dm-markus
Goto Top

Mit Batch-Datei alle Sonderzeichen in einer Textdatei entfernen

Hallo zusammen,

ich habe versucht mit Hilfe einer Batch Datei einen String aus einer mehrzeiligen Textdatei auszulesen und diesen dann wieder in eine andere Textdatei zu speichern.

Hierfür habe ich folgende Code gebastelt:

FOR /F "tokens=*" %%i in ('findstr /n /v "asdf" C:\temp.txt^|Findstr "07"') do Set ln=%%i
echo %ln% >>C:\daten.txt

Wenn die Zeile ausgelesen ist, soll diese nach dem String "07" durchsucht werden und anschließend die 6 Zeichen davor in eine Textdatei speichern. Das hätte ich bestimmt auch noch hinbekommen, leider komme ich aber nicht soweit, da es Probleme gibt mit dem lesen der Textdatei.

Hier ein Auszug aus der Textdatei:


€%
 
T | † ì } 8   ÒA ðÒA† ì  L ÿÿÿÿÿÿÿÿ\ 1 4 . 0 9 . 0 7 # #  # #  # # 
 
%
€%
 
T „ h
ì e 8   ÒA ðÒAhì L ÿÿÿÿÿÿÿÿ` f r e i    "   + " $  
 
%

€%
 
T ˆ ò
ì 
8   ÒA ðÒAò
ì

Ich habe jetzt die Frage an euch ob es vielleicht einen Befehl gibt, dass aus dieser Textdatei alle Sonderzeichen entfernen kann.
Vielleicht hilft die Info weiter, dass es in Excel mittels VB-Skript möglich ist.
Wenn ich die Datei in Excel öffne und ein VB-Skript erstelle in dem die Ascii Zeichen zwischen 46 und 127 gelöscht werden, dann funktioniert das, dann sind alle Sonderzeichen entfernt.

Ich will das ganze aber mit einer Batch-Datei machen.

Über einen Tipp wie ich das schaffen kann, wäre ich sehr dankbar.

Grüße,
Markus

Content-Key: 72425

Url: https://administrator.de/contentid/72425

Printed on: April 19, 2024 at 19:04 o'clock

Member: dm-markus
dm-markus Oct 31, 2007 at 14:05:16 (UTC)
Goto Top
Hallo ich nochmals.
Mir ist ein kleiner Fehler unterlaufen. Ich meinte natürlich die Ascii Zeichen kleiner als 46 und größer als 126 löschen.

Hier im übrigen der Code für VB (vielleicht hilft der ja weiter?):

Dim zaehler0 As Long
Dim zaehler1 As Integer
Dim zaehler3 As Integer
For zaehler0 = 1 To ActiveSheet.UsedRange.SpecialCells(xlCellTypeLastCell).Row + 1
For zaehler1 = 1 To ActiveSheet.UsedRange.SpecialCells(xlCellTypeLastCell).Column
For zaehler3 = 1 To Len(Cells(zaehler0, zaehler1))
If Asc(Mid(Cells(zaehler0, zaehler1), zaehler3, 1)) > 46 And Asc(Mid(Cells(zaehler0, zaehler1), zaehler3, 1)) < 127 Then
neu = neu & Chr$(Asc(Mid(Cells(zaehler0, zaehler1), zaehler3, 1)))
End If
If zaehler3 = Len(Cells(zaehler0, zaehler1)) Then
Cells(zaehler0, zaehler1) = neu
neu = ""
End If
Next zaehler3
Next zaehler1
Next zaehler0
Member: bastla
bastla Oct 31, 2007 at 14:31:53 (UTC)
Goto Top
Hallo dm-markus!

Wenn Du Dir sicher sein kannst, dass die einzige Kombination mit ".07" Dein gesuchtes Datum darstellt, könntest Du folgenden Batch (mit temporärem VBScript) verwenden:
@echo off & setlocal
set "Src=C:\temp.txt"  
set "Dst=C:\daten.txt"  
set Chk=".07"  

set "GD=%temp%\GetDate.vbs"  
echo T=Split(CreateObject("Scripting.FileSystemObject").OpenTextFile("%Src%",1).ReadAll,vbCrLF)>"%GD%"  
echo For Each L In T:D="":For i=1 To Len(L):C=Mid(L,i,1):If C="." Or (C^>="0" And C^<="9") Then D=D^&C>>"%GD%"  
echo Next:If InStr(D,%Chk%) Then WScript.Echo Mid(D,InStr(D,%Chk%)-5,8)>>"%GD%"  
echo Next>>"%GD%"  
for /f %%i in ('cscript //nologo "%GD%"') do set Dat=%%i  
if defined Dat (echo %Dat% >>"%Dst%") else echo Kein Datum gefunden!  
del "%GD%"  

Die Untersuchung der Datei erfolgt (analog zu Deinem Beispiel oben) zeilenweise.

Eine Verbesserung der Laufzeit wäre noch zu erzielen, indem das Script nach Ausgabe des ersten passenden Datumsstrings beendet wird. Dazu wäre ersatzweise folgende Zeile zu verwenden:
echo Next:If InStr(D,%Chk%) Then WScript.Echo Mid(D,InStr(D,%Chk%)-5,8):WScript.Quit>>"%GD%"  

Grüße
bastla

[Edit] Hart codiertes Kriterium ".07" durch Variable ersetzt. [/Edit]
Member: dm-markus
dm-markus Oct 31, 2007 at 15:35:04 (UTC)
Goto Top
Hallo Bastla!

Danke für die schnelle Hilfe.
Habe es soeben ausprobiert. Leider bringt er mir die Meldung "Kein Datum gefunden!" .
Ich hab versucht zu verstehen was du da machst, leider ist mir das nur teils gelungen, darum kann ich mir jetzt auch nicht selber helfen und muss wieder auf deine Hilfe zurückgreifen.

Verstehe ich es richtig, dass du die Datei Zeile für Zeile nach Zahlen durchsuchen lässt und die Treffer dann nach der Zeichenfolge ".07" durchsuchst um anschließend 8 Zeichen zurückzugen um die nächsten 5 einzulesen. Anschließend übergibst du den Treffer an eine Variable die in der daten.txt eingetragen wird??????

Vielleicht kannst du mir ja nochmals helfen??

Ich habe übrigens nach den Dateien gesucht und auch das Echo wieder eingeschaltet um auf Fehler zu stoßen. Leider habe ich nichts gefunden. Er kann die Quelldatei finden. Ebenso wird die Datei Getdate.vbs erstellt.

Das Datum mit ".07" kommt übrigens mindestens einmal höchstens viermal in der Datei vor. Ich dachte wenn die Sonderzeichen weg sind, dann kann ich das Problem, das richtige Datum zu erwischen selber lösen. Es ist das Datum, das am "höchsten" (in der Zukunft) ist.

Bin also ratlos.

Gruß,

dm-markus
Member: dm-markus
dm-markus Oct 31, 2007 at 16:10:25 (UTC)
Goto Top
Habe festgestellt, dass es funktioniert, wenn ich nur nach der "7" suchen lasse. Allerdings bringt er mir dann nicht das Datum sondern etwas anderes wo eine 7 mit drin ist.

Im Notepad++ wird mir das Datum wie folgt angezeigt:

1NUL4NUL.NUL0NUL9NUL.NUL0NUL7NUL
Vielleicht hast du eine Idee wie man das herauslesen kann???
Member: bastla
bastla Oct 31, 2007 at 16:13:11 (UTC)
Goto Top
Hallo dm-markus!

Eine etwas face-wink lesbarere Version des Scripts sieht so aus:
Set fso = CreateObject("Scripting.FileSystemObject")  
Set objTxtFile = fso.OpenTextFile("C:\temp.txt", 1)  
strGesamtText = objTxtFile.ReadAll
arrText = Split(strGesamtText, vbCrLF)
For Each strLine In arrText
	strDatum = ""  
	For i = 1 To Len(strLine)
		chrC = Mid(strLine, i, 1)
		If chrC = "." Or (chrC >= "0" And chrC <= "9") Then strDatum = strDatum & chrC  
	Next
	If InStr(strDatum, ".07") Then WScript.Echo Mid(strDatum, InStr(strDatum,".07")-5, 8)  
Next
Es wird die gesamte Datei in ein Array "arrText" (aufgeteilt nach Zeilen) eingelesen und dann jede dieser Zeilen zeichenweise durchsucht, wobei nur "." und Ziffern in das (Zwischen-)Ergebnis aufgenommen werden.

Nach Zeilenende wird im Ergebnis nach ".07" gesucht. Ist dieser Teilstring enthalten, dann wird ab der Position "5 Zeichen vor dem Auftreten des Suchstrings" beginnend ein String von 8 Zeichen gebildet und ausgegeben. Da ich mich an Deinem geposteten Beispiel orientieren musste, wäre das Ergebnis zunächst "814.09.07" - vom "." vor "07" 5 Zeichen nach vorne befindet sich "1", und von dort insgesamt 8 Zeichen liefern dann "14.09.07" - zumindest mit den dargestellten Testdaten erhalte ich also das gewünschte Ergebnis (nochmals unter Verwendung meines oben geposteten Batchcodes verifiziert).

Falls es Dir hilft, eine Variante, die zeilenweise nur die brauchbaren Zeichen ausgibt:
@echo off & setlocal
set "Src=C:\temp.txt"  
set "Dst=C:\daten.txt"  

if exist "%Dst%" del "%Dst%"  
set "GD=%temp%\GetDate.vbs"  
echo T=Split(CreateObject("Scripting.FileSystemObject").OpenTextFile("%Src%",1).ReadAll,vbCrLF)>"%GD%"  
echo For Each L In T:D="":For i=1 To Len(L):C=Mid(L,i,1):If C="." Or (C^>="0" And C^<="9") Then D=D^&C>>"%GD%"  
echo Next:WScript.Echo D:Next>>"%GD%"  
for /f %%i in ('cscript //nologo "%GD%"') do  echo %%i>>"%Dst%"  
del "%GD%"  
Das damit erzielte Ergebnis für Dein Beispiel wäre:
814.09.07
8
8

Grüße
bastla
Member: bastla
bastla Oct 31, 2007 at 16:21:48 (UTC)
Goto Top
Hallo dm-markus!

Das Problem mit den Chr(0) zwischen den einzelnen Stellen des Datums kann ich nicht nachvollziehen. Diese fallen ohnehin weg (da ja nur "." und Ziffern in den String "D" aufgenommen werden), sodass ich auch bei einer entsprechend Änderung der Testdaten immer noch das gesuchte Datum erhalte ...

Grüße
bastla
Member: bastla
bastla Oct 31, 2007 at 16:44:14 (UTC)
Goto Top
... zum Thema "Datum bis zu viermal" könnte die Vorgangsweise so aussehen:

Die vom Script (hoffentlich) zurückgelieferten Datumswerte zunächst zerlegen und im Format "JJ.MM.TT" wieder zusammensetzen und so in eine temporäre Textdatei schreiben, diese danach sortiert ausgeben und den Wert der letzten Zeile verwenden, also etwa:
if exist %temp%\ToSort.txt del %temp%\ToSort.txt
for /f "tokens=1-3 delims=." %%i in ('cscript //nologo "%GD%"') do echo %%k.%%j.%%i >>%temp%\ToSort.txt  
for /f %%i in ('sort %temp%\ToSort.txt') do set MaxWert=%%i  
echo %MaxWert% >>%Dst%
Bei jedem Schleifendurchlauf wird %MaxWert% überschrieben, so dass am Ende der Wert aus der letzten (sortierten) Zeile darin enthalten ist.

Grüße
bastla
Member: bastla
bastla Nov 05, 2007 at 21:14:20 (UTC)
Goto Top
Hallo dm-markus!

Unter Berücksichtigung der Tatsache, dass ".07" ja auch als Monatsangabe zu interpretieren wäre und um das Auftreten mehrerer Datumswerte zu erfassen, eine neue Version:
@echo off & setlocal
set "Src=Z:\temp.txt"  
set "Dst=Z:\daten.txt"  
set Chk=".07"  

set "Uns=%temp%\unsortiert.txt"  
set "Sor=%temp%\zusortieren.txt"  
if exist "%Sor%" del "%Sor%"  
set "GD=%temp%\GetDate.vbs"  
echo T=CreateObject("Scripting.FileSystemObject").OpenTextFile("%Src%",1).ReadAll>"%GD%"  
echo L=Len(T):For i=1 To L:C=Mid(T,i,1):If C="." Or (C^>="0" And C^<="9") Then D=D^&C>>"%GD%"  
echo Next:L=Len(D):P=InStr(D,%Chk%):Do While P^>0 And P^<L:If (P+3)^<=L Then If Mid(D,P+3,1)^<^>"." Then E=E^&Mid(D,P-5,8)^&vbCrLF>>"%GD%"  
echo P=InStr(P+1,D,".07"):Loop:WScript.Echo E>>"%GD%"  
cscript //nologo "%GD%">"%Uns%"  
for /f "usebackq tokens=1-3 delims=." %%i in ("%Uns%") do echo %%k.%%j.%%i >>"%Sor%"  
for /f %%i in ('sort "%Sor%"') do set MaxWert=%%i  
(echo %MaxWert%)>"%Dst%"  
del "%GD%"  
del "%Uns%"  
del "%Sor%"  

Grüße
bastla
Member: dm-markus
dm-markus Nov 06, 2007 at 06:28:46 (UTC)
Goto Top
Super!

Es erscheint das richtige Datum. Herzlichen Dank Bastla für die schnelle Hilfe!

Grüße,

dm-markus