martinstein
Goto Top

Inhalt einer mehrere Zeilen umfassenden txt-Datei als Variable

Hallo Leute,

Ich hab eine txt-Datei, die aus ein paar Zeilen besteht, in jeder Zeile stehen ein oder mehrere durch Leerzeichen getrennte Worte. In manchen Zeilen steht dasselbe. Beispieldatei:

das ist
ein Beispiel für
eine oben
geschilderte
Textdatei.
geschilderte
Textdatei.

- Wie kann ich die doppelten Zeilen von der Verarbeitung ausschließen?
- Wie kann ich den restlichen Inhalt dieser Datei als EINE Variable darstellen?
- Wie kann ich dabei die Zeilenumbrüche entfernen und durch Komma-Leerzeichen (, ) ersetzen?

Ich steh mal wieder tierisch auf dem Schlauch und bin dankbar für jede Hilfe!

Gruß

Martin

Content-ID: 176705

Url: https://administrator.de/contentid/176705

Ausgedruckt am: 24.11.2024 um 04:11 Uhr

bastla
bastla 23.11.2011 um 19:32:52 Uhr
Goto Top
Hallo martinstein!

Wenn Du tatsächlich aus dem gesamten Inhalt eine einzige Zeile (ohne Wiederholungen) machen möchtest, dann im einfachsten Fall etwa so:
@echo off & setlocal
set "Ein=D:\Textdatei.txt"  
set "Var=, "  

for /f "usebackq delims=" %%i in ("%Ein%") do call :ProcessLine "%%i"  
set "Var=%Var:~2,-2%"  
set Var
goto :eof

:ProcessLine
echo "%Var%"|findstr /c:", %~1, ">nul && goto :eof  
set "Var=%Var%%~1, "  
goto :eof
Es wird zunächst die Variable mit der Trennzeichensequenz Komma + Leerzeichen vorbelegt - so kann dann nachher für jede Zeile verglichen werden, ob sie in der Variablen bereits enthalten ist, ohne dass irrtümlich ein Teilstring ausgeschlossen würde - wenn etwa in Deiner Beispieldatei als letzte Zeile noch
oben
folgen würde, müsste eigentlich diese Zeile ebenfalls in das Ergebnis aufgenommen werden (vorher hieße es ja "eine oben"). Um dies zu erreichen, wird jeweils der Zeileninhalt mit Trennzeichen davor und danach verglichen - im Beispiel würde also nicht untersucht, ob sich "oben" schon in der Variablen befindet, sondern es wird (in Zeile 11) auf
, oben, 
geprüft. Je nach dem Ergebnis dieser Prüfung wird dann bei "Zeile ist bereits enthalten" sofort zurückge- und damit die Zeile übersprungen, oder an die Variable die Zeile + Trennzeichen angefügt.

Am Ende enthält die Variable daher jeweils am Anfang und am Ende die beiden Trennzeichen, weshalb sie per Teilstringbildung (Zeile 6 bedeutet: Verwende alles nach den ersten beiden Zeichen bis vor die letzten beiden Zeichen!) korrigiert werden muss.

Grüße
bastla
rubberman
rubberman 23.11.2011 um 20:53:51 Uhr
Goto Top
Hallo martinstein und hallo bastla!

Genauso, nur anders:
@echo off &setlocal
set "Ein=D:\Textdatei.txt"  

setlocal enabledelayedexpansion &set "Var=, "  
<"%Ein%" (for /f %%i in ('type "%Ein%"^|find /c /v ""') do for /l %%j in (1 1 %%i) do (  
  set /p "ln=" &echo "!Var!"|findstr /c:", !ln!, ">nul ||set "Var=!Var!!ln!, ")  
)
endlocal &set "Var=%Var:~2,-2%"  

set Var
pause

Der Code unterscheidet sich nicht wesentlich. Auch bastlas Version könnte ohne Subroutine auskommen, solang keine Ausrufezeichen in der Datei vorkommen. Unterschied ist, dass bei der SET /P Variante in meinem Code, trotz verzögerter Variablenerweiterung, Ausrufezeichen im Text nicht eliminiert werden.

Eine Anmerkung sollte aber noch kommen:
Strings dürfen nicht endlos lang sein!

Grüße
rubberman
martinstein
martinstein 23.11.2011 um 21:05:57 Uhr
Goto Top
Hallo bastla und rubberman,

ich hab echt Mühe, eure Codes aufzudröseln, aber: Es scheint zu funktionieren, vielen Dank!

In der Tat können keine Ausrufezeichen vorkommen, eine Sache aber: Ist mit String die Variable gemeint? Die kann nämlich evtl. über 204 Zeichen lang sein, wenn man die ganzen verschiedenen Zeilen zusammennimmt. Wär's irgendwie möglich, die Variable nach 204 Zeichen "abzuschneiden" oder macht das cmd evtl. von selbst? Dann fehlte zwar ein Teil, aber das wäre zu vernachlässigen.

Gruß

martin
bastla
bastla 23.11.2011 um 21:12:51 Uhr
Goto Top
Hallo martinstein!

Da Du vermutlich nicht mehr NT4 verwendest, liegt die Grenze nicht bei 2047 Zeichen, sondern bei 8191 ... face-wink

Grüße
bastla
rubberman
rubberman 23.11.2011 um 21:14:47 Uhr
Goto Top
Hallo martinstein,

204 Zeichen sind mit Sicherheit noch kein Kriterium, über das du dir Sorgen machen müsstest. Folge einfach mal meinem Link, da steht etwas von 8191 Zeichen für XP. Ich glaube bei Vista und Win7 hat sich dieses Limit nicht geändert.

Grüße
rubberman

<EDIT zu spät face-wink />
Biber
Biber 23.11.2011 um 21:16:36 Uhr
Goto Top
Moin martinstein,

die Längenbeschränkung ist nicht nicht 204, sondern mindestens 2047 (also 2048-1 bzw 2 hoch 12 minus ein Nullbyte)
Im Falle Windows-wie-immer-die-heutige-Zwischenversion-heisst auch durchaus das 4fache.

Wenn du damit auch nur in die Nähe eines möglichen Datenverlusts kommst--> dann nimm ein anderes Werkzeug.
Es gibt keinen "verschmerzbaren Datenverlust", jedenfalls nicht in diesem Seitenarm des Forums.

Ein paar andere Werkzeuge können wir auch zur Not bedienen.

Grüße
Biber
[Edit] ...doppelt zu spät ... face-wink [/Edit]
martinstein
martinstein 23.11.2011 um 21:27:54 Uhr
Goto Top
Hallo ihr drei,

sorry, es war mein Fehler - 2047 langt für meine Zwecke vollkommen!

Danke nochmal,

martin
martinstein
martinstein 14.12.2011 um 20:01:37 Uhr
Goto Top
Hallo Leute,

ich hab jetzt doch noch ein Problem entdeckt: Ganz selten steht in einer Zeile sowas wie

"text der zeile"

also mit Anführungszeichen vorn und hinten und dann zickt die Batch rum. Kann man das irgendwie umschiffen? Falls es das Skript vereinfacht: Ich kann programmseitig auch einrichten, dass die Anführungszeichen vorn und hinten nicht willkürlich, sondern in JEDER Zeile vorhanden sind. Weiterer Hinweis: An anderer Stelle als vorn und hinten kommen niemals Anführungszeichen vor.

Danke schonmal für eure Ratschläge!
bastla
bastla 14.12.2011 um 21:42:55 Uhr
Goto Top
Hallo martinstein!

Es sollte in meinem Ansatz oben genügen, die Zeile 5 durch
for /f "usebackq delims=" %%i in ("%Ein%") do call :ProcessLine "%%~i"
zu ersetzen ...

Grüße
bastla
martinstein
martinstein 15.12.2011 um 20:34:15 Uhr
Goto Top
Hallo bastla,

danke für die Antwort. Da ich rubbermans subroutinefreie Lösung verbaut habe: Wie sähe es denn da aus? Es ist übrigens NICHT möglich, dass am Anfang zwei und am Ende zwei Anführungszeichen stehen, falls das die Sache weiter vereinfacht.

Gruß

Martin
bastla
bastla 15.12.2011 um 20:46:35 Uhr
Goto Top
Hallo martinstein!

Versuch es mal mit der folgenden Zeile 6:
set /p "ln=" & set "ln=!ln:~1,-1!" &echo "!Var!"|findstr /c:", !ln!, ">nul ||set "Var=!Var!!ln!, ")
Grüße
bastla
martinstein
martinstein 15.12.2011 um 21:51:38 Uhr
Goto Top
Potzblitz! Jetzt ist es perfekt! Hier nochmal beide Varianten in der geänderten Form:

@echo off & setlocal
set "Ein=D:\Textdatei.txt"  
set "Var=, "  

for /f "usebackq delims=" %%i in ("%Ein%") do call :ProcessLine "%%~i"  
set "Var=%Var:~2,-2%"  
set Var
goto :eof

:ProcessLine
echo "%Var%"|findstr /c:", %~1, ">nul && goto :eof  
set "Var=%Var%%~1, "  
goto :eof

und

@echo off &setlocal
set "Ein=D:\Textdatei.txt"  

setlocal enabledelayedexpansion &set "Var=, "  
<"%Ein%" (for /f %%i in ('type "%Ein%"^|find /c /v ""') do for /l %%j in (1 1 %%i) do (  
  set /p "ln=" & set "ln=!ln:~1,-1!" &echo "!Var!"|findstr /c:", !ln!, ">nul ||set "Var=!Var!!ln!, ")  
)
endlocal &set "Var=%Var:~2,-2%"  

set Var
pause

Danke nochmal und viele Grüße

Martin