jweghorn
Goto Top

Batchdatei - HTML-Code aus CSV-Datei entfernen

Hallo zusammen,

ich habe eine CSV-Datei, in der sich in einer bestimmten Spalte, Aufzählungspunkte mit Text befinden. Diese sind
als HTML-Code vercoded.

In Excel kann ich das jetzt prinzipiell leicht bearbeiten.
Man markiert die entsprechende Spalte, geht auf "Suchen und Ersetzen", gibt "<*>" ein und
schon sind alle Codes draußen.

Das Problem ist, dass diese CSV-Datei aus einem ERP-System erzeugt wird und ich
mittels Batch-Datei automatisiert diese CSV-Datei bearbeiten muss und dadurch die
HTML-Codes entfernt werden müssen.

Kann mir einer sagen, wie ich diesen Code aufbaue?

Schon jetzt vielen Dank für Eure Hilfe. Ich bin für jeden Hinweis dankbar.

Gruss
Jörg

Content-ID: 358092

Url: https://administrator.de/contentid/358092

Ausgedruckt am: 26.11.2024 um 17:11 Uhr

134998
Lösung 134998 13.12.2017, aktualisiert am 14.12.2017 um 10:26:11 Uhr
Goto Top
Hi,
can be done with a single line of code
powershell -ExecutionPolicy ByPass -Command "(Import-csv 'C:\file.csv' -Delimiter ';') | %%{$_.'ColumnName' = $_.'ColumnName' -replace '^.*|<[^>]+>|[\r\n]+','';$_} | export-csv 'C:\file.csv' -Delimiter ';' -NoType -Encoding UTF8"  
Filenames, CSV-Delimiter and ColumnName where the HTML string is stored need to be adjusted.

Regards
Tom
jweghorn
jweghorn 14.12.2017 aktualisiert um 08:28:11 Uhr
Goto Top
Dear Tom,

first - thank you for your help.

I tested it, but it doesn't work. Maybe I did something wrong.
Could you help me again?

Please see the message which I got back.

//Fehlende schließende ")" im Ausdruck.
Bei Zeile:1 Zeichen:91

+ (Import-csv C:\Users\xxxxxxxxx\Desktop\filename.csv -Delimiter <<<< ;) | \Users\xxxxxxxxx\Desktop\filename.csv -Delimiter ';' -NoType -Encoding UTF8
+ CategoryInfo : ParserError: (CloseParenToken:TokenId) , Paren
tContainsErrorRecordException
+ FullyQualifiedErrorId : MissingEndParenthesisInExpression


Thank you in advance for your help.

Best regards,
Jörg
134998
134998 14.12.2017 aktualisiert um 08:57:19 Uhr
Goto Top
Sorry, small typo, is corrected above.

For your information, this line has to be used inside a Batchfile, because percent signs are doubled, otherwise you have to replace the double percent signs with a single one..
jweghorn
jweghorn 14.12.2017 um 09:09:29 Uhr
Goto Top
Dear Tom,

wow - that works. You are great - thank you.

The result is "nearly" perfect, but:
could you extend your command to delete after removing the html codes also the first line into that cells and also delete all line breaks into that cells?

Again thank you in advance for that final question.

Best regards,
Jörg
134998
134998 14.12.2017 um 10:13:41 Uhr
Goto Top
Done.
jweghorn
jweghorn 14.12.2017 um 10:24:06 Uhr
Goto Top
Dear Tom,

I got following error message:

Fehlende schließende ")" im Ausdruck.
Bei Zeile:1 Zeichen:182

+ (Import-csv C:\Users\XXXXXX\Desktop\filename.csv -Delimiter ';') | %{$_.ItemTechnicalFeatures = ($_.ItemTechnicalFeatures -replace '<[^>]+>|[\r\n]+','' <<<< ;$_} | export-csv C:\Users\XXXXXX\Desktop\filename.csv -Delimiter ';' -NoType -Encoding UTF8
+ CategoryInfo : ParserError: (CloseParenToken:TokenId) , Paren
tContainsErrorRecordException

+ FullyQualifiedErrorId : MissingEndParenthesisInExpression

Do you have an idea where the problem is?

Again thank you ...

Rgds,
Jörg
134998
134998 14.12.2017 aktualisiert um 10:28:02 Uhr
Goto Top
Damn, my fingers are way too cold today face-smile. Typo is corrected, sorry again.
jweghorn
jweghorn 14.12.2017 um 10:32:14 Uhr
Goto Top
Dear Tom,

please don't say sorry. It is so great that you help me. It works phantastic. Thank you very very much.
That was great and perfect.

Best regards,
Jörg
134998
134998 14.12.2017 um 10:33:33 Uhr
Goto Top
Glad it helped you face-smile.

Have a nice day.
Tom
jweghorn
jweghorn 23.11.2018 um 12:24:52 Uhr
Goto Top