thomas345
Goto Top

Iconv Charset-Konvertierung funktioniert nicht - Umlaute werden nicht korrekt dargestellt. Was tun?

Hallo,

ich habe auf einem Ubuntu-Server 14.xxx eine Datei, die laut dem Befehl 'file dateiname1.xml' so kodiert ist:

HTML document, UTF-8 Unicode text, with very long lines

Diese Datei benötige ich in ISO-8859-15. Dafür führe ich folgenden Befehl aus:

iconv -f UTF-8 -t ISO-8859-15//TRANSLIT dateiname1.xml > dateiname2.xml

Danach ist die dateiname2.xml laut 'file dateiname2.xml' so kodiert:

HTML document, ISO-8859 text, with very long lines

In der Eingabedatei waren die Umlaut korrekt dargestellt, in der Ausgabedatei sind sie hingegen defekt.

Woran liegt das und wie kann ich das beheben?
Bin für jeden Hinweis dankbar - Grüße
Thomas

Content-Key: 283962

Url: https://administrator.de/contentid/283962

Printed on: April 19, 2024 at 07:04 o'clock

Member: dog
dog Sep 26, 2015 at 18:16:11 (UTC)
Goto Top
Woran liegt das und wie kann ich das beheben?

Das liegt daran, dass dein Terminal-Programm UTF-8 für die Textausgabe verwendet.
Das Terminal kann nicht magisch "erkennen" was für einen Zeichensatz die dargestellten Inhalte haben.
Dass die Umlaute jetzt "defekt" sind, ist allerhöchstens ein Indiz dafür, dass die Konvertierung funktioniert hat.

Wenn du es genau wissen willst, kopier die Datei auf deinen Rechner und öffne sie in einem Editor mit Zeichensatz-Support (Notepad++, Textmate, Sublime Text, ...)
Member: Lochkartenstanzer
Lochkartenstanzer Sep 26, 2015 at 22:12:26 (UTC)
Goto Top
Genau.


Einfach die Zeichenkodierung anpassen nochmal probieren.

Lks