Ghostscript pdfwrite zu txt wird in UCS-2 Little Endian konvertiert
Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne liegen
Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne, liegen diese in UCS-2 Little Endian vor. Jetzt würde ich gerne auf der Commandozeilenebene diese in UTF-8 oder ANSI umwandeln. Gibt es ein einfaches dos-script das dies erledigt?
Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne, liegen diese in UCS-2 Little Endian vor. Jetzt würde ich gerne auf der Commandozeilenebene diese in UTF-8 oder ANSI umwandeln. Gibt es ein einfaches dos-script das dies erledigt?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 176298
Url: https://administrator.de/contentid/176298
Ausgedruckt am: 22.11.2024 um 21:11 Uhr
3 Kommentare
Neuester Kommentar
ja
Ist zwar kein dos-skript aber vielleicht hilft dir das ja auch weiter:
Das einfach als .vbs-Datei abspeichern.
Grüße manni
Const Path = "file.txt"
Const adTypeBinary = 1
Const adTypeText = 2
Const adSaveCreateOverWrite = 2
Dim BinaryStream, Text
Set BinaryStream = CreateObject("ADODB.Stream")
With BinaryStream
.Type = adTypeText
.Charset = "UTF-16"
.Open
.LoadFromFile Path
Text = .ReadText
.Close
End With
With BinaryStream
.Type = adTypeText
.Charset = "x-Ansi"
.Open
.WriteText Text
.SaveToFile Path, adSaveCreateOverWrite
.Close
End With
Das einfach als .vbs-Datei abspeichern.
Grüße manni