moebelwachs
Goto Top

Linux Text nach WINDOWS konvertieren - Problem mit ESC Sequenzen

Hallo zusammen,

ich muß Textdateien von einem Linuxsystem in ein WINDOWS Format umwandeln.
Wie das aussieht seht Ihr hier an einem Beispiel.

OPL|GAPIT.......
10705331|120008282
Aussehen solls so:
OPL|GAPIT.......
10705331|120008282

Für die, dies interessiert: Das sind sog. HL7 Daten, mit denen im Gesundheitswesen gearbeitet wird. Aus Datenschutzgründen muß ich mit der Darstellung
etwas sparsam sein.

Hier die Ansicht im Notepad++
1172d65618182a5f76baf9a4a67268d3
Ich bin leider ein Linux-U-Boot , daher meine Bitte um Hilfe.
Ich weiß, daß es verschiedene Kodiermöglichkeiten gibt, habe aber auch nach langem suchen nicht ermitteln können, was das für Zeichen sind.
Ziel: ca 50000 Zeilen in Windows ASCII Text zu konvertieren.

Vielen Dank !
Grüße Wolfgang

Content-ID: 182934

Url: https://administrator.de/contentid/182934

Ausgedruckt am: 26.11.2024 um 09:11 Uhr

64748
64748 02.04.2012 um 10:46:54 Uhr
Goto Top
Guten Morgen Wolfgang,

ich hab mir das gerade mal angesehen. Unter Linux kann ich mir die erste von Dir gepostete Sequenz nicht richtig anzeigen lassen.
OPL|GAPIT.......
10705331|120008282
die Sequenzen [0;7m... u.ä. sind jedenfalls Steuerzeichen im Terminal und sind nicht im HL7 Format enthalten, ich hab mir das gerade mal angesehen http://www.hosinc.com/products/interfaces/interface_documentation.htm#C ....

Ich vermute, dass Du die Dateien besser unter Linux bearbeitest, also umwandelst. Es ist bestimmt schon bei der bisherigen Umwandlung was schief gelaufen. Kannst Du mal genau beschreiben, wie die Dateien bisher bearbeitet worden sind?

Eigentlich besteht der große Unterschied zwischen Unix- und Windows-Textformaten darin, dass die Zeilenenden verschieden dargestellt werden. Das können die gängigen Editoren aber händeln.

Markus
moebelwachs
moebelwachs 02.04.2012 um 11:01:06 Uhr
Goto Top
Hi MArkus,
danke für deine Nachricht.

Die Sonderzeichen sind kein Bestandteil von HL7, richtig. Ich weiß auch nicht, wie die Daten exportiert wurden, ich hab sie so bekommen.
Deinem Vorschlag nach installier ich mir ein Linux, und öffne sie dann da? Ich nehme an, eine VM reicht. Gibts ne empfehlenswerte EInsteigerdistribution ?
Danke + Grüße Wolfgang
64748
64748 02.04.2012 um 11:15:20 Uhr
Goto Top
Unter Umständen hilft Dir das hier http://wiki.ubuntuusers.de/Zeichensatz-Konverter

Und da es über Ubuntu handelt, pack Dir Ubuntu auf einen virtuellen Recher. Virtualbox ist einfach zu händeln https://www.virtualbox.org/wiki/Downloads.
Es gibt wohl auch fertige Images mit Ubuntu http://virtualboxes.org/images/ubuntu/, das hab ich aber noch nie gemacht, Du musst dann nur Virtualbox installieren und das runtergeladene Image in Virtualbox öffnen.

Alternative wäre eine Live-CD/DVD, z.B. Porteus http://porteus.org/index.php ein relativ kleines iso zum Runterladen, auf CD brennen und dann booten. Pack Dir vorher die Daten für die Umwandlung auf einen USB-Stick (damit Du nicht von Linux aus auf Windows zugreifen musst, das geht zwar, würde ich aber einem Anfänger nicht empfehlen).

Wie gesagt, ich vermute, dass Du die Daten "einen Schritt vorher" benötigst, sie sehen m.E. schon ziemlich zerschossen aus. Kannst Du denjenigen fragen, der Dir die Daten gegeben hat, was bisher damit gemacht worden ist?

Markus
it-frosch
it-frosch 02.04.2012 um 11:18:38 Uhr
Goto Top
Hallo moebelwachs,

Gibts ne empfehlenswerte EInsteigerdistribution ?
Du kannst dir fast jede Linux LiveCD nehmen. Ubuntu ist in der Bedienung recht windowsnah.

Wenn du die VM von einer Ubuntu Live CD gestartet hast, öffne dir ein Terminalfenster und installier dir mit sudo apt-get install mc den Midnightcommander.
Das ist ein Norton Commander Clon mit dem man sich in der Filestruktur etwas leichter bewegen kann.

grüße vom it-frosch
moebelwachs
moebelwachs 02.04.2012 um 12:25:32 Uhr
Goto Top
Hallo,
danke für alle Vorschläge. Bevor ich mich in unbekanntes Terrain stürze hab ichs hausbacken gelöst:
Mit Ultraedit kann man viel mit Textdateien machen, und 4 aufeinanderfolgende Befehle haben 90 % meines Problems gelöst.
Cool: UE kann alle Dateien in einem Verzeichnis auf einmal bearbeiten, bietet Makros und vieles mehr.

Nochmals herzlichen Dank,
Grüße Wolfgang
Lochkartenstanzer
Lochkartenstanzer 02.04.2012 um 14:01:54 Uhr
Goto Top
Moin,

Das sieht mir ganz danach aus, als ob jemand entweder eine Druck- oder eine Terminalausgabe einfach in eine Datei mitgeschnitten hat und das dann als "Export" genommen hat. Sofern das so ist, reicht es einfach einen reinen "ASCII-Drucker" als Drucker oder einen "Teletype" als Terminal zu nehmen, so daß die ESC-Steuersequenzen nicht mehr ausgegeben werden.

Ansonsten reicht ein kurzes "sed"-Kommand die Sonderzeicehn auszufiltern.

lks
Mehr von moebelwachsmoebelwachsTCP Durchsatz zu VM - Virtual Boxmoebelwachs - 4 KommentaremoebelwachsOL2010 im IMAP Modus findet Leichenmoebelwachs - 4 KommentaremoebelwachsEin Zeichen in einer SEHR großen TXT Datei ersetzenmoebelwachs - 13 KommentaremoebelwachsText in Datum und Zeit umwandelnmoebelwachs - 2 Kommentare
Heiß diskutiert
superfun2k24Sophos SFOS 20 DNAT funktioniert nichtsuperfun2k24 - 26 KommentareLangaberWindows Server Sicherung Restore - MöglichkeitenLangaber - 21 Kommentareprplemk2Testumgebung bauen (Grundlegend)prplemk2 - 21 KommentaremaisenkaiserSwitch ohne STP ins Netzwerkmaisenkaiser - 20 KommentareTJ.Hooker74Dom.Admin-Passwort ändern - Auswirkungen auf EX, HCW, AADCTJ.Hooker74 - 15 KommentareBlitterWindows 10 u. 11 und 802.1x Netzwerk PortsecurityBlitter - 15 KommentaremaxMicrosoft plant für 2025 mehrere Preiserhöhungenmax - 14 KommentareHemingwayWord Makro soll aktuelle Datei regelmäßig kopieren und speichernHemingway - 13 KommentareleberkaeseFB7590 ISDN Fax-Funktionleberkaese - 13 KommentareUnluckyProccess1999Creo 4.0 Lizenz Server (LMTOOLS)UnluckyProccess1999 - 13 KommentareEnrixkHilfe bei Netzwerkinfrastruktur für AbschlussprojektEnrixk - 12 KommentareDaniSIP Zugangsdaten von Vodafone erhaltenDani - 12 Kommentare