netzwerkdude
Goto Top

XML Dateien mit DTD in PowerShell parsen

Moin,

habe hier eine XML Datei mit
(Ist eine .hocr Datei erstellt von Tesseract)

Wenn ich die Datei per Import-Clixml reinladen will, kommt folgende exception



Habe mal ins XML Objekt von PS geschaut:
was für Methoden und Eigenschaften das Objekt in PS so hat, aber konnte jetzt auf die schnelle nichts finden was nach DtD aussieht

Frage: Wie mache ich den vorgeschlagenen Workaround?
Und andere Workaound Idee: kann ich eigentlich alles was in der dtd steht "manuell" runterladen und einfach in die XML einbauen?

MFG N-Dude

Content-Key: 396424

Url: https://administrator.de/contentid/396424

Ausgedruckt am: 03.10.2022 um 00:10 Uhr

Mitglied: 137846
Lösung 137846 21.12.2018 aktualisiert um 15:58:36 Uhr
Goto Top
Setze vor dem Laden per XML Object den XmlResolver auf $null dann wird die DTD beim parsen ignoriert.
Beispiel:
Gruß A.

btw.. dein gepostetes XML oben ist nicht valide, du hast das HTML End-Tag vergessen.
Mitglied: 137846
Lösung 137846 21.12.2018 aktualisiert um 16:12:54 Uhr
Goto Top
Oder du nutzt einen XMLReader wie in der Meldung schon drauf hingewiesen um die DTD zu parsen:
Mitglied: NetzwerkDude
NetzwerkDude 21.12.2018 aktualisiert um 16:29:46 Uhr
Goto Top
Danke für die Antwort, ja sorry für das unvollständige XML, wollte nur den oberen header zeigen wegen dem DTD - die komplette File hätte 200 Zeilen, wollte das ersparen face-smile
Mitglied: NetzwerkDude
NetzwerkDude 21.12.2018 um 16:29:01 Uhr
Goto Top
Wie füttere ich denn den Reader? Die Methoden .Read() und .ReadinnerXML() wollen nicht
(wenn ich denen den XML inhalt als string gebe)
-->
Mitglied: NetzwerkDude
NetzwerkDude 21.12.2018 um 16:29:30 Uhr
Goto Top
Hier der vollständigkeit halber die ganze XML:
Mitglied: 137846
Lösung 137846 21.12.2018 aktualisiert um 16:35:19 Uhr
Goto Top
Wie füttere ich denn den Reader?
S.o.
Die Datei wird beim Create als erster Parameter übergeben.
Zum lesen der Daten machst du eine While() Schleife mit Read()

Beispiel:
Den Rest entnimmst du bitte der .NET Doku zum Object
https://docs.microsoft.com/de-de/dotnet/api/system.xml.xmlreader?view=ne ...
Mitglied: NetzwerkDude
NetzwerkDude 21.12.2018 um 16:36:47 Uhr
Goto Top
Danke soweit!
Mitglied: 137846
137846 21.12.2018 aktualisiert um 16:44:29 Uhr
Goto Top
Keine Ursache.

Frohes Fest!