netzwerkdude
Goto Top

XML Dateien mit DTD in PowerShell parsen

Moin,

habe hier eine XML Datei mit
(Ist eine .hocr Datei erstellt von Tesseract)

Wenn ich die Datei per Import-Clixml reinladen will, kommt folgende exception



Habe mal ins XML Objekt von PS geschaut:
was für Methoden und Eigenschaften das Objekt in PS so hat, aber konnte jetzt auf die schnelle nichts finden was nach DtD aussieht

Frage: Wie mache ich den vorgeschlagenen Workaround?
Und andere Workaound Idee: kann ich eigentlich alles was in der dtd steht "manuell" runterladen und einfach in die XML einbauen?

MFG N-Dude

Content-Key: 396424

Url: https://administrator.de/contentid/396424

Printed on: March 21, 2023 at 09:03 o'clock

Mitglied: 137846
Solution 137846 Dec 21, 2018 updated at 14:58:36 (UTC)
Goto Top
Setze vor dem Laden per XML Object den XmlResolver auf $null dann wird die DTD beim parsen ignoriert.
Beispiel:
Gruß A.

btw.. dein gepostetes XML oben ist nicht valide, du hast das HTML End-Tag vergessen.
Mitglied: 137846
Solution 137846 Dec 21, 2018 updated at 15:12:54 (UTC)
Goto Top
Oder du nutzt einen XMLReader wie in der Meldung schon drauf hingewiesen um die DTD zu parsen:
Member: NetzwerkDude
NetzwerkDude Dec 21, 2018 updated at 15:29:46 (UTC)
Goto Top
Danke für die Antwort, ja sorry für das unvollständige XML, wollte nur den oberen header zeigen wegen dem DTD - die komplette File hätte 200 Zeilen, wollte das ersparen face-smile
Member: NetzwerkDude
NetzwerkDude Dec 21, 2018 at 15:29:01 (UTC)
Goto Top
Wie füttere ich denn den Reader? Die Methoden .Read() und .ReadinnerXML() wollen nicht
(wenn ich denen den XML inhalt als string gebe)
-->
Member: NetzwerkDude
NetzwerkDude Dec 21, 2018 at 15:29:30 (UTC)
Goto Top
Hier der vollständigkeit halber die ganze XML:
Mitglied: 137846
Solution 137846 Dec 21, 2018 updated at 15:35:19 (UTC)
Goto Top
Wie füttere ich denn den Reader?
S.o.
Die Datei wird beim Create als erster Parameter übergeben.
Zum lesen der Daten machst du eine While() Schleife mit Read()

Beispiel:
Den Rest entnimmst du bitte der .NET Doku zum Object
https://docs.microsoft.com/de-de/dotnet/api/system.xml.xmlreader?view=ne ...
Member: NetzwerkDude
NetzwerkDude Dec 21, 2018 at 15:36:47 (UTC)
Goto Top
Danke soweit!
Mitglied: 137846
137846 Dec 21, 2018 updated at 15:44:29 (UTC)
Goto Top
Keine Ursache.

Frohes Fest!