yannosch
Goto Top

OCR Eingangsrechnungen von PDF in XML

Hallo zusammen,

ich bin gerade dabei eine Automatisierungslösung für unsere Eingangsrechnungen zu finden.

Folgendes soll umgesetzt werden:

Einscannen der Eingangsrechnungen als PDF in einen "Arbeitsordner". [Kein Problem]
Eingangrechnungen die bereits als PDF geschickt wurden ebenfalls in einen "Arbeitsordner" speichern. [Kein Problem]

Danach sollte es möglich sein alle PDFs aus dem "Arbeitsordner" in eine OCR-Software einzulesen die bestenfalls eine Felderkennung hat und Parameter wie Name, Anschrift, UST-ID, Bestellnummer, usw. erkennt. Außerdem wäre es wünschenswert nicht erkannte Felder manuell zuzuordnen. Das Ergebnis jeder bearbeiteten PDF-Eingangsrechnung sollte im XML Format [ebenfalls vom Aufbau anpassbar] abgespeichert werden, um es in unser ERP-System einzulesen.

Kennt jemand evtl. eine OCR Software die meine Aufgabenstellung so oder so ähnlich abbildet?

Bin für jeden Tipp dankbar

liebe Grüße
Yannosch

Content-ID: 336277

Url: https://administrator.de/forum/ocr-eingangsrechnungen-von-pdf-in-xml-336277.html

Ausgedruckt am: 08.04.2025 um 18:04 Uhr

132895
132895 27.04.2017 aktualisiert um 13:47:15 Uhr
Goto Top
Mit Acrobat dem Aktionsassistent und ein bisschen JavaScript sollte das z.B. lösbar sein.

Abbyy Forms Processing kann das auch.

Gruß
tr6234
tr6234 05.07.2017 um 11:46:27 Uhr
Goto Top
Hallo Yannosch,

es gibt eine Lösung sowohl für PDF als auch OCR-PDF: https://www.pdfmapper.com
Kann auch komplexe Positionsdaten aus unterschiedlich aufgebauten Artikelzeilen auslesen.

Gruss