PDF auslesen und in Excel Tabelle schreiben
Ich möchte in folgendem PDF (hier Beispiel als Bilddatei) die orange umkreisten Felder auslesen und in Excel in je eine eigene Spalte automatisch eintragen lassen. Dabei müsste bei dem Feld "jährliche Erneuerungen" des PDFs das Jahr als Spaltenüberschrift und je nachdem ob unter dem Jahr eine Unterschrift ist oder ein Schrägstrich müsste in Excel in der jeweiligen Jahresspalte eine null oder eins eingetragen werden.
Vielleicht kann mir jemand weiterhelfen und zumindest beantworten, ob man das automatisieren könnte oder eher nicht.
Danke für die Hilfe!
Vielleicht kann mir jemand weiterhelfen und zumindest beantworten, ob man das automatisieren könnte oder eher nicht.
Danke für die Hilfe!
Please also mark the comments that contributed to the solution of the article
Content-Key: 385812
Url: https://administrator.de/contentid/385812
Printed on: April 28, 2024 at 02:04 o'clock
3 Comments
Latest comment
Mit entsprechend intelligenter Software ja, da es ja offensichtlich Handschriftliche Merkmale sind die ausgewertet werden müssen und da braucht es schon etwas mehr mit Imageprocessing:
https://sourceforge.net/projects/formscanner/
http://autodata.com/products/expert-scan/
https://www.abbyy.com/en-us/solutions/forms-processing/
https://www.scanstore.com/Scanning/Document_Imaging/Software/Form_&_ ...
https://sourceforge.net/projects/formscanner/
http://autodata.com/products/expert-scan/
https://www.abbyy.com/en-us/solutions/forms-processing/
https://www.scanstore.com/Scanning/Document_Imaging/Software/Form_&_ ...
Hallo,
nimm doch mal eine OCR-Software oder einen Kopierer der mit OCR scannen kann und scan mal 100 Dokumente ein.
Hier vergleiche mal das Original mit dem erkannten Texten.
So wie das hier aussieht gehe ich mal von einer Fehlerraten von mindestens 10% aus.
Der Aufwand das erkannte mit dem Original zu vergleichen ist sehr hoch.
Vermutlich ist es einfacher die Daten direkt digital zu erfassen.
Mit Tablets oder ähnlichen.
Oder sind es eh alte Zettel?
Stefan
nimm doch mal eine OCR-Software oder einen Kopierer der mit OCR scannen kann und scan mal 100 Dokumente ein.
Hier vergleiche mal das Original mit dem erkannten Texten.
So wie das hier aussieht gehe ich mal von einer Fehlerraten von mindestens 10% aus.
Der Aufwand das erkannte mit dem Original zu vergleichen ist sehr hoch.
Vermutlich ist es einfacher die Daten direkt digital zu erfassen.
Mit Tablets oder ähnlichen.
Oder sind es eh alte Zettel?
Stefan
Hallo,
ich habe Dein Bild mal durch meinen Mittelklasse-Dokumenten-Scanner geschickt.
Das Ergebnis ist ein PDF mit Text und Grafik. Ich habe es Dir eben per PN geschickt.
Du kannst den Text im PDF markieren, kopieren und in Word oder einem Editor einfügen.
Dann kannst Du sehen was er nicht erkennen konnte und was falsch.
Stefan
ich habe Dein Bild mal durch meinen Mittelklasse-Dokumenten-Scanner geschickt.
Das Ergebnis ist ein PDF mit Text und Grafik. Ich habe es Dir eben per PN geschickt.
Du kannst den Text im PDF markieren, kopieren und in Word oder einem Editor einfügen.
Dann kannst Du sehen was er nicht erkennen konnte und was falsch.
Stefan