Ios-App, Scan, pdf, ocr, fortl. auto-Name
Hallo in die Runde,
hatte meinen letzten Beitrag gelöscht, weil sich die Problematik eigentlich auf recht überschaubare Funktionalität runterdampfte. Nachdem ich jetzt aber etliche Apps installierte, probierte und nicht das passende fand, ruf ich hier nochmal um Hilfe:
Gesucht:
Problem:
Die Apps lassen automatisch nur Datum und Uhrzeit zu, der Rest muss manuell gemacht werden.
Die Idee war eigentlich, dass der Beleg fotografiert wird - die fortlaufende Nummer auf dem Original vermerkt und dann gleich unter dem Monat "geleitzt" wird. Der Scan kommt dann extern zur Buchung. Anhand des Monats und der Nummer lassen sie sich dem Original recht schnell zuordnen.
Kennt jemand ne App, die sowas beherrscht?!
Mal so ne richtige Freitags-Frage
Euch ein schönes, sonniges und erholsames WE.
hatte meinen letzten Beitrag gelöscht, weil sich die Problematik eigentlich auf recht überschaubare Funktionalität runterdampfte. Nachdem ich jetzt aber etliche Apps installierte, probierte und nicht das passende fand, ruf ich hier nochmal um Hilfe:
Gesucht:
- Beleg/Qittung/Rechnung in IOS scannen
- OCR Deutsch/Englisch
- Speichern (Jahr/Monat_fortlaufende Zählung)
- Einfacher Export zu oneDrive/Sharepoint
Problem:
- Die fortlaufende Zählung im Dateinamen
Die Apps lassen automatisch nur Datum und Uhrzeit zu, der Rest muss manuell gemacht werden.
Die Idee war eigentlich, dass der Beleg fotografiert wird - die fortlaufende Nummer auf dem Original vermerkt und dann gleich unter dem Monat "geleitzt" wird. Der Scan kommt dann extern zur Buchung. Anhand des Monats und der Nummer lassen sie sich dem Original recht schnell zuordnen.
Kennt jemand ne App, die sowas beherrscht?!
Mal so ne richtige Freitags-Frage
Euch ein schönes, sonniges und erholsames WE.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 3555690032
Url: https://administrator.de/forum/ios-app-scan-pdf-ocr-fortl-auto-name-3555690032.html
Ausgedruckt am: 13.03.2025 um 19:03 Uhr
5 Kommentare
Neuester Kommentar
Hallo,
iOS leider kein Plan. Ich gehe mal davon aus: PDF/ Bild liegt unter Windows.
Eine Möglichkeit bei PDF wäre OCR zu machen: Tesseract ist kostenlos und multilinugal. Im nächsten Step mit pdftotext extrahieren.
Je nach Layout stehen die Nummern und Datum neben oder untereinander. Kommt dabei auch auf die Dokumente an.
Reicht das nicht, brauchst du mehr Logilk. Ich selber realisiere grad ein Projekt mit gescannten Belegen, die wir selber erstellt haben. Ort des Barcodes ist hier bekannt. Sind in C# nur 2 Zeilen. Bzw. in Powershell. Um die Genauigkeit - und da der Barcode Ort bekannt ist - zu verbessern, nutze ich Rectangle für die Bildbearbeitung. Damit ziehe ich ein Quadrat über den Bereich und übergebe nur den an die Barcode Reader DLL.
Hier nutze ich eine ältere. Man kann 100 oder 500 und mehr Durchgänge einstellen. Auch dunkle Büchrücken erkennt die DLL. Finde es recht gut. Je nach Anzahl der Durchgänge und Schwierigkeit bekommt man einen Array mit ALLEN Barcdoes zurück. Mitunter ist die Nummer auch doppelt. Kann man Filtern.
Ohne Barcode hilft das dir ggf. bedigt! Da die Lokation doch meist oben rechts ist, könntest du damit Tesseract untersützten und nur die relevanten Daten übergeben. Wobei sich komplette OCR schon lohnt. Es added einen Textstream zum PDF und macht es durchsuchbar.
Eine Area wie mit Rectangle hätte den Vorteil, dass du hier explizit ein O "Oh" in 0 "Null" konvertieren kannst. Falls es mal Amok läuft und aus Zahlen Buchstaben macht. Mit Nullen und den Buchstaben O dürften eh viele Prrobleme haben.
Ggf. hat die Rechnung ja schon einen Barcode. Wenn die nicht gerade kryptisch unterwegs sind, kann man ggf. Belegnummer und Datum daraus ziehen.
Ich hab leider noch nicht viel mit OneDrive etc. gemacht. Denke aber die API sollte alles hergeben. Bzw. manipulierst Du die Dateinamen vorher mit PowerShell.
Die Erkennng bei den Barcode, wie oben beschrieben, lief bei mir < 1 Sekunde. Die Frage ist, ob Zeit überhaupt dann eine Rolle spielt. Würde - wenn ich es selber progge - eher versuchen so sauber wie möglich Datum etc. zu bekommen.
Da wir in der Verarbeitung sind, kannst du auch auf Plausibiliät prüfen! Rechnung aus 1955 macht wenig Sinn. So könnte man schon ein paar Ausreißer einfangen.
Übrigens benutze ich für Rectangle einen Clone. Org. Bild bleibt erhalten. Du kannst es also in 1x Druchlauf durch 2x Funktionen schicken. Einmal nur mit Konzentration auf den rechten, oberen Bereich. Einmal für Volltext.
Unter Ubuntu wäre das schöne, dass es da schon Tools gibt, die PDF in IMG und an Tesseract übergeben. Linux oder Linux Subsystem unter Winodws Server sind nicht jedermanns Sache. PowerShell kann belieibige managementbare DLLs laden. Call zu public static ist nur ein 1 Zeiler.
Bei Interesse kann ich den Barcode Reader mal posten. Ohne Barcode wie gesagt zumindest die Rectangle Aufteilung nutzbar.
Tesseract gibt es auch für MacOS: https://fynder.de/tutorial/mac-osx-kostenlose-texterkennung-tesseract-oc ...
Die Frage ist, ob die iOS App alles können soll, oder Du später nachverarbeiten willst. Bei der letzten Variante bist du frei unter Linux, MacOS oder Windows unterwegs......
mfg Crusher
iOS leider kein Plan. Ich gehe mal davon aus: PDF/ Bild liegt unter Windows.
Eine Möglichkeit bei PDF wäre OCR zu machen: Tesseract ist kostenlos und multilinugal. Im nächsten Step mit pdftotext extrahieren.
Je nach Layout stehen die Nummern und Datum neben oder untereinander. Kommt dabei auch auf die Dokumente an.
Reicht das nicht, brauchst du mehr Logilk. Ich selber realisiere grad ein Projekt mit gescannten Belegen, die wir selber erstellt haben. Ort des Barcodes ist hier bekannt. Sind in C# nur 2 Zeilen. Bzw. in Powershell. Um die Genauigkeit - und da der Barcode Ort bekannt ist - zu verbessern, nutze ich Rectangle für die Bildbearbeitung. Damit ziehe ich ein Quadrat über den Bereich und übergebe nur den an die Barcode Reader DLL.
Hier nutze ich eine ältere. Man kann 100 oder 500 und mehr Durchgänge einstellen. Auch dunkle Büchrücken erkennt die DLL. Finde es recht gut. Je nach Anzahl der Durchgänge und Schwierigkeit bekommt man einen Array mit ALLEN Barcdoes zurück. Mitunter ist die Nummer auch doppelt. Kann man Filtern.
Ohne Barcode hilft das dir ggf. bedigt! Da die Lokation doch meist oben rechts ist, könntest du damit Tesseract untersützten und nur die relevanten Daten übergeben. Wobei sich komplette OCR schon lohnt. Es added einen Textstream zum PDF und macht es durchsuchbar.
Eine Area wie mit Rectangle hätte den Vorteil, dass du hier explizit ein O "Oh" in 0 "Null" konvertieren kannst. Falls es mal Amok läuft und aus Zahlen Buchstaben macht. Mit Nullen und den Buchstaben O dürften eh viele Prrobleme haben.
Ggf. hat die Rechnung ja schon einen Barcode. Wenn die nicht gerade kryptisch unterwegs sind, kann man ggf. Belegnummer und Datum daraus ziehen.
Ich hab leider noch nicht viel mit OneDrive etc. gemacht. Denke aber die API sollte alles hergeben. Bzw. manipulierst Du die Dateinamen vorher mit PowerShell.
Die Erkennng bei den Barcode, wie oben beschrieben, lief bei mir < 1 Sekunde. Die Frage ist, ob Zeit überhaupt dann eine Rolle spielt. Würde - wenn ich es selber progge - eher versuchen so sauber wie möglich Datum etc. zu bekommen.
Da wir in der Verarbeitung sind, kannst du auch auf Plausibiliät prüfen! Rechnung aus 1955 macht wenig Sinn. So könnte man schon ein paar Ausreißer einfangen.
Übrigens benutze ich für Rectangle einen Clone. Org. Bild bleibt erhalten. Du kannst es also in 1x Druchlauf durch 2x Funktionen schicken. Einmal nur mit Konzentration auf den rechten, oberen Bereich. Einmal für Volltext.
Unter Ubuntu wäre das schöne, dass es da schon Tools gibt, die PDF in IMG und an Tesseract übergeben. Linux oder Linux Subsystem unter Winodws Server sind nicht jedermanns Sache. PowerShell kann belieibige managementbare DLLs laden. Call zu public static ist nur ein 1 Zeiler.
Bei Interesse kann ich den Barcode Reader mal posten. Ohne Barcode wie gesagt zumindest die Rectangle Aufteilung nutzbar.
Tesseract gibt es auch für MacOS: https://fynder.de/tutorial/mac-osx-kostenlose-texterkennung-tesseract-oc ...
Die Frage ist, ob die iOS App alles können soll, oder Du später nachverarbeiten willst. Bei der letzten Variante bist du frei unter Linux, MacOS oder Windows unterwegs......
mfg Crusher