Ios-App, Scan, pdf, ocr, fortl. auto-Name

Hallo in die Runde,

hatte meinen letzten Beitrag gelöscht, weil sich die Problematik eigentlich auf recht überschaubare Funktionalität runterdampfte. Nachdem ich jetzt aber etliche Apps installierte, probierte und nicht das passende fand, ruf ich hier nochmal um Hilfe:

Gesucht:

Beleg/Qittung/Rechnung in IOS scannen
OCR Deutsch/Englisch
Speichern (Jahr/Monat_fortlaufende Zählung)
Einfacher Export zu oneDrive/Sharepoint

Problem:

Die fortlaufende Zählung im Dateinamen

Die Apps lassen automatisch nur Datum und Uhrzeit zu, der Rest muss manuell gemacht werden.

Die Idee war eigentlich, dass der Beleg fotografiert wird - die fortlaufende Nummer auf dem Original vermerkt und dann gleich unter dem Monat "geleitzt" wird. Der Scan kommt dann extern zur Buchung. Anhand des Monats und der Nummer lassen sie sich dem Original recht schnell zuordnen.

Kennt jemand ne App, die sowas beherrscht?!

Mal so ne richtige Freitags-Frage

Euch ein schönes, sonniges und erholsames WE.

Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben

Content-ID: 3555690032

Url: https://administrator.de/forum/ios-app-scan-pdf-ocr-fortl-auto-name-3555690032.html

Ausgedruckt am: 05.06.2025 um 19:06 Uhr

5 Kommentare

Neuester Kommentar

Moin,

in der App Scanner Pro gibt es die Möglichkeit, Arbeitsabläufe zu definieren. Darunter gab es meiner Erinnerung nach auch einen Punkt "Umbenennen". Ich weiß allerdings im Moment nicht, ob sich das auch auf den Dateinamen bezog.

Gruß

Uwe

Hallo,

iOS leider kein Plan. Ich gehe mal davon aus: PDF/ Bild liegt unter Windows.

Eine Möglichkeit bei PDF wäre OCR zu machen: Tesseract ist kostenlos und multilinugal. Im nächsten Step mit pdftotext extrahieren.

Je nach Layout stehen die Nummern und Datum neben oder untereinander. Kommt dabei auch auf die Dokumente an.

Reicht das nicht, brauchst du mehr Logilk. Ich selber realisiere grad ein Projekt mit gescannten Belegen, die wir selber erstellt haben. Ort des Barcodes ist hier bekannt. Sind in C# nur 2 Zeilen. Bzw. in Powershell. Um die Genauigkeit - und da der Barcode Ort bekannt ist - zu verbessern, nutze ich Rectangle für die Bildbearbeitung. Damit ziehe ich ein Quadrat über den Bereich und übergebe nur den an die Barcode Reader DLL.

Hier nutze ich eine ältere. Man kann 100 oder 500 und mehr Durchgänge einstellen. Auch dunkle Büchrücken erkennt die DLL. Finde es recht gut. Je nach Anzahl der Durchgänge und Schwierigkeit bekommt man einen Array mit ALLEN Barcdoes zurück. Mitunter ist die Nummer auch doppelt. Kann man Filtern.

Ohne Barcode hilft das dir ggf. bedigt! Da die Lokation doch meist oben rechts ist, könntest du damit Tesseract untersützten und nur die relevanten Daten übergeben. Wobei sich komplette OCR schon lohnt. Es added einen Textstream zum PDF und macht es durchsuchbar.

Eine Area wie mit Rectangle hätte den Vorteil, dass du hier explizit ein O "Oh" in 0 "Null" konvertieren kannst. Falls es mal Amok läuft und aus Zahlen Buchstaben macht. Mit Nullen und den Buchstaben O dürften eh viele Prrobleme haben.

Ggf. hat die Rechnung ja schon einen Barcode. Wenn die nicht gerade kryptisch unterwegs sind, kann man ggf. Belegnummer und Datum daraus ziehen.

Ich hab leider noch nicht viel mit OneDrive etc. gemacht. Denke aber die API sollte alles hergeben. Bzw. manipulierst Du die Dateinamen vorher mit PowerShell.

Die Erkennng bei den Barcode, wie oben beschrieben, lief bei mir < 1 Sekunde. Die Frage ist, ob Zeit überhaupt dann eine Rolle spielt. Würde - wenn ich es selber progge - eher versuchen so sauber wie möglich Datum etc. zu bekommen.

Da wir in der Verarbeitung sind, kannst du auch auf Plausibiliät prüfen! Rechnung aus 1955 macht wenig Sinn. So könnte man schon ein paar Ausreißer einfangen.

Übrigens benutze ich für Rectangle einen Clone. Org. Bild bleibt erhalten. Du kannst es also in 1x Druchlauf durch 2x Funktionen schicken. Einmal nur mit Konzentration auf den rechten, oberen Bereich. Einmal für Volltext.

Unter Ubuntu wäre das schöne, dass es da schon Tools gibt, die PDF in IMG und an Tesseract übergeben. Linux oder Linux Subsystem unter Winodws Server sind nicht jedermanns Sache. PowerShell kann belieibige managementbare DLLs laden. Call zu public static ist nur ein 1 Zeiler.

Bei Interesse kann ich den Barcode Reader mal posten. Ohne Barcode wie gesagt zumindest die Rectangle Aufteilung nutzbar.

Tesseract gibt es auch für MacOS: https://fynder.de/tutorial/mac-osx-kostenlose-texterkennung-tesseract-oc ...

Die Frage ist, ob die iOS App alles können soll, oder Du später nachverarbeiten willst. Bei der letzten Variante bist du frei unter Linux, MacOS oder Windows unterwegs......

mfg Crusher

@transocean:
Ja, Scanner Pro habe ich selber und u.a. mit Genius Scan habe getestet. Das Problem war, dass ich die fortlaufende Nummierung nicht automatisiert bekomme und auch eine Lösung über den Upload zu OneDrive nicht klappte, weil sich die Dokumente mit gleichem Namen ( z.B. Jahr_Monat) automatisch überschreiben.
Habe aber jetzt - mit ScannerPro - einen Workaround gefunden: Bei der lokalen Speicherung innerhalb eines Ordners legt er die Dokumente mit fortalufender Numierung an. Das müsste eigentlich auch im Tagesgeschäft funktionieren. Wir werden das jetzt einfach mal ne zeitlang testen, ob sich das bewährt.

@Crusher79:
Danke Dir Crusher, ich hatte sowas schon gefunden, z.B. siehe Links für Anwälte. In dem gewünschten Einsatz-Zweck wäre das vom Arbeitsablauf aber ziemlich einschränkend. Die iPad-App kann ich am Arbeitsplatz nutzen, gleich noch die Kontierung notieren und die fortlaufende Nummierung auf dem Original vermerken und dieses gleich ablegen. Da will ich nicht vom Scanner zum Arbeitsplatz usw.
https://www.lto.de/recht/legal-tech/l/legal-tech-innovation-pdf-scan-umb ...

schau dir mal "Microsoft lens" an, die macht (nach meinem geschmack) ganz gute ergebnisse

Nee, das is nix. Das ist schon rausgeflogen, weil man die Namensgebung nicht vordefinieren kann.

Im Anschluss wird man auch noch auf OneDrive verwiesen, welches genauso unflexibel ist aber als Krönung bei jedem Wackler nachfragt, ob man nicht nen Feedback schicken möchte.

Für sowas fehlt mir echt Verständnis, Lebenszeit - und Nerven

Der Markt ist überraschend überschaubar - lieber werben 45 Scanner-Apps damit, dass sie die Quittungen doch ein minimales wenig more crispy einscannen als die 44 anderen.

gelöstFrage Apple iOS

Mehr von Visucius

UptimeKuma - fehlerhafte AusfälleVisucius - 2 Kommentare

14.000 Fortinet-Firewalls kompromitiertVisucius - 6 Kommentare

MacBook, externer Monitor, FingerprintVisucius - 7 Kommentare

Domainfactory - Migration zu MS365Visucius - 7 Kommentare

Heiß diskutiert