metameyer990
Goto Top

Scannen mit Texterkennung und Automatischer Benennung von Dateien

Ich suche ein Programm, was einscannt und die gescannten Dateien (normal nur Rechnungen) benennt.

Hallo,

wir bekommen in der Firma Pro Woche ca. 50 Rechnungen von 5 Lieferanten.

Also relativ übersichtlich.

Nun hätte ich gerne ein Programm, wo ich einfach den Stapel Rechnungen auf meinen Einzahlblatt-USB-Twain-Kompatiblen Scanner legen und das Zeug mit Texterkennung durch laufen lassen kann.


Da bei den Rechnungen steht immer alles ein gleicher Stelle, damit könnte man perfekterweise die Dateien Automatisch Bennen lassen.

Einige Rechnungen haben auch mehr als eine Seite, diese sind aber immer numeriert.


z.B.
JJJJ-MM-TT Lieferant - Rechnungsnummer - Summe.pdf

Davon 5 verschiedene

und natürlich
JJJJ-MM-TT - nicht zugeordnet.


Leider ist das mit Paperport nicht möglich. Und sowas wie ELO etc. brauchen wir nicht. Es geht reinweg darum eine PDF Ablage in Ordner zu erstellen.

ich freue mich auf Tipps!

Content-ID: 204557

Url: https://administrator.de/contentid/204557

Ausgedruckt am: 19.11.2024 um 20:11 Uhr

64748
64748 07.04.2013 um 15:12:50 Uhr
Goto Top
Hallo,

wenn ich Dich richtig verstehe, geht es darum, die Rechnungen einzuscannen als PDF-Dokumente. Diese werden dann umbenannt (nach Rechnungsnummer, Lieferant etc.) und in entsprechende Ordner verschoben.

Ich glaube, wenn Du es effizient von Hand machst, geht es schneller. Ich würde die Rechnungsdateien erstmal mit einem Template umbenennen. Also für kommende Woche alle Rechnungen nach dem Muster
01_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
02_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
03_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
...
50_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
Dann kannst Du Dir die Dateien als Vorschau im Explorer ansehen und entsprechend umbenennen und dann in Ordner verschieben. Das Umbenennen geht auf diese Weise ziemlich flott. Vielleicht auch mit einem kleinen Batch-Skript.

Es ist auch denkbar, dass Du manuell die Rechnungen nach Lieferanten vorsortierst und benennst.

Da bei OCR eine gewisse Fehlerquote zu berücksichtigen ist, müsstest Du den automatisierten Vorgang sowieso prüfen und dann ist es vielleicht manuell schneller.

Markus
MetaMeyer990
MetaMeyer990 07.04.2013 um 18:58:31 Uhr
Goto Top
HI,

ggf. hätte ich erwähnen sollen das noch nie was gescannt wurde?
Es sind also rund 3000 Rechnungen die noch gescannt werden müssen.

Die Texterkennung vom Paperport arbeitet Fehlerfrei, und selbst wenn da mal ein Fehler drin ist, das wäre ja nicht dramatisch, das sieht man ja sicher sehr zügig. Da vertippe ich mich glaube ich eher, als das ein Computer nen fehler macht face-smile

Auch würden Fehler nicht so viel aus machen, es ist ein Archiv um alle Rechnungen bei Sammen zu haben. sonst sucht man halt immer eweig wenn man etwas braucht.

Gesucht wird meistens nach Datum, da macht das ding keine fehler.


Würde mich freuen, falls jemand noch eine Idee dazu hat!
Lochkartenstanzer
Lochkartenstanzer 07.04.2013 um 21:17:30 Uhr
Goto Top
Moin,

Ich würde da vermutlich eine Lösung auf linux.basis "zusammenschrauben"

  • mit einem Kommandozeilen-scantool (scanadf o.ä.) Alle Rechnungen einscannen und unter temporärem Namen ablegen.
  • Aus diesen Scans den betreffenden ausschnitt mit imagemagick ausschneiden und an ein ocr-programm verfüttern, wie z.B. gocr
  • Aus den Ergebnis einen Namen zusammenbasteln und den temporären Scan in das endgültige PDF mit dem richtigen namen umwandeln.

Ist zwar zuviel um das hier einfach so mal aus dem Ärmel zu schütteln, insbesondere weil man nicht weiß, von welchen Programmen/Treibern Euer scanner unterstützt wird, sollte aber für einen Erfahrenen Spezialisten relativ Fix (unter 1/2 MT) zu bewerkstelligen sein.

lks
64748
64748 07.04.2013 um 21:59:37 Uhr
Goto Top
Hallo nochmal,

ja, an Linux hatte ich auch gedacht face-wink

Es ließe sich leicht durch parsen des Textes Lieferant, Rechnungsnummer und Datum sowie Rechnungsbetrag herausfinden. Gerade hab ich mal gocr ausprobiert, danke Lochkartenstanzer für den Tipp face-smile

Das Ergebnis scheint von der Scan-Qualität abzuhängen. Für's Parsen würde ich mir in einem solchen Fall ein Perlskript schreiben. Damit kann man dann auch gleich Ordner anlegen, Dateien umbenennen und verschieben.

Markus