Scannen mit Texterkennung und Automatischer Benennung von Dateien
Ich suche ein Programm, was einscannt und die gescannten Dateien (normal nur Rechnungen) benennt.
Hallo,
wir bekommen in der Firma Pro Woche ca. 50 Rechnungen von 5 Lieferanten.
Also relativ übersichtlich.
Nun hätte ich gerne ein Programm, wo ich einfach den Stapel Rechnungen auf meinen Einzahlblatt-USB-Twain-Kompatiblen Scanner legen und das Zeug mit Texterkennung durch laufen lassen kann.
Da bei den Rechnungen steht immer alles ein gleicher Stelle, damit könnte man perfekterweise die Dateien Automatisch Bennen lassen.
Einige Rechnungen haben auch mehr als eine Seite, diese sind aber immer numeriert.
z.B.
JJJJ-MM-TT Lieferant - Rechnungsnummer - Summe.pdf
Davon 5 verschiedene
und natürlich
JJJJ-MM-TT - nicht zugeordnet.
Leider ist das mit Paperport nicht möglich. Und sowas wie ELO etc. brauchen wir nicht. Es geht reinweg darum eine PDF Ablage in Ordner zu erstellen.
ich freue mich auf Tipps!
Hallo,
wir bekommen in der Firma Pro Woche ca. 50 Rechnungen von 5 Lieferanten.
Also relativ übersichtlich.
Nun hätte ich gerne ein Programm, wo ich einfach den Stapel Rechnungen auf meinen Einzahlblatt-USB-Twain-Kompatiblen Scanner legen und das Zeug mit Texterkennung durch laufen lassen kann.
Da bei den Rechnungen steht immer alles ein gleicher Stelle, damit könnte man perfekterweise die Dateien Automatisch Bennen lassen.
Einige Rechnungen haben auch mehr als eine Seite, diese sind aber immer numeriert.
z.B.
JJJJ-MM-TT Lieferant - Rechnungsnummer - Summe.pdf
Davon 5 verschiedene
und natürlich
JJJJ-MM-TT - nicht zugeordnet.
Leider ist das mit Paperport nicht möglich. Und sowas wie ELO etc. brauchen wir nicht. Es geht reinweg darum eine PDF Ablage in Ordner zu erstellen.
ich freue mich auf Tipps!
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 204557
Url: https://administrator.de/contentid/204557
Ausgedruckt am: 19.11.2024 um 20:11 Uhr
4 Kommentare
Neuester Kommentar
Hallo,
wenn ich Dich richtig verstehe, geht es darum, die Rechnungen einzuscannen als PDF-Dokumente. Diese werden dann umbenannt (nach Rechnungsnummer, Lieferant etc.) und in entsprechende Ordner verschoben.
Ich glaube, wenn Du es effizient von Hand machst, geht es schneller. Ich würde die Rechnungsdateien erstmal mit einem Template umbenennen. Also für kommende Woche alle Rechnungen nach dem MusterDann kannst Du Dir die Dateien als Vorschau im Explorer ansehen und entsprechend umbenennen und dann in Ordner verschieben. Das Umbenennen geht auf diese Weise ziemlich flott. Vielleicht auch mit einem kleinen Batch-Skript.
Es ist auch denkbar, dass Du manuell die Rechnungen nach Lieferanten vorsortierst und benennst.
Da bei OCR eine gewisse Fehlerquote zu berücksichtigen ist, müsstest Du den automatisierten Vorgang sowieso prüfen und dann ist es vielleicht manuell schneller.
Markus
wenn ich Dich richtig verstehe, geht es darum, die Rechnungen einzuscannen als PDF-Dokumente. Diese werden dann umbenannt (nach Rechnungsnummer, Lieferant etc.) und in entsprechende Ordner verschoben.
Ich glaube, wenn Du es effizient von Hand machst, geht es schneller. Ich würde die Rechnungsdateien erstmal mit einem Template umbenennen. Also für kommende Woche alle Rechnungen nach dem Muster
01_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
02_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
03_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
...
50_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
Es ist auch denkbar, dass Du manuell die Rechnungen nach Lieferanten vorsortierst und benennst.
Da bei OCR eine gewisse Fehlerquote zu berücksichtigen ist, müsstest Du den automatisierten Vorgang sowieso prüfen und dann ist es vielleicht manuell schneller.
Markus
Moin,
Ich würde da vermutlich eine Lösung auf linux.basis "zusammenschrauben"
Ist zwar zuviel um das hier einfach so mal aus dem Ärmel zu schütteln, insbesondere weil man nicht weiß, von welchen Programmen/Treibern Euer scanner unterstützt wird, sollte aber für einen Erfahrenen Spezialisten relativ Fix (unter 1/2 MT) zu bewerkstelligen sein.
lks
Ich würde da vermutlich eine Lösung auf linux.basis "zusammenschrauben"
- mit einem Kommandozeilen-scantool (scanadf o.ä.) Alle Rechnungen einscannen und unter temporärem Namen ablegen.
- Aus diesen Scans den betreffenden ausschnitt mit imagemagick ausschneiden und an ein ocr-programm verfüttern, wie z.B. gocr
- Aus den Ergebnis einen Namen zusammenbasteln und den temporären Scan in das endgültige PDF mit dem richtigen namen umwandeln.
Ist zwar zuviel um das hier einfach so mal aus dem Ärmel zu schütteln, insbesondere weil man nicht weiß, von welchen Programmen/Treibern Euer scanner unterstützt wird, sollte aber für einen Erfahrenen Spezialisten relativ Fix (unter 1/2 MT) zu bewerkstelligen sein.
lks
Hallo nochmal,
ja, an Linux hatte ich auch gedacht
Es ließe sich leicht durch parsen des Textes Lieferant, Rechnungsnummer und Datum sowie Rechnungsbetrag herausfinden. Gerade hab ich mal gocr ausprobiert, danke Lochkartenstanzer für den Tipp
Das Ergebnis scheint von der Scan-Qualität abzuhängen. Für's Parsen würde ich mir in einem solchen Fall ein Perlskript schreiben. Damit kann man dann auch gleich Ordner anlegen, Dateien umbenennen und verschieben.
Markus
ja, an Linux hatte ich auch gedacht
Es ließe sich leicht durch parsen des Textes Lieferant, Rechnungsnummer und Datum sowie Rechnungsbetrag herausfinden. Gerade hab ich mal gocr ausprobiert, danke Lochkartenstanzer für den Tipp
Das Ergebnis scheint von der Scan-Qualität abzuhängen. Für's Parsen würde ich mir in einem solchen Fall ein Perlskript schreiben. Damit kann man dann auch gleich Ordner anlegen, Dateien umbenennen und verschieben.
Markus