melmelly
Goto Top

PDF-Rechungen autom. umbenennen?

Hallo,

ich habe regelmäßig einen Stapel Rechnungen (von unterschiedlichen Firmen, auch Tankquittungen) die teilweise eingescannt und später auf jeden Fall umbenannt werden müssen. Das Umbenennen erfolgt auf Basis der Inhalte der PDF-Datei nach dem Schema
<Datum> <Firma-Absender> <Inhalt>.PDF

Gibt es Tools die das einigermaßen automatisch hinkriegen? Momentan erfolgt alles manuell. Zumindest das Datum und die Firma die die Rechnung stellt sollte doch heutzutage automatisch erkennbar sein, oder?

Kann mir einer Tools empfehlen, die genau das können? Cloudlösungen scheiden aus.

Danke

Mel

Content-Key: 7060151068

Url: https://administrator.de/contentid/7060151068

Printed on: May 4, 2024 at 21:05 o'clock

Member: NordicMike
NordicMike May 08, 2023 at 04:48:07 (UTC)
Goto Top
Viele gute OCR Programme können das. Ich verwende Omnipage.
Mitglied: 7010350221
7010350221 May 08, 2023 at 05:38:28 (UTC)
Goto Top
Member: Inf1d3l
Inf1d3l May 08, 2023 updated at 07:22:32 (UTC)
Goto Top
Viel Spaß bei den unterschiedlich aufgebauten und schlecht gedruckten Rechnungen. Am Ende wirst du wahrscheinlich noch mehr Arbeit haben. Warum speichert ihr die Rechnungen nicht als Anhang in eurer FIBU-Datenbank.
Member: TomTomBon
TomTomBon May 08, 2023 at 07:33:29 (UTC)
Goto Top
Member: TomTomBon
TomTomBon May 08, 2023 at 07:50:07 (UTC)
Goto Top
PS:
ScannerVision beherrscht auch Vorlagen Erkennung.
Heißt Ich habe einen Scan (ohne Daten..) und gebe anhand dessen an wo was ist.
Und wenn man Graustufen und etwas verdunkelt scannt klappt das auch sehr oft gut.
Member: Crusher79
Crusher79 May 08, 2023 at 07:57:29 (UTC)
Goto Top
Hallo,

oder selber bauen. Mit tesseract PDF lesbar machen und mit pdftotext Texte exrahieren.

Je nach Aufbau kann man dann einfach den Text mit PowerShell sich vornehmen und die Felder füllen.

Geht auch für Barcode. DLL integriert und alles oder nur einen Ausschnitt durchlaufen lasen.

So ähnlich arbeiten auch die anderen. Nur da zahlt man halt mit Workflow teils deutlich mehr.

Das Hauptproblem wir das Anlernen sein. Bei den kommerziellen kann man es durch mehrere Templates jagen und erhält so einen match. Ging aber auch mit der Script Variante. Dann sollte es aber immer wiederkhrende Vorgäng sein. Sonst müsste man sich die Felder via GUI vorschlagen lassen und manuell kurz prüfen.

Die Post arbeitet teils ja auch so. Die schauen sich nur das Feld mit der PLZ an und tickern es im Härtefall ein. Arbeitserleichterung ist Softwarestütze schon. Nur wird man ggf. auf die Manpower nicht verzichten können.

Bei der Post tauchen die neuen Vorgänge ja sofort auf. Massenverarbeitung.

Asonsten DMS. Zwar die gleichen Probleme, aber mann kann es im Original ansehen und die Verschlagwortung korrigieren.

Besser wäre DMS als umbennnen allemal. Da hat man mehr Mögichkeiten. Oder kann nicht abgearbeitet Stapel zur WV legen.

Komplett liegen solche Lösunge teisl im 5-stelligen bis 6-stelligen Bereich.

Ich würde über DMS nachdenken, wo man die Masken schnell zu Gesicht bekommt. Die Dokumenten Verschlagwortung rasch prüfen kann.

Allerdings sind wir bei Rechnungen dann wieder bei GoBD angelangt - Verfahrensdokumentation.

Am beste wäre die Kombination aus allen: DMS + (halb-) automatisierte Worfklows. GUI die schnelle Kontrolle und Korrektur der Verschlagwortung während des archivierens ermöglicht.


Barcode Bsp.:
using namespace System.Drawing;
Add-Type -AssemblyName System.Drawing;

[void] [Reflection.Assembly]::LoadWithPartialName("System.Windows.Forms")  

$testBild = "C:\temp\code_ls4.png-1.png"  
$src=[System.Drawing.Image]::FromFile($testBild)

$rect = New-Object System.Drawing.Rectangle(740,1500,400,250) # top, left, width, height of slice
$slice = $src.Clone($rect, $src.PixelFormat);
$src = $slice;

[void] [System.Reflection.Assembly]::LoadFrom("c:\temp\BarcodeImaging.dll");      
$barcodes = @{}
[BarcodeImaging]::FullScanPage([ref] $barcodes, $src, 150)

$barcodes
Member: Crusher79
Crusher79 May 08, 2023 at 10:18:24 (UTC)
Goto Top
Nachtrag:

https://www.horland.de/scan2pdf.html

Ggf. ist das noch etwas.