megaadwwh
Goto Top

Lieferscheine öffnen, auslesen und mit entsprechenden Dateinamen ablegen

Hallo Zusammen, zukünftig sollen in der Firma Dokumente (Lieferscheine) auf einen SMB Pfad gescannt werden. Dann soll ein script, tool oder eine Software den Textinhalt durchsuchen, den Firmennamen auf dem Lieferschein sowie die Lieferscheinnummer, PLZ oder andere relevante und verwertbare Daten auslesen und die Datei entsprechend "Firmaxyz LS123456 PLZ" oder so ähnlich benennen.

In der Suche habe ich wirklich verschiedenste PDF Nachbearbeitungen gefunden, aber nichts was das so erstellen würde.
Wie würdet ihr das lösen, ich habe vor einigen Jahren mit einem Freund etwas ähnliches gemacht, aber ich glaube das PDF24 dafür nicht geeignet ist.

Content-Key: 7546696259

Url: https://administrator.de/contentid/7546696259

Printed on: May 24, 2024 at 14:05 o'clock

Member: tagol01
tagol01 Jun 16, 2023 updated at 09:35:54 (UTC)
Goto Top
Hallo

Zitat von @Megaadwwh:

Hallo Zusammen, zukünftig sollen in der Firma Dokumente (Lieferscheine) auf einen SMB Pfad gescannt werden. Dann soll ein script, tool oder eine Software den Textinhalt durchsuchen, den Firmennamen auf dem Lieferschein sowie die Lieferscheinnummer, PLZ oder andere relevante und verwertbare Daten auslesen und die Datei entsprechend "Firmaxyz LS123456 PLZ" oder so ähnlich benennen.

wir haben sowas schonmal umgesetzt.
- PDF kommt in einen Ordern
- Danach wird die Mail Adresse oder Faxnummer gesucht
- Danach wird die Rechnung entweder gefaxt oder per Mail verschickt.
- Rechnung wird umbenannt und in den richtigen Ordner verschoben


Ist relativ leicht zum umsetzen, das Script läuft halt unter Linux....
Falls das eine Option ist suche mal nach: pdfgrep, pdftotext , ...

Gerne mit der Ente: hier
Member: DerMaddin
DerMaddin Jun 16, 2023 at 09:43:15 (UTC)
Goto Top
Ich denke ein DMS ist hier besser geeignet. Es muss ja schließlich nach dem Scannen eine OCR-Erkennung durchgeführt werden und in die PDF geschrieben, damit diese durchsuchbar wird. Dann muss auch eine Erkennung stattfinden, die Mittels Training "weiß" wo es nach den gesuchten Inhalten suchen soll. Immerhin ist nicht jeder Lieferschein gleich aufgebaut, oder?
Mitglied: 7426148943
7426148943 Jun 16, 2023 at 09:53:46 (UTC)
Goto Top
Member: Looser27
Looser27 Jun 16, 2023 at 10:03:06 (UTC)
Goto Top
Hi,

ich schließe mich hier @DerMaddin an. Es gibt hier fertige Lösungen, wie z.B. von ELO, die sowas von Haus aus bieten.
Kann man noch weiter ausbauen in dem man Barcodes auf die Dokumente aufbringt und diese dann entsprechend weiter verarbeiten kann.

Gruß

Looser
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:04:11 (UTC)
Goto Top
@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar. Wie aber auch schon dort erwähnt, ist die Position des gesuchten Textes und Lesbarkeit innerhalb der PDF entscheidend.
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:09:34 (UTC)
Goto Top
, ist die Position des gesuchten Textes und Lesbarkeit innerhalb der PDF entscheidend.
Was mit Regex für die Erkennung des Pattern ja kein wirkliches Problem ist face-smile.
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:16:50 (UTC)
Goto Top
Zitat von @7426148943:

, ist die Position des gesuchten Textes und Lesbarkeit innerhalb der PDF entscheidend.
Was mit Regex ja kein wirkliches Problem ist face-smile.

Wie kann Regex die Position finden? Damit wird nur ein String nach den Vorgaben gesucht und unter Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:25:48 (UTC)
Goto Top
Zitat von @DerMaddin:
Wie kann Regex die Position finden? Damit wird nur ein String nach den Vorgaben gesucht und unter Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Indem man den Pattern so eindeutig definiert das es nicht verwechselt werden kann.
Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Wenn der Prefix/Suffix vor/nach den entsprechenden Daten gewählt wurde nicht wirklich.

Feste Positionen sind nur was für einheitliche Dokumente. Regex kann es auch für unterschiedliche wenn man den Regex intelligent und universell gestaltet.
Member: Kraemer
Kraemer Jun 16, 2023 at 10:29:28 (UTC)
Goto Top
Zitat von @DerMaddin:

@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.

2,50 riskieren oder teuer ELO kaufen. Ich weiß, was ich machen würde...
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:35:12 (UTC)
Goto Top
Ja klar, mach das mal für 200 Kunden und Lieferscheintypen. Regex ist nicht intelligent, das ist nur eine starre Formel.
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:36:03 (UTC)
Goto Top
Zitat von @Kraemer:

Zitat von @DerMaddin:

@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.

2,50 riskieren oder teuer ELO kaufen. Ich weiß, was ich machen würde...

Ich auch, keine Bastellösungen für etwas benutzen, dass vorne und hinten mehr Arbeit und Kosten verursachen wird.
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:43:45 (UTC)
Goto Top
Zitat von @DerMaddin:

Ja klar, mach das mal für 200 Kunden und Lieferscheintypen.
Existiert hier bereits und arbeitet problemlos, seit Jahren.
Regex ist nicht intelligent, das ist nur eine starre Formel.
Nur wenn man es nicht dynamisch nutzt. 😉 Da steckt natürlich noch weitere Programm-Logik dahinter ist ja nur ein Teil des Puzzles.
Ich auch, keine Bastellösungen für etwas benutzen, dass vorne und hinten mehr Arbeit und Kosten verursachen wird.
Genauso wie man sich vom Anbieter kostenmäßig abhängig macht face-wink.
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:44:33 (UTC)
Goto Top
@7426148943: gibt mir ein Beispiel für...

6163044988595
20224519
787907
0058-23
222/2022
KA1793455D0
LS06099
0052302497A
WK3023-01811
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:47:51 (UTC)
Goto Top
Die eigentlichen Werte sind nur ja ein Teil der Erkennung da gehört die Auswertung der Prefixe und Suffixe für eine erfolgreiche und zuverlässige Erkennung dazu...
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:49:12 (UTC)
Goto Top
Zitat von @7426148943:

Genauso wie man sich vom Anbieter kostenmäßig abhängig macht face-wink.

Ich bin lieber von einer fertigen und funktionierenden Lösung "abhängig", die Raum für Erweiterungen und Schnittstellen hat zu anderen Applikationen als im Nachhinein der Geschäftsführung zu sagen "ja nee, mehr als das Ändern des Dateinamens kann die Lösung nicht" oder "eine Verknüpfung zur FiBu ist nicht möglich".
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:51:19 (UTC)
Goto Top
Jedem das seine. Dafür gibt es ja Foren, jeder darf am Ende wählen was er will und zu ihm passt, alles gut face-smile.
Member: DerMaddin
DerMaddin Jun 16, 2023 at 10:51:16 (UTC)
Goto Top
Zitat von @7426148943:

Die eigentlichen Werte sind nur ja ein Teil der Erkennung da gehört die Auswertung der Prefixe und Suffixe für eine erfolgreiche und zuverlässige Erkennung dazu...

Das sind echte Beispiele, da gibt es keine weiteren Pre/Suffixe. Davor steht evtl. auch "LS", "Liefersch.Nr", "Lieferschein:", "Delivery note" oder auch ca. 12 weitere Sprachen und eben so viele Formen.
Mitglied: 7426148943
7426148943 Jun 16, 2023 updated at 10:58:58 (UTC)
Goto Top
Zitat von @DerMaddin:
Das sind echte Beispiele, da gibt es keine weiteren Pre/Suffixe. Davor steht evtl. auch "LS", "Liefersch.Nr", "Lieferschein:", "Delivery note" oder auch ca. 12 weitere Sprachen und eben so viele Formen.
Sichtbare vielleicht nicht, aber auch unsichtbare Merkmale aus dem PDF-Flow werden hier ausgewertet. Wie gesagt Regex ist nur ein kleiner Teil der Intelligenz dahinter, wie bspw. auch die Auswertung des Kunden und seiner vorherigen Dokumente und Nummern-Pattern-Abgleich mit Datenbank,usw. usw.. Da sind wir morgen noch dran wenn ich hier jetzt weiter mache ...
Member: DerMaddin
DerMaddin Jun 16, 2023 at 11:36:33 (UTC)
Goto Top
Ist gut, lassen wir die Diskussion. Der TO wird hoffentlich wissen was die aktuellen und evtl. zukünftigen Anforderungen sind und entsprechend umsetzen.
Member: TomTomBon
TomTomBon Jun 19, 2023 at 06:46:27 (UTC)
Goto Top
Moin Moin,

Da Ich mit beidem zu tun habe mein senf dazu face-wink

Die Programme sind gut wenn der Endkunde keine IT Fähigkeiten / Zeiten hat.
Sie sind auf eigenständiges Arbeiten ausgelegt, meistens wird der Support gegen gut Geld mitgeliefert.

Nachteile:
Hohe Kosten.
Keine Variabilität abseits dessen was der Hersteller vorsieht oder wirklich hohe Kosten für die Anpassung.
PS:
SAP baut Firmen um damit die an das Programm SAP korrekt ausgerichtet sind..

Vorteile Skripte:
Es wird je nach Fähigkeiten / Knowledge an die Firma angepasst.
Je mehr der Betreuer lernt, sowohl was die Grundlagen als auch die Besonderheiten des Tools/Skript.

Natürlich kann es sein das auch Prozesse, Prozess Abschnitte angepasst werden müssen.

Nachteil:
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..

PS:
Letzterer Punkt kann auch SEHR schnell bei Firmen sein.
Eigentlich auch der davor.
Ich werfe mal MS in den Raum.


Duck und wech.
Member: departure69
departure69 Jun 21, 2023 at 05:50:11 (UTC)
Goto Top
@TomTomBon:

Hallo.

Nachteil:
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..

Hhmm, "Skripte" klingt aber nach einer flachen Lernkurve. Die in kleineren Häusern/Umgebungen auch öfter unterbrochen werden und dadurch noch flacher wird. Nicht selten One-Man-Shows in der IT. Der Mann/die Frau hat ja auch nie was anderes zu tun. In großen Firmen, wo es eine 2stellige Zahl (oder mehr) an Admins/Betreuern gibt, läßt sich da viel leichter mal einer projektmäßig für eine gewisse Zeit lang am Stück dafür abstellen, nur dies ungestört zu erlernen und zu entwickeln, bis ein gut laufender Stand erreicht ist. Wir könnten das hier nicht, viel zu viele verschiedenste Aufgaben an der Auslastungsgrenze. Wir würden hier eine fertige Lösung kaufen müssen. Hat also nicht zwingend etwas damit zu tun, ob der Betreuer "gut" oder "schlecht" ist.

Viele Grüße

von

departure69
Member: TomTomBon
TomTomBon Jun 21, 2023 at 10:27:13 (UTC)
Goto Top
Wie gesagt,
es gibt für alles seine Gründe. Und auch Teilweise Vorteile.

Bei uns sehe Ich das zB.
In eine software die wir vertreiben, werden Sachen eingebaut die ein Großkunde haben will.
Und es wird nicht in spezifische Versionen momentan eingebaut, sondern in die Allgemein Version.
Die auch anderen zur Verfügung steht.

Und manche Techniker die das gehört haben, haben bei anderen Kunden schon das kleine Dollarzeichen gesehen.
Zeit für das Implementieren da der Kunde sich das gewünscht hat.
Aber nicht zu DEM Preis der eine SW Anpassung natürlich hat.
Aber wenn der Techniker das nebenbei macht und halt 1h länger da ist..
Und das bei 10 Kunden..
Kann der Tecniker das beim nächsten Gehaltsgespräch erwähnen face-wink


Nicht immer sind Skripte von Vorteil.
Das größte Problem ist die Person/Firma die das auf einen anpasst.
UND
Was man ja auch öfters noch antrifft:
Die skripte sind meistens auf die Umgebung so gut angepasst das ein größerer Wechsel an Hardware / Software Unterbau nicht möglich ist.
Stichwort CAD Maschinen die auf Win 95 angewiesen sind..
Oder NT4.