Lieferscheine öffnen, auslesen und mit entsprechenden Dateinamen ablegen
Hallo Zusammen, zukünftig sollen in der Firma Dokumente (Lieferscheine) auf einen SMB Pfad gescannt werden. Dann soll ein script, tool oder eine Software den Textinhalt durchsuchen, den Firmennamen auf dem Lieferschein sowie die Lieferscheinnummer, PLZ oder andere relevante und verwertbare Daten auslesen und die Datei entsprechend "Firmaxyz LS123456 PLZ" oder so ähnlich benennen.
In der Suche habe ich wirklich verschiedenste PDF Nachbearbeitungen gefunden, aber nichts was das so erstellen würde.
Wie würdet ihr das lösen, ich habe vor einigen Jahren mit einem Freund etwas ähnliches gemacht, aber ich glaube das PDF24 dafür nicht geeignet ist.
In der Suche habe ich wirklich verschiedenste PDF Nachbearbeitungen gefunden, aber nichts was das so erstellen würde.
Wie würdet ihr das lösen, ich habe vor einigen Jahren mit einem Freund etwas ähnliches gemacht, aber ich glaube das PDF24 dafür nicht geeignet ist.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 7546696259
Url: https://administrator.de/contentid/7546696259
Ausgedruckt am: 24.11.2024 um 18:11 Uhr
22 Kommentare
Neuester Kommentar
Hallo
wir haben sowas schonmal umgesetzt.
- PDF kommt in einen Ordern
- Danach wird die Mail Adresse oder Faxnummer gesucht
- Danach wird die Rechnung entweder gefaxt oder per Mail verschickt.
- Rechnung wird umbenannt und in den richtigen Ordner verschoben
Ist relativ leicht zum umsetzen, das Script läuft halt unter Linux....
Falls das eine Option ist suche mal nach: pdfgrep, pdftotext , ...
Gerne mit der Ente: hier
Zitat von @Megaadwwh:
Hallo Zusammen, zukünftig sollen in der Firma Dokumente (Lieferscheine) auf einen SMB Pfad gescannt werden. Dann soll ein script, tool oder eine Software den Textinhalt durchsuchen, den Firmennamen auf dem Lieferschein sowie die Lieferscheinnummer, PLZ oder andere relevante und verwertbare Daten auslesen und die Datei entsprechend "Firmaxyz LS123456 PLZ" oder so ähnlich benennen.
Hallo Zusammen, zukünftig sollen in der Firma Dokumente (Lieferscheine) auf einen SMB Pfad gescannt werden. Dann soll ein script, tool oder eine Software den Textinhalt durchsuchen, den Firmennamen auf dem Lieferschein sowie die Lieferscheinnummer, PLZ oder andere relevante und verwertbare Daten auslesen und die Datei entsprechend "Firmaxyz LS123456 PLZ" oder so ähnlich benennen.
wir haben sowas schonmal umgesetzt.
- PDF kommt in einen Ordern
- Danach wird die Mail Adresse oder Faxnummer gesucht
- Danach wird die Rechnung entweder gefaxt oder per Mail verschickt.
- Rechnung wird umbenannt und in den richtigen Ordner verschoben
Ist relativ leicht zum umsetzen, das Script läuft halt unter Linux....
Falls das eine Option ist suche mal nach: pdfgrep, pdftotext , ...
Gerne mit der Ente: hier
Ich denke ein DMS ist hier besser geeignet. Es muss ja schließlich nach dem Scannen eine OCR-Erkennung durchgeführt werden und in die PDF geschrieben, damit diese durchsuchbar wird. Dann muss auch eine Erkennung stattfinden, die Mittels Training "weiß" wo es nach den gesuchten Inhalten suchen soll. Immerhin ist nicht jeder Lieferschein gleich aufgebaut, oder?
Mal die Suche hier bemüht
Powerhellskript zum Auslesen von Kundennummern aus diversen PDFs, mit anschließender Umbenennung der Datei
Zeppel
Powerhellskript zum Auslesen von Kundennummern aus diversen PDFs, mit anschließender Umbenennung der Datei
Zeppel
Hi,
ich schließe mich hier @DerMaddin an. Es gibt hier fertige Lösungen, wie z.B. von ELO, die sowas von Haus aus bieten.
Kann man noch weiter ausbauen in dem man Barcodes auf die Dokumente aufbringt und diese dann entsprechend weiter verarbeiten kann.
Gruß
Looser
ich schließe mich hier @DerMaddin an. Es gibt hier fertige Lösungen, wie z.B. von ELO, die sowas von Haus aus bieten.
Kann man noch weiter ausbauen in dem man Barcodes auf die Dokumente aufbringt und diese dann entsprechend weiter verarbeiten kann.
Gruß
Looser
, ist die Position des gesuchten Textes und Lesbarkeit innerhalb der PDF entscheidend.
Was mit Regex für die Erkennung des Pattern ja kein wirkliches Problem ist .Zitat von @7426148943:
, ist die Position des gesuchten Textes und Lesbarkeit innerhalb der PDF entscheidend.
Was mit Regex ja kein wirkliches Problem ist .Wie kann Regex die Position finden? Damit wird nur ein String nach den Vorgaben gesucht und unter Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Zitat von @DerMaddin:
Wie kann Regex die Position finden? Damit wird nur ein String nach den Vorgaben gesucht und unter Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Indem man den Pattern so eindeutig definiert das es nicht verwechselt werden kann.Wie kann Regex die Position finden? Damit wird nur ein String nach den Vorgaben gesucht und unter Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Umständen wird statt Lieferscheinnummer ein Konto, Kundennummer oder Auftragsnummer etc. gefunden.
Wenn der Prefix/Suffix vor/nach den entsprechenden Daten gewählt wurde nicht wirklich.Feste Positionen sind nur was für einheitliche Dokumente. Regex kann es auch für unterschiedliche wenn man den Regex intelligent und universell gestaltet.
Zitat von @DerMaddin:
@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.
@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.
2,50 riskieren oder teuer ELO kaufen. Ich weiß, was ich machen würde...
Zitat von @Kraemer:
2,50 riskieren oder teuer ELO kaufen. Ich weiß, was ich machen würde...
Zitat von @DerMaddin:
@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.
@7426148943: der Beitrag hilft nicht weiter, da die vermeintliche Lösung hinter einer "Paywall" steht, wenn überhaupt nocht verfügbar.
2,50 riskieren oder teuer ELO kaufen. Ich weiß, was ich machen würde...
Ich auch, keine Bastellösungen für etwas benutzen, dass vorne und hinten mehr Arbeit und Kosten verursachen wird.
Existiert hier bereits und arbeitet problemlos, seit Jahren.
Regex ist nicht intelligent, das ist nur eine starre Formel.
Nur wenn man es nicht dynamisch nutzt. 😉 Da steckt natürlich noch weitere Programm-Logik dahinter ist ja nur ein Teil des Puzzles.Ich auch, keine Bastellösungen für etwas benutzen, dass vorne und hinten mehr Arbeit und Kosten verursachen wird.
Genauso wie man sich vom Anbieter kostenmäßig abhängig macht .
Die eigentlichen Werte sind nur ja ein Teil der Erkennung da gehört die Auswertung der Prefixe und Suffixe für eine erfolgreiche und zuverlässige Erkennung dazu...
Zitat von @7426148943:
Genauso wie man sich vom Anbieter kostenmäßig abhängig macht .
Genauso wie man sich vom Anbieter kostenmäßig abhängig macht .
Ich bin lieber von einer fertigen und funktionierenden Lösung "abhängig", die Raum für Erweiterungen und Schnittstellen hat zu anderen Applikationen als im Nachhinein der Geschäftsführung zu sagen "ja nee, mehr als das Ändern des Dateinamens kann die Lösung nicht" oder "eine Verknüpfung zur FiBu ist nicht möglich".
Jedem das seine. Dafür gibt es ja Foren, jeder darf am Ende wählen was er will und zu ihm passt, alles gut .
Zitat von @7426148943:
Die eigentlichen Werte sind nur ja ein Teil der Erkennung da gehört die Auswertung der Prefixe und Suffixe für eine erfolgreiche und zuverlässige Erkennung dazu...
Die eigentlichen Werte sind nur ja ein Teil der Erkennung da gehört die Auswertung der Prefixe und Suffixe für eine erfolgreiche und zuverlässige Erkennung dazu...
Das sind echte Beispiele, da gibt es keine weiteren Pre/Suffixe. Davor steht evtl. auch "LS", "Liefersch.Nr", "Lieferschein:", "Delivery note" oder auch ca. 12 weitere Sprachen und eben so viele Formen.
Zitat von @DerMaddin:
Das sind echte Beispiele, da gibt es keine weiteren Pre/Suffixe. Davor steht evtl. auch "LS", "Liefersch.Nr", "Lieferschein:", "Delivery note" oder auch ca. 12 weitere Sprachen und eben so viele Formen.
Sichtbare vielleicht nicht, aber auch unsichtbare Merkmale aus dem PDF-Flow werden hier ausgewertet. Wie gesagt Regex ist nur ein kleiner Teil der Intelligenz dahinter, wie bspw. auch die Auswertung des Kunden und seiner vorherigen Dokumente und Nummern-Pattern-Abgleich mit Datenbank,usw. usw.. Da sind wir morgen noch dran wenn ich hier jetzt weiter mache ...Das sind echte Beispiele, da gibt es keine weiteren Pre/Suffixe. Davor steht evtl. auch "LS", "Liefersch.Nr", "Lieferschein:", "Delivery note" oder auch ca. 12 weitere Sprachen und eben so viele Formen.
Moin Moin,
Da Ich mit beidem zu tun habe mein senf dazu
Die Programme sind gut wenn der Endkunde keine IT Fähigkeiten / Zeiten hat.
Sie sind auf eigenständiges Arbeiten ausgelegt, meistens wird der Support gegen gut Geld mitgeliefert.
Nachteile:
Hohe Kosten.
Keine Variabilität abseits dessen was der Hersteller vorsieht oder wirklich hohe Kosten für die Anpassung.
PS:
SAP baut Firmen um damit die an das Programm SAP korrekt ausgerichtet sind..
Vorteile Skripte:
Es wird je nach Fähigkeiten / Knowledge an die Firma angepasst.
Je mehr der Betreuer lernt, sowohl was die Grundlagen als auch die Besonderheiten des Tools/Skript.
Natürlich kann es sein das auch Prozesse, Prozess Abschnitte angepasst werden müssen.
Nachteil:
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..
PS:
Letzterer Punkt kann auch SEHR schnell bei Firmen sein.
Eigentlich auch der davor.
Ich werfe mal MS in den Raum.
Duck und wech.
Da Ich mit beidem zu tun habe mein senf dazu
Die Programme sind gut wenn der Endkunde keine IT Fähigkeiten / Zeiten hat.
Sie sind auf eigenständiges Arbeiten ausgelegt, meistens wird der Support gegen gut Geld mitgeliefert.
Nachteile:
Hohe Kosten.
Keine Variabilität abseits dessen was der Hersteller vorsieht oder wirklich hohe Kosten für die Anpassung.
PS:
SAP baut Firmen um damit die an das Programm SAP korrekt ausgerichtet sind..
Vorteile Skripte:
Es wird je nach Fähigkeiten / Knowledge an die Firma angepasst.
Je mehr der Betreuer lernt, sowohl was die Grundlagen als auch die Besonderheiten des Tools/Skript.
Natürlich kann es sein das auch Prozesse, Prozess Abschnitte angepasst werden müssen.
Nachteil:
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..
PS:
Letzterer Punkt kann auch SEHR schnell bei Firmen sein.
Eigentlich auch der davor.
Ich werfe mal MS in den Raum.
Duck und wech.
@TomTomBon:
Hallo.
Hhmm, "Skripte" klingt aber nach einer flachen Lernkurve. Die in kleineren Häusern/Umgebungen auch öfter unterbrochen werden und dadurch noch flacher wird. Nicht selten One-Man-Shows in der IT. Der Mann/die Frau hat ja auch nie was anderes zu tun. In großen Firmen, wo es eine 2stellige Zahl (oder mehr) an Admins/Betreuern gibt, läßt sich da viel leichter mal einer projektmäßig für eine gewisse Zeit lang am Stück dafür abstellen, nur dies ungestört zu erlernen und zu entwickeln, bis ein gut laufender Stand erreicht ist. Wir könnten das hier nicht, viel zu viele verschiedenste Aufgaben an der Auslastungsgrenze. Wir würden hier eine fertige Lösung kaufen müssen. Hat also nicht zwingend etwas damit zu tun, ob der Betreuer "gut" oder "schlecht" ist.
Viele Grüße
von
departure69
Hallo.
Nachteil:
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..
Es steht und fällt mit dem IT Betreuer.
Ist der schlecht...
Ist der gut und will mehr Geld..
Hhmm, "Skripte" klingt aber nach einer flachen Lernkurve. Die in kleineren Häusern/Umgebungen auch öfter unterbrochen werden und dadurch noch flacher wird. Nicht selten One-Man-Shows in der IT. Der Mann/die Frau hat ja auch nie was anderes zu tun. In großen Firmen, wo es eine 2stellige Zahl (oder mehr) an Admins/Betreuern gibt, läßt sich da viel leichter mal einer projektmäßig für eine gewisse Zeit lang am Stück dafür abstellen, nur dies ungestört zu erlernen und zu entwickeln, bis ein gut laufender Stand erreicht ist. Wir könnten das hier nicht, viel zu viele verschiedenste Aufgaben an der Auslastungsgrenze. Wir würden hier eine fertige Lösung kaufen müssen. Hat also nicht zwingend etwas damit zu tun, ob der Betreuer "gut" oder "schlecht" ist.
Viele Grüße
von
departure69
Wie gesagt,
es gibt für alles seine Gründe. Und auch Teilweise Vorteile.
Bei uns sehe Ich das zB.
In eine software die wir vertreiben, werden Sachen eingebaut die ein Großkunde haben will.
Und es wird nicht in spezifische Versionen momentan eingebaut, sondern in die Allgemein Version.
Die auch anderen zur Verfügung steht.
Und manche Techniker die das gehört haben, haben bei anderen Kunden schon das kleine Dollarzeichen gesehen.
Zeit für das Implementieren da der Kunde sich das gewünscht hat.
Aber nicht zu DEM Preis der eine SW Anpassung natürlich hat.
Aber wenn der Techniker das nebenbei macht und halt 1h länger da ist..
Und das bei 10 Kunden..
Kann der Tecniker das beim nächsten Gehaltsgespräch erwähnen
Nicht immer sind Skripte von Vorteil.
Das größte Problem ist die Person/Firma die das auf einen anpasst.
UND
Was man ja auch öfters noch antrifft:
Die skripte sind meistens auf die Umgebung so gut angepasst das ein größerer Wechsel an Hardware / Software Unterbau nicht möglich ist.
Stichwort CAD Maschinen die auf Win 95 angewiesen sind..
Oder NT4.
es gibt für alles seine Gründe. Und auch Teilweise Vorteile.
Bei uns sehe Ich das zB.
In eine software die wir vertreiben, werden Sachen eingebaut die ein Großkunde haben will.
Und es wird nicht in spezifische Versionen momentan eingebaut, sondern in die Allgemein Version.
Die auch anderen zur Verfügung steht.
Und manche Techniker die das gehört haben, haben bei anderen Kunden schon das kleine Dollarzeichen gesehen.
Zeit für das Implementieren da der Kunde sich das gewünscht hat.
Aber nicht zu DEM Preis der eine SW Anpassung natürlich hat.
Aber wenn der Techniker das nebenbei macht und halt 1h länger da ist..
Und das bei 10 Kunden..
Kann der Tecniker das beim nächsten Gehaltsgespräch erwähnen
Nicht immer sind Skripte von Vorteil.
Das größte Problem ist die Person/Firma die das auf einen anpasst.
UND
Was man ja auch öfters noch antrifft:
Die skripte sind meistens auf die Umgebung so gut angepasst das ein größerer Wechsel an Hardware / Software Unterbau nicht möglich ist.
Stichwort CAD Maschinen die auf Win 95 angewiesen sind..
Oder NT4.