nikilas21
Goto Top

Powerhellskript zum Auslesen von Kundennummern aus diversen PDFs, mit anschließender Umbenennung der Datei

Guten Tag liebes Forum,

Ich wurde in meiner Firma damit beauftragt Archivierungsfehler zu korrigieren. (600 fehlerhaft abgelegte PDFs)
Nun muss ich die einzelnen PDF öffnen, die Kundennummer kopieren, die PDF schließen und diese anschließend mit einem vorgefertigtem Zeichensatz + Kundennummer umbenennen.
Dadurch kann unser System die Dateien automatisch einordnen.

Natürlich könnte ich das ganze händisch machen, doch wo wäre dabei der Lerneffekt.

Vielen Dank für Zeit!

Content-ID: 541199

Url: https://administrator.de/forum/powerhellskript-zum-auslesen-von-kundennummern-aus-diversen-pdfs-mit-anschliessender-umbenennung-der-datei-541199.html

Ausgedruckt am: 22.12.2024 um 13:12 Uhr

142232
Lösung 142232 30.01.2020 aktualisiert um 12:00:22 Uhr
Goto Top
Kommt hier immer wieder z.B.
PowerShell - PDF auslesen und trennen

Btw. wie deine uns unbekannte Kundennummer aussieht und wo diese im Kontext platziert ist kann hier niemand wissen, das ist immer Anpassungssache und wird meist am effektivsten mit Regular Expressions erledigt.
colinardo
Lösung colinardo 30.01.2020, aktualisiert am 03.02.2020 um 09:18:38 Uhr
Goto Top
Servus @nikilas21 ,willkommen auf Administrator.de!
mit iTextSharp ist das schnell erledigt. Wie @142232 aber schon angemerkt hat, ist der Position der Kundennummer im Fließtext und das Vorliegen von maschinenlesbarem Text entscheidend für den Erfolg und das muss man natürlich immer an seine Gegebenheiten anpassen.

Hier ein Beispiel bei dem die Kundennummer mit "Kundennr.: [NUMMER]" gekennzeichnet im PDF steht.

screenshot

Pfad zu den PDFs und den Prefix für den Dateinamen und den Regex Pattern zur Extrahierung kannst du im Header anpassen.
(Zur Info: Die benötigte DLL für iTextSharp wird, wenn noch nicht vorhanden, in das Skriptverzeichnis heruntergeladen, Schreibzugriff auf das Skriptverzeichnis muss also gegeben sein wenn die DLL dort noch nicht liegt.)

Habe das Demo-Package mit Test-PDF-Datei hier zum Download bereitgestellt

back-to-topextract_number_and_rename_pdf_541199.zip


Falls "Regular-Expressions" ein Fremdwort für dich sein sollte, kannst du das hier ändern:
Regular Expressions Tutorial


Viel Spaß damit.

Support dazu gerne via PN .

Grüße Uwe
nikilas21
nikilas21 30.01.2020 um 12:43:58 Uhr
Goto Top
Vielen Dank Uwe,

das ganze ist mir eine sehr große Hilfe! Sollten noch Fragen aufkommen, melde ich mich face-smile