Powerhellskript zum Auslesen von Kundennummern aus diversen PDFs, mit anschließender Umbenennung der Datei
Guten Tag liebes Forum,
Ich wurde in meiner Firma damit beauftragt Archivierungsfehler zu korrigieren. (600 fehlerhaft abgelegte PDFs)
Nun muss ich die einzelnen PDF öffnen, die Kundennummer kopieren, die PDF schließen und diese anschließend mit einem vorgefertigtem Zeichensatz + Kundennummer umbenennen.
Dadurch kann unser System die Dateien automatisch einordnen.
Natürlich könnte ich das ganze händisch machen, doch wo wäre dabei der Lerneffekt.
Vielen Dank für Zeit!
Ich wurde in meiner Firma damit beauftragt Archivierungsfehler zu korrigieren. (600 fehlerhaft abgelegte PDFs)
Nun muss ich die einzelnen PDF öffnen, die Kundennummer kopieren, die PDF schließen und diese anschließend mit einem vorgefertigtem Zeichensatz + Kundennummer umbenennen.
Dadurch kann unser System die Dateien automatisch einordnen.
Natürlich könnte ich das ganze händisch machen, doch wo wäre dabei der Lerneffekt.
Vielen Dank für Zeit!
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 541199
Url: https://administrator.de/contentid/541199
Ausgedruckt am: 22.11.2024 um 02:11 Uhr
3 Kommentare
Neuester Kommentar
Kommt hier immer wieder z.B.
PowerShell - PDF auslesen und trennen
Btw. wie deine uns unbekannte Kundennummer aussieht und wo diese im Kontext platziert ist kann hier niemand wissen, das ist immer Anpassungssache und wird meist am effektivsten mit Regular Expressions erledigt.
PowerShell - PDF auslesen und trennen
Btw. wie deine uns unbekannte Kundennummer aussieht und wo diese im Kontext platziert ist kann hier niemand wissen, das ist immer Anpassungssache und wird meist am effektivsten mit Regular Expressions erledigt.
Servus @nikilas21 ,willkommen auf Administrator.de!
mit iTextSharp ist das schnell erledigt. Wie @142232 aber schon angemerkt hat, ist der Position der Kundennummer im Fließtext und das Vorliegen von maschinenlesbarem Text entscheidend für den Erfolg und das muss man natürlich immer an seine Gegebenheiten anpassen.
Hier ein Beispiel bei dem die Kundennummer mit "Kundennr.: [NUMMER]" gekennzeichnet im PDF steht.
Pfad zu den PDFs und den Prefix für den Dateinamen und den Regex Pattern zur Extrahierung kannst du im Header anpassen.
(Zur Info: Die benötigte DLL für iTextSharp wird, wenn noch nicht vorhanden, in das Skriptverzeichnis heruntergeladen, Schreibzugriff auf das Skriptverzeichnis muss also gegeben sein wenn die DLL dort noch nicht liegt.)
Habe das Demo-Package mit Test-PDF-Datei hier zum Download bereitgestellt
Falls "Regular-Expressions" ein Fremdwort für dich sein sollte, kannst du das hier ändern:
Regular Expressions Tutorial
Viel Spaß damit.
Support dazu gerne via PN .
Grüße Uwe
mit iTextSharp ist das schnell erledigt. Wie @142232 aber schon angemerkt hat, ist der Position der Kundennummer im Fließtext und das Vorliegen von maschinenlesbarem Text entscheidend für den Erfolg und das muss man natürlich immer an seine Gegebenheiten anpassen.
Hier ein Beispiel bei dem die Kundennummer mit "Kundennr.: [NUMMER]" gekennzeichnet im PDF steht.
Pfad zu den PDFs und den Prefix für den Dateinamen und den Regex Pattern zur Extrahierung kannst du im Header anpassen.
(Zur Info: Die benötigte DLL für iTextSharp wird, wenn noch nicht vorhanden, in das Skriptverzeichnis heruntergeladen, Schreibzugriff auf das Skriptverzeichnis muss also gegeben sein wenn die DLL dort noch nicht liegt.)
Habe das Demo-Package mit Test-PDF-Datei hier zum Download bereitgestellt
extract_number_and_rename_pdf_541199.zip
Falls "Regular-Expressions" ein Fremdwort für dich sein sollte, kannst du das hier ändern:
Regular Expressions Tutorial
Viel Spaß damit.
Support dazu gerne via PN .
Grüße Uwe