PDF auslesen und umbennen
Hallo,
ich bin neu in diesem Forum und hätte ein dringendes Anliegen.
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen. Diese müssten nach objektiver Betrachtung immer an der gleichen Stelle liegen. Wenn ich jedoch diese in eine TXT Datei konvertiere haben diese immer unterschiedliche Abstände.
Die Kombination sieht immer nach einem bestimmte Schema aus , die Kombinationen sind auch immer einzigartig. Bsp. "E0Z D2.0 010"
Der sinn besteht daraus ,dass ich eine Excel Liste habe , dort sind die Schildnummern gespeichert und wenn ich die anklicke sollte sich die PDF
öffnen zu der das Schild gehört. Idee dabei ... alles in einzelne PDF Dateien zerteilen (ist eine große ) und mit den Schildernnummern als Namen speichern das die Excel Liste direkt als Hyperlink die Dateien öffnen kann.
Wäre jemand in der Lage mir zu helfen ich verzweifel hier ziemlich.
MFG
ich bin neu in diesem Forum und hätte ein dringendes Anliegen.
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen. Diese müssten nach objektiver Betrachtung immer an der gleichen Stelle liegen. Wenn ich jedoch diese in eine TXT Datei konvertiere haben diese immer unterschiedliche Abstände.
Die Kombination sieht immer nach einem bestimmte Schema aus , die Kombinationen sind auch immer einzigartig. Bsp. "E0Z D2.0 010"
Der sinn besteht daraus ,dass ich eine Excel Liste habe , dort sind die Schildnummern gespeichert und wenn ich die anklicke sollte sich die PDF
öffnen zu der das Schild gehört. Idee dabei ... alles in einzelne PDF Dateien zerteilen (ist eine große ) und mit den Schildernnummern als Namen speichern das die Excel Liste direkt als Hyperlink die Dateien öffnen kann.
Wäre jemand in der Lage mir zu helfen ich verzweifel hier ziemlich.
MFG
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Kommentar vom Moderator Biber am 19.11.2014 um 19:04:37 Uhr
Zitat von @s0l1v3r:
PDF-Dateien auslesen und umbennen
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen
Set /a rgc+=2PDF-Dateien auslesen und umbennen
Ich habe eine PDF in dieser sind Daten drin und ich müsste diese auslesen und jeweils nach diesen Daten umbennen
#898
Content-ID: 255015
Url: https://administrator.de/forum/pdf-auslesen-und-umbennen-255015.html
Ausgedruckt am: 10.04.2025 um 10:04 Uhr
7 Kommentare
Neuester Kommentar
Hi,
wenn du es doch schon bis zur Textdatei geschafft hast müsstest du doch darin nach dem String suchen können. Da du uns leider nicht einweihst in welcher sprache das umgesetzt werden soll gibts hier auch keine weitere Hilfe, alle Glaskugeln sind gerade zum vorweihnachtlichen Checkup bei @keine-ahnung im Wartezimmer.
Gruß
PJM
wenn du es doch schon bis zur Textdatei geschafft hast müsstest du doch darin nach dem String suchen können. Da du uns leider nicht einweihst in welcher sprache das umgesetzt werden soll gibts hier auch keine weitere Hilfe, alle Glaskugeln sind gerade zum vorweihnachtlichen Checkup bei @keine-ahnung im Wartezimmer.
Gruß
PJM
Hallo s0l1v3r, Willkommen auf Administrator.de!
Erste Lektion:
Suchfunktion nutzen lernen:
Grüße @colinardo
Erste Lektion:
Suchfunktion nutzen lernen:
- PDF auslesen und per VBA in Excel schreiben
- Pdf auslesen und in excel schreiben
- PDF Datei auslesen und bei Stichwörtern ausdrucken
Grüße @colinardo

Moin,
Gruß jodel32
Zitat von @s0l1v3r:
Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
dann mach mal ... ohne ein Muster von deiner Seite ist das definieren eines Regex-Pattern hier sonst schlichtweg unmöglich ...Ich könnte auch eine vereinfachte (Copyright Datenschutz e.tc bla ) hochladen wenn das weiterhelfen würde
Gruß jodel32

hättest du die oben verlinkten Anleitungen von @colinardo mal richtig gelesen, wüsstest du wovon ich spreche ...
Hier der passende Regex-Pattern für dein Vorhaben: (und nein das ließt nicht die Lfd-Nr aus sondern die Zeile darunter !)
Damit dieser Pattern funktioniert musst du dein PDF mit pdftotext so in eine Textdatei extrahieren
dann kannst du den gewünschten String mit VBS aus der Textdatei extrahieren
Den Rest findest du in den oben verlinkten Anleitungen.
Gruß jodel32
Hier der passende Regex-Pattern für dein Vorhaben: (und nein das ließt nicht die Lfd-Nr aus sondern die Zeile darunter !)
^Lfd-Nr.\s+.*\s+(.*)
pdftotext.exe demo.pdf
Set fso = CreateObject("Scripting.FileSystemObject")
SubjectString = fso.OpenTextFile("C:\demo.txt",1).ReadAll()
Set myRegExp = New RegExp
myRegExp.IgnoreCase = True
myRegExp.MultiLine = True
myRegExp.Pattern = "^Lfd-Nr.\s+.*\s+(.*)"
Set myMatches = myRegExp.Execute(SubjectString)
If myMatches.Count > 0 Then
msgbox "Der String lautet: " & Trim(myMatches(0).submatches(0))
else
msgbox "String wurde nicht gefunden"
End If
Gruß jodel32