Text in PDF lesen und nutzen
Hallo zusammen,
meine erste Frage in diesem Forum betrifft das umbenennen von PDF-Dateien, die mit einem OCR-Scan erstelle wurden.
Also eine Vorstufe eines DMS. Ob ein DMS eingeführt wird, steht noch in den Sternen.
Was man aber will:
Eledigte Vorgänge einscannen und in bestimmte Ordner ablegen.
Um aber dem User die Arbeit zu vereinfache und Schreibfehler zu vermeiden, möchte man die Benennung der PDF-Datei automatisieren.
Heißt:
Man müsste die PDF-Datei lesen und wenn z.B die Zeichenfolge " 2016- " gefunden wird, die nächsten 6 Zeichen dazu nehmen.
Ergebnis:
z.B. 2016-568956 (Das ist eine Auftragsnummer)
Die PDF-Datei soll dann damit umbenannt werden.
Ergebnis:
2016-568956.pdf
Danach soll die Datei dann in ein bestimmtes Verzeichnis verschoben werden. Z.B. o:\Archiv\Auftraege\2016\
Man meint dafür gäbe es ein Tool. Mir aber unbekannt!
Kennt irgendwer ein Tool das so etwas kann? Oder wie könnte man das als VBA-Script laufen lassen?
Wer könnte helfen.
Für eure Hilfe wäre ich da sehr dankbar.
Reinhard
meine erste Frage in diesem Forum betrifft das umbenennen von PDF-Dateien, die mit einem OCR-Scan erstelle wurden.
Also eine Vorstufe eines DMS. Ob ein DMS eingeführt wird, steht noch in den Sternen.
Was man aber will:
Eledigte Vorgänge einscannen und in bestimmte Ordner ablegen.
Um aber dem User die Arbeit zu vereinfache und Schreibfehler zu vermeiden, möchte man die Benennung der PDF-Datei automatisieren.
Heißt:
Man müsste die PDF-Datei lesen und wenn z.B die Zeichenfolge " 2016- " gefunden wird, die nächsten 6 Zeichen dazu nehmen.
Ergebnis:
z.B. 2016-568956 (Das ist eine Auftragsnummer)
Die PDF-Datei soll dann damit umbenannt werden.
Ergebnis:
2016-568956.pdf
Danach soll die Datei dann in ein bestimmtes Verzeichnis verschoben werden. Z.B. o:\Archiv\Auftraege\2016\
Man meint dafür gäbe es ein Tool. Mir aber unbekannt!
Kennt irgendwer ein Tool das so etwas kann? Oder wie könnte man das als VBA-Script laufen lassen?
Wer könnte helfen.
Für eure Hilfe wäre ich da sehr dankbar.
Reinhard
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 292738
Url: https://administrator.de/forum/text-in-pdf-lesen-und-nutzen-292738.html
Ausgedruckt am: 19.02.2025 um 22:02 Uhr
6 Kommentare
Neuester Kommentar

Moin,
mal die Suche nutzen und das hier finden:
PDF nach deren Inhalt umbenennen, den Namen immer auslesen
Gruß grexit
mal die Suche nutzen und das hier finden:
PDF nach deren Inhalt umbenennen, den Namen immer auslesen
Gruß grexit

Nö, er will ja nur die Datei umbenennen, und das kann man ja problemlos hinterher erledigen...
Text per PDF2Text auselesen per Regex den Text filtern, Datei umbenennen fertig.
Habe ich hier in ähnlicher Weise schon gezeigt, nur ging es da ums Splitten nicht ums umbenennen nach Begriff
PDF splitten nach Ausdruck
Text per PDF2Text auselesen per Regex den Text filtern, Datei umbenennen fertig.
Habe ich hier in ähnlicher Weise schon gezeigt, nur ging es da ums Splitten nicht ums umbenennen nach Begriff
PDF splitten nach Ausdruck
Mmmmhhh... Die Äußerung des TO
Andernfalls hast du natürlich Recht...keine Frage.
die PDF-Datei lesen und wenn z.B die Zeichenfolge " 2016- " gefunden wird, die nächsten 6 Zeichen dazu nehmen.
könnte man auch anders interpretieren das das Lesen beim scannen passieren soll...ist tatsächlich etwas widersprüchlich und sollte er mal aufklären !Andernfalls hast du natürlich Recht...keine Frage.

Zitat von @fautec56:
Aber wie lese ich die Zeichenfolge 2016- + die nächsten 5 Buchstaben aus, Variable füllen, um dann damit die PDF-Datei umbenenne.
In Powershell eine einfache Regex-Expression:Aber wie lese ich die Zeichenfolge 2016- + die nächsten 5 Buchstaben aus, Variable füllen, um dann damit die PDF-Datei umbenenne.
[regex]::Match($VariablemitTextInhalt,'2016-.{5}').Value