Text in PDF lesen und nutzen

Mitglied: fautec56

fautec56 (Level 1) - Jetzt verbinden

11.01.2016, aktualisiert 17.01.2016, 818 Aufrufe, 6 Kommentare

Hallo zusammen,

meine erste Frage in diesem Forum betrifft das umbenennen von PDF-Dateien, die mit einem OCR-Scan erstelle wurden.
Also eine Vorstufe eines DMS. Ob ein DMS eingeführt wird, steht noch in den Sternen.

Was man aber will:

Eledigte Vorgänge einscannen und in bestimmte Ordner ablegen.

Um aber dem User die Arbeit zu vereinfache und Schreibfehler zu vermeiden, möchte man die Benennung der PDF-Datei automatisieren.

Heißt:
Man müsste die PDF-Datei lesen und wenn z.B die Zeichenfolge " 2016- " gefunden wird, die nächsten 6 Zeichen dazu nehmen.

Ergebnis:
z.B. 2016-568956 (Das ist eine Auftragsnummer)
Die PDF-Datei soll dann damit umbenannt werden.

Ergebnis:
2016-568956.pdf
Danach soll die Datei dann in ein bestimmtes Verzeichnis verschoben werden. Z.B. o:\Archiv\Auftraege\2016\

Man meint dafür gäbe es ein Tool. Mir aber unbekannt!

Kennt irgendwer ein Tool das so etwas kann? Oder wie könnte man das als VBA-Script laufen lassen?
Wer könnte helfen.

Für eure Hilfe wäre ich da sehr dankbar.


Reinhard
Mitglied: 122990
122990 (Level 2)
11.01.2016 um 10:26 Uhr
Moin,
mal die Suche nutzen und das hier finden:
https://www.administrator.de/forum/pdf-deren-inhalt-umbenennen-namen-imm ...

Gruß grexit
Bitte warten ..
Mitglied: aqui
11.01.2016 um 10:38 Uhr
Nützt ihm nur nix, denn er will ja aktiv während des Scann Vorgangs aus dem Dokument Daten lesen die dann Teil des Dateinamens werden sollen.
Diese Herausforderung ist dann schon eine andere als die Script gesteuerte im o.a. URL.
Bitte warten ..
Mitglied: 122990
122990 (Level 2)
11.01.2016, aktualisiert um 10:53 Uhr
Nö, er will ja nur die Datei umbenennen, und das kann man ja problemlos hinterher erledigen...
Text per PDF2Text auselesen per Regex den Text filtern, Datei umbenennen fertig.

Habe ich hier in ähnlicher Weise schon gezeigt, nur ging es da ums Splitten nicht ums umbenennen nach Begriff
https://www.administrator.de/forum/pdf-splitten-ausdruck-292194.html
Bitte warten ..
Mitglied: aqui
LÖSUNG 11.01.2016, aktualisiert 17.01.2016
Mmmmhhh... Die Äußerung des TO
die PDF-Datei lesen und wenn z.B die Zeichenfolge " 2016- " gefunden wird, die nächsten 6 Zeichen dazu nehmen.
könnte man auch anders interpretieren das das Lesen beim scannen passieren soll...ist tatsächlich etwas widersprüchlich und sollte er mal aufklären !
Andernfalls hast du natürlich Recht...keine Frage.
Bitte warten ..
Mitglied: fautec56
17.01.2016 um 14:01 Uhr
Hallo zusammen,

erst mal Danke für eure Beiträge.

Bezüglich der Frage wann das geschehen soll ist das einfach beantwortet:

" Nach dem Scannen".

Ich denke in 10 Tagen bekomme ich den Scanner, mit dem wir die Dokumente einscannen.

Im Test habe ich schon mal eine durch PDF24 erstelle PDF-Datei als TXT umbenannt. Innerhalb der Umbenannten Datei konnte ich meinen Text 2016- finden.
Wenn das in der durch den Scanner eingescannten PDF-Datei auch so eindeutig zu finden ist, wäre das Kopieren und umbenennen zur txt, das Verschieben der PDF-Datei und löschen der TXT per Batchskript klar.

Aber wie lese ich die Zeichenfolge 2016- + die nächsten 5 Buchstaben aus, Variable füllen, um dann damit die PDF-Datei umbenenne.
Da fehlt mir einfach das Wissen um das finden, auslesen und kopieren von Textteilen in eine Variable.

Die bisher gefunden Beispiele gehen da einfach zu weit und ich bekomme Sie nicht für meinen Fall umgesetzt. Ich denke, dass müsste auch einfacher gehen.

Grüße Reinhard
Bitte warten ..
Mitglied: 122990
122990 (Level 2)
LÖSUNG 17.01.2016, aktualisiert um 16:55 Uhr
Zitat von @fautec56:
Aber wie lese ich die Zeichenfolge 2016- + die nächsten 5 Buchstaben aus, Variable füllen, um dann damit die PDF-Datei umbenenne.
In Powershell eine einfache Regex-Expression:

Bitte warten ..
Heiß diskutierte Inhalte
Off Topic
Wie sieht eine korrekte IT-Organisation aus?
imebroVor 1 TagFrageOff Topic20 Kommentare

Hallo, da unser IT-Verantwortlicher ja vor einem Jahr gehen musste, stelle ich mir die Frage, wie denn eine korrekte IT-Organisation überhaupt aussehen muss. Zur ...

Server-Hardware
Mini-PC oder Server für Dauerbetrieb
Surfer12Vor 1 TagFrageServer-Hardware20 Kommentare

Hallo zusammen, wir projektieren gerade eine neue Zutrittslösung für ein kleines Hotel mit ca. 20 Zimmern. Die Gäste sollen in Zukunft einen SelfCheckIn machen ...

Firewall
Windows Defender dauerhaft deaktivieren
Frankie222Vor 1 TagFrageFirewall9 Kommentare

Hallo, ich wollte mal fragen ob jemand weiss wie man bei Windows 10 Home den kompletten Schutz deaktiviert. Den Defender und alles! Ich habe ...

Notebook & Zubehör
Funktionieren keine USB-DVD-RW an Surfaces?
StefanKittelVor 1 TagFrageNotebook & Zubehör14 Kommentare

Hallo, ein Kunde von mir hat ein Surface Pro. Wenn er ein USB-DVD-RW-Laufwerk an die Dockingstation anschliesst funktioniert es nicht. - Es bekommt Strom ...

Windows 10
Windows 10 20HS SCCM
stoepsu77Vor 1 TagFrageWindows 1014 Kommentare

Hallo zusammen Ich hoffe, dass jemand von euch mir eine weitere Idee geben kann. Ich habe keine Ideen mehr. Folgendes: Wir haben eine Tasksequenz ...

Suche Projektpartner
Suche Projektpartner
irinaterletska12Vor 1 TagFrageSuche Projektpartner1 Kommentar

Hallo alle zusammen . Wir sind eine ukrainische Firma, die nach dem Projektpartner sucht. Wir können für deutsche Firmen Support geben. Wir können Fernwartung ...

SAN, NAS, DAS
NAS mit Backup Funktion gesucht
YellowcakeVor 1 TagFrageSAN, NAS, DAS8 Kommentare

Hallo zusammen ich bin total unerfahren was diese NAS Systeme angeht die man sich zuhause hinstellen kann. Aktuell habe ich einen kleinen Server hier ...

Windows Server
Wie konvertiere ich NTFS zu GPT
itnirvanaVor 1 TagFrageWindows Server11 Kommentare

Hallo, auf einem Server ist die Platte 2048 GB per NTFS mit vollem Platz erreicht. Wie kann ich nun diese Platte zu GPT konvertieren. ...