botpenner

PDF Dateien, Bilder extrahieren ! Welche Software?

Hallo Leute,


ich habe viele PDF Dateien in einem Ordner. Die PDF sind mit 6 Stelligen Nummern benannt.
Jede PDF hat nur 1 Seite , mit einem Bild.


Ich möchte nun das Bild aus den gesamten PDF dateien extrahieren und asl JPG speichern. Der Name der Bilder sollen gleich der PDF seien.

Ich habe die Software "PDF Image Extraction Wizard" gefunden. An sich tut sie alles wie ich es will. Problem ist nur das ich nur eine PDF immer laden kann.
Bei über 200 PDf Dateien dauert mir das zu lange.


Gibt es ein Programm wo man Direkt mehere dateien laden kann?


Betriebssystem ist Windows 10
Auf Facebook teilen
Auf X (Twitter) teilen
Auf Reddit teilen
Auf Linkedin teilen

Content-ID: 354789

Url: https://administrator.de/forum/pdf-dateien-bilder-extrahieren-welche-software-354789.html

Ausgedruckt am: 08.06.2025 um 13:06 Uhr

134464
134464 14.11.2017 aktualisiert um 12:00:52 Uhr
Goto Top
Stell uns doch mal eins deiner PDFs als Demo zum Download, dann können wir dir ein PS-Skript schreiben was das erledigt ganz ohne zusätzliche Software.
Betriebssystem ist Windows 10
Das OS der ahnungslosen Horden face-smile.
Botpenner
Botpenner 14.11.2017 um 12:19:12 Uhr
Goto Top
Hallo sehr gerne,


zur PDF Datei :

Ich habe jetzt nur die erste Seite zu Verfügung gestellt.
In der Wirklichkeit befinden sich in einer PDF Dateien 100 Seiten mit dem Selben Aufbau.

Ich habe nun ein Programm gefunden wo ich die Seiten Splitten und die CAT-NUMMER herauslesen und als Dateinamen verwende kann.

Dann hätte ich 100 PDf Dateien die jeweiligs mit der CAT-Nummer benannt sind.
Nun bräuchte ich ein Programm der aus den PDF Dateien nur den QR Code heraus extrahieren und das Bild als CAT-Nummer speichert.

Anschließend steht in einer CSV-Datei der alte und neue Name. Per Batch sollte nun alle Bilder mit dem neuen Dateinamen unbenannt werden.

Aufbau der CSV Datei:

"Alt";"Neu"
"datei1.pdf";"datei_neu.pdf"
"datei2.pdf";"datei_neu2.pdf"


PDF Datei zum Testen
beidermachtvongreyscull
beidermachtvongreyscull 14.11.2017 aktualisiert um 12:22:43 Uhr
Goto Top
Lochkartenstanzer
Lochkartenstanzer 14.11.2017 aktualisiert um 13:04:05 Uhr
Goto Top
Moin,

mit den poppler-utilities für Windows geht das ganz einfach:

<code ype=plain>
pdfimages name.pdf name


packt die Bilder von name.pdf in dateien mit dem Namen name-xxx.ppm, wobei xxx eien forlaufende Nummerierung der Bilder in der pdf-Datei ist.

lks
BassFishFox
BassFishFox 14.11.2017 um 13:06:14 Uhr
Goto Top
Mahlzeit,

Genau!
Da er ja W10 hat, kann er das easy in der WSL nachinstallieren und benutzen. face-smile

Und wenn er
pdfimages -j name.pdf name
nimmt, hat er die Bilderlinge gleich als JPG.

BFF
Lochkartenstanzer
Lochkartenstanzer 14.11.2017 um 13:21:35 Uhr
Goto Top
Moin

Imagemagick konvertiert aber das ganze pdf nach jpg und extrahiert nicht die eingebetteten Bilder.

lks
colinardo
colinardo 14.11.2017, aktualisiert am 23.06.2023 um 12:32:43 Uhr
Goto Top
Servus,
iTextSharp und Powershell ist alles was man braucht für dein Vorhaben, multiple Tools nicht nötig face-wink.
Demo-Projekt zum direkt ausprobieren (angepasst an dein PDF):

split_and_extractimage_pdf_354789.zip

Rechtsklick auf process.ps1 > "Mit Powershell ausführen" ...Freuen.
Trennt alle Seiten deines PDFs auf in einzelne, extrahiert den zugehörigen QR-Code als PNG und benennt beide nach der auf der Seite enthaltenen CAT-Nummer.

Grüße Uwe
colinardo
colinardo 20.11.2017 um 14:45:42 Uhr
Goto Top
Wenn hier nichts mehr kommt, bitte als gelöst markieren. Merci!