botpenner
Goto Top

PDF Dateien, Bilder extrahieren ! Welche Software?

Hallo Leute,


ich habe viele PDF Dateien in einem Ordner. Die PDF sind mit 6 Stelligen Nummern benannt.
Jede PDF hat nur 1 Seite , mit einem Bild.


Ich möchte nun das Bild aus den gesamten PDF dateien extrahieren und asl JPG speichern. Der Name der Bilder sollen gleich der PDF seien.

Ich habe die Software "PDF Image Extraction Wizard" gefunden. An sich tut sie alles wie ich es will. Problem ist nur das ich nur eine PDF immer laden kann.
Bei über 200 PDf Dateien dauert mir das zu lange.


Gibt es ein Programm wo man Direkt mehere dateien laden kann?


Betriebssystem ist Windows 10

Content-Key: 354789

Url: https://administrator.de/contentid/354789

Printed on: April 18, 2024 at 23:04 o'clock

Mitglied: 134464
134464 Nov 14, 2017 updated at 11:00:52 (UTC)
Goto Top
Stell uns doch mal eins deiner PDFs als Demo zum Download, dann können wir dir ein PS-Skript schreiben was das erledigt ganz ohne zusätzliche Software.
Betriebssystem ist Windows 10
Das OS der ahnungslosen Horden face-smile.
Member: Botpenner
Botpenner Nov 14, 2017 at 11:19:12 (UTC)
Goto Top
Hallo sehr gerne,


zur PDF Datei :

Ich habe jetzt nur die erste Seite zu Verfügung gestellt.
In der Wirklichkeit befinden sich in einer PDF Dateien 100 Seiten mit dem Selben Aufbau.

Ich habe nun ein Programm gefunden wo ich die Seiten Splitten und die CAT-NUMMER herauslesen und als Dateinamen verwende kann.

Dann hätte ich 100 PDf Dateien die jeweiligs mit der CAT-Nummer benannt sind.
Nun bräuchte ich ein Programm der aus den PDF Dateien nur den QR Code heraus extrahieren und das Bild als CAT-Nummer speichert.

Anschließend steht in einer CSV-Datei der alte und neue Name. Per Batch sollte nun alle Bilder mit dem neuen Dateinamen unbenannt werden.

Aufbau der CSV Datei:

"Alt";"Neu"
"datei1.pdf";"datei_neu.pdf"
"datei2.pdf";"datei_neu2.pdf"


PDF Datei zum Testen
Member: beidermachtvongreyscull
beidermachtvongreyscull Nov 14, 2017 updated at 11:22:43 (UTC)
Goto Top
Member: Lochkartenstanzer
Lochkartenstanzer Nov 14, 2017 updated at 12:04:05 (UTC)
Goto Top
Moin,

mit den poppler-utilities für Windows geht das ganz einfach:

<code ype=plain>
pdfimages name.pdf name


packt die Bilder von name.pdf in dateien mit dem Namen name-xxx.ppm, wobei xxx eien forlaufende Nummerierung der Bilder in der pdf-Datei ist.

lks
Member: BassFishFox
BassFishFox Nov 14, 2017 at 12:06:14 (UTC)
Goto Top
Mahlzeit,

Genau!
Da er ja W10 hat, kann er das easy in der WSL nachinstallieren und benutzen. face-smile

Und wenn er
pdfimages -j name.pdf name
nimmt, hat er die Bilderlinge gleich als JPG.

BFF
Member: Lochkartenstanzer
Lochkartenstanzer Nov 14, 2017 at 12:21:35 (UTC)
Goto Top
Moin

Imagemagick konvertiert aber das ganze pdf nach jpg und extrahiert nicht die eingebetteten Bilder.

lks
Member: colinardo
colinardo Nov 14, 2017, updated at Jun 23, 2023 at 10:32:43 (UTC)
Goto Top
Servus,
iTextSharp und Powershell ist alles was man braucht für dein Vorhaben, multiple Tools nicht nötig face-wink.
Demo-Projekt zum direkt ausprobieren (angepasst an dein PDF):

split_and_extractimage_pdf_354789.zip

Rechtsklick auf process.ps1 > "Mit Powershell ausführen" ...Freuen.
Trennt alle Seiten deines PDFs auf in einzelne, extrahiert den zugehörigen QR-Code als PNG und benennt beide nach der auf der Seite enthaltenen CAT-Nummer.

Grüße Uwe
Member: colinardo
colinardo Nov 20, 2017 at 13:45:42 (UTC)
Goto Top
Wenn hier nichts mehr kommt, bitte als gelöst markieren. Merci!