Ordnerstruktur mit 100.000 SW-Bildddateien in PDFs überführen
Hallo!
Bei uns wurde vor langer Zeit eine Kartei digitalisiert. Jede Karteikarte wurde vorne und hinten gescannt. Wir haben nun hier fast 1000 Ordner mit jeweils ca. 100 einzelnen durchnummerierten Tif-Bilddateien (jeweils ca. 15 kB groß). Die Ordner-Struktur sieht wie folgt aus:
D:\FT28TI4K.SCF\00\00\00 (00-99) -> jeweils 100 Dateien
D:\FT28TI4K.SCF\00\01\00 (00-x) -> jeweils 100 Dateien
D:\T2P4W727.SCF\00\00\00 (00-99) -> jeweils 100 Dateien
D:\T2P4E727.SCF\00\01\00 (00-99) -> jeweils 100 Dateien
D:\T2P4E727.SCF\00\02\00 (00-x) -> jeweils 100 Dateien
etc.
In der Indexdatenbank wurde ca. jedes 40. Bild erfasst (nur der Name). Die Suche erfolgt über ein Mini-DMS: Man gibt die ersten Buchstaben des Namens ein (z.B. Hu), findet dann einen halbwegs passenden Eintrag (z.B. Huber, Alois) und muss dann bis zum gewünschten Eintrag (z.B. Huchler, Sven) durchblättern.
Die Mini-DMS-Software funktioniert unter Windows 10 nicht mehr. Der Hersteller existiert nicht mehr.
Wir würden nun gerne "einfach" die Bilddateien in PDF-Dateien überführen. Je Ordner soll es eine PDF-Datei geben (mit 100 Seiten).
=> Hat jemand eine Idee, wie man das am besten automatisiert bewerkstelligt?
Die Schwierigkeit dabei:
- Die Reihenfolge der Bilddateien muss unbedingt eingehalten werden.
- Schön wäre es, wenn die PDF-Dateien als Name den Ordnernamen erhalten (z.B. "FT28TI4K.SCF-00-00-00.pdf") könnten und alle in einem zentralen Ordner gespeichert werden (sodass wir sie nicht aus den 1000 Ordnern zusammensammeln müssen).
Gruß
User1000
Bei uns wurde vor langer Zeit eine Kartei digitalisiert. Jede Karteikarte wurde vorne und hinten gescannt. Wir haben nun hier fast 1000 Ordner mit jeweils ca. 100 einzelnen durchnummerierten Tif-Bilddateien (jeweils ca. 15 kB groß). Die Ordner-Struktur sieht wie folgt aus:
D:\FT28TI4K.SCF\00\00\00 (00-99) -> jeweils 100 Dateien
D:\FT28TI4K.SCF\00\01\00 (00-x) -> jeweils 100 Dateien
D:\T2P4W727.SCF\00\00\00 (00-99) -> jeweils 100 Dateien
D:\T2P4E727.SCF\00\01\00 (00-99) -> jeweils 100 Dateien
D:\T2P4E727.SCF\00\02\00 (00-x) -> jeweils 100 Dateien
etc.
In der Indexdatenbank wurde ca. jedes 40. Bild erfasst (nur der Name). Die Suche erfolgt über ein Mini-DMS: Man gibt die ersten Buchstaben des Namens ein (z.B. Hu), findet dann einen halbwegs passenden Eintrag (z.B. Huber, Alois) und muss dann bis zum gewünschten Eintrag (z.B. Huchler, Sven) durchblättern.
Die Mini-DMS-Software funktioniert unter Windows 10 nicht mehr. Der Hersteller existiert nicht mehr.
Wir würden nun gerne "einfach" die Bilddateien in PDF-Dateien überführen. Je Ordner soll es eine PDF-Datei geben (mit 100 Seiten).
=> Hat jemand eine Idee, wie man das am besten automatisiert bewerkstelligt?
Die Schwierigkeit dabei:
- Die Reihenfolge der Bilddateien muss unbedingt eingehalten werden.
- Schön wäre es, wenn die PDF-Dateien als Name den Ordnernamen erhalten (z.B. "FT28TI4K.SCF-00-00-00.pdf") könnten und alle in einem zentralen Ordner gespeichert werden (sodass wir sie nicht aus den 1000 Ordnern zusammensammeln müssen).
Gruß
User1000
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 337134
Url: https://administrator.de/contentid/337134
Ausgedruckt am: 22.11.2024 um 07:11 Uhr
6 Kommentare
Neuester Kommentar
Dann nimmst du halt ImageMagick.
Und hier gibt's nochwas wenn man die TIFFs vorher zu einem Multipage TIFF zusammenstellen wollte
Multi-Page Tiff mit Powershell erstellen
Multi-Page Tiff mit Powershell erstellen
Moin,
die wesentllichen Tools wurden ja bereits genannt:
ImageMagick -> Konvertierung der TIF-Dateien in PDF
pdftk -> PDF Einzelseiten in mehrseitige Dokumente überführen
Ich würde dann noch mit PDFXchange aus den PDF-Dateien durchsuchbare PDF machen (Volltextindexierung). Lässt sich mit der Free-Version von PDFXchange und Autohotkey umsetzten.
Habe solche Projekte schon einige Male umgesetzt um solche filebasierten Archivdaten in ein DMS zu überführen (z.B. ELO DMS, Easy Archiv).
Gruß
Dirk
die wesentllichen Tools wurden ja bereits genannt:
ImageMagick -> Konvertierung der TIF-Dateien in PDF
pdftk -> PDF Einzelseiten in mehrseitige Dokumente überführen
Ich würde dann noch mit PDFXchange aus den PDF-Dateien durchsuchbare PDF machen (Volltextindexierung). Lässt sich mit der Free-Version von PDFXchange und Autohotkey umsetzten.
Habe solche Projekte schon einige Male umgesetzt um solche filebasierten Archivdaten in ein DMS zu überführen (z.B. ELO DMS, Easy Archiv).
Gruß
Dirk