Suche Programmierer für ein Skript gegen Bezahlung
Hallo,
ich suche auf diesem Weg ein Programmierer, der mir ein Skript schreiben kann, der Folgendes tun soll
Ich habe eine 2 Seitige Pdf Datei, die Bestimmten Inhalt hat. Aus dieser Pdf benötige ich BESTIMMTE Daten.
Der Aufbau des PDF ist nicht in einer XML Struktur sortiert. Um die Daten aus dem PDF weiter verarbeiten zukönnen mussen die daten aus dem Pdf in eine strukturierte XML Datei umgewandet werden.
Die umgewandelte XML Datei wird sodann für ein Wordprogramm benötigt um mit den extrahierten Daten Textbausteine generieren zu können. Momentan erledigen wir dies von Hand.
Die Pdf datei ist wie gesagt nicht in einer XML struktur. Das bedeutet bei erstellung der Pdf können "BESTIMMTE" Daten vorhanden sein oder "BESTIMMTE" daten fehlen. Das hängt von der jeweils erstellten PDF datei ab.
Die PDF wird durch ein Programm generiert.
Beispiel bestimmter daten in der PDF:
Blumen: Rosen
Herkunft: Blumenland AG
Rosenstraße 23
75427 Göttingen
Farbe: Lila
Lagernr: 5642
Diese Daten diehen nur zur Vorstellung !!!!!
Beispiel bestimmter daten in eine PDF die fehlen
Blumen: Rosen
Farbe: Lila
Lagernr: 564
Über eine Umsetzung würde ich mich freuen. Selbstverständlich gegen Bezahlung.
Bei interesse könnt ihr mich gerne anschreiben eine Telnummer hier zu hinterlgen wäre glaube ich nicht Hilfreich.
PS: Danke an den Site Admin der mir diesen Tipp gab mal direkt eine Frage ins Board zustellen.
LG
C-Sharp
ich suche auf diesem Weg ein Programmierer, der mir ein Skript schreiben kann, der Folgendes tun soll
Ich habe eine 2 Seitige Pdf Datei, die Bestimmten Inhalt hat. Aus dieser Pdf benötige ich BESTIMMTE Daten.
Der Aufbau des PDF ist nicht in einer XML Struktur sortiert. Um die Daten aus dem PDF weiter verarbeiten zukönnen mussen die daten aus dem Pdf in eine strukturierte XML Datei umgewandet werden.
Die umgewandelte XML Datei wird sodann für ein Wordprogramm benötigt um mit den extrahierten Daten Textbausteine generieren zu können. Momentan erledigen wir dies von Hand.
Die Pdf datei ist wie gesagt nicht in einer XML struktur. Das bedeutet bei erstellung der Pdf können "BESTIMMTE" Daten vorhanden sein oder "BESTIMMTE" daten fehlen. Das hängt von der jeweils erstellten PDF datei ab.
Die PDF wird durch ein Programm generiert.
Beispiel bestimmter daten in der PDF:
Blumen: Rosen
Herkunft: Blumenland AG
Rosenstraße 23
75427 Göttingen
Farbe: Lila
Lagernr: 5642
Diese Daten diehen nur zur Vorstellung !!!!!
Beispiel bestimmter daten in eine PDF die fehlen
Blumen: Rosen
Farbe: Lila
Lagernr: 564
Über eine Umsetzung würde ich mich freuen. Selbstverständlich gegen Bezahlung.
Bei interesse könnt ihr mich gerne anschreiben eine Telnummer hier zu hinterlgen wäre glaube ich nicht Hilfreich.
PS: Danke an den Site Admin der mir diesen Tipp gab mal direkt eine Frage ins Board zustellen.
LG
C-Sharp
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 565281
Url: https://administrator.de/contentid/565281
Ausgedruckt am: 24.11.2024 um 01:11 Uhr
11 Kommentare
Neuester Kommentar
Moin,
ist die Art, worin es umgesetzt wird, egal?
Grüße
ist die Art, worin es umgesetzt wird, egal?
Grüße
Hallo,
mein Weg wäre eine C#-Anwendung zur Verarbeitung der PDFs in einem Verzeichnis.
Der extrahierte Text (Textlayer oder OCR) würde per RegEx geparst werden. Der RegEx ist in einer Konfiguration hinterlegt wie RegEx-Syntax¶Name in der XML.
Der Aufwand ist auch überschaubar.
Bei Interesse einfach kurz melden mit Kontaktdaten.
Umsetzung kann kurzfristig erfolgen.
Viele Grüße
Ralf
mein Weg wäre eine C#-Anwendung zur Verarbeitung der PDFs in einem Verzeichnis.
Der extrahierte Text (Textlayer oder OCR) würde per RegEx geparst werden. Der RegEx ist in einer Konfiguration hinterlegt wie RegEx-Syntax¶Name in der XML.
Der Aufwand ist auch überschaubar.
Bei Interesse einfach kurz melden mit Kontaktdaten.
Umsetzung kann kurzfristig erfolgen.
Viele Grüße
Ralf
Ich würde das mit einem einfachen Rust-Programm machen.
Wie genu sollen die Daten im XML-Dokument aufgebaut sein? Vielleicht so?:
<?xml version="1.0" encoding="1.0" ?>
<Informationen>
<Blumen>Rosen</Blumen>
<Herkunft>Blumenland AG
Rosenstraße 23
75427 Göttingen</Herkunft>
<Farbe>Lila</Farbe>
<Lagernr>5642</Lagernr>
</Informationen>
Wenn ja wie das Root-Element (was im Beispiel "Informationen" heißt) heißen, oder ist das egal?
Wie genu sollen die Daten im XML-Dokument aufgebaut sein? Vielleicht so?:
<?xml version="1.0" encoding="1.0" ?>
<Informationen>
<Blumen>Rosen</Blumen>
<Herkunft>Blumenland AG
Rosenstraße 23
75427 Göttingen</Herkunft>
<Farbe>Lila</Farbe>
<Lagernr>5642</Lagernr>
</Informationen>
Wenn ja wie das Root-Element (was im Beispiel "Informationen" heißt) heißen, oder ist das egal?