20.06.2018

3759

ImageMagick wellige Seiten geradeziehen

Hallo,

ich bin dabei eine Software zu schreiben, die über ImageMagick aus Kamerabildern
Dokumentseiten extrahiert und dann optimiert und als PDF speichert. Das Extrahieren
mit Distort klappt prima mit 4 Punkten. Bei manchen welligen Dokumenten bekomme
ich allerdings das Problem dass ich zusätzliche Räume habe, die ebenfalls gezerrt werden
müssten wie hier zu sehen: (Ich meine nur den oberen schwarzen Balken)

Gibt es hier eine *einfache* Lösung in ImageMagick um das Problem zu lösen?

Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben

Content-ID: 377612

Url: https://administrator.de/forum/imagemagick-wellige-seiten-geradeziehen-377612.html

Ausgedruckt am: 14.07.2025 um 03:07 Uhr

11 Kommentare

Neuester Kommentar

Hallo,

Schau mal ob das hier weiter hilft.
mytech.fiala.cc/foto/verzerrung-und-entzerrung

Gruss
BFF

Danke für deine Antwort,

leider arbeitet der Barrel immer auch im entgegengesetzten Blatteil wo
sich keine Verzerrungen befinden. Momentan versuche ich eine einfachere
Lösung über Imagemagick zu Realisieren, die das Bild in 2 Einzelbilder aufteilt,
diese dann perspektivisch entzerrt und dann wieder 1 daraus macht. mal sehen
ob die Schrift dann an der Trennstelle gestückelt ist

Das Optimum ist das sicher nicht. Mit 10 Koordinaten erreiche ich leider auch keine
wirklich guten Ergebnisse. => Vielleicht hat ja hier jemand einen Tipp für Imagemagick
wie ich am besten mit dem Raster arbeite ...

Danke

Das Ergebnis wird nicht so schlecht wie erwartet.

Im Bild wird die unterste Stelle in der Mitte markiert welche nach oben gezogen
werden soll. Danach erstelle ich 2 Teilbilder daraus (1* links und 1*rechts).
Auf die beiden Teilbilder wende ich dann den ImageMagick Perspective mit
jeweils 4 Punkten an, indem ich die Ecken nach oben ziehe.

das Ergebnis sieht dann so aus:

Wenn ihr eine bessere Lösung kennt lasst es mich bitte wissen.

Garnicht so uebel.

Ich hab mal die OCR von NAPS2 dureber gehen lassen, was die erkennt sind die dunkler gefaerbten "Woerter".

Das zweite Bild ist die OCR von Acrobat 11.

Durch die Wellenform der Saetze wird wohl jede OCR etwas "zu tun" habe. Warum aber in diesem Fall Adobe Acrobat jaemmerlich schlechter ist wie NAPS2 ist mir unerklaerlich.

Am Ende wirst Du wohl nicht darum herum kommen, dass das Ausgangsmaterial "bessere" Qualtitaet haben muss. Bei uns wurden Seiten wie Du im Bild hast tatsaechlich "gebuegelt" damit abfotografiert werden konnte. Die spaeter eingesetzten Hochleistungsscanner waren da ein riesiger Fortschritt.

Die Erkennung von Text in wellenfoermigen Saetzen etc. scheint schon fast eine eigene Wissenschaft zu sein.

BFF

NAPS2 ist ein echt guter Tipp, durch die Tatsache das ich ja selbst ein Programm wie NAPS2
in .Net schreibe gibt mir dieses Teil einiges an Stoff den ich mit einbringen kann. Super Tipp!

NAPS2 verwendet eine Tesseract 3.04 Engine mit Leptonica, diese ist beim geradeziehen von
Texten vermutlich besser als die von Adobe. Ich verwende mittlerweile schon Tesseract4 weil
der schon mit KI Methoden arbeitet und nochmal bessere Ergebnisse liefert. Die Wellenform der
Texte kriegt man vermutlich eh nie gebügelt ... (außer mit Bügeln :D - auch ein guter Tipp)
Dieses Dokument habe ich selbst geknittert :D Normalerweise sehen die Dokumente nicht so wild
aus, die haben halt den berühmten Briefumschlagsknick.

Aktueller Stand ist jetzt:

Ein Hilfsprogramm um die Umrisse des Dokuments zu markieren, danach die Einzelpunkte an
die richtige Stelle schieben (Was auch die Zeilen dazwischen mit betrifft ... )
Die Quell- und Zielkoordinaten dann als Text ausgeben und mit
ImageMagick -distort 3 {Koordinaten} Ausgabedatei.jpg durchrechnen lassen ...

Das Ergebnis sieht dann so aus:

Ich glaube mit einfachen Mitteln ist da jetzt echt nicht mehr rauszuholen ...

Liest sich echt interessant was Du da treibst.

Wenn ich mich recht erinnere hatte ABBY FineReader auch schon so eine GeradeMachFunktion, an der Du arbeitest. Die hatten/haben auch SDK die vielleicht fuer Dich interessant sein koennten, wenn Du es nicht schon weisst.

Schoenes WE!
BFF

Wenn du an dem Projekt mitarbeiten möchtest, gerne. Ich stell es dann auf git und du kannst Ideen beitragen und testen.

github.com/Phreak87

Danke fuer das Angebot.

Zusaetzlich setze ich mal meinen Luetten darauf an, ok der Luette ist jetzt in der 12.

Das was Du schon auf Github hast, ist wohl auch das was ihn interessiert.
Ich geb im mal den Link, wenn er seine Magendarmgrippe ueberwunden hat.

BFF

Schreib mir einfach Mal ne Mail an nbhcrew@gmail.com - ist ja hier schon nicht mehr topic

Hast du vielleicht auch eine Idee wie ich aus einem Bild den Bereich in dem das Dokument liegt hausfinden kann? Also Handybild wo irgendwo in der Mitte ein Dokument ist ... Ansonsten mach ich noch extra topic auf

Also Du hast "Vorlagen".

Meine Idee waere es mit Kontrastunterschieden zu versuchen.
Sprich das Stueck Papier ist meist heller, die Umgebung des Papieres meist dunkler. Ok, geht nicht, wenn das Papier auf einem weissen Untergrund liegt.

Am Ende wuerde ich die Auswahl des "Dokumentes" in eine Vorauswahl bringen bevor zugeschnitten wird.

Aber! Ich kann mir sehr wohl vorstellen, dass eine OCR Probleme mit diesem Ausschnitt haben wird, da die Vergroesserung des Textes zu pixelig ist.

BFF

Frage Multimedia Grafik Hard-, Software

Mehr von Phreak87

Suche Objekterkennung mit Aussage über KoordinatenPhreak87 - 14 Kommentare

Radarsensor für Ölstandsmessung auf ESPPhreak87 - 9 Kommentare

Multidimensionales Array an Funktion übergeben in C (ESP8266)Phreak87 - 1 Kommentar

Javascipt Expression ParserPhreak87

Heiß diskutiert