ImageMagick wellige Seiten geradeziehen
Hallo,
ich bin dabei eine Software zu schreiben, die über ImageMagick aus Kamerabildern
Dokumentseiten extrahiert und dann optimiert und als PDF speichert. Das Extrahieren
mit Distort klappt prima mit 4 Punkten. Bei manchen welligen Dokumenten bekomme
ich allerdings das Problem dass ich zusätzliche Räume habe, die ebenfalls gezerrt werden
müssten wie hier zu sehen: (Ich meine nur den oberen schwarzen Balken)
Gibt es hier eine *einfache* Lösung in ImageMagick um das Problem zu lösen?
ich bin dabei eine Software zu schreiben, die über ImageMagick aus Kamerabildern
Dokumentseiten extrahiert und dann optimiert und als PDF speichert. Das Extrahieren
mit Distort klappt prima mit 4 Punkten. Bei manchen welligen Dokumenten bekomme
ich allerdings das Problem dass ich zusätzliche Räume habe, die ebenfalls gezerrt werden
müssten wie hier zu sehen: (Ich meine nur den oberen schwarzen Balken)
Gibt es hier eine *einfache* Lösung in ImageMagick um das Problem zu lösen?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 377612
Url: https://administrator.de/contentid/377612
Ausgedruckt am: 20.11.2024 um 00:11 Uhr
11 Kommentare
Neuester Kommentar
Hallo,
Schau mal ob das hier weiter hilft.
http://mytech.fiala.cc/foto/verzerrung-und-entzerrung
Gruss
BFF
Schau mal ob das hier weiter hilft.
http://mytech.fiala.cc/foto/verzerrung-und-entzerrung
Gruss
BFF
Garnicht so uebel.
Ich hab mal die OCR von NAPS2 dureber gehen lassen, was die erkennt sind die dunkler gefaerbten "Woerter".
Das zweite Bild ist die OCR von Acrobat 11.
Durch die Wellenform der Saetze wird wohl jede OCR etwas "zu tun" habe. Warum aber in diesem Fall Adobe Acrobat jaemmerlich schlechter ist wie NAPS2 ist mir unerklaerlich.
Am Ende wirst Du wohl nicht darum herum kommen, dass das Ausgangsmaterial "bessere" Qualtitaet haben muss. Bei uns wurden Seiten wie Du im Bild hast tatsaechlich "gebuegelt" damit abfotografiert werden konnte. Die spaeter eingesetzten Hochleistungsscanner waren da ein riesiger Fortschritt.
Die Erkennung von Text in wellenfoermigen Saetzen etc. scheint schon fast eine eigene Wissenschaft zu sein.
BFF
Ich hab mal die OCR von NAPS2 dureber gehen lassen, was die erkennt sind die dunkler gefaerbten "Woerter".
Das zweite Bild ist die OCR von Acrobat 11.
Durch die Wellenform der Saetze wird wohl jede OCR etwas "zu tun" habe. Warum aber in diesem Fall Adobe Acrobat jaemmerlich schlechter ist wie NAPS2 ist mir unerklaerlich.
Am Ende wirst Du wohl nicht darum herum kommen, dass das Ausgangsmaterial "bessere" Qualtitaet haben muss. Bei uns wurden Seiten wie Du im Bild hast tatsaechlich "gebuegelt" damit abfotografiert werden konnte. Die spaeter eingesetzten Hochleistungsscanner waren da ein riesiger Fortschritt.
Die Erkennung von Text in wellenfoermigen Saetzen etc. scheint schon fast eine eigene Wissenschaft zu sein.
BFF
Also Du hast "Vorlagen".
Meine Idee waere es mit Kontrastunterschieden zu versuchen.
Sprich das Stueck Papier ist meist heller, die Umgebung des Papieres meist dunkler. Ok, geht nicht, wenn das Papier auf einem weissen Untergrund liegt.
Am Ende wuerde ich die Auswahl des "Dokumentes" in eine Vorauswahl bringen bevor zugeschnitten wird.
Aber! Ich kann mir sehr wohl vorstellen, dass eine OCR Probleme mit diesem Ausschnitt haben wird, da die Vergroesserung des Textes zu pixelig ist.
BFF
Meine Idee waere es mit Kontrastunterschieden zu versuchen.
Sprich das Stueck Papier ist meist heller, die Umgebung des Papieres meist dunkler. Ok, geht nicht, wenn das Papier auf einem weissen Untergrund liegt.
Am Ende wuerde ich die Auswahl des "Dokumentes" in eine Vorauswahl bringen bevor zugeschnitten wird.
Aber! Ich kann mir sehr wohl vorstellen, dass eine OCR Probleme mit diesem Ausschnitt haben wird, da die Vergroesserung des Textes zu pixelig ist.
BFF