Professionelle Scan Software gesucht
Hallo,
ich besitze einen Kyocera CDW5526cdw Drucker/Scanner mit dem ich soweit zufrieden bin.
Allerdings lässt die mitgelieferte Software zu Wünschen übrig.
Bei einigen Dokumentenscannern habe ich gesehen, dass dort schon recht gute SW mitgeliefert wird.
Da ich mir aber nicht zusätzlich einen separaten Scanner hinstellen möchte, suche ich eine Drittanbieter Software die mir den Einsatz meines Scanners erleichtert.
Derzeit nutze ich NAPS2, das für eine Freeware gute Dienste bietet. Allerdings fehlen da natürlich einige Funktionen.
z.B. hätte ich gerne:
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)
Dass dies alles generell Möglich ist, zeigt ja die Cloud-basierende Lösung von Fujisu mit den canSnap iX....... Scannern.
Wenn ich nicht schon einen Scanner hätte, kämen die in meine engere Wahl.
Interessantes Video dazu findet man auf https://www.youtube.com/watch?v=SmMklB4C1CI
Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?
Gruß
Christian
ich besitze einen Kyocera CDW5526cdw Drucker/Scanner mit dem ich soweit zufrieden bin.
Allerdings lässt die mitgelieferte Software zu Wünschen übrig.
Bei einigen Dokumentenscannern habe ich gesehen, dass dort schon recht gute SW mitgeliefert wird.
Da ich mir aber nicht zusätzlich einen separaten Scanner hinstellen möchte, suche ich eine Drittanbieter Software die mir den Einsatz meines Scanners erleichtert.
Derzeit nutze ich NAPS2, das für eine Freeware gute Dienste bietet. Allerdings fehlen da natürlich einige Funktionen.
z.B. hätte ich gerne:
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)
Dass dies alles generell Möglich ist, zeigt ja die Cloud-basierende Lösung von Fujisu mit den canSnap iX....... Scannern.
Wenn ich nicht schon einen Scanner hätte, kämen die in meine engere Wahl.
Interessantes Video dazu findet man auf https://www.youtube.com/watch?v=SmMklB4C1CI
Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?
Gruß
Christian
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 5462458857
Url: https://administrator.de/contentid/5462458857
Ausgedruckt am: 17.11.2024 um 13:11 Uhr
18 Kommentare
Neuester Kommentar
Vielleicht funktioniert die Software der Kodak Akaris Geräte.
Das dürfte das Maß der Dinge sein.
Das dürfte das Maß der Dinge sein.
Moin,
Wäre es eine Option, einen RPi mit passender Software zu bestücken?
Selbst nicht umgesetzt, aber vielleicht reicht dir das: https://jankarres.de/2014/03/raspberry-pi-dokumentenverwaltung-mit-ocr-e ...
Du kannst dann vom MFP auf den Pi scannen und vom Pc/ Laptop/ Smartphone auf die Dokumente zugreifen…
Wäre es eine Option, einen RPi mit passender Software zu bestücken?
Selbst nicht umgesetzt, aber vielleicht reicht dir das: https://jankarres.de/2014/03/raspberry-pi-dokumentenverwaltung-mit-ocr-e ...
Du kannst dann vom MFP auf den Pi scannen und vom Pc/ Laptop/ Smartphone auf die Dokumente zugreifen…
Zitat von @BassFishFox:
Keine Ahnung was Abbyy Finereader jetzt so bringt nachdem da massiv umgestellt wurde. Damals (2014) war es das Mass der Dinge fuer uns.
Keine Ahnung was Abbyy Finereader jetzt so bringt nachdem da massiv umgestellt wurde. Damals (2014) war es das Mass der Dinge fuer uns.
Läuft immer noch hervorragend.
Die Software kann im Batchverfahren ganze Ordner per OCR beackern
Gerade bei der Texterkennung versagen die meisten Programme, die vom Hersteller als Steuerung für ihre Hardware beigefügt werden.
Programme, wie Abyy Fine Reader oder Omnipage sind hardwareunabhängig und liefern die besten Ergebnisse bei der Texterkennung.
Ich persönlich habe mich in Omnipage eingearbeitet und finde es toll wie man da per GUI ganze Abläufe bzw Scripte durchführen lassen kann um z.B. einen Dateinamen zu erzeugen.
Programme, wie Abyy Fine Reader oder Omnipage sind hardwareunabhängig und liefern die besten Ergebnisse bei der Texterkennung.
Ich persönlich habe mich in Omnipage eingearbeitet und finde es toll wie man da per GUI ganze Abläufe bzw Scripte durchführen lassen kann um z.B. einen Dateinamen zu erzeugen.
Da ich nur ein Anwender bin der täglich vielleicht 10 Dokumente einscannt, wäre mir das zu aufwändig wenn überhaupt möglich für mich.
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
MFPs sind für OCR zu lahm. Lass das eine Software wie den ABBYY FineReader (oder andere o. g.) machen. Als Ziel hinterlegst du im MFP dann deinen PC/ dein Laptop oder ein NAS. Ich hab @home auf dem Zielgerät einen Benutzer "Scan" angelegt, der ausschließlich Schreibrechte auf eine Freigabe hat. Deine oftware könnte den o. g. Ordnder dann einlesen und die PDFs per OCR "beackern"-Konfigurierbare Vorgabe des Dateinamens.
kannst du in der Kurzwahl definieren (wenn ich mich recht erinnere)-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
Kannst du beim Scan selbst angeben- leere Seiten Erkennung (nice to have)
Kann das MFP selbst
Moin,
Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC
Das Gerät hat normalerweise 512MB RAM.
Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...
Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/
Ist in der Community Variante kostenfrei.
Bin Ich selbst auch am überlegen
Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC
Das Gerät hat normalerweise 512MB RAM.
Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...
Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/
Ist in der Community Variante kostenfrei.
Bin Ich selbst auch am überlegen
Hallo,
https://github.com/tesseract-ocr/tesseract
Problem ist die Automatik beim Ansteuern. Für alles andere gibt es auch kostenlose Tools die sich mit PowerShell oder anderen Programmiersprachen einfach aufmotzen lassen.
Tesseract wird - wo oben schon DMS reingeworfen wurde - von Bitfarm genommen.
Steuerung ist so eine Sache. Für Linux gibt es einige Tools. Man kann auch Scanner der nur unter Linux läuft mit TWAIN via LAN steuern.
Auf der "frickeligen" Variante gibt es auch zig Lösungen die kaum Wünsche übrig lassen.
Habe selber mal einen Fujutsu SnapScan via Linux angebunden, da kein Twain für Windows vorhanden war. Via LAN dann unter Windows gescannt. Ging. Unter Bitfarm hab ich es nicht richtig hinbekommen, danach einer Seite Schluß war. Der Vorgangn wurde nicht sauber beendet. Normal kann man mit den Geräten ja mehrere Seiten auf einmal scannen.
https://sourceforge.net/projects/nttwain/
Unter Linux musste ich nur USB 3.0 aktivieren, darum ging es am Anfang nicht. Ansonsten stand die Kommunikation.
Am schnellsten sind die Viecher unter USB 3. Viele Programme setzen nur Twain voraus. Sonst schaut man in die Röhre.
Oder als Kompromiss wäre kannst du auch mit der Hard- und Sofware arbeiten. Leere Blatt Erkennung oder umwandeln in PDF beherrschen viele Geräte schon. Wenn du so im Pulk hunderte Seite hast lassen die sich später mit Lösungen wie PowreShell und Tesseract o.ä. einfach abarbeiten.
Leere Seiten - Segen oder Fluch. Manche Konzept basieren immer noch auf Trennblättern. Wenn dir die Dokumente bekantn und der Aufbau immer gleich ist, gibt es zig Möglichkeiten. Wenn die erste Seite QR oder Barcode hat das als Trenner nehmen und die Seiten so zuammenfassen.
Gibt auch professionelle Software. Die Werten Bereiche oder alles aus. Machen aus QR Code den Dateinamen und kosten 3.500 Euro...
Ich hab mal Code Snippet geschrieben, der Dokument als Bild nimmt und in Kopie das ganze nur auf den unteren Bereich beschränkt. Anschließend Barcode ausgewertet.
War nur ein Schnellschuß. ging ganz gut!
PDF ist Segen und Fluch! Warum? Viele Programme werden Bilder aus: IMG, JPG. Da muss man PDF erst wieder hin konvertieren damit es läuft.
Hier wird 150 mal die Auswertung drüberlaufen gelassen, damit man gut Resultate erzielt. Fand ich ganz nett die DLL.
Als Bsp. war ein Buchrücken mit 3 Barcodes. Das Programm holte alle hervor.
Wir sind hier übrigens gerade unter Windows 10 + PowerShell + C-Sharp DLL.
Die größte Herausforerung ist die DLL anzusprechen. Unter $barcodes kommt nur ein Text mit dem Inhalt.
Umbenennen anhand von Barcode, Aufteilen, Bilder wieder in PDF zusammenführen und mit Tesseract Text Stream hinzufügen.
Geht auch für lau - kostenlos.....
Abarbeitung Din A4 Lieferschein nur für Barcode < 1 Sekunde.
https://github.com/tesseract-ocr/tesseract
Problem ist die Automatik beim Ansteuern. Für alles andere gibt es auch kostenlose Tools die sich mit PowerShell oder anderen Programmiersprachen einfach aufmotzen lassen.
Tesseract wird - wo oben schon DMS reingeworfen wurde - von Bitfarm genommen.
Steuerung ist so eine Sache. Für Linux gibt es einige Tools. Man kann auch Scanner der nur unter Linux läuft mit TWAIN via LAN steuern.
Auf der "frickeligen" Variante gibt es auch zig Lösungen die kaum Wünsche übrig lassen.
Habe selber mal einen Fujutsu SnapScan via Linux angebunden, da kein Twain für Windows vorhanden war. Via LAN dann unter Windows gescannt. Ging. Unter Bitfarm hab ich es nicht richtig hinbekommen, danach einer Seite Schluß war. Der Vorgangn wurde nicht sauber beendet. Normal kann man mit den Geräten ja mehrere Seiten auf einmal scannen.
https://sourceforge.net/projects/nttwain/
Unter Linux musste ich nur USB 3.0 aktivieren, darum ging es am Anfang nicht. Ansonsten stand die Kommunikation.
Am schnellsten sind die Viecher unter USB 3. Viele Programme setzen nur Twain voraus. Sonst schaut man in die Röhre.
Oder als Kompromiss wäre kannst du auch mit der Hard- und Sofware arbeiten. Leere Blatt Erkennung oder umwandeln in PDF beherrschen viele Geräte schon. Wenn du so im Pulk hunderte Seite hast lassen die sich später mit Lösungen wie PowreShell und Tesseract o.ä. einfach abarbeiten.
Leere Seiten - Segen oder Fluch. Manche Konzept basieren immer noch auf Trennblättern. Wenn dir die Dokumente bekantn und der Aufbau immer gleich ist, gibt es zig Möglichkeiten. Wenn die erste Seite QR oder Barcode hat das als Trenner nehmen und die Seiten so zuammenfassen.
Gibt auch professionelle Software. Die Werten Bereiche oder alles aus. Machen aus QR Code den Dateinamen und kosten 3.500 Euro...
Ich hab mal Code Snippet geschrieben, der Dokument als Bild nimmt und in Kopie das ganze nur auf den unteren Bereich beschränkt. Anschließend Barcode ausgewertet.
War nur ein Schnellschuß. ging ganz gut!
PDF ist Segen und Fluch! Warum? Viele Programme werden Bilder aus: IMG, JPG. Da muss man PDF erst wieder hin konvertieren damit es läuft.
[BarcodeImaging]::FullScanPage([ref] $barcodes, $src, 150)
Hier wird 150 mal die Auswertung drüberlaufen gelassen, damit man gut Resultate erzielt. Fand ich ganz nett die DLL.
Als Bsp. war ein Buchrücken mit 3 Barcodes. Das Programm holte alle hervor.
Wir sind hier übrigens gerade unter Windows 10 + PowerShell + C-Sharp DLL.
Die größte Herausforerung ist die DLL anzusprechen. Unter $barcodes kommt nur ein Text mit dem Inhalt.
Umbenennen anhand von Barcode, Aufteilen, Bilder wieder in PDF zusammenführen und mit Tesseract Text Stream hinzufügen.
Geht auch für lau - kostenlos.....
using namespace System.Drawing;
Add-Type -AssemblyName System.Drawing;
[void] [Reflection.Assembly]::LoadWithPartialName("System.Windows.Forms")
$testBild = "C:\temp\code_ls4.png-2.png"
$src=[System.Drawing.Image]::FromFile($testBild)
$rect = New-Object System.Drawing.Rectangle(740,1500,400,250) # top, left, width, height of slice
$slice = $src.Clone($rect, $src.PixelFormat);
#$slice.Save("c:\temp\test_slice.png", "png");
$src = $slice;
[void] [System.Reflection.Assembly]::LoadFrom("c:\temp\BarcodeImaging.dll");
$barcodes = @{}
[BarcodeImaging]::FullScanPage([ref] $barcodes, $src, 150)
$barcodes
Abarbeitung Din A4 Lieferschein nur für Barcode < 1 Sekunde.
Zitat von @TomTomBon:
Moin,
Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC
Das Gerät hat normalerweise 512MB RAM.
Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...
Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/
Ist in der Community Variante kostenfrei.
Bin Ich selbst auch am überlegen
Moin,
Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC
Das Gerät hat normalerweise 512MB RAM.
Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...
Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/
Ist in der Community Variante kostenfrei.
Bin Ich selbst auch am überlegen
Ich liebäugel damit auch! Preise sehr transparent. Weit unter 100.000 Euro. Die große Konkurrenz liegt teils bei 60.000. Oder mit "unlashed" so 120.000 Euro.
Die API - das eig. interessante - wird wohl dann zu Buche schlagen. Da wird es ja erst lustig.
Bitfarm ist ähnlich unterwegs. Da fehlen mir aber ein paar Feature. Das Scan Programm kann Twain. Aber - wie in meinen anderen Post - können das nicht alle Geräte.
Hardware mit Hotfolder und dann in DMS - das wäre die einfachste Variante. Alternativ kann man es auch einfach selber bauen. Nur was dann? Haufen lesbarer PDF mit Namen aus dem Barcode? Kriegt man hin. Aber die Verwaltung ist wieder ein anderes Thema.
Ich finde viele Lösungen ziemlich teuer. In Kombination von DMS und Hardware kann man da deutlich sparen und hat professionelle Ergebnisse.
Moin
Kleine Einordnung zu TWAIN:
Alle Kyocera Geräte, inkl deren Töchter wie Triumph-Adler und UTAX, können TWAIN.
Mit der TWAIN Software 3.0 auch TWAIN 64bit. Was in meinen Augen kein Fortschritt derzeit ist.
Der Performance Unterschied wird woanders nivelliert.
Und DeFakto ist 64bit bei TWAIN noch nicht überall angekommen.
Ähnlich wie 64bit bei Win XP.
Performance mäßig WAR es besser.
Wenn man den besseren PC hatte....
Aber irgendetwas aus der 32bit Welt ans Laufen bekommen war.....
Nervig
@Crusher79
Wegen der Abarbeitung später habe Ich ein DMS eingeworfen.
Man sollte die Daten auch verwerten können
Und das eine ist eine vernünftige Ordner Struktur.
Das andere ist eine Suche durch indizierte Seiten..
Kleine Einordnung zu TWAIN:
Alle Kyocera Geräte, inkl deren Töchter wie Triumph-Adler und UTAX, können TWAIN.
Mit der TWAIN Software 3.0 auch TWAIN 64bit. Was in meinen Augen kein Fortschritt derzeit ist.
Der Performance Unterschied wird woanders nivelliert.
Und DeFakto ist 64bit bei TWAIN noch nicht überall angekommen.
Ähnlich wie 64bit bei Win XP.
Performance mäßig WAR es besser.
Wenn man den besseren PC hatte....
Aber irgendetwas aus der 32bit Welt ans Laufen bekommen war.....
Nervig
@Crusher79
Wegen der Abarbeitung später habe Ich ein DMS eingeworfen.
Man sollte die Daten auch verwerten können
Und das eine ist eine vernünftige Ordner Struktur.
Das andere ist eine Suche durch indizierte Seiten..
Ein Hinweis: Als DMS für den Hausgebrauch käme paperless-ngx in Frage. Alle Dateien, die der Scanner in einem "consume" Ordner ablegt (PDF, TIFF, JPG, ...) würden via tessaract OCR als ein durchsuchbares PDF umgewandelt und archivert. Das anschließende Handling ist auch schon ganz ordentlich gelöst, und noch in vielversprechender Entwicklung.
Das ganze läuft z.B. als Docker-Container auf einem NAS. Weiteres hier:
https://github.com/paperless-ngx/paperless-ngx
Das ganze läuft z.B. als Docker-Container auf einem NAS. Weiteres hier:
https://github.com/paperless-ngx/paperless-ngx
Zitat von @Survival62:
z.B. hätte ich gerne:
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)
Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)
Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?
Google mal Scan2PDF Pro kann das alles und kostet nicht viel..
Gruß
Hmm sieht nett aus. Hab Erfahrung mit Tool aus NRW. Wurde damals Klinik über Drucker-Anbieter mit verkauft. Lagen bei 3.500 Euro? Wollten nur QR-Code einlesen und Datei umbenennen.
Für den Workflow bzw. das Tool 4-stelliger Betrag
Zitat von @Crusher79:
Hmm sieht nett aus. Hab Erfahrung mit Tool aus NRW. Wurde damals Klinik über Drucker-Anbieter mit verkauft. Lagen bei 3.500 Euro? Wollten nur QR-Code einlesen und Datei umbenennen.
Für den Workflow bzw. das Tool 4-stelliger Betrag
Hmm sieht nett aus. Hab Erfahrung mit Tool aus NRW. Wurde damals Klinik über Drucker-Anbieter mit verkauft. Lagen bei 3.500 Euro? Wollten nur QR-Code einlesen und Datei umbenennen.
Für den Workflow bzw. das Tool 4-stelliger Betrag
Ich glaube Du meinst was anderes.
Scan2PDF Pro kostet irgendwas um die 90.- Euro