survival62
Goto Top

Professionelle Scan Software gesucht

Hallo,

ich besitze einen Kyocera CDW5526cdw Drucker/Scanner mit dem ich soweit zufrieden bin.
Allerdings lässt die mitgelieferte Software zu Wünschen übrig.
Bei einigen Dokumentenscannern habe ich gesehen, dass dort schon recht gute SW mitgeliefert wird.
Da ich mir aber nicht zusätzlich einen separaten Scanner hinstellen möchte, suche ich eine Drittanbieter Software die mir den Einsatz meines Scanners erleichtert.
Derzeit nutze ich NAPS2, das für eine Freeware gute Dienste bietet. Allerdings fehlen da natürlich einige Funktionen.

z.B. hätte ich gerne:
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)

Dass dies alles generell Möglich ist, zeigt ja die Cloud-basierende Lösung von Fujisu mit den canSnap iX....... Scannern.
Wenn ich nicht schon einen Scanner hätte, kämen die in meine engere Wahl.
Interessantes Video dazu findet man auf https://www.youtube.com/watch?v=SmMklB4C1CI

Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?

Gruß
Christian

Content-ID: 5462458857

Url: https://administrator.de/contentid/5462458857

Ausgedruckt am: 17.11.2024 um 13:11 Uhr

2423392070
2423392070 18.01.2023 um 20:04:21 Uhr
Goto Top
Vielleicht funktioniert die Software der Kodak Akaris Geräte.
Das dürfte das Maß der Dinge sein.
em-pie
em-pie 18.01.2023 um 20:47:04 Uhr
Goto Top
Moin,

Wäre es eine Option, einen RPi mit passender Software zu bestücken?
Selbst nicht umgesetzt, aber vielleicht reicht dir das: https://jankarres.de/2014/03/raspberry-pi-dokumentenverwaltung-mit-ocr-e ...

Du kannst dann vom MFP auf den Pi scannen und vom Pc/ Laptop/ Smartphone auf die Dokumente zugreifen…
BassFishFox
BassFishFox 18.01.2023 um 20:51:49 Uhr
Goto Top
Keine Ahnung was Abbyy Finereader jetzt so bringt nachdem da massiv umgestellt wurde. Damals (2014) war es das Mass der Dinge fuer uns.
em-pie
em-pie 18.01.2023 um 20:53:55 Uhr
Goto Top
Zitat von @BassFishFox:

Keine Ahnung was Abbyy Finereader jetzt so bringt nachdem da massiv umgestellt wurde. Damals (2014) war es das Mass der Dinge fuer uns.

Läuft immer noch hervorragend.
Die Software kann im Batchverfahren ganze Ordner per OCR beackern face-smile
5175293307
5175293307 18.01.2023 aktualisiert um 21:40:29 Uhr
Goto Top
Bietet so gut wie alles was das Herz begehrt
VueScan

Gruß wurstel
NordicMike
NordicMike 19.01.2023 um 09:29:32 Uhr
Goto Top
Gerade bei der Texterkennung versagen die meisten Programme, die vom Hersteller als Steuerung für ihre Hardware beigefügt werden.

Programme, wie Abyy Fine Reader oder Omnipage sind hardwareunabhängig und liefern die besten Ergebnisse bei der Texterkennung.

Ich persönlich habe mich in Omnipage eingearbeitet und finde es toll wie man da per GUI ganze Abläufe bzw Scripte durchführen lassen kann um z.B. einen Dateinamen zu erzeugen.
Survival62
Survival62 19.01.2023 um 12:54:46 Uhr
Goto Top
Zitat von @em-pie:

Wäre es eine Option, einen RPi mit passender Software zu bestücken?
Selbst nicht umgesetzt, aber vielleicht reicht dir das: https://jankarres.de/2014/03/raspberry-pi-dokumentenverwaltung-mit-ocr-e ...

Du kannst dann vom MFP auf den Pi scannen und vom Pc/ Laptop/ Smartphone auf die Dokumente zugreifen…

Da ich nur ein Anwender bin der täglich vielleicht 10 Dokumente einscannt, wäre mir das zu aufwändig wenn überhaupt möglich für mich.
em-pie
em-pie 19.01.2023 um 13:56:27 Uhr
Goto Top
Da ich nur ein Anwender bin der täglich vielleicht 10 Dokumente einscannt, wäre mir das zu aufwändig wenn überhaupt möglich für mich.


-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
MFPs sind für OCR zu lahm. Lass das eine Software wie den ABBYY FineReader (oder andere o. g.) machen. Als Ziel hinterlegst du im MFP dann deinen PC/ dein Laptop oder ein NAS. Ich hab @home auf dem Zielgerät einen Benutzer "Scan" angelegt, der ausschließlich Schreibrechte auf eine Freigabe hat. Deine oftware könnte den o. g. Ordnder dann einlesen und die PDFs per OCR "beackern"
-Konfigurierbare Vorgabe des Dateinamens.
kannst du in der Kurzwahl definieren (wenn ich mich recht erinnere)
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
Kannst du beim Scan selbst angeben
- leere Seiten Erkennung (nice to have)
Kann das MFP selbst
Survival62
Survival62 19.01.2023 um 14:47:21 Uhr
Goto Top
Hallo,
also, nach erstem (sehr) kurzen Test von VueScan, Omnipage und ScanIt bin ich bei VueScan am weitesten gekommen.

Abby Finereader
den habe ich erstmal beiseite gelegt, denn für meine Anwendung wäre mir ein Jährliches Abo von 99€ zuviel.

OmniPage
kommt schlecht mit meiner PC Umgebung klar. Notebook mit 13" UHD Screen (200%, Hauptscreen) und zwei weiteren 32" UHD Monitoren (100%) im Extended Desktop.
Schriftbild der Anwendung ist sehr klein und skaliert sich nicht um wenn ich die App auf meine 32" Monitore schiebe.
Zudem kam ich schon nach der Installation nicht klar damit und habe es nicht kapiert, wieso ich von OmniScan start und dann erstmal der Kyocera Treiber aufgerufen wird und ich von dort den Scan starte.
Außerdem sieht es so aus als wenn die Datei erst in ein zuerst eine OmniPage eigenes Format gescannt wird und man dann den Creator für die PDF Erstellung nutzt.
Dazu bin ich aber erstmal nicht gekommen, denn auf den ersten Blick sieht es für mich sehr Aufwändig aus, OmniPage für meine einfachen Belange einzurichten.

VueScan
hat meine Umgebung sofort erkannt und einen Patch dafür angeboten..
Auch hat es sofort den Kyocera Twain Treiber übernommen.
Ich konnte innerhalb kürzester Zeit einen Scan durchführen und ein durchsuchbares PDF erzeugen.
Zwar hakt es noch an ein paar stellen in der Konfigurierung, aber das sollte ich noch in den Griff bekommen.
Ein wichtiges Mako ist aber, dass die Texterkennung zu wünschen übrig lässt. Einfache Wörter wie z.B. "Hannover" oder auch "identisch" und Andere wurden nicht erkannt.

ScanIt
auch hier war der Erste Scan schnell erledigt.
Auf den ersten Blich ist die OCR dort besser als bei VueScan.
Derzeit mein Favorit.

Ich werde jetzt noch etwas mit ScanIt und VueScan herumtesten und mir dann vermutlich eine der Versionen zulegen.

Bitte beachtet, dass ich nur einfacher Anwender bin und von Skripten und Ähnlichem nur wenig Ahnung habe.
Für mich muss eine Software intuitiv nutzbar sein und die grundlegende Funktion muss schnell und komfortabel ausgeführt werden können.
VueScan hat gezeigt, dass es zumindest auf den ersten Blick
Klar, ein IT-ler muss natürlich viel tiefer in die Materie hinein um es in seine firmeneigene IT Infrastruktur einbinden zu können.
TomTomBon
TomTomBon 19.01.2023 um 16:04:24 Uhr
Goto Top
Moin,

Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC face-smile
Das Gerät hat normalerweise 512MB RAM.

Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...

Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/

Ist in der Community Variante kostenfrei.

Bin Ich selbst auch am überlegen face-smile
Crusher79
Crusher79 19.01.2023 aktualisiert um 20:27:33 Uhr
Goto Top
Hallo,

https://github.com/tesseract-ocr/tesseract

Problem ist die Automatik beim Ansteuern. Für alles andere gibt es auch kostenlose Tools die sich mit PowerShell oder anderen Programmiersprachen einfach aufmotzen lassen.

Tesseract wird - wo oben schon DMS reingeworfen wurde - von Bitfarm genommen.

Steuerung ist so eine Sache. Für Linux gibt es einige Tools. Man kann auch Scanner der nur unter Linux läuft mit TWAIN via LAN steuern.

Auf der "frickeligen" Variante gibt es auch zig Lösungen die kaum Wünsche übrig lassen.

Habe selber mal einen Fujutsu SnapScan via Linux angebunden, da kein Twain für Windows vorhanden war. Via LAN dann unter Windows gescannt. Ging. Unter Bitfarm hab ich es nicht richtig hinbekommen, danach einer Seite Schluß war. Der Vorgangn wurde nicht sauber beendet. Normal kann man mit den Geräten ja mehrere Seiten auf einmal scannen.

https://sourceforge.net/projects/nttwain/

Unter Linux musste ich nur USB 3.0 aktivieren, darum ging es am Anfang nicht. Ansonsten stand die Kommunikation.

Am schnellsten sind die Viecher unter USB 3. Viele Programme setzen nur Twain voraus. Sonst schaut man in die Röhre.

Oder als Kompromiss wäre kannst du auch mit der Hard- und Sofware arbeiten. Leere Blatt Erkennung oder umwandeln in PDF beherrschen viele Geräte schon. Wenn du so im Pulk hunderte Seite hast lassen die sich später mit Lösungen wie PowreShell und Tesseract o.ä. einfach abarbeiten.

Leere Seiten - Segen oder Fluch. Manche Konzept basieren immer noch auf Trennblättern. Wenn dir die Dokumente bekantn und der Aufbau immer gleich ist, gibt es zig Möglichkeiten. Wenn die erste Seite QR oder Barcode hat das als Trenner nehmen und die Seiten so zuammenfassen.

Gibt auch professionelle Software. Die Werten Bereiche oder alles aus. Machen aus QR Code den Dateinamen und kosten 3.500 Euro...


Ich hab mal Code Snippet geschrieben, der Dokument als Bild nimmt und in Kopie das ganze nur auf den unteren Bereich beschränkt. Anschließend Barcode ausgewertet.

War nur ein Schnellschuß. ging ganz gut!

PDF ist Segen und Fluch! Warum? Viele Programme werden Bilder aus: IMG, JPG. Da muss man PDF erst wieder hin konvertieren damit es läuft.

[BarcodeImaging]::FullScanPage([ref] $barcodes, $src, 150)

Hier wird 150 mal die Auswertung drüberlaufen gelassen, damit man gut Resultate erzielt. Fand ich ganz nett die DLL.

Als Bsp. war ein Buchrücken mit 3 Barcodes. Das Programm holte alle hervor.

Wir sind hier übrigens gerade unter Windows 10 + PowerShell + C-Sharp DLL.

Die größte Herausforerung ist die DLL anzusprechen. Unter $barcodes kommt nur ein Text mit dem Inhalt.

Umbenennen anhand von Barcode, Aufteilen, Bilder wieder in PDF zusammenführen und mit Tesseract Text Stream hinzufügen.

Geht auch für lau - kostenlos.....

using namespace System.Drawing;
Add-Type -AssemblyName System.Drawing;

[void] [Reflection.Assembly]::LoadWithPartialName("System.Windows.Forms")  

$testBild = "C:\temp\code_ls4.png-2.png"  
$src=[System.Drawing.Image]::FromFile($testBild)

$rect = New-Object System.Drawing.Rectangle(740,1500,400,250) # top, left, width, height of slice
$slice = $src.Clone($rect, $src.PixelFormat);
#$slice.Save("c:\temp\test_slice.png", "png"); 

$src = $slice;

[void] [System.Reflection.Assembly]::LoadFrom("c:\temp\BarcodeImaging.dll");      
$barcodes = @{}
[BarcodeImaging]::FullScanPage([ref] $barcodes, $src, 150)

$barcodes

Abarbeitung Din A4 Lieferschein nur für Barcode < 1 Sekunde.

ps_barcode_bsp

ls_bsp
Crusher79
Crusher79 19.01.2023 um 20:34:35 Uhr
Goto Top
Zitat von @TomTomBon:

Moin,

Kleine Einordnung des Gerätes:
Es kann einiges. Ist aber unter dem Einstiegsmodell des Büro-Arbeitens.
Vergleichbar mit einem i3 und 4GB RAM bei einem PC face-smile
Das Gerät hat normalerweise 512MB RAM.

Lass das Gerät in einen Hotfolder scannen und werkel ab da weiter.
Alles andere...

Wie wäre es mit einem DMS System?
https://www.ecodms.de/index.php/de/

Ist in der Community Variante kostenfrei.

Bin Ich selbst auch am überlegen face-smile

Ich liebäugel damit auch! Preise sehr transparent. Weit unter 100.000 Euro. Die große Konkurrenz liegt teils bei 60.000. Oder mit "unlashed" so 120.000 Euro.

Die API - das eig. interessante - wird wohl dann zu Buche schlagen. Da wird es ja erst lustig.

Bitfarm ist ähnlich unterwegs. Da fehlen mir aber ein paar Feature. Das Scan Programm kann Twain. Aber - wie in meinen anderen Post - können das nicht alle Geräte.

Hardware mit Hotfolder und dann in DMS - das wäre die einfachste Variante. Alternativ kann man es auch einfach selber bauen. Nur was dann? Haufen lesbarer PDF mit Namen aus dem Barcode? Kriegt man hin. Aber die Verwaltung ist wieder ein anderes Thema.

Ich finde viele Lösungen ziemlich teuer. In Kombination von DMS und Hardware kann man da deutlich sparen und hat professionelle Ergebnisse.
TomTomBon
TomTomBon 20.01.2023 um 08:49:10 Uhr
Goto Top
Moin

Kleine Einordnung zu TWAIN:
Alle Kyocera Geräte, inkl deren Töchter wie Triumph-Adler und UTAX, können TWAIN.
Mit der TWAIN Software 3.0 auch TWAIN 64bit. Was in meinen Augen kein Fortschritt derzeit ist.
Der Performance Unterschied wird woanders nivelliert.
Und DeFakto ist 64bit bei TWAIN noch nicht überall angekommen.
Ähnlich wie 64bit bei Win XP.
Performance mäßig WAR es besser.
Wenn man den besseren PC hatte....
Aber irgendetwas aus der 32bit Welt ans Laufen bekommen war.....
Nervig face-wink


@Crusher79
Wegen der Abarbeitung später habe Ich ein DMS eingeworfen.
Man sollte die Daten auch verwerten können face-wink
Und das eine ist eine vernünftige Ordner Struktur.
Das andere ist eine Suche durch indizierte Seiten..
ph1248
ph1248 02.02.2023 um 02:14:00 Uhr
Goto Top
Ein Hinweis: Als DMS für den Hausgebrauch käme paperless-ngx in Frage. Alle Dateien, die der Scanner in einem "consume" Ordner ablegt (PDF, TIFF, JPG, ...) würden via tessaract OCR als ein durchsuchbares PDF umgewandelt und archivert. Das anschließende Handling ist auch schon ganz ordentlich gelöst, und noch in vielversprechender Entwicklung.

Das ganze läuft z.B. als Docker-Container auf einem NAS. Weiteres hier:

https://github.com/paperless-ngx/paperless-ngx
AndreaZ
AndreaZ 20.02.2023 um 09:24:17 Uhr
Goto Top
Zitat von @Survival62:

z.B. hätte ich gerne:
-automatisches Einscannen und Abspeichern als durchsuchbares PDF (OCR) auf Knopfdruck (in der Software oder, falls überhaupt möglich, am Kyocera) in einen vordefinierten Netzwerkordner.
-Konfigurierbare Vorgabe des Dateinamens.
-Vorschlag zur Benennung der Datei. Einige Dokumentenscanner bieten solch eine Erkennung z.B. eines Firmennamens.
- leere Seiten Erkennung (nice to have)
Kennt jemand so eine Software oder auch Cloud-Lösung für Scanner über z.B. Twain?

Google mal Scan2PDF Pro kann das alles und kostet nicht viel..

Gruß
Crusher79
Crusher79 20.02.2023 um 10:23:26 Uhr
Goto Top
Zitat von @AndreaZ:

Google mal Scan2PDF Pro kann das alles und kostet nicht viel..

Gruß

Hmm sieht nett aus. Hab Erfahrung mit Tool aus NRW. Wurde damals Klinik über Drucker-Anbieter mit verkauft. Lagen bei 3.500 Euro? Wollten nur QR-Code einlesen und Datei umbenennen.

Für den Workflow bzw. das Tool 4-stelliger Betrag face-big-smile
Survival62
Survival62 20.02.2023 um 14:58:03 Uhr
Goto Top
Hallo,

ich hatte ja schon gesagt, dass ScanIt derzeit mein Favorit ist aber für mich noch ein paar Funktionen fehlen.
Aber es sieht so aus, dass das Tool Office-n-PDF aus dem gleichen Hause diese fehlenden Funktionen (uvm) beinhaltet.
z.B. OCR direkt ohne es extra aufzurufen und sogar leere Seiten Erkennung für duplex Scan.
Dies wurde mir vom Hersteller zumindest so mitgeteilt.
Für mich als SOHO Anwender ist der Preis von derzeit 98€ für die Standard-Edition durchaus ok.
Vor allem auch weil ich die Version auf meinem eigenen Büro PC aber auch auf meinem Privat PC mit dem gleichen Login/Account nutzen darf.
Leider habe ich bisher noch nicht die Zeit gefunden das Tool zu testen, werde es aber in kürze versuchen.

Gruß
Christian
AndreaZ
AndreaZ 22.02.2023 um 07:57:10 Uhr
Goto Top
Zitat von @Crusher79:

Zitat von @AndreaZ:

Google mal Scan2PDF Pro kann das alles und kostet nicht viel..

Gruß

Hmm sieht nett aus. Hab Erfahrung mit Tool aus NRW. Wurde damals Klinik über Drucker-Anbieter mit verkauft. Lagen bei 3.500 Euro? Wollten nur QR-Code einlesen und Datei umbenennen.

Für den Workflow bzw. das Tool 4-stelliger Betrag face-big-smile

Ich glaube Du meinst was anderes.
Scan2PDF Pro kostet irgendwas um die 90.- Euro