Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Quick n Dirty OCR für Scanner nachrüsten mit OpenSource mitteln

Mitglied: NetzwerkDude

NetzwerkDude (Level 2) - Jetzt verbinden

12.02.2019, aktualisiert 13.02.2019, 1771 Aufrufe, 5 Danke

Abend,

wenn ihr Nerzwerkfähige MFPs habt und die leute wie blöd Sachen einscannen und sich dann beschweren das man in den Scans nicht volltext suchen kann, hier eine Idee:
Statt jedem User die feinheiten der OCR Methodik näherzubringen, direkt die gescannten Dateien abfangen, mit dem OpenSource Tool tesseract-ocr bearbeiten und dem User das fertige Dokument präsentieren.

Ausgangssituation, was ihr braucht:
Ein MPF / Scanner der die Scans als Multipage-TIFF auf einem Netzwerkshare ablegt
Ein Linux Server der zwei Shares bereitstellt (ShareA, ShareB z.B. via Samba) + auf dem tesseract-ocr in einer halbwegs aktuellen Version installiert ist.

HowTo:
1. Nun stellt man den Scanner so ein das er Dateien in guter Qualität (>= 300dpi für tesseract) auf Share A legt

2. Auf dem Server läuft folgendes Skript:
Das skript akzeptiert zwei Parameter, daher startet man es so:
3. User haben Zugriff auf Share B und bekommen dort ihre durchsuchbaren PDFs


Was dieses Skript nicht tut und wo es noch mangelt (Da Quick & Dirty):

- hat keinerlei fehlerhandling
- fest eingestellt auf deutsche sprache
- hat keinen DOS schutz, wenn der User 6000 Dateien gleichzeitig ablegt, wird der Server wohl schwer zu schwitzen haben
- die Scans werden nicht voraufbereitet, dabei wäre es eine gute Idee z.B. es vorher mit magick o.ä. zu begradigen + die farbtiefe zu reduzieren
Neue Wissensbeiträge
Netzwerkmanagement
How To Mikrotik Netinstall
Erfahrungsbericht von areanod vor 4 StundenNetzwerkmanagement

Jedes Mal wenn ich Netinstall längere Zeit nicht benutzt habe stolpere ich über die „Besonderheiten“ dieser Software. Das ist ...

Microsoft
Microsoft: LDAPS per Update als Default
Information von em-pie vor 4 StundenMicrosoft

Hallo, Microsoft wird mit einem der zukünftigen Updates LDAP auf LDAPS per Default umstellen. Admins von angebundenen Systemen die ...

Humor (lol)

Funny: Warum es immer schwieriger wird, die richtigen Produkte online zu finden

Information von Dilbert-MD vor 2 TagenHumor (lol)17 Kommentare

Wir befinden uns in der Rubrik "Off Topic - Humor" und in 15 Minuten ist Freitag. und ja, es ...

Windows Update
MS SQL Server Updates
Information von sabines vor 2 TagenWindows Update

Für 2012, 2014 und 2016 sind seit Dienstag wichtige Sicherheitsupdates verfügar, die eine remote, leicht auszunutzende Lücke im Reporting ...

Heiß diskutierte Inhalte
Server-Hardware
Lieferzeiten bei einem Server - kann das sein?
gelöst Frage von samet22Server-Hardware31 Kommentare

Hallo, ich hätte an diejenigen eine Frage welche innerhalb der letzten 6-12 Monate einen Server bestellt haben. Ich habe ...

Verschlüsselung & Zertifikate
SSL Zertifikat gekauft funktioniert aber nicht
Frage von TeKiLLa1895Verschlüsselung & Zertifikate19 Kommentare

Hi, Habe vor 2 Tagen mit einer CSR mir ein Zertifikat beantragt und auch bekommen. Jetzt passt aber der ...

Humor (lol)
Funny: Warum es immer schwieriger wird, die richtigen Produkte online zu finden
Information von Dilbert-MDHumor (lol)17 Kommentare

Wir befinden uns in der Rubrik "Off Topic - Humor" und in 15 Minuten ist Freitag. und ja, es ...

Netzwerke
Empfehlung für Etagenswitche - 48xGbE + 2-4xSFP+
Frage von Der-PhilNetzwerke16 Kommentare

Hallo! Ich bräuchte einige, neue Access-Switche. Anforderung ist: - Ausschließlich Layer-2 Betrieb - Gute Stabilität - 48 Gigabit Ports ...