josephusflavius
Goto Top

Privates Dokumenten-Management-System mit OCR + Browserzugriff

Guten Morgen Zusammen,

ich habe inzw. einige Tausend PDF Dateien (Rechnungen, Behördendokumente, Steuerunterlagen), die ich sinnvoll verwalten möchte.

Ich verwalte die PDF aktuell auf Nextcloud (bei Allinkl) . NC bietet mir aber zu wenig Funktionen. Kein OCR, kein Scanmodul, kein Filter, die freigegeben werden könnten, keine Dokumenten-Tags ...

Was für mich wichtig wäre:

- Die Lösung sollte Web- oder Appzugriff haben (also nicht nur auf einem Notebook o. ä. zugänglich sein )
- die importierten PDF Dateien, sollten via OCR durchsuchbar sein
- kostenlose Lösungen würde ich bevorzugen, muss aber nicht unbedingt sein. (preiswertes Abo ist auch OK)
- NAS (Synology) -Installationen würde ich bevorzugen, Cloud-Lösungen sind für mich aber nicht per se schlecht, wenn die Server zumindest in Europa sind.
- Die Software sollte eigenes Scan-Modul am Bord haben, damit ich mir die unnötigen Umwege durch externes Scanning vermeiden kann.
- Zumindest eine rudimentäre Groupware-Funktionalität müsste vorhanden sein, damit auch die Familie auf freigegebene Dokumente zugreifen kann.
- Verschlüsselung wäre schön, die PDFs sollen aber exportierbar bleiben, um "Vendor-Locking" zu vermeiden.

Falls jemand für sich selbst so etwas schon implementiert hat, bedanke ich mich für eine Empfehlung.

LG

Jofla

Content-ID: 667931

Url: https://administrator.de/contentid/667931

Ausgedruckt am: 26.09.2024 um 23:09 Uhr

Platypus
Platypus 06.09.2024 um 09:27:32 Uhr
Goto Top
Hallo,

zwei gut funktionierende Lösungen:
- https://docs.paperless-ngx.com/
- https://docspell.org/

Grüße
JosephusFlavius
JosephusFlavius 06.09.2024 um 09:36:26 Uhr
Goto Top
face-smile Vielen Dank für deine Rückmeldung.
NordicMike
NordicMike 06.09.2024 aktualisiert um 09:41:47 Uhr
Goto Top
Nicht jedes DMS passt zu jedem Unternehmen. Wenn man dann eines gefunden hat, kommt die nächste Hürde und man ist mit der OCR Erkenn-Qualität nicht einverstanden. Gibt es überhaupt das ultimative Schweizer Taschenmesser, bei dem alle Module perfekt passen?

Es ist ja nicht so, dass man sagen könnte: Bei dem DMS ist die OCR Erkennqualität "ausreichend", sondern, je besser, desto besser. Es kommen trotzdem immer noch ein paar Erkennungsfehler durch.

Deshalb würde ich in der Tat erwägen die einzelnen Funktionen mit getrennten Mitteln zu lösen, sie "müssen" ja nicht zusammen hängen.

OCR Erkennung mach ich deswegen gerne mit meinem Scanner, der ein gutes OCS bereits an Bord hat und eine durchsuchbare PDF erzeugt. Damit kommt jedes DMS klar.

Blöd nur, dass ich mir einen guten sparsamen und schnellen Multifunktionsdrucker dazu gekauft habe, der beim Scanner kein gutes OCR macht. Dafür habe ich eine kleine Omnipage Überwachungsinstanz auf dem Fileserver gebaut, die gescannte TIFFs in eine durchsuchbare PDF umwandeln, bevor sie an das DMS geschickt werden. Meines Erachtens kommt kein OCR Scanner oder DMS Programm mit integriertem OCR an die Erkennungsqualität von Omnipage ran. Die "kostenlosen" OCR Engines sowieso nicht.

Die Software sollte eigenes Scan-Modul am Bord haben
Scanner, Multifunktionsdrucker usw sollten immer einen Netzwerkanschluss haben und sollten den Scan mit einer Taste ins Netzwerk senden können. Irgendwelche Scanmodule verlangsamen den Vorgang und machen es unbequem. (<- nur eine Meinung, keine Belehrung) face-smile
JosephusFlavius
JosephusFlavius 06.09.2024 um 09:51:30 Uhr
Goto Top
Vielen Dank @NordicMike! face-smile
jsysde
jsysde 06.09.2024 um 11:00:18 Uhr
Goto Top
Moin.

+1 für paperless-ngx - läuft stabil und zuverlässig als Docker Container, bei mir auf ner Synology DS916+.
Bedienung/Nutzung via Web-GUI, keine App nötig. Wobei sich im Github-Universum auch passende Apps finden lassen.

Mobile Ansicht/Bearbeitung via Browser ist kein Problem. Das ein PDF-Dokument auf einem 6.x-Zoll kleinen Display eher mäßig zu lesen ist, kann man nun ja nicht der Software anlasten. face-wink

Cheers,
jsysde