PhilleConnect
Webdesign
GradeMan
Download
GradeMan
DocMailer
SoundAnalysis
Physik-Formelsammlung
LinuxBlog

26.03.2014

Debian-Paket für 0.3.2

Ab sofort steht die neue Version als Debian-Paket zur Verfügung!

27.09.2013

Version 0.3.0

Nach über zwei Jahren gibt's endlich die neue Version!

Sie bringt neue Optionen: Die Anzahl der zu scannenden Seiten kann jetzt direkt angegeben werden, wenn keine Seiten- oder Dateioptionen angegeben werden fragt DocMailer nach jeder Seite nach ob noch eine gescannt werden soll.

Außerdem gibt es ein paar Bugfixes.

Bislang ist es noch ein Kommandozeilen-Programm, eine Benutzeroberfläche ist immernoch in Planung...

DocMailer

Dokumentenmanagement im eMail-Eingang

Schredder' dein Papier: Dein eMail-Postfach ist ab sofort dein einziger Posteingang, auch für Papierpost - gut archivierbar, durchsuchbar und eine allzu wohlbekannte Bedienung. Ohne kompliziertes Dokumentenmanagementsystem, ohne lästige Papierordner.

DocMailer ist ein kleines Python-Programm für Linux, welches die Arbeit mit Papierdokumenten deutlich vereinfacht.

Das Problem: Ein Dokument kann zwar gescannt oder abfotografiert werden. Auch das Mailen übernimmt der Scanner oft gerne. Normale Bilddateien sind aber nicht durchsuchbar, der Betreff der eMail oft nicht manuell einstellbar. Damit sind die Dokumente nicht mehr auffindbar. Für dieses Problem habe ich DocMailer geschrieben:

DocMailer scannt ein (mehrseitiges) Dokument, erkennt den Text aus dem Bild und schickt ihn in einer eMail an eine voreingestellte eMail-Adresse. Das Dokument wird dabei der eMail als pdf mit eingebettetem Text angehängt, die Betreffzeile ist frei wählbar mit dem Beginn "DocMailer: ". Alternativ zum Scannen kan DocMailer jedes denkbare Bild oder pdf als Ausgangsdokument verwenden.

Auch wenn OCR nach wie vor keine hundertprozentigen Ergebnisse liefert reicht es allemal, um die Dokumente durchsuchbar zu machen. Das Zuschicken per eMail sorgt dabei dafür, dass die Verwaltung der Dokumente nahtlos in den persönlichen Workflow integriert wird ohne ein kompliziertes Dokumentenmanagementsystem zu erlernen oder zu benötigen. Die frei definierbare Betreffzeile sichert auch bei schlechten OCR-Ergebnissen das Auffinden mit der Standartsuche des eMail-Clients. Der voreingestellte, einfarbige Schwarz/Weiß-Scan sorgt für extrem kleine Dateigrößen. Bei Bedarf kann aber natürlich auch in Graustufen, Farbe und anderen Auflösungen gescannt werden.

Bislang ist DocMailer ein Kommandozeilenprogramm, irgendwann folgt noch eine Benutzeroberfläche dazu.

Download DocMailer version 0.3.3

Abhängigkeiten

Bei der Installation des debian-Paketes sollten alle Abhängigkeiten automatisch installiert werden. (unten stehende Information ist damit veraltet)

 

DocMailer benötigt zur Zeit ImageMagick (zur Bildbearbeitung), sane (scannen) und cuneiform (als OCR-engine), sowie hocr2pdf (in Ubuntu im Paket exactimage) und python-argparse (ab Ubuntu 11.04 standart).

Um unter Ubuntu alle Abhängigkeiten zu installieren genügt es in einem Terminalfenster folgende Zeile einzugeben:

sudo apt-get install imagemagick sane-utils cuneiform exactimage python-argparse pdftk

26.03.2014

Aktuelle Version: Docmailer 0.3.2

Features:

Changelog von 0.3.1 vom 25.03.2014:

Changelog von 0.3.0:

Changelog von v. 0.2.1 vom 27.09.2013:

Changelog von v. 0.2.0 vom 5.3.2011:

Changelog von v. 0.1.0 vom 19.02.2011:

TODO

Diese Features stehen auf meiner TODO-Liste für DocMailer und dürften in der Reihenfolge in zukünftigen Versionen implementiert werden:

Rechtliche Einschätzung gescannter Dokumente

In der Wirtschaft ist es oft das Standardvorgehen: Dokumente werden gescannt, digital abgelegt und die originale vernichtet. Werden die Dokumente rechtsverbindlich benötigt stellt sich die Frage ob die digitale Kopie reicht.

Dies scheint in der Regel der Fall zu sein wie eine Studie zeigt:

http://www.heise.de/newsticker/meldung/Studie-Elektronische-Dokumente-als-Beweismittel-zulaessig-2036739.html

Ohne Garantie, aber ich persönlich schreddere auch (fast) alle Originale!