hilfdirselbst.ch
Facebook Twitter gamper-media

PlugIns, XTensions und Knowhow: Publishing-Worker.com

Steffen Kernstock I
Beiträge: 105
7. Jun 2018, 13:27
Beitrag #1 von 1
Bewertung:
(51 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen

Automatisierte Dateibenamsung aus OCR-PDF


Liebes Forum,

folgende Arbeit würde ich gerne automatisieren:

1. Texterkennung eines gescannten Briefs (PDF, z.T. mehrseitig) mit OCR auf dem Mac (soweit mit Acrobat kein Problem!)
2. Extrahieren des Empfänger-Namens (Privatperson mit "Vorname(n) Nachname") aus dem Anschriftfeld (immer an der gleichen Stelle)
3. Extrahieren des Briefdatums (auch immer an der gleichen Stelle)
4. Sichern der Datei unter dem Namen "NachnameVornamen-Datum-Brief.pdf" (Datum in der Form "JJJJMMTT").

Ich weiß, dass professionelle Document-Management-Systeme das können, aber das wäre m.E. mit Kanonen auf Spatzen geschossen. Zumal diese Systeme nach meinem Kenntnisstand häufig dann die totale Kontrolle übernehmen.

Vielleicht gibts da eine kleine aber feine Shareware-Lösung, die nur das macht - aber aus Datenschutzgründen kein Online-Dienst.

Kennt da jemand was?

Vielen Dank im Voraus!

Steffen Top
 
X