[GastForen Programme Web/Internet PDF Grundlagen / Web / eForms Automatisierte Dateibenamsung aus OCR-PDF

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Web/Internet - Webdesign, eForms
Themen
Beiträge
Moderatoren
Letzter Beitrag

Automatisierte Dateibenamsung aus OCR-PDF

Steffen Kernstock
Beiträge gesamt: 105

7. Jun 2018, 13:27
Beitrag # 1 von 1
Bewertung:
(1468 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Liebes Forum,

folgende Arbeit würde ich gerne automatisieren:

1. Texterkennung eines gescannten Briefs (PDF, z.T. mehrseitig) mit OCR auf dem Mac (soweit mit Acrobat kein Problem!)
2. Extrahieren des Empfänger-Namens (Privatperson mit "Vorname(n) Nachname") aus dem Anschriftfeld (immer an der gleichen Stelle)
3. Extrahieren des Briefdatums (auch immer an der gleichen Stelle)
4. Sichern der Datei unter dem Namen "NachnameVornamen-Datum-Brief.pdf" (Datum in der Form "JJJJMMTT").

Ich weiß, dass professionelle Document-Management-Systeme das können, aber das wäre m.E. mit Kanonen auf Spatzen geschossen. Zumal diese Systeme nach meinem Kenntnisstand häufig dann die totale Kontrolle übernehmen.

Vielleicht gibts da eine kleine aber feine Shareware-Lösung, die nur das macht - aber aus Datenschutzgründen kein Online-Dienst.

Kennt da jemand was?

Vielen Dank im Voraus!

Steffen
X