Hallo,
wir haben von unserem Kunden ein PDF Dokument bekommen - mit dem Text soll ein Folder designt werden.
Leider können wir den Text nicht und nicht ordentlich extrahieren. Die "normale" herkömmliche Vorgangsweise, markieren, kopieren + einfügen, bringt beispielsweise folgendes Ergebnis:
Þ»· ˲º–´´»² ·³ Ì«²²»´ »²¬½¸»·¼»² Í»µ«²¼»²ò
Ü«®½¸ »·²» ¦»·¬»ºº·¦·»²¬ ¿¾´¿«º»²¼» Ô±¹·¬·µ ¼»®
묬«²¹³¿y²¿¸³»² µ†²²»² Ó»²½¸»²´»¾»² ¹»ó
®»¬¬»¬ô Ù»º¿¸®»² «³¹¿²¹»² «²¼ ¸±¸»® ³¿¬»®·»´´»®
ͽ¸¿¼»² ©·®µ¿³ ª»®¸·²¼»®¬ ©»®¼»²ò
(Der abgebildete Text im PDF ist normales Deutsch). Wir haben auch schon versucht das Dokument unter neuem Namen zu speichern, nochmals ein PDF zu machen, den Text zu exportieren, eine HTML-Datei zu erstellen und diese auszulesen - leider vergeblich. Der Text wird immer zum Zahlensalat.
Hat vielleicht jemand eine Idee was wir noch tun können - Vielen Dank
PS: Wir arbeiten auf Mac, Acrobat ist in Version 5 und 8 als Vollversion vorhanden.