[GastForen PrePress allgemein Typographie Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Themen
Beiträge
Moderatoren
Letzter Beitrag

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

starspawn
Beiträge gesamt: 5

19. Feb 2020, 17:17
Beitrag # 1 von 6
Bewertung:
(19669 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Zusammen,

ich bin über ein komischen Phänomen gestolpert. Könnt ihr mir sagen woran das liegt?

Ich kopiere einen polnischen Text aus einem PDF und füge ihn irgendwo ein (z.B. Textedit)
Einige Sonderzeichen, z.B. das a oder e mit Schlenker unten (wird hier im Forum nicht angezeigt) werden hierbei ersetzt z.B. durch das "normale" a oder e. Andere wie das durchgestrichene L bleiben erhalten. Wenn ich aber in Acrobat in die Textbearbeitung gehe und dann den Text kopiere lassen sich alle Sonderzeichen normal kopieren und einfügen.

Kann mir jemand sagen woran das liegt? Ggf. Vielleicht sogar einen brauchbaren Workaround? (Der Kunde hat nur den reader)

Ich arbeite auf einem Mac, unser Kunde arbeitet in Windows und hat das Problem auch.
(Ich habe nur versucht das ganze zu rekonstruieren). Das Phänomen tritt mit aktiviertem und deaktiviertem Font (UTC) auf.

Lieben Gruß und danke für eure Hilfe schon mal!
Florian
X

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

JohanneS.
Beiträge gesamt: 1001

19. Feb 2020, 18:10
Beitrag # 2 von 6
Beitrag ID: #574203
Bewertung:
(19647 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Moin Florian,

ein wenig kann ich Dir erklären: Die beiden genannten Zeichen (a bzw. e mit Ogonek) sind eigene Zeichen und nicht aus dem jeweiligen Vokal und einem Akzent zusammengesetzt. Im PDF geht das, weil da die Schrift enthalten ist. Die Schrift des Zieldokuments hat sie wohl nicht.
L und l mit Schrägstrich sind Teil des üblichen Latin-Zeichensatzes, deswegen machen sie keine Probleme.
Was hilft? Die Schrift im Zieldokument muss die beiden Zeichen enthalten.

Grüße
Johannes


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

starspawn
Beiträge gesamt: 5

20. Feb 2020, 08:54
Beitrag # 3 von 6
Beitrag ID: #574206
Bewertung:
(19572 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Johannes, danke, aber das erklärt leider nicht mein Problem. Wie gesagt: Wenn ich über die Textbearbeitungsfunktion in Acrobat den Text kopiere sind die Buchstaben mit Ogonek ja vorhanden. Das ist in meinem Fall wohl keine Frage des Zieldokuments.

Besten Gruß
Florian


als Antwort auf: [#574203]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

bavella
Beiträge gesamt: 128

22. Mai 2020, 00:53
Beitrag # 4 von 6
Beitrag ID: #575405
Bewertung:
(12798 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Wenn es noch interessiert:

In Notepad++ (unter Windows) kann man im Menüpunkt Kodierung auf UTF8 umschalten. Wenn man danach den kopierten Text einfügt, sollten die Sonderzeichen erhalten bleiben.
In MS-Word bleiben die Sonderzeichen auch erhalten, abhängig vom Font. So enthält z.B. die Arial als Opentype u.a. die osteuropäischen Sonderzeichen, ebenso wie einige Kauffonts, die "Professional" oder "East" statt "Standard" in der Fontbezeichnung führen.

Zitat Wenn ich über die Textbearbeitungsfunktion in Acrobat den Text kopiere sind die Buchstaben mit Ogonek ja vorhanden

Wie stellen Sie das fest? In dem Sie den Text im gleichen PDF wieder einsetzen? Das funktioniert deshalb, weil dann auf den eingebetteten Font im PDF zurückgegriffen wird.
Wenn Sie den Text aber außerhalb des PDFs in einer anderen Anwendung einsetzen, dann besteht ja keine Verbindung mehr zum eingebetteten Font im PDF und es wird auf Fonts zurückgegtriffen, die vom OS angeboten werden. Die enthalten dann eben nicht immer die erweiterten osteuropäischen Sonderzeichen.

MfG
Simon


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

Uwe Laubender
Beiträge gesamt: 4772

22. Mai 2020, 13:20
Beitrag # 5 von 6
Beitrag ID: #575417
Bewertung:
(12687 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Florian,

könnte auch sein, dass im PDF das Zeichen nur als Position in der Liste der vorhandenen Glyphen definiert ist. Dann kannst Du immer ein falsches Ergebnis beim Einfügen aus der Zwischenablage bekommen.
*****
Mit herzlichem Gruß,
Uwe Laubender


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

mk-will
Beiträge gesamt: 1175

22. Mai 2020, 14:02
Beitrag # 6 von 6
Beitrag ID: #575422
Bewertung:
(12678 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo, Florian,

auch wenn es schon ein paar Tage her ist.

Ein a mit Ogonek kann man auf zwei Arten in einer Schrift hinterlegen.

1. Es wird tatsächlich das "a mit Ogonek" als Glyphe vollständig gezeichnet und existiert damit tatsächlich in der Schrift.

2. An der Glyphenposition des "a mit Ogonek" wird die Information hinterlegt "nimm die Glyphe a und kombiniere sie mit der Glyphe Ogonek". Das Ogonek ist als eigenständige Glyphe in der Schrift hinterlegt.
Es gibt das "a mit Ogonek" also nur "virtuell".

In Fall 2 landet in der Zwischenablage kein a mit Ogonek, sondern die Info "nimm die Glyphe a und kombiniere sie mit der Glyphe Ogonek", mithin zwei Schrift-Positonsangaben.

Wenn Dein Zielprogramm eine solche Information zu einem zusammengesetzten Buchstaben nicht korrekt aus der Zwischenablage übernehmen kann, kann das passieren, was Du beschreibst: es kommt nur die erste Glyphe aus der Zwischenablage in Textedit an, das "a".

Gruß
Stephan


als Antwort auf: [#574206]
X

Aktuell

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
04.09.2020 - 05.03.2021

Digicomp Academy AG, Limmatstrasse 50, 8005 Zürich
Freitag, 04. Sept. 2020, 13.00 Uhr - Freitag, 05. März 2021, 12.00 Uhr

Lehrgang

Bilden Sie sich zum zertifizierten Publishing-Multimedia-Profi aus. Neben Fotografie und Video befassen Sie sich mit der Medienproduktion, digitalen Publikationen und dem Webdesign für Desktop- und mobile Endgeräte. Mit dem Abschluss «Publisher Professional – Profil «Multimedia» verliehen durch die Digicomp Academy AG, bestätigen Sie Ihre Praxiserfahrungen und Qualifizierung in den genannten Themengebieten gegenüber Ihrem Arbeitgeber sowie Ihren Kunden.

Preis: CHF 10'500.-
Dauer: 30 Tage (ca. 210 Lektionen) – Unterricht findet jeweils am Freitag von 13 - 19 Uhr und Samstag von 09 - 17 Uhr statt

Nein

Organisator: Digicomp Academy AG

Kontaktinformation: Isil Günalp, E-Mailisil.guenalp AT digicomp DOT ch

https://www.digicomp.ch/weiterbildung/software-anwendungs-trainings/adobe-trainings/publishing-lehrgaenge/lehrgang-publisher-professional-profil-multimedia

Veranstaltungen
22.09.2020 - 23.09.2020

Digicomp Academy AG, Basel, Bern oder virtuell
Dienstag, 22. Sept. 2020, 08.30 Uhr - Mittwoch, 23. Sept. 2020, 17.00 Uhr

Kurs

In diesem Basic-Kurs lernen Sie das Wichtigste über den Aufbau und die Funktionsweise von Photoshop. Zusammen mit den notwendigen Grundlagen von Farbenlehre bis Bildauflösung lernen Sie zudem die kreativen Möglichkeiten von Photoshop kennen.

Preis: CHF 1'400.-
Dauer: 2 Tage

Nein

Organisator: Digicomp Academy AG

Kontaktinformation: Isil Günalp, E-Mailisil.guenalp AT digicomp DOT ch

https://www.digicomp.ch/weiterbildung/software-anwendungs-trainings/adobe-trainings/desktop-publishing/adobe-photoshop-cc/kurs-adobe-photoshop-cc-basic

Neuste Foreneinträge


Problem mit der Verknüpfung von InDesign mit Excel

Indesign Fußnoten/Endnoten bei Buchfunktion

Suchen und Ersetzen in Arrays

Pfeil zurück geht nur im eingeloggten Zustand

Illustrator: Anker-Anzeige in Schrift

Automatische Farbmengenberechnung

Lüftergeräusch nach Installation von Catalina update 10.15.6

Tastatur-Kürzel in Dialogen tun nicht mehr

safaribookmarkssyncagent wurde unerwartet beendet Fehlermeldung geht nicht mehr weg

wie langen Text auf viele Seiten einfügen - erledigt
medienjobs