[GastForen PrePress allgemein Typographie Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Themen
Beiträge
Moderatoren
Letzter Beitrag

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

starspawn
Beiträge gesamt: 5

19. Feb 2020, 17:17
Beitrag # 1 von 6
Bewertung:
(186832 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Zusammen,

ich bin über ein komischen Phänomen gestolpert. Könnt ihr mir sagen woran das liegt?

Ich kopiere einen polnischen Text aus einem PDF und füge ihn irgendwo ein (z.B. Textedit)
Einige Sonderzeichen, z.B. das a oder e mit Schlenker unten (wird hier im Forum nicht angezeigt) werden hierbei ersetzt z.B. durch das "normale" a oder e. Andere wie das durchgestrichene L bleiben erhalten. Wenn ich aber in Acrobat in die Textbearbeitung gehe und dann den Text kopiere lassen sich alle Sonderzeichen normal kopieren und einfügen.

Kann mir jemand sagen woran das liegt? Ggf. Vielleicht sogar einen brauchbaren Workaround? (Der Kunde hat nur den reader)

Ich arbeite auf einem Mac, unser Kunde arbeitet in Windows und hat das Problem auch.
(Ich habe nur versucht das ganze zu rekonstruieren). Das Phänomen tritt mit aktiviertem und deaktiviertem Font (UTC) auf.

Lieben Gruß und danke für eure Hilfe schon mal!
Florian
X

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

JohanneS.
Beiträge gesamt: 1044

19. Feb 2020, 18:10
Beitrag # 2 von 6
Beitrag ID: #574203
Bewertung:
(186810 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Moin Florian,

ein wenig kann ich Dir erklären: Die beiden genannten Zeichen (a bzw. e mit Ogonek) sind eigene Zeichen und nicht aus dem jeweiligen Vokal und einem Akzent zusammengesetzt. Im PDF geht das, weil da die Schrift enthalten ist. Die Schrift des Zieldokuments hat sie wohl nicht.
L und l mit Schrägstrich sind Teil des üblichen Latin-Zeichensatzes, deswegen machen sie keine Probleme.
Was hilft? Die Schrift im Zieldokument muss die beiden Zeichen enthalten.

Grüße
Johannes


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

starspawn
Beiträge gesamt: 5

20. Feb 2020, 08:54
Beitrag # 3 von 6
Beitrag ID: #574206
Bewertung:
(186735 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Johannes, danke, aber das erklärt leider nicht mein Problem. Wie gesagt: Wenn ich über die Textbearbeitungsfunktion in Acrobat den Text kopiere sind die Buchstaben mit Ogonek ja vorhanden. Das ist in meinem Fall wohl keine Frage des Zieldokuments.

Besten Gruß
Florian


als Antwort auf: [#574203]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

bavella
Beiträge gesamt: 137

22. Mai 2020, 00:53
Beitrag # 4 von 6
Beitrag ID: #575405
Bewertung:
(179961 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Wenn es noch interessiert:

In Notepad++ (unter Windows) kann man im Menüpunkt Kodierung auf UTF8 umschalten. Wenn man danach den kopierten Text einfügt, sollten die Sonderzeichen erhalten bleiben.
In MS-Word bleiben die Sonderzeichen auch erhalten, abhängig vom Font. So enthält z.B. die Arial als Opentype u.a. die osteuropäischen Sonderzeichen, ebenso wie einige Kauffonts, die "Professional" oder "East" statt "Standard" in der Fontbezeichnung führen.

Zitat Wenn ich über die Textbearbeitungsfunktion in Acrobat den Text kopiere sind die Buchstaben mit Ogonek ja vorhanden

Wie stellen Sie das fest? In dem Sie den Text im gleichen PDF wieder einsetzen? Das funktioniert deshalb, weil dann auf den eingebetteten Font im PDF zurückgegriffen wird.
Wenn Sie den Text aber außerhalb des PDFs in einer anderen Anwendung einsetzen, dann besteht ja keine Verbindung mehr zum eingebetteten Font im PDF und es wird auf Fonts zurückgegtriffen, die vom OS angeboten werden. Die enthalten dann eben nicht immer die erweiterten osteuropäischen Sonderzeichen.

MfG
Simon


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

Uwe Laubender
Beiträge gesamt: 5046

22. Mai 2020, 13:20
Beitrag # 5 von 6
Beitrag ID: #575417
Bewertung:
(179850 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Florian,

könnte auch sein, dass im PDF das Zeichen nur als Position in der Liste der vorhandenen Glyphen definiert ist. Dann kannst Du immer ein falsches Ergebnis beim Einfügen aus der Zwischenablage bekommen.
*****
Mit herzlichem Gruß,
Uwe Laubender


als Antwort auf: [#574201]

Copy & Paste von Polnischen Texten aus PDFs -> Sonderzeichen gehen verloren

mk-will
Beiträge gesamt: 1191

22. Mai 2020, 14:02
Beitrag # 6 von 6
Beitrag ID: #575422
Bewertung:
(179841 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo, Florian,

auch wenn es schon ein paar Tage her ist.

Ein a mit Ogonek kann man auf zwei Arten in einer Schrift hinterlegen.

1. Es wird tatsächlich das "a mit Ogonek" als Glyphe vollständig gezeichnet und existiert damit tatsächlich in der Schrift.

2. An der Glyphenposition des "a mit Ogonek" wird die Information hinterlegt "nimm die Glyphe a und kombiniere sie mit der Glyphe Ogonek". Das Ogonek ist als eigenständige Glyphe in der Schrift hinterlegt.
Es gibt das "a mit Ogonek" also nur "virtuell".

In Fall 2 landet in der Zwischenablage kein a mit Ogonek, sondern die Info "nimm die Glyphe a und kombiniere sie mit der Glyphe Ogonek", mithin zwei Schrift-Positonsangaben.

Wenn Dein Zielprogramm eine solche Information zu einem zusammengesetzten Buchstaben nicht korrekt aus der Zwischenablage übernehmen kann, kann das passieren, was Du beschreibst: es kommt nur die erste Glyphe aus der Zwischenablage in Textedit an, das "a".

Gruß
Stephan


als Antwort auf: [#574206]
X

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
20.01.2022

Zoom Meeting
Donnerstag, 20. Jan. 2022, 08.21 - 08.22 Uhr

Vortrag

Die Neuerungen in Illustrator CC2022 sind sehr umfangreich. Vor allem im Bereich 3D hat Adobe hier einiges umgesetzt, was Grafiker lange vermisst haben. Monika Gause (http://www.gause.de), eine liebe Freundin der IDUG Stuttgart, wird uns einmal mehr Illustrator erklären und vermitteln, wie wir mit dem Funktionsumfang des Programmes unsere Ideen und Vorstellungen umsetzen können. Zudem erzählt sie uns von ihrer „36 Days of Type“ Challenge, bei der alle Buchstaben nur aus jeweils einem Ankerpunkt bestehen. Einen Vorgeschmack darauf könnt ihr auf Monikas Instagram- (https://www.instagram.com/vektorgarten) oder Behance-Account (https://www.behance.net/gallery/118643031/36-Days-of-Type-and-Anchor-Points) bestaunen.

Nein

Organisator: InDesign Usergroup Stuttgart

Kontaktinformation: Christoph Steffens, E-Mailidug AT satzkiste DOT de

idugs78.eventbrite.com

Neues in Illustrator CC2022
Veranstaltungen
14.02.2022

Zürich, Online
Montag, 14. Feb. 2022, 07.30 - 18.00 Uhr

Word Press / Digitalisierung / Selbständigkeit

Digitalisierung und KMU's in der Schweiz Leistungsfähig im Zeitalter der Digitalisierung Machine Learning Künstliche Intelligenz CRM Change Management Kommunikation im Betrieb Kommunikation digitale Medien Digitale Vertriebsmodelle

Ja

Organisator: B. Isik

Kontaktinformation: B. Isik / Daniela Lovric, E-Mailinfo AT snfa DOT ch

https://www.fernstudiumfitness.ch/website-mit-wix-erstellen/