[GastForen Programme Print/Bildbearbeitung Adobe InDesign Datenzusammenführung + diakritische Zeichen

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Datenzusammenführung + diakritische Zeichen

Ralf Hobirk
Beiträge gesamt: 5961

26. Mär 2016, 02:25
Beitrag # 1 von 11
Bewertung:
(5616 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo zusammen,

ich habe ein Problem bei der Datenzusammenführung. Ich habe eine OpenOffice-Tabelle, die ich als CSV mit Tab als Trennzeichen in UTF-8 speichere. Da InDesign bezüglich der Trennzeichen recht eingeschränkt ist, benenne ich die Datei in TXT um. Wenn ich sie in TextEdit öffne, werden alle diakritischen Zeichen korrekt dargestellt. Nach dem Import in InDesign sieht dies jedoch anders aus.

Da die Foren-Software die Zeichen nicht darstellt, sondern teilweise in Unicode umwandelt, hänge ich ein paar Beispiele als Screenshot an.

Hat jemand eine Idee, wo man hier was "schrauben" kann? Klar, ich kann mir jetzt schnell ein kleines Script basteln, das mit ein paar S&E-Routinen die Zeichen "glattbügelt". Aber das ist wohl nicht Sinn der Sache. Diakritische Zeichen sollten doch wohl glatt herüberkommen…

Ansonsten allen schon mal frohe Ostern!

Anhang:
diakritisch.png (26.5 KB)
X

Datenzusammenführung + diakritische Zeichen

WernerPerplies
Beiträge gesamt: 2762

26. Mär 2016, 06:37
Beitrag # 2 von 11
Beitrag ID: #548367
Bewertung:
(5575 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Guten Tag Ralf,

hast Du schon hiermit

erste Testversion von WpsCsvHandler

mal expermentiert?

Probiere mal die unterschiedlichen Encodings aus.

Es erstaunt mich, dass Du bei UTF-8 unterschiedliche Escape-Codes zu haben scheinst.

Hilfreich wäre es gewesen, wenn Du eine passende CSV-Datei zur Verfügung gestellt hättest.


als Antwort auf: [#548366]
(Dieser Beitrag wurde von WernerPerplies am 26. Mär 2016, 06:39 geändert)

Datenzusammenführung + diakritische Zeichen

Uwe Laubender
Beiträge gesamt: 5316

26. Mär 2016, 10:23
Beitrag # 3 von 11
Beitrag ID: #548369
Bewertung:
(5528 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Ralf,

probier mal in OpenOffice Calc die CSV-Datei als "Unicode" zu speichern.
Nicht als "Unicode(UTF8)", was das Default zu sein scheint.

Das sollte funktionieren.


als Antwort auf: [#548366]

Datenzusammenführung + diakritische Zeichen

Ralf Hobirk
Beiträge gesamt: 5961

26. Mär 2016, 13:05
Beitrag # 4 von 11
Beitrag ID: #548370
Bewertung:
(5483 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
@Uwe

Unicode hat überhaupt nichts gebracht, dabei kommen wieder andere Zeichen heraus.

@Werner

Der WpsCsvHandler tut das was er soll, alle Zeichen kommen korrekt. Den entscheidenden Tipp hast du aber in den Screenshots dazu in deinem Forum gegeben: InDesign möchte UTF-16. Ich habe daraufhin eine UTF-8-CSV in BBEDit geöffnet und als UTF-16 gespeichert. Das Ergebnis ist wie gewünscht ;-)

Was mich allerdings wundert:

Adobe sagt selbst, dass für die Datenzusammenführung entweder CSV-Dateien mit Komma als Trennzeichen verwendet werden können oder TXT-Dateien mit Tab als Trennzeichen. Da ich in den zu importierenden Daten Kommas verwenden muss, scheidet diese Variante als Trennzeichen aus. Deshalb verwende ich den Tab als Trennzeichen. Und – oh Wunder – InDesign importiert ohne Mucken auch Daten aus einer CSV mit Tab als Trennzeichen…

Problem (ohne Script) gelöst, danke euch beiden und nochmal frohe Ostern (und dicke Eier ;-))

Update: Das Speichern in UTF-16 geht auch in TextEdit, ich brauche also BBEdit überhaupt nicht zu bemühen.


als Antwort auf: [#548369]
(Dieser Beitrag wurde von Ralf Hobirk am 26. Mär 2016, 13:11 geändert)

Datenzusammenführung + diakritische Zeichen

kkauer
Beiträge gesamt: 661

26. Mär 2016, 13:50
Beitrag # 5 von 11
Beitrag ID: #548371
Bewertung:
(5447 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Ralf Hobirk ] Update: Das Speichern in UTF-16 geht auch in TextEdit, ich brauche also BBEdit überhaupt nicht zu bemühen.

LibreOffice kann direkt als UTF-16 speichern. OpenOffice bestimmt ebenfalls …


als Antwort auf: [#548370]

Datenzusammenführung + diakritische Zeichen

WernerPerplies
Beiträge gesamt: 2762

26. Mär 2016, 14:03
Beitrag # 6 von 11
Beitrag ID: #548372
Bewertung:
(5433 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Ralf,

freut mich, dass ich helfen konnte, mich interessiert jetzt nur warum Du einen Editor und nicht meinen CSV-Handler zur Konvertierung benutzt hast.

Der Weg über den Editor erscheint mir persönlich mühseliger zu sein.

Da hab ich doch noch etwas vergessen:

Zitat Was mich allerdings wundert:

Adobe sagt selbst, dass für die Datenzusammenführung entweder CSV-Dateien mit Komma als Trennzeichen verwendet werden können oder TXT-Dateien mit Tab als Trennzeichen. Da ich in den zu importierenden Daten Kommas verwenden muss, scheidet diese Variante als Trennzeichen aus. Deshalb verwende ich den Tab als Trennzeichen. Und – oh Wunder – InDesign importiert ohne Mucken auch Daten aus einer CSV mit Tab als Trennzeichen…


Wundert mich überhaupt nicht, ich behaupte mal, Du kannst auch .xyz als Extension verwenden.

Entscheidend ist, was drinsteht!


als Antwort auf: [#548370]
(Dieser Beitrag wurde von WernerPerplies am 26. Mär 2016, 14:07 geändert)

Datenzusammenführung + diakritische Zeichen

Ralf Hobirk
Beiträge gesamt: 5961

26. Mär 2016, 14:16
Beitrag # 7 von 11
Beitrag ID: #548373
Bewertung:
(5418 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Werner,

das "Konvertieren" im Editor geht deutlich schneller, als im CSV-Handler die Einstellungen vorzunehmen. Ich ziehe die CSV auf das Icon von TextEdit, mache ein Duplikat der Datei (Cmd+Shift+S), dann Cmd+S, UTF-16 auswählen und "Enter". Erledigt.

Es mag Quelldateien geben, bei denen der CSV-Handler durchaus Sinn macht, vor allem bei wechselnden Erstellern/Lieferanten. Ich erstelle die Quelldateien jedoch selbst.

@kkauer: Nein OpenOffice bietet maximal UTF-8, habe das Menü schon durchsucht.


als Antwort auf: [#548372]

Datenzusammenführung + diakritische Zeichen

WernerPerplies
Beiträge gesamt: 2762

26. Mär 2016, 15:04
Beitrag # 8 von 11
Beitrag ID: #548374
Bewertung:
(5390 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Ralf,
Zitat als im CSV-Handler die Einstellungen vorzunehmen


Zitat das "Konvertieren" im Editor geht deutlich schneller, als im CSV-Handler die Einstellungen vorzunehmen. Ich ziehe die CSV auf das Icon von TextEdit, mache ein Duplikat der Datei (Cmd+Shift+S), dann Cmd+S, UTF-16 auswählen und "Enter". Erledigt.

Ah ja, interessante Argumente.

Das mit den Einstellungen stimmt meines Erachtens nicht ganz, denn mindest einmal muss man ja wissen, welche Einstellungen man braucht, und dabei hilft der CSV-Handler.

Und weil sich der CSV-Handler sich alle Einstellungen inklusive dem letzten Pfad merkt, muss man bei unveränderten Einstellungen überhaupt keine weiteren Einstellungen vornehmen.

Und wenn sich etwas geändert hat, sollte man das direkt sehen.

Drag and Drop bietet er allerdings nicht.


als Antwort auf: [#548373]

Datenzusammenführung + diakritische Zeichen

kkauer
Beiträge gesamt: 661

26. Mär 2016, 17:27
Beitrag # 9 von 11
Beitrag ID: #548380
Bewertung:
(5312 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Ralf Hobirk ] @kkauer: Nein OpenOffice bietet maximal UTF-8, habe das Menü schon durchsucht.

In OpenOffice heißt das wohl nur "Unicode". Das hat Uwe aber oben™ schon vorgeschlagen und deine Tests waren nicht erfolgreich. Das verstehe ich nicht und kann es hier auch nicht nachvollziehen. Alle Varianten (OO: Unicode, LO und TE: Unicode [UTF-16]) erzeugen letztendlich einen "Little-endian UTF-16 Unicode text" und alle Varianten funktionieren in Indesigns DZ.


als Antwort auf: [#548373]
(Dieser Beitrag wurde von kkauer am 26. Mär 2016, 17:29 geändert)

Datenzusammenführung + diakritische Zeichen

Uwe Laubender
Beiträge gesamt: 5316

26. Mär 2016, 18:51
Beitrag # 10 von 11
Beitrag ID: #548383
Bewertung:
(5265 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Ja, so hätte ich mir das auch gedacht.
Ich habe mal die Gegenprobe mit TextWrangler gemacht:

1. OpenOffice 4.1.2 Calc-Datei als CSV-Datei mit Option "Unicode" gespeichert.

Option Text CSV (.csv)

Feldoptionen: Unicode
Feldtrenner: Tabulator
Texttrenner: "

[ ] Alle Textzellen zitieren
[x] Zellinhalte wie angezeigt

2. In TextWrangler geöffnet und im Speichern-Dialog für "Speichern Unter…" die genaue Version der Datei angeschaut:

Line Breaks: Unix (LF)
Encoding: Unicode (UTF-16 Little-Endian)

3. In InDesign CS6 v8.1.0 als Datenquelle importiert, die Optionen für den Datenquellimport anzeigen lassen:

Trennzeichen: Tabstop
Kodierung: Unicode
Plattform: PC

Unverändert so als Datenquelle geladen.

Alle verwendeten diakritischen Zeichen kamen gut im Export an.
Unter anderem:

\u0160 LATIN CAPITAL LETTER S WITH CARON
\u017D LATIN CAPITAL LETTER Z WITH CARON

Hier kann man mal ein paar kleine Testdateien von meinem Dropbox-Account runterladen:

https://www.dropbox.com/...-Diacritics.zip?dl=0


als Antwort auf: [#548380]

Datenzusammenführung + diakritische Zeichen

Ralf Hobirk
Beiträge gesamt: 5961

26. Mär 2016, 19:32
Beitrag # 11 von 11
Beitrag ID: #548384
Bewertung:
(5254 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Uwe,

das Stichwort war "Importoptionen" ;-) An die hatte ich nämlich nicht gedacht. Jetzt klappt es auch mit "Unicode" aus OpenOffice, womit demzufolge auch kkauer Recht hatte…

Also kein Konvertieren oder erneutes Speichern mehr. Sozusagen frisch aus OpenOffice in InDesign ;-)

Nochmal danke an alle!


als Antwort auf: [#548383]
X