[GastForen Programme Print/Bildbearbeitung Adobe InDesign Textdatei Importoption Zeichensatz Unicode

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 11:00
Beitrag # 1 von 13
Bewertung:
(12512 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).

Allerdings habe ich auf dem Mac Schwierigkeiten, UTF16-codierte Textdateien, die ich per Javaskript z.B. in einem Report geschrieben habe, in InDesign zu importieren, wenn im Inhalt des Reports Dateinamen mit Umlauten enthalten sind.

Nochmal langsam:
Keine Probleme, wenn Report ohne Umlaute geschrieben wird.
Keine Probleme, wenn Report mit über die Tastatur eingegebene Umlaute geschrieben wird.
Probleme, wenn im Report Umlaute enthalten sind, wie sie z.B. aus Dateinamen (verknüpfte Bilder) kommen.

Das hängt wahrscheinlich mit dem Problem zusammen, dass auf dem Mac ein 'ü' in einem Dateinamen als aus 'u' und dem Doppelpunkt (Diaresis) kombiniert erscheint.

Ich generiere den Report per JavaScript in eine UTF16-encodierte Textdatei.
Diese lässt sich in InDesign *dann* nicht öffnen, wenn ein solcher Umlaut enthalten ist.
Öffne ich diesen Report jedoch in BBEdit und sichere dort nochmals als UTF16, *dann* kann ich die Datei in InDesign problemlos öffnen.

Den Export habe ich mit folgendem Script vorgenommen:

Code
//writeLog ( 'Kübel' ); // Umlaut kombiniert aus 'u' und '̈' 
writeLog ( 'Kübel' ); // normaler Umlaut

function writeLog ( myData )
{
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}

(Den kombinierten Umlaut kann ich hier nicht wiedergeben.
Man kann den aber leicht einfügen: im Finder Datei mit Umlaut im Namen suchen und den Namen kopieren und im Skript oben statt 'Kübel' einfügen.)

Für das Encoding stehen mir folgende Formate zur Verfügung:

Code
US-ASCII, ASCII,ISO646-US,I SO-646.IRV:1991, ISO-IR-6,  
ANSI-X3.4-1968,CP367,IBM367,US,ISO646.1991-IRV
UCS-2,UCS2, ISO-10646-UCS-2
UCS2LE,UCS-2LE,ISO-10646-UCS-2LE
UCS2BE,UCS-2BE,ISO-10646-UCS-2BE
UCS-4,UCS4, ISO-10646-UCS-4
UCS4LE,UCS-4LE,ISO-10646-UCS-4LE
UCS4BE,UCS-4BE,ISO-10646-UCS-4BE
UTF-8,UTF8,UNICODE-1-1-UTF-8,UNICODE-2-0-UTF-8,X-UNICODE-2-0-UTF-8
UTF16,UTF-16,ISO-10646-UTF-16
UTF16LE,UTF-16LE,ISO-10646-UTF-16LE
UTF16BE,UTF-16BE,ISO-10646-UTF-16BE
CP1252,WINDOWS-1252,MS-ANSI
ISO-8859-1,ISO-8859-1,ISO-8859-1:1987,ISO-IR-100,LATIN1
MACINTOSH,X-MAC-ROMAN
BINARY


Bei der Wahl eines anderen Encodings als UTF oder BINARY wird der Report mit so einem kombinierten Umlaut gar nicht exportiert. Die Datei bleibt leer.
Der Export funktioniert mit allen UTF-Formaten und BINARY.
Der Import in InDesign schlägt aber bei allen gewählten UTF-Formaten fehl.
Es geht erst, wenn die Report-Datei in BBEdit geöffnet wird und nochmal explizit als UTF16 gespeichert wird.

Kann mir jemand sagen, wie ich die im UTF16-Format gespeicherte Text-Datei ohne den Umweg über BBEdit in InDesign platzieren kann?

Ich vermute, die Daten sollten vor dem Export aus InDesign dahingehend bereinigt werden, dass die kombinierten Umlaute durch die entsprechenden einfachen Unicode-Zeichen ersetzt werden.

Viele Grüße
Martin



(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 11:17 geändert)
X

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3139

25. Sep 2008, 11:30
Beitrag # 2 von 13
Beitrag ID: #367601
Bewertung:
(12500 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).



Hallo Martin,

ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 11:39
Beitrag # 3 von 13
Beitrag ID: #367606
Bewertung:
(12497 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bin einen Schritt weiter:

Kopiere ich im Finder einen umlauthaltigen Namen und füge den Inhalt der Zwischenablage in InDesign ein, dann kommt dort ein einfacher Umlaut an.
Füge ich den Inhalt der Zwischenablage im ExtendScript Toolkit ein, dann kommt dort ein kombinierter Umlaut an.

So auch, wenn ich den Namen (mit Umlaut) einer verknüpften Bilddatei per Skript auslese und in InDesign weiterverarbeite (irgendwo einfüge); auch hier kommt der kombinierte Umlaut an.

Es scheint also mit JavaScript zusammenzuhängen und nicht direkt mit InDesign.
M.W. besteht das Problem nicht über AppleScript.

Als Workaround dient mir nun folgender Prototyp, der die Umlaute bereinigt

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}


Im obigen Skript etwa so zu verwenden:

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}

writeLog ( 'Kübel' );

function writeLog ( myData )
{
myData = myData.cleanUmlaut();
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}


Die damit erzeugten Reports können nun auch in InDesign direkt importiert werden.

Ich vermute, dass beim Weg über BBEdit (öffnen und erneut im selben UTF16-Format sichern) unter der Hand die kombinierten Umlaute in die einfachen Umlaute konvertiert wurden.
Denn dort konnte ich die kombinierten Umlaute nach dem Öffnen nicht mehr 'ertasten'.

Nebenbei habe ich auch den Test mit Akzentkombinationen (áàéèóòúù) durchgeführt.
Hier scheint es die bei den Umlauten entdeckten Probleme nicht zu geben.

Danke für die Aufmerksamkeit. ;-)

Viele Grüße
Martin




als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 11:45
Beitrag # 4 von 13
Beitrag ID: #367610
Bewertung:
(12495 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bernd,

danke für Deine Antwort.
Aber ich vermute, das Problem hängt eher mit den 'aufgelösten' bzw. 'kombinierten' Umlauten zusammen, mit welchen InDesign beim Import nichts anfangen kann.

Zumindest nicht beim Import der Textdatei im UTF16-Format.
XML mit UTF-8 wäre noch zu prüfen.

Aber zu diesem Zweck müsste der Report erst in einem Textrahmen in der InDesign platziert und von dort aus exportiert werden. Das funktioniert auch direkt über den Export als TXT-Datei.

Und dieses temporäre Erstellen eines Textrahmens (und das Löschen danach) wollte ich vermeiden. Weil damit im InDesign-Dokument eine Änderung vorgenommen wird, auch wenn sonst nur analysiert und Daten gesammelt worden sind: Der Anwender würde nach Ausführung des Skripts gefragt, ob er das Dokument sichern möchte oder nicht. Manchmal ist das ein Problem.

Viele Grüße
Martin




als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 12:23
Beitrag # 5 von 13
Beitrag ID: #367632
Bewertung:
(12480 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.


Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.

Vielleicht sollte Adobe gelegentlich das Importformat präzisieren und nicht nur 'Unicode', sondern 'UTF-16' angeben und ggf. den Filter für das verbreitete UTF-8 ergänzen. Aber andere Dinge (wie z.B. Erweiterung der Fußnotenfunktion) haben natürlich Vorrang.

Viele Grüße
Martin




als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3139

25. Sep 2008, 12:36
Beitrag # 6 von 13
Beitrag ID: #367634
Bewertung:
(12477 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.



Hallo Martin,

ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist. Wieso musst du die XML erst in ID importieren, dann wieder exportieren, Rahmen löschen usw.? Was genau ist das, was du erreichen möchtest? Du kannst doch XML mit der gleichen Funktionalität wie eine Plain-Text-Datei importieren, sofern ein entsprechender Rahmen dafür zur Verfügung steht?

Schöne Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367632]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 13:02
Beitrag # 7 von 13
Beitrag ID: #367641
Bewertung:
(12467 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

> ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist.

Ich entwickle gerade ein Skript, das am Ende einen Report erzeugt.
Dabei habe ich festgestellt, dass kombinierte Umlaute, wie sie beim Auslesen von Dateinamen erfasst werden, beim Schreiben der Textdatei Probleme bereiten, wenn die Datei nicht im UTF-Format gesichert wird.

Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.

Bei diesen Tests hatte es mich überrascht, dass InDesign beim TXT-Import mit UTF-8 nichts anzufangen weiß. Und mit UTF-19 hat es wohl auch Schwierigkeiten, wenn die erwähnten kombinierten Umlaute in der TXT-Datei enthalten sind.
Keine Probleme hat InDesign mit dem XML-Import von XML-Dateien im UTF-8-Format.

Wenn Du so willst, war es eine Studie und ich habe in deren Verlauf immer wieder mal nachgefragt, ob mir denn keiner das Finden der Lösung etwas beschleunigen könnte.
Im Prinzip habe ich diese nun gefunden und weiß, wie mit dem Problem bei dieser konkreten Aufgabe umzugehen ist.

Danke.

Viele Grüße
Martin




als Antwort auf: [#367634]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3139

25. Sep 2008, 13:10
Beitrag # 8 von 13
Beitrag ID: #367644
Bewertung:
(12464 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.


Hallo Martin,

mir war nicht ganz klar, ob die erzeugte Report-Datei für eine konkrete Anwendung in ID gedacht war (d.h. der Report wird Teil eines InDesign-Dokumentes). In diesem Fall muss das ID-Dokument ja auch einen dafür vorgesehenen Platz besitzen, und diesem (Rahmen) kann der <report>-Tag einfach zugewiesen und letzterem automatisch einem Absatzformat zugeordnet werden.

Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367641]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 13:18
Beitrag # 9 von 13
Beitrag ID: #367645
Bewertung:
(12461 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)


Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)

Viele Grüße
Martin




als Antwort auf: [#367644]
(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 13:21 geändert)

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3139

25. Sep 2008, 13:35
Beitrag # 10 von 13
Beitrag ID: #367652
Bewertung:
(12455 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)


Hallo Martin,

ja, kann ich bestätigen, hab's gerade nochmal ausprobiert. Es funktionieren (mit einer Testdatei aus TextWrangler) nur die Encodings "Unicode UTF-16" und "Unicode UTF-16 Little Endian", alle anderen erzeugen rosa Kästchen. Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367645]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12346

25. Sep 2008, 17:34
Beitrag # 11 von 13
Beitrag ID: #367698
Bewertung:
(12407 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.


Am Anfang einer UTF-8 codierten Textdatei steht normalerweise ein BOM (Byte Order Mark = Bytereihenfolge-Markierung) anhand dem die Codierung der UTF-Datei festgestellt werden kann: http://de.wikipedia.org/wiki/Byte_Order_Mark

InDesign wird also diese Info auswerten.

Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).

Viele Grüße
Martin




als Antwort auf: [#367652]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3139

25. Sep 2008, 17:44
Beitrag # 12 von 13
Beitrag ID: #367699
Bewertung:
(12402 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).


Hallo Martin,

danke für die Info. Ich hatte das schon ausprobiert, die BBEdit/Textwrangler-Dateien ohne BOM führen in ID auch zu rosa Kästchen.

Schöne Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367698]

Textdatei Importoption Zeichensatz Unicode

truni
Beiträge gesamt: 98

22. Jul 2019, 12:09
Beitrag # 13 von 13
Beitrag ID: #571182
Bewertung:
(3023 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo zusammen, habe einen Workflow mit Apple Numbers gefunden, der auch gut geht (im Moment):

- XLSX öffnen
- Export als CSV, Textcodierung Unicode (UTF-16)
- Import in InDesign mit: Kommagetrennt, Unicode, PC

=)


als Antwort auf: [#367699]
X

Aktuell

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.

pdf-icon Hier eine kleine Anleitung hinsichtlich Bedeutung der auszufüllenden Formularfelder.

Veranstaltungen
02.11.2020 - 03.11.2020

Digicomp Academy AG, Limmatstrasse 50, 8005 Zürich
Montag, 02. Nov. 2020, 08.30 Uhr - Dienstag, 03. Nov. 2020, 17.00 Uhr

Kurs

Dieser Basic-Kurs ist der perfekte Einstieg in die Welt von InDesign, dem vielseitigen Layout-Programm. Sie lernen, wie InDesign aufgebaut ist, wie saubere Dokumente erstellt werden und wie man korrekt mit gelieferten InDesign-Projekten umgeht.

Preis: CHF 1'400.-
Dauer: 2 Tage

Nein

Organisator: Digicomp Academy AG

Kontaktinformation: Isil Günalp, E-Mailisil.guenalp AT digicomp DOT ch

https://www.digicomp.ch/weiterbildung/software-anwendungs-trainings/adobe-trainings/desktop-publishing/adobe-indesign-cc/kurs-indesign-cc-basic

Veranstaltungen
05.11.2020

Augmented Reality hat sich in den letzten Jahren rasant zu einer nachgefragten Technologie entwickelt.

Sitzungszimmer VSD in Bern - oder Online via ZOOM
Donnerstag, 05. Nov. 2020, 08.30 - 17.00 Uhr

Seminar

Print bietet ein haptisches Erlebnis und besticht noch immer durch seinen guten Ruf als Image-Träger. Und: Print kann mittels neuen Technologien wie Augmented Reality auch zum Türöffner in die digitale Welt werden, verschiedene Medien geschickt miteinander vernetzen und so ganz neue Perspektiven schaffen! Grundlagen und technologische Trends. Dieses Wissen ermöglicht Ihnen, spezielle Angebote und passende Produkte zu erschaffen für Ihre Kunden. Verpassen Sie nicht den Anschluss, investieren Sie ein wenig Zeit an diesem Tages-Seminar vom Donnerstag, 5. November 2020.

Aktuell planen wir dieses Seminar vor Ort - je nach Stand der Pandemie bieten wir dieses Seminar als ZOOM-Meeting Online an.

Ja

Organisator: publishingNETWORK und VSD

Kontaktinformation: René Theiler, E-Mailrene.theiler AT vsd DOT ch

https://www.vsd.ch/2020/10/01/seminar-augmented-reality-print-als-tueroeffner-in-die-digitale-welt/

Augmented Reality – Print als Türöffner in die digitale Welt

Neuste Foreneinträge


Erweiterungen in CC 2021 laufen nicht mehr

cPanel Datenbank Eintrag nicht möglich

Ich mochte E-Mail mit PHP senden

Formular / leere Options ausblenden

Farbeinstellungen zeigen falschen Einstellungsnamen

Bedingter Text

Hilfe: Text bei Absturz verschwunden, Endnoten noch da

Pages: geteilte Fußnoten

Alternativen zu Acrobat

Shortcut funktioniert nicht mehr
medienjobs