[GastForen Programme Print/Bildbearbeitung Adobe InDesign Textdatei Importoption Zeichensatz Unicode

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 11:00
Beitrag # 1 von 13
Bewertung:
(10474 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).

Allerdings habe ich auf dem Mac Schwierigkeiten, UTF16-codierte Textdateien, die ich per Javaskript z.B. in einem Report geschrieben habe, in InDesign zu importieren, wenn im Inhalt des Reports Dateinamen mit Umlauten enthalten sind.

Nochmal langsam:
Keine Probleme, wenn Report ohne Umlaute geschrieben wird.
Keine Probleme, wenn Report mit über die Tastatur eingegebene Umlaute geschrieben wird.
Probleme, wenn im Report Umlaute enthalten sind, wie sie z.B. aus Dateinamen (verknüpfte Bilder) kommen.

Das hängt wahrscheinlich mit dem Problem zusammen, dass auf dem Mac ein 'ü' in einem Dateinamen als aus 'u' und dem Doppelpunkt (Diaresis) kombiniert erscheint.

Ich generiere den Report per JavaScript in eine UTF16-encodierte Textdatei.
Diese lässt sich in InDesign *dann* nicht öffnen, wenn ein solcher Umlaut enthalten ist.
Öffne ich diesen Report jedoch in BBEdit und sichere dort nochmals als UTF16, *dann* kann ich die Datei in InDesign problemlos öffnen.

Den Export habe ich mit folgendem Script vorgenommen:

Code
//writeLog ( 'Kübel' ); // Umlaut kombiniert aus 'u' und '̈' 
writeLog ( 'Kübel' ); // normaler Umlaut

function writeLog ( myData )
{
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}

(Den kombinierten Umlaut kann ich hier nicht wiedergeben.
Man kann den aber leicht einfügen: im Finder Datei mit Umlaut im Namen suchen und den Namen kopieren und im Skript oben statt 'Kübel' einfügen.)

Für das Encoding stehen mir folgende Formate zur Verfügung:

Code
US-ASCII, ASCII,ISO646-US,I SO-646.IRV:1991, ISO-IR-6,  
ANSI-X3.4-1968,CP367,IBM367,US,ISO646.1991-IRV
UCS-2,UCS2, ISO-10646-UCS-2
UCS2LE,UCS-2LE,ISO-10646-UCS-2LE
UCS2BE,UCS-2BE,ISO-10646-UCS-2BE
UCS-4,UCS4, ISO-10646-UCS-4
UCS4LE,UCS-4LE,ISO-10646-UCS-4LE
UCS4BE,UCS-4BE,ISO-10646-UCS-4BE
UTF-8,UTF8,UNICODE-1-1-UTF-8,UNICODE-2-0-UTF-8,X-UNICODE-2-0-UTF-8
UTF16,UTF-16,ISO-10646-UTF-16
UTF16LE,UTF-16LE,ISO-10646-UTF-16LE
UTF16BE,UTF-16BE,ISO-10646-UTF-16BE
CP1252,WINDOWS-1252,MS-ANSI
ISO-8859-1,ISO-8859-1,ISO-8859-1:1987,ISO-IR-100,LATIN1
MACINTOSH,X-MAC-ROMAN
BINARY


Bei der Wahl eines anderen Encodings als UTF oder BINARY wird der Report mit so einem kombinierten Umlaut gar nicht exportiert. Die Datei bleibt leer.
Der Export funktioniert mit allen UTF-Formaten und BINARY.
Der Import in InDesign schlägt aber bei allen gewählten UTF-Formaten fehl.
Es geht erst, wenn die Report-Datei in BBEdit geöffnet wird und nochmal explizit als UTF16 gespeichert wird.

Kann mir jemand sagen, wie ich die im UTF16-Format gespeicherte Text-Datei ohne den Umweg über BBEdit in InDesign platzieren kann?

Ich vermute, die Daten sollten vor dem Export aus InDesign dahingehend bereinigt werden, dass die kombinierten Umlaute durch die entsprechenden einfachen Unicode-Zeichen ersetzt werden.

Viele Grüße
Martin



(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 11:17 geändert)
X

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3051

25. Sep 2008, 11:30
Beitrag # 2 von 13
Beitrag ID: #367601
Bewertung:
(10462 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).



Hallo Martin,

ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 11:39
Beitrag # 3 von 13
Beitrag ID: #367606
Bewertung:
(10459 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bin einen Schritt weiter:

Kopiere ich im Finder einen umlauthaltigen Namen und füge den Inhalt der Zwischenablage in InDesign ein, dann kommt dort ein einfacher Umlaut an.
Füge ich den Inhalt der Zwischenablage im ExtendScript Toolkit ein, dann kommt dort ein kombinierter Umlaut an.

So auch, wenn ich den Namen (mit Umlaut) einer verknüpften Bilddatei per Skript auslese und in InDesign weiterverarbeite (irgendwo einfüge); auch hier kommt der kombinierte Umlaut an.

Es scheint also mit JavaScript zusammenzuhängen und nicht direkt mit InDesign.
M.W. besteht das Problem nicht über AppleScript.

Als Workaround dient mir nun folgender Prototyp, der die Umlaute bereinigt

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}


Im obigen Skript etwa so zu verwenden:

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}

writeLog ( 'Kübel' );

function writeLog ( myData )
{
myData = myData.cleanUmlaut();
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}


Die damit erzeugten Reports können nun auch in InDesign direkt importiert werden.

Ich vermute, dass beim Weg über BBEdit (öffnen und erneut im selben UTF16-Format sichern) unter der Hand die kombinierten Umlaute in die einfachen Umlaute konvertiert wurden.
Denn dort konnte ich die kombinierten Umlaute nach dem Öffnen nicht mehr 'ertasten'.

Nebenbei habe ich auch den Test mit Akzentkombinationen (áàéèóòúù) durchgeführt.
Hier scheint es die bei den Umlauten entdeckten Probleme nicht zu geben.

Danke für die Aufmerksamkeit. ;-)

Viele Grüße
Martin




als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 11:45
Beitrag # 4 von 13
Beitrag ID: #367610
Bewertung:
(10457 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bernd,

danke für Deine Antwort.
Aber ich vermute, das Problem hängt eher mit den 'aufgelösten' bzw. 'kombinierten' Umlauten zusammen, mit welchen InDesign beim Import nichts anfangen kann.

Zumindest nicht beim Import der Textdatei im UTF16-Format.
XML mit UTF-8 wäre noch zu prüfen.

Aber zu diesem Zweck müsste der Report erst in einem Textrahmen in der InDesign platziert und von dort aus exportiert werden. Das funktioniert auch direkt über den Export als TXT-Datei.

Und dieses temporäre Erstellen eines Textrahmens (und das Löschen danach) wollte ich vermeiden. Weil damit im InDesign-Dokument eine Änderung vorgenommen wird, auch wenn sonst nur analysiert und Daten gesammelt worden sind: Der Anwender würde nach Ausführung des Skripts gefragt, ob er das Dokument sichern möchte oder nicht. Manchmal ist das ein Problem.

Viele Grüße
Martin




als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 12:23
Beitrag # 5 von 13
Beitrag ID: #367632
Bewertung:
(10442 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.


Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.

Vielleicht sollte Adobe gelegentlich das Importformat präzisieren und nicht nur 'Unicode', sondern 'UTF-16' angeben und ggf. den Filter für das verbreitete UTF-8 ergänzen. Aber andere Dinge (wie z.B. Erweiterung der Fußnotenfunktion) haben natürlich Vorrang.

Viele Grüße
Martin




als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3051

25. Sep 2008, 12:36
Beitrag # 6 von 13
Beitrag ID: #367634
Bewertung:
(10439 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.



Hallo Martin,

ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist. Wieso musst du die XML erst in ID importieren, dann wieder exportieren, Rahmen löschen usw.? Was genau ist das, was du erreichen möchtest? Du kannst doch XML mit der gleichen Funktionalität wie eine Plain-Text-Datei importieren, sofern ein entsprechender Rahmen dafür zur Verfügung steht?

Schöne Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367632]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 13:02
Beitrag # 7 von 13
Beitrag ID: #367641
Bewertung:
(10429 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

> ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist.

Ich entwickle gerade ein Skript, das am Ende einen Report erzeugt.
Dabei habe ich festgestellt, dass kombinierte Umlaute, wie sie beim Auslesen von Dateinamen erfasst werden, beim Schreiben der Textdatei Probleme bereiten, wenn die Datei nicht im UTF-Format gesichert wird.

Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.

Bei diesen Tests hatte es mich überrascht, dass InDesign beim TXT-Import mit UTF-8 nichts anzufangen weiß. Und mit UTF-19 hat es wohl auch Schwierigkeiten, wenn die erwähnten kombinierten Umlaute in der TXT-Datei enthalten sind.
Keine Probleme hat InDesign mit dem XML-Import von XML-Dateien im UTF-8-Format.

Wenn Du so willst, war es eine Studie und ich habe in deren Verlauf immer wieder mal nachgefragt, ob mir denn keiner das Finden der Lösung etwas beschleunigen könnte.
Im Prinzip habe ich diese nun gefunden und weiß, wie mit dem Problem bei dieser konkreten Aufgabe umzugehen ist.

Danke.

Viele Grüße
Martin




als Antwort auf: [#367634]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3051

25. Sep 2008, 13:10
Beitrag # 8 von 13
Beitrag ID: #367644
Bewertung:
(10426 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.


Hallo Martin,

mir war nicht ganz klar, ob die erzeugte Report-Datei für eine konkrete Anwendung in ID gedacht war (d.h. der Report wird Teil eines InDesign-Dokumentes). In diesem Fall muss das ID-Dokument ja auch einen dafür vorgesehenen Platz besitzen, und diesem (Rahmen) kann der <report>-Tag einfach zugewiesen und letzterem automatisch einem Absatzformat zugeordnet werden.

Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367641]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 13:18
Beitrag # 9 von 13
Beitrag ID: #367645
Bewertung:
(10423 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)


Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)

Viele Grüße
Martin




als Antwort auf: [#367644]
(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 13:21 geändert)

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3051

25. Sep 2008, 13:35
Beitrag # 10 von 13
Beitrag ID: #367652
Bewertung:
(10417 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)


Hallo Martin,

ja, kann ich bestätigen, hab's gerade nochmal ausprobiert. Es funktionieren (mit einer Testdatei aus TextWrangler) nur die Encodings "Unicode UTF-16" und "Unicode UTF-16 Little Endian", alle anderen erzeugen rosa Kästchen. Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.

Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367645]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12089

25. Sep 2008, 17:34
Beitrag # 11 von 13
Beitrag ID: #367698
Bewertung:
(10369 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.


Am Anfang einer UTF-8 codierten Textdatei steht normalerweise ein BOM (Byte Order Mark = Bytereihenfolge-Markierung) anhand dem die Codierung der UTF-Datei festgestellt werden kann: http://de.wikipedia.org/wiki/Byte_Order_Mark

InDesign wird also diese Info auswerten.

Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).

Viele Grüße
Martin




als Antwort auf: [#367652]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3051

25. Sep 2008, 17:44
Beitrag # 12 von 13
Beitrag ID: #367699
Bewertung:
(10364 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).


Hallo Martin,

danke für die Info. Ich hatte das schon ausprobiert, die BBEdit/Textwrangler-Dateien ohne BOM führen in ID auch zu rosa Kästchen.

Schöne Grüße,
Bernd
---------------
cavete fenestras et nubes!


als Antwort auf: [#367698]

Textdatei Importoption Zeichensatz Unicode

truni
Beiträge gesamt: 98

22. Jul 2019, 12:09
Beitrag # 13 von 13
Beitrag ID: #571182
Bewertung:
(985 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo zusammen, habe einen Workflow mit Apple Numbers gefunden, der auch gut geht (im Moment):

- XLSX öffnen
- Export als CSV, Textcodierung Unicode (UTF-16)
- Import in InDesign mit: Kommagetrennt, Unicode, PC

=)


als Antwort auf: [#367699]
X

Aktuell

Veranstaltungskalender

Hier können Sie Ihre Anlässe eintragen, welche einen Zusammenhang mit den Angeboten von HilfDirSelbst.ch wie z.B. Adobe InDesign, Photoshop, Illustrator, PDF, Pitstop, Affinity, Marketing, SEO, Büro- und Rechtsthemen etc. haben. Die Einträge werden moderiert freigeschaltet. Dies wird werktags üblicherweise innert 24 Stunden erfolgen.
pdf-icon Hier eine kleine Anleitung.

Veranstaltungen
21.08.2019

Affinity Photo, Affinity Designer und Affinity Publisher

Schulungsraum von pre2media – Dammstrasse 8, 8610 Uster
Mittwoch, 21. Aug. 2019, 09.00 - 17.00 Uhr

Referat

Alle reden davon – wir zeigen ihnen kompakt was in den einzelnen ­Programmen wirklich steckt. Sind die Programme von Affinity – bereits heute – eine Alternative zu den Adobe-Programmen? Was versteht ­Affinity unter StudioLink und der vollständigen Integration der Affinity-Apps. Sie können jedes Affinity-Referat einzeln buchen. Oder alle drei Referate zusammen, bequem an einem Tag.

Mittwoch, 21. August 2019
9.00 bis 11.00 Affinity Photo Bildbearbeitung CHF 90.00
13.00 bis 15.00 Affinity Designer Grafikdesign CHF 90.00
15.00 bis 17.00 Affinity Publisher Layoutprogramm CHF 90.00
Alle drei Affinity Programme zusammen (6 Lektionen) CHF 220.00

Diese Referate werden auch noch am Fr. 13. September und am Di. 22. Oktober 2019 durchgeführt.

Ja

Organisator: pre2media gmbh, Dammstrasse 8, 8610 Uster, info@pre2media.ch, www.pre2media.ch

Kontaktinformation: Peter Jäger oder Roger Thurnherr, E-Mailinfo AT pre2media DOT ch

https://www.pre2media.ch/-1/de/kurse/affinity-referat/

Affinity-Referat bei pre2media
Veranstaltungen
22.08.2019

Impressed GmbH, Hamburg
Donnerstag, 22. Aug. 2019, 10.00 - 10.30 Uhr

Webinar

Wir stellen Ihnen in diesem kostenlosen ca. halbstündigen Webinar das neue Enfocus Switch PDF Review Modul zur Freigabe von PDF-Druckdaten vor.

Ja

Organisator: Impressed GmbH

Kontaktinformation: Detlef Grimm, E-Mailschulungen AT impressed DOT de

https://www.impressed.de/schulung.php?c=sDetail&sid=250

Enfocus Switch PDF Review Modul