Connect failed: Connection timed out

[GastForen Programme Print/Bildbearbeitung Adobe InDesign Textdatei Importoption Zeichensatz Unicode

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 11:00
Beitrag # 1 von 13
Bewertung:
(17998 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).

Allerdings habe ich auf dem Mac Schwierigkeiten, UTF16-codierte Textdateien, die ich per Javaskript z.B. in einem Report geschrieben habe, in InDesign zu importieren, wenn im Inhalt des Reports Dateinamen mit Umlauten enthalten sind.

Nochmal langsam:
Keine Probleme, wenn Report ohne Umlaute geschrieben wird.
Keine Probleme, wenn Report mit über die Tastatur eingegebene Umlaute geschrieben wird.
Probleme, wenn im Report Umlaute enthalten sind, wie sie z.B. aus Dateinamen (verknüpfte Bilder) kommen.

Das hängt wahrscheinlich mit dem Problem zusammen, dass auf dem Mac ein 'ü' in einem Dateinamen als aus 'u' und dem Doppelpunkt (Diaresis) kombiniert erscheint.

Ich generiere den Report per JavaScript in eine UTF16-encodierte Textdatei.
Diese lässt sich in InDesign *dann* nicht öffnen, wenn ein solcher Umlaut enthalten ist.
Öffne ich diesen Report jedoch in BBEdit und sichere dort nochmals als UTF16, *dann* kann ich die Datei in InDesign problemlos öffnen.

Den Export habe ich mit folgendem Script vorgenommen:

Code
//writeLog ( 'Kübel' ); // Umlaut kombiniert aus 'u' und '̈' 
writeLog ( 'Kübel' ); // normaler Umlaut

function writeLog ( myData )
{
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}

(Den kombinierten Umlaut kann ich hier nicht wiedergeben.
Man kann den aber leicht einfügen: im Finder Datei mit Umlaut im Namen suchen und den Namen kopieren und im Skript oben statt 'Kübel' einfügen.)

Für das Encoding stehen mir folgende Formate zur Verfügung:

Code
US-ASCII, ASCII,ISO646-US,I SO-646.IRV:1991, ISO-IR-6,  
ANSI-X3.4-1968,CP367,IBM367,US,ISO646.1991-IRV
UCS-2,UCS2, ISO-10646-UCS-2
UCS2LE,UCS-2LE,ISO-10646-UCS-2LE
UCS2BE,UCS-2BE,ISO-10646-UCS-2BE
UCS-4,UCS4, ISO-10646-UCS-4
UCS4LE,UCS-4LE,ISO-10646-UCS-4LE
UCS4BE,UCS-4BE,ISO-10646-UCS-4BE
UTF-8,UTF8,UNICODE-1-1-UTF-8,UNICODE-2-0-UTF-8,X-UNICODE-2-0-UTF-8
UTF16,UTF-16,ISO-10646-UTF-16
UTF16LE,UTF-16LE,ISO-10646-UTF-16LE
UTF16BE,UTF-16BE,ISO-10646-UTF-16BE
CP1252,WINDOWS-1252,MS-ANSI
ISO-8859-1,ISO-8859-1,ISO-8859-1:1987,ISO-IR-100,LATIN1
MACINTOSH,X-MAC-ROMAN
BINARY


Bei der Wahl eines anderen Encodings als UTF oder BINARY wird der Report mit so einem kombinierten Umlaut gar nicht exportiert. Die Datei bleibt leer.
Der Export funktioniert mit allen UTF-Formaten und BINARY.
Der Import in InDesign schlägt aber bei allen gewählten UTF-Formaten fehl.
Es geht erst, wenn die Report-Datei in BBEdit geöffnet wird und nochmal explizit als UTF16 gespeichert wird.

Kann mir jemand sagen, wie ich die im UTF16-Format gespeicherte Text-Datei ohne den Umweg über BBEdit in InDesign platzieren kann?

Ich vermute, die Daten sollten vor dem Export aus InDesign dahingehend bereinigt werden, dass die kombinierten Umlaute durch die entsprechenden einfachen Unicode-Zeichen ersetzt werden.

(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 11:17 geändert)
X

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3342

25. Sep 2008, 11:30
Beitrag # 2 von 13
Beitrag ID: #367601
Bewertung:
(17986 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Hallo,

InDesign hat einen Importfilter für Unicode-Textdateien:
Importoptionen/Zeichensatz: Unicode

Nach einigem Hin- und Herprobieren habe ich herausgefunden, dass damit UTF16 gemeint ist (und nicht UTF8 oder UTF7).



Hallo Martin,

ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.

Grüße,
Bernd


als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 11:39
Beitrag # 3 von 13
Beitrag ID: #367606
Bewertung:
(17983 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bin einen Schritt weiter:

Kopiere ich im Finder einen umlauthaltigen Namen und füge den Inhalt der Zwischenablage in InDesign ein, dann kommt dort ein einfacher Umlaut an.
Füge ich den Inhalt der Zwischenablage im ExtendScript Toolkit ein, dann kommt dort ein kombinierter Umlaut an.

So auch, wenn ich den Namen (mit Umlaut) einer verknüpften Bilddatei per Skript auslese und in InDesign weiterverarbeite (irgendwo einfüge); auch hier kommt der kombinierte Umlaut an.

Es scheint also mit JavaScript zusammenzuhängen und nicht direkt mit InDesign.
M.W. besteht das Problem nicht über AppleScript.

Als Workaround dient mir nun folgender Prototyp, der die Umlaute bereinigt

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}


Im obigen Skript etwa so zu verwenden:

Code
String.prototype.cleanUmlaut = function ()  
{
var s = this;
s = s.replace( /a\u0308/g, 'ä');
s = s.replace( /o\u0308/g, 'ö');
s = s.replace( /u\u0308/g, 'ü');
s = s.replace( /A\u0308/g, 'Ä');
s = s.replace( /O\u0308/g, 'Ö');
s = s.replace( /U\u0308/g, 'Ü');
return s;
}

writeLog ( 'Kübel' );

function writeLog ( myData )
{
myData = myData.cleanUmlaut();
var f = new File( '~/Desktop/logfile.txt' );
f.open( 'w' );
f.encoding = 'UTF16';
f.writeln ( myData );
f.close();
}


Die damit erzeugten Reports können nun auch in InDesign direkt importiert werden.

Ich vermute, dass beim Weg über BBEdit (öffnen und erneut im selben UTF16-Format sichern) unter der Hand die kombinierten Umlaute in die einfachen Umlaute konvertiert wurden.
Denn dort konnte ich die kombinierten Umlaute nach dem Öffnen nicht mehr 'ertasten'.

Nebenbei habe ich auch den Test mit Akzentkombinationen (áàéèóòúù) durchgeführt.
Hier scheint es die bei den Umlauten entdeckten Probleme nicht zu geben.

Danke für die Aufmerksamkeit. ;-)


als Antwort auf: [#367585]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 11:45
Beitrag # 4 von 13
Beitrag ID: #367610
Bewertung:
(17981 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Bernd,

danke für Deine Antwort.
Aber ich vermute, das Problem hängt eher mit den 'aufgelösten' bzw. 'kombinierten' Umlauten zusammen, mit welchen InDesign beim Import nichts anfangen kann.

Zumindest nicht beim Import der Textdatei im UTF16-Format.
XML mit UTF-8 wäre noch zu prüfen.

Aber zu diesem Zweck müsste der Report erst in einem Textrahmen in der InDesign platziert und von dort aus exportiert werden. Das funktioniert auch direkt über den Export als TXT-Datei.

Und dieses temporäre Erstellen eines Textrahmens (und das Löschen danach) wollte ich vermeiden. Weil damit im InDesign-Dokument eine Änderung vorgenommen wird, auch wenn sonst nur analysiert und Daten gesammelt worden sind: Der Anwender würde nach Ausführung des Skripts gefragt, ob er das Dokument sichern möchte oder nicht. Manchmal ist das ein Problem.


als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 12:23
Beitrag # 5 von 13
Beitrag ID: #367632
Bewertung:
(17966 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: ich bin mir nicht ganz sicher, aber wie wäre es, wenn du den Report als XML mit einem einzigen Element <report> generierst? Dann wäre doch UTF-8 das Encoding der Wahl, das auch InDesign korrekt importieren müsste.


Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.

Vielleicht sollte Adobe gelegentlich das Importformat präzisieren und nicht nur 'Unicode', sondern 'UTF-16' angeben und ggf. den Filter für das verbreitete UTF-8 ergänzen. Aber andere Dinge (wie z.B. Erweiterung der Fußnotenfunktion) haben natürlich Vorrang.


als Antwort auf: [#367601]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3342

25. Sep 2008, 12:36
Beitrag # 6 von 13
Beitrag ID: #367634
Bewertung:
(17963 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Das mit dem XML-Export und XML-Import funktioniert - im UTF-8.
Sogar die kombinierten Umlaute kommen so, wie sie vor dem Export umgesetzt waren, wieder zurück (nämlich kombiniert).

Ein Versuch, die XML-Datei im UTF-8 direkt als Textdatei mit Unicode-Formatierung zu importieren schlug fehl: statt der Zeichen kamen nur rosa Kästchen an.



Hallo Martin,

ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist. Wieso musst du die XML erst in ID importieren, dann wieder exportieren, Rahmen löschen usw.? Was genau ist das, was du erreichen möchtest? Du kannst doch XML mit der gleichen Funktionalität wie eine Plain-Text-Datei importieren, sofern ein entsprechender Rahmen dafür zur Verfügung steht?

Schöne Grüße,
Bernd


als Antwort auf: [#367632]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 13:02
Beitrag # 7 von 13
Beitrag ID: #367641
Bewertung:
(17953 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

> ich habe ehrlich gesagt noch nicht ganz verstanden, was die Aufgabenstellung ist.

Ich entwickle gerade ein Skript, das am Ende einen Report erzeugt.
Dabei habe ich festgestellt, dass kombinierte Umlaute, wie sie beim Auslesen von Dateinamen erfasst werden, beim Schreiben der Textdatei Probleme bereiten, wenn die Datei nicht im UTF-Format gesichert wird.

Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.

Bei diesen Tests hatte es mich überrascht, dass InDesign beim TXT-Import mit UTF-8 nichts anzufangen weiß. Und mit UTF-19 hat es wohl auch Schwierigkeiten, wenn die erwähnten kombinierten Umlaute in der TXT-Datei enthalten sind.
Keine Probleme hat InDesign mit dem XML-Import von XML-Dateien im UTF-8-Format.

Wenn Du so willst, war es eine Studie und ich habe in deren Verlauf immer wieder mal nachgefragt, ob mir denn keiner das Finden der Lösung etwas beschleunigen könnte.
Im Prinzip habe ich diese nun gefunden und weiß, wie mit dem Problem bei dieser konkreten Aufgabe umzugehen ist.

Danke.


als Antwort auf: [#367634]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3342

25. Sep 2008, 13:10
Beitrag # 8 von 13
Beitrag ID: #367644
Bewertung:
(17950 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Damit der Kunde ggf. mit diesen in der TXT gespeicherten Daten weiterarbeiten kann, habe ich den Import der TXT-Datei in InDesign geprüft und bin auf die o.g. Probleme gestoßen.


Hallo Martin,

mir war nicht ganz klar, ob die erzeugte Report-Datei für eine konkrete Anwendung in ID gedacht war (d.h. der Report wird Teil eines InDesign-Dokumentes). In diesem Fall muss das ID-Dokument ja auch einen dafür vorgesehenen Platz besitzen, und diesem (Rahmen) kann der <report>-Tag einfach zugewiesen und letzterem automatisch einem Absatzformat zugeordnet werden.

Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)

Grüße,
Bernd


als Antwort auf: [#367641]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 13:18
Beitrag # 9 von 13
Beitrag ID: #367645
Bewertung:
(17947 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Ich verstehe auch nicht ganz bzw. bin überrascht, dass ID unter "Unicode" automatisch UTF-16 voraussetzt. War mir bisher nicht bewusst :-)


Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)


als Antwort auf: [#367644]
(Dieser Beitrag wurde von Martin Fischer am 25. Sep 2008, 13:21 geändert)

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3342

25. Sep 2008, 13:35
Beitrag # 10 von 13
Beitrag ID: #367652
Bewertung:
(17941 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Aber Du kannst das auch bestätigen?
(scheint von der Plattform unabhängig zu sein; bin auch unter Win grad an einer UTF-8 Datei gescheitert)


Hallo Martin,

ja, kann ich bestätigen, hab's gerade nochmal ausprobiert. Es funktionieren (mit einer Testdatei aus TextWrangler) nur die Encodings "Unicode UTF-16" und "Unicode UTF-16 Little Endian", alle anderen erzeugen rosa Kästchen. Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.

Grüße,
Bernd


als Antwort auf: [#367645]

Textdatei Importoption Zeichensatz Unicode

Martin Fischer
  
Beiträge gesamt: 12779

25. Sep 2008, 17:34
Beitrag # 11 von 13
Beitrag ID: #367698
Bewertung:
(17893 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Bernd,

Antwort auf: Im Falle der beiden o.g. Encodings sind die entsprechenden Importoptionen beim Import in ID allerdings ausgegraut, ID erkennt also selbständig das Encoding. Auch interessant.


Am Anfang einer UTF-8 codierten Textdatei steht normalerweise ein BOM (Byte Order Mark = Bytereihenfolge-Markierung) anhand dem die Codierung der UTF-Datei festgestellt werden kann: http://de.wikipedia.org/wiki/Byte_Order_Mark

InDesign wird also diese Info auswerten.

Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).


als Antwort auf: [#367652]

Textdatei Importoption Zeichensatz Unicode

Be.eM
Beiträge gesamt: 3342

25. Sep 2008, 17:44
Beitrag # 12 von 13
Beitrag ID: #367699
Bewertung:
(17888 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Antwort auf [ Martin Fischer ] Es gibt auch UTF-Dateien ohne BOM (bietet z.B. BBEdit als Sicherungsoption an).


Hallo Martin,

danke für die Info. Ich hatte das schon ausprobiert, die BBEdit/Textwrangler-Dateien ohne BOM führen in ID auch zu rosa Kästchen.

Schöne Grüße,
Bernd


als Antwort auf: [#367698]

Textdatei Importoption Zeichensatz Unicode

truni
Beiträge gesamt: 98

22. Jul 2019, 12:09
Beitrag # 13 von 13
Beitrag ID: #571182
Bewertung:
(8509 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo zusammen, habe einen Workflow mit Apple Numbers gefunden, der auch gut geht (im Moment):

- XLSX öffnen
- Export als CSV, Textcodierung Unicode (UTF-16)
- Import in InDesign mit: Kommagetrennt, Unicode, PC

=)


als Antwort auf: [#367699]
X