[GastForen Programme Print/Bildbearbeitung Adobe InDesign Skriptwerkstatt xml-Datei Encoding

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

xml-Datei Encoding

-hans-
Beiträge gesamt: 748

17. Mai 2017, 10:09
Beitrag # 1 von 5
Bewertung:
(2837 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo zusammen,

ich habe eine Reihe von xml-Dateien (eigentlich utf8) die von Extendscript nicht korrekt gelesen werden können, da auch Zeichen enthalten sind die wohl nicht in utf8 enthalten sind ...

Im vorliegenden Beispiel in der vorletzten Zeile:
https://www.dropbox.com/...Roetgen.xml.zip?dl=0

TextEdit (Automatisch) und Brackets können diese Datei z.B. gar nicht öffnen.
Öffnen mit Atom und sichern unter ergibt eine intakte utf8 kodierte Datei.
Mit AppleScript kann ich die Datei einlesen, aber nur indem ich das encoding weglasse. Die Folge: alle Umlaute etc sind nicht korrekt. Müsste dann per suchen und ersetzen ... selbst iconv bricht in der vorletzten Zeile wider ab ...

Hat vielleicht jemand einen Idee¿

Besten Tag! :)
X

xml-Datei Encoding

Uwe Laubender
Beiträge gesamt: 5318

17. Mai 2017, 11:01
Beitrag # 2 von 5
Beitrag ID: #557484
Bewertung:
(2826 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Hans-Gerd,

wenn ich die Datei versuche, mit TextWrangler zu öffnen, kommt folgende Warnmeldung:

Zitat Incorrect formatted UTF-8
The UTF-8 file "Roetgen.xml" is damaged or incorrectly formatted: Please proceed with caution.


Geöffnet, sehe ich ein paar Probleme.

In Zeile 363 steht ein sog. "Gremlin" (als umgedrehtes Fragezeichen dargestellt) im Wort K¿ckhoven.
In Zeile 345 steht ein Leerzeichen im öffnenden Tag. Das folgende Wort wird in "rot" markiert.

Mit der Funktion Text>Zap Gremlins kann ich die Umlaute in Entities wandeln.
Das ¿ in K¿ckhoven lässt sich damit allerdings nicht reparieren. Beispielsweise in ein "ü".

Einstellung Zap Gremlins:

Search for:
[x] Non-ASCII characters
[x] Control characters
[x] Null (ASCII 0) characters

and then:
[x] Replace with HTML entity
[x] Use named entities


als Antwort auf: [#557483]

xml-Datei Encoding

-hans-
Beiträge gesamt: 748

17. Mai 2017, 11:52
Beitrag # 3 von 5
Beitrag ID: #557488
Bewertung:
(2819 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Uwe,

so isset :)

Ich versuche mal mit dem Lieferant der Daten in Konatkt zu treten ... ist halt immer schwieritsch :)

LG


als Antwort auf: [#557484]

xml-Datei Encoding

Uwe Laubender
Beiträge gesamt: 5318

17. Mai 2017, 12:57
Beitrag # 4 von 5
Beitrag ID: #557491
Bewertung:
(2813 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Hans-Gerd,

das dürfte das beste sein.

Hab die Datei auch mal mit "Atom 1.0" geöffnet.
Auch hier wird das "Ersetzen"-Zeichen in K¿ckhoven nur als solches angezeigt.

Wobei ich im Unterschied zu "Atom 1.0" die Warnmeldung von TextWrangler angenehmer finde.
Da wird sofort auf ein Problem hingewiesen.
Aber was sag' ich, hab' mich gerade mal 2 Minuten mit "Atom 1.0" beschäftigt.

Witziges Video übrigens: Introducing Atom 1.0
https://www.youtube.com/watch?v=Y7aEiVwBAdk


als Antwort auf: [#557488]

xml-Datei Encoding

-hans-
Beiträge gesamt: 748

17. Mai 2017, 15:53
Beitrag # 5 von 5
Beitrag ID: #557498
Bewertung:
(2794 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
:)


als Antwort auf: [#557491]
X