[GastForen Programme Print/Bildbearbeitung Adobe InDesign HTML / XML Import in InDesign

  • Suche
  • Hilfe
  • Lesezeichen
  • Benutzerliste
Print/Bildbearbeitung - Photos, Layout, Design
Themen
Beiträge
Moderatoren
Letzter Beitrag

HTML / XML Import in InDesign

RK01
Beiträge gesamt: 20

16. Mär 2011, 11:54
Beitrag # 1 von 5
Bewertung:
(11018 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Forum,

unser Kunde hat auf seiner Website einen Online-Veranstaltungskalender, der 2x jährlich in gedruckter Form veröffentlicht wird.
Wir haben von unserem Kunden einen Link erhalten, über den wir auf die Daten des Veranstaltungskalenders zugreifen können. In der Browseransicht (Firefox) werden alle Termine aufeinander folgend ohnen Struktur angezeigt. Lässt man sich den Seitenquelltext anzeigen, so beginnt die Seite mit einem HTML-Doctype (HTML 4.01 Transitional). Zusätzlich zu den Tags HEAD, TITLE, META ist noch folgendes Tag-Element enthalten:
<SCRIPT src="/Templates/edit_menu.js" type="text/javascript"></SCRIPT>
wobei ich auf "edit_menu.js" nicht zugreifen kann.

Anschließend folgen die Daten in strukturierter Form. D.h. die jeweiligen Veranstaltungen sindwie folgt getaggt:

<veranstaltung>
<datum>18.03.2011</datum>
<titel>Buchpräsentation und Lesung</titel>
<ort>Stadtbibliothek</ort>
<zeit>20:00 Uhr </zeit>
<text>Lesung aus dem historischen Roman </text>
<veranstalter>Stadtbibliothek</veranstalter>
<striche></striche>
</veranstaltung>

Gibt es eine Möglichkeit diese HTML-Datei in InDesign (CS4) zu importieren und den Tags entsprechende Formate zuzuweisen?
Ich habe bereits versucht das HTML-Doctype durch ein XML Doctype zu ersetzen und dann die Datei in InDesign zu importieren - allerdings ohne Erfolg.
Oder gibt es eine Möglichkeit HTML in valides XML zu konvertieren?

Selbstverständlich bin ich auch für andere Alternativen dankbar

Beste Grüße

Rouven
X

HTML / XML Import in InDesign

klasinger
Beiträge gesamt: 1646

16. Mär 2011, 16:45
Beitrag # 2 von 5
Beitrag ID: #467173
Bewertung:
(10984 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Rouven,

InDesign kann ganz gut mit XML umgehen, eine Aufbereitung der HTML-Datei als XML-Datei würde also helfen.

Hierfür gibt es verschiedene Möglichlkeiten:
- Dirty: Copy & Paste in ein neue XML-Dokment mit passendem Header (hier muss man auf die Sonderzeichencodierungen achten und schauen, dass das Ursprungsdok. wohlgeformt ist [korrete Verschachtelung der Tags]).
- Easy: Es gibt Programm die machen soetwas, bspw. Altova (http://www.altova.com/...ion/html-in-xml.html), kosten aber eben Geld
- Der "Königsweg": für derartige Umformungen gibt es XSL, sehr mächtig, aber es will erst gelernt sein

Wenn du dann eine korrekte XML-Datei hast, dann kannst du Tags in InDesign auch Formate zuweisen.


als Antwort auf: [#467131]

HTML / XML Import in InDesign

RK01
Beiträge gesamt: 20

16. Mär 2011, 18:01
Beitrag # 3 von 5
Beitrag ID: #467178
Bewertung:
(10972 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Klaas,

vielen Dank für Deine Antwort. Die Variante "Dirty" habe ich auch schon ansatzweise getestet. Allerdings machen hier die Sonderzeichen / Umlaute noch Schwierigkeiten.

Aber immerhin habe ich jetzt einmal drei Ansatzpunkte an denen man weiterarbeiten kann.

Beste Grüße

Rouven


als Antwort auf: [#467173]

HTML / XML Import in InDesign

klasinger
Beiträge gesamt: 1646

16. Mär 2011, 18:59
Beitrag # 4 von 5
Beitrag ID: #467183
Bewertung:
(10955 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo,

für das Konvertieren der Umlaute gibt es versch. Möglichkeiten - auf welchem System bist du unterwegs?

Probieren kannst du mal:
1.) Onlinedienst: http://www.motobit.com/...epage-conversion.asp
2.) Programm: http://www.gnu.org/software/libiconv/ (Doku: http://www.gnu.org/...ibiconv/iconv.1.html)


als Antwort auf: [#467178]

HTML / XML Import in InDesign

RK01
Beiträge gesamt: 20

16. Mär 2011, 21:38
Beitrag # 5 von 5
Beitrag ID: #467187
Bewertung:
(10925 mal gelesen)
URL zum Beitrag
Beitrag als Lesezeichen
Hallo Klaas,

an dieser Stelle nochmals vielen Dank für Deine schnellen und hilfreichen Rückmeldungen.

Inzwischen bin ich ein ganzes Stück weitergekommen. Inzwischen habe ich festgestellt, daß im ursprünglichen HTML-Header die Zeichenkodierung ISO-8859-1 war. Der XML-Header durch den ich den HTML-Header ersetzt habe war mit UTF-8 definiert. Daher also auch die Schwierigkeiten mit den Sonderzeichen.
Im XML-Header habe ich nun die Zeichenkodierung auf ISO-8859-1 gesetzt - die Darstellung der Umlaute ist nun korrekt.
Das einzige Problem lag noch in der Darstellung des kaufmännischen und -Zeichens (&), welches ich im Editor durch das entity "&amp;" mittels S+E ersetzt habe.
Nun lässt sich die XML Datei in InDesign problemlos einschließlich der Tags importieren.

Beste Grüße

Rouven


als Antwort auf: [#467183]
X