next up previous contents
Next: Namen Up: XML Previous: Metasprache   Contents

Markup

XML-Dokumente bestehen aus einer Folge von Zeichen und Markups. Das Markup befindet sich inmitten der Zeichen oder des elektronischen Textes und zeichnet bestimmte Bereiche der Zeichen mit einer Eigenschaft aus, die durch das Markup festgelegt wird. Dadurch können wir Textstücke beschreiben oder für eine gewisse Art der Verarbeitung gesondert kennzeichnen.
Das Markup wird als Zeichenkette auftretend als Tag bezeichnet. Ein Charakteristikum von XML ist, dass jedes Start-Tag mit einem zugehörigen Ende-Tag abgeschlossen werden muss. Dazwischen können textuelle Inhalte plaziert werden oder weitere Tags auftreten. Das bedeutet wir können zunächst zwei verschiedene Ebenen unterscheiden auf denen XML-Dokumente direkt strukturiert werden können. Einmal die Ebene der konkreten Daten oder Textfragmenten und die Ebene der abstrakten Einheiten, die den Daten Funktionen zuordnen oder sie gruppieren.
Die abstrakten Einheiten werden in XML als Elemente bezeichnet, die wiederum zwei verschiedene Typen besitzen können: Beide Arten können auch als Mischform auftreten und eine Differenzierung ist folgendermaßen begründbar, dass Daten-Elemente die konkreten Daten enthalten und Container-Elemente selbst wiederum Elemente enthalten, die Daten- oder Container-Elemente sein können. Mit dem Konzept der Container-Elemente ist es möglich, komplexe Strukturen in die Daten-Elemente zu modulieren. Ein dritter Typ sind die sogenannten leeren Elemente.
Alle Konstrukte, die in XML mit einer spitzen Klammer oder mit dem kaufmännischen Und beginnen, bezeichnen wir als Markup, alle anderen als Zeichendaten, Daten oder Text. Das Programm, das diese Unterscheidung formal zu treffen hat, um XML-Dokumente zu verarbeiten heißt Parser. Ein Parser ist ein Teil des Prozessors, genauer des XML-Prozessors, dessen Aufgabe darin besteht XML-Markup und Daten in eine Folge von Tokens zu zerlegen, um diese dann weiter zu verarbeiten. Ein Token kann ein Start-Tag, ein Datenelement oder ein anderer Teil von Markup sein, der Dokumentteile auszeichnet. Diese Folge von Tokens wird danach an die nächste Komponente des XML-Prozessors weitergereicht.
Betrachten wir ein erstes Beispiel mit folgendem Ausschnitt eines möglichen XML-Dokuments:
<Vorname>Ludwig</Vorname>
Dabei handelt es sich um folgende unterschiedliche Tokens mit dazugehöriger Bedeutung:

<Vorname> -Tag des Elements Vorname

Ludwig Inhalt des Elements Vorname
</Vorname> Ende-Tag des Elements Vorname
< Öffnendes Begrenzungszeichen für das Start-Tag
</ Öffnendes Begrenzungszeichen für das Ende-Tag
Vorname Elementname
> Schließendes Begrenzungszeichen für ein Tag
Jedes Element kann über Eigenschaften verfügen, die mittels Attribute folgendermaßen realisiert werden können:
<name art="first">Ludwig</name>

art 

= Zuweisungsoperator
" Begrenzungszeichen für die Zeichenkette
first Attributwert
Elemente können auch über mehrere Attribute verfügen, diese werden dann hintereinander mit Leerraum getrennt, ebenso innerhalb des Start-Tags aufgelistet.
next up previous contents
Next: Namen Up: XML Previous: Metasprache   Contents
Nikolai Jursic 2004-03-05