Next: Text
Up: Markup
Previous: metamarkup
Contents
Standard General Markup Language
Computer und seine Anwendungen stellen die Infrastruktur bereit, um Daten in einer Menge zu verarbeiten, wie es ohne diese Techniken nicht möglich wäre. Riesige gekoppelte Satellitenantennen, Very Large Arrays (VLA), gerichtet ins All, empfangen Frequenzen zwischen 300 and 50,000 MHz und speichern diese Datenansammlungen unentwegt, um nach Strukturen zu suchen.5
Dokumente und Texte werden seit Jahren fast ausschließlich am Computer erzeugt. Das geschah bis Mitte der 80er Jahre des vorigen Jahrhunderts mit dem Schwerpunkt auf der Präsentation des Dokuments auf Papier oder dem Bildschirm selbst. TEX ist eine solche Formatierungssprache, mit der hervorragende Ergebnisse erzielt werden können, sofern es um die Formatierung gedruckter Texte geht. Die Textstruktur selbst bzw. die Bedeutung einzelner Textabschnitte sind so aber nicht maschinell nutzbar, ebenso ist ein formatierter Text mit TEX ausschließlich für eine Anwendung gedacht und nicht generalisierbar. Denselben Sourcecode bspw. für mobile computing, für Intranets, Bücher oder Internetkataloge zu verwenden ist nicht möglich mit reiner Formatierungsauszeichnung des Textes.
Der erste Schritt für eine Verbesserung dieser Situation war Ende 1960 durch zwei Projekte gegeben, die durch die Idee des generischen (engl.: generic) Markups Dokumente mit logischen, rein inhaltsbeschreibenden Tags (to tag = markieren, auszeichnen; tag = Auszeichnungselement) versahen. Somit wurde es möglich physikalisch verteilte Dokumente z.B. zusammenzufügen oder auch mit unterschiedlichen Programmen ein und dasselbe Dokument zu verarbeiten.
Der Präsident der Graphic Communication Association (GCA) präsentierte 1967 seine Idee von der Trennung zwischen Inhalt und Formatierung eines Dokuments. Das Projekt GenCode der GCA beschäftigte sich mit dem generischen Markup, um verschiedene Dokumente und unterschiedliche Dokumenttypen gemeinsam zu verarbeiten und ggfs. neu zusammenzustellen. Ein weiteres Projekt namens Generic Markup Language (GML)6, initiiert von IBM, befasste sich mit generischen Tags, um damit meist technische Dokumente mit unterschiedlichen Programmen auf verschiedenen Computersystemen zu formatieren, zu editieren und zu durchsuchen.
Aufbauend auf dem großen Erfolg von GML startete das American National Standards Institute (ANSI) ein Projekt unter der Leitung von Charles Goldfarb zur Entwicklung eines Standards zur generischen Textauszeichnung. Die Standard General Markup Language (SGML) war im Entstehen. Institutionen wie die Association of American Publishers (AAP) oder das U.S. Department of Defense arbeiteten bereitwillig mit SGML und entwickelten SGML-Anwendungen, als 1986 die International Standards Organization (ISO) einen Standard für SGML (ISO 8879:1986) ratifizierte.
Doch was ist SGML eigentlich? SGML ist die Metasprache für die Definition von Markupsprachen, das heisst SGML stellt lediglich eine Menge von Regeln zur Definition von Markupsprachen bereit, ist selbst daher keine Markupsprache. SGML Dokumente sind reine Textdokumente kombiniert mit Tags, die vorher in einer Document Type Definition (DTD) beschrieben werden und die für die Strukturauszeichnung des Dokuments herangezogen werden. Die DTD beschreibt die Grammatik, die syntaktischen Regeln und die hierarchische Struktur einer Dokumentklasse.
SGML hat aber auch Nachteile, aufgrund der großen Macht von SGML ist es praktisch unmöglich die Sprache effizient einzusetzen, lediglich Global Players können die nötigen Ressourcen aufbringen. Um das auszugleichen, ohne die Vorteile von SGML zu verlieren, entwickelte das World Wide Web Consortium (W3C) 1998 eine überschaubare und leicht anwendbare Untermenge von SGML, die Extended Markup Language (XML). Im Grunde ist jedes XML-Dokument auch ein SGML-Dokument, mit dem Untschied, dass XML mit seiner Einfachheit es jedem gestattet Anwendungen zu entwickeln. Auch sind die komplexen, sehr großen SGML-Anwendungen praktisch untauglich für verteilte Netzwerkanwendungen.
Next: Text
Up: Markup
Previous: metamarkup
Contents
Nikolai Jursic
2004-03-05