next up previous contents
Next: Metadaten Up: Daten Previous: objekt-relationale Modelle   Contents

Datenspeicherung

Bei Datenbanken übernimmt in der Regel das DBMS zusammen mit Methoden des Betriebssystems die Speicherung der Daten, die dann meist im Binärformat auf einem physikalischen Speichersystem festgehalten werden. Die erforderlichen Methoden zum Lesen und Schreiben werden vom jeweiligen Betriebssystem (operating system, OS) bereitgestellt. Binäre Daten haben die Eigenschaft, sich nur mit einem speziellen Programm darstellen zu lassen, hier mit dem DBMS. Eine direkte Manipulation der Daten auf Rohdatenebene mittels Systemsoftware ist somit nicht möglich, diese Funktion übernimmt ebenfalls das DBMS.
Im Gegensatz hierzu stehen Textformate, die auf viele verschiedene Arten schließlich auf der Festplatte des Computers gespeichert werden können. Eine für strukturierte Dokumente sehr typische Art der Organisation auf physikalischen Speichermedien ist die Organisationsform des Baumes.
Die Elemente oder Blöcke einer Datei können auch in einer als Baumstruktur (engl. tree) bezeichneten Anordnung gespeichert werden. Besondere Bedeutung für die Speicherung größerer und unregelmäßig wachsender Datenmengen haben so genannte balancierte Bäume, kurz B-Bäume genannt, erlangt. [Gaus, 2000, 35]
Bei strukturierten Dokumenten ist es möglich, die Daten auch ohne Programm, mit dem das Dokument erstellt wurde, lesbar darzustellen. Dazu reicht ein einfacher Texteditor, der bei allen Betriebssystemen bereits vorinstalliert ist, vorausgesetzt es wird ein Zeichensatz verwendet, mit dem der Texteditor arbeiten kann. Daraus ergibt sich ein wesentlicher Vorteil dieser Art von Dokumenten als Strukturmöglichkeit über Plattformgrenzen hinweg, denn binäre Formate sind immer an ein Programm gebunden, das wiederum vom jeweiligen OS abhängig ist.
Computer verstehen prinzipiell keine Symbole oder Zeichen, sie handeln bloß auf Ebene von langen Zeichenketten des Binärecodes, der rein auf Zahlen beruht. In der Informatik heißen Daten codiert, wenn jedes Symbol mit einer eindeutigen Nummer repräsentiert ist. Werden vom Texteditor nun Zeichen dargestellt, die wir als Text interpretieren, so liegt dahinter die Decodierung der Zahlencodes in Zeichen eines Zeichensystems (character set) zur Darstellung und nach dem Editieren dieser Datei werden alle Zeichen wieder in den Binärcode des Computers codiert.
Heute besitzen Texteditoren die Fähigkeit, verschiedene Zeichensätze zu verwenden. HTML akzeptierte anfänglich nur den ISO 8859-1 Zeichensatz, oft der Einfachheit halber bloß als Latin-1 bezeichnet. Mit Latin-1 können fast alle westeuropäischen Sprachen dargestellt werden, mit ISO 8859-2 hingegen, kurz Latin-2, werden die auf dem lateinischen Alphabet aufgebauten slawischen Sprachen in Mitteleuropa unterstützt. Heute gibt es Erweiterungen des Zeichensatzes ISO 8859 bis Latin 15. Diese Fülle an verschiedenen Zeichensätzen ist notwendig, wenn das World Wide Web seinem Namen gerecht werden soll.
next up previous contents
Next: Metadaten Up: Daten Previous: objekt-relationale Modelle   Contents
Nikolai Jursic 2004-03-05