Was ist eigentlich eine Datenbank? Eine Datenbank dient dazu Daten in elektronischer Form abzuspeichern, um zu einem späteren Zeitpunkt auf diese Daten wieder zugreifen zu können. Es handelt sich also - vereinfacht betrachtet - um eine Karteikartensammlung im Computer. Daten sind in diesem Zusammenhang abstrakte und strukturierte Teile einer Beschreibung der Welt (oder zumindest einer möglichen Welt), wobei sich die Welt aus sogenannten Sachverhalten zusammensetzt. Diese Sachverhalte werden mit Sätzen beschrieben. Normalerweise sind nur Sätze von Interesse die wahr sind - sogenannte Tatsachen -, also bestehende Sachverhalte beschreiben. Es steht allerdings jedermann frei auch nicht bestehende Sachverhalte in eine Datenbank abzubilden.
Die Form der Beschreibung, der Grad der Abstraktion bzw. die Struktur hängt von folgenden Aspekten ab:

1.1. Komponenten einer Datenbank:

1.1.1. Benutzer:

1.1.2. Datenbank-Analytiker/Programmierer:

1.1.3. Datenbank Administrator:

1.1.4. Eingabe- und Abfrage-Programmmodule:

1.1.5. Datenbank Management System (DBMS):

1.1.6. Gespeicherte Daten:

1.1.7. Der Computer:

1.2. Der Abstraktionsprozess:

Bei den Sachverhalten kann es sich um Teile der wirklichen Welt oder um Teile einer virtuellen (möglichen) Welt (es könnte z.B. ein Schriftsteller Beschreibungen seiner Romanfiguren in einer Datenbank ablegen) handeln. Normalerweise sind im Zusammenhang mit Datenbanken nur Sachverhalte von Interesse die auch bestehen - es ist meist nur relevant was ist und nicht was nicht ist (manche Datenbanken verwenden sogar das Konzept, dass alles was nicht in der Datenbank abgebildet wurde automatisch als falsch oder nicht bestehender Sachverhalt interpretiert wird; siehe dazu weiter unten bei deduktiven datenbanken). Sachverhalte werden mittels Sätzen beschrieben. Bestehende Sachverhalte werden nur durch wahre Sätze beschrieben (das ist gewissermaßen die Definition wahrer Sätze). Man hat aber natürlich die Freiheit auch jede andere Art von Sätzen hier zu verwenden (falsche, unsinnige,...), jedoch würde das die Verwendbarkeit der in der Datenbank abgelegten Daten für andere Personen wesentlich erschweren.

Die Sätze werden zuerst aufgespaltet und umgeformt sodass eine möglichst einfache und einheitliche Form der Beschreibung entsteht. Diese Form hängt stark von der Art und der Struktur der verwendeten Datenbank ab. Die so gewonnenen Sätze (Elementar-Sätze) werden nun in Satzbausteine zerlegt, also ihrer Syntax entkleidet.
Dieser Prozess wird auch als semantische Modellierung bezeichnet. Einer der weitest verbreiteten Modelle stellt das "Entity/Relationship"-Modell dar. Dabei wird eine natürlichsprachige Beschreibung nach folgenden semantischen Konzepten, die sich bei der Beschreibung der Wirklichkeit als nützlich herausgestellt haben, analysiert: es gibt also so etwas wie Dinge oder eben Entitäten, welche nach Typen geordnet werden können. Diese Entitäten besitzen gewisse Eigenschaften, welche für alle Entitäten eines bestimmten Typs gleich sein sollen (somit den Typ definieren). Jede Entität ist etwas einmaliges und kann eindeutig identifiziert werden; man könnte auch von Identität sprechen. Und Entitäten können in bestimmten Zusammenhängen bzw. Verbindungen - den sogenannten "relationaships"- mit anderen Entitäten stehen. Hat man diese semantischen Grundbausteine erst einmal identifiziert kann man davon ein Datenmodell erstellen, auf das sich dieses semantische Modell optimal abbilden läßt (dass als Folge der "Entity/Relationship"-Analyse sogenannte Datenobjekte, Integritätsregeln und Operatoren festgelegt werden soll hier nur der Vollständigkeit halber erwähnt werden).

Man könnte auch sagen, dass die Satzbausteine als Daten interpretiert, d.h. in eine für die Datenbank geeignete Form umgewandelt werden. Diese Daten, also die Abbildung der abstrakten Satzbausteine in der Datenbank, sind die kleinsten Teile einer Datenbank aus Benutzersicht, also sozusagen Elementarbausteine. Intern werden diese Daten vom DBMS noch in Rohdaten umgewandelt und danach dem Computerbetriebssystem übergeben das diese Rohdaten als Binärdaten mittels der Systemsoftware in der Computerhardware ablegt.
Alle zu einem (Elementar-)Satz gehörenden Satzbausteine bilden einen Datenbankeintrag oder Datensatz.
Meist werden dann diese Datenbankeinträge, das sind die abstrahierten Teile von Sätzen mit gleichem Aufbau, also gleichen Satzbausteinen, in einem Teil der Datenbank gesammelt um zu einem späteren Zeitpunkt aus diesen Teil einen oder mehrere Datensätze nach bestimmten Suchkriterien auszuwählen.
Mittels des DBMS kann auf die gesammelten (Binär-)Daten bei einer späteren Abfragen oder Änderungen wieder über die Systemsoftware zugegriffen werden.
Einen Überblick über die verschiedenen Abstraktionsebenen mit einem einfachen Beispiel findet sich in folgender Aufstellung:

Bei der Abfrage von Daten aus einer Datenbank wird der umgekehrte Prozess in die Wege geleitet, wobei der Schritt von den Binärdaten über die Rohdaten hin zu den Daten vom DBMS (bzw. der Systemsoftware) reversibel erledigt wird. Ob der Konkretisierungsschritt von den Daten hin zu den Satzbausteinen, den Elementarsätzen und zum Satz ebenfalls gelingt, hängt sehr vom Design der Datenbank und dem Abstraktionsgrad der Daten ab. D.h. je stärker bei der Eingabe der Daten vom Satz her abstrahiert wird, desto schwieriger wird es werden die Daten richtig zu interpretieren, sodass sich daraus wieder der entsprechende Sachverhalt identifizieren lässt.

1. Datenbanken: