Warum NoSQL?

Wenn du relationale Datenbanken kennst – Tabellen, Zeilen, SQL, Constraints – kommt dir die Welt erstmal ordentlich vor. Schemas sind definiert, Beziehungen klar, ACID-Garantien verhindern Datenchaos. Warum sollte irgendjemand etwas anderes wollen?

Die Antwort ist: weil in den 2000ern Web-Anwendungen entstanden sind, deren Bedürfnisse nicht mehr zu klassischen Datenbanken passten. Facebook mit Milliarden Posts, Amazon mit Millionen Produktklicks pro Sekunde, Twitter mit unstrukturierten Daten – diese Use Cases brachen relationale Systeme an drei Stellen: Skalierung, Schema-Flexibilität und Datenmodell-Anpassung. Daraus entstand die NoSQL-Bewegung – kein „kein SQL", sondern „Not Only SQL".

1) Das Skalierungsproblem

Eine klassische SQL-Datenbank läuft auf einem Server. Wenn der zu klein wird, gibt es zwei Wege: vertikale Skalierung („Scale up") – einen stärkeren Server kaufen. Oder horizontale Skalierung („Scale out") – mehrere Server zusammenschalten. Letzteres ist mit relationalen DBs sehr schwierig, weil JOINs über Server-Grenzen extrem teuer werden.

Scale up vs. Scale out

Vertikale Skalierung (SQL-Klassiker)

Ein Server, immer stärker: mehr CPU, mehr RAM, schnellere Disks. Funktioniert gut – bis du an die Hardware-Grenze stößt. Dann ist Schluss. Teure Top-Server kosten exponentiell mehr.

Horizontale Skalierung (NoSQL-Stärke)

Viele kleine, günstige Server. Daten werden auf sie verteilt (Sharding). Theoretisch unbegrenzt erweiterbar – einfach weitere Knoten dazustecken. Genau das, was Cloud-Anbieter günstig machen.

Die Web-Riesen der 2000er stießen an die Grenzen vertikaler Skalierung. Ein einzelner Server – egal wie groß – kann nicht das gesamte Facebook-Daten-Volumen halten. Die Lösung musste „auf viele Maschinen verteilen" heißen. NoSQL-Datenbanken sind von Anfang an für dieses Modell gebaut. Mehr zu verteilten Systemen in K31 (Cloud Computing).

2) Das Schema-Problem

Eine SQL-Tabelle hat ein festes Schema: definierte Spalten, feste Datentypen. Jede Zeile sieht gleich aus. Wenn du eine neue Spalte willst, ist ein ALTER TABLE nötig – bei großen Tabellen eine teure Operation. Wenn manche Zeilen das Feld brauchen und andere nicht, hast du viele NULL-Werte.

In modernen Web-Anwendungen ändern sich Datenstrukturen ständig: neue Felder, optionale Attribute, verschachtelte Strukturen. Ein Produkt mit 5 Eigenschaften heute, mit 23 morgen, mit teils geteilten Eigenschaften. Im SQL-Schema wird das schnell zur Tortur.

Schema-Starr vs. Schema-Flexibel

SQL-Tabelle „produkte"

id	name	preis	autor	seiten	spieldauer
1	Roman	19,90	Müller	320	NULL
2	Brettspiel	45,00	NULL	NULL	90 min
3	Stift	2,50	NULL	NULL	NULL

Viele NULL-Werte, weil unterschiedliche Produkttypen unterschiedliche Felder brauchen. Neue Produktart → ALTER TABLE.

NoSQL-Collection „produkte"

{ _id: 1, name: "Roman",
preis: 19.90, autor: "Müller",
seiten: 320 }

{ _id: 2, name: "Brettspiel",
preis: 45.00,
spieldauer: "90 min" }

{ _id: 3, name: "Stift",
preis: 2.50 }

Jedes Dokument trägt nur die Felder, die es braucht. Neues Feld? Einfach hinzufügen, kein Schema-Update nötig.

Vorsicht: „kein Schema" heißt nicht „keine Struktur". Auch NoSQL-Daten haben implizit Strukturen – sie sind nur nicht zentral erzwungen. Das ist Freiheit und Verantwortung: die Anwendung muss sich mehr Gedanken machen, dass eingehende Daten konsistent geschrieben werden. Sonst entsteht Chaos. Schema-Validierung ist in modernen NoSQL-DBs (z.B. MongoDB) optional aktivierbar.

3) Die historische Entwicklung

NoSQL ist keine spontane Erfindung, sondern eine Reaktion auf reale Probleme der Web-Riesen Anfang der 2000er. Eine kurze Zeitleiste der wichtigsten Stationen:

NoSQL – die wichtigsten Meilensteine

1970

Edgar F. Codd veröffentlicht das relationale Modell. SQL wird zum De-facto-Standard für strukturierte Daten.

1998

Carlo Strozzi nutzt erstmals den Begriff „NoSQL" – für eine relationale DB ohne SQL-Interface. Anderer Sinn als heute.

2004–2007

Google veröffentlicht Paper zu MapReduce und BigTable. Amazon Paper zu Dynamo. Diese Konzepte begründen die moderne NoSQL-Welle.

2009

Johan Oskarsson organisiert ein Meetup zu „distributed, non-relational databases" – und prägt „NoSQL" in der heute üblichen Bedeutung. MongoDB 1.0 erscheint, Redis wird veröffentlicht.

2010–2015

Boom-Phase. Cassandra (Apache), CouchDB, Neo4j, HBase. Jeder probiert NoSQL für alles aus – oft zu Recht, oft als Mode.

heute

Pragmatisches Bild: SQL bleibt der Standard für strukturierte Daten und Transaktionen, NoSQL füllt spezifische Nischen. Moderne Systeme nutzen oft beide parallel („Polyglot Persistence").

Die NoSQL-Bewegung war zwischenzeitlich von viel Hype begleitet – „SQL ist tot!" war ein gängiger Slogan. Heute ist klarer geworden: NoSQL ergänzt SQL, ersetzt es selten. Wer SQL einfach durch NoSQL austauscht und auf ACID-Garantien verzichtet, handelt sich schnell andere Probleme ein.

4) Wo NoSQL glänzt

NoSQL ist kein Universalwerkzeug. Es löst bestimmte Probleme besser als SQL – und andere schlechter. Hier die klassischen Stärken-Domänen:

NoSQL-Einsatzgebiete

Massendaten / Big Data

Mehrere TB oder PB an Daten. Horizontale Verteilung auf viele Knoten ist Pflicht. Beispiel: Web-Logs, IoT-Sensorströme.

Hochfrequente Schreibvorgänge

Millionen Inserts pro Sekunde. Klassische DBs würden an Lock-Contention ersticken. Beispiel: Click-Tracking, Telemetrie.

Unstrukturierte / semi-strukturierte Daten

JSON-Daten aus APIs, Konfigurationen mit variabler Tiefe, Produktkataloge mit unterschiedlichen Attributen.

Caching & Sessions

Schnelle Key-Value-Zugriffe mit Sub-Millisekunden-Latenz. Klassischer Use Case für Redis – siehe Lektion 8.

Graph-Beziehungen

Soziale Netzwerke, Empfehlungssysteme, Routenplanung. Tiefe JOINs wären in SQL zu teuer. Spezial-DB: Neo4j.

Globale Verteilung

Daten in mehreren Rechenzentren, Replikation über Kontinente. Klassische DBs strugglen mit Konsistenz, NoSQL ist dafür gebaut.

Für viele dieser Use Cases existieren spezialisierte NoSQL-Datenbanken – kein Universal-Tool, sondern Werkzeug-Kasten. Welcher Typ für welchen Use Case taugt, schauen wir uns in Lektion 2 an.

5) Wo NoSQL Nachteile hat

Genauso wichtig wie die Stärken sind die Schwächen. Wer sie ignoriert, baut sich Schmerzen ein. Drei häufige Stolpersteine:

Schwächere Konsistenz-Garantien: viele NoSQL-Systeme bieten nur „Eventually Consistent" statt voller ACID. Heißt: kurz nach einem Schreibvorgang können andere Knoten noch alte Daten liefern. Für Likes okay, für Kontostände nicht. Mehr dazu im CAP-Theorem (Lektion 3).
Weniger Standardisierung: SQL ist normiert, NoSQL nicht. Jede DB hat eine eigene Query-Sprache, eigene Tools, eigene Konzepte. Wechsel von MongoDB zu Cassandra ist viel mehr Arbeit als von MySQL zu PostgreSQL.
Komplexe Abfragen sind schwerer: Was in SQL ein einziger JOIN ist, wird in vielen NoSQL-DBs zu mehreren Round-Trips oder zur Datenduplikation. Geschäfts-Reports, die in SQL trivial sind, werden oft kompliziert.

Die ehrliche Wahrheit: relationale DBs sind nicht schlecht. Sie sind seit 50 Jahren weiterentwickelt, hochoptimiert, robust. Wenn dein Use Case in eine relationale DB passt, nimm eine. NoSQL nur dort, wo die SQL-Welt an echte Grenzen stößt.

6) Polyglot Persistence – das pragmatische Ende

Der heutige Standard in größeren Architekturen heißt Polyglot Persistence: man nutzt mehrere Datenspeicher parallel, jeweils für das, was sie am besten können. Ein typisches Setup:

Eine relationale DB (PostgreSQL, MySQL) für die Kerngeschäftsdaten mit ACID-Anforderungen: Kunden, Bestellungen, Rechnungen.
Eine Dokumenten-DB (MongoDB) für variable Daten: Produktkataloge mit unterschiedlichen Attributen, User-generated Content.
Ein Key-Value-Store (Redis) für Cache und Sessions: Login-Tokens, gerenderte Seiten, Counter.
Eine Such-Engine (Elasticsearch) für Volltextsuche.
Eine Graph-DB (Neo4j) für Empfehlungen und Beziehungs-Analysen.

Das macht die Architektur komplexer – aber jedes Tool macht das, wofür es gebaut ist. Wer alles in eine einzige DB stopft, optimiert für Einfachheit, zahlt aber an anderer Stelle (Performance, Kosten, Skalierung).

Zusammenfassung

NoSQL („Not Only SQL") ist eine Familie nicht-relationaler Datenbanken, die ab Mitte der 2000er als Antwort auf die Skalierungs-Probleme der Web-Riesen entstand. Drei Hauptgründe für NoSQL: horizontale Skalierung (viele günstige Server statt eines großen, „Scale out"), Schema-Flexibilität (unterschiedliche Datensätze in einer Collection, keine ALTER TABLE-Schmerzen), angepasste Datenmodelle für spezifische Use Cases (Dokumente, Key-Value, Graphen, Spalten). NoSQL ist kein Ersatz für SQL, sondern ein Ergänzung für spezielle Use Cases: Big Data, hochfrequente Schreibvorgänge, unstrukturierte Daten, Caching, Graphen, globale Verteilung. Nachteile: schwächere Konsistenz, weniger Standardisierung, komplexere Abfragen. Modernes Pragma: Polyglot Persistence – mehrere Datenspeicher kombinieren, jeden für das was er kann.