- 1 Section
- 10 Lessons
- unbegrenzt
- Hochverfügbarkeit & Disaster Recovery10
- 1.1Verfügbarkeit berechnen: die Neun-Regel
- 1.2MTBF und MTTR
- 1.3Single Point of Failure identifizieren
- 1.4USV – Unterbrechungsfreie Stromversorgung
- 1.5Load Balancing
- 1.6Clustering: Active-Active vs. Active-Passive
- 1.7Failover: automatisch und manuell
- 1.8Disaster-Recovery-Plan erstellen
- 1.9Business Continuity Plan (BCP)
- 1.10Aufgaben Hochverfügbarkeit
USV – Unterbrechungsfreie Stromversorgung
Bevor wir uns mit Clustern, Load-Balancing und Failover beschäftigen, kommt eine grundlegendere Frage: Was passiert wenn der Strom ausfällt? Alle Hochverfügbarkeits-Maßnahmen helfen nichts, wenn die Stromversorgung kippt. Genau dafür gibt's die USV – Unterbrechungsfreie Stromversorgung (englisch: Uninterruptible Power Supply, UPS).
Diese Lektion behandelt das Fundament jeder HA-Architektur: USV-Typen (Offline, Line-Interactive, Online), Dimensionierung nach Leistung und Laufzeit, die typischen Stromprobleme die eine USV abfängt, und die Verbindung zu Notstrom-Aggregaten. Pflicht-Wissen für FISI – fast jedes IT-Audit fragt danach.
1) Was eine USV macht
Eine USV ist ein Gerät zwischen dem Stromnetz und deinen Servern. Ihre Hauptaufgabe ist es, die Stromversorgung aufrechtzuerhalten, wenn das öffentliche Netz versagt oder Probleme hat. Sie hat drei Kernfunktionen:
- Überbrückung kurzer Ausfälle: bei kleinen Aussetzern (Millisekunden bis Sekunden) sofort einspringen, so dass kein Server merkt was passiert.
- Längere Stromausfälle abfedern: bei Black-Outs die Server lang genug versorgen, dass entweder ein Notstrom-Aggregat anspringt – oder die Systeme geordnet heruntergefahren werden.
- Strom-Qualität verbessern: Spannungsschwankungen, Über-/Unterspannung, Frequenzabweichungen, Netzstörungen ausgleichen.
Eine USV ist nicht dasselbe wie ein Notstrom-Aggregat. Die USV überbrückt nur kurze Zeit (typischerweise Minuten), das Aggregat liefert über Stunden Strom. Beide ergänzen sich – kein Ersatz füreinander.
2) Anatomie einer USV
Wie sieht eine USV von innen aus? Vier Hauptkomponenten arbeiten zusammen:
RICHTER
3) Die drei USV-Typen
Es gibt drei wichtige USV-Klassen, die sich in Preis, Funktion und Schutzlevel unterscheiden. Vom einfachen Heim-USV bis zur Online-USV im Rechenzentrum:
4) Welche Stromprobleme eine USV abfängt
„Stromausfall" ist nur eines von vielen möglichen Stromproblemen. Eine gute USV schützt vor neun verschiedenen Phänomenen, die alle Schäden anrichten können:
5) Dimensionierung: Wie groß muss die USV sein?
Beim Kauf einer USV musst du zwei Dinge bestimmen: die Leistung (in VA oder Watt) und die Überbrückungszeit (in Minuten). Beide hängen vom Verbraucher ab.
Die Leistung wird in Volt-Ampere (VA) oder Watt (W) angegeben. VA ist die Scheinleistung, W die Wirkleistung. Der Unterschied ist der Leistungsfaktor (Power Factor, PF), typischerweise 0,7 bis 1,0:
Die Überbrückungszeit hängt vom Verhältnis Last zu Batteriekapazität ab. Eine 1.500-VA-USV mit voller Last hält oft nur 5-10 Minuten durch. Bei halber Last entsprechend länger. Für längere Zeiten brauchst du Erweiterungs-Batterien oder mehrere USVs parallel.
6) Überbrückungszeit – wofür reicht sie?
Typische USV-Laufzeiten sind kürzer als viele denken. Hier eine Übersicht und was du damit erreichen kannst:
| Laufzeit | Realistisches Szenario | Was machbar ist |
|---|---|---|
| 1-2 Min | Kleine USV, halbe Last | Kurze Aussetzer überbrücken |
| 5-10 Min | Standard-USV, volle Last | Geordnetes Shutdown der Server |
| 15-30 Min | Standard-USV, halbe Last | Notstrom-Aggregat startet, Stand-By |
| 1-2 Std | Großdimensionierte USV / Erweiterungen | Kurze Stromausfälle ohne Aggregat überbrücken |
| 4+ Std | Spezial-USV mit großen Akku-Bänken | Längere Ausfälle in kritischer Infrastruktur |
Die typische Logik in Rechenzentren: USV überbrückt 5-15 Minuten, in dieser Zeit startet das Notstrom-Aggregat. Aggregat dann unbegrenzt, solange Diesel da ist (meist 24-72h ohne Nachtanken).
7) Notstrom-Aggregat (Diesel-Generator)
Für längere Stromausfälle reicht eine USV nicht. Dann kommt das Notstrom-Aggregat – meist ein Diesel-Generator. Funktionsweise:
- Stromausfall tritt ein
- USV übernimmt sofort (Server merken nichts)
- Automatik bemerkt den Ausfall, startet das Aggregat
- Aggregat braucht 10-60 Sekunden zum Anlaufen und Synchronisieren
- Automatik schaltet Aggregat in den Stromkreis
- USV wechselt zurück zum (jetzt vom Aggregat gespeisten) Eingang
- USV-Batterien werden wieder geladen
Wichtig dabei: regelmäßige Tests. Notstrom-Aggregate, die jahrelang nur warten, springen im Ernstfall oft nicht an – durch verharzten Diesel, leere Starterbatterie, festgegammelte mechanische Teile. Best Practice: monatlicher Lasttest, mindestens 30 Minuten Volllast.
8) Das mehrstufige Stromkonzept
In einem hochverfügbaren Rechenzentrum gibt's typischerweise mehrere Schutzstufen, die aufeinander aufbauen:
9) Batterietechnologien
USVs nutzen verschiedene Batterie-Typen. Die Wahl hat Einfluss auf Lebensdauer, Wartung und Kosten:
- Bleiakkus (VRLA / AGM): klassische, günstige Variante. Wartungsarm. Lebensdauer 3-5 Jahre. Müssen regelmäßig getauscht werden.
- Lithium-Ionen: moderne Alternative. Doppelte Lebensdauer (8-10 Jahre), kleiner, leichter, weniger Wärmeentwicklung. Aber deutlich teurer in der Anschaffung. Über Lebensdauer oft günstiger.
- Schwungrad-USVs (Flywheel UPS): speichern Energie mechanisch in einer rotierenden Masse. Lebensdauer 20+ Jahre, sehr wartungsarm, aber begrenzte Überbrückungszeit (10-30 Sek). Praktisch nur zur Überbrückung bis das Aggregat anläuft.
- Brennstoffzellen-USVs: Wasserstoff-basiert. Sehr lange Laufzeit ohne Nachfüllen. Nische, sehr teuer.
Wichtig: Batterien altern auch ohne Nutzung. Eine 5 Jahre alte Bleiakku-USV hat im Ernstfall vielleicht nur noch 30% ihrer angegebenen Laufzeit. Regelmäßige Tests sind essentiell.
10) USV-Management und Monitoring
Moderne USVs haben Netzwerk-Karten und können überwacht werden. Typische Features:
- SNMP-Monitoring: Batterie-Status, Last, Temperatur, Eingangs-/Ausgangs-Spannung auslesbar
- Web-Interface: lokale Verwaltung pro USV
- Shutdown-Software:
NUT(Network UPS Tools),PowerChute(APC),ViewPower(Eaton) – fahren Server bei niedriger Batterie automatisch herunter - Alert-Integration: in Monitoring-Systeme wie Prometheus, Zabbix, Nagios
- Lasttest-Funktionen: automatisierte regelmäßige Batterie-Tests
Hier ein einfaches Beispiel für die Integration unter Linux mit dem Open-Source-Tool NUT (Network UPS Tools):
11) USV-Wartung und Lebenszyklus
Eine USV ist kein „install and forget"-Gerät. Sie braucht regelmäßige Pflege:
- Quartalsweise: Sichtkontrolle, Lüftung prüfen, Logs auf Anomalien checken, Selbsttest auslösen
- Jährlich: Lasttest unter realer Last, Batterie-Health-Check, Verschleißteile prüfen
- Alle 3-5 Jahre: Batterien tauschen (bei Bleiakku-USVs), unabhängig vom Zustand
- Alle 5-10 Jahre: Komplette USV ersetzen oder generalüberholen lassen
Vor allem die Batterien werden oft vergessen. Eine USV mit 7 Jahre alten Akkus ist im Ernstfall fast nutzlos – die Batterien halten dann oft nur Sekunden statt der dokumentierten Minuten. Wartungs-Verträge mit dem Hersteller decken das oft ab.
12) Typische Fehler beim USV-Einsatz
Auch hier gibt's Anti-Patterns, die regelmäßig zu Schäden führen:
- USV nicht gewartet: alte Batterien, nie getestet → versagt im Ernstfall
- Unterdimensioniert: USV bricht ein wenn alle Server gleichzeitig hochfahren
- Überlastet: dauerhaft am Limit → kürzere Batterielebensdauer, gefährlich
- Falsche USV-Klasse: VFD für Server – zu langsame Umschaltung, Server crashen trotzdem
- USV als SPoF: nur eine USV ohne Redundanz → USV-Defekt = alles aus (siehe L3)
- Kein Auto-Shutdown: bei längerem Ausfall fährt nichts geordnet runter → Datenverlust
- Drucker und Monitor an der USV: ziehen unnötig Strom, verkürzen Laufzeit für wichtige Geräte
- Bypass nie getestet: USV-Wartung erfordert Bypass – wenn der nicht funktioniert, geht's auf Live-System
13) USV im redundanten Cluster
Für hohe Verfügbarkeit sollte die USV selbst nicht zum SPoF werden. Typische Architekturen:
- N+1: drei USVs für die Last von zweien – eine kann ausfallen ohne Probleme
- 2N (parallele Redundanz): zwei komplette USV-Anlagen mit je eigenem Stromkreis. Jeder Server hat zwei Netzteile, eines an Anlage A, eines an B
- Hot-Swap-Module: einzelne USV-Module können während des Betriebs getauscht werden
Diese Konzepte machen die USV-Infrastruktur selbst hochverfügbar – Voraussetzung für SLAs ab vier Neunen. Mehr zum allgemeinen Redundanz-Denken in L3 (SPoF).
Zusammenfassung
USV (Unterbrechungsfreie Stromversorgung) versorgt Server bei Stromproblemen weiter. Drei Klassen nach IEC 62040-3: VFD/Offline (5-10 ms Umschaltung, billig, für Heim-PC), VI/Line-Interactive (mit AVR, 2-5 ms, für KMU), VFI/Online (Double-Conversion, 0 ms, für Rechenzentrum). Anatomie: Gleichrichter → Batterie → Wechselrichter. 9 Strom-Probleme: Blackout, Sag, Surge, Spike, Undervoltage, Frequenzabweichung, Oberwellen, EMI, Switching-Transient. Dimensionierung: Watt × 1,3 / PF = VA. Plus 30% Reserve. Überbrückungszeit: typisch 5-15 Min, ab 30 Min mit Erweiterungs-Batterien. Mehrstufiges Schutzkonzept: 2 Stromkreise → USV → Notstrom-Aggregat → Diesel-Verträge → Graceful Shutdown. Tier I-IV nach Uptime Institute. Batterien: Blei (3-5 Jahre), Lithium (8-10 Jahre), Schwungrad (20+ Jahre), Brennstoffzelle (Nische). Monitoring via SNMP, NUT, PowerChute. Wartung: vierteljährlich Test, jährlich Lasttest, Batterietausch alle 3-5 Jahre. Anti-Patterns: nicht gewartet, unterdimensioniert, USV als SPoF, kein Auto-Shutdown. Redundanz: N+1 oder 2N für HA-Setups.
