Server- und Systemdokumentation

Server-Doku ist die Antwort auf die Frage „Was steht eigentlich in unserem Rack/in unserer Cloud/in unserer VM-Farm?" – und es ist eine Antwort, die sich konstant ändert: neue Server kommen dazu, alte werden deprovisioniert, Konfigurationen wachsen, Verantwortlichkeiten wechseln. Wer hier ohne System arbeitet, weiß nach 2 Jahren nicht mehr, welcher der drei „srv-app-irgendwas"-Server wofür zuständig ist. Diese Lektion zeigt dir die zwei Haupt-Doku-Ebenen (Hardware/Virtualisierung und Software-Stack), das Konzept des Server-Steckbriefs als kompakte Standard-Vorlage, die Integration mit der CMDB, die Automatisierung mit Infrastructure as Code (Ansible, Terraform) sowie die Stolperfallen. Server-Doku ist die Voraussetzung für Patch-Management, Backups, Incidents, DR – ohne sie ist Betrieb Glücksspiel.

1) Doku-Schichten – was wird wo dokumentiert?

Klick die Schichten an, um Details zu sehen:

Server-Doku-Schichten

2) Server-Steckbrief – die Standard-Vorlage

Pro Server ein Steckbrief, immer mit gleichem Aufbau. Beispiel für einen produktiven App-Server:

Server-Steckbrief: srv-erp-app01

srv-erp-app01.firma.local PRODUKTIV

Identifikation

Hostname:srv-erp-app01

FQDN:srv-erp-app01.firma.local

CMDB-ID:CI-00421

Asset-Tag:A-2024-0421

Erstellung:2024-08-15

Hardware / Virt.

Plattform:VMware ESXi 8.0

Cluster:cluster-prod01

vCPU:8

RAM:32 GB

Disk:100 GB OS + 500 GB Data

Betriebssystem

OS:Ubuntu 24.04.2 LTS

Kernel:6.8.0-50-generic

Patch-Stand:2026-04-09

Time-Zone:Europe/Berlin

EOL:April 2029 (LTS)

Netzwerk

IP (primary):10.0.20.21/24

Gateway:10.0.20.1

VLAN:20 (Server)

DNS:10.0.20.10, 10.0.20.11

FW-Regeln:FW-2024-088 (Wiki-Link)

Anwendung

App:Dynamics 365 BC

Version:25.2.20800.18

Service:bc-app-server.service

Endpoint:https://erp.firma.de

Lizenz:L-2024-088 (5J)

Verantwortlichkeit

Service-Owner:K. Wagner

Tech-Owner:M. Schmidt

On-Call:Bereitschaft IT-OPS

Backup-Owner:IT-OPS Team

Backup & HA

Backup-Tool:Veeam B&R 12

Backup-Plan:täglich 22:00 inkr., wöchentl. voll

RPO / RTO:1 h / 4 h

HA:Cluster + Replica srv-erp-app02

Monitoring

Tool:Zabbix

Dashboard:ERP-Stack

Critical:Service-Stop, Disk >90 %

Alert-Route:PagerDuty → On-Call

3) Pflichtfelder eines Server-Steckbriefs

Auch wenn die Vorlage individuell ist, gibt es Felder, die auf keiner fehlen dürfen:

Kategorie	Pflichtfelder
Identifikation	Hostname, FQDN, CMDB-ID, Erstellungs-Datum
Hardware / Virt.	Plattform (physisch/VMware/Hyper-V/Cloud), CPU, RAM, Disk
Betriebssystem	OS-Version, Patch-Stand, EOL-Datum
Netzwerk	IP, VLAN, Gateway, DNS, FQDN-Auflösung
Anwendung	Was läuft drauf? Version, Service-Name
Verantwortlichkeit	Service-Owner, Tech-Owner, On-Call-Kette
Backup	Wie? Wann? Wohin? RPO/RTO?
Monitoring	Tool, Alerts, Eskalation
Lifecycle	Erstellung, Patch, geplante Außerbetriebnahme

4) Infrastructure as Code als „lebende Doku"

Ein moderner Ansatz: Server-Konfiguration als Code. Mit Ansible, Terraform, Puppet wird die Doku zur ausführbaren Konfiguration:

# Ansible-Inventory: erp-server.yml
all:
  vars:
    os_family: Debian
    timezone: Europe/Berlin
  children:
    erp_app:
      hosts:
        srv-erp-app01:
          ansible_host: 10.0.20.21
          vcpu: 8
          ram_gb: 32
          role: erp_app_primary
          backup_schedule: daily-22
        srv-erp-app02:
          ansible_host: 10.0.20.22
          vcpu: 8
          ram_gb: 32
          role: erp_app_secondary
    erp_db:
      hosts:
        srv-erp-db01:
          ansible_host: 10.0.20.31
          vcpu: 16
          ram_gb: 64
          role: mssql_primary
          backup_schedule: hourly

Vorteile gegenüber statischer Word-Doku:

Versioniert in Git – jede Änderung mit Datum, Autor, Begründung.
Reviewbar – Pull Requests vor Anwendung.
Ausführbar – die Doku ist die Konfiguration. Drift zwischen Doku und Realität ist ausgeschlossen.
Reproduzierbar – Neu-Aufbau identischer Server in Minuten.
Auditierbar – Git-Log zeigt Wer-Wann-Was.

5) CMDB-Integration

Pro Server ein Configuration Item (CI) in der CMDB. Wichtige Beziehungen, die dort modelliert werden:

„runs on": srv-erp-app01 runs on cluster-prod01 (VMware)
„uses": srv-erp-app01 uses srv-erp-db01 (Daten)
„part of": srv-erp-app01 part of Service „ERP"
„owned by": srv-erp-app01 owned by Person K. Wagner
„located in": srv-erp-app01 located in Rack 12, Position 7-10 (RZ Hauptsitz)

Diese Beziehungen erlauben Impact-Analysen: „Was passiert, wenn srv-erp-db01 ausfällt?" → CMDB zeigt alle davon abhängigen CIs.

6) Discovery und Auto-Update

Die fleißigste Methode bringt nichts, wenn Mensch jeden Patch von Hand in die Doku eintragen muss. Moderne Setups arbeiten mit Discovery:

Agent-basiert: Tools wie Tanium, SCCM/MECM, Lansweeper, Intune haben Agents auf allen Geräten, melden Hardware, OS, Software automatisch.
Agent-less: SSH/WMI-Discovery scannt Netzwerk, sammelt Informationen. NetBox, Auvik, OpenAudIT.
Cloud-API: AWS/Azure/GCP haben eigene APIs zum Asset-Listing. Tools wie CloudKnox, Wiz nutzen das.
Ansible Facts: nach jedem Playbook-Lauf wird die aktuelle Konfig erfasst und kann in CMDB gespeist werden.

Ergebnis: die CMDB spiegelt die Realität, ohne dass jemand pflegt. Manuelle Felder gibt es nur dort, wo Discovery keine Informationen liefern kann (z. B. Service-Owner-Zuordnung).

7) Standard-Templates und Goldenes Image

Wer alle Server identisch aufsetzt, spart Doku-Aufwand:

Goldenes Image / Template: einmal pro OS-Familie sauber konfigurieren (NTP, DNS, SSH, Monitoring-Agent, Logging) – alle neuen Server aus diesem Template klonen.
Naming-Konvention: <rolle>-<zweck>-<nummer>, z. B. srv-erp-app01, srv-erp-db01, srv-fileserver01. Selbsterklärend.
Standard-Sizing: Klassen wie „Small/Medium/Large" mit definiertem CPU/RAM/Disk. Vereinfacht Doku und Kapazitätsplanung.
Tagging in Cloud: Owner, Environment (prod/test/dev), Cost-Center, Application als Tags.

8) Antipatterns

„Excel-Liste reicht." Bei 10 Servern ja, bei 100 nicht. Lösung: CMDB oder NetBox.
Hostnames willkürlich. WICKIE, RUFUS, BUTTERLOSER – nach 3 Jahren weiß niemand mehr, was wo läuft. Lösung: Naming-Konvention.
Nur ein „Server X läuft." in der Doku. Ohne Versionen, Service, Owner. Lösung: Pflicht-Steckbrief-Felder.
Patch-Stand nicht dokumentiert. Audit fragt: „auf welchem Patch-Level ist srv-erp-app01?" – niemand kann antworten ohne SSH. Lösung: automatisches Erfassen in CMDB.
Service-Owner = „IT". Allgemeiner Eintrag, niemand spezifisch. Bei Incident keine schnelle Ansprache. Lösung: konkrete Personen.
Doku-Drift. Konfiguration in Realität weicht von Doku ab, weil manuelle Änderungen nicht eingetragen wurden. Lösung: IaC und Drift-Detection.
Server „aus Versehen" deprovisioniert. War als „Test" markiert, war aber Prod. Lösung: Lifecycle-Status in CMDB, Schutz vor Löschung.
Doku ohne Lifecycle-Status. srv-old05 läuft noch, aber niemand weiß ob es noch gebraucht wird. Lösung: Status-Feld (planned / staging / prod / deprecated / decommissioned).
Lizenz-Doku fehlt. Bei Lizenz-Audit teure Strafzahlung. Lösung: pro Software-Komponente Lizenz-Info im Steckbrief.

Zusammenfassung

Server-Doku dokumentiert pro System fünf Schichten von Hardware/Virtualisierung über OS, Middleware und Anwendung bis zu Daten/Schnittstellen – standardisiert als Server-Steckbrief mit klaren Pflichtfeldern (ID, Hardware, OS+Patch-Stand, Netz, App, Owner, Backup, Monitoring). Moderne Variante: Infrastructure as Code mit Ansible/Terraform – die Konfiguration ist die Doku. Anbindung an die CMDB mit Discovery-Tools (Tanium, NetBox, MECM) automatisiert die Pflege. Naming-Konventionen, Goldenes Image und Tagging reduzieren den Doku-Aufwand drastisch.

Verwandte Lektionen: Betriebshandbuch · Netzwerk-Doku · CMDB · und mehrWeitere relevante LektionenAnsible-Playbooks Patch-Management RTO/RPO Failover Monitoring Windows-Server Linux systemd