KI und Machine Learning

Seit Ende 2022 kennt jeder den Begriff ChatGPT – und plötzlich redet die ganze Welt über Künstliche Intelligenz. Dabei ist KI keine neue Erfindung: der Begriff wurde 1956 auf der Dartmouth-Konferenz geprägt, die mathematischen Grundlagen reichen bis in die 1940er zurück. Was sich geändert hat, ist die Verfügbarkeit: durch billige Rechenkapazität (GPUs, Cloud), riesige Datenmengen und neue Architekturen (vor allem die Transformer-Architektur 2017) sind KI-Anwendungen plötzlich praktisch und für jeden zugänglich. Diese Lektion zeigt dir die Begriffshierarchie (KI → Machine Learning → Deep Learning → Generative KI), die drei großen Lernarten (Supervised, Unsupervised, Reinforcement), den typischen ML-Projekt-Lifecycle von Problem-Definition bis Modell-Betrieb, häufige Anwendungsfälle in der Industrie und Praxis sowie kritische Themen wie Bias, Halluzination, Datenschutz und EU AI Act. Tiefe Mathematik bleibt außen vor – es geht um Verständnis als IT-Profi.

1) Die Begriffshierarchie

Die wichtigsten Konzepte sind ineinander verschachtelt. Klick die Ringe:

KI · ML · Deep Learning · Generative KI

2) Die drei großen Lernarten

Welche Daten man hat, bestimmt, welche Lernart anwendbar ist. Wähle einen Tab:

Supervised vs. Unsupervised vs. Reinforcement Learning

Supervised
Learning

Unsupervised
Learning

Reinforcement
Learning

3) Generative KI – die GenAI-Welle seit 2022

Was ChatGPT, Claude, Gemini und Co. so durchschlagend macht: sie sind Large Language Models (LLMs), trainiert auf gigantischen Text-Mengen. Sie erzeugen Wahrscheinlich-passenden Text – nicht „echtes Verstehen" im menschlichen Sinn. Kern-Eigenschaften:

Eigenschaft	Bedeutung
Transformer-Architektur	Seit 2017 (Google-Paper „Attention is all you need") die dominante Architektur für LLMs
Pre-Training	Modell wird einmalig auf riesigen Datenmengen trainiert (Wochen, Millionen €)
Fine-Tuning	Anpassung an spezifische Aufgaben mit kleineren Datensätzen
Prompt Engineering	Geschickte Eingabe steuert die Ausgabe – ohne Modell anzufassen
RAG (Retrieval Augmented Generation)	Modell nutzt zusätzlich aktuelle Doku/Wissensbasis – beliebter Enterprise-Ansatz
Multimodal	Modelle verarbeiten heute Text, Bild, Audio, Video gleichzeitig
Inference vs. Training	Training ist teuer, Nutzung („Inference") billig pro Anfrage

4) Anwendungsfälle in Unternehmen

🤖Chatbots & virtuelle Assistenten

Kunden-Service automatisieren: häufige Fragen beantworten, Tickets vorklassifizieren, FAQ navigieren. Mit RAG auf eigene Doku.

📝Text-Generierung & -Zusammenfassung

Marketing-Texte, Produktbeschreibungen, Meeting-Protokolle, Mail-Entwürfe. Spart Zeit, braucht aber redaktionelle Kontrolle.

💻Code-Assistenz

GitHub Copilot, Claude, ChatGPT für Entwickler. Boilerplate-Code, Unit-Tests, Refactoring. Produktivitäts-Sprünge messbar.

🔍Predictive Maintenance

Sensordaten von Maschinen mit ML überwachen, Verschleiß vorhersagen. Klassischer Industrie-4.0-Anwendungsfall.

📊Forecasting / Demand Planning

Verkaufs-Prognosen, Bestände, Personalplanung – mit Zeitreihen-Modellen. Genauer als Excel-Schätzungen.

🛡Fraud Detection & Anomalie-Erkennung

Banken erkennen Kartenmissbrauch in Echtzeit, IT-Sicherheit erkennt ungewöhnliche Login-Muster (SIEM mit ML).

🖼Bild- & Mustererkennung

Qualitätskontrolle in der Produktion, medizinische Bildanalyse, Gesichtserkennung, Verkehrszeichenerkennung im Auto.

🎯Empfehlungs-Systeme

„Kunden kauften auch …" bei Amazon, Netflix-Empfehlungen, personalisierte Newsletter. Spotify-Playlists.

5) Der ML-Projekt-Lifecycle

Ein produktives ML-Projekt durchläuft mehrere Phasen – ähnlich Software-Entwicklung, aber mit eigenen Schritten:

ML-Lifecycle in 7 Schritten

Problem-DefinitionWas soll vorhergesagt/klassifiziert werden? Welcher Business-Wert? Welche Erfolgs-Metrik (Accuracy, Precision, Recall, F1, ROC)?

Daten-Sammlung & -VorbereitungDaten zusammenführen, säubern, fehlende Werte behandeln, Features engineeren. Oft 60-80 % der Projekt-Zeit. „Garbage in, garbage out" gilt eisern.

Modell-Auswahl & TrainingAlgorithmus passend zur Aufgabe wählen (Regression, Random Forest, Neural Net, LLM-Fine-Tuning, ...). Auf Trainings-Daten trainieren.

EvaluationModell-Qualität auf nicht gesehenen Test-Daten messen. Overfitting prüfen (Modell hat auswendig gelernt statt generalisiert).

DeploymentModell in Produktion bringen – als REST-API, eingebettet in Anwendung, on Edge. MLOps-Pipelines automatisieren das.

MonitoringModell-Leistung im echten Betrieb überwachen: Genauigkeit, Latenz, Anzahl Anfragen, Daten-Drift.

RetrainingModelle altern – Welt ändert sich, neue Muster entstehen. Regelmäßig mit neuen Daten nachtrainieren oder neu trainieren.

6) Risiken und kritische Themen

Thema	Bedeutung
Bias (Verzerrung)	Modell wurde auf einseitigen Daten trainiert und diskriminiert (z. B. Bewerbungs-Software, die Frauen benachteiligt)
Halluzination	LLMs erzeugen plausibel klingenden, aber falschen Text – kritisch in Medizin, Recht, Finance
Erklärbarkeit (XAI – Explainable AI)	Deep-Learning-Modelle sind „Blackboxes" – schwer zu erklären, warum sie eine Entscheidung trafen
Datenschutz	Trainings-Daten enthalten oft persönliche Daten – DSGVO-Konflikt, Recht auf Vergessen
Urheberrecht	Trainings-Daten umfassen oft urheberrechtlich geschütztes Material – Klagen gegen OpenAI, Midjourney usw.
Energieverbrauch	LLM-Training verschlingt enorme Strommengen – Green-IT-Konflikt
Job-Verdrängung	Erste Berufe (Textübersetzer, einfache Programmierung, Marketing-Texte) spürbar betroffen – mehr in L7
Missbrauch	Deepfakes, automatisierte Phishing-Mails, Desinformation, Wahl-Manipulation

7) Regulierung – EU AI Act

Die EU hat 2024 den weltweit ersten umfassenden AI Act verabschiedet (Verordnung 2024/1689). Kernpunkte:

Risiko-basierter Ansatz: KI-Systeme werden in 4 Kategorien eingeteilt
Unzulässig: Social Scoring, Manipulationen, biometrische Massen-Überwachung (mit Ausnahmen)
Hochrisiko: KI in kritischer Infrastruktur, Bildung, Beschäftigung, Strafverfolgung, Migration – strenge Auflagen, CE-Kennzeichnung
Begrenzte Risiken: Chatbots, Deepfakes müssen als KI-generiert gekennzeichnet werden (Transparenz-Pflicht)
Minimal: Spam-Filter, Spiele-KI – kaum Auflagen
Allgemeine KI-Modelle (LLMs): eigene Regeln, mit höheren Pflichten ab einer Schwelle (GPAI mit „systemischem Risiko")
Strafen: bis zu 35 Mio. € oder 7 % des weltweiten Jahresumsatzes
Inkrafttreten: gestaffelt 2025-2027

8) Antipatterns & Hype-Fallen

„KI für alles" als Allheilmittel. Erst Problem definieren, dann prüfen, ob KI passt. Viele Probleme lassen sich mit klassischen Regeln günstiger lösen.
Daten-Qualität ignorieren. Trainings-Daten sind unsauber, KI lernt schlechte Muster. Vorher saubere Daten-Strategie.
Halluzinationen blind vertrauen. ChatGPT-Output ungeprüft an Kunden senden – peinliche Falschauskünfte sind häufig.
Kein Human-in-the-Loop. Bei kritischen Entscheidungen (Medizin, Kredit, Recht) muss Mensch im Loop sein.
Modell deployt, dann vergessen. Kein Monitoring, kein Retraining. Modell wird über Monate schlechter (Daten-Drift).
Personenbezogene Daten in LLM-API senden. ohne Privacy-Schutz – DSGVO-Risiko. Lösung: lokale Modelle oder pseudonymisierte Daten.
Schatten-KI in Fachabteilungen. Mitarbeiter nutzen private ChatGPT-Accounts mit Firmen-Daten. Lösung: enterprise-KI-Strategie, Schulung.
Erklärbarkeit übersehen. Kreditscore-Modell lehnt ab – Kunde fragt warum, niemand kann erklären. Rechtliches Problem.
Erfolgs-Metrik falsch gewählt. Accuracy reicht nicht bei unbalancierten Daten – Precision/Recall/F1 prüfen.
Bias nicht prüfen. Modell diskriminiert latent (Geschlecht, Herkunft, Alter). Reputations- und Rechts-Risiko.
„Wir trainieren ein eigenes LLM". Aus dem Stand kaum machbar – Training kostet zig Mio. €. Lösung: vorhandene Modelle fine-tunen oder RAG.

Zusammenfassung

Künstliche Intelligenz ist 2025 omnipräsent. Begriffe sind verschachtelt: KI umfasst alles, Machine Learning ist Teilmenge davon (lernt aus Daten), Deep Learning nutzt tiefe neuronale Netze, Generative KI erzeugt neue Inhalte (LLMs wie ChatGPT, Bildgeneratoren). Drei Lernarten: Supervised (mit Labels), Unsupervised (ohne Labels, Muster finden), Reinforcement (durch Belohnung/Strafe). Der ML-Lifecycle in 7 Schritten geht von Problem-Definition über Daten-Vorbereitung, Training, Evaluation, Deployment, Monitoring bis Retraining. Kritisch sind Bias, Halluzinationen, Erklärbarkeit, Datenschutz, Urheberrecht und Energieverbrauch. Der EU AI Act regelt seit 2024 KI mit risikobasiertem Ansatz und Strafen bis 35 Mio. €.

Verwandte Lektionen: Digitalisierung · Cloud-Megatrend · Gesellschaftliche Auswirkungen · und mehrWeitere relevante LektionenIoT Edge & 5G Green IT IT-Sicherheit IHK-Aufgaben