- 1 Section
- 10 Lessons
- unbegrenzt
- IT-Trends & technologischer Wandel10
KI und Machine Learning
Seit Ende 2022 kennt jeder den Begriff ChatGPT – und plötzlich redet die ganze Welt über Künstliche Intelligenz. Dabei ist KI keine neue Erfindung: der Begriff wurde 1956 auf der Dartmouth-Konferenz geprägt, die mathematischen Grundlagen reichen bis in die 1940er zurück. Was sich geändert hat, ist die Verfügbarkeit: durch billige Rechenkapazität (GPUs, Cloud), riesige Datenmengen und neue Architekturen (vor allem die Transformer-Architektur 2017) sind KI-Anwendungen plötzlich praktisch und für jeden zugänglich. Diese Lektion zeigt dir die Begriffshierarchie (KI → Machine Learning → Deep Learning → Generative KI), die drei großen Lernarten (Supervised, Unsupervised, Reinforcement), den typischen ML-Projekt-Lifecycle von Problem-Definition bis Modell-Betrieb, häufige Anwendungsfälle in der Industrie und Praxis sowie kritische Themen wie Bias, Halluzination, Datenschutz und EU AI Act. Tiefe Mathematik bleibt außen vor – es geht um Verständnis als IT-Profi.
1) Die Begriffshierarchie
Die wichtigsten Konzepte sind ineinander verschachtelt. Klick die Ringe:
2) Die drei großen Lernarten
Welche Daten man hat, bestimmt, welche Lernart anwendbar ist. Wähle einen Tab:
Learning
Learning
Learning
3) Generative KI – die GenAI-Welle seit 2022
Was ChatGPT, Claude, Gemini und Co. so durchschlagend macht: sie sind Large Language Models (LLMs), trainiert auf gigantischen Text-Mengen. Sie erzeugen Wahrscheinlich-passenden Text – nicht „echtes Verstehen" im menschlichen Sinn. Kern-Eigenschaften:
| Eigenschaft | Bedeutung |
|---|---|
| Transformer-Architektur | Seit 2017 (Google-Paper „Attention is all you need") die dominante Architektur für LLMs |
| Pre-Training | Modell wird einmalig auf riesigen Datenmengen trainiert (Wochen, Millionen €) |
| Fine-Tuning | Anpassung an spezifische Aufgaben mit kleineren Datensätzen |
| Prompt Engineering | Geschickte Eingabe steuert die Ausgabe – ohne Modell anzufassen |
| RAG (Retrieval Augmented Generation) | Modell nutzt zusätzlich aktuelle Doku/Wissensbasis – beliebter Enterprise-Ansatz |
| Multimodal | Modelle verarbeiten heute Text, Bild, Audio, Video gleichzeitig |
| Inference vs. Training | Training ist teuer, Nutzung („Inference") billig pro Anfrage |
4) Anwendungsfälle in Unternehmen
🤖Chatbots & virtuelle Assistenten
Kunden-Service automatisieren: häufige Fragen beantworten, Tickets vorklassifizieren, FAQ navigieren. Mit RAG auf eigene Doku.
📝Text-Generierung & -Zusammenfassung
Marketing-Texte, Produktbeschreibungen, Meeting-Protokolle, Mail-Entwürfe. Spart Zeit, braucht aber redaktionelle Kontrolle.
💻Code-Assistenz
GitHub Copilot, Claude, ChatGPT für Entwickler. Boilerplate-Code, Unit-Tests, Refactoring. Produktivitäts-Sprünge messbar.
🔍Predictive Maintenance
Sensordaten von Maschinen mit ML überwachen, Verschleiß vorhersagen. Klassischer Industrie-4.0-Anwendungsfall.
📊Forecasting / Demand Planning
Verkaufs-Prognosen, Bestände, Personalplanung – mit Zeitreihen-Modellen. Genauer als Excel-Schätzungen.
🛡Fraud Detection & Anomalie-Erkennung
Banken erkennen Kartenmissbrauch in Echtzeit, IT-Sicherheit erkennt ungewöhnliche Login-Muster (SIEM mit ML).
🖼Bild- & Mustererkennung
Qualitätskontrolle in der Produktion, medizinische Bildanalyse, Gesichtserkennung, Verkehrszeichenerkennung im Auto.
🎯Empfehlungs-Systeme
„Kunden kauften auch …" bei Amazon, Netflix-Empfehlungen, personalisierte Newsletter. Spotify-Playlists.
5) Der ML-Projekt-Lifecycle
Ein produktives ML-Projekt durchläuft mehrere Phasen – ähnlich Software-Entwicklung, aber mit eigenen Schritten:
6) Risiken und kritische Themen
| Thema | Bedeutung |
|---|---|
| Bias (Verzerrung) | Modell wurde auf einseitigen Daten trainiert und diskriminiert (z. B. Bewerbungs-Software, die Frauen benachteiligt) |
| Halluzination | LLMs erzeugen plausibel klingenden, aber falschen Text – kritisch in Medizin, Recht, Finance |
| Erklärbarkeit (XAI – Explainable AI) | Deep-Learning-Modelle sind „Blackboxes" – schwer zu erklären, warum sie eine Entscheidung trafen |
| Datenschutz | Trainings-Daten enthalten oft persönliche Daten – DSGVO-Konflikt, Recht auf Vergessen |
| Urheberrecht | Trainings-Daten umfassen oft urheberrechtlich geschütztes Material – Klagen gegen OpenAI, Midjourney usw. |
| Energieverbrauch | LLM-Training verschlingt enorme Strommengen – Green-IT-Konflikt |
| Job-Verdrängung | Erste Berufe (Textübersetzer, einfache Programmierung, Marketing-Texte) spürbar betroffen – mehr in L7 |
| Missbrauch | Deepfakes, automatisierte Phishing-Mails, Desinformation, Wahl-Manipulation |
7) Regulierung – EU AI Act
Die EU hat 2024 den weltweit ersten umfassenden AI Act verabschiedet (Verordnung 2024/1689). Kernpunkte:
- Risiko-basierter Ansatz: KI-Systeme werden in 4 Kategorien eingeteilt
- Unzulässig: Social Scoring, Manipulationen, biometrische Massen-Überwachung (mit Ausnahmen)
- Hochrisiko: KI in kritischer Infrastruktur, Bildung, Beschäftigung, Strafverfolgung, Migration – strenge Auflagen, CE-Kennzeichnung
- Begrenzte Risiken: Chatbots, Deepfakes müssen als KI-generiert gekennzeichnet werden (Transparenz-Pflicht)
- Minimal: Spam-Filter, Spiele-KI – kaum Auflagen
- Allgemeine KI-Modelle (LLMs): eigene Regeln, mit höheren Pflichten ab einer Schwelle (GPAI mit „systemischem Risiko")
- Strafen: bis zu 35 Mio. € oder 7 % des weltweiten Jahresumsatzes
- Inkrafttreten: gestaffelt 2025-2027
8) Antipatterns & Hype-Fallen
- „KI für alles" als Allheilmittel. Erst Problem definieren, dann prüfen, ob KI passt. Viele Probleme lassen sich mit klassischen Regeln günstiger lösen.
- Daten-Qualität ignorieren. Trainings-Daten sind unsauber, KI lernt schlechte Muster. Vorher saubere Daten-Strategie.
- Halluzinationen blind vertrauen. ChatGPT-Output ungeprüft an Kunden senden – peinliche Falschauskünfte sind häufig.
- Kein Human-in-the-Loop. Bei kritischen Entscheidungen (Medizin, Kredit, Recht) muss Mensch im Loop sein.
- Modell deployt, dann vergessen. Kein Monitoring, kein Retraining. Modell wird über Monate schlechter (Daten-Drift).
- Personenbezogene Daten in LLM-API senden. ohne Privacy-Schutz – DSGVO-Risiko. Lösung: lokale Modelle oder pseudonymisierte Daten.
- Schatten-KI in Fachabteilungen. Mitarbeiter nutzen private ChatGPT-Accounts mit Firmen-Daten. Lösung: enterprise-KI-Strategie, Schulung.
- Erklärbarkeit übersehen. Kreditscore-Modell lehnt ab – Kunde fragt warum, niemand kann erklären. Rechtliches Problem.
- Erfolgs-Metrik falsch gewählt. Accuracy reicht nicht bei unbalancierten Daten – Precision/Recall/F1 prüfen.
- Bias nicht prüfen. Modell diskriminiert latent (Geschlecht, Herkunft, Alter). Reputations- und Rechts-Risiko.
- „Wir trainieren ein eigenes LLM". Aus dem Stand kaum machbar – Training kostet zig Mio. €. Lösung: vorhandene Modelle fine-tunen oder RAG.
Zusammenfassung
Künstliche Intelligenz ist 2025 omnipräsent. Begriffe sind verschachtelt: KI umfasst alles, Machine Learning ist Teilmenge davon (lernt aus Daten), Deep Learning nutzt tiefe neuronale Netze, Generative KI erzeugt neue Inhalte (LLMs wie ChatGPT, Bildgeneratoren). Drei Lernarten: Supervised (mit Labels), Unsupervised (ohne Labels, Muster finden), Reinforcement (durch Belohnung/Strafe). Der ML-Lifecycle in 7 Schritten geht von Problem-Definition über Daten-Vorbereitung, Training, Evaluation, Deployment, Monitoring bis Retraining. Kritisch sind Bias, Halluzinationen, Erklärbarkeit, Datenschutz, Urheberrecht und Energieverbrauch. Der EU AI Act regelt seit 2024 KI mit risikobasiertem Ansatz und Strafen bis 35 Mio. €.
Verwandte Lektionen: Digitalisierung · Cloud-Megatrend · Gesellschaftliche Auswirkungen · und mehrWeitere relevante LektionenIoTEdge & 5GGreen ITIT-SicherheitIHK-Aufgaben
