- 1 Abschnitt
- 7 Lektionen
- Um den Kurs in deinem Profil zu hinterlegen klicke oben auf Starten
Aufgaben
Aufgabe 1: Big Data Technologien
Frage 1: Was ist Apache Hadoop und welche Hauptkomponenten gehören zu diesem Framework? Beschreibe kurz jede Komponente.
Frage 2: Was sind die Hauptvorteile von Apache Spark im Vergleich zu Hadoop?
Aufgabe 2: Datenanalyse-Tools und -Techniken
Frage 3: Erkläre, wofür die Python-Bibliothek Pandas verwendet wird. Nenne zwei Beispiele für typische Datenmanipulationen, die mit Pandas durchgeführt werden können.
Frage 4: Beschreibe die Grundfunktionen von SQL und gib ein Beispiel für eine SQL-Abfrage, die Daten aus einer Tabelle abruft und aggregiert.
Aufgabe 3: Datenvisualisierung
Frage 5: Nenne drei Tools zur Datenvisualisierung und beschreibe jeweils einen wichtigen Vorteil jedes Tools.
Frage 6: Welche Visualisierungstechnik würdest du verwenden, um Verkaufstrends über die Zeit darzustellen, und warum?
Aufgabe 4: Best Practices für die Datenverarbeitung und -analyse
Frage 7: Warum ist die Datenbereinigung ein wichtiger Schritt in der Datenverarbeitung? Nenne zwei konkrete Beispiele für Datenbereinigung.
Frage 8: Erkläre, warum die Automatisierung von Datenverarbeitungsaufgaben von Vorteil ist. Gib ein Beispiel für eine Aufgabe, die automatisiert werden kann.
Aufgabe 5: Anwendungsfall
Frage 9: Stelle dir vor, du arbeitest für ein Unternehmen, das seine Marketingstrategien basierend auf Kundendaten optimieren möchte. Beschreibe einen Datenanalyse-Workflow, der von der Datenextraktion bis zur Visualisierung reicht.
Frage 10: Du sollst ein Dashboard erstellen, das verschiedene Verkaufsdaten visualisiert. Welche Visualisierungstechniken und -tools würdest du verwenden und warum?
