Literatur |
- Anand Rajaraman, Jure Leskovec, and Jeffrey Ullman, Mining of massive datasets, - Yucheng Low, Joseph Gonzalez, Aapo Kyrola, Danny Bickson, Carlos Guestrinand Joseph M. Hellerstein (2012). "Distributed GraphLab: A Framework for Machine Learning and Data Mining in the Cloud." PVLDB. |
Lerninhalte |
Speicherung, Abfrage, Analyse und Lernen von großen Datenmengen ist ein anspruchsvolles Thema, das erhebliche Auswirkungen in verschiedenen Bereichen der Industrie und der Wissenschaft hat. Die Vorlesung behandelt Grundbegriffe analysierender Verfahren des sogenannten "Big Data" sowie Beispiele für typische Anwendungen, die davon profitieren können. Die Vorlesung umfasst folgende Themengebiete: - Verteilte Dateisysteme und Datenspeicher-Frameworks - Computermodelle für große Daten (z.B. MapReduce und GraphLab) - Datenstrom Analyse - Statistische Lernverfahren für große Datenmengen - Large Scale Empfehlungssysteme - Link-Analyse |