Seminar „Neueste Trends in Big Data Analytics“
Beschreibung
Das Buzzword “Big Data” bezeichnet umgangssprachlich große Datenmengen aber auch eine Industrie, welche aus diesen Daten mit Hilfe der Datenanalyse Wert schöpft. Big Data wird typischerweise neben ihrer Größe durch vier weitere Charakteristiken ausgezeichnet: ihrer Variabilität, dem stetigen und massiven Zuwachs an neuen Daten, potenziell schlechter Datenqualität und ihrer Komplexität.
Methoden aus der Statistik und des maschinellen Lernens ermöglichen es computergestützt Modelle von Sachverhalten zu erzeugen und zu verifizieren. Neue Erkenntnisse können so durch die automatisierte Auswertung dieser Daten gewonnen werden. Global-Players wie Google und Facebook nutzen diese Techniken beispielsweise um Werbung zielgerichtet zu platzieren und somit den Werbeerlös zu maximieren. Die Techniken sind jedoch auch in der Wissenschaft vielseitig einsetzbar, stellen jedoch einen Paradigmenwechsel in der wissenschaftlichen Arbeitsweise dar.
Im Seminar werden wir verschiedenste Teilgebiete von Big Data Analytics beleuchten und insbesondere aktuelle Trends und Forschungsbereiche kennen lernen, dies umfasst u.A. die Teilgebiete:
- Maschinelles lernen
- Deep learning
- Data Engineering
- Speicher- und Compute
- Analyseverfahren und Algorithmen
- Visualisierung
Das gewählte Thema kann nach Wunsch und Interesse der Studenten gestaltet werden.
Beachten Sie auch unsere allgemeinen organisatorischen Hinweise zu Seminaren.
Zielgruppe
Das Seminar eignet sich für Studierende im Bachelorstudiengängen mit Bezug zur Informatik sowie Masterstudiengängen. Interessierte Zuhörer sind auch herzlich willkommen.
Daten der Veranstaltung
Dozenten
- Christian Hovy
- Eugen Betke
- Jakob Lüttgau
Themenliste
- History of big data + AI
- Milestones + Tool development
- Public competitions (Kaggle, …)
- Moralic aspects of AI and big data
- Concepts
- Vega Visualisierungs-Grammatik
- Interaktive Visualisierung mittels JSON
- Generative AI / adversial networks: Content creation with deep learning
- Understanding p-value
- Practical simulation of p-value
- How to fool users
- Deep Neural Networks
- Going deeper with convolutions: https://www.cv-foundation.org/openaccess/content_cvpr_2015/html/Szegedy_Going_Deeper_With_2015_CVPR_paper.html
- Recurrent Neural Networks and Long short-term memory
- Incremental learning in deep neural networks (or other machine learning algorithms)
- Tensorflow: An open-source software library for Machine Intelligence
- Tensorflow Python API + TensorBoard visualization
- Mimicing the brain behavior
- Dendrite models
- Hierarchical Temporal Memory: https://de.wikipedia.org/wiki/Hierarchischer_Temporalspeicher
- Machine learning hardware
- Applied big data + machine learning
- Application of big data + machine learning in science
- Beating humans in complex board games (e.g., Go + Chess using deep Learning)
- AI in computer games
- Training body movement (arms, robots, …)
- Predicting system reliability (buildings, etc..)
- Big data and AI impact on future employment:
- Predicting/Tuning storage performance using AI
- Optimizing HPC systems with AI
- Computer vision
- Classifying images
- Big data + AI in healthcare
- Text analysis and natural language processing
- NGrams
- Skip-Thoughts
- Word2Vec
- Suicid prevention
- Stock market prediction
- Big Data Tools:
- Apache Flink Big Data Streaming + Batch Processing Engine
- Data management with the: Integrated Rule-Oriented Data System (iRODS)
- Big Data Tools in HPC environments, performance, optimizations, tools
- Cloud APIs to access big data services
- Workflow management with Apache NiFi + Apache Airflow
Zeitplan und Betreuer
- 16.10. 2017 – Vorbesprechung
- Vorgehensweise bei Seminaren
- Themenvorstellung
- Themenwahl
- 06.11. 2017
- 13.11. 2017 Fällt aus
- 20.11. 2017
- 04.12. 2017 Wir sind in Raum 023
Training body movement – Lennart Kordt 4)Predicting system reliability – Henri Engelhardt 5)- 11.12. 2017
- Generative AI / adversial networks: Content creation with deep learning – Nele Lips 6)
Präsentation – Ausarbeitung - 18.12. 2017
Beating humans in computer games – Tim Runge 9)- 08.01. 2018
- 15.01. 2018
- 22.01. 2018
Predicting/Tuning storage performance using AI – Max Brecht 16)- 29.01. 2018
- Money in the Big Data Age - Analyzing Blockchains – Frederik The 17)
Präsentation – Ausarbeitung
Literaturhinweise
- Bitcoin price prediction:
- Blockchains + AI:
- Games