Table of Contents

Projekt „Big Data“

Beschreibung

Das Buzzword “Big Data” bezeichnet umgangssprachlich große Datenmengen aber auch eine Industrie, welche aus diesen Daten mit Hilfe der Datenanalyse Wert schöpft. Big Data wird typischerweise neben ihrer Größe durch vier weitere Charakteristiken ausgezeichnet: ihrer Variabilität, dem stetigen und massiven Zuwachs an neuen Daten, potenziell schlechter Datenqualität und ihrer Komplexität.

Methoden aus der Statistik und des maschinellen Lernens ermöglichen es computergestützt Modelle von Sachverhalten zu erzeugen und zu verifizieren. Neue Erkenntnisse können so durch die automatisierte Auswertung dieser Daten gewonnen werden. Global-Players wie Google und Facebook nutzen diese Techniken beispielsweise um Werbung zielgerichtet zu platzieren und somit den Werbeerlös zu maximieren. Die Techniken sind jedoch auch in der Wissenschaft vielseitig einsetzbar, stellen jedoch einen Paradigmenwechsel in der wissenschaftlichen Arbeitsweise dar.

Im Projekt wird eine Einführung zu Big Data gegeben und dann aktuelle wissenschaftliche Fragestellungen vorgestellt. Anschließend werden über das Semester hinweg, die Aufgaben selbständig in Kleingruppen bearbeitet.

Diese Aufgaben umfassen u.A.

Das exakte Thema als auch der Anteil aus Programmiertätigkeit, Theorie und Evaluation kann gemeinsam mit den Betreuern nach Wunsch der Teilnehmer gestaltet werden.

Beachten Sie auch unsere allgemeinen organisatorischen Hinweise zu Projekten.

Zielgruppe

Das Seminar eignet sich für Studierende im Bachelorstudiengängen mit Bezug zur Informatik sowie Masterstudiengängen. Interessierte Zuhörer sind auch herzlich willkommen.

Daten der Veranstaltung

Ort DKRZ, Raum 034
Zeit Montag, 16:15-17:45 Uhr
Vorbesprechung Montag, 16.10.2017
Mailingliste BDP-1718

Dozenten

Themenliste

Die Themenliste ist nicht vollständig. Gerne gehen wir auf Eure Vorschläge ein.

Themenzuteilung (provisorisch)

Exploration der Eigenschaften von News

Teilnehmer: Alexander Spikofsky, Sara Yüksel

Code Präsentation Bericht

Analyse von News zur Suizidprevention

Teilnehmer: Nina Arndt, Melanie Budde, Ariana Sliwa

Betreuer: Julian Kunkel

Code Präsentation Bericht

Analyse von News-Artikeln – Sentimentanalyse mit Word2vec

Teilnehmer: Raffael Diestel, Maike Schubert

Code Präsentation Bericht

Wolkenkamera

Teilnehmer: Marcel Steger, Jan Zickermann

Betreuer: Tobias Finn, Julian Kunkel

Code Präsentation Bericht

Semantische Suche mit Apache Solr

Teilnehmer: Eike Knopp, Minh Hieu Nguyen

Betreuer: Andrej Fast, Heinrich Widmann, Julian Kunkel

PräsentationBerichtSourcecode

Big Data Platform für Erdsystemdaten

Teilnehmer: Nele Lips, Dominik Scherer

Betreuer: Jakob Lüttgau, Julian Kunkel

Code Präsentation Bericht

AI for a computer game

Teilnehmer: Friedrich Braun, Valentin Krön, Steven Buyten

Betreuer: Julian Kunkel, Eugen Betke

Chat bot

Teilnehmer: Felicitas Castrian, Paul Offner, Merlin Sewina

Betreuer: Julian Kunkel, Andrej Fast

Code Präsentation Bericht

Neuronale Netzwerke in der Klimamodellierung zur Prognose eines Zeitschritts

Teilnehmer: Tobias Machnitzki, Finn Burgemeister

Betreuer: Julian Kunkel, Tobias Finn

Diese Arbeit beschäftigt sich damit ein neuronales Netzwerk einzusetzen, welches nicht nur zur Erkennung von Mustern dient, sondern versucht die 2 m-Temperatur-Prognose eines Klimamodells hinreichend genau zu approximieren. Das Ziel ist es zu zeigen, wozu selbst einfachste neuronale Netzwerke in der Lage sind, verglichen mit einem sehr komplexen gekoppelten Klimamodell.

PräsentationBericht

Zeitplan

Als Vorgehensweise werden wir uns monatlich zu einem Status-Update treffen. Gerne können Arbeiten in der Vorlesungsfreien Zeit abgeschlossen werden. Ansonsten können individuelle Termine mit den Betreuern vereinbart werden.

Literaturhinweise