Praktikum „Parallele Programmierung“

Um Mehrkernprozessoren und Multiprozessoren effizient zu nutzen, genügt es nicht, ein serielles Programm zu schreiben. Vierkernsysteme sind auch schon bei Arbeitsplatzrechnern weit verbreitet. Standards wie MPI und OpenMP, erlauben es, in den Programmiersprachen C(++) und Fortran Code zu schreiben, welcher auch auf Hochleistungsrechnern lauffähig ist.

Im Praktikum werden wir das parallele Programmieren mit MPI und OpenMP erlernen und auch eigenständige Anwendungen (z.B. Spielelöser) in Gruppen entwickeln. Im Vergleich zu der Vorlesung Hochleistungsrechnen wird der Fokus auf der Praxis liegen.

Die Veranstaltung wird zum Teil auf Englisch gehalten.

Beachten Sie auch unsere allgemeinen organisatorischen Hinweise zu Praktika.

Ziel des Praktikums ist es, die wichtigsten Parallelisierungskonzepte kennen zu lernen und Problemstellungen selbstständig im Team zu bearbeiten. Die Studierenden gewinnen eine Übersicht über hilfreiche Werkzeuge zur Entwicklung und Bewertung von Anwendungen.

Das Projekt eignet sich für Studierende der Informatik in den Diplom- und Bachelorstudiengängen. Studierende anderer Studiengänge müssen die Anrechnung mit dem jeweiligen Prüfungsausschuss klären.

Interessierte Zuhörer sind auch herzlich willkommen.

Die Veranstaltung wird auf Englisch stattfinden.

Zeit		Mittwoch, 16–18 Uhr
Ort		DKRZ, Raum 034
Beginn		Mi, 6. Apr. 2016, 16:15 Uhr
Vorbesprechung		Mi, 6. Apr. 2016, 16:15 Uhr
Mailingliste		PAPO-16

Dr. Julian Kunkel (Ansprechpartner)
Nabeeh Jumah

Zunächst werden die Grundlagen theoretisch vermittelt und mit kleinen Beispielen geübt. Im zweiten Teil werden in kleinen Gruppen jeweils unterschiedliche Problemstellungen bearbeitet. Hierbei wird ein (kleiner) Projektplan erstellt und im Team eine Anwendung zur Problemlösung implementiert. Status und aufgetretene Probleme werden regelmäßig gemeinsam besprochen.

Optimale Spielzüge ermitteln (Suchbaumverfahren) für Spiele.
(Einfache) Räuber-Beute-Beziehung eines abgeschlossenen Systems mit Tierwanderung.
Autos im Straßenverkehr eines Stadtnetzes und entstehende Staus.

Für weitere Vorschläge sind wir offen. Wichtig ist vor allem die korrekte Parallelisierung (evtl. mit Alternativen) und Auswertung. Detaillierte Kenntnisse der Numerik sind nicht erforderlich.

Vorgeschlagene Themen:

Astrophysikalische Berechnungen
Skat, Go oder Robotersimulation
Längste Wege Problem
Lösen großer logischer Formeln
Algorithmen aus der Bioinformatik
Strategien zur Platzierung von Flugzeugpassagieren

Bei der Durchführung der Projektes sollten einige Inhalte bearbeitet werden und entsprechend in Präsentation und Ausarbeitung einfließen.

Konzepte des zugrundeliegenden (Anwendungs)-Modells
Parallelisierungsschema (Kommunikationsmuster, Verteilung der Daten & Aufgaben)
- Es sollte mit MPI parallelisiert werden (optional: Shared-Memory Parallelisierung mit Threads oder OpenMP).
Leistungsanalyse des sequentiellen Codes (Verhält sich dieser Erwartungskonform)
Skalierungsverhalten der parallelen Version
- Speedup-Diagramme
- Potentiell Analyse mit Vampir/Sunshot
Durchführung einer Optimierung der parallelen Version (Kommunikationsschema etc.)

Vorbesprechung (06.04.2016), Beschreibung des Praktikums, Architekturen, Programmierkonzepte von OpenMP und MPI, Gebietszerlegung und Aufgabenteilung.
Theoretische Grundlagen (in der Vorlesungszeit)
- 13.04.2016 - Praktisches: Einführung in C, Versionsverwaltung, Clusternutzung, Programmierkonzepte von OpenMP und MPI (2)
  - Übung: erste Schritte mit OpenMP und MPI auf unserem Cluster, anlegen eines Repositories und Testbeispiele verwalten. Übungsblatt 1
  - Literatur zum Nachlesen:
    - Folien in der Vorlesung: Architekturen: 17-46, Anwendungsklassen: 201-241, Threads: 304-381
    - Versionsverwaltung
- 20.04.2016 - Speichermanagement von C/Fortran, Einführung in Debugging, MPI, Individuelle und kollektive Operationen im Detail, nicht-blockierende Aufrufe, Parallelisierung von Anwendungen
  - Übung: einfache Probleme selbständig parallelisieren. Werkzeuge: GDB bzw. DDT+Valgrind. Übungsblatt 2
  - Debugging Segmantation Faults
  - Debugging: GDB Valgrind
  - Executables
  - MPI Tutorial
  - Vorlesung MPI: 251-277
- 27.04.2016 Der Termin fällt aus.
- 04.05.2016 Leistungsbewertung von Anwendungen, PGAS - Folien
  - Einfaches Modell für Leistungsengpässe; CPU: Betrachtungen zu FLOPS, Instructions per Second, Cache-Hit/Miss Ratio, …
  - Literatur:
  - Übung: Amdahls Gesetz, Speedup-Diagramme bewerten, Projekt-Aufgabenstellung.Übungsblatt 3
- 11.05.2016 – OpenMP, Programmanalyse Werkzeuge Tolle Präsentation -- OpenMP and Performance Tasking Präsentation OpenMP Tutorials sind hier verlinkt
- Folien zur Leistungsanalyse mit Vampir
  - Übung: OpenMP, Leistungsanalyse, Verschiedene Code-Fragmente parallelisieren und die Leistung bewerten. Übungsblatt 4
- 25.05.2016 Wir sind in R207 – Processor-level parallelism, intrinsics in C, low-level memory management (Nabeeh Jum'ah)
Projektbearbeitung (je nach Absprache auch in der vorlesungsfreien Zeit)
- Hinweise zur Projektbearbeitung Hinweise zur Projektarbeit
- 08.06.2016 – Projektvorstellung und Präsentation der algorithmischen Lösung und Projektplan
- 13.07.2016 Statustreffen – Vorstellung der bisherigen Arbeiten und aufgetretene Probleme
- 17.08.2016 Statustreffen – Vorstellung der bisherigen Arbeiten und aufgetretene Probleme, erste Leistungsergebnisse
- 21.09.2016 Abschlusstreffen – Präsentation der Ergebnisse

Autor: Jonas Tietz

In diesen Projekt habe ich versucht Emissionen im zweidimenstionalen Raum zu simulieren. Dafür habe ich statt einzelne Partikel zu simulieren alles in Zellen unterteilt.

Präsentation – Bericht – Code

Git online kurs
Introduction to HPC (BUCH!)
Empfehlenswerte Übersicht
Vorlesung HR Folien
Programmierung: C Fortran
Debugging: GDB Valgrind
Wikipedia MPI
MPI Tutorial
Git for Computer Scientists
Heap vs. Stack Call Stack/Stackframe Stack im Detail auf Deutsch
OpenMP Tutorials sind hier verlinkt
OpenMP Tutorial GCC Doku zu OpenMP und Links zum Standard
Links zu den MPI Standards
Executables
Debugging Segmantation Faults
Nice MPI Presentation
MPI Function Man-Pages sehr detailliert mit Beispielen!
MPI-2 Standard Beschreibung
MPI-2 Beschreibung von Maui
Pthread-Programmierung und schöne Erklärung von Threads
Interne Verarbeitung von OpenMP und Auto-Parallisierung im GCC (von 2006) - OpenMP and automatic parallelization in GCC
GCC Features um parallel zu programmieren, auch eine schöne kurze Übersicht über die parallele Programmierung Parallel programming with GCC
GCC Optimierungsflags GCC Handbuch HTML
SIMD Assembler Instruction Sets HTML , GCC Inline Assembly Guide HTML Assembly Language FPU
Analyse: gprof Jumpshot Perf - Linux Counter + Kernel Analyse
Details zu Intel Architektur http://www.intel.com/products/processor/manuals/
Speicherbandbreite / Ausnutzung abschätzen mit Performance Countern http://software.intel.com/en-us/articles/detecting-memory-bandwidth-saturation-in-threaded-applications/
What Every Computer Scientist Should Know About Floating-Point Arithmetic http://docs.oracle.com/cd/E19957-01/806-3568/ncg_goldberg.html

Using MPI, 2nd Edition, by William Gropp, Ewing Lusk, and Anthony Skjellum, published by MIT Press ISBN 0-262-57132-3.
MPI: The Complete Reference, by Marc Snir, Steve Otto, Steven Huss-Lederman, David Walker, and Jack Dongarra, The MIT Press.
MPI: The Complete Reference - 2nd Edition: Volume 2 - The MPI-2 Extensions, by William Gropp, Steven Huss-Lederman, Andrew Lumsdaine, Ewing Lusk, Bill Nitzberg, William Saphir, and Marc Snir, The MIT Press.
Parallel Programming With MPI, by Peter S. Pacheco, published by Morgan Kaufmann.

Praktikum „Parallele Programmierung“

Beschreibung

Lernziel

Zielgruppe

Daten der Veranstaltung

Dozenten

Vorgehen

Beispiel Problemstellungen

Bearbeitung des Projektes

Zeitplan und Materialien

Ergebnisse

Emissions-Simulation

Literaturhinweise

Links

Bücher

HPS