Kurseinführung

Data Science 1 - Programmieren & Visualisieren

Saskia Otto & Monika Eberhard

Universität Hamburg, IMF

Wintersemester 2024/2025

Was ist ‘Data Science’?

Aktuell sehr populär!

Quelle: Screenshot der Harvard Business Review Website vom 11. November 2017.

Die perfekten Wissenschaftler

Die 5 Hauptkomponenten in Data Science

Das Data Science in Biology Programm

Übersicht der Bachelormodule

Zu diesem Modul

Lernziele

Am Ende dieses Moduls werden Sie…

Modulstruktur

Interaktive Vorlesungen

  • Web-basierte Vorlesungen (VL)
  • Quizze während der VL (HTML)
  • Paralleles Programmieren (RStudio Desktop/Workbench, Jupyter)
  • Abschließende Wissensquizze (HTML) als Vorbereitung zur Klausur
  • Hilfreich: Handy, Tablet oder Computer

Übungen

  • Praktische Übungen mittels swirl-Kurs bzw. R Skripten im Rahmen betreuter Gruppenarbeit
  • Angewandte Online-Quizze auf Moodle als weitere Vorbereitung zur Klausur
  • Bearbeitung einer Fallstudie mit abschließender Überprüfung (Moodle)
  • Nötig: Computer oder Tablet
  • Anwesenheitspflicht, 15% (= 2 Übungstage) Fehlzeit erlaubt

Vorlesungsthemen - Zeitplan

Termin: Montags, 11:15-12:45, Gr. Hörsaal (MLK 3)

  • Oktober: Data Science Allgemein
    • Einführung in Daten und Datenmanagement
    • Grundlagen der deskriptiven Statistik
    • Biologische Prozesse mathematisch beschreiben
  • November/Dezember: R Programmierung
    • Einführung in die (R) Programmierung
    • Grundlagen in R: Variablen und Vektoren
    • Grundlagen in R: Komplexere Objekte
    • Datenaufbereitung mit tidyverse
    • Datevisualisierung mit base R und ggplot2
    • Maßgeschneiderte ggplot2 Diagramme
  • Januar: Visualisierung
    • Grundlagen der Visualisierung
    • Kartenerstellung mit ggplot und interaktive Grafiken
    • Handhabung spezieller Datentypen
    • Fortgeschrittene Programmierung

Übersicht zu den Übungen

Gruppenzeiten

Gruppe Tag Zeit Ort BSc Betreuung
A Mo 14:00-15:30 IZS, gr. HS BIO Kathrin Otte
B Mo 14:00-15:30 IZS, Kosswig-HS BIO Marie-Christin Hardenbricker
C Mi 11:00-12:30 IPM, CvL-HS BIO Julian Mittmann-Götsch
D Mi 11:00-12:30 IPM, E.004 BIO Katrin Möller
E Mi 15:15-16:45 IZS, 017 BIO Marie-Christin Hardenbricker
F Mi 15:15-16:45 IZS, Kosswig-HS BIO Monika Eberhard
G Mi 15:30-17:00 IPM, E.303 BIO Dragan Matevski
H Mi 15:30-17:00 IPM, E.304 BIO Nadine Hauschild
I Do 14:15-15:45 IZS, Kosswig-HS BIO Kathrin Otte
J Do 14:15-15:45 IZS, gr. HS BIO Marie-Christin Hardenbricker
K Do 15:30-17:00 IPM, CvL-HS BIO Miriam Scriba
L Mi 13:15-14:45 IMF/GES, 107 BMARSYS Saskia Otto

Das Team

Dr. Monika Eberhard

Prof. Dr. Jochen Fründ

Prof. Dr. Kathrin Otte

Marie-Christin Hardenbricker

Dr. Saskia Otto

Julian Mittmann-Götsch

Katrin Möller

Nadine Hauschild

Miriam Scriba

Dr. Dragan Matevski

Moodle Kurs

MIN Moodle Zugang

  • Lernmaterial
  • VL Aufzeichnungen
  • Übungsdateien
  • Quizfragen
  • Fallstudien
  • Klausur
  • Kommunikation (Forum/Nachrichten)

Webseite mit Vorlesungsfolien

Kurswebseite: https://uham-bio.github.io/bsc-data-science-1/

Handbuch zum Modul


Das Handbuch enthält Hinweise und Erläuterungen zum Modul (Teil 1), den Übungsaufgaben (Teil 2) und den Fallstudien (Teil 3).

Übungsdateien zum Download

Vor der ERSTEN Übungsstunde von Moodle herunterzuladen!

Software

Vorbereitung zu den Übungen

Installieren Sie auf Ihrem Computer (Tablets funktionieren nicht):

Vor dem ERSTEN Übungsttag

Vor dem VIERTEN Übungsttag

Mehr Informationen zur Installation der Software finden Sie im Handout.

Fallstudien (ab Dezember)

  • Schriftlicher Leistungsnachweis: Bearbeitung einer Fallstudie die frei ausgewählt werden kann.
  • Jede Fallstudie
    • hat ein oder mehrere Datensätze und spezifische Fragen.
    • soll mithilfe einer umfangreichen Datenanalyse in R bearbeitet werden.
  • Abgabe:
    • R Skript
    • Kurzbericht (MS Word)
  • Abschlussfragebogen auf Moodle

Weitere Infos gibt es auf Moodle.

Buchempfehlungen

Hier ein paar Vorschläge…

Ready for the jump?

Quelle: www.pixabay.com (CCO 1.0 Lizenz)

Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de

Creative Commons License
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.