Kurseinführung

Data Science 1 - Programmieren & Visualisieren

Saskia Otto

Universität Hamburg, IMF

Wintersemester 2022/2023

Was ist ‘Data Science’?

Aktuell sehr populär!

Quelle: Screenshot der Harvard Business Review Website vom 11. November 2017.

Die perfekten Wissenschaftler

Die 5 Hauptkomponenten in Data Science

Das Data Science in Biology Programm

Die DSB Module im Überblick

Bachelormodule | Übersicht

Bachelormodule | Semesterverteilung

Kursstruktur | Präsenz

Interaktive Vorlesungen

  • Web-basierte Vorlesungen (VL)
  • Quizze während der VL (HTML, ArsNova)
  • Paralleles Programmieren (RStudio Workbench, Jupyter)
  • Abschließende Wissensquizze (HTML) als Vorbereitung zur Klausur
  • Hilfreich: Handy, Tablet oder Computer

Übungen

  • Praktische Übungen mittels swirl-Kurs bzw. R Skripten und Notebooks im Rahmen betreuter Gruppenarbeit
  • Angewandte Online-Quizze auf Moodle als weitere Vorbereitung zur Klausur
  • Bearbeitung einer Fallstudie mit abschließender Überprüfung (Moodle)
  • Nötig: Computer oder Tablet

Kursstruktur | Selbststudium

Theorie

  • Vorlesungen als HTML-Dokumente jederzeit verfügbar
    • Mit abschließenden Quizfragen (HTML) als Vorbereitung zur Klausur
  • Screencast der VL (Moodle)

Praxis

  • Praktische Übungen mittels swirl-Kurs bzw. R Skripten und Notebooks im Selbststudium
  • Angewandte Online-Quizze auf Moodle als weitere Vorbereitung zur Klausur
  • Bearbeitung einer Fallstudie mit abschließender Überprüfung (Moodle)

Zu diesem Modul

Lernziele

Am Ende dieses Moduls werdet Ihr…

Vorlesungsthemen - Zeitplan

Termin: Montags, 11:15-12:45, Gr. Hörsaal (MLK 3)

  • Oktober: Data Science Allgemein
    • Einführung in Daten und Datenmanagement
    • Grundlagen der deskriptiven Statistik
    • Biologische Prozesse mathematisch beschreiben
  • November/Dezember: R Programmierung
    • Einführung in die (R) Programmierung
    • Grundlagen in R: Variablen und Vektoren
    • Grundlagen in R: Komplexere Objekte
    • Datenaufbereitung mit tidyverse 1: Import/Export und Bereinigung
    • Datenaufbereitung mit tidyverse 2: Aggregation und Transformation
  • Januar: Visualisierung
    • Datenexploration mit R
    • Grundlagen der Visualisierung und ggplot2
    • Maßgeschneiderte ggplot2 Diagramme
    • Kartenerstellung mit ggplot und interaktive Grafiken
  • Februar: Handhabung spezieller Datentypen

Webseite mit Vorlesungsfolien

Aktuelle Kurswebseite: https://saskiaotto.github.io/bio-bsc-data-science-1/

Moodle Kurs

MIN Moodle Zugang

  • Übungen
  • Quizfragen
  • VL Screencasts
  • Forum
  • Onlinemeetings

Fallstudien (ab Woche 10)

  • Schriftlicher Leistungsnachweis: Bearbeitung einer Fallstudie die frei ausgewählt werden kann.
  • Jede Fallstudie
    • hat ein oder mehrere Datensätze und spezifische Fragen.
    • soll mithilfe einer umfangreichen Datenanalyse in R bearbeitet werden.
  • Abgabe:
    • R Skript
    • Kurzbericht (MS Word, Libreoffice Writer)
  • Abschlussfragebogen auf Moodle
  • Weitere Infos gibt es auf Moodle.

Übersicht zu den Übungen

Themen

Woche Thema Gruppenzahl
1-4 Tabellenkalkulationsprogramm 5
5-10 R Grundlagen mit swirl 5
11-14 Visualisierung mit swirl bzw. Fallstudien 1 (freiwillig)

Gruppenzeiten

Gruppe Tag Zeit Ort Wer
A Mo 14:30-16:00 MLK, Gr. Hörsaal BIO BSc
B Mi 11:00-12:30 CvL/E.507 BIO BSc
C Mi 15:30-17:00 CvL/E.507 BIO BSc
D Do 15:00-16:30 CvL/E.507 BIO BSc
E Mi 13:15-14:45 IMF, GES BMARSYS BSc
A-E Fr 15:30-17:00 MLK, Gr. Hörsaal BIO/BMARSYS BSc

Weitere BetreuerInnen der Übungsgruppen

Buchempfehlungen

Hier ein paar Vorschläge…

  • Data Science mit R
    • The R Book von Michael J. Crawley (2013), 2. Edition, Wiley & Sons, Ltd., West Sussex, UK, 975 S. → online verfügbar als PDF zum Beispiel hier
    • R for Data Science von Hadley Wickham & Garret Grolemund (2017): , O’Reilly Media Inc., CA, U.S.A, 494 S. → online verfügbar
  • Visualisierung mit ggplot2
  • Visualisierung allgemein

Ready for the jump?

Quelle: www.pixabay.com (CCO 1.0 Lizenz)

Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de

Creative Commons License
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.