Df Sum Sq Mean Sq F value Pr(>F)
dosis_fac 1 6834 6834 167.1 9.38e-12 ***
Residuals 22 900 41
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
DS3 - Vom experimentellen Design zur
explorativen Datenanalyse & Data Mining
Saskia Otto
Universität Hamburg, IMF
Wintersemester 2024/2025
Das Modul wird als vollständig abgeschlossen betrachtet, sobald beide Komponenten erfolgreich absolviert wurden.
VL | Datum | Thema | Übung |
---|---|---|---|
1 | 15.11.2024 | Moduleinführung und Wiederholung DS2 | → Übung 1 |
2 | 22.11.2024 | 2-faktorielle, gekreuzte Varianzanalyse (ANOVA) | → Übung 2 |
3 | 29.11.2024 | Kovarianzanalyse (ANCOVA) | → Übung 3 |
4 | 06.12.2024 | Lineare Gemischte Modelle und verschachtelte ANOVA | → Übung 4 |
5 | 13.12.2024 | Multiple lineare Regression | |
6 | 20.12.2024 | VIDEO: Open Science und R Markdown | |
- | Weihnachtsferien | ||
7 | 10.01.2025 | Resampling-Techniken | → Übung 5 |
8 | 17.01.2025 | Unsupervised Learning 1: Clusteranalyse | → Übung 6 |
9 | 24.01.2025 | Unsupervised Learning 2: PCA | → Übung 7 |
10 | 31.01.2025 | Wiederholung |
Gruppe | Tag & Zeit | Raum | Dozent*in |
---|---|---|---|
A | Mo, 13:00-14:30 | IPM, E.303 | Prof. Dr. Jochen Fründ |
B | Mo, 13:00-14:30 | IPM, E.004 | Dr. Dragan Matevski |
C | Mi, 10:30-12:00 | IPM, gr. HS | Nadine Hauschild |
D | Mi, 10:30-12:00 | IZS, 115 | Dr. Kim Rohlfing |
E | Fr, 13:15-14:45 | IZS, Kosswig-Saal | Dr. Monika Eberhard |
F | Fr, 13:15-14:45 | IZS, 116 | Dr. Kim Rohlfing |
BMARSYS | Mo, 14:00-15:30 | IMF, GES, 107 | Dr. Saskia Otto |
Weitere Fragen?
Image by starline on Freepik
Die Explorative Datenanalyse (EDA) und Data Mining sind zwei verschiedene, jedoch miteinander verbundene Konzepte im Bereich der Datenanalyse:
→ Die Wissenschaft des Lernens spielt eine Schlüsselrolle in den Bereichen Statistik, Data Mining und künstliche Intelligenz und überschneidet sich mit Bereichen der Ingenieurwissenschaften und anderen Disziplinen.
Bildquelle: Morimoto & Ponton (2021): Virtual reality in biology: could we become virtual naturalists?
Bildquelle: James et al. (2013): Introduction to Statistical Learning
Die Trainingsfehlerrate (\(MSE_{train}\)) unterscheidet sich oft erheblich von der Testfehlerrate (\(MSE_{test}\)). Insbesondere bei sehr flexiblen Modellen kann die Trainingsfehlerrate die Testfehlerrate drastisch unterschätzen.
Bildquelle: James et al. (2013): Introduction to Statistical Learning
Download-link dieses Cheatsheets: [datacamp.com](https://www.datacamp.com/cheat-sheet/)
Aber fangen wir erstmal wieder mit kleineren Datensätzen aus (eigenen) Datenerhebungen an …
Fragen, die Sie sich stellen sollten | Fest | Zufällig |
---|---|---|
Interessiert an den Unterschieden zwischen den Faktorstufen? | ☑️︎ | |
Ist der Faktor ein Behandlungseffekt? | ☑️ | |
Sind die Faktorstufen informativ? | ☑️ | |
Repräsentieren die Faktorstufen experimentelle Interventionen? | ☑️ | |
Sind die Faktorstufen speziell ausgewählt? | ☑️ | |
Kommen alle Stufen des Faktors im Experiment vor? | ☑️ | |
Kommen die Faktorstufen von der gleichen Population? | ☑️ | |
Gibt es viele Faktorstufen? | ☑️ | |
Soll auf andere Faktorstufen, die nicht im Experiment vorkommen, verallgemeinert werden? | ☑️ | |
Gibt es ein verschachteltes (nested) oder hierarchisches (Sub)sampling? | ☑️ |
Quelle: Lazic (2016) Experimental Design for Laboratory Biologists
Alle experimentellen Einheiten sind unabhängig und können zufällig allen Kombinationen von Behandlungsstufen zugeteilt werden.
\[\begin{align*} \text{Ergebnis} &= \text{Dosis} + \text{Fehler}\\ \text{(N - 1)} &= \text{(p - 1)} + \text{(N - p)}\\ \text{(7)} &= \text{(1)} + \text{(6)} \end{align*}\]
Df Sum Sq Mean Sq F value Pr(>F)
dosis_fac 1 6834 6834 167.1 9.38e-12 ***
Residuals 22 900 41
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
1-faktorielle ANOVA mit gemittelten Unterprobewerten
Df Sum Sq Mean Sq F value Pr(>F)
dosis_fac 1 2278 2278.1 83.87 9.54e-05 ***
Residuals 6 163 27.2
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Summary Measure Analysis’ der DS2 Fallstudie
Vorbereitung @home (s. Handbuch)
Dann testen Sie doch Ihr Wissen in folgendem Abschlussquiz…
Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Kurswebseite: Data Science 3