Data Science 2
Saskia Otto
Universität Hamburg, IMF
Sommersemester 2024
Nach Abschluss dieser VL und Übung..
Übernommen aus:
Lazic (2016) Experimental Design for Laboratory Biologists
→ Je länger die Dauer, desto besser ein EA-Design!
Quelle: Hurlbert (1984) Pseudoreplication and the Design of Ecological Field Experiments
Accuracy (~Treffgenauigkeit) = Nähe einer Schätzung zum wahren Wert des zu schätzenden Parameters.
Precision (~Exaktheit) = Grad der Übereinstimmung zwischen wiederholten Schätzungen.
Nachdem das Design des Experiments und die statistische Analyse bestimmt wurden, ergeben sich oft folgende 3 Fragen:
Power \propto \frac{ES~\alpha~\sqrt{n}}{\sigma^2}
Die Teststärke steigt proportional* mit
→ Durch Umstellung der Gleichung kann jede dieser 5 Größen berechnet werden, wenn die anderen 4 gegeben sind.
*Wie genau die Teststärke sich ändert, hängt von der Analyse ab.
Cohen, J. (1992): A Power Primer, Psychological Bulletin 112(1): 155-159
Um die Stichprobengröße für einen unabhängigen t-Test zu ermitteln, brauchen wir einfach nur die Formel der Teststatistik nach n umwandeln. Es gilt für gleiche Varianzen und Stichprobengrößen:
t=\frac{(\bar{X}_1-\bar{X}_2)}{\sqrt{2\frac{s_p^2}{n}}}=\frac{d}{\sqrt{2\frac{s_p^2}{n}}}~~\Rightarrow~~\sqrt{2\frac{s_p^2}{n}}=\frac{d}{t}~~\Rightarrow~~2\frac{s_p^2}{n}=\frac{d^2}{t^2}~~\Rightarrow~~n = \frac{2t^2s_p^2}{d^2}
power.t.test()
power.prop.test()
power.anova.test()
Wie groß muss die Stichprobe sein, damit der von uns beobachtete Unterschied von 1200 km statistisch nachweisbar ist?
Kenngröße | Buchfink | Mönchsgrasmücke |
---|---|---|
Mittelwert x̅ | 1800 km | 3000 km |
Standardabweichung s | ±900 km | ±1000 km |
Stichprobengröße n | 20 | 30 |
Bildquellen: Wikipedia (Buchfink unter (CC BY-SA 2.5 Lizenz) und Mönchsgrasmücke unter CC0 Lizenz)
Wie groß muss die Stichprobe sein, damit der von uns beobachtete Unterschied von 1200 km statistisch nachweisbar ist?
Und wie groß müsste die Stichprobe sein, wenn wir bereits einen Unterschied von 600 km bzw. 300 km statistisch nachweisen wollen?
Im vorliegenden Experiment betrug der Stichprobenumfang 20 und 30. Wie hoch wäre die Teststärke bei 20 oder bei 5 Vogelmessungen (in beiden Gruppen) gewesen, um einen Unterschied von 1200 km statistisch nachweisen zu können?
Angenommen es soll die Untersuchung des Zugverhaltens wiederholt werden, es können aber nur 8 Vögel jeweils untersucht werden. Welche Differenz könnte dann überhaupt statistisch nachgewiesen werden?
→ Die Differenz müsste mindestens 1433.3 km betragen, um überhaupt einen signifikanten Unterschied zwischen den beiden Arten nachweisen zu können.
Anstatt immer nur einzelne Szenarios durchzuspielen, ist es hilfreich, die Teststärke für mehrere Kombinationen an Parametern als Kurve zu visualisieren:
# Erstellen eines df mit versch. Kombinationen
df <- expand.grid(
n = seq(5, 40, 2),
sd = c(500,750,1000, 1250),
delta = c(500,1000),
power = NA
)
dim(df)
[1] 144 4
# Powerberechnung für jede der 144 Kombinationen
for (i in 1:nrow(df)) {
df$power[i] <- power.t.test(n = df$n[i], sd = df$sd[i],
delta = df$delta[i])$power
}
head(df)
n sd delta power
1 5 500 500 0.28593
2 7 500 500 0.40570
3 9 500 500 0.51333
4 11 500 500 0.60708
5 13 500 500 0.68671
6 15 500 500 0.75292
groups
: Anzahl der Gruppenn
: Stichprobenumfang pro Gruppe (Annahme balanciertes Design)between.var
: Varianz zwischen den Gruppenwithin.var
: Varianz innerhalb der Gruppensig.level
: Signifikanzniveaupower
: TeststärkeGewichtsunterschiede von Atlantischem Lachs, der in 4 verschiedenen Typen von Netzkäfigen gezüchtet wurde (n = 24).
Funktion | Poweranalyse für |
---|---|
pwr::pwr.t.test() |
t-Tests (1-2-Stichproben, unabhängig, gepaart) |
pwr::pwr.t2n.test() |
t-Test (2-Stichproben, ungleiches n) |
MKpower::power.welch.t.test() |
Welch t-Test |
WMWssp::WMWssp() |
Mann-Whitney U-Test (nur Berechnung n) |
pwr::pwr.chisq.test() |
Chi-Quadrat-Test |
pwr::pwr.anova.test() |
Balanced one-way ANOVA (gleiches n) |
MultNonParam::kwpower() und MultNonParam::kwsamplesize() |
Kruskal-Wallis-Test |
pwr::pwr.r.test() |
Korrelation |
WebPower::wp.regression() |
lineare Regression |
(siehe auch begleitendes VL-Skript)
Nützliche Open Source Software für Windows und Mac
Vor Beginn der quantitativen Studie..
Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Kurswebseite: Data Science 2