Data Science 2
Saskia Otto & Monika Eberhard
Universität Hamburg, IMF & IZS
Sommersemester 2025
Nach Abschluss dieser VL und Übung..
Können wir sagen dass, basierend auf unserer Stichprobe, die intraspezifische Streuung des Zugverhaltens bei Buchfinken allgemein kleiner ist als bei der Mönchsgrasmücke?
Bildquellen: Wikipedia (Buchfink unter CC BY-SA 2.5 Lizenz) und Mönchsgrasmücke unter CC0 Lizenz)
Das MODELL ist eine Erklärung für das Muster, es postuliert Regeln oder Prozesse.
Bildquellen: Goto & Takekata 2015, H.Y. Siry 2007
Abb. rechts: Meereswanderung des Atlantischen Lachses
(Atlantic Salmon Life Cycle, U.S. Fish & Wildlife Service, 2010)
→ Wenn H0 abgelehnt wird, akzeptieren wir unsere (Alternativ-) Hypothese H1 und damit unser Modell.
Beispiel:
Die Gesänge von Meisen in der Stadt und auf dem Land unterscheiden sich in ihrer durchschnittlichen Lautstärke.
Beispiel:
Kohlmeisen in der Stadt singen durchschnittlich lauter als auf dem Land.
Wichtig!
Die Alternativhypothese muss immer eine Effektgröße enthalten.
‘Es gibt keinen Unterschied’ kann daher keine H_A sein!
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
Die Varianz \sigma^2 bzw. s^2
Bildquellen: Wikipedia (Buchfink unter CC BY-SA 2.5 Lizenz) und Mönchsgrasmücke unter CC0 Lizenz)
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
Bildquellen: Wikipedia (Buchfink unter CC BY-SA 2.5 Lizenz) und Mönchsgrasmücke unter CC0 Lizenz)
Kenngröße | Buchfink | Mönchsgrasmücke |
---|---|---|
Mittelwert x̅ | 1800 km | 3000 km |
Standardabweichung s | ±900 km | ±1000 km |
Stichprobengröße n | 20 | 30 |
Folgende grundlegende Fragen müssen beantwortet werden:
Entscheidungsbaum (auch im Handbuch enthalten) sollte für die Fallstudie verwendet werden.
Entscheidung | H_0 trifft zu | H_0 trifft nicht zu |
---|---|---|
H_0 wird nicht abgelehnt | Richtige Entscheidung; kein Effekt nachgewiesen | \beta-Fehler; vorhandenen Effekt nicht nachgewiesen |
H_0 wird abgelehnt | \alpha-Fehler; Effekt nachgewiesen, den es nicht gibt | Richtige Entscheidung; vorhandenen Effekt nachgewiesen |
Fall 1 (links): Angenommen, wir testen die H_A, dass der Durchschnitt unserer Probe -4σ Einheiten von der H_0 entfernt sei und die H_A ist wahr. Dann ist für eine Zufallsprobe aus dieser Population die Wahrscheinlichkeit, dass sie in den Akzeptanzbereich von H_0 fällt (welcher bei ±1.96σ um μ liegt wenn α = 0.05), etwa 2.5% → β = 0.025 und die Teststärke ist dann 1-0.025=0.975 (im Durchschnitt würden wir für 97.5% aller Proben die H_0 korrekt verwerfen).
Fall 2 (rechts): Angenommen, der Unterschied der H_0 und H_A Population liegt nur noch bei -2σ Einheiten. Dann ist die Wahrscheinlichkeit, dass eine zufällig gewählte Probe von H_A außerhalb des kritischen Bereichs fällt (μ ± 1.96σ) nur noch 50%. Bei der Hälfte aller Proben würden wir also die H_0 fälschlicherweise akzeptieren (Fehler 2. Art).
Hier würden viele lieber einen Fehler 2. Art als einen Fehler 1. Art begehen:
Hier wäre es als Vorsichtsmaßnahme besser, einen Fehler 1. Art zu machen:
Was denken einige Statistiker über Signifikanz?
It is very bad practice to summarize an important investigation solely by a value of P.
Blind adherence to the 0.05 level denies any consideration of alternative strategies, and it is a serious impediment to the interpretation of data ( e.g. 0.049 is significant, but 0.051 is not significant).
Scientist care about whether a result is statistically significant, but they should care much more about whether it is meaningful.
Der statistische Test..
liefert eine Teststatistik (T) und eine Wahrscheinlichkeit (p-Wert) basierend auf dessen Prüfverteilung, dass das statistische Ergebnis so extrem ausfällt wie das beobachtete, wenn die Nullhypothese wahr wäre (nach der z.B. zwei Stichproben zur gleichen Grundgesamtheit gehören).
Bei den klassischen Tests sollte immer die Teststatistik, der bzw. die Freiheitsgrade (für die Prüfverteilung), und der p-Wert angegeben werden:
shapiro.test()
:
ks.test()
:
Kennwert: | \mu, \sigma^2 bzw. \bar{X} und s^2 |
H0: | X ist normalverteilt |
HA: | X ist nicht normalverteilt |
Teststatistik: | W |
alpha: | 5% |
p-Wert: | Vergleich Teststatistik W mit kritischen Wert für den Ablehnungsbereich (aus Verteilung der Teststatistik) |
Shapiro-Wilk normality test
data: bf
W = 1, p-value = 0.5
Shapiro-Wilk normality test
data: mgm
W = 1, p-value = 0.6
Built-in Funktion ks.test()
Exact one-sample Kolmogorov-Smirnov test
data: bf
D = 0.1, p-value = 0.9
alternative hypothesis: two-sided
Exact one-sample Kolmogorov-Smirnov test
data: mgm
D = 0.09, p-value = 0.9
alternative hypothesis: two-sided
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
Bildquellen: Wikipedia (Buchfink unter CC BY-SA 2.5 Lizenz) und Mönchsgrasmücke unter CC0 Lizenz)
Kennwert: | \sigma^2 bzw. s^2 |
H0: | \sigma^2_{BF} = \sigma^2_{MGM} bzw. F=1 |
HA: | \sigma^2_{BF} \neq \sigma^2_{MGM} bzw. F \neq 1 |
Voraussetzung: | Erfüllt (Daten sind normal verteilt) |
Teststatistik: | F = \frac{\text{größeres}~s_1^2}{\text{kleineres}~s_2^2}* |
alpha: | 5% |
FG: | FG1 = n1-1; FG2 = n2-1 |
p-Wert: | Der F-Wert wird mit dem F_{krit} aus der F-Verteilung verglichen. |
*Die größere Varianz kommt in den Zähler. Damit ist F immer ≥ 1.
Manuelle Berechnung in R
[1] 1.23
[1] 2.08
[1] 0.641
Automatische Berechnung mit der Built-in Funktion var.test()
F test to compare two variances
data: mgm and bf
F = 1, num df = 29, denom df = 19, p-value = 0.6
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.514 2.755
sample estimates:
ratio of variances
1.23
03:00
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "setosa"]
W = 1, p-value = 0.5
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "versicolor"]
W = 1, p-value = 0.5
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "virginica"]
W = 1, p-value = 0.3
set <- iris$Sepal.Length[iris$Species=="setosa"]
ver <- iris$Sepal.Length[iris$Species=="versicolor"]
var.test(set, ver)
F test to compare two variances
data: set and ver
F = 0.5, num df = 49, denom df = 49, p-value = 0.009
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.265 0.822
sample estimates:
ratio of variances
0.466
Was ist zu tun?
Die passenden Null- und Alternativhypothesen für ein Modell zu Veränderungen in Korallenriffen definieren.
Wichtig
Moodle-Quiz VOR der nächsten Übung ausfüllen!
Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Kurswebseite: Data Science 2