Der Standardfehler - staff.uni

Werbung
Biostatistik, WS 2015/2016
Der Standardfehler
Matthias Birkner
http://www.staff.uni-mainz.de/birkner/Biostatistik1516/
20.11.2015
1/84
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
2/84
Ein kurze Wiederholung zur deskriptiven Statistik
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
3/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
4/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Bachstelzen fressen Dungfliegen
Räuber
Beute
Bachstelze (White Wagtail)
Motacilla alba alba
Gelbe Dungfliege
Scatophaga stercoraria
image (c) by Artur Mikołajewski
image (c) by Viatour Luc
5/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
100
50
0
number
150
available dung flies
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
50
100
mean= 7.99
0
number
150
available dung flies
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
150
100
sd= 0.96
50
mean= 7.99
0
number
available dung flies
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
40
30
20
10
0
number
50
60
captured dung flies
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
captured dung flies
40
30
20
10
0
number
50
60
mean= 6.79
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
captured dung flies
10
20
30
40
sd= 0.69
0
number
50
60
mean= 6.79
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
0.5
dung flies: available, captured
0.1
0.2
0.3
available
0.0
fraction per mm
0.4
captured
4
5
6
7
8
9
10
11
length [mm]
6/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Wählerische Bachstelzen
Länge der Dungfliegen:
gefangen
verfügbar
Mittelwert
6.79
<
7.99
Standardabw.
0.69
<
0.96
0.5
dung flies: available, captured
0.2
0.3
available
0.0
0.1
fraction per mm
0.4
captured
4
5
6
7
8
9
10
11
length [mm]
Interpretation: Die Bachstelzen bevorzugen Dungfliegen aus
einem relativ engen Größenbereich um 7mm herum.
7/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Beobachtung
In der Biologie sind viele Datenverteilungen
annähernd glockenförmig und können durch den
Mittelwert und die Standardabweichung
angemessen beschrieben werden
(z.B. die verfügbaren und die tatsächlich gefangenen Dungfliegen
aus dem Bachstelzen-Beispiel).
8/84
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Beobachtung
In der Biologie sind viele Datenverteilungen
annähernd glockenförmig und können durch den
Mittelwert und die Standardabweichung
angemessen beschrieben werden
(z.B. die verfügbaren und die tatsächlich gefangenen Dungfliegen
aus dem Bachstelzen-Beispiel).
Es gibt aber auch Ausnahmen.
8/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
9/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Kupfertolerantes Rotes Straußgras
Rotes Straußgras
Agrostis tenuis
Kupfer
Cuprum
image (c) Kristian Peters
Hendrick met de Bles
10/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
40
Browntop Bent (n=50)
m−s
10
20
30
meadow plants
0
density per cm
m+s
m
0
50
100
150
200
root length (cm)
11/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
40
Browntop Bent (n=50)
m−s
20
30
meadow plants
0
10
density per cm
m+s
m
0
50
100
150
200
root length (cm)
In etwa 2/3 der Wurzellängen innerhalb [m-sd,m+sd]????
11/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
40
Browntop Bent (n=50)
m−s
20
30
meadow plants
0
10
density per cm
m+s
m
0
50
100
150
200
root length (cm)
In etwa 2/3 der Wurzellängen innerhalb [m-sd,m+sd]????
Nein! Deutlich mehr.
11/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Manche Verteilungen können nur mit mehr als zwei
Variablen angemessen beschrieben werden,
12/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Manche Verteilungen können nur mit mehr als zwei
Variablen angemessen beschrieben werden,
z.B. mit den fünf Werten der Boxplots:
min, Q1 , median, Q3 , max
12/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Browntop Bent n=50+50
copper mine plants
●
●
meadow plants
●
●
0
●
●
● ●●
50
●
●●
●
●●
●
100
●
150
●
200
root length (cm)
13/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Schlussfolgerung
In der Biologie sind viele Datenverteilungen
annähernd glockenförmig und können durch den
Mittelwert und die Standardabweichung
angemessen beschrieben werden.
14/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Schlussfolgerung
In der Biologie sind viele Datenverteilungen
annähernd glockenförmig und können durch den
Mittelwert und die Standardabweichung
angemessen beschrieben werden.
Es gibt aber auch Ausnahmen. Also:
Immer die Daten erst mal graphisch untersuchen!
14/84
Ein kurze Wiederholung zur deskriptiven Statistik
Ein Beispiel zur Warnung
Schlussfolgerung
In der Biologie sind viele Datenverteilungen
annähernd glockenförmig und können durch den
Mittelwert und die Standardabweichung
angemessen beschrieben werden.
Es gibt aber auch Ausnahmen. Also:
Immer die Daten erst mal graphisch untersuchen!
Verlassen Sie sich nicht allein auf numerische
Kenngrößen!
14/84
Der Standardfehler
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
15/84
Der Standardfehler
Ein Versuch
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
16/84
Der Standardfehler
Ein Versuch
Hirse
Bild: Panicum miliaceum
17/84
Der Standardfehler
Ein Versuch
Ein Versuch
Versuchsaufbau:
14 Hirse-Pflanzen von einer Sorte wurden 7 Tage
lang nicht mehr gegossen ( trockengestresst“).
”
18/84
Der Standardfehler
Ein Versuch
Ein Versuch
Versuchsaufbau:
14 Hirse-Pflanzen von einer Sorte wurden 7 Tage
lang nicht mehr gegossen ( trockengestresst“).
”
An den letzten drei Tagen wurde die Wasserabgabe
der Pflanzen durch Wägung ermittelt und ein
Mittelwert über drei Tage errechnet.
18/84
Der Standardfehler
Ein Versuch
Ein Versuch
Versuchsaufbau:
14 Hirse-Pflanzen von einer Sorte wurden 7 Tage
lang nicht mehr gegossen ( trockengestresst“).
”
An den letzten drei Tagen wurde die Wasserabgabe
der Pflanzen durch Wägung ermittelt und ein
Mittelwert über drei Tage errechnet.
Zum Schluß des Versuchs wurden die Pflanzen
abgeschnitten und die Blattfläche bestimmt.
18/84
Der Standardfehler
Ein Versuch
Transpirationsrate
=
(Wasserabgabe pro Tag)/Blattfläche
19/84
Der Standardfehler
Ein Versuch
Transpirationsrate
=
(Wasserabgabe pro Tag)/Blattfläche
h
i
ml
cm2 ·Tag
19/84
Der Standardfehler
Ein Versuch
Ein Ziel des Versuchs: die mittlere
Transpirationsrate
(für diese Hirsesorte unter diesen
Bedingungen)
zu bestimmen.
20/84
Der Standardfehler
Ein Versuch
Ein Ziel des Versuchs: die mittlere
Transpirationsrate µ
(für diese Hirsesorte unter diesen
Bedingungen)
zu bestimmen.
20/84
Der Standardfehler
Ein Versuch
In einem großen Versuch mit sehr vielen
Pflanzen könnte man µ beliebig genau
bestimmen.
21/84
Der Standardfehler
Ein Versuch
In einem großen Versuch mit sehr vielen
Pflanzen könnte man µ beliebig genau
bestimmen.
FRAGE:
Wie genau ist die Schätzung von µ in
diesem kleinen (n = 14) Versuch?
21/84
Der Standardfehler
Ein Versuch
4
3
2
1
0
Häufigkeit
5
6
Trockengestresste Hirse (n = 14)
0.08
0.10
0.12
0.14
0.16
Transpiration (ml/(Tag*cm^2))
22/84
Der Standardfehler
Ein Versuch
6
Trockengestresste Hirse (n = 14)
4
3
2
1
0
Häufigkeit
5
Mittelwert=0,117
0.08
0.10
0.12
0.14
0.16
Transpiration (ml/(Tag*cm^2))
22/84
Der Standardfehler
Ein Versuch
Standardabweichung=0,026
4
3
2
1
0
Häufigkeit
5
6
Trockengestresste Hirse (n = 14)
0.08
0.10
0.12
0.14
0.16
Transpiration (ml/(Tag*cm^2))
22/84
Der Standardfehler
Ein Versuch
Transpirationsdaten: x1, x2, . . . , x14
x = x1 + x2 + · · · + x14 /14
23/84
Der Standardfehler
Ein Versuch
Transpirationsdaten: x1, x2, . . . , x14
14
x = x1 + x2 + · · · + x14
1 X
/14 =
xi
14
i=1
23/84
Der Standardfehler
Ein Versuch
Transpirationsdaten: x1, x2, . . . , x14
14
x = x1 + x2 + · · · + x14
1 X
/14 =
xi
14
i=1
x = 0,117
23/84
Der Standardfehler
Ein Versuch
Unsere Schätzung:
µ ≈ 0,117
24/84
Der Standardfehler
Ein Versuch
Unsere Schätzung:
µ ≈ 0,117
Wie genau ist diese Schätzung?
24/84
Der Standardfehler
Ein Versuch
Unsere Schätzung:
µ ≈ 0,117
Wie genau ist diese Schätzung?
Wie weit weicht x (unser Schätzwert)
von µ (dem wahren Mittelwert) ab?
24/84
Der Standardfehler
Ein allgemeiner Rahmen
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
25/84
Der Standardfehler
Ein allgemeiner Rahmen
Ein allgemeiner Rahmen
Wir stellen uns vor,
wir hätten den Versuch nicht 14 mal,
26/84
Der Standardfehler
Ein allgemeiner Rahmen
Ein allgemeiner Rahmen
Wir stellen uns vor,
wir hätten den Versuch nicht 14 mal,
sondern 100 mal,
26/84
Der Standardfehler
Ein allgemeiner Rahmen
Ein allgemeiner Rahmen
Wir stellen uns vor,
wir hätten den Versuch nicht 14 mal,
sondern 100 mal,
1.000 mal,
26/84
Der Standardfehler
Ein allgemeiner Rahmen
Ein allgemeiner Rahmen
Wir stellen uns vor,
wir hätten den Versuch nicht 14 mal,
sondern 100 mal,
1.000 mal,
1.000.000 mal
wiederholt.
26/84
Der Standardfehler
Ein allgemeiner Rahmen
Unsere 14 Transpirationswerte
betrachten wir als
zufällige Stichprobe
aus dieser großen Population
von möglichen Werten.
27/84
Der Standardfehler
Ein allgemeiner Rahmen
Population
(sämtliche Transpirationsraten)
N sehr groß
(mathematische Idealisierung: N = ∞)
28/84
Der Standardfehler
Ein allgemeiner Rahmen
Population
(sämtliche Transpirationsraten)
N sehr groß
(mathematische Idealisierung: N = ∞)
Stichprobe
n = 14
28/84
Der Standardfehler
Ein allgemeiner Rahmen
Population
(sämtliche Transpirationsraten)
N sehr groß
(mathematische Idealisierung: N = ∞)
µ
Stichprobe
n = 14
x
28/84
Der Standardfehler
Ein allgemeiner Rahmen
Wir schätzen
den Populationsmittelwert
µ
durch
den Stichprobenmittelwert
x.
29/84
Der Standardfehler
Ein allgemeiner Rahmen
Jede neue Stichprobe liefert einen neuen
Wert von x.
30/84
Der Standardfehler
Ein allgemeiner Rahmen
Jede neue Stichprobe liefert einen neuen
Wert von x.
x hängt vom Zufall ab:
eine Zufallsgröße
30/84
Der Standardfehler
Ein allgemeiner Rahmen
Jede neue Stichprobe liefert einen neuen
Wert von x.
x hängt vom Zufall ab:
eine Zufallsgröße
FRAGE: Wie variabel ist x?
30/84
Der Standardfehler
Ein allgemeiner Rahmen
Jede neue Stichprobe liefert einen neuen
Wert von x.
x hängt vom Zufall ab:
eine Zufallsgröße
FRAGE: Wie variabel ist x?
Genauer: Wie weit weicht x typischerweise
von µ ab?
30/84
Der Standardfehler
Ein allgemeiner Rahmen
x = x1 + x2 + · · · + xn /n
Wovon hängt die Variabilität von x ab?
31/84
Der Standardfehler
Ein allgemeiner Rahmen
1.
von der
Variabilität
der einzelnen
Beobachtungen
x1, x2, . . . , xn
32/84
Der Standardfehler
Ein allgemeiner Rahmen
x variiert viel
0.05
0.10
0.15
0.20
0.25
x variiert wenig
0.05
0.10
0.15
0.20
0.25
33/84
Der Standardfehler
Ein allgemeiner Rahmen
Mittelwert = 0.117
x variiert viel
⇒ x variiert viel
0.05
0.10
0.15
0.20
0.25
Mittelwert = 0.117
x variiert wenig
⇒ x variiert wenig
0.05
0.10
0.15
0.20
0.25
33/84
Der Standardfehler
Ein allgemeiner Rahmen
2.
vom
Stichprobenumfang
n
34/84
Der Standardfehler
Ein allgemeiner Rahmen
2.
vom
Stichprobenumfang
n
Je größer n,
desto kleiner
die Variabilität von x.
34/84
Der Standardfehler
Ein allgemeiner Rahmen
Um diese Abhängigkeit
zu untersuchen,
machen wir ein
(Computer-)Experiment.
35/84
Der Standardfehler
Ein allgemeiner Rahmen
Experiment:
Wir nehmen eine Population,
ziehen Stichproben,
und schauen,
wie x variiert.
36/84
Der Standardfehler
Ein allgemeiner Rahmen
Nehmen wir an,
die Verteilung
aller möglichen Transpirationswerte
sieht folgendermaßen aus:
37/84
Der Standardfehler
Ein allgemeiner Rahmen
10
5
0
Dichte
15
Hypothethische Transpirationsratenverteilung
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
38/84
Der Standardfehler
Ein allgemeiner Rahmen
Hypothethische Transpirationsratenverteilung
10
5
0
Dichte
15
Mittelwert=0.117
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
38/84
Der Standardfehler
Ein allgemeiner Rahmen
Hypothethische Transpirationsratenverteilung
10
5
0
Dichte
15
Standardabw.=0.026
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
38/84
Der Standardfehler
Ein allgemeiner Rahmen
Wir beginnen mit kleinen Stichproben:
n=4
39/84
Der Standardfehler
Ein allgemeiner Rahmen
10
5
0
Dichte
15
Eine Stichprobe vom Umfang 4
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
40/84
Der Standardfehler
Ein allgemeiner Rahmen
10
5
0
Dichte
15
Eine zweite Stichprobe vom Umfang 4
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
40/84
Der Standardfehler
Ein allgemeiner Rahmen
10
5
0
Dichte
15
Eine dritte Stichprobe vom Umfang 4
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
40/84
Der Standardfehler
Ein allgemeiner Rahmen
10 Stichproben
41/84
Der Standardfehler
Ein allgemeiner Rahmen
0
2
4
6
8
10
10 Stichproben
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
41/84
Der Standardfehler
Ein allgemeiner Rahmen
50 Stichproben
42/84
Der Standardfehler
Ein allgemeiner Rahmen
0
10
20
30
40
50
50 Stichproben
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
42/84
Der Standardfehler
Ein allgemeiner Rahmen
Wie variabel sind
die Stichprobenmittelwerte?
43/84
Der Standardfehler
Ein allgemeiner Rahmen
0
2
4
6
8
10
10 Stichproben vom Umfang 4
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
44/84
Der Standardfehler
Ein allgemeiner Rahmen
0
2
4
6
8
10
10 Stichproben vom Umfang 4 und die zugehörigen
Stichprobenmittel
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
44/84
Der Standardfehler
Ein allgemeiner Rahmen
0
10
20
30
40
50
50 Stichproben vom Umfang 4
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
45/84
Der Standardfehler
Ein allgemeiner Rahmen
0
10
20
30
40
50
50 Stichproben vom Umfang 4 und die zugehörigen
Stichprobenmittel
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
45/84
Der Standardfehler
Ein allgemeiner Rahmen
Stichprobenmittel
Mittelwert=0.117
Standardabw.=0.013
10
20
Population
Mittelwert=0.117
Standardabw.=0.026
0
Dichte
30
40
Verteilung der Stichprobenmittelwerte
(Stichprobenumfang n = 4)
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
46/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
47/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
Stichprobenmittelwerte (n = 4):
Standardabweichung = 0,013
47/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
Stichprobenmittelwerte (n = 4):
Standardabweichung = 0,013 √
= 0,026/ 4
47/84
Der Standardfehler
Ein allgemeiner Rahmen
Erhöhen wir
den Stichprobenumfang
von
4
auf
16
48/84
Der Standardfehler
Ein allgemeiner Rahmen
0
2
4
6
8
10
10 Stichproben vom Umfang 16 und die
zugehörigen Stichprobenmittel
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
49/84
Der Standardfehler
Ein allgemeiner Rahmen
0
10
20
30
40
50
50 Stichproben vom Umfang 16 und die
zugehörigen Stichprobenmittel
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
50/84
Der Standardfehler
Ein allgemeiner Rahmen
Population
Mittelwert=0.117
Standardabw.=0.026
Stichprobenmittel
Mittelwert=0.117
Standardabw.= 0.0065
40
20
0
Dichte
60
80
Verteilung der Stichprobenmittelwerte
(Stichprobenumfang n = 16)
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
51/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
52/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
Stichprobenmittelwerte (n = 16):
Standardabweichung = 0,0065
52/84
Der Standardfehler
Ein allgemeiner Rahmen
Population:
Standardabweichung = 0,026
Stichprobenmittelwerte (n = 16):
Standardabweichung = 0,0065√
= 0,026/ 16
52/84
Der Standardfehler
Ein allgemeiner Rahmen
Die allgemeine Regel
Die Standardabweichung
des Mittelwerts einer Stichprobe vom
Umfang n
53/84
Der Standardfehler
Ein allgemeiner Rahmen
Die allgemeine Regel
Die Standardabweichung
des Mittelwerts einer Stichprobe vom
Umfang n
ist
√
1/ n
mal
der Standardabweichung
der Population.
53/84
Der Standardfehler
Ein allgemeiner Rahmen
Die Standardabweichung der Population
bezeichnet man mit
σ
(sigma).
54/84
Der Standardfehler
Ein allgemeiner Rahmen
Die Standardabweichung der Population
bezeichnet man mit
σ
(sigma).
Die Regel schreibt man häufig so:
1
σ(x) = √ σ(X )
n
54/84
Der Standardfehler
Ein allgemeiner Rahmen
In der Praxis ist σ unbekannt.
55/84
Der Standardfehler
Ein allgemeiner Rahmen
In der Praxis ist σ unbekannt.
Es wird durch
die Stichproben-Standardabweichung
s
geschätzt:
55/84
Der Standardfehler
Ein allgemeiner Rahmen
In der Praxis ist σ unbekannt.
Es wird durch
die Stichproben-Standardabweichung
s
geschätzt:
σ =??
(Erinnerung: s =
q
1
n−1
Pn
i=1
(xi − x)2
)
55/84
Der Standardfehler
Ein allgemeiner Rahmen
In der Praxis ist σ unbekannt.
Es wird durch
die Stichproben-Standardabweichung
s
geschätzt:
σ≈s
(Erinnerung: s =
q
1
n−1
Pn
i=1
(xi − x)2
)
55/84
Der Standardfehler
Ein allgemeiner Rahmen
√
s/ n
(die geschätzte
Standardabweichung
von x)
nennt man den
Standardfehler.
56/84
Der Standardfehler
Ein allgemeiner Rahmen
√
s/ n
(die geschätzte
Standardabweichung
von x)
nennt man den
Standardfehler.
(Englisch: standard error of the mean,
standard error, SEM)
56/84
Der Standardfehler
Zur Verteilung von x
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
57/84
Der Standardfehler
Zur Verteilung von x
Wir haben gesehen:
Auch wenn die Verteilung von
x mehrgipfelig
&
asymmetrisch
ist
58/84
Der Standardfehler
Zur Verteilung von x
10
5
0
Dichte
15
Hypothethische Transpirationsratenverteilung
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
59/84
Der Standardfehler
Zur Verteilung von x
ist die Verteilung von
x
trotzdem
(annähernd)
eingipfelig
&
symmetrisch
(wenn der Stichprobenumfang n nur groß genug ist)
60/84
Der Standardfehler
Zur Verteilung von x
10 20 30 40 50 60
Population
Stichprobenmittel
(n=16)
0
Dichte
Hypothethische Transpirationsratenverteilung
0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
Transpiration (ml/(Tag*cm^2))
61/84
Der Standardfehler
Zur Verteilung von x
Die Verteilung von x
hat annähernd
eine ganz bestimmte Form:
die Normalverteilung.
62/84
Der Standardfehler
Zur Verteilung von x
Dichte der Normalverteilung:
µ
exp
(x−µ)2 2σ 2
0.1
0.2
0.3
µ+σ
0.0
Normaldichte
0.4
µ−σ
√ 1
2πσ 2
−1
0
1
2
3
4
5
63/84
Der Standardfehler
Zur Verteilung von x
Dichte der Normalverteilung:
µ
exp
(x−µ)2 2σ 2
0.1
0.2
0.3
µ+σ
0.0
Normaldichte
0.4
µ−σ
√ 1
2πσ 2
−1
0
1
2
3
4
5
Die Normalverteilungsdichte heisst
auch Gauß’sche Glockenkurve
63/84
Der Standardfehler
Zur Verteilung von x
Dichte der Normalverteilung:
√ 1
2πσ 2
exp
(x−µ)2 2σ 2
Die Normalverteilungsdichte heisst
auch Gauß’sche Glockenkurve
(nach Carl Friedrich Gauß, 1777-1855)
63/84
Der Standardfehler
Zur Verteilung von x
Wichtige Folgerung
√
√ Wir betrachten das Intervall x − s/ n, x + s/ n
√
x − s/ n
√
x + s/ n
x
Der Standardfehler
Zur Verteilung von x
Wichtige Folgerung
√
√ Wir betrachten das Intervall x − s/ n, x + s/ n
Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb
dieses Intervalls.
√
√
x − s/ n
x + s/ n
x
Der Standardfehler
Zur Verteilung von x
Wichtige Folgerung
√
√ Wir betrachten das Intervall x − s/ n, x + s/ n
Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb
dieses Intervalls.
√
√
x − s/ n
x + s/ n
x
Mit Wahrscheinlichkeit ca. 1/3 liegt µ ausserhalb des Intervalls.
64/84
Der Standardfehler
Zur Verteilung von x
Wichtige Folgerung
√
√ Wir betrachten das Intervall x − s/ n, x + s/ n
Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb
dieses Intervalls.
√
√
x − s/ n
x + s/ n
x
Mit Wahrscheinlichkeit ca. 1/3 liegt µ ausserhalb des Intervalls.
Beachte: Das wahre µ ist unbekannt, aber nicht zufällig.
Die Wahrscheinlichkeit bezieht sich auf das Verhalten von x und
s, die wir anhand der zufälligen Stichprobe berechnet haben.
64/84
Der Standardfehler
Zur Verteilung von x
Demnach:
Es kommt durchaus vor, dass x
von µ
um
√ mehr als
s/ n abweicht.
65/84
Der Standardfehler
Anwendungen
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
66/84
Der Standardfehler
Anwendungen
Anwendung 1:
Welche Werte von µ sind plausibel?
67/84
Der Standardfehler
Anwendungen
Anwendung 1:
Welche Werte von µ sind plausibel?
x = 0,12
√
s/ n = 0,007
67/84
Der Standardfehler
Anwendungen
Anwendung 1:
Welche Werte von µ sind plausibel?
x = 0,12
√
s/ n = 0,007
Frage: Könnte es sein, dass
µ = 0,115?
67/84
Der Standardfehler
Anwendungen
Antwort: Es ist gut möglich.
68/84
Der Standardfehler
Anwendungen
Antwort: Es ist gut möglich.
Abweichung
x − µ = 0,120 − 0,115 = 0,005.
68/84
Der Standardfehler
Anwendungen
Antwort: Es ist gut möglich.
Abweichung
x − µ = 0,120 − 0,115 = 0,005.
Standardfehler
√
s/ n = 0,007
68/84
Der Standardfehler
Anwendungen
Antwort: Es ist gut möglich.
Abweichung
x − µ = 0,120 − 0,115 = 0,005.
Standardfehler
√
s/ n = 0,007
Abweichungen dieser Größe
kommen häufig vor.
68/84
Der Standardfehler
Anwendungen
Antwort: Es ist gut möglich.
Abweichung
x − µ = 0,120 − 0,115 = 0,005.
Standardfehler
√
s/ n = 0,007
Abweichungen dieser Größe
kommen häufig vor.
(Die Frage, welche Abweichungen nicht mehr plausibel sind,
untersuchen wir im nächsten Kapitel.)
68/84
Der Standardfehler
Anwendungen
Anwendung 2:
Vergleich von Mittelwerten
69/84
Der Standardfehler
Anwendungen
Anwendung 2:
Vergleich von Mittelwerten
Beispiel: Eine Stichprobe von Springkrebsen
69/84
Der Standardfehler
Anwendungen
Galathea: Carapaxlänge
in einer Stichprobe
Männchen:
x 1 = 3,04 mm
s1 = 0,9 mm
n1 = 25
Weibchen:
x 2 = 3,23 mm
s2 = 0,9 mm
n2 = 29
70/84
Der Standardfehler
Anwendungen
Die Weibchen
scheinen größer zu sein.
71/84
Der Standardfehler
Anwendungen
Die Weibchen
scheinen größer zu sein.
Ist das ernst zu nehmen?
71/84
Der Standardfehler
Anwendungen
Die Weibchen
scheinen größer zu sein.
Ist das ernst zu nehmen?
Oder könnte es nur Zufall sein?
71/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
72/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
Männchen:
x 1 = 3,04 mm
s1 = 0,9 mm
n1 = 25
√
s1/ n1 = 0,18 [mm]
72/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
Männchen:
x 1 = 3,04 mm
s1 = 0,9 mm
n1 = 25
√
s1/ n1 = 0,18 [mm]
Mit Schwankungen von
±0,18 (mm) in x 1
müssen wir rechnen.
72/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
73/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
Weibchen:
x 2 = 3,23 mm
s2 = 0,9 mm
n2 = 29
√
s2/ n2 = 0,17 [mm]
73/84
Der Standardfehler
Anwendungen
Wie genau sind die beiden Mittelwerte?
Weibchen:
x 2 = 3,23 mm
s2 = 0,9 mm
n2 = 29
√
s2/ n2 = 0,17 [mm]
Es ist nicht unwahrscheinlich,
dass x 2 um mehr als ±0,17 (mm) vom
wahren Mittelwert abweicht.
73/84
Der Standardfehler
Anwendungen
Die Differenz der Mittelwerte
3,23 − 3,04 = 0,19 [mm]
74/84
Der Standardfehler
Anwendungen
Die Differenz der Mittelwerte
3,23 − 3,04 = 0,19 [mm]
ist kaum größer als
die zu erwartenden Schwankungen.
74/84
Der Standardfehler
Anwendungen
Die Differenz der Mittelwerte
3,23 − 3,04 = 0,19 [mm]
ist kaum größer als
die zu erwartenden Schwankungen.
Es könnte also einfach Zufall sein,
dass
x2 > x1
74/84
Der Standardfehler
Anwendungen
Genauer formuliert:
Wenn in Wirklichkeit
die Populationsmittelwerte
gleich sind,
µWeibchen = µMännchen
75/84
Der Standardfehler
Anwendungen
Genauer formuliert:
Wenn in Wirklichkeit
die Populationsmittelwerte
gleich sind,
µWeibchen = µMännchen
kann es trotzdem leicht passieren,
dass die Stichprobenmittelwerte
x 2 und x 1
so weit auseinander liegen.
75/84
Der Standardfehler
Anwendungen
Der Statistiker sagt:
Die Differenz
der Mittelwerte
ist
(statistisch)
nicht signifikant.
76/84
Der Standardfehler
Anwendungen
Der Statistiker sagt:
Die Differenz
der Mittelwerte
ist
(statistisch)
nicht signifikant.
nicht signifikant
=
könnte Zufall sein
76/84
Der Standardfehler
Anwendungen
Anwendung 3:
Wenn man Mittelwerte
graphisch darstellt,
sollte man auch
ihre Genauigkeit
√
(±s/ n)
anzeigen.
77/84
Der Standardfehler
Anwendungen
Also nicht so:
3.2
●
2.8
3.0
●
Männchen
Weibchen
2.6
Carapaxlänge [mm]
3.4
Carapaxlängen:
Mittelwerte nach Geschlecht
78/84
Der Standardfehler
Anwendungen
sondern so:
3.2
●
2.8
3.0
●
Männchen
Weibchen
2.6
Carapaxlänge [mm]
3.4
Carapaxlängen:
Mittelwerte ± Standardfehler nach Geschlecht
78/84
Der Standardfehler
Anwendungen
Anwendung 4:
Bei der Versuchsplanung:
79/84
Der Standardfehler
Anwendungen
Anwendung 4:
Bei der Versuchsplanung:
Wieviele Beobachtungen
brauche ich?
(Wie groß sollte n sein?)
79/84
Der Standardfehler
Anwendungen
Wenn man weiß, welche Genauigkeit
√
(Standardfehler s/ n)
für x man erreichen will,
80/84
Der Standardfehler
Anwendungen
Wenn man weiß, welche Genauigkeit
√
(Standardfehler s/ n)
für x man erreichen will,
und wenn man (aus Erfahrung oder aus
einem Vorversuch) s ungefähr kennt,
80/84
Der Standardfehler
Anwendungen
Wenn man weiß, welche Genauigkeit
√
(Standardfehler s/ n)
für x man erreichen will,
und wenn man (aus Erfahrung oder aus
einem Vorversuch) s ungefähr kennt,
dann kann man
das notwendige n ungefähr abschätzen:
√
s/ n = g
(g = gewüschter Standardfehler)
80/84
Der Standardfehler
Anwendungen
Beispiel:
Gestresste Transpirationswerte
bei einer anderen Hirse-Sorte:
x = 0,18
s = 0,06
n = 13
81/84
Der Standardfehler
Anwendungen
Beispiel:
Gestresste Transpirationswerte
bei einer anderen Hirse-Sorte:
x = 0,18
s = 0,06
n = 13
Nehmen wir an, der Versuch soll wiederholt
werden und man will
Standardfehler ≈ 0,01 erreichen.
81/84
Der Standardfehler
Anwendungen
Beispiel:
Gestresste Transpirationswerte
bei einer anderen Hirse-Sorte:
x = 0,18
s = 0,06
n = 13
Nehmen wir an, der Versuch soll wiederholt
werden und man will
Standardfehler ≈ 0,01 erreichen.
Wie groß sollte n sein?
81/84
Der Standardfehler
Anwendungen
Lösung:
gew
√ ünscht:
s/ n ≈ 0,01
82/84
Der Standardfehler
Anwendungen
Lösung:
gew
√ ünscht:
s/ n ≈ 0,01
aus dem Vorversuch wissen wir:
s ≈ 0,06,
82/84
Der Standardfehler
Anwendungen
Lösung:
gew
√ ünscht:
s/ n ≈ 0,01
aus dem Vorversuch wissen wir:
s ≈ 0,06,
√
also n ≈ 6
82/84
Der Standardfehler
Anwendungen
Lösung:
gew
√ ünscht:
s/ n ≈ 0,01
aus dem Vorversuch wissen wir:
s ≈ 0,06,
√
also n ≈ 6
n ≈ 36
82/84
Der Standardfehler
Zusammenfassung
Inhalt
1
Ein kurze Wiederholung zur deskriptiven Statistik
Mittelwert und Standardabweichung
Ein Beispiel zur Warnung
2
Der Standardfehler
Ein Versuch
Ein allgemeiner Rahmen
Zur Verteilung von x
Anwendungen
Zusammenfassung
83/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
√
mit Mittelwert µ und Standardabweichung σ/ n.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
√
mit Mittelwert µ und Standardabweichung σ/ n.
√
Man schätzt die Standardabweichung von x mit s/ n.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
√
mit Mittelwert µ und Standardabweichung σ/ n.
√
Man schätzt die Standardabweichung von x mit s/ n.
√
s/ n nennt man den Standardfehler.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
√
mit Mittelwert µ und Standardabweichung σ/ n.
√
Man schätzt die Standardabweichung von x mit s/ n.
√
s/ n nennt man den Standardfehler.
√
Schwankungen in x von der Größe s/ n kommen häufig
vor.
84/84
Der Standardfehler
Zusammenfassung
ZUSAMMENFASSUNG
Nehmen wir an, eine Population hat Mittelwert µ und
Standardabweichung σ.
Aus dieser Population ziehen wir eine Zufallsstichprobe
vom Umfang n, mit Stichprobenmittelwert x.
x ist eine Zufallsgröße
√
mit Mittelwert µ und Standardabweichung σ/ n.
√
Man schätzt die Standardabweichung von x mit s/ n.
√
s/ n nennt man den Standardfehler.
√
Schwankungen in x von der Größe s/ n kommen häufig
vor.
Solche Schwankungen sind nicht signifikant“: sie könnten
”
Zufall sein.
84/84
Herunterladen