Biostatistik, WS 2015/2016 Der Standardfehler Matthias Birkner http://www.staff.uni-mainz.de/birkner/Biostatistik1516/ 20.11.2015 1/84 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 2/84 Ein kurze Wiederholung zur deskriptiven Statistik Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 3/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 4/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Bachstelzen fressen Dungfliegen Räuber Beute Bachstelze (White Wagtail) Motacilla alba alba Gelbe Dungfliege Scatophaga stercoraria image (c) by Artur Mikołajewski image (c) by Viatour Luc 5/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung 100 50 0 number 150 available dung flies 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung 50 100 mean= 7.99 0 number 150 available dung flies 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung 150 100 sd= 0.96 50 mean= 7.99 0 number available dung flies 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung 40 30 20 10 0 number 50 60 captured dung flies 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung captured dung flies 40 30 20 10 0 number 50 60 mean= 6.79 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung captured dung flies 10 20 30 40 sd= 0.69 0 number 50 60 mean= 6.79 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung 0.5 dung flies: available, captured 0.1 0.2 0.3 available 0.0 fraction per mm 0.4 captured 4 5 6 7 8 9 10 11 length [mm] 6/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Wählerische Bachstelzen Länge der Dungfliegen: gefangen verfügbar Mittelwert 6.79 < 7.99 Standardabw. 0.69 < 0.96 0.5 dung flies: available, captured 0.2 0.3 available 0.0 0.1 fraction per mm 0.4 captured 4 5 6 7 8 9 10 11 length [mm] Interpretation: Die Bachstelzen bevorzugen Dungfliegen aus einem relativ engen Größenbereich um 7mm herum. 7/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Beobachtung In der Biologie sind viele Datenverteilungen annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung angemessen beschrieben werden (z.B. die verfügbaren und die tatsächlich gefangenen Dungfliegen aus dem Bachstelzen-Beispiel). 8/84 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Beobachtung In der Biologie sind viele Datenverteilungen annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung angemessen beschrieben werden (z.B. die verfügbaren und die tatsächlich gefangenen Dungfliegen aus dem Bachstelzen-Beispiel). Es gibt aber auch Ausnahmen. 8/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 9/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Kupfertolerantes Rotes Straußgras Rotes Straußgras Agrostis tenuis Kupfer Cuprum image (c) Kristian Peters Hendrick met de Bles 10/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung 40 Browntop Bent (n=50) m−s 10 20 30 meadow plants 0 density per cm m+s m 0 50 100 150 200 root length (cm) 11/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung 40 Browntop Bent (n=50) m−s 20 30 meadow plants 0 10 density per cm m+s m 0 50 100 150 200 root length (cm) In etwa 2/3 der Wurzellängen innerhalb [m-sd,m+sd]???? 11/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung 40 Browntop Bent (n=50) m−s 20 30 meadow plants 0 10 density per cm m+s m 0 50 100 150 200 root length (cm) In etwa 2/3 der Wurzellängen innerhalb [m-sd,m+sd]???? Nein! Deutlich mehr. 11/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden, 12/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Manche Verteilungen können nur mit mehr als zwei Variablen angemessen beschrieben werden, z.B. mit den fünf Werten der Boxplots: min, Q1 , median, Q3 , max 12/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Browntop Bent n=50+50 copper mine plants ● ● meadow plants ● ● 0 ● ● ● ●● 50 ● ●● ● ●● ● 100 ● 150 ● 200 root length (cm) 13/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Schlussfolgerung In der Biologie sind viele Datenverteilungen annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung angemessen beschrieben werden. 14/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Schlussfolgerung In der Biologie sind viele Datenverteilungen annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung angemessen beschrieben werden. Es gibt aber auch Ausnahmen. Also: Immer die Daten erst mal graphisch untersuchen! 14/84 Ein kurze Wiederholung zur deskriptiven Statistik Ein Beispiel zur Warnung Schlussfolgerung In der Biologie sind viele Datenverteilungen annähernd glockenförmig und können durch den Mittelwert und die Standardabweichung angemessen beschrieben werden. Es gibt aber auch Ausnahmen. Also: Immer die Daten erst mal graphisch untersuchen! Verlassen Sie sich nicht allein auf numerische Kenngrößen! 14/84 Der Standardfehler Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 15/84 Der Standardfehler Ein Versuch Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 16/84 Der Standardfehler Ein Versuch Hirse Bild: Panicum miliaceum 17/84 Der Standardfehler Ein Versuch Ein Versuch Versuchsaufbau: 14 Hirse-Pflanzen von einer Sorte wurden 7 Tage lang nicht mehr gegossen ( trockengestresst“). ” 18/84 Der Standardfehler Ein Versuch Ein Versuch Versuchsaufbau: 14 Hirse-Pflanzen von einer Sorte wurden 7 Tage lang nicht mehr gegossen ( trockengestresst“). ” An den letzten drei Tagen wurde die Wasserabgabe der Pflanzen durch Wägung ermittelt und ein Mittelwert über drei Tage errechnet. 18/84 Der Standardfehler Ein Versuch Ein Versuch Versuchsaufbau: 14 Hirse-Pflanzen von einer Sorte wurden 7 Tage lang nicht mehr gegossen ( trockengestresst“). ” An den letzten drei Tagen wurde die Wasserabgabe der Pflanzen durch Wägung ermittelt und ein Mittelwert über drei Tage errechnet. Zum Schluß des Versuchs wurden die Pflanzen abgeschnitten und die Blattfläche bestimmt. 18/84 Der Standardfehler Ein Versuch Transpirationsrate = (Wasserabgabe pro Tag)/Blattfläche 19/84 Der Standardfehler Ein Versuch Transpirationsrate = (Wasserabgabe pro Tag)/Blattfläche h i ml cm2 ·Tag 19/84 Der Standardfehler Ein Versuch Ein Ziel des Versuchs: die mittlere Transpirationsrate (für diese Hirsesorte unter diesen Bedingungen) zu bestimmen. 20/84 Der Standardfehler Ein Versuch Ein Ziel des Versuchs: die mittlere Transpirationsrate µ (für diese Hirsesorte unter diesen Bedingungen) zu bestimmen. 20/84 Der Standardfehler Ein Versuch In einem großen Versuch mit sehr vielen Pflanzen könnte man µ beliebig genau bestimmen. 21/84 Der Standardfehler Ein Versuch In einem großen Versuch mit sehr vielen Pflanzen könnte man µ beliebig genau bestimmen. FRAGE: Wie genau ist die Schätzung von µ in diesem kleinen (n = 14) Versuch? 21/84 Der Standardfehler Ein Versuch 4 3 2 1 0 Häufigkeit 5 6 Trockengestresste Hirse (n = 14) 0.08 0.10 0.12 0.14 0.16 Transpiration (ml/(Tag*cm^2)) 22/84 Der Standardfehler Ein Versuch 6 Trockengestresste Hirse (n = 14) 4 3 2 1 0 Häufigkeit 5 Mittelwert=0,117 0.08 0.10 0.12 0.14 0.16 Transpiration (ml/(Tag*cm^2)) 22/84 Der Standardfehler Ein Versuch Standardabweichung=0,026 4 3 2 1 0 Häufigkeit 5 6 Trockengestresste Hirse (n = 14) 0.08 0.10 0.12 0.14 0.16 Transpiration (ml/(Tag*cm^2)) 22/84 Der Standardfehler Ein Versuch Transpirationsdaten: x1, x2, . . . , x14 x = x1 + x2 + · · · + x14 /14 23/84 Der Standardfehler Ein Versuch Transpirationsdaten: x1, x2, . . . , x14 14 x = x1 + x2 + · · · + x14 1 X /14 = xi 14 i=1 23/84 Der Standardfehler Ein Versuch Transpirationsdaten: x1, x2, . . . , x14 14 x = x1 + x2 + · · · + x14 1 X /14 = xi 14 i=1 x = 0,117 23/84 Der Standardfehler Ein Versuch Unsere Schätzung: µ ≈ 0,117 24/84 Der Standardfehler Ein Versuch Unsere Schätzung: µ ≈ 0,117 Wie genau ist diese Schätzung? 24/84 Der Standardfehler Ein Versuch Unsere Schätzung: µ ≈ 0,117 Wie genau ist diese Schätzung? Wie weit weicht x (unser Schätzwert) von µ (dem wahren Mittelwert) ab? 24/84 Der Standardfehler Ein allgemeiner Rahmen Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 25/84 Der Standardfehler Ein allgemeiner Rahmen Ein allgemeiner Rahmen Wir stellen uns vor, wir hätten den Versuch nicht 14 mal, 26/84 Der Standardfehler Ein allgemeiner Rahmen Ein allgemeiner Rahmen Wir stellen uns vor, wir hätten den Versuch nicht 14 mal, sondern 100 mal, 26/84 Der Standardfehler Ein allgemeiner Rahmen Ein allgemeiner Rahmen Wir stellen uns vor, wir hätten den Versuch nicht 14 mal, sondern 100 mal, 1.000 mal, 26/84 Der Standardfehler Ein allgemeiner Rahmen Ein allgemeiner Rahmen Wir stellen uns vor, wir hätten den Versuch nicht 14 mal, sondern 100 mal, 1.000 mal, 1.000.000 mal wiederholt. 26/84 Der Standardfehler Ein allgemeiner Rahmen Unsere 14 Transpirationswerte betrachten wir als zufällige Stichprobe aus dieser großen Population von möglichen Werten. 27/84 Der Standardfehler Ein allgemeiner Rahmen Population (sämtliche Transpirationsraten) N sehr groß (mathematische Idealisierung: N = ∞) 28/84 Der Standardfehler Ein allgemeiner Rahmen Population (sämtliche Transpirationsraten) N sehr groß (mathematische Idealisierung: N = ∞) Stichprobe n = 14 28/84 Der Standardfehler Ein allgemeiner Rahmen Population (sämtliche Transpirationsraten) N sehr groß (mathematische Idealisierung: N = ∞) µ Stichprobe n = 14 x 28/84 Der Standardfehler Ein allgemeiner Rahmen Wir schätzen den Populationsmittelwert µ durch den Stichprobenmittelwert x. 29/84 Der Standardfehler Ein allgemeiner Rahmen Jede neue Stichprobe liefert einen neuen Wert von x. 30/84 Der Standardfehler Ein allgemeiner Rahmen Jede neue Stichprobe liefert einen neuen Wert von x. x hängt vom Zufall ab: eine Zufallsgröße 30/84 Der Standardfehler Ein allgemeiner Rahmen Jede neue Stichprobe liefert einen neuen Wert von x. x hängt vom Zufall ab: eine Zufallsgröße FRAGE: Wie variabel ist x? 30/84 Der Standardfehler Ein allgemeiner Rahmen Jede neue Stichprobe liefert einen neuen Wert von x. x hängt vom Zufall ab: eine Zufallsgröße FRAGE: Wie variabel ist x? Genauer: Wie weit weicht x typischerweise von µ ab? 30/84 Der Standardfehler Ein allgemeiner Rahmen x = x1 + x2 + · · · + xn /n Wovon hängt die Variabilität von x ab? 31/84 Der Standardfehler Ein allgemeiner Rahmen 1. von der Variabilität der einzelnen Beobachtungen x1, x2, . . . , xn 32/84 Der Standardfehler Ein allgemeiner Rahmen x variiert viel 0.05 0.10 0.15 0.20 0.25 x variiert wenig 0.05 0.10 0.15 0.20 0.25 33/84 Der Standardfehler Ein allgemeiner Rahmen Mittelwert = 0.117 x variiert viel ⇒ x variiert viel 0.05 0.10 0.15 0.20 0.25 Mittelwert = 0.117 x variiert wenig ⇒ x variiert wenig 0.05 0.10 0.15 0.20 0.25 33/84 Der Standardfehler Ein allgemeiner Rahmen 2. vom Stichprobenumfang n 34/84 Der Standardfehler Ein allgemeiner Rahmen 2. vom Stichprobenumfang n Je größer n, desto kleiner die Variabilität von x. 34/84 Der Standardfehler Ein allgemeiner Rahmen Um diese Abhängigkeit zu untersuchen, machen wir ein (Computer-)Experiment. 35/84 Der Standardfehler Ein allgemeiner Rahmen Experiment: Wir nehmen eine Population, ziehen Stichproben, und schauen, wie x variiert. 36/84 Der Standardfehler Ein allgemeiner Rahmen Nehmen wir an, die Verteilung aller möglichen Transpirationswerte sieht folgendermaßen aus: 37/84 Der Standardfehler Ein allgemeiner Rahmen 10 5 0 Dichte 15 Hypothethische Transpirationsratenverteilung 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 38/84 Der Standardfehler Ein allgemeiner Rahmen Hypothethische Transpirationsratenverteilung 10 5 0 Dichte 15 Mittelwert=0.117 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 38/84 Der Standardfehler Ein allgemeiner Rahmen Hypothethische Transpirationsratenverteilung 10 5 0 Dichte 15 Standardabw.=0.026 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 38/84 Der Standardfehler Ein allgemeiner Rahmen Wir beginnen mit kleinen Stichproben: n=4 39/84 Der Standardfehler Ein allgemeiner Rahmen 10 5 0 Dichte 15 Eine Stichprobe vom Umfang 4 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 40/84 Der Standardfehler Ein allgemeiner Rahmen 10 5 0 Dichte 15 Eine zweite Stichprobe vom Umfang 4 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 40/84 Der Standardfehler Ein allgemeiner Rahmen 10 5 0 Dichte 15 Eine dritte Stichprobe vom Umfang 4 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 40/84 Der Standardfehler Ein allgemeiner Rahmen 10 Stichproben 41/84 Der Standardfehler Ein allgemeiner Rahmen 0 2 4 6 8 10 10 Stichproben 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 41/84 Der Standardfehler Ein allgemeiner Rahmen 50 Stichproben 42/84 Der Standardfehler Ein allgemeiner Rahmen 0 10 20 30 40 50 50 Stichproben 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 42/84 Der Standardfehler Ein allgemeiner Rahmen Wie variabel sind die Stichprobenmittelwerte? 43/84 Der Standardfehler Ein allgemeiner Rahmen 0 2 4 6 8 10 10 Stichproben vom Umfang 4 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 44/84 Der Standardfehler Ein allgemeiner Rahmen 0 2 4 6 8 10 10 Stichproben vom Umfang 4 und die zugehörigen Stichprobenmittel 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 44/84 Der Standardfehler Ein allgemeiner Rahmen 0 10 20 30 40 50 50 Stichproben vom Umfang 4 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 45/84 Der Standardfehler Ein allgemeiner Rahmen 0 10 20 30 40 50 50 Stichproben vom Umfang 4 und die zugehörigen Stichprobenmittel 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 45/84 Der Standardfehler Ein allgemeiner Rahmen Stichprobenmittel Mittelwert=0.117 Standardabw.=0.013 10 20 Population Mittelwert=0.117 Standardabw.=0.026 0 Dichte 30 40 Verteilung der Stichprobenmittelwerte (Stichprobenumfang n = 4) 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 46/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 47/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 Stichprobenmittelwerte (n = 4): Standardabweichung = 0,013 47/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 Stichprobenmittelwerte (n = 4): Standardabweichung = 0,013 √ = 0,026/ 4 47/84 Der Standardfehler Ein allgemeiner Rahmen Erhöhen wir den Stichprobenumfang von 4 auf 16 48/84 Der Standardfehler Ein allgemeiner Rahmen 0 2 4 6 8 10 10 Stichproben vom Umfang 16 und die zugehörigen Stichprobenmittel 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 49/84 Der Standardfehler Ein allgemeiner Rahmen 0 10 20 30 40 50 50 Stichproben vom Umfang 16 und die zugehörigen Stichprobenmittel 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 50/84 Der Standardfehler Ein allgemeiner Rahmen Population Mittelwert=0.117 Standardabw.=0.026 Stichprobenmittel Mittelwert=0.117 Standardabw.= 0.0065 40 20 0 Dichte 60 80 Verteilung der Stichprobenmittelwerte (Stichprobenumfang n = 16) 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 51/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 52/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 Stichprobenmittelwerte (n = 16): Standardabweichung = 0,0065 52/84 Der Standardfehler Ein allgemeiner Rahmen Population: Standardabweichung = 0,026 Stichprobenmittelwerte (n = 16): Standardabweichung = 0,0065√ = 0,026/ 16 52/84 Der Standardfehler Ein allgemeiner Rahmen Die allgemeine Regel Die Standardabweichung des Mittelwerts einer Stichprobe vom Umfang n 53/84 Der Standardfehler Ein allgemeiner Rahmen Die allgemeine Regel Die Standardabweichung des Mittelwerts einer Stichprobe vom Umfang n ist √ 1/ n mal der Standardabweichung der Population. 53/84 Der Standardfehler Ein allgemeiner Rahmen Die Standardabweichung der Population bezeichnet man mit σ (sigma). 54/84 Der Standardfehler Ein allgemeiner Rahmen Die Standardabweichung der Population bezeichnet man mit σ (sigma). Die Regel schreibt man häufig so: 1 σ(x) = √ σ(X ) n 54/84 Der Standardfehler Ein allgemeiner Rahmen In der Praxis ist σ unbekannt. 55/84 Der Standardfehler Ein allgemeiner Rahmen In der Praxis ist σ unbekannt. Es wird durch die Stichproben-Standardabweichung s geschätzt: 55/84 Der Standardfehler Ein allgemeiner Rahmen In der Praxis ist σ unbekannt. Es wird durch die Stichproben-Standardabweichung s geschätzt: σ =?? (Erinnerung: s = q 1 n−1 Pn i=1 (xi − x)2 ) 55/84 Der Standardfehler Ein allgemeiner Rahmen In der Praxis ist σ unbekannt. Es wird durch die Stichproben-Standardabweichung s geschätzt: σ≈s (Erinnerung: s = q 1 n−1 Pn i=1 (xi − x)2 ) 55/84 Der Standardfehler Ein allgemeiner Rahmen √ s/ n (die geschätzte Standardabweichung von x) nennt man den Standardfehler. 56/84 Der Standardfehler Ein allgemeiner Rahmen √ s/ n (die geschätzte Standardabweichung von x) nennt man den Standardfehler. (Englisch: standard error of the mean, standard error, SEM) 56/84 Der Standardfehler Zur Verteilung von x Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 57/84 Der Standardfehler Zur Verteilung von x Wir haben gesehen: Auch wenn die Verteilung von x mehrgipfelig & asymmetrisch ist 58/84 Der Standardfehler Zur Verteilung von x 10 5 0 Dichte 15 Hypothethische Transpirationsratenverteilung 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 59/84 Der Standardfehler Zur Verteilung von x ist die Verteilung von x trotzdem (annähernd) eingipfelig & symmetrisch (wenn der Stichprobenumfang n nur groß genug ist) 60/84 Der Standardfehler Zur Verteilung von x 10 20 30 40 50 60 Population Stichprobenmittel (n=16) 0 Dichte Hypothethische Transpirationsratenverteilung 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 Transpiration (ml/(Tag*cm^2)) 61/84 Der Standardfehler Zur Verteilung von x Die Verteilung von x hat annähernd eine ganz bestimmte Form: die Normalverteilung. 62/84 Der Standardfehler Zur Verteilung von x Dichte der Normalverteilung: µ exp (x−µ)2 2σ 2 0.1 0.2 0.3 µ+σ 0.0 Normaldichte 0.4 µ−σ √ 1 2πσ 2 −1 0 1 2 3 4 5 63/84 Der Standardfehler Zur Verteilung von x Dichte der Normalverteilung: µ exp (x−µ)2 2σ 2 0.1 0.2 0.3 µ+σ 0.0 Normaldichte 0.4 µ−σ √ 1 2πσ 2 −1 0 1 2 3 4 5 Die Normalverteilungsdichte heisst auch Gauß’sche Glockenkurve 63/84 Der Standardfehler Zur Verteilung von x Dichte der Normalverteilung: √ 1 2πσ 2 exp (x−µ)2 2σ 2 Die Normalverteilungsdichte heisst auch Gauß’sche Glockenkurve (nach Carl Friedrich Gauß, 1777-1855) 63/84 Der Standardfehler Zur Verteilung von x Wichtige Folgerung √ √ Wir betrachten das Intervall x − s/ n, x + s/ n √ x − s/ n √ x + s/ n x Der Standardfehler Zur Verteilung von x Wichtige Folgerung √ √ Wir betrachten das Intervall x − s/ n, x + s/ n Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb dieses Intervalls. √ √ x − s/ n x + s/ n x Der Standardfehler Zur Verteilung von x Wichtige Folgerung √ √ Wir betrachten das Intervall x − s/ n, x + s/ n Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb dieses Intervalls. √ √ x − s/ n x + s/ n x Mit Wahrscheinlichkeit ca. 1/3 liegt µ ausserhalb des Intervalls. 64/84 Der Standardfehler Zur Verteilung von x Wichtige Folgerung √ √ Wir betrachten das Intervall x − s/ n, x + s/ n Mit Wahrscheinlichkeit ca. 2/3 liegt µ innerhalb dieses Intervalls. √ √ x − s/ n x + s/ n x Mit Wahrscheinlichkeit ca. 1/3 liegt µ ausserhalb des Intervalls. Beachte: Das wahre µ ist unbekannt, aber nicht zufällig. Die Wahrscheinlichkeit bezieht sich auf das Verhalten von x und s, die wir anhand der zufälligen Stichprobe berechnet haben. 64/84 Der Standardfehler Zur Verteilung von x Demnach: Es kommt durchaus vor, dass x von µ um √ mehr als s/ n abweicht. 65/84 Der Standardfehler Anwendungen Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 66/84 Der Standardfehler Anwendungen Anwendung 1: Welche Werte von µ sind plausibel? 67/84 Der Standardfehler Anwendungen Anwendung 1: Welche Werte von µ sind plausibel? x = 0,12 √ s/ n = 0,007 67/84 Der Standardfehler Anwendungen Anwendung 1: Welche Werte von µ sind plausibel? x = 0,12 √ s/ n = 0,007 Frage: Könnte es sein, dass µ = 0,115? 67/84 Der Standardfehler Anwendungen Antwort: Es ist gut möglich. 68/84 Der Standardfehler Anwendungen Antwort: Es ist gut möglich. Abweichung x − µ = 0,120 − 0,115 = 0,005. 68/84 Der Standardfehler Anwendungen Antwort: Es ist gut möglich. Abweichung x − µ = 0,120 − 0,115 = 0,005. Standardfehler √ s/ n = 0,007 68/84 Der Standardfehler Anwendungen Antwort: Es ist gut möglich. Abweichung x − µ = 0,120 − 0,115 = 0,005. Standardfehler √ s/ n = 0,007 Abweichungen dieser Größe kommen häufig vor. 68/84 Der Standardfehler Anwendungen Antwort: Es ist gut möglich. Abweichung x − µ = 0,120 − 0,115 = 0,005. Standardfehler √ s/ n = 0,007 Abweichungen dieser Größe kommen häufig vor. (Die Frage, welche Abweichungen nicht mehr plausibel sind, untersuchen wir im nächsten Kapitel.) 68/84 Der Standardfehler Anwendungen Anwendung 2: Vergleich von Mittelwerten 69/84 Der Standardfehler Anwendungen Anwendung 2: Vergleich von Mittelwerten Beispiel: Eine Stichprobe von Springkrebsen 69/84 Der Standardfehler Anwendungen Galathea: Carapaxlänge in einer Stichprobe Männchen: x 1 = 3,04 mm s1 = 0,9 mm n1 = 25 Weibchen: x 2 = 3,23 mm s2 = 0,9 mm n2 = 29 70/84 Der Standardfehler Anwendungen Die Weibchen scheinen größer zu sein. 71/84 Der Standardfehler Anwendungen Die Weibchen scheinen größer zu sein. Ist das ernst zu nehmen? 71/84 Der Standardfehler Anwendungen Die Weibchen scheinen größer zu sein. Ist das ernst zu nehmen? Oder könnte es nur Zufall sein? 71/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? 72/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? Männchen: x 1 = 3,04 mm s1 = 0,9 mm n1 = 25 √ s1/ n1 = 0,18 [mm] 72/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? Männchen: x 1 = 3,04 mm s1 = 0,9 mm n1 = 25 √ s1/ n1 = 0,18 [mm] Mit Schwankungen von ±0,18 (mm) in x 1 müssen wir rechnen. 72/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? 73/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? Weibchen: x 2 = 3,23 mm s2 = 0,9 mm n2 = 29 √ s2/ n2 = 0,17 [mm] 73/84 Der Standardfehler Anwendungen Wie genau sind die beiden Mittelwerte? Weibchen: x 2 = 3,23 mm s2 = 0,9 mm n2 = 29 √ s2/ n2 = 0,17 [mm] Es ist nicht unwahrscheinlich, dass x 2 um mehr als ±0,17 (mm) vom wahren Mittelwert abweicht. 73/84 Der Standardfehler Anwendungen Die Differenz der Mittelwerte 3,23 − 3,04 = 0,19 [mm] 74/84 Der Standardfehler Anwendungen Die Differenz der Mittelwerte 3,23 − 3,04 = 0,19 [mm] ist kaum größer als die zu erwartenden Schwankungen. 74/84 Der Standardfehler Anwendungen Die Differenz der Mittelwerte 3,23 − 3,04 = 0,19 [mm] ist kaum größer als die zu erwartenden Schwankungen. Es könnte also einfach Zufall sein, dass x2 > x1 74/84 Der Standardfehler Anwendungen Genauer formuliert: Wenn in Wirklichkeit die Populationsmittelwerte gleich sind, µWeibchen = µMännchen 75/84 Der Standardfehler Anwendungen Genauer formuliert: Wenn in Wirklichkeit die Populationsmittelwerte gleich sind, µWeibchen = µMännchen kann es trotzdem leicht passieren, dass die Stichprobenmittelwerte x 2 und x 1 so weit auseinander liegen. 75/84 Der Standardfehler Anwendungen Der Statistiker sagt: Die Differenz der Mittelwerte ist (statistisch) nicht signifikant. 76/84 Der Standardfehler Anwendungen Der Statistiker sagt: Die Differenz der Mittelwerte ist (statistisch) nicht signifikant. nicht signifikant = könnte Zufall sein 76/84 Der Standardfehler Anwendungen Anwendung 3: Wenn man Mittelwerte graphisch darstellt, sollte man auch ihre Genauigkeit √ (±s/ n) anzeigen. 77/84 Der Standardfehler Anwendungen Also nicht so: 3.2 ● 2.8 3.0 ● Männchen Weibchen 2.6 Carapaxlänge [mm] 3.4 Carapaxlängen: Mittelwerte nach Geschlecht 78/84 Der Standardfehler Anwendungen sondern so: 3.2 ● 2.8 3.0 ● Männchen Weibchen 2.6 Carapaxlänge [mm] 3.4 Carapaxlängen: Mittelwerte ± Standardfehler nach Geschlecht 78/84 Der Standardfehler Anwendungen Anwendung 4: Bei der Versuchsplanung: 79/84 Der Standardfehler Anwendungen Anwendung 4: Bei der Versuchsplanung: Wieviele Beobachtungen brauche ich? (Wie groß sollte n sein?) 79/84 Der Standardfehler Anwendungen Wenn man weiß, welche Genauigkeit √ (Standardfehler s/ n) für x man erreichen will, 80/84 Der Standardfehler Anwendungen Wenn man weiß, welche Genauigkeit √ (Standardfehler s/ n) für x man erreichen will, und wenn man (aus Erfahrung oder aus einem Vorversuch) s ungefähr kennt, 80/84 Der Standardfehler Anwendungen Wenn man weiß, welche Genauigkeit √ (Standardfehler s/ n) für x man erreichen will, und wenn man (aus Erfahrung oder aus einem Vorversuch) s ungefähr kennt, dann kann man das notwendige n ungefähr abschätzen: √ s/ n = g (g = gewüschter Standardfehler) 80/84 Der Standardfehler Anwendungen Beispiel: Gestresste Transpirationswerte bei einer anderen Hirse-Sorte: x = 0,18 s = 0,06 n = 13 81/84 Der Standardfehler Anwendungen Beispiel: Gestresste Transpirationswerte bei einer anderen Hirse-Sorte: x = 0,18 s = 0,06 n = 13 Nehmen wir an, der Versuch soll wiederholt werden und man will Standardfehler ≈ 0,01 erreichen. 81/84 Der Standardfehler Anwendungen Beispiel: Gestresste Transpirationswerte bei einer anderen Hirse-Sorte: x = 0,18 s = 0,06 n = 13 Nehmen wir an, der Versuch soll wiederholt werden und man will Standardfehler ≈ 0,01 erreichen. Wie groß sollte n sein? 81/84 Der Standardfehler Anwendungen Lösung: gew √ ünscht: s/ n ≈ 0,01 82/84 Der Standardfehler Anwendungen Lösung: gew √ ünscht: s/ n ≈ 0,01 aus dem Vorversuch wissen wir: s ≈ 0,06, 82/84 Der Standardfehler Anwendungen Lösung: gew √ ünscht: s/ n ≈ 0,01 aus dem Vorversuch wissen wir: s ≈ 0,06, √ also n ≈ 6 82/84 Der Standardfehler Anwendungen Lösung: gew √ ünscht: s/ n ≈ 0,01 aus dem Vorversuch wissen wir: s ≈ 0,06, √ also n ≈ 6 n ≈ 36 82/84 Der Standardfehler Zusammenfassung Inhalt 1 Ein kurze Wiederholung zur deskriptiven Statistik Mittelwert und Standardabweichung Ein Beispiel zur Warnung 2 Der Standardfehler Ein Versuch Ein allgemeiner Rahmen Zur Verteilung von x Anwendungen Zusammenfassung 83/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße √ mit Mittelwert µ und Standardabweichung σ/ n. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße √ mit Mittelwert µ und Standardabweichung σ/ n. √ Man schätzt die Standardabweichung von x mit s/ n. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße √ mit Mittelwert µ und Standardabweichung σ/ n. √ Man schätzt die Standardabweichung von x mit s/ n. √ s/ n nennt man den Standardfehler. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße √ mit Mittelwert µ und Standardabweichung σ/ n. √ Man schätzt die Standardabweichung von x mit s/ n. √ s/ n nennt man den Standardfehler. √ Schwankungen in x von der Größe s/ n kommen häufig vor. 84/84 Der Standardfehler Zusammenfassung ZUSAMMENFASSUNG Nehmen wir an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser Population ziehen wir eine Zufallsstichprobe vom Umfang n, mit Stichprobenmittelwert x. x ist eine Zufallsgröße √ mit Mittelwert µ und Standardabweichung σ/ n. √ Man schätzt die Standardabweichung von x mit s/ n. √ s/ n nennt man den Standardfehler. √ Schwankungen in x von der Größe s/ n kommen häufig vor. Solche Schwankungen sind nicht signifikant“: sie könnten ” Zufall sein. 84/84