EINFÜHRUNGSKURS STATISTIK Modul 0008 Warum eigentlich Statistik? • Deskriptive Statistik • Beschreiben der Daten • Suchen nach Trends /Mustern • Induktive Statistik • Ziel: Verallgemeinerung der Ergebnisse • Rückschlüsse auf Grundgesamtheit/Population durch Erhebung einer repräsentativen Stichprobe Ablauf statistischer Untersuchungen Ablauf statistischer Untersuchungen • Wieviele Proben benötige ich? • Welche Stichprobeneinheit soll verwendet werden? • Skalierung • Welches räumliche Probennahmemuster soll verwendet werden? • z.B. bei Beprobung einer Fläche • Welches zeitlich Probennahmemuster soll verwendet werden? • Adäquate Intervalle Populationen und Stichproben Definition Population Stichprobe Grundgesamtheit Teilmenge einer Grundgesamtheit latein Symbole griechisch Mittel m Standardabweichung s s Stichproben • Verbundene Stichproben • z.B. wiederholte Messungen am gleichen Versuchsobjekt • Stichprobe zu einem Zeitpunkt kann Einfluss auf Stichprobe eines anderen Zeitpunkts haben • Unverbundene Stichproben • Stichproben haben keinen Einfluss aufeinander • z.B. unterschiedliche Populationen, Vergleich unterschiedlicher Individuen Datentypen Informationsgehalt Merkmale / Variablen • Experimente werden normalerweise so gestaltet, um den Einfluss eines oder mehrerer Faktoren auf eine Variable zu untersuchen • Feldarbeit kann nie vollständig kontrolliert werden: Verschiedene Faktoren können Einfluss auf Variable haben • see “Nearly right or precisely wrong” by Randolph and Nuttall (1994) Systematische Fehler/Trend (Bias) • Auftretender, meist störender systematischer Effekt mit einer Grundtendenz, der von den wahren Ergebnissen abweicht • Schätzung von Fischpopulationen mit Netzen einer bestimmten Maschenweite: kleine Fische können immer entkommen • Fangen von Säugetieren: manche Individuen sind “trap happy”, manche sind “trap shy” Deskriptive Statistik • Eine Methode um Daten zusammenzufassen und darzustellen • Heiko hat 2006 über 68.000 Zecken gesammelt • H.G. Andrewartha hat in 14 Jahren über 3.000.000 Fransenflügler auf Rosen gezählt • Große Datenmengen müssen zusammengefasst werden • Eine numerische Darstellung wird für eine genaue Beschreibung der Daten benötigt • Excel, SPSS, R, … Darstellung von Daten Darstellung von Daten Histogramm Säulendiagramm Scatterplot Boxplot Häufigkeitsverteilungen Parameter einer Verteilung • Lagemaße • Mittelwerte • Median • Modalwert • Quantile • Streuungsmaße • Spannweite (Minimum bis Maximum) • Varianz • Standardabweichung • Konfidenzintervall (e.g. a=5%=95%KI) Zentrale Tendenz & Streuung Lagemaße - Mittelwerte • Arithmetisches Mittel (am häufigsten verwendet) AM=1/nSxi • Geometrisches Mittel (für logarithmierte Daten, z.B. Populationswachstum) • Harmonisches Mittel (Mittelwert von Verhältnissen, z.B. Fahrzeit) • AM>GM>HM Weitere Lagemaße • Median (der Wert, der bei einer Auflistung von Zahlenwerten in der Mitte steht) 4, 1, 37, 2, 1 Median = 2 (1, 1, 2, 4, 37) • Modalwert (Dichtemittel) • 2, 2, 3, 5, 5, 5, 9, 9, 15 • Quantil, Quartil • Die geordnete Reihe der Merkmalsausprägungen wird in gleichgroße Teile zerlegt Streuungsmaße • Spannweite • Maximale Differenz zwischen zugrunde liegenden Daten • Mindestens Ordinaldaten notwendig • Varianz • Mittlere quadratische Abweichung der einzelnen Datenwerte vom arithmetischen Mittelwert. • Standardabweichung • Als Standardabweichung bezeichnet man die Wurzel aus der Varianz. Dieses Streuungsmaß besitzt die selbe Einheit wie die Daten und der Mittelwert Wahrscheinlichkeitsverteilung • Einige Verteilungen, die natürlich vorkommen • Normalverteilung • Poissonverteilung • Binomialverteilung • Negative Binomialverteilung Normalverteilung • Häufigste Verteilung für stetige Variablen • Lagemaß: Mittelwert • Streuungsmaß: Varianz • Anforderung um parametrische Tests durchzuführen Bei einer Normalverteilung sind Mittelwert und Median gleich Poissonverteilung • Einparametrige, diskrete statistische Verteilung • “Verteilung der seltenen Ereignisse • Anzahl von Tieren, die auf einem km Straße getötet werden • Anzahl der Personen aus 10 preussischen Armeen, die über den Zeitraum von 20 Jahren durch Pferdetritte getötet werden Binomialverteilung • Zweiparametrige, diskrete statistische Verteilung • Genau zwei Ausprägungsmöglichkeiten des Merkmals möglich: z.B. weiblich & männlich, verheiratet und ledig Negative Binomialverteilung • Eine gruppierte Anzahl Darmwürmer pro Igel (aggregierte) Verteilung, die oft verwendet wird um eine Überdispersion z.B. in Parasitenpopulationen anzugeben. • Die Varianz ist normalerweise größer als der Mittelwert • Bsp.: Anzahl von Zecken/ Igel auf 20 Igeln) Hypothesen und Testen von Hypothesen • Hypothesen • Signifikanzniveau • Konfidenzintervall • Typ I - und Typ II - Fehler • Ein- und zweiseitige Tests Das Prinzip der Hypothesen • Die Nullhypothese (H0) sagt, dass es keine Unterschiede gibt • Wird H0 abgelehnt, wird die Alternativhypothese H1 akzeptiert Statistische Tests untersuchen die Wahrscheinlichkeit ob einer der Hypothesen “richtig” oder “falsch” ist Ablauf eines statistischen Tests • Aufstellen der Forschungsfrage Entwicklung eines • • • • • • Experiments zum testen der Hypothese Formulieren von H0 und H1: klares Verständnis für Erwartungen Entscheidung für einen geeigneten statistischen Test und Signifikanzniveau (normalerweise p < 0.05) Sammeln der Daten um Hypothese zu testen Kontrolle der Probenverteilung: wenn nötig alternativer Test oder Datentransformierung Testanalyse: Berechnung des p-Wertes Statistische Entscheidung p < 0,05 => Verwerfen der H0 und Annehmen der H1 p ≥ 0,05 Beibehalten der Nullhypothese (H0) • Interpretation der Ergebnisse Signifikanzniveau & Konfidenzintervall =Irrtumswahrscheinlichkeit α α/2 = Konfidenzintervall & Co. • Konfidenzintervall: Der Bereich in dem der Parameter der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit liegt • Konfidenzintervalle lassen sich nur bestimmen wenn die Verteilung der Grundgesamtheit bekannt ist • Ein Mittelwert ist wenig wert, wenn man nichts über die Verteilung der Daten weiß > Standardabweichung (s) Maß für die Streuung der Werte einer Zufallsvariablen um ihren Erwartungswert > Standardfehler (Streuungsmaß - (s/sqrt(n))) Durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert Testauswahl: Welche Kriterien nutzen wir? • Skalenniveau das für die Daten passt • Sind die Daten verbunden oder unverbunden? • Sind die Daten normalverteilt? • Anzahl der untersuchten Variablen • Anzahl der Vergleichsgruppen der Variablen • Können eine oder mehrere Faktoren die Werte der Variable beeinflussen? • (univariate oder multivariate Analyse) Kreuztabelle • tabellarische Darstellung der gemeinsamen Häufigkeitsverteilung zweier Variablen • Eignet sich vor allem für kategorielle Daten • 2 x 2 Tabelle • m x n Tabelle • z.B. Vergleich von Prävalenzen Produkt A Produkt B Summe weiblich männlich Summe 660 440 1100 340 560 900 1000 1000 2000 Frage 1 Trevor möchte wissen ob das Verhältnis der Anzahl von männlichen zu weiblichen Zecken, die er im Garten gesammelt hat, gleich ist. 2x2 Tabelle Variable I II Total + a b a+b - c d c+d Total a+c b+d Männchen (m) Weibchen (f) Total Beobachtet (o) 42 38 80 Erwartet (e) 40 80 40 c2 1= (om-em)2/em + (of-ef)2/ef Freiheitsgrade (df) = Anzahl untersuchten Gruppen -1 c2 mit 1df ist signifikant wenn α=5% wenn größer als >3.84 c2 1= 0.2 nicht signifikant Frage 2 Trevor möchte wissen ob das Verhältnis von männlichen zu weiblichen Zecken an zwei unterschiedlichen Fangtagen im März das Gleiche ist. Männchen Weibchen Total 31. März 42 38 80 14. März 33 35 68 Total 75 73 148 c21=n(lad-bcl-n/2)2/(a+b)(c+d)(a+c)(b+d) n/2 =Yates Korrektur für kleine Stichproben Eine alternative Methode bei kleinen Stichproben ist der Fisher’s exact test http://www.quantpsy.org/chisq/chisq.htm http://daten-consult.de/forms/cht2x2.html http://www.quantpsy.org/chisq/chisq.htm Frage 3 Trevor möchte wissen ob das Verhältnis von Männchen zu Weibchen aus dem Garten im März das gleiche ist wie an zwei Sammeltagen im April. n x m Tabelle Variable 1 2 Total A n11 n21 R1 B n12 n22 R2 C n13 n23 R3 Total C1 C2 N Männchen Weibchen Total 17. März 75 73 148 25. April 13 6 19 27. April 13 5 18 Total 101 84 185 c22=4,64; p=0,098 df=(c-1)(r-1) Achtung: es gibt keinen signifikanten Unterschiede zwischen den Apriltagen. Vereinigt man die Daten der beiden Apriltage und vergleicht sie mit März c21=4,54; p=0,032 SEHR WICHTIG! • Plane dein Experiment von Anfang an immer mit den statistischen Tests im Hinterkopf • Viele Daten werden gesammelt ohne die spätere statistische Auswertung zu berücksichtigen oft nutzlos! Typ 1 und Typ 2 Fehler • Typ 1: wir lehnen H0 ab, obwohl sie wahr ist. Wenn a=0,05 dann lehnen wir H0 in 5% der Fälle ab, obwohl sie wahr ist. a, die Wahrscheinlichkeit, mit der wir H0 ablehnen, wird so definiert. • Typ 2: wir akzeptieren H0 obwohl sie falsch ist. Die Wahrscheinlichkeit einen Typ 2 Fehler zu machen ist b. 1-b ist die Wahrscheinlichkeit H0 abzulehnen obwohl sie in Wirklichkeit richtig ist. Ein- oder zweiseitige Tests t-Test und andere • tdf= 1- 2/Standardfehler • Vergleich von Mittelwerten • Zwei unabhängige Stichproben • Gleiche Varianz (Mann-Whitney U-test) • Ungleiche Varianz • Abhängige Stichproben (Wilcoxon signed-ranks test) • Transformationen • * nicht-parametrische Tests Freiheitsgrade • Stichprobengröße kann die Verteilung der Daten beeinflussen • Je mehr Individuen, desto eher sind die geschätzten Parameter nah an der Realität (Grundgesamtheit). • Dieser Einfluss wird in der Statistik mit aufgenommen (df) • Für eine Population ist df=n, für eine Stichprobe n-1 Frage • Miriam möchte wissen, ob sich die Anzahl von Retikulozyten bei männlichen und weiblichen Igeln unterscheidet • Eventuell saisonal abhängig Mai 2007 für den Test • Zwei Mittelwerte (Männchen, Weibchen) • Stichproben sind unabhängig voneinander Gruppenstatistiken VAR00004 VAR00002 1,00 2,00 N 13 15 Mittelwert 508,8462 486,4000 Standardab weichung 284,59470 114,95453 Standardfe hler des Mittelwertes 78,93237 29,68113 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit VAR00004 Varianzen sind gleich Varianzen sind nicht gleich F Signifikanz 6,017 ,021 T-Test für die Mittelwertgleichheit T ,281 ,266 df Sig. (2-seitig) 26 ,781 15,370 ,794 95% Konfidenzintervall der Differenz Mittlere Standardfehle Differenz r der Differenz Untere Obere 22,4462 79,93357 -141,860 186,75195 22,4462 84,32845 -156,919 201,81174 Die Annahmen des t-Tests • Beobachtungen müssen unabhängig voneinander sein • Stichproben müssen zufälllig aus einer normal verteilten Population genommen werden (ggf. Transformation) • Populationen haben (normalerweise) die gleiche Varianz (nicht zwingend notwendig) • Variablen müssen mindestens intervallskaliert sein Was machen, wenn die Daten nicht zum Test passen? • Parametrische Tests • Annahme der Normalverteilung • Die tatsächlichen Werte werden verwendet • Nicht-parametrische Tests • Keine bestimmte Verteilung wird angenommen • Daten werden für den Test klassifiziert (verlieren damit an Information) Parametrisch vs. nicht-parametrisch • Vorteile von parametrischen Tests • Die wahre Verteilung der Daten wird in den Test mit einbezogen vorhandene Informationen werden genutzt • Vorhandene Tests können komplexe Interaktionen zwischen Variablen einschätzen • Vorteile von nicht-parametrischen Tests • Können verwendet werden wenn die Stichprobengröße gering ist • Können für Daten verwendet werden, die nicht normalverteilt sind (auch nicht transformiert werden können) • Können auch für nominale oder ordinale Daten verwendet werden Nicht-parametrischer Test für zwei Stichproben • Mann-Whitney U-test • Zwei unabhängige Stichproben • Wilcoxon-Vorzeichen-Rang-Test • Zwei abhängige Stichproben Beide verwenden klassifizierte Daten Frage • Miriam möchte wissen, ob die Anzahl von Retikulozyten sich bei männlichen und weiblichen Igeln unterscheiden • Eventuell saisonal abhängig Mai 2007 für den Test • Zwei Mittelwerte (Männchen, Weibchen) Stichproben sind unabhängig voneinander Ränge VAR00003 VAR00002 1,00 2,00 Ges amt N 14 19 33 Mittlerer Rang 13,93 19,26 Statistik für Testb Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) Exakte Signifikanz [2*(1-seitig Sig.)] VAR00003 90,000 195,000 -1,566 ,117 ,123 a a. Nicht für Bindungen korrigiert. b. Gruppenvariable: VAR00002 Rangsumme 195,00 366,00 Gruppenstatistiken VAR00004 VAR00002 1,00 2,00 N 13 15 Mittelwert 508,8462 486,4000 Standardab weichung 284,59470 114,95453 Standardfe hler des Mittelwertes 78,93237 29,68113 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit VAR00004 Varianzen sind gleich Varianzen sind nicht gleich F Signifikanz 6,017 ,021 T-Test für die Mittelwertgleichheit T ,281 ,266 df Sig. (2-seitig) 26 ,781 15,370 ,794 95% Konfidenzintervall der Differenz Mittlere Standardfehle Differenz r der Differenz Untere Obere 22,4462 79,93357 -141,860 186,75195 22,4462 84,32845 -156,919 201,81174 Varianzanalyse (ANOVA) • Einfach (Einfaktorielle) • z.B. Hämoglobinkonzentration/Igel in drei verschiedenen Gruppen • Mehrfaktoriell: mehr als eine unabhängige Variable • Zwei oder mehr Faktoren können das Ergebnis eines Experiments beeinflussen: die Interaktionen zwischen den unabhängigen Faktoren können bestimmt werden • z.B. Stichproben von 100 Bulinus Schnecken, die sich unter verschiedenen Temperatur- und pH- Bedingungen entwickelt haben 1 380 376 360 368 372 366 374 382 2 350 356 358 376 338 342 366 350 344 364 3 354 360 362 352 366 372 362 344 342 358 351 348 348 4 376 344 342 372 374 360 Breite des Scutums von Haemaphysalis laporis palustris Larven von 4 Kaninchen(mm) Deskriptive Statistik n 1 2 3 4 8 10 13 6 372,3 354,4 355,3 361,3 11,91 8,91 15,26 Standard7,36 abweichung ANOVA (Analysis of Variance) Quelle der df Abweichungen Sums of Mean F squares squares P Zwischen Gruppen 3 1.807,7 602,6 0,004 Innerhalb der Gruppen Total 33 3.778,0 114,5 36 5.585,7 5,26 Interpretation • Wir finden Unterschiede zwischen den Gruppen aber wo? • Weitere Tests können dies überprüfen (Post-hoc Tests): • Least significant difference (LSD) • Tukey’s HSD Wo sind die Unterschiede? • LSD und Tukey’s HSD zeigen beide: • 1=4 aber 1> 2 und 3 • 2=3, 4 aber 2>1 • 3= 2,4 aber 3>1 • 4=1, 2, 3 Hintergrund • Annahmen: wie für den t- Test • Abhängige (Zielvariable) und unabhängige Variablen (Einflussvariable/Faktor) • Der Faktor beeinflusst die Zielvariable • z.B. wie beeinflusst eine bestimmte Dosis eines Medikaments den Blutdruck? Der Blutdruck hängt von der Dosis ab, aber nicht umgekehrt Nicht-parametrische Tests für mehr als zwei Stichproben • Kruskal-Wallis Test • Für k unabhängige Stichproben • Friedman-Test • Für k abhängige Daten • Beide nutzen klassifizierte Daten Korrelation • Pearson Korrelation (r) • Verwendet tatsächlichen Werte • Rangkorrelation nach Spearman (rs) • Verwendet klassifizierte Daten • Bestimmtheitsmaß (r2) • Zwischen 0 und 1 • Zusammenhang zwischen der abhängigen und den unabhängigen Variablen 160 Retikulozyten 140 120 100 80 60 VAR00003 40 20 0 0 200 VAR00004 400 600 800 1000 Retikulozyten Konz. 1200 Korrelationen VAR00004 VAR00003 VAR00004 VAR00003 Korrelation nach Pears on 1 ,796** Signifikanz (2-s eitig) . ,000 N 28 28 Korrelation nach Pears on ,796** 1 Signifikanz (2-s eitig) ,000 . N 28 33 **. Die Korrelation is t auf dem Niveau von 0,01 (2-s eitig) s ignifikant. Korrelationen Spearman-Rho VAR00004 VAR00003 VAR00004 VAR00003 Korrelations koeffizient 1,000 ,850** Sig. (2-s eitig) . ,000 N 28 28 Korrelations koeffizient ,850** 1,000 Sig. (2-s eitig) ,000 . N 28 33 **. Die Korrelation is t auf dem 0,01 Niveau s ignifikant (zweis eitig). Regression • Linear • Nicht-linear • Transformationen wie für den t-Test und die ANOVA Bsp.: Kurvenförmige Regression http://www.methodenberatung.uzh.ch/index.html Fragen?