Sportwissenschaftliche Forschungsmethoden Altenberger / Lames, SS 2004 5. Statistische Auswertung Statistik Programm Grundbegriffe Deskriptive Statistik Lokationsmaße Streuungsmaße Verteilungen Normalverteilung Z-Transformation Statistischer Test Theorie: Drei Schritte Praxis: Ausreißertest Grundbegriffe Statistik Terminologie Grundgesamtheit (Population): • „Bereich, für den eine Untersuchung Geltung beansprucht“ • alle potentiell untersuchbaren Einheiten oder Elemente • Z.B. Drittklässler, Fußballer, Sportstudenten Statistik Terminologie Stichprobe: • „Teilnehmer an einer Untersuchung“ • Zufalls-, Klumpen-, geschichtete Stichprobe • Problem der Repräsentativität Statistik Terminologie Weitere Grundbegriffe der Statistik • Untersuchungseinheit (Vpn, Pbn) • Zufallsvariable (oder Merkmal) • Ereignisraum (alle denkbaren Ereignisse) • Verteilung (Häufigkeit der Merkmale über dem Ereignisraum) Deskriptive Statistik Lokationsmaße Statistik Lokationsmaße 1. Modalwert häufigster Wert einer Stichprobe/GG Statistik Lokationsmaße 2. Arithmetisches Mittel (Mittelwert) 1 n x xi n i 1 Statistik Lokationsmaße 3. Median Wert, der Verteilung in zwei gleich große Hälften teilt Stichprobengröße gerade: 2 3 4 6 7 8 9 Stichprobengröße ungerade: 2 3 4 5 6 7 8 9 : Median = 5,5 Vorteile gegenüber „Mittelwert“: • bei asymmetrischen Verteilungen • bei Ausreißern, Extremwerten Deskriptive Statistik Streuungsmaße Statistik Streuungsmasse Spannweite: Differenz zwischen größtem und kleinstem Wert der Stichprobe xmax-xmin Statistik Streuungsmasse Varianz: Mittlere quadratische Abweichung der Stichprobenwerte vom Mittelwert n 1 2 s ( xi x ) n 1 i 1 2 Statistik Streuungsmasse Standardabweichung (Streuung): Wurzel aus der Varianz 1 2 s s ( xi x ) n 1 i 1 n 2 1/ 2 Statistik Streuungsmasse Variationskoeffizient: Prozentualer Anteil der Streuung am Mittelwert s V 100 x Verteilungen Statistik Diskrete Verteilungen Tore in der Bundesliga von FC Hansa Rostock 6 5 Tore 4 3 2 1 0 1. 4. 7. 10. 13. 16. 19. 22. 25. 28. 31. 34. SpielNr. Statistik Diskrete Verteilung Verteilungsfunktion: Tore in der Bundesliga von Rostock 18 16 14 12 Spiele 108 6 4 2 0 0 1 2 Tore 3 4 5 Statistik Stetige Verteilungen 100m-Bestleistung von Studenten abs. Häufigkeit 10 8 6 4 2 0 11 11,4 11,8 12,2 12,6 13 13,4 13,8 14,2 100m-Zeit [sec.] 14,6 15 Statistik Überblick Verteilungen empirisch mathematisch diskret Tore von Rostock PoissonVerteilung kontinuierlich 100mLeistungen NormalVerteilung Normalverteilung Statistik Normalverteilung Dichtefunktion f x 1 2 2 e ( x )2 2 2 Verteilungsfunktion (Wahrscheinlichkeit) a F x a 1 2 2 e ( x )2 2 2 dx Statistik Verteilungstabelle Statistik Bedeutung der Normalverteilung • Theoretisch: Viele empirische Merkmale sind normalverteilt • Praktisch: Viele Testleistungen im Sport sind normalverteilt • Pragmatisch: Für viele statistische Verfahren ist Normalverteilung Anwendungsvoraussetzung Statistik Standardnormalverteilung Standardnormalverteilung (m=0, s=1) 0,5 0,4 f(x) 0,3 0,2 0,1 x 5 4, 5 4 3, 5 3 2, 5 2 1, 5 1 0 0, 5 -5 -4 ,5 -4 -3 ,5 -3 -2 ,5 -2 -1 ,5 -1 -0 ,5 0 Z-Transformation Statistik Problemchen Klaus ist ein sehr guter Schwimmer. Frank dagegen ein sehr guter Mittelstreckenläufer. Wer ist nun der bessere Sportler? Wir möchten also verschiedene Persönlichkeitsmerkmale (z.B. Schwimmund Laufleistungen) miteinander vergleichen. Die Antwort gibt uns ein (relativierender) Vergleich an einer Stichprobe. Statistik Z - Transformation Transformationsvorschrift: _ xi x zi s X, s aus Stichprobe, dann ist z Standard-Normalverteilt Z = 100 + 10zi ist normalverteilt mit Mittelwert 100, Streuung 10 Statistik Vergleich 800m: 1:59,25 ? L, sL 2,11 100m: 1:43,55 s , sS ! 1,55 Der statistische Test Was Sie immer schon über Signifikanz wissen wollten, aber nie zu fragen wagten! Statistik Einbettung in Forschungsgang Forschungshypothese Sport wirkt gesundheitsfördernd Operationalisierte Hypothese 6 wöchiges Ausdauertraining bei Stichprobe von 50jährigen senkt den Ruhepuls Statistische Hypothese Mittelwert Ruhepuls nachher kleiner als Mittelwert Ruhepuls vorher Statistischer Test t-Test für abhängige Stichproben Prüfung Statistik Hypothesenarten Forschungshypothese Thema des Projekts, Forschungsfrage Operationalisierte Hypothese Genaue Spezifikation der Untersuchung Statistische Hypothese Welche Aussage möchte ich prüfen ? Statistischer Test Konkrete statistische Berechnungen Der statistische Test Die Schritte Statistik Statistischer Test - Theorie Drei Schritte zur Signifikanz 1. Formulierung der Nullhypothese 2. Prüfstatistik berechnen 3. Entscheidung treffen Statistik 1. Schritt Formulierung der Nullhypothese 1. Fall: Statistische Prüfung: Die Nullhypothese behauptet das Gegenteil von dem, was ich beweisen möchte Wenn ich Unterschiede beweisen möchte, behauptet die Nullhypothese die Gleichheit! 2. Fall: Prüfung von Anwendungsvoraussetzungen: Die Nullhypothese behauptet die Geltung der Anwendungsvoraussetzung Statistik Beispiel Ausreissertest: 1. Schritt Weitsprungleistungen 6. Klasse: Mittelwert 3,50m Streuung 0,50m Maximum 5,50m Ist das ein Ausreißer? Kann die Ergebnisse erheblich verfälschen, insbesondere bei kleinen Stichproben Statistik Ausreissertest - Nullhypothese 2. Fall: Anwendungsvoraussetzung liegt vor! H 0 : xmax xmin Stichprobe Die Leistung von 5,50m gehört zur Stichprobe! Statistik 2. Schritt Berechnen einer Prüfstatistik: Aus den Daten der Stichprobe Testspezifische Rechenvorschrift Größe, von der man weiß, dass sie einer mathematischen Verteilung unterliegt Statistik Ausreissertest - Prüfstatistik _ zˆmax ẑmax ẑmax xmax x s ist standardnormalverteilt ! = (5,50 – 3,50 ) / 0,50 = 4,00 Statistik 3. Schritt Entscheidungsregel H0 wird dann abgelehnt, wenn Prüfstatistik einen Schwellenwert überschreitet Dieser Schwellenwert entspricht einer Irrtumswahrscheinlichkeit a a = 5% signifikant, a = 1% hoch signifikant Statistik Ausreissertest - Entscheidungsregel Lehne Ho ab, wenn: zˆ za Statistik Woher Schwellenwert ? 1,63 1,64 1,65 ... 2,32 2,33 2,34 ... 0,9434 0,9487 0,9512 0,9823 0,9902 0,9987 Statistik ẑmax = 4,0 3. Schritt Ausreißertest > 1,645 = z > 2,33 = z 5% 1% Entscheidung: H0 ablehnen, d.h. auf dem 1% - Niveau der Irrtumswahrscheinlichkeit ist 5,50 ein Ausreisser! Statistik Bedeutung Entscheidung 2 mögliche Entscheidungen: 1. H0 beibehalten, d.h. es liegen nicht genügend Hinweise in den Daten vor, um H0 abzulehnen, heisst nicht H0 ist wahr 2. H0 ablehnen, d.h. mit einer (kleinen) Irrtumswahrscheinlichkeit a ist H0falsch Statistik Illustration Entscheidungsregel H0 beibehalten H0 ablehnen (signifikant) 1,645 z5% H0 ablehnen (hoch signifikant) 2,33 z1% ẑ Der statistische Test Was Sie immer schon über Signifikanz wissen wollten, aber nie zu fragen wagten! Nächste Woche geben Sie die Antworten!