Univ.-Prof. Dr. Georg Wydra Methoden zur Auswertung von Untersuchungen 1 2 3 4 SKALENTYPEN UND VARIABLEN ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN DESKRIPTIVE STATISTIK Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 1 1 Skalentypen und Variablen Die Güte der einer Statistik zugrunde liegenden Zahlen hat einen unmittelbaren Einfluss auf die zur Verfügung stehenden statistischen Methoden. Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 2 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 3 Skalentypen Nominalskalen: Verbale Bezeichnung von Merkmalsausprägungen einer Variablen (z. B. Haarfarbe). Ordinalskalen: Bildung einer Rangfolge der Merkmalsausprägungen einer Variablen (z. B. Schulnoten). Intervallskalen: Konstante Abstände der Merkmalsausprägungen aber variabler Nullpunkt (z. B. °C oder °F). Ratioskalen Verhältnisskalen): Intervallskalen mit einem natürlichen Nullpunkt und variabler Skalierung (z. B.: Längenmaße; Skalierung Meter oder Meilen) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 4 Variablen Eine Variable ist ein Symbol für eine Menge von Merkmalsausprägungen. Beispiele: Geschlecht, Haarfarbe, schulische Leistungen, Zeit beim 100-m-Lauf, absolute Temperatur Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 5 Unabhängige und abhängige Variablen Unabhängige Variablen sind diejenigen, die manipuliert, d. h. beeinflusst werden können. Abhängige Variablen werden dagegen nur gemessen. Beispiel Kraftunterschiede zwischen Männer und Frauen Abhängige Variable: Kraftwerte Unabhängige Variablen: Geschlecht Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 6 Diskrete und kontinuierliche Variablen Eine diskrete Variable besteht aus endlich vielen oder abzählbaren, separaten, unteilbaren Werten eines bestimmten Intervalls. Zwischen zwei benachbarten Werten existieren keine weiteren Werte (z. B. Zahl der Studierenden, Antwortkategorien bei einem Fragebogen). Eine stetige bzw. kontinuierliche Variable besteht aus einer unendlichen Anzahl möglicher Merkmalsausprägungen. Zwischen zwei benachbarten Werten existieren unendlich viele weitere Werte (c-g-s-System: Längen-, Gewichts- und Zeitmaße sind bis ins Unendliche weiter zu unterteilen m, cm, mm, µm, nm etc.) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 7 2 Zur Bedeutung der Statistik in der Forschung Ich glaube nur an Statistiken , die ich selbst gefälscht habe. Nein nicht - Sir Winston Churchill (1874 - 1965) Mit Statistiken kann man alles beweisen, nur nicht die Wahrheit. ohne Quellennachweis Ich stehe Statistiken etwas skeptisch gegenüber, denn laut Statistik haben ein Millionär und ein Habenichts je eine halbe Million. Franklin D. Roosevelt (1882 - 1945) Alles was lediglich wahrscheinlich ist, ist wahrscheinlich falsch. René Descartes (1596-1650) Wenn man den Kopf in der Sauna hat und die Füße im Kühlschrank, sprechen Statistiker von einer angenehmen mittleren Temperatur. Franz Josef Strauß (1915-1988) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 8 Pospeschill, 2006 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 9 Pospeschill, 2006 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 10 Formen der Statistik Die deskriptive Statistik stellt Analysetechniken zur Verfügung, die der explorativen Beschreibung und Charakterisierung empirischer Daten in Form ihrer Verteilung, Lage und Streuung dienen. Die Inferenzstatistik basiert auf Analysetechniken, die der Untersuchung von Stichproben dienen und Generalisationen auf die Grundgesamtheit (Population) erlauben, aus denen sie gezogen wurden. Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 11 Pospeschill, 2006 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 12 Stichprobe und Stichprobenfehler Eine Stichprobe ist eine bestimmte Anzahl von Fällen aus einer definierten Population, die zur Repräsentation der Population in einer empirischen Untersuchung eingesetzt wird. Der Stichprobenfehler stellt die Diskrepanz zwischen der Stichprobenstatistik und den tatsächlichen Werten in der Gesamtpopulation dar. Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 13 3 Statistik als Verfahren zur Prüfung von Hypothesen Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 14 Unterschiede zwischen Zeitpunkten nen Hypothesenformen Querschnittsuntersuchungen Längsschnittuntersuchungen Ex-post-facto-Untersuchungen Quasiexperimentelle Untersuchungen mit Vortest Hybride Experimente mit Vortest Naturwissenschaftliche Experimente X X X X X X X X X X X X X X X X Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes Kausalhypothesen Gruppenunterschiede Design-Typen zu den verschiede- Effektunterschiede Zusammenhänge X X X Zuordnung der verschiedenen X X 15 4 Deskriptive Statistik • Häufigkeiten • Form der Verteilung der Daten • Mittelwerte • Streuungsmaße Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 16 Analyse und Darstellung von Häufigkeiten • Absolute, prozentuale und kumulative Häufigkeiten • Grafische Darstellung von Häufigkeiten Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 17 Häufigkeiten • Absolute Häufigkeiten • Relative Häufigkeiten • Kumulative Häufigkeiten • Relative kumulative Häufigkeiten • jeweils von einer oder mehreren Gruppen Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 18 Häufigkeiten Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 19 Häufigkeiten Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 20 Mittelwerte - Maße der zentralen Tendenz Die zentrale Tendenz ist ein statistisches Messverfahren zur Bestimmung eines einzelnen Wertes zur Repräsentation einer bestimmten Verteilung. Dabei soll der zu bestimmende Wert typisch oder repräsentativ für das vollständige Datenset sein“ (Pospeschill, 2005, S. 59). Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 21 Mittelwerte • Arithmetisches Mittel: Durchschnittswert einer Zahlreihe • Gewogenes Arithmetisches Mittel: Mittelwert aus mehreren unterschiedlich großen Stichproben • Median: Wert, der eine Verteilung halbiert • Modalwert (Modus): Der häufigste Werte einer Verteilung Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 22 Mittelwerte Bös, Hänsel & Schott, 2000 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 23 Streuungsmaße Die Variabilität ist ein statistisches Messverfahren zur Quantifizierung des Streuungsmaßes von Messwerten. Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 24 Streuungsmaße Range (Spannweite): Differenz aus dem größten und kleinsten Wert Standardabweichung: Die mittleren 68 % einer Verteilung Varianz: Standardabweichung zum Quadrat Variationskoeffizient: Die relative Standardabweichung, d. h. die Standardabweichung dividiert durch den Mittelwert Interquartilabstand: Die mittlere 50 % einer Verteilung Standardfehler: Standardabweichung dividiert durch die Wurzel aus der Stichprobengröße n. Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 25 Streuungsmaße Durchschnittliche absolute Abweichung: basiert auf der Summe der absoluten Abweichungen jedes Variablenwertes vom »arithmetischen Mittel« über alle »Untersuchungseinheiten«. Die Summe der absoluten Abweichungen wird durch die Anzahl der Untersuchungseinheiten dividert, Konfidenzintervall (Präzision der Schätzung): Der Wertebereich, in dem man den interessierenden Parameter der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit erwartet Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 26 Beispiel aus Statistica Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 27 Möglichkeiten der grafischen Darstellung Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 28 Modifikation einer WinStat-Abbildung Mittelwert und Standardabweichung der Variable Alter 70 ± SD 65 Alter (Monate) 60 55 50 45 40 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 29 Box & Whisker Plot 75 Alter (Monate) 70 65 60 55 50 45 Alter (Monate) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 30 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 31 Normalverteilung Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 32 Verteilungsformen Pospeschill, 2006 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 33 Schiefe oder Symmetrie Bös, Hänsel & Schott, 2000 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 34 Steilheit oder Exzeß Bös, Hänsel & Schott, 2000 Die Wölbung bzw. Kurtosis der Dichtefunktion bzw. Wahrscheinlichkeitsfunktion einer Zufallsvariablen X ist definiert als ihr auf die vierte Potenz der Standardabweichung σ normiertes viertes zentrales Moment μ4(X) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 35 Prüfung der Normalverteilung 1. Optische Prüfung Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 36 Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 37 2. Statistische Prüfung 3. WinStat • Kolmogorow für kontinuierliche Daten und Chi-Quadrat für diskrete Daten • Angaben zu Schiefe und Kurtosis (→deskriptive Statistik) Prof. Dr. Georg Wydra Sportwissenschaftliches Institut der Universität des Saarlandes 38