Univ.-Prof. Dr. Georg Wydra

Werbung
Univ.-Prof. Dr. Georg Wydra
Methoden zur Auswertung von Untersuchungen
1 2 3 4 SKALENTYPEN UND VARIABLEN ZUR BEDEUTUNG DER STATISTIK IN DER FORSCHUNG STATISTIK ALS VERFAHREN ZUR PRÜFUNG VON HYPOTHESEN DESKRIPTIVE STATISTIK Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
1
1
Skalentypen und Variablen
Die Güte der einer Statistik zugrunde liegenden Zahlen hat einen unmittelbaren Einfluss auf die zur Verfügung stehenden
statistischen Methoden.
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
2
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
3
Skalentypen
Nominalskalen: Verbale Bezeichnung von Merkmalsausprägungen einer Variablen (z. B. Haarfarbe).
Ordinalskalen: Bildung einer Rangfolge der Merkmalsausprägungen einer Variablen (z. B. Schulnoten).
Intervallskalen: Konstante Abstände der Merkmalsausprägungen aber variabler Nullpunkt (z. B. °C oder °F).
Ratioskalen Verhältnisskalen): Intervallskalen mit einem natürlichen Nullpunkt und variabler Skalierung (z. B.: Längenmaße; Skalierung Meter oder Meilen)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
4
Variablen
Eine Variable ist ein Symbol für eine Menge von Merkmalsausprägungen.
Beispiele: Geschlecht, Haarfarbe, schulische Leistungen, Zeit
beim 100-m-Lauf, absolute Temperatur
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
5
Unabhängige und abhängige Variablen
Unabhängige Variablen sind diejenigen, die manipuliert, d. h.
beeinflusst werden können. Abhängige Variablen werden dagegen nur gemessen.
Beispiel Kraftunterschiede zwischen Männer und Frauen
Abhängige Variable: Kraftwerte
Unabhängige Variablen: Geschlecht
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
6
Diskrete und kontinuierliche Variablen
Eine diskrete Variable besteht aus endlich vielen oder abzählbaren, separaten, unteilbaren Werten eines bestimmten Intervalls. Zwischen zwei benachbarten Werten existieren keine
weiteren Werte (z. B. Zahl der Studierenden, Antwortkategorien
bei einem Fragebogen).
Eine stetige bzw. kontinuierliche Variable besteht aus einer
unendlichen Anzahl möglicher Merkmalsausprägungen. Zwischen zwei benachbarten Werten existieren unendlich viele
weitere Werte (c-g-s-System: Längen-, Gewichts- und Zeitmaße sind bis ins Unendliche weiter zu unterteilen  m, cm, mm,
µm, nm etc.)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
7
2
Zur Bedeutung der Statistik in der Forschung
Ich glaube nur an Statistiken , die ich selbst gefälscht habe.
Nein nicht - Sir Winston Churchill (1874 - 1965)
Mit Statistiken kann man alles beweisen, nur nicht die Wahrheit.
ohne Quellennachweis
Ich stehe Statistiken etwas skeptisch gegenüber, denn laut Statistik haben
ein Millionär und ein Habenichts je eine halbe Million.
Franklin D. Roosevelt (1882 - 1945)
Alles was lediglich wahrscheinlich ist, ist wahrscheinlich falsch.
René Descartes (1596-1650)
Wenn man den Kopf in der Sauna hat und die Füße im Kühlschrank, sprechen Statistiker von einer angenehmen mittleren Temperatur.
Franz Josef Strauß (1915-1988)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
8
Pospeschill, 2006
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
9
Pospeschill, 2006
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
10
Formen der Statistik
Die deskriptive Statistik stellt Analysetechniken zur Verfügung, die der explorativen Beschreibung und Charakterisierung
empirischer Daten in Form ihrer Verteilung, Lage und Streuung
dienen.
Die Inferenzstatistik basiert auf Analysetechniken, die der Untersuchung von Stichproben dienen und Generalisationen auf
die Grundgesamtheit (Population) erlauben, aus denen sie gezogen wurden.
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
11
Pospeschill, 2006
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
12
Stichprobe und Stichprobenfehler
Eine Stichprobe ist eine bestimmte Anzahl von Fällen aus einer definierten Population, die zur Repräsentation der Population in einer empirischen Untersuchung eingesetzt wird.
Der Stichprobenfehler stellt die Diskrepanz zwischen der
Stichprobenstatistik und den tatsächlichen Werten in der Gesamtpopulation dar.
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
13
3
Statistik als Verfahren zur Prüfung von Hypothesen
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
14
Unterschiede zwischen
Zeitpunkten
nen Hypothesenformen
Querschnittsuntersuchungen
Längsschnittuntersuchungen
Ex-post-facto-Untersuchungen
Quasiexperimentelle Untersuchungen mit
Vortest
Hybride Experimente mit Vortest
Naturwissenschaftliche Experimente
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
Kausalhypothesen
Gruppenunterschiede
Design-Typen zu den verschiede-
Effektunterschiede
Zusammenhänge
X
X
X
Zuordnung der verschiedenen
X
X
15
4
Deskriptive Statistik
• Häufigkeiten
• Form der Verteilung der Daten
• Mittelwerte
• Streuungsmaße
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
16
Analyse und Darstellung von Häufigkeiten
• Absolute, prozentuale und kumulative Häufigkeiten
• Grafische Darstellung von Häufigkeiten
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
17
Häufigkeiten
• Absolute Häufigkeiten
• Relative Häufigkeiten
• Kumulative Häufigkeiten
• Relative kumulative Häufigkeiten
• jeweils von einer oder mehreren Gruppen
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
18
Häufigkeiten
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
19
Häufigkeiten
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
20
Mittelwerte - Maße der zentralen Tendenz
Die zentrale Tendenz ist ein statistisches Messverfahren zur
Bestimmung eines einzelnen Wertes zur Repräsentation einer
bestimmten Verteilung. Dabei soll der zu bestimmende Wert
typisch oder repräsentativ für das vollständige Datenset sein“
(Pospeschill, 2005, S. 59).
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
21
Mittelwerte
• Arithmetisches Mittel: Durchschnittswert einer Zahlreihe
• Gewogenes Arithmetisches Mittel: Mittelwert aus mehreren unterschiedlich großen Stichproben
• Median: Wert, der eine Verteilung halbiert
• Modalwert (Modus): Der häufigste Werte einer Verteilung
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
22
Mittelwerte
Bös, Hänsel & Schott, 2000
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
23
Streuungsmaße
Die Variabilität ist ein statistisches Messverfahren zur Quantifizierung des Streuungsmaßes von Messwerten.
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
24
Streuungsmaße
Range (Spannweite): Differenz aus dem größten und kleinsten
Wert
Standardabweichung: Die mittleren 68 % einer Verteilung
Varianz: Standardabweichung zum Quadrat
Variationskoeffizient: Die relative Standardabweichung, d. h.
die Standardabweichung dividiert durch den Mittelwert
Interquartilabstand: Die mittlere 50 % einer Verteilung
Standardfehler: Standardabweichung dividiert durch die Wurzel aus der Stichprobengröße n.
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
25
Streuungsmaße
Durchschnittliche absolute Abweichung: basiert auf der
Summe der absoluten Abweichungen jedes Variablenwertes
vom »arithmetischen Mittel« über alle »Untersuchungseinheiten«. Die Summe der absoluten Abweichungen wird durch die
Anzahl der Untersuchungseinheiten dividert,
Konfidenzintervall (Präzision der Schätzung): Der Wertebereich, in dem man den interessierenden Parameter der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit erwartet
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
26
Beispiel aus Statistica
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
27
Möglichkeiten der grafischen Darstellung
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
28
Modifikation einer WinStat-Abbildung
Mittelwert und Standardabweichung der Variable Alter
70
± SD
65
Alter (Monate)
60
55
50
45
40
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
29
Box & Whisker Plot
75
Alter (Monate)
70
65
60
55
50
45
Alter (Monate)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
30
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
31
Normalverteilung
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
32
Verteilungsformen
Pospeschill, 2006
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
33
Schiefe oder Symmetrie
Bös, Hänsel & Schott, 2000
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
34
Steilheit oder Exzeß
Bös, Hänsel & Schott, 2000
Die Wölbung bzw. Kurtosis der Dichtefunktion bzw. Wahrscheinlichkeitsfunktion einer Zufallsvariablen X ist definiert als ihr auf die vierte Potenz
der Standardabweichung σ normiertes viertes zentrales Moment μ4(X)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
35
Prüfung der Normalverteilung
1. Optische Prüfung
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
36
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
37
2. Statistische Prüfung
3. WinStat
• Kolmogorow für kontinuierliche Daten und Chi-Quadrat für
diskrete Daten
•
Angaben zu Schiefe und Kurtosis (→deskriptive Statistik)
Prof. Dr. Georg Wydra
Sportwissenschaftliches Institut der Universität des Saarlandes
38
Herunterladen