Deskriptive Statistik

Werbung
Quantitative Methoden
Skalen der Messtheorie
Deskriptive Statistik
Andreas Opitz
(Vertretung von Prof. Thomas Pechmann)
Universität Leipzig
Institut für Linguistik
Ausfall der VL am 02. Juni 2015 (nächste Woche)
Arten von Variablen im Experiment
(Wiederholung)
Arten von Variablen im Experiment
• unabhängige Variablen
• abhängige Variablen
• Störvariablen
Arten von Variablen im Experiment
• Unabhängige Variable:
– Ihr Einfluss soll untersucht werden. Dazu wird sie im Experiment
planmäßig variiert.
• Abhängige Variable:
– Die Variable, deren Abhängigkeit (Beeinflussbarkeit) von der
unabhängigen Variablen Gegenstand der Untersuchung ist. (Die
Ausprägung dieser Variablen wird i.d.R. im Experiment gemessen.)
• Störvariable:
– Alle Variablen die sonst noch (d.h. außer der planmäßig variierten
unabhängigen Variablen) einen Einfluss auf die abhängige Variable
haben. Die Störvariablen müssen in einem Experiment so
kontrolliert werden, dass sie keinen Einfluss auf das Testergebnis
haben.
unabhängige Variablen
• werden vom Versuchsleiter (VL) verändert (manipuliert,
variiert)
unabhängige Variablen
•
•
•
•
Faktoren
Faktorenstufe
Bedingung
 Multiplikation der Stufen aller Faktoren
(alle Zellen müssen gefüllt sein)
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige
Variable im Experiment hat, zum Beispiel „Genus“ oder
„lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum
Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales
Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment
gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6
Bedingungen
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im
Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel:
„maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment gemeinsam
auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
Maskulinum
Reales Wort
Pseudo-Wort
Femininum
Neutrum
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im
Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel:
„maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment gemeinsam
auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
Reales Wort
Pseudo-Wort
Maskulinum
Femininum
Neutrum
der Baum
die Welt
das Haus
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im
Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel:
„maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment gemeinsam
auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
Maskulinum
Femininum
Neutrum
Reales Wort
der Baum
die Welt
das Haus
Pseudo-Wort
der Waum
die Selt
das Vaus
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im
Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel:
„maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment gemeinsam
auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
Maskulinum
Femininum
Neutrum
Reales Wort
der Baum
(mask real)
die Welt
(fem real)
das Haus
(neut real)
Pseudo-Wort
der Waum
(mask pseudo)
die Selt
(fem pseudo)
das Vaus
(neut pseudo)
unabhängige Variablen
• Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im
Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“
• Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel:
„maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“
• Bedingung: Kombination von Faktoren, die im Experiment gemeinsam
auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen
Maskulinum
Femininum
Neutrum
Reales Wort
B1
(mask real)
der Baum
B2
(fem real)
die Welt
B3
(neut real)
das Haus
Pseudo-Wort
B4
(mask pseudo)
der Waum
B5
(fem pseudo)
die Selt
B6
(neut pseudo)
das Vaus
abhängige Variablen
• das, was gemessen wird
Messen
• Realen Objekten oder Ereignissen werden nach definierten
Regeln Zahlenwerte zugeordnet.
• Das numerische Relativ ist eine homomorphe Abbildung
des empirischen Relativs.
• Das resultierende numerische Relativ wird als Skala
bezeichnet.
• Abbildungsrelationen
Homomorphismus
(Funktion)
Ereignis
Zahl
A
1
B
2
C
3
D
4
• Abbildungsrelationen
Homomorphismus
(Funktion)
Isomorphismus
(bijektive Funktion)
Ereignis
Zahl
Ereignis
Zahl
A
1
A
1
B
2
B
2
C
3
C
3
D
4
D
4
• Abbildungsrelationen
Homomorphismus
(Funktion)
Isomorphismus
(bijektive Funktion)
Ereignis
Zahl
Ereignis
Zahl
Ereignis
Zahl
A
1
A
1
A
1
B
2
B
2
B
2
C
3
C
3
C
3
D
4
D
4
D
4
Gütekriterien wissenschaftlicher
Messungen
• Objektivität: Sind die Ergebnisse unabhängig von
Einflüssen der Untersucher oder der
Untersuchungssituation bei Durchführung, Auswertung
und Interpretation zustande gekommen?
• Reliabilität: Wird die abhängige Variable zuverlässig
gemessen oder ist die Messung in zu großem Ausmaß mit
Messfehlern behaftet?
• Validität: Misst das Verfahren tatsächlich das gewünschte
Merkmal? (Oder ist es zum Beispiel zu stark von
Störvariablen beeinflusst?)
(was kann gemessen werden)
• Verhalten der VP (behaviorale Mehtoden)
–
–
–
–
–
Tastendruck (Reaktionszeiten, Anteil der Fehler)
Augenbewegungen
Artikulation (Benennen, Lesen…)
„Ankreuzen“
…
• Physiologische Reaktionen der VP
Veränderungen der:
– Hirnströme (EEG)
– Magnetfelder (MEG)
– Stoffwechselprozesse im Gehirn (fMRI)
– …
Reaktionszeiten
• VP reagieren (i.d.R. per Tastendruck) auf einen
präsentierten Stimulus
Beispiel: Lexikalische Entscheidung
• Ist die folgende Zeichenkette ein Wort des Deutschen?
• präsentiert werden dann z.B. Haus, Kleum… usw.
• VP reagiert durch drücken von zwei Tasten mit „ja“ oder „nein“
• Gemessen wird die Zeit (Latenz) und ggf. die Art der
Entscheidung (Korrektheit).
Skalen
der Messtheorie
Skalen
•
•
•
•
Nominalskala
Ordinalskala
Intervallskala
Rationalskala
Nominalskala
•
•
•
•
•
nicht-numerische, verbalisierte Daten
Entscheidung über Gleichheit vs. Verschiedenheit
Werte nicht zu einander geordnet
Statistik: Häufigkeit (N), Chi-Quadrat
Bsp.
–
–
–
–
Blutgruppen
Geschlecht
Korpusanalyse: Wortartenbestimmung
strukturelles Priming: Antwort ist vom Typ A oder Typ B
Ordinalskala
•
•
•
•
numerische Daten
größer/kleiner-Entscheidung
Statistik: Median, Mann-Whitney-U-Test
Bsp.
– Schulnoten
– Erreichter Bildungsabschluss
– Rating auf Skala, z.B. Akzeptabilität
Intervallskala
• ordinalskalierte Daten mit gleichen Abständen zwischen
Werten
• (x ist genauso weit von y entfernt wie y von z)
• Einheiten und Nullpunkt willkürlich festgelegt
• Statistik: arithmetisches Mittel; Korrelation, T-Test,
Varianzanalyse
• Bsp.
– Temperaturmessung in Celsius
– Jahreszahlen
Rationalskala
• (auch: Verhältnisskala, Ratio-Skala)
• Einheiten willkürlich festgelegt, theoretisch bestimmter
(„logischer“ bzw. absoluter) Nullpunkt
• Bsp.
–
–
–
–
–
absolute Temperaturskala
Lebensalter
Geldbeträge
Reaktionszeiten
Rating mittels magnitude estimation
Skalenniveaus
•
Nominalskala
qualitative Methoden
•
Ordinalskala
quantitative Methoden
•
Intervallskala
•
Rationalskala
28
Skalenniveaus
•
Nominalskala
qualitative Methoden
•
Ordinalskala
quantitative Methoden
•
Intervallskala
•
Rationalskala
nicht-parametrische Tests
parametrische Tests
29
Skalenniveaus
Stichproben in der Psycholinguistik
Stichprobe - Grundgesamtheit
• Durch das Experiment will man Aussagen über die
Grundgesamtheit treffen. Es wird jedoch nur eine sehr
kleine Stichproben untersucht.
Von dieser muss auf die Grundgesamtheit geschlussfolgert
werden.
– Grundgesamtheit: Für alle X gilt… ∀(X)
– Stichprobe: Es gibt mindestens ein X, für das gilt… ∃(x)
• Im Experiment wird meist versucht, Unterschiede
zwischen Bedingungen zu finden.
– Nullhypothese: es gibt keinen Unterschied
– Alternativ-Hypothese: es gibt einen Unterschied
Stichprobe - Grundgesamtheit
• Um zu beweisen, dass eine Hypothese für alle X gilt, müssten alle X
untersucht werden.
• Eine Hypothese kann mit einer Stichprobe also nie verifiziert werden.
(Es kann ein Individuum außerhalb der Stichprobe geben, dass die Hypothese
widerlegt.)
• Eine Hypothese kann mit einer Stichprobe nur falsifiziert werden.
(Es genügt, ein X zu finden, für das die Hypothese nicht gilt, um sie zu
widerlegen.)
• Wenn man eigentlich an Unterschieden interessiert ist, muss man also
die Nullhypothese (H0 = es gibt keine Unterschiede) für die Stichprobe
falsifizieren.
(Die eigentlich interessierende Hypothese ist dann die Alternativhypothese.)
• Ist die Nullhypothese falsifiziert, hat man indirekte Evidenz, dass die
Alternativhypothese (H1) für die Grundgesamtheit gelten kann.
(Wenn es Unterschiede in der Stichprobe gibt, gilt dies logisch auch für die
Grundgesamtheit.)
Stichprobe - Grundgesamtheit
• Wichtig: Liefert ein Experiment ein Null-Ergebnis, das
heißt, kann die Null-Hypothese nicht abgewiesen werden
(kein Unterschied feststellbar), dann bedeutet das nicht,
dass der untersuchte Faktor keinen Einfluss in der
Grundgesamtheit hat.
• Mögliche Ursachen für Null-Ergebnis:
– der untersuchte Faktor hat tatsächlich keinen Einfluss
– es gibt Elemente außerhalb der Stichprobe, auf die der Faktor
einen Einfluss hat
– ungenaue Messung, Messfehler
– falsches experimentelles Design
– …
Deskriptive Statistik
Deskriptive Statistik
• deskriptive Statistik erfolgt immer vor Inferenzstatistik!
• Beschreibung der Daten anhand von Kennwerten
– Anzahl der gültigen Werte
– Kennwerte der zentralen Tendenz
– Kennwerte der Streuung
• tabellarische Darstellung
• Abbildung
36
Deskriptive Statistik
• deskriptive Statistik vor Inferenzstatistik!
– Prüfung
Hat die Messung funktioniert?
Genügen die Daten den Kriterien der inferenzstatistischen Verfahren?
– Ausschluss von Versuchspersonen oder Items
nach vordefinierten Kriterien:
fehlende Werte
Fehlerrate
Reaktionszeiten
– Extremwerte
37
Verteilungsformen
Deskriptive Statistik
• Histogramm
Deskriptive Statistik
39
Deskriptive Statistik
• Histogramm
Deskriptive Statistik
40
Verteilungsformen
(Bortz, 1999, S. 35)
Normalverteilung
Normalverteilung
Normalverteilung
• Die Normal- oder Gauß-Verteilung ist ein wichtiger Typ
stetiger Wahrscheinlichkeitsverteilungen.
• Die Abweichungen der (Mess-)Werte vieler
naturwissenschaftlicher Vorgänge vom Mittelwert lassen
sich durch die Normalverteilung (oft auch logarithmische
Normalverteilung) entweder exakt oder wenigstens in
sehr guter Näherung beschreiben.
• Dies gilt vor allem für Werte, die von mehreren Faktoren
unabhängig voneinander in verschiedene Richtungen
beeinflusst werden. (Zentraler Grenzwertsatz)
• mehr dazu später im Semester
Kennwerte der zentralen Tendenz
• Modalwert
• arithmetisches Mittel
• Median
45
Kennwerte der zentralen Tendenz
• Modalwert (Modus, engl. mode)
•
– der am häufigsten in einer Verteilung vorkommende Wert
Beispiel:
25 zufällige Werte (Bereich 1-9):
4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6
Sortiert noch Größe:
1122233344444556667777899
„4“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus:
Wert
1
2
3
4
5
6
7
8
9
Anzahl
2
3
3
5
2
3
4
1
2
46
Kennwerte der zentralen Tendenz
„4“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus:
Wert
1
2
3
4
5
6
7
8
9
Anzahl
2
3
3
5
2
3
4
1
2
47
Kennwerte der zentralen Tendenz
• Auch für nominale Skalen geeignet (kategoriale Werte)
•
Beispiel:
Werte (Kategorien):
beeabcccaaceface
Sortiert noch Kategorie:
aaaabbccccceeeef
„c“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus:
Wert
a
b
c
e
f
Anzahl
4
2
5
4
1
48
Kennwerte der zentralen Tendenz
„c“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus:
Wert
a
b
c
e
f
Anzahl
4
2
5
4
1
49
Beispiel: „Rosen-Experiment“
Dieses hypothetische Beispiel wird uns als Illustration für einige
statistische Konzepte noch häufiger im Semester beschäftigen.
50
Beispiel: „Rosen-Experiment“
Hypothetisches Szenario:
Karl ist Rosenzüchter. Er möchte herausfinden, wie lange es
dauert, bis eine frische Rose seiner neuen Züchtung in einer Vase
mit Wasser verwelkt.
(Eigenschaft der Population)
Vorgehen:
Am Tag des Aufblühens wird eine Rose abgeschnitten und in eine
genormte Vase mit Wasser gestellt.
Notiert wird am wievielten Tag das erste Blütenblatt welkt ist.
Karl führt diesen Versuch mit insgesamt 100 Rosen durch.
51
Ergebnis:
1
2
3
4
5
6
…
10
0
Verblüh-Tag 5
2
4
6
5
4
…
3
Versuch Nr.
Ergebnis:
Verblüh-Tag
1
2
3
4
5
6
7
8
Anzahl
0
2
15
39
30
12
2
0
Ergebnis:
Modus = 4
Kennwerte der zentralen Tendenz
• arithmetisches Mittel („Mittelwert“, engl. mean)
– arithmetischer Durchschnittswert einer Verteilung
– „Summe der Werte durch Anzahl der Werte“
55
Arithmetisches Mittel
• arithmetisches Mittel („Mittelwert“, engl. mean)
Beispiel:
24 zufällige Werte (Bereich 1-9):
4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6
Mittelwert =
𝑛
𝑖=1 𝑥𝑖
𝑛
=
4+6+2+4+7+4+1+4+7+3+2+7+4+7+9+3+1+8+6+5+9+5+2+3+6
24
= 4.76
56
Arithmetisches Mittel
• arithmetisches Mittel
– mindestens intervallskalierte Daten
– bei symmetrischer Verteilung
– nicht bei kleinen Stichproben
– relativ anfällig gegen Ausreißer
57
Arithmetisches Mittel
Beispiel aus dem Rosen-Experiment:
mean =
5+2+4+6+5+ … 4+3
100
= 4.41
58
Arithmetisches Mittel
• Gründe gegen das arithmetische Mittel
–
–
–
–
Mehrgipflige Verteilungen
Keine intervallskalierten Daten
Extrem kleine Stichprobe
Asymmetrische Verteilung
59
Arithmetisches Mittel
Anfälligkeit gegen Ausreißer
„Königreich-Beispiel“:
Angenommen Sie möchten eine Aussage über das Vermögen aller
Menschen in einem fiktiven mittelalterlichen Königreich machen. Aus
diesem Grund bestimmen Sie bei einer Volkszählung das Vermögen
eines jeden Einwohners inklusive des Königs und seiner Familie.
 Das Vermögen ist sehr ungleich verteilt.
60
Arithmetisches Mittel
„Königreich-Beispiel“:
Einwohner:
100 Personen
(90 Bürger, 9 Adlige, 1 König)
Gesamtvermögen im Land:
2791 Goldtaler
Durchschnittliches Vermögen (Mittelwert):
27.91 Goldtaler
61
Arithmetisches Mittel
„Königreich-Beispiel“ (Anfallen der Messpunkte):
Deskriptive Statistik
62
Arithmetisches Mittel
„Königreich-Beispiel“ (sortiert Werte):
Deskriptive Statistik
63
Arithmetisches Mittel
„Königreich-Beispiel“:
– Gesamtvermögen im Land:
2791 Goldtaler
Vermögen des Königs:
1000 Goldtaler
gesamtes Vermögen der 9 Adligen:
898 Goldtaler
gesamtes Vermögen der übrigen 90 Bürger:
893 Goldtaler
64
Arithmetisches Mittel
„Königreich-Beispiel“:
Deskriptive Statistik
65
Arithmetisches Mittel
„Königreich-Beispiel“:
Mittel im Land:
27.91 Taler
Mittel ohne König:
18.09 Taler
Mittel ohne Adlige und ohne König:
9.92 Taler
Welches ist der aussagekräftigste Wert für das Land ?
66
Arithmetisches Mittel
„Königreich-Beispiel“:
das obere 1% der Bevölkerung
(König) besitzt
35.8% des Vermögens
(1000 von 2791 Talern)
die oberen 10% der Bevölkerung
(König + Adel) besitzen
68.0% des Vermögens
(1000 + 898 von 2791 Talern)
67
Arithmetisches Mittel
„Königreich-Beispiel“:
Wie sehen eigentlich reale
Vermögensverhältnisse aus?
68
Quelle: Stefan Bach, Martin Beznoska, Viktor Steiner (2011):
"A Wealth Tax on the Rich to Bring down Public Debt?", DIW 2011, S. 11.
Quelle: http://phasenraum.blogspot.de/2012/07/ware-deutschlands-flache-nach-vermogen.html
(abgerufen am 05.05.2014)
Kennwerte der zentralen Tendenz
• Median
–
–
–
–
–
der Wert, über und unter dem gleich viele Werte liegen
mindestens ordinalskalierte Daten
auch bei asymmetrischer Verteilung
auch bei kleinen Stichproben
nicht sehr anfällig für Ausreißer
71
Median
• Median – Beispiel
24 zufällige Werte (Bereich 1-9):
4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6
Sortiert noch Größe:
1122233344444556667777899
„Mitte“ der Zahlenreihe suchen:
1122233344444556667777899
=4
Über und unter der „Mitte“ liegen hier je 12 Messwerte.
72
Median
Rosen – Beispiel:
Deskriptive Statistik
73
Median
Rosen – Beispiel:
Werte nach
Größe sortieren:
Deskriptive Statistik
74
Median
Rosen – Beispiel:
Mitte
bestimmen:
Deskriptive Statistik
75
Median
Rosen – Beispiel:
Median ablesen:
Median = 4
(mean = 4.41)
Deskriptive Statistik
76
Median
Königreich-Beispiel:
(nach Größe sortiert)
77
Median
Königreich-Beispiel:
(nach Größe sortiert)
Mitte bestimmen
78
Median
Königreich-Beispiel:
(nach Größe sortiert)
Y-Wert ablesen
79
Median
Königreich-Beispiel:
(nach Größe sortiert)
Y-Wert ablesen
80
Median
Königreich-Beispiel:
(nach Größe sortiert)
Y-Wert ablesen
81
Median
Königreich-Beispiel:
(nach Größe sortiert)
Y-Wert ablesen
Median = 10
(Mean = 27.91)
82
Kennwerte der zentralen Tendenz
• Median und Mittelwert
– Bei extremen Werten am oberen oder unteren Ende des Wertebereichs ist
der Median ein besseres Maß als der Mittelwert.
– Siehe Beispiel: Einkommensverhältnisse eines hypothetischen
Königreiches
83
• Median in den Medien
• http://www.welt.de/wirtschaft/article114649182/Italiener-undSpanier-sind-reicher-als-Deutsche.html
• http://www.zeit.de/2013/14/europa-vermoegensverteilung
• http://www.spiegel.de/politik/deutschland/faktencheck-zurbundesbank-studie-private-haushalte-und-ihre-finanzen-a890877.html
84
Kennwerte der Dispersion
• Varianzbreite (range)
• Varianz
• Standardabweichung (Streuung)
Herunterladen