Quantitative Methoden Skalen der Messtheorie Deskriptive Statistik Andreas Opitz (Vertretung von Prof. Thomas Pechmann) Universität Leipzig Institut für Linguistik Ausfall der VL am 02. Juni 2015 (nächste Woche) Arten von Variablen im Experiment (Wiederholung) Arten von Variablen im Experiment • unabhängige Variablen • abhängige Variablen • Störvariablen Arten von Variablen im Experiment • Unabhängige Variable: – Ihr Einfluss soll untersucht werden. Dazu wird sie im Experiment planmäßig variiert. • Abhängige Variable: – Die Variable, deren Abhängigkeit (Beeinflussbarkeit) von der unabhängigen Variablen Gegenstand der Untersuchung ist. (Die Ausprägung dieser Variablen wird i.d.R. im Experiment gemessen.) • Störvariable: – Alle Variablen die sonst noch (d.h. außer der planmäßig variierten unabhängigen Variablen) einen Einfluss auf die abhängige Variable haben. Die Störvariablen müssen in einem Experiment so kontrolliert werden, dass sie keinen Einfluss auf das Testergebnis haben. unabhängige Variablen • werden vom Versuchsleiter (VL) verändert (manipuliert, variiert) unabhängige Variablen • • • • Faktoren Faktorenstufe Bedingung Multiplikation der Stufen aller Faktoren (alle Zellen müssen gefüllt sein) unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Reales Wort Pseudo-Wort Femininum Neutrum unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Reales Wort Pseudo-Wort Maskulinum Femininum Neutrum der Baum die Welt das Haus unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort der Baum die Welt das Haus Pseudo-Wort der Waum die Selt das Vaus unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort der Baum (mask real) die Welt (fem real) das Haus (neut real) Pseudo-Wort der Waum (mask pseudo) die Selt (fem pseudo) das Vaus (neut pseudo) unabhängige Variablen • Faktor: ist eine Variable, die einen Einfluss auf die abhängige Variable im Experiment hat, zum Beispiel „Genus“ oder „lexikalischer Status“ • Faktorenstufe: ist eine Ausprägung eines Faktors, zum Beispiel: „maskulin“, „feminin“, „neutrum“ – oder „reales Wort“ / „Pseudo-Wort“ • Bedingung: Kombination von Faktoren, die im Experiment gemeinsam auftreten, z.B.: Genus x lex. Status = 2 x 3 = 6 Bedingungen Maskulinum Femininum Neutrum Reales Wort B1 (mask real) der Baum B2 (fem real) die Welt B3 (neut real) das Haus Pseudo-Wort B4 (mask pseudo) der Waum B5 (fem pseudo) die Selt B6 (neut pseudo) das Vaus abhängige Variablen • das, was gemessen wird Messen • Realen Objekten oder Ereignissen werden nach definierten Regeln Zahlenwerte zugeordnet. • Das numerische Relativ ist eine homomorphe Abbildung des empirischen Relativs. • Das resultierende numerische Relativ wird als Skala bezeichnet. • Abbildungsrelationen Homomorphismus (Funktion) Ereignis Zahl A 1 B 2 C 3 D 4 • Abbildungsrelationen Homomorphismus (Funktion) Isomorphismus (bijektive Funktion) Ereignis Zahl Ereignis Zahl A 1 A 1 B 2 B 2 C 3 C 3 D 4 D 4 • Abbildungsrelationen Homomorphismus (Funktion) Isomorphismus (bijektive Funktion) Ereignis Zahl Ereignis Zahl Ereignis Zahl A 1 A 1 A 1 B 2 B 2 B 2 C 3 C 3 C 3 D 4 D 4 D 4 Gütekriterien wissenschaftlicher Messungen • Objektivität: Sind die Ergebnisse unabhängig von Einflüssen der Untersucher oder der Untersuchungssituation bei Durchführung, Auswertung und Interpretation zustande gekommen? • Reliabilität: Wird die abhängige Variable zuverlässig gemessen oder ist die Messung in zu großem Ausmaß mit Messfehlern behaftet? • Validität: Misst das Verfahren tatsächlich das gewünschte Merkmal? (Oder ist es zum Beispiel zu stark von Störvariablen beeinflusst?) (was kann gemessen werden) • Verhalten der VP (behaviorale Mehtoden) – – – – – Tastendruck (Reaktionszeiten, Anteil der Fehler) Augenbewegungen Artikulation (Benennen, Lesen…) „Ankreuzen“ … • Physiologische Reaktionen der VP Veränderungen der: – Hirnströme (EEG) – Magnetfelder (MEG) – Stoffwechselprozesse im Gehirn (fMRI) – … Reaktionszeiten • VP reagieren (i.d.R. per Tastendruck) auf einen präsentierten Stimulus Beispiel: Lexikalische Entscheidung • Ist die folgende Zeichenkette ein Wort des Deutschen? • präsentiert werden dann z.B. Haus, Kleum… usw. • VP reagiert durch drücken von zwei Tasten mit „ja“ oder „nein“ • Gemessen wird die Zeit (Latenz) und ggf. die Art der Entscheidung (Korrektheit). Skalen der Messtheorie Skalen • • • • Nominalskala Ordinalskala Intervallskala Rationalskala Nominalskala • • • • • nicht-numerische, verbalisierte Daten Entscheidung über Gleichheit vs. Verschiedenheit Werte nicht zu einander geordnet Statistik: Häufigkeit (N), Chi-Quadrat Bsp. – – – – Blutgruppen Geschlecht Korpusanalyse: Wortartenbestimmung strukturelles Priming: Antwort ist vom Typ A oder Typ B Ordinalskala • • • • numerische Daten größer/kleiner-Entscheidung Statistik: Median, Mann-Whitney-U-Test Bsp. – Schulnoten – Erreichter Bildungsabschluss – Rating auf Skala, z.B. Akzeptabilität Intervallskala • ordinalskalierte Daten mit gleichen Abständen zwischen Werten • (x ist genauso weit von y entfernt wie y von z) • Einheiten und Nullpunkt willkürlich festgelegt • Statistik: arithmetisches Mittel; Korrelation, T-Test, Varianzanalyse • Bsp. – Temperaturmessung in Celsius – Jahreszahlen Rationalskala • (auch: Verhältnisskala, Ratio-Skala) • Einheiten willkürlich festgelegt, theoretisch bestimmter („logischer“ bzw. absoluter) Nullpunkt • Bsp. – – – – – absolute Temperaturskala Lebensalter Geldbeträge Reaktionszeiten Rating mittels magnitude estimation Skalenniveaus • Nominalskala qualitative Methoden • Ordinalskala quantitative Methoden • Intervallskala • Rationalskala 28 Skalenniveaus • Nominalskala qualitative Methoden • Ordinalskala quantitative Methoden • Intervallskala • Rationalskala nicht-parametrische Tests parametrische Tests 29 Skalenniveaus Stichproben in der Psycholinguistik Stichprobe - Grundgesamtheit • Durch das Experiment will man Aussagen über die Grundgesamtheit treffen. Es wird jedoch nur eine sehr kleine Stichproben untersucht. Von dieser muss auf die Grundgesamtheit geschlussfolgert werden. – Grundgesamtheit: Für alle X gilt… ∀(X) – Stichprobe: Es gibt mindestens ein X, für das gilt… ∃(x) • Im Experiment wird meist versucht, Unterschiede zwischen Bedingungen zu finden. – Nullhypothese: es gibt keinen Unterschied – Alternativ-Hypothese: es gibt einen Unterschied Stichprobe - Grundgesamtheit • Um zu beweisen, dass eine Hypothese für alle X gilt, müssten alle X untersucht werden. • Eine Hypothese kann mit einer Stichprobe also nie verifiziert werden. (Es kann ein Individuum außerhalb der Stichprobe geben, dass die Hypothese widerlegt.) • Eine Hypothese kann mit einer Stichprobe nur falsifiziert werden. (Es genügt, ein X zu finden, für das die Hypothese nicht gilt, um sie zu widerlegen.) • Wenn man eigentlich an Unterschieden interessiert ist, muss man also die Nullhypothese (H0 = es gibt keine Unterschiede) für die Stichprobe falsifizieren. (Die eigentlich interessierende Hypothese ist dann die Alternativhypothese.) • Ist die Nullhypothese falsifiziert, hat man indirekte Evidenz, dass die Alternativhypothese (H1) für die Grundgesamtheit gelten kann. (Wenn es Unterschiede in der Stichprobe gibt, gilt dies logisch auch für die Grundgesamtheit.) Stichprobe - Grundgesamtheit • Wichtig: Liefert ein Experiment ein Null-Ergebnis, das heißt, kann die Null-Hypothese nicht abgewiesen werden (kein Unterschied feststellbar), dann bedeutet das nicht, dass der untersuchte Faktor keinen Einfluss in der Grundgesamtheit hat. • Mögliche Ursachen für Null-Ergebnis: – der untersuchte Faktor hat tatsächlich keinen Einfluss – es gibt Elemente außerhalb der Stichprobe, auf die der Faktor einen Einfluss hat – ungenaue Messung, Messfehler – falsches experimentelles Design – … Deskriptive Statistik Deskriptive Statistik • deskriptive Statistik erfolgt immer vor Inferenzstatistik! • Beschreibung der Daten anhand von Kennwerten – Anzahl der gültigen Werte – Kennwerte der zentralen Tendenz – Kennwerte der Streuung • tabellarische Darstellung • Abbildung 36 Deskriptive Statistik • deskriptive Statistik vor Inferenzstatistik! – Prüfung Hat die Messung funktioniert? Genügen die Daten den Kriterien der inferenzstatistischen Verfahren? – Ausschluss von Versuchspersonen oder Items nach vordefinierten Kriterien: fehlende Werte Fehlerrate Reaktionszeiten – Extremwerte 37 Verteilungsformen Deskriptive Statistik • Histogramm Deskriptive Statistik 39 Deskriptive Statistik • Histogramm Deskriptive Statistik 40 Verteilungsformen (Bortz, 1999, S. 35) Normalverteilung Normalverteilung Normalverteilung • Die Normal- oder Gauß-Verteilung ist ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. • Die Abweichungen der (Mess-)Werte vieler naturwissenschaftlicher Vorgänge vom Mittelwert lassen sich durch die Normalverteilung (oft auch logarithmische Normalverteilung) entweder exakt oder wenigstens in sehr guter Näherung beschreiben. • Dies gilt vor allem für Werte, die von mehreren Faktoren unabhängig voneinander in verschiedene Richtungen beeinflusst werden. (Zentraler Grenzwertsatz) • mehr dazu später im Semester Kennwerte der zentralen Tendenz • Modalwert • arithmetisches Mittel • Median 45 Kennwerte der zentralen Tendenz • Modalwert (Modus, engl. mode) • – der am häufigsten in einer Verteilung vorkommende Wert Beispiel: 25 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 Sortiert noch Größe: 1122233344444556667777899 „4“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert 1 2 3 4 5 6 7 8 9 Anzahl 2 3 3 5 2 3 4 1 2 46 Kennwerte der zentralen Tendenz „4“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert 1 2 3 4 5 6 7 8 9 Anzahl 2 3 3 5 2 3 4 1 2 47 Kennwerte der zentralen Tendenz • Auch für nominale Skalen geeignet (kategoriale Werte) • Beispiel: Werte (Kategorien): beeabcccaaceface Sortiert noch Kategorie: aaaabbccccceeeef „c“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert a b c e f Anzahl 4 2 5 4 1 48 Kennwerte der zentralen Tendenz „c“ kommt fünf Mal vor, ist damit der häufigste Wert, der Modus: Wert a b c e f Anzahl 4 2 5 4 1 49 Beispiel: „Rosen-Experiment“ Dieses hypothetische Beispiel wird uns als Illustration für einige statistische Konzepte noch häufiger im Semester beschäftigen. 50 Beispiel: „Rosen-Experiment“ Hypothetisches Szenario: Karl ist Rosenzüchter. Er möchte herausfinden, wie lange es dauert, bis eine frische Rose seiner neuen Züchtung in einer Vase mit Wasser verwelkt. (Eigenschaft der Population) Vorgehen: Am Tag des Aufblühens wird eine Rose abgeschnitten und in eine genormte Vase mit Wasser gestellt. Notiert wird am wievielten Tag das erste Blütenblatt welkt ist. Karl führt diesen Versuch mit insgesamt 100 Rosen durch. 51 Ergebnis: 1 2 3 4 5 6 … 10 0 Verblüh-Tag 5 2 4 6 5 4 … 3 Versuch Nr. Ergebnis: Verblüh-Tag 1 2 3 4 5 6 7 8 Anzahl 0 2 15 39 30 12 2 0 Ergebnis: Modus = 4 Kennwerte der zentralen Tendenz • arithmetisches Mittel („Mittelwert“, engl. mean) – arithmetischer Durchschnittswert einer Verteilung – „Summe der Werte durch Anzahl der Werte“ 55 Arithmetisches Mittel • arithmetisches Mittel („Mittelwert“, engl. mean) Beispiel: 24 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 Mittelwert = 𝑛 𝑖=1 𝑥𝑖 𝑛 = 4+6+2+4+7+4+1+4+7+3+2+7+4+7+9+3+1+8+6+5+9+5+2+3+6 24 = 4.76 56 Arithmetisches Mittel • arithmetisches Mittel – mindestens intervallskalierte Daten – bei symmetrischer Verteilung – nicht bei kleinen Stichproben – relativ anfällig gegen Ausreißer 57 Arithmetisches Mittel Beispiel aus dem Rosen-Experiment: mean = 5+2+4+6+5+ … 4+3 100 = 4.41 58 Arithmetisches Mittel • Gründe gegen das arithmetische Mittel – – – – Mehrgipflige Verteilungen Keine intervallskalierten Daten Extrem kleine Stichprobe Asymmetrische Verteilung 59 Arithmetisches Mittel Anfälligkeit gegen Ausreißer „Königreich-Beispiel“: Angenommen Sie möchten eine Aussage über das Vermögen aller Menschen in einem fiktiven mittelalterlichen Königreich machen. Aus diesem Grund bestimmen Sie bei einer Volkszählung das Vermögen eines jeden Einwohners inklusive des Königs und seiner Familie. Das Vermögen ist sehr ungleich verteilt. 60 Arithmetisches Mittel „Königreich-Beispiel“: Einwohner: 100 Personen (90 Bürger, 9 Adlige, 1 König) Gesamtvermögen im Land: 2791 Goldtaler Durchschnittliches Vermögen (Mittelwert): 27.91 Goldtaler 61 Arithmetisches Mittel „Königreich-Beispiel“ (Anfallen der Messpunkte): Deskriptive Statistik 62 Arithmetisches Mittel „Königreich-Beispiel“ (sortiert Werte): Deskriptive Statistik 63 Arithmetisches Mittel „Königreich-Beispiel“: – Gesamtvermögen im Land: 2791 Goldtaler Vermögen des Königs: 1000 Goldtaler gesamtes Vermögen der 9 Adligen: 898 Goldtaler gesamtes Vermögen der übrigen 90 Bürger: 893 Goldtaler 64 Arithmetisches Mittel „Königreich-Beispiel“: Deskriptive Statistik 65 Arithmetisches Mittel „Königreich-Beispiel“: Mittel im Land: 27.91 Taler Mittel ohne König: 18.09 Taler Mittel ohne Adlige und ohne König: 9.92 Taler Welches ist der aussagekräftigste Wert für das Land ? 66 Arithmetisches Mittel „Königreich-Beispiel“: das obere 1% der Bevölkerung (König) besitzt 35.8% des Vermögens (1000 von 2791 Talern) die oberen 10% der Bevölkerung (König + Adel) besitzen 68.0% des Vermögens (1000 + 898 von 2791 Talern) 67 Arithmetisches Mittel „Königreich-Beispiel“: Wie sehen eigentlich reale Vermögensverhältnisse aus? 68 Quelle: Stefan Bach, Martin Beznoska, Viktor Steiner (2011): "A Wealth Tax on the Rich to Bring down Public Debt?", DIW 2011, S. 11. Quelle: http://phasenraum.blogspot.de/2012/07/ware-deutschlands-flache-nach-vermogen.html (abgerufen am 05.05.2014) Kennwerte der zentralen Tendenz • Median – – – – – der Wert, über und unter dem gleich viele Werte liegen mindestens ordinalskalierte Daten auch bei asymmetrischer Verteilung auch bei kleinen Stichproben nicht sehr anfällig für Ausreißer 71 Median • Median – Beispiel 24 zufällige Werte (Bereich 1-9): 4, 6, 2, 4, 7, 4, 1, 4, 7, 3, 2, 7, 4, 7, 9, 3, 1, 8, 6, 5, 9, 5, 2, 3, 6 Sortiert noch Größe: 1122233344444556667777899 „Mitte“ der Zahlenreihe suchen: 1122233344444556667777899 =4 Über und unter der „Mitte“ liegen hier je 12 Messwerte. 72 Median Rosen – Beispiel: Deskriptive Statistik 73 Median Rosen – Beispiel: Werte nach Größe sortieren: Deskriptive Statistik 74 Median Rosen – Beispiel: Mitte bestimmen: Deskriptive Statistik 75 Median Rosen – Beispiel: Median ablesen: Median = 4 (mean = 4.41) Deskriptive Statistik 76 Median Königreich-Beispiel: (nach Größe sortiert) 77 Median Königreich-Beispiel: (nach Größe sortiert) Mitte bestimmen 78 Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 79 Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 80 Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen 81 Median Königreich-Beispiel: (nach Größe sortiert) Y-Wert ablesen Median = 10 (Mean = 27.91) 82 Kennwerte der zentralen Tendenz • Median und Mittelwert – Bei extremen Werten am oberen oder unteren Ende des Wertebereichs ist der Median ein besseres Maß als der Mittelwert. – Siehe Beispiel: Einkommensverhältnisse eines hypothetischen Königreiches 83 • Median in den Medien • http://www.welt.de/wirtschaft/article114649182/Italiener-undSpanier-sind-reicher-als-Deutsche.html • http://www.zeit.de/2013/14/europa-vermoegensverteilung • http://www.spiegel.de/politik/deutschland/faktencheck-zurbundesbank-studie-private-haushalte-und-ihre-finanzen-a890877.html 84 Kennwerte der Dispersion • Varianzbreite (range) • Varianz • Standardabweichung (Streuung)