Methoden der Psychologie Prof. Dr. G. Meinhardt 2. Stock, Nordflügel R. 02-429 (Persike) R. 02-431 (Meinhardt) Forschungsstatistik I Sprechstunde jederzeit nach Vereinbarung Dr. Malte Persike } [email protected] WS 2008/2009 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Methoden der Psychologie Stetige Verteilungen Normalverteilung Ausblick: Inferenzstatistik Das Prinzip des statistischen Testens – Binomialtest Der Hersteller eines elektronischen Wahlsystems verspricht, dass durch den Einsatz einer neuartigen Technik beim Urnengang Abstimmungsergebnisse zuverlässiger vorhergesagt werden können. Der Ypsilant-O-Mat™ führt dazu eine Videoanalyse der abgegebenen Stimmzettel durch und leitet bei sogenannten Devianzvoten automatisch ein Parteiausschlussverfahren ein. Laut Hersteller wird hierdurch die Wahrscheinlichkeit für eine abweichende Gewissensentscheidung unentschlossener Wahlteilnehmer auf 8% gesenkt. Bei einer Abstimmung soll das System getestet werden. 24 indifferente Abgeordnete schreiten zur Wahl und geben ihre Stimme ab. 5 Voten fallen wider das gewünschte Ergebnis aus. Methoden der Psychologie Stetige Verteilungen Normalverteilung Ausblick: Inferenzstatistik Das Prinzip des statistischen Testens Wenn die Wahrscheinlichkeitsfunktion eines Zufallsexperimentes theoretisch bekannt ist, können die bei einer Durchführung erwarteten empirischen Häufigkeiten bestimmt werden. Beobachtete absolute oder relative Häufigkeiten können dann mit den erwarteten Häufigkeiten verglichen werden. Wenn eine beobachtete Häufigkeit „zu unwahrscheinlich“ ist, um unter der gegebenen Wahrscheinlichkeitsfunktion zu entstehen, kann die Wahrscheinlichkeitsfunktion als nicht zutreffend betrachtet werden. Entweder sind dann ihre Parameter falsch definiert oder die Funktion selbst ist nicht zutreffend. Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Stetige Zufallsvariablen Definition Merkmale Falls eine Zufallsvariable jeden Wert in einem Intervall annehmen kann, wird sie stetige Zufallsvariable genannt Die Wahrscheinlichkeitsfunktion f(y) einer stetigen Zufallsvariable wird zumeist als mathematische Funktion definiert. Sie wird bei stetigen ZV auch als Dichtefunktion bezeichnet. Die Verteilungsfunktion einer stetigen Zufallsvariablen ist dann F ( y) = ∫ +∞ −∞ f ( y )dy Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Stetige Zufallsvariablen Definition Merkmale Eine Funktion f(y) ist gemäß der Kolmogoroff Axiome genau dann eine Dichtefunktion, wenn gilt f ( y) ≥ 0 und F ( y) = ∫ +∞ −∞ f ( y )dy = 1 Dabei reicht der Wertebereich von f(y) nicht für jede Zufallsvariable von -∞ bis +∞ (z.B. Reaktionszeit). Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Stetige Zufallsvariablen Merkmale Merkmale Für eine stetige Zufallsvariable ist die Punktwahrscheinlichkeit P(Y = y) immer 0. Die Wahrscheinlichkeitsdichte f(y) liefert also nicht unmittelbar die Wahrscheinlichkeiten für Ereignisse, die Wahrscheinlichkeiten ergeben sich aus der Fläche unter der Dichtefunktion Es sind nur Wahrscheinlichkeiten für Intervalle von Realisationen zu berechnen, also P(a ≤ y ≤ b). Diese wird dann berechnet als b P(a ≤ y ≤ b) = ∫ f ( y )dy a Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilung Definition Standard-NV Binomialapproximation Im psychologischen Kontext ist die Normalverteilung die wohl prominenteste Wahrscheinlichkeitsverteilung. Sie ist theoretischer Natur, da sie (anders als z.B. die Binomialverteilung) nicht direkt aus dem Bedingungskomplex Ξ abgeleitet werden kann. Die Normalverteilung ist durch zwei Parameter, μ und σ definiert. 1 f ( y, μ , σ ) = e 2πσ 1 ⎛ y−μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 Ist eine Zufallsvariable Y normalverteilt, wird dies häufig geschrieben als Y ∼ N(μ, σ) Methoden der Psychologie Stetige Verteilungen Normalverteilung Normalverteilung Beispiele Der Parameter μ ist direkt der Erwartungswert der Normalverteilung σ ist direkt die Varianz der Normalverteilung Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilung Warum die Normalverteilung? Standard-NV Binomialapproximation 1. Sie ergibt sich, wenn viele Zufallsprozesse bei der Realisierung einer Zufallsvariablen additiv zusammenwirken. 2. Sie ist die Verteilung des Mittelwerts aller Realisierungen bei sehr häufiger Wiederholung eine Zufallsexperiment („Zentraler Grenzwertsatz“). 3. Sie ist die Verteilung von Zufallsvariablen, wenn diese eine messfehlerbehaftete Erfassung eines Merkmals darstellen. 4. Sie ist mathematisch relativ leicht zu behandeln. Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilung Eigenschaften Standard-NV Binomialapproximation Ist symmetrisch, unimodal und glockenförmig Verschiedene Normalverteilungen unterscheiden sich bezüglich Erwartungswert (µ) und/oder Standardabweichung (σ) Der Wertebereich reicht von –∞ bis +∞ Die Kurve berührt oder schneidet nie die x-Achse Jedes Intervall mit einer Länge größer Null hat eine Wahrscheinlichkeit größer Null Der Typ (i.e. die Form) der Verteilung ändert sich für lineare Transformationen der Zufallsvariable nicht (siehe Transformationsregelen für Erwartungswert und Varianz). Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Standardnormalverteilung z-Transformation Standard-NV Binomialapproximation Wir haben bereits die z-Standardisierung von Realisierungen einer Zufallsvariablen kennen gelernt. Standardisiert man eine normalverteilte Zufallsvariable erhält man die Standardnormalverteilung. Für die Standardnormalverteilung gilt: μ = 0, σ = 1 Die Formel der Normalverteilung reduziert sich damit auf 1 − 1 z2 f ( z) = e 2 2π Der Werte der Dichte- und Verteilungsfunktion hängen also nur von z ab Methoden der Psychologie Definition Stetige Verteilungen Standardnormalverteilung Quantile Standard-NV Binomialapproximation Normalverteilung Methoden der Psychologie Definition Stetige Verteilungen Standardnormalverteilung Die 68-95-99 Regel Standard-NV Binomialapproximation Normalverteilung Methoden der Psychologie Definition Stetige Verteilungen Standardnormalverteilung Verteilungsfunktion Standard-NV Binomialapproximation Normalverteilung Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Standardnormalverteilung Verteilungsfunktion Standard-NV Binomialapproximation Die Verteilungsfunktion der Normalverteilung wird häufig auch als Φ (Phi) geschrieben. Häufig ist es wichtig, die Inverse der Verteilungsfunktion der Normalverteilung zu berechnen, z.B. für die Bestimmung von Quantilen. Die Inverse der Verteilungsfuntion wird dann geschrieben als Φ-1 Sowohl die Verteilungsfunktion als auch die Inverse der Verteilungsfunktion sind mathematisch nicht als einfacher Formelausdruck zu beschreiben (anders als die Dichtefunktion). Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilungsapproximation der Binomialverteilung Standard-NV Binomialapproximation Bei sehr kleinem p kann die Binomialverteilung durch die Poissonverteilung approximiert werden (wie gesehen) Bei großem Produkt n·p wird die Binomialverteilung sehr gut durch die Normalverteilung approximiert. Daumenregel: Eine gute Approximation ergibt sich bereits für n·p·q > 9 (also σ² > 9). [Eine alternative Faustregel besagt, dass für eine hinreichend gute Approximation n·p ≥ 10 und n·q ≥ 10 sein sollen.] Als Parameter μ ist dann n·p einzusetzen, der Parameter σ ist n·p·q. Eine binomialverteilte ZV Y kann approximiert werden als Y ∼ N (np, npq ) Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilungsapproximation der Binomialverteilung Standard-NV Binomialapproximation Sind die Faustregeln für eine gute Approximation erfüllt, können sowohl die Punktwahrscheinlichkeit als auch die Intervallwahrscheinlichkeit für die Binomialverteilung aus der Normalverteilung approximiert werden. Punktwahrscheinlichkeit: Für ein beliebiges Ereignis Y = yi einer binomialverteilten ZV ist die NV-approximierte Punktwahrscheinlichkeit definiert als P(yi-0.5 ≤ yi ≤ yi+0.5) = Φ(yi+0.5) - Φ(yi-0.5) Intervallwahrscheinlichkeit: Die Intervallwahrscheinlichkeit u ≤ yi ≤ o ist analog definiert als P(u-0.5 ≤ yi ≤ o+0.5) = Φ(u+0.5) - Φ(o-0.5) Methoden der Psychologie Definition Stetige Verteilungen Normalverteilung Normalverteilungsapproximation der Binomialverteilung - Stetigkeitskorrektur Standard-NV Binomialapproximation Die Subtraktion bzw. Addition von 0.5 wird auch als Stetigkeitskorrektur bezeichnet. Die Stetigkeitskorrektur bringt besonders bei hohem n (also dem Grund für die Verwendung der NVApproximation) nur wenig mehr Rechengenauigkeit bei der Berechnung von Intervallwahrscheinlichkeiten. Sie ist aber prinzipiell notwendig, da eine beliebige Kategorie yi (z.B. 4) in der Binomialverteilung theoretisch von yi-0.5 bis yi+0.5 (z.B. 3.5 bis 4.5) reichen muss. Bei fehlender Stetigkeitskorrektur entstehen „Lücken“ in der NV-Approximation. Die Wahrscheinlichkeiten P(Y ≤ yi) und P(Y > yi) addieren sich dann nicht mehr zu 1, da der Bereich von yi bis yi+1 fehlt.