Normalverteilung - Johannes Gutenberg

Werbung
Methoden der
Psychologie
Prof. Dr. G. Meinhardt
2. Stock, Nordflügel
R. 02-429 (Persike)
R. 02-431 (Meinhardt)
Forschungsstatistik I
Sprechstunde jederzeit
nach Vereinbarung
Dr. Malte Persike
} [email protected]
WS 2008/2009
Fachbereich Sozialwissenschaften
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Methoden der
Psychologie
Stetige Verteilungen
Normalverteilung
Ausblick: Inferenzstatistik
Das Prinzip des statistischen Testens – Binomialtest
Der Hersteller eines elektronischen Wahlsystems verspricht,
dass durch den Einsatz einer neuartigen Technik beim
Urnengang Abstimmungsergebnisse zuverlässiger
vorhergesagt werden können. Der Ypsilant-O-Mat™ führt
dazu eine Videoanalyse der abgegebenen Stimmzettel durch
und leitet bei sogenannten Devianzvoten automatisch ein
Parteiausschlussverfahren ein.
Laut Hersteller wird hierdurch die Wahrscheinlichkeit für eine
abweichende Gewissensentscheidung unentschlossener
Wahlteilnehmer auf 8% gesenkt.
Bei einer Abstimmung soll das System getestet werden. 24
indifferente Abgeordnete schreiten zur Wahl und geben ihre
Stimme ab. 5 Voten fallen wider das gewünschte Ergebnis
aus.
Methoden der
Psychologie
Stetige Verteilungen
Normalverteilung
Ausblick: Inferenzstatistik
Das Prinzip des statistischen Testens
– Wenn die Wahrscheinlichkeitsfunktion eines
Zufallsexperimentes theoretisch bekannt ist, können die
bei einer Durchführung erwarteten empirischen
Häufigkeiten bestimmt werden.
– Beobachtete absolute oder relative Häufigkeiten können
dann mit den erwarteten Häufigkeiten verglichen werden.
– Wenn eine beobachtete Häufigkeit „zu unwahrscheinlich“
ist, um unter der gegebenen Wahrscheinlichkeitsfunktion
zu entstehen, kann die Wahrscheinlichkeitsfunktion als
nicht zutreffend betrachtet werden.
– Entweder sind dann ihre Parameter falsch definiert oder
die Funktion selbst ist nicht zutreffend.
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Stetige Zufallsvariablen
Definition
Merkmale
– Falls eine Zufallsvariable jeden Wert in einem Intervall
annehmen kann, wird sie stetige Zufallsvariable
genannt
– Die Wahrscheinlichkeitsfunktion f(y) einer stetigen
Zufallsvariable wird zumeist als mathematische Funktion
definiert. Sie wird bei stetigen ZV auch als
Dichtefunktion bezeichnet.
– Die Verteilungsfunktion einer stetigen Zufallsvariablen
ist dann
F ( y) = ∫
+∞
−∞
f ( y )dy
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Stetige Zufallsvariablen
Definition
Merkmale
– Eine Funktion f(y) ist gemäß der Kolmogoroff Axiome
genau dann eine Dichtefunktion, wenn gilt
f ( y) ≥ 0
und
F ( y) = ∫
+∞
−∞
f ( y )dy = 1
– Dabei reicht der Wertebereich von f(y) nicht für jede
Zufallsvariable von -∞ bis +∞ (z.B. Reaktionszeit).
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Stetige Zufallsvariablen
Merkmale
Merkmale
– Für eine stetige Zufallsvariable ist die
Punktwahrscheinlichkeit P(Y = y) immer 0.
– Die Wahrscheinlichkeitsdichte f(y) liefert also nicht
unmittelbar die Wahrscheinlichkeiten für Ereignisse, die
Wahrscheinlichkeiten ergeben sich aus der Fläche unter
der Dichtefunktion
– Es sind nur Wahrscheinlichkeiten für Intervalle von
Realisationen zu berechnen, also P(a ≤ y ≤ b). Diese wird
dann berechnet als
b
P(a ≤ y ≤ b) = ∫ f ( y )dy
a
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilung
Definition
Standard-NV
Binomialapproximation
– Im psychologischen Kontext ist die Normalverteilung die
wohl prominenteste Wahrscheinlichkeitsverteilung.
– Sie ist theoretischer Natur, da sie (anders als z.B. die
Binomialverteilung) nicht direkt aus dem
Bedingungskomplex Ξ abgeleitet werden kann.
– Die Normalverteilung ist durch zwei Parameter, μ und
σ definiert.
1
f ( y, μ , σ ) =
e
2πσ
1 ⎛ y−μ ⎞
− ⎜
⎟
2⎝ σ ⎠
2
– Ist eine Zufallsvariable Y normalverteilt, wird dies häufig
geschrieben als Y ∼ N(μ, σ)
Methoden der
Psychologie
Stetige Verteilungen
Normalverteilung
Normalverteilung
Beispiele
– Der Parameter μ ist direkt der Erwartungswert der Normalverteilung
– σ ist direkt die Varianz der Normalverteilung
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilung
Warum die Normalverteilung?
Standard-NV
Binomialapproximation
1. Sie ergibt sich, wenn viele Zufallsprozesse bei der
Realisierung einer Zufallsvariablen additiv
zusammenwirken.
2. Sie ist die Verteilung des Mittelwerts aller Realisierungen
bei sehr häufiger Wiederholung eine Zufallsexperiment
(„Zentraler Grenzwertsatz“).
3. Sie ist die Verteilung von Zufallsvariablen, wenn diese
eine messfehlerbehaftete Erfassung eines Merkmals
darstellen.
4. Sie ist mathematisch relativ leicht zu behandeln.
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilung
Eigenschaften
Standard-NV
Binomialapproximation
– Ist symmetrisch, unimodal und glockenförmig
– Verschiedene Normalverteilungen unterscheiden sich
bezüglich Erwartungswert (µ) und/oder
Standardabweichung (σ)
– Der Wertebereich reicht von –∞ bis +∞
– Die Kurve berührt oder schneidet nie die x-Achse
– Jedes Intervall mit einer Länge größer Null hat eine
Wahrscheinlichkeit größer Null
– Der Typ (i.e. die Form) der Verteilung ändert sich für
lineare Transformationen der Zufallsvariable nicht (siehe
Transformationsregelen für Erwartungswert und Varianz).
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Standardnormalverteilung
z-Transformation
Standard-NV
Binomialapproximation
– Wir haben bereits die z-Standardisierung von
Realisierungen einer Zufallsvariablen kennen gelernt.
– Standardisiert man eine normalverteilte Zufallsvariable
erhält man die Standardnormalverteilung.
– Für die Standardnormalverteilung gilt: μ = 0, σ = 1
– Die Formel der Normalverteilung reduziert sich damit auf
1 − 1 z2
f ( z) =
e 2
2π
– Der Werte der Dichte- und Verteilungsfunktion hängen
also nur von z ab
Methoden der
Psychologie
Definition
Stetige Verteilungen
Standardnormalverteilung
Quantile
Standard-NV
Binomialapproximation
Normalverteilung
Methoden der
Psychologie
Definition
Stetige Verteilungen
Standardnormalverteilung
Die 68-95-99 Regel
Standard-NV
Binomialapproximation
Normalverteilung
Methoden der
Psychologie
Definition
Stetige Verteilungen
Standardnormalverteilung
Verteilungsfunktion
Standard-NV
Binomialapproximation
Normalverteilung
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Standardnormalverteilung
Verteilungsfunktion
Standard-NV
Binomialapproximation
– Die Verteilungsfunktion der Normalverteilung wird häufig
auch als Φ (Phi) geschrieben.
– Häufig ist es wichtig, die Inverse der
Verteilungsfunktion der Normalverteilung zu
berechnen, z.B. für die Bestimmung von Quantilen.
– Die Inverse der Verteilungsfuntion wird dann geschrieben
als Φ-1
– Sowohl die Verteilungsfunktion als auch die Inverse der
Verteilungsfunktion sind mathematisch nicht als einfacher
Formelausdruck zu beschreiben (anders als die
Dichtefunktion).
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilungsapproximation
der Binomialverteilung
Standard-NV
Binomialapproximation
– Bei sehr kleinem p kann die Binomialverteilung durch die
Poissonverteilung approximiert werden (wie gesehen)
– Bei großem Produkt n·p wird die Binomialverteilung sehr
gut durch die Normalverteilung approximiert.
– Daumenregel: Eine gute Approximation ergibt sich bereits
für n·p·q > 9 (also σ² > 9).
[Eine alternative Faustregel besagt, dass für eine hinreichend
gute Approximation n·p ≥ 10 und n·q ≥ 10 sein sollen.]
– Als Parameter μ ist dann n·p einzusetzen, der Parameter
σ ist n·p·q.
– Eine binomialverteilte ZV Y kann approximiert werden als
Y ∼ N (np, npq )
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilungsapproximation
der Binomialverteilung
Standard-NV
Binomialapproximation
Sind die Faustregeln für eine gute Approximation erfüllt,
können sowohl die Punktwahrscheinlichkeit als auch die
Intervallwahrscheinlichkeit für die Binomialverteilung
aus der Normalverteilung approximiert werden.
– Punktwahrscheinlichkeit: Für ein beliebiges Ereignis
Y = yi einer binomialverteilten ZV ist die NV-approximierte
Punktwahrscheinlichkeit definiert als
P(yi-0.5 ≤ yi ≤ yi+0.5) = Φ(yi+0.5) - Φ(yi-0.5)
– Intervallwahrscheinlichkeit: Die Intervallwahrscheinlichkeit u ≤ yi ≤ o ist analog definiert als
P(u-0.5 ≤ yi ≤ o+0.5) = Φ(u+0.5) - Φ(o-0.5)
Methoden der
Psychologie
Definition
Stetige Verteilungen
Normalverteilung
Normalverteilungsapproximation
der Binomialverteilung - Stetigkeitskorrektur
Standard-NV
Binomialapproximation
– Die Subtraktion bzw. Addition von 0.5 wird auch als
Stetigkeitskorrektur bezeichnet.
– Die Stetigkeitskorrektur bringt besonders bei hohem n
(also dem Grund für die Verwendung der NVApproximation) nur wenig mehr Rechengenauigkeit bei
der Berechnung von Intervallwahrscheinlichkeiten.
– Sie ist aber prinzipiell notwendig, da eine beliebige
Kategorie yi (z.B. 4) in der Binomialverteilung theoretisch
von yi-0.5 bis yi+0.5 (z.B. 3.5 bis 4.5) reichen muss.
– Bei fehlender Stetigkeitskorrektur entstehen „Lücken“ in
der NV-Approximation. Die Wahrscheinlichkeiten P(Y ≤ yi)
und P(Y > yi) addieren sich dann nicht mehr zu 1, da der
Bereich von yi bis yi+1 fehlt.
Herunterladen