z-Werte - Methodenlehre - Johannes Gutenberg

Werbung
Statistik &
Methodenlehre
Sprechstunde
jederzeit nach
Vereinbarung und
nach der Vorlesung
Mathematische und
statistische Methoden II
Wallstr. 3, 6. Stock,
Raum 06-206
Dr. Malte Persike
[email protected]
lordsofthebortz.de
lordsofthebortz.de/g+
facebook.com/methodenlehre
twitter.com/methodenlehre
youtube.com/methodenlehre
SoSe 2012
Folie 1
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Statistik &
Methodenlehre
Stetige Verteilungen
Inferenzstatistik
Inhalte
dieser Sitzung
 Stetige Verteilungen
 Kennwerte und Darstellungen
 z-Standardisierung und ihre Folgen
 z-Test
Folie 2
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Definition
Kennwerte &
Darstellung
Normalverteilung
z-Werte
Folie 3
 Eine Zufallsvariable, die jeden Wert in einem Intervall
annehmen kann, ist eine stetige Zufallsvariable
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Definition
Kennwerte &
Darstellung
Normalverteilung
z-Werte
 Die Wahrscheinlichkeitsverteilung f(x) einer stetigen
Zufallsvariable X wird zumeist als mathematische
Funktion definiert. Sie wird bei stetigen Zufallsvariablen
auch als Dichtefunktion bezeichnet.
 Die Verteilungsfunktion einer stetigen Zufallsvariablen
ist dann
k
P( x)   p  X  xi 
i 1
Diskret
Folie 4
F ( x) 
xk
 f  x  dx
x 
Stetig
 Die Verteilungsfunktion gibt wieder an, wie wahrscheinlich X einen Wert kleiner oder gleich x annimmt.
Statistik &
Methodenlehre
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Definition
Definition
Kennwerte &
Darstellung
Normalverteilung
 Eine Funktion f(x) ist gemäß der Kolmogoroff Axiome
genau dann eine Dichtefunktion, wenn gilt
f ( x)  0
F ( x)  
und

f ( x) dx  1
 Dabei reicht der Wertebereich von f(x) nicht für jede
stetige Verteilung von - bis + (z.B. Reaktionszeit).
Standardnormalverteilung
Standardnormalverteilung
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
F(z,,)
f(z,,)
z-Werte
‐3
Folie 5

‐2
‐1
0
z‐Wert
1
2
3
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
‐3
‐2
‐1
0
z‐Wert
1
2
3
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Definition
Kennwerte &
Darstellung
Normalverteilung
z-Werte
 Für eine stetige Zufallsvariable ist die Punktwahrscheinlichkeit f(X = x) nicht definiert (bzw. immer 0).
 Die Dichtefunktion f(x) liefert also nicht unmittelbar die
Wahrscheinlichkeiten für Ereignisse, die
Wahrscheinlichkeiten ergeben sich aus der Fläche unter
der Dichtefunktion
 Es sind nur Wahrscheinlichkeiten für Intervalle von
Realisationen zu bestimmen, also F(xi  X  xj). Diese
werden dann berechnet als
xj
F ( xi  X  x j )   f ( x) dx  F ( x j )  F ( xi )
xi
Folie 6
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Kennwerte
Kennwerte &
Darstellung
 Der Erwartungswert einer stetigen Zufallsvariablen ist
ähnlich definiert wie im diskreten Fall

Normalverteilung
z-Werte
 f  x   x dx
x 
 Auch Varianz und Standardabweichung werden
analog berechnet
 
2
x 

x 
Folie 7
x 
f  x    x    dx
2
  2
Statistik &
Methodenlehre
Stetige Verteilungen
Inferenzstatistik
Stetige Zufallsvariablen
Definition
Darstellung
 Die Darstellung der Dichtefunktion und
Verteilungsfunktion einer stetigen Zufallsvariablen findet
zumeist über kontinuierliche Graphen statt.
Normalverteilung
f(z,,)
z-Werte
Standardnormalverteilung
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
‐3
‐2
‐1
0
z‐Wert
Folie 8
Standardnormalverteilung
F(z,,)
Kennwerte &
Darstellung
1
2
3
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
‐3
‐2
‐1
0
z‐Wert
1
2
3
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Normalverteilung
Definition
Kennwerte &
Darstellung
Normalverteilung
z-Werte
 Im psychologischen Kontext ist die Normalverteilung die
wohl prominenteste Wahrscheinlichkeitsverteilung.
 Sie ist theoretischer Natur, da sie (anders als z.B. die
Binomialverteilung) nicht direkt aus dem
Bedingungskomplex  abgeleitet werden kann.
 Die Normalverteilung ist durch zwei Parameter,  und
definiert.
1
f ( x,  ,  ) 
e
2
1  x 
 

2  
2
 Ist eine Zufallsvariable X normalverteilt, wird dies häufig
geschrieben als X  N(, )
Folie 9
Statistik &
Methodenlehre
Stetige Verteilungen
Inferenzstatistik
Normalverteilung
Kennwerte
 Der Parameter  ist direkt der Erwartungswert der Normalverteilung
 ²ist direkt die Varianz der Normalverteilung
Folie 10
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Normalverteilung
Warum die Normalverteilung - Zentraler Grenzwertsatz
Kennwerte &
Darstellung
 Der Zentrale Grenzwertsatz (Central Limit Theorem):
Die Summe einer großen Zahl unabhängiger, identisch
verteilter Zufallsvariablen ist approximativ normalverteilt.
Normalverteilung
z-Werte
Folie 11
 Dies veranlasste Sir Francis Galton (1889) zu der
enthusiasmierten Lobpreisung
„Ich kenne kaum etwas, das unsere Imaginationskraft so bewegen kann wie
die wundervolle Form kosmischer Ordnung, die sich im ‚Gesetz der
Verteilung von Fehlern‘ ausdrückt. Hätten die Griechen es gekannt, sie
hätten es personifiziert und als Gottheit angebetet. Es herrscht mit
bescheidener Gelassenheit in der wildesten Konfusion. Je gewaltiger die
Horde, je ärger die augenscheinliche Anarchie, um so souveräner ist seine
Herrschaft. Wann immer eine Menge chaotischer Elemente nach ihrer Größe
angeordnet wird, tritt es hinter dem Schleier des Chaos als unverhoffte und
wunderschöne Form der Regelmäßigkeit hervor.“
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Normalverteilung
Warum die Normalverteilung
Kennwerte &
Darstellung
1. Sie ergibt sich, wenn viele Zufallsprozesse bei der
Realisierung einer Zufallsvariablen additiv
zusammenwirken.
Normalverteilung
2. Sie ist die Verteilung des Mittelwerts aller Realisierungen
bei sehr häufiger Wiederholung eines Zufallsexperimentes
(„Zentraler Grenzwertsatz“).
z-Werte
3. Sie ist die Verteilung von Zufallsvariablen, wenn diese
eine messfehlerbehaftete Erfassung eines Merkmals
darstellen.
4. Sie ist mathematisch relativ leicht zu behandeln.
Folie 12
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Normalverteilung
Eigenschaften
Kennwerte &
Darstellung
Normalverteilung
 Ist symmetrisch, eingipflig und glockenförmig
 Verschiedene Normalverteilungen unterscheiden sich
bezüglich Erwartungswert (µ) und/oder
Standardabweichung ()
 Der Wertebereich reicht von – bis +
 Die Kurve berührt oder schneidet nie die x-Achse
z-Werte
 Jedes Intervall mit einer Länge größer Null hat eine
Wahrscheinlichkeit größer Null
 Die Verteilungsfunktion der Normalverteilung wird auch
als (x) (Phi) geschrieben.
Folie 13
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Exkurs: z-Standardisierung
Grundlagen
Kennwerte &
Darstellung
Normalverteilung
z-Werte
Ziel: Angabe der relativen Lage von Werten in einer
Verteilung.
1. Angabe einer normierten Differenz eines Messwertes
zum Erwartungswert
2. Umwandlung einer Skala in eine andere mit
vorgegebenem  und .
Berechnungsvorschrift: Jede Differenz eines Messwertes
wird durch die Standardabweichung aller Messwerte geteilt.
Die erhaltenen Werte werden als z-Werte bezeichnet.
z
Folie 14
x
x
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Exkurs: z-Standardisierung
Skalentransformation
Kennwerte &
Darstellung
Normalverteilung
 Mithilfe der z-Transformation können Messdaten mit
beliebigem Mittelwert und Standardabweichung in
Daten transformiert werden, die einen definierten
Mittelwert und Standardabweichung aufweisen.
 Schritt 1: z-Standardisierung jedes Datenpunktes
 Schritt 2: Transformation jedes Datenpunktes in
die neue Skala
z-Werte
xneu   z  sneu   xneu
 Beispiele: Hamburg-Wechsler IQ-Test (MW=100,
s=15), IQ-Skala laut IST (MW=100, s=10), StanineSkala (MW=5, s=2),
Folie 15
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Exkurs: z-Standardisierung
Standardnormalverteilung
Kennwerte &
Darstellung
 z-transformiert man eine normalverteilte Zufallsvariable
erhält man die Standardnormalverteilung.
 Für die Standardnormalverteilung gilt:  = 0,  = 1
Normalverteilung
z-Werte
 Die Formel der Normalverteilung reduziert sich damit auf
1  1 z2
f ( z) 
e 2
2
 Der Werte der Dichte- und Verteilungsfunktion hängen
also nur von z ab
Folie 16
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Standardnormalverteilung
Wichtige Punkte
Kennwerte &
Darstellung
Normalverteilung
z-Werte
Folie 17
Inferenzstatistik
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Inferenzstatistik
Standardnormalverteilung
Wichtige Punkte – die 68-95-99 Regel
Kennwerte &
Darstellung
Normalverteilung
z-Werte
Folie 18
Statistik &
Methodenlehre
Definition
Stetige Verteilungen
Standardnormalverteilung
Verteilungsfunktion
Kennwerte &
Darstellung
Normalverteilung
z-Werte
Folie 19
Inferenzstatistik
Statistik &
Methodenlehre
Relevante Excel Funktionen
 Normalverteilung, z-Transformation
• NORM.VERT(), NORM.S.VERT()
• NORM.INV(), NORM.S.INV()
• STANDARDISIERUNG()
Folie 20
Herunterladen