Statistik & Methodenlehre Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Mathematische und statistische Methoden II Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike [email protected] lordsofthebortz.de lordsofthebortz.de/g+ facebook.com/methodenlehre twitter.com/methodenlehre youtube.com/methodenlehre SoSe 2012 Folie 1 Psychologisches Institut Johannes Gutenberg Universität Mainz Statistik & Methodenlehre Stetige Verteilungen Inferenzstatistik Inhalte dieser Sitzung Stetige Verteilungen Kennwerte und Darstellungen z-Standardisierung und ihre Folgen z-Test Folie 2 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Definition Kennwerte & Darstellung Normalverteilung z-Werte Folie 3 Eine Zufallsvariable, die jeden Wert in einem Intervall annehmen kann, ist eine stetige Zufallsvariable Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Definition Kennwerte & Darstellung Normalverteilung z-Werte Die Wahrscheinlichkeitsverteilung f(x) einer stetigen Zufallsvariable X wird zumeist als mathematische Funktion definiert. Sie wird bei stetigen Zufallsvariablen auch als Dichtefunktion bezeichnet. Die Verteilungsfunktion einer stetigen Zufallsvariablen ist dann k P( x) p X xi i 1 Diskret Folie 4 F ( x) xk f x dx x Stetig Die Verteilungsfunktion gibt wieder an, wie wahrscheinlich X einen Wert kleiner oder gleich x annimmt. Statistik & Methodenlehre Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Definition Definition Kennwerte & Darstellung Normalverteilung Eine Funktion f(x) ist gemäß der Kolmogoroff Axiome genau dann eine Dichtefunktion, wenn gilt f ( x) 0 F ( x) und f ( x) dx 1 Dabei reicht der Wertebereich von f(x) nicht für jede stetige Verteilung von - bis + (z.B. Reaktionszeit). Standardnormalverteilung Standardnormalverteilung 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 F(z,,) f(z,,) z-Werte ‐3 Folie 5 ‐2 ‐1 0 z‐Wert 1 2 3 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 ‐3 ‐2 ‐1 0 z‐Wert 1 2 3 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Definition Kennwerte & Darstellung Normalverteilung z-Werte Für eine stetige Zufallsvariable ist die Punktwahrscheinlichkeit f(X = x) nicht definiert (bzw. immer 0). Die Dichtefunktion f(x) liefert also nicht unmittelbar die Wahrscheinlichkeiten für Ereignisse, die Wahrscheinlichkeiten ergeben sich aus der Fläche unter der Dichtefunktion Es sind nur Wahrscheinlichkeiten für Intervalle von Realisationen zu bestimmen, also F(xi X xj). Diese werden dann berechnet als xj F ( xi X x j ) f ( x) dx F ( x j ) F ( xi ) xi Folie 6 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Kennwerte Kennwerte & Darstellung Der Erwartungswert einer stetigen Zufallsvariablen ist ähnlich definiert wie im diskreten Fall Normalverteilung z-Werte f x x dx x Auch Varianz und Standardabweichung werden analog berechnet 2 x x Folie 7 x f x x dx 2 2 Statistik & Methodenlehre Stetige Verteilungen Inferenzstatistik Stetige Zufallsvariablen Definition Darstellung Die Darstellung der Dichtefunktion und Verteilungsfunktion einer stetigen Zufallsvariablen findet zumeist über kontinuierliche Graphen statt. Normalverteilung f(z,,) z-Werte Standardnormalverteilung 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 ‐3 ‐2 ‐1 0 z‐Wert Folie 8 Standardnormalverteilung F(z,,) Kennwerte & Darstellung 1 2 3 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 ‐3 ‐2 ‐1 0 z‐Wert 1 2 3 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Normalverteilung Definition Kennwerte & Darstellung Normalverteilung z-Werte Im psychologischen Kontext ist die Normalverteilung die wohl prominenteste Wahrscheinlichkeitsverteilung. Sie ist theoretischer Natur, da sie (anders als z.B. die Binomialverteilung) nicht direkt aus dem Bedingungskomplex abgeleitet werden kann. Die Normalverteilung ist durch zwei Parameter, und definiert. 1 f ( x, , ) e 2 1 x 2 2 Ist eine Zufallsvariable X normalverteilt, wird dies häufig geschrieben als X N(, ) Folie 9 Statistik & Methodenlehre Stetige Verteilungen Inferenzstatistik Normalverteilung Kennwerte Der Parameter ist direkt der Erwartungswert der Normalverteilung ²ist direkt die Varianz der Normalverteilung Folie 10 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Normalverteilung Warum die Normalverteilung - Zentraler Grenzwertsatz Kennwerte & Darstellung Der Zentrale Grenzwertsatz (Central Limit Theorem): Die Summe einer großen Zahl unabhängiger, identisch verteilter Zufallsvariablen ist approximativ normalverteilt. Normalverteilung z-Werte Folie 11 Dies veranlasste Sir Francis Galton (1889) zu der enthusiasmierten Lobpreisung „Ich kenne kaum etwas, das unsere Imaginationskraft so bewegen kann wie die wundervolle Form kosmischer Ordnung, die sich im ‚Gesetz der Verteilung von Fehlern‘ ausdrückt. Hätten die Griechen es gekannt, sie hätten es personifiziert und als Gottheit angebetet. Es herrscht mit bescheidener Gelassenheit in der wildesten Konfusion. Je gewaltiger die Horde, je ärger die augenscheinliche Anarchie, um so souveräner ist seine Herrschaft. Wann immer eine Menge chaotischer Elemente nach ihrer Größe angeordnet wird, tritt es hinter dem Schleier des Chaos als unverhoffte und wunderschöne Form der Regelmäßigkeit hervor.“ Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Normalverteilung Warum die Normalverteilung Kennwerte & Darstellung 1. Sie ergibt sich, wenn viele Zufallsprozesse bei der Realisierung einer Zufallsvariablen additiv zusammenwirken. Normalverteilung 2. Sie ist die Verteilung des Mittelwerts aller Realisierungen bei sehr häufiger Wiederholung eines Zufallsexperimentes („Zentraler Grenzwertsatz“). z-Werte 3. Sie ist die Verteilung von Zufallsvariablen, wenn diese eine messfehlerbehaftete Erfassung eines Merkmals darstellen. 4. Sie ist mathematisch relativ leicht zu behandeln. Folie 12 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Normalverteilung Eigenschaften Kennwerte & Darstellung Normalverteilung Ist symmetrisch, eingipflig und glockenförmig Verschiedene Normalverteilungen unterscheiden sich bezüglich Erwartungswert (µ) und/oder Standardabweichung () Der Wertebereich reicht von – bis + Die Kurve berührt oder schneidet nie die x-Achse z-Werte Jedes Intervall mit einer Länge größer Null hat eine Wahrscheinlichkeit größer Null Die Verteilungsfunktion der Normalverteilung wird auch als (x) (Phi) geschrieben. Folie 13 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Exkurs: z-Standardisierung Grundlagen Kennwerte & Darstellung Normalverteilung z-Werte Ziel: Angabe der relativen Lage von Werten in einer Verteilung. 1. Angabe einer normierten Differenz eines Messwertes zum Erwartungswert 2. Umwandlung einer Skala in eine andere mit vorgegebenem und . Berechnungsvorschrift: Jede Differenz eines Messwertes wird durch die Standardabweichung aller Messwerte geteilt. Die erhaltenen Werte werden als z-Werte bezeichnet. z Folie 14 x x Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Exkurs: z-Standardisierung Skalentransformation Kennwerte & Darstellung Normalverteilung Mithilfe der z-Transformation können Messdaten mit beliebigem Mittelwert und Standardabweichung in Daten transformiert werden, die einen definierten Mittelwert und Standardabweichung aufweisen. Schritt 1: z-Standardisierung jedes Datenpunktes Schritt 2: Transformation jedes Datenpunktes in die neue Skala z-Werte xneu z sneu xneu Beispiele: Hamburg-Wechsler IQ-Test (MW=100, s=15), IQ-Skala laut IST (MW=100, s=10), StanineSkala (MW=5, s=2), Folie 15 Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Exkurs: z-Standardisierung Standardnormalverteilung Kennwerte & Darstellung z-transformiert man eine normalverteilte Zufallsvariable erhält man die Standardnormalverteilung. Für die Standardnormalverteilung gilt: = 0, = 1 Normalverteilung z-Werte Die Formel der Normalverteilung reduziert sich damit auf 1 1 z2 f ( z) e 2 2 Der Werte der Dichte- und Verteilungsfunktion hängen also nur von z ab Folie 16 Statistik & Methodenlehre Definition Stetige Verteilungen Standardnormalverteilung Wichtige Punkte Kennwerte & Darstellung Normalverteilung z-Werte Folie 17 Inferenzstatistik Statistik & Methodenlehre Definition Stetige Verteilungen Inferenzstatistik Standardnormalverteilung Wichtige Punkte – die 68-95-99 Regel Kennwerte & Darstellung Normalverteilung z-Werte Folie 18 Statistik & Methodenlehre Definition Stetige Verteilungen Standardnormalverteilung Verteilungsfunktion Kennwerte & Darstellung Normalverteilung z-Werte Folie 19 Inferenzstatistik Statistik & Methodenlehre Relevante Excel Funktionen Normalverteilung, z-Transformation • NORM.VERT(), NORM.S.VERT() • NORM.INV(), NORM.S.INV() • STANDARDISIERUNG() Folie 20