Prof. Dr. Roland Füss Statistik II SS 2008 1. Zufallsvariable und Verteilungsfunktion 1.1 Die Wahrscheinlichkeits- und Verteilungsfunktion • Notation: X : Zufallsvariable, x i : eine bestimmte Ausprägung von X • Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable: Eine Funktion f (xi ) , die jeder Ausprägung x i der (abzählbar unendlichen) Zufallsvariable X eine Wahrscheinlichkeit P( X = xi ) zuordnet heißt Wahrscheinlichkeitsfunktion. • Eigenschaften: 0 ≤ f (xi ) ≤ 1 und ∑ f (x n )=1 i =1 1 Prof. Dr. Roland Füss Statistik II SS 2008 Z.B. Würfel: • Verteilungsfunktion einer diskreten Zufallsvariablen: Die Wahrscheinlichkeitsfunktion F ( x ) , welche die Wahrscheinlichkeit angibt, dass die Zufallsvariable X einen Wert kleiner oder 2 Prof. Dr. Roland Füss xi gleich annimmt, Statistik II P( X ≤ xi ) , SS 2008 heißt Verteilungsfunktion: xi F ( x ) = ∑ f ( xi ) i =1 • Eigenschaften: (1) F ( x ) ist monoton steigend: wenn x2 > x1 ist auch immer F ( x 2 ) > F ( x1 ) (2) F ( x ) ist rechtsseitig stetig F ( x ) = 0 und lim F ( x ) = 1 (3) xlim → −∞ x → +∞ 3 Prof. Dr. Roland Füss Statistik II SS 2008 Z.B. Würfel: zu (2) rechtsseitig stetig: z.B. man nähert sich der 2 von rechts: lim+ = F (2 ) = x→ 2 2 6 4 Prof. Dr. Roland Füss Statistik II SS 2008 man nähert sich der 2 von links: lim− = F (1) = x→ 2 1 6 • Wahrscheinlichkeitsintervall einer diskreten Zufallsvariable: P ( x1 < X ≤ x2 ) = P( X ≤ x2 ) − P ( X ≤ x1 ) = F ( x2 ) − F ( x1 ) 5 Prof. Dr. Roland Füss Statistik II SS 2008 1.2 Stetige Zufallsvariable • Dichtefunktion einer stetigen Zufallsvariable: für den Fall einer überabzählbar unendlichen Zufallsvariable gilt für die Dichtefunktion: +∞ (1) ∫ f ( x ) dx = 1 −∞ und (2) f ( x ) ≥ 0 • Die Dichtefunktion kann nur in einem unendlichen Intervall [− ∞;+∞] oder endlichen Intervall [xu ; x o ] positive Werte annehmen (d.h. die Punktwahrscheinlichkeit ist 0), z.B.: ⎧0,5 , 3 < x < 5 f (x ) = ⎨ ⎩0 , sonst 6 Statistik II Prof. Dr. Roland Füss SS 2008 • Verteilungsfunktion einer stetigen Zufallsvariable: Die Verteilungsfunktion stellt die Fläche unter der Dichtefunktion bis zur Stelle x dar: F (x ) = x ∫ f (u )du −∞ • Eigenschaften: (1) für x < xu : (2) für F (x ) = 0 xu ≤ x < x o : (3) für x ≥ xo : F (x ) = x ∫ f (u )du xu F (x ) = 1 7 Prof. Dr. Roland Füss Statistik II SS 2008 Die Dichtefunktion ist die erste Ableitung der Verteilungsfunktion, d.h. dF ( x ) = f (x ) dx • Wahrscheinlichkeitsintervall einer stetigen Zufallsvariable: b P (a < x < b ) = ∫ f ( x )dx = F (b ) − F (a ) a 8 Prof. Dr. Roland Füss Statistik II SS 2008 1.3 Erwartungswerte von Zufallsvariablen • Erwartungswert: Der Erwartungswert der Zufallsvariable X, E ( x ) oder auch µ , ist wie folgt definiert: n im diskreten Fall: im stetigen Fall: E ( x ) = ∑ xi ⋅ f ( xi ) i =1 E (x ) = +∞ ∫ x ⋅ f (x )dx −∞ 9 Statistik II Prof. Dr. Roland Füss SS 2008 1.4 Varianzen von Zufallsvariablen • Varianz und Standardabweichung: 2 Die Varianz der Zufallsvariable X , Var (x ) oder auch σ , ist wie folgt definiert: n im diskreten Fall: n σ = ∑ ( xi − E ( X )) ⋅ f (xi ) = ∑ xi2 f (xi ) − E ( X )2 2 i =1 2 i =1 Oft lässt sich die Varianz mit der zweiten Version dieser Gleichung einfacher berechnen. 10 Statistik II Prof. Dr. Roland Füss σ = 2 im stetigen Fall: SS 2008 +∞ 2 ( ( ) ) x − E X ⋅ f ( x )dx ∫ −∞ Auch für diese Gleichung ist folgende Umformung oft nützlich: σ2 = +∞ 2 ∫ x ⋅ f (x )dx − E ( X ) 2 −∞ • Die Standardabweichung ist in beiden Fällen: σ = Var ( X ) = σ 2 11 Statistik II Prof. Dr. Roland Füss SS 2008 1.5 Momenterzeugende Funktionen • Moment um Null: Das n-te Moment um Null einer Zufallsvariable ist definiert als: ( ) = ∑ x f (x ) n diskreter Fall: E X n n i i =1 i +∞ stetiger Fall: ( ) = ∫ x f (x )dx E X n n −∞ 2 • Beachte den Unterschied: E (x ) und E ( x ) beim Berechnen der 2 Varianz: 12 Statistik II Prof. Dr. Roland Füss +∞ ( ) ∫x E x2 = 2 −∞ SS 2008 ⋅ f ( x )dx im Vergleich zu E ( x ) 2 ⎛ +∞ ⎞ ⎜ = ⎜ ∫ x ⋅ f ( x )dx ⎟⎟ ⎝ −∞ ⎠ 2 Der erste Term ist also das zweite Moment um Null, während der zweite Term das erste Moment um Null (= Erwartungswert) zum Quadrat ist. • Zentrales Moment n-ter Ordnung: ( ) n diskreter Fall: E ( X − E ( X )) = ∑ (xi − E ( X )) ⋅ f (xi ) n n i =1 13 Statistik II Prof. Dr. Roland Füss ( ) ∫ (x − E ( X )) stetiger Fall: E ( X − E ( X )) = n SS 2008 +∞ n ⋅ f ( x )dx −∞ Die Varianz ist also das zentrale Moment zweiter Ordnung. 1.6 Standardisieren X mit Erwartungswert µ und Standardab- Eine Zufallsvariable weichung σ lässt sich zur standardisierten Zufallsvariable Z transformieren: Z = X −µ σ 14 Prof. Dr. Roland Füss Statistik II SS 2008 Eigenschaften: 1 µ µ ⎛ X −µ⎞ 1 ( ) ( ) E (Z ) = E ⎜ = E X − E = − = 0 und µ ⎟ σ σ σ ⎝ σ ⎠ σ σ2 ⎛X −µ⎞ 1 Var (Z ) = Var ⎜ ⎟ = 2 Var ( X ) = 2 = 1 σ σ ⎠ σ ⎝ Eine Standardisierte Zufallsvariable hat also einen Erwartungswert von 0 und eine Varianz von 1. 15 Prof. Dr. Roland Füss Statistik II SS 2008 1.7 Tschebyscheffsche Ungleichung Mit der Ungleichung von Tschebyscheff kann die Wahrscheinlichkeit geschätzt werden, dass eine Zufallsvariable in einem symmetrisch um den Erwartungswert gelegenen Intervall liegt. Je nach Verteilung wird die Wahrscheinlichkeit sehr ungenau. Vorteil ist aber, dass die Verteilung nicht bekannt sein muss: P (µ − c ⋅ σ < X < µ + c ⋅ σ ) oder auch P( X − µ < c ⋅ σ ) 16 Prof. Dr. Roland Füss Statistik II SS 2008 Die Wahrscheinlichkeit, dass sich X um wenigstens cσ von µ 1 ( ) P X − ≥ c ⋅ ≤ µ σ unterscheidet, lässt sich abschätzen als: c2 . Die Wahrscheinlichkeit, dass sich X um höchstens cσ von µ 1 ( ) P X − < c ⋅ > 1 − µ σ unterscheidet, lässt sich abschätzen als: c2 . 17 Statistik II Prof. Dr. Roland Füss SS 2008 1.8 Schiefe und Wölbung Die Schiefe einer Verteilung zeigt an, wie stark die Verteilung nach rechts (negative Schiefe) oder nach links (positive Schiefe) geneigt ist. Die Wölbung zeigt an, wie hoch die Wahrscheinlichkeiten um den Mittelwert und die extremen Enden der Verteilung liegen. • Schiefe: ( E ( X − E ( X )) 3 σ3 ) , d.h. die Schiefe ist das zentrale Moment dritter Ordnung bezogen auf die Standardabweichung in der dritten Potenz. 18 Statistik II Prof. Dr. Roland Füss • Kurtosis: ( E ( X − E ( X )) 4 σ4 SS 2008 ) , d.h. die Kurtosis ist das zentrale Moment vierter Ordnung bezogen auf die Standardabweichung in der vierten Potenz. Eine Kurtosis >3 wird auch als Excess Kurtosis bezeichnet. 19 Prof. Dr. Roland Füss Statistik II SS 2008 1.9 Median, Quantile und Modus • Median: Der Median oder Zentralwert xMed einer Zufallsvariablen X ist diejenige Zahl, für welche die Wahrscheinlichkeit, dass X grösser oder kleiner als xMed ist, gleich groß ist: P( X ≤ xMed ) = F ( xMed ) = 0,5 −1 (0,5) x = F oder: Med Da sich der Median für viele diskrete Zufallsvariablen nicht eindeutig bestimmen lässt schreibt man auch: 20 Prof. Dr. Roland Füss und Statistik II SS 2008 P( X ≤ xMed ) ≥ 0,5 ⎫ ⎬ P(( X ≥ xMed ) ≥ 0,5⎭ • Quantil: Eine Zahl x[q] mit 0 < q < 1 heisst q-Quantil wenn gleichzeitig gilt: und P( X ≤ x[q ]) ≥ q ⎫ ⎬ P(( X ≥ x[q ]) ≥ 1 − q ⎭ Der Median ist also das 0,5- oder 50%-Quantil und das q-Quantil eine Verallgemeinerung. 21 Prof. Dr. Roland Füss Statistik II SS 2008 • Modus: der Modus einer Verteilung ist diejenige Zahl xM , die im diskreten Fall die höchste Eintrittswahrscheinlichkeit oder im stetigen Fall die höchste Wahrscheinlichkeitsdichte aufweist: f ( xM ) > f ( x ) für alle x ≠ xM 22