TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung a) Funktionen von Zufallsvariablen sind wieder Zufallsvariablen. Betrachte etwa zweimaligen Würfelwurf (vgl. Beispiel 8.2 b)) und definiere Zufallsvariablen: X1 = Augenzahl Wurf 1“; ” X2 = Augenzahl Wurf 2“. Dann sind ” Z1 = min {X1 , X2 } Z2 = max {X1 , X2 } Z3 = X1 + X2 ebenfalls Zufallsvariablen b) Im Folgenden von Interesse: Wie lassen sich Wahrscheinlichkeiten angeben, dass Zufallsvariable X Wert xi annimmt? Zunächst lediglich Betrachtung diskreter Zufallsvariablen. Dr. Hendrik Hansen 199 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Definition 9.2 Sei X diskrete Zufallsvariable mit möglichen Realisationen x1 , x2 , ..., xk . Dann heißt die Funktion f (·), die angibt, mit welcher Wahrscheinlichkeit X die Realisation xi annimmt, f (xi ) = P (X = xi ), i = 1, . . . , k, Wahrscheinlichkeitsfunktion von X. Dr. Hendrik Hansen 200 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.2 (Zweimaliges Würfeln, vgl. Beispiel 8.2 b)) ◮ Definiere X =Augensumme beider Würfe ◮ 8.2 b) bzw. 8.4: Zweimaliges Würfeln entspricht Laplace Experiment mit |Ω| = 36 → X(ω) = xi X=2 X=3 X=4 .. . X = 12 Dr. Hendrik Hansen {zugehörige ω} {(1, 1)} {(1, 2), (2, 1)} {(1, 3), (2, 2), (3, 1)} .. . ⇒ ⇒ ⇒ ⇒ {(6, 6)} ⇒ P (X = 12) = 1/36 P (X P (X P (X P (X .. . = xi ) = 2) = 1/36 = 3) = 2/36 = 4) = 3/36 201 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.2 (Fortsetzung) Realisation xi P (X = xi ) 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 Realisation xi P (X = xi ) 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 ⇒ P 7 6/36 P (X = xi ) = 1 (klar, da sich eine Augensumme zwischen i Dr. Hendrik Hansen 2 und 12 auf jeden Fall realisieren wird!) 202 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen 3/36 0 1/36 2/36 P(X = xi) 4/36 5/36 6/36 Beispiel 9.2 (Fortsetzung) 2 3 4 5 6 7 8 9 10 11 12 xi Dr. Hendrik Hansen 203 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.2 (Fortsetzung) ◮ Frage: Wie wahrscheinlich überschreitet Zufallsvariable einen bestimmten Wert nicht? ◮ Hier etwa: Mit welcher Wahrscheinlichkeit ist Augensumme ≤ 3? P(X ≤ 3) = P({(1, 1)} ∪ {(1, 2), (2, 1)}) = P({(1, 1)}) + P({(1, 2), (2, 1)}) +P({(1, 1)} ∩ {(1, 2), (2, 1)}) = P({(1, 1)}) + P({(1, 2), (2, 1)}) + P(∅) = 1 2 + +0 36 36 = P(X = 2) + P(X = 3) Dr. Hendrik Hansen 204 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Definition 9.3 Für eine Zufallsvariable X heißt die Funktion F (·), die angibt, mit welcher Wahrscheinlichkeit X einen Wert x nicht überschreitet, F (x) = P (X ≤ x), x ∈ R, Verteilungsfunktion von X. Bemerkung Für eine diskrete Zufallsvariable X gilt X F (x) = f (xi ), x ∈ R xi ≤x (vergleiche Definition 2.2: F (x) theoretisches Gegenstück“ zu ” empirischer Verteilungsfunktion Fn (x)) Dr. Hendrik Hansen 205 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.3 (Zweimaliges Würfeln, vgl. Beispiel 9.2) Weiterhin sei X =Augensumme beider Würfe ◮ In Bsp. 9.2 berechnet: F (3) = P(X = 2) + P(X = 3) = 3 36 ◮ Bem. nach Def. 9.3: 6 , F (4) = P(X = 2) + P(X = 3) + P(X = 4) = 36 F (5) = P(X = 2)+P(X = 3)+P(X = 4)+P(X = 5) = 10 36 , ... x∈ F (x) (−∞, 2) 0 [2, 3) 1/36 [3, 4) 3/36 [4, 5) 6/36 [5, 6) 10/36 [6, 7) 15/36 x∈ F (x) [7, 8) 21/36 [8, 9) 26/36 [9, 10) 30/36 [10, 11) 33/36 [11, 12) 35/36 [12, ∞) 1 Dr. Hendrik Hansen 206 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen 1 Beispiel 9.3 (Fortsetzung) ● ● 5/6 ● ● 1/2 ● ● 1/3 P(X ≤ x) 2/3 ● 1/6 ● ● ● 0 ● −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 x → F (x) Treppenfunktion; Sprungstellen x = 2, 3, ..., 12, Sprunghöhen den Werten der Wahrscheinlichkeitsfunktion entsprechend (1/36, 2/36, 3/36, ..., 1/36) Dr. Hendrik Hansen 207 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung Betrachte nun stetige Zufallsvariable X; Hier Definition der Wahrscheinlichkeitsfunktion durch f (xi ) = P(X = xi ) analog zu Definition 9.2 nicht sinnvoll ◮ Grund: X stetig → Sämtliche xi ∈ R können sich realisieren (zumindest auf Intervall, vergleiche Definition 9.1) ◮ Stetigkeit in Praxis jedoch Idealisierung, da Messungen diskret ◮ Sei etwa X = Körpergewicht (in kg) einer zufällig ausgewählten Person i → P(X = 82, 514367842312) ??? → deswegen: P(X = x) = 0 für alle x ∈ R Dr. Hendrik Hansen 208 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Definition 9.4 Sei X stetige Zufallsvariable mit möglichen Realisationen im Intervall (a, b), a = −∞ und/oder b = ∞ erlaubt, und differenzierbarer Verteilungsfunktion F (x). Dann heißt die erste Ableitung f (x) = F ′ (x), x ∈ R, Dichtefunktion (kurz Dichte) von X. Dr. Hendrik Hansen 209 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung 1 a) Zusammenhang zwischen Verteilungs- und Dichtefunktion Zx f (x) = F ′ (x) (vgl. Def. 9.4) und F (x) = f (t) dt −∞ b) Interpretation der Dichtefunktion schraffiert: Ra f (t) dt = F (a) = P(X ≤ a) −∞ → gesamter Flächeninhalt unter der Dichte=1 Dr. Hendrik Hansen 210 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung 2 a) Eigenschaften der Verteilungsfunktion ( Gegenstück“ zur ” Bemerkung nach Beispiel 2.3): Sei X beliebige Zufallsvariable mit Verteilungsfunktion F (x). Dann gilt ◮ F (x) ist monoton nicht fallend ◮ 0 ≤ F (x) ≤ 1 für alle x ∈ R ◮ lim F (x) = 0 und x→−∞ ◮ Dr. Hendrik Hansen lim F (x) = 1 x→∞ P (a < X ≤ b) = F (b) − F (a) 211 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung 2 (Fortsetzung) b) Eigenschaften der Wahrscheinlichkeits-/Dichtefunktion: Sei f (x) die der Zufallsvariablen X aus a) zugehörige Wahrscheinlichkeits-/Dichtefunktion. Dann gilt ◮ ◮ f (x) ≥ 0 lim f (x) = lim f (x) = 0 x→−∞ ◮ P x→∞ f (xi ) = 1 falls X diskret (I Indexmenge, z.B. i∈I I = {1, ..., n}), bzw. R∞ f (x) dx = 1 falls X stetig −∞ ◮ F (b) − F (a) = Rb f (x) dx, falls X stetig a Dr. Hendrik Hansen 212 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.4 a) Gleich-/Rechteckverteilung (einfachste stetige Verteilung) ◮ X gleichverteilt auf Intervall [a, b] → ( 1 x ∈ [a, b] f (x) = b−a 0 sonst → Werte auf Intervall gleichmäßig“ verteilt ” Dr. Hendrik Hansen 213 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.4 (Fortsetzung) 0.00 0.01 0.02 f(x) 0.03 0.04 0.05 b) Sei X = Verspätung der S1 an der Haltestelle Universität ” Dortmund“; Annahme: X auf Intervall [0, 20] gleichverteilt ( 1 x ∈ [0, 20] → f (x) = 20 0 sonst −5 0 5 10 15 20 25 Verspätung x in Minuten Dr. Hendrik Hansen 214 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.4 (Fortsetzung) b) (Fortsetzung) ◮ Frage: Mit welcher Wahrscheinlichkeit beträgt S1-Verspätung zwischen fünf und zehn Minuten? P (5 < X ≤ 10) = F (10) − F (5) (vgl. Bem. 2 a) nach Def. 9.4) → Berechnung von F (x) : F (x) = Zx f (t) dt = 0 → Insgesamt: F (x) = 0, x , 20 1, Dr. Hendrik Hansen Zx 0 x x 1 1 dt = t = 20 20 0 20 x<0 0 ≤ x ≤ 20 x > 20 215 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.4 (Fortsetzung) b) (Fortsetzung) P (5 < X ≤ 10) = F (10) − F (5) = 10 20 − 5 20 = 0, 25 F(x) 0 0.25=F(5) 0.5=F(10) 0.75 1 → P(S1 fünf bis zehn Minuten zu spät)=25 % −5 0 5 10 15 20 25 Verspätung x in Minuten Dr. Hendrik Hansen 216 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Definition 9.5 Gilt für zwei Zufallsvariablen X und Y und alle x, y ∈ R P (X ≤ x, Y ≤ y) = P (X ≤ x) · P (Y ≤ y) = FX (x) · FY (y), so heißen X und Y stochastisch unabhängig. Beispiel 9.5 (zweimaliges Würfeln, vgl. u.a. Beispiel 9.2) X =Augenzahl erster Wurf Y =Augenzahl zweiter Wurf Dr. Hendrik Hansen 217 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.5 (Fortsetzung) P (X ≤ 3, Y ≤ 5) = P (X ≤ 3 und Y ≤ 5) = P ( {(1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (3, 6)} | {z } A mit |A|=18 und {(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)} ) {z } | B mit |B|=30 = P (A ∩ B) = P ({(1, 1), (1, 2), ..., (1, 5), (2, 1), ..., (3, 5)}) {z } | C mit |C|=15 = Dr. Hendrik Hansen 15 5 = 36 12 218 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 9.5 (Fortsetzung) Außerdem gilt: P (X ≤ 3) = P (A) = 1 18 = 36 2 P (Y ≤ 5) = P(B) = 30 5 = 36 6 Und somit P (X ≤ 3) · P (Y ≤ 5) = 5 1 5 · = = P (X ≤ 3, Y ≤ 5) 2 6 12 Für alle (x, y) ∈ R nachweisbar → X und Y stochastisch unabhängig Dr. Hendrik Hansen 219 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Bemerkung Fazit/Zusammenfassung Kapitel 9 ◮ Zufallsvariablen zur vereinfachten Berechnung von Wahrscheinlichkeiten; Quantifizierung von Ereignissen ◮ Diskrete Zufallsvariablen besitzen Wahrscheinlichkeits- und Verteilungsfunktion ◮ stetige Zufallsvariablen besitzen Dichte und Verteilungsfunktion Dr. Hendrik Hansen 220 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Kapitel 10: Erwartungswert, Varianz und Kovarianz von Zufallsvariablen Motivation Erwartungswert: Welchen Wert nimmt Zufallsvariable durchschnittlich an? Populärstes Lagemaß aus Teil A: Arithmetisches Mittel ◮ Ausgangslage: Metrisch skaliertes Merkmal X mit möglichen Ausprägungen a1 , ..., ak , die mit relativen Häufigkeiten h(a1 ), ..., h(ak ) auftreten. Es gilt (vergleiche Definition 3.1 und Beispiel 3.2 a)) a x̄ = k X ai · h(ai ) i=1 → Idee: Ersetze relative Häufigkeiten durch bekannte Wahrscheinlichkeiten Dr. Hendrik Hansen 221 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Definition 10.1 a) Sei X diskrete Zufallsvariable mit möglichen Realisationen x1 , ..., xn und f (xi ) = P(X = xi ) Wahrscheinlichkeitsfunktion. Dann heißt X E (X) = xi · f (xi ) i∈I Erwartungswert von X (I =Indexmenge). b) Sei X stetige Zufallsvariable mit Dichte f (x). Dann heißt E (X) = Z∞ x · f (x) dx −∞ Erwartungswert von X. Dr. Hendrik Hansen 222 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 10.1 a) X = Augensumme zweimaliges Würfeln“, vgl. u.a. Bsp. 9.2 ” E (X) = X xi · f (xi ) = xi · f (xi ) i=1 i∈I = 2· 11 X 1 2 3 1 +3· +4· + . . . + 12 · =7 36 36 36 36 b) X = Anzahl Kopf bei zweimaligem Münzwurf“, vgl. Bsp. 9.1 ” E (X) = X i∈I = 0· Dr. Hendrik Hansen xi · f (xi ) = 3 X xi · f (xi ) i=1 2 1 1 +1· +2· =1 4 4 4 223 TU Dortmund Wintersemester 2010/2011 - Statistik für Ökonomen Beispiel 10.1 (Fortsetzung) c) X = Verspätung der S1“, vgl. Bsp. 9.4 ” E (X) = Z∞ −∞ x · f (x) dx = Z20 0 1 2 20 1 = 10 dx = x x· 20 40 0 Bemerkung a) Ist Wahrscheinlichkeitsfunktion/Dichte einer Zufallsvariablen X symmetrisch um x⋆ , dann gilt E (X) = x⋆ b) Der Erwartungswert einer diskreten Zufallsvariablen X muss nicht unbedingt mögliche Realisation xi von X sein c) Der Erwartungswert muss nicht notwendigerweise existieren, d. h. E (X) = ∞ ist möglich Dr. Hendrik Hansen 224