Zufallsvariablen und deren Verteilungen Erinnerung Zufallsexperiment Datenerhebungsprozess mit nicht vorhersagbarem Ausgang Ergebnis ω Elementarer Ausgang eines Zufallsexperiments Grundraum Ω Menge aller möglichen Ergebnisse Ω ={ω| ω ist Ergebnis des Zufallsexperiments} Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ ω a X(ω ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 1 Zufallsvariablen und deren Verteilungen Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ ω a X(ω ) Beispiel Würfelwurf Zufallsvariable Augenzahl: X1(ω) = ω Ω X1 -1 0 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 2 3 4 5 6 ℜ 2 Zufallsvariablen und deren Verteilungen Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ ω a X(ω ) Beispiel Würfelwurf Zufallsvariable ungerade Augenzahl: X2(ω) = ω mod 2 Ω X2 -1 0 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 2 3 4 5 6 ℜ 3 Zufallsvariablen und deren Verteilungen Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ ω a X(ω ) Beispiel zweifacher Münzwurf: ωi = 1, falls i-ter Wurf Kopf, ωi = 0, sonst Zufallsvariable Anzahl Kopf: X([ω1, ω2]) = ω1 + ω2 Ω X -1 0 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 2 3 4 5 6 ℜ 4 Zufallsvariablen und deren Verteilungen Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ Version ω a X(ω ) 1.1 Beispiel zufällige Auswahl der Bearbeitung von Softwareaufgaben ZV Version: ωi =ei , X(ωi) = {0, falls X3;i=1.1; 1, falls X3;i=1.2; 2, falls X3;i=2.0} 1.2 1.1 1.2 2.0 Ω e12 e11 X e5 1.2 1.2 e9 e8 e10 e7 e3 e6 e4 e2 1.2 1.2 1.1 e1 2.0 -1 0 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 2 3 4 5 6 ℜ 2.0 5 Zufallsvariablen und deren Verteilungen Zufallsvariable Eine Abbildung, die jedem Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet, wird Zufallsvariable genannt. Ein konkreter Wert x = X(ω) heißt Realisation der Zufallsvariable X. X : Ω→ℜ ω a X(ω ) Beispiel Mausaktivität: ω(t) = [x(t), y(t), c(t)] X(ω ) = [x(t2 ) − x(t1 )]2 + [y(t2 ) − y(t1 )]2 ZV Distanz zwischen ersten 2 Mausclicks t1 = min(t | c(t) > 0), t2 = min(t | c(t) > 0, t > t1 ) Ω X t1x t x2 x t2 t1 x … -1 0 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 2 3 4 5 6 ℜ 6 Zufallsvariablen und deren Verteilungen Mehrdimensionale Zufallsvariable Ein k-Tupel (X1,…,Xk) von Zufallsvariablen X1,…,Xk heißt mehrdimensionale Zufallsvariable Beispiel Mausaktivität X(ω ) = [x(t2 ) − x(t1 )]2 + [y(t2 ) − y(t1 )]2 t2 −1 X = Distanz zwischen ersten 2 Mausclicks Y(ω ) = ∑ [x(t + 1) − x(t)]2 + [y(t + 1) − y(t)]2 Y = zurückgelegte Strecke zwischen t = t1 ersten 2 Mausclicks t = min(t | c(t) > 0), t = min(t | c(t) > 0, t > t ) 1 2 1 Y Ω t1x t x2 x t2 t1 x -1 0 1 2 3 4 5 6 ℜ -1 0 1 2 3 4 5 6 ℜ … X Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 7 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die durch die Zufallsvariable definierte Abbildung von beliebigem Grundraum Ω auf die reellen Zahlen erlaubt die Zuordnung von Wahrscheinlichkeiten zu Teilmengen von ℜ. X Ω abzählbar ω1 Ω ω2 ω3 ω4 B = {X(A)} P(A) = P(B) = Σωi ∈AP({ωi}) ω5 A ={ω∈Ω |X(ω)∈B} ⇒ ω∈A ⇔ X(ω)∈B -1 Ω überabzählbar 0 1 2 X 3 4 5 6 ℜ B = {X(A)} P(A) = P(B) = ∫AP(t)dt Ω A ={ω∈Ω |X(ω)∈B} ⇒ ω∈A ⇔ X(ω)∈B -1 0 1 2 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 3 4 5 6 ℜ 8 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Diese Verteilung ist eindeutig definiert, wenn PX(Bx) für jedes Intervall der Form Bx = (-∞,x] bekannt ist. Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 9 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Diese Verteilung ist eindeutig definiert, wenn PX(Bx) für jedes Intervall der Form Bx = (-∞,x] bekannt ist: B = {x 1 } = lim ({Bx1 \ Bx1 −ε }) ⇒ PX (B) = lim[P X (Bx1 ) − PX (Bx1 −ε )] , da B x1 −ε ⊂ B x1 ε↓ 0 ε↓ 0 k k X X (−∞ , x − ε] x 1 ≠ ... ≠ x k : B xB−ε == {x \ B }) ⇒ P (B) = lim [P (B ) − P (Bx i −ε )] x1x-ε ∑ 1 ,...,1x k } = U lim ({B x − ε x ε i i i X 1 i=1 ε↓ 0 i=1 ε↓ 0 B x 1 \ B x 1 −ε B x1 = (−∞ , x 1 ] 2 3 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 4 x1 5 ℜ 10 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Diese Verteilung ist eindeutig definiert, wenn PX(Bx) für jedes Intervall der Form Bx = (-∞,x] bekannt ist: B = {x 1 } = lim ({Bx1 \ Bx1 −ε }) ⇒ PX (B) = lim[P X (Bx1 ) − PX (Bx1 −ε )] , da B x1 −ε ⊂ B x1 ε↓ 0 ε↓ 0 k k x 1 ≠ ... ≠ x k : B = {x 1 ,..., x k } = U lim ({Bxi \ B x i −ε }) ⇒ P (B) = ∑ lim[P X (Bxi ) − PX (Bx i −ε )] X i=1 ε↓ 0 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker i=1 ε↓ 0 11 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Diese Verteilung ist eindeutig definiert, wenn PX(Bx) für jedes Intervall der Form Bx = (-∞,x] bekannt ist: x 1 < x 2 : B = (x 1 , x 2 ] = B x2 \ Bx1 ⇒ PX (B) = PX (Bx2 ) − PX (Bx1 ) , da B x1 ⊂ Bx 2 B x 1 +1/t = (−∞ , x 2 ] x2 B = Bx2 \ Bx1 x1 B x1 = (−∞ , x 1 ] 2 3 4 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 5 ℜ 12 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Diese Verteilung ist eindeutig definiert, wenn PX(Bx) für jedes Intervall der Form Bx = (-∞,x] bekannt ist: B = {x 1 } = lim ({Bx1 \ B x1 −ε }) ⇒ PX (B) = lim[P X (Bx1 ) − PX (Bx1 −ε )] , da Bx1 −ε ⊂ B x1 ε↓ 0 ε↓ 0 k k x 1 ≠ ... ≠ x k : B = {x 1 ,..., x k } = U lim ({Bx1 \ B x1 −ε }) ⇒ P (B) = ∑ lim[P X (Bxi ) − PX (Bx i −ε )] X i=1 ε↓0 i=1 ε↓ 0 x 1 < x 2 : B = (x 1 , x 2 ] = B x2 \ Bx1 ⇒ PX (B) = PX (Bx 2 ) − PX (Bx1 ) , da Bx1 ⊂ B x2 ... Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 13 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer Zufallsvariablen X ist definiert durch PX(B) = P(X∈B) = P({ω∈Ω|X(ω)∈B}), B ⊆ ℜ Die Funktion F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, wird Verteilungsfunktion von X genannt. Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 14 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Die Funktion F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, wird Verteilungsfunktion von X genannt. Die Entsprechung der Verteilungsfunktion in der deskriptiven Statistik ist die empirische Verteilungsfunktion, bei der an die Stelle von Wahrscheinlichkeiten kumulierte relative Häufigkeiten treten. 0 falls x < x(1) # {x n | x n ≤ x(j)} FN (x) = ~ ~ s = mit j = max{ j | x( j ) ≤ x} falls x(1) ≤ x j N = # {x n | x n ≤ x} N Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 15 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, Eigenschaften der Verteilungsfunktion (A) lim F(x) = 0 , lim F(x) = 1 x → −∞ x → +∞ Beweis lim F(x) = lim P({ω ∈ Ω | X(ω ) ∈ (−∞, x] ∩ ℜ}) = P({ω ∈ Ω | X(ω ) ∈ { −∞} ∩ ℜ}) x → −∞ x → −∞ = P({ω ∈ Ω | X(ω ) = ∅}) = P(∅) = 0 * * ω ∈ Ω ⇒ X(ω ) ∈ ℜ ⇔ X(ω ) ∉ ℜ ⇒ ω ∉ Ω lim F(x) = lim P({ω ∈ Ω | X(ω ) ∈ (−∞, x] ∩ ℜ}) = P({ω ∈ Ω | X(ω ) ∈ ℜ}) = P(Ω ) = 1 x →∞ x →∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 16 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, Eigenschaften der Verteilungsfunktion (A) lim F(x) = 0 , lim F(x) = 1 x → −∞ x → +∞ (B) x < y ⇒ F(x) ≤ F(y) F(x) = P(A) mit A = {ω ∈ Ω | X(ω ) ≤ x} F(y) = P(B) mit B = {ω ∈ Ω | X(ω ) ≤ y} x < y ⇒ A ⊆ B ⇒ P(A) ≤ P(B) ⇔ F(x) ≤ F(y) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 17 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, Eigenschaften der Verteilungsfunktion (A) lim F(x) = 0 , lim F(x) = 1 x → −∞ x → +∞ (C) lim F(x) = F(z) x ↓z (B) x < y ⇒ F(x) ≤ F(y) Beweis : Setze A n = {ω ∈ Ω | X(ω ) ∈ (-∞ , z + 1/n]}, A 0 = Ω ∞ ⇒ A = I A n = {ω ∈ Ω | X(ω ) ∈ (-∞ , z]}, A n ⊂ A n-1 , A nC-1 ⊂ A nC , n = 1,2,... n=1 ∞ N ∞ ∞ C C C F(z) = P(A) = P I A n = 1 − P U A n = 1 − ∑ P(An \ A n-1 ) = 1 - lim ∑ P(AnC \ A nC-1 ) N↑ ∞ n=1 n=1 n=1 n=1 = 1 - lim P(ANC ) = lim P(AN ) = lim F(x) N↑ ∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker N↑ ∞ x ↓z 18 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, Eigenschaften der Verteilungsfunktion (A) lim F(x) = 0 , lim F(x) = 1 (C) lim F(x) = F(z) (B) x < y ⇒ F(x) ≤ F(y) (D) P(a < X ≤ b) = F(b) − F(a) x → −∞ x → +∞ x ↓z Beweis : Setze A = {ω ∈ Ω| X(ω ) ∈ (−∞, a]} und B = {ω ∈ Ω| X(ω ) ∈ (−∞, b]} ⇒ P(a < X ≤ b) = P({ω ∈ Ω | X(ω ) ∈ (a, b]}) = P(B \ A) = P(B) − P(A) = P(X ≤ b) − P(X ≤ a) = F(b) − F(a) A ⊆B Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 19 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ, Eigenschaften der Verteilungsfunktion (A) lim F(x) = 0 , lim F(x) = 1 (C) lim F(x) = F(z) (B) x < y ⇒ F(x) ≤ F(y) (D) P(a < X ≤ b) = F(b) − F(a) x → −∞ x → +∞ x ↓z (E) P(X > a) = 1 − F(a) Beweis Setze A = {ω ∈ Ω | X(ω ) ≤ a} ⇒ A C = {ω ∈ Ω | X(ω ) > a} ⇒ P(X > a) = P(A C ) = 1 − P(A) = 1 − F(a) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 20 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ 1 F(x) 0 x1 xk Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 21 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n (A) lim F(x) = 0 , lim F(x) = 1 x → −∞ x → +∞ F(x) = P(A x ) mit A x = {ω ∈ Ω | X(ω ) ∈ (−∞ , x] ∩ {x1 ,..., xk }} x < x 1 ⇒ A x = ∅ ⇒ P(A x ) = 0 x ≥ xk ⇒ A x = Ω ⇒ P(A x ) = 1 1 F(x) 0 x1 xk Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 22 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n (C) lim F(x) = F(z) x ↓z F(x) = P(A x ) mit A x = {ω ∈ Ω | X(ω ) ∈ (−∞, x] ∩ {x1 ,..., xk }} i = 1,..., n - 1 : x i ≤ x < x i+1 ⇒ A x = {ω ∈ Ω | X(ω ) ∈ {x 1 ,..., x i }} ⇒ P(A x ) = F(xi ) 1 F(x) 0 x1 xi Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker xk 23 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n (D) P(a < X ≤ b) = F(b) − F(a) Ab \ A a = {ω ∈ Ω | X(ω ) ∈ {x1 ,..., xk }, a < X(ω ) ≤ b} P( a < X ≤ b ) = P(Ab \ A a ) = F(b) − F(a) 1 F(x) 0 x1 a Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker b xk 24 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n (D) i = 1,..., n : P(x i-1 < X ≤ x i ) (x 0 = −∞) A xi \ A x i-1 = {ω ∈ Ω | X(ω ) ∈ {x i }} P( x i-1 < X ≤ x i ) = P(A xi \ A xi-1 ) = P(X = x i ) = pi 1 F(x) 0 x1 xi-1 xi Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker xk 25 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n (D) i = 1,..., n : P(x i-1 < X ≤ x i ) (x 0 = −∞) A xi \ A x i-1 = {ω ∈ Ω | X(ω ) ∈ {x i }} P( xi-1 < X ≤ xi ) = P(A xi \ A xi-1 ) = P(X = xi ) = p(xi ) 1 F(x) 0 x1 xk Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 26 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n Die Funktion p: ℜ→[0,1] mit p(x) = P(X = x) heißt Zähldichte von X p(x) 0 x1 xk Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 27 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {x1 , ..., xk } mit − ∞ < x1 < ... < xk < ∞ , k ≤ n Die Funktion p: ℜ→[0,1] mit p(x) = P(X = x) heißt Zähldichte von X F(x ) − F(x i−1 ) , x ∩ {x1 ,..., xk } = {x i } p(x) = i 0 , x ∩ {x1 ,..., xk } ≠ ∅ p(x) 0 x Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 28 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: Anzahl Kopf beim 5-fachen Münzwurf Zähldichte x 0 1 2 3 4 5 10/32 5/32 1/32 Ax = {ω∈Ω| X(ω)=x} p(x)=P(X=x) =|Ax|/|Ω| 1/32 5/32 10/32 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 29 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: Anzahl Kopf beim 5-fachen Münzwurf Zähldichte x 0 1 2 p(x)=P(X=x) 1/32 5/32 10/32 3 4 5 10/32 5/32 1/32 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 30 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: Anzahl Kopf beim 5-fachen Münzwurf Zähldichte und Verteilungsfunktion x 0 1 2 p(x)=P(X=x) x F(x) = P(X ≤ x) = ∑ p(i) 1/32 + = 1/32 5/32 = 6/32 + 10/32 = 16/32 3 10/32 + = 26/32 4 5 5/32 + + = 31/32 1/32 = 32/32 i=0 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 31 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 32 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ (C) lim F(x) = F(z) = lim F(x) x ↓z x ↑z F(z) x↑z x↓z z Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 33 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ (C) lim F(x) = F(z) = lim F(x) x ↓z x ↑z (D) P( a < X ≤ b ) = F(b) − F(a) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 34 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ (C) lim F(x) = F(z) = lim F(x) x ↓z x ↑z (D) P( a < X ≤ b ) = F(b) − F(a) P(X = b) = lim P( a < X ≤ b ) a↑b = F(b) − lim F(a) = F(b) - F(a) = 0 a↑b Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 35 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ (C) lim F(x) = F(z) = lim F(x) x ↓z x ↑z (D) P( a < X ≤ b ) = F(b) − F(a) (F) P(X = x) = 0 , x ∈ ℜ (G) P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) − F(a) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 36 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Vergleich der Wahrscheinlichkeiten zu gleich breiten Intervallen P(0 < X ≤ 100) < P(150 < X ≤ 250) X „verdichtet“ sich stärker zwischen 150 und 250 als zwischen 0 und 100 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 37 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Vergleich der W‘keiten zu unterschiedlich breiten Intervallen P(0 < X ≤ 100) P(150 < X ≤ 200) < 100 50 X „verdichtet“ sich stärker zwischen 150 und 200 als zwischen 0 und 100 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 38 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Zwar gilt lim P( a < X ≤ b ) = 0 a→b Allerdings kann für diff.-bares F der Grenzwert der „Verdichtung“ von X für unendlich kleine Intervalle (a,b] i.A. >0 sein. lim c↓0 F(x + c) − F(x) c Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 39 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Zwar gilt lim P( a < X ≤ b ) = 0 a→b Allerdings kann für diff.-bares F der Grenzwert der „Verdichtung“ von X für unendlich kleine Intervalle (a,b] i.A. >0 sein. lim c↓0 F(x + c) − F(x) c Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 40 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Zwar gilt lim P( a < X ≤ b ) = 0 a→b Allerdings kann für diff.-bares F der Grenzwert der „Verdichtung“ von X für unendlich kleine Intervalle (a,b] i.A. >0 sein. lim c↓0 F(x + c) − F(x) c Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 41 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Zwar gilt lim P( a < X ≤ b ) = 0 a→b Allerdings kann für diff.-bares F der Grenzwert der „Verdichtung“ von X für unendlich kleine Intervalle (a,b] i.A. >0 sein. lim c↓ 0 F(x + c) − F(x) = F' (x) = f(x) c x Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 42 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : X(ω ) ∈ B, B ⊆ ℜ F = FX : ℜ → [0,1] mit F(x) = PX((–∞,x]) = P(X ≤ x) = P({ω∈Ω|X(ω) ≤ x}), x∈ℜ Zwar gilt lim P( a < X ≤ b ) = 0 a→b lim c↓ 0 F(x + c) − F(x) = F' (x) = f(x) c Die Funktion f(x) wird Dichtefunktion bzw. Dichte von X genannt. x Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 43 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) x F' (x) = f(x), F(x) = ∫ f(t)dt, x ∈ ℜ, −∞ ∞ ∫ f(t)dt = 1 z P(X ≤ z ) = F( z ) = ∫ f(t)dt −∞ −∞ F(z) F(z) z z Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 44 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) x F' (x) = f(x), F(x) = ∫ f(t)dt, x ∈ ℜ, −∞ ∞ ∫ f(t)dt = 1 b P( a < X ≤ b ) = F( b ) − F( a ) = ∫ f(t)dt a −∞ F(b) F(b)F(a) F(a) a b a Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker b 45 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit P(T < tmin ) = 0 = F(tmin ) ⇒ F(t) = 0, t ≤ tmin P(T > tmax ) = 0 = 1 − F(tmax ) ⇒ F(t) = 1, t ≥ tmax Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 46 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = 1, t ≥ tmax Teile [tmin, tmax] in i gleich lange Intervalle der Länge ci=(tmax-tmin)/i auf. Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 47 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = 1, t ≥ tmax T fällt nach Annahme in jedes dieser Intervalle mit der gleichen W‘keit pi, d.h. P(tmin + (j − 1)ci < T ≤ tmin + jci ) = pi , j = 1,..., i Wegen P(tmin< T ≤tmax)=1 gilt damit: i ∑p i = 1 ⇒ pi = 1/i j=1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 48 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = 1, t ≥ tmax P(tmin + (j − 1)ci < T ≤ tmin + jci ) = pi , j = 1,..., i Wegen P(tmin< T ≤tmax)=1 gilt damit: i ∑p i = 1 ⇒ pi = 1/i j=1 z.B. für j = 1 : pi = P(T ≤ tmin + (tmax − tmin )/i) = 1/i , i > 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 49 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = 1, t ≥ tmax P(tmin + (j − 1)ci < T ≤ tmin + jci ) = pi , j = 1,..., i Wegen P(tmin< T ≤tmax)=1 gilt damit: i ∑p i = 1 ⇒ pi = 1/i j=1 z.B. für j = 1 : pi = P(T ≤ tmin + (tmax − tmin )/i) = 1/i , i > 1 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 50 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = 1, t ≥ tmax pi = P(T ≤ tmin + (tmax − tmin )/i) = 1/i , i > 1 Setze t = tmin + (tmax − tmin )/i ⇒ i = ⇒ P(T ≤ t) = F(t) = Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker tmax − tmin t − tmin t − tmin , tmin < t < tmax tmax − tmin 51 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = t − tmin , tmin < t < tmax tmax − tmin F(t) = 1, t ≥ tmax Wahrscheinlichkeitsdichte t ≤ tmin : F' (t) = f(t) = ∂ 0/∂t = 0 tmin < t < tmax : t - tmin 1 /∂t = F' (t) = f(t) = ∂ tmax - tmin tmax - tmin t ≤ tmin : F' (t) = f(t) = ∂1/∂t = 0 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 52 Zufallsvariablen und deren Verteilungen Verteilung eindimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, exakter Zeitpunkt T des ersten Mausclicks Annahme: T fällt in jedes Intervall gleicher Länge c zwischen tmin und tmax mit derselben Wahrscheinlichkeit F(t) = 0, t ≤ tmin F(t) = F(t) = 1, t ≥ tmax t − tmin , tmin < t < tmax tmax − tmin f(t) = 0, t ≤ tmin F(t) = f(t) = 0, t ≥ tmax 1 , tmin < t < tmax tmax − tmin Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 53 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen Die Wahrscheinlichkeitsverteilung oder kurz Verteilung einer zweidimensionalen Zufallsvariablen (X,Y) ist definiert durch P(X,Y)(B) = P((X,Y)∈B) = P({ω∈Ω|(X(ω), Y(ω))∈B}), B ⊆ ℜ2 Die Funktion F = F(X,Y) : ℜ2 → [0,1] mit F(x,y) = P(X,Y)((–∞,x] ×(–∞,y]) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ, wird Verteilungsfunktion von (X,Y) genannt. Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 54 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P(X,Y)(B) = P((X,Y)∈B) = P({ω∈Ω|(X(ω), Y(ω))∈B}), B ⊆ ℜ2 F(x,y) = P(X,Y)((–∞,x] ×(–∞,y]) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ Eigenschaften 1. lim F(x, y) = lim F(x, y) = lim F(x, y) = 0 , lim F(x, y) = 1 x → −∞ y → −∞ x, y → −∞ x,y →∞ Beweis A = {ω ∈ Ω | X(ω ) ≤ x, Y(ω ) ≤ y} = A x ∩ A y mit A x = {ω ∈ Ω | X(ω ) ≤ x} A y = {ω ∈ Ω | Y(ω ) ≤ y} F(x, y) = P(A) = P(A x ∩ A y ) = 1 − P(A Cx ∪ A Cy ) lim F(x, y) = 1 − P(A C−∞ ∪ A Cy ) = 1 − P(Ω ∪ A Cy ) = 1 − [P(Ω ) + P(A Cy ) − P(A Cy )] = 1 − 1 = 0 x → −∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 55 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P(X,Y)(B) = P((X,Y)∈B) = P({ω∈Ω|(X(ω), Y(ω))∈B}), B ⊆ ℜ2 F(x,y) = P(X,Y)((–∞,x] ×(–∞,y]) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ Eigenschaften 1. lim F(x, y) = lim F(x, y) = lim F(x, y) = 0 , lim F(x, y) = 1 x → −∞ y → −∞ x, y → −∞ x,y →∞ 2. lim F(x, y) = FX (x) , lim F(x, y) = F Y (y) y →∞ x →∞ Beweis A = {ω ∈ Ω | X(ω ) ≤ x, Y(ω ) ≤ y} = A x ∩ A y mit A x = {ω ∈ Ω | X(ω ) ≤ x} A y = {ω ∈ Ω | Y(ω ) ≤ y} F(x, y) = P(A) = P(A x ∩ A y ) = 1 − P(A Cx ∪ A Cy ) lim F(x, y) = 1 − P(A C∞ ∪ A Cy ) = 1 − P(∅ ∪ A Cy ) = 1 − [P(A Cy )] = P(A y ) = F Y (y) x →∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 56 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P(X,Y)(B) = P((X,Y)∈B) = P({ω∈Ω|(X(ω), Y(ω))∈B}), B ⊆ ℜ2 F(x,y) = P(X,Y)((–∞,x] ×(–∞,y]) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ Eigenschaften 1. lim F(x, y) = lim F(x, y) = lim F(x, y) = 0 , lim F(x, y) = 1 x → −∞ y → −∞ x, y → −∞ x,y →∞ 2. lim F(x, y) = FX (x) , lim F(x, y) = F Y (y) y →∞ x →∞ Beweis lim F(x, y) = F Y (y) x →∞ lim F(x, y) = lim F Y (y) = 1 x , y →∞ Beweis für FX(x) analog. FX(x) und FY(y) heißen die Randverteilungen von X und Y y →∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 57 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P(X,Y)(B) = P((X,Y)∈B) = P({ω∈Ω|(X(ω), Y(ω))∈B}), B ⊆ ℜ2 F(x,y) = P(X,Y)((–∞,x] ×(–∞,y]) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ Eigenschaften 1. lim F(x, y) = lim F(x, y) = lim F(x, y) = 0 , lim F(x, y) = 1 x → −∞ y → −∞ x, y → −∞ x,y →∞ 2. lim F(x, y) = FX (x) , lim F(x, y) = F Y (y) y →∞ x →∞ 3. x 1 < x 2 ⇒ F(x1 , y) ≤ F(x 2 , y) , y 1 < y 2 ⇒ F(x, y 1 ) ≤ F(x, y 2 ) Beweis F(x i , y) = P(A i ) mit A i = {ω ∈ Ω | X(ω ) ≤ x i , Y(ω ) ≤ y} Beweis für F(x,y1) analog x 1 < x 2 ⇒ A 1 ⊆ A 2 ⇒ P(A1 ) ≤ P(A 2 ) ⇔ F(x1 , y) ≤ F(x 2 , y) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 58 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen F(x,y) = P( X ≤ x , Y ≤ y ) , x,y∈ℜ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 59 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = P( X ≤ x 2 , Y ≤ y 2 ) − P( X ≤ x 1 , Y ≤ y 2 ) − P( X ≤ x 2 , Y ≤ y 1 ) + P( X ≤ x 1 , Y ≤ y 1 ) = F(x 2 , y 2 ) − F(x1 , y 2 ) − F(x 2 , y 1 ) + F(x1 , y 1 ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 60 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = P( X ≤ x 2 , Y ≤ y 2 ) − P( X ≤ x 1 , Y ≤ y 2 ) − P( X ≤ x 2 , Y ≤ y 1 ) + P( X ≤ x 1 , Y ≤ y 1 ) = F(x 2 , y 2 ) − F(x1 , y 2 ) − F(x 2 , y 1 ) + F(x1 , y 1 ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 61 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = P( X ≤ x 2 , Y ≤ y 2 ) − P( X ≤ x 1 , Y ≤ y 2 ) − P( X ≤ x 2 , Y ≤ y 1 ) + P( X ≤ x 1 , Y ≤ y 1 ) = F(x 2 , y 2 ) − F(x1 , y 2 ) − F(x 2 , y 1 ) + F(x1 , y 1 ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 62 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = P( X ≤ x 2 , Y ≤ y 2 ) − P( X ≤ x 1 , Y ≤ y 2 ) − P( X ≤ x 2 , Y ≤ y 1 ) + P( X ≤ x 1 , Y ≤ y 1 ) = F(x 2 , y 2 ) − F(x1 , y 2 ) − F(x 2 , y 1 ) + F(x1 , y 1 ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 63 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen P( x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 ) = P( X ≤ x 2 , Y ≤ y 2 ) − P( X ≤ x 1 , Y ≤ y 2 ) − P( X ≤ x 2 , Y ≤ y 1 ) + P( X ≤ x 1 , Y ≤ y 1 ) = F(x 2 , y 2 ) − F(x1 , y 2 ) − F(x 2 , y 1 ) + F(x1 , y 1 ) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 64 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {X(ω1 ),..., X(ωn )} = {x 1 , ..., x n } mit − ∞ < x 1 ≤ ... ≤ x 2 < ∞ Y ∈ {Y(ω1 ),..., Y(ωn )} = {y 1 , ..., y n } mit − ∞ < y 1 ≤ ... ≤ y 2 < ∞ Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 65 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen Spezialfall diskrete Verteilungsfunktion (Ω abzählbar) Ω = {ω1 ,..., ωn } ⇒ X ∈ {X(ω1 ),..., X(ωn )} = {x 1 , ..., x n } mit − ∞ < x 1 ≤ ... ≤ x 2 < ∞ Y ∈ {Y(ω1 ),..., Y(ωn )} = {y 1 , ..., y n } mit − ∞ < y 1 ≤ ... ≤ y 2 < ∞ Die Funktion p: ℜ2→[0,1] mit p(x,y) = P(X = x, Y = y) heißt Zähldichte von (X,Y) x ∈ {x1 ,..., x n } F(x i , y i ) − F(x i−1 , y i ) , i p(x, y) = − F(x i , y i−1 ) + F(x i−1 , y i−1 ) y i ∈ {y 1 ,..., yn } 0 , sonst Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 66 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: 4-facher Münzwurf , X=Anzahl Kopf nach 4 Würfen, Y=Anzahl Kopf nach 2 Würfen Zähldichte ↓y x→ 0 1 2 3 4 0 1 2 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 67 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: 4-facher Münzwurf , X=Anzahl Kopf nach 4 Würfen, Y=Anzahl Kopf nach 2 Würfen Zähldichte ↓y x→ 0 1 2 3 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 4 0 1 1/16 2 p(x,y) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 68 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, diskrete Verteilungsfunktion Beispiel: 4-facher Münzwurf , X=Anzahl Kopf nach 4 Würfen, Y=Anzahl Kopf nach 2 Würfen Zähldichte ↓y x→ 0 1 2 3 4 1/16 + 2/16 + 1/16 0 = = 1/16 3/16 + 2/16 = 1 5/16 = 4/16 + + 4/16 + 2/16 = 10/16 + 1/16 2 p(x,y) F(x,y) = 12/16 + 2/16 + 1/16 = = 11/16 15/16 = 16/16 Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 69 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) ω ∈ Ω : (X(ω ), Y(ω )) ∈ B, B ⊆ ℜ 2 F = FXY : ℜ2 → [0,1] mit F(x) = P(X ≤ x, Y ≤ y) = P({ω∈Ω|X(ω) ≤ x, Y(ω) ≤ y}), x,y∈ℜ Die Funktion f: ℜ2 → [0,1] mit ∂ 2F(x, y) f(x, y) = ∂x∂y heißt die gemeinsame Dichtefunktion von X und Y. x y ∞ ∞ Es gilt: F(x, y) = P(X ≤ x, Y ≤ y) = ∫ ∫ f(s, t)dtds , ∫ ∫ f(s, t)dtds = 1 − ∞− ∞ − ∞− ∞ Die Randdichten fX und fY von X und Y sind definiert durch ∞ ∞ −∞ −∞ f X (x) = ∫ f(x, t) dt und f Y (y) = ∫ f(s, y)ds Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 70 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen Spezialfall stetige Verteilungsfunktion (Ω überabzählbar) F(x,y) f(x,y) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 71 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, interpolierte Mausposition (X,Y) zu exaktem Zeitpunkt t0 Annahme: (X,Y) fällt in jeden Quader mit gleichen Kantenlängen a und b zwischen 0 und xmax sowie 0 und ymax mit derselben Wahrscheinlichkeit P(X≤a, Y ≤b). (xmax,0) (0,0) b a b a b a (0,ymax) (xmax,ymax) Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 72 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, interpolierte Mausposition (X,Y) zu exaktem Zeitpunkt t0 Annahme: (X,Y) fällt in jeden Quader mit gleichen Kantenlängen a und b zwischen 0 und xmax sowie 0 und ymax mit derselben Wahrscheinlichkeit P(X≤a, Y ≤b). Randdichten 1/x max X f (x) = 0 1/ymax Y f (y) = 0 ,0 ≤ x ≤ x max , sonst ,0 ≤ y ≤ y max , sonst Gemeinsame Dichte , 0 ≤ x ≤ x max , 1/(x max y max ) f(x, y) = 0 ≤ y ≤ y max 0 sonst Randverteilungsfunktionen x/x max ,0 ≤ x ≤ x max X F (x) = , sonst 0 y/y max ,0 ≤ y ≤ y max Y F (y) = , sonst 0 Gemeinsame Verteilungsfunktion , 0 ≤ x ≤ x max , xy/(x max y max ) F(x, y) = 0 ≤ y ≤ y max 0 sonst Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 73 Zufallsvariablen und deren Verteilungen Verteilung mehrdimensionaler Zufallsvariablen, stetige Verteilungsfunktion Beispiel: Mausaktivität, interpolierte Mausposition (X,Y) zu exaktem Zeitpunkt t0 Gemeinsame Dichte , 0 ≤ x ≤ x max , 1/(xmax y max ) f(x, y) = 0 ≤ y ≤ y max 0 sonst Gemeinsame Verteilungsfunktion , 0 ≤ x ≤ x max , xy/(x max y max ) F(x, y) = 0 ≤ y ≤ y max 0 sonst Nils Raabe: Wahrscheinlichkeitsrechnung und mathematische Statistik für Informatiker 74