WAHRSCHEINLICHKEITSVERTEILUNGEN 1. Zufallsvariablen Zur Formalisierung ist es oft zweckmäßig sich etwas von den konkreten Experimenten zu entfernen und/oder die jeweils interessanten Daten aus den Ergebnissen zu filtern. Hierfür stehen einem Zufallsvariablen zur Verfügung. Definition Eine Funktion X : Ω → R bezeichnet man als Zufallsvariable. Die Werte X(ω), für ω ∈ Ω, nennt man Realisationen der Zufallsvariablen. Es gibt verschiedene Arten von Zufallsvariablen. Man unterscheidet hierbei, ob sie ein diskretes oder ein kontinuierliches Merkmal beschreiben. Definition Wir nennen eine Zufallsvariable diskret, falls das Bild X(Ω) ⊂ R endlich ist. In diesem Fall schreiben wir X(Ω) = {x1 , . . . , xN } und setzen pi := P (X −1 (xi )) =: P (X = xi ), wobei X −1 (xi ) = {ω ∈ Ω : X(ω) = xi } ⊂ Ω das Urbild von xi unter X bezeichnet. Die Funktion f : X(Ω) → R, definiert durch f (xi ) = pi nennt man dann die Wahrscheinlichkeitsverteilung von X und es gilt n n n X X [ f (xi ) = P (X −1 (xi )) = P ( X −1 (xi )) = P (Ω) = 1. i=1 i=1 i=1 Üblicherweise erweitert man den Definitionsbereich von f auf ganz R durch f (x) = P (X −1 (x)) = P (∅) = 0 für x ∈ / X(Ω). Mit dieser Konvention betrachten wir zukünftig stets f : R → R. Bemerkung In der Literatur ist es üblich, für eine diskrete Zufallsvariable sogar eine abzählbar unendliche Wertemenge X(Ω) zuzulassen. Da es keinen großen Unterschied macht und es bei unseren Anwendungen in der Regel nur endlich viele mögliche Ausgänge der betrachteten Zufallsexperimente gibt, beschränken wir uns in dieser Vorlesung jedoch auf obige Definition. Beispiel (Binomialverteilung) Zufallsexperimente, bei denen nur zwei Ausgängen möglich sind, werden Bernoulli-Experimente genannt. Der Ereignisraum kann dann durch Ω = {E, E} mit P (E) = p und P (E) = 1 − p =: q für 0 ≤ p ≤ 1 beschrieben werden. e : Ω → R mit X(E) e e Führen wir dann die Zufallsvariable X = 1, X(E) = 0 ein, so ist e X(Ω) = {0, 1} und die entsprechende Wahrscheinlichkeitsverteilung f (1) = P (E) = p, f (0) = P (E) = q heißt die zugehörige Zweipunktverteilung mit Parameter p. Wiederholen wir nun ein solches Experiment n-mal (unabhängig voneinander), so erhalten wir ein sogenanntes n-stufiges Bernoulli-Experiment. Bei jeder einzelnen Wiederholung tritt dann entweder E oder E ein und wir können uns fragen, wie hoch die Wahrscheinlichkeit dafür ist, dass das Ereignis E genau k-mal eintritt. Dafür betrachten wir die Zufallsvariable X = Anzahl der Wiederholungen mit Ausgang E “ ” und überlegen uns, dass für k ∈ {0, 1, . . . , n} die zugehörige Wahrscheinlichkeitsverteilung gegeben ist durch n k n k n−k f (k) = P (X = k) = p (1 − p)n−k = p q . k k Insbesondere gilt daher n 1 = (p + (1 − p)) = n X n k=0 k pk (1 − p)n−k = n X P (X = k). k=0 Die Wahrscheinlichkeitsverteilung f (k) = nk pk (1 − p)n−k heißt Binomialverteilung und wird meistens mit Bn,p (k) bezeichnet. Man schreibt dann oft kurz einfach X ∼ Bn,p , um auszudrücken, dass die Zufallsvariable entsprechend binomialverteilt ist. Aber nicht alle Zufallsexperimente können durch diskrete Zufallsvariablen beschrieben werden. Bei kontinuierlichen Merkmalen benötigt man eine weitere Klasse von Zufallsvariablen. Definition Eine Zufallsvariable X : Ω → R nennt man stetig, falls die Menge X(Ω) ihrer Realisationen ein echtes Intervall enthält und falls es eine Funktion f : R → R gibt, so dass für jedes Intervall [a, b] ⊂ R Z P (a ≤ X ≤ b) = b f (x) dx a gilt. Ein solches f heißt dann die zu X gehörende Dichte. Es gilt dann Z ∞ f (x) dx = P (Ω) = 1 −∞ (vgl. für diskrete Zufallsvariable X mit X(Ω) = {x1 , . . . , xN } ist PN i=1 P (X = xi ) = P (Ω) = 1) und es ist Z a P (X ≤ a) = f (x) dx. PN i=1 f (xi ) = −∞ Beispiele Eine Zufallsvariable X heißt (i) exponentialverteilt, falls die zugehörige Dichte von der Form ( c e−cx , x ≥ 0 f (x) = 0, x<0 für ein c > 0 ist. (ii) normalverteilt nach (der Normalverteilung) N (µ, σ 2 ), falls die zugehörige Dichte durch (x−µ)2 1 f (x) = √ e− 2σ2 σ 2π für σ > 0 gegeben ist. Für µ = 0 und σ = 1 erhält man die Dichte der Standardnormalverteilung N (0, 1), die man gewöhnlicherweise mit dem griechischen Buchstaben ϕ bezeichnet, x2 1 ϕ(x) = √ e− 2 . 2π Definition Ist X eine Zufallsvariable, so heißt die Funktion F : R → R, F (x) = P (X ≤ x), die Verteilungsfunktion von X. Falls nötig, bezeichnen wir die Verteilungsfunktion von X auch mit FX , um deutlich zu machen zu welcher Zufallsvariablen die Funktion gehört. Bemerkungen (i) Kennt man F , so kann man P (a ≤ X ≤ b) für jedes Intervall [a, b] berechnen (vgl. Übung). Rx (ii) Ist X stetig mit Dichte f , so ist F (x) = −∞ f (t) dt. P (iii) Ist X diskret mit X(Ω) = {x1 , . . . , xN }, so ist F (x) = {xi ≤x} f (xi ) = P {xi ≤x} P (X = xi ). Direkt aus der Definition der Verteilungsfunktion erhält man mit dem Hauptsatz der Differential- und Integralrechnung die folgende Aussage. Satz Überall wo die Dichte f einer stetigen Zufallsvariablen X stetig ist, existiert die Ableitung der zugehörigen Verteilungsfunktion F mit F 0 (x) = f (x). Beispiel Es sei X ∼ N (0, 1), d.h. standardnormalverteilt mit Dichte ϕ(x) = √1 2π e− x2 2 . Dann bezeichnet man die Verteilungsfunktion von X üblicherweise mit Rx t2 Φ und es gilt Φ(x) = P (X ≤ x) = √12π −∞ e− 2 dt, also insbesondere Φ0 (x) = ϕ(x). Dieses Integral ist nicht elementar/geschlossen lösbar, es gibt jedoch (durch Näherungsverfahren) sehr ausführliche Wertetabellen für Φ. In der Vorlesung wurde gezeigt, dass (und wie) man die Verteilungsfunktionen nach N (µ, σ 2 ) verteilter Zufallsvariablen auf die Verteilungsfunktion Φ der Standardnormalverteilung zurückführen kann. Es reicht daher die Werte der Funktion Φ zu kennen, um die Werte der Verteilungsfunktionen beliebig normalverteilter Zufallsvariablen zu berechnen. Satz Für eine normalverteilte Zufallsvariable X ∼ N (µ, σ 2 ) ist die sogenannte standardisierte Variable Y = X−µ standardnormalverteilt und es gilt σ x−µ x−µ FX (x) = P (X ≤ x) = P (Y ≤ ) = Φ( ). σ σ