WAHRSCHEINLICHKEITSVERTEILUNGEN 2. Maßzahlen von Zufallsvariablen Häufig ist man nicht am gesamten Realisationsbereich einer Zufallsvariablen, sondern lediglich an Bereichen hoher Wahrscheinlichkeit interessiert. Für die qualitative Untersuchung von Zufallsvariablen benötigt man entsprechend geeignete Maß-/Kennzahlen. Definition Der Erwartungswert E(X) einer diskreten Zufallsvariablen X : Ω → R PN PN mit X(Ω) = {x1 , . . . , xN } ist E(X) = i=1 xi P (X = xi ) = i=1 xi f (xi ). Analog ist der R ∞Erwartungswert einer stetigen R ∞ Zufallsvariablen X mit Dichte f durch E(X) = −∞ xf (x) dx definiert (falls −∞ |x|f (x) dx existiert). Besteht keine Verwechslungsgefahr, bezeichnet man den Erwartungswert häufig auch mit µ (sonst µX ). R∞ Bemerkung Existiert in der obigen Definition nämlich das Integral −∞ |x|f (x) dx, so existiert auch der Erwartungswert. Im Allgemeinen braucht der Erwartungswert zwar nicht zu existieren (z.B. bei der sog. Cauchy-Verteilung), aber wir gehen in dieser Vorlesung stets davon aus, dass wir es lediglich mit Zufallsvariablen zu tun haben, deren Erwartungswert existiert, ohne dies jedes Mal explizit zu erwähnen. In der Regel wird der Wert, den X annimmt, mehr oder weniger vom Erwartungswert µ abweichen. Diese Abweichung wird beschrieben durch die Zufallsvariable X − µ. Um diese Abweichung zu untersuchen betrachtet man, statt z.B. den Erwartungswert E(X − µ), die mathematisch besser geeignete Varianz. Definition Ist X eine Zufallsvariable, so nennt man den Erwartungswert ihrer quadratischen Abweichung von E(X) = µ die Varianz von X und bezeichnet diese mit V (X), d.h. V (X) = E((X − µ)2 ) (falls existent). Besteht keine Verwechslungs2 2 gefahr, p so bezeichnet man die Varianz häufig auch mit σ (sonst σX ). Die Größe σ = V (X) heißt die Standardabweichung von X. Um einen für die Praxis brauchbaren Ausdruck für die Berechnung der Varianz zu bekommen, benötigen wir den folgenden Satz. Satz Es sei X : Ω → R eine Zufallsvariable und g : X(Ω) → R stetig. Dann gilt für die Zufallsvariable Y = g ◦ X : Ω → R R∞ (i) Ist X stetig mit Dichte f , so ist E(Y ) = −∞ g(x)f (x) dx (falls existent). PN (ii) Ist X diskret mit X(Ω) = {x1 , . . . , xN }, so ist E(Y ) = i=1 g(xi )f (xi ). Als direkte Konsequenz erhalten wir nun entsprechende Ausdrücke für die Varianz einer Zufallsvariablen, indem wir im obigen Satz g(x) = (x − µ)2 setzen. Folgerungen (i) Ist X eine stetige R ∞ Zufallsvariable mit Dichte f und Erwartungswert µ, so gilt V (X) = −∞ (x − µ)2 f (x) dx (falls existent). (ii) Ist X eine diskrete Zufallsvariable mit Realisationsmenge X(Ω) = {x1 , . . . , xN } und Wahrscheinlichkeitsverteilung f (xi ) = P (X = xi ) sowie ErwartungsPN wert E(X) = µ, so gilt V (X) = i=1 (xi − µ)2 f (xi ). (iii) Es gilt der sogenannte Verschiebungssatz V (X) = E(X 2 ) − (E(X))2 . Oft ist man hauptsächlich an Bereichen hoher Wahrscheinlichkeiten interessiert. Hierfür benötigt man dann die Grenzen der entsprechenden Wertebereiche. Definition Für eine Zufallsvariable X, nennen wir einen Wert ξα , der die Gleichung P (X ≤ ξα ) = α für α ∈ (0, 1) erfüllt, ein α-Quantil von X. Ein 0.5-Quantil wird auch als Median bezeichnet. Bemerkungen (i) Man bezeichnet die Quantile oft auch mit den entsprechenden Prozentzahlen, d.h. man spricht beispielsweise bei ξ0.75 auch vom 75%-Quantil und ein 0.2-Quantil ist dasselbe wie ein 20%-Quantil. (ii) Im Allgemeinen muss ein Quantil nicht existieren oder eindeutig sein. (iii) Ist X stetig mit stetiger Dichte f , so existieren alle Quantile. Ist zudem die Verteilungsfunktion F umkehrbar, so ist ξα (eindeutig) gegeben durch ξα = F −1 (α). Eine wichtige Beobachtung bei der Untersuchung von Zufallsvariablen liefert der sogenannte Zentrale Grenzwertsatz. Satz (Zentraler Grenzwertsatz) Es seien X1 , . . . , Xn : Ω → R unabhängige und identisch verteilte Zufallsvariablen mit Erwartungswert µ und Varianz σ 2 . Dann ist für hinreichend großes n die SumPn me Y = i=1 Xi annähernd normalverteilt mit Erwartungswert E(Y ) = nµ und −µ Varianz V (Y ) = nσ 2 . Insbesodere ist dann die standardisierte Variable Z = Yσ√ n annähernd standardnormalverteilt. Bemerkungen (i) Die Näherung ist meistens bereits für n ≥ 30 brauchbar. (ii) Die Voraussetzungen des Satzes sind insbesondere erfüllt, wenn man ein Experiment hinreichend oft durchführt. Ganz allgemein nennt man Zufallsvariablen X1 , . . . , Xn : Ω → R unabhängig, falls P ({X1 = x1 } ∩ . . . ∩ {Xn = xn }) = P (X1 = x1 ) · . . . · P (Xn = xn ) für alle x1 , . . . , xn ∈ R gilt. (iii) Sind alle Xi normalverteilt, so ist auch Y normalverteilt.