WAHRSCHEINLICHKEITSVERTEILUNGEN 2. Maßzahlen von

Werbung
WAHRSCHEINLICHKEITSVERTEILUNGEN
2. Maßzahlen von Zufallsvariablen
Häufig ist man nicht am gesamten Realisationsbereich einer Zufallsvariablen,
sondern lediglich an Bereichen hoher Wahrscheinlichkeit interessiert. Für die qualitative Untersuchung von Zufallsvariablen benötigt man entsprechend geeignete
Maß-/Kennzahlen.
Definition Der Erwartungswert E(X) einer diskreten Zufallsvariablen X : Ω → R
PN
PN
mit X(Ω) = {x1 , . . . , xN } ist E(X) = i=1 xi P (X = xi ) = i=1 xi f (xi ). Analog ist der
R ∞Erwartungswert einer stetigen
R ∞ Zufallsvariablen X mit Dichte f durch
E(X) = −∞ xf (x) dx definiert (falls −∞ |x|f (x) dx existiert). Besteht keine Verwechslungsgefahr, bezeichnet man den Erwartungswert häufig auch mit µ (sonst
µX ).
R∞
Bemerkung Existiert in der obigen Definition nämlich das Integral −∞ |x|f (x) dx,
so existiert auch der Erwartungswert. Im Allgemeinen braucht der Erwartungswert
zwar nicht zu existieren (z.B. bei der sog. Cauchy-Verteilung), aber wir gehen in
dieser Vorlesung stets davon aus, dass wir es lediglich mit Zufallsvariablen zu tun
haben, deren Erwartungswert existiert, ohne dies jedes Mal explizit zu erwähnen.
In der Regel wird der Wert, den X annimmt, mehr oder weniger vom Erwartungswert µ abweichen. Diese Abweichung wird beschrieben durch die Zufallsvariable X − µ. Um diese Abweichung zu untersuchen betrachtet man, statt z.B. den
Erwartungswert E(X − µ), die mathematisch besser geeignete Varianz.
Definition Ist X eine Zufallsvariable, so nennt man den Erwartungswert ihrer
quadratischen Abweichung von E(X) = µ die Varianz von X und bezeichnet diese
mit V (X), d.h. V (X) = E((X − µ)2 ) (falls existent). Besteht keine Verwechslungs2
2
gefahr,
p so bezeichnet man die Varianz häufig auch mit σ (sonst σX ). Die Größe
σ = V (X) heißt die Standardabweichung von X.
Um einen für die Praxis brauchbaren Ausdruck für die Berechnung der Varianz zu
bekommen, benötigen wir den folgenden Satz.
Satz Es sei X : Ω → R eine Zufallsvariable und g : X(Ω) → R stetig. Dann gilt
für die Zufallsvariable Y = g ◦ X : Ω → R
R∞
(i) Ist X stetig mit Dichte f , so ist E(Y ) = −∞ g(x)f (x) dx (falls existent).
PN
(ii) Ist X diskret mit X(Ω) = {x1 , . . . , xN }, so ist E(Y ) = i=1 g(xi )f (xi ).
Als direkte Konsequenz erhalten wir nun entsprechende Ausdrücke für die Varianz einer Zufallsvariablen, indem wir im obigen Satz g(x) = (x − µ)2 setzen.
Folgerungen
(i) Ist X eine stetige
R ∞ Zufallsvariable mit Dichte f und Erwartungswert µ, so
gilt V (X) = −∞ (x − µ)2 f (x) dx (falls existent).
(ii) Ist X eine diskrete Zufallsvariable mit Realisationsmenge X(Ω) = {x1 , . . . , xN }
und Wahrscheinlichkeitsverteilung f (xi ) = P (X = xi ) sowie ErwartungsPN
wert E(X) = µ, so gilt V (X) = i=1 (xi − µ)2 f (xi ).
(iii) Es gilt der sogenannte Verschiebungssatz V (X) = E(X 2 ) − (E(X))2 .
Oft ist man hauptsächlich an Bereichen hoher Wahrscheinlichkeiten interessiert.
Hierfür benötigt man dann die Grenzen der entsprechenden Wertebereiche.
Definition Für eine Zufallsvariable X, nennen wir einen Wert ξα , der die Gleichung
P (X ≤ ξα ) = α für α ∈ (0, 1) erfüllt, ein α-Quantil von X. Ein 0.5-Quantil wird
auch als Median bezeichnet.
Bemerkungen
(i) Man bezeichnet die Quantile oft auch mit den entsprechenden Prozentzahlen, d.h. man spricht beispielsweise bei ξ0.75 auch vom 75%-Quantil und ein
0.2-Quantil ist dasselbe wie ein 20%-Quantil.
(ii) Im Allgemeinen muss ein Quantil nicht existieren oder eindeutig sein.
(iii) Ist X stetig mit stetiger Dichte f , so existieren alle Quantile. Ist zudem
die Verteilungsfunktion F umkehrbar, so ist ξα (eindeutig) gegeben durch
ξα = F −1 (α).
Eine wichtige Beobachtung bei der Untersuchung von Zufallsvariablen liefert der
sogenannte Zentrale Grenzwertsatz.
Satz (Zentraler Grenzwertsatz)
Es seien X1 , . . . , Xn : Ω → R unabhängige und identisch verteilte Zufallsvariablen
mit Erwartungswert
µ und Varianz σ 2 . Dann ist für hinreichend großes n die SumPn
me Y = i=1 Xi annähernd normalverteilt mit Erwartungswert E(Y ) = nµ und
−µ
Varianz V (Y ) = nσ 2 . Insbesodere ist dann die standardisierte Variable Z = Yσ√
n
annähernd standardnormalverteilt.
Bemerkungen
(i) Die Näherung ist meistens bereits für n ≥ 30 brauchbar.
(ii) Die Voraussetzungen des Satzes sind insbesondere erfüllt, wenn man ein
Experiment hinreichend oft durchführt. Ganz allgemein nennt man Zufallsvariablen X1 , . . . , Xn : Ω → R unabhängig, falls
P ({X1 = x1 } ∩ . . . ∩ {Xn = xn }) = P (X1 = x1 ) · . . . · P (Xn = xn )
für alle x1 , . . . , xn ∈ R gilt.
(iii) Sind alle Xi normalverteilt, so ist auch Y normalverteilt.
Herunterladen