Erwartungswert

Kleiner Exkurs in die Mathematik
Erwartungswert einer diskreten Zufallsvariable:
Der Wertevorrat W = {x1,x2,x3,….,xm} der diskreten Zufallsvariable X sei endlich. Das zugehörige
Zufallsexperiment werde n-mal unabhängig durchgeführt, wobei die n Realisierungen der
Zufallsvariablen X zu einer Stichprobe vom Umfang n zusammengefaßt werden. Diese Stichprobe
kann dann in einer Häufigkeitstabelle für die m Merkmalsausprägungen x1, x2, …. ,xm dargestellt
werden mit den relativen Häufigkeiten rn(xi). Diese Stichprobe besitzt den Mittelwert
m
x = ∑ xi .rn ( xi )
i =1
.
Für große n gilt wegen rn(xi) ≈ P(X=xi) für alle I
m
x ≈ ∑ x i .P ( X = x i )
i =1
Die rechte Seite hängt nur mehr von der Verteilung der Zufallsvariable X ab, nicht mehr von (der
Größe) der Stichprobe. Diese Summe heißt Erwartungswert mit der exakten Definition:
Erwartungswert der diskreten Zufallsvariable X:
Die diskrete Zufallsvariable X besitze die Verteilung (xi, P(X=xi)), i = 1, 2, …; Dann heißt:
E ( X ) = µ = ∑ x i .P ( X = x i )
der Erwartungswert von X, falls
∑ x .P( X = x ) < ∞ ist.
i
i
Man sieht daher, daß der Erwartungswert E(X) einer Zufallsvariablen gleich dem Mittelwert der
zugrunde liegenden Verteilung ist. Mit steigendem n konvergiert der Mittelwert gegen den
Erwartungswert.
lim( x ) = µ
n→∞
Für die Praxis bedeutet dieser Umstand, daß die Bestimmung des Mittelwertes um so „genauer“ wird,
je größer unsere Stichprobe ist. Um die Genauigkeit bzw. die Ungenauigkeit des experimentell
bestimmten Mittelwertes zu kennen, muß man vorerst noch einen weiteren Parameter betrachten,
nämlich die Varianz V(X), bzw. die Standardabweichung σ(x).
Die Varianz selber ist wieder ein „Erwartungswert“ und zwar der Erwartungswert der Quadrate der
Abweichung vom Mittelwert, in genauer mathematischer Definition geschrieben als:
Die Varianz einer Zufallsvariable X ist der Erwartungswert von (X-µ)²; üblicherweise geschrieben als
V(X). Die Standardabweichung
σ = V (X ) .
[
]
V ( X ) = E ( X − µ) 2
= E( X ² − 2.µ. X + µ²)
= E( X ²) − 2µ.E( X ) + E(µ²)
= E( X ²) − 2µ² + µ²
= E( X ²) − µ²
in anderer Schreibweise:
ue biostatistik. deskriptive st., verteilungen
1/3
h.lettner/ physik
[
V ( X ) = E ( X − µ) 2
=
]
1 n
∑ ( X − µ) 2
n i =1
σ = V (X )
Achtung: Für die Berechnung der Varianz und der Standardabweichung nach diesem Verfahren ist die
Kenntnis des Erwartungswertes der Verteilung notwendig. Normalerweise ist das in experimentellen
Untersuchungen nicht der Fall, die Berechnung der Varianz und der Standardabweichung ist daher zu
modifizieren!
Experimentell ermittelte Varianz und Standardabweichung
n
V (X ) = S² =
∑(X
i =1
i
− X )²
n −1
Für die Berechnung der experimentell ermittelten Standardabweichung steht im Nenner n-1 im
Vergleich zu n für die Standardabweichung der zugrunde liegenden Verteilung. Warum ist das so ?
Betrachten wir zunächst die Berechnung der Summe der Abweichungsquadrate vom Mittelwert.
n
∑(X
i =1
− X )² = ∑ [( X i − µ) − ( X − µ)]²
n
i
i =1
=
∑ [( X
n
i =1
=
=
− µ)² + ( X − µ)² − 2.( X i − µ) ( X − µ)]
n
n
n
i =1
i =1
i =1
∑ ( X i − µ)² +∑ ( X − µ)² − 2.( X − µ)∑ ( X i − µ)
n
∑(X
i =1
=
i
i
− µ)² + n.( X − µ)² − 2n.( X − µ)²
i
− µ)² − n.( X − µ)²
n
∑(X
i =1
Unter Anwendung der Erwartungswerte auf beiden Seiten der Identität
[
 n

 n

E ∑ ( X i − X )²  = E ∑ ( X i − µ)²  − n.E ( X − µ)²
 i =1

 i =1

]
n
= ∑ E [( X i − µ)²] − n.V ( X ), weil E ( X ) = µ.
i =1
n
= ∑V ( X i ) − n.
i =1
σ2
n
= n.σ ² − σ ²
= (n − 1).σ ²
Durch Division beider Seiten durch (n-1):
ue biostatistik. deskriptive st., verteilungen
2/3
h.lettner/ physik
 n
2 
∑(X − X ) 
 = σ 2, n >1
E  i =1
n −1




erhalten wir die Standardabweichung der Verteilung.
Die Varianz einer Stichprobe mit den Realisierungen x1, x2, x3,….xn der Zufallsvariable X wird mit
S2 bezeichnet und definiert als:
n
s2 =
∑ (x − x)
2
i =1
n −1
, bzw. E ( s 2 ) = σ 2 = V ( X )
Der Erwartungswert der experimentell ermittelten Varianz ist also die Varianz der Verteilung, ein nicht
uninteressantes, vor allem aber nicht unwichtiges Ergebnis.
Varianz und Standardabweichung des Mittelwertes X
Alle X: X1, X2, ….., Xn sind unabhängige Zufallsvariablen mit der gleichen Varianz σ², dann ist
V ( X 1 + X 2 + ... + X n ) = V ( X 1 ) + V ( X 2 ) + .... + V ( X n )
= n.σ 2
Wenn U eine Zufallsvariable und a eine Konstante ist, dann ist V(a.U) = a².V(U).
Mit U = X1 + X2 + … + Xn und a = 1/n, ergeben diese Regeln:
V (X ) =
V ( X 1 + X 2 + ..... + X n )
n2
σ2
=
n
Die Varianz des Mittelwertes ist also genau um den Faktor 1/n kleiner als die Varianz der zugrunde
liegenden Verteilung. Die Standardabweichung des Mittelwertes X ist daher um den Faktor 1/√n
kleiner als die Standardabweichung von X.
Beispiel und Fragen
1.
Was ist der Erwartungswert beim Werfen eines Würfels mit den Zahlen 1,…,6.
2.
Was ist die Standardabweichung des Mittelwertes einer Probe mit n=20, n = 50. Stellen Sie den
funktionellen Zusammenhang s = f(n) graphisch dar.
ue biostatistik. deskriptive st., verteilungen
3/3
h.lettner/ physik