Kleiner Exkurs in die Mathematik Erwartungswert einer diskreten Zufallsvariable: Der Wertevorrat W = {x1,x2,x3,….,xm} der diskreten Zufallsvariable X sei endlich. Das zugehörige Zufallsexperiment werde n-mal unabhängig durchgeführt, wobei die n Realisierungen der Zufallsvariablen X zu einer Stichprobe vom Umfang n zusammengefaßt werden. Diese Stichprobe kann dann in einer Häufigkeitstabelle für die m Merkmalsausprägungen x1, x2, …. ,xm dargestellt werden mit den relativen Häufigkeiten rn(xi). Diese Stichprobe besitzt den Mittelwert m x = ∑ xi .rn ( xi ) i =1 . Für große n gilt wegen rn(xi) ≈ P(X=xi) für alle I m x ≈ ∑ x i .P ( X = x i ) i =1 Die rechte Seite hängt nur mehr von der Verteilung der Zufallsvariable X ab, nicht mehr von (der Größe) der Stichprobe. Diese Summe heißt Erwartungswert mit der exakten Definition: Erwartungswert der diskreten Zufallsvariable X: Die diskrete Zufallsvariable X besitze die Verteilung (xi, P(X=xi)), i = 1, 2, …; Dann heißt: E ( X ) = µ = ∑ x i .P ( X = x i ) der Erwartungswert von X, falls ∑ x .P( X = x ) < ∞ ist. i i Man sieht daher, daß der Erwartungswert E(X) einer Zufallsvariablen gleich dem Mittelwert der zugrunde liegenden Verteilung ist. Mit steigendem n konvergiert der Mittelwert gegen den Erwartungswert. lim( x ) = µ n→∞ Für die Praxis bedeutet dieser Umstand, daß die Bestimmung des Mittelwertes um so „genauer“ wird, je größer unsere Stichprobe ist. Um die Genauigkeit bzw. die Ungenauigkeit des experimentell bestimmten Mittelwertes zu kennen, muß man vorerst noch einen weiteren Parameter betrachten, nämlich die Varianz V(X), bzw. die Standardabweichung σ(x). Die Varianz selber ist wieder ein „Erwartungswert“ und zwar der Erwartungswert der Quadrate der Abweichung vom Mittelwert, in genauer mathematischer Definition geschrieben als: Die Varianz einer Zufallsvariable X ist der Erwartungswert von (X-µ)²; üblicherweise geschrieben als V(X). Die Standardabweichung σ = V (X ) . [ ] V ( X ) = E ( X − µ) 2 = E( X ² − 2.µ. X + µ²) = E( X ²) − 2µ.E( X ) + E(µ²) = E( X ²) − 2µ² + µ² = E( X ²) − µ² in anderer Schreibweise: ue biostatistik. deskriptive st., verteilungen 1/3 h.lettner/ physik [ V ( X ) = E ( X − µ) 2 = ] 1 n ∑ ( X − µ) 2 n i =1 σ = V (X ) Achtung: Für die Berechnung der Varianz und der Standardabweichung nach diesem Verfahren ist die Kenntnis des Erwartungswertes der Verteilung notwendig. Normalerweise ist das in experimentellen Untersuchungen nicht der Fall, die Berechnung der Varianz und der Standardabweichung ist daher zu modifizieren! Experimentell ermittelte Varianz und Standardabweichung n V (X ) = S² = ∑(X i =1 i − X )² n −1 Für die Berechnung der experimentell ermittelten Standardabweichung steht im Nenner n-1 im Vergleich zu n für die Standardabweichung der zugrunde liegenden Verteilung. Warum ist das so ? Betrachten wir zunächst die Berechnung der Summe der Abweichungsquadrate vom Mittelwert. n ∑(X i =1 − X )² = ∑ [( X i − µ) − ( X − µ)]² n i i =1 = ∑ [( X n i =1 = = − µ)² + ( X − µ)² − 2.( X i − µ) ( X − µ)] n n n i =1 i =1 i =1 ∑ ( X i − µ)² +∑ ( X − µ)² − 2.( X − µ)∑ ( X i − µ) n ∑(X i =1 = i i − µ)² + n.( X − µ)² − 2n.( X − µ)² i − µ)² − n.( X − µ)² n ∑(X i =1 Unter Anwendung der Erwartungswerte auf beiden Seiten der Identität [ n n E ∑ ( X i − X )² = E ∑ ( X i − µ)² − n.E ( X − µ)² i =1 i =1 ] n = ∑ E [( X i − µ)²] − n.V ( X ), weil E ( X ) = µ. i =1 n = ∑V ( X i ) − n. i =1 σ2 n = n.σ ² − σ ² = (n − 1).σ ² Durch Division beider Seiten durch (n-1): ue biostatistik. deskriptive st., verteilungen 2/3 h.lettner/ physik n 2 ∑(X − X ) = σ 2, n >1 E i =1 n −1 erhalten wir die Standardabweichung der Verteilung. Die Varianz einer Stichprobe mit den Realisierungen x1, x2, x3,….xn der Zufallsvariable X wird mit S2 bezeichnet und definiert als: n s2 = ∑ (x − x) 2 i =1 n −1 , bzw. E ( s 2 ) = σ 2 = V ( X ) Der Erwartungswert der experimentell ermittelten Varianz ist also die Varianz der Verteilung, ein nicht uninteressantes, vor allem aber nicht unwichtiges Ergebnis. Varianz und Standardabweichung des Mittelwertes X Alle X: X1, X2, ….., Xn sind unabhängige Zufallsvariablen mit der gleichen Varianz σ², dann ist V ( X 1 + X 2 + ... + X n ) = V ( X 1 ) + V ( X 2 ) + .... + V ( X n ) = n.σ 2 Wenn U eine Zufallsvariable und a eine Konstante ist, dann ist V(a.U) = a².V(U). Mit U = X1 + X2 + … + Xn und a = 1/n, ergeben diese Regeln: V (X ) = V ( X 1 + X 2 + ..... + X n ) n2 σ2 = n Die Varianz des Mittelwertes ist also genau um den Faktor 1/n kleiner als die Varianz der zugrunde liegenden Verteilung. Die Standardabweichung des Mittelwertes X ist daher um den Faktor 1/√n kleiner als die Standardabweichung von X. Beispiel und Fragen 1. Was ist der Erwartungswert beim Werfen eines Würfels mit den Zahlen 1,…,6. 2. Was ist die Standardabweichung des Mittelwertes einer Probe mit n=20, n = 50. Stellen Sie den funktionellen Zusammenhang s = f(n) graphisch dar. ue biostatistik. deskriptive st., verteilungen 3/3 h.lettner/ physik