3 PARAMETERSCHÄTZUNG: GENAUIGKEIT UND SICHERHEIT

46
3 PARAMETERSCHÄTZUNG:
GENAUIGKEIT UND SICHERHEIT
Inhalt:
3.1 Datenbeschreibung bei einem Merkmal
3.2 Ermittlung von Schätzwerten für Verteilungsparameter
3.3 Schätzfunktionen
3.4 Intervallschätzung
3.5 Exkurs: Statistische Prozessregelung
3.6 Übungsbeispiele
3.7 Repetitorium: Begriffe und Methoden
Lernziele:
- Aus Stichprobenwerten die Variation eines quantitativen Merkmals
durch eine Häufigkeitsverteilung (mit bzw. ohne Klassenbildung)
darstellen können;
- univariate Statistiken (Mittelwert, Standardabweichung/Varianz,
Standardfehler des Mittelwerts, Modalwert, Quantile, Schiefe) aus
Stichprobenwerten bestimmen und interpretieren können;
- die Merkmalsvariation durch ein Boxplot veranschaulichen können;
- eindimensionale Stichproben zentrieren und standardisieren
können;
- die Verteilung des Stichprobenmittels einer normalverteilten
Zufallsvariablen kennen und die praktische Bedeutung des
zentralen Grenzwertsatzes angeben können;
- Konfidenzintervalle für den Mittelwert , die Varianz und die
Standardabweichung einer normalverteilten Zufallsvariablen
berechnen und interpretieren können;
- Konfidenzintervalle für die Erfolgswahrscheinlichkeit einer
Zweipunktverteilung sowie den Mittelwert der Poisson-Verteilung
berechnen und interpretieren können;
- Qualitätsregelkarten zur Überwachung des Mittelwerts und der
Standardabweichung eines stetigen Merkmals erstellen und
interpretieren können.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
47
3.1 DATENBESCHREIBUNG BEI EINEM MERKMAL
Was ist der Zweck der Parameterschätzung?
Die Merkmalsvariation wird i. Allg. durch Wahrscheinlichkeitsverteilungen
(Wahrscheinlichkeitsfunktionen bzw. Dichtefunktionen) mit unbekannten
Parametern modelliert. Für diese Parameter sind - mit Hilfe von
Zufallsstichproben - Schätzwerte zu ermitteln.
Wahrscheinlichkeitsdichte
Grundgesamtheit X
N(µ, σ2)
Zufallsstichprobe
Zufallsauswahl
x1, x2, ..., xn
Stichprobenfunktionen
µ
X
2σ
Stichprobenmittel
Parameterschätzung:
Schätzwert
Konfidenzintervall
Stichprobenstandardabweichung
Wie beschreibt man die Merkmalsvariation mit Hilfe einer
eindimensionalen Stichprobe?
-
-
durch eine Häufigkeitsverteilung ohne (bzw. mit) Klassenbildung, die
Aufschluss gibt über die Wahrscheinlichkeitsfunktion
(Wahrscheinlichkeitsdichte) eines diskreten (bzw. stetigen) Merkmals;
durch Maßzahlen, die markante Eigenschaften der Verteilung zum
Ausdruck bringen.
Wie ermittelt man eine Häufigkeitsverteilung ohne Klassenbildung?
Es sei X ein quantitatives diskretes Merkmal mit k (verschiedenen)
Werten a1, a2, ..., ak.
Beobachtung von X an n Untersuchungseinheiten
à Stichprobe x1, x2, ..., xn
à Abzählen der Untersuchungseinheiten mit dem Merkmalswert ai ergibt
die absolute Häufigkeit Hi ;
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
48
à Division der absoluten Häufigkeit Hi durch den Stichprobenumfang n
ergibt die relative Häufigkeit hi = Hi /n.
Beispiel 3.1:
An 40 Exemplaren einer Pflanze (Biscutella laevigata) wurde die Anzahl X der Zähne
des größten Grundblattes bestimmt. Man stelle die Merkmalsvariation durch eine
Häufigkeitserteilung dar.
1
0
3
3
2
2
2
2
0
4
0
2
5
3
3
3
2
1
3
3
2
2
0
3
0
4
3
1
3
5
2
3
3
6
2
3
4
4
4
4
Lösungshinweise:
Die absolute Häufigkeit der Ausprägung a1=0 ist H1=5, die entsprechende relative Häufigkeit
h1=5/40=0.125, usw. Alle Ausprägungen und die zugeordneten Häufigkeiten werden in der
Häufigkeitstabelle zusammengefasst. Errichtet man über der Merkmalsachse „Stäbe“ mit den
Häufigkeiten (z.B. ausgedrückt in %) als Längen, erhält man eine grafische Darstellung der Verteilung
in Form eines Stabdiagramms.
Lösung mit R:
R-Console:
> options(digits=3)
> zaehne <- c(
+
1,2,0,5,2,2,0,3,3,4,
+
0,2,4,3,1,2,4,5,6,4,
+
3,2,0,3,3,0,3,2,2,4,
+
3,2,2,3,3,3,1,3,3,4)
> n <- length(zaehne); n # Stichprobenumfang
[1] 40
> Xdefmenge <- min(zaehne):max(zaehne); Xdefmenge
[1] 0 1 2 3 4 5 6
> absolute_H <- table(zaehne); absolute_H
zaehne
0 1 2 3 4 5 6
5 3 10 13 6 2 1
# Tabelle mit absoluten Häufigkeiten
> relative_H <- table(zaehne)/n # Tabelle mit relativen Häufigkleiten
> htab <- cbind(Xdefmenge, absolute_H, relative_H)
+
# Zusammenfassen der abs. u. rel. Häufigk. in einer Tabelle
> htab # Ausgabe der Häufigkeitstabelle
Xdefmenge absolute_H relative_H
0
0
5
0.125
1
1
3
0.075
2
2
10
0.250
3
4
5
6
3
4
5
6
13
6
2
1
0.325
0.150
0.050
0.025
> #
> # Darstellung der Verteilung der Anzahl der Zähne durch
> # ein Stabdiagramm mit absoluten Häufigkeiten
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
49
>
+
>
>
>
>
+
barplot(absolute_H, xlab="Anz. der Zähne", ylab="Abs. Häufigkeit",
main="Häufigkeitsverteilung n=40")
#
# Darstellung der Verteilung der Anzahl der Zähne durch
# ein Stabdiagramm mit relativen Häufigkeiten
barplot(relative_H, xlab="Anz.d.Zähne", ylab="rel.Häufigkeit",
main="Häufigkeitsverteilung d.Anz.d.Zähne, n=40")
R-Grafiken:
Häufigkeitsverteilung d.Anz.d.Zähne, n=40
0.20
0.15
rel.Häufigkeit
0.10
6
0
0.00
2
0.05
4
Abs. Häufigkeit
8
10
0.25
12
0.30
Häufigkeitsverteilung n=40
0
1
2
3
4
5
6
Anz. der Zähne
0
1
2
3
4
5
6
Anz.d.Zähne
Wie ermittelt man eine Häufigkeitsverteilung mit Klassenbildung?
Es sei X ein stetiges Merkmal und x1, x2, ..., xn eine Stichprobe von X;
Zerlegung der Merkmalsachse in gleich lange, aneinandergrenzende
Intervalle (Klassen) K1, K2, ..., Kl
à Klasseneinteilung
l ≈ n
Anzahl l der Klassen und Klassenbreite b:
b = ( x max − x min ) / l
Klassengrenzen:
Festlegung der unteren Grenze c1 der ersten Klasse K1 derart, dass
c1 < xmin < c1+ b àK1 =[c1, c1+ b); c2 = c1+ b ist die untere Grenze der
zweiten Klasse K2 = [c2, c2+ b); c3 = c2 + b die untere Grenze der
dritten Klasse K3 = [c3, c3+ b) usw.
à Abzählen der Untersuchungseinheiten in der Klasse Ki ergibt die
absolute Klassenhäufigkeit H'i von Ki (= Anzahl der Merkmalswerte xi
mit ci ≤ xi < ci+1); man beachte: ∑ j H ' j = n !
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
50
à Division der absoluten Klassenhäufigkeit H'i durch den
Stichprobenumfang n führt zur relativen Klassenhäufigkeit h'i = H'i /n;
man beachte: ∑ j h' j = 1 !
à Division der relativen Klassenhäufigkeit h'i durch die Klassenbreite b
ergibt die Häufigkeitsdichte di = h'i /b;
Histogramm:
Über jede Klasse Ki wird das Rechtecke mit der Breite b und der Höhe di
errichtet (dieses Histogramm heißt flächennormiert, weil die gesamte
"Histogrammfläche" = 1 ist)
Beispiel 3.2:
Die folgende Tabelle enthält die Blutgerinnungszeiten (in s) von 30 Probanden. Man
beschreibe die Merkmalsvariation tabellarisch und grafisch durch eine geeignet
gewählte Häufigkeitsverteilung.
22,7
27,0
29,0
24,0
27,7
29,0
24,4
27,8
30,0
25,8
28,0
30,1
25,9
28,0
31,1
26,0
28,1
31,8
26,4
28,7
32,0
26,6
28,7
33,0
26,6
28,8
33,7
26,8
29,0
35,0
Lösung mit R:
R-Console:
> x <- c(
+
22.7, 24.0, 24.4, 25.8, 25.9, 26.0, 26.4, 26.6, 26.6, 26.8,
+
27.0, 27.7, 27.8, 28.0, 28.0, 28.1, 28.7, 28.7, 28.8, 29.0,
+
29.0, 29.0, 30.0, 30.1, 31.1, 31.8, 32.0, 33.0, 33.7, 35.0)
> #
> options(digits=4)
> # Histogramm mit abs. Klassenhäufigkeiten
> grafik_1 <- hist(x, freq=TRUE,
+
xlab="Blutgerinnungszeiten in s", ylab="abs. Klassenhäufigkeit",
+
main="Grafik 1: Histogramm mit abs. Klassenhäufigkeiten, n=30")
>
> # Histogramm mit rel. Klassenhäufigkeitsdichten (Flächennormierung auf 1)
> grafik_2 <- hist(x, freq=F, xlab="Blutgerinnungszeiten in s",
+
ylab="Klassenhäufigkeitsdichte",
+
main="Grafik 2: Flächennormiertes Histogramm, n=30")
>
> # Häufigkeitstabelle
> names(grafik_1)
[1] "breaks "counts" "intensities" "density" "mids" "xname"
[7] "equidist"
> anz_klassen <- length(grafik_1$mids)
> anz_klassen
[1] 7
> klassenbreite <- (max(grafik_1$breaks)-min(grafik_1$breaks))/anz_klassen
> klassenbreite
[1] 2
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
51
>
>
>
>
>
klassenmitte <- grafik_1$mids
abs_klassen_H <- grafik_1$counts
rel_klassen_H <- abs_klassen_H/n
klassen_H_dichte <- rel_klassen_H/klassenbreite
print(cbind(klassenmitte, abs_klassen_H, rel_klassen_H, klassen_H_dichte))
klassenmitte abs_klassen_H rel_klassen_H klassen_H_dichte
[1,]
23
2
0.06667
0.03333
[2,]
25
4
0.13333
0.06667
[3,]
27
9
0.30000
0.15000
[4,]
29
8
0.26667
0.13333
[5,]
31
4
0.13333
0.06667
[6,]
33
2
0.06667
0.03333
[7,]
35
1
0.03333
0.01667
> #
> # Man beachte die Normierungen der diversen Häufigkeiten!
R-Grafiken:
Grafik 2: Flächennormiertes Histogramm, n=30
0.10
K lassenhäufigkeitsdichte
0.05
6
4
0
0.00
2
abs. Klassenhäufigkeit
8
0.15
Grafik 1: Histogramm mit abs. Klassenhäufigkeiten, n=30
22
24
26
28
30
32
34
36
22
24
Blutgerinnungszeiten in s
26
28
30
32
34
Blutgerinnungszeiten in s
R-Console (Forts.):
> # Erstellung eines Histogramms mit vorgegebenen Klassengrenzen:
> x_min <- min(x); x_max <- max(x); n <- length(x)
> print(cbind(x_min, x_max, n))
x_min x_max n
[1,] 22.7
35 30
> anz_klassen <- round(sqrt(n))
> b <- (x_max- x_min)/anz_klassen # Klassenbreite
> klassenbreite <- round(b,digits=0)+1 # gerund.Klassenbreite
> ug <- trunc(x_min) # linke Grenze der 1. Klasse
> og <- ug+anz_klassen*klassenbreite # rechte Grenze der obersten Klasse
> print(cbind(anz_klassen, b, klassenbreite, ug, og))
anz_klassen
b klassenbreite ug og
[1,]
5 2.46
3 22 37
> klassengrenzen <- seq(from=ug, to=og, by=klassenbreite); klassengrenzen
[1] 22 25 28 31 34 37
> grafik_3 <- hist(x, breaks=klassengrenzen, freq=TRUE,
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
36
52
+
+
xlab="Blutgerinnungszeiten in s", ylab="abs. Klassenhäufigkeit",
main="Grafik 3: Histogramm mit 5 Klassen, n=30")
R-Grafik:
8
6
4
0
2
abs. Klassenhäufigkeit
10
12
Grafik 3: Histogramm mit 5 Klassen, n=30
25
30
35
Blutgerinnungszeiten in s
Was sind die wichtigsten Verteilungskennwerte (univariate Statistiken)?
Es sei X ein quantitatives Merkmal mit den an n Untersuchungseinheiten
beobachteten Werten x1, x2, ..., xn; unter den Stichprobenwerten gibt es k
verschiedene Werte, die mit ai bezeichnet werden.
Lagemaß: (Arithmetischer) Mittelwert
n
x = 1 ∑ xi = 1 (x1 + x2 + L + xn )
n i =1
n
1 k
1
= ∑ a H =  a H + a H + L + a H 
k k
n i=1 i i n  1 1 2 2
Hinweis:
a)
n
∑
i =1
=
k
∑ ai hi =a1h1 + a 2 h2 + L + a k hk
i =1
( xi − x ) = 0
b) SQX (ξ )
n
= ∑
i =1
( xi − ξ )
W. Timischl: Statistik, Parameterschaetzung_10_Text
2
= min! für ξ = x
05.10.2010
53
Streuungsmaße: Varianz s2, Standardabweichung s
n
1
1
s =
SQX ( x ) =
∑ (x i − x )
n −1
n − 1 i =1
2
2
2
k
1
=
∑ (a i − x ) H i
n − 1 i =1
2
k
n
=
∑ (a i − x ) h i
n − 1 i =1
s=
s2
Wozu dient der Mittelwert?
a) um den "wahren" Wert µ von X zu schätzen (dabei wird
angenommen, dass sich die Messwerte additiv aus dem wahren
Wert und einem regellos um Null streuenden Messfehler
zusammensetzen)
b) um den Mittelwert µ von X zu schätzen (dabei wird angenommen,
dass X an sich zufällig variiert)
Man beachte: Je größer n, desto "besser" die Mittelwertschätzung!
Standardfehler (Maß für die
Zufallsstreuung des Mittelwerts):
SE =
s
n
Beispiel 3.3: (Mittelwert und Standardfehler zu Beispiel 3.1):
1
(0 ⋅ 5 + 1 ⋅ 3 + 2 ⋅ 10 + 3 ⋅ 13 + 4 ⋅ 6 + 5 ⋅ 2 + 6 ⋅ 1) = 2,55
40
1
(0 − 2,55)2 ⋅ 5 + L + (6 − 2,55)2 ⋅ 1 = 2,1
s2 =
39
s = 2,1 = 1,45
1,45
SE =
= 0,23
40
x=
[
]
Hinweis: Messergebnisse werden oft in der Form
dargestellt:
x ± SE = 2,55 ± 0, 23
Welche weiteren Lagemaße finden bei der Datenbeschreibung
Anwendung?
• der Modalwert xmod (häufigster Merkmalswert)
• der kleinste und größte Merkmalswert xmin bzw. xmax
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
54
• das p -Quantil xp (0 ≤ p < 1): unter dem p-Quantil einer (quantitativen)
Stichprobe vom Umfang n kann man sich – grob gesprochen – jenen
Wert vorstellen, der von np Stichprobenwerten unterschritten und von
n(1-p) Stichprobenwerten überschritten wird; ist np nicht ganzzahlig,
so nehme man dafür den auf die nächste ganze Zahl gerundeten
Wert. Im Folgenden wird eine genaue Definition des p-Quantils
(nämlich jene, die in der R-Funktionen summary oder quantile
verwendet wird) angegeben.
Wie bestimmt man das p-Quantil aus einer Stichprobe?
Eine Stichprobe der Variablen X umfasse die n metrischen Werte
x1, x2, ... , xn. Die Anordnung der Stichprobenwerte nach aufsteigender
Größe führt auf die geordnete Stichprobe x(1), x(2), ... , x(n). Wir bestimmen
die Zahl u = 1+(n-1)p und daraus die größte ganze Zahl [u] kleiner oder
gleich u; ferner setzen wir v= u-[u]. Dann ist das p-Quantil xp der
Stichprobenwerte gegeben durch
x p = (1 − v) x([ u ]) + vx([ u ]+1)
Sonderfälle:
p = 50% (Median x0.5)
p = 25% (unteres Quartil x0.25)
p = 75% (oberes Quartil x0.75)
Beispiel 3.4:
Man bestimme das 25%-, 50%- und 75%-Quantil für die Stichprobe
8, 12, 14, 22, 25, 25, 30. Was ergibt sich, wenn man die Stichprobe um den Wert 35
vergrößert?
Lösung:
a) Stichprobe: 8, 12, 14, 22, 25, 25, 30 (n=7)
p=0,25: u= 1+(n-1)p=2,5; [u]=2, v=0,5à x0,25= 0,5x(2)+0,5x(3)=13;
p=0,5: u= 4; [u]=4, v=0à x0,5= 1x(4)+0x(5)=22;
p=0,75: u= 5,5; [u]=5, v=0,5à x0,75= 0,5x(5)+0,5x(6)=25.
b) Stichprobe: 8, 12, 14, 22, 25, 25, 30, 35 (n=8)
p=0,25: u= 1+(n-1)p=2,75; [u]=2, v=0,75à x0,25= 0,25x(2)+0,75x(3)=13,5;
p=0,5: u= 4,5; [u]=4, v=0,5à x0,5= 0,5x(4)+0,5x(5)=23,5;
p=0,75: u= 6,25; [u]=6, v=0,25à x0,75= 0,75x(6)+0,25x(7)=26,25.
Man beachte:
- Es gibt mehrere Definitionen für die Quantile; sowohl Excel als auch
z.B. SPSS verwenden andere Definitionen.
- Speziell für die Quartile x0.25 und x0.75 findet man auch die folgende
Definitionen: Das Quartil x0.25 (x0.75) ist der Median der Merkmalswerte
kleiner (größer) als x0.5; die so berechneten Statistiken werden im
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
55
Englischen auch als „hinges“ bezeichnet und finden z.B. in R bei der
Berechnung der Quartile in der Funktion boxplot() Anwendung.
Beispiel 3.5:
a) Man stelle die Variation der Blutgerinnungswerte von Beispiel 3.2 durch ein
Boxplot dar.
Lösung:
n= 30;
p=0,25: u= 1+(n-1)p=8,25; [u]=8, v=0,25à x0,25= 0,75x(8)+0,25x(9)=26,6;
p=0,5: u= 15,5; [u]=15, v=0,5à x0,5= 0,5x(15)+0,5x(16)=28,05;
p=0,75: u= 22,75; [u]=22, v=0,75à x0,75= 0,25x(22)+0,75x(23)=29,75.
IQR = x075 - x0,25 = 3,15.
Whisker-Längen: xmin = 22,7; xmax = 35.
xmin
x0.25
x0.5
x0.75
xmax
X
23
25
27
29
31
33
35
Lösung mit R:
R-Console:
> x <- c(
+
22.7, 24.0, 24.4, 25.8, 25.9, 26.0, 26.4, 26.6, 26.6, 26.8,
+
27.0, 27.7, 27.8, 28.0, 28.0, 28.1, 28.7, 28.7, 28.8, 29.0,
+
29.0, 29.0, 30.0, 30.1, 31.1, 31.8, 32.0, 33.0, 33.7, 35.0)
> summary(x)
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
22.70
26.60
28.05
28.39
29.75
35.00
> grafik_1 <- boxplot(x, range=0, horizontal=TRUE)
> names(grafik_1)
[1] "stats" "n"
"conf" "out"
"group" "names"
> grafik_1$stats
[,1]
[1,] 22.70
[2,] 26.60
[3,] 28.05
[4,] 30.00
[5,] 35.00
> # Man beachte: Das untere und obere Quartile werden als „hinges“ berechnet!
> grafik_1$stats[4,1] # oberes Quartil (upper hinge)
[1] 30
> IQR <- grafik_1$stats[4,1]-grafik_1$stats[2,1]
[1] 3.4
> # Man beachte: IQR ist hier mit dem oberen und unteren hinge berechnet!
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
56
R-Grafik (Boxplot):
24
26
28
30
32
34
b) Man zeige: Für ein N(µ, σ2)-verteilte Zufallsvariable X ist P=
P(x0.25 –1,5IQR <X< x0.75 +1,5IQR) ≈ 99,3%, d.h. außerhalb des Intervalls
[x0.25 –15IQR, x0.75 + 1,5IQR] liegende Werte sind unwahrscheinlich und daher
"ausreißerverdächtig".
Lösung:
x0,75=µ+z0,75σ ; x0,25=µ+z0,25σ = µ-z0,75σ à
IQR=x0,75–x0,25 = 2z0,75σ à
x0.75+1,5IQR=µ+4z0,75σ ; x0.25–1,5IQR=µ−4z0,75σ à
P= P((x0.25 -1,5IQR–µ)/σ <(X-µ)/σ < (x0.75+1,5IQR-µ)/σ)=
P(−4z0,75 <(X-µ)/σ <4z0,75); z0,75= (Tabelle)=0,675 à
P=P(-2,7< (X-µ)/σ <2,7) = Φ(2,7)-Φ(-2,7) = 2Φ(2,7)-1=(Tabelle)=2⋅0,99651=0,993.
Wie beschreibt man die Asymmetrie einer Häufigkeitsverteilung?
Das Maß für die Asymmetrie heißt Schiefe.
Schiefe g =
(
S xxx
n s 1 − 1/ n
)
3
3
, S xxx = ∑ ( xi − x )
n
i =1
Beispiel 3.6:
Man berechne die Schiefe der Häufigkeitsverteilung von X (Anzahl der Zähne des
größten Grundblattes) mit den Daten von Beispiel 3.1.
Lösung mit R:
R-Console:
> options(digits=3)
> x <- c(
+
1,2,0,5,2,2,0,3,3,4,
+
0,2,4,3,1,2,4,5,6,4,
+
3,2,0,3,3,0,3,2,2,4,
+
3,2,2,3,3,3,1,3,3,4)
> n <- length(x)
> mw <- mean(x)
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
57
> std <- sd(x)
> g <- sum((x-mw)^3)/n/(std*sqrt(1-1/n))^3 # Schiefe
> print(cbind(n, mw, std, g))
n
mw std
g
[1,] 40 2.55 1.45 -0.0494
Hinweis:
Die folgende Grafik zeigt die beiden grundsätzlich möglichen
Asymmetrietypen. Für symmetrische Verteilungen ist die Schiefe null.
Was versteht man unter einer zentrierten Stichprobe, was unter einer
standardisierten Stichprobe?
X → Z c = X − x (Zentriere n)
X → ZS =
X −x
(Standardi sieren)
s
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
58
3.2 ERMITTLUNG VON SCHÄTZWERTEN FÜR VERTEILUNGSPARAMETER
Wie schätzt man den Mittelwert µ einer N(µ, σ2)-verteilten
Zufallsvariablen X?
Zur Schätzung von Verteilungsparametern werden Schätzfunktionen
verwendet. Es sei X1, X2, ..., Xn eine Zufallsstichprobe, in der die
Variablen Xi (i = 1, 2, …, n) die Ergebnisse von n Beobachtungen
ausdrücken. Die Schätzung des Mittelwerts einer normalverteilten
Zufallsvariablen erfolgt mit Hilfe des Stichprobenmittels:
X =
1
(X 1 + X 2 + L + X n )
n
Es gilt:
§
X i ∝ N ( µ ,σ 2 ) ⇒ X ∝ N ( µ ,σ 2 / n )
§
E[ X i ] = µ und Var[ X i ] = σ 2
⇒ E[ X ] = µ , Var[ X ] = σ 2 /n und X ∝ N ( µ , σ 2 / n ) für großes n
(ab n = 30, Zentraler Grenzwertsatz)
Beispiel 3.7:
a) Es seien X eine 2-wertige Zufallsvariable mit P(X = 1) = p, P(X = 0) = 1 – p und
X1, X2, ..., Xn eine Zufallsstichprobe von X. Dann gilt für jedes Xi: E[Xi] = p, Var[Xi]
= p(1-p). Für große n gilt darüber hinaus die Approximation ( X = Anteil der
Wiederholungen mit Xi = 1):
X =
1
( X 1 + X 2 + L + X n ) ∝ N  p, p (1 − p) 
n
n


b) Man betrachte ein Bernoulli-Experiment, d.h. ein Experiment mit 2 Ausgängen,
die wir mit a bzw. b (z.B. violette Blütenfarbe bzw. weiße Blütenfarbe)
bezeichnen. Die Ergebnismenge des Zufallsexperiments ist also Ω ={a, b}. Auf
dieser Menge definieren wir eine Zufallsvariable X derart, dass X den Wert 1
annimmt, wenn der Ausgang a eintritt, und den Wert 0, wenn der Ausgang b
eintritt. Die Wahrscheinlichkeit, dass bei Durchführung des Experiments der
Ausgang a eintritt, also die Wahrscheinlichkeit P(X=1), sei p.
Das Benoulli-Experiment wird n-mal wiederholt. Jedem dieser Experimente
ordnen wir - wie eben ausgeführt - eine Zufallsvariable zu, der ersten
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
59
Wiederholung die Zufallsvariable X1, der zweiten die Zufallsvariable X2 usw. Die
Summe Y = X1 + X2 + ... + Xn dieser Variablen bedeutet die Anzahl jener
Wiederholungen, bei denen der Ausgang a eintritt. Dividiert man Y durch n, bildet
man also den Mittelwert der von X1, X2, ..., Xn, so erhält man den Anteil der
Wiederholungen mit dem Ausgang a. Dieser Mittelwert (oder Anteil) ist eine
Stichprobenfunktion; deren Mittelwert ist gleich dem Mittelwert jedes einzelnen Xi
(d.h. gleich der Wahrscheinlichkeit p); die Varianz von Y/n ist gleich p(1-p)/n, d.h.
gleich der durch n geteilten Varianz eines jeden Xi.
Man zeige diese Zusammenhänge an Hand einer Simulation des 9-stufigen
Bernoulli-Experimentes rechnerisch und grafisch auf und zeichne in das
(flächennormierte) Histogramm der Stichprobenmittelwerte die Dichtekurve der
entsprechenden Normalverteilung ein. Die Simulation möge aus 10000
Wiederholungen des 9-stufigen Bernoulli-Experimentes bestehen.
Lösung mit R:
R-Console:
> # Simulation des 9-stufigen Bernoulli-Experiments
> n_sim <- 10000 # Anzahl der Simulationen
> zaehler <- c(1: n_sim)
> omega <- c(1,0) # Ergebnismenge
> p <- 0.4 # Erfolgswahrscheinlichkeit
> ws <- c(p, 1-p) # Wahrscheinlichk. der Elemente 1 und 0 in der Ergebnismenge
> # Schätzung des Mittelwerts und der Standardabweichung aus den Simulationen
> mittel_9 <- c()
> for (i in zaehler){
+
bernoulli_9 <- sample(omega, 9, replace=TRUE, prob=ws)
+
mittel_aktuell <- mean(bernoulli_9) # Mittelwert
+
mittel_9 <- append(mittel_9, mittel_aktuell)}
> #
> mittelwert_9 <- mean(mittel_9) # Mittelwert aller Erfolgsanteile
> std_9 <- sd(mittel_9) # Standardabweichung aller Erfolgsanteile
> varianz_9 <- std_9*std_9
> print(cbind(mittelwert_9, varianz_9))
mittelwert_9 varianz_9
[1,]
0.4002444 0.02679472
> #
> # Theoretischer Mittelwert und theoretische Standardabweichung
> mittelwert <- p
> varianz <- p*(1-p)/9
> print(cbind(mittelwert, varianz))
mittelwert
varianz
[1,]
0.4 0.02666667
> #
> # Verteilung des Stichprobenmittels (Anteils) beim 9-stufigen
> # Bernoulli-Experiment
> hist(mittel_9, breaks=10, xlab="Anteil", ylab="Dichte/flächennormiert",
+
main="9-stufiges Bernoulli-Experiment", freq=FALSE)
> x <- mittel_9
> curve(dnorm(x, mean=p, sd=sqrt(p*(1-p)/9)), add=T)
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
60
R-Grafik:
1.5
1.0
0.0
0.5
Dichte/flächennormiert
2.0
2.5
9-stufiges
Bernoulli-Experiment
0.0
0.2
0.4
0.6
0.8
1.0
Anteil
Wie schätzt man die Varianz einer N(µ, σ2)-verteilten Zufallsvariablen X?
Zufallsstichprobe X1, X2, ... , Xn
Stichprobenvarianz:
[
]
1
( X 1 − X )2 + ( X 2 − X )2 + L + ( X n − X )2 ;
n −1
( n − 1) S 2
∝ χ n2−1
2
σ
S2 =
d.h. (n-1)S2/σ2 folgt einer Chiquadratverteilung mit f = n - 1
Freiheitsgraden.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
61
2
Dichte
1,6
1,2
f=1
0,8
f=5
f=3
0,4
0
0
1
2
X
3
Dichtekurven
der χ2-Verteilung
3.3 SCHÄTZFUNKTIONEN
Wie Eigenschaften sollen Schätzfunktionen haben?
Schätz(Stichproben)funktion für den Verteilungsparameter π:
πˆ n = πˆ n ( X 1 , X 2 ,K, X n )
Beurteilung der Güte von Schätzfunktionen durch
mittleren quadratischen Fehler:
MSE = E[(πˆ n − π ) 2 ] = Var[πˆ n ] + (E[πˆ n ] − π )2
d.h. MSE = Varianz der Schätzfunktion + Quadrat der Verzerrung (Bias)
Forderungen an "gute" Schätzfunktionen:
1. Für n à ∞ sollen Schätzwerte mit wachsender Wahrscheinlichkeit
um π konzentriert sein; dies trifft zu, wenn die Schätzfunktion
unverzerrt (erwartungstreu) ist .
2. Varianz soll für n à ∞ gegen Null streben.
Man beachte:
• Das Stichprobenmittel πˆ n = X = ( X 1 + X 2 + K + X n ) / n ist eine
erwartungstreue Schätzfunktion für µ, d.h. E[ X ] = µ ⇒ Bias = 0 .
2

Überdies gilt: Var[ X ] = σ / n n
→
∞→ 0 .
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
62
• Die Stichprobenvarianz πˆ n = S = ∑ ( X i − X ) /(n − 1) ist eine
n
2
2
i =1
2
2
erwartungstreue Schätzfunktion für σ2, d.h. E[ S ] = σ ⇒ Bias = 0 .
2
4

→0 .
Überdies gilt: Var[ S ] = 2σ /(n − 1) n
→∞
Dagegen ist S ist keine erwartungstreue Schätzfunktion für σ.
Es gilt nämlich:
n
Γ 
2
2 <1
E[S ] = k nσ mit k n =
n −1  n − 1
Γ

 2 
Γ bezeichnet die Gamma-Funktion mit der Eigenschaft
Γ(x+1) = x Γ(x) für alle x>0. Speziell ist Γ(1)=1 und Γ(1/2)=√π. Z.B.
ergibt sich damit für n=5:
k5 = (1/√2 )Γ(5/2)/Γ(2) = (1/√2 )⋅1⋅(3/2)(1/2) √π = 0,94.
Wie kommt man zu guten Schätzfunktionen?
Es seien:
• X eine (diskrete) Zufallsvariable mit der von dem zu schätzenden
Parameter π abhängigen Wahrscheinlichkeitsfunktion f(x|π)
• x1, x2, ... , xn eine Zufallsstichprobe von X
Wir bilden die so genannte Likelihood-Funktion:
n
L(π = π~ | x1, x2 ,K, xn ) = ∏ f (xi | π~)
i=1
Die Likelihood-Funktion ist die Wahrscheinlichkeit dafür, dass X die
Realisationen x1, x2,..., xn annimmt, wenn π~ der Schätzwert für π ist.
Der Maximum Likelihood - Schätzer (kurz ML-Schätzer) für π ist jenes π~ ,
für das die Likelihood - Funktion den größten Wert annimmt, d.h. die
Maximumstelle von L.
Beispiel 3.8:
Es sei X ~ N(µ, σ2). Man bestimme den ML-Schätzer für den Mittelwert µ unter der
Annahme, dass σ2 bekannt ist.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
63
Lösung:
ln L ( µ = µ~ | x 1 , x 2 , K , x n )
= −
n
n
ln( 2 π ) − ln σ
2
2
2
−
1 n
2
∑ ( x i − µ~ ) / σ
2 i =1
2
d
ln L = 0 ⇒ µ~ = x
~
dµ
Hinweise:
• Bei stetigen Zufallsvariablen tritt an die Stelle der
Wahrscheinlichkeitsfunktion die Wahrscheinlichkeitsdichte.
• Die ML-Schätzung des Mittelwertes ist gleichwertig mit der
sogenannten Kleinsten Quadrat-Schätzung (LS-Schätzung:
"optimaler" Schätzwert ist jener, der die Summe der Quadrate der
Abweichungen der Beobachtungswerte vom Schätzwert minimiert)
3.4 INTERVALLSCHÄTZUNG
Was sind und wie berechnet man Konfidenzintervalle?
Wir bezeichnen als Konfidenzintervall für einen unbekannten Parameter
π einer Verteilung das Intervall [U, O] der Zahlengeraden, das den
Parameter π mit einer vorgegebenen hohen Wahrscheinlichkeit
1-α einschließt, d.h., P(U ≤ π ≤ O) = 1-α.
Zusätzlich geben wir die Symmetrieforderung vor:
P(U > π) = P(O < π) = α/2
Wie berechnet man ein (1-α)-Konfidenzintervall für die Varianz einer N(µ,
σ2)- verteilten Zufallsvariablen?
 (n − 1)S 2 (n − 1)S 2 
,
 2

2
χ
χ
 n−1,1−α / 2 n−1,α / 2 
Beispiel 3.9:
Es sei X normalverteilt mit dem Mittelwert µ und der Varianz σ2.
Von einer Stichprobe sei bekannt: n =30, s2 = 7.93. Man bestimme ein 95%iges
Konfidenzintervall (CI) für σ.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
64
Lösung mit Tabelle:
χ229,0.975= (Tabelle)=45,72; χ229,0.025= (Tabelle)=16,05 à
95%-CI für σ2: [5,03; 14,33] à
95%-CI für σ: [2,24; 3,79].
Lösung mit R:
R-Console:
> # R-Funktion mit Übergabeparameter:
> # n (Stichprobenumfang), var (Varianz), alpha (Irrtumsrisiko)
> CI_var <- function(n, var, alpha){
+
ug <- (n-1)*var/qchisq(1-alpha/2, n-1)
+
og <- (n-1)*var/qchisq(alpha/2, n-1)
+
grenzen <- cbind(ug, og)
+
return(grenzen)}
> options(digits=4)
> # Funktionsaufruf mit n=30, var=7.93, alpha=5%
> CI_var(30, 7.93, 0.05)
ug
og
[1,] 5.03 14.33
> #
> # CI für die Standardabweichung
> CI_sd <- sqrt(CI_var(30, 7.93, 0.05))
> CI_sd
ug
og
[1,] 2.243 3.786
Wie berechnet man ein (1-α)-Konfidenzintervall für den Mittelwert einer
N(µ, σ2)- verteilten Zufallsvariablen?
[X − d, X + d]
mit d = tn−1,1−α / 2
S
n
Es ist d die halbe Intervallbreite und tn-1,1-α/2 das (1-α/2)-Quantil der
t-Verteilung mit n-1 Freiheitsgraden.
Dichtekurven
der t-Verteilung:
0,4
N(0,1)
t5
Dichte
0,3
0,2
t1
0,1
0
-3
W. Timischl: Statistik, Parameterschaetzung_10_Text
-2
-1
0
1
2
X
3
05.10.2010
65
Beispiel 3.10:
Es sei X normalverteilt mit dem Mittelwert µ und der Varianz σ2. Für den Mittelwert
und die Standardabweichung von X wurden mit Hilfe einer Stichprobe vom Umfang
n=20 die Schätzwerte 25 bzw. 5 bestimmt. Man bestimme zum Niveau 1-α =0.95 ein
Konfidenzintervall (CI) für den Mittelwert von X.
Lösung mit Tabelle:
t19,0.975= (Tabelle)= 2,093; s/√n=1,118; d=2,34 à 95%-CI für µ: 25 ± 2.34.
Lösung mit R:
R-Console:
> # Beachte: ß-Quantil t_(f, ß) = qt(ß, f)
> #
> # Funktion mit Übergabeparameter:
> # mw (Mittelwert, n (Stichprobenumfang, std (Standardabweichung), alpha
(Irrtumsrisiko)
> CI_mittel <- function(mw, n, std, alpha){
+
d <- std/sqrt(n)*qt((1-alpha/2), n-1)
+
ug <- mw-d
+
og <- mw+d
+
grenzen <- cbind(ug, og)
+
return(grenzen)}
> #
> # Funtionsaufruf mit mw=25, n=20, std=5, alpha=5%
> options(digits=4)
> CI_mittel(25, 20, 5, 0.05)
ug
og
[1,] 22.66 27.34
Hinweis:
Für „große“ Stichproben gilt die Approximation (z1-α/2 = (1-α/2 )-Quantil
der N(0,1)-Verteilung):
[X − d, X + d]
mit d = z1−α / 2
S
n
Folgerung:
Faustformel für den Mindeststichprobenumfang zur Schätzung eines
Mittelwerts mit der vorgegebenen Genauigkeit ±d und der vorgegebenen
Sicherheit 1-α :
2
σ
z
n ≈  1−α / 2 
d


Beispiel 3.11:
Der Mittelwert µ einer N(µ, σ2)-verteilten Zufallsvariablen soll mit einer Genauigkeit
von ±0,25 und einer Sicherheit von 99% bestimmt werden. Von einer
Voruntersuchung sei bekannt, dass σ ≤ 1,5 ist.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
66
a) Wie groß ist der erforderliche Mindeststichprobenumfang n zu planen?
b) Man stelle n in Abhängigkeit von d (0,1 ≤ d≤ 0,3) für 1- α=0.95 und 0.99 dar!
Lösung mit Tabelle (nur a):
α=0,01 à 1-α/2=0,995 à z0,995=(Tabelle)=2,58; d=0,25;
σ=1,5 à n≈ 239,63 ≈ 240.
Lösung mit R:
R-Console:
> # Aufgabe a)
> # R-Funktion mit Übergabeparameter:
> # genauigkeit (d), sicherheit (1-alpha), sigma
> n_mindest <- function(genauigkeit, sicherheit, sigma){
+
alpha <- 1-sicherheit
+
n <- (qnorm(1-alpha/2)*sigma/genauigkeit)^2
+
return(n)}
> #
> options(digits=4)
> # Funktionsaufruf mit genauigkeit=0.25, sichheit=0.99, sigma=1.5
> n_mindest(0.25, 0.99, 1.5)
[1] 238.9
>
>
>
>
# Aufgabe b)
# Erzeugen der Folge der d-Werte von 0,1 bis 0,3 in Schritten von 0,01
d <- seq(from=0.1, to=0.3, by=0.01)
d
[1] 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.20 0.21 0.22 0.23 0.24
[16] 0.25 0.26 0.27 0.28 0.29 0.30
> #
> # Berechnen der den d-Werten entsprechenden Mindeststichprobenumfänge
> n_mindest_95 <- n_mindest(d, 0.95, 1.5)
> n_mindest_95
[1] 864.33 714.32 600.23 511.44 440.98 384.15 337.63 299.08 266.77 239.43
[11] 216.08 195.99 178.58 163.39 150.06 138.29 127.86 118.56 110.25 102.77
[21] 96.04
> n_mindest_99 <- n_mindest(d, 0.99, 1.5)
> n_mindest_99
[1] 1492.9 1233.8 1036.7
[11] 373.2 338.5 308.4
[21] 165.9
> #
883.3
282.2
761.7
259.2
663.5
238.9
583.1
220.8
516.6
204.8
460.8
190.4
413.5
177.5
> # Grafische Darstellung der Abhängigkeit der Mindeststichprobenumfänge von d
> plot(d, n_mindest_95, type="p", col="blue", xlab="Genauigkeit",
+
ylab="n", main="Mindest-n bei Mittelwertschätzung")
> lines(d, n_mindest_95, col="blue", lty=1, lwd=2)
> lines(d, n_mindest_99, col="red", lty=2, lwd=2)
> text(0.15, 200, col="blue", expression("Sicherheit = 95%"))
> text(0.25, 400, col="red", expression("Sicherheit = 99%"))
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
67
R-Grafik:
400
n
600
800
Mindest-n bei Mittelwertschätzung
200
Sicherheit = 99%
Sicherheit = 95%
0.10
0.15
0.20
0.25
0.30
Genauigkeit
Wie berechnet man ein (1-α)-Konfidenzintervall für den Parameter p
(Wahrscheinlichhkeit) einer Zweipunktverteilung?
Es sei X eine zweistufig skalierte Zufallsvariable mit den Werten 1 und 0,
p = P(X =1) bzw. q = 1-p = P(X=0) die Wahrscheinlichkeiten, mit denen
diese Werte angenommen werden.
Ferner seien x1, x2, ..., xn eine Zufallsstichprobe vom Umfang n, m die
Anzahl der Wiederholungen mit xi = 1 und h = m/n der Anteil der
Wiederholungen mit xi = 1.
Dann sind die untere und obere Grenze pu bzw. po eines (1-α) Konfidenzintervalls für p gegeben durch (exaktes Pearson/Clopper –
Intervall):
pu =
po =
mF2 m, 2( n− m +1),α / 2
n − m + 1 + mF2m, 2( n − m+1),α / 2
(m + 1) F2( m+1), 2( n− m ),1−α / 2
n − m + (m + 1) F2( m+1),2( n− m ),1−α / 2
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
68
Die Größen Ff1, f2, α/2 und Ff1, f2, 1-α/2 sind das α/2- bzw. (1-α/2)-Quantil der
F-Verteilung mit den Freiheitsgraden f1 und f2;
Hinweis: Man beachte, dass Ff1, f2, α = 1/ Ff2, f1, 1-α gilt.
1
Dichte
0,8
F10,40
0,6
F5,2
0,4
Dichtekurven
der F-Verteilung
0,2
0
0
1
2
X
3
Beispiel 3.12:
Es soll die Erfolgsrate p einer neuen Behandlungsmethode, also die
Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine
Verbesserung eintritt, geschätzt und ein 95%iges Konfidenzintervall für p bestimmt
werden. In einer Studie mit n=50 Probanden erwies sich die neue Methode bei m=35
Personen erfolgreich.
Lösung mit Tabelle:
Schätzwert für p=35/50=0,7;
Berechnung von pu: F70,32,0.025= 1/ F32,70,0.975 ≈ 1/F30,70,0.975 = (Tabelle,
Interpolation) = 1/1,785=0,56; pu=0,551;
Berechnung von po: F72,30,0.975 ≈ F60,30,0.975 = (Tabelle) = 1,94; po=0,823; die mit
den exakten Tabellenwerten berechneten Intervallgrenzen sind 0,554 bzw. 0,821.
Lösung mit R:
R-Console:
> # Exakte Rechnung (Pearson/Clopper – Intervall)
>
>
>
>
# Beachte: ß-Quantil F(f1, f2, ß) = qf(ß, f1, f2)
#
# R-Funktion mit Übergabeparameter:
# m (Anzahl der Personen mit der interessierenden Merkmalsausprägung),
> # n (Stichprobenumfang), alpha (Irrtumsrisiko)
> CI_pexakt <- function(m, n, alpha){
+
quantil_1 <- qf(alpha/2, 2*m, 2*(n-m+1))
+
pu <- m*quantil_1/(n-m+1+m*quantil_1)
+
+
+
+
quantil_2 <- qf(1-alpha/2, 2*(m+1), 2*(n-m))
po <- (m+1)*quantil_2/(n-m+(m+1)*quantil_2)
grenzen <- cbind(pu, po)
return(grenzen)}
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
69
>
>
>
>
#
options(digits=4)
# Funktionsaufruf mit m=35, n=50, alpha=5%
CI_pexakt(35, 50, 0.05)
pu
po
[1,] 0.5539 0.8214
> #
> # Hinweis: Das exakte Konfidenzintervall kann direkt mit der R-Funktion
binom.test bestimmt werden.
> # Aufruf: binom.test(m, n, 1-alpha)
> binom.test(35, 50, conf.level=0.95)
Exact binomial test
data: 35 and 50
number of successes = 35, number of trials = 50, p-value = 0.0066
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.5539 0.8214
sample estimates:
probability of success
0.7
Man beachte:
Bei großem n (n >20 und 10 ≤ m ≤ n-10) verwendet man in guter
Näherung das approximative (1-α)-Konfidenzintervall für p:
[h − d, h + d ]
mit d = z1−α / 2
h(1 − h)
n
Beispiel 3.12 (Forts.):
Man zeige, dass die Voraussetzungen für die approximative Berechnung
des Konfidenzintervalles für p erfüllt sind. Wie lauten die approximativen
Intervallgrenzen?
Wegen n=50>20 und 10 ≤ 35 ≤ 40 kann mit ausreichender Genauigkeit das
approximative Konfidenzintervall für p verwendet werden.
Lösung mit R:
R-Console:
>
>
>
>
#
#
#
#
Approximation für große Stichproben (n>20)
und nicht zu extremes m (10<=m<=n-10)
R-Funktion mit Übergabeparameter:
m (Anzahl der Personen mit der interessierenden Merkmalsausprägung),
> # n (Stichprobenumfang), alpha (Irrtumsrisiko)
> CI_papprox <- function(m, n, alpha){
+
h <- m/n
+
d <- qnorm(1-alpha/2)*sqrt(h*(1-h)/n)
+
pu <- h-d
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
70
+
po <- h+d
+
grenzen <- cbind(pu, po)
+
return(grenzen)}
> #
> # Funktionsaufruf mit m=35, n=50, alpha=5%
> CI_papprox(35, 50, 0.05)
pu
po
[1,] 0.573 0.827
Folgerung:
Aus dem approximativen Intervall ergibt sich eine grobe Faustformel für
den Mindeststichprobenumfang zur Schätzung einer Wahrscheinlichkeit
mit der vorgegebenen Genauigkeit ±d und der vorgegebenen
Sicherheit 1-α:
z

n ≈  1−α / 2 
 2d 
2
Beispiel 3.13:
Die Keimfähigkeit p von Blumenzwiebeln (d.h. die Wahrschein-lichkeit, dass ein
ausgesetzter Zwiebel keimt) soll in einem Feldversuch mit der Genauigkeit ±0,1 und
der Sicherheit 1-α= 0,95 geschätzt werden. Welcher Stichprobenumfang ist zu
planen?
Lösung mit Tabelle:
d=0,1; α=0,05; 1-α/2=0,975; z0,975=1,96 (Tabelle) à (Faustformel) à
n ≈ 96,04 ≈ 97.
Lösung mit R:
R-Console:
> # Approximativer Mindeststichprobenumfang für die Schätzung einer
> # Wahrscheinlichkeit zur vorgegebenen Genauigkeit d und Sicherheit S = 1-alpha
> # R-Funktion mit Übergabeparameter:
> # d (Genauigkeit=halbe Intervallbreite), S (Sicherheit)
> n_approx <- function(d, S){
+
alpha <- 1-S
+
quantil <- qnorm(1-alpha/2)
+
n <- (quantil/2/d)^2
+
return(n)}
> #
> # Funktionsaufruf mit d=0.1, S=0.95
> n_approx(0.1, 0.95)
[1] 96.04
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
71
Wie berechnet man ein (1-α)-Konfidenzintervall für den Parameter λ der
Poisson-Verteilung?
Es seien X eine Poisson-verteilte Zufallsvariable mit dem Parameter λ,
d.h. X ∼ Pλ und x = 0, 1, 2,… die Realisierungen von X.
Dann gilt:
§ Ein 2-seitiges (1-α)-Konfidenzintervall λu ≤ λ ≤ λo für λ ist ein
Intervall mit der Eigenschaft P(λu ≤ λ ≤ λo) = 1-α; die
Intervallgrenzen sind:
λu =
1 2
1
χ 2 x,α / 2 und λo = χ 22x+ 2 ,1−α / 2
2
2
§ 1-seitige (1-α)-Konfidenzintervalle für λ sind Intervalle der Form
λ ≤ λo bzw. λ ≥ λu mit der Eigenschaft P(λ ≤ λo) =
P(λ ≥ λu) = 1-α; λo und λu heißen obere bzw. untere
Vertrauensschranke für λ zur Sicherheit 1-α und sind zu berechnen
aus:
λo =
1 2
1
χ 2 x+2 ,1−α bzw. λu = χ 22x ,α
2
2
Beispiel 3.14:
Nach der ISO-Norm 13408-1 soll in einer Anlage zur aseptischen Abfüllung bei der
Prozessüberprüfung mit nicht weniger als 3000 Einheiten der Ausschussanteil von
0,1% nicht überschritten werden (Media fill-Forderung).
Bei einem Prüflauf mit 3000 Einheiten wurde eine kontaminierte Einheit festgestellt.
Ist die Media fill-Forderung erfüllt, wenn bei der Schätzung der Ausschussquote der
ungünstigste Wert (d.h. die zu einer vorgegebenen Sicherheit von 95% berechnete
obere Vertrauensschranke) angenommen wird?
Lösung mit Tabelle:
Es sei X die Anzahl der Einheiten, die von den insgesamt n=3000 abgefüllten
Einheiten kontaminiert sind.
Approximativ gilt: X ∼ Pλ mit λ = np (p ist der Ausschussanteil, d.h. die
Kontaminierungsrate).
Von X liegt die Realisierung x=1 vor.
Zu berechnen ist die 95%ige obere Vertrauensschranke λo für λ.
Mit 2x+2 = 4 und 1-α = 0,95 ist χ22x+2,1-α = χ24, 0.95 = 9,488 à λo = χ24, 0.95/2 =
4,744. Division durch n ergibt den Schätzwert p̂ = λo/n = 0,158% > 0,1%.
Die Media Fill-Forderung ist daher nicht erfüllt.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
72
3.5 EXKURS: STATISTISCHE PROZESSREGELUNG
In der statistischen Prozesslenkung (SPC Statistical Process Controll)
erfolgt eine laufende Überwachung eines Fertigungsprozesses
hinsichtlich eines Qualitätsmerkmals X. Zu diesem Zweck werden
regelmäßig Stichproben aus dem Prozesses entnommen und mit Hilfe
von Kennzahlen beurteilt, ob eine „Störung“ des Prozess vorliegt. Zur
Dokumentation des Prozessverlaufs werden sogenannte
Qualitätsregelkarten verwendet.
Wir betrachten den Einsatz von Qualitätsregelkarten zur Klärung der
Frage, ob ein Prozess „beherrscht“ ist. Für einen beherrschten Prozess
bleibt die Verteilung des Qualitätsmerkmals X im Laufe des Prozesses
unverändert. Wenn X – wie wir annehmen wollen - normalverteilt ist,
bedeutet dies, dass die Werte von X mit einer festen Fehlervarianz σ2
zufällig um einen festen Mittelwert (dem Fertigungsmittelwert) µ streuen.
Große oder systematische in eine Richtung gehende Abweichungen vom
Mittelwert deuten eine (unerwünschte) Änderung des Mittelwertes
und/oder der Standardabweichung an, die z.B. durch Störungen in der
Fertigungsanlage bedingt sein können.
Zur Überwachung des Mittelwerts µ findet die x -Karte, zur Überwachung
der Standardabweichung σ die s-Karte Anwendung. Mit diesen Karten
wird grundsätzlich nach folgendem Schema gearbeitet:
• Man entnimmt zum Zeitpunkt t1 eine Zufallstichprobe vom Umfang
n (z.B. n=5) und bestimmt damit den Stichprobenmittelwert x1 bzw.
die Standardabweichung s1.
• Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 )
außerhalb des mit der unteren und oberen Eingriffsgrenze
gebildeten Intervalls [UEG, OEG], wird der Prozessverlauf als
gestört angesehen und eingegriffen.
• Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 ) im
Intervall [UEG, OEG], wird der Prozessverlauf als ungestört
interpretiert und die Überwachung mit der Entnahme einer
neuerlichen Stichprobe zum Zeitpunkt t2 fortgesetzt.
Zusätzlich zur unteren und oberen Eingriffgrenze enthalten die x - und sKarte auch noch eine untere und eine obere Warngrenze (UWG, OWG).
Ein x - oder s- Wert außerhalb der Warngrenzen (aber noch innerhalb
der Eingriffsgrenzen) ist im Allgemeinen Anlass zu erhöhter
Aufmerksamkeit, die sich z.B. in einer Verkürzung der Zeitpunkte
zwischen den Stichprobenentnahmen ausdrückt.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
73
Die Eingriffsgrenzen der Mittelwertkarte ( x -Karte) werden aus der
Forderung P( X < UEG) = P( X > OEG) = 0,5% bestimmt; daraus ergibt
sich
UEG = µˆ − z0, 995σˆ / n , OEG = µˆ + z0, 995σˆ / n ;
analog werden die Warngrenzen aus der Forderung P( X < UWG) =
P( X > OWG) = 2,5%, d.h.
UWG = µˆ − z0 ,975σˆ / n , OWG = µˆ + z0 ,975σˆ / n .
In diesen Formeln sind µ̂ und σ̂ Schätzwerte für den Fertigungsmittelwert µ und die Fertigungsstreuung σ, die im Allgemeinen aus einem
Vorlauf mit einer großen Anzahl von Stichprobenwerten bestimmt
werden. Zu diesem Zweck werden Zu diesem Zweck werden dem
Fertigungsprozess in 20 bis 30 aufeinanderfolgenden Zeitpunkten
Stichproben (jeweils vom Umfang n) entnommen. Den Schätzwert µ̂
gewinnt man durch Mittelung der Stichprobenmittelwerte über die
Erhebungszeitpunkte; analog wird σ2 durch den Mittelwert der Stichprobenvarianzen geschätzt, die Quadratwurzel dieses Mittelwerts ist
schließlich der gesuchte Schätzwert σ̂ für σ.
Neben den Eingriffs- und Warngrenzen ist in der x -Karte auch der
Schätzwert µ̂ für den Fertigungsmittelwert (als Mittellinie MLµ = µ̂
parallel zur Zeitachse) eingezeichnet.
Die Eingriffsgrenzen der s-Karte werden aus der Forderung P(S2 <
UEG2) = P(S2 > OEG2) = 0,5% bestimmt; daraus ergibt sich
χ n2−1, 0.005
χ n2−1, 0.995
UEG = σˆ
, OEG = σˆ
.
n −1
n −1
analog werden die Warngrenzen aus der Forderung Forderung P(S2 <
UWG2) = P(S2 > OWG2) = 2,5% bestimmt, d.h.
UWG = σˆ
χ n2−1, 0.025
n −1
, OWG = σˆ
χ n2−1, 0.975
n −1
.
Für die Mittellinie der s-Karte ergibt sich die Lage
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
74
n
Γ 
2
2 .
MLs = E[ S ] = k nσˆ mit k n =
n − 1  n − 1
Γ

 2 
Beispiel 3.15:
Zur Erstellung einer x - und s-Karte zur Überwachung des Fertigungsmittelwerts
bzw. der Streuung des Durchmessers eines Produktes (Nennmaß 4,5mm) werden
aus einem Vorlauf 20 Stichproben vom Umfang n=5 in aufeinanderfolgenden
Zeitpunkten der Fertigung entnommen und die gemessenen Durchmesser
zusammen mit den Mittelwerten und Varianzen dokumentiert.
Daten:
Zeitpunkt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
4,46
4,91
5,36
4,97
4,50
4,20
4,61
4,45
4,18
4,45
3,96
4,52
4,77
4,30
4,31
4,26
4,17
4,76
4,82
4,52
Proben-Durchmesser
4,50 4,59 4,35
4,32 4,39 4,59
4,32 5,34 4,47
5,00 4,24 4,92
4,69 4,45 4,34
4,35 4,44 3,98
4,44 4,58 4,31
4,38 4,55 4,39
4,43 4,72 4,44
4,37 4,30 3,51
4,69 4,20 4,01
4,21 4,58 4,33
4,50 4,35 4,51
4,37 4,51 4,60
4,29 4,10 4,18
4,65 4,54 4,88
4,22 4,62 4,22
4,31 4,08 4,17
4,76 4,49 4,10
4,82 4,42 4,40
4,65
4,88
4,64
4,95
4,42
4,56
4,17
4,24
4,20
4,31
3,91
4,84
4,27
4,27
4,24
4,68
4,59
4,63
4,72
4,24
Mittelwert Varianz
4,510
0,0136
4,618
0,0739
4,826
0,2417
4,816
0,1045
4,480
0,0172
4,306
0,0505
4,422
0,0342
4,402
0,0128
4,394
0,0483
4,188
0,1472
4,154
0,1018
4,496
0,0588
4,480
0,0366
4,410
0,0198
4,224
0,0073
4,602
0,0516
4,364
0,0489
4,390
0,0864
4,578
0,0870
4,480
0,0462
4,457
0,0644
Lösung:
Die Mittelwerte und Varianzen der zu den vorgegebenen Zeitpunkten entnommenen
Zufallsstichproben sind bereits der Datenmatrix beigefügt, ebenso der
Gesamtmittelwert 4,457 (Mittelwert der Einzelmittelwerte) und die Gesamtvarianz
0,0644 (Mittelwert der Einzelvarianzen); die entsprechende GesamtStandardabweichung ist 0,2538.
Bestimmung der Mittelwertkarte:
ML = 4,457; z0,995 = 2,576; UEG = 4,457– 2,576×0,2538/√5 = 4,165; OEG = 4,749;
z0,975 = 1,960; UWG = 4,457– 1,96×0,2538/√5 = 4,235; OWG = 4,680.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
75
5,000
OEG
4,800
OWG
4,600
ML
4,400
UWG
4,200
UEG
4,000
0
2
4
6
8
10
12
14
16
18
20
Bestimmung der s-Karte:
k5 = (1/√2 )Γ(5/2)/Γ(2) = (1/√2 )⋅ (3/2)(√π)/2 = 0,940; ML = 0,940×0,2538 = 0,2386;
χ24,0.005 = 0,207; χ24,0.995 = 14,86; UEG = 0,2538 √(0,207/4) = 0,0577; OEG = 4892;
χ24,0.025 = 0,4844; χ24,0.975 = 11,143; UWG = 0,2538 √(0,0,4844/4) = 0,0883; OWG =
4236;
0,6
OEG
0,4
OWG
0,2
ML
UWG
UEG
0
0
2
4
6
8
10
12
14
16
18
20
Interpretation:
In der Mittelwertkarte werden die Eingriffsgrenzen zu zwei Zeitpunkten über- bzw.
unterschritten. In diesen Fällen nimmt man an, dass diese Werte nicht mehr als
zufällig zu betrachten sind, d.h. auf eine systematische Änderung des
Fertigungsmittelwertes hinweisen; der Vorlauf wäre abzubrechen und die
ursprüngliche Lage des Mittelwertes herzustellen. Wirken nur noch zufällige
Ursachen, heißt der Prozess stabil. Analog wird bei Über-/Unterschreitung der
Eingriffsgrenzen in der s-Karte angenommen, dass eine systematische Veränderung
der Fertigungsstreuung stattgefunden hat. Die s-Karte gibt ferner über die Größe der
Streuung Auskunft Ist die Streuung zu groß, wird der Prozess als „nicht fähig“
bezeichnet; zur Beurteilung der Prozessfähigkeit existieren eigene Kennwerte.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
76
3.6 ÜBUNGSBEISPIELE
Einfache Übungsbeispiele:
1. Die nachfolgende Tabelle enthält die Gesamtzahl der bis zum Aussterben
abgelegten Puparien für 40 (mit jeweils 15 geschlüpften Weibchen gebildete)
Kohorten von Tsetsefliegen (Glossina p. palpalis). Man stelle die Verteilung der
Merkmalswerte durch eine Häufigkeitstabelle und ein Histogramm dar. Ferner
bestimme man das arithmetische Mittel und die Standardabweichung sowie den
Median und die Quartile. (Mittelwert/Standardabw./Median/Quartile: 60.38, 9.87,
60, 53, 68)
55
79
55
61
55
55
40
72
69
54
51
48
53
61
44
62
50
71
72
51
63
86
52
57
73
74
62
66
62
55
63
72
52
53
65
59
53
69
67
54
2. Nach einer Kfz-Unfallstatistik ist die Anzahl X der Unfälle pro Versicherten
innerhalb von 20 Jahren wie folgt verteilt:
X
rel.Häufigk.%
0
1
2
3
10 20 15 10
4
8
5
7
6
6
7
5
8
4
9 10 11-20
3 2
je 1
Welcher Prozentsatz der Fahrer hat eine über dem arithmetischen Mittelwert
(über dem Median) von X liegende Unfallzahl?
3. Man vergleiche die durch die folgenden Stichproben gegebene Variation von X
(Spaltöffnungslänge in µm) bei diploiden und tetraploiden Biscutella laevigata mit
Hilfe der entsprechenden Box-Plots. (Median/Quartile 25, 23, 26; 30, 28, 32)
diploid
tetraploid
27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26,
23, 24, 26, 26
28, 30, 32, 29, 28, 33, 32, 28, 30, 31, 31,
34, 27, 29, 30
4. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine
Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm).
Man stelle die Verteilung der Ozonkonzentration dar (tabellarisch, grafisch) und
berechne den Mittelwert, die Standardabweichung, den Median und die Quartile.
(5.21, 1.85, 5.4, 4.1, 6.5)
3.6
1.5
6.6
6.0
4.2
6.7
2.5
5.4
4.5
5.4
2.5
3.0
5.6
4.7
6.5
6.7
1.7
5.3
4.6
7.4
5.4
4.1
5.1
5.6
5.4
6.1
7.6
6.2
6.0
5.5
5.8
8.2
3.1
5.8
2.6
9.5
3.4
8.8
7.3
1.3
6.9
3.2
4.7
3.8
5.9
6.6
4.4
5.7
4.5
7.7
5. Man nehme eine geeignete Klassenbildung vor und stelle die Verteilung von X
(größte Grundblattlänge von Biscutella laevigata in mm) tabellarisch und
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
77
graphisch dar. Zusätzlich bestimme man das arithmetische Mittel, den Median
und die Varianz aus den klassierten Daten und vergleiche die erhaltenen
Ergebnisse mit den direkt aus der Beobachtungsreihe berechneten
Kenngrößenwerten. (exakte Werte: 69.13, 28.86, 65)
50
48
75
90
65
50
64
91
32 77 65 85 36 63
26 84 62 137 36 70
48 125 95 51 78 39
52 80 72 67 24 58
97 140
48 63
66 138
70 48
6. Die Sprosshöhe X einer Pflanze sei N(µ, σ2)-verteilt. a) Aus einer Stichprobe vom
Umfang n=25 ergibt sich die Stichprobenvarianz s2=7714. Man gebe ein
Konfidenzintervall zum Niveau 1-α=0.95 für σ an. b) Für den Mittelwert und die
Standardabweichung von X wurden mit Hilfe einer Stichprobe vom Umfang n=40
die Schätzwerte 296 und 105 für den Mittelwert bzw, die Standardabweichung
bestimmt. Man bestimme zum Niveau 1-α=0.95 ein Konfidenzintervall für den
Mittelwert von X. ([68.6, 122.2]; [262.4, 329.6])
7. Im folgenden wird X als N(µ, σ2)-verteilt vorausgesetzt. Welcher
Stichprobenumfang ist jeweils zu planen?
a) Der mittlere Glykoalkaloidgehalt X (in mg/100 mg Frischgewicht) einer
Kartoffelsorte soll mit einer Genauigkeit von ± 0.4 bei einer Sicherheit von 99%
bestimmt werden. Von einer Voruntersuchung sei bekannt, dass σ ≤ 2 ist.
b) Das Normgewicht von 10-jährigen Knaben soll auf ± 0.5 kg genau mit einer
Sicherheit von 95% bestimmt werden. Für die Standardabweichung möge die
Abschätzung σ ≤ 2.5 kg zutreffen. (167; 96)
8. Für den Mittelwert und die Varianz von einer als normalverteilt angenommenen
Variablen X wurden mit Hilfe einer Stichprobe vom Umfang n=15 die Werte 40
bzw. 10 bestimmt. Man bestimme ein 95%- Konfidenzintervall für den Mittelwert
von X. Um wie viel % größer ist die Intervalllänge eines 99%igen
Konfidenzintervalls? ([38.25, 41.75]; [37.57, 42.43]; 38.8%)
9. Die Masse X (in mg) einer Substanz in einem Präparat soll absolut auf +/-0,5
genau mit einer Sicherheit von 95% bestimmt werden. Für die
Standardabweichung möge die Abschätzung s≤2 zutreffen. Wie viele Proben
müssen untersucht werden, wenn X als normalverteilt vorausgesetzt werden
kann? (62)
10. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 29, 110, 47, 35, 65, 69, 9, 10. Man
bestimme ein 95%-Konfidenzintervall für den Mittelwert und die
Standardabweichung von X. ([18.39, 75.11]; [22.43, 69.05])
11. In einer Studie wurden 33 Personen mit einem Präparat behandelt. Der
Behandlungserfolg wurde auf einer 2-stufigen Skala mit den Skalenwerten
"Verbesserung" und "keine Verbesserung" dargestellt. Es ergab sich bei 13
Personen eine Verbesserung. Man bestimme ein 95%iges Konfidenzintervall für
die Wahrscheinlichkeit p einer Verbesserung. Welcher Stichprobenumfang
müsste geplant werden, um die Wahrscheinlichkeit p mit einer Genauigkeit von
+/- 0,1 und einer Sicherheit von 95% schätzen zu können? ([0.227, 0.561]; 97)
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
78
12. In einem Supermarkt wurden 100 Milchpackungen überprüft und dabei
festgestellt, dass in 15 Fällen die Milch im Begriffe war, sauer zu werden. Man
bestimme ein Konfidenzintervall zum Niveau 1-α=95% für den Anteil der sauren
Milchpackungen. ([0.08, 0.22])
13. Die Wahrscheinlichkeit für das Auftreten einer Erkrankung soll in einer
Risikogruppe mit einer Sicherheit von 95% und einer vorgegebenen Genauigkeit
von ± 0.05 bestimmt werden. Wie viele Probanden benötigt man für die Studie?
(385)
14. Von einer Pflanze erhielt Mendel insgesamt 62 Samen, von denen 44 gelb und 18
grün gefärbt waren. Man bestimme ein 95%iges Konfidenzintervall für die
Wahrscheinlichkeit p dafür, dass ein gelber Same gebildet wird. Welcher
Stichprobenumfang müsste geplant werden, um die Wahrscheinlichkeit p mit
einer Genauigkeit von +/- 0,05 und einer Sicherheit von 90% schätzen zu
können? ([0.597, 0.823]; 271)
Anspruchsvollere Übungsbeispiele:
15. Rutherford und Geiger studierten die Emission von α-Teilchen, indem sie die
Anzahl X der in Zeitintervallen der Länge 7,5s emittierten α-Teilchen zählten. Die
Auswertung von 2608 Zeitintervallen ergab die in der folgenden Tabelle
zusammengefassten Häufigkeiten H. Unter der Annahme, dass X Poisson-verteilt
ist, schätze man den Verteilungsparameter λ und bestimme die erwarteten
Häufigkeiten E. (λ = 3.867, E-Werte: siehe Tabelle)
X
0
1
2
3
4
5
6
7
8
9
10
>10
H
57
203
383
525
532
408
273
139
45
27
16
0
E
54.54
210.94
407.89
525.81
508.37
393.21
253.44
140.02
67.69
29.09
11.25
5.75
16. An sieben Patienten wurde der systolische Blutdruck im Sitzen (in mm Hg) vor
einer Behandlung (Variable Xv) und nachher (Variable Xn) gemessen; es ergaben
sich die in der folgenden Tabelle angeführten Werte. Man bestimme den
Mittelwert und die Varianz des durch die Differenz Xn - Xv ausgedrückten
Behandlungseffektes. Wie hängen diese Statistiken mit den Mittelwerten bzw.
Varianzen von Xv und Xn zusammen? (-21, 190)
Xv
Xn
175 155 195 173 154 180 178
140 143 157 170 133 150 170
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
79
17. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurden 151
Patienten mit Heparain therapiert, von denen 19 innerhalb von 28 Tagen
verstarben. Man schätze die Wahrscheinlichkeit p, dass ein Patient innerhalb von
28 Tagen nach Herzinfarkt stirbt, und bestimme für p ein 95%-Konfidenzintervall.
(approx. 0.0729, 0.1787; exakt: 0.0775, 0.1895)
18. Nach der ISO-Norm 13408-1 soll in einer Anlage zur aseptischen Abfüllung bei
der Prozessüberprüfung mit nicht weniger als 3000 Einheiten der Ausschussanteil
von 0,1% nicht überschritten werden (Media fill-Forderung). Bei einem Prüflauf
mit 10000 Einheiten wurden drei kontaminierte Einheiten festgestellt. Ist die
Media fill-Forderung erfüllt, wenn bei der Schätzung der Ausschussquote der
ungünstigste Wert (d.h. die zu einer vorgegebenen Sicherheit von 95%
berechnete obere Vertrauensschranke) angenommen wird? (0,078% < 0,1%,
Forderung erfüllt)
3.7 REPETITORIUM: BEGRIFFE UND METHODEN
1. Wann ist zur tabellarischen oder grafischen Darstellung der Häufigkeitsverteilung
eines Merkmals X jedenfalls eine Klassenbildung vorzunehmen? Geben Sie an,
unter welchen Bedingungen Sie die Häufigkeitsverteilung mit den relativen
Klassenhäufigkeiten beschreiben! Wann würde Sie die relativen
Klassenhäufigkeitsdichten verwenden?
Antwort:
Bei einem quantitativen, diskreten Merkmal ist eine Klassenbildung vorzunehmen,
wenn es viele verschiedene Merkmalswerte gibt. Bei einem stetigen Merkmal ist
jedenfalls eine Klassenbildung vorzunehmen. In beiden Fällen erhält man nur
dann Aufschluss über die Verteilung des Merkmals, wenn der Stichprobenumfang
nicht zu klein ist (Richtwert: n>15). Eine Darstellung mit relativen
Klassenhäufigkeiten erlaubt den Vergleich von Verteilungen bei unterschiedlichen
Stichprobenumfängen; die Summe der relativen Klassenhäufigkeiten ist stets 1
(bzw. 100%). Die relative Klassenhäufigkeitsdichte ist so normiert, dass ihre mit
der Klassenbreite multiplizierte Summe gleich 1 ergibt. Ein mit der relativen
Klassenhäufigkeitsdichte erstelltes Histogramm kann wegen dieser Normierung
direkt mit der Wahrscheinlichkeitsdichte eines theoretischen Verteilungsmodells
(z.B. Normalverteilung) verglichen werden. Der Vergleich erlaubt eine
Einschätzung, ob die Merkmalsvariation durch ein bestimmtes Verteilungsmodell
erfasst werden kann.
2. Unter welcher Bedingung würden Sie zur Beschreibung der Häufigkeitsverteilung
eines Merkmals als Lage- und Streuungsmaß den arithmetischen Mittelwert bzw.
die Standardabweichung empfehlen? Welche Alternative dazu gibt es, die
zentrale Lage und die „Breite“ der Verteilung zu kennzeichnen?
Antwort:
Der arithmetische Mittelwert und die Standardabweichung eignen sich als gute
Kennwerte zur Beschreibung der zentralen Lage und der Streuung von
Merkmalswerten, wenn das Merkmal stetig oder quantitativ-diskret vom Typ eines
Zählmerkmals ist und die Häufigkeitsverteilung keine zu „stark“ Asymmetrie
erkennen lässt. Bei starker Asymmetrie verwendet man besser den Median, der
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
80
in diesem Fall besser den „mittleren“ Wert einer Messreihe wiedergibt; das
entsprechende Streuungsmaß ist der Interquartilabstand, also die Differenz aus
dem oberen Quartil (75%-Quantil) und dem unteren Quartil (25%). Die
Asymmetrie einer Häufigkeitsverteilung wird numerische durch die sogenannte
Schiefe ausgedrückt; diese besitzt den Wert null für eine symmetrische
Verteilung, ist positiv für eine „linkssteile“ Verteilung und negativ für eine
„rechtssteile“ Verteilung. Für eine linkssteile Verteilung ist der Median kleiner als
der Mittelwert, für eine rechtsteile Verteilung größer; für eine symmetrische
Verteilung fallen der Median und der Mittelwert zusammen.
3. Was versteht man unter Zentrieren einer Messreihe, was unter Standardisieren?
Antwort:
Unter einer Messreihe versteht man eine Stichprobe, die durch wiederholtes
Messen eines metrischen Merkmals X gewonnen wurde. Die Stichprobe heißt
„zentriert“, wenn der arithmetische Mittelwert der Stichprobenwerte gleich null ist.
Dies erreicht man so, dass von jedem Einzelwert der arithmetische Mittelwert
subtrahiert wird. Werden die so gebildeten Abweichungen vom Mittelwert
überdies noch durch die Standardabweichung der Messreihe dividiert, erhält man
die standardisierten Werte der Messreihe. Eine standardisierte Messreihe hat den
Mittelwert 0 und die Standardabweichung 1. Messreihen werden standardisiert,
um sie – durch Normierung der zentralen Lage und der Streuung – in anderen
Verteilungseigenschaften (z.B. der Asymmetrie) vergleichbar zu machen.
4. Mit welcher Stichprobenfunktion wird der Mittelwert einer N(µ, σ2)-verteilten
Zufallsvariablen X geschätzt? Warum sind Stichprobenmittelwerte „gute“
Schätzwerte?
Antwort:
Zur Schätzung des Verteilungsparameters µ benötigt man eine Zufallsstichprobe
von X, die man durch wiederholtes Messen der Größe X erhält. Wenn wir
insgesamt n-mal messen, können die Ergebnisse der Messvorgänge von X durch
die Zufallsvariablen Xi (i=1,2,...,n) ausgedrückt werden. In diesem Sinne ist z.B.
X1 das Ergebnis des Zufallsexperimentes „1. Messung von X“ usw. Wenn die
Messvorgänge knapp hintereinander erfolgen, kann man annehmen, dass sich
die Verteilung von X nicht verändert hat, d.h. alle Zufallsvariablen sind - wie X –
als normalverteilt mit den Parametern µ und σ2 anzunehmen. Der (arithmetische)
Mittelwert X = (X1 + X2 + ... + Xn)/n der Zufallsvariablen X1, X2, ..., Xn ist eine
sogenannte Stichprobenfunktion, die als Stichprobenmittel bezeichnet wird; durch
die Bezeichnung „Stichprobenfunktion“ wird die Abhängigkeit von den
Messergebnissen zum Ausdruck gebracht. Das Stichprobenmittel ist eine „gute“
Schätzfunktion für µ; von einer guten Schätzfunktion für einen
Verteilungsparameter erwartet man, dass die Werte der Schätzfunktion mit hoher
Wahrscheinlichkeit eng um den zu schätzenden Parameter verteilt sind.
Tatsächlich trifft dies auf das Stichprobenmittel in so ferne zu, als man zeigen
kann, dass X normalverteilt ist mit dem Mittelwert µ und der
Standardabweichung σ/√n, die mit wachsendem n gegen Null strebt. Die
Standardabweichung von X heißt Standardfehler von X. Setzt man die konkret
gemessenen Werte x1, x2, ..., xn für X1, X2, ... , Xn in das Stichprobenmittel ein,
ergibt sich ein Schätzwert x für µ.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
81
5. Mit welcher Stichprobenfunktion wird die Varianz einer N(µ, σ2)-verteilten
Zufallsvariablen X geschätzt?
Antwort:
Wie bei der Mittelwertschätzung bezeichnen die Zufallsvariablen X1, X2, ..., Xn die
Ergebnisse der n Messungen von X. Bildet man damit die Zufallsvariable
[
]
S 2 = (X 1 − X ) + ( X 2 − X ) + ... + ( X n − X ) /( n − 1) erhält man die als
2
2
2
Stichprobenvarianz bezeichnete Schätzfunktion für die Varianz σ2 der
normalverteilten Zufallsvariablen X. Die Wurzel aus der Stichprobenvarianz ist die
Stichprobenstandardabweichung S. Man kann zeigen, dass der Mittelwert von S2
mit dem zu schätzenden Verteilungsparameter σ2 zusammenfällt und die Varianz
von S2 mit wachsendem n gegen null strebt. Durch Einsetzen der konkret
gemessenen Werte x1, x2, ..., xn für X1, X2, ... , Xn in die Stichprobenvarianz, erhält
man die empirische Varianz s2, die ein Schätzwert für σ2 ist.
6. Wie berechnet man ein 95%iges Konfidenzintervall für den Mittelwert einer
N(µ,σ2)-verteilten Zufallsvariablen? Wie ist das Intervall zu interpretieren?
Antwort:
Das (1-α)-Konfidenzintervall für den Mittelwert µ einer normalverteilten
Zufallsvariablen ist ein symmetrisches Intervall um das Stichprobenmittel X . (Im
Falle 1-α=95% spricht man von einem 95%igem Konfidenzintervall.) Die Breite 2d
des Intervalls ist ein Maß für die Genauigkeit der Schätzung; man erwartet, dass
das Intervall mit wachsendem Stichprobenumfang kleiner wird; die halbe Breite d
des Intervalls ist gleich dem Produkt des Standardfehlers SE = S / n und dem
(1-α/2)-Quantil tn-1, 1-α/2 der t-Verteilung mit n-1 Freiheitsgraden; man beachte
beim Standardfehler SE, dass die Standardabweichung σ durch die Stichprobenstandardabweichung ersetzt wurde, die eine Zufallsvariable darstellt. Die untere
Grenze des (1-α)-Konfidenzintervalls für µ ist UG= X - d, die obere Grenze
OG= X + d. Die Grenzen UG und OG sind Stichprobenfunktionen (also
Zufallsvariablen) mit der Eigenschaft, dass sie mit der Wahrscheinlichkeit 1-α den
Mittelwert µ einschließen. Für eine konkrete Zufallsstichprobe sind die Grenzen
feste Zahlenwerte; die Wahrscheinlichkeit, mit diesen Zahlenwerten ein Intervall
zu haben, das den Mittelwert µ einschließt, beträgt gerade 1-α.
7. Wodurch erreicht man bei einem Konfidenzintervall für den Mittelwert µ einer
N(µ,σ2)-verteilten Zufallsvariablen eine höhere Genauigkeit (d.h. eine kleinere
Intervallbreite)?
Antwort:
Die halbe Intervallbreite ist verkehrt proportional zu n , d.h. mit wachsendem
Umfang der Zufallsstichprobe wird die Genauigkeit größer. Bei größerem n (etwa
ab n=20) kann mit für die Praxis ausreichender Näherung das Quantil tn-1, 1-α/2
durch das entsprechende (1-α/2)- Quantil z1-α/2 der Standardnormalverteilung
(
)
ersetzt werden, so dass d = s / n z1−α / 2 gilt. Durch Auflösen nach n erhält man
die Formel n = (sz1−α / 2 / d ) , mit der man näherungsweise den erforderlichen
2
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010
82
Mindeststichprobenumfang zur Erreichung einer vorgegebenen Genauigkeit d
und einer vorgegebnen Sicherheit 1-α bestimmen kann. Im Besonderen erkennt
man nun, dass eine kleines d (hohe Genauigkeit) ein großes n impliziert; in die
gleiche Richtung wirkt eine große Sicherheit (kleines α).
8. Mit welcher Stichprobenfunktion wird die Wahrscheinlichkeit p einer
Zweipunktverteilung geschätzt? Wodurch erreicht man eine hohe Genauigkeit der
Schätzung?
Antwort:
Es sei X ein zweistufiges Merkmal und a die interessierende Merkmalsausprägung (z.B. Verbesserung nach einer Behandlung). Die Beobachtung dieses
Merkmals an n Untersuchungseinheiten möge m Untersuchungseinheiten mit der
Ausprägung a (Verbesserung) ergeben. Wiederholt man die Beobachtung von X
an n Untersuchungseinheiten, so ergibt sich i. Allg. ein anderer Wert für die
absolute Häufigkeit, mit der X den Wert a annimmt. Die absolute Häufigkeit m ist
wie die relative Häufigkeit h=m/n eine Stichprobenfunktion. Letztere wird zur
Schätzung der Wahrscheinlichkeit p = P(X=a) verwendet. Für große n (n > 20)
und nicht zu große oder kleine Werte von m (10 ≤ m ≤ n-10) ist die relative
Häufigkeit h näherungsweise normalverteilt mit dem Mittelwert p und der
Standardabweichung σ h =
p (1 − p ) / n , die durch den Standardfehler
SEh = h(1− h ) / n geschätzt wird. Mit wachsendem n geht SE h gegen null, so
dass die Schätzwerte für p (die Werte der Stichprobenfunktion h) bei großem n
mit hoher Wahrscheinlichkeit nahe bei p liegen. Unter den angeführten
Voraussetzungen ist die halbe Breite d des (1-α)-Konfidenzintervalles für die
Wahrscheinlichkeit p durch d = z1−α / 2 SE h und die Intervallgrenzen durch UG=h-d
bzw. OG= h+d gegeben.
9. Wie bestimmt man einen Näherungswert für den Mindestumfang n einer
Stichprobe, mit der eine Wahrscheinlichkeit p so geschätzt werden soll, dass eine
vorgegebene Sicherheit 1-α und vorgegebene Genauigkeit d (halbe Breites des
(1-α)-Konficenzintervalls) eingehalten wird?
Antwort:
Die halbe Intervallbreite d des (1-α)-Konfidenzintervalls für p ist durch
d = z1−α / 2 SEh = z1−α / 2 h(1 − h) / n gegeben. Auflösen nach n ergibt wegen
h(1-h)≤ ½ (0 ≤ h ≤ 1) die Abschätzung n =
z2
1−α / 2
d
2
h(1 − h) ≤
z2
1−α / 2
4d 2
für den
Mindesstichprobenumfang.
W. Timischl: Statistik, Parameterschaetzung_10_Text
05.10.2010

Zugehörige Unterlagen

+ = + ganz n 2

Vermischte Aufgaben zur Differenzial

Anova: Einfaktorielle Varianzanalyse ZUSAMMENFASSUNG

3 PARAMETERSCHÄTZUNG: GENAUIGKEIT UND SICHERHEIT

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können