Stichproben und statistische Fehler

Kapitel 10
Stichproben und statistische Fehler
10.1
Verfahren zur Auswahl von Stichproben
Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung
der Stichprobe soll dann auf die Grundgesamtheit geschlossen werden.
Ziel:
10.1.1
Ergebnis der Untersuchung der Stichprobe
= Ergebnis der Untersuchung der Grundgesamtheit, wenn sie exakt durchgeführt werden
könnte, bis auf einen abschätzbaren Fehler, dessen Grenzen vor der Untersuchung
festgelegt werden sollten.
Zufällige Auswahlverfahren
Def. 10.1.1: Eine (streng) zufällige Auswahl einer Stichprobe liegt vor, wenn bei jeder
Ziehung gilt: Jedes Element der Grundgesamtheit (bei ”m. Z.”) bzw. des Restes der Grundgesamtheit (bei ”o. Z.”) hat die gleiche Chance, gezogen zu werden.
Wichtiges Hilfsmittel: Zufallszahlen.
Def. 10.1.2: (zi ) heißt eine Folge von Zufallsziffern, wenn jedes zi eine Realisierung einer ZV
Zi ist, für die gilt:
a) Zi nimmt die Werte 0, 1, . . . , 9 jeweils mit der Wahrscheinlichkeit 0.1 an.
b) Die Zi bilden eine Folge von unabhängigen ZV.
Def. 10.1.3: k sei eine feste natürliche Zahl. (xi ) heißt eine Folge von Zufallszahlen (mit
Stellenzahl ≤ k), wenn jedes xi eine Realisierung einer ZV Xi ist, für die gilt:
a) Xi nimmt die Werte 0, 1, 2, . . . , 10k − 1 jeweils mit der Wahrsch. 10−k an.
b) Die Xi bilden eine Folge von unabhängigen ZV.
Die xi erhält man durch Zusammenfassung von je k Zufallsziffern, wobei Lücken und Überlappungen vermieden werden sollten. Bei der Verwendung von Zufallszahlentabellen sollte die
Anfangsstelle zufällig ausgewählt werden.
Beispiel 10.1.1: Mit Hilfe der Zufallsziffern
3, 3, 2, 6, 7, 7, 9, 3, 9, 9, 3, 0, 1, 3, 6, 0, 4, 1
bilden wir vier ganzzahlige Zufallszahlen mit Stellenzahl ≤ 4:
123
3326,
=: x1 ,
7793,
=: x2 ,
9930,
=: x3 ,
1360
=: x4
Dies sind Realisierungen von unabhängige Zufallsvariablen
X1 , X2 , X3 , X4
mit
P (Xi = m) = 10−4 ,
m = 0, 1, 2, . . . , 9, 10, 11, . . . , 9999
Def. 10.1.4 (xi ) heißt eine Folge von z.B. reellen, auf (0, 1] gleichverteilten Zufallszahlen,
wenn jedes xi Realisierung einer ZV Xi ist, für die gilt:
a) Xi ist auf (0, 1] gleichverteilt, d.h. es gilt: 0 < Xi ≤ 1 und P (a < Xi ≤ b) = b − a für
0 ≤ a ≤ b ≤ 1.
b) Die Xi bilden eine Folge von unabhängigen ZV.
Statt “echter” Zufallszahlen verwendet man meist Pseudo-Zufallszahlen. Dies sind von Rechenprogrammen erzeugte Zahlen, die deshalb keine Zufallszahlen sein können, aber in ausreichender
Näherung die gleichen Eigenschaften wie “echte” Zufallszahlen haben.
Allgemeines Verfahren zur (streng) zufälligen Auswahl einer Stichprobe vom Umfang n:
Annahme: Die Elemente der Grundgesamtheit sind registriert und durchnumeriert mit den Nummern 1, 2, . . . , N .
Ziehe n auf (0, 1] gleichverteilte (Pseudo-)Zufallszahlen xi . Bilde daraus zunächst die Zahlen
yi := xi · N. Diese Zahlen sind auf (0, N ] gleichverteilte (Pseudo-)Zufallszahlen. Bestimme daraus für jedes i = 1, . . . , n die Zahl ui als nächst größere ganze Zahl, d.h. ui ist die kleinste ganze
Zahl mit der Eigenschaft ui ≥ yi . Die Elemente mit den Nummern u1 , u2 , . . . un bilden dann eine
(streng) zufälligen Stichprobe vom Umfang n m.Z.
Will man eine (streng) zufälligen Stichprobe vom Umfang n o.Z., so muss man jedes ui , das zum
zweitenmal vorkommt, streichen, und wenn nötig weitere auf (0, 1] gleichverteilte
(Pseudo-)Zufallszahlen xi ziehen und verarbeiten.
Beispiel 10.1.2: Wir wollen eine Stichprobe vom Umfang 4 o.Z. aus einer Grundgesamtheit von
900 Elementen ziehen. Dazu lassen wir uns vom Computer reelle Zufallszahlen zwischen 0 und
1 erzeugen und bilden daraus nach dem oben beschriebenen Verfahren die für die Stichprobe
benötigten Zufallszahlen:
i
xi
yi = xi · 900 ui := nächst größere ganze Zahl, nicht gerundete Zahl
1 0.833236
749.912
750
2 0.498096
448.286
449
3 0.195437
175.893
176
4 0.236627
212.964
213
Wir wählen also die Elemente 176, 213, 449 und 750 aus der Grundgesamtheit für die Stichprobe
aus.
Quellen für Folgen von Zufallsziffern und –zahlen:
a) Tabellen in Statistik–Lehrbüchern
b) The Rand Corporation: A Million Random Digits with 100,000 Normal Deviates, Glencoe
(Illinois), 1955
c) Feste Unterprogramme in Rechenanlagen
124
10.1.2
Andere Auswahlverfahren
Gründe für nicht streng zufällige Auswahlverfahren: Streng zufällige Verfahren sind nicht immer
möglich oder zu aufwendig, Vorkenntnisse bleiben unberücksichtigt, Vereinfachungen erwünscht.
Geschichtete Stichprobe:
Aufteilung der Grundgesamtheit in Schichten (z.B. Arbeitnehmer, Freiberufliche ...).
Zufällige Stichprobe aus jeder Schicht o.Z.
Bezeichnungen der relevanten Größen:
k
Schichten
Ni (keine ZV) Umfang der Schicht i (i = 1, 2, . . . , k)
!
ni (≥ 1)
µi
Umfang der auf Schicht i entfallenden Teilstichprobe
arithmetisches Mittel der Merkmalswerte aller statistischen
Elemente in Schicht i
modifizierte Standardabweichung der Merkmalswerte aller
statistischen Elemente in Schicht i
arithmetisches Mittel der Merkmalswerte aller statistischen
Elemente in der Grundgesamtheit
modifizierte Standardabweichung der Merkmalswerte aller
statistischen Elemente in der Grundgesamtheit
σ
ei
µ
σ
e
n :=
k
P
ni
i=1
k
P
N :=
Ni
Gesamtstichprobenumfang
Umfang der Grundgesamtheit
i=1
xij
Merkmalswert von dem statistischen Element Nummer j aus
der Schicht i
Ai
Menge der Nummern der statistischen Elemente aus Schicht
i, die für die Teilstichprobe ausgewählt werden. Die Auswahl
aus einer Schicht geschieht unabhängig von der Auswahl aus
jeder anderen Schicht.
Definitionen und Eigenschaften:
card Ai = ni
µi :=
Ni
Ni
1 X
1 X
2
(xij − µi )2
xij , σ
ei :=
Ni
Ni − 1
j=1
j=1
µ
:=
k Ni
k
1 XX
1 X
xij =
µ i · Ni
N
N
i=1 j=1
i=1
125
N
k
σ
e2 =
=
=
i
1 XX
(xij − µ)2
N −1
1
N −1
1
N −1
+
i=1 j=1
Ni
k X
X
(xij − µi + µi − µ)2
i=1 j=1
Ni
k X
X
(xij − µi )2
i=1 j=1
Ni
k X
X
1
N −1
i=1 j=1
k
2(xij − µi )(µi − µ)
|
{z
=0
N
i
1 XX
(µi − µ)2
+
N −1
}
i=1 j=1
=
k
X
Ni − 1
i=1
N −1
σ
ei2
+
k
X
i=1
1
Ni (µi − µ)2
N −1
1 X
xij ist ZV, da die Elemente j ∈ Ai zufällig ausgewählt
Jedes Teilstichprobenmittel Y i :=
ni
j∈Ai
werden.
Y 1 , . . . Y k sind unabhängig.
Die Realisierung y i der ZV Y i (nach der Auswahl der Stichprobe) ist eine erwartungstreue
Schätzung für µi :
E(Y i ) = µi
Die Realisierung z :=
k
k
1 X
1 X
Ni y i der ZV Z :=
Ni Y i ist eine erwartungstreue Schätzung
N
N
i=1
für µ:
E(Z) =
i=1
k
k
1 X
1 X
Ni E(Y i ) =
Ni µ i = µ
N
N
i=1
i=1
Was ist nun überhaupt der Vorteil der Schichtung? Dies sehen wir, wenn wir die Varianzen der
ZV bilden: Aus der Unabhängigkeit der Y i folgt:
V (Z) =
k
X
N2
i=1
i
V
N2
(Y i ) =
k
X
N2 σ
e2
i=1
i
N2
i
ni
(1 −
ni
)
Ni
Zum Vergleich:
A sei eine Zufallsauswahl (ohne Berücksichtigung der Schichten) aus {1, . . . , N } vom Umfang n,
d.h. card A = n
1X
x
eℓ , x
e1 := x11 , x
e2 := x12 , . . . , x
en1 := x1n1 , x
en1 +1 := x21 , . . . , x
en1 +n2 := x2n2
Y :=
n
ℓ∈A
E(Y ) = µ
n
σ
e2
(1 − )
V (Y ) =
n
N
126
Sind die σ
ei bekannt, so würde V (Z) minimal für
Ni · σ
ei
ni = n ·
k
P
ℓ=1
Nℓ · σ
eℓ
Eine eventuell nicht–ganzzahlige rechte Seite ist auf eine ganze Zahl zu runden und führt zu
einem neuen (vom alten höchstens geringfügig abweichenden) Umfang
nneu =
k
X
ni
i=1
Dies liefert die optimale Stichprobe.
Sind die σ
ei nicht bekannt, so wählt man am Besten
Ni
N
Dies liefert die proportionale Stichprobe (wobei bei evtl. nicht–ganzzahliger rechter Seite
wie bei der optimale Stichprobe zu verfahren ist.)
Schon bei der proportionalen Stichprobe gilt mindestens im Fall, dass alle rechten Seiten ganzzahlig sind und dass alle Ni groß gegenüber n sind, für den Vergleich der Varianz der ZV Y ohne
Schichtung mit der Varianz der ZV Z mit Schichtung:
ni = n ·
V (Y ) ≈
V (Z) ≈
k
k
X
ni 2 X ni
σ
e
+
(µi − µ)2
n2 i
n2
i=1
i=1
> falls nicht alle µi gleich sind
k
X
ni · σ
e2
i
i=1
n2
Beispiel 10.2.1: In einem Unternehmen mit N = 100000 Beschäftigten sind
85000 Arbeiter
(Schicht 1)
15000 Angestellte
(Schicht 2)
Wir bezeichnen die Zahl der Arbeiter bzw. Zahl der Angestellten mit N1 bzw. N2 (Hier also
keine ZV).
Wir wollen nun das Gesamtjahreseinkommen aller Beschäftigten schätzen.
Wir gehen dabei von der Annahme aus, dass die modifizierte Standardabweichungen bekannt
seien:
σ˜1 = 10000 DM
σ˜2 = 20000 DM
Die Varianzen, wie sie in Formel (3.2.2) definiert waren, sind somit gegeben durch
σi2 =
Ni − 1 2
σ̃i
Ni
Der Gesamtstichprobenunfang sei nun n = 200
Die Umfänge der Teilstichproben in den beiden Schichten bei der optimale Stichprobe sind somit
85000 · 10000
= 148 (gerundet)
85000 · 10000 + 15000 · 20000
15000 · 20000
= 52 (gerundet)
n2 = 200 ·
85000 · 10000 + 15000 · 20000
n1 = 200 ·
127
n = n1 + n2 = 200
d.h. der Gesamtstichprobenunfang n kann unverändert bleiben. Aus den 85000 Arbeitern werden
also 148 zufällig ausgewählt; bei diesen 148 beträgt der Durchschnitt der Jahreseinkommen
ȳ1 =
Summe der Jahreseinkommen von Arbeiter1, 2, . . . , 148 aus der Teilstichproben
= 53600
148
Enstprechend bei den Angestellten
ȳ2 = 79000
Schätzwert für das Gesamtjahreseinkommen aller Beschäftigten:
N ·z =N
ȳ1 · 85000 + ȳ2 · 15000
= 5.74 · 109 DM
N
Wenn die modifizierte Standardabweichungen nicht bekannt wären, müsste man sich mit der
proportionalen Stichprobe begnügen. Für die Teilstichproben in den beiden Schichten würde
man dann folgende Umfänge wählen:
n1 = 200 ·
85000
= 170
105
15000
= 30
105
n = n1 + n2 = 200, d.h. der Gesamtstichprobenunfang n kann unverändert bleiben.
Def. 10.1.5: Beim Quotenverfahren (z. B. bei Umfragen) muss ein Interviewer Quoten (=
Anteile, relative Häufigkeiten) bei der Auswahl der befragten Personen beachten. Ist z. B. der
Anteil der freiberuflich Tätigen in der Grundgesamtheit p%, so müssen auch p% der befragten
Personen freiberuflich tätig sein. Sonst ist dem Interviewer die Auswahl in seinem Bereich freigestellt.
n2 = 200 ·
Def. 10.1.6: Eine Grundgesamtheit werde in kleinere Einheiten aufgeteilt. Dann wird bei dem
Verfahren der Klumpenstichprobe
a) eine zufällige Stichprobe von kleineren Einheiten gezogen,
b) bei jeder gezogenen kleineren Einheit eine zufällige Stichprobe von Elementen aus dieser
kleineren Einheit gezogen. Häufig werden auch alle statistischen Elemente aus der kleineren
Einheit untersucht.
Ein Beispiel für ein Auswahlverfahren einer systematischen Stichprobe vom Umfang n aus
einer Grundgesamtheit von N Elementen, wobei N durch n teilbar sein soll, ist das folgende:
a) Wähle zufällig eine Zahl aus 1, 2, . . . , i :=
N
. Das Ergebnis sei k.
n
b) Die Elemente mit den Nummern: k, k + i, k + 2i, . . . , k + (n − 1)i kommen in die Stichprobe.
Vorteile: Vereinfachung, Ähnlichkeit mit geschichteter Stichprobe
Nachteil: Mögliche Gefahr durch Regelmäßigkeit, Abhilfe: Statt einer Zufallszahl k werden n
Zufallszahlen k0 , k2 , . . . , kn−1 (m. Z.) gezogen. Die Elemente mit den Nummern: k0 , k1 + i, k2 +
2i, . . . , kn−1 + (n − 1)i kommen in die Stichprobe.
128
10.2
Zufällige und systematische Fehler
Bei einer Messung treten nur zufällige Fehler auf, wenn die Messwerte gleichmäßig um den
richtigen Wert streuen. Den richtigen Wert kann man dann nach den in Kap.8 besprochenen
Verfahren schätzen. Ist aber z. B. das Messinstrument falsch adjustiert, so käme zu dem zufälligen Fehler auch ein systematischer: Die einzelnen Werte würden nicht um den richtigen Wert
streuen, sondern um einen davon verschiedenen. Ein weiteres Beispiel für einen zufälligen Fehler ist der Rundungsfehler, d. h. jener Fehler, der durch das Runden von Zahlen entsteht. Wird
z. B. auf ganze Zahlen gerundet, so wird der Rundungsfehler in der Regel im Intervall ±0.5
gleichverteilt sein, d. h. die Verteilungsdichte der zugehörigen ZV ist = 1 zwischen -0.5 und +0.5
und = 0 sonst.
Die Ursache für zufällige Stichprobenfehler liegt in der Untersuchung der Stichprobe statt
der Grundgesamtheit. Dieser Fehler ist mit Hilfe der Stichprobe der Wahrscheinlichkeitsrechnung (vgl. Kap.8,9,11) kontrollierbar und z. B. durch Erhöhung des Stichprobenumfangs und
durch Berücksichtigung von Vorkenntnissen reduzierbar.
Ursachen für systematische Stichprobenfehler sind (z. T. unvermeidbare) Fehler bei der
Auswahl der Stichprobe, der Datenerfassung, der Aufbereitung der Daten u. s. w.
10.3
Das Rechnen mit fehlerbehafteten Zahlen
Gegeben seien zwei Zahlen x und y, die mit gewissen Fehlern ∆x und ∆y behaftet sind. (x+∆x)
und (y + ∆y) seien also die zugehörigen (unbekannten) exakten Werte. ∆x und ∆y werden als
absolute, ∆x/x und ∆y/y als relative Fehler bezeichnet. Wir interessieren uns dafür, mit welchem
Fehler ein aus x und y berechneter Funktionswert f (x, y) behaftet ist. Wenn wir annehmen, dass
die relativen Fehler dem Betrage nach klein gegen 1 sind (d. h. |∆x| ist klein gegen |x|, und |∆y|
ist klein gegen |y|), gilt:
(10.3.1)
∆f (x, y) := f (x + ∆x, y + ∆y) − f (x, y)
≈
fx (x, y)∆x + fy (x, y)∆y
.
Dabei sind fx und fy die partiellen Ableitungen von f nach x bzw. y.
Spezialfälle:
a) f (x, y) = x ± y
∆(x ± y) := [(x + ∆x) ± (y + ∆y)] − [x ± y]
=
∆x ± ∆y
Für den relativen Fehler gilt also
∆x ± ∆y
∆(x ± y)
=
x±y
x±y
.
Dieser relative Fehler kann dem Betrage nach sehr groß werden und den Zahlenwert (x±y)
sogar unbrauchbar machen, wenn zwar die relativen Fehler von x und y dem Betrage nach
klein gegen 1 sind, aber andererseits |x ± y| klein gegen |x| und gegen |y| ist.
b) f (x, y) = x · y. Es gilt: fx (x, y) = y ∧ fy (x, y) = x. Daraus folgt: ∆(x · y) ≈ y · ∆x + x · ∆y
∆x ∆y
∆(x · y)
≈
+
.
und
x·y
x
y
129
x
1
x
c) f (x, y) = , Es gilt: fx (x, y) = ∧ fy (x, y) = − 2 . Daraus folgt: ∆
y
y
y x
∆x ∆y
x
−
.
/
≈
und ∆
y
y
x
y
10.4
x
x
∆x
− 2 ∆y
≈
y
y
y
Bestimmung des Stichprobenumfangs
Je höher der Stichprobenumfang ist, desto genauer, aber auch desto teurer ist ein statistisches
Verfahren. Es empfiehlt sich also, den für eine bestimmte Genauigkeitsforderung nötigen Stichprobenumfang – wenn möglich – zu bestimmen oder wenigstens abzuschätzen. Als Beispiel dazu
nehmen wir an, dass wir ein 90%–Konfidenzintervall für µ bei einer N (µ, σ)–verteilten ZV bestimmen wollen, wobei σ = 0.5 bekannt sei. Wie groß muss der Stichprobenumfang gewählt
werden, damit das Konfidenzintervall höchstens die Länge 0.3 hat, d. h. die Abweichung höchstens 0.15 beträgt? Da Φ streng monoton wachsend ist, gilt:
√
0.15 n
) − 1 ≥ 0.9 = 2Φ(1.645) − 1
P (|X n − µ| ≤ 0.15) = 2Φ(
0.5
√
⇔ 0.3 n ≥ 1.645 ⇔ n ≥ (1.645/0.3)2 = 30.07
Der Stichprobenumfang sollte also 31 sein.
Allgemein erhält man als Faustregel für die Bestimmung des Stichprobenumfangs bei einer
Grundgesamtheit vom Umfang N , die im wesentlichen auf der Näherung durch die Normalverteilung beruht und nur als grobe Orientierung dienen kann:
!
P (|Schätz–ZV für den Parameter θ − θ| ≤ d) ≥ γ,
(1 + γ)
, wobei σ
wobei d und γ vorgegeben seien. Wir bestimmen q aus der Formel Φ(q) =
2
etwa aufgrund von früheren Untersuchungen bekannt sei. Der Stichprobenumfang wird dann
näherungsweise nach der folgenden Formel bestimmt:
n≈ d
qσ
1
2
+
1
N
oder, wenn N sehr groß ist und damit praktisch eine fast ”unendliche” Grundgesamtheit vorliegt,
n≈
qσ 2
d
130
.