Stichproben und statistische Fehler

Werbung
Kapitel 10
Stichproben und statistische Fehler
10.1
Verfahren zur Auswahl von Stichproben
Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung
der Stichprobe soll dann auf die Grundgesamtheit geschlossen werden.
Ziel:
10.1.1
Ergebnis der Untersuchung der Stichprobe
= Ergebnis der Untersuchung der Grundgesamtheit, wenn sie exakt durchgeführt werden
könnte, bis auf einen abschätzbaren Fehler, dessen Grenzen vor der Untersuchung
festgelegt werden sollten.
Zufällige Auswahlverfahren
Def. 10.1.1: Eine (streng) zufällige Auswahl einer Stichprobe liegt vor, wenn bei jeder
Ziehung gilt: Jedes Element der Grundgesamtheit (bei ”m. Z.”) bzw. des Restes der Grundges.
(bei ”o. Z.”) hat die gleiche Chance, gezogen zu werden.
Wichtiges Hilfsmittel: Zufallszahlen.
Def. 10.1.2: (zi ) heißt eine Folge von Zufallsziffern, wenn jedes zi eine Realisierung einer ZV
Zi ist, für die gilt:
a) Zi nimmt die Werte 0, 1, . . . , 9 jeweils mit der Wahrscheinlichkeit 0.1 an.
b) Die Zi bilden eine Folge von unabhängigen ZV.
Def. 10.1.3: k sei eine feste natürliche Zahl. (xi ) heißt eine Folge von Zufallszahlen (mit
Stellenzahl ≤ k), wenn jedes xi eine Realisierung einer ZV Xi ist, für die gilt:
a) Xi nimmt die Werte 0, 1, 2, . . . , 10k − 1 jeweils mit der Wahrsch. 10−k an.
b) Die Xi bilden eine Folge von unabhängigen ZV.
Die xi erhält man durch Zusammenfassung von je k Zufallsziffern, wobei Lücken und Überlappungen vermieden werden sollten. Bei der Verwendung von Zufallszahlentabellen sollte die
Anfangsstelle zufällig ausgewählt werden.
Def. 10.1.4 (xi ) heißt eine Folge von z.B. reellen, auf (0, 1] gleichverteilten Zufallszahlen,
wenn jedes xi Realisierung einer ZV Xi ist, für die gilt:
a) Xi ist auf (0, 1] gleichverteilt, d.h. es gilt: 0 < Xi ≤ 1 und P (a < Xi ≤ b) = b − a für
0 ≤ a ≤ b ≤ 1.
b) Die Xi bilden eine Folge von unabhängigen ZV.
72
Statt “echter” Zufallszahlen verwendet man meist Pseudo-Zufallszahlen. Dies sind von Rechenprogrammen erzeugte Zahlen, die deshalb keine Zufallszahlen sein können, aber in ausreichender
Näherung die gleichen Eigenschaften wie “echte” Zufallszahlen haben.
Allgemeines Verfahren zur (streng) zufälligen Auswahl einer Stichprobe vom Umfang n:
Annahme: Die Elemente der Grundgesamtheit sind registriert und durchnumeriert mit den Nummern 1, 2, . . . , N .
Ziehe n auf (0, 1] gleichverteilte (Pseudo-)Zufallszahlen xi . Bilde daraus zunächst die Zahlen
yi := xi · N. Diese Zahlen sind auf (0, N ] gleichverteilte (Pseudo-)Zufallszahlen. Bestimme daraus für jedes i = 1, . . . , n die Zahl ui als nächst größere ganze Zahl, d.h. ui ist die kleinste ganze
Zahl mit der Eigenschaft ui ≥ yi . Die Elemente mit den Nummern u1 , u2 , . . . un bilden dann eine
(streng) zufälligen Stichprobe vom Umfang n m.Z.
Will man eine (streng) zufälligen Stichprobe vom Umfang n o.Z., so muss man jedes ui , das zum
zweitenmal vorkommt, streichen, und wenn nötig weitere auf (0, 1] gleichverteilte
(Pseudo-)Zufallszahlen xi ziehen und verarbeiten.
Quellen für Folgen von Zufallsziffern und –zahlen:
a) Tabellen in Statistik–Lehrbüchern
b) The Rand Corporation: A Million Random Digits with 100,000 Normal Deviates, Glencoe
(Illinois), 1955
c) Feste Unterprogramme in Rechenanlagen
10.1.2
Andere Auswahlverfahren
Gründe für nicht streng zufällige Auswahlverfahren: Streng zufällige Verfahren sind nicht immer
möglich oder zu aufwendig, Vorkenntnisse bleiben unberücksichtigt, Vereinfachungen erwünscht.
Geschichtete Stichprobe:
Aufteilung der Grundgesamtheit in Schichten (z.B. Arbeitnehmer, Freiberufliche ...).
Zufällige Stichprobe aus jeder Schicht o.Z.
Bezeichnungen der relevanten Größen:
k
Schichten
Ni (keine ZV) Umfang der Schicht i (i = 1, 2, . . . , k)
!
ni (≥ 1)
µi
ei
σ
µ
e
σ
Umfang der auf Schicht i entfallenden Teilstichprobe
arithmetisches Mittel der Merkmalswerte aller statistischen
Elemente in Schicht i
modifizierte Standardabweichung aller statistischen Elemente in Schicht i
arithmetisches Mittel der Merkmalswerte aller statistischen
Elemente in der Grundgesamtheit
modifizierte Standardabweichung der Merkmalswerte aller
statistischen Elemente in der Grundgesamtheit
73
n :=
k
P
i=1
k
P
ni
N :=
Ni
Gesamtstichprobenumfang
Umfang der Grundgesamtheit
i=1
xij
Merkmalswert von dem statistischen Element Nummer j aus
der Schicht i
Ai
Menge der Nummern der statistischen Elemente aus Schicht
i, die für die Teilstichprobe ausgewählt werden. Die Auswahl
aus einer Schicht geschieht unabhängig von der Auswahl aus
jeder anderen Schicht.
Definitionen und Eigenschaften:
card Ai = ni
Ni
X
N
µi :=
1
Ni
µ
Ni
k X
1 X
:=
N
j=1
ei2 :=
xij , σ
xij =
i=1 j=1
1 Xi
(xij − µi )2
Ni − 1 j=1
k
1 X
µ i · Ni
N i=1
N
e2 =
σ
=
k X
i
1 X
(xij − µ)2
N − 1 i=1 j=1
N
k X
i
1 X
(xij − µi + µi − µ)2
N − 1 i=1 j=1
N
=
k X
i
1 X
(xij − µi )2
N − 1 i=1 j=1
N
+
k X
i
1 X
2(xij − µi )(µi − µ)
N − 1 i=1 j=1
|
N
+
=
{z
=0
k X
i
1 X
(µi − µ)2
N − 1 i=1 j=1
k
X
Ni − 1
i=1
N −1
ei2
σ
+
k
X
i=1
}
1
Ni (µi − µ)2
N −1
1 X
xij ist ZV, da die Elemente j ∈ Ai zufällig ausgewählt
Jedes Teilstichprobenmittel Y i :=
ni j∈A
i
werden.
Y 1 , . . . Y k sind unabhängig.
Die Realisierung y i der ZV Y i (nach der Auswahl der Stichprobe) ist eine erwartungstreue
Schätzung für µi :
E(Y i ) = µi
k
k
1 X
1 X
Die Realisierung z :=
Ni y i der ZV Z :=
Ni Y i ist eine erwartungstreue Schätzung
N i=1
N i=1
für µ:
k
k
1 X
1 X
E(Z) =
Ni E(Y i ) =
Ni µ i = µ
N i=1
N i=1
74
Was ist nun überhaupt der Vorteil der Schichtung? Dies sehen wir, wenn wir die Varianzen der
ZV bilden: Aus der Unabhängigkeit der Y i folgt:
V (Z) =
k
X
Ni2
i=1
N
V (Y i ) =
2
k
X
ei2
Ni2 σ
i=1
N2
ni
(1 −
ni
)
Ni
Zum Vergleich:
A sei eine Zufallsauswahl (ohne Berücksichtigung der Schichten) aus {1, . . . , N } vom Umfang n,
d.h. card A = n
Y :=
1X
eℓ , x
e1 := x11 , x
e2 := x12 , . . . , x
en1 := x1n1 , x
en1 +1 := x21 , . . . , x
en1 +n2 := x2n2
x
n ℓ∈A
E(Y ) = µ
e2
σ
n
V (Y ) =
(1 − )
n
N
ei bekannt, so würde V (Z) minimal für
Sind die σ
ni = n ·
ei
Ni · σ
k
P
ℓ=1
eℓ
Nℓ · σ
Eine eventuell nicht–ganzzahlige rechte Seite ist auf eine ganze Zahl zu runden und führt zu
einem neuen (vom alten höchstens geringfügig abweichenden) Umfang
nneu =
k
X
ni
i=1
Dies liefert die optimale Stichprobe.
ei nicht bekannt, so wählt man am besten
Sind die σ
Ni
N
Dies liefert die proportionale Stichprobe (wobei bei evtl. nicht–ganzzahliger rechter Seite
wie bei der optimale Stichprobe zu verfahren ist.)
Schon bei der proportionalen Stichprobe gilt mindestens im Fall, dass alle rechten Seiten ganzzahlig sind und dass alle Ni groß gegenüber n sind, für den Vergleich der Varianz der ZV Y ohne
Schichtung mit der Varianz der ZV Z mit Schichtung:
ni = n ·
k
X
ni
e2 +
σ
2 i
k
X
ni
(µi − µ)2
2
n
n
i=1
i=1
> falls nicht alle µi gleich sind
k
X
ei2
ni · σ
V (Z) ≈
n2
i=1
V (Y ) ≈
Def. 10.1.5: Beim Quotenverfahren (z. B. bei Umfragen) muss ein Interviewer Quoten (=
Anteile, relative Häufigkeiten) bei der Auswahl der befragten Personen beachten. Ist z. B. der
Anteil der freiberuflich Tätigen in der Grundgesamtheit p%, so müssen auch p% der befragten
Personen freiberuflich tätig sein. Sonst ist dem Interviewer die Auswahl in seinem Bereich freigestellt.
75
Def. 10.1.6: Eine Grundgesamtheit werde in kleinere Einheiten aufgeteilt. Dann wird bei dem
Verfahren der Klumpenstichprobe
a) eine zufällige Stichprobe von kleineren Einheiten gezogen,
b) bei jeder gezogenen kleineren Einheit eine zufällige Stichprobe von Elementen aus dieser
kleineren Einheit gezogen. Häufig werden auch alle statistischen Elemente aus der kleineren
Einheit untersucht.
Ein Beispiel für ein Auswahlverfahren einer systematischen Stichprobe vom Umfang n aus
einer Grundgesamtheit von N Elementen, wobei N durch n teilbar sein soll, ist das folgende:
a) Wähle zufällig eine Zahl aus 1, 2, . . . , i :=
N
n.
Das Ergebnis sei k.
b) Die Elemente mit den Nummern: k, k + i, k + 2i, . . . , k + (n − 1)i kommen in die Stichprobe.
Vorteile: Vereinfachung, Ähnlichkeit mit geschichteter Stichprobe
Nachteil: Mögliche Gefahr durch Regelmäßigkeit, Abhilfe: Statt einer Zufallszahl k werden n
Zufallszahlen k0 , k2 , . . . , kn−1 (m. Z.) gezogen. Die Elemente mit den Nummern: k0 , k1 + i, k2 +
2i, . . . , kn−1 + (n − 1)i kommen in die Stichprobe.
10.2
Zufällige und systematische Fehler
Bei einer Messung treten nur zufällige Fehler auf, wenn die Messwerte gleichmäßig um den
richtigen Wert streuen. Den richtigen Wert kann man dann nach den in Kap.8 besprochenen
Verfahren schätzen. Ist aber z. B. das Messinstrument falsch adjustiert, so käme zu dem zufälligen Fehler auch ein systematischer: Die einzelnen Werte würden nicht um den richtigen Wert
streuen, sondern um einen davon verschiedenen. Ein weiteres Beispiel für einen zufälligen Fehler ist der Rundungsfehler, d. h. jener Fehler, der durch das Runden von Zahlen entsteht. Wird
z. B. auf ganze Zahlen gerundet, so wird der Rundungsfehler in der Regel im Intervall ±0.5
gleichverteilt sein, d. h. die Verteilungsdichte der zugehörigen ZV ist = 1 zwischen -0.5 und +0.5
und = 0 sonst.
Die Ursache für zufällige Stichprobenfehler liegt in der Untersuchung der Stichprobe statt
der Grundgesamtheit. Dieser Fehler ist mit Hilfe der Stichprobe der Wahrscheinlichkeitsrechnung (vgl. Kap.8,9,11) kontrollierbar und z. B. durch Erhöhung des Stichprobenumfangs und
durch Berücksichtigung von Vorkenntnissen reduzierbar.
Ursachen für systematische Stichprobenfehler sind (z. T. unvermeidbare) Fehler bei der
Auswahl der Stichprobe, der Datenerfassung, der Aufbereitung der Daten u. s. w.
10.3
Das Rechnen mit fehlerbehafteten Zahlen
Gegeben seien zwei Zahlen x und y, die mit gewissen Fehlern ∆x und ∆y behaftet sind. (x+∆x)
und (y + ∆y) seien also die zugehörigen (unbekannten) exakten Werte. ∆x und ∆y werden als
absolute, ∆x/x und ∆y/y als relative Fehler bezeichnet. Wir interessieren uns dafür, mit welchem
Fehler ein aus x und y berechneter Funktionswert f (x, y) behaftet ist. Wenn wir annehmen, dass
die relativen Fehler dem Betrage nach klein gegen 1 sind (d. h. |∆x| ist klein gegen |x|, und |∆y|
ist klein gegen |y|), gilt:
76
∆f (x, y) := f (x + ∆x, y + ∆y) − f (x, y)
(10.3.1)
≈
fx (x, y)∆x + fy (x, y)∆y
.
Dabei sind fx und fy die partiellen Ableitungen von f nach x bzw. y.
Spezialfälle:
a) f (x, y) = x ± y
∆(x ± y) := [(x + ∆x) ± (y + ∆y)] − [x ± y]
=
∆x ± ∆y
Für den relativen Fehler gilt also
∆(x ± y)
∆x ± ∆y
=
x±y
x±y
.
Dieser relative Fehler kann dem Betrage nach sehr groß werden und den Zahlenwert (x±y)
sogar unbrauchbar machen, wenn zwar die relativen Fehler von x und y dem Betrage nach
klein gegen 1 sind, aber andererseits |x ± y| klein gegen |x| und gegen |y| ist.
b) f (x, y) = x · y. Es gilt: fx (x, y) = y ∧ fy (x, y) = x. Daraus folgt: ∆(x · y) ≈ y · ∆x + x · ∆y
∆y
∆x
und ∆(x·y)
x·y ≈ x + y .
c) f (x, y) = xy , Es gilt: fx (x, y) =
∆
10.4
x
y
/
x
y
≈
∆x
x
−
∆y
y .
1
y
∧ fy (x, y) = − yx2 . Daraus folgt: ∆
x
y
≈
∆x
y
− yx2 ∆y und
Bestimmung des Stichprobenumfangs
Je höher der Stichprobenumfang ist, desto genauer, aber auch desto teurer ist ein statistisches
Verfahren. Es empfiehlt sich also, den für eine bestimmte Genauigkeitsforderung nötigen Stichprobenumfang – wenn möglich – zu bestimmen oder wenigstens abzuschätzen. Als Beispiel dazu
nehmen wir an, dass wir ein 90%–Konfidenzintervall für µ bei einer N (µ, σ)–verteilten ZV bestimmen wollen, wobei σ = 0.5 bekannt sei. Wie groß muss der Stichprobenumfang gewählt werden, damit das Konfidenzintervall höchstens die Länge 0.3 hat, d. h. die Abweichung höchstens
0.15 beträgt? Da Φ streng monoton wachsend ist, gilt:
√
0.15 n
) − 1 ≥ 0.9 = 2Φ(1.645) − 1
P (|X n − µ| ≤ 0.15) = 2Φ(
0.5
√
⇔ 0.3 n ≥ 1.645 ⇔ n ≥ (1.645/0.3)2 = 30.07
Der Stichprobenumfang sollte also 31 sein.
Allgemein erhält man als Faustregel für die Bestimmung des Stichprobenumfangs bei einer
Grundgesamtheit vom Umfang N , die im wesentlichen auf der Näherung durch die Normalverteilung beruht und nur als grobe Orientierung dienen kann:
!
P (|Schätz–ZV für den Parameter θ − θ| ≤ d) ≥ γ,
wobei d und γ vorgegeben seien. Wir bestimmen ε aus der Formel Φ(ǫ) = (1+γ)
2 , wobei σ
etwa aufgrund von früheren Untersuchungen bekannt sei. Der Stichprobenumfang wird dann
77
näherungsweise nach der folgenden Formel bestimmt:
n≈
1
d 2
)
( εσ
+
1
N
oder, wenn N sehr groß ist und damit praktisch eine fast ”unendliche” Grundgesamtheit vorliegt,
n≈
εσ
d
78
2
.
Herunterladen