Kapitel 10 Stichproben und statistische Fehler 10.1 Verfahren zur Auswahl von Stichproben Stichprobenauswahl als Bestandteil von Teilerhebungen: Aus dem Ergebnis der Untersuchung der Stichprobe soll dann auf die Grundgesamtheit geschlossen werden. Ziel: 10.1.1 Ergebnis der Untersuchung der Stichprobe = Ergebnis der Untersuchung der Grundgesamtheit, wenn sie exakt durchgeführt werden könnte, bis auf einen abschätzbaren Fehler, dessen Grenzen vor der Untersuchung festgelegt werden sollten. Zufällige Auswahlverfahren Def. 10.1.1: Eine (streng) zufällige Auswahl einer Stichprobe liegt vor, wenn bei jeder Ziehung gilt: Jedes Element der Grundgesamtheit (bei ”m. Z.”) bzw. des Restes der Grundges. (bei ”o. Z.”) hat die gleiche Chance, gezogen zu werden. Wichtiges Hilfsmittel: Zufallszahlen. Def. 10.1.2: (zi ) heißt eine Folge von Zufallsziffern, wenn jedes zi eine Realisierung einer ZV Zi ist, für die gilt: a) Zi nimmt die Werte 0, 1, . . . , 9 jeweils mit der Wahrscheinlichkeit 0.1 an. b) Die Zi bilden eine Folge von unabhängigen ZV. Def. 10.1.3: k sei eine feste natürliche Zahl. (xi ) heißt eine Folge von Zufallszahlen (mit Stellenzahl ≤ k), wenn jedes xi eine Realisierung einer ZV Xi ist, für die gilt: a) Xi nimmt die Werte 0, 1, 2, . . . , 10k − 1 jeweils mit der Wahrsch. 10−k an. b) Die Xi bilden eine Folge von unabhängigen ZV. Die xi erhält man durch Zusammenfassung von je k Zufallsziffern, wobei Lücken und Überlappungen vermieden werden sollten. Bei der Verwendung von Zufallszahlentabellen sollte die Anfangsstelle zufällig ausgewählt werden. Def. 10.1.4 (xi ) heißt eine Folge von z.B. reellen, auf (0, 1] gleichverteilten Zufallszahlen, wenn jedes xi Realisierung einer ZV Xi ist, für die gilt: a) Xi ist auf (0, 1] gleichverteilt, d.h. es gilt: 0 < Xi ≤ 1 und P (a < Xi ≤ b) = b − a für 0 ≤ a ≤ b ≤ 1. b) Die Xi bilden eine Folge von unabhängigen ZV. 72 Statt “echter” Zufallszahlen verwendet man meist Pseudo-Zufallszahlen. Dies sind von Rechenprogrammen erzeugte Zahlen, die deshalb keine Zufallszahlen sein können, aber in ausreichender Näherung die gleichen Eigenschaften wie “echte” Zufallszahlen haben. Allgemeines Verfahren zur (streng) zufälligen Auswahl einer Stichprobe vom Umfang n: Annahme: Die Elemente der Grundgesamtheit sind registriert und durchnumeriert mit den Nummern 1, 2, . . . , N . Ziehe n auf (0, 1] gleichverteilte (Pseudo-)Zufallszahlen xi . Bilde daraus zunächst die Zahlen yi := xi · N. Diese Zahlen sind auf (0, N ] gleichverteilte (Pseudo-)Zufallszahlen. Bestimme daraus für jedes i = 1, . . . , n die Zahl ui als nächst größere ganze Zahl, d.h. ui ist die kleinste ganze Zahl mit der Eigenschaft ui ≥ yi . Die Elemente mit den Nummern u1 , u2 , . . . un bilden dann eine (streng) zufälligen Stichprobe vom Umfang n m.Z. Will man eine (streng) zufälligen Stichprobe vom Umfang n o.Z., so muss man jedes ui , das zum zweitenmal vorkommt, streichen, und wenn nötig weitere auf (0, 1] gleichverteilte (Pseudo-)Zufallszahlen xi ziehen und verarbeiten. Quellen für Folgen von Zufallsziffern und –zahlen: a) Tabellen in Statistik–Lehrbüchern b) The Rand Corporation: A Million Random Digits with 100,000 Normal Deviates, Glencoe (Illinois), 1955 c) Feste Unterprogramme in Rechenanlagen 10.1.2 Andere Auswahlverfahren Gründe für nicht streng zufällige Auswahlverfahren: Streng zufällige Verfahren sind nicht immer möglich oder zu aufwendig, Vorkenntnisse bleiben unberücksichtigt, Vereinfachungen erwünscht. Geschichtete Stichprobe: Aufteilung der Grundgesamtheit in Schichten (z.B. Arbeitnehmer, Freiberufliche ...). Zufällige Stichprobe aus jeder Schicht o.Z. Bezeichnungen der relevanten Größen: k Schichten Ni (keine ZV) Umfang der Schicht i (i = 1, 2, . . . , k) ! ni (≥ 1) µi ei σ µ e σ Umfang der auf Schicht i entfallenden Teilstichprobe arithmetisches Mittel der Merkmalswerte aller statistischen Elemente in Schicht i modifizierte Standardabweichung aller statistischen Elemente in Schicht i arithmetisches Mittel der Merkmalswerte aller statistischen Elemente in der Grundgesamtheit modifizierte Standardabweichung der Merkmalswerte aller statistischen Elemente in der Grundgesamtheit 73 n := k P i=1 k P ni N := Ni Gesamtstichprobenumfang Umfang der Grundgesamtheit i=1 xij Merkmalswert von dem statistischen Element Nummer j aus der Schicht i Ai Menge der Nummern der statistischen Elemente aus Schicht i, die für die Teilstichprobe ausgewählt werden. Die Auswahl aus einer Schicht geschieht unabhängig von der Auswahl aus jeder anderen Schicht. Definitionen und Eigenschaften: card Ai = ni Ni X N µi := 1 Ni µ Ni k X 1 X := N j=1 ei2 := xij , σ xij = i=1 j=1 1 Xi (xij − µi )2 Ni − 1 j=1 k 1 X µ i · Ni N i=1 N e2 = σ = k X i 1 X (xij − µ)2 N − 1 i=1 j=1 N k X i 1 X (xij − µi + µi − µ)2 N − 1 i=1 j=1 N = k X i 1 X (xij − µi )2 N − 1 i=1 j=1 N + k X i 1 X 2(xij − µi )(µi − µ) N − 1 i=1 j=1 | N + = {z =0 k X i 1 X (µi − µ)2 N − 1 i=1 j=1 k X Ni − 1 i=1 N −1 ei2 σ + k X i=1 } 1 Ni (µi − µ)2 N −1 1 X xij ist ZV, da die Elemente j ∈ Ai zufällig ausgewählt Jedes Teilstichprobenmittel Y i := ni j∈A i werden. Y 1 , . . . Y k sind unabhängig. Die Realisierung y i der ZV Y i (nach der Auswahl der Stichprobe) ist eine erwartungstreue Schätzung für µi : E(Y i ) = µi k k 1 X 1 X Die Realisierung z := Ni y i der ZV Z := Ni Y i ist eine erwartungstreue Schätzung N i=1 N i=1 für µ: k k 1 X 1 X E(Z) = Ni E(Y i ) = Ni µ i = µ N i=1 N i=1 74 Was ist nun überhaupt der Vorteil der Schichtung? Dies sehen wir, wenn wir die Varianzen der ZV bilden: Aus der Unabhängigkeit der Y i folgt: V (Z) = k X Ni2 i=1 N V (Y i ) = 2 k X ei2 Ni2 σ i=1 N2 ni (1 − ni ) Ni Zum Vergleich: A sei eine Zufallsauswahl (ohne Berücksichtigung der Schichten) aus {1, . . . , N } vom Umfang n, d.h. card A = n Y := 1X eℓ , x e1 := x11 , x e2 := x12 , . . . , x en1 := x1n1 , x en1 +1 := x21 , . . . , x en1 +n2 := x2n2 x n ℓ∈A E(Y ) = µ e2 σ n V (Y ) = (1 − ) n N ei bekannt, so würde V (Z) minimal für Sind die σ ni = n · ei Ni · σ k P ℓ=1 eℓ Nℓ · σ Eine eventuell nicht–ganzzahlige rechte Seite ist auf eine ganze Zahl zu runden und führt zu einem neuen (vom alten höchstens geringfügig abweichenden) Umfang nneu = k X ni i=1 Dies liefert die optimale Stichprobe. ei nicht bekannt, so wählt man am besten Sind die σ Ni N Dies liefert die proportionale Stichprobe (wobei bei evtl. nicht–ganzzahliger rechter Seite wie bei der optimale Stichprobe zu verfahren ist.) Schon bei der proportionalen Stichprobe gilt mindestens im Fall, dass alle rechten Seiten ganzzahlig sind und dass alle Ni groß gegenüber n sind, für den Vergleich der Varianz der ZV Y ohne Schichtung mit der Varianz der ZV Z mit Schichtung: ni = n · k X ni e2 + σ 2 i k X ni (µi − µ)2 2 n n i=1 i=1 > falls nicht alle µi gleich sind k X ei2 ni · σ V (Z) ≈ n2 i=1 V (Y ) ≈ Def. 10.1.5: Beim Quotenverfahren (z. B. bei Umfragen) muss ein Interviewer Quoten (= Anteile, relative Häufigkeiten) bei der Auswahl der befragten Personen beachten. Ist z. B. der Anteil der freiberuflich Tätigen in der Grundgesamtheit p%, so müssen auch p% der befragten Personen freiberuflich tätig sein. Sonst ist dem Interviewer die Auswahl in seinem Bereich freigestellt. 75 Def. 10.1.6: Eine Grundgesamtheit werde in kleinere Einheiten aufgeteilt. Dann wird bei dem Verfahren der Klumpenstichprobe a) eine zufällige Stichprobe von kleineren Einheiten gezogen, b) bei jeder gezogenen kleineren Einheit eine zufällige Stichprobe von Elementen aus dieser kleineren Einheit gezogen. Häufig werden auch alle statistischen Elemente aus der kleineren Einheit untersucht. Ein Beispiel für ein Auswahlverfahren einer systematischen Stichprobe vom Umfang n aus einer Grundgesamtheit von N Elementen, wobei N durch n teilbar sein soll, ist das folgende: a) Wähle zufällig eine Zahl aus 1, 2, . . . , i := N n. Das Ergebnis sei k. b) Die Elemente mit den Nummern: k, k + i, k + 2i, . . . , k + (n − 1)i kommen in die Stichprobe. Vorteile: Vereinfachung, Ähnlichkeit mit geschichteter Stichprobe Nachteil: Mögliche Gefahr durch Regelmäßigkeit, Abhilfe: Statt einer Zufallszahl k werden n Zufallszahlen k0 , k2 , . . . , kn−1 (m. Z.) gezogen. Die Elemente mit den Nummern: k0 , k1 + i, k2 + 2i, . . . , kn−1 + (n − 1)i kommen in die Stichprobe. 10.2 Zufällige und systematische Fehler Bei einer Messung treten nur zufällige Fehler auf, wenn die Messwerte gleichmäßig um den richtigen Wert streuen. Den richtigen Wert kann man dann nach den in Kap.8 besprochenen Verfahren schätzen. Ist aber z. B. das Messinstrument falsch adjustiert, so käme zu dem zufälligen Fehler auch ein systematischer: Die einzelnen Werte würden nicht um den richtigen Wert streuen, sondern um einen davon verschiedenen. Ein weiteres Beispiel für einen zufälligen Fehler ist der Rundungsfehler, d. h. jener Fehler, der durch das Runden von Zahlen entsteht. Wird z. B. auf ganze Zahlen gerundet, so wird der Rundungsfehler in der Regel im Intervall ±0.5 gleichverteilt sein, d. h. die Verteilungsdichte der zugehörigen ZV ist = 1 zwischen -0.5 und +0.5 und = 0 sonst. Die Ursache für zufällige Stichprobenfehler liegt in der Untersuchung der Stichprobe statt der Grundgesamtheit. Dieser Fehler ist mit Hilfe der Stichprobe der Wahrscheinlichkeitsrechnung (vgl. Kap.8,9,11) kontrollierbar und z. B. durch Erhöhung des Stichprobenumfangs und durch Berücksichtigung von Vorkenntnissen reduzierbar. Ursachen für systematische Stichprobenfehler sind (z. T. unvermeidbare) Fehler bei der Auswahl der Stichprobe, der Datenerfassung, der Aufbereitung der Daten u. s. w. 10.3 Das Rechnen mit fehlerbehafteten Zahlen Gegeben seien zwei Zahlen x und y, die mit gewissen Fehlern ∆x und ∆y behaftet sind. (x+∆x) und (y + ∆y) seien also die zugehörigen (unbekannten) exakten Werte. ∆x und ∆y werden als absolute, ∆x/x und ∆y/y als relative Fehler bezeichnet. Wir interessieren uns dafür, mit welchem Fehler ein aus x und y berechneter Funktionswert f (x, y) behaftet ist. Wenn wir annehmen, dass die relativen Fehler dem Betrage nach klein gegen 1 sind (d. h. |∆x| ist klein gegen |x|, und |∆y| ist klein gegen |y|), gilt: 76 ∆f (x, y) := f (x + ∆x, y + ∆y) − f (x, y) (10.3.1) ≈ fx (x, y)∆x + fy (x, y)∆y . Dabei sind fx und fy die partiellen Ableitungen von f nach x bzw. y. Spezialfälle: a) f (x, y) = x ± y ∆(x ± y) := [(x + ∆x) ± (y + ∆y)] − [x ± y] = ∆x ± ∆y Für den relativen Fehler gilt also ∆(x ± y) ∆x ± ∆y = x±y x±y . Dieser relative Fehler kann dem Betrage nach sehr groß werden und den Zahlenwert (x±y) sogar unbrauchbar machen, wenn zwar die relativen Fehler von x und y dem Betrage nach klein gegen 1 sind, aber andererseits |x ± y| klein gegen |x| und gegen |y| ist. b) f (x, y) = x · y. Es gilt: fx (x, y) = y ∧ fy (x, y) = x. Daraus folgt: ∆(x · y) ≈ y · ∆x + x · ∆y ∆y ∆x und ∆(x·y) x·y ≈ x + y . c) f (x, y) = xy , Es gilt: fx (x, y) = ∆ 10.4 x y / x y ≈ ∆x x − ∆y y . 1 y ∧ fy (x, y) = − yx2 . Daraus folgt: ∆ x y ≈ ∆x y − yx2 ∆y und Bestimmung des Stichprobenumfangs Je höher der Stichprobenumfang ist, desto genauer, aber auch desto teurer ist ein statistisches Verfahren. Es empfiehlt sich also, den für eine bestimmte Genauigkeitsforderung nötigen Stichprobenumfang – wenn möglich – zu bestimmen oder wenigstens abzuschätzen. Als Beispiel dazu nehmen wir an, dass wir ein 90%–Konfidenzintervall für µ bei einer N (µ, σ)–verteilten ZV bestimmen wollen, wobei σ = 0.5 bekannt sei. Wie groß muss der Stichprobenumfang gewählt werden, damit das Konfidenzintervall höchstens die Länge 0.3 hat, d. h. die Abweichung höchstens 0.15 beträgt? Da Φ streng monoton wachsend ist, gilt: √ 0.15 n ) − 1 ≥ 0.9 = 2Φ(1.645) − 1 P (|X n − µ| ≤ 0.15) = 2Φ( 0.5 √ ⇔ 0.3 n ≥ 1.645 ⇔ n ≥ (1.645/0.3)2 = 30.07 Der Stichprobenumfang sollte also 31 sein. Allgemein erhält man als Faustregel für die Bestimmung des Stichprobenumfangs bei einer Grundgesamtheit vom Umfang N , die im wesentlichen auf der Näherung durch die Normalverteilung beruht und nur als grobe Orientierung dienen kann: ! P (|Schätz–ZV für den Parameter θ − θ| ≤ d) ≥ γ, wobei d und γ vorgegeben seien. Wir bestimmen ε aus der Formel Φ(ǫ) = (1+γ) 2 , wobei σ etwa aufgrund von früheren Untersuchungen bekannt sei. Der Stichprobenumfang wird dann 77 näherungsweise nach der folgenden Formel bestimmt: n≈ 1 d 2 ) ( εσ + 1 N oder, wenn N sehr groß ist und damit praktisch eine fast ”unendliche” Grundgesamtheit vorliegt, n≈ εσ d 78 2 .