Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Stichprobenziehung Jost Reinecke Universität Bielefeld 7. April 2005 Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einleitung Die Berücksichtigung aller Untersuchungseinheiten ist in der Regel zu kosten- und zeitaufwändig. Daher beschränkt man sich auf eine gewisse Anzahl von Untersuchungseinheiten, den Stichproben, um Aussagen über Sachverhalte in der interessierenden Gesamtheit treffen zu können. Die Stichprobenziehung hängt unmittelbar mit der Wahrscheinlichkeitstheorie zusammen: 1. Die Wahrscheinlichkeitstheorie läßt Angaben über die Wahrscheinlichkeit der Zusammensetzung einer Stichprobe zu. 2. Bei der Generalisierung von Stichprobendaten können Angaben über die Wahrscheinlichkeit getroffen werden, mit der Kennwerte in der Population abgebildet werden können. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Grundbegriffe Grundgesamtheit (Population): Elemente bzw. Personen, auf die sich Aussagen einer statistischen Analyse beziehen. Die Grundgesamtheit ist sowohl sachlich als auch räumlich und zeitlich exakt zu definieren. In den meisten Fällen ist es aus zeitlichen und finanziellen Gründen nicht möglich, alle Einheiten der Grundgesamtheit zu erheben (Totalerhebung). Man wird sich daher auf eine Auswahl (Stichprobe) beschränken, die auch häufig sehr viel intensiver und präziser als eine Totalerhebung durchgeführt werden kann. Beispiel: Wählerbefragung - sämtliche Wahlberechtigte der Stadt Köln / des Landes NRW / der BRD. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Parameter der Grundgesamtheit: µ: Mittelwert σ2: Varianz σ: Standardabweichung, π (manchmal auch θ): Anteilswert N: Fallzahl in der Grundgesamtheit Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Stichprobe (Sample): Auswahl von Elementen bzw. Personen der Gesamtheit. Eine Stichprobe soll ein möglichst repräsentatives Bild der Grundgesamtheit liefern. Handelt es sich um eine Zufallsstichprobe, bei der die Erhebungseinheiten nach dem Zufallsprinzip ausgewählt wurden, dann können die Schätzverfahren und Hypothesentests der schließenden Statistik angewendet werden. Beispiel: Stichprobe von Wählern. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Parameter der Stichprobe: x: s: s2 p: n: Mittelwert Standardabweichung Varianz Anteilswert Stichprobenumfang Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Erhebungseinheiten: Elemente der Population, auf die sich die Auswahl bezieht und die überhaupt eine Chance haben, in die Stichprobe aufgenommen zu werden. Stichprobenverfahren: Vorschrift, die festlegt, in welcher Weise Elemente der Grundgesamtheit ausgewählt werden. 1. Zufallsauswahl: Resultat einer Zufallsauswahl sind Zufallsstichproben. 2. Bewußte Auswahl: Quotenstichproben 3. Willkürliche Auswahl: Psychologische Experimente Stichprobenumfang: Anzahl der ausgewählten Elemente, die in der Regel mit N bezeichnet werden. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Stichprobe oder Totalerhebung Uns interessiert ein Kennwert einer Gesamtheit, z.B. das durchschnittliche Nettoeinkommen der Haushalte in Bielefeld. 1. Totalerhebung: Man kann alle Bielefelder Haushalte nach ihrem Nettoeinkommen fragen und dann den Mittelwert berechnen. 2. Stichprobe: Man kann einige Bielefelder Haushalte auswählen und diese über ihr Nettoeinkommen befragen. Wenn die Haushalte nach bestimmten Regeln ausgewählt werden, können wir anschließend mit einer gewissen Wahrscheinlichkeit auf das mittlere Nettoeinkommen aller Bielefelder Haushalte schließen. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Die Totalerhebung hat den Vorteil, dass die gesuchten Kennwerte genau angegeben werden können. Beispiel: Das mittlere Haushaltsnettoeinkommen in Bielefeld beträgt X Euro. Bei einer Stichprobe würde das Ergebnis komplizierter ausfallen. Beispiel: Mit einer Wahrscheinlichkeit von 95% liegt das Haushaltsnettoeinkommen in Bielefeld in einem Intervall von X Euro ± Y Euro. Aufgrund der Stichprobenerhebung weist das Ergebnis ein Unsicherheitsintervall aus. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Warum wird dann nicht in jedem Fall eine Totalerhebung durchgeführt? Vorteile von Stichprobenerhebungen: I Sie sind billiger als Totalerhebungen. I Die Ergebnisse stehen bei Stichprobenerhebungen schneller zur Verfügung als bei Totalerhebungen. I Bei Stichprobenerhebungen ist eine geringere Größe des Mitarbeiterstabes notwendig als bei Totalerhebungen. Die Mitarbeiter können dafür spezieller geschult werden. I Es ist bei Stichprobenerhebungen ein besserer Umgang mit Ausfällen, z.B. aufgrund von Nichterreichbarkeit der zu Befragenden, möglich als bei Totalerhebungen. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Nachteile von Stichprobenerhebungen: I Bei verhältnismäßig kleinen Gesamtheiten, zum Beispiel vom Umfang N = 300, ist es in der Regel wenig sinnvoll, eine Stichprobe zu ziehen. I Eine Totalerhebung ist vorteilhafter, wenn Aussagen zu kleinen Subpopulationen innerhalb der Gesamtheit getroffen werden sollen. Diese sind bei einer Stichprobenerhebung wesentlich unpräziser als bei einer Totalerhebung. I In gewissen Fällen verbietet sich eine Stichprobenerhebung und die Totalerhebung ist die einzige Möglichkeit. Dies gilt z.B. für so genannte Rückrufaktionen bei Autos. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Grundgesamtheit Die Menge aller Elemente, für die die aus der Stichprobe gewonnenen Aussagen gültig sein sollen, bezeichnet man als Grundgesamtheit oder Untersuchungsgesamtheit. Die Grundgesamtheit muss zu Beginn der Untersuchung sachlich, räumlich und zeitlich abgegrenzt werden. Beispiel: In einer Erhebung sollte festgestellt werden, wie sich die Änderung des Gesetzes über den Erziehungsurlaub aus dem Jahr 1986 auf die Berufsverläufe von Frauen in Deutschland ausgewirkt hat. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I sachliche Abgrenzung: alle deutschsprachigen Frauen außer Auszubildende, Schülerinnen und Studentinnen. I räumliche Abgrenzung: alle deutschsprachigen Frauen, die in der Bundesrepublik Deutschland in Privathaushalten leben. I zeitliche Abgrenzung: alle deutschsprachigen Frauen, die seit dem 01.01.1992 ein Kind bekommen bzw. adoptiert haben. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Existiert eine Liste, auf der die Elemente der Grundgesamtheit akzeptabel verzeichnet sind: I Hinreichende Aktualität der Liste Beispiel: Einwohnermelderegister der Gemeinden haben in der Regel ein timelag, d.h. enthalten Fehler in Bezug auf mobile Personen, Geburten und Sterbefälle. Trotzdem sind die Register eine häufig verwendete Auswahlgrundlage, da eine bessere Liste nicht verfügbar ist. I Jedes Mitglied der Grundgesamtheit ist einmal und nur einmal aufgeführt, d.h. die Liste weist weder overcoverage noch undercoverage auf: I I overcoverage: Es sind Elemente enthalten, die nicht zur Grundgesamtheit gehören. undercoverage: Es sind Elemente nicht enthalten, die zur Grundgesamtheit gehören. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I Die Liste ist für die Erhebung zugänglich und ihre Nutzung ist nicht zu teuer. Beispiel Einwohnermelderegister: Die Untersuchung muss im öffentlichen Interesse liegen. Das Untersuchungsinstitut hat eine gültige Unbedenklichkeitsbescheinigung. Die Preise für Stichproben aus Einwohnermelderegistern sind jeweils von den Bundesländern festgelegt und unterscheiden sich stark. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Auswahlgesamtheit und Stichprobe Die Auswahlgesamtheit besteht aus allen Einheiten, aus denen die Stichprobe tatsächlich ausgewählt wird. Die Auswahlgesamtheit ist die Grundlage für die Stichprobenziehung. I Auswahlgesamtheit und Grundgesamtheit sind selten identisch. I Existieren systematische Abweichungen zwischen Auswahlund Grundgesamtheit? I Abschätzung des Umfangs der Grundgesamtheit vor Beginn der Untersuchung, um beurteilen zu können, ob eine Stichprobenerhebung überhaupt sinnvoll ist. I Sichtung von Materialien über die Grundgesamtheit (z. B. Mikrozensusdaten) Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Umfrageergebnis und tatsächliches Ergebnis der Bundestagswahl 1994 Partei CDU/CSU SPD FDP B90/Grüne PDS REP FG Wahlen 42.5% 35.5% 7.0% 8.0% 3.5% 2.0% N=1.250 Jost Reinecke Amtl. Ergebnis 41.5% 36.4% 6.9% 7.3% 4.4% 1.9% N=42.104.576 Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Zufallsstichproben Eine Stichprobenziehung wird als zufällig bezeichnet, wenn jede Einheit der Auswahlgesamtheit die gleiche Wahrscheinlichkeit hat, in die Stichprobe zu gelangen. Ein wesentlicher Vorteil von Zufallsauswahlen besteht darin, daß sich angeben läßt, wie Stichprobenergebnisse vom “wahren“ Wert der Auswahlgesamtheit abweichen. Es werden folgende Verfahren unterschieden: 1. Einfache Zufallsstichproben 1.1 Reine Zufallsstichprobe 1.2 Systematische Zufallsstichprobe 2. Komplexe Zufallsstichproben 2.1 Geschichtete Stichprobe 2.2 Klumpenstichprobe 2.3 Mehrstufige Stichproben Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Wahl des Designs/Wahl des Erhebungsmodus Wahl des Designs systematisch Wahl des Erhebungsmodus schriftlich geschichtet - proportional - disproportional persönlich-mündlich telefonisch E-Mail/Internet Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I I I Einfache Zufallsstichproben Komplexe Zufallsstichproben Wenn eine akzeptable Liste mit den Elementen der Auswahlgesamtheit vorliegt, wird aus dieser uneingeschränkt ausgewählt. Wenn Zusatzinformationen zur Verfügung stehen, kann auch geschichtet ausgewählt werden. Dabei spielt der Erhebungsmodus keine Rolle. Wenn keine Liste vorliegt, die für die Auswahl geeignet ist, muss auf andere Konstruktionen zurückgegriffen werden. Diese kann beispielsweise in einer mehrstufigen Flächenstichprobe mit Random-Route-Elementen bestehen. Random-Route setzt die Vorgabe von Startadressen voraus. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel für Random-Route: Gehen Sie von der Startadresse bis zur nächsten Kreuzung, dann rechts abbiegen und dann wieder links. Notieren Sie auf dem Weg jeden sechsten Haushalt. Adressermittlung und Interviews werden von verschiedenen Personen durchgeführt: → Adressandom Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Einfache Zufallsstichproben I I Man zieht eine einfache Zufallstichprobe, indem man aus einer vollständigen Liste aller Objekte der Zielpopulation nach dem Zufallsprinzip eine Anzahl von Objekten auswählt, wobei die Auswahlwahrscheinlichkeiten aller Objekte gleich groß sein müssen. Bei der Auswahl von Einheiten aus einer Gesamtheit ist es von Vorteil, wenn diese Einheiten nach einem Wahrscheinlichkeitsgesetz gezogen werden, da sich dann statistisch gesicherte Aussagen über interessierende Parameter der Gesamtheit machen lassen. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Reine Zufallsstichprobe Ausgangspunkt ist folgenden Situation: I Es ist eine Einheit der Grundgesamtheit vom Umfang N auszuwählen und die Auswahl für jede Einheit ist gleich, d. h. 1/N. Die Durchführung der Ziehung kann über ein Zufallsexperiment realisiert werden. I Wiederholt man dieses Zufallsexperiment n mal unabhängig und hält die ausgewählten Einheiten in einem Vektor fest, so erhält man Ziehungsergebnisse mit der gleichen Wahrscheinlichkeit. Dieses Stichprobendesign wird auch als uneingeschränkte Zufallsauswahl mit Zurücklegen bezeichnet. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel: I I I Es existiert eine Grundgesamtheit mit vier Elementen: {1, 2, 3, 4} Es sollen zwei Elemente ausgewählt werden. Es existieren insgesamt 6 mögliche Stichproben: 4! 2! · (4 − 2)! I Die Wahrscheinlichkeit, daß eine bestimmte Stichprobe realisiert wird, beträgt ein 1/6. Jost Reinecke Stichprobenziehung (1) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Systematische Zufallsstichprobe I I Bei einer systematischen Zufallsstichprobe wird das erste Element per Zufall ermittelt. Ausgehend von diesem Element werden alle weiteren Elemente systematisch ausgewählt. Damit gelangt jedes k-te Element in die Stichprobe. Mit k wird das Stichprobenintervall gekennzeichnet. k= Auswahlgesamtheit Stichprobe Jost Reinecke Stichprobenziehung (2) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel: I Es existiert eine Auswahlgesamtheit von 20.000 Personen. Es soll eine Stichprobe von 500 Personen gezogen werden. I 20.000 = 40 500 Jede 40. Person gelangt in die Stichprobe. I k= Jost Reinecke Stichprobenziehung (3) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Komplexe Zufallsstichproben I I Wenn keine Ausflistung der Auswahlgesamtheit vorliegt, dann verwendet man komplexe Zufallsstichproben. Hierzu gehören geschichtete Stichproben, die Klumpenstichprobe und sogenannte mehrstufige Stichprobenverfahren. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Geschichtete Stichprobe I I Zur Ziehung einer geschichteten Stichprobe werden die Elemente der Auswahlgesamtheit bezüglich des interessierenden Merkmals in Schichten eingeteilt. Aus diesen Schichten werden dann Zufallstichproben gezogen. Bezeichnet man mit N(h) den Umfang der Auswahlgesamtheit und mit n(h) den Umfang der Stichprobe der h-ten Schicht (h = 1, . . . , H), so wird das gewogene arithmetische Mittel der Stichprobenmittel ȳ (h) zur Schätzung verwendet: ȳstr = H X N(h) h=1 Jost Reinecke N ȳ (h) Stichprobenziehung (4) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I Einfache Zufallsstichproben Komplexe Zufallsstichproben Für die Varianz des geschichteten Schätzers kann folgende Funktion angegeben werden: 2 sstr H X n(h) − 1 N(h) 2 s 2 (h) = 1− N n(h) N(h) − 1 (5) h=1 I Ein 95%-Konfidenzintervall kann damit für den Mittelwert Ȳ der Grundgesamtheit angegeben werden: q q 2 ; ȳ 2 ȳstr − 1.96 sstr + 1.96 sstr (6) str I Je größer die Homogenität der Auswahlgesamtheit, desto kleiner der Stichprobenfehler. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I Einfache Zufallsstichproben Komplexe Zufallsstichproben Proportional geschichtete Stichprobe: Die Größe der Stichprobe einer Schicht wird entsprechend ihres Anteils an der Auswahlgesamtheit ausgewählt. Beispiel: Die Anteil der Arbeiter in der Stichprobe entspricht dem Anteil in der Auswahlgesamtheit. I Disproportional geschichtete Stichprobe: Die Größe der Stichprobe einer Schicht wird überproportional zum Anteil an der Grundgesamtheit ausgewählt. Beispiel: Die Anteil der Ostdeutschen in der Stichprobe ist höher als der Anteil der Westdeutschen. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Klumpenstichprobe Eine Klumpenstichprobe ist möglich, wenn die Grundgesamtheit in mehrere Teile (auch Klumpen genannt) zerlegt werden kann. Im einfachsten Fall besteht sie aus zwei Stufen: 1. Aus allen Klumpen werden in einer uneingeschränkten Zufallsauswahl einzelne ausgewählt. Die Anzahl der ausgewählten Klumpen ist der erste Stichprobenumfang. 2. Sämtliche Einheiten (Personen) der ausgewählten Klumpen werden erfasst. 3. Die Anzahl der ausgewählten Einheiten ist der zweite Stichprobenumfang. Dieser Stichprobenumfang ist der eigentliche Umfang einer Klunpenstichprobe. 4. Die Auswahl bezieht sich nicht auf Untersuchungseinheiten, sondern auf Aggregate von Untersuchungseinheiten (Klumpen). Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Vorteil der Klumpenstichprobe: I I I Es ist nur eine umfassende Auswahlgrundlage für die Klumpen, nicht aber für die Gesamtheit aller Untersuchungseinheiten erforderlich. Bei organisatorischen und geographischen Abgrenzungen der Klumpen ist eine kostengünstige Erhebung der Einheiten möglich. Der Idealfall liegt vor, wenn alle Klumpen gleich groß sind und die Heterogenität der Grundgesamtheit wiedergeben. Nachteil der Klumpenstichprobe: I Je stärker sich die Klumpen in ihrer Größe unterscheiden und je homogener sie in Bezug auf das Untersuchungsmerkmal sind, desto größer ist der Schätzfehler. Dies wird auch als Klumpeneffekt bezeichnet. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Mehrstufige Stichproben I I Erstreckt sich eine Zufallsauswahl über mehrere Ebenen, dann wird von einer mehrstufigen Zufallsauswahl gesprochen. Mehrstufige Stichproben sind eine Reihe nacheinander durchgeführte einfache Zufallsauswahlen. 1. Stufe: Stichprobe von Primäreinheiten (regionale Einheiten) 2. Stufe: Stichprobe von Sekundäreinheiten aus den Primäreinheiten I 3. Stufe: Stichprobe von Untersuchungseinheiten aus den Sekundäreinheiten I I I Geschichtete Zufallsauswahl und Klumpenauswahl sind zwei Spezialfälle mehrstufiger Stichproben. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel: Stichprobenziehung des ALLBUS 1998 1. 1. Stufe: zufällig ausgewählte Stimmbezirke 2. 2. Stufe: zufällig ausgewählte Haushalten in den jeweiligen Stimmbezirken (Random-Route) 3. 3. Stufe: zufällig ausgewählte Befragungsperson aus den ausgewählte Haushalten (Schwedenschlüssel) Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I I I Einfache Zufallsstichproben Komplexe Zufallsstichproben Die Primäreinheiten (Stimmbezirke) haben bei mehrstufigen Auswahlverfahren immer unterschiedlich viele Elemente. Elemente aus größeren Primäreinheiten beitzen damit eine niedrigere Auswahlwahrscheinlichkeit als Elemente aus kleineren Primäreinheiten. Wenn die Primäreinheiten unterschiedlich groß sind, müssen diese mit einer Wahrscheinlichkeit ausgewählt werden, die proportional zu ihrer Größe ist. Hierzu existiert das sogenannte PPS-Design (probability proportional to size). Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel für ein PPS-Design 1. Es werden 200 Blocks mit Auswahlwahrscheinlichkeiten proportional zu ihrer Größe (Anzahl der Haushalte im Block) ausgewählt. Die Ziehungswahrscheinlichkeit ist: p = nBlock nHH/Block nHH/Stadt (7) nBlock ist die Anzahl der auszuwählenden Blocks, nHH/Block is die Anzahl der Haushalte im Block und nHH/Stadt als Anzahl der Haushalte der Stadt. Bei einem Block mit 100 Haushalten ergibt sich folgende Ziehungswahrscheinlichkeit: p = 200 100 = 0.2 100000 Jost Reinecke Stichprobenziehung (8) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Bei einem Block mit 400 Haushalten ergibt sich folgende Ziehungswahrscheinlichkeit: p = 200 400 = 0.8 100000 (9) 2. Aus jedem Block werden 5 Haushalte ausgewählt. Bei 100 Haushalten ist die Ziehungswahrscheinlichkeit: 5/100 = 0.05. Bei 400 Haushalten ist die Ziehungswahrscheinblichkeit: 5/400 = 0.0125. 3. Werden die Wahrscheinlichkeiten aus der 1. Stufe und der 2. Stufe miteinander multipliziert, dann ergibt sich die tatsächliche Auswahlwahrscheinlichkeit: p = 0.2 ∗ 0.05 = 0.8 ∗ 0.0125 = 0.01 Jost Reinecke Stichprobenziehung (10) Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben ADM-Stichproben-System Die Arbeitsgemeinschaft Deutscher Markt- und Sozialforschungsinstitute e.V. (ADM) verwendet für persönlich-mündliche Bevölkerungsbefragungen der Markt-, Mediaund Sozialforschung, in der Regel ein speziell entwickeltes Design, das sogenannte ADM-Design. Es handelt sich dabei um eine dreistufige, geschichtete Zufallsauswahl, die zur Repräsentation der Wahlberechtigten, die in Privathaushalten identifiziert werden können, geeignet ist. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I Einfache Zufallsstichproben Komplexe Zufallsstichproben 1. Stufe: Die Wahlbezirke werden nach Kreisen und Gemeindegrößenklassen geschichtet. Dabei entstehen in Westdeutschland 3280 Zellen, in Ostdeutschland 1120. Aus dem Schichttableau werden dann mit der Wahrscheinlichkeit proportional zur (geschätzten) Anzahl der Privathaushalte Wahlbezirke ausgewählt. Anschließend werden diese in möglichst überschneidungsfreie und kumulierbare Teilstichproben (sog. Netze) zerlegt und an die einzelnen Institute des ADM ausgegeben. Ein Netz umfasst 210 Sample Points in Westdeutschland und 48 Sample Points in Ostdeutschland. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I I Einfache Zufallsstichproben Komplexe Zufallsstichproben 2. Stufe: Anschließend werden die Haushalte gesucht, in denen schließlich die Zielperson zu ermitteln ist. Die Interviewer erhalten dazu eine vorgegebene Begehungsvorschrift. Ihnen obliegt es nun, beginnend an einer vorgegebenen Startadresse eine bestimmte Zahl von Haushalten entlang dieses Weges aufzulisten. Beim sogenannten Adressvorlaufverfahren erfolgen Begehung und Befragung getrennt. Hier wird die Liste der Haushalte dem Institut übergeben, das eine Zufallsauswahl der Zielhaushalte vornimmt. Der Interviewer bekommt damit die Haushaltsadressen vorgegeben, bei denen eine Befragung durchzuführen ist. 3. Stufe: In der letzten Auswahlstufe werden schließlich die zu befragenden Personen ermittelt. Diese Auswahl erfolgt erst während der Feldarbeit. Dazu wird der sogenannte Schwedenschlüssel verwendet. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Einwohnermeldeamtsstichproben I I Das derzeitig qualitativ hochwertigste Design für bundesweite Bevölkerungsumfragen in Deutschland ist die Einwohnermeldeamtstichprobe, die auf einem geschichteten, zweistufigem Zufallsverfahren basiert. Da in Deutschland kein zentrales Einwohnerregister besteht, sondern die Register auf Gemeindeebene organisiert sind, muss in einem ersten Schritt eine Auswahl von Gemeinden erfolgen. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben Einfache Zufallsstichproben Komplexe Zufallsstichproben Beispiel: Konstruktion der Einwohnermeldeamtsstichprobe für den European Social Survey 2003 I I I Grundgesamtheit dieser Untersuchung waren alle Personen im Alter von 15 Jahren und älter, die in Deutschland in Privathaushalten leben. Für Ost- und Westdeutschland wurde ein disproportionaler Stichprobenansatz gewählt: 1000 Interviews in Ostdeutschland und in 2000 Interviews in Westdeutschland. Zunächst wurden die Gemeinden nach Kreisen und Gemeindegrößenklassen geschichtet. Dabei ergaben sich 1.085 Schichtzellen in West- und 435 Schichtzellen in Ostdeutschland. Jost Reinecke Stichprobenziehung Einleitung Grundbegriffe Stichprobe oder Totalerhebung Grundgesamtheit Auswahlgesamtheit und Stichprobe Zufallsstichproben I I Einfache Zufallsstichproben Komplexe Zufallsstichproben In der ersten Auswahlstufe wurden aus diesen Schichten 100 Gemeinden in West- und 50 Gemeinden in Ostdeutschland proportional zur Bevölkerungszahl 15 Jahre und älter ausgewählt. Die Zahl der Sample Points in Westdeutschland beträgt 108, in Ostdeutschland 55. In der zweiten Auswahlstufe wird in den entsprechenden Einwohnermeldeämtern für jeden Sample Point per systematischer Zufallsauswahl eine feste Zahl von Personen gezogen. Jost Reinecke Stichprobenziehung