Stichprobenziehung - Universität Bielefeld

Werbung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Stichprobenziehung
Jost Reinecke
Universität Bielefeld
7. April 2005
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einleitung
Die Berücksichtigung aller Untersuchungseinheiten ist in der Regel
zu kosten- und zeitaufwändig. Daher beschränkt man sich auf eine
gewisse Anzahl von Untersuchungseinheiten, den Stichproben, um
Aussagen über Sachverhalte in der interessierenden Gesamtheit
treffen zu können.
Die Stichprobenziehung hängt unmittelbar mit der
Wahrscheinlichkeitstheorie zusammen:
1. Die Wahrscheinlichkeitstheorie läßt Angaben über die
Wahrscheinlichkeit der Zusammensetzung einer Stichprobe zu.
2. Bei der Generalisierung von Stichprobendaten können
Angaben über die Wahrscheinlichkeit getroffen werden, mit
der Kennwerte in der Population abgebildet werden können.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Grundbegriffe
Grundgesamtheit (Population):
Elemente bzw. Personen, auf die sich Aussagen einer statistischen
Analyse beziehen. Die Grundgesamtheit ist sowohl sachlich als
auch räumlich und zeitlich exakt zu definieren. In den meisten
Fällen ist es aus zeitlichen und finanziellen Gründen nicht möglich,
alle Einheiten der Grundgesamtheit zu erheben (Totalerhebung).
Man wird sich daher auf eine Auswahl (Stichprobe) beschränken,
die auch häufig sehr viel intensiver und präziser als eine
Totalerhebung durchgeführt werden kann.
Beispiel: Wählerbefragung - sämtliche Wahlberechtigte der Stadt
Köln / des Landes NRW / der BRD.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Parameter der Grundgesamtheit:
µ:
Mittelwert
σ2:
Varianz
σ:
Standardabweichung,
π (manchmal auch θ): Anteilswert
N:
Fallzahl in der Grundgesamtheit
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Stichprobe (Sample):
Auswahl von Elementen bzw. Personen der Gesamtheit. Eine
Stichprobe soll ein möglichst repräsentatives Bild der
Grundgesamtheit liefern. Handelt es sich um eine Zufallsstichprobe,
bei der die Erhebungseinheiten nach dem Zufallsprinzip ausgewählt
wurden, dann können die Schätzverfahren und Hypothesentests der
schließenden Statistik angewendet werden.
Beispiel: Stichprobe von Wählern.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Parameter der Stichprobe:
x:
s:
s2
p:
n:
Mittelwert
Standardabweichung
Varianz
Anteilswert
Stichprobenumfang
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Erhebungseinheiten: Elemente der Population, auf die sich die
Auswahl bezieht und die überhaupt eine Chance haben, in die
Stichprobe aufgenommen zu werden.
Stichprobenverfahren: Vorschrift, die festlegt, in welcher Weise
Elemente der Grundgesamtheit ausgewählt werden.
1. Zufallsauswahl: Resultat einer Zufallsauswahl sind
Zufallsstichproben.
2. Bewußte Auswahl: Quotenstichproben
3. Willkürliche Auswahl: Psychologische Experimente
Stichprobenumfang: Anzahl der ausgewählten Elemente, die in
der Regel mit N bezeichnet werden.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Stichprobe oder Totalerhebung
Uns interessiert ein Kennwert einer Gesamtheit, z.B. das
durchschnittliche Nettoeinkommen der Haushalte in Bielefeld.
1. Totalerhebung: Man kann alle Bielefelder Haushalte nach
ihrem Nettoeinkommen fragen und dann den Mittelwert
berechnen.
2. Stichprobe: Man kann einige Bielefelder Haushalte auswählen
und diese über ihr Nettoeinkommen befragen. Wenn die
Haushalte nach bestimmten Regeln ausgewählt werden,
können wir anschließend mit einer gewissen
Wahrscheinlichkeit auf das mittlere Nettoeinkommen aller
Bielefelder Haushalte schließen.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Die Totalerhebung hat den Vorteil, dass die gesuchten Kennwerte
genau angegeben werden können.
Beispiel: Das mittlere Haushaltsnettoeinkommen in Bielefeld
beträgt X Euro.
Bei einer Stichprobe würde das Ergebnis komplizierter ausfallen.
Beispiel: Mit einer Wahrscheinlichkeit von 95% liegt das
Haushaltsnettoeinkommen in Bielefeld in einem Intervall von X
Euro ± Y Euro.
Aufgrund der Stichprobenerhebung weist das Ergebnis ein
Unsicherheitsintervall aus.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Warum wird dann nicht in jedem Fall eine Totalerhebung
durchgeführt?
Vorteile von Stichprobenerhebungen:
I
Sie sind billiger als Totalerhebungen.
I
Die Ergebnisse stehen bei Stichprobenerhebungen schneller
zur Verfügung als bei Totalerhebungen.
I
Bei Stichprobenerhebungen ist eine geringere Größe des
Mitarbeiterstabes notwendig als bei Totalerhebungen. Die
Mitarbeiter können dafür spezieller geschult werden.
I
Es ist bei Stichprobenerhebungen ein besserer Umgang mit
Ausfällen, z.B. aufgrund von Nichterreichbarkeit der zu
Befragenden, möglich als bei Totalerhebungen.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Nachteile von Stichprobenerhebungen:
I
Bei verhältnismäßig kleinen Gesamtheiten, zum Beispiel vom
Umfang N = 300, ist es in der Regel wenig sinnvoll, eine
Stichprobe zu ziehen.
I
Eine Totalerhebung ist vorteilhafter, wenn Aussagen zu
kleinen Subpopulationen innerhalb der Gesamtheit getroffen
werden sollen. Diese sind bei einer Stichprobenerhebung
wesentlich unpräziser als bei einer Totalerhebung.
I
In gewissen Fällen verbietet sich eine Stichprobenerhebung
und die Totalerhebung ist die einzige Möglichkeit. Dies gilt
z.B. für so genannte Rückrufaktionen bei Autos.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Grundgesamtheit
Die Menge aller Elemente, für die die aus der Stichprobe
gewonnenen Aussagen gültig sein sollen, bezeichnet man als
Grundgesamtheit oder Untersuchungsgesamtheit. Die
Grundgesamtheit muss zu Beginn der Untersuchung sachlich,
räumlich und zeitlich abgegrenzt werden.
Beispiel: In einer Erhebung sollte festgestellt werden, wie sich die
Änderung des Gesetzes über den Erziehungsurlaub aus dem Jahr
1986 auf die Berufsverläufe von Frauen in Deutschland ausgewirkt
hat.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
sachliche Abgrenzung: alle deutschsprachigen Frauen außer
Auszubildende, Schülerinnen und Studentinnen.
I
räumliche Abgrenzung: alle deutschsprachigen Frauen, die in
der Bundesrepublik Deutschland in Privathaushalten leben.
I
zeitliche Abgrenzung: alle deutschsprachigen Frauen, die seit
dem 01.01.1992 ein Kind bekommen bzw. adoptiert haben.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Existiert eine Liste, auf der die Elemente der Grundgesamtheit
akzeptabel verzeichnet sind:
I
Hinreichende Aktualität der Liste
Beispiel: Einwohnermelderegister der Gemeinden haben in der
Regel ein timelag, d.h. enthalten Fehler in Bezug auf mobile
Personen, Geburten und Sterbefälle. Trotzdem sind die
Register eine häufig verwendete Auswahlgrundlage, da eine
bessere Liste nicht verfügbar ist.
I
Jedes Mitglied der Grundgesamtheit ist einmal und nur einmal
aufgeführt, d.h. die Liste weist weder overcoverage noch
undercoverage auf:
I
I
overcoverage: Es sind Elemente enthalten, die nicht zur
Grundgesamtheit gehören.
undercoverage: Es sind Elemente nicht enthalten, die zur
Grundgesamtheit gehören.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
Die Liste ist für die Erhebung zugänglich und ihre Nutzung ist
nicht zu teuer.
Beispiel Einwohnermelderegister:
Die Untersuchung muss im öffentlichen Interesse liegen.
Das Untersuchungsinstitut hat eine gültige
Unbedenklichkeitsbescheinigung.
Die Preise für Stichproben aus Einwohnermelderegistern sind
jeweils von den Bundesländern festgelegt und unterscheiden
sich stark.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Auswahlgesamtheit und Stichprobe
Die Auswahlgesamtheit besteht aus allen Einheiten, aus denen die
Stichprobe tatsächlich ausgewählt wird. Die Auswahlgesamtheit ist
die Grundlage für die Stichprobenziehung.
I
Auswahlgesamtheit und Grundgesamtheit sind selten
identisch.
I
Existieren systematische Abweichungen zwischen Auswahlund Grundgesamtheit?
I
Abschätzung des Umfangs der Grundgesamtheit vor Beginn
der Untersuchung, um beurteilen zu können, ob eine
Stichprobenerhebung überhaupt sinnvoll ist.
I
Sichtung von Materialien über die Grundgesamtheit (z. B.
Mikrozensusdaten)
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Umfrageergebnis und tatsächliches Ergebnis der Bundestagswahl
1994
Partei
CDU/CSU
SPD
FDP
B90/Grüne
PDS
REP
FG Wahlen
42.5%
35.5%
7.0%
8.0%
3.5%
2.0%
N=1.250
Jost Reinecke
Amtl. Ergebnis
41.5%
36.4%
6.9%
7.3%
4.4%
1.9%
N=42.104.576
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Zufallsstichproben
Eine Stichprobenziehung wird als zufällig bezeichnet, wenn jede
Einheit der Auswahlgesamtheit die gleiche Wahrscheinlichkeit hat,
in die Stichprobe zu gelangen. Ein wesentlicher Vorteil von
Zufallsauswahlen besteht darin, daß sich angeben läßt, wie
Stichprobenergebnisse vom “wahren“ Wert der Auswahlgesamtheit
abweichen. Es werden folgende Verfahren unterschieden:
1. Einfache Zufallsstichproben
1.1 Reine Zufallsstichprobe
1.2 Systematische Zufallsstichprobe
2. Komplexe Zufallsstichproben
2.1 Geschichtete Stichprobe
2.2 Klumpenstichprobe
2.3 Mehrstufige Stichproben
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Wahl des Designs/Wahl des Erhebungsmodus
Wahl des Designs
systematisch
Wahl des Erhebungsmodus
schriftlich
geschichtet
- proportional
- disproportional
persönlich-mündlich
telefonisch
E-Mail/Internet
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
I
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Wenn eine akzeptable Liste mit den Elementen der
Auswahlgesamtheit vorliegt, wird aus dieser
uneingeschränkt ausgewählt.
Wenn Zusatzinformationen zur Verfügung stehen, kann
auch geschichtet ausgewählt werden. Dabei spielt der
Erhebungsmodus keine Rolle.
Wenn keine Liste vorliegt, die für die Auswahl geeignet
ist, muss auf andere Konstruktionen zurückgegriffen
werden. Diese kann beispielsweise in einer mehrstufigen
Flächenstichprobe mit Random-Route-Elementen
bestehen. Random-Route setzt die Vorgabe von
Startadressen voraus.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel für Random-Route:
Gehen Sie von der Startadresse bis zur nächsten Kreuzung,
dann rechts abbiegen und dann wieder links. Notieren Sie auf
dem Weg jeden sechsten Haushalt.
Adressermittlung und Interviews werden von verschiedenen
Personen durchgeführt: → Adressandom
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Einfache Zufallsstichproben
I
I
Man zieht eine einfache Zufallstichprobe, indem man aus einer
vollständigen Liste aller Objekte der Zielpopulation nach dem
Zufallsprinzip eine Anzahl von Objekten auswählt, wobei die
Auswahlwahrscheinlichkeiten aller Objekte gleich groß sein
müssen.
Bei der Auswahl von Einheiten aus einer Gesamtheit ist es von
Vorteil, wenn diese Einheiten nach einem
Wahrscheinlichkeitsgesetz gezogen werden, da sich dann
statistisch gesicherte Aussagen über interessierende Parameter
der Gesamtheit machen lassen.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Reine Zufallsstichprobe
Ausgangspunkt ist folgenden Situation:
I Es ist eine Einheit der Grundgesamtheit vom Umfang N
auszuwählen und die Auswahl für jede Einheit ist gleich, d. h.
1/N. Die Durchführung der Ziehung kann über ein
Zufallsexperiment realisiert werden.
I Wiederholt man dieses Zufallsexperiment n mal unabhängig
und hält die ausgewählten Einheiten in einem Vektor fest, so
erhält man Ziehungsergebnisse mit der gleichen
Wahrscheinlichkeit. Dieses Stichprobendesign wird auch als
uneingeschränkte Zufallsauswahl mit Zurücklegen bezeichnet.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel:
I
I
I
Es existiert eine Grundgesamtheit mit vier Elementen:
{1, 2, 3, 4}
Es sollen zwei Elemente ausgewählt werden.
Es existieren insgesamt 6 mögliche Stichproben:
4!
2! · (4 − 2)!
I
Die Wahrscheinlichkeit, daß eine bestimmte Stichprobe
realisiert wird, beträgt ein 1/6.
Jost Reinecke
Stichprobenziehung
(1)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Systematische Zufallsstichprobe
I
I
Bei einer systematischen Zufallsstichprobe wird das erste
Element per Zufall ermittelt.
Ausgehend von diesem Element werden alle weiteren Elemente
systematisch ausgewählt. Damit gelangt jedes k-te Element in
die Stichprobe. Mit k wird das Stichprobenintervall
gekennzeichnet.
k=
Auswahlgesamtheit
Stichprobe
Jost Reinecke
Stichprobenziehung
(2)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel:
I
Es existiert eine Auswahlgesamtheit von 20.000 Personen.
Es soll eine Stichprobe von 500 Personen gezogen werden.
I
20.000
= 40
500
Jede 40. Person gelangt in die Stichprobe.
I
k=
Jost Reinecke
Stichprobenziehung
(3)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Komplexe Zufallsstichproben
I
I
Wenn keine Ausflistung der Auswahlgesamtheit vorliegt, dann
verwendet man komplexe Zufallsstichproben.
Hierzu gehören geschichtete Stichproben, die
Klumpenstichprobe und sogenannte mehrstufige
Stichprobenverfahren.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Geschichtete Stichprobe
I
I
Zur Ziehung einer geschichteten Stichprobe werden die
Elemente der Auswahlgesamtheit bezüglich des
interessierenden Merkmals in Schichten eingeteilt. Aus diesen
Schichten werden dann Zufallstichproben gezogen.
Bezeichnet man mit N(h) den Umfang der Auswahlgesamtheit
und mit n(h) den Umfang der Stichprobe der h-ten Schicht
(h = 1, . . . , H), so wird das gewogene arithmetische Mittel der
Stichprobenmittel ȳ (h) zur Schätzung verwendet:
ȳstr =
H
X
N(h)
h=1
Jost Reinecke
N
ȳ (h)
Stichprobenziehung
(4)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Für die Varianz des geschichteten Schätzers kann folgende
Funktion angegeben werden:
2
sstr
H X
n(h) − 1
N(h) 2 s 2 (h)
=
1−
N
n(h)
N(h) − 1
(5)
h=1
I
Ein 95%-Konfidenzintervall kann damit für den Mittelwert Ȳ
der Grundgesamtheit angegeben werden:
q q
2 ; ȳ
2
ȳstr − 1.96 sstr
+
1.96
sstr
(6)
str
I
Je größer die Homogenität der Auswahlgesamtheit, desto
kleiner der Stichprobenfehler.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Proportional geschichtete Stichprobe: Die Größe der
Stichprobe einer Schicht wird entsprechend ihres Anteils an
der Auswahlgesamtheit ausgewählt.
Beispiel: Die Anteil der Arbeiter in der Stichprobe entspricht dem
Anteil in der Auswahlgesamtheit.
I
Disproportional geschichtete Stichprobe: Die Größe der
Stichprobe einer Schicht wird überproportional zum Anteil an
der Grundgesamtheit ausgewählt.
Beispiel: Die Anteil der Ostdeutschen in der Stichprobe ist höher
als der Anteil der Westdeutschen.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Klumpenstichprobe
Eine Klumpenstichprobe ist möglich, wenn die Grundgesamtheit in
mehrere Teile (auch Klumpen genannt) zerlegt werden kann. Im
einfachsten Fall besteht sie aus zwei Stufen:
1. Aus allen Klumpen werden in einer uneingeschränkten
Zufallsauswahl einzelne ausgewählt. Die Anzahl der
ausgewählten Klumpen ist der erste Stichprobenumfang.
2. Sämtliche Einheiten (Personen) der ausgewählten Klumpen
werden erfasst.
3. Die Anzahl der ausgewählten Einheiten ist der zweite
Stichprobenumfang. Dieser Stichprobenumfang ist der
eigentliche Umfang einer Klunpenstichprobe.
4. Die Auswahl bezieht sich nicht auf Untersuchungseinheiten,
sondern auf Aggregate von Untersuchungseinheiten
(Klumpen).
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Vorteil der Klumpenstichprobe:
I
I
I
Es ist nur eine umfassende Auswahlgrundlage für die
Klumpen, nicht aber für die Gesamtheit aller
Untersuchungseinheiten erforderlich.
Bei organisatorischen und geographischen Abgrenzungen der
Klumpen ist eine kostengünstige Erhebung der Einheiten
möglich.
Der Idealfall liegt vor, wenn alle Klumpen gleich groß sind und
die Heterogenität der Grundgesamtheit wiedergeben.
Nachteil der Klumpenstichprobe:
I
Je stärker sich die Klumpen in ihrer Größe unterscheiden und
je homogener sie in Bezug auf das Untersuchungsmerkmal
sind, desto größer ist der Schätzfehler. Dies wird auch als
Klumpeneffekt bezeichnet.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Mehrstufige Stichproben
I
I
Erstreckt sich eine Zufallsauswahl über mehrere Ebenen, dann
wird von einer mehrstufigen Zufallsauswahl gesprochen.
Mehrstufige Stichproben sind eine Reihe nacheinander
durchgeführte einfache Zufallsauswahlen.
1. Stufe: Stichprobe von Primäreinheiten (regionale Einheiten)
2. Stufe: Stichprobe von Sekundäreinheiten aus den
Primäreinheiten
I 3. Stufe: Stichprobe von Untersuchungseinheiten aus den
Sekundäreinheiten
I
I
I
Geschichtete Zufallsauswahl und Klumpenauswahl sind zwei
Spezialfälle mehrstufiger Stichproben.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel: Stichprobenziehung des ALLBUS 1998
1. 1. Stufe: zufällig ausgewählte Stimmbezirke
2. 2. Stufe: zufällig ausgewählte Haushalten in den jeweiligen
Stimmbezirken (Random-Route)
3. 3. Stufe: zufällig ausgewählte Befragungsperson aus den
ausgewählte Haushalten (Schwedenschlüssel)
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
I
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Die Primäreinheiten (Stimmbezirke) haben bei mehrstufigen
Auswahlverfahren immer unterschiedlich viele Elemente.
Elemente aus größeren Primäreinheiten beitzen damit eine
niedrigere Auswahlwahrscheinlichkeit als Elemente aus
kleineren Primäreinheiten.
Wenn die Primäreinheiten unterschiedlich groß sind, müssen
diese mit einer Wahrscheinlichkeit ausgewählt werden, die
proportional zu ihrer Größe ist.
Hierzu existiert das sogenannte PPS-Design (probability
proportional to size).
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel für ein PPS-Design
1. Es werden 200 Blocks mit Auswahlwahrscheinlichkeiten
proportional zu ihrer Größe (Anzahl der Haushalte im Block)
ausgewählt. Die Ziehungswahrscheinlichkeit ist:
p = nBlock
nHH/Block
nHH/Stadt
(7)
nBlock ist die Anzahl der auszuwählenden Blocks, nHH/Block is
die Anzahl der Haushalte im Block und nHH/Stadt als Anzahl
der Haushalte der Stadt. Bei einem Block mit 100 Haushalten
ergibt sich folgende Ziehungswahrscheinlichkeit:
p = 200
100
= 0.2
100000
Jost Reinecke
Stichprobenziehung
(8)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Bei einem Block mit 400 Haushalten ergibt sich folgende
Ziehungswahrscheinlichkeit:
p = 200
400
= 0.8
100000
(9)
2. Aus jedem Block werden 5 Haushalte ausgewählt. Bei 100
Haushalten ist die Ziehungswahrscheinlichkeit: 5/100 = 0.05.
Bei 400 Haushalten ist die Ziehungswahrscheinblichkeit:
5/400 = 0.0125.
3. Werden die Wahrscheinlichkeiten aus der 1. Stufe und der 2.
Stufe miteinander multipliziert, dann ergibt sich die
tatsächliche Auswahlwahrscheinlichkeit:
p = 0.2 ∗ 0.05 = 0.8 ∗ 0.0125 = 0.01
Jost Reinecke
Stichprobenziehung
(10)
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
ADM-Stichproben-System
Die Arbeitsgemeinschaft Deutscher Markt- und
Sozialforschungsinstitute e.V. (ADM) verwendet für
persönlich-mündliche Bevölkerungsbefragungen der Markt-, Mediaund Sozialforschung, in der Regel ein speziell entwickeltes Design,
das sogenannte ADM-Design. Es handelt sich dabei um eine
dreistufige, geschichtete Zufallsauswahl, die zur Repräsentation der
Wahlberechtigten, die in Privathaushalten identifiziert werden
können, geeignet ist.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
1. Stufe: Die Wahlbezirke werden nach Kreisen und
Gemeindegrößenklassen geschichtet. Dabei entstehen in
Westdeutschland 3280 Zellen, in Ostdeutschland 1120. Aus
dem Schichttableau werden dann mit der Wahrscheinlichkeit
proportional zur (geschätzten) Anzahl der Privathaushalte
Wahlbezirke ausgewählt. Anschließend werden diese in
möglichst überschneidungsfreie und kumulierbare
Teilstichproben (sog. Netze) zerlegt und an die einzelnen
Institute des ADM ausgegeben. Ein Netz umfasst 210 Sample
Points in Westdeutschland und 48 Sample Points in
Ostdeutschland.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
2. Stufe: Anschließend werden die Haushalte gesucht, in denen
schließlich die Zielperson zu ermitteln ist. Die Interviewer
erhalten dazu eine vorgegebene Begehungsvorschrift. Ihnen
obliegt es nun, beginnend an einer vorgegebenen Startadresse
eine bestimmte Zahl von Haushalten entlang dieses Weges
aufzulisten. Beim sogenannten Adressvorlaufverfahren erfolgen
Begehung und Befragung getrennt. Hier wird die Liste der
Haushalte dem Institut übergeben, das eine Zufallsauswahl der
Zielhaushalte vornimmt. Der Interviewer bekommt damit die
Haushaltsadressen vorgegeben, bei denen eine Befragung
durchzuführen ist.
3. Stufe: In der letzten Auswahlstufe werden schließlich die zu
befragenden Personen ermittelt. Diese Auswahl erfolgt erst
während der Feldarbeit. Dazu wird der sogenannte
Schwedenschlüssel verwendet.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Einwohnermeldeamtsstichproben
I
I
Das derzeitig qualitativ hochwertigste Design für bundesweite
Bevölkerungsumfragen in Deutschland ist die
Einwohnermeldeamtstichprobe, die auf einem geschichteten,
zweistufigem Zufallsverfahren basiert.
Da in Deutschland kein zentrales Einwohnerregister besteht,
sondern die Register auf Gemeindeebene organisiert sind, muss
in einem ersten Schritt eine Auswahl von Gemeinden erfolgen.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
Beispiel: Konstruktion der Einwohnermeldeamtsstichprobe für den
European Social Survey 2003
I
I
I
Grundgesamtheit dieser Untersuchung waren alle Personen im
Alter von 15 Jahren und älter, die in Deutschland in
Privathaushalten leben.
Für Ost- und Westdeutschland wurde ein disproportionaler
Stichprobenansatz gewählt: 1000 Interviews in Ostdeutschland
und in 2000 Interviews in Westdeutschland.
Zunächst wurden die Gemeinden nach Kreisen und
Gemeindegrößenklassen geschichtet. Dabei ergaben sich 1.085
Schichtzellen in West- und 435 Schichtzellen in
Ostdeutschland.
Jost Reinecke
Stichprobenziehung
Einleitung
Grundbegriffe
Stichprobe oder Totalerhebung
Grundgesamtheit
Auswahlgesamtheit und Stichprobe
Zufallsstichproben
I
I
Einfache Zufallsstichproben
Komplexe Zufallsstichproben
In der ersten Auswahlstufe wurden aus diesen Schichten 100
Gemeinden in West- und 50 Gemeinden in Ostdeutschland
proportional zur Bevölkerungszahl 15 Jahre und älter
ausgewählt. Die Zahl der Sample Points in Westdeutschland
beträgt 108, in Ostdeutschland 55.
In der zweiten Auswahlstufe wird in den entsprechenden
Einwohnermeldeämtern für jeden Sample Point per
systematischer Zufallsauswahl eine feste Zahl von Personen
gezogen.
Jost Reinecke
Stichprobenziehung
Herunterladen