2 Datenerhebung

Werbung
Datenerhebung
2
17
Datenerhebung
Problemstellungen
Die mit einem * markierten Problemstellungen basieren auf Klausuraufgaben.
Problemstellung 2-1
Erfassen Sie analog zur beigefügten Abbildung mit Hilfe eines Metermaßbandes
den Umfang (Angaben in cm) der jeweils linken Hand (ohne Daumen) von zehn
erwachsenen weiblichen und von zehn erwachsenen
männlichen Personen aus dem Kreis Ihrer Familie, Ihrer
Freunde und/oder Ihrer Kommilitonen.
a) Benennen Sie den Merkmalsträger und die Erhebungsmerkmale sowie die Skala, auf der jeweils die erfassten
Merkmalsausprägungen definiert sind.
b) Erläutern Sie kurz den Zustandsmengenbegriff und geben Sie für die Erhebungsmerkmale die jeweilige Zustandsmenge an.
c) Welche der nachfolgend genannten Merkmalsklassifikationen treffen für die in Rede stehenden Erhebungsmerkmale zu? Klassifikationen: häufbar, nicht häufbar, mittelbar erfassbar, unmittelbar erfassbar.
d) Wie wird in der angewandten Statistik die Zusammenstellung der erfassten Daten bezeichnet?
e) Welche der nachfolgend aufgelisteten Begriffe sind geeignet, Ihre empirisch erhobenen Daten zu charakterisieren? Begründen Sie kurz Ihre jeweilige Aussage.
Auflistung: i) Primärerhebung, ii) Sekundärerhebung, iii) Totalerhebung, iv)
Stichprobenerhebung.
f) Welche erfassungsstatistische Konsequenz resultiert aus der Festlegung der Geschlechtszugehörigkeit als ein Identifikationsmerkmal? Erläutern Sie kurz den
Begriff „Identifikationsmerkmal“.
g) Erläutern Sie in Anlehnung an die vorhergehende Fragestellung am konkreten
Sachverhalt die Adjektive „dichotom“ und „disjunkt“. 
Problemstellung 2-2*
Die aufgelisteten Daten sind ein Bestandteil einer empirischen Studie, die im Jahr 2008 in Berliner Orthopädiepraxen durchgeführt
wurde. Die Daten beschreiben die Länge ((1), Angaben in cm) des
jeweils linken Fußes eines Patienten. Die Studie basiert auf den
Daten von insgesamt 1000 Patienten.
24,3
28,1
12,2
18,6
22,2
32,1
11,1
27,0
26,4
24,8
24,5
25,7
23,5
26,9
25,8
26,2
28,3
29,4
30,0
17,1
23,6
28,1
25,7
25,0
25,7
© Springer Fachmedien Wiesbaden 2017
P.P. Eckstein, Datenanalyse mit SPSS,
DOI 10.1007/978-3-658-18039-3_2
18
Datenerhebung
a) Erläutern Sie am konkreten Sachverhalt die folgenden statistischen Grundbegriffe: Merkmalsträger, Grundgesamtheit, Grundgesamtheitsumfang, Stichprobe, Zufallsstichprobe, realisierte Zufallsstichprobe, Stichprobenumfang,
Identifikationsmerkmal, Erhebungsmerkmal, Merkmalsausprägung, Zustandsmenge, Skala.
b) Aus der „bunt gemischten“ Menge aller für die Studie erfassten Patienten wurde
jeder zehnte Patient ausgewählt. Als Erster wurde der Patient mit der Ordnungsnummer 100 ausgewählt. Wie wird in der Statistik die praktizierte Patientenauswahl bezeichnet?
c) Mit welchem Zählabstand hätte man die Patienten auswählen müssen, wenn als
erster Patient der Patient mit der Ordnungsnummer 1 und als letzter Patient der
Patient mit der Ordnungsnummer 1000 ausgewählt worden wäre?
d) Bestimmen und interpretieren Sie den prozentualen Auswahlsatz.
e) Welche Form der Zufallsauswahl wäre im konkreten Fall praktiziert worden,
wenn theoretisch jeder Patient eine gleiche Chance besessen hätte, in die Auswahl zu gelangen?
f) Die Gesamtheit der 1000 erfassten Patienten wird durch die beiden Gruppierungsmerkmale „Geschlecht“ und „Altersgruppe“ in insgesamt sechs disjunkte
Teilgesamtheiten gegliedert. Aus den disjunkten Teilgesamtheiten wird jeweils
jeder fünfte Patient ausgewählt.
Welche Zufallsauswahl hätte man in diesem Fall praktiziert? Wie viele Ausprägungen muss im konkreten Fall die Zustandsmenge des Gruppierungsmerkmals „Altersgruppe“ beinhalten? 
Problemstellung 2-3*
In Anlehnung an die Problemstellung 1-12* liegt Ihnen ein „Stapel ausgefüllter
Fragebögen“ vor. Die hinsichtlich ihres Umfanges zahlreich erhobenen Informationen sollen mit Hilfe des Statistik-Programm-Pakets SPSS in einer Datendatei gespeichert, aufbereitet und analysiert werden.
a) Wie wird in der statistischen Methodenlehre das praktizierte Datenerhebungskonzept gekennzeichnet?
b) Wie viele Variablen müssen Sie im Dateneditor insgesamt definieren?
c) In SPSS kann eine Vielzahl von Variablentypen optional vereinbart werden.
Welchen Typ würden Sie vereinbaren? Begründen Sie kurz Ihre Entscheidung.
d) Erläutern Sie exemplarisch und kurz den Vorgang und die Zweckbestimmung
einer numerischen Kodierung.
e) Sie haben unter beachtlichem Zeitaufwand die vermerkten Informationen von
bereits 789 Fragebögen via Tatstatur in den SPSS Dateneditor eingegeben und
in einer SPSS Arbeitsdatei gespeichert.
Charakterisieren und begründen Sie die im Dateneditor angezeigte Datenmatrix in der üblichen Zeilen-Spalten-Kennung. 
Datenerhebung
19
Lösungen
Die mit einem * markierten Lösungen basieren auf Klausuraufgaben.
Lösung 2-1
a) Merkmalsträger: erwachsene Person
Erhebungsmerkmale: i) Handumfang, metrisch skaliert, ii) Geschlechtszugehörigkeit, nominal skaliert
b) Zustandsmenge als Menge aller wohl voneinander unterschiedenen Aussagen
über ein Erhebungsmerkmal
i) Zustandsmenge für Handumfang: Menge der positiven reellen Zahlen
ii) Zustandsmenge für Geschlechtszugehörigkeit: Aussagenpaar „männlich“
bzw. „weiblich“
c) nicht häufbar, unmittelbar erfassbar
d) Urliste
e) i) Primärerhebung, da für die Merkmalsträger die gewünschten Daten noch
nicht erhoben wurden bzw. nicht verfügbar sind
ii) Sekundärerhebung hier nicht zu treffend, wäre zum Beispiel zutreffend,
wenn man auf bereits erfasste geschlechtsspezifische Handumfangsdaten zurückgreifen würde
iii) Totalerhebung, wenn man die Erhebung nur auf die 20 Personen bezieht
iv) Stichprobenerhebung, wenn man die 20 Personen als eine Teilmenge aus
einer großen Menge von Personen auffasst
f) Identifikationsmerkmal: wird für eine statistische Gesamtheit festgelegt und variiert somit bezüglich seiner möglichen Ausprägung nicht
Konsequenz: Dichotomisierung der statistischen Gesamtheit, d.h. die Gesamtheit wird in zwei disjunkte Teilgesamtheiten (zehn männliche und zehn weibliche Personen) aufgeteilt
g) dichotom: Geschlechtszugehörigkeit einer Person ist eine Dichotomie, da nur
die zwei Zustände „männlich bzw. weiblich“ definiert sind
disjunkt: elementefremd, d.h. eine Person kann entweder nur männlich oder nur
weiblich sein, ein gemeinsames Eintreten der beiden Ausprägungen ist per Definition im Sinne einer „leeren Schnittmenge“ ausgeschlossen 
Lösung 2-2*
a) Merkmalsträger: Patient
Grundgesamtheit einschließlich Umfang: 1000 Patienten
Stichprobe: Auswahl von 25 aus 1000 Patienten
Zufallsstichprobe: zufällige Auswahl von 25 aus 1000 Patienten
realisierte Zufallsstichprobe einschließlich Umfang: 25 Fußlängendaten von 25
zufällig ausgewählten Patienten
20
Datenerhebung
Identifikationsmerkmale: Patient (sachlich), Berliner Orthopädiepraxen (örtlich), 2008 (zeitlich)
Erhebungsmerkmal: Länge des rechten Fußes
Zustandsmenge: Menge der positiven reellen Zahlen, Skala: metrisch, da die
Fußlänge mittels eines Messvorgang bewerkstelligt und mit Hilfe positiver reeller Zahlen bzw. Dezimalzahlen beschrieben wurde
b) systematische Zufallsauswahl
c) Zählabstand: INT(1000 / 25) = 40
Hinweis: die numerische Funktion INT(eger) erzeugt in Anlehnung an den lateinischen Begriff „numerus integer“ aus einer reellen Zahl (etwa in Gestalt eines Quotienten a = b / c) eine ganze Zahl
d) aus der Grundgesamtheit wurden (25 / 1000)  100 % = 2,5 % der Patienten
zufällig ausgewählt
e) reine Zufallsauswahl
f) geschichtete Zufallsauswahl; die Zustandsmenge des kategorialen Gruppierungsmerkmals „Altersgruppe“ muss im konkreten Fall drei Ausprägungen
(z.B. Kinder, Jugendliche, Erwachsene) beinhalten 
Lösung 2-3*
a) primärstatische Datenerhebung mit Hilfe eines standardisierten Fragebogen
b) insgesamt 13 Variablen, wobei die erste Variable F0 die Nummer der befragten
Person und die letzte Variable F8d in Gestalt einer numerischen, dichotomen
und 0-1-kodierten Größe die Mehrfachnennungsoption Internet beinhaltet
c) numerisch, da sämtliche Fragen bezüglich der möglichen Antworten entweder
zahlenmäßig kodierte Größen oder Mess- bzw. Zählgrößen sind
d) zum Beispiel Frage F4: Schulabschluss einer befragten Person
Vorgang: die drei im Sinne einer geschlossenen persönlichen Frage indizierten, wohl voneinander zu unterscheidenden, hinsichtlich ihrer Wertigkeit geordneten und verbal beschriebenen Schulabschlüsse werden auf die natürlichen
Zahlen 1 bis 3 abgebildet
vorteilhafte Zweckbestimmung: bei der Dateneingabe braucht man jeweils
nur ein Zeichen in Gestalt einer einziffrigen Zahl und keine Zeichenkette in Gestalt eines Begriffes via Tastatur in den Dateneditor einzugeben, hinzu kommt
noch, dass in SPSS viele Analyseverfahren nur mit Hilfe von numerischen Informationen bewerkstelligt werden können
e) Datenmatrix vom Typ 789  13, wobei die 789 im SPSS Dateneditor belegten
Zeilen die erfassten Fragebögen bzw. befragten Personen und die 13 Spalten die
fragebogenbasierten bzw. personenbezogenen Erhebungsmerkmale einschließlich der Fragebogennummer kennzeichnen 
http://www.springer.com/978-3-658-18038-6
Herunterladen