Datenerhebung 2 17 Datenerhebung Problemstellungen Die mit einem * markierten Problemstellungen basieren auf Klausuraufgaben. Problemstellung 2-1 Erfassen Sie analog zur beigefügten Abbildung mit Hilfe eines Metermaßbandes den Umfang (Angaben in cm) der jeweils linken Hand (ohne Daumen) von zehn erwachsenen weiblichen und von zehn erwachsenen männlichen Personen aus dem Kreis Ihrer Familie, Ihrer Freunde und/oder Ihrer Kommilitonen. a) Benennen Sie den Merkmalsträger und die Erhebungsmerkmale sowie die Skala, auf der jeweils die erfassten Merkmalsausprägungen definiert sind. b) Erläutern Sie kurz den Zustandsmengenbegriff und geben Sie für die Erhebungsmerkmale die jeweilige Zustandsmenge an. c) Welche der nachfolgend genannten Merkmalsklassifikationen treffen für die in Rede stehenden Erhebungsmerkmale zu? Klassifikationen: häufbar, nicht häufbar, mittelbar erfassbar, unmittelbar erfassbar. d) Wie wird in der angewandten Statistik die Zusammenstellung der erfassten Daten bezeichnet? e) Welche der nachfolgend aufgelisteten Begriffe sind geeignet, Ihre empirisch erhobenen Daten zu charakterisieren? Begründen Sie kurz Ihre jeweilige Aussage. Auflistung: i) Primärerhebung, ii) Sekundärerhebung, iii) Totalerhebung, iv) Stichprobenerhebung. f) Welche erfassungsstatistische Konsequenz resultiert aus der Festlegung der Geschlechtszugehörigkeit als ein Identifikationsmerkmal? Erläutern Sie kurz den Begriff „Identifikationsmerkmal“. g) Erläutern Sie in Anlehnung an die vorhergehende Fragestellung am konkreten Sachverhalt die Adjektive „dichotom“ und „disjunkt“. Problemstellung 2-2* Die aufgelisteten Daten sind ein Bestandteil einer empirischen Studie, die im Jahr 2008 in Berliner Orthopädiepraxen durchgeführt wurde. Die Daten beschreiben die Länge ((1), Angaben in cm) des jeweils linken Fußes eines Patienten. Die Studie basiert auf den Daten von insgesamt 1000 Patienten. 24,3 28,1 12,2 18,6 22,2 32,1 11,1 27,0 26,4 24,8 24,5 25,7 23,5 26,9 25,8 26,2 28,3 29,4 30,0 17,1 23,6 28,1 25,7 25,0 25,7 © Springer Fachmedien Wiesbaden 2017 P.P. Eckstein, Datenanalyse mit SPSS, DOI 10.1007/978-3-658-18039-3_2 18 Datenerhebung a) Erläutern Sie am konkreten Sachverhalt die folgenden statistischen Grundbegriffe: Merkmalsträger, Grundgesamtheit, Grundgesamtheitsumfang, Stichprobe, Zufallsstichprobe, realisierte Zufallsstichprobe, Stichprobenumfang, Identifikationsmerkmal, Erhebungsmerkmal, Merkmalsausprägung, Zustandsmenge, Skala. b) Aus der „bunt gemischten“ Menge aller für die Studie erfassten Patienten wurde jeder zehnte Patient ausgewählt. Als Erster wurde der Patient mit der Ordnungsnummer 100 ausgewählt. Wie wird in der Statistik die praktizierte Patientenauswahl bezeichnet? c) Mit welchem Zählabstand hätte man die Patienten auswählen müssen, wenn als erster Patient der Patient mit der Ordnungsnummer 1 und als letzter Patient der Patient mit der Ordnungsnummer 1000 ausgewählt worden wäre? d) Bestimmen und interpretieren Sie den prozentualen Auswahlsatz. e) Welche Form der Zufallsauswahl wäre im konkreten Fall praktiziert worden, wenn theoretisch jeder Patient eine gleiche Chance besessen hätte, in die Auswahl zu gelangen? f) Die Gesamtheit der 1000 erfassten Patienten wird durch die beiden Gruppierungsmerkmale „Geschlecht“ und „Altersgruppe“ in insgesamt sechs disjunkte Teilgesamtheiten gegliedert. Aus den disjunkten Teilgesamtheiten wird jeweils jeder fünfte Patient ausgewählt. Welche Zufallsauswahl hätte man in diesem Fall praktiziert? Wie viele Ausprägungen muss im konkreten Fall die Zustandsmenge des Gruppierungsmerkmals „Altersgruppe“ beinhalten? Problemstellung 2-3* In Anlehnung an die Problemstellung 1-12* liegt Ihnen ein „Stapel ausgefüllter Fragebögen“ vor. Die hinsichtlich ihres Umfanges zahlreich erhobenen Informationen sollen mit Hilfe des Statistik-Programm-Pakets SPSS in einer Datendatei gespeichert, aufbereitet und analysiert werden. a) Wie wird in der statistischen Methodenlehre das praktizierte Datenerhebungskonzept gekennzeichnet? b) Wie viele Variablen müssen Sie im Dateneditor insgesamt definieren? c) In SPSS kann eine Vielzahl von Variablentypen optional vereinbart werden. Welchen Typ würden Sie vereinbaren? Begründen Sie kurz Ihre Entscheidung. d) Erläutern Sie exemplarisch und kurz den Vorgang und die Zweckbestimmung einer numerischen Kodierung. e) Sie haben unter beachtlichem Zeitaufwand die vermerkten Informationen von bereits 789 Fragebögen via Tatstatur in den SPSS Dateneditor eingegeben und in einer SPSS Arbeitsdatei gespeichert. Charakterisieren und begründen Sie die im Dateneditor angezeigte Datenmatrix in der üblichen Zeilen-Spalten-Kennung. Datenerhebung 19 Lösungen Die mit einem * markierten Lösungen basieren auf Klausuraufgaben. Lösung 2-1 a) Merkmalsträger: erwachsene Person Erhebungsmerkmale: i) Handumfang, metrisch skaliert, ii) Geschlechtszugehörigkeit, nominal skaliert b) Zustandsmenge als Menge aller wohl voneinander unterschiedenen Aussagen über ein Erhebungsmerkmal i) Zustandsmenge für Handumfang: Menge der positiven reellen Zahlen ii) Zustandsmenge für Geschlechtszugehörigkeit: Aussagenpaar „männlich“ bzw. „weiblich“ c) nicht häufbar, unmittelbar erfassbar d) Urliste e) i) Primärerhebung, da für die Merkmalsträger die gewünschten Daten noch nicht erhoben wurden bzw. nicht verfügbar sind ii) Sekundärerhebung hier nicht zu treffend, wäre zum Beispiel zutreffend, wenn man auf bereits erfasste geschlechtsspezifische Handumfangsdaten zurückgreifen würde iii) Totalerhebung, wenn man die Erhebung nur auf die 20 Personen bezieht iv) Stichprobenerhebung, wenn man die 20 Personen als eine Teilmenge aus einer großen Menge von Personen auffasst f) Identifikationsmerkmal: wird für eine statistische Gesamtheit festgelegt und variiert somit bezüglich seiner möglichen Ausprägung nicht Konsequenz: Dichotomisierung der statistischen Gesamtheit, d.h. die Gesamtheit wird in zwei disjunkte Teilgesamtheiten (zehn männliche und zehn weibliche Personen) aufgeteilt g) dichotom: Geschlechtszugehörigkeit einer Person ist eine Dichotomie, da nur die zwei Zustände „männlich bzw. weiblich“ definiert sind disjunkt: elementefremd, d.h. eine Person kann entweder nur männlich oder nur weiblich sein, ein gemeinsames Eintreten der beiden Ausprägungen ist per Definition im Sinne einer „leeren Schnittmenge“ ausgeschlossen Lösung 2-2* a) Merkmalsträger: Patient Grundgesamtheit einschließlich Umfang: 1000 Patienten Stichprobe: Auswahl von 25 aus 1000 Patienten Zufallsstichprobe: zufällige Auswahl von 25 aus 1000 Patienten realisierte Zufallsstichprobe einschließlich Umfang: 25 Fußlängendaten von 25 zufällig ausgewählten Patienten 20 Datenerhebung Identifikationsmerkmale: Patient (sachlich), Berliner Orthopädiepraxen (örtlich), 2008 (zeitlich) Erhebungsmerkmal: Länge des rechten Fußes Zustandsmenge: Menge der positiven reellen Zahlen, Skala: metrisch, da die Fußlänge mittels eines Messvorgang bewerkstelligt und mit Hilfe positiver reeller Zahlen bzw. Dezimalzahlen beschrieben wurde b) systematische Zufallsauswahl c) Zählabstand: INT(1000 / 25) = 40 Hinweis: die numerische Funktion INT(eger) erzeugt in Anlehnung an den lateinischen Begriff „numerus integer“ aus einer reellen Zahl (etwa in Gestalt eines Quotienten a = b / c) eine ganze Zahl d) aus der Grundgesamtheit wurden (25 / 1000) 100 % = 2,5 % der Patienten zufällig ausgewählt e) reine Zufallsauswahl f) geschichtete Zufallsauswahl; die Zustandsmenge des kategorialen Gruppierungsmerkmals „Altersgruppe“ muss im konkreten Fall drei Ausprägungen (z.B. Kinder, Jugendliche, Erwachsene) beinhalten Lösung 2-3* a) primärstatische Datenerhebung mit Hilfe eines standardisierten Fragebogen b) insgesamt 13 Variablen, wobei die erste Variable F0 die Nummer der befragten Person und die letzte Variable F8d in Gestalt einer numerischen, dichotomen und 0-1-kodierten Größe die Mehrfachnennungsoption Internet beinhaltet c) numerisch, da sämtliche Fragen bezüglich der möglichen Antworten entweder zahlenmäßig kodierte Größen oder Mess- bzw. Zählgrößen sind d) zum Beispiel Frage F4: Schulabschluss einer befragten Person Vorgang: die drei im Sinne einer geschlossenen persönlichen Frage indizierten, wohl voneinander zu unterscheidenden, hinsichtlich ihrer Wertigkeit geordneten und verbal beschriebenen Schulabschlüsse werden auf die natürlichen Zahlen 1 bis 3 abgebildet vorteilhafte Zweckbestimmung: bei der Dateneingabe braucht man jeweils nur ein Zeichen in Gestalt einer einziffrigen Zahl und keine Zeichenkette in Gestalt eines Begriffes via Tastatur in den Dateneditor einzugeben, hinzu kommt noch, dass in SPSS viele Analyseverfahren nur mit Hilfe von numerischen Informationen bewerkstelligt werden können e) Datenmatrix vom Typ 789 13, wobei die 789 im SPSS Dateneditor belegten Zeilen die erfassten Fragebögen bzw. befragten Personen und die 13 Spalten die fragebogenbasierten bzw. personenbezogenen Erhebungsmerkmale einschließlich der Fragebogennummer kennzeichnen http://www.springer.com/978-3-658-18038-6