Empirie-Vorlesung im Wintersemester 2006/2007 Teil A: Quantitative Methoden Themen am 14.11.2006: • Operationalisierung • Begriffsexplikation • Messtheorie, Korrespondenzhypothesen und Korrespondenzregeln • Beobachten und Messen • Axiomatische Messtheorie • Psychologische Teststheorie: Reliabile und valide Messungen Lernziele: 1. 2. 3. 4. Nominal- u. Realdefinitionen Variablen, Faktoren und Indikatoren Messniveaus: Nominalskala, Ordinalskala, Intervallskala, Ratioskala Zulässige Transformationen Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 1 Wiederholung von letzter Woche Untersuchungsdesigns: • Ex-post-facto-Anordnung: Alle interessierenden Größen werden gleichzeitig nach ihrem erstmaligen Auftreten erfasst, Forscher hat keine Kontrolle über Ausprägungen der erklärenden Größen; • „echtes“ randomisiertes Experiment: Forscher hat vollständige Kontrolle über Ausprägungen der erklärenden Größen, die Versuchspersonen (Untersuchungseinheiten) werden zufällig den verschiedenen Ausprägungen der erklärenden Variablen (Treatment) zugeordnet und bilden Experimentalund Kontrollgruppen; • Quasi-Experiment: Forscher hat nur teilweise Kontrolle über Ausprägungen der erklärenden Variablen bzw. Zuordnung der Versuchspersonen zu Experimental- und Kontrollgruppen, es ist sichergestellt, dass die Größen, die als kausale Ursachen vermutet werden, vor dem Auftreten der Größen, die als Folgen vermutet werden, beoachtet werden. Weitere Kennzeichnungen von Untersuchungen: Querschnitts- u. Längsschnittsstudien (Trend, Panel, Zeitreihen); Einebenen - u. Mehrebenendesign, Netzwerkerhebung Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 2 Wiederholung von letzter Woche Kriterien für die Güte von Untersuchungsdesigns: • interne Validität: es gibt keine Alternativerklärung für den beobachteten Zusammenhang; • statistische Schlussvalidität: es wird ausgeschlossen, dass der beobachtete Zusammenhang nicht nur Folge der zufälligen Auswahl von Untersuchungseinheiten und der Zuordnung zu den Ausprägungen der erklärenden Größen ist; • Konstruktvalidität: die Bezeichnung der Ursachen und Wirkungen ist zutreffend; • externe Validität: die Verallgemeinerung von der untersuchten Population auf alle Einheiten der interessierenden Populationen ist korrekt. Fehlschlüsse • Regression zur Mitte: Fehlinterpretation einer durch zufällige Messfehler hervorgerufenen Veränderung zwischen zwei Messzeitpunkten als Entwicklung oder Effekt einer erklärenden Größe. • Ökologischer Fehlschluss. Fälschliche Gleichsetzung einer beobachteten Beziehung auf Aggregatebene mit einer entsprechender Beziehung auf Individualebene. Begriffe: Untersuchungseinheit (dabei evtl. Unterscheidung zwischen Erhebungseinheit u. Analyseeinheit) und Aussageeinheit. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 3 Operationalisierung und Messen Um den Wahrheitsgehalt einer empirischen Aussage zu untersuchen, ist es notwendig, eine Verbindung zwischen den in der empirischen Aussage benutzten Begriffen und den damit beschriebenen Sachverhalten herzustellen. Hierzu sind drei Schritte notwendig: • In der Begriffsexplikation ist zu klären, welche semantische Bedeutung ein Begriff hat. • Die Herstellung einer Beziehung zwischen einem Begriff und einem beobachtbaren Sachverhalt wird in der Sozialforschung als Operationalisierung bezeichnet. • Die tatsächliche Feststellung des Vorliegens bzw. Nichtvorliegens eines empirischen Sachverhalts ist die Beobachtung, deren Dokumentation in einem Messwert die Messung. 1. Begriffsexplikation In der Begriffsexplikation geht es um die Bedeutung eines Begriffes. Gelegentlich wird hierbei unterschieden zwischen Extension: Gesamtheit der Objekte, auf die ein Begriff zutrifft und Intension: Gesamtheit der gemeinsamen Eigenschaften, die die Objekte haben, auf die ein Begriff zutrifft. Die Intension des Begriffs „Demokratie“ besteht in der vollständigen Auflistung aller Eigenschaften, die eine Demokratie ausmachen, die Extension des Begriffs in der Aufzählung aller demokratischer Staaten. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 4 Begriffsexplikation Begriffe sollen konsistent und widerspruchsfrei verwendet werden. Voraussetzung hierfür ist: • Eindeutigkeit: Ein Begriff soll in immer gleicher, einheitlicher Bedeutung verwendet werden • Präzision: Für jeden Begriff soll eindeutig entscheidbar sein, ob etwas unter diesen Begriff fällt oder nicht fällt (extensionale Präzision); alle Eigenschaften des Begriffs sollen bekannt sein (intensionale Präzision). In der Konzeptspezifikation wird die Bedeutung eines Begriffes genauer expliziert. Dabei kann sich herausstellen, dass ein Begriff verschiedene Subdimensionen (Aspekte) umfasst. So kann etwa der in der Politikwissenschaft verwendete Begriff „Systemunterstützung“ die Aspekte - der Zufriedenheit mit den politischen Institutionen bzw. - der Zufriedenheit mit den politischen Akteuren beinhalten oder auch - die Identifikation mit dem Staat bzw. - die Identififkation mit der Gesellschaft beinhalten. Bisweilen lassen sich die einzelnen Aspekte eines Begriffs in Form eines Baumes oder Netzwerks darstellen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 5 Begriffsexplikation Beispiel: Systemunterstützung Systemunterstützung Systemzufriedenheit Identifikation Identifikation mit Staat Zufriedenheit mit Parteien Zufriedenheit mit Politikern Zufriedenheit mit Regeln Identifikation mit Gesellschaft Zufriedenheit mit Ergebnissen Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 6 Begriffsexplikation Darüber hinaus gibt es weitere Möglichkeiten, wie vage Begriffe präzisiert werden können: - Extensionale Festlegung (Aufzählung, in Sozialwissenschaften kaum anwendbar): Zu den Vögeln gehören: Elster, Papagei, ..., Schwalbe. - Einengung der Extension durch Erweiterung der Intension (Einführung zusätzlicher Merkmale): Zusätzlich zum Merkmal „kann fliegen“ für Explikation des Begriffs „Vogel“ weitere notwendige Merkmale: „zweibeinig“ , „hat Schnabel“, „legt Eier“, „hat Federn“, „ist warmblütig“. - Erweiterung der Extension durch Reduktion der Intension (Eliminierung von Merkmalen): Verzicht auf das Merkmal „kann fliegen“ bei Explikation des Begriffs „Vogel“. - Skalierung/Klassenbildung (zusätzlich zu der Dichotomie „Begriff trifft zu“ vs. „Begriff trifft nicht zu" werden zusätzliche Klassen bzw. Werte berücksichtigt); Anstelle der Unterscheidung „städtisch“ und „ländlich“ kann in einer Untersuchung zwischen „großstädtisch“, „kleinstädtisch“, „stadtnah“ und „dörflich“ unterschieden werden. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 7 Definitionen Das Ergebnis der Begriffsexplikation sollte möglichst zu einer Definition aller für eine Untersuchung relevanten Begriffe führen. Definition Gleichsetzungen (unbekannter) Begriffe mit bekannten Begriffen: Definiendum: zu definierender Begriff; Definiens: Aussagen, die ausschließlich bekannte Begriffe enthalten. Nominaldefinition: ist eine sprachliche Festlegung (Konvention), nach der das Definiendum analystisch mit dem Definiens gleichgesetzt wird. Beispiel: Schimmel =: weißes Pferd Konsequenzen: • Nominaldefinitionen können nicht falsch sein, d.h. es sind tautologische (analytisch wahre) Aussagen. • Nominaldefinitionen können jedoch inadäquat (unzweckmäßig) sein. Ob eine Nominaldefinition zweckmäßig ist, lässt sich in der Regel erst im praktischen Gebrauch des definierten Begriffs im Kontext seiner Verwendung erkennen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 8 Anforderungen an Nominaldefinitionen Bei der Verwendung von Nominaldefinitionen müssen Kriterien eingehalten werden: a) Eliminierbarkeit: Definiens und Definiendum müssen stets austauschbar sein. Wenn „Schimmel“ als weißes Pferd definiert ist, muss das Wort „Schimmel“ stets durch „weißes Pferd“ ersetzt werden können, ohne dass sich die Bedeutung einer Aussage ändert. b) Nichtkreativität: Bei Austausch von Definiens und Definiendum darf keine zusätzliche Bedeutung erzeugt werden. Wenn „Arbeiter“ nominal definiert ist als eine Person, die ihre Körperkraft anderen Personen gegen Entgelt zur Verfügung stellt, dann darf mit dem Begriff nicht ohne Ergänzung der Definitionsmerkmale die zusätzliche Bedeutung „Person mit niedriger sozialer Stellung“ verbunden werden. c) Nicht-Zirkularität: Der zu definierende Begriff darf nicht unmittelbar oder mittelbar im Definiens vorkommen. Die Definition „Ausbeutung =: unfaire Ausnutzung von Ressourcen einer Person“ wäre zirkulär, wenn an anderer Stelle „unfair“ als „jemanden ausbeuten“ definiert würde. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 9 Anforderungen an Nominaldefinitionen Bei der Verwendung von Nominaldefinitionen müssen Kriterien eingehalten werden: d) Keine Mehrfachdefinitionen: Ein Begriff darf nur einmal definiert werden. Unzulässig wäre z.B. die Definition „Arbeiter = Person, die ihre Körperkraft anderen entgeltlich zur Verfügung stellt“ und an anderer Stelle „Arbeiter = Arbeitnehmer, der bei einer Landesversicherungsanstalt rentenversichert ist“. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 10 Realdefinitionen Eine Realdefinition kann als Behauptung über die richtige Verwendung eines Begriffes verstanden werden. ‘Handy‘ ist eine in Deutschland übliche Bezeichnung für Mobiltelefone. Im Unterschied zu den tautologischen Nominaldefinitionen sind Realdefinitionen dann empirische Aussagen, d.h. sie können empirisch wahr oder falsch sein. Nominal- und Realdefinition werden oft mit zwei unterschiedlichen Konzeptionen von Sprache und Sprechen verbunden: • Im Begriffskonventionalismus wird die Bedeutung eines Begriffs durch Konvention vereinbart. - Problem: infiniter Regress, weil stets auf bekannte Begriffe rekurriert werden muss. • Der Begriffsessentialismus unterstellt dagegen, dass die Bedeutung eines Begriffes naturnotwendig vorgegeben ist. - Problem: essentielle Definitionen machen nur Sinn, wenn angenommen werden kann, dass die „wahre Bedeutung“ oder das „Wesen“ eines Begriffs intersubjektiv erkannt werden kann. Der Begriffsessentialismus ignoriert mögliche kulturelle Bedingtheiten von Begriffen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 11 Operationalisierung 2. Operationalisierung Die Formulierung von Regeln, mit deren Hilfe entschieden wird, ob bzw. in welchem Ausmaß der durch einen Begriff bezeichnete Sachverhalt vorliegt, wird als Operationalisierung bezeichnet. Operationalisierung des Begriffs „Systemunterstützung“ durch die Frage in einem Fragebogen: „ Was würden Sie allgemein zu der Demokratie in der Bundesrepublik, d.h. zu unseren politischen Parteien und zu unserem ganzen politischen System sagen? Sind Sie damit sehr zufrieden, eher zufrieden, eher unzufrieden oder sehr unzufrieden?“ Unterschied zwischen Definition und Operationalisierung: • Definition ist die Verknüpfung von unbekannten Begriffen mit bekannten Begriffen, • Operationalisierung ist die Verknüpfung von bekannten Begriffen mit empirischen Sachverhalten Unglücklich ist der Begriff operationale Definition als Gleichsetzung eines (empirischen) Begriffs mit seinem Messinstrument. Beispiel: Intelligenz ist, was der Intelligenztest misst. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 12 Operationalisierung Wie kann die Verknüpfung eines Begriffs mit empirischen Sachverhalten erfolgen? Nennung von Handlungsanweisungen (Korrespondenzregeln), mit deren Hilfe entschieden wird, ob ein Sachverhalt vorliegt. Beispiel Systemunterstützung: (a) Stellen der Frage nach der Zufriedenheit mit dem System (b) Notieren der Antworten: • Bei der Antwort „sehr zufrieden“ besteht eine große Systemzufriedenheit, • bei der Antwort „eher zufrieden“ besteht eine geringere, aber vorhandene Systemzufriedenheit, • bei der Antwort „eher unzufrieden“ besteht eine geringe Unzufriedenheit • und bei der Antwort „völlig unzufrieden“ besteht eine große Unzufriedenheit mit dem politischen System. Voraussetzung für eine geeignete Operationalisierung: Geeignete Handlungsanweisungen. Im Beispiel sollten die Antworten auf die Frage nach der Zufriedenheit mit dem politischen System tatsächlich mit den Vorstellungen/Bewertungen einer Person über das politische System korrespondieren. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 13 Operationalisierung Daraus folgt: Eine Operationalisierung kann als Anwendung einer Messtheorie verstanden werden. Die Messtheorie beinhaltet Annahmen über die Konsequenzen der mit einem Begriff verbundenen Eigenschaften auf empirisch beobachtbare Sachverhalte. Die Annahmen (empirischen Gesetze) der Messtheorie werden als Korrespondenzhypothesen bezeichnet. Aus den Korrelspondenzhypothesen werden in der Operationalisierung Korrespondenzregeln generiert. Korrespondenzregeln sind somit Anwendungen von Korrespondenzhypothesen. Korrespondenzhypothesen der Messtheorie zur Operationalisierung von „Systemzufriedenheit“: (1) Je zufriedener eine Person mit dem politischen System ist, desto größer ist die geäußerte Zufriedenheit in der Antwort auf die Frage: „Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, sehr zufrieden, eher zufrieden, eher unzufrieden oder völlig unzufrieden?“ (2) Wenn eine beiebige Person A auf die Frage nach der Demokratiezufriedenheit eine positivere Antwort gibt als eine zweite Person B, dann ist Person A zufriedener mit der Demokratie als Person B. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 14 Operationalisierung Eine Operationalisierung ist selbst bei einfachen, scheinbar leicht erfassbaren Begriffen nicht einfach. Beispiel: Operationalisierung des Lebensalters einer Person Alternativen: • „Sagen Sie mir bitte, wie alt Sie sind?“ (Befragung) • „Sagen Sie mir bitte, in welchem Jahr Sie geboren sind?“ (Befragung) • Notieren des Geburtstages aus dem Personalausweis. (Dokumentenanalyse) • Einschätzung des Alters durch den Forscher. (Beobachtung) Es ist nicht ausgeschlossen, dass die verschiedenen Operationalisierungen bei manchen Personen zu verschiedenen Ergebnissen führen, obwohl das Alter ein klar defnierter Begriff ist . Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 15 Operationalisierung: ideale Vorgehensweise Forschungsfrage mit Begriffen, die empirische Sachverhalte beinhalten ↓ Explikation der Begriffe ↓ Formulierung einer Messtheorie mit Korrespondenzhypothesen ↓ Generierung von Korrespondenzregeln Probleme: (1) In der Regel keine explizite Formulierung der Messtheorie: ⇒ Postulate der Messtheorie (Korrespondenzhypothesen) nicht bewusst. (2) Korrespondenzhypothesen können falsch sein: ⇒ Korrespondenzregeln vermutlich unangemessen ⇒ Empirische Beobachtung erlaubt keine Antwort auf Forschungsfrage. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 16 Variablen Vom Begriff zur Variablen Empirische Begriffe beschreiben bzw. postulieren Eigenschaften der Realität. In der Operationalisierung wird das Zutreffen oder Nichtzutreffen der durch einen Begriff bezeichneten Sachverhalte über Beobachtungen der Eigenschaften von Untersuchungseinheiten erfasst. Technisch wird ein Merkmal, das ist eine Eigenschaft einer Untersuchungseinheit als Variable bezeichnet. Die Untersuchungseinheit, auf die sich die Eigenschaft bezieht, wird auch als Merkmlasträger bezeichnet. Die Ausprägungen (Kategorien oder Werte) einer Variablen geben an, ob bzw. in welchem Ausmaß die betrachtete Eigenschaft bei einem potentiellen Merkmlasträger vorliegt. Jede Variable hat mindestens zwei Ausprägungen, da ein Merkmal vorhanden oder aber nicht vorhanden sein kann. Eine Variable mit genau zwei Ausprägungen wird als dichotom bezeichnet; polytome Variablen haben entsprechend mehr als zwei Ausprägungen. Die dichtome Variable „Geschlecht“ hat die Ausprägungen „männlich“ und „weiblich“. Die Variable „höchster allgemeinbildender Schulabschluss“ wird in Deutschland oft über fünf Ausprägungen erfasst: kein Abschluss, Hauptschulabschluss, mittlere Reife, Fachhochschulreife und Hochschulreife. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 17 Variablen Von einer Konstanten spricht man, wenn alle Untersuchungseinheiten die gleiche Ausprägung einer Eigenschaft haben. Alle Menschen haben die Eigenschaft „ist ein Säugetier“. Diese Ausprägung einer Variablen ist bezogen auf Menschen (aber nicht auf alle Tiere) eine Konstante. Variablenausprägungen sind stets (1) disjunkt: bei einem Merkmalsträger können nicht gleichzeitig zwei verschiedene Ausprägungen einer Variablen vorliegen. (2) erschöpfend: Jeder Merkmalsträger weist eine Ausprägung einer Variablen auf. Auf jeden Merkmalsträger trifft somit immer genau eine Ausprägung einer Variablen zu Schnecken sind zwittrige Tiere. Die beiden Ausprägungen „männlich“ und „weiblich“ sind daher für die Erfassung der Ausprägungen des biologischen Geschlechts von Organismen nicht immer ausreichend und müssen entsprechend ergänzt werden. Auch in den Sozialwissenschaften kann es sinvoll sein, die soziale Kategorie Geschlecht (Gender) nicht als dichotom aufzufassen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 18 Variablen Kennzeichnend für viele sozialwissenschaftliche Begriffe ist, dass (a) ihre Operationalisierung über mehrere Variablen erfolgt Im Sinne der Konzeptspezifikation von Systemunterstützung könnte dieser Begriff über die Variablen „Zufriedenheit mit den Regeln des Systems“, „Zufriedenheit mit dem Funktionieren des Systems“ und „Zufriedenheit mit den Ergebnissen des Systems“ erfasst werden. (b) Variablen sich auch oft auf nicht direkt beobachtbare Eigenschaften beziehen. Da sich die Variablen zur Erfassung der Systemunterstützung jeweils auf Bewertungen (Einstellungen) der Bürger eines Systems beziehen, sind sie nicht direkt beobachtbar, sondern müssen indirekt aus beobachtbaren Verhalten (z.B. den Antworten auf Fragen) erschlossen werden. Nicht direkt beobachtbare oder beobachtete Eigenschaften werden in der statistischen Datenanalyse als latente Variablen oder Faktoren bezeichnet; Variablen, deren beobachtete Ausprägungen zur indirekte Erfassung von latenten Variablen verwendet werden, heißen Indikatoren. Als Indikator zur Erfassung der latenten Variable „Systemunterstützung“ kann in einer Umfrage die Frage nach der „Demokratiezufriedenheit“ als Indikator herangezogen werden. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 19 Beobachten und Messen 3. Beobachten und Messen Messen bezieht sich dann auf den Vorgang der Datengewinnung, d.h. der Anwendung der Korrespondenzregeln bei der Beobachtung von empirischen Sachverhalten in der Datenerfassung und der Umsetzung und Dokumentation dieser Beobachtungen in mathematische Größen (Zahlen). Bei dem oft nicht eindeutig verwendeten Begriff lassen sich zwei unterschiedliche Bedeutungen unterscheiden: (1) Messen im weiteren Sinne bezieht sich auf den Akt der Datenerhebung. In der Sozialforschung spricht man auch von Beobachtung, (wobei unter „Beobachtung“ hier auch „Befragung“ und „Erfassung der Eigenschaften von Dokumenten, Filmen etc.“ fällt) (2) Messen im engeren Sinne bezieht sich auf die Zuordnung von Zahlen zu den bereits beobachteten empirischen Eigenschaften eines Objekts. Messen im engeren Sinne wird technisch auch als Kodierung bezeichnet. In der quantitativen Sozialforschung werden als Hilfestellung bei der Beobachtung und Messung Erhebungsinstrumente verwendet, mit deren Hilfe die Anwendung der Korrespondenzregeln erleichtert und die beobachteten Sachverhalte dokumentert werden. Bei Befragungen wird so i.a. ein Fragebogen eingesetzt, der die zu stellenden Fragen enthält und in dem die Antworten notiert werden. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 20 Beobachten und Messen: Beispiel für ein Erhebungsinstrument FRAGE 1. Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, alles in allem gesehen ... ANTWORT Code ... sehr zufrieden,................................. ... eher zufrieden,................................. ... eher unzufrieden,............................. ... oder völlig unzufrieden?................. ___________________ weiß nicht 1 keine Angabe 4 3 2 1 8 9 2. Nun einige Aussagen, über die man verschiedener Ansicht sein kann. Sagen Sie mir bitte jeweils, ob Sie der Aussage eher zustimmen oder eher nicht zustimmen. a) Leute wie ich haben so oder so keinen Einfluss darauf, was die Regierung tut b) Die Parteien wollen nur die Stimmen der Wähler, ihre Ansichten interessieren sie nicht ohne Abfrage eintragen! Das Interview wurde geführt mit... stimme eher zu stimme weiß eher nicht nicht zu keine Angabe 1 2 8 9 1 2 8 9 einem Mann.............................. einer Frau................................. 1 2 Da die Ausprägungen von Variablen disjunkt und erschöpfend sein müssen, muss bei einem Messinstrument auch stets berücksichtigt werden, dass fehlende oder ungültige Antworten mögliche Ausprägungen von empirischen Variablen sein können. Im Beispielfragebogen wird so die Zahl „9“ (bzw. „9999“ beim Alter) verwendet, um „keine Angabe“ zu erfassen und die Zahl „8“, um die im Sinne der Operationalisierung ungültige Antwort „weiß nicht“ zu berücksichtigen. 4. Zum Schluss noch eine Frage zur Geburtsjahr vierstellig eintragen! Statistik. Sagen Sie mir bitte, in ___________________ welchem Jahr Sie geboren sind. keine Angabe 9999 1 Kursiver gedruckter Text ist für den Interviewer bestimmt und wird nicht vorgelesen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 21 Beobachten und Messen: Beispiel für ein Erhebungsinstrument FRAGE 1. Sind Sie mit der Art und Weise, wie die Demokratie in der Bundesrepublik funktioniert, alles in allem gesehen ... ANTWORT Code ... sehr zufrieden,................................. ... eher zufrieden,................................. ... eher unzufrieden,............................. ... oder völlig unzufrieden?................. ___________________ weiß nicht 1 keine Angabe 4 3 2 1 8 9 2. Nun einige Aussagen, über die man verschiedener Ansicht sein kann. Sagen Sie mir bitte jeweils, ob Sie der Aussage eher zustimmen oder eher nicht zustimmen. a) Leute wie ich haben so oder so keinen Einfluss darauf, was die Regierung tut b) Die Parteien wollen nur die Stimmen der Wähler, ihre Ansichten interessieren sie nicht ohne Abfrage eintragen! Das Interview wurde geführt mit... stimme eher zu stimme weiß eher nicht nicht zu keine Angabe 1 2 8 9 1 2 8 9 einem Mann.............................. einer Frau................................. 1 2 4. Zum Schluss noch eine Frage zur Geburtsjahr vierstellig eintragen! 1943 Statistik. Sagen Sie mir bitte, in ___________________ welchem Jahr Sie geboren sind. keine Angabe 9999 1 Kursiver gedruckter Text ist für den Interviewer bestimmt und wird nicht vorgelesen. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) Beobachten bedeutet im Beispiel: Stellen der Fragen und Notieren der Antworten Die Beobachtung ergibt: Die befragte Person ... (1) ist „eher zufrieden“ mit dem Funktionieren der Demokratie, (2) stimmt der Aussage nicht zu, dass Leute wie die Person keinen Einfluss auf die Regierung hat, (3) stimmt auch nicht zu, dass die Parteien nicht an den Ansichten der Wähler interessiert sind, (4) ist männlich (5) und 1943 geboren. 22 Messen Mesen ist die Zuordnung von Zahlen zu den möglichen Vorkommensweisen einer Eigenschaften von Untersuchungseinheiten. Jedem empirischen Objekt wird eine Zahl (der Code) derart zugeordnet, dass der Zahl eine Eigenschaft des Objektes entspricht, und dem Vergleich von jeweils zwei Messungen der gemessenen Eigenschaft der Vergleich der zugeordneten Zahlen entspricht. Beispiel: gleiches Geschlecht ⇔ gleiche Zahl, verschiedenes Geschlecht ⇔ verschiedene Zahl. A B C 1 D 2 Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 23 Messen in der axiomatischen Messtheorie Definition von Messen in der axiomatischen Messtheorie: Messen ist eine homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ A B C 1 D 2 empirisches Relativ: empirische Objekte und Beziehungen (Relationen) zwischen den Objekten anhand deren Eigenschaften (hier: Vergleich nach Gleichheit bzw. Verschiedenheit von Menschen hinsichtlich ihres Geschlechts numerisches Relativ: mathematische Objekte (Zahlen) und Beziehungen (Relationen) zwischen den Zahlen Homomorphe (strukturtreue) Abbildung: Vergleiche aufgrund der empischen Eigenschaft entsprechen Vergleiche von Zahlen und müssen daher zum gleichen Ergebnis kommen. hier: gleiche Zahl = gleiches Geschlecht, verschiedene Zahl = verschiedenes Geschlecht. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 24 Messniveau oder Skalenniveau: Die Informationshaltigkeit von Messungen Zwischen Zahlen lassen sich sehr verschiedenen Beziehungen (Relationen) herstellen. So ist die Zahl 2 doppelt so groß wie die Zahl 1; 2 = 2×1 Dieser Eigenschaft entspricht bei der Messung des Geschlechts keine empirische Eigenschaft: Weibliche Befragte (Code = 2) haben verglichen mit männlichen Befragten (Code = 1) kein doppeltes Ausmaß an der Eigenschaft Geschlecht! Geschlecht lässt gar sich nicht hinsichtlich seines Ausmaßes vergleichen. Das Messniveau oder Skalenniveau einer Messung legt fest, welche numerische Eigenschaften von Zahlen empirischen Bedeutungen entsprechen: • Messungen auf Nominalskalenniveau enthalten nur Informationen, ob gleiche oder ungleiche Ausprägungen einer Eigenschaft vorliegen; • Messungen auf Ordinalskalenniveau geben zusätzlich Auskunft über ein mehr oder weniger des Ausmaßes einer Eigenschaft; • Messungen auf Intervallskalenniveau erlauben zusätzlich den Abstand zwischen einzelnen Messwerten inhaltlich zu interpretieren; • Messungen auf Ratioskalenniveau (auch: Verhältnisskalenniveau, Proportionalskalenniveau) ermöglichen zusätzlich die Interpretation des Verhältnisses von Messwerten. ⇒ Je höher das Messniveau, desto informationshaltiger die Messung Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 25 Messniveau oder Skalenniveau: Die Informationshaltigkeit von Messungen Beispiele für Skalenniveaus Skalenniveau Relation zwischen Ausprägungen Nominalskala Klassifikation Religion, Familienstand, Parteineigung Ordinalskala Rangordnung Einstellungsmessungen in Umfragen z.B. Ausmaß an Zustimmung zu einer Behauptung Intervallskala Abstand Temperatur in Grad Celsius, Geburtsjahr Ratioskala Verhältnis Alter, Größe, Einkommen Beispiele (nach Kühnel/ Krebs, 2006: S. 31) Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 26 Messniveau: Hierarchie zwischen den Messnievaus Zwischen den Messniveaus besteht eine hierarchische Ordnung: • Alle Informationen eines geringeren Messniveaus gelten auch bei höherem Messniveau. • Die zusätzlichen Informationen eines höheren Messniveaus können aber nicht bei einem geringeren Messniveau genutzt werden: Interpretierbare Relationen Identität Ränge Abstände Quotienten Nominalskala ja nein nein nein Ordinalskala ja ja nein nein Intervallskala ja ja ja nein Ratioskala ja ja ja ja Intervall- und Ratioskalen werden auch als metrische Skalen bezeichnet. Daraus folgt: Jede Messung auf Ratioskalenniveau ist auch eine Messung auf Intervallskalenniveau, auf Ordinalskalenniveau und auf Nominalskalenniveau; jede Messung auf Intervallskalenniveau ist auch eine Messung auf Ordinalskalenniveau und auf Nominalskalenniveau; jede Messung auf Ordinalskalenniveau ist auch eine Messung auf Nominalskalenniveau. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 27 Messniveau: Zulässige Transformationen Welche Zahlen den Ausprägungen eines Merkmals zugeordnet werden, ist solange willkürlich, solange die strukturtreue Abbildung der empirischen Beziehungen in die mathematischen Beziehungen erhalten bleibt. Messskalen (d.h. Kodierungen), die die gleichen Informationen erhalten, sind äquivalent. Ob bei der Ordinalskala „Demokratiezufriedenheit“ die Zahlen 1,2,3,4 oder 0,1,2,3 oder 10,11,15,20 verwendet werden, ist beliebig, solange eine größere Zahl stets für eine größere Demokratiezufriedenheit steht. Antworten Alternative Kodierungen völlig unzufrieden eher unzufrieden eher zufrieden sehr zufrieden 1 2 3 4 0 1 2 3 10 11 15 20 1 2 4 3 zulässige unzulässige Messskalen Der Wechsel (Übergang) von einer Kodierung zu einer anderen Kodierung wird als zulässige Transformation bezeichnet, wenn alle empirischen Informationen enthalten bleiben. Bei unzulässigen Transformationen gehen dagegen Informationen verloren. Es ist aber unzulässig, die Zahlen 1,2,4,3 zu verwenden, da dann „eher zufrieden“ (4) für eine größere Zufriedenheit stehen würde als „sehr zufrieden“ (3). Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 28 Messniveau: Zulässige Transformationen Tabelle 2.3: Zulässige Transformationen Skalenniveau Zulässige Transformationen Beispiele für erlaubte mathematische Operationen Nominal Alle ein-eindeutigen Transforformationen Multiplikation (mit Zahl ≠0), Addition (oder Subtraktion) einer Konstanten, Wenn Ausgangswerte > 0: Logarithmieren Ordninal Alle positiv-monotonen, die Rangordnung wahrenden Transformationen Wenn Ausgangswerte > 0: Quadrieren, Logarithmieren, Wurzelziehen Intervall Alle positiven linearen Transformationen Y = a + b ⋅ X mit b> 0 Ratio Streckungen und Stauchungen Y = b ⋅ X mit b> 0 (nach Kühnel/ Krebs, 2006: S. 32) Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 29 Bedeutung des Skalenniveaus für die Sozialforschung Das Messniveau ist wichtig, weil es Aussagen über die Informationshaltigkeit von Messungen beinhaltet. Für die statistische Datenanalyse ist das Messniveau auch deswegen wichtig, weil es festgelegt, ob ein statistisches Analysemodell angemessen ist oder nicht: Wenn sich nach der Transformation einer Messwertreihe mit einer zulässigen Transformation die inhaltliche Aussage ändert, ist ein Analysemodell nicht angemessen. . Wenn ein nicht angemessenes Analysemodell verwendet wird, besteht die Gefahr der Produktion von Artefakten: Analyseergebnisse werden als vermeintliche empirische Befunde interpretiert, obwohl sie ungültig und Folge eines nicht angemessenen Analysemodells sind. Beispiel: Vergleich von Mittelwerten bei ordinalen Messungen: Mittelwertsberechnung ist bei ordinalen Messungen unzulässig. Messwerte nach Transformation Messwerte bei Ausgangsskala Gruppe 1 Gruppe 2 Gruppe 1 Gruppe 2 zulässige Transformation 1 4 1 2 der Ordinalskala: 9 16 3 4 Ranginformationen 36 25 6 5 bleiben erhalten. Mittelwert: 46/3 45/3 Mittelwert: 10/3 11/3 Gruppe 2 hat im Mittel höheres Ausmaß Gruppe 1 hat im Mittel höheres Ausmaß an der interessierenden Eigenschaft. an der interessierenden Eigenschaft. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 30 Bestimmung des Messniveaus Die axiomatischen Messtheorie nennt als Voraussetzungen Repräsentation, Eindeutigkeit und Bedeutsamkeit, die zur Erreichung eines bestimmten Messniveaus nachgewiesen werden müssen: (1) Repräsentationstheoreme geben für jedes Skalenniveau Präzisierungen an, um Repräsentation nachzuweisen. Beispiel bei einer Ordinalskala: Transitivitätsbedingung muss erfüllt sein. Wenn bei drei Beobachtungen A, B und C gilt: (a) bei Beobachtung B liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung A, (b) bei Beobachtung C liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung B, dann muss auch gelten: (c) bei Beobachtung C liegt eine höheres Ausmaß der zu messenden Eigenschaft vor als bei Beobachtung A. Gilt die Transitivitätsbedingung nicht, kann nicht auf Ordinalskalenniveau gemessen werden. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 31 Bestimmung des Messniveaus (2) Eindeutigkeitstheoreme geben die Bedingungen an, unter denen zulässige Transformationen im numerischen Relativ möglich sind. (3) Bedeutsamkeitstheoreme beziehen sich auf die statistischen Verfahren, die unter einem Skalenniveau zulässig sind. Repräsentation bezieht sich also auf den Informationsgehalt im empirischen Relativ, Eindeutigkeit auf die zulässigen Transformationen innerhalb des numerischen Relativs und Bedeutsamkeit auf die Gültigkeit statistischer Modelle innerhalb eines Messniveaus. Nach der axiomatischen Messtheorie muss für jede empirische Messkala das Vorliegen der drei Bedingungen nachgewiesen sein. In der Praxis erfolgt oft eine Festlegung des Skalenniveaus nach Augenschein („measurement per fiat“). Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 32 Bestimmung des Messniveaus Bei der Unterstellung eines Messniveaus sind drei Aspekte zu beachten: 1. Beim Messniveau sind empirische wie theoretische Gegebenheiten relevant. Daher kann auch das Messniveau einer Größe nicht ‚theorielos‘ (d.h. ohne theoretische Annahmen) ermittelt werden. Beispiel: „Haarfarbe“ ist in der Soziologie der Mode eine nominalskalierte Größe. In der Physik ist Farbe dagegen eine auf Ratioskalenniveau gemessene Frequenz von Lichtwellen. 2. Eine zu prüfende empirische Theorie kann ein bestimmtes Messniveau für die beteiligten Konzepte voraussetzen. Ist dieses nicht gegeben, ist die Theorie nicht oder nur eingeschränkt prüfbar. Beispiel: Die „Nutzentheorie“ behauptet, dass sich der Nettonutzen einer Alternative aus der Produktsumme der Bewertungen der mit der Alternative verbundenen Konsequenzen und den Auftretenswahrscheinlichkeiten dieser Konsequenzten ergibt. Sind die Bewertungen und die Auftretenswahrscheinlichkeiten nicht auf metrischem Messniveau erfassbar, kann diese Behauptung nicht geprüft werden. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 33 Bestimmung des Messniveaus 3. Das Messniveau der beobachteten Größen (Indikator) kann sich vom Messniveau der eigentlich interessierenden theoretischen Eigenschaft (latente Variable) unterscheiden und z..B. ein höheres Messniveau haben. Beispiel: Alter dürfte in der Regel auf Ratioskalenniveau messbar sein. Wird „Alter“ aber in einer Studie im Sinne der theoretischen Konzeption des „Lebenszyklus“ verwendet, handelt es sich möglicherweise nur um eine nominale Messung. Letztlich kommt es bei der Festlegung des Messniveaus und der Messkala (Kodierung) darauf an, ob die verwendeteten Zahlen und die eingesetzten Analysemodelle inhaltlich interpretierbar sind. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 34 Klassische Testtheorie In der klassischen psychologischen Testtheorie wird eine Messung als Summe aus einem wahren Wert (true score) und einem Messfehler aufgefasst. Wird weiter zwischen systematischen und zufälligen Messfehlern unterschieden, ergibt sich folgende Beziehung: Messwert = wahrer Wert + systematischer Fehler + zufälliger Fehler valideKomponente unreliable Komponente reliable Komponente invalide Komponente Eine Messung ist danach valide, wenn es weder systematische noch zufällige Messfehler gibt, eine Messung ist reliabel, wenn es nur sytematische, aber keine zufälligen Messfehler gibt, eine Messung ist nicht reliabel (und auch nicht valide), wenn es zufällige Messfehler gibt. Empirie-Vorlesung Teil: Quantitative Methoden WiSe 06/07, 14.11.06) 35