T E I L 3 : M E SSE N U N D SK A L I E R E N GLIEDERUNG Das Messen – eine Umschreibung Skalenniveaus von Variablen Drei Gütekriterien von Messungen Objektivität Reliabilität Validität Konstruierte Skalen in den Sozialwissenschaften Likert-Skala Guttman-Skala Das Messen – eine Umschreibung Der Prozess der Datenerhebung kann auch als Messen bezeichnet werden Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.B. „Feststellung, wie viel eine Person wiegt“ oder „Feststellung, wie aggressiv ein Schulkind auf einen Reiz reagiert“) Messen ist die Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Regeln und zwar so, dass numerische Relative den empirischen Relativen entsprichen Begriff Empirisches Relativ Numerisches Relativ Definition Eine Menge von Objekten, über die eine Relation definiert wurde bzw. die entsprechend der Relation geordnet wurden Eine Menge von Zahlen, über die eine Relation definiert wurde und die entsprechend sortiert wurden Beispiel (Messung der Otto > Fritz > Hugo Körpergröße an drei Personen in cm) 186 > 179 > 168 Eine Messung im o.g. Sinne ist eine strukturtreue Abbildung Die Beziehungen der Objekte werden durch die Beziehungen der zugeordneten Zahlen korrekt wiedergegeben Strukturtreue Abbildungen werden als Morphismen bezeichnet Beispiel: Vier Schülern A, B, C, D werden ihre Schulnoten im Mathe zugeordnet: Isomorphismus: umkehrbar eindeutige Abbildung A <-----------> 1 B <-----------> 2 C <-----------> 3 D <-----------> 4 Homomorphismus: nicht umkehrbar eindeutige Abbildung Skalenniveaus von Variablen Drei Gütekriterien von Messungen 1. Objektivität (Intersubjektivität): Durchführungsobjektivität – Unabhängigkeit zwischen der durchführenden Person und der Durchführung (z.B. standardisierte Fragen; kein Spielraum für verschiedene Interviewer) Auswertungsobjektivität – Unabhängigkeit zwischen einer Auswertung und der auswertenden Personen (deshalb gibt es etablierte statistische Analyseverfahren) Interpretationsobjektivität – Unabhängigkeit zwischen der interpretierenden Person und der Interpretation (offene, publizierte Argumentation) 2. Reliabilität (Zuverlässigkeit von Messungen): Ausmaß, bei wiederholten Messungen mit einem Messinstrument unter den gleichen Bedingungen zu dem gleichen Ergebnis zu gelangen Verfahren zur Überprüfung der Reliabilität: Test-Re-Test – ein Test wird an den selben Objekten zwei Mal durchgeführt und es werden die Ergebnisse auf ihre Übereinstimmung geprüft Parallel-Test – die Messungen werden mit zwei unterschiedlichen (leicht abweichenden) Instrumenten durchgeführt (z.B. mit zwei ähnlichen Fragebögen) Konsistenz (split-half-Methode) – Spaltung eines Messinstruments in zwei Hälften und Vergleich der Ergebnisse 3. Validität (Gültigkeit von Messungen) Ausmaß, in dem das Messinstrument tatsächlich das misst, was es messen soll Validitätskonzepte: Inhaltsvalidität – bezieht sich darauf, dass möglichst alle Aspekte / Dimensionen des Sachverhalts, die gemessen werden sollten, berücksichtigt werden (z.B. bei der Messung des Musikwissens sollten alle gängigen Musikrichtungen abgefragt werden und nicht nur Rock und Jazz) Kriteriumsvalidität – bezieht sich auf den Zusammenhang zwischen den empirisch gemessenen Ergebnissen des Messinstrumentes und einem anders gemessenen externen Kriterium Vorhersagevalidität (Prädiktive Validität) – das externe Kriterium liegt in der Zukunft (z.B. mit einem Einstellungstest soll vorausgesagt werden, wie gut jmd. seine Arbeit später machen wird) known-groups – sind zwei Gruppen bekannt, die auf der interessierenden Dimension Unterschiede aufweisen, so muss ein Messinstrument diese beiden Gruppen unterscheiden können (die Gruppenzugehörigkeit ist hier also das externe Kriterium Expertenvalidierung – Experten überprüfen gefühlsmäßig die Gültigkeit des Messinstrumentes Konstruktvalidität liegt dann vor, wenn aus dem Konstrukt empirisch überprüfbare Zusammenhänge dieses Konstruktes mit anderen Konstrukten theoretisch hergeleitet und empirisch überprüft werden können ist in dem Sinne die Überprüfung von statistischen Modellen (die auf Hypothesen basieren) dafür stehen komplexe statistische Methoden zur Verfügung Konstruierte Skalen in den Sozialwissenschaften Skalen allgemein sind Homomorphismen, welche für Messungen genutzt werden, und somit die Ergebnisse der Konstruktion von Messinstrumenten darstellen Methoden zur Konstruktion solcher Instrumente bezeichnet man daher als Skalierungsverfahren Konstruierte Skalen: Spezielle Skalen, bei denen die Kombination eine Reihe von „Items“, die entlang einer inhaltlichen Dimension messen, die Skalenwerte liefern Items: Die kleinsten Bestandteile eines Erhebungsinstrumentes (z.B. einzelne Fragen, Aufgaben oder Aussagen, die verbunden sind mit der Aufforderung, den Grad der Zustimmung bzw. Ablehnung oder einer anderen Bewertung anzugeben) Man erschließt soziale Einstellungen aus Reaktionen auf sorgfältig ausgewählten Statements (Items), die als Indikatoren für eine direkt nicht beobachtbare Einstellung betrachtet werden BEISPIEL: Einstellung: Ausländerfeindlichkeit Item 1: „In wirtschaftlich schlechten Zeiten wie diesen sollten Ausländer lieber wieder gehen“. Item 2: „Ausländer können sich nicht anpassen.“ Weitere Anmerkungen: Skalierungsverfahren werden in der empirischen Sozialforschung überwiegend zur Messung von Einstellungen verwendet Einstellungen werden dabei als latente Variablen aufgefasst – Ziel der Einstellungsmessung ist die Feststellung der Ausprägung der latenten Variablen bei den Befragten Zur Messung werden den Befragten Aussagen vorgelegt, auf welche die Befragten mit Zustimmung oder Ablehnung reagieren sollen (Items) Bei diesen Items geht man davon aus, dass sie die interessierenden Auffassungen / Einstellungen über die Beantwortung zum Ausdruck bringen Über verschiedene Regeln, welche von der verwendeten Skalenkonstruktion abhängen, werden nun die Ergebnisse der Statements einzelner Personen zu einem Skalenwert pro Person verarbeitet Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmöglichkeiten: Likert-Skala: 1. Schritt: Die Konstruktion einer Likert-Skala beginnt mit der Sammlung einer großen Zahl von Items (diese Items stellen hierbei Aussagen dar, von denen angenommen wird, dass sie die interessierende Einstellung wiedergeben) Diese Items werden einer Stichprobe von Personen vorgelegt, die Befragten werden nun aufgefordert, zu jedem Statement Stellung zu beziehen; jedes Item hat die gleichen Antwortvorgaben, z.B.: ¤ stimme voll und ganz zu ¤ stimme eher zu ¤ teils / teils ¤ stimme eher nicht zu ¤ stimme gar nicht zu 2. Schritt: Kodierung der Antwortmöglichkeiten mit Zahlenwerten und ggf. Umkehrung der Zahlenwerte bei negativ formulierten Items, damit die Zahlenwerte immer der gleichen Einstellungsrichtung entsprechen Beispiel – Einstellung gegenüber der Familie: ITEM A: “Meine Familie bedeutet mir sehr ITEM B: “Meine Familie spielt in meinem viel” Leben keine große Rolle” Ausprägungen: Werte: Ausprägungen: Werte: stimme voll und ganz zu 1 stimme voll und ganz zu 5 stimme eher zu 2 stimme eher zu 4 teils / teils 3 teils / teils 3 stimme eher nicht zu 4 stimme eher nicht zu 2 stimme gar nicht zu 5 stimme gar nicht zu 1 3. Schritt – Item-Analyse: Das statistische Verfahren „Item-Analyse“ (Überprüfung der Eindimensionalität) soll ungeeignete Items aus der Skala aussondern Ungeeignete Items: Personen mit sehr unterschiedlicher Einstellung beantworten ein Item ähnlich oder alle Personen stimmen dem Item zu bzw. alle Personen lehnen es ab Guttman-Skala: Die Guttman-Skala basiert auf der Vorgabe einer Reihe von Aussagen, die in bezug auf die interessierende Einstellung immer extremer werden Die Fragen / Aussagen lassen sich nur mit ja / nein beantworten Es wird angenommen, dass ein Befragter mit einer bestimmten Einstellung alle Aussagen, die weniger extreme Anschauungen ausdrücken als er selbst besitzt, zustimmt und alle Aussagen, die extremere Anschauungen ausdrücken, ablehnt BEISPIEL (Verdrossenheit gegenüber Managern großer Wirtschaftskonzerne): 1. Manager können sich oftmals in die Probleme einfacher Arbeiter nicht hineinversetzen 2. Managern sind Geld und andere Vorteile oft wichtiger, als sich um die Probleme der Arbeiter zu kümmern 3. Manager würden über Leichen gehen, um an Geld und Macht zu gelangen – wer und was dabei auf der Strecke bleibt, interessiert sie nicht Aufgaben: 1 2 3 4 5 6 7 8 9 10 Probleme bei der Guttman-Skala: Es ist schwierig, geeignete Items für eine solche Skala zu finden, welche eindimensional sind und gleichzeitig an Intensität monoton zunehmen Es können inkonsistente Antwortmuster auftreten