TEIL 3: MESSEN UND SKALIEREN

T E I L 3 : M E SSE N U N D SK A L I E R E N
GLIEDERUNG
Das Messen – eine Umschreibung
Skalenniveaus von Variablen
Drei Gütekriterien von Messungen
Objektivität
Reliabilität
Validität
Konstruierte Skalen in den Sozialwissenschaften
Likert-Skala
Guttman-Skala
Das Messen – eine Umschreibung
Der Prozess der Datenerhebung kann auch als Messen bezeichnet werden
Feststellung der Merkmalsausprägungen von Untersuchungseinheiten (z.B. „Feststellung,
wie viel eine Person wiegt“ oder „Feststellung, wie aggressiv ein Schulkind auf einen
Reiz reagiert“)
Messen ist die Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Regeln und zwar so, dass numerische Relative den empirischen Relativen
entsprichen
Begriff
Empirisches Relativ
Numerisches Relativ
Definition
Eine Menge von Objekten, über
die eine Relation definiert wurde
bzw. die entsprechend der Relation geordnet wurden
Eine Menge von Zahlen, über
die eine Relation definiert
wurde und die entsprechend
sortiert wurden
Beispiel (Messung der Otto > Fritz > Hugo
Körpergröße an drei Personen in cm)
186 > 179 > 168
Eine Messung im o.g. Sinne ist eine strukturtreue Abbildung
Die Beziehungen
der Objekte werden durch die Beziehungen der zugeordneten Zahlen korrekt wiedergegeben
Strukturtreue Abbildungen werden als Morphismen bezeichnet
Beispiel: Vier Schülern A, B, C, D werden ihre Schulnoten im Mathe zugeordnet:
Isomorphismus: umkehrbar eindeutige Abbildung
A <-----------> 1
B <-----------> 2
C <-----------> 3
D <-----------> 4
Homomorphismus: nicht
umkehrbar eindeutige
Abbildung
Skalenniveaus von Variablen
Drei Gütekriterien von Messungen
1. Objektivität (Intersubjektivität):
Durchführungsobjektivität – Unabhängigkeit zwischen der durchführenden Person
und der Durchführung (z.B. standardisierte Fragen; kein Spielraum für verschiedene
Interviewer)
Auswertungsobjektivität – Unabhängigkeit zwischen einer Auswertung und der auswertenden Personen (deshalb gibt es etablierte statistische Analyseverfahren)
Interpretationsobjektivität – Unabhängigkeit zwischen der interpretierenden Person
und der Interpretation (offene, publizierte Argumentation)
2. Reliabilität (Zuverlässigkeit von Messungen):
Ausmaß, bei wiederholten Messungen mit einem Messinstrument unter den gleichen
Bedingungen zu dem gleichen Ergebnis zu gelangen
Verfahren zur Überprüfung der Reliabilität:
Test-Re-Test – ein Test wird an den selben Objekten zwei Mal durchgeführt und es
werden die Ergebnisse auf ihre Übereinstimmung geprüft
Parallel-Test – die Messungen werden mit zwei unterschiedlichen (leicht abweichenden) Instrumenten durchgeführt (z.B. mit zwei ähnlichen Fragebögen)
Konsistenz (split-half-Methode) – Spaltung eines Messinstruments in zwei Hälften
und Vergleich der Ergebnisse
3. Validität (Gültigkeit von Messungen)
Ausmaß, in dem das Messinstrument tatsächlich das misst, was es messen soll
Validitätskonzepte:
Inhaltsvalidität – bezieht sich darauf, dass möglichst alle Aspekte / Dimensionen
des Sachverhalts, die gemessen werden sollten, berücksichtigt werden (z.B. bei der
Messung des Musikwissens sollten alle gängigen Musikrichtungen abgefragt werden
und nicht nur Rock und Jazz)
Kriteriumsvalidität – bezieht sich auf den Zusammenhang zwischen den empirisch
gemessenen Ergebnissen des Messinstrumentes und einem anders gemessenen externen Kriterium
Vorhersagevalidität (Prädiktive Validität) – das externe Kriterium liegt in der
Zukunft (z.B. mit einem Einstellungstest soll vorausgesagt werden, wie gut jmd.
seine Arbeit später machen wird)
known-groups – sind zwei Gruppen bekannt, die auf der interessierenden Dimension Unterschiede aufweisen, so muss ein Messinstrument diese beiden
Gruppen unterscheiden können (die Gruppenzugehörigkeit ist hier also das externe Kriterium
Expertenvalidierung – Experten überprüfen gefühlsmäßig die Gültigkeit des Messinstrumentes
Konstruktvalidität
liegt dann vor, wenn aus dem Konstrukt empirisch überprüfbare Zusammenhänge dieses Konstruktes mit anderen Konstrukten theoretisch hergeleitet und
empirisch überprüft werden können
ist in dem Sinne die Überprüfung von statistischen Modellen (die auf Hypothesen basieren)
dafür stehen komplexe statistische Methoden zur Verfügung
Konstruierte Skalen in den Sozialwissenschaften
Skalen allgemein sind Homomorphismen, welche für Messungen genutzt werden, und
somit die Ergebnisse der Konstruktion von Messinstrumenten darstellen
Methoden zur Konstruktion solcher Instrumente bezeichnet man daher als
Skalierungsverfahren
Konstruierte Skalen: Spezielle Skalen, bei denen die Kombination eine Reihe von
„Items“, die entlang einer inhaltlichen Dimension messen, die Skalenwerte liefern
Items:
Die kleinsten Bestandteile eines Erhebungsinstrumentes (z.B. einzelne Fragen,
Aufgaben oder Aussagen, die verbunden sind mit der Aufforderung, den Grad der Zustimmung bzw. Ablehnung oder einer anderen Bewertung anzugeben)
Man erschließt soziale Einstellungen aus Reaktionen auf sorgfältig ausgewählten
Statements (Items), die als Indikatoren für eine direkt nicht beobachtbare Einstellung
betrachtet werden
BEISPIEL:
Einstellung: Ausländerfeindlichkeit
Item 1: „In wirtschaftlich schlechten Zeiten wie
diesen sollten Ausländer lieber wieder gehen“.
Item 2: „Ausländer können sich nicht
anpassen.“
Weitere Anmerkungen:
Skalierungsverfahren werden in der empirischen Sozialforschung überwiegend zur
Messung von Einstellungen verwendet
Einstellungen werden dabei als latente Variablen aufgefasst – Ziel der Einstellungsmessung ist die Feststellung der Ausprägung der latenten Variablen bei den Befragten
Zur Messung werden den Befragten Aussagen vorgelegt, auf welche die Befragten
mit Zustimmung oder Ablehnung reagieren sollen (Items)
Bei diesen Items geht man davon aus, dass sie die interessierenden Auffassungen /
Einstellungen über die Beantwortung zum Ausdruck bringen
Über verschiedene Regeln, welche von der verwendeten Skalenkonstruktion abhängen, werden nun die Ergebnisse der Statements einzelner Personen zu einem Skalenwert pro Person verarbeitet
Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmöglichkeiten:
Likert-Skala:
1. Schritt:
Die Konstruktion einer Likert-Skala beginnt mit der Sammlung einer großen Zahl
von Items (diese Items stellen hierbei Aussagen dar, von denen angenommen wird,
dass sie die interessierende Einstellung wiedergeben)
Diese Items werden einer Stichprobe von Personen vorgelegt, die Befragten werden
nun aufgefordert, zu jedem Statement Stellung zu beziehen; jedes Item hat die gleichen
Antwortvorgaben, z.B.:
¤ stimme voll und ganz zu
¤ stimme eher zu
¤ teils / teils
¤ stimme eher nicht zu
¤ stimme gar nicht zu
2. Schritt:
Kodierung der Antwortmöglichkeiten mit Zahlenwerten und ggf. Umkehrung der
Zahlenwerte bei negativ formulierten Items, damit die Zahlenwerte immer der gleichen Einstellungsrichtung entsprechen
Beispiel – Einstellung gegenüber der Familie:
ITEM A: “Meine Familie bedeutet mir sehr ITEM B: “Meine Familie spielt in meinem
viel”
Leben keine große Rolle”
Ausprägungen:
Werte:
Ausprägungen:
Werte:
stimme voll und ganz zu
1
stimme voll und ganz zu
5
stimme eher zu
2
stimme eher zu
4
teils / teils
3
teils / teils
3
stimme eher nicht zu
4
stimme eher nicht zu
2
stimme gar nicht zu
5
stimme gar nicht zu
1
3. Schritt – Item-Analyse:
Das statistische Verfahren „Item-Analyse“ (Überprüfung der Eindimensionalität) soll
ungeeignete Items aus der Skala aussondern
Ungeeignete Items: Personen mit sehr unterschiedlicher Einstellung beantworten ein
Item ähnlich oder alle Personen stimmen dem Item zu bzw. alle Personen lehnen es ab
Guttman-Skala:
Die Guttman-Skala basiert auf der Vorgabe einer Reihe von Aussagen, die in bezug
auf die interessierende Einstellung immer extremer werden
Die Fragen / Aussagen lassen sich nur mit ja / nein beantworten
Es wird angenommen, dass ein Befragter mit einer bestimmten Einstellung alle Aussagen, die weniger extreme Anschauungen ausdrücken als er selbst besitzt, zustimmt und alle Aussagen, die extremere Anschauungen ausdrücken, ablehnt
BEISPIEL (Verdrossenheit gegenüber Managern großer Wirtschaftskonzerne):
1. Manager können sich oftmals in die Probleme einfacher Arbeiter nicht hineinversetzen
2. Managern sind Geld und andere Vorteile oft wichtiger, als sich um die Probleme der
Arbeiter zu kümmern
3. Manager würden über Leichen gehen, um an Geld und Macht zu gelangen – wer und
was dabei auf der Strecke bleibt, interessiert sie nicht
Aufgaben:
1 2 3 4 5 6 7 8 9 10
Probleme bei der Guttman-Skala:
Es ist schwierig, geeignete Items für eine solche Skala zu finden, welche eindimensional sind und gleichzeitig an Intensität monoton zunehmen
Es können inkonsistente Antwortmuster auftreten