W. Specht November 2001 Tipps für die Gestaltung von Fragebögen Fragebögen sind als Instrumente im Zusammenhang mit Selbstevaluationsprozessen von Schulen sehr beliebt. Der Anwender verspricht sich, mit relativ geringem Aufwand zu einer Vielfalt an Information zu gelangen. Dabei wird oft vergessen, dass es noch viele andere (auch standardisierte) Formen der Datengewinnung gibt, die oft informativer, aber auch ökonomischer anzuwenden sind als Fragebögen; dass viele Evaluationsfragen gar keine eigenen Datenerhebungen erfordern, sondern auf der Basis bereits vorliegender Daten (z.B. Schülerbeurteilungen, Schulstatistik ...) beantwortet werden könnten; dass auch die Gestaltung und Auswertung solcher Instrumente eine „Kunst“ ist, die erlernt werden muss und deren richtiger Einsatz Kompetenz und Erfahrung erfordert. Oberster Grundsatz jeder Evaluation sollte sein: Die Methoden folgen den Fragestellungen und nicht umgekehrt! Ein schlecht gemachter Fragebogen hält jedenfalls nicht, was man sich von ihm verspricht: Ohne sorgfältige Überlegungen darüber, was man erfassen möchte, stellt man am Ende oft fest, dass man wichtige Dinge nicht erfragt, dafür aber viel unbrauchbaren „Datenmüll“ erzeugt hat. Unklare Formulierungen der Items oder unüberlegt gewählte Antwortkategorien führen oft zu uninterpretierbaren oder nichts sagenden Ergebnissen. Formale Mängel und ungünstig gewählte Fragestellungen führen zu Unmut beim Beantworter, senken die Rücklaufquote und vermindern dadurch den Informationsertrag. Ein schlechter Fragebogen ist auch die geringe Mühe nicht wert, die man in ihn investiert hat. Im Folgenden sind einige der wichtigsten Kunstgriffe zusammengestellt, die bei der Konstruktion von Fragebögen Beachtung finden sollten. 1. Auswertung mitplanen Wer einen Fragebogen konstruiert und einsetzen will, muss vor den entsprechenden Überlegungen bereits genau wissen, wie er ausgewertet werden soll. Es ist eine häufige Erfahrung, dass der selbst ernannte Forscher frisch drauflos fragt, Werner Specht, 05/16 68619983 dann aber nicht weiß, was er tun soll, wenn er die Daten erst einmal „im Kasten“ hat. Qualitative oder quantitative Auswertung? Wer erstellt Codepläne für die EDV-mäßige Datenaufnahme? Wer übernimmt die Dateneingabe in den Computer? Mit welchen Programmen wird ausgewertet? Welcher Anspruch wird an die statistische Analyse gestellt? Dies sind nur einige der Fragen, die bereits vor der Arbeit am Fragebogen selbst geklärt sein sollten. 2. Konzentration auf präzise Fragestellungen Einer der häufigsten Fehler bei der Planung von Befragungen ist, mit einem solchen Instrument könne man sozusagen „alles über die Welt (oder die Schule)“ erfahren. Dies ist ein Irrtum. Die komplexe „Wirklichkeit“ lässt sich nicht in einem Instrument abbilden. Am Beginn jeder Datenerhebung sollte eine möglichst präzise Fragestellung, wenn möglich sogar eine konkrete Hypothese stehen, die die Entwicklung des Instruments leitet. Beispiel: Wie zufrieden sind die Lehrerinnen und Lehrer mit den Arbeitsbedingungen an dieser Schule? (Fragestellung) Lehrer der Geisteswissenschaften sind mit ihren Arbeitsbedingungen zufriedener als Lehrer der Naturwissenschaften. (Hypothese) 3. „Theoretische“ Dimensionierung des Gegenstandes Wird eine differenzierte und exakte Messung des Konstrukts („Zufriedenheit mit Arbeitsbedingungen“) angestrebt (was meistens empfehlenswert ist), dann muss vor der eigentlichen Formulierung der Fragen eine „theoretische Dimensionierung“ erfolgen: Durch welche verschiedenen Tätigkeits- und Situationsaspekte sind die Arbeitsbedingungen charakterisiert? (z.B. materielle Ausstattung, informeller Status in der Schule, „schwierige/einfache Klassen“, günstiger/ungünstiger Stundenplan usw.) Welche unterschiedlichen Indikatoren von „Zufriedenheit“ gibt es? (z.B. Sich länger als unbedingt notwendig an der Schule aufhalten, sich nach den Ferien auf die Schule freuen, am Nachmittag befriedigt nach Hause gehen...) Besser - und vor allem zuverlässiger - als einfach zu fragen „Wie zufrieden bist du ...“ ist eine differenzierte Abfrage unterschiedlicher Facetten des Gegenstandsbereichs, die dann bei der Datenaufbereitung und entsprechenden Prüfungsverfahren in zuverlässige Scores zusammengefasst werden können. 4. Auf die spezifische Situation zuschneiden Es ist immer hilfreich, sich von anderen Instrumenten inspirieren zu lassen. Besser aber, als einfach etwas zu übernehmen, was „so ungefähr passt“, ist es, ein maßgeschneidertes Instrument für die konkrete Situation und Fragestellung zu konstruieren. Die Erfahrung zeigt, dass Fragebögen, durch die sich die Adressaten sowohl vom Inhalt, als auch von der Formulierung her angesprochen und „verstanden“ fühlen, erheblich weniger Widerwillen auslösen. Dies wird im AllWS, 05/16 2 gemeinen dann eher der Fall sein, wenn das Instrument auf die spezifische Situation der Befragten zugeschnitten ist. 5. Skalen, Items, Antwortkategorien Für Befragungsgegenstände, die sich auf Meinungen, Einstellungen, Befindlichkeiten usw. beziehen, hat es sich bewährt, so genannte „Skalen“ zu entwickeln. Dabei werden eine Reihe von Items über den Untersuchungsgegenstand als IstAussagen formuliert, auf die der Befragte auf einer fünfstufigen Skala (z. B. „trifft genau zu / trifft eher zu / unentschieden / trifft eher nicht zu / trifft überhaupt nicht zu“) positiv oder negativ reagieren kann. Einfache „ja/nein“-Items sind ungünstiger. Sie enthalten weniger Information und erregen mehr Unwillen bei der Beantwortung. Die Aufnahme einer Mittelkategorie („unentschieden“, „weiß nicht“) ist eine Glaubensfrage. Das Vorhandensein einer solchen Kategorie begünstigt das Ausweichen vor einer klaren Stellungnahme, ihre Fehlen kann zu Ärger und Unwillen beim Beantworter führen - etwa wenn er zu einer Entscheidung in einer Sache gezwungen wird, zu der keine Meinung hat (Rücklaufprobleme!). 6. Sinnvolle Antwortkategorien sind wichtig Sollen konkrete Sachverhalte erhoben werden (z.B. tägliche Arbeitszeiten außerhalb der Unterrichtszeit), ist es sinnvoller, die Frageform zu verwenden und als Antwortkategorien sinnvolle Einheiten (z.B. 0-1 / 2-3 / 4-5 / mehr als 5 Stunden) vorzugeben. Solche zu finden, kann aber erhebliche Mühe kosten und mit Vorversuchen verbunden sein. Es ist dann oft besser, gar keine Antwortkategorien vorzugeben, sondern den Beantworter eine Zahl („tägliche Arbeitszeit in Stunden“) in ein Kästchen schreiben zu lassen, und später die Aufteilung in einzelne Klassen aufgrund der empirischen Verteilung vorzunehmen. 7. Fragen unterschiedlicher „Schwierigkeit“ aufnehmen Der Fragebogen (z.B. „Zufriedenheit mit Arbeitsbedingungen“) soll Fragen unterschiedlichen „Schwierigkeitsgrades“ enthalten. Als „Schwierigkeitsgrad“ bezeichnet man den Anteil an (vermuteten) Zustimmungen. Es sollen also Items enthalten sein, denen ein großer Teil der Befragten zustimmen kann (z.B. „Wenn eine Unterrichtsstunde gelungen ist, gehe ich oft mit einem Gefühl der Zufriedenheit aus der Klasse“), aber auch solche, die einen „harten Test“ für den zu erfassenden Gegenstand darstellen (z.B.: „Am Morgen in meine Klasse zu kommen, ist für mich jeden Tag ein Augenblick freudiger Erwartung“). Wenn nur „leichte“ Items enthalten sind, besteht die Gefahr von Ceiling-Effekten, d.h. es gibt eine große Gruppe von Personen mit maximaler Punktezahl, zwischen denen nicht mehr differenziert werden kann. Bei einer Überrepräsentation von „schwierigen“ Items besteht die umgekehrte Gefahr. WS, 05/16 3 8. Das Konstrukt nicht nur positiv, sondern auch in seiner Negation messen Neben positiv formulierten, sollten, wenn möglich in ungefähr gleicher Zahl, auch negativ formulierte Items enthalten sein, also Aussagen, die das Gegenteil des zu messenden Konstrukts ausdrücken. Eine Fragebogenskala, die Arbeitszufriedenheit misst, sollte also auch Aussagen enthalten, die Unzufriedenheit thematisieren. So können schematische Ankreuzmuster („Response-Sets“) verhindert, aber auch der Eindruck der Einseitigkeit des Fragestellers vermieden werden (Manipulationsverdacht). 9. Einfache Sätze verwenden Die Items sollen einfach und, wenn möglich, im Sprachcode der Adressaten formuliert sein. Komplexe, schwer verständliche Sätze sollen vermieden werden. Ein professioneller Fragebogen besteht meist überwiegend aus Items, die dem kritischen (aber fachlich nicht versierten) Leser übersimplifizierend erscheinen. In der Summe führen aber gerade solche Instrumente zu validen und zuverlässigen Ergebnissen. 10. Jedes Item darf nur eine Aussage enthalten Besonders wichtig ist, dass ein Item nur eine Aussage enthält. Enthält ein Statement zwei oder mehr Aussagen in einem verschachtelten Satz, sind Ablehnungen nicht eindeutig zu interpretieren, weil unsicher ist, welcher der Aussagen sie gelten. (Beispiel: Wird das Item „Ich arbeite gerne an dieser Schule, weil ich hier viele Kollegen sehr schätze“ abgelehnt, ist unsicher ob der Befragte ungern an der Schule arbeitet, ob er hier keine geschätzten Kollegen hat, oder ob beides der Fall ist). 11. Ein Probedurchgang ist immer sinnvoll Vor dem letztlichen Einsatz eines Fragebogens ist ein Pretest immer sinnvoll. Dieser kann unter Umständen aber auch durch Expertengespräche mit erfahrenen Fragebogenkonstrukteuren ersetzt werden. WS, 05/16 4