ARBE I TSSTEL LE WI SSENSCHAFTL I CHE S ARBE I TEN UND SOZ I AL FORSCHUNG Excel 2010: DatenEingabe und -Auswertung eine handreichung für studierende des fachbereichs sozial- und kulturwissenschaften Stand 09/2015 Vorwort Über WAS Die Arbeitsstelle Wissenschaftliches Arbeiten und Sozialforschung wurde im Wintersemester 2011/12 ins Leben gerufen, um einen Beitrag zur Verbesserung der Qualität von Studium und Lehre zu leisten. Unser Aufgabenschwerpunkt ist die Weiterentwicklung und konzeptionelle Unterstützung der Propädeutik. Aus diesem Grund unterstützen wir den Prozess der Aneignung und Vertiefung sozialwissenschaftlicher Basiskompetenzen. Neben unseren Fortbildungsangeboten für Lehrende und Studierende, einer Lernplattform und einem Semesterapparat in der Fachbibliothek Sozialwesen der Hochschule Düsseldorf sollen auch unsere Reader zum wissenschaftlichen Arbeiten, zum Formatieren in Word und die hier vorliegenden Hinweise zur Datenauswertung mit Excel dazu beitragen. Weitere Informationen über die Arbeitsstelle WAS sowie unser aktuelles Angebot finden Sie auf unserer Homepage: http://soz-kult.hs-duesseldorf.de/studium/was. Zur Auswertung quantitativer Daten mit Excel Valides Datenmaterial über die Gegenstandsbereiche Sozialer Arbeit ist unerlässlich für eine reflexive Praxis Sozialer Arbeit. Hierfür bedarf es nicht nur kontrollierter Erhebungsmethoden, sondern auch effektiver Instrumente der Auswertung und Darstellung. MS Excel bietet gute Möglichkeiten auch umfangreiche Datensätze zu bündeln und grafisch darzustellen. Zu beachten freilich ist, dass Excel nicht in erster Linie Statistik- und Analysesoftware ist. Die Problemstellungen der schließenden Statistik, mit deren Hilfe Aussagen über das Verhältnis einer Stichprobe zur Grundgesamtheit getroffen werden können, sind sicherlich bei speziell dafür entworfenen Programmen besser aufgehoben. Beachten Sie dazu auch unsere regelmäßigen Schulungen zu SPSS. Zugleich ist Excel ein Kalkulationsprogramm mit umfangreichen Funktionsmöglichkeiten. Erschöpfende Einführungen in die Handhabung des Programms nehmen schnell mehrere hundert Buchseiten ein. Wir haben deshalb gezielt einige Funktionen gesammelt, die es Ihnen ermöglichen sollen, Ihre quantitativen Daten in MS Excel einzugeben und auszuwerten. Eine solche Handreichung bleibt Entwurf und soll dynamisch bleiben. Deshalb freuen wir uns auf Ihre Rückmeldungen und Erweiterungsvorschläge. Ihr Team WAS Kontakt: Hochschule Düsseldorf Fachbereich SK Sozial- und Kulturwissenschaften Arbeitsstelle WAS Gebäude 24.21, Raum 01.62 Tel.: 0211-811-4607 E-Mail: [email protected] Arbeitsstelle WAS Stand September 2015 I Inhaltsverzeichnis Inhaltsverzeichnis ......................................................................................................................... II 1 Einführung ............................................................................................................................ 1 1.1 Zentrale Begriffe ...................................................................................................................... 1 1.2 Ablauf der Auswertung ............................................................................................................ 1 2 Erstellen einer Datenmatrix ................................................................................................... 3 3 Codierung und Eingabe der Daten ......................................................................................... 4 4 Wichtige Kennzahlen der deskriptiven Statistik ...................................................................... 6 4.1 Mittelwerte – Maße der zentralen Tendenz ............................................................................ 6 4.2 Streuungsmaße........................................................................................................................ 8 4.3 Häufigkeiten ............................................................................................................................ 8 5 Sortieren und Filtern von Daten .......................................................................................... 10 6 Grafische Darstellung der Ergebnisse ................................................................................... 13 Arbeitsstelle WAS Stand September 2015 II 1 Einführung Microsoft Excel 2010 führt eine Reihe von Bezeichnungen für seine Funktionen, die nicht unbedingt selbsterklärend sind. Wir stellen unseren Hinweisen deshalb eine kurze Erläuterung dieser Bezeichnungen vorneweg. Zudem möchten wir einführend den grundsätzlichen Ablauf der Eingabe und Auswertung quantitativer Daten in Excel darstellen. Daran orientiert sich der Aufbau des vorliegenden Readers. 1.1 Zentrale Begriffe Im Reader bedienen wir uns in Bezug auf Excel folgender Bezeichnungen: Wenn Sie das Programm öffnen, sehen Sie ein sog. Menüband (siehe Screenshot unten), das aus verschiedenen Registerkarten (Start, Einfügen, Seitenlayout, Formeln usw.) mit jeweils mehreren Befehlen besteht. Hier ist die Registerkarte Start geöffnet: Die Registerkarte bezeichnet die wichtigste Gliederungs- und Sortierungsebene. Bei den StandardVoreinstellungen haben Sie folgende Registerkarten zur Auswahl: Datei, Start, Einfügen, Seitenlayout, Formeln, Daten, Überprüfen und Ansicht. Jede Registerkarte unterteilt sich in Gruppen – im Falle der Registerkarte Start in die Gruppen Zwischenablage, Schriftart, Ausrichtung, Zahl, Formatvorlagen, Zellen und Bearbeiten (s.o.). Im oberen Teil dieser Gruppen befinden sich die Befehle. Mit ihrer Hilfe können Sie zügig auf einzelne Bereiche zugreifen und sie z.B. formatieren. Im unteren Teil finden Sie die Gruppenbezeichnung und teilweise am rechten unteren Rand kleine Pfeile, mit denen Sie das jeweils zugehörige Dialogfeld öffnen können. Das ist ein neues Fenster, in dem Sie alle Befehle finden, die Sie in der Registerkarte im Menüband haben, aber darüber hinaus auch weitere Möglichkeiten. Unterhalb des Menübands sehen Sie zum einen das Namenfeld, in dem Ihnen angezeigt wird, in welcher Zelle Sie sich gerade befinden – hier die Zelle A1, die schwarz umrahmt ist. Daneben befindet sich die Bearbeitungsleiste. Hier sehen Sie die Funktion, die für die jeweilige Zelle hinterlegt ist (im o.g. Beispiel die Summe der Zellen C5 bis E5). In der Zelle selbst wird währendessen das Ergebnis der hinterlegten Funktion als Zahlenwert angezeigt (hier der Wert 126). 1.2 Ablauf der Auswertung Wenn Sie Ihre Daten gesammelt haben, ist der erste Schritt, die Fragebögen/Testbögen zu nummerieren. Sollten Sie sich im Laufe der Dateneingabe einmal vertun, müssen Sie sonst womöglich wieder ganz von vorne mit der Eingabe beginnen. Die Nummerierung kann aus einfachen Zahlen oder bestimmten Codes bestehen – beispielsweise Kürzel für die jeweilige Institution oder Berufsgruppe, wenn dies zutrifft. Diese Bezeichnung soll so gestaltet sein, dass sie nur einmal vergeben wird, also ein Code eindeutig einem Bogen zuzuordnen ist. Arbeitsstelle WAS Stand September 2015 1 Nachdem Sie das erledigt haben, ist der nächste Schritt die Erstellung einer Datenmatrix (siehe Kapitel 2 Erstellen einer Datenmatrix), indem Sie die Spalten und Zeilen Ihren Daten entsprechend benennen. Es folgt die Eingabe der Daten in die Datenmatrix (siehe Kapitel 3 Codierung und Eingabe der Daten) und schließlich die Berechnung zentraler Kennwerte der deskriptiven Statistik (siehe Kapitel 4 Wichtige Kennzahlen der deskriptiven Statistik). Gegebenenfalls ist für den Forschungsbericht auch eine grafische Darstellung der Daten in Form von Diagrammen gewünscht – diese Möglichkeit stellen wir Ihnen in Kapitel 6 Grafische Darstellung der Ergebnisse kurz vor. Arbeitsstelle WAS Stand September 2015 2 2 Erstellen einer Datenmatrix Die Daten, die Sie in Ihrer Erhebung gesammelt haben, müssen Sie in Excel eingeben. Den Rahmen dafür stellt die sogenannte Datenmatrix dar. Diese erstellen Sie, bevor Sie die Daten tatsächlich in Excel einpflegen. Es ist auch möglich, die Datenmatrix schon vor der Datenerhebung zu erstellen. Das kann hilfreich sein, um im Vorfeld schon mögliche Schwierigkeiten bei der Dateneingabe auszuräumen, die man sonst übersehen könnte. Ihre Datenmatrix kann etwa so aussehen: 2. 1. 1. In der ersten Zeile der Matrix stehen Bezeichnungen für alle Variablen (z. B. FragebogenNummer, Geschlecht, die einzelnen Fragen oder Messwerte, ...). Das können beispielsweise Kurztitel sein (anstatt „Wie viele Jahre Berufserfahrung haben Sie?“: „Berufserfahrung“ o.ä.), aber auch einfache Zahlen (Frage 1 = 1 etc.). Selbstverständlich sollten Sie sich an geeigneter Stelle notieren, was die Variablennamen bedeuten. 2. In der ersten Spalte der Matrix stehen die Bezeichnungen für die jeweilige Untersuchungseinheit (d.h. den Fragebogen, die Person, …). Das kann eine Zahl sein, aber auch ein zusätzliches Kürzel, das Ihnen hilft, den einzelnen Fall einzuordnen – wenn Sie eine Befragung in verschiedenen Städten durchgeführt haben, können Sie beispielsweise deren Kfz-Kennzeichen nutzen, bei verschiedenen Berufsgruppen eine Abkürzung wie im Beispiel SP für Sozialpädagogische Fachkräfte und LK für Lehrkräfte. Verwenden Sie hier möglichst die gleiche Codierung, die Sie auch auf den Fragebögen selbst verwendet haben, um die Zuordnung zu vereinfachen. In den anderen Zellen werden später die Werte eingetragen (siehe Kapitel 3 Codierung und Eingabe der Daten). Ihre Matrix hat also jetzt pro Untersuchungseinheit (= Person) eine Zeile, in der die Werte für die jeweiligen Variablen eingetragen werden. Andersherum betrachtet: Pro Variable (= Frage) hat die Matrix eine Spalte, in der die Werte für jede Untersuchungseinheit eingetragen werden. Tipp: Bei großen Datenmengen kann es sinnvoll sein, für jede Gruppe (z.B. Stadt, Klasse, Schule, …) ein eigenes Tabellenblatt anzulegen, da dies übersichtlicher ist als eine Gesamtaufstellung. In jedem Fall sollten Sie aber zusätzlich ein Tabellenblatt mit den Gesamtdaten erstellen. Arbeitsstelle WAS Stand September 2015 3 3 Codierung und Eingabe der Daten Nachdem Sie nun die Datenmatrix erstellt haben, tragen Sie die einzelnen Werte in die übrigen Zellen ein. Außerhalb der 1. Zeile und Spalte sollten Sie ausschließlich Zahlen eintragen. Das ist bei einigen Werten einfacher umzusetzen als bei anderen. Wir unterscheiden hier vier Fälle, die wir in den beiden Beispielen für ausgefüllte Datenmatrizen auch dementsprechend gekennzeichnet haben: 1. Zahlen Die Werte liegen als Zahlen vor (z. B. Alter, Berufserfahrung in Jahren, Ergebnis einer Klausur als Note). In diesem Fall werden einfach die Zahlen direkt in die betreffende Zelle eingetragen. In allen anderen Fällen müssen Sie die Antworten erst zu einer Zahl verschlüsseln, also codieren. 2. Einfachnennung Die Werte liegen nicht als Zahlen vor, können aber durch eine (!) Zahl ausgedrückt werden. Das ist der Fall, wenn nur eine Antwort vorgesehen ist (z. B. bei Beruf, Wohnort, Geschlecht, ja/nein-Fragen, Bewertungsfragen mit einer Skala von 1 bis 5). Bei Ja/nein-Fragen beispielsweise können die Antworten durch 0 (=nein) und 1 (=ja) codiert werden. Bei der Frage nach dem Beruf könnten die Antworten dann durch die Zahlen 1, 2, 3, 4 etc. codiert werden, wobei jeder Beruf durch eine Zahl ausgedrückt wird. Achtung: Dieser Fall tritt nur bei geschlossenen Fragen („Ankreuzfragen“) ein, bei denen nur eine Antwort ausgewählt werden soll. Sonst müssen Sie bei Fall 3 (Mehrfachnennung) oder 4 (offene Fragen) schauen! 3. Mehrfachnennung Die Werte liegen nicht als Zahlen vor und die Fragen sind so gestellt, dass bei einer Person mehrere Antworten vorliegen können (z. B. „Wie sind Sie auf XY aufmerksam geworden?“ oder „Welchen Stressoren fühlen Sie sich in Ihrem Berufsalltag regelmäßig ausgesetzt?“). Solche Daten behandelt man so, als wäre jede Antwortmöglichkeit eine separate ja/nein-Frage. Es wird also für jede Antwortmöglichkeit eine eigene Spalte angelegt, als wäre sie eine eigene Variable, in der dann eine 1 eingetragen wird, wenn sie angekreuzt wurde, und eine 0 bzw. nichts, wenn nicht.1 1 Diese Möglichkeit haben Sie auch im Fall 2: Für jede Antwortmöglichkeit eine Spalte mit 1/0 als Codierung. Arbeitsstelle WAS Stand September 2015 4 4. Offene Fragen Die Werte liegen nicht als Zahlen vor und die Fragen sind so gestellt, dass die Person selbst eine Antwort formulieren soll (z.B. Frage nach Wünschen oder Gestaltungsvorschlägen oder dem Wohnort). Diese Art von Frage bietet sich immer dann an, wenn man die möglichen Antworten nicht absehen kann. In diesem Fall ist oft ein mehrschrittiges Vorgehen notwendig: In einem ersten Schritt übernehmen Sie die Antworten einfach wortgetreu. In einem zweiten Schritt (falls nötig) müssen Sie dann selbst entscheiden, nach welchen Kriterien Sie die Antworten zusammenfassen möchten. Beim Wohnort kann man beispielsweise nach Landkreisen, Regionen oder Entfernungen gruppieren (bis 10 km, bis 50 km, bis 100 km vom Arbeitsplatz). Bei Wünschen können Sie schauen, ob sich mehrere Antworten zu einer Kategorie zusammenfassen lassen (im Beispiel unten beispielsweise die je 2 Antworten zu den Lehrplänen und zur besseren Einbindung). Wenn Sie den zweiten Schritt vollzogen haben, können Sie die entstandenen Gruppen codieren (wie bei Fall 2 bzw. 3). Ob und wie Sie den zweiten Schritt vollziehen, hängt immer von Ihrer Fragestellung und von Ihrem Erkenntnisinteresse ab. Gehen Sie bei der Eingabe zeilenweise vor, d.h., dass Sie die Werte Fragebogen um Fragebogen in die vorbereitete Datenmatrix eintragen. Bei fehlenden Werten (keine Antwort oder unverständlich) wird die entsprechende Zelle frei gelassen oder mit einem Wert codiert, den diese Variable nicht annehmen kann (beispielsweise beim Geburtsjahr der Code 9999, bei 6 vorkommenden Berufen der Code 99). Arbeitsstelle WAS Stand September 2015 5 4 Wichtige Kennzahlen der deskriptiven Statistik Mit dem Einsatz eines Fragebogens werden zahlreiche Daten produziert, die sich dann unsortiert in Ihrer Datenmatrix finden. Der Aussagewert dieser Datenmengen erschließt sich nicht auf den ersten Blick. Bloße Zahlensammlungen sind zunächst unübersichtlich, mithin sinnlos. Deskriptive Statistik beschäftigt sich mit der Organisation, Zusammenfassung und Darstellung von Daten, um sie übersichtlich und für einen Betrachter leicht fassbar zu machen. Aus einer Vielzahl von Daten werden also einige wenige Kennzahlen einer Statistik gebildet, die zentrale Eigenschaften der Datenmenge anzeigen. Mithilfe von Excel ist es vor allem relativ leicht möglich Mittelwerte und Streuungsmaße einer Verteilung zu berechnen. 4.1 Mittelwerte – Maße der zentralen Tendenz Die gebräuchlichen Formen die zentrale Tendenz einer Verteilung darzustellen sind das arithmetische Mittel, der Median, sowie der Modus. arithmetisches Mittel Das arithmetische Mittel gibt den Durchschnitt aller Werte einer Variable wieder. Sie haben etwa folgende Informationen über das Alter einer befragten Personengruppe erhalten: Das arithmetische Mittel erhalten Sie durch das Zusammenzählen der einzelnen Werte (also 18 + 22 + 21 …). Diese Summe teilen Sie dann durch die Anzahl der Nennungen (hier: 9). Excel erleichtert Ihnen hier die Arbeit vor allem bei größeren Frage- und Zahlenmengen wie folgt: In der Registerkarte Start in der Gruppe Bearbeiten wird Ihnen das Summensymbol Ʃ angezeigt. Mit dem Klick auf den Pfeil neben diesem Befehl öffnet sich ein Dialogfeld mit einer Reihe statistischer Kennzahlen, z.B. der Summe, dem Mittelwert und der Anzahl der Werte, die Sie auswählen können. Im Beispiel unten sehen Sie die Anzahl der Werte in der Zelle B13. Diese Zelle ist durch die Funktion „=ANZAHL(B3:B11)“ gekennzeichnet. Dies sehen Sie auch in der Bearbeitungsleiste. Arbeitsstelle WAS Stand September 2015 6 Für die Summe wird nun in Zelle B14 der Wert 195 angezeigt. Die Zelle B14 ist mit der Funktion „=SUMME(B3:B11)“ definiert. Genauso ist der Mittelwert durch die Funktion „=MITTELWERT(B3:B11)“ definiert. Tipp: Sie können alle Funktionen mit diesen Formeln auch händisch in die Bearbeitungsleiste eingeben. Modus Der Modus einer Verteilung ist derjenige Wert, der am häufigsten vorkommt. Würden wir eine Zufallsstichprobe ziehen, würde er mit der größten Wahrscheinlichkeit gezogen werden. Im obigen Beispiel lässt sich der Modus leicht ablesen. Nur der Wert 22 wird zwei Mal angegeben. Um sich den Modus durch Excel anzeigen zu lassen, klicken Sie auf den Befehl fx direkt links neben der Bearbeitungsleiste. Es öffnet sich das Dialogfeld Funktion einfügen, in dem Sie die Kategorie Statistik auswählen. Nun erhalten Sie eine ganze Reihe weiterer, alphabetisch sortierter Funktionen, darunter den Modus und den Median. Wichtig ist, dass Sie als Bezugswerte die richtigen Zeilen und Spalten angeben, in unserem Beispiel bezieht sich die Zelle B16, die den Modus anzeigt, auf die Zellen B3 bis B11. In der Bearbeitungsleiste steht damit die Formel: „=MODUS.EINF(B3:B11)“ Median Ober- und unterhalb des Medianwertes liegen gleich viele Werte, d.h. der Median ist derjenige Wert, der eine Verteilung halbiert. Bei einer ungeraden Zahl von Werten ist der Median leicht abzulesen. Liegen etwa die Werte 3,4,5,6,7 (n= 5) vor, so ist der dritte Wert (hier die 5) der Median. Die Berechnung des Medians setzt voraus, dass die Daten der Größe nach geordnet sind (x_1 <= x_2 <= …). Bei einer geraden Zahl von Werten ist das arithmetische Mittel der beiden mittleren Zahlen der Median. In der Reihe 2, 3, 5, 6 ist der Median folglich die Mitte des zweiten und dritten Wertes (hier also 4). Auch den Median finden Sie in dem Dialogfeld Funktion einfügen. In der Bearbeitungsleiste steht dann die Formel „=MEDIAN(B3:B11)“ Insgesamt ergibt sich also nebenstehendes Bild für unsere Beispielverteilung. Arbeitsstelle WAS Stand September 2015 7 4.2 Streuungsmaße Nun können recht unterschiedliche Verteilungen zu etwa demselben Mittelwert führen. Die oben angegebenen Maße der zentralen Tendenz (arithmetisches Mittel, Modus, Median) genügen nicht, eine Verteilung vollständig zu charakterisieren. Streuungsmaße geben Auskunft darüber, wie stark einzelne Werte voneinander abweichen. Die Spannweite (range) gibt die Größe des Bereichs an, in dem sich alle Messwerte finden. Eine Standardtabellenfunktion zur Berechnung dieses Wertes bietet Excel nicht an. Sie können sich aber behelfen, indem Sie zwei Tabellenfunktionen miteinander kombinieren, um die Spannweite Ihrer Daten zu berechnen. Um die Spannweite zu berechnen, bilden Sie die Differenz aus dem Maximum (MAX) und dem Minimum (MIN) der Werte Ihrer Tabelle. In der Bearbeitungsleiste findet sich folgende Formel: „=MAX(B3:B11)-MIN(B3:B11)“ Die Varianz ist ein weiteres Streuungsmaß; sie nimmt umso größere Werte an, je stärker die Messwerte von ihrem Mittelwert abweichen. Auch die Varianz finden Sie unter den in Excel bereitgestellten Formeln; sie lautet für unser Beispiel: "=VARIANZ(B3:B11)" Die Standardabweichung schließlich ist ein Indikator für die Breite einer Verteilung. Sie gibt an, wie weit die Werte um den Mittelwert streuen. In Excel errechnen Sie die Standardabweichung für unser Beispiel mit dem Befehl: "=STABW(B3:B11)" 4.3 Häufigkeiten Excel kann Ihnen auch die absolute und relative Häufigkeit der Nennungen einzelner Werte einer Variable anzeigen – also anzeigen, wie oft eine bestimmte Antwort gegeben wurde. Die unten stehende Tabelle bezieht sich auf Fragen zu Geschlecht und Zuwanderungsgeschichte. Die Antwortmöglichkeiten wurden mit den Ziffern 1 und 2 codiert. Arbeitsstelle WAS Stand September 2015 8 Um die absoluten Häufigkeiten anzeigen zu lassen, markieren Sie die Zellen, in denen sich die Ergebnisse finden sollen. Achtung: Markieren Sie so viele Zellen, wie Antwortkategorien vorhanden sind, also im obigen Beispiel markieren Sie zwei Felder (hier B13 und B14). Klicken Sie in der Registerkarte Formeln auf den Befehl Funktion einfügen, dann landen Sie auf anderem Weg in dem bereits bekannten Dialogfeld Funktion einfügen. In der Kategorie Statistik finden sie die Funktion Häufigkeit. Sie werden nun aufgefordert die sogenannten Funktionsargumente zu benennen. Die Daten sind die Werte, sie beziehen sich im Beispiel für Frage 1 auf die Zellen B2 bis B10; die Klassen bezeichnen die Antwortmöglichkeiten, im obigen Beispiel in den Zellen A13 und A14 (das müssen Sie ggf. zuvor händisch eingeben). Beenden Sie den Vorgang nicht mit OK, sondern mit der Tastenkombination Strg, Shift und Enter, die Sie gleichzeitig drücken. Excel zeigt Ihnen nun neben jedem Wert die absolute Häufigkeit seiner Nennung an. Wenn Sie neben der Zahl der Nennung auch die relative Häufigkeit, sprich den prozentualen Anteil an den Nennungen insgesamt, darstellen möchten, müssen Sie zunächst die Summe aller Nennungen errechnen (hier 9). Dazu klicken Sie in der Registerkarte Start in der Gruppe Bearbeiten auf das Summenzeichen Ʃ und wählen die zu summierenden Werte aus. Nun können Sie in einer neuen Spalte die prozentualen Anteile errechnen lassen, indem Sie entweder a) für jeden Wert die Zahl der jeweiligen Nennungen (hier 3 bzw. 6) mit 100 multiplizieren und durch die Zahl der gesamten Nennungen (hier 9) teilen. Klicken Sie dazu auf die Bearbeitungsleiste, beginnen Sie Ihre Formel mit „=“ und klicken Sie dann die entsprechenden Zellen an (hier: B13*100/B15 und dann B14*100/B15) oder b) die Zellen, in denen das Ergebnis stehen soll, ins Prozentformat bringen (über Registerkarte Start, Gruppe Zahl) - dann müssen Sie nur B13/B15 rechnen. Arbeitsstelle WAS Stand September 2015 9 5 Sortieren und Filtern von Daten Nachdem Sie die Daten eingegeben haben, sind die Datensätze zuerst in der Reihenfolge sortiert, in der Sie diese eingegeben haben. Excel bietet Ihnen die Möglichkeit, Ihre Daten nach verschiedenen Kriterien zu sortieren oder auch zu filtern, sodass nur bestimmte Datensätze angezeigt werden. Zudem können Sie bestimmte Daten optisch hervorheben. Das kann Ihnen dabei helfen, einen ersten Überblick über Ihre Daten zu bekommen. Wenn Sie die Daten sortieren oder filtern möchten, ist es zuerst ratsam, für einige Aktionen sogar notwendig, dass Sie die Daten als Tabelle formatieren. Dazu markieren Sie Ihre Daten und klicken dann in der Registerkarte Einfügen auf den Befehl Tabelle. In dem Dialogfeld, das sich beim Umwandeln in eine Tabelle öffnet, setzen Sie ein Häkchen bei Tabelle hat Überschriften. Die Spaltenbeschriftungen sind jetzt hervorgehoben und als Tabellenüberschriften formatiert (siehe links). Sortieren von Daten Sie können Ihre Daten der Größe nach auf- oder absteigend sortieren, indem Sie die Spalte markieren, deren Werte Sie aufsteigend oder absteigend sortieren möchten, und dann in der Registerkarte Start in der Gruppe Bearbeiten auf den Befehl Sortieren und Filtern klicken. Dort wählen Sie entweder eine der beiden vorgegebenen Optionen (auf- oder absteigend sortieren). In dem dann erscheinenden Dialogfeld wählen Sie die Option Markierung erweitern. Tun Sie das nicht, sortiert Excel Ihnen nur die markierte Spalte, d.h. ein Datensatz steht nicht mehr in einer Zeile; Zellen in dieser Spalte werden anders als die anderen Zellen in derselben Zeile verschoben. Alternativ können Sie den ganzen Bereich, in dem die zu sortierenden Daten stehen, markieren, und wiederum in der Registerkarte Start in der Gruppe Bearbeiten unter dem Befehl Sortieren und Filtern auf das Benutzerdefiniertes Sortieren klicken. Es öffnet sich ein Dialogfeld, in dem Sie auswählen können, nach welchem Kriterium Sie die Daten sortieren möchten. Arbeitsstelle WAS Stand September 2015 10 Wählen Sie im ersten Dropdown-Menü die betreffende Variable und im letzten Dropdown-Menü die Reihenfolge aus. Sie können dann weitere Ebenen hinzufügen, indem Sie auf den entsprechenden Befehl oben links im Dialogfeld klicken. Es öffnet sich eine neue Zeile, in der Sie wieder Variable und Reihenfolge auswählen. Sie können beliebig viele Sortierebenen festlegen (maximal so viele, wie es Variablen gibt). Wenn Sie auf OK klicken, wird die Sortierung angewendet. Welche Variablen in die Sortierung einbezogen wurden, sehen Sie anhand eines kleinen Pfeilsymbols neben der Spaltenüberschrift. Sie entfernen die Sortierung, indem Sie in der Registerkarte Start in der Gruppe Bearbeiten unter dem Befehl Sortieren und Filtern auf Löschen klicken. Filtern von Daten Anders als beim Sortieren werden beim Filtern bestimmte Werte ausgeblendet. Wenn Sie auf den kleinen Pfeil rechts neben der Spaltenbezeichnung klicken, öffnet sich hierfür ein Dialogfeld. Dieses Feld bietet Ihnen ebenfalls die Möglichkeit, die Daten auf- oder absteigend zu sortieren. Zudem können Sie die Daten filtern, indem Sie die Häkchen im unteren Teil des Feldes nur bei den Daten setzen, die angezeigt werden sollen (z.B. möchten Sie nur die hoch belasteten Fälle anschauen und setzen deshalb nur bei 4 und 5 Ihr Häkchen, oder Sie möchten sich nur die Gruppe der Lehrkräfte anschauen und lassen sich deshalb nur Beruf 2 anzeigen). Zudem können Sie gezielt nach Fällen suchen, indem Sie das Suchkriterium (eine Zahl) in das Suchfeld eintippen. Die Option Zahlenfilter ermöglicht es, sich darüber hinaus bestimmte Werte anzeigen zu lassen, zum Beispiel alle, die größer oder kleiner als ein von Ihnen bestimmter Wert sind oder zwischen zwei Werten liegen, Werte, die unter oder über dem Durchschnitt der Variable liegen oder die 10 höchsten Werte. Probieren Sie einfach einmal aus, welche Möglichkeiten es dort gibt! Sobald Sie auf OK klicken, werden Ihre Daten Ihren Vorgaben entsprechend gefiltert. Dass ein Filter angewendet wurde, erkennen Sie am kleinen Trichter-Symbol in der Spaltenüberschrift. Wenn Sie einen Filter wieder entfernen möchten, tun Sie dies ebenfalls, indem Sie auf den Pfeil neben der Überschrift klicken und Filter löschen aus … anklicken. Die Befehle zum Setzen und zum Löschen von Filtern finden Sie auch in der Registerkarte Daten in der Gruppe Sortieren und Filtern. Bedingte Formatierung Unter der Option Zahlenfilter wurde gerade die Möglichkeit beschrieben, sich nur bestimmt Werte, wie z.B. jene, die unter oder über dem Durchschnitt der Variable liegen oder die 10 höchsten Werte insgesamt, anzeigen zu lassen. Sie können diese Werte aber auch durch eine sogenannte bedingte Formatierung hervorheben, anstatt Sie herauszufiltern. Im Unterschied zum oben beschriebenen Filtern werden dann weiterhin alle Werte angezeigt; es findet lediglich eine optische Hervorhebung der für Sie relevanten Daten durch die bedingte Formatierung statt. Arbeitsstelle WAS Stand September 2015 11 Die Möglichkeit zur optischen Kennzeichnung finden Sie in der Registerkarte Start in der Gruppe Formatvorlagen. Wenn Sie dort auf Bedingte Formatierung klicken, öffnet sich ein Dialogfeld, das Ihnen eine ganze Reihe von voreingestellten Gestaltungsmöglichkeiten bietet. Unter Regeln zum Hervorheben von Zellen werden Ihnen die Möglichkeiten Größer als x, Kleiner als x, Gleich x oder Zwischen x und y angezeigt. Klicken Sie darauf, öffnet sich ein Dialogfeld, in dem Sie den Zahlenwert eingeben können. Unter Obere/untere Regeln können Sie sich die größten/kleinsten x Werte, die oberen/unteren x% oder die Werte unter/über dem arithmetischen Mittel hervorheben lassen. In dem sich dann öffnenden Dialogfeld können Sie jeweils noch Anpassungen vornehmen. Sie können neben dieser reinen Hervorhebung auch Datenbalken, Farbskalen oder Symbolsätze einfügen. Hier gilt: je nach Variable bieten sich unterschiedliche Darstellungen an. Wir zeigen Ihnen in der Abbildung rechts ein paar Möglichkeiten auf, wie Sie diese Formatierung einsetzen können. Bei einer hohen Stressbelastung beispielsweise können Sie das betreffende Feld rot, bei geringerer grün, bei mittlerer gelb einfärben lassen. Sie können die Belastung auch mithilfe von roten Balken darstellen. Die Berufserfahrung wird visualisiert, indem Sie Kreise einfügen lassen, die je nach Umfang der Berufserfahrung leer, zu einem Viertel, zur Hälfte, zu drei Vierteln oder ganz voll sind. Probieren Sie hier einfach aus und klicken Sie sich durch die verschiedenen Möglichkeiten durch! Für alle hier vorgestellten Varianten gilt: Unterhalb der von Excel vorgeschlagenen Formatierungen können Sie in allen Fällen auf Weitere Regeln klicken. Dort haben Sie die Möglichkeit, eine Formatierung ganz nach Ihrem Bedarf anzupassen. Wenn Sie die Formatierung nicht mehr angezeigt bekommen möchten, klicken Sie in der Registerkarte Start in der Gruppe Formatvorlagen auf den Befehl Bedingte Formatierung und dort auf Regeln löschen. Sie können dann wählen, welche Formatierungen gelöscht werden sollen. Arbeitsstelle WAS Stand September 2015 12 6 Grafische Darstellung der Ergebnisse Für Ihren Forschungsbericht werden Sie regelmäßig grafische Darstellungen Ihrer Ergebnisse in Form von Diagrammen einfügen. Abhängig davon, welche Aussage Sie mit Ihren Daten treffen wollen, bieten sich je unterschiedliche Diagrammtypen an. Kreisdiagramme verwendet man beispielsweise, um relative Häufigkeiten und Verteilungen abzubilden (z.B. Anteil der einzelnen Berufsgruppen an der Gesamtgruppe), Balken- und Säulendiagramme hingegen für absolute Häufigkeiten (z.B. Anzahl der Nennung der einzelnen Stressoren). Bei Fragen mit Mehrfachnennungen empfiehlt sich insofern eher die Arbeit mit Balken- oder Säulendiagrammen. Um Zusammenhänge zwischen zwei Variablen abzubilden (z.B. zwischen Berufserfahrung und Stressbelastung) eigenen sich sogenannte Liniendiagramme. Grundsätzlich generieren Sie Kreis-, Balken- und Säulendiagramme nicht aus Ihren Rohdaten, sprich direkt aus der Datenmatrix. Sie müssen die Daten zuvor schon weiterverarbeitet haben, indem Sie z.B. die Häufigkeiten der einzelnen Werte oder die Durchschnittswerte mehrerer Variablen errechnen lassen. Liniendiagramme können Sie hingegen in einigen Fällen auch aus den Rohdaten erstellen. Für das unten stehende Kreisdiagramm haben wir dementsprechend die Häufigkeiten der verschiedenen genannten Schulformen anzeigen lassen (siehe Kapitel 4.3 Häufigkeiten). Wenn die Zeilenbeschriftungen links von den Daten und die Spaltenbeschriftungen über den Daten stehen, wird Ihnen Excel i.d.R. automatisch ein passendes Diagramm erzeugen. Dazu wählen Sie in der Registerkarte Einfügen in der Gruppe Diagramme Ihren gewünschten Diagrammtyp aus. Sie können die konkrete Gestaltung eines Diagramms nach dem Einfügen verändern. Die obige Darstellungsvariante erhalten Sie, indem Sie das Diagramm anklicken und unter Diagrammtools in der Registerkarte Entwurf in die Gruppe Layouts gehen. Dort haben Sie verschiedene Optionen Ihr Diagramm zu gestalten, einzelne Bereiche der Grafik hervorzuheben usw. Auch hier gilt: Probieren Sie die verschiedenen Darstellungsvarianten einfach einmal aus. Arbeitsstelle WAS Stand September 2015 13 Mit dem oben ebenfalls markierten Befehl Daten auswählen können Sie bei Bedarf die Datenbezüge Ihres Diagramms verändern. Es öffnet sich folgendes Dialogfeld: Die Beschriftung als Legendeneinträge und Horizontale Achsenbeschriftung ist zunächst kontraintuitiv. Wenn Sie unter Legendeneinträge auf Bearbeiten klicken, können Sie Namen und Bezüge Ihres Diagramms festlegen und verändern. Als Reihenname definieren Sie den Namen der Datenreihe. Als Reihenwerte benennen Sie den Bereich von Daten, der hier abgebildet werden soll, also im obigen Beispiel den Bereich von C8 bis C11. Die Benennungen Ihrer Werte (hier die Schulformen 1-4) verändern Sie, indem Sie die Horizontale Achsenbeschriftung bearbeiten und analog die Bezugsreihe verändern. Wenn sich Kreisdiagramme vor allem eignen, um relative Häufigkeiten abzubilden, so können Sie mit Balken- und Stabdiagrammen in erster Linie absolute Häufigkeiten abbilden: Das Einfügen und die Auswahl der Bezugsdaten folgt der gleichen Systematik, wie bei der Erstellung von Kreisdiagrammen. Arbeitsstelle WAS Stand September 2015 14 Mit dem Liniendiagramm lassen sich u.U. Hypothesen über Zusammenhänge zwischen Variablen sichtbar machen. Für alle Diagramme gilt: Achten Sie darauf, dass Sie diese präzise beschriften, einen aussagekräftigen Titel wählen und angeben, wie viele Fälle jeweils dargestellt sind (n). Arbeitsstelle WAS Stand September 2015 15