Excel 2010: DatenEingabe und

Werbung
ARBE I TSSTEL LE WI SSENSCHAFTL I CHE S
ARBE I TEN UND SOZ I AL FORSCHUNG
Excel 2010:
DatenEingabe und -Auswertung
eine handreichung für
studierende des fachbereichs
sozial- und kulturwissenschaften
Stand 09/2015
Vorwort
Über WAS
Die Arbeitsstelle Wissenschaftliches Arbeiten und Sozialforschung wurde im Wintersemester
2011/12 ins Leben gerufen, um einen Beitrag zur Verbesserung der Qualität von Studium und Lehre
zu leisten.
Unser Aufgabenschwerpunkt ist die Weiterentwicklung und konzeptionelle Unterstützung der Propädeutik. Aus diesem Grund unterstützen wir den Prozess der Aneignung und Vertiefung sozialwissenschaftlicher Basiskompetenzen. Neben unseren Fortbildungsangeboten für Lehrende und Studierende, einer Lernplattform und einem Semesterapparat in der Fachbibliothek Sozialwesen der Hochschule Düsseldorf sollen auch unsere Reader zum wissenschaftlichen Arbeiten, zum Formatieren in
Word und die hier vorliegenden Hinweise zur Datenauswertung mit Excel dazu beitragen.
Weitere Informationen über die Arbeitsstelle WAS sowie unser aktuelles Angebot finden Sie auf unserer Homepage: http://soz-kult.hs-duesseldorf.de/studium/was.
Zur Auswertung quantitativer Daten mit Excel
Valides Datenmaterial über die Gegenstandsbereiche Sozialer Arbeit ist unerlässlich für eine reflexive
Praxis Sozialer Arbeit. Hierfür bedarf es nicht nur kontrollierter Erhebungsmethoden, sondern auch
effektiver Instrumente der Auswertung und Darstellung. MS Excel bietet gute Möglichkeiten auch
umfangreiche Datensätze zu bündeln und grafisch darzustellen. Zu beachten freilich ist, dass Excel
nicht in erster Linie Statistik- und Analysesoftware ist. Die Problemstellungen der schließenden Statistik, mit deren Hilfe Aussagen über das Verhältnis einer Stichprobe zur Grundgesamtheit getroffen
werden können, sind sicherlich bei speziell dafür entworfenen Programmen besser aufgehoben. Beachten Sie dazu auch unsere regelmäßigen Schulungen zu SPSS. Zugleich ist Excel ein Kalkulationsprogramm mit umfangreichen Funktionsmöglichkeiten. Erschöpfende Einführungen in die Handhabung des Programms nehmen schnell mehrere hundert Buchseiten ein. Wir haben deshalb gezielt
einige Funktionen gesammelt, die es Ihnen ermöglichen sollen, Ihre quantitativen Daten in MS Excel
einzugeben und auszuwerten.
Eine solche Handreichung bleibt Entwurf und soll dynamisch bleiben. Deshalb freuen wir uns auf Ihre
Rückmeldungen und Erweiterungsvorschläge.
Ihr Team WAS
Kontakt:
Hochschule Düsseldorf
Fachbereich SK Sozial- und Kulturwissenschaften
Arbeitsstelle WAS
Gebäude 24.21, Raum 01.62
Tel.: 0211-811-4607
E-Mail: [email protected]
Arbeitsstelle WAS
Stand September 2015
I
Inhaltsverzeichnis
Inhaltsverzeichnis ......................................................................................................................... II
1
Einführung ............................................................................................................................ 1
1.1
Zentrale Begriffe ...................................................................................................................... 1
1.2
Ablauf der Auswertung ............................................................................................................ 1
2
Erstellen einer Datenmatrix ................................................................................................... 3
3
Codierung und Eingabe der Daten ......................................................................................... 4
4
Wichtige Kennzahlen der deskriptiven Statistik ...................................................................... 6
4.1
Mittelwerte – Maße der zentralen Tendenz ............................................................................ 6
4.2
Streuungsmaße........................................................................................................................ 8
4.3
Häufigkeiten ............................................................................................................................ 8
5
Sortieren und Filtern von Daten .......................................................................................... 10
6
Grafische Darstellung der Ergebnisse ................................................................................... 13
Arbeitsstelle WAS
Stand September 2015
II
1
Einführung
Microsoft Excel 2010 führt eine Reihe von Bezeichnungen für seine Funktionen, die nicht unbedingt
selbsterklärend sind. Wir stellen unseren Hinweisen deshalb eine kurze Erläuterung dieser
Bezeichnungen vorneweg. Zudem möchten wir einführend den grundsätzlichen Ablauf der Eingabe
und Auswertung quantitativer Daten in Excel darstellen. Daran orientiert sich der Aufbau des
vorliegenden Readers.
1.1 Zentrale Begriffe
Im Reader bedienen wir uns in Bezug auf Excel folgender Bezeichnungen:
Wenn Sie das Programm öffnen, sehen Sie ein sog. Menüband (siehe Screenshot unten), das aus
verschiedenen Registerkarten (Start, Einfügen, Seitenlayout, Formeln usw.) mit jeweils mehreren
Befehlen besteht. Hier ist die Registerkarte Start geöffnet:
Die Registerkarte bezeichnet die wichtigste Gliederungs- und Sortierungsebene. Bei den StandardVoreinstellungen haben Sie folgende Registerkarten zur Auswahl: Datei, Start, Einfügen, Seitenlayout,
Formeln, Daten, Überprüfen und Ansicht. Jede Registerkarte unterteilt sich in Gruppen – im Falle der
Registerkarte Start in die Gruppen Zwischenablage, Schriftart, Ausrichtung, Zahl, Formatvorlagen,
Zellen und Bearbeiten (s.o.).
Im oberen Teil dieser Gruppen befinden sich die Befehle. Mit ihrer Hilfe können Sie zügig auf
einzelne Bereiche zugreifen und sie z.B. formatieren. Im unteren Teil finden Sie die Gruppenbezeichnung und teilweise am rechten unteren Rand kleine Pfeile, mit denen Sie das jeweils
zugehörige Dialogfeld öffnen können. Das ist ein neues Fenster, in dem Sie alle Befehle finden, die
Sie in der Registerkarte im Menüband haben, aber darüber hinaus auch weitere Möglichkeiten.
Unterhalb des Menübands sehen Sie zum einen das Namenfeld, in dem Ihnen angezeigt wird, in
welcher Zelle Sie sich gerade befinden – hier die Zelle A1, die schwarz umrahmt ist. Daneben
befindet sich die Bearbeitungsleiste. Hier sehen Sie die Funktion, die für die jeweilige Zelle hinterlegt
ist (im o.g. Beispiel die Summe der Zellen C5 bis E5). In der Zelle selbst wird währendessen das
Ergebnis der hinterlegten Funktion als Zahlenwert angezeigt (hier der Wert 126).
1.2 Ablauf der Auswertung
Wenn Sie Ihre Daten gesammelt haben, ist der erste Schritt, die Fragebögen/Testbögen zu nummerieren. Sollten Sie sich im Laufe der Dateneingabe einmal vertun, müssen Sie sonst womöglich wieder
ganz von vorne mit der Eingabe beginnen. Die Nummerierung kann aus einfachen Zahlen oder bestimmten Codes bestehen – beispielsweise Kürzel für die jeweilige Institution oder Berufsgruppe,
wenn dies zutrifft. Diese Bezeichnung soll so gestaltet sein, dass sie nur einmal vergeben wird, also
ein Code eindeutig einem Bogen zuzuordnen ist.
Arbeitsstelle WAS
Stand September 2015
1
Nachdem Sie das erledigt haben, ist der nächste Schritt die Erstellung einer Datenmatrix (siehe Kapitel 2 Erstellen einer Datenmatrix), indem Sie die Spalten und Zeilen Ihren Daten entsprechend benennen. Es folgt die Eingabe der Daten in die Datenmatrix (siehe Kapitel 3 Codierung und Eingabe
der Daten) und schließlich die Berechnung zentraler Kennwerte der deskriptiven Statistik (siehe Kapitel 4 Wichtige Kennzahlen der deskriptiven Statistik). Gegebenenfalls ist für den Forschungsbericht
auch eine grafische Darstellung der Daten in Form von Diagrammen gewünscht – diese Möglichkeit
stellen wir Ihnen in Kapitel 6 Grafische Darstellung der Ergebnisse kurz vor.
Arbeitsstelle WAS
Stand September 2015
2
2
Erstellen einer Datenmatrix
Die Daten, die Sie in Ihrer Erhebung gesammelt haben, müssen Sie in Excel eingeben. Den Rahmen
dafür stellt die sogenannte Datenmatrix dar. Diese erstellen Sie, bevor Sie die Daten tatsächlich in
Excel einpflegen. Es ist auch möglich, die Datenmatrix schon vor der Datenerhebung zu erstellen. Das
kann hilfreich sein, um im Vorfeld schon mögliche Schwierigkeiten bei der Dateneingabe auszuräumen, die man sonst übersehen könnte.
Ihre Datenmatrix kann etwa so aussehen:
2.
1.
1. In der ersten Zeile der Matrix stehen Bezeichnungen für alle Variablen (z. B. FragebogenNummer, Geschlecht, die einzelnen Fragen oder Messwerte, ...). Das können beispielsweise Kurztitel sein (anstatt „Wie viele Jahre Berufserfahrung haben Sie?“: „Berufserfahrung“ o.ä.), aber
auch einfache Zahlen (Frage 1 = 1 etc.). Selbstverständlich sollten Sie sich an geeigneter Stelle notieren, was die Variablennamen bedeuten.
2. In der ersten Spalte der Matrix stehen die Bezeichnungen für die jeweilige Untersuchungseinheit
(d.h. den Fragebogen, die Person, …). Das kann eine Zahl sein, aber auch ein zusätzliches Kürzel,
das Ihnen hilft, den einzelnen Fall einzuordnen – wenn Sie eine Befragung in verschiedenen Städten durchgeführt haben, können Sie beispielsweise deren Kfz-Kennzeichen nutzen, bei verschiedenen Berufsgruppen eine Abkürzung wie im Beispiel SP für Sozialpädagogische Fachkräfte und
LK für Lehrkräfte. Verwenden Sie hier möglichst die gleiche Codierung, die Sie auch auf den Fragebögen selbst verwendet haben, um die Zuordnung zu vereinfachen.
In den anderen Zellen werden später die Werte eingetragen (siehe Kapitel 3 Codierung und Eingabe
der Daten). Ihre Matrix hat also jetzt pro Untersuchungseinheit (= Person) eine Zeile, in der die Werte
für die jeweiligen Variablen eingetragen werden. Andersherum betrachtet: Pro Variable (= Frage) hat
die Matrix eine Spalte, in der die Werte für jede Untersuchungseinheit eingetragen werden.
Tipp: Bei großen Datenmengen kann es sinnvoll sein, für jede Gruppe (z.B. Stadt, Klasse, Schule, …)
ein eigenes Tabellenblatt anzulegen, da dies übersichtlicher ist als eine Gesamtaufstellung. In jedem
Fall sollten Sie aber zusätzlich ein Tabellenblatt mit den Gesamtdaten erstellen.
Arbeitsstelle WAS
Stand September 2015
3
3
Codierung und Eingabe der Daten
Nachdem Sie nun die Datenmatrix erstellt haben, tragen Sie die einzelnen Werte in die übrigen Zellen
ein. Außerhalb der 1. Zeile und Spalte sollten Sie ausschließlich Zahlen eintragen. Das ist bei einigen
Werten einfacher umzusetzen als bei anderen.
Wir unterscheiden hier vier Fälle, die wir in den beiden Beispielen für ausgefüllte Datenmatrizen
auch dementsprechend gekennzeichnet haben:
1. Zahlen
Die Werte liegen als Zahlen vor (z. B. Alter, Berufserfahrung in Jahren, Ergebnis einer Klausur als Note). In diesem Fall werden einfach die Zahlen direkt in die betreffende Zelle eingetragen. In allen anderen Fällen müssen Sie die Antworten erst zu einer Zahl verschlüsseln, also codieren.
2. Einfachnennung
Die Werte liegen nicht als Zahlen vor, können aber durch eine (!) Zahl ausgedrückt werden. Das ist
der Fall, wenn nur eine Antwort vorgesehen ist (z. B. bei Beruf, Wohnort, Geschlecht, ja/nein-Fragen,
Bewertungsfragen mit einer Skala von 1 bis 5). Bei Ja/nein-Fragen beispielsweise können die Antworten durch 0 (=nein) und 1 (=ja) codiert werden. Bei der Frage nach dem Beruf könnten die Antworten
dann durch die Zahlen 1, 2, 3, 4 etc. codiert werden, wobei jeder Beruf durch eine Zahl ausgedrückt
wird. Achtung: Dieser Fall tritt nur bei geschlossenen Fragen („Ankreuzfragen“) ein, bei denen nur
eine Antwort ausgewählt werden soll. Sonst müssen Sie bei Fall 3 (Mehrfachnennung) oder 4 (offene
Fragen) schauen!
3. Mehrfachnennung
Die Werte liegen nicht als Zahlen vor und die Fragen sind so gestellt, dass bei einer Person mehrere
Antworten vorliegen können (z. B. „Wie sind Sie auf XY aufmerksam geworden?“ oder „Welchen
Stressoren fühlen Sie sich in Ihrem Berufsalltag regelmäßig ausgesetzt?“). Solche Daten behandelt
man so, als wäre jede Antwortmöglichkeit eine separate ja/nein-Frage. Es wird also für jede Antwortmöglichkeit eine eigene Spalte angelegt, als wäre sie eine eigene Variable, in der dann eine 1
eingetragen wird, wenn sie angekreuzt wurde, und eine 0 bzw. nichts, wenn nicht.1
1
Diese Möglichkeit haben Sie auch im Fall 2: Für jede Antwortmöglichkeit eine Spalte mit 1/0 als Codierung.
Arbeitsstelle WAS
Stand September 2015
4
4. Offene Fragen
Die Werte liegen nicht als Zahlen vor und die Fragen sind so gestellt, dass die Person selbst eine Antwort formulieren soll (z.B. Frage nach Wünschen oder Gestaltungsvorschlägen oder dem Wohnort).
Diese Art von Frage bietet sich immer dann an, wenn man die möglichen Antworten nicht absehen
kann. In diesem Fall ist oft ein mehrschrittiges Vorgehen notwendig: In einem ersten Schritt übernehmen Sie die Antworten einfach wortgetreu. In einem zweiten Schritt (falls nötig) müssen Sie dann
selbst entscheiden, nach welchen Kriterien Sie die Antworten zusammenfassen möchten. Beim Wohnort kann man beispielsweise nach Landkreisen, Regionen oder Entfernungen gruppieren (bis 10 km,
bis 50 km, bis 100 km vom Arbeitsplatz). Bei Wünschen können Sie schauen, ob sich mehrere Antworten zu einer Kategorie zusammenfassen lassen (im Beispiel unten beispielsweise die je 2 Antworten zu den Lehrplänen und zur besseren Einbindung). Wenn Sie den zweiten Schritt vollzogen haben,
können Sie die entstandenen Gruppen codieren (wie bei Fall 2 bzw. 3). Ob und wie Sie den zweiten
Schritt vollziehen, hängt immer von Ihrer Fragestellung und von Ihrem Erkenntnisinteresse ab.
Gehen Sie bei der Eingabe zeilenweise vor, d.h., dass Sie die Werte Fragebogen um Fragebogen in die
vorbereitete Datenmatrix eintragen. Bei fehlenden Werten (keine Antwort oder unverständlich) wird
die entsprechende Zelle frei gelassen oder mit einem Wert codiert, den diese Variable nicht annehmen kann (beispielsweise beim Geburtsjahr der Code 9999, bei 6 vorkommenden Berufen der Code
99).
Arbeitsstelle WAS
Stand September 2015
5
4
Wichtige Kennzahlen der deskriptiven Statistik
Mit dem Einsatz eines Fragebogens werden zahlreiche Daten produziert, die sich dann unsortiert in
Ihrer Datenmatrix finden. Der Aussagewert dieser Datenmengen erschließt sich nicht auf den ersten
Blick. Bloße Zahlensammlungen sind zunächst unübersichtlich, mithin sinnlos. Deskriptive Statistik
beschäftigt sich mit der Organisation, Zusammenfassung und Darstellung von Daten, um sie übersichtlich und für einen Betrachter leicht fassbar zu machen. Aus einer Vielzahl von Daten werden also
einige wenige Kennzahlen einer Statistik gebildet, die zentrale Eigenschaften der Datenmenge anzeigen. Mithilfe von Excel ist es vor allem relativ leicht möglich Mittelwerte und Streuungsmaße einer
Verteilung zu berechnen.
4.1 Mittelwerte – Maße der zentralen Tendenz
Die gebräuchlichen Formen die zentrale Tendenz einer Verteilung darzustellen sind das arithmetische
Mittel, der Median, sowie der Modus.
arithmetisches Mittel
Das arithmetische Mittel gibt den Durchschnitt aller Werte einer Variable wieder. Sie haben etwa
folgende Informationen über das Alter einer befragten Personengruppe erhalten:
Das arithmetische Mittel erhalten Sie durch das Zusammenzählen
der einzelnen Werte (also 18 + 22 + 21 …). Diese Summe teilen Sie
dann durch die Anzahl der Nennungen (hier: 9). Excel erleichtert
Ihnen hier die Arbeit vor allem bei größeren Frage- und Zahlenmengen wie folgt: In der Registerkarte Start in der Gruppe Bearbeiten wird Ihnen das Summensymbol Ʃ angezeigt. Mit dem Klick auf
den Pfeil neben diesem Befehl öffnet sich ein Dialogfeld mit einer
Reihe statistischer Kennzahlen, z.B. der Summe, dem Mittelwert
und der Anzahl der Werte, die Sie auswählen können.
Im Beispiel unten sehen Sie die Anzahl der Werte in der Zelle B13. Diese Zelle ist durch die Funktion
„=ANZAHL(B3:B11)“ gekennzeichnet. Dies sehen Sie auch in der Bearbeitungsleiste.
Arbeitsstelle WAS
Stand September 2015
6
Für die Summe wird nun in Zelle B14 der Wert 195
angezeigt. Die Zelle B14 ist mit der Funktion
„=SUMME(B3:B11)“ definiert.
Genauso ist der Mittelwert durch die Funktion
„=MITTELWERT(B3:B11)“ definiert.
Tipp: Sie können alle Funktionen mit diesen Formeln
auch händisch in die Bearbeitungsleiste eingeben.
Modus
Der Modus einer Verteilung ist derjenige Wert, der am häufigsten vorkommt. Würden wir eine Zufallsstichprobe ziehen, würde er mit der größten Wahrscheinlichkeit gezogen werden. Im obigen
Beispiel lässt sich der Modus leicht ablesen. Nur der Wert 22 wird zwei Mal angegeben.
Um sich den Modus durch Excel anzeigen zu lassen, klicken Sie auf den Befehl fx direkt links neben
der Bearbeitungsleiste. Es öffnet sich das Dialogfeld Funktion einfügen, in dem Sie die Kategorie Statistik auswählen. Nun erhalten Sie eine ganze Reihe weiterer, alphabetisch sortierter Funktionen,
darunter den Modus und den Median.
Wichtig ist, dass Sie als Bezugswerte die richtigen Zeilen und Spalten angeben, in unserem Beispiel
bezieht sich die Zelle B16, die den Modus anzeigt, auf die Zellen B3 bis B11. In der Bearbeitungsleiste
steht damit die Formel: „=MODUS.EINF(B3:B11)“
Median
Ober- und unterhalb des Medianwertes liegen gleich viele Werte, d.h. der Median ist derjenige Wert,
der eine Verteilung halbiert. Bei einer ungeraden Zahl von Werten ist der Median leicht abzulesen.
Liegen etwa die Werte 3,4,5,6,7 (n= 5) vor, so ist der dritte Wert (hier die 5) der Median. Die Berechnung des Medians setzt voraus, dass die Daten der Größe nach geordnet sind (x_1 <= x_2 <= …). Bei
einer geraden Zahl von Werten ist das arithmetische Mittel der beiden mittleren Zahlen der Median.
In der Reihe 2, 3, 5, 6 ist der Median folglich die Mitte des zweiten und dritten Wertes (hier also 4).
Auch den Median finden Sie in dem Dialogfeld Funktion einfügen. In der Bearbeitungsleiste steht
dann die Formel „=MEDIAN(B3:B11)“
Insgesamt ergibt sich also nebenstehendes Bild für unsere Beispielverteilung.
Arbeitsstelle WAS
Stand September 2015
7
4.2 Streuungsmaße
Nun können recht unterschiedliche Verteilungen zu etwa demselben Mittelwert führen. Die oben
angegebenen Maße der zentralen Tendenz (arithmetisches Mittel, Modus, Median) genügen nicht,
eine Verteilung vollständig zu charakterisieren. Streuungsmaße geben Auskunft darüber, wie stark
einzelne Werte voneinander abweichen.
Die Spannweite (range) gibt die Größe des
Bereichs an, in dem sich alle Messwerte finden. Eine Standardtabellenfunktion zur Berechnung dieses Wertes bietet Excel nicht an.
Sie können sich aber behelfen, indem Sie zwei
Tabellenfunktionen miteinander kombinieren,
um die Spannweite Ihrer Daten zu berechnen.
Um die Spannweite zu berechnen, bilden Sie
die Differenz aus dem Maximum (MAX) und
dem Minimum (MIN) der Werte Ihrer Tabelle.
In der Bearbeitungsleiste findet sich folgende
Formel:
„=MAX(B3:B11)-MIN(B3:B11)“
Die Varianz ist ein weiteres Streuungsmaß; sie nimmt umso größere Werte an, je stärker die Messwerte von ihrem Mittelwert abweichen. Auch die Varianz finden Sie unter den in Excel bereitgestellten Formeln; sie lautet für unser Beispiel: "=VARIANZ(B3:B11)"
Die Standardabweichung schließlich ist ein Indikator für die Breite einer Verteilung. Sie gibt an, wie
weit die Werte um den Mittelwert streuen. In Excel errechnen Sie die Standardabweichung für unser
Beispiel mit dem Befehl: "=STABW(B3:B11)"
4.3 Häufigkeiten
Excel kann Ihnen auch die absolute und relative Häufigkeit der Nennungen einzelner Werte einer
Variable anzeigen – also anzeigen, wie oft eine bestimmte Antwort gegeben wurde. Die unten stehende Tabelle bezieht sich auf Fragen zu Geschlecht und Zuwanderungsgeschichte. Die Antwortmöglichkeiten wurden mit den Ziffern 1 und 2 codiert.
Arbeitsstelle WAS
Stand September 2015
8
Um die absoluten Häufigkeiten anzeigen zu lassen, markieren Sie die Zellen, in denen sich die Ergebnisse finden sollen. Achtung: Markieren Sie so viele Zellen, wie Antwortkategorien vorhanden sind,
also im obigen Beispiel markieren Sie zwei Felder (hier B13 und B14). Klicken Sie in der Registerkarte
Formeln auf den Befehl Funktion einfügen, dann landen Sie auf anderem Weg in dem bereits bekannten Dialogfeld Funktion einfügen. In der Kategorie Statistik finden sie die Funktion Häufigkeit. Sie
werden nun aufgefordert die sogenannten Funktionsargumente zu benennen. Die Daten sind die
Werte, sie beziehen sich im Beispiel für Frage 1 auf die Zellen B2 bis B10; die Klassen bezeichnen die
Antwortmöglichkeiten, im obigen Beispiel in den Zellen A13 und A14 (das müssen Sie ggf. zuvor händisch eingeben). Beenden Sie den Vorgang nicht mit OK, sondern mit der Tastenkombination Strg,
Shift und Enter, die Sie gleichzeitig drücken.
Excel zeigt Ihnen nun neben jedem Wert die absolute Häufigkeit
seiner Nennung an. Wenn Sie neben der Zahl der Nennung auch die
relative Häufigkeit, sprich den prozentualen Anteil an den Nennungen insgesamt, darstellen möchten, müssen Sie zunächst die Summe aller Nennungen errechnen (hier 9). Dazu klicken Sie in der Registerkarte Start in der Gruppe Bearbeiten auf das Summenzeichen Ʃ und wählen die zu summierenden Werte aus. Nun können Sie in einer neuen Spalte die prozentualen Anteile errechnen lassen,
indem Sie entweder
a) für jeden Wert die Zahl der jeweiligen Nennungen (hier 3 bzw. 6) mit 100 multiplizieren und
durch die Zahl der gesamten Nennungen (hier 9) teilen. Klicken Sie dazu auf die Bearbeitungsleiste, beginnen Sie Ihre Formel mit „=“ und klicken Sie dann die entsprechenden Zellen an (hier:
B13*100/B15 und dann B14*100/B15) oder
b) die Zellen, in denen das Ergebnis stehen soll, ins Prozentformat bringen (über Registerkarte Start,
Gruppe Zahl) - dann müssen Sie nur B13/B15 rechnen.
Arbeitsstelle WAS
Stand September 2015
9
5
Sortieren und Filtern von Daten
Nachdem Sie die Daten eingegeben haben, sind die Datensätze zuerst in der Reihenfolge sortiert, in
der Sie diese eingegeben haben. Excel bietet Ihnen die Möglichkeit, Ihre Daten nach verschiedenen
Kriterien zu sortieren oder auch zu filtern, sodass nur bestimmte Datensätze angezeigt werden. Zudem können Sie bestimmte Daten optisch hervorheben. Das kann Ihnen dabei helfen, einen ersten
Überblick über Ihre Daten zu bekommen.
Wenn Sie die Daten sortieren oder filtern möchten, ist
es zuerst ratsam, für einige Aktionen sogar notwendig,
dass Sie die Daten als Tabelle formatieren. Dazu markieren Sie Ihre Daten und klicken dann in der Registerkarte Einfügen auf den Befehl Tabelle. In dem Dialogfeld, das sich beim Umwandeln in eine Tabelle öffnet,
setzen Sie ein Häkchen bei Tabelle hat Überschriften.
Die Spaltenbeschriftungen sind jetzt hervorgehoben
und als Tabellenüberschriften formatiert (siehe links).
Sortieren von Daten
Sie können Ihre Daten der Größe nach auf- oder absteigend sortieren, indem Sie die Spalte markieren, deren Werte Sie aufsteigend oder absteigend sortieren möchten, und dann in der Registerkarte
Start in der Gruppe Bearbeiten auf den Befehl Sortieren und Filtern klicken. Dort wählen Sie entweder eine der beiden vorgegebenen Optionen (auf- oder absteigend sortieren). In dem dann erscheinenden Dialogfeld
wählen Sie die Option Markierung erweitern. Tun Sie das
nicht, sortiert Excel Ihnen nur die markierte Spalte, d.h. ein
Datensatz steht nicht mehr in einer Zeile; Zellen in dieser Spalte werden anders als die anderen Zellen in derselben Zeile
verschoben.
Alternativ können Sie den ganzen Bereich, in dem die zu sortierenden Daten stehen, markieren, und
wiederum in der Registerkarte Start in der Gruppe Bearbeiten unter dem Befehl Sortieren und Filtern
auf das Benutzerdefiniertes Sortieren klicken. Es öffnet sich ein Dialogfeld, in dem Sie auswählen können, nach welchem Kriterium Sie die Daten sortieren möchten.
Arbeitsstelle WAS
Stand September 2015
10
Wählen Sie im ersten Dropdown-Menü die betreffende Variable und im letzten Dropdown-Menü die
Reihenfolge aus. Sie können dann weitere Ebenen hinzufügen, indem Sie auf den entsprechenden
Befehl oben links im Dialogfeld klicken. Es öffnet sich eine neue Zeile, in der Sie wieder Variable und
Reihenfolge auswählen. Sie können beliebig viele Sortierebenen festlegen (maximal so viele, wie es
Variablen gibt). Wenn Sie auf OK klicken, wird die Sortierung angewendet. Welche Variablen in die
Sortierung einbezogen wurden, sehen Sie anhand eines kleinen Pfeilsymbols neben der Spaltenüberschrift. Sie entfernen die Sortierung, indem Sie in der Registerkarte Start in der Gruppe Bearbeiten
unter dem Befehl Sortieren und Filtern auf Löschen klicken.
Filtern von Daten
Anders als beim Sortieren werden beim Filtern bestimmte Werte ausgeblendet. Wenn Sie auf den
kleinen Pfeil rechts neben der Spaltenbezeichnung klicken, öffnet sich hierfür ein Dialogfeld.
Dieses Feld bietet Ihnen ebenfalls die Möglichkeit, die
Daten auf- oder absteigend zu sortieren. Zudem können Sie die Daten filtern, indem Sie die Häkchen im
unteren Teil des Feldes nur bei den Daten setzen, die
angezeigt werden sollen (z.B. möchten Sie nur die
hoch belasteten Fälle anschauen und setzen deshalb
nur bei 4 und 5 Ihr Häkchen, oder Sie möchten sich
nur die Gruppe der Lehrkräfte anschauen und lassen
sich deshalb nur Beruf 2 anzeigen). Zudem können Sie
gezielt nach Fällen suchen, indem Sie das Suchkriterium (eine Zahl) in das Suchfeld eintippen.
Die Option Zahlenfilter ermöglicht es, sich darüber hinaus bestimmte Werte anzeigen zu lassen, zum
Beispiel alle, die größer oder kleiner als ein von Ihnen bestimmter Wert sind oder zwischen zwei
Werten liegen, Werte, die unter oder über dem Durchschnitt der Variable liegen oder die 10 höchsten Werte. Probieren Sie einfach einmal aus, welche Möglichkeiten es dort gibt!
Sobald Sie auf OK klicken, werden Ihre Daten Ihren Vorgaben entsprechend gefiltert. Dass ein Filter
angewendet wurde, erkennen Sie am kleinen Trichter-Symbol in der Spaltenüberschrift. Wenn Sie
einen Filter wieder entfernen möchten, tun Sie dies ebenfalls, indem Sie auf den Pfeil neben der
Überschrift klicken und Filter löschen aus … anklicken.
Die Befehle zum Setzen und zum Löschen von Filtern finden Sie auch in der Registerkarte Daten in
der Gruppe Sortieren und Filtern.
Bedingte Formatierung
Unter der Option Zahlenfilter wurde gerade die Möglichkeit beschrieben, sich nur bestimmt Werte,
wie z.B. jene, die unter oder über dem Durchschnitt der Variable liegen oder die 10 höchsten Werte
insgesamt, anzeigen zu lassen. Sie können diese Werte aber auch durch eine sogenannte bedingte
Formatierung hervorheben, anstatt Sie herauszufiltern. Im Unterschied zum oben beschriebenen
Filtern werden dann weiterhin alle Werte angezeigt; es findet lediglich eine optische Hervorhebung
der für Sie relevanten Daten durch die bedingte Formatierung statt.
Arbeitsstelle WAS
Stand September 2015
11
Die Möglichkeit zur optischen Kennzeichnung finden
Sie in der Registerkarte Start in der Gruppe Formatvorlagen. Wenn Sie dort auf Bedingte Formatierung
klicken, öffnet sich ein Dialogfeld, das Ihnen eine ganze Reihe von voreingestellten Gestaltungsmöglichkeiten bietet.
Unter Regeln zum Hervorheben von Zellen werden
Ihnen die Möglichkeiten Größer als x, Kleiner als x,
Gleich x oder Zwischen x und y angezeigt. Klicken Sie
darauf, öffnet sich ein Dialogfeld, in dem Sie den Zahlenwert eingeben können.
Unter Obere/untere Regeln können Sie sich die größten/kleinsten x Werte, die oberen/unteren x% oder die
Werte unter/über dem arithmetischen Mittel hervorheben lassen. In dem sich dann öffnenden Dialogfeld
können Sie jeweils noch Anpassungen vornehmen.
Sie können neben dieser reinen Hervorhebung auch
Datenbalken, Farbskalen oder Symbolsätze einfügen. Hier gilt: je nach Variable bieten sich unterschiedliche Darstellungen an.
Wir zeigen Ihnen in der Abbildung
rechts ein paar Möglichkeiten auf,
wie Sie diese Formatierung einsetzen können. Bei einer hohen
Stressbelastung
beispielsweise
können Sie das betreffende Feld
rot, bei geringerer grün, bei mittlerer gelb einfärben lassen. Sie können die Belastung auch mithilfe
von roten Balken darstellen. Die
Berufserfahrung wird visualisiert, indem Sie Kreise einfügen lassen, die je nach Umfang der Berufserfahrung leer, zu einem Viertel, zur Hälfte, zu drei Vierteln oder ganz voll sind. Probieren Sie hier einfach aus und klicken Sie sich durch die verschiedenen Möglichkeiten durch!
Für alle hier vorgestellten Varianten gilt: Unterhalb der von Excel vorgeschlagenen Formatierungen
können Sie in allen Fällen auf Weitere Regeln klicken. Dort haben Sie die Möglichkeit, eine Formatierung ganz nach Ihrem Bedarf anzupassen. Wenn Sie die Formatierung nicht mehr angezeigt bekommen möchten, klicken Sie in der Registerkarte Start in der Gruppe Formatvorlagen auf den Befehl
Bedingte Formatierung und dort auf Regeln löschen. Sie können dann wählen, welche Formatierungen gelöscht werden sollen.
Arbeitsstelle WAS
Stand September 2015
12
6
Grafische Darstellung der Ergebnisse
Für Ihren Forschungsbericht werden Sie regelmäßig grafische Darstellungen Ihrer Ergebnisse in Form
von Diagrammen einfügen.
Abhängig davon, welche Aussage Sie mit Ihren Daten treffen wollen, bieten sich je unterschiedliche
Diagrammtypen an. Kreisdiagramme verwendet man beispielsweise, um relative Häufigkeiten und
Verteilungen abzubilden (z.B. Anteil der einzelnen Berufsgruppen an der Gesamtgruppe), Balken- und
Säulendiagramme hingegen für absolute Häufigkeiten (z.B. Anzahl der Nennung der einzelnen Stressoren). Bei Fragen mit Mehrfachnennungen empfiehlt sich insofern eher die Arbeit mit Balken- oder
Säulendiagrammen. Um Zusammenhänge zwischen zwei Variablen abzubilden (z.B. zwischen Berufserfahrung und Stressbelastung) eigenen sich sogenannte Liniendiagramme.
Grundsätzlich generieren Sie Kreis-, Balken- und Säulendiagramme nicht aus Ihren Rohdaten, sprich
direkt aus der Datenmatrix. Sie müssen die Daten zuvor schon weiterverarbeitet haben, indem Sie
z.B. die Häufigkeiten der einzelnen Werte oder die Durchschnittswerte mehrerer Variablen errechnen lassen. Liniendiagramme können Sie hingegen in einigen Fällen auch aus den Rohdaten erstellen.
Für das unten stehende Kreisdiagramm haben wir dementsprechend die Häufigkeiten der verschiedenen genannten Schulformen anzeigen lassen (siehe Kapitel 4.3 Häufigkeiten).
Wenn die Zeilenbeschriftungen links von den Daten und die Spaltenbeschriftungen über den Daten
stehen, wird Ihnen Excel i.d.R. automatisch ein passendes Diagramm erzeugen. Dazu wählen Sie in
der Registerkarte Einfügen in der Gruppe Diagramme Ihren gewünschten Diagrammtyp aus.
Sie können die konkrete Gestaltung eines Diagramms nach dem Einfügen verändern. Die obige Darstellungsvariante erhalten Sie, indem Sie das Diagramm anklicken und unter Diagrammtools in der
Registerkarte Entwurf in die Gruppe Layouts gehen. Dort haben Sie verschiedene Optionen Ihr Diagramm zu gestalten, einzelne Bereiche der Grafik hervorzuheben usw. Auch hier gilt: Probieren Sie
die verschiedenen Darstellungsvarianten einfach einmal aus.
Arbeitsstelle WAS
Stand September 2015
13
Mit dem oben ebenfalls
markierten Befehl Daten
auswählen können Sie bei
Bedarf die Datenbezüge
Ihres Diagramms verändern. Es öffnet sich folgendes Dialogfeld:
Die Beschriftung als Legendeneinträge und Horizontale Achsenbeschriftung ist zunächst kontraintuitiv. Wenn Sie unter Legendeneinträge auf Bearbeiten klicken, können Sie Namen und Bezüge Ihres
Diagramms festlegen und verändern.
Als Reihenname definieren Sie den Namen der Datenreihe. Als Reihenwerte benennen Sie den Bereich von Daten, der hier abgebildet werden soll, also im obigen Beispiel den Bereich von C8 bis C11.
Die Benennungen Ihrer Werte (hier die Schulformen 1-4) verändern Sie, indem Sie die Horizontale
Achsenbeschriftung bearbeiten und analog die Bezugsreihe verändern.
Wenn sich Kreisdiagramme vor allem eignen, um relative Häufigkeiten abzubilden, so können Sie mit
Balken- und Stabdiagrammen in erster Linie absolute Häufigkeiten abbilden:
Das Einfügen und die Auswahl der Bezugsdaten folgt der gleichen Systematik, wie bei der Erstellung
von Kreisdiagrammen.
Arbeitsstelle WAS
Stand September 2015
14
Mit dem Liniendiagramm lassen sich u.U.
Hypothesen über Zusammenhänge zwischen Variablen sichtbar machen.
Für alle Diagramme gilt: Achten Sie darauf,
dass Sie diese präzise beschriften, einen
aussagekräftigen Titel wählen und angeben, wie viele Fälle jeweils dargestellt sind
(n).
Arbeitsstelle WAS
Stand September 2015
15
Zugehörige Unterlagen
Herunterladen