Übungsaufgaben 05.01.2016 -Einfaktorielle Varianzanalyse- 1. Was macht eine einfaktorielle Varianzanalyse? Sie untersucht den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägung einer Zufallsvariablen. Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen. Man vergleicht folglich die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen. Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse. 2. Welche Voraussetzungen müssen für eine einfaktorielle Varianzanalyse gegeben sein? Die Fehlerkomponenten müssen normalverteilt sein (Fehlerkomponenten bezeichnen die jeweiligen Varianzen (Gesamtvarianz, Fehlervarianz, etc.). Die Gültigkeit dieser Voraussetzung ist gegeben, wenn davon ausgegangen werden kann, dass die Ausprägung in der Grundgesamtheit normalverteilt ist.) Homoskedastizität muss gegeben sein. (Die Fehlervarianzen müssen zwischen den Gruppen (also den k Faktorstufen) gleich bzw. homogen sein) Die Messwerte bzw. Faktorstufen müssen unabhängig voneinander sein. 3. Bitte beschriften Sie den Output einer einfaktoriellen Varianzanalyse und erklären Sie kurz, was dargestellt wird, welche Bereiche besonders interessant für uns sind. a) Obere Tabelle: Levenetest für Varianzhomogenität Wichtige Spalte: „Sig.“ → denn hier lässt sich das Ergebnis des Levenetests ablesen Ergebnis = 0.913 also größer als 0,05 und folglich nicht signifikant d.h. dass kein signifikanter Unterschied zwischen den Varianzen der Gruppen besteht (sie sind homogen) folglich darf die ANOVA durchgeführt werden b) Untere Tabelle: Ergebnis der ANOVA Wichtige Zeile: „Zwischen den Gruppen“, Wichtige Spalte „Sig.“ → denn hier lässt sich das Ergebnis der Varianzanalyse ablesen Ergebnis = 0,025 also kleiner als 0,05 und folglich signifikant d.h. dass es einen signifikanten Unterschied zwischen den getesteten Gruppen gibt c) Gibt es einen signifikanten Unterschied bei der Platzierung des Saufranges des Speichers zwischen den verschiedenen Altersgruppen? Altersgruppe 1: 0-20 Altersgruppe 2:21-24 Altersgruppe 3: ≥25 Variable Alter neu berechnen (alle Fälle mit einschließen) AnalysierenMittelwerte vergleicheneinfaktorielle Varianzanalyse Option: Häkchen bei deskriptive Statistik und Test auf Homogenität der Varianzen post-hoc Scheffé ONEWAY deskriptive Statistiken Saufrang_Speicher 95%-Konfidenzintervall für den Mittelwert Standardabwe Standardfehle N Mittelwert ichung r Untergrenze Obergrenze Minimum Maximum 1,00 13 6,2308 1,09193 ,30285 5,5709 6,8906 5,00 8,00 2,00 15 3,9333 2,93906 ,75886 2,3057 5,5609 1,00 8,00 3,00 5 5,4000 1,14018 ,50990 3,9843 6,8157 4,00 7,00 33 5,0606 2,35769 ,41042 4,2246 5,8966 1,00 8,00 Gesamt Test der Homogenität der Varianzen Saufrang_Speicher Levene-Statistik df1 14,773 df2 2 Signifikanz 30 ,000 Einfaktorielle ANOVA Saufrang_Speicher Mittel der Quadratsumme df Quadrate Zwischen den Gruppen 37,438 2 18,719 Innerhalb der Gruppen 140,441 30 4,681 Gesamt 177,879 32 F 3,999 Signifikanz ,029 Mehrfachvergleiche Abhängige Variable: Saufrang_Speicher Scheffé-Prozedur 95%-Konfidenzintervall Mittlere (I) Alter (J) Alter 1,00 2,00 2,29744* ,81988 ,031 ,1861 4,4088 3,00 ,83077 1,13859 ,768 -2,1013 3,7629 1,00 -2,29744* ,81988 ,031 -4,4088 -,1861 3,00 -1,46667 1,11730 ,433 -4,3439 1,4106 1,00 -,83077 1,13859 ,768 -3,7629 2,1013 2,00 1,46667 1,11730 ,433 -1,4106 4,3439 2,00 3,00 Differenz (I-J) Standardfehler Signifikanz Untergrenze Obergrenze *. Die Differenz der Mittelwerte ist auf dem Niveau 0.05 signifikant. a) Gibt es ein signifikantes Ergebnis? Wenn ja zwischen welchen Gruppen gibt es einen signifikanten Unterschied? Nach der Scheffé Prozedur post hoc gibt es einen signifikanten Unterschied zwischen der Altersgruppe 1 und der Altersgruppe 2 b) Ist die Varianzhomogenität gegeben? (abzulesen bei der Signifikanz/p-Wert im Levene-Testbei einem nicht signifikanten Ergebnis ist die Varianzhomogenität gegeben) Die Varianzhomogenität ist hier nicht gegeben c) Welchen Aussagen kannst du zu dieser ANOVA treffen? Es gibt zwar signifikante Ergebnisse, aber die Vorrausetzung der Varianzhomogenität ist in der Stichprobe nicht gegeben (die Stichprobe ist wahrscheinlich zu klein), deshalb darf man das Ergebnis nicht direkt als signifikant richtigen Unterschied interpretieren. d) Gibt es einen signifikanten Unterschied zwischen Männer und Frauen bei der Platzierung des Saufranges von der Karibikbar? a. Rechne es zuerst mit einem t-Test. unabhängiger t-Test Mittelwert Frauen: 2,5 Mittelwert Männer: 2,25 F=,093 Signifikanz=,763 Varianzen sind gleich, homogen T-Wert:,388 Signifikanz=,701 kein signifikanter Unterschied b. Rechne es mit einer einfaktoriellen Varianzanalyse. Mittelwert Frauen: 2,5 Mittelwert Männer: 2,25 Test der Homogenität der Varianzen Saufrang_Karibikbar Levene-Statistik ,093 df1 df2 1 Signifikanz 30 ,763 Varianzhomogenität ist gegeben. Signifikianz=,701 nicht signifikant Keine Post-hoc Tests möglich, da weniger als drei Gruppen vorhanden sind c. Vergleiche die Werte. Was unterscheidet die Varianzanalyse von den tTests? Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests im Falle von mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test. e) Was unterscheidet eine einfaktorielle von einer mehrfaktoriellen Varianzanalyse? Die mehrfaktorielle Varianzanalyse berücksichtigt mehr als einen Faktor zur Aufklärung der Zielvariablen, während die einfaktorielle nur einen berücksichtigt. Ein Beispiel für eine mehrfaktorielle Varianzanalyse wäre eine Untersuchung bei der festgestellt werden soll, welchen Einfluss Kaffee und Rauchen auf die Nervosität darstellen. Kaffee ist hier Faktor 1 und Rauchen Faktor 2.