Institut für Statistik, Universität Innsbruck Sommersemester 2006 Ass.Prof. Dr.Christian Traweger Universität Innsbruck Sozialwissenschaftliche Methodengruppe Institut für Politikwissenschaft [email protected] Semesterübersicht SS 2006 1. Block 30.3. 10.00-12.30 Uhr X X X Vorbesprechung, Gruppeneinteilung, Referate Grundlagen der emp. Sozialforschung Einführung in SPSS, Häufigkeiten 2. Block 27.4. 10.00-12.30 Uhr 1 2 3 Technische Erörterungen zu SPSS Masszahlen der Lage und der Streuung Chiquadratunabhängigkeitstest, Kontingenztabellen 3. Block 18.5. 10.00-12.30 Uhr 4 6 Nichtparametrische Tests für ordinale Merkmale (Mann-Whitney U-Test) Nichtparametrische Tests für ordinale Merkmale (Kruskal Wallis Test) Einfaktorielle Varianzanalyse 5 4. Block 1.6. 10.00-12.30 Uhr 7 8 X Einfache lineare Regression (R2) Streudiagramm, Korrelationskoeffizient Stoffwiederholung, Klausurvorbereitung 5. Block 8.6. 10.00-12.30 Uhr X Schlussklausur ( 2 Gruppen x á 45 Min) 6.Block 22.6. 11-13.30 Uhr X Klausurbesprechung (bei Bedarf, wird noch bekanntgegeben) Die Lehrinhalte sind dem Buch: Statistik – Der Weg zur Datenanalyse, Fahrmeir, Künstler, et al. zu entnehmen. 2 Grundlagen der empirischen Sozialforschung Problemformulierung Bestimmung der Erhebungsmethode Fragebogenerstellung Stichprobenplanung/-größe Datenerhebung Prüfung auf Plausibilität bzw. Interviewerkontrolle Prüfung auf Repräsentativität Datenanalyse und Auswertung Ergebnisbericht Interpretation und Umsetzung der Ergebnisse 3 PROBLEMFORMULIERUNG: Im ersten Stadium soll festgelegt werden, was recherchiert, analysiert bzw. erhoben werden soll (Projekterfassung). Ziel dieser Phase ist es, ein klares und verständliches Bild dessen zu erhalten, was letztendlich abgefragt werden soll. Was sind die Ziele ? Ist das gewünschte Instrument (Befragung,...) dazu geeignet ? BESTIMMUNG DER ERHEBUNGSMETHODE: Welche Erhebungsmethode im einzelnen gewählt wird, richtet sich natürlich nach dem jeweiligen Untersuchungsanliegen und hier speziell danach, ob und wie der Informationsbedarf am ergiebigsten, ökonomischsten und/ oder schnellsten durch eine Erhebung gedeckt werden kann. Einen wesentlichen Einflußfaktor auf die Bestimmung der Erhebungsmethode bildet das zur Verfügung stehende Budget. Grundsätzlich unterscheidet man 3 Arten von Interviews: - Persönliches Interview (Vorteile: Einfache Abwicklung, hohe Erfolgsquote, unbeschränkte Thematik, kontrollierte Befragungssituation; Nachteile: große Feldorganisation, hohe Kosten, Interviewereinfluß) - Schriftliches Interview (Vorteile: keine Feldorganisation, geringe Kosten, räumliche Entfernungen sind unerheblich, völlige Anonymität; Nachteile: Rücklaufquote, ungeregelte Befragungs- situation, längerer Durchführungszeitraum) - Telephoninterview (Vorteile: geringe Feldorganisation, rasche Durchführbarkeit; Nachteile: eingeschränkter Frageumfang und Thematik) Der Trend geht immer mehr zu Telefoninterviews. (CATI=Computer Assisted Telephone Interviews). Dabei werden die Interviews in Telefonlabors durchgeführt, im Rahmen der Stichprobenplanung werden die anzurufenden Personen ausgewählt, die Telefonverbindung wird entweder manuell oder direkt vom Computer hergestellt und der Interviewer liest den Fragebogen vom Bildschirm ab und kodiert die Ergebnisse sofort in den Computer. Der letzte technische Stand ist CI (=Computerinterviewing, dabei führt ein Sprachcomputer das Interview durch) und Befragungen über Internet (Repräsentativität ?) 4 FRAGEBOGENERSTELLUNG: Es gibt: - offene Fragestellungen: jede Antwort ist denkbar; Gruppenbildung für Auswertung; Vorsicht: nicht zu viele, da keine statistischen Tests durchgeführt werden können!! - geschlossene Fragestellungen: - dichotome Fragen: zwei Antworten zur Auswahl z.B: Waren Sie heuer auf Sommerurlaub? Ja Nein - Multiple choice, Alternativfragen: drei oder mehr Alternativen stehen zur Auswahl, entweder 1 oder mehrere Antwortmöglichkeiten z.B: Woher beziehen Sie die Infos´s zu ihrem Urlaub? (max.2 Antwortmöglk.) Reiseführer/ Katalog durch Reisebüroangestellte über Bekannte/ Freunde andere Infos über´s Internet/ TV - Likert-Skala: eine Aussage, mit der die Befragten den Grad ihrer Zustimmung bzw. Ablehnung angeben können. z.B: Urlaubsbuchungen über das Reisebüro bieten im allgemeinen mehr Sicherheit. Stimme ich Stimme ich UnentStimme Stimme ich überhaupt nicht zu nicht zu schieden ich zu voll zu - Semantisches Differential: Bipolare Skala mit adjektivischen Gegensatzpaaren. Der Befragte sucht sich eine Stelle aus, die tendenziell oder graduell seine Meinung anzeigt. (!! Auswertung nicht eindeutig, Verwendung mehr in Psychologischen Bereichen!!) z.B: Das Hotel ist: modern ------------- altmodisch - Beurteilungsskala: vorgegebene Beurteilungswerte z.B: Wie beurteilen Sie die Möglichkeit, dass man Urlaube bereits im Internet buchen kann? sehr gut gut mittelmäßig schlecht sehr schlecht 5 Finden sich im Fragebogen sogenannte "Antwortbatterien", das heißt, viele Fragen mit den gleichen Antwortmöglichkeiten hintereinander (z.B. Einstellungs-, Polaritätsprofile), dann kann beim Interviewten ein Drang und "Zwang" nach Vollständigkeit beim Beantworten entstehen, der in der Folge leicht zu willkürlichen Angaben führt. Skalierungen: Im Rahmen der Fragebogenerstellung sollte man sich bereits Gedanken über die verschiedenen Skalierungen zu machen: - nominal (z.B.: Haarfarbe, ja/nein-Fragen, Codierung spielt keine Rolle) - ordinal (es liegt eine Ordnung vor, z.B.: Schulnoten, Beurteilungen,...) - metrisch bzw. quantitativ (Intervallskala, Verhältnisskala, z.B.: Gewicht, Alter, Einkommen - nicht gruppiert) 6 STICHPROBENPLANUNG: Eine Stichprobe ist ein Teil der Grundgesamtheit (z.B.: Tiroler Bevölkerung). Damit die Ergebnisse der Erhebung auf die Grundgesamtheit bezogen werden können (repräsentativ sind), muß die Stichprobe, hinsichtlich verschiedener Merkmale, ein genaues Abbild der Grundgesamtheit sein. (verkleinert aber wirklichkeitsgetreu) Wie wählt man nun einen bestimmten Teil der Grundgesamtheit aus ? Man unterscheidet : - Systematische Verfahren: - Quotenverfahren - systematische Auswahl - Zufallsstichprobe: - Einfache Zufallsstichprobe - geschichtete Zufallsstichprobe - Klumpenstichprobe Quotenauswahl: Verteilung der Merkmalsausprägungen wird gezielt erreicht z.B. Gesamtzahl der Interviews: 10 Stadtteil: A 5 B 3 C 2 Geschlecht: männl. 6 Weibl. 4 Alter: 18- 30J 3 31- 50 J 4 über 50J 3 Beruf: Arbeiter/Angest. 2 Jahreseinkommen: - 15.000 Beamter/VB 1 15.001- 30.000 Selbst. 1 über 30.000 Hausf/-m 2 Pension 2 Ausbildg 1 Sonstiges(K/AL) 1 3 5 2 7 systematische Auswahl: typische Auswahl (!!ist kein methodisch gesichertes, den Repräsentationsschluß ermöglichendes Verfahren!!) Man greift nach freiem Ermessen solche Elemente aus der Grundgesamtheit heraus, die als besonders charakteristisch und typisch erachtet werden und schließt von den erzielten Ergebnissen entsprechend auf die Grundgesamtheit. (Welche Elemente sind typisch?; in welchem Umfang kann verallgemeinert werden???) Einfache Zufallsstichprobe: (Urnenmodell) Die Elemente, die in das Stichprobensample eingehen, werden unmittelbar aus der Grundgesamtheit gezogen. Voraussetzung: Vollständigkeit der Grundgesamtheit, gleiche Auswahlchance. - Systematische Zufallsauswahl: Startpunkt t, s = N/ n - Schlussziffernverfahren: aus durchnummerierten Datei werden jene Elemente mit best. Schlußziffer genommen - Buchstabenauswahl: Stichprobe = all jene Elemente, deren Nachname best. Anfangsbuchstaben hat Geschichtete Zufallsstichprobe: Grundgesamtheit wird in mehrere Untergruppen (Schichten) aufgeteilt, aus denen dann jeweils die, in die Gesamtstichprobe eingehenden Elemente, mittels eines reinen Zufallsverfahrens ausgewählt werden. z.B: nach Altersgruppen Klumpenauswahl: Grundgesamtheit wird in Klumpen (Flächen) unterteilt und dann wird rein zufällig eine bestimmte Zahl dieser Klumpen ausgewählt und mit allen ihren Elementen in das Sample einbezogen. Nicht einzelne Elemente, sondern ganze Gruppen bilden die Auswahleinheit – !! die Grundgesamtheit muß vollständig vorliegen. z.B: (Städteplanung) Planquadrate eines Stadtplans, oder Häuserblocks ( Die gezogenen Klumpen gehen entweder als Gesamtheit in die Stichprobe ein, oder es werden aus ihnen wiederum Teilstichproben nach einfacher Zufallsauswahl gezogen) Als ein besonders verbreitetes Beispiel für ein mehrstufig geschichtetes Auswahlverfahren wird der folgende Musterstichprobenplan (mit 3 Auswahlstufen), 8 der von zahlreichen führenden Marktforschungsinstituten für repräsentative Bevölkerungsumfragen entwickelt wurde, angeführt: 1) Auswahl von sample-points: Dabei erfolgt ein sogenanntes area sampling, das heißt es werden im Rahmen einer Zufallsauswahl Gemeinden oder Bezirke ausgewählt. 2) Auswahl von Haushalten in den gezogenen sample-points (Zufällige Auswahl der Haushalte aus Adressenlisten oder Telefonbüchern) 3) Auswahl der Zielpersonen in den gezogenen Haushalten (z.B.: Auswahl der Person fortlaufend nach dem Alter oder Vornamensalphabetisch) Eine wesentliche Bedingung für die Durchführung einer Zufallsauswahl ist, daß das „Personenmaterial“ vollständig katalogisiert sein muß: „Jedes Element muß die gleiche Chance haben ausgewählt zu werden“. (Beginn der Auswahl über eine Zufallszahl). Die Größe der Stichprobe ist meist aus finanziellen Überlegungen determiniert. Ein wesentlicher Indikator zur Bestimmung der Größe der Stichprobe ist jedoch der Stichprobenfehler: Das heißt, wie exakt sind die Ergebnisse bzw. wie exakt sollen die Ergebnisse sein ? (Nicht zu verwechseln mit der Repräsentativität !!!) (Totalerhebung) Vollerhebung vs. Teilerhebung Stichprobenfehler: da man noch keine Ergebnisse vorliegen hat, geht man von einem Antwortverhalten 50:50 aus. („ungünstigster Fall“) Stichprobenfehler e = 1,96 2 p (1 p) n p = Anteile in % z.B: Umfrage in Innsbruck; N=300 Wie groß ist Stichprobenfehler? +/-......% Stichprobenumfang: 9 Der Marktforscher weiß von den Umständen der jeweiligen Aufgabenstellung her und in Abstimmung mit dem jeweiligen Auftraggeber....... - wie genau das Stichprobenergebnis sein muß (Intervall) - mit welcher Sicherheit diese Aussage getroffen werden soll (95% Sicherheit.) n = 1,962 . p (1 p) e2 n......Stichprobenumfang p......Anteil der Befragten, die eine best.Antwort gaben e......Stichprobenfehler, Schwankungsbreite z.B. Umfrage Innsbruck: Wie groß muss Stichprobe sein, bei e = +/-5,6% 10 Die anschließende Tabelle gibt Aufschluß über den Stichprobenfehler bei unterschiedlichen Stichprobenumfängen und Anteilen: (ohne Endlichkeitskorrektur, nur für große Grundgesamtheiten) p........Anteil (Soviele Prozent geben eine bestimmte Antwort) n........Stichprobenumfang Stichprobenfehler in % Anteile in % 10 / 90 15 / 85 20 / 80 25 / 75 30 / 70 35 / 65 40 / 60 45 / 55 50/50 =0,1 =0,15 =0,2 =0,25 =0,3 =0,35 =0,4 =0,45 =0,5 n= 100 200 300 400 500 600 700 800 900 1000 1500 2000 2500 3000 5,88% 4,16% 3,39% 2,94% 2,63% 2,40% 2,22% 2,08% 1,96% 1,86% 1,52% 1,31% 1,18% 1,07% 7,00% 4,95% 4,04% 3,50% 3,13% 2,86% 2,65% 2,47% 2,33% 2,21% 1,81% 1,56% 1,40% 1,28% Stichprobenfehler = 7,84% 5,54% 4,53% 3,92% 3,51% 3,20% 2,96% 2,77% 2,61% 2,48% 2,02% 1,75% 1,57% 1,43% 8,49% 6,00% 4,90% 4,24% 3,80% 3,46% 3,21% 3,00% 2,83% 2,68% 2,19% 1,90% 1,70% 1,55% 8,98% 6,35% 5,19% 4,49% 4,02% 3,67% 3,39% 3,18% 2,99% 2,84% 2,32% 2,01% 1,80% 1,64% 1,96 2 p (1 p) n 9,35% 6,61% 5,40% 4,67% 4,18% 3,82% 3,53% 3,31% 3,12% 2,96% 2,41% 2,09% 1,87% 1,71% 9,60% 6,79% 5,54% 4,80% 4,29% 3,92% 3,63% 3,39% 3,20% 3,04% 2,48% 2,15% 1,92% 1,75% 9,75% 6,89% 5,63% 4,88% 4,36% 3,98% 3,69% 3,45% 3,25% 3,08% 2,52% 2,18% 1,95% 1,78% 9,80% 6,93% 5,66% 4,90% 4,38% 4,00% 3,70% 3,46% 3,27% 3,10% 2,53% 2,19% 1,96% 1,79% p = Anteile in % Beispiel: Bei einer Umfrage unter 500 Innsbruckern geben rund 30% an, daß sie ihren Sommerurlaub "last minute" buchen. Man kann nun behaupten, daß der tatsächliche Anteil jener Personen, die "last minute" ihren Sommerurlaub buchen, mit einer Wahrscheinlichkeit von 95%, zwischen 26% und 34% liegt (=+- 4,02%). Beträgt der Stichprobenumfang mehr als 5% der Grundgesamtheit, so wird die Schwankungsbreite mit Hilfe der Endlichkeitskorrektur (EK) berechnet StichprobenfehlerEK = 1,96 2 p (1 p ) ( N n) n ( N 1) p = Anteile in %, N = Grundgesamtheit 11 DATENERHEBUNG: In dieser Phase werden nun die Interviews - persönlich - telefonisch durch geschulte Interviewer - oder postalisch durchgeführt. Dieser Abschnitt wird auch als Feldarbeit bezeichnet. Werden mehrer Auftraggeber in einer Umfrage mit verschiedenen Themen zusammengefasst, so spricht man von ein OMNIBUSUMFRAGE. PRÜFUNG AUF PLAUSIBILITÄT bzw. INTERVIEWERKONTROLLEN: Dies ist sowohl eine visuelle wie auch computergestützte Kontrolle der erhobenen Interviews. Dabei handelt es sich einerseits um einen Vergleich von eingebauten Kontrollfragen (z.B.: Haushaltstyp, Haushaltsgröße, Familienstand, Kinder,...) bis hin zur direkten Kontaktaufnahme der interviewten Person und Befragung zur Interviewdurchführung und zum Verhalten des Interviewers. In modernen Interviewcallcenters wird diese Überprüfung unter anderem auf die entsprechende Telefonsoftware ausgeweitet, wo alle Interviews (=Gespräche) hinsichtlich ihrer Dauer und Rufnummer genau aufgezeichnet werden. (Nur zur internen Kontrolle, DATENSCHUTZ!!) PRÜFUNG AUF REPRÄSENTATIVITÄT: Ziel einer repräsentativen Umfrage ist es, ein möglichst exaktes Abbild der zu befragenden Bevölkerung zu erhalten: (z.B.: bei politischen Umfragen ein Abbild der wahlberechtigten Bevölkerung). Anders ausgedrückt: die Untersuchung soll Aufschlüsse über die Grundgesamtheit bringen und um dies zu erreichen muß aus dem Ergebnis der Teilerhebung möglichst sicher und exakt auf die Verhältnisse der Gesamtmasse geschlossen werden können. Die Grundgesamtheit soll sich also in Bezug auf verschiedene Merkmale in der Stichprobe wiederfinden. In der Regel wird die Repräsentativität in Bezug auf die Merkmale Geschlecht, Alter und Bildung überprüft. 12 DATENANALYSE UND AUSWERTUNG: Bei der Datenanalyse ist auf das vorliegende Skalenniveau zu achten; dementsprechend werden Modus, Median oder Mittelwert zur Interpretation verwendet. Bei den durchzuführenden Testverfahren ist ebenfalls auf diese Unterscheidung zu achten. Welche Maßzahlen und Graphiken sinnvoll sind richtet sich nach dem Variablentyp bzw. dem Skalenniveau: Variablentyp Nominal Ordinal Metrisch Maßzahlen Häufigkeitstabelle, Modus Häufigkeitstabelle, Modus, Median, Quantile Min., Max., Median, Mittelwert, Std.Dev., Std. Err.; Graphische Darstellung Balken-/Kreisdiagramm Balkendiagramm Kreisdiagramm Boxplots Histogramm,.... Hinsichtlich graphischer Aufbereitung von Daten sind dem Marktforscher nahezu keine Grenzen gesetzt; obenstehende Tabelle erhebt keinen Anspruch auf Vollständigkeit sondern dient lediglich als ein möglicher Leitfaden. So wie an dieser Stelle im Rahmen der deskriptiven Statistik die einzelnen Maßzahlen nach Variablentypen unterschieden werden, so müssen bei der bivariaten statistischen Analyse (Sommersemester) auch die unterschiedlichen Testverfahren berücksichtigt werden. ERGEBNISBERICHT: Der Ergebnisbericht sollte die Auswertung (tabellarisch, graphisch und verbal) jeder einzelnen Frage beinhalten. In weiterer Folge sollen bei jeder Fragestellung zu interessierende Hypothesen überprüft werden. INTERPRETATION UND UMSETZUNG DER ERGEBNISSE: In dieser Phase sollten mit dem Auftraggeber noch die Ergebnisse der Erhebung analysiert werden und eventuell eine schriftliche Kurzfassung der wesentlichen Ergebnisse erfolgen. Bei der Hilfe zur Umsetzung empfiehlt sich eine interdis-ziplinäre Zusammenarbeit mit entsprechenden Fachleuten. 13 Deskriptive Statistik: Häufigkeitsverteilungen: Beispiel: Schulnoten bei 24 Schülern Note: xi (absolute hi (relative Häufigkeit) Häufigkeit) Hi (kumulierte Häufigkeit) 1 2 8,3 8,3 2 4 16,7 25,0 3 9 37,5 62,5 4 6 25,0 87,5 5 3 12,5 100,0 Summe 24 100,0 Berechnung der relativen Häufigkeit: Berechnung von h2 = (x2/N)*100 = 16,7 % Berechnung der kumulierten Häufigkeiten: Berechnung von %H3 = h1 + h2 + h3 = 8,3 + 16,7 + 37,5 = 62,5 % Die Verteilungskurve ergibt sich aus: Ausgangshistogramm Kurvenpolygon in Histogramm eintragen Glätten des Kurvenpolygons Dichtekurve 14 Statistische Maßzahlen: Modus: xModus hi max Definition: Der Modus ist der häufigste Wert der absoluten (Mess)-werte Arithmetisches Mittel : x 1 N * xi N i 1 Def: Der Mittelwert (Mean; arithm. Mittel) ist die Summe aller Messwerte, geteilt durch ihre Anzahl. Exkurs : arithmetisches Mittel bei vorgegebenen Klassenbreiten: x 1 k * xi * xmi N i 1 Bsp: Klasse 1 2 3 4 x IQ-Intervall 80 – 100 101 – 121 122 – 142 143 – 163 Klassenmitte xmi 90 111 132 153 xi 4 9 9 3 Σ= 25 xi xmi 360 999 1188 459 Σ= 3006 1 k * xi * xmi = 1/25 * 3006 = 120,24 N i 1 Geometrisches Mittel: xG = n x1 * ......xn xi > 0 !!!!! Def: Verwendung bei prozentualen Wachstums- und Abnahmeprozessen. z.B. bei Firmenumsätzen der durchschnittliche Verlauf über Jahre: Die Steigerung des Umsatzes von Jahr 1 zu Jahr 2 beträgt: 2% Die Steigerung des Umsatzes von Jahr 2 zu Jahr 3 beträgt: 18% WICHTIG: Man muß mit den Wachstumsfaktoren (1,02 bzw. 1,18) rechnen und nicht mit den Wachstumsraten 2% bzw. 18%. xG = 1,02 *1,18 = 1,097 ; d.h. 9,7% mittlere Umsatzsteigerung. 15 Harmonisches Mittel: xH = n 1 1 ..... xi xn z.B.: Ein Anleger kauft an zwei Tagen Wertpapiere für je 22.000,-€. Einmal zum Kurs von 110,-€ und einmal zum Kurs von 100,-€. Zu welchem Durchschnittskurs wurden die Wertpapiere gekauft. xH = 44000 = 104,76 (= durchschnittlicher Kurs) 22000 22000 110 100 Median : n ist ungerade: z x( n 1) / 2 n ist gerade: z xn / 2 x( n / 2)1 2 Def: Der Median ist derjenige Punkt der Messwertskala, unterhalb und oberhalb dessen jeweils die Hälfte der Messwerte liegen. Quantile: In der Praxis werden meist spezielle Quantile verwendet: Quartile: Einteilung in vier Abschnitte zu je 25% Dezile: Einteilung in 10 Abschnitte zu je 10% Perzentile: Einteilung in 100 Abschnitte zu je 1% Die besonders häufig verwendeten Quartile sind: Q1 : 1.Quartil = x 0,25 Q2 : 2.Quartil = x 0,5 = z (Zentralwert) =Median Q3 : 3.Quartil = x 0,75 Mit Hilfe der Werte min, Q1, z, Q3, max. lässt sich ein Box-Plot-Diagramm zeichnen, das einen guten Einblick über die Verteilung der Daten gibt. 16 1 k * ( xi x ) 2 N i 1 Varianz der Stichprobe: s2 = Empirische Varianz: s2 = k 1 * ( xi x ) 2 N 1 i 1 Def: Varianz s2 von N- Messwerten xi ist definiert als die Summe der quadrierten Differenzen (xi - x ) dividiert durch ihre Anzahl. Standardabweichung: s = s 2 Def: Die Standardabweichung s ist definiert als Quadratwurzel aus der Varianz. Normalverteilung: Messwertverteilung unter der Glockenkurve x ±s = ca. 68% der Meßwerte x ±2s = ca. 95% der Meßwerte x ±3s = ca. 99,7% der Meßwerte Standardfehler des Mittelwertes: sx = s N Mit einer Wahrscheinlichkeit von 95% liegt der wahre Mittelwert in einem Intervall von x ± 2 s x . Variationskoeffizient: VK = s 100 % x Def: Der Variationskoeffizient ist ein Maß, inwieweit die Verteilung homogen ist. Bei einem Variationskoeffizient von über 50% ist die Verteilung so inhomogen, dass man den Mittelwert als Maßzahl besser nicht verwendet. 17 Grafische Darstellungen von Verteilungen Boxplot 1600,00 ek 1400,00 1200,00 1000,00 Die Fünf-Punkte Zusammenfassung einer metrischen Verteilung führt zur komprimierten Visualisierung einer Verteilung durch den Box-Plot. Es lässt sich schnell ein Eindruck darüber gewinnen, ob die Beobachtungen z.B. annähernd symmetrisch sind, oder ob Ausreißer in dem Datensatz auftreten. Der Box-Plot besteht aus: - x0,25 = Anfang der Schachtel ("box") - x0,75 = Ende der Schachtel - Der Median wird durch einen Punkt oder eine Linie in der Box markiert - Zwei Linien "whiskers" außerhalb der Box gehen bis zu xmin und xmax, 18 Der modifizierte Box-Plot berücksichtigt etwaige Ausreißer, die unterhalb bzw. überhalb der bestimmter Grenzen liegen, quasi außerhalb der Zäune (zu und zo) sich befinden. Zur Berechnung der Zäune benötigt man den Interquartilsabstand: (dQ = x0,75 - x0,25 ) Die oberen und unteren Grenzen für Ausreißer errechnen sich aus: zu = x0,25 – 1,5* dQ zo = x0,75 + 1,5* dQ Auf diese Weise werden die sogenannten Ausreißer, außerhalb der Zäune im Box-Plot markiert. 19 weitere grafische Darstellungsmöglichkeiten: Ballbesuch Ballsaison 02/03 4,2 ja nein vielleicht 32,8 63,0 IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5% Ballbesuch Ballsaison 02/03 vielleicht 4,2% ja 32,8% nein 63,0% IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5% Ballbesuch Ballsaison 02/03 vielleicht 4,2% ja 32,8% nein 63,0% IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5% 20 Ballbesuch Ballsaison 02/03 Vielleicht 4,2% Ja 32,8% Nein 63,0% 21 Statistisches Testen: Mit Hilfe statistischer Tests überprüft u.a. ob zwischen Gruppen wie z.B. Männer und Frauen im Antwortverhalten auf eine zu untersuchende Fragestellung hin statistisch signifikante Unterschiede bestehen, oder ob zwischen zwei Variablen (Fragestellungen) Zusammenhänge existieren. Folgende Tabelle zeigt eine Auswahl statistischer Tests zur Überprüfung von Unterschieden zwischen Gruppen und zur Überprüfung von Zusammenhängen zwischen Variablen bzw. Fragestellungen: Skalierung Unterschiedsverfahren Zusammenhangsverfahren Nominal Chiquadrattest Kontingenzkoeffizient Ordinal N=2 Stichproben: Mann Whitney U-Test Rangkorrelationskoeffizient nach Spearman n>2 Stichproben: Kruskal-Wallis Test Metrisch Varianzanalyse; Voraussetzungen zur Durchführung: Normalverteilung Varianzhomogenität Korrelationskoeffizient nach Pearson 22 Hypothesenformulierung: Im Rahmen der bivariaten Analyse stellt sich die Frage durch welche demographischen Merkmale die Antworten besonders beeinflußt werden. Unterscheiden sich z.B.: Männer und Frauen im Hinblick auf ihren Wunschurlaub. Dabei interessiert man sich nicht nur für die Unterschiede in der Stichprobe, sondern man will prüfen, ob die in der Stichprobe festgestellten Unterschiede auch für die Grundgesamtheit Gültigkeit haben. Man kann also über die Grundgesamtheit nur Vermutungen anstellen. Dieses Vermutungen bezeichnet man als Hypothesen. Es gibt zwei Arten von Hypothesen: - Nullhypothese: H0 - Alternativhypothese: H1 Im Rahmen der Nullhypothese vermutet man, daß z.B. zwischen Männern und Frauen kein (=Null) Meinungsunterschied besteht und als Alternativhypothese nimmt man an, daß dieser Unterschied gegeben ist. Die Ergebnisse der Stichprobe der Befragten dienen dazu, sich für eine der beiden Hypothesen zu entscheiden. Bei der Entscheidung für die Alternativhypothese möchte man möglichst sicher sein; d.h. man möchte sich bei der Entscheidung für die Alternativhypothese "möglichst wenig irren". Diese Wahrscheinlichkeit, dass man sich irrt und die Alternativhypothese 23 gewählt hat, obwohl in der Realität (bezogen auf die Grundgesamtheit) doch die Nullhypothese zutrifft, bezeichnet man als Irrtumswahrscheinlichkeit. Diese wird von den meisten StatistikSoftware-Produkten exakt berechnet. Das gängigste Verfahren dazu sind die Signifikanztests. Zur Überprüfung der Hyppothesen kann folgendes Schema herangezogen werden: In der Grundgesamtheit gilt H0 H1 H0 richtig Entsch. Beta-Fehler Entscheidung auf Grund der Stichprobe zugunsten der: H1 Alpha-Fehler richtige Entsch. Als Signifikanzniveau wird in der klassischen Statistik ein =0.05 herangezogen, das heißt: beträgt das errechnete Signifikanzniveau 0.05, dann wird die Nullhypothese verworfen. Dieses Alpha bezeichnet man auch als Irrtumswahrscheinlichkeit. 24 Unterschiedsverfahren: Der Chiquadrattest: Mit Hilfe der Chiquadrattests untersucht man, ob bei nominalen Variablen Unterschiede zwischen Stichproben bestehen. Der Chiquadratwert nach Pearson wird nach folgender Formel berechnet: n 2 i 1 (O E ) 2 E O....... sind die beobachteten Häufigkeiten (=observed values) E....... sind die erwarteten Häufigkeiten (=expected values), das sind jene Häufigkeiten, die man sich bei völliger Unabhängigkeit zwischen den Stichproben erwartet hätte. Die erwarteten Häufigkeiten werden nach folgender Formel berechnet: eij ci*r j N c......Spaltensumme r.......Zeilensumme N......Gesamtstichprobe 25 Folgendes Beispiel zeigt die Anwendung eines Chiquadrattests: Es wird untersucht ob es Unterschiede zwischen Männern und Frauen in Bezug auf das Leseverhalten gibt. Die entsprechenden Hypothesen lauten: H0: Zwischen Männern und Frauen gibt es hinsichtlich des Leseverhaltens keinen signifikanten (=null) Unterschied. H1: Zwischen Männern und Frauen gibt es hinsichtlich des Leseverhaltens einen signifikanten Unterschied. Ausgangspunkte sind die Ergebnisse einer Erhebung bei 300 Personen, die in folgender Tabelle zusammengefasst sind: 1.Schritt: Beobachtete Häufigkeiten: Krimi Romane Männer 65 25 Frauen 70 50 Gesamt: abs. 135 75 in % 45% 25% SciFi 50 40 90 30% 2.Schritt: Erwartete Häufigkeiten: Krimi Romane Männer 63 35 Frauen 72 40 SciFi 42 48 Gesamt 140 160 300 100% 2err. = ((65-63)2/63) + ((25-35)2/35) +......+((40-48)2/48) = 8,333 Die Größe der Tabelle wird durch den Ausdruck Freiheitsgrade (=degress of freedom DF) beschrieben und ist definiert aus: DF= (c-1) * (r-1) = (3-1)*(2-1) = 2............d.h.: 2 Freiheitsgrade 26 Bei der Chiquadratverteilung (siehe Tabelle in Fahrmeier) liegt der Grenz (Schwell-)wert zur Ablehnung der Nullhypothese bei einer Irrtumswahrscheinlichkeit von 5% (Tabelle 1- = 0,95) und 2 Freiheitsgraden bei: 2Tab.0,95;2 = 5,991 Ist der errechnete Chiquadratwert größer/gleich dem tabellierten, so wird die Nullhypothese verworfen. Ist dieser Wert kleiner als der Tabellierte so wird die Nullhypothese angenommen. Die Chiquadratverteilung lässt sich durch die Normalverteilung approximieren. Den dann gesuchten Grenzwert z erhält man durch: z= 2 2 2 DF 1 im vorliegenden Beispiel ist das: z= 2 8,333 (2 * 2) 1 = 2,351 Für die Standardnormalverteilung lässt sich nun folgende Fläche (=Signifikanz) durch Integrieren in den Grenzen z = 2,4 errechnen: z 2 x 1 1 2 e 2 d x 0.016395 z Die Irrtumswahrscheinlichkeit – das ist jene Fehlerwahrscheinlichkeit mit der H1 angenommen wird, obwohl H0 zutrifft - beträgt also 0,016395 (=1,6%); sie ist daher kleiner als die 5% Grenze, welche in der klassischen Statistik häufig Anwendung findet. 27 Aufgrund dieses Ergebnisses: Sig=0,016395 0,05 kann die Nullhypothese verworfen werden; anders ausgedrückt: die Alternativhypothese wird angenommen. Zwischen Männern und Frauen bestehen im Leseverhalten signifikante Unterschiede. Es erfolgt eine Interpretation der Kontingenz (Kreuz-)tabelle. Weiteres Beispiel mit Softwarelösung: Fragestellung: Gibt es zwischen Männern und Frauen signifikante Unterschiede in Bezug auf ihren Wunschurlaub ? Die beiden Hypothesen lauten: H0: Zwischen Männern und Frauen bestehen hinsichtlich des Wunschurlaubs keine Unterschiede. H0: M = F H1: Zwischen Männern und Frauen bestehen hinsichtlich des Wunschurlaubs Unterschiede. H1: M F 28 Das Statistikpaket SPSS liefert folgenden Output: Wunschurlaub * Geschlecht Kreuztabelle Wunschurlaub flugreis e kreuzfahrt ös terreichurlaub Gesamt Anzahl % von Wunschurlaub % von Geschlecht Anzahl % von Wunschurlaub % von Geschlecht Anzahl % von Wunschurlaub % von Geschlecht Anzahl % von Wunschurlaub % von Geschlecht Geschlecht männlich weiblich 23 3 88,5% 11,5% 63,9% 18,8% 8 10 44,4% 55,6% 22,2% 62,5% 5 3 62,5% 37,5% 13,9% 18,8% 36 16 69,2% 30,8% 100,0% 100,0% Gesamt 26 100,0% 50,0% 18 100,0% 34,6% 8 100,0% 15,4% 52 100,0% 100,0% Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusam menhang linear-m it-linear Anzahl der gültigen Fälle As ymptotisch e Signifikanz (2-seitig) df a 9,875 2 ,007 10,281 2 ,006 5,086 1 ,024 52 a. 1 Zellen (16,7%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 2,46. Im vorliegenden Beispiel beträgt das =0.007 ; Die Irrtumswahrscheinlichkeit ist daher 0,7% 0.05 H0 0.05 H1 daraus folgt H1 Zwischen Männern und Frauen bestehen signifikante Unterschiede hinsichtlich ihres Urlaubswunsches. 29 Ein Sonderfall des Chiquadrattests ist: - bei 2x2 Tabellen die Kontinuitätskorrektur (bzw. Yates Korrektur) Der Chiquadratwert mit der Kontinuitätskorrektur wird nach folgender Formel berechnet: n [ O E 0.5]2 i 1 E 2 Fragestellung: Gibt es einen Unterschied zwischen Männer und Frauen dahingehend, ob Sie letztes Jahr Urlaub machten ? Die beiden Hypothesen lauten: H0: Zwischen Männern und Frauen bestehen hinsichtlich des Urlaubsverhaltens (ob Urlaub gemacht wird ? Ja/Nein) keine Unterschiede. H0: M = F H1: Zwischen Männern und Frauen bestehen hinsichtlich des Urlaubsverhaltens Unterschiede. H0: M F 30 Somm erurlaub * Geschle cht Kreuztabelle Sommerurlaub Ja Nein Gesamt Anzahl % von Sommerurlaub % von Ges chlecht Anzahl % von Sommerurlaub % von Ges chlecht Anzahl % von Sommerurlaub % von Ges chlecht Geschlecht männlich weiblic h 23 13 63,9% 36,1% 63,9% 81,3% 13 3 81,3% 18,8% 36,1% 18,8% 36 16 69,2% 30,8% 100,0% 100,0% Gesamt 36 100,0% 69,2% 16 100,0% 30,8% 52 100,0% 100,0% Chi-Quadrat-Tests W ert Chi-Quadrat nach Pearson a Kontinuität skorrekt ur Lik elihood-Quotient Ex akter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle As ymptotis ch e S ignifikanz (2-seit ig) df b 1,567 1 ,211 ,858 1,659 1 1 ,354 ,198 Ex akte Signifik anz (2-seit ig) ,331 1,537 1 Ex akte Signifik anz (1-seit ig) ,178 ,215 52 a. W ird nur für eine 2x 2-Tabelle berec hnet b. 1 Zellen (25,0% ) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4,92. Im vorliegenden Beispiel beträgt das =0.354, daraus folgt, daß zwischen Männern und Frauen keine signifikanten Unterschiede hinsichtlich des Urlaubsverhaltens bestehen. Würde man behaupten, dass diesbezügliche Unterschiede bestehen, so "riskiert" man, dass man sich zu rund 35% irrt, da die exakte Irrtumswahrscheinlichkeit 35,4% beträgt. 31 PARAMETERFREIE PRÜFVERFAHREN Die folgenden beiden statistischen Testverfahren, der MannWhitney-U-Test und der Kruskal-Wallis Test dienen zum Vergleich unabhängiger Stichproben, die entweder ordinal skaliert oder nicht normalverteilt sind. Mann-Whitney U-Test: Der U-Test von Mann und Whitney dient zum Vergleich zweier unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable bzw. solcher, die die Voraussetzung der Normalverteilung nicht erfüllen. Das Prinzip dieses Tests ist die Ersetzung der gegebenen erfassten Werte durch Rangplätze. Es handelt sich dabei praktisch um eine ordinal skalierte Variable (wie z.B. Beurteilung nach Schulnoten) oder um eine metrische Variable, welche nicht normalverteilt ist; dabei werden sämtliche auftretenden Werte durch Ränge ersetzt, die Abstände zueinander werden dabei völlig vernachlässigt. Auf Ordinalskalenniveau erhobene Daten lassen lediglich Rechen- operationen zu, in denen Rangplätze (ordinale Informationen) verarbeitet werden. Mittelwerte, Varianzen können nicht berechnet werden, weil das Kriterium der Äquidistanz nicht gegeben ist. Statt dessen werden Summen der Rangplätze berechnet, denen die Fälle in den Substichproben zuzuordnen sind. 32 Die Vorgangsweise beim Mann-Whitney U-Test wird durch folgendes Beispiel erörtert: Untersucht wird die Fragestellung ob sich Studenten (männlich) von Studentinnen (weiblich) hinsichtlich der Beurteilung der Nebenjobmöglichkeiten unterscheiden. Die beiden zu überprüfenden Hypothesen sind: H0: Zwischen Männern und Frauen besteht kein Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten. H1: Zwischen Männern und Frauen besteht ein signifikanter Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten. (Irrtumswahrscheinlichkeit max.5%) Folgende Tabelle zeigt die zusammengefassten Ergebnisse: Beurteilung Männlich Weiblich ti (ti3-ti) Gut 2 8 10 990 Mittel 3 2 5 120 Schlecht 7 3 10 990 Gesamt n1=12 n2=13 N=25 =2100 Im ersten Schritt werden nun den einzelnen Werten, geordnet nach männlich/weiblich und den Beurteilungen, Rangplätze zugewiesen und so für die Gruppe der Männer und Frauen Rangsummen berechnet: Es ergeben sich also insgesamt 25 Rangplätze, von der ersten Person männlich+gut-Beurteilung bis zur letzten (25-sten) Person weiblich+schlecht-Beurteilung. 33 Die Rangsummen werden nach Ermittlung der Rangziffern und anschließender Gewichtung nach der jeweiligen Anzahl von Frauen und Männern berechnet. Beurteilung Männlich Weiblich 1+2+ 5,5 x 2=11 3+4+5+6+7+8+9+10=55/10=5,5 5,5 x 8=44 11+12+13+ 13 x 3=39 16+17+18+19+20+21+22+ 20,5 x 7=143,5 14+15=65/5=13 13 x 2=26 23+24+25=205/10=20,5 20,5 x 3=61,5 Rangsummen R R1=193,5 R2=131,5 Mittlerer Rang 193,5/12=16,13 131,5/13=10,12 1=Gut 2=Mittel 3=Schlecht Es gilt: R1 + R2 = [N*(N+1)]/2 193,5 + 131,5 = 325 In weiterer Folge wird die Testmaßzahl U bestimmt: U1 = R1 – [n1*(n1+1)]/2 U1 = 193,5 – 78 = 115,5 U2 = R2 – [n2*(n2+1)]/2 U2 = 131,5 – 91 = 40,5 Die Prüfgröße U des U-Testes ist nun der kleinere der beiden UWerte: U = Minimum (U1, U2) = 40,5 Laut Tabelle beträgt der kritische U-Wert: U;n1;n2 = U0,05;12;13 = 41 Da der errechnete U-Wert kleiner als U-tabelliert ist, wird H0 verworfen; es folgt die Interpretation von H1. 34 Zur Bestimmung der exakten Irrtumswahrscheinlichkeit muß zuerst z bestimmt werden; dann kann die asymptotische significance berechnet werden: Zur Berechnung von z benutzt man folgende korrigierte Formel: Warum korrigiert ? Da Messwerte auftreten, die wiederholt vorkommen, wird in die Formel ein Korrektur-Term eingebaut: U z= n1* n2 2 n1* n2 * (N 3 N 12 * N * ( N 1) m (t 3 i ti ) i 1 z = - 2,193 Exkurs:---------------------------------------------------------------------Tritt jeder Messwert nur einmal auf, so wird zur Berechnung von z die folgende unkorrigierte Formel herangezogen: n1* n2 2 n1* n2 * (n1 n2 1) 12 U z= -------------------------------------------------------------------------------Berechnung der Irrtumswahrscheinlichkeit: sig z 2 x 1 1 2 2 e d x 0.028307 z sig = 0,028 = 2,8% Da 0,0283 0,05 H1 ; d.h. H0 wird verworfen !! 35 Schlussfolgerung: Zwischen Männern und Frauen besteht ein signifikanter Unterschied hinsichtlich der Beurteilung der Nebenjob-möglichkeiten. Wo liegt nun der diesbezügliche Unterschied ? Man betrachtet die mittleren Ränge: Mittlerer Rang Männer Frauen 16,13 10,12 Der einzelne mittlere Rang sagt nichts aus und wird so auch nicht interpretiert. Betrachtet man jedoch die Höhe des mittleren Ranges, so kann festgestellt werden, dass der mittlere Rang bei den Männern deutlich höher ist als jener, der Frauen. Die ursprüngliche Codierung der Beurteilung war: 1 = gut 2 = mittel 3 = schlecht Ein höherer Wert sagt also aus, dass "schlechter beurteilt" wurde. Im vorliegenden Beispiel kann also festgehalten werden, dass Männer (Studenten) die Nebenjobmöglichkeiten schlechter beurteilen als Frauen (Studentinnen). 36 Das Statistikpaket SPSS liefert folgenden Output: Mann-Whitney-Test Ränge Beurteilung Nebenjobmögl. Geschlecht männlich weiblich Gesamt N 12 13 25 Mittlerer Rang 16,13 10,12 Rangs umme 193,50 131,50 Statistik für Testb Mann-Whitney-U Wilcoxon-W Z As ymptotische Signifikanz (2-seitig) Exakte Signifikanz [2*(1-s eitig Sig.)] Beurteilung Nebenjobm ögl. 40,500 131,500 -2,193 ,028 a ,040 a. Nicht für Bindungen korrigiert. b. Gruppenvariable: Geschlecht Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische Signifikanz und interpretiert, wenn H0 verworfen wird und man sich für H1 entscheidet, die mittleren Ränge. 37 Kruskal-Wallis H-Test: Der H-Test von Kruskal und Wallis dient zum Vergleich mehr als zweier (n>2) unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable bzw. solcher, die die Voraussetzung der Normalverteilung nicht erfüllen. Das Prinzip dieses Tests ist die Ersetzung der gegebenen erfassten Werte durch Rangplätze. Es handelt sich dabei praktisch um eine ordinal skalierte Variable (wie z.B. Beurteilung nach Schulnoten) oder um eine metrische Variable, welche nicht normalverteilt ist; dabei werden sämtliche auftretenden Werte durch Ränge ersetzt, die Abstände zueinander werden dabei völlig vernachlässigt. Auf Ordinalskalenniveau erhobene Daten lassen lediglich Rechenoperationen zu, in denen Rangplätze (ordinale Informationen) verarbeitet werden. Mittelwerte, Varianzen können nicht berechnet werden, weil das Kriterium der Äquidistanz nicht gegeben ist. Statt dessen werden Summen der Rangplätze berechnet, denen die Fälle in den Substichproben zuzuordnen sind. 38 Die Vorgangsweise beim Kruskal-Wallis H-Test ist bis hin zur Berechnung der mittleren Ränge gleich jener beim M-W U-Test. Untersucht wird die Fragestellung ob sich Studenten der 4 Studienrichtungen BWL/VWL/IWW/Wipäd hinsichtlich der Beurteilung der Nebenjobmöglichkeiten voneinander unterscheiden. Die beiden zu überprüfenden Hypothesen sind: H0: Zwischen den Studenten der 4 Studienrichtungen besteht kein Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten. H1: Zwischen den Studenten der 4 Studienrichtungen besteht ein Signifikanter Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten. (Irrtumswahrscheinlichkeit max.5%) Die Berechnung der Rangsummen und mittleren Ränge erfolgt gleich wie beim Mann Whitney U-Test. Es ergibt sich folgende Tabelle: BWL VWL IWW Wipäd ti (ti3-ti) Gut 6 2 0 2 10 990 Mittel 1 2 0 2 5 120 Schlecht 0 4 6 0 10 990 Gesamt ni 7 8 6 4 N=25 2100 Rangsummen Ti 46 119 123 37 - - Mittlerer Rang 6,57 14,88 20,55 9,25 - - 39 Die für den Kruskal-Wallis Test zu berechnende Prüfgröße H ist chiquadrat-verteilt, mit Df = k-1 Freiheitsgraden , wobei k= die Anzahl der Klassen/Gruppen (=4 Studienrichtungen) Im vorliegenden Beispiel errechnet sich durch: DF = 4 – 1 = 3 Die angeführte Formel H bezieht sich auf die Berechnung in dem Fall, dass jeder Messwert nur einmal auftritt; H= 12 * N * ( N 1) Ti2 3 * ( N 1) i 1 n i k Die vorliegende Problemstellung zeigt jedoch, dass bei den 4 Studienrichtungen die gleichen Beurteilungen zum Teil häufiger als nur einmal auftreten, daher verwendet man beim Kruskal Wallis Test, ähnlich wie beim U-Test, eine korrigierte Formel: H´ = H 1 m (t 3 i 1 i 3 ti ) N N H´err.= 15,166 Ein Blick auf die Chiquadrattabelle (siehe Fahrmeier) zeigt, dass H´1-;DF = H´0,95;3 = 7,8147 Da der errechnete H-Wert größer dem H-Wert aus der Chiquadrattabelle ist, wird H0 verworfen; man entschließt sich für H1 und interpretiert die mittleren Ränge. Über den H-Wert wird wie beim Chiquadrattest z errechnet und daraus wiederum die exakte Irrtumswahrscheinlichkeit. 40 Das Statistikpaket SPSS liefert folgenden Output: Kruskal-Wallis-Test Rä nge Beurteilung Nebenjobmögl. St udienrichtungen BW L VW L IW W W ipäd Gesamt N 7 8 6 4 25 Mittlerer Rang 6,57 14,88 20,50 9,25 Statistik für Te sta,b Beurteilung Nebenjobmögl. Chi-Quadrat 15,171 df 3 As ymptotis che Signifikanz ,002 a. Kruskal-W allis-Test b. Gruppenvariable: St udienric htungen Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische Signifikanz und interpretiert, wenn H0 verworfen wird und man sich für H1 entscheidet, die mittleren Ränge. 41 Varianzanalyse: Will man untersuchen inwiefern sich zwei oder mehrere Gruppen einer nominalen oder ordinalen Variable in Bezug auf ein metrisches Merkmal unterscheiden, so wendet man die einfaktorielle Varianzanalyse an. Um den Einfluß mehrerer nominaler bzw. ordinaler Variable auf eine metrische Variable zu überprüfen, wird die mehrfaktorielle Varianzanalyse durchgeführt. Von Interesse ist also der Einfluß eines sogenannten Faktors auf eine eigentlich metrische Zielgröße. Es ist darauf hinzuweisen, dass bei Überprüfung zweier Gruppen (z.B. Männer/Frauen) hinsichtlich eines metrischen Merkmals (z.B. Ausgaben für Geschenke) häufig der t-Test Anwendung findet. Bei mehr als 2 Gruppen (n>2) findet der F-Test seine Anwendung, da der t-Test nur im Zweistichprobenfall zu verwenden ist. Da der F-Test jedoch auch im Zweistichprobenfall anwendbar ist, ist seine Verbreitung wesentlich häufiger. Wichtige Voraussetzungen für die Durchführung der Varianzanalyse sind: Normalverteilung (K-S Test) Varianzhomogenität (Levene-Statistik) 42 Liegen diese Voraussetzungen nicht vor, so wird in der Regel auf Unterschiedsverfahren für ordinal skalierte Variable zurückgegriffen. Die Varianzanalyse geht ihrem Prinzip nach von einer Zerlegung der Varianzen aus. Diese Gesamtvarianz wird zerlegt in eine Varianz innerhalb der Gruppen und eine Varianz zwischen den Gruppen. Welche Hypothesen werden überprüft: H0 : 1 = 2 = ...... = n H1 : 1 ≠ 2 ≠ ...... ≠ n Da die Varianzanalyse ein Mittelwertvergleich ist, wird untersucht, ob die Mittelwerte der einzelnen Gruppen in etwa gleich, oder ob die Mittelwerte voneinander signifikant verschieden sind. 43 Die zu berechnende F-Teststatistik(Ferrechnet)ergibt sich aus: SQE 2 Ferr = SQR * 1 , wobei SQR = Summe der Streuung innerhalb der Gruppen SQR = (n 1) * s ; si2=Varianz innerhalb der einzelnen Gruppen I 2 i i i 1 T = Gesamtstreuung T = ( x x) N 2 i i 1 SQE = Summe der Streuung zwischen den Gruppen SQE = (n * ( x x) ) ; I ni 2 i i 1 i j 1 d.h. rechentechnisch = SQE =T(Gesamtstreuung)–SQR(Streuung innerhalb der Gruppen) Zur Berechnung der Freiheitsgrade: 1 = I – 1, wobei I ist gleich die Anzahl der Gruppen 2 = N – I, wobei N gleich dem Stichprobenumfang Eine andere Möglichkeit zur Berechnung der Teststatistik F ist folgende: W T * 2 W 1 T 1 Fer = r , wobei T = Gesamtstreuung und W die Streuung innerhalb der Gruppen ist. 44 Diese Vorgangsweise wird anhand folgendem Beispiel erörtert: In nachstehender Tabelle sind die Daten einer Erhebung der durchschnittlichen Ausgaben pro Urlaubstag in Euro für Niederländer, Deutsche und Amerikaner angeführt: Ausgaben pro Tag Gruppenmittelwert Berechnung von T Berechnung von SQE 1 = Niederländer 75 80 (104-75)2 (80-104)2 1 80 (104-80)2 (80-104)2 1 85 (104-85)2 (80-104)2 2=Deutsche 90 (104-90)2 (100-104)2 2 100 (104-100)2 (100-104)2 2 110 (104-110)2 (100-104)2 3= Amerikaner 110 (104-110)2 (125-104)2 3 130 (104-130)2 (125-104)2 3 120 (104-120)2 (125-104)2 3 140 (104-140)2 (125-104)2 Gesamtmittelwert 104 Summe = 4290 Summe=3540 100 125 Aus den Daten ergeben sich folgende Varianzen: s12 = 25; s22 = 100; s32 = 166,666 SQR = 2 * 25 + 2 * 100 + 3 * 166,666 = 750 SQE = 3*(80-104)2+3*(100-104)2+4*(125-104)2 = 3540 1 = I – 1 = 3 – 1 = 2 2 = N – I = 10 – 3 = 7 45 Ferr = 3540 7 * 750 2 = 16,52 Das auf diese Weise errechnete F wird nun, wie bereits bei anderen statistischen Tests aufgezeigt, mit dem tabellierten F-Wert verglichen: (Irrtumswahrscheinlichkeit 5%) F tab 0,05; 2; 7 = 4,74 Da Ferr ≥ Ftab. wird die H0 verworfen und man kann mit großer Wahrscheinlichkeit davon ausgehen, dass sich die Mittelwerte der einzelnen Gruppen signifikant voneinander unterscheiden. Zur Interpretation der signifikanten Ergebnisse werden die Mittelwerte der einzelnen Gruppen (Gruppenmittelwerte – siehe Tabelle) herangezogen. Das Statistikpaket SPSS liefert folgenden Output: Deskriptive Statistik AUSG N Niederländer Deutsche Amerikaner Gesamt 3 3 4 10 Mittelwert 80,0000 100,0000 125,0000 104,0000 Standardab weichung 5,0000 10,0000 12,9099 21,8327 Standardf ehler 2,8868 5,7735 6,4550 6,9041 95%-Konfidenzintervall für den Mittelwert Untergrenze Obergrenze 67,5793 92,4207 75,1586 124,8414 104,4574 145,5426 88,3818 119,6182 Minimum 75,00 90,00 110,00 75,00 Maximum 85,00 110,00 140,00 140,00 ANOVA AUSG Zwischen den Gruppen Innerhalb der Gruppen Gesamt Quadrats umme 3540,000 750,000 4290,000 df 2 7 9 Mittel der Quadrate 1770,000 107,143 F 16,520 Signifik anz ,002 46 Nach der Entscheidung für H0 oder H1 auf Basis der von der Software errechneten exakten Signifikanz (größer oder kleiner gleich 0,05), werden bei H1 die Mittelwerte interpretiert. 47 Regressionsanalyse Durch die Regressionsanalyse soll der Zusammenhang zweier oder mehrerer Variable mathematisch erfasst werden. Ziel der Regressionsrechnung ist es dabei, Formeln zu finden, nach denen man bei Kenntnis des Wertes der einen Variablen den zu erwartenden Wert der anderen Variable bestimmen kann. Ausgangspunkt ist also eine grafische Übersicht des Zusammenhangs zweier metrischer Variable. Dieser Zusammenhang wird durch eine Regressionslinie am besten dargestellt. An dieser Stelle wird ein Modell mit zwei Variablen ausführlich behandelt; dieses bezeichnet man als lineare Einfachregression. Der Zusammenhang von zwei Variablen wird durch die lineare Funktion der Form: ŷi = α + βxi , deren Graf eine Gerade ist, verdeutlicht. Gesucht wird also ein objektives Verfahren zur Ermittlung der ŷi = α + βxi mit der Steigung β und dem Geradengleichung Ordinatenabschnitt α. Dabei nennt man β auch den Regressionskoeffizienten. Das Vorzeichen drückt die Art des Zusammenhangs aus: Positiv: je mehr, desto mehr / je weniger, desto weniger Negativ: je mehr, desto weniger / je weniger, desto mehr Null: keine Richtung/Muster erkennbar. 48 Mit Hilfe folgender Formel kann β bestimmt werden: n β= n n (x * y ) n * x * y 1 i i i i 1 i 1 n n x i 1 2 i i i 1 1 *( xi ) 2 n i 1 Der Ordinatenabschnitt bestimmt sich nach der Berechnung von β zu: α = y *x Folgendes Beispiel soll die Anwendung der Regressionsrechnung besser verständlich machen: Gegeben sind das monatliche Einkommen und die Ausgaben für Geschenke pro Monat: EK ( x) 1000,00 1050,00 1100,00 1200,00 1250,00 1250,00 1250,00 1500,00 1400,00 1600,00 AUSG (y) 75,00 80,00 85,00 90,00 100,00 110,00 110,00 130,00 120,00 140,00 y2 5625,00 6400,00 7225,00 8100,00 10000,00 12100,00 12100,00 16900,00 14400,00 19600,00 x2 1000000 1102500 1210000 1440000 1562500 1562500 1562500 2250000 1960000 2560000 xiyi 75000,00 84000,00 93500,00 108000,0 125000,0 137500,0 137500,0 195000,0 168000,0 224000,0 Mittelwert 1260 104 11245 1621000 134750 Summe 12600 1040 112450 16210000 1347500 ni 1 2 3 4 5 6 7 8 9 10 49 β= 1 *1040 *12600 10 1 16210000 *12600 2 10 1347500 = 0,1110778 α = 104 – 0,1110778 * 1260 = -35,958 Daraus ergibt sich folgendes Regressionsmodell für unsere Daten: ŷi = -35,958 + 0,1110778*xi Die Regressionsgerade kann nach der angegebenen Methode immer berechnet werden. Sinnvoll ist ihre Berechnung aber nur dann, wenn der Zusammenhang zwischen den beiden betrachteten Variablen tatsächlich linear ist. Dies ist entweder aus der Erfahrung bekannt oder in der Regel aus dem optischen Eindruck des Korrelationsdiagramms ersichtlich. Die zu suchende Gerade erfüllt die Modellfunktion dann am besten, wenn die Summe der Abstände der Punkte außerhalb der Geraden zu dieser Geraden möglichst gering ist. Im geometrischen Sinn kann man die Abstände als euklidisches Differenzenquadrat auffassen. Es wird also eine Zielfunktion im Sinne der Methode der kleinsten Quadrate formuliert, wo die Quadratwerte minimal werden. Die Differenzen der beobachteten Werte zu den geschätzten Werten, werden als Residuen bezeichnet. Das sind jene Werte, deren Betrag möglichst gering sein sollte; ˆi yi yˆi 50 Auf Grund unseres Regressionsmodells ergeben sich für ein Einkommen in der Höhe von 1250 Euro geschätzte Ausgaben für Geschenke in der Höhe von 102,8892. Dieser Wert ergibt sich aus: ŷi = 0,1110778 *1250 +(-35,958) = 102,8892 Die Differenz dieses geschätzten Wertes zum tatsächlich beobachteten Wert 100 beträgt –2,8892; dies ist das Residuum für den beobachteten Wert von 100 Euro. Für die gesamten beobachteten Werte der Variable Ausgaben (AUSG) ergeben sich auf Grund unseres Regressionsmodells, d.h. die Erklärung der Ausgaben über die beeinflussende Variable Einkommen (EK) folgende Werte (Residuen): EK (x) 1000,00 1050,00 1100,00 1200,00 1250,00 1250,00 1250,00 1500,00 1400,00 1600,00 AUSG (y) 75,00 80,00 85,00 90,00 100,00 110,00 110,00 130,00 120,00 140,00 ŷ 75,11976 80,67365 86,22754 97,33533 102,8892 102,8892 102,8892 130,6587 119,5509 141,7665 Residuen -,11976 -,67365 -1,22754 -7,33533 -2,88922 7,11078 7,11078 -,65868 ,44910 -1,76647 51 Das Statistikpaket SPSS liefert folgenden Output: b Model lzusam menfassung Modell 1 R R-Quadrat ,980a ,961 Korrigiertes R-Quadrat ,956 St andardf ehler des Sc hätz ers 4,5964 a. Einfluß variablen : (Kons tant e), EK b. Abhängige Variable: AUSG Koeffi zientena Modell 1 (Konst ante) EK St andardi sierte Koeffiz ien ten Nicht s tandardisierte Koeffiz ient en St andardf B ehler -35,958 10,126 ,111 ,008 Beta ,980 T -3, 551 13,966 Signifik anz ,007 ,000 a. Abhängige Variable: AUSG 140,00 ausg = -35.96 + 0.11 * ek R-Quadrat = 0.96 Punkte/Linien zeigen Mittelw erte Lineare Regression ausg 120,00 100,00 80,00 1000,00 1200,00 1400,00 1600,00 ek 52 Zusammenhangsverfahren: Kontingenzkoeffizient: (0 bis 1) Für nominale Merkmale wird als Zusammenhangsmaß der Kontingenzkoeffizient (C) verwendet. Dieser Wert liegt zwischen 0 und 1 und drückt die Stärke des Zusammenhangs aus. Der Kontingenzkoeffizient misst nur die Stärke des Zusammenhangs, eine Richtung der Wirkungsweise wird nicht erfasst. Als Basis zu Berechnung des Kontingenzkoeffizienten wird der errechnete Chiquadratwert herangezogen: C= 2 n2 Die beiden zu untersuchenden Hypothesen lauten: H0 : Zwischen den beiden Variablen Geschlecht und Lesegewohnheiten besteht kein wesentlicher Zusammenhang H1 : Zwischen den beiden Variablen Geschlecht und Lesegewohnheiten besteht ein wesentlicher Zusammenhang Bezogen auf das Beispiel zur Berechnung des Chiquadratwertes hinsichtlich der Lesegewohnheiten (Krimi/Romane/SciFi) und dem Geschlecht ergibt sich folgender Kontingenzkoeffizient: 53 C= 8,333 300 8,333 = 0,1644 Wie auf Grund des durchgeführten Chiquadrattests ersichtlich war gibt es einen signifikanten Unterschied zwischen Männer und Frauen in Bezug auf ihre Lesegewohnheiten; der Zusammenhang zwischen den beiden Variablen ist jedoch mit 0,1644 als eher gering zu bezeichnend, obwohl signifikant. Das Statistikpaket SPSS liefert folgenden Output: Symmetrische Maße Wert Nominal- bzgl. Nominalmaß Kontingenzkoeffizient Anzahl der gültigen Fälle Näherungs weis e Signifikanz ,164 ,016 300 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Es kann festgestellt werden, daß zwischen der Variable Geschlecht und der Variable Lesegwohnheiten ein signifikanter Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.016; daher wird H0 verworfen!); der Kontingenzkoeffizient in der Höhe von 0,164 drückt die Stärke des Zusammenhangs aus. 54 Rangkorrelationskoeffizient nach Spearman: (-1 bis +1) Wenn man für ordinalskalierte Variable von den ursprünglichen xund y-Werten zu ihren Rängen übergeht, erhält man den Korrelationskoeffizienten nach Spearman. Dabei wird analog zum MannWhitney U-Test den Werten der x Variable aber auch den Werten der y Variable jeweils nach ihrer Ordnung ein Rangplatz zugeordnet und man erhält nun für jede Beobachtung sogenannte Messpaare. Zu x1 ≤ ........ ≤xn, als bereits geordnete Werte gilt rg (xi)=i, und zu y1 ≤ ........ ≤yn, als bereits geordnete Werte gilt rg (y i)=i; Sowohl innerhalb der x-Werte wie auch der y-Werte können identische Werte auftreten. Die Rangvergabe ist dann nicht eindeutig, so werden wie bereits bei der Vorgehensweise beim Mann-Whitney U-Test Durchschnittsränge berechnet. Die Berechnung des Korrelationskoeffizienten nach Spearman erfolgt über folgende allgemeine Formel: d rSP= 1 - ; 2 i 6 (n 2 1)n da jedoch häufig sogenannte Bindungen auftreten und daher eine diesbezügliche Korrektur angewendet werden muß (nach Bindungen korrigiert = corrected for ties), findet folgende korrigierte Formel ihre Anwendung: 6 d rSP corr. = 1 ; 2 i (n 2 1)n (T x´ T y´ ) wobei: di sind die Rangdifferenzen und n der Stichprobenumfang. Tx´ = 12 (t t ) ; dadurch wird die Häufigkeit des Auftretens der 3 xi´ xi´ 55 gleichen Bewertungen berücksichtigt. Analog dazu wird Ty´ berechnet. Gegeben sind zwei Variable: x....Beurteilung der Nebenjobmöglichkeiten y....Beurteilung der eigenen finanziellen Situation Die beiden Hypothesen lauten: H0: Zwischen der Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der eigenen finanz. Situation besteht kein Zusammenhang. H1: Zwischen den beiden Variablen besteht ein Zusammenhang. X 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 Berechnung der Rangziffern Rg(xi) 1+2+3+4+5+6+7+8+9+10=55/10=5,5 11+12+13+14+15=65/5=13 16+17+18+19+20+21+22+23+24+25= = 205/10=20,5 Tx´ = 12 (t 3 xi´ t x´ ) i Y 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 1 2 2 2 3 3 3 3 3 3 Rg (yi) Rg (1) = 4 Rg(2) = 12,5 Rg(3) = 21,5 Berechnung der Rangdifferenzen (d) 5,5 – 4= 1,5 5,5 – 4= 1,5 5,5 – 4= 1,5 5,5 - 4 = 1,5 5,5 – 4= 1,5 5,5, - 4 = 1,5 5,5 - 12,5 = 7 5,5 - 12,5 = 7 5,5 - 12,5 = 7 5,5 - 12,5 = 7 13 – 12,5= 0,5 13 – 12,5= 0,5 13 – 12,5 = 0,5 13 – 21,5= 8,5 13 – 21,5 = 8,5 20,5 – 4 = 16,5 20,5 – 12,5= 8 20,5 – 12,5= 8 20,5 – 12,5= 8 20,5 – 21,5 = 1 20,5 – 21,5 = 1 20,5 – 21,5 = 1 20,5 – 21,5 = 1 20,5 – 21,5 = 1 20,5 – 21,5 = 1 Summe d2 2,25 2,25 2,25 2,25 2,25 2,25 49 49 49 49 0,25 0,25 0,25 72,25 72,25 272,25 64 64 64 1 1 1 1 1 1 825 =½*[(103-10)+(53-5)+(103-10)] = 1050 56 Ty´ = ½*[(73-7)+(103-10)+(83-8)] = 915 6 * 825 rSP corr. = 1 - (25 1)25 (1050 915 ) 2 =1- 4950 113635 = + 0,6369 Der Zusammenhang zwischen der Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der eigenen finanziellen Situation ist ein positiver Zusammenhang. Ob dieser Zusammenhang signifikant ist oder nicht kann über die z-Transformation mit anschließender Berechnung der Irrtumswahrscheinlichkeit (=Signifikanzniveau) geklärt werden: z=ż* n 3 , wobei ż als Korrelationsziffer bezeichnet wird und wie folgt zu berechnen ist: ż = ½*ln( 1 r ) = ½ * ln 1 0,6369 1 0,6369 daraus folgt: z = ż * n 3 = 0,753* 25 3 1 r = 0,753 = 3,532 Das Signifikanzniveau errechnet sich aus: z 2 x 1 1 2 e 2 d x 0.001229270561 z 57 Da das Signifikanzniveau ≤0,05, nämlich exakt 0,00123 ist, kann die H0 verworfen werden und man kann behaupten, dass der Zusammenhang zwischen der Beurteilung der Nebenjobmöglich-keiten und der Beurteilung der eigenen finanziellen Situation sta-tistisch signifikant ist. Die Stärke des Zusammenhang ist +0,637. Das heißt: je besser die Nebenjobmöglichkeiten beurteilt werden, desto besser wird auch die persönliche finanzielle Situation beurteilt. Das Statistikpaket SPSS liefert folgenden Output: Korrelationen Spearman-Rho Beurteilung der Nebenjobmöglichkeiten Beurteilung der eigenen finaziellen Situation Korrelationskoeffizient Sig. (2-seitig) N Korrelationskoeffizient Sig. (2-seitig) N Beurteilung Beurteilung der der eigenen Nebenjobmö finaziellen glichkeiten Situation 1,000 ,637** , ,001 25 25 ,637** 1,000 ,001 , 25 25 **. Korrelation ist auf dem Niveau von 0,01 signifikant (2-s eitig). Es kann festgestellt werden, daß zwischen der Variable Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der eigenen finanziellen Situation ein signifikanter Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.001; daher wird H0 verworfen!); der Korrelationskoeffizient in der Höhe von +0,637 drückt die Stärke des Zusammenhangs aus. 58 Korrelationskoeffizient nach Pearson (-1 bis +1) Der Bravais-Pearson´sche Korrelationskoeffizient ist prinzipiell nur für metrische Variable geeignet; diese sollten zudem normal-verteilt sein. Ist diese Voraussetzung nicht gegeben so ist der Korrelationskoeffizient nach Spearman anzuwenden. Zur Berechnung des Korrelationskoeffizienten nach Pearson werden jeweils zwei metrische Variable einer Person erfasst und als sogenannte Wertepaare dargestellt. Zu jedem x1 ,......., xn, gibt es ein entsprechendes y1 ,.....,.yn; Der Zusammenhang zwischen den beiden metrischen Variablen kann, wie bereits beim Korrelationskoeffizient nach Spearman poisitiv (~+1), negativ (~ -1) bzw. annähernd Null sein. Im vorliegenden Beispiel wird der Zusammenhang bzw. die Stärke des Zusammenhangs zwischen dem Einkommen (x) und den Ausgaben für Geschenke (y) berechnet. Die beiden Hypothesen lauten: H0: Zwischen dem Einkommen und den Ausgaben für Geschenke besteht kein Zusammenhang. H1: Zwischen den beiden Variablen besteht ein Zusammenhang. Die Berechnung des Korrelationskoeffizienten nach Pearson erfolgt nach: n rP = [( x i x ) * ( y i y )] i 1 n (x i 1 n i x) 2 * (y i y) 2 i 1 59 [( xi x ) * ( y i y )] EK (x) AUSG (y) 1000,00 75,00 7540,00 1050,00 80,00 5040,00 1100,00 85,00 3040,00 1200,00 90,00 840,00 1250,00 100,00 40,00 1250,00 110,00 -60,00 1250,00 110,00 -60,00 1500,00 130,00 6240,00 1400,00 120,00 2240,00 1600,00 140,00 12240,00 Mittelwert(x)=1260 Mittelwert(y)=104 Summe=37100 rP = 37100 334000 * 4290 ( xi x ) 2 67600,00 44100,00 25600,00 3600,00 100,00 100,00 100,00 57600,00 19600,00 115600,0 Su=334000 ( yi y) 2 841,00 576,00 361,00 196,00 16,00 36,00 36,00 676,00 256,00 1296,00 Su=4290 = +0,98 Der Zusammenhang zwischen dem Einkommen und den Ausgaben für Geschenke ist stark positiv und beträgt +0,98. Das heißt: je mehr jemand verdient, desto mehr ist er auch bereit für Geschenke auszugeben. Das Statistikpaket SPSS liefert folgenden Output: Korrelationen EK AUSG Korrelation nach Pearson Signifikanz (2-s eitig) N Korrelation nach Pearson Signifikanz (2-s eitig) N EK 1,000 , 10 ,980** ,000 10 AUSG ,980** ,000 10 1,000 , 10 **. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant. Es kann festgestellt werden, daß zwischen der Variable Einkommen und den Ausgaben für Geschenke ein signifikanter Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.000; daher wird H0 verworfen!); der Korrelationskoeffizient in der Höhe von +0,98 drückt die Stärke des Zusammenhangs aus. 60