fh – management, communication & it Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 1 SPSS • Überblick – – – – – – Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-Test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse ..... Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 2 SPSS • Überblick – – – – – ..... Varianzanalyse Diskrimanzanalyse Faktorenanalyse Clusteranalyse Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 3 SPSS • Statistische Grundbegriffe – Voraussetzungen für die Anwendung eines statistischen Tests • Welches Skalenniveau hat die betreffende Variable ? • Falle es sich um eine intervallskalierte Variable handelt: Liegt Normalverteilung der Werte vor ? • Handelt es sich bei den zu vergleichenden Stichproben um unabhängige oder abhängige Stichproben ? Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 4 SPSS • Skalenniveau: – Nominal: Das nominale Skalenniveau ist das „unterste“ in der Typologie, da keine Voraussetzungen über Beziehungen zwischen den Werten erforderlich sind. Jeder Wert definiert eine einzelne Kategorie und dient lediglich als Label oder Name der Kategorie. – Ordinal: Wenn eine Rangordnung zwischen den Kategorien nach irgend einem Kriterium möglich ist, liegt eine ordinales Skalenniveau vor. – Metrisch: (Intervall- oder Verhältnisskala) Zusätzlich zur Ordnung haben intervallskalierte Messungen die Eigenschaft aussagefähige Abstände zwischen den Werten. Verhältnis-Skalen haben alle Ordnungs- und Abstandseigenschaften einer Intervallskala. Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 5 SPSS • Skalenniveau/Empirische Relevanz Skalenniveau Nominal Ordinal Intervall Verhältnis Empirische Relevanz Keine Ordnung der Zahlen Differenz der Zahlen Verhältnisse der Zahlen Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 6 SPSS • Beispiele fürs Skalenniveau – Geschlecht: • 1 = männlich • 2 = weiblich • • • gleichwertig wie 1 = weiblich 2 = männlich – nominalen Variable mit zwei Ausprägungen = dichotome Variable – --> nur Häufigkeitsauswertung Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 7 SPSS • Beispiele fürs Skalenniveau – Familienstand: • 1 = ledig • 2 = verheiratet • 3 = verwitwet • 4 = geschieden – nominal Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 8 SPSS • Beispiele fürs Skalenniveau – Rauchgewohnheiten: • 1 = Nichtraucher • 2 = mäßiger Raucher • 3 = starker Raucher • 4 = sehr starker Raucher --> Ordnungsrelation – ordinalskalierte Variable (Mittelwerte, Median) Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 9 SPSS • Beispiele fürs Skalenniveau – monatliches Nettoeinkommen: • 1 = bis 1500 Euro • 2 = 1501 – 2500 Euro • 3 = über 2500 Euro --> ordinalskalierte Variable Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 10 SPSS • Beispiele fürs Skalenniveau – Intelligenzquotient Rangordnung + Bedeutung von Differenzen → intervallskalierte Variable (Differenz des Intervalls) Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 11 SPSS • Beispiele fürs Skalenniveau – Alter --> höchste Stufe der Skalierung Man kann sagen Gustav (60) ist doppelt als Max (30) Es sind dies alle intervallskalierte Variablen, die einen absoluten Nullpunkt besitzen. Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 12 SPSS • Spezielle Lagermaße: – Mittelwert: Mittelwert zur Kennzeichnung zentraler Tendenzen der Daten – Median: der Median oder Zentralwert ist der Wert, der die geordneten Daten genau halbiert, d.h. 50% der Daten liegen oberhalb und 50% liegen unterhalb des Median. – Modus: der Modus ist der Wert mit der größten Häufigkeit in einem Datensatz – Varianz/Standabweichung: Varianz und Standardabweichung ermitteln die (quadrierten) Abweichungen jedes Einzelwertes vom Mittelwert Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 13 SPSS • Normalverteilung: – Die Anwendung zahlreicher Verfahren setzt voraus, die intervallskalierte Variablen betreffen, dass deren Werte normalverteilt sind. – Die ist eine Verteilung, bei der sich die meisten Werte um den Mittelwert gruppieren, während die Häufigkeiten nach beiden Seiten hin gleichmäßig abfallen. – Grafische Darstellung: Normalverteilungskurve = Gaußsche Glockenkurve Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 14 SPSS • Abhängigkeit und Unabhängigkeit der Stichproben – Zwei Stichproben sind dann voneinander abhängig, wenn jedem Wert der einen Stichprobe auf sinnvolle und eindeutige Weise genau ein Wert der anderen Stichprobe zugeordnet werden kann. – Meist handelt es sich dabei um den Fall, dass eine Messung zu mehreren Zeitpunkten durchgeführt wurde; die Werte zu den verschiedenen Zeitpunkten führen dann zu abhängigen Stichproben. Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 15 SPSS • Übersicht über gängige Mittelwerttests – Intervallskalierte, normalverteilte Variablen (Mittelwert vergleichen) Anzahl der miteinander zu vergleichenden Stichproben Abhängigkeit Test 2 unabhängig t-Test nach Student 2 abhängig t-Test für abhängige Stichproben >2 unabhängig Einfache Varianzanalyse >2 abhängig Einfache Varianzanalyse mit Meßwiederholungen Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 16 SPSS • Übersicht über gängige Mittelwerttests – Ordinalskalierte oder nichtnormalverteilte intervallskalierte Variablen (nichtparametrische Tests) Anzahl der miteinander zu vergleichenden Stichproben Abhängigkeit Test 2 unabhängig U-Test nach Mann und Whitney 2 abhängig Wilcoxon Test >2 unabhängig H-Test nach Kruskal und Wallis >2 abhängig Friedman-Test Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 17 SPSS • Die Irrtumswahrscheinlichkeit p – Hypothesenformulierung: • Hypothese 0 (Nullhypothese): Die beiden Stichproben entstammen der gleichen Grundgesamtheit (d.h. Der Mittelwertsunterschied ist zufällig zustandegekommen) • Hypothese 1 (Alternativhypothese): Die beiden Stichproben entstammen verschiedenen Grundgesamtheiten (d.h. der Mittelwertsunterschied ist nicht zufällig zustandegekommen) Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 18 SPSS • Die Irrtumswahrscheinlichkeit p – Die Prüfstatistik hat Verfahren entwickelt, die aus den gegebenen Stichprobenwerten bzw. den daraus resultierenden Kennwerten nach bestimmten Formeln sogenannte Prüfgrößen berechnet. – Diese Prüfgrößen folgen bestimmten theoretischen Verteilungen (t-Verteilung, F-Verteilung, x2-Verteilung u.a.), welche die Berechnung der sogenannten Irrtumswahrscheinlichkeit erlauben. Es ist dies die Wahrscheinlichkeit, sich zu irren, wenn man die Nullhypothese verwirft und die Alternativhypothese annimmt. Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 19 SPSS • Die Irrtumswahrscheinlichkeit p Irrtumswahrscheinlichkeit Bedeutung Symbolisierung P > 0,05 Nicht signifikant Ns P <= 0,05 Signifikant * P <= 0,01 Sehr signifikant ** P <= 0,001 Höchst signifikant *** Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 20 SPSS • Statistischer Wegweiser – Strukturierung, Eingabe und Überprüfung der Daten • Strukturieren Sie Ihre Datenmenge, indem Sie vor allem klären, welches Ihre Fälle und welches Ihre Variablen sind. • Klären Sie das Skalenniveau Ihrer Variablen ab • Erstellen Sie einen Codeplan • Geben Sie die Daten unter Berücksichtigung des Codeplans mit Hlfe des Daten-Editors ein. (alternativ Excel..) • Überprüfen Sie die Daten auf Eingabefehler und Plausibiltät – Stellen Sie fest, ob Ihre intervallskalierten Variablen normalverteilt sind oder nicht – Deskriptive Auswertung – Analytische Statistik Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 21 SPSS • Grundsätzliches zu Hypothesen – Jede statistische Analyse dient der Überprüfung von Hypothesen – Man unterscheidet • Nullhypothese • Alternativhypothese • Signifikanzniveau < 5% (< 1%) Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 22 SPSS • Null- Alternativhypothese Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 23 SPSS • Kreuztabelle – „Erstellung von zwei- oder mehrdimensionalen Tabellen und Prüfung von Hypothesen von Unterschieden und Zusammenhängen in Kontigenztabellen“ – Kreuztabellen: Statistiken • Chi-Quadrat-Test: Der Chi-Quadrat Wert mit der Bezeichnung Pearson wird ausgegeben. Es gilt die Hypothese zu testen, ob die Zeilen und Spaltenvariablen unabhängig voneinander sind. • Ein niedriger Signifkanzwert (p < 0,05) indiziert, dass es eine Beziehung zwischen den zwei Variablen gibt. Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 24 Vielen Dank für ihre Aufmerksamkeit. Management Center Innsbruck Universitätsstraße 15 A-6020 Innsbruck Tel: +43 (0) 512 / 20 70 -1000 Fax: +43 (0)512 / 20 70 -1099 [email protected] www.mci.edu Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik Folie 25