Grundlagen Statistik Angewandte Statistik – 3. Semester Übung 5 Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Grundlagen der Statistik • Übersicht ◦ Semester 1 – Einführung ins SPSS – Auswertung im SPSS anhand eines Beispieles – Häufigkeitsauswertungen – Grafiken – Statistische Grundlagen – Datenmanipulationen – Mehrfachantworten – Kreuztabellen – Mittelwertevergleich – Korrelationsanalyse Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Überblick • • • • • • Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-Test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse ..... Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Überblick • • • • • ..... Varianzanalyse Diskrimanzanalyse Faktorenanalyse Clusteranalyse Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Voraussetzungen für die Anwendung eines statistischen Tests • Welches Skalenniveau hat die betreffende Variable? • Falle es sich um eine intervallskalierte Variable handelt: Liegt Normalverteilung der Werte vor? • Handelt es sich bei den zu vergleichenden Stichproben um unabhängige oder abhängige Stichproben? Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Skalenniveau • Nominal:Das nominale Skalenniveau ist das „unterste“ in der Typologie, da keine Voraussetzungen über Beziehungen zwischen den Werten erforderlich sind. Jeder Wert definiert eine einzelne Kategorie und dient lediglich als Label oder Name der Kategorie. • Ordinal:Wenn eine Rangordnung zwischen den Kategorien nach irgend einem Kriterium möglich ist, liegt eine ordinales Skalenniveau vor. • Metrisch:(Intervall- oder Verhältnisskala) Zusätzlich zur Ordnung haben intervallskalierte Messungen die Eigenschaft aussagefähige Abstände zwischen den Werten. Verhältnis-Skalen haben alle Ordnungs- und Abstandseigenschaften einer Intervallskala. Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Skalenniveau/Empirische Relevanz Skalenniveau Empirische Relevanz Nominal keine Ordinal Ordnung der Zahlen Intervall Differenz der Zahlen Verhältnis Verhältnisse der Zahlen Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • Geschlecht: 1 = männlich 2 = weiblich • gleichwertig wie 1 = weiblich 2 = männlich • nominalen Variable mit zwei Ausprägungen = dichotome Variable → nur Häufigkeitsauswertung Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • Familienstand: 1 = ledig 2 = verheiratet 3 = verwitwet 4 = geschieden → nominal Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • Rauchgewohnheiten: 1 = Nichtraucher 2 = mäßiger Raucher 3 = starker Raucher 4 = sehr starker Raucher → Ordnungsrelation • ordinalskalierte Variable (Mittelwerte, Median) Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • monatliches Nettoeinkommen: 1 = bis 1500 Euro 2 = 1501 – 2500 Euro 3 = über 2500 Euro → ordinalskalierte Variable Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • Intelligenzquotient Rangordnung + Bedeutung von Differenzen → intervallskalierte Variable (Differenz des Intervalls) Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Beispiele fürs Skalenniveau • Alter → höchste Stufe der Skalierung Man kann sagen Gustav (60) ist doppelt als Max (30) Es sind dies alle intervallskalierte Variablen, die einen absoluten Nullpunkt besitzen. Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Spezielle Lagemaße • Mittelwert: Mittelwert zur Kennzeichnung zentraler Tendenzen der Daten • Median: der Median oder Zentralwert ist der Wert, der die geordneten Daten genau halbiert, d.h. 50% der Daten liegen oberhalb und 50% liegen unterhalb des Median. • Modus: der Modus ist der Wert mit der größten Häufigkeit in einem Datensatz • Varianz/Standabweichung: Varianz und Standardabweichung ermitteln die (quadrierten) Abweichungen jedes Einzelwertes vom Mittelwert Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Normalverteilung • Die Anwendung zahlreicher Verfahren setzt voraus, die intervallskalierte Variablen betreffen, dass deren Werte normalverteilt sind. • Die ist eine Verteilung, bei der sich die meisten Werte um den Mittelwert gruppieren, während die Häufigkeiten nach beiden Seiten hin gleichmäßig abfallen. • Grafische Darstellung: Normalverteilungskurve = Gaußsche Glockenkurve Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Abhängigkeit und Unabhängigkeit der Stichproben • Zwei Stichproben sind dann voneinander abhängig, wenn jedem Wert der einen Stichprobe auf sinnvolle und eindeutige Weise genau ein Wert der anderen Stichprobe zugeordnet werden kann. • Meist handelt es sich dabei um den Fall, dass eine Messung zu mehreren Zeitpunkten durchgeführt wurde; die Werte zu den verschiedenen Zeitpunkten führen dann zu abhängigen Stichproben. Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Übersicht über gängige Mittelwerttest • Intervallskaliert, normalverteilte Variablen (Mittelwert vergleichen) Anzahl der zu vergleichenden Stichproben Abhängigkeit Test 2 unabhängig T-Test nach Student 2 abhängig T-Test für abhängige Stichproben >2 unabhängig Einfache Varianzanalyse >2 abhängig Einfache Varianzanlyse mit Meßwiederholungen Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Übersicht über gängige Mittelwerttest • Ordinalskaliert oder nicht normalverteilte intervallskalierte Variablen (nichtparametrische Tests)) Anzahl der zu vergleichenden Stichproben Abhängigkeit Test 2 unabhängig U-Test nach Mann und Whitney 2 abhängig Wilcoxon Test >2 unabhängig H-Test nach Kruskal und Wallis >2 abhängig Friedman-Test Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Die Irrtumswahrscheinlichkeit p • Hypothesenformulierung: ◦ Hypothese 0 (Nullhypothese): Die beiden Stichproben entstammen der gleichen Grundgesamtheit (d.h. Der Mittelwertsunterschied ist zufällig zustandegekommen) ◦ Hypothese 1 (Alternativhypothese): Die beiden Stichproben entstammen verschiedenen Grundgesamtheiten (d.h. der Mittelwertsunterschied ist nicht zufällig zustandegekommen) Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Die Irrtumswahrscheinlichkeit p • Die Prüfstatistik hat Verfahren entwickelt, die aus den gegebenen Stichprobenwerten bzw. den daraus resultierenden Kennwerten nach bestimmten Formeln sogenannte Prüfgrößen berechnet. • Diese Prüfgrößen folgen bestimmten theoretischen Verteilungen (tVerteilung, F-Verteilung, x2-Verteilung u.a.), welche die Berechnung der sogenannten Irrtumswahrscheinlichkeit erlauben. Es ist dies die Wahrscheinlichkeit, sich zu irren, wenn man die Nullhypothese verwirft und die Alternativhypothese annimmt Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Die Irrtumswahrscheinlichkeit p Irrtumswahrscheinlichkeit Bedeutung Symbolisierung P > 0,05 Nicht signifikant Ns P <= 0,05 Signifikant * P <= 0,01 Sehr signifikant ** P <= 0,001 Höchst signifikant *** Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Statistischer Wegweiser • Strukturierung, Eingabe und Überprüfung der Daten ◦ Strukturieren Sie Ihre Datenmenge, indem Sie vor allem klären, welches Ihre Fälle und welches Ihre Variablen sind. ◦ Klären Sie das Skalenniveau Ihrer Variablen ab ◦ Erstellen Sie einen Codeplan ◦ Geben Sie die Daten unter Berücksichtigung des Codeplans mit Hilfe des Daten-Editors ein. (alternativ Excel..) ◦ Überprüfen Sie die Daten auf Eingabefehler und Plausibiltät • Stellen Sie fest, ob Ihre intervallskalierten Variablen normalverteilt sind oder nicht ◦ Deskriptive Auswertung ◦ Analytische Statistik Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Grundsätzliches zu Hypothesen • Jede statistische Analyse dient der Überprüfung von Hypothesen • Man unterscheidet ◦ Nullhypothese ◦ Alternativhypothese ◦ Signifikanzniveau < 5% (< 1%) Grundlagen Statistik / ©2012 CvC it-services Grundlagen Statistik • Null- und Alternativhypothese Grundlagen Statistik / ©2012 CvC it-services