Angewandte Statistik – 3. Semester

Werbung
Grundlagen Statistik
Angewandte Statistik – 3. Semester
Übung 5
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Grundlagen der Statistik
• Übersicht
◦ Semester 1
– Einführung ins SPSS 
– Auswertung im SPSS anhand eines Beispieles 
– Häufigkeitsauswertungen 
– Grafiken 
– Statistische Grundlagen 
– Datenmanipulationen 
– Mehrfachantworten 
– Kreuztabellen 
– Mittelwertevergleich
– Korrelationsanalyse
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Überblick
•
•
•
•
•
•
Grundlagen (Testvoraussetzungen)
Mittelwertvergleiche (t-Test,..)
Nichtparametrische Tests
Korrelationen
Regressionsanalyse
.....
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Überblick
•
•
•
•
•
.....
Varianzanalyse
Diskrimanzanalyse
Faktorenanalyse
Clusteranalyse
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Voraussetzungen für die Anwendung eines
statistischen Tests
• Welches Skalenniveau hat die betreffende Variable?
• Falle es sich um eine intervallskalierte Variable handelt:
Liegt Normalverteilung der Werte vor?
• Handelt es sich bei den zu vergleichenden Stichproben
um unabhängige oder abhängige Stichproben?
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Skalenniveau
• Nominal:Das nominale Skalenniveau ist das „unterste“ in der
Typologie, da keine Voraussetzungen über Beziehungen zwischen
den Werten erforderlich sind. Jeder Wert definiert eine einzelne
Kategorie und dient lediglich als Label oder Name der Kategorie.
• Ordinal:Wenn eine Rangordnung zwischen den Kategorien nach
irgend einem Kriterium möglich ist, liegt eine ordinales Skalenniveau
vor.
• Metrisch:(Intervall- oder Verhältnisskala) Zusätzlich zur Ordnung
haben intervallskalierte Messungen die Eigenschaft aussagefähige
Abstände zwischen den Werten. Verhältnis-Skalen haben alle
Ordnungs- und Abstandseigenschaften einer Intervallskala.
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Skalenniveau/Empirische Relevanz
Skalenniveau
Empirische Relevanz
Nominal
keine
Ordinal
Ordnung der Zahlen
Intervall
Differenz der Zahlen
Verhältnis
Verhältnisse der Zahlen
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• Geschlecht:
1 = männlich
2 = weiblich
• gleichwertig wie
1 = weiblich
2 = männlich
• nominalen Variable mit zwei Ausprägungen
= dichotome Variable
→ nur Häufigkeitsauswertung
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• Familienstand:
1 = ledig
2 = verheiratet
3 = verwitwet
4 = geschieden
→ nominal
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• Rauchgewohnheiten:
1 = Nichtraucher
2 = mäßiger Raucher
3 = starker Raucher
4 = sehr starker Raucher
→ Ordnungsrelation
• ordinalskalierte Variable (Mittelwerte, Median)
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• monatliches Nettoeinkommen:
1 = bis 1500 Euro
2 = 1501 – 2500 Euro
3 = über 2500 Euro
→ ordinalskalierte Variable
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• Intelligenzquotient
Rangordnung + Bedeutung von Differenzen →
intervallskalierte Variable (Differenz des Intervalls)
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Beispiele fürs Skalenniveau
• Alter
→ höchste Stufe der Skalierung
Man kann sagen Gustav (60) ist doppelt als Max (30)
Es sind dies alle intervallskalierte Variablen, die einen absoluten
Nullpunkt besitzen.
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Spezielle Lagemaße
• Mittelwert: Mittelwert zur Kennzeichnung zentraler Tendenzen der
Daten
• Median: der Median oder Zentralwert ist der Wert, der die
geordneten Daten genau halbiert, d.h. 50% der Daten liegen
oberhalb und 50% liegen unterhalb des Median.
• Modus: der Modus ist der Wert mit der größten Häufigkeit in einem
Datensatz
• Varianz/Standabweichung: Varianz und Standardabweichung
ermitteln die (quadrierten) Abweichungen jedes Einzelwertes vom
Mittelwert
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Normalverteilung
• Die Anwendung zahlreicher Verfahren setzt voraus, die
intervallskalierte Variablen betreffen, dass deren Werte
normalverteilt sind.
• Die ist eine Verteilung, bei der sich die meisten Werte
um den Mittelwert gruppieren, während die Häufigkeiten
nach beiden Seiten hin gleichmäßig abfallen.
• Grafische Darstellung:
Normalverteilungskurve = Gaußsche Glockenkurve
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Abhängigkeit und Unabhängigkeit der Stichproben
• Zwei Stichproben sind dann voneinander abhängig,
wenn jedem Wert der einen Stichprobe auf sinnvolle und
eindeutige Weise genau ein Wert der anderen
Stichprobe zugeordnet werden kann.
• Meist handelt es sich dabei um den Fall, dass eine
Messung zu mehreren Zeitpunkten durchgeführt wurde;
die Werte zu den verschiedenen Zeitpunkten führen
dann zu abhängigen Stichproben.
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Übersicht über gängige Mittelwerttest
• Intervallskaliert, normalverteilte Variablen (Mittelwert
vergleichen)
Anzahl der zu
vergleichenden
Stichproben
Abhängigkeit
Test
2
unabhängig
T-Test nach Student
2
abhängig
T-Test für abhängige
Stichproben
>2
unabhängig
Einfache Varianzanalyse
>2
abhängig
Einfache Varianzanlyse mit
Meßwiederholungen
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Übersicht über gängige Mittelwerttest
• Ordinalskaliert oder nicht normalverteilte
intervallskalierte Variablen (nichtparametrische Tests))
Anzahl der zu
vergleichenden
Stichproben
Abhängigkeit
Test
2
unabhängig
U-Test nach Mann und
Whitney
2
abhängig
Wilcoxon Test
>2
unabhängig
H-Test nach Kruskal und
Wallis
>2
abhängig
Friedman-Test
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Die Irrtumswahrscheinlichkeit p
• Hypothesenformulierung:
◦ Hypothese 0 (Nullhypothese): Die beiden Stichproben
entstammen der gleichen Grundgesamtheit (d.h. Der
Mittelwertsunterschied ist zufällig zustandegekommen)
◦ Hypothese 1 (Alternativhypothese): Die beiden Stichproben
entstammen verschiedenen Grundgesamtheiten (d.h. der
Mittelwertsunterschied ist nicht zufällig zustandegekommen)
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Die Irrtumswahrscheinlichkeit p
• Die Prüfstatistik hat Verfahren entwickelt, die aus den gegebenen
Stichprobenwerten bzw. den daraus resultierenden Kennwerten nach
bestimmten Formeln sogenannte Prüfgrößen berechnet.
• Diese Prüfgrößen folgen bestimmten theoretischen Verteilungen (tVerteilung, F-Verteilung, x2-Verteilung u.a.), welche die Berechnung
der sogenannten Irrtumswahrscheinlichkeit erlauben. Es ist dies die
Wahrscheinlichkeit, sich zu irren, wenn man die Nullhypothese
verwirft und die Alternativhypothese annimmt
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Die Irrtumswahrscheinlichkeit p
Irrtumswahrscheinlichkeit
Bedeutung
Symbolisierung
P > 0,05
Nicht signifikant
Ns
P <= 0,05
Signifikant
*
P <= 0,01
Sehr signifikant
**
P <= 0,001
Höchst signifikant
***
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Statistischer Wegweiser
• Strukturierung, Eingabe und Überprüfung der Daten
◦ Strukturieren Sie Ihre Datenmenge, indem Sie vor allem klären,
welches Ihre Fälle und welches Ihre Variablen sind.
◦ Klären Sie das Skalenniveau Ihrer Variablen ab
◦ Erstellen Sie einen Codeplan
◦ Geben Sie die Daten unter Berücksichtigung des Codeplans mit
Hilfe des Daten-Editors ein. (alternativ Excel..)
◦ Überprüfen Sie die Daten auf Eingabefehler und Plausibiltät
• Stellen Sie fest, ob Ihre intervallskalierten Variablen
normalverteilt sind oder nicht
◦ Deskriptive Auswertung
◦ Analytische Statistik
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Grundsätzliches zu Hypothesen
• Jede statistische Analyse dient der Überprüfung von
Hypothesen
• Man unterscheidet
◦ Nullhypothese
◦ Alternativhypothese
◦ Signifikanzniveau < 5% (< 1%)
Grundlagen Statistik / ©2012 CvC it-services
Grundlagen Statistik
• Null- und Alternativhypothese
Grundlagen Statistik / ©2012 CvC it-services
Herunterladen