SPSS - Statistik

Werbung
fh – management,
communication & it
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 1
SPSS
• Überblick
–
–
–
–
–
–
Grundlagen (Testvoraussetzungen)
Mittelwertvergleiche (t-Test,..)
Nichtparametrische Tests
Korrelationen
Regressionsanalyse
.....
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 2
SPSS
• Überblick
–
–
–
–
–
.....
Varianzanalyse
Diskrimanzanalyse
Faktorenanalyse
Clusteranalyse
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 3
SPSS
• Statistische Grundbegriffe
– Voraussetzungen für die Anwendung eines statistischen Tests
• Welches Skalenniveau hat die betreffende Variable ?
• Falle es sich um eine intervallskalierte Variable handelt: Liegt
Normalverteilung der Werte vor ?
• Handelt es sich bei den zu vergleichenden Stichproben um unabhängige
oder abhängige Stichproben ?
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 4
SPSS
• Skalenniveau:
– Nominal: Das nominale Skalenniveau ist das „unterste“ in der
Typologie, da keine Voraussetzungen über Beziehungen zwischen
den Werten erforderlich sind. Jeder Wert definiert eine einzelne
Kategorie und dient lediglich als Label oder Name der Kategorie.
– Ordinal: Wenn eine Rangordnung zwischen den Kategorien nach
irgend einem Kriterium möglich ist, liegt eine ordinales Skalenniveau
vor.
– Metrisch: (Intervall- oder Verhältnisskala) Zusätzlich zur Ordnung
haben intervallskalierte Messungen die Eigenschaft aussagefähige
Abstände zwischen den Werten. Verhältnis-Skalen haben alle
Ordnungs- und Abstandseigenschaften einer Intervallskala.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 5
SPSS
• Skalenniveau/Empirische Relevanz
Skalenniveau
Nominal
Ordinal
Intervall
Verhältnis
Empirische Relevanz
Keine
Ordnung der Zahlen
Differenz der Zahlen
Verhältnisse der Zahlen
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 6
SPSS
• Beispiele fürs Skalenniveau
– Geschlecht:
•
1 = männlich
•
2 = weiblich
•
•
•
gleichwertig wie
1 = weiblich
2 = männlich
– nominalen Variable mit zwei Ausprägungen
= dichotome Variable
– --> nur Häufigkeitsauswertung
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 7
SPSS
• Beispiele fürs Skalenniveau
– Familienstand:
•
1 = ledig
•
2 = verheiratet
•
3 = verwitwet
•
4 = geschieden
– nominal
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 8
SPSS
• Beispiele fürs Skalenniveau
– Rauchgewohnheiten:
•
1 = Nichtraucher
•
2 = mäßiger Raucher
•
3 = starker Raucher
•
4 = sehr starker Raucher
--> Ordnungsrelation
– ordinalskalierte Variable (Mittelwerte, Median)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 9
SPSS
• Beispiele fürs Skalenniveau
– monatliches Nettoeinkommen:
•
1 = bis 1500 Euro
•
2 = 1501 – 2500 Euro
•
3 = über 2500 Euro
--> ordinalskalierte Variable
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 10
SPSS
• Beispiele fürs Skalenniveau
– Intelligenzquotient
Rangordnung + Bedeutung von Differenzen →
intervallskalierte Variable (Differenz des Intervalls)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 11
SPSS
• Beispiele fürs Skalenniveau
– Alter
--> höchste Stufe der Skalierung
Man kann sagen Gustav (60) ist doppelt als Max (30)
Es sind dies alle intervallskalierte Variablen, die einen absoluten
Nullpunkt besitzen.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 12
SPSS
• Spezielle Lagermaße:
– Mittelwert: Mittelwert zur Kennzeichnung zentraler Tendenzen der
Daten
– Median: der Median oder Zentralwert ist der Wert, der die geordneten
Daten genau halbiert, d.h. 50% der Daten liegen oberhalb und 50%
liegen unterhalb des Median.
– Modus: der Modus ist der Wert mit der größten Häufigkeit in einem
Datensatz
– Varianz/Standabweichung: Varianz und Standardabweichung
ermitteln die (quadrierten) Abweichungen jedes Einzelwertes vom
Mittelwert
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 13
SPSS
• Normalverteilung:
– Die Anwendung zahlreicher Verfahren setzt voraus, die
intervallskalierte Variablen betreffen, dass deren Werte normalverteilt
sind.
– Die ist eine Verteilung, bei der sich die meisten Werte um den
Mittelwert gruppieren, während die Häufigkeiten nach beiden Seiten
hin gleichmäßig abfallen.
– Grafische Darstellung:
Normalverteilungskurve = Gaußsche Glockenkurve
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 14
SPSS
• Abhängigkeit und Unabhängigkeit der Stichproben
– Zwei Stichproben sind dann voneinander abhängig, wenn jedem Wert
der einen Stichprobe auf sinnvolle und eindeutige Weise genau ein
Wert der anderen Stichprobe zugeordnet werden kann.
– Meist handelt es sich dabei um den Fall, dass eine Messung zu
mehreren Zeitpunkten durchgeführt wurde; die Werte zu den
verschiedenen Zeitpunkten führen dann zu abhängigen Stichproben.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 15
SPSS
• Übersicht über gängige Mittelwerttests
– Intervallskalierte, normalverteilte Variablen (Mittelwert vergleichen)
Anzahl der miteinander zu
vergleichenden Stichproben
Abhängigkeit
Test
2
unabhängig
t-Test nach Student
2
abhängig
t-Test für abhängige Stichproben
>2
unabhängig
Einfache Varianzanalyse
>2
abhängig
Einfache Varianzanalyse mit
Meßwiederholungen
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 16
SPSS
• Übersicht über gängige Mittelwerttests
– Ordinalskalierte oder nichtnormalverteilte intervallskalierte Variablen
(nichtparametrische Tests)
Anzahl der miteinander zu
vergleichenden Stichproben
Abhängigkeit
Test
2
unabhängig
U-Test nach Mann und Whitney
2
abhängig
Wilcoxon Test
>2
unabhängig
H-Test nach Kruskal und Wallis
>2
abhängig
Friedman-Test
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 17
SPSS
• Die Irrtumswahrscheinlichkeit p
– Hypothesenformulierung:
• Hypothese 0 (Nullhypothese): Die beiden Stichproben entstammen der
gleichen Grundgesamtheit (d.h. Der Mittelwertsunterschied ist zufällig
zustandegekommen)
• Hypothese 1 (Alternativhypothese): Die beiden Stichproben entstammen
verschiedenen Grundgesamtheiten (d.h. der Mittelwertsunterschied ist
nicht zufällig zustandegekommen)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 18
SPSS
• Die Irrtumswahrscheinlichkeit p
– Die Prüfstatistik hat Verfahren entwickelt, die aus den
gegebenen Stichprobenwerten bzw. den daraus
resultierenden Kennwerten nach bestimmten Formeln
sogenannte Prüfgrößen berechnet.
– Diese Prüfgrößen folgen bestimmten theoretischen
Verteilungen (t-Verteilung, F-Verteilung, x2-Verteilung u.a.),
welche die Berechnung der sogenannten
Irrtumswahrscheinlichkeit erlauben. Es ist dies die
Wahrscheinlichkeit, sich zu irren, wenn man die
Nullhypothese verwirft und die Alternativhypothese annimmt.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 19
SPSS
• Die Irrtumswahrscheinlichkeit p
Irrtumswahrscheinlichkeit
Bedeutung
Symbolisierung
P > 0,05
Nicht signifikant
Ns
P <= 0,05
Signifikant
*
P <= 0,01
Sehr signifikant
**
P <= 0,001
Höchst signifikant
***
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 20
SPSS
• Statistischer Wegweiser
– Strukturierung, Eingabe und Überprüfung der Daten
• Strukturieren Sie Ihre Datenmenge, indem Sie vor allem klären, welches
Ihre Fälle und welches Ihre Variablen sind.
• Klären Sie das Skalenniveau Ihrer Variablen ab
• Erstellen Sie einen Codeplan
• Geben Sie die Daten unter Berücksichtigung des Codeplans mit Hlfe des
Daten-Editors ein. (alternativ Excel..)
• Überprüfen Sie die Daten auf Eingabefehler und Plausibiltät
– Stellen Sie fest, ob Ihre intervallskalierten Variablen normalverteilt
sind oder nicht
– Deskriptive Auswertung
– Analytische Statistik
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 21
SPSS
• Grundsätzliches zu Hypothesen
– Jede statistische Analyse dient der Überprüfung von Hypothesen
– Man unterscheidet
• Nullhypothese
• Alternativhypothese
• Signifikanzniveau < 5% (< 1%)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 22
SPSS
• Null- Alternativhypothese
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 23
SPSS
• Kreuztabelle
– „Erstellung von zwei- oder mehrdimensionalen Tabellen und Prüfung
von Hypothesen von Unterschieden und Zusammenhängen in
Kontigenztabellen“
– Kreuztabellen: Statistiken
• Chi-Quadrat-Test: Der Chi-Quadrat Wert mit der Bezeichnung Pearson
wird ausgegeben. Es gilt die Hypothese zu testen, ob die Zeilen und
Spaltenvariablen unabhängig voneinander sind.
• Ein niedriger Signifkanzwert (p < 0,05) indiziert, dass es eine Beziehung
zwischen den zwei Variablen gibt.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 24
Vielen Dank für ihre
Aufmerksamkeit.
Management Center Innsbruck
Universitätsstraße 15
A-6020 Innsbruck
Tel: +43 (0) 512 / 20 70 -1000
Fax: +43 (0)512 / 20 70 -1099
[email protected]
www.mci.edu
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 25
Herunterladen