Lösung von Grundaufgaben mit SPSS Version 11.5

1
Angewandte Statistik:
Lösung von Grundaufgaben mit SPSS
Version 11.5
Daten: grund??.sav
Ausgabe WS 2003/04
Begleitskriptum zum Lehrbuch: W. Timischl: Biostatistik, Wien - New York: Springer 2000.
Problemlösung (schematisch) mit dem Datenanalysesystem SPSS:
Dateneingabe:
Direkteingabe (Datei-Neu) oder durch
Importieren einer Datei (Datei-Öffnen,
z.B. Dateien vom Typ sav, xls, txt, ...)
DATEN-FENSTER
mit SPSS-Datenmatrix:
Variable > Spalten,
Untersuchungseinheiten > Zeilen
Datenmanipulation wie z.B.:
- Daten-Fälle sortieren ...
- Daten-Fälle auswählen ...
- Daten-Fälle gewichten ...
- Transformieren-Berechnen ...
Auswerten mit Menueoptionen wie z.B.:
- Analysieren-Deskriptive StatistikenExplorative Datenanalyse ...
- Analysieren-Mittelwerte vergleichenT-Test bei einer Stichprobe ...
- Grafiken-Balken ...
- Grafiken-Streudiagramm ...
EINFÜGEN
OK
SYNTAX-FENSTER
mit SPSS-Programm, z.B.:
EXAMINE
VARIABLES=x_7 BY typ
/PLOT BOXPLOT
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
AUSFÜHREN
VIEWER-FENSTER
mit Ergebnissen
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
2
Grundaufgabe 1:
Berechnungen im Datenfenster (Rechnen mit Wahrscheinlichkeiten)
(i) Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Vari anz
0.25. Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten?
(ii) Bei einem Test werden 5 Aufgaben derart gestellt, daß es bei jeder Aufgabe 4 Antwortmöglichkeiten gibt, von denen
genau eine die richtige ist. Wie groß ist die Wahrscheinlichkeit, daß man mehr als die Hälfte der Aufgaben richtig löst,
wenn die Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit 1/4 gewählt
wird?
Lösung:
(i) Daten-Fenster:
Hauptmenü:
Transformieren –
Berechnen …
Ergebnis:
anteil = 0,9545 = 95,45%
(ii) Wahrscheinlichkeit = 1- CDF.BINOM(2,5,0.25) = 10.35%
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
3
Grundaufgabe 2:
Eindimensionale Datenbeschreibung
Man vergleiche die Verteilungen der Spaltöffnungslängen (Merkmal X, in mm) bei diploiden und tetraploiden Biscutella
laevigata .
X/diploid:
X/tetraploid:
27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23,24, 26, 26
28, 30, 28, 32, 25, 29, 28, 33, 32, 28, 28, 30, 32, 31, 31, 34, 29, 36, 33, 30, 29, 27, 27, 29, 26
Datei: grund02.sav
Lösung:
Daten-Fenster:
Hauptmenü:
Analysieren –
Deskriptive Statistiken –
Explorative Datenanalyse ...
Syntax-Fenster:
SPSS-Programmcode
(Einfügen)
EXAMINE
VARIABLES=x_7 BY typ
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
4
Viewer-Fenster: Ergebnisse (teilweise)
Univariate Statistiken
TYP
diploid
Spaltöffnungslänge
tetraploid
Mittelwert
95% Konfidenzintervall
des Mittelwerts
5% getrimmtes Mittel
Median
Varianz
Standardabweichung
Minimum
Maximum
Spannweite
Interquartilbereich
Schiefe
Kurtosis
Mittelwert
95% Konfidenzintervall
des Mittelwerts
Statistik
24,67
23,79
25,55
24,69
25,00
2,524
1,59
22
27
5
3,00
-,105
-1,174
29,80
28,71
30,89
29,73
29,00
6,917
2,63
25
36
11
4,00
,430
-,070
Untergrenze
Obergrenze
Untergrenze
Obergrenze
5% getrimmtes Mittel
Median
Varianz
Standardabweichung
Minimum
Maximum
Spannweite
Interquartilbereich
Schiefe
Kurtosis
Standardfehler
,41
,580
1,121
,53
,464
,902
Schnelltest („quick and dirty“) auf Abweichungen von der Normalverteilung:
Daten sind mit Normalverteilungsannahme verträglich, wenn sowohl die Schiefe als auch die Kurtosis nicht
„signifikant“ von null abweichen. Für nicht zu kleine Stichprobenumfänge vertretbare Näherungen für 95%Konfidenzintervalle für die Schiefe und Kurtosis erhält man, indem man um den jeweiligen Schätzwert ein
Intervall mit dem entsprechenden 2-fachen Standardfehler bildet. Liegt die null außerhalb dieses Intervalls,
besteht – mit einem Irrtumsrisiko von 5% - eine signifikante Abweichung von null.
Spaltöffnungslänge Stem-and-Leaf Plot for
TYP= diploid
Frequency
Stem &
Leaf
22
23
24
25
26
27
0
0000
0
0000
000
00
Spaltöffnungslänge Stem-and-Leaf Plot
for
TYP= tetraploid
Frequency
1,00
4,00
1,00
4,00
3,00
2,00
Stem width:
Each leaf:
.
.
.
.
.
.
1
1 case(s)
1,00
3,00
9,00
5,00
5,00
1,00
1,00
Stem width:
Each leaf:
W. Timischl, LV-Nr. 859 903, grund_spss11neu
Stem &
2
2
2
3
3
3
3
.
.
.
.
.
.
.
Leaf
5
677
888889999
00011
22233
4
6
10
1 case(s)
08.03.04
5
38
36
34
32
Spaltöffnungslänge
30
28
26
24
22
20
N=
15
25
diploid
tetraploid
TYP
Grundaufgabe 3:
Vergleich einer Wahrscheinlichkeit mit einem Sollwert (Binomialtest)
Bei einer Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60
keimten 35 Zwiebeln.
(i) Liegt eine signifikante Abweichung vom garantierten Prozentsatz vor? Man prüfe diese Frage auf dem
Signifikanzniveau α=5%.
(ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von
90% feststellen zu können?
Datei: grund3.sav
Lösung:
(i) Daten-Fenster:
DatenFälle gewichten …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
6
Keimfähigkeit
Anzeige der Daten
(im Viewer):
Analysieren –
Deskriptive Statistiken –
Häufigkeiten ...
Gültig
1 (ja)
2 (nein)
Gesamt
Häufigkeit
35
25
60
Prozent
58,3
41,7
100,0
Gültige
Prozente
58,3
41,7
100,0
Kumulierte
Prozente
58,3
100,0
Einseitiger Binomialtest: H0: p>=0.75, H1: p<0.75
Hauptmenü im Datenfenster:
Analysieren –
Nichtparametrische Tests –
Binomial ...
Test auf Binomialverteilung
Viewer-Fenster:
Ergebnisse
Keimfähigkeit
Gruppe 1
Gruppe 2
Gesamt
Kategorie
ja
nein
N
35
25
60
Beobachteter
Anteil
,583333
,42
1,00
Testanteil
,75
Asymptotische
Signifikanz
(1-seitig)
,002a,b
a. Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,75.
b. Basiert auf der Z-Approximation.
Interpretation: 1-seit.Sign. (= P-Wert) = 0,002 = Risiko für irrtümliche Ablehnung von H0
à H1 (p<0.75)
(ii) Fallzahlenschätzung - Formelauswertungen im Daten-Fenster
p_0=0.75, delta = 0.1;
z0_95= IDF.NORMAL(1-alpha,0,1) = 1.65, z0_90 = IDF.NORMAL(1-beta,0,1) = 1.28,
n = 1/delta**2 *(z0_95*SQRT(p_0*(1-p_0)) + z0_90*SQRT((p_0+delta)*(1-p_0-delta)))**2 ≅ 137
(Transformieren – Berechnen …)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
7
Grundaufgabe 4:
Vergleich eines Mittelwerts mit einem Sollwert
Während der Sommermonate wurden von einer Messstelle die in der folgenden Tabelle enthaltenen Ozonwerte (in
ppm/100) erfasst.
(i) Man erstelle eine geeignete Häufigkeitsverteilung (grafisch) und beschreibe die Verteilung durch die üblichen
deskriptiven Statistiken. Gibt es einen Grund, die Ozonwerte als nicht normalverteilt zu betrachten?
(ii) Man prüfe, ob die durchschnittliche Konzentration signifikant ( α= 5%) kleiner als 0.045 ppm ist.
3,6
6,7
2,5
6,7
5,4
1,5
2,5
3,0
1,7
4,1
6,6
5,4
5,6
5,3
5,1
6,0
4,5
4,7
4,6
5,6
4,2
5,4
6,5
7,4
5,4
6,1
5,8
9,5
6,9
6,6
7,6
8,2
3,4
3,2
4,4
6,2
3,1
8,8
4,7
5,7
6,0
5,8
7,3
3,8
4,5
5,5
2,6
1,3
5,9
7,7
Datei: grund04.sav
(i) Häufigkeitsverteilung
Hauptmenü im Datenfenster:
AnalysierenDeskriptive StatistikenExplorative Datenanalyse …
Univariate Statistiken
OZON
à Viewer-Fenster:
Ergebnisse (teilweise)
Statistik
5,212
Mittelwert
95% Konfidenzintervall
des Mittelwerts
Untergrenze
Obergrenze
4,686
5,738
5% getrimmtes Mittel
5,212
Median
5,400
Varianz
Standardfehler
,2619
3,429
Standardabweichung
1,8518
Minimum
1,3
Maximum
9,5
Spannweite
8,2
Interquartilbereich
2,500
Schiefe
-,116
,337
Kurtosis
-,165
,662
Tests auf Normalverteilung
Interpretation:
P = Risiko für irrtümliche
Kolmogorov-Smirnov(a)
Shapiro-Wilk
Ablehnung von H0
Statistik
df
Signifikanz
Statistik
df
Signifikanz
(Normalverteilung) ≥ 0,2
OZON
,100
50
,200(*)
,986
50
,832
(K-S-Test) ≥ 5%
* Dies ist eine untere Grenze der echten Signifikanz.
à auf 5%igem Testniveau
a Signifikanzkorrektur nach Lilliefors
kann H0 nicht abgelehnt
werden, d.h. Annahme der
Normalverteilung bleibt aufrecht.
Histogramm
20
Häufigkeit
10
Std.abw. = 1,85
Mittel = 5,21
N = 50,00
0
,75
3,75
2,25
W. Timischl, LV-Nr. 859 903, grund_spss11neu
OZON
6,75
5,25
9,75
8,25
08.03.04
8
Bearbeitung der Grafik:
Doppelklicken auf die Grafik
im Viewer-Fenster à
Öffnen des Chart-Fensters
mit Bearbeitungsoptionen
(ii) Sollwertvergleich
H0: mittlere Ozonkonzentration ≥ Sollwert = 4,5 vs. H1: mittlere Ozonkonzentration < Sollwert = 4,5
Hauptmenü:
AnalysierenMittelwerte vergleichenT-Test bei einer Stichprobe ...
Statistik bei einer Stichprobe
Viewer-Fenster:
Ergebnisse (teilweise)
N
OZON
50
Mittelwert
5,212
Standardabw
eichung
1,8518
Standardfehl
er des
Mittelwertes
,2619
Test bei einer Sichprobe
Testwert = 4.5
T
OZON
2,719
df
Sig. (2-seitig)
49
,009
Mittlere
Differenz
,712
95% Konfidenzintervall
der Differenz
Untere
,186
Obere
1,238
Interpretation:
Wenn - wie in diesem Beispiel - der Stichprobenmittelwert und der Sollwert im Sinne von H0
zueinander stehen: P = Risiko für irrtümliche Ablehnung von H0 = 1-(2-seit.Sig)/2 = 99,55%
à H0 nicht ablehnen.
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
9
Grundaufgabe 5:
Mittelwertvergleiche im Rahmen eines Parallelversuchs bzw. eines Paarvergleichs
An Hand der Datentabelle (siehe das Daten-Fenster) sollen folgende Fragen untersucht werden (α = 5%):
(i) Bewirkt das Testpräparat (Präparat=1) eine mittlere Abnahme Fe1-Fe2 der Zielvariablen (Serumeisen) vom
Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2), die von der durch das Kontrollpräparat (Präparat=2)
verursachten abweicht?
(ii) Zeigt die Zielvariable Serumeisen vom Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2) im Mittel
innerhalb jeder Präparatgruppe eine signifikante Änderung?
Datei: grund05.sav
Lösung:
(i) Parallelversuch
Bereitstellung der Zielvariablen
abnahme = Fe1 - Fe2
mit Hilfe von:
Transformieren - Berechnen ...
à Daten-Fenster
Berechnung von
deskriptiven Statistiken mit Hilfe von:
AnalysierenBerichteFälle zusammenfassen ...
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
10
Zusammenfassung von Fällen
Viewer – Fenster:
Ergebnisse
Präparat
Test
Alter/
Jahre
N
Serumeisen,
Zeitp.1
Serumeisen,
Zeitp.2
ABNAHME
8
8
8
8
Mittelwert
23,50
102,62
75,63
27,00
Standardabweichung
3,665
36,229
15,137
31,672
Standardfehler des
Mittelwertes
1,296
12,809
5,352
11,198
,418
-,190
,662
,193
,752
,752
,752
,752
-1,222
-2,077
-,309
-1,341
1,481
1,481
1,481
1,481
Schiefe
Standardfehler der Schiefe
Kurtosis
Standardfehler der Kurtosis
Kontrolle
N
8
8
8
8
Mittelwert
25,13
111,13
72,12
39,00
Standardabweichung
2,167
20,657
24,567
26,987
,766
7,303
8,686
9,541
-,549
-1,210
,445
-,060
,752
,752
,752
,752
-,663
2,820
-1,684
-1,451
1,481
1,481
1,481
1,481
16
16
16
16
Mittelwert
24,31
106,87
73,88
33,00
Standardabweichung
3,027
28,826
19,795
29,093
,757
7,206
4,949
7,273
-,193
-,581
,324
-,027
,564
,564
,564
,564
-1,014
-,900
-1,069
-1,275
1,091
1,091
1,091
1,091
Standardfehler des
Mittelwertes
Schiefe
Standardfehler der Schiefe
Kurtosis
Standardfehler der Kurtosis
Insgesamt
N
Standardfehler des
Mittelwertes
Schiefe
Standardfehler der Schiefe
Kurtosis
Standardfehler der Kurtosis
Prüfung auf Normalverteilung (H0: Daten aus normalverteilter Grundgesamtheit):
Zur Anwendung des Tests
in einem Arbeitsgang
auf beide Gruppen:
Daten - Datei aufteilen ...
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
11
Ausführung des Tests durch
AnalysierenNichtparametrische Tests–
K-S bei einer Stichprobe …
Kolmogorov-Smirnov-Anpassungstest(c)
Testergebnisse im
Viewer-Fenster:
ABNAHME
8
N
Mittelwert
Interpretation/Testpräparat:
P = Asymptotische Sign. =
0.987 ≥ 5% à
Normalverteilungsannahme
wird beibehalten
27,00
Parameter der
Normalverteilung(a,b)
Standardabweichung
Extremste Differenzen
Absolut
,159
Positiv
,159
Negativ
-,141
31,672
Kolmogorov-Smirnov-Z
,450
Asymptotische Signifikanz (2-seitig)
,987
a Die zu testende Verteilung ist eine Normalverteilung.
b Aus den Daten berechnet.
c Präparat = Test
Kolmogorov-Smirnov-Anpassungstest(c)
ABNAHME
Interpretation/Kontrollpräparat:
P = Asymptotische Sign. =
0.869 ≥ 5% à
Normalverteilungsannahme
wird beibehalten
N
8
Mittelwert
Parameter der
Normalverteilung(a,b)
Standardabweichung
Extremste Differenzen
Absolut
39,00
26,987
,211
Positiv
,125
Negativ
-,211
Kolmogorov-Smirnov-Z
Asymptotische Signifikanz (2-seitig)
,596
,869
a Die zu testende Verteilung ist eine Normalverteilung.
b Aus den Daten berechnet.
c Präparat = Kontrolle
Mittelwertvergleich mit dem t-Test für unabhängige Stichproben:
H0: mittl. abnahme/Test = mittl. abnahme/Kontrolle vs. H1: mittl. abnahme/Test ≠ mittl. abnahme/Kontrolle
Wichtig: vor Anwendung des t-Tests ist die Aufteilung der Datei aufzuheben!
(Daten - Datei aufteilen ... /alle Fälle analysieren)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
12
t-Test für unabhängige Stichproben:
Analysieren –
Mittelwerte vergleichen –
T-Test bei unabhängigen Stichproben ...
Gruppenstatistiken
Testergebnis im
Viewer-Fenster:
ABNAHME
Präparat
Test
N
Kontrolle
Mittelwert
Standardabw
eichung
Standardfehler
des Mittelwertes
8
27,00
31,672
11,198
8
39,00
26,987
9,541
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichheit
Varianzen sind
gleich
Varianzen sind
nicht gleich
,302
,591
df
Standardfe
hler der
Differenz
T
Mittlere
Differenz
Sig. (2seitig)
Signifikanz
F
ABNAHME
T-Test für die Mittelwertgleichheit
95%
Konfidenzintervall
der Differenz
Untere
Obere
-,816
14
,428
-12,00
14,712
-43,553
19,553
-,816
13,656
,429
-12,00
14,712
-43,628
19,628
Interpretation:
Varianzvergleich (Levene-Test): P = 0.591≥ 5% à Varianzgleichheit kann angenommen werden.
Mittelwertvergleich: P = Risiko für eine irrtümliche Ablehnung von H0 ist 2-seit.Sign. = 42.8% > 5%
à H0 (Gleichheit der mittleren Abnahmen) kann nicht abgelehnt werden!
Bestimmung des ß-Fehlers
(bzw. der Power):
AnalysierenAllgemeines lineares Modell–
Univariat ...
(Hinweis: "Power =
Beobachtete Schärfe" in
Optionen aktivieren)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
13
Ergebnis der Powerberechnung im Viewer-Fenster:
Tests der Zwischensubjekteffekte
Abhängige Variable: ABNAHME
Quelle
Korrigiertes Modell
Konstanter Term
PRAEP
Quadratsumme
vom Typ III
576,000(b)
17424,000
F
1
Mittel der
Quadrate
576,000
1
17424,000
df
576,000
1
576,000
Fehler
12120,000
14
865,714
Gesamt
30120,000
16
Korrigierte
Gesamtvariation
12696,000
15
,665
Sign.
,428
NZP
,665
Power(a)
,119
20,127
,001
20,127
,986
,665
,428
,665
,119
a Unter Verwendung von Alpha = ,05 berechnet
b R-Quadrat
= ,045 (korrigiertes R-Quadrat = -,023)
Interpretation:
Power (=Schärfe) = 11,9% (PRAEP-Zeile), d.h.
Sicherheit, mit dem gewählten Versuchsansatz die Differenz der Mittelwerte 27 (Test ) und 39 (Kontrolle)
der Zielvariablen abnahme auf 5%igem Testniveau als signikant zu erkennen, ist zu klein, um eine
Entscheidung für H0 zuzulassen. à Versuch neu planen (Stichprobenumfang!)
(ii) Paarvergleich für das Testpräparat (Vergleich der Zielvariablen Fe1 und Fe2)
Präparatgruppe 1 (Test) auswählen mit:
DatenFälle auswählen …
(Falls Bedingung “praep=1“ zutrifft)
Ergebnis der Datenselektion
im Daten-Fenster:
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
14
Mittelwertvergleich:
H0: im Mittel gilt fe1 = fe2 vs. H1: im Mittel gilt fe1 ≠ fe2
t-Test für abhängige Stichproben:
Analysieren –
Mittelwerte vergleichen –
T-Test bei abhängigen Stichproben ...
Statistik bei gepaarten Stichproben
Testergebnis im
Viewer-Fenster:
Mittelwert
Paaren 1
N
Standardabweichung
Standardfehler
des Mittelwertes
Serumeisen, Zeitp.1
102,63
8
36,229
12,809
Serumeisen, Zeitp.2
75,63
8
15,137
5,352
Test bei gepaarten Stichproben
Gepaarte Differenzen
Mittelwert
STD
SEM
Serumeisen, Zeitp.1 Serumeisen, Zeitp.2
27,00
31,672
11,198
Sig. (2seitig)
df
95%
Konfidenzintervall
der Differenz
Untere
Paaren 1
T
,52
Obere
53,48
2,411
7
,047
Interpretation: P-Wert = 2-seit.Sig = 4.7% < 5% à H0 (Gleichheit der Mittelwerte) ablehnen.
Grundaufgabe 6:
Wirksamkeits- u. Äquivalenzprüfung im Rahmen eines Paarvergleichs
In einem als randomisierte Versuchsanlage geplanten Experiment wurden 7 Probanden zeitlich hintereinander zwei
Präparate (1=Test, 2=Kontrolle) verabreicht, wobei die Zuordnung der Probanden zu den Präparatsequenzen 12 bzw. 21
zufällig erfolgte. Die Zielvariable ist die Halbwertszeit HWZ für die Elimination des jeweiligen Präparates aus dem Blut.
Man prüfe (α=5%):
(i) Gibt es im Mittel einen Unterschied bezüglich der Zielvariablen (Wirksamkeitsprüfung)?
(ii) Sind die Halbwertszeiten im Mittel gleich? (Äquivalenzprüfung, Gleichheit besteht, wenn sich die Halbwertszeiten um
weniger als 20% des Kontrollpräparates unterscheiden.)
Datei: grund06.sav
Lösung:
Datenbeschreibung:
Auflisten der Stichprobenwerte und Berechnung von deskriptiven Statistiken mit Hilfe von:
Analysieren- Berichte-Fälle zusammenfassen ...
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
15
Zusammenfassung von Fällen(a)
Ergebnisse
(Stichproben, deskriptive
Statistiken)
Im Viewer:
1
HalbwertszeitTestpräp.
1,50
HalbwertszeitKontrollpräp.
1,95
2
1,92
2,05
3
1,43
2,46
4
1,68
2,88
5
1,97
2,52
6
2,01
1,80
1,85
2,03
7
7
1,7657
2,2414
,23201
,38607
,08769
,14592
-,558
,670
,794
,794
-1,589
-,713
1,587
1,587
7
Insgesamt
N
Mittelwert
Standardabweich
ung
Standardfehler
des Mittelwertes
Schiefe
Standardfehler
der Schiefe
Kurtosis
Standardfehler
der Kurtosis
a Begrenzt auf die ersten 100 Fälle.
(i) Wirksamkeitsprüfung mit dem t-Test für abhängige Stichproben
H0: Die Halbwertszeiten der Präparate stimmen im Mittel überein
H1: Die Halbwertszeiten der Präparate sind im Mittel verschieden
t-Test für abhängige Stichproben:
Analysieren –
Mittelwerte vergleichen –
T-Test bei gepaarten Stichproben ...
Statistik bei gepaarten Stichproben
Mittelwert
Paaren 1
Ergebnis (bearbeitet) im Viewer:
N
STD
SEM
Halbwertszeit
-Testpräp.
1,7657
7
,23201
,08769
Halbwertszeit
-Kontrollpräp.
2,2414
7
,38607
,14592
Test bei gepaarten Stichproben
Gepaarte Differenzen
Mittelwert
STD
SEM
HalbwertszeitTestpräp. HalbwertszeitKontrollpräp.
-,4757
,50252
,18994
Sig. (2seitig)
df
95%
Konfidenzintervall
der Differenz
Untere
Paaren 1
T
-,9405
Obere
-,0110
-2,505
6
Interpretation: P = 2-seit.Sig. = 4,6% < 5% à Die beobachtete Mittelwertdifferenz (Test-Kontrolle)
von -0.4757 ist auf 5%igem Testniveau signifikant.
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
,046
16
(ii) Äquivalenzprüfung
H0: absolute Differenz der mittleren Halbwertszeiten ≥ vorgegebener relevanter Unterschied D
(z.B. 20% des Mittels des Kontrollpräparates)
H1: absolute Differenz der mittleren Halbwertszeiten < D 
(in diesem Fall sind die Präparate äquivalent)
Westlake-Verfahren:
H0 wird auf dem Niveau α abgelehnt (d.h. für die Äquivalenz der Präparate entschieden), wenn das
(1-2α)-Konfidenzintervall der Mittelwertdifferenz im Toleranzintervall (-D, +D) liegt.
t-Test für abhängige Stichproben:
Analysieren –
Mittelwerte vergleichen –
T-Test bei gepaarten Stichproben ...
Hinweis:
Konfidenzintervall auf 90% einstellen (Optionen)!
Ergebnisse (bearbeitet)im Viewer:
Test bei gepaarten Stichproben
Gepaarte Differenzen
Mittelwert
STD
SEM
T
90%
Konfidenzintervall
der Differenz
Untere
Paaren 1
HalbwertszeitTestpräp. HalbwertszeitKontrollpräp.
-,4757
,50252
,18994
Sig. (2seitig)
df
-,8448
Obere
-,1066
-2,505
6
,046
Interpretation:
Stichprobenmittel des Kontrollpräperat ist 2.414; D (=20% von 2.414) = 0.448;
Toleranzintervall für die Äquivalenz = (-0.448, +0.448);
90%-Konfidenzintervall für die Mittelwertdifferenz ist nicht im Toleranzintervall enthalten à keine
Äquivalenz
Grundaufgabe 7:
Chiquadrat-Test für diskrete Verteilungen
Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige
gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis von
9 : 3 : 3 : 1? (α = 5%)
Datei: grund07.sav
Lösung:
Daten-Fenster:
Zielvariable = phaeno
(Werte 1=rund/gelb usw.),
Gewichtung der Fälle mit
Hilfsvariabler freq beachten!
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
17
Hypothesen:
H0: die Phänotypen treten mit Wahrscheinlichkeiten im Verhältnis 9:3:3:1 auf vs.
H1: die Phänotypen treten mit Wahrscheinlichkeiten in einem von 9:3:3:1 abweichenden Verhältnis auf.
Chiquadrat-Test zur Prüfung
auf ein vorgegebenes Verhältnis:
AnalysierenNichtparametrische TestsChi-quadrat ...
Ergebnisse im Viewer:
Phänotyp
Statistik für Test
rund/gelb
Beobachtetes
N
315
Erwartete
Anzahl
312,8
Residuum
2,3
rund/grün
108
104,3
3,8
kantig/gelb
kantig/grün
Gesamt
101
104,3
-3,3
32
34,8
-2,8
556
Chi-Quadrat(a)
df
Phänotyp
,470
3
Asymptotische Signifikanz
,925
a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten
erwartet. Die kleinste erwartete Zellenhäufigkeit ist 34,8.
Interpretation: P = Asymptotische Signifikanz =
92,5% ≥ 5%à H0 kann nicht abgelehnt werden.
Grundaufgabe 8:
Vergleich von zwei Wahrscheinlichkeiten (mit unabhängigen Stichproben)
Es ist zu untersuchen, ob die Düngung (Mineral- bzw. Tresterkompostdüngung) einen Einfluss auf den Pilzbefall
(Falscher Mehltau) von Weinstöcken (Vitis vinifera) hat oder nicht. Dazu werden 39 mineralgedüngte Weinstöcke
beobachtet, und es wird dabei festgestelltet, dass in 6 Fällen ein starker Befall (Ausprägung 1) zu verzeichnen ist, in den
restlichen 33 Fällen nur ein schwacher bzw. überhaupt keiner (Ausprägung 0). Parallel dazu werden 39
tresterkompostgedüngte Weinstöcke untersucht mit dem Ergebnis, dass in 23 Fällen ein starker Befall (Ausprägung 1)
und in 16 Fällen ein schwacher bis nicht erkennbarer Befall (Ausprägung 0) vo rhanden war. (α = 5%)
Datei: grund08.sav
Lösung:
Daten-Fenster:
Zielvariable = pilz,
Gruppierungsvariable = dueng,
Hilfsvariable = freq
(zur Gewichtung der Fälle mit den
beobachteten Häufigkeiten)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
18
Hypothesen:
H0: Befallrisiko ist unabhängig von der Düngung vs. H1: Befallrisiko ist abhängig von der Düngung.
Chi-Quadrat-(Homogenitäts-)Test:
AnalysierenDeskriptive Statistiken–
Kreuztabellen ...
Im Fenster „Kreuztabellen: Statistik“
„Chi-Quadrat“ aktivieren …
Im Fenster „Kreuztabellen: Zellen“
folgende Einstellungen vornehmen …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
19
Pilzbefall * Düngung Kreuztabelle
Ergebnisse (teilweise)
im Viewer:
Düngung
Mineral
Pilzbefall
nein
Anzahl
ja
Erwartete
Anzahl
% von
Düngung
Anzahl
Erwartete
Anzahl
% von
Düngung
Gesamt
16
49
24,5
24,5
49,0
84,6%
41,0%
62,8%
6
23
29
14,5
14,5
29,0
15,4%
59,0%
37,2%
39
39
78
39,0
39,0
78,0
100,0%
100,0%
100,0%
Erwartete
Anzahl
% von
Düngung
Anzahl
Gesamt
Trester
33
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Asymptotische
Signifikanz (2seitig)
df
15,863(b)
1
,000
Kontinuitätskorrektur(a)
14,052
1
,000
Likelihood-Quotient
16,656
1
,000
Exakter Test nach Fisher
Zusammenhang linearmit-linear
Exakte
Signifikanz
(2-seitig)
Exakte
Signifikanz
(1-seitig)
,000
15,660
1
,000
,000
Anzahl der gültigen Fälle
78
a Wird nur für eine 2x2-Tabelle berechnet
b 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 14,50.
Interpretation:
P = 2-seitige Signifikanz = 0,000 (näherungsweise, Chi-Quadrat nach Pearson) < 0.05 à H0 ablehnen;
Exakter Test (nach Fisher): P = 2-seitige exakte Signifikanz = 0.000 < 0.05 à H0 ablehnen.
Grundaufgabe 9:
McNemar-Test zum Vergleich von zwei Wahrscheinlichkeiten (mit abhängigen Stichproben)
Bei einer Studie wurde u.a. das Ges.Eiweiß i.S.
zu Beginn und am Ende bestimmt. Es ergab sich,
dass bei 22 Probanden der Eiweißwert vor und
nach Ende der Studie im Normbereich lag, bei 12
Probanden lag der Wert vorher im Normbereich
und nachher außerhalb, bei 7 Probanden vorher
außerhalb und nachher im Normbereich und bei
4 vorher und nachher außerhalb des
Normbereichs. Hat sich während der Studie
eine signifikante Änderung hinsichtlich des
Normbereichs ergeben? (α = 5%)
Datei: grund09.sav
Lösung:
Daten-Fenster:
Zielvariablen = beginn, ende,
Hilfsvariable = freq
(zur Gewichtung der Fälle mit den
beobachteten Häufigkeiten)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
20
Hypothesen:
H0: p(im Normbereich/vorher à außerhalb/nachher) = p(außerhalb/vorher à im Normbereich/nachher)
H1: p(im Normbereich/vorher à außerhalb/nachher) ≠ p(außerhalb/vorher à im Normbereich/nachher)
McNemar-Test zur „Messung“ von
Veränderungen:
AnalysierenNichtparametrische Tests2 verbundene StichprobenMcNemar ...
Ergebnisse im Viewer:
Statistik für Test(b)
Behandlungsbeginn & Behandlungsende
Behandlungs
beginn &
Behandlungs
ende
Behandlungsende
Behandlungsbeginn
1
2
1
2
22
12
7
4
N
Exakte Signifikanz
(2-seitig)
45
,359(a)
a Verwendetete Binomialverteilung.
b McNemar-Test
Interpretation: P = Exakte Signifikanz (2seitig) = 35,9% ≥ 5% à H0 kann nicht
abgelehnt werden.
Grundaufgabe 10:
Prüfung auf Abhängigkeit (nominale Daten)
Die Wirksamkeit einer Behandlung wurde einerseits
durch den Probanden und andererseits durch den
Prüfarzt beurteilt. Man beschreibe den Zusammenhang
zwischen den Beurteilungen mit einem geeigneten
Korrelationsmaß. Wie groß sind die bei einer
angenommenen Unabhängigkeit zu erwartenden
absoluten Häufigkeiten? Ist die Korrelation signifikant
von Null verschieden? (α = 5%)
Datei: grund10.sav
Lösung:
Daten-Fenster:
Zielvariable: proband, arzt,
Hilfsvariable freq
(zur Gewichtung der Fälle mit den
beobachteten Häufigkeiten)
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
21
Hypothesen:
H0: die Variablen proband (Beurteilung durch Probanden) und arzt (Beurteilung durch den Prüfarzt) sind unabhängig
H1: die Variablen proband und arzt sind abhängig.
Abhängigkeitsprüfung mit dem
Chi-Quadrat-Test:
AnalysierenDeskriptive StatistikenKreuztabellen …
Im Fenster „Kreuztabellen: Statistik“
„Chi-Quadrat“ und
„Phi und Cramer-V“
aktivieren …
Im Fenster „Kreuztabellen: Zellen“
die folgenden Einstellungen
vornehmen …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
22
Ergebnisse (teilweise) im Viewer:
Beurteilung d. Proband * Beurteilung d. Prüfarzt Kreuztabelle
Beurteilung d. Prüfarzt
Beurteilung d.
Proband
sehr gut
23
sehr gut
Anzahl
gut
Erwartete
Anzahl
% von
Beurteilung d.
Prüfarzt
Anzahl
mäßig
Erwartete
Anzahl
% von
Beurteilung d.
Prüfarzt
Anzahl
Erwartete
Anzahl
% von
Beurteilung d.
Prüfarzt
Anzahl
Gesamt
Erwartete
Anzahl
% von
Beurteilung d.
Prüfarzt
gut
Gesamt
mäßig
7
3
33
14,1
11,4
7,5
33,0
71,9%
26,9%
17,6%
44,0%
5
13
4
22
9,4
7,6
5,0
22,0
15,6%
50,0%
23,5%
29,3%
4
6
10
20
8,5
6,9
4,5
20,0
12,5%
23,1%
58,8%
26,7%
32
26
17
75
32,0
26,0
17,0
75,0
100,0%
100,0%
100,0%
100,0%
Interpretation: (unter H0) erwartete Häufigkeiten: siehe Erwartete Anzahl.
Chi-Quadrat-Tests
Interpretation:
P = asymptotische Signifikanz
(2-seitig, Chi-Quadrat nach
Pearson) = 0,000 < 0,05 à H1
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang linearmit-linear
Anzahl der gültigen Fälle
Asymptotische
Signifikanz (2-seitig)
df
25,215(a)
4
,000
24,045
4
,000
17,358
1
,000
75
a 2 Zellen (22,2%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete
Häufigkeit ist 4,53.
Symmetrische Maße
Korrelationsmaß:
Cramer-V = 0,41
(sign. ≠ 0)
Näherungsweise
Signifikanz
Wert
Nominal- bzgl.
Nominalmaß
Phi
Cramer-V
Anzahl der gültigen Fälle
,580
,000
,410
,000
75
a Die Null-Hyphothese wird nicht angenommen.
b Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler
verwendet.
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
23
Grundaufgabe 11:
Prüfung auf Abhängigkeit bei metrischen Variablen und lineare Regression
In einer Stichprobe von 10 Frauen wurden der Blutdruck (mm Hg)und das Alter registriert (Daten siehe folgende
Tabelle). Kann man vom Alter im Rahmen eines linearen Regressionsmodells auf den Blutdruck schließen? (α = 5%)
Datei: grund11.sav
Lösung:
Daten-Fenster:
Abhängige Variable blut,
unabhängige Variable alt
Darstellung der Abhängigkeit im
Streudiagramm mit Hilfe von
GrafikenStreudiagramm …
Streudiagramm-Einfach-Definieren …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
24
Ergebnis im Viewer …
150
140
130
Blutdruck (mm Hg)
Interpretation:
Lineares Modell (Gerade) zur
Beschreibung der Abhängigkeit
Ist passsend;
Anstieg der Geraden ≠ 0,
Frage: Ist der Anstieg „signifikant“
von null verschieden?
(Nur dann hängt der Blutdruck
vom Alter ab.)
120
110
R-Qu. = 0.8689
20
30
40
50
60
70
Alter/Jahre
Hinweis:
Bearbeitung der Grafik durch
Doppelklicken auf die Grafik
à Chart-Fenster
z.B. Einzeichnen der
Regressionsgeraden:
Diagramme-Optionen …
… Optionen für Streudigramme:
AnpassungslinieGesamtAnpassungsoptionen …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
25
Abhängigkeitsprüfung - Variante 1:
Test auf Abweichung von der Nullkorrelation mit H0: (Pearson-)Korrelation ρ = 0 vs. H1: ρ ≠ 0
AnalysierenKorrelationBivariat …
… Ergebnis im Viewer:
Korrelationen
Alter/Jahre
Alter/Jahre
Interpretation:
P = Signifikanz (2-seitig) =
0,000 < 0.05
à H1 (Abhängigkeit)
Korrelation nach
Pearson
Signifikanz (2-seitig)
N
Blutdruck (mm Hg)
Korrelation nach
Pearson
Signifikanz (2-seitig)
N
Blutdruck
(mm Hg)
1
,932(**)
.
,000
10
10
,932(**)
1
,000
10
** Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
.
10
Abhängigkeitsprüfung - Variante 2:
Test im Rahmen des einfachen linearen Regressionsmodells mit
H0: Geradenanstieg β1 = 0 (Modell: Blitdruck = β1 * Alter + β0 + Fehler)
AnalysierenRegressionLinear …
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
26
… Lineare RegressionStatistiken …
Deskriptive Statistiken
… Ergebnisse (teilweise)
im Viewer …
Mittelwert
Blutdruck (mm Hg)
Standardabw
eichung
N
127,90
7,909
10
44,20
11,970
10
Alter/Jahre
Modellzusammenfassung
Interpretation:
R-Quadrat = 86,9% = durch Alter
erklärter Anteil der Variation
der Blutgruppe
Modell
1
R
R-Quadrat
Korrigiertes RQuadrat
,932(a)
,869
a Einflußvariablen : (Konstante), Alter/Jahre
Standardfehler
des Schätzers
,853
3,037
Koeffizienten(a)
Nicht standardisierte
Koeffizienten
Modell
1
(Konstante)
Alter/Jahre
B
100,679
Standardfe
hler
3,860
,616
,085
Standardisiert
e
Koeffizienten
T
Signifikanz
Beta
,932
26,086
,000
7,282
,000
a Abhängige Variable: Blutdruck (mm Hg)
Interpretation:
Geradenanstieg b1 = 0,616 signifikant ungleich null (P = Signifikanz = 0,000 < 0,05) à
Regressionsgleichung: Blutdurck = 100,679 + 0,616*Alter
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
27
Grundaufgabe 12:
1-faktorielle Varianzanalyse (Globaltest, Varianzhomogenität, multiple Mittelwertvergleiche)
Man vergleiche an Hand der
Beobachtungsreihen in der folgenden
Tabelle die Mg-Konzentration zwischen
den Lösungen 1, 2 und 3.
Bestehen zwischen den Lösungen
signifikante Mittelwertunterschiede?
Man führe die Aufgabe auch mit
den K- und Ca-Konzentrationen durch.
(α = 5%)
Datei: grund12.sav
Lösung:
Daten-Fenster:
Zielvariable: mg (bzw. k, ca),
Gliederungsmerkmal (Faktor) loesung
Abhängigkeitsprüfung im Rahmen der 1-faktoriellen ANOVA:
(abhängige Variable mg, unabhängige Variable loesung;
deskriptive Statistiken, Globaltest, Prüfung der Varianzhomogenität, multiple Mittelwertvergleiche)
AnalysierenMittelwerte vergleichenEinfaktorielle ANOVA ...
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04
28
… Einfaktorielle ANOVAOptionen …
… EInfaktorielle ANOVAPost Hoc …
… Ergebnisse im Viewer …
ONEWAY deskriptive Statistiken
Magnesium
N
Mittelwert
STD
SEM
95%-Konfidenzintervall für
den Mittelwert
Untergrenze
Minimum
Maximum
Obergrenze
1.5K, 0.75Ca
6
232,83
26,888
10,977
204,62
261,05
185
256
1.5K, 3.75Ca
6
175,67
18,107
7,392
156,66
194,67
155
203
6
162,50
38,025
15,524
122,60
202,40
121
216
18
190,33
41,487
9,779
169,70
210,96
121
256
7.5K, 0.75Ca
Gesamt
Test der Homogenität der Varianzen
Interpretation:
H0: Varianzen der Zielvariablen mg stimmen
für die drei Lösungen überein;
P= Sign. =0,082 à kein Grund für Ablehnung von H0
W. Timischl, LV-Nr. 859 903, grund_spss11neu
Magnesium
LeveneStatistik
2,968
df1
df2
2
Signifikanz
15
,082
08.03.04
29
ONEWAY ANOVA
Magnesium
Quadratsu
mme
Mittel der
Quadrate
df
F
Zwischen den Gruppen
16776,333
2
8388,167
Innerhalb der Gruppen
12483,667
15
832,244
Gesamt
29260,000
17
Signifikanz
10,079
,002
Interpretation (Globaltest):
H0: Zielvariable mg im Mittel vom Faktor (loesung) unabhängig;
P = Sign. (Zwischen den Gruppen)= 0,002 à Faktorwirkung ist signifikant
Mehrfachvergleiche
Abhängige Variable: Magnesium
Scheffé-Prozedur
95%-Konfidenzintervall
Mittlere
Differenz (I-J)
57,17(*)
70,33(*)
Standardfe
hler
16,656
16,656
Signifikanz
,013
,003
Untergrenze
11,97
25,13
Obergrenze
102,37
115,53
-57,17(*)
16,656
,013
-102,37
-11,97
13,17
7.5K, 0.75Ca
1.5K, 0.75Ca
-70,33(*)
1.5K, 3.75Ca
-13,17
* Die mittlere Differenz ist auf der Stufe .05 signifikant.
16,656
16,656
16,656
,736
,003
,736
-32,03
-115,53
-58,37
58,37
-25,13
32,03
(I) Nährlösung
1.5K, 0.75Ca
(J) Nährlösung
1.5K, 3.75Ca
7.5K, 0.75Ca
1.5K, 3.75Ca
1.5K, 0.75Ca
7.5K, 0.75Ca
Magnesium
Scheffé-Prozedur
Interpretation:
Der Mittelwert auf der Faktorstufe
"1.5K, 0.75Ca" weicht auf dem
Testniveau 5% signifikant von den
anderen Faktorstufenmittelwerten ab
Untergruppe für Alpha =
.05.
Nährlösung
7.5K, 0.75Ca
240
N
6
1
162,50
1.5K, 3.75Ca
6
175,67
1.5K, 0.75Ca
6
2
232,83
Signifikanz
,736
1,000
Die Mittelwerte für die in homogenen Untergruppen
befindlichen Gruppen werden angezeigt.
a Verwendet ein harmonisches Mittel für Stichprobengröße
= 6,000.
220
Mittelwert von Magnesium
200
180
160
Diagramm der Mittelwerte
140
1.5K, 0.75Ca
1.5K, 3.75Ca
7.5K, 0.75Ca
Nährlösung
W. Timischl, LV-Nr. 859 903, grund_spss11neu
08.03.04