Übungen zur EDV und Biometrie

Werbung
1
Statistische Modellbildung
Lösung von Grundaufgaben mit SPSS (ab Version 8.0)
Daten: grund??.sav
Ausgabe SS 2002
Lehrbuch: W. Timischl, Biostatistik. Wien - New York: Springer 2000.
Grundaufgabe 2: Eindimensionale Datenbeschreibung
Man vergleiche die Verteilungen der Spaltöffnungslängen (Merkmal X, in mm) bei diploiden und tetraploiden Biscutella
laevigata .
X/diploid:
27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23,24, 26, 26
X/tetraploid:
28, 30, 28, 32, 25, 29, 28, 33, 32, 28, 28, 30, 32, 31, 31, 34, 29, 36, 33, 30, 29, 27, 27, 29, 26
Datei: grund02.sav
Dialogfenster: Statistik - Zusammenfassen - Explorative Datenanalyse
Univa riate Sta tistiken
Spaltöffnungslänge
TY P
diploid
tet raploid
Mittelwert
95% K onfidenz intervall
des Mittelwerts
5% getrimmtes Mit tel
Median
Varianz
St andardabweichung
Minimum
Maximum
Spannweit e
Int erquartilbereich
Sc hiefe
Kurtos is
Mittelwert
95% K onfidenz intervall
des Mittelwerts
St atist ik
24,67
23,79
25,55
24,69
25,00
2,524
1,59
22
27
5
3,00
-,105
-1, 174
29,80
28,71
30,89
29,73
29,00
6,917
2,63
25
36
11
4,00
,430
-,070
Untergrenz e
Obergrenz e
Untergrenz e
Obergrenz e
5% getrimmtes Mit tel
Median
Varianz
St andardabweichung
Minimum
Maximum
Spannweit e
Int erquartilbereich
Sc hiefe
Kurtos is
St andardfehler
,41
,580
1,121
,53
,464
,902
Tests auf Normalverteilung
a
Spaltöffnungslänge
TYP
diploid
tetraploid
Kolmogorov-Smirnov
Statistik
df
Signifikanz
,186
15
,171
,140
25
,200*
Statistik
,923
,973
Shapiro-Wilk
df
Signifikanz
15
,277
25
,704
*. Dies is t eine untere Grenze der echten Signifikanz.
a. Signifikanzkorrektur nach Lilliefors
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
2
38
36
34
32
Spaltöffnungslänge
30
28
26
24
22
20
N=
15
25
di pl oi d
tetra plo id
TYP
Grundaufgabe 3: Vergleich einer Wahrscheinlichkeit mit einem Sollwert (Binomialtest)
Bei einer Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60
keimten 35 Zwiebeln.
(i) Liegt eine signifikante Abweichung vom garantierten Prozentsatz vor? Man prüfe diese Frage auf dem
Signifikanzniveau =5%.
(ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von
90% feststellen zu können?
a) Daten
Datei: grund3.sav (Gewichtung beachten!)
Anzeige der Daten mit: Statistik -Zusammenfassen - Häufigkeiten
Keimfähigkeit
Gültig
1 (ja)
2 (nein)
Gesamt
Häufigkeit
35
25
60
Prozent
58,3
41,7
100,0
Gültige
Prozente
58,3
41,7
100,0
Kumulierte
Prozente
58,3
100,0
b) H0: p>=0.75, H1: p<0.75
Dialogfenster: Statistik - Nichtparametrische Tests - Binomial
Ergebnis:
1-seit.Sign. = P-Wert = Risiko für irrtümliche Ablehnung von H0 (=0,002) --> H0 ablehnen.
c) Fallzahlenschätzung
z_0.95 = IDF.NORMAL(0.95,0,1) = 1.65 (Transformieren - Berechnen)
z_0.90 = IDF.NORMAL(0.90,0,1) = 1.28
p_0=0.75, delta = 0.1
n = 1/delta**2 *(z_095*SQRT(p*(1-p)) + z_090*SQRT((p+delta)*(1-p-delta)))**2 = 137
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
3
Test auf Binomialverteilung
Keimfähigkeit
Gruppe 1
Gruppe 2
Gesamt
Kategorie
ja
nein
N
35
25
60
Beobachteter
Anteil
,583333
,42
1,00
Testanteil
,75
As ymptotische
Signifikanz
(1-seitig)
,002a,b
a. Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,75.
b. Basiert auf der Z-Approximation.
Grundaufgabe 4: Vergleich eines Mittelwerts mit einem Sollwert
In einer Zufallsstichprobe von 24 Probanden wurden die folgenden IQ-Werte bestimmt:
115, 119, 119, 134, 121, 128, 128, 152, 97, 108, 98, 130, 108, 110, 111, 122, 106, 142, 143, 140, 141, 151, 125, 126.
(i) Man erstelle eine geeignete Häufigkeitsverteilung (grafisch) und beschreibe die Verteilung durch die üblichen
deskriptiven Statistiken.
(ii) Man prüfe, ob der durchschnittliche IQ signifikant (= 5%) größer als 130 ist.
a) Häufigkeitsverteilung
Daten: grund04.sav
Dialogfenster: Statistik - Zusammenfassn - Häufigkeiten
Statistiken
IQ
N
Gültig
Fehlend
Mittelwert
Standardfehler des Mittelwertes
Median
Modus
Standardabweichung
Varianz
Schiefe
Standardfehler der Schiefe
Kurtos is
Standardfehler der Kurtosis
Spannweite
Minimum
Maximum
Summe
24
0
123,92
3,20
123,50
108a
15,70
246,34
,109
,472
-,788
,918
55
97
152
2974
a. Mehrere Modi vorhanden. Der kleinste Wert wird angezeigt.
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
4
IQ
10
8
6
Häufigkeit
4
2
Std.abw. = 15,70
Mittel = 123,9
N = 24,00
0
98,5
110,5
122,5
134,5
146,5
IQ
b) Sollwertvergleich
H0: Im Mittel gilt: IQ <= Sollwert = 130
H1: Im Mittel gilt: IQ > Sollwert = 130
Dialogfenster: Statistik - Mittelwerte vergleichen - t-Test bei einer Stichprobe
Statistik bei einer Stichprobe
N
IQ
Mittelwert
123,92
24
Standardfehler
des
Mittelwertes
3,20
Standardabweichung
15,70
Test bei einer Sichprobe
Testwert = 130
IQ
T
-1,899
df
23
Sig.
(2-seitig)
,070
Mittlere
Differenz
-6,08
95% Konfidenzintervall
der Differenz
Untere
Obere
-12,71
,54
Ergebnis:
Wenn - wie in diesem Beispiel - der Stichprobenmittelwert und der Sollwert im Sinne von H0 zueinander stehen: Risiko
für irrtümliche Ablehnung von H0 = 1-(2-seit.Sig)/2 = 96,5% --> H0 nicht ablehnen.
Grundaufgabe 5: Mittelwertvergleich (Parallelversuch - Paarvergleich)
An Hand der Datentabelle sollen folgende Fragen untersucht werden ( = 5%):
(i) Bewirkt das Testpräparat (Präparat=1) eine mittlere Abnahme Fe1-Fe2 der Zielvariablen (Serumeisen) vom
Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2), die von der durch das Kontrollpräparat (Präparat=2)
verursachten abweicht?
(ii) Zeigt die Zielvariable Serumeisen vom Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2) im Mittel
innerhalb jeder Präparatgruppe eine signifikante Änderung?
a) Daten
Datei: grund05.sav
Berechnung der Zielvariablen abnahme=Fe1 - Fe2
mit Hilfe von: Transformieren - Berechnen ...
Auflisten der Datentabelle mit Hilfe von: Statistik - Zusammenfassen - Fälle zusammenfassen
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
5
Zusammenfassung von Fällen
Präparat
Test
Kontrolle
1
2
3
4
5
6
7
8
Ins ges amt
1
2
3
4
5
6
7
8
Ins ges amt
N
Mi ttelwert
Standardabweichung
Standardfehler des
Mi ttelwertes
Schiefe
Standardfehler der
Schiefe
Kurtos is
Standardfehler der
Kurtos is
N
Mi ttelwert
Standardabweichung
Standardfehler des
Mi ttelwertes
Schiefe
Standardfehler der
Schiefe
Kurtos is
Standardfehler der
Kurtos is
Fe Zeitp.1
141
137
88
139
54
78
122
62
8
102,62
36,23
Fe Zeitp.2
102
71
90
68
70
64
84
56
8
75,63
15,14
ABNAHME
39
66
-2
71
-16
14
38
6
8
27,00
31,67
12,81
5,35
11,20
-,190
,662
,193
,752
,752
,752
-2,077
-,309
-1,341
1,481
1,481
1,481
123
139
112
115
122
105
105
68
8
111,13
20,66
45
107
91
57
68
47
102
60
8
72,12
24,57
78
32
21
58
54
58
3
8
8
39,00
26,99
7,30
8,69
9,54
-1,210
,445
-,060
,752
,752
,752
2,820
-1,684
-1,451
1,481
1,481
1,481
b) Parallelversuch
b1) Normalitätsprüfung
H0: Daten stammen aus normalverteilter Grundgesamtheit
Datei aufteilen (Daten -Datei aufteilen), um den K-S-Test auf die Zielvariable abnahme in jeder Präparatgruppe
anzuwenden.
Dialogfenster für K-S-Test:
Statistik - Nichtparametrische Tests - K-S bei einer Stichprobe
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
6
Kolmogorov-Smirnov-Anpassungstestc
N
Parameter der Normalverteilunga,b
Extremste Differenzen
Mittelwert
Standardabweichung
Absolut
Positiv
Negativ
Kolmogorov-Smirnov-Z
As ymptotische Signifikanz (2-seitig)
ABNAHME
8
27,00
31,67
,159
,159
-,141
,450
,987
a. Die zu testende Verteilung ist eine Normalverteilung.
b. Aus den Daten berechnet.
c. Präparat = Test
Kolmogorov-Smirnov-Anpassungstestc
N
Parameter der Normalverteilunga,b
Extremste Differenzen
Mittelwert
Standardabweichung
Absolut
Positiv
Negativ
Kolmogorov-Smirnov-Z
As ymptotische Signifikanz (2-seitig)
ABNAHME
8
39,00
26,99
,211
,125
-,211
,596
,869
a. Die zu testende Verteilung ist eine Normalverteilung.
b. Aus den Daten berechnet.
c. Präparat = Kontrolle
b2) t-Test für unabhängige Stichproben
H0: mittl.abnahme/Test = mittl.abnahme/Kontrolle
H1: mittl.abnahme/Test <> mittl.abnahme/Kontrolle
Wichtig: vor Anwendung des t-Tests Aufteilung der Datei aufheben!
(Daten - Datei aufteilen/alle Fälle analysieren)
Dialogfenster für t-Test:
Statistik - Mittelwerte vergleichen - t-Test bei unabhängigen Stichproben
Gruppenstatistike n
Präparat
ABNAHME Test
Kontrolle
W. Timischl, LV-Nr. 104.001,75902701
N
8
8
Mittelwert
27,00
39,00
St andardabweichung
31,67
26,99
St andardfehler
des
Mittelwertes
11,20
9,54
15.05.16
7
Te st bei unabhängige n Stichproben
SE Diff .
14
13,656
,428
,429
-12,00
-12,00
14,71
14,71
O
Mittl. Diff.
-,816
-,816
95% Konf. Int.
Diff.
U
Sign. (2-seit.)
,591
df
,302
T-Test für die Mittelwert gleic hheit
T
Sign.
ABNAHME Varianz. gleich
Varianz. n. gleich
F
Levene-Tes t
-43,55
-43,63
19,55
19,63
Ergebnis:
Risiko für eine irrtümliche Ablehnung von H0 ist
P=2-seit.Sig = 42.8% > 5% --> H0 kann nicht abgelehnt werden!
b3) Bestimmung der Power
Dialogfenster:
Statistik - Allgemeines lineares Modell - GLM-Allgemein mehrfaktoriell (Hinweis: "Power=Beobachtete Schärfe" in
Optionen aktivieren)
Te sts der Zwische nsubjekteffekte
Abhängige Variable: ABNAHME
Quelle
Korr.Modell
Konst. Term
PRAEP
Fehler
Gesamt
Korrigierte
Gesamtvariation
SQ Ty p III
576,000b
17424, 000
576,000
12120, 000
30120, 000
12696, 000
df
1
1
1
14
16
MQ
576,000
17424, 000
576,000
865,714
F
,665
20,127
,665
Sign.
,428
,001
,428
NZP
,665
20,127
,665
a
Power
,119
,986
,119
15
a. Unter Verwendung von Alpha = ,05 berechnet
b. R-Quadrat = ,045 (korrigiert es R-Quadrat = -,023)
Ergebnis: Power (=Schärfe) = 11,9%, d.h.
Sicherheit, mit dem gewählten Versuchsansatz die Differenz der Mittelwerte 27 (Test) und 39 (Kontrolle) der
Zielvariablen "abnahme" als signikant zu erkennen, ist zu klein, um eine Entscheidung für H0 zuzulassen.
--> Versuchsplanung
c) Paarvergleich für das Testpräparat (Vergleich der Zielvariablen Fe1 und Fe2)
Präparatgruppe 1 (Test) auswählen mit:
Daten - Fälle auswählen - Falls Bedingung praep=1 zutrifft
Hypothese:
H0; im Mittel gilt Fe1 = Fe2 gegen H1: im Mittel gilt: Fe1 <> Fe2
Dialogfenster für den t-Test bei gepaarten Stichproben:
Statistik - Mittelwerte vergleichen - t-Test bei gepaarten Stichproben
Statistik bei gepa arte n Stichproben
Paaren
FE, Zeitp.1
FE, Zeitp.2
W. Timischl, LV-Nr. 104.001,75902701
Mittelwert
102,63
75,63
N
8
8
STD
36,23
15,14
SEM
12,81
5,35
15.05.16
8
Te st bei gepa arte n Stichproben
Mittelwert
Paaren
FE
Zeitp.1 FE
Zeitp.2
27,00
Gepaarte Differenz en
95% Konf. int. Diff.
STD
SEM
U
O
31,67
11,20
,52
53,48
T
2,411
Sign.
(2-seit .)
df
7
,047
Ergebnis: P-Wert = 2-seit.Sig = 4.7% < 5% --> H0 ablehnen.
Grundaufgabe 6: Wirksamkeits- u. Äquivalenzprüfung im Rahmen eines Paarvergleichs
In einem als randomisierte Versuchsanlage geplanten Experiment wurden 7 Probanden zeitlich hintereinander zwei
Präparate (1=Test, 2=Kontrolle) verabreicht, wobei die Zuordnung der Probanden zu den Präparatsequenzen 12 bzw. 21
zufällig erfolgte. Die Zielvariable ist die Halbwertszeit HWZ für die Elimination des jeweiligen Präparates aus dem Blut.
Man prüfe (=5%):
(i) Gibt es im Mittel einen Unterschied bezüglich der Zielvariablen (Wirksamkeitsprüfung)?
(ii) Sind die Halbwertszeiten im Mittel gleich? (Äquivalenzprüfung, Gleichheit besteht, wenn sich die Halbwertszeiten um
weniger als 20% des Kontrollpräparates unterscheiden.)
a) Daten
Datei: grund06.sav
Auflisten mit: Statistik - Zusammenfassen - Fälle zusammenfassen
Zusammenfassung von Fällena
1
2
3
4
5
6
7
Ins ges amt
N
Standardabweichung
Standardfehler des
Mittelwertes
Schiefe
Standardfehler der
Schiefe
Kurtosis
Standardfehler der
Kurtosis
Proband-Nr.
1
2
3
4
5
6
7
7
2,16
HWZ -Testpräp.
1,50
1,92
1,43
1,68
1,97
2,01
1,85
7
,2320
HWZ-Kontrolle
,82
8,769E-02
,1459
,000
-,558
,670
,794
,794
,794
-1,200
-1,589
-,713
1,587
1,587
1,587
1,95
2,05
2,46
2,88
2,52
1,80
2,03
7
,3861
a. Begrenzt auf die ersten 100 Fälle.
b) Wirksamkeitsprüfung mit dem t-Test für abhängige Stichproben
H0: Die Halbwertszeiten der Präparate stimmen im Mittel überein
H1: Die Halbwertszeiten der Präparate sind im Mittel verschieden
Dialogfenster: Statistik - Mittelwerte vergleichen - t-Test bei gepaarten Stichproben
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
9
Statistik bei gepa arte n Stichproben
Mittelwert
Paaren
Halbw. zeit
-Testp.
Halbw. zeit Kontr.
N
STD
SEM
1,7657
7
,2320
8,769E-02
2,2414
7
,3861
,1459
Test bei gepaarten Stichproben
Gepaarte Differenzen
Mittel
w.
Paaren
Halbw.zeit
-Testp.
Halbw.zeit
- Kontr.
STD
-,4757
95% CI Differenz
Untere
Obere
SEM
,5025
,1899
-,9405
-1,E-02
T
df
-2,505
Sig.
(2-seitig)
6
,046
Ergebnis: P = 2-seit.Sig. = 4,6% < 5% --> Die beobachtete Mittelwertdifferenz (Test-Kontrolle) von -0.4757 ist
signifikant.
c) Äquivalenzprüfung
H0: absolute Differenz der mittleren Halbwertszeiten >= vorgegebener relevanter Unterschied D (z.B. 20% des Mittels
des Kontrollpräparates)
ind die Präparate äquivalent)
Westlake-Verfahren:
H0 wird auf dem Niveau  abgelehnt (d.h. für die Äquivalenz der Präparate entschieden), wenn das (1-2)Konfidenzintervall der Mittelwertdifferenz im Toleranzintervall (-D, +D) liegt.
Dialogfenster: Statistik - Mittelwerte vergleichen - t-Test bei gepaarten Stichproben
(Konfidenzintervall auf 90% einstellen!)
Te st bei gepa arte n Stichproben
Gepaarte Differenzen
Mittelwert
Paaren
Halbwertsz eit
- Testpräp. Halbwertsz eit
- Kontrollpräp.
-,4757
STD
,5025
SEM
,1899
90% CI der
Differenz
Untere
Obere
-,8448
-,1066
T
-2, 505
Sig.
(2-seit ig)
df
6
,046
Ergebnis:
Stichprobenmittel des Kontrollpräperat ist 2,414; D (=20% von 2,414) = 0,448;
Toleranzintervall für die Äquivalenz = (-0,448, +0,448);
90%-Konfidenzintervall für die Mittelwertdifferenz ist nicht im Toleranzintervall enthalten. --> keine Äquivalenz
Grundaufgabe 7: Chiquadrat-Test für diskrete Verteilungen
Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige
gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis von
9 : 3 : 3 : 1? ( = 5%)
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
10
a) Daten
Datei: grund07.sav (Gewichtung der Fälle mit freq beachten!)
b) Anpassungstest
H0: die Phänotypen treten mit den Wahrscheinlichkeiten 9/16, 3/16, 3/16, 1/16 auf.
Dialogfenster: Statistik - Nichtparametrische Tests - Chi-quadrat
Phänotyp
rund/gelb
rund/grün
kantig/gelb
kantig/grün
Gesamt
Beobachtetes
N
315
108
101
32
556
Erwartete
Anzahl
312,8
104,3
104,3
34,8
Residuum
2,3
3,8
-3,3
-2,8
Statistik für Test
Chi-Quadrata
df
As ymptotis che Signifikanz
Phänotyp
,470
3
,925
a. Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten
erwartet. Die kleinste erwartete Zellenhäufigkeit ist
34,8.
Ergebnis: P = 92,5% --> H0 kann nicht abgelehnt werden.
Grundaufgabe 8: Vergleich von 2 Wahrscheinlichkeiten (unabhängige Stichproben)
Es ist zu untersuchen, ob die Düngung (Mineral- bzw. Tresterkompostdüngung) einen Einfluss auf den Pilzbefall
(Falscher Mehltau) von Weinstöcken (Vitis vinifera) hat oder nicht. Dazu werden 39 mineralgedüngte Weinstöcke
beobachtet, und es wird dabei festgestelltet, dass in 6 Fällen ein starker Befall (Ausprägung 1) zu verzeichnen ist, in den
restlichen 33 Fällen nur ein schwacher bzw. überhaupt keiner (Ausprägung 0). Parallel dazu werden 39
tresterkompostgedüngte Weinstöcke untersucht mit dem Ergebnis, dass in 23 Fällen ein starker Befall (Ausprägung 1)
und in 16 Fällen ein schwacher bis nicht erkennbarer Befall (Ausprägung 0) vorhanden war. ( = 5%)
a) Daten
Datei: grund08.sav (Gewichtung der Fälle mit den beobachteten Häufigkeiten beachten!)
b) Test
H_0: Befallrisiko ist unabhängig von der Düngung
Dialogfenster: Statistik - Zusammenfassen - Kreuztabellen
Pilzbefall * Düngung Kreuztabelle
Pilzbefall
nein
ja
Gesamt
W. Timischl, LV-Nr. 104.001,75902701
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Düngung
Mineral
Trester
33
16
24,5
24,5
6
23
14,5
14,5
39
39
39,0
39,0
Gesamt
49
49,0
29
29,0
78
78,0
15.05.16
11
Chi-Quadrat-Tests
W ert
Chi-Quadrat nach
Pearson
a
Kontinuität skorrekt ur
Lik elihood-Quotient
Ex akter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gült igen Fälle
As ymptotis che
Signifik anz
(2-seitig)
df
15,863
b
14,052
16,656
15,660
1
,000
1
1
,000
,000
1
Ex akte
Signifik anz
(2-seitig)
Ex akte
Signifik anz
(1-seitig)
,000
,000
,000
78
a. W ird nur für eine 2x 2-Tabelle berechnet
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartet e Häufigkeit
ist 14,50.
Symmetrische Maße
Nominal- bzgl.
Nominalmaß
Wert
,451
,451
78
Phi
Cramer-V
Anzahl der gültigen Fälle
Näherungs weis e
Signifikanz
,000
,000
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler
verwendet.
Grundaufgabe 9: McNemar-Test zum Vergleich von 2 Wahrscheinlichkeiten (abhängige Stichproben)
Bei einer Studie wurde u.a. das Ges.Eiweiß i.S. zu Beginn und am Ende bestimmt. Es ergab sich, dass bei 22
Probanden der Eiweißwert vor und nach Ende der Studie im Normbereich lag, bei 12 Probanden lag der Wert vorher im
Normbereich und nachher außerhalb, bei 7 Probanden vorher außerhalb und nachher im Normbereich und bei 4 vorher
und nachher außerhalb des Normbereichs. Hat sich während der Studie eine signifikante Änderung hinsichtlich des
Normbereichs ergeben? ( = 5%)
a) Daten
Datei: grund09.sav (Gewichtung der Fälle beachten!)
b) Test
H0: p(im Normbereich/vorher-->ausßerhalb/nachher) = p(außerhalb/vorher--> im Normbereich(nachher)
Dialogfenster: Statistik - Nichtparametrische Tests - 2 verbundene Stichproben - McNemar
1& 2
Behandlungsbeginn
1
2
W. Timischl, LV-Nr. 104.001,75902701
Behandlungsende
1
2
22
12
7
4
15.05.16
12
Statistik für Testb
1&2
45
N
Exakte Signifikanz
(2-seitig)
a
,359
a. Verwendetete Binomialverteilung.
b. McNemar-Test
Ergebnis: P = 35,9% --> H0 kann nicht abgelehnt werden.
Grundaufgabe 10: Prüfung auf Abhängigkeit (nominale Daten)
Die Wirksamkeit einer Behandlung wurde einerseits durch den Probanden und andererseits durch den Prüfarzt beurteilt.
Man beschreibe den Zusammenhang zwischen den Beurteilungen mit einem geeigneten Korrelationsmaß. Wie groß sind
die bei einer angenommenen Unabhängigkeit zu erwartenden absoluten Häufigkeiten? Ist die Korrelation signifikant von
Null verschieden? ( = 5%)
a) Daten
Datei: grund10.sav (Gewichtung beachten!)
b) Kreuztabelle mit Abhängigkeitsprüfung
H_0: die Beurteilungen durch den Probanden und durch den Prüfarzt sind unabhängig
Dialogfenster: Statistik - Zusammenfassen - Kreuztabellen
Be urte ilung d. Prüfarz t * Beurteilung d. Proband Kre uzta bell e
Beurteilung
d. Prüfarzt
sehr gut
gut
mäßig
Gesamt
Anzahl
Erwart ete Anzahl
Anzahl
Erwart ete Anzahl
Anzahl
Erwart ete Anzahl
Anzahl
Erwart ete Anzahl
Beurteilung d. Proband
sehr gut
gut
mäßig
23
5
4
14,1
9,4
8,5
7
13
6
11,4
7,6
6,9
3
4
10
7,5
5,0
4,5
33
22
20
33,0
22,0
20,0
Gesamt
32
32,0
26
26,0
17
17,0
75
75,0
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
As ymptotis che
Signifikanz
(2-seitig)
df
25,215
a
4
,000
24,045
4
,000
17,358
1
,000
75
a. 2 Zellen (22,2%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit is t 4,53.
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
13
Symmetrische Maße
Nominal- bzgl.
Nominalmaß
Wert
,580
,410
75
Phi
Cramer-V
Anzahl der gültigen Fälle
Näherungs weis e
Signifikanz
,000
,000
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler
verwendet.
Grundaufgabe 11: Prüfung auf Abhängigkeit bei metrischen Variablen; lineare Regression
In einer Stichprobe von 10 Frauen wurden der Blutdruck (mm Hg)und das Alter registriert (Daten siehe folgende
Tabelle). Kann man vom Alter im Rahmen eines linearen Regressionsmodells auf den Blutdruck schließen? ( = 5%)
a) Daten
Datei: grund11.sav
Auflisten der Fälle mit: Statistik - Zusammenfassen - Fälle zusammenfassen
Zusammenfassung von Fällena
1
2
3
4
5
6
7
8
9
10
Alter/Jahre
36
57
61
42
46
31
49
27
35
58
Blutdruck
(mm Hg)
123
137
139
127
125
120
125
118
125
140
a. Begrenzt auf die ers ten 100 Fälle.
b) Darstellung der Abhängigkeit im Streudiagramm
Dialogfenster: Grafiken - Streudiagramm
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
14
150
140
Blutdruck (mm Hg)
130
120
110
R-Qu. = 0,8689
20
30
40
50
60
70
A lter/Jahre
Ergebnis:
Beschreibung der Abhängigkeit durch lineares Modell adäquat; Anstieg der Regressionsgerade von Null verschieden.
Frage:
Ist der Anstieg signifikant ungleich Null? (Nur dann hängt der Blutdruck vom Alter ab.)
c) Abhängigkeitsprüfung
c1) Korrelationstest (Pearson)
H0: (Pearson-)Korrelation = 0
Dialogfenster: Statistik - Korrelation - Bivariat ...
Korrelationen
Alter/Jahre
Blutdruck (mm Hg)
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
Alter/Jahre
1,000
,
10
,932**
,000
10
Blutdruck
(mm Hg)
,932**
,000
10
1,000
,
10
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
c2) Abhängigkeitsprüfung im Rahmen des Regressionsmodells
H0: Geradenanstieg = 0
Dialogfenster: Statistik - Regression - Linear ...
De skriptive Statistike n
Blutdruck (mm Hg)
Alter/Jahre
W. Timischl, LV-Nr. 104.001,75902701
Mittelwert
127,90
44,20
St andardabweichung
7,91
11,97
N
10
10
15.05.16
15
Koeffizientena
Modell
1
Nicht s tandardis ierte
Koeffizienten
B
Standardfehler
100,679
3,860
,616
,085
(Konstante)
Alter/Jahre
Standardi
sierte
Koeffizien
ten
Beta
,932
T
26,086
7,282
Signifikanz
,000
,000
a. Abhängige Variable: Blutdruck (mm Hg)
Ergebnis: Geradenanstieg (=0.616) signifikant ungleich Null (P = 0,000)
Regressionsgleichung: Blutdruck = 100,679 + 0,616 * Alter
Grundaufgabe 12: 1-faktorielle Varianzanalyse
Globaltest, Homogenitätsprüfung, multiple Mittelwertvergleiche)
Man vergleiche an Hand der Beobachtungsreihen in der folgenden Tabelle die Mg-Konzentration zwischen den
Lösungen 1, 2 und 3. Bestehen zwischen den Lösungen signifikante Mittelwertunterschiede? Man führe die Aufgabe
auch mit den K- und Ca-Konzentrationen durch. ( = 5%)
a) Daten
Datei: grund12.sav
Auflisten der Daten mit: Statistik - Zusammenfassen - Fälle zusammenfassen ...
Zusammenfassung von Fällena
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Ins ges amt
N
Mittelwert
Standardabweichung
Standardfehler des
Mittelwertes
Varianz
Schiefe
Standardfehler der
Schiefe
Kurtos is
Standardfehler der
Kurtos is
Nährlösung
1.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 3.75Ca
1.5K, 3.75Ca
1.5K, 3.75Ca
1.5K, 3.75Ca
1.5K, 3.75Ca
1.5K, 3.75Ca
7.5K, 0.75Ca
7.5K, 0.75Ca
7.5K, 0.75Ca
7.5K, 0.75Ca
7.5K, 0.75Ca
7.5K, 0.75Ca
18
2,00
,84
Magnesium
218
185
256
251
241
246
184
161
155
185
203
166
182
216
186
145
125
121
18
190,33
41,49
Kalium
712
716
742
715
910
831
712
698
552
855
659
585
1970
1649
1843
2057
1714
2027
18
1108,17
572,73
Calzium
356
431
619
472
555
564
1121
1031
1148
1045
1073
904
398
415
345
253
222
256
18
622,67
333,63
,20
9,78
134,99
78,64
,706
,000
1721,176
,055
328021,0
,786
111310,2
,517
,536
,536
,536
,536
-1,594
-,851
-1,312
-1,416
1,038
1,038
1,038
1,038
a. Begrenzt auf die ers ten 100 Fälle.
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
16
b) Abhängigkeitsprüfung (Nährlösung --> Zielvariable Mg)
(Deskriptive Statistiken, Globaltest, Homogenitätsprüfung, a priori-Vergleiche, Scheffe-Test)
Deskriptive Statistik
Magnesium
Mittelwe
rt
232,83
175,67
162,50
190,33
N
1.5K, 0.75Ca
1.5K, 3.75Ca
7.5K, 0.75Ca
Gesamt
6
6
6
18
STD
26,89
18,11
38,02
41,49
95%-CI für den
Mittelwert
U
O
204,62
261,05
156,66
194,67
122,60
202,40
169,70
210,96
SEM
10,98
7,39
15,52
9,78
Min
185
155
121
121
Max
256
203
216
256
Te st der Homogenität der Varianz en
Magnesium
Levene-Statistik
2,968
df1
df2
2
15
Signifik anz
,082
Ergebnis: Sign. =0,082  Varianzinhomogenität: nicht signifikant.
ANOVA
Magnesium
Zwischen den
Gruppen
(Kombiniert)
Linearer
Term
Kontrast
Abweic hung
Innerhalb der Gruppen
Gesamt
2
1
1
Mittel der
Quadrate
8388,167
14840, 333
1936,000
12483, 667
15
832,244
29260, 000
17
Quadratsumme
16776, 333
14840, 333
1936,000
df
F
10,079
17,832
2,326
Ergebnis: Sign. (Zwischen den Gruppen)= 0,002  Faktorwirkung ist signifikant.
Kontrast-Koeffizienten
Kontras t
1
2
1.5K,
0.75Ca
1
1
Nährlös ung
1.5K,
3.75Ca
-1
0
7.5K,
0.75Ca
0
-1
Kontra st-Tests
Magnesium
Varianzen sind gleich
Varianzen sind nicht
gleich
W. Timischl, LV-Nr. 104.001,75902701
Kontrast
1
2
1
2
Kontrast
wert
57,17
70,33
57,17
70,33
STF
16,66
16,66
13,23
19,01
T
3,432
4,223
4,320
3,699
df
15
15
8,761
9,000
Sign
(2-seit ig)
,004
,001
,002
,005
15.05.16
Sign
,002
,001
,148
17
Mehrfachvergleiche
Abhängige Variable: Magnes ium
Scheffé-Prozedur
(I) Nährlösung
1.5K, 0.75Ca
1.5K, 3.75Ca
7.5K, 0.75Ca
(J) Nährlös ung
1.5K, 3.75Ca
7.5K, 0.75Ca
1.5K, 0.75Ca
7.5K, 0.75Ca
1.5K, 0.75Ca
1.5K, 3.75Ca
Mittlere
Differenz
(I-J)
Standardfehler
57,17*
16,656
70,33*
16,656
-57,17*
16,656
13,17
16,656
-70,33*
16,656
-13,17
16,656
Signifikanz
,013
,003
,013
,736
,003
,736
95%-Konfidenzintervall
Untergrenze
Obergrenze
11,97
102,37
25,13
115,53
-102,37
-11,97
-32,03
58,37
-115,53
-25,13
-58,37
32,03
*. Die mittlere Differenz ist auf der Stufe .05 signifikant.
Magnesium - Homogene Untergruppen
a
Scheffé-Prozedur
Nährlösung
7.5K, 0.75Ca
1.5K, 3.75Ca
1.5K, 0.75Ca
Signifikanz
N
6
6
6
Untergruppe für Alpha
= .05.
1
2
162,50
175,67
232,83
,736
1,000
Die Mittelwerte für die in homogenen Untergruppen
befindlichen Gruppen werden angezeigt.
a. Verwendet ein harmonis ches Mittel für
Stichprobengröße = 6,000.
Ergebnis (Mittelwertvergleiche): Der Mittelwert auf der Faktorstufe "1.5K, 0.75Ca" weicht signifikant von den anderen
Faktorstufenmitelwerten ab.
Mittelwert-Diagramm
240
220
Mittelwert von Magnesium
200
180
160
140
1.5K, 0.75Ca
1.5K, 3.75Ca
7.5K, 0.75Ca
Nährlösung
W. Timischl, LV-Nr. 104.001,75902701
15.05.16
Herunterladen