1 Angewandte Statistik: Lösung von Grundaufgaben mit SPSS Version 11.5 Daten: grund??.sav Ausgabe WS 2003/04 Begleitskriptum zum Lehrbuch: W. Timischl: Biostatistik, Wien - New York: Springer 2000. Problemlösung (schematisch) mit dem Datenanalysesystem SPSS: Dateneingabe: Direkteingabe (Datei-Neu) oder durch Importieren einer Datei (Datei-Öffnen, z.B. Dateien vom Typ sav, xls, txt, ...) DATEN-FENSTER mit SPSS-Datenmatrix: Variable > Spalten, Untersuchungseinheiten > Zeilen Datenmanipulation wie z.B.: - Daten-Fälle sortieren ... - Daten-Fälle auswählen ... - Daten-Fälle gewichten ... - Transformieren-Berechnen ... Auswerten mit Menueoptionen wie z.B.: - Analysieren-Deskriptive StatistikenExplorative Datenanalyse ... - Analysieren-Mittelwerte vergleichenT-Test bei einer Stichprobe ... - Grafiken-Balken ... - Grafiken-Streudiagramm ... EINFÜGEN OK SYNTAX-FENSTER mit SPSS-Programm, z.B.: EXAMINE VARIABLES=x_7 BY typ /PLOT BOXPLOT /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. AUSFÜHREN VIEWER-FENSTER mit Ergebnissen W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 2 Grundaufgabe 1: Berechnungen im Datenfenster (Rechnen mit Wahrscheinlichkeiten) (i) Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Vari anz 0.25. Welcher Anteil von Präparaten mit der Substanz W zwischen 9mg und 11mg ist zu erwarten? (ii) Bei einem Test werden 5 Aufgaben derart gestellt, daß es bei jeder Aufgabe 4 Antwortmöglichkeiten gibt, von denen genau eine die richtige ist. Wie groß ist die Wahrscheinlichkeit, daß man mehr als die Hälfte der Aufgaben richtig löst, wenn die Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit 1/4 gewählt wird? Lösung: (i) Daten-Fenster: Hauptmenü: Transformieren – Berechnen … Ergebnis: anteil = 0,9545 = 95,45% (ii) Wahrscheinlichkeit = 1- CDF.BINOM(2,5,0.25) = 10.35% W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 3 Grundaufgabe 2: Eindimensionale Datenbeschreibung Man vergleiche die Verteilungen der Spaltöffnungslängen (Merkmal X, in mm) bei diploiden und tetraploiden Biscutella laevigata . X/diploid: X/tetraploid: 27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23,24, 26, 26 28, 30, 28, 32, 25, 29, 28, 33, 32, 28, 28, 30, 32, 31, 31, 34, 29, 36, 33, 30, 29, 27, 27, 29, 26 Datei: grund02.sav Lösung: Daten-Fenster: Hauptmenü: Analysieren – Deskriptive Statistiken – Explorative Datenanalyse ... Syntax-Fenster: SPSS-Programmcode (Einfügen) EXAMINE VARIABLES=x_7 BY typ /PLOT BOXPLOT STEMLEAF /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 4 Viewer-Fenster: Ergebnisse (teilweise) Univariate Statistiken TYP diploid Spaltöffnungslänge tetraploid Mittelwert 95% Konfidenzintervall des Mittelwerts 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis Mittelwert 95% Konfidenzintervall des Mittelwerts Statistik 24,67 23,79 25,55 24,69 25,00 2,524 1,59 22 27 5 3,00 -,105 -1,174 29,80 28,71 30,89 29,73 29,00 6,917 2,63 25 36 11 4,00 ,430 -,070 Untergrenze Obergrenze Untergrenze Obergrenze 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis Standardfehler ,41 ,580 1,121 ,53 ,464 ,902 Schnelltest („quick and dirty“) auf Abweichungen von der Normalverteilung: Daten sind mit Normalverteilungsannahme verträglich, wenn sowohl die Schiefe als auch die Kurtosis nicht „signifikant“ von null abweichen. Für nicht zu kleine Stichprobenumfänge vertretbare Näherungen für 95%Konfidenzintervalle für die Schiefe und Kurtosis erhält man, indem man um den jeweiligen Schätzwert ein Intervall mit dem entsprechenden 2-fachen Standardfehler bildet. Liegt die null außerhalb dieses Intervalls, besteht – mit einem Irrtumsrisiko von 5% - eine signifikante Abweichung von null. Spaltöffnungslänge Stem-and-Leaf Plot for TYP= diploid Frequency Stem & Leaf 22 23 24 25 26 27 0 0000 0 0000 000 00 Spaltöffnungslänge Stem-and-Leaf Plot for TYP= tetraploid Frequency 1,00 4,00 1,00 4,00 3,00 2,00 Stem width: Each leaf: . . . . . . 1 1 case(s) 1,00 3,00 9,00 5,00 5,00 1,00 1,00 Stem width: Each leaf: W. Timischl, LV-Nr. 859 903, grund_spss11neu Stem & 2 2 2 3 3 3 3 . . . . . . . Leaf 5 677 888889999 00011 22233 4 6 10 1 case(s) 08.03.04 5 38 36 34 32 Spaltöffnungslänge 30 28 26 24 22 20 N= 15 25 diploid tetraploid TYP Grundaufgabe 3: Vergleich einer Wahrscheinlichkeit mit einem Sollwert (Binomialtest) Bei einer Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. (i) Liegt eine signifikante Abweichung vom garantierten Prozentsatz vor? Man prüfe diese Frage auf dem Signifikanzniveau α=5%. (ii) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? Datei: grund3.sav Lösung: (i) Daten-Fenster: DatenFälle gewichten … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 6 Keimfähigkeit Anzeige der Daten (im Viewer): Analysieren – Deskriptive Statistiken – Häufigkeiten ... Gültig 1 (ja) 2 (nein) Gesamt Häufigkeit 35 25 60 Prozent 58,3 41,7 100,0 Gültige Prozente 58,3 41,7 100,0 Kumulierte Prozente 58,3 100,0 Einseitiger Binomialtest: H0: p>=0.75, H1: p<0.75 Hauptmenü im Datenfenster: Analysieren – Nichtparametrische Tests – Binomial ... Test auf Binomialverteilung Viewer-Fenster: Ergebnisse Keimfähigkeit Gruppe 1 Gruppe 2 Gesamt Kategorie ja nein N 35 25 60 Beobachteter Anteil ,583333 ,42 1,00 Testanteil ,75 Asymptotische Signifikanz (1-seitig) ,002a,b a. Nach der alternativen Hypothese ist der Anteil der Fälle in der ersten Gruppe < ,75. b. Basiert auf der Z-Approximation. Interpretation: 1-seit.Sign. (= P-Wert) = 0,002 = Risiko für irrtümliche Ablehnung von H0 à H1 (p<0.75) (ii) Fallzahlenschätzung - Formelauswertungen im Daten-Fenster p_0=0.75, delta = 0.1; z0_95= IDF.NORMAL(1-alpha,0,1) = 1.65, z0_90 = IDF.NORMAL(1-beta,0,1) = 1.28, n = 1/delta**2 *(z0_95*SQRT(p_0*(1-p_0)) + z0_90*SQRT((p_0+delta)*(1-p_0-delta)))**2 ≅ 137 (Transformieren – Berechnen …) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 7 Grundaufgabe 4: Vergleich eines Mittelwerts mit einem Sollwert Während der Sommermonate wurden von einer Messstelle die in der folgenden Tabelle enthaltenen Ozonwerte (in ppm/100) erfasst. (i) Man erstelle eine geeignete Häufigkeitsverteilung (grafisch) und beschreibe die Verteilung durch die üblichen deskriptiven Statistiken. Gibt es einen Grund, die Ozonwerte als nicht normalverteilt zu betrachten? (ii) Man prüfe, ob die durchschnittliche Konzentration signifikant ( α= 5%) kleiner als 0.045 ppm ist. 3,6 6,7 2,5 6,7 5,4 1,5 2,5 3,0 1,7 4,1 6,6 5,4 5,6 5,3 5,1 6,0 4,5 4,7 4,6 5,6 4,2 5,4 6,5 7,4 5,4 6,1 5,8 9,5 6,9 6,6 7,6 8,2 3,4 3,2 4,4 6,2 3,1 8,8 4,7 5,7 6,0 5,8 7,3 3,8 4,5 5,5 2,6 1,3 5,9 7,7 Datei: grund04.sav (i) Häufigkeitsverteilung Hauptmenü im Datenfenster: AnalysierenDeskriptive StatistikenExplorative Datenanalyse … Univariate Statistiken OZON à Viewer-Fenster: Ergebnisse (teilweise) Statistik 5,212 Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze 4,686 5,738 5% getrimmtes Mittel 5,212 Median 5,400 Varianz Standardfehler ,2619 3,429 Standardabweichung 1,8518 Minimum 1,3 Maximum 9,5 Spannweite 8,2 Interquartilbereich 2,500 Schiefe -,116 ,337 Kurtosis -,165 ,662 Tests auf Normalverteilung Interpretation: P = Risiko für irrtümliche Kolmogorov-Smirnov(a) Shapiro-Wilk Ablehnung von H0 Statistik df Signifikanz Statistik df Signifikanz (Normalverteilung) ≥ 0,2 OZON ,100 50 ,200(*) ,986 50 ,832 (K-S-Test) ≥ 5% * Dies ist eine untere Grenze der echten Signifikanz. à auf 5%igem Testniveau a Signifikanzkorrektur nach Lilliefors kann H0 nicht abgelehnt werden, d.h. Annahme der Normalverteilung bleibt aufrecht. Histogramm 20 Häufigkeit 10 Std.abw. = 1,85 Mittel = 5,21 N = 50,00 0 ,75 3,75 2,25 W. Timischl, LV-Nr. 859 903, grund_spss11neu OZON 6,75 5,25 9,75 8,25 08.03.04 8 Bearbeitung der Grafik: Doppelklicken auf die Grafik im Viewer-Fenster à Öffnen des Chart-Fensters mit Bearbeitungsoptionen (ii) Sollwertvergleich H0: mittlere Ozonkonzentration ≥ Sollwert = 4,5 vs. H1: mittlere Ozonkonzentration < Sollwert = 4,5 Hauptmenü: AnalysierenMittelwerte vergleichenT-Test bei einer Stichprobe ... Statistik bei einer Stichprobe Viewer-Fenster: Ergebnisse (teilweise) N OZON 50 Mittelwert 5,212 Standardabw eichung 1,8518 Standardfehl er des Mittelwertes ,2619 Test bei einer Sichprobe Testwert = 4.5 T OZON 2,719 df Sig. (2-seitig) 49 ,009 Mittlere Differenz ,712 95% Konfidenzintervall der Differenz Untere ,186 Obere 1,238 Interpretation: Wenn - wie in diesem Beispiel - der Stichprobenmittelwert und der Sollwert im Sinne von H0 zueinander stehen: P = Risiko für irrtümliche Ablehnung von H0 = 1-(2-seit.Sig)/2 = 99,55% à H0 nicht ablehnen. W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 9 Grundaufgabe 5: Mittelwertvergleiche im Rahmen eines Parallelversuchs bzw. eines Paarvergleichs An Hand der Datentabelle (siehe das Daten-Fenster) sollen folgende Fragen untersucht werden (α = 5%): (i) Bewirkt das Testpräparat (Präparat=1) eine mittlere Abnahme Fe1-Fe2 der Zielvariablen (Serumeisen) vom Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2), die von der durch das Kontrollpräparat (Präparat=2) verursachten abweicht? (ii) Zeigt die Zielvariable Serumeisen vom Zeitpunkt 1 (Variable Fe1) bis zum Zeitpunkt 2 (Variable Fe2) im Mittel innerhalb jeder Präparatgruppe eine signifikante Änderung? Datei: grund05.sav Lösung: (i) Parallelversuch Bereitstellung der Zielvariablen abnahme = Fe1 - Fe2 mit Hilfe von: Transformieren - Berechnen ... à Daten-Fenster Berechnung von deskriptiven Statistiken mit Hilfe von: AnalysierenBerichteFälle zusammenfassen ... W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 10 Zusammenfassung von Fällen Viewer – Fenster: Ergebnisse Präparat Test Alter/ Jahre N Serumeisen, Zeitp.1 Serumeisen, Zeitp.2 ABNAHME 8 8 8 8 Mittelwert 23,50 102,62 75,63 27,00 Standardabweichung 3,665 36,229 15,137 31,672 Standardfehler des Mittelwertes 1,296 12,809 5,352 11,198 ,418 -,190 ,662 ,193 ,752 ,752 ,752 ,752 -1,222 -2,077 -,309 -1,341 1,481 1,481 1,481 1,481 Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Kontrolle N 8 8 8 8 Mittelwert 25,13 111,13 72,12 39,00 Standardabweichung 2,167 20,657 24,567 26,987 ,766 7,303 8,686 9,541 -,549 -1,210 ,445 -,060 ,752 ,752 ,752 ,752 -,663 2,820 -1,684 -1,451 1,481 1,481 1,481 1,481 16 16 16 16 Mittelwert 24,31 106,87 73,88 33,00 Standardabweichung 3,027 28,826 19,795 29,093 ,757 7,206 4,949 7,273 -,193 -,581 ,324 -,027 ,564 ,564 ,564 ,564 -1,014 -,900 -1,069 -1,275 1,091 1,091 1,091 1,091 Standardfehler des Mittelwertes Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Insgesamt N Standardfehler des Mittelwertes Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis Prüfung auf Normalverteilung (H0: Daten aus normalverteilter Grundgesamtheit): Zur Anwendung des Tests in einem Arbeitsgang auf beide Gruppen: Daten - Datei aufteilen ... W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 11 Ausführung des Tests durch AnalysierenNichtparametrische Tests– K-S bei einer Stichprobe … Kolmogorov-Smirnov-Anpassungstest(c) Testergebnisse im Viewer-Fenster: ABNAHME 8 N Mittelwert Interpretation/Testpräparat: P = Asymptotische Sign. = 0.987 ≥ 5% à Normalverteilungsannahme wird beibehalten 27,00 Parameter der Normalverteilung(a,b) Standardabweichung Extremste Differenzen Absolut ,159 Positiv ,159 Negativ -,141 31,672 Kolmogorov-Smirnov-Z ,450 Asymptotische Signifikanz (2-seitig) ,987 a Die zu testende Verteilung ist eine Normalverteilung. b Aus den Daten berechnet. c Präparat = Test Kolmogorov-Smirnov-Anpassungstest(c) ABNAHME Interpretation/Kontrollpräparat: P = Asymptotische Sign. = 0.869 ≥ 5% à Normalverteilungsannahme wird beibehalten N 8 Mittelwert Parameter der Normalverteilung(a,b) Standardabweichung Extremste Differenzen Absolut 39,00 26,987 ,211 Positiv ,125 Negativ -,211 Kolmogorov-Smirnov-Z Asymptotische Signifikanz (2-seitig) ,596 ,869 a Die zu testende Verteilung ist eine Normalverteilung. b Aus den Daten berechnet. c Präparat = Kontrolle Mittelwertvergleich mit dem t-Test für unabhängige Stichproben: H0: mittl. abnahme/Test = mittl. abnahme/Kontrolle vs. H1: mittl. abnahme/Test ≠ mittl. abnahme/Kontrolle Wichtig: vor Anwendung des t-Tests ist die Aufteilung der Datei aufzuheben! (Daten - Datei aufteilen ... /alle Fälle analysieren) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 12 t-Test für unabhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei unabhängigen Stichproben ... Gruppenstatistiken Testergebnis im Viewer-Fenster: ABNAHME Präparat Test N Kontrolle Mittelwert Standardabw eichung Standardfehler des Mittelwertes 8 27,00 31,672 11,198 8 39,00 26,987 9,541 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit Varianzen sind gleich Varianzen sind nicht gleich ,302 ,591 df Standardfe hler der Differenz T Mittlere Differenz Sig. (2seitig) Signifikanz F ABNAHME T-Test für die Mittelwertgleichheit 95% Konfidenzintervall der Differenz Untere Obere -,816 14 ,428 -12,00 14,712 -43,553 19,553 -,816 13,656 ,429 -12,00 14,712 -43,628 19,628 Interpretation: Varianzvergleich (Levene-Test): P = 0.591≥ 5% à Varianzgleichheit kann angenommen werden. Mittelwertvergleich: P = Risiko für eine irrtümliche Ablehnung von H0 ist 2-seit.Sign. = 42.8% > 5% à H0 (Gleichheit der mittleren Abnahmen) kann nicht abgelehnt werden! Bestimmung des ß-Fehlers (bzw. der Power): AnalysierenAllgemeines lineares Modell– Univariat ... (Hinweis: "Power = Beobachtete Schärfe" in Optionen aktivieren) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 13 Ergebnis der Powerberechnung im Viewer-Fenster: Tests der Zwischensubjekteffekte Abhängige Variable: ABNAHME Quelle Korrigiertes Modell Konstanter Term PRAEP Quadratsumme vom Typ III 576,000(b) 17424,000 F 1 Mittel der Quadrate 576,000 1 17424,000 df 576,000 1 576,000 Fehler 12120,000 14 865,714 Gesamt 30120,000 16 Korrigierte Gesamtvariation 12696,000 15 ,665 Sign. ,428 NZP ,665 Power(a) ,119 20,127 ,001 20,127 ,986 ,665 ,428 ,665 ,119 a Unter Verwendung von Alpha = ,05 berechnet b R-Quadrat = ,045 (korrigiertes R-Quadrat = -,023) Interpretation: Power (=Schärfe) = 11,9% (PRAEP-Zeile), d.h. Sicherheit, mit dem gewählten Versuchsansatz die Differenz der Mittelwerte 27 (Test ) und 39 (Kontrolle) der Zielvariablen abnahme auf 5%igem Testniveau als signikant zu erkennen, ist zu klein, um eine Entscheidung für H0 zuzulassen. à Versuch neu planen (Stichprobenumfang!) (ii) Paarvergleich für das Testpräparat (Vergleich der Zielvariablen Fe1 und Fe2) Präparatgruppe 1 (Test) auswählen mit: DatenFälle auswählen … (Falls Bedingung “praep=1“ zutrifft) Ergebnis der Datenselektion im Daten-Fenster: W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 14 Mittelwertvergleich: H0: im Mittel gilt fe1 = fe2 vs. H1: im Mittel gilt fe1 ≠ fe2 t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei abhängigen Stichproben ... Statistik bei gepaarten Stichproben Testergebnis im Viewer-Fenster: Mittelwert Paaren 1 N Standardabweichung Standardfehler des Mittelwertes Serumeisen, Zeitp.1 102,63 8 36,229 12,809 Serumeisen, Zeitp.2 75,63 8 15,137 5,352 Test bei gepaarten Stichproben Gepaarte Differenzen Mittelwert STD SEM Serumeisen, Zeitp.1 Serumeisen, Zeitp.2 27,00 31,672 11,198 Sig. (2seitig) df 95% Konfidenzintervall der Differenz Untere Paaren 1 T ,52 Obere 53,48 2,411 7 ,047 Interpretation: P-Wert = 2-seit.Sig = 4.7% < 5% à H0 (Gleichheit der Mittelwerte) ablehnen. Grundaufgabe 6: Wirksamkeits- u. Äquivalenzprüfung im Rahmen eines Paarvergleichs In einem als randomisierte Versuchsanlage geplanten Experiment wurden 7 Probanden zeitlich hintereinander zwei Präparate (1=Test, 2=Kontrolle) verabreicht, wobei die Zuordnung der Probanden zu den Präparatsequenzen 12 bzw. 21 zufällig erfolgte. Die Zielvariable ist die Halbwertszeit HWZ für die Elimination des jeweiligen Präparates aus dem Blut. Man prüfe (α=5%): (i) Gibt es im Mittel einen Unterschied bezüglich der Zielvariablen (Wirksamkeitsprüfung)? (ii) Sind die Halbwertszeiten im Mittel gleich? (Äquivalenzprüfung, Gleichheit besteht, wenn sich die Halbwertszeiten um weniger als 20% des Kontrollpräparates unterscheiden.) Datei: grund06.sav Lösung: Datenbeschreibung: Auflisten der Stichprobenwerte und Berechnung von deskriptiven Statistiken mit Hilfe von: Analysieren- Berichte-Fälle zusammenfassen ... W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 15 Zusammenfassung von Fällen(a) Ergebnisse (Stichproben, deskriptive Statistiken) Im Viewer: 1 HalbwertszeitTestpräp. 1,50 HalbwertszeitKontrollpräp. 1,95 2 1,92 2,05 3 1,43 2,46 4 1,68 2,88 5 1,97 2,52 6 2,01 1,80 1,85 2,03 7 7 1,7657 2,2414 ,23201 ,38607 ,08769 ,14592 -,558 ,670 ,794 ,794 -1,589 -,713 1,587 1,587 7 Insgesamt N Mittelwert Standardabweich ung Standardfehler des Mittelwertes Schiefe Standardfehler der Schiefe Kurtosis Standardfehler der Kurtosis a Begrenzt auf die ersten 100 Fälle. (i) Wirksamkeitsprüfung mit dem t-Test für abhängige Stichproben H0: Die Halbwertszeiten der Präparate stimmen im Mittel überein H1: Die Halbwertszeiten der Präparate sind im Mittel verschieden t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei gepaarten Stichproben ... Statistik bei gepaarten Stichproben Mittelwert Paaren 1 Ergebnis (bearbeitet) im Viewer: N STD SEM Halbwertszeit -Testpräp. 1,7657 7 ,23201 ,08769 Halbwertszeit -Kontrollpräp. 2,2414 7 ,38607 ,14592 Test bei gepaarten Stichproben Gepaarte Differenzen Mittelwert STD SEM HalbwertszeitTestpräp. HalbwertszeitKontrollpräp. -,4757 ,50252 ,18994 Sig. (2seitig) df 95% Konfidenzintervall der Differenz Untere Paaren 1 T -,9405 Obere -,0110 -2,505 6 Interpretation: P = 2-seit.Sig. = 4,6% < 5% à Die beobachtete Mittelwertdifferenz (Test-Kontrolle) von -0.4757 ist auf 5%igem Testniveau signifikant. W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 ,046 16 (ii) Äquivalenzprüfung H0: absolute Differenz der mittleren Halbwertszeiten ≥ vorgegebener relevanter Unterschied D (z.B. 20% des Mittels des Kontrollpräparates) H1: absolute Differenz der mittleren Halbwertszeiten < D (in diesem Fall sind die Präparate äquivalent) Westlake-Verfahren: H0 wird auf dem Niveau α abgelehnt (d.h. für die Äquivalenz der Präparate entschieden), wenn das (1-2α)-Konfidenzintervall der Mittelwertdifferenz im Toleranzintervall (-D, +D) liegt. t-Test für abhängige Stichproben: Analysieren – Mittelwerte vergleichen – T-Test bei gepaarten Stichproben ... Hinweis: Konfidenzintervall auf 90% einstellen (Optionen)! Ergebnisse (bearbeitet)im Viewer: Test bei gepaarten Stichproben Gepaarte Differenzen Mittelwert STD SEM T 90% Konfidenzintervall der Differenz Untere Paaren 1 HalbwertszeitTestpräp. HalbwertszeitKontrollpräp. -,4757 ,50252 ,18994 Sig. (2seitig) df -,8448 Obere -,1066 -2,505 6 ,046 Interpretation: Stichprobenmittel des Kontrollpräperat ist 2.414; D (=20% von 2.414) = 0.448; Toleranzintervall für die Äquivalenz = (-0.448, +0.448); 90%-Konfidenzintervall für die Mittelwertdifferenz ist nicht im Toleranzintervall enthalten à keine Äquivalenz Grundaufgabe 7: Chiquadrat-Test für diskrete Verteilungen Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis von 9 : 3 : 3 : 1? (α = 5%) Datei: grund07.sav Lösung: Daten-Fenster: Zielvariable = phaeno (Werte 1=rund/gelb usw.), Gewichtung der Fälle mit Hilfsvariabler freq beachten! W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 17 Hypothesen: H0: die Phänotypen treten mit Wahrscheinlichkeiten im Verhältnis 9:3:3:1 auf vs. H1: die Phänotypen treten mit Wahrscheinlichkeiten in einem von 9:3:3:1 abweichenden Verhältnis auf. Chiquadrat-Test zur Prüfung auf ein vorgegebenes Verhältnis: AnalysierenNichtparametrische TestsChi-quadrat ... Ergebnisse im Viewer: Phänotyp Statistik für Test rund/gelb Beobachtetes N 315 Erwartete Anzahl 312,8 Residuum 2,3 rund/grün 108 104,3 3,8 kantig/gelb kantig/grün Gesamt 101 104,3 -3,3 32 34,8 -2,8 556 Chi-Quadrat(a) df Phänotyp ,470 3 Asymptotische Signifikanz ,925 a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 34,8. Interpretation: P = Asymptotische Signifikanz = 92,5% ≥ 5%à H0 kann nicht abgelehnt werden. Grundaufgabe 8: Vergleich von zwei Wahrscheinlichkeiten (mit unabhängigen Stichproben) Es ist zu untersuchen, ob die Düngung (Mineral- bzw. Tresterkompostdüngung) einen Einfluss auf den Pilzbefall (Falscher Mehltau) von Weinstöcken (Vitis vinifera) hat oder nicht. Dazu werden 39 mineralgedüngte Weinstöcke beobachtet, und es wird dabei festgestelltet, dass in 6 Fällen ein starker Befall (Ausprägung 1) zu verzeichnen ist, in den restlichen 33 Fällen nur ein schwacher bzw. überhaupt keiner (Ausprägung 0). Parallel dazu werden 39 tresterkompostgedüngte Weinstöcke untersucht mit dem Ergebnis, dass in 23 Fällen ein starker Befall (Ausprägung 1) und in 16 Fällen ein schwacher bis nicht erkennbarer Befall (Ausprägung 0) vo rhanden war. (α = 5%) Datei: grund08.sav Lösung: Daten-Fenster: Zielvariable = pilz, Gruppierungsvariable = dueng, Hilfsvariable = freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 18 Hypothesen: H0: Befallrisiko ist unabhängig von der Düngung vs. H1: Befallrisiko ist abhängig von der Düngung. Chi-Quadrat-(Homogenitäts-)Test: AnalysierenDeskriptive Statistiken– Kreuztabellen ... Im Fenster „Kreuztabellen: Statistik“ „Chi-Quadrat“ aktivieren … Im Fenster „Kreuztabellen: Zellen“ folgende Einstellungen vornehmen … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 19 Pilzbefall * Düngung Kreuztabelle Ergebnisse (teilweise) im Viewer: Düngung Mineral Pilzbefall nein Anzahl ja Erwartete Anzahl % von Düngung Anzahl Erwartete Anzahl % von Düngung Gesamt 16 49 24,5 24,5 49,0 84,6% 41,0% 62,8% 6 23 29 14,5 14,5 29,0 15,4% 59,0% 37,2% 39 39 78 39,0 39,0 78,0 100,0% 100,0% 100,0% Erwartete Anzahl % von Düngung Anzahl Gesamt Trester 33 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Asymptotische Signifikanz (2seitig) df 15,863(b) 1 ,000 Kontinuitätskorrektur(a) 14,052 1 ,000 Likelihood-Quotient 16,656 1 ,000 Exakter Test nach Fisher Zusammenhang linearmit-linear Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig) ,000 15,660 1 ,000 ,000 Anzahl der gültigen Fälle 78 a Wird nur für eine 2x2-Tabelle berechnet b 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 14,50. Interpretation: P = 2-seitige Signifikanz = 0,000 (näherungsweise, Chi-Quadrat nach Pearson) < 0.05 à H0 ablehnen; Exakter Test (nach Fisher): P = 2-seitige exakte Signifikanz = 0.000 < 0.05 à H0 ablehnen. Grundaufgabe 9: McNemar-Test zum Vergleich von zwei Wahrscheinlichkeiten (mit abhängigen Stichproben) Bei einer Studie wurde u.a. das Ges.Eiweiß i.S. zu Beginn und am Ende bestimmt. Es ergab sich, dass bei 22 Probanden der Eiweißwert vor und nach Ende der Studie im Normbereich lag, bei 12 Probanden lag der Wert vorher im Normbereich und nachher außerhalb, bei 7 Probanden vorher außerhalb und nachher im Normbereich und bei 4 vorher und nachher außerhalb des Normbereichs. Hat sich während der Studie eine signifikante Änderung hinsichtlich des Normbereichs ergeben? (α = 5%) Datei: grund09.sav Lösung: Daten-Fenster: Zielvariablen = beginn, ende, Hilfsvariable = freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 20 Hypothesen: H0: p(im Normbereich/vorher à außerhalb/nachher) = p(außerhalb/vorher à im Normbereich/nachher) H1: p(im Normbereich/vorher à außerhalb/nachher) ≠ p(außerhalb/vorher à im Normbereich/nachher) McNemar-Test zur „Messung“ von Veränderungen: AnalysierenNichtparametrische Tests2 verbundene StichprobenMcNemar ... Ergebnisse im Viewer: Statistik für Test(b) Behandlungsbeginn & Behandlungsende Behandlungs beginn & Behandlungs ende Behandlungsende Behandlungsbeginn 1 2 1 2 22 12 7 4 N Exakte Signifikanz (2-seitig) 45 ,359(a) a Verwendetete Binomialverteilung. b McNemar-Test Interpretation: P = Exakte Signifikanz (2seitig) = 35,9% ≥ 5% à H0 kann nicht abgelehnt werden. Grundaufgabe 10: Prüfung auf Abhängigkeit (nominale Daten) Die Wirksamkeit einer Behandlung wurde einerseits durch den Probanden und andererseits durch den Prüfarzt beurteilt. Man beschreibe den Zusammenhang zwischen den Beurteilungen mit einem geeigneten Korrelationsmaß. Wie groß sind die bei einer angenommenen Unabhängigkeit zu erwartenden absoluten Häufigkeiten? Ist die Korrelation signifikant von Null verschieden? (α = 5%) Datei: grund10.sav Lösung: Daten-Fenster: Zielvariable: proband, arzt, Hilfsvariable freq (zur Gewichtung der Fälle mit den beobachteten Häufigkeiten) W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 21 Hypothesen: H0: die Variablen proband (Beurteilung durch Probanden) und arzt (Beurteilung durch den Prüfarzt) sind unabhängig H1: die Variablen proband und arzt sind abhängig. Abhängigkeitsprüfung mit dem Chi-Quadrat-Test: AnalysierenDeskriptive StatistikenKreuztabellen … Im Fenster „Kreuztabellen: Statistik“ „Chi-Quadrat“ und „Phi und Cramer-V“ aktivieren … Im Fenster „Kreuztabellen: Zellen“ die folgenden Einstellungen vornehmen … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 22 Ergebnisse (teilweise) im Viewer: Beurteilung d. Proband * Beurteilung d. Prüfarzt Kreuztabelle Beurteilung d. Prüfarzt Beurteilung d. Proband sehr gut 23 sehr gut Anzahl gut Erwartete Anzahl % von Beurteilung d. Prüfarzt Anzahl mäßig Erwartete Anzahl % von Beurteilung d. Prüfarzt Anzahl Erwartete Anzahl % von Beurteilung d. Prüfarzt Anzahl Gesamt Erwartete Anzahl % von Beurteilung d. Prüfarzt gut Gesamt mäßig 7 3 33 14,1 11,4 7,5 33,0 71,9% 26,9% 17,6% 44,0% 5 13 4 22 9,4 7,6 5,0 22,0 15,6% 50,0% 23,5% 29,3% 4 6 10 20 8,5 6,9 4,5 20,0 12,5% 23,1% 58,8% 26,7% 32 26 17 75 32,0 26,0 17,0 75,0 100,0% 100,0% 100,0% 100,0% Interpretation: (unter H0) erwartete Häufigkeiten: siehe Erwartete Anzahl. Chi-Quadrat-Tests Interpretation: P = asymptotische Signifikanz (2-seitig, Chi-Quadrat nach Pearson) = 0,000 < 0,05 à H1 Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linearmit-linear Anzahl der gültigen Fälle Asymptotische Signifikanz (2-seitig) df 25,215(a) 4 ,000 24,045 4 ,000 17,358 1 ,000 75 a 2 Zellen (22,2%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4,53. Symmetrische Maße Korrelationsmaß: Cramer-V = 0,41 (sign. ≠ 0) Näherungsweise Signifikanz Wert Nominal- bzgl. Nominalmaß Phi Cramer-V Anzahl der gültigen Fälle ,580 ,000 ,410 ,000 75 a Die Null-Hyphothese wird nicht angenommen. b Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 23 Grundaufgabe 11: Prüfung auf Abhängigkeit bei metrischen Variablen und lineare Regression In einer Stichprobe von 10 Frauen wurden der Blutdruck (mm Hg)und das Alter registriert (Daten siehe folgende Tabelle). Kann man vom Alter im Rahmen eines linearen Regressionsmodells auf den Blutdruck schließen? (α = 5%) Datei: grund11.sav Lösung: Daten-Fenster: Abhängige Variable blut, unabhängige Variable alt Darstellung der Abhängigkeit im Streudiagramm mit Hilfe von GrafikenStreudiagramm … Streudiagramm-Einfach-Definieren … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 24 Ergebnis im Viewer … 150 140 130 Blutdruck (mm Hg) Interpretation: Lineares Modell (Gerade) zur Beschreibung der Abhängigkeit Ist passsend; Anstieg der Geraden ≠ 0, Frage: Ist der Anstieg „signifikant“ von null verschieden? (Nur dann hängt der Blutdruck vom Alter ab.) 120 110 R-Qu. = 0.8689 20 30 40 50 60 70 Alter/Jahre Hinweis: Bearbeitung der Grafik durch Doppelklicken auf die Grafik à Chart-Fenster z.B. Einzeichnen der Regressionsgeraden: Diagramme-Optionen … … Optionen für Streudigramme: AnpassungslinieGesamtAnpassungsoptionen … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 25 Abhängigkeitsprüfung - Variante 1: Test auf Abweichung von der Nullkorrelation mit H0: (Pearson-)Korrelation ρ = 0 vs. H1: ρ ≠ 0 AnalysierenKorrelationBivariat … … Ergebnis im Viewer: Korrelationen Alter/Jahre Alter/Jahre Interpretation: P = Signifikanz (2-seitig) = 0,000 < 0.05 à H1 (Abhängigkeit) Korrelation nach Pearson Signifikanz (2-seitig) N Blutdruck (mm Hg) Korrelation nach Pearson Signifikanz (2-seitig) N Blutdruck (mm Hg) 1 ,932(**) . ,000 10 10 ,932(**) 1 ,000 10 ** Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant. . 10 Abhängigkeitsprüfung - Variante 2: Test im Rahmen des einfachen linearen Regressionsmodells mit H0: Geradenanstieg β1 = 0 (Modell: Blitdruck = β1 * Alter + β0 + Fehler) AnalysierenRegressionLinear … W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 26 … Lineare RegressionStatistiken … Deskriptive Statistiken … Ergebnisse (teilweise) im Viewer … Mittelwert Blutdruck (mm Hg) Standardabw eichung N 127,90 7,909 10 44,20 11,970 10 Alter/Jahre Modellzusammenfassung Interpretation: R-Quadrat = 86,9% = durch Alter erklärter Anteil der Variation der Blutgruppe Modell 1 R R-Quadrat Korrigiertes RQuadrat ,932(a) ,869 a Einflußvariablen : (Konstante), Alter/Jahre Standardfehler des Schätzers ,853 3,037 Koeffizienten(a) Nicht standardisierte Koeffizienten Modell 1 (Konstante) Alter/Jahre B 100,679 Standardfe hler 3,860 ,616 ,085 Standardisiert e Koeffizienten T Signifikanz Beta ,932 26,086 ,000 7,282 ,000 a Abhängige Variable: Blutdruck (mm Hg) Interpretation: Geradenanstieg b1 = 0,616 signifikant ungleich null (P = Signifikanz = 0,000 < 0,05) à Regressionsgleichung: Blutdurck = 100,679 + 0,616*Alter W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 27 Grundaufgabe 12: 1-faktorielle Varianzanalyse (Globaltest, Varianzhomogenität, multiple Mittelwertvergleiche) Man vergleiche an Hand der Beobachtungsreihen in der folgenden Tabelle die Mg-Konzentration zwischen den Lösungen 1, 2 und 3. Bestehen zwischen den Lösungen signifikante Mittelwertunterschiede? Man führe die Aufgabe auch mit den K- und Ca-Konzentrationen durch. (α = 5%) Datei: grund12.sav Lösung: Daten-Fenster: Zielvariable: mg (bzw. k, ca), Gliederungsmerkmal (Faktor) loesung Abhängigkeitsprüfung im Rahmen der 1-faktoriellen ANOVA: (abhängige Variable mg, unabhängige Variable loesung; deskriptive Statistiken, Globaltest, Prüfung der Varianzhomogenität, multiple Mittelwertvergleiche) AnalysierenMittelwerte vergleichenEinfaktorielle ANOVA ... W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04 28 … Einfaktorielle ANOVAOptionen … … EInfaktorielle ANOVAPost Hoc … … Ergebnisse im Viewer … ONEWAY deskriptive Statistiken Magnesium N Mittelwert STD SEM 95%-Konfidenzintervall für den Mittelwert Untergrenze Minimum Maximum Obergrenze 1.5K, 0.75Ca 6 232,83 26,888 10,977 204,62 261,05 185 256 1.5K, 3.75Ca 6 175,67 18,107 7,392 156,66 194,67 155 203 6 162,50 38,025 15,524 122,60 202,40 121 216 18 190,33 41,487 9,779 169,70 210,96 121 256 7.5K, 0.75Ca Gesamt Test der Homogenität der Varianzen Interpretation: H0: Varianzen der Zielvariablen mg stimmen für die drei Lösungen überein; P= Sign. =0,082 à kein Grund für Ablehnung von H0 W. Timischl, LV-Nr. 859 903, grund_spss11neu Magnesium LeveneStatistik 2,968 df1 df2 2 Signifikanz 15 ,082 08.03.04 29 ONEWAY ANOVA Magnesium Quadratsu mme Mittel der Quadrate df F Zwischen den Gruppen 16776,333 2 8388,167 Innerhalb der Gruppen 12483,667 15 832,244 Gesamt 29260,000 17 Signifikanz 10,079 ,002 Interpretation (Globaltest): H0: Zielvariable mg im Mittel vom Faktor (loesung) unabhängig; P = Sign. (Zwischen den Gruppen)= 0,002 à Faktorwirkung ist signifikant Mehrfachvergleiche Abhängige Variable: Magnesium Scheffé-Prozedur 95%-Konfidenzintervall Mittlere Differenz (I-J) 57,17(*) 70,33(*) Standardfe hler 16,656 16,656 Signifikanz ,013 ,003 Untergrenze 11,97 25,13 Obergrenze 102,37 115,53 -57,17(*) 16,656 ,013 -102,37 -11,97 13,17 7.5K, 0.75Ca 1.5K, 0.75Ca -70,33(*) 1.5K, 3.75Ca -13,17 * Die mittlere Differenz ist auf der Stufe .05 signifikant. 16,656 16,656 16,656 ,736 ,003 ,736 -32,03 -115,53 -58,37 58,37 -25,13 32,03 (I) Nährlösung 1.5K, 0.75Ca (J) Nährlösung 1.5K, 3.75Ca 7.5K, 0.75Ca 1.5K, 3.75Ca 1.5K, 0.75Ca 7.5K, 0.75Ca Magnesium Scheffé-Prozedur Interpretation: Der Mittelwert auf der Faktorstufe "1.5K, 0.75Ca" weicht auf dem Testniveau 5% signifikant von den anderen Faktorstufenmittelwerten ab Untergruppe für Alpha = .05. Nährlösung 7.5K, 0.75Ca 240 N 6 1 162,50 1.5K, 3.75Ca 6 175,67 1.5K, 0.75Ca 6 2 232,83 Signifikanz ,736 1,000 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a Verwendet ein harmonisches Mittel für Stichprobengröße = 6,000. 220 Mittelwert von Magnesium 200 180 160 Diagramm der Mittelwerte 140 1.5K, 0.75Ca 1.5K, 3.75Ca 7.5K, 0.75Ca Nährlösung W. Timischl, LV-Nr. 859 903, grund_spss11neu 08.03.04