Übungsblatt 13 Wie schon im Tutorium erwähnt sind ein paar Aufgabenteile am Dienstag noch nicht besprochen worden. Da es sich aber fast nur um Formeleinsetzarbeit handelt, könnt ihr euch ja schon mal daran versuchen. Zu Aufgabe 1b) vom letzten Übungsblatt: Fehler im TW, der korrekte wäre t (48) = 2,87. Sorry! Zu Aufgabe 4 vom letzten Übungsblatt: Die ssq(between) = 3949905 ist korrekt berechnet. Abweichende Werte ergeben sich durch die Rundung des Mittelwertes von y auf eine Nachkommastelle. Aufgabe 1 Bei acht Personen mit Schlafstörungen soll mittels einer Therapie die Schlafdauer verlängert werden. Die Patienten werden drei verschiedenen Therapeuten zugeteilt. Folgende Statistik wird erhoben: Therapeut A Schlaufdauer 2 2 in h vorher Schlafdauer 4 4 in h nachher 5 Therapeut B 2 4 6 Therapeut C 4 7 6 4 6 6 6 6 Zu überprüfen sind die folgenden Hypothesentests: (Beachte, dass für keinen der Tests alle in der Tabelle enthaltenen Informationen verwendet werden müssen. Stelle fest, um welchen Test es sich jeweils handelt!) a) H0: Die Therapiegruppen der Therapeuten A, B und C unterscheiden sich im Durchschnitt nicht hinsichtlich der Schlafdauer, die die jeweiligen Patienten vor Beginn der Therapie angaben. H A: H0 ist falsch. b) H0: Die einzelnen Patienten schlafen nach der Therapie im Durchschnitt zwei Stunden länger. (So wird es von den Therapeuten angepriesen). HA: Die durchschnittliche Verbesserung des Schlafes beträgt weniger als zwei Stunden. c) H0: Der Anteil derjenigen Patienten, bei denen sich eine längere Schlafdauer einstellt, ist 0.5 (d.h. eine Schlafverbesserung ist rein zufällig). HA: Der Anteil derjenigen Patienten, bei denen sich eine längere Schlafdauer einstellt, ist größer als 0.5 (d.h. eine Schlafverbesserung ist nicht zufällig). d) H0: Die durchschnittliche Schlafdauer nach Ende der Therapie ist 6 Stunden. HA: Die durchschnittliche Schlafdauer nach Ende der Therapie beträgt weniger als 6 Stunden. Aufgabe 2 Eine Arbeitszeituntersuchung für Beschäftigte des öffentlichen Dienstes ergibt folgende jährliche Arbeitszeit in Stunden: Art der Beschäftigung Größe der Stichprobe Finanzbeamte 100 Amtsärzte 120 Wiss. Angestellte 120 Lehrer 80 a) b) c) d) e) mittlere Arbeitszeit 1750 2010 1880 1950 sn21 90000 40000 55000 64000 Gib die Regel(mit), die Regel(ohne), den Fehler(mit) und den Fehler(ohne) an. Berechne das PRE-Maß. Teste die universelle Nullhypothese. Gib den adjustierten Determinationskoeffizienten 1. Art an. Welche Voraussetzungen müssen erfüllt sein, damit man eine Varianzanalyse durchführen kann? Aufgabe 3 Züchtern ist es gelungen, gezielt dumme, mittelgescheite und blitzgescheite Ratten zu Züchten. Es soll untersucht werden, ob die Klugheit der Ratten einen Einfluss auf die Durchsetzungsfähigkeit hat. Als Maß für die Durchsetzungsfähigkeit dient die Gewichtszu- bzw. Abnahme bei einem gemeinsamen Aufenthalt in einem Käfig mit begrenzten Futterresourcen : Rattenart dumm mittel blitzgescheit Gewichtsveränderungen -4; -6; +1; -2 -3; +5; +7; +4; +2; +7; +8; +5 Führe eine (einfaktorielle) Varianzanalyse durch. Stelle das Ergebnis als ANOVA-Tabelle dar. Aufgabe 4 Folgende Datenpaare geben die Nebenverdienste von Studenten verschiedener Semesterzahl an: Semesterzahl: x Verdienst in €: y 2 220 3 220 5 300 6 450 11 600 Es soll eine lineare Prädiktionsregel für den Verdienst berechnet werden (Welches Skalenniveau ist dafür notwendig?): a) Gib die Regel(ohne x) und die Regel(mit x) an. b) Berechne die prädizierten Werte für die fünf Studenten. c) Berechne den Fehler(ohne) und den Fehler(mit). d) Berechne das PRE-Maß und den adjustierten Determinationskoeffizienten 2. Art. e) Gib für b -Konfidenzintervall an. f) Welche Voraussetzungen sind notwendig, um aus der Regressionsgeraden aus der Stichprobe auf die Regressionsgerade der Population zu schließen? g) Wie groß ist die (Produktmoment-)Korrelation zwischen dem x- und dem y-Merkmal? Was sagt diese Korrelation aus? Aufgabe 5 Der Computerausdruck einer Regressionsanalyse weist folgende Werte aus: Cov(X,Y) = 6, (Var(X)) = 2, (Var(Y)) = 10. Ferner ist bekannt, dass beim t-Test für die Regressionskoeffizienten jeweils 198 Freiheitsgrade festgestellt werden können. a) Wie groß ist n ? b) Berechne die Korrelation. LÖSUNGEN Aufgabe 1 a) Varianzanalyse: TW F ( 2,5) = 1,014 KB ab 5,79 TW nicht im KB, Ho beibehalten b) Mittelwerttest bei verbundenen SP: TW: d quer = 1,25 linksseitiger Test KB kleiner 1,217 TW nicht im KB, Ho beibehalten. c) Binomialtest: TW: p = 0,75, bzw. Anzahl = 6 rechtsseitiger Test KB größer als 7 TW nicht im KB, Ho beibehalten d) Mittelwerttest: TW: x quer = 5,25 linksseitiger Test KB kleiner 5,30 TW im KB, Ho verworfen Aufgabe 2 a) Regel(mit): y1Dach=1750, y2Dach=2010; y3Dach=1880; y4Dach=1950 Regel(ohne): yDach=1899,524 Fehler(mit)= ssq(within)=25271000 Fehler(ohne)=ssq(within)+ssq(between)=25271000+3949601=29220601 b) Eta^2=0,135 c) H0: alle Mittelwerte gleich HA: mindestens zwei verschieden voneinander TS: F-ratio ist F-verteilt mit df1=3 und df2=416 TW=21,67 kB ab 2,65, also ho verworfen d) 0,1289 e) Intervallskaliertes y, y in jeder Gruppe normalverteilt, in allen Gruppen gleiche Populationsvarianz Aufgabe 3 Variationsquelle Gescheitheit Fehler Total ssq 144,45 105,55 250 df 2 9 11 msq 72,225 11,728 22,727 F-Ratio 6,16 kB ab 4,26, also H0 abgelehnt: Die Klugheit hat Einfluss auf die Gewichtszu- bzw. abnahme Aufgabe 4 a) Regel(ohne): yDach=358, Regel(mit): yDach = a+b*x, a und b müssen folgendermaßen berechnet werden: b) c) d) e) f) g) Xquer= 5,4; yquer=358; Var(x)=12,3; Cov(x,y)=558,5 Damit ist b=Cov(x,y)/Var(x)=45,407 und a = yquer-b*xquer=112,805 203,618; 249,024; 339,837; 385,244; 612,276 F(ohne)=ssq(total)=108480; F(mit)=7039,87952 PRE=r^2=0,935; Adj. Det.koeff. =0,913 KI=23,445 bis 67,369 Homoskedastizität, Für jedes x sind die y normalverteilt r = 0,967 bedeutet: starker, positiver linearer Zusammenhang Aufgabe 5 a) n = 200 b) r=0,3