Einführung in die Statistik – Übungsblatt 14 Tutorium Magdalena Fischer: Mo 8:30 – 10:00, D431 Aufgabe 1 Folgende Datenpaare geben die Nebenverdienste von Studenten verschiedener Semesterzahl an: Semesterzahl: x Verdienst in €: y 2 220 3 220 5 300 6 450 11 600 Es soll eine lineare Prädiktionsregel für den Verdienst berechnet werden (Welches Skalenniveau ist dafür notwendig?): a) Gib die Regel(ohne x) und die Regel(mit x) an. b) Berechne die prädizierten Werte für die fünf Studenten. c) Berechne den Fehler(ohne) und den Fehler(mit). d) Berechne das PRE-Maß und den adjustierten Determinationskoeffizienten 2. Art. e) -Konfidenzintervall an. f) Welche Voraussetzungen sind notwendig, um aus der Regressionsgeraden aus der Stichprobe auf die Regressionsgerade der Population zu schließen? g) Wie groß ist die (Produktmoment-)Korrelation zwischen dem x- und dem y-Merkmal? Was sagt diese Korrelation aus? Aufgabe 2 Der Computerausdruck einer Regressionsanalyse weist folgende Werte aus: Cov(X,Y) = 6, (Var(X)) = 2, (Var(Y)) = 10. Ferner ist bekannt, dass beim t-Test für die Regressionskoeffizienten jeweils 198 Freiheitsgrade festgestellt werden können. a) Wie groß ist n ? b) Berechne die Korrelation. Aufgabe 3 Man will herausfinden, ob zwischen dem Merkmal x und dem Merkmal y ein linearer Zusammenhang besteht. Beide Merkmale seien intervallskaliert. Eine Stichprobe von 100 Messpaaren ergibt: x = 1,2 a) b) c) d) e) y=9 sx=0,3 sy = 1 sxy = 0,1 Bestimme die Gleichung der Regressionsgeraden und den Determinationskoeffizienten 2. Art Nach welchem Prinzip wird die Regressionsgerade bestimmt? Bestimme den Fehler(mit) und den Fehler(ohne). Teste die Alternativhypothese β ≠ 0 auf Signifikanzniveau 5%. Berechne Fischers Z. Aufgabe 4 Bei fünf Personen wird untersucht, wie viele Zigaretten sie am Tag rauchen und wie viel Stunden Sport sie in der Woche treiben. Die Ergebnisse: Person 1 2 3 4 5 Zigaretten 0 0 5 10 40 Sport 0 1 1 4 0 a) Erstelle die Regressionsgerade y = a + b*x für den Zusammenhang zwischen Zigarettenkonsum und Sport, berechne auch den Determinationskoeffizienten 2. Art. b) Sind die Regressionskoeffizienten a und b signifikant ? c) Erstelle 95 %-Konfidenzintervalle für a und b. d) Berechne den Pearson-Korrelationskoeffizienten, sowie Fischers Z. Aufgabe 5 Man will herausfinden, ob zwischen dem nominalen Merkmal x und dem intervallskalierten Merkmal y ein Zusammenhang besteht. Eine Stichprobe von 100 Messpaaren ergibt folgendes: x n y sn-1 1 2 3 20 50 30 1 1,1 3 0,1 0,1 0,4 a) b) c) Bestimme Fehler(ohne) und Fehler(mit). Bestimme das PRE-Maß. Wird H0 abgelehnt? Lösungen: Aufgabe 1 a) Regel(ohne): yDach=358, Regel(mit): yDach = a+b*x, a und b müssen folgendermaßen berechnet werden: Xquer= 5,4; yquer=358; Var(x)=12,3; Cov(x,y)=558,5 Damit ist b=Cov(x,y)/Var(x)=45,407 und a = yquer-b*xquer=112,805 b) 203,618; 249,024; 339,837; 385,244; 612,276 c) F(ohne)=ssq(total)=108480; F(mit)=7039,87952 d) PRE=r^2=0,935; Adj. Det.koeff. =0,913 e) KI=23,445 bis 67,369 f) Homoskedastizität, Für jedes x sind die y normalverteilt g) r = 0,967 bedeutet: starker, positiver linearer Zusammenhang Aufgabe 2 a) n = 200 b) r=0,3 Aufgabe 3 a) b=0,1/0,3²=1,11; a=9-1,11*1,2=7,667; r² = 0,11 b) Nach der Kleinste Quadrate-Methode c) F (Ohne) = 99; F (Mit) = 88 d) TW t (98) = 3,4965, KB ab 1,98; also ist β ≠ 0 e) z (r) = 0,34657 Aufgabe 4 a) a = 1,40625; b = -,01875; r² = 0,03646 b) Test ob a, bzw. b ≠ 0: TW bei a: t (3) = 1,360 und bei b: t (3) = - 0,337 je mit se² = 3,46875 berechnet. Beide TW liegen nicht im KB, da KB ab +/- 3,18; die Regressionskoeffizienten sind also nicht signifikant. c) KB für a: u = - 1,8809; o = 4,6934; für b: u = -0,1957; o = 0,1582 d) r = - 0.19094; z (r) = -0.19331 Aufgabe 5 a) F (Ohne) = 83,57; F (Mit) = 5,32; b) Eta² = 0,9363 c) Ja, der TW 713,37 liegt im KB; KB ab 3,09