Einführung in die Statistik – Übungsblatt 14

Werbung
Einführung in die Statistik – Übungsblatt 14
Tutorium Magdalena Fischer: Mo 8:30 – 10:00, D431
Aufgabe 1
Folgende Datenpaare geben die Nebenverdienste von Studenten verschiedener Semesterzahl an:
Semesterzahl: x
Verdienst in €: y
2
220
3
220
5
300
6
450
11
600
Es soll eine lineare Prädiktionsregel für den Verdienst berechnet werden (Welches Skalenniveau ist
dafür notwendig?):
a) Gib die Regel(ohne x) und die Regel(mit x) an.
b) Berechne die prädizierten Werte für die fünf Studenten.
c) Berechne den Fehler(ohne) und den Fehler(mit).
d) Berechne das PRE-Maß und den adjustierten Determinationskoeffizienten 2. Art.
e)
-Konfidenzintervall an.
f) Welche Voraussetzungen sind notwendig, um aus der Regressionsgeraden aus der Stichprobe auf
die Regressionsgerade der Population zu schließen?
g) Wie groß ist die (Produktmoment-)Korrelation zwischen dem x- und dem y-Merkmal? Was sagt
diese Korrelation aus?
Aufgabe 2
Der Computerausdruck einer Regressionsanalyse weist folgende Werte aus: Cov(X,Y) = 6, (Var(X))
= 2, (Var(Y)) = 10. Ferner ist bekannt, dass beim t-Test für die Regressionskoeffizienten jeweils 198
Freiheitsgrade festgestellt werden können.
a) Wie groß ist n ?
b) Berechne die Korrelation.
Aufgabe 3
Man will herausfinden, ob zwischen dem Merkmal x und dem Merkmal y ein linearer Zusammenhang
besteht. Beide Merkmale seien intervallskaliert. Eine Stichprobe von 100 Messpaaren ergibt:
x = 1,2
a)
b)
c)
d)
e)
y=9
sx=0,3
sy = 1
sxy = 0,1
Bestimme die Gleichung der Regressionsgeraden und den Determinationskoeffizienten 2. Art
Nach welchem Prinzip wird die Regressionsgerade bestimmt?
Bestimme den Fehler(mit) und den Fehler(ohne).
Teste die Alternativhypothese β ≠ 0 auf Signifikanzniveau 5%.
Berechne Fischers Z.
Aufgabe 4
Bei fünf Personen wird untersucht, wie viele Zigaretten sie am Tag rauchen und wie viel Stunden
Sport sie in der Woche treiben. Die Ergebnisse:
Person
1
2
3
4
5
Zigaretten
0
0
5
10
40
Sport
0
1
1
4
0
a) Erstelle die Regressionsgerade y = a + b*x für den Zusammenhang zwischen Zigarettenkonsum
und Sport, berechne auch den Determinationskoeffizienten 2. Art.
b) Sind die Regressionskoeffizienten a und b signifikant ?
c) Erstelle 95 %-Konfidenzintervalle für a und b.
d) Berechne den Pearson-Korrelationskoeffizienten, sowie Fischers Z.
Aufgabe 5
Man will herausfinden, ob zwischen dem nominalen Merkmal x und dem intervallskalierten Merkmal y
ein Zusammenhang besteht. Eine Stichprobe von 100 Messpaaren ergibt folgendes:
x
n
y
sn-1
1
2
3
20
50
30
1
1,1
3
0,1
0,1
0,4
a)
b)
c)
Bestimme Fehler(ohne) und Fehler(mit).
Bestimme das PRE-Maß.
Wird H0 abgelehnt?
Lösungen:
Aufgabe 1
a) Regel(ohne): yDach=358,
Regel(mit): yDach = a+b*x, a und b müssen folgendermaßen berechnet werden:
Xquer= 5,4; yquer=358; Var(x)=12,3; Cov(x,y)=558,5
Damit ist b=Cov(x,y)/Var(x)=45,407 und a = yquer-b*xquer=112,805
b) 203,618; 249,024; 339,837; 385,244; 612,276
c) F(ohne)=ssq(total)=108480; F(mit)=7039,87952
d) PRE=r^2=0,935; Adj. Det.koeff. =0,913
e) KI=23,445 bis 67,369
f) Homoskedastizität, Für jedes x sind die y normalverteilt
g) r = 0,967 bedeutet: starker, positiver linearer Zusammenhang
Aufgabe 2
a)
n = 200
b)
r=0,3
Aufgabe 3
a) b=0,1/0,3²=1,11; a=9-1,11*1,2=7,667; r² = 0,11
b) Nach der Kleinste Quadrate-Methode
c) F (Ohne) = 99; F (Mit) = 88
d) TW t (98) = 3,4965, KB ab 1,98; also ist β ≠ 0
e) z (r) = 0,34657
Aufgabe 4
a) a = 1,40625; b = -,01875; r² = 0,03646
b) Test ob a, bzw. b ≠ 0: TW bei a: t (3) = 1,360 und bei b: t (3) = - 0,337 je mit se² = 3,46875
berechnet. Beide TW liegen nicht im KB, da KB ab +/- 3,18; die Regressionskoeffizienten sind also
nicht signifikant.
c) KB für a: u = - 1,8809; o = 4,6934; für b: u = -0,1957; o = 0,1582
d) r = - 0.19094; z (r) = -0.19331
Aufgabe 5
a)
F (Ohne) = 83,57; F (Mit) = 5,32;
b)
Eta² = 0,9363
c)
Ja, der TW 713,37 liegt im KB; KB ab 3,09
Herunterladen