Einführung in Quantitative Methoden

Werbung
Einfache Regressionsanalyse
Einführung in Quantitative Methoden
Mag. Dipl.Ing. Dr. Pantelis Christodoulides
&
Mag. Dr. Karin Waldherr
SS 2011
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
1/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Historisches
I
Regression geht auf Galton (1889) und seine Studien zur
Vererbung zurück; Galton formulierte das Gesetz der
universalen Regression
I
Jede vom ’normalen’ abweichende Eigenschaft eines Menschen
wird in der nachfolgenden Generation zwar übernommen, aber
im Durchschnitt in einem geringeren Ausmaß. Es tritt also
bzgl. dieser Eigenschaft ein Rücktritt (Regression) ein
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
2/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Historisches
I
Karl Pearson hat bei 1078 Familien die Größe von Vater und
Sohn untersucht
I
Obwohl große Väter dazu neigen große Söhne zu haben, sind
die Söhne von großen Vätern im Durchschnitt kleiner als ihre
Väter
I
Ebenso wird die Besonderheit der Kleinheit von Vätern nicht
in vollem Maße an die Söhne vererbt, denn diese sind
durchschnittlich größer als ihre Väter
I
Es ist eine Regression oder ein Rücktritt in Bezug auf die
Größe bei Söhnen sichtbar
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
3/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Ziele
I
Empirische Repräsentation großer Datenmengen
I
Erkennen eines funktionalen Zusammenhanges
I
Nachweis einer bereits bekannten Beziehung zwischen den
Variablen
I
Spezifizierung eines funktionalen Zusammenhanges zwischen
zwei Variablen
I
Schätzen der Parameter einer funktionalen Beziehung
I
Interpolation fehlender bzw. Prognose zukünftiger Werte
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
4/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Ausgangslage
I
Zusammenhang zwischen 2 metrischen Variablen X und Y
mit Ausprägungen xi und yi
I
Spezifizierung einer funktionalen Beziehung Y = f (X ): Y
wird mithilfe von X und f geschätzt
I
Stichprobe mit n Objektpaaren - (x1 , y1 ) · · · (xn , yn )
I
Objektpaare (x1 , y1 ) · · · (xn , yn ) darstellbar als Punkte in
kartesischem Koordinatensystem mit Koordinaten (xi , yi ) =
Streudiagramm
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
5/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Ausgangslage
I
Y ist der Regressand (abhängige Variable); X ist der
Regressor (unabhängige Variable); Regression von Y auf X
I
Annahmen - die abhängige Variable ist mit Zufallsfehlern
überlagert; die unabhängige Variable gilt als fehlerfrei
I
Einfache Regression weil ein Regressor, im Vergleich zu
multipler Regression mit mehr als einem Regressor
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
6/47
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfache Regressionsanalyse
Funktion f (X )
I
Linear: Y = a + bX , a und b reelle Zahlen, höchster
Polynomgrad ist 1
I
Quadratisch: Y = c + wX + dX 2 , c, w , und d reelle Zahlen,
höchster Polynomgrad ist 2
I
Exponentiell: Y = q e gX , q und g reelle Zahlen
I
Logarithmisch: Y = h ln
zusätzlich positiv
Christodoulides / Waldherr
X
p
, h und p reelle Zahlen, p
Einführung in Quantitative Methoden- 2.VO
7/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel 1: Lineare Funktion f (X )
I
Treibstoffverbrauch (Y ) und Leistungsabgabe eines Motors
(X ) bei konstanter Drehzahl: Y ≈ 0.854 + 0.302X
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
8/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel 2: Quadratische Funktion f (X )
I
Körnerertrag (Y ) und Düngung (X ):
Y ≈ 5.78 + 2.29X − 0.09X 2
I
Bis zu einer bestimmten Düngungsgrenze steigt der
Körnerertrag an, um wieder abzufallen
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
9/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel 3: Logarithmische Funktion f (X )
I
Weber-Fechner’sches Gesetz: Bei einem linearen Anstieg der
Reizstärke (X ), wächst die Empfindung im Sinnesorgan (Y )
logarithmisch an
I
b = Schwellenreiz
I
X
Y = c ln
b
c = Konstante abhängig von der Reizart
Weber-Fechner’sches Gesetz allgemein bekannt durch die
Dezibel-Skala, die das logarithmische Verhältnis zwischen Reiz
und Lärmempfindung überträgt
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
10/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel 3: Logarithmische Funktion f (X )
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
11/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
I
Vermutet wird ein zumindest näherungsweise linearer
Zusammenhang zwischen zwei Variablen Y und X
I
Die Variable Y soll näherungsweise durch eine lineare
Funktion von X beschrieben werden
I
Y ≈ Ŷ = bX + a
mit
a, b
reelle Zahlen
I
a (Schnitt mit Y -Achse) und b (Anstieg) sind unbekannt
I
a und b so wählen, dass Zusammenhang (Streudiagramm)
zwischen Y und X ’am besten’ beschrieben wird
I
Die Methode der kleinsten Quadrate ermittelt beste
Schätzungen â und b̂ für a und b
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
12/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Kleinste Quadrate Schätzung (KQS)
I
Residuum ei = yi − ŷi ; n Residuen (Abweichungen von der
Regressionsgerade in Richtung abhängiger Variable)
I
Zentrale Idee bei KQS ist, a und b derart zu wählen, dass die
Summe der quadrierten Differenzen (Quadratsumme aller
Residuen) minimal wird
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
13/47
Einfache Regressionsanalyse
Christodoulides / Waldherr
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einführung in Quantitative Methoden- 2.VO
14/47
Einfache Regressionsanalyse
Christodoulides / Waldherr
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einführung in Quantitative Methoden- 2.VO
15/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Kleinste Quadrate Schätzung (KQS)
I
Bestimme a und b derart, dass die Quadratsumme aller
Residuen minimal wird, d.h.
S2 =
n
X
i=1
(yi − ŷi )2 =
n
X
(yi − a − bxi )2 → Min
i=1
I
Partielles Differenzieren von S 2 nach den Unbekannten a und
b und anschließendes Nullsetzen der Ableitungen liefert
cXY
b̂ = 2 , â = ȳ − b̂x̄
sX
I
b̂ = Verhältnis zwischen Kovarianz und Varianz des Regressors
â ist abhängig von den Mittelwerten, x̄, ȳ , und b̂
I
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
16/47
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfache Regressionsanalyse
Beispiel
I
Bei einer Stichprobe von n = 40 Personen wurden
Körpergröße (X ) und Gewicht (Y ) gemessen
40
X
xi = 6814,
i=1
40
X
yi = 2722,
40
X
xi2 = 1163780,
sX2 = 77.31
i=1
40
X
i=1
i=1
yi2
= 190422,
sY2
= 133.07,
40
X
xi yi = 466599
i=1
I
cXY =
40
1 X
1
6814 2722
(
xi yi − 40x̄ ȳ ) = (466599 − 40
)
39
39
40
40
i=1
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
17/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
cXY = 74.52, sX2 = 77.31
⇒
b̂ =
cXY
= 0.9639
sX2
â = ȳ − b̂x̄ = 68.05 − 0.9639 · 170.35 = −96.15
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
18/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
19/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
I
Produktmomentkorrelation rXY steht im engen
Zusammenhang zum Schätzer b̂
I
Es gilt
rXY =
I
cXY
,
sX sY
b̂ =
cXY
cXY sY
rXY sY
=
=
sX sX
sY sX sX
sX
Aus der Korrelation kann der Steigungsparameter geschätzt
werden und umgekehrt
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
20/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
I
Maß für Güte der Anpassung einer Regression ist das
Bestimmtheitsmaß B
I
B misst das Verhältnis der Varianz der geschätzten Werte ŷi
zur Varianz der beobachteten Werte yi
I
B misst den Anteil der Varianz der abhängigen Variable Y ,
der durch die unabhängige Variable X (bzw. die Regression)
erklärt werden kann
I
Achtung ’verursacht’ nur bei Kausalität
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
21/47
Einfache Regressionsanalyse
B=
sŶ2
sY2
mit
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
0≤B≤1
I
Je näher die Punkte zur Regressionsgerade liegen, desto
größer ist B
I
Liegen alle Punkte auf der Regressionsgerade, dann ist B = 1
und Y wird durch die Regression völlig erklärt
I
Das Bestimmtheitsmaß ist gleich dem Quadrat der Korrelation
I
Es gilt also B = r 2
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
22/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
B und Streudiagramm
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
23/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
Gewicht und Körpergröße
b̂ = 0.9639;
√
77.31
r = 0.9639 √
= 0.735
133.07
I
B = r 2 = 0.7352 = 0.54
I
54% der Varianz vom Gewicht wird durch die lineare
Regression mit Körpergröße erklärt
I
deswegen Korrelation von ’mittelmäßiger Höhe’
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
24/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Regression von X auf Y
I
Vertauschen von abhängiger und unabhängiger Variable;
Vertauschen des Koordinatensystems X -Y
I
X approximativ als lineare Funktion von Y darstellen
X ≈ b 0 Y + a0
I
Wie ändern sich unsere Parameter? Vertauschen von X undY
in den Formeln, d.h.
cXY
b̂ 0 = 2
â0 = x̄ − b̂ 0 ȳ
sY
I
2 Regressionsgeraden, je nach Fragestellung; beide gehen
durch den Schwerpunkt des Punktschwarms (x̄, ȳ )
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
25/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Regression von X auf Y bzw. Y auf X
I
Verschiedenheit beider Regressionsgeraden hat ihre Ursache in
der Annahme, dass die unabhängige Variable als fehlerfrei
angesehen wird, während die abhängige Variable durch einen
Zufallsfehler überlagert wird
I
Darstellung beider Geraden im X -Y Koordinatensystem
Y = b̂X + â
X = b̂ 0 Y + â0 ⇒ Y =
Christodoulides / Waldherr
(1)
1
b̂ 0
X−
â0
b̂ 0
(2)
Einführung in Quantitative Methoden- 2.VO
26/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
Y = 0.624X + 35.13 (1) X = 0.789Y + 27.01
1
27.01
Y =
X−
⇒ Y = 1.27X − 34.23 (2)
0.789
0.789
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
27/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Bemerkungen
I
Korrelation und Bestimmtheitsmaß ändern sich nicht, da sie
symmetrisch bzgl. X und Y sind
I
Vorzeichen der Steigungsparameter bleibt auch unverändert
I
Steigungsparameter ändert sich um die jeweilige Varianz des
Regressors X bzw.Y
I
Regressionsgeraden fallen zusammen bei perfektem linearen
Zusammenhang zwischen X und Y , d.h. bei rXY = ±1
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
28/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
I
Prognose von Y ⇒ Y als abhängige Variable; für gegebenes x
in die Modellgleichung ŷ = b̂x + â einsetzen und ŷ ausrechnen
I
Prognose von X ⇒ X als abhängige Variable; für gegebenes y
in die Modellgleichung x̂ = b̂ 0 y + â0 einsetzen und x̂
ausrechnen
I
Die zu prognostizierende Variable ist die im jeweiligen Modell
abhängige Variable
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
29/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
Prognose von y bei x = 125 ⇒ ŷ = (0.624)(125) + 35.13,
d.h. ŷ = 113.13
I
Prognose von x bei y = 125 ⇒ x̂ = (0.789)(125) + 27.01,
d.h. x̂ = 125.635
I
Überprüfung der Güte der Prognose mithilfe der Abweichung
des beobachteten Wertes yi vom geschätzten yˆi (bzw. analog
für X )
I
Betragsmäßig ’kleine’ Abweichungen sprechen für eine ’gute
Prognose’
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
30/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Allgemeine Richtlinien
I
Grafische Überprüfung der Daten und der Regressionsgerade
im Streudiagramm; Daten sollten annähernd auf einen
linearen Zusammenhang hinweisen
I
Größe und Struktur der Residuen: Betragsmäßig kleine
Residuen, die in einem Streudiagramm mit den geschätzten
Werten ŷi keine erkennbare Struktur zeigen, weisen auf ein
gutes Modell hin
I
Hohes Bestimmtheitsmaß: Dieses Kriterium sollte im
Zusammenhang mit einer Residualanalyse und grafischen
Überprüfung der Daten verwendet werden
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
31/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Residualanalyse
’Betragsmäßig kleine’ Residuen ei = yi − ŷi weisen auf ein
gutes Regressionsmodell hin
I Residuen sind aber abhängig von den Maßeinheiten in Y und X
Pn
I
i=1 ei = 0 und auch ē = 0, d.h. der Mittelwert der Residuen
ist 0
I Standardisieren der Residuen mit
I
n
se2 =
1 X 2
ei ,
n−2
i=1
ei
also e˜i = p
se2
e˜i sind die normierten Residuen, welche bei einem ’guten
Modell’ im Intervall [−2.5, 2.5] liegen sollten
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
32/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
I
Datei ’bspreg.sav’, n = 61, Y sei die abhängige Variable
Streudiagramm spricht eher für einen positiven linearen
Zusammenhang
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
33/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
ŷ = 0.92x + 3.63, B = 0.86, rXY = 0.93
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
34/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
Berechnung
der Residuen und normierten Residuen mit
p
se2 = 1.45
i
1
2
3
..
.
yi
33
33
35
..
.
xi
32
33
35
..
.
ŷi
33.20
34.13
35.98
..
.
ei
-0.20
-1.13
-0.98
..
.
ẽi
-0.14
-0.78
-0.67
..
.
61
47
48
47.99
-0.99
-0.68
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
35/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
I
Graph der normierten Residuen mit Konfidenzbereich
[−2.5, 2.5]
i auf der X Achse, ẽi auf der Y Achse
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
36/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Beispiel
I
I
Graph der normierten Residuen gegen die geschätzten Werte
yˆi
yˆi auf der X Achse, ẽi auf der Y Achse
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
37/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Problematische Darstellungen
I
I
Graph der normierten Residuen gegen die geschätzten Werte
yˆi
linearer Trend, Hinweis auf Messfehler oder inadäquates
Modell
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
38/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Problematische Darstellungen
I
I
Graph der normierten Residuen gegen die geschätzten Werte
yˆi
Ansteigende Varianzen mit ansteigendem yˆi
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
39/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Problematische Darstellungen
I
I
Graph der normierten Residuen gegen die geschätzten Werte
yˆi
Nicht-linearer Verlauf der Residuen, inadäquates Modell
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
40/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Regression mit Standardmesswerten
I
Wir betrachten die Regression von Y auf X mit
standardisierten Variablen tY∗ und tX∗
I
Kovarianz, Korrelation und Regressionskoeffizient b̂ sind
gleich dem mittleren Messwertprodukt, und die
Regressionskonstante â = 0.
I
n
ctY∗ tX∗ = rtY∗ tX∗ = b̂tY∗ tX∗ =
1 X ∗ ∗
tyi txi
n−1
i=1
I
Regressionseffekt (bei |rXY | < 1: |ŷi − ȳ | < |xi − x̄|) leichter
erkennbar, da x, y und ŷ standardisiert sind
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
41/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Partielle Korrelation rXY |Z
I
Berechnung der partiellen Korrelation mithilfe der Residuen
I
Regression von X auf Z durchführen und die Residuen
ei = (xi − x̂i ) berechnen; diese Residuen drücken jene
Variation von X aus, die durch Z nicht erklärt wird
I
Regression von Y auf Z durchführen und die Residuen
eˇi = (yi − ŷi ) berechnen; diese Residuen drücken jene
Variation von Y aus, die durch Z nicht erklärt wird
I
rXY |Z ist identisch mit rE ,Ě
I
Einfachere Berechnung mit Formel von letzter Einheit
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
42/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfluss von Ausreissern
I
Einzelne Ausreisser können die Regressionsgerade beeinflussen
I
b̂ und â werden sehr stark durch Ausreisser verfälscht
I
Schlimmster Fall, wenn Ausreisser nicht in Richtung des
Punktschwarms liegen
I
Leichtes Erkennen von Ausreissern im Streudiagramm der
Daten
I
Nur in manchen Fällen sind Ausreisser auch durch große
normierte Residuen erkennbar (Residuengraphs)
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
43/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
44/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
45/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Einfluss von Ausreissern
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
46/47
Einfache Regressionsanalyse
Einführung
Art funktionaler Beziehung
Lineare Regression
Parameterschätzung
Zusammenhang Regression und Korrelation
Vertauschen abhängiger und unabhängiger Variablen
Prognose und Interpolation
Gütekriterien
Weitere Erkentnisse
Nichtlineares f (X )
I
Quadratisch: Y = c + dX 2 ⇒ KQS
I
Exponentiell: Y = qe gX ⇒ Logarithmieren ergibt
ln(Y ) = ln(q) + gX also ln(Y ) = q 0 + gX ⇒ KQS für q̂ 0 und
ĝ
I
Logarithmisch: Y = ln (hX p ) ⇒ Y = p ln(X ) + ln(h); KQS
[
für p̂ und ln(h)
I
Achtung auf richtige Interpretation der Parameter!
Christodoulides / Waldherr
Einführung in Quantitative Methoden- 2.VO
47/47
Herunterladen