Einfache Regressionsanalyse Einführung in Quantitative Methoden Mag. Dipl.Ing. Dr. Pantelis Christodoulides & Mag. Dr. Karin Waldherr SS 2011 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 1/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Historisches I Regression geht auf Galton (1889) und seine Studien zur Vererbung zurück; Galton formulierte das Gesetz der universalen Regression I Jede vom ’normalen’ abweichende Eigenschaft eines Menschen wird in der nachfolgenden Generation zwar übernommen, aber im Durchschnitt in einem geringeren Ausmaß. Es tritt also bzgl. dieser Eigenschaft ein Rücktritt (Regression) ein Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 2/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Historisches I Karl Pearson hat bei 1078 Familien die Größe von Vater und Sohn untersucht I Obwohl große Väter dazu neigen große Söhne zu haben, sind die Söhne von großen Vätern im Durchschnitt kleiner als ihre Väter I Ebenso wird die Besonderheit der Kleinheit von Vätern nicht in vollem Maße an die Söhne vererbt, denn diese sind durchschnittlich größer als ihre Väter I Es ist eine Regression oder ein Rücktritt in Bezug auf die Größe bei Söhnen sichtbar Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 3/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Ziele I Empirische Repräsentation großer Datenmengen I Erkennen eines funktionalen Zusammenhanges I Nachweis einer bereits bekannten Beziehung zwischen den Variablen I Spezifizierung eines funktionalen Zusammenhanges zwischen zwei Variablen I Schätzen der Parameter einer funktionalen Beziehung I Interpolation fehlender bzw. Prognose zukünftiger Werte Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 4/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Ausgangslage I Zusammenhang zwischen 2 metrischen Variablen X und Y mit Ausprägungen xi und yi I Spezifizierung einer funktionalen Beziehung Y = f (X ): Y wird mithilfe von X und f geschätzt I Stichprobe mit n Objektpaaren - (x1 , y1 ) · · · (xn , yn ) I Objektpaare (x1 , y1 ) · · · (xn , yn ) darstellbar als Punkte in kartesischem Koordinatensystem mit Koordinaten (xi , yi ) = Streudiagramm Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 5/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Ausgangslage I Y ist der Regressand (abhängige Variable); X ist der Regressor (unabhängige Variable); Regression von Y auf X I Annahmen - die abhängige Variable ist mit Zufallsfehlern überlagert; die unabhängige Variable gilt als fehlerfrei I Einfache Regression weil ein Regressor, im Vergleich zu multipler Regression mit mehr als einem Regressor Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 6/47 Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfache Regressionsanalyse Funktion f (X ) I Linear: Y = a + bX , a und b reelle Zahlen, höchster Polynomgrad ist 1 I Quadratisch: Y = c + wX + dX 2 , c, w , und d reelle Zahlen, höchster Polynomgrad ist 2 I Exponentiell: Y = q e gX , q und g reelle Zahlen I Logarithmisch: Y = h ln zusätzlich positiv Christodoulides / Waldherr X p , h und p reelle Zahlen, p Einführung in Quantitative Methoden- 2.VO 7/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel 1: Lineare Funktion f (X ) I Treibstoffverbrauch (Y ) und Leistungsabgabe eines Motors (X ) bei konstanter Drehzahl: Y ≈ 0.854 + 0.302X Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 8/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel 2: Quadratische Funktion f (X ) I Körnerertrag (Y ) und Düngung (X ): Y ≈ 5.78 + 2.29X − 0.09X 2 I Bis zu einer bestimmten Düngungsgrenze steigt der Körnerertrag an, um wieder abzufallen Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 9/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel 3: Logarithmische Funktion f (X ) I Weber-Fechner’sches Gesetz: Bei einem linearen Anstieg der Reizstärke (X ), wächst die Empfindung im Sinnesorgan (Y ) logarithmisch an I b = Schwellenreiz I X Y = c ln b c = Konstante abhängig von der Reizart Weber-Fechner’sches Gesetz allgemein bekannt durch die Dezibel-Skala, die das logarithmische Verhältnis zwischen Reiz und Lärmempfindung überträgt Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 10/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel 3: Logarithmische Funktion f (X ) Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 11/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse I Vermutet wird ein zumindest näherungsweise linearer Zusammenhang zwischen zwei Variablen Y und X I Die Variable Y soll näherungsweise durch eine lineare Funktion von X beschrieben werden I Y ≈ Ŷ = bX + a mit a, b reelle Zahlen I a (Schnitt mit Y -Achse) und b (Anstieg) sind unbekannt I a und b so wählen, dass Zusammenhang (Streudiagramm) zwischen Y und X ’am besten’ beschrieben wird I Die Methode der kleinsten Quadrate ermittelt beste Schätzungen â und b̂ für a und b Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 12/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Kleinste Quadrate Schätzung (KQS) I Residuum ei = yi − ŷi ; n Residuen (Abweichungen von der Regressionsgerade in Richtung abhängiger Variable) I Zentrale Idee bei KQS ist, a und b derart zu wählen, dass die Summe der quadrierten Differenzen (Quadratsumme aller Residuen) minimal wird Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 13/47 Einfache Regressionsanalyse Christodoulides / Waldherr Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einführung in Quantitative Methoden- 2.VO 14/47 Einfache Regressionsanalyse Christodoulides / Waldherr Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einführung in Quantitative Methoden- 2.VO 15/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Kleinste Quadrate Schätzung (KQS) I Bestimme a und b derart, dass die Quadratsumme aller Residuen minimal wird, d.h. S2 = n X i=1 (yi − ŷi )2 = n X (yi − a − bxi )2 → Min i=1 I Partielles Differenzieren von S 2 nach den Unbekannten a und b und anschließendes Nullsetzen der Ableitungen liefert cXY b̂ = 2 , â = ȳ − b̂x̄ sX I b̂ = Verhältnis zwischen Kovarianz und Varianz des Regressors â ist abhängig von den Mittelwerten, x̄, ȳ , und b̂ I Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 16/47 Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfache Regressionsanalyse Beispiel I Bei einer Stichprobe von n = 40 Personen wurden Körpergröße (X ) und Gewicht (Y ) gemessen 40 X xi = 6814, i=1 40 X yi = 2722, 40 X xi2 = 1163780, sX2 = 77.31 i=1 40 X i=1 i=1 yi2 = 190422, sY2 = 133.07, 40 X xi yi = 466599 i=1 I cXY = 40 1 X 1 6814 2722 ( xi yi − 40x̄ ȳ ) = (466599 − 40 ) 39 39 40 40 i=1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 17/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel cXY = 74.52, sX2 = 77.31 ⇒ b̂ = cXY = 0.9639 sX2 â = ȳ − b̂x̄ = 68.05 − 0.9639 · 170.35 = −96.15 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 18/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 19/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse I Produktmomentkorrelation rXY steht im engen Zusammenhang zum Schätzer b̂ I Es gilt rXY = I cXY , sX sY b̂ = cXY cXY sY rXY sY = = sX sX sY sX sX sX Aus der Korrelation kann der Steigungsparameter geschätzt werden und umgekehrt Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 20/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse I Maß für Güte der Anpassung einer Regression ist das Bestimmtheitsmaß B I B misst das Verhältnis der Varianz der geschätzten Werte ŷi zur Varianz der beobachteten Werte yi I B misst den Anteil der Varianz der abhängigen Variable Y , der durch die unabhängige Variable X (bzw. die Regression) erklärt werden kann I Achtung ’verursacht’ nur bei Kausalität Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 21/47 Einfache Regressionsanalyse B= sŶ2 sY2 mit Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse 0≤B≤1 I Je näher die Punkte zur Regressionsgerade liegen, desto größer ist B I Liegen alle Punkte auf der Regressionsgerade, dann ist B = 1 und Y wird durch die Regression völlig erklärt I Das Bestimmtheitsmaß ist gleich dem Quadrat der Korrelation I Es gilt also B = r 2 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 22/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse B und Streudiagramm Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 23/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I Gewicht und Körpergröße b̂ = 0.9639; √ 77.31 r = 0.9639 √ = 0.735 133.07 I B = r 2 = 0.7352 = 0.54 I 54% der Varianz vom Gewicht wird durch die lineare Regression mit Körpergröße erklärt I deswegen Korrelation von ’mittelmäßiger Höhe’ Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 24/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Regression von X auf Y I Vertauschen von abhängiger und unabhängiger Variable; Vertauschen des Koordinatensystems X -Y I X approximativ als lineare Funktion von Y darstellen X ≈ b 0 Y + a0 I Wie ändern sich unsere Parameter? Vertauschen von X undY in den Formeln, d.h. cXY b̂ 0 = 2 â0 = x̄ − b̂ 0 ȳ sY I 2 Regressionsgeraden, je nach Fragestellung; beide gehen durch den Schwerpunkt des Punktschwarms (x̄, ȳ ) Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 25/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Regression von X auf Y bzw. Y auf X I Verschiedenheit beider Regressionsgeraden hat ihre Ursache in der Annahme, dass die unabhängige Variable als fehlerfrei angesehen wird, während die abhängige Variable durch einen Zufallsfehler überlagert wird I Darstellung beider Geraden im X -Y Koordinatensystem Y = b̂X + â X = b̂ 0 Y + â0 ⇒ Y = Christodoulides / Waldherr (1) 1 b̂ 0 X− â0 b̂ 0 (2) Einführung in Quantitative Methoden- 2.VO 26/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel Y = 0.624X + 35.13 (1) X = 0.789Y + 27.01 1 27.01 Y = X− ⇒ Y = 1.27X − 34.23 (2) 0.789 0.789 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 27/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Bemerkungen I Korrelation und Bestimmtheitsmaß ändern sich nicht, da sie symmetrisch bzgl. X und Y sind I Vorzeichen der Steigungsparameter bleibt auch unverändert I Steigungsparameter ändert sich um die jeweilige Varianz des Regressors X bzw.Y I Regressionsgeraden fallen zusammen bei perfektem linearen Zusammenhang zwischen X und Y , d.h. bei rXY = ±1 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 28/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse I Prognose von Y ⇒ Y als abhängige Variable; für gegebenes x in die Modellgleichung ŷ = b̂x + â einsetzen und ŷ ausrechnen I Prognose von X ⇒ X als abhängige Variable; für gegebenes y in die Modellgleichung x̂ = b̂ 0 y + â0 einsetzen und x̂ ausrechnen I Die zu prognostizierende Variable ist die im jeweiligen Modell abhängige Variable Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 29/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I Prognose von y bei x = 125 ⇒ ŷ = (0.624)(125) + 35.13, d.h. ŷ = 113.13 I Prognose von x bei y = 125 ⇒ x̂ = (0.789)(125) + 27.01, d.h. x̂ = 125.635 I Überprüfung der Güte der Prognose mithilfe der Abweichung des beobachteten Wertes yi vom geschätzten yˆi (bzw. analog für X ) I Betragsmäßig ’kleine’ Abweichungen sprechen für eine ’gute Prognose’ Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 30/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Allgemeine Richtlinien I Grafische Überprüfung der Daten und der Regressionsgerade im Streudiagramm; Daten sollten annähernd auf einen linearen Zusammenhang hinweisen I Größe und Struktur der Residuen: Betragsmäßig kleine Residuen, die in einem Streudiagramm mit den geschätzten Werten ŷi keine erkennbare Struktur zeigen, weisen auf ein gutes Modell hin I Hohes Bestimmtheitsmaß: Dieses Kriterium sollte im Zusammenhang mit einer Residualanalyse und grafischen Überprüfung der Daten verwendet werden Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 31/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Residualanalyse ’Betragsmäßig kleine’ Residuen ei = yi − ŷi weisen auf ein gutes Regressionsmodell hin I Residuen sind aber abhängig von den Maßeinheiten in Y und X Pn I i=1 ei = 0 und auch ē = 0, d.h. der Mittelwert der Residuen ist 0 I Standardisieren der Residuen mit I n se2 = 1 X 2 ei , n−2 i=1 ei also e˜i = p se2 e˜i sind die normierten Residuen, welche bei einem ’guten Modell’ im Intervall [−2.5, 2.5] liegen sollten Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 32/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I I Datei ’bspreg.sav’, n = 61, Y sei die abhängige Variable Streudiagramm spricht eher für einen positiven linearen Zusammenhang Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 33/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I ŷ = 0.92x + 3.63, B = 0.86, rXY = 0.93 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 34/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I Berechnung der Residuen und normierten Residuen mit p se2 = 1.45 i 1 2 3 .. . yi 33 33 35 .. . xi 32 33 35 .. . ŷi 33.20 34.13 35.98 .. . ei -0.20 -1.13 -0.98 .. . ẽi -0.14 -0.78 -0.67 .. . 61 47 48 47.99 -0.99 -0.68 Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 35/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I I Graph der normierten Residuen mit Konfidenzbereich [−2.5, 2.5] i auf der X Achse, ẽi auf der Y Achse Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 36/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Beispiel I I Graph der normierten Residuen gegen die geschätzten Werte yˆi yˆi auf der X Achse, ẽi auf der Y Achse Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 37/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Problematische Darstellungen I I Graph der normierten Residuen gegen die geschätzten Werte yˆi linearer Trend, Hinweis auf Messfehler oder inadäquates Modell Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 38/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Problematische Darstellungen I I Graph der normierten Residuen gegen die geschätzten Werte yˆi Ansteigende Varianzen mit ansteigendem yˆi Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 39/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Problematische Darstellungen I I Graph der normierten Residuen gegen die geschätzten Werte yˆi Nicht-linearer Verlauf der Residuen, inadäquates Modell Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 40/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Regression mit Standardmesswerten I Wir betrachten die Regression von Y auf X mit standardisierten Variablen tY∗ und tX∗ I Kovarianz, Korrelation und Regressionskoeffizient b̂ sind gleich dem mittleren Messwertprodukt, und die Regressionskonstante â = 0. I n ctY∗ tX∗ = rtY∗ tX∗ = b̂tY∗ tX∗ = 1 X ∗ ∗ tyi txi n−1 i=1 I Regressionseffekt (bei |rXY | < 1: |ŷi − ȳ | < |xi − x̄|) leichter erkennbar, da x, y und ŷ standardisiert sind Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 41/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Partielle Korrelation rXY |Z I Berechnung der partiellen Korrelation mithilfe der Residuen I Regression von X auf Z durchführen und die Residuen ei = (xi − x̂i ) berechnen; diese Residuen drücken jene Variation von X aus, die durch Z nicht erklärt wird I Regression von Y auf Z durchführen und die Residuen eˇi = (yi − ŷi ) berechnen; diese Residuen drücken jene Variation von Y aus, die durch Z nicht erklärt wird I rXY |Z ist identisch mit rE ,Ě I Einfachere Berechnung mit Formel von letzter Einheit Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 42/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfluss von Ausreissern I Einzelne Ausreisser können die Regressionsgerade beeinflussen I b̂ und â werden sehr stark durch Ausreisser verfälscht I Schlimmster Fall, wenn Ausreisser nicht in Richtung des Punktschwarms liegen I Leichtes Erkennen von Ausreissern im Streudiagramm der Daten I Nur in manchen Fällen sind Ausreisser auch durch große normierte Residuen erkennbar (Residuengraphs) Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 43/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfluss von Ausreissern Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 44/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfluss von Ausreissern Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 45/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Einfluss von Ausreissern Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 46/47 Einfache Regressionsanalyse Einführung Art funktionaler Beziehung Lineare Regression Parameterschätzung Zusammenhang Regression und Korrelation Vertauschen abhängiger und unabhängiger Variablen Prognose und Interpolation Gütekriterien Weitere Erkentnisse Nichtlineares f (X ) I Quadratisch: Y = c + dX 2 ⇒ KQS I Exponentiell: Y = qe gX ⇒ Logarithmieren ergibt ln(Y ) = ln(q) + gX also ln(Y ) = q 0 + gX ⇒ KQS für q̂ 0 und ĝ I Logarithmisch: Y = ln (hX p ) ⇒ Y = p ln(X ) + ln(h); KQS [ für p̂ und ln(h) I Achtung auf richtige Interpretation der Parameter! Christodoulides / Waldherr Einführung in Quantitative Methoden- 2.VO 47/47