Das Skalarprodukt in Geometrie und Statistik Flächensätze Korrelationskoeffizient präsentiert von Michael Spielmann RFAG-Mathematik KT Bergische Region 1 Welches Anliegen hat der Vortrag? • Vernetzung im Sinne eines Spiralcurriculums • Verankerung des Begriffes in verschiedenen Kontexten • Ermöglichung differenzierter Sicht auf mathematische Begriffe RFAG-Mathematik KT Bergische Region 2 Welche Klassenstufen werden angesprochen? • • • • • Klasse Klasse Klasse Klasse Klasse 8: Ähnlichkeit 9: Kathetensatz, Pythagoras 10: Cosinus-Satz 11: Statistik, Regression 12: Vektorgeometrie RFAG-Mathematik KT Bergische Region 3 Gliederung des Vortrages Geometrie: Ähnlichkeit -> Projektionssatz (speziell Kathetensatz, Pythagoras) Projektionssatz -> Cosinus-Satz Cosinus-Satz -> Skalarprodukt Statistik: Listen sind Vektoren Korrelationskoeffizient ist Skalarprodukt RFAG-Mathematik KT Bergische Region 4 1.Teil: Geometrie Wir beschränken uns auf spitzwinklige Dreiecke. RFAG-Mathematik KT Bergische Region 5 Höhen erzeugen ähnliche Teildreiecke. BEA CAD RFAG-Mathematik KT Bergische Region 6 Man kann die Höhen ins Verhältnis setzen; das führt aber zu einem anderen Thema. RFAG-Mathematik KT Bergische Region 7 Wir betrachten Seitenverhältnisse: RFAG-Mathematik KT Bergische Region 8 BEA CDA AB AC AE ADVerhältnis AB AD AC AE Flächen Rechteck-Flächen? RFAG-Mathematik KT Bergische Region 9 Bevor wir die Rechtecke betrachten, beschreiben wir AD und AE. AD ist die orthogonale Projektion von AC auf AB. Seite b Oder Projektion pbc von b auf c pbc Seite c RFAG-Mathematik KT Bergische Region 10 In der neuen Schreibweise notieren wir: AB AD AC AE c pbc b pcb RFAG-Mathematik KT Bergische Region 11 Das erinnert an den Kathetensatz und an den Pythagoras. Wir ergänzen die Figur. flächengleiche Rechtecke sind auch hier denkbar RFAG-Mathematik KT Bergische Region 12 RFAG-Mathematik KT Bergische Region 13 Beim spitzwinkligen Dreieck sind die Projektionsrechtecke mit gemeinsamer Ecke flächengleich. Zwei Projektionsrechtecke sind zu Kathetenquadraten geworden. RFAG-Mathematik KT Bergische Region 14 c a a pba b b pab 2 2 2 a 2 b 2 a pba b pab a pba b pab a 2 b 2 2 a pba RFAG-Mathematik KT Bergische Region 15 Trigonometrie es gilt pba b cos 2 a pba 2 a b cos RFAG-Mathematik KT Bergische Region 16 Wir sind beim Cosinussatz angekommen. pba b cos 2 a pba 2 a b cos c a b 2 a b cos 2 2 2 Und der ist ja als Verallgemeinerung des Pythagoras bekannt. RFAG-Mathematik KT Bergische Region 17 Skalarprodukt Definitionen geometrisch algebraisch a b a b | a | | b | cos a1b1 a2b2 anbn a b cos RFAG-Mathematik KT Bergische Region 18 Wir nutzen die Definition mit cosinus. a b a b cos Das erinnert uns an den Cosinus-Satz! Und an die Projektionsrechtecke! Die Fläche des Rechtecks war a b cos a pba RFAG-Mathematik KT Bergische Region 19 Das Skalarprodukt kann man sich als Rechteckfläche veranschaulichen: Die eine Rechteckseite ist die Länge des einen Vektors, die andere Seite ist die Projektionslänge des anderen auf den ersten Vektor. 2.Teil: Statistik Regressionsanalyse • Regressionsanalyse bringt zwei Messreihen in Verbindung • linearer Zusammenhang gesucht • Methode der kleinsten Quadrate • Qualitätsmaß (Korrelation) RFAG-Mathematik KT Bergische Region 21 Diese Formeln sind bekannt. cxy 1 n (xi x )( yi y ) n 1 i 1 n 1 2 s x2 ( x x ) i n 1 i 1 1 n 2 s ( y y ) i n 1 i 1 cxy m 2 sx Covarianz Varianzen 2 y r cxy s x ·s y Steigung Korrelationskoeff. RFAG-Mathematik KT Bergische Region 22 n (x x )( y y ) i 1 i i n (x x ) i 1 i 2 Das sind Skalarprodukte n-dimensionaler Vektoren. Wir ahnen etwas. RFAG-Mathematik KT Bergische Region 23 Regressionsgerade verläuft durch den Schwerpunkt der Wolke Koordinatensystem in Schwerpunkt ( x / y ) legen ui xi x vi yi y Vektoren transformieren RFAG-Mathematik KT Bergische Region 24 Nach Transformation erhalten wir cuv 1 n ui vi n 1 i 1 n 1 2 su2 u i n 1 i 1 Covarianz Varianzen 1 n 2 s vi n 1 i 1 cuv m 2 su Steigung cuv ruv rxy su ·sv Korrelationskoeff. 2 v RFAG-Mathematik KT Bergische Region 25 Spaltenvektoren X 22 38 31 36 57 65 59 Y U V W 23 -22 -27 -26,3 25 -6 -25 -7,2 36 -13 -14 -15,5 55 -8 5 -9,5 54 13 4 15,5 67 21 17 25,1 90 15 40 17,9 44 50 X Y 0 U 0 0 Ziel: w so bestimmen, dass w=mu Lineare Funktion, Proportionalität, minimale Quadratsumme 1895 m 1,19 1588 1895 r 0,806 1588 3480 RFAG-Mathematik KT Bergische Region V 26 w m u wi m ui w m u Als Regressionsgerade ist gesucht ein Vektor mit der Eigenschaft „Proportionalität“. RFAG-Mathematik KT Bergische Region 27 U V W -22 -27 -26,3 -6 -25 -7,2 -13 -14 -15,5 -8 5 -9,5 13 4 15,5 21 17 25,1 15 40 17,9 w 1,19·u RFAG-Mathematik KT Bergische Region 28 u ist die Menge der (transformierten) Werte der unabhängigen Größe, v die Menge der (nicht passenden) abhängigen Größe, w mu die Menge der (proportionalen) angepassten abhängigen Größe. RFAG-Mathematik KT Bergische Region 29 cuv m 2 su bekannte Formel u v 2 u 1 u v u u 1 pvu u Die Steigung der Regressionsgeraden (Proportionalitätsfaktor m) ist ein Skalarprodukt oder Projektionslänge geteilt durch Länge u RFAG-Mathematik KT Bergische Region 30 w hat Richtung von u, und Länge ist Projektion v auf u. w m u w mu 1 pvu | u | u pvu Länge von w ist Projektion von v auf u RFAG-Mathematik KT Bergische Region 31 Wie hatten wir w angepasst? Methode der kleinsten Quadrate: n 2 ( w v ) i i i 1 soll minimal sein | w v | Dieser Betrag ist offenbar das „Lot“ (was sicher minimal ist). RFAG-Mathematik KT Bergische Region 32 Korrelation Als Qualitätsmaß der Regressionsbeziehung dient der Korrelationskoeffizient. cxy cuv u ·v r cos sx ·s y su ·sv uv RFAG-Mathematik KT Bergische Region 33 u ·v r cos uv r ist ein Skalarprodukt geometrisch geschrieben, also: der Cosinus des „Winkels“ zwischen den Vektoren Sei z.B. r 0.8 arccos 0,8 36,8 RFAG-Mathematik KT Bergische Region 34 Die Vektoren u und v schließen einen „Winkel von 37° “ ein. r nahe 1 bedeutet hohe Korrelation. Vektoriell gesehen ist dann der Winkel zwischen u und v klein. Wir erhalten eine andere Lesart der Qualität der Regressionsbeziehung! RFAG-Mathematik KT Bergische Region 35 Vielen Dank für Ihr Interesse! RFAG-Mathematik KT Bergische Region 36