Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 $Id: anageo.tex,v 1.3 2009/01/18 21:24:38 hk Exp hk $ II. Lineare Algebra §10 Analytische Geometrie 10.1 Das Skalarprodukt v w u p 0 Wir wollen noch eine weiteres Ergebnis der eben durchgeführten Überlegung festhalten. Den eben verwendeten Lotfußpunkt p nennt man auch die Projektion des Vektors v in Richtung von u, oder auf u. Unsere obige Formel besagt dann p = λu = u·v |u · v| · u, |p| = |λ| · |u| = . 2 |u| |u| Insbesondere ist damit p·u= u·v · (u · u) = u · v. |u|2 Diese Beobachtungen bilden auch die Grundlage für die Bedeutung des Skalarprodukts in der Mechanik. Dort treten Vektoren zumeist bei der Beschreibung wirkender Kräfte auf. Denken wir uns, dass der Vektor eine Kraft beschreibt, so interessiert man sich hier für den in Richtung von u wirkenden Teil der Kraft. Um diesen zu ermitteln zerlegt man v in einen zu u parallelen und einen zu u senkrechten Teil, und dies ist gerade unsere oben verwendet Zerlegung v = p + w. Der in Richtung u wirkende Teil der Kraft ist dann also p = λu = ((u · v)/|u|2 )u. In der Regel wird die Richtung dann durch einen Einheitsvektor beschrieben, d.h. wir haben |u| = 1 und somit p = (u · v)u. Der Betrag der in Richtung u wirkenden Kraft ist dann |p| = |u · v|. In §8 hatten wir bemerkt, dass die Determinante, beziehungsweise ihr Betrag, das Volumen des von den Spalten der Determinante aufgespannten Parallelepipeds angibt. 20-1 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 An dieser Stellen wollen wir dies für den ebenen Fall n = 2 auch einmal nachweisen. Hierzu betrachten wir die Fläche F des durch u und v gegebenen Parallelogramms: v w u p 0 so haben wir F = |u| · |w|, da wir etwa das rechts abgetrennte Teildreieck links wieder anhängen können und ein Rechteck mit den Seitenlängen |u| und |v| erhalten. Betrachten wir erneut unser rechtwinkliges Dreieck von oben, so können wir aus diesem die Länge |w| als |w| = |v| sin φ gewinnen, und somit wird die Fläche des von u und v aufgespannten Parallelogramms zu F = |u| · |w| = |u| · |v| · sin φ. Dabei betrachten wir hier den Fall, dass u und v sich wie im obigen Bild verhalten, der Punkt v also oberhalb von u liegt und der Winkel φ von u nach v kleiner als π ist, denn dann ist sin φ > 0. Quadrieren wir die Gleichung, so wird F 2 = (|u| · |w|)2 = |u|2 |v|2 sin2 φ = |u|2 |v|2 (1 − cos2 φ) = |u|2 |v|2 − (u · v)2 . Setzen wir hier u = (u1 , u2 ), v = (v1 , v2 ) ein, so wird dieser Ausdruck zu F 2 = (u21 + u22 ) · (v12 + v22 ) − (u1 v1 + u2 v2 )2 = u21 v12 + u21 v22 + u22 v12 + u22 v22 − u21 v12 − u22 v22 − 2u1 u2 v1 v2 = u21 v22 + u22 v12 u1 v 1 2 , − 2u1 u2 v1 v2 = (u1 v2 − u2 v1 ) = u2 v 2 2 d.h. es ist tatsächlich F = | det(u, v)|. Auch das Vorzeichen der Determinante det(u, v) hat eine geometrische Bedeutung. Um diese zu sehen betrachten wir die beiden möglichen Konstellationen von u und v 20-2 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 v 0 u 0 Positive Basis, det(u,v) > 0 u Negative Basis, det(u,v) < 0 v Wir drehen den Vektor u, beziehungsweise genauer die von ihm erzeugte Halbgerade, gegen den Uhrzeigersinn zum Vektor v. Im linken Bild ist der dabei auftretende Drehwinken φ kleiner als π, und wir nennen die Basis u, v positiv. Im rechten Bild ist der Winkel φ größer als π und wir haben eine negative Basis. Welcher der beiden Fälle vorliegt läßt sich an der Determinante det(u, v) ablesen, ist diese positiv, so ist die Basis positiv, und ist sie negativ, so ist die Basis negativ. 10.2 Die Hessesche Normalform Die Hessesche Normalform ist eine Beschreibung von Geraden in der Ebene und von Ebenen im Raum, und allgemeiner von (n−1)-dimensionalen affinen Teilräumen im Rn . Der Vollständigkeit halber wollen wir diese Begriffe erst einmal in Vektorraumsprache einführen: Definition 10.2: Eine Gerade im Rn ist ein eindimensionaler affiner Teilraum des Rn , und eine Ebene im Rn ist ein zweidimensionaler affiner Teilraum des Rn . Eine Hyperebene im Rn ist ein (n − 1)-dimensionaler affiner Teilraum des Rn . Starten wir einmal mit Geraden im Rn . Diese sind eindimensionale affine Teilräume, haben also die Form {v + tu|t ∈ R} (Parameterform oder Aufpunkt-Richtung Form). Dabei ist der Aufpunkt v irgendein Punkt der Geraden, ist also keinesfalls eindeutig. Auch der Richtungsvektor u ist nicht eindeutig festgelegt, mit u funktioniert auch jedes Vielfache von u, natürlich mit Ausnahme des Nullvektors. Nehmen wir als ein Beispiel einmal die Gerade 20-3 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 y y=x−1 o p x q gegeben als y = x − 1. Als Aufpunkt können wir dann irgendeinen Punkt, etwa den eingezeichneten Punkt p nehmen. Als Richtung können wir dann beispielsweise den Vektor von q nach p, also u = p − q benutzen, also haben wir als (eine) AufpunktRichtung Form 1 1 0 1 1 1+t +t· − = +t· = , t ∈ R. 0 0 −1 0 1 t Auch für Ebenen haben wir eine entsprechende Aufpunkt-Richtung, beziehungsweise Parameterform. Da Ebenen als zweidimensionale affine Teilräume definiert sind, brauchen wir hier gleich zwei Richtungsvektoren und entsprechend auch zwei Parameter {v + tu + sw|t, s ∈ R}. Wir kommen nun zu einer weiteren Beschreibung von Hyperebenen im Rn . Jeder kdimensionale affine Teilraum des Rn läßt sich durch ein lineares Gleichungssystem aus n − k Gleichungen in n Unbekannten beschreiben. Da Hyperebenen ja als (n − 1)dimensionale affine Teilräume definiert sind, lassen sich diese durch eine einzige lineare Gleichung a1 x 1 + · · · + an x n = c beschreiben. Im Fall n = 2 wird dies zur Beschreibung einer Geraden durch eine Gleichung ax + by = c (Implizite Form), beziehungsweise für n = 3 zur Beschreibung einer Ebene durch ebenfalls eine Gleichung ax + by + cz = d (Implizite Form). In unserem obigen Beispiel einer Geraden ist diese leicht zu erhalten, die Gerade war ja ursprünglich als y = x − 1 gegeben, die implizite Form ist also x − y = 1. Man 20-4 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 kann die implizite Form der Gleichung einer Hyperebene nun auch noch in Termen des Skalarprodukts deuten. Betrachten wir den Vektor a1 a := ... ∈ Rn an so wird für jeden Vektor x ∈ Rn a1 x1 + · · · + an xn = a · x, d.h. die implizite Form einer Hyperebene läßt sich als a · x = c (Implizite Form als Skalarprodukt) schreiben. Der Vektor a ist dann normal zur beschriebenen Hyperebene, steht also senkrecht auf ihr. Sind nämlich x, y zwei Punkte der Hyperebene, also a · x = a · y = c, so ist a · (x − y) = a · x − a · y = c − c = 0. In unserem Beispiel einer Geraden war die implizite Form als x − y = 1 gegeben, der Vektor a ist hier also 1 a= . −1 Auch die implizite Form einer Geraden oder einer Ebene ist nicht eindeutig. Die Gerade x − y = 1 können wir zum Beispiel ebensogut durch 2x − 2y = 2 beschreiben. Die Hessesche Normalform einer Hyperebene im Rn ist ein Spezialfall der impliziten Form dieser Hyperebene. Als Hessesche Normalform bezeichnet man eine implizite Form n · x = c, |n| = 1 (Hessesche Normalform) bei der der konstante Vektor n ein Einheitsvektor ist, für den also |n| = 1 gilt. Den Vektor n bezeichnet man als Normalenvektor der Hyperebene, und schreibt daher auch n“ anstelle von a“. Aus einer bereits vorhandenen impliziten Form a · x = c, ist es ” ” leicht eine Hessesche Normalform zu gewinnen, man teilt a einfach durch seine Länge. Die Hessesche Normalform wird a c ·x= |a| |a| also n · x = c0 mit n = a/|a|, c0 = c/|a|. Im unseren Geradenbeispiel ist ! √ √1 √ √ 1 1 1√ 1 2 0 2 √ a= , |a| = 1 + 1 = 2, n = √ a = = , c = 2, −1 − √12 2 − 2 2 2 die Hessesche Normalform ist also n·x= 1√ 2. 2 20-5 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 Auch die Hessesche Normalform ist nicht ganz eindeutig, man kann von n noch zu −n, und dann rechts natürlich zu −c, übergehen, aber bis auf dieses Vorzeichen ist die Hessesche Normalform eindeutig festgelegt. Die rechte Seite c in der Hesseschen Normalform hat auch noch eine direkte geometrische Bedeutung, der Betrag |c| ist gerade der Abstand der Geraden zum Nullpunkt. Wir wollen uns dies einmal für eine Gerade in der Ebene klarmachen, aber genau dasselbe Argument funktioniert dann auch im n-dimensionalen Fall. Wir betrachten also eine Gerade g, die in Hessescher x Normalform durch n · x = c gegeben ist. Weiter betrachp ten wir dann das Lot auf der Geraden g durch den Nullpunkt und bezeichnen den Lotfußpunkt, also den Schnitt der Lotgeraden mit g, als p. Der Abstand l := |p| von p l zu 0 ist dann der Abstand der Geraden g von Null. Ist 0 nämlich x ein beliebiger Punkt auf g, so haben wir das rechts angedeutete rechtwinklige Dreieck, und erhalten |x|2 = l2 + |x − p|2 ≥ l2 , also auch |x| ≥ l. Nun ist der Vektor p aber senkrecht auf der Geraden g, also ist p ein Vielfaches des Normalenvektors n. Wir können also p = λn mit einer reellen Zahl λ schreiben, und erhalten |λ| = |λn| = |p| sowie c = n · p = n · (λn) = λn · n = λ|n|2 = λ, √ also |c| = |λ| = |p| = l. In unserem Beispiel ist also 2/2 gerade der Abstand der Geraden x − y = 1 zum Nullpunkt. Dies können wir natürlich auch direkt einsehen: y x o Der Abstand der Geraden zum Nullpunkt ist gerade die halbe√Länge der Diagonale in einem Quadrat mit der Seitenlänge 1, und letztere ist gerade 2. 20-6 Mathematik für Ingenieure I, WS 2008/2009 10.3 Freitag 16.1 Das Vektorprodukt Das Vektorprodukt ist ein spezifisch dreidimensionales Phänomen, es ordnet zwei Vektoren u, v ∈ R3 einen weiteren Vektor u × v ∈ R3 zu, genannt das Vektorprodukt oder auch das Kreuzprodukt von u und v. Wie für das bereits behandelte Skalarprodukt gibt es zwei mögliche Arten das Vektorprodukt einzuführen, eine algebraische und eine mehr geometrische Methode. Wir werden die algebraische Form als Definition verwenden, wollen aber erst mal die geometrische Beschreibung des Vektorprodukts angeben. Zunächst soll u × v senkrecht auf u und auf v stehen. Sind insbesondere u und v linear unabhängig, so wird u × v senkrecht auf der von u und v aufgespannten Ebene sein. Hierdurch ist das Vektorprodukt aber noch nicht festgelegt, die auf u und v senkrechten Vektoren bilden einen eindimensionalen Teilraum des R3 , zumindest wenn u und v linear unabhängig sind. Als nächste Einschränkung soll die Länge des Vektorprodukts gerade die Fläche des von u und v aufgespannten Parallelograms sein. Dadurch ist das Skalarprodukt fast vollständig festgelegt, es gibt gerade zwei auf u, v senkrechte Vektoren einer vorgeschriebenen Länge. Welcher dieser beiden Vektoren als Vektorprodukt verwendet wird, ist durch die dritte Eigenschaft des Vektorprodukts festgelegt, die drei Vektoren u, v und u × v sollen eine positive Basis des R3 bilden, also eine deren Determinante positiv ist. Dies beschreibt zumindest den Fall wenn u und v linear unabhängig sind, andernfalls wird einfach u × v = 0 sein. Wie im zweidimensionalen Fall läßt sich auch wieder sagen was die Positivität einer Basis geometrisch bedeutet. Eine Basis u, v, w des R3 ist positiv, wenn sie ein Rechtssystem bildet, also wie die x-, y- und z-Achse im R3 angeordnet ist. Eine populäre andere Formulierung dieser Bedingung ist die Rechte Hand Regel“. Halten Sie den Daumen ” der rechten Hand in Richtung des ersten Basisvektors u, und den Finger daneben in Richtung des zweiten Basisvektors v, so richtet sich der Mittelfinger in Richtung des dritten Basisvektors w aus. Algebraisch erkennt man dies, wie bereits bemerkt, einfach daran das det(u, v, w) > 0 ist. Wir kommen nun zur algebraischen Definition des Vektorprodukts, und werden dann im folgenden nachweisen, dass diese Definition tatsächlich die obige geometrische Beschreibung verwirklicht. Definition 10.3: Seien u, v ∈ R3 . Das Vektorprodukt von u und v ist dann der Vektor u1 v1 e1 u × v := u2 v2 e2 ∈ R3 . u3 v3 e3 Dabei stehen e1 , e2 , e3 wieder für die drei kanonischen Basisvektoren des R3 . Wir verwenden hier die bisher nicht bemerkte Tatsache, dass wir auch Determinanten bilden können in denen Zahlen und Vektoren gemischt auftreten. Die Determinante war ja eine Summe von Produkten, haben wir also Zahlen und Vektoren in der Determinante stehen, so treten die folgenden Typen von Produkten auf: 1. Produkte von Zahlen. Was diese bedeuten ist klar. 20-7 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 2. Produkte aus mehreren Zahlen und genau einem Vektor. Multiplizieren wir dann die Zahlen, so erhalten wir einen Skalar, den wir mit dem Vektor multiplizieren können und einen neuen Vektor erhalten. 3. Produkte in denen mindestens zwei Vektoren auftreten. Diese Produkte fassen wir einfach als Null auf. Dass der so erweiterte Determinantenbegriff weiter all unsere in §8 hergeleiteten Eigenschaften hat, ist zwar nicht schwer zu sehen, erfordert aber einen etwas abstrakter angelegten Zugang zur Determinantentheorie, als den in dieser Vorlesung verwendeten Weg. Daher wollen wir dies an dieser Stelle einfach glauben. Eine etwas direktere Beschreibung des Vektorprodukts u × v erhalten wir, indem wir die obige Determinante nach der dritten Spalte entwickeln. Das Vektorprodukt wird dann zu u1 v1 e1 u2 v 2 u1 v 1 u1 v 1 ·e ·e + ·e − u × v = u2 v2 e2 = u3 v 3 1 u3 v 3 2 u2 v 2 3 u3 v3 e3 u2 v 2 u3 v 3 u v − u v 2 3 3 2 u1 v 1 u3 v 1 − u1 v 3 . = − u3 v 3 = u1 v 2 − u2 v 1 u1 v 1 u2 v 2 Insbesondere ist das tatsächliche Berechnen von Kreuzprodukten einfach möglich 1 3 2 − 10 −8 −1 × 5 = −(−2 − 6) = 8 . 2 −2 5+3 8 Einige der algebraischen Grundeigenschaften des Vektorprodukts folgen sofort aus der algebraischen Definition. Da eine Determinante genau dann Null ist, wenn ihre Spalten linear abhängig sind, erhalten wir u × v = 0 ⇐⇒ u und v sind linear abhängig. Vertauschen wir in einer Determinante zwei Spalten, so ändert sich das Vorzeichen der Determinante, also u × v = −v × u. Da die Determinante in jeder ihrer Spalten linear ist, haben wir ebenfalls (u1 +u2 )×v = u1 ×v +u2 ×v, u×(v1 +v2 ) = u×v1 +u×v2 , λ·u×v = (λu)×v = u×(λv) für u, v, u1 , u2 , v1 , v2 ∈ R3 , λ ∈ R. Wir wollen nun beginnen uns die eingangs gegebene geometrische Beschreibung des Vektorprodukts herzuleiten. Es stellt sich als nützlich 20-8 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 heraus, zunächst einmal für u, v, w ∈ R3 die folgende Kombination von Skalarprodukt und Vektorprodukt zu berechnen u1 v1 w1 u1 v 1 u1 v 1 u2 v2 w3 = u2 v2 w2 = det(u, v, w). w2 + w1 − (u×v)·w = u2 v 2 u3 v 3 u3 v 3 u3 v3 w3 Man bezeichnet (u × v) · w = det(u, v, w) auch als das Spatprodukt der drei Vektoren u, v, w. Insbesondere haben wir nun (u × v) · u = det(u, v, u) = 0 da die Determinante det(u, v, u) zwei identische, also insbesondere linear abhängige, Spalten hat. Ebenso ist (u × v) · v = 0. Andererseits haben wir bereits eingesehen, dass (u × v) · u = 0 gerade bedeutet, dass u × v senkrecht auf u steht, und ebenso steht dann u × v senkrecht auf v. Damit haben wir die erste der obigen drei Bedingungen an das Vektorprodukt eingesehen. Wir kommen nun zur Länge von u × v 2 |u × v| u2 v 2 2 u1 v 1 2 u1 v 1 2 + = u3 v 3 + u2 v 2 u3 v 3 = (u2 v3 − u3 v2 )2 + (u1 v3 − u3 v1 )2 + (u1 v2 − u2 v1 )2 = u22 v32 + u23 v22 + u21 v32 + u23 v12 + u21 v22 + u22 v12 −2(u2 u3 v2 v3 + u1 u3 v1 v3 + u1 u2 v1 v2 ) 2 = (u1 + u22 + u23 ) · (v12 + v22 + v32 ) − (u21 v12 + u22 v22 + u23 v32 +2(u2 u3 v2 v3 + u1 u3 v1 v3 + u1 u2 v1 v2 )) = (u21 + u22 + u23 ) · (v12 + v22 + v32 ) − (u1 v1 + u2 v2 + u3 v3 )2 = |u|2 |v|2 − (u · v)2 . Andererseits haben wir bereits bei der Diskussion des Skalarprodukts festgehalten, dass |u|2 |v|2 − (u · v)2 gerade das Quadrat der Fläche des von u und v aufgespannten Parallelograms ist. Folglich ist die Länge |u×v| gerade die Fläche dieses Parallelograms. Es verbleibt nur noch zu zeigen, dass u, v, u × v eine positive Basis des R3 ist, wenn u und v linear unabhängig sind. Dies ist aber mit unserer obigen Formel (u × v) · w = det(u, v, w) klar det(u, v, u × v) = (u × v) · (u × v) = |u × v|2 > 0. Damit haben wir auch die geometrische Beschreibung des Vektorprodukts verifiziert. Wir wollen uns nun noch über die geometrische Bedeutung des Spatprodukts klar werden. 20-9 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 w uxv v F 0 u Wir wollen uns überlegen, dass (u × v) · w gerade das Volumen des von u, v, w aufgespannten Spats ist, wie im obigen Bild angedeutet. Beachte dazu, das sich das Volumen einer Teilmenge des R3 unter Scherungen nicht ändert, das Volumen V des Spats ergibt sich also als das Produkt F · l, wobei F die Fläche des von u und v aufgespannten Parallelograms ist, und l die Länge der Projektion von w auf eine zu diesem Parallelogram senkrechte Gerade ist. Wie bereits gesehen steht das Vektorprodukt u × v senkrecht auf u und v, also auch auf unserem Parallelogram. Wie bei der Diskussion des Skalarprodukts gezeigt, ist die Länge der Projektion von w auf u × v gegeben als l= (u × v) · w . |u × v| Andererseits haben wir auch bereits eingesehen, dass die Fläche F unseres Parallelograms gerade die Länge des Vektorprodukts u × v ist, d.h. wir haben V = F · l = |u × v| · (u × v) · w = (u × v) · w. |u × v| Das Spatprodukt ist also das Volumen unseres Spats versehen mit einem Vorzeichen. Insbesondere ist dieses Volumen auch gleich V = (u × v) · w = det(u, v, w). Damit haben wir die in §8 angemerkte Bedeutung der Determinante als Volumen auch für n = 3 eingesehen. Das Vorzeichen des Spatprodukts zeigt wieder an, ob u, v, w eine positive Basis bilden oder nicht, ist also positiv für ein Rechtssystem und negativ für ein Linkssystem. Das Vektorprodukt hat vielfältige Anwendungen. Wollen wir beispielsweise zu einer in Aufpunkt-Richtung Form gegebenen Ebene E = {v + tu + sw|t, s ∈ R} eine implizite Form berechnen, so benötigen wir einen auf der Ebene senkrechten Vektor, d.h. einen zu u und w senkrechten Vektor. Ein kanonisches Beispiel für einen solchen Vektor ist dann durch das Vektorprodukt a = u × w gegeben. Oft tritt das Vektorprodukt bei der Behandlung von Drehungen in der Mechanik auf. Denken wir 20-10 Mathematik für Ingenieure I, WS 2008/2009 Freitag 16.1 uns etwa einen um einen Punkt z drehbaren Körper im Raum gegeben, und lassen eine Kraft F in einem Punkt p auf den Körper wirken, so betrachten wir den Vektor r := p − z von z nach p, und bezeichnen das Vektorprodukt M =r×F als Drehmoment. Die Richtung des Drehmoments M gibt dabei die Achse durch z an, um die der Körper in Drehung versetzt wird, und die Länge des Drehmoments gibt die Geschwindigkeit dieser Drehung. Die algebraischen Eigenschaften des Vektorprodukts sind ganz anders als diejenigen der gewöhnlichen Multiplikation. Wir hatten beispielsweise schon gesehen, dass für alle u, v ∈ R3 stets u × v = −v × u ist, und das u × v = 0 sein kann selbst wenn u, v 6= 0 beide nicht Null sind. Das Vektorprodukt ist auch nicht assoziativ, man kann also nicht einfach Klammern weglassen. Als Ersatz für das Assoziativgesetz gibt es die sogenannte Jacobi-Identität u × (v × w) + v × (w × u) + w × (u × v) = 0 für alle u, v, w ∈ R3 . In den Übungen wird auch noch die Formel u × (v × w) = (u · w)v − (u · v)w für alle u, v, w ∈ R3 gezeigt. 20-11