Brückenkurs Mathematik TU Dresden 2015 Lineare Gleichungssysteme Schwerpunkte: Modellbildung geometrische Interpretation Lösungsmethoden Prof. Dr. F. Schuricht TU Dresden, Fachbereich Mathematik (auf der Grundlage des Manuskriptes von Prof. Dr. M. Ludwig, TU Dresden) 1 1 Problemstellung Gleichungssysteme, in denen die Unbekannten xk nur in der ersten Potenz auftreten und nicht miteinander multipliziert werden, heißen lineare Gleichungssysteme. Sie haben die Form a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . am1 x1 + am2 x2 + · · · + amn xn = bm Die Koeffizienten akl und die rechten Seiten bk sind gegebene Größen (k = 1, 2, . . . , m, l = 1, 2, . . . , n). Im allgemeinen bestehen sie aus m Gleichungen mit n Unbekannten x1 , . . . , xn . Das Gleichungssystem lösen heißt, n Größen x1 , . . . , xn zu finden, die zusammen jede der m Gleichungen erfüllen. Im folgenden werden Lösungsmethoden vorrangig für lineare Gleichungssysteme mit n, m = 2 angegeben. Entsprechend werden die Unbekannten mit x und y bezeichnet. Die Resultate können auf allgemeinere Fälle übertragen werden. Alle vorkommenden Größen akl , bk , xk , x, y, z usw. seien reell (d.h. Elemente aus R) und die Größen i, j, k, l, m, n seien natürliche Zahlen (d.h. Elemente aus N). 2 Modellbildung Lineare Gleichungssysteme treten bei vielen Problemen in Naturwissenschaft, Technik und Wirtschaft auf (z.B. lineare Optimierungsprobleme, Berechnungen basierend auf linearen Modellen, Näherungsrechnungen mittels Computer). Dabei entstehen im allgemeinen Gleichungssysteme mit sehr vielen Gleichungen, deren Lösung einen erheblichen Rechenaufwand erfordert. Heute werden derartige Systeme mittels Computer gelöst, wobei spezielle effiziente Lösungsmethoden genutzt werden (kleinere Gleichungssysteme können bereits auf leistungsfähigen Taschenrechnern gelöst werden). Das Aufstellen der Gleichungen gehört zur Aufgabe von Experten des jeweiligen Gebietes und erfordert spezifische Fachkenntnisse. 2 3 Geometrische Interpretation Wir betrachten die geometrische Bedeutung von verschiedenen linearen Gleichungssystemen. Da es sich künftig immer um lineare Gleichungssysteme handelt, wird der Begriff linear“ im folgenden ” weggelassen. 3.1 Gleichungen mit einer Unbekannten ◦ eine Gleichung: ax = b Für feste Werte von a und b sind alle reellen Zahlen x zu bestimmen, die in die Gleichung eingesetzt, die Gleichheitsbedingung erfüllen. Betrachtet man die Funktion f (x) = ax − b, so entspricht das Lösen der Gleichung gerade der Bestimmung der Nullstellen f (x) = 0 der linearen Funktion f . Für a 6= 0 gibt es genau b eine Nullstelle und somit genau eine Lösung x = der Gleichung. a ◦ 2 Gleichungen a1 x = b 1 a2 x = b 2 Es sind alle reellen Zahlen x zu bestimmen, die beide Gleichungen gleichzeitig erfüllen. Falls a1 , a2 6= 0 besitzt jede Gleichung eine eindeutige Lösung x1 bzw. x2 , aber in der Regel ist x1 6= x2 , d.h. es gibt keine Lösung des Gleichungssystems aus beiden Gleichungen. Nur im Ausnahmefall, dass eine Gleichung ein Vielfaches der anderen ist, hat das System eine Lösung. Man sagt auch: das Gleichungssystem ist überbestimmt (mehr Gleichungen als Unbekannte) 3 3.2 Gleichungen mit zwei Unbekannten ◦ eine Gleichung: ax + by = c (a2 + b2 6= 0) Für feste Werte a, b und c sind alle reellen Zahlen x und y zu bestimmen, so dass die Gleichung erfüllt ist. a x Die linke Seite der Gleichung ist gerade das Skalarprodukt der Vektoren und b y in der xy-Ebene. Die Gleichung wird auch als Geradengleichung bezeichnet, da die Menge aller Lösungen (x, y) eine Gerade in der xy-Ebene beschreibt. Es gibt also unendlich viele Lösungen. Man sagt auch: die Gleichung ist unterbestimmt (weniger Gleichungen als Unbekannte) ◦ 2 Gleichungen a1 x + b 1 y = c 1 a2 x + b 2 y = c 2 (a2k +b2k 6= 0, k = 1, 2) Für gegebene ak , bk , ck sind alle reellen Zahlen x und y zu bestimmen, so dass beide Gleichungen gleichzeitig erfüllt sind. Wir haben also 2 Geradengleichungen, deren Lösungsmenge jeweils eine Gerade ist. Schneiden sich beide Geraden in einem Punkt, so sind die Koordinaten dieses Schnittpunktes die einzige Lösung des obigen Gleichungssystems. Im Ausnahmefall, dass beide Geraden parallel sind, muss man zwei Fälle betrachten: entweder sind die Geraden verschieden und das Gleichungssystem hat keine Lösung oder die Geraden fallen zusammen und jeder Punkt (x, y) dieser Geraden liefert eine Lösung. ◦ 3 Gleichungen a1 x + b 1 y = c 1 a2 x + b 2 y = c 2 a3 x + b 3 y = c 3 (a2k +b2k 6= 0, k = 1, 2, 3) Wir haben hier 3 Geradengleichungen, so dass die Lösungsmenge für jede einzelne Gleichung eine Gerade ist. Nur im Ausnahmefall, in dem sich alle 3 Geraden in einem Punkt schneiden, besitzt das Gleichungssystem eine Lösung. In allen anderen Fällen gibt es keine Lösung. Man sagt wieder: das Gleichungssystem ist überbestimmt (mehr Gleichungen als Unbekannte) 4 3.3 Gleichungen mit drei Unbekannten ◦ eine Gleichung: ax + by + cz = d (a2 + b2 + c2 6= 0) Mit Argumenten wie bisher erkennt man, dass die Menge aller Lösungen (x, y, z) eine Ebene im 3-dimensionalen xyz-Raum beschreibt. Es gibt somit unendlich viele Lösungen und die Gleichung ist unterbestimmt. ◦ 2 Gleichungen a1 x + b 1 y + c 1 z = d 1 a2 x + b 2 y + c 2 z = d 2 (a2k +b2k +c2k 6= 0, k = 1, 2) Abgesehen von Ausnahmefällen kann man als Lösungsmenge die Schnittmenge zweier nicht paralleler Ebenen erwarten, d.h. eine Gerade im xyz-Raum. Es gibt also wieder unendlich viele Lösungen und die Gleichung ist unterbestimmt. ◦ 3 Gleichungen a1 x + b 1 y + c 1 z = d 1 a2 x + b 2 y + c 2 z = d 2 a3 x + b 3 y + c 3 z = d 3 (a2k +b2k +c2k 6= 0, k = 1, 2, 3) Abgesehen von Ausnahmefällen kann man als Lösungsmenge die Schnittmenge von drei Ebenen, wovon jeweils zwei nicht parallel zueinander sind, erwarten. Das ist auch der Schnittpunkt einer Ebene mit einer Geraden und liefert eine eindeutige Lösung des Gleichungssystems. ◦ vier und mehr Gleichungen Abgesehen von Ausnahmefällen sind solche Gleichungssysteme überbestimmt und besitzen keine Lösung. FAZIT: Abgesehen von Ausnahmefällen zeigen lineare Gleichungssysteme folgendes Lösungsverhalten: ◦ Anzahl Gleichungen < Anzahl Unbekannte unterbestimmt −→ unendlich viele Lösungen ◦ Anzahl Gleichungen = Anzahl Unbekannte −→ genau eine Lösung ◦ Anzahl Gleichungen > Anzahl Unbekannte überbestimmt 5 −→ keine Lösung 4 Alternative geometrische Interpretation Wir betrachten 2 Gleichungen mit ein, zwei bzw. drei Unbekannten und betrachten die Gleichungen als Gleichung für Vektoren in der Ebene (a21 + a22 6= 0, b21 + b22 6= 0, c21 + c22 6= 0): (a) a1 x = d 1 a2 x = d 2 (b) a1 x + b 1 y = d 1 a2 x + b 2 y = d 2 (c) a1 x + b 1 y + c 1 z = d 1 a2 x + b 2 y + c 2 z = d 2 a1 x a2 a1 x a2 a1 x a2 = Wir suchen also geeignete Vielfache der Vektoren gleich dem vorgegebenen Vektor d1 d2 d1 d2 b1 +y b2 b1 +y b2 = d1 d2 c1 +z c2 = d1 d2 a1 b1 c1 , und , so dass deren Summe a2 b2 c2 ist. a1 d1 Fall (a): Nur im Ausnahmefall, in dem und auf einer Geraden liegen, gibt es eine a2 d2 Lösung x. Sonst gibt es keine Lösung und das System ist überbestimmt. a1 b1 Fall (b): Sind und linear unabhängig (d.h. sie liegen nicht auf einer Geraden), a2 b2 dann gibt es genau eine Lösung (x, y). Die anderen Fälle können als Ausnahme angesehen werden und können selbst diskutiert werden. a1 b1 c1 Fall (c): Falls nicht alle drei Vektoren , und auf einer Geraden liegen gibt es a2 b2 c2 unendlich viele Lösungen und das System ist unterbestimmt. Die anderen Fälle können als Ausnahme angesehen werden und können selbst diskutiert werden. Ergebnis: Analog können wir auch für drei und mehr Gleichungen argumentieren und unsere Überlegungen bestätigen das Fazit aus dem vorigen Abschnitt. 6 5 Determinante Gleichungssysteme, die eine eindeutige Lösung besitzen, sind für Anwendungen besonders wichtig. Deshalb betrachten wir hier Systeme, bei denen die Anzahl von Gleichungen und Unbekannten gleich ist, also z.B. a11 x + a12 y = b1 a21 x + a22 y = b2 In der Praxis muss man überprüfen, ob ein reguläres Gleichungssystem (d.h. kein Ausnahmefall) vorliegt. Ein Schema von Zahlen a11 a12 a21 a22 nennt man auch Matrix (hier 2 × 2-Matrix). Die Zahl a11 a12 = a11 a22 − a12 a21 D= a21 a22 heißt Determinante dieser Matrix. Der Betrag |D| ist gerade das Volumen des Parallelogramms, das von den Vektoren a12 a22 a11 a21 und aufgespannt wird. Somit hat man D 6= 0 genau dann, wenn diese Vektoren linear unabhängig sind. Somit hat das obige Gleichungssystem genau dann eine eindeutige Lösung, wenn D 6= 0 gilt. Für die Matrix 1 1 −1 4 erhält man 1 1 = 4 − (−1) = 5 D = −1 4 7 6 Lösungsmethoden Die folgenden Verfahren können für wenige Gleichungen von Hand ausgeführt und für viele Gleichungen mittels Computer realisiert werden. Zur Demonstration der wichtigsten Techniken betrachten wir das Lösen von 2 Gleichungen mit 2 Unbekannten. Dabei betrachten wir neben dem allgemeinen Fall (links) stets ein konkretes Beispiel (rechts) und fordern stets D = a11 a22 − a12 a21 6= 0 (so dass wir ein reguläres Problem haben): a11 x + a12 y = b1 a21 x + a22 y = b2 6.1 x+y =3 −x + 4y = 2 Gleichsetzungsverfahren Auflösen beider Gleichungen nach der gleichen Unbekannten, z.B. nach x (es seien a11 , a21 6= 0): x= b1 a12 − y a11 a11 x = −y + 3 x= a22 b2 − y a21 a21 x = 4y − 2 Gleichsetzen (x = x) beider Gleichungen: a12 b2 a22 b1 − y= − y a11 a11 a21 a21 − y + 3 = 4y − 2 Auflösen nach y: y= a11 b2 − a21 b1 a11 a22 − a12 a21 y=1 Lösung in eine der beiden Ausgangsgleichungen einsetzen (z.B. in die erste) und man erhält x: x= a22 b1 − a12 b2 a11 a22 − a12 a21 x=2 (beachte: im Nenner der Lösungen steht jeweils die Determinante D) 8 6.2 Einsetzungsverfahren a11 x + a12 y = b1 a21 x + a22 y = b2 x+y =3 −x + 4y = 2 Auflösen einer Gleichung nach einer Unbekannten, z.B. der ersten Gleichung nach x x= b1 a12 − y a11 a11 x = −y + 3 Einsetzen des Ergebnisses in die andere Gleichung, d.h. hier in die zweite Gleichung: b a12 1 a21 − y + a22 y = b2 − (−y + 3) + 4y = 2 a11 a11 Auflösen nach der verbleibenden Unbekannten, hier nach y, führt zu: y= a11 b2 − a21 b1 a11 a22 − a12 a21 y=1 Die zweite Unbekannte berechnet man wie bei dem Gleichsetzungsverfahren: x= 6.3 a22 b1 − a12 b2 a11 a22 − a12 a21 x=2 Additionsverfahren Addition eines bestimmten (evtl. auch negativen) Vielfachen der ersten Gleichung zu einem bestimmten Vielfachen der zweiten Gleichung derart, dass eine Unbekannte nicht mehr auftritt. Konkret multiplizieren wir die erste Gleichung mit −a21 , die zweite mit a11 und addieren die so entstandenen Gleichungen: −a21 a12 y + a11 a22 y = −a21 b1 + a11 b2 5y = 5 Auflösen nach y liefert y= a11 b2 − a21 b1 a11 a22 − a12 a21 y=1 Analog multipliziert man die erste Gleichung mit −a22 , die zweite mit a12 und addiert die entstandenen Gleichungen: −a11 a22 x + a12 a21 x = −a22 b1 + a12 b2 − 5x = −10 Auflösen nach x liefert x= a22 b1 − a12 b2 a11 a22 − a12 a21 x=2 9 6.4 Cramersche Regel Betrachte das reguläre Gleichungssystem a11 x + a12 y = b1 a21 x + a22 y = b2 x+y =3 −x + 4y = 2 1 1 =4+1=5 D = −1 4 D = a11 a22 − a12 a21 6= 0 Ersetze in der Matrix der Koeffizienten die 1. Spalte bzw. die 2. Spalte durch die rechte Seite und berechne die Determinanten b1 a12 = b1 a22 − a12 b2 D1 = b2 a22 3 1 = 12 − 2 = 10 D1 = 2 4 a11 b1 = a11 b2 − b1 a21 D2 = a21 b2 1 3 =2+3=5 D2 = −1 2 Verwendet man die Interpretation der Determinante als Volumen, so erhält man D1 = Dx und D2 = Dy Dies ergibt für die eindeutige Lösung des Gleichungssystems die sogenannte Cramersche Regel x= D1 , D y= D2 D x= 10 = 2, 5 y= 5 =1 5 Bemerkungen: a11 a12 b1 (a) Falls D = D1 = D2 = 0, dann liegen alle drei Vektoren , und auf a21 a22 b2 einer Geraden. Dies bedeutet, dass eine Gleichung ein Vielfaches der anderen Gleichung ist und es gibt unendlich viele Lösungen. (b) Falls D = 0 und wenigstens eine der Determinanten D1 , D2 ist nicht Null, dann liegen die a11 a12 b1 Vektoren und auf einer Geraden und liegt auf einer anderen Geraden. a21 a22 b2 In diesem Fall gibt es keine Lösung (sofern b21 + b22 6= 0). 10 6.5 Gaußscher Algorithmus Eine Kombination von Additions- und Einsetzungsverfahren führt zum Gaußschen Algorithmus (auch Gaußsches Eliminationsverfahren). Hierbei multipliziert und addiert man die Gleichungen derart, dass eine Dreiecksstruktur entsteht. Wir betrachten wieder a11 x + a12 y = b1 a21 x + a22 y = b2 x+y =3 −x + 4y = 2 Die 1. Gleichung übernehmen wir unverändert. Dann multiplizieren wir die 1. Gleichung mit − aa21 11 und addieren die so entstandene Gleichung zur zweiten. Dabei erhält man die Gleichung ã22 y = b̃2 ã22 = a22 − mit b2 a21 a12 a21 , b̃2 = b2 − a11 a11 Diese verwendet man nun anstelle der 2. Gleichung, d.h. man hat das System a11 x + a12 y = b1 ã22 y = b̃2 x+y =3 5y = 5 Nun löst man die 2. Gleichung nach y auf. Die erhaltene Lösung wird in die 1. Gleichung eingesetzt, um x zu berechnen: b̃2 ã22 b1 a12 b1 a12 b̃2 x= − y= − a11 a11 a11 a11 ã22 y= y=1 x = −1 + 3 = 2 Somit besteht der Gaußsche Algorithmus aus folgenden Schritten: ◦ Erzeugung einer Dreiecksstruktur ◦ Berechnung der Unbekannten durch Rückrechnung (Einsetzungsverfahren). Bemerkung: (a) Beim Gaußschen Algorithmus ist darauf zu achten, dass bei den auftretenden Multiplikationsfaktoren die Nenner immer von Null verschieden sind. (b) Der Gaußsche Algorithmus ist besonders für die Lösung linearer Gleichungssysteme mittels Computer geeignet. 11 7 Lösung unterbestimmter und überbestimmter Systeme Unterbestimmte und überbestimme Gleichungssysteme kann man z.B. auch mit dem Einsetzungs-, Gleichsetzungs- oder Additionsverfahren behandeln. An zwei Beispielen demonstrieren wir, welches Ergebnis man im allgemeinen erhält. 7.1 Unterbestimmte Systeme Wir betrachten 2 Gleichungen mit 3 Unbekannten: x−y−z =2 x + y − 5z = 4 Auflösen der 1. Gleichung nach x: Einsetzen in die 2. Gleichung: Auflösen dieser Gleichung nach y: Einsetzen in die Gleichung für x: x=y+z+2 2y − 4z = 2 y = 2z + 1 x = 3z + 3 Interpretation des Ergebnisses Man kann beliebige Werte für z wählen und erhält durch Einsetzen in die Lösungsformeln jeweils eine Lösung des Gleichungssystems: z.B. z = 1 −→ Lösung (x, y, z) = (6, 3, 1) z = −2 −→ Lösung (x, y, z) = (−3, −3, −2) Auf diese Weise erhält man alle Lösungen. Das sind unendlich viele, die alle auf einer Geraden im 3-dimensionalen xyz-Raum liegen. 7.2 Überbestimmte Systeme Wir betrachten drei Gleichungen mit zwei Unbekannten: x−y =2 x+y =4 −x + y = 6 Wir bestimmen die Lösung von zwei Gleichungen, z.B. der ersten beiden: Addition der Gleichungen liefert: Einsetzen in die 1. Gleichung liefert: 2x = 6 −→ 3 − y = 2 −→ x=3 y=1 Einsetzen dieser Lösung für (x, y) = (3, 1) in die verbleibende dritte Gleichung: −3 + 1 6= 6 Wir stellen fest, dass das System keine Lösung besitzt. 12 8 Lösung in Abhängigkeit von Parametern In vielen Anwendungen stehen nicht sofort alle Werte für die Koeffizienten akl bzw. für die rechte Seite bk fest, da sie z.B. materialabhängige Parameter sind. In diesen Fällen ist es oft sinnvoll, die Lösung in Abhängigkeit eines (oder auch mehrerer) Parameter darzustellen. Wir wollen dies an einem Beispiel demonstrieren. ax − y = 2 x+y =4 z.B. Auflösen der 1. Gleichung nach y: dies in die 2. Gleichung einsetzen: y = ax − 2 x + ax − 2 = 4 Auflösen nach x: x= 6 1+a Einsetzen in die Gleichung für y: y= 6a −2 1+a Wir stellen fest, dass wir für jede Wahl des Parameters a 6= −1 die eindeutige Lösung sofort ausrechnen können: z.B. a = 1 −→ Lösung (x, y) = (3, 1) a = 0 −→ Lösung (x, y) = (6, −2) Bemerkung zu a = −1: In diesem Fall ist die linke Seite der 2. Gleichung ein Vielfaches der linken Seite der ersten Gleichung −1 −1 = −1 − (−1) = 0. Es liegt also ein (Faktor -1). Insbesondere ist die Determinante D = 1 1 Ausnahmefall vor und es gibt keine Lösung. 13 9 Fehlerdiskussion Wir betrachten das konkrete (reguläre) Gleichungssystem 941664x − 665857y = 1 665857x − 470832y = 0 mit der exakten Lösung, z.B. mittels Cramerscher Regel x = −470832 , y = −665857 Löst man das Gleichungssystem auf einem Computer mit 12 Gleitkommastellen mittels Gleichsetzungsverfahren, erhält man als Lösung ◦ bei Auflösung jeweils nach x: x = −750911, 982606 y = 1061949, 90995 ◦ bei Auflösung jeweils nach x: x = −150182, 396521 y = −212389, 9819907 Die Ursache der sehr großen Abweichungen vom exakten Resultat liegt in der Stellenauslöschung bei der Differenzbildung in Verbindung mit der Division. Sie tritt besonders dann auf, wenn beide Gleichungen Geraden repräsentieren, die fast parallel sind (das ist der Fall wenn die Determinante D sehr klein ist). In solchen Fällen sind Verfahren einzusetzen, die derartige Stellenauslöschungen weitestgehend vermeiden. Im vorliegenden Fall liefert z.B. das Gaußsche Verfahren eine bessere Lösung x = −5000000, 000000 y = −707106, 781187 die aber immer noch mit einem großen Fehler behaftet ist. 14