Lineare Gleichungssysteme

Werbung
Brückenkurs Mathematik
TU Dresden 2015
Lineare Gleichungssysteme
Schwerpunkte: Modellbildung
geometrische Interpretation
Lösungsmethoden
Prof. Dr. F. Schuricht
TU Dresden, Fachbereich Mathematik
(auf der Grundlage des Manuskriptes von Prof. Dr. M. Ludwig, TU Dresden)
1
1
Problemstellung
Gleichungssysteme, in denen die Unbekannten xk nur in der ersten Potenz auftreten und nicht
miteinander multipliziert werden, heißen lineare Gleichungssysteme. Sie haben die Form
a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2
..
.
am1 x1 + am2 x2 + · · · + amn xn = bm
Die Koeffizienten akl und die rechten Seiten bk sind gegebene Größen
(k = 1, 2, . . . , m, l = 1, 2, . . . , n).
Im allgemeinen bestehen sie aus m Gleichungen mit n Unbekannten x1 , . . . , xn .
Das Gleichungssystem lösen heißt, n Größen x1 , . . . , xn zu finden, die zusammen jede der m Gleichungen erfüllen.
Im folgenden werden Lösungsmethoden vorrangig für lineare Gleichungssysteme mit n, m = 2 angegeben. Entsprechend werden die Unbekannten mit x und y bezeichnet. Die Resultate können auf
allgemeinere Fälle übertragen werden.
Alle vorkommenden Größen akl , bk , xk , x, y, z usw. seien reell (d.h. Elemente aus R) und die Größen
i, j, k, l, m, n seien natürliche Zahlen (d.h. Elemente aus N).
2
Modellbildung
Lineare Gleichungssysteme treten bei vielen Problemen in Naturwissenschaft, Technik und Wirtschaft
auf (z.B. lineare Optimierungsprobleme, Berechnungen basierend auf linearen Modellen, Näherungsrechnungen mittels Computer). Dabei entstehen im allgemeinen Gleichungssysteme mit sehr vielen
Gleichungen, deren Lösung einen erheblichen Rechenaufwand erfordert. Heute werden derartige Systeme mittels Computer gelöst, wobei spezielle effiziente Lösungsmethoden genutzt werden (kleinere
Gleichungssysteme können bereits auf leistungsfähigen Taschenrechnern gelöst werden).
Das Aufstellen der Gleichungen gehört zur Aufgabe von Experten des jeweiligen Gebietes und erfordert spezifische Fachkenntnisse.
2
3
Geometrische Interpretation
Wir betrachten die geometrische Bedeutung von verschiedenen linearen Gleichungssystemen. Da es
sich künftig immer um lineare Gleichungssysteme handelt, wird der Begriff linear“ im folgenden
”
weggelassen.
3.1
Gleichungen mit einer Unbekannten
◦ eine Gleichung:
ax = b
Für feste Werte von a und b sind alle reellen Zahlen x zu bestimmen, die in die Gleichung
eingesetzt, die Gleichheitsbedingung erfüllen.
Betrachtet man die Funktion f (x) = ax − b, so entspricht das Lösen der Gleichung gerade
der Bestimmung der Nullstellen f (x) = 0 der linearen Funktion f . Für a 6= 0 gibt es genau
b
eine Nullstelle und somit genau eine Lösung x =
der Gleichung.
a
◦ 2 Gleichungen
a1 x = b 1
a2 x = b 2
Es sind alle reellen Zahlen x zu bestimmen, die beide Gleichungen gleichzeitig erfüllen.
Falls a1 , a2 6= 0 besitzt jede Gleichung eine eindeutige Lösung x1 bzw. x2 , aber in der Regel ist
x1 6= x2 , d.h. es gibt keine Lösung des Gleichungssystems aus beiden Gleichungen. Nur im
Ausnahmefall, dass eine Gleichung ein Vielfaches der anderen ist, hat das System eine Lösung.
Man sagt auch: das Gleichungssystem ist überbestimmt
(mehr Gleichungen als Unbekannte)
3
3.2
Gleichungen mit zwei Unbekannten
◦ eine Gleichung:
ax + by = c
(a2 + b2 6= 0)
Für feste Werte a, b und c sind alle reellen Zahlen x und y zu bestimmen, so dass die Gleichung
erfüllt ist.
a
x
Die linke Seite der Gleichung ist gerade das Skalarprodukt der Vektoren
und
b
y
in der xy-Ebene. Die Gleichung wird auch als Geradengleichung bezeichnet, da die Menge
aller Lösungen (x, y) eine Gerade in der xy-Ebene beschreibt. Es gibt also unendlich viele
Lösungen.
Man sagt auch: die Gleichung ist unterbestimmt
(weniger Gleichungen als Unbekannte)
◦ 2 Gleichungen
a1 x + b 1 y = c 1
a2 x + b 2 y = c 2
(a2k +b2k 6= 0, k = 1, 2)
Für gegebene ak , bk , ck sind alle reellen Zahlen x und y zu bestimmen, so dass beide Gleichungen gleichzeitig erfüllt sind.
Wir haben also 2 Geradengleichungen, deren Lösungsmenge jeweils eine Gerade ist. Schneiden
sich beide Geraden in einem Punkt, so sind die Koordinaten dieses Schnittpunktes die einzige
Lösung des obigen Gleichungssystems.
Im Ausnahmefall, dass beide Geraden parallel sind, muss man zwei Fälle betrachten: entweder
sind die Geraden verschieden und das Gleichungssystem hat keine Lösung oder die Geraden
fallen zusammen und jeder Punkt (x, y) dieser Geraden liefert eine Lösung.
◦ 3 Gleichungen
a1 x + b 1 y = c 1
a2 x + b 2 y = c 2
a3 x + b 3 y = c 3
(a2k +b2k 6= 0, k = 1, 2, 3)
Wir haben hier 3 Geradengleichungen, so dass die Lösungsmenge für jede einzelne Gleichung
eine Gerade ist. Nur im Ausnahmefall, in dem sich alle 3 Geraden in einem Punkt schneiden,
besitzt das Gleichungssystem eine Lösung. In allen anderen Fällen gibt es keine Lösung.
Man sagt wieder: das Gleichungssystem ist überbestimmt
(mehr Gleichungen als Unbekannte)
4
3.3
Gleichungen mit drei Unbekannten
◦ eine Gleichung:
ax + by + cz = d
(a2 + b2 + c2 6= 0)
Mit Argumenten wie bisher erkennt man, dass die Menge aller Lösungen (x, y, z) eine Ebene
im 3-dimensionalen xyz-Raum beschreibt.
Es gibt somit unendlich viele Lösungen und die Gleichung ist unterbestimmt.
◦ 2 Gleichungen
a1 x + b 1 y + c 1 z = d 1
a2 x + b 2 y + c 2 z = d 2
(a2k +b2k +c2k 6= 0, k = 1, 2)
Abgesehen von Ausnahmefällen kann man als Lösungsmenge die Schnittmenge zweier nicht
paralleler Ebenen erwarten, d.h. eine Gerade im xyz-Raum.
Es gibt also wieder unendlich viele Lösungen und die Gleichung ist unterbestimmt.
◦ 3 Gleichungen
a1 x + b 1 y + c 1 z = d 1
a2 x + b 2 y + c 2 z = d 2
a3 x + b 3 y + c 3 z = d 3
(a2k +b2k +c2k 6= 0, k = 1, 2, 3)
Abgesehen von Ausnahmefällen kann man als Lösungsmenge die Schnittmenge von drei Ebenen, wovon jeweils zwei nicht parallel zueinander sind, erwarten. Das ist auch der Schnittpunkt
einer Ebene mit einer Geraden und liefert eine eindeutige Lösung des Gleichungssystems.
◦ vier und mehr Gleichungen
Abgesehen von Ausnahmefällen sind solche Gleichungssysteme überbestimmt und besitzen
keine Lösung.
FAZIT:
Abgesehen von Ausnahmefällen zeigen lineare Gleichungssysteme folgendes Lösungsverhalten:
◦ Anzahl Gleichungen < Anzahl Unbekannte
unterbestimmt
−→
unendlich viele Lösungen
◦ Anzahl Gleichungen = Anzahl Unbekannte
−→
genau eine Lösung
◦ Anzahl Gleichungen > Anzahl Unbekannte
überbestimmt
5
−→
keine Lösung
4
Alternative geometrische Interpretation
Wir betrachten 2 Gleichungen mit ein, zwei bzw. drei Unbekannten und betrachten die Gleichungen
als Gleichung für Vektoren in der Ebene (a21 + a22 6= 0, b21 + b22 6= 0, c21 + c22 6= 0):
(a)
a1 x = d 1
a2 x = d 2
(b)
a1 x + b 1 y = d 1
a2 x + b 2 y = d 2
(c)
a1 x + b 1 y + c 1 z = d 1
a2 x + b 2 y + c 2 z = d 2
a1
x
a2
a1
x
a2
a1
x
a2
=
Wir suchen also geeignete Vielfache der Vektoren
gleich dem vorgegebenen Vektor
d1
d2
d1
d2
b1
+y
b2
b1
+y
b2
=
d1
d2
c1
+z
c2
=
d1
d2
a1
b1
c1
,
und
, so dass deren Summe
a2
b2
c2
ist.
a1
d1
Fall (a): Nur im Ausnahmefall, in dem
und
auf einer Geraden liegen, gibt es eine
a2
d2
Lösung x. Sonst gibt es keine Lösung und das System ist überbestimmt.
a1
b1
Fall (b): Sind
und
linear unabhängig (d.h. sie liegen nicht auf einer Geraden),
a2
b2
dann gibt es genau eine Lösung (x, y). Die anderen Fälle können als Ausnahme angesehen
werden und können selbst diskutiert werden.
a1
b1
c1
Fall (c): Falls nicht alle drei Vektoren
,
und
auf einer Geraden liegen gibt es
a2
b2
c2
unendlich viele Lösungen und das System ist unterbestimmt. Die anderen Fälle können
als Ausnahme angesehen werden und können selbst diskutiert werden.
Ergebnis: Analog können wir auch für drei und mehr Gleichungen argumentieren und unsere
Überlegungen bestätigen das Fazit aus dem vorigen Abschnitt.
6
5
Determinante
Gleichungssysteme, die eine eindeutige Lösung besitzen, sind für Anwendungen besonders wichtig.
Deshalb betrachten wir hier Systeme, bei denen die Anzahl von Gleichungen und Unbekannten gleich
ist, also z.B.
a11 x + a12 y = b1
a21 x + a22 y = b2
In der Praxis muss man überprüfen, ob ein reguläres Gleichungssystem (d.h. kein Ausnahmefall)
vorliegt.
Ein Schema von Zahlen
a11 a12
a21 a22
nennt man auch Matrix (hier 2 × 2-Matrix). Die Zahl
a11 a12 = a11 a22 − a12 a21
D=
a21 a22 heißt Determinante dieser Matrix.
Der Betrag |D| ist gerade das Volumen des Parallelogramms, das von den Vektoren
a12
a22
a11
a21
und
aufgespannt wird. Somit hat man
D 6= 0
genau dann, wenn diese Vektoren linear unabhängig sind. Somit hat das obige Gleichungssystem
genau dann eine eindeutige Lösung, wenn D 6= 0 gilt.
Für die Matrix
1 1
−1 4
erhält man
1 1
= 4 − (−1) = 5
D = −1 4 7
6
Lösungsmethoden
Die folgenden Verfahren können für wenige Gleichungen von Hand ausgeführt und für viele Gleichungen mittels Computer realisiert werden.
Zur Demonstration der wichtigsten Techniken betrachten wir das Lösen von 2 Gleichungen mit
2 Unbekannten. Dabei betrachten wir neben dem allgemeinen Fall (links) stets ein konkretes Beispiel
(rechts) und fordern stets D = a11 a22 − a12 a21 6= 0 (so dass wir ein reguläres Problem haben):
a11 x + a12 y = b1
a21 x + a22 y = b2
6.1
x+y =3
−x + 4y = 2
Gleichsetzungsverfahren
Auflösen beider Gleichungen nach der gleichen Unbekannten, z.B. nach x (es seien a11 , a21 6= 0):
x=
b1
a12
−
y
a11 a11
x = −y + 3
x=
a22
b2
−
y
a21 a21
x = 4y − 2
Gleichsetzen (x = x) beider Gleichungen:
a12
b2
a22
b1
−
y=
−
y
a11 a11
a21 a21
− y + 3 = 4y − 2
Auflösen nach y:
y=
a11 b2 − a21 b1
a11 a22 − a12 a21
y=1
Lösung in eine der beiden Ausgangsgleichungen einsetzen (z.B. in die erste) und man erhält x:
x=
a22 b1 − a12 b2
a11 a22 − a12 a21
x=2
(beachte: im Nenner der Lösungen steht jeweils die Determinante D)
8
6.2
Einsetzungsverfahren
a11 x + a12 y = b1
a21 x + a22 y = b2
x+y =3
−x + 4y = 2
Auflösen einer Gleichung nach einer Unbekannten, z.B. der ersten Gleichung nach x
x=
b1
a12
−
y
a11 a11
x = −y + 3
Einsetzen des Ergebnisses in die andere Gleichung, d.h. hier in die zweite Gleichung:
b
a12 1
a21
−
y + a22 y = b2
− (−y + 3) + 4y = 2
a11 a11
Auflösen nach der verbleibenden Unbekannten, hier nach y, führt zu:
y=
a11 b2 − a21 b1
a11 a22 − a12 a21
y=1
Die zweite Unbekannte berechnet man wie bei dem Gleichsetzungsverfahren:
x=
6.3
a22 b1 − a12 b2
a11 a22 − a12 a21
x=2
Additionsverfahren
Addition eines bestimmten (evtl. auch negativen) Vielfachen der ersten Gleichung zu einem bestimmten Vielfachen der zweiten Gleichung derart, dass eine Unbekannte nicht mehr auftritt.
Konkret multiplizieren wir die erste Gleichung mit −a21 , die zweite mit a11 und addieren die so
entstandenen Gleichungen:
−a21 a12 y + a11 a22 y = −a21 b1 + a11 b2
5y = 5
Auflösen nach y liefert
y=
a11 b2 − a21 b1
a11 a22 − a12 a21
y=1
Analog multipliziert man die erste Gleichung mit −a22 , die zweite mit a12 und addiert die entstandenen Gleichungen:
−a11 a22 x + a12 a21 x = −a22 b1 + a12 b2
− 5x = −10
Auflösen nach x liefert
x=
a22 b1 − a12 b2
a11 a22 − a12 a21
x=2
9
6.4
Cramersche Regel
Betrachte das reguläre Gleichungssystem
a11 x + a12 y = b1
a21 x + a22 y = b2
x+y =3
−x + 4y = 2
1 1
=4+1=5
D = −1 4 D = a11 a22 − a12 a21 6= 0
Ersetze in der Matrix der Koeffizienten die 1. Spalte bzw. die 2. Spalte durch die rechte Seite und
berechne die Determinanten
b1 a12 = b1 a22 − a12 b2
D1 = b2 a22 3 1
= 12 − 2 = 10
D1 = 2 4
a11 b1 = a11 b2 − b1 a21
D2 = a21 b2 1 3
=2+3=5
D2 = −1 2 Verwendet man die Interpretation der Determinante als Volumen, so erhält man
D1 = Dx und D2 = Dy
Dies ergibt für die eindeutige Lösung des Gleichungssystems die sogenannte Cramersche Regel
x=
D1
,
D
y=
D2
D
x=
10
= 2,
5
y=
5
=1
5
Bemerkungen:
a11
a12
b1
(a) Falls D = D1 = D2 = 0, dann liegen alle drei Vektoren
,
und
auf
a21
a22
b2
einer Geraden. Dies bedeutet, dass eine Gleichung ein Vielfaches der anderen Gleichung ist
und es gibt unendlich viele Lösungen.
(b) Falls D = 0 und wenigstens eine der Determinanten D1 , D2 ist nicht Null, dann liegen die
a11
a12
b1
Vektoren
und
auf einer Geraden und
liegt auf einer anderen Geraden.
a21
a22
b2
In diesem Fall gibt es keine Lösung (sofern b21 + b22 6= 0).
10
6.5
Gaußscher Algorithmus
Eine Kombination von Additions- und Einsetzungsverfahren führt zum Gaußschen Algorithmus (auch
Gaußsches Eliminationsverfahren). Hierbei multipliziert und addiert man die Gleichungen derart, dass
eine Dreiecksstruktur entsteht.
Wir betrachten wieder
a11 x + a12 y = b1
a21 x + a22 y = b2
x+y =3
−x + 4y = 2
Die 1. Gleichung übernehmen wir unverändert. Dann multiplizieren wir die 1. Gleichung mit − aa21
11
und addieren die so entstandene Gleichung zur zweiten. Dabei erhält man die Gleichung
ã22 y = b̃2
ã22 = a22 −
mit
b2 a21
a12 a21
, b̃2 = b2 −
a11
a11
Diese verwendet man nun anstelle der 2. Gleichung, d.h. man hat das System
a11 x + a12 y = b1
ã22 y = b̃2
x+y =3
5y = 5
Nun löst man die 2. Gleichung nach y auf. Die erhaltene Lösung wird in die 1. Gleichung eingesetzt,
um x zu berechnen:
b̃2
ã22
b1
a12
b1
a12 b̃2
x=
−
y=
−
a11 a11
a11 a11 ã22
y=
y=1
x = −1 + 3 = 2
Somit besteht der Gaußsche Algorithmus aus folgenden Schritten:
◦ Erzeugung einer Dreiecksstruktur
◦ Berechnung der Unbekannten durch Rückrechnung (Einsetzungsverfahren).
Bemerkung:
(a) Beim Gaußschen Algorithmus ist darauf zu achten, dass bei den auftretenden Multiplikationsfaktoren die Nenner immer von Null verschieden sind.
(b) Der Gaußsche Algorithmus ist besonders für die Lösung linearer Gleichungssysteme mittels
Computer geeignet.
11
7
Lösung unterbestimmter und überbestimmter Systeme
Unterbestimmte und überbestimme Gleichungssysteme kann man z.B. auch mit dem Einsetzungs-,
Gleichsetzungs- oder Additionsverfahren behandeln. An zwei Beispielen demonstrieren wir, welches
Ergebnis man im allgemeinen erhält.
7.1
Unterbestimmte Systeme
Wir betrachten 2 Gleichungen mit 3 Unbekannten:
x−y−z =2
x + y − 5z = 4
Auflösen der 1. Gleichung nach x:
Einsetzen in die 2. Gleichung:
Auflösen dieser Gleichung nach y:
Einsetzen in die Gleichung für x:
x=y+z+2
2y − 4z = 2
y = 2z + 1
x = 3z + 3
Interpretation des Ergebnisses
Man kann beliebige Werte für z wählen und erhält durch Einsetzen in die Lösungsformeln jeweils
eine Lösung des Gleichungssystems: z.B. z = 1 −→ Lösung (x, y, z) = (6, 3, 1)
z = −2 −→ Lösung (x, y, z) = (−3, −3, −2)
Auf diese Weise erhält man alle Lösungen. Das sind unendlich viele, die alle auf einer Geraden im
3-dimensionalen xyz-Raum liegen.
7.2
Überbestimmte Systeme
Wir betrachten drei Gleichungen mit zwei Unbekannten:
x−y =2
x+y =4
−x + y = 6
Wir bestimmen die Lösung von zwei Gleichungen, z.B. der ersten beiden:
Addition der Gleichungen liefert:
Einsetzen in die 1. Gleichung liefert:
2x = 6 −→
3 − y = 2 −→
x=3
y=1
Einsetzen dieser Lösung für (x, y) = (3, 1) in die verbleibende dritte Gleichung:
−3 + 1 6= 6
Wir stellen fest, dass das System keine Lösung besitzt.
12
8
Lösung in Abhängigkeit von Parametern
In vielen Anwendungen stehen nicht sofort alle Werte für die Koeffizienten akl bzw. für die rechte
Seite bk fest, da sie z.B. materialabhängige Parameter sind. In diesen Fällen ist es oft sinnvoll, die
Lösung in Abhängigkeit eines (oder auch mehrerer) Parameter darzustellen. Wir wollen dies an einem
Beispiel demonstrieren.
ax − y = 2
x+y =4
z.B. Auflösen der 1. Gleichung nach y:
dies in die 2. Gleichung einsetzen:
y = ax − 2
x + ax − 2 = 4
Auflösen nach x:
x=
6
1+a
Einsetzen in die Gleichung für y:
y=
6a
−2
1+a
Wir stellen fest, dass wir für jede Wahl des Parameters a 6= −1 die eindeutige Lösung sofort
ausrechnen können: z.B. a = 1 −→ Lösung (x, y) = (3, 1)
a = 0 −→ Lösung (x, y) = (6, −2)
Bemerkung zu a = −1:
In diesem Fall ist die linke Seite der 2. Gleichung ein Vielfaches der linken Seite der ersten Gleichung
−1 −1 = −1 − (−1) = 0. Es liegt also ein
(Faktor -1). Insbesondere ist die Determinante D = 1 1 Ausnahmefall vor und es gibt keine Lösung.
13
9
Fehlerdiskussion
Wir betrachten das konkrete (reguläre) Gleichungssystem
941664x − 665857y = 1
665857x − 470832y = 0
mit der exakten Lösung, z.B. mittels Cramerscher Regel
x = −470832 ,
y = −665857
Löst man das Gleichungssystem auf einem Computer mit 12 Gleitkommastellen mittels Gleichsetzungsverfahren, erhält man als Lösung
◦ bei Auflösung jeweils nach x: x = −750911, 982606
y = 1061949, 90995
◦ bei Auflösung jeweils nach x: x = −150182, 396521
y = −212389, 9819907
Die Ursache der sehr großen Abweichungen vom exakten Resultat liegt in der Stellenauslöschung
bei der Differenzbildung in Verbindung mit der Division. Sie tritt besonders dann auf, wenn beide
Gleichungen Geraden repräsentieren, die fast parallel sind (das ist der Fall wenn die Determinante
D sehr klein ist). In solchen Fällen sind Verfahren einzusetzen, die derartige Stellenauslöschungen
weitestgehend vermeiden.
Im vorliegenden Fall liefert z.B. das Gaußsche Verfahren eine bessere Lösung
x = −5000000, 000000 y = −707106, 781187
die aber immer noch mit einem großen Fehler behaftet ist.
14
Herunterladen