V AUSGLEICHSPROBLEME V.A. Gaußsche Normalengleichung. In

V AUSGLEICHSPROBLEME
S. BARTELS, 3.12.2013
V.A. Gaußsche Normalengleichung. In vielen Anwendungen treten überbestimmte Gleichungssysteme auf, das heißt für A ∈ Rm×n mit m ≥ n und
b ∈ Rm ist x ∈ Rn gesucht, so dass
Ax ≈ b.
Das Problem ist im Allgmeinen nicht exakt lösbar.
Beispiel V.1. Zu Messdaten (ti , yi ), i = 1, 2, . . . , m, ist
c ∈ R gesucht mit yi ≈ cti . Die Zahl c beschreibt dann die
Steigung einer Geraden, die die Punktepaare möglichst
gut approximiert.
Definition V.2. Durch A ∈
Rm×n
und b ∈
Rm
y
y = ct
t
wird das Ausgleichsproblem
Minimiere x 7→ kAx − bk22
definiert. Für x ∈ Rn heißt r = Ax − b Residuum von x.
Die Betrachtung des Ausgleichsproblems wird aufgrund der verwendeten
euklidischen Norm auch als Methode der kleinsten Quadrate bezeichnet.
Satz V.3. Die Lösungen des Ausgleichsproblems sind genau die Lösungen
der Gaußschen Normalengleichung
⊥
⊥
A Ax = A b,
insbesondere existiert eine Lösung x ∈ Rn . Ist z ∈ Rn eine weitere Lösung,
so gilt Ax = Az und die zugehörigen Residuen stimmen überein.
Beweis. Siehe Vorlesung.
⊥
Bemerkung V.4. Die Identität A r = 0 besagt, dass r senkrecht oder
normal zu den Spalten von A ist.
⊥
Lemma V.5. Die Matrix A A ist symmetrisch und positiv semidefinit. Sie
ist positiv definit genau dann, wenn ker A = {0} gilt, das heißt wenn A injektiv ist beziehungsweise die Spaltenvektoren von A linear unabhängig sind,
also rank A = n falls m ≥ n. In diesem Fall ist die Lösung der Normalengleichung eindeutig.
⊥
⊥
⊥
Beweis. Es gilt (A A) = A A und
⊥
⊥
⊥
x (A A)x = (Ax) (Ax) = kAxk22 ≥ 0
mit Gleichheit genau dann, wenn Ax = 0 gilt. Dies impliziert die Behauptung, da positiv definite Matrizen regulär sind.
1
S. BARTELS, 3.12.2013
2
⊥
Bemerkung V.6. Die Konditionszahl von A A ist im Allgemeinen größer
als die von A, denn für m = n und eine reguläre Matrix A ∈ Rn×n gilt
⊥
λmax (A A)
= cond2 (A)2 ,
λmin (A A)
⊥
⊥
⊥
⊥
cond2 (A A) = kA Ak2 k(A A)−1 k2 =
⊥
also cond2 (A A) ≥ cond2 (A), da cond2 (A) ≥ 1.
Aufgrund dieser Beobachtung werden Ausgleichsprobleme nicht mit Hilfe
der Normalengleichung gelöst.
V.B. Householder-Transformationen. Da die euklidische Norm invariant ist unter Rotationen, gilt
e
kQ(Ax
− b)k2 = kAx − bk2
e und allgemeiner für orthogonale Matrizen. Wir werfür jede Rotation Q
den versuchen, eine orthogonale Matrix Q zu konstruieren, so dass QA eine
verallgemeinerte obere Dreiecksgestalt hat, was eine einfache Lösung des
Ausgleichsproblems ermöglicht.
⊥
Definition V.7. Die Matrix Q ∈ R`×` heißt orthogonal, falls Q Q = I`
gilt. Die Menge der orthogonalen Matrizen wird mit O(`) bezeichnet.
⊥
Lemma V.8. Für alle P, Q ∈ O(`) gilt P Q ∈ O(`), Q−1 = Q
kQxk2 = kxk2 für alle x ∈ R` sowie cond2 (Q) = 1.
∈ O(`),
Beweis. Für alle x ∈ R` gilt
⊥
⊥
⊥
⊥
kQxk22 = (Qx) (Qx) = x (Q Q)x = x x = kxk22
und damit kQk2 = 1. Aus den Identitäten
⊥
⊥ ⊥
⊥
QQ = (QQ ) = I` = I` ,
⊥
⊥
⊥
⊥
⊥
Q− Q−1 = (QQ )−1 = (Q Q)− = I`− = I` ,
⊥
⊥
⊥
⊥
(P Q) (P Q) = Q (P P )Q = Q Q = I`
∈ O(`). Diese Eigenschaften implizieren
Definition V.9. Für v ∈ R` mit kvk2 = 1 heißt die Matrix Pv = In − 2vv
Householder-Transformation.
⊥
⊥
folgt P Q ∈ O(`) und Q−1 = Q
cond2 (Q) = kQk2 kQ−1 k2 = 1.
Householder-Transformationen realisieren Spiegelungen an der zu v senkrechten Ebene.
Lemma
V.10. Jede
HouseholderTransformation Pv = I` − 2vv ist symmetrisch und orthogonal. Es gilt Pv v = −v und
Pv w = w für alle w ∈ R` mit w · v = 0.
⊥
Beweis. Siehe Übung.
Pv v =
−v
Pv z = w − v
w = Pv w
z =w+v
v
V AUSGLEICHSPROBLEME
3
Jeder Vektor x ∈ R` \ {0} lässt sich mit einer Householder-Transformation
in R` auf ein Vielfaches des kanonischen Basisvektors e1 ∈ R` abbilden.
Lemma V.11. Sei x ∈ R` \ {0} und x 6∈ span{e1 } und definiere mit σ =
sign(x1 ) falls x1 6= 0 und σ = 1 sonst
x + σkxk2 e1
v=
x + σkxk2 e1 .
2
Dann gilt
⊥
Pv x = (I` − 2vv )x = −σkxke1 .
Beweis. Siehe Vorlesung.
Bemerkung V.12. Die Einführung von σ vermeidet Auslöschungseffekte.
V.C. QR-Zerlegung. Mit Hilfe von Householder-Transformationen werden
wir schrittweise die ersten Spalten von Teilmatrizen von A auf Vielfache kanonischer Basisvektoren e1 entsprechender Länge transformieren und somit
eine obere Dreiecksstruktur erzeugen.
Satz V.13. Sei A ∈ Rm×n mit m ≥ n und rank A = n. Dann existieren
Q ∈ O(m) und eine verallgemeinerte obere Dreiecksmatrix R ∈ Rm×n , das
heißt es gilt rij = 0 für i > j, so dass


r11 r12 . . . r1n

r22 . . . r2n 



.. 
..

.
. 
A = QR = Q 
.


r
nn




Ferner gilt |rii | > 0 für alle 1 ≤ i ≤ n. Die Faktorisierung heißt QRZerlegung.
Beweis. Siehe Vorlesung.
Bemerkungen V.14. (i) Im Fall m = n ist die Faktorisierung bis auf
Vorzeichen der Diagonaleinträge von R eindeutig bestimmt, denn gilt A =
QR = Q0 R0 , so folgt, dass E = (Q0 )−1 Q = R0 R−1 eine obere Dreiecksmatrix in O(n) ist. Da E −1 eine obere Dreiecksmatrix ist, kann die Identität
E = E −1 jedoch nur dann gelten, wenn E eine Diagonalmatrix mit Diagonalelementen in {±1} ist und damit folgt Q = Q0 E sowie R = ER0 .
(ii) Die Householder-Transformationen werden nicht über Matrix-MatrixMultiplikationen realisiert, denn es gilt mit w = A v
⊥
⊥
⊥
⊥
⊥
Pv A = (Im − 2vv )A = A − 2v(v A) = A − 2vw .
(iii) Die Vektoren vi , i = 1, 2, . . . , n, die die Householder-Transformationen
definieren, lassen sich an den frei werdenden Stellen von A abspeichern,
S. BARTELS, 3.12.2013
4
wobei vi = 0 sei, falls Qi = Im ist. Es gilt ferner
n
Y
Q=
(Im − 2vi vi ).
⊥
i=1
Algorithmus V.15 (QR-Zerlegung). Sei A ∈ Rm×n mit rank A = n. Initialisiere A1 = A und i = 1.
(1) Sei ai ∈ Rm−i+1 die erste Spalte des rechten unteren Blocks Ai ∈
R(m−i+1)×(n−i+1) von A.
(2) Gilt ai = e1 so fahre fort mit (5).
(3) Definiere ve = ai + σkai k2 e1 und v = ve/ke
v k2 .
(4) Ersetze den Block Ai durch Ai − vw mit w = 2Ai v.
(5) Stoppe falls i = n.
(6) Erhöhe i → i + 1 und fahre fort mit (1).
⊥
⊥
Bemerkung V.16. Im i-ten Schritt werden
• 4(m − i + 1) + 4 Operationen zur Berechnung von v,
• (m − i + 2)(n − i + 1) Operationen zur Berechnung von w,
• (m − i)(n − i + 1) Operationen zur Berechnung von Ai − vw
benötigt. Insgesamt ist der Aufwand zur Berechnung der Faktorisierung damit 2mn2 −(2/3)n3 +O(mn). Im Fall m = n ist die Berechnung also doppelt
so teuer wie die der LU -Zerlegung.
⊥
V.D. Lösung des Ausgleichsproblems. Wir verwenden die QR-Zerlegung,
um ein stabiles Verfahren für das Ausgleichsproblem zu konstruieren.
Satz V.17. Sei A ∈ Rm×n mit m ≥ n und rank A = n. Mit der QRZerlegung A = QR sowie
b
c
R
, Q A=R=
Q b=
d
0
⊥
⊥
b ∈ Rn×n ist
mit c ∈ Rn , d ∈ Rm−n und einer oberen Dreiecksmatrix R
die Lösung des durch A und b definierten Ausgleichsproblems gegeben durch
b = c.
Rx
⊥
Beweis. Mit kQzk2 = kzk2 für alle z ∈ Rm und Q Q = Im gilt
2
c
b R
2
2
2
2
b
kb − Axk2 = kQ(Q b − Q Ax)k2 = d − 0 x = kRx − ck2 + kdk2 .
2
⊥
⊥
b regulär. Die rechte Seite wird offensichtlich für
Da rank A = n gilt, ist R
−1
b
x = R c minimal.
Bemerkung V.18. Aus Q ∈ O(n) folgt für reguläre Matrizen A ∈ Rn×n ,
dass cond2 (R) = cond2 (A). Die QR-Zerlegung definiert damit einen stabilen
Algorithmus.

Zugehörige Unterlagen

Numerische Lineare Algebra

V AUSGLEICHSPROBLEME V.A. Gaußsche Normalengleichung. In

Zugehörige Unterlagen

Produkte

Unterstützung

V AUSGLEICHSPROBLEME V.A. Gaußsche Normalengleichung. In

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können