Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung

Vertiefung Lineare Algebra 1
Schriftliche Unterlagen zur Vorlesung
im Wintersemester 2016/17
Franz Pauer
c 2016 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK
KAPITEL 1
Mehr über lineare Funktionen
In diesem Kapitel sei K ein Körper.
§1. Der Graph einer linearen Funktion
Satz 1 : Seien V1 , . . . ,V` Vektorräume über K. Dann wird das kartesische
Produkt
V1 × · · · ×V` = {(x1 , . . . , x` ) | x1 ∈ V1 , . . . , x` ∈ V` }
mit der komponentenweisen Addition
(x1 , . . . , x` ) + (y1 , . . . , y` ) := (x1 + y1 , . . . , x` + y` )
und der komponentenweisen Skalarmultiplikation
c(x1 , . . . , x` ) := (cx1 , . . . , cx` )
mit c ∈ K ein Vektorraum und heißt der Produktraum von V1 , . . . ,V` .
Wenn (v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, dann
ist
((v11 , 0, . . . , 0), . . . , (v1n1 , 0, . . . , 0), . . .
. . . , (0, . . . , 0, v`1 ), . . . , (0, . . . , 0, v`n` ))
eine Basis von V1 × · · · ×V` , insbesondere gilt
dimK (V1 × · · · ×V` ) = dimK (V1 ) + · · · + dimK (V` ) .
Beweis: Es ist leicht zu zeigen, dass V1 × · · · ×V` mit der komponentenweisen Addition und Skalarmultiplikation ein Vektorraum ist.
Wir beweisen daher nur, dass
((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) eine Basis von V1 × · · · ×V` ist. Wir
schreiben x1 ∈ V1 , . . . , x` ∈ V` als Linearkombinationen der Basen
(v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ):
n`
n1
x1 = ∑ d1i v1i , . . . , x` = ∑ d`i v`i .
i=1
i=1
Dann ist
(x1 , . . . , x` ) = (x1 , 0, . . . , 0) + · · · + (0, . . . , 0, x` )
n`
n1
= ∑ d1i (v1i , 0, . . . , 0) + · · · + ∑ d`i (0, . . . , 0, v`i ) ,
i=1
i=1
1
2
1. MEHR ÜBER LINEARE FUNKTIONEN
also ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) ein Erzeugendensystem von
V1 × · · · ×V` . Um die lineare Unabhängigkeit zu zeigen, seien
c11 , . . . , c`n` ∈ K mit
n`
n1
∑ c1i(v1i, 0, . . . , 0) + · · · + ∑ c`i(0, . . . , 0, v`i) = (0, . . . , 0) .
i=1
Dann ist
i=1
n`
n1
( ∑ c1i v1i , . . . , ∑ c`i v`i ) = (0, . . . , 0) ,
i=1
also
n1
i=1
n`
∑ c1iv1i = 0 , . . . , ∑ c`iv`i = 0 .
i=1
i=1
Da (v11 , . . . , v1n` ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, folgt
c11 = · · · = c`n` = 0, was zu zeigen war.
Satz 2 : Es seien V und W Vektorräume über K.
Eine Funktion f : V → W ist genau dann linear, wenn der Graph von f ein
Untervektorraum des Produktraums V ×W ist.
Wenn f linear ist und und (v1 , ..., vn ) eine Basis von V ist, dann hat der
Graph von f die Basis ((v1 , f (v1 )), ..., (vn , f (vn ))). Insbesondere ist
dimK (Graph( f )) = dimK (V ) .
Beweis: Nach Definition ist Graph( f ) = {(v, f (v)) | v ∈ V } ⊂ V ×W . Seien
u, w ∈ V und c ∈ K. Wenn f linear ist, dann ist
0V ×W = (0V , 0W ) = (0V , f (0V )) ∈ Graph( f ),
(u, f (u))+(w, f (w)) = (u+w, f (u)+ f (w)) = (u+w, f (u+w)) ∈ Graph( f )
und
c(w, f (w)) = (cw, c f (w)) = (cw, f (cw)) ∈ Graph( f ),
also Graph( f ) ein Untervektorraum von V ×W . Wenn umgekehrt Graph( f )
ein Untervektorraum von V ×W ist, dann sind
(u, f (u)) + (w, f (w)) = (u + w, f (u) + f (w)) ∈ Graph( f ) und
c(w, f (w)) = (cw, c f (w)) ∈ Graph( f ), somit
f (u + w) = f (u) + f (w) und f (cw) = c f (w), also f linear.
Wenn f linear ist, dann ist auch die Funktion
F : V → Graph( f ) , x 7→ (x, f (x)) ,
linear und hat die Umkehrfunktion Graph( f ) → V , (x, f (x)) 7→ x. Daher ist
F ein Isomorphismus und (F(v1 ), ..., F(vn )) eine Basis von Graph( f ).
Beispiel 3 : Es sei k eine reelle Zahl und f die lineare Funktion
f : R −→ R, z 7−→ kz. Dann ist
Graph(f) = {(z, kz)|z ∈ R} = {z(1, k)|z ∈ R} = R(1, k) ⊆ R × R
3
1. MEHR ÜBER LINEARE FUNKTIONEN
die Gerade durch (0, 0) und (1, k).
Graph( f )
(0, 1)
(1, 0)
(1, k)
Beispiel 4 : Es seien k und d reelle Zahlen und h : R → R , z 7→ kz + d.
Dann ist
Graph(h) = {(z, kz + d)| z ∈ R }
= {z(1, k) + (0, d)| z ∈ R }
eine Gerade in R 2 , aber für d 6= 0 kein Untervektorraum.
(0, d)
(0, 1)
(1, 0)
(1, k)
Graph(h)
4
1. MEHR ÜBER LINEARE FUNKTIONEN
Beispiel 5 : Es seien a, b reelle Zahlen und g die lineare Funktion
g : R2 −→ R, (x, y) 7−→ ax + by. Dann ist
Graph(g) = {(x, y, ax+by) | x, y ∈ R} = {x·(1, 0, a)+y·(0, 1, b) | x, y ∈ R} =
= R(1, 0, a) + R(0, 1, b) ⊆ R2 × R
die Ebene durch (0, 0, 0), (1, 0, a) und (0, 1, b).
(0, 0, 1)
(0, 1, 0)
(1, 0, 0)
(1, 0, a)
(0, 1, b)
R (0, 1, b)
R (1, 0, a)
§2. Bild und Kern einer linearen Funktion
In diesem Abschnitt seien V und W Vektorräume über K und
f : V −→ W eine lineare Funktion.
Definition 6 : Die Menge
Bild( f ) := { f (v) | v ∈ V } ⊆ W
heißt Bild von f und die Menge
Kern( f ) := {v ∈ V | f (v) = 0W } ⊆ V
heißt Kern von f .
5
1. MEHR ÜBER LINEARE FUNKTIONEN
Satz 7 : Bild( f ) ist ein Untervektorraum von W , Kern( f ) ist ein Untervektorraum von V .
Die Dimension des Bildes von f heißt Rang von f (Schreibweise rg( f )).
Bild( f )
Kern( f )
f
0V
0W
W
V
Beweis: Da f linear ist, ist 0V ∈ Kern( f ). Für u, v ∈ Kern( f ) und c ∈ K folgt
aus f (u + v) = f (u) + f (v) = 0W auch u + v ∈ Kern( f ), sowie aus f (cu) =
c f (u) = 0W auch cu ∈ Kern( f ). Daher ist Kern( f ) ein Untervektorraum von
V . Analog zeigt man, dass Bild( f ) ein Untervektorraum von W ist.
Satz 8 : Sei A ∈ K m×n und L(A, 0) := {x ∈ K n×1 | Ax = 0} der Lösungsraum des durch A definierten Systems homogener linearer Gleichungen.
Fasst man die Matrix A als lineare Funktion
A : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist Kern(A) = L(A, 0) und Bild(A) = K hA−1 , . . . , A−n i, der Spaltenraum von A.
Beweis: Es ist Kern(A) = {x ∈ K n×1 | Ax = 0} = L(A, 0) und Bild(A) =
= { Ax | x ∈ K n×1 } = { ∑ni=1 xi A−i | x1 , . . . xn ∈ K } = K hA−1 , . . . , A−n i.
Satz 9 : Seien V,W endlich-dimensionale Vektorräume über K,
f : V → W eine K-lineare Funktion und r := rg( f ). Dann gibt es eine Basis
(v1 , . . . , vn ) von V so, dass
(1) ( f (v1 ), . . . , f (vr )) eine Basis von Bild( f ) und
(2) (vr+1 , . . . , vn ) eine Basis von Kern( f )
ist. Insbesondere gilt
dimK (V ) = dimK (Bild( f )) + dimK (Kern( f )) .
6
1. MEHR ÜBER LINEARE FUNKTIONEN
Ergänzt man die Basis ( f (v1 ), . . . , f (vr )) von Bild( f ) zu einer Basis
(w1 , . . . , wm ) von W , dann ist


1 0 ...
 .. ..

.
.
0

. .


 ∈ K m×n
Dr :=  .. . . 1



0


...
(nur an den Stellen (1, 1), . . . , (r, r) stehen Einsen und sonst Nullen) die Matrix von f bezüglich der Basen (v1 , . . . , vn ) und (w1 , . . . , wm ).
Beweis: Sei (w1 , . . . , wr ) eine Basis von Bild( f ). Dann kann man Urbilder
v1 , . . . , vr ∈ V von w1 , . . . , wr unter f wählen. Sei (u1 , . . . , us ) eine Basis von
Kern( f ). Dann ist
(v1 , . . . , vr , u1 , . . . , us )
ein Erzeugendensystem von V , weil für y ∈ V aus
r
r
r
f (y) = ∑ ai wi = ∑ ai f (vi ) = f ( ∑ ai vi )
i=1
i=1
i=1
r
folgt, dass z := y − ∑i=1 ai vi ∈ Kern( f ) ist. Daher ist y
Linearkombination von (v1 , . . . , vr , u1 , . . . , us ).
= z + ∑ri=1 ai vi eine
Wir zeigen noch, dass (v1 , . . . , vr , u1 , . . . , us ) linear unabhängig ist. Seien
dazu c1 , . . . , cr , d1 , . . . , ds ∈ K mit
r
s
∑ civi + ∑ d j u j = 0 .
i=1
j=1
f (∑ri=1 ci vi + ∑sj=1 d j u j ) = ∑ri=1 ci f (vi ) = ∑ri=1 ci wi .
Dann ist 0 =
Da (w1 , . . . , wr ) linear unabhängig ist, sind alle ci gleich 0. Dann ist
∑sj=1 d j u j = 0, und aus der linearen Unabhängigkeit von u1 , . . . , us folgt
d1 = · · · = ds = 0. Also ist (v1 , . . . , vr , u1 , . . . , us ) die gesuchte Basis von V .
Insbesondere ist r + s = n.
Beispiel 10 :V = W
1 −1

1
−1
wobei A :=
0 0
=
R 3×1 ,
1
2 .
3

f : R 3×1 → R 3×1 ,
 
 
1
1




1
Eine Basis von Bild( f ): w1 :=
, w2 := 2.
0
3
 
1

Eine Basis von Kern( f ): v3 := 1.
0
x 7→ Ax,
7
1. MEHR ÜBER LINEARE FUNKTIONEN
 
 
 
1
0
1
Eine Basis des Definitionsbereichs: v := v1 := 0 , v2 := 0 , v3 = 1.
0
1
0

 
0
Eine Basis des Bildbereichs: w := w1 , w2 , w3 := 0.
1

f (v1 ) = w1 ,
f (v2 ) = w2 ,
f (v3 ) = 0, also:

1 0

M( f , v, w) = 0 1
0 0

0
0 .
0
§3. Systeme linearer Gleichungen in koordinatenfreier Form
Definition 11 : Ein System linearer Gleichungen in koordinatenfreier Form
ist eine Aufgabe:
• Gegeben sind eine lineare Funktion f : V → W und ein Vektor y ∈ W .
• Gesucht ist eine gute Beschreibung“ der Menge
”
L( f , y) := f −1 ({y}) = {x ∈ V | f (x) = y}
aller Vektoren x ∈ V , für die f (x) = y ist.
Die Menge L( f , y) heißt Lösungsmenge des durch f und y gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems.
Das durch f und y gegebene System linearer Gleichungen heißt homogen, wenn y = 0W ist, ansonsten inhomogen. Die Lösungsmenge eines
homogenen Systems linearer Gleichungen ist
L( f , 0) = Kern( f ) .
Beispiel 12 : Die Aufgabe Finde eine quadratische Funktion g : R → R
”
mit g(1) = 3, g(−1) = 2 und g(5) = 1“ ist ein System linearer Gleichungen
in koordinatenfreier Form.
Gesucht ist g ∈ V := {h : R → R | h Polynomfunktion deren Grad ≤ 2 ist}
mit f (g) = (3, 2, 1) ∈ R 3×1 , dabei ist f : V → R 3 die Auswertungsfunkti”
on (in 1, −1 und 5)“ mit f (h) = (h(1), h(−1), h(5)).
Satz 13 : Sei f : V → W K-linear, y ∈ W und z ∈ L( f , y) (insbesondere ist
L( f , y) nicht leer). Dann ist
L( f , y) = z + Kern( f )
ein affiner Unterraum von V mit Aufpunkt z und parallelem Untervektorraum Kern( f ).
Das durch f und y gegebene System lösen“bedeutet daher: finde
”
8
1. MEHR ÜBER LINEARE FUNKTIONEN
(irgend)ein Urbild z von y unter f und (irgend)eine Basis von Kern( f ).
Falls V endlichdimensional ist, gilt weiters
dimK (L( f , y)) = dimK (V ) − rg( f ) .
Beweis: Sei v ∈ Kern( f ). Dann ist f (z + v) = f (z) + f (v) = y + 0 = y, also
z + v ∈ L( f , y).
Sei x ∈ L( f , y). Dann ist f (x − z) = f (x) − f (z) = y − y = 0, also x − z ∈
Kern( f ) und x = z + (x − z) ∈ {z + v | v ∈ Kern( f )}.
Nach Satz 9 ist dimK (Kern( f )) = dimK (V ) − rg( f ) .
Beispiel 14 : Fasst man eine Matrix A ∈ K m×n als eine lineare Funktion
f : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist L( f , y) = L(A, y).
Beispiel 15 : Sei C( R , R ) := { f | f : R → R stetig},
C1 ( R , R ) := { f | f : R → R stetig differenzierbar} und
D : C1 ( R , R ) → C( R , R ) , f 7→ f 0 ,
wobei f 0 die Ableitung der Funktion f bezeichnet. Dann sind C( R , R )
und C1 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D ist R -linear. Der Unterraum Kern(D)
besteht aus allen konstanten Funktionen. Eine Funktion f ∈ C1 ( R , R ) heißt
Stammfunktion von g ∈ C( R , R ), wenn D f = g ist. Wenn f eine Stammfunktion von g ist, dann ist die Menge aller Stammfunktionen von g
L(D, g) = f + Kern(D).
Beispiel 16 : Sei C( R , R ) := { f | f : R → R stetig},
C2 ( R , R ) := { f | f : R → R 2-mal stetig differenzierbar}, a, b ∈ R und
D2 + aD + b : C1 ( R , R ) → C( R , R ) , f 7→ f 00 + a f 0 + b f ,
wobei f 00 die zweite Ableitung der Funktion f bezeichnet. Dann sind C( R , R )
und C2 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D2 + aD + b ist R -linear. Den Unterraum Kern(D2 + aD + b) nennt man die Lösungsmenge der homogenen linearen Differentialgleichung y00 + ay0 + by = 0.
Wenn f ∈ L(D2 + aD + b, g) ist, dann ist
L(D2 + aD + b, g) = f + Kern(D2 + aD + b).
9
1. MEHR ÜBER LINEARE FUNKTIONEN
Definition 17 : Es sei V ein Vektorraum v = (v1 , . . . , vn ) eine Basis von V
und c ∈ K n×1 eine Spalte mit n Zeilen.
Wir verwenden im Weiteren die Schreibweise
n
vc := ∑ ci vi .
i=1
Satz 18 : Seien V,W Vektorräume über K der Dimensionen n, m mit Basen
v , w , sei f : V → W K-linear mit Matrix
A := M( f , v, w) ∈ K m×n
und y = wb ∈ W . Dann bildet der Koordinaten-Isomorphismus
V → K n×1 , vc 7→ c ,
L( f , y) auf L(A, b) ab und Kern( f ) auf L(A, 0).
Beweis: Es ist vc ∈ L( f , y) genau dann wenn w(Ac) = wb, also c ∈ L(A, b)
ist.
Nach Satz 18 kann für f : V → W und y ∈ W das System linearer Gleichungen ( f , y) wie folgt gelöst werden:
(1) Wähle Basen v , w von V,W .
(2) Berechne die Matrix A := M( f , v, w) und die Koordinatenspalte b
von y bezüglich w .
(3) Berechne die Lösungsmenge L(A, b).
Wenn L(A, b) leer ist, dann ist auch L( f , y) leer.
Wenn z ∈ L(A, b) und (u1 , . . . , us ) eine Basis von L(A, 0) ist, dann ist
vz ∈ L( f , y) und (vu1 , . . . , vus ) eine Basis von Kern( f ).
Im Schulunterricht entsprechen Systeme linearer Gleichungen in koordinatenfreier Form gewissen Textaufgaben“.
”
Beispiel 19 : ( Interpolation von 3 gegebenen Funktionswerten durch Po”
lynomfunktionen, deren Grad höchstens 4 ist“.)Wir bezeichnen mit x die
identische Funktion von R nach R und mit 1 die konstante Funktion, die jede reelle Zahl auf 1 abbildet. Man kann zeigen, dass die Potenzfunktionen
1, x, x2 , x3 , x4 linear unabhängig sind. Es sei V der von diesen erzeugte Untervektorraum des Vektorraums aller Polynomfunktionen. Wir suchen alle
Polynomfunktionen p ∈ V mit
p(−1) = 2, p(1) = 1
und
p(2) = 1 .
Sei W := R 3 ,
f : V −→ W , q 7−→ (q(−1), q(1), q(2)) ,
10
1. MEHR ÜBER LINEARE FUNKTIONEN
und y := (2, 1, 1) ∈ W . Die Funktion f ist linear.
Wir wählen die Basis v := (1, x, x2 , x3 , x4 ) von V und die Standardbasis
w := (e1 , e2 , e3 ) von W = R 3 . Dann ist

 

2
1 −1 1 −1 1
A := M( f , v, w) := 1 1 1 1 1  und b := 1 .
1
1 2 4 8 16
Man berechnet mit dem Gauß-Verfahren
 4 
 
 
−2
−4
3
− 1 
1
0
 2
 
 
1 + R  2 + R  5  .
L(A, b) = 
 6 
 
 
 0 
−1
0
0
−1
0
Daher ist
1
4 1
L( f , y) = { − x + x2 +
3 2
6
+c(−2 + x + 2x2 − x3 ) + d(−4 + 5x2 − x4 ) | c, d ∈ R } .
KAPITEL 2
Interpolation und Regression
§1. Interpolationsaufgaben
Wir betrachten die folgenden Interpolationsaufgaben:
Gegeben sind
•
•
•
•
ganze Zahlen m ≥ 2 und n ≥ 1,
Funktionen f1 , . . . , fn von R nach R,
paarweise verschiedene reelle Zahlen x1 , . . . , xm ∈ R und
reelle Zahlen y1 , . . . , ym ∈ R.
Gesucht sind reelle Zahlen c1 , . . . , cn so, dass die Funktion f := ∑ni=1 ci fi
die Bedingungen
f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xm ) = ym
erfüllt.
y3
y2
y1
x2
x1
y4
x4
x3
Durch die Funktionen f1 , . . . , fn wird der Typ“ der Interpolationsaufga”
be vorgegeben. Die reellen Zahlen x1 , . . . , xm heißen Stützstellen, die reellen
Zahlen y1 , . . . , ym (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion.
Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die
Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind.
Anders formuliert: Wir suchen Zahlen c1 , . . . , cn so, dass
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fn (x1 )cn
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fn (x2 )cn
..
.
f1 (xm )c1 + f2 (xm )c2 + . . . + fn (xm )cn
11
= y1
= y2
.. ..
. .
= ym
12
2. INTERPOLATION UND REGRESSION
ist. Das ist ein System von m linearen Gleichungen mit n Unbekannten
c1 , . . . , cn . In Matrizenform:

    
f1 (x1 ) . . . fn (x1 )
c1
y1
 f1 (x2 ) . . . fn (x2 )  c2   y2 
 .
· .  =  .  .
..
.. 
 ..
.
.   ..   .. 
f1 (xm ) . . . fn (xm )
cn
ym
 
y1
 y2 

eine Lösung existiert genau dann, wenn 
 ...  ein Element des von
ym
f1 (x1 )
fn (x1 )
 f1 (x2 ) 
 fn (x2 ) 
 .  , . . . ,  .  erzeugten Vektorraums ist.
 .. 
 .. 


f1 (xm )


fn (xm )
Beispiel 20 : ( Lineare Interpolation“).
”
Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die
Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich
selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit
( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n .
Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften
c1 + c2 x1 = y1
..
.. ..
.
. .
c1 + c2 xm = ym
zu finden, ist ein System von m linearen Gleichungen mit zwei Unbekannten. In Matrizenform


 
1 x1
y1
1 x2  c1
 y2 
. . ·
 
 .. ..  c2 =  ...  .
1 xm
ym
Beispiel 21 : (Interpolation durch Polynomfunktionen).
Für 1 ≤ i ≤ n sei fi : R −→ R, z 7−→ zi−1 , die (i − 1)-te Potenzfunktion.
Dann ist die gesuchte Funktion f eine Polynomfunktion
f : R −→ R, z 7−→ c1 + c2 z + . . . + cn zn−1 .
Wir suchen reelle Zahlen c1 , c2 , . . . , cn mit der Eigenschaft, dass
c1 + x1 c2 + . . . + x1n−1 cn = y1
..
.. ..
.
. .
n−1 c
c1 + xm c2 + . . . + xm
=
ym
n
13
2. INTERPOLATION UND REGRESSION
ist, müssen also ein System von m Gleichungen mit n Unbekannten lösen.
In Matrizenform:

    
1 x1 . . . x1n−1
c1
y1
1 x . . . xn−1  c2   y2 
2

2   
· . = .  .
 .. ..
..
.. 
. .
.
.   ..   .. 
n−1
cn
ym
1 xm . . . xm
Ist m = n = 3 ( Interpolation durch eine quadratische Funktion für drei
”
Stützstellen“), dann hat diese Interpolationsaufgabe für jede Vorgabe von
y1 , y2 , y3 genau eine Lösung, weil die Matrix


1 x1 x12




1 x2 x2 
2



2
1 x3 x3
invertierbar ist (ihre Determinante ist (x1 − x2 )(x2 − x3 )(x3 − x1 )).
§2. Systeme linearer Gleichungen ohne Lösung und Regression
Es seien A ∈ Rm×n und b ∈ Rm×1 . Das durch A und b gegebene System linearer Gleichungen hat genau dann eine Lösung, wenn es eine Spalte
c ∈ Rn×1 mit A · c = b , also ∑ni=1 ci A−i = b, gibt. Das ist genau dann der
Fall, wenn b ein Element des Spaltenraumes von A ist. Wir bezeichnen den
Spaltenraum von A mit U, dieser ist ein Untervektorraum von Rm×1 . Wenn
b nicht in U liegt, gibt es keine Lösung.
Ist man der Meinung, dass es eine Lösung geben sollte, aber vielleicht
b nicht exakt bestimmt wurde (z.B. durch Runden oder durch Messfehler),
kann man b durch b0 ∈ U so ersetzen, dass der Abstand von b zu b0 möglichst
klein ist. Wählen wir den durch das Standardskalarprodukt auf Rm×1 definierten Abstand, bedeutet das, dass
m
kb − b0 k2 = ∑ (bi − b0i )2
i=1
( die Summe der Fehlerquadrate“) möglichst klein sein soll. (Für positive
”
reelle Zahlen r und s ist r ≤ s genau dann, wenn r2 ≤ s2 ist. Somit ist der
Abstand von b zu b0 genau dann minimal, wenn sein Quadrat minimal ist).
Für b0 muss daher der Fußpunkt des Lotes von b auf den Untervektorraum
U gewählt werden und dann das Gleichungssystem A · z = b0 anstatt von
A · z = b gelöst werden.
Hat man das Gleichungssystem durch eine Interpolationsaufgabe wie
im vorigen Abschnitt erhalten und gibt es keine Lösung (also keine interpolierende Funktion des vorgegebenen Typs), dann nennt man die Vorgangsweise wie oben Regression“.
”
14
2. INTERPOLATION UND REGRESSION
U
0
b
b0
Mit den Bezeichnungen des vorigen Abschnittes ist Ai j = f j (xi ) und
bi = yi , 1 ≤ i ≤ m, 1 ≤ j ≤ n. Für die gesuchte Funktion f = ∑ni=1 ci fi soll
f (xi ) = b0i = y0i , 1 ≤ i ≤ m, sein, also der Abstand
k( f (x1 ), f (x2 ), . . . , f (xm ))T − (y1 , . . . , ym )T k
von der Spalte der berechneten Funktionswerte“ zur Spalte der gemesse”
”
nen Funktionswerte“ möglichst klein sein. Falls auf R m×1 das Standardskalarprodukt gewählt wurde, ist
m
k( f (x1 ), . . . , f (xm ))T − (y1 , . . . , ym )T k2 = ∑ ( f (xi ) − yi )2
i=1
die Summe der Fehlerquadrate“.
”
Bei linearer Interpolation“ ist U die von
”
 
 
1
x1
.
1 :=  ..  und x :=  ... 
1
xm
erzeugte Ebene in Rm×1 . Wir verwenden die Bezeichnungen
 
y1
y :=  ...  und y0 := Fußpunkt des Lotes von y auf U .
ym
y
1
c1 1
0
x
y0
c2 x
15
2. INTERPOLATION UND REGRESSION
Wir berechnen nun y0 :
• y0 = c2 x + c1 1 ∈ U und
• die Gerade durch y und y0 steht normal auf der von x und 1 erzeugten
Ebene U.
Also ist
• hc2 x + c1 1 − y, xi = 0 und
• hc2 x + c1 1 − y, 1i = 0.
Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 :
• c2 hx, xi + c1 h1, xi = hx, yi
• c2 hx, 1i + c1 h1, 1i = h1, yi
Als Lösung erhalten wir
h1, 1i · hx, yi − h1, xi · h1, yi
hx, xi · h1, yi − h1, xi · hx, yi
c2 =
und c1 =
.
2
h1, 1i · hx, xi − h1, xi
h1, 1i · hx, xi − h1, xi2
Der Divisor h1, 1i · hx, xi − h1, xi2 ist nach der Cauchy-Schwarzschen Ungleichung nicht 0. Denn: h1, xi2 = h1, 1i · hx, xi nur dann, wenn x ein Vielfaches von 1 ist, d.h.: x1 = x2 = . . . = xm , was wegen der Annahmen m > 1“
”
und xi paarweise verschieden“ nicht möglich ist. Wenn h−, −i das Standard”
m
m
Skalarprodukt ist, dann ist hx, yi = ∑m
i=1 xi yi , h1, xi = ∑i=1 xi , h1, yi = ∑i=1 yi ,
m
2
2
h1, 1i = m, hx, xi = ∑m
i=1 xi und hy, yi = ∑i=1 yi , daher
c2 =
und
c1 =
m
m
m ∑m
i=1 xi yi − (∑i=1 xi )(∑i=1 yi )
m
2
2
m ∑m
i=1 xi − (∑i=1 xi )
m
m
m
2
(∑m
i=1 xi )(∑i=1 yi ) − (∑i=1 xi )(∑i=1 xi yi )
.
m
2
2
n ∑m
i=1 xi − (∑i=1 xi )
Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt,
dass der (euklidische) Abstand vom m-Tupel der gegebenen (gemessenen
oder gerundeten) ungenauen Funktionswerte (y1 , . . . , ym ) zum m-Tupel der
berechneten Funktionswerte ( f (x1 ), . . . , f (xm )) möglichst klein ist, also
2
∑m
i=1 (yi − (c2 xi + c1 )) möglichst klein ist. Der Graph dieser Funktion heißt
Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xm , ym ).
Man rechnet leicht nach, dass
1 m
1 m
f ( ∑ xi ) = ∑ yi
m i=1
m i=1
ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xm ) und (y1 , . . . , ym ) liegt
also immer auf der Regressionsgeraden.
KAPITEL 3
Mehr über Geometrie
§1. Strahlensatz
Satz 22 : ( Strahlensatz“)
”
Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann
gibt es c, d ∈ K \ {0} so, dass
v2 = cv1
und
w2 = dw1
ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1
bzw. v2 und w2 . Dann gilt:
(1) L1 und L2 sind genau dann parallel, wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ).
Z1
v2
v1
0
w1
L1
w2
Z2
L2
Beweis:
(1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw.
K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die
Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau
dann gleich K(cv1 − dw1 ), wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, ist c = d und
v2 − w2 = cv1 − cw1 = c(v1 − w1 ) .
16
17
3. MEHR ÜBER GEOMETRIE
Satz 23 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 +
U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist
Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0.
/
Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer
ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 .
§2. Affine Hülle
Es sei K ein Körper und V ein Vektorraum über K.
Definition 24 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination
von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I .
Beispiel 25 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt,
wenn v1 = v2 ist, bzw. die Gerade
{c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K},
wenn v1 6= v2 ist.
Satz 26 :
(1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche
Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten.
(2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum
von V . Der dazu parallele Untervektorraum wird von
(vi − v j )i∈I, i6= j erzeugt, wobei j ∈ I beliebig gewählt werden kann.
(3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält.
Beweis:
(1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine
Familie in K mit ∑i∈I ci = 1. Zu vi gibt es ui ∈ U so, dass vi = p + ui ,
i ∈ I. Dann ist
∑ civi = ∑ ci(p + ui) = (∑ ci)p + ∑ ciui = p + ∑ ciui ∈ M .
i∈I
i∈I
i∈I
i∈I
(2) Sei j ∈ I und
M := v j + K hvi − v j ; i ∈ I, i 6= ji.
i∈I
18
3. MEHR ÜBER GEOMETRIE
Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle
in M enthalten.
Sei umgekehrt (di )i∈I eine Familie in K.
Dann ist




v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di  v j
i∈I
i6= j
i∈I
i6= j
i∈I
i6= j
eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element
von M in der affinen Hülle von (vi )i∈I enthalten.
(3) Folgt aus (1) und (2).
Definition 27 : Affine Unterräume von V heißen kollinear bzw. koplanar,
wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind.
Satz 28 :
(1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind.
(2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die
Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind.
(3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar,
wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind.
Beweis: Die ersten zwei Aussagen folgen aus Satz 26, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von
p1 − p2 , v1 und v2 erzeugt.
 
 
 
1
2
−1
Beispiel 29 : Sind die Vektoren v1 := 0 , v2 := 2 , v3 :=  1 
1
3
0
 
1
und v4 := 2 ∈ R 3×1 koplanar?
3
 
 
 
1
−2
0
Es ist v2 − v1 = 2 , v3 − v1 =  1  , v4 − v1 = 2 .
2
−1
2


1 −2 0

Wegen det 2 1 2 = 4 6= 0 sind v2 − v1 , v3 − v1 , v4 − v1 linear un2 −1 2
abhängig, nach Satz 28 also v1 , v2 , v3 , v4 nicht koplanar.
19
3. MEHR ÜBER GEOMETRIE
Satz 30 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel.
Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 =
{0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist
M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }.
§3. Polytope und Schwerpunkte
Es seien K = Q oder R und V ein Vektorraum über K.
Definition 31 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V.
Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I
on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist.
i∈I
Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe
Hülle von (vi )i∈I .
Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 .
v2
v1
Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck
mit Eckpunkten v1 , v2 , v3 .
v3
v2
v1
20
3. MEHR ÜBER GEOMETRIE
Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer
endlichen Familie in V ist.
Es sei I := {1, . . . , n} , c1 , . . . , cn ∈ R ≥0 und ∑ ci = 1. Für cn 6= 1 ist
i∈I
!
ci
∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn ,
i=1
i=1
n
n−1
ci
wobei w := ∑n−1
i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt.
Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H.
v3
u = c1 v1 + c2 v2 + c3 v3
= (c1 + c2 )w + c3 v3
u
v1
c1
c2
c1 +c2 v1 + c1 +c2 v2
=: w
v2
Beispiel 32 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie
ein abgeschlossenes Intervall ist.
Satz 33 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und
(vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten.
Beweis: Für allei ∈ I ist der Vektor vi eine konvexe Linearkombination
∑ c ji w j von w j j∈J .
j∈J
21
3. MEHR ÜBER GEOMETRIE
Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist
i∈I
!
∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji
i∈I
i∈I j∈J
j∈J
mit ∑ di c ji ≥ 0, für alle j ∈ J, und
i∈I
!
∑ ∑ dic ji
j∈J
i∈I
= ∑ di
i∈I
wj
i∈I
!
= ∑ di = 1 .
∑ c ji
j∈J
i∈I
Daher ist ∑ di vi ∈ P .
i∈I
Definition 34 : Es sei (vi )i∈I eine endliche Familie in V .
Der Schwerpunkt von (vi )i∈I ist
1
vi .
# (I) ∑
i∈I
Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1
und v2 .
Satz 35 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade
durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen
zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u
bzw. v bzw. w.
Die drei Schwerlinien sind paarweise verschieden und schneiden einander
im Schwerpunkt 13 (u + v + w) von (u, v, w) .
w
1
2 (u + w)
1
2 (v + w)
u
1
2 (u + v)
v
Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 28 die Vektoren v − u
und w − u linear unabhängig. Also sind auch
1
1
1
v − u und
(v − u) + (w − u) = (v + w) − u
2
2
2
22
3. MEHR ÜBER GEOMETRIE
linear unabhängig, nach Satz 28 sind daher u, v, 12 (v + w) nicht kollinear.
Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben
höchstens einen Schnittpunkt. Wegen
1
2 1
1
2 1
1
(u + v + w) = u +
(v + w) = v +
(u + w) =
3
3
3 2
3
3 2
1
2 1
= w+
(u + v)
3
3 2
liegt der Schwerpunkt auf allen Schwerlinien.
§4. Affine Räume
Definition 36 : Es seien (G, ?) eine Gruppe mit neutralem Element e und
M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt:
für alle m ∈ M ist e · m = m und
für alle s,t ∈ G und alle m ∈ M ist (s ? t) · m = s · (t · m).
Beispiel 37 : Die Funktion
Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) ,
ist eine Operation der Permutationsgruppe Sn auf der Menge
{1, 2, . . . , n}.
Definition 38 : Sei V ein Vektorraum über einem Körper K, A eine Menge
und
V × A → A , (v, a) 7→ v · a ,
eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist
0 · a = a und (v + w) · a = v · (w · a).
A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für
alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b.
Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des
affinen Raums.
Satz 39 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion
V −→ A , v 7−→ v · a ,
ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek”
torraum betrachtet werden).
Beweis: Folgt aus der Definition.
23
3. MEHR ÜBER GEOMETRIE
Beispiel 40 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von
V . Dann ist der affine Unterraum p +U mit
U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) ,
ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner
Raum (über sich selbst).
Beispiel 41 : Sie E die Zeichenebene oder der Anschauungsraum und T (E)
der Vektorraum der Translationen von E. Dann ist E mit
T (E) × E −→ E , (t, x) 7−→ t(x) ,
ein affiner Raum über T (E).
Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man
”
sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E)
und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert
werden, aber Vektoren können addiert werden und auf Punkten wirken“.
”
Sind P und Q Punkte von E und P 6= Q, dann gibt es genau eine Trans~ bezeichnet.
lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ
Q
~
Graph(PQ)
P
Die Menge
~ |t ∈ R } ⊆ T (E)
{t PQ
~ in T (E). Die Gerade durch P und
ist die Gerade durch 0T (E) = idE und PQ
”
Q in E“ ist dann als
~
{(t PQ)(P)
|t ∈ R } ⊆ E
~
~
definiert. Wegen (PQ)(P)
= Q und (0 · PQ)(P)
= idE (P) = P sind P und
~
Q Punkte dieser Geraden. Die Translation PQ wird als Richtungsvektor“
”
dieser Geraden bezeichnet.
~
Gerade durch 0T (E) und PQ
im Vektorraum T (E)
~
2PQ
~
(−PQ)(P)
P
Q
~
PQ
0T (E) = idE
~
−PQ
Gerade durch
P und Q in E
~
~
(2PQ)(P)
= PQ(Q)