Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung

Werbung
Vertiefung Lineare Algebra 1
Schriftliche Unterlagen zur Vorlesung
im Wintersemester 2016/17
Franz Pauer
c 2016 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK
KAPITEL 1
Mehr über lineare Funktionen
In diesem Kapitel sei K ein Körper.
§1. Der Graph einer linearen Funktion
Satz 1 : Seien V1 , . . . ,V` Vektorräume über K. Dann wird das kartesische
Produkt
V1 × · · · ×V` = {(x1 , . . . , x` ) | x1 ∈ V1 , . . . , x` ∈ V` }
mit der komponentenweisen Addition
(x1 , . . . , x` ) + (y1 , . . . , y` ) := (x1 + y1 , . . . , x` + y` )
und der komponentenweisen Skalarmultiplikation
c(x1 , . . . , x` ) := (cx1 , . . . , cx` )
mit c ∈ K ein Vektorraum und heißt der Produktraum von V1 , . . . ,V` .
Wenn (v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, dann
ist
((v11 , 0, . . . , 0), . . . , (v1n1 , 0, . . . , 0), . . .
. . . , (0, . . . , 0, v`1 ), . . . , (0, . . . , 0, v`n` ))
eine Basis von V1 × · · · ×V` , insbesondere gilt
dimK (V1 × · · · ×V` ) = dimK (V1 ) + · · · + dimK (V` ) .
Beweis: Es ist leicht zu zeigen, dass V1 × · · · ×V` mit der komponentenweisen Addition und Skalarmultiplikation ein Vektorraum ist.
Wir beweisen daher nur, dass
((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) eine Basis von V1 × · · · ×V` ist. Wir
schreiben x1 ∈ V1 , . . . , x` ∈ V` als Linearkombinationen der Basen
(v11 , . . . , v1n1 ), . . . , (v`1 , . . . , v`n` ):
n`
n1
x1 = ∑ d1i v1i , . . . , x` = ∑ d`i v`i .
i=1
i=1
Dann ist
(x1 , . . . , x` ) = (x1 , 0, . . . , 0) + · · · + (0, . . . , 0, x` )
n`
n1
= ∑ d1i (v1i , 0, . . . , 0) + · · · + ∑ d`i (0, . . . , 0, v`i ) ,
i=1
i=1
1
2
1. MEHR ÜBER LINEARE FUNKTIONEN
also ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, v`n` )) ein Erzeugendensystem von
V1 × · · · ×V` . Um die lineare Unabhängigkeit zu zeigen, seien
c11 , . . . , c`n` ∈ K mit
n`
n1
∑ c1i(v1i, 0, . . . , 0) + · · · + ∑ c`i(0, . . . , 0, v`i) = (0, . . . , 0) .
i=1
Dann ist
i=1
n`
n1
( ∑ c1i v1i , . . . , ∑ c`i v`i ) = (0, . . . , 0) ,
i=1
also
n1
i=1
n`
∑ c1iv1i = 0 , . . . , ∑ c`iv`i = 0 .
i=1
i=1
Da (v11 , . . . , v1n` ), . . . , (v`1 , . . . , v`n` ) Basen von V1 , . . . ,V` sind, folgt
c11 = · · · = c`n` = 0, was zu zeigen war.
Satz 2 : Es seien V und W Vektorräume über K.
Eine Funktion f : V → W ist genau dann linear, wenn der Graph von f ein
Untervektorraum des Produktraums V ×W ist.
Wenn f linear ist und und (v1 , ..., vn ) eine Basis von V ist, dann hat der
Graph von f die Basis ((v1 , f (v1 )), ..., (vn , f (vn ))). Insbesondere ist
dimK (Graph( f )) = dimK (V ) .
Beweis: Nach Definition ist Graph( f ) = {(v, f (v)) | v ∈ V } ⊂ V ×W . Seien
u, w ∈ V und c ∈ K. Wenn f linear ist, dann ist
0V ×W = (0V , 0W ) = (0V , f (0V )) ∈ Graph( f ),
(u, f (u))+(w, f (w)) = (u+w, f (u)+ f (w)) = (u+w, f (u+w)) ∈ Graph( f )
und
c(w, f (w)) = (cw, c f (w)) = (cw, f (cw)) ∈ Graph( f ),
also Graph( f ) ein Untervektorraum von V ×W . Wenn umgekehrt Graph( f )
ein Untervektorraum von V ×W ist, dann sind
(u, f (u)) + (w, f (w)) = (u + w, f (u) + f (w)) ∈ Graph( f ) und
c(w, f (w)) = (cw, c f (w)) ∈ Graph( f ), somit
f (u + w) = f (u) + f (w) und f (cw) = c f (w), also f linear.
Wenn f linear ist, dann ist auch die Funktion
F : V → Graph( f ) , x 7→ (x, f (x)) ,
linear und hat die Umkehrfunktion Graph( f ) → V , (x, f (x)) 7→ x. Daher ist
F ein Isomorphismus und (F(v1 ), ..., F(vn )) eine Basis von Graph( f ).
Beispiel 3 : Es sei k eine reelle Zahl und f die lineare Funktion
f : R −→ R, z 7−→ kz. Dann ist
Graph(f) = {(z, kz)|z ∈ R} = {z(1, k)|z ∈ R} = R(1, k) ⊆ R × R
3
1. MEHR ÜBER LINEARE FUNKTIONEN
die Gerade durch (0, 0) und (1, k).
Graph( f )
(0, 1)
(1, 0)
(1, k)
Beispiel 4 : Es seien k und d reelle Zahlen und h : R → R , z 7→ kz + d.
Dann ist
Graph(h) = {(z, kz + d)| z ∈ R }
= {z(1, k) + (0, d)| z ∈ R }
eine Gerade in R 2 , aber für d 6= 0 kein Untervektorraum.
(0, d)
(0, 1)
(1, 0)
(1, k)
Graph(h)
4
1. MEHR ÜBER LINEARE FUNKTIONEN
Beispiel 5 : Es seien a, b reelle Zahlen und g die lineare Funktion
g : R2 −→ R, (x, y) 7−→ ax + by. Dann ist
Graph(g) = {(x, y, ax+by) | x, y ∈ R} = {x·(1, 0, a)+y·(0, 1, b) | x, y ∈ R} =
= R(1, 0, a) + R(0, 1, b) ⊆ R2 × R
die Ebene durch (0, 0, 0), (1, 0, a) und (0, 1, b).
(0, 0, 1)
(0, 1, 0)
(1, 0, 0)
(1, 0, a)
(0, 1, b)
R (0, 1, b)
R (1, 0, a)
§2. Bild und Kern einer linearen Funktion
In diesem Abschnitt seien V und W Vektorräume über K und
f : V −→ W eine lineare Funktion.
Definition 6 : Die Menge
Bild( f ) := { f (v) | v ∈ V } ⊆ W
heißt Bild von f und die Menge
Kern( f ) := {v ∈ V | f (v) = 0W } ⊆ V
heißt Kern von f .
5
1. MEHR ÜBER LINEARE FUNKTIONEN
Satz 7 : Bild( f ) ist ein Untervektorraum von W , Kern( f ) ist ein Untervektorraum von V .
Die Dimension des Bildes von f heißt Rang von f (Schreibweise rg( f )).
Bild( f )
Kern( f )
f
0V
0W
W
V
Beweis: Da f linear ist, ist 0V ∈ Kern( f ). Für u, v ∈ Kern( f ) und c ∈ K folgt
aus f (u + v) = f (u) + f (v) = 0W auch u + v ∈ Kern( f ), sowie aus f (cu) =
c f (u) = 0W auch cu ∈ Kern( f ). Daher ist Kern( f ) ein Untervektorraum von
V . Analog zeigt man, dass Bild( f ) ein Untervektorraum von W ist.
Satz 8 : Sei A ∈ K m×n und L(A, 0) := {x ∈ K n×1 | Ax = 0} der Lösungsraum des durch A definierten Systems homogener linearer Gleichungen.
Fasst man die Matrix A als lineare Funktion
A : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist Kern(A) = L(A, 0) und Bild(A) = K hA−1 , . . . , A−n i, der Spaltenraum von A.
Beweis: Es ist Kern(A) = {x ∈ K n×1 | Ax = 0} = L(A, 0) und Bild(A) =
= { Ax | x ∈ K n×1 } = { ∑ni=1 xi A−i | x1 , . . . xn ∈ K } = K hA−1 , . . . , A−n i.
Satz 9 : Seien V,W endlich-dimensionale Vektorräume über K,
f : V → W eine K-lineare Funktion und r := rg( f ). Dann gibt es eine Basis
(v1 , . . . , vn ) von V so, dass
(1) ( f (v1 ), . . . , f (vr )) eine Basis von Bild( f ) und
(2) (vr+1 , . . . , vn ) eine Basis von Kern( f )
ist. Insbesondere gilt
dimK (V ) = dimK (Bild( f )) + dimK (Kern( f )) .
6
1. MEHR ÜBER LINEARE FUNKTIONEN
Ergänzt man die Basis ( f (v1 ), . . . , f (vr )) von Bild( f ) zu einer Basis
(w1 , . . . , wm ) von W , dann ist


1 0 ...
 .. ..

.
.
0

. .


 ∈ K m×n
Dr :=  .. . . 1



0


...
(nur an den Stellen (1, 1), . . . , (r, r) stehen Einsen und sonst Nullen) die Matrix von f bezüglich der Basen (v1 , . . . , vn ) und (w1 , . . . , wm ).
Beweis: Sei (w1 , . . . , wr ) eine Basis von Bild( f ). Dann kann man Urbilder
v1 , . . . , vr ∈ V von w1 , . . . , wr unter f wählen. Sei (u1 , . . . , us ) eine Basis von
Kern( f ). Dann ist
(v1 , . . . , vr , u1 , . . . , us )
ein Erzeugendensystem von V , weil für y ∈ V aus
r
r
r
f (y) = ∑ ai wi = ∑ ai f (vi ) = f ( ∑ ai vi )
i=1
i=1
i=1
r
folgt, dass z := y − ∑i=1 ai vi ∈ Kern( f ) ist. Daher ist y
Linearkombination von (v1 , . . . , vr , u1 , . . . , us ).
= z + ∑ri=1 ai vi eine
Wir zeigen noch, dass (v1 , . . . , vr , u1 , . . . , us ) linear unabhängig ist. Seien
dazu c1 , . . . , cr , d1 , . . . , ds ∈ K mit
r
s
∑ civi + ∑ d j u j = 0 .
i=1
j=1
f (∑ri=1 ci vi + ∑sj=1 d j u j ) = ∑ri=1 ci f (vi ) = ∑ri=1 ci wi .
Dann ist 0 =
Da (w1 , . . . , wr ) linear unabhängig ist, sind alle ci gleich 0. Dann ist
∑sj=1 d j u j = 0, und aus der linearen Unabhängigkeit von u1 , . . . , us folgt
d1 = · · · = ds = 0. Also ist (v1 , . . . , vr , u1 , . . . , us ) die gesuchte Basis von V .
Insbesondere ist r + s = n.
Beispiel 10 :V = W
1 −1

1
−1
wobei A :=
0 0
=
R 3×1 ,
1
2 .
3

f : R 3×1 → R 3×1 ,
 
 
1
1




1
Eine Basis von Bild( f ): w1 :=
, w2 := 2.
0
3
 
1

Eine Basis von Kern( f ): v3 := 1.
0
x 7→ Ax,
7
1. MEHR ÜBER LINEARE FUNKTIONEN
 
 
 
1
0
1
Eine Basis des Definitionsbereichs: v := v1 := 0 , v2 := 0 , v3 = 1.
0
1
0

 
0
Eine Basis des Bildbereichs: w := w1 , w2 , w3 := 0.
1

f (v1 ) = w1 ,
f (v2 ) = w2 ,
f (v3 ) = 0, also:

1 0

M( f , v, w) = 0 1
0 0

0
0 .
0
§3. Systeme linearer Gleichungen in koordinatenfreier Form
Definition 11 : Ein System linearer Gleichungen in koordinatenfreier Form
ist eine Aufgabe:
• Gegeben sind eine lineare Funktion f : V → W und ein Vektor y ∈ W .
• Gesucht ist eine gute Beschreibung“ der Menge
”
L( f , y) := f −1 ({y}) = {x ∈ V | f (x) = y}
aller Vektoren x ∈ V , für die f (x) = y ist.
Die Menge L( f , y) heißt Lösungsmenge des durch f und y gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems.
Das durch f und y gegebene System linearer Gleichungen heißt homogen, wenn y = 0W ist, ansonsten inhomogen. Die Lösungsmenge eines
homogenen Systems linearer Gleichungen ist
L( f , 0) = Kern( f ) .
Beispiel 12 : Die Aufgabe Finde eine quadratische Funktion g : R → R
”
mit g(1) = 3, g(−1) = 2 und g(5) = 1“ ist ein System linearer Gleichungen
in koordinatenfreier Form.
Gesucht ist g ∈ V := {h : R → R | h Polynomfunktion deren Grad ≤ 2 ist}
mit f (g) = (3, 2, 1) ∈ R 3×1 , dabei ist f : V → R 3 die Auswertungsfunkti”
on (in 1, −1 und 5)“ mit f (h) = (h(1), h(−1), h(5)).
Satz 13 : Sei f : V → W K-linear, y ∈ W und z ∈ L( f , y) (insbesondere ist
L( f , y) nicht leer). Dann ist
L( f , y) = z + Kern( f )
ein affiner Unterraum von V mit Aufpunkt z und parallelem Untervektorraum Kern( f ).
Das durch f und y gegebene System lösen“bedeutet daher: finde
”
8
1. MEHR ÜBER LINEARE FUNKTIONEN
(irgend)ein Urbild z von y unter f und (irgend)eine Basis von Kern( f ).
Falls V endlichdimensional ist, gilt weiters
dimK (L( f , y)) = dimK (V ) − rg( f ) .
Beweis: Sei v ∈ Kern( f ). Dann ist f (z + v) = f (z) + f (v) = y + 0 = y, also
z + v ∈ L( f , y).
Sei x ∈ L( f , y). Dann ist f (x − z) = f (x) − f (z) = y − y = 0, also x − z ∈
Kern( f ) und x = z + (x − z) ∈ {z + v | v ∈ Kern( f )}.
Nach Satz 9 ist dimK (Kern( f )) = dimK (V ) − rg( f ) .
Beispiel 14 : Fasst man eine Matrix A ∈ K m×n als eine lineare Funktion
f : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist L( f , y) = L(A, y).
Beispiel 15 : Sei C( R , R ) := { f | f : R → R stetig},
C1 ( R , R ) := { f | f : R → R stetig differenzierbar} und
D : C1 ( R , R ) → C( R , R ) , f 7→ f 0 ,
wobei f 0 die Ableitung der Funktion f bezeichnet. Dann sind C( R , R )
und C1 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D ist R -linear. Der Unterraum Kern(D)
besteht aus allen konstanten Funktionen. Eine Funktion f ∈ C1 ( R , R ) heißt
Stammfunktion von g ∈ C( R , R ), wenn D f = g ist. Wenn f eine Stammfunktion von g ist, dann ist die Menge aller Stammfunktionen von g
L(D, g) = f + Kern(D).
Beispiel 16 : Sei C( R , R ) := { f | f : R → R stetig},
C2 ( R , R ) := { f | f : R → R 2-mal stetig differenzierbar}, a, b ∈ R und
D2 + aD + b : C1 ( R , R ) → C( R , R ) , f 7→ f 00 + a f 0 + b f ,
wobei f 00 die zweite Ableitung der Funktion f bezeichnet. Dann sind C( R , R )
und C2 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D2 + aD + b ist R -linear. Den Unterraum Kern(D2 + aD + b) nennt man die Lösungsmenge der homogenen linearen Differentialgleichung y00 + ay0 + by = 0.
Wenn f ∈ L(D2 + aD + b, g) ist, dann ist
L(D2 + aD + b, g) = f + Kern(D2 + aD + b).
9
1. MEHR ÜBER LINEARE FUNKTIONEN
Definition 17 : Es sei V ein Vektorraum v = (v1 , . . . , vn ) eine Basis von V
und c ∈ K n×1 eine Spalte mit n Zeilen.
Wir verwenden im Weiteren die Schreibweise
n
vc := ∑ ci vi .
i=1
Satz 18 : Seien V,W Vektorräume über K der Dimensionen n, m mit Basen
v , w , sei f : V → W K-linear mit Matrix
A := M( f , v, w) ∈ K m×n
und y = wb ∈ W . Dann bildet der Koordinaten-Isomorphismus
V → K n×1 , vc 7→ c ,
L( f , y) auf L(A, b) ab und Kern( f ) auf L(A, 0).
Beweis: Es ist vc ∈ L( f , y) genau dann wenn w(Ac) = wb, also c ∈ L(A, b)
ist.
Nach Satz 18 kann für f : V → W und y ∈ W das System linearer Gleichungen ( f , y) wie folgt gelöst werden:
(1) Wähle Basen v , w von V,W .
(2) Berechne die Matrix A := M( f , v, w) und die Koordinatenspalte b
von y bezüglich w .
(3) Berechne die Lösungsmenge L(A, b).
Wenn L(A, b) leer ist, dann ist auch L( f , y) leer.
Wenn z ∈ L(A, b) und (u1 , . . . , us ) eine Basis von L(A, 0) ist, dann ist
vz ∈ L( f , y) und (vu1 , . . . , vus ) eine Basis von Kern( f ).
Im Schulunterricht entsprechen Systeme linearer Gleichungen in koordinatenfreier Form gewissen Textaufgaben“.
”
Beispiel 19 : ( Interpolation von 3 gegebenen Funktionswerten durch Po”
lynomfunktionen, deren Grad höchstens 4 ist“.)Wir bezeichnen mit x die
identische Funktion von R nach R und mit 1 die konstante Funktion, die jede reelle Zahl auf 1 abbildet. Man kann zeigen, dass die Potenzfunktionen
1, x, x2 , x3 , x4 linear unabhängig sind. Es sei V der von diesen erzeugte Untervektorraum des Vektorraums aller Polynomfunktionen. Wir suchen alle
Polynomfunktionen p ∈ V mit
p(−1) = 2, p(1) = 1
und
p(2) = 1 .
Sei W := R 3 ,
f : V −→ W , q 7−→ (q(−1), q(1), q(2)) ,
10
1. MEHR ÜBER LINEARE FUNKTIONEN
und y := (2, 1, 1) ∈ W . Die Funktion f ist linear.
Wir wählen die Basis v := (1, x, x2 , x3 , x4 ) von V und die Standardbasis
w := (e1 , e2 , e3 ) von W = R 3 . Dann ist

 

2
1 −1 1 −1 1
A := M( f , v, w) := 1 1 1 1 1  und b := 1 .
1
1 2 4 8 16
Man berechnet mit dem Gauß-Verfahren
 4 
 
 
−2
−4
3
− 1 
1
0
 2
 
 
1 + R  2 + R  5  .
L(A, b) = 
 6 
 
 
 0 
−1
0
0
−1
0
Daher ist
1
4 1
L( f , y) = { − x + x2 +
3 2
6
+c(−2 + x + 2x2 − x3 ) + d(−4 + 5x2 − x4 ) | c, d ∈ R } .
KAPITEL 2
Interpolation und Regression
§1. Interpolationsaufgaben
Wir betrachten die folgenden Interpolationsaufgaben:
Gegeben sind
•
•
•
•
ganze Zahlen m ≥ 2 und n ≥ 1,
Funktionen f1 , . . . , fn von R nach R,
paarweise verschiedene reelle Zahlen x1 , . . . , xm ∈ R und
reelle Zahlen y1 , . . . , ym ∈ R.
Gesucht sind reelle Zahlen c1 , . . . , cn so, dass die Funktion f := ∑ni=1 ci fi
die Bedingungen
f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xm ) = ym
erfüllt.
y3
y2
y1
x2
x1
y4
x4
x3
Durch die Funktionen f1 , . . . , fn wird der Typ“ der Interpolationsaufga”
be vorgegeben. Die reellen Zahlen x1 , . . . , xm heißen Stützstellen, die reellen
Zahlen y1 , . . . , ym (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion.
Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die
Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind.
Anders formuliert: Wir suchen Zahlen c1 , . . . , cn so, dass
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fn (x1 )cn
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fn (x2 )cn
..
.
f1 (xm )c1 + f2 (xm )c2 + . . . + fn (xm )cn
11
= y1
= y2
.. ..
. .
= ym
12
2. INTERPOLATION UND REGRESSION
ist. Das ist ein System von m linearen Gleichungen mit n Unbekannten
c1 , . . . , cn . In Matrizenform:

    
f1 (x1 ) . . . fn (x1 )
c1
y1
 f1 (x2 ) . . . fn (x2 )  c2   y2 
 .
· .  =  .  .
..
.. 
 ..
.
.   ..   .. 
f1 (xm ) . . . fn (xm )
cn
ym
 
y1
 y2 

eine Lösung existiert genau dann, wenn 
 ...  ein Element des von
ym
f1 (x1 )
fn (x1 )
 f1 (x2 ) 
 fn (x2 ) 
 .  , . . . ,  .  erzeugten Vektorraums ist.
 .. 
 .. 


f1 (xm )


fn (xm )
Beispiel 20 : ( Lineare Interpolation“).
”
Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die
Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich
selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit
( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n .
Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften
c1 + c2 x1 = y1
..
.. ..
.
. .
c1 + c2 xm = ym
zu finden, ist ein System von m linearen Gleichungen mit zwei Unbekannten. In Matrizenform


 
1 x1
y1
1 x2  c1
 y2 
. . ·
 
 .. ..  c2 =  ...  .
1 xm
ym
Beispiel 21 : (Interpolation durch Polynomfunktionen).
Für 1 ≤ i ≤ n sei fi : R −→ R, z 7−→ zi−1 , die (i − 1)-te Potenzfunktion.
Dann ist die gesuchte Funktion f eine Polynomfunktion
f : R −→ R, z 7−→ c1 + c2 z + . . . + cn zn−1 .
Wir suchen reelle Zahlen c1 , c2 , . . . , cn mit der Eigenschaft, dass
c1 + x1 c2 + . . . + x1n−1 cn = y1
..
.. ..
.
. .
n−1 c
c1 + xm c2 + . . . + xm
=
ym
n
13
2. INTERPOLATION UND REGRESSION
ist, müssen also ein System von m Gleichungen mit n Unbekannten lösen.
In Matrizenform:

    
1 x1 . . . x1n−1
c1
y1
1 x . . . xn−1  c2   y2 
2

2   
· . = .  .
 .. ..
..
.. 
. .
.
.   ..   .. 
n−1
cn
ym
1 xm . . . xm
Ist m = n = 3 ( Interpolation durch eine quadratische Funktion für drei
”
Stützstellen“), dann hat diese Interpolationsaufgabe für jede Vorgabe von
y1 , y2 , y3 genau eine Lösung, weil die Matrix


1 x1 x12




1 x2 x2 
2



2
1 x3 x3
invertierbar ist (ihre Determinante ist (x1 − x2 )(x2 − x3 )(x3 − x1 )).
§2. Systeme linearer Gleichungen ohne Lösung und Regression
Es seien A ∈ Rm×n und b ∈ Rm×1 . Das durch A und b gegebene System linearer Gleichungen hat genau dann eine Lösung, wenn es eine Spalte
c ∈ Rn×1 mit A · c = b , also ∑ni=1 ci A−i = b, gibt. Das ist genau dann der
Fall, wenn b ein Element des Spaltenraumes von A ist. Wir bezeichnen den
Spaltenraum von A mit U, dieser ist ein Untervektorraum von Rm×1 . Wenn
b nicht in U liegt, gibt es keine Lösung.
Ist man der Meinung, dass es eine Lösung geben sollte, aber vielleicht
b nicht exakt bestimmt wurde (z.B. durch Runden oder durch Messfehler),
kann man b durch b0 ∈ U so ersetzen, dass der Abstand von b zu b0 möglichst
klein ist. Wählen wir den durch das Standardskalarprodukt auf Rm×1 definierten Abstand, bedeutet das, dass
m
kb − b0 k2 = ∑ (bi − b0i )2
i=1
( die Summe der Fehlerquadrate“) möglichst klein sein soll. (Für positive
”
reelle Zahlen r und s ist r ≤ s genau dann, wenn r2 ≤ s2 ist. Somit ist der
Abstand von b zu b0 genau dann minimal, wenn sein Quadrat minimal ist).
Für b0 muss daher der Fußpunkt des Lotes von b auf den Untervektorraum
U gewählt werden und dann das Gleichungssystem A · z = b0 anstatt von
A · z = b gelöst werden.
Hat man das Gleichungssystem durch eine Interpolationsaufgabe wie
im vorigen Abschnitt erhalten und gibt es keine Lösung (also keine interpolierende Funktion des vorgegebenen Typs), dann nennt man die Vorgangsweise wie oben Regression“.
”
14
2. INTERPOLATION UND REGRESSION
U
0
b
b0
Mit den Bezeichnungen des vorigen Abschnittes ist Ai j = f j (xi ) und
bi = yi , 1 ≤ i ≤ m, 1 ≤ j ≤ n. Für die gesuchte Funktion f = ∑ni=1 ci fi soll
f (xi ) = b0i = y0i , 1 ≤ i ≤ m, sein, also der Abstand
k( f (x1 ), f (x2 ), . . . , f (xm ))T − (y1 , . . . , ym )T k
von der Spalte der berechneten Funktionswerte“ zur Spalte der gemesse”
”
nen Funktionswerte“ möglichst klein sein. Falls auf R m×1 das Standardskalarprodukt gewählt wurde, ist
m
k( f (x1 ), . . . , f (xm ))T − (y1 , . . . , ym )T k2 = ∑ ( f (xi ) − yi )2
i=1
die Summe der Fehlerquadrate“.
”
Bei linearer Interpolation“ ist U die von
”
 
 
1
x1
.
1 :=  ..  und x :=  ... 
1
xm
erzeugte Ebene in Rm×1 . Wir verwenden die Bezeichnungen
 
y1
y :=  ...  und y0 := Fußpunkt des Lotes von y auf U .
ym
y
1
c1 1
0
x
y0
c2 x
15
2. INTERPOLATION UND REGRESSION
Wir berechnen nun y0 :
• y0 = c2 x + c1 1 ∈ U und
• die Gerade durch y und y0 steht normal auf der von x und 1 erzeugten
Ebene U.
Also ist
• hc2 x + c1 1 − y, xi = 0 und
• hc2 x + c1 1 − y, 1i = 0.
Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 :
• c2 hx, xi + c1 h1, xi = hx, yi
• c2 hx, 1i + c1 h1, 1i = h1, yi
Als Lösung erhalten wir
h1, 1i · hx, yi − h1, xi · h1, yi
hx, xi · h1, yi − h1, xi · hx, yi
c2 =
und c1 =
.
2
h1, 1i · hx, xi − h1, xi
h1, 1i · hx, xi − h1, xi2
Der Divisor h1, 1i · hx, xi − h1, xi2 ist nach der Cauchy-Schwarzschen Ungleichung nicht 0. Denn: h1, xi2 = h1, 1i · hx, xi nur dann, wenn x ein Vielfaches von 1 ist, d.h.: x1 = x2 = . . . = xm , was wegen der Annahmen m > 1“
”
und xi paarweise verschieden“ nicht möglich ist. Wenn h−, −i das Standard”
m
m
Skalarprodukt ist, dann ist hx, yi = ∑m
i=1 xi yi , h1, xi = ∑i=1 xi , h1, yi = ∑i=1 yi ,
m
2
2
h1, 1i = m, hx, xi = ∑m
i=1 xi und hy, yi = ∑i=1 yi , daher
c2 =
und
c1 =
m
m
m ∑m
i=1 xi yi − (∑i=1 xi )(∑i=1 yi )
m
2
2
m ∑m
i=1 xi − (∑i=1 xi )
m
m
m
2
(∑m
i=1 xi )(∑i=1 yi ) − (∑i=1 xi )(∑i=1 xi yi )
.
m
2
2
n ∑m
i=1 xi − (∑i=1 xi )
Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt,
dass der (euklidische) Abstand vom m-Tupel der gegebenen (gemessenen
oder gerundeten) ungenauen Funktionswerte (y1 , . . . , ym ) zum m-Tupel der
berechneten Funktionswerte ( f (x1 ), . . . , f (xm )) möglichst klein ist, also
2
∑m
i=1 (yi − (c2 xi + c1 )) möglichst klein ist. Der Graph dieser Funktion heißt
Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xm , ym ).
Man rechnet leicht nach, dass
1 m
1 m
f ( ∑ xi ) = ∑ yi
m i=1
m i=1
ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xm ) und (y1 , . . . , ym ) liegt
also immer auf der Regressionsgeraden.
KAPITEL 3
Mehr über Geometrie
§1. Strahlensatz
Satz 22 : ( Strahlensatz“)
”
Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann
gibt es c, d ∈ K \ {0} so, dass
v2 = cv1
und
w2 = dw1
ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1
bzw. v2 und w2 . Dann gilt:
(1) L1 und L2 sind genau dann parallel, wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ).
Z1
v2
v1
0
w1
L1
w2
Z2
L2
Beweis:
(1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw.
K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die
Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau
dann gleich K(cv1 − dw1 ), wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, ist c = d und
v2 − w2 = cv1 − cw1 = c(v1 − w1 ) .
16
17
3. MEHR ÜBER GEOMETRIE
Satz 23 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 +
U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist
Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0.
/
Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer
ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 .
§2. Affine Hülle
Es sei K ein Körper und V ein Vektorraum über K.
Definition 24 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination
von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I .
Beispiel 25 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt,
wenn v1 = v2 ist, bzw. die Gerade
{c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K},
wenn v1 6= v2 ist.
Satz 26 :
(1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche
Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten.
(2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum
von V . Der dazu parallele Untervektorraum wird von
(vi − v j )i∈I, i6= j erzeugt, wobei j ∈ I beliebig gewählt werden kann.
(3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält.
Beweis:
(1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine
Familie in K mit ∑i∈I ci = 1. Zu vi gibt es ui ∈ U so, dass vi = p + ui ,
i ∈ I. Dann ist
∑ civi = ∑ ci(p + ui) = (∑ ci)p + ∑ ciui = p + ∑ ciui ∈ M .
i∈I
i∈I
i∈I
i∈I
(2) Sei j ∈ I und
M := v j + K hvi − v j ; i ∈ I, i 6= ji.
i∈I
18
3. MEHR ÜBER GEOMETRIE
Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle
in M enthalten.
Sei umgekehrt (di )i∈I eine Familie in K.
Dann ist




v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di  v j
i∈I
i6= j
i∈I
i6= j
i∈I
i6= j
eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element
von M in der affinen Hülle von (vi )i∈I enthalten.
(3) Folgt aus (1) und (2).
Definition 27 : Affine Unterräume von V heißen kollinear bzw. koplanar,
wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind.
Satz 28 :
(1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind.
(2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die
Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind.
(3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar,
wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind.
Beweis: Die ersten zwei Aussagen folgen aus Satz 26, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von
p1 − p2 , v1 und v2 erzeugt.
 
 
 
1
2
−1
Beispiel 29 : Sind die Vektoren v1 := 0 , v2 := 2 , v3 :=  1 
1
3
0
 
1
und v4 := 2 ∈ R 3×1 koplanar?
3
 
 
 
1
−2
0
Es ist v2 − v1 = 2 , v3 − v1 =  1  , v4 − v1 = 2 .
2
−1
2


1 −2 0

Wegen det 2 1 2 = 4 6= 0 sind v2 − v1 , v3 − v1 , v4 − v1 linear un2 −1 2
abhängig, nach Satz 28 also v1 , v2 , v3 , v4 nicht koplanar.
19
3. MEHR ÜBER GEOMETRIE
Satz 30 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel.
Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 =
{0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist
M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }.
§3. Polytope und Schwerpunkte
Es seien K = Q oder R und V ein Vektorraum über K.
Definition 31 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V.
Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I
on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist.
i∈I
Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe
Hülle von (vi )i∈I .
Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 .
v2
v1
Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck
mit Eckpunkten v1 , v2 , v3 .
v3
v2
v1
20
3. MEHR ÜBER GEOMETRIE
Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer
endlichen Familie in V ist.
Es sei I := {1, . . . , n} , c1 , . . . , cn ∈ R ≥0 und ∑ ci = 1. Für cn 6= 1 ist
i∈I
!
ci
∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn ,
i=1
i=1
n
n−1
ci
wobei w := ∑n−1
i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt.
Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H.
v3
u = c1 v1 + c2 v2 + c3 v3
= (c1 + c2 )w + c3 v3
u
v1
c1
c2
c1 +c2 v1 + c1 +c2 v2
=: w
v2
Beispiel 32 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie
ein abgeschlossenes Intervall ist.
Satz 33 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und
(vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten.
Beweis: Für allei ∈ I ist der Vektor vi eine konvexe Linearkombination
∑ c ji w j von w j j∈J .
j∈J
21
3. MEHR ÜBER GEOMETRIE
Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist
i∈I
!
∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji
i∈I
i∈I j∈J
j∈J
mit ∑ di c ji ≥ 0, für alle j ∈ J, und
i∈I
!
∑ ∑ dic ji
j∈J
i∈I
= ∑ di
i∈I
wj
i∈I
!
= ∑ di = 1 .
∑ c ji
j∈J
i∈I
Daher ist ∑ di vi ∈ P .
i∈I
Definition 34 : Es sei (vi )i∈I eine endliche Familie in V .
Der Schwerpunkt von (vi )i∈I ist
1
vi .
# (I) ∑
i∈I
Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1
und v2 .
Satz 35 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade
durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen
zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u
bzw. v bzw. w.
Die drei Schwerlinien sind paarweise verschieden und schneiden einander
im Schwerpunkt 13 (u + v + w) von (u, v, w) .
w
1
2 (u + w)
1
2 (v + w)
u
1
2 (u + v)
v
Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 28 die Vektoren v − u
und w − u linear unabhängig. Also sind auch
1
1
1
v − u und
(v − u) + (w − u) = (v + w) − u
2
2
2
22
3. MEHR ÜBER GEOMETRIE
linear unabhängig, nach Satz 28 sind daher u, v, 12 (v + w) nicht kollinear.
Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben
höchstens einen Schnittpunkt. Wegen
1
2 1
1
2 1
1
(u + v + w) = u +
(v + w) = v +
(u + w) =
3
3
3 2
3
3 2
1
2 1
= w+
(u + v)
3
3 2
liegt der Schwerpunkt auf allen Schwerlinien.
§4. Affine Räume
Definition 36 : Es seien (G, ?) eine Gruppe mit neutralem Element e und
M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt:
für alle m ∈ M ist e · m = m und
für alle s,t ∈ G und alle m ∈ M ist (s ? t) · m = s · (t · m).
Beispiel 37 : Die Funktion
Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) ,
ist eine Operation der Permutationsgruppe Sn auf der Menge
{1, 2, . . . , n}.
Definition 38 : Sei V ein Vektorraum über einem Körper K, A eine Menge
und
V × A → A , (v, a) 7→ v · a ,
eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist
0 · a = a und (v + w) · a = v · (w · a).
A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für
alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b.
Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des
affinen Raums.
Satz 39 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion
V −→ A , v 7−→ v · a ,
ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek”
torraum betrachtet werden).
Beweis: Folgt aus der Definition.
23
3. MEHR ÜBER GEOMETRIE
Beispiel 40 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von
V . Dann ist der affine Unterraum p +U mit
U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) ,
ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner
Raum (über sich selbst).
Beispiel 41 : Sie E die Zeichenebene oder der Anschauungsraum und T (E)
der Vektorraum der Translationen von E. Dann ist E mit
T (E) × E −→ E , (t, x) 7−→ t(x) ,
ein affiner Raum über T (E).
Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man
”
sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E)
und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert
werden, aber Vektoren können addiert werden und auf Punkten wirken“.
”
Sind P und Q Punkte von E und P 6= Q, dann gibt es genau eine Trans~ bezeichnet.
lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ
Q
~
Graph(PQ)
P
Die Menge
~ |t ∈ R } ⊆ T (E)
{t PQ
~ in T (E). Die Gerade durch P und
ist die Gerade durch 0T (E) = idE und PQ
”
Q in E“ ist dann als
~
{(t PQ)(P)
|t ∈ R } ⊆ E
~
~
definiert. Wegen (PQ)(P)
= Q und (0 · PQ)(P)
= idE (P) = P sind P und
~
Q Punkte dieser Geraden. Die Translation PQ wird als Richtungsvektor“
”
dieser Geraden bezeichnet.
~
Gerade durch 0T (E) und PQ
im Vektorraum T (E)
~
2PQ
~
(−PQ)(P)
P
Q
~
PQ
0T (E) = idE
~
−PQ
Gerade durch
P und Q in E
~
~
(2PQ)(P)
= PQ(Q)
Herunterladen