Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung

Werbung
Vertiefung Lineare Algebra 1
Schriftliche Unterlagen zur Vorlesung
im Wintersemester 2013/14
Franz Pauer
c 2013 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK
⃝
KAPITEL 1
Vertiefung zu Kap. 2, §3
In diesem Kapitel sei K ein Körper.
§1. Erzeugendensysteme, lineare Unabhängigkeit und Basen
In der Vorlesung Lineare Algebra 1“ wurde der Begriff Linearkom”
bination eines n-Tupels von Vektoren eingeführt. Wir erweitern diesen Begriff nun auf beliebige (auch unendliche) Familien (vi )i∈I von Vektoren. Die
Definition im Skriptum Lineare Algebra 1 entspricht dann dem Spezialfall
I := {1, . . . , n}.
Definition 1 : Sei V ein Vektorraum über K und I eine (beliebige) Menge.
Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn
ci ̸= 0 für nur endlich viele i ∈ I ist.
Sei (vi )i∈I eine Familie von Vektoren in V .
Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine
Koeffizientenfamilie (ci )i∈I gibt, sodass
w=
∑
ci vi
i∈I,ci ̸=0
ist. Wir schreiben im weiteren einfach
∑ ci vi
anstatt
∑
ci vi .
i∈I,ci ̸=0
i∈I
Die Menge aller Linearkombinationen von (vi )i∈I ist ein Untervektorraum
von V und enthält alle Vektoren vi , i ∈ I. Er heißt der von vi , i ∈ I, erzeugte
Untervektorraum von V und wird mit
K ⟨vi
| i ∈ I⟩
oder
∑ Kvi
i∈I
bezeichnet.
Definition 2 : Sei V ̸= {0} ein Vektorraum über K. Eine Familie (vi )i∈I
von Vektoren in V heißt genau dann ein Erzeugendensystem von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn jeder Vektor in V auf
mindestens eine bzw. höchstens eine bzw. genau eine Weise als Linearkombination von (vi )i∈I geschrieben werden kann.
Wir schreiben linear abhängig anstatt nicht linear unabhängig.
Die leere Menge ist eine Basis von {0}.
1
1. VERTIEFUNG ZU KAP. 2, §3
2
Satz 3 : Sei V ̸= {0} ein Vektorraum über K und (vi )i∈I eine Familie von
Vektoren in V .
(1) Eine Basis von V ist ein linear unabhängiges Erzeugendensystem.
(2) Die Familie (vi )i∈I von Vektoren ist genau dann ein Erzeugendensystem von V , wenn
K ⟨vi
| i ∈ I⟩ = V
ist.
(3) Die Familie (vi )i∈I von Vektoren ist genau dann linear unabhängig,
wenn für jede Koeffizientenfamilie (ci )i∈I aus
∑ civi = 0
i∈I
folgt, dass
ci = 0 für alle i ∈ I
ist.
Beweis:
(1) und (2) folgen aus der Definition der Begriffe Erzeugendensystem,
linear unabhängig und Basis.
(3) Wenn sich jeder Vektor aus V auf höchstens eine Weise als Linearkombination von (vi )i∈I schreiben lässt, dann folgt aus
∑ civi = 0V = ∑ 0K vi
i∈I
i∈I
auf Grund der Eindeutigkeit ci = 0K für 1 ≤ i ≤ n.
Sei umgekehrt (vi )i∈I linear unabhängig in V und w ∈ V so, dass es
eine Koeffizientenfamilie (ci )i∈I mit
w = ∑ ci vi
i∈I
gibt. Falls (di )i∈I eine weitere Koeffizientenfamilie mit
w = ∑ di vi
i∈I
ist, erhält man
0V = w − w = ∑ ci vi − ∑ di vi = ∑(ci − di )vi .
i∈I
i∈I
i∈I
Nach Annahme folgt ci − di = 0K für alle i ∈ I, also ci = di für alle
i ∈ I.
Beispiel 4 : Die Familie
(Ekℓ )1≤k≤m = (Ekℓ )(k,ℓ)∈{1,...,m}×{1,...,n}
1≤ℓ≤n
1. VERTIEFUNG ZU KAP. 2, §3
3
der Standard-Matrizen ist eine Basis von K m×n und heißt die Standardbasis
von K m×n .
Für A ∈ K m×n ist
A = ∑ Akℓ Ekℓ ,
1≤k≤m
1≤ℓ≤n
also ist A die Koordinatenfamilie von A bezüglich der Standardbasis
(Ekℓ )1≤k≤m (und Akℓ die Koordinate von A bei Ekℓ ).
1≤ℓ≤n
Beispiel 5 : Es seien I eine endliche Menge und V die Menge aller Funktionen von I in einen Körper K. Für i ∈ I sei δi die durch
δi ( j) := δi j , j ∈ I,
definierte Funktion von I nach K. Dann ist die Familie
(δi )i∈I
eine K-Basis von V . Für f ∈ V ist
f = ∑ f (i)δi .
i∈I
Beispiel 6 : Es sei K ein Körper und F := {(ai )i∈N | ai ∈ K, i ∈ N} die Menge aller Folgen in K. Mit den durch
(ai )i∈N + (bi )i∈N := (ai + bi )i∈N und c · (ai )i∈N := (cai )i∈N
definierten Rechenoperationen wird F zu einem Vektorraum. Mit ei (i ∈ N)
bezeichnen wir die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der i-ten Stelle steht. Die Familie (ei )i∈N ist linear unabhängig, aber kein Erzeugendensystem von F. Zum Beispiel kann die Folge (1, 1, 1, . . . , 1, . . .) nicht als Linearkombination der Familie (ei )i∈N geschrieben werden.
Der von der Familie (ei )i∈N erzeugte Untervektorraum ist die Menge
aller Folgen, von denen nur endlich viele Folgenglieder nicht 0 sind. Er
heißt Vektorraum der endlichen Folgen in K. Die Familie (ei )i∈N ist eine
Basis dieses Vektorraums, daher ist er unendlich-dimensional.
§2. Rechnen mit Koordinaten
In diesem Abschnitt seien V und W endlich-dimensionale Vektorräume
über K, n ∈ N die Dimension von V und v := (v1 , . . . , vn ) eine Basis von V .
Definition 7 : Seien p und q positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p
1. VERTIEFUNG ZU KAP. 2, §3
4
ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei
(
)
p
p
(
)
uT := (uT )1 , . . . , (uT )q := ∑ Ti1 ui , . . . , ∑ Tiq ui ∈ V q .
i=1
i=1
Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j ∈ V nach der Regel
Zeile u mal Spalte T− j“
”
berechnet.
Satz 8 : Seien p, q, r positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p . Dann gilt:
(1) uI p = u
(2) Für T ∈ K p×q und U ∈ K q×r ist u(TU) = (uT )U .
(3) Für T ∈ GL p (K) und u′ := uT gilt u = u′ T −1 .
Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus
u = uI p = u(T T −1 ) = (uT )T −1 = u′ T −1 .
Definition 9 : Seien w ∈ V und c1 , . . . , cn ∈ K die Koordinaten von w bezüglich v, also
n
w = ∑ ci vi = vc ∈ V ,
i=1
Dann heißt die Spalte
 
c1
 ...  ∈ K n×1
cn
die Koordinatenspalte von w bezüglich v.
Satz 10 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt:
(1) Es gibt genau eine Matrix T ∈ K n×q mit
u = vT .
Diese Matrix T heißt die Transformationsmatrix von v zu u, und die
Spalten von T sind die Koordinatenspalten von u1 , . . . , uq bezüglich
v.
(2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar
ist.
Beweis:
5
1. VERTIEFUNG ZU KAP. 2, §3
(1) Sei T ∈ K n×k jene Matrix, die sich durch Nebeneinanderschreiben
der Koordinatenspalten von u1 , . . . , uk bezüglich v ergibt. Dann ist
u j = vT− j für 1 ≤ j ≤ k, also u = vT . Wenn umgekehrt u = vS mit
S ∈ K n×k ist, d.h. u j = vS− j für 1 ≤ j ≤ k, dann ist S− j die Koordinatenspalte von u j bezüglich v für 1 ≤ j ≤ k.
(2) Wenn T ∈ GLn (K) ist, dann ist v = uT −1 nach Satz 8, also sind die
Vektoren v1 , . . . , vn Linearkombinationen von u1 , . . . , un , somit ist
K ⟨u1 , . . . , un ⟩ = V und, weil V n-dimensional ist, (u1 , . . . , un ) eine Basis von V . Wenn umgekehrt u eine Basis von V ist, dann gibt es eine Matrix U ∈ K n×n mit v = uU. Weil u eine Basis ist, folgt aus
uIn = vT = u(UT ), dass UT = In ist und analog TU = In , also ist
T ∈ GLn (K).
Satz 11 : Sei u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von w ∈ V bezüglich v, dann
ist
T −1 c
die Koordinatenspalte von w bezüglich u , d.h. bei Basiswechsel mit der
Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 .
”
Beweis: Es ist w = vc = (uT −1 )c = u(T −1 c).
Beispiel 12 : Wir betrachten die Ebene E nach Wahl eines Nullpunktes als
Vektorraum. Wir wählen Punkte P1 , P2 so, dass P := (P1 , P2 ) eine Basis von
E ist. Es sei
3
1
1
Q := (Q1 , Q2 ) := ( P1 + 2P2 , P1 + P2 ) .
2
2
2
Dann ist Q = PT , wobei
3 1
T := 
2
2
2
1
2

ist. Man prüft leicht nach, dass T invertierbar ist und dass
(
)
−2 2
−1
T =
8 −6
ist. Daher ist P = QT −1 = (−2Q1 + 8Q2 , 2Q1 − 6Q2 ).
( )
1
Der Punkt P1 + 2P2 hat bezüglich P die Koordinatenspalte
und
2
( ) ( )
1
2
bezüglich Q die Koordinatenspalte T −1
=
.
2
−4
Somit ist P1 + 2P2 = 2Q1 − 4Q2 .
KAPITEL 2
Vertiefung zu Kap. 3, §2
§1. Strahlensatz
Satz 13 : ( Strahlensatz“)
”
Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann
gibt es c, d ∈ K \ {0} so, dass
v2 = cv1
und w2 = dw1
ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1
bzw. v2 und w2 . Dann gilt:
(1) L1 und L2 sind genau dann parallel, wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ).
Z1
v2
v1
0
w1
L1
w2
L2
Z2
A BBILDUNG 1. Strahlensatz
Beweis:
(1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw.
K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die
Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau
dann gleich K(cv1 − dw1 ), wenn c = d ist.
6
2. VERTIEFUNG ZU KAP. 3, §2
7
(2) Wenn L1 und L2 parallel sind, ist c = d und
v2 − w2 = cv1 − cw1 = c(v1 − w1 ) .
Satz 14 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 +
U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist
Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0.
/
Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer
ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 .
§2. Affine Hülle
Es sei K ein Körper und V ein Vektorraum über K.
Definition 15 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination
von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I .
Beispiel 16 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt,
wenn v1 = v2 ist, bzw. die Gerade
{c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K},
wenn v1 ̸= v2 ist.
Satz 17 :
(1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche
Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten.
(2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum
von V . Der dazu parallele Untervektorraum wird von
(vi − v j )i∈I, i̸= j erzeugt, wobei j ∈ I beliebig gewählt werden kann.
(3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält.
Beweis:
2. VERTIEFUNG ZU KAP. 3, §2
8
(1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine
Familie in K mit ∑i∈I ci = 1. Dann ist
(
)
(
)
∑ civi = ∑ ci
i∈I
p−
i∈I
∑ ci
i∈I
p + ∑ ci vi =
i∈I
= p + ∑ ci (vi − p) ∈ p +U = M.
i∈I
(2) Sei j ∈ I und
M := v j + K ⟨vi − v j ; i ∈ I, i ̸= j⟩.
Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle
in M enthalten.
Sei umgekehrt (di )i∈I eine Familie in K.
Dann ist




v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di  v j
i∈I
i̸= j
i∈I
i̸= j
i∈I
i̸= j
eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element
von M in der affinen Hülle von (vi )i∈I enthalten.
(3) Folgt aus (1) und (2).
Definition 18 : Affine Unterräume von V heißen kollinear bzw. koplanar,
wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind.
Satz 19 :
(1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind.
(2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die
Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind.
(3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar,
wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind.
Beweis: Die ersten zwei Aussagen folgen aus Satz 17, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von
p1 − p2 , v1 und v2 erzeugt.
Satz 20 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel.
2. VERTIEFUNG ZU KAP. 3, §2
9
Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 =
{0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist
M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }.
§3. Polytope und Schwerpunkte
Es seien K = Q oder R und V ein Vektorraum über K.
Definition 21 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V.
Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I
on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist.
i∈I
Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe
Hülle von (vi )i∈I .
Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 .
Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck
mit Eckpunkten v1 , v2 , v3 .
Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer endlichen Familie in V ist.
Es sei I := {1, . . . , n} und c1 , . . . , cn ∈ R ≥0 . Für cn ̸= 1 ist
)
ci
∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn ,
i=1
i=1
n
(
n−1
ci
wobei w := ∑n−1
i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt.
Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H.
Beispiel 22 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie
ein abgeschlossenes Intervall ist.
( )
Satz 23 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und
(vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten.
2. VERTIEFUNG ZU KAP. 3, §2
10
Beweis: Für (alle)i ∈ I ist der Vektor vi eine konvexe Linearkombination
∑ c ji w j von w j j∈J .
j∈J
Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist
i∈I
(
)
∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji
i∈I
i∈I j∈J
j∈J
wj
i∈I
mit ∑ di c ji ≥ 0, für alle j ∈ J, und
i∈I
)
(
∑ ∑ dic ji
j∈J
i∈I
(
= ∑ di
i∈I
)
∑ c ji
j∈J
= ∑ di = 1 .
i∈I
Daher ist ∑ di vi ∈ P .
i∈I
Definition 24 : Es sei (vi )i∈I eine endliche Familie in V .
Der Schwerpunkt von (vi )i∈I ist
1
vi .
# (I) ∑
i∈I
Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1
und v2 .
Satz 25 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade
durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen
zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u
bzw. v bzw. w.
Die drei Schwerlinien sind paarweise verschieden und schneiden einander
im Schwerpunkt 31 (u + v + w) von (u, v, w) .
Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 19 die Vektoren v − u
und w − u linear unabhängig. Also sind auch
v − u und
1
1
1
(v − u) + (w − u) = (v + w) − u
2
2
2
linear unabhängig, nach Satz 19 sind daher u, v, 12 (v + w) nicht kollinear.
Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben
11
2. VERTIEFUNG ZU KAP. 3, §2
höchstens einen Schnittpunkt. Wegen
(
)
(
)
1
1
2 1
1
2 1
(u + v + w) = u +
(v + w) = v +
(u + w) =
3
3
3 2
3
3 2
(
)
1
2 1
= w+
(u + v)
3
3 2
liegt der Schwerpunkt auf allen Schwerlinien.
§4. Affine Räume
Definition 26 : Es seien (G, ⋆) eine Gruppe mit neutralem Element e und
M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt:
für alle m ∈ M ist e · m = m und
für alle s,t ∈ G und alle m ∈ M ist (s ⋆ t) · m = s · (t · m).
Beispiel 27 : Die Funktion
Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) ,
ist eine Operation der Permutationsgruppe Sn auf der Menge
{1, 2, . . . , n}.
Definition 28 : Sei V ein Vektorraum über einem Körper K, A eine Menge
und
V × A → A , (v, a) 7→ v · a ,
eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist
0 · a = a und (v + w) · a = v · (w · a).
A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für
alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b.
Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des
affinen Raums.
Satz 29 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion
V −→ A , v 7−→ v · a ,
ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek”
torraum betrachtet werden).
Beweis: Folgt aus der Definition.
12
2. VERTIEFUNG ZU KAP. 3, §2
Beispiel 30 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von
V . Dann ist der affine Unterraum p +U mit
U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) ,
ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner
Raum (über sich selbst).
Beispiel 31 : Sie E die Zeichenebene oder der Anschauungsraum und T (E)
der Vektorraum der Translationen von E. Dann ist E mit
T (E) × E −→ E , (t, x) 7−→ t(x) ,
ein affiner Raum über T (E).
Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man
”
sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E)
und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert
werden, aber Vektoren können addiert werden und auf Punkten wirken“.
”
Sind P und Q Punkte von E und P ̸= Q, dann gibt es genau eine Trans⃗ bezeichnet. Die
lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ
Menge
⃗ |t ∈ R } ⊆ T (E)
{t PQ
⃗ in T (E). Die Gerade durch P und
ist die Gerade durch 0T (E) = idE und PQ
”
Q in E“ ist dann als
⃗
{(t PQ)(P)
|t ∈ R } ⊆ E
⃗
⃗
definiert. Wegen (PQ)(P)
= Q und (0 · PQ)(P)
= idE (P) = P sind P und
⃗ wird als Richtungsvektor“
Q Punkte dieser Geraden. Die Translation PQ
”
dieser Geraden bezeichnet.
KAPITEL 3
Vertiefung zu Kap. 3, §3-5
§1. Mehr über Skalarprodukte
In diesem Abschnitt sei V ein reeller Vektorraum und ⟨−, −⟩ ein Skalarprodukt auf V .
Definition 32 : Ein reeller Vektorraum mit einem Skalarprodukt heißt reeller Prähilbertraum. Ein endlich-dimensionaler reeller Prähilbertraum heißt
euklidischer Raum.
Beispiel 33 : (Für Studierende mit Kenntnissen aus Analysis). Es seien a, b
reelle Zahlen mit a < b und V der Vektorraum aller stetigen Funktionen
vom Intervall [a, b] nach R . Die Funktion
⟨−, −⟩ : V ×V −→ R ,
( f , g) 7−→
∫ b
a
f (x) · g(x)dx ,
ist ein Skalarprodukt auf V . Die Norm von f ∈ V ist
√
∥f∥ =
∫ b
f (x)2 dx
.
a
Satz 34 : (Parallelogrammgleichung) Für alle Vektoren v und w in einem
reellen Prähilbertraum ist
∥v + w∥2 + ∥v − w∥2 = 2∥v∥2 + 2∥w∥2 .
Beweis: Nachrechnen.
Definition 35 : Eine Norm auf V ist eine Funktion
N : V −→ R ≥0 := {t ∈ R |t ≥ 0} , v 7−→ N(v) ,
mit den Eigenschaften:
(1) Es ist N(v) = 0 genau dann, wenn v = 0 ist.
(2) Für alle c ∈ R , v ∈ V ist N(cv) = |c|N(v) .
(3) Für alle v, w ∈ V ist N(v + w) ≤ N(v) + N(w) .
V zusammen mit einer Norm heißt normierter Raum .
13
3. VERTIEFUNG ZU KAP. 3, §3-5
14
Beispiel 36 : Ist ⟨−, −⟩ ein Skalarprodukt auf V , dann ist
√
∥ · ∥ : V −→ R , v 7−→ ∥v∥ := ⟨v, v⟩,
eine Norm.
Beispiel 37 : Die Funktion
n
N : R −→ R ≥0 , (c1 , c2 , . . . , cn ) 7−→ ∑ |ci | ,
n
i=1
Rn .
ist eine Norm (die Summennorm“) auf
”
Die Parallelogrammgleichung gilt für diese Norm nicht, zum Beispiel ist
für n = 2, v := (2, 1) und w := (1, 2):
N(v + w)2 + N(v − w)2 = 36 + 4 = 40, aber
2 · N(v)2 + 2 · N(w)2 = 18 + 18 = 36.
Satz 38 : N sei eine Norm auf V .
Dann sind die folgenden Aussagen äquivalent:
(1) Die Parallelogrammgleichung gilt für N, dh.: Für alle v, w ∈ V ist
N(v + w)2 + N(v − w)2 = 2 · N(v)2 + 2 · N(w)2 .
(2) Es gibt ein Skalarprodukt
√ ⟨−, −⟩, das die Norm N induziert, dh.: für
alle v ∈ V ist N(v) = ⟨v, v⟩.
In diesem Fall ist dieses Skalarprodukt von v, w ∈ V durch
1
⟨v, w⟩ := (N(v + w)2 − N(v − w)2 )
4
definiert.
Beweis: Wenn (2) gilt, dann folgt (1) aus Satz 34.
Wenn (1) gilt, dann kann damit nachgeprüft werden, dass die oben definierte
Funktion ⟨−, −⟩ die Eigenschaften eines Skalarproduktes hat.
Definition 39 : Eine Familie (vi )i∈I in V heißt orthonormal bezüglich
⟨−, −⟩, wenn für alle i, j ∈ I gilt:
⟨vi , v j ⟩ = δi j .
Eine Familie (vi )i∈I in V heißt Orthonormalbasis (kurz: ON-Basis) von V
bezüglich ⟨−, −⟩, wenn sie eine Basis von V und orthonormal bezüglich
⟨−, −⟩ ist.
Beispiel 40 : Es sei V der Vektorraum der endlichen Folgen in R. Für i ∈ N
bezeichnen wir mit ei die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der
15
3. VERTIEFUNG ZU KAP. 3, §3-5
i-ten Stelle steht. Die Familie (ei )i∈N ist eine Basis von V . Durch
⟨a, b⟩ :=
∑ aibi , für alle Folgen a, b in
N
i∈N
wird ein Skalarprodukt auf V definiert. Die Familie (ei )i∈N ist eine ONBasis bezüglich dieses Skalarproduktes.
Satz 41 : Eine orthonormale Familie ist linear unabhängig.
Insbesondere: Wenn V endlich-dimensional ist, dann ist jede orthonormale
Familie mit dimK (V ) Elementen eine ON-Basis von V .
Beweis: Sei (vi )i∈I eine orthonormale Familie und (ci )i∈I eine Koeffizienten-Familie in K. Wenn ∑i∈I ci vi = 0 ist, dann ist für alle j ∈ I auch
0 = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = c j .
i∈I
i∈I
Satz 42 : Sei w ∈ V und (vi )i∈I eine ON-Basis von V . Dann ist
w = ∑⟨vi , w⟩vi .
i∈I
( Die Koordinate von w bei vi ist das Skalarprodukt von vi mit w“.)
”
Beweis: Sei w = ∑i∈I ci vi . Dann ist
⟨v j , w⟩ = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = ∑ ci δ ji = c j .
i∈I
i∈I
i∈I
§2. Interpolationsaufgaben
Wir betrachten die folgenden Interpolationsaufgaben:
Gegeben sind
• Funktionen f1 , . . . , fk von R nach R,
• paarweise verschiedene reelle Zahlen x1 , . . . , xn ∈ R und
• reelle Zahlen y1 , . . . , yn ∈ R.
Gesucht sind reelle Zahlen c1 , . . . , ck so, dass die Funktion f := ∑ki=1 ci fi
die Bedingungen
f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xn ) = yn
erfüllt.
r
y1
x1
r
r
y2
x2
r
y3
x3
y4
x4
16
3. VERTIEFUNG ZU KAP. 3, §3-5
Durch die Funktionen f1 , . . . , fk wird der Typ“ der Interpolationsaufgabe
”
vorgegeben. Die reellen Zahlen x1 , . . . , xn heißen Stützstellen, die reellen
Zahlen y1 , . . . , yn (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion.
Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die
Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind.
Anders formuliert: Wir suchen Zahlen c1 , . . . , ck so, dass
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2
..
.. ..
.
. .
f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn
ist. Das ist ein System von n linearen Gleichungen mit k Unbekannten
c1 , . . . , ck . In Matrizenform:

    
f1 (x1 ) . . . fk (x1 )
c1
y1
 f1 (x2 ) . . . fk (x2 ) c2  y2 
 .
· .  =  .  .
..
.. 
 ..
.
.   ..   .. 
f1 (xn ) . . . fk (xn )
ck
yn
Beispiel 43 : ( Lineare Interpolation“).
”
Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die
Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich
selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit
( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n .
Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften
c1 + c2 x1 = y1
..
.. ..
.
. .
c1 + c2 xn = yn
zu finden, ist ein System von n linearen Gleichungen mit zwei Unbekannten. In Matrizenform
 


y1
1 x1
( )
y2 
1 x2  c1
 
. . ·
 .. ..  c2 =  ...  .
yn
1 xn
Beispiel 44 : (Interpolation durch Polynomfunktionen).
Für 1 ≤ i ≤ k sei fi : R −→ R, z 7−→ zi−1 , die i − 1-te Potenzfunktion. Dann
ist die gesuchte Funktion f eine Polynomfunktion vom Grad k − 1, also
f : R −→ R, z 7−→ c1 + c2 z + . . . + ck zk−1 .
3. VERTIEFUNG ZU KAP. 3, §3-5
17
Wir suchen reelle Zahlen c1 , c2 , . . . , ck mit der Eigenschaft, dass
c1 + x1 c2 + . . . + x1k−1 ck = y1
..
.. ..
.
. .
k−1
c1 + xn c2 + . . . + xn ck = yn
ist, müssen also ein System von n Gleichungen mit k Unbekannten lösen.
In Matrizenform:
    

1 x1 . . . x1k−1
y1
c1
1 x . . . xk−1  c2  y2 
2

2   
.
·  ..  = 
 .. ..
.. 
.
.. 

..

. .
.
.
.
yn
ck
1 xn . . . xnk−1
§3. Systeme linearer Gleichungen (mit und ohne Lösung)
Das System
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2
..
.. ..
.
. .
f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn
von k linearen Gleichungen mit den Unbekannten c1 , . . . , ck kann auch in
der Form

  

fk (x1 )
y1
f1 (x1 )
.
.
c1  ..  + . . . + ck  ..  =  ...  ,
fk (xn )
yn
f1 (xn )

oder, mit den Abkürzungen
 
y1

y := ...  und
yn


fi (x1 )
fi (x) :=  ...  , 1 ≤ i ≤ k,
fi (xn )
kurz als
k
∑ cifi(x) = y
i=1
angeschrieben werden.
Wir können also das System linearer Gleichungen als die folgende Aufgabe interpretieren: Schreibe die Spalte y als Linearkombination ∑ki=1 ci fi (x)
der Spalten fi (x) , 1 ≤ i ≤ k. Das ist aber nur dann möglich, wenn y in dem
von den Spalten fi (x) , 1 ≤ i ≤ k , erzeugten Untervektorraum U von Rn×1
enthalten ist. Wenn das nicht der Fall ist, ist dieses System linearer Gleichungen nicht lösbar.
18
3. VERTIEFUNG ZU KAP. 3, §3-5
Im Fall von Beispiel Lineare Interpolation“ ist U die von
”
 
 
1
x1
.
1 :=  ..  und x :=  ... 
1
xn
erzeugte Ebene in Rn×1 .
Im Fall von Beispiel Interpolation durch Polynomfunktionen vom Grad
”
≤ k“ ist U der von
   
1
x1
.
 ..  ,  ...  , . . .
1
xn

x1k−1


,  ... 

xnk−1
erzeugte Untervektorraum von Rn×1 .
Wenn die Interpolationsaufgabe einerseits eine Situation beschreibt, von
der man weiß, dass es eine Lösung gibt, andererseits die Aufgabe aber nicht
lösbar ist, weil y mit Mess- oder Rundungsfehlern behaftet ist, liegt es nahe, dass y eigentlich“ ein Element von U sein sollte. Wir erzwingen die
”
Lösbarkeit der Aufgabe, indem wir y durch eine Spalte y′ in U ersetzen!
Wie sollen wir diese Spalte y′ aber wählen? Am einfachsten ist es, y′ in
U so zu wählen, dass der Abstand zwischen y′ und y möglichst klein ist. Wir
suchen also ein Element des Vektorraums U so, dass der Abstand ∥y′ − y∥
zwischen y und y′ so klein wie möglich ist. Wir müssen nun festlegen, welchen Abstand wir meinen: Wenn wir den (durch das Standardskalarprodukt
auf dem Rn induzierten) euklidischen Abstand im Rn wählen, dann ist
√
∥y′ − y∥ :=
n
∑ (y′i − yi)2 .
i=1
Für positive reelle Zahlen a und b ist a ≤ b genau dann, wenn a2 ≤ b2 ist.
Daher ist der ∥y′ − y∥ genau dann minimal, wenn die Summe ∑ni=1 (y′i − yi )2
der Fehlerquadrate“ minimal ist.
”
Die Spalte y′ ist der Fußpunkt des Lotes von y auf U.
§4. Lineare Regression
Genau dann ist der Abstand zwischen y′ und y kleiner oder gleich dem
Abstand zwischen y und jedem anderen Element z von U, wenn die Gerade
durch y′ und y normal zum Untervektorraum U steht. Das folgt leicht aus
dem Satz von Pythagoras:
3. VERTIEFUNG ZU KAP. 3, §3-5
19
U
hy
Sphhhhhh
h
S
z
S
Sp y′
Das Dreieck mit den Eckpunkten y′ , y und z hat bei y′ einen rechten
Winkel. Der Abstand zwischen y und z ist die Länge der Hypotenuse, also
größer oder gleich der Länge einer Kathete, also dem Abstand zwischen y
und y′ .
Die Gerade durch y′ und y steht genau dann normal zu U, wenn alle
Skalarprodukte von y′ − y mit den erzeugenden Spalten von U gleich 0
sind. Für y′ = ∑ki=1 ci fi (x) ∈ U muss also gelten:
⟨y′ − y, fj (x)⟩ = 0, 1 ≤ j ≤ k .
Anders geschrieben:
k
∑ ci⟨fi(x), fj(x)⟩ = ⟨y, fj(x)⟩, 1 ≤ j ≤ k .
i=1
Wenn wir dieses System von k linearen Gleichungen mit k Unbekannten
c1 , . . . , ck lösen, dann erhalten wir die annähernd“ interpolierende Funktion
”
f = ∑ki=1 ci fi .
Bei linearer Interpolation ist
• y′ = c2 x + c1 1 ∈ U und
• die Gerade durch y und y′ steht normal auf der von x und 1 erzeugten
Ebene U.
Also ist
• ⟨c2 x + c1 1 − y, x⟩ = 0 und
• ⟨c2 x + c1 1 − y, 1⟩ = 0.
Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 :
• c2 ⟨x, x⟩ + c1 ⟨1, x⟩ = ⟨x, y⟩
• c2 ⟨x, 1⟩ + c1 ⟨1, 1⟩ = ⟨1, y⟩
Als Lösung erhalten wir
c2 =
⟨1, 1⟩.⟨x, y⟩ − ⟨1, x⟩.⟨1, y⟩
⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2
und
c1 =
⟨x, x⟩.⟨1, y⟩ − ⟨1, x⟩.⟨x, y⟩
.
⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2
3. VERTIEFUNG ZU KAP. 3, §3-5
20
Wenn ⟨−, −⟩ das Standard-Skalarprodukt ist, dann ist ⟨x, y⟩ = ∑ni=1 xi yi ,
⟨1, x⟩ = ∑ni=1 xi , ⟨1, y⟩ = ∑ni=1 yi , ⟨1, 1⟩ = n, ⟨x, x⟩ = ∑ni=1 xi2 und ⟨y, y⟩ =
∑ni=1 y2i , daher
c2 =
und
c1 =
n ∑ni=1 xi yi − (∑ni=1 xi )(∑ni=1 yi )
n ∑ni=1 xi2 − (∑ni=1 xi )2
(∑ni=1 xi2 )(∑ni=1 yi ) − (∑ni=1 xi )(∑ni=1 xi yi )
.
n ∑ni=1 xi2 − (∑ni=1 xi )2
Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt,
dass der (euklidische) Abstand vom n-Tupel der gegebenen (gemessenen
oder gerundeten) ungenauen Funktionswerte (y1 , . . . , yn ) zum n-Tupel der
berechneten Funktionswerte ( f (x1 ), . . . , f (xn )) möglichst klein ist, also
∑ni=1 (yi − (c2 xi + c1 ))2 möglichst klein ist. Der Graph dieser Funktion heißt
Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).
Man rechnet leicht nach, dass
1 n
1 n
f ( ∑ xi ) = ∑ yi
n i=1
n i=1
ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xn ) und (y1 , . . . , yn ) liegt
also immer auf der Regressionsgeraden.
KAPITEL 4
Mehr über lineare Funktionen
In diesem Kapitel sei K ein Körper.
§1. Der Graph einer linearen Funktion
Satz 45 : Seien V1 , . . . ,Vℓ Vektorräume über K. Dann wird das kartesische
Produkt
V1 × · · · ×Vℓ = {(x1 , . . . , xℓ ) | x1 ∈ V1 , . . . , xℓ ∈ Vℓ }
mit der komponentenweisen Addition
(x1 , . . . , xℓ ) + (y1 , . . . , yℓ ) := (x1 + y1 , . . . , xℓ + yℓ )
und der komponentenweisen Skalarmultiplikation
c(x1 , . . . , xℓ ) := (cx1 , . . . , cxℓ )
mit c ∈ K ein Vektorraum und heißt der Produktraum von V1 , . . . ,Vℓ .
Wenn (v11 , . . . , v1n1 ), . . . , (vℓ1 , . . . , vℓnℓ ) Basen von V1 , . . . ,Vℓ sind, dann
ist
((v11 , 0, . . . , 0), . . . , (v1n1 , 0, . . . , 0), . . .
. . . , ((0, . . . , 0, vℓ1 ), . . . , (0, . . . , 0, vℓnℓ ))
eine Basis von V1 × · · · ×Vℓ , insbesondere gilt
dimK (V1 × · · · ×Vℓ ) = dimK (V1 ) + · · · + dimK (Vℓ ) .
Beweis: Es ist leicht zu zeigen, dass V1 × · · · ×Vℓ mit der komponentenweisen Addition und Skalarmultiplikation ein Vektorraum. Wir beweisen daher
nur, dass
((v11 , 0, . . . , 0), . . . , (0, . . . , 0, vℓnℓ )) eine Basis von V1 × · · · ×Vℓ ist. Wir
schreiben x1 ∈ V1 , . . . , xℓ ∈ Vℓ als Linearkombinationen der Basen
(v11 , . . . , v1n1 ), . . . , (vℓ1 , . . . , vℓnℓ ):
n1
nℓ
i=1
i=1
x1 = ∑ d1i v1i , . . . , xℓ = ∑ dℓi vℓi .
Dann ist
(x1 , . . . , xℓ ) = (x1 , 0, . . . , 0) + · · · + (0, . . . , 0, xℓ )
n1
nℓ
i=1
i=1
= ∑ d1i (v1i , 0, . . . , 0) + · · · + ∑ dℓi (0, . . . , 0, vℓi )
21
22
4. MEHR ÜBER LINEARE FUNKTIONEN
und ((v11 , 0, . . . , 0), . . . , (0, . . . , 0, vℓnℓ )) ein Erzeugendensystem von
V1 × · · · ×Vℓ . Um die lineare Unabhängigkeit zu zeigen, seien
c11 , . . . , cℓnℓ ∈ K mit
n1
nℓ
i=1
i=1
∑ c1i(v1i, 0, . . . , 0) + · · · + ∑ cℓi(0, . . . , 0, vℓi) = (0, . . . , 0) .
Dann ist
n1
nℓ
i=1
i=1
( ∑ c1i v1i , . . . , ∑ cℓi vℓi ) = (0, . . . , 0) ,
also
n1
∑ c1iv1i = 0 , . . . ,
i=1
nℓ
∑ cℓivℓi = 0 .
i=1
Da (v11 , . . . , v1nℓ ), . . . , (vℓ1 , . . . , vℓnℓ ) Basen von V1 , . . . ,Vℓ sind, folgt c11 =
· · · = cℓnℓ = 0, was zu zeigen war.
Definition 46 : Seien V und W Vektorräume über K.
Eine Funktion f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind:
(1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) .
( Das Bild der Summe ist die Summe der Bilder.“)
”
(2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) .
( Das Bild des c-fachen ist das c-fache des Bildes.“)
”
Beispiel 47 : Ein Kaufhaus bietet n Waren an. Kauft jemand ai Einheiten
der i-ten Ware, 1 ≤ i ≤ n, so muss er p(a1 , . . . , an ) Euro zahlen. Die Funktion
p : Q n −→ Q , (a1 , . . . , an ) 7−→ p(a1 , . . . , an )
ist genau dann linear, wenn es keinen Mengenrabatt, keine Sonderaktionen
( nimm drei, zahl’ zwei“) oder ähnliches gibt, also:
”
(1) Nimmt man bei einem Einkauf ai und bei einem anderen Einkauf
bi Einheiten der i-ten Ware, 1 ≤ i ≤ n, dann bezahlt man in Summe
dasselbe, wie wenn man alles bei einem Einkauf genommen hätte
(p(a1 , . . . , an ) + p(b1 , . . . , bn ) = p(a1 + b1 , . . . , an + bn )).
(2) Kauft man von jeder Ware das c-fache, dann muss man c-mal soviel
zahlen (p(ca1 , . . . , can ) = c · p(a1 , . . . , an )).
Beispiel 48 : V sei ein Untervektorraum des K-Vektorraums F(K, K) aller Funktionen von K nach K und t0 , . . . ,tn seien paarweise verschiedene
Elemente von K. Dann ist die Auswertungsfunktion“
”
a : V −→ K n+1 , f 7−→ ( f (t0 ), f (t1 ), . . . , f (tn )),
linear.
23
4. MEHR ÜBER LINEARE FUNKTIONEN
Beispiel 49 : Für jede Matrix A ∈ K m×n ist die Funktion
K n×1 → K m×1 , x 7→ Ax ,
K-linear. Später werden wir sehen, dass jede lineare Funktion vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist.
Satz 50 : Es seien V und W Vektorräume über K und (vi )i∈I eine (beliebige)
Basis von V .
Eine Funktion f : V → W ist genau dann linear, wenn der Graph von f
ein Untervektorraum des Produktraums V ×W ist.
In diesem Fall hat der Graph von f die Basis ((vi , f (vi )))i∈I . Insbesondere gilt
dimK (Graph( f )) = dimK (V ) .
Beweis: Nach Definition ist Graph( f ) = {(v, f (v)) | v ∈ V } ⊂ V ×W . Seien
u, w ∈ V und c ∈ K. Wenn f linear ist, dann ist
0V ×W = (0V , 0W ) = (0V , f (0V )) ∈ Graph( f ),
(u, f (u))+(w, f (w)) = (u+w, f (u)+ f (w)) = (u+w, f (u+w)) ∈ Graph( f )
und
c(w, f (w)) = (cw, c f (w)) = (cw, f (cw)) ∈ Graph( f ),
also Graph( f ) ein Untervektorraum von V ×W . Wenn umgekehrt Graph( f )
ein Untervektorraum von V ×W ist, dann sind
(u, f (u)) + (w, f (w)) = (u + w, f (u) + f (w)) ∈ Graph( f ) und
c(w, f (w)) = (cw, c f (w)) ∈ Graph( f ), somit
f (u + w) = f (u) + f (w) und f (cw) = c f (w), also f linear.
Wenn f linear ist, dann ist auch die Funktion
F : V → Graph( f ) , x 7→ (x, f (x)) ,
linear und hat die Umkehrfunktion Graph( f ) → V , (x, f (x)) 7→ x. Daher ist
F ein Isomorphismus und (F(vi ))i∈I eine Basis von Graph( f ).
Beispiel 51 : Es sei k eine reelle Zahl und f die lineare Funktion
f : R −→ R, z 7−→ kz. Dann ist
Graph(f) = {(z, kz)|z ∈ R} = {z(1, k)|z ∈ R} = R(1, k) ⊆ R × R
die Gerade durch (0, 0) und (1, k).
Beispiel 52 : Es seien a, b reelle Zahlen und g die lineare Funktion
g : R2 −→ R, (x, y) 7−→ ax + by. Dann ist
Graph(g) = {(x, y, ax+by) | x, y ∈ R} = {x·(1, 0, a)+y·(0, 1, b) | x, y ∈ R} =
= R(1, 0, a) + R(0, 1, b) ⊆ R2 × R
24
4. MEHR ÜBER LINEARE FUNKTIONEN
die Ebene durch (0, 0, 0), (1, 0, a) und (0, 1, b).
§2. Bild und Kern einer linearen Funktion
In diesem Abschnitt seien V und W Vektorräume über K und
f : V −→ W eine lineare Funktion.
Definition 53 : Die Menge
Bild( f ) := { f (v) | v ∈ V } ⊆ W
heißt Bild von f und die Menge
Kern( f ) := {v ∈ V | f (v) = 0W } ⊆ V
heißt Kern von f .
Satz 54 : Bild( f ) ist ein Untervektorraum von W , Kern( f ) ist ein Untervektorraum von V .
Die Dimension des Bildes von f heißt Rang von f (Schreibweise rg( f )).
Beweis: Da f linear ist, ist 0V ∈ Kern( f ). Für u, v ∈ Kern( f ) und c ∈ K folgt
aus f (u + v) = f (u) + f (v) = 0W auch u + v ∈ Kern( f ), sowie aus f (cu) =
c f (u) = 0W auch cu ∈ Kern( f ). Daher ist Kern( f ) ein Untervektorraum von
V . Analog zeigt man, dass Bild( f ) ein Untervektorraum von W ist.
Satz 55 : Sei A ∈ K m×n und L(A, 0) := {x ∈ K n×1 | Ax = 0} der Lösungsraum des durch A definierten Systems homogener linearer Gleichungen.
Fasst man die Matrix A als lineare Funktion
A : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist Kern(A) = L(A, 0) und Bild(A) = K ⟨A−1 , . . . , A−n ⟩.
Beweis: Es ist Kern(A) = {x ∈ K n×1 | Ax = 0} = L(A, 0) und Bild(A) =
= { Ax | x ∈ K n×1 } = { ∑ni=1 xi A−i | x1 , . . . xn ∈ K } = K ⟨A−1 , . . . , A−n ⟩.
Satz 56 : Seien V,W endlich-dimensionale Vektorräume über K,
f : V → W eine K-lineare Funktion und r := rg( f ). Dann gibt es eine Basis
(v1 , . . . , vn ) von V so, dass
(1) ( f (v1 ), . . . , f (vr )) eine Basis von Bild( f ) und
(2) (vr+1 , . . . , vn ) eine Basis von Kern( f )
ist. Insbesondere gilt
dimK (V ) = dimK (Bild( f )) + dimK (Kern( f )) .
25
4. MEHR ÜBER LINEARE FUNKTIONEN
Ergänzt man die Basis ( f (v1 ), . . . , f (vr )) von Bild( f ) zu einer Basis
(w1 , . . . , wm ) von W , dann ist


1 0 ...
 .. ..

.
.
0

. .

 ∈ K m×n
.
.
Dr := 
.
.
1




0


..
.
(nur an den Stellen (1, 1), . . . , (r, r) stehen Einsen und sonst Nullen) die Matrix von f bezüglich der Basen (v1 , . . . , vn ) und (w1 , . . . , wm ).
Beweis: Sei (w1 , . . . , wr ) eine Basis von Bild( f ). Dann kann man Urbilder
v1 , . . . , vr ∈ V von w1 , . . . , wr unter f wählen. Sei (u1 , . . . , us ) eine Basis von
Kern( f ). Dann ist
(v1 , . . . , vr , u1 , . . . , us )
ein Erzeugendensystem von V , weil für y ∈ V aus
r
r
r
i=1
i=1
i=1
f (y) = ∑ ai wi = ∑ ai f (vi ) = f ( ∑ ai vi )
folgt, dass z := y − ∑ri=1 ai vi ∈ Kern( f ) ist. Daher ist y = z + ∑ri=1 ai vi eine
Linearkombination von (v1 , . . . , vr , u1 , . . . , us ).
Wir zeigen noch, dass (v1 , . . . , vr , u1 , . . . , us ) linear unabhängig ist. Seien
dazu c1 , . . . , cr , d1 , . . . , ds ∈ K mit
r
s
i=1
j=1
∑ ci vi + ∑ d j u j = 0 .
Dann ist 0 = f (∑ri=1 ci vi + ∑sj=1 d j u j ) = ∑ri=1 ci f (vi ) = ∑ri=1 ci wi .
Da (w1 , . . . , wr ) linear unabhängig ist, sind alle ci gleich 0. Dann ist
∑sj=1 d j u j = 0, und aus der linearen Unabhängigkeit von u1 , . . . , us folgt
d1 = · · · = ds = 0. Also ist (v1 , . . . , vr , u1 , . . . , us ) die gesuchte Basis von V .
Insbesondere ist r + s = n.
§3. Systeme linearer Gleichungen in koordinatenfreier Form
Definition 57 : Ein System linearer Gleichungen in koordinatenfreier Form
ist eine Aufgabe:
• Gegeben sind eine lineare Funktion f : V → W und ein Vektor y ∈ W .
• Gesucht ist eine gute Beschreibung“ der Menge
”
L( f , y) := f −1 ({y}) = {x ∈ V | f (x) = y}
aller Vektoren x ∈ V , für die f (x) = y ist.
26
4. MEHR ÜBER LINEARE FUNKTIONEN
Die Menge L( f , y) heißt Lösungsmenge des durch f und y gegebenen Systems linearer Gleichungen. Ihre Elemente heißen Lösungen dieses Systems.
Das durch f und y gegebene System linearer Gleichungen heißt homogen, wenn y = 0W ist, ansonsten inhomogen. Die Lösungsmenge eines
homogenen Systems linearer Gleichungen ist
L( f , 0) = Kern( f ) .
Satz 58 : Sei f : V → W K-linear, y ∈ W und z ∈ L( f , y) (also ist L( f , y)
insbesondere nicht leer). Dann ist
L( f , y) = z + Kern( f )
ein affiner Unterraum von V mit Aufpunkt z und parallelem Untervektorraum Kern( f ).
Das durch f und y gegebene System lösen“bedeutet daher: finde
”
(irgend)ein Urbild z von y unter f und (irgend)eine Basis von Kern( f ).
Falls V endlichdimensional ist, gilt weiters
dimK (L( f , y)) = dimK (V ) − rg( f ) .
Beweis: Sei v ∈ Kern( f ). Dann ist f (z + v) = f (z) + f (v) = y + 0 = y, also
z + v ∈ L( f , y).
Sei x ∈ L( f , y). Dann ist f (x − z) = f (x) − f (z) = y − y = 0, also x − z ∈
Kern( f ) und x = z + (x − z) ∈ {z + v | v ∈ Kern( f )}.
Nach Satz 56 ist dimK (Kern( f )) = dimK (V ) − rg( f ) .
Beispiel 59 : Fasst man eine Matrix A ∈ K m×n als eine lineare Funktion
f : K n×1 → K m×1 , x 7→ Ax ,
auf, dann ist L( f , y) = L(A, y).
Beispiel 60 : Sei C( R , R ) := { f | f : R → R stetig},
C1 ( R , R ) := { f | f : R → R stetig differenzierbar} und
D : C1 ( R , R ) → C( R , R ) , f 7→ f ′ ,
wobei f ′ die Ableitung der Funktion f bezeichnet. Dann sind C( R , R )
und C1 ( R , R ) mit der punktweisen Addition und Skalarmultiplikation Vektorräume über R , und die Funktion D ist R -linear. Der Unterraum Kern(D)
besteht aus allen konstanten Funktionen. Eine Funktion f ∈ C1 ( R , R ) heißt
Stammfunktion von g ∈ C( R , R ), wenn D f = g ist. Die Menge aller Stammfunktionen von g ist
L(D, g) = f + Kern(D).
27
4. MEHR ÜBER LINEARE FUNKTIONEN
Satz 61 : Seien V,W Vektorräume über K der Dimensionen n, m mit Basen
v , w , sei f : V → W K-linear mit Matrix
A := M( f , v, w) ∈ K m×n
und y = wb ∈ W . Dann bildet der Koordinaten-Isomorphismus
V → K n×1 , vc 7→ c ,
L( f , y) auf L(A, b) ab und Kern( f ) auf L(A, 0).
Beweis: Es ist vc ∈ L( f , y) genau dann wenn w(Ac) = wb, also c ∈ L(A, b)
ist.
Nach Satz 61 kann für f : V → W und y ∈ W das System linearer Gleichungen ( f , y) wie folgt gelöst werden:
(1) Wähle Basen v , w von V,W .
(2) Berechne die Matrix A := M( f , v, w) und die Koordinatenspalte b
von y bezüglich w .
(3) Berechne die Lösungsmenge L(A, b).
Wenn L(A, b) leer ist, dann ist auch L( f , y) leer.
Wenn z ∈ L(A, b) und (u1 , . . . , us ) eine Basis von L(A, 0) ist, dann ist
vz ∈ L( f , y) und (vu1 , . . . , vus ) eine Basis von Kern( f ).
Im Schulunterricht entsprechen Systeme linearer Gleichungen in koordinatenfreier Form gewissen Textaufgaben“, und die Umwandlung in die
”
Form Ax = b nennt man den Ansatz finden“.
”
Beispiel 62 : Wir suchen alle Polynomfunktionen p ∈ R [x] mit
p(−1) = 2, p(1) = 1, p(2) = 1 und gr(p) < 5 .
Sei V := {q ∈ R [x] | gr(q) < 5}, W := R 3 ,
f : V −→ W , q 7−→ (q(−1), q(1), q(2)) ,
und y := (2, 1, 1) ∈ W . Die Funktion f ist linear.
Wir wählen die Basis v := (1, x, x2 , x3 , x4 ) von V und die Standardbasis
w := (e1 , e2 , e3 ) von W = R 3 . Dann ist


 
1 −1 1 −1 1
2
A := M( f , v, w) := 1 1 1 1 1  und b := 1 .
1 2 4 8 16
1
Man berechnet mit dem Gauß-Verfahren
 
 
 4 
−4
−2
3
0
1
− 1 
 
 
 2
1 + R  2 + R  5  .
L(A, b) = 
 
 
 6 
0
−1
 0 
−1
0
0
28
Daher ist
4. MEHR ÜBER LINEARE FUNKTIONEN
4 1
1
L( f , y) = { − x + x2 +
3 2
6
2
3
+c(−2 + x + 2x − x ) + d(−4 + 5x2 − x4 ) | c, d ∈ R } .
Satz 63 : Sei V ein endlich-dimensionaler Vektorraum über K und Z ein
affiner Unterraum von V . Dann ist Z die Lösungsmenge eines Systems linearer Gleichungen, d.h. es gibt eine lineare Funktion
f : V → W und einen Vektor y ∈ W mit
Z = L( f , y) .
(Dann ist Z durch f und y in impliziter Form“ gegeben).
”
Wenn der affine Unterraum Z durch einen Aufpunkt p und eine Basis
(u1 , . . . , uk ) des parallelen Untervektorraums gegeben ist, dann kann ein
solches System linearer Gleichungen auf die folgende Weise berechnet werden:
Ergänze (u1 , . . . , uk ) zu einer Basis (u1 , . . . , uk , uk+1 , . . . , un ) von V .
Setze
f : V −→ K n−k ,
n
∑ ciui 7−→ (ck+1, ck+2, . . . , cn)
i=1
und y := f (p).
Beweis: Seien f und y wie im Satz definiert. Dann ist Kern( f ) =
=K < u1 , . . . , uk > und p ∈ L( f , y). Nach Satz 58 ist Z = L( f , y).
Herunterladen