Vertiefung Lineare Algebra 1 Schriftliche Unterlagen zur Vorlesung

Werbung
Vertiefung Lineare Algebra 1
Schriftliche Unterlagen zur Vorlesung
im Wintersemester 2011/12
Franz Pauer
c 2011 I NSTITUT F ÜR M ATHEMATIK , U NIVERSIT ÄT I NNSBRUCK
⃝
KAPITEL 1
Vertiefung zu Kap. 2, §3
In diesem Kapitel sei K ein Körper.
§1. Erzeugendensysteme, lineare Unabhängigkeit und Basen
In der Vorlesung Lineare Algebra 1“ wurde der Begriff Linearkom”
bination eines n-Tupels von Vektoren eingeführt. Wir erweitern diesen Begriff nun auf beliebige (auch unendliche) Familien (vi )i∈I von Vektoren. Die
Definition im Skriptum Lineare Algebra 1 entspricht dann dem Spezialfall
I := {1, . . . , n}.
Definition 1 : Sei V ein Vektorraum über K und I eine (beliebige) Menge.
Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn
ci ̸= 0 für nur endlich viele i ∈ I ist.
Sei (vi )i∈I eine Familie von Vektoren in V .
Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine
Koeffizientenfamilie (ci )i∈I gibt, sodass
w=
∑
ci vi
i∈I,ci ̸=0
ist. Wir schreiben im weiteren einfach
∑ ci vi
anstatt
∑
ci vi .
i∈I,ci ̸=0
i∈I
Die Menge aller Linearkombinationen von (vi )i∈I ist ein Untervektorraum
von V und enthält alle Vektoren vi , i ∈ I. Er heißt der von vi , i ∈ I, erzeugte
Untervektorraum von V und wird mit
K ⟨vi
| i ∈ I⟩
oder
∑ Kvi
i∈I
bezeichnet.
Definition 2 : Sei V ̸= {0} ein Vektorraum über K. Eine Familie (vi )i∈I
von Vektoren in V heißt genau dann ein Erzeugendensystem von V bzw. linear unabhängig in V bzw. eine Basis von V , wenn jeder Vektor in V auf
mindestens eine bzw. höchstens eine bzw. genau eine Weise als Linearkombination von (vi )i∈I geschrieben werden kann.
Wir schreiben linear abhängig anstatt nicht linear unabhängig.
Die leere Menge ist eine Basis von {0}.
1
1. VERTIEFUNG ZU KAP. 2, §3
2
Satz 3 : Sei V ̸= {0} ein Vektorraum über K und (vi )i∈I eine Familie von
Vektoren in V .
(1) Eine Basis von V ist ein linear unabhängiges Erzeugendensystem.
(2) Die Familie (vi )i∈I von Vektoren ist genau dann ein Erzeugendensystem von V , wenn
K ⟨vi
| i ∈ I⟩ = V
ist.
(3) Die Familie (vi )i∈I von Vektoren ist genau dann linear unabhängig,
wenn für jede Koeffizientenfamilie (ci )i∈I aus
∑ civi = 0
i∈I
folgt, dass
ci = 0 für alle i ∈ I
ist.
Beweis:
(1) und (2) folgen aus der Definition der Begriffe Erzeugendensystem,
linear unabhängig und Basis.
(3) Wenn sich jeder Vektor aus V auf höchstens eine Weise als Linearkombination von (vi )i∈I schreiben lässt, dann folgt aus
∑ civi = 0V = ∑ 0K vi
i∈I
i∈I
auf Grund der Eindeutigkeit ci = 0K für 1 ≤ i ≤ n.
Sei umgekehrt (vi )i∈I linear unabhängig in V und w ∈ V so, dass es
eine Koeffizientenfamilie (ci )i∈I mit
w = ∑ ci vi
i∈I
gibt. Falls (di )i∈I eine weitere Koeffizientenfamilie mit
w = ∑ di vi
i∈I
ist, erhält man
0V = w − w = ∑ ci vi − ∑ di vi = ∑(ci − di )vi .
i∈I
i∈I
i∈I
Nach Annahme folgt ci − di = 0K für alle i ∈ I, also ci = di für alle
i ∈ I.
Beispiel 4 : Die Familie
(Ekℓ )1≤k≤m = (Ekℓ )(k,ℓ)∈{1,...,m}×{1,...,n}
1≤ℓ≤n
1. VERTIEFUNG ZU KAP. 2, §3
3
der Standard-Matrizen ist eine Basis von K m×n und heißt die Standardbasis
von K m×n .
Für A ∈ K m×n ist
A = ∑ Akℓ Ekℓ ,
1≤k≤m
1≤ℓ≤n
also ist A die Koordinatenfamilie von A bezüglich der Standardbasis
(Ekℓ )1≤k≤m (und Akℓ die Koordinate von A bei Ekℓ ).
1≤ℓ≤n
Beispiel 5 : Es seien I eine endliche Menge und V die Menge aller Funktionen von I in einen Körper K. Für i ∈ I sei δi die durch
δi ( j) := δi j , j ∈ I,
definierte Funktion von I nach K. Dann ist die Familie
(δi )i∈I
eine K-Basis von V . Für f ∈ V ist
f = ∑ f (i)δi .
i∈I
Beispiel 6 : Es sei K ein Körper und F := {(ai )i∈N | ai ∈ K, i ∈ N} die Menge aller Folgen in K. Mit den durch
(ai )i∈N + (bi )i∈N := (ai + bi )i∈N und c · (ai )i∈N := (cai )i∈N
definierten Rechenoperationen wird F zu einem Vektorraum. Mit ei (i ∈ N)
bezeichnen wir die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der i-ten Stelle steht. Die Familie (ei )i∈N ist linear unabhängig, aber kein Erzeugendensystem von F. Zum Beispiel kann die Folge (1, 1, 1, . . . , 1, . . .) nicht als Linearkombination der Familie (ei )i∈N geschrieben werden.
Der von der Familie (ei )i∈N erzeugte Untervektorraum ist die Menge
aller Folgen, von denen nur endlich viele Folgenglieder nicht 0 sind. Er
heißt Vektorraum der endlichen Folgen in K. Die Familie (ei )i∈N ist eine
Basis dieses Vektorraums, daher ist er unendlich-dimensional.
§2. Rechnen mit Koordinaten
In diesem Abschnitt seien V und W endlich-dimensionale Vektorräume
über K, n ∈ N die Dimension von V und v := (v1 , . . . , vn ) eine Basis von V .
Definition 7 : Seien p und q positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p
1. VERTIEFUNG ZU KAP. 2, §3
4
ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei
(
)
p
p
(
)
uT := (uT )1 , . . . , (uT )q := ∑ Ti1 ui , . . . , ∑ Tiq ui ∈ V q .
i=1
i=1
Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j ∈ V nach der Regel
Zeile u mal Spalte T− j“
”
berechnet.
Satz 8 : Seien p, q, r positive ganze Zahlen und
u := (u1 , . . . , u p ) ∈ V p . Dann gilt:
(1) uI p = u
(2) Für T ∈ K p×q und U ∈ K q×r ist u(TU) = (uT )U .
(3) Für T ∈ GL p (K) und u′ := uT gilt u = u′ T −1 .
Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus
u = uI p = u(T T −1 ) = (uT )T −1 = u′ T −1 .
Definition 9 : Seien w ∈ V und c1 , . . . , cn ∈ K die Koordinaten von w bezüglich v, also
n
w = ∑ ci vi = vc ∈ V ,
i=1
Dann heißt die Spalte
 
c1
 ...  ∈ K n×1
cn
die Koordinatenspalte von w bezüglich v.
Satz 10 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt:
(1) Es gibt genau eine Matrix T ∈ K n×q mit
u = vT .
Diese Matrix T heißt die Transformationsmatrix von v zu u, und die
Spalten von T sind die Koordinatenspalten von u1 , . . . , uq bezüglich
v.
(2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar
ist.
Beweis:
5
1. VERTIEFUNG ZU KAP. 2, §3
(1) Sei T ∈ K n×k jene Matrix, die sich durch Nebeneinanderschreiben
der Koordinatenspalten von u1 , . . . , uk bezüglich v ergibt. Dann ist
u j = vT− j für 1 ≤ j ≤ k, also u = vT . Wenn umgekehrt u = vS mit
S ∈ K n×k ist, d.h. u j = vS− j für 1 ≤ j ≤ k, dann ist S− j die Koordinatenspalte von u j bezüglich v für 1 ≤ j ≤ k.
(2) Wenn T ∈ GLn (K) ist, dann ist v = uT −1 nach Satz 8, also sind die
Vektoren v1 , . . . , vn Linearkombinationen von u1 , . . . , un , somit ist
K ⟨u1 , . . . , un ⟩ = V und, weil V n-dimensional ist, (u1 , . . . , un ) eine Basis von V . Wenn umgekehrt u eine Basis von V ist, dann gibt es eine Matrix U ∈ K n×n mit v = uU. Weil u eine Basis ist, folgt aus
uIn = vT = u(UT ), dass UT = In ist und analog TU = In , also ist
T ∈ GLn (K).
Satz 11 : Sei u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von w ∈ V bezüglich v, dann
ist
T −1 c
die Koordinatenspalte von w bezüglich u , d.h. bei Basiswechsel mit der
Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 .
”
Beweis: Es ist w = vc = (uT −1 )c = u(T −1 c).
Beispiel 12 : Wir betrachten die Ebene E nach Wahl eines Nullpunktes als
Vektorraum. Wir wählen Punkte P1 , P2 so, dass P := (P1 , P2 ) eine Basis von
E ist. Es sei
3
1
1
Q := (Q1 , Q2 ) := ( P1 + 2P2 , P1 + P2 ) .
2
2
2
Dann ist Q = PT , wobei
3 1
T := 
2
2
2
1
2

ist. Man prüft leicht nach, dass T invertierbar ist und dass
(
)
−2 2
−1
T =
8 −6
ist. Daher ist P = QT −1 = (−2Q1 + 8Q2 , 2Q1 − 6Q2 ).
( )
1
Der Punkt P1 + 2P2 hat bezüglich P die Koordinatenspalte
und
2
( ) ( )
1
2
bezüglich Q die Koordinatenspalte T −1
=
.
2
−4
Somit ist P1 + 2P2 = 2Q1 − 4Q2 .
KAPITEL 2
Vertiefung zu Kap. 3, §2
§1. Strahlensatz
Satz 13 : ( Strahlensatz“)
”
Es seien Z1 , Z2 zwei verschiedene, einander im Punkt 0 schneidende Geraden in V , v1 , v2 Punkte auf Z1 \ {0} und w1 , w2 Punkte auf Z2 \ {0}. Dann
gibt es c, d ∈ K \ {0} so, dass
v2 = cv1
und w2 = dw1
ist. Mit L1 bzw. L2 bezeichnen wir die Geraden durch die Punkte v1 und w1
bzw. v2 und w2 . Dann gilt:
(1) L1 und L2 sind genau dann parallel, wenn c = d ist.
(2) Wenn L1 und L2 parallel sind, dann ist v2 − w2 = c(v1 − w1 ).
Z1
v2
v1
0
w1
L1
w2
L2
Z2
A BBILDUNG 1. Strahlensatz
Beweis:
(1) Der zu L1 bzw. L2 parallele Untervektorraum ist K(v1 − w1 ) bzw.
K(cv1 − dw1 ). Weil die Geraden Z1 und Z2 verschieden sind, sind die
Vektoren v1 und w1 linear unabhängig. Daher ist K(v1 − w1 ) genau
dann gleich K(cv1 − dw1 ), wenn c = d ist.
6
2. VERTIEFUNG ZU KAP. 3, §2
7
(2) Wenn L1 und L2 parallel sind, ist c = d und
v2 − w2 = cv1 − cw1 = c(v1 − w1 ) .
Satz 14 : Es seien V ein Vektorraum über einem Körper K und Z1 = p1 +
U1 , Z2 = p2 +U2 affine Unterräume von V mit Aufpunkten p1 , p2 und parallelen Untervektorräumen U1 , U2 . Wenn Z1 und Z2 parallel sind, dann ist
Z1 ⊆ Z2 oder Z2 ⊆ Z1 oder Z1 ∩ Z2 = 0.
/
Beweis: Wir nehmen o.E.d.A. an, dass U1 ⊆ U2 ist. Wenn Z1 ∩ Z2 nicht leer
ist, dann gibt es ein p ∈ Z1 ∩ Z2 . Daher ist Z1 = p +U1 ⊆ p +U2 = Z2 .
§2. Affine Hülle
Es sei K ein Körper und V ein Vektorraum über K.
Definition 15 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V . Eine Linearkombination ∑i∈I ci vi von (vi )i∈I heißt affine Kombination
von (vi )i∈I , wenn ∑i∈I ci = 1 ist. Die Menge aller affinen Linearkombinationen von (vi )i∈I heißt affine Hülle von (vi )i∈I .
Beispiel 16 : Die affine Hülle von zwei Vektoren v1 und v2 ist ein Punkt,
wenn v1 = v2 ist, bzw. die Gerade
{c1 v1 + c2 v2 | c1 , c2 ∈ K, c1 + c2 = 1} = {v1 + c(v2 − v1 ) | c ∈ K},
wenn v1 ̸= v2 ist.
Satz 17 :
(1) Es seien M ein affiner Unterraum von V und (vi )i∈I eine endliche
Familie in M. Dann ist die affine Hülle von (vi )i∈I in M enthalten.
(2) Die affine Hülle einer Familie (vi )i∈I in V ist ein affiner Unterraum
von V . Der dazu parallele Untervektorraum wird von
(vi − v j )i∈I, i̸= j erzeugt, wobei j ∈ I beliebig gewählt werden kann.
(3) Die affine Hülle von (vi )i∈I ist der (bezüglich Inklusion) kleinste affine Unterraum, der alle vi , i ∈ I, enthält.
Beweis:
2. VERTIEFUNG ZU KAP. 3, §2
8
(1) Sei p ∈ M, U der zu M parallele Untervektorraum und (ci )i∈I eine
Familie in K mit ∑i∈I ci = 1. Dann ist
(
)
(
)
∑ civi = ∑ ci
i∈I
p−
i∈I
∑ ci
i∈I
p + ∑ ci vi =
i∈I
= p + ∑ ci (vi − p) ∈ p +U = M.
i∈I
(2) Sei j ∈ I und
M := v j + K ⟨vi − v j ; i ∈ I, i ̸= j⟩.
Dann ist (vi )i∈I eine Familie in M und nach (1) ist ihre affine Hülle
in M enthalten.
Sei umgekehrt (di )i∈I eine Familie in K.
Dann ist




v j + ∑ di (vi − v j ) = ∑ di vi + 1 − ∑ di  v j
i∈I
i̸= j
i∈I
i̸= j
i∈I
i̸= j
eine affine Linearkombination von (vi )i∈I . Daher ist jedes Element
von M in der affinen Hülle von (vi )i∈I enthalten.
(3) Folgt aus (1) und (2).
Definition 18 : Affine Unterräume von V heißen kollinear bzw. koplanar,
wenn sie alle in einer Geraden bzw. Ebene in V enthalten sind.
Satz 19 :
(1) Drei Punkte v1 , v2 , v3 ∈ V sind genau dann kollinear, wenn die Vektoren v2 − v1 und v3 − v1 linear abhängig sind.
(2) Vier Punkte v1 , v2 , v3 , v4 ∈ V sind genau dann koplanar, wenn die
Vektoren v2 − v1 , v3 − v1 und v4 − v1 linear abhängig sind.
(3) Zwei Geraden p1 + Kv1 und p2 + Kv2 sind genau dann koplanar,
wenn die Vektoren p1 − p2 , v1 und v2 linear abhängig sind.
Beweis: Die ersten zwei Aussagen folgen aus Satz 17, (2). Der zur affinen Hülle von (p1 , p2 , p1 + v1 , p2 + v2 ) parallele Untervektorraum wird von
p1 − p2 , v1 und v2 erzeugt.
Satz 20 : Zwei verschiedene koplanare Geraden schneiden einander in genau einem Punkt oder sie sind parallel.
2. VERTIEFUNG ZU KAP. 3, §2
9
Beweis: Seien M1 und M2 verschiedene koplanare Geraden und E die Ebene, die beide enthält. Wenn M1 und M2 nicht parallel sind, dann ist U1 ∩U2 =
{0} und U1 + U2 = U1 ⊕ U2 ist der zu E parallele Untervektorraum. Wegen p1 , p2 ∈ E ist p1 − p2 ∈ U1 ⊕ U2 , daher gibt es eindeutig bestimmte Vektoren u1 ∈ U1 , u2 ∈ U2 so, dass p1 − p2 = u1 + u2 ist. Somit ist
M1 ∩ M2 = {p1 − u1 } = {p2 + u2 }.
§3. Polytope und Schwerpunkte
Es seien K = Q oder R und V ein Vektorraum über K.
Definition 21 : Es seien I eine endliche Menge und (vi )i∈I eine Familie in
V.
Eine Linearkombination ∑ ci vi von (vi )i∈I heißt konvexe Linearkombinatii∈I
on von (vi )i∈I , wenn ∑ ci = 1 und ci ≥ 0 für alle i ∈ I ist.
i∈I
Die Menge der konvexen Linearkombinationen von (vi )i∈I heißt konvexe
Hülle von (vi )i∈I .
Die konvexe Hülle zweier Vektoren v1 , v2 heißt Strecke zwischen v1 und v2 .
Die konvexe Hülle dreier nicht kollinearer Punkte v1 , v2 , v3 heißt Dreieck
mit Eckpunkten v1 , v2 , v3 .
Eine Teilmenge von V heißt Polytop, wenn sie die konvexe Hülle einer endlichen Familie in V ist.
Es sei I := {1, . . . , n} und c1 , . . . , cn ∈ R ≥0 . Für cn ̸= 1 ist
)
ci
∑ civi = (1 − cn) ∑ 1 − cn vi + cnvn = (1 − cn)w + cnvn ,
i=1
i=1
n
(
n−1
ci
wobei w := ∑n−1
i=1 1−cn vi in der konvexen Hülle H von (v1 , . . . , vn−1 ) liegt.
Daraus folgt: Für n ≥ 3 ist die konvexe Hülle von (v1 , . . . , vn ) die Vereinigung aller Strecken zwischen vn und den Elementen von H.
Beispiel 22 : Eine Teilmenge von R ist genau dann ein Polytop, wenn sie
ein abgeschlossenes Intervall ist.
( )
Satz 23 : Es seien P die konvexe Hülle einer Familie w j j∈J in V und
(vi )i∈I eine Familie in P. Dann ist die konvexe Hülle von (vi )i∈I in P enthalten.
2. VERTIEFUNG ZU KAP. 3, §2
10
Beweis: Für (alle)i ∈ I ist der Vektor vi eine konvexe Linearkombination
∑ c ji w j von w j j∈J .
j∈J
Sei ∑ di vi eine konvexe Linearkombination von (vi )i∈I . Dann ist
i∈I
(
)
∑ divi = ∑ ∑ dic jiw j = ∑ ∑ dic ji
i∈I
i∈I j∈J
j∈J
wj
i∈I
mit ∑ di c ji ≥ 0, für alle j ∈ J, und
i∈I
)
(
∑ ∑ dic ji
j∈J
i∈I
(
= ∑ di
i∈I
)
∑ c ji
j∈J
= ∑ di = 1 .
i∈I
Daher ist ∑ di vi ∈ P .
i∈I
Definition 24 : Es sei (vi )i∈I eine endliche Familie in V .
Der Schwerpunkt von (vi )i∈I ist
1
vi .
# (I) ∑
i∈I
Der Schwerpunkt von (v1 , v2 ) heißt Mittelpunkt der Strecke zwischen v1
und v2 .
Satz 25 : Es seien u, v, w drei nicht kollineare Punkte in V . Die Gerade
durch u bzw. v bzw. w und den Mittelpunkt der Strecke zwischen den anderen
zwei Punkten heißt Schwerlinie des Dreiecks mit Eckpunkten u, v, w durch u
bzw. v bzw. w.
Die drei Schwerlinien sind paarweise verschieden und schneiden einander
im Schwerpunkt 31 (u + v + w) von (u, v, w) .
Beweis: Da u, v, w nicht kollinear sind, sind nach Satz 19 die Vektoren v − u
und w − u linear unabhängig. Also sind auch
v − u und
1
1
1
(v − u) + (w − u) = (v + w) − u
2
2
2
linear unabhängig, nach Satz 19 sind daher u, v, 12 (v + w) nicht kollinear.
Somit liegt v nicht auf der Schwerlinie durch u . Daher sind die Schwerlinien durch u und durch v verschieden und die drei Schwerlinien haben
11
2. VERTIEFUNG ZU KAP. 3, §2
höchstens einen Schnittpunkt. Wegen
(
)
(
)
1
1
2 1
1
2 1
(u + v + w) = u +
(v + w) = v +
(u + w) =
3
3
3 2
3
3 2
(
)
1
2 1
= w+
(u + v)
3
3 2
liegt der Schwerpunkt auf allen Schwerlinien.
§4. Affine Räume
Definition 26 : Es seien (G, ⋆) eine Gruppe mit neutralem Element e und
M eine Menge. Eine Funktion G × M −→ M , (s, m) 7−→ s · m , ist eine Operation der Gruppe G auf der Menge M, wenn gilt:
für alle m ∈ M ist e · m = m und
für alle s,t ∈ G und alle m ∈ M ist (s ⋆ t) · m = s · (t · m).
Beispiel 27 : Die Funktion
Sn × {1, 2, . . . , n} → {1, 2, . . . , n} , (σ , i) 7→ σ (i) ,
ist eine Operation der Permutationsgruppe Sn auf der Menge
{1, 2, . . . , n}.
Definition 28 : Sei V ein Vektorraum über einem Körper K, A eine Menge
und
V × A → A , (v, a) 7→ v · a ,
eine Operation der Gruppe (V, +) auf A. (Also: Für alle a ∈ A, v, w ∈ V ist
0 · a = a und (v + w) · a = v · (w · a).
A zusammen mit dieser Operation ist ein affiner Raum über V , wenn es für
alle Elemente a, b ∈ A genau einen Vektor v ∈ V gibt mit v · a = b.
Die Elemente von A heißen dann Punkte, die Elemente von V Vektoren des
affinen Raums.
Satz 29 : Sei A ein affiner Raum über V und a ∈ A. Die Funktion
V −→ A , v 7−→ v · a ,
ist bijektiv. (Nach Wahl eines Nullpunktes“ kann ein affiner Raum als Vek”
torraum betrachtet werden).
Beweis: Folgt aus der Definition.
12
2. VERTIEFUNG ZU KAP. 3, §2
Beispiel 30 : Sei V ein Vektorraum, p ∈ V und U ein Untervektorraum von
V . Dann ist der affine Unterraum p +U mit
U × (p +U) −→ p +U (v, p + u) 7−→ p + (u + v) ,
ein affiner Raum über U. Insbesondere ist jeder Vektorraum ein affiner
Raum (über sich selbst).
Beispiel 31 : Sie E die Zeichenebene oder der Anschauungsraum und T (E)
der Vektorraum der Translationen von E. Dann ist E mit
T (E) × E −→ E , (t, x) 7−→ t(x) ,
ein affiner Raum über T (E).
Möchte man in der Zeichenebene keinen Nullpunkt“ wählen, kann man
”
sie als affinen Raum betrachten. Dann muss man zwischen Punkten (∈ E)
und Vektoren (∈ T (E)) unterscheiden. Punkte können dann nicht addiert
werden, aber Vektoren können addiert werden und auf Punkten wirken“.
”
Sind P und Q Punkte von E und P ̸= Q, dann gibt es genau eine Trans⃗ bezeichnet. Die
lation in T (E), die P auf Q abbildet. Sie wird häufig mit PQ
Menge
⃗ |t ∈ R } ⊆ T (E)
{t PQ
⃗ in T (E). Die Gerade durch P und
ist die Gerade durch 0T (E) = idE und PQ
”
Q in E“ ist dann als
⃗
{(t PQ)(P)
|t ∈ R } ⊆ E
⃗
⃗
definiert. Wegen (PQ)(P)
= Q und (0 · PQ)(P)
= idE (P) = P sind P und
⃗ wird als Richtungsvektor“
Q Punkte dieser Geraden. Die Translation PQ
”
dieser Geraden bezeichnet.
KAPITEL 3
Vertiefung zu Kap. 3, §3-5
§1. Mehr über Skalarprodukte
In diesem Abschnitt sei V ein reeller Vektorraum und ⟨−, −⟩ ein Skalarprodukt auf V .
Definition 32 : Ein reeller Vektorraum mit einem Skalarprodukt heißt reeller Prähilbertraum. Ein endlich-dimensionaler reeller Prähilbertraum heißt
euklidischer Raum.
Beispiel 33 : (Für Studierende mit Kenntnissen aus Analysis). Es seien a, b
reelle Zahlen mit a < b und V der Vektorraum aller stetigen Funktionen
vom Intervall [a, b] nach R . Die Funktion
⟨−, −⟩ : V ×V −→ R ,
( f , g) 7−→
∫ b
a
f (x) · g(x)dx ,
ist ein Skalarprodukt auf V . Die Norm von f ∈ V ist
√
∥f∥ =
∫ b
f (x)2 dx
.
a
Satz 34 : (Parallelogrammgleichung) Für alle Vektoren v und w in einem
reellen Prähilbertraum ist
∥v + w∥2 + ∥v − w∥2 = 2∥v∥2 + 2∥w∥2 .
Beweis: Nachrechnen.
Definition 35 : Eine Norm auf V ist eine Funktion
N : V −→ R ≥0 := {t ∈ R |t ≥ 0} , v 7−→ N(v) ,
mit den Eigenschaften:
(1) Es ist N(v) = 0 genau dann, wenn v = 0 ist.
(2) Für alle c ∈ R , v ∈ V ist N(cv) = |c|N(v) .
(3) Für alle v, w ∈ V ist N(v + w) ≤ N(v) + N(w) .
V zusammen mit einer Norm heißt normierter Raum .
13
3. VERTIEFUNG ZU KAP. 3, §3-5
14
Beispiel 36 : Ist ⟨−, −⟩ ein Skalarprodukt auf V , dann ist
√
∥ · ∥ : V −→ R , v 7−→ ∥v∥ := ⟨v, v⟩,
eine Norm.
Beispiel 37 : Die Funktion
n
N : R −→ R ≥0 , (c1 , c2 , . . . , cn ) 7−→ ∑ |ci | ,
n
i=1
Rn .
ist eine Norm (die Summennorm“) auf
”
Die Parallelogrammgleichung gilt für diese Norm nicht, zum Beispiel ist
für n = 2, v := (2, 1) und w := (1, 2):
N(v + w)2 + N(v − w)2 = 36 + 4 = 40, aber
2 · N(v)2 + 2 · N(w)2 = 18 + 18 = 36.
Satz 38 : N sei eine Norm auf V .
Dann sind die folgenden Aussagen äquivalent:
(1) Die Parallelogrammgleichung gilt für N, dh.: Für alle v, w ∈ V ist
N(v + w)2 + N(v − w)2 = 2 · N(v)2 + 2 · N(w)2 .
(2) Es gibt ein Skalarprodukt
√ ⟨−, −⟩, das die Norm N induziert, dh.: für
alle v ∈ V ist N(v) = ⟨v, v⟩.
In diesem Fall ist dieses Skalarprodukt von v, w ∈ V durch
1
⟨v, w⟩ := (N(v + w)2 − N(v − w)2 )
4
definiert.
Beweis: Wenn (2) gilt, dann folgt (1) aus Satz 34.
Wenn (1) gilt, dann kann damit nachgeprüft werden, dass die oben definierte
Funktion ⟨−, −⟩ die Eigenschaften eines Skalarproduktes hat.
Definition 39 : Eine Familie (vi )i∈I in V heißt orthonormal bezüglich
⟨−, −⟩, wenn für alle i, j ∈ I gilt:
⟨vi , v j ⟩ = δi j .
Eine Familie (vi )i∈I in V heißt Orthonormalbasis (kurz: ON-Basis) von V
bezüglich ⟨−, −⟩, wenn sie eine Basis von V und orthonormal bezüglich
⟨−, −⟩ ist.
Beispiel 40 : Es sei V der Vektorraum der endlichen Folgen in R. Für i ∈ N
bezeichnen wir mit ei die Folge (0, . . . , 0, 1, 0, . . . , 0, . . .), wobei 1 an der
15
3. VERTIEFUNG ZU KAP. 3, §3-5
i-ten Stelle steht. Die Familie (ei )i∈N ist eine Basis von V . Durch
⟨a, b⟩ :=
∑ aibi , für alle Folgen a, b in
N
i∈N
wird ein Skalarprodukt auf V definiert. Die Familie (ei )i∈N ist eine ONBasis bezüglich dieses Skalarproduktes.
Satz 41 : Eine orthonormale Familie ist linear unabhängig.
Insbesondere: Wenn V endlich-dimensional ist, dann ist jede orthonormale
Familie mit dimK (V ) Elementen eine ON-Basis von V .
Beweis: Sei (vi )i∈I eine orthonormale Familie und (ci )i∈I eine Koeffizienten-Familie in K. Wenn ∑i∈I ci vi = 0 ist, dann ist für alle j ∈ I auch
0 = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = c j .
i∈I
i∈I
Satz 42 : Sei w ∈ V und (vi )i∈I eine ON-Basis von V . Dann ist
w = ∑⟨vi , w⟩vi .
i∈I
( Die Koordinate von w bei vi ist das Skalarprodukt von vi mit w“.)
”
Beweis: Sei w = ∑i∈I ci vi . Dann ist
⟨v j , w⟩ = ⟨v j , ∑ ci vi ⟩ = ∑ ci ⟨v j , vi ⟩ = ∑ ci δ ji = c j .
i∈I
i∈I
i∈I
§2. Interpolationsaufgaben
Wir betrachten die folgenden Interpolationsaufgaben:
Gegeben sind
• Funktionen f1 , . . . , fk von R nach R,
• paarweise verschiedene reelle Zahlen x1 , . . . , xn ∈ R und
• reelle Zahlen y1 , . . . , yn ∈ R.
Gesucht sind reelle Zahlen c1 , . . . , ck so, dass die Funktion f := ∑ki=1 ci fi
die Bedingungen
f (x1 ) = y1 , f (x2 ) = y2 , . . . , f (xn ) = yn
erfüllt.
r
y1
x1
r
r
y2
x2
r
y3
x3
y4
x4
16
3. VERTIEFUNG ZU KAP. 3, §3-5
Durch die Funktionen f1 , . . . , fk wird der Typ“ der Interpolationsaufgabe
”
vorgegeben. Die reellen Zahlen x1 , . . . , xn heißen Stützstellen, die reellen
Zahlen y1 , . . . , yn (Funktions-)Werte der Interpolationsaufgabe. Die gesuchte Funktion f heißt interpolierende Funktion.
Wir suchen also eine Funktion f des vorgegebenen Typs so, dass die
Funktionswerte von f in den Stützstellen die vorgegebenen Werte der Interpolationsaufgabe sind.
Anders formuliert: Wir suchen Zahlen c1 , . . . , ck so, dass
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2
..
.. ..
.
. .
f1 (xn )c1 + f2 (xn )c2 + . . . + fk (xn )ck = yn
ist. Das ist ein System von n linearen Gleichungen mit k Unbekannten
c1 , . . . , ck . In Matrizenform:

    
f1 (x1 ) . . . fk (x1 )
c1
y1
 f1 (x2 ) . . . fk (x2 ) c2  y2 
 .
· .  =  .  .
..
.. 
 ..
.
.   ..   .. 
f1 (xn ) . . . fk (xn )
ck
yn
Beispiel 43 : ( Lineare Interpolation“).
”
Wenn f1 die konstante Funktion 1 (also die Funktion, die jeder Zahl die
Zahl 1 zuordnet) und f2 die Identität (also die Funktion, die jeder Zahl sich
selbst zuordnet) ist, dann suchen wir eine Funktion f := c1 f1 + c2 f2 mit
( f (xi ) =) c1 + c2 xi = yi , 1 ≤ i ≤ n .
Die Aufgabe, Zahlen c1 und c2 mit den Eigenschaften
c1 + c2 x1 = y1
..
.. ..
.
. .
c1 + c2 xn = yn
zu finden, ist ein System von n linearen Gleichungen mit zwei Unbekannten. In Matrizenform
 


y1
1 x1
( )
y2 
1 x2  c1
 
. . ·
 .. ..  c2 =  ...  .
yn
1 xn
Beispiel 44 : (Interpolation durch Polynomfunktionen).
Für 1 ≤ i ≤ k sei fi : R −→ R, z 7−→ zi , die i-te Potenzfunktion. Dann ist
die gesuchte Funktion f eine Polynomfunktion vom Grad k − 1, also
f : R −→ R, z 7−→ c1 + c2 z + . . . + ck zk−1 .
3. VERTIEFUNG ZU KAP. 3, §3-5
17
Wir suchen reelle Zahlen c1 , c2 , . . . , ck mit der Eigenschaft, dass
c1 + x1 c2 + . . . + x1k−1 ck = y1
..
.. ..
.
. .
k−1
c1 + xn c2 + . . . + xn ck = yn
ist, müssen also ein System von n Gleichungen mit k Unbekannten lösen.
In Matrizenform:
    

1 x1 . . . x1k−1
y1
c1
1 x . . . xk−1  c2  y2 
2

2   
.
·  ..  = 
 .. ..
.. 
.
.. 

..

. .
.
.
.
yn
ck
1 xn . . . xnk−1
§3. Systeme linearer Gleichungen (mit und ohne Lösung)
Das System
f1 (x1 )c1 + f2 (x1 )c2 + . . . + fk (x1 )ck = y1
f1 (x2 )c1 + f2 (x2 )c2 + . . . + fk (x2 )ck = y2
..
.. ..
.
. .
f1 (xk )c1 + f2 (xk )c2 + . . . + fk (xn )ck = yn
von k linearen Gleichungen mit den Unbekannten c1 , . . . , cn kann auch in
der Form

  

fk (x1 )
y1
f1 (x1 )
.
.
c1  ..  + . . . + ck  ..  =  ...  ,
fk (xn )
yn
f1 (xn )

oder, mit den Abkürzungen
 
y1

y := ...  und
yn


fi (x1 )
fi (x) :=  ...  , 1 ≤ i ≤ k,
fi (xn )
kurz als
k
∑ cifi(x) = y
i=1
angeschrieben werden.
Wir können also das System linearer Gleichungen als die folgende Aufgabe interpretieren: Schreibe die Spalte y als Linearkombination ∑ki=1 ci fi (x)
der Spalten fi (x) , 1 ≤ i ≤ k. Das ist aber nur dann möglich, wenn y in dem
von den Spalten fi (x) , 1 ≤ i ≤ k , erzeugten Untervektorraum U von Rn×1
enthalten ist. Wenn das nicht der Fall ist, ist dieses System linearer Gleichungen nicht lösbar.
18
3. VERTIEFUNG ZU KAP. 3, §3-5
Im Fall von Beispiel Lineare Interpolation“ ist U die von
”
 
 
1
x1
.
1 :=  ..  und x :=  ... 
1
xn
erzeugte Ebene in Rn×1 .
Im Fall von Beispiel Interpolation durch Polynomfunktionen vom Grad
”
≤ k“ ist U der von
   
1
x1
.
 ..  ,  ...  , . . .
1
xn

x1k−1


,  ... 

xnk−1
erzeugte Untervektorraum von Rn×1 .
Wenn die Interpolationsaufgabe einerseits eine Situation beschreibt, von
der man weiß, dass es eine Lösung gibt, andererseits die Aufgabe aber nicht
lösbar ist, weil y mit Mess- oder Rundungsfehlern behaftet ist, liegt es nahe, dass y eigentlich“ ein Element von U sein sollte. Wir erzwingen die
”
Lösbarkeit der Aufgabe, indem wir y durch eine Spalte y′ in U ersetzen!
Wie sollen wir diese Spalte y′ aber wählen? Am einfachsten ist es, y′ in
U so zu wählen, dass der Abstand zwischen y′ und y möglichst klein ist. Wir
suchen also ein Element des Vektorraums U so, dass der Abstand ∥y′ − y∥
zwischen y und y′ so klein wie möglich ist. Wir müssen nun festlegen, welchen Abstand wir meinen: Wenn wir den (durch das Standardskalarprodukt
auf dem Rn induzierten) euklidischen Abstand im Rn wählen, dann ist
√
∥y′ − y∥ :=
n
∑ (y′i − yi)2 .
i=1
Für positive reelle Zahlen a und b ist a ≤ b genau dann, wenn a2 ≤ b2 ist.
Daher ist der ∥y′ − y∥ genau dann minimal, wenn die Summe ∑ni=1 (y′i − yi )2
der Fehlerquadrate“ minimal ist.
”
Die Spalte y′ ist der Fußpunkt des Lotes von y auf U.
§4. Lineare Regression
Genau dann ist der Abstand zwischen y′ und y kleiner oder gleich dem
Abstand zwischen y und jedem anderen Element z von U, wenn die Gerade
durch y′ und y normal zum Untervektorraum U steht. Das folgt leicht aus
dem Satz von Pythagoras:
3. VERTIEFUNG ZU KAP. 3, §3-5
19
U
hy
Sphhhhhh
h
S
z
S
Sp y′
Das Dreieck mit den Eckpunkten y′ , y und z hat bei y′ einen rechten
Winkel. Der Abstand zwischen y und z ist die Länge der Hypotenuse, also
größer oder gleich der Länge einer Kathete, also dem Abstand zwischen y
und y′ .
Die Gerade durch y′ und y steht genau dann normal zu U, wenn alle
Skalarprodukte von y′ − y mit den erzeugenden Spalten von U gleich 0
sind. Für y′ = ∑ki=1 ci fi (x) ∈ U muss also gelten:
⟨y′ − y, fj (x)⟩ = 0, 1 ≤ j ≤ k .
Anders geschrieben:
k
∑ ci⟨fi(x), fj(x)⟩ = ⟨y, fj(x)⟩, 1 ≤ j ≤ k .
i=1
Wenn wir dieses System von k linearen Gleichungen mit k Unbekannten
c1 , . . . , ck lösen, dann erhalten wir die annähernd“ interpolierende Funktion
”
f = ∑ki=1 ci fi .
Bei linearer Interpolation ist
• y′ = c2 x + c1 1 ∈ U und
• die Gerade durch y und y′ steht normal auf der von x und 1 erzeugten
Ebene U.
Also ist
• ⟨c2 x + c1 1 − y, x⟩ = 0 und
• ⟨c2 x + c1 1 − y, 1⟩ = 0.
Daraus erhalten wir das folgende System von zwei linearen Gleichungen mit zwei Unbekannten c1 und c2 :
• c2 ⟨x, x⟩ + c1 ⟨1, x⟩ = ⟨x, y⟩
• c2 ⟨x, 1⟩ + c1 ⟨1, 1⟩ = ⟨1, y⟩
Als Lösung erhalten wir
c2 =
⟨1, 1⟩.⟨x, y⟩ − ⟨1, x⟩.⟨1, y⟩
⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2
und
c1 =
⟨x, x⟩.⟨1, y⟩ − ⟨1, x⟩.⟨x, y⟩
.
⟨1, 1⟩.⟨x, x⟩ − ⟨1, x⟩2
3. VERTIEFUNG ZU KAP. 3, §3-5
20
Wenn ⟨−, −⟩ das Standard-Skalarprodukt ist, dann ist ⟨x, y⟩ = ∑ni=1 xi yi ,
⟨1, x⟩ = ∑ni=1 xi , ⟨1, y⟩ = ∑ni=1 yi , ⟨1, 1⟩ = n, ⟨x, x⟩ = ∑ni=1 xi2 und ⟨y, y⟩ =
∑ni=1 y2i , daher
c2 =
und
c1 =
n ∑ni=1 xi yi − (∑ni=1 xi )(∑ni=1 yi )
n ∑ni=1 xi2 − (∑ni=1 xi )2
(∑ni=1 xi2 )(∑ni=1 yi ) − (∑ni=1 xi )(∑ni=1 xi yi )
.
n ∑ni=1 xi2 − (∑ni=1 xi )2
Wir haben damit die Funktion f : R −→ R, z 7−→ c2 z + c1 , so bestimmt,
dass der (euklidische) Abstand vom n-Tupel der gegebenen (gemessenen
oder gerundeten) ungenauen Funktionswerte (y1 , . . . , yn ) zum n-Tupel der
berechneten Funktionswerte ( f (x1 ), . . . , f (xn )) möglichst klein ist, also
∑ni=1 (yi − (c2 xi + c1 ))2 möglichst klein ist. Der Graph dieser Funktion heißt
Regressionsgerade oder Trendlinie der Punkte (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).
Man rechnet leicht nach, dass
1 n
1 n
f ( ∑ xi ) = ∑ yi
n i=1
n i=1
ist. Das Paar der arithmetischen Mittel von (x1 , . . . , xn ) und (y1 , . . . , yn ) liegt
also immer auf der Regressionsgeraden.
Herunterladen