Ingenieurmathematik 1 - Fachhochschule Südwestfalen

Werbung
Ingenieurmathematik 1
Henrik Schulze
Fachhochschule Südwestfalen, Meschede
Chronologie der Aktualisierungen
Datum
2017-09-20
Änderungen
Kapitel über Differentialrechnung hinzugefügt.
3
Vorbemerkungen zur Lehrveranstaltung Ingenieurmathematik 1
Die Lehrveranstaltung besteht aus Vorlesungen und Übungen. In der Vorlesung wird der Stoff präsentiert.
Fragen sind dabei willkommen, können aber wegen der Größe der Veranstaltung und der begrenzten Zeit
dort nicht so ausführlich diskutiert werden wie in der Übung. Die Übungen finden in kleineren Gruppen statt.
Dort können Sie ausführlich fragen, und auch auf individuelle Verständnisprobleme kann dabei eingegangen
werden. Der Schwerpunkt der Übung liegt im Üben, d.h. im selbstständigen Rechnen der Übungaufgaben.
Erst dadurch lernt man und bekommt Sicherheit und Routine. Sie finden die Aufgaben im vorliegenden
Skript1 direkt im Anschluss an das jeweilige Thema. Um die Aufgaben rechnen zu können und in der
Vorlesung nicht “abgehängt” zu werden, müssen Sie diese immer zeitnah nachbereiten. Verständnisprobleme
muss man immer so schnell wie möglich klären und nicht verschieben!
Fangen Sie gleich, nachdem der Stoff in der Vorlesung dran war, mit dem Rechnen der zugehörigen Aufgaben
an. Die Aufgaben sind im Skript entsprechend angeordnet. Wenn dabei Probleme auftauchen, fragen Sie
in der Übung! In der Übung wird manchmal etwas wiederholt, oder es werden exemplarisch Aufgaben
vorgerechnet. Der Schwerpunkt liegt aber darin, Sie beim selbstständigen Arbeiten zu unterstützen.
Soll man in der Vorlesung mitschreiben? Es gibt ja ein Skript...
Mitschreiben unterstützt bei vielen Menschen den Lerneffekt, – aber nur, wenn man dabei auch mitdenkt.
Einfach nur die Tafel abzuschreiben ohne etwas zu verstehen, bringt nichts. Damit sich keiner unter Zeitdruck
die Finger wund schreiben muss, gibt es dieses Skript. Der Dozent braucht auch nicht jede mündliche
Erklärung noch einmal an die Tafel schreiben, wenn man sie auch im Skript nachlesen kann. Wie und
wieviel man mitschreibt, sollte jeder für sich selbst entscheiden. Es gibt schließlich auch ganz unterschiedliche
Lerntypen.
Die Klausur dient der Lernzielkontrolle. Lernziele der Ingenieurmathematik sind die sichere Beherrschung
der Rechentechniken sowie die Fähigkeit, die mathematischen Begriffe praktisch anwenden zu können. Es
geht nicht darum, Zahlen in Formeln einzusetzen. Taschenrechner und handelsübliche Formelsammlungen
sind deshalb nicht zugelassen. Wenn man es geschafft hat, alle Übungsaufgaben zu lösen, dann dürfte die
Klausur keine größeren Probleme bereiten.
1 Achten
Sie bitte auch auf Aktualisierungen, die Sie auf meiner Homepage finden.
4
Vorbemerkungen zu diesem Skript
Ingenieure brauchen Mathematik als Werkzeug. Ein Werkzeug muss man bedienen können, aber man
braucht es in der Regel nicht neu zu erfinden.
Ein Schwerpunkt der Ingenieurmathematik 1 ist das Rechnen mit Vektoren und Matrizen (Kapitel 1
und 3). In der Mathematik wird dieses Gebiet als “Lineare Algebra” bezeichnet. Wir sprechen statt
dessen lieber von Vektorrechnung und Matrizenrechnung, weil es hier weniger um die mathematischen
Strukturen dieser Objekte geht, sondern vor allem um deren Anwendung. Vektoren braucht man z.B.
in der Mechanik, um Kräfte zu beschreiben und in der Elektrotechnik für die elektrischen und magnetischen Felder. Matrizen beschreiben lineare Abbildungen zwischen Vektoren. Außerdem benötigt man
sie zum Lösen linearer Gleichungssysteme.
In Kapitel 2 nach der Vektorrechnung und vor den Matrizen sind die komplexen Zahlen dazwischen
geschoben, weil es an der Stelle didaktisch gut hineinpasst: Man kann sich komplexe Zahlen gut als
zweidimensionale Vektoren mit einer zusätzlichen Multiplikation vorstellen. Komplexe Zahlen spielen
eine wichtige Rolle bei der mathematischen Beschreibung von Schwingungen.
Ein zweiter Schwerpunkt sind die Grenzwerte und Funktionen.
In Kapitel 4 werden Folgen und Reihen sowie deren Grenzwerte eingeführt. Es handelt sich hierbei
um grundlegende mathematische Konzepte, auf die in der Ingenieurmathematik 2 aufgebaut wird. Die
geometrische Reihe ist wichtig sowohl in der Finanzierungsrechnung als auch bei vielen technischen
und naturwissenschaftlichen Vorgängen. Hierauf wird in Beispielen und Übungsaufgaben eingegangen.
Kapitel 5 führt den mathematischen Begriff der Funktion ein. Funktionen spielen eine zentrale Rolle in
Naturwissenschaft und Technik und kommen praktisch überall vor. Die wichtigsten Klassen von den
linearen bis zu den trigononmetrischen und den Hyperbelfunktionen werden vorgestellt.
In Kapitel 6 werden die Konzepte der Differential- und Integralrechnung aus physikalischen Fragestellungen entwickelt. Newton hat diese Gebiete begründet, damit er die “Newtonsche Mechanik” formulieren konnte. Sein “Rivale” Leibniz hat zeitgleich dieselben Entdeckungen gemacht, allerdings war er
mehr philosophisch motiviert.
Der Ingenieur muss mathematische Konzepte auf praktische Problemstellungen anwenden können, und
er muss sicher rechnen können. Mathematische Beweise braucht er eher selten, dafür um so mehr eine
gute anschauliche Vorstellung. Entsprechend ist die Vorlesung ausgerichtet.
Um die Lesbarkeit zu erleichtern, wird soweit wie möglich auf formale Definitionen und mathematische Sätze verzichtet. Neue Begriffe werden im Zusammenhang erklärt und dabei durch Fettdruck
hervorgehoben. Genauso hervorgehoben werden Schlüsselworte und Schlagworte.
Teilweise ist in diesem Skript weiterführendes Material eingearbeitet, das nicht unbedingt in der Vorlesung behandelt wird, aber unter Umständen für spätere technische Anwendungen relevant ist. Solche
Abschnitte sind mit einem Stern (*) gekennzeichnet.
Inhaltsverzeichnis
1 Vektorrechnung
7
1.1
Grundbegriffe und elementare Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Analytische Geometrie I: Ortsvektoren und Richtungsform . . . . . . . . . . . . . . . . . 18
1.3
Richtungen und Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4
Das Skalarprodukt und seine Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5
Analytische Geometrie II: Anwendung des Skalarproduktes . . . . . . . . . . . . . . . . 42
1.6
Das Vektorprodukt, das Spatprodukt und Anwendungen dazu . . . . . . . . . . . . . . . 50
2 Komplexe Zahlen
7
63
2.1
Komplexe Zahlen als Zeiger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.2
Multiplikation von komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.3
Komplex konjugierte Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.4
Exponentialdarstellung von komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 76
2.5
Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3 Matrizen
91
3.1
Definitionen und Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.2
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3.3
Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.4
Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
3.5
Komplexe Matrizen (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4 Folgen und Reihen
158
4.1
Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
4.2
Reihen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5 Funktionen
176
5.1
Grundbegriffe
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.2
Einteilung der Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
5
6 Differentialrechnung
207
6.1
Der Begriff der Ableitung und elementare Rechenregeln . . . . . . . . . . . . . . . . . . 207
6.2
Die Ableitungen transzendenter Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.3
Taylor-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.4
Die Regeln von de l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
6.5
Extremwerte und Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
A Elementare Tatsachen über Winkel
248
A.1 Richtungen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
A.2 Wichtige Werte für Sinus und Cosinus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
A.3 Winkelfunktionen am Einheitskreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
Kapitel 1
Vektorrechnung
Vektoren werden in der Mechanik und Elektrotechnik verwendet, um gerichtete Größen wie z.B. Geschwindigkeiten, Kräfte und elektromagnetische Felder zu beschreiben. Mit Vektoren lassen sich geometrische Sachverhalte beschreiben, die mit Längen, Winkeln und Flächen zu tun haben. Man kann
mit Vektoren sehr leicht rechnen. Dadurch kann man oft geometrische Argumente durch eine Rechung
ersetzen oder eine geometrische Idee in einen rechnerischen Ansatz übersetzen.
Vektoren im zwei- oder dreidimensionalen Raum (2D oder 3D) haben einen direkten Bezug zu unserer
anschaulichen Vorstellung. Die mathematischen Eigenschaften von Vektoren lassen sich aber auch
auf höher dimensionalen Räume übertragen. Das ist keineswegs nur eine mathematische Spielerei:
Zeitdiskrete Signale in der Nachrichtentechnik oder gekoppelte Pendel oder Schwingkreise sind wichtige
Anwendungsbeipiele. Die Vektorrechnung vereinfacht hierbei den Formalismus enorm.
Wir werden uns wegen der leichteren Anschauung zunächst auf Vektoren im (höchstens) dreidimensionalen Raum beschränken. Wir wählen dabei eine geometrische Vorgehensweise anstatt einer formal
mathematischen, weil dies der Denkweise in den Ingenieurwissenschaften näher kommt. Vieles kann
man rein anschaulich sehr gut verstehen, und ein wichtiges Ziel ist es, diese anschauliche Vorstellung
zu stärken.
1.1
Grundbegriffe und elementare Rechenregeln
Es gibt physikalische Größen, die nicht allein durch einen Zahlenwert (d.h. den Betrag der Größe in
einer passenden physikalischen Maßeinheit) beschrieben werden können, sondern auch eine Richtung
besitzen. Solche Größen nennt man Vektoren. Ein sehr wichtiges Beispiel ist die Kraft. Auch eine
(gerade) Wegstrecke hat eine Richtung und Länge und kann daher als Vektor aufgefasst werden. Andere
Beispiele sind das elektrische oder magnetische Feld. Auch eine Geschwindigkeit ist immer mit einer
Bewegungsrichtung verbunden. Wie in Abbildung 1.1 dargestellt, kann man sich einen Vektor als Pfeil
~a
Abbildung 1.1: Ein Vektor.
veranschaulichen. Der Pfeil gibt die Richtung der Größe an, die Länge des Vektors charakterisiert den
Betrag. Den Fußpunkt des Pfeiles zeichnet man so, dass es zur Anwendung passt. Zum Beispiel zeichnet
KAPITEL 1. VEKTORRECHNUNG
8
man bei einem Kraftvektor den Fußpunkt meist an den Punkt, wo die Kraft angreift. Passend zu der
Veranschaulichung durch Pfeile ist es in der mathematischen Notation üblich, Vektoren mit Pfeilen
→
−
über dem Symbol zu versehen. Man schreibt z.B. F für den Kraftvektor und F für seinen Betrag.
Viele Bücher verwenden auch Fettdruck für Vektoren. Der Kraftvektor wird dann mit F bezeichnet.
Vektoren kann man addieren, und man kann sie mit einer reellen Zahl multiplizieren.
Bei der Multiplikation mit einer positiven reellen Zahl bleibt die Richtung des Vektors gleich, aber
seine Länge ändert sich. Ist die Zahl negativ, so kehrt sich seine Richtung um. Der Vektor 2~a zeigt
also in die selbe Richtung wie der Vektor ~a, ist aber doppelt so lang. Der Vektor −3~a zeigt in die
Gegenrichtung und ist drei mal so lang.
Die Addition von Vektoren kann man sich am besten als Addition von Wegstrecken veranschaulichen:
Der Fußpunkt des zweiten Vektorpfeiles wird an die Spitze des ersten angehängt. Auf gleiche Weise
addiert man Kräfte mit dem Kräfteparallelogramm.
Wir leben im dreidimensionalen Raum (3D), und die grundlegenden physikalischen Gesetze sind für
diesen Raum formuliert. Problemstellungen mit Vektoren im 3D kann man sich geometrisch vorstellen,
aber manchmal sind sie schwierig zu zeichnen. Manchmal kann man ein Problem auch im zweidimensionalen Raum (2D) formulieren, weil die dritte Koordinate keine Rolle spielt. Vektoren im 2D sind
meist noch leichter vorzustellen als im 3D. Vor allem aber sind sie leichter zu zeichnen. In dieser Vorlesung werden Vektoren im zwei- oder dreidimensionalen Raum mit kleinen Buchstaben ~a, ~b, ~c etc.
bezeichnet.
Vektoren lassen sich auch in höher-dimensionalen Räumen definieren. Die Rechenregeln sind die selben1 . Vektoren in höherdimensionalen Räumen besitzen durchaus praktische Relevanz. Zum Beispiel
kann man sich die Lösungsmenge eines Gleichungssystems mit vielen Unbekannten als ein geometrisches Objekt in einem höherdimensionalen Raum vorstellen. Auch digitale Signale wie die Abtastwerte
(“Samples”) eines Audiosignales kann man als Vektoren interpretieren und entsprechende Vektoroperationen damit durchführen. Allgemeine Vektoren in Räumen beliebiger Dimension bezeichnen wir mit
fetten Buchstaben a, b, c.2
Im Folgenden soll erklärt werden, wie man mit Vektoren rechnet.
Kartesische Koordinaten
Um Vektoren durch Zahlenwerte zu beschreiben, wird ein rechtwinkliges Koordinatensystem eingeführt.
Abbildung 1.2 zeigt einen Vektor im dreidimensionalen Raum. Den Koordinatenursprung bezeichnen
wir mit dem (kalligraphischen) Buchstaben O. Man kann einen Vektor ~a im Raum durch seine Koordinaten ax , ay und az charakterisieren. Die Koordinaten sind die Projektionen des Vektors auf die
Koordinatenachsen. Geometrisch bedeutet das: Man fällt das Lot von der Pfeilspitze des Vektors auf
die Achsen. Die Koordinaten hängen natürlich von der räumlichen Ausrichtung des rechtwinkligen
Koordinatensystems ab. Bei einem einmal festgelegten Koordinatensystem ist die Zuordnung zwischen
dem Vektor ~a und seinen drei Koordinaten ax , ay , az aber eindeutig. Dann kann man den Vektor
einfach mit seinem Koordinaten-Tripel identifizieren3 und folgendermaßen als Spaltenvektor schreiben:


ax
~a =  ay 
az
1 Ausnahme:
Das an späterer Stelle eingeführte Vektorprodukt lässt sich allein in 3D definieren.
sich der Fettdruck handschriftlich nicht realisieren lässt, unterstreicht man dann oft die Buchstaben: a,b,c. Dies
entspricht der typographischen Regel für Fettdruck.
3 Wenn man es in der Physik mit den Begriffen genau nimmt, muss man zwischen der physikalischen Größe und ihren
Koordinaten unterscheiden. Wenn man das Koordinatensystem dreht, ändern sich die Koordinaten, obwohl der Vektor
(die physikalische Größe) unverändert bleibt. Wenn das Koordinatensystem fest ist, braucht man sich aber darüber keine
Gedanken zu machen.
2 Da
KAPITEL 1. VEKTORRECHNUNG
9
Die Koordinaten ax , ay , az nennt man auch die Komponenten des Spaltenvektors ~a.
z
az
~ez
~a
γ
O
β
~ey
α
ay
y
~ex
ax
x
Abbildung 1.2: Ein Vektor im dreidimensionalen Koordinatensystem.
Das beschriebene rechtwinklige Koordinatensystem wird als kartesisches Koordinatensystem bezeichnet4 .
Die Vektoren


 
 
1
0
0
~ex =  0  , ~ey =  1  und ~ez =  0 
0
0
1
bezeichnet man als Basisvektoren des kartesischen Koordinatensystems. Sie zeigen in Richtung der
Achsen und haben den Betrag Eins. Man kann den Vektor ~a dann folgendermaßen aus den Basisvektoren ~ex , ~ey , ~ez zusammensetzen:
~a = ax~ex + ay~ey + az ~ez
Solch einen Ausdruck nennt man Linearkombination der Vektoren ~ex , ~ey , ~ez .
Manchmal ist es günstiger, die Koordinatenachsen zu numerieren, anstatt sie mit x, y und z zu bezeichnen. Dann schreibt man


a1
~a =  a2 
a3
und
~a
= a1~e1 + a2~e2 + a3~e3
3
X
ai~ei .
=
i=1
4 Nach
dem französchen Mathematiker und Philosophen René Descartes (lat. Cartesius) 1596-1650.
KAPITEL 1. VEKTORRECHNUNG
10
Oft hat man es in der Vektorrechnung mit einem Problem in der Ebene zu tun. Dann ist es sinnvoll,
das Koordinatensystem so zu legen, dass die z-Komponente den Wert Null hat. Man lässt sie im
Spaltenvektor dann einfach weg und schreibt
a1
ax
.
oder ~a =
~a =
a2
ay
Die Addition von Vektoren
−
→
−
→
Wenn zwei Kräfte F1 und F2 an einem Punkt angreifen, so addieren sich diese nach dem KräfteParallelogramm: Wie in Abbildung 1.3 gezeigt, spannen die beiden Kraftvektoren ein Parallelogramm
F~2
F~1
F~1 + F~2
F~2
F~1
Abbildung 1.3: Kräfteparallelogramm.
−
→
−
→
auf. Dabei wird an die Pfeilspitze von F1 der parallel verschobene Pfeil F2 angeklebt und umgekehrt.
−
→ −
→
Der Pfeil der Diagonalen entspricht dem Summenvektor F1 + F2 . Aus dem Bild wird auch deutlich, dass
es auf die Reihenfolge bei der Addition nicht ankommt. Es gilt das sogenannte Kommutativgesetz:
−
→ −
→ −
→ −
→
F1 + F2 = F2 + F1
Zeichnet man ein Kräfteparallelogramm in ein Koordinatensystem, so erkennt man, dass sich bei der
Addition von zwei Vektoren




ax
bx
~a =  ay  und ~b =  by 
az
bz
gerade die Koordinaten addieren:

 
 

ax
bx
ax + b x
 ay  +  b y  =  ax + b y 
az
bz
ax + b z
Das ist genau das Gleiche, wie wenn man in einem Tabellenkalkulationsprogramm zwei Spalten addiert
und das Ergebnis in eine dritten Spalte schreibt.
Bei der Addition von Zahlen a ∈ R ist die Null durch die Eigenschaft a + 0 = a definiert. Entsprechend
ist der Nullvektor ~0 definiert durch die Eigenschaft
~a + ~0 = ~a .
In Koordinaten geschrieben lautet dieser:


0
~0 =  0 
0
Wenn es nicht zu Missverständnissen führt, lässt man den Pfeil über dem Nullvektor oft einfach weg.
KAPITEL 1. VEKTORRECHNUNG
11
Der Differenzvektor
Vektoren kann man nicht nur addieren, sondern auch subtrahieren. Der Vektor −~b ist der zu ~b gespiegelte Vektor. Mathematisch kann man ihn definieren durch die Eigenschaft
~b + −~b = ~0
Es gilt




bx
bx
~b =  by  ⇒ − ~b = −  by 
bz
bz
Der Differenzvektor ~a − ~b ist die Summe von ~a und dem zu ~b gespiegelten Vektor −~b :
~a − ~b = ~a + −~b
Merke: Bezüglich der Addition und Subtraktion kann man mit Vektoren genauso rechnen wie mit
Zahlen. Es gelten alle entsprechenden Rechenregeln für Klammerung etc.
Abbildung 1.4 zeigt die Vektoren ~a und ~b sowie den Differenzvektor ~c = ~a − ~b. An Hand der Zeichnung
sieht man, dass ~b + ~c = ~a gilt.
~b
~c = ~a − ~b
~a
Abbildung 1.4: Differenzvektor.
Merkregel: Die Pfeilspitze von ~c = ~a − ~b berührt die von ~a.
Den Differenzvektor berechnet man, indem man die Differenzen der Koordinaten der einzelnen Vektoren brechnet und diese in einen Spaltenvektror schreibt:

 
 

ax
bx
ax − b x
 ay  −  b y  =  ax − b y 
az
bz
ax − b z
Multiplikation mit einem Skalar
In der Vektorrechnung bezeichnet man eine nicht gerichtete Größe oft als Skalar, um auf den Unterschied zu den gerichteten Vektoren hinzuweisen. Ein Skalar ist also einfach eine (reelle) Zahl. Die
Multiplikation eines Vektors mit einem Skalar σ bedeutet eine Streckung des Vektors um den Faktor
σ. Der Vektor 2~a hat also die selbe Richtung wie der Vektor ~a, ist aber doppelt so lang. Der Skalar
kann auch negativ sein: Dann kehrt sich die Richtung um. Der Vektor −2~a = (−2)~a zeigt also in die
zu ~a genau entgegengesetzte Richtung und ist doppelt so lang.
KAPITEL 1. VEKTORRECHNUNG
12
Offensichtlich müssen bei einer Streckung des Vektors ~a um den Faktor σ alle seine Koordinaten mit
diesem Faktor multipliziert werden. Es gilt also:

 

σax
ax
σ  ay  =  σay 
σaz
az
Für die Multiplikation von Vektoren ~a, ~b, ... mit Skalaren σ, ρ, ... gelten folgende Rechenregeln:
1. Assoziativgesetz:
σ (ρ~a) = (σρ) ~a = σρ~a
2. Distributivgesetze:
3. Multiplikation mit der Eins:
(σ + ρ) ~a =
σ ~a + ~b
=
σ~a + ρ~a
σ~a + σ~b
1~a = ~a
Lineare Abhängigkeiten
Wenn zwei Vektoren ~a, ~b in die gleiche Richtung zeigen, so nennt man sie auch kollinear. Mathematisch
ausgedrückt: Es gibt eine Zahl σ, so dass
~b = σ~a
gilt. Abbildung 1.5 zeigt zwei kollineare Vektoren. Zwei Vektoren, die nicht kollinear sind, sind linear
~b = 3~a
~a
Abbildung 1.5: Die kollinearen Vektoren ~a und ~b = 3~a.
unabhängig.
Wenn drei Vektoren ~a, ~b, ~c in einer Ebene liegen, so nennt man sie auch komplanar. Man kann
dann (zumindest) einen dieser drei Vektoren (z. B. ~c) als Linearkombination der beiden anderen
ausdrücken: Er ist linear abhängig von den beiden anderen. In Formeln geschrieben heißt das: Es
gibt zwei Zahlen σ und µ, so dass
~c = σ~a + µ~b
gilt. Abbildung 1.6 zeigt drei komplanare Vektoren. Drei Vektoren, die nicht komplanar sind, sind
linear unabhängig.
Vier Vektoren ~a1 , ~a2 , ~a3 und ~b im dreidimensionalen Raum können nicht linear unabhängig sein5 .
Denn (zumindest) einer dieser Vektoren (z. B. ~b) lässt sich als Linearkombination der drei anderen
schreiben. In Formeln heißt das: Es gibt drei Zahlen σ1 , σ2 und σ3 , so dass
~b = σ1~a1 + σ2~a2 + σ3~a3
5 Vier
Vektoren können erst in einem Raum mit mehr als drei Dimensionen linear unabhängig sein.
KAPITEL 1. VEKTORRECHNUNG
13
~c = 3~a + 2~b
~a
~b
Abbildung 1.6: Die komplanaren Vektoren ~a, ~b und ~c = 3~a + 2~b.
gilt. Kann man jeden dreidimensionalen Vektor ~b auf diese Weise als Linearkombination der Vektoren
~a1 , ~a2 , ~a3 schreiben, so nennt man die Vektoren ~a1 , ~a2 , ~a3 eine Basis des dreidimensionalen Raumes. Ein Beispiel für eine Basis des dreidimensionalen Raumes haben wir schon kennengelernt: Die
kartesische Basis ~e1 , ~e2 , ~e3 .
Wozu braucht man das? Wir geben ein Beispiel. Ein lineares Gleichungssystem aus drei Gleichungen
mit drei Unbekannten x1 ,x2 ,x3 kann man schreiben als
x1~a1 + x2~a2 + x3~a3 = ~b ,
wobei ~a1 , ~a2 , ~a3 und ~b gegebene Vektoren im dreidimensionalen Raum sind. Dieses Gleichungssystem
hat im Regelfall genau eine Lösung. Wenn allerdings ~a1 , ~a2 , ~a3 in einer Ebene liegen (also komplanar
sind) und ~b in eine andere Richtung zeigt (d.h. aus der Ebene heraus), so lässt sich die Gleichung nicht
erfüllen, und gibt es keine Lösung. In diesem Fall ist ~b linear unabhängig von ~a1 , ~a2 , ~a3 , d.h. nicht
als Linearkombination von ~a1 , ~a2 , ~a3 darstellbar. Liegt dagegen ~b in der selben Ebene (ist also
linear abhängig von ~a1 , ~a2 , ~a3 ), so gibt es unendlich viele Lösungen.
Bei Systemen mit mehr als drei Gleichungen benötigt man Vektoren in höheren Dimensionen. Die
Lösbarkeit dieser Gleichungssyteme kann man wieder an Hand der linearen Abhängigkeit prüfen. Dieses
Thema wird ausführlich im Abschnitt 3 untersucht werden.
Der Betrag eines Vektors und die Normierung von Vektoren
Der Betrag eines Vektors ist seine Größe ohne die Richtung. Zum
−
Beispiel wirkt auf einen Körper der
→
−
→
Masse 1 kg auf der Erde eine Gewichtskraft F mit dem Betrag F = 9.81 N. Wenn keine Verwechslung
möglich ist, lässt man oft auch einfach den Vektorpfeil und die Betragsstriche weg, d.h. man schreibt
F = 9.81 N. Geometrisch entspricht der Betrag eines Vektors der Länge des Pfeiles. Wir verwenden
die Begriffe Betrag und Länge eines Vektors deshalb gelegentlich synonym. Nach Abbildung 1.2 und
dem Satz des Pythagoras ist der Betrag |~a| des Vektors


ax
~a =  ay 
az
gegeben durch
|~a| =
q
a2x + a2y + a2z .
Wenn man einen Vektor mit einem Skalar σ multipliziert, verändert sich sein Betrag (seine Länge) um
genau den Betrag dieses Faktors:
|σ~a| = |σ| |~a|
KAPITEL 1. VEKTORRECHNUNG
14
Einen Vektor vom Betrag Eins bezeichnet man als Einheitsvektor. Ein Einheitsvektor charakterisiert
eine Richtung im Raum. Wenn man den Vektor ~a durch seinen Betrag a = |~a| teilt (d.h. mit dem Skalar
a−1 multipliziert, so erhält man den Einheitsvektor
ˆ = 1 ~a = ~a ,
~a
a
a
der die selbe Richtung wie ~a besitzt. Man bezeichnet dies als Normierung (des Vektors ~a) und nennt
ˆ den Einheitsvektor zu ~a. Wir werden diese Schreibweise mit dem Hütchen
den normierten Vektor ~a
“ ˆ“ regelmäßig als Kurzschreibweise für normierte Vektoren verwenden.
Die Dreiecksungleichung
~
~
Wir betrachten zwei
Vektoren ~a und b sowie den Summenvektor ~c = ~a + b. Die Längen dieser Vektoren
~
sind a = |~a|, b = b und c = |~c|. Abbildung 1.7 zeigt das Dreieck, das durch diese Vektoren beschrieben
~b
~a
~c = ~a + ~b
Abbildung 1.7: Veranschaulichung der Dreiecksungleichung.
wird. Bei einem Dreieck ist die Summe der Längen zweier beliebiger Seiten immer größer oder gleich6
der Länge der dritten Seite. Es gilt also c ≤ a+b. Für die Vektoren ~a und ~b gilt deshalb die Ungleichung:
~a + ~b ≤ |~a| + ~b
Dies nennt man die Dreiecksungleichung.
Vektoralgebra in höheren Dimensionen (*)
Wir haben bisher Vektoren im dreidimensionalen Raum betrachtet, weil wir im dreidimensionalen
Raum leben und die wichtigsten physikalischen Vektoren dreidimensional sind. Alles oben Gesagte
lässt sich natürlich in jeder beliebigen anderen Dimension sinngemäß gleich formulieren. Einen Vektor
a in N Dimensionen kann man z.B. schreiben:


a1
 a2 


a= . 
 .. 
aN
Die Addition von Vektoren ist auch hier komponentenweise definiert, ebenso die Multiplikation mit
einem Skalar. Der Betrag eines N -dimensionalen Vektors wird in naheliegender Verallgemeinerung des
dreidimensionalen Falles definiert als
v
u N
uX
a2n
|a| = t
n=1
6 Im
Falle der Gleichheit liegen alle drei Punkte auf einer Geraden.
KAPITEL 1. VEKTORRECHNUNG
15
Wozu braucht man Vektoren in mehr als drei Dimensionen?
Man kann sich N -dimensionale Vektoren zwar nicht so gut räumlich vorstellen, sie haben aber dennoch
eine wichtige Bedeutung. Zum Beispiel wird in Computerprogrammen oft mit Feldern (engl. arrays)
gearbeitet, in denen zusammengehörige Größen angeordnet sind. Oft spricht man auch hier von Vektoren. In vielen Fällen lassen sich Rechenregeln für Vektoren auf solche Objekte sinnvoll anwenden.
Beispiel: Abmischen von Audio-Signalen Zwei Audio-Signale (WAV-Dateien, Mono) sind gegeben durch die Vektoren




a1
b1
 a2 
 b2 




a =  .  und b =  . 
 .. 
 .. 
aN
bN
N ist eine ziemlich große Zahl... Zur Abmischung sollen diese beiden Signalvektoren gewichtet zu einem
Signalvektor c überlagert werden. Das zweite Signal soll dabei in der Lautstärke etwas angehoben
werden:
c = a + 2b
d.h.
oder





c1
c2
..
.
cN







 
 
=
 
c1
c2
..
.
cN


a1
a2
..
.
aN

 
 
=
 





+2


a1 + 2b1
a2 + 2b2
..
.
aN + 2bN
b1
b2
..
.
bN










Der Betrag von Signalvektoren hat auch eine wichtige Bedeutung: Sein Quadrat
|a|2 =
N
X
a2i
i=1
kann als die Energie des Signals interpretiert werden, und
1
|a| =
N
2
ist seine mittlere Leistung.
N
X
i=1
a2i
!
KAPITEL 1. VEKTORRECHNUNG
16
Aufgaben zu Abschnitt 1.1
1.1.1
Aufgabe:
Gegeben sind die Vektoren


3
~a =  2  ,
−4


−2
~b =  0  ,
4


−5
~c =  1  .
4
Berechnen Sie daraus die folgenden Vektoren:
a)
b)
c)
1.1.2
~u = 3~a − 5~b + 3~c
~v = −2 ~b + 5~c + 5 ~a − 3~b
w
~ = 4 ~a − 2~b + 10~c
Aufgabe:
Normieren Sie die folgenden Vektoren:


2
~b = 3~ex − 4~ey + 8~ez ,
~a =  1  ,
4
1.1.3


−1
~c =  1  ,
−1


6
d~ =  −6  .
3
Aufgabe:


1
Gegeben ist der Vektor ~a =  −4 . Bestimmen Sie den Einheitsvektor ~e, der die entgegengesetzte
3
Richtung von ~a besitzt.
1.1.4
Aufgabe:
Finden Sie den Vektor ~v , der die folgende Gleichung erfüllt:
3~v − ~ex = ~ey + 2~ey + ~v
1.1.5
Aufgabe:
Prüfen Sie, ob die drei gegebenen Vektoren ~a, ~b, ~c jeweils komplanar oder sogar kollinear sind:
a)


1
~a =  2  ,
3


2
~b =  4  ,
6


3
~c =  6 
9
KAPITEL 1. VEKTORRECHNUNG
17
b)

c)

1
~a =  2  ,
0


1
~a =  2  ,
3


3
~b =  2  ,
0


2
~b =  2  ,
6


0
~c =  0 
7


4
~c =  6 
12
KAPITEL 1. VEKTORRECHNUNG
1.2
18
Analytische Geometrie I: Ortsvektoren und Richtungsform
Ortsvektoren
Ein Punkt A im dreidimensionalen Raum mit den Koordinaten ax , ay , az wird häufig mit einer der
folgenden Schreibweisen bezeichnet:
A = (ax , ay , az )
oder
A = (ax ; ay ; az )
oder
A = (ax |ay |az )
Die Schreibweise mit den Kommata führt zur Verwirrung, wenn man Zahlen mit Dezimalkomma einsetzt. Deshalb werden (im deutschsprachigen Raum) meist die anderen verwendet. Man kann dem
Punkt A aber auch direkt den Vektor


ax
~a =  ay 
az
zuordnen. Man nennt ~a den Ortsvektor zu dem Punkt A. Der Ortsvektor ist die gerichtete Strecke
vom Koordinatenursprung O zum Punkt A. Die begriffliche Unterscheidung zwischen einem Punkt
und seinem Vektor mag zunächst ein wenig künstlich erscheinen: Es spielt natürlich keine Rolle, ob
man die Zahlenwerte für die Koordinaten horizontal oder vertikal hinschreibt. Was jedoch die Vektoren
gegenüber den Punkten auszeichnet, ist die reichere Struktur. Punkte im Raum sind die “primitiveren”
Objekte (man lernt sie meist kennen, bevor man von Vektoren gehört hat). Mit Vektoren kann man
“mehr machen”: Man kann sie addieren und mit einem Skalar multiplizieren (und – wie wir sehen
werden – noch viel mehr). Punkte kann man nur verbinden, aber das kann man mit den Pfeilspitzen der
Vektoren auch: Dann erhält man den Differenzvektor. Der Differenzvektor zwischen zwei Ortsvektoren
kann als eine gerichtete Wegstrecke interpretiert werden. Es sei zum Beispiel ~a der Ortsvektor zu dem
Punkt A und ~b der Ortsvektor zu dem Punkt B. Dann zeigt der Vektor ~b − ~a von dem Punkt A zu
dem Punkt B (siehe Abbildung 1.8). Die Strecke AB erhält man als Betrag des Differenzvektors:
AB = ~b − ~a
Manchmal bezeichnet man den Ortsvektor zum Punkt A als ~rA anstatt mit dem Kleinbuchstaben ~a
−−→
−−→
−−→
und den Vektor von A nach B als AB anstatt als ~b − ~a. Es gilt also AB = −BA .
Vereinbarung: Im Folgenden wird oft einfach von einem Punkt ~a gesprochen, wenn ein Ortsvektor
zu einem Punkt A gemeint ist.
A
~a = ~rA
O
−→ ~
AB = b − ~a
~b = ~rB
B
Abbildung 1.8: Ortsvektoren und Differenzvektoren.
KAPITEL 1. VEKTORRECHNUNG
19
Geradengleichungen in Punkt-Richtungsform
Durch einen Punkt ~a und die Richtung eines Vektors ~v 6= ~0 ist eine Gerade gegeben. Wie in Abbildung
1.9 skizziert, erhält man Punkte der Geraden, wenn man zum Aufpunkt-Vektor ~a Vielfache des
~a + 2~v
~a + 32 ~v
~a + ~v
~v
Gerade
~a
~a − ~v
O
Abbildung 1.9: Punkte einer Geraden mit Aufpunkt-Vektor ~a und Richtungsvektor ~v .
√
v , ~a − 2~v auf dieser
Richtungsvektors ~v addiert. Zum Beispiel liegen die Punkte ~a +~v, ~a + 2~v, ~a + 27
5~
Geraden. Einen allgemeinen Punkt der Geraden kann man schreiben als ~a + λ~v , wobei der Parameter
λ alle reellen Zahlen durchläuft. Den allgemeinen Punkt der Geraden schreiben wir als
~r (λ) = ~a + λ~v .
Dies ist die Geradengleichung in der Punkt-Richtungform. Beispielsweise gelangt man zum Punkt
~r(λ) = ~a + λ~v
~v
Gerade
~a
O
Abbildung 1.10: Geradengleichung.
~r (7) = ~a + 7~v , indem man erst zum Punkt ~a geht und dann sieben Schritte der Länge und Richtung
von ~v macht.
Die selbe Gerade kann durch verschiedene (äquivalente) Geradengleichungen in Punkt-Richtungsform
beschrieben werden. Beispielsweise kann man verschiedene Aufpunkte wählen. Außerdem kann man
den Richtungsvektor skalieren, d.h. mit einem Skalar multiplizieren (da es ja nur auf dessen Richtung
ankommt).
Wenn die Richtungsvektoren zweier Geradengleichungen sich nur um einen Skalierungsfaktor unterscheiden, sind die Geraden auf jeden Fall parallel (sonst nicht). Um in diesem Fall zu prüfen, ob die
beiden Gleichungen die selbe Gerade beschreiben, muss man prüfen, ob der Aufpunkt der zweiten
Geraden ein Punkt der ersten Geraden ist (oder umgekehrt).
Man kann eine Gerade auch durch zwei Punkte ~a und ~b festlegen. Man nimmt einfach ~v = ~b − ~a als
Richtungsvektor und erhält
~r (λ) = ~a + λ ~b − ~a .
KAPITEL 1. VEKTORRECHNUNG
20
Schnittpunkte von Geraden
Zwei beliebige Geraden im dreidimensionalen Raum sind im Regelfall zueinander windschief : Weder
schneiden sie sich, noch sind sie zueinander parallel. Wenn zwei Geraden
~r (λ) = ~a + λ~u
und
~s (µ) = ~b + µ~v
einen Schnittpunkt besitzen, so muss dieser auf beiden Geraden liegen, d.h. es muss Werte für λ und
µ geben, so dass
~r (λ) = ~s (µ)
gilt. Daraus ergibt sich folgende Bedingung für λ und µ:
~a + λ~u = ~b + µ~v
Schreibe dies in Koordinaten hin:
ax + λux
= bx + µvx
ay + λuy
az + λuz
= by + µvy
= bz + µvz
Dies ist ein System von 3 linearen Gleichungen mit 2 Unbekannten λ und µ. Im Regelfall gibt es keine
Lösung, es sei denn, dass die Gleichungen nicht unabhängig sind. Ist letzteres der Fall, so findet man
eine Lösung für λ und µ, setzt einen dieser Werte in die entsprechende Geradengleichung ein und erhält
so den Schnittpunkt.
Bei zwei Geraden im zweidimensionalen Raum (d.h. in der x-y-Ebene) ergeben sich 2 Gleichungen mit
2 Unbekannten. Es können drei Fälle auftreten:
1. Im Regelfall gibt es genau eine Lösung, die auf den Schnittpunkt führt.
2. Wenn es unendlich viele Lösungen gibt, sind die Geraden identisch.
3. Wenn es keine Lösung gibt, sind die Geraden parallel.
Ebenengleichungen in Punkt-Richtungsform
Eine Ebene im dreidimensionalen Raum lässt sich beschreiben durch einen Aufpunkt ~a und zwei
Richtungsvektoren ~u 6= ~0, ~v 6= ~0 . Die Ebenengleichung lautet dann:
~r (λ, µ) = ~a + λ~u + µ~v .
Diese Richtungsvektoren dürfen jedoch nicht kollinear sein, – ansonsten degeneriert die Ebene zu einer
Geraden. Drei verschiedene Punkte A, B, C im Raum, die nicht auf eine Geraden liegen, legen ebenfalls
eine Ebene fest. Die Ebenengleichung in der obigen Form erhält man (zum Beispiel), indem man A als
−−→
−→
Aufpunkt wählt und AB und AC als Richtungsvektoren.
Wie bei den Geraden bereits erläutert, gilt auch hier entsprechend: Die selbe Ebene kann durch veschiedene (äquivalente) Ebenengleichungen beschrieben werden.
KAPITEL 1. VEKTORRECHNUNG
21
Schnittpunkt von Ebene und Gerade
Im Regelfall schneiden sich eine Ebene und eine Gerade im Raum. Im Ausnahmefall liegt die Gerade
in der Ebene oder ist zu ihr parallel. Es sei die Ebene gegeben durch
~r (λ, µ) = ~a + λ~u + µ~v
und die Gerade durch
~s (σ) = ~b + σ w
~.
Die Bedingung
~r (λ, µ) = ~s (σ)
führt auf ein System von 3 linearen Gleichungen
~a + λ~u + µ~v = ~b + σ w
~
mit 3 Unbekannten λ, µ, σ, das im Regelfall eine Lösung besitzt. Falls die Gleichungen nicht voneinander unabhängig sind, so gibt es unendlich viele Lösungen. Dann liegt die Gerade in der Ebene. Falls
es keine Lösung gibt, ist die Gerade parallel zur Ebene. Dann sind die drei Vektroren komplanar, d.h.
der Vektor w
~ ist linear abhängig von ~u und ~v . An späterer Stelle werden wir Methoden kennenlernen,
an Hand der Koeffizienten des Gleichungssystems direkt zu erkennen, welcher der Fälle vorliegt.
Schnittgerade zweier Ebenen
Im Regelfall schneiden sich zwei Ebenen ~r (λ, µ) und ~s (σ, ρ) in einer Geraden. In diesem Fall führt die
Bedingung
~r (λ, µ) = ~s (σ, ρ)
auf 3 Gleichungen mit 4 Unbekannten λ, µ, σ, ρ. Man kann 3 Unbekannte eliminieren, d.h. diese durch
den vierten Parameter ausdrücken. Nehmen wir an, wir können µ, σ, ρ durch λ ausdrücken (es funktioniert auch mit jeder anderen Kombination). Dann ist λ der Parameter der Schnittgeradengleichung.
Diese erhält man, indem man in ~r (λ, µ) den Parameter µ durch λ ausdrückt. Dadurch entsteht ein
Ausdruck mit nur einem Parameter λ. Genauso kann man aber auch in ~s (σ, ρ) die Parameter σ, ρ
durch λ ausdrücken. Dies führt auf eine äquivalente Geradengleichung.
KAPITEL 1. VEKTORRECHNUNG
Beispiel:
22
Wir betrachten die beiden Ebenen



1
~r (λ, µ) =  −1  + λ 
1



−1
~s (σ, ρ) =  1  + σ 
1


1
1  + µ
1


1
1  + ρ
2
Die Schnittbedingung ~r (λ, µ) = ~s (σ, ρ) führt auf die 3 Gleichungen
1+λ+ µ

1
−1 
2

1
−1  .
1
= −1 + σ + ρ
−1 + λ − µ =
1 + λ + 2µ =
1+ σ− ρ
1 + 2σ + ρ .
Durch Addition und Subtraktion der ersten beiden Gleichungen folgt
λ = σ und µ = ρ − 2 .
Dies setzt man in die dritte Gleichung ein und erhält
σ + 2ρ − 4 = 2σ + ρ
und damit
σ = ρ −4.
Jetzt kann man λ, µ und σ durch den Parameter ρ ausdrücken:
λ =
µ
σ
=
=
ρ−4
ρ−2
ρ−4
Jetzt kann man in einer der beiden Ebenengleichungen die beiden Parameter durch ρ ausdrücken. Wir
wählen die zweite (weil dort ρ sowieso schon vorkommt). Wir berechnen also ~s (σ, ρ) = ~s (ρ − 4, ρ). Das
ist jetzt eine vektorielle Gleichung mit nur noch einem Parameter ρ: Eine Geradengleichung ~t (ρ) =
~s (ρ − 4, ρ). Diese berechnet sich wie folgt:
~t (ρ) = ~s (ρ − 4, ρ)


 


−1
1
1
~t (ρ) =  1  + (ρ − 4)  1  + ρ  −1 
1
2
1


 
−5
2
~t (ρ) =  −3  + ρ  0 
−7
3
KAPITEL 1. VEKTORRECHNUNG
23
Aufgaben zu Abschnitt 1.2
1.2.1
Aufgabe:
Bestimmen
Sie die Koordinaten des Punktes Q, der vom Punkt P = (3; 1; −5) in Richtung des Vektors


3
~a =  −5  um 20 Längeneinheiten entfernt liegt.
4
1.2.2
Aufgabe:
Liegen die drei Punkte A = (3; 0; 4) ,
1.2.3
B = (1; 1; 1) ,
C = (−1; 2; −2) auf einer Geraden?
Aufgabe:
Gegeben sind die Punkte
A = (5; 3; 4) , B = (11; 7; 6) , C = (0; −3; −3) , D = (−1; −5; −6)
Die Gerade Nummer 1 geht durch die Punkte A und B, die Gerade Nummer 2 geht durch die Punkte
C und D.
• Geben Sie für beide Geraden eine vektorielle Darstellung in Punkt-Richtungsform an
• Prüfen Sie, ob die Geraden sich schneiden und bestimmen Sie gegebenenfalls den Schnittpunkt
S.
1.2.4
Aufgabe:
Gegeben sind die Punkte
A = (5; 1; 4) , B = (6; 2; 8) , C = (5; 4; 6) , D = (5; 7; 8)
Die erste Gerade geht durch die Punkte A und B, die zweite Gerade geht durch die Punkte C und D.
• Geben Sie für beide Geraden eine vektorielle Darstellung in Punkt-Richtungsform an
• Prüfen Sie, ob die Geraden sich schneiden und bestimmen Sie gegebenenfalls den Schnittpunkt
S.
1.2.5
Aufgabe:
Gegeben sind die Ebene

sowie die Gerade



 
2
5
2
~r (λ, µ) =  1  + λ  4  + µ  3 
0
1
4


 
3
6
~s (σ) =  3  + σ  5  .
3
2
Falls es einen Schnittpunkt gibt, so bestimmen Sie diesen. Falls nicht, so prüfen Sie, ob die Gerade in
der Ebene liegt oder parallel zu ihr verläuft.
KAPITEL 1. VEKTORRECHNUNG
1.2.6
24
Aufgabe:
Gegeben sind die Ebene

sowie die Gerade

 


1
1
1
~r (λ, µ) =  1  + λ  2  + µ  −1 
1
3
2


 
3
2
~s (σ) =  2  + σ  1  .
6
5
Falls es einen Schnittpunkt gibt, so bestimmen Sie diesen. Falls nicht, so prüfen Sie, ob die Gerade in
der Ebene liegt oder parallel zu ihr verläuft.
1.2.7
Aufgabe:
Von zwei Ebenen sind jeweils 3 Punkte gegeben:
• Die erste Ebene geht durch die Punkte A = (1; 0; 3) ,
• Die zweite Ebene geht durch die Punkte P = (2; 3; 2) ,
B = (2; 0; 3) ,
Q = (2; 4; 3) ,
C = (2; 1; 3).
R = (4; 3; 3)
Zeigen Sie, dass sich die Ebenen längst einer Geraden schneiden und bestimmen Sie die Gleichung der
Geraden.
KAPITEL 1. VEKTORRECHNUNG
1.3
25
Richtungen und Winkel
Der Richtungskosinus
Es sei ein Vektor


ax
~a =  ay 
az
der Länge a = |~a| gegeben. Seine Richtung lässt sich eindeutig durch die drei Richtungswinkel α,
β und γ beschreiben, die er mit den (positiven!) Richtungen der drei Koordinatenachsen (x-, y- und
z-Achse) einschließt. In Abbildung 1.2 sind diese Winkel mit eingezeichnet. Diese Winkel sind nach
Definition alle positiv. Es gilt:
α, β, γ ∈ [0, π]
Ist ein Winkel stumpf (d.h. er liegt zwischen π/2 und π), so ist die jeweilige Koordinate negativ.
~a
a
·
α
ax = a cos α
0
x-Achse
Abbildung 1.11: Die x-Koordinate ax des Vektors ~a erhält man als seine Projektion auf die x-Achse.
Die Koordinaten ax , ay , az sind die Projektionen des Vektors auf die x-, y- und z-Achse. Abbildung
1.11 zeigt die geometrische Situation für die x-Achse. Aus dem Bild erkennt man:
ax = a cos α
Für die beiden anderen Koordinaten gilt entsprechend
ay = a cos β
und
az = a cos γ.
Die Werte cos α, cos β, cos γ bezeichnet man jeweils als den Richtungskosinus des Vektors zu der
jeweiligen Achse.
Merke: Die Projektion eines Vektors auf eine Richtung ist immer das Produkt zwischen der Länge
des Vektors und dem Kosinus des eingeschlossen Winkels. Diesen wichtigen Zusammenhang zwischen
dem Bild und der mathematischen Beziehung sollte man immer vor Augen haben. Er wird sehr oft
gebraucht.
Wenn man die Koordinaten durch die Richtungskosinusse ausdrückt und zu einem Spaltenvektor zusammen fasst, ergibt sich:




a cos α
cos α
~a =  a cos β  = a  cos β  .
a cos γ
cos γ
KAPITEL 1. VEKTORRECHNUNG
26
Normiert man den Vektor ~a, so erhält man aus dieser Gleichung den Einheitsvektor


cos α
ˆ =  cos β  .
~a
cos γ
2
Wegen ˆ
~a = 1 ergibt sich aus der Definition des Betrages:
cos2 α + cos2 β + cos2 γ = 1
Die drei Richtungswinkel sind also nicht unabhängig, – was auch geometrisch unmittelbar einleuchtet.
Bis auf eine Doppeldeutigkeit ist jeder der drei Winkel durch die beiden anderen festgelegt. Sind zum
Beispiel α und β gegeben, so gibt es für cos γ die beiden Lösungen der obigen Gleichung
p
cos γ1,2 = ± 1 − cos2 α − cos2 β .
p
γ1 zur z-Achse, d.h.
Die erste Lösung cos γ1 = + 1 − cos2 α − cos2 β führt auf einen spitzen Winkel
p
der Vektor zeigt in Abbildung 1.12 nach oben. Die zweite Lösung cos γ2 = − 1 − cos2 α − cos2 β führt
auf einen stumpfen Winkel γ2 = π − γ1 zur z-Achse, d.h. der Vektor zeigt nach unten.
z-Achse
cos γ1 =
p
1 − cos2 α − cos2 β
γ1
0
γ2 = π − γ1
x-y-Ebene
p
cos γ2 = − 1 − cos2 α − cos2 β
Abbildung 1.12: Die Zweideutigkeit für cos γ.
Polarkoordinaten
Bei manchen geometrischen Fragestellungen gibt es eine bessere Wahl als kartesische Koordinaten. Will
man Punkte auf einer Kugel betrachten, führt man am besten Kugelkoordinaten (auch räumliche
Polarkoordinaten genannt) ein und rechnet mit Längen- und Breitengraden.
Im folgenden sollen ein paar Beispiele für solche angepassten Koordinatensysteme vorgestellt werden.
Zuerst werden ebene Polarkoordinaten eingeführt, weil diese am einfachsten sind und die Grundlage
für das Folgende bilden. Dann werden Zylinderkoordinaten eingeführt, die sich gut für Fragestellungen
mit Zylindersymmetrie eignen. Danach behandeln wir räumliche Polarkoordinaten.
Bei den Polarkoordinaten wird die Definition der Winkelfunktion am Einheitskreis benötigt. Dieses
Thema aus der Schulmathematik wird in Anhang A.3 noch einmal wiederholt.
KAPITEL 1. VEKTORRECHNUNG
27
Ebene Polarkoordinaten
Ein Vektor
~r =
in der Ebene ist eindeutig durch seine Länge
r=
und seine Richtung festgelegt.
x
y
p
x2 + y 2
y-Achse
1
ϕ = 27◦
−1
1
2
x-Achse
ϕ = −117◦
−1
−2
Abbildung 1.13: Zur Definition des Winkels ϕ.
Man kann die Richtung mit Hilfe der Richtungskosinusse der beiden Winkel α und β (0 ≤ α, β ≤ π)
beschreiben. Es gilt x = r cos α und y = r cos β. Es ist etwas umständlich, zwei Winkel zu verwenden.
Der eine Winkel legt den anderen bis auf die oben beschriebene Doppeldeutigkeit fest. Man kann
die Doppeldeutigkeit beseitigen und kommt mit einem Winkel ϕ aus, wenn dieser Werte aus dem
ganzen Winkelbereich −π ≤ ϕ ≤ π annehmen darf, d.h. auch negativ werden kann7 . Der Winkel ϕ
wird dann festgelegt als der Winkel zur (positiven) x-Achse, siehe Abbildung 1.13. Hierbei trifft man
die Festlegung ϕ ≥ 0 für Vektoren in der oberen Halbebene (y ≥ 0) und ϕ ≤ 0 für Vektoren in
der unteren Halbebene (y ≤ 0). Der Winkel ist also gerichtet: Er ist positiv, wenn man im positiven
Drehsinn von der x-Achse zum Vektor gelangt und ansonsten negativ. Der jeweilige Drehsinn wird
durch die Pfeile (x oder y) am Winkelsymbol angedeutet. Man bezeichnet ϕ als Polarwinkel oder
auch als Azimuthwinkel. In Abbildung 1.13 sind zwei Vektoren und ihre Polarwinkel eingezeichnet.
Offensichtlich stimmt der Polarwinkel ϕ mit dem Richtungswinkel α in der oberen Halbebene überein,
aber in der unteren besitzt er das umgekehrte Vorzeichen. Aus Abbildung 1.14 kann man ablesen, dass
die kartesischen Koordinaten x, y sich durch die Polarkoordinaten r, ϕ folgendermaßen ausdrücken
lassen:
x =
r cos ϕ
y
r sin ϕ
=
Diese Formel ist sowohl für die obere als auch für die untere Halbebene richtig8 .
7 Entscheidend
ist, dass ϕ den ganzen Winkelbereich (Vollwinkel) durchläuft. Man kann dabei statt −π ≤ ϕ ≤ π auch
0 ≤ ϕ ≤ 2π als Winkelbereich wählen
8 Man beachte dabei, dass
sin (−ϕ)
=
− sin (ϕ)
cos (−ϕ)
=
cos (ϕ)
KAPITEL 1. VEKTORRECHNUNG
28
y = r sin ϕ
~r
r
ϕ
x = r cos ϕ
Abbildung 1.14: Ebene Polarkoordinaten.
Es gilt y/x = sin ϕ/ cos ϕ = tan ϕ. Die Polarkoordinaten erhält man daher aus den kartesischen durch
die Umkehrung der obigen Formeln als
p
r =
x2 + y 2
y (für x > 0) .
ϕ = arctan
x
Vorsicht: Die untere der beiden Formeln ist nur in der rechten Halbebene (d.h. für x > 0) richtig,
denn der Arkustangens liefert immer nur Werte zwischen −π/2 und π/2. Wenn man z.B. für den roten
Pfeil in Abbildung 1.13 x = −1 und y = −2 den Wert für arctan (y/x) berechnet, erhält man (gerundet)
ϕ = 63◦ . Das ist der selbe Wert wie für x = +1 und y = +2. Der richtige Winkel ist aber ϕ = −117◦.
Man muss also zuerst nachsehen, in welchem Quadranten der Vektor liegt und dann ggf. 180◦ zu dem
berechneten Winkel hinzu addieren oder abziehen. In der linken Halbebene (d.h. für x < 0) gilt also:
y ± π (für x < 0) .
ϕ = arctan
x
Für die Winkel ϕ = 0◦ , 30◦ , 45◦ , 60◦ , 90◦ (im Bogenmaß: ϕ = 0, π/6, π/4, π/3, π/2) muss ein Ingenieur die Sinus- und Kosinuswerte auswendig wissen, weil sie so oft gebraucht werden:
sin 0◦
sin 30◦
sin 45◦
sin 60◦
sin 90◦
=
=
=
=
=
0
=
=
1
2
=
2√
1
3
=
2
1
=
1
2
√
cos 90◦
cos 60◦
cos 45◦
cos 30◦
cos 0◦
Die geometrische Herleitung dafür findet sich im Anhang. Die Tangenswerte für die obigen Winkel
ergeben sich aus der Definition
sin ϕ
.
tan ϕ =
cos ϕ
gilt.
KAPITEL 1. VEKTORRECHNUNG
29
Zylinderkoordinaten (*)
Kommt die dritte Dimension hinzu, kann man für diese die kartesische Koordianate z beibehalten. Der
Vektor


x
~r =  y 
z
wird dann geschrieben als:


r cos ϕ
~r =  r sin ϕ  ,
z
wobei r, ϕ die Polarkoordinaten sind. Diese Zylinderkoordinaten sind nützlich bei der Beschreibung
zylindrischer Probleme.
Räumliche Polarkoordinanten (Kugelkoordinaten) (*)
Es sei


x
~r =  y 
z
ein Vektor auf der Kugel vom Radius
r=
p
x2 + y 2 + z 2 .
Der Anschaulichkeit halber stellen wir uns dabei eine idealisierte Erdkugel vor. Der Nordpol liegt
auf der z-Achse und der Äquator in der x-y-Ebene. Einen Punkt auf der Kugel kann man durch
seinen Längengrad und seinen Breitengrad beschreiben. Der Längengrad entspricht dem bei den ebenen
Polarkoordinaten eingeführten Azimutwinkel ϕ. Östliche Länge gehört zu ϕ ≥ 0. In der Geographie ist
es üblich, den Breitengrad von Äquator aus zu messen, der die Breite 0◦ besitzt. In der Mathematik
fängt man beim Nordpol mit θ = 0◦ an, siehe Abbildung 1.15. Der Äquator liegt dann bei θ = 90◦ und
z-Achse
~r
z = r cos θ
r
θ
ρ = r sin θ
x-y-Ebene
Abbildung 1.15: Zur Definition des Winkels θ.
der Südpol bei θ = 180◦ . Den Winkel θ nennt man Polarwinkel9 . Offenbar ist θ gerade der Winkel,
den wir als Richtungswinkel γ beim Richtungskosinus eingeführt haben. Es gilt
z = r cos θ ,
9 Vorsicht!
winkel.
Der Winkel ϕ bei ebenen Polarkoordinaten wird meist auch so genannt. Hier nennt man ihn aber Azimut-
KAPITEL 1. VEKTORRECHNUNG
30
z
r cos θ
~r
θ
O
r sin θ sin ϕ
ϕ
y
ρ = r sin θ
r sin θ cos ϕ
x
Abbildung 1.16: Kugelkoordinaten.
d.h. die z-Komponente ist gerade die Projektion des Vektors auf die z-Achse. Alle Punkte mit festem
Winkel θ bilden einen Kreis auf der Kugel, den Breitengrad. Wir betrachten die Projektion dieses
Breitengrades auf die x-y-Ebene. Dies ist ein Kreis vom Radius ρ = r sin θ. Für diesen Kreis in der
Ebene führen wir ebene Polarkoordinaten ein. Es gilt also :
x =
y =
ρ cos ϕ
ρ sin ϕ
Der Vektor in Kugelkoordinaten lautet dann:




r sin θ cos ϕ
sin θ cos ϕ
~r =  r sin θ sin ϕ  = r  sin θ sin ϕ 
r cos θ
cos θ
Abbildung 1.16 zeigt die geometrische Situation dazu.
Azimut und Elevation in Navigation, Geodäsie und Astronomie (*)
Der Polarwinkel θ wird in der Astronomie als Zenitwinkel bezeichnet. Der Zenit ist der Punkt (bzw.
die Richtung) am Himmel direkt über dem Beobachter, und der Zenitwinkel ist der Winkel zwischen
einem Stern und dem Zenit. Man verwendet aber meist den Winkel ε über dem Horizont. Diesen nennt
man Elevation (oder auch Höhenwinkel). Es gilt:
ε = 90◦ − θ .
Der Azimutwinkel ϕ wird in Navigation, Geodäsie und Astronomie im Uhrzeigersinn gezählt, also im
mathematisch negativen Drehsinn. Hierbei entspricht in der Astronomie die südliche Richtung meist
ϕ = 0, während dies in der Geodäsie meist Norden ist.
KAPITEL 1. VEKTORRECHNUNG
31
Aufgaben zu Abschnitt 1.3
1.3.1
Aufgabe:
Gesucht sind die Länge, der zugehörige Einheitsvektor sowie die Richtungskosinus-Werte cos α, cos β,
cos γ der folgenden Vektoren:


 




2
1
−2
4
~v =  −1  , ~a =  1  , ~b =  5  , ~c =  3 
−2
1
0
−2
1.3.2
Aufgabe:
Von einem Vektor ~a sind sein Betrag a = |~a| und zwei seiner Richtungswinkel bekannt:
a = 10 ,
α = 30◦ , β = 60◦ ,
90◦ ≤ γ ≤ 180◦
Wie lauten die Koordinaten von ~a ?
1.3.3
Aufgabe:
Gesucht sind alle Vektoren der Länge 2 mit den Richtungswinkeln α = 60◦ und β = 135◦. Wie groß
ist der Richtungswinkel γ ?
1.3.4
Aufgabe:
Bestimmen Sie (im dreidimensionalen Raum) alle Geraden durch den Ursprung, die sowohl mit der
x-Achse als auch mit der y-Achse einen Winkel von 60◦ einschließen! Welche Winkel γ schließen diese
Geraden mit der z-Achse ein?
1.3.5
Aufgabe: (*)
Ein Käfer krabbelt (in der Ebene) zunächst 20 cm weit mit einem Winkel von 60° (zur x-Achse). Dann
dreht er sich um 60° nach rechts und krabbelt wieder 20 cm weit. Dann dreht er um 120° nach rechts
und krabbelt 40 cm weit. Dann dreht er um 120° nach links und krabbelt 20 cm weit. Dann dreht er
nochmal um 120° nach links und krabbelt 40 cm weit. Zuletzt dreht er nochmal um 120° nach links
und krabbelt 20 cm weit.
• Schreiben sie jede der einzelnen Wegstrecken als Vektor zunächst in Polarkoordinaten und dann
in kartesischen Koordinaten (1 Längeneinheit=10cm).
• Bei welchem Punkt (in kartesischen) Koordinaten kommt der Käfer an?
• Skizzieren Sie die Tour!
KAPITEL 1. VEKTORRECHNUNG
1.3.6
32
Aufgabe: (*)
Ein Flugzeug wird unter dem Elevationswinkel ε = 30◦ und dem Azimutwinkel ϕ = 60◦ geortet. Es
befindet sich in einer Höhe von 800 m über dem Erdboden. Vereinfachende Annahme: Der Beobachter
befindet sich auf Höhe des Erdbodens und die Erdkrümmung ist vernachlässigbar.
• Wie weit ist das Flugzeug vom Beobachter entfernt?
• Wie lautet die Position des Flugzeugs in kartesischen Koordinaten, wenn sich der Beobachter im
Koordinatenursprung befindet?
1.3.7
Aufgabe:
Skizzieren Sie die folgenden Vektoren ~v in der Ebene und bestimmen Sie danach (ohne Taschenrechner!)
jeweils ihre Polarkoordinaten r und ϕ :
a)
b)
c)
d)
e)
~v =
√1
3
−1
√
~v =
− 3
−8
~v =
8
−2
√
~v =
12
3
√
~v =
− 3
KAPITEL 1. VEKTORRECHNUNG
1.4
33
Das Skalarprodukt und seine Anwendungen
Um die Winkel zwischen Vektoren zu definieren und diese berechnen zu können, wird der Begriff
des Skalarproduktes eingeführt. Überall, wo Winkel in Naturwissenschaft und Technik auftreten, wird
damit gearbeitet. Zum Beispiel benötigt man das Skalarprodukt, um die Arbeit einer schräg angreifenden Kraft zu berechnen oder die Lichtausbeute einer Solaranlage bei schräg einfallendem Sonnenlicht.
Die geometrische Definition des Skalarproduktes
Bei den folgenden geometrischen Überlegungen beschränken wir uns der Anschaulichkeit halber auf
den zwei- oder dreidimensionalen Raum, weil wir uns höherdimensionale Räume nicht so gut vorstellen
können. Mathematisch lässt sich das Skalarprodukt in Räumen beliebiger Dimension definieren, und
alle Eigenschaften gelten entsprechend.
Es seien zwei Vektoren ~a und ~b mit den Beträgen a = ~a und b = ~b im dreidimensionalen Raum
gegeben, die einen Winkel ϕ (0 ≤ ϕ ≤ π) miteinander einschließen, siehe Abbildung 1.17 .
~a
ϕ
·
~b
a cos ϕ
Abbildung 1.17: Geometrische Darstellung zum Skalarprodukt: Projektion eines Vektors auf einen
anderen.
Die Projektion von ~a auf ~b ist gegeben durch a cos ϕ. Diese Zahl kann positiv oder negativ sein, –
je nach dem, ob ϕ ein spitzer oder ein stumpfer Winkel ist. Für viele Anwendungen wird die Größe
ab cos ϕ benötigt, also die Projektion von ~a auf ~b, multipliziert mit der Länge von ~b. Diese Größe
bezeichnet man als das Skalarprodukt der Vektoren ~a und ~b und schreibt dafür
~a · ~b = ~a~b cos ϕ
Wie wir bald sehen werden, kann man das Skalarprodukt sehr leicht durch die Koordinaten der beiden
Vektoren ausdrücken. Auf diese Weise lässt sich z.B. der Winkel zwischen zwei Vektoren berechnen.
Das Skalarprodukt heißt so, weil das Produkt der Vektoren ein Skalar ist (und kein Vektor).
Eigenschaften des Skalarproduktes
Der Name Skalarprodukt ist sinnvoll, weil es viele Eigenschaften eines gewöhnlichen Produktes hat
(aber nicht alle!). Die folgenden Eigenschaften ergeben sich entweder direkt aus der Definition oder
lassen sich durch geometrische Überlegungen beweisen, worauf wir hier aber verzichten.
1. Kommutativität:
~a · ~b = ~b · ~a
2. Das Skalarprodukt ist nicht assoziativ! Im Allgemeinen gilt:
~a · ~b · ~c 6= ~a · ~b · ~c
KAPITEL 1. VEKTORRECHNUNG
34
Denn: Die Klammerausdrücke sind skalar. Der Vektor auf der linken Seite hat also die selbe
Richtung wie ~c, und der auf der rechten Seite hat die selbe Richtung wie ~a. Beide sind i. A.
verschieden.
3. Distributivität:
~a · ~b + ~c = ~a · ~b + ~a · ~c
4. Linearität bezüglich der Multiplikation mit einem Skalar σ:
σ ~a · ~b = (σ~a) · ~b = ~a · σ~b
5. Orthogonalität:
π
,
2
d.h. die beiden Vektoren stehen senkrecht (=orthogonal) zu einander.
2
6. ~a · ~a = ~a
7. Aus cos ϕ ≤ 1 folgt die Ungleichung von Cauchy-Bunjakowski-Schwarz10 :
~a · ~b = 0
⇔
ϕ=
~a · ~b ≤ ~a~b
Das Gleichheitszeichen gilt genau dann, wenn die beiden Vektoren kollinear sind.
Berechnung von Winkeln mit dem Skalarpodukt
Aus der Definition des Skalarproduktes folgt sofort:
1
ˆ · ~ˆb
cos ϕ = ~a · ~b = ~a
~a~b
ˆ, ~ˆb ist also der Kosinus des eingeschlossenen Winkels.
Das Skalarprodukt zweier Einheitsvektoren ~a
Kennt man dieses Skalarprodukt, kann man den Winkel berechnen.
Die Parallelkomponente von Vektoren
Es sei ein Vektor ~a gegeben, den wir uns als eine physikalische Größe (z.B. eine Kraft) vorstellen
können. Ein anderer Vektor ~b soll eine bestimmte Richtung festlegen. Wie in Abbildung 1.18 gezeigt,
~a
~a⊥~b
·
ϕ
~b
~ak~b
Abbildung 1.18: Zerlegung eines Vektors ~a in eine zu ~b parallele und eine dazu orthogonale Komponente.
10 Augustin-Louis
Cauchy (1789 -– 1857) war ein französischer Mathematiker. Er hat diese Ungleichung zum ersten Mal
aufgestellt. Der russische Mathematiker Wiktor Jakowlewitsch Bunjakowski (1804 – 1889) war ein Schüler von Cauchy
und hat die Ungleichung für Integrale verallgemeinert. Der deutsche Mathematiker Hermann Amandus Schwarz (1843 –
1921) hat sie Jahrzehnte später (wohl unabhängig davon) entdeckt.
KAPITEL 1. VEKTORRECHNUNG
35
~a
·
ϕ
ˆ ˆ
~ak~b = (~a · ~b) · ~b
~b
ˆ
a cos ϕ = ~a · ~b
Abbildung 1.19: Die Projektion eines Vektors auf einen anderen.
kann man den Vektor ~a eindeutig in eine Komponente ~ak~b parallel zu ~b und eine Komponente ~a⊥~b
senkrecht dazu zerlegen11 :
~a = ~ak~b + ~a⊥~b
Der Betrag der Parallelkomponente ~ak~b ist gerade die Projektion von ~a auf ~b. Sie ist gegeben durch
~ak~b = a cos ϕ .
Man kann sie durch das Skalarprodukt folgendermaßen ausdrücken:
1
ˆ
~ak~b = a cos ϕ = ~a · ~b = ~a · ~b
b
ˆ
Multipliziert man diese Zahl mit dem Einheitsvektor ~b, so erhält man einen Vektor
!
~b
~
a
·
ˆ
ˆ
~b ,
~ak~b = ~a · ~b ~b =
b2
ˆ
der in Richtung von ~b zeigt: Die Parallelkomponente von ~a bezogen auf die Richtung ~b. Abbildung 1.19
zeigt diesen Vektor. Offensichtlich spielt die Länge von ~b hierbei keine Rolle.
Die senkrechte Komponente ist einfach der Differenzvektor
ˆ ˆ
~a⊥~b = ~a − ~a · ~b ~b
ˆ
Man überprüft leicht, dass ~a⊥~b · ~b = 0 gilt.
Die mechanische Arbeit als Skalarprodukt
Die mechanische Arbeit ist definiert als:
Arbeit = Kraf t · W eg
Wenn Kraft und Wegstrecke nicht skalare, sondern vektorielle Größen sind, trägt nur die zu dem Weg
parallele Komponente der Kraft zur Arbeit bei.
→
−
Wir betrachten die in Abbildung 1.20 dargestellte Situation. Eine konstante Kraft F wirkt auf einen
−−→
Gegenstand und zieht diesen entlang einer geraden Schiene von Punkt A nach Punkt B. Es sei ~x = AB.
−
→
−→
Die Kraft kann man zerlegen in eine Komponente Fk parallel zur Schiene und eine Komponente F⊥
senkrecht dazu:
→ −
−
→ −→
F = Fk + F⊥
11 Diese
Tatsache wird manchmal als Projektionstheorem bezeichnet.
KAPITEL 1. VEKTORRECHNUNG
36
−
→
F
−
→
F⊥
ϕ
−
→
Fk
A
·
B
Abbildung 1.20: Arbeit.
−
→
Nur die Kraftkomponente Fk verrichtet Arbeit. Aus der geometrischen Definition des Skalarproduktes
ergibt sich direkt, dass die Arbeit durch das Skalarprodukt
→
−
W = F · ~x
gegeben ist12 . Die Definition der Arbeit als Produkt von Kraft und Weg behält also im Sinne des
→
−
Skalarproduktes seine Gültigkeit, wenn die Kraft F und der Weg ~x durch Vektoren beschrieben werden
und die Multiplikation im Sinne des Skalarproduktes verstanden wird.
Das Skalarprodukt in Koordinatendarstellung
Wir bezeichnen die Basisvektoren der Koordinatenachsen mit ~e1 , ~e2 , ~e3 . Sie sind auf Eins normiert und
stehen aufeinander senkrecht. Man nennt das orthonormal (=orthogonal und auf Eins normiert).
Man braucht sechs Gleichungen, um diese Eigenschaft zu beschreiben:
~e1 · ~e1 = 1 ~e2 · ~e2 = 1 ~e3 · ~e3 = 1
~e1 · ~e2 = 0 ~e1 · ~e3 = 0 ~e2 · ~e3 = 0
Diese sechs Gleichung lassen sich etwas einfacher schreiben. Wir definieren dazu das Kroneckersymbol13 :
(
1: i=k
δik =
0 : i 6= k
Damit kann man die Orthonormalität der Basis so schreiben:
~ei · ~ek = δik
In Worten: Das Skalarprodukt ist Null, wenn die Indizes i und k verschieden sind, und es ist Eins,
wenn sie gleich sind.
Es seien nun zwei Vektoren
~a = a1~e1 + a2~e2 + a3~e3
und
~b = b1~e1 + b2~e2 + b3~e3
gegeben. Deren Skalarprodukt lautet:
~a · ~b =
=
(a1~e1 + a2~e2 + a3~e3 ) · (b1~e1 + b2~e2 + b3~e3 )
a1 b1~e1 · ~e1 + a2 b1~e2 · ~e1 + a3 b1~e3 · ~e1
+a1 b2~e1 · ~e2 + a2 b2~e2 · ~e2 + a3 b2~e3 · ~e2
+a1 b3~e1 · ~e3 + a2 b3~e2 · ~e3 + a3 b3~e3 · ~e3
−
→
−
→
Erinnerung: Das Skalarprodukt F · ~
x ist gerade die Projektion des Vektors F auf den Vektor ~
x, multiplziert
mit der Länge des Vektors ~
x. Dies ist gleich der Parallelkomponente der Kraft, multipliziert mit der Weglänge.
13 Nach dem deutschen Mathematiker Leopold Kronecker (1823-1891).
12 Zur
KAPITEL 1. VEKTORRECHNUNG
37
Wegen der Orthonormalität der Basisvektoren sind nur 3 Terme von Null verschieden und man erhält
die folgende Formel:
~a · ~b = a1 b1 + a2 b2 + a3 b3
bzw.

 

a1
b1
 a2  ·  b 2  = a1 b 1 + a2 b 2 + a3 b 3
a3
b3
Auf diese Weise lassen sich Skalarprodukte – und damit Winkel, Projektionen etc. – direkt aus den
Koordinaten der Vektoren berechnen.
Das Skalarprodukt in höheren Dimensionen
Der obige Ausdruck in Koordianten für das
verallgemeinern. Für zwei Vektoren

a1
 a2

a= .
 ..
aN
Skalarprodukt lässt sich direkt für höhere Dimensionen






 und b = 


b1
b2
..
.
bN
im N -dimensionalen Raum ist das Skalarprodukt gegeben durch





a · b = a1 b 1 + a2 b 2 + . . . + aN b N
Dies betrachten wir als Defintion des Skalarproduktes in höherdimensionalen Raumen. Die Rechenregeln sind exakt identisch zu denen im zwei- oder dreidimensionalen Raum. Den Winkel ϕ zwischen
den Vektoren a und b kann man nun nachträglich einführen durch die Definition
cos ϕ =
a·b
.
|a| |b|
Es mag etwas schwierig erscheinen, sich einen Winkel in höherdimensionalen Räumen vorzustellen.
Das ist es aber nicht. Zwei Vektoren a und b spannen immer nur eine zweidimensionale Ebene auf.
Die anderen Richtungen, die aus der Ebene heraus zeigen, spielen beim Skalarprodukt keine Rolle. Wir
können sie getrost ignorieren und die beiden Vektoren auf ein Blatt Papier zeichnen.
Skalarprodukte in höheren Dimensionen haben eine wichtige Bedeutung in der Kommunikationstechnik. Zeitdiskrete Signale sind N -dimensionale Vektoren. Skalarprodukte zwischen solchen SignalVektoren sagen etwas über deren Ähnlichkeit aus. Man spricht dann von Korrelationen. Zum Beispiel
kann ein GPS-Empfänger mit Hilfe der Berechnung von Korrelationen das Empfangssignal bestimmten
Satelliten zuordnen.
Additionstheoreme der Winkelfunktionen
Es seinen ~u und ~v zwei Einheitsvektoren in der Ebene. In Polarkoordinaten kann man diese schreiben
als
cos ϕ
cos ψ
~u =
~v =
,
sin ϕ
sin ψ
wobei ϕ und ψ die jeweiligen Polarwinkel (d.h. die Winkel mit der x-Achse) sind, siehe Abbildung 1.21.
Der von den beiden Vektoren eingeschlossene Winkel ist ϕ−ψ. Wegen der geometrischen Definition des
Skalarproduktes ist das Skalarprodukt zweier Einheitsvektoren gleich dem Kosinus des eingeschlossenen
Winkels. Daher gilt:
38
y- Achse
KAPITEL 1. VEKTORRECHNUNG
~u
ϕ−ψ
ϕ
~v
ψ
x- Achse
Abbildung 1.21: Bild zur Veranschaulichung des 1. Additionstheorems.
~u · ~v = cos (ϕ − ψ)
Berechnet man das Skalarprodukt in Koordinatendarstellung, so erhält man:
cos ϕ
cos ψ
~u · ~v =
·
= cos (ϕ) cos (ψ) + sin (ϕ) sin (ψ)
sin ϕ
sin ψ
Da beide Ausdrücke gleich sein müssen, gilt:
cos (ϕ − ψ) = cos (ϕ) cos (ψ) + sin (ϕ) sin (ψ)
Wenn man jetzt noch ψ durch −ψ ersetzt, erhält man das 1. Additionstheorem der Winkelfunktionen:
cos (ϕ + ψ) = cos (ϕ) cos (ψ) − sin (ϕ) sin (ψ)
Das zweite Additionstheorem lautet:
sin (ϕ + ψ) = cos (ϕ) sin (ψ) + sin (ϕ) cos (ψ)
Man erhält es aus dem ersten, wenn man die Identitäten
π
= sin φ
cos φ −
2
π
sin φ −
= − cos φ
2
verwendet:
sin (ϕ + ψ) =
=
=
π
cos ϕ + ψ −
2 π
π
cos (ϕ) cos ψ −
− sin (ϕ) sin ψ −
2
2
cos (ϕ) sin (ψ) + sin (ϕ) cos (ψ)
KAPITEL 1. VEKTORRECHNUNG
39
Aufgaben zu Abschnitt 1.4
1.4.1
Aufgabe:
Bilden Sie mit den Vektoren


1
~a =  1  ,
1
die folgenden Skalarprodukte:


−3
~b =  0  ,
4


4
~c =  10 
−2
~a · ~b
~a − 3~b · (4~c)
~a + ~b · (~a − ~c)
a)
b)
c)
1.4.2
Aufgabe:
Welchen Winkel schließen jeweils die Vektoren ~a und ~b ein?
 


3
−4
a)
~a =  6  , ~b =  4 
6
16


 
6
6
b)
~a =  4  , ~b =  3 
−8
6
c)
~a = 4~ex + 8~ey − 4~ez ,
1.4.3
~b = 6~ex + 3~ey + 3~ez
Aufgabe:
Zeigen Sie, dass die Vektoren ~a und ~b jeweils zu einander orthogonal sind:




−1
−4
a)
~a =  2  , ~b =  8 
5
−4




3
4
b)
~a =  −2  , ~b =  1 
10
−1
1.4.4
Aufgabe:




6
4
Gegeben sind der Vektor ~v =  3  und der Kraftvektor F~ =  8  .
3
−4
• Zerlegen Sie die Kraft F~ in eine Komponente F~k zu ~v und in eine Komponente F~⊥ dazu.
• Welchen Winkel schließen die beiden Vektoren ein?
KAPITEL 1. VEKTORRECHNUNG
1.4.5
40
Aufgabe:
Gegeben ist ein Vektor


2
~v =  −2  .
1
Berechnen Sie jeweils für die folgenden Vektoren ihre Komponente in Richtung des Vektors ~v :
 




5
−2
10
~a =  1  , ~b =  5  , ~c =  4 
3
0
−2
1.4.6
Aufgabe:
Gegeben ist ein Kraftvektor

9
√
F~ =  2 2  .
−1

Ein weiterer Vektor ~v ist durch folgende Angaben bestimmt: Er bildet mit der x-Achse einen Winkel
von 60°, mit der y-Achse einen Winkel von 45° und mit der z-Achse einen Winkel zwischen 0° und 70°.
• Berechnen Sie den Richtungswinkel γ des Vektors ~v .
• Zerlegen Sie die Kraft F~ in eine Komponente F~k zu ~v und in eine Komponente F~⊥ dazu.
1.4.7
Aufgabe:
Ein Rechteck A, B, C, D ist durch drei seiner Eckpunkte eindeutig festgelegt, – aber drei beliebige
Punkte sind nicht notwendigerweise Eckpunkte eines Rechtecks! Gegeben seien nun die drei Punkte
A = (1; 1; 1) , B = (2; 3; 1) , C = (4; 2; 2) .
a)
Zeigen Sie, dass diese Punkte ein Rechteck definieren.
b)
Wie groß ist der Flächeninhalt des Rechtecks?
c)
Wie lang sind die Diagonalen?
d)
Bestimmen Sie die Koordinaten für den Mittelpunkte M des Rechtecks.
D
C
A
B
KAPITEL 1. VEKTORRECHNUNG
1.4.8
41
Aufgabe:
Gegeben ist ein Würfel mit dem Mittelpunkt M = (0; 0; 0) und der Kantenlänge 2.
a)
Die Raumdiagonalen des Würfels schneiden sich in M . Welche unterschiedlichen Winkel α
zwischen den Raumdiagonalen kommen vor?
b)
Wie groß ist der Winkel β zwischen einer Raumdiagonalen und einer Kante, die mit der
Raumdiagonalen einen gemeinsamen Eckpunkt hat?
c)
Wie groß ist der Winkel γ zwischen einer Raumdiagonalen und einer Seitendiagonalen, die
im selben Eckpunkt auf einader treffen?
KAPITEL 1. VEKTORRECHNUNG
1.5
42
Analytische Geometrie II: Anwendung des Skalarproduktes
Abstand eines Punktes von einer Geraden
Es sei eine Gerade gegeben durch
~r (λ) = ~a + λ~v
und ein Punkt P durch seinen Ortsvektor ~p. Sein Abstand ∆ zur Geraden soll berechnet werden, siehe
Abbildung 1.22. Dazu fällt man das Lot vom Punkt auf die Gerade. Wenn ~r (λ) der Fußpunkt des
Lotes ist, so gilt
∆ = |~p − ~r (λ)| .
Da das Lot senkrecht auf der Richtung der Geraden steht, gilt
~v · (~r (λ) − p~) = 0 ,
d.h.
~v · (~a + λ~v − p~) = 0 .
Dies ist eine Gleichung mit einer Unbekannten λ. Ist diese berechnet, erhält man den Abstand aus der
Formel ∆ = |~
p − ~r (λ)| .
P
p~
∆
·
~a
~v
Gerade
~r(λ)
O
Abbildung 1.22: Der Abstand eines Punktes von einer Geraden.
Der Abstand zweier windschiefer Geraden
Es seien zwei windschiefe Geraden gegeben durch
~r (λ)
~s (µ)
= ~a + λ~u
= ~b + µ~v
Ihr Abstand ∆ soll berechnet werden. Die kürzeste Verbindung steht senkrecht auf beiden Geraden.
Das bedeutet:
~u · (~r (λ) − ~s (µ))
~v · (~r (λ) − ~s (µ))
= 0
= 0
Dies sind zwei Gleichungen in den zwei Unbekannten λ und µ. Man löst dieses Gleichungssystem und
erhält den Abstand dann als ∆ = |~r (λ) − ~s (µ)|.
KAPITEL 1. VEKTORRECHNUNG
43
Die Normalenform der Ebene
Einen Vektor, der senkrecht auf einer Ebene steht, bezeichnet man als Normalenvektor der Ebene.
Es gibt zu jeder Ebene unendlich viele Normalenvektoren, die alle kollinear zu einander sind. Eine
Ebene ist eindeutig festgelegt durch einen Ortsvektor ~a zum Aufpunkt A und einen Normalenvektor
~n, siehe Abbildung 1.23. Es sei nun ~r ein beliebiger Punkt der Ebene. Der Differenzvektor ~r − ~a liegt
~n
·
Ebene
~r − ~a
~a
~r
O
Abbildung 1.23: Normalenform der Ebene.
dann in der Ebene und muss deshalb orthogonal zu dem Normalenvektor ~n sein:
(~r − ~a) · ~n = 0
Man kann das auch so schreiben:
~r · ~n = ~a · ~n
Diese beiden Schreibweise
nennt man die (Punkt-) Normalenform der Ebene. Wir teilen die letztere
Gleichung durch ~n und erhalten
ˆ · ~r = ~n
ˆ · ~a ,
~n
wobei
ˆ = ~n
~n
~n
der (auf die Länge Eins) normierte Normalenvektor ist. Es gibt für jede Ebene genau zwei mögliche
normierte Normalenvektoren. Einer zeigt von der Ebene aus gesehen zum Ursprung hin und der andere
ˆ ·~a < 0 (stumpfer Winkel
in die entgegengesetzte Richtung vom Ursprung zur Ebene. Im ersten Fall ist ~n
ˆ
zwischen den beiden Vektoren), und im zweiten Fall ~n · ~a > 0 (spitzer Winkel zwischen den beiden
Vektoren)14 . Wir legen uns auf den zweiten Fall fest, der in Abbildung 1.24 gezeigt ist. Also: Per
Definitionem gilt immer
ˆ · ~a > 0 .
~n
Die kürzeste Verbindungslinie zwischen dem Ursprung und der Ebene steht senkrecht auf dieser und
ˆ . Das Skalarprodukt ~n
ˆ · ~a > 0 ist also die Projektion des Aufpunktes auf
hat daher die Richtung von ~n
diese Linie – und dies ist gerade der Abstand d der Ebene vom Ursprung. Die Ebenengleichung in der
Hesseschen Normalenform lautet dann:
ˆ · ~r = d
~n
Den Abstand
ˆ · ~a
d = ~n
ˆ ist so zu wählen, dass ~n
ˆ · ~a ≥ 0 gilt.
kann man mit einem beliebigen Punkt ~a berechnen. Der Vektor ~n
ˆ
Ansonsten muss ~n gespiegelt werden.
14 Für
ˆ · ~a = 0 liegt der Koordinatenursprung in der Ebene.
den Sonderfall ~
n
KAPITEL 1. VEKTORRECHNUNG
44
ˆ
~n
·
d
Ebene
~a
O
Abbildung 1.24: Hessesche Normalenform der Ebene.
Abstand eines Punktes von einer Ebene
Es sei eine Ebene in der Hesseschen Normalenform gegeben sowie ein Punkt P mit Ortsvektor p~ . Es
P
p~
p~ − ~a
∆
d
ˆ
~n
·
·
A
·
~a
Ebene
O
Abbildung 1.25: Der Abstand eines Punktes von einer Ebene.
soll der Abstand ∆ dieses Punktes zur Ebene bestimmt werden. Aus Abbildung 1.25 erkennt man,
dass dieser gerade gegeben ist durch den Betrag der Projektion des Differenzvektors p~ − ~a auf den
ˆ . Durch das Skalarprodukt kann man dies schreiben als
Normalenvektor ~n
ˆ
ˆ
∆ = ~n
· (~p − ~a) = ~n
· p~ − d .
ˆ (~
Die Betragsstriche sind notwendig, weil per definitionem ∆ ≥ 0 gilt, während ~n
p − ~a) < 0 gilt, wenn
der Punkt vom Ursprung aus gesehen vor der Ebene liegt.
Abstand zwischen einer Ebene und einer parallelen Geraden
Eine Gerade
~r (λ) = ~b + λ~v
verläuft genau dann parallel zur Ebene (oder liegt sogar in der Ebene) mit Normalenvektor ~n, wenn
der Richtungsvektor ~v der Geraden senkrecht auf dem Normalvektor steht. Ist dies der Fall, ist der
Abstand der Geraden zur Ebene gerade gleich dem Abstand des Aufpunktes ~b zur Ebene.
KAPITEL 1. VEKTORRECHNUNG
45
Schnittpunkt zwischen Gerade und Ebene
Es sei eine Ebene gegeben durch
(~r − ~a) · ~n = 0
und eine Gerade gegeben durch
~r (λ) = ~b + λ~v .
Falls der Normalenvektor ~n senkrecht auf dem Richtungsvektor ~v steht (~v · ~n = 0), kann es keinen
Schnittpunkt geben. Denn dann liegt die Gerade entweder in der Ebene oder parallel dazu. Einen
(möglichen) Schnittpunkt bestimmt man, indem man die Gleichung für die Gerade in die der Ebene
einsetzt:
~b + λ~v − ~a · ~n = 0
Dies ist eine Gleichung mit einer Unbekannten λ, welche sich leicht lösen lässt. Einsetzen in die
Geradengleichung liefert den Schnittpunkt.
Koordinatendarstellungen der Ebene
Eine Ebene in der Punkt-Normalenform ist gegeben durch
~r · ~n = ~a · ~n .
Dabei ist

x
~r =  y 
z

ein allgemeiner Punkt der Ebene, ~a ein gegebener Aufpunkt und ~n ein gegebener Normalenvektor.
Schreibt man das Skalarprodukt der Gleichung in Koordinaten und definiert k = ~a · ~n, so erhält man
eine Gleichung der Form
nx x + ny y + nz z = k .
Dies ist die Koordinatenform der Ebene. Man nennt dies auch die skalare Form.
Eine Ebene in der Hesseschen Normalenform ist gegeben durch
ˆ · ~r = d .
~n
Dabei ist


x
~r =  y 
z
ein allgemeiner Punkt der Ebene und d ≥ 0 der Abstand der Ebene zum Ursprung. Der NormalenEinheitsvektor


n̂x
ˆ =  n̂y 
~n
n̂z
zeigt vom Ursprung in Richtung der Ebene. Schreibt man das Skalarprodukt in der Hesseschen Normalenform in Koordinaten, so ergibt sich die Hessesche Normalenform in Koordinaten:
n̂x x + n̂y y + n̂z z = d
Eine Ebene, die durch die Gleichung
x y z
+ + = 1 mit a, b, c 6= 0
a
b
c
KAPITEL 1. VEKTORRECHNUNG
46
gegeben ist, schneidet die Koordinatenachsen jeweils bei x = a, y = b und z = c. Man nennt dies die
Achsenabschnittsform der Ebene. Es gilt offenbar
a=
d
n̂x
b=
d
n̂y
c=
d
.
n̂z
KAPITEL 1. VEKTORRECHNUNG
47
Aufgaben zu Abschnitt 1.5
1.5.1
Aufgabe
Welchen Abstand besitzt der Punkt P = (3; 0; 4) von der Geraden
 


3
1
~r (λ) =  6  + λ  2 
7
2
1.5.2
Aufgabe
Es seien zwei Geraden gegeben durch








3
2
3
1
~r (λ) =  2  + λ  −1  und ~s (µ) =  1  + µ  −1  .
1
−1
−1
0
Falls sich die Geraden schneiden, bestimmen Sie den Schnittpunkt. Falls sie sich nicht schneiden,
bestimmen Sie den Abstand.
1.5.3
Aufgabe zu den Ebenengleichungen:
Bestimmen Sie die Ebene, die durch den Punkt P = (1; 0; 2) geht und den Normalenvektor


−3
~n =  −2 
−1
besitzt. Schreiben Sie die Ebenengleichung hin
• in der Punkt-Normalenform
• in der Hesseschen Normalenform (vektoriell und in Koordinaten)
• in der Achsenabschnittsform
Lesen Sie daraus ab:
• Den Abstand der Ebene vom Ursprung
• Die Schnittpunkte mit den Koordinatenachsen
1.5.4
Aufgabe:
Gegeben sind die folgenden vier Ebenen:
E1 :
2 (x − 1) − 3y + 5 (z − 2) = 0
E2 :
−4x + 6y + 10z + 24 = 0
E3 :
4x − 6y − 10z + 1 = 0
E4 :
2x − 3y + 5z − 12 = 0
• Welche dieser Ebenen sind identisch und welche sind parallel?
• Bestimmen Sie den Winkel zwischen E1 und E2 !
KAPITEL 1. VEKTORRECHNUNG
1.5.5
48
Aufgabe:
Eine Gerade geht durch die Punkte P = (5; 4; 6) und Q = (6; 6; 9). Eine Ebene geht durch den Punkt
R = (5; 3; 2) und besitzt den Normalenvektor


3
~n =  2 
−2
Berechnen Sie den Schnittpunkt zwischen Gerade und Ebene.
1.5.6
Aufgabe:
Eine Ebene ist durch den Aufpunkt A = (6; 2; 7) und den Normalenvektor


2
~n =  −2 
1
gegeben. Welchen Abstand hat der Punkt P = (3; 1; 2) von der Ebene?
1.5.7
Aufgabe:
Von einer Ebene sind der Punkt A = (6; −2; −1) und der Normalenvektor
 
2
~n =  2  .
1
bekannt, von einer Geraden der Punkt B = (8; 4; 4) und der Richtungsvektor


2
~v =  −2  .
0
Zeigen Sie, dass Gerade und Ebene parallel verlaufen und berechnen Sie den Abstand.
1.5.8
Aufgabe:
Eine Ebene ist in Koordinatenform gegeben durch
3x + 4y + 5z = 10 .
• Wie groß ist der Abstand der Ebene vom Ursprung?
• Wo schneidet die Ebene die Koordinatenachsen?
KAPITEL 1. VEKTORRECHNUNG
1.5.9
49
Aufgabe:
Eine Ebene enthält die durch




1
2
~r (λ) =  2  + λ  −1 
1
5
gegebene Gerade sowie den Punkt B = (1; 4; 3). Bestimmen Sie die Gleichung der Ebene
• in der Punkt-Richtungsform
• in der Normalenform
• in der skalaren Form.
KAPITEL 1. VEKTORRECHNUNG
1.6
50
Das Vektorprodukt, das Spatprodukt und Anwendungen
dazu
Neben dem Skalarprodukt gibt es ein weiteres Produkt, das in der Vektorrechnung und deren Anwendung in Naturwissenschaft und Technik eine wichtige Rolle spielt: Das Vektorprodukt. Man nennt es so,
weil das Vektorprodukt zweier Vektoren wieder ein Vektor ist. Man schreibt ~a ×~b für das Vektorprodukt
(im Unterschied zu ~a · ~b für das Skalarprodukt).
Vektorprodukte werden in Natur und Technik oft gebraucht, wenn man es mit Drehungen zu tun
hat, zum Beispiel beim Drehmoment und beim Drehimpuls. Hier kann man die auftretenden Richtungen durch die entsprechenden Vektoren korrekt beschreiben. Auch in der elektrischen Feldtheorie
benötigt man das Vektorprodukt. Beispielsweise ist der Poynting-Vektor, der die Energieflussdichte eines elektromagnetischen Feldes beschreibt, das Vektorprodukt der elektrischen und der magnetischen
Feldstärke.
Das Vektorprodukt ist eine Besonderheit des dreidimensionalen Raumes! Man kann es nicht auf Räume
anderer Dimension verallgemeinern. Dies ist ein sehr grundlegender Unterschied zum Skalarprodukt.
Einführendes Beispiel: Das Drehmoment
Es ist aus der Alltagserfahrung und vielleicht auch aus dem Physikunterricht bekannt, dass für eine
Drehbewegung nicht allein die Stärke der angreifenden Kraft eine Rolle spielt, sondern auch der Hebelarm, mit dem diese ansetzt. Das Produkt aus der Länge r des Hebelarms und der Kraft F bildet
das Drehmoment M . Das ist allerdings nur dann richtig, wenn die Kraft senkrecht zum Hebelarm
ansetzt. Ansonsten muss man den Anteil der Kraft nehmen, der senkrecht zum Hebelarm wirkt. Mit
dem Vektorprodukt lässt sich die entsprechende Geometrie sehr elegant beschreiben. Abbildung 1.26
~ = ~r × F~
M
·
·
F~
ϕ
~r
ψ
F~
Abbildung 1.26: Das Drehmoment in vektorieller Darstellung.
zeigt einen Kraftvektor F~ und einen Hebelarm, der durch den Ortsvektor ~r beschrieben ist. Diese
beiden Vektoren spannen eine Ebene auf, und die Richtung der Drehachse steht senkrecht auf dieser
~ zeigt gerade in diese Richtung. Der Kraftvektor F~ setzt mit
Ebene. Das vektorielle Drehmoment M
dem Winkel ψ an der Spitze des Ortsvektors an. Der Winkel zwischen ~r und F~ ist also ϕ = 180◦ − ψ.
Da nur der senkrechte Anteil der Kraft in das Drehmoment eingeht, ist der Betrag des Drehmoments
also gegeben durch
M = rF sin ψ = rF sin ϕ
Dies ist übrigens gerade die Fläche des von ~r und F~ aufgespannten Parallelogramms. Das Vektorprodukt (Zeichen: “×”) wird uns in die Lage versetzen, das vektorielle Drehmoment folgendermaßen zu
KAPITEL 1. VEKTORRECHNUNG
51
schreiben:
~ = ~r × F~ .
M
Geometrische Definition des Vektorproduktes
Drei Vektoren ~a, ~b, ~c bilden ein rechtshändiges System, wenn man den Daumen der rechten Hand
in die Richtung von ~a, den Zeigefinger in die Richtung von ~b und den Mittelfinger in die Richtung von ~c
ausrichten kann. Hierbei kommt es auf die Reihenfolge der Vektoren an: Vertauscht man zwei Vektoren,
so erhält man ein linkshändiges System. Es ist üblich, die Basisvektoren ~ex , ~ey , ~ez des kartesischen
Koordinatensystems wie in Abbildung 1.27 gezeigt als rechtshändiges System zu definieren.
~ez 7→ Mittelfinger
·
O
·
·
~ey 7→ Zeigefinger
~ex 7→ Daumen
Abbildung 1.27: Die Basisvektoren ~ex , ~ey , ~ez bilden ein rechthändiges System.
Das Vektorprodukt ~a × ~b lässt sich folgendermaßen definieren:
1. Der Vektor ~c = ~a × ~b steht senkrecht auf den beiden Vektoren ~a und ~b.
2. Die drei Vektoren ~a, ~b, ~c bilden ein rechtshändiges System.
3. Der Betrag des Vektors ~c = ~a × ~b ist gegeben durch
~a × ~b = |~a| ~b sin ϕ ,
wobei ϕ ∈ [0, π] der Winkel zwischen den Vektoren ~a und ~b ist. Diese Größe ist gerade die
~
Fläche
des von ~a und b aufgespannten Parallelogrammes mit der Grundseite |~a| und der Höhe
~
h = b sin ϕ (siehe Abbildung 1.28).
~b
h = |~b| sin ϕ
ϕ
~a
Abbildung 1.28: Die Fläche des von ~a und ~b aufgespannten Parallelogrammes ist |~a| ~b sin ϕ.
KAPITEL 1. VEKTORRECHNUNG
52
Man kann sich also das Vektorprodukt als einen Vektor vorstellen, der senkrecht auf ~a und ~b steht und
dessen Länge gleich der Fläche des von ~a und ~b aufgespannten Parallelogramms ist, siehe Abbildung
1.29.
~c = ~a × ~b
·
·
~b
ϕ
~a
Abbildung 1.29: Die geometrische Interpretation des Vektorproduktes.
Eigenschaften des Vektorproduktes
Das Vektorprodukt hat einige Eigenschaften eines gewöhnlichen Produktes, aber auch einige andere, für
ein Produkt ungewöhnliche Eigenschaften. Die folgenden Eigenschaften ergeben sich entweder direkt
aus der Definition oder lassen sich durch geometrische Überlegungen beweisen, worauf wir aber hier
verzichten.
1. Das Vektorprodukt ist nicht kommutativ! Es gilt vielmehr:
~a × ~b = −~b × ~a
Wir nennen die Eigenschaft antikommutativ.
2. Das Vektorprodukt ist nicht assoziativ! Im Allgemeinen gilt:
~a × ~b × ~c 6= ~a × ~b × ~c
3. Distributivität:
~a × ~b + ~c = ~a × ~b + ~a × ~c
4. Linearität bezüglich der Multiplikation mit einem Skalar σ:
σ ~a × ~b = (σ~a) × ~b = ~a × σ~b
5. Parallelität:
~a × ~b = ~0
⇔
ϕ = 0 oder ϕ = π ,
d.h. die beiden Vektoren sind parallel (=kollinear). Ein Spezialfall ist die folgende Eigenschaft:
6. ~a × ~a = ~0
Das Vektorprodukt wird oft auch als Kreuzprodukt bezeichnet.
KAPITEL 1. VEKTORRECHNUNG
53
Anwendungen des Vektorproduktes
Der Drehimpuls: Der Drehimpuls eines Massepunktes der Masse m mit Geschwindigkeit ~v am Ort
~r ist gegeben durch
~ = m ~r × ~v .
L
In der Physik gibt es den Drehimpulserhaltungssatz : Der gesamte Drehimpuls eines Systems, auf das
keine äußeren Drehmomente wirken, ist konstant. Deshalb dreht sich zum Beispiel eine Eiskunstläuferin
schneller, wenn sie die Arme an den Körper legt.
Die Lorentzkraft: Auf eine bewegte Ladung q, die sich mit der Geschwindigkeit ~v im Magnetfeld
~ bewegt, wirkt die Lorentzkraft
B
~.
F~ = q ~v × B
Die Ablenkung von Elektronen durch die Lorentzkraft in einer Bildröhre ist für das Bild verantwortlich.
Das Vektorprodukt in Koordinatendarstellung
Wir bezeichnen die normierten Basisvektoren der Koordinatenachsen mit ~e1 , ~e2 , ~e3 . Diese Einheitsvektoren stehen senkrecht aufeinander. Also gilt
~ei · ~ek = δik .
Wir haben ~e1 , ~e2 , ~e3 so gewählt, dass sie ein Rechtssystem bilden, siehe Abbildung 1.27. Das Vektorprodukt zweier verschiedener dieser Vektoren muss immer den dritten ergeben, allerdings hängt das
Vorzeichen von der Reihenfolge ab. Aus Abbildung 1.27 erkennt man:
~e1
~e2
~e3
= ~e2 × ~e3
= ~e3 × ~e1
= ~e1 × ~e2
Um nicht jedesmal in die Zeichnung und auf die Finger der rechten Hand schauen zu müssen, kann
man sich die richtige Reihenfolge der Indizes 1,2,3 folgendermaßen merken: Es kommen nur die Permutationen15 (1,2,3), (3,1,2) und (2,3,1) vor. Dies sind gerade die zyklischen Permutationen16
des Zahlentripels (1,2,3). Abbildung zeigt die Zahlen auf einem Kreis. Zyklische Permutationen des
Zahlentriples (1,2,3) erhält man, indem man diese wie Perlen auf einer Kette auf den Einheitskreis
zeichnet und von der jeweiligen Anfangszahl immer im mathematisch positiven Drehsinn (gegen den
Uhrzeigersinn) auf dem Kreis weitergeht, siehe Abbildung 1.30.
2
1
3
Abbildung 1.30: Zyklische Permutationen der Zahlen 1,2,3.
15 Permutationen
16 Lat.
sind Vertauschungen.
cyclus heißt Kreis.
KAPITEL 1. VEKTORRECHNUNG
54
Wenn man im mathematisch negativen Drehsinn weitergeht, erhält man die antiyzyklischen Permutationen.
Es seien nun zwei Vektoren
~a = a1~e1 + a2~e2 + a3~e3
und
~b = b1~e1 + b2~e2 + b3~e3
gegeben. Deren Vektorprodukt lautet:
~a × ~b =
=
(a1~e1 + a2~e2 + a3~e3 ) × (b1~e1 + b2~e2 + b3~e3 )
a1 b1~e1 × ~e1 + a2 b1~e2 × ~e1 + a3 b1~e3 × ~e1
+a1 b2~e1 × ~e2 + a2 b2~e2 × ~e2 + a3 b2~e3 × ~e2
+a1 b3~e1 × ~e3 + a2 b3~e2 × ~e3 + a3 b3~e3 × ~e3
Die drei Terme mit identischen Basisvektoren verschwinden. Wir verwenden die Antikommutativität,
fassen zusammen und erhalten:
~a × ~b
=
(a2 b3 − a3 b2 ) ~e1
+ (a3 b1 − a1 b3 ) ~e2
+ (a1 b2 − a2 b1 ) ~e3
Wie kann man sich so eine Formel merken? Hier hilft wieder der Kreis von Abbildung 1.30. Es treten
sechs Terme auf: Drei mit zyklischen Permutationen der Indizes (123, 231, 312). Diese haben positives Vorzeichen. Die drei Terme mit antizyklischen Permutationen (132, 213, 321) haben negatives
Vorzeichen.
Mit Spaltenvektoren geschrieben lautet das Vektorprodukt:

 
 

a1
b1
a2 b 3 − a3 b 2
 a2  ×  b 2  =  a3 b 1 − a1 b 3 
a3
b3
a1 b 2 − a2 b 1
Wegen der zyklischen Anordnung der Indizes lässt sich das Vektorprodukt in dieser Schreibweise gut
einprägen. Um dies zu verdeutlichen, definieren wir ~c = ~a × ~b und schreiben
 


a2 b 3 − a3 b 2
c1
 c2  =  a3 b 1 − a1 b 3  ,
c3
a1 b 2 − a2 b 1
wobei wir die Indizes mit der gleichen Farbe wie in Abbildung 1.30 markiert haben. Die Farben treten
in der Reihenfolge auf, die durch den Pfeil in der Abbildung gegeben ist.
Die Fläches eines Parallelogrammes in der x-y-Ebene
Es seien durch
~a =
a1
a2
und ~b =
b1
b2
zwei Vektoren in der x-y-Ebene gegeben. Durch einen kleinen Trick kann man mit Hilfe des Kreuzproduktes leicht die Fläche des von diesen beiden Vektoren aufgespannten Parallelogrammes berechnen.
KAPITEL 1. VEKTORRECHNUNG
55
Dazu fügen wir eine Komponente in der dritten Dimension hinzu, die wir einfach Null setzen. Für diese
Vektoren berechen wir das Vektorprodukt:

 
 

a1
b1
0
 a2  ×  b 2  = 

0
0
0
a1 b 2 − a2 b 1
Dieser Vektor zeigt in z-Richtung. Sein Betrag
|a1 b2 − a2 b1 |
ist die gesuchte Fläche des Parallelogrammes. Die Größe a1 b2 − a2 b1 ist eine sogenannte 2 × 2Determinante. Man schreibt dafür auch
a1 b 1 a2 b 2 = a1 b 2 − a2 b 1
Anwendung: Der Abstand eines Punktes von einer Geraden
Eine Methode, welche mit dem Skalarprodukt arbeitet, haben wir schon kennengelernt. Jetzt kommt
eine, die das Vektorprodukt verwendet. Es sei eine Gerade gegeben durch
~r (λ) = ~a + λ~v
und ein Punkt P durch seinen Ortsvektor p~. Sein Abstand ∆ zur Geraden soll berechnet werden. Wie
man in Abbildung 1.31 erkennt, spannen der Vektor p~ − ~a und der Vektor ~v ein Parallelogramm auf.
P
p~
∆
p~ − ~a
·
~v
Gerade
~a
O
Abbildung 1.31: Der Abstand eines Punktes von einer Geraden.
Dessen Fläche ist |~v × (~
p − ~a)|. Die Grundseite des Parallelogramms ist v = |~v | , und seine Höhe ist
∆. Dann ist die Fläche gleich v∆. Es muss also gelten:
v∆ = |~v × (~
p − ~a)|
Daraus folgt
∆ =
=
|~v × (~p − ~a)|
v
ˆ
p − ~a) .
~v × (~
Welche der beiden Methoden vorzuziehen ist, ist Geschmackssache.
KAPITEL 1. VEKTORRECHNUNG
56
~a × ~b
h
~c
~b
~b
~a
Abbildung 1.32: Ein Spat.
Geometrische Definition des Spatproduktes
Ein Spat ist im Dreidimensionalen das, was ein Parallelogramm im Zweidimensionalen ist, siehe Abbildung 1.32. Der Spat ist ein Körper, der von 6 Parallelogrammflächen begrenzt wird, von denen sich
jeweils zwei parallel gegenüberliegen und geometrisch identisch sind. Ein Spat wird von drei Vektoren ~a, ~b, ~c aufgespannt. Diese Vektoren beschreiben die Kanten des Spates17 . Umgekehrt beschreiben
drei Vektoren im Raum einen Spat. Wir betrachten der Einfachheit halber zunächst den Fall, dass
die drei Vektoren ~a, ~b, ~c ein rechtshändiges System bilden und wollen das Volumen des Spates berechnen18 . Abbildung 1.33 zeigt den Spat in der Seitenansicht. Die beiden Vektoren ~a, ~b spannen das
~a × ~b
[
(~a × ~b) · ~c
~c
h
·
G = |~a × ~b|
Abbildung 1.33: Volumen eines Spates.
Parallelogramm mit der Grundfläche
G = ~a × ~b
auf. Vom Betrachter aus gesehen kommt zuerst der Vektor ~a. Der Vektor ~b liegt weiter hinten. Entsprechend der geometrischen Definition des Vektorproduktes zeigt der Vektor ~a × ~b dann nach oben. Bei
einem rechtshändigen System ~a, ~b, ~c zeigt der Vektor ~c ebenfalls nach oben. Das Volumen des Spates
ist gegeben durch
V = G ·h,
17 Ein Spat hat 12 Kanten, von denen jeweils 4 parallel und gleich lang sind. Jede dieser drei Vierergruppen gehört zu
einem der Vektoren.
18 Auf den Fall eines linkshändigen Systems kommen wir später zurück.
KAPITEL 1. VEKTORRECHNUNG
57
wobei h die Höhe des Spates ist. Diese ist identisch mit der Projektion des Vektors ~c auf den Einheitvektor
~a × ~b
[
~a × ~b = .
~a × ~b
Die Projektion eines Vektors auf einen Einheitsvektor kann man durch das Skalarprodukt ausdrücken.
Es gilt:
[
h = ~a × ~b · ~c
Multipliziert man dies mit G = ~a × ~b, so erhält man
G · h = ~a × ~b · ~c
Das Volumen ist also gegeben durch
V = ~a × ~b · ~c
Dies ist nur richtig für ein rechtshängiges
System. Für ein linkshändiges System zeigt der Vektor ~c in
Abbildung 1.33 nach unten, und ~a × ~b ·~c wird negativ, hat aber den Betrag des Volumens. In beiden
Fällen gilt also
V = ~a × ~b · ~c .
Den Ausdruck ~a × ~b ·~c bezeichnet man als das Spatprodukt der drei Vektoren ~a, ~b, ~c. Es ist identisch
mit dem Volumen V des von diesen Vektoren aufgespannten Spates, wenn das System rechtshändig
ist. Ansonsten hat das Spatprodukt den Wert −V .
Neben der Volumenberechnung gibt es noch andere Anwendungen:
• Man kann offenbar an Hand des Vorzeichens des Spatproduktes überprüfen, ob drei Vektoren ein
rechts- oder ein linkshändiges System bilden.
• Man kann prüfen, ob drei Vektoren in einer Ebene liegen. Das ist genau dann der Fall, wenn ihr
Spatprodukt gleich Null ist.
Der Wert des Spatproduktes ändert sich nicht, wenn man die drei Vektoren zyklisch vertauscht:
~a × ~b · ~c = ~b × ~c · ~a = (~c × ~a) · ~b
Dies ergibt sich unmittelbar aus der geometrischen Interpretation des Spatprodukts. Wegen dieser
Eigenschaft schreibt man das Spatprodukt oft auch folgendermaßen:
h
i ~a, ~b, ~c = ~a × ~b · ~c = ~a · ~b × ~c
Es kommt also nicht darauf an, ob das “×” zwischen dem ersten und zweiten oder zwischen dem
zweiten und dritten Vektor steht.
Das Spatprodukt in Koordinaten
Es seien die drei Vektoren in Koordinaten gegeben als




b1
a1
~a =  a2  ~b =  b2 
b3
a3

c1
~c =  c2 
c3

KAPITEL 1. VEKTORRECHNUNG
58
Wir berechnen das Spatprodukt ~a × ~b · ~c :

 
 

a1
b1
c1
 a2  ×  b2  ·  c2 
a3
b3
c3

 

a2 b 3 − a3 b 2
c1
=  a3 b 1 − a1 b 3  ·  c2 
a1 b 2 − a2 b 1
c3
= (a2 b3 − a3 b2 ) · c1
+ (a3 b1 − a1 b3 ) · c2
+ (a1 b2 − a2 b1 ) · c3
Es gilt also
h
i
~a, ~b, ~c =
a1 b 2 c3 + a2 b 3 c1 + a3 b 1 c2
−a1 b3 c2 − a2 b1 c3 − a3 b2 c1
Bei dieser Anordnung der Terme sieht man folgendes: Jeder Term ist von der Gestalt ai bk cℓ , wobei
(ikℓ) eine zyklische oder antizyklische Permutation von (123) ist. Bei einer zyklischen Permutation ist
das Vorzeichen positiv (obere Zeile), bei einer antizyklischen ist es negativ (untere Zeile). Sehr einfach
wird es, wenn man die 3 × 3 - Determinante definiert19 :
a1
a2
a3
b1
b2
b3
c1
c2
c3
=
a1 b 2 c3 + a2 b 3 c1 + a3 b 1 c2
−a1 b3 c2 − a2 b1 c3 − a3 b2 c1
Das ist zunächst einmal nur eine andere Schreibweise für die selbe Sache: Die drei Spaltenvektoren
werden nebeneinander geschrieben. Durch diese Anordnung ergibt sich aber ein Rechenverfahren, das
man sich leicht merken kann. Zunächst werden dabei jeweils die drei Zahlen miteinander multipliziert,
die auf der selben Diagonalen stehen, die von links oben nach rechts unten geht. Dabei muss man sich
alles wieder zyklisch vorstellen:
a1 b1 c1 a2 b2 c2 a3 b3 c3 Eine Diagonale (farbig markiert), die rechts über den Strich hinausgeht, geht links wieder hinein.
Alternativ kann man auch die Spalten wiederholen und folgendes Bild zeichnen:
a1 b1 c1 a1 b1
a2 b2 c2 a2 b2
a3 b3 c3 a3 b3
Die diagonalen Produkte gleicher Farbe werden nun addiert:
a1 b 2 c3 + a2 b 3 c1 + a3 b 1 c2
Das Gleiche wird mit den Diagonalen gemacht, die von rechts oben nach links unten gehen:
a1 b1 c1 a1 b1
a2 b 2 c2 a2 b 2
a3 b 3 c3 a3 b 3
19 Determinanten
werden später noch ausführlich behandelt. Dies ist ein kleiner Vorgeschmack.
KAPITEL 1. VEKTORRECHNUNG
59
Diese Diagonalprodukte werden nun von den zuvor berechneten subtrahiert und man erhält:
a1 b 1 c1 a2 b 2 c2 = a1 b 2 c3 + a2 b 3 c1 + a3 b 1 c2 − a1 b 3 c2 − a2 b 1 c3 − a3 b 2 c1
a3 b 3 c3 Die eben beschriebene Methode zur Berechnung von 3×3 Determinanten bezeichnet man als die Regel
von Sarrus20 oder auch als Jägerzaun-Regel.
Achtung: Diese Regel darf nicht auf Determinanten in höheren Dimensionen (die wir in Kapitel 3
kennenlernen werden) übertragen werden.
20 Pierre
Frédéric Sarrus (1798 – 1861), französischer Mathematiker.
KAPITEL 1. VEKTORRECHNUNG
60
Aufgaben zu Abschnitt 1.6
1.6.1
Aufgabe:
Gegeben sind die Vektoren


1
~a =  4  ,
−6
Berechnen Sie die folgenden Ausdrücke:


2
~b =  −1  ,
2


0
~c =  2 
3
~a × ~b
~a − ~b × (3~c)
a)
b)
(−~a + 2~c) × −~b
c)
(2~a) × −~b + 5~c
d)
1.6.2
Aufgabe:


3
Gegeben sind die Vektoren ~v =  −2  ,
4


−1
w
~ =  3 .
−3
• Bestimmen Sie alle Einheitsvektoren, die zu ~v und w
~ orthogonal sind.
• Wie groß ist die Fläche des von ~v und w
~ aufgespannten Parallelogramms?
1.6.3
Aufgabe:
Bestimmen Sie den Flächeninhalt des von ~a und ~b aufgespannten Parallelograms.
a)
b)
1.6.4




6
6
~a =  0  , ~b =  −2 
−2
−1
 


2
4
~a =  2  , ~b =  1 
1
−1
Aufgabe:
Prüfen Sie, ob die Vektoren ~a , ~b , ~c komplanar sind:
a)


1
~a =  4  ,
−6


2
~b =  −1  ,
2


0
~c =  2 
3
KAPITEL 1. VEKTORRECHNUNG
b)
c)
1.6.5
61






−3
−2
−1
~a =  4  , ~b =  3  , ~c =  3 
0
5
25
 
 


1
1
1
~a =  1  , ~b =  0  , ~c =  4 
1
2
−2
Aufgabe:
Wie muss die reelle Zahl λ gewählt werden, damit die drei Vektoren






1
−2
−3
~a =  λ  , ~b =  4  , ~c =  5 
4
11
1
komplanar sind?
1.6.6
Aufgabe:
Bestimmen Sie das Volumen des von den Vektoren

 

3
−1
~a =  1  , ~b =  4  ,
7
−1
aufgespannten Spats.
1.6.7

1
~c =  2 
−8

Aufgabe:
Durch die drei Punkte A, B, C wird jeweils ein Dreieck festgelegt. Berechnen Sie die Seitenlängen, die
innen liegenden Winkel sowie den Flächeninhalt des jeweiligen Dreiecks.
a)
A = (1; 4; −2) ,
B = (3; 1; 0) ,
C = (−1; 1; 2)
b)
A = (1; 4; −3) ,
B = (2; 2; 1) ,
C = (−1; 2; −3)
1.6.8
Aufgabe:
Für welchen reellen Wert α liegen die Punkte
A = (1; 1; −1) ,
in einer Ebene?
B = (1; 0; 1) ,
C = (0; 2; 1) ,
D = (1; 2; α)
KAPITEL 1. VEKTORRECHNUNG
1.6.9
62
Aufgabe:
Zeigen Sie zunächst, dass die beiden Vektoren
 


2
−1
~u =  0  und ~v =  1 
3
1
nicht kollinear sind und somit mit dem Aufpunkt P = (2; 1; −3) eine Ebene festlegen.
a)
Wie lautet die Ebenengleichung in vektorieller (Punkt-Richtungs-) Form?
b)
Wie lautet die Ebenengleichung in Normalenform?
c)
Wie lautet die Ebenengleichung in Koordinatenform?
1.6.10
Aufgabe:
Eine Ebene geht durch die Punkte A = (5; −1; 3) ,
B = (6; 0; 3) ,
C = (4; −1; 4).
a)
Welchen Abstand hat der Punkt P = (10; 3; 8) von dieser Ebene?
b)
Welchen Abstand hat der Punkt Q = (0; 2; 11) von dieser Ebene?
c)
Welche Höhenkoordinate z muss der Punkt R = (2; −4; z) haben, damit er in der Ebene
liegt?
1.6.11
Aufgabe:
Berechnen Sie die folgenden
−4
a) 1
−2
Determinanten:
1
3 −1 3 3 b) 3
1
0 3 −2 0
−3 2
−2 −2
5
1
5 c) −1 2 −2 5 −3 −4 Kapitel 2
Komplexe Zahlen
Die kürzeste Verbindung zwischen zwei Aussagen über reelle Zahlen führt über komplexe
Zahlen. (Jacques Salomon Hadamard, französischer Mathematiker, 1865 – 1963)
Komplexe Zahlen werden unter anderem bei der mathematischen Beschreibung von Schwingungen
und Wellen gebraucht. Anstatt mit Sinus- und Kosinusfunktionen rechnet man dann mit komplexen
Exponentialfunktionen, was viel einfacher und übersichtlicher ist.
2.1
Komplexe Zahlen als Zeiger
Wir führen die komplexen Zahlen C geometrisch ein als Zeiger1 in der sogenannten Gaußschen
Zahlenebene2 . Die Gaußsche Zahlenebene ist zunächst einmal nichts anderes als die schon bekannte
x-y-Ebene, und die Zeiger sind zunächst einmal nichts anderes als Vektoren in zwei Dimensionen,
deren Addition in genau der gleichen Weise wie die Vektoraddition erklärt ist. Wir führen zunächst
nur neue Bezeichnungen für bekannte Dinge ein. Erst danach wird mit der komplexen Multiplikation
von Zeigern eine neue mathematische Struktur konstruiert, die es für Vektoren nicht gibt und die völlig
neue Möglichkeiten eröffnet.
Wir führen jetzt die neuen Bezeichnungen ein und definieren die (Vektor-) Addition von Zeigern.
Die Zeiger sind Vektoren in der Ebene, die wir nur etwas anders schreiben: Statt eines zweidimensionalen Spaltenvektors
x
~z =
y
mit einem Pfeil über dem Symbol schreiben wir einen Zeilenvektor3
z = (x, y) ∈ C .
Abbildung 2.1 zeigt einen solchen Zeiger in der Ebene. Man nennt x den Realteil von z und y den
Imaginärteil und schreibt
x = Re {z}
1 In der Technik bezeichnet man die komplexen Zahlen oft als Zeiger, weil dies der Anschauung hilft. Ein Mathematiker kennt diese Bezeichnung oft nicht.
2 Carl Friedrich Gauß (1777-1855) war ein deutscher Mathematiker und Astronom.
3 In der Wechselstromrechnung der Elektrotechnik werden komplexe Größen unterstrichen. Mathematisch ist das nicht
nötig.
63
KAPITEL 2. KOMPLEXE ZAHLEN
64
imaginäre Achse
z = (x, y) = x + jy
y = |z| sin ϕ
|z|
(0, 1) = j
ϕ
reelle Achse
x = |z| cos ϕ
(1, 0) = 1
Abbildung 2.1: Zeigerdarstellung in der Gaußschen Zahlenebene.
und entsprechend
y = Im {z} .
Die x-Achse in Abbildung 2.1 wird daher auch als reelle Achse und die y-Achse als imaginäre Achse
bezeichnet.
Komplexe Zeiger addiert man genau wie Vektoren komponentenweise:
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) ,
Genau wie bei Vektoren ist die Multiplikation mit einer reellen Zahl a (einem Skalar ), dadurch erklärt,
dass beide Komponenten mit dieser Zahl multipliziert werden:
a (x, y) = (ax, ay)
Merke: Komplexe Zeiger haben bezüglich der Addition ganz genau die selben Eigenschaften wie
Vektoren in der Ebene.
Bevor wir nun für die komplexen Zahlen die Multiplikation als zusätzliche Operation definieren, wollen
wir zur Vorbereitung eine Schreibweise einführen, die beim Rechnen mit komplexen Zahlen gebräuchlich
ist.
Schreibweise:
(1, 0) =
(0, 1) =
1
j
Erläuterung der Schreibweise: Die x-Achse (die reelle Achse) ist ja nichts anderes als der Zahlenstrahl der reellen Zahlen: Rein eindimensionale Vektoren sind einfach nur Zahlen, und wir schreiben x
statt (x, 0). In diesem Sinne fassen wir die Menge der reellen Zahlen R als eine Teilmenge der komplexen
Zahlen C auf, d.h.
R ⊂ C.
KAPITEL 2. KOMPLEXE ZAHLEN
65
Konsequenterweise schreiben wir also 1 statt des Basisvektors (1, 0), den wir früher auch mit ~ex bezeichnet haben. Für die y-Achse (die imaginäre Achse) führen wir die Bezeichnung j für den Basisvektor
(0, 1) ein (den wir früher auch mit ~ey bezeichnet haben) und schreiben jy für einen Vektor (0, y), der
in Richtung der y-Achse zeigt. Man nennt j die Imaginäre Einheit4 .
Einen komplexen Zeiger
z = (x, y) = x (1, 0) + y (0, 1)
kann man dann also schreiben als
z = x · 1 + y · j = x + jy .
Dies nennt man die kartesische Darstellung der komplexen Zahl. Abbildung 2.1 zeigt den Zeiger und
die beiden Basisvektoren 1 und j. Die komplexe Zahl z ist also reell, wenn der Imaginärteil verschwindet
und damit z = x gilt. Wenn der Realteil verschwindet und damit z = jy gilt, so nennt man die Zahl
(rein) imaginär.
Zeiger haben wie Vektoren Längen und Richtungen. Wir übernehmen aus der Vektorrechnung die
Definition des Betrages. Ein komplexer Zeiger
z = x + jy
hat den Betrag
|z| =
p
x2 + y 2 .
Nach dem Satz des Pythagoras ist der Betrag gerade die Länge des Zeigers. Genau wie für Vektoren
in der Ebene werden Polarkoordinaten eingeführt. Den Winkel ϕ ∈ [−π, π] zwischen dem komplexen
Zeiger z und der x-Achse bezeichnet man bei komplexen Zahlen als den Phasenwinkel. Man schreibt
für diesen Phasenwinkel auch
ϕ = arg (z)
Wie bei ebenen Polarkoordinaten wird der Winkel im mathematisch positiven Drehsinn gezählt und
ist positiv in der oberen Halbebene und negativ in der unteren. Es gilt
x = |z| cos ϕ
y = |z| sin ϕ .
In ebenen Polarkoordinaten kann man eine komplexe Zahl also schreiben als
z = |z| (cos ϕ + j sin ϕ) .
Man nennt dies die Polardarstellung oder auch die trigonometrische Darstellung der komplexen
Zahl.
Wie im Abschnitt zu den ebenen Polarkoordinaten diskutiert, ist der Phasenwinkel gegeben durch
y
.
ϕ = arctan
x
Dies ist – wie bei Vektoren – wieder nur in der rechten Halbebene richtig. Für Zeiger in der linken
Halbebene muss man ±π addieren.
4 Mathematiker und Physiker verwenden i für die imaginäre Einheit. Den Buchstaben j verwenden vorzugsweise die
Elektrotechniker, weil das sonst übliche i für den Strom gebraucht wird.
KAPITEL 2. KOMPLEXE ZAHLEN
66
Aufgaben zu Abschnitt 2.1
2.1.1
Aufgabe
Formen Sie die folgenden Ausdrücke jeweils so um, dass die komplexe Zahl z in der kartesischen Form
da steht: z = x + jy
a)
z = (2 − 7j) + (12 − 13j)
b)
z = (5 − j · 23) − (2 − j · 3)
c)
z = (j · 1 + 2) − (1 + j · 2)
d)
z = (1 + 2j) − (−2 + 3j) + (−3 + j) − (5 + 4j) − (−1 + 9j) + (5 − 8j)
e)
z = (−2a + 3j) − (b − jb) + (−2a − 3j) − (−b − cj) mit a, b, c ∈ R
2.1.2
Aufgaben
Skizzieren Sie die folgenden komplexen Zahlen z in der Gaußschen Zahlenebene und bestimmen Sie
danach (ohne Taschenrechner!) jeweils ihren Betrag |z| und den Phasenwinkel ϕ :
a)
b)
c)
d)
e)
Hinweis:
√
z =1+j 3
√
z = −j − 3
z = 8 − 8j
√
z = 12j − 2
√
z = 3 − 3j
z = |z| (cos ϕ + j sin ϕ)
67
imaginäre Achse
KAPITEL 2. KOMPLEXE ZAHLEN
z = z1 · z2
ϕ = ϕ1 + ϕ2
z2
ϕ
z1
ϕ2
ϕ1
reelle Achse
Abbildung 2.2: Multiplikation von zwei Zeigern der Länge Eins.
2.2
Multiplikation von komplexen Zahlen
Der geometrische Zugang zur Multiplikation komplexer Zahlen
Anstatt die Multiplikation von komplexen Zahlen mit einer formalen Rechenvorschrift einzuführen,
bevorzugen wir einen geometrischen Zugang.
Das Produkt zweier komplexer Zahlen soll wieder eine komplexe Zahl sein. Für die reellen Zahlen soll
sich das übliche Produkt zweier reeller Zahlen als Spezialfall ergeben. Das führt auf die
Forderung 1: Bei der Multiplikation zweier komplexer Zahlen multiplizieren sich die Beträge. D.h.
für z1 , z2 ∈ C gilt
|z1 · z2 | = |z1 | · |z2 | .
Jetzt müssen wir erklären, was mit den Phasenwinkeln bei der Multiplikation passiert. Die Konstruktion
erhält man mit der
Forderung 2: Bei der Multiplikation zweier komplexer Zahlen addieren sich die Phasenwinkel. D.h.
für z1 , z2 ∈ C mit Phasenwinkeln ϕ1 , ϕ2 hat das Produkt z = z1 · z2 den Phasenwinkel
ϕ = ϕ1 + ϕ2 .
Damit ϕ ∈ [−π, π] gilt, muss evtl. der Vollwinkel 2π addiert oder subtrahiert werden.
Multiplikation mit einem Zeiger kann man sich also als eine Drehstreckung vorstellen: Man dreht um
den Winkel des Zeigers und streckt um den Betrag. Abbildung 2.2 zeigt die Multiplikation zweier
Zeiger z1 , z2 mit dem Betrag |z1 | = |z2 | = 1.
Eigenschaften des Produktes
Von einer Multiplikation erwartet man gewisse Eigenschaften: Sie muss assoziativ, kommutativ und
distributiv sein. Man kann sich durch geometrische Überlegungen davon überzeugen, dass diese Eigenschaften erfüllt sind. Auf formale Beweise verzichten wir. Es gilt für z, u, v ∈ C:
KAPITEL 2. KOMPLEXE ZAHLEN
68
1. Assoziativgesetz:
z · (u · v) = (z · u) · v
2. Kommutativgesetz:
u·v = v·u
3. Distributivgesetz:
(u + v) · z = u · z + v · z
4. Es gibt eine “multiplikative Eins”:
z·1=z
Diese letzte Eigenschaft ist nicht ganz so trivial, wie sie aussieht. Man muss prüfen, dass die Zahl
1 = (1, 0)
tatsächlich bezüglich der oben definierten komplexen Multiplikation diese Eigenschaft hat. Es passt
aber glücklicherweise zusammen, denn die Zahl 1 = (1, 0) hat die Phase ϕ = 0 und den Betrag Eins
und führt damit genau auf die zuletzt genannte Eigenschaft.
Division: Um dividieren zu können, muss es zu einer komplexen Zahl z 6= 0 ein inverses Element
bezüglich der Multiplikation (d.h. einen Kehrwert )
z −1 =
1
z
geben. Die Zahl z −1 wird definiert als die Zahl, die die Eigenschaft
z −1 · z = 1
bezitzt. Durch die geometrische Definition der Multiplikation als Drehstreckung (Forderung 1 und
Forderung 2) findet man diese Zahl z −1 folgendermaßen:
• Wenn z den Betrag r besitzt, so muss z −1 den Betrag 1/r haben.
• Wenn z den Phasenwinkel ϕ besitzt, so muss z −1 den Phasenwinkel −ϕ haben.
Es gilt also
Das Inverse von
−1 z = |z|−1
arg z −1
= − arg (z)
z = r (cos ϕ + j sin ϕ)
lautet deshalb in kartesischer Darstellung:
z −1 =
1
(cos ϕ − j sin ϕ)
r
Division ist gerade die Multiplikation mit dem Kehrwert, d.h.
z1
= z1 · z2−1 .
z2
KAPITEL 2. KOMPLEXE ZAHLEN
69
Aus den eben beschriebenen Regeln zur Bestimmung des Kehrwertes folgt:
z1 |z1 |
=
z2 |z2 |
und
arg
d.h.
z1
z2
= arg (z1 ) − arg (z2 )
ϕ = ϕ1 − ϕ2 .
Das Rechnen mit j
Wir berechnen nun ein paar wichtige Produkte, in denen die imaginäre Einheit j vorkommt. Zuerst
schauen wir uns j · j = j 2 an. Weil j den Betrag |j| = 1 und den Phasenwinkel ϕ = π/2 hat, hat j 2
den selben Betrag j 2 = 1 und den Phasenwinkel π. Also gilt
j 2 = −1 .
In Worten: Das Quadrat√der imaginären Einheit ergibt die reelle Zahl −1. Diese Eigenschaft wird
oft geschrieben als „ j = −1 “, – was zunächst etwas gewöhnungsbedürftig ist: Im Komplexen kann
man Wurzeln aus negativen Zahlen ziehen! Komplexe Wurzeln werden ausführlich in Abschnitt 2.5
behandelt. In dieser Vorlesung wird die Schreibweise mit dem Wurzelzeichen aber vermieden, weil sie
leicht zu Fehlern führen kann.
Aus j 2 = −1 folgt
1
= −j und j 3 = −j .
j
Weil die Multiplikation mit j einer Drehung um 90° und die Division durch j einer Drehung um -90°
entspricht, muss jede ganzzahlige Potenz von j einem der vier Zeiger in Abbildung 2.3 entsprechen.
imaginäre Achse
j = j 5 = ... =
−1 = j 2 = ... =
1
j2
= ...
1
j3
= ...
1 = j 4 = ... =
reelle Achse
−j = j 3 = ... =
1
j
= ...
Abbildung 2.3: Die Zeiger zu den Potenzen von j.
1
j4
= ...
KAPITEL 2. KOMPLEXE ZAHLEN
70
Es gilt:
ϕ = 0◦
ϕ = 90◦
ϕ = 180◦
ϕ = −90◦
1
1
= 8 = ...
j4
j
1
1
j = j 5 = j 9 = ... = 3 = 7 = ...
j
j
1
1
−1 = j 2 = j 6 = ... = 2 = 6 = ...
j
j
1
1
−j = j 3 = j 7 = ... = = 5 = ...
j
j
1 = j 4 = j 8 = ... =
Berechnen des Produktes in kartesischer Darstellung
Wir berechnen das Produkt zweier komplexer Zahlen
z1 = x1 + jy1
und
z2 = x2 + jy2 .
Durch Ausmultiplizieren (Distributivgesetz) ergibt sich:
z1 · z2 = (x1 + jy1 ) · (x2 + jy2 ) = x1 x2 + j 2 y1 y2 + j (x1 y2 + y1 x2 )
Mit j 2 = −1 erhalten wir
z1 · z2 = x1 x2 − y1 y2 + j (x1 y2 + y1 x2 ) .
KAPITEL 2. KOMPLEXE ZAHLEN
71
Aufgaben zu Abschnitt 2.2
2.2.1
Aufgabe
Formen Sie die folgenden Ausdrücke jeweils so um, dass die komplexe Zahl z in der kartesischen Form
da steht: z = x + jy
a) z = j 6 + j 7 + j 8
2.2.2
b) z =
j−2
j3
c) z = 1 + j +
1
1
+ 5
j3
j
d) z =
2j 3 · 3j 7
5j 21
Aufgabe:
Formen Sie die folgenden Ausdrücke jeweils so um, dass die komplexe Zahl z in der kartesischen Form
da steht: z = x + jy
a)
z = (3 − 2j) (4 + 2j)
b)
z = (4 + j) (6 − 2j)
c)
z = (5 − 23j) (2 − 3j)
d)
z = (5 − 2j) (−3 + 2j)
√
√ √
√ z = 3 2 + 5j 3 3 2 − j · 5 3
e)
f)
z = (3 + 2j)3
g)
z = (1 + j) Tipp: Interpretieren Sie die Aufgabe geometrisch!
h)
z = (j − 2)
2.2.3
5
4
Aufgabe
Berechnen Sie (auf möglichst einfache Weise!) für die folgenden komplexen Ausdrücke z das Betrags2
quadrat (d.h. |z| ):
a)
z = (1 + 2j) (3j − 2)
b)
z=
c)
z = 2 + cos ϕ + j sin ϕ ,
d)
z=
jλ
,
1 + jλ
e)
z=
jωτ
,
1 + jωτ
f)
z=
jωδ
,
ω02 − ω 2 + jωδ
2 + 4j
6 − 2j
ϕ ∈ [−π, π]
λ∈R
ω, τ ∈ R
ω, ω0 , δ ∈ R
KAPITEL 2. KOMPLEXE ZAHLEN
2.3
72
Komplex konjugierte Zahlen
Zur praktischen Durchführung der Division mit komplexen Zahlen benötigen wir einen neuen Begriff.
Für eine komplexe Zahl
z = x + jy
nennt man
z ∗ = x − jy
die komplex konjugierte Zahl oder auch das komplex Konjugierte von z. In Polardarstellung gilt:
z = |z| (cos ϕ + j sin ϕ)
z ∗ = |z| (cos ϕ − j sin ϕ)
Das heißt: Beim komplexen Konjugieren ändert der Phasenwinkel ϕ sein Vorzeichen. Die Operation
“komplex konjugieren” bedeutet einfach nur “Spiegeln an der x-Achse”, siehe Abbildung 2.4. Addiert
imaginäre Achse
z
y
ϕ
reelle Achse
x
−ϕ
−y
z∗
Abbildung 2.4: Die komplex konjugierte Zahl.
man die beiden Gleichungen
z
z∗
= x + jy
= x − jy ,
so erhält man
x = Re {z} =
1
(z + z ∗ ) .
2
Subtrahiert man die Gleichungen, so folgt
y = Im {z} =
1
(z − z ∗ ) .
2j
Geometrisch kann man diese beiden Beziehungen durch Vektoraddition bzw. -subtraktion am Zeigerdiagramm in Abbildung 2.5 ablesen. Denn es gilt (in Vektorschreibweise):
z + z ∗ = (x, y) + (x, −y) = 2 (x, 0) = 2x
und
z − z ∗ = (x, y) − (x, −y) = 2 (0, y) = 2jy .
KAPITEL 2. KOMPLEXE ZAHLEN
73
imaginäre Achse
z
2jy = z − z ∗
ϕ
reelle Achse
2x = z + z ∗
−ϕ
z∗
Abbildung 2.5: Komplex konjugierte Zahl sowie der Realteil und der Imaginärteil.
Für das Betragsquadrat
2
|z| = x2 + y 2
einer komplexen Zahl z = x + jy erhält man folgende nützliche Formel, die oft die Rechnungen
vereinfacht:
2
|z| = z · z ∗
Denn: Die rechte Seite ist gleich (x + jy) (x − jy) = x2 − j 2 y 2 = x2 + y 2 .
Außerdem gilt für zwei komplexe Zeiger z1 , z2 :
∗
(z1 + z2 ) = z1∗ + z2∗
Man zeigt dies durch direktes Hinschreiben in der kartesischen Darstellung.
Komplex konjugiertes Erweitern: Um einen Quotienten von komplexen Zahlen zu berechen und
in der kartesischen Darstellung zu schreiben, erweitert man mit dem konjugiert komplexen Nenner
(damit der Nenner reell wird):
z1 z2∗
z1 · z2∗
z1
=
· ∗ =
2
z2
z2 z2
|z2 |
Danach muss man nur noch das Produkt im Zähler berechnen (durch Ausmultiplizieren). Ein Beispiel
soll das Verfahren verdeutlichen:
1 + 2j
3 + 4j
=
=
=
(1 + 2j) · (3 − 4j)
32 + 42
3 + 8 + (6 − 4) j
25
1
(11 + 2j)
25
KAPITEL 2. KOMPLEXE ZAHLEN
74
Aufgaben zu Abschnitt 2.3
2.3.1
Aufgabe:
(Platzhalter)
2.3.2
Aufgabe:
Formen Sie die folgenden Ausdrücke jeweils so um, dass die komplexe Zahl z in der kartesischen Form
da steht: z = x + jy
3 + 4j
3 + 4j
1
a) z =
b) z =
c) z = √
3 − 4j
j+2
5−j
d) z =
g) z =
1 − 2j
−5 + j
e) z =
1+j
1−j
−
1−j
1+j
h) z =
3 − 2j
+ 3 (j − 8)
j) z =
4 − 3j
2.3.3
f) z =
3j 5 · 5j 4
6j 20
1+j
1−j
+
1−j
1+j
i) z =
2
k) z = (2 − 4j) +
√ 1 − j 3
j
1
1
+ 7
j5
j
l) z =
4 (3 − j)
(1 + j) (−1 + j)
Aufgabe
Berechnen Sie:
j a) 1−j
13 d) Im 3 + 4j 2.3.4
3j
−j + 1
b) Re (5 − 2j) (2 + 3j)2
c) Im
3 + 4j
4 − 2j
j (j + 2) f) Im
−1 − 5j e) Re ((5 − 2j) · j · (5 + 2j))
Aufgabe
Berechnen Sie mit den komplexen Zahlen
z1
=
z2
z3
=
=
−4j
3 − 2j
−1 + j
die folgenden Ausdrücke:
a) z = z1 − 2z2 + 3z3
z ∗ z2
d) z = 1
z3
2.3.5
b) z = 2z1 z2∗
z1 − z2∗
e) z =
3z3∗
c) z = z1 (2z2∗ − z1 ) + z3∗
z1 + z3∗
f) z =
z2∗ z3
Aufgabe
Betrachtet werden die komplexen Zahlen
z1
z2
Für welche Werte a, b ∈ R gilt z1 = z2 ?
=
=
(3a − 5) + j (a − b)
(2a − 7) + j (3a + 7) .
KAPITEL 2. KOMPLEXE ZAHLEN
2.3.6
75
Aufgabe
Betrachtet wird die komplexe Zahl
z
=
a2 (1 + j) + 4a (j − 1) + 4 (1 + j) .
Für welche Werte a ∈ R ist z reell, und für welche ist z rein imaginär?
2.3.7
Aufgabe
Es seien
z1
z2
=
=
3 + 4j und
a + 2j
zwei komplexe Zahlen. Für welche Werte a ∈ R stehen die Zeiger von z1 und z2 senkrecht aufeinander?
KAPITEL 2. KOMPLEXE ZAHLEN
2.4
76
Exponentialdarstellung von komplexen Zahlen
Die Multiplikation von komplexen Zahlen haben wir am Anfang geometrisch eingeführt: Die Beträge
der komplexen Faktoren werden multipliziert, und die zugehörigen Phasenwinkel werden addiert (siehe
Abbildung 2.2). In Formeln kann man dies schreiben als:
|z1 z2 | =
arg (z1 z2 ) =
|z1 | |z2 |
arg (z1 ) + arg (z2 )
imaginäre Achse
Dieser direkte geometrische Zugang zur Multiplikation ist in einigen Fällen dem formalen Rechnen
in kartesischer Darstellung vorzuziehen, weil er anschaulicher ist und oft schneller zum Ziel führt. In
der kartesischen Darstellung kann man die Multiplikation formal leicht durchführen. Was bisher noch
fehlt, ist ein Schritt von der geometrischen Multiplikationsregel zu einer Rechenregel.
z = z1 · z2 = j
z1 =
z2 = 41 (1 +
√
√
3+j
3j)
ϕ1 = 30◦
ϕ
ϕ2 = 60◦
reelle Achse
1
Abbildung 2.6: Beispiel zur Multiplikation von zwei Zeigern verschiedener Länge.
Als Zahlenbeispiel zum leichteren Verständnis der folgenden Formeln betrachten wir die in Abbildung
2.6 veranschaulichte Multiplikation der beiden Zeiger
√
3+j
z1 =
√ 1
z2 =
1 + 3j
4
mit den Beträgen
r1 = |z1 | = 2
1
r2 = |z2 | =
2
und den Phasenwinkeln
ϕ1 = arg (z1 ) =
30◦
ϕ2 = arg (z2 ) =
60◦ .
Das Produkt
z = z1 z2
KAPITEL 2. KOMPLEXE ZAHLEN
77
hat dann den Betrag
r = r1 r2 = 1
und den Phasenwinkel
ϕ = ϕ1 + ϕ2 = 90◦ ,
und damit gilt
z = z1 z2 = j .
Allgemein gilt: Die beiden Faktoren in Polardarstellung lauten
z1
=
r1 (cos (ϕ1 ) + j sin (ϕ1 ))
z2
=
r2 (cos (ϕ2 ) + j sin (ϕ2 )) ,
und das Produkt besitzt die Polardarstellung
z1 z2 = r1 r2 (cos (ϕ1 + ϕ2 ) + j sin (ϕ1 + ϕ2 )) .
In all diesen drei Ausdrücken der Polardarstellung steht auf der rechten Seite ein Faktor der Gestalt
cos (φ) + j sin (φ). Um die Schreibweise zu vereinfachen, führen wir dafür eine Abkürzung ein und
definieren eine neue Funktion:
exp (jφ) = cos (φ) + j sin (φ)
Man kann damit die drei obigen Ausdrücke in der Polardarstellung folgendermaßen schreiben:
z1
z2
=
=
r1 exp (jϕ1 )
r2 exp (jϕ2 )
z1 z2
=
r1 r2 exp (j (ϕ1 + ϕ2 ))
Setzt man r1 = r2 = 1, so ergibt sich für die neu definierte Funktion exp (jφ) die Rechenregel:
exp (jϕ1 ) · exp (jϕ2 ) = exp (j (ϕ1 + ϕ2 ))
Offenbar gehorcht die oben definierte Funktion exp (jϕ) den Rechenregeln der Exponentialfunktion.
Es handelt sich auch tatsächlich um die Exponentialfunktion. Es gilt:
exp (jϕ) = ejϕ ,
wobei
e = 2.71828...
die Eulersche Zahl ist. Dies können wir an dieser Stelle mit den bisher zugänglichen Werkzeugen
nicht beweisen, was uns aber nicht daran hindern soll, damit zu rechnen. Die obige Rechenregel lautet
in dieser Schreibweise
ej(ϕ1 +ϕ2 ) = ejϕ2 ejϕ2 ,
5
und der Zusammenhang mit den Winkelfunktionen ist gegeben durch:
ejϕ = cos (ϕ) + j sin (ϕ)
Diese wichtige Gleichung trägt den Namen Eulersche Formel. Ersetzt man ϕ durch −ϕ, so erhält
man:
e−jϕ = cos ϕ − j sin ϕ
5 Leonard
Euler (1707-1783), schweizer Mathematiker
KAPITEL 2. KOMPLEXE ZAHLEN
78
Dies ist gerade das konjugiert Komplexe der rechten Seite der Eulerschen Formel. Also gilt:
∗
ejϕ = e−jϕ
Addiert man die Eulersche Gleichung und ihr konjugiert Komplexes, so ergibt sich
ejϕ + e−jϕ = 2 cos ϕ
und damit
cos ϕ =
Durch Subtraktion erhält man
sin ϕ =
1 jϕ
e + e−jϕ
2
1 jϕ
e − e−jϕ
2j
Man kann also den Sinus und Kosinus durch komplexe Exponentialfunktionen darstellen. Dies ist eine
sehr wichtige Eigenschaft. Sie ist der Grund, warum komplexe Zahlen so nützlich sind: Schwingungen
und Wellen werden durch Sinus- und Kosinusfunktionen beschrieben. Mit Exponentialfunktionen lässt
sich aber viel leichter rechnen. Insbesondere vermeidet man die Anwendung der Additionstheoreme.
Durch die Eulersche Formel gelangt man von der Polardarstellung
z = r (cos (ϕ) + j sin (ϕ))
einer komplexen Zahl zu ihrer Exponentialform
z = rejϕ ,
die sehr viel einfacher und bequemer zu handhaben ist.
Einige wichtige Zeiger der Länge Eins
An früherer Stelle haben wir die folgenden Werte für Sinus und Kosinus bei bestimmten Winkeln
erwähnt, die man kennen sollte:
sin 0◦
sin 30◦
sin 45◦
sin 60◦
sin 90◦
=
=
=
=
=
0
=
=
1
2 √2 =
1
2 3 =
1
=
1
2
√
cos 90◦
cos 60◦
cos 45◦
cos 30◦
cos 0◦
Für diese Winkel ergibt sich nach der Eulerschen Formel:
◦
ej0
◦
ej30
◦
ej45
j60◦
e
◦
ej90
=
=
=
=
=
√1
1
2√ 3 + j
1
+ j)
2 2 (1√
1
1
+
3j
2
j
Dies sind nur die Winkel im 1. Quadranten. Für die anderen Quadranten muss man entsprechend die
Vorzeichen für Realteil bzw. Imaginärteil ändern. Z.B. gilt
√ ◦
1
e−j120 = − 1 + 3j .
2
KAPITEL 2. KOMPLEXE ZAHLEN
79
imaginäre Achse
◦
ej90 = j
ej60 = 12 (1 +
◦
j45◦
e
√
3j)
√
= 21 2(1 + j)
√
◦
ej30 = 21 ( 3 + j)
◦
ej0 = 1
reelle Achse
Abbildung 2.7: Einige wichtige Zeiger in kartesischer und in Exponentialdarstellung.
Es ist wichtig, schnell und sicher von der Exponentialform in die kartesische umrechnen zu können
(und umgekehrt). Anstatt sich die Zahlen der obigen Tabelle zu merken, fällt es vielen Anwendern
(auch dem Verfasser) leichter, sich die Pfeile für die komplexen Zeiger in der Gaußschen Zahlenebene
vorzustellen, wie sie in Abbildung 2.7 dargestellt sind. Für die nicht beschrifteten Zeiger möge der
Leser zur Übung die Beschriftung ergänzen. Es ist sehr hilfreich, sich dieses Bild zu merken.
Multiplikation und Division mit der Exponentialform
Mit Hilfe der Exponentialform lassen sich komplexe Zahlen oft einfacher multiplizieren und vor allem
dividieren als mit der kartesischen.
Wir kommen zurück auf das Beispiel von Abbildung 2.6 und schreiben:
√
◦
z1 =
3 + j = 2ej30
√ 1
◦
1
1 + 3j = ej60
z2 =
4
2
KAPITEL 2. KOMPLEXE ZAHLEN
80
Dann gilt
z1 z2
=
=
=
◦
◦
1
2ej30 · ej60
2
◦
ej90
j
Wie man an den beiden folgenden Beispielen sieht, vereinfacht die Exponentialdarstellung oft auch die
Division:
√
◦
◦
2 ej45
1+j
= √ −j45◦ = ej90 = j
1−j
e
2
√
◦
3+j
2 ej30
1 √
−j30◦
√ =
3
−
j
=
e
=
◦
2 ej60
2
1 + 3j
Die Exponentialdarstellung für Zähler und Nenner kann man der Abbildung 2.7 oder der entsprechenden Tabelle entnehmen.
Anwendungsbeispiel der Exponentialform: Schwingungen und Schwebungen
Für Ingenieure ist die Beschreibung von Schwingungen eine der wichtigsten Anwendungen der komplexen Zahlen. Eine Kosinus-Schwingung
x (t) = A cos (ωt + ϕ)
der Kreisfrequenz ω mit Amplitude A und Phase ϕ wird dabei charakterisiert durch den komplexen
Zeiger
c = Aejϕ .
Die Schwingung wird dann geschrieben als:
x (t) = Re {z (t)}
Hierbei ist
z (t) = cejωt
die zugehörige komplexe Schwingung. Mit ihr lässt sich viel leichter rechnen als mit der KosinusSchwingung.
Das Rechnen mit komplexen Schwingungen soll an Hand eines Beispiels erläutert werden: Wir betrachten die Überlagerung von zwei Schwingungen gleicher Amplitude mit den Kreisfrequenzen
ω1 = ω0 + ∆ω
und
ω2 = ω0 − ∆ω ,
die gegenüber der Mitten(kreis)frequenz ω0 jeweils um eine kleine Differenz ∆ω nach oben und unten
verstimmt 6 sind. Das Signal ist gegeben durch:
x (t)
6 Verstimmt
= cos (ω1 t) + cos (ω2 t)
= cos ((ω0 + ∆ω) t) + cos ((ω0 − ∆ω) t)
heißt, dass die Frequenzen geringfügig voneinander abweichen.
KAPITEL 2. KOMPLEXE ZAHLEN
81
Die zugehörige komplexe Schwingung lautet:
z (t) = ej(ω0 +∆ω)t + ej(ω0 −∆ω)t
Dieser Ausdruck lässt sich so umformen, dass man sieht, was bei der Überlagerung der Schwingungen
physikalisch passiert:
z (t) =
=
Mit
ej(ω0 +∆ω)t + ej(ω0 −∆ω)t
ejω0 t ej∆ωt + e−j∆ωt
cos (∆ωt) =
ergibt sich
1 j∆ωt
e
+ e−j∆ωt
2
z (t) = 2ejω0 t cos (∆ωt) .
Die reelle, physikalische Schwingung ist der Realteil der komplexen Schwingung:
x (t) = 2 cos (ω0 t) cos (∆ωt)
Dies ist eine multiplikative Überlagerung von einer schnellen Schwingung cos (ω0 t) und einer langsamen
Schwingung cos (∆ωt). Das wird in der Physik als Schwebung bezeichnet. Abbildung 2.8 zeigt den
Schwebung: f1=111 Hz, f2=109 Hz
2
1.5
1
x(t)
0.5
0
−0.5
−1
−1.5
−2
0
0.2
0.4
0.6
0.8
1
t [s]
Abbildung 2.8: Zeitlicher Signalverlauf bei einer Schwebung. Die Schwebung 2 cos (∆ωt) ist rot gezeichnet.
zeitlichen Signalverlauf für die Frequenzen
f1 =
ω2
ω1
= 111 Hz und f2 =
= 109 Hz.
2π
2π
KAPITEL 2. KOMPLEXE ZAHLEN
82
Die Mittenfrequenz f0 =110 Hz entspricht dem Ton der A-Seite einer Gitarre. Bei der Überlagerung der
beiden gegeneinander verstimmten Töne ergibt sich ein Ton mit der Mittenfrequenz f0 , der abwechselnd
laut und leise wird. Bei diesem Bespiel geschieht dies zweimal pro Sekunde: Die Schwebungsfrequenz
ist f1 − f2 = 2 Hz.
KAPITEL 2. KOMPLEXE ZAHLEN
83
Aufgaben zu Abschnitt 2.4
2.4.1
Aufgabe:
Schreiben Sie die folgenden komplexen Zahlen in Exponentialform:
√
√
a) 3 + 3 j
b) −2 − 2j
c) − 3 − j
√
√
d) 2 − 6j
e) 5 + 5j
f) −2
2.4.2
Aufgabe:
Berechnen Sie (möglichst im Kopf) mit dem Umweg über die Exponentialform die kartesische Form
der folgenden komplexen Zahlen:
√ !6
√ !6
√
√ 4
3
1
3
3
a)
c)
+
j
−
j
b)
3+ 3j
4
4
2
2
d)
1 1
− j
4 4
2.4.3
4
π 10
π
e) 2 cos + j sin
3
3
π
π 30
f) cos
+ j sin
15
15
Aufgabe:
Schreiben Sie die folgenden komplexen Zahlen in kartesischer Form:
√
3
5
1
2π
b) 2 2 exp j π
c) exp
+j π
a) 80 exp j
3
4
3
6
π
π
d) exp 3 − j
e) 5exp j
f) − exp (9πj)
2
4
2.4.4
Aufgabe:
Berechnen Sie den Ausdruck
jϕ
e + ejψ 2 , (ϕ, ψ ∈ [−π, π])
und vereinfachen Sie das Ergebnis so, dass keine komplexe Zahl mehr auftaucht.
2.4.5
Aufgabe: (*)
Beweisen Sie folgende Identitäten:
cos 15◦
=
sin 15◦
=
1 √ √
2
3+1
4
1 √ √
2
3−1
4
KAPITEL 2. KOMPLEXE ZAHLEN
2.4.6
84
Aufgabe: (*)
Beweisen Sie die folgenden Aussagen:
1. Es sei z eine komplexe Zahl und N eine natürliche Zahl. Dann gilt:
(1 − z) 1 + z + z 2 + ... + z N −1 = 1 − z N
2. Es seien n, N natürliche Zahlen mit n < N . Dann gilt
N
−1
X
ej2πkn/N = 0 .
k=0
3. Veranschaulichen Sie diese Eigenschaft an Hand von Zeigern für n = 1 und N = 6.
2.4.7
Aufgabe:
Ein Käfer krabbelt (in der Ebene) zunächst 20 cm weit mit einem Winkel von 60° (zur x-Achse). Dann
dreht er sich um 60° nach rechts und krabbelt wieder 20 cm weit. Dann dreht er um 120° nach rechts
und krabbelt 40 cm weit. Dann dreht er um 120° nach links und krabbelt 20 cm weit. Dann dreht er
nochmal um 120° nach links und krabbelt 40 cm weit. Zuletzt dreht er nochmal um 120° nach links
und krabbelt 20 cm weit.
• Schreiben sie jede der einzelnen Wegstrecken als komplexen Zeiger (1 LE=10cm).
• Bei welchen Koordinaten kommt der Käfer an?
• Skizzieren Sie die Tour!
KAPITEL 2. KOMPLEXE ZAHLEN
2.5
85
Wurzeln
Die Exponentialdarstellung ist sehr nützlich zur Berechnung von Wurzeln im Komplexen.
Sei c ∈ C eine gegebene Zahl. Wir suchen nach Lösungen der Gleichung
zn = c
und nennen diese die n-ten Wurzeln aus c. Es gibt im Komplexen immer genau n solche Wurzeln. Dies
besagt der Hauptsatz der Algebra, auf den wir hier aber nicht näher eingehen werden. Im Folgenden
geht es darum, diese n Wurzeln zu berechnen.
Wir betrachten die Exponentialdarstellung
c = r ejϕ .
Was passiert beim Wurzelziehen mit dem Phasenwinkel ϕ? Beim Potenzieren mit der Potenz n vervielfacht sich der Phasenwinkel um den Faktor n. Beim Ziehen der n-ten Wurzel muss man also die
Phase durch n teilen. Und was passiert mit dem Betrag? Die Beträge sind reelle Zahlen und verhalten
sich beim Potenzieren wie solche. Entsprechendes gilt dann auch für die Wurzeln.
Man erhält also mit
z0 =
√
n
r ejϕ/n
eine erste Lösung der Gleichnung z n = c, die wir als Hauptwurzel bezeichnen. Hierbei ist
gewöhnliche reelle n-te Wurzel aus dem Betrag r.
√
n
r die
Alle weiteren Wurzeln erhält man als
zk = z0 · ej2πk/n ,
k = 0, 1, ..., n − 1 .
Denn offensichtlich gilt:
zkn
=
z0 · ej2πk/n
= z0n · ej2πk
= z0n
n
= c
Geometrisch kann man sich dies mit einer Drehschablone folgendermaßen vorstellen: Man teilt den
Vollwinkel7 [0, 2π] in n gleiche Teile. Man kann sich das als n äquidistante Perlen auf dem Einheitskreis
vorstellen wie in Abbildung 2.9 für n = 6 gezeigt. Jeder der Einheitszeiger ej2πk/n zeigt auf eine
Perle. Man erhält nun alle Wurzeln, indem man die Hauptwurzel mit allen diesen Einheitszeigern
multipliziert, was geometrisch einer Drehung um den entsprechenden Winkel entspricht. Für n = 6
sind dies die Winkel 0◦ , 60◦ , 120◦ , 180◦ , 240◦ , 300◦.
Beispiel: Es sollen alle komplexen Lösungen der Gleichung
z 6 = −1
berechnet und in kartesischer Form angegeben werden.
Zuerst schreiben wir die Aufgabenstellung in Exponentialform:
◦
z 6 = ej180
7 An
dieser Stelle ist es einfacher, den Winkel von 0 bis 2π laufen zu lassen an statt von −π bis π.
KAPITEL 2. KOMPLEXE ZAHLEN
86
◦
ej120
◦
ej60
◦
ej180
◦
ej0
◦
◦
ej240
ej300
Abbildung 2.9: Drehschablone: Die Einheitszeiger für die Drehungen gegenüber der Hauptwurzel z0
bei der Wurzelberechnung für n = 6.
In diesem Fall gilt r = 1, so dass alle Lösungen den Betrag Eins besitzen. Die Hauptwurzel hat den
Phasenwinkel 180◦ /6 = 30◦ . Sie lautet also:
◦
z0 = ej30 =
1 √
3+j
2
Die weiteren Wurzeln erhält man, indem man dies mit den Einheitszeigern in Abbildung 2.9 multipliziert (d.h. um den entsprechenden Winkel dreht). Es gilt:
◦
z1 = z0 ej60
◦
z2 = z1 ej60
Damit folgt:
...
◦
z5 = z4 ej60
◦
z1 = ej90 = j
◦
z2 = ej150 =
◦
z3 = ej210 =
1 √
− 3+j
2
1 √
− 3−j
2
◦
z4 = ej270 = −j
1 √
3−j
2
Hierbei ist die Abbildung 2.7 hilfreich, die die Drehungen gegenüber der Hauptwurzel z0 bei der
Wurzelberechnung für n = 6 veranschaulicht.
◦
z5 = ej330 =
KAPITEL 2. KOMPLEXE ZAHLEN
87
Quadratwurzeln und quadratische Gleichungen
Die Gleichung
z2 = c
hat im Komplexen immer zwei Lösungen z1 und z2 , deren Zeiger sich in der komplexen Ebene genau
gegenüber liegen:
z1 = −z2
Im
Denn: Wenn z1 die erste Lösung der Gleichung ist, erhält man die zweite durch Drehung um 180◦ , was
gerade der Multiplikation mit −1 entspricht. Abbildung 2.10 zeigt die geometrische Situation für das
◦
z1 = 2ej100
Re
z 2 = 4ej200
◦
◦
z2 = 2ej280
Abbildung 2.10: Veranschaulichung der Quadratwurzel.
Beispiel
◦
c = 4ej200 .
Welche der beiden Wurzeln z1 und z2 man als Hauptwurzel ansieht, hängt davon ab, ob man den
Phasenwinkel ϕ von c als ϕ = 200◦ oder als ϕ = −160◦ schreibt. Es gibt keinen allgemein gültigen
Grund, eine der beiden Wurzeln zu bevorzugen. Deshalb ist es auch problematisch,
von der Wurzel zu
√
sprechen oder sogar das Wurzelzeichen zu verwenden und etwa „ z = c “ zu schreiben. Es lässt sich
zwar schon eine Eindeutigkeit der Wurzeloperation
erreichen, in dem man verlangt, dass die Wurzel in
√
der rechten Halbene liegt. Dann ist „ z = c “ in unserem Beispiel von Abbildung 2.10 eindeutig durch
die Lösung z2 gegeben. Für reelle, negative c (zum Beispiel für c = −1) muss man sich dann zwischen
den beiden Wurzeln entscheiden, die beide (einander gegenüber) auf der imaginären Achse liegen.
Sinnvollerweise wählt man die auf der oberen Halbachse. Dann
√ hat man tatsächlich eine eindeutige
Definition für die Wurzel aus negativen Zahlen und darf „ j = −1 “ schreiben. Dass diese Schreibweise
aber nicht ganz unproblematisch ist, zeigt ein kleiner
Mathematischer Scherz:
Es gilt sicher
(−1) · (−1) = 1 .
Wir √
ziehen auf beiden Seiten die Wurzel und rechnen ein bisschen weiter, wobei wir von der Formel
j = −1 Gebrauch machen:
p
(−1) · (−1) = 1
p
p
(−1) · (−1) = 1
j·j = 1
−1 = 1
KAPITEL 2. KOMPLEXE ZAHLEN
88
Die letzte Gleichung ist offensichtlich falsch. Was stimmt hier nicht? Wenn man die √
komplexe
√
√ Wurzel
so wie oben erklärt definiert hat, gilt die p
aus dem Reellenpbekannte
Rechenregel
ab
=
a b für
p
Wurzeln nicht mehr, denn die Gleichung „ (−1) · (−1) = (−1) · (−1) “ ist offensichtlich falsch.
Man darf also zwar das Wurzelzeichen verwenden, wenn man erklärt, was damit gemeint ist. Aber man
darf nicht damit rechnen, sonst passieren Fehler wie in dem obigen Beispiel. In dieser Vorlesung wird
dewegen bei komplexer Rechnung das Wurzelsymbol weitgehend vermieden. Nur bei der p-q-Formel
(siehe unten) machen wir eine Ausnahme.
Quadratische Gleichungen sind im Komplexen immer lösbar. Man erhält dabei zwei komplexe
Lösungen z1 und z2 , die aber identisch sein können. Man spricht dann – wie im Reellen – von doppelten
Nullstellen. Wie im Reellen löst man quadratische Gleichungen mit der Technik der quadratischen
Ergänzung.
Beispiel (quadratische Ergänzung):
Es sei die quadratischen Gleichung
z 2 + 6jz − 8 = 0
gegeben. Gesucht sind die beiden Lösungen z1,2 . Wegen
2
z 2 + 6jz − 9 = (z + 3j)
kann man die Gleichung als
2
(z + 3j) + 1 = 0
schreiben. Die Gleichung
u2 + 1 = 0
besitzt die beiden Lösungen
u1,2 = ±j .
Deshalb gilt
z1,2 + 3j = ±j
und damit
z1 = −2j und z2 = −4j .
Die p-q-Formel für quadratische Gleichungen: Bei reellen quadratischen Gleichungen verwendet man oft die sogenannte p-q-Formel. Man darf im Komplexen genau so damit rechnen wie im
Reellen. Denn die p-q-Formel ist eigentlich nichts anderes als eine fertige Formel für die quadratische
Ergänzung und kommt folgendemaßen zustande: Es sei die quadratische Gleichung
z 2 + pz + q = 0
mit komplexen Koeffizienten p und q gegeben. Durch quadratische Ergänzung erhält man
z 2 + pz +
p 2
2
p 2
−
=
2
Die beiden Lösungen der quadratischen Gleichung
z+
u2 =
p 2
2
p 2
2
p 2
2
+q =0
−q.
−q
KAPITEL 2. KOMPLEXE ZAHLEN
89
schreiben wir formal als
u1,2 = ±
r p 2
−q.
2
Die Verwendung des Wurzelzeichens ist hier unproblematisch, weil es nicht auf die Numerierung der
beiden Lösungen ankommt und in jedem Fall u1 = −u2 gilt. Es gilt also
r p
p 2
z1,2 + = ±
−q
2
2
und damit die bekannte p-q-Formel
z1,2
p
=− ±
2
r p 2
2
−q.
Hierbei ist zu beachten: Dies ist als Formel für eine Lösungsmenge zu verstehen, und der Ausdruck
r p 2
±
−q
2
steht für die Lösungsmenge der quadratischen Gleichung
u2 =
p 2
2
−q.
KAPITEL 2. KOMPLEXE ZAHLEN
90
Aufgaben zu Abschnitt 2.5
2.5.1
Aufgabe:
Finden Sie alle komplexen Lösungen der folgenden Gleichungen und schreiben Sie diese in kartesischer
Form. Stellen Sie diese in der Gaußschen Zahlenebene dar.
√
1 1√
a) z 2 = −1 + 3j
b) 4z 2 − 2z + 1 = 0
c) z 4 = − −
3j
2 2
√ j 13 π
12 − 4j
2e 4 + 1
d) z 2 +
z − 16j = 0
e) z 6 + 64 z 3 − 27 = 0
f) z 4 =
7
2+j
e−j 2 π
4
g) (z − 1) = −4
h) z 6 = 64
i) z 3 = −8
Kapitel 3
Matrizen
Wozu braucht der Ingenieur Matrizen?
Die offensichtlichste und vielleicht häufigste Anwendung ist das Lösen von linearen Gleichungssystemen.
Lineare Gleichungssysteme und deren Lösung mit dem Gauß-Algorithmus sind daher ein Schwerpunkt
dieses Kapitels.
Matrizen beschreiben ganz allgemein lineare Abbildungen zwischen Vektoren. Deshalb gibt es sehr
viele Anwendungen in der Technik. Bei der Beschreibung der Drehbewegung benötigt man eine Matrix
(den sogenannten Trägheitstensor ), deren Eigenwerte und Eigenvektoren die Hauptträgheitsmomente und Hauptträgheitsachsen festlegen. In der Zweitortheorie der Elektrotechnik rechnet man mit
(komplexen) Matrizen. In modernen Kommunikationssytemen wie LTE (long-time evolution) wird mit
mehreren Sende- und Empfangsantennen gearbeitet (MIMO: multiple-in multiple-out). Der zugehörige
Übertragungskanal (Abbildung zwischen Input- und Output-Signal) wird durch Matrizen beschrieben.
3.1
Definitionen und Grundbegriffe
Matrizen sind tabellarische Anordnungen von Zahlen, die man in Klammern schreibt. Zum Beispiel
ist


1 2
A= 3 4 
5 6
eine Matrix mit 3 Zeilen und 2 Spalten. Man nennt A deshalb eine 3 × 2-Matrix. Sprich: “3-Kreuz2-Matrix”. Matrizen sind nützlich, weil man damit Syteme von vielen Gleichungen, bei denen viele
Zahlen vorkommen, kompakter und übersichtlicher schreiben kann. Zum Beispiel verwendet man Matrizen beim Lösen linearer Gleichungssysteme mit mehreren Unbekannten. Auch werden lineare Abbildungen durch Matrizen beschrieben. Wer eine 3D-Computeranimation programmieren will, braucht
Drehmatrizen, um Drehungen von Körpern im Raum zu beschreiben.
Wir betrachten in diesem Kapitel der Einfachheit halber zunächst nur Matrizen mit reellen Elementen.
Matrizen mit komplexen Elementen werden aber durchaus gebraucht, z. B. in der Zweitortheorie in
der Elektrotechnik. Deshalb ist am Ende dieses Kapitels (mit einem Sternchen (*) versehen) noch ein
Abschnitt zu diesem Thema angefügt.
Matrizen sind Verallgemeinerungen von Vektoren: Eine Matrix besteht aus mehreren Spaltenvekto-
91
KAPITEL 3. MATRIZEN
92
ren. Für die obige Matrix A sind dies die beiden Spaltenvektoren
 
 
1
2
 3  und  4  .
5
6
Manchmal benötigt man auch Zeilenvektoren. Die obige Matrix besteht aus den drei Zeilenvektoren
1 2 ,
3 4 und 5 6 .
Bei einer Matrix mit M Zeilen und N Spalten spricht man von einer M × N - Matrix. Sie hat die
allgemeine Gestalt


a11 a12 · · · a1N
 a21 a22 · · · a2N 


A= .
..
..  .
 ..
.
. 
aM1
aM2
· · · aMN
Die Anzahl M der Zeilen nennt man auch vertikale Dimension und die Zahl N der Spalten nennt
man dann horizontale Dimension. Die Zahlen amn (m = 1, ..., M ; n = 1, ..., N ) bezeichnet man als
Matrixelemente. Der Index m heißt Zeilenindex und läuft in vertikaler Richtung in der Matrix. Der
Index n heißt Spaltenindex und läuft in horizontaler Richtung in der Matrix. Bei einer Matrix A
schreibt man manchmal [A]mn für das Element mit Zeilenindex m und Spaltenindex n. Für die obige
Matrix gilt also:
[A]mn = amn
Eine Matrix mit M = N nennt man quadratisch. Die Elemente ann (n = 1, ..., N ) auf der Diagonalen
einer quadratischen Matrix nennt man Diagonalelemente. Die Summe der Diagonalelemente heißt
Spur (engl. trace) der Matrix. Man schreibt dafür:
tr (A) = a11 + a22 + ... + aN N
Es ist üblich, Matrizen mit Großbuchstaben A, B, ... im Fettdruck zu bezeichnen. Für Vektoren
verwenden wir in diesem Kapitel kleine Buchstaben a, , b, ... im Fettdruck. Dadurch wird betont,
dass Vektoren spezielle Matrizen sind. Die geometrische Vorstellung als “Pfeile” wird in diesem Kapitel
als nachrangig angesehen.
Eine Untermatrix von A erhält man, indem man Zeilen oder Spalten streicht. Zum Beispiel ist


1 2 4
B =  9 10 12  ,
13 14 16
eine Untermatrix von

1
 5
A=
 9
13

2 3 4
6 7 8 
,
10 11 12 
14 15 16
die durch Streichung der 2. Zeile und der 3. Spalte entstanden ist.
Für (reelle) Spaltenvektoren



x=

x1
x2
..
.
xN





KAPITEL 3. MATRIZEN
93
des N -dimensionalen Raumes schreiben wir: x ∈ RN .
Die zu A transponierte Matrix AT erhält man, indem man Zeilen mit Spalten vertauscht. Deren
Elemente sind also gegeben durch:
T
A mn = [A]nm
Aus der M × N - Matrix



A=

ergibt sich dadurch die N × M - Matrix



AT = 

a11
a21
..
.
a12
a22
..
.
···
···
a1N
a2N
..
.
aM1
aM2
· · · aMN
a11
a12
..
.
a21
a22
..
.
···
···
aN 1
aN 2
· · · aMN
a1M
a2M
..
.



.




.

Eine Matrix A heißt symmetrisch, falls
A = AT
gilt. Für die Elemente amn symmetrischer Matrizen gilt also:
amn = anm
Matrizen mit der Eigenschaft
A = −AT
nennt man schiefsymmetrisch. Für deren Elemente gilt:
amn = −anm
Für die Diagonalelemente schiefsymmetrischer Matrizen gilt:
ann = −ann ⇒ ann = 0 .
Auf der Diagonale einer schiefsymmetrischen Matrix stehen also ausschließlich Nullen.
Addition von Matrizen: Zwei Matrizen gleicher Dimension addiert man, indem man die Matrixelemente an der selben Position addiert:

 
 

a11 · · · a1N
b11 · · · b1N
a11 + b11 · · · a1N + b1N
 ..

..  +  ..
..  = 
..
..
..
..
..
 .

.
.
.
.   .
.  
.
.
aM1 · · · aMN
bM1 · · · bMN
aM1 + bM1 · · · aMN + bMN
Die Multiplikation einer Matrix mit einem Skalar σ

 
a11 · · · a1N
σa11
 ..


.
..
.
..
..  = 
σ .
.
aM1
· · · aMN
σaM1
wird folgendermaßen erklärt:

· · · σa1N

..
..

.
.
· · · σaMN
KAPITEL 3. MATRIZEN
94
Eine Nullmatrix 0 besteht nur aus Nullen:



0=


0
0
..
.
0

··· 0
. 
..
. .. 
0


.. ..
.
. 0 
··· 0 0
0
Die N ×N - Einheitsmatrix IN ist eine quadratische Matrix und hat auf der Diagonalen ausschließlich
Einsen und außerhalb der Diagonalen nur Nullen als Elemente:


1 0 ··· 0

. 
 0 1 . . . .. 


IN =  .

 .. . . . . . . 0 
0 ··· 0 1
Wenn dadurch keine Missverständnisse entstehen, schreibt man meist einfach I statt IN . Die Bezeichnung I steht für “Identität” (engl. identity matrix ). Im deutschsprachigen Raum wird oft die
Bezeichnung E für die Einheitsmatrix verwendet.
Multiplikation einer Matrix mit einem Vektor
Eine wichtige Anwendung von Matrizen besteht darin, lineare Gleichungssysteme beliebiger Dimension
auf kompakte Art und Weise zu schreiben. Hierzu führt man die Multiplikation einer Matrix mit einem
Vektor ein.
Ein allgemeines System aus M linearen Gleichungen mit N Unbekannten x1 , x2 , ..., xN lautet:
a11 x1 + a12 x2 + . . . + a1N xN
=
b1
a21 x1 + a22 x2 + . . . + a2N xN
=
..
.
b2
aM1 x1 + aM2 x2 + . . . + aMN xN
=
bM
Die Zahlen amn (m = 1, ..., M ; n = 1, ..., N ) sind die Koeffizienten des Gleichungssystems und
die Zahlen bm (m = 1, ..., M ) nennt man die Inhomogenitäten.
Man kann die obigen Gleichungen auch folgendermaßen durch die Koeffizienten ausdrücken:
N
X
amn xn = bm (m = 1, 2, ..., M )
n=1
Um eine kompakte Schreibweise einzuführen,

x1
 x2

x= .
 ..
xN
und die M × N Koeffizientenmatrix



A=

definieren wir die beiden Vektoren



b1

 b2 



 und b =  .. 

 . 
bM
a11
a21
..
.
a12
a22
..
.
···
···
..
.
a1N
a2N
..
.
aM1
aM2
· · · aMN



.

KAPITEL 3. MATRIZEN
95
Das Produkt Ax der Matrix A mit dem Vektor x wird
 


x1
a11 a12 · · · a1N
 a21 a22 · · · a2N   x2  
 


 ..
..
..   ..  = 
..

 .

.
.  
.
.
xN
aM1 aM2 · · · aMN
folgendermaßen erklärt:
a11 x1 + a12 x2 + ... + a1N xN
a21 x1 + a22 x2 + ... + a2N xN
..
.
aM1 x1 + aM2 x2 + ... + aMN xN
Auf diese Weise kann man das Gleichungssystem folgendermaßen schreiben:





Ax = b .
Der Spaltenvektor b der Dimension M ist das Produkt der Matrix mit dem Vektor. Wir bezeichnen
diese Multiplikation als Matrixmultiplikation.
Bemerkungen und Rechenregeln:
1. Das Produkt Ax von Matrix A und Spaltenvektor x ist nur dann erklärt, wenn die Dimensionen zusammenpassen: Die horizontale Dimension N der Matrix muss mit der Dimension des
Spaltenvektors x übereinstimmen. Wichtig ist außerdem die Reihenfolge bei der Multiplikation!
2. Für die Elemente bm des Vektors b = Ax gilt:
bm = am1 x1 + am2 x2 + ... + amN xN
Das ist gerade das Skalarprodukt zwischen dem m-ten Zeilenvektor am1 am2 · · · amN
der Matrix A und dem Vektor x. Man kann dafür schreiben:


x1


 x2 
bm = am1 am2 · · · amN  .  = am1 x1 + am2 x2 + ... + amN xN
 .. 
xN
3. Es seien A und B Matrizen der Dimension M × N und x, y ∈ RN Spaltenvektoren. Dann gilt
das Distibutivgesetz:
(A + B) x = Ax + Bx
A (x + y) = Ax + Ay
Es sei außerdem σ ein Skalar. Dann gilt:
A (σx) = σAx
4. Es gilt
Ix = x
Das Skalarprodukt als Matrixprodukt:
Das Skalarprodukt
a·b =
zweier Vektoren



a=

a1
a2
..
.
aN

N
X
an b n
n=1





 und b = 


b1
b2
..
.
bN





KAPITEL 3. MATRIZEN
96
im N -dimensionalen Raum kann man also folgendermaßen durch ein Matrixprodukt ausdrücken:


b1


 b2 
a · b = aT b = a1 a2 · · · aN  . 
 .. 
bN
Denn der Zeilenvektor aT = a1 a2 · · · aN ist eine M × N -Matrix mit M = 1.
Wir haben bisher nur ein lineares Gleichungssystem mit Hilfe von Matrizen und Vektoren formuliert.
An späterer Stelle wird die Lösung linearer Gleichungssysteme ausführlich behandelt.
Lineare Abbildungen
Wenn x ∈ RN ein Vektor im N -dimensionalen Raum ist und A eine M × N -Matrix, so ist
x′ = Ax
ein Vektor im M -dimensionalen Raum (d.h. x′ ∈ RM ). Die Matrix A bildet also Vektoren des N dimensionalen Raumes auf Vektoren des M -dimensionalen Raumes ab. Man schreibt auch
x 7→ x′
und nennt x das Urbild der durch A gegebenen Abbildung und x′ das Bild. Wir bezeichnen im
Folgenden die Bildvektoren auf diese Weise jeweils mit einem Strich. Man findet man Hand der obigen Rechenregeln für die Matrixmultiplikation die folgenden Eigenschaften, die wir als Linearitätseigenschaften bezeichnen:
1. Wenn man einen Vektor mit einem Skalar σ multipliziert und dann abbildet, ergibt sich das
selbe, als wenn man erst abbildet und dann mit dem Skalar multipliziert:
(σx)′ = σx′
2. Wenn man zwei Vektoren x und y addiert und dann abbildet, erhält man das selbe, als wenn
man beide Vektoren einzeln abbildet und dann addiert:
′
(x + y) = x′ + y′
Matrizen definieren also lineare Abbildungen. Diese spielen eine sehr wichtige Rolle in Naturwissenschaft und Technik. Beispiele dazu sind u.a. geometrische Abbildungen wie Drehungen, Streckungen,
Scherungen, Projektionen usw.
Durch die Multiplikation (eines Vektors) mit einer Matrix ist also immer eine lineare Abbildung gegeben. Umgekehrt kann man beweisen, dass alle linearen Abbildungen (d.h. solche mit den oben genannten Eigenschaften) zwischen Räumen endlicher Dimension durch Matrizen gegeben sind. Deshalb
sind Matrizen so wichtig.
Beispiel: Drehung im R2 – Es sei ϕ ∈ [−π, π] ein Winkel. Wir definieren die Drehmatrix
cos ϕ − sin ϕ
D=
.
sin ϕ cos ϕ
Durch
x′ = Dx
KAPITEL 3. MATRIZEN
97
ist eine lineare Abbildung x 7→ x′ des R2 in den R2 gegeben. In Koordinatenschreibweise mit
′ x1
x1
x=
und x′ =
x′2
x2
gilt also:
x′1
x′2
=
cos ϕ
sin ϕ
− sin ϕ
cos ϕ
x1
x2
=
cos(ϕ) x1 − sin(ϕ) x2
sin(ϕ) x1 + cos(ϕ) x2
Wir zeigen, dass dies gerade eine Drehung um den Winkel ϕ ist. Dazu betrachten wir die Basisvektoren
1
0
e1 =
und e2 =
0
1
und berechnen die Koordinaten der zugehörigen Bildvektoren
e′1 = De1 und e′2 = De2
mit der oben definierten Multiplikation und erhalten:
cos ϕ
− sin ϕ
e′1 =
und e′2 =
sin ϕ
cos ϕ
Abbildung 3.1 zeigt die Basisvektoren e1 und e2 sowie deren Bilder e′1 und e′2 . Offensichtlich bewirkt
e2
e′2
cos ϕ
sin ϕ
e′1
ϕ
ϕ
− sin ϕ
cos ϕ
e1
Abbildung 3.1: Drehung der kartesischen Basis im R2 .
die durch D gegebene Abbildung gerade eine Drehung der Koordinatenachsen um den Winkel ϕ. Ein
allgemeiner Vektor
x = x1 e1 + x2 e2
wird dann abgebildet auf
x′
=
=
D (x1 e1 + x2 e2 )
x1 e′1 + x2 e′2
Das bedeutet: Der Bildvektor x′ hat in der gedrehten Basis e′1 und e′2 die selben Koordinaten wie der
ursprüngliche Vektor x in der ursprünglichen Basis e1 und e2 . Dies ist genau das, was man anschaulich unter einer Drehung versteht. Man spricht hier von einer aktiven Drehung, weil der Vektor
KAPITEL 3. MATRIZEN
98
aktiv gedreht wird. Bei einer passiven Drehung bleibt der betrachtete Vektor unverändert, aber die
Basisvektoren des Koordinatensystem werden gedreht:
e′1 = De1 und e′2 = De2
Gesucht sind dann die Koordinaten x′1 und x′2 im neuen (gedrehten) Koordinatensystem. Die Aufgabenstellung lautet also: Finde x′1 und x′2 , so dass
x′1 e′1 + x′2 e′2 = x1 e1 + x2 e2
gilt. Wenn man die Drehmatrizen einsetzt, findet man, dass der Punkt in dem neuen Koordinatensystem um den gleichen Winkel rückwärts gedreht erscheint, – was anschaulich unmittelbar einleuchtet.
Die mathematische Beschreibung von Drehungen im dreidimensionalen Raum ist außerordentlich wichtig. Ein Flugsimulator macht davon ebenso Gebrauch wie ein großer Teil der Computerspiele. Drehungen im dreidimensionalen Raum sind schwieriger vorzustellen als zweidimensionale. Man kann sie
als aufeinander folgende jeweils zweidimensionale Drehungen um jeweils eine feste Drehachse zusammensetzen. Eine Drehung um die z-Achse mit dem Winkel ϕ wird z.B. durch die folgende Matrix
beschrieben:


cos ϕ − sin ϕ 0
Dz =  sin ϕ cos ϕ 0 
0
0
1
Eine Drehung um die x-Achse mit dem Winkel ψ ist gegeben durch:


1
0
0
Dx =  0 cos ψ − sin ψ 
0 sin ψ
cos ψ
Eine Drehung um die z-Achse, gefolgt von einer Drehung um die x-Achse des neuen Koordinatensystems
ist dann gegeben durch x 7→ x′ mit
x′ = Dx Dz x
In dieser Formel taucht der Ausdruck Dx Dz auf. Diese zusammengesetzte Drehung ist das Produkt
zweier Matrizen. Solche Matrizenprodukte sollen im Folgenden definiert und berechnet werden.
Produkte von Matrizen
Es sei A eine K × M -Matrix und B eine M × N -Matrix. Es soll das Matrixprodukt C = AB erklärt
werden. Dass dies sinnvoll ist, wird durch folgende Überlegung deutlich:
Die Matrix B beschreibt eine Abbildung vom RN in den RM . Die Matrix A beschreibt eine Abbildung
vom RM in den RK . Man schreibt das so:
B
A
RN −→ RM −→ RK
Die zusammengesetzte Abbildung, die durch C = AB beschrieben wird, ist also eine Abbildung vom
RN in den RK :
C
RN −→ RK
Achtung: Das geht nur, wenn die innere Matrixdimension M der beiden Matrizen übereinstimmt.
Denn die Abbildung A muss auf dem Bildraum von B definiert sein.
Dass durch die folgenden Definition der Matrixmultiplikation genau die so beschriebene Abbildung
beschrieben wird, muss man natürlich beweisen. Wir verzichten auf den Beweis und beschreiben nur
das Ergebnis. Das Matrixprodukt C = AB wird folgendermaßen erklärt: Die Matrix


b11 · · · b1N

.. 
..
B =  ...
.
. 
bM1
· · · bMN
KAPITEL 3. MATRIZEN
99
besteht aus N Spaltenvektoren b1 , ..., bN der Dimension M . Wir schreiben dafür
B = b1 · · · bN .
Die Matrix

c11

C =  ...
cK1

· · · c1N
.. 
..
.
. 
· · · cKN
besteht aus N Spaltenvektoren c1 , ..., cN der Dimension K. Wir schreiben dafür
C = c1 · · · cN .
Die Rechenregel, die jedem bn ein cn zuordnet, lautet nun:
cn = Abn
Das heißt: Um das Matrixprodukt AB zu berechnen, wird A mit jeder Spalte aus B multipliziert. Die
resultierenden Spaltenvektoren werden wieder in einer Matrix
C = Ab1 · · · AbN
angeordnet.
Für die Matrixelemente ckn von C bedeutet dies:
ckn
=
M
X
akm bmn
m=1
ak1
=
ak2
· · · akM





b1n
b2n
..
.
bMn





Das Element ckn mit Zeilenindex k und Spaltenindex n ist also das Skalarprodukt zwischen dem
Zeilenvektor ak1 ak2 · · · akM und dem Spaltenvektor bn . Dies führt auf das folgende
Rechenschema Man schreibt die Matrizen folgendermaßen hin:






a11
a21
..
.
a12
a22
..
.
···
···
..
.
a1M
a2M
..
.
aK1
aK2
· · · aKM









b11
b21
..
.
b12
b22
..
.
···
···
..
.
b1N
b2N
..
.
b
b
· · · bMN
 M1 M2
c11 c12 · · · c1N
 c21 c22 · · · c2N

 ..
..
..
..
 .
.
.
.
cK1 cK2 · · · cKN










Bei dieser Schreibweise steht das zu berechnende Element ckn in der selben Zeile wie der für dessen
Berechnung benötigte Zeilenvektor und in der selben Spalte wie der benötigte Spaltenvektor. Dies
verbessert die Übersichtlichkeit und erleichtert so die Berechnung.
KAPITEL 3. MATRIZEN
100
Ein Zahlenbeispiel:

1 2
1 2
3 4
 3 4 

7 8 , B = 
A= 5 6
 5 6 
9 10 11 12
7 8
Wir schreiben die Matrix A nach links und die Matrix B nach oben und berechnen die Elemente der
Matrix C = AB unten rechts als Skalarprodukte nach dem obigen Schema:


1 2
 3 4 


 5 6 
7 8

 

1 2 3 4
50
60
 5 6 7 8   114 140 
178 220
9 10 11 12



Das Ergebnis der Matrixmultiplikation lautet also:


50 60
AB =  114 140 
178 220
Rechenregeln für die Matrixmultiplikation
Wie oben erläutert wurde, ist das Matrixprodukt nur dann definiert, wenn die Dimensionen der Matrizen zu einander passen. Im folgenden sei dies für die Matrizen A, B, C immer vorausgesetzt. Mit σ
ist wieder ein Skalar gemeint. Das Matrixprodukt hat dann folgende Eigenschaften:
1. Das Matrixprodukt ist nicht kommutativ! Im Allgemeinen gilt:
AB 6= BA
2. Assoziativgesetz:
A (BC) = (AB) C
Man kann also Klammern weglassen und einfach ABC schreiben.
3. Distributivgesetz:
A (B + C) = AB + AC
(A + B) C = AC + BC
4. Multiplikation mit einem Skalar:
A (σB) = (σA) B = σ (AB) = σAB
5. Für die transponierte Matrix eines Produktes gilt:
T
(AB) = BT AT
6. Die Einheitsmatrix I ist die Eins bezüglich der Matrizenmultiplikation:
AI = IA = A
Allerdings steht links in der Regel eine andere Einheitsmatrix als rechts. Etwas präziser: Wenn
A eine M × N -Matrix ist, so gilt:
AIN = IM A = A
Man kann mit Matrizen also fast genauso rechnen wie mit Zahlen. Man muss nur mit der Reihenfolge
aufpassen, weil die Matrizenmultiplikation nicht kommutativ ist.
KAPITEL 3. MATRIZEN
101
Die Inverse Matrix
Es sei A eine N × N -Matrix. Eine N × N -Matrix A−1 mit der Eigenschaft
AA−1 = A−1 A = I
nennt man die inverse Matrix zu A.
Man kann nicht einfach durch Matrizen teilen, und es ist ein Unterschied, ob man eine Matrix B von
rechts oder von links mit der inversen Matrix A−1 multipliziert. Denn im Allgemeinen gilt
A−1 B 6= BA−1 .
Diese inverse Matrix A−1 existiert keineswegs für jede N ×N -Matrix A. Wenn A−1 existiert, bezeichnet
man die Matrix A als regulär oder auch als invertierbar, andernfalls als singulär. Wie wir später
sehen werden, kann man an Hand der sogenannten Determinante det (A) prüfen, ob die Inverse A−1
existiert. Falls det (A) 6= 0 ist, so existiert A−1 , andernfalls nicht.
Es gibt eine explizite Formel zur Berechnung der inversen Matrix, die allerdings zur praktischen Berechnung eher unpraktisch ist. Einen praktikablen Algorithmus (Gauß-Jordan) werden wir am Ende
dieses Abschnitts vorstellen.
Bei 2 × 2-Matrizen gibt es eine einfache Formel für die Inverse. Es sei
a11 a12
.
A=
a21 a22
Die Determinante det (A) dieser Matrix ist definiert als:
det (A) = a11 a22 − a12 a21
Oft schreibt man die Deteminante auch so:
a11 a12
a21 a22
= a11 a22 − a12 a21
Die inverse Matrix A−1 existiert genau dann, wenn
det (A) 6= 0
gilt. Sie ist dann gegeben durch:
A−1 =
1
det (A)
a22
−a21
−a12
a11
In Worten: Die beiden Diagonalelemente werden vertauscht, und die Vorzeichen der beiden anderen
Elemente werden umgedreht. Anschließend teilt man durch die Determinante. Dass diese Formel für
A−1 richtig ist, überprüft man leicht, indem man Folgendes nachrechnet:
1 0
a11 a12
a22 −a12
a22 −a12
a11 a12
= (a11 a22 − a12 a21 )
=
0 1
a21 a22
−a21 a11
−a21 a11
a21 a22
Die Existenz einer inversen Matrix steht in engem Zusammenhang mit der eindeutigen Lösbarkeit
linearer Gleichungssysteme. Ein lineares Gleichungssystem von N Gleichungen mit N Unbekannten
kann man schreiben als
Ax = b ,
KAPITEL 3. MATRIZEN
102
wobei A die gegebene Koeffizientenmatrix und b ∈ RN die gegebene Inhomogenität ist. Der Vektor x ∈
RN mit den Unbekannten ist gesucht. Die obige Gleichung beschreibt also eine lineare Abbildung mit
Abbildungsmatrix A, die den unbekannten Vektor x auf den bekannten Vektor b abbildet. Dies wird
in Abbildung 3.2 veranschaulicht. Um aus dem Bildvektor b den Vektor des Urbildes x zu ermitteln,
muss also die Abbildung umgekehrt werden. Dies geschieht durch die inverse Matrix A−1 (sofern sie
existiert). In Formeln sieht das so aus:
x = A−1 b
Ein lineares Gleichungssystem ist also genau dann eindeutig lösbar, wenn die Koeffizientenmatrix A
regulär ist, d.h. wenn A−1 existiert.
A
b = Ax
A−1
x
Abbildung 3.2: Lösung eines linearen Gleichungssystems durch die inverse Matrix.
Zahlenbeispiel für 2 Gleichungen mit 2 Unbekannten mit regulärer Koeffizientenmatrix:
Wir betrachten folgendes Gleichungssystem:
4x1 + 3x2
=
10
5x1 − 2x2
=
1
Dies kann man schreiben als
Ax = b ,
wobei die Unbekannten zu einem Vektor
x=
x1
x2
zusammengefasst sind und die Inhomogenität durch den Vektor
10
b=
1
und die Koeffizientenmatrix durch die Matrix
A=
4
5
3
−2
gegeben ist. Die Determinante det(A) lässt sich berechnen als
4 3 5 −2 = −23 6= 0 .
KAPITEL 3. MATRIZEN
103
Die Matrix ist also regulär. Die inverse Matrix ergibt sich als
1
2 3
A−1 =
.
5 −4
23
Die Lösung des Gleichungssystems ist dann gegeben durch:
1
2 3
10
x =
5 −4
1
23
1
=
2
Bei 2 Gleichungen mit 2 Unbekannten kann man das Gleichungssystem sehr schön geometrisch im
zweidimensionalen Raum veranschaulichen. Hierzu schreiben wir das Gleichungssystem als
x1 a1 + x2 a2 = b ,
wobei
a1 =
4
5
und a2 =
3
−2
die Spaltenvektoren der Koeffizientenmatrix A sind. Gesucht sind also die beiden Vorfaktoren x1 und
a1
b = 1a1 + 2a2
a2
2a2
Abbildung 3.3: Beispiel für 2 Gleichungen mit 2 Unbekannten bei regulärer Koeffizientenmatrix A. Die
eindeutige Lösung lautet hier x1 = 1 und x2 = 2.
x2 , mit denen sich b als Linearkombination
3
4
10
=
+ x2
x1
−2
5
1
KAPITEL 3. MATRIZEN
104
von a1 und a2 darstellen lässt, so wie es in Abbildung 3.3 skizziert ist. Es gibt genau eine Möglichkeit
einer solchen Darstellung, nämlich mit x1 = 1 und x2 = 2. Aus dem Bild wird anschaulich auch klar,
dass für eine solche eindeutige Darstellung notwendig und hinreichend ist, dass die beiden Vektoren a1
und a2 linear unabhängig (also nicht kollinear) sind. Dies ist äquivalent zu der Aussage det(A) 6= 0.
Eine singuläre Koeffizientenmatrix bei 2 Gleichungen mit 2 Unbekannten
ein lineares Gleichungssystem mit der Koeffizientenmatrix
1 2
A=
.
3 6
Wegen
1 2
3 6
Wir betrachten
=0
ist die Matrix A singulär, d.h. das Gleichungssystem
Ax = b
mit b ∈ R2 hat keine eindeutige Lösung. Dass die Matrix A singulär ist, bedeutet geometrisch, dass
ihre beiden Spaltenvektoren
1
2
a1 =
und a2 =
3
6
kollinear sind. Es können – abhängig vom Inhomogenitätsvektor b – zwei Fälle auftreten: Entweder es
gibt gar keine Lösung oder es gibt unendlich viele:
1. Zum Beispiel besitzt das Gleichungssystem
x1 + 2x2
3x1 + 6x2
= 3
= 2
keine Lösung, denn die beiden Gleichungen führen auf einen Widerspruch. Geometrisch bedeutet dies: Der Inhomogenitätsvektor b zeigt in eine andere Richtung als die beiden zueinander
kollinearen Vektoren a1 und a2 . Deshalb lässt sich die Gleichung
x1 a1 + x2 a2 = b
nicht erfüllen. Diese geometrische Situation ist in Abbildung 3.4 skizziert.
a1
a2
b
Abbildung 3.4: Beispiel für 2 Gleichungen mit 2 Unbekannten bei singulärer Koeffizientenmatrix A
und keiner Lösung für x1 , x2 .
KAPITEL 3. MATRIZEN
105
2. Dagegen besitzt das Gleichungssystem
x1 + 2x2
= 3
3x1 + 6x2
= 9
unendlich viele Lösungen, denn die beiden Gleichungen sind äquivalent. Geometrisch bedeutet
dies: Der Inhomogenitätsvektor b ist kollinear zu den beiden (unter einander kollinearen) Vektoren a1 und a2 . Deshalb lässt sich die Gleichung
x1 a1 + x2 a2 = b
mit beliebig vielen Koeffizientenpaaren x1 , x2 erfüllen. Diese geometrische Situation ist in Abbildung 3.5 skizziert. Die Gleichung
a1
a2
b
Abbildung 3.5: Beispiel für 2 Gleichungen mit 2 Unbekannten bei singulärer Koeffizientenmatrix A
und unendlich vielen Lösungen für x1 , x2 .
3
1
x1 + 2x2 = 3 ⇔ x2 = − x1 +
2
2
beschreibt eine Gerade im zweidimensionalen Raum, und jeder Punkt
x1
.
x=
x2
auf dieser Geraden ist eine Lösung. Diese Gerade ist also die Lösungsmenge des Gleichungssystems. Es ist üblich, eine solche Lösungsmenge als Geradengleichung in Punkt-Richtungsform
anzugeben. Hierzu setzt man x2 = λ und erhält die beiden Gleichungen
x1
=
x2
=
3 − 2λ
0 + λ.
Vektoriell geschrieben erhält man daraus die Gerade in Punkt-Richtungsform:
3
−2
x (λ) =
+λ
.
0
1
Ein geometrisches Beispiel: Die inverse Drehmatrix Wir betrachten die Drehmatrix
cos ϕ − sin ϕ
D=
sin ϕ cos ϕ
zu einer Drehung um den Winkel ϕ in der Ebene. Die Determinante ist gegeben durch
det (D) = cos2 ϕ + sin2 ϕ = 1 .
KAPITEL 3. MATRIZEN
106
Also exisitiert die Inverse und ist gegeben durch
cos ϕ sin ϕ
D−1 =
.
− sin ϕ cos ϕ
Dies ist offensichtlich die Matrix einer Drehung um den Winkel −ϕ . Die inverse Matrix dreht also eine
“Drehung zurück”, was man auch anschaulich erwarten sollte. Außerdem hat die Drehmatrix folgende
interessante Eigenschaft:
D−1 = DT
Die Inverse einer Drehmatrix ist also gleich ihrer Transponierten! Dies ist sehr hilfreich, denn die
transponierte Matrix ist viel einfacher zu berechnen als die inverse. Diese Beobachtung führt uns zu
dem Begriff der orthogonalen Matrix.
Orthogonale Matrizen
Eine N × N - Matrix A heißt orthogonal, wenn sie eine Inverse A−1 besitzt und diese die Eigenschaft
A−1 = AT
hat. Dies ist äquivalent zu der Eigenschaft
AT A = AAT = I .
Merke: Orthogonale Matrizen beschreiben Drehspiegelungen im N -dimensionalen Raum.
Wir wollen im Folgenden diskutieren, warum das so ist. Unter einer Drehspiegelung im RN versteht man eine winkel- und längentreue lineare Abbildung, d.h. eine lineare Abbildung, die Winkel
und Beträge von Vektoren nicht verändert. Drehspiegelungen kann man sich vorstellen als Drehungen
oder Spiegelungen oder Kombinationen von beiden. Da sowohl Winkel als auch Beträge von Vektoren
durch Skalarprodukte ausgedrückt werden können, sind Drehspiegelungen die Abbildungen zwischen
Vektoren, bei denen sich das Skalarprodukt nicht ändert. Wir müssen also zeigen: Wenn
x′ = Ax und y′ = Ay
die Bildvektoren von x, y ∈ RN unter der Abbildung sind, die durch eine orthogonale Matrix A
beschrieben wird, so gilt:
x′ · y′ = x · y
Diese Behauptung lässt sich leicht prüfen. Es gilt:
x′ · y′
T
=
=
(Ax) Ay
xT AT Ay
=
=
xT Iy
xT y
=
x·y
Damit ist die Behauptung bewiesen.
Für die Elemente amn einer Matrix mit der Eigenschaft AT A = I ergibt sich:
N
X
k=1
akm akn = δmn
KAPITEL 3. MATRIZEN
107
Das bedeutet: Für die N Spaltenvektoren

einer orthogonalen Matrix


an = 




A=

gilt:
a1
a2
..
.
an





(n = 1, ..., N )
a11
a21
..
.
a12
a22
..
.
···
···
..
.
a1N
a2N
..
.
aN 1
aN 2
· · · aN N





am · an = δmn
Diese Vektoren sind also untereinander orthonormal. Die Orthogonalität einer N × N - Matrix lässt
sich also leicht prüfen: Ihre Spaltenvektoren müssen zueinander orthogonal sein und den Betrag Eins
besitzen. Die selbe Eigenschaft gilt für die Zeilenvektoren.
Aktive und passive Drehungen (*)
In dem Beispiel zu Abbildung 3.1 haben wir eine aktive Drehung im zweidimensionalen Raum
betrachtet. Die Basisvektoren werden dabei durch die Drehmatrix D um den Winkel ϕ gedreht
e2
e′2
x1 e1 + x2 e2 = x′1 e′1 + x′2 e′2
x2
e′1
x′1
x′2
ϕ
x1
e1
Abbildung 3.6: Eine passive Drehung.
e′1 = De1 und e′2 = De2 ,
und der Vektor x1 e1 + x2 e2 wird mit der Basis mitgedreht. Er hat daher in der neuen Basis die
selben Koordinaten x1 , x2 wie in der alten. Eine andere Situation liegt bei einer passiven Drehung
vor: Die Koordinatenbasis wird gedreht, aber der Vektor bleibt der selbe. Abbildung 3.6 zeigt die
Situation im zweidimensionalen Raum. Der selbe Vektor hat in der neuen Basis nun die Koordinaten
x′1 , x′2 . Im neuen Koordinatensystem erscheint die Orientierung des Vektors gegenüber der im alten
um den Winkel −ϕ gedreht (also zurück gedreht). Das bedeutet, dass der Koordinatenvektor mit der
inversen Drehmatrix D−1 = DT multipliziert werden muss, um die Koordinaten in der gedrehten
KAPITEL 3. MATRIZEN
108
Basis zu erhalten. Diese anschauliche Argumentation für den zweidimensionalen Raum soll nun für
den dreidimensionalen Raum1 mathematisch begründet werden.
Es sei also

D11
D =  D21
D31
D12
D22
D32

D13
D23 
D33
eine orthogonale 3 × 3−Matrix (d.h. eine 3D-Drehspiegelung). Die neue (gestrichene) Basis ergibt sich
aus der ursprünglichen durch
e′1 = De1 , e′2 = De2 , e′3 = De3 .
Der selbe Vektor hat in der ursprünglichen Basis die Koordinaten x1 , x2 , x3 und in der neuen die
Koordinaten x′1 , x′2 , x′3 . Das heißt:
x1 e1 + x2 e2 + x3 e3 = x′1 e′1 + x′2 e′2 + x′3 e′3
Drückt man die gestrichene Basis durch die Drehmatrizen aus, so ergibt sich:
x1 e1 + x2 e2 + x3 e3 = x′1 De1 + x′2 De2 + x′3 De3
Auf der rechten Seite ist De1 gerade die erste Spalte der
die dritte. Also gilt:

D11
x′1 De1 + x′2 De2 + x′3 De3 =  D21
D31
Matrix D, De2 ist die zweite, und De3 ist
D12
D22
D32
 ′ 
D13
x1
D23   x′2 
x′2
D33
Außerdem ist der Ausdruck x1 e1 +x2 e2 +x3 e3 auf der linken Seite der Spaltenvektor der ursprünglichen
Koordinaten:


x1
x1 e1 + x2 e2 + x3 e3 =  x2 
x2
Also gilt:

 
x1
D11
 x2  =  D21
x2
D31
D12
D22
D32
 ′ 
D13
x1
D23   x′2 
D33
x′2
Für die Spaltenvektoren der ursprünglichen und der neuen Koordinaten führen wir die Bezeichnungen


 ′ 
x1
x1
r =  x2  und r′ =  x′2 
x2
x′2
ein. Dann gilt:
r = Dr′
Die inverse Matrix D−1 = DT beschreibt eine Zurück-Drehung (bzw. Zurück-Drehspiegelung). Multipliziert man die obige Gleichung mit dieser Matrix, so ergibt sich
r′ = DT r .
In dem neuen Koordinatensystem erscheint der Vektor also zurück gedreht.
1 Die
selbe Argumentation funktionert in Räumen beliebiger Dimension.
KAPITEL 3. MATRIZEN
109
Der Trägheitstensor2 (*)
Bei Beschreibung der Dynamik von Drehbewegungen spielt der Trägheitstensor J eine zentrale
Rolle3 . Wir betrachten einen starren Körper mit Schwerpunkt im Koordinatenursprung, der aus n
Punktmassen mi (i = 1, ..., n) zusammengesetzt ist4 . Die Ortsvektoren des i-ten Massepunktes (vom
Schwerpunkt aus betrachtet) sei


xi
ri =  y i  .
zi
Der Trägheitstensor lautet dann
yi2 + zi2

mi
−xi yi
J=
i=1
−xi zi
n
X

−xi yi
x2i + zi2
−yi zi

−xi zi
−yi zi  .
x2i + yi2
Diese Matrix ist symmetrisch. Ihre Diagonalelemente sind die Trägheitsmomente bezüglich der Koordinatenachsen. Die Elemente
n
X
mi xi yi
−
i=1
usw. außerhalb der Diagonalen nennt man Deviationsmomente. Sie verursachen sogenannte dynamische Unwuchten, wenn sich der Körper um eine der Koordinatenachsen dreht. Dabei treten
Drehmomente auf, die auf die Achse zurückwirken und einen unruhigen Lauf (ein Flattern) verursachen.
Wie wir am Ende des Abschitts über Eigenwerte sehen werden, kann man wegen der Symmetrie von J
immer durch eine geeignete Drehung des Koordinatensystems erreichen, dass die Deviationsmomente
verschwinden und der Trägheitstensor zu einer Diagonalmatrix wird.
Eine Drehung des Koordinatensystems ist eine passive Drehung. Im Folgenden wird deshalb beschrieben, wie sich der Trägheitstensor durch eine passive Drehung (oder auch Drehspiegelung) transformiert.
Hierzu schreiben wir den Trägheitstensor etwas kompakter als
J=
n
X
i=1
Hierbei ist
ri =
mi ri2 I − ri rT
.
i
q
x2i + yi2 + zi2
der Abstand des i-ten Massepunktes vom Schwerpunkt, und I ist die Einheitsmatrix. Der Matrixprodukt ri rT
i ist eine kompakte Schreibweise für folgende Matrix


 2

xi
xi
xi yi xi zi
 y i  xi y i z i =  yi xi yi2 yi zi  .
ri rT
i =
zi
zi xi zi yi zi2
Es sei nun D eine orthogonale 3 × 3-Matrix. Wie oben gezeigt, transformieren sich die Koordinaten
der Massepunkte unter der zugehörigen passiven Drehspiegelung gemäß
ri 7→ r′i = DT ri ,
2 Siehe
z.B. unter Wikipedia, Stichworte: Trägheitsmoment, Trägheitstensor.
ist auch der Buchstabe I für den Trägheitstensor. Aber diesen Buchstaben brauchen wir für die Einheits-
3 Verbreitet
matrix.
4 Wir verwenden hier diskrete Massepunkte statt eines Kontinuums, um Integrale zu vermeiden.
KAPITEL 3. MATRIZEN
110
wobei

x′i
r′i =  yi′ 
zi′

ist. Orthogonale Matrizen sind längentreu, d.h. durch die Drehspiegelung ändert sich der Abstand zum
Ursprung nicht:
′2
′2
ri2 = ri′2 = x′2
i + yi + zi
Um den Trägheitstensor durch die transfomierten Koordinaten auszudrücken, setzt man ri = Dr′i ein:
J
=
n
X
i=1
=
n
X
i=1
=
n
X
i=1
= D
mi ri2 I − ri rT
i
T
mi ri′2 I − Dr′i (Dr′i )
T
mi ri′2 DIDT − Dr′i r′T
i D
"
n
X
i=1
mi ri′2 I
−
r′i r′T
i
#
DT
Hierbei wurde I = DIDT = DDT verwendet. In der eckigen Klammer steht jetzt der bezüglich des
gestrichenen Koordinatensystems berechnete Trägheitstensor
J′ =
n
X
i=1
.
mi ri′2 I − r′i r′T
i
Es gilt also
J = DJ′ DT .
Wir multiplizieren von links mit DT und von rechts mit D und haben gezeigt, dass sich der neue
Trägheitstensor aus dem ursprünglich berechneten durch folgende Transformation ergibt:
J′ = DT JD
Ziel der Transformation ist es, die Achsen so zu legen, dass die Matrix J′ diagonal ist, d.h. die Deviationsmomente verschwinden. Diese Achsen nennt man dann die Hauptträgheitsachsen und die
entsprechenden Trägheitsmomente auf der Diagonalen heißen Hauptträgheitsmomente. Dies sind
gerade die Eigenwerte der Matrix J, und die Haupträgheitsachsen sind die Eigenvektoren (siehe unten).
KAPITEL 3. MATRIZEN
111
Aufgaben zu Abschnitt 3.1
3.1.1
Aufgabe:
Transponieren Sie die folgenden

1 5

−5
1
A=
4 0
3.1.2
Matrizen:

3
3
0 , B=
4
1
1 −2
−5 0
,


−2
5 
10
3

2
C=
8
Aufgabe:
Welche der folgenden Matrizen sind symmetrisch? Welche sind schiefsymmetrisch?






0
1
4
0
5 0 −3
1 0 −1
 −1 0 −3 5 
, B= 0 5 7 , C= 0 1 5 
A=
 −4 3
0 −8 
−3 7 1
−1 5 1
0 −5 8
0




0 −a b
1 −4 −3
0 −1  mit a, b ∈ R, E =  −4 0
2 
D= a
−b 1
0
−3 2
8


0
x2 −z 2
2

−x
0
y 2  mit x, y, z ∈ R
F=
z 2 −y 2
1
3.1.3
Aufgabe:
Gegeben sind die Matrizen


1
4
A =  3 −2  ,
−1 5
a)



2
X =  −1  ,
1
Berechnen Sie – sofern möglich – die folgenden Ausdrücke:
A+ B,
b)
B−Y,
A+Y,
A· B,
B ·A,
B ·X,

2
Y= 3
4
B·Y,
B2 ,
YT · Y ,
Y · YT ,
Aufgabe:
Gegeben sind die Vektoren




a1
b1
a =  a2  und b =  b2  .
a3
b3
Finden Sie eine schiefsymmetrische Matrix A mit der Eigenschaft
Ab = a × b .
Zeigen Sie:
−A2 = a2 I − aaT
XT · X ,

1
2 
3
AT · Y ,
Berechnen Sie die folgenden Matrizenprodukte
A · YT · B · X ,
3.1.4

0
1
−3 1  ,
2 −1
1
B= 2
0
X · XT
YT · B
KAPITEL 3. MATRIZEN
3.1.5
112
Aufgabe:
Gegeben sind die Matrizen
A=
2
1
4 1
3 5


3 1 1
B= 0 2 1 ,
−1 5 1
,
Berechnen Sie – sofern möglich – die folgenden Ausdrücke:
a)
3.1.6
b)
(AB) C

T
c) A (B + C)
A (BC)

3
1 
1
−2 0
C= 2 5
−1 1
T
d)
(AB)
Aufgabe:
Gegeben sind die Matrizen


1 0 2
5 −6
4
16
−2 −6
A= 0 1 0 , B=
, C=
, D=
4 −5
−1 −4
3
9
0 0 0
6
3
1 1
3 5
1 2
F=
, G=
, H=
, K=
−2 −1
2 2
4 1
6 4
Berechnen Sie die folgenden Ausdrücke:
a) A2
b)
B2
c) C2
d)
DF
e) GH
f)
GK
Die Ergebnisse sind auf dem ersten Blick überraschend. Was für Eigenschaften können also Matrizen
haben, die beim Rechnen mit Zahlen nicht vorkommen können?
3.1.7
Aufgabe:
Gegeben sind die Matrizen:


3 0 0
A= 0 3 0 ,
0 0 3


0 0
2 0 ,
0 −1
3
B= 0
0


2 0
0 0 
0 1
0
C= 3
0
Worauf werden die Basisvektoren e1 , e2 , e3 durch diese Matrizen jeweils abgebildet? Um was für
Abbildung handelt es sich geometrisch?
3.1.8
Aufgabe:
Gegeben sind die Matrizen:


0 0 1
A= 0 1 0 ,
1 0 0

B=
√
1
2
2 √
− 12 2
0
√
1
2 √2
1
2 2
0

0
0 ,
−1

C=
√
1
2 √2
1
2 2
0
√
1
2
2 √
− 21 2
0

0
0 
1
Zeigen Sie, dass diese Matrizen orthogonal sind. Worauf werden die Basisvektoren e1 , e2 , e3 durch
diese Matrizen jeweils abgebildet? Um was für Abbildung handelt es sich geometrisch?
KAPITEL 3. MATRIZEN
3.1.9
113
Aufgabe:
Gegeben ist die 4 × 4-Hadamard 5 -Matrix:

1 1
 1 −1
H4 = 
 1 1
1 −1

1
1
1 −1 

−1 −1 
−1 1
a) Zeigen Sie, dass die Matrix 12 H4 orthogonal ist.
b) Die 8 × 8-Hadamard-Matrix ist definiert als
H4
H8 =
H4
H4
−H4
.
Begründen Sie an Hand des Ergebnisses von a), dass auch die Matrix σH8 orthogonal ist, wenn man
die Zahl σ geeignet wählt. Bestimmen Sie diese Zahl.
5 Benannt
nach dem französischen Mathematiker Jacques Hadamard (1865 – 1963).
KAPITEL 3. MATRIZEN
3.2
114
Determinanten
Geometrische Motivation
Determinanten sind unter anderem wichtig, um eine Aussage über die Existenz der inversen Matrix machen zu können. Insbesondere hat ein lineares Gleichungssystem mit einer N × N -Koeffizientenmatrix
A genau dann eine eindeutige Lösung, wenn die Bedingung det (A) 6= 0 erfüllt ist.
Merke:
Determinanten sind nur für quadratische Matrizen definiert.
Die Determinante einer 2 × 2-Matrix
A=
haben wir schon kennengelernt. Sie lautet:
a
det (A) = 11
a21
a11
a21
a12
a22
a12 = a11 a22 − a12 a21
a22 Wie wir im Kapitel über Vektorrechnung festgestellt haben, ist dies (evtl. bis auf ein Vorzeichen) die
Fläche des von den beiden Vektoren
a12
a11
und a2 =
a1 =
a22
a21
aufgespannten Parallelogrammes. Die Bedingung det (A) = 0 bedeutet also gerade, dass die Fläche
des Parallelogrammes Null ist. Das ist genau dann der Fall, wenn die Vektoren kollinear sind.
Die Determinante einer 3 × 3-Matrix

a11
A =  a21
a31
a12
a22
a32

a13
a23 
a33
haben wir bei der Behandlung des Spatproduktes auch schon kennengelernt. Sie lautet:
a11 a12 a13 det (A) = a21 a22 a23 a31 a32 a33 = a11 a22 a33 + a21 a32 a13 + a31 a12 a23
−a11 a32 a23 − a21 a12 a33 − a31 a22 a13
Wir haben außerdem mit der Sarrus-Methode ein übersichtliches Schema kennengelernt, diese Determinante zu berechnen. Die Determinante ist (evtl. bis auf ein Vorzeichen) das Volumen des von den
drei Vektoren






a11
a12
a13
a1 =  a21  , a2 =  a22  und a3 =  a23 
a31
a32
a33
aufgespannten Spates. Die Bedingung det (A) = 0 bedeutet also gerade, dass das Volumen des Spates
Null ist. Das ist genau dann der Fall, wenn die Vektoren in einer Ebene liegen.
Diese Beispiele legen nahe (und man kann es tatsächlich zeigen), dass Determinanten (evtl. bis auf ein
Vorzeichen) als N -dimensionales Volumen eines von N Vektoren im RN aufgespannten N -dimensionalen
KAPITEL 3. MATRIZEN
115
Spates interpretiert werden können. Es ist nicht nötig, sich das räumlich vorzustellen. Wichtig ist vor
allem: Die Bedingung det (A) = 0 bedeutet, dass die N Spaltenvektoren a1 , ..., aN der Matrix
A = a1 a2 · · · aN
linear abhängig voneinander sind. Das heißt: Mindestens einer dieser Vektoren kann als Linearkombination der N − 1 anderen dargestellt werden. Falls dies z.B. der Vektor aN ist, so gibt es Zahlen
σ1 , ..., σN −1 , so dass gilt:
aN = σ1 a1 + σ2 a2 + ... + σN −1 aN −1
Um ein Zahlenbeispiel zu geben, betrachten wir folgende

1 2 1
 2 3 1
A=
 3 1 2
4 1 3
4 × 4-Matrix:

4
6 

6 
8
Man prüft leicht nach, dass der vierte Spaltenvektor die Summe der ersten drei Spaltenvektoren ist.
Deshalb gilt det (A) = 0, und das Gleichungssystem Ax = b kann keine eindeutige Lösung besitzen
(egal, wie man b wählt).
Die Berechnung von Determinanten
Für Determinanten von N × N -Matrizen mit N > 3 ist die Berechnung etwas aufwändiger. Es gibt
hierfür keine Regel von Sarrus. Wir stellen im Folgenden den Entwicklungssatz von Laplace vor.
Dieser führt die Berechnung einer Determinante einer quadratischen Matrix der Dimension N auf eine
der Dimension N − 1 zurück. Dies kann man wiederholt anwenden, so dass man schließlich bei 3 × 3
oder 2 × 2 ankommt. Wir zeigen das Schema am Beispiel der folgenden 4 × 4-Determinante:
8 3 8 5 6 5 5 4 3 7 3 6 2 3 7 6 Wir entwickeln nach der ersten Spalte. Dazu nehmen wir jedes dieser Elemente dieser Spalte (d.h.
die Zahlen 8, 6, 3, 2) und bilden die Unterdeterminanten aus den Elementen der jeweils anderen
Spalten und Zeilen 6 . Hier sind die Elemente und die jeweiligen Unterdeterminanten:
8
5
7
3
5 4 3 6 7 6 6
3 8
7 3
3 7
5
6
6
3
3
5
3
8 5 5 4 7 6 2
3 8
5 5
7 3
5
4
6
Anschließend werden diese Zahlen mit den jeweiligen Determinanten multipliziert und mit alternierendem Vorzeichen aufsummiert. Es gilt:
8 3 8 5 3 8 5 3 8 5 3 8 5 5 5 4 6 5 5 4 3 7 3 6 = 8 7 3 6 −6 7 3 6 +3 5 5 4 −2 5 5 4 7 3 6 3 7 6 3 7 6 3 7 6 2 3 7 6 Die verbleibenden 3×3-Determinanten kann man mit der Sarrus-Regel ausrechnen. Man kann aber auch
jeweils noch einmal den Entwicklungssatz anwenden und diese auf 2 × 2-Determinaten zurückführen.
6 Unterdeterminaten
sind also die Determinanten der jeweiligen Untermatrizen.
KAPITEL 3. MATRIZEN
116
Das Ergebnis lautet:
8
6
3
2
3
5
7
3
8
5
3
7
5
4
6
6
= −246
Wir haben eben den Entwicklungssatz von Laplace7 an Hand der Entwicklung nach der ersten
Spalte erklärt. Er erlaubt aber sogar die Entwicklung nach jeder beliebigen Spalte oder Zeile. Die
Unterdeterminanten werden immer aus den Elementen der jeweils anderen Zeilen und Spalten gebildet.
Man muss dabei aber mit dem alternierenden Vorzeichen aufpassen. Die Vorzeichen finden sich in
folgendem “Schachbrett-Schema”:
+ − + − ··· − + − + ··· + − + − ··· − + − + ··· ..
.. . . .. ..
.
. .
. .
Bei der zweiten Spalte muss man also z. B. mit einem “-” anfangen, ebenso bei der vierten Zeile.
Damit man möglichst wenig rechen muss, sucht man sich am besten eine Zeile oder Spalte aus, in der
möglichst viele Nullen stehen. Wir betrachten das folgende Beispiel:
3 3 2 3 3 0 1 4 2 3 4 4 2 0 0 3 Es bietet sich
3
3
2
2
an, nach der untersten Zeile zu entwickeln, in der zwei Nullen vorkommen:
3 2 3 3 3 2
3 3 3 3 2 3 3 2 3 0 1 4 0 1 4 +0 3 1 4 −0 3 0 4 +3 3 0 1
=
−2
3 4 4 2 3 4
2 3 4 2 4 4 3 4 4 0 0 3
Der zweite und dritte Term ist Null. Wir haben ihn nur aus systematischen Gründen hingeschrieben.
Es müssen jetzt nur noch zwei 3 × 3-Determinanten ausgerechnet werden. Da auch hier jeweils eine
Null vorkommt, ist es günstig, wieder den Laplaceschen Entwicklungssatz zu verwenden. Es gilt:
3 2 3 0 1 4 = 3 (4 − 16) + 3 (8 − 3) = −21 (Entwicklung nach der 1. Spalte)
3 4 4 und
3
3
2
Daraus folgt:
3 2 0 1 = −3 (12 − 2) − 3 (3 − 6) = −21 (Entwicklung nach der 2. Spalte)
3 4 3
3
2
2
3
0
3
0
2
1
4
0
3
4
4
3
= −2 · (−21) + 3 · (−21) = −21
Anmerkung: Diese Matrizen wurden mit einem Zufallsgenerator erzeugt. Dass die Zahl -21 dreimal
vorkommt, ist also wirklich Zufall und nicht etwa konstruiert!
Als eine Folgerung des Entwicklungssatzes von Laplace ergibt sich die folgende Regel über
7 Pierre-Simon
Marquis de Laplace (1749-1827) war ein französischer Mathematiker.
KAPITEL 3. MATRIZEN
117
Determinanten von Dreiecksmatrizen: Wenn alle Elemente amn einer N ×N Matrix A unterhalb
oder oberhalb der Diagonalen Null sind, d.h.
amn = 0 für alle m > n
oder
amn = 0 für alle m < n ,
so ist die Determinante gleich dem Produkt ihrer Diagonalelemente:
det (A) = a11 a22 · · · ann
Solche Matrizen der Gestalt

a11 a12
 0 a22

 ..
..
 .
.
0
0
···
···
..
.
a1N
a2N
..
.
· · · aN N






 bzw. 


a11
a21
..
.
0
a22
..
.
···
···
..
.
aN 1
aN 2
· · · aN N
bezeichnet man als obere bzw. untere Dreiecksmatrizen.
0
0
..
.





Dreiecksmatrizen sind unter Anderem wichtig für die Lösung linearer Gleichungssysteme mit dem
Gauß-Algorithmus.
Eigenschaften von Determinanten
Im Folgenden sind mit A, B,... immer N × N -Matrizen gemeint. Mit σ bzw. σk ist ein Skalar gemeint.
Die Determinante der Einheitsmatrix I hat den Wert Eins:
det (I) = 1
Weiterhin gilt folgende wichtige Eigenschaft:
det AT = det (A)
Da sich durch das Transponieren – also durch das Vertauschen von Zeilen mit Spalten – der Wert
einer Matrix nicht ändert, gelten alle folgende Aussagen über Spalten auch sinngemäß über Zeilen.
Wir machen im Folgenden Aussagen über Spalten. Für Zeilen gelten sie entsprechend.
Die N Spaltenvektoren der Matrix A seien im folgenden wieder mit a1 , ..., aN bezeichnet, d. h.
A = a1 a2 · · · aN
Es gelten folgende Rechenregeln:
1. Wenn man zwei Spalten einer Matrix vertauscht, wechselt die Determinante ihr Vorzeichen. Zum
Beispiel gilt:
a2 a1 a3 · · · aN
a1 a2 a3 · · · aN
= −det
det
2. Wenn man eine Spalte der Matrix mit dem Faktor σ multipliziert, verändert sich der Wert der
gesamten Determinanten um diesen Faktor:
a1 · · · σan · · · aN
= σdet (A)
det
Als Folgerung daraus ergibt sich die nächste Eigenschaft:
KAPITEL 3. MATRIZEN
118
3. Wenn man alle Spalten der Matrix mit dem Faktor σ multipliziert, verändert sich der Wert der
gesamten Determinanten um den Faktor σ N :
σa1 σa2 · · · σaN
= σ N det (A)
det
4. Der Wert der Determinate ändert sich nicht, wenn man zur Spalte ai ein Vielfaches σak einer
anderen Spalte hinzuaddiert, d. h.
ai
ersetzt. Zum Beispiel gilt:
a1 a2 a3
det
· · · aN
ai + σak
= det
(i 6= k)
a1
a2 + 7a1
a3
· · · aN
Als Folgerung daraus ergibt sich die nächste Eigenschaft:
5. Wenn die Spalte ai der Matrix von den anderen Spalten ak (i 6= k) linear abhängig ist, so gilt
det (A) = 0 .
Lineare Unabhängigkeit der Spalten ist also äquivalent zu der Eigenschaft det (A) 6= 0.
6. Determinante des Matrixproduktes
det (AB) = det (A) det (B)
Als Folgerung daraus ergibt sich die nächste Eigenschaft:
7. Determinante der inversen Matrix: Wenn die Matrix A regulär ist, so gilt
det A−1 =
1
det (A)
Mit Hilfe dieser Rechenregeln lässt sich eine Matrix oft auf eine einfachere Gestalt bringen, ohne dabei
den Wert der Determinanten zu verändern. Im folgenden Beispiel werden Vielfache der ersten Zeile
von der dritten und der vierten Zeile abgezogen, so dass dabei eine obere Dreiecksmatrix entsteht:
1 2 3 4 1 2 3
4 0 3 1 1 0 3 1
1 4 8 7 5 = 0 0 −5 −11 = −15
2 4 6 9 0 0 0
1 Man bezeichnet solche Umformungen als elementare Zeilen- oder Spaltenumformungen.
−1
Aus der letzten Rechenregel det A−1 = det (A)
folgt für eine orthogonale Matrix A sofort die
2
Eigenschaft [det (A)] = 1. Die Determinante einer orthogonalen Matrix kann also nur den Wert
det (A) = ±1 haben. Doch Vorsicht, die Umkehrung gilt nicht: Wenn die Determinante einer Matrix
den Wert 1 oder −1 hat, ist sie nicht notwendigerweise orthogonal! Man kann daraus aber schließen,
dass die zugehörige lineare Abbildung das Volumen nicht verändert.
KAPITEL 3. MATRIZEN
119
Aufgaben zu Abschnitt3.2
3.2.1
Aufgabe:
Berechnen Sie die Determinanten der folgenden 2 × 2- Matrizen:
2 3
a a
3
A=
B=
(a, b ∈ R)
C=
4 −5
b b
x
3.2.2
(x, y ∈ R)
Aufgabe:
Berechnen Sie die Determinanten der folgenden 3 × 3


1 4 7
−2 8
A= 2 5 8 
B= 1 0
3 6 9
4 3
3.2.3
11
2x
Matrizen:

2
7 
1

3
C= 7
0

4 −10
4
1 
2
8
Aufgabe:
Für welche reelle Zahl λ werden die Determinanten der folgenden Matrizen gleich Null?


1−λ
2
0
1−λ
2
3−λ
1 
A=
B= 0
1
−1 − λ
0
0
2−λ
3.2.4
Aufgabe:
Begründen Sie (ohne direkte Berechnung), warum die Determinanten der folgenden Matrizen gleich
Null sind:




1 0 −2
1 −2 3
B= 5 0 3 
A =  −4 8 0 
1
0 0 4
−1
3
2




6 −3 −15 24
1 4 −3 6
 3
 0 2 3 8 
5
−7
0 


D=
C=
 −2 1
 1 4 −3 6 
5
−8 
1
1
0
0
0 1 1 1
3.2.5
Aufgabe:
Berechnen Sie die Determinante folgender Matrix auf zwei Wegen:
1. Entwicklung nach der zweiten Zeile
2. Entwicklung nach der dritten Spalte

2
 −5
A=
 1
9
5
3
7
3

1 4
0 0 

0 −3 
4 5
KAPITEL 3. MATRIZEN
3.2.6
120
Aufgabe:
Berechnen Sie die Determinanten der folgenden Matrizen:

1
 −2
A=
 1
0

1
 0

C=
0
0
3.2.7
0
1
4
2
3
0
1
2
0 0
1 0
0 −2
4 1

4
3 

5 
0

1
 1
B=
 0
4

0
0 

0 
5

1
 0

D=
0
0
0
2
1
0
0
4
0
0

5 3
2 1 

3 1 
2 −3

0
0 

0 
4
0
0
3
0
Aufgabe:
Zeigen Sie mit Hilfe elementarer Umformungen, die den Wert der Determinanten nicht verändern, dass
die Determinanten der folgenden Matrizen verschwinden:

−1
 2
B=
 −1
1


4 6 8
A= 3 1 4 
−2 4 0
3.2.8
1
4
8
3
0
3
1
2

2
5 

5 
4
Aufgabe:
Gegeben sind folgende Matrizen

0 1
A= 3 2
1 1

1
D= 0
0

2
1 
0
0
cos t
sin t
B=

0
− sin t 
cos t
cos t
sin t
− sin t
cos t

3
1
0
0
0
0
4
2
3
0


F=


2
0
0
0
0
7
8
4
0
0

2 3
 4 5
C=
 3 −1
2 1
1
4
3
3
2








1 2
2 5 

4 −3 
3 4
−1
G= 3
1

2 1
2 1 
1 0
a)
Bestimmen Sie die Determinaten dieser Matrizen!
b)
Berechnen Sie die Produkte AG, GA, AA sowie die Determinanten dieser Produkte!
3.2.9
Aufgabe:
Prüfen Sie, ob die folgenden drei Vektoren jeweils komplanar sind:
KAPITEL 3. MATRIZEN
121
a)


1
~a =  2 
2
b)


0
~b =  −4 
3


0
~a =  1 
2
3.2.10


3
~b =  2 
1


3
~c =  −6 
15


1
~c =  1 
0
Aufgabe:
Durch die Matrix
A=
eine Abbildung
in der Ebene gegeben.
1
0
λ
1
(λ ∈ R)
x 7→ x′ = Ax
• Was bedeutet diese Abbildung geometrisch? Wie verändert sich ein zu den Achsen paralleles
Rechteck durch diese Abbildung?
• Beweisen Sie mit Hilfe der Determinante, dass die Fläche eines Parallelogramms sich durch diese
Abbildung nicht ändert.
• Eine derartige Abbildung wird als Scherung bezeichnet. Wie könnte eine dreidimensionale Scherung aussehen?
KAPITEL 3. MATRIZEN
3.3
122
Lineare Gleichungssysteme
Lösungsmengen
Ein allgemeines System aus M linearen Gleichungen mit N Unbekannten x1 , x2 , ..., xN lautet:
a11 x1 + a12 x2 + . . . + a1N xN
a21 x1 + a22 x2 + . . . + a2N xN
=
=
..
.
b1
b2
aM1 x1 + aM2 x2 + . . . + aMN xN
=
bM
Wir schreiben dies wieder kompakt mit Matrizen und Vektoren als
Ax = b ,
wobei



x=


x1
x2
..
.





 und b = 


xN
b1
b2
..
.
bM





gilt und und die M × N Koeffizientenmatrix gegeben ist durch


a11 a12 · · · a1N
 a21 a22 · · · a2N 


A= .
..
..  .
..
 ..
.
.
. 
aM1
aM2
· · · aMN
Die N Spaltenvektoren der Koeffizientenmatrix bezeichnen wir mit a1 , a2 , ..., aN . Für die Überlegungen zur Lösbarkeit ist es hilfreich, das Gleichungssystem folgendermaßen zu schreiben:
x1 a1 + x2 a2 + ... + xN aN = b
Das Gleichungssystem ist also genau dann lösbar, wenn sich b als Linearkombination der Vektoren
a1 , a2 , ..., aN darstellen lässt. In Abbildung 3.7 ist die Situation für ein Gleichungssystem mit einer
2 × 2-Koeffizientenmatrix veranschaulicht. Es sind diejenigen Zahlen x1 und x2 gesucht, mit denen sich
b als Linearkombination
b = x1 a1 + x2 a2
darstellen lässt. Für Vektoren in zwei Dimensionen lässt sich dieses Problem sogar geometrisch lösen.
Für die Zahlenwerte
2 2
2
2
A=
d.h. a1 =
und a2 =
−1 2
−1
2
und
b=
7
1
aus der Zeichnung erhält man so die Lösung x1 = 2, x2 = 3/2.
Die lineare Abhängigkeit oder Unabhängigkeit der Vektoren a1 , ..., aN untereinander sowie die lineare
Abhängigkeit des Vektors b von diesen spielt eine wesentliche Rolle für die Lösbarkeit des Gleichungssystems. Um diese Abhängigkeiten charakterisieren zu können, führen wir einen neuen Begriff ein.
KAPITEL 3. MATRIZEN
123
y-Achse
3
2
a2
b
1
0
2
−1
3
4
7
x-Achse
a1
Abbildung 3.7: Veranschaulichung eines linearen Gleichungssystems mit einer regulären 2 × 2Koeffizientenmatrix.
Der Rang einer Matrix:
Der Rang (engl. rank ) rank (A) einer M × N - Matrix
A = a1 a2 a3 . . . aN
ist die maximale Anzahl linear unabhängiger Spalten- oder Zeilenvektoren8 .
Man kann den Rang der Matrix interpretieren als die Dimension der von den Spaltenvektoren a1 , a2 , ..., aN
aufgespannten verallgemeinerten Ebene (Hyperebene)
r (σ1 , ..., σN ) = σ1 a1 + ... + σN aN
im M -dimensionalen Raum, die durch den Ursprung geht. Diese Formel ist eine Verallgemeinerung der
Ebenengleichung in Punkt-Normalen-Form auf höherdimensionale Räume (der Aufpunkt ist in diesem
Fall der Ursprung). Die obige Hyperebene ist ein N -dimensionales geometrisches Gebilde, wenn die
Vektoren a1 , a2 , ..., aN linear unabhängig sind. Ansonsten ist die Dimension kleiner als N .
Das Rangkriterium für die Lösbarkeit des Gleichungssystems Ax = b :
tem besitzt eine Lösung, wenn sich die Bedingung
Das Gleichungssys-
x1 a1 + x2 a2 + ... + xN aN = b
erfüllen lässt. Dies bedeutet gerade, dass b von a1 , a2 , ..., aN linear abhängig ist9 . Das bedeutet,
dass die Koeffizientenmatrix
A = a1 a2 a3 . . . aN
und die sogenannte (um b) erweiterte Koeffizientenmatrix
(A|b) := a1 a2 a3 . . . aN
b
den selben Rang besitzen müssen. Diese Bedingung nennt man das Rangkriterium. Ist das Rangkriterium nicht erfüllt, so kann es keine Lösung geben.
Um mit dem Rang einer Matrix arbeiten zu können, muss man ein paar Eigenschaften und Rechenregeln
kennen. Diese werden im Folgenden erläutert.
8 Man kann zeigen: Die maximale Anzahl linear unabhängiger Spalten ist gleich der maximalen Anzahl unabhängiger
Zeilen. Man braucht daher nicht zwischen Spaltenrang und Zeilenrang zu unterscheiden.
9 Anschaulich kann man das so interpretieren, dass die Vektoren a ,
a2 , ..., aN und der Vektor b in der selben
1
von a1 , a2 , ..., aN aufgespannten verallgemeinerten Ebene (Hyperebene) liegen.
KAPITEL 3. MATRIZEN
124
Elementare Zeilen und Spaltenumformungen ändern den Rang einer Matrix nicht. Wenn
man zum Beispiel zur 2. Spalte einer Matrix ein Vielfaches der 1. Spalte addiert, bleibt der Rang der
Matrix gleich. Anschaulich ist dies unmittelbar einleuchtend: Die Spaltenvektoren der Matrix sind die
Richtungsvektoren einer (Hyper-) Ebene durch den Ursprung, und bei dieser Operation werden andere
Richtungsvektoren für die selbe (Hyper-) Ebene erzeugt.
Die Dimension der Hyperebene kann natürlich auch nie größer sein als die Dimension M des Raumes,
in dem sie liegt. Es gilt also die folgende
Eigenschaft: Der Rang einer Matrix kann nicht größer sein als die kleinere der beiden Matrixdimensionen M und N :
rank (A) ≤ min (M, N )
Wenn das Gleichheitszeichen gilt, spricht man von maximalem Rang. Wenn es lineare Abhängigkeiten zwischen den Zeilen oder Spalten einer Matrix gibt, kann also der Rang nicht maximal sein.
Berechnung des Ranges: Die Dimension der größten nicht verschwindenden Unterdeterminante
einer Matrix A ist gerade der Rang der Matrix. Man muss dabei also (im Prinzip) alle Unterdeterminaten bestimmen, um den Rang zu ermitteln. Bei praktischen Beispielen kann man den Rang oft
anders erkennen. Zum Beispiel gilt:




1 2 3 4
1 1 2 3
 5 6 7 8 
 5 1 2 3 



rank 
 9 10 11 12  = rank  9 1 2 3  = 2
13 14 15 16
13 1 2 3
Im allgemeinen Fall muss man im möglicherweise viel rechnen. Dies tut dann aber meist der Computer.
Wir verwenden nun den Begriff des Ranges, um die Lösbarkeit von Gleichungssystemen zu untersuchen
und unterscheiden dabei verschiedene Fälle:
Ein Gleichungssystem mit quadratischer Koeffizientenmatrix
Wenn die Matrix A quadratisch ist, kann man als Regelfall eine eindeutige Lösung des Gleichungssystems erwarten. Dies ist genau dann der Fall, wenn die Matrix regulär ist. Ist die Matrix dagegen
singulär so gibt es keine eindeutige Lösung.
Reguläre Koeffizientenmatrix: Die Matrix ist regulär, wenn ihre Spalten linear unabhängig sind,
d. h. wenn det (A) 6= 0 gilt. Dann existiert A−1 , und die Lösung ist gegeben durch
x = A−1 b .
Singuläre Koeffizientenmatrix: Ist die Matrix singulär (d. h. det (A) = 0), so sind die Spaltenvektoren a1 , a2 , ..., aN der Matrix voneinander linear abhängig. In diesem Fall gibt es entweder unendlich
viele Lösungen oder gar keine, – je nachdem, ob der Inhomogenitätsvektor b zu diesen Abhängigkeiten
“passt” oder nicht. Damit ist gemeint: Unendlich viele Lösungen gibt es, wenn der Vektor b auch von
den Spaltenvektoren der Matrix linear abhängig ist. Dann kann man Zahlen x1 ,...,xN finden, so dass
er als Linearkombination
b = x1 a1 + ... + xN aN
dargestellt werden kann. Das heißt geometrisch: Er liegt in der Hyperebene, die von den Spaltenvektoren aufgespannt wird. Weil die Spaltenvektoren a1 , a2 , ..., aN untereinander schon linear abhängig
KAPITEL 3. MATRIZEN
125
sind, gibt es aber beliebig viele Kombinationsmöglichkeiten für die Zahlen x1 ,...,xN . Wenn der Vektor
b dagegen von den Spaltenvektoren linear unbhängig ist (also nicht in der Hyperebene liegt), kann er
nicht als deren Linearkombination geschrieben werden. Das heißt: Es gibt keine Lösung.
Wir greifen ein weiter oben schon betrachtetes Beispiel auf. Das Gleichungssystem
x1 + 2x2
= 3
3x1 + 6x2
= 9
besitzt unendlich viele Lösungen, weil der Inhomogenitätsvektor
3
b=
9
zu der singulären Matrix
A=
1
3
2
6
”passt”: Der Inhomogenitätvektor
b ist linear abhängig von den beiden Spaltenvektoren a1 und a2 der
Matrix A = a1 a2 , d. h. die Gleichung
x1 a1 + x2 a2 = b
lässt sich erfüllen, weil der Vektor b eine Linearkombination von a1 und a2 ist.
Dagegen besitzt das Gleichungssystem
x1 + 2x2
= 3
3x1 + 6x2
= 2
keine Lösung, weil der Inhomogenitätsvektor
b=
3
2
nicht zu der singulären Matrix “passt”: Der Inhomogenitätsvektor b ist linear unabhängig von den
beiden Spaltenvektoren a1 und a2 der Matrix, d. h. die Gleichung
x1 a1 + x2 a2 = b
lässt sich nicht erfüllen.
Welcher der beiden Fälle vorliegt, lässt sich mit Hilfe der erweiterten Koeffizientenmatrix ( A| b)
entscheiden. Im ersten Fall des Beispiels lautet diese:
1 2 3
( A| b) =
3 6 9
Die lineare Abhängigkeit spiegelt sich darin wieder, sich durch Hinzufügen des Vektors b der Rang
nicht erhöht:
rank ( A| b) = rank (A) = 1
Dies überprüft man, indem man zeigt, dass alle drei Unterdeterminanten verschwinden:
1 2 1 3 2 3 =
=
3 6 3 9 6 9 =0
Im zweiten Fall gilt:
( A| b) =
1
3
2 3
6 2
KAPITEL 3. MATRIZEN
und damit
Es gilt also:
1
3
126
2 = 0,
6 1 3
3 2
= −4 ,
2
6
3 = −14
2 rank (A) = 1 , aber rank ( A| b) = 2
Wegen rank ( A| b) > rank (A) = 1 gibt es keine Lösung.
In höheren Dimensionen kann man genauso vorgehen. Allgemein gilt folgendes
Rang-Kriterium für die Lösbarkeit eines linearen Gleichungssystems mit singulärer N × N Koeffizientenmatrix A: Falls
rank ( A| b) = rank (A)
gilt, so gibt es unendlich viele Lösungen. Wenn dagegen
rank ( A| b) > rank (A)
gilt, so gibt es keine Lösung.
Um das Rang-Kriterium geometrisch zu veranschaulichen, soll der Fall einer singulären 3 × 3 Koeffizientenmatrix
A = a1 a2 a3
betrachtet werden. Weil die Matrix laut Annahme singulär ist, verschwindet das Spatprodukt der drei
Vektoren a1 , a2 , a3 . Dies bedeutet, dass die Vektoren in einer Ebene liegen. Wir schreiben die
Gleichung Ax = b als
x1 a1 + x2 a2 + x3 a3 = b .
Diese Bedingung lässt sich nur erfüllen, wenn b in der selben Ebene liegt wie die Vektoren a1 , a2 , a3 ,
d.h. linear abhängig ist von a1 , a2 , a3 . Mathematisch ausgedrückt ist dies gerade die Eigenschaft
rank ( A| b) = rank (A). Wenn der Vektor b in eine andere Richtung (aus der Ebene heraus) zeigt,
kann er nicht von a1 , a2 , a3 linear abhängig sein. Dann gilt rank ( A| b) > rank (A).
Ein allgemeines lineares Gleichungssystem mit M Gleichungen und N Unbekannten
Gibt es mehr Gleichungen als Unbekannte (M > N ), so ist das Gleichungssystem im Regelfall überbestimmt: Es sind zu viele Bedingungen vorhanden, als dass sich alle zugleich erfüllen lassen. Es gibt
dann keine Lösung. Man sagt: Die Lösungsmenge ist leer. Es kann aber vorkommen, dass zwischen den
Gleichungen Abhängigkeiten bestehen, so dass sich einige eliminieren lassen und auf diese Weise ein
kleineres äquivalentes Gleichungssystem entsteht, welches dann eine nicht leere Lösungsmenge besitzt.
Ein einfaches Beispiel ist folgendes System von 3 Gleichungen mit 2 Unbekannten:
x1 + x2
= 3
x1 + 2x2
2x1 + 3x2
= 5
= 8
Man sieht, dass die dritte Gleichung die Summe der beiden ersten ist. Lineare Abhängigkeiten sind
nicht immer so offensichtlich. Aber man kann die Abhängigkeit immer folgendermaßen überprüfen: Wir
schreiben die Spaltenvektoren a1 , a2 der Koeffizientenmatrix A und den Vektor b der Inhomogenität
nebeneinander hin:
 
 


1
1
3
a1 =  1  , a2 =  2  , b =  5  .
2
3
8
KAPITEL 3. MATRIZEN
127
Diese drei Vektoren sind komplanar, denn es gilt
det ( A| b) = det
Man überprüft:
a1
a2 b = 0 .
rank ( A| b) = rank (A) = 2
Dies bedeutet, dass der Vektor b in der von a1 , a2 aufgespannten Ebene liegt. Daran erkennt man
die Lösbarkeit des Gleichungssystems. In diesem Beispiel findet man mit etwas Probieren heraus, dass
a1 + 2a2 = b gilt. Damit hat man auch schon die Lösung, nämlich x1 = 1 und x2 = 2.
Sind weniger Gleichungen als Unbekannte vorhanden (M < N ), so ist das Gleichungssystem im Regelfall unterbestimmt: Die Bedingungen reichen nicht aus, um eine eindeutige Lösung fest zu legen.
Es gibt dann unendlich viele Lösungen. Es kann aber vorkommen, dass zwischen den Gleichungen
Abhängigkeiten bestehen, die auf einen Widerspruch führen. Es einfaches Beispiel ist das folgende
Gleichungssystem:
x1 + 2x2 + 3x3
x1 + 2x2 + 3x3
=
=
1
2
Wegen 1 6= 2 widersprechen sich die Gleichungen. Geometrisch liegt folgende Situation vor: Die Spaltenvektoren a1 , a2 , a3 der Koeffizientenmatrix sind kollinear, und deshalb gilt
1 2 3
rank (A) = rank
= 1.
1 2 3
Der Vektor b ist davon linear unabhängig (zeigt also in eine andere Richtung als a1 , a2 , a3 ).
deshalb gilt:
1 2 3 1
rank ( A| b) = rank
=2
1 2 3 2
Wir formulieren jetzt das allgemeine
Rang-Kriterium: Es sei ein Gleichungssystem mit allgemeiner M × N Koeffizientenmatrix A und
Inhomogenität b gegeben. Falls
rank ( A| b) = rank (A)
gilt, so gibt es entweder eine Lösung oder unendlich viele Lösungen. Wenn dagegen
rank ( A| b) > rank (A)
gilt, so gibt es keine Lösung.
Abbildung 3.8 zeigt die geometrische Situation: Im ersten Fall liegt b mit den Spaltenvektoren von
A in einer Hyperebene und lässt sich deshalb als deren Linearkombination darstellen. Im zweiten Fall
zeigt b in eine andere Richtung und lässt sich deshalb nicht als Linearkombination darstellen.
Homogene lineare Gleichungssysteme
Man spricht von einem homogenen linearen Gleichungssystem, wenn b = 0 gilt. Andernfalls ist das
System inhomogen. Nach dem Rangkriterium muss ein solches System immer eine Lösung besitzen.
Diese ist aber nicht sehr interessant: Der Nullvektor x = 0 ist immer eine Lösung des Gleichungssystem
Ax = 0 .
KAPITEL 3. MATRIZEN
128
nicht lösbar
lösbar
b
Hyperebene span(A)
Abbildung 3.8: Veranschaulichung des Rangkriteriums. Mit span (A) ist die Hyperebene gemeint, die
von den Spaltenvektoren der Matrix A aufgespannt wird.
Man nennt dies die triviale Lösung. Wir interessieren uns für die nicht trivialen Lösungen. Das
homogene Gleichungssystem lässt sich schreiben als
x1 a1 + x2 a2 + ... + xN aN = 0 ,
wobei mit a1 , a2 , ..., aN wieder die Spaltenvektoren der Matrix A bezeichnet sind. Die geometrische
Situation für N = 4 ist in Abbildung 3.9 dargestellt: Mit geeigneten Vorfaktoren x1 , ..., xN führt die
x3 a3
x4 a4
O
x2 a2
x1 a1
Abbildung 3.9: Veranschaulichung eines homogenen linearen Gleichungssystems.
Superposition (Vektorsumme) der Spaltenvektoren zum Ursprung zurück. Falls die Spaltenvektoren
linear unabhängig sind, lässt sich diese Bedingung nur erfüllen, wenn alle Vorfaktoren verschwinden:
x1 = 0, ... , xN = 0. Also gilt der
Satz: Wenn die Spaltenvektoren a1 , a2 , ..., aN der Matrix A linear unabhängig sind, dann besitzt
das homogene Gleichungssystem
Ax = 0
nur die triviale Lösung x = 0.
Damit es nicht triviale Lösungen gibt, müssen die Spaltenvektoren a1 , a2 , ..., aN also linear abhängig
sein. Das bedeutet, dass sie einen Raum von niedrigerer Dimension als N aufspannen:
rank (A) < N
Ohne Begründung teilen wir mit, dass es dann immer unendlich viele Lösungen gibt. Die Lösungsmenge
lässt sich dann geometrisch interpretieren als eine Hyperfläche der Dimension N − rank (A) im RN .
Bei einer N × N -Matrix A gibt es also genau dann unendlich viele nichttriviale Lösungen, wenn die
Matrix singulär ist, also
det (A) = 0
KAPITEL 3. MATRIZEN
129
gilt. Bei einem Gleichungssystem von drei Gleichungen mit drei Unbekannten liegen die drei Spaltenvektoren der Matrix dann in einer Ebene.
Die beschriebenen Lösbarkeitskriterien für lineare Gleichungssysteme sind wichtig, um zu vestehen,
welche Fälle vorkommen können. Welcher Fall bei einem gegebenen Gleichungssystem konkret vorliegt,
prüft man aber in der Praxis meist nicht an Hand dieser Regeln. Statt dessen fängt man einfach an,
es zu lösen und “sieht” dann, welcher der Fälle vorliegt. Das im Folgenden beschriebene Gaußsche
Eliminationsverfahren ist die Standardmethode zur Lösung linearer Gleichungssysteme.
Lösung linearer Gleichungssysteme: Das Gaußsche Eliminationsverfahren
Das Ziel des Gaußschen Eliminationsverfahrens (auch Gauß-Algorithmus genannt) ist es, das Gleichungssystem durch systematische Äquivalenzumformungen auf eine bestimmte einfache Gestalt zu
bringen, so dass man nur noch die Gleichungen ineinander einzusetzen braucht.
Ein Beispiel mit quadratischer Koeffizientenmatrix und eindeutiger Lösung
Wir betrachten als Beispiel folgendes System aus vier Gleichungen mit vier Unbekannten:
x1
x1
2x1
x1
−x2
+x2
−3x2
+x2
+x3
−2x3
+2x3
+x3
−x4
−2x4
+x4
−4x4
=
=
=
=
2
(∗)
1 (−1 × (∗))
4 (−2 × (∗))
5 (−1 × (∗))
Die Matrix ist nicht singulär. Es gibt also eine eindeutige Lösung.
Das Gleichungssystem soll nun so umgeformt werden, dass die Koeffizientenmatrix die Gestalt einer
oberen Dreiecksmatrix hat. Dabei soll “stur nach Schema” vorgegangen werden, – so wie ein Computerprogramm einen Algorithmus implementiert. Geschickte Vereinfachungen durch “scharfes Hinsehen”
sind dabei nicht vorgesehen. Die farbigen Markierungen symbolisieren die nächsten Rechenschritte.
Der Algorithmus benutzt zunächst die erste Gleichung, um bei allen anderen Gleichungen den Vorfaktor
zu x1 zu Null zu machen. Dazu werden geeignete Vielfache der ersten Gleichung zu den jeweiligen
anderen hinzuaddiert, was jeweils durch farbige Symbole an der rechten Seite angedeutet ist. Führt
man all diese Umformungen durch, so ergibt sich:
x1
−x2
2x2
−x2
2x2
+x3
−3x3
+0x3
+0x3
−x4
−x4
+3x4
−3x4
=
=
=
=
2
−1
0 (×2)
3
Wir weichen an dieser Stelle etwas von sturen Computerprogramm ab und multiplizieren die dritte Gleichung mit den Faktor 2, damit die Zahlen einfacher werden. Es ändert aber nichts an der prinzipiellen
Vorgehensweise. Es ergibt sich:
x1
−x2
2x2
−2x2
2x2
+x3
−3x3
+0x3
+0x3
−x4
−x4
+6x4
−3x4
=
=
=
=
−x4
−x4
+5x4
−2x4
=
=
=
=
2
(∗)
−1
0 (+1 × (∗))
3 (−1 × (∗))
Die farbigen Markierungen deuten die nächsten Umformungen an: Die erste Zeile bleibt so stehen, und
die zweite Zeile wird benutzt, um an der x2 -Position Nullen zu erzeugen. Es ergibt sich:
x1
−x2
2x2
+x3
−3x3
−3x3
3x3
2
−1
−1
(∗)
4 (+1 × (∗))
KAPITEL 3. MATRIZEN
130
Nach dem letzten Schritt ergibt sich:
x1
−x2
2x2
+x3
−3x3
−3x3
−x4
−x4
+5x4
3x4
=
=
=
=
2
−1
−1
3
Aus der letzten Gleichung folgt x4 = 1. Durch weiteres Einsetzen (Rückwärts-Einsetzen) erhält
man nacheinander x3 = 2, x2 = 3, x1 = 4.
Um so vorgehen zu können wie beschrieben, darf der Koeffizient oben links nicht Null sein. Wenn dies
doch der Fall ist, muss man ggf. die Reihenfolge der Gleichungen ändern. Entsprechendes gilt auch bei
späteren Schritten.
Um Schreibarbeit zu sparen und um gleichzeitig das Verfahren übersichtlicher zu machen, schreibt
man die Koeffizienten ohne die Unbekannten in eine Tabelle und führt die Zeilenumformungen in der
Tabelle durch. Die Lösung des selben Gleichungssystems stellt sich nun folgendermaßen dar:
1
1
2
1
1
-1
1
-3
1
-1
2
-1
2
-1
2
-2
2
-1
2
1
1
1
-1
2
1
-2
2
1
1
-3
0
0
1
-3
0
0
1
-3
-3
3
1
-3
-3
-1
-2
1
-4
-1
-1
3
-3
-1
-1
6
-3
-1
-1
5
-2
-1
-1
5
3
2
1
4
5
2
-1
0
3
2
-1
0
3
2
-1
-1
4
2
-1
-1
3
(∗)
(−1 × (∗))
(−2 × (∗))
(−1 × (∗))
(×2)
(∗)
(+1 × (∗))
(−1 × (∗))
(∗)
(+1 × (∗))
Um mit diesem Verfahren eine Lösung zu finden, braucht nicht vorher geprüft werden, ob es eine gibt!
Ein Beispiel mit unendlich vielen Lösungen
Wir betrachten das Gleichungssystem
Ax = b
mit

1
A= 4
7

 
2 3
1
5 6  und b =  1  .
8 9
1
Man könnte jetzt sofort mit dem Gauß-Algorithmus anfangen. Zur Wiederholung schieben wir aber
vorher eine theoretische Untersuchung zur Lösbarkeit ein:
KAPITEL 3. MATRIZEN
131
Lösbarkeitsbetrachtung: Wegen
det (A) = 0
ist A singulär, d. h. dieses Gleichungssystem besitzt keine eindeutige Lösung. Ob es überhaupt
Lösungen gibt, kann man an Hand des Rangkriteriums prüfen. Es gilt
rank (A) = 2 ,
denn z. B. die 2 × 2-Deteminante ganz oben links ist von Null verschieden:
1 2 4 5 = −3
Es ist jetzt rank (A|b) zu prüfen. Dies kann man tun, indem man die Determinanten aller 3 × 3Untermatrizen (A|b) berechnet. Man wird feststellen, dass alle den Wert Null besitzen. Mit
“scharfem Hinsehen” geht es noch einfacher: Man erkennt, dass b gerade der Differenzvektor des
zweiten und ersten Spaltenvektors von A ist:
a2 − a1 = b
Also gibt es Lösungen, weil b in einer Ebene mit a1 , a2 , a3 liegt. Dieser geometrische Sachverhalt
ist äquivalent zum Rangkriterium.
Wir wenden das Gaußsche Eliminationsverfahren an:
1
4
7
1
1
2
5
8
2
-3
-6
2
-3
3
6
9
3
-6
-12
3
-6
0
1
1
1
1
-3
-6
1
-3
0
(∗)
(−4 × (∗))
(−7 × (∗))
(∗)
(−2 × (∗))
Unten in der Tabelle ist eine Zeile aus Nullen entstanden, die man auch weglassen kann. In der Zeile
darüber steht die Gleichung −3x2 − 6x3 = −3, für die es keine eindeutige Lösung gibt. Es ist also ein
Gleichungssystem aus 2 Gleichungen mit 3 Unbekannten entstanden, welches unendlich viele Lösungen
besitzt. Diese lassen sich charakterisieren durch einen frei wählbaren Parameter, den wir λ nennen.
Geometrisch gesehen ist die Lösungsmenge des Gleichungssystems eine Gerade im dreidimensionalen
Raum.
Um die Lösungsmenge hinzuschreiben, muss der Parameter gewählt werden. Es gibt viele Möglichkeiten. Üblicherweise setzt man ihn gleich der letzten Unbekannten
x3 = λ
und drückt dann alle anderen Unbekannten durch diesen Parameter aus. Aus der letzten Gleichung
−3x2 − 6λ = −3 folgt
x2 = 1 − 2λ
Aus der ersten Gleichung x1 + 2x2 + 3x3 = 1 folgt x1 + 2 − 4λ + 3λ = 1 und damit
x1 = −1 + λ
KAPITEL 3. MATRIZEN
132
Die Lösungsmenge ist also als Gerade in Punkt-Richtungsform gegeben durch:




−1
1
x (λ) =  1  + λ  −2 
0
1
Offenbar war es nicht notwendig, vorab die Lösbarkeit des Gleichungssystems zu analysieren. Beim
Gaußschen Eliminationsverfahren sieht man zum Schluss “automatisch”, welcher der möglichen Fälle
vorliegt.
Ein Beispiel, bei dem es keine Lösung gibt
Wir betrachten der Einfachheit halber wieder
den Vektor b:

1 2
A= 4 5
7 8
die selbe Koeffizientenmatrix wie oben, aber verändern

 
3
1
6  und b =  1  .
9
2
Wir wissen schon, dass A singulär ist und deshalb dieses Gleichungssystem nicht eindeutig lösbar ist.
Dass es in diesem Fall gar keine Lösung gibt, kann man an Hand des Rangkriteriums prüfen. Wir
verzichten darauf und fangen gleich mit dem Gauß-Algorithmus an:
1
4
7
1
1
2
5
8
2
-3
-6
2
-3
3
6
9
3
-6
-12
3
-6
0
1
1
2
1
-3
-5
1
-3
1
(∗)
(−4 × (∗))
(−7 × (∗))
(∗)
(−2 × (∗))
In der untersten Zeile steht nun die falsche Behauptung “0=1”. Wir haben den Gauß-Algorithmus
gestartet unter der Annahme, dass das System lösbar ist. Diese Annahme führt auf einen Widerspruch.
Also ist die Annahme falsch, und es gibt keine Lösung.
Wie geht man im allgemeinen Fall vor?
Unabhängig davon, ob der Fall M = N , M > N oder M < N vorliegt, fängt man zunächst einfach
mit dem Gauß-Algorithmus an. Man muss allerdings darauf achten, dass in der ersten Gleichung, mit
deren Hilfe in der linken Spalte die Nullen erzeugt werden, nicht selbst eine Null in der ersten Position
enthält. Der Algorithmus kann nicht starten, wenn a11 = 0 gilt. Auch beim nächsten Schritt kann
dieses Problem auftreten, wenn in der zweiten Gleichung in der zweiten Position eine Null steht usw.
In einem solchem Fall muss man die Reihenfolge der Gleichungen ändern.
Ansonsten rechnet man los und erzeugt in der ersten Spalte mit Hilfe der ersten Zeile unterhalb dieser
lauter Nullen in der ersten Spalte und macht dann entsprechend mit der zweiten Zeile weiter usw. Auf
diese Weise erzeugt man unten links in der Tabelle Nullen, bis es nicht mehr weiter geht.
Nach dem letzten Schritt kann die Tabelle eine unterschiedliche Gestalt haben. Jetzt diskutieren wir
die Fälle. Im Folgenden bedeutet ein Stern “*” als Tabelleneintrag, dass dort eine Zahl steht, die im
Allgemeinen 6= 0 ist, aber im Einzelfall auch 0 sein darf. Positionen, an denen der Algorithmus Nullen
erzeugt hat, bleiben leer. Eventuell auftretende Zeilen, in denen der Algorithmus nur Nullen erzeugt
hat, werden weg gelassen.
KAPITEL 3. MATRIZEN
133
Fall 1: Es gibt eine eindeutige Lösung
folgender Gestalt:
Das Gleichungssystem ist nach dem letzten Schritt von
∗
∗
∗
···
···
..
.
∗
∗
..
.
∗
∗
∗
..
.
∗
Die Koeffizentenmatrix ist jetzt eine obere Dreiecksmatrix. Wir nehmen an, dass auf der Diagonalen
keine Nullen stehen10 . Die Matrix ist dann regulär. In der letzten Zeile steht jetzt eine Gleichung mit
einer Unbekannten, wofür es eine eindeutige Lösung gibt. Durch Rückwärtseinsetzen der gefundenen
Lösung(en) in die jeweilige(n) Gleichung(en) darüber erhält man die anderen Lösungen für die anderen
Unbekannten.
Fall 2: Es gibt unendlich viele Lösungen Das Gleichungssystem ist nach dem letzten Schritt
von folgender Gestalt:
∗
∗
∗
···
···
..
.
∗
∗
···
···
∗
···
···
∗
∗
..
.
∗
∗
∗
..
.
∗
In der letzten Zeile steht jetzt eine Gleichung mit 2 oder mehr Unbekannten. Dafür gibt es unendlich
viele Lösungen. Bei 2 Unbekannten ersetzt man (z. B.) die letzte Unbekannte durch λ, bei 3 Unbekannten ersetzt man (z. B.) die letzten beiden durch λ und µ usw. Durch Rückwärtseinsetzten bekommt
man dann die Lösungsmenge. Dies ist dann die Gleichung für eine Gerade oder eine Ebene etc.11 im
N -dimensionalen Raum.
Fall 3: Es gibt gar keine Lösung Das Gleichungssystem ist nach dem letzten Schritt von folgender
Gestalt:
∗
∗
∗
···
···
..
.
∗
∗
..
.
∗
∗
∗
..
.
∗
0
∗
∗
..
.
∗
∗
Wenn der Stern in der letzten Zeile 6= 0 ist, liegt ein Widerspruch vor, und es gibt keine Lösung. Wenn
der Stern =0 ist, liegt der zuvor behandelte Fall vor.
Zwei Beispiele für ein lineares homogenes Gleichungssystem
Zur Überleitung zum nächsten Thema betrachten wir zunächst das homogonene lineare Gleichungssystem
Ax = 0
10 Wenn
doch, dann liegt ein weiter unten diskutierter Fall vor.
Begriff im höherdimensionalen Raum: eine Hyperebene
11 allgemeiner
KAPITEL 3. MATRIZEN
134
mit

1 2
A= 4 5
7 8

3
6 .
9
2
5
8
2
-3
-6
2
-3
(∗)
(−4 × (∗))
(−7 × (∗))
Wir wissen schon, dass A singulär ist (det (A) = 0) und dieses Gleichungssystem deshalb unendlich
viele nicht triviale Lösungen besitzt. Der Gauß-Algoritmus ergibt:
1
4
7
1
1
3
6
9
3
-6
-12
3
-6
0
0
0
0
0
0
0
0
0
0
(∗)
(−2 × (∗))
Die letzte Gleichung lautet −3x2 − 6x3 = 0. Wir führen den Parameter α = x3 ein und erhalten
x2 = −2α
sowie x1 − 4α + 3α = 0 bzw.
x1 = α
Die Lösungsmenge ist also gegeben durch folgende Gerade durch den Ursprung:


1
x (α) = α  −2 
1
Als nächstes betrachten wir das homogene Gleichungssystem mit

1 2
A= 2 4
3 6

3
6 .
9
Wir brauchen gar nicht mit dem Gauß-Algorithmus zu starten. Man sieht direkt, dass alle drei Gleichungen äquivalent sind. Wir schreiben die erste hin:
x1 + 2x2 + 3x3 = 0
Nun kann man zwei freie Parameter wählen. Wir setzen α = x3 und β = x2 und erhalten x1 = −2β−3α.
Die Lösungsmenge ist also gegeben durch folgende Ebenengleichung:




−3
−2
x (α, β) = α  0  + β  1 
1
0
KAPITEL 3. MATRIZEN
135
Aufgaben zu Abschnitt 3.3
3.3.1
Aufgabe:
Lösen Sie die folgenden linearen Gleichungssysteme mit dem Gauß-Algorithmus:
a)
3x1 + x2 + 3x3
= 7
2x1 + x2 + 2x3
= 5
3x1 + 3x2 + x3
= 8
b)


 

2 2
x1
10
2 1   x2  =  11 
1 2
x3
10
0
 4
2
c)
5x1 + 5x2 + 4x3 + 5x4
x1 + 4x2 + 2x3 + 4x4
=
=
3x1 + 2x2 + 3x3 + x4
2x1
+ 4x3 + x4
=
=
4
−1
5
4
d)

4
 3

 1
1
e)

1
2
3
1
4
2
1
3
2 1
 2 3
4 4
3.3.2

x1
2

2 
  x2
3   x3
x4
3

0
  −1 

=
  −3 
−1



  
1
x1
1
4   x2  =  1 
5
x3
1
Aufgabe:
Finden Sie mit Hilfe des Gauß-Algorithmus jeweils alle Lösungen der folgenden linearen Gleichungssysteme:
a)
2x1 − 3x2
−5x1 + x2
x1 − 5x2
=
=
=
11
−8
16
b)

 
x1
1
1
2 0
1
 x2 
= 5 
 −3 2
0 1 
 x3 
8 −2 −2 2
0
x4



KAPITEL 3. MATRIZEN
136
c)
x1 + x2 − x3
−2x1 + x3
5x1 − x2 + 2x3
2x1 + 6x2 − 3x3
=
2
=
=
−2
4
=
5
d)


0

 −1 



 −2  x1 + 
−3

3.3.3


3

−3 
x +
1  2 
4


−5

0 
x + 
2  3 
2


0
1
 −5
−1 
x = 
2  4  2
8
2




Aufgabe:
Finden Sie mit Hilfe des Gauß-Algorithmus jeweils alle Lösungen der folgenden homogenen linearen
Gleichungssysteme:
a)
b)
2x1 − x2 + 4x3
−4x1 + 5x2 + 3x3
2x1 − 2x2 + x3
6x1 + 5x3
3.3.4
=
0
=
=
0
0
=
0

1
 0

 3
3
1
1
4
5




2
x
1

−1 
  x2  = 


5
x3
4

0
0 

0 
0
Aufgabe:
Finden Sie mit Hilfe des Gauß-Algorithmus jeweils alle Lösungen der folgenden linearen Gleichungssysteme:
 



−2 1
1
0
x1
 1 −2 1   x2  =  0 
a)
1
1 −2
x3
0








2
3
1
−1
 −4  x1 +  −8  x2 +  −3  x3 =  7 
b)
−2
−5
−2
−6
 



1 2 −3
5
x1
 0 1 −1   x2  =  8 
c)
2 9 11
x3
50

 


−1
x1
2 5 −1
0

 

 −1 8
8
−4 
  x2   −13 

d)
 4 2 −16 10   x3  =  0 
−1
x4
0 1
1
−4
e)
x1 + 2x3 − 5x4
x1 + 4x2 + 4x3 − 5x4
x1 + 2x2 + 3x3 − 5x4
4x1 + 2x2 + 9x3 − 20x4
=
0
=
=
10
5
=
5
KAPITEL 3. MATRIZEN
137
f)






1
0
−4
2
5
1
1
0
1
3
0
4
2
3
4

x1
−1 0
 x2
2
6 


5 −7 
  x3
0 −2   x4
x5
−4 1


 
 
=
 
 
1
42
−21
−8
4






KAPITEL 3. MATRIZEN
138
Praktische Matrixinversion und der Gauß-Jordan Algorithmus (*)
Bei dem im Folgenden beschriebenen Gauß-Jordan12-Algorithmus werden gegenüber dem reinen GaußAlgorithmus am Ende noch weitere Schritte hinzugefügt. Diese zusätzlichen Schritte sind für die numerische Implementation oft vorteilhaft, aber für das Rechnen im Kopf eher eine zusätzliche mögliche
Fehlerquelle. Allerdings ist dieses Verfahren sehr praktisch, um auf einfache Weise die inverse Matrix zu
berechnen. Deswegen soll es hier kurz beschrieben werden. Da sich nur reguläre quadratische Matrizen
invertieren lassen, beschränken wir uns bei der Beschreibung des Algorithmus auf solche.
Der Gauß-Jordan-Algorithmus arbeitet folgendermaßen: Nachdem die Koeffizientenmatrix mit dem
Gauß-Algorithmus auf die Dreiecksform gebracht worden ist, werden durch weitere elementare Zeilenumformungen oberhalb der Diagonalen Nullen erzeugt. Damit lässt sich erreichen, dass links die
Einheitsmatrix steht. Der Lösungsvektor steht dann explizit auf der rechten Seite. Das RückwärtsEinsetzen entfällt also. Deshalb ist der Algorithmus besonders elegant für die Implementation als
Computerprogramm.
An dem Eingangsbeispiel für das Gaußsche Eliminationsverfahren soll der Algorithmus erläutert werden. Nach dem letzten Schritt hat sich dort folgendes Gleichungssystem ergeben:
x1
−x2
2x2
+x3
−3x3
−3x3
−x4
−x4
+5x4
x4
=
=
=
=
2
−1
−1
1
Wir verwenden die Tabellenform und führen die folgenden Schritte durch:
1
-1
2
1
-3
-3
1
-1
2
1
-3
-3
1
-1
2
1
-3
1
1
-1
2
0
0
1
1
-1
1
0
0
1
1
0
1
0
0
1
-1
-1
5
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
2
-1
-1
1
3
0
-6
1
3
0
2
1
1
6
2
1
1
3
2
1
4
3
2
1
+1 × (∗)
+1 × (∗)
−5 × (∗)
(∗)
× (−1/3)
−1 × (∗)
+3 × (∗)
(∗)
× (1/2)
+1 × (∗)
(∗)
12 Wilhelm Jordan (1842 – 1899) war ein deutscher Geodät und Mathematiker. Carl-Friedrich Gauß wurde bereits
erwähnt.
KAPITEL 3. MATRIZEN
139
Links unten steht die Einheitsmatrix.
ben:

1
 0

 0
0
Der Lösungsvektor lautet also
Mit dem letzten Schritt hat sich folgende Matrixgleichung erge
  
x1
0 0 0
4

  
1 0 0 
  x2  =  3 
0 1 0   x3   2 
x4
0 0 1
1

 
x1
4
 x2   3

 
 x3  =  2
x4
1


.

Allgemein gilt: Nach dem letzten Schritt des Gauß-Jordan-Algorithmus steht links die Einheitmatrix IN und rechts der Lösungsvektor x.
Wir notieren folgende Tatsache: Es seien




e1 = 


1
0
0
..
.
0




,






e2 = 


0
1
0
..
.
0




,


...
die Einheitsvektoren der kartesischen Koordinaten. Wir betrachten die N Gleichungssysteme
Axn = en , (n = 1, ..., N ) .
Die Lösung
xn = A−1 en
des Gleichungssystems Nummer n ist die n-te Spalte der inversen Matrix A−1 . Wenn man also den
Gauß-Jordan-Algorithmus mit dem Inhomogenitätsvektor b = en startet, steht im letzten Schritt auf
der linken Seite die Einheitsmatrix und auf der rechten Seite die n-te Spalte der inversen Matrix A−1 .
Man führt das Verfahren für alle Einheitsvektoren e1 , ..., eN simultan durch, indem man am Anfang
auf die rechte Seite die Einheitsmatrix
IN = e1 e2 · · · eN
schreibt und alle elementaren Umformungen auf der rechten Seite nicht nur für eine Spalte, sondern
für die ganze Matrix durchführt. Am Ende steht links die Einheitsmatrix und rechts die dazu inverse
Matrix A−1 .
Beispiel:
Wir betrachten die Matrix

1
A= 2
1

0 1
1 3 
1 1
und wenden den Gauß-Jordan-Algorithmus in Tabellenform an:
KAPITEL 3. MATRIZEN
140
1
2
1
1
0
0
1
0
0
1
0
0
1
0
0
0
1
1
0
1
1
0
1
0
0
1
0
0
1
0
1
3
1
1
1
0
1
1
-1
1
1
1
0
0
1
1
0
0
1
-2
-1
1
-2
1
1
-2
-1
2
-1
-1
0
1
0
0
1
0
0
1
-1
0
1
1
-1
0
1
0
0
1
0
0
1
0
0
1
0
0
-1
1
1
-1
(∗)
−2 × (∗)
−1 × (∗)
(∗)
−1 × (∗)
×(−1)
−1 × (∗)
−1 × (∗)
(∗)
Die inverse Matrix findet man jetzt rechts unten in der Tabelle. Sie lautet:


2 −1 1
1 
A−1 =  −1 0
−1 1 −1
KAPITEL 3. MATRIZEN
3.4
141
Eigenwerte und Eigenvektoren
Die Formulierung des Eigenwertproblems
Es sei eine N × N -Matrix A gegeben. Multipliziert man diese Matrix mit einem Vektor x ∈ RN , so
ergibt das Produkt einen neuen Vektor x′ = Ax ∈ RN 13 . In der Regel zeigt x′ in eine andere Richtung
als x. Es gibt aber (in der Regel) einige spezielle Vektoren x 6= 0, auf die diese Abbildung genauso
wirkt wie die Multiplikation mit einem Skalar λ. Für diese speziellen Vektoren x gilt also:
Ax = λx
Einen solchen Vektor x (x 6= 0) nennt man Eigenvektor (engl. eigenvector ) der Matrix A und den
dazu gehörigen Skalar14 λ den Eigenwert (engl. eigenvalue). Diese obige Gleichung nennt man Eigenwertgleichung. Man spricht auch von dem Eigenwertproblem, d. h. wir haben es mit der Problemstellung zu tun, die Eigenwerte und Eigenvektoren von A zu finden. Jedes Vielfache eines Eigenvektors
erfüllt wieder die Eigenwertgleichung zum selben Eigenwert. Er legt damit eine Eigenrichtung fest.
Ein Beispiel für Eigenvektoren einer Matrix: Wir betrachten die 2 × 2- Matrix
1 2
A=
.
2 1
Die zugehörige zweidimensionale lineare Abbildung ist in Abbildung 3.10 veranschaulicht. Wir betrachten als Urbild die Menge von Punkten x, die das blaue Viereck ergeben. Das Bild dieser Menge unter
der linearen Abbildung A sind die Punkte
x′ = Ax .
Dies ist das rote Viereck. Man erkennt aus der Zeichnung, dass es zwei Richtungen gibt, die sich unter
der Abbildung nicht ändern: Dies sind gerade die Diagonalen. Damit kennt man die Richtungen der
Eigenvektoren. Die Punkte auf der ersten Diagonalen (von links unten nach rechts oben) werden um
den Faktor 3 gestreckt. Die Punkte auf der anderen Diagonalen (von links oben nach rechts unten)
werden am Ursprung gespiegelt. Wir haben damit die Lösung des Eigenwertproblems aus der Zeichnung
abgelesen. Wir prüfen das jetzt rechnerisch.
Wie man direkt nachrechnet, gilt:
1
2
2
1
1
1
=3
x1 =
1
1
Das heißt: Der Vektor
1
1
ist ein Eigenvektor von A zu dem Eigenwert λ1 = 3. Ebenfalls durch Nachrechnen überzeugt man sich,
dass
1 2
1
1
=−
2 1
−1
−1
gilt. Daher ist
x2 =
1
−1
A
Matrix beschreibt also eine lineare Abbildung RN −→ RN .
Skalar kann im Allgemeinen auch bei einer reellen Matrix durchaus komplex sein. Allerdings werden wir nur
Beispiele betrachten, bei denen λ reell ist.
13 Die
14 Dieser
KAPITEL 3. MATRIZEN
142
3
2
Urbild
Bild
Eigenrichtungen
y−Achse
1
0
−1
−2
−3
−3
−2
−1
0
x−Achse
1
2
3
Abbildung 3.10: Geometrische Veranschaulichung des Eigenwertproblems an Hand der durch die Matrix
A definierten linearen Abbildung.
ein Eigenvektor von A zu dem Eigenwert λ2 = −1.
Zu jedem Eigenvektor x gibt es unendlich viele andere, die sich nur durch die Multiplikation mit einem
Skalar unterscheiden. Wenn x die Eigenwertgleichung erfüllt, so tut dies natürlich auch σx (σ ∈ R).
Bei dem obigen Beispiel hätte man auch ebenso gut
2
−1
x1 =
und x2 =
2
1
als Eigenvektoren zu den selben Eigenwerten wählen können. Statt von Eigenvektoren zu sprechen, ist
es sicher präziser, von Eigenrichtungen zu sprechen. Man tut dies aber meist nicht. Man bezeichnet
vielmehr die jeweiligen Mengen kollinearer Vektoren (=Geraden durch den Ursprung)
1
x1 (α) = α
, mit α ∈ R
1
bzw.
x2 (β) = β
1
−1
,
mit β ∈ R
als Eigenvektor zu λ1 = 3 bzw. als Eigenvektor zu λ2 = −1.
Merke: Mit einem Eigenvektor zu einem Eigenwert meint man eine Eigenrichtung: Das heißt eine
Menge von kollinearen Vektoren, die man als Gerade durch den Ursprung interpretieren kann.
Die Lösung des Eigenwertproblems
Um das Eigenwertproblem zu lösen, fügen wir in der Eigenwertgleichung die Einheitsmatrix I auf der
rechten Seite ein
Ax = λIx
KAPITEL 3. MATRIZEN
143
und bringen dann alles auf die linke Seite:
(A − λI) x = 0
Dies ist ein homogenes lineares Gleichungssystem mit quadratischer Koeffizientenmatrix A − λI. Die
triviale Lösung x = 0 interessiert uns nicht und wird nach Definition nicht als Eigenvektor angesehen.
Damit es nicht-triviale Lösungen gibt, muss die Koeffizientenmatrix singulär sein. Es muss also gelten:
det (A − λI) = 0
Diese Gleichung nennt man charakteristische Gleichung.
Lösung des Eigenwertproblems für ein Beispiel
Wir erläutern jetzt die systematische Lösung des Eigenwertproblems an Hand des obigen Beispiels mit
der Matrix
1 2
A=
.
2 1
Wir schreiben die Eigenwertgleichung in der Form
(A − λI) x = 0
hin:
1−λ
2
2
1−λ
x1
x2
=0
Bestimmung der Eigenwerte: Die charakteristische Gleichung lautet:
1−λ
2 =0
2
1−λ Das ist eine quadratische Gleichung im λ:
λ2 − 2λ − 3 = 0
Sie besitzt die Lösungen λ1 = 3 und λ2 = −1. Dies sind gerade die Eigenwerte.
Bestimmung der Eigenvektoren: Um die Eigenvektoren zu finden, setzen wir zunächst den ersten
Eigenwert λ1 = 3 für λ in die Eigenwertgleichung
1−λ
2
x1
=0
2
1−λ
x2
ein und erhalten das Gleichungssystem
−2 2
2 −2
x1
x2
= 0.
Diese Koeffizientenmatrix ist offenbar singulär (wie es sein muss), und es kann deshalb keine eindeutige
Lösung geben15 . Das Gleichungssystem führt auf die Bedingung x1 = x2 . Die Lösungsmenge ist also
1
x1 (α) = α
,
mit α ∈ R .
1
15 Falls
man bei einer konkreten Aufgabe doch eine eindeutige Lösung erhält, hat man sich mit Sicherheit verrechnet!
KAPITEL 3. MATRIZEN
144
Das ist der erste Eigenvektor. Um den zweiten Eigenvektor zu bestimmen, wird der zweite Eigenwert
λ2 = −1 in die Eigenwertgleichung eingesetzt. Dies führt auf das Gleichungssystem
2 2
x1
= 0.
2 2
x2
Diese Koeffizientenmatrix ist offenbar ebenfalls singulär (wie es sein muss), und man erhält die Bedingung x1 = −x2 . Die Lösungsmenge ist also
−1
x2 (β) = β
,
mit β ∈ R .
1
Das ist der zweite Eigenvektor.
Lösung des Eigenwertproblems für den allgemeinen Fall
Bestimmung der Eigenwerte: Entwickelt man im allgemeinen Fall die Determinante der charakteristischen Gleichung
det (A − λI) = 0
nach dem oben beschriebenen Laplaceschen Entwicklungssatz, so ergibt sich auf der linken Seite ein
Polynom N -ter Ordnung in λ:
pN λN + pN −1 λN −1 + ...p1 λ + p0 λ = 0
Das Polynom
P (λ) = pN λN + pN −1 λN −1 + ...p1 λ + p0 λ
mit pi ∈ R nennt man das charakteristische Polynom. Es hat (im Komplexen) N Nullstellen
λ1 , ..., λN , wobei mehrfache Nullstellen entsprechend ihrer Vielfachheit gezählt werden. Diese Nullstellen sind die Lösungen der charakteristischen Gleichung und damit die Eigenwerte. Bei einer m-fachen
Nullstelle spricht man auch von m-facher (algebraischer) Vielfachheit des Eigenwertes.
Bestimmung der Eigenvektoren: Sind die Eigenwerte berechnet, so setzt man jeweils jeden einzelnen Wert λn in die Eigenwertgleichung
(A − λn I) x = 0
ein und löst dieses Gleichungssystem. Wie schon erwähnt, ist keine eindeutige Lösung zu erwarten.
Das heißt, die Eigenvektoren sind von der Gestalt
x (α) = αv ,
wobei α ein freier Parameter ist und v ein fester Vektor, der eine Richtung charakterisiert. Es kann bis
zu N verschiedene solche Lösungen geben. Das ist aber nur der einfachste Fall. An Stelle einer solchen
Geradengleichung können aber auch Lösungen z. B. der Gestalt
x (α, β) = αu + βv
vorkommen. Hierbei sind α und β freie Parameter und u und v feste Richtungsvektoren. Dies ist
eine Ebenengleichung im RN . Der Lösungsraum (oder auch Eigenraum) zu diesem Eigenwert ist
dann zweidimensional. Dieser Fall kann bei zweifachen Eigenwerten auftreten. Allgemein gilt: Bei mfacher (algebraischer) Viefachheit können Lösungsräume der Dimension kleiner oder gleich m auftreten.
Diese Lösungsräume sind Hyperebenen durch den Ursprung, wie sie uns auch im vorigen Abschnitt
begegnet sind. Wir beschränken uns in Beispielen und Aufgaben aber auf 2 × 2- und 3 × 3-Matrizen.
Die Lösungsräume können dann nur Geraden und Ebenen oder im Extremfall auch der ganze Raum
sein, was man sich anschaulich noch ganz gut vorstellen kann.
KAPITEL 3. MATRIZEN
145
Wichtige Eigenschaften von Eigenwerten und Eigenvektoren
Wir nennen (ohne Beweis) einige Eigenschaften von Eigenwerten und Eigenvektoren einer N × N Matrix A. Sie sind u. a. hilfreich, um die Richtigkeit der Rechnung zu überprüfen.
1. Die Summe der Eigenwerte ist gleich der Spur der Matrix. Mehrfache Nullstellen des charakteristischen Polynoms sind in diesem Fall mehrfach zu zählen.
tr (A) = λ1 + λ2 + ... + λN
2. Das Produkt der Eigenwerte ist gleich der Determinante der Matrix. Mehrfache Nullstellen des
charakteristischen Polynoms sind in diesem Fall mehrfach zu zählen.
det (A) = λ1 λ2 · · · λN
3. Für eine symmetrische Matrix A gilt:
(a) Alle Eigenwerte sind reell.
(b) Die Eigenvektoren xi und xk zu verschiedenen Eigenwerten λi 6= λk sind untereinander
orthogonal:
xi · xk = 0
(c) Alle Eigenvektoren zusammen spannen den ganzen RN auf, d.h.
rank ([x1 , ..., xN ]) = N .
4. Wenn man die Matrix A mit einem Skalar σ multipliziert (A 7→ σA), so ändern sich die Eigenwerte um den selben Faktor (λ 7→ σλ).
Anmerkung:
Bei einer 2 × 2-Matrix
A=
a11
a21
a12
a22
sind die Eigenwerte λ1 und λ2 durch die ersten beiden Bedingungen
λ1 + λ2 = a11 + a22 und λ1 λ2 = a11 a22 − a12 a21
schon eindeutig festgelegt. Dadurch wird deren Berechnung manchmal etwas einfacher, als wenn man
das charakteristische Polynom hinschreibt und dann die entsprechende quadratische Gleichung löst.
Dieses Verfahren entspricht der Anwendung des Wurzelsatzes von Vieta.
Der Wurzelsatz von Vieta: Zur Erinnerung an die Schulmathematik: Für eine quadratische Gleichung
λ2 + pλ + q = 0
im λ mit den Nullstellen λ1 und λ2 gilt nach Vieta16 :
λ1 + λ2 = −p und λ1 λ2 = q
Wir wenden dies für eine 2 × 2-Matrix an. Die charakteristische Gleichung lautet:
λ2 − (a11 + a22 ) λ + a11 a22 − a12 a21 = 0
Hier ist also −p die Spur und q die Determinante von A.
16 Zum
Beweis: Ausmultiplizieren von (λ − λ1 ) (λ − λ2 ) = 0 und Koeffizientenvergleich.
KAPITEL 3. MATRIZEN
146
Beispiele
Um besser zu verstehen, was für Fälle auftreten können und wie man damit umgeht, sollen nun Beispiele
gerechnet werden.
1. Beispiel: Ein 2-dimensionales Eigenwertproblem
Wir betrachten das Eigenwertproblem für die Matrix
1 1
A=
1 −1
Das Eigenwertproblem lautet also
Die charakteristische Gleichung
führt auf die quadratische Gleichung
1−λ
1
1
−1 − λ
1−λ
1
1
−1 − λ
λ2 = 2 .
Deren Lösungen
λ1 =
x1
x2
=0
=0
√
√
2 und λ2 = − 2
sind die Eigenwerte. Zur Probe überprüfen wir die Bedingungen λ1 λ2 = det (A) = −2 und λ1 + λ2 =
tr (A) = 0. Mit diesen Bedingungen hätte man die Eigenwerte auch direkt und einfacher bestimmen
können.
Zur Berechnung der Eigenvektoren werden diese beiden Eigenwerte nun in die Eigenwertgleichung
1−λ
1
x1
=0
x2
1
−1 − λ
eingesetzt.
√
2. Dies ergibt das homogene lineare Gleichungssystem
√ 1 − 2 x1
√ +x
2 = 0
x1 − 1 + 2 x2 = 0
√ Durch Multiplikation der 2. Gleichung mit 1 − 2 kann man überprüfen, dass diese Gleichungen äquivalent sind. Wir setzen x2 = α und erhalten als Lösungsmenge:
√ 1+ 2
x1 (α) = α
1
√
2. λ1 = − 2. Dies ergibt das homogene lineare Gleichungssystem
√ 1 + 2 x1
√ +x
2 = 0
x1 + −1 + 2 x2 = 0
√ Durch Multiplikation der 2. Gleichung mit 1 + 2 kann man überprüfen, dass diese Gleichungen äquivalent sind. Wir setzen x2 = β und erhalten als Lösungsmenge:
√ 1− 2
x2 (β) = β
1
1. λ1 =
Zur Probe überprüft man, dass x1 und x2 zu einander orthogonal sind. Dies muss so sein, weil A
symmetrisch ist.
KAPITEL 3. MATRIZEN
147
2. Beispiel: Ein 3-dimensionales Eigenwertproblem mit drei verschiedenen Eigenwerten
Wir betrachten das Eigenwertproblem für die Matrix

1 −1
A =  −1 1
1
1
Das Eigenwertproblem lautet also

1−λ
−1
 −1 1 − λ
1
1
Die charakteristische Gleichung
1−λ
−1
1

1
1 
−1


1
x1
  x2  = 0
1
−1 − λ
x3
−1
1
1−λ
1
1
−1 − λ
=0
führt auf ein Polynom dritten Grades in λ, dessen Nullstellen ermittelt werden müssen. In solchen
Fällen kann man meist zunächst eine erste Nullstelle durch Raten finden. Bei diesem Beispiel ist es
einfacher. Die Entwicklung der Determinante führt auf die Gleichung
2
− (1 − λ) (1 + λ) − 3 (1 − λ) = 0 .
Der Faktor (1 − λ) lässt sich ausklammern, d.h. die erste Nullstelle ist gegeben durch λ1 = 1. Um
weitere Nullstellen zu finden, dividiert man das Polynom durch den Faktor (1 − λ) und erhält die
quadratische Gleichung
− (1 − λ) (1 + λ) − 3 = 0 .
Diese besitzt die beiden Lösungen λ2 = +2 und λ3 = −2. Zur Probe überprüfen wir die Bedingungen
λ1 λ2 λ3 = det (A) = −4 und λ1 + λ2 + λ3 = tr (A) = 1.
Zur Berechnung der Eigenvektoren werden die drei Eigenwerte λ1 , λ2 , λ3 nun jeweils in die Eigenwertgleichung



1−λ
−1
1
x1
 −1 1 − λ
  x2  = 0
1
1
1
−1 − λ
x3
eingesetzt.
1. λ1 = 1. Dies ergibt das folgende homogene lineare Gleichungssystem:
−x1
x1
−x2
+x2
+x3
+x3
−2x3
=
=
=
0
0
0
Man erkennt, dass die Gleichungen voneinander linear abhängig sind: Wenn man die ersten beiden
Gleichungen addiert, erhält man die dritte Gleichung mit umgekehrten Vorzeichen. Wir setzen
x3 = α und erhalten daraus x2 = α und x1 = α. Der Eigenvektor lautet also:
 
1
x1 (α) = α  1 
1
KAPITEL 3. MATRIZEN
148
2. λ2 = 2. Dies ergibt das folgende homogene lineare Gleichungssystem:
−x1
−x1
x1
−x2
−x2
+x2
+x3
+x3
−3x3
=
=
=
0
0
0
Die beiden ersten Gleichungen sind identisch. Addiert man die erste Gleichung zu der letzten, so
folgt −2x3 = 0. Also muss x3 = 0 sein. Es bleibt dann eine einzige Gleichung −x1 − x2 = 0. Wir
setzen x2 = β und erhalten x1 = −β. Der Eigenvektor lautet also:


−1
x2 (β) = β  1 
0
3. λ2 = −2. Dies ergibt das folgende homogene lineare Gleichungssystem:
3x1
−x1
x1
−x2
+3x2
+x2
+x3
+x3
+x3
=
=
=
0
0
0
Wir wenden das Gaußsche Eliminationsverfahren an, vertauschen aber zuvor die erste und die
dritte Zeile:
1
-1
3
1
1
1
3
-1
1
4
-4
1
4
1
1
1
1
2
-2
1
2
0
0
0
0
0
0
0
0
0
0
(∗)
(+1 × (∗))
(−3 × (∗))
(∗)
(+1 × (∗))
Wir setzen x2 = γ und erhalten x3 = −2γ und x1 = γ. Der Eigenvektor lautet also:


1
x3 (γ) = γ  1 
−2
Da die Matrix A symmetrisch ist, müssen die drei Eigenvektoren zu den drei verschiedenen Eigenwerten
orthogonal zu einander sein. Zur Probe prüft man nach, dass dies tatsächlich der Fall ist.
3. Beispiel: Ein 3-dimensionales Eigenwertproblem mit zweifachem Eigenwert und zugehörigem zweidimensionalen Lösungsraum
Wir betrachten das Eigenwertproblem für die Matrix


3 1
1
A =  1 3 −1 
1 −1 3
Das Eigenwertproblem lautet also

3−λ
 1
1


1
1
x1
3−λ
−1   x2  = 0
−1
3−λ
x3
KAPITEL 3. MATRIZEN
Die charakteristische Gleichung
führt auf die Bedingung
149
3−λ
1
1
3
−
λ
1
−1
1
−1
3−λ
3
=0
(3 − λ) − 3 (3 − λ) − 2 = 0
bzw.
λ3 − 9λ2 + 24λ − 16 = 0 .
Die erste Nullstelle λ1 = 1 findete man durch Raten. Polynomdivision mit dem Linearfaktor λ − 1
ergibt:
λ3 − 9λ2 + 24λ − 16 : (λ − 1) = λ2 − 8λ + 16
Die quadratische Gleichung besitzt eine doppelte Nullstelle bei λ2,3 = 4.
Zur Berechnung der Eigenvektoren werden die drei Eigenwerte λ1 , λ2 , λ3 nun jeweils in die Eigenwertgleichung



3−λ
1
1
x1
 1
3−λ
−1   x2  = 0
1
−1
3−λ
x3
eingesetzt.
1. λ1 = 1. Dies ergibt das folgende homogene lineare Gleichungssystem:
2x1
x1
x1
+x2
+2x2
−x2
+x3
−x3
+2x3
= 0
= 0
= 0
Wir wenden das Gaußsche Eliminationsverfahren an, vertauschen aber zuvor die erste und die
dritte Zeile:
1
1
2
1
1
-1
2
1
-1
3
3
-1
3
2
-1
1
2
-3
-3
2
-3
0
0
0
0
0
0
0
0
0
0
(∗)
(−1 × (∗))
(−2 × (∗))
(∗)
(−1 × (∗))
Wir setzen x3 = α und erhalten x2 = α und x1 = −α. Der Eigenvektor lautet also:


−1
x1 (α) = α  1 
1
2. λ2 = λ3 = 4. Dies ergibt das folgende homogene lineare Gleichungssystem:
−x1
x1
x1
+x2
−x2
−x2
+x3
−x3
−x3
= 0
= 0
= 0
KAPITEL 3. MATRIZEN
150
Die drei Gleichungen sind identisch. Durch x1 − x2 − x3 = 0 ist eine Ebene durch den Ursprung
in Koordinatenform gegeben. Die vektorielle Form erhält man, indem man (z. B.) x1 = β und
x2 = γ setzt. Daraus ergibt sich x3 = β − γ und somit die Ebenengleichung




1
0
x2,3 (β, γ) = β  0  + γ  1 
1
−1
Offenbar ist diese Ebene orthogonal zu dem Eigenvektor x1 . Die beiden Richtungsvektoren
 


1
0
 0  und  1 
1
−1
sind linear unabhängig von einander, aber nicht orthogonal. Manchmal ist Orthogonalität erwünscht. Dies lässt sich in diesem Beispiel dadurch erreichen, dass man beiden Vektoren durch
ihre Summen bzw. Differenzen ersetzt:
    


   

1
1
0
1
1
0
 1  =  0  +  1  und  −1  =  0  −  1 
0
1
−1
2
1
−1
Das funktioniert deshalb, weil die Vektoren gleich lang sind und daher eine Raute aufspannen.
Und die Diagonalen einer Raute stehen senkrecht auf einander. Man erhält so die Ebenengleichung:
 


1
1
x2,3 (σ, µ) = σ  1  + µ  −1 
0
2
Weil der Eigenraum die Dimension 2 hat, sagt man: Der Eigenwert λ = 4 ist 2-fach entartet. Nicht
immer liegt bei einer doppelten Nullstelle Entartung vor. Dies zeigt das folgende Beispiel.
4. Beispiel: Ein 3-dimensionales Eigenwertproblem mit zweifachem Eigenwert und zugehörigem eindimensionalen Lösungsraum
Wir betrachten das Eigenwertproblem für die Matrix


2 1 1
A= 0 2 1 
0 0 1
Man findet die Eigenwerte λ1,2 = 2 und λ3 = 1. Der Eigenraum zu λ1,2 = 2 ist eindimensional mit
Richtung
 
1
 0 
0
KAPITEL 3. MATRIZEN
151
Diagonalisierung symmetrischer Matrizen (*)
Eine der häufigsten Anwendungen der Eigenwertberechnung ist die Diagonalisierung von Matrizen.
Man braucht dies zum Beispiel, um die Hauptträgheitsachsen eines Körpers zu finden. Anschaulich
passiert dabei Folgendes: Man dreht das Koordinatensystem so, dass der Körper bezüglich der gedrehten Koordinatenachsen ausgewuchtet ist.
Wir betrachten im Folgenden eine symmetrische N × N -Matrix A. Es gilt der folgende
Satz:
Für eine symmetrische N × N Matrix A gilt:
1. Die Eigenwerte λi sind alle reell. Es gibt genau N Eigenwerte, wobei diese entsprechend ihrer
Vielfachheit gezählt sind.
2. Die Eigenvektoren vi , vk zu unterschiedlichen Eigenwerten λi , λk sind zueinander orthogonal:
vi · vk = 0
Falls ein Eigenwert mehrfach vorkommt, kann man die entsprechenden Eigenvektoren so wählen,
dass sie zu einander orthogonal sind.
3. Die Eigenräume von A spannen den ganzen RN auf. Das heißt: Jeder Vektor x ∈ RN lässt sich
als Linearkombination von Eigenvektoren von A schreiben.
4. Es gibt eine orthogonale Matrix V mit der Eigenschaft
AV = VΛ, d.h. VT AV = Λ
wobei Λ eine N × N Diagonalmatrix ist, auf deren Diagonale die Eigenwerte von A stehen (ggf.
mit ihrer entsprechenden Vielfachheit):


λ1 · · · 0

.. 
Λ =  ... . . .
. 
0
· · · λN
Die Spalten der Matrix V sind die entsprechenden orthonormalen Eigenvektoren zu diesen Eigenwerten:
V = [v̂1 , ..., v̂N ]
Zur Interpretation: Am Ende des Abschnitts 3.1 haben wir passive Drehungen erklärt und am
Begriff des Trägheitstensors erläutert. Wir denken uns deshalb A als Trägheitstensor. Der Satz sagt
aus, dass man eine orthogonale Matrix V finden kann, so dass der gedrehte Tensor VT AV eine Diagonalmatrix ist, auf deren Diagonalen die Eigenwerte von A stehen:


λ1 0
0
VT AV = Λ =  0 λ2 0 
0
0 λ3
Die orthogonale Matrix V besteht gerade aus den normierten Eigenvektoren:
V = v̂1 v̂2 v̂3 .
KAPITEL 3. MATRIZEN
152
Wir greifen auf das obige Beispiel 3 mit der symmetrischen Matrix


3 1
1
A =  1 3 −1  mit λ1 = 1 , λ2,3 = 4
1 −1 3
zurück und denken uns A als Trägheitstensor. Die Elemente außerhalb der Diagonalen sind die Deviationsmomente. Als Eigenvektoren hatten wir gefunden:


 


−1
1
1
x1 (α) = α  1  und x2,3 (σ, µ) = σ  1  + µ  −1 
1
0
2
Die orthogonalen und normierten Eigenvektoren lauten:






−1
1
1
1
1
1 
1  , v̂2 = √  1  , v̂3 = √  −1 
v̂1 = √
3
2
6
1
0
2
Daraus konstruiert man die orthogonale Matrix (Drehung oder Drehspiegelung):
V=
Man rechnet nach:
v̂1

1
VT AV =  0
0
v̂2
v̂3
.

0 0
4 0  = Λ.
0 4
Die passive Drehung (bzw. Drehspiegelung) ist gegeben durch:
e′m = v̂m = Vem , m = 1, 2, 3
Bezüglich der gedrehten Achsen e′m ist der Körper ausgewuchtet. Die Trägheitsmomente bezüglich
der gedrehten Achsen sind die Elemente der Matrix Λ = VT AV. Diese ist nun diagonal, und auf der
Diagonalen stehen die Eigenwerte. Dies sind die Hauptträgheitsmomente, d.h. die Trägheitsmomente in
Richtung der Hauptachsen, deren Richtungen gegeben sind duch v̂1 , v̂2 , v̂3 . Dabei ist λ1 = 1 das
Trägheitsmoment bezüglich der (neuen) x-Achse, und λ2 = λ3 = 4 die Trägheitsmomente bezüglich
der (neuen) y- und z−Achse. Die beiden letzteren sind gleich. Das bedeutet, dass man den Körper
in der y − z−Ebene drehen kann, ohne dass sich etwas ändert. Dies ist (z.B.) bei einem Körper mit
Zylindersymmetrie der Fall.
Übrigens ist die obige Matrix V = v̂1 v̂2 v̂3 wegen det (V) = −1 tatsächlich eine Drehspiegelung
und nicht nur eine einfache Drehung. Bei einer reinen Drehung hat die Determinante den Wert +1.
Das Vorzeichen der Determinante kann man umkehren, indem man zwei Spalten der Matrix vertauscht
(z.B. v̂2 und v̂3 ) oder bei einer der Spalten das Vorzeichen umkehrt.
KAPITEL 3. MATRIZEN
153
Aufgaben zu Abschnitt 3.4
3.4.1
Aufgabe
Finden Sie alle Eigenwerte und Eigenvektoren der folgenden Matrizen und prüfen Sie die Richtigkeit
Ihrer Berechnung mit Hilfe von Spur und Determinante.
1 −1
1 2
1 −1
a) A =
b) A =
c) A =
0 2
3 0
−2 0


2 1 2
1 0
d) A =
e) A =  0 3 4 
0 −1
0 2 5
3.4.2
Aufgabe
Finden Sie alle Eigenwerte und Eigenvektoren der folgenden Matrizen und prüfen
Ihrer Berechnung mit Hilfe von Spur und Determinante.
0 1
1 2
a) A =
b) A =
c) A =
1 0
2 −2

1
a b
1 −2
e) A = 
d) A =
(a, b ∈ R)
e) A =
− 21
1
b a
3.4.3
Sie die Richtigkeit
−2 −4
−2 4

2 0 −2
0 3 0 
−2 0 5
Aufgabe
Finden Sie alle Eigenwerte und Eigenvektoren der folgenden Matrix und prüfen Sie die Richtigkeit
Ihrer Berechnung mit Hilfe von Spur und Determinante sowie eines weiteren Kriteriums, das für symmetrische Matrizen anwendbar ist.

7 −2
A =  −2 6
0 −2

0
−2 
5
Hinweis: Bei geschickter Rechnung ist kein Raten von Nullstellen erforderlich.
KAPITEL 3. MATRIZEN
3.5
154
Komplexe Matrizen (*)
Grundbegriffe
Wir betrachten Matrizen mit komplexen

a11
 a21

A= .
 ..
aM1
Elementen, d.h. Matrizen

a12 · · · a1N
a22 · · · a2N 

..  mit amn ∈ C.
..
..
.
. 
.
aM2 · · · aMN
Solche Matrizen werden in verschiedenen Anwendungen benötigt: Die Zweitortheorie in der Elektrotechnik verwendet komplexe 2 × 2 Matrizen. In den etwas fortgeschrittenen Gebieten der digitalen
Übertragungstechnik (insbesondere bei Mehrfachantennensystemen) sowie in vielen Gebieten der digitalen Signalverarbeitung und der Schwingungslehre werden komplexe Matizen benötigt.
Für komplexe Matrizen benötigt man den Begriff der hermitesch konjugierten Matrix, die in gewisser
Hinsicht den Begriff der transponierten Matrix, den wir von reellen Matrizen kennen, verallgemeinert.
Die Addition und Multiplikation komplexer Matrizen ist genauso erklärt wie bei reellen.
Es werden nun ein paar neue Begriffe eingeführt.
Hermitesche Matrizen
Die zu A hermitesch konjugierte Matrix17 AH erhält man, indem man Zeilen mit Spalten vertauscht. Deren Elemente sind also gegeben durch:
H
∗
A mn = ([A]nm )
Aus der M × N - Matrix



A=

ergibt sich dadurch die N × M - Matrix



AH = 

a11
a21
..
.
a12
a22
..
.
···
···
..
.
a1N
a2N
..
.
aM1
aM2
· · · aMN
a∗11
a∗12
..
.
a∗21
a∗22
..
.
···
···
..
.
a∗N 1
a∗N 2
· · · a∗N M
a∗1M
a∗2M
..
.



.




.

Die hermitesch konjugierte Matrix AH wird oft auch mit A† oder A∗ bezeichnet. Manchmal nennt
man sie auch adjungierte Matrix.
Eine Matrix A heißt hermitesch, falls
A = AH
gilt. Für die Elemente amn hermitescher Matrizen gilt also:
amn = a∗nm
17 Nach
dem französischen Mathematiker Charles Hermite (1822 – 1901)
KAPITEL 3. MATRIZEN
155
Für die Diagonalelemente hermitescher Matrizen gilt: ann = a∗nn ⇒ Im {ann } = 0.
Matrizen mit der Eigenschaft
A = −AH
nennt man schiefhermitesch. Für deren Elemente gilt:
amn = −anm
Für die Diagonalelemente schiefhermitescher Matrizen gilt: ann = −a∗nn ⇒ Re {ann } = 0.
Komplexe Vektoren und deren Skalarprodukt
Als Spezialfall von Matrizen mit komplexen Elementen kann man Spaltenvektoren und Zeilenvektoren mit komplexen Elementen betrachten. Bezüglich der Addition und der Multiplikation mit einem
Skalar gelten die bekannten Regeln. Man kann Vektoren und Matrizen passender Dimension nach den
bekannten Regeln multiplizieren, wenn die Dimensionen passen. Insbesondere kann man einen Zeilenvektor mit einem Spaltenvektor miteinander multiplizieren, sofern beide die gleiche Länge besitzen.
Bei reellen Vektoren entspricht dies gerade dem Skalarprodukt. Bei komplexen Vektoren muss man die
Definition des Skalarproduktes etwas modifizieren.
Es seien



a=

a1
a2
..
.
aN






 und b = 


b1
b2
..
.
bN



 , ai , b i ∈ C

zwei komplexe N -dimensionale Spaltenvektoren. Wir schreiben dafür a, b ∈ CN . Ihr Skalarprodukt
ha | bi ist definiert als
N
X
a∗i bi .
ha | bi = aH b =
i=1
Der Betrag eines komplexen Vektors a ist definiert als
p
kak = ha | ai .
Es gilt also
2
kak = ha | ai =
N
X
i=1
a∗i ai =
N
X
i=1
2
|ai | .
Wichtig ist, dass diese Definition kompatibel ist zu den jeweiligen Definitionen des Betrags eines reellen
Vektors und des Betrags einer komplexen Zahl: Für N = 1 gilt kak = |a1 |. Das passt deshalb, weil
beim Skalarprodukt auf der linken Seite die konjugierte Größe genommen worden ist!
Durch die Konjugation des linken Faktors beim Skalarprodukt müssen ein paar Rechenregeln modifiziert werden. Es gilt:
1. ha | bi = hb | ai∗
2. ha | σbi = σha | bi mit σ ∈ C
3. hσa | bi = σ ∗ ha | bi mit σ ∈ C
KAPITEL 3. MATRIZEN
156
Unitäre Matrizen
Der Begriff einer orthogonalen Matrix findet im Komplexen seine natürliche Verallgemeinerung in dem
Begriff der unitären Matrix. Eine N × N - Matrix A heißt unitär, wenn sie eine Inverse A−1 besitzt
und diese die Eigenschaft
A−1 = AH
hat. Dies ist äquivalent zu der Eigenschaft
AH A = AAH = I .
Unitäre Matrizen lassen das Skalarprodukt invariant: Wenn
x′ = Ux und y′ = Uy
die Bildvektoren von x, y ∈ CN unter der Abbildung sind, die durch eine unitäre Matrix U beschrieben
wird, so gilt:
hx′ | y′ i = hx | yi
Diese Behauptung lässt sich leicht prüfen. Es gilt:
hx′ | y′ i =
(Ux)H Uy
=
=
xH UH Uy
xH Iy
=
=
xH y
hx | yi
Damit ist die Behauptung bewiesen.
Für die Elemente amn einer Matrix mit der Eigenschaft UH U = I ergibt sich:
N
X
a∗km akn = δmn
k=1
Das bedeutet: Für die N Spaltenvektoren

einer orthogonalen Matrix


an = 


gilt:


A=

a1
a2
..
.
an





(n = 1, ..., N )
a11
a21
..
.
a12
a22
..
.
···
···
..
.
a1N
a2N
..
.
aN 1
aN 2
· · · aN N





ham | an i = δmn
Diese Vektoren sind also untereinander orthonormal. Die Unitarität einer N × N - Matrix lässt sich also
leicht prüfen: Ihre Spaltenvektoren müssen zueinander orthogonal sein und den Betrag Eins besitzen.
Die selbe Eigenschaft gilt für die Zeilenvektoren.
KAPITEL 3. MATRIZEN
157
Eigenwerte und Eigenvektoren
Wir erlauben jetzt komplexe Eigenwerte. Auch rein reelle Matrizen können in der Regel komplexe
Eigenwerte besitzen, denn schließlich können beim charakteristischen Polynom komplexe Nullstellen
auftreten. Wichtig ist der folgende
Satz:
Für eine hermiteschen N × N Matrix A gilt:
1. Die Eigenwerte λi sind alle reell. Es gibt genau N Eigenwerte, wobei diese entsprechend ihrer
Vielfachheit gezählt sind.
2. Die Eigenvektoren vi , vk zu unterschiedlichen Eigenwerten λi , λk sind zueinander orthogonal:
hvi | vk i = 0
3. Die Eigenräume von A spannen den ganzen CN auf. Das heißt: Jeder Vektor z ∈ CN lässt sich
als Linearkombination der Eigenvektoren von A schreiben.
4. Es gibt eine unitäre Matrix U mit der Eigenschaft
AU = UΛ, d.h. UH AU = Λ
wobei Λ eine N × N Diagonalmatrix ist, auf deren Diagonale die Eigenwerte von A stehen (ggf.
mit ihrer entsprechenden Vielfachheit):


λ1 · · · 0

.. 
Λ =  ... . . .
. 
0
· · · λN
Die Spalten der Matrix U sind die entsprechenden orthonormalen Eigenvektoren zu diesen Eigenwerten:
U = [û1 , ..., ûN ]
Kapitel 4
Folgen und Reihen
4.1
Zahlenfolgen
Zahlenfolgen sind ein wichtiges Werkzeug, um damit Eigenschaften von Funktionen zu untersuchen. Sie
haben in Naturwissenschaft und Technik sowie in der Finanzmathematik aber auch ihre eigenständige
Bedeutung. Sie beschreiben Größen, die sich in einem bestimmten Takt ändern. Ein technisch wichtiges
Bespiel sind zeitdiskrete Signale wie etwa die Abtastwerte (Samples) eines Audiosignals. Ein weiteres
Beispiel sind Zinsen und Zinseszinsen, die jeweils am Ende eines Jahres oder eines Monats anfallen.
Grundbegriffe
Wir betrachten Folgen von reellen oder auch komplexen Zahlen. Ein Beispiel:
1,
1
,
2
1
,
4
1
,
8
1
,
16
...
Die einzelnen Zahlen in der Folge nennt man Folgenglieder oder manchmal auch Elemente. Die
Folgenglieder ak werden durch einen Index k numeriert. Meist fängt man bei k = 0 an und schreibt:
a0 ,
a1 ,
a2 ,
a3 ,
a4 ,
...
Bei dem obigem Beispiel ist das Bildungsgesetz
ak =
1
,
2k
k ∈ N0 ,
und die Zuordnung sieht so aus:
a0
a1
a2
a3
a4
···
ak
···
1
1
2
1
4
1
8
1
16
···
1
2k
···
Es gibt folgende Schreibweisen für allgemeine Zahlenfolgen:
∞
∞
∞
(ak )k=0 oder {ak }k=0 oder hak ik=0
Für unser Beispiel kann man also schreiben:
∞
1
1
oder auch
2k k=0
2k k∈N0
158
KAPITEL 4. FOLGEN UND REIHEN
159
Wenn die Folge erst bei k = 1 anfängt, schreibt man z.B.
∞
1
1
.
oder
auch
2k k=1
2k k∈N
Diese Schreibweise mit den Klammern ist nicht unbedingt notwendig. Allerdings muss deutlich werden,
welche Werte der Index annimmt.
Besonders in der Technik ist es üblich, Zahlenfolgen als Stem-Plot darzustellen: Auf der Abszisse trägt
man den Index auf, und in Richtung der Ordinate werden die zugehörigen Folgenglieder mit einem
senkrechten Strich (“Stamm” – engl. stem) und einem Kreissymbol dargestellt. Abbildung 4.1 zeigt ein
1
0.8
ak
0.6
0.4
0.2
0
0
2
4
6
8
10
k
12
14
16
18
20
Abbildung 4.1: Stem-Plot für die die ersten zwanzig Glieder der Zahlenfolge ak = 1/k, k ∈ N.
Beispiel für die Zahlenfolge ak = 1/k.
Wenn zwei benachbarte Folgenglieder immer unterschiedliches Vorzeichen haben, spricht man von einer
alternierenden Folge.
Beispiele für alternierende Zahlenfolgen:
ak = (−1)k
1
,
2k
k ∈ N0
1
, k∈N
k
1
, k∈N
2k + 1
k+1
ak = (−1)
k+1
ak = (−1)
ak = (−1)k
5k
,
k!
k ∈ N0
Übung: Schreiben Sie jeweils die ersten 6 Folgenglieder hin.
Der Begriff der Fakultät k!
Bei dem letzten Beispiel kam der Ausdruck k! vor. Dieses Symbol ist eine Abkürzung für das Produkt
aller natürlichen Zahlen von 1 bis k:
k! = 1 · 2 · 3 · . . . · k
KAPITEL 4. FOLGEN UND REIHEN
160
Man sagt dafür „k Fakultät“. Als Sonderfall ist auch
0! = 1
definiert. Diese Definition hat sich als sinnvoll erwiesen, weil sich dann manche Formeln einfacher
schreiben lassen. Die Folge
∞
(k!)k=1
der Fakultäten wird mit wachstendem k sehr schnell sehr groß. Die ersten 10 Folgenglieder lauten:
1!
2!
3!
4!
5!
6!
7!
8!
9!
10!
=
1
=
2
=
6
=
24
=
120
=
720
=
5 040
=
40 320
=
362 880
= 3 628 800
Die Folge der Kehrwerte der Fakultäten
1
k!
∞
k=1
wird mit wachstendem k sehr schnell sehr klein und nähert sich dem Wert 0 an, ohne ihn allerdings je
zu erreichen. Dies ist ein Beispiel für eine sogenannte Nullfolge. Dieser Begriff wird jetzt erklärt.
Konvergenz einer Zahlenfolge
Eine Zahlenfolge (ak )∞
k=0 heißt Nullfolge, wenn sich die Folgenglieder mit wachsendem Index k immer
dichter der Null annähern. Man schreibt dafür
ak → 0 für k → ∞ .
Etwas kompakter schreibt man dies mit dem Limes-Symbol „lim“ folgendermaßen:
lim (ak ) = 0 .
k→∞
Die Aussage „immer dichter der Null annähern“ muss man mathematisch präzisieren: Man kann eine
beliebige, noch so kleine Zahl ε > 0 vorgeben, so dass trotzdem immer
|ak | < ε
gilt, wenn k nur genügend groß ist (z.B. ab dem Index k = k0 ). Man sagt auch: Die Folge konvergiert
gegen den Grenzwert (Limes) 0. Zum Beispiel konvergiert die in Abbildung 4.1 gezeigte Folge gegen
Null. Wählt man z.B. ε = 0.05, so gilt |ak | < ε ab k = 21.
Was bedeutet fast alle? Zur Vereinfachung sagt man, dass eine Aussage für fast alle Indizes
k ∈ N oder für fast alle Folgenglieder ak gilt und meint damit, dass sie für alle bis auf endlich viele
Ausnahmen gilt. Eine Nullfolge ist also eine Folge, für die
|ak | < ε für fast alle k
KAPITEL 4. FOLGEN UND REIHEN
161
gilt, wobei ε > 0 eine beliebig kleine Zahl sein darf.
Eine Folge kann nicht nur gegen 0 konvergieren, sondern auch gegen irgend einen anderen Grenzwert
a ∈ R oder auch a ∈ C:
ak → a für k → ∞
Man schreibt dies oft auch mit dem Limes-Symbol („lim“) folgendermaßen:
lim (ak ) = a .
k→∞
Eine solche Folge heißt konvergent. Man sagt auch: Der Limes existiert. Die Folgenglieder einer
konvergenten Folge nähern sich dann immer mehr dem Grenzwert a, d.h. es gilt
|ak − a| < ε
∞
für fast alle k. Offenbar gilt: Eine Folge (ak )k=0 konvergiert gegen einen Grenzwert a, wenn die Folge
∞
(ak − a)k=0 eine Nullfolge ist.
Eine nicht konvergente Folge heißt divergent.
Für Grenzwertbetrachtungen spielen die ersten endlich vielen Glieder einer Folge offenbar keine Rolle.
Man kann also zu diesem Zweck die Folge erst bei einem beliebig gewählten Wert k = k0 beginnen
lassen.
Rechenregeln für Grenzwerte konvergenter Folgen
Schreibweise mit Pfeilen: Wenn
ak → a und bk → b (k → ∞)
konvergente Zahlenfolgen sind, so gilt für k → ∞:
1.
ak ± b k → a ± b
2.
ak · b k → a · b
3.
b
bk
→ sofern a 6= 0
ak
a
Man kann die selben Aussagen auch mit dem Limes-Symbol schreiben.
Schreibweise mit dem Limes-Symbol: Wenn
lim ak und lim bk
k→∞
k→∞
existieren, so gilt:
1.
lim (ak ± bk ) = lim ak ± lim bk
k→∞
k→∞
k→∞
KAPITEL 4. FOLGEN UND REIHEN
162
2.
lim (ak · bk ) =
k→∞
lim ak
=
k→∞
· lim bk
k→∞
3. Falls limk→∞ ak 6= 0 ist, so gilt:
lim
k→∞
bk
ak
limk→∞ bk
limk→∞ ak
Bei dieser Schreibweise muss man darauf achten, dass alle Limites, die man hinschreibt, auch existieren.
Uneigentliche Grenzwerte
Wenn bei einer reellen Folge die Folgenglieder ak mit wachsendem k beliebig größer (bzw. kleiner)
werden, d.h. wenn
ak > σ bzw. ak < −σ
für jedes beliebig große σ > 0 und fast alle k gilt, so schreibt man dafür auch
ak → ∞ bzw. ak → −∞ (k → ∞)
oder
lim ak = ∞ bzw. lim ak = −∞.
k→∞
k→∞
Auch wenn man in diesem Fall oft vom “Grenzwert (plus/minus) unendlich” spricht, divergiert die
Folge! Für diese uneigentlichen Grenzwerte ±∞ gelten die obigen Rechenregeln für Grenzwerte
mit gewissen Einschränkungen.
Beachte: Unendlich ist keine Zahl! Die Symbole ∞ und −∞ sind keine Zahlen, sondern nur
Symbole, mit denen man den obigen Sachverhalt kürzer schreiben kann. Man darf damit nicht rechnen
wie mit Zahlen!
Rechenregeln für uneigentliche Grenzwerte
1. Für ak → ∞ und bk → ∞ (k → ∞) gilt
ak + bk → ∞ und ak bk → ∞ .
2. Es gilt für ak → ∞ und eine konvergente Folge bk → b (k → ∞):
ak + b k → ∞
und
ak bk → ∞ für b > 0 bzw. ak bk → −∞ für b < 0
3. Für ak → ∞ (k → ∞) gilt:
1
→0
ak
KAPITEL 4. FOLGEN UND REIHEN
163
Diese Formulierung erscheint etwas schwerfällig, weil man zwischen eigentlichen und uneigentlichen
Grenzwerten unterscheiden muss. Es erscheint einfacher, wenn man diese Aussagen mit dem LimesSymbol formuliert. Man muss dann aber sehr vorsichtig sein und darauf achten, dass die Ausdrücke,
die man hinschreibt, überhaupt erklärt sind. Im Prinzip gelten in der Limes-Schreibweise dieselben
Rechenregeln wie für die echten Grenzwerte. Man muss aber beachten, dass die Ausdrücke
∞ − ∞ und
∞
und 0 · ∞
∞
nicht erklärt sind und deshalb nicht auftreten dürfen.
Zum Beispiel ist für
lim ak = ∞ und lim bk = ∞
k→∞
k→∞
weder der Ausdruck
lim ak − lim bk
k→∞
noch der Ausdruck
k→∞
limk→∞ bk
limk→∞ ak
sinnvoll erklärt. Trotzdem kann unter Umständen die Folge ak − bk oder bk /ak einen (echten oder uneigentlichen) Grenzwert besitzen. Man muss dann aber vor der Grenzwertbildung geeignet umformen.
Das folgende Beispiel soll das erläutern.
Ein Beispiel für Grenzwerte bei Quotienten von Folgen: Bei dem Ausdruck
ak =
2k 2 + 4
3k 2 + k + 1
stehen im Zähler und Nenner Folgen, die jeweils für k → ∞ gegen den uneigentlichen Grenzwert
∞ streben. Diese Grenzwerte darf man nicht einfach dividieren. Durch die einfache Umformung (für
k > 0)
2 + k42
k 2 2 + k42
ak = 2
=
k 3 + k1 + k12
3 + k1 + k12
erhält man aber einen Quotienten zweier Folgen, die beide konvergieren und zwar gegen den Grenzwert
2 im Zähler und den Grenzwert 3 im Nenner. Es gilt also:
ak =
2 + k42
2
→ für k → ∞
3
3 + k1 + k12
In der Limes-Schreibweise sieht das so aus:
limk→∞ 2 + k42
2 + k42
2
=
=
lim ak = lim
1
1
1
1
k→∞
k→∞ 3 +
3
limk→∞ 3 + k + k2
k + k2
Man kann diese Vorgehensweise verallgemeinern: Wenn im Zähler und Nenner Summen von Potenzen
von k stehen, so klammert man oben und unten die jeweils höchste auftretende Potenz aus, zieht diese
vor den Bruchstrich und kürzt. Das Resultat davon (d.h. dieser Ausdruck vor dem Bruchstrich) ist
entscheidend für die Konvergenz, denn der andere Faktor konvergiert im jedem Fall.
KAPITEL 4. FOLGEN UND REIHEN
164
Wurzeln und Grenzwerte
∞
Man darf Wurzeln und Grenzwertbildung vertauschen: Wenn die Folge (ak )k=0 (ak ≥ 0) konvergiert
oder ihr uneigentlicher Grenzwert existiert, so gilt:
lim
k→∞
Mit Pfeilen geschrieben:
q
√
ak =
lim ak
k→∞
√
ak → a (k → ∞)
√
ak → ∞ ⇒ ak → ∞ (k → ∞)
ak → a ⇒
√
Dies gilt nicht nur für Quadratwurzeln, sondern für beliebige Wurzeln (Kubikwurzeln etc.). Auf den
Beweis dieser Tatsache verzichten wir.
Um bei Folgen mit Differenzen von Wurzeln Grenzwerte zu berechnen, gibt es einen Trick, der im
folgenden Beispiel vorgeführt wird:
Beispiel für Grenzwerte von Folgen mit Differenzen von Wurzeln:
√
√
ak = k + 1 − k.
Es sei
Um den Grenzwert k → ∞ zu berechnen, darf man nicht einfach die Differenz der uneigentlichen
Grenzwerte ∞ − ∞ bilden, da dies einen mathematisch unsinnigen Ausdruck ergibt (siehe oben). Statt
dessen erinnern wir uns an die dritte binomische Formel und schreiben
√
√
√
√ k+1+ k
k+1−k
√ =√
√ .
ak =
k+1− k √
k+1+ k
k+1+ k
Also gilt:
1
√ −→ 0
ak = √
k+1+ k
(k → ∞)
Wichtige Beispiele für Grenzwerte
1. Es gilt
lim
√
k
k=1
lim
√
k
a=1
k→∞
2. Es gilt für jedes a > 0:
k→∞
3. Die Eulersche Zahl e = 2.71828... lässt sich als Grenzwert folgendermaßen darstellen:
k
1
1+
=e
k→∞
k
lim
KAPITEL 4. FOLGEN UND REIHEN
165
Abgrenzung der Begriffe: Konvergenz, uneigentliche Grenzwerte, Divergenz
Es ist wichtig, die Begriffe sauber zu unterscheiden.
Der Begriff Konvergenz darf nur für endliche Grenzwerte verwendet werden, also für
lim ak = a ,
k→∞
wobei a eine endliche (reelle oder komplexe) Zahl ist.
Eine nicht konvergente Folge divergiert (nach Definition). Bei Divergenz kann ein uneigentlicher
Grenzwert
lim ak = ∞ oder lim ak = −∞
k→∞
k→∞
existieren.
Es gibt aber auch viele divergente Folgen, die keinen uneigentlichen Grenzwert besitzen. Ein Beispiel
ist die Folge
k
ak = (−1) .
Die Glieder dieser Folge springen zwischen den Werten +1 und −1 hin und her.
Konvergenzkriterien
Die beiden folgenden Kriterien sind manchmal hilfreich, die Konvergenz einer Folge zu prüfen, auch
wenn sich der Grenzwert nicht explizit bestimmen lässt.
∞
1. Das Monotoniekriterium: Eine Folge (ak )k=0 heißt monoton wachsend (bzw. fallend), falls
ak+1 ≥ ak (bzw. ak+1 ≤ ak ) gilt. Anschaulich einleuchtend ist folgende Tatsache (die man aber
beweisen muss): Jede nach oben (bzw. unten) beschränkte und monoton wachsende (bzw. fallende)
Folge konvergiert.
2. Das Cauchy-Kriterium: Eine Folge ak heißt Cauchy-Folge, wenn ab einem bestimmten Index
k0 die Differenz zweier Folgenglieder beliebig klein wird. In der Sprache der Mathematik: Bei einer
Cauchy-Folge gibt es zu jedem ε < 0 ein k0 ∈ N so dass
|ai − ak | < ε
für alle i, k > k0 gilt. Jede konvergente Folge ist eine Cauchy-Folge. Auch umgekehrt gilt: Jede CauchyFolge konvergiert.
KAPITEL 4. FOLGEN UND REIHEN
166
Aufgaben zu Abschnitt 4.1
4.1.1
Aufgabe:
Berechnen Sie die folgenden (echten oder uneigentlichen) Grenzwerte (sofern sie existieren):
a)
c)
b)
2k + 1
lim
k→∞
4k
d)
e)
105 k − 3k 2
lim
k→∞
k2
g)
k2 + 4
lim
k→∞
k
h)
−k
1
lim
k→∞ 2
j)
k2 − 1
lim
k→∞ k + 1
√
n2 + 5
lim
n→∞ n − 2
k)
p
p
lim
n2 + 1 − n2 − 3
n→∞
m)
n
lim (1 − (−1) )
n→∞
f)
3n
√
lim √
n−3− n+2
2 − k3
k→∞ 10k 2 + k
lim
i)
ℓ)
n→∞
k 2 + 4k − 1
k→∞
k 2 − 3k
lim
√
2
(n − 5) − n + 1
lim
n→∞
n2 + 1
√
√
a+n− n
lim √
√
n→∞
b+n− n
KAPITEL 4. FOLGEN UND REIHEN
4.2
167
Reihen
Endliche Reihen
Die Summe
sn =
n
X
ak = a0 + a1 + a2 + ... + an
k=0
der ersten n+1 Glieder einer Zahlenfolge (ak )∞
k=0 bezeichnet man als endliche Reihe. In vielen Fällen
kann man diese Summe ausrechnen.
Beispiel: Die geometrische Reihe
Die (endliche) geometrische Reihe ist die Summe
sn =
n
X
q k = 1 + q + q 2 + ... + q n .
k=0
Sie spielt eine sehr wichtige Rolle sowohl in den Naturwissenschaften als auch in den Wirtschaftswissenschaften, insbesondere in der Finanzmathematik. Wenn man zum Beispiel jedes Jahr am 1. Januar
einen festen Betrag auf ein Konto einzahlt, hat man nach n Jahren am 1. Januar das sn -fache dieses
Betrages auf seinem Konto. Die Zahl q ist hierbei der sogenannte Verzinsungsfaktor. Er berechnet
sich als
z
,
q =1+
100
wobei z der Zinssatz in Prozent ist. In der Natur beschreibt die geometrische Reihe exponentielles
Wachstum, in der Nachrichtentechnik braucht man sie zur Beschreibung digitaler Filter. Die geometrische Reihe lässt sich recht einfach mit einem kleinen Trick aufsummieren. Man schreibt sn und qsn
untereinander hin
sn = 1 +q +q 2 + ... + q n
qsn =
q +q 2 + .... + q n +q n+1
und subtrahiert diese beiden Zeilen. Als Ergebnis erhält man
Für q 6= 1 gilt dann:
(1 − q) sn = 1 − q n+1
sn =
n
X
1 − q n+1
1−q
qk =
k=0
1 − q n+1
1−q
Für den Sonderfall q = 1 ergibt sich als Summe von n + 1 Einsen einfach sn = n + 1.
Oftmals benötigt man einen Ausdruck für die geometrische Reihe ohne den ersten Term (zu k = 0)
q 0 = 1. Diesen erhält man (z.B) so:
q + q 2 + ... + q n
=
=
n
X
k=1
qk =
1 − q n+1
−1
1−q
q − q n+1
1−q
q − q n+1
1−q
KAPITEL 4. FOLGEN UND REIHEN
168
Noch ein Beispiel: Die Formel vom kleinen Gauß
Es wird erzählt, dass der Grundschullehrer des kleinen Gauß seiner Schulklasse einmal die Aufgabe
stellte, alle (ganzen) Zahlen von 1 bis 100 zu addieren. Er wollte wohl die Klasse damit eine Weile beschäftigen und derweil etwas anderes tun. Bevor er dazu kam, legte ihm der kleine Gauß mit den Worten
“da ligget se” das Heft mit der richtigen Lösung hin. Wie kam er so schnell darauf? Wahrscheinlich so
oder so ähnlich:
1 +2 +3 +4 +... +98 +99 +100
100 +99 +98 +97 +... +3 +2
+1
Die Summe zweier untereinander stehender Zahlen ist 101. Addiert man alle Zahlen, so ergibt sich
100 · 101 = 10100. Das gesuchte Ergebnis ist die Hälfte davon, also
n
X
k=
k=1
1
100 · 101 = 5050 .
2
Allgemein gilt die Formel:
n
X
k=
k=1
1
n (n + 1)
2
Diese Summenformel für die arithmetische Reihe hat sehr viele Anwendungen in der Praxis.
Unendliche Reihen und ihre Konvergenz
Wenn n alle Zahlen 1,2,3, ... durchläuft, wird durch die Summen (man nennt diese Partialsummen)
sn =
n
X
ak
k=0
∞
eine neue Zahlenfolge (sn )n=0 definiert1 . In der Technik ist für diese Folge auch die Bezeichnung
kumulierte Summe gebräuchlich.
∞
Wenn die Folge (sn )n=0 konvergiert, gibt es einen endlichen Grenzwert
s = lim sn = lim
n→∞
n→∞
n
X
ak .
k=0
Man sagt: Die unendliche Reihe konvergiert und schreibt
∞
X
k=0
ak = lim
n→∞
n
X
ak
k=0
für diese Summe aus unendlich vielen Summanden.
∞
Falls (sn )n=0 divergiert, so sagt man, dass die unendliche Reihe
P∞
k=0
ak divergiert.
P∞
Notwendige Bedingung für die Konvergenz einer unendlichen Reihe: Eine Reihe k=0 ak
kann nur dann konvergieren, wenn ihre Glieder ak eine Nullfolge bilden. Aber Vorsicht! Die Umkehrung
gilt nicht. Es gibt Nullfolgen, deren Reihe divergiert. Ein Beispiel dazu kommt gleich.
1 Beachte:
Der Anfangsindex ist fest, der obere Index n ist variabel.
KAPITEL 4. FOLGEN UND REIHEN
169
Cauchy-Kriterium für unendliche Reihen: Wenn man das Cauchy-Kriterium auf die Folge der
Partialsummen (sn )∞
n=0 anwendet, so ergibt sich die Aussage: Die Reihe konvergiert genau dann, wenn
es zu jedem ε ein k0 ∈ N gibt, so dass
n
X
ak < ε
k=m+1
für alle m, n > k0 gilt.
P∞
P∞
Man nennt eine Reihe k=0 ak absolut konvergent, falls k=0 |ak | gegen einen (endlichen!) Grenzwert konvergiert. Man schreibt dafür auch:
∞
X
k=0
Merke:
|ak | < ∞
Absolute Konvergenz =⇒ Konvergenz.
Die Umkehrung (der Umkehrschluss) gilt nicht: Eine konvergente Reihe braucht nicht absolut konvergent zu sein.
Beispiele für konvergente und divergente Reihen:
1. Die geometrische Reihe
∞
X
qk
k=0
konvergiert (absolut) für |q| < 1, andernfalls divergiert sie. Man sieht das leicht aus der Formel
für die endliche Summe
n
X
1 − q n+1
qk =
1−q
k=0
Daraus ergibt sich im Falle der Konvergenz (also für |q| < 1) sofort die Summenformel
∞
X
qk =
k=0
2. Die harmonische Reihe
1
.
1−q
∞
X
1
1 1 1
= 1 + + + + ...
k
2 3 4
k=1
divergiert (sehr langsam). Die Beweisidee ist in Abbildung 4.2 veranschaulicht: Die Summe des
3. und 4. Folgengliedes ist größer als 1/2. Die Summe der Folgenglieder Nummer 5 bis Nummer
8 ist auch größer als 1/2, ebenso wie die Summe der Folgenglieder 9 bis 16, 17 bis 32 usw. In
Formeln geschrieben gilt allgemein:
2n
X
1
1
1
≥n
= .
k
2n
2
k=n+1
Es werden unendlich viele solche Terme addiert, von denen jeder ≥ 1/2 ist. Weil man aber
unendlich oft eine Zahl ≥ 1/2 aufsummiert, so divergiert diese Reihe2 . Formal kann man so
argumentieren: Die Bedingung
n
X
ak < ε
k=m+1
2 Diese
Argumentation ist ein Spezialfall des Majoranten/Minoranten-Kriteriums, zu dem wir gleich kommen.
KAPITEL 4. FOLGEN UND REIHEN
170
1
Harmon. Reihe ak=1/k
0.9
Div. Minorante bk
0.8
ak und bk
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
k
15
20
Abbildung 4.2: Veranschaulichung des Argumentes zur Divergenz der harmonischen Reihe.
des Cauchy-Kriteriums für Reihen für beliebig kleine ε lässt sich nicht erfüllen, weil man immer
m und n so wählen kann, dass der Ausdruck auf der linken Seite ≥ 1/2 wird.
3. Die alternierende harmonische Reihe
∞
k−1
X
(−1)
k=1
k
=1−
1 1 1
+ − + ...
2 3 4
konvergiert (aber nicht absolut!). Der Beweis ergibt sich aus dem Leibniz-Kriterium, zu dem wir
gleich kommen werden.
Die letzten beiden Beispiele zeigen:
• Auch wenn die Folgenglieder immer kleiner werden, liegt nicht notwendig Konvergenz vor.
• Das alternierende Vorzeichen kann zu Konvergenz führen. Das im Anschluss beschriebene LeibnizKriterium zeigt, wann dies der Fall ist.
Konvergenzkriterien für unendliche Reihen
Leibniz3 -Kriterium: Es sei (ak )k∈N eine monoton fallende Nullfolge, d. h. ak+1 ≤ ak und ak →
0 (n → ∞). Dann konvergiert die alternierende Reihe
∞
X
k−1
(−1)
ak
k=1
3 Gottfried Wilhelm Leibniz (1646 – 1716) war ein deutscher Philosoph und Mathematiker. Er hat unabhängig von
Newton die Differential- und Integralrechnung entdeckt. Beide haben sich lebenslang gestritten, wer dabei der erste war.
KAPITEL 4. FOLGEN UND REIHEN
171
Beweis: Die Idee besteht darin, die Partialsummen
sn =
n
X
k−1
(−1)
ak
k=1
zu geraden Indizes n = 2m und zu ungeraden Indizes n = 2m + 1 zu betrachten und zu zeigen, dass
die ersteren monoton steigen und nach oben beschränkt sind (durch a1 ) und die letzteren monoton
fallen und nach unten beschränkt sind (durch die Zahl 0). Abbildung 4.3 zeigt die Situation. Für die
a2m+1
s2m−2 s2m
0
s2m+1 s2m−1
a1
Abbildung 4.3: Veranschaulichung des Beweises zum Leibnizkriterium. Die monoton fallenden ungeraden Partialsummen sind rot eingezeichnet, die monoton steigenden geraden sind blau eingezeichnet.
Differenz zweier aufeinander folgender Partialsummen gilt:
s2m+1 − s2m = a2m+1 ≥ 0 .
Dieser Ausdruck konvergiert gegen Null, da die Folgenglieder (nach Voraussetzung) eine Nullfolge
bilden. Wenn also s2m+1 und s2m überhaupt konvergieren, so konvergieren sie gegen den selben Grenzwert, der dann damit auch gleich dem Grenzwert der Reihe ist. Um die Konvergenz von s2m+1 und
s2m zu zeigen, schreiben wir
und
s2m = (a1 − a2 ) + (a3 − a4 ) + ... + (a2m−1 − a2m )
s2m+1 = a1 − (a2 − a3 ) − (a4 − a5 ) − ... − (a2m − a2m+1 ) .
Weil die Ausdrücke in den Klammern alle ≥ 0 sind, gilt:
und
s2m ≥ s2m−2 ≥ 0
s2m+1 ≤ s2m−1 ≤ a1 .
Die s2m sind also monoton steigend und die s2m+1 monoton fallend. Außerdem müssen alle ungeradzahligen Partialsummen oberhalb aller geradzahligen liegen, wie es Abbildung 4.3 zeigt:
0 ≤ s2m−2 ≤ s2m ≤ s2m+1 ≤ s2m−1 ≤ a1
Beide Partialsummen s2m+1 und s2m konvergieren, weil sie monoton und beschränkt sind. Weil ihre
Differenz eine Nullfolge ist, konvergieren sie gegen den selben Grenzwert, der dann auch gleich dem
Grenzwert
∞
X
lim sn =
(−1)k−1 ak
n→∞
k=1
ist. Das war zu beweisen. Für die nächsten Kriterien lohnt es sich, die folgende Ausdrucksweise zu verwenden, die wir auch
schon im vorherigen Abschnitt kennen gelernt haben: Für fast alle n ∈ N0 heißt: Für alle n ∈ N0
mit höchstens endlich vielen Ausnahmen. Der Grund ist: Der Konvergenz schadet es nicht, wenn ein
Kriterium für die ersten 10 oder 100 oder 1000 Glieder der Folge (ak ) nicht erfüllt ist.
Wir betrachten in der folgenden Definition Reihen mit nur positiven Gliedern. Hierfür definieren wir:
P∞
P
Eine
von ∞
k=0 bk , falls ak ≥ bk für fast alle k. Dann nennt man
P∞ Reihe k=0 ak heißt Majorante
P∞
b
die
Minorante
von
a
.
Zum
Beispiel
ist in Abbildung 4.2 die harmonische Reihe (blau)
k=0 k
k=0 k
eine Majorante der rot gezeichneten Reihe und diese wiederum eine Minorante der blau gezeichneten
harmonischen Reihe. Es gilt das
KAPITEL 4. FOLGEN UND REIHEN
172
Majorantenkriterium (bei Reihen mit nur positiven Gliedern): Die Majorante einer divergenten
Reihe divergiert und die Minorante einer konvergenten Reihe konvergiert.
Zusammen mit den Konvergenzeigenschaften der geometrischen Reihe folgt hieraus das
Quotientenkriterium:
Falls es eine Zahl q mit 0 < q < 1 gibt, so dass für fast alle k
ak+1 ak ≤ q
gilt, so konvergiert die Reihe
∞
X
ak
k=0
absolut. Bei
für fast alle k divergiert sie.
ak+1 ak ≥ 1
Beweis: Nehmen wir der Einfachheit halber an, dass wir “fast alle” durch “alle” ersetzen dürfen.
Ansonsten lässt man einfach endlich viele Glieder weg, was an der Konvergenz oder Divergenz
nichts ändert.
Konvergenz: Falls
ab k = 0 gilt, so folgt
Also ist die geometrische Reihe
ak+1 ak ≤ q,
0<q<1
|ak | ≤ |a0 | q k
a0
∞
X
qk
k=0
eine Majorante der betrachteten Reihe, die deshalb nach dem Majoranten-Kriterium auch
konvergiert.
Divergenz: Falls
ak+1 ak ≥ 1
gilt, so wird der Betrag der Folgenglieder immer größer (oder bleibt gleich). Eine notwendige
Bedingung für Konvergenz ist aber, dass diese kleiner werden.
Achtung Falle! Es reicht nicht, |ak+1 /ak | < 1 zu zeigen, sonst würde ja die harmonische Reihe
konvergieren. Man muss wirklich ein q > 0 finden, das gewissermaßen einen “Abstand” zu der Eins
herstellt!
Bei vielen Beispielen ist es etwas einfacher und trotzdem ausreichend, mit einem etwas schwächeren4
Kriterium zu arbeiten.
4 Ein
Kriterium ist schwächer, wenn es auf weniger Fälle anwendbar ist.
KAPITEL 4. FOLGEN UND REIHEN
173
Quotientenkriterium “(schwache Version)”: In vielen Fällen existiert der Grenzwert
ak+1 .
g = lim k→∞
ak Falls dieser Grenzwert g existiert und g < 1 gilt, so ist das Quotientenkriterium sicher erfüllt5 . Dieses
schwache Quotientenkriterium ist oft etwas leichter zu prüfen als das eigentliche Quotientenkriterium,
weshalb diese Version manchmal bevorzugt wird.
Es gibt noch ein weiteres wichtiges Konvergenzkriterium, nämlich das
Wurzelkriterium:
Falls es eine Zahl q mit 0 < q < 1 gibt, so dass für fast alle k
p
k
|ak | ≤ q
gilt, so konvergiert die Reihe
∞
X
ak
k=0
absolut. Wenn dagegen
für fast alle k gilt, so divergiert sie.
p
k
|ak | ≥ 1
a
nicht existiert.
kann aber das Quotientenkriterium erfüllt sein, obwohl der Grenzwert limk→∞ k+1
ak Diese Bedingung ist also schwächer als das eigentliche Quotientenkriterium.
5 Umgekehrt
KAPITEL 4. FOLGEN UND REIHEN
174
Aufgaben zu Abschnitt 4.2
4.2.1
Aufgabe:
Auf einer Party befinden sich 10 Gäste sowie der Gastgeber. Nachdem der Gastgeber mit allen Gästen
angestoßen hat, stoßen auch alle Gäste untereinander an, – jeder mit jedem genau einmal. Wie oft
klingen die Gläser insgesamt?
4.2.2
Aufgabe:
Ein Schachbrett soll so mit Getreidekörnern gefüllt werden, dass auf dem ersten Feld ein Korn liegt
und sich die Anzahl der Körner von Feld zu Feld verdoppelt.
a) Drücken Sie die Zahl an der Körner auf dem Feld n (n = 1, ..., 64) durch ein Bildungsgesetz aus.
Wie viele Körner liegen auf dem letzten Feld (n = 64)?
b) Geben Sie eine Formel für die Summe sn der Körner bis einschließlich Feld n an. Wie viele Körner
liegen insgesamt auf dem Brett?
4.2.3
Aufgabe:
a) Sie legen einmalig am Jahresanfang 1000 e auf einem Sparkonto mit einer jährlichen Verzinsung
von 5% an. Die Zinsen werden dem Sparkonto jeweils zum Jahresende gutgeschrieben. Drücken Sie
den Kontostand an am Ende des Jahres n durch ein Bildungsgesetz aus. Berechnen Sie damit den
Kontostand am Ende des 5., 10. und 20. Jahres.
b) Sie legen jährlich zum Jahresanfang 100 e auf einem Sparkonto mit einer jährlichen Verzinsung
von 5% an. Die Zinsen werden dem Sparkonto jeweils zum Jahresende gutgeschrieben. Geben Sie eine
Formel für den Kontostand sn am Ende des Jahres n an. Berechnen Sie damit den Kontostand am
Ende des 5., 10. und 20. Jahres.
4.2.4
Aufgabe:
Eine Schätzung der Öl- und Gasreserven in Norwegen zu Beginn des Jahres 2006 betrug 11 Milliarden
Tonnen. Die Förderung im Jahr 2005 lag bei 250 Millionen Tonnen. Wie lange reichen die Reserven
unter folgenden Annahmen:
a) Die Förderung bleibt konstant.
b) Die Förderung wird jährlich um 2,5% reduziert, beginnend im Jahr 2006.
4.2.5
Aufgabe
Ein Patient nimmt an jedem Morgen 100 mg eines Medikaments zu sich. Er beginnt damit am Morgen
des ersten Tages (Zeitpunkt t = 0). Innerhalb eines Tages werden jeweils 25% der Stoffmenge des
Medikaments vom Körper abgebaut.
a) Stellen Sie den Vorgang dar, indem Sie an einen Zeitstrahl für die Zeitpunkte t = 0, 1, 2, 3, ... die
aufgenommenen Medikamentenmengen und deren Größe zu den folgenden Zeitpunkten schreiben.
b) Stellen Sie für die Stoffmenge St des Medikaments im Körper zum Zeitpunkt t eine Formel mit
Summenzeichen auf und vereinfachen Sie diese mit Hilfe der Formel für eine geometrische Reihe.
c) Welche Stoffmenge S des Medikaments stellt sich im Körper nach längerer Zeit ein?
KAPITEL 4. FOLGEN UND REIHEN
4.2.6
175
Aufgabe:
Untersuchen Sie, ob die folgenden Reihen konvergieren oder divergieren:
a) 1 +
c) 1 +
e)
10 100 1000
+
+
+ ...
1!
2!
3!
3
7
5
+ 3 + ...
+
2 22
2
∞
X
k!
2k
k=0
k=0
h)
∞
X
k=1
d)
∞ k
X
5
f)
k−1
(−1)
b)
6
k
k2 + 1
1+
1+
k
k+1
1
2
3
+ + + ...
1! 2! 3!
3!
7!
5!
+ 2 + 3 + ...
2
2
2
g)
∞
X
k=1
i)
∞
X
k2
k=1
2k
(−1)k−1
k
k+1
Kapitel 5
Funktionen
5.1
Grundbegriffe
Was ist eine Funktion?
In Naturwissenschaft und Technik, in der Wirtschaftswissenschaft und in vielen anderen Bereichen
haben wir es mit Größen zu tun, die von anderen Größen abhängen. Solche Abhängigkeiten beschreibt
man mathematisch durch Funktionen. Zum Beispiel ist die bei einer Bewegung zurückgelegte Wegstrecke s eine Funktion der Zeit t. Man schreibt dafür s(t).
Eine Funktion f ist eine Zuordnung, die jedem Wert einer Variablen x einen Funktionswert
y = f (x)
zuordnet. Symbolisiert man die Zuordnung (auch: Abbildungsvorschrift) durch einen Pfeil 7→, so
kann man den Zusammenhang auch durch
f : x 7→ f (x)
ausdrücken. Zum Beispiel ist die Operation
f : x 7→ x2
“bilde das Quadrat” eine solche Abbildungsvorschrift. Man veranschaulicht eine Funktion gern durch
ein Diagramm, siehe Abbildung 5.1 . Die Kurve aus Punkten (x, y) in der Ebene, die von den WertePaaren (x, f (x)) gebildet wird, heißt der Graph der Funktion. Die Achse für die Variable (x-Achse)
heißt Abszisse, die für die Funktionswerte (y-Achse) Ordinate.
Die Menge, aus der die zulässigen Werte für die Variable stammen, nennt man den Definitionsbereich
D. Die Menge, aus der die Funktionswerte stammen, nennt man den Wertebereich W. Es gilt also
x ∈ D und f (x) ∈ W. Die Tatsache, dass die Menge D in die Menge W abgebildet wird, wird
mathematisch durch den Pfeil → beschrieben:
f : D→W
Merke: Eine Funktion ist durch drei Angaben vollständig beschrieben: Definitionsbereich D, Wertebereich W und Abbildungsvorschrift f .
176
KAPITEL 5. FUNKTIONEN
177
y
Graph von y=f(x)
x
Abbildung 5.1: Der Graph einer Funktion.
Zusammenfassung: Mathematisch charakterisiert man eine Funktion durch die Angabe
f: D → W
x 7→ f (x)
Wir betrachten in dieser Vorlesung nur Funktionen einer reellen Variablen x, d. h.
D ⊂ R.
Wenn nichts anderes gesagt ist, sind die Funktionswerte auch reell1 , d. h.
W ⊂ R.
Beispiel:
Die Normalparabel ist gegeben durch die Funktion
f: R → R
x 7→ x2
Der Definitionsbereich R ist hier der maximal mögliche. Der angegebene Wertebereich R ist nicht der
minimal mögliche, denn es kommen nur Funktionswerte aus R+
0 vor.
Eine Funktion muss jedem Element des Definitionsbereiches ein Element des Wertebereiches zuordnen.
Dass – wie im Beispiel – im Wertebereich gar nicht alle Werte vorkommen (die negativen nicht!), ist
erlaubt. Dagegen muss die Funktion für alle x im Definitionsbereich erklärt sein. Hier muss man
aufpassen!
Beispiel:
f : R {0} → R
1
x 7→
x
1 In Naturissenschaft und Technik arbeitet man oft auch mit komplexwertigen Funktionen, weil dadurch mancher
Rechenweg einfacher wird. Man kann eine komplexwertige Funktionen in zwei reellwertige zerlegen: Eine für den Realteil,
eine für den Imaginärteil.
KAPITEL 5. FUNKTIONEN
178
Wir müssen die Null (d. h. die Menge {0}) aus dem Definitionsbereich heraus nehmen, weil man
bekanntlich nicht durch Null teilen darf. Hier ist der Wert x = 0 eine Definitionslücke der Funktion
f.
Eine Definitionslücke ist ein Wert, der (am Rand oder mittendrin) aus dem Definitionsbereich herausgenommen wurde, weil die Abbildungsvorschrift hier nicht erklärt ist (z. B. weil an dieser Stelle
ansonsten durch Null geteilt würde).
Oft ist der Definitionsbereich ein Intervall. Man verwendet folgende Bezeichnungen:
• Offenes Intervall:
(a, b) = {x ∈ R : a < x < b}
• Abgeschlossenes Intervall:
[a, b] = {x ∈ R : a ≤ x ≤ b}
• Halboffene Intervalle:
(a, b] = {x ∈ R : a < x ≤ b}
[a, b) = {x ∈ R : a ≤ x < b}
Hierbei sind a und b reelle Zahlen oder auch ±∞.
Beispiel:
Die folgende Funktion taucht als Doppler-Spektrum im Mobilfunk auf.
f : (−1, 1) → R
x
7→
1
√
1 − x2
Sie ist nur in dem offenen Intervall D = (−1, 1) definiert, denn der Ausdruck unter der Wurzel (Radikand) muss positiv sein.
Wir benutzen auch folgende Abkürzungen:
• R+ : Die positiven reellen Zahlen
• R+
0 : Die positiven reellen Zahlen inklusive der Null
• R− : Die negativen reellen Zahlen
• R−
0 : Die negativen reellen Zahlen inklusive der Null
In der Anwendung und beim praktischen Rechnen schreibt man die Funktionen meist ohne die Pfeile,
also z. B.
f (x) = x2
oder
y = x2
statt (mathematisch genauer)
Manchmal schreibt man auch
f : x 7→ x2 .
y (x) = x2 ,
d. h. es wird nicht zwischen dem Symbol für die Funktion und dem für den Funktionswert unterschieden.
Das geht meist gut, man muss nur wissen, was gemeint ist!
Wir werden je nach Geschmack die eine oder die andere Schreibweise verwenden. Solange wir noch den
Begriff der Funktion erklären, nehmen wir es etwas genauer, später dann nicht mehr.
KAPITEL 5. FUNKTIONEN
179
Die Umkehrfunktion
Eine Funktion ist immer eindeutig: Zu jedem x ∈ D gibt es genau einen Funktionswert y = f (x) ∈ W
(das Bild der Abbildung). Wenn nun umgekehrt auch jeder Wert y ∈ W auch ein Funktionswert ist
und genau ein Urbild x ∈ D besitzt mit y = f (x) (und nicht zwei Urbilder besitzt oder mehr), so
kann man die Funktion
f : D → W, x 7→ f (x)
umkehren, wobei zwischen der Funktion f und der Umkehrfunktion f −1 der folgende Zusammenhang besteht:
y = f (x) ⇔ x = f −1 (y)
Die Rollen von Definitions- und Wertebereich vertauschen sich für die Umkehrfunktion. Formal schreibt
man:
f −1 : W → D, y 7→ f −1 (y)
Praktisch heißt das einfach, dass man die Gleichung der Abbildungvorschrift umstellt und x durch y
ausdrückt.
Beispiel:
Es sei
f (x) = 10x
mit D = R, W = R+ . Dann ist die Umkehrfunktion gegeben durch
f −1 (y) = lg (y) .
Man kann natürlich auch
f −1 (x) = lg (x)
schreiben: Es ist schließlich unwichtig, wie man die Variable nennt. Die Schreibweise
f −1 (♥) = lg (♥)
ist zwar wenig verbreitet, aber genauso gut möglich.
Merke: Die Umkehrfunktion existiert nicht immer. Sie existiert nur dann, wenn im Wertebereich
jeder Wert y genau einmal vorkommt, nicht mehr als einmal und auch nicht weniger.
Monotonie
Häufig kommt der Fall vor, dass man nicht für den gesamten Definitionsbereich einer Funktion eine
Umkehrfunktion angeben kann. Wenn man die Funktion auf ein Intervall einschränkt, in welchem sie
streng monoton steigend oder fallend ist, so kann man dort eine Umkehrfunktion definieren. Eine
Funktion f heißt monoton steigend bzw. fallend, wenn aus x1 < x2 folgt, dass f (x1 ) ≤ f (x2 ) bzw.
f (x1 ) ≥ f (x2 ) gilt. Eine Funktion ist sogar streng monoton steigend bzw. fallend, wenn aus x1 < x2
folgt, dass f (x1 ) < f (x2 ) bzw. f (x1 ) > f (x2 ) gilt.
KAPITEL 5. FUNKTIONEN
180
y
y = f −1 (x)
y = f (x)
x
Abbildung 5.2: Der Graph einer Funktion und ihrer Umkehrfunktion.
Beispiel: Wenn man die Funktion f (x) = x2 auf die rechte Halbachse als Definitionsbereich einschränkt, d. h.
f : R+
x
→ R+
7→ x2
dann ist die Funktion streng monoton steigend. Die Umkehrfunktion ist gegeben durch die Wurzelfunktion
f −1 : R+ → R+
√
x 7→
x.
Merke: Den Graphen einer Umkehrfunktion erhält man geometrisch durch Spiegelung an der Winkelhalbierenden, siehe Abbildung 5.2.
Verkettung von Funktionen
Es kommt vor, dass eine Funktion von einer Variablen abhängt, die wiederum ein Funktionswert ist.
Z. B. ist der Luftdruck eine Funktion der Temperatur, und diese kann wiederum eine Funktion der
Zeit sein.
Haben wir eine Funktion
y = f (x)
KAPITEL 5. FUNKTIONEN
181
und eine andere Funktion
x = g (u) ,
so gilt
y = f (g (u)) .
Dies definiert eine neue, verkettete Funktion f ◦ g, welche gegeben ist durch
f ◦ g (u) = f (g (u))
Wir nennen f die äußere Funktion und g die innere Funktion.
Gerade und ungerade Funktionen
Sei f : x 7→ f (x) eine Funktion. Dann ist
f˜ : x → f˜ (x) = f (−x)
die an der y-Achse gespiegelte Funktion: Das Vorzeichen der Variablen ist gerade umgedreht.
Eine Funktion nennt man gerade, wenn ihr Graph spiegelsymmetrisch zur y-Achse ist. Mathematisch
heißt das:
f (x) = f (−x) .
Eine Funktion nennt man ungerade, wenn ihr Graph spiegelsymmetrisch zum Ursprung ist. Mathematisch heißt das:
f (x) = −f (−x) .
“Normalerweise” sind Funktionen weder gerade noch ungerade. Haben sie jedoch diese Eigenschaft, so
kann man manches vereinfachen.
Man überlegt sich leicht:
• Summen und Produkte und Quotienten gerader Funktionen sind wieder gerade.
• Summen ungerader Funktionen sind ungerade.
• Der Kehrwert einer ungeraden Funktion ist ungerade.
• Das Produkt einer geraden und einer ungeraden Funktion ist ungerade.
• Das Produkt zweier ungerader Funktionen ist gerade.
Manchmal ist eine Funktion zwar weder gerade noch ungerade, aber die verschobene Version einer
geraden oder ungeraden Funktion. So ist z. B.
y = (x − 1)2
die um Eins nach rechts verschobene Normalparabel y = x2 , welche bekanntlich gerade ist.
Sei f : x → f (x) eine Funktion und a > 0. Dann ist
fa : x → fa (x) = f (x − a)
die um a nach rechts verschobene Funktion: Man findet dieselben Funktionswerte, die vorher bei
x waren, nun bei x + a. Für a < 0 ist fa entsprechend die um |a| nach links verschobene Funktion.
KAPITEL 5. FUNKTIONEN
182
y
f(x)
a
x
Abbildung 5.3: Sprungstelle.
y
f(x)
a
x
Abbildung 5.4: Polstelle.
Stetigkeit und Grenzwerte
Bei der Untersuchung von Funktionen spielt der Begriff der Stetigkeit eine wichtige Rolle. Anschaulich
bedeutet Stetigkeit ungefähr Folgendes:
Merke: Eine Funktion ist an den Stellen stetig, wo man den Graphen der Funktion zeichnen kann,
ohne dabei den Stift abzusetzen. Dort, wo man den Stift absetzen muss, liegt eine Unstetigkeitsstelle (auch Singularität genannt). Wenn man von Stetigkeit oder Unstetigkeit spricht, so bezieht
sich diese Aussage immer auf einen bestimmten Punkt. Wenn eine Funktion allerdings für jeden Punkt
ihres Definitionsbereiches stetig ist, so sagt man einfach: Die Funktion ist stetig.
Eine Unstetigkeitsstelle (einer ansonsten stetigen Funktion) ist zum Beispiel eine Sprungstelle wie
in Abbildung 5.3 oder auch eine Unendlichkeitsstelle (auch: eine Polstelle oder ein Pol) wie in
Abbildung 5.4 . Es gibt aber noch ein Vielzahl anderer Möglichkeiten der Unstetigkeit. Zum Beispiel
kann eine Funktion in der Nähe der Unstetigkeitsstelle immer schneller (“unendlich schnell”) oszillieren
wie in Abbildung 5.5. Dies ist auch mit dem Computer nicht mehr leicht zu zeichnen.
In Naturwissenschaft und Technik sind die Funktionen in der Regel stetig, aber man muss hin und
wieder auch mit Unstetigkeiten umgehen können. Zum Beispiel kommt eine Sprungstelle bei Einschaltvorgängen vor. Resonanzkurven bei angeregten, ungedämpften Schwingungen haben Polstellen: Dort
gibt es eine “Resonanzkatastrophe”.
KAPITEL 5. FUNKTIONEN
183
Oszillierende Unstetigkeitsstelle
1
0.8
0.6
0.4
y
0.2
0
−0.2
−0.4
−0.6
−0.8
−1
0
0.2
0.4
0.6
0.8
1
x
Abbildung 5.5: Oszillierende Unstetigkeitsstelle bei a = 0.
Wir wollen nun den Begriff der Stetigkeit einer Funktion f in einem Punkt a mathematisch präzise
definieren. Hierzu untersuchen wir das Verhalten der Funktionswerte f (x), wenn sich die Variable x
diesem Punkt nähert. Man schreibt dafür x → a. Wenn sich x auf beliebige Weise dem Punkt a nähert
und sich dann auch f (x) immer mehr f (a) nähert, so heißt die Funktion stetig in a. Man schreibt
dafür:
lim f (x) = f (a)
x→a
bzw.
f (x) → f (a) für x → a
Auch wenn man sich darunter ganz gut etwas vorstellen kann, so bedarf es doch noch einer Erklärung.
Wir haben nämlich den Begriff des Grenzwertes (Limes) in der Form
lim
x→a
bisher noch nicht definiert. Den Begriff des Grenzwertes (Limes) bei Folgen kennen wir aus dem vorherigen Kapitel. Wir schreiben
lim xn = a
n→∞
für eine Zahlenfolge (xn )n∈N , die gegen einen Grenzwert a konvergiert. Alternativ kann man auch
xn → a
(n → ∞)
oder
xn n→∞
−→ a
dafür schreiben.
Wir definieren nun, was ein Grenzwert g von f (x) für x → a bedeutet:
Die Aussage
lim f (x) = g
x→a
heißt, dass
lim f (xn ) = g
n→∞
KAPITEL 5. FUNKTIONEN
184
für jede beliebige Folge xn mit
lim xn = a
n→∞
gilt.
Für uneigentliche Grenzwerte wird diese Definition sinngemäß entsprechend angewendet.
Die obige Definition der Stetigkeit der Funktion f in einem Punkt a bedeutet also genau genommen:
Für jede Folge mit
lim xn = a
n→∞
gilt
lim f (xn ) = f (a) .
n→∞
Bei einer Unstetigkeitsstelle a kann durchaus der Grenzwert existieren, wenn man sich ihm nur von
oben (d.h. von rechts auf der x-Achse) nähert (mit einer monoton fallenden Folge) oder wenn man sich
ihm nur von unten (d.h. von links auf der x-Achse) nähert (mit einer monoton steigenden Folge). Dies
ist z.B. bei der Sprungstelle in Abbildung 5.3 der Fall. Für diese Grenzwerte von oben bzw. von unten
gibt es die Schreibweise
lim
x↓a
bzw.
lim .
x↑a
Ebenfalls gebräuchlich sind auch folgende Schreibweisen:
lim
x→a+
lim
xցa
bzw.
lim
x→a−
lim
xրa
Summen und Produkte von stetigen Funktionen sind stetig. Quotienten von stetigen Funktionen sind
stetig, sofern der Nenner von Null verschieden ist.
Beispiele für stetige Funktionen sind:
f (x) = x2
f (x) = x3 + 3x2
f (x) =
1
1 + x2
Nullstellen und Asymptoten
Man sagt: Eine Funktion f hat im Punkt a ∈ D eine Nullstelle, wenn
f (a) = 0
gilt. Hier schneidet der Graph die x-Achse (Abszisse).
Strebt eine Funktion an einer Definitionslücke a ∈ R gegen ∞ oder −∞ (evtl. durchaus auch unterschiedlich für x ց a und x ր a), so spricht man von einer Polstelle oder einer senkrechten
Asymptote. Abbildung 5.4 zeigt ein Beispiel für eine Polstelle.
Für
lim f (x) = b
x→∞
KAPITEL 5. FUNKTIONEN
185
y
y=b
y=c
x
Abbildung 5.6: Diese Funktion hat zwei waagerechte Asymptoten.
y
y=x
y=−x
f(x)
0
x
Abbildung 5.7: Asymptoten.
bzw.
lim f (x) = c
x→−∞
spricht man von einer waagerechten Asymptote bei ∞ bzw. −∞, siehe Abbildung 5.6.
Es kann auch passieren, dass die Funktion f sich im (positiv oder negativ) Unendlichen einer Geraden
g (x) = mx + b
mit Steigung m und Ordinatenabschnitt b annähert. Man bezeichnet g dann als die Asymptote. In
Abbildung 5.7 hat die Funktion y = f (x) die Asymptote y = x für x → ∞ und y = −x für x → −∞.
Wir sagen, dass eine Funktion f für x → ∞ die Asymptote g hat, falls
lim |f (x) − g (x)| = 0
x→∞
gilt. Für x → −∞ gilt die Definition sinngemäß entsprechend. Die Asymptote g braucht keine Gerade
zu sein, sondern kann auch irgendeine andere Funktion sein.
Hebbare Singularitäten
Es sei a eine Definitionslücke der Funktion f . Es kann passieren, dass der Grenzwert limx→a f (x) = b
trotzdem existiert. Dann kann man f in a stetig ergänzen, indem man einfach diese Stelle durch die
KAPITEL 5. FUNKTIONEN
186
y=si(x)
1
0.8
0.6
y
0.4
0.2
0
−0.2
−0.4
−4
−3
−2
−1
0
x/π
1
2
3
4
Abbildung 5.8: Die Funktion y = si (x)
Definition
f (a) = b
hinzufügt . Man nennt die Stelle a dann eine hebbare Singularität von f .
2
Beispiel:
Dieses Beispiel ist in der Kommunikationstechnik sehr wichtig: Die Funktion
f (x) =
sin x
x
ist auf dem Definitionsbereich D = R {0} erklärt, wobei das Argument des Sinus immer im Bogenmaß
zu verstehen ist. Man kann beweisen, dass
sin x
=1
x→0 x
lim
gilt. Also erhält man mit der Definition 3
f (0) := 1
(das ist gerade die stetige Ergänzung) eine (neue) Funktion, die jetzt auf ganz R definiert ist. Abbildung
5.8 zeigt den Graphen dieser Funktion, die man als si-Funktion bezeichnet.
Beweis der Behauptung
sin x
=1
x
Weil die Funktion gerade ist, reicht es, nur x > 0 zu betrachten. Wir betrachten in Abbildung 5.9
einen Kreissektor mit dem Öffnungswinkel x (im Bogenmaß!) des Einheitskreises. Man sieht aus der
lim
x→0
genommen ist das dann eine neue Funktion, die man z. B. mit f¯ bezeichnen könnte.
schreiben “A := B” für: A ist definiert als B.
2 Streng
3 Wir
KAPITEL 5. FUNKTIONEN
187
tan x
x
sin x
1
Abbildung 5.9: Zur Begründung von sin x ≤ x ≤ tan x.
Zeichnung, dass
gilt. Der Kreissektor hat die Fläche
sin x ≤ x
AKreissektor = π
1
x
= x,
2π
2
und das große Dreick hat die Fläche
1
tan x .
2
Der Kreissektor ist in dem großen Dreieck enthalten. Deshalb muss gelten:
A△ =
1
1
x ≤ tan x.
2
2
Es folgt:
sin x ≤ x ≤ tan x y
1
x
≤
y
1≤
sin x
cos x
sin x
1≥
≥ cos x
x
Damit ist die Funktion sinx x zwischen der Eins und dem Kosinus “eingeklemmt”. Da cos x → 1 für
x → 0, bleibt ihr nichts anderes übrig als sinx x → 1. Unser pragmatischer Umgang mit dem Thema “Stetigkeit”
Streng genommen muss man jede Funktion auf Stetigkeit untersuchen. Wir wollen hier aber nicht bei
allen Funktionen, wo es eigentlich klar ist, die Stetigkeit beweisen. Wir nehmen folgende Tatsachen
zur Kenntnis:
• Polynome, Sinus und Kosinus, Exponentialfunktionen sind stetig auf R (d. h. in jedem Punkt
von R)
• Logarithmus-Funktionen sind stetig auf R+ (d. h. in jedem Punkt von R+ )
Meist ist eine Funktion irgendwie aus anderen “elementaren” Funktions-”Bausteinen” aufgebaut, von
denen wir wissen, ob sie stetig sind. Wir müssen uns vor allem anschauen, ob irgendwo durch Null geteilt wird. Dann muss man mit einer Polstelle rechnen (genau anschauen und Grenzwert betrachten!).
Sprungstellen erkennt man meist aus der Definition der Funktion. Es gibt noch andere Unstetigkeits
stellen als Pole und Nullstellen. Beispiel: Oszillierende Singularitäten, z. B. bei y = sin 1/x2 .
KAPITEL 5. FUNKTIONEN
188
Aufgaben zu Abschnitt 5.1
5.1.1
Aufgabe:
Geben Sie für die folgenden Funktionen den größtmöglichen Definitonsbereich D und den kleinsten
Wertebereich W an und skizzieren Sie die Graphen:
x2 − 1
x+1
1
f (x) = √
1 − x2
a) f (x) =
d)
5.1.2
b) f (x) =
√
4−x
e) f (x) = sin
1
x2
c)
f (x) = lg
x+1
x−1
f ) f (x) = 10−x
2
Aufgabe:
Geben Sie die Nullstellen der folgenden Funktionen an:
a) y = 6x2 − x − 1
3x3 + 5x2 − 2x
c) y =
1 + x2
x2 − 9
e) y =
x+1
5.1.3
b) y = 36x4 − 25x2 + 4
π
d) y = cos x −
4
f)
y = (x − 1) e−x
Aufgabe:
Welche der folgenden Funktionen sind gerade, welche sind ungerade?
a) y = 3x2 + 6
x2 − 1
x2 + 1
g) y = exp (cos x)
b) y = x3 + x + 2
e) y = e−x
d) y =
5.1.4
2
x3 − 2x
x2 − 1
ln 1 − x2
y=
x
c) y =
f)
h) y = tan x − sin 2x
Aufgabe:
Berechnen Sie (ggf. nach elementaren Umformungen) für die folgenden Funktionsausdrücke die jeweils
angegebenen Grenzwerte:
x2 − x − 12
x→−3
x+3
√
1+x−1
d) lim
x→0
x
4
(x + 1) − 1
g) lim
x→0
x
a)
lim
(x − 2) (3x + 1)
x→2
4x − 8
x2
e) lim 2
x→∞ x − 4x + 1
1−x
√
h) lim
x→1 1 −
x
b)
lim
c)
f)
i)
x3 − 2x + 3
x→∞
x2 + 1
4
x −1
lim
x→1 x − 1
√
√ lim
x+2− x
lim
x→∞
KAPITEL 5. FUNKTIONEN
189
y
y = mx + b
y2
y1
b
a
0
x1
x2
x
Abbildung 5.10: Eine lineare Funktion (Gerade).
5.2
Einteilung der Funktionen
Wir wollen die Funktionen klassifizieren, einige Begriffe einführen und einige Eigenschaften untersuchen.
Im Folgenden schreiben wir statt f (x) oft einfach y. Wenn nichts anderes gesagt ist, ist x immer die
Variable.
Lineare und stückweise lineare Funktionen
Die Funktion f mit
f (x) = mx + b
mit reellen Konstanten m und b bezeichnet man als eine lineare Funktion. Der zugehörige Graph ist
geometrisch eine Gerade in der Ebene, siehe Abbildung 5.10 . Wir schreiben dafür auch
y = mx + b .
Diese Gleichung ist eine Geradengleichung in der sogenannten Hauptform. Die Konstante b ist der
y-Achsenabschnitt, die Konstante m die Steigung. Wenn die zwei Punkte (x1 , y1 ) und (x2 , y2 ) auf der
Geraden liegen, so gilt
y2 − y1
m=
x2 − x1
Wir betrachten den zweiten Punkt als variabel (d. h. als die Variable x und den zugehörigen Funktionswert y = f (x)) und schreiben
y − y1
m=
x − x1
Die 2-Punkte-Form der Geraden lautet damit:
y2 − y1
y − y1
=
x − x1
x2 − x1
Alternativ erhalten wir aus dem Ausdruck für die Steigung die Punkt-Steigungs-Form der Geraden
y = m (x − x1 ) + y1 .
KAPITEL 5. FUNKTIONEN
190
y
y=f(x)
x
Abbildung 5.11: Der Graph einer stückweise linearen Funktion.
y
y=|x|
0
x
Abbildung 5.12: Der Graph der Betragsfunktion.
Eine andere Form der Geraden ist die Achsenabschnittsform
x y
+ = 1.
a
b
Offenbar sind a und b Achsenabschnitte auf der x- bzw. y-Achse.
Eine Funktion heißt stückweise linear, wenn man sie aus linearen Funktionen auf einzelnen Teilintervallen zusammensetzen kann wie in Abbildung 5.11 skizziert. Zur Beschreibung solcher Funktionen
braucht man Fallunterscheidungen.
Wir definieren folgende stückweise lineare Funktionen, die in der Technik eine wichtige Rolle spielen:
Betragsfunktion: Der Funktionswert y ist der Betrag der Variablen x:
x: x≥0
y = |x| =
,
−x : x < 0
siehe Abbildung 5.12.
Rechteck-Funktion:
Ein Rechteck der Breite Eins ist definiert als
1 : |x| ≤ 1/2
rect (x) =
.
0 : |x| > 1/2
KAPITEL 5. FUNKTIONEN
191
y
y=rect(x)
−1/2
1
0
1/2 x
Abbildung 5.13: Der Graph der Rechteckfunktion.
y
y=sign(x)
0
x
Abbildung 5.14: Der Graph der Signum-Funktion.
Abbildung 5.13 zeigt den Graphen der Rechteckfunktion.
Signumfunktion:
siehe Abbildung 5.14.
Diese Funktion ist einfach das Vorzeichen der Variablen:

 1: x>0
−1 : x < 0 ,
sign (x) =

0: x=0
Für die Betragsfunktion und die Vorzeichenfunktion gelten die Eigenschaften
x = |x| · sign (x)
und
|x| = x · sign (x) .
Sprungfunktion: Diese Funktion charakterisiert zum Beispiel einen Einschaltvorgang zur Zeit t =
0. Sie ist definiert als
1: t≥0
ε (t) =
0: t<0
Wir haben die Variable hier mit t bezeichnet, weil dieser Buchstabe gerne bei einer Zeitvariablen
verwendet wird.
KAPITEL 5. FUNKTIONEN
Treppenfunktionen
192
sind stückweise konstante Funktionen.
Für die Sprungfunktion und x 6= 0 gilt offenbar folgender Zusammenhang mit der Vorzeichenfunktion
ε (x) =
1
(1 + sign (x)) .
2
Ebenso kann man das Rechteck durch die Sprungfunktion ausdrücken. Für |x| 6= 1/2 gilt:
1
1
−ǫ x−
rect (x) = ǫ x +
2
2
Polynome
Polynome oder ganze rationale Funktionen sind Funktionen, in denen Linearkombinationen von
beliebigen Potenzen der Variablen x vorkommen dürfen. Die höchste vorkommende Potenz ist der
Grad des Polynoms. Ein Polynom vom Grade n ∈ N lautet also
f (x) = a0 + a1 x + a2 x2 + ... + an xn
Oft schreibt man die Reihenfolge so, dass die höchste Potenz von x zuerst kommt:
f (x) = an xn + an−1 xn−1 + ... + a2 x2 + a1 x + a0
Merke: Polynome sind auf ganz R stetige Funktionen.
Ein Polynom n−ten Grades kann maximal bis zu n reelle Nullstellen x1 , x2 , ..., xn haben. Zu jeder
Nullstelle gehört ein Linearfaktor x − xi (i = 1, ..., n). Wenn das Polynom n reelle Nullstellen hat (also
so viele wie möglich), so zerfällt das Polynom vollständig in Linearfaktoren
f (x) = an (x − x1 ) · (x − x2 ) · ... · (x − xn ) .
Dabei können zwei oder mehr Linearfaktoren gleich sein. Man spricht dann von doppelten (oder mehrfachen) Nullstellen. In der Regel ist die Anzahl m der reellen Nullstellen kleiner als n. Man erhält dann
bei der Faktorisierung ein Restpolynom p(x) vom Grade n − m:
f (x) = (x − x1 ) · (x − x2 ) · ... · (x − xm ) · p (x)
Die folgenden Beispiele soll die verschiedenen Fälle verdeutlichen:
Beispiele
1. Das Polynom dritten Grades
f (x) = x3 − 6x2 + 11x − 6
hat die drei Nullstellen x1 = 1, x2 = 2, x3 = 3 und zerfällt deshalb vollständig in Linearfaktoren:
f (x) = (x − 1) (x − 2) (x − 3)
2. Das Polynom dritten Grades
f (x) = x3 − 1
besitzt die Nullstelle x1 = 1 und hat deshalb den Linearfaktor x − 1. Durch Polynomdivision
2
erhält man f (x) (x − 1) = x + x + 1. Dieses Polynom hat keine reelle Nullstelle. Man kann
also nur einen Linearfaktor abspalten und erhält die Faktorisierung
f (x) = (x − 1) · x2 + x + 1 .
KAPITEL 5. FUNKTIONEN
193
3. Das letzte Beispiel ist der Spezialfall einer wichtigen Faktorisierung, die zu kennen oft nützlich
ist: Für n ∈ N gilt
xn+1 − 1 = (x − 1) · xn + xn−1 + . . . + x + 1
Man rechnet das einfach nach, indem man die rechte Seite ausmultipliziert. Für x 6= 1 kann man
diese Gleichung durch x − 1 teilen und erhält so wieder die Summenformel der geometrischen
Reihe.
4. Wir verallgemeinern das letzte Beispiel noch etwas weiter: Allgemein gilt für c ∈ R
xn − cn = (x − c)
n
X
i=1
ci−1 xn−i = (x − c)
n−1
X
cn−1−i xi
i=0
Der Beweis ist eine kleine Übung.
In der Praxis findet man bei Polynomen dritten Grades eine Nullstelle häufig am Besten durch “Raten”.
Probieren Sie erst einmal die Kandidaten 0, ±1, ±2... Dann dividiert man durch den entsprechenden
Linearfaktor und erhält eine quadratische Gleichung, deren Nullstellen sich nach Standardmethoden
finden lassen.
Rationale Funktionen
Rationale Funktionen sind Funktionen der Gestalt
f (x) =
p (x)
,
q (x)
wobei p (x) und q (x) Polynome sind. Der Fall q (x) = 1 wird als ganze rationale Funktion bezeichnet,
andernfalls liegt eine gebrochen rationale Funktion vor.
Bei rationalen Funktionen muss man immer aufpassen, dass man nicht durch Null teilt. Der Definitionsbereich ist so wählen, dass dies ausgeschlossen ist.
Manchmal kann man aus gebrochen rationalen Funktionen noch Linearfaktoren herauskürzen – genau
wie man bei gewöhnlichen Brüchen kürzen kann. In diesem Fall ist zu prüfen, ob eine hebbare Singularität vorliegt und man stetig ergänzen kann. Dies ist z. B. dann der Fall, wenn Nenner und Zähler
beide dieselbe einfache Nullstelle haben.
Polstellen, Nullstellen und hebbare Singularitäten:
ten können.
Wir wollen auflisten, welche Fälle auftre-
1. Damit die rationale Funktion f (x) eine Nullstelle bei x0 hat (d. h. f (x0 ) = 0), muss der Zähler
hier eine Nullstelle haben: p (x0 ) = 0. Das reicht aber noch nicht! Wenn allerdings der Nenner
hier von Null verschieden ist (d. h. q (x0 ) 6= 0), so liegt sicher eine vor. Falls nicht: Siehe Fall 3.
2. Damit die rationale Funktion f (x) eine Polstelle bei x0 hat, muss der Nenner hier eine Nullstelle haben: q (x0 ) = 0. Das reicht aber noch nicht! Wenn allerdings der Zähler hier von Null
verschieden ist (d. h. p (x0 ) 6= 0), so liegt sicher eine vor. Falls nicht: Siehe Fall 3.
3. Falls Zähler und Nenner bei x0 eine Nullstelle haben (p (x0 ) = 0 und q (x0 ) = 0), so muss man
Zähler und Nenner soweit wie möglich in Linearfaktoren zerlegen und soweit wie möglich kürzen.
Danach können Zähler und Nenner nicht mehr gleichzeitig eine Nullstelle haben.
KAPITEL 5. FUNKTIONEN
194
(a) Falls nun der Nenner immer noch eine Nullstelle bei x0 hat (nicht aber der Zähler!), so liegt
eine Polstelle vor.
(b) Falls jetzt weder der Zähler noch der Nenner noch eine Nullstelle hat, so bildet man den
Limes x → x0 und hat damit eine stetige Ergänzung gefunden.
(c) Dasselbe gilt, wenn nur der Zähler noch eine Nullstelle hat. Man kann dann mit dem Funktionswert Null stetig ergänzen, und die stetig ergänzte Funktion hat hier gerade eine Nullstelle.
Bei gebrochen rationalen Funktionen interessiert man sich für das Verhalten im Unendlichen:
1. Die Funktion kann für x → ±∞ asymptotisch gegen eine Konstante streben.
2. Die Funktion kann für x → ±∞ nach (±) ∞ streben: Dann gibt es eine asymptotische Funktion,
z. B. eine asymptotische Gerade.
Welcher Fall gegeben ist, hängt vom Grad des Zähler- und Nennerpolynoms ab.
Beispiele:
1.
f (x)
=
=
x2 + x + 1
2x3 − 3x2 + x + 4
1 + x1 + x12
1
3
2x 1 − 2x
+ 2x1 2 +
2
x3
−→ 0
(x → ±∞) ,
denn der rechte Bruch geht gegen 1 und der linke gegen Null.
2.
f (x) =
=
x4 + 3
x3 + x2 + x + 1
1 + x34
x
−→ ±∞
1 + x1 + x12 + x13
(x → ±∞)
3.
f (x) =
=
x2 − 1
x2 + 1
1 − x12
−→ 1
1 + x12
(x → ±∞)
Wenn man die Pole und Nullstellen sowie das asymptotische Verhalten einer rationalen Funktion kennt,
kann man sie meist schon grob skizzieren. Manchmal hilft es dabei, noch einen einzelnen bekannten
Funktionswert hinzuzunehmen.
Beispiel:
Gegeben sei die Funktion
f (x) =
x2
−1
x2
KAPITEL 5. FUNKTIONEN
195
y
y=1
x=−1
x=1
x
Abbildung 5.15: Der Graph der Funktion f (x) =
x2
x2 −1
.
Die einzige Nullstelle liegt bei x0 = 0. Offenbar ist die Funktion gerade. Wir brauchen daher nur
0 ≤ x < ∞ zu untersuchen. Die einzige Polstelle in diesem Bereich liegt bei x1 = 1. Wir formen nun
etwas um (beliebter Trick):
f (x) =
1
x2 − 1 + 1
=1+ 2
−→ 1
x2 − 1
x −1
(x → ∞)
Für 0 < x < 1 gilt f (x) < 0. Für 1 < x < ∞ ist der zweite Summand in der unteren Darstellung
positiv. Hier gilt f (x) > 1. Bei der Polstelle wechselt also das Vorzeichen. Mit diesen Informationen
können wir den Graphen dieser Funktion grob skizzieren, siehe Abbildung 5.15 .
Algebraische Funktionen
Algebraische Funktionen sind solche, bei denen auch gebrochene Exponenten der Variablen x vorkommen dürfen, d. h. beliebige Wurzeln und Potenzen. Ein Beispiel ist die Funktion
√
3−x
f (x) = √
x−1
Bei algebraischen Funktionen muss man besonders mit dem Definitionsbereich aufpassen: Aus negativen Zahlen kann man bekanntlich im Reellen keine Wurzeln ziehen. Bei der obigen Funktion ist der
größtmögliche Definitionsbereich
D = {x ∈ R : 0 ≤ x ≤ 3, x 6= 1} = [0, 3] {1} .
Auch bei k−ten Wurzeln (k ∈ N)
√
1
k
x = xk
wählt man den Definitionsbereich so, dass der Radikand nicht negativ wird4 :
f : R+
0
4 Das
→
x 7→
R+
0
√
k
x
ist nötig aus Gründen der Konsistenz. Ansonsten würde man bei Anwendung der üblichen Rechenregeln für
Potenzen widersprüchliche Aussagen bekommen.
KAPITEL 5. FUNKTIONEN
196
Die Rechenregeln für Wurzeln und Potenzen setzen wir als bekannt voraus.
Um bei Wurzelfunktionen Grenzwerte zu berechnen, gibt es einen Trick, der im folgenden Beispiel
vorgeführt wird:
Beispiel:
Es sei
f (x) =
√
√
x + 1 − x.
Um den Grenzwert x → ∞ zu berechnen, erinnern wir uns an die dritte binomische Formel und
schreiben
√
√
√
√ x+1+ x
x+1−x
f (x) =
x+1− x √
√ =√
√ y
x+1+ x
x+1+ x
1
f (x) = √
√ −→ 0 (x → ∞)
x+1+ x
Bei der Umkehrung von Wurzelfunktionen und bei der Suche nach Nullstellen muss man aufpassen:
Durch Quadrieren entstehen möglicherweise zusätzliche, scheinbare Lösungen (die gar keine sind). Man
erkennt sie, indem man die Probe macht!
Beispiele:
1. Die Nullstelle(n) der Funktion
f (x) =
√
√
3x + 1 − 2x − 1 − 1
muss (müssen) die folgende Bedingung erfüllen:
√
√
3x + 1 = 1 + 2x − 1 y
√
3x + 1 = 1 + 2x − 1 + 2 2x − 1 y
√
x + 1 = 2 2x − 1 y
x2 + 2x + 1
x2 − 6x + 5
= 8x − 4 y
= 0
Alle Nullstellen der Funktion müssen diese quadratische Gleichung erfüllen. Aber nicht alle Lösungen dieser quadratischen Gleichung müssen automatisch Nullstellen sein. Durch Einsetzen
prüfen wir nach, dass x1 = 1 und x2 = 5 tatsächlich Nullstellen sind.
2. Die Nullstelle(n) der Funktion
f (x) =
√
√
x + 10 − 2x + 6 − 1
muss (müssen) die folgende Bedingung erfüllen:
√
√
x + 10 = 1 + 2x + 6 y
√
x + 10 = 1 + 2x + 6 + 2 2x + 6 y
√
−x + 3 = 2 2x + 6 y
2
x − 6x + 9 = 8x + 24 y
x2 − 14x − 15 =
0
Alle Nullstellen der Funktion müssen diese quadratische Gleichung erfüllen. Aber nicht alle Lösungen dieser quadratischen Gleichung müssen automatisch Nullstellen sein. Durch Einsetzen
prüfen wir nach, dass die erste Lösung x1 = 15 keine Nullstelle ist. Die zweite Lösung x2 = −1
ist dagegen eine Nullstelle.
KAPITEL 5. FUNKTIONEN
197
Transzendente Funktionen
Unter transzendenten Funktionen versteht man alles, was nicht unter die bisher behandelten Kategorien fällt. Hier kommen die speziellen mathematischen Funktionen vor wie z. B. Sinus und Kosinus,
Exponentialfunktion und Logarithmus.
Winkelfunktionen
Wir setzen Vertrautheit mit der geometrischen Definition am Einheitskreis und den Eigenschaften der
Winkelfunktionen sin, cos, tan, cot voraus. Zur Wiederholung sind diese Dinge im Anhang A.3 noch
einmal erklärt.
Merke: Wenn nichts anderes gesagt ist, ist das Argument von Winkelfunktionen immer im Bogenmaß zu verstehen.
Der Verlauf von y = sin (x) und y = cos (x) für 0 ≤ x ≤ 2π ist in Abbildung 5.16 gezeigt.
1
0.8
0.6
0.4
y
0.2
0
−0.2
−0.4
−0.6
−0.8
−1
0
y=sin(x)
y=cos(x)
0.5
1
x/π
1.5
2
Abbildung 5.16: Der Graph von Sinus und Kosinus.
Merke: Der Sinus ergibt sich aus dem Kosinus durch eine Phasenverschiebung um π/2 (=90°) nach
rechts. Es gilt also:
π
sin (x) = cos x −
2
Der Definitionsbereich beider Funktionen lässt sich von dem Grundintervall [0, 2π] durch periodische
Fortsetzung
sin (x + 2πk) = sin (x) k ∈ Z
cos (x + 2πk) = cos (x)
auf die ganze reelle Achse ausweiten. Die Funktionen
tan (x) =
sin (x)
cos (x)
k∈Z
KAPITEL 5. FUNKTIONEN
198
bzw.
cot (x) =
haben Polstellen bei x = k +
1
2
π bzw. x = kπ
cos (x)
sin (x)
(k ∈ Z), siehe Abbildung 5.17 . Diese Punkte sind
4
y=tan(x)
y=cot(x)
Asymptoten
3
2
y
1
0
−1
−2
−3
−4
−1
−0.5
0
x/π
0.5
1
Abbildung 5.17: Der Graph von Tangens und Kotangens.
daher aus dem Definitionsbereich herauszunehmen.
Merke:
Beliebt als Übung für das Gedächtnis sind die beiden Additionstheoreme
sin (x + y) = sin (x) cos (y) + cos (x) sin (y)
und
cos (x + y) = cos (x) cos (y) − sin (x) sin (y) .
Ein Beweis dieser Formel mit Hilfe des Skalarproduktes findet sich im Kapitel über Vektorrechnung.
Leichter merken kann man sich wegen des Satzes des Pythagoras die Formel
sin2 (x) + cos2 (x) = 1 .
Außerdem sollte man folgende Funktionswerte auswendig wissen (Angaben diesmal in Grad):
Winkel α
0°
30°
sin (α)
0
1
60°
2
√
1
2 2
√
1
2 3
90°
1
45°
cos (α)
1
√
1
2 3
√
1
2 2
1
2
0
Um die Umkehrfunktionen zu bilden, muss der Definitionsbereich jeweils so eingeschränkt werden,
dass die Umkehrung eindeutig ist. Auf diesen Intervallen sind die Funktionen monoton steigend bzw.
fallend.
Für den Sinus wählt man dazu D = [−π/2, π/2]. In Abbildung 5.18 ist der Graph der Sinusfunktion
KAPITEL 5. FUNKTIONEN
199
2
y=sin(x)
y=arcsin(x)
π/2
1.5
1
y
0.5
0
π/2
−π/2
−0.5
−1
−1.5
−2
−π/2
−2
−1
0
x
1
2
Abbildung 5.18: Der Graph von Sinus (blau) und Arkussinus (rot).
in diesem Bereich als durchgezogene blaue Kurve zu sehen. Außerhalb dieses Bereiches ist die Kurve
gestrichelt. Spiegelt man die durchgezogene blaue Kurve an der Diagonalen, so erhält man als Graph
der Arkussinus-Funktion die rote Kurve.
Für den Kosinus wählt man D = [0, π] als Definitionsbereich, auf dem die Funktion umgekehrt werden
kann.
Die Umkehrfunktionen bezeichnet man mit
y = arcsin (x) ,
D = [−1, 1]
y = arccos (x) ,
D = [−1, 1] .
und
Die Graphen beider Arkusfunktionen sind in Abbildung 5.19 dargestellt. Es gilt:
arcsin (x) + arccos (x) =
π
2
Dies ist nur eine andere Schreibweise für folgende Tatsache:
φ+ψ =
π
⇒ sin φ = cos ψ
2
Die Umkehrfunktionen des Tangens
y = arctan (x) ,
D=R
ist in Abbildung 5.20 dargestellt.
Die Umkehrfunktion des Kotangens heißt entsprechend Arkuskotangens (arccot). Man verwendet sie
aber eher selten.
KAPITEL 5. FUNKTIONEN
200
1
y=arccos(x)
y=arcsin(x)
y=π/2
y/π
0.5
0
−0.5
−1
−0.5
0
x
0.5
1
Abbildung 5.19: Der Graph von Arkussinus (rot) und Arkuskosinus (blau).
Exponentialfunktion und Logarithmus
Eine Funktion der Gestalt
f (x) = ax
heißt Exponentialfunktion zur Basis a ∈ R+ . Für die Basis a = 10 und a = 2 ist Ihnen das sicher
schon gelegentlich begegnet. Für alle Exponentialfunktionen gilt: D = R und W = R+ . Sie sehen alle
so aus wie in Abbildung 5.21 blau skizziert. Für x → −∞ geht die Funktion asymptotisch gegen Null,
für x → ∞ (sehr stark) gegen Unendlich. Es gilt f (0) = 1.
Wir lernen jetzt eine wichtige, spezielle Basis kennen: Die Eulersche Zahl e. Wir definieren sie als
den Grenzwert
n
1
e := lim 1 +
n→∞
n
Auf den Beweis, dass dieser Grenzwert existiert, wollen wir hier verzichten. Wir definieren außerdem
die (Eulersche) Exponentialfunktion als
x n
.
exp (x) := lim 1 +
n→∞
n
Man kann zeigen, dass dies gerade die Exponentialfunktion zur Basis der Eulerschen Zahl e ist. Es gilt
also:
exp (x) = ex
Bemerkung: Exponentielles Abfallverhalten spielt eine wichtige Rolle in Natur und Technik, z. B.
bei der Entladung eines Kondensators, bei der Abkühlung einer Tasse Kaffee oder bei dem radioaktiven
Zerfall. Man hat es dort mit Zeitfunktionen der Art
f (t) = f (0) exp (−t/τ )
(t ≥ 0)
zu tun. Die Zeitkonstante τ > 0 bestimmt die Geschwindigkeit der Entladung bzw. der Abkühlung
bzw. des Zerfalls.
KAPITEL 5. FUNKTIONEN
201
y=arctan(x)
0.5
0.4
0.3
0.2
y/π
0.1
0
−0.1
−0.2
−0.3
−0.4
−0.5
−10
−5
0
x
5
10
Abbildung 5.20: Der Graph des Arkustangens.
Die Umkehrfunktion der Exponentialfunktion zur Basis a heißt Logarithmus zur Basis a. Man
schreibt dafür
y = loga (x)
Spezielle Symbole gibt es für den Zehnerlogarithmus
log10 (x) =: lg (x)
und den natürlichen Logarithmus (logarithmus naturalis)
loge (x) =: ln (x)
Für alle Logarithmen ist D = R+ und W = R. Es gilt log (1) = 0. Bei x = 0 gibt es eine senkrechte
Asymptote und für x → ∞ strebt der Logarithmus (sehr schwach) gegen Unendlich. Abbildung 5.21
(rot) zeigt den Graphen der Logarithmusfunktion, der sich aus dem der Exponentialfunktion durch
Spiegelung an der Winkelhalbierenden ergibt.
Man muss folgende Rechenregeln für Logarithmen sicher beherrschen:
1.
log (ab) = log (a) + log (b)
2.
log
3.
a
b
(für a, b > 0)
= log (a) − log (b)
log ab = b log (a)
(für a, b > 0)
(für a > 0)
Die Exponentialfunktion zur Basis a ∈ R+ kann man dann folgendermaßen ausdrücken:
x
f (x) = ax = eln a = ex ln a
Entsprechend kann man für a ∈ R schreiben5 :
a
f (x) = xa = eln x = ea ln x
Logarithmen zu verschiedenen Basen rechnet man wie im folgenden Beispiel beschrieben um:
5 Streng genommen sind nach dem bisher Gesagten Potenzen nur für rationale Exponenten definiert, nicht aber für
beliebige reelle Exponenten. Man kann diese Gleichungen als Definition für solche Potenzen ansehen.
KAPITEL 5. FUNKTIONEN
202
y
f (x) = ax
f −1 = loga (x)
1
1
Abbildung 5.21: Exponentialfunktion (blau) und Logarithmus (rot).
x
KAPITEL 5. FUNKTIONEN
Beispiel:
203
Sei x > 0.
y = lg (x) ⇔ x = 10y
ln (x) = y ln (10) = lg (x) ln (10)
lg (x) =
ln (x)
ln (10)
Der Logarithmus steigt sehr schwach an, nämlich schwächer als jede Wurzelfunktion. Es gilt (zunächst
ohne Beweis) für beliebiges n ∈ N:
ln (x)
√
−→ 0 (x → ∞)
n
x
Die Exponentialfunktion dagegen steigt sehr stark an, nämlich stärker als jede Potenz. Es gilt (zunächst
ohne Beweis) für beliebiges n ∈ N:
exp (x)
−→ ∞
xn
(x → ∞)
Hyperbelfunktionen
Die Hyperbelfunktionen sinh (Sinus Hyperbolicus), cosh (Cosinus Hyperbolicus), tanh (Tangens
Hyperbolicus) und coth (Cotangens Hyperbolicus) basieren auf der Exponentialfunktion exp. Die
Beziehung zu den Winkelfunktionen, die durch die Namen suggeriert wird, ergibt sich durch den Zusammenhang zwischen den Winkelfunktionen und der komplexen Exponentialfunktion. Wir erinnern
uns an die Eulerschen Formeln:
cos (x) =
sin (x) =
1 jx
e + e−jx
2
1 jx
e − e−jx
2j
Die Hyperbelfunktionen sind ähnlich definiert, - man lässt einfach überall die imaginäre Einheit j weg:
cosh (x) =
1 x
e + e−x
2
1 x
e − e−x
2
Der Definitionsbereich ist ganz R. Offensichtlich ist der cosh eine gerade Funktion und der sinh eine
ungerade. Die Graphen der beiden Funktionen sind in Abbildung 5.22 dargestellt.
sinh (x) =
Es gilt
cosh2 (x) − sinh2 (x) = 1
Die Definitionsgleichungen kann man nach der Exponentialfunktion auflösen:
e
ex
= cosh (x) + sinh (x)
−x
= cosh (x) − sinh (x)
Weiter definiert man
tanh (x) =
sinh (x)
cosh (x)
coth (x) =
cosh (x)
sinh (x)
und
KAPITEL 5. FUNKTIONEN
204
30
20
y
10
0
−10
−20
y=cosh(x)
y=sinh(x)
−30
−4
−3
−2
−1
0
x
1
2
3
4
Abbildung 5.22: Der Graph der Hyperbelfunktionen.
Die Umkehrfunktionen der Hyperbelfunktionen nennt man Area-Funktionen. Sie lassen sich alle
durch den natürlichen Logarithmus ausdrücken:
p
arcosh (x) = ln x + x2 − 1 , D = |1, ∞)
p
arsinh (x) = ln x + x2 + 1 , D = R
1+x
1
, D = (−1, 1)
ln
artanh (x) =
2
1−x
1
x+1
arcoth (x) =
, D = {x ∈ R : |x| > 1}
ln
2
x−1
KAPITEL 5. FUNKTIONEN
205
Aufgaben zu Abschnitt 5.2
5.2.1
Aufgabe:
Geben Sie die Gleichung der durch die Punkte (1,2) und (-3,3) verlaufenden Geraden in der 2-PunkteForm, der Hauptform, der Punkt-Steigungsform und der Achsenabschnittsform an.
5.2.2
Aufgabe:
Zerlegen Sie die folgenden Polynome in möglichst viele Linearfaktoren und geben Sie die Produktdarstellung an:
5.2.3
a) y = x3 − 4x2 + 4x − 16
b)
c) y = −x3 − 6x2 − 12x − 8
d)
1
(3x2 − 1)
2
y = x3 − 2x2 − 5x + 6
y=
Aufgabe:
Eine Polynom-Funktion 4. Grades y = f (x) soll aufgrund der folgenden Eigenschaften bestimmt werden:
• Die Funktion ist gerade.
• Die Funktion hat Nullstellen bei x1 = 3 und x2 = 6.
• Die Kurve (Graph der Funktion) schneidet die Ordinate bei y = −3.
5.2.4
Aufgabe:
Bestimmen Sie für die folgenden gebrochen rationalen Funktionen Nullstellen, Unstetigkeitstellen (hebbare oder Polstellen) sowie Asymptoten im Unendlichen und skizzieren Sie grob den Funktionsverlauf:
5.2.5
a)
y=
x2 − 4
x2 + 1
c)
y=
x3 − 5x2 + 8x − 4
x3 − 6x2 + 12x − 8
b)
y=
x3 − 6x2 + 12x − 8
x2 − 4
2
d)
y=
(x − 1)
(x + 1)2
Aufgabe:
Finden Sie die Nullstellen der folgenden Funktionen. Geben Sie die Definitionsbereiche an!
a)
b)
√
f (x) = x − 2 x
f (x) = 1 +
c)
d)
f (x) = x + 1 −
e)
f (x) = 3 −
√
r
1
3
2x2 + x +
2
2
x−4−
√
7−x−
√
x−2
f (x) =
√
√
x + 5 − 2x + 3 − 1
f (x) =
q
√
x + 2 + 2x − 4 − 4
f)
√
3−x
KAPITEL 5. FUNKTIONEN
5.2.6
206
Aufgabe:
Die Sinusfunktion y = sin(x) ist im Intervall [0, π] durch eine Parabel zu approximieren, die mit ihr
in den beiden Nullstellen und dem Maximum übereinstimmt. Wie lautet die Funktionsgleichung der
Parabel ?
5.2.7
Aufgabe:
Es sei x ∈ (π/2, π). Bestimmen Sie jeweils die drei anderen trigonometrischen Funktionen desselben
Arguments (ohne Verwendung eines Taschenrechners):
a) sin x = 0.6
b) cot x = −0.75
5.2.8
Aufgabe:
Vereinfachen Sie die folgenden trigonometrischen Ausdrücke:
c)
b)
a)
cos(x) tan(x)
sin(x)
sin(x)
1 + tan12 (x)
1
− sin(x) tan(x)
cos(x)
d)
e)
2
(sin(x) + cos(x)) − 2 sin(x) cos(x)
s
1
sin(x) tan(x) +
tan(x)
cos(x)
f)
s
5.2.9
1 − sin(x)
1 + sin(x)
(ohne Wurzel!)
Aufgabe:
Drücken Sie die jeweilige Umkehrfunktion f −1 der folgenden Hyperbelfunktionen jeweils durch den
natürlichen Logarithmus aus:
f (x) = sinh (x)
f (x) = cosh (x)
f (x) = tanh (x)
f (x) = coth (x)
——————————————
Kapitel 6
Differentialrechnung
6.1
Der Begriff der Ableitung und elementare Rechenregeln
Der Begriff der Ableitung beschreibt den Grad der Änderung einer Funktion in Abhängigkeit von ihrer
Variablen. Isaac Newton musste erst die Differentialrechnung erfinden1 und diesen Begriff einführen,
um die Geschwindigkeit als Änderung des Ortes zu definieren. Wir bleiben bei diesem Beispiel
und wollen die Geschwindigkeit als Ableitung des Ortes nach der Zeit erklären.
Abbildung 6.1 zeigt den Verlauf der zurückgelegten Wegstrecke s (t) als Funktion der Zeit t. Um die
Geschwindigkeit v zu ermitteln, muss man zu zwei Zeitpunkten t1 und t2 die zugehörigen Wegstrecken
s1 und s2 messen. Die Geschwindigkeit als “Weg pro Zeit” sollte dann ungefähr der Quotient von
Wegdifferenz ∆s = s2 − s1 und Zeitdifferenz ∆t = t2 − t1 sein:
v≈
∆s
∆t
Dieser Differenzen-Quotient ist die Steigung der Geraden durch die Punkte (t1 , s1 ) und (t2 , s2 ). Diese Gerade nennt man Sekante. Dieser Differenzenquotient ist aber nur die mittlere Geschwindigkeit während des betrachteten Intervalles. Wir wollen aber die Momentangeschwindigkeit zu
einem gegebenen Zeitpunkt definieren, z. B. zur Zeit t1 . Geometrisch ist dies gerade die Steigung der
Tangente an die Kurve im Punkt (t1 , s1 ). Offenbar nähert sich die Sekante der Tangente immer mehr
an, wenn sich der zweite Zeitpunkt t2 dem ersten Zeitpunkt t1 nähert. Für den Grenzfall t2 → t1
bekommt man exakt die Tangente. Wir definieren also die Geschwindigkeit zur Zeit t1 als
v (t1 ) = lim
t2 →t1
s (t2 ) − s (t1 )
t2 − t1
Für eine beliebige Zeit t ist die (Momentan-) Geschwindigkeit also definiert als
v (t) = lim
∆t→0
s (t + ∆t) − s (t)
.
∆t
Man sagt: v (t) ist die Ableitung von s (t) nach der Zeit.
1 ...
zeitgleich mit Gottfried Wilhelm Leibniz in Hannover.
207
KAPITEL 6. DIFFERENTIALRECHNUNG
208
s
s(t)
s2
Sekante
Tangente zur Zeit t1
s1
t1
t2
t
Abbildung 6.1: Zum Begriff der Geschwindigkeit.
Schreibweisen für die Ableitung:
• Der Ingenieur oder Physiker schreibt diesen Grenzwert auch gerne etwas kürzer und einprägsamer
∆s
,
∆t→0 ∆t
v = lim
wobei die Variable t einfach weggelassen wurde (wenn man weiß, wie es gemeint ist).
• Für die zeitliche Ableitung hat Newton den Punkt über der Funktion eingeführt. Man schreibt
dann
∆s
ṡ = lim
∆t→0 ∆t
• Ähnlich ist die Schreibweise mit dem Strich, wie man sie in de Schule lernt und wie wir sie auch
meist verwenden werden:
s (t + ∆t) − s (t)
.
s′ (t) = lim
∆t→0
∆t
Hier haben wir die Variable t wieder ordentlich dazugeschrieben.
• Wenn man die Funktion
y = f (x)
schreibt, schreibt man für die Ableitung auch gerne
y ′ = f ′ (x) .
Wir werden diese Schreibweise auch gelegentlich verwenden. Sie ist sehr verbreitet, aber etwas
ungenau: Denn f ist die Funktion, aber y = f (x) ist der Funktionswert an der Stelle x, also
eine Zahl, und eine Zahl kann man nicht ableiten. Die Ableitung an der Stelle x ist f ′ (x), also
wieder eine Zahl. Dagegen kennzeichnet f ′ wieder eine Funktion, nämlich die Ableitungsfunktion.
KAPITEL 6. DIFFERENTIALRECHNUNG
209
s
s(t)
Sekante
s2
Tangente zur Zeit tm
s1
t1
tm
t2
t
Abbildung 6.2: Mittlere Geschwindigkeit und Mittelwertsatz.
Naturwissenschaftler und Ingenieure nehmen es mit der Schreibweise oft nicht so genau wie
Mathematiker, auch wenn ihnen der Unterschied zwischen Funktion und Funktionswert durchaus
bewusst ist.
• Die Schreibweise als Differentialquotient (=“infinitesimaler Differenzenquotient”) geht auf
Gottfried Wilhelm Leibniz zurück, der die Differentialrechnung praktisch zeitgleich zu Newton
entwickelt hat:
∆s
ds
= lim
∆t→0 ∆t
dt
Diese Schreibweise suggeriert sehr schön: Im Grenzübergang nähern sich die Differenzen ∆t und
∆s den (“unendlich kleinen”) Differentialen dt und ds an, mit denen man im Prinzip rechen darf
wie mit Brüchen. Wenn diese Sichtweise mathematisch auch etwas fragwürdig ist: Es funktioniert
in der Praxis sehr gut!
Mittelwertsatz der Differentialrechnung
mittlere Geschwindigkeit
Wir haben oben den Differenzenquotienten ∆s/∆t als
s2 − s1
t2 − t1
identifiziert. Es gibt nun tatsächlich (mindestens) einen Zeitpunkt tm zwischen t1 und t2 , in dem die
Momentangeschwindigkeit ṡ genau gleich der mittleren Geschwindigkeit in diesem Zeitintervall ist
v̄ =
ṡ (tm ) =
s2 − s1
.
t2 − t1
Dies ist der Mittelwertsatz der Differentialrechnung. Nach Abbildung 6.2 erscheint dieser Sachverhalt anschaulich fast selbstverständlich. Der Mathematiker verlangt hier natürlich nach einem Beweis, auf den wir aber hier verzichten wollen.
Mit Hilfe des Mittelwertsatzes kann man die folgende Aussage beweisen:
Merke: Falls für alle x im Definitionsbereich f ′ (x) = 0 gilt, dann ist diese Funktion konstant. Das
ist doch anschaulich auch klar!
KAPITEL 6. DIFFERENTIALRECHNUNG
210
Ein Spezialfall des Mittelwertsatzes ist der
Satz von Rolle Es sei I = [a, b] ein Intervall und f eine differenzierbare (s.u.) Funktion, die an
den Randpunkten des Intervalles denselben Wert annimmt: f (a) = f (b) = c (c ∈ R). Dann gibt es
(mindestens) ein xm ∈ I, so dass
f ′ (xm ) = 0
gilt.
Der Satz von Rolle kommt beweistechnisch vor dem Mittelwertsatz und sei hier der Vollständigkeit
halber erwähnt.
Wir wollen noch etwas bei dem Beispiel aus der Kinematik2 bleiben und die Zeitableitung ausrechnen
für die Bewegung mit konstanter angreifender Kraft. Hier gilt
s (t) =
1 2
at .
2
Die Größe a nennt man Beschleunigung. Der Differenzenquotient für diese Funktion lautet
2
2
a (t + ∆t) − t2
a 2t · ∆t + (∆t)
s (t + ∆t) − s (t)
=
=
−→ a · t
∆t
2
∆t
2
∆t
(∆t → 0)
Also gilt
d a 2
t =a·t
dt 2
Hier haben wir die Schreibweise mit dem Differentialoperator
d
(· · · )
dt
eingeführt, den man vor den Ausdruck schreiben kann, durch den die Funktion gegeben ist, z. B.
ds
d
s (t) =
.
dt
dt
Eine konstante Bewegung mit konstanter Geschwindigkeit v0 ist
s (t) = v0 t
Offenbar gilt
d
(v0 t) = v0
dt
Wenn sich der Ort gar nicht ändert, ist die Zeitableitung Null:
d
(s0 ) = 0
dt
Wir haben bis jetzt verschiedene Beispiele betrachtet und wollen nun den Begriff der Ableitung und
der Differenzierbarkeit noch mathematisch präzise definieren:
Definition: Es sei D = (a, b) ein Intervall auf der reellen Achse und
f : D → R,
x 7→ f (x)
2 Kinematik
ist die Lehre von der Bewegung.
KAPITEL 6. DIFFERENTIALRECHNUNG
211
eine stetige Funktion auf diesem Intervall. Falls der Grenzwert
f (x + h) − f (x)
h→0
h
f ′ (x) := lim
für den Punkt x ∈ D existiert, so heißt f differenzierbar in x. Den Grenzwert f ′ (x) nennt
man die Ableitung im Punkt x und die Funktion f ′ : x 7→ f ′ (x) die Ableitungsfunktion. Wenn
der Grenzwert für jeden Punkt x ∈ D existiert, so heißt f differenzierbar auf D.
Merke: Jede differenzierbare Funktion ist stetig, aber nicht jede stetige Funktion ist differenzierbar.
Beispiel für eine nicht differenzierbare Funktion: Die Betragsfunktion
y = |x|
ist für x = 0 nicht differenzierbar.
Höhere Ableitungen Die Ableitung f ′ einer Funktion f ist wieder eine Funktion. Wenn diese wieder
differenzierbar ist, nennt man deren Ableitung f ′′ die zweite Ableitung von f . Deren Ableitung f ′′′
wiederum heißt dritte Ableitung von f usw. Die vierte Ableitung schreibt man besser als f (4) und
die n-te Ableitung als f (n) (n = 0, 1, 2, ...). Die nullte Ableitung ist die Funktion selber: f (0) = f .
Gebräuchlich ist auch die Schreibweise y ′ , y ′′ , y ′′′ usw.
Mit dem Differentialoperator d/dx kann man die n-te Ableitung auch elegant als n-fache Anwendung
dieses Operators schreiben:
oder auch als
d
dx
n
f=
dn f
dxn
dn y
dxn
Will man darauf hinweisen, dass die n-te Ableitung der Funktion an der Stelle x = x0 auszuwerten ist,
ist folgende Schreibweise möglich
dn f dxn x=x0
Tangente und Normale an eine Kurve Es sei y0 = f (x0 ). Die Ableitung f ′ (x0 ) gibt die Steigung
der Tangente an den Graphen von f im Punkt (x0 , y0 ) an, siehe Abbildung 6.3 . Aus der PunktSteigungsform der Geraden erhält man damit direkt die Tangentengleichung:
y = (x − x0 ) f ′ (x0 ) + y0
Die Normale in diesem Punkt ist die Gerade durch den Punkt, welche senkrecht auf der Tangente
−1
steht. Sie hat die Steigung − (f ′ (x0 )) . Dass dies passt, sieht man ganz leicht, indem man das
Skalarprodukt zwischen Tangenten- und Normalenvektor bildet:
1
1
=0
·
−1
f ′ (x0 )
− (f ′ (x0 ))
Die Normalengleichung lautet also
y=−
x − x0
+ y0
f ′ (x0 )
KAPITEL 6. DIFFERENTIALRECHNUNG
y
212
y = f (x)
Normale
Tangente
y0
x
x0
Abbildung 6.3: Tangente und Normale an den Graphen der Funktion.
Die wichtigsten Ableitungen im Überblick
Die folgenden Ableitungen haben wir schon hergeleitet:
f (x) = c ⇒ f ′ (x) = 0
f (x) = x ⇒ f ′ (x) = 1
f (x) = x2 ⇒ f ′ (x) = 2x
Nun wollen wir noch die Ableitung der folgenden Funktion herleiten:
f (x) =
1
1
⇒ f ′ (x) = − 2
x
x
Beweis:
f (x + h) − f (x)
lim
h→0
h
=
=
=
1
x+h
lim
h
h→0
lim
h→0
−
−
1
x
!
−1
x (x + h)
1
x2
In Tabelle 6.1 sind die Ableitungen einiger wichtiger Funktionen zusammen gestellt. Eine ausführlichere
Diskussion und Beweise dazu kommen an späterer Stelle.
Rechenregeln
Um konkret Ableitungen auszurechnen, braucht man ein paar Rechenregeln, die man sicher beherrschen3 muss. Mit a, b, c usw. bezeichnen wir reelle Konstanten. Funktionen bezeichnen wir im folgenden
mit f , g, usw., die Ableitungen mit f ′ , g ′ usw.
3 Eine
notwendige Bedingung dafür ist, dass man sie mindestens auswendig weiß.
KAPITEL 6. DIFFERENTIALRECHNUNG
213
Tabelle 6.1: Einige wichtige Ableitungen
f (x)
f ′ (x)
1.
c
0
c∈R
2.
xr
rxr−1
r ∈ R {0}
3.
ln |x|
1
x
x 6= 0
4.
arctan (x)
1
1 + x2
5.
arcsin (x)
1
√
1 − x2
6.
sin x
cos x
7.
cos x
− sin x
8.
sinh x
cosh x
10.
cosh x
sinh x
11.
tan x
1
= 1 + tan2 x
cos2 x
12.
cot x
13.
exp x
−
1
sin2 x
exp x
x2 < 1
KAPITEL 6. DIFFERENTIALRECHNUNG
214
Betrachtungen über den Definitionsbereich lassen wir der Einfachheit halber weg und setzen es als
selbstverständlich voraus, dass nicht durch Null dividiert werden darf und dass Umkehrfunktionen
eindeutig sein müssen.
Zunächst einmal gilt die Linearität der Ableitung (auch Faktor- und Summenregel genannt):
(af + bg)′ = af ′ + bg ′
Diese Aussage folgt aus der Linearität der Grenzwertbildung und bedarf keines Beweises.
Erinnern wir uns an das einführende Beispiel mit der Bewegung. Eine konstant beschleunigte Bewegung
mit Anfangsgeschwindigkeit v0 und Anfangsort s0 wird beschrieben durch
a
s (t) = t2 + v0 t + s0
2
Die Summe differenzieren wir gliedweise und erhalten
ṡ (t) = at + v0 .
Die Ableitungen der Summanden wurden schon am Anfang dieses Abschnitts berechnet.
Die Produktregel
Das Produkt zweier Funktionen wird durch das Produkt der jeweiligen Funktionswerte erklärt, d. h.
(f · g) (x) = f (x) g (x)
Für die so definierte Produkt-Funktion f · g gilt die Produktregel
′
(f g) = f · g ′ + f ′ · g
Die Reihenfolge der Summanden ist natürlich Geschmackssache. Viele finden es schöner, erst den ersten
Faktor abzuleiten:
′
(f g) = f ′ · g + f · g ′
Beispiel für die Produktregel:
y = 3x2 + 2x − 1 · x2 + 2
y ′ = (6x + 2) · x2 + 2 + 3x2 + 2x − 1 · (2x) = ...
Beweis für die Produktregel:
f (x + h) g (x + h) − f (x) g (x)
h
f (x + h) g (x + h) − f (x + h) g (x) + f (x + h) g (x) − f (x) g (x)
lim
h→0
h
g (x + h) − g (x) f (x + h) − f (x)
lim f (x + h)
+
g (x)
h→0
h
h
f (x + h) − f (x)
g (x + h) − g (x)
+ lim
g (x)
lim f (x + h)
h→0
h→0
h
h
f (x) g ′ (x) + f ′ (x) g (x) lim
h→0
=
=
=
=
Anwendung: Die Regel
y = xn ,
n ∈ N ⇒ y ′ = nxn−1
können wir mit Hilfe der Produktregel und der Technik der vollständigen Induktion leicht
zeigen.
KAPITEL 6. DIFFERENTIALRECHNUNG
215
Die Methode der vollständigen Induktion
Wir wollen an diesem Beispiel die vom Grundgedanken her einleuchtende Methode der vollständigen
Induktion erklären: Es soll eine Aussage bewiesen werden, die für jede natürliche Zahl n gilt (z.
B. die in der obigen Gleichung). Nehmen wir an, dass die Aussage für n = 1 richtig ist (was man
meist leicht nachprüfen kann). Man nennt das den Induktionsanfang. Wir möchten nun folgenden
Induktionsschritt beweisen: Es sei k eine beliebige natürliche Zahl mit k ≥ 2. Aus der Richtigkeit
der Aussage für n = k − 1 führt man den Beweis, dass die Aussage dann auch für n = k richtig ist.
Ist dieser Nachweis gelungen, besagt der Induktionsschluss, dass die Aussage für alle natürlichen
Zahlen gilt. Denn: Für n = 1 gilt sie ja. Wegen des Induktionsschrittes gilt sie deshalb auch auch für
n = 2 und deshalb auch für n = 3 und so weiter.
Man spricht manchmal von unvollständiger Induktion, wenn man aus der Gültigkeit der Aussage
für ein paar Beispiele (z. B. für n = 1, 2, 3, 4) fälschlicherweise folgert, dass sie für alle n ∈ N gilt.
Hierzu ein
Physikerwitz (unter Mathematikern sehr beliebt)
Wie beweist ein Physiker, dass alle ungeraden Zahlen größer als 1 Primzahlen sind? Ganz
einfach: 3 ist eine Primzahl; 5 ist eine Primzahl; 7 ist eine Primzahl; 9 ist ein Messfehler; 11 ist eine Primzahl; 13 ist eine Primzahl. Das sind genug Messungen, - Feierabend!
Beweis durch vollständige Induktion: Wir wissen schon, dass die Aussage für n = 1 gilt (Induktionsanfang). Wir können also annehmen, dass es eine natürliche Zahl k gibt, so sie für n = 1, ..., k − 1
gilt, wobei k ≥ 2 gilt. Mit Hilfe der Produktregel zeigen wir nun (Induktionsschritt ): Wenn die
Aussage für n = k − 1 gilt, dann gilt sie auch für n = k und damit für alle natürlichen Zahlen
(Induktionsschluss). Der Induktionsschritt geht so:
d k
d
d
d k−1
k−1
+
x =
x·x
=x·
x
x · xk−1
dx
dx
dx
dx
Daraus folgt
d k
x = x · (k − 1) xk−2 + xk−1 = kxk−1 ,
dx
was zu beweisen war. Wir berechnen jetzt die n-te Ableitung der Funktion
y = xn ,
n ∈ N.
Es gilt
y′
y ′′
=
=
y ′′′
=
..
.
=
y (n)
nxn−1
(n − 1) nxn−1
(n − 2) (n − 1) nxn−1
1 · 2 · . . . (n − 1) n
Wir benutzen die Schreibweise
(sprich: n Fakultät) und schreiben:
n! = 1 · 2 · . . . (n − 1) n
dn n
x = n!
dxn
KAPITEL 6. DIFFERENTIALRECHNUNG
216
Die Kettenregel
Mit dieser Regel kann man verkettete Funktionen (also Funktionen von Funktionen) der Gestalt f ◦ g
ableiten. Wir erinnern uns an die Bezeichnung
f ◦ g (x) = f (g (x))
und nennen wieder f die äußere Funktion und g die innere Funktion. Die Ableitung f ′ der äußeren
Funktion nennt man äußere Ableitung und die Ableitung g ′ der inneren Funktion nennt man innere
Ableitung. Nach der Kettenregel ist die Ableitung von f ◦ g einfach das Produkt von äußerer und
innerer Ableitung:
′
(f ◦ g) = f ′ · g ′
Dies ist sehr kompakt geschrieben. Man muss die äußere und die innere Funktion erkennen und beachten, was man jeweils einsetzten muss:
′
(f ◦ g) (x) = f ′ (g (x)) · g ′ (x)
Das ist korrekt, aber etwas unübersichtlich. Gut merken kann man sich die kompakte Schreibweise mit
Differentialquotienten
dy du
dy
=
·
dx
du dx
Mathematiker nennen das manchmal etwas abschätzig die “Physikerschreibweise”. Wir haben einfach
eine “Zwischenvariable”
u = g (x)
für die innere Funktion eingeführt und mit deren Differential du erweitert. Im Prinzip funktioniert so
auch der Beweis der Kettenregel: Man erweitert für den Differenzenquotienten mit ∆u, d. h.
∆y
∆y ∆u
=
·
∆x
∆u ∆x
und führt den Grenzübergang ∆x → 0 durch. Das ist der Kern des folgenden Beweises, der ausführlich
hingeschrieben nur komplizierter aussieht (es aber nicht wirklich ist):
Beweis der Kettenregel:
lim
∆x→0
f ◦ g (x + ∆x) − f ◦ g (x)
∆x
=
lim
∆x→0
f (g (x + ∆x)) − f (g (x))
∆x
Wir erweitern den Bruch auf der rechten Seite mit g (x + ∆x) − g (x) und erhalten
f (g (x + ∆x)) − f (g (x)) g (x + ∆x) − g (∆x)
lim
∆x→0
g (x + ∆x) − g (x)
∆x
g (x + ∆x) − g (∆x)
f (g (x + ∆x)) − f (g (x))
· lim
= lim
∆x→0
∆x→0
g (x + ∆x) − g (x)
∆x
Der Limes im rechten Faktor ergibt sich nach Definition zu
g (x + ∆x) − g (∆x)
lim
= g ′ (x)
∆x→0
∆x
Beim linken Faktor setzen wir u = g (x) und ∆u = g (x + ∆x) − g (x) Wegen der vorausgesetzten
Stetigkeit von g gilt ∆u → 0 für ∆x → 0. Der Limes im linken Faktor ergibt damit
f (g (x + ∆x)) − f (g (x))
f (u + ∆u) − f (u)
lim
= lim
∆x→0
∆u→0
g (x + ∆x) − g (x)
∆u
′
= f (u)
= f ′ (g (x))
KAPITEL 6. DIFFERENTIALRECHNUNG
217
Damit gilt
lim
∆x→0
f ◦ g (x + ∆x) − f ◦ g (x)
= f ′ (g (x)) · g ′ (x) ,
∆x
was zu beweisen war. Beispiel für die Kettenregel: Es sei
y = x2 + 3x − 1
Die innere Funktion ist
7
u = g (x) = x2 + 3x − 1
und die äußere Funktion ist
y = f (u) = u7 .
Dann gilt
y ′ = 7 x2 + 3x − 1
Anwendung: Es sei
f (x) =
6
· (2x + 3) .
1
g (x)
Die äußere Funktion ist die Funktion u 7→ 1/u (“Eins durch”), die innere ist die Funktion
x 7→ u = g (x), von der wir annehmen, dass sie 6= 0 ist. Wir verwenden zur Abwechslung
die “Physikerschreibweise”
d 1
d 1 du
u′
=
=− 2
dx u
du u dx
u
Die eben bewiesene Regel lautet also (konventionell geschrieben):
f (x) =
1
g ′ (x)
⇒ f ′ (x) = −
g (x)
(g (x))2
Jetzt können wir mit Hilfe der Kettenregel die Ableitung von
y=
1
= x−n
xn
(n ∈ N)
berechnen:
nxn−1
= −nx−n−1
x2n
Die folgende Gleichung gilt also für alle ganzen Zahlen außer der Null:
y′ = −
y = xn ,
n ∈ Z {0} ⇒ y ′ = nxn−1
Die Quotientenregel
Die Quotientenregel braucht man sich eigentlich nicht separat zu merken, da sie eine Kombination der
Produktregel und der Regel zur Ableitung des Kehrwertes ist. Trotzdem wird sie meist als eigene Regel
aufgelistet, und wir wollen dies auch tun. Es gilt
′
f
gf ′ − g ′ f
=
g
g2
KAPITEL 6. DIFFERENTIALRECHNUNG
218
Die Ableitung der Umkehrfunktion
Wir schauen uns noch einmal den Graphen der Umkehrfunktion in Abbildung 5.2 an. Bei der Umkehrfunktion wird einfach die Rolle von x und y vertauscht. Man muss alles einfach “andersherum sehen”:
y = y(x) ist die Funktion und x = x(y) ist die Umkehrfunktion. Wenn man mit Differentialquotienten
rechnet und sich diese als Grenzwerte von Differenzenquotienten vorstellt, braucht man den Bruch
einfach nur umzukehren. Die Ableitung der Umkehrfunktion (also x′ (y)) ist dann
1
dx
= dy
dy
dx
Es ist zu beachten, dass auf der linken Seite x eine Funktion von y ist. Auf der rechten Seite ist
der Nenner dy/dx zwar eine Funktion von x, aber über die Umkehrfunktion ist x als eine Funktion
von y aufzufassen. Das ist alles richtig (und reicht dem Physiker oder Ingenieur als Beweis), aber
mathematisch kann man es sauberer formulieren: f : x 7→ y = f (x) ist die Funktion und f −1 : y 7→
x = f −1 (y) die Umkehrfunktion. Dann gilt:
′
1
f −1 (y) = ′ −1
f (f (y))
Das ist die gleiche Aussage wie oben, nur “mathematischer” hingeschrieben. Wenn man die Variable
jetzt wieder x statt y nennt, lautet die Regel
′
1
f −1 (x) = ′ −1
f (f (x))
Mathematisch sauber formuliert laut der
Beweis: Es gilt per definitionem
f −1 ◦ f (x) = x y
′
f −1 ◦ f (x) = 1
Hierauf wenden wir die Kettenregel an y
′
f −1 (f (x)) · f ′ (x) = 1 y
′
f −1 (f (x)) =
1
f ′ (x)
Jetzt schreiben wir y = f (x) ⇔ x = f −1 (y) und erhalten
′
1
f −1 (y) = ′ −1
,
f (f (y))
was zu beweisen war. Beispiel: Die Wurzelfunktion
y=
n
√
1
n
x = xn
ist die Umkehrfunktion von x = y . Also gilt
(n ∈ N)
dy
1 1 −1
1
1
1
=
= dx =
xn ,
1 =
n−1
1−
dx
ny
n
nx n
dy
d. h.
1
f (x) = x n
(n ∈ N) ⇒ f ′ (x) =
1 1 −1
xn
n
Anwendung: Es gilt
y = xq ,
q ∈ Q {0} ⇒ y ′ = qxq−1
Man schreibt einfach q = n/m und wendet die Kettenregel an (kleine Übungsaufgabe)
KAPITEL 6. DIFFERENTIALRECHNUNG
219
Aufgaben zu Abschnitt 6.1
6.1.1
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
a)
b)
f (x) = −10x4 + 2x2 − 2
c)
d)
f (x) = x + 1 −
e)
f (x) = 3 −
6.1.2
√
r
2x2
1
3
+ x+
2
2
f (x) = 5x2 + 3x − 1
2
f (x) =
√
√
x + 5 − 2x + 3 − 1
f (x) =
q
√
x + 2 + 2x − 4 − 4
f)
x−4−
√
3−x
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
a)
b)
3
c)
f (x) = 4x − 2x + 1
2
x − 2x + 5
5x5 − 6x2 + 1
f (x) = 2
x + 2x + 1
e)
f (x) = 5x2 + 3x − 1
d)
f (x) =
f)
10x
x2 + 1
√
x − x2
f (x) = 2
x +1
2x3 − 6x2 + x − 3
f (x) =
x3 − 5x
6.1.3
2
Aufgabe:
Die Funktion f (x) = (x−1)2 +2 definiert eine quadratische Parabel. Die Gleichung g(x) = m·x, m ∈
R beschreibt eine Schar von Geraden durch den Ursprung des Koordinatensystems. Für welche Werte
m tangieren die Ursprungsgeraden die Parabel? Wie groß ist der Schnittwinkel α zwischen diesen
Tangenten?
6.1.4
Aufgabe:
Gegeben ist die Funktion
1
x2
Es sollen die Punkte der Kurve dieser Funktion bestimmt werden, in denen die Tangente an die Kurve
zugleich eine Normale für einen anderen Punkt der Kurve ist. Arbeitsschritte:
f (x) =
1. Skizzieren Sie die Kurve.
2. Stellen Sie die Geradengleichung der Tangente an den Kurvenpunkt (u, f (u)) auf.
KAPITEL 6. DIFFERENTIALRECHNUNG
220
3. Bestimmten Sie den Schnittpunkt der unter b) berechneten Tangente mit der Kurve.
4. Werten Sie die Forderung „Tangente normal zur Kurve“ aus4
6.2
Die Ableitungen transzendenter Funktionen
Mit den bisherigen Regeln können wir alle algebraischen Funktionen ableiten. Uns fehlen noch die
transzendenten Funktionen, insbesondere die Winkelfunktionen, die Exponentialfunktion, die Hyperbelfunktionen sowie die Umkehrfunktionen dieser genannten Funktionen. Wir fangen an mit den
Ableitungen der Winkelfunktionen und ihrer Umkehrfunktionen
Ableitung des Sinus Wir leiten zuerst den Sinus ab. Hierzu benötigen wir den Grenzwert
lim
x→0
sin x
=1
x
und das Additionstheorem
sin (ϕ + ψ) = cos (ϕ) sin (ψ) + sin (ϕ) cos (ψ) .
Außerdem benötigen wir noch die Beziehung
cos (x) = 1 − 2 sin2
x
2
,
was man mit Hilfe der Additionstheoreme beweisen kann. Wir berechnen damit die Ableitung folgendermaßen:
lim
h→0
sin (x + h) − sin (x)
h
=
=
=
=
sin (x) cos (h) + cos (x) sin (h) − sin (x)
h
(cos (h) − 1)
sin (h)
lim sin (x)
+ cos (x)
h→0
h
h
!
2 h
2 sin 2
sin (h)
+ cos (x)
lim − sin (x)
h→0
h
h
lim
h→0
−0 + cos (x)
Also gilt
f (x) = sin (x) ⇒ f ′ (x) = cos (x)
Ableitung des Kosinus Wir schreiben
Daraus folgt mit der Kettenregel
also gilt
π
cos (x) = sin x +
.
2
π
d
π
d
= cos x +
= − sin (x) ,
cos (x) =
sin x +
dx
dx
2
2
f (x) = cos (x) ⇒ f ′ (x) = − sin (x)
4 Hinweis:
Als Normale in einem Punkt einer Kurve bezeichnet man die Senkrechte zur Tangente in diesem Punkt.
KAPITEL 6. DIFFERENTIALRECHNUNG
Ableitung des Tangens
221
Für den Tangens braucht man die Quotientenregel:
f (x) =
f ′ (x) =
sin x
y
cos x
cos2 x − (−1) · sin2 x
1
=
cos2 x
cos2 x
Also gilt
f (x) = tan (x) ⇒ f ′ (x) =
1
= 1 + tan2 (x)
cos2 (x)
Ableitung des Kotangens Bei dem Kotangens geht man vor wie beim Tangens und erhält
f (x) = cot (x) ⇒ f ′ (x) = −
1
= − 1 + cot2 (x)
sin (x)
2
Ableitung des Arkussinus Wir schreiben dazu:
y = arcsin x ⇔ x = sin y
(|x| < 1)
1
dy
1
1
1
=√
= dx =
=p
2
dx
cos y
1 − x2
1 − sin y
dy
Man beachte, dass man im letzten Schritt wieder y durch x ausdrücken muss. Wir haben gezeigt:
1
f (x) = arcsin (x) ⇒ f ′ (x) = √
1 − x2
Ableitung des Arkuskosinus
(|x| < 1)
Wegen
arcsin x + arccos x =
π
2
braucht man nicht viel zu rechnen, um Folgendes zu sehen:
1
f (x) = arccos (x) ⇒ f ′ (x) = − √
1 − x2
Ableitung des Arkustangens
(|x| < 1)
Wir schreiben
y = arctan x ⇔ x = tan y
und berechnen die Ableitung des Arkustangens als
1
1
dy
1
= dx =
=
2
dx
1
+
x2
1
+
tan
y
dy
d. h.
f (x) = arctan (x) ⇒ f ′ (x) =
Ableitung des Arkuskotangens
1
1 + x2
Auf die gleiche Weise wie eben zeigt man
f (x) = arccot (x) ⇒ f ′ (x) = −
1
1 + x2
KAPITEL 6. DIFFERENTIALRECHNUNG
222
Ableitung der Exponentialfunktion und des Logarithmus
Um die Funktion y = ex abzuleiten, benutzen wir die Definition der Exponentialfunktion als Grenzwert
x n
exp (x) = lim 1 +
n→∞
n
und schreiben
x n
d d
x n
d
1+
= lim
exp (x) =
lim 1 +
n→∞ dx
dx
dx n→∞
n
n
Hier haben wir einfach zwei Grenzwerte miteinander vertauscht: Den für Grenzwert n → ∞ und die
Ableitung, die ja auch ein Grenzwert ist. Meistens geht es gut, aber man muss etwas vorsichtig sein.
Hier ist es erlaubt, aber die saubere mathematische Begründung ist aufwendig und trägt an dieser
Stelle nicht zum Verständnis bei. Es gilt nun
n
n
1 + nx
limn→∞ 1 + nx
x n
x n−1
d =
1+
lim
= lim 1 +
= lim
n→∞ dx
n→∞
n→∞ 1 + x
n
n
limn→∞ 1 + nx
n
Der Grenzwert im Zähler ist exp (x) und der im Nenner ist Eins. Somit erhalten wir
f (x) = exp (x) ⇒ f ′ (x) = exp (x)
Die Ableitung der Exponentialfunktion ist also wieder die Exponentialfunktion!
Anmerkung: Es gibt übrigens keine andere Funktion als y = c exp x, c ∈ R, die identisch mit ihrer
Ableitung ist, d.h die Differentialgleichung
y′ = y
erfüllt.
Ableitungen von Exponentialfunktionen mit anderer Basis erhält man daraus durch eine einfache
Umformung.
Beispiel:
y = 10x = eln 10
x
= exp (ln (10) · x) y
d x
10 = ln (10) · 10x
dx
Wir wollen den natürlichen Logarithmus ableiten. Hierzu verwenden wir die Regel über die Ableitung
der Umkehrfunktion und schreiben
y = ln x ⇔ x = ey y
dy
1
1
1
= dx = y =
dx
e
x
dy
Also gilt
1
(x > 0)
x
Für x < 0 erhalten wir für y = ln (−x) mit der Kettenregel dasselbe Ergebnis
f (x) = ln (x) ⇒ f ′ (x) =
f (x) = ln (−x) ⇒ f ′ (x) =
1
x
(x < 0)
KAPITEL 6. DIFFERENTIALRECHNUNG
223
Wir fassen beide Fälle zusammen zu
f (x) = ln (|x|) ⇒ f ′ (x) =
1
x
(x 6= 0)
Die Ableitung anderer Logarithmen berechnet man wie im folgenden Beispiel:
d
d
d ln (x)
1
1
lg (x) =
=
ln (x) =
dx
dx ln (10)
ln (10) dx
ln (10) · x
Mit Hilfe von Exponentialfunktion und Logarithmus kann man für x > 0 auch zeigen:
y = xa ,
a ∈ R {0} ⇒ y ′ = axa−1
(x > 0)
Man schreibt einfach x = eln x und wendet die Kettenregel an.
Die Hyperbel und Area-Funktionen
Die Hyperbelfunktionen setzen sich aus Exponentialfunktionen zusammen und lassen sich dementsprechend leicht ableiten. Hier sind die Ergebnisse:
f (x) = sinh (x) ⇒ f ′ (x) = cosh (x)
f (x) = cosh (x) ⇒ f ′ (x) = sinh (x)
1
= 1 − tanh2 (x)
cosh2 x
1
= 1 − coth2 (x)
f (x) = coth (x) ⇒ f ′ (x) = −
sinh2 x
Für die Area-Funktionen erhalten wir mit der Ableitungsregel für die Umkehrfunktion:
f (x) = tanh (x) ⇒ f ′ (x) =
1
f (x) = ar sinh (x) ⇒ f ′ (x) = √
2
x −1
1
f (x) = ar cos (x) ⇒ f ′ (x) = √
2
x +1
1
x2 < 1
f (x) = ar tanh (x) ⇒ f ′ (x) =
2
1−x
1
x2 > 1
f (x) = ar coth (x) ⇒ f ′ (x) =
2
1−x
Wir bemerken die große Ähnlichkeit zwischen Hyperbelfunktionen und den trigonometrischen Funktionen. Man muss allerdings immer mit dem Vorzeichen aufpassen!
Die Ableitung exotischer Funktionen
Logarithmisches Differenzieren
Die Funktion
y = xx
KAPITEL 6. DIFFERENTIALRECHNUNG
224
können wir mit keiner der bisherigen Methoden direkt differenzieren. Aber es geht mit einem kleinen
Trick, indem wir etwas umformen:
y = exp (ln xx ) = exp (x ln x)
und dann nach Ketten- und Produktregel ableiten:
y′ =
d
1
exp (x ln x) = exp (x ln x) x + ln x y
dx
x
y ′ = xx (1 + ln x)
Dies nennt man logarithmisches Differenzieren. Diese Bezeichnung wird noch suggestiver, wenn
man - völlig äquivalent zu dem Trick eben - die ganze Funktionsgleichung logarithmiert und anschließend ableitet:
= xx yln()
y
d
= x ln x y dx
x
=
+ ln x y
x
= xx (1 + ln x)
ln y
y′
y
y′
Implizites Differenzieren
Manchmal ist eine Funktion in impliziter Form
g (x, y) = 0
gegeben. Ein Beispiel ist die Kreisgleichung
y 2 + x2 = 1
Hier kann man nach y auflösen und bekommt zwei Funktionen
p
y = 1 − x2
und
p
y = − 1 − x2
die jeweils den oberen und den unteren Halbkreis beschreiben. Es gibt Gleichungen in impliziter Form,
die auf ähnliche Weise (evtl. jeweils mehrere) eindeutige Funktionen ergeben, die sich aber nicht nach
y auflösen lassen. Trotzdem kann man Aussagen über die Ableitung y ′ bekommen.
Wir bleiben bei dem Beispiel der Kreisgleichung, obwohl es hier auch anders ginge. Wir leiten die
Gleichung ab:
2yy ′ + 2x
y′
0y
x
=−
y
=
Wenn man nun einen Punkt (x, y) des Funktionsgraphen kennt, kennt man in diesem Punkt auch die
Ableitung.
KAPITEL 6. DIFFERENTIALRECHNUNG
225
Aufgaben zu Abschnitt 6.2
6.2.1
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
a)
b)
z(t) = a cos t − t2 + et + 1
c)
e)
√
3
f (x) = 4 x5 − 4ex + sin x
f (x) =
d)
f (x) = xn ex
f)
f (x) = tan2 x
f (x) = sin x cos x
g)
g)
f (t) = tet cos t
f (x) = 2x ln x
i)
j)
f (x) = 2xex cos x
6.2.2
10
− 3 lg x + tan x
x3
f (x) =x2 arcsin x
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
a)
c)
b)
1 + cos x
f (x) =
1 − sin x
f (x) = e−x ln x
d)
ln x
f (x) = 2
x
6.2.3
e)
arctan x
f (x) =
exp x
f (x) = 2 ln x3 − 2x
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
b)
a)
3
c)
f (x) = x − 4x + 5
− 53
f (x) = exp x2 − 2x + 5
6.2.4
f (x) = arccos
d)
p
x2 − 1
f (x) = 5 cos x2 + 2x − 1
e)
f (x) = arctan 1 + x2
2
Aufgabe:
Berechnen Sie die Ableitungen der folgenden Funktionen:
a)
b)
f (x) = 4x ln x
c)
g)
u(t) = u0 e−λt cos (ωt + ϕ) (Konstanten reell)
d)
f (x) = sin x2 + 1 cos (4x)
f (x) = xcos x
h)
e)
f (x) = sin x2 + 1 cos (4x)
f (x) = (sin x)cos x
2
f (x) = x ln (x + ex )
i)
f (x) = (x2 + 5x)3x+2
KAPITEL 6. DIFFERENTIALRECHNUNG
Divergenz
226
Konvergenz
−r
Divergenz
0
r
Abbildung 6.4: Konvergenzradius.
6.2.5
Aufgabe:
Berechnen Sie für folgende implizit gegebene Funktionen die Ableitungen:
a)
b)
1
y − 2xy =
x
3
6.2.6
2
x2 + y 2
2
− 2x x2 + y 2 = y 2
Aufgabe:
Gegeben ist der Kreis mit der Gleichung
2
2
(x − 2) + (y − 1) = 25 .
Berechnen Sie die y-Koordinate y0 des Punktes P 0 auf der oberen Hälfte dieses Kreises, der die xKoordinate x0 = 4 besitzt. Welche Steigung hat die Tangente an den Kreis im Punkt P 0 ?
6.3
Taylor-Reihen
Die allgemeine Reihen-Entwicklung
Eine Vielzahl von Funktionen5 lassen sich innerhalb von geeigneten Teilintervallen I ⊂ D ihres Definitionsbereiches als Potenzreihen
f (x) =
∞
X
k=0
ak (x − x0 )
k
(ak ∈ R)
um einen Entwicklungspunkt x0 ∈ I darstellen.
Konvergenzeigenschaften von Potenzreihen: Es gibt eine Zahl r ≥ 0 (eventuell auch r = ∞), so
dass die Reihe für |x − x0 | < r absolut konvergiert. Für |x − x0 | > r divergiert sie. Die Zahl r
nennt man den Konvergenzradius der Potenzreihe.
Für x0 = 0 ist das Verhalten in Abbildung 6.4 skizziert: Innerhalb eines offenen Intervalles (−r, r)
konvergiert die Reihe. Außerhalb des abgeschlossenen Intervalles [−r, r] divergiert sie. Was auf den
Randpunkten ±r passiert, ist unklar.
Den Konvergenzradius berechnet man mit der Formel
an r = lim n→∞ an+1 die man aus dem schwachen Quotientenkriterium herleiten kann.
5 darunter
all die Funktionen, die wir bisher behandelt haben
KAPITEL 6. DIFFERENTIALRECHNUNG
227
z.B. Polstelle
Divergenz
Konvergenz
x0 − r
Divergenz
x0 + r
x0
Abbildung 6.5: Konvergenzintervall einer Potenzreihe um den Entwicklungspunkt x0 herum.
Eindeutigkeit von Potenzreihen: Wenn zwei Potenzreihen um den selben Entwicklungspunkt dieselbe Funktion ergeben, so sind diese Potenzreihen gleich, d. h. sie haben dieselben Koeffizienten.
Zum Beispiel gilt für zwei Reihen mit dem Entwicklungspunkt x0 = 0:
∞
X
an xn =
∞
X
bn xn =⇒ an = bn
n=0
n=0
Die Anwendung dieser Eigenschaft nennt sich Koeffizientenvergleich. Wir werden diese Technik
noch öfter benötigen.
Komplexe Potenzreihen Die folgende Tatsache gibt einen kleinen Ausblick in die Theorie komplexer Funktionen, die wir nur am Rande streifen können. Vielleicht hilft sie beim Verständnis: Wenn
eine Potenzreihe
∞
X
an xn
n=0
für |x| < r konvergiert (d. h. den Konvergenzradius r hat), so konvergiert auch die komplexe Potenzreihe
∞
X
an z n ,
n=0
z∈C
für |z| < r. Das erklärt den Namen Konvergenzradius.
Wir wissen, dass Potenzreihen innerhalb eines Abstandes r (des Konvergenzradius) vom Entwicklungspunkt konvergieren. Also ist das Konvergenzintervall gegeben durch I = (x0 − r, x0 + r), siehe
Abbildung 6.5 . Wie in der Abbildung angedeutet, stößt das Konvergenzintervall häufig an seinem
Rand an eine Polstelle. Insbesondere bei rationalen Funktionen kann man aus den Polstellen sofort
erkennen, wo ihre Potenzreihen-Entwicklungen konvergieren.
Potenzreihen rationaler Funktionen
Die Entwicklung einer rationalen Funktion in eine Potenzreihe hat sehr wichtige Anwendungen in der
digitalen Signalverarbeitung. Man braucht sie unter anderem bei der Untersuchung digitaler Filter.
Solche Filter stellt man im Frequenzbereich durch die sogenannte Übertragungsfunktion dar, die in
der Regel als eine rationale Funktion in einer komplexen Variablen gegeben ist. Um das Verhalten in
Zeitbereich zu beschreiben, benötigt man die sogenannte Impulsantwort, die man durch Koeffizientenvergleich aus der Reihenentwicklung ermitteln kann.
Das wichtigste Werkzeug bei der Reihenentwicklung von rationalen Funktionen ist die bekannte Formel
für die geometrische Reihe:
∞
X
1
qk =
1−q
k=0
KAPITEL 6. DIFFERENTIALRECHNUNG
228
Polstelle bei x = 2
x0 = 1
x0 = 0
x
Abbildung 6.6: Konvergenzkreise zweier Potenzreihen für dieselbe Funktion um die Entwicklungspunkte
x0 = 0 und x0 = 1 herum.
Diese konvergiert für |q| < 1. Übrigens darf q auch komplex sein. Jede rationale Funktion lässt sich in
geeigneter Weise umformen, so dass sich mit Hilfe der geometrischen Reihe eine Potenzreihenentwicklung finden lässt. Wir wollen hier aber nicht den allgemeinen Fall6 behandeln, sondern anhand einiger
Beispiel die grundsätzliche Vorgehensweise kennen lernen.
Bei diesen Beispielen ist das Prinzip immer gleich: Man formt so um, dass ein Term der Gestalt 1 − q
im Nenner steht, benutzt die Formel für die geometrische Reihe und erhält dann nach geeigneter
Umformung die Koeffizienten ak der Reihe
f (x) =
∞
X
k=0
k
ak (x − x0 )
durch Koeffizientenvergleich. Wir werden bei diesen Beispielen auch sehen, dass man dieselbe Funktion in verschiedene Potenzreihen entwickeln kann, je nachdem welchen Entwicklungspunkt man wählt.
Der Konvergenzradius ist dann im Allgemeinen auch verschieden.
Bevor man die Reihenentwicklung berechnet, kann man bei rationalen Funktionen das Konvergenzverhalten einer Potenzreihenentwicklung mit der folgenden anschaulichen Methode herausfinden, auf
deren Beweis wir hier aber nicht eingehen wollen: Zunächst muss man alle Polstellen finden, d. h. alle
Punkte, bei denen der Nenner Null wird. Diese können auch im Komplexen liegen. Wir betrachten
in Abbildung 6.6 das Beispiel einer Funktion mit einer reellen Polstelle bei x = 2. Die Abbildung
veranschaulicht die Entwicklung dieser rationalen Funktion in zwei verschiedene Potenzreihen mit den
jeweiligen Entwicklungspunkten x0 = 1 und x0 = 2: Man zeichnet um den jeweiligen Entwicklungspunkt x0 einen Kreis, der die nächstgelegene Polstelle genau berührt. Der Radius dieses Kreises ist
gerade der Konvergenzradius.
Wir kommen jetzt zu den Beispielen für die Berechnung der Potenzreihen von rationalen Funktionen:
6 Hierzu
benötigt man die Theorie der Partialbruchzerlegung, die in der Ingenieurmathematik 2 behandelt wird.
KAPITEL 6. DIFFERENTIALRECHNUNG
229
1. Wir betrachten als erstes Beispiel die Funktion
f (x) =
1
1−x
Sie hat bei x = 1 eine Polstelle. Eine Potenzreihenentwicklung um den Punkt x0 = 0 ist daher
einfach die geometrische Reihe selber:
f (x) =
∞
X
xk
k=0
Diese geometrische Reihe konvergiert für |x| < 1, d. h. r = 1 und I = (−1, 1). Durch Koeffizientenvergleich mit der allgemeinen Formel
f (x) =
∞
X
ak xk
k=0
erkennen wir, dass alle Koeffizienten denselben Wert haben:
ak = 1
für alle k ∈ N0
2. Wir betrachten als zweites Beispiel die Funktion
f (x) =
1
2−x
und wollen diese nun um den Punkt x0 = 1 herum entwickeln. Die Funktion hat bei x = 2 eine
Polstelle, durch die der Konvergenzkreis (gelber Kreis in Abbildung 6.6) an seine Grenze stößt.
Die Potenzreihen-Entwicklung um den Punkt x0 = 1 erhalten wir mit einer einfachen Umformung
zu einer geometrischen Reihe:
∞
f (x) =
X
1
=
(x − 1)k
1 − (x − 1)
k=0
Dies ist eine geometrische Reihe mit q = x − 1. Sie konvergiert für |x − 1| < 1, d. h. r = 1 und
I = (0, 2). Die Koeffizienten lauten
ak = 1, k ∈ N0
3. Wir betrachten im dritten Beispiel dieselbe Funktion
f (x) =
1
2−x
und wollen diese nun um den Punkt x0 = 0 herum entwickeln (zyanfarbener Kreis in Abbildung
6.6). Um die geeignete geometrische Reihe zu finden, formen wir etwas um:
∞
f (x) =
1X
1 1
=
1
2 1 − 2x
2
k=0
Dies ist eine geometrische Reihe mit q =
I = (−2, 2). Die Koeffizienten lauten
ak =
1
2 x.
1
2k+1
k
1
xk
2
Sie konvergiert für |x| < 2, d. h. r = 2 und
,
k ∈ N0
KAPITEL 6. DIFFERENTIALRECHNUNG
230
4. Die Funktion
1+x
2−x
soll um x0 = 0 herum entwickelt werden. Wir formen um und entwickeln in eine geometrische
Reihe:
∞ k
X
1
1 1+x
1
xk
(1
+
x)
f (x) =
=
1
2 1 − 2x
2
2
f (x) =
k=0
Diese Reihe konvergiert für |x| < 2, d. h. r = 2 und I = (−2, 2). Wir müssen aber noch ein wenig
umformen, damit die Potenzreihe von der Gestalt
f (x) =
∞
X
ak xk
k=0
ist und man die Koeffizienten ak direkt ablesen kann (Koeffizientenvergleich). Wir multiplizieren
dazu aus und schreiben:
∞ k+1
∞ k+1
X
X
1
1
k
f (x) =
x +
xk+1
2
2
k=0
k=0
∞ k
∞ k+1
X
X
1
1
k
x +
xk
=
2
2
k=1
k=0
∞ k
∞ k+1
X
X
1
1
1
=
xk +
xk
+
2
2
2
=
1
+
2
k=1
∞
X
k=1
k=1
3 1 k
x
2 2k
Das Bildungsgesetz für die Koeffizienten ak benötigt also eine Fallunterscheidung:
(
1
:
k=0
ak = 2 3
:
k
= 1, 2, ...
2k+1
5. Für die Funktion
1
f (x) =
(1 − x)2
findet man mit Hilfe eines kleinen Tricks eine Reihenentwicklung um x0 = 0. Es gilt
!
∞
∞
∞
X
d X k
d X k
d
d 1
k
=
x
1+
=
x =
x
f (x) =
dx 1 − x
dx
dx
dx
k=1
k=0
Die Ableitung können wir unter die Summe ziehen7 und erhalten
f (x) =
∞
∞
X
d k X k−1
x =
kx
.
dx
k=1
k=1
Durch Umnumerierung (k → k + 1) ergibt sich:
f (x) =
∞
X
(k + 1) xk
k=0
Die Koeffizienten lauten also
ak = k + 1,
7 Da
k ∈ N0
es eine unendliche Summe ist, ist dies wieder ein Vertauschen von Grenzwerte.
k=1
KAPITEL 6. DIFFERENTIALRECHNUNG
231
Anmerkung: Es gibt eine systematische Methode mit Namen Partialbruchzerlegung, mit der man
jede rationale Funktion so umformen kann, dass man sie mit Hilfe einer geometrischen Reihe
in eine Potenzreihe entwickeln kann. Diese wird im Rahmen der Integralrechnung behandelt.
Deshalb werden wir hier nicht weiter darauf eingehen.
Die an den Beispielen gezeigte Methode mit der geometrischen Reihe funktioniert nur bei rationalen
Funktionen, nicht aber bei algebraischen und transzendenten Funktionen. Eine allgemeine Methode,
die auch für diese anwendbar ist, ist die Taylorsche Reihenentwicklung, die im folgenden erklärt
werden soll.
Die Formel für die Taylorreihe
Für eine Funktion f suchen wir eine Potenzreihenentwicklung der Gestalt
f (x) =
∞
X
k=0
ak (x − x0 )
k
(ak ∈ R)
Wir setzen im Folgenden voraus, dass die Funktion f in dem Entwicklungspunkt x0 beliebig oft differenzierbar ist. Es gilt der folgende
Satz: Wenn es für die Funktion f eine Potenzreihenentwicklung der Gestalt
f (x) =
∞
X
k=0
k
ak (x − x0 )
gibt, dann sind die Koeffizienten ak eindeutig gegeben durch:
ak =
f (k) (x0 )
k!
Beweis-Skizze: Die k-te Ableitung der Potenzreihe an der Stelle x = x0 lautet
f (k) (x0 ) = k!ak .
Daraus folgt die Behauptung. Die allgemeine Taylor-Reihe einer Funktion f lautet also:
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )
k
Man muss also einen Ausdruck für die k-te Ableitung der Funktion f an der Stelle x0 finden und kann
dann sofort die Reihe hinschreiben.
Beispiel: Es sei
f (x) = ln x
KAPITEL 6. DIFFERENTIALRECHNUNG
232
Wir wollen die Taylorreihe um x0 = 1 hinschreiben und berechnen die Ableitungen an dieser
Stelle:
f (x) = ln x
1
f ′ (x) =
x
1
′′
f (x) = − 2
x
2
′′′
f (x) = + 3
x
1·2·3
(4)
f (x) = −
x4
n−1
f (n) (x) = (−1)
f (1) = 0
f ′ (1) = 1
f ′′ (1) = −1
f ′′′ (1) = +2
..
.
(n − 1)!
xn
f (4) (1) = −1 · 2 · 3
n−1
f (n) (1) = (−1)
(n − 1)!
Daraus ergibt sich die Taylorreihe
ln x =
∞
k−1
X
(−1)
k
(x − 1)
k
k=1
Der Konvergenzradius der Reihe ist r = 1 (siehe folgende Anmerkung).
Anmerkungen:
1. Den Konvergenzradius r einer Taylorreihe bestimmt man entsprechend der Formel
ak .
r = lim k→∞ ak+1 2. Eine Taylor-Reihe um den Entwicklungspunkt x0 = 0 wird auch als MacLaurin-Reihe bezeichnet.
3. Wenn es für die Funktion f eine Potenzreihenentwicklung gibt, die gegen f konvergiert, so spricht
man von einer analytischen Funktion.
Das Restglied nach Lagrange
Auch wenn die Taylor-Reihe
∞
X
f (k) (x0 )
k=0
k!
k
(x − x0 ) ,
die aus den Ableitungen der Funktion f gebildet worden ist, konvergiert, ist noch nicht unbedingt
sichergestellt, dass diese Reihe auch wirklich die Funktion f (x) ergibt. Das Ergebnis kann durchaus
eine andere Funktion ein, aber zum Glück kommt das in der Praxis nicht so häufig vor. Wir werden
deshalb zunächst Beispiele betrachten, wo die Reihe gegen die Funktion konvergiert und erst ganz am
Schluss ein Gegenbeispiel erwähnen.
Um sicherzugehen, dass die Reihe gegen die Funktion konvergiert, muss man die endliche Taylor-Reihe
mit Restglied einführen. Sie lautet
f (x) =
n
X
f (k) (x0 )
k=0
k!
k
(x − x0 ) + Rn (x) .
KAPITEL 6. DIFFERENTIALRECHNUNG
233
Das Restglied Rn (x) in der Form von Lagrange hat die Gestalt
Rn (x) =
f (n+1) (ξ)
n+1
(x − x0 )
,
(n + 1)!
wobei ξ eine Zahl zwischen x0 und x ist. Erst wenn man bewiesen hat, dass
lim Rn (x) = 0
n→∞
gilt, kann man sicher sein, dass
f (x) =
∞
X
f (k) (x0 )
k!
k=0
(x − x0 )
k
gilt, d.h. dass die Taylor-Reihe gegen die Funktion konvergiert.
Approximation einer Funktion durch ein Taylor-Polynom
Eine der wichtigsten Anwendungen der Taylorreihe besteht darin, dass man durch sie komplizierte
Funktionen durch einfache Polynome approximieren kann.
Wir wollen im Folgenden davon ausgehen, dass das Restglied im Limes n → ∞ gegen Null geht:
lim Rn (x) = 0
n→∞
Wenn das Restglied für irgendein endliches n schon sehr klein ist, dann ist die bei endlicher Ordnung
abgebrochene Taylorreihe, d.h. das Taylorpolynom n-ter Ordnung
Tn (x) =
n
X
f (k) (x0 )
k!
k=0
k
(x − x0 ) ,
eine Näherung für f (x) in einer Umgebung von x0 . Sie wird (in der Regel) umso besser sein, je höher
die Ordnung ist. Das Taylorpolynom erster Ordnung (n = 1) entspricht genau der Approximation
der Funktion durch ihre Tangente im Punkt x0 . Diese lineare Näherung wird häufig gebraucht.
Als Beispiel für die Näherungen verschiedener Ordnung betrachten wir die Taylorreihe um x0 = 0 für
die Sinusfunktion. Alle Ableitungen an der Stelle Null sind sehr leicht auszurechnen:
f (x) = sin x
f ′ (x) = cos x
f ′′ (x) = − sin x
f ′′′ (x) = − cos x
f (4) (x) = sin x
⇒ f (0) = 0
⇒ f ′ (0) = 1
⇒ f ′′ (0) = 0
⇒ f ′′′ (0) = −1
⇒ f (4) (0) = 0
..
..
.
.
Wir erhalten also die Reihenentwicklung
sin (x) = x −
1
1
1 3
x + x5 − x7 ± ...
3!
5!
7!
Da der Sinus eine ungerade Funktion ist, kommen in der Reihe auch nur ungerade Potenzen von
x vor. Abbildung 6.7 zeigt den Sinus mit seinen Näherungen bis zur 7. Ordnung. In der Nähe des
Entwicklungspunktes kommt man offenbar mit sehr niedriger Ordnung aus. Man wird diese Näherung
nur für |x| ≤ π/4 verwenden und dann weiter außen die Taylorentwicklung um x0 = ±π/2 nehmen.
Auf diese Weise kann man den Sinus mit wenig Aufwand überall sehr genau berechnen.
KAPITEL 6. DIFFERENTIALRECHNUNG
234
Die Taylorreihe der Sinusfunktion
1
0.8
0.6
0.4
y
0.2
0
−0.2
−0.4
y=sin(x)
1. Ordnung
3. Ordnung
5. Ordnung
7. Ordnung
−0.6
−0.8
−1
−1
−0.5
0
x/π
0.5
1
Abbildung 6.7: Die Taylor-Reihe für den Sinus um x0 = 0.
Spezielle Potenzreihenentwicklungen
Wir wollen für einige wichtige Funktionen die Taylor-Reihen angeben.
Die einfachste Taylor-Reihe um x0 = 0 ist die für die Exponentialfunktion, denn für jede ihrer Ableitungen an dieser Stelle gilt f (k) (0) = 1. Die Reihe lautet also
exp (x) =
∞
X
1
1
1
1 k
x = 1 + x + x2 + x3 + ...
k!
1!
2!
3!
k=0
Für cosh(x) und sinh(x) sind die Ableitungen ebenfalls sehr einfach zu berechnen. Noch einfacher ist
es aber, die Reihe für die Exponentialfunktion direkt in die Definitionen einzusetzen. Man erhält
cosh (x) =
und
sinh (x) =
∞
X
i=0
∞
X
1 2i
1
1
x = 1 + x2 + x4 + ...
(2i)!
2!
4!
i=0
1
1
1
x2i+1 = x + x3 + x5 + ...
(2i + 1)!
3!
5!
Die Reihe für den Kosinus Hyperbolicus entsteht also der Reihe der Exponentialfunktion, indem man
nur die Summanden mit geradzahliger Potenz (k = 2i) mitnimmt und die mit ungeradzahliger (k =
2i + 1) weglässt. Beim Sinus Hyperbolicus ist es genau anders herum.
Die Reihen für Kosinus und Sinus sind denen der entsprechenden Hyperbelfunktionen sehr ähnlich. Sie
unterscheiden sich “nur” in einem alternierenden Vorzeichen8 . Es gilt
cos (x) =
∞
i
X
(−1)
i=0
8 welches
(2i)!
x2i = 1 −
1 2
1
x + x4 ∓ ...
2!
4!
natürlich große Auswirkungen auf den Verlauf der Funktion hat!
KAPITEL 6. DIFFERENTIALRECHNUNG
und
235
∞
i
X
(−1)
1
1
x2i+1 = x − x3 + x5 ∓ ...
sin (x) =
(2i
+
1)!
3!
5!
i=0
Mit Hilfe der Reihenentwicklung kann man die berühmte Eulersche Formel, d. h. den Zusammenhang
zwischen dem Sinus und Kosinus und der Exponentialfunktion herleiten. √
Hierzu betrachten wir die
Reihe der Exponentialfunktion und ersetzen (rein formal) x durch jx (j = −1), d. h.
exp (jx) =
∞
X
1
1
1
1
k
(jx) = 1 + jx + j 2 x2 + j 3 x3 + ...
k!
1!
2!
3!
k=0
=
=
∞
∞
X
j 2m 2m X j 2m+1 2m+1
x +
x
(2m)!
(2m + 1)!
m=0
m=0
∞
∞
m
m
X
X
(−1) 2m
(−1)
x +j
x2m+1
(2m)!
(2m
+
1)!
m=0
m=0
Rechts stehen genau die Reihen für Kosinus und Sinus. Hieraus folgt die Eulersche Formel
exp (jx) = cos (x) + j sin (x)
Die Taylor-Reihen für exp x, sin x, cos x, sinh x und cosh x besitzen den Konvergenzradius r = ∞.
Das kann natürlich beim Logarithmus nicht der Fall sein, weil er nur für positive Werte definiert ist.
Die Ableitungen des natürlichen Logarithmus an der Stelle x0 = 1 haben wir im obigen Beispiel schon
ausgerechnet. Wir erhielten folgende Taylorreihe um diesen Entwicklungspunkt:
ln (x)
=
∞
k+1
X
(−1)
k
k=1
=
(x − 1) −
(x − 1)k
2
(|x − 1| < 1)
3
4
(x − 1)
(x − 1)
(x − 1)
+
−
± ...
2
3
4
Der Konvergenzradius ist r = 1. Oft wird diese Reihe in einer anderen Form angegeben:
ln (1 + x) =
∞
k+1
X
(−1)
x2
x3
x4
xk = x −
+
−
± ...
k
2
3
4
(|x| < 1)
k=1
Diese erhält man, indem man in der Taylorreihe für ln x die Variable x durch 1 + x ersetzt, was
einer Verschiebung der Funktion um den Wert 1 nach links entspricht. Der Entwicklungspunkt dieser verschobenen Funktion ln (1 + x) ist dann x0 = 0. Am Konvergenzradius ändert sich durch die
Verschiebung natürlich nichts.
Die Taylor-Reihe für die Wurzelfunktion ist sehr wichtig für praktische Näherungen:
√
x =
∞
1+
X
1
k+1 1 · 3 · 5 · ... · (2k − 3)
k
(x − 1) +
(−1)
(x − 1)
2
2k k!
k=2
=
1
1·3
1·3·5
1
2
3
4
1 + (x − 1) −
(x − 1) +
(x − 1) −
(x − 1) ± ...
2
3
2
2!2
3!2
4!24
KAPITEL 6. DIFFERENTIALRECHNUNG
236
Der Konvergenzradius ist r = 1. Durch die gleiche Verschiebung wie in dem Beispiel mit dem Logarithmus erhält man die folgende Darstellung, die in vielen Formelsammlungen bevorzugt wird:
√
1+x
∞
X
1
k+1 1 · 3 · 5 · ... · (2k − 3) k
(−1)
x
= 1+ x+
2
2k k!
(|x| < 1)
k=2
1
= 1+ x−
2
1
= 1+ x−
2
1 2
x +
2!22
1 2
x +
2·4
1·3 3 1·3·5 4
x −
x ± ...
3!23
4!24
1·3 3
1·3·5 4
x −
x ± ...
2·4·6
2·4·6·8
Wichtige Näherungen
Aus den Taylorreihen lassen sich wichtige Näherungsformeln erkennen. Die folgenden Näherungsformeln gelten für |x| ≪ 1:
exp (x) ≈ 1 + x
1
cos (x) ≈ 1 − x2
2
1
sin (x) ≈ x − x3
6
1
cosh (x) ≈ 1 + x2
2
1 3
sinh (x) ≈ x + x
6
1
ln (1 + x) ≈ x − x2
2
√
1
1+x≈1+ x
2
Mit der letzteren Formel kann man näherungsweise Wurzeln berechnen.
Beispiel:
√
1000 =
=
≈
=
√
1024 − 24
r
24
32 1 −
1024
1 24
32 1 −
2 1024
3
32 − = 31, 625
8
√
Dies stimmt mit dem exakten Wert 1000 = 31.622... bis zur zweiten Stelle hinter dem Komma
überein, was für viele Anwendungen genau genug ist.
KAPITEL 6. DIFFERENTIALRECHNUNG
237
Die Funktion y=exp(−1/x2)
1
0.9
0.8
0.7
y
0.6
0.5
0.4
0.3
0.2
0.1
0
−4
−3
−2
−1
0
x
1
2
3
4
Abbildung 6.8: Eine nicht-analytische Funktion.
Ein Beispiel, bei dem die Taylor-Reihe in die Irre führt
1
f (x) = exp − 2
x
(x 6= 0)
Diese Funktion ist bei x = 0 zunächst nicht definiert, aber dann mit der Definition f (0) = 0 stetig
ergänzbar und mit dieser Ergänzung sogar unendlich oft differenzierbar. Allerdings sind alle Ableitungen an der Stelle x0 = 0 identisch Null! Das heißt, die Taylorreihe ist die Reihe für die Nullfunktion
und konvergiert deshalb für x 6= 0 nicht gegen f (x), – denn f (x) 6= 0 für x 6= 0.
Abbildung 6.7 zeigt diese nicht-analytische Funktion. Eigentlich sieht sie ganz harmlos aus. Sie ist nur
bei x = 0 extrem flach. Aber das ist gerade der entscheidende Punkt: Sie ist hier flacher als jede Potenz
y = xn . Deswegen kann die Potenzreihenentwicklung nicht funktionieren.
Aufgaben zu Abschnitt 6.3
6.3.1
Aufgabe:
Bestimmen Sie für die folgenden Funktionen die Taylorreihen um x0 = 0 sowie deren Konvergenzradius.
a)
f (x) =
c)
√
1 + 2x
1
f (x) = √
3
1+x
6.3.2
b)
2
f (x) = (1 + ex )
d)
f (x) =
(
sin x
x
1
: x 6= 0
: x=0
Aufgabe:
Bestimmen Sie die Taylorreihe um x0 = 0 der Funktion f (x) = cosh x
1. auf direktem Wege mit der Formel für die Taylorreihe,
2. aus der Definition von f (x) = cosh x und der Potenzreihenentwicklung der Exponentialfunktion
KAPITEL 6. DIFFERENTIALRECHNUNG
6.3.3
238
Aufgabe:
Lösen Sie die Gleichung cosh x = 4 − x2 näherungsweise durch Potenzreihenentwicklung und Abbruch
dieser Reihe nach der 4. Potenz von x.
6.3.4
Aufgabe:
Entwickeln Sie die Funktion
f (x) =
√
x
um die Stelle x0 = 1 in eine Taylor-Reihe und bestimmen Sie deren Konvergenzradius.
6.3.5
Aufgabe:
Geben Sie für die Funktion
1
1 − 2x
zwei Taylor-Reihen an: Die eine für den Entwicklungspunkt x0 = 0, die andere für x0 = 2. Bestimmen
Sie für beide Fälle die Konvergenzradien und tragen Sie sie in eine Skizze des Kurvenverlaufs ein. Wie
erklären Sie sich die unterschiedlichen Konvergenzradien?
f (x) =
6.3.6
Aufgabe:
Approximieren Sie die Sinusfunktion in der Umgebung ihres 1. Maximums im Bereich positiver x-Werte
durch eine Parabel.
6.4
Die Regeln von de l’Hospital
Wir betrachten als Beispiel die Funktion
f (x) =
sin (x)
.
exp (x) − 1
Für x0 = 0 ist die Funktion nicht definiert, weil der Nenner Null wird. Der Zähler wird aber auch Null.
Liegt hier eine hebbare Singularität vor? Wir wollen herausfinden, wie sich die Funktion für x → 0
verhält. Mit Hilfe der Taylorreihe für die Funktionen in Zähler und Nenner erhält man
1 3
1 5
3! x + 5! x ∓ ...
1 2
1 3
2! x + 3! x + ...
1 4
1 2
x + 5!
x ∓ ...
1 − 3!
1 2
1
1 + 2! x + 3! x + ...
x−
x+
f (x) =
=
Offenbar gilt
lim f (x) = 1,
x→0
und man kann die Funktion stetig ergänzen.
Aus dem Beispiel erkennen wir: Wenn eine Funktion als ein Quotient gegeben ist, bei dem der Zähler
und der Nenner bei x0 = 0 verschwinden, beginnt die Taylorreihe jeweils mit dem linearen Term. Der
Proportionalitätsfaktor dieses Termes ist die jeweilige Ableitung von Zähler und Nenner an der Stelle
KAPITEL 6. DIFFERENTIALRECHNUNG
239
x0 = 0. Man kann dann in dem Ausdruck x herauskürzen, den Limes x → 0 bilden und erhält als
stetige Ergänzung den Quotienten der Ableitungen bei x0 = 0.
Wir haben den Fall x0 = 0 betrachtet. Für andere Werte von x0 geht die Argumentation natürlich
genauso, nur mit den entsprechenden Potenzreihen um diesen Entwicklungspunkt.
Es gilt der folgende
Satz (1. Regel von de l’Hospital): Es seien f und g differenzierbare Funktionen mit f (x0 ) = 0 und
g (x0 ) = 0. Ferner sei g ′ (x) 6= 0 in unmittelbarer Nähe von x0 . Dann gilt
lim
x→x0
f (x)
f ′ (x)
= lim ′
g (x) x→x0 g (x)
Anmerkungen:
1. Wenn g ′ (x0 ) 6= 0 gilt, kann man den Limes auf der rechten Seite direkt ausführen und es gilt:
lim
x→x0
f (x)
f ′ (x0 )
= ′
g (x)
g (x0 )
2. Wenn die beiden ersten Ableitungen f ′ (x) und g ′ (x) an der Stelle x = x0 auch verschwinden
(d. h. f ′ (x0 ) = 0 und g ′ (x0 ) = 0 ist), kann man den Satz auf die Funktionen f ′ und g ′ nochmal
anwenden und erhält:
f ′ (x)
f ′′ (x)
f (x)
= lim ′
= lim ′′
.
lim
x→x0 g (x)
x→x0 g (x)
x→x0 g (x)
Wenn die zweiten Ableitungen in Zähler und Nenner auch verschwinden, berechnet man so lange
höhere Ableitungen, bis man irgendwann den Grenzwert bilden kann.
3. Vorsicht: Der Satz ist nur richtig, wenn Zähler und Nenner beide bei x0 verschwinden!
4. Für den Beweis des Satzes benötigt man die Taylorreihe nicht. Eine Taylorreihe um x0 herum
braucht nicht einmal zu existieren und ist daher in der Formulierung des Satzes auch nicht vorausgesetzt. Dieser Fall spielt z. B. dann eine Rolle, wenn x0 auf dem Rande des Definitionsbereiches
liegt (so etwas kommt bei Wurzelfunktionen vor).
Man kann den Satz auch modifizieren und damit Grenzwerte der Gestalt
lim
x→±∞
f (x)
g (x)
untersuchen, wenn Zähler und Nenner im Limes gegen Null gehen. Der Trick dabei ist: Man setzt
x = 1/u und wendet auf die Funktionen u 7→ f (1/u) und u 7→ g (1/u) den obigen Satz und die
Kettenregel an. Man erhält so den
Satz (2. Regel von de l’Hospital): Es seien f und g differenzierbare Funktionen mit limx→∞ f (x) = 0
und limx→∞ g (x) = 0. Ferner sei g ′ (x) 6= 0 für hinreichend große x. Dann gilt
f (x)
f ′ (x)
,
= lim ′
x→∞ g (x)
x→∞ g (x)
lim
sofern der Grenzwert auf der rechten Seite existiert. Für limx→−∞ gilt die Aussage entsprechend.
KAPITEL 6. DIFFERENTIALRECHNUNG
240
Ohne Beweis geben wir noch die 3. Regel an:
Satz (3. Regel von de l’Hospital): Es seien f und g differenzierbare Funktionen mit limx→x0 f (x) = ∞
und limx→x0 g (x) = ∞, wobei x0 ∈ R ∪ {±∞}. Ferner sei g ′ (x) 6= 0 in einer Umgebung von x0 .
Dann gilt
f (x)
f ′ (x)
lim
,
= lim ′
x→x0 g (x)
x→x0 g (x)
sofern der Grenzwert auf der rechten Seite existiert.
Auf diese Weise lassen sich die folgenden Grenzwerte berechnen:
1.
lim xn e−x = 0
(n > 0)
lim x−n ex = ∞
(n > 0)
lim x−n ln x = 0
(n > 0)
x→∞
2.
x→∞
3.
x→∞
Daraus folgen einige Tatsachen, die für die Praxis sehr wichtig sind:
• Die abfallende Exponentialfunktion fällt stärker ab als jede rationale oder algebraische Funktion.
• Die ansteigende Exponentialfunktion steigt stärker an als als jede rationale oder algebraische
Funktion.
• Die Logarithmusfunktion steigt schwächer an als jede rationale oder algebraische Funktion.
Exotische Grenzwerte Mit Hilfe der de l’Hospitalschen Regeln und etwas trickreichen Umformungen lassen sich auch Grenzwerte berechnen, bei denen man erstmal nicht weiß, wie man dort herangehen
soll. Hier ein Beispiel für solche “Trixerei”:
Es soll
lim xx
x↓0
berechnet werden. Der Trick geht so:
x
lim xx = lim eln x = lim ex ln x = exp lim (x ln x)
x↓0
x↓0
x↓0
x↓0
Den Limes konnten wir wegen der Stetigkeit von exp() hineinziehen. Wir berechnen jetzt diesen Limes
mit de l’Hospital:
d
1
ln x
ln x
lim (x ln x) = lim 1 = lim dxd 1 = lim x1 = 0
x↓0
x↓0
x↓0
x↓0 − 2
x
x
dx x
Daraus folgt
lim xx = exp lim (x ln x) = exp (0) = 1
x↓0
x↓0
KAPITEL 6. DIFFERENTIALRECHNUNG
241
Aufgaben zu Abschnitt 6.4
6.4.1
Aufgabe:
Die folgende Grenzwertberechnung ist falsch:
x3 − 2x + 1
3x2 − 2
6x
=
lim
= lim
=3
2
x→1
x→1
x→1
x −1
2x
2
lim
Wo steckt der Fehler und welches ist der richtige Grenzwert?
6.4.2
Aufgabe:
Berechnen Sie die folgenden Grenzwerte:
b)
a)
ln x
lim
x→∞ x2
c)
lim
x→0
d)
x
x3 − 2
x→∞ exp(2x)
lim (2x)
lim
x→0
f)
e)
lim
x→0
i)
1
1
−
tan x x
√ lim e−x x
g)
lim
x→∞
j)
1+x
1
lim 1 +
x→∞
x
6.5
ln (1 + x)
x
lim
x→0
1+
1
x
x→π
3 tan x
sin (2x)
1+x
Extremwerte und Kurvendiskussion
Lokale Extrema und Wendepunkte
Eine Funktion f hat bei x0 ein lokales Maximum, wenn in der nächsten Umgebung von x0 alle
Funktionswerte kleiner (oder gleich) sind gegenüber dem Funktionswert an dieser Stelle, d. h. f (x) ≤
f (x0 ). Bei f (x) ≥ f (x0 ) spricht man von einem lokalen Minimum.
Ein lokales Extremum setzt (bei einer differenzierbaren Funktion) eine waagerechte Tangente voraus.
Das bedeutet:
Bei differenzierbaren Funktionen f gilt: x0 ist lokales Extremum von f
=⇒
f ′ (x0 ) = 0
Die Umkehrung “⇐” gilt nicht, wie man am Beispiel f (x) = x3 sofort sieht: Die Tangente bei x0 = 0
ist zwar waagerecht, aber die Funktionswerte werden nach links kleiner und nach rechts größer. Hier
liegt ein sogenannter Sattelpunkt vor. Das ist ein Punkt mit waagerechter Tangente, der eben kein
Extremum ist.
Abbildung 6.9 veranschaulicht den Sachverhalt.
KAPITEL 6. DIFFERENTIALRECHNUNG
242
Lokale Extrema
20
15
10
y
5
0
−5
−10
Minimum
Maximum
Sattelpunkt
−15
−20
−4
−3
−2
−1
0
x
1
2
3
4
Abbildung 6.9: Lokale Extrema.
Wir suchen nun ein Kriterium, aus dem wir erkennen, ob ein Minimum, ein Maximum oder ein Sattelpunkt vorliegt. Der Einfachheit halber betrachten wir den Punkt x0 = 0 als Kandidaten und nehmen
an, dass dort die erste Ableitung verschwindet: f ′ (0) = 0 Wir betrachten die Taylor-Reihe9 um diesen
Punkt, d. h.
1
1
f (x) = f (0) + f ′′ (0) x2 + f ′′′ (0) x3 + ...
2
6
Man beachte, dass wegen f ′ (0) = 0 der lineare Term der Reihe fehlt. Wenn der quadratische Term
nicht auch verschwindet, so bestimmt dieser das Geschehen in der Nähe von des betrachteten Punktes
x0 = 0, d. h.
1
f (x) ≈ f (0) + f ′′ (0) x2
2
Dies ist eine Parabel mit dem Scheitelpunkt (0, f (0)). Sie ist nach oben geöffnet für f ′′ (0) > 0
(⇒Minimum) und nach unten geöffnet für f ′′ (0) < 0 (⇒Maximum). Für f ′′ (0) = 0, aber f ′′′ (0) 6= 0
bestimmt der kubische Term das Geschehen, d. h.
1
f (x) ≈ f (0) + f ′′′ (0) x3 .
6
In diesem Fall liegt ein Sattelpunkt vor. Verschwindet die dritte Ableitung auch, so schaut man die
vierte an usw.
Merke: Ist die Ordnung k ≥ 2 der niedrigsten nicht verschwindenden höheren Ableitung f (k) (x0 )
geradzahlig, so liegt ein Minimum vor für f (k) (x0 ) > 0 und ein Maximum für f (k) (x0 ) < 0.
Ist sie ungeradzahlig, so liegt ein Sattelpunkt vor.
Wendepunkte: Eine Funktion f hat im Punkt x0 einen Wendepunkt, falls f ′ dort ein Extremum
hat. Im Wendepunkt ändert sich die Richtung der Krümmung. Ein Beispiel dafür ist die Funktion
f (x) = sin x ⇒ f ′ (x) = cos x
an der Stelle x = 0.
9 Das
geht, wenn die Funktion analytisch ist. Ansonsten kann man das Restglied nehmen und ähnlich argumentieren.
KAPITEL 6. DIFFERENTIALRECHNUNG
243
Monotonie: Eine Funktion ist in einem Intervall monoton steigend bzw. fallend genau dann, wenn
dort f ′ (x) ≥ 0 bzw. f ′ (x) ≤ 0 gilt. Strenge Monotonie gilt bei f ′ (x) > 0 bzw. f ′ (x) < 0.
Kurvendiskussion
Um den Graphen einer Funktion f skizzieren zu können, benötigt man die Nullstellen, das asymptotische Verhalten für x → ±∞, das Verhalten bei eventuellen Polstellen sowie die Extrema
und Sattelpunkte und Wendepunkte. Bei Definitionslücken muss man herausfinden, ob sie stetig
ergänzbar sind oder nicht. Außerdem muss man wissen: Für x → ∞ geht y = exp (x) extrem stark
(stärker als jede rationale Funktion) gegen ∞ und y = exp (−x) extrem stark (stärker als jede rationale
Funktion) gegen 0. Der Logarithmus dagegen steigt schwächer an als jede Wurzel. Außerdem hilft die
Taylor-Reihe oft weiter.
Wir wollen hier keine Kurvendiskussion nach irgend einem Schema üben, wie man es manchmal in der
Schule betrieben wird. Man muss natürlich in der Lage sein, ohne Hilfsmittel (Rechner) den Graphen
einer Funktion skizzieren zu können. Wenn man alles verstanden hat, kann man sich das bei Bedarf
alles leicht ohne Schema überlegen.
Literatur zum Thema “Kurvendiskussion” gibt es genug, und man findet auch viel unter diesem Stichwort im Internet. Eine Übersicht gibt z. B. der Artikel
http://de.wikipedia.org/wiki/Kurvendiskussion.
Aufgaben zu Abschnitt 6.4
6.5.1
Aufgabe:
Aus einem Baumstamm mit dem nutzbaren Durchmesser d soll ein Holzbalken herausgesägt werden.
Der Querschnitt dieses Balkens soll rechteckig mit der Breite b und der Höhe h sein. Außerdem soll
der Balken
1. ein möglichst großes Widerstandsmoment Wb = 16 bh2 oder
2. ein möglicht großes Flächenträgheitsmoment Iy =
1
3
12 bh
besitzen.
Wie groß müssen b und h gewählt werden, um diese Ziele zu erreichen?
6.5.2
Aufgabe:
Konservendosenprobleme:
1. Unter sämtlichen Kreiszylindern, die in eine Kugel mit dem Radius R passen, ist derjenige mit
dem größten Volumen zu bestimmen.
2. Unter sämtlichen Kreiszylindern mit dem Volumen V ist derjenige mit der kleinsten Gesamtoberfläche zu bestimmen.
(Geben Sie jeweils Höhe und Radius des Kreiszylinders an.)
KAPITEL 6. DIFFERENTIALRECHNUNG
6.5.3
244
Aufgabe:
Ein Kaffeepausen-Problem: Aus einem kreisförmigen Stück Filterpapier mit dem Durchmesser D =
20 cm soll ein kreiskegelförmiger Kaffeefilter mit größtmöglichem Volumen hergestellt werden. Geben
Sie Öffnungsradius r, Höhe h und Volumen V dieses Filters an. (Hinweis: Das Volumen eines Kreiskegels
beträgt V = 31 πhr2 )
6.5.4
Aufgabe:
Ein Ein Fluss fließt mit der konstanten Geschwindigkeit v 0 relativ zum Grund. Gegen den Strom
schwimmt eine Fischin mit der Geschwindigkeit v R relativ zum Wasser. Sie möchte einen Fisch besuchen, der sich stromauf in der Entfernung a aufhält. Ihren Energieaufwand E für diese Reise möchte
sie möglichst klein halten. Da sie intelligent ist, weiß sie, dass E im Wesentlichen von ihrer Schwimmk
geschwindigkeit v R und ihrer Schwimmzeit t abhängt, genauer: E = c · vR
· t (c > 0 und k > 1
sind gegebene physikalische Konstanten.) Wie wählt die Fischin ihre Schwimmgeschwindigkeit v R ?
(Gegeben: v 0 , a, c, k )
Index
Abbildungsvorschrift, 176
Ableitung, 207
Ableitung (Rechenregeln), 212
Ableitungen im Überblick, 212
Ableitungen, höhere, 211
Abszisse, 176
Achsenabschnittsform der Ebene, 46
Additionstheorem der Winkelfunktionen, 38
adjungierte Matrix, 154
alternierende Folge, 159
alternierende Reihe, 170
arithmetische Reihe, 168
asymptotisches Verhalten, 243
Aufpunkt, 19
Azimuthwinkel, 27
Basis, 13
Basisvektoren, 9, 13
Betrag einer komplexen Zahl, 65
Betragsquadrat, 73
Cauchy-Folge, 165
charakteristische Gleichung, 143
charakteristische Polynom, 144
de l’Hospital, Regel von, 238
Definitionsbereich, 176
Definitionslücke, 178, 243
Determinante, 55, 101
Deviationsmomente, 109
Diagonale, 94
Diagonalelemente eine Matrix, 92
Differentialgleichung, 222
Differentialoperator, 210
Differentialquotient, 209
Differentialrechnung, 207
Differenzenquotient, 207
Differenzierbarkeit einer Funktion, 211
Differenzieren, implizites, 224
Differenzieren, logarithmisches, 223
Differenzvektor, 11
Distibutivgesetz, 95
divergent, 161
doppelte Nullstellen, 88
Drehmatrix, 96, 105, 107
Drehspiegelung, 106
Dreiecksmatrizen, 117
Dreiecksungleichung, 14
dynamische Unwucht, 109
Ebene Polarkoordinaten, 27
Eigenraum, 144
Eigenwert, 141
Eigenwertgleichung, 141
Eigenwertproblem, 141
Einheitsmatrix, 94
Einheitsvektor, 14
elementare Zeilen- oder Spaltenumformungen, 118
Elevation, 30
endliche Reihe, 167
Entwicklungssatz von Laplace, 115
erweiterte Koeffizientenmatrix, 123, 125
Eulersche Formel, 77
Eulersche Zahl, 77
Exponentialform, 78
Exponentialfunktion, 77
Extrema, 243
Extremum, lokales, 241
Extremwerte, 241
fast alle, 160
Folgenglieder, 158
Funktion, 176
Funktion, analytische, 232
Funktionswerte, 176
Gauß-Algorithmus, 129
Gaußschen Zahlenebene, 63
Gaußsches Eliminationsverfahren, 129
geometrische Reihe, 167
Gerade und ungerade Funktionen, 181
Geschwindigkeit, 207
Graph einer Funktion, 176
Grenzwert, 160
Hauptwurzel, 85
hermitesch konjugierte Matrix, 154
Hessesche Normalenform, 43
245
INDEX
homogenes lineares Gleichungssystem, 127
Hyperebene, 123
Imaginäre Einheit, 65
imaginäre Zahl, 65
Imaginärteil, 63
Index, 158
Induktion, vollständige, 215
inhomogenes lineares Gleichungssystem, 127
Inhomogenität eines linearen Gleichungssystems,
94
Intervall, 178
invertierbare Matrix, 101
Jägerzaun-Regel, 59
kartesische Darstellung, 65
Kettenregel, 216
Koeffizientenmatrix, 94, 122
Koeffizientenvergleich, 228
kollinear, 12
komplex konjugiert, 72
Komplex konjugiertes Erweitern, 73
komplexe Schwingung, 80
konvergent, 161
Konvergenzradius, 226, 227
konvergiert, 160
Koordinaten, 8
Koordinatenform, 45
Kreuzprodukt, 52
Kroneckersymbol, 36
Kugelkoordinaten, 29
kumulierte Summe, 168
Kurvendiskussion, 241, 243
Lösungsraum, 144
Lagrange (Restglied), 232
Laplace-Entwicklungssatz, 115
Laplace-Entwicklungssatz für Deteminanten, 116
Limes, 160, 161
linear unabhängig, 13
Linearkombination, 9
MacLaurin-Reihe, 232
Matrixelemente, 92
Matrixmultiplikation, 95
Matrizen, 91
Maximum, lokales, 241
Minimum, lokales, 241
Mittelwertsatz der Differentialrechnung, 209
Momentangeschwindigkeit, 207
monotone Folgen, 165
monotone Funktionen, 179
246
Monotonie, 243
Normale, 211
Normalenform der Ebene, 43
Normalenvektor, 43
Normalparabel, 177
Normierung, 14
Nullfolge, 160
Nullstellen, 243
Nullvektor, 10
Ordinate, 176
Orthogonalität, 34
orthonormal, 36
Ortsvektoren, 18
p-q-Formel, 88
Partialbruchzerlegung, 231
Partialsummen, 168
Phasenwinkel, 65
Polardarstellung einer komplexen Zahl, 65
Polarkoordinaten, 27
Polarwinkel, 27, 29
Polstellen, 243
Produktregel, 214
Punkt-Richtungsform, 19, 20
quadratische Gleichungen, 88
quadratische Matrix, 92
Quotientenregel, 217
Rückwärts-Einsetzen, 130
Rückwärtseinsetzen, 133
Rang einer Matrix, 123
Rangkriterium, 123
Realteil, 63
rechtshändiges System, 51
Regel von Sarrus, 59
reguläre Matrix, 101, 124
Reihe, geometrische, 227
Richtungskosinus, 25
Richtungsvektors, 19
Richtungswinkel, 25
Rolle, Satz von, 210
Sattelpunkt, 241
Sattelpunkte, 243
schiefsymmetrische Matrix, 93
Schwebung, 81
singulär, 124
Skalar, 11
skalare Form, 45
Skalarprodukt, 33, 95
INDEX
Skalarprodukt (komplex), 155
Spaltenvektoren, 92
Spat, 56
Spatprodukt, 56
Spur, 92
Stetigkeit, 182
symmetrische Matrix, 93
Tangente, 207, 211
Tangentengleichung, 211
Taylorreihe, 226, 231
transponierte Matrix, 93
trigonometrische Darstellung, 65
triviale Lösung, 128
Umkehrfunktion, 179
Umkehrfunktion, Ableitung der, 218
uneigentlichen Grenzwerte, 162
unendliche Reihe, 168
Ungleichung von Cauchy-Bunjakowski-Schwarz, 34
unitäre Matrix, 156
Unterdeterminanten, 115
Variable, 176
Vektorprodukt, 51
Verkettung von Funktionen, 180
Wendepunkte, 241–243
Wertebereich, 176
Wurzeln, 85
Zeiger, 63
Zeilenvektor, 95
Zeilenvektoren, 92
Zenitwinkel, 30
zyklische Permutationen, 53
Zylinderkoordinaten, 29
247
Anhang A
Elementare Tatsachen über Winkel
In diesem Anhang werden ein paar Tatsachen über Winkel zusammengefasst, die in der Vorlesung ohne
weitere Begründungen verwendet werden. Die meisten Dinge sind anschaulich unmittelbar einleuchtend
und werden nicht weiter mathematisch begründet. Ein paar andere Dinge sind Wiederholungen des
Schulstoffs.
A.1
Richtungen im Raum
Zwischen zwei Richtungen im Raum, die durch die Vektoren ~a und ~b beschrieben werden, gibt es einen
Winkel ϕ. Auf die Reihenfolge der Vektoren kommt es dabei nicht an. Der Winkel liegt zwischen 0◦ und
180◦. Für ϕ = 0◦ zeigen die Vektoren in die selbe Richtung, und für ϕ = 180◦ in die entgegengesetzte
Richtung. Für 0◦ < ϕ < 90◦ spricht man von einem spitzen Winkel, und für 90◦ < ϕ < 180◦
spricht man von einem stumpfen Winkel. Für den rechten Winkel ϕ = 90◦ stehen die Richtungen
senkrecht zu einander.
A.2
Wichtige Werte für Sinus und Cosinus
Wir betrachten zunächst ein gleichseitiges und rechtwinkliges Dreieck. Das ist ein Geo-Dreieck, wie
man es aus der Schule kennt. Abbildung A.1 zeigt ein solches Dreieck für die Hypothenuse c = 1. Es
gilt α = β = 45◦ . Aus dem Satz des Pythagoras folgt
sin 45◦ = cos 45◦ =
1√
2.
2
Jetzt betrachten wir ein rechtwinkliges Dreieck der Hypothenuse c = 1 mit α = 30◦ und ergänzen es
durch Spiegelung zu einem gleichseitigen Dreieck der Seitenlänge c = 1 (s. Abbildung A.2). Wegen der
Spiegelsymmetrie gilt
1
sin 30◦ = cos 60◦ = .
2
Nach dem Satz des Pythagoras berechnet sich die Höhe des gleichseitigen Dreiecks zu
cos 30◦ = sin 60◦ =
248
1√
3.
2
ANHANG A. ELEMENTARE TATSACHEN ÜBER WINKEL
249
β = 45◦
c=1
sin(α) =
α = 45◦
1
2
√
2
.
cos(α) =
1
2
√
2
Abbildung A.1: Ein gleichseitiges, rechwinkliges Dreieck.
A.3
Winkelfunktionen am Einheitskreis
Wir betrachten die x-y-Ebene und legen einen Einheitskreis um den Ursprung. Die Einheitsvektoren
werden als Pfeile gezeichnet, deren Spitzen auf dem Einheitskreis liegen. In Abbildung A.3 sind vier
solche Vektoren ~v1 , ~v2 , ~v3 , ~v4 eingezeichnet, die jeweils in einem der vier Quadranten liegen.
y-Achse
~v2
~v1
y1
ϕ1
π
180◦
ϕ2 = 135◦
ϕ1 = 30◦
x1 1
x-Achse
ϕ4 = −30◦
ϕ3 = −120◦
~v4
~v3
Abbildung A.3: Winkelfunktionen am Einheitskreis.
Jedem Einheitsvektor ~v in der x-y-Ebene ordnen wir einen gerichteten Winkel ϕ zu: Den Winkel,
ANHANG A. ELEMENTARE TATSACHEN ÜBER WINKEL
250
β = 60◦
c=1
sin(α) =
α = 30◦
√
cos(α) = 12 3
1
2
.
Abbildung A.2: Ein rechwinkliges Dreieck mit α = 30◦ .
den der Vektor mit dem Einheitsvektor
~ex =
1
0
(d.h. mit der Richtung der positiven x-Achse) einschließt, zählen wir positiv, wenn der Vektor in der
oberen Halbebene liegt (Quadrant 1 oder 2) und negativ, wenn der Vektor in der unteren Halbebene
liegt (Quadrant 3 oder 4). Der Winkelbogen wird mit einem Pfeil versehen (y oder x), der von der xAchse zu dem Vektor zeigt. Bei mathematisch positivem Drehsinn x (gegen den Uhrzeiger) des Pfeiles
wird der Winkel positiv gezählt, bei mathematisch negativem Drehsinn y (mit dem Uhrzeiger) wird
er negativ gezählt. Die Winkel der Vektoren ~v1 , ~v2 , ~v3 , ~v4 in Abbildung A.3 lauten folgendermaßen:
ϕ1 = 30◦ ,
ϕ2 = 135◦ ,
ϕ3 = −120◦ ,
ϕ4 = −30◦
Der Winkel ϕ eines Einheitsvektors ~v kann also zwischen −180◦ und 180◦ liegen. Durch diese Erweiterung des Winkelbereiches gibt es nun eine umkehrbar eindeutige Zuordnung zwischen Einheitsvektor
und Winkel: Der gerichtete Winkel ϕ legt eindeutig den Einheitsvektor ~v fest, und jeder Einheitsvektor
~v besitzt einen eindeutigen Winkel ϕ.
Mit Hilfe des Einheitskreises kann man die Definition von Kosinus und Sinus verallgemeinern. Am in
der ursprünglichen Definition am rechtwinkligen Dreieck können die Winkelfunktionen Kosinus und
Sinus können für Winkel zwischen 0◦ und 90◦ definiert werden. Am Einheitskreis entspricht dies dem
ersten Quadranten. Für einen Vektor
x
~v =
y
in diesem Quadranten (in der Abbildung z.B. ~v1 ) ergibt sich nach der Definition von Sinus und Kosinus
am rechtwinkligen Dreieck die Beziehung:
x = cos ϕ und y = sin ϕ
Wir verallgemeinern dies nun auf alle Winkel zwischen −180◦ und 180◦ : Für einen beliegen Winkel ϕ
aus diesem Intervall ist der Kosinus die x-Komponente des zugehörigen Einheitsvektors und der Sinus
ANHANG A. ELEMENTARE TATSACHEN ÜBER WINKEL
251
die y-Komponente. Es gilt also:
~v =
cos ϕ
sin ϕ
Für Vektoren in der rechten Halbebene (x > 0) lässt sich der Winkel aus den Koordinaten x, y mit
y ϕ = arctan
x
berechnen. Der Arkustangens liefert nur Winkel zwischen −90◦ und 90◦ . Für Vektoren mit x < 0 muss
man zu dem aus der obigen Formel berechneten Wert noch 180◦ addieren oder subtrahieren, um zu
dem richtigen Winkel zu gelangen.
Bisher haben wir nur Winkel ϕ zwischen −180◦ und 180◦ betrachtet. Wenn man einen Vektor um ±360◦
dreht, bekommt man wieder den selben Vektor. Der Winkel ϕ ± 360◦ entspricht also geometrisch der
selben Richtung wie der Winkel ϕ. Wir können deshalb auch mit Winkeln außerhalb des Bereichs
weiter rechnen und insbesondere auch Kosinus und Sinus für alle diese Winkel erklären. Auf diese
Weise kann man das Grundintervall für die Definition des Winkels ϕ auch anders legen und z.B. mit
Winkeln zwischen 0◦ und 360◦ arbeiten. Manchmal ist dies praktischer.
Das Bogenmaß
Anstatt in dem eben verwendeten Gradmaß [deg] werden Winkel werden oft im Bogenmaß [rad]
angegeben. Es gilt:
ϕ [deg]
ϕ [rad]
=
π
180◦
Man kann sich ϕ [rad] als die Länge eines Bogenstücks des Einheitskreises1 vorstellen, wobei 180◦ dem
Bogen des Halbkreises entspricht. Jeder Winkel ϕ lässt sich durch das zugehörige Kreisbogenstück
ϕ
π
180◦
ausdrücken, welches für ϕ1 in Abbildung A.3 in schwarz eingezeichnet ist. Dieses Kreisbogenstück
nennt man das Bogenmaß des Winkels. Das Kreisbogenstück ist gerichtet und wird daher auch mit
einem Pfeil versehen. Häufig gibt man bei den Winkelfunktionen im Bogenmaß statt im Gradmaß an
und schreibt dann z.B.
π
sin anstatt sin 45◦ .
4
1 Der
Einheitskreis ist ein Kreis mit dem Radius r = 1.
Herunterladen