Mathematik für Physiker I

Werbung
Teil I
Mathematik für Physiker I
1
Kapitel 1
Zahlen und Vektoren
Wir beschäftigen uns hier mit Vektoren, die in der analytischen Geometrie, wie sie für einen
Einstieg in die klassische Mechanik hilfreich ist, zentral sind. Dabei gehen wir von nur“ auf
”
Rechenregeln fundierten reellen Zahlen aus, was aber dennoch ausreicht, ein Rechnen mit Vektoren zu ermöglichen. Elemente der Sprache der Mathematik führen wir entlang der auftretenden
Notwendigkeiten ein, später werfen wir einen tieferen Blick darauf.
1.1
Physikalische Größen
Die Beschreibung (unbelebter) Natur in der Physik wird durch eine Reihe von Begriffen möglich.
Wir kennen selbst ohne tiefere Beschäftigung mit der Physik schon einige: Länge, Zeit, Masse,
Geschwindigkeit, Beschleunigung, elektrische Ladung, . . . . Ihre eindeutige und unmissverständliche Definition ist notwendige Voraussetzung für den Aufbau einer physikalischen Theorie.
Die physikalischen Begriffe müssen auch quantitativ erfasst, d.h. durch Einheiten und Zahlen
ausgedrückt/gemessen werden können. Messbare Begriffe werden häufig als Größen bezeichnet.
Das Endziel der Verknüpfung von Größen und Begriffen ist die Aufstellung physikalischer Gesetze. In der exakten Definition der Begriffe und Größen und in der exakten Formulierung der
Gesetze liegt die Bedeutung der Mathematik: sie stellt die geeignete Sprache bereit und sie liefert
mit ihren unterschiedlichen Betrachtungsweisen (algebraisch, arithmetisch, geometrisch), Theorien und Resultaten wichtige Erkenntnisse bei der Analyse physikalischer Theorien. Andererseits
hat sich tiefe Mathematik (über drei Jahrhunderte hinweg), angetrieben insbesondere durch Fragestellungen der Mechanik, fast ausschließlich im Wechselspiel mit der Physik entwickelt.
Ein bemerkenswertes Beispiel dafür stellen die Kepplerschen Gesetze dar. Aufgefunden wurden sie durch intensive Beobachtungen der Planetenbewegungen, eine theoretische Begründung
erfuhren sie durch die Newtonschen Gesetze, der Versuch, sie abzusichern auch in allgemeinerem
Rahmen hat im Gefolge der Variationsrechnung die Differenzial– und Integralrechnung hervorgebracht, in der Einbettung in Form der Lagrange– und Hamiltonmechanik wurden allgemeine
Prinzipien von Bewegung entdeckt. Im Zentrum der Mechanik steht die Beschreibung und Untersuchung der Bewegung von Massenpunkten, in Mehrteilchensystemen und von starren Körpern.
Sehr allgemein ausgedrückt, hat dies damit zu tun, Gesetze aufzustellen und zu analysieren, die
eine Vorhersage“ für die Bewegung gestatten.
”
Viele Einführungen in die mathematischen Vorbereitungen auf die Mechanik beginnen etwa
so: Zur Festlegung einer physikalischen Größe werden drei Angaben benätigt:
Dimension, Maßeinheit, Maßzahl
Die Maßzahlen sind entnommen einem Zahlbereich. Man kommt in der Regel mit den reellen
Zahlen, die wir unten zunächst naiv“ verwenden werden, später dann auf ein sicheres Fundament
”
2
stellen werden, aus. Dabei führen wir dann auch die komplexen Zahlen ein, die ebenfalls als
Maßzahlen Verwendung finden können.
Für das MKS–System (Meter–Kilogramm–Sekunden–System) sind die Größen Länge, Masse,
Zeit zentral; siehe Abbildung 1.1.
Physikalische Größen, die nach Festlegung der Dimension und einer Maßeinheit durch die Angabe einer einzigen
Maßzahl vollständig beschrieben sind,
nennt man Skalare.1 Größen, bei denen zur vollständigen Beschreibung neben einem Zahlenwert, dem Betrag“,
”
noch die Angabe einer Richtung“ er”
forderlich ist, nennt man Vektoren.
Beispiele für Skalare: Masse,
Temperatur, Energie, Wellenlänge, . . . .
Beispiele für Vektoren: Kraft,
Geschwindigkeit, Beschleunigung,. . . .
Länge
Maßeinheit Meter/m
Masse
Dimension [Masse]
Maßeinheit Kilogramm/kg
Zeit
Dimension [Zeit]
Maßeinheit Sekunde/s
Geschwindigkeit
Kraft
Um die Frage, was Vektoren im mathematischen Sinne sind, geht es nach
einer kurzen Einführung der reellen
Zahlen(gerade) im übernächsten Abschnitt.
1.2
Dimension [Länge]
[Laenge]
[Zeit]
m
Maßeinheit s
[Masse][Laenge]
Dimension
[Zeit][Zeit]
Maßeinheit Newton/N
Dimension
Abbildung 1.1: MKS–System
Die reelle Zahlengerade
Für die Maßzahlen bei physikalischen Größen
benätigen wir einen Zahlbereich, in dem wir
−2
−1
0
1
2
3
auf gesicherter Basis rechnen“ können. Da”
zu reichen uns zunächst die reellen Zahlen.
Abbildung 1.2: Reelle Zahlengerade
Wir stellen sie uns mitunter als Zahlengerade vor; siehe Abbildung 1.2. Auf dieser sind
die natürlichen Zahlen 1,2,3, . . . , die wir zum Zählen von Objekten verwenden, und die negativen ganzen Zahlen −1, −2, . . . eingetragen; zusammen mit der Null bilden sie die ganzen Zahlen.
Einen Sonderplatz nimmt die Null ein: sie trennt den positiven Halbstrahl“ (rechts von der
”
Null) und den negativen Halbstrahl“ (links von der Null); der Pfeil am rechten Ende des Aus”
schnitts der Zahlengeraden deutet die Wachstumsrichtung an. Hier haben wir eine Konvention
(Wachstum nach rechts) übernommen, die später bei der Orientierung von Koordinatensystemen
viel wesentlicher zu Tage tritt.
Aufgefüllt wird die Zahlengerade lückenlos“ mit den rationalen und irrationalen Zahlen. Die”
se Zahlen können wir uns in einer hier ausreichenden naiven Sicht als Dezimalzahlen vorstellen.
Aber was meinen wir damit?
1
Bei den Griechen hießen die (ungleichen) Seitenlängen eines quaderförmigen Körpers σκαλενoὶ ά
’ ριϑµoι.
3
Rationale Zahlen schreiben wir meist als Brüche, also als Ausdrücke der Form
x=
p
wobei p eine ganze Zahl, q eine natürliche Zahl ist;
q
dabei heiät p Zähler, q Nenner der Zahl.
Die Darstellung einer rationalen Zahl ist nicht eindeutig. Dies zeigt das bekannte Kürzen und
Erweitern von Brüchen. Eine eindeutige Darstellung als Bruch lässt sich erreichen durch die
Forderung, dass Zahlen und Nenner teilerfremd sind, d.h. wenn alle Teiler herausgekürzt sind.
Von der Darstellung als Bruch kommt man zur Darstellung als Dezimalbruch in der üblichen
Weise durch Division mit Rest. So ergibt sich
1
3
8
5
7
=
11
= 1.375 (abbrechender Dezimalbruch) ,
8
= 0.714285714 . . . = 0.714285 (periodischer Dezimalbruch) .
Die Periode wird dabei durch überstreichen der Ziffernfolge, die sich periodisch wiederholt,
gekennzeichnet. Bei der Herstellung eines Dezimalbruchs für eine rationale Zahl x = pq kann als
Rest immer nur eine der Zahlen 0, . . . , q − 1 auftreten. Tritt der Rest Null auf, so bricht der
Dezimalbruch ab. Anderenfalls gibt es höchstens q − 1 verschiedene Reste und spätestens nach
q − 1 Ziffern des Dezimalbruchs (von vorangestellten Nullen abgesehen) muss einer der Reste
erneut auftreten, so dass der Dezimalbruch periodisch wird. Daher können wir festhalten:
Jede rationale Zahl lässt sich durch einen abbrechenden oder periodischen Dezimalbruch darstellen.
Umgekehrt lässt sich jeder abbrechende oder periodische Dezimalbruch als Bruch schreiben. Die
Grundidee der Umwandlung von periodischen Dezimalbrüchen in Brüche – die Umwandlung von
abbrechenden Dezimalbrüchen ist trivial – zeigt das folgende Beispiel: Ist
x = 0.d1 . . . dk , wobei jedes di eine ganze Zahl zwischen 0 und 9
und k ein natürliche Zahl ist, so gilt mit der Potenz 10k := |10 ·{z
· · 10}
k–mal
10k x = d1 . . . dk + 0.d1 . . . dk = d1 . . . dk + x , also x =
d1 . . . dk
.
10k − 1
Beispiel 1.1
0.478 =
0.478 =
53.23478 =
478
,
1000
478
,
999
1
1
478
531855
(5323 + 0.478) =
(5323 +
) =
.
100
100
999
99900
Bemerkung 1.2 Die Dezimalbruchentwicklung ist nur eine Variante aus der Vielfalt der g–
adischen Entwicklungen: Für eine Zahl g = 2, 3, 4, . . . , 10, . . . kann man Zahlen x = 0.r1 r2 . . .
betrachten, wobei jede Ziffer vom Wert 0, 1, . . . , g − 1 ist. Bei g = 2 spricht man von der
Dualentwicklung.
4
Die rationalen Zahlen reichen nicht aus, um alle Zahlen der Zahlengeraden zu erfassen. Dies
können wir hier durch den Dezimalbruch
0.10 100 1000 10000 1 . . . (= 10−1 + 10−3 + 10−6 + 10−10 + · · · )
belegen, der weder abbricht noch periodisch ist. Er kann nach obiger Überlegung keine rationale
Zahl darstellen. Der Summationsprozess sollte aber gut gehen, denn wir haben ja
0.10 100 1000 10000 1 · · · < 10−1 + 10−2 + 10−3 + 10−4 + · · · =
1
10
−1 = 9 .
1 − 10
wie wir später beim Thema Folgen“ noch sehen werden. Dies – wir werden weitere Notwendig”
keiten entdecken – macht die Erweiterung der rationalen Zahlen um die Menge der irrationalen
Zahlen nätig.
Praktisch rechnet man mit abbrechenden Dezimalbrüchen. Damit sind also nicht einmal alle
rationalen Zahlen erfasst. Doch worauf kommt es aber beim exakten“ Rechnen mit reellen
”
Zahlen im Folgenden an?
Es gibt eine Rechenart Addition, die mit dem Zeichen + “ zwei reelle Zahlen so verknüpft,
”
dass folgende Rechenregeln gelten:
(a)
Es gilt das Assoziativgesetz:
a + (b + c) = (a + b) + c für alle reellen Zahlen a, b .
(b) Die Null ist neutral für die Addition:
0 + a = a + 0 = a für alle reellen Zahlen a .
(c)
Für jede reelle Zahl a gibt es eine eindeutig bestimmte Zahl −a mit
(−a) + a = a + (−a) = 0 .
(d) Es gilt das Kommutativgesetz:
a + b = b + a für alle reellen Zahlen a, b .
Die Operation, die aus einem a die Zahl −a erzeugt, nennt man Negation. Dies führt uns
zur Subtraktion:2
a − b := a + (−b) für alle reellen Zahlen a, b .
Es gibt eine Rechenart Multiplikation, die mit dem Zeichen ·“ zwei reelle Zahlen so ver”
knüpft, dass folgende Rechenregeln gelten:
(a)
Es gilt das Assoziativgesetz:
a · (b · c) = (a · b) · c für alle reellen Zahlen a, b .
(b) Die Eins ist neutral für die Multiplikation:
1 · a = a · 1 = a für alle reellen Zahlen a .
(c)
Für jede reelle Zahl a verschieden von Null gibt es eine eindeutig bestimmte Zahl a−1 mit
a−1 · a = a · a−1 = 1 .
(d) Es gilt das Kommutativgesetz:
a · b = b · a für alle reellen Zahlen a, b .
2
Hier haben wir das definierende Gleichheitszeichen := verwendet: das, was links von := steht, wird durch das,
was rechts davon steht, erklärt.
5
Die Operation, die aus einer nicht verschwindenden Zahl a die Zahl a−1 erzeugt, nennt man
Inversion. Dies führt uns zur Division:
a
:= a/b := ab−1 für alle reellen Zahlen a, b mit b verschieden von Null .
b
Beachte: Der Nenner b ist immer von Null verschieden.
Nun können wir die Strichrechnung“ Addition und Subtraktion mit der Punktrechnung“
”
”
Multiplikation und Division verknüpfen. Dies geschieht nach folgender Regel:
Es gilt das Distributivgesetz:
a · (b + c) = a · b + a · c für alle reellen Zahlen a, b .
Das Distributivgesetz ist Basis für Rechentricks“ der Form
”
17 · 34 = (10 + 7) · 34 = 17 · (30 + 4) = (10 + 7) · (30 + 4) .
Aus dem Distributivgesetz lesen wir ab, dass mit der Regel Multiplikation hat Vorrang vor
”
der Addition“ an vielen Stellen Klammern weggelassen werden dürfen. Ferner ist es üblich,
an Stellen, wo die Übersichtlichkeit nicht leidet, auch den Punkt ·“ für die Multiplikation
”
wegzulassen.
Aus den obigen Regeln ergeben sich die uns wohlvertrauten Regeln
0 · a = 0, (−a) · (−a) = a, −(a · b) = (−a) · b für alle reellen Zahlen a, b .
(1.1)
Wir werden später, wenn wir die reellen Zahlen in abstrakterem Kontext axiomatisch einführen,
diese Regeln als Konsequenz der obigen drei Regelgruppen erkennen. Wichtig ist, dass das Negative einer Zahl schon eindeutig bestimmt ist, was man an
0 = a + a1 = a + a2 führt zu a1 = a1 + (a + a2 ) = (a1 + a) + a2 = 0 + a2 = a2
abliest.
Die drei Regelgruppen für Addition, Multiplikation, Klammerrechnung“ genögen als Fun”
dament für die reellen Zahlen noch nicht, es fehlt uns noch die Möglichkeit reelle Zahlen zu
vergleichen. Dazu die folgende Forderung:
Es gibt positive reelle Zahlen, so dass folgende Rechenregeln gelten:
(a)
Sind a, b positive Zahlen, dann sind auch a + b, ab positive Zahlen.
(b) Für jede reelle Zahl a gilt genau eine der folgenden Alternativen:
a ist positiv, − a ist positiv, a = 0 .
(c)
1 ist eine positive Zahl.
Ist a eine positive Zahl, so heiät −a eine negative Zahl.
Die erste Rechenregel besagt, dass durch die beiden Rechenarten Addition und Multiplikation
die positiven Zahlen nicht verlassen werden; man sagt, die positiven Zahlen sind abgeschlossen
gegenüber Addition und Multiplikation. Die zweite Rechenregel teilt die reelle Zahlengerade auf
in einen linken Halbstrahl (positive Zahlen), einen linken Halbstrahl (negative Zahlen) und die
6
Null. Die dritte Regel liefert die Aussage, dass es eine positive Zahl gibt. Es gibt sogar viele
positive Zahlen, denn mit (a), (b) folgt, dass mit 1 auch
2 = 1 + 1, 3 = 2 + 1, 4 = 2 + 2, . . . , n := |1 + ·{z
· · + 1}, . . .
n–mal
positive Zahlen sind. (Es ist natürlich etwas unbefriedigend, n zu definieren mit einem Ausdruck,
in dem umgangssprachlich n–mal vorkommt, aber hier ist es wohl verständlich.)
Wir schreiben:
a > 0 , falls a eine positive Zahl ist,
a < 0 , falls a eine negative Zahl ist.
Wir erweitern dies zur Größer–Relation zwischen zwei reellen Zahlen a, b :
a > b , falls a − b > 0 gilt.
Damit ergeben sich nun ergänzend die folgenden Schreibweisen:
a<b
, falls b > a .
a≥b
, falls a > b oder a = b .
a≤b
, falls b ≥ a .
Wichtig für das Rechnen mit Ungleichungen ist die Transitivität von >. Dies meint:
Aus a > b, b > c folgt a > c .
(1.2)
Diese Transitivität folgt mit der Tatsache, dass die Menge der positiven Zahlen abgeschlossen
ist gegenüber Addition, so:
Aus a > b, b > c folgt a − b > 0, b − c > 0 und daher a − c = (a − b) + (b − c) > 0 .
Hier haben wir einen ersten Beweis vorgeführt: beginnend mit zutreffenden Aussagen haben
wir eine Argumentationskette aufgebaut, die zur erwünschten Aussage führt. Übrigens, auch
folgende Varianten der Transitivität sind gültig:
Aus a > b, b ≥ c folgt a > c; aus a ≥ b, b ≥ c folgt a ≥ c .
Das Vorzeichen sign(·) einer reellen Zahl sei folgendermaßen festgelegt:
(
+1 , falls x ≥ 0
sign(x) :=
−1 , falls x < 0
Den Betrag einer reellen Zahl x führen wir so ein:
(
x
, falls x ≥ 0
|x| :=
−x , falls x < 0
Die Definition erfolgt also durch Fallunterscheidung, die eine vollständige ist, denn für eine reelle
Zahlen x gilt ja entweder x ≥ 0 oder x < 0 . Den Betrag |x| einer Zahl x kann man auch als
Abstand der Zahl x vom Nullpunkt auf der Zahlengeraden verstehen.
7
Rechenregeln 1.3 Seien x, y, a reelle Zahlen.
x ≤ |x| , −x ≤ |x| für alle x ∈ R;
|ax|
=
|a||x| für alle x, a ∈ R;
|x + y| ≤ |x| + |y| für alle x, y ∈ R;
||x| − |y|| ≤ |x − y| für alle x, y ∈ R.
(1.3)
(1.4)
(1.5)
(1.6)
Die Ungleichung (1.5) heiät Dreiecksungleichung. Später wird diese Bezeichnung verständlich
werden. Der Beweis dieser Ungleichung kann durch Fallunterscheidung erbracht werden. Der
Fall x > 0, y > 0 ist ganz trivial, da dann auch x + y > 0 ist und in (1.5) sogar Gleichheit gilt.
Betrachte den Fall x > 0, y < 0. Ist x + y ≥ 0, dann schlieät man so
|x + y| = x + y = |x| + y ≤ |x| + |y|,
anderenfalls schlieät man so:
|x + y| = −(x + y) = −x − y = −x + |y| ≤ |x| + |y|.
Alle anderen Fälle sind einfach zu verifizieren.
Der Nachweis der anderen Regeln sei dem Leser überlassen.
Wichtig ist noch festzuhalten, dass sich mit (1.1) ergibt:
a2 := a · a > 0 für jede reelle Zahl verschieden von Null.
(1.7)
Der Beweis“ dazu: Ist die Zahl a verschieden von Null, dann ist sie entweder positiv oder negativ.
”
Ist sie positiv, dann ist a2 = aa positiv, ist sie negativ, dann ist −a positiv und a2 = (−a)(−a)
positiv, da die positiven Zahlen abgeschlossen sind gegenüber Multiplikation.
1.3
Mengen, die Erste
Im letzten Abschnitt haben wir uns ziemlich abgemüht, Objekte mit Eigenschaften zu beschreiben und einzugrenzen: ganz, nichtnegativ, größer, . . . . Damit dies etwas leichter von der Hand
geht, führen wir die Mengenschreibweise ein; später lernen wir dann symbolisch damit zu hantieren.
Den Begriff der Menge wollen und können und sollten wir hier nicht im Sinne der mathematischen Grundlagen einführen. Er dient uns nur als Hilfsmittel für eine möglichst kurze Notation
von konkreten Mengen. Von G. Cantor, dem Begründer der Mengenlehre, haben wir folgende
Definition:
Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer Anschauung oder unseres Denkens – welche Elemente der Menge genannt werden – zu einem
Ganzen.
Eine Menge besteht also aus Elementen, kennt man alle Elemente der Menge, so kennt man die
Menge.
Man kann eine Menge dadurch bezeichnen, dass man ihre Elemente zwischen zwei geschweifte
Klammern (Mengenklammern) schreibt. Die Zuordnung eines Elements zu einer Menge erfolgt
mit dem Zeichen “ ∈ “. Gehört ein Objekt x nicht zu einer Menge M, so schreiben wir x ∈
/ M.
Es hat sich als zweckmäßig erwiesen, den Mengenbegriff so aufzufassen, dass eine Menge aus
gar keinem Element bestehen kann. Dies ist dann die leere Menge, das Zeichen dafür ist ∅ .
8
Beispielsweise ist die Menge der rationalen Zahlen, deren Quadrat gleich 2 ist, leer, wie wir noch
sehen werden.
Das Hinschreiben der Elemente einer Menge kann auf zweierlei Weisen geschehen. Hat die
Menge nur ganz wenige Elemente, so kann man sie einfach alle hinschreiben, durch Kommata
getrennt, auf die Reihenfolge kommt es dabei nicht an, etwa:
{1, 2, 3} = {2, 3, 1} = {3, 3, 1, 2} , Fermionen := {Quarks, Leptonen} .
Abgekürzt verfährt man oft auch so: Elemente, die man kennt, aber nicht (alle) nennen will,
werden durch Punkte angedeutet, etwa:
{1, 2, 3, 4, 5, 6, 7, 8} = {1, 2, . . . , 8} = {1, . . . , 8} .
Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Umfangsdefinition. Die zweite
Möglichkeit besteht darin, Objekte einer Menge als Elemente dadurch zuzuordnen, dass man
ihnen eine charakterisierende Eigenschaft zuweist. Ist E eine Eigenschaft, die jedes Objekt x
einer Menge M hat oder nicht hat, so bezeichne
{x ∈ M |x hat die Eigenschaft E}
die Menge aller Elemente von M , die die Eigenschaft E haben; etwa
V := {Vierecke|zwei gegenüberliegende Seiten sind gleich lang} ,
wobei unterstellt wird, dass die Menge der Vierecke wohldefiniert ist. Man nennt diese Art,
Mengen hinzuschreiben, zu definieren, die Inhaltsdefinition. Wichtig beim Hinschreiben von
Mengen ist, dass stets nachgeprüft werden kann, ob ein spezielles Objekt einer in Frage stehenden
Menge angehört oder nicht; siehe obige Definition von Cantor.
Beispiele von Mengen, die wir schon ausgiebig benutzt haben und die wir noch benätigen
werden, sind:
N := Menge der natürlichen Zahlen := {1, 2, 3, . . . , n, n + 1, . . . }
Z := Menge der ganzen Zahlen := {0, ±1, ±2, . . . } ,
p
Q := Menge der rationalen Zahlen := { |p ∈ Z, q ∈ N}
q
R := Menge der reellen Zahlen .
Wir führen, nachdem wir die natürlichen Zahlen nun zur Hand haben, noch eine Kurzschreibweise ein. Sei x eine reelle Zahl und n eine natürliche Zahl. Wir setzen:
nx := x
· · + x} , xn := x
· · · x} .
| · ·{z
| + ·{z
n–mal
n–mal
Mit Hilfe der natürlichen Zahlen kann man diese Vielfachen und Potenzen auch anders definieren,
nämlich induktiv:
1x := x, (n + 1)x := nx + x , x1 := x, xn+1 := xn · x .
Dabei stätzen wir uns auf die Tatsache, dass 1 die kleinste natürliche Zahl ist und jede natürliche
Zahl n einen Nachfolger n + 1 hat.
Wir wissen schon 0x = 0 und vereinbaren noch: x0 := 1 für jede Zahl x .
9
Hat man eine Eigenschaft E(n) für jede natürliche Zahl n zu definieren, verifizieren, so reicht
es, dies für n = 1 zu tun (Induktionsbeginn) und für n + 1 unter der Annahme, dass dies
schon für n getan ist (Induktionsschluss). Dieses Prinzip heiät Vollständige Induktion.
Man kann sich dieses Prinzip an einer unendlichen Reihe von Dominosteinen veranschaulichen:
Wenn sicher ist, dass für jedes n der n + 1–te Stein fällt, wenn der n–te Stein fällt, dann fallen
alle Steine, wenn der erste Stein fällt.
Beispiel 1.4 Wir betrachten als erstes Beispiel für das Prinzip der vollständigen Induktion die
Definition der Fakultät n!“ einer natürlichen Zahl n:
”
1! := 1 , (n + 1)! := n! · n .
Diese Definition ergänzen wir durch die Vereinbarung 0! := 1 .
Als weiteres Beispiel für die induktive Definition führen wir die Definition des Summenzeichens an. Wir setzen:
n
X
ai := a1 , für n = 1 ,
n+1
X
ai := an+1 +
i=1
i=1
i=1
n
X
ai , für n ∈ N ;
dabei sind a1 , . . . , an+1 ∈ X := R ; später können wir diese Definition auch für allgemeinere
Mengen X übernehmen, wennPdort eine Addition definiert ist.
Auch das Summenzeichen ni=0 ai ist damit erklärt, wenn man die naheliegende Umnummerierung
n+1
n
X
X
ai−1
ai :=
i=0
i=1
vornimmt.
Beispiel 1.5 Über G.F. Gauß wird berichtet, dass er die Beschäftigungstherapie seines Lehrers
“Addiert mal die ersten 20 Zahlen“ durch folgenden Trick zunichte gemacht hat: Er schreibt die
Zahlenreihe 1, . . . , 20 zweimal so
1
20
2
19
...
...
19
2
20
1
hin und addiert spaltenweise. Dies ergibt
2 · (1 + 2 + · · · + 20) = 20 · 21 = 420
und das verlangte Ergebnis ist 210.
Löst man sich von der konkreten Länge der Zahlenreihe, ist also zu beweisen:
2
n
X
i=1
i = n(n + 1) , n ∈ N .
Der Beweis mittels vollständiger Induktion sieht so aus:
Induktionsbeginn: Die Formel ist offenbar richtig für n = 1.
Induktionsschluss: Die Formel sei richtig für n. Wir zeigen damit die Richtigkeit der Formel für
n + 1 so:
n
n+1
X
X
i + 2(n + 1) = n(n + 1) + 2(n + 1) = (n + 1)(n + 2) .
i=2
2
i=1
i=1
10
Die Binomialkoeffizienten sind definiert als
n
n!
, n, k ∈ N, n ≥ k .
:=
k
k!(n − k)!
Sie lassen sich durch die Rekursion“
”
n+1
n
n
=
+
k
k−1
k
berechnen. (Das Pascalsche Dreieck ist eine dahingehende sinnvolle Anordnung der Binomialkoeffizienten.) Bestätige dies!
Satz 1.6 (Binomialformel)
Für a, b ∈ R und n ∈ N gilt:
n
(a + b) =
n X
n
j=0
j
aj bn−j .
Beweis:
Der Beweis mittels vollständiger Induktion sieht so aus:
n = 1 : Klar.
n n+1 :
X
n j n−j
n+1
n
(a + b)
= (a + b)(a + b) = (a + b)
ab
j
j=0
n n X
n j+1 n−j X n j n−j+1
=
a b
+
ab
j
j
j=0
n+1
X
j=0
n X
n j n−j+1
n
k n−(k−1)
=
ab
a b
+
j
k−1
j=0
k=1
n n
n
n n+1 X
n n+1
k n+1−k
+
=
a b
+
b
+
a
k−1
k
0
n
k=1
n n + 1 n+1 X n + 1 k n+1−k
n + 1 n+1
=
b
+
a b
+
a
0
k
n+1
k=1
n+1
X n + 1
=
ak bn+1−k
k
k=0
Wir führen allgemeine Intervalle ein:
[a, b] := {x ∈ R|x ≥ a und x ≤ b} (kompaktes Intervall)
[a, b) := {x ∈ R|x ≥ a und x < b} (halboffenes Intervall)
(a, b] := {x ∈ R|x > a und x ≤ b} (halboffenes Intervall)
(a, b) := {x ∈ R|x > a und x < b} (offenes Intervall)
[a, ∞) := {x ∈ R|x ≥ a} (Halbstrahl)
(−∞, b]
:= {x ∈ R|x ≤ b} (Halbstrahl)
(a, ∞) := {x ∈ R|x > a} (Halbstrahl)
(−∞, b) := {x ∈ R|x < b} (Halbstrahl)
11
Die Bezeichnungen kompakt, halboffen, offen“ werden später noch einen Sinn erhalten. Das
”
Symbol ∞ (Unendlich) haben wir für eine unendlich große Zahl“ reserviert. Sie steht für das
”
unendlich ferne Ende des rechten Halbstrahls der Zahlengeraden; entsprechend −∞ .
Achtung: ∞, −∞ sind keine Zahlen, mit denen man wie gewohnt rechnen kann.
Ein wichtiger Sachverhalt ist, dass (0, ∞) := {x ∈ R|x > 0}, also die Menge der positiven
reellen Zahlen, abgeschlossen bezöglich der Multiplikation mit einer positiven Zahl ist, d.h. aus
x, a ∈ (0, ∞) folgt stets ax ∈ (0, ∞) . Gilt x ∈ (a, b) mit a < b, dann gilt für y := 12 (a + x)
offenbar a < y < x, denn es ist ja y = a + z mit z := 12 (x − a) . Dies zeigt uns, dass wir zwischen
a und x immer noch eine reelle Zahl y finden.
Bei den obigen Intervallen entdecken wir Teilmengenbezöge, etwa ist [a, b) enthalten in [a, b] .
Den Begriff der Teilmenge wollen wir nun exakt aufschreiben.
Definition 1.7
Seien A, B Mengen.
Wir sagen, dass A eine Teilmenge von B ist und schreiben A ⊂ B, wenn jedes Element von A
auch ein Element von B ist.
Wir sagen, dass A gleich B ist und schreiben A = B, wenn A ⊂ B und B ⊂ A gilt.
Beachte: Die Tatsache, dass bei einer Menge (nach der Cantorschen Definition) stets nachgeprüft werden kann, ob ein gegebenes Objekt dazugehört oder nicht – dies mag praktisch sehr
schwer fallen – , macht dieEntscheidung, ob A ⊂ B gilt, nachprüfbar.
Man beachte, dass es unserer Verabredung nicht widerspricht, dass Elemente von Mengen
selbst wieder Mengen sein können. Man hüte sich aber vor Konstruktionen wie Menge aller
”
Mengen“, Teilmengen aller Mengen“ usw.. Damit sind wir in einer naiven Auffasung von Men”
gen überfordert.3
Definition 1.8
Sei A eine Menge. Die Potenzmenge von A ist die Menge der Teilmengen von A einschließlich
der leeren Menge:
P OT (A) := {B|B ⊂ A} .
Beispiel 1.9 Sei A := {p, q, r}. Wie sieht die Potenzmenge P OT (A) aus? Wir haben
P OT (A) = {∅, {p}, {q}, {r}, {p, q}, {q, r}{p, r}, {p, q, r}}
Definition 1.10
Seien A, B Teilmengen von X .
(a)
A ∩ B := {x ∈ X|x ∈ A und x ∈ B} := {x|x ∈ A, x ∈ B}
(b) A ∪ B := {x ∈ X|x ∈ A oder x ∈ B}
(Durchschnitt)
(Vereinigung)
In der Definition 1.10 ist oder “ nicht als ausschließendes oder“ zu verstehen.
”
”
3
Mit den Schwierigkeiten, die bei solchen Konstruktionen auftreten, hat sich Bertrand Russel erfolgreich auseinandergesetzt.
12
Definition 1.11
Seien A, B Mengen. Die Menge A×B := {(a, b)|a ∈ A, b ∈ B} heißt das (kartesische) Produkt
der Faktoren A, B .
Beachte, dass einem Element (a, b) im Produkt A × B eine Ordnung innewohnt“: zuerst a
”
dann b .
Beispiel 1.12 Seien
A := {a} , B := {♥, ∆, #} .
Dann ist
A × B = {(a, ♥), (a, ∆), (a, #)} .
Das kartesische Produkt zweier Mengen hat seine Bedeutung bei der Nutzung von Koordinatensystemen in der Ebene: mit geordneten Paaren sind wir gewohnt, die Koordinaten eines
Punktes zu notieren. Koordinaten nutzend lässt sich dann Dreiecksgeometrie analytisch betreiben. Da R. Descartes4 sehr erfolgreich die Koordinatisierung algebraischer/geometrischer
Probleme betrieben hat, ist die Bezeichnung kartesisches Produkt“ wohl angebracht; genaueres
”
später.
Wir wenden nun die Produktbildung auf die reellen Zahlen an:
R1 := R , R2 := R × R , R3 := R × R × R , , . . . , Rn := R
· · × R}.
| × ·{z
n–mal
Bei Rn haben wir die Produktbildung auf n Faktoren sinngemäß erweitert, also
Rn := {(x1 , . . . , xn )|x1 , . . . , xn ∈ R} .
Man beachte, dass es bei einem n–Tupel (x1 , . . . , xn ) auf die Reihenfolge der Einträge“ x1 , . . . , xn
”
ankommt.
Genauso lässt sich die Produktbildung auf n Faktoren bei einer beliebigen Menge ausdehnen.
Setzt man etwa A := {A, B, C, . . . , Y, Z} (Alphabet), so entsprechen die Tupel (x1 , . . . , xn ) ∈
An := A
· · × A} gerade den Wörtern“ der Länge n unserer Sprache.
| × ·{z
”
n–mal
Definition 1.13
Eine Menge A ⊂ R heiät nach oben beschränkt, wenn es ein x ∈ R gibt mit a ≤ x für alle
a ∈ A.
Eine Menge A ⊂ R heiät nach unten beschränkt, wenn es ein x ∈ R gibt mit x ≤ a für alle
a ∈ A.
Eine Menge A ⊂ R heiät beschränkt, wenn sie nach oben und nach unten beschränkt ist.
1.4
Vollständigkeit der reellen Zahlen
Wir haben uns die reellen Zahlen als Punkte der Zahlengerade vorgestellt. Ist diese Zahlengerade
nun gekörnt“ oder liegen die Punkte lückenlos“ auf dieser Geraden? Wir wollen mit letzterem
”
”
arbeiten. Also was heiät es, dass die rellen Zahlen die Zahlengerade lückenlos ausfüllen?
4
Descartes, René (1596 —1650)
13
Die in Abbildung 1.3 elementar vorgenommene Konstruktion der Diagonalen im Einheitsquadrat legt offenbar eine Zahl x fest, die der Länge der Diagonalen
im Einheitsquadrat entspricht. Nach dem Satz des
Pythagoras (siehe unten) muss x2 = 2 gelten. Die
reellen Zahlen sollten also so reichhaltig sein, dass
diese Zahl nun wirklich existiert. x kann keine rationale Zahl sein – dies beweisen wir später – x ist
also ein nichtabbrechender nichtperiodischer Dezimalbruch. Wir haben folgende Näherungen:
1
1
2
x
1
1
x = 1.4 , x = 1.4142 , x = 1.414213562 . . . .
Abbildung 1.3: Quadratwurzel
Bevor wir die Grundannahme einführen, die uns
Lückenlosigkeit liefert, beschäftigen wir uns mit
Zahlenfolgen. Wir schreiben eine Folge reeller Zahlen so
(xn )n∈N
auf und meinen damit, dass für jedes n ∈ N ein Folgenglied xn ∈ R gegeben ist; diese Folgenglieder bringen wir in die Reihe“
”
x1 , x2 , . . . , xn , xn+1 , . . . .
Wir unterscheiden solche Folgen dann, wenn sie sich in einem Folgenglied unterscheiden.
Beispiel 1.14
(1)n∈N
n
((−1) )n∈N
(1/n)n∈N
n − 3n
)n∈N
(
2n + 7n17 − 1
Konstante Folge: jedes Folgenglied ist 1
Alternierende Folge: − 1, 1, −1, 1, −1, . . .
Folge der sogenannten Stammbrüche: 1, 1/2, 1/3, . . . .
2
Willkürliche“ Folge
”
Folgen will man ansehen, wohin sie streben“, d.h. in welcher Umgebung welcher Zahl auf
”
der Zahlengeraden sich die Folgenglieder eventuell aufhalten“ 5 . Der mathematische Begriff, der
”
dies beschreibt, ist der der Konvergenz.
Definition 1.15
Eine Zahlenfolge (xn )n∈N konvergiert gegen x ∈ R, wenn für jedes Intervall (x−ε, x+ε), ε > 0,
nur endlich viele Folgenglieder xn außerhalb liegen, d.h. wenn es zu jedem ε > 0 ein N ∈ N gibt
mit xn ∈ (x − ε, x + ε) für alle n ≥ N , was gleichbedeutend ist mit |xn − x| < ε für alle n ≥ N .
Wir schreiben dann x = limn∈N xn = limn xn und nennen x den Grenzwert von (xn )n∈N . 5
Das beliebte Spiel auf Knobelseiten von Zeitungen
Setzen Sie folgende Zahlenreihe 1, 9, 25, . . . fort
ist unsinnig: jeder beliebigen Fortsetzung lässt sich ein Sinn abgewinnen.
14
In der obigen Definition sind kleine“ ε von Interesse, denn für große“ ε stellt sich die gewünschte
”
”
Aussage meist von alleine ein. Die endlich viele Folgenglieder xn , die in der Definition 1.15
eventuell außerhalb (x − ε, x + ε) liegen, sind x1 , . . . , xN −1 .
Eine Folge kann nur einen Grenzwert besitzen. Dazu die folgende Überlegung: Sei x =
limn∈N xn , y = limn∈N xn .
Annahme: x 6= y, etwa x < y .
Dann gibt es zu ε ∈ (0, 12 |x − y|) ein N ∈ N mit
|x − xn | < ε , |y − xn | < ε , n ≥ N .
Dies ist aber im Widerspruch zur Wahl von ε .
Es gibt auch Zahlenfolgen, die keinen Grenzwert besitzen; die alternierende Folge ist so eine. Die konstante Folge (1)n∈N hat offensichtlich 1 als Grenzwert. Die Folge der Stammbrüche
(1/n)n∈N hat 0 als Grenzwert. Dies verifiziert man etwa so:
Gegeben ε > 0. Dann wählen wir N ∈ N mit N ε > 1 . Dann gilt offenbar 1/n ∈
(−ε, ε) für alle n ≥ N , da 0 < 1/n ≤ 1/N < ε für n ≥ N .
Die Eigenschaft, dass es zu jedem ε > 0 ein N ∈ N gibt mit N ε > 1 ist keineswegs so selbstverständlich, wenn wir nur unser bisheriges Wissen über die reelle Zahlengerade voraussetzen,
besagt sie doch im wesentlichen, dass es beliebig große natürliche Zahlen N gibt; aus der Tatsache, dass N nicht beschränkt ist, d.h. dass es zu jedem m ∈ N stets ein m′ ∈ N gibt mit m′ > m,
folgt dies.
Bei der Folge
(
greift der Trick“
”
n2 − 3n
)n∈N
2n + 7n17 − 1
(n2 − 3n)n−17
n−15 − 3n−16
n2 − 3n
=
=
,
2n + 7n17 − 1
(2n + 7n17 − 1)n−17
2n−16 + 7 − n−17
der auf den Grenzwert 0 schließen lässt. Solche Tricks bedürfen einer Rechfertigung. Mit der
Definition der Konvergenz sieht man sehr schnell die folgenden Regeln, die diese Tricks rechtfertigen, ein:
Rechenregeln 1.16 Seien (xn )n∈N , (yn )n∈N reelle Zahlenfolgen. Dann gilt:
Aus lim xn = x folgt {xn |n ∈ N} ist beschränkt.
(1.8)
Aus lim xn = x, lim yn = y folgt lim(xn + yn ) = x + y .
(1.9)
n
n
n
n
Aus lim xn = x, lim yn = y folgt lim(xn · yn ) = x · y .
(1.10)
Aus lim xn = x und x 6= 0 folgt lim 1/xn = 1/x .
(1.11)
Aus lim xn = x und xn ≥ 0 für alle n ∈ N folgt x ≥ 0 .
(1.12)
n
n
n
n
n
n
Die Regel (1.8) ist einfach einzusehen: höchstens endlich viele xn liegen außerhalb der beschränkten Menge (x − 1, x + 1), eine endliche Menge ist aber immer beschränkt.
Den Beweisansatz der Regel (1.10) liest man an folgender Argumentationskette mit Hilfe von
(1.8) ab:
|xn yn − xy| ≤ |xn yn − xyn | + |xyn − xn yn | ≤ |yn ||xn − x| + |y||yn − y| .
15
Bei der Regel für den Quotienten von Folgen hat man implizit zu lernen, dass es bei Folgen
bezöglich Konvergenz und Grenzwert nicht auf endlich viele Folgenglieder ankommt. Dies trifft
auch bei (1.12) zu.
Nun wollen wir sicherstellen, dass hinreichend viele“ Folgen auch konvergieren. Das Axiom,
”
das dies u.a. sichert, ist das der Vollständigkeit:
Zu jeder nichtleeren Teilmenge A von R, die nach oben beschränkt ist, d.h. zu der es eine
Zahl (obere Schranke) b ∈ R gibt mit a ≤ b für alle a ∈ A, gibt es eine kleinste obere
Schranke a∗ ∈ R, die so charakterisiert ist:
a ≤ a∗ für alle a ∈ A; ist u < a∗ , dann gibt es a ∈ A mit u < a .
Wir schreiben nun
a∗ = sup a = sup A
a∈A
a∗
und nennen
auch das Supremum von A .
Ist A ⊂ R derart, dass −A := {−a|a ∈ A} nach oben beschränkt ist, dann nennen wir A nach
unten beschränkt und wir bezeichnen
a∗ = inf a = inf A(= − sup −a = − sup −A)
a∈A
a∈A
als die kleinste untere Schranke oder das Infimum von A .
Eine Menge, die sowohl nach oben als auch nach unten beschränkt ist, nennt man beschränkt. Klar, zu einer beschränkten Menge M ⊂ R gibt es a, b ∈ R mit M ⊂ [a, b] oder
alternativ r ≥ 0 mit |x| ≤ r für alle x ∈ M .
Aus dem Axiom der Vollständigkeit folgt die Dedekindschen Schnitteigenschaft, die
etwas anschaulicher diese Lückenlosigkeit beleuchtet:
Sind A, B Teilmengen von R, mit u ≤ v für alle u ∈ A, v ∈ B, so gibt es ein x ∈ R
mit u ≤ x ≤ v für alle u ∈ A, v ∈ B .
Ist die Zahlenfolge (xn )n∈N monoton wachsend, d.h. gilt
xn ≤ xn+1 für alle n ∈ N ,
dann ist Konvergenz einer solchen Folge schnell geklärt, denn: ist die Menge A := {xn |n ∈ N}
nach oben beschränkt, dann müssen sich alle Folgenglieder bei a∗ := supa∈A a häufen“ und der
”
Grenzwert ist a∗ ; besitzt A keine obere Schranke, dann kann auch keine Konvergenz eintreten.
Damit haben wir eine erstes Resultat verifiziert, das man Satz bezeichnen kann:
Satz 1.17
Eine monoton wachsende und beschränkte Folge ist konvergent; Grenzwert ist das Supremum
der Folgenglieder. 6
Beweis:
Den Beweis haben wir schon angedeutet, hier ist er formal.
Sei (xn )n∈N ein monoton wachsende Folge, die beschränkt ist. Dann existiert auf Grund der
Vollständigkeit x := sup{xn |n ∈ N} . Sei ε > 0 . Da x − ε keine obere Schranke ist, denn es ist
6
Beachte: Bei einer monoton wachsenden Folge ist Beschränktheit gleichbedeutend mit Beschränktheit nach
oben.
16
ja x − ε < x, gibt es ein N ∈ N mit x − ε < xN . Da die vorgelegte Folge monoton wachsend ist,
gilt nun sicherlich x ≥ xn für alle n ∈ N und wir erhalten schließlich für n ≥ N
|xn − x| = x − xn ≤ x − xN < ε .
Wie man der alternierenden Folge ansieht, trifft eine entsprechende Aussage bei nicht monotonen Folgen im allgemeinen nicht zu.
Die Überlegung, die wir zu monoton wachsenden Folgen anwenden, können wir auf monoton
fallende Folgen, d.h. auf Folgen (xn )n∈N mit
xn ≥ xn+1 für alle n ∈ N ,
anwenden, denn (−xn )n∈N ist dann monoton wachsend.
√
·“ gesichert:
”
Zu jedem a ∈ R, a > 0, und m ∈ N gibt es genau ein x ∈ R, x > 0, mit xm = a .
Diese Zahl x heiät m–te–Wurzel – im Falle von m = 2 Quadratwurzel – aus a
√
√
und wir schreiben dafür m a und a im Falle von m = 2 .
Mit der Vollständigkeit ist auch die Rechenart
Wir geben einen konstruktiven Beweis für die Existenz der Quadratwurzel aus einer positiven
Zahl, der Beweis für die m–te Wurzel kann analog erbracht werden; siehe Bemerkung 1.18. Die
Eindeutigkeit beweisen wir in Bemerkung 1.19.
Algorithmus 1 Heronverfahren
EIN Reelle Zahl a > 0 . Startwert x0 mit x20 > a .
Schritt 0 n := 1 .
Schritt 1 y := 21 (xn + xan ) .
Schritt 2 Ist y 2 = a, STOPP.
Schritt 3 n := n + 1 und gehe zu Schritt 1.
AUS STOPP mit einer Lösung (xn )n∈N oder einer monoton fallenden Folge (xn )n∈N .
Bemerkung 1.18 Das Verfahren, das im obigen Algorithmus angeführt wurde, ist nach Heron7
benannt. Es kann sofort auf die m-te Wurzel verallgemeinert werden. Für m = 2 stellt xn+1
in der Rekursionsformel gerade den Mittelwert von xn und xan dar. Die Vorgehensweise ist
ein Spezialfall des Newton–Verfahrens, das bei der Nullstellensuche als effizientes Verfahren
bekannt ist; siehe Tabelle 1.4 zu m = 2 . (Man sieht dort, dass sich die Eigenschaft x2n > a
selbst bei Nichtvorliegen für die Startnäherung von alleine einstellt.) Die fett ausgedruckten
Ziffern sollen die gültigen Stellen zeigen; die Anzahl verdoppelt sich dank der quadratischen
”
Konvergenzgeschwindigkeit“ bei jedem Iterationsschritt.
7
Heron von Alexandria, um 50 n. Chr.
17
Findet das Heron-Verfahren ein y mit y 2 = a,
dann haben wir keine weiteren Betrachtungen
anzustellen. Anderenfalls zeigen wir, dass der
Algorithmus eine Folge (xn )n∈N erzeugt, die
folgende Eigenschaften besitzt:
x2n > a für alle n ∈ N .
0 < xn für alle n ∈ N .
n
xn
0
1
2
3
4
1
1.5
1.41666. . .
1.41421568627
1.41421356237
2
xn
2
1.333. . .
1.41176470588
1.41421143847
1.414211356237
√
Abbildung 1.4: Zur Berechnung von 2
(1.13)
(1.14)
xn+1 ≤ xn ≤ x0 für alle n ∈ N (. 1.15)
Zu den Beweisen:
Aus xn xn+1 = 12 (x2n + a) > 0 folgt
1
1
x2n (x2n+1 − a) = x2n (x2n + a)2 − x2n a = (x2n − a)2 ,
4
4
was sofort induktiv auf (1.13) führt. Damit ist auch (1.14) schon klar. Aus
1 1
1 1 a
) ≤ xn ( + ) = xn
xn+1 = xn ( +
2 2 x2n
2 2
liest man (1.15) ab. Da die Folge (xn )n∈N nun als monoton fallend und nach unten beschränkt
erkannt ist, konvergiert diese Folge gegen ein x mit x2 ≥ a . Es folgt nun x 6= 0 und mit den
a , also x2 = a .
Rechenregeln 2x = x + x
Bemerkung 1.19 Die m–te Wurzel aus a > 0 ist eindeutig bestimmt, da wir
haben. Dies sieht man für die Quadratwurzel so:
√
a > 0 verlangt
m
Aus x2 = a = y 2 , x, y > 0, folgt 0 = x2 − y 2 = (x − y)(x + y), x + y > 0, und daher x = y .
Dabei haben wir die Nullteilerfreiheit in R verwendet: Aus ab = 0 folgt stets a = 0 oder b = 0 .
Dies ist durch Fallunterscheidung leicht einzusehen, wenn man noch auf die Abgeschlossenheit
der positiven Zahlen gegenüber der Multiplikation zurückgreift.
√
Zurück zur Existenz von 2 . Das so genannte Bisektionsverfahren, das sich aus dem
folgenden Algorithmus von selbst erklärt, kann ebenfalls zur Näherung der Quadratwurzel eingesetzt werden.
Algorithmus 2 Bisektionsverfahren
EIN Reelle Zahl a > 0 . Startwerte u1 , v1 mit
√
a ∈ (u1 , v1 ) .
Schritt 0 n := 1 .
Schritt 1 y := 21 (un + vn ) .
Schritt 2 Ist y 2 = a, STOPP.
Schritt 3 Ist y 2 − a > 0, setze un+1 := un , vn+1 := y, anderenfalls setze un+1 := y, vn+1 := vn .
AUS STOPP mit einer Lösung oder einer monoton wachsenden Folge (un )n∈N und einer monoton fallenden Folge (vn )n∈N .
18
Hat man mit dem Bisektionsverfahren keine Lösung
in endlich vielen Schritten gefunden, dann erhält man
Folgen (un )n∈N , (vn )n∈N . Sie haben offenbar die Eigenschaft
s 2n
1
1
|vn+1 − un+1 | ≤ |vn − un | ≤ ( )n |v1 − u1 |, n ∈ N .
2
2
(1.16)
Da beide Folgen (un )n∈N , (vn )n∈N auch monoton sind,
sind sie konvergent und wegen (1.16) können sie nur
denselben Grenzwert x besitzen. Da einerseits stets
u2n > a und vn2 < a gilt, muss für den Grenzwert x2 = a
gelten.
z
y
Abbildung 1.5: Zur Berechnung von π
Ein Kreis, genauer die Kreislinie, ist die Punktmenge
{(x, y) ∈ R2 |x2 + y 2 = 1} .
Nach Archimedes8 ist 2π der Umfang des Einheitskreises oder π das Verhältnis von Durchmesser
und Umfang eines Kreises. Von Archimedes stammt auch die Idee für ein Berechnungsverfahren:
Approximiere den Einheitskreis durch regelmäßige n–Ecke und betrachte deren Umfang als
Approximation für 2π. Welche Approximation erhält man?
Sei sn die Seitenlänge im regelmäßigen n–Eck und un sein Umfang. Dann sollten also
un bzw. nsn
√
√
gute Approximationen für 2π sein. Klar: s4 = 2, s6 = 1 und daher 2π ≈ 4 2 bzw. 2π ≈ 6 .
Wir haben (siehe Skizze 1.5)
z = 1 − y , y2 +
sn 2
sn 2
= 1 , z2 +
= s22n .
4
4
Also
s22n
sn 2
= (1 − y) +
=
4
2
oder
s22n =
und
1−
r
sn 2
1−
4
!2
+
p
sn 2
= 2 − 4 − s2n , n ∈ N ,
2
s2
4 − (4 − s2n )
p
pn
=
, n ∈ N,
2 + 4 − s2n
2 + 4 − s2n
u2n = 2ns2n = 2n q
2+
sn
p
4
− s2n
=s
un
, n ∈ N.
r
2
u
1 1
1 − n2
+
2 2
4n
(1.17)
(1.18)
(1.19)
Es ist sicher sn ≤ 2s2n , also un = nsn ≤ 2ns2n = u2n . Ferner beweist man induktiv sofort
u2n ≤ 8 für n ≥ 2 (interpretiere diese Schranke!). Damit ist die Konvergenz der Folge (u2n )n∈N
aus Monotoniegränden sichergestellt; sei u := limn u2n . Über diesen Grenzwert wird nun die
Kreiszahl π definiert: π := u
2.
2
(sn )n∈N konvergiert gegen Null wegen
p (1.19). Man beachte, dass sn sehr schnell klein werden
sollte und daher im Ausdruck 2 − 4 − s2n zwei annähernd gleich große Zahlen subtrahiert
werden. Dies ist beim numerischen Rechnen immer zu vermeiden, da in solchen Situationen
8
Archimedes, 267 - 212 n. Chr., ein erster Ingenieur, Mathematiker, Physiker
19
Rundungsfehler im allgemeinen das Ergebnis stark verfälschen. Wir sollten also die Darstellung
(1.18) für die sukzessive Berechnung von s2n , u2n , n ∈ N, verwenden.
Als Approximation an für die Fläche des Einheitskreises ergibt sich aus den obigen Überlegungen
r
r
s2n
u2
1
1
an = nsn 1 −
= un 1 − n2 , n ∈ N .
(1.20)
2
4
2
4n
Also erhalten wir π = limn a2n .
Halten wir fest (nun skaliert): Fläche des Kreises mit Radius r: πr 2 .
Umfang des Kreises mit Radius r: 2πr .
1.5
Der Vektorraum Rn
Oben haben wir das kartesische Produkt Rn eingeführt. Die Elemente dieser Menge sind die
n–Tupel x = (x1 , . . . , xn ) ; xi heis̈n Eintröge, Komponenten (und später auch Koordinaten).
Ein Quader Q in Rn sieht so aus:
Q = I1 × · · · × In mit Ii = [ai , bi ], i = 1, . . . , n .
Ein oberer Halbraum in Rn etwa ist gegeben durch
R+ × Rn−1 , R+ := [0, ∞) .
Aus den Rechenarten Addition, Multiplikation“ in R können wir Rechenarten in Rn ableiten,
”
indem wir jeweils komponentenweise rechnen. Diese Rechenarten werden wir im nächsten Kapitel
dann als wichtiges Instrument zum geometrischen Verständnis in der Ebene und im Raum
verwenden.
Man möchte meinen, die Betrachtung von Rn für n ≥ 4 sei ziemlich sinnlos, da wir damit
über unsere Anschauung hinausgehen. Dies trifft aber nicht zu. Der Fall n = 4 wird uns später
als passender Raum für das Studium von Ereignissen, die der Relativität unterliegen, begegnen;
die 4. Dimension“ ist der Zeit vorbehalten. Der Fall n sehr groß“ begegnet uns, wenn wir in
”
”
R3 die Bewegung von ganz vielen Teilchen, etwa m, betrachten. Dann sind 3m Koordinaten für
die Position der Teilchen in R3 vorzusehen; nimmt man auch die Geschwindigkeiten der Teilchen
noch hinzu, dann wird man also zu Betrachtungen in R6m geführt.
Wir haben eine Addition ⊕ in V := Rn , die zwei Elemente x := (x1 , . . . , xn ), y :=
(y1 , . . . , yn ) ∈ Rn folgendermaßen verknüpft:
x ⊕ y := (x1 , . . . , xn ) ⊕ (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ) .
Wir haben eine skalare Multiplikation ⊙ in V := Rn , die ein Element x := (x1 , . . . , xn ) ∈ Rn
und eine reelle Zahl a so verknüpft:
a ⊙ x := a ⊙ (x1 , . . . , xn ) := (ax1 , . . . , axn ) .
Die Symbole ⊕, ⊙ haben wir hier nur kurzzeitig eingesetzt, um die unterschiedlichen Operationen
in V = Rn bzw. R deutlich zu machen. Wir verzichten nun sofort wieder darauf und schreiben
für ⊕ wieder + und für ⊙ wieder · und lassen auch · meist wieder weg.
Die Elemente in Rn nennen wir Vektoren; im nächsten Abschnitt liefern wir die Rechtfertigung dafür. Mit θ schreiben wir die vektorielle Null in Rn , d.h. θ := (0, . . . , 0) . Zu x =
(x1 , . . . , xn ) ∈ Rn sei der negative Vektor −x dazu durch (−1) · x = (−x1 , . . . , −xn ) erklärt.
20
Nun fassen wir Rechenregeln zusammen, die sich unmittelbar aus den Rechenregeln für die
reellen Zahlen ergeben.
Rechenregeln 1.20 Sei V := Rn . Es gelten die folgenden Aussagen:
(x + y) + z = x + (y + z) für alle x, y, z ∈ V .
x + θ = θ + x = x für alle x ∈ V .
x + (−x) = θ für alle x ∈ V .
x + y = y + x für alle x, y ∈ V .
(1.21)
(1.22)
(1.23)
(1.24)
a(x + y) = ax + ay für alle a ∈ R, x, y ∈ V .
(1.25)
a(bx) = (ab)x für alle a, b ∈ R, x ∈ V .
(1.27)
(a + b)x = ax + bx für alle a ∈ R, x ∈ V .
1x = x für alle x ∈ V .
(1.26)
(1.28)
Wir haben die Rechenregeln in der Ausführlichkeit angeführt, wie sie später als definierende
Eigenschaften eines Vektorraums Verwendung finden können. Der Zahlraum R spielt die Rolle
des Skalarkörpers (siehe später). Im Vorgriff darauf bezeichnen wir V := Rn zusammen mit den
Skalaren R und der Addition und der skalaren Multiplikation einen Vektorraum.
Spezielle Elemente in Rn sind die so genannten Einheitsvektoren
(
1 , falls i = j
1
n
i
, 1 ≤ i, j ≤ n, ist.
e , . . . , e , wobei ej := δij :=
0 , falls i 6= j
1.6
Affiner Raum und Pfeile
Bevor wir über Pfeile und Vektoren reden, wollen wir über Räume unserer Anschauung reden.
Die Bezeichnung Raum“ wird uns noch häufig begegnen: Vektorraum, topologischer Raum,
”
Hilbertraum, Raum der Distributionen, . . . . Grob gesprochen sprechen wir dann von einem
Raum (mit zusätzlicher genauerer Bezeichnung), wenn wir eine Menge von Objekten vorfinden,
die als Gesamtheit eine zusätzliche Struktur trögt. Nun wäre wieder das Wort Struktur“ zu
”
erklärenr. Diese wird dann deutlich, wenn wir klären wollen, wann Objekte als gleich anzusehen
sind, auch wenn sie in unterschiedlichem Kleide“ daherkommen. Dabei stoßen wir auf den
”
Begriff der Strukturgleichheit“, der durch Isomorphismen beschrieben wird.
”
Im letzten Abschnitt haben wir mit dem Vektorraum V := Rn zusammen mit der Addition und der skalaren Multiplikation ein konkretes Beispiel eines Vektorraums vorgestellt. Wir
werden sehen, dass dieser Vektorraum auch in einem anderen Kleide“ daherkommen kann. Die
”
Strukturgleichheit ergibt sich dann, wenn wir die linearen Abbildungen hinzufögen.
Drei verschiedene Fülle haben wir im Auge: den so einfachen Raum, der durch die Zahlengerade bereitgestellt wird, den Anschauungsraum in dem wir unsere Umwelt wahrnehmen und die
Ebene, die dazwischen liegt und die wir – etwas vereinfacht – in unserer Erdoberfläche wahrnehmen. Wir nehmen diese Räume als Punktmengen wahr, denen wir mit den reellen Zahlen
Leben“ einhauchen wollen. (Es reicht ja nicht, abstrakt über Punkte und daraus abgeleitete
”
Objekte zu reden, wie dies in manchen Einführungen geschieht, ohne irgendeine Beschreibungs–
/Konkretisierungsanstrengung zu machen.)
Es ist offenbar, dass wir für die obigen Situationen folgende Vorgaben vorfinden: Für die
Zahlengerade reicht es aus, eine reelle Zahl anzugeben, um den Punkt darauf zu identifizieren,
21
den wir meinen, für die Ebene werden wir zwei reelle Zahlen benätigen, für den Anschaungsraum
wohl drei.
Die wichtigsten Figuren in der Ebene oder im Anschauungsraum sind die Geraden. Wir stoßen
auf sie bei ganz alltöglichen Erfahrungen: das, was wir auf dem Zeichenblatt mit einem Lineal
hinzeichnen können, ist Teil einer Geraden, sie entstehen beim Papierfalten, wir entdecken sie als
Weg, den ein Lichtstrahl nimmt, wir neigen dazu Kanten von Bauwerken und Möbeln gerade“
”
zu konstruieren.
Wir setzen:
AR1 := {[x]|x ∈ R} , AR2 := {[x, y]|x, y ∈ R} , . . . , ARn := {[x1 , . . . , xn ]|x1 , . . . , xn ∈ R} .
Die Schreibweise [x, y], [x1 , . . . , xn ] ist wie (x, y), (x1 , . . . , xn ) zu verstehen, soll aber die Elemente
in ARi von Ri abheben (i = 1, 2, . . . , n). Wir beschränken uns nun darauf, den Fall P := AR2
weiterzubehandeln, denn AR1 ist ziemlich uninteressant, AR3 birgt keine extra Schwierigkeiten.
Eine Gerade g in P wollen wir in Parameterdarstellung angeben. Zu g = ga,b,c gehören
drei Parameter a, b, c mit (a, b) 6= (0, 0) in folgendem Sinne9 :
ga,b,c = {[x, y] ∈ P|ax + by = c} .
Wir setzen
G := {g|g Gerade} .
und sagen, dass der Punkt P mit Darstellung [x, y] auf ga,b,c liegt, wenn [x, y] ∈ ga,b,c gilt; bei
liegt auf“ spricht man von einer Inzidenzrelation. Punkte, die auf einer Geraden liegen, nennt
”
man kollinear.
Bemerkung 1.21 Statt AR2 könnten wir auch AQ2 , d.h. die Menge der Punkte [x, y] mit
x, y ∈ Q, betrachten und dann entsprechend nur Geraden mit Parameter a, b ∈ Q zulassen. Die
folgenden Überlegungen ließen sich dann völlig analog anstellen.
Das Mengenpaar (P, G), heiät affine Ebene, gebaut mit den reellen Zahlen. Es ist wesentlich, dass
wir nicht von R2 sprechen, denn wir wollen Abstand
gewinnen von der Vorstellung, die wir mit der Ebe”
ne“ R2 verbinden: in R2 stellen wir uns meist ein
Koordinatenkreuz vor, das dann unsere Punkte bestimmt. Doch diese Festlegung eines Koordinatensystems (Bezugssystems) ist nicht von physikalischer
Bedeutung: keine Nebelkammer, in der wir ebene
”
Phänomene“ betrachten, hat originär ein Koordinatenkreuz; wir beobachten die Spur (Bahn) eines Experiments als Punktmenge. Erst, wenn wir sie aus”
messen“ wollen, sind wir gezwungen“, ein Bezugs”
system ins Spiel zu bringen.
Q’
P’
Q
S
P
R
S’
R’
Einer Geraden g = ga,b,c ist eine GeradengleiAbbildung 1.6: Verschiebungsvektoren
chung zugeordnet:
ax + by = c
(1.29)
9
Man mache sich klar, dass (a, b) 6= (0, 0) nicht bedeutet, dass sowohl a als auch b von Null verschieden sein
müssen.
22
Die Menge der Punkte, die auf dieser Geraden liegen, nennen wir Lösungsmenge von (1.29).
Offenbar liegt [x0 + tb, y 0 − ta] auf ga,b,c für jedes t ∈ R, falls [x0 , y 0 ] auf ga,b,c liegt.
Nun wollen wir die Lösungsmengen von zwei Geradengleichungen vergleichen. Betrachte also
die Geraden ga,b,c , ga′ ,b′ ,c′ . Man rechnet leicht nach, dass folgende Aussage zutrifft:
Die Geraden ga,b,c , ga′ ,b′ ,c′ haben entweder keine, genau eine oder alle Lösungen gemeinsam.
Dies entspricht den Beobachtungen, dass zwei Geraden parallel“ sein, sich schneiden oder iden”
tisch sein können. Dazu die folgende Argumentation:
Es liege [x0 , y 0 ] auf ga,b,c und ga′ ,b′ ,c′ . Dann gilt
a′ ax0 + a′ by 0 = a′ c , aa′ x0 + ab′ y 0 = ac′ ,
also
(a′ b − ab′ )y 0 = a′ c − ac′ .
Ist a′ b − ab′ 6= 0, dann errechnet sich y 0 und dann x0 auf eindeutige Weise daraus, denn eine der
beiden Zahlen a, a′ verschwindet nicht; es liegt ein Schnittpunkt“ vor. Ist a′ b − ab′ = 0, dann
”
muss a′ c − ac′ = 0 gelten und wir können o.E. annehmen, dass b′ 6= 0 gilt, denn es ist ja a′ 6= 0
oder b′ 6= 0 . Dann ist
−1
−1
a = (b′ b)a′ , b = (b′ b)b′
(1.30)
und jedes [x, y], das a′ x + b′ y = c löst, löst wegen (1.30) auch ax + by = c ; es liegt die Identität
der beiden Geraden vor.
Bemerkung 1.22 P stellt ein Modell“ einer affinen Ebene dar, denn in (P, G) gilt:
”
• Zu je zwei verschiedenen Punkten von P gibt es genau eine Gerade, auf denen diese Punkte
liegen, zwei Punkte sind also stets kollinear.
• Zu jedem Punkt P aus P und jeder Geraden g aus G gibt es genau eine weitere Gerade h ∈
G, die durch P geht und die entweder identisch g ist oder mit g keinen Punkt gemeinsam
hat; im letzteren Fall nennt man h zu g parallel.
• Es gibt drei Punkte in P, die nicht auf einer Geraden liegen.
Kommen wir nun zu Pfeilen und Vektoren. Wir tun dies wieder in P. Ein Pfeil in P ist
−−→
assoziiert mit zwei Punkten P, Q ∈ P : P Q ist eine Verbindungsstrecke“ mit Ende P und
”
Spitze in Q ; beachte, dass diese Verbindungsstrecke real ist, denn wir haben ja die Gerade, auf
der P und Q liegen. Damit können wir den affinen Raum P in sich abbilden in folgendem Sinne:
−−→
wir heften an jeden Punkt R in P den Pfeil P Q an und kommen so zu einem Punkt S ∈ P
als Spitze des angehefteten Pfeils. Wir erhalten so eine starre“ Verschiebung τP,Q von P und
”
wir können auch jeden Punkt S ′ in P durch Verschiebung erreichen; siehe Abbildung 1.6. Ferner
−−→
kann diese Verschiebung rückgängig gemacht werden mit dem Pfeil QP ; später sprechen wir
davon, dass τP,Q , τQP zueinander inverse Abbildungen sind.
−−→
Diese Verschiebung des affinen Raumes P mit einem Pfeil P Q ändert sich nicht, wenn der Pfeil
−−→
−−→
−−→ −−→
P Q durch einen Pfeil P ′ Q′ ersetzt wird, so dass – in P interpretiert – P Q, P ′ Q′ gegenüberliegende
Seiten eines Parallelogramms sind; siehe Abbildung 1.6. In diesem Sinne hat dann ein Pfeil
anschaulich eine Richtung und eine Länge (Seitenlänge im Parallelogramm) aber keine Position.
Die physikalische Anwendung für die Pfeilnotation ist meist verbunden mit der Diskussion von
Krafteinwirkung“. Beispiele für Kräfte sind die Federkraft, Gravitationskraft, . . . .
”
23
Beispiel 1.23 An einer Federwaage mögen zwei Kräfte F1 , F2 angreifen, realisiert durch die
−→ −→
Pfeile AP , AQ; siehe Abbildung 1.7. An der Skala der Federwaage können wir die resultierende
−→ −→
Kraft F1 + F2“ ablesen, die durch Aneinanderhängen der Pfeile AP , AQ in Form des Pfeiles
−→ ”
AR entsteht. Im Vektorraum R2 addieren wir die Vektoren u, v, wobei A dann θ entspricht; man
erstellt ein Kräfteparallelogramm.
−−
→
Wir wollen uns nun von der Pfeilnotation wieder trennen. Dazu ordnen wir einem Pfeil P Q
den Vektor v := (v1 , v2 ) ∈ R2 zu, wenn folgender Zusammenhang gültig ist:
τP,Q verschiebt jedes [x1 , x2 ] in [x1 + v1 , x2 + v2 ] .
Dem Aneinanderhängen von Pfeilen entspricht offenbar die Addition im Raum R2 ,
P/u
dem Strecken“ von Pfeilen, indem man auf
”
der Geraden durch P, Q ein Stcük“ über Q
Federwaage
”
R / u+v
hinausgeht, wobei beide Richtungen zugelasA
sen sind, entspricht die skalare Multiplikation. (Mit dem Strahlensatz kann man eine solQ/v
che Streckung (im R2 ) sehr einfach herstellen.)
Abbildung 1.7: Kräfteparallelogramm
Damit ist nun auch die Bezeichnung Vektor“
”
2
für die Elemente in R naheliegend: er vermit−−→
telt sich gerade durch den Zusammenhang eines Vektors v = (v1 , v2 ) ∈ R2 mit dem Pfeil OQ,
−−→
wobei O, Q ∈ P durch [0, 0] bzw. [v1 , v2 ] gegeben sind; der Pfeil OQ ist der so genannte Ortsvektor zu Q . In diesem Sinne können wir nun von R2 als einem Vektor–Raum sprechen.
In der Physik ist der Unterschied Skalar – Vektor“ ganz bedeutend. Eine Gesamtheit von
”
Skalaren wird ein skalares Feld, eine Gesamtheit von Vektoren ein Vektorfeld genannt. Also:
Skalares Feld: Jedem x ∈ D ⊂ R3 wird ein Skalar U (x) ∈ R zugeordnet.
Vektorielles Feld: Jedem x ∈ D ⊂ R3 wird ein Vektor V (x) ∈ R3 zugeordnet.
D ist der Definitionsbereich, wo die Felder erklärt sind.
Beispiele für skalare Felder sind:
• Temperaturverteilung im Raum.
• Druckwert in der Atmosphäre.
• Potential einer elektrischen Punktladung.
• Gravitationspotential.
Beispiele für vektorielle Felder sind:
• Gravitationsfeld eines Massenpunktes.
• Geschwindigkeitsverteilung in einer strömenden Flüssigkeit.
• Elektrisches Feld eines Kondensators.
• Magnetfeld der Erde.
Wenn wir in der Analysis mehrerer Veränderlicher weiter fortgeschritten sind, können wir dazu
etwas mehr sagen.
24
Bemerkung 1.24 Zeit spielt in der Physik eine herausgehobene Rolle. Wir bringen sie ins Spiel
als Maß für die Dauer einer Bewegung, eines Prozesses, . . . . Das Newtonsche Konzept der Zeit ist
das einer absoluten Zeit und wir hätten sie mit AR1 zu identifizieren. Wenn wir zum Vektorraum
V := R1 übergehen, haben wir damit insbesondere die Addition in R zur Verfögung, die uns in
die Lage versetzt, unterschiedliche Zeitintervalle zu vergleichen.
Seien P, Q zwei verschiedene Punkte in P gegeben duch
P := [x1 , y 1 ] , Q := [x2 , y 2 ] .
−−→
Die Darstellung einer Geraden GP,Q , durch P, Q mit dem Richtungsvektor P Q knüpft an an
−−→
der Pfeilvorstellung: um vom Punkt P zum Punkt Q zu kommen, haben wir den Pfeil P Q an
P anzuheften. In Vektornotation bedeutet dies:
GP,Q = {[x1 , y1 ]+̃t(x2 − x1 , y2 − y1 )|t ∈ R} ,
wobei +̃ andeutet, dass wir Ungleiches addieren. Da wir uns von der Pfeilnotation schon getrennt
haben, schreiben wir einfach
GP,Q = {(x1 , y1 ) + t(x2 − x1 , y2 − y1 )|t ∈ R} .
Diese Beschreibung ist keineswegs eindeutig, wie uns eine einfache Skizze schon lehrt. Nimmt
man einen Punkt R ∈ GP,Q , so kann man etwa Q gegen R austauschen, denn es gilt dann
GP,Q = GP,R .
(1.31)
Was heiät es, dies zu verifizieren? Wir haben nach Definition 1.7 zu zeigen, dass jeder Punkt in
GP,Q in GP,R liegt und umgekehrt.
Sei R := [u, v] ∈ GP,Q , also u = x1 + t0 (x2 − x1 ), v = y 1 + t0 (y 2 − y 1 ) mit einem t0 ∈ R . Ist
t0 = 1, dann ist Q = R und nichts ist zu beweisen. Sei also nun t0 6= 1 . Wir erhalten dann
x1 = (u − t0 x2 )(1 − t0 )−1 , y 1 = (v − t0 y 2 )(1 − t0 )−1 .
Sei [x, y] mit x = x1 + t(x2 − x1 ), y = y 1 + t(y 2 − y 1 ) in GP,Q . Dann rechnet man nach:
x =u+
t0 − t
t0 − t
(u − x2 ) , y = v +
(v − y 2 ) ,
1 − t0
1 − t0
was zeigt, dass [x, y] in GP,R liegt. Also haben wir nun GP,Q ⊂ GP,R bewiesen.
Die Umkehrung beweist man analog.
Die Festlegung eines Koordinatensystems in P bedeutet:
g2
Man wählt einen Punkt O
(Ursprung) und zwei verschiedene Geraden g1 und
g2 , die sich in O schneiden.
Dies ist möglich, wenn wie
oben bei P notiert, es drei
Punkte gibt, die nicht auf einer Geraden liegen. Zu jedem Punkt P der affinen
Ebene ziehe man nun die
Parallelen durch P zu g1 und
t OR
g
II
I
R
P2
E
O
S
III
P
P
g1
1
IV
Abbildung 1.8: Koordinatensystem
25
g2 . Ihre Schnittpunkte P1 mit g1 und P2 mit g2 kann man nun als Koordinatenpaar
für den Punkt P verwenden, wenn man die Punkte auf g1 bzw. g2 in umkehrbar eindeutiger Weise den reellen Zahlen zuordnet. Man hat dazu lediglich noch auf jeder
Gerade eine Einheit festzulegen, welche der Einheit 1 in R entspricht.
Die beiden Geraden heißen Koordinatenachsen.
Ein orthonormales Koordinatenssystem in der Ebene entsteht aus zwei senkrechten Geraden; ortho“ steht für senkrecht (aufrecht)“ , normal“ bedeutet gleiche Maßeinheit auf beiden
”
”
”
Geraden. Im nächsten Kapitel klärenr wir die Begriffe senkrecht, Länge einer Strecke“. Hier
”
reicht es aus, zu wissen, dass man ausgehend von einer Geraden durch Füllen eines Lotes von
einem Punkt P der nicht auf der Geraden liegt, sofort (mit Zirkel und Lineal) eine zweite Gerade
konstruieren kann, die zur Ausgangsgeraden senkrecht steht. Man spricht bei einer solchen Wahl
von einem kartesischen Koordinatensystem. Die Ermittelung der Koordinaten eines Punktes P ∈ P ist hier besonders einfach. Bei einem orthonormalen Koordinatensystem bezeichnet
man die horizontale Achse als Abszisse, die vertikale als Ordinate; siehe Abbildung 1.8. Die
Koordinatenachsen zerlegen die Ebene P in vier Teile, so genannte Quadranten, die im mathematisch positiven Drehsinn, d.h. entgegegesetzt dem Uhrzeigersinn, mit I, II, III, IV bezeichnet
werden.
Im Anschauungsraum AR3 entsteht ein orthonormales Koordinatensystem aus drei sich in
einem Punkt senkrecht schneidenden Achsen, auf denen jeweils Einheitsstrecken gleicher Länge
abgetragen sind.
Man unterscheidet im Raum in Abhängigkeit von der Reihenfolge, in der die Achsen nummeriert werden, zwischen Links– bzw. Rechtskoordinatensystemen. Wir wollen die erste
Achse mit x, die zweite mit y und die dritte mit z beschriften. Kann man die ersten drei Finger
der rechten Hand gestreckt so ausrichten, dass der Daumen in die Richtung der x–Achse, der
Zeigefinger in Richtung der y–Achse und der Mittelfinger in Richtung der z–Achse deutet, so
liegt ein Rechtssystem vor, anderenfalls ein Linkssystem, da man dann denselben Versuch mit
der linken Hand erfolgreich durchführen kann.
Hier haben wir nur geradlinige“ Koordinatensysteme skizziert. Später wird es – nicht zuletzt
”
auf Grund physikalischer Betrachtungen – nätig sein, auch krummlinige“ Koordinatensysteme
”
zu studieren. Lokal, d.h. im Kleinen, werden sie wieder durch geradlinige Koordinatensysteme
angenähert, im Großen, d.h. global, sind sie aber etwas ganz anderes. Bei Betrachtungen auf
der Erdkugel können wir dies erkennen: Auf einem kleinen Kartenausschnitt merken wir nichts
von der Krummlinigkeit“ der Breiten– und Längenkreise, die die Koordinaten auf der Erdkugel
”
vorgeben.
1.7
Anhang: Elementare Dreiecksgeometrie
Die Dreiecksgeometrie ist die Beschäftigung mit Punkten und Geraden in der Ebene. Man bewegt
sich dabei in einem Modell für die euklidische Geometrie, wie sie schon von Euklid10 begrändet
wurde.
In der Begrändung der abstrakten Geometrie sind Punkte, Geraden und Abstand Grundbegriffe des Axiomensystems. Die Axiome sind zusammengefasst in 5 Gruppen:
I Inzidenzaxiome
II Abstandsaxiome
III Anordnungsaxiome
IV Bewegungsaxiom
10
Euklid, 365 – 300 v. Chr.
26
V Parallelenaxiom
Die Axiome I – IV begränden die so genannte absolute Geometrie. Unter Einbeziehung des
Parallelenaxioms in unterschiedlichen Varianten entstehen dann euklidische und nichteuklidische Geometrien.
Die Gruppe der Inzidenzaxiome11 beschäftigt
sich mit der elementarsten geometrischen Relation,
C
nämlich mit der Zugehörigkeit von Punkten zu Geraden. Hinter der Gruppe der Abstandsaxiome
γ
verbergen sich Eigenschaften, die wir aus Abschnitt
b
a = (BC)
1.6 schon in einer konkreten Situation kennen. Die
Gruppe der Anordnungsaxiome dient dazu, Beα
β
griffe wie Strahl, Strecke und Winkel einzuführen.
A
c
Das Bewegungsaxiom wird benötigt, um KongruB
enzgeometrie betreiben zu können. Die Reihenfolge
der Axiomengruppe ist nicht beliebig, da sie aufAbbildung 1.9: Allgemeines Dreieck
einander aufbauen. Zur Illustration führen wir die
Gruppe der Inzidenzaxiome an:
I. Inzidenzaxiome
I/1 Jede Gerade ist eine Punktmenge.
I/2 Zu zwei beliebigen, voneinander verschiedenen Punkten gibt es genau eine Gerade,
welche diese beiden Punkte enthält.
I/3 Jede Gerade enthält mindestens einen Punkt.
I/4 Es existieren (mindestens) drei Punkte, die nicht einer Geraden angehören.
Verlassen wir nun den abstrakten Rahmen – wir kommen am Ende des Abschnitts wieder
darauf zurück – und skizzieren die euklidische Geometrie in der Ebene derart, dass wir uns
mit den mit Zirkel und Lineal konstruierbaren Figuren zuwenden. Dabei ist das Lineal ein
maßstabloses Lineal und der Zirkel ein einfacher Stechzirkel.
Sei P die Menge aller Punkte, G die Menge aller Geraden der Ebene. Jede Gerade ist eine
Menge von Punkten. Wir sagen: P liegt auf der Geraden g ∈ G, wenn P ∈ g gilt. Wir sagen:
P ist Schnittpunkt der Geraden g und h, wenn P auf g und h liegt. Eine Menge von Punkten
heißt kollinear, falls es eine Gerade gibt, zu der alle diese Punkte gehören. Den Abstand von
Punkten P, Q bezeichnen wir mit |P Q|.
Seien A, B, C drei nichtkollineare Punkte. Mit dem Lineal zeichnen wir die Geraden durch die
Punkte A, B, A, C und B, C. Die offenen Strecken (AB) bzw. (BC) bzw. (AC) heißen offene
Seiten, die Strecken AB, BC, AC Seiten und die Punkte A, B, C Eckpunkte des Dreiecks
ABC. Im Dreieck ABC gibt es die Winkel
α := ∢ (BAC) , β := ∢ (ABC) , γ := ∢ (BCA) .
Solche Dreiecke können wir unterschiedlich hinlegen und es stellt sich die Frage, wie man dann
Dreiecke wirklich unterscheidet. Das unterschiedliche Hinlegen beschreibt man mit Bewegungen.
Eine Bewegung ist eine surjektive Abbildung f : P → P, die abstandserhaltend ist, d.h. für die
|f (A) f (B)| = |AB|
11
incidere (lat.)= hineinfallen
27
für alle A, B ∈ P
gilt; surjektiv“ erklären wir später.
”
Seien M1 , M2 ⊂ P. M1 und M2 heißen kongruent, in Zeichen M1 ≡ M2 , falls eine Bewegung
f : P −→ P existiert mit f (M1 ) = M2 .12
Kongruenzsatz SWS
Sind ABC und DEF zwei Dreiecke und gilt
AB ≡ DE, AC ≡ DF , ∢ (BAC) ≡ ∢ (EDF ),
so sind die beiden Dreiecke ABC und DEF kongruent.
Kongruenzsatz WSW
Sind ABC und DEF zwei Dreiecke und gilt
AB ≡ DE, ∢ (BAC) ≡ ∢ (EDF ), ∢ (ABC) ≡ ∢ (DEF ),
so sind die beiden Dreiecke kongruent.
Basiswinkelsatz
Ist ABC ein Dreieck mit AC = BC, so sind ∢ (BAC) und ∢ (ABC) kongruent.
Kongruenzsatz SSS
Sind ABC und DEF Dreiecke mit
AB ≡ DE , AC ≡ DF , BC ≡ EF ,
so sind die Dreiecke ABC und DEF kongruent.
Kongruenzsatz SSW
Sind ABC und DEF Dreiecke mit
AB ≡ DE, AC ≡ DF, |AB| > |AC|, ∢ (ACB) ≡ ∢ (DF E),
so sind die Dreiecke ABC, DEF kongruent.
Mit dieser Aufstellung der Kongruenzsätze können wir nun interessante Figuren diskutieren.
Als erste überlegung kommen wir zum Satz des Pythagoras (in der Ebene). Er handelt von einem
rechtwinkligen Dreieck, d.h. von einem Dreieck, in dem ein Winkel ein halber gestreckter
Winkel ist. Man kann mit Zirkel und Lineal einen solchen rechten Winkel herstellen, indem man
von einem Punkt das Lot auf eine Gerade füllt. Der Satz des Pythagoras besagt bekanntlich,
dass in einem rechtwinkligen Dreieck ABC die Summe der Quadrate der Katheten13 gleich dem
Quadrat der Hypothenuse14 ist (siehe Abbildung 1.10 (a)):
a2 + b2 = c2
(1.32)
Dabei sind die Katheten a, b die Dreiecksseiten, die den rechten Winkel, also den halben gestreckten Winkel bilden, die Hypothenuse c ist die dritte Dreiecksseite; siehe Abbildung 1.10
(a).
In der Praxis“ ist aber die Umkehrung dieses Satzes, die auch gilt, von Wert: Ein Dreieck,
”
für das die Summe der Quadrate zweier Seiten gleich dem Quadrat der dritten Seite ist, ist
28
C
.
a
A
b
c
B
c
b
a
c
(a) Der Lehrsatz
(b) Ein indischer Beweis
a
b
(c) Ein Mosaikbeweis
Abbildung 1.10: Beweise des pythagoreischen Lehrsatzes
notwendig rechtwinklig. Man kann damit rechtwinklige Dreiecke abstecken, eine im Bau– und
Ingenieurswesen wichtige Aufgabe.
Es gibt eine Vielzahl von Beweisen für den pythagoreischen Lehrsatz, teils auf Griechen und
Inder zurückgehend; vielleicht sollte man eher von Veranschaulichungen für die Richtigkeit des
Satzes sprechen. Aus indischen Quellen stammt der Beweis, der aus der Abbildung 1.10 (b)
abzulesen ist. Ein weiterer Beweis ist in Abbildung 1.10 (c) zu sehen.15
Als Vorwissen für die Argumentationen in den Beweisen benötigt man die Flächeninhaltsformel für rechtwinklige Dreiecke und Rechtecke:
Fläche Rechteck = a · b wobei a, b die Seitenlängen des Rechteckes sind.
1
Fläche rechtwinkliges Dreieck = a · b wobei a, b die Katheten des Dreiecks sind.
2
Ein Parallelogramm ist ein Viereck, in dem die gegenüberliegenden Seiten parallel sind.
Zwei Größen sind in einem Parallelogramm interessant: die Höhe und die Projektion der einen
Seite auf die andere Seite.
Die euklidische Geometrie, wie sie von Euklid begrändet und von Hilbert16 axiomatisch vollendet wurde, ist das Parallelenpostulat zentral.
V: Parallelenpostulat (von Euklid):
Zu einer Geraden g und einem Punkt P nicht auf dieser Geraden gibt es eine Gerade h, die
parallel zu g ist und auf der P liegt.
Aus heutiger Sicht ist es verwunderlich, dass die Existenz nicht–euklidischer Geometrien so
lange (ca. 2200 Jahre) nicht in Betracht gezogen wurde, gab es doch die sphärische Geometrie
– wir kommen darauf zurück – mit ihrer Parallelenanomalie“ (durch einen Punkt gehen meh”
rere Geraden (Großkreise)) seit langer Zeit. Ursächlich dafür war sicher, dass die sphärische
Geometrie nicht als eigenständige Geometrie, sondern als Besonderheit in der Raumgeometrie
12
Beim Begriff der Kongruenz handelt es sich dank der Tatsache, dass eine Bewegung bijektiv ist, um eine
Äquivalenzrelation. Dadurch wird die Menge aller Figuren in nichtleere disjunkte Teilmengen (Äquivalenzklassen)
zerlegt. Der Begriff der Kongruenz spielt eine überragende Rolle.
13
von καϑίστ ηµι (griech.) = hinsetzen, aufstellen
14
von v’ πóϑǫσις (griech.) = Unterlage, Grundlage
15
Den Beweis, der in den Elementen von Euklid wiedergegeben ist, führen wir nicht an. Er ist eine Beweisversion,
die keineswegs die Einfachheit der obigen Beweisvorlagen hat.
16
D. Hilbert, 1862 – 1943
29
betrachtet wurde. Erst B. Riemann17 machte den Blick frei für eine eigenständige Betrachtung,
lange nach der Entdeckung nicht–euklidischer Geometrien. Nach Fehlschlagen vieler Versuche,
das Parallelenpostulat zu beweisen, waren drei Mathematiker nahezu gleichzeitig und weitgehend unabhängig voneinander zu der Überzeugung gekommen, dass dieses Postulat nicht bewiesen werden kann, dass es also von den anderen Axiomen und Postulaten unabhängig ist.
Diese Mathematiker waren J. Bolyai18 , C. F. Gauß19 , N.I. Lobatschewski20 . Die Theorie von
Lobatschewski war der von Bolyai sehr ähnlich, die Veröffentlichung der Arbeiten von Gauß zu
diesem Thema erfolgten erst nach seinem Tode. Wir geben zunächst das Parallelenpostulat von
Lobatschewski wider und skizzieren dann ein konkretes Modell die hyperbolische Ebene dafür.
V’: Parallelenpostulat von Lobatschewski
Es existiert eine Gerade g und ein nicht auf g liegender Punkt, durch den mindestens zwei
Geraden verlaufen, die g nicht schneiden.
Man beachte, dass nur die Existenz einer Geraden gefordert wurde, zu der eine besondere
Situation bezüglich Parallelität besteht.
Kommen wir nun zu einer Konkretisierung der Lobatschewski–Geometrie, die wir H. Poincaré21 verdanken. Im Poincaré–Modell sind nun die Objekte “Punkte, Gerade, Abstand“ zu
definieren. Ausgangspunkt ist die uns schon vertraute Ebene AR2 , konkretisiert in R2 . Wir
betrachten nun die obere Halbebene
H := {(x, y) ∈ R2 |y > 0}
und nennen Punkte der Poincaré–Geometrie die Elemente von H, also
P := {(x, y) ∈ R2 |y > 0} .
In der Ebene R2 kennen wir elementargeometrisch Halbkreise und Kreise, ebenso in H. Davon
machen wir nun Gebrauch. Die euklidische Gerade
{x ∈ R2 |x = te1 , t ∈ R}
bezeichnen wir mit U ; U gehört P nicht an. Wir setzen
G := {Kr (Z)|Z ∈ U, r > 0} ∪ {L(S)|S ∈ U };
dabei ist Kr (Z) := {(x, y) ∈ H|(x − z)2 + y 2 = r 2 } , wobei Z ein Punkt mit den Koordinaten
(z, 0) ist, L(S) := {(x, y) ∈ H|x = s, y > 0} , wobei S ein Punkt mit den Koordinaten (s, 0) ist.
In Abbildung 1.11 sind die Objekte zu sehen.
Die Gerade U wird als Randgerade der hyperbolischen Ebene bezeichnet. Die Schnittpunkte der Halbkreise Kr (Z) und der Geraden L(S) bezeichnen wir als uneigentliche Punkte.
Man rechnet nach, dass die Inzidenzaxiome I damit erfüllt sind. Auf die Angabe des Abstands
verzichten wir hier.
Wir haben nun zwei verschiedene Modelle von Geometrien kennengelernt: Euklidische Geometrie und hyperbolische Geometrie. Man weist der euklidischen Geometrie konstante Krümmung
Null und der hyperbolischen Geometrie konstante negative Krümmung zu. Es fehlt noch ein Modell für eine Geometrie mit positiver konstanter Krümmung. Ein solches Modell stellt die sphärische Geometrie dar. Es ist dies die Geometrie, die für unsere Anschauung auf der Erdkugel oder
der Himmelskugel zuständig ist.
17
Riemann, Bernhard, 1826 – 1866
Bolyai, Janos, 1801 —1860
19
Gauß, Carl F., 1777 – 1855
20
Lobatschewski, Nikolai I., 1792 – 1856
21
Poincaré, Henry, 1854 – 1912
18
30
Die Frage, welche Geometrie für unser Universum gültig ist, lässt sich in diesem Deutungsmuster auf die Frage nach der Krümmung
L(S)
des realen Raumes zurückführen. Die AntKr (Z)
wort, die uns A. Einstein gegeben hat, wird
Kr (Z)
noch komplexer dadurch, dass der Raum nicht
r
von der Zeit zu trennen ist. Mit der speziellen Relativitätstheorie stellt Einstein die
Z
Z
S
Geometrie der Raum–Zeit–Welt als pseudo–
”
euklidischen“ Raum dar, der viel von der hyperbolischen Geometrie hat. Mit der allgemeiAbbildung 1.11: Die hyperbolische Ebene
nen Relativitätstheorie, mit der Einstein die
spezielle Relativitätstheorie präzisierte und
ergänzte, stellte sich heraus, dass die Geometrie der realen Raum–Zeit–Welt als allgemeine
vierdimensionale Riemannsche Mannigfaltigkeit mit variabler Krümmung anzusehen ist. Die
Krümmung dieser Mannigfaltigkeit hängt von der Dichte der Materie in der Umgebung dieses Punktes ab, je größer die Dichte, desto größer die Krümmung. (Hier haben die schwarzen
Löcher ihren Platz“: Der Raum in ihrer Umgebung ist so stark gekrümmt, dass selbst Licht (in
”
seiner Teilchenstruktur) nicht entweichen kann.) In einer hinreichend kleinen Umgebung eines
jeden Punktes ist die Raum–Zeit–Welt ein vierdimensionaler pseudo–euklidischer Raum, so dass
die Verhältnisse in diesen kleinen Bereichen durch die spezielle Relativitätstheorie beschrieben
werden können. In noch kleineren“ Bereichen bei kleinen Geschwindigkeiten zerfällt die Raum–
”
Zeit–Welt wieder in eine Raum–Welt und eine Zeit–Achse und die klassische Newton–Mechanik
greift.
1.8
1.)
2.)
3.)
4.)
Übungen
Stelle x := 7.93578 als gekürzten Bruch dar.
17 (Approximation von √2) für g = 10, g = 2
Bestimme die g–adische Entwicklung von 12
und g = 6 .
√
Man gebe die ersten 6 Ziffern der Dezimalbruchentwicklung von x := 9 − 4 5 an.
Seien G, M Mengen und sei I ⊂ G × M . Zu A ⊂ G setze
Aˆ:= {m ∈ M |(a, m) ∈ I für alle a ∈ A} .
Zeige:
(a)
Bˆ⊂ Aˆ falls A ⊂ B .
(b) A ⊂ Aˆˆ, Aˆ= Aˆˆˆ.
5.)
6.)
Zeige mittels vollständiger Induktion:
Pn
(n + 1)(2a + nd)
,n ∈ N.
(a)
j=0 (a + jd) =
2
2
Pn 1
n(n + 1)
(b)
,n ∈ N.
j=0 3 =
2
j
Zeige:
l! ≥ 2l−1 , l ∈ N .
Pn 1
(b)
j=0 j! < 3 , n ∈ N .
(a)
31
(c)
7.)
8.)
P
1)
Die Folge ( nj=0 j!
n∈N ist konvergent.
Seien a, b ∈ R . Zeige: Ist a > 0, b < 0, dann ist a−1 > 0 und ab < 0 .
Seien a, b ∈ R, a > 0, b > 0 . Zeige, dass
√ aus √der√Tatsache, dass die Quadratwurzel
eindeutig bestimmt ist, dazu führt, dass ab = a b gilt.
• Ist A nach oben beschränkt und welchen Wert hat gegebenenfalls a∗ := supa∈A a?
• Ist A nach unten beschränkt und welchen Wert hat gegebenenfalls a∗ := inf a∈A a?
(a) A := {(1 − n12 )n |n ∈ N} .
(b) A := {q n |n ∈ N} für q ∈ (0, 1) .
Hinweis: Es gilt die Ungleichung (1 + h)n ≥ (1 + nh), n ∈ N, für 1 + h > 0 .
9.)
(a)
Sei A eine nichtleere nach oben beschränkte Menge. Zeige: Ist
a∗ = sup A , b∗ = sup A,
dann gilt a∗ = b∗ .
(b) Sei A eine nichtleere, beschränkte Menge. Es gelte:
sup A = inf A .
Wie kann die Menge A aussehen?
(c)
Sei A := {x ∈ R|x2 − 7x + 12 ≥ 0 und x2 − 72 x > 0}. Berechne inf A und sup A .
10.) Sei X eine Menge. Für Teilmengen A, B ⊂ X heiät
A △ B := {x ∈ X|x ∈ A ∪ B, x ∈
/ A ∩ B}
die symmetrische Differenz von A und B .
(a) Zeige für A, B ⊂ X: A △ A = ∅ , ∅ △ A = A .
(b) Zeige für A, B, C ⊂ X: A ∩ (B △ C) = (A ∩ B) △ (A ∩ C) .
(c)
Sei nun X = R und seien A, B beschränkte Teilmengen von X . Welche Brücke lässt
sich von
inf (A △ B), sup (A △ B)
zu
inf A, inf B, sup A, sup B, inf (A ∪ B), inf (A ∩ B), sup(A ∪ B), sup(A ∩ B)
bauen?
11.) Seien y1 , . . . , yn , x1 , . . . , xn ∈ R und y1 > 0, . . . , yn > 0 . Zeige
min{
x1 + · · · + xn
xi
xi
|i = 1, . . . , n} ≤
≤ max{ |i = 1, . . . , n} .
yi
y1 + · · · + yn
yi
12.) Die Folge (xn )n∈N sei erklärt durch folgende Rekursion:
x1 := u , xn+1 := axn (1 − xn ), n ∈ N .
Dabei sei a > 1, u ≥ 0 .
Mögliche Interpretation: Jedes xn kann gedeutet werden als Größe einer Population in
der n–ten Generation; a steht für einen Reproduktionskoeffizienten.
32
(a)
Wie sieht die Folge aus für u = 1, u = 0? Interpretiere das Ergebnis im Rahmen
des obigen Modells.
(b) Sei nun u ∈ (0, 1). Berechne Kandidaten für den Grenzwert der Folge unter der
Annahme, dass (xn )n∈N konvergiert.
Hinweis: Verwende die Rechenregeln für Limiten.
(c)
Zeige für u =
(d) Zeige für u =
1
4
1
4
und a = 2: 0 ≤ xn ≤
1
2
für alle n ∈ N .
und a = 2: limn∈N xn =
1
2
.
13.) Sei a0 > 0, b0 ≥ 0 . Definiere
an+1
an + 3bn
, bn+1 :=
:=
4
p
an bn
, n ∈ N0
2
und zeige:
a1 ≥ b1 , an ≥ an+1 ≥ bn+1 ≥ bn , n ∈ N0 ;
√
√
(b) an+1 − bn+1 = 14 ( an − bn )2 < 41 (an − bn ) , n ∈ N0 ;
(a)
(c)
(an )n∈N , (bn )n∈N konvergieren und es gilt limn an = limn bn .
14.) Zeige für a, b ∈ R : max{a, b} = 21 (a + b + |a − b|) , min{a, b} = 12 (a + b − |a − b|)
15.) Sei A := { n2 + 1 |n ∈ N}. Zeige: A ist nach unten beschränkt und inf A = 0.
n +3
1 |a ∈ A}.
16.) Sei A eine Teilmenge von R mit a > 0 für alle a ∈ A. Setze A1 := { a
Zeige: Ist inf A > 0, so ist sup A1 = (inf A)−1 .
17.) Zeige für a, b ∈ R :

a
1
2

 {x ∈ R||x + 2 | ≤ 2 D} , falls D := a − 4b > 0
1}
{− a
, falls D = 0
{x ∈ R|x2 + ax + b ≤ 0} =


0
, falls D < 0
18.) Seien a, b, h reelle Zahlen. Zeige:
(a)
0 < ah < bh, falls 0 < a < b und h > 0 .
(b) a2 < b2 , falls 0 ≤ a < b.
19.) Sei M das Intervall (1, ∞) . Sind die folgenden Aussagen für eine reelle Zahl wahr?
Beantworte dies jeweils durch einen Beweis oder ein Gegenbeispiel!
(a)
Ist a ∈ M, dann ist auch a2 ∈ M .
(b) Ist a ∈
/ M, dann gilt auch a2 ∈
/ M.
Ist a ∈ M, dann ist auch a−1 ∈ M .
√
(d) Ist a ∈ M, dann ist auch a ∈ M .
(c)
20.) Seien P = [0, 0], Q = [2, 1] zwei Punkte in AR2 . Liegt der Punkt R = [11, 15] auf der
Geraden durch P, Q ? Berechne einen Vektor u ∈ R2 , der die Verschiebung der affinen
−−
→
Ebene AR2 durch den Pfeil P Q realisiert.
21.) Beweise: In (AR2 , G) gilt:
(a)
Zu je zwei verschiedenen Punkten von AR2 gibt es genau eine Gerade, auf denen
diese Punkte liegen.
33
(b) Zu jedem Punkt P aus AR2 und jeder Geraden g aus G gibt es genau eine weitere
Gerade h ∈ G, die durch P geht und die entweder identisch g ist oder mit g keinen
Punkt gemeinsam hat; im letzteren Fall nennt man h zu g parallel.
(c)
Es gibt drei Punkte in AR2 , die nicht auf einer Geraden liegen.
22.) Betrachte in AR2 das Koordinatensystem, das durch die Geraden G1 , G2 durch O =
[0, 0], E = [1, 0] bzw. O = [0, 0], D = [1, 1] festgelegt wird. Berechne zu P = [2, 1], Q =
[4, 1], R = [6, 2] die Koordinaten bezöglich dieses Koordinatensystems.
Stoffkontrolle
• Die Rechenarten Addition, Multiplikation, Vergleich“ sollten in ihren Regelgruppen ver”
standen sein.
• Grenzwerte werden später vertieft. Die Regeln für das Rechnen mit Grenzwerten gehören
zum Standardwissen.
• Die Aufstellung von Geraden in AR2 bzw. R2 muss eingeübt sein.
• Wie fällt man ein Lot auf eine Gerade, wie erstellt man ein Parallelogramm in R2 ?
34
Kapitel 2
Vektorrechnung
Im ersten Kapitel haben wir u.a. den Vektorraum Rn und den Umgang mit der Addition und
der skalaren Multiplikation kennengelernt. Nun wollen wir die euklidische Struktur des Rn ,
insbesondere des Anschauungsraums R3 , aufdecken. Diese Struktur wird nicht zuletzt durch das
geometrische Konzept der Orthogonalität beherrscht. Überall präsent ist der Begriff der linearen
Unabhängigkeit und der Basis. Dies sind auch die Begriffe, die weit über den Rn hinaus tragen.
2.1
Skalarprodukt und Abstand
Definition 2.1
Für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn nennen wir die Zahl
hx, yi :=
n
X
xi yi
i=1
das euklidische Skalarprodukt von x, y ∈ Rn .
Die Bezeichnung Skalarprodukt“ rührt daher, dass
”
in der analytischen Geometrie Elemente von Rn
als Vektoren und die Elemente des zugrundeliegenden Körpers R als Skalare bezeichnet werden. Dies
stimmt mit der in der Physik üblichen Bezeichnungsweise überein, Größen mit Richtung“ als Vek”
toren und Zahlgrößen als Skalare zu benennen. Das
Skalarprodukt ist also eine Vorschrift, die aus einem Paar von Vektoren einen Skalar bildet. Wir
werden noch ein Produkt“ kennenlernen, das aus
”
einem Paar von Vektoren einen Vektor bildet.
Die Bezeichnung euklidisch“ rührt daher, dass dar”
aus sich Orthogonalität und ein Abstandsbegriff
herleitet, der zentral in der euklidischen Geometrie
(der Ebene) ist.
Folgerung 2.2
Für das Skalarprodukt haben wir folgende Eigenschaften:
2
1
y0
–1
–2
–2
–1
35
1
2
Abbildung 2.1: Ebenes Zentralfeld
1. hx, xi ≥ 0 für alle x ∈ Rn und hx, xi = 0 genau dann, wenn x = θ .
2. hx, yi = hy, xi für alle x, y ∈ Rn .
0
x
3. hax + by, zi = ahx, zi + bhy, zi für alle a, b ∈ R und x, y ∈ Rn .
Beweis:
Diese Eigenschaften verifiziert man ohne Mühe mit den Rechenregeln in R .
Definition 2.3
Für x = (x1 , . . . , xn ) ∈ Rn nennen wir die Zahl
|x| :=
p
hx, xi
die euklidische Norm von x . Die Zahl |x| heißt auch euklidische Länge von x .
Wir haben für den Betrag |x| einer reellen Zahl und die euklidische Länge des Vektors x ∈ Rn
kein unterscheidbares Symbol verwendet. Dies war klug, denn für n = 1 stimmen beide Objekte
überein.
Die euklidische Länge in Rn definiert in Rn auch einen Abstandsbegriff : sind x, y zwei
Vektoren in Rn , so stellt |x − y| den Abstand von x, y dar. Hier kommt die Betrachtungsweise
der Objekte in Rn als Punkte durch. Betrachtet man x − y als (Orts–)Vektor, so liegt es nahe
bei |x − y| von der Länge von x − y zu sprechen. Man beachte den Spezialfall y = θ .
Bei Vektorfeldern ist (durch die Anwendungen) bestimmten Punkten im Raum ein Vektor
zugeordnet. Zur Veranschaulichung von Vektorfeldern hängt man an die Punkte im Raum diesen
Vektor des Vektorfeldes als einen Pfeil mit entsprechender Richtung und Länge an. Oftmals hat
man es bei Vektorfeldern mit Kraftfeldern zu tun.
Beispiel 2.4 Die Gravitationskraft k zwischen zwei Massenpunkten mit Masse M bzw. m,
die sich im Abstand r im Raum befinden, ist dem Betrage nach gegeben durch
|k| = γ
m
Mm
, γ (∼ 9.81 2 ) Gravitationskonstante .
2
r
sec
Diese Gravitationskraft wirkt entlang der Verbindungslinie der Massenpunkte und lässt sich als
Vektorfeld K daher so
Mm x
, x 6= θ
(2.1)
K(x) = −γ 2
|x| |x|
anschreiben, wenn wir uns die Masse M ( Sonne“) im Ursprung denken und x der Ortsvektor
”
des Massenpunktes m ( Erde“) ist. Siehe die Veranschaulichung in der Ebene in Abbildung
”
2.1.1 )
Folgerung 2.5
Für die euklidische Norm haben wir folgende Eigenschaften:
(a)
|x| = 0 genau dann, wenn x = θ .
(b) |ax| = |a||x| für alle a ∈ R und x ∈ Rn .
(c)
|x + y| ≤ |x| + |y| für alle x, y ∈ Rn .
(d) |hx, yi| ≤ |x| |y| für alle x, y ∈ Rn .
(e)
|x + y|2 + |x − y|2 = 2|x|2 + 2|y|2 , x, y ∈ Rn .
1
Die Abbildung 2.1 wurde mit Maple erzeugt und dann in Latex eingebunden, woraus sich Maßstabsverzerrungen ergeben können. Der code lautet:
> restart : with(plots) :
> v := [−x/sqrt(x2 + y2 ), −y/sqrt(x2 + y2 )] :
> fieldplot(v, x = −2..2, y = −2..2, axes = box, grid = [8, 8], arrow = slim);
36
Beweis:
Die Eigenschaften (a), (b) und (e) verifiziert man ohne Mühe.
Zu (d). Seien x, y ∈ Rn . Die Behauptung gilt offenbar, wenn x = y = θ ist. Sei nun etwa
y 6= θ . Für alle a ∈ R gilt 0 ≤ hx − ay, x − ayi = |x|2 + a2 |y|2 − 2ahx, yi , und wählt man
a := hx, yihy, yi−1 , was wegen y 6= θ möglich ist, so folgt die Aussage.
Zu (c). Seien x, y ∈ Rn . Mit (d) folgt
|x + y|2 = |x|2 + 2hx, yi + |y|2 ≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2 .
Daran liest man die Behauptung ab.
Die Eigenschaften (a), (b), (c) in Folgerung 2.5 sind typisch für eine Längenfunktion; sie heißen
Definitheit, Homogenität bzw. Dreiecksungleichung. Der Begriff Dreiecksungleichung“
”
erklärt sich aus der Tatsache, dass sie sich als Ungleichung für die Seitenlängen im Dreieck mit
den Ecken O, A, B mit den Koordinaten θ, x, y deuten lässt. Die Eigenschaft (d) heißt Cauchy–
Schwarzsche Ungleichung. Die Identität in (e) heißt Parallelogrammidentität, da sie von
Seiten– und Diagonalenlängen in dem Parallelogramm, das durch x, y aufgespannt wird, handelt.
Bemerkung 2.6 Aus dem Beweis zu Folgerung 2.5 lesen wir ab, dass in der Cauchy–Schwarzschen Ungleichung Gleichheit genau dann gilt, wenn x = ay oder y = ax mit einem a ∈ R gilt,
d.h. wenn die Vektoren x, y linear abhängig sind; siehe Abschnitt 2.2
Definition 2.7
x, y ∈ Rn heißen orthogonal (senkrecht), wenn hx, yi = 0 gilt. Wir sagen auch, x, y bilden
einen rechten Winkel.
Dass wir in Definition den richtigen Ansatz gewählt haben, wird auch gestützt durch
Satz des Pythagoras: |x + y|2 = |y|2 + |y|2 für x, y ∈ Rn mit hx, yi = 0 .
Dies ist leicht nachzurechen.
2.2
Lineare Unabhängigkeit
Wir betrachten im Vektorraum Rn die Einheitsvektoren e1 , . . . , en . Offenbar können wir damit
jeden Vektor x ∈ Rn , die skalare Multiplikation nutzend, als Linearkombination darstellen:
x=
n
X
i=1
xi ei , falls x = (x1 , . . . , xn ) ∈ Rn .
(2.2)
Hier haben wir das Summensymbol in einer neuen Situation kennengelernt. Es steht für
x1 e1 + x2 e2 + · · · + xn en .
In (2.2) heißen x1 , . . . , xn Koeffizienten der Linearkombination.
Umgekehrt kann man sich fragen, wieviele Vektoren aus Rn , gegeben Vektoren u1 , . . . , ul ∈
man durch Linearkombinationen darstellen kann. Die durch diese Vektoren darstellbare
Menge erhält den Namen lineare Hülle von U := {u1 , . . . , ul } ; wir schreiben:
Rn ,
l
X
xi ui |u1 , . . . , ul ∈ Rn , x1 , . . . , xl ∈ R} .
span(U ) := span(u1 , . . . , ul ) = L({u1 , . . . , ul }) = {
i=1
37
Die Abkürzung span“ steht für aufspannen“.
”
”
Es sollte klar sein, dass man bei der Wahl von ganz vielen“ verschiedenen Vektoren u1 , . . . , ul
”
die Chance hat, dass span(u1 , . . . , ul ) = Rn gilt. Andererseits möchte man überflüssige“ Vekto”
ren auch weglassen können; z.B. ist klar, dass man bei der Wahl u1 := e1 , . . . , un := en , un+1 :=
e := (1, . . . , 1) sicher einen Vektor weglassen kann, und zwar genau einen; dieser kann aber
beliebig gewählt werden. Diese Betrachtungen führen uns nun zu einem wichtigen Begriff der
linearen Algebra, die wir später ausbauen werden.
Definition 2.8
Die Vektoren u1 , . . . , ul ∈ Rn heißen linear unabhängig, falls aus einer Darstellung θ =
Pl
i
i=1 xi u folgt, dass alle Koeffizienten verschwinden, also x1 = · · · = xl = 0 .
Sind u1 , . . . , ul nicht linear unabhängig, dann heißen sie linear abhängig.
Der Kern der Definition ist also, dass die Darstellung des Nullvektors bei linear unabhängigen
Vektoren eindeutig ist, denn mit verschwindenden Koeffizienten gelingt die Darstellung von θ
immer.
Beispiel 2.9 Betrachte in R3 die Vektoren
u1 := (1, 1, 1) , u2 := (2, 2, 2) , u3 := (1, 2, 3) .
Diese Vektoren sind linear abhängig, denn schon die Vektoren u1 := (1, 1, 1) , u2 := (2, 2, 2) sind
linear abhängig: θ = 2u1 − u2 .
Wie sieht die lineare Hülle dieser Vektoren aus? Offenbar gilt span(u1 , u2 , u3 ) = span(u1 , u3 ) =
span(u2 , u3 ), da ja u2 = 2u1 , u1 = 12 u2 . Aber es gilt nicht span(u1 , u3 ) = R3 , denn z.B. gilt
(0, 1, 1) ∈
/ R3 .
Nicht immer genügen also in Rn schon n paarweise verschiedene Vektoren, um alle Vektoren in
Rn durch Linearkombination darstellen zu können.
Bemerkung 2.10 Skalierung verändert die Eigenschaft Lineare Unabhängigkeit“ nicht. Dies
”
bedeutet: Sind u1 , . . . , ul ∈ Rn linear unabhängig und sind a1 , . . . , al ∈ R mit ai 6= 0 für alle
i = 1, . . . , l, dann sind auch a1 u1 , . . . , al ul linear unabhängig. Dies ist leicht einzusehen. Man
sagt, dass man linear unabhängige Vektoren skalieren“ darf. Insbesondere kann man sie immer
”
auf die Länge Eins normieren; siehe später.
Folgerung 2.11
Seien u1 , . . . , ul ∈ Rn mit
ui 6= θ, i = 1, . . . , l , hui , uj i = 0, 1 ≤ i, j ≤ l, i 6= j .
Dann sind u1 , . . . , ul linear unabhängig.
Beweis: P
Aus θ = li=1 ai ui folgt mit der Linearität des Skalarprodukts
0 = hθ, uj i =
l
X
i=1
ai hui , uj i = aj |uj |2 für alle j = 1, . . . , l .
Also folgt mit der Voraussetzung uj 6= θ, j = 1, . . . , l, aj = 0 für alle j = 1, . . . l .
Definition 2.12
Seien u1 , . . . , ul ∈ Rn mit
ui 6= θ, i = 1, . . . , l , hui , uj i = 0, 1 ≤ i, j ≤ l, i 6= j .
38
Dann heißen u1 , . . . , ul ∈ Rn ein Orthogonalsystem. Gilt zusätzlich noch |ui | = 1 für alle
i = 1, . . . , l, dann heißen u1 , . . . , ul ∈ Rn ein Orthonormalsystem.
In Rn kennen wir schon n linear unabhängige Vektoren, nämlich die Einheitsvektoren; sie
bilden ein Orthonormalsystem. Dass sie linear unabhängig sind, folgt nun aus Folgerung 2.11. Sie
haben sogar die Eigenschaft, dass jeder Vektor sich durch sie darstellen lässt: span(e1 , . . . , en ) =
Rn .
Definition 2.13
Wir sagen, dass w1 , . . . , wm ∈ Rn eine Basis von Rn darstellen, wenn gilt:
(a)
w1 , . . . , wm sind linear unabhängig.
(b) span(w1 , . . . , wm ) = Rn , d.h. w1 , . . . , wm sind ein Erzeugendensystem“ von Rn .
”
Folgerung 2.14
Sei w1 , . . . , wm ∈ RnPeine Basis in Rn und sei x ∈ Rn . Dann gibt es eindeutig bestimmte Skalare
i
a1 , . . . , am mit x = m
i=1 ai w .
Beweis:
Dass es solche Skalare gibt, folgt aus (a) der Definition 6.55. Dass diese Skalare auch eindeutig
bestimmt sind, folgt mit (b) aus Definition 6.55, denn zwei solche Darstellungen führen durch
Subtraktion sofort auf eine Darstellung von θ .
Bemerkung 2.15 Seien w1 , . . . , wm , wm+1 ∈ Rn .
Sind w1 , . . . , wm , wm+1 linear unabhängig, so auch w1 , . . . , wm , was man an
θ=
m
X
xi wi =
m
X
xi wi + 0wm+1 .
i=1
i=1
abliest.
Ist w1 , . . . , wm ein Erzeugendensystem, dann ist erst recht w1 , . . . , wm , wm+1 ein Erzeugendensystem.
Ist w1 , . . . , wm eine Basis, dann sind w1 , . . . , wm , wm+1 linear abhängig, was man an
w
m+1
=
m
X
xi w i
i=1
abliest; beachte, dass wm+1 so durch die Basis w1 , . . . , wm dargestellt werden kann.
Wir wissen bereits, dass e1 , . . . , en eine Basis von Rn bilden.; siehe Folgerung 2.11. Nun
bleiben Fragen offen:
1. Es gibt offenbar andere Vektoren w1 , . . . , wm , die linear unabhängig sind. Bilden solche
Vektoren auch schon eine Basis?
2. Ist die Anzahl der linear unabhängigen Vektoren w1 , . . . , wm durch n beschränkt, d.h. gilt
immer m ≤ n, oder gilt sogar immer m = n?
Diesen Fragen wollen wir nun nachgehen. Hier haben wir den Fall allgemeiner n’s im Auge,
den Fall n = 2, n = 3 können wir später sehr viel einfacher klären; die folgenden überlegungen
kann man also überspringen, wenn man nur an n = 2, n = 3 interessiert ist.
39
Lemma 2.16 (Austauschlemma)
P
Sei u1 , . . . , ul eine Basis von Rn . Ist w = li=1 ai ui ∈ Rn und ist ak 6= 0 für ein k, dann ist auch
u1 , . . . , uk−1 , w, uk+1 , . . . , ul eine Basis von Rn .
Beweis:
P
P
O.E. k = 1, ak = 1 . Also w = u1 + li=2 ai ui , u1 = w − li=2 ai ui .
w, u2 , . . . , ul sind linear unabhängig, denn aus
θ = bw +
l
X
i
1
bi u = bu +
(bai + bi )ui
i=2
i=2
u1 , . . . , ul
l
X
folgt, da
linear unabhängig sind,
P b = 0, b2 = · · · = bl = 0 .
span(w, u2 , . . . , ul ) = Rn . Sei etwa x = li=1 xi ui ∈ Rn ; beachte u1 , . . . , ul ist eine Basis und
P
daher ein Erzeugendensystem. Ersetze nun u1 durch w − li=2 ai ui .
Satz 2.17 (Austauschsatz)
Sei u1 , . . . , ul eine Basis von Rn . Seien w1 , . . . , wm ∈ Rn linear unabhängig. Dann gilt m ≤ l .
Beweis:
Wir beweisen induktiv bezüglich m:
m ≤ l , {w1 , . . . , wm , um+1 , . . . , wl } ist (eventuell nach Umnummerierung) eine Basis von Rn .
Induktionsbeginn: Ist m = 0, so ist nichts zu beweisen.
Induktionsschluss: w1 , . . . , wm ist als Teilmenge von w1 , . . . , wm+1 auch linear unabhängig. Nach
Induktionsannahme gilt m ≤ l und – nach geeigneter Umnummerierung – ist w1 , . . . , wm ,
um+1 , . . . , ul eine Basis von Rn . Zum Nachweis von m + 1 ≤ l muss nur noch m = l ausgeschlossen werden. In diesem Falle wäre aber schon w1 , . . . , wm eine Basis und w1 , . . . , wm , wm+1
müssten linear abhängig sein. Also gilt nun m + 1 ≤ l . Wir schreiben
wm+1 = a1 w1 + · · · + am wm + am+1 um+1 + · · · + al ul .
Wäre am+1 = · · · = al = 0, dann wären w1 , . . . , wm+1 linear abhängig, was im Widerspruch zur
Voraussetzung ist. Also gibt es ein k ≥ m + 1 mit ak 6= 0 . Nun können wir, nach geeigneter Umnummerierung, nach Lemma 2.16 wm+1 gegen um+1 austauschen und w1 , . . . , wm+1 , um+2 , . . . , ul
ist eine Basis.
Folgerung 2.18
Der Vektorraum Rn hat eine Basis und jede Basis besteht aus n Vektoren.
Beweis:
Sei w1 , . . . , wm und u1 , . . . , ul eine Basis von Rn . Dann kann man Satz 2.17 zweimal anwenden
und erhält m ≤ l und l ≤ m . Da wir die Basis e1 , . . . , en schon kennen, gilt m = l = n .
Definition 2.19
Wir sagen, der Vektorraum Rn hat die Dimension n, da jede Basis aus n Vektoren besteht. Das, was wir nun für den Rn vorgeführt haben, um zu erkennen, dass die Vorstellung vom
Rn als einem Raum mit n Freiheitsgraden“ zutrifft, wird später auch für eine Abstrahierung
”
taugen.
Der Begriff der Basis ist für (allgemeine) Vektorräume ein sehr wesentlicher. Aber auch in
der Physik ist er von Bedeutung. Er wird bei Koordinatensystemen bedeutsam und er ist in der
Mechanik im Hintergrund, wenn von Freiheitsgraden einer Bewegung die Rede ist.
Wir haben schon gesehen, dass es in einem Vektorraum Rn viele Basen gibt. Wie kommt man
von einer Basis zu einer anderen: mit einem Basiswechsel. In Abschnitt 2.4, wenn wir auch
schon genauer über die Orthogonalität Bescheid wissen, skizzieren wir dies.
40
2.3
Orthogonalität und Winkel
(Voll–)Kugeln in Rn sind gegeben als Mengen
Br (z) := {w ∈ Rn ||w − z| < r} ,
B r (z) := {w ∈ Rn ||w − z| ≤ r} .
Eine Kreislinie ist die Menge
Kr (z) := {w ∈ Rn ||w − z| = r} .
Sei A ⊂ Rn eine nichtleere Menge und sei x ∈ Rn . Man nennt
d(x, A) := inf{|x − w||w ∈ A}
den Abstand von x zu A . Ist x = θ, so nennt man ein w ∈ A mit |w| = d(θ, A) einen kürzesten
Vektor in A .
Betrachte folgende Aufgabe:
Gegeben:
Gesucht:
Vektoren x, y ∈ Rn , x 6= θ, y 6= θ .
Zerlegung y = yk + y⊥ mit yk ∈ span(x) und
y⊥ kürzester Vektor mit dieser Zerlegungseigenschaft.
Diese Aufgabe ist recht einfach zu lösen. Wir machen den Ansatz
y = yk + w mit yk = sx, s ∈ R .
Gesucht sind nun s und w unter Beiziehung der geforderten Extremaleigenschaft. Man sucht
also w so, dass
|w|2 = hy − sx, y − sxi = |y|2 − 2shx, yi + s2 |x|2 = |x|2 (s −
hx, yi2
hx, yi 2
2
)
+
|y|
−
|x|2
|x|2
in Abhängigkeit von s möglichst klein wird. Man liest nun ab – siehe Abbildung 2.2 – , dass dies
für
hx, yi
s=
|x|2
der Fall ist. Damit erhält man mit einfachen Rechenschritten
hyk , y⊥ i = 0
x
|hx, yi|
hx, yi
|y|
, |yk | =
|y|
yk =
|x||y| |x|
|x||y|
s
hx, yi
x
hx, yi2
y⊥ = y −
|y|
, |y⊥ | =
1 − 2 2 |y|
|x||y| |x|
|x| |y|
(2.3)
(2.4)
(2.5)
Offenbar stellt (2.3) gerade das erwartete Senkrechtstehen“ von yk , y⊥ dar.
”
Die Cauchy–Schwarzsche Ungleichung lässt sich so anschreiben:
cx,y :=
hx, yi
∈ [−1, 1]
|x||y|
41
(2.6)
für alle x, y ∈ Rn , x 6= θ, y 6= θ . Damit lassen sich (2.4), (2.5) so aufschreiben:
q
|yk | = |cx,y ||y| , |y⊥ | = 1 − c2x,y |y| .
Nun ist es an der Zeit, über Winkel zu reden. Winkel (in der Geometrie) kommen zustande,
indem man zwei Geraden zum Schnitt bringt und die Menge, die von den Halbgeraden, die
vom Schnittpunkt ausgehen, eingeschlossen wird, als Winkel bezeichnet. Wichtig ist dass man
eine Maßzahl für die Größe“ des Winkels hat. Den Weg dahin wollen wir nun in der Ebene
”
skizzieren.
In Abbildung 2.3 ist im kartesischen Koordinatensystem ein Punkt P auf dem Rand des
Kreises B1 (θ) eingezeichnet. Die Gerade durch
O und P mit Richtungsvektor x := (x1 , x2 )
und die Gerade durch O und Q mit Richtungsvektor y := (y1 , y2 ) schneidet auf der Kreisliy
nie Kr (θ) einen Kreisbogen heraus. Die Länge
dieses Kreisbogens ist ein Maß für die Größe
y|
des Winkels φ = ∢ (x, y), wenn wir richtig skas
lieren; der Winkel wird oft mit seiner Maßzahl
gleichgesetzt und ist dann von der Dimension
y ||
x
einer Länge. Allerdings ist dieser Kreisbogen
nicht einfach auszumessen, da er gekrümmt
Abbildung 2.2: Orthogonale Zerlegung
ist. Später werden wir Hilfsmittel kennenlernen, die die Berechnung der Länge von solchen Bögen gestattet. Soviel sei hier schon bemerkt,
dass die Kreiszahl π ∼ 3.14145 . . . für das Winkelmaß wesentlich ist: π/2 ist die Länge des
Viertelkreisbogens mit Radius 1; siehe Anhang 2.6.
Sei F der Fußpunkt des Lotes von P auf die
Abszisse. Die Seitenlängen
p im Dreieck OP F
sind gegeben durch r = x21 + x22 , x1 und x2 .
Wir schreiben
cos(φ) :=
x1
x2
, sin(φ) := ,
r
r
P (x 1 x 2 )
r
ϕ
und haben nach dem Satz des Pythagoras
((y1 , 0) und (0, x2 ) sind orthogonal!)2
cos2 (φ) + sin2 (φ) = 1 .
x2
O
x1
F
Q (y 1 y 2 )
(2.7)
Nun erhalten wir dann etwa: cos(0) =
sin(π/2) = 0, cos(π/2) √ = sin(0) =
0, sin(π/4) = cos(π/4) = 21 2, cos(π) = −1 .
Abbildung 2.3: Kreisbogen
Wandert“ der Punkt P über den Kreisbogen,
”
überstreicht der Wert der Maßzahl cos(φ) die
Zahlen aus dem Intervall [−1, 1] . Dass jede reelle Zahl in [−1, 1] dabei auftritt, ist noch nicht
belegt, aber naheliegend.3 Wegen (2.7) gilt dieselbe Aussage auch für die Maßzahl sin(φ).
2
Die folgende Schreibweise cos2 (φ) + sin2 (φ) = 1 statt cos(φ)2 + sin(φ)2 = 1 hat sich durchgesetzt. Sie ist eine
Spezialität für die trigonometrischen Funktionen. Also: cos2 (h) steht für cos(h) · cos(h) .
3
Später sprechen wir davon, dass die Funktion cos(·) eine stetige Funktion ist. Dann nimmt cos(·) in der Tat
jeden Wert in [−1, 1] an.
42
Die trigonometrischen Größen (Cosinus, Sinus) cos(φ), sin(φ) sind nur sehr indirekt und etwas vage eingeführt, in der Theorie der reeellen Funktionen werden sie ein sicheres Fundament
erhalten.
Bemerkung 2.20 Wir kommen zur Zerlegung y = yk + y⊥ zurück. Wir können nun schreiben:
y = yk + y⊥ mit |yk | = cos(∢ (x, y))|y| , |y⊥ | = sin(∢ (x, y))|y| .
In der Ebene können wir die Polarkoordinaten einführen: Jedem Punkt P mit den eukli”
dischen Koordinaten“ (x, y) ordnen wir das Zahlenpaar
p
(r, φ) mit r = x1 2 + x2 2 , r cos(φ) = x1 , r sin(φ) = x2 , φ ∈ [0, 2π),
zu. Damit kommen wir zu Zylinderkoordinaten im Raum R3 : jedem Punkt P mit den eu”
klidischen Koordinaten“ (x1 , x2 , x3 ) ordnen wir das Zahlenpaar
p
(r, φ, x3 ) mit r = x1 2 + x2 2 , r cos(φ) = x1 , r sin(φ) = x2 , φ ∈ [0, 2π),
zu.
Der Cosinussatz der ebenen Trigonometrie besagt, dass in einem Dreieck mit den Seiten
a, b, c und dem c gegenüberliegenden Winkel γ gilt:
c2 = a2 + b2 − 2ab cos(γ) .
(2.8)
Dies kommt so zustande: Lege das Dreieck ABC so, dass C der Ursprung ist, der Ortsvektor
zu A der Vektor x ist und der Ortsvektor zu B der Vektor y ist. Dann entspricht c der Vektor
x − y und aus c2 = hx − y, x − yi = hx, xi + hy, yi − 2hx, yi ergibt sich mit der Festlegung von γ
die obige Aussage.
2.4
Basiswechsel
Wir skizzieren nun einen Basiswechsel, der Einfachheit halber nur für den Fall R3 , die Verallgemeinerung auf den Rn birgt keine Extraschwierigkeiten, ist nur technisch aufwändiger. Warum
wir dies hier nach Einführung von Winkeln tun, wird schnell klar werden.
Seien also u1 , u2 , u3 und v 1 , v 2 , v 3 zwei Basen in R3 . Wir wollen von der Basis u1 , u2 , u3 zur
Basis v 1 , v 2 , v 3 wechseln. Dazu nützen wir aus, dass dann jeder Vektor ui in der neuen“ Basis
”
v 1 , v 2 , v 3 dargestellt werden kann:
uj = a1j v 1 + a2j v 2 + a3j v 3 , j = 1, 2, 3 .
Die Koeffizienten aij , i, j = 1, 2, 3, fügen wir in folgendes Schema zusammen:


a11 a12 a13
A := (aij )1 ≤i,j ≤3 := a21 a22 a23  .
a31 a32 a33
(2.9)
(2.10)
Man nennt ein solches Schema eine Matrix (der Größe 3 × 3 oder mit drei Zeilen und drei
Spalten). Diese Matrix beinhaltet also die vollständige Information für den Basiswechsel, denn
43
mit ihrer Hilfe können wir eine Darstellung eines Vektors x ∈ R3 in der alten Basis u1 , u2 , u3 in
eine Darstellung bezüglich der neuen Basis v 1 , v 2 , v 3 umrechnen.
P
Sei etwa x = 3j=1 zj uj . Dann erhalten wir mit (2.9)
x=
3
X
zj uj =
j=1
3
X
j=1
3
3
3 X
3
X
X
X
yi v i
aij zj )v i =
(
aij v i ) =
zj (
mit
yi :=
i=1 j=1
i=1
3
X
aij zj , i = 1, 2, 3 .
(2.11)
i=1
(2.12)
j=1
In (2.12) stehen die Skalarprodukte der Zeilen der Matrix A, aufgefasst als Vektoren in R3 , mit
dem Vektor z := (z1 , z2 , z3 ) . Wenn wir die Matrizenrechnung zur Verfügung haben, ist diese
Rechenoperation einfach als Matrixmultiplikation zu interpretieren.
Die umgekehrte Fragestellung ist: Erhält man mit jedem Schema A der Form (2.10) aus einer
Basis v 1 , v 2 , v 3 vermöge (2.9) eine Basis u1 , u2 , u3 . Schon eine oberflächliche Betrachtung sagt
uns, dass dies im allgemeinen nicht der Fall sein wird.
Von besonderem Interesse sind die anschaulich naheliegenden Basiswechsel, die sich aus Dre”
hungen“ des kartesischen Koordinatensystems ablesen lassen. Drei Spezialfälle sind dann auszumachen:
Es bleibt jeweils ein Basisvektor der kanonischen Basis e1 , e2 , e3 fest, die anderen
beiden werden um einen Winkel φ gedreht.
Wir setzen zur Abkürzung
c := cos(φ) , s := sin(φ)
Die drei Basen sind dann:
{(c, s, 0), (−s, c, 0), (0, 0, 1)} , {(c, 0, s), (−s, 0, c), (0, 1, 0)} , {(0, c, s), (0, −s, c), (1, 0, 0)} . (2.13)
Dass Basen vorliegen, dazu hat man nur Folgerung 2.11 heranzuziehen, denn die Orthogonalität
der Vektoren ist leicht nachzurechnen. Die zugehörigen Basiswechsel sind mit den Matrizen






c s 0
c 0 −s
1 0 0
A3 (φ) := −s c 0 , A2 (φ) := 0 1 0  , A1 (φ) := 0 c s
(2.14)
0 0 1
s 0 c
0 −s c
entlang (2.9), (2.10) verknüpft, wie man leicht überprüft.
Die Basen aus (2.14) entstehen durch Drehung des kartesischen Koordinatensystems um einen
Winkel φ, wobei eine Achse jeweils fest bleibt. Besprechen wir wieder den Fall, dass die e3 –Achse
fix bleibt. Hier findet dann eine Drehung in der Ebene, die von e1 , e2 aufgespannt wird, statt,
und zwar im Gegenuhrzeigersinn, welches der mathematisch positive ist. Diese Drehung lässt
sich wieder durch eine Matrix beschreiben, und zwar durch D3 (φ) in folgendem Sinne: w ∈ R3
wird gedreht in z := D3 (φ)w gemäß:
 
  
c −s 0
w1
z1
z2  = s c 0 w2  ,
(2.15)
w3
0 0 1
z3
{z
} | {z }
| {z } |
z
D3 (φ)
44
w
was bedeutet:
z1 = c · w1 − s · w2 + 0 · w3 , z2 = s · w1 + c · w2 + 0 · w3 , z3 = 0 · w1 + 0 · w2 + 1 · w3 . (2.16)
Hier haben wir erstmals von der Notation von Vektoren in R3 in Spaltenform Gebrauch gemacht.
In der Matrizenrechnung, und so ist (2.15) formuliert, ist dies unerlässlich“. Dort lernen wir
”
dann Matrizen wie Abbildungen aufzufassen, also die Wirkung auf (Spalten–)Vektoren, wie
dies in (2.15), (2.16) ad hoc geschehen ist. Jedenfalls ist nun vorstellbar, dass wir Drehungen
sukzessive anwenden können und daher mit der Abfolge
D3 (ρ)D2 (ψ)D1 (α)D3 (β)D2 (φ)
die Operation
Drehe um Winkel φ in der e1 − e3 –Ebene, drehe dann um den Winkel β in der
”1
e − e2 –Ebene, drehe dann . . . , drehe schlieälich um den Winkel ρ in der e1 − e2 –
Ebene.
gestalten können.
Da wir mit der Matrix A3 (φ) die neuen Basisvektoren in die alten Basisvektoren zurück”
gedreht“ haben, ist es nicht verwunderlich, dass sich die Abfolge zuerst D3 (φ), dann A3 (φ)“
”
nichts bewirkt; sie stellt die neutrale Operation dar.
Die spezielle Gestalt von D3 (φ) hat nun zur Konsequenz,
hD3 (φ)u, D3 (φ)vi = hu, vi , |D3 (φ)u| = |u| für alle u, v ∈ R3 ,
(2.17)
was ja nicht überraschend ist, da wir starr“ gedreht haben. Die Matrix D3 (φ) transformiert
”
also den Raum R3 so, dass Winkel und Längen erhalten bleiben.
Bemerkung 2.21 Die oben diskutierten Matrizen D1 (φ), D2 (φ), D3 (φ) sind Beispiele von Drehmatrizen. Sie spielen in der Mechanik der starren Körper und bei Kreiselbewegungen eine große
Rolle und sind auch interessant in der Informatik (Animation, . . . ). Auch in der Geometrie sind
sie und verwandte Objekte von großer Bedeutung, nicht zuletzt, weil sie die Eigenschaft haben,
Längen und Winkel zu erhalten.
2.5
Elementare analytische Geometrie im Raum
Hier nehmen wir zunächst die überlegungen aus Abschnitt 1.6 wieder auf, verzichten aber auf
die Pfeilnotation.
Die Geraden in R3 bringen wir in Beziehung mit der Aufgabe, zwei verschiedene Punkte P
und Q durch eine nicht gekrümmte Linie zu verbinden; diese Verbindung erscheint uns als die
kürzeste. Haben wir P, Q gegeben in Koordinaten u ∈ R3 bzw. v ∈ R3 , dann liegt es auf Grund
unserer Erfahrung mit den Konstruktionen mit dem Lineal nahe, folgende Menge hinzuschreiben:
G := {x ∈ R3 |x = u + t(v − u), t ∈ R} .
(2.18)
Jedenfalls liegt sowohl P als auch Q in G , wenn wir ihre Stellvertreter“ u, v dafür betrachten:
”
man wähle t = 0 bzw. t = 1 .
Definition 2.22
Eine Menge G ⊂ R3 heißt Gerade (in Parameterdarstellung) genau dann, wenn es p, u ∈ R3
gibt mit
G = Gp;u := {p + tu|t ∈ R}(= p + Ru) ,
45
wobei u 6= θ ist.
Gp;u heißt Gerade mit Aufpunkt p und Richtungsvektor u . Wir schreiben kurz
g : x = p + tu .
Beachte: Eine Parameterdarstellung einer Geraden ist nicht eindeutig bestimmt, man darf den
Richtungsvektor mit einem Skalar ungleich Null multiplizieren.
Man rechnet nun einfach nach, dass es durch zwei verschiedene Punkte P ′ , P ′′ nur die in
(2.18) dargestellte Gerade gibt. Zwei Geraden
g1 : x = p + tu , g2 : x = q + sv
können sich schneiden oder auch nicht. Im Falle, dass sie sich nicht schneiden unterscheidet man
die Fülle
u, v sind linear abhängig: g1 , g2 heißen parallel ;
u, v sind linear unabhängig; g1 , g2 heißen windschief.
Sind die Geraden g1 , g2 windschief, dann sind p − q, u, v linear unabhängig, was man an
α(p − q) + βu + γv = θ
durch Fallunterscheidung α = 0, α 6= 0 sofort abliest.
Den Abstand zweier windschiefer Geraden – sich schneidende Geraden haben offenbar den Abstand Null – werden wir später sehr einfach bestimmen können.
Der Abstand d von parallelen Geraden
g : x = p + tu , h : x = q + su
ist einfach auszurechnen: wir haben zu einem beliebigen Punkt w von h den Abstand zu g zu
bestimmen; wir verwenden w = q . Also ist t ∈ R so zu bestimmen, dass |w − p − tu| möglichst
klein wird. Aus
hq − p, ui2
hq − p, ui 2
2
)
+
|u|
−
|q − p − tu|2 = |u|2 (t −
|u|2
|u|2
liest man
t=
ab und wir erhalten
hq − p, ui
|u|2
d = |q − p −
hq − p, ui
u| .
|u|2
(2.19)
Hat man drei Punkte, die nicht auf einer Geraden liegen, also nicht kollinear sind, kann man
eine Ebene suchen, die diese Punkte enthält. Haben wir P, Q, R gegeben in Koordinaten u, v, w,
dann liegt es nahe, folgende Menge sich anzuschauen:
E := {x ∈ R3 |x = u + s(v − u) + t(w − u), s, t ∈ R} .
(2.20)
Jedenfalls liegen P, Q, R in E: man wähle (s, t) = (0, 0) bzw. (s, t) = (1, 0), bzw. (s, t) = (0, 1) .
46
Definition 2.23
Eine Menge E ⊂ R3 heißt Ebene (in Parameterdarstellung) genau dann, wenn es p, u, v ∈ R3
gibt mit
E = Ep;u,v := {p + tu + sv|s, t ∈ R}(= p + Ru + Rv) ,
wobei u, v linear unabhängig sind.
Ep;u,v heißt Ebene durch den Aufpunkt p mit Richtungsraum u, v.
Die Forderung der linearen Unabhängigkeit von u, v ist oben in (2.20) eingearbeitet durch die
Ausgangsforderung, dass die drei Punkte P, Q, R nicht auf einer Geraden liegen.
Beachte: Eine Parameterdarstellung einer Ebene ist nicht eindeutig bestimmt, man darf die
Richtungsvektoren u, v mit einem Skalar ungleich Null multiplizieren.
Eine Ebene kann man auch anders hinschreiben, nämlich so:
Hw,a := {x ∈ R3 |hw, xi = a} ;
dabei ist w ∈ R3 , w 6= θ, und α ∈ R . Die Umrechnung von Ep;u,v nach Hw,a und zurück
verschieben wir noch auf Abschnitt 2.5. Man nennt die Gleichung
hw, xi = a
(2.21)
die Gleichungsdarstellung der Ebene. Ist w in (2.21) auf 1 normiert, d.h. gilt |w| = 1, dann
spricht man bei (2.21) von der Ebene in Hessescher Normalform.
Die verschiedenen Darstellungsmöglichkeiten bieten auch unterschiedliche Chancen: die Parameterdarstellung ist sehr geeignet, wenn wir Punkte einer Ebene zuordnen wollen, die Gleichungsdarstellung macht es einfach, Abstände von Punkten zur Ebene auszurechnen; wir kommen darauf zurück.
Die analytische Geometrie im Anschauungsraum R3 wird in einer elementaren Betrachtung
beherrscht von vier Rechenoperationen: (Vektor–)Addition, Skalare Multiplikation, Skalarprodukt, Vektorprodukt. Bis auf das Vektorprodukt haben wir diese Rechenoperationen
schon kennengelernt. Diese Operation ist eine Spezialität“ des R3 ; in keinem der Räume R2
”
und Rn mit n ≥ 4 existiert ein direktes Analogon.
Anstelle einer Formel für das Vektorprodukt/Kreuzprodukt in R3 beschreiben wir es
zunächst durch 4 Eigenschaften: Für u, v ∈ R3 soll ein Vektor u × v ∈ R3 erklärt sein, so dass
folgende Forderungen erfällt sind:
u × (v + w) = u × v + u × w , (u + v) × w = u × w + v × w für alle u, v, w ∈ R3(2.22)
u × (av) = (au) × v = a(u × v) für alle u, v ∈ R3 , a ∈ R
u × v = −v × u für alle u, v ∈ R
1
2
e ×e
3
2
3
1
(2.23)
3
3
1
(2.24)
2
= e , e ×e = e , e ×e = e
(2.25)
Aus (2.22), . . . , (2.25) folgen:
u×u
hu, v × wi
=
=
hu, u × vi
=
u×v =θ
⇐⇒
2
|u × v|
=
θ für alle u ∈ R3
hu × v, wi für alle u, v, w ∈ R
0 = hv, u × vi
2
2
2
(2.26)
3
|u| |v| − hu, vi für alle u, v ∈ R
u, v linear unabhängig .
47
(2.27)
(2.28)
3
(2.29)
(2.30)
Zu (2.26).
θ = u × u − u × u = u × u + u × u = 2u × u .
Zu (2.27).
Da sowohl das Kreuzprodukt als auch das Skalarprodukt linear operiert in jeder Komponente,
genügt es, da jeder Vektor u ∈ R3 Linearkombination der Einheitsvektoren e1 , e2 , e3 ist, (2.27)
in dem Fall zu beweisen, in dem alle beteiligten Vektoren u, v, w Einheitsvektoren sind. Hier ist
der Nachweis aber trivial.
Zu (2.28).
Folgt aus (2.26), (2.27), denn es gilt
hu, u × vi = hu × u, vi = hθ, vi = 0 .
Zu (2.29).
Wir rechnen dies nach, indem wir die Darstellungen
u = u1 e1 + u2 e2 + u3 e3 , v = v1 e1 + v2 e2 + v3 e3 ,
ausnutzen. Damit folgt
hu, vi =
3
X
i=1
2
ui vi , |u| =
3
X
i=1
u2i ,
2
|v| =
3
X
vi2 ,
i=1
u×v =
3
3 X
X
i=1 j=1
ui vj (ei × ej ) ,
und es ergibt sich unter Berücksichtigung von (2.26)
u × v = (u1 v2 − u2 v1 )(e1 × e2 ) + (u2 v3 − u3 v2 )(e2 × e3 ) + (u3 v1 − u1 v3 )(e3 × e1 )
= (u1 v2 − u2 v1 )e3 + (u2 v3 − u3 v2 )e1 + (u3 v1 − u1 v3 )e2 .
Daher folgt nun
|u × v|2 = (u1 v2 − u2 v1 )2 + (u2 v3 − u3 v2 )2 + (u3 v1 − u1 v3 )3
3
X
2
2
2
2
2
2
ui vi )2 .
= (u1 + u2 + u3 )(v1 + v2 + v3 ) − (
i=1
Zu (2.31).
Aus u × v = θ ist gleichbedeutend mit |u||v| = |hu, vi| . Nach Bemerkung 2.6 gilt also u × v = θ
genau dann, wenn u, v linear abhängig sind.
Wir kennen nun die Länge des Vektors u × v und wissen, dass er sowohl zu u als auch zu v
senkrecht steht. Ferner haben wir nun auch eine Formel für das Kreuzprodukt abgeleitet:
u × v = (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ) falls u = (u1 , u2 , u3 ), v = (v1 , v2 , v3 ) .
(2.31)
Dies haben wir unter Verwendung der Forderungen aus (2.22),. . . , (2.25) getan. Damit ist aber
noch nicht gesagt, dass wirklich ein Objekt, das den Forderungen genügt, existiert. Aber in der
Formel (2.31) ist ein solches Objekt beschrieben! Man kann es leicht bestätigen.
Beachte: Das Kreuzprodukt ist nicht assoziativ (e1 × (e2 × e2 ) = θ, (e1 × e2 ) × e2 = −e1 ).
Das Kreuzprodukt zweier Vektoren u, v hat die Bedeutung eines (orientierten) Flächeninhaltes. Dies sieht man so: Seien u, v ∈ R3 . Aus der Elementargeometrie wissen wir, dass der
Flächeninhalt des Parallelogramms, das von u, v aufgespannt wird (siehe Abbildung 2.4), als
F = |v||h| mit |h| = |u|| sin(φ)|
48
sich berechnet; siehe Abbildung 2.4. Wir ersetzen sin(φ) unter Verwendung von cos(φ)2 +
sin(φ)2 = 1 und erhalten
F 2 = |u|2 |v|2 (1 − cos(φ)2 ) = |u|2 |v|2 (1 −
hu, vi2
) = |u|2 |v|2 − hu, vi2 = |u × v|2 .
|u|2 |v|2
Also ist |u × v| gerade der Flächeninhalt des von u, v aufgespannten Parallelogramms. Bei Vertauschung von u, v bleibt der Flächenbetrag erhalten, das Vorzeichen ändert sich. Insbesondere
verschwindet in übereinstimmung mit der Anschauung u × v nicht, wenn u, v lineare unabhängig
sind (Keine Gleichheit in der Cauchy-Schwarzschen Ungleichung).
Zu Vektoren u, v ∈ R3 können wir nun die drei Vektoren u, v, u × v betrachten und sie unter
Umständen als Koordinatensystem in R3 verwenden.
Satz 2.24
Sind u, v linear unabhängig, dann bilden u, v, u × v eine Basis in R3 .
Beweis:
u, v, u × v sind linear unabhängig, denn aus au + bv + cu × v = θ folgt durch Bildung des
Skalarprodukts mit u × v sofort c|u × v|2 = 0. Da u, v linear unabhängig sind, verschwindet
u × v nicht; siehe (2.31). Also gilt c = 0, und da u, v linear unabhängig sind, auch schließlich
a = b = 0.
u, v, u × v ist ein Erzeugendensystem von R3 , denn damit für x ∈ R3 eine Darstellung x = au +
bv+cu×v gilt, hat man nur c := hx, u×vi|u×v|−2 zu setzen und a, b mit hx, ui = ahu, ui+bhv, ui
und hx, vi = ahu, vi + bhv, vi zu berechnen; letzteres ist leicht möglich, da |u|2 |v|2 − hu, vi2 6= 0
gilt nach (2.31).
Nun können wir die noch nicht abschließend elementar geklärte Frage, ob es in R3 nicht 4
linear unabhängige Vektoren geben kännte, was natürlich der Aussage dim R3 = 3 widersprüche,
angehen; siehe Satz 2.17 und Folgerung 2.18. Mit unseren Mitteln können wir dies nun einfach
erledigen.
Seien u, v, w, z vier Vektoren in R3 . Wir wollen zeigen, dass sie linear abhängig sind. Wir dürfen
dabei o.E. annehmen, dass u, v linear unabhängig sind. Dann ist nach Satz 2.24 u, v, u × v eine
Basis in R3 .
Ist etwa hz, u × vi = 0, dann ist z = au + bv und aus
θ = au + bv + 0w − z
liest man ab, dass u, v, w, z linear abhängig sind.
Ist nun hz, u × vi =
6 0, hw, u × vi =
6 0, dann ist
z = au + bv + cu × v, w = αu + βv + γu × v, mit c, γ 6= 0 .
Aus
θ = (aγ − αc)u + (bγ − βc)v + cw − γz
liest man ab, dass u, v, w, z linear abhängig sind.
In der Physik werden viele Größen mit Hilfe des Vektorprodukts beschrieben. Wir geben zwei
Beispiele dafür:
Drehmoment Das Drehmoment M eines Massenpunktes am Ort x, an dem eine Kraft F
angreift, ist gegeben durch M = x × F .
Drehimpuls Der Drehimpuls L eines Massenpunktes am Ort x mit Impuls p ist gegeben durch
L := x × p .
49
Den Ausdruck hu × v, wi bezeichnet man als Spatprodukt der Vektoren u, v, w ; beachte, dass sich
das Vorzeichen ändert, wenn etwa eine Vertauschung
u
u+v
von u, v vorgenommen wird. Bilden nun die Vek3
toren u, v, w eine Basis von R , so ist der Betrag
h
des Spatprodukts gerade das Volumen des durch
ϕ
u, v, w aufgespannten Parallelepipeds, d.h. eines
v
Hexaeders (Sechsflächners), dessen gegenüberliegende Seiten jeweils parallel sind; man bezeichnet es
Abbildung 2.4: Parallelogramm
auch als Spat. Dies ergibt sich daraus, dass der
Grundfächeninhalt sich als |u × v| ergibt. Da u × v
senkrecht auf der von u, v aufgespannten Fläche steht, ist die Höhe h des Parallelepipeds gegeben
durch
|hw, u × vi|
.
h := |w|
|w||u × v|
Daraus liest man die Volumenformel nun ab.
Bemerkung 2.25 Im Abschnitt 2.6 haben wir den Basiswechsel kennengelernt. Es blieb die
Frage, wie man eine Matrix A – siehe (2.10) – testen kann, ob sie wirklich einen Basiswechsel
beschreibt. Dieses Hilfsmittel haben wir nun zur Hand: Man begreife die Spalten der Matrix A als
Vektoren u1 , u2 , u3 in R3 , etwa u1 = (a11 , a21 , a31 ), und bilde das Spatprodukt b := hu1 × u2 , u3 i;
verschwindet b nicht, dann führt A in der beschriebenen Weise zu einem Basiswechsel. Dies ist
leicht einzusehen.
Bemerkung 2.26 Das Spatprodukt für die Einheitsvektoren e1 , e2 , e3 ergibt erwartungsgemäß
1. Vertauscht man aber e1 und e2 , so erhält man -1. Man sagt, dass das Koordinatensystem
e1 , e2 , e3 , welches mit der Dreifingerregel der rechten Hand (Daumen: e1 –Achse, Zeigefinger: e2 –
Achse, Mittelfinger: e3 –Achse) beschrieben werden kann, ein Rechtssystem und positiv ist. Bei
Vertauschung von e1 und e2 muss man dann zur Dreifingerregel der linken Hand greifen.
Satz 2.27
Sei p ∈ R3 und seien u, v ∈ R3 linear unabhängig. Dann gilt:
Ep;u,v = Hu×v,hu×v,pi
Beweis:
Zunächst ist festzuhalten, dass u × v nicht der Nullvektor ist, da u, v linear unabhängig sind.
Sei x ∈ Ep;u,v . Dann gilt x = p + tu + sv mit t, s ∈ R. Daraus folgt hu × v, xi = hu × v, pi =: a .
Sei x ∈ Hu×v,hu×v,pi . Dann ist hu × v, x − pi = 0 und daher – siehe Satz 2.24 – x − p ∈ span(u, v),
d.h. x − p = tu + sv für t, s ∈ R .
Etwas unangenehmer ist es, eine Ebene Hw,a in eine Form Ep;u,v umzuwandeln. Dazu eine
Vorbereitung.
Sei w ∈ R3 , w 6= θ . Wir nehmen an, dass |w| = 1 gilt. Dies können wir erreichen durch Skalierung.
Nun können wir u, v ∈ R3 finden mit
1 = |w| = |u| = |v| , hu, wi = hu, vi = hv, wi = 0 .
(2.32)
Dies machen wir so:
1. Fall: Ist hw, e1 i = 0, setze u := e1 .
2. Fall: Ist hw, e1 i =
6 0, dann setze u an mit u = ae1 + be2 und suche a, b so, dass |u| = 1 und
hu, wi = 0 gilt. Dies ist leicht erreichbar.
50
Nun setzen wir noch v := u × w und wir sind fertig. Beachte, dass nun die Vektoren u, v, w eine
Basis in R3 bilden.
Sei nun eine Ebene Hw,a vorgelegt. Wir bestimmen Vektoren u, v ∈ R3 , so dass u, v, w eine
Basis von R3 ist und
hu, wi = hu, vi = hv, wi = 0
gilt, also w, u, v eine Orthogonalbasis bildet. Also kann insbesondere jeder Vektor in R3 als
Linearkombination von u, v, w geschrieben werden:
x = hx, uiu + hx, viv + hx, wiw , x ∈ R3 .
Ist nun x ∈ Hw,a , dann ergibt sich
a = hw, xi = hx, wihw, wi d. h. hx, wi =
Also haben wir
Hw,a = {x ∈ R3 |x =
da s = hx, ui, t = hx, vi beliebig sind.
a
.
hw, wi
a
w + su + tv, s, t ∈ R},
hw, wi
Wir haben nun
Hw,a = Ep,u,v ,
wobei w senkrecht auf den Vektoren u, v steht, die den Richtungsraum aufspannen. w heißt
deshalb auch ein Normalenvektor.
Liegt die Ebene in Hessescher Normalform vor, dann ist der Abstand eines Punktes x ∈ R3 von
der Ebene gegeben durch |a − hx, wi| , denn dies ist der Abstand des Fussunktes des Lotes vom
Ursprung auf die Ebene.
Bemerkung 2.28 Oben haben wir kennengelernt, wie man einen Vektor w ∈ R2 zu einer
orthogonalen Basis in R3 ergänzen kann.
Den Abstand paralleler Geraden haben wir schon bestimmt. Wir wollen nun noch den Abstand windschiefer Geraden bestimmen. Seien also zwei windschiefe Geraden
g : x = p + tu , x = q + sv
gegeben; u, v sind also linear unabhängig. Dann sind, wie wir schon wissen, p − q, u, v linear
unabhängig. Um den Abstand auszurechnen, haben wir y auf g und z auf h zu finden, so dass
w := y − z orthogonal zu g und h ist, d.h. orthogonal zu u und v ist. Einen solchen Vektor w
kennen wir: w = u × v . Also berechnet sich der Abstand d der beiden Geraden aus
d = |αu × v| mit α|u × v|2 =
hp − q, u × vi
, da αw = u × v = p − q + tu + sv .
|u × v|2
Für ein Paar von zwei Geraden gibt es bekanntlich vier Möglichkeiten: die Geraden sind
identisch; die Geraden sind parallel, d.h. die zugehörigen Richtungsvektoren sind linear abhängig;
sie schneiden sich in einem Punkt; sie sind weder identisch, noch parallel, noch schneiden sie
sich, sie sind windschief. Ähnliche Fälle sind jeweils für zwei Ebenen, eine Ebene und eine
Gerade, eine Punkt und eine Gerade, ein Punkt und eine Ebene zu diskutieren. Ohne Rechnung
geht dies nicht!
51
Mit dem Vektorprodukt ist es möglich, auch sphäri”
sche“ Objekte, also Objekte auf der Kugeloberfläche
in R3 zu studieren. Etwa erhält man im sphärischen
Dreieck ABC (siehe Abbildung 2.5) Formeln für die
Winkel, die als Winkel zwischen Ebenen zu verstehen sind:
cos(α) =
| sin(α)| =
2.6
ha × b, a × ci
|a × b||a × c|
|(a × b) × (a × c)|
|a × b||a × c|
C
c
b
a
(2.33)
(2.34)
α
A
B
Abbildung 2.5: Sphärisches Dreieck
Anhang: Elementare analytische Geometrie in der Ebene
Hier betrachten wir die Fragen, die wir im letzten Abschnitt betrachtet haben, für den Spezialfall,
dass wir uns auf die Ebene zurückziehen dürfen. Hauptunterschied wird sein, dass wir keinen
Gebrauch vom Kreuzprodukt machen.
Definition 2.29
Eine Teilmenge L von Rn heißt Gerade, falls es p, w ∈ Rn , w 6= θ, gibt mit
L = Lp,w := {p + tw|t ∈ R} .
Der Vektor w heißt Richtungsvektor von L .
Ist L eine Gerade und P ein Punkt in R2 , so verwenden wir die Sprechweisen:
Der Punkt P liegt auf L, P gehört L an, P liegt auf L, P ∈ L, P ist ein Punkt der
Geraden L, die Gerade L geht durch den Punkt P, P inzidiert mit L
synomym. Die letzte Sprechweise P inzidiert mit L“ führt den Begriff der Inzidenz ein, einen
”
Begriff, der in der axiomatisch betriebenen Geometrie ganz am Anfang neben den Begriffen
Punkte, Geraden“ steht.
”
Mitunter benötigen wir den Sachverhalt, dass wir
den Koordinatenursprung verschieben wollen. Dass
sich dies mit den Figuren Geraden“ verträgt, ist
”
festgehalten in
x
Beispiel 2.30 Jede Translation
τp : Rn ∋ x 7−→ x + p ∈ Rn (p ∈ Rn )
bildet eine Gerade Lq,w offenbar auf die Gerade
Lτp (q),w ab (Geradentreue einer Translation). x
Eine hilfreiche Konstruktion in der euklidischen
Ebene ist die Orthogonalisierung:
R2 ∋ x = (x1 , x2 ) 7−→ x⊥ := (−x2 , x1 ) ∈ R2
52
Abbildung 2.6: Orthogonalisierung
Der Begriff Orthogonalisierung“ leitet sich aus der Tatsache ab, dass stets hx, x⊥ i = 0 gilt, wie
”
man leicht nachrechnet. Der Winkel zwischen x und x⊥ ist also ein rechter Winkel, d.h. x, x⊥
stehen stets senkrecht aufeinander.
Die Figur in Abbildung 2.6 zeigt, dass x⊥ aus x durch Drehung um einen rechten Winkel
hervorgeht. Dies deckt sich mit der Tatsache, dass e2 = (e1 )⊥ ist. Diesen Drehsinn, den Gegenuhrzeigersinn, wollen wir in R2 stets als positiv auszeichnen. Bilden wir dann noch (x⊥ )⊥ = −x,
so sagen wir, dass x und −x einen gestreckten Winkel bilden.
Wir definieren noch
[· , ·] : R2 × R2 ∋ (x, y) 7−→ hx⊥ , yi ∈ R
und listen damit folgende Regeln auf:
Rechenregeln 2.31
hx, x⊥ i = 0 , (x⊥ )⊥ = −x , |x⊥ | = |x| für alle x ∈ R2 .
⊥
⊥
2
hx, y i = −hx , yi für alle x, y ∈ R .
⊥
⊥
2
[x, y] = −[y, x] , [x , y ] = [x, y] für alle x, y ∈ R .
2
2
hx, yi + [x, y]
2
2
2
= |x| |y| für alle x, y ∈ R .
2
[x, y]z + [y, z]x + [z, x]y = θ für alle x, y, z ∈ R .
(2.35)
(2.36)
(2.37)
(2.38)
(2.39)
Man verifiziert diese Regeln ganz ohne Mühe.
Satz 2.32
Ist x ∈ R2 \{θ}, so ist x, x⊥ eine Basis von R2 , d.h. zu jedem z ∈ R2 gibt es genau ein Zahlenpaar
(a, b) ∈ R2 mit
z = ax + bx⊥ .
Beweis:
Nach Regel (2.39) gilt [x, x⊥ ]z = −[x⊥ , z]x − [z, x]x⊥ . Da [x, x⊥ ] = hx⊥ , x⊥ i =
6 0 gilt nach
⊥
Voraussetzung, haben wir nach Division mit [x, x ] in der Darstellung a, b bereits gefunden. Die
Eindeutigkeit folgt aus
z = ax + bx⊥
durch Multiplikation“ mit x bzw. x⊥ so:
”
hz, xi = ahx, xi , hz, x⊥ i = bhx⊥ , x⊥ i ,
Die im obigen Satz verwendete Definition einer Basis deckt sich nicht mit der Definition
6.55, aber man sieht sehr einfach ein, dass beide äquivalent sind. Man beachte dabei, dass drei
Vektoren wegen Regel (2.39) stets linear abhängig sind. Also kommt für die Dimension von R2
nur die Zahl 2 in Frage, denn ein Vektor ist in R2 kein Erzeugendensystem.
Satz 2.32 liefert uns ganz viele“ Basen von R2 . Beachte aber, dass nicht jede Basis so
”
zustande kommt. Etwa ist auch e1 , e1 + e2 eine Basis, aber e1 , e1 + e2 sind nicht orthogonal.
Oben haben wir die Figur Gerade“ in der Parameterdarstellung Lp,w kennengelernt: Para”
meter von Lp,w sind der Vektor p und der Richtungsvektor w . Eine andere Darstellungsmöglichkeit für die Figur Gerade“ ist die Gleichungsdarstellung:
”
Hz,α := {x ∈ R2 |hz, xi = α} , z 6= θ .
Es handelt sich hier wirklich um die gleichen Objekte. Dies ist im folgenden Satz festgehalten:
53
Satz 2.33
Es gilt für p, w, z ∈ R2 , w 6= θ, z 6= θ, und α ∈ R :
Lp,w = Hw⊥ ,hw⊥ ,pi , Hz,α = L(α|z|−2 )z,z ⊥
(2.40)
Beweis:
Zu Lp,w = Hw⊥ ,hw⊥ ,pi . Sei w = (w1 , w2 ) und sei etwa w1 6= 0 .
Sei x ∈ Lp,w , also x = p + tw mit t ∈ R . Es ist
hw⊥ , xi = −w2 (p1 + tw1 ) + w1 (p2 + tw2 ) = −w2 p1 + w1 p2 = hw⊥ , pi,
also x ∈ Hw⊥ ,hw⊥ ,vi .
Sei x ∈ Hw⊥ ,hw⊥ ,vi , d.h. −w2 x1 + w1 x2 = −w2 p1 + w1 p2 . Setze t := (x1 − p1 )w1−1 . Dann gilt
x1 = p1 + tw1 und
p2 + tw2 = p2 + (x1 w2 − p1 w2 )w1−1 = p2 + (w1 x2 − w1 p2 )w1−1 = x2 ,
also x ∈ Lp,w .
Die zweite Identität ist genauso einfach zu verifizieren.
Die obige Aussage kann man nun dahingehend deuten, dass man die Figuren, die wir Geraden
nennen, auch mit den linearen Gleichungen identifizieren können, denn x ∈ Hz,α ist äquivalent
mit dem Erfülltsein der Gleichung z1 x1 + z2 x2 = α . Eine solche Gleichung heißt linear, da x1 , x2
genau in erster Potenz eingehen.
Satz 2.34
(a) Jede Gerade enthält unendlich viele Punkte.
(b) Durch jeden Punkt gehen unendlich viele Geraden.
(c) Durch zwei verschiedene Punkte geht genau eine Gerade.
(d) Zwei verschiedene Geraden haben entweder keinen oder genau einen Punkt gemeinsam.
Beweis:
Zu(a). Dies folgt aus der Tatsache, dass für eine Gerade g = Lp,w stets w 6= (0, 0) vorausgesetzt
ist und R unendlich viele Elemente enthält.
Zu (b). Folgt aus (c), da R2 unendlich viele Punkte enthält.
Zu (c). Seien P, Q ∈ R2 mit Koordinaten x = (x1 , x2 ) bzw. y = (y1 , y2 ) . Setze w := x− y, v := x.
Dann ist x = x + 0 · w , y = x + (−1) · w , also x, y ∈ Lv,w , d.h. P, Q liegen in Lv,w . Also ist die
Existenz einer verbindenden“ Gerade gezeigt, die Eindeutigkeit folgt aus (d).
”
Zu (d). Seien Lp,w , Lq,u verschiedene Geraden. Ist Lp,w ∩ Lq,u = ∅, so ist nichts mehr zu zeigen.
Sei nun Lp,w ∩ Lq,u 6= ∅ und z ∈ Lp,w ∩ Lq,u . Dann können wir o.E. annehmen p = q = z . Also
ist zu zeigen Lz,w ∩ Lz,u = {z} . Ist hw, u⊥ i = 0, dann ist nach Satz 2.32 u = aw mit einem
a ∈ R\{0} und daher sicherlich Lz,w = Lz,u im Widerspruch zur Tatsache, dass die beiden
Geraden verschieden sind. Also ist < w, u⊥ > 6= 0 . Sei y ∈ Lz,w ∩ Lz,u . Dann ist
y = z + tw = z + su, d.h. thw, u⊥ i = 0 , −shu, w⊥ h= 0 ,
also t = s = 0 und damit u = z .
Im Beweis zu Satz 2.34 haben wir bereits Schnittpunkte von Geraden ausgerechnet. Halten
wir dies etwas allgemeiner fest.
54
Schnittformel (I):
Geraden Lp,w , Lq,u
• Voraussetzung: [w, u] 6= 0 .
• Schnittpunkt: Lp,w ∩ Lq,u =
Schnittformel (II):
([q, u]w − [p, w]u)
[w, u]
Geraden Lp,w , Hz,α
• Voraussetzung: hw, zi =
6 0.
• Schnittpunkt: Lp,w ∩ Hz,α = p +
Schnittformel (III):
Geraden Hz,α , Hy,β
• Voraussetzung: [z, y] 6= 0 .
• Schnittpunkt: Hz,α ∩ Hy,β =
α − hp, zi
w
hw, zi
βz ⊥ − αy ⊥
[z, y]
Definition 2.35
Zwei Geraden g, h heißen parallel, wenn g = h oder g ∩ h = ∅ gilt. Wir schreiben dann gkh . Folgerung 2.36
Zwei Geraden g = Lp,w , h = Lq,u sind parallel genau dann, wenn hw, u⊥ i = 0 gilt.
Beweis:
Seien g, h parallel. Ist g = h, dann ist w = u = x − y für zwei Punkte x, y ∈ g, also hw, u⊥ i =
hw, w⊥ i = 0 . Ist g ∩ h = ∅ , dann haben wir hw, u⊥ i = 0 im Beweis zu Satz 2.34 (d) mitbewiesen.
Gilt hw, u⊥ i = 0, dann ist u = rw mit r ∈ R . Dann folgt aber g ∩ h = ∅ oder g = h .
Bemerkung 2.37 Durch die Relation
g ∼ h : ⇐⇒ gkh
wird auf der Menge der Geraden in R2 eine Äquivalenzrelation erklärt; siehe dazu Abschnitt 5.2.
Dies sieht man so:
Reflexivität und Symmetrie sind nahezu trivial. Zur Transitivität. Sei gkh, hkk . Seien g =
Lp,w , h = Lq,u , k = Lr,y . Dann gilt nach Folgerung 2.36 hw⊥ , ui = hu⊥ , yi = 0 . Daraus folgt
hw⊥ , yi = 0 und daher gkk mit Folgerung 2.36.
Die folgende Eigenschaft der Anschauungsebene ist das berühmte Parallelenpostulat.
Folgerung 2.38
Zu jeder Geraden g und zu jedem Punkt P in R2 , der nicht auf der Geraden g liegt, existiert
genau eine Gerade h mit P ∈ h und hkg .
Beweis:
Sei x := (x1 , x2 ) der Koordinatenvektor von P und sei g = Lp,w . Setze h := Lx,w . Eine weitere
Gerade h durch P kann es wegen Folgerung 2.36 nicht geben. 4
Das Lot von einem Punkt P ∈ R2 mit Koordinaten p auf eine Gerade Hz,α (z 6= θ !) ist
die Gerade durch P, die auf Hz,α senkrecht steht. Da Hz,α die Richtung w := z ⊥ hat (siehe
Satz 2.33), erhält man das Lot durch P in der Form Lp,z . Die Koordinaten y des Fußpunkt
4
Bei Euklid ist die Aussage von Folgerung 2.38 mehr oder minder ein Postulat. Man hat immer wieder versucht,
dieses Parallelenpostulat aus den übrigen angegebenen Axiomen, die den Aussagen von (a)–(d) aus Satz 2.34
entsprechen, herzuleiten, es also als Satz zu formulieren und in Menge der Axiome überflüssig zu machen.
55
F dieses Lotes, also des Schnittpunktes des Lotes mit der Geraden Hz,α , berechnet sich nach
Schnittformel (II) zu
α − hz, pi
y =p+
z
hz, zi
Der Abstand des Punktes P von der Geraden Hz,α ist
|p − y| =
| α − hz, pi|
.
|z|
(2.41)
Satz 2.39 (Hessesche Normalform)
Hat eine Gerade g die Form Hz,α mit |z| = 1, so hat ein Punkt P ∈ R2 mit Koordinaten p den
Abstand | α − hz, pi| von dieser Geraden.
Beweis:
Siehe Gleichung (2.41).
Die Hessesche Normalform lässt eine geometrische
Deutung der Konstanten α bei einer Geraden Hz,α
zu: Der Ursprung O hat von dieser Geraden den
Abstand |α|.
Der Flächeninhalt eines Dreiecks mit den Ecken
A, B, C mit den Koordinaten x, y, z ∈ R2 ist
nach elementar–geometrischer Überlegung gleich
dem halben Produkt von Grundlinie und Höhe. Dies
verifizieren wir nun in neuem Kontext.
Die Länge hC der Höhe durch C ist gleich
dem Abstand des Punktes C von der Geraden
g durch A, B, d.h. von der Geraden Lx,y−x bzw.
H(y−x)⊥ ,hy−x,xi . Also gilt nach (2.41)
hC =
1
(x,y)
α
s
β
α
r
1
Abbildung 2.7: Additionstheorem
1
1
|h(y−x)⊥ , zi−h(y−x)⊥ , xi| , d.h. hC =
|hy ⊥ −x⊥ , z−xi| .
|y − x|
|y − x|
Hier ist
hy ⊥ − x⊥ , z − xi = hy ⊥ , zi − hy ⊥ , xi − hx⊥ , zi = [x, y] + [y, z] + [z, x].
Führt man also die Abkürzung
[x, y, z] := [x, y] + [y, z] + [z, x] = [x − z, y − z]
ein, so erhält man für die Länge hC der Höhe durch C schließlich
hC =
|[x, y, z]|
,
|x − y|
und der Flächeninhalt FABC des Dreiecks mit den Ecken A, B, C ergibt sich als
1
FABC = [x, y, z] .
2
(2.42)
(2.43)
Als Konsequenz lesen wir ab: Drei Punkte liegen auf einer Geraden genau dann, wenn in den
Koordinaten [x, y, z] = 0 gilt. Für den Flächeninhalt FOABC eines Parallelogramms mit den
Ecken O, A, B, C – die Koordinaten seien θ, x, y, x + y – gilt:
FOABC = 2FOAB = |[x, y]| .
56
(2.44)
Als ein Beispiel, wie man elementar mit den trigonometrischen Funktionen argumentieren
kann, führen wir die Additionsformeln
sin(α + β) = sin(α) cos(β) + cos(α) sin(β)
(2.45)
cos(α + β) = cos(α) cos(β) − sin(α) sin(β)
(2.46)
Dabei lässt sich etwa das Additionstheorem (2.45) für Winkel mit α + β ≤ π/2 anhand der
nebenstehenden Abbildung 2.7 begränden. Der Punkt (x, y) auf dem Einheitskreis entspricht
dem Winkel α + β . Also gilt sin(α + β) = y . Nun bieten sich die Zerlegung y = r + s an, wobei
das Dreieck im Sektor des Winkels α
sin(α) =
r
cos(β)
erkennen lässt. Mit Scheitel im Punkt (x, y) gibt es ebenfalls einen Winkel mit Maß α . Die
Schenkel dieses Winkels stehen nämlich paarweise senkrecht auf dem urspränglichen Winkel mit
Maßzahl α . Im obigen rechtwinkligen Dreieck gilt
cos(α) =
s
.
sin(β)
Damit hat man insgesamt (2.45) gezeigt.
2.7
Anhang: Kegelschnitte
Betrachten wir hier nur ebene Kurven, also Kurven in der euklidischen Ebene R2 . Die analytische Geometrie gestattet es, Kurven durch analytische Beziehungen zwischen den Koordinaten
ihrer Punkte zu beschreiben. Bei Verwendung des üblichen rechtwinkligen Koordinatensystems
— hier schreiben wir anstatt (x1 , x2 ) stets (x, y) — haben wir:
(a) die implizite Darstellung in der Form einer Gleichung f (x, y) = c;
(b) die explizite Darstellung y = f (x);
(c) die Parameterdarstellung x = ϕ(t), y = ψ(t);
Die mechanische Auffassung wird in (c) deutlich: t wird als Zeit aufgefasst. Die Bahn des Punktes
ergibt sich als {(ϕ(t), ψ(t))|t ∈ I}, wobei I das Intervall der zulässigen (zur Verfügung stehenden)
Zeit ist.
Beispiel 2.40 Für die Kreislinie hat man folgende Darstellungen:
(a) implizite Darstellung: x2 + y 2 = r 2 ;
√
(a) explizite Darstellung: y = ± r − x2 , |x| ≤ r ;
(a) Parameterdarstellung: x = r cos(t), y = r sin(t), t ∈ [0, 2π) . Hier stehen wir noch nicht auf
einem sicherem Fundament, da Sinus– und Kosinusfunktion noch nicht eingeführt sind.
Die Kurven Ellipse, Parabel, Hyperbel sind von besonderem Interesse. Sie können gemeinsam definiert werden durch:
57
Ein Kegelschnitt C zum Parameter ε ist der geometrische Ort der Punkte P , deren
Distanz von einem festen Punkt F das ε–fache der Distanz von einer festen Gerade
g ist.
ε heißt Exzentrizität, der Punkt F heißt Brennpunkt und g heißt Leitgerade. Diese Bezeichnungen gehen auf Apollonius zurück, sie sind festgehalten in der Abbildung 2.8. Die Definition,
die wir gegeben haben, ist die des geometrischen Ortes: Die Punkte der Kurve werden durch
eine Beschreibung durch geometrische Forderungen gegeben.
Sei g′ die Gerade durch F parallel zur Leitgeraden g
und sei h die Gerade durch F senkrecht zur Geraden
g. Offenbar ist der geometrische Ort C nun symmetrisch zu h. Dann liegt auf g′ eine Strecke |LL′ |,
deren Endpunkte L und L′ auf dem geometrischen
Ort C liegen, denn es gibt sicher Punkte L, L′ auf
der Geraden g′ mit |F L| = |F L′ | = εdist(F, g) . Sei
l := |F L| = |F L′ |. Wir haben nun definitionsgemäß
g
L
P
h’
l
F
l = |F L| = ε|LH|
wobei H der Schnittpunkt der Geraden h′ durch L,
parallel zu h, ist. Durch g′ , h wird ein rechtwinkliges
Koordinatensystem mit Ursprung F vorgelegt. Für
einen Punkt P des geometrischen Ort C mit den
kartesischen Koordinaten (x, y) haben wir
H
K
h
L’
Abbildung 2.8: Kegelschnitte
r = |F P | = ε|P K| = l − εx ,
(2.47)
wobei K der Schnittpunkt der Geraden h′′ durch P parallel zu h ist. Man erhält
x2 + y 2 = (l − εx)2
Ist ε 6= 1, erhalten wir mit a :=
(2.48)
l
1 − ε2
(x + εa)2 y 2
+
=1
la
a2
(2.49)
und wir erkennen, dass hier die Gleichungen für eine Ellipse oder Hyperbel stehen, allerdings
nicht symmetrisch zum Ursprung.
Ist ε = 1, erhalten wir
y 2 = l2 − 2lx
(2.50)
und wir erkennen die Gleichung einer Parabel.
Nun gehen wir auf die verschiedenen Typen in einer Standardform“ ein.
”
Ellipse
x2 y 2
+ 2 = 1 (a ≥ b > 0) .
a2
b
Ist a = b, dann haben wir den Kreis
als
geometrischen
Ort vor uns.
√
2
2
Sei etwa a > b. Wir setzen c := a − b , tragen auf der x−Achse die Punkte F1 , F2 mit den
Koordinaten (−c, 0) bzw. (c, 0) ein; dies sind die Brennpunkte (siehe unten) der Ellipse. Die
Ellipse ist nun also der geometrische Ort aller Punkte, für die die Summe der Abstände von F1
58
und F2 konstant (gleich 2a) ist. Denn es gilt für einen Punkt P mit den Koordinaten (x, y) die
Ellipsengleichung genau dann, wenn
|(x, y) − (−c, 0)| + |(x, y) − (c, 0)| = 2a
q
q
2
2
gilt. (Die Verifikation gelingt ausgehend von (x + c) + y = 2a− (x − c)2 + y 2 sehr schnell.)
Diese Tatsache entspricht der sogenannten Gärtner–Konstruktion einer Ellipse: Ein Seil der
Länge 2a wird in den Brennpunkten (−c, 0), (c, 0) eingepflockt und zu einem Dreieck F1 F2 P
gespannt; in P gleitet bei gespanntem Seil ein Stab entlang. Dieser 3. Punkt P beschreibt dann
eine Ellipse mit Exzentrizität ε := ac .
Klären wir nun die Bezeichnung Brenn”
punkt“ auf. Dazu schicken wir folgende Betrachtung voraus, die aus Abbildung 2.9 abzulesen ist.
,
F
P
2
Ist P ein Punkt auf der Ellipse, so verlängern
wir die Strecke |F1 P | über P hinaus bis zu ei.
2a
F1
F2
nem Punkt F2′ so, dass |F1 F2′ | = 2a gilt. Das
Dreieck F2 P F2′ ist nun gleichschenklig, da ja
|F1 P | + |P F2 | = 2a und daher |P F2′ | = |P F2 |
gilt. Die Winkelhalbierende t von ∢ (F2 P F2′ )
ist also auch Lot von P auf die Verbindungsstrecke von |F2 F2′ | . Der Punkt P liegt auf t
Abbildung 2.9: Ellipsennormalen
und t enthält keinen weiteren Punkt, denn
ist Q 6= P ein Punkt der Tangente, so gilt
|QF2 | = |QF2′ | und aufgrund der Dreiecksungleichung (unter Heranziehung des Dreiecks F1 QF2′ )
haben wir
|P F1 | + |P F2 | = 2a = |F1 F2′ | < |QF1 | + |QF2′ | = |QF1 | + |QF2 | .
Daher ist t Tangente an die Ellipse in P. Die zu t senkrechte Gerade durch P , die wir Normale
an die Ellipse in P nennen, ist Winkelhalbierende im Winkel ∢ (F1 P F2 ). Wir haben also gezeigt:
Satz 2.41
In jedem Ellipsenpunkt P wird der Winkel ∢ (F1 P F2 ) von der Ellipsennormale halbiert.
Aus Satz 2.41 ergibt sich nun, dass ein von F1 ausgehender Strahl an der Ellipse bzw. an der
Ellipsentangente so reflektiert wird, dass der reflektierte Strahl durch F2 verläuft. Ein von außen
auf die Ellipse treffender Strahl, dessen Verlängerung durch F1 verläuft, wird so reflektiert, dass
die Verlängerung des reflektierten Strahls durch F2 verläuft. Eine entsprechende Eigenschaft hat
ein Ellipsoid. Dies ist die Figur, die im Raum entsteht, wenn wir eine Ellipse um eine ihrer
Achsen rotieren lassen. Hat ein Gewölbe in einem Bauwerk die Form eines Halbellipsoids, so
kann ein Ton, der in F1 erzeugt wird, in F2 besonders gut gehört werden; man spricht daher
bei solchen Gewölben von Flüstergewölben. Diese Eigenschaft macht man sich auch bei der
Bündelung“ von Ultraschallwellen bei der Zertrümmerung von Nierensteinen zunutze.
”
Analytisch–geometrisch erhält man eine Ellipse aus einem Kreis x2 + y 2 = b2 durch die
Koordinatentransformation
a
(2.51)
u := x , v := y,
b
denn es resultiert in den Koordinaten u, v die Gleichung
u2 v 2
+ 2 = 1.
a2
b
59
(2.52)
Die Transformation (2.51) ist eine affine Transformation; man sagt, dass eine Ellipse ein affines
Abbild eines Kreises ist. Die Abbildung 2.10 gibt dies wieder. Sie enthält auch gleichzeitig eine
Möglichkeit, eine Ellipse aus einem Kreis heraus zu zeichnen. Die Lösungsmenge von (2.52) lässt
sich als Kurve auffassen und so parametrisieren:
u = a cos(φ), v = b cos(φ) , φ ∈ [0, 2π) .
Bemerkung 2.42 Mit der obigen Idee, eine Ellipse als affines Bild eines Kreises aufzufassen,
kann man heuristisch sehr schnell auf die Formel für den Flächeninhalt einer Ellipse kommen.
Um einen Kreis mit Radius b mit Quadraten der Seitenlänge h zu überdecken, benötigt man
2
etwa Nh := πb2 Quadrate. Im affinen Bild der Ellipse benötigt man Nh Bilder dieser Quadrate
h
(Rechtecke), die nun die Fläche a h2 haben. Also ist die Fläche FE der Ellipse gegeben durch
b
a
FE = Nh · h2 , d.h. FE = πab;
b
eine Formel, die korrekt ist.
Gestützt auf die astronomischen Beobachtungen von Tycho de Brahe5 entdeckte J. Kepler6 ,
dass sich die Planeten um die Sonne nicht auf
Kreisbahnen, sondern auf elliptischen Bahnen
mit der Sonne im Brennpunkt bewegen. Er konnte damit und mit quantitativen Aussagen über
Umlaufzeiten das heliozentrische kopernikanische
System stützen. Die Halbachsen der Bahnellipse
verhalten sich im Falle der Erde wie 7200 zu 7199
(Exzentrizität ǫ = 0, 017), so dass es verständlich erscheint, dass N. Kopernikus7 die Umlaufbahn der Erde um die Sonne noch für einen Kreis
hielt. Im Falle der Marsbahn ist Exzentrizität Abbildung 2.10: Die Ellipse als affines Bild
noch kleiner: ǫ = 0, 0007 ! Kepler stellt in den
Jahren 1609 und 1619 die nach ihm benannten Gesetze auf:
1. Der Planet bewegt sich um die Sonne auf einer Ellipse, in deren einem Brennpunkt die
Sonne steht.
2. Der von der Sonne zum Planeten gezogene Fahrstrahl überstreicht in gleichen Zeiten gleiche Flächen.
3. Die Quadrate der Umlaufzeiten der Planeten verhalten sich wie die Kuben der großen
Halbachsen ihrer Bahnellipsen.
Wir werden diese Gesetze aus dem Newtonschen Gravitationsgesetz noch ableiten.
Hyperbel
x2 y 2
− 2 = 1 (a ≥ b > 0) .
a2
b
√
Sei etwa a > b. Wir setzen c := a2 + b2 und tragen auf der x–Achse die sogenannten Brennpunkte F1 , F2 mit den Koordinaten (−c, 0) bzw. (c, 0) ein. Die Hyperbel ist der geometrische
5
Brahe, Tycho de, 1546 — 1601
Kepler, Johannes, 1571 – 1630
7
Kopernikus, Nikolaus, 1473 – 1543
6
60
Ort aller Punkte, für die die Differenz der Abstände von den Brennpunkten F1 und F2 konstant
(gleich 2a) ist. Denn es gilt für eine Punkt P mit den Koordinaten (x, y) die Hyperbelgleichung
genau dann,wenn
|(x, y) − (−c, 0)| − |(x, y) − (c, 0)| = 2a
gilt. Damit haben wir aber nur den rechten Ast“ der Hyperbel beschrieben. Der linke Ast
”
resultiert aus
|(x, y) − (c, 0)| − |(x, y) − (−c, 0)| = 2a .
Die Punkte (−a, 0) und (a, 0), in denen die Hyperbel die x−Achse schneidet, heißen Scheitel
der Hyperbel. Die Geraden
b
y=± x
a
sind die Asymptoten der Hyperbel, da sich die Hyperbeläste im Unendlichen diesen Geraden
annähern.
Satz 2.43
Die Tangente an die Hyperbel in einem Punkt P ist Winkelhalbierende von ∢ (F1 P F2 ) .
Aus diesem Satz 2.43 folgt nun wieder die Eigenschaft, dass ein von F1 ausgehender oder auf
F1 gerichteter Strahl so an der Hyperbel reflektiert wird, dass der reflektierte Strahl oder seine
Verlängerung durch F2 geht. Die Konstruktion der Tangente an eine Hyperbel ist festgehalten
in Abbildung 2.11.
Bei der Ellipse sehen wir, dass sie als Bahn für einen Massenkörper in dem Zentralfeld der
Sonne auftritt; ein Planet ist eingefangen durch die von der Sonne (große Masse) auf den Planeten (kleine Masse) ausgeübte Gravitationskraft. Die Hyperbel kommt ins Spiel, wenn wir uns
einen Massenkörper, der mit positiver Engergie ins Kraftfeld der Sonne eintritt, vorstellen: Er
beschreibt dann eine Hyperbelbahn, auf der er das Sonnensystem durcheilt und schließlich wieder
verlässt.
Parabel
y 2 = 2px (p > 0) .
Wir markieren auf der x−Achse den Brennpunkt F mit den Koordinaten (p/2, 0) und zeichnen die Gerade x = −p/2, welche Leitlinie der Parabel heißt, ein. Die Parabel ist also der
geometrische Ort aller Punkte, die vom Brennpunkt und der Leitlinie den gleichen Abstand
haben.
Satz 2.44
Die Tangente an die Parabel in einem Punkt P ist die Winkelhalbierende von ∢ (F P L), wobei
L der Fußpunkt des Lotes von P auf die Leitlinie ist.
Durch Drehung einer Parabel um seine Achse entsteht im Raum ein sogenanntes Paraboloid.
Ist die Innenseite verspiegelt, nennt man ein solches Paraboloid einen Parabolspiegel. Bringt
man in einem Brennpunkt eines Parabolspiegels eine Lichtquelle an, so werden die Lichtstrahlen
parallel zur Achse der Parabel reflektiert. Dies wird bei der Konstruktion von Scheinwerfern
ausgenutzt. Treffen Lichtstrahlen parallel zur Achse auf den Parabolspiegel dann gehen die reflektierten Lichtstrahlen durch den Brennpunkt. Diese Eigenschaft kann bei der Konstruktion
eines Sonnenofens ausgenützt werden; die Bezeichnung Brennpunkt“ ist also mehr als ange”
bracht. Von Archimedes wird berichtet, dass er im Krieg gegen die Römer einen Parabolspiegel
eingesetzt hat, um die Flotte des Feindes in Brand zu setzen.
61
Bei der Bewegung von Massenkörpern in einem Zentralfeld kommt die Parabel ins Spiel,
wenn wir uns einen Körper, der mit Energie Null
ins Kraftfeld der Sonne eintritt“, vorstellen: Er
”
beschreibt dann eine Parabelbahn, auf der er das
Sonnensystem durcheilt und schließlich wieder
mit Energie Null verlässt“. Diese Grenzsituati”
on ist natürlich in der Realität auf Grund der
vielfältigen Störfaktoren nicht vorstellbar.
P
F2
F1
Wie wir oben gesehen haben, bestehen zwiAbbildung 2.11: Tangenten/Hyperbel
schen Ellipse, Hyperbel und Parabel viele Gemeinsamkeiten. Der Schlüssel zum Verständnis
hierfür ist neben der gemeinsamen Definition als geometrischer Ort die Menaichmos (um 350 v.
Chr.) zugeschriebene Entdeckung, dass diese Kurven beim Schnitt eines Kreiskegels mit einer
geeigneten Ebene entstehen. Sie heißen daher auch Kegelschnitte. Von A. Dürer8 gibt es dazu
illustrative Bilder. Die Bestätigung, dass dies so ist, liefern wir nun.
Zunächst benötigen wir die Beschreibung eines Kegels und des Kegelmantels. Ein Kegel
(in spezieller Lage) ist die Figur
2
y2 z2
3 x
(a, b, c > 0);
(x, y, z) ∈ R | 2 + 2 − 2 ≤ 0
a
b
c
sein Mantel ist die Menge
x2 y 2 z 2
(x, y, y) ∈ R | 2 + 2 − 2 = 0 ,
a
b
c
3
seine Spitze ist der Punkt (0, 0, 0). Wählt man z = h fest, so entsteht die Gleichung
x2 y 2
h2
+
=
a2
b2
c2
in der Ebene {(x, y, z) ∈ R3 |z = h}; es ist dies eine Gleichung einer Ellipse mit den Halbachsen
ah bzw. bh . Wählt man y = 0, so entsteht in der x − z – Ebene die Gleichung eines Paares sich
c
c
in (0, 0) schneidender Geraden. Für unsere Betrachtung der Kegelschnitte reicht es nun aus, den
Einheitskegel“ mit definierender Gleichung
”
x2 + y 2 − z 2 = 0
zu betrachten. Die schneidende Ebene E setzen wir parametrisch so an:
E := {u ∈ R3 |u = re3 + te1 + s(ae2 + be3 ), s, t ∈ R} ;
dabei sind r > 0 und a, b ∈ R noch freie Parameter. Die Schnittmenge S des Kegelmantels mit
der Ebene H wird dann durch die Gleichung
t2 + (a2 − b2 )s2 = r 2 + 2brs
beschrieben. Man erhält also nun in der Tat Kegelschnitte durch unterschiedliche Wahl der
Parameter a, b :
a2 > b2 : Ellipse
8
a2 < b2 : Hyperbel
Dürer, Albrecht, 1471 — 1528
62
a2 = b2 : Parabel
2.8
1.)
2.)
Übungen
Für welche a ∈ R sind (a, a2 ), (a, a + 1) ∈ R2 orthogonal bzw. eine Basis in R2 ?
(a) Zeige (1, 2), (−10, 5) sind orthogonal.
(b) Bestimme x, y ∈ R mit (1, 1) = x(1, 2) + y(−10, 5).
3.)
Bestimme die Längen der Vektoren (−1, −2, −2), (a, −a, 2a) ∈ R3 und untersuche, für
welche a sie aufeinander senkrecht stehen.
4.)
Berechne das Kreuzprodukt w von (−1, −2, −2), (a, −a, 2a) ∈ R3 und finde b ∈ R mit
|bw| = 1 .
5.)
Gegeben sei in in R3 drei Punkte A, B, C mit den Koordinaten (−1, 0, 2), (0, 1, 0), (1, −1, 0) .
Finde einen Punkt D, so dass A, B, C, D ein ebenes Parallelogramm bilden.
6.)
Seien A, B, C drei Punkte mit den Koordinatenvektoren θ, x, y . Setze u := x, v := y −
x, w := −y . Zeige:
(a)
(b)
u × v = v × w = w × u.
|v|
|w|
|u|
=
=
,
sin(α)
sin(β)
sin(γ)
wobei α, β, γ die Winkel in dem Dreieck ABC sind, jeweils bei A bzw. B bzw. C .
7.)
8.)
Beweise für drei Vektoren u, v, w ∈ R3 die Identität hu×v, (v×w)×(w×u)i = hu, v×wi2 .
Betrachte die Vektoren u = (2, −14, 5), v = (11, −2, −10), w = (−10, −5, −10) ∈ R3 .
(a)
Zeige, dass die drei Vektoren Kanten eines Würfels sind.
(b) Wie lange sind die Raum– und Flächendiagonalen?
(c)
Stehen die Raumdiagonalen senkrecht aufeinander?
(d) Drehe den Würfel um 45o um die e3 /z–Achse (e3 /z bleibt also fest, die beiden
anderen Achsen werden starr“ gedreht) und berechne mindestens eine Kante des
”
entstehenden Würfels.
9.)
Eine Gerade g in R3 durch (1, 1, 1) mit Richtungsvektor (2, −2, 1) werde als Achse eines
Zylinders angesehen.
(a)
Stelle die Gerade als Gleichung auf.
(b) Zeige: Der Punkt P mit den Koordinaten (2, 1, 2) liegt auf dem Zylindermantel.
(c)
Bestimme eine in P den Zylinder berührende Ebene.
10.) Zeige für Vektoren w, x, y, z ∈ R3 :
(a)
x × (y × z) = yhx, zi − zhx, yi .
(b) h(w × x), (y × z)i = hw, yihx, zi − hw, zihx, yi .
11.) Seien w, x, y, z ∈ R3 Vektoren, die in einer Ebene liegen. Zeige:
(w × x) × (y × z) = θ .
12.) Die magnetische Induktion B ist mit der Lorentzkraft F verknüpft durch
F = q(v × B) (q Konstante, v Geschwindigkeit).
O. E. q = 1.
63
(a)
Bei Experimenten erhält man:
F
F
F
= 2e3 − 4e2 , falls v = e1
= 4e1 − e3 , falls v = e2
= e2 − 2e1 , falls v = e3
Berechne daraus B .
(b) Welche Kraft F erhält man, wenn man das Experiment mit v = e1 +e2 veranstaltet?
Benötigt man zur Beantwortung der Frage die Kenntnis der Induktion B?
(c)
Für welches Experiment v erhält man F = θ?
13.) Seien u, v, w Vektoren in R3 und sei x := az + bv + cw (a, b, c ∈ R) . Wann lässt sich a
als
hx, v × wi
a=
hu, v × wi
ausdrücken?
14.) Betrachte das Dreieck ABC, das dessen Ecken die Koordinaten (1|0|0) bzw. ( √12 , 0, √12 )
bzw. (0, √12 , √12 ) haben.
Berechne die Längen der Dreiecksseiten und die Winkel im Dreieck.
15.) Seien x = (3, 2, −1), y = (−6, −4, 2), z = (1, −2, −1) ∈ R3 . Finde unter diesen Vektoren
ein Paar orthogonaler Vektoren und ein Paar linear abhängiger Vektoren.
16.) Gegeben seien die Geraden
g1 : x = (1, 5, 2) + t(−1, 2, 0) ,
g2 : x = (−3, 4, 2) + r(−2, 1, −3) .
(a)
Zeige, dass sich g1 , g2 nicht schneiden.
(b) Verlaufen g1 , g2 windschief oder parallel?
(c)
Zeige, dass die Gerade g1 in der Ebene
E : x = (0, 7, 2) + a(1, 0, −1) + b(0, −2, 1)
liegt.
17.) Gegeben seien in R3 die Vektoren
v 1 := (0, 1, a) , v 2 := (a, 0, 1) , v 3 := (a, 1, 1 + a) .
(a)
Für welche a sind diese Vektoren orthogonal?
(b) Für welche a bilden diese Vektoren eine Basis in R3 ?
(c)
Beschreibe für die a aus (b) den Basiswechsel von der Standardbasis u1 := e1 , u2 :=
e2 , u3 := e3 zu v 1 , v 2 , v 3 .
18.) Gegeben seien in R3
u := (0, 3, 4) , v := (0, 4, 2) , w := (2, 0, 1) .
(a)
Beweise, dass u, v, w eine Basis des R3 bilden.
(b) Man gebe einen zu v orthogonalen Vektor x an.
(c)
Berechne eine Ebene, in der die Punkte P, Q, R mit den Koordinaten u, v, w liegen.
64
19.) Ergänze w := (2, −1, 0) zu einer orthonormalen Basis in R3 .
20.) Gegeben sei die Ebene
3x1 − 2x2 + 3x3 = 14 .
(a)
Bestimme drei Punkte, die auf dieser Ebene liegen.
(b) Bestimme den Abstand der Ebene zum Nullpunkt.
(c)
21.)
Finde eine Parameterdarstellung der Ebene.
u1 , u2 , u3
∈ R3 seien drei nicht in einer Ebene liegende Vektoren. Definiere die so genannten reziproken Vektoren v 1 , v 2 , v 3 ∈ R3 durch
v 1 :=
(a)
u3 × u1
u1 × u2
u2 × u3
2
3
,
v
:=
,
v
:=
.
hu1 , u2 × u3 i
hu2 , u3 × u1 i
hu3 , u1 × u2 i
Zeige hui , v j i = δij , i, j = 1, 2, 3 .
(b) Zeige: hv 1 , v 2 × v 3 i = hu1 , u2 × u3 i−1 .
22.) Wie groß ist der Flächeninhalt des Dreiecks mit den Ecken ABC, wenn A, B, C die
Koordinaten (0, 3, −2), (1, 2, 0), (2, 4, −1) haben.
23.) Gegeben sei die Gerade g : 4x1 + 2x2 = 1 und der Punkt P mit den Koordinaten (1, 1) .
Berechne die Gerade h durch P , die senkrecht auf g steht und bestimme den Abstand
des Punktes P von g .
24.) In R3 seien zwei Mengen (Ebenen) gegeben durch
E
F
:= {x = (−2, 3, 7) + +s(1, −9, 3) + t(2, 10, 6), s, t ∈ R},
:= {x = (−6, 3, 9) + p(3, 0, 1) + q(2, 4, −5), p, q ∈ R}.
Berechne die Punkte, die sowohl in E als auch in F liegen.
Stoffkontrolle
• Was ist lineare Unabhängigkeit, was ist eine Basis (in Rn )?
• Wie stellt man aus drei Vektoren u, v, w drei paarweise aufeinander senkrecht stehende
Vektoren her? Geht dies immer?
• Die elementaren Fragestellungen Schnittpunkt von Geraden, Aufstellung einer Ebenen”
gleichung, Berechnung von Abständen“ muss eingeübt sein.
• Welche Flächeninhalte/Volumina kann man mit Hilfe des Kreuzprodukts berechnen?
65
Kapitel 3
Schritte zur (Vektor–)Analysis
Nun bereiten wir die Modellierung von Bewegung (von Massenpunkten) vor. Dazu benötigen
wir Kurven in der Ebene R2 , im Raum R3 und allgemein in Rn . Das Wort Kurve“ deutet an,
”
dass es sich nun um gekrümmte Linien handelt, lineare Algebra daher nun nicht mehr ausreicht
und analytische Werkzeuge hinzugenommen werden müssen.
Mit Bewegung eng verknüpft sind Kräfte (als Ursache von Bewegung), Geschwindigkeit und
Beschleunigung. Dafür haben wir die Ableitungen von Funktionen und allgemein von Vektorfunktionen kennenzulernen.
3.1
Abbildungen, die Erste
Zur Abkürzung führen wir Quantoren ein; siehe Abbildung 3.1. Damit können wir dann viele
Resultate und Definitionen kompakt hinschreiben; wir werden viele Beispiele für die Nützlichkeit
dieser Quantoren kennenlernen.
Wichtig ist es zu verstehen, wie die Negationen der aufgeführten Aussagen aussehen; etwa:
¬(∀ a ∈ A (P (a))) = ∃ a ∈ A (¬P (a)) .
Mit Abbildungen wollen wir den mathematischen
Notation
Sachverhalt ausdrücken, dass
∀a ∈ A
es zwischen zwei Objekten
eine klar definierte Abhän∃a ∈ A
gigkeit gibt. Wiederum be∃1 a ∈ A
handeln wir den Begriff auf
der Ebene einer naiven Auf∀a ∈ A (P (a))
fassung, auf der Ebene ei∀a ∈ A (P (a))
ner fundierten Mengenlehre
lässt sich der Begriff der Ab∃a ∈ A (P (a))
bildung ebenso wie der Umgang mit Mengen auf eine
sicherere Basis stellen. Der
Abbildungsbegriff, wie wir
ihn hier einführen werden, konnte erst nach G.
handhabare Objekte waren.
66
Sprechweise
“für alle Elemente a in A“
“es existiert a in A“
“es existiert genau ein a in A“
“für alle Elemente a in A ist P (a) wahr“
“für alle Elemente a in A gilt P (a)“
“es existiert a in A mit P (a)“
Abbildung 3.1: Quantoren
Cantor in Mode“ kommen, da nun Mengen
”
Definition 3.1
Seien X, Y, W, Z Mengen.
(a) Eine Abbildung f von X nach Y ist eine Vorschrift, durch die jedem x ∈ X genau ein
y := f (x) ∈ Y zugeordnet wird; x heißt Urbild von y, y heißt Bild von x, X heißt
Definitionsbereich, Y heißt Wertebereich von f .
Wir schreiben f : X −→ Y oder mehr informativ f : X ∋ x 7−→ f (x) ∈ Y .
(b) Zwei Abbildungen f : X −→ Y, g : W −→ Z heißen gleich, wenn gilt:
X = W, Y = Z, f (x) = g(x) für alle x ∈ X .
Die Definition 3.1 hat eine gewisse Schwäche, denn es werden aus der Umgangssprache die
Worte Vorschrift, zugeordnet“ verwendet. Es sollte aber hier genügen, damit zu arbeiten in der
”
Gewissheit, dass es auch auf der Basis einer fundierten Mengenlehre exakter ginge.
Bei einer Abbildung kann es also nicht vorkommen, dass einem x im Definitionbsbereich
zwei Bilder y, y ′ zugeordnet werden; man nennt dies die Wohldefiniertheit der Abbildung.
Unter Benutzung der eingeführten Quantoren lässt sich diese Wohldefiniertheit einer Abbildung
f : X −→ Y so hinschreiben:
∀x, x′ ∈ X (x = x′ =⇒ f (x) = f (x′ )) oder ∀x, x′ ∈ X (f (x) 6= f (x′ ) =⇒ x 6= x′ ) .
Man hat sich immer zu vergewissern, ob der Formulierung genau ein“ in der Definition 3.1 im
”
konkreten Fall Rechung getragen wird. Etwa ist es nicht zulässig, zu sagen: Sei f die Abbildung,
die jeder rationalen Zahle r = pq −1 die Differenz p − q zuordnet, denn eine rationale Zahl r hat
viele Darstellungen der Form r = pq −1 , die aber zu unterschiedlichen Differenzen p − q führen.
Nachdem wir in (b) der Definition 3.1 geklärt
haben, wann zwei Abbildungen gleich sind,
können wir ohne Bedenken für Mengen X, Y
die Menge
c)
Abb(X, Y ) := {f : X −→ Y }
a)
hinschreiben.
Ist X = Y, dann ist die Identität idX :
X ∋ x 7−→ x ∈ X ein ausgezeichnetes Element von Abb(X, X) . Manchmal lassen wir
den Index X weg und schreiben einfach id,
wenn klar ist, um welches X es sich handelt.
b)
Abbildung 3.2: Graphen zu Beispiel 3.2
In unserem Verständnis ist eine Funktion ein Spezialfall einer Abbildung: Wir sprechen
dann von einer Funktion, wenn wir eine Abbildung zwischen Zahlbereichen haben, d.h. wenn
Definitions– und Wertebereich der Abbildung (Teil–)Mengen von Zahlen sind.
Beispiel 3.2 Mehr oder minder interessante Beispiele f : D −→ R, D ⊂ R, sind:
a) D := R , f (x) := |x| .
√
b) D := [−1, 1] , f (x) := 1√− x2 . Es sei daran erinnert, dass es für das Hinschreiben etwa
der Funktion R ∋ t 7−→ 1 − t2 ∈ R der Vollständigkeit von R bedarf.
67
c) D := [0, ∞) := {x ∈ R|x ≥ 0} , f (x) :=
√
x.
d) D := [−1, 1] , f (x) := 3x(1 − x) .
Definition 3.3
Sei f : X −→ Y eine Abbildung. Die Menge
graph(f ) := {(x, y) ∈ X × Y |x ∈ X, y = f (x)}
heißt der Graph von f.
Der Graph einer Abbildung mit Definitionsbereich X und Wertebereich Y ist das, was wir in
X × Y hinzeichnen können, vorausgesetzt, wir haben es mit Mengen X, Y zu tun, die numeri”
sche“ Qualität haben, wie dies der Fall ist, wenn X, Y etwa Teilmengen der reellen Zahlen sind.
In der Abbildung 3.2 sind zu a), b), c) aus Beispiel 3.2 die Graphen skizziert.
Bei Abbildungen mit Wertebereich in R können wir auch die Summe, Differenz, Produkt,
Quotient (unter Umständen) erklären. Wir tun es hier sehr formal. Seien f, g : D −→ R, D
eine Menge.
f + g : D ∋ x 7−→ f (x) + g(x) ∈ R
f − g : D ∋ x 7−→ f (x) − g(x) ∈ R
f ·g : D ∋x −
7 → f (x) · g(x) ∈ R
f (x)
f
: D∋x −
7 →
∈R
g
g(x)
Beim Quotienten sind allerdings die Nullstellen von g, also die Elemente x ∈ D mit g(x) = 0,
aus dem Definitionsbereich zu entfernen.
Beispiel 3.4 Physikalische Messergebnisse trägt man oft in Form einer Wertetabelle zusammen,
etwa, die Temperatur eines Gegenstandes in Abhängigkeit von der Zeit; siehe Abbildung 3.3. Es
wird damit die Abbildung
ti 7−→ Ti , i = 1, . . . , n ,
festgelegt. Im allgemeinen wird man die Punkte (ti , Ti ), i = 1, . . . , n, auf der Zeichenebene durch
Geraden verbinden, um einen besseren überblick über die Abhängigkeit zu erhalten.
In obigem Beispiel haben wir gegen die Verabredung verstoßen, dass zu einer Funktion Definitions–
und Wertebereich anzugeben sind. Wir werden in
einem solchen Fall im folgenden einen der folgenden Standpunkte einnehmen, die insbesondere bei
Physikern/in Physikbüchern nicht selten anzutreffen sind:
t(ime)
T(emperature)
t1
t2
···
tn
T1 T2 · · · Tn
Abbildung 3.3: Messergebnisse
1. Es geht schon aus dem Zusammenhang hervor, welcher Definitions– und Wertebereich
gemeint ist.
2. Die Funktion ist überall dort definiert, wo der angegebene Ausdruck gelesen werden kann
(Natürlicher Definitionsbereich).
3. Der Definitionsbereich spielt für das, was über die Funktion zu sagen ist, keine Rolle.
68
Beispiel 3.5 Seien A, B Mengen. Dann heißt die Abbildung
π1 : A × B ∋ (a, b) 7−→ a ∈ A
die Projektion auf den ersten Faktor. Die Wortwahl wird verständlich, wenn wir uns A × B
durch ein Achsenkreuzes auf der Zeichenebene realisiert denken. Dann wird von einem Punkt
durch Beleuchtung parallel zur einer Achse auf der anderen Achse der projezierte Punkt sichtbar.
Es sollte klar sein, dass entsprechend auch die Projektionen auf beliebige Faktoren in einem
kartesischen Produkt erklärt sind.
Definition 3.6
Seien f : X −→ Y , g : Y −→ Z Abbildungen. Die Hintereinanderausführung oder
Komposition g ◦ f der Abbildungen f, g ( zuerst f dann g“) ist erklärt durch
”
g ◦ f : X ∋ x 7−→ g(f (x)) ∈ Z .
Rechenregeln 3.7 Seien f : X −→ Y, g : Y −→ Z, h : Z −→ W Abbildungen.
idY ◦ f
= f ◦ idX
h ◦ (g ◦ f ) = (h ◦ g) ◦ f
(3.1)
(3.2)
Die Identität in (3.2) nennt man das Assoziativgesetz. Man beachte aber, dass für die Hintereinanderausführung von Abbildungen ein Kommutativgesetz ( f ◦ g = g ◦ f ) nicht gilt. Dies
sieht man etwa an folgendem überaus einfachen Beispiel.
Beispiel 3.8 Sei A := {a, b} mit a 6= b . Betrachte die Abbildungen
f : A −→ A, a 7−→ a, b 7−→ a , g : A −→ A, a 7−→ b, b 7−→ b .
Dann haben wir
f ◦ g : a −→ A, a 7−→ a, b 7−→ a , g ◦ f : A −→ A, a 7−→ b, b 7−→ b .
Definition 3.9
Sei f : X −→ Y eine Abbildung und seien A ⊂ X, B ⊂ Y . Dann heißt die Menge
f (A) := {f (x)|x ∈ A}
die Bildmenge von A oder das Bild von A unter f und die Menge
−1
f (B) := {x ∈ X|f (x) ∈ B}
heißt die Urbildmenge von B oder einfach das Urbild von B unter f.
Reelle Polynome sind Funktionen der Form
p : R ∋ x 7−→
n
X
i=0
ai xi ∈ R .
Die reellen Zahlen a0 , . . . , an heißen Koeffizienten des obigen Polynoms
Pn−1 undi n heißt Grad
des Polynoms, falls an 6= 0 ist; sonst verringere die Darstellung zu i=0 ai x und stelle die
69
Gradbetrachtung erneut an. Die linearen Polynome, also Polynome vom Grad 1, werden uns
als einfache und brauchbare Approximation von allgemeinen Funktionen begegnen. Ihre Graphen
sind Geraden in R2 .
Die Polynome sind durch Summen– und Produktbildung aufgebaut aus den Monomen
R ∋ x 7−→ xi ∈ R , i = 0, . . . , n ,
und der konstanten Funktion
R ∋ x 7−→ a ∈ R (a ∈ R) .
Wir setzen
Pn := {p : R −→ R|p Polynom vom Grad n} , P := {p : R −→ R|p Polynom} .
Polynome haben überragende Bedeutung in nahezu jedem Zweig der Mathematik. In der
Analysis, da man mit ihnen gute Näherungen für Funktionen bilden kann (Taylorpolynom,
Approximationssatz von Weierstraß), in der Algebra, da sie selbst eine interessante Struktur sind und andere Strukturen aufklären helfen (Ringtheorie, Körpererweiterung), in der
Numerik, da sie als Näherungen (Interpolation, Integration) einfach zu handhaben sind,
denn man kann sie abspeichern und manipulieren durch die Koeffizienten.
Bei der Auswertung von Polynomen sollte man nicht den Weg gehen, die Monome für sich
auszurechnen, sondern folgende mit Namen Horner–Schema versehene aufwandsminimale Methode anwenden. Wir lesen sie ab aus der Darstellung
p(x) = an xn + an−1 xn−1 + · · · + a1 x + a0 = (an xn−1 + an−1 xn−2 + · · · + a1 )x + a0
des Polynoms p . Wir können es nun so hinschreiben
p(x) = (· · · (an x + an−1 )x + · · · + a2 )x + a1 )x + a0 ,
was uns nun zur algorithmischen Formulierung führt.
Algorithmus 3 Horner–Schema
EIN Polynom p(x) = an xn + an−1 xn−1 + · · · + a1 x + a0 und Auswertungspunkt x∗ .
Schritt 0 p∗ := an , i := n .
Schritt 1 p∗ := p∗ x∗ + ai−1 , i := i − 1 .
Schritt 2 Ist i = 0 gehe zu AUS, sonst gehe zu Schritt 1.
AUS Wert p∗ = p(x∗ ) .
Bei Polynomen haben wir keine Schwierigkeiten mit dem Definitionsbereich, überall sind
sie definiert. Wenn wir von den Polynomen zu den rationalen Funktionen übergehen, treten
diesbezügliche Schwierigkeiten sofort auf. Eine rationale Funktion kommt zustande, indem
man Quotienten von Polynomen betrachtet:
f (x) :=
p(x)
, x ∈ R, mit p, q ∈ P .
q(x)
70
Dabei heißt p Nennerpolynom und q Zählerpolynom. Hat dann q Nullstellen, d.h. gibt
es x ∈ R mit p(x) = 0, so sind diese im Definitionsbereich von f nicht zugelassen. Etwas
undurchsichtig“ wird es nun, wenn wir etwa die reelle Funktion
”
h : x 7−→
x2 − 49
x3 − 7x2 + x − 7
betrachten wollen. Hier tritt zwar im Nenner eine Nullstelle auf, aber sie ist kürzbar, denn
x3 − 7x2 + x − 7 lässt sich zerlegen in (x2 + 1)(x − 7) . Dies führt uns nun zur Abbildung
h : R ∋ x 7−→
x+7
∈ R.
x2 + 1
Die reelle Funktion
x+7
x2 + 1
ist wohldefiniert. Später, wenn wir die komplexen Zahlen zur Verfügung haben, werden wir
sehen, dass diese Funktion, betrachtet mit komplexen Argumenten x nicht wohldefiniert ist, da
dann das resultierende Polynom x 7−→ x2 + 1 eine Nullstelle besitzt.
l : x 7−→
3.2
Stetigkeit
Wir betrachten nun Eigenschaften von Funktionen, die für Anwendungen von herausragender
Bedeutung sind. Stetigkeit von Funktionen wird oft so charakterisiert, dass sie sicherstellt, dass
der Graph in einem Zug zu Papier gebracht werden kann. Differenzierbarkeit von Funktionen,
die wir später besprechen, bedeutet dann in diesem Kontext, dass der Graph keine Ecken besitzt.
Diese Betrachtungsweisen sind nicht weit von der mathematischen Wirklichkeit entfernt. Von der
Anwendungsseite her ist Stetigkeit das Konzept, das sicherstellt, dass man Störungen quantitativ
und qualitativ studieren kann.
Definition 3.10
Sei A ⊂ R . Ein ξ ∈ R heisst Berührungspunkt von A, wenn es eine Folge (xn )n∈N gibt mit
xn ∈ A für alle n ∈ N , lim xn = ξ .
n
Klar, a ist Berührungspunkt von (a, b) . Um ∞ als Berührungspunkt etwa von [a, ∞) begreifen
zu können, führen wir noch ein:
Definition 3.11
Wir schreiben limn xn = ∞, wenn gilt: für alle k ∈ R gibt es ein N ∈ N mit xn ≥ k für alle
n≥N.
Definition 3.12
Sei g : D −→ R, ξ ∈ D ein Berührungspunkt von D . Wir sagen dass η ∈ R Grenzwert von
g in ξ ist, wenn für jede Folge (tn )n∈N , die in D liegt und ξ als Grenzwert (ξ = ±∞ ist auch
erlaubt) hat,
η = lim g(tn )
(3.3)
n∈N
gilt. Wir schreiben η = limt→ξ g(t) .
Ist in der Definition 3.12 etwa D = (a, b) und ξ = a oder ξ = b, dann haben wir es mit einseitigen
Grenzwerten zu tun.
71
Beispiel 3.13 Betrachte die Funktion


−t



0
g : R ∋ t 7−→

−1



1
,
,
,
,
falls
falls
falls
falls
t≤0
t ∈ (0, 2), t 6= 1
∈ R.
t=1
t≥2
Dann haben wir:
lim g(t) = 0 , lim g(t) existiert nicht , lim g(t) existiert nicht , lim g(t) = 1 .
t→0
t→1
t→2
t→∞
Definition 3.14
Sei I ein Intervall, g : I −→ R, ξ ∈ I . Wir sagen dass g in ξ stetig ist, wenn g(ξ) = limt→ξ g(t)
gilt.
Wir sagen dass g stetig in I ist, wenn g stetig ist in jedem ξ ∈ I .
Stetigkeit in einem ξ ist eine lokale Angelegenheit, d.h. eine Eigenschaft, bei der das Verhalten
der Funktion nur in einer Umgebung des fraglichen Punktes ξ eine Rolle spielt.
Satz 3.15
Sei I ein Intervall, g : I −→ R, ξ ∈ I. Äquivalent sind.
(a)
g ist stetig in ξ .
(b) Für alle ε > 0 gibt es ein δ > 0 mit
|g(t) − g(ξ)| < ε für alle t ∈ (ξ − δ, ξ + δ) ∩ I .
(3.4)
Beweis:
(a) =⇒ (b)
Sei ε > 0. Annahme: Es gibt kein δ > 0 der gewünschten Art.
Dann gibt es zu jedem n ∈ N und δn := n1 ein tn in I ∩(ξ −δn , ξ +δn ) mit |g(tn )−g(ξ)| ≥ ε . Dann
konvergiert aber die Folge (tn )n∈N gegen ξ und daher aus Stetigkeitsgründen auch (g(tn ))n∈N
gegen g(ξ), was einen Widerspruch zu |g(tn ) − g(ξ)| ≥ ε darstellt.
(b) =⇒ (a)
Sei (tn )n∈N eine Folge in I mit limn tn = ξ . Sei ε > 0, wähle dazu δ > 0 gemäß (b). Dann gibt es
N ∈ N mit |g(tn ) − g(ξ)| < ε für alle n ≥ N, da nur endlich viele tn außerhalb von (ξ − δ, ξ + δ)
liegen.
In (a) in Satz 3.15 ist die Stetigkeit im Sinne der Definition 3.14 (Folgenstetigkeit) gemeint,
(b) aus Satz 3.15 nennt man die ε–δ–Definition der Stetigkeit.
Bemerkung 3.16 Für eine Klasse von Funktionen ist die Abhängigkeit von δ von der Wahl von
ε in (b) aus Satz 3.15 einfach zu beherrschen. Es sind dies die Hölder– bzw. Lipschitzstetigen
Funktionen. Sie sind so definiert:
Sei I ein Intervall. Gilt für eine Funktion f : I −→ R mit α ∈ (0, 1] und L ∈ R die Ungleichung
|f (u) − f (v)| ≤ L|u − v|α , u, v ∈ I ,
so heißt sie Hölderstetig mit Hölderexponent α und Hölderkonstante L ≥ 0 . Im Spezialfall
α = 1 heißen solche Funktionen Lipschitzstetig mit Lipschitzkonstante L . Lipschitzstetige
Funktionen sind offenbar stetig: man wähle δ zu vorgegebenem ε als δ := ε(L + 1)−1 .1
1
L + 1 im Nenner ist eine Vorsichtsmaßnahme: es könnte ja L = 0 sein.
72
Rechenregeln 3.17 Sei I ein Intervall, seien g, h : I −→ R stetig in ξ . Dann gilt:
g + h, g · h sind stetig in ξ .
(3.5)
g/h ist stetig in ξ, falls h(ξ) 6= 0 gilt.
(3.6)
Diese Regeln ergeben sich sofort aus den Rechenregeln für Limiten.
Beispiel 3.18 Aus den Rechenregeln ergibt sich die Stetigkeit ganz vieler Funktionen. Zum
Beispiel:
Jedes Polynom ist stetig.
Jede rationale Funktion ist stetig, da ja die Nullstellen im Nenner aus dem Definitionsbereich entfernt wurden/entfernt werden mussten.
Die Stetigkeit der Wurzelfunktion in ξ 6= 0 liest man aus folgender Betrachtung
ab.
p
√
1
|t − ξ|
| t − ξ| ≤ √
√ ≤ p |t − ξ|
| t + + ξ|
ξ
Beispiel 3.19 Betrachte die Funktion
R ∋ t 7−→
(
1
3−t
1
1+t
, falls t < 1
, falls t ≥ 1
∈ R.
Da wir es mit einer zusammengesetzten rationalen Funktion zu tun haben, ist die Stetigkeit in
R\{1} schon klar. Da in ξ = 1 aber Links– und Rechtsgrenzwert übereinstimmen, ist g auch
stetig in 1.
Rechenregeln 3.20 Seien I, J Intervalle, sei f : I −→ R stetig in ξ ∈ I , sei g : J −→ R
stetig in η ∈ J und es gelte: f (I) ⊂ J, η = f (ξ) . Dann ist g ◦ f stetig in ξ .
3.3
Differenzierbarkeit
Definition 3.21
Sei I ein Intervall, sei f : I −→ R, ξ ∈ I . Wir sagen dass f ′ (ξ) die Ableitung von f in ξ ist,
wenn für jede Folge (tn )n∈N mit tn ∈ I und tn 6= ξ für alle n ∈ N,
f (tn ) − f (ξ)
n∈N
tn − ξ
f ′ (ξ) = lim
(3.7)
gilt.
f (t) − f (ξ)
.
t−ξ
t→ξ
Kurzschreibweise: f ′ (ξ) = lim
Ist in der Definition 3.21 etwa I = [a, b] und ξ = a oder ξ = b, dann haben wir es mit einseitigen Ableitungen zu tun. Den Arbeitsschritt, die Ableitung auszurechnen, nennt man Differenzieren. Die Berechnung der Ableitung f ′ (ξ) bedeutet, wenn f (t) zur Zeit t eine durchlaufene
Wegstrecke darstellt, die Ermittelung einer Momentangeschwindigkeit zur Zeit t .
Die Definition 3.21 kann so interpretiert werden, dass die Funktion f in der Nähe von ξ
gut durch das lineare Polynom I ∋ t 7−→ f (ξ) − f ′ (ξ)(t − ξ) ∈ R angenähert wird. In der
73
Zeichenebene R2 nehmen wir dieses lineare Polynom als Tangente an den Graphen von f
wahr. Diese Tangente berührt den Graphen im Punkt (ξ, f (ξ)) . Beachte hierzu
f (t) − f (ξ)
1
′
′
(f (t) − f (ξ) − f (ξ)(t − ξ)) = lim
− f (ξ) = 0 .
(3.8)
lim
t→ξ
t→ξ t − ξ
t−ξ
In Abbildung 3.4 ist ein Steigungsdreieck eingezeichnet:
f (t) − f (ξ)
Länge der Gegenkathede
t−ξ
Länge der Ankathete
Man kann nun, wie bei der Stetigkeit, der Definition 3.21 die so genannte ε–δ–Definition der Differenzierbarkeit zur Seite stellen. In Analogie haben wir die
Äquivalenz
(a)
f ist differenzierbar in ξ mit Ableitung
Tangente
f(t)
f ′ (ξ) .
(b) ∀ ε > 0 ∃ δ > 0 ∀ t ∈ (ξ − δ, ξ + δ) ∩ I
Sekante
f(ξ )
f (t) − f (ξ)
− f ′ (ξ) < ε .
t−ξ
(3.9)
ξ
Beispiel 3.22 Betrachte erneut die Funktion (siehe
Beispiel 3.19)
(
1
3
−
t , falls t < 1 ∈ R .
R ∋ t 7−→
1
1 + t , falls t ≥ 1
t
Abbildung 3.4: Tangente
Da wir es mit einer zusammengesetzten rationalen Funktion zu tun haben, ist die Stetigkeit in
R\{1} schon klar. In ξ = 1 liegt keine Differenzierbarkeit vor, da
lim
t→1,t<1
g(t) − g(ξ)
1
g(t) − g(ξ)
1
1
1
lim
=
.
2 = 4 6= − 4 = −
2 = t→1,t>1
t−ξ
t−ξ
(3 − ξ)
(1 + ξ)
Satz 3.23
Sei I ein Intervall, sei f : I −→ R stetig in ξ ∈ I . Dann ist f stetig in ξ .
Beweis:
Dies liest man ab an
g(t) − g(ξ) = (g(t) − g(ξ) − g′ (ξ)(t − ξ)) + g′ (ξ)(t − ξ) .
Beachte: Aus Stetigkeit folgt nicht die Differenzierbarkeit; siehe Beispiel 3.22.
Beispiel 3.24 Betrachte die Funktion R ∋ t 7−→ sin(t) ∈ R . Wir haben (siehe Anhang 2.6)
g(t + h) − g(t) = sin(t) cos(h) + cos(t) sin(h) − sin(t)
= sin(t)(cos(h) − 1) + cos(t) sin(h) .
Wegen | cos(h) − 1| = |1 − cos2 (h)||1 + cos(h)|−1 = sin2 (h)|1 + cos(h)|−1 genügt es zeigen, dass
= 1 gilt, um die allseits bekannte Tatsache, dass g′ (t) = cos(t) ist, nachzuweisen.
limh→0 sin(h)
h
74
Hier ist ein elementargeometrischer Beweis dieser Tatsache; siehe dazu Abbildung 3.5.
Sei h der Kreisbogen zwischen B und C. Wir gehen davon aus, dass 0 < h < π2 . Die Fläche des
Dreiecks OBC ist 12 sin(h), die Fläche a des Kreissektors OBC ist 21 h, da folgendes Verhältnis
besteht: a : π( Kreisfläche) = h : 2π( Gesamtkreisbogen); siehe Anhang 2.6. Ferner ist die Fläche
sin(h)
. Daraus ergibt sich
des Dreiecks OBA gegeben durch 21 cos(h)
sin(h) < h <
Wegen
1 − cos(h) =
1
1
sin(h)
d.h. 1 <
<
.
cos(h)
sin(h)
cos(h)
1 − cos2 (h)
sin2 (h)
=
< sin2 (h)
1 + cos(h)
1 + cos(h)
erhalten wir
sin(h)
< 1.
h
Wegen sin(−h) = −h ist dies nun auch gültig für − π2 < h < 0 . Dies zeigt
1 − cos(h) < h2 , 1 − h2 <
1 − cos(h)
sin(h)
= 1 , lim
= 0.
h→0
h→0
h
h
lim
Man kann ähnliche überlegungen anstellen, um zu zeigen, dass R ∋ t 7−→ cos(t) ∈ R differenzierbar ist und dass R ∋ t 7−→ − sin(t) ∈ R die Ableitungsfunktion ist.
Aus den Rechenregeln für Limiten ergeben sich Rechenregeln für die Berechnung von Ableitungen.
Rechenregeln 3.25 Sei I ein Intervall, seien f, g : I −→ R differenzierbar in ξ ∈ I , sei r ∈ R .
Es gilt:
(f + g) ist differenzierbar in ξ und es ist (f + g)′ (ξ) = f ′ (ξ) + g′ (ξ) .
′
(3.10)
′
(rg) ist differenzierbar in ξ und es ist (rg) (ξ) = rg (ξ) .
′
′
(3.11)
′
(f · g) ist differenzierbar in ξ und es ist (f · g) (ξ) = f (ξ)g(ξ) + f (ξ))g (ξ) . (3.12)
f ′ (ξ)g(ξ) − f (ξ)g′ (ξ)
.
(3.13)
(f /g) ist differenzierbar in ξ und es ist (f /g)′ (ξ) =
g(ξ)2
Selbstverständlich ist (3.12) nur unter der Voraussetzung verwendbar, dass g(ξ) 6= 0 gilt.
Rechenregeln 3.26 Seien I, J Intervale, sei f : I −→ R differenzierbar in ξ ∈ I , sei g : J −→
R differenzierbar in η ∈ J und es gelte: f (I) ⊂ J, η = f (ξ) . Dann ist g ◦ f differenzierbar in ξ
und es gilt
(g ◦ f )′ (ξ) = g′ (f (ξ))f ′ (ξ) .
(3.14)
Aus der folgenden Identität liest man die Idee zum Beweis der Regel ab:
(g(f (t)) − (g(f (ξ)) f (t) − f (ξ)
(g ◦ f )(t) − (g ◦ f )(ξ)
=
.
t−ξ
f (t) − f (ξ)
t−ξ
Das Problem, mit einem verschwindenden Nenner f (t) − f (ξ) umzugehen, lässt sich einfach
umgehen.
75
Beispiel 3.27 Betrachte ein reelles Polynom n–ten
Grades:
n
X
ai ti , t ∈ R .
p(t) =
C
A
i=0
Die Ableitung von p in einem ξ ∈ R ist gegeben
durch
n
X
iai ξ i−1 .
p′ (ξ) =
O
B
i=1
Wie sieht man dies ein? Wegen der Rechenregel
(3.7), (3.11) reicht es aus, nur ein einzelnes Monom
Abbildung 3.5: überlegung am Kreis
qm : t 7−→ tm zu betrachten. Dann hat man zu
zeigen:
′
qm
(ξ) = mqm−1 (ξ) .
Dazu geben wir zwei Beweise.
1. Beweis. Da t 7−→ tm aufgefasst werden kann als Produkt von Funktionen, liegt es nahe,
vollständige Induktion einzusetzen:
m = 1: Liest man ab aus
t−ξ
= 1.
t−ξ
m + 1: Es gilt qm+1 = qm · q1 . Also erhalten wir mit (3.12)
′
′
qm+1
(ξ) = qm
(ξ)q1 (ξ) + qm (ξ)q1′ (ξ) = mqm−1 (ξ)q1 (ξ) + qm (ξ) = (m + 1)qm (ξ) .
2. Beweis. Aus
m−1
X
|qm (t) − qm (ξ)| = |tm − ξ m | ≤ |t − ξ|(
leitet man die gewünschte Aussage ab.
j=0
|t|j |ξ|m−1−j )
Nach Beispiel 3.27 sind nun mit Hilfe von Rechenregel 3.13 auch die rationalen Funktionen
als differenzierbar erkannt.
Es ist nun an der Zeit, eine Anmerkung zu infinitesimalen Größen (unendlich kleinen
Größen) zu machen. Solche Größen werden ins Spiel gebracht schon durch die Schreibweise (y
steht nun für die Funktion f ):
dy
für y ′ .
dt
Diese Schreibweise geht auf Leibniz zurück, der sich die Steigung einer Funktion in einem Punkt
als Quotient aus Gegenkathete (dy) und Ankathete (dt) vorgestellt hat, wobei dy und dt als
unendlich klein anzusehen sind.
dy, dt sollte man als eigenständige Größen nicht verwenden, jedenfalls solange nicht, bis im
Rahmen von Differentialformen dy, dt eine sinnnvolle Interpretation erhalten; dies hat dann mit
unendlich kleinen Größen nichts mehr zu tun. Die Physik hat trotz allem ein grosses Interesse
am Rechnen mit unendlich kleinen Größen. Es vermittelt in vielen Bereichen einen schnellen
heuristischen Zugang, der nahe am Gehalt der physikalischen Formeln bleibt. Etwa, wenn wir
bei einer Ortsfunktion t 7−→ y(t) schreiben:
dy(t) = y ′ (t)dt
76
(3.15)
Hier ist dy(t) die infinitesimale Veränderung des Ortes in der infinitesimalen Zeitspanne dt zum
Zeitpunkt t . Sie trifft den physikalischen Sachverhalt gut, denn y ′ (t) steht für eine mittlere
”
Geschwindigkeit“ und y ′ (t)dt als für einen mittleren Weg“ in der infinitesimalen Zeitspanne dt.
”
Sie ist aber auch zweifelhaft, denn wenn man es in (3.15) auf die Spitze treibt und auf beiden
Seiten zum Grenzwert Null übergeht, bleibt die Gleichheit 0 = y ′ (t)0 übrig, was ja nichts bringt.
Wir werden bei der Diskussion von Flächen, Volumina noch weitere derartige Zugänge kennenlernen.
Differenzierbarkeit in einem Punkt ξ ist eine lokale Angelegenheit, d.h. ist eine Eigenschaft,
bei der das Verhalten der Funktion nur in einer Umgebung des fraglichen Punktes ξ eine Rolle
spielt. Damit können wir über Differenzierbarkeit bei Funktionen g : I −→ R mit beliebigen
nichtleeren Intervallen I mit ξ ∈ I reden.
Haben wir eine differenzierbare Funktion f : I −→ R, so liegt es nahe, die 1. Ableitung
f ′ : T ∋ t 7−→ f ′ (t) ∈ R
(3.16)
zu betrachten; sie heißt Ableitung(sfunktion). Diese Funktion können wir nun wieder hinterfragen bezüglich Stetigkeit und Differenzierbarkeit. Ist die Ableitungsfunktion wieder differenzierbar, erhält man als Ableitung von f ′ die zweite Ableitung(sfunktion) f ′′ von f :
f ′′ : I ∋ t 7−→ (f ′ )′ (t) ∈ R .
(3.17)
Sukzessive erhält man so gegebenenfalls die Funktionen
′
f ′ , f ′′ , f (3) := (f ′′ )′ , f (4) := f (3) , . . . .
(m)
(m+1)
Für ein Monom qm , qm (t) := tm , haben wir: qm (t) = m! , qm
also das Nullpolynom.
(m+1)
(t) = 0 für alle t ; qm
ist
Definition 3.28
Sei I ein Intervall, sei f : I −→ R und sei m ∈ N .
(a)
f heißt m–mal differenzierbar, wenn die Ableitungen f (i) für i = 1, . . . , m existieren.
(b) f heißt m–mal stetig differenzierbar, wenn die Ableitungen f (i) für i = 1, . . . , m existieren und f (m) auch stetig ist.
(c)
f heißt unendlich oft differenzierbar, wenn die Ableitungen f (i) für alle i ∈ N existieren.
Beispiel 3.29 Wir können mit der Quotientenregel erkennen, dass die rationale Funktion
f : I ∋ t 7−→
at + b
∈R
ct + d
unendlich oft differenzierbar ist, falls ct + d 6= 0 ist für t ∈ I . Etwa:
f ′ (ξ) =
da − cb
da − cb
da − cb
, f ′′ (ξ) = (−2)c
, f ′′′ (ξ) = (−2)(−3)c2
(cξ + d)2
(cξ + d)3
(cξ + d)4
77
3.4
Kurven
Es gibt zwei Arten, den Begriff einer Kurve einzuführen. In der geometrischen Auffassung ist
eine Kurve der Ort von Punkten in der Ebene oder im Raum, die durch gewisse Eigenschaften
charakterisiert sind. So wird etwa in der Ebene ein Kreis durch den konstanten Abstand zu einem
Punkt beschrieben. Die Kegelschnitte, ein Hauptgegenstand der griechischen Mathematik, sind
durch geometrische Eigenschaften definiert. In der mechanischen Vorstellung erscheint die
Kurve als Bahnkurve eines bewegten Punktes. Beide Auffassungen finden sich bereits in der
Antike. Die erste mechanisch erklärte Kurve ist die archimedische Spirale.
Wenn sich ein Halbstrahl in einer Ebene um seinen Endpunkt mit gleichförmiger Geschwindigkeit dreht, nach einer beliebigen Zahl von Umdrehungen wieder in die Anfangslage zurückkehrt und sich auf dem Strahl der Punkt mit gleichförmiger Geschwindigkeit, vom Endpunkt
des Halbstrahls beginnend, bewegt, so beschreibt dieser Punkt eine Spirale.2
Man beachte, dass der Begriff der gleichförmigen Geschwindigkeit“ vorkommt, ein Begriff, der
”
erst bei Newton3 im 16. Jahrhundert endgültige Klärung und Bedeutung erfuhr.
Wege, Kurven sind das Werkzeug, Bewegung sichtbar“ zu machen; man denke etwa an
”
Planeten, Satelliten, Animationsfiguren in der Grafik, . . . . Nachdem wir nun den Begriff der
Funktion/Abbildung parat haben, können wir uns damit auseinandersetzen.
Wir betrachten
x : I ∋ t 7−→ x(t) := (x1 (t), . . . , xn (t)) ∈ Rn .
Dabei ist I irgendein Intervall in R, das wir als Parameterintervall und manchmal auch als
Zeitintervall bezeichnen; x nennen wir einen Weg, das Bild Cx der Vektorfunktion x – wir
→
verzichten meist wieder auf die Pfeilnotation −
x – bezeichnen wir als (Bahn–)Kurve. Für
n = 2 sprechen wir von einer ebenen Kurve, für n = 3 von einer Raumkurve. Zu einer Kurve
kann es durchaus mehrere sinnvolle Parameterdarstellungen geben; siehe Beispiel 3.31.
Physikalisch betrachtet denken wir uns bei einer
→
Vektorfunktion x an der Spitze des Pfeiles −
x
ein Masseteilchen gegebener Masse m aber vernachlässigbarer Ausdehnung; wir sprechen von einem Massenpunkt. Im Laufe der Zeit wird er –
unter der Einwirkung einer äußeren Kraft – den Ort
wechseln. In dem zeitunabhängigen“ kartesischen
”
Koordinatensystem der Einheitsvektoren e1 , e2 , e3
haben wir dann
x(t) =
3
X
i=1
xi (t)ei , t ∈ I .
x0
v
Abbildung 3.6: Gleichfürmige Bewegung
Wir betrachten eine Vektorfunktion x : I −→
Rn und interessieren uns für infinitesimale änderungen des Vektors x(t), d.h. für änderungen in kleinen Zeitintervallen. Physikalisch gesprochen
interessieren wir uns für die Momentangeschwindigkeit eines Massenpunktes, der durch die
Vektorfunktion x beschrieben wird. Wie sieht eine solche Veränderung im Zeitintervall (a, b) ⊂ R
2
3
Siehe H. Gericke: Mathematik in Antike und Orient; Springer-Verlag, 1984, S. 120.
Newton, Isaac (1643 — 1727)
78
aus? Klar, die Differenz x(a) − x(b) beschreibt die Veränderung und der Differenzenquotient
(a − b)−1 (x(a) − x(b)) = (
x1 (a) − x1 (b)
xn (a) − xn (b)
,...,
)
a−b
a−b
beschreibt die relative Veränderung. Bei einer gleichförmigen Bewegung ergibt sich als Differenzenquotient sofort die Geschwindigkeit; siehe Beispiel 3.30. Bei einer ungleichfürmigen Bewegung
kann man für die Momentangeschwindigkeit in ξ ∈ (a, b) erst dann damit eine vernünftige Näherung erwarten, wenn a nahe“ bei b liegt. Der Grenzübergang b → a führt zur Differenziation.
”
Beispiel 3.30 Eine gleichfürmige (geradlinige) Bewegung im Raum mit zeitlich konstanter Geschwindigkeit ist gegeben durch eine Vektorfunktion
x : I ∋ t 7−→ (x01 + v1 t, x02 + v2 t, x03 + v3 t) ∈ R3 .
Dabei ist x0 = (x01 , x02 , x03 ) ∈ R3 ein Startpunkt“ der Bewegung, v = (v1 , v2 , v3 ) ∈ R3 der
”
Geschwindigkeitsvektor. Das Intervall I beschreibt den Zeitraum, für den die Bewegung existiert,
betrachtet werden soll. Setzt man x03 = v3 = 0, dann erhält man eine Bewegung in einer Ebene.
Beispiel 3.31 Eine gleichfürmige Kreisbewegung wird parametrisiert durch (wir verwenden
hier die elementare Betrachtungsweise der Sinus– und Cosinusfunktion)
x : R ∋ t 7−→ (r sin(ωt), r cos(ωt)) ∈ R2 .
Dabei ist r der Radius der Kreisbewegung und ω die Kreisfrequenz. Die minimale Zeit
T, die vergeht, bis ein Ausgangspunkt der Bewegung wieder erreicht wird, heißt Periode der
Bewegung. Sie ist hier gegeben durch
T :=
2π
.
ω
An diesem Beispiel sieht man, dass es viele Parameterdarstellungen für diesselbe Kurve geben
kann; hier ist eine andere:
y : R ∋ t 7−→ (r sin(ω(t + 2π)), r cos(ω(t + 2π)) ∈ R2 .
Definition 3.32
Sei I ein Intervall, sei x : I ∋ t 7−→ x(t) := (x1 (t), . . . , xn (t)) ∈ Rn , sei I ein offenes nichtleeres
Intervall und sei ξ ∈ I . Der Vektor z ∈ Rn heißt Ableitungsvektor/Geschwindigkeitsvektor
von x in ξ wenn gilt:
zi ist Ableitung von xi in ξ für jedes i = 1, . . . , n .
(3.18)
Da dieser Vektor eindeutig bestimmt ist, schreiben wir ẋ(ξ) für z .
Ist ẋ : I −→ Rn wiederum differenzierbar in ξ, dann schreiben wir ẍ(ξ) für die Ableitung und
nennen ẍ(ξ) zweite Ableitung/Beschleunigungsvektor. Die Schreibweise ẋ(ξ), ẍ(ξ) mag
etwas ungewöhnlich sein, sie deckt sich aber mit den Bezeichnungsgewohnheiten der Physiker.
Beispiel 3.33 Betrachte die Kreisbewegung
R ∋ t 7−→ (r cos(t), r sin(t)) ∈ R2 .
79
Hier haben wir
ẋ(t) = (−r sin(t), r cos(t)) , ẍ(t) = (−r cos(t), −r sin(t)) ,
wobei wir schon auf zweite Ableitungen zugegriffen haben. Beachte:
ẍ(t) + x(t) = θ , hx(t), ẋ(t)i = 0 = hẋ(t), ẍ(t)i für alle t ∈ R .
Sei x : I −→
Forderungen:
R3 eine Raumkurve mit Parameterintervall I . Wir betrachten folgende
Annahme 0: x sei dreimal differenzierbar.
Diese Kurve soll mit Geschwindigkeit vom Betrage 1 durchlaufen werden. Also:
Annahme 1: |ẋ| = 1 für alle t ∈ I .
über die Annahme 1 wird noch zu sprechen sein. Wir wollen nun zu jedem Zeitpunkt“ t ein
”
kartesiches Koordinatensystem an den Kurvenpunkt x(t) anhängen, das wir uns mitwandernd
denken können. Dazu betrachten wir:
d
d
hx(t), x(t)i = 2hx(t), ẋ(t)i , hẋ(t), ẋ(t)i = 2hẋ(t), ẍ(t)i .
dt
dt
Annahme 3: ẍ(t) 6= θ für alle t ∈ I .
Dies ergibt nun, dass die drei Vektorfunktionen
T := ẋ, N := ẍ|ẍ|−1 , B := T × N
zu jedem Zeitpunkt t eine Basis in R3 aus orthonormalen Vektoren bilden, welches ein Rechts–
Koordinatenssystem definiert. T heisst Tangentenvektor, N Krümmungsvektor, B Binormaleneinheitsvektor, κ := |ẍ| Krümmung, ρ := κ−1 Krümmungsradius.
Durch die drei Einheitsvektoren T, N, B werden
drei Ebenen festgelegt, die Namen tragen:
N
T
T, N : Schmiegeebene
N, B: Normalenebene
B, T : Rektifizierende Ebene
N
Etwa ist die Gleichung der Normalenebene bzw. der
Schmiegeebene durch x(t0 ) gegeben durch
B
T
hx − x(t0 ), T (t0 )i = 0 bzw. hx − x(t0 ), B(t0 )i = 0 .
B
Abbildung 3.7: Begleitendes Dreibein
In der Schmiegeebene verläuft die Bewegung infinitesimal, die Normalenebene steht infinitesimal senkrecht auf der Kurve, in der rektifizierenden Ebene wir infinitesimal die Länge der Kurve ermittelt.
Nun betrachten wir die Zeitabhängigkeit der Basis T, N, B genauer. Klar
Ṫ = ẍ = κN .
80
Man erhält Ḃ = Ṫ × N + T × Ṅ = κ(N × N ) + T × Ṅ = T × Ṅ , was bedeutet, dass Ḃ orthogonal
zu T ist; die Regel, wie man Kreuzprodukte differenziert, legt man sich leicht zurecht. Weil B
ein Einheitsvektor ist, ist Ḃ auch orthogonal zu B. Also ist folgender Ansatz
Ḃ = −τ N
zwingend. τ heisst die Torsion (Windung) der Kurve, σ := τ −1 Torsionsradius. Nun ist
N = B × T, da T, B, B × T eine Basis orthogonaler Vektoren in R3 ist. Also
Ṅ = Ḃ × T + B × Ṫ = −τ (N × T ) + κ(B × N ) = τ B − κT .
Wir halten die überlegungen fest in
Rechenregeln 3.34
T
Ṫ
:= ẋ , N := ẍκ−1 , B := T × N
:= κN , Ṅ := τ B − κT , Ḃ := −τ N .
(3.19)
(3.20)
Die Identitäten in (3.20) heissen Frenetsche Formeln. Das Vektortripel T, N, B heisst begleitendes Dreibein. Es ist ein Tripel paarweiser orthogonaler Vektoren und damit zu jedem
Zeitpunkt t eine Basis in R3 . Die differenzierten Größen Ṫ , Ṅ , Ḃ sind von Interessse, wenn
man die Bewegung eines Massenpunktes in den zwei Koordinatensystemen e1 , e2 , e3 und T, N, B
vergleicht.
Bei einer gleichfürmigen Bewegung ist die Voraussetzung ẍ 6= θ nicht zutreffend. In diesem
Falle nehme man T := ẋ, was ein konstanter Vektor ist, und ergänze T durch (beliebig gewählte
konstante ) Einheitsvektoren N, B zu einer orthogonalen Basis in R3 ; diese Basis verwende man
als begleitendes Dreibein.
Beispiel 3.35 Betrachte erneut eine gleichfürmige Kreisbewegung; siehe 3.31.
t
t
x : [0, 2πr] ∋ t 7−→ (r cos( ), r sin( ), 0) ∈ R3 .
r
r
Dabei haben wir es schon so eingerichtet, dass |ẋ(t)| = 1 für alle t gilt. Wir haben für alle
t ∈ [0, 2πr]:
t
t
1
t
1
t
T (t) = (cos( ), − sin( ), 0) , Ṫ (t) = (− sin( ), − cos( ), 0) ,
r
r
r
r
r
r
t
t
1
t 1
t
N (t) = (− sin( ), − cos( ), 0) , Ṅ (t) = (− cos( ), sin( ), 0) ,
r
r
r
r r
r
B(t) = (0, 0, −1) , Ḃ = (0, 0, 0) .
Als Krümmungsradius haben wir erwartungsgemäß ρ = r, für die Torsion folgt τ = 0 , was
ausdrückt, dass die Bewegung in einer Ebene erfolgt.
3.5
Sätze über stetige Funktionen
Die eingangs mit der Stetigkeit in Verbindung gebrachten Eigenschaft, den Graph in einem Zug
zu Papier bringen zu können, hat zu tun mit den folgenden Sätzen 3.36 und 3.37.
Satz 3.36
Sei I ein Intervall, sei g : I −→ R stetig in ξ ∈ I . Ist dann g(ξ) > 0, dann gibt es δ > 0 mit
g(t) > 0 für alle t ∈ (ξ − δ, ξ − δ) ∩ I .
81
Beweis:
Wir schließen mit der Folgenstetigkeitsdefinition; man überlege sich den Beweis auch für die
ε-δ–Definition.
Annahme: Für jedes δ > 0 gibt es ein t ∈ (ξ − δ, ξ + δ) mit g(t) ≤ 0 . Dies können wir nun für
die Folge (δn )n∈N mit δn := n1 realisieren. Dann erhalten wir dazu eine Folge (tn )n∈N mit
tn ∈ (ξ − δn , ξ + δn ) = (ξ −
1
1
, ξ + ) , g(tn ) ≤ 0 .
n
n
Also gilt ξ = limn tn und mit der Stetigkeit folgt g(ξ) = limn g(tn ) ≤ 0 ; siehe (1.12). Dies ist
aber im Widerspruch zur Tatsache g(ξ) > 0 .
Satz 3.37 (Zwischenwertsatz)
Sei g : [a, b] −→ R stetig. Ist dann g(a)g(b) < 0, dann gibt es ξ ∈ (a, b) mit g(ξ) = 0 .
Beweis:
Man erzeuge ausgehend vom Intervall [a, b] mittels Bisektion – siehe Algorithmus 1.4 für die
Funktion g(t) := t2 − 2 – eine Folge von Intervallen [un , vn ] mit g(un )g(vn ) < 0, wobei man das
Bisektionsverfahren abbrechen kann, wenn g(un )g(vn ) = 0 auftritt. Wir haben ja dann sicherlich
in un oder vn ein ξ mit g(ξ) = 0 gefunden. Tritt in endlich vielen Schritten g(un )g(vn ) =
0 nicht auf, dann erhält man eine monoton wachsende Folge (un )n∈N , eine monoton fallende
Folge (vn )n∈N , die beide konvergent sind, da sie im beschränkten Intervall [a, b] liegen, mit
übereinstimmendem Grenzwert ξ , da wir immer Intervalle halbiert haben. Dann gilt aber 0 ≥
limn g(un )g(vn ) = g(ξ)g(ξ) ≥ 0 . Also haben wir g(ξ) = 0 .
Beispiel 3.38 Betrachte die Gleichung
p(x) := x17 − πx − 1.001 = 0 .
Wir haben p(0) = −1.001 < 0 , p(2) > 0 ; beachte π ≤ 4 . Also besitzt die obige Gleichung nach
Satz 3.36 eine Lösung, da wir es bei p sicherlich mit einer stetigen Funktion zu tun haben.
Hier ist anzumerken, dass der Zwischenwertsatz von vorneherein eine Nullstelle signalisiert.
Denn ein Polynom p ungeraden Grades hat immer die Eigenschaft, dass ein Vorzeichenwechsel
stattfindet, dank der Tatsache, dass die höchste Potenz das Wachstum des Polynoms bestimmt.
Bemerkung 3.39 Die Bezeichnung Zwischenwertsatz“ für den Sachverhalt aus Satz 3.37 sieht
”
zunächst etwas überzogen aus, da ja nur ein Zwischenwert angenommen wird. Hat man aber
irgendeinen Wert η zwischen g(a) und g(b), so setze man h(x) := g(x) − η, x ∈ [a, b] und wende
nun Satz 3.37 auf h an, was ein ξ ergibt mit 0 = h(ξ) = g(ξ) − η (beachte: h(a)h(b) ≤ 0, da η
zwischen g(a) und g(b) liegt).
Definition 3.40
Sei f : R ⊃ D −→ R . Wir nennen ξ, η ∈ D ein
Maximum, falls f (ξ) ≥ f (t) für alle t ∈ D,
Minimum, falls f (ξ) ≤ f (t) für alle t ∈ D .
Minima und Maxima zusammen nennen wir Extrema.
Zur Vorbereitung für die Beantwortung der Frage nach Extrema bei Funktionen haben wir
aus der Vollständigkeit der reellen Zahlen noch ein Ergebnis abzuleiten. Der Begriff der Teilfolge
ist dabei nötig.
82
Definition 3.41
(xnk )k∈N heißt Teilfolge der Folge (xn )n∈N , wenn die Folge (nk )k∈N eine streng monoton wachsende Folge natörlicher Zahlen ist, d.h. wenn nk < nk+1 , nk ∈ N , k ∈ N , gilt.
Ein richtungsweisendes Beispiel ist die Folge
1, −1, 1, −1, 1, . . . .
Sie hat mindestens zwei Teilfolgen, die konvergent sind: 1, 1, 1, . . . und −1, −1, −1, . . . . Beachte,
dass das Wort mindestens“ seine Bedeutung hat. Etwa wäre auch
”
1, −1, 1, −1, −1, −1, −1, . . .
eine konvergente Teilfolge, denn man darf eine Folge immer an endlich vielen Stellen abändern,
ohne die Konvergenzeigenschaft zu beeinträchtigen.
Satz 3.42 (Satz von Bolzano–Weierstraß)
Jede beschränkte Folge besitzt eine Teilfolge, die konvergent ist.
Beweis:
Sei (xn )n∈N eine beschränkte Folge; α := supn∈N xn , β := supn∈N xn . Sei A := {m ∈ N|xn <
xm für alle n > m} . Ist #A = ∞ und A durch {mk |k ∈ N} monoton wachsend aufgezählt, so
ist (xmk )k∈N eine monoton fallende Teilfolge. Ist #A < ∞, so gibt es offenbar eine monoton
wachsende Teilfolge.
O.E. sei die Teilfolge monoton wachsend. Da die Folge (xn )n∈N durch α nach oben beschränkt
ist, ist auch diese Teilfolge beschränkt und sie konvergiert als monoton wachsende Folge gegen
α.
Hier ist nun auch der Platz, die Beziehung von der Konvergenz von Folgen zur Vollständigkeit
der reellen Zahlen abzurunden.
Definition 3.43
Eine Folge (xn )n∈N heißt Cauchyfolge, wenn gilt:
∀ ε > 0 ∃ N ∈ N ∀ n, n ≥ N (|xn − xm | < ε) .
(3.21)
Folgerung 3.44
Sei (xn )n∈N eine Folge. Es sind äquivalent:
(a)
(xn )n∈N ist konvergent.
(b) (xn )n∈N ist eine Cauchyfolge.
Beweis:
Zu (a) =⇒ (b).
Sei x := limn xn . Sei ε > 0. Wähle N ∈ N mit
|xn − x| < ε für alle n ≥ N .
Dann gilt
|xn − xm | ≤ |xn − x| + |xm − x| < 2ε für alle n, m ≥ N .
83
Zu (b) =⇒ (a).
Zunächst zeigen wir, dass eine Cauchyfolge stets beschränkt ist. Sei dazu zu ε := 1 ein N ∈ N
gewählt mit |xn − xm | < 1 für alle n, m ≥ N . Dann ist
|xn | ≤ |xn − xN | + |xN | ≤ 1 + |xN | für alle n ≥ N .
Da es auf endlich viele Folgenglieder bezüglich Beschränktheit nicht ankommt, ist die Beschränktheit gezeigt.
Nach Satz 3.42 gibt es eine konvergente Teilfolge; etwa x = limk xnk . Dann konvergiert aber die
ganze Folge gegen x, wie man wie folgt einsehen kann. Sei ε > 0. Wähle K ∈ N mit |xnk − x| < ε
für alle k ≥ K und wähle N ∈ N mit |xn − xm | < ε für alle n, m ≥ N . Sei N ′ := max(nK , N ).
Dann gilt für n ≥ N ′
|xn − x| ≤ |xn − xnK | + |xnK − x| < ε + ε = 2ε .
Satz 3.45 (Weierstrass)
Sei f : [a, b] −→ R stetig. Dann gibt es u, v ∈ [a, b] mit
min f (t) = f (u) ≤ f (v) = max f (t) .
t∈[a,b]
t∈[a,b]
Beweis:
Offenbar sind u, v ∈ [a, b] gesucht mit
f (u) = inf f (t) , f (v) = sup f (t).
t∈[a,b]
t∈[a,b]
Zur Existenz von u.
Annahme: {f (t)|t ∈ [a, b]} ist nicht nach unten beschränkt.
Dann gibt es eine Folge (tn )n∈N mit tn ∈ [a, b], f (tn ) < −n für alle n ∈ N. Da die Folge (tn )n∈N
beschränkt ist, besitzt sie nach Satz 3.42 eine konvergente Teilfolge (tnk )k∈N ; z := limk tnk . Da
f stetig ist, gilt f (z) = limk f (tnk ) = −∞ . Dies ist aber ein Widerspruch.
Also ist nun {f (t)|t ∈ [a, b]} nach unten beschränkt und es existiert inf t∈[a,b] f (t) . Offenbar
gibt es daher eine Folge (tn )n∈N mit tn ∈ [a, b], n ∈ N, und limn f (tn ) = inf t∈[a,b] f (t) . Da die
Folge (tn )n∈N beschränkt ist, besitzt sie nach Satz 3.42 eine konvergente Teilfolge (tnk )k∈N ; u :=
limk tnk . Da f stetig ist, gilt f (u) = limk f (tnk ) = limn f (tn ) = inf t∈[a,b] f (t) .
Zur Existenz von v.
Beweise analog oder beachte, dass
sup f (t) = − inf (−f )(t)
t∈[a,b]
t∈[a,b]
ist.
Bemerkung 3.46 Es lohnt sich, hier einen Blick auf die Zusammenhänge zu werfen: sowohl der
Zwischenwertsatz 3.37 als auch der Existenzsatz 3.45 basiert in der Konvergenz von monotonen
Folgen auf der Vollständigkeit der reellen Zahlen.
Der obige Satz 3.45 besagt, dass eine stetige Funktion auf einem abgeschlossenem beschränkten Intervall Minimum und Maximum annimmt.
84
Definition 3.47
Sei I ein Intervall und sei f : I −→ R . f heißt gleichmäßig stetig, wenn gilt:
∀ ε > 0 ∃ δ > 0 ∀ x, z ∈ D (|x − z| < δ =⇒ |f (x) − f (z)| < ε) .
Satz 3.48
Sei f : [a, b] −→ R stetig. Dann ist f gleichmäßig stetig.
Beweis:
Annahme: f ist nicht gleichmäßig stetig.
1 aber |f (x )−f (z )| >
Dann gibt es ein ε > 0 und zu jedem n ∈ N xn , zn ∈ [a, b] mit |xn −zn | < n
n
n
ε . Daraus folgt mit dem Satz von Bolzano Weierstrass 3.42 die Existenz von konvergenten
1
Teilfolgen von (xn )n∈N , (zn )n∈N . O.E. limn xn = x, limn zn = z . Auf Grund von |xn − zn | < n
für alle n ∈ N, folgt x = z und schließlich mit der Stetigkeit |f (x) − f (z)| ≥ ε > 0 , was ein
Widerspruch ist.
Beispiel 3.49 Das Standardgegenbeispiel zu Satz 3.48 ist die stetige Funktion f : (0, 1) ∋
1 ∈ R . Sie ist nicht gleichmäßig stetig, wie man an
x 7−→ x
xn :=
1
1
1
, zn :=
, f (xn ) = n, f (zn ) = 2n, |xn − zn | =
, |f (xn ) − f (zn )| = n , n ∈ N,
n
2n
2n
abliest.
3.6
Sätze über differenzierbare Funktionen
Satz 3.50
Sei f : [a, b] −→ R , und sei ξ ∈ (a, b) mit f (ξ) = max f (t) oder f (ξ) = min f (t) .
t∈[a,b]
t∈[a,b]
Ist f differenzierbar in ξ, so gilt f ′ (ξ) = 0 .
Beweis:
Sei etwa f (ξ) = max f (t) . Wir haben f (t) ≤ f (ξ) für alle t ∈ [a, b]. Folglich ist
t∈[a,b]
und daher f ′ (ξ) = 0 .
f (t) − f (ξ)
t−ξ
≥ 0,
≤ 0,
falls t < ξ
falls t > ξ
Man beachte, dass die Aussage des obigen Satzes so nur gilt, weil ξ ∈ [a, b]\{a, b} ist. Vergleiche etwa mit f : [−1, 1] ∋ t 7−→ t ∈ R .
Satz 3.50 ist ein Baustein für die Diskussion des änderungsverhaltens von Funktionen: er
gestattet es, Kandidaten für Maxima (Hochpunkte) und Minima (Tiefpunkte) – man ersetze f
durch −f – auszusortieren.
Welche Bahn beschreibt ein Lichtstrahl in einem (inhomogenen) Medium? Eine erste Antwort
auf diese Frage geht zurück auf Hero von Alexandrien4 Er zeigt, dass ein Lichtstrahl bei der
Reflektion an einem Spiegel den kürzesten Weg vom Objekt zum Auge des Betrachters nimmt.
Fermat5 stützt seine Antwort auf die physikalische Annahme, dass Licht sich mit endlicher
Geschwindigkeit ausbreitet und diese Geschwindigkeit in dichterem Medium kleiner ist als in
einem dünneren Medium (Descartes ging vom Gegenteil aus!). Sein Extremalprinzip lautet:
Der Lichtstrahl nimmt die Bahn, die in kürzester Zeit durchlaufen wird.
4
5
Hero von Alexandrien, um 125 v. Chr.
Fermat, Pierre de, 1607 – 1662
85
Für den Fall zweier homogener Medien, die durch
eine Ebene getrennt sind, bedeutet dies (siehe Abbildung 3.8):
d
A
Mache
a
1p
1p 2
a + x2 +
(d − x)2 + b2
t(x) :=
c1
c2
α
O
bezüglich x minimal.
Dabei sind c1 , c2 die Ausbreitungsgeschwindigkeiten
des Lichtes im Medium 1 bzw. 2.
Als notwendige Bedingung erhalten wir – Fermat
hatte dazu schon die entsprechenden Kenntnisse, wir
bedienen uns der entwickelten Ergebnisse –
c1
d.h.
Daher
√
1
x
α2
b
B
Abbildung 3.8: Brechung von Licht
d−x
x
=0
− p
2
2
a +x
c2 (d − x)2 + b2
1
x
1 d−x
·
·
=
.
c1 |AO|
c2 |OB|
sin α2
sin α1
=
.
c1
c2
(3.22)
Fermat hat auch gezeigt, dass diese Bedingung hinreichend dafür ist, dass der Weg A OB die
kürzeste Laufzeit besitzt. Das Gesetz (3.22) wurde von Snellius (1621) am Beispiel der Lichtstrahlen entdeckt.
Satz 3.51 (Satz von Rolle)
Sei f : [a, b] −→ R stetig und in (a, b) differenzierbar. Sei f (a) = f (b) . Dann gibt es ξ ∈ (a, b)
mit f ′ (ξ) = 0.
Beweis:
Ist f identisch Null, ist nichts zu beweisen. Also sei f nicht identisch Null. O.E. gibt es dann
t ∈ (a, b) mit f (t) > 0. Nach Satz 3.45 gibt es ξ ∈ (a, b) mit
f (ξ) = max f (t) .
t∈[a,b]
Da f (a) = f (b) = 0, f (ξ) ≥ f (t) > 0 gilt, ist ξ 6= a, ξ 6= b . Dann ist nach Satz 3.50 f ′ (ξ) = 0 . Eine Konsequenz aus dem Satz von Rolle ist, dass ein Polynom m–ten Grades höchstens m
Nullstellen besitzen kann, da zwischen je zwei Nullstellen jeweils eine Nullstelle der 1. Ableitung
liegt und diese 1. Ableitung ein Polynom (m − 1)–ten Grades ist.
Satz 3.52 (Mittelwertsatz der Differentialrechnung)
Seien f, g : [a, b] −→ R stetig und differenzierbar in (a, b). Sei g′ (x) 6= 0 für alle x ∈ (a, b).
Dann gibt es ξ ∈ (a, b) mit
f ′ (ξ)
f (b) − f (a)
(3.23)
= ′
g(b) − g(a)
g (ξ)
86
Beweis:
Betrachte
h : [a, b] ∋ t 7−→ f (a) +
f (b) − f (a)
(g(t) − g(a)) ∈ R.
g(b) − g(a)
Da g′ (t) 6= 0 für alle t ∈ [ab] vorausgesetzt ist, ist nach Satz 3.51 g(b) 6= g(a) . Es gilt h(a) =
f (a), h(b) = f (b) und nach dem Satz von Rolle, angewendet auf h − f, gibt es ξ ∈ (a, b) mit
h′ (ξ) − f ′ (ξ) = 0 , d. h.
f (b) − f (a) ′
g (ξ) = f ′ (ξ).
g(b) − g(a)
Die wichtigste Anwendung von Satz 3.52 ergibt sich mit g(x) := x. Dann kann man die
Formel (3.23) auch so lesen:6
Es gibt ϑ ∈ (0, 1) mit f (b) = f (a) + f ′ (a + ϑ(b − a))(b − a) .
(3.24)
Eine Konsequenz des Satzes 3.52 ist auch, dass eine differenzierbare Funktion durch die Ableitungsfunktion bis auf eine Konstante schon eindeutig bestimmt ist: ist f ′ = g′ , so ergibt eine
Anwendung des Mittelwertsatzes auf h := f − g die Aussage f (t) = g(t) + (f (a) − g(a)) für
alle t . Im Zusammenhang mit Stammfunktionen kommen wir darauf zurück. Hier halten wir
dazu noch fest, dass – in physikalischer Betrachtung – eine Bewegung durch die Angabe der
Beschleunigung und der Anfangswerte“ für den Ortsvektor und die Geschwindigkeit festgelegt
”
ist, d.h.
Aus ẍ = ÿ, x(t0 ) = x(t0 ), ẋ(t0 ) = ẏ(t0 ) folgt x = y .
Folgerung 3.53 (Regel von de l’Hospital)
Sei I = (a, b) ein offenes Intervall mit b ∈ R oder b = ∞ . Seien f, g : I −→ R zwei differenzierbare Funktionen mit der Eigenschaft
lim f (x) = lim g(x) = 0 , g′ (x) 6= 0 für alle x ∈ I .
x→b
x→b
Dann ist g(x) 6= 0 für alle x ∈ I , und es gilt
f (x)
f ′ (x)
,
= lim
′
x→b g(x)
x→b g (x)
c := lim
falls c existiert.
Beweis:
Sei zunächst b ∈ R . Dann kann man f, g zu fˆ, ĝ auf (a, b] fortsetzen, indem man fˆ(b) := ĝ(b) := 0
setzt. Dann sind fˆ, ĝ stetig in (a, b] und differenzierbar in (a, b) . Nach dem Mittelwertsatz ist
g(x) = ĝ(x) = ĝ(x) − ĝ(b) = (x − b)ĝ′ (ξ) = g′ (ξ) mit einer Zwischenstelle ξ für x ∈ (a, b) .
Also haben wir g(x) 6= 0 für alle x ∈ (a, b) . Nach dem Mittelwertsatz 3.52 lässt sich zu jedem
x ∈ (a, b) ein ξ = ξ(x) ∈ (x, b) finden mit
f (x) − f (b)
f ′ (ξ(x))
f (x)
=
= ′
.
g(x)
g(x) − g(b)
g (ξ(x))
Wenn nun x gegen b strebt, dann strebt auch ξ(x) gegen b und die Behauptung ist für b < ∞
bewiesen.
Den Beweis der Behauptung im Falle b = ∞ überlassen wir dem Leser.
6
In dieser Form geht der Satz 3.52 auf J.L. Lagrange zurück.
87
Satz 3.54 (Taylorsche Formel)
Sei f : (a, b) −→ R (n + 1)–mal differenzierbar; n ∈ N0 . Seien t0 , t ∈ (a, b). Dann gibt es
ϑ ∈ (0, 1) mit
f (t) =
n
X
1
1 (j)
f (t0 )(t − t0 )j +
f (n+1) (t0 + ϑ(t − t0 ))(t − t0 )n+1 .
j!
(n + 1)!
(3.25)
j=0
Beweis:
n
P
1 f (j) (x)(t + h − x)j , x ∈ (a, b). Es ist
Setze h := t − t0 ) , F (x) :=
0
j!
j=0
n
X
1 (j)
f (t0 )hj , F (t0 + h) = f (t0 + h).
F (t0 ) =
j!
j=0
Ferner ist F differenzierbar und es gilt
F ′ (x) =
n
n
X
X
1 (j+1)
1
f
(x)(t0 + h − x)j −
f (j) (x)(t0 + h − x)j−1
j!
(j − 1)!
j=0
=
j=1
1 (n+1)
f
(x)(t0 + h − x)n .
n!
Nach dem Mittelwertsatz folgt mit g(x) := (t0 + h − x)n+1 (siehe (3.24) und beachte g′ (x) =
6 0
für x 6= t0 + h)
F (t0 + h) − F (t0 )
F ′ (t0 + ϑh)
,
= ′
g(t0 + h) − g(t0 )
g (t0 + ϑh)
n
P
1 (j)
1
d.h. f (t0 + h) = F (t0 + h) =
(t0 )hj + (n+1)!
f (n+1) (t0 + ϑh)hn+1 .
j! f
j=0
Die Formel (3.25) heißt Taylorsche Formel mit Lagrangeschem Restglied. Für n = 0
reduziert sich die Formel auf den Mittelwertsatz. Für n ≥ 1 spricht man von der Taylorentwicklung von f bis zum n–ten Glied. Der Term
n
X
1 (j)
f (t0 )(t − t0 )j
j!
j=0
heißt das Taylorpolynom von f im Entwicklungspunkt t0 , der Term
Rn,t0 f :=
1
f (n+1) (t0 + ϑ(t − t0 ))(t − t0 )n+1
(n + 1)!
wird das zugehörige Lagrangesche Restglied genannt. Für n = 1 ist das Taylorpolynom eine
lineare Approximation von f , für n = 2 ist es eine Approximation durch ein quadratisches Polynom, das in t0 mit f in der null–ten, in der ersten und in der zweiten Ableitung übereinstimmt.
Wir werden im nächsten Abschnitt die Exponentialfunktion R ∋ t 7−→ exp(t) ∈ R kennenlernen und dabei auch erfahren, dass exp′ (x) = exp(x) gilt für alle x ∈ R . In Abbildung 3.9 sind
Taylorpolynome von x 7−→ exp(2x) festgehalten.
Verwendet man die Taylorsche Formel für n = 1, so haben wir
1
f (t) = f (t0 ) + f ′ (t0 )(t − t0 ) + f ′′ (ξ)(t − t0 )2
2
88
mit einem ξ zwischen t und t0 . Daraus liest
man ab:
• Ist f (t0 ) = maxt∈(t0 −δ,t0 +δ) f (t) für ein
δ > 0, dann ist f ′′ (t0 ) ≥ 0 .
6
• Ist f ′ (t0 ) = 0 und f ′′ (t0 ) > 0 für ein δ >
0, dann ist f (t0 ) = maxt∈(t0 −δ,t0 +δ) f (t) .
Dabei ist vorauszusetzen, dass f ′′ stetig
ist.
4
Diese Aussagen sind die elementaren Bausteine für die Kurvendiskussion.“
”
2
Bemerkung 3.55 Mit der Taylorentwicklung lassen sich Aussagen über den Fehler
bei der Berechnung von f (x) machen, wenn
das Argument x fehlerbehaftet ist. Ist x̃ eine
Näherung von x mit Fehlertoleranz |x− x̃| ≤ δ,
dann gilt für den Fehler η := |f (x)−f (x̃)| nach
Satz 3.52 die Abschätzung
–1.5
3.7
x
–0.5
0
0.5
1
–2
Abbildung 3.9: Taylorpolynome: x 7−→ exp(2x)
η = |f (x) − f (x̃)| = |f ′ (ξ)||x − x̃| = |f ′ (ξ)|δ
mit einem ξ zwischen x, x̃ .
–1
Reihen
Der Grenzübergang n → ∞ in der Formel (3.25) ist manchmal möglich und manchmal nicht.
Dies wollen wir nun verstehen lernen. Zunächst einige Vorbereitungen zum Thema Reihen“.
”
Viele Zahlenfolgen (xn )n∈N sind von der Form
xn =
n
X
j=0
aj , n ∈ N ,
wobei (an )n∈N0 selbst eine Zahlenfolge ist. Dass eine Reihe manchmal mit einem Summationsindex j ≥ 1 beginnt, ist nicht bedeutend: man nummeriere einfach um!
Definition 3.56
P
Der Ausdruck ∞
Sei (an )n∈N0 eine Zahlenfolge.
j=0 aj heißt die zugehörige Reihe. Wenn der
Pn
Grenzwert s := limn j=0 aj der Partialsummen existiert, so nennen wir die Reihe konvergent und s ihren (Reihen–)Wert, anderenfalls nennen wir die Reihe divergent. Wir schreiben
s=
∞
X
aj .
j=0
(Wir verwenden das Reihensymbol also zweifach: als Schreibweise für eine vorgelegte Reihe und
als Reihenwert.)
89
Die KonvergenzP
der Reihe ist unter Verwendung der Definition von Konvergenz bei Folgen so
auszusprechen: ∞
j=0 aj ist konvergent genau dann, wenn gilt:
∀ ε > 0 ∃N ∈ N ∀ n ≥ N (|
∞
X
j=n+1
aj |< ε).
Lemma 3.57P
Ist die Reihe ∞
j=0 aj konvergent, dann ist (an )n∈N eine Nullfolge.
Beweis:
Sei x der Grenzwert der vorgelegten Reihe. Dann folgt die gewünschte Aussage aus


n
n
n+1
n+1
X
X
X
X
aj  = lim an+1 .
aj = lim 
aj −
aj − lim
0 = x − x = lim
n
j=0
n
n
j=0
j=0
j=0
n
Beispiel 3.58 Wir betrachten die harmonische Reihe, d.h. die Folge (hn )n∈N , die beim Aufsummieren der Folge der Stammbrüche entsteht; also:
hn :=
n
X
1
j=1
j
, n ∈ N.
Diese Folge ist nicht konvergent, da sie nicht beschränkt ist, wie folgende Überlegung zeigt:
h2n
1 1
1 1 1 1
1
1
1
+ ( + ) + ( + + + ) + · · · + ( n−1
+ ··· + n)
2
3 4
5 6 7 8
2
+1
2
1 1
1
1
1
1
1
≥ 1 + + ( + ) + ( + ··· + ) + ··· + ( n + ··· + n)
2
4 4
8
8
2
2
1 1 1
n
1
= 1 + + + + ··· + = 1 + .
2}
2
|2 2 2{z
= 1+
n−mal
Also divergiert die harmonische Reihe
nicht umkehrbar ist.
P∞
1
j=1 j
und wir sehen, dass das Resultat aus Lemma 3.57
Lemma 3.59 (Bernoullische Ungleichung)
Für h > −1 und m ∈ N gilt:
(1 + h)m ≥ 1 + mh .
(3.26)
Beweis:
Mit vollständiger Induktion: m = 1: Klar.
m + 1: (1 + h)m+1 = (1 + h)m (1 + h) ≥ (1 + mh)(1 + h) = 1 + (m + 1)h + mh2 ≥ (1 + (m + 1)h .
Beispiel 3.60 Sei |q| < 1 . Dann ist limn q n = 0 . Dies sieht man so für q 6= 0 so ein:
Da |q| < 1 ist, gilt |q|−1 > 1 . Also können wir schreiben: |q|−1 = 1 + h mit h > 0 . Dann folgt
mit Lemma 3.59
1
1
, n ∈ N,
≤
|q|n =
(1 + h)n
1 + nh
woraus man die Aussage abliest.
90
Beispiel 3.61 Das wohl wichtigste Beispiel einer Reihe ist die geometrische Reihe7 , d.h. die
Folge
n
X
q j , n ∈ N0 .
(sn )n∈N0 mit sn :=
j=0
Es gilt offenbar – belege dies mit vollständiger Induktion oder sonstwie –
sn =
1 − q n+1
, n ∈ N , falls q 6= 1, und sn = n + 1 , falls q = 1 .
1−q
Daraus schließt man mit Beispiel 3.60 sofort auf
∞
X
1
lim sn =
q j , falls |q| < 1 .
=
n
1−q
j=0
Beispiel 3.62 Wir betrachten die Reihe
P∞
j=1
1 . Wir haben
j2
n
n
n
X
X
X
1
1
1
1
1
0≤
(
=
− ) = 1 − ≤ 1.
2 ≤
j(j − 1)
j−1 j
n
j
j=2
j=2
j=2
Also ist die Folge der zugehörigen Partialsummen nach oben beschränkt und sicherlich monoton
wachsend, und daher konvergent. Wir wissen auch, dass für den Reihenwerts s gilt: s ≤ 2 .
Übrigens, mit ziemlich viel Aufwand kann man
∞
π2 X 1
=
6
j2
j=1
beweisen.
7
Das Paradoxon von Zenon ist:
Ein Läufer, der eine bestimmte Strecke zwischen zwei Punkten zurücklegen will, muss zuerst die Hälfte der
Entfernung überwinden, dann die Hälfte des verbleibenden Weges, davon wieder die Hälfte und immer so weiter.
Dies erfordert laut Zenon eine unendliche Anzahl von Schritten, und so würde der Läufer nie an sein Ziel gelangen.
Natürlich wusste auch Zenon sehr gut, dass der Läufer seinen Bestimmungsort nach einer endlichen Zeitspanne
erreicht, doch löste er das Paradoxon nicht auf. Die Auflösung geschieht durch folgende Beobachtung:
Indem der Läufer erst die Hälfte der Gesamtstrecke zurücklegt, dann die Hälfte der verbleibenden Hälfte usw.,
bewältigt er eine Entfernung, die der Summe
1
1
1
+ + ··· ,
2
4
8
entspricht. Diese unendliche Summe“ hat die Eigenschaft, dass sie nie den Wert 1 erreicht und überschreitet, aber
”
beliebig“ nahe an 1 herankommt. Nehmen wir nun an, dass der Läufer eine konstante Geschwingkeit beibehält.
”
Die Zeitintervalle, die er benötigt, um die entsprechende Entfernung zurückzulegen, folgen dann ebenfalls dem
Gesetz
1
1
1
+ + ···
2
4
8
und so erreicht er sein Ziel in einer endlichen Zeitspanne, da er für den Halbierungsprozess nur die Zeitspanne 1
unterwegs ist, da die Folge
n
X
1
xn :=
, n ∈ N,
i
2
i=0
nach unserem Wissen über die geometrische Reihe gegen die Zeit 1 konvergiert. Das Paradoxon ist damit aufgeklärt.
91
P
Hat man eine Reihe ∞
j=1 aj auf Konvergenz zu untersuchen, dann kann man Vergleichsreihen dazu heranziehen:
P∞
Man verschaffe sich
eine
konvergente
Reihe
mit |aj | ≤ bj , j ∈ N0 . Dann
j=1 bj P
P∞
konvergiert auch j=1 |aj | und damit sicherlich auch ∞
j=1 aj .
P∞
j=1 bj nennt man in diesem Zusammenhang eine Majorante. Die geometrische Reihe dient
häufig als Vergleichsreihe/Majorante für zu untersuchende Reihen.
Satz 3.63 (Konvergenzkriterium)
∞
P
Betrachte die Reihe
aj .
j=0
a) Die Reihe konvergiert, falls gilt:
∃ q ∈ [0, 1) ∃K ∈ N0 ∀ k ≥ K (|ak+1 | ≤ q|ak |) .
(3.27)
b) Die Reihe divergiert, falls gilt:
∃ q ∈ (1, ∞) ∃K ∈ N0 ∀ k ≥ K (|ak+1 | ≥ q|ak |) .
(3.28)
Beweis:
Zu a) .
Da es auf endlich viele Summanden in der Reihe nicht ankommt, können wir K = 0 annehmen.
Man zeigt dann induktiv:
|ak | ≤ q k |a0 | für alle k ∈ N0 .
P
j
Also ist die geometrische ∞
j=0 q eine konvergente Majorante.
Zu b) . P
j
Hier ist ∞
j=0 q eine divergente ”Minorante“.
Bemerkung 3.64 Die Voraussetzung (3.27) ist etwa erfüllt, wenn limk |ak+1 ||ak |−1 < 1 gilt.
Den Beweis dazu überlassen wir dem Leser. In dieser Fassung bezeichnet man den Satz 3.63
dann als Quotientenkriterium.
p
Die Voraussetzung (3.27) ist auch erfüllt, wenn limk k |ak | < 1 gilt. Den Beweis dazu überlassen
wir erneut dem Leser. In dieser Fassung bezeichnet man den Satz 3.63 dann als Wurzelkriterium.
p
P
−1 = 1 oder lim k |a | =
Bemerkung 3.65 Betrachte die Reihe ∞
k
k
j=0 aj . Falls limk |ak+1 ||ak |
1 ist, so ist sowohl Konvergenz als auch Divergenz der Reihe möglich.
P
Bisher haben wir die Konvergenz der Reihe ∞
j=0 aj über Kriterien nachgewiesen, die sogar
die P
absolute Konvergenz der Reihe impliziert haben, d.h. die sogar die Konvergenz der Reihe ∞
j=0 |aj | sichergestellt haben. Für ”alternierende Reihen“ kann man damit möglicherweise
nichts gewinnen.
Satz 3.66 (Leibnizkriterium)
P
j a . Es gelte 0 ≤ a
Betrachte die reelle Reihe ∞
n+1 ≤ an , n ∈ N0 , und limn an = 0 .
j=0 (−1)
P∞ j j
Dann konvergiert die Reihe s := j=0 (−1) aj und es gelten für n ≥ 0 :
a)
2n+1
P
j=0
(−1)j aj ≤ s ≤
2n
P
(−1)j aj (Einschlies̈ung).
j=0
92
b) |s −
n
P
(−1)j aj | ≤ an+1 (Fehlerabschätzung).
j=0
Beweis: P
Sei sn := nj=0 (−1)j aj . Man rechnet mit der Monotonie der Folge (an )n∈N0 leicht
s2n ≥ s2n+2 , s2n+1 ≤ s2n+3 , n ∈ N0 ,
nach. Damit folgt
s1 ≤ s2n+1 ≤ s2n + a2n+2 ≤ s2n+2 ≤ s0 , n ∈ N0 .
Also ist die Folge (s2n )n∈N0 monoton fallend und (s2n+1 )n∈N0 monoton wachsend. Da die erste
Folge durch s1 nach unten und die zweite Folge durch s0 nach oben beschränkt ist, konvergieren
beide. Wegen
lim s2n+1 − lim s2n = lim(s2n+1 − s2n ) = −a2n+1 = 0
n
n
n
haben beide denselben Grenzwert. Dann konvergiert also die gegebene Reihe. Die obigen Ungleichungen zeigen insbesondere, dass der Grenzwert s die Ungleichung
s2n+1 ≤ s ≤ s2n
erfüllt. Die Abschätzung aus b) liest man aus
s2n − s ≤ s2n − s2n+1 = a2n+1 , s − s2n+1 ≤ s2n+2 − s2n+1 = a2n+2
ab.
Beispiel 3.67 Sei (sn )n∈N die Folge der Partialsummen der alternierenden harmonischen
Reihe
∞
X
1
(−1)j+1 .
j
j=1
Aus dem Leibnizkriterium folgt die Konvergenz dieser Reihe. Beachte, die majorisierende harmonische Reihe ist divergent!
3.8
Potenzreihen
Wir wenden uns nun Funktionen zu, die durch Reihen erklärt sind.
Definition 3.68
Eine Reihe der Form
∞
X
k=0
ak (t − t0 )k
wird eine Potenzreihe genannt. a0 , a1 , . . . sind die Koeffizienten, t0 ist der Entwicklungspunkt der Potenzreihe.
Wir haben es in Definition 3.68 vermieden, von einer Funktion zu sprechen, obwohl wir natörlich
die Funktion
∞
X
t 7−→
ak (t − t0 )k
k=0
im Auge haben. Damit diese Betrachtung aber Sinn macht, muss erst die Konvergenzfrage geklärt
werden. Wie lässt sich die Konvergenz einer Potenzreihe ermitteln? Wir kennen aus Lemma 3.57
93
jedenfalls schon die Bedingung, dass für die Konvergenz der Reihe für ein t erforderlich ist, dass
limn an (t − t0 )n = 0 gilt. Haben wir eine Abschätzung für die Koeffizienten der Form
|ak | ≤ cak , k ∈ N,
dann können wir die geometrische Reihe als Majorante einsetzen, da wir durch die Wahl von
t sicherstellen können, dass q := a|t − t0 | < 1 ist. Mit einer detailierteren Betrachtungsweise
kommen wir zu einem Ergebnis, das uns dann erlaubt, Potenzreihen auf seinem natörlichen“
”
Definitionsbereich als Funktionen zu betrachten.
Satz 3.69
P
k
Sei die Potenzreihe ∞
k=0 ak (t − t0 ) betrachtet. Dann gibt es R mit R ∈ [0, ∞) oder R = ∞, so
dass folgende Aussagen gültig sind:
(a)
Für |t − t0 | < R konvergiert die Potenzreihe.
(b) Für |t − t0 | > R divergiert die Potenzreihe.
(c)
Für die Randpunkte t = t0 − R, t = t0 + R kann Konvergenz oder Divergenz vorliegen.
Beweis:
Sei p eine Zahl mit folgender Eigenschaft:
Es gibt N ∈ N mit
p
k
|ak | ≤ p für alle k ≥ N .
Wenn keine solche Zahl existiert, setzen wir q := ∞. Anderenfalls sei q die kleinste Zahl unter
diesen Zahlen. Sie existiert, da diese Zahlen p durch 0 nach unten beschränkt sind. Damit setzen
wir


1/q , falls q ∈ (0, ∞)
R := ∞
, falls q = 0


0
, falls q = ∞
Zu a).
Wir betrachten nur den Fall 0 < R < ∞, den Fall R = ∞ überlassen wir dem Leser.
Sei |t − t0 | < R . Dann können wir δ > 0 wählen mit |t − t0 | < (q + δ)−1 . Da q + δ > q = R−1 ist,
gibt es N ∈ N mit |ak | ≤ (q + δ)k , k ≥ N . Dann ist aber |ak (t − t0 )k | ≤ (q + δ)k |t − t0 |k , k ≥ N,
und wir können die geometrische Reihe als Majorante verwenden.
Für (b) kann man eine divergente geometrische Reihe als Minorante verwenden.
(c) wird durch Beispiele geklärt.
Die Zahl R aus Satz 3.69 heißt Konvergenzradius und das Intervall (t0 − R, t0 + R) das
Konvergenzintervall der vorgelegten Potenzreihe.8 Der Konvergenzradius ist – in einer Formulierung, die wir noch begränden werden – gegeben durch
1
.
R = lim inf p
k
k
|ak |
p
−1
(R ist kleinster Häufungspunkt der Folge ( k |ak | )k∈N .) Es gilt auch
(3.29)
|ak |
1
,
= lim
R = lim p
k |ak+1 |
k k |ak |
falls diese Grenzwerte existieren. Es sei noch angemerkt, dass die Fülle R = 0 und R = ∞
wirklich auftreten können. Jedenfalls ist nun eine Potenzreihe mit Konvergenzradius R auf dem
Konvergenzintervall (t0 − R, t0 + R) als Funktion wohldefiniert.
8
Die Bezeichnung Radius“ erschließt sich erst, wenn wir Funktionen in der komplexen Ebene betrachten.
”
94
Bemerkung
3.70 Der Satz 3.69 hat eine wesentliche Verschörfung: man kann P
nicht nur über die
P∞
k
k
Reihe k=0 ak (t−t0 ) die Aussagen machen, sie sind sogar gültig für die Reihe ∞
k=0 |ak ||t−t0 | .
Man sagt, dass die Potenzreihe im Konvergenzintervall absolut konvergiert.
Der Grenzübergang n → ∞ in (3.25) führt nun zu
f (t0 + h) =
∞
X
1 (j)
f (t0 )hj .
j!
(3.30)
j=0
Die Reihe (3.30) heißt Taylorreihe von f . Leider ist es nun so, dass nicht immer gilt, dass
durch die Reihe (3.30) die Funktion f dargestellt wird. Ein solches Beispiel ist
(
exp(− 12 ) , x 6= 0
x
f (x) :=
.
0
,x = 0
Dabei haben wir die Exponentialreihe vorweggenommen, deren Einführung unmittelbar folgen
wird.
P
k
−1 = 1 .
Beispiel 3.71 Betrachte die Potenzreihe ∞
k=0 (k + 1)t . Hier ist R = limk |k + 1||k + 2|
Also konvergiert die Potenzreihe in (−1, 1). In den Randpunkten liegt keine Konvergenz vor. Wir sind nun in der Lage, eine Vielzahl von speziellen Funktionen anzuführen. Wir diskutieren sie unten und verweisen dabei darauf, was zur Rechfertigung noch zu sagen und zu tun
ist. Insbesondere die Aussagen über die Konvergenzradien bedürfen einiger Arbeit; einiges dazu
wird sich unterwegs ergeben.
Funktion
(1 + t)a (a ∈ Q)
exp(t) bzw. et
ln(t)
sin(t)
cos(t)
tan(t)
cot(t)
arcsin(t)
Potenzreihe
∞
P
a k
k t
k=0
∞ k
P
k=0
∞
P
t
k!
(−1)k
(t − 1)k
k
k=0
∞
P
(−1)k 2k+1
t
k=0 (2k + 1)!
∞
P
(−1)k 2k
t
k=0 (2k)!
t + 31 t3 +
2 5
15 t
+
17 7
315 t
+ ···
1 3
2 5
1
t − 3 t + 45 t − 945 t + · · ·
∞
P
(2k)!
t2k+1
2k
2
2
(k!)
(2k
+
1)!
k=0
1
Konvergenzinterv.
Name
(−1, 1)
Binomialreihe
(−∞, ∞)
Exponentialreihe
(0, 2]
Logarithmus
(−∞, ∞)
Sinusfunktion
(−∞, ∞)
Cosinusfunktion
(−π/2, π/2)
Tangensreihe
(0, π)
Cotangensreihe
[−1, 1]
Arcussinusfunktion
a steht. Wir definieren:
Bei der Binomialreihe9 ist noch zu klären, für was das Symbol k
a
a
a(a − 1) · · · (a − k + 1)
,k ∈ N.
:= 1 ,
=
k!
0
k
9
Wir haben sie nur für a ∈ Q hingeschrieben. Wenn die Potenzrechnung auch für reelle Zahlen bekannt ist,
kann man sie formal genauso für jede reelle Zahl hinschreiben.
95
Für den Spezialfall a = n ∈ N erhalten wir offenbar
n
n
n!
=
, k = 1, . . . , n ,
= 0, k = n + 1, . . . .
k
k!(n − k)!
k
Die zugehörige Reihe ist also dann die bekannte binomische Formel. Die Reihe wird abgeleitet
über die Taylorformel von t 7−→ (1 + t)a im Entwicklungspunkt t0 := 0 .
Beispiel 3.72 Dier totale Energie E eines relativistischen Teilchens ist gegeben durch
E = mc2 (1 −
v2 − 1
) 2.
c2
Dabei ist m die Masse, v die Geschwindigkeit des Teilchens und c die Lichtgeschwindigkeit.
2
Die Binomialreihe ist nun hilfreich, etwas Einsicht zu gewinnen. Wir setzen q := − v2 und
c
erhalten
1
3
5
E = mc2 + mv 2 + mv 2 q + mv 2 q 2 + . . . .
(3.31)
2
8
16
Ist q sehr klein, also v relativ zu c sehr klein, so reicht es aus, nur den zweiten Term zu
berücksichtigen und es ergibt sich wieder der klassische Ansatz für die kinetische Energie:
Ekinetisch = 12 mv 2 .
Die Exponentialreihe ist von überragender Bedeutung. Ihre Konvergenz für jedes t ∈ R
ergibt sich aus dem Quotientenkriterium:
tk+1
t
k!
1
· k =
≤ für alle k ≥ 2t − 1 .
(k + 1)! t
k+1
2
Wir erhalten insbesondere
exp(1) =
∞
X
1
.
k!
k=0
Die Zahl e := exp(1) heißt eulersche Zahl. Für den numerischen Wert haben wir e ∼ 2.718281 . . . .
Die eulersche Zahl kommt auch noch anders zustande:
e = lim(1 +
n
1 n
) .
n
Dass der Grenzwert lim(1 + n1 )n existiert, verdankt“ man den Ungleichungen
”
n
0 ≤ (1 +
1 n
1 n+1
1 n+2
) ≤ (1 +
)
≤ (1 +
)
≤ 3, n ∈ N,
n
n+1
n+1
welche mittels vollständiger Induktion nicht allzu schwer zu beweisen sind; wir verzichten darauf.
Nun ist noch die Gleichheit von
∞
1 n X 1
lim(1 + ) =
n
n
k!
k=0
zu beweisen. Wir haben
un :=
n
n
X
X
1
2
k−1 1
1
1
− (1 + )n =
)) ≥ 0 , n ∈ N ,
(1 − (1 − )(1 − ) · · · (1 −
k!
n
n
n
n
k!
k=0
k=2
96
und daher wegen
1 − (1 −
k−1 k−1 X
X
k−1
(k − 1)l
k − 1 k−1
k − 1 (k − 1)l
(−1)l
)
= 1−
≤
l
n
l
nl
nl
l=0
l=1
k−1 k−1X k−1
k
≤
< 2k−1 , n ∈ N ,
n
n
l
l=1
schließlich
0 ≤ un = 1 −
n
∞
n
X
1X
1X 1 k
1
1
1 k k−1
2
=
2k−1 <
2 = exp(2) , n ∈ N ,
k! n
n
(k − 1)!
n
k!
n
k=2
k=2
k=0
was man mit der Binomialformel erhält.
Die Logarithmus–Funktion ist die Umkehrfunktion der Exponentialfunktion. Dazu aber
später!
Bei den trigonometrischen Funktionen Sinus und Cosinus ist völlig unklar, warum sich
aus der Darstellung als Potenzreihe das gewünschte Verhalten der Periodizität ergeben sollte,
wie es am Einheitskreis abzulesen ist. Hierzu bedarf es einiger recht tiefliegender Betrachtungen.
Darauf kommen wir später zurück.
Aus der Sinus– und Cosinusfunktion leiten sich die Tangens– und Cotangensfunktion ab:
tan(t) :=
sin(t)
sin(t)
, cot(t) :=
.
cos(t)
cos(t)
Aus dem Wissen über die Nullstellen von cos bzw. sin ergeben sich Vorsichtsmaänahmen“:
”
(2k + 1) π2 bzw. kπ sind für alle k ∈ N0 aus dem jeweiligen Definitionsgebiet zu entfernen. Die
Terme der Tangens– bzw. Cotangensreihe lassen sich durchaus geschlossen angeben, der Aufwand
dafür erscheint uns hier aber zu groß. Stattdessen skizzieren wir in diesem Zusammenhang ein
zunächst etwas hemdsärmeliges Argument. Wir stellen uns vor, dass wir die Potenzreihe von
tan(x) in
∞
X
ck tk
k=0
bereits kennen. Dann muss ja sin(x) = tan(x) cos(x) gelten und wir können so rechnen:
∞
∞
∞
X
X
X
(−1)k 2k
(−1)k 2k+1
t
= (
t )
ck tk )(
(2k + 1)!
(2k)!
k=0
k=0
k=0
0
∼ (c0 · 0)t + (c0 · 1 + c1 · 0)t1 + (c0 · 0 + c1 · 1 + c2 · 0)t2
1
+(c3 · 0 + c2 · 1 + c1 · 0 + c0 · (− ))t3 + · · · .
3!
Daraus kann man nun sukzessive die Unbekannten c0 , c1 , c2 , . . . ermitteln. Das überraschende
dabei ist, dass solche Tricks im allgemeinen auf richtige Ergebnisse führen. Die Herangehensweise
beruht auf dem Koeffizientenvergleich: man sammelt die Koeffizienten der Potenzen geeignet
auf; siehe Satz 3.77.
Die Arcussin–Funktion ist die Umkehrfunktion der Sinusfunktion. Dazu aber später!
Satz 3.73 (Ein Entwicklungssatz)
Sei f : (a, b) −→ R beliebig oft differenzierbar und sei t0 ∈ (a, b) .
97
(a)
Falls es positive Konstanten K und δ gibt mit
|f (j) (t)| ≤ K für alle j ∈ N0 , t ∈ (a, b) ∩ (t0 − δ, t0 + δ),
(3.32)
so ist f entwickelbar in eine Potenzreihe mit Entwicklungspunkt t0 und Konvergenzradius
R ≥ δ.
(b) Es gebe ein r, so dass f (r) = f ist. Dann ist f entwickelbar in eine Potenzreihe mit
Entwicklungspunkt t0 und positivem Konvergenzradius.
(c)
Es gebe ein r und reelle Zahlen a0 , . . . , ar−1 , so dass f (r) = a0 f + · · · + ar−1 f (r−1) . Dann
ist f entwickelbar in eine Potenzreihe mit Entwicklungspunkt t0 und positivem Konvergenzradius.
Beweis:
Zu (a).
Für das Restglied der Taylorentwicklung von f gilt für |t − t0 | ≤ δ
f (n+1) (ξ)
δn+1
n+1 (t − t0 )
,
|Rn (t)| = ≤ K
(n + 1)!
(n + 1)!
n
und da limn δ = 0 gilt, folgt die Aussage unter (a).
n!
Zu (b).
Sei δ > 0 mit [t0 − δ, t0 + δ] ⊂ (a, b). Da stetige Funktionen auf abgeschlossenen, beschränkten
Intervallen beschränkt sind, gibt es K ≥ 0 mit
|f (i) (t)| ≤ K für alle t ∈ [t0 − δ, t0 + δ], i = 0, . . . , r − 1 .
Da f (i+r) = f (i) für alle i ∈ N0 gilt, ist sogar
|f (i) (t)| ≤ K für alle t ∈ [t0 − δ, t0 + δ], i ∈ N0 .
Wende nun (a) an.
Zu (c).
Wiederum können wir ein Intervall [t0 − δ, t0 + δ] ⊂ (a, b) und K ≥ 1 wählen mit
|f (i) (t)| ≤ K für alle t ∈ [t0 − δ, t0 + δ], i = 0, . . . , r − 1 .
Wähle nun noch A ≥ 1 mit A ≥ |a0 | + · · · + |ar−1 | . Wir zeigen nun induktiv:
|f (i) (t)| ≤ (rAK)j+1 für alle t ∈ [t0 − δ, t0 + δ] und alle i ∈ N0 .
(3.33)
Für i = 0, . . . , r − 1 ist dies klar. Sei i ≥ r . Dann gilt
f (i) = a0 f (i−r) + · · · + ar−1 f (i−1)
und wir können daher für t ∈ [t0 − δ, t0 + δ] so fortfahren:
|f (i) | = |a0 f (i−r) (t) + · · · + ar−1 f (i−1) (t)|
≤ |a0 f (i−r) (t)| + · · · + |ar−1 f (i−1) (t)|
≤ A(rAK)i−r+1 + · · · + A(rAK)i
≤ rA(rAK)i
≤ (rAK)i+1
Also erhalten wir nun für das Restglied die Abschätzung
f (n+1) (ξ)
(rAKδ)n+1
δn+1
n+1 |Rn (t)| = (t − t0 )
= (rAK)
.
≤ (rAK)n+2
(n + 1)!
(n + 1)!
(n + 1)!
Wir lesen die gewünschte Aussage ab.
98
Beispiel 3.74 Für den nächsten Satz benötigen wir die Aussage
√
lim n n = 1 .
(3.34)
n
Den Beweis dieser Tatsache schicken wir eine Art Verallgemeinerung der Bernoullischen
Ungleichung voraus, nämlich die Gültigkeit von
(1 + x)n ≥ 1 + nx +
n(n − 1) 2
x , x > 0, n ∈ N .
2
(3.35)
Dies ergibt sich aus der Binomialreihe für t := x und a := n . Wir geben einen direkten Beweis
mittels vollständiger Induktion. n = 1 ist trivial, der Induktionsschluss lässt sich aus
n(n − 1) 2
n(n − 1) 2
x )(1 + x) ≥ 1 + nx +
x + x + nx2
2
2
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx +
ablesen.
√
√
Nun zur Aussage limn n n = 1 . Wir schreiben n n = 1 + xn mit xn > 0. Dann folgt aus der
obigen Ungleichung
r
2
n(n − 1) 2
n(n − 1) 2
n
n = (1 + xn ) ≥ 1 + nxn +
xn ≥
xn , also 0 ≤ xn ≤
,
2
2
n−1
und wir schließen auf limn xn = 0, was zu zeigen reicht.
Satz 3.75
∞
P
Sei
ak (t − t0 )k eine Potenzreihe mit Konvergenzradius R ∈ (0, ∞) oder R = ∞ . Sei I :=
k=0
(t0 − R, t0 + R), falls R 6= ∞, und I := (−∞, ∞), falls R = ∞ . Dann gilt:
(a)
Die Reihensumme stellt eine auf I stetige Funktion f dar.
(b) f ist auf I differenzierbar und es gilt
f ′ (t) =
∞
X
k=1
der Konvergenzradius von
Beweis:
Zu (a) . Folgt aus (b) .
P∞
k=0 (k
Zu (b) . Der Konvergenzradius R1 von
kak (t − t0 )k−1 , t ∈ I ;
+ 1)ak+1 (t − t0 )k ist also ebenfalls R .
∞
P
(k + 1)ak+1 (t − t0 )k ist R ; beachte limk
√
k
k = 1 . Also
k=0
ist
f1 (t) :=
∞
X
(k + 1)ak+1 (t − t0 )k = lim s′n (t) , t ∈ I,
n
k=0
wohldefiniert.
Sei t ∈ I, |t − t0 | < ρ < R. Für n ∈ N schreiben wir
f (t) = sn (t) + rn (t) , sn (t) :=
n−1
X
k=0
ak (t − t0 )k , t ∈ I .
f ′ (t)
Wir haben zu zeigen
= f1 (t).
Sei ε > 0. Wähle N0 ∈ N mit (möglich wegen R = R1 ) mit
|
∞
X
ε
rn (s) − rn (t)
|≤
k|ak |ρk−1 < für alle n ≥ N0 , s ∈ (t0 − ρ, t0 + ρ) .
s−t
3
k=n
99
(3.36)
Wähle N1 ∈ N mit (möglich wegen (3.36))
|s′n (t) − f1 (t)| <
ε
für alle n ≥ N1 .
3
Sei N := max(N0 , N1 ). Wähle δ > 0 mit
|
ǫ
sN (s) − sN (t)
− s′N (t)| < für alle s ∈ (t − δ, t + δ) , (t − δ, t + δ) ⊂ (t0 − ρ, t0 + ρ) .
s−t
3
Dies ist möglich, da sN differenzierbar ist; siehe (3.16). Nun folgt
|
f (s) − f (t)
− f1 (t)| < ε für alle s ∈ (t − δ, t + δ) .
s−t
Da Satz 9.29 wiederholt angewendet werden kann, haben wir gezeigt, dass eine Potenzreihe
in ihrem Konvergenzkreis unendlich oft differenzierbar ist und dass ihre Ableitungen explizit
angebbar sind:
f (t) := f
(0)
(t) :=
∞
X
k=0
f (l) (t)
=
∞
X
(k + l)!
k=0
k!
k
ak (t − t0 ) , f
(1)
∞
X
(k + 1)ak+1 (t − t0 )k
(t) =
k=0
ak+l (t − t0 )k , l = 2, . . . .
Insbesondere:
1 (l)
f (t0 ) , l ∈ N0 .
(3.37)
l!
Später werden wir den Spieß umdrehen und unendlich oft differenzierbare Funktionen (zumindest
formal) eine Potenzreihe zuordnen; (3.37) spielt dann die Schlüsselrolle.
P
1 k
−1 = 1
Beispiel 3.76 Für den Konvergenzradius von ∞
k=0 k t haben wir wegen limk (k + 1)k
R = 1. In den Randpunkten t = 1 und t = −1 tritt unterschiedliches Konvergenverhalten auf:
Divergenz für t = 1 (Divergenz der harmonischen Reihe), Konvergenz für t = −1 (Konvergenz
nach dem
P Leibniz–Kriterium).
k
k
Bei ∞
wegen der Form der Koeffizienten leicht, den Konvergenzradius
k=0 k (t + 2) ist es √
k
auszurechen. Wir haben limk kk = limk k = ∞. Diese Reihe konvergiert also nur im Entwicklungspunkt t0 = −2.
f (l) (t0 ) = l! al , d.h. al =
Mit Satz 9.29 haben wir nun ein leistungsfühiges Ergebnis für die Untersuchung von Potenzreihen zu Verfügung. Insbesondere:
exp′ (t) = exp(t) , sin′ (t) = cos(t) , cos(t) = − sin(t) , t ∈ R .
Hier machen wir noch Anmerkungen zum Entstehen der Reihe für den Sinus. Wir wissen
schon aus elementargeometrischen überlegungen, dass sin′ = cos gilt. Analog gilt cos′ = sin .
Also wissen wir, dass y := sin folgender Funktionalgleichung, die eine Differentialgleichung
2. Ordnung ist, genügt:
y ′′ + y = 0 .
(3.38)
Machen wir für die Lösung y von (3.38) den Potenzreihen–Ansatz
y(t) :=
∞
X
j=0
100
aj tj ,
so stellen wir fest, dass die Koeffizienten aj folgenden Gleichungen genügen müssen:
aj+2 (j + 2)(j + 1) + aj = 0 , j ∈ N0 .
Mit der Festsetzung a0 = 0, a1 = 1, erhalten wir dann die Sinusreihe. Übrigens, mit a0 = 1, a1 =
1 erhalten wir die Cosinusfunktion. Dies entspricht der Tatsache, dass die Differentialgleichung
(3.38) zwei wesentlich“ verschiedene Lösungen besitzt. Dies entspricht dem Faktum, dass die
”
Anfangswerte y(0), y ′ (0) noch als Freiheitsgrade (Ort, Geschwindigkeit) zur Verfügung stehen.
Satz 3.77 (Identitätssatz für Potenzreihen)
∞
∞
P
P
bk (t − t0 )k Potenzreihen mit (gemeinsamem) Konverak (t − t0 )k , g(t) :=
Seien f (t) :=
k=0
k=0
genzradius R > 0. Gilt nun für eine Folge (sk )k∈N
sk ∈ (t0 − R, t0 + R), f (sk ) = g(sk ), sk 6= t0 für alle k ∈ N , lim sk = t0 ,
(3.39)
f (t) = g(t) für alle t ∈ (t0 − R, t0 + R) und ak = bk für alle k ∈ N .
(3.40)
k
so folgt
Beweis:
Der Beweis der Tatsache ak = bk für alle k ∈ N“ ist mit vollständiger Induktion einfach zu
”
führen.
Aus der Stetigkeit der Potenzreihen (siehe Satz 9.29) folgt
f (t0 ) = lim f (sk ) = lim g(sk ) = g(t0 ) , also a0 = b0 ;
k
k
der Induktionsbeginn ist gelungen.
Sei nun schon a0 = b0 , . . . , an = bn . Die Potenzreihen
f1 (t) =
∞
X
l=0
an+l+1 (t − t0 )l , g1 (t) =
∞
X
l=0
bn+l+1 (t − t0 )l ,
sind auch auf (t0 − R, t0 + R) konvergent (sie haben auch R als Konvergenzradius!) und wir
haben
f1 (t) = (f (t) −
n
X
k=0
k
n+1
ak (t − t0 ) )(t − t0 )
, g1 (t) = (g(t) −
n
X
k=0
bk (t − t0 )k )(t − t0 )n+1 .
Nun folgt daraus und mit der Induktionsvoraussetzung
f1 (sk ) = g1 (sk ), k ∈ N , f1 (t0 ) = lim f1 (sk ) = lim g1 (sk ) = g1 (t0 ) , also an+1 = bn+1 .
k
k
Der Identitätssatz hat auch Bedeutung in der Störungsrechnung, also in der Vorgehensweise, bei einer Gleichung, die von einem kleinen Parameter abhängt, die Lösung in eine Potenzreihe
nach diesem Parameter zu entwickeln. Ein Hinweis darauf stellt schon das Beispiel 3.72 dar.
Beispiel 3.78 Betrachte die Gleichung
1+a=
1 + v/c
1 − v/c
101
1
2
.
(3.41)
Dabei ist v eine Geschwindigkeit, c die Lichtgeschwindigkeit, a ein kleiner Parameter.
Wir setzen v als Funktion von a an als
v = c(q1 a + q2 a2 + . . . )
und experimentieren
1+a =
≈
1 + q1 a + q2 a2 + . . .
1 − q1 a − q2 a2 − . . .
12
1 + 2q1 a + q12 a2 + . . .
≈
21
1
(1 + q1 a + q2 a2 + . . . )(1 + q1 a) 2
≈ 1 + q1 a .
Wir erhalten also in erster Näherung“ v = ca . Man mache die Betrachtung etwas genauer und
”
leite eine Entwicklung zweiter Näherung“ ab!
”
Bemerkung 3.79 Eine andere Form von Funktionenreihen, also von Funktionen, die als Reihe
dargestellt werden, sind die Fourierreihen. Hier entwickelt man Funktionen nach den trigonometrischen Funktionen sin(kt), cos(kt) . Wir kommen später darauf zurück.
3.9
Anhang: Approximationssatz von Weierstrass
Der Satz, den wir nun beweisen wollen, besagt, dass jede auf einem endlichen, abgeschlossenen
Intervall stetige Funktion durch Polynome beliebig genau gleichmäßig approximiert werden kann.
Wir geben hier einen sehr konstruktiven Beweis.
Sei
Pn := {p : R −→ R|p(x) =
die Menge der Polynome vom Grade n ∈ N0 .
n
X
i=0
ai xi }
Satz 3.80
Sei f : [a, b] −→ R stetig. Dann gibt es zu jedem ǫ > 0 ein n ∈ N und ein Polynom p ∈ Pn mit
sup |f (x) − p(x)| < ǫ .
x∈[a,b]
Beweis:
Da jedes Intervall [a, b] linear auf [0, 1] transformiert werden kann, drfen wir uns auf den
Fall [a, b] = [0, 1] beschränken. Der Beweis besteht nun darin, zu zeigen, dass die Folge der
Bernstein–Polynome
(Bn f )(x) :=
n
X
i=0
i n i
f( )
x (1 − x)n−i , x ∈ [0, 1] , (n ∈ N)
n i
auf [0, 1] gleichmäßig gegen f konvergiert. Man bemerkt, dass (Bn f )(0) = f (0) und (Bn f )(1) =
f (1) für alle n ∈ N . gilt. Mit
1 = (x + (1 − x)) =
n X
n
i=0
i
xi (1 − x)n−i =:
102
n
X
i=0
qn,i (x) ,
ist für alle x ∈ [0, 1]
f (x) − (Bn f )(x) =
|f (x) − (Bn f )(x)| ≤
n
X
i=0
n
X
i=0
i
(f (x) − f ( ))qn,i (x) ,
n
i
|f (x) − f ( )|qn,i (x) .
n
Wegen der gleichmäßigen Stetigkeit von f gibt es für jedes ǫ > 0 ein δ > 0 mit
ǫ
i
i
|f (x) − f ( )| < , falls |x − | < δ .
n
2
n
Zu x ∈ [0, 1] setzen wir
Nx := {i ∈ {0, . . . , n}||x −
Wir haben
X
i∈Nx
i
i
| < δ} , Mx := {i ∈ {0, . . . , n}||x − | ≥ δ} .
n
n
n
i
ǫX
ǫ X
ǫ
|f (x) − f ( )|qn,i (x) ≤
qn,i (x) ≤
qn,i (x) = .
n
2
2
2
i∈Nx
i=0
Mit m := maxx∈[0,1] |f (x)| gilt
X
i∈Mx
i
|f (x) − f ( )|qn,i (x) ≤
n
X
i∈Mx
≤
i
i
|f (x) − f ( )|qn,i (x)(x − )2 δ−2
n
n
n
2m X
i
qn,i (x)(x − )2
2
n
δ i=0
n
=
2m X
i
i
qn,i (x)(x2 − 2x + ( )2 ) .
2
n
n
δ i=0
Nun verwenden wir
n X
n i
x (1 − x)n−i = 1 ,
i
i=0
n n X
X
n − 1 i−1
n i
n−i i
= x
x (1 − x)(n−1)−(i−1) = x ,
x (1 − x)
n
i−1
i
i=1
i=0
n
n X
n − 1 i−1
x
xX
n i
n−i i 2
(i − 1)
x (1 − x)n−i +
x (1 − x) ( ) =
i−1
n
n
n
i
i=1
i=0
n
X
x2
n − 2 i−2
x
=
(i − 1)
x (1 − x)n−i +
(n − 1)
i−2
n
n
i=2
x
x
1
= x2 + (1 − x) .
= x2 (1 − ) +
n
n
n
Damit ist für alle x ∈ [0, 1]
n
X
i=0
X
i∈Mx
qn,i (x)(x −
x 2
x(1 − x)
1
) = x2 − 2x2 + x2 +
≤
,
n
n
4n
i
|f (x) − f ( )|qn,i (x) ≤
n
2m 1
ǫ
2 4n < 2 ,
δ
103
gewählt wird. Insgesamt haben wir nun die gewünschte Abschätzung
gezeigt, falls nur n > m
δ2 ǫ
erzielt.
Hier ist nun der Platz, die verschiedenen quantitativen Abstufungen von Stetigkeit zu erfassen.
Definition 3.81
Sei f : [a, b] −→ R stetig. Die Größe ωf (·), definiert durch
ωf (δ) := sup{|f (u) − f (v)|||u − v| ≤ δ, u, v ∈ [a, b]} , δ > 0 ,
heißt Stetigkeitsmodul von f .
Folgerung 3.82
Sei f : [a, b] −→ R stetig. Dann gibt es κ ≥ 0, so dass gilt:
1
|f (x) − (Bn f )(x)| ≤ κωf ( √ ) , x ∈ [a, b] .
n
Beweis:
Sei wieder [a, b] = [0, 1] . Sei δ > 0 . Seien u, v ∈ [0, 1]. Setze damit λ(u, v, δ) :=
wegen ωf (δ1 ) ≤ ωf (δ2 ) , falls δ1 ≤ δ2 , sicherlich
(3.42)
|u−v|
δ
. Dann gilt
|f (u) − f (v)| ≤ ωf (|u − v|) ≤ ωf ((λ(u, v, δ) + 1)δ) .
Daraus folgt wegen ωf (mδ) ≤ mωf (δ) für m ∈ N
|f (u) − f (v)| ≤ (λ(u, v, δ) + 1)ωf (δ) .
k , δ) ≥ 1} . Dann folgt wie im Beweis zu
Sei nun x ∈ [0, 1] . Setze N := {k ∈ {0, . . . , n}|λ(x, n
Satz 3.80
n
X
k
|f (x) − (Bn f )(x)| ≤
|f (x) − f ( )|qn,k (x)
n
k=0
n
X
k
(λ(x, , δ) + 1)qn,k (x)
n
k=0
X
k
≤ ωf (δ)(1 +
λ(x, , δ)qn,k (x)
n
k∈N
X
k
≤ ωf (δ)(1 + δ−2
(x − )2 qn,k (x)
n
≤ ωf (δ)
k∈N
1
≤ ωf (δ)(1 +
).
4nδ2
Wählt man nun δ := √1n , dann folgt die Behauptung für den Fall [a, b] = [0, 1] mit κ := 45 . Eine
Transformation von [a, b] auf [0, 1] verändert den Stetigkeitsmodul nur um eine Konstante. Beispiel 3.83 Gilt für eine Funktion f : [a, b] −→ R mit α ∈ (0, 1] und L ∈ R die Ungleichung
|f (u) − f (v)| ≤ L|u − v|α , u, v ∈ [a, b] ,
so ist offenbar f stetig; solche Funktionen heißen Lipschitz–stetig. Es folgt für den Stetigkeitsmodul:
ωf (δ) ≤ Lδα , δ > 0 .
Damit wird dann die Abschätzung (3.42) zu
α
|f (x) − (Bn f )(x)| ≤ κLn− 2 , x ∈ [a, b] .
(3.43)
104
3.10
1.)
Übungen
Berechne die folgenden Grenzwerte:
(a)
3
x2 − x − 1 .
limx→1 x + x
+1
3
2
−x−1.
(b) limx→1 x + x
x−1
3
2
limx→1 x + x2 − x − 1 .
x −1
Berechne die folgenden Grenzwerte:
(c)
2.)
(a)
2
limx→0 x .
|x|
3.)
4.)
5.)
p
1 − x2 .
x2
Betrachte die folgenden Reihen bezüglich Konvergenz, Divergenz:
√
P∞ √
k
−
k − 1) .
(a)
(
k=1
P∞
2k
+
1
(b)
.
k=1 2
k (k + 1)2
P∞ k!
(c)
k=1 k .
k
Sei f : (−1, 1) −→ R. Zeige: Existiert limx→0 f (x), so gibt es ε ∈ (0, 1), so dass
{f (x)|x ∈ (−ε, ε)} beschränkt ist.
(b) limx→0
1−
2
Betrachte f : R ∋ x 7−→ x − 12 ∈ R .
1+x
(a) Man zerlege die Funktion f gemäß f = f+ − f− , so dass f+ (x) ≥ 0, f− (x) ≥ 0 für
alle x ∈ R ist.
(b) Beschreibe die Menge Da := {x ∈ R|f (x) = a} für jedes a ∈ R.
(c)
6.)
7.)
Bestimme supx∈R f (x) und inf x∈R f (x) .
q
Berechne limx→∞ x( 1 + x1 − 1) .
Man zeige:
(a)
√
√
limx→∞ (cos( x + 1) − cos( x)) = 0 .
(b) limx→∞ (cos(x + 1) − cos(x)) existiert nicht.
8.)
Betrachte die Funktionsterme
3
f (x) := |x | , g(x) :=
√
x+1−1
x
und die daraus ableitbaren Funktionen f, g in ihren jeweiligen größtmöglichen Definitionsbereichen.
(a)
Berechne f ◦ g , g ◦ f in ihrem größtmöglichen Definitionbereich.
(b) Zeige: f ist differenzierbar im Intervall [−1, 1] .
(c)
9.)
Berechne limx→∞ g(x) , limx→∞ (g ◦ f ) .
Betrachte f : (−1, 1) ∋ x 7−→
(a)
√
x + 1 ∈ R.
Berechne in ξ = 0 die Tangente x 7−→ t(x) an den Graphen von f .
105
(b) Man gebe eine möglichst realistische obere Schranke für die Zahl
e :=
max |f (x) − t(x)|
x∈[− 21 , 12 ]
an.
(c)
Man zeige, dass
|f (0.2) − t(0.2)| < 0.01
gilt.
Vereinbarung: Numerische Werkzeuge (Taschenrechner, PC, . . . ) sind nicht zugelassen.
x2 − 1 ∈ R , h : (0, ∞) ∋ t 7−→ 1 ∈ R . Bilde die
t
1 + x2
Hintereinanderausführungen f ◦ h und h ◦ f. Man achte insbesondere auf das jeweilige
natörliche Definitionsgebiet.
10.) Betrachte f : R ∋ x
7−→
11.) Sei f : [a, b] −→ [a, b] stetig. Zeige: Es gibt z ∈ [a, b] mit f (z) = z . (z ist Fixpunkt)
12.) Sei f : [a, b] −→ [a, b] monoton wachsend. Zeige: Es gibt z ∈ [a, b] mit f (z) = z . (z ist
Fixpunkt)
Hinweis: Betrachte M := {x ∈ [a, b]|x ≤ f (x)} .
13.) Sei p(x) := xn + an−1 xn−1 + · · · + a0 ein normiertes Polynom und sei z ∈ R . Zeige:
Pn−1
(a) |z| ≤ max{1, i=0
|ai |} .
(b) |z| ≤ max{|a0 |, 1 + |a1 |, . . . ., 1 + |an−1 |} .
14.) Berechne die Ableitung von
f (t) := (sin(t))2 .
2
(b) f (t) := t 2 .
1+t
(a)
p(2) − p(1)
= p′ (ξ) .
2−1
16.) Differenziere die sich aus den folgenden Termen ableitbaren Funktionen in ihrem jeweiligen natörlichen Definitionsbereich:
√
1+x−1
3
.
|x | ,
x
15.) Sei p das Polynom p(x) := x3 − 3x + 4 . Bestimme ξ ∈ R mit
17.) Sei f : R −→ R eine Funktion mit f ′ = f . Betrachte damit die Funktion g : R ∋ t 7−→
f (t2 ) ∈ R . Berechen die Taylorreihe von g mit Entwicklungspunkt t0 = 0 .
√
18.) Benutze den Mittelwertsatz der Differentialrechnung, um eine Näherung für 6 65 zu
bekommen.
19.) Betrachte die Schar von Polynomen
p(x) := x3 + ax2 + bx + c , x ∈ R ,
mit den Koeffizienten a, b, c ∈ R .
(a)
Zeige, dass für a = 0, b > 0 beliebig, das Polynom p für jedes c genau eine reelle
Nullstelle besitzt.
(b) Welchen Bedingungen müssen a, b, c genügen, dass p keine waagrechte Tangente
besitzt.
106
(c)
Definiere induktiv
f ◦1 := p , f ◦n+1 := p ◦ f ◦n , n ∈ N .
Welchen Bedingungen müssen a, b, c genügen, dass f ◦n für kein n ∈ N eine waagrechte Tangente besitzt.
20.) Bestimme den Wert der Reihe 1 − x3 + x6 − x9 + . . . für |x| < 1 .
21.) Berechne die Konvergenzradien von
∞
∞
X
k2k k X
(1 + k2 2k )tk .
t ,
(2k)!
k=1
k=1
(t + 2)k
?
5k+1 k
23.) Bestimme mit Koeffizientenvergleich √die ersten drei“ Glieder in der Potenzreihe mit
”
Entwicklungspunkt t0 = 0 für t 7−→ 1 − t2 .
22.) Für welche Zahlen x ∈ R konvergiert die Reihe
P∞
k+1
k=1 (−1)
1 3
24.) Die Potenzreihe für den Sinus hat als erste drei Terme g(t) := t− 3!
t + 5!1 t5 . Berechne damit eine Näherung für t = 0.1 und t := −7 und vergleiche jeweils mit einem (hoffentlich)
guten Näherungswert auf einem Taschenrechner.
∞
P
1 k
25.) Die Exponentialreihe ist gegeben durch
k! t . Bestätige, dass der Konvergenzradius
k=0
∞ ist.
26.) Die Funktion cosh baut sich aus der Exponentialfunktion gemäß
cosh(t) :=
1
(exp(t) + exp(−t)) , t ∈ R ,
2
auf.
1
∈ R wohldefiniert ist und berechne limt→0 g(t) .
cosh(t)
(b) Bestimme das Taylorpolynom 3. Grades von g im Entwicklungspunkt t0 = 0 .
(c) Bestimme (durch Koeffizientenvergleich) die ersten drei Terme in der Potenzreihe
1
von t 7−→
im Entwicklungspunkt t0 = 0 .
cosh(t)
(a)
Zeige, dass g : R ∋ t 7−→
27.) Bestimme die Konvergenzradien der folgenden Potenzreihen
∞
∞
X
X
2k
(2k + 1)(2k)t ,
(3k + 2)tk .
k=0
k=1
28.) Bestimme mit Hilfe von Potenzreihenentwicklungen die folgenden Grenzwerte:
t3 sin(t)
t − sin(t)
.
,
lim
t→0 et − 1 − t − 1 t2 t→0 (1 − cos(t))2
2
lim
29.) Zeige: Die Funktion f , definiert durch f (x) := ax + b hat ein Extremum genau dann,
cx + d
wenn f die konstante Funktion ist (a, b, c, d ∈ R).
30.) Betrachte f : R −→ R, definiert durch
(
sin(x)
x
f (x) :=
1
Zeige: f ist differenzierbar.
107
, falls x 6= 0
.
, falls x = 0
31.) Ein geradlinig begrenzter Bach mit Breite b mändet rechtwinklig in einen Kanal der
Breite a . Wie lange dürfen Baumstämme (vernachlässigbarer Dicke) sein, damit die –
ohne sie aufzustellen – vom Kanal in den Bach geflusst werden können?
32.) Betrachte die Schraubenlinie
x : [0, 4π] ∋ t 7−→ (r cos( √
r2
t
ht
t
), r sin( √
), √
) ∈ R3 .
2
2
2
2
2
+h
r +h
r +h
(h > 0, r > 0). Bestimme das begleitende Dreibein.
mit Ganghähe p h
r 2 + h2
33.) Betrachte die Schraubenlinie
x : [0, 4π] ∋ t 7−→ (r cos( √
r2
t
t
ht
) ∈ R3
), r sin( √
), √
2
2
2
2
r +h
r + h2
+h
mit Ganghähe p h
(h > 0, r > 0). Sei T, N, B das begleitende Dreibein.
r 2 + h2
(a) Berechne Krümmungsradius ρ(t) und Torsion τ (t) .
(b) Berechne den Mittelpunkt µ(t) eines Kreises in der Schmiegeebene mit Radius ρ(t),
der in x(t) T (t) als Tangentenvektor hat.
Skizziere den Spezialfall h = r .
Sei f : [a, b] −→ R . Zeige: Es gibt höchstens eine differenzierbare Funktion
F : [a, b] −→ R mit F (a) = 0, F ′ (t) = f (t) für alle t ∈ [a, b] .
(b) Das Newtonsche Gesetz begrändet für die Bewegung eines Massenpunktes mit Masse m folgende Beschreibung:
34.) (a)
v(t) = s′ (t) : v(t) Geschwindigkeit, Ort des Massenpunktes zur Zeit t,
b(t) = v ′ (t) : b(t) Beschleunigung des Massenpunktes zur Zeit t,
mb(t) = F (t) : F (t) Kraft, die zur Zeit t auf den Massenpunkt einwirkt.
Ermittle für das Kraftgesetz
t
F (t) := F0 (1 − exp(− )) (T > 0, F0 ≥ 0)
T
die Bewegung t 7−→ s(t) eines Massenpunktes, der zur Zeit t = 0 mit Geschwindigkeit v(0) = 0 mit s(0) = 0 startet. Ist diese Bewegung durch die Vorgaben eindeutig
bestimmt?
Wir rechnen mit m = 1, F0 = 1 .
Stoffkontrolle
• Die Nachprüfung der Stetigkeit an Hand der ε–δ–Definition ist einzuüben.
• Die Bedeutung der Grenzwertregeln für die Stetigkeit und Differenzierbarkeit muss am
Beispiel erläutert werden können.
• Die Kriterien für die Konvergenz von Reihen gehören zu den unverzichtbaren Kenntnissen
in der Analysis.
• Der Konvergenzradius von Potenzreihen sollte zumindest an einfachen Beispielen ausgerechnet werden können.
• Entwicklung in Potenzreihen und Störungsrechnung ist ein wichtiges Instrument in der
Physik.
• Was ist eine Kurve, wie kommt das begleitende Dreibein zustande?
108
Kapitel 4
Integration und Vektorfelder
Hier beschäftigen wir uns mit Vektorfeldern und den damit in engem Zusammenhang stehenden
Objekten: Wege und Wegintegrale. Dafür unerlässlich ist die Beschäftigung mit dem Integral.
Wir gehen dabei noch nicht auf alle Feinheiten des Integralbegriffs ein, wichtig ist, dass es gelingt
den Zusammenhang zur Stammfunktion herzustellen. Abschließend dehnen“ wir die Analysis
”
auf Funktionen mehrerer Variabler und auf Vektorfelder aus, allerdings mehr kursorisch. Damit
sind nahezu alle Begriffe bereitgestellt, die für ein Verständnis der Integralsätze, den zentralen
Sätzen der Mathematischen Physik, nötig sind.
4.1
Abbildungen, die Zweite
Bei Abbildungen haben wir uns noch nicht mit Umkehrabbildungen beschäftigt. Dies wollen wir
nun nachholen.
Definition 4.1
Sei f : X −→ Y eine Abbildung.
(i) f injektiv : ⇐⇒ ∀x, x′ ∈ X (x 6= x′ =⇒ f (x) 6= f (x′ ))
(ii) f surjektiv : ⇐⇒ ∀y ∈ Y ∃x ∈ X (y = f (x))
(iii) f bijektiv : ⇐⇒ f ist injektiv und surjektiv.
Wir charakterisieren die Eigenschaften von Abbildungen aus Definition 4.1 in einer Weise,
die uns dann weiterbringt.
Satz 4.2
Sei f : X −→ Y eine Abbildung und sei B := f (X). Dann gilt:
(a) f ist injektiv ⇐⇒ ∃ g : B −→ X(g ◦ f = idX )
(b) f ist surjektiv ⇐⇒ ∃ g : Y −→ X(f ◦ g = idY )
(c) f ist bijektiv ⇐⇒ ∃ g : Y −→ X(g ◦ f = idX , f ◦ g = idY )
Beweis:
Zunächst eine Vorüberlegung.
−1
−1
Sei y ∈ B . Dann ist f ({y}) 6= ∅ ; wähle xy ∈ f ({y}) . Damit definieren wir
ĝ : B ∋ y 7−→ ĝ(y) := xy ∈ X .
109
−1
Zu (a). Sei f injektiv. Wir setzen g := ĝ . Da f injektiv ist, gilt f ({y}) = xy für jedes y ∈ B .
Sei x ∈ X, y := f (x) . Dann ist also x = xy und wir haben
(g ◦ f )(x) = g(f (x)) = ĝ(f (xy )) = xy = x = idX (x) für alle x ∈ X .
Sei nun g : B −→ X mit g ◦ f = idX . Seien x, x′ ∈ X mit f (x) = f (x′ ). Dann ist
x = idX (x) = g(f (x)) = g(f (x′ )) = idX (x′ ) = x′ ,
was wir zeigen wollten.
Zu (b). Sei f surjektiv. Wir setzen g := ĝ und beachten B = Y . Dann ist
(f ◦ g)(y) = f (ĝ(y)) = f (xy ) = y = idY (y) .
Die Umkehrung ist trivial.
Zu (c). Gibt es g mit den notierten Eigenschaften, dann ist nach (a) und (b) die Bijektivität
von f klar. Sei nun f bijektiv. Dann gibt es nach (a) und (b) Abbildungen ga : Y −→ X und
gb : Y −→ X mit ga ◦ f = idX , f ◦ gb = idY . Wir zeigen ga = gb und sind dann fertig. Unter
Verwendung der eben angeführten Identitäten folgt:
ga = ga ◦ idY = ga ◦ (f ◦ gb ) = (ga ◦ f ) ◦ gb = idX ◦ gb = gb .
Im Beweis der Vorüberlegung des Beweises zu Satz 4.2 haben wir das sogenannte starke
Auswahlaxiom benutzt. Es besagt, dass man zu einer Familie Xα , α ∈ A, von Mengen eine
Auswahlfunktion c : A −→ ∪α∈A Xα mit c(α) ∈ Xα für alle α ∈ A existiert. Dahinter
versteckt sich ein Problem, das in den Grundlagen der Mathematik auf der Basis einer fundierten
Mengenlehre seinen Platz hat.
Definition 4.3
Sei f : X −→ Y bijektiv. Die nach Satz 4.2 (c) eindeutig bestimmte Abbildung1 g mit
g ◦ f = idX , f ◦ g = idY heißt die zu f inverse Abbildung oder Umkehrabbildung von f .
Wir schreiben dafür f −1 .
Existiert die Umkehrabbildung von f, dann nennt man f invertierbar.
−1
Die Notation f und f −1 passt folgendermaßen zusammen: Ist f : X −→ Y eine bijektive
−1
Abbildung und B ⊂ Y, dann ist f −1 (B) = f (B) .
Lemma 4.4
Seien f : X −→ Y , g : Y −→ Z bijektiv. Dann ist auch g ◦ f : X −→ Z bijektiv und es gilt
(g ◦ f )−1 = f −1 ◦ g−1 .
Beweis:
Dies verifiziert man ohne Mühe.
Wenn wir zählen/abzählen, ordnen wir den Elementen einer Menge von Objekten sukzessive
eine natürliche Zahl, beginnend bei 1, zu. Wesentlich beim Zählen ist, dass wir zwei Objekten
nicht dieselbe Zahl zuordnen. Dies führt uns dazu, das Zählen mit einer bijektiven Abbildung
mit Werten in N in Beziehung setzen.
1
In der Literatur spricht man bei bijektiven Abbildungen oft auch von umkehrbar eineindeutigen Abbildungen.
In Satz 4.2 zusammen mit Definition 4.1 liegt die Berechtigung für eine solche Sprechweise.
110
Definition 4.5
Sei M eine Menge, M 6= ∅ .
(a) M heißt endlich, wenn es ein N ∈ N und eine bijektive Abbildung ϕ : M −→ {1, . . . , N }
gibt; wir setzen dann #M := N . (Da die Zahl N eindeutig bestimmt (was zu zeigen ist)
ist, ist die Schreibweise #M := N wohldefiniert!)
(b) M heißt abzählbar unendlich, wenn es eine bijektive Abbildung ϕ : M −→ N gibt.
(c) M heißt abzählbar, wenn M endlich oder abzählbar unendlich ist.
(d) Ist M weder endlich noch abzählbar unendlich, nennen wir M überabzählbar (nicht
abzählbar).
Wir schreiben oft, wenn M keine endliche Menge ist, #M = ∞ .
Die obige Definition sagt also, dass wir die Elemente einer
(endlichen) Menge M gezählt
(1, 1) −→ (2, 1)
(3, 1) −→ (4, 1) · · ·
haben, wenn wir eine Bijektiւ
ր
ւ
(1, 2)
(2, 2)
(3, 2)
(4, 2) · · ·
on φ : M −→ {1, . . . , N } ge↓
ր
ւ
ր
funden haben; das Zählergeb(1, 3)
(2, 3)
(3, 3)
(4, 3) · · ·
nis ist #M := N .
ւ
ր
ւ
Endliche Mengen haben wir
(1, 4)
(2, 4)
(3, 4)
(4, 4) · · ·
schon viele kennengelernt. Als
↓
ր
ganz einfache Beispiele für
(1, 5)
···
..
abzählbare unendliche Mengen
.
führen wir an: A := {10n |n ∈
N} , N × N , Z × Z . Mit der DeAbbildung 4.1: Das Cantorsche Diagonalisierungsverfahren
finition 4.5 (a),(b) verträglich
ist, daß wir Nn die Elementanzahl n zuordnen und dass N
abzählbar unendlich ist; die Identität ist ja jeweils die passende Bijektion. Klar, der leeren
Menge ordnen wir die Elementanzahl 0 zu, d.h. #∅ := 0 , und bezeichnen sie ebenfalls als endliche Menge. 2
Ist M eine Menge mit #M = n , dann gilt offenbar #P OT (M ) = 2n .
Satz 4.6
Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis:
Wir schreiben die rationalen Zahlen, d.h. die Paare (a, b), a ∈ Z, b ∈ N, wie in Abbildung 4.1 auf.
Die Pfeile deuten an, in welcher Reihenfolge wir die Paare nun abzählen. Ein einmal abgezähltes
Paar wird nicht mehr berücksichtigt.
Der obige Beweis weicht ab von der naheliegenden Idee, die Abzählung von Q der Größe nach
zu versuchen. Dies wäre auch zum Scheitern verurteilt, denn wir wissen schon, dass zwischen zwei
rationalen Zahlen auch schon wieder unendlich viele rationale Zahlen liegen, d.h. zwischen zwei
2
Das Symbol “∞“ aus Definition 4.5 (b) wurde erstmals wohl von J. Wallis verwendet. Er hat es vermutlich
aus dem römischen Zeichen für 100 Millionen, eine Zahl, die Unendlichkeit“ symbolisiert, abgeleitet.
”
Die Definition 4.5 ist nicht die von G. Cantor 1895 erstmals gegebene Definition der Unendlichkeit einer Menge: Eine Menge ist unendlich, wenn zwischen ihr und einer ihrer echten Teilmengen eine umkehrbar eindeutige
Zuordnung möglich ist.
111
rationalen Zahlen stellte sich das Abzählproblem erneut. Der Ausweg ist die obige Beweisidee
von G. Cantor.
Man beachte, dass es Mengen gibt, die nicht abzählbar sind. Ein wichtiges Beispiel ist M := R . Das Cana11 a12 a13 · · ·
torsche Diagonalisierungsverfahren, das üblicherweia21 a22 a23 · · ·
se im Rahmen der Analysis im Zusammenhang mit der Dea31 a32 a33 · · ·
zimalbruchentwicklung vorgestellt wird, belegt dies. Wir
..
..
..
..
.
.
.
.
machen uns dies an den Dualzahlen klar, d.h. an der Menge D aller Folgen, die nur aus den Zahlen 0 und 1 gebildet
werden. Es geht so:
Abbildung 4.2: Abzählschema
Wäre D abzählbar und an1 , an2 , . . . die n–te Folge in einer irgenwie vorgenommenen Abzählung, so könnte man
D durch das Schema in Abbildung 4.2 darstellen. Setzt
man nun
(
1 , falls ann = 0
,
bn :=
0 , falls ann = 1
dann gehärt die Folge b1 , b2 , . . . zwar zu D, tritt aber offenbar im Schema 4.2 nicht auf. Dieser
Widerspruch zeigt, dass D nicht abzählbar ist.
Satz 4.7
Die Menge R der reellen Zahlen ist überabzählbar.
Beweis:
übertrage das Cantorsche Diagonalisierungsverfahren auf die Dezimalbruchentwicklungen in
[0, 1] .
Man beachte, dass nun auch R\Q nicht abzählbar ist.
Definition 4.8
Sei f : [a, b] −→ R.
(a) f heißt monoton wachsend (bzw. monoton fallend), wenn für alle x, y ∈ [a, b] mit
x ≤ y stets f (x) ≤ f (y) (bzw. stets f (x) ≥ f (y)) ist.
(b) f heißt streng monoton wachsend (bzw. streng monoton fallend), wenn für alle
x, y ∈ [a, b] mit x < y stets f (x) < f (y) (bzw. stets f (x) > f (y)) ist.
Zusammenfassend sprechen wir auch von monotonen bzw. streng monotonen Funktionen,
wenn es uns auf den Monotonietyp (wachsend/fallend) nicht ankommt. Genau dann ist f (streng)
monoton wachsend, wenn −f (streng) monoton fallend ist. Es genügt daher meist, sich auf einen
Monotonietyp zu beschränken.
Satz 4.9
Sei f : [a, b] −→ R stetig und streng monoton wachsend. Dann gilt:
(a) f ([a, b]) = J := [f (a), f (b)] .
(b) Die Umkehrfunktion f −1 : J −→ [a, b] existiert.
(c) f −1 ist streng monoton wachsend und stetig.
112
Beweis:
Zu (a).
Folgt aus dem Zwischenwertsatz 3.37 gemäß Bemerkung 3.39.
Zu (b).
Da f streng monoton wachsend ist, ist f : [a, b] −→ J bijektiv.
Zu (c).
Klar, f −1 ist auch streng monoton wachsend. Sei η ∈ J und sei (yn )n∈N eine Folge mit yn ∈
J für alle n ∈ N, η = limn yn . Sei xn := f −1 (yn ), n ∈ N, und ξ := f −1 (η). Da (xn )n∈N eine Folge
in dem beschränkten Intervall [a, b] ist, enthält (xn )n∈N eine konvergente Teilfolge (xnk )k∈N ; x :=
limk xnk . Aus der Stetigkeit von f folgt
f (x) = lim f (xnk ) = lim ynk = η = f (ξ).
k
k
Da f streng monoton ist, ist x = ξ. Daraus schließt man, daß die gesamte Folge (xn )n∈N gegen
ξ konvergiert, also limn f −1 (yn ) = f −1 (η).
Berechnen wir noch die Ableitung einer Umkehrfunktion. Wenn wir uns die Abbildung über
das Steigungsdreieck anschauen, ist das folgende Resultat nicht mehr überraschend.
Satz 4.10
Sei f : [a, b] −→ R stetig und streng monoton wachsend. Dann ist J := f ([a, b]) = [f (a), f (b)]
und die Umkehrfunktion f −1 : J −→ R von f ist stetig und streng monoton wachsend.
Ferner gilt: Ist f differenzierbar in ξ ∈ (a, b) mit f ′ (ξ) 6= 0, so ist f −1 differenzierbar in η := f (ξ)
und es gilt
1
1
= ′ −1
(f −1 )′ (η) = ′
f (ξ)
f (f (η))
Beweis:
Existenz, Monotonie und Stetigkeit von f −1 folgen aus Satz 4.9. Sei η := f (ξ). Für y 6= η, f (x) =
y, gilt:
f −1 (y) − f −1 (η)
x−ξ
1
=
=
f
(x)
−
f (ξ)
y−η
f (x) − f (ξ)
x−ξ
Daraus liest man ab:
lim
y→η
f −1 (y) − f −1 (η)
1
.
= ′
y−η
f (ξ)
Beispiel 4.11 Die Ableitung der Wurzelfunktion (siehe Beispiel 3.2 (c))
g : (0, ∞) ∋ y 7−→
√
y∈R
können wir auch berechnen, indem wir Satz 4.10 anwenden mit
f : (0, ∞) ∋ x 7−→ x2 ∈ R .
Es folgt damit
g′ (η) =
1
1
= √ , η ∈ (0, ∞) .
2 η
f (g(η))
′
Dieses Vorgehen über die Umkehrfunktion macht sich erst recht bezahlt“, wenn man an die
”
Berechnung der n–ten Wurzel angeht.
113
Lemma 4.12
Sei f : (a, b) −→ R differenzierbar und sei f ′ (x) > 0 für alle x ∈ (a, b) . Dann ist f streng
monoton wachsend und daher auch injektiv.
Beweis:
Dies liest man ohne Mühe an
f (x) − f (x′ ) = f (ξ) für ein ξ zwischen x, x′
ab.
4.2
Exponentialfunktion und Logarithmus
Satz 4.13
Es gibt genau eine Funktion f mit den Eigenschaften
f : R −→ R differenzierbar, f ′ = f, f (0) = 1 .
(4.1)
Sie ist gegeben durch die Exponentialfunktion.
Beweis:
Schreiben wir die Potenzreihe
f0 (x) :=
∞
X
1 k
x
k!
k=0
hin. Diese Potenzreihe hat nach dem Quotientenkriterium Konvergenzradius R = ∞, und ist
daher nach Satz 9.29 unendlich oft differenzierbar. f0′ = f0 lässt sich nun unter Beiziehung von
Satz 9.29 verifizieren; f0 (0) = 1 ist offenbar auch richtig.
Um zu zeigen, dass die gesuchte Funktion eindeutig bestimmt ist, gehen wir von einem f : R −→
R mit f ′ = f und f (0) = 1 aus. Diese Bedingungen implizieren sofort
f (k) (0) = 1 , d.h.
1
f (k)(0)
= , k ∈ N0 .
k!
k!
(4.2)
Wegen Satz 9.29 ist f in eine Potenzreihe zu entwickeln und diese Entwicklung muss wegen (4.2)
mit f0 übereinstimmen.
Wir haben also die Exponentialfunktion, die wir schon unter den Potenzreihen aufgeführt
haben, wiederentdeckt.
Satz 4.14
(a) Die Exponentialfunktion ist unendlich oft differenzierbar und insbesondere stetig.
(b) exp(x) exp(−x) = 1 für alle x ∈ R .
(c)
exp(x) 6= 0 für alle x ∈ R .
(d) exp(x) > 0 für alle x ∈ R .
(e)
(f)
(g)
exp(x + y) = exp(x) exp(y) für alle x, y ∈ R .
exp : R −→ R ist streng monoton wachsend.
exp(R) = (0, ∞) .
Beweis:
Zu (a). Folgt aus Satz 9.29.
Zu (b). Betrachte g(x) := exp(x) exp(−x), x ∈ R. Mit den Rechenregeln für Ableitungen folgt
g′ (x) = 0. Also ist nach Satz 3.52 die Funktion g konstant, also g(x) = g(0) = 1.
114
Zu (c). Folgt aus (b).
Zu (d). Folgt ebenfalls aus (b), denn es ist exp(x) > 0 sicher für jedes x ≥ 0 auf Grund der
Reihendarstellung.
Zu (e). Sei y ∈ R (fest) gewählt. Betrachte
g(x) :=
exp(x + y)
, x ∈ R.
exp(y)
g ist wieder differenzierbar und man erhält g′ (x) = g(x) für alle x ∈ R . Außerdem ist g(0) = 1 .
Nach Satz 4.13 gilt g(x) = exp(x) für alle x ∈ R .
Zu (f ). Folgt aus der Tatsache exp′ (x) = exp(x) > 0 für alle x ∈ R .
Zu (g). Sei y ∈ (0, ∞) . Wähle n ∈ N mit exp(−n) ≤ y ≤ exp(n) . Dies ist möglich, da e =
exp(1) > 1 und exp(n) = (exp(1))n , exp(−n) = 1/ exp(1)n . Wende nun den Zwischenwertsatz
auf das Intervall [−n, n] an.
Die Umkehrfunktion der reellen Exponentialfunktion existiert nach Satz 4.9. Wir bezeichnen
sie mit ln und nennen sie Logarithmus naturalis oder den Logarithmus zur Basis e . Also
ln : (0, ∞) ∋ x 7−→ ln(x) ∈ R .
(4.3)
Aus den Eigenschaften der Exponentialfunktion ergeben sich Eigenschaften für den Logarithmus.
Satz 4.15
Es gilt:
a) ln ist stetig und streng monoton wachsend.
1,x > 0.
b) ln ist differenzierbar und ln′ (x) = x
c) ln((0, ∞)) = R , ln((1, ∞)) = (0, ∞) , ln((0, 1)) = (−∞, 0)) , ln(1) = 0 .
d) ln(x · y) = ln(x) + ln(y) für alle x, y ∈ (0, ∞) .
Beweis:
a), b) folgen aus Satz 4.9 und Satz 4.14. c) liest man aus der strengen Monotonie ab. d) folgt aus
exp(ln(x) + ln(y)) = exp(ln(x)) + exp(ln(y)) = xy .
Folgerung 4.16
Es gilt die Potenzreihenentwicklung
ln(1 + x) =
∞
X
(−1)k
k=1
k
xk , x ∈ (−1, 1] .
(4.4)
Beweis:
Sei f (x) := ln(x), x > 0 . f ist unendlich oft differenzierbar nach Satz 4.15 und es gilt f (k) (1) =
(−1)k−1 (k − 1)!, k ∈ N . Daraus folgt für die Taylorentwicklung
f (x) =
n
X
(−1)k−1
k=1
k
(x − 1)k +
(−1)n
(x − 1)n+1 mit |ξ| < 1 .
n + 1((1 + ξ(x − 1))n
Daraus folgert man durch Grenzübergang die behauptete Aussage.
115
Bemerkung 4.17 Die Bedeutung der Logarithmusfunktion liegt u.a. in der Tatsache begründet,
dass Addieren leichter als Multiplizieren“ ist und man deswegen einen Vorteil hat, wenn man
”
ein multiplikatives Problem in ein additives übersetzen kann. Die Funktionalgleichung
ln(x · y) = ln(x) + ln(y) für alle x, y ∈ (0, ∞)
ist der Schlässel dazu.3
Nun können wir die allgemeinen Potenzen und allgemeinen Logarithmen auch betrachten. Wir setzen für a ∈ R, a > 0 :
ax := expa (x) := exp(x ln(a)) , x ∈ R .
(4.5)
Die Zahl a heißt Basis und exp heißt Exponentialfunktion zur Basis a . Klar, wir haben wegen
ln(e) = 1 offenbar expe = exp . Dazu gehärt nun die Logarithmusfunktion zur Basis a:
loga := exp−1
a . Von besonderem Interesse sind der dekadische Logarithmus log := log10 und
der binäre Logarithmus lb := log2 . Sie geben an, wieviele Stellen eine Zahl im Dezimal–
beziehungsweise im Dualsystem hat. Die unterschiedlichen Logarithmen verrechnen sich untereinander ziemlich einfach:
logb (a) loga = logb .
Bemerkung 4.18 Die Logarithmusfunktion wird gebraucht“ für den in der Thermodynamik
”
bzw. statistischen Physik wichtigen Begriff der Entropie. Dieser Begriff ist aber auch zentral
in der Informationstheorie, wie sie in der Informatik studiert wird. Hier ist sie etwas einfacher zu fassen. Sie handelt vom Informationsgehalt von Nachrichten, die in einem Alphabet
mit den Buchstaben A := {x1 , . . . , xn } geschrieben sind. Dieser hängt von den Auftrittswahrscheinlichkeiten der Buchstaben in den Worten, gebildet mit dem Alphabet, ab. Dabei ist die
Wahrscheinlichkeit eine Zahl zwischen 0 und 1, die nach bestimmten Regeln gebildet wird. Die
Forderungen an einen solchen Informationsgehalt sollen sein:
1. Je seltener ein Buchstabe in den Nachrichten auftaucht, desto höher sollte sein Informationsgehalt sein.
2. Der Informationsgehalt eines Wortes soll sich aus der Summe der Informationsgehalte der
Buchstaben ergeben.
3. Der Informationsgehalt eines absolut sicheren Buchstaben ist 0.
Der Logarithmus ist nun die einfachste Funktion, mit der diese Bedingungen erfüllt werden
können. Man definiert für einen Buchstaben x
1
= − log2 (w(x)) ;
I(x) := log2
w(x)
in deutschen Texten tritt etwa der Buchstabe ’b’ mit Wahrscheinlichkeit (relativer Häufigkeit)
0.016 auf. Also ist es in diesem Alphabet angebracht, I(b) so zu berechnen:
I(b) = − log2 (0.016) =
3
log(0.016)
= 5.79 .
log(2)
Der Rechenschieber ist eine instrumentelle Umsetzung dieser Idee. Die Erfindung des Rechsenschiebers – E.
Gunter und W. Oughtred (um 1620 bis 1650) können als Erfinder genannt werden – war erst möglich, als man
die Logarithmen entwickelt hatte. Die ersten Logarithmentafeln wurden von J. Bärgi und Lord Napier (um 1610
bis 1620) veröffentlicht.
116
Liegt nun ein Alphabet A := {x1 , . . . , xn } vor und für jedes x ∈ A eine Wahrscheinlichkeit w(x),
so wird mit
n
n
X
X
w(xi ) log2 (w(xi ))
w(xi )I(xi ) = −
H :=
i=1
i=1
die Entropie gebildet. Sie ist nichts anderes als der Erwartungswert des Informationsgehaltes
des Alphabets bei der gegebenen Wahrscheinlichkeitsverteilung“ w(x1 ), . . . , w(xn ) . Die von
”
der Thermodynamik bekannte Tatsache, dass die Entropie eines Systems nicht abnehmen kann,
wenn keine Energie zugeführt wird, drückt sich hier so aus, dass bei Codierung der Nachrichten
in einem anderen Alphabet die Entropie eine untere Schranke für die mittlere Wortlänge der
codierten Buchstaben ist.
Aus der Funktionalgleichung für die Exponentialfunktion ergeben sich Regeln für das Rechnen
p
mit allgemeinen Potenzen; beachte, dass wir schon wissen: exp( pq ) = e q für alle pq ∈ Q .
Rechenregeln 4.19
Wir haben für alle a, b ∈ R, a > 0, b > 0, und x, w ∈ R :
1
ax+w = ax aw , (ax )w = axw , ax bx = (ab)x , ( )x = a−x
a
(4.6)
Nun können wir sogar g : (0, ∞) ∋ x 7−→ xx ∈ R definieren:
xx := exp(x ln(x)) , x ∈ (0, ∞) .
Die Ableitung von g auszurechnen füllt dann auch nicht schwer:
g′ (x) = exp(x ln(x))(ln(x) + 1) = xx (ln(x) + 1) , x > 0 .
Beispiel 4.20 Wir berechnen einige Grenzwerte, die bei der Potenzrechnung von Nutzen sind.
1. lim x−k ex = ∞ . Dies folgt aus der Beobachtung
x→∞
ex >
xk+1
, x > 0.
(k + 1)!
2. lim xk e−x = 0 . Dies folgt mit 1. und der Beobachtung
x→∞
xk
ex −1
=
(
) , x > 0.
ex
xk
1
3. lim xk e( x ) = ∞ . Dies gilt wegen
x↓0
1
lim xk e( x ) = lim y −k ey .
y→∞
x↓0
4. lim ln(x) = ∞ . Dies folgt aus der strengen Monotonie von ln und der Beobachtung
x→∞
ln(x) > K, falls x > eK .
5. lim ln(x) = −∞ . Dies folgt aus lim ln(x) = − lim ln y = ∞ .
x↓0
y→∞
x↓0
117
6. lim
x→∞
ln(x)
= 0 für alle α > 0 . Dies folgt aus
xα
ln(x)
α ln(x) −α ln(x)
= lim
e
.
α
x→∞ x
x→∞
α
lim
Da wir schon über die Stetigkeit und Differenzierbarkeit der Exponentialfunktion Bescheid
wissen, ergibt sich die Stetigkeit und Differenzierbarkeit der allgemeinen Potenzfunktion in trivialer Weise. Ferner ergeben sich aus den obigen Grenzwerten auch Aussagen über die Wertebereiche der allgemeinen Potenzfunktion.
4.3
Riemann–Integral
Wir wollen nun das Integral4 von stetigen reellen Funktionen einführen. Das Integrieren (stetiger Funktionen) hat zwei verschiedene Aspekte: zum einem die Messung von Flächeninhalten,
Längen und schließlich Volumina, zum anderen die Bestimmung von Stammfunktionen, d. h.
von Funktionen, die eine gegebene Funktion als Ableitung besitzen.
Wir wissen, wie man den Flächeninhalt der einfachen Figuren Quadrat, Rechteck, Dreieck, Parallelogramm, Trapez, . . . und daraus zusammengebauf(x)
ten Figuren ermittelt. Dabei ist unterstellt, dass sich
Flächen und Volumina beim Zusammenfügen additiv verhalten. Aber wie berechnet man den Flächeninhalt einer krummlinig begrenzten Figur? Es liegt
auf der Hand, dass wieder das Approximationsprinzip der Mathematik bemüht werden muss. Die Ap”
proximationsmathematik“ hilft etwa, wenn die Figur, um deren Flächeninhalt wir uns bemühen, so
x
a
b
zustande kommt, wie das in Abbildung 4.3 skizziert
Abbildung 4.3: Eine einfache Fläche
ist: es ist eine Fläche, bei der eine Seite eines Rechtecks durch den Graph einer Funktion f : [a, b] −→
R ersetzt ist. Es ist offensichtlich, dass diese Situation selten so vorliegt, aber durch Verschieben,
Drehen, Zerschneiden kann man sie oft herbeiführen. Wie gehen wir nun an die Berechnung des
Flächeninhalts der Figur aus Abbildung 4.3 heran? Wir approximieren die Figur durch endlich
viele Rechtecke und summieren die Fläche dieser Rechtecke auf.
Definition 4.21
Sei f : [a, b] → R beschränkt. Sei Z : a = x0 < x1 < · · · < xn−1 < xn = b eine Zerlegung des
Intervalls [a, b]. Sei
Ml :=
sup
f (x) , ml :=
x∈[xl−1 ,xl ]
Die Zahlen
S f (Z) :=
n
X
l=1
inf
x∈[xl−1 ,xl ]
f (x) , l = 1, . . . , n .
Ml (xl − xl−1 ) , S f (Z) :=
n
X
l=1
ml (xl − xl−1 )
heißen Ober– und Untersummen von f bezüglich der Zerlegung Z (mit den Zerlegungspunkten x0 , . . . , xn .)
4
Der Begriff Integral“R(integer (lat.) = ganz) wurde von Johann Bernoulli verwendet, das unten zur Verwen”
dung kommende Zeichen ist ein stilisiertes Summenzeichen. Leibniz verwendet ursprünglich Summe“ dafür.
”
118
Um Unter– und Obersummen zu verschiedenen Zerlegungen vergleichen zu können, benötigen
wir den Begriff der Verfeinerung. Eine Zerlegung Z ∗ heißt Verfeinerung der Zerlegung Z, wenn
jeder Zerlegungspunkt xl von Z auch ein Teilpunkt von Z ∗ ist.
Lemma 4.22
Sei f : [a, b] −→ R beschränkt und sei Z ∗ eine Verfeinerung der Zerlegung Z. Dann gilt:
S f (Z) ≤ S f (Z ∗ ) ≤ S f (Z ∗ ) ≤ S f (Z)
Beweis:
Seien
Z : a = x0 < · · · < xn = b , Z ∗ : a = x∗0 < · · · < x∗m = b
Zerlegungen. Sind die Zerlegungen identisch, ist nichts zu beweisen. Sei etwa [xi−1 , xi ] = [x∗l−1 , x∗l+m ].
Dann ist mit der eingeführten Bedeutung von mi , Mi , m∗i , Mi∗
l+m
X
j=l
l+m
X
j=l
l+m
X
j=l
m∗j (x∗j − x∗j−1 ) ≤
l+m
X
j=l
Mj∗ (x∗j − x∗j−1 ) ,
m∗j (x∗j − x∗j−1 ) ≥ mi (xi − xi−1 ) ,
Mj∗ (x∗j − x∗j−1 ) ≤ Mi (xi − xi−1 ).
Daraus liest man die Behauptung ab.
Folgerung 4.23
Sei f : [a, b] → R beschränkt und seien Z1 , Z2 Zerlegungen von [a, b]. Dann gilt:
S f (Z1 ) ≤ S f (Z2 ) .
Beweis:
Dies ist klar, denn für jede gemeinsame Verfeinerung Z von Z1 und Z2 – dies ist eine Zerlegung
von [a, b], die gerade die Zerlegungspunkte von Z1 und Z2 als gemeinsame Zerlegungspunkte hat
– folgt
S f (Z1 ) ≤ S f (Z) ≤ S f (Z) ≤ S f (Z2 ).
Es existieren also nach Folgerung 4.23 zu einer beschränkten Funktion f : [a, b] −→ R
I f := sup{S f (Z)|Z Zerlegung von [a, b]} , I f := inf{S f (Z)|Z Zerlegung von [a, b]},
und wir werden damit zu einer Definition geführt, die auf B. Riemann zurückgeht.
Definition 4.24
Eine beschränkte Funktion f : [a, b] → R heißt (Riemann–)integrierbar, wenn
I f := sup{S f (Z)|Z Zerlegung von [a, b]} und I f := inf{S f (Z)|Z Zerlegung von [a, b]},
gleich sind. In diesem Falle heißt
Zb
f (x)dx := I f = I f
a
das (Riemann–)Integral von f und a untere Grenze und b obere Grenze des Integrals; f
heißt Integrand.
119
Beispiel 4.25 Die Funktion
(
1
f : [0, 1] ∋ x −
7 →
0
, falls x rational
∈R
, falls x irrrational
ist zwar beschränkt, aber nicht Riemann–integrierbar, denn jede Obersumme hat den Wert 1,
jede Untersumme hat den Wert 0, da in jedem Intervall [α, β] mit α < β stets rationale und
irrationale Zahlen liegen.
Wir treffen folgende Vereinbarungen:
Z
Z a
f (x)dx = 0 ,
b
a
a
f (x)dx := −
Z
b
f (x)dx .
a
Satz 4.26
Sei f : [a, b] → R beschränkt. Dann sind äquivalent:
(a) f ist integrierbar.
(b) ∀ ε > 0 ∃ Zerlegung Z (S f (Z) − S f (Z) < ε) .
Beweis:
(a) =⇒ (b). Sei ε > 0. Wähle, die Definition des Supremums und Infimums nutzend, Zerlegungen Z1 , Z2 mit
Z b
Z b
ε
ε
f (x)dx < S f (Z2 ) + .
f (x)dx > S f (Z1 ) − ,
2 a
2
a
Ist dann die Zerlegung Z die gemeinsame Verfeinerung von Z1 , Z2 , dann gilt
S f (Z) − S f (Z) ≤ S f (Z1 ) − S f (Z2 < ε .
(b) =⇒ (a). Sei ε > 0 . Dann gibt es eine Zerlegung Z mit
I f − I f ≤ S f (Z) − S f (Z) < ε .
Da ε > 0 beliebig war, folgt I f ≤ I f , d.h. I f = I f .
Bemerkung 4.27 Ist f : [a, b] −→ R Riemann-integrierbar, dann sieht man schnell, dass man
n
Rb
P
das Integral f (x) dx durch
f (ξi )(xi − xi−1 ), approximieren kann; dabei ist
a
i=1
a = x0 < x1 < · · · < xn = b , ξi ∈ [xi−1 , xi ], 1 ≤ i ≤ n,
eine Zerlegung von [a, b] . Man hat ja nur zu beachten, dass mi ≤ f (ξi ) ≤ Mi in der üblichen
Bezeichnung gilt.
Der Zusatz Riemann–“ bei der Integrierbarkeit hat seine Bedeutung darin, dass es noch
”
andere Integrierbarkeitsbegriffe (Lebesgue–integrierbar, . . . ) gibt, die von einer anderen Approximierbarkeit durch Ober– und Untersummen ausgehen und für allgemeinere Funktionsklassen
geeignet sind. Für stetige Funktionen ist Riemann–Integrierbarkeit der passende Begriff. Dazu
benötigen wir natürlich, dass stetige Funktionen Riemann–integrierbar sind.
Satz 4.28
Sei f : [a, b] −→ R stetig. Dann gilt:
120
(a) f ist Riemann–integrierbar.
Rb
(b) | f (x)dx| ≤ (b − a) max |f (x)| .
x∈[a,b]
a
Beweis:
Zu (a).
Sei ǫ > 0. f ist nach Satz 3.48 gleichmäßig stetig. Man kann daher δ > 0 wählen mit
|x − y| < δ =⇒ |f (x) − f (y)| < ǫ für alle x, y ∈ [a, b] .
Für jede Zerlegung Z : a = x0 < x1 < · · · < xn = b mit xi − xi−1 < δ , 1 ≤ i ≤ n, gilt dann mit
der üblichen Bedeutung von Mi , mi
S f (Z) − S f (Z) =
n
n
X
X
(xi − xi−1 ) = ǫ(b − a)
(Mi − mi )(xi − xi−1 ) < ǫ
i=1
i=1
und (b) ist gezeigt.
Zu (c). Offensichtlich, da die Aussage auf der Ebene der Ober– und Untersummen gilt.
Rechenregeln 4.29
Ist f : [a, b]
integrierbar.
−→
R integrierbar und [α, β] ⊂ [a, b], so ist f : [α, β]
−→
R auch
Ist f : [a, b] −→ R, a ≤ c ≤ b und ist f |[a,c] , f |[c,b] integrierbar, so ist f integrierbar und
es gilt
Z b
Z c
Z b
f (x)dx .
f (x)dx +
f (x)dx =
c
a
a
Sind f, g : [a, b] −→ R integrierbar, so ist αf + βg für alle α, β ∈ R integrierbar und es
gilt
Z b
Z b
Z b
g(x)dx .
(αf + βg)(x)dx = α
f (x)dx + β
a
a
a
Ist f : [a, b] −→ R integrierbar und ist f (x) ≥ 0 für alle x ∈ [a, b], dann ist
Z
b
a
f (x)dx ≥ 0 .
Ist f : [a, b] −→ R integrierbar, so ist auch |f | : [a, b] ∋ x 7−→ |f (x)| ∈ R integrierbar
und es gilt
Z b
Z b
|f (x)|dx .
f (x)dx| ≤
|
a
a
Sind f, g : [a, b] −→ R integrierbar, so ist auch f g : [a, b] ∋ x 7−→ f (x)g(x) ∈ R
integrierbar.
Die ersten vier Aussagen ergeben aus der Tatsache, dass entsprechende Aussagen für Unter– und
Obersummen gelten. Den Beweis zur Aussage, dass Integrierbarkeit von |f | aus der Integrierbarkeit von f folgt, überlassen wir dem Leser. Die angegebene Ungleichung folgt aus der Tatsache,
dass eine entsprechende Ungleichung für Unter– und Obersummen gilt. Den Beweis der letzten
Behauptung überlassen wir dem Leser; bei stetigen Funktionen ist dies sowieso trivial.
121
Satz 4.30
Jede monotone Funktion f : [a, b] −→ R ist integrierbar.
Beweis:
Sei f etwa monoton wachsend, also f (a) ≤ f (x) ≤ f (b) für alle x ∈ [a, b] . Ist Z : x0 = a < x1 <
· · · < xn = b eine Zerlegung, dann gilt
S f (Z) =
n
X
i=1
S f (Z) − S f (Z) =
n
X
i=1
f (xi−1 )(xi − xi−1 ) , S f (Z) =
n
X
i=1
f (xi )(xi − xi−1 ) ,
(f (xi ) − f (xi−1 ))(xi − xi−1 ) ≤ max (xi − xi−1 ) (f (b) − f (a)) ,
1≤i≤n
woraus man die Behauptung mit Satz 4.26 abliest.
Beispiel 4.31 Betrachte die Funktion f : [0, 1] ∋ x 7−→ x2 ∈ R . Da sie als Polynom stetig ist,
ist sie integrierbar. Die Riemann–Summen zu einer beliebigen Zerlegung Z sehen so aus:
S f (Z) =
n
X
f (xi−1 )(xi − xi−1 ) =
i=1
S f (Z) =
n
X
i=1
n
X
x2i−1 (xi − xi−1 )
i=1
n
X
f (xi )(xi − xi−1 ) =
i=1
x2i (xi − xi−1 ).
Mit der speziellen äquidistanten Zerlegung
Z : 0 = x0 < x1 = h < x2 = 2h < · · · < xn = nh = 1
wird daraus
S f (Z) =
S f (Z) =
n−1
X
i=0
n−1
X
i=0
i2 h3 = h3 ·
(n − 1)n(2n − 1)
1
= (1 − h)(2 − h) ,
6
6
(i + 1)2 h3 = h3 ·
Der Grenzwert h → 0 liefert dann
Z1
n(n + 1)(2n + 1)
1
= (1 + h)(2 + h) .
6
6
f (x)dx =
1
3
0
Rb
Will man das Riemann–Integral a f (x)dx numerisch berechnen, so ist ein praktikables Vorgehen, [a, b] in n Intervalle der Länge h := (b − a)/n zu zerlegen und das Integral über ein
Intervall der Länge h zu approximieren. Hier sind drei Möglichkeiten:
Rechteckregel:
Zb
n−1
X
f (x)dx ≈ IhR :=
hf (a + kh)
k=0
a
Trapezregel:
Zb
a
f (x)dx ≈
IhT
:=
n−1
X
k=0
h
(f (a + kh) + f (a + (k + 1)h))
2
122
Simpsonregel:
Zb
a
f (x)dx ≈
IhS
:=
n−1
X
h
k=0
6
(f (a + kh) + 4f (a + kh +
h
) + f (a + (k + 1)h))
2
(Hierbei soll ≈ andeuten, dass die dabei verglichenen Werte annähernd gleich sein sollen.) Die
Umsetzung dieser Formeln ist einfach. Wie unterscheiden sich die Regeln? Offenbar im Fehler
bei der Approximation der Fläche. Wir wollen (und können) dieser Frage hier nicht nachgehen,
sondern nur anmerken, dass sich Rechteckregel und Trapezregel nicht sehr stark unterscheiden
– der Fehler ist proportional h – , die Simpsonsche Regel ist besser: der Fehler ist proportional
h2 (, falls f zweimal stetig differenzierbar ist).
Satz 4.32 (Mittelwertsatz der Integralrechnung)
Sei f : [a, b] −→ R stetig. Dann gibt es ξ ∈ [a, b] mit
Zb
a
f (x)dx = f (ξ)(b − a) .
Beweis:
Sei
m := min f (x) , M := max f (x) ;
x∈[a,b]
x∈[a,b]
siehe Satz 3.45. Wegen m ≤ f (x) ≤ M, x ∈ [a, b], ist
m(b − a) =
Daher gibt es µ ∈ [m, M ] mit
Zb
a
m dx ≤
Zb
1
b−a
a
Z
f (x)dx ≤
Zb
a
M dx = M (b − a) .
b
f (x)dx = µ .
a
Wegen der Stetigkeit von f gibt es ξ ∈ [a, b] mit f (ξ) = µ; siehe Satz 3.37 und Bemerkung 3.39.
Im Beispiel 4.31 haben wir ein Monom integriert. Wenn wir nun Potenzreihen integrieren
wollen und wir dies gliedweise tun därfen, wie wir richtigerweise vermuten, müsten wir die
Integrale aller Monome ausrechnen können. Dazu müsste man, wenn man sich am Beispiel 4.31
orientiert, Formeln für
N
X
im
i=1
kennen. Viel Arbeit wurde hierin investiert, aber vermutlich ist keine allgemeine Formel bekannt.
Wir wollen nun einen eleganten Weg beschreiten, um die Integration aller Monome zu erledigen:
wir beschäftigen uns mit Stammfunktionen, d.h. mit Funktionen, die eine gegebene Funktion
als Ableitung besitzen.
Definition 4.33
Sei f : [a, b] → R. Eine Funktion F : [a, b] → R heißt Stammfunktion von f, wenn F differenzierbar ist und F ′ = f gilt.
123
Satz 4.34
Ist F eine Stammfunktion von f : [a, b] → R, so gibt es zu jeder anderen Stammfunktion G von
f eine Konstante c ∈ R mit G(x) = F (x) + c , x ∈ [a, b] .
Beweis:
Offenbar ist für jedes c ∈ [a, b]
F + c : [a, b] ∋ x 7−→ F (x) + c ∈ R
eine Stammfunktion von f. Sei G irgendeine Stammfunktion. Dann ist
(F − G)′ (x) = F ′ (x) − G′ (x) = f (x) − f (x) = 0 , x ∈ R .
Also folgt mit dem Mittelwertsatz 3.52 mit x0 ∈ [a, b]
(F − G)(x) − (F − G)(x0 ) = (F − g)′ (ξ)(x − x0 ) = 0 , x ∈ R ,
und wir haben F (x) = G(x) + c , x ∈ R, mit c := (F − G)(x0 ) .
Satz 4.35
∞
P
Sei
ak (x − x0 )k eine Potenzreihe mit Konvergenzradius R > 0. Dann stellt
k=0
F (t) :=
∞
X
ak
(x − x0 )k+1
k+1
(4.7)
k=0
auf jedem Intervall [a, b] ⊂ (x0 − R, x0 + R) eine Stammfunktion von f (t) :=
∞
P
k=0
ak (t − t0 )k dar.
Beweis:
√
Die Potenzreihe aus (4.7) hat wegen limk k k = 1 wieder Konvergenzradius R . Siehe nun Satz
9.29.
Satz 4.36 (Erster Hauptsatz der Differential– und Integrallrechnung)
Sei F eine Stammfunktion der Riemann–integrierbaren Funktion von f : [a, b] −→ R . Dann
gilt:
Zb
f (x)dx = F (b) − F (a) .
(4.8)
a
Beweis:
Sei eine Zerlegung Z : x0 = a < x1 < · · · < xn = b vorgelegt. Dann können wir hinschreiben:
F (b) = F (a) +
n
n
X
X
f (ξk )(xk − xk−1 ) ,
(F (xk ) − F (xk−1 )) = F (a) +
(4.9)
k=1
k=1
wobei wir die Zwischenpunkte gemäß Satz 3.36 gewählt haben. Da f Riemann–integrierbar ist,
erhalten wir durch Grenzübergang (4.8); siehe Bemerkung 4.27.
In (4.8) wird oft statt der Differenz F (b) − F (a) folgender Ausdruck angeschrieben:
F (b) − F (a) = F (x) |ba .
(4.10)
Der obige Satz eröffnet nun die Berechnung einer Vielzahl von Integralen. Insbesondere alle
Potenzreihen lassen sich nun nach Satz 4.35 einfach integrieren. Es ist hier noch offen, ob stetige
Funktionen eine Stammfunktion besitzen.
124
Satz 4.37 (Zweiter Hauptsatz der Differential– und Integrallrechnung)
Sei f : [a, b] → R stetig. Dann ist durch
Zx
F : [a, b] ∋ x 7−→
a
f (t)dt ∈ R
eine Stammfunktion von f gegeben.
Beweis:
f ist integrierbar auf jedem Intervall [a, x], x ∈ [a, b] ; wende dazu Satz 4.28 an. Es gilt für
ξ ∈ [a, b] und h > 0 mit ξ + h ∈ [a, b] :
ξ+h
ξ+h
Z
Zξ
Z
f (t)dt − f (t)dt =
f (t)dt = f (ξ + ϑh)h
F (ξ + h) − F (ξ) =
a
a
ξ
mit ϑ ∈ [0, 1] unter Verwendung des Mittelwertsatzes der Integralrechnung (Satz 4.32). Daher
gilt
F (ξ + h) − F (ξ)
= f (ξ + ϑh)
h
Folglich haben wir – die obige Identität folgt auch sinngemäß für h < 0 –
F (ξ + h) − F (ξ)
= f (ξ) ,
h→0
h
lim
da f stetig ist. Also ist F differenzierbar in ξ und es gilt F ′ (ξ) = f (ξ) .
Die Stammfunktion in Satz 4.37 kann man als Flächeninhaltsfunktion deuten. Eine Skizze legt
den Sachverhalt, dass Differenzenquotienten von F gegen die Werte von f konvergieren, sofort
offen; siehe Abbildung 4.4. Der Satz 4.37 legt auch dar, dass Integration invers zur Differentiation
ist.
Wir geben einige Stammfunktionen an.
bezeichnet.
f (x) := xn
F (x)
−1
f (x) := x
F (x)
f (x) := sin(x) F (x)
f (x) := cos(x) F (x)
f (x) := ex
F (x)
f (x) := ln(x) F (x)
Dabei sei stets mit F die Stammfunktion von f
:=
:=
:=
:=
:=
:=
1
n+1 (n ∈ N \{−1}!)
0
n + 1x
ln(x)
− cos(x)
sin(x)
ex
x(ln(x) − 1)
Um bei rationalen Funktionen weiterzukommen, ist das Rezept Partialbruchzerlegung hilfreich. Dieses Vorgehen macht sich zunutze, dass Polynome in Linearfaktoren zerlegt werden
können; wir kommen darauf zurück. Wir skizzieren das Vorgehen an einem Beispiel.
Beispiel 4.38 Sei f (x) :=
1 . Da wir
x2 − 1
f (x) =
1
1
1
1
= (
−
)
(x − 1)(x + 1)
2 x−1 x+1
haben, folgt für die Stammfunktion F :
r
x−1
1
F (x) = (ln((x − 1)) − ln((x + 1))) = ln(
).
2
x+1
125
Das Auffinden einer Stammfunktion ist die einfache Form des Lösens einer Differentialgleichung 1. Ordnung. Dies sind Funktionalgleichungen“ der folgenden Form:
”
y ′ = f (t, y)
(4.11)
wobei f : I × D −→ R eine gegebene Funktion ist und I, D Intervalle sind. Die Gleichung
(4.11) läsen heißt, eine (möglichst große) Teilmenge I˜ von I und eine differenzierbare Funktion
y : I˜ −→ R zu finden, mit
y(t) ∈ D , y ′ (t) = f (t, y(t)) für alle t ∈ I˜ .
(4.12)
Das Auffinden einer Stammfunktion hat also zu
tun mit dem Spezialfall, dass f in (4.11) nicht
von y abhängt, also nur eine Funktion von t alleine ist. Da man das Auffinden einer Stammf
funktion durch Integrieren erledigen kann, wie
Satz 4.37 ausweist, nennt man das Lösen einer Differentialgleichung auch Integration einer
Differentialgleichung.
Wir haben die Differentialgleichung y ′ =
y schon gesehen. Die Lösungen sind gegeben
∼ h f(x 0 )
durch die Schar y(t) := a exp(t) (a wird festgelegt durch den Anfangswert“ y(0) = a). Das
”
x0 x0 + h b
a
Beispiel y ′ = y 2 zeigt, dass nun die Dinge nicht
mehr so einfach liegen. Hier hat man als triviale
Lösung y(t) := 0. Aber wie sehen nichttriviale Abbildung 4.4: Stammfunktionkonstruktion
Lösungen aus? Kann man sie raten? Ein Polynomansatz verbietet sich schon aus einer einfachen Gradbetrachtung heraus, ein Potenzreihenansatz führt sehr schnell zu unübersichtlichen Bedingungen für die Koeffizienten. Man hat hier
die Lösungschar y(t) := (t − a)−1 (a ∈ R); bestätige dies! Später lernen wir ein Rezept kennen,
das zu diesen Lösungen führt.
Die Gesamtheit der Stammfunktionen einer stetigen Funktion f : [a, b] −→ R wird meist
durch das Symbol
Z
f (x)dx
hingeschrieben
und als unbestimmtes Integral bezeichnet
Rb
R im Gegensatz zum bestimmten
Integral a f (x)dx . Also bedeutet etwa ln(x)(ln(x) − 1) = ln(x)dx, dass x 7−→ ln(x)(ln(x) −
1) eine Stammfunktion von x 7−→ ln(x) ist.
Das Riemann–Integral wurde entwickelt unter der doppelteten Voraussetzung, dass sowohl
Definitionsbereich [a, b] als auch die Funktion f selbst beschränkt ist. Lässt man nun eine dieser Voraussetzungen fallen, so verliert es zunächst seinen Sinn. Verzichtet man auf eine bzw.
beide Voraussetzungen, so spricht man von uneigentlicher Integration. Wenn wir uns an die
Flächeninterpretation erinnern, wird auch unmittelbar klar, dass die Situation zu überdenken
ist. Aber es liegt auch auf der Hand, dass man mit Grenzwerten wieder weiterkommt; etwa
Z∞
0
−t
e dt := lim
b→∞
Zb
0
e−t dt = lim (1 − e−b ) = 1 .
b→∞
126
Beispiel 4.39 Fär die Physik von Mehrteilchensystemen (und nicht nur dort), also in einer
Situation, wo statistische Aussagen eine Rolle spielen, benötigt man die folgende Aussage
IG :=
Z∞
2
e−t dt =
√
π.
−∞
Den Beweis können/wollen wir hier noch nicht erbringen.
Ein wichtiges Hilfsmittel bei der Integration ist das der partiellen Integration.
Satz 4.40 (Partielle Integration)
Seien f, g : [a, b] −→ R differenzierbar und seien f ′ , g′ stetig. Dann gilt:
Zb
a
f ′ (t)g(t)dt = f (b)g(b) − f (a)g(a) −
Zb
f (t)g′ (t)dt .
(4.13)
a
Beweis:
f g ist eine Stammfunktion von (f g)′ . Aus der Produktregel der Differentiation und aus Satz
4.36 folgt die Behauptung.
Beispiel 4.41 Gesucht ist eine Stammfunktion von x 7−→ ln(x) . Wir wollen zeigen, wie wir
diese mit partieller Integration finden können. Wegen
ln′ (x) =
erhalten wir
Z
ln(x)dx = x ln(x) −
Z
1
x
1
x dx = x(ln(x) − 1) .
x
Satz 4.42 (Substitutionsregel)
Sei f : [a, b] −→ R stetig, sei g : [α, β] −→ R differenzierbar und sei g′ stetig. Ferner gelte:
g([α, β]) ⊂ [a, b] , g(α) = a, g(β) = b .
Dann gilt
Zb
a
f (x)dx =
Zβ
f (g(t))g′ (t)dt .
(4.14)
α
Beweis:
Nach Satz 4.37 besitzt f eine Stammfunktion F. Dann ist mit der Kettenregel
(F ◦ g)′ (t) = F ′ (g(t))g′ (t) = f (g(t))g′ (t) , t ∈ [α, β] ,
und mit Satz 4.36
Zβ
α
′
f (g(t))g (t)dt =
Zβ
α
′
(F ◦ g) (t)dt = F (g(β)) − F (g(α)) = F (b) − F (a) =
Zb
f (x)dx .
a
127
√
Beispiel 4.43 Gesucht ist eine Stammfunktion von x 7−→ x√ 1 + x . Wir wollen zeigen, wie
wir diese mit der Substitutionsregel finden können. Setze u := 1 + x, also x = u2 − 1, und wir
erhalten
Z
Z
Z
√
5
3
2
2
u5 u3
x 1 + x dx = 2 (u2 − 1)u2 du = 2 (u4 − u2 )du = 2( − ) = (1 + x) 2 − (1 + x) 2 .
5
3
5
3
Die etwas hemdsärmelige Berechnung der Stammfunktion können wir mit Satz 4.42 rigoros
machen.
4.4
Kurvenlänge
Sei eine Kurve γ mit Parameterdarstellung x : I −→ Rn mit I = [a, b] vorgelegt. Wir wollen
nun die Länge“ der Kurve bestimmen. Da man sich, ist die Länge l schon bestimmt, diese
”
Länge dann als Faden mit der Länge l entlang eines Lineals mit Maöstab angelegt vorstellen
kann und so die Länge als gerade Strecke ablesen kann, spricht man bei der Längenbestimmung
von Kurven von Rektifizierung.
Anschaulich liegt es nahe, einen Näherungswert für die (bisher undefinierte) Länge folgendermaßen zu bestimmen: Man nimmt eine Zerlegung Z = {t0 , t1 , . . . , tm } der Form a = t0 < t1 <
· · · < tm = b, bestimmt die Abstände |x(tk ) − x(tk−1 )| je zweier aufeinanderfolgender Punkte
x(tk−1 ), x(tk )(k = 1, . . . , m) und sieht die Abstandsumme
L(x, Z) :=
m
X
k=1
|x(tk ) − x(tk−1 )|
als einen Näherungswert für die Länge des Weges x
an. L(x, Z) nennt man die Länge des einbeschriebe”
nen Polygonzugs“; siehe Abbildung 4.5. Ist nun Z ′
eine Verfeinerung von Z, d.h. enthält Z ′ alle Zerlegungspunkte von Z, dann ergibt sich mit Hilfe
der Dreiecksungleichung, dass L(x, Z ′ ) ≥ L(x, Z)
gilt. Also benötigen wir für eine aufsteigende Folge von Zerlegungen nur noch eine obere Schranke
für die Längen der Polygonzüge. Dann ist nämlich
die kleinste obere Schranke sinnvollerweise als Länge
des Weges anzusehen.
x(t 2 )
(4.15)
x(tn)
Abbildung 4.5: Polygonzug
Definition 4.44
Sei x : [a, b] −→ Rn eine Parameterdarstellung zur Kurve γ . Wir sagen, dass x rektifizierbar
ist, wenn es eine Schranke L gibt mit
L(x, Z) ≤ L für alle Zerlegungen Z von [a, b] .
Die dann existierende Zahl L(γ) := sup{L(x, Z)|Z Zerlegung von [a, b]} heißt Bogenlänge von
γ . Wir schreiben
Z
dx := L(γ) .
(4.16)
γ
Die Schreibweise
eines Weges.
R
γ
dx kommt so zustande: dx steht als infinitesimale Größe für ein kleines Stück
128
Bemerkung 4.45 Wie wir wissen, gibt es im allgemeinen zu einer Kurve γ unterschiedliche
Parameterdarstellungen. Man nennt zwei Darstellungen x : I −→ Rn , y : J −→ Rn äquivalent,
wenn es eine monoton wachsende, stetige, bijektive Funktion h : J −→ I gibt mit y =
x ◦ h . Anschaulich bedeutet dies, dass die Kurve γ in derselben zeitlichen Reihenfolge aber mit
möglicherweise verschiedener Geschwindigkeit durchlaufen wird. Man überlegt sich leicht, dass
die Länge der Kurve von der gewählten Darstellung nicht abhängt.
Ist x : [a, b] −→ Rn ein stetig differenzierbarer Weg zur Kurve γ, dann ist also ẋ beschränkt,
also etwa |ẋ(t)| ≤ κ für alle t ∈ [a, b] . Dann ist dieser Weg lipschitzstetig, d.h.
|x(t) − x(s)| ≤ κ|t − s| für alle t, s ∈ [a, b] .
Aus (4.15) liest man ab, dass dann γ rektifizierbar ist. Wir verbessern diese Beobachtung zu
Satz 4.46
Ist x : [a, b] −→ Rn ein stetig differenzierbarer Weg zur Kurve γ, dann existiert die Länge L(γ)
dieses Weges und wir haben
Z b
|ẋ(t)|dt
(4.17)
L(γ) =
a
Beweis:
Rb
Zunächst ist klar, dass L := a |ẋ(t)|dt existiert, da ja ẋ stetig ist.
Sei Z : a = t0 < t1 < · · · < tm = b eine Zerlegung. Dann haben wir offenbar
L(x, Z) =
m
X
k=1
m Z
X
|
|x(tk ) − x(tk−1 )| =
k=1
tk
tk−1
ẋ(t)dt| ≤
m Z
X
k=1
tk
tk−1
|ẋ(t)|dt ≤ L .
(4.18)
Damit ist γ rektifizierbar.
Setze für t ∈ [a, b] s(t) := Bogenlänge von x|[a,t] . s(t) stellt also die Länge der Kurve γ bis zum
Zeitpunkt“ t dar. Offenbar ist s wohldefiniert, da γ rektifizierbar ist.
”
Sei t ∈ [a, b) und h > 0 mit t + h ≤ b . Dann ist offenbar mit (4.18)
|x(t + h) − x(t)| ≤ s(t + h) − s(t) ,
d.h.
−1
h
−1
|x(t + h) − x(t)| ≤ h
−1
(s(t + h) − s(t)) ≤ h
Z
t
t+h
|ẋ(r)|dr .
Fär h → 0 erhalten wir daher, dass s in t rechtsseitig differenzierbar und die rechtsseitige Ableitung gleich |ẋ(t)| ist. ähnlich argumentiert man für t ∈ (a, b] und erhält, dass s differenzierbar
ist und dass für die Ableitung gilt: s′ (t) = |ẋ(t)| , t ∈ [a, b] . Daraus folgt dann die gewänschte
Aussage.
Wir haben nicht den allgemeinsten Fall betrachtet, für den eine Bogenlänge nachgewiesen
werden kann. Spezielle Kurven sind solche, die als Graphen einer Funktion auftreten; in der
Abbildung 4.5 sieht es so aus. In diesen Fällen ergibt sich:
Folgerung 4.47
Ist f : [a, b] −→ R stetig differenzierbar, dann existiert die Bogenlänge L(f ) des zugehärigen
Graphen und wir haben
Z bq
1 + f ′ (t)2 dt .
(4.19)
L(f ) =
a
129
Beweis:
Folgt sofort aus Satz 4.46.
Beispiel 4.48 Betrachte als Kurve die Verbindungsstrecke zweier Punkte in R2 :
x(t) := (x1 , x2 ) + t(y1 − x1 , y2 − x2 ) , t ∈ [0, 1] .
Wir haben ẋ(t) = (y1 − x1 , y2 − x2 ) , t ∈ [0, 1] , und daher L(γ) = |(y1 , y2 ) − (x1 , x2 )|, wie
erwartet.
Beispiel 4.49 Betrachte den Weg
(
(0, 0)
x : [0, 1] ∋ t −
7 →
(t, t2 cos( π2 ))
t
Fär die Zerlegung Z : 0 = 0 <
√1
m
<
√ 1
m−1
< ··· <
, falls t = 0
.
, falls t > 1
√1
2
k
< 1 ist x( √1k ) = ( √1k , (−1)
k ), k =
1
1, . . . , m, und daher erhält man offenbar L(x, Z) ≥ 1 + 12 + · · · + m
, was bedeutet, dass x keine
Bogenlänge besitzt, da die harmonische Reihe divergent ist.
Beachte: Man kann zeigen, dass x zwar differenzierbar, aber nicht stetig differenzierbar ist. Beispiel 4.50 Betrachte eine Parameterdarstellung x der Schraubenlinie γ mit Ganghähe
2πh (h > 0):
x(t) := (r cos(t), r sin(t), ht) , t ∈ [0, 4π] .
R 4π √
r 2 + h2 dt =
Wir haben ẋ(t) = (−r sin(t), r cos(t), h) , t ∈ [0, 4π] , und daher L(γ) = 0
√
4π r 2 + h2 .
Beispiel 4.51 Betrachte die Kurve γ, die ein Parabelbogen darstellt. Also in Parameterdarstellung
1
x : [0, b] ∋ t 7−→ (t, t2 ) ∈ R2 (b > 0) .
2
Die Formel (4.19) liefert
Zb p
1 + t2 dt .
L(γ) =
0
Tabellenwerken über Stammfunktionen entnimmt man
Z p
p
1 p
x 1 + x2 + ln(x + 1 + x2 ) + c ,
1 + t2 dt =
2
also
L(γ) =
p
1 p
b 1 + b2 + ln(b + 1 + b2 ) .
2
Wenn man die Darstellung einer Kurve nicht in kartesischen Koordinaten, sondern in Polarkoordinaten vornimmt, so sieht dies so aus:
x = ρ(φ) cos(φ) , y = ρ(φ) sin(φ) , α ≤ φ ≤ β .
130
Die Bogenlänge L(γ) einer so gegebenen Kurve berechnet sich dann durch
L(γ) :=
Zβ p
ρ(φ)2 + ρ′ (φ)2 dφ .
α
Wege kann man in ganz offensichtlicher Weise zusammensetzen, indem man die Parameterdarstellungen aneinanderhängt. Sind etwa x : [a, b] −→ Rn , y : [c, d] −→ Rn Wege mit
x(b) = y(c), dann definiere man
(
x(s)
, falls s ∈ [a, b]
z : [a, b + (d − c)] ∋ s 7−→
y(s + c − b) , falls s ∈ [b, b + (d − c)]
und schreibe etwa x⊕y für diesen Weg z . Es ist nun klar, dass wir dann – unter Voraussetzungen,
wie sie in Satz 4.46 formuliert sind – L(x ⊕ y) = L(x) + L(y) haben. (Man kann ja bei der
Zerlegung von [a, b + (d − c)] o.E. den Zerlegungspunkt b vorsehen und damit Zerlegungen von
[a, b] und [c, d] zusammenbringen. Dass nun an der Stelle b der Weg x ⊕ y nur stetig und nicht
differenzierbar ist, stärt nicht.)
Definition 4.52
Einen stetig differenzierbaren Weg x : [a, b] −→ Rn nennen wir regulär, wenn ẋ(t) 6= θ ist für
alle t ∈ I .
Liegt ein regulärer Weg x : [a, b] −→ Rn vor, dann ist er rektifizierbar und die Bogenlängenfunktion
Zt
s : [a, b] ∋ t 7−→ s(t) := |ẋ(r)|dr ∈ [0, L]
a
ist stetig differenzierbar und streng monoton wachsend und hat daher eine Umkehrfunktion τ :
[0, L] −→ [a, b] ; dabei ist L = L(γ) . Diese Umkehrfunktion drückt dann die Zeit t durch die Bogenlänge aus: t = τ (s) . Geht man zur Zusammensetzung
[0, L] ∋ s 7−→ (x ◦ τ )(s) ∈ Rn
über, so sagt man, der Weg sei auf die Bogenlänge
umparametrisiert. Dieser Weg z := x◦τ hat dann
die Geschwindigkeit ż, welche nach der Kettenregel
und der Umkehrregel die euklidische Norm 1 hat.
Abbildung 4.6: Volumen von Zylinder
Damit haben wir nun das Hilfmittel kennengelernt,
um die Voraussetzung in Abschnitt 3.4 im Zusammenhang mit dem begleitenden Dreibein herzustellen zu können.
Integration können wir nun einsetzen zur Berechnung von Flächen, Mantelflächen und Volumina. Die entscheidende Annahme dafür, dass dies gelingen kann, ist die, dass es sich um
rotationssymmetrische Kärper handelt, d.h. um Kärper, die durch Drehung des Graphen einer
in [a, b] vorliegenden Funktion entstehen. Bekannte Kärper dieser Art sind Kugel, Kreiskegel,
Zylinder, Paraboloid,. . . . Wir skizzieren die Herleitung der entsprechenden Formeln.
131
Sei f : [a, b] −→ R; o.E. f (x) > 0 für alle x ∈ [a, b] . Sei Z : a = x0 < · · · < xm = b eine
Zerlegung von [a, b] . Dadurch entstehen die Kreisscheiben mit Volumen
Vi = π(xi − xi−1 )f (xi )2 , 1 ≤ i ≤ m ,
und, Differenzierbarkeit von f vorausgesetzt, Mantelflächen
p
Mi = 2πf (xi )(xi − xi−1 ) 1 + f ′ (xi )2 , 1 ≤ i ≤ m .
Durch Grenzwertbetrachtungen entstehen die Formeln
Vf
= π
Mf
Z
= 2π
b
f (x)2 dx
(4.20)
a
Z
a
b
p
f (x) 1 + f ′ (x)2 dx
(4.21)
Fär (4.20) reicht die Stetigkeit von f aus, für (4.21) die stetige Differenzierbarkeit.
Man beachte, dass wir die Rotation um die x–Achse betrachtet haben. Wir können auch Rotation
um die y–Achse betrachten; f ist dann durch die dann benötigte Umkehrfunktion von f zu
ersetzen.
Beispiel 4.53 Eine Kugel mit Radius R entsteht durch Rotation des Halbkreises
p
R2 − x2 ∈ R
[−R, R] ∋ x 7−→
um die x–Achse. Also erhält man für das Volumen der Kugel
Z R
2πR3 2πR3
4πR3
(R2 − x2 )dx =
VR = 2π
+
=
3
3
3
0
und für die Oberfläche der Kugel
MR = 2π
Z
R
−R
p
R 2 − x2
r
1+
x2
dx = 4πR2 .
R 2 − x2
Mit den obigen Formeln können wir nun die Flächenberechnungen, soweit es sich um glatt“
”
berandete Flächen handelt, vorläufig als abgeschlossen betrachten. Die infinitesimale Methode,
die zur Integrationstheorie geführt hat, wurde von Archimedes angedacht, von Galilei benutzt,
um Bewegung zu erklären, von Newton und Leibniz auf das Niveau der mathematischen Strenge
gehoben und von Riemann und Weierstrass schließlich in gewisser Weise zum Abschluss gebracht.
Der Schäler Cavalieri5 baute die Ideen seines Lehrers Galilei aus. Das Prinzip von Cavalieri
besagt: Zwei Raumkärper K1 , K2 mögen diesselbe Hähe haben. Sind dann die Querschnitte der
Kärper in jeder Hähe h gleich (proportional), dann sind auch die Volumina gleich (proportional).
Damit kann man etwa beweisen, dass senkrechte und schiefe Zylinder oder Kegel mit derselben
Grundfläche und Hähe das gleiche Volumen haben; siehe Abbildung 4.6. Auf den Beweis wollen
wir hier verzichten.6
5
6
Cavalieri, Bonaventura, 1598? – 1647?
Im übrigen musste auch B. Cavalieri einen Beweis schuldig bleiben.
132
4.5
Trigonometrische Funktionen
Es fehlen noch die Winkelfunktionen auf sicherem Fundament. Wir haben zwar im letzten Kapitel Potenzreihen schon mit sin und cos bezeichnet, aber die Lücke zwischen der analytischen
Hinschreibe und der anschaulichen Bedeutung als aus dem Kreisbogen abgeleitete Größe ist
noch nicht geschlossen. Wieso sollten die Reihen
cos(α) :=
∞
X
(−1)j
j=0
(2j)!
2j
α
∞
X
(−1)j 2j+1
, α ∈ R , sin(α) :=
α
, α ∈ R,
(2j + 1)!
j=0
die Eigenschaften besitzen, die man vom Sinus und Cosinus kennt.
Wir wenden uns der Messung“ von Kreisbögen zu. Es ist naheliegend, dies mit dem Werkzeug
”
aus dem letzten Abschnitt anzugehen. Der Viertelkreis im ersten Quadranten des Koordinatensystems hat als Kurve die Parameterdarstellung
p
[0, 1] ∋ t 7−→ (t, 1 − t2 ) ∈ R2 .
Bei
√ der Anwendung von Formel (4.19) ist Vorsicht geboten, denn die Funktion [0, 1] ∋ t 7−→
1 − t2 ∈ R ist nicht stetig differenzierbar. Dem entspricht die Tatsache, dass das Integral für
die Bogenlänge
Zx
1
p
dt
1 − t2
0
für x = 1 zu einem uneigentlichen Integral wird. Wegen
Zx
0
1
p
1 − t2
dt ≤
Zx
√
0
√
1
dt = −2 1 − x + 2 ≤ 2 , 0 ≤ x < 1 ,
1−t
existiert das uneigentliche Integral. Wir können also
l : [0, 1] ∋ x 7−→
Zx
0
als Bogenlängenfunktion unbedenklich einführen.
1
p
1 − t2
dt ∈ R
(4.22)
Satz 4.54
Es gilt:
a) l(0) = 0 , l(1) = π
2.
.
b) l ist stetig in [0, 1] und stetig differenzierbar in [0, 1) mit Ableitung l′ (x) = − p 1
1 − x2
c) l ist streng monoton wachsend.
Beweis:
l(0) = 0 ist klar. Wir wissen aus Abschnitt 2.6, dass der Viertelkreis den Umfang π
2 hat.
Wenn wir die Bedeutung des Integrals, das l(1) beschreibt, zurückverfolgen, sehen wir, dass die
Polygonzüge, die zur Definition von π geführt haben, als zugehärige Unter– und Obersummen
interpretiert werden können. Damit ist auch l(1) = π2 klar.
Wir wissen, dass auf [0, 1) die Funktion l eine Stammfunktion der stetigen Funktion t 7−→
133
√ 1
1−t2
ist. Damit ist nach dem Hauptsatz der Differential– und Integralrechnung l auf [0, 1)
differenzierbar und daher auch stetig. Da das uneigentliche Integral existiert, ist l auch in x = 1
stetig.
Die Monotonie ergibt sich aus der Tatsache, dass l′ (x) > 0 für alle x ∈ [0, 1) gilt.
Nun setzen wir
L(x) :=
(
π + l(−x)
2
π − l(x)
2
, falls x ∈ [−1, 0)
, falls x ∈ [0, 1]
.
(4.23)
Folgerung 4.55
Es gilt:
a) L(−1) = π , L(0) = π
2 , L(1) = 0 .
b) L ist stetig, streng monoton fallend und stetig differenzierbar in (−1, 1) mit Ableitung
L′ (x) = − p 1
.
1 − x2
c) L hat eine Umkehrfunktion L−1 : [0, π] −→ [−1, 1] .
Beweis:
Nichts ist nach Satz 4.54 mehr zu beweisen.
Wir vergessen zunächst, dass wir sin und cos schon definiert haben und definieren neu:
q
−1
cos(t) := L (t) , sin(t) := 1 − (cos t)2 , t ∈ [0, π] .
Dass diese Definition mit der fräher gegebenen übereinstimmt, werden wir unten zeigen.
Folgerung 4.56
Es gilt:
a) cos, sin : [0, π] −→ [−1, 1] sind stetig.
b) cos, sin sind differenzierbar auf [0, π] und cos′ = − sin , sin′ = cos .
Beweis:
a) ergibt sich aus allgemeinen Aussagen zu Umkehrfunktionen, ebenso die Differenzierbarkeit in
b) . Ferner haben wir für t ∈ (0, π)
cos′ (t) = (L−1 )′ (t) =
und
sin′ (t) = −
1
′
L (L
−1
(t))
=
−p
1
1
= − sin t
1 − cos(t)2
1 2 cos(t) cos′ (t)
sin(t) cos(t)
q
=q
= cos(t) .
2
1 − cos(t)2
1 − cos(t)2
Bleibt die Differenzierbarkeit in t = 0, π zu zeigen. Sei etwa t = 0 . Wir haben für h > 0 nach
Satz 3.52
cos(h) − cos(0)
= cos′ (ξ) = − sin(ξ) mit ξ ∈ (0, h) .
h
Daraus liest man nun
cos(h) − cos(0)
= − sin(0) = 0
h→0
h
cos′ (0) = lim
134
ab. Analog sin′ (0) = cos(0), sin′ (π) = cos(π) .
Nun setzen wir cos und sin zunächst auf [−π, 0] durch
cos(t) := cos(−t) , sin(t) := − sin(−t) , t ∈ [−π, 0] ,
fort und machen dann 2π–periodische Funktionen auf R daraus gemäß
cos(t) := cos(t − (2k + 1)π) , für t ∈ [(2k − 1)π, (2k + 1)π] , k 6= 0 ,
sin(t) := sin(t − (2k + 1)π) , für t ∈ [(2k − 1)π, (2k + 1)π] , k 6= 0 .
Definition 4.57
Die oben konstruierten Funktionen
cos, sin : R −→ R
heissen Cosinus– bzw. Sinusfunktion.
Folgerung 4.58
Cosinus– und Sinusfunktion sind unendlich oft differenzierbar und darstellbar durch Potenzreihen:
∞
∞
X
X
(−1)j 2j+1
(−1)j 2j
t , sin(t) =
t
, t ∈ R.
(4.24)
cos(t) =
(2j)!
(2j + 1)!
j=0
j=0
Beweis:
Die Differenzierbarkeit von cos, sin ergibt sich aus der Konstruktion und Folgerung 4.56, ebenso
die Tatsache cos′ = sin , sin′ = cos . Daraus ergibt sich nun, dass cos, sin unendlich oft differenzierbar sind. Weiterhin:
(
(
(k−1)
0
,
falls
k
ungerade
(−1) 2
, falls k ungerade
(k)
(k)
, sin (0) =
cos (0) =
.
k
, falls k gerade
(−1) 2
0
, falls k gerade
Also lautet die Darstellung etwa von cos als Taylorpolynom mit Restglied folgendermaßen:
cos(t) =
n
X
(−1)k
k=0
(2k)!
t2k +
cos(n+1) (ϑt) n+1
t
.
(n + 1)!
Da Ableitungen von cos (und sin) nur Werte zwischen 1 und −1 annehmen, liegt Konvergenz
des Restgliedes gegen Null für alle t ∈ R vor.
(Wir hätten hier auch mit Satz 3.73 (c) argumentieren können.)
Rechenregeln 4.59
sin(−x) = − sin(x), cos(−x) = cos(x), x ∈ R.
(4.25)
cos(x + y) = cos(x) cos(y) − sin(x) sin(y), x, y ∈ R.
(4.27)
sin(x + y) = sin(x) cos(y) + cos(x) sin(y), x, y ∈ R.
2
2
sin(x) + cos(x)
sin(x)
lim
x→0
x
π
sin( − x)
2
π
cos( − x)
2
sin(π + x)
(4.26)
= 1 , x ∈ R.
(4.28)
= 1.
(4.29)
π
+ x) = cos(x) , x ∈ R .
2
π
= sin(x) , cos( + x) = − sin(x) , x ∈ R .
2
= − sin(x) , cos(π + x) = − cos(x) , x ∈ R .
= cos(x) , sin(
sin(2π + x) = sin(x) , cos(2π + x) = cos(x) , x ∈ R .
135
(4.30)
(4.31)
(4.32)
(4.33)
Die Aussage (4.25) ist offensichtlich.
Betrachte für a ∈ R die Funktion
f : R ∋ x 7−→ sin(x) cos(a − x) + cos(x) sin(a − x) ∈ R .
Man stellt f ′ (x) = 0 fest, d. h. f (x) = sin(a) für alle x ∈ R . Mit a := x + y erhält man (4.26).
Analog beweist man (4.27). (4.28) folgt mit (4.27) aus
1 = cos(0) = cos(x − x) = cos(x) cos(x) + sin(x) sin(x) .
(4.29) ergibt sich aus der Beobachtung
∞
sin(x) X (−1)j 2j
=
x
x
(2j + 1)!
j=0
für x 6= 0 und einer einfachen Abschätzung.
Die übrigen Aussagen ergeben sich leicht aus nun schon bewiesenen Identitäten.
Rechenregeln 4.60 Mit den Aussagen aus (4.25),. . . , (4.33) ergeben sich sofort die folgenden
nötzlichen Identitäten.
sin(2x) = 2 sin(x) cos(x) , cos(2x) = cos(x)2 − sin(x)2 , x ∈ R .
sin(3x) = 3 sin(x) − 4 sin(x)3 , cos(3x) = 4 cos(x)3 − 3 cos(x) , x ∈ R .
sin(4x) = 8 cos(x)3 sin(x) − 4 cos(x) sin(x) , cos(4x) = 8 cos(x)4 − 8 cos(x)2 + 1 , x ∈ R .
sin(5x) = 16 cos(x)4 sin(x) − 12 cos(x)2 sin(x) + sin(x) , x ∈ R .
cos(5x) = 5 cos(x) − 20 cos(x)3 + 16 cos(x)5 , x ∈ R .
Damit kann man nun mit der Kenntnis von sin(2π) = 0 etwa auch sin( 2π
5 ) berechnen. Es
ergibt sich:
q
√
2π
1
sin( ) =
10 + 2 5 , x ∈ R ,
(4.34)
5
4
2π
1 √
cos( ) = ( 5 − 1) , x ∈ R .
(4.35)
5
4
Die Zahl π haben wir als Kreisumfangszahl eingeführt. Es wird damit nicht deutlich, dass
π die sogenannte Kreiszahl ist, die die Fläche einer Kreisscheibe mit Radius 1 angibt. Dazu
betrachte die Funktion
p
f : [−1, 1] ∋ x 7−→
1 − x2 ∈ R .
Als Graph von f erhalten wir einen Halbkreisbogen
in der oberen Halbebene (von R2 ), denn es ist
R1
2
2
x + f (x) = 1, x ∈ [−1, 1] . Also beschreibt −1 f (x)dx die Fläche einer Hälfte der Kreisscheibe
R1
mit Radius 1 . Können wir −1 f (x)dx ausrechnen? Man kann! Wir verwenden dazu die Substitutionsregel aus Satz 4.42. Sei g(t) := − cos(t), t ∈ [0, π] . Damit folgt mit der Substitutionsregel
und mit partieller Integration
Zπ
Zπ
Zπ p
Z1 p
2
2
2
1 − x dx =
1 − cos(t) sin(t)dt = sin(t) dt = cos(t)2 dt .
−1
0
0
136
0
Also7
π=
Zπ
1dt =
0
Zπ
2
2
(sin(t) + cos(t) )dt = 2
0
Zπ
2
sin(t) dt , d.h.
0
Z1 p
−1
1 − x2 dx =
π
.
2
Nun können wir in Kenntnis von Sinus und Cosinus definieren
tan(t) :=
1
cos(t)
sin(t)
, t 6= (k + )π (k ∈ Z) ; cot(t) =
, t 6= kπ (k ∈ Z) .
cos(t)
2
sin(t)
tan heißt Tangens(–funktion) und cot heißt Cotangens(–funktion). Die Gesamtheit der
Funktionen Cosinus, Sinus, Tangens, Cotangens stellt die Familie der trigonometrischen
Funktionen dar.
Durch Betrachtung der Monotonieeigenschaften der trigonometrischen Funktionen findet man
auch wieder Umkehrfunktionen, die Arcus–Funktionen. Sie werden so bezeichnet:
arccos := cos−1 , arcsin := sin−1 ,
arctan := tan−1 , arccot := cot−1 .
Die Definitionsgebiete hat man sich zu überlegen!
Wir wissen, dass Klangwellen von einer Klangquelle als Fluktuationen des Luftdruckes an un1
ser Ohr kommen. Dies wird deutlich an einer einfachen Sirene, bei der Luft auf eine
gleichförmig sich drehende Scheibe, worauf in
0.5
gleichen Abständen kreisförmige Löcher angebracht sind, geblasen wird. Hinter der Scheibe
entsteht in gleichen Zeitabstanden eine Verdichtung (Puff) der Luft. Die Anzahl der Puffs pro
0
1
2
3
4
5
6
t
Sekunde ist gleich der Anzahl der Umdrehungen
multipliziert mit der Anzahl der Löcher. Hat die
Scheibe 11 Löcher und dreht sie sich 40–mal in
–0.5
der Sekunde, dann produziert sie 444 Puffs in der
Sekunde. Diese Frequenz dient als Festlegung des
Kammertons a.
–1
Unter den Klängen sind reine Töne, die zwar
nicht aufregend sind, aber die Bausteine von zu”
sammengesetzten Tönen“ bilden. Bei einem rei- Abbildung 4.7: Eine Fourierapproximation
nen Ton sieht die Schwankung des Luftdrucks wie
eine sinusförmige Funktion aus. Das Aussehen einer solchen Funktion ist beschrieben durch drei
Größen: Amplitude a, Frequenz f , Phase ϕ. Sie lässt sich so hinschreiben:
Sa,φ,f (t) = a sin(
f
t − ϕ) , t ∈ R .
2π
7
Hier ist ein Pseudobeweis, daß π = 2 ist: π ist die Länge eines Halbkreises mit Radius 1. Man ersetze den
Halbkreis durch zwei aneinandergefügte Halbkreise mit dem halben Radius. Dann ist die neue Kurve genauso
lang wie die alte. Man ersetze nach demselben Muster jeden Halbkreis durch ein Paar von Halbkreisen mit dem
halben Radius, und so weiter. Jede der so entstehenden Kurven hat dieselbe Länge wie ihre Vorgängerin, und die
Kurven kommen dem Durchmesser des ursprünglichen Halbkreises beliebig nahe. Der hat aber die Länge 2. Also
ist π = 2 . Der Fehler der Argumentation liegt darin, dass die Kurven zwar gegen den Durchmesser konvergieren“,
”
wenn man einen üblichen Abstandsbegriff zugrundelegt, nicht aber bezüglich dessen, der für die Längenmessung
der angemessene ist.
137
Fourier fand heraus, dass jede periodische Funktion (Welle) als Reihe von Sinusfunktionen (Sinuswellen) geeigneter Amplitude geschrieben werden kann. Wir kommen darauf unter dem Stichwort Fourierreihen“ zurück. Dieses tiefliegende Ergebnis wird schon eindrucksvoll klar, wenn
”
man etwa folgende Überlagerung betrachtet:
S(t) = cos(t) −
1
1
cos(3t) + cos(3t)
3
5
Wir erhalten eine Funktion, die eine recht gute Approximation für eine quadratförmige Welle
ist; siehe Abbildung 4.7.
Betrachten wir einen reinen Ton c, der durch die Frequenz f0 repräsentiert wird. Durch
die Frequenzen f0 bzw. 54 f0 bzw. 32 f0 werden dann die Töne c bzw. e bzw. g dargestellt; im
Zusammenklang haben wir es mit dem Akkord der c–Dur zu tun. Die Obertöne sind:
5
5
3
3
3
5
c : f0 , 2f0 , 3f0 , . . . ; e : f0 , 2 f0 , 4 f0 , . . . ; g : f0 , 2 f0 , 4 f0 , . . . .
4
4
4
2
2
2
Wir stellen fest, dass die Obertöne dieser Noten ganzzahlige Vielfache von 41 f0 sind. Wenn wir
diesen Akkord hören, sollten wir dann nicht auch die Untertöne 14 f0 , 2 14 f0 hören? In der Tat
können viele diesen fundamentalen Bass 14 f0 hören.
4.6
Wegintegral
Zunächst die Einführung von offenen Mengen in Rn . Sie sind hilfreich bei der Formulierung
von Vektorfeldern.
Definition 4.61
Sei B ⊂ Rn .
(a)
B heißt offen, falls gilt: ∀ x ∈ B ∃r > 0 (Br (x) ⊂ B) . B heißt abgeschlossen, wenn Rn \B
offen ist.
(b) x ∈ Rn heißt Randpunkt von B, falls gilt: ∀ r > 0 (Br (x)∩ M 6= ∅ , Br (x)∩ (Rn \M ) 6= ∅) .
Wir schreiben: ∂B := {x ∈ Rn |x Randpunkt von B} .
Offen“ soll also u.a. ausdrücken, dass um jeden Punkt x herum noch Bewegungsspielraum“
”
”
ist, ohne an den Rand zu stoßen“. In R1 ist etwa jedes Intervall (a, b) offen, in Rn sind es etwa
”
die Kugeln Br (z) und auch {x = (x1 , . . . , xn ) ∈ Rn |xn > 0} . Der Rand von (a, b] ⊂ R1 ist {a, b},
der Rand von (a, b] × {0} ⊂ R2 ist [a, b] × {0}, der Rand von Br (z) ⊂ Rn ist B r (z) .
Im R3 sei ein Vektorfeld F gegeben, das als Kraftfeld gedeutet werden möge. Ein Massenpunkt möge
nun unter der Einwirkung dieses Kraftfeldes auf der
durch einen Weg vorgelegten Bahn bewegt werden.
Dafür ist eine Kraftanstrengung nötig; man sagt, es
mösse Arbeit geleistet werden. Ziel ist es, den physikalischen Zusammenhang
Arbeit = Kraft · Weg
in dieser Situation zu beschreiben.
Beginnen wir mit dem einfachen Fall, dass das
Vektorfeld konstant sei und der Weg das Verbindungsstück der Geraden ist, die P mit Q verbindet;
138
Q
F
F
P
Abbildung 4.8: Arbeit
siehe Abbildung 4.8. Dann haben wir lediglich die Projektion p(F ) der Kraft F auf den Verbin−−→
dungsvektor u := P Q zu bilden, um die Kraft zu ermitteln, die in Richtung des Weges wirkt
(siehe (2.4)):
hF, ui
p(F ) =
|F | .
|F ||u|
Diese Projektion ist nun konstant auf dem Weg von P nach Q mit gleichfürmiger Geschwindigkeit
u . Als Arbeit W erhalten wir deshalb:
W = hF, ui .
(4.36)
Dabei schließt diese Festsetzung ein, dass die Arbeit nichtnegativ ist, wenn der Winkel zwischen
Kraftvektor und Bewegungsrichtung ein spitzer ist.
Im allgemeinen Fall wird man wieder wie schon in anderen Situationen vorgehen: man zerlegt
den Weg in kleine“ Teilstücke, wende darauf die obigen überlegungen zum Spezialfall an und
”
summiere auf.
Satz 4.62
Sei x : [a, b] −→ R3 ein stetig differenzierbarer Weg zur Kurve γ, sei F : D −→ R3 ein
Vektorfeld und sei x([a, b]) ⊂ D . Ist [a, b] ∋ t 7−→ hF (x(t)), ẋ(t)i ∈ R stetig und gibt es κ ≥ 0
mit |F (x)| ≤ κ für alle x ∈ D, dann wird durch
W :=
Z
γ
hF (x), dxi :=
Z
b
a
hF (x(t), ẋ(t)i dt
(4.37)
die Arbeit dargestellt.8
Beweis:
Sei Z : a = t0 < t1 < · · · < tm = b eine Zerlegung. Fär die Arbeit haben wir nun die Näherung
m
m
X
X
hF (x(tk )), x(tk ) − x(tk−1 )i =
hF (x(tk )), ẋ(tk )i(tk − tk−1 )
k=1
k=1
m
X
+
k=1
hF (x(tk )),
x(tk ) − x(tk−1 )
− ẋ(tk )i(tk − tk−1 )
tk − tk−1
Der erste Summand lässt sich als Riemannsumme der Funktion
[a, b] ∋ t 7−→ hF (x(t)), ẋ(t)i ∈ R
deuten und wir erhalten durch Grenzübergang in der Feinheit die Aussage, da der zweite Summand dank der Voraussetzung gegen Null konvergiert.
R
Die Schreibweise γ hF (x), dxi für die Arbeit erklärt sich aus einer infinitesimalen Betrachtung
in naheliegender Weise: ẋ(t)∆t = ∆x .
Beispiel 4.63 Betrachte den Weg, der die Punkte (0, 0, 0) über (1, 0, 0) nach (1, 1, 0) gerade
verbindet. Welche Arbeit ist zu leisten, wenn eine Bewegung im Kraftfeld
F : R3 ∋ x = (x1 , x2 , x3 ) 7−→ (x1 x22 , x1 x2 , 0) ∈ R3
8
In der Literatur ist auch
R
γ
F (x) · dx gebräuchlich, wenn das innere Produkt in Rn durch x · y notiert wird.
139
stattfindet. Wir betrachten also eine Bewegung in der x − y–Ebene.
Entlang des Weges von (0, 0, 0) nach (1, 0, 0) wirkt keine Kraft, die Arbeit ist also Null. Fär die
Arbeit von (1, 0, 0) nach (1, 1, 0) bestimmt man eine Parameterdarstellung der Geraden
x(t) := (1, 0, 0) + t(0, 1, 0) = (1, t, 0) , t ∈ [0, 1] ,
berechnet das Kraftfeld entlang des Weges als
[0, 1] ∋ t 7−→ (t2 , t, 0) ∈ R3 ,
und erhält schließlich
[0, 1] ∋ t 7−→ hF (x(t)), ẋ(t)i = t ∈ R.
Also erhalten wir für die Arbeit
W =
Z
1
t dt =
0
1
.
2
Wir betrachten nun die Arbeit entlang des Weges x der direkten Verbindung von (0, 0, 0) nach
(1, 0, 0) . Hier erhält man
x(t) := (0, 0, 0) + t(1, 1, 0) = (t, t, 0) , t ∈ [0, 1] ,
berechnet das Kraftfeld entlang des Weges als
[0, 1] ∋ t 7−→ (t3 , t2 , 0) ∈ R3 ,
und erhält schließlich
[0, 1] ∋ t 7−→ hF (x(t)), ẋ(t)i = t3 + t2 ∈ R.
Also erhalten wir für die Arbeit
W =
Z
1
(t3 + t2 )dt =
0
7
.
12
Das obige Beispiel lehrt uns, dass die Arbeit, die in einem Kraftfeld bei einer Bewegung von P
nach Q zu leisten ist, vom Weg abhängt, wie wir dies bewerkstelligen. Diese Wegabhängigkeit ist weiter zu untersuchen, oder andersherum: Gibt es interessante Kraftfelder, in denen
keine Wegabhängigkeit besteht. Es gibt solche Felder: die Gradientenfelder sind solche; dazu
nächster Abschnitt.
4.7
Gradient
Hat man eine Funktion mehrerer Veränderlicher, also eine Funktion
f : U −→ R mit U ⊂ Rn offen, n ≥ 2 ,
so kann man sich den Begriff der Differenziation einer Veränderlicher, wie wir ihn eingeführt
haben, dadurch zu Nutze machen, dass man die Funktion f eindimensional“ anschaut:
”
Wähle x0 ∈ D, u ∈ Rn ,und betrachte
g : (a, b) ∋ h 7−→ f (x0 + hu) ∈ R ,
wobei a < 0 < b ist. Ausgezeichnete Richtungen sind induziert durch die Einheitsvektoren, die
die kartesischen Koordinatenachsen definieren.
140
Definition 4.64
Sei f : U −→ R , U ⊂ Rn offen.
(a)
f heißt im Punkt x0 ∈ U partiell nach xk differenzierbar (k ∈ {1, . . . , n}), wenn
lim
h→0
f (x0 + hek ) − f (x0 )
h
existiert; man setzt dann für diesen Grenzwert
∂f 0
(x ) oder fxk (x0 ) oder ∂k f (x0 ) .
∂xk
(b) f heißt partiell differenzierbar in x0 ∈ U , wenn f in x0 partiell nach xk differenzierbar
ist für jedes k = 1, . . . , n .
(c)
f heißt partiell differenzierbar, wenn f in jedem Punkt von U partiell differenzierbar
ist.
Beispiel 4.65 Die (kanonischen) Projektionsabbildungen sind:
pl : Rn ∋ x = (x1 , . . . , xn ) 7−→ xl ∈ R (l ∈ {1, . . . , n}) .
Man bestätigt leicht:
∂pl 0
(x ) =
∂xk
(
0
1
, falls k 6= l
, k ∈ {1, . . . , n} .
, falls k = l
Bemerkung 4.66 Sei f : U −→ R , U ⊂ Rn offen. f ist genau dann in x0 = (x01 , . . . , x0n ) ∈ U
partiell nach xk differenzierbar, wenn die partielle Funktion
fk : Uk ∋ xk 7−→ f (x01 , . . . , x0k−1 , xk , x0k+1 , . . . , x0n ) ∈ R ,
bei xk 0 differenzierbar ist; dabei ist Uk := pk (U ) ⊂ R (pk := kanonische Projektion auf k–te
Komponente).
Beispiel 4.67 Sei f : R2 −→ R definiert durch


0
, falls (x1 , x2 ) = (0, 0)
x1 x2
(x1 , x2 ) 7−→
.
, falls (x1 , x2 ) 6= (0, 0)
 2
x1 + x22
Die partiellen Funktionen f (·, x2 ) bzw. f (x1 , ·) sind für jedes (feste) x2 bzw. x1 stetig. f ist nicht
stetig in (0, 0), wie mit der Folge (n−1 , n−1 )n∈N sofort erkennen kann. Die partiellen Ableitungen
existieren überall. Wir zeigen etwa:
x2 x22 − x21
∂f
∂f
(x1 , x2 ) =
(x1 , 0) = 0 , x1 ∈ R .
2 , x1 ∈ R , x2 6= 0 ,
2
2
∂x1
∂x
1
x +x
1
2
141
Definition 4.68
∂f
Sei U ⊂ Rn offen und sei f : U −→ R partiell differenzierbar. Ist
: U −→ R für jedes
∂xk
k = 1, . . . , n partiell differenzierbar in x0 ∈ U , dann heißt f zweimal partiell differenzierbar
in x0 .
Bezeichnung: Sei U ⊂ Rn offen und sei f : U −→ R .
1. Fär die partiellen Ableitungen 2. Ordnung verwenden wir die Schreibweisen
∂2f
∂f
∂
∂2f
oder ∂k2 f falls j = k .
oder
oder ∂j ∂k f und
∂xj ∂xk
∂xj ∂xk
∂x2k
2. Hähere Ableitungen sind entsprechend definiert. Etwa schreibt man für Ableitungen dritter, vierter, . . . Ordnung:
∂4f
∂3f
∂5f
,
,
, ...
∂x2 ∂x4 ∂x1 ∂x1 ∂x22 ∂x3 ∂x52
Bei manchen Resultaten in diesem Abschnitt ist manchmal nur der Fall R2 interessant. In
diesem Falle verwenden wir meist x für x1 und y für x2 . Die partiellen A bleitungen schreiben
wir dann oft so:
fx , fy , fxy , fxyx , . . . .
Definition 4.69
Sei U ⊂ Rn offen, f : U −→ R besitze partielle Ableitungen in x ∈ U . Dann heißt der Vektor
(fx1 (x), fx2 (x), . . . , fxn (x))
der Gradient von f in x. Wir schreiben dafür grad f (x) oder ∇f (x) und nennen ∇ den
Nabla–Operator.
Beispiel 4.70 Sei f : R2 −→ R definiert durch

, falls (x, y) = (0, 0)
 0
f (x, y) =
.
xy

, falls (x, y) 6= (0, 0)
2
2
x +y
Dann haben wir
grad f (x, y) =
y
x2 − y 2
y 2 − x2
,
x
(x2 + y 2 )2
(x2 + y 2 )2
, (x, y) 6= (0, 0) , grad f (0, 0) = (0, 0) .
Jede Komponente des Gradienten ist unstetig in (0, 0) .
Folgerung 4.71
Sei D ⊂ Rn offen, sei f : D −→ R partielll differenzierbar. Ist dann f (x) ≤ f (x) für alle x ∈ D,
d.h. f (x) = minx∈D f (x), dann läst x die Gleichung
∇f (x) = θ .
(4.38)
Beweis:
Es ist f (x) = min(x1 ,...,xi−1 ,xi ,xi+1 ...,xn )∈D f (x1 , . . . , xi−1 , xi , xi+1 . . . , xn )) für alle i = 1, . . . , n .
Aus Satz 3.50 folgt die Aussage.
Die Gleichung (4.38) kann also dazu dienen, Kandidaten für ein Minimumm von f auszusortieren. Offensichtlich gilt dies auch für Maxima.
142
Beispiel 4.72 Betrachte f : R2 ∋ (x, y) 7−→ x41 + x42 − 4ax1 x2 ∈ R (a > 0). Offenbar ist f
beliebig oft partiell differenzierbar. Die Gleichung (4.38) lautet hier:
4x31 − 4ax2 = 0 , 4x32 − 4ax1 = 0 .
Als Lösungen ergeben sich
√ √
(0, 0) , ±( a, a) .
Zu klären ist, in welchen Lösungen ein Minimum bzw. ein Maximum vorliegt. Dazu fehlen uns im
allgemeinen Fall noch die Hilfsmittel, hier können wir ad hoc schon eine Klärung herbeiführen.
√ √
Sicherlich ist (0, 0) kein Extremum, da f positive und negative Werte annimmt. In ±( a, a)
liegen Minima vor!
Bei partiellen Ableitungen schauen wir uns eine Funktion f : D −→ R entlang der Koordinatenachsen an. Nun sind diese Achsen ziemlich willkärlich und es liegt nahe, diese sich entlang
einer beliebigen Richtung anzuschauen.
Definition 4.73
Sei f : U −→ R , U ⊂ Rn offen. Sei p ∈ Rn , |p| = 1 .
(a)
f heißt im Punkt x0 ∈ U richtungsdifferenzierbar in Richtung p, wenn
lim
h→0
f (x + hp) − f (x)
h
existiert; man setzt dann für diesen Grenzwert
∂f
0
∂p (x ) .
(b) f heißt richtungsdifferenzierbar in Richtung p, wenn f in jedem Punkt von U richtungsdifferenzierbar in Richtung p ist.
In der Definition 4.73 ergeben sich für p = ej (j–ter Einheitsvektor) gerade wieder die Begriffe
der partiellen Differenzierbarkeit. Wenn wir die Kettenregel für Funktionen mehrerer Veränderlicher zur Verfügung haben, können wir ganz einfach zeigen, dass für Funktionen f mit stetigen
partiellen Ableitungen – es geht etwas allgemeiner – die Identität
∂f 0
(x ) = h∇f (x0 ), pi ≤ |∇f (x0 )|
∂p
(4.39)
richtig ist. Im Falle von ∇f (x0 ) 6= θ haben wir für p := ∇f (x0 )|∇f (x0 )|−1
∂f 0
(x ) = |∇f (x0 )| .
∂p
(4.40)
(4.39), (4.40) bedeuten, dass in einem Punkt x0 der Gradient ∇f (x0 ) die Richtung p vorgibt,
in der die (hinreichend differenzierbare) Funktion f den stärksten Anstieg hat. Infolgedessen
ist −∇f (x0 ) die Richtung des stärksten (steilsten) Abstiegs; die Wortwahl Gradient“ ist
”
daher gerechtfertigt. Bei der Suche eines Minimums einer Funktion mehrerer Veränderlicher ist
die Suche in der Richtung des steilsten Abstiegs nach guten“ Kandidaten nicht verkehrt; im
”
Gebirge“ und in der numerischen Wirklichkeit ist dies aber zu hinterfragen.
”
Es gibt eine weitere damit zusammenhängende Interpretation des Gradienten. Einer skalaren
Funktion f : D −→ R kann man die Schar der Hähenlinien
Hc := {x ∈ D|f (x) = c} (c ∈ R)
143
zuordnen. Ist x : [−a, a] −→ D ein differenzierbarer Weg (a > 0), der ganz in einer Hähenlinie
Hc liegt, dann folgt unter Umständen, die wir noch klären werden,
0 = lim
t→0
f (x(t)) − f (x(0))
= h∇f (x(0)), ẋ(0)i .
t
Also steht der Gradient in x(0) senkrecht auf dem Tangentialvektor“ in x(0) an die Hähenlinie.
”
Nun erweitern wir die Begriffsbildungen im Zusammenhang mit partieller Differenzierbarkeit auf vektorwertige Abbildungen f : U −→ Rm . Eine solche Abbildung hat so genannte
Koordinatenabbildungen f1 , . . . , fm : U −→ R , wobei also damit verabredungsgemäß
f (x) = (f1 (x), . . . , fm (x)) , x ∈ U , ist.
Definition 4.74
Sei U ⊂ Rn offen und sei f : U −→ Rm .
a) f heißt in x0 partiell differenzierbar nach xk (k ∈ {1, . . . , n}), wenn jede Koordinatenabbildung fi , 1 ≤ i ≤ n , in x0 partiell nach xk differenzierbar ist.
b) f heißt in x0 partiell differenzierbar nach xk (k ∈ {1, . . . , n}), wenn f partiell differenzierbar nach xk ist in jedem x0 ∈ U .
Ist f : U −→ R (U ⊂ Rn offen) partiell differenzierbar, dann definiert ∇f ein Vektorfeld,
d.h. eine vektorwertige Abbildung gemäß
U ∋ x 7−→ ∇f (x) ∈ Rn .
Definition 4.75
Sei F : D −→ Rn ein Vektorfeld, D ⊂ Rn offen. F heißt Gradientenfeld, falls es eine
Funktion V : D −→ R gibt mit F (x) = grad V (x) für alle x ∈ D . Die Funktion V heisst dann
ein Potential dieses Gradientenfeldes.
Satz 4.76
Sei F : D −→ Rn ein Gradientenfeld mit Potential V . Sei x : [a, b] −→ Rn ein stetig
differenzierbarer Weg zur Kurve γ und sei x([a, b]) ⊂ D . Dann gilt:
Z b
Z
hF (x(t)), ẋ(t)idt = V (x(b)) − V (x(a)) .
(4.41)
hF (x), dxi =
γ
a
Beweis:
Wir betrachten
g : [a, b] ∋ t 7−→ V (x(t)) ∈ R
(4.42)
g′ (t) = h∇V (x(t)), ẋ(t)i = hF (x(t)), ẋ(t)i für alle t ∈ [a, b] .
(4.43)
und haben
Fär diese letzte Aussage haben wir noch keinen Beweis, wir holen ihn später nach. Er besteht in
der Anwendung einer Kettenregel für Funktionen mehrerer Veränderlicher. Die Integration von
g′ ergibt nun die Aussage.
Beispiel 4.77 Betrachte das Feld F, definiert durch
F : R3 \{(0, 0, 0)} ∋ (x1 , x2 , x3 ) 7−→
144
x21
1
(−x2 , x1 , 0) ∈ R3 .
+ x22
1
Hier hat man das Potential V (x1 , x2 , x3 ) := −arctan( x
x2 ) und der Wert des Wegintegrals auf
dem Weg γ von (1, 0, 0) nach (0, 1, 0) lässt sich einfach ausrechnen:
Z
1
π
0
F (x) · dx = arctan( ) − arctan( ) = − .
1
0
2
γ
Hier haben wir aber etwas geschludert, denn auf der Achse x2 = 0 macht arctan Schwierigkeiten.
Aber das Ergebnis ist in Ordnung.
4.8
1.)
Übungen
Seine A, B, C Mengen und seien f : A −→ B , g : B −→ C Abbildungen. Zeige:
(a) Ist g ◦ f surjektiv, so ist g surjektiv.
(b) Ist g ◦ f bijektiv und ist f bijektiv, so ist auch g bijektiv.
2.)
Sei f : N × N −→ N × N definiert durch (x, y) 7−→ (y, x) . Zeige:
(a) f ◦ f = id .
(b) f ist injektiv.
(c) f ist bijektiv.
3.)
Seien f : X −→ Y , g : Y −→ Z Abbildungen.
Zeige: Ist g ◦ f bijektiv, so ist f injektiv und g surjektiv.
4.)
Fär welche Wahl von a, b, c ist f : R ∋ x 7−→ ax2 + bx + c ∈ R injektiv bzw. surjektiv
bzw. bijektiv?
5.)
Man prüfe, welche der folgenden Abbildungen injektiv bzw. surjektiv bzw. bijektiv sind.
(a) f : R2 ∋ (x, y) −
7 → (x + 3, y + 2) ∈ R2 .
(b) g : R2 ∋ (x, y) 7−→ (xy, x + 1) ∈ R2 .
(c) h : R2 ∋ (x, y) 7−→ (xy, x + y) ∈ R2 .
6.)
Sei f : X −→ Y eine Abbildung und sei B ⊂ Y.
(a)
−1
Zeige: f ( f (B)) ⊂ B.
−1
(b) Ist f ( f (C)) = C für jede Teilmenge C von Y , so ist f surjektiv.
(c) Finde ein Beispiel dafür, dass in (a) im allgemeinen keine Gleichheit gilt.
7.)
Sei f : D −→ R injektiv und stetig, D ⊂ R offen. Muss f monoton sein?
8.)
Sei f : [a, b] −→ R eine monoton wachsende Funktion. Zeige, dass limt→a f (t), limt→b f (t)
existieren.
9.)
Sei f : [a, b] −→ R monoton wachsend. Zeige: Ist [f (a), f (b)] ⊂ f ([a, b]), dann ist f
stetig.
ln(x)
10.) Beweise: lim x − 1 = 1 .
x→1
1
+ x ) = P∞
2k+1 in (−1, 1) zu bestätigen.
11.) Versuche die Entwicklung ln( 11 −
k=0 2k+1 x
x
12.) Man gebe die Potenzreihenentwicklung für folgende unbestimmte Integrale an.
R et − 1
(a)
t dt ;
R
t dt .
(b)
cos(t)
145
13.) Fär die stetige Funktion f : [a, b] −→ R mit a < b gelte
mindestens eine Nullstelle.
Rb
a
f (t)dt = 0 . Zeige: f hat
14.) Seien g : R2 −→ R und h : R −→ R stetig differenzierbar. Sei fh : R −→ R definiert
durch
Z h(x)
g(t, x)dt, x ∈ R .
fh (x) :=
0
Berechne fh′ .
15.) Sei f : [a, b] −→ (0, ∞) beschränkt und Riemann–integrierbar. Zeige:
Rx
(a) [a, b] ∋ x 7−→ a f (t)dt ∈ R ist stetig.
Rb
Rc
(b) Es gibt c ∈ (a, b) mit a f (t)dt = 12 a f (t)dt .
(c) Ist die Aussage aus (b) auch richtig, wenn man darauf verzichtet, dass f nur positive
Werte annimmt?
16.) Man bestimme die Stammfunktionen zu folgenden Funktionen (jeweils dort, wo sie existieren).
(a) t 7−→ f (t) := t sin(t2 ) ;
t
(b) t −
7 → 1−t
2 ;
(c)
t 7−→
t2 +1
2t3 +1
.
3
2
− 2x + 2 ∈ R .
17.) Sei r : R ∋ x 7−→ 9x − 18x
2
x +7
(a)
Zeige: Es gibt Polynome p, q mit r(x) = 9x − 18 +
p(x)
für alle x ∈ R, .
q(x)
(b) Wie sieht eine Stammfunktion von r aus?
(c) Zeige: r hat in (−1, 0), (0, 1), (1, ∞) Nullstellen.
Sind damit alle Nullstellen gefunden? (Begrändung dazu mit den Hilfsmitteln der
bisher behandelten Analysis.)
R3
t
18.) Man bestimme 2
dt mit Hilfe der Partialbruchzerlegung (und eventueller
(t − 1)(t2 + 4)
Verwendung von Integraltafeln).
19.) Man entscheide, ob die folgenden uneigentlichen Integrale existieren.
R∞ t
(a)
0 1 + t2 dt ;
R∞
t
(b) 1 p
dt ;
3
t + t6
R ∞ sin(t)
(c)
1
t dt .
20.) Berechne das uneigentliche Integral
Z ∞
1
dt .
t − e−t
e
1
21.) Existiert
lim
Z
a
a→∞ −a
22.) Berechne das uneigentliche Integral
Z
a
−a
sin(t)dt ?
t2
√
dt .
a2 − t2
Hinweis: Die Substitution t = a sin(s) ist hilfreich.
146
23.) Die Zykloide beschreibt die Bahn eines Punktes auf der Peripherie eines Kreises vom
Radius 1, der auf der x–Achse abrollt:
x : R ∋ t 7−→ (t − sin(t), 1 − cos(t)) ∈ R2 .
Berechne die Bogenlänge von x|[0,2π] . (Man beachte, dass das Ergebnis ganzzahlig ist,
obwohl die Kurve eine Menge von sehr irrationalen Punkten darstellt.)
24.) Betrachte die Kardioide k:
r(φ) := 2a(1 + cos(φ) , k(φ) := r(φ)(cos(φ), sin(φ)) , 0 ≤ φ ≤ 2π, a > 0 .
Berechne ihre Länge.
25.) Betrachte den Weg x : R ∋ t 7−→ (t2 , t3 , 0) ∈ R3 . Berechne die Bogenlängenfunktion
s : [0, ∞) −→ R . Ist die Umkehrfunktion differenzierbar?
26.) Betrachte den Weg x : R ∋ t 7−→ (t3 , 0, 0) ∈ R3 . Berechne die Bogenlängenfunktion
s : [0, ∞) −→ R .
27.) Betrachte den Weg [1, 2] ∋ t 7−→ (t, 1 − t, t2 ) ∈ R3 und das Vektorfeld F : R3 ∋
(x, y, z) 7−→ (xy, x2 + yz, xz) ∈ R3 .
(a)
Berechne die Bogenlängefunktion.
(b) Berechne die Arbeit, die entlang des Weges zu leisten ist.
28.) Man berechne den Flächeninhalt von M := {x, y) ∈ R2 |x, y ≥ 0, 2y − x ≤ 0, x2 − y 2 − 1 ≤
0} .
29.) Man bestimme den Flächeninhalt der Mengen
(a)
A := {(x, y) ∈ R2 |0 ≤ x ≤ 1, y 2 ≤ x2 (1 − x)} ;
(b) B := {(x, y) ∈ R2 |0 ≤ x ≤ 1, |y| ≤ x exp(−x)} .
30.) Führe eine Partialbruchzerlegung durch für
(a)
(b)
(c)
18x2 + 15x − 4 .
(3x + 1)2 (x − 2)
6x2 − 12
.
2
(x − 4)(x + 1)
1 .
x4 + 4
31.) Betrachte f : [−1, 1] ∋ t 7−→ 3 −
(a)
√
4 − x2 ∈ R .
Berechne die Bogenlänge des Bogens x : [−1, 1] ∋ t 7−→ (t, f (t)) ∈ R2 .
(b) Durch Rotation von f um die t–Achse entsteht zwischen den Ebenen t = −1 und
t = 1 ein Rotationskärper (in der Gestalt einer Spindel). Berechne Volumen und
Mantelfläche.
32.) Sei Vn,r das Volumen der Kugel in Rn mit Radius r und sei On,r die Oberfläche der
Kugel. Zeige: nVn,r = rOn,r .
33.) Der Kegel mit Hähe h > 0 über dem Kreis Br (θ) ist die Menge K := {x ∈ R3 |h −
hr −1 |x| ≥ 0} . Berechne die Oberfläche des Kegels.
34.) Berechne den Schwerpunkt
(a)
eines Dreiecks D := {(x, y) ∈ R2 |0 ≤ y ≤ qx, 0 ≤ x ≤ 1} ;
(b) des Trapezes“ T := D ∪ [1, 2] × [0, q] ;
”
147
(c)
des Halbkreises B := {(x, y) ∈ R2 |0 ≤ y ≤
35.) Betrachte das Vektorfeld
F : R3 \{(0, 0, 0)} ∋ (x, y, z) 7−→
p
r 2 − y 2 , −r ≤ x ≤ r} .
1
(−y, x, 0) ∈ R3 .
x + y2
2
Berechne die Arbeit für die Wege
(a)
Viertelkreis von (1, 0, 0) nach (0, 1, 0) ;
(b) gerade Verbindung von (1, 0, 0) nach (0, 1, 0) ;
(c)
Vollkreis mit Radius R in der x1 − x2 –Ebene.
36.) Ist das Vektorfeld F, definiert durch F (x, y) := (3x2 y, x3 ), (x, y) ∈ R2 , ein Gradientenfeld?
37.) Betrachte den Parabelbogen, der durch den Weg x : [1, 2] ∋ t 7−→ (t, t2 ) ∈ R2 parametrisiert wird.
(a)
Berechne die Bogenlänge.
(b) Unter Wirkung des Kraftfeldes
F : R2 ∋ (x, y) 7−→ (2xy, x2 + y 2 ) ∈ R2
bewege sich ein Massenpunkt entlang des Parabelbogens von (1, 1) nach (2, 4) .
Welche Arbeit wird hier geleistet?
38.) Berechne das Wegintegral längs des Weges x(t) := (t2 , t, t − 3), t ∈ [0, 1], für das Vektorfeld F, definiert durch F (x, y, z) := √ 2 1 2 2 (x, y, z), (x, y, z) ∈ R3 \{(0, 0, 0) .
x +y +z
39.) Berechne in R2 das Wegintegral längs der Verbindungsgeraden von (0, 0, 2) mit (3, 6, 2)
für das Vektorfed F, definiert durch
F (x, y, z) :=
1
x3 y 3
(y(xy + 2x2 y 2 ), x(xy − x2 y)), (x, y) ∈ R2 \{(0, 0) .
40.) Berechne das Wegintegral für einen Weg, der (−1, 1) und (1, 1) in R2 verbindet für das
Vektorfeld
V : R2 ∋ (x, y) 7−→ (x + y, x − y) ∈ R2 .
41.) Betrachte den Halbkreisbogen
[0, 1] ∋ x 7−→ (x,
und den Parabelbogen
p
1 − x2 ) ∈ R 2
[0, 1] ∋ x 7−→ (x, 1 − x2 ) ∈ R2 .
(a)
Berechne die Fläche zwischen Parabel– und Kreisbogen.
(b) Berechne das Volumen und die Mantelfläche des Rotationskärpers, der entsteht,
wenn man das Flächenstück zwischen Parabel– und Kreisbogen um die x–Achse
rotiert.
42.) Berechne die partiellen Ableitungen in folgenden Fällen:
f (x1 , x2 ) := ln(1 − exp(x1 + x2 )) , (x1 , x2 ) ∈ D := {(x1 , x2 )|1 > exp(x1 + x2 )} .
x1
1
(b) f (x1 , x2 ) := arcsin( x
x2 ) , (x1 , x2 ) ∈ D := {(x1 , x2 )|| x2 | < 1} .
Beachte, dass arcsin die Umkehrfunktion zu sin ist und nutze dies!
(a)
148
43.) Betrachte
f : R2 ∋ (x1 , x2 ) 7−→ x1 exp(sin(x2 )) ∈ R .
(a)
Man zeige, dass f stetig ist.
(b) Man finde Koeffizienten a00 , a10 , a01 , a11 , a12 ∈ R in
f (x1 , x2 ) =
∞
X
k,l=1
44.) (a)
akl xk1 xl2 , (x1 , x2 ) ∈ R2 .
Berechne die partiellen Ableitungen in folgenden Fällen:
f (x1 , x2 ) := x1 exp(sin(x2 )) , (x1 , x2 ) ∈ R2 ;
f (x1 , x2 , x3 ) := sin(x1 + x2 + x3 ) , (x1 , x2 , x3 ) ∈ R3 .
(b) Berechne die Divergenz für f (x1 , x2 , x3 ) := ln(x31 + x32 + x33 − 3x1 x2 x3 ) dort, wo f
definiert ist.
Stoffkontrolle
• Welche Eigenschaften übertragen sich bei einer monotonen Funktion auf die Umkehrfunktion?
• Welche Funktionsklassen sind Riemann–integrierbar?
• Welche Rolle spielen bei der Integration die Stammfunktion?
• Nach Riemannintegral, Weglänge sollte nun das Prinzip, durch Approximation Längen,
Flächen, Volumina zu berechnen klar geworden sein.
• Warum ist es nicht immer nötig, bei der Berechnung eines Wegintegrals festzulegen, wie
der Integrationsweg zwischen zwei Punkten des Weges aussieht?
149
Kapitel 5
Gruppen, Körper und Matrizen
In diesem Kapitel ergänzen wir die Einführung in die heute übliche Sprache der Mathematik,
soweit sie bisher noch nicht Verwendung fand; sie soll auch eine Art Neubetrachtung der verwendeten Argumentationen vermitteln.
Diese Sprache hat sich erst allmählich entwickelt, bezeichnenderweise sehr viel später als die
meisten konkreten Gebiete der Mathematik (Zahlentheorie, Algebra, Analysis, . . . ). Sie hat sich
als nötig erwiesen, um Gedanken, Argumente, Ergebnisse allgemeingültig zu übermitteln, mit
einer nicht geringen Ausstrahlung in andere Wissenschaften hinein. Darlegen werden wir auch
die so wichtigen Konzepte der Gruppe und der Körper mit engen Verbindungen zur mathematischen Physik (Symmetrie). Hieran schließt sich an, die reellen und komplexen Zahlen (und einen
weiteren Zahlkörper) nun abschließend einzuführen.
5.1
Aussagen
Der Begriff Aussage“ ist wie der Mengenbegriff ein mathematischer Grundbegriff. Er soll hier
”
nicht definiert, sondern nur beschrieben werden: Eine Aussage ist ein sprachliches Gebilde“,
”
bei dem feststeht, ob ihm Wahrheit (w) oder Falschheit (f ) zukommt (tertium non datur !).
Beispiele:
1.
2.
3.
4.
5.
6.
2 ist eine gerade Zahl
Ein Hund ist kein Tier
Die Sonne kreist um die Erde
Ein Quark ist ein Elementarteilchen
Das Dreieck ABC ist gleichschenklig
29999999999991 − 1 ist eine Primzahl
Die erste Aussage ist wahr, die zweite Aussage ist falsch, der Wahrheitsgehalt der dritten Aussage
änderte sich im Laufe der Zeit. Die vierte Aussage hängt von einer physikalischen Definition von
Elementarteilchen“ ab, ob die fünfte Aussage wahr ist, ist nicht zu entscheiden, solange keine
”
exakte Definition und Beschreibung des konkreten Dreiecks vorliegt, der Wahrheitsgehalt der
letzten Aussage ist offen: 2999991 − 1 ist eine Primzahl oder sie ist keine, die Instanz“, die dies
”
entscheiden kann, ist wohl noch zu finden.
Für die Formulierung unserer Aussagen von mathematischem Gehalt benötigen wir Verabredungen, Sprechweisen, Symbole und eine griffige Notation. Dabei wollen wir aber nicht in
die Tiefen der mathematischen Grundlagen (Mengenlehre, Logik) eintauchen, sondern geben
uns mit einem naiven“ Standpunkt zufrieden, so wie wir es in den vorhergehenden Kapiteln
”
schon praktiziert haben. Er führt zu keinerlei Konflikten, solange wir uns mit konkret definierten
Objekten beschäftigen.
150
Argumentationen in der Mathematik beruhen darauf, dass ein Zusammenhang zwischen Aussagen hergestellt wird, daß Aussagen verknüpft werden. Als erstes Aussagenkonstrukt betrachten
wir die Verneinung/Negation einer Aussage. Konkret: Ist P eine Aussage, so bezeichnen wir
mit ¬P die Negation der Aussage P ; es ist also P wahr genau dann, wenn ¬P falsch ist. Man
bezeichnet die Negation als einstellige Verknüpfung“, benötigen wir doch dabei nur eine Aus”
sage. Logische Verknüpfungen, bei denen zwei Aussagen beteiligt sind, nennen wir zweistellige
oder binäre Aussageverknüpfungen. Logische Verknüpfungen (Junktoren) für zwei Aussagen
sind in der beistehenden Tabelle aufgeführt.
Durch logische Verknüpfung
Junktor
Sprechweise
Symbol
zweier Aussagen P,Q ensteht eine
dritte Aussage R, eine sogenannKonjunktion
. . . und . . .
∧
te verbundene Aussage. Um
Alternative
. . . oder . . .
∨
den Wahrheitsgehalt dieser verbundene Aussage geht es dann.
Implikation
wenn . . ., dann . . .
=⇒
Bestimmt wird die Aussage R da. . . genau dann, wenn . . .
⇐⇒
Äquivalenz
durch, welcher Wahrheitswert ihr
für die verschiedenen Belegungen
mit (w) (Wahrheitswert wahr“) und (f) (Wahrheitswert falsch“) der Aussagen P und Q zu”
”
kommt. Die folgende Wahrheitstafel zeigt, wie die oben angeführten Aussageverknüpfungen
definiert sind:
P
Q
P ∧ Q
P ∨ Q
P =⇒ Q
P ⇐⇒ Q
(w)
(w)
(w)
(w)
(w)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(f)
(f)
(f)
(f)
(w)
(w)
Man beachte insbesondere die Wahrheitstafel zu P =⇒ Q: Ist P falsch, so ist die Implikation
P =⇒ Q wahr, unabhängig vom Wahrheitsgehalt von Q.
Mit den nun eingeführten Verknüpfungen stehen uns schon eine große Anzahl von Aussagenkonstrukten zur Verfügung. Halten wir einige logische Gesetze fest.
Rechenregeln 5.1 Seien P, Q Aussagen.
(P =⇒ Q)
¬(P ∧ Q)
¬(P ∨ Q)
(P =⇒ Q)
⇐⇒
(¬Q =⇒ ¬P )
⇐⇒
¬P ∧ ¬Q
⇐⇒
⇐⇒
(5.1)
¬P ∨ ¬Q
(5.2)
(¬P ∨ Q)
(5.4)
(5.3)
Von der Richtigkeit dieser Aussagen überzeugen wir uns, indem wir die Wahrheitstafeln erstellen.
Etwa zu (5.1):
151
P =⇒ Q ¬ Q ¬ P ¬ Q =⇒ ¬ P
(P =⇒ Q) ⇐⇒ (¬ Q =⇒ ¬ P)
P
Q
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(w)
(w)
Ergebnisse in der Mathematik werden festgehalten in Sätzen, Lemmata, Hilfssätzen,
Folgerungen, . . . . Diese Ergebnisse sind zu beweisen, d.h. ihr Wahrheitsgehalt muss wahr
sein. Die Formulierung eines solchen Ergebnisses sieht – lostgelöst von Formulierungsbeiwerk –
im allgemeinen so aus:
Beweise
V =⇒ B
Dabei wird V Voraussetzung und B Behauptung genannt.
Ein direkter Beweis ist eine eine Kette von Implikationen, ausgehend von der Aussage V bis
zur Aussage B:
V =⇒ . . . =⇒ B
Ein indirekte Beweis (Kontrapositionsbeweis) basiert auf der Tatsache, dass die Wahrheitstafel zu V =⇒ B identisch ist mit der Wahrheitstafel zu ¬B =⇒ ¬V .
Ein Widerspruchsbeweis stützt sich auf die Tatsache, dass die Wahrheitstafel zu ¬(V =⇒ B)
identisch ist mit der Wahrheitstafel zu V ∧ ¬B , wie wir aus der Negation der Regel (5.4) in
Verbindung mit Regel (5.3) einsehen. Der darauf aufgebaute Beweis stellt sich dann so dar:
V ∧ ¬B =⇒ . . . =⇒ Q
Hierbei ist mit Q dann eine Aussage erreicht, die nicht wahr ist und wir haben in der Beweiskette einen Widerspruch erreicht. Der Vorteil des Widerspruchbeweises ist, dass zu der
Voraussetzung V noch ¬B hinzugenommen werden kann, um Folgerungen zu ziehen.
√
Der wohl berühmteste“ Widerspruchsbeweis ist der Nachweis der Tatsache, dass a := 2
”
keine rationale Zahl ist; er ist über 2000 Jahre alt. Dies geht so:
Zunächst eine Vorbemerkung über gerade und ungerade Zahlen: n ∈ N ist gerade, wenn es p ∈ N
gibt mit n = 2p , anderenfalls ungerade.
Man nehme an, dass a eine rationale Zahl ist. Dann haben wir
a=
p
mit p, q ∈ N , a2 = 2 .
q
Wir kännen o.E. annehmen, dass p oder q ungerade ist1 . Dann ist aber wegen p2 = q 2 · 2 p2
gerade und damit auch p , denn das Produkt zweier ungeraden Zahlen ist immer ungerade. Also
ist p = 2k mit k ∈ N, und wir erhalten 4k2 = q 2 ·, 2k2 = q 2 , und nun wäre auch q gerade. Also
haben wir einen Widerspruch erreicht.
1
Die Kürzungsregel war den Griechen auch vertraut, sie hat zu tun mit der Zerlegung einer Zahl in Primfaktoren
152
Rechenregeln 5.2 Seien P, Q, R Aussagen.
P ∧ Q
P ∨ Q
⇐⇒
⇐⇒
Q ∧ P
(5.5)
Q ∨ P
(5.6)
P ∨ (Q ∨ R)
(5.8)
(P ∧ Q) ∧ R
⇐⇒
P ∧ (Q ∧ R)
(5.7)
P ∧ (P ∨ Q)
⇐⇒
P
(5.9)
P
(5.10)
P ∧ (Q ∨ R)
⇐⇒
⇐⇒
(5.11)
⇐⇒
(P ∧ Q) ∨ (P ∧ R)
(P ∨ Q) ∧ (P ∨ R)
(P ∨ Q) ∨ R
P ∨ (P ∧ Q)
P ∨ (Q ∧ R)
⇐⇒
(5.12)
Die Gültigkeit von (5.5) , . . . , (5.12) belegt man wieder mit Hilfe von Wahrheitstafeln. Etwa zu
(5.11) in nicht vollständiger Aufzählung:
P
Q
R
Q ∨ R
P ∧ (Q ∨ R)
P ∧ Q
P ∧ R
(P ∧ Q) ∨ (P ∧ R)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
Sprechweisen:
(5.5),(5.6): Kommutativgesetze; (5.7),(5.8): Assoziativgesetze; (5.9),(5.10): Verschmelzungsgesetze; (5.11),(5.12): Distributivgesetze.
In Definitionen weisen wir mathematischen Objekten manchmal Eigenschaften mit einem
definierenden Äquivalenzzeichen “ : ⇐⇒ “ zu, etwa:
Objekt O hat Eigenschaft E : ⇐⇒ Eine E beschreibende Aussage A über das Objekt O ist
wahr (gilt).
5.2
Mengen, die zweite
Mit Mengen haben wir bereits hantiert und dabei auch Teilmengenbeziehungen untersucht. Nun
ergänzen wir die Mengenlehre“. Dabei werden wir feststellen, dass eine enge Beziehung zwischen
”
Junktoren und Mengenoperationen besteht.
Ein bequemes Hilfsmittel beim Nachdenken über Mengen sind die Venn–Diagramme, bei
denen in der Zeichenblattebene Gebiete zur Darstellung von Mengen benutzt werden: Durch
Kurven umschlossene Gebiete stellen Mengen A, B, . . . dar. Solche Darstellungen sind sehr gut
geeignet, formale Argumente für einen zu beweisenden Sachverhalt zu finden.
Die Nützlichkeit der leeren Menge ∅ wird deutlich bei der Definition des Durchschnitts. Hier ist
ja der Fall, daß A ∩ B kein Element enthält, sicherlich nicht auszuschließen, wie uns ein geeignetes Venn–Diagramm sofort lehrt. Zwei Mengen, deren Durchschnitt leer ist, heißen disjunkt.
153
A
A
B
(a) Teilmenge
A
B
(b) Vereinigung
B
(c) Durchschnitt
Abbildung 5.1: Venn–Diagramme
Rechenregeln 5.3 Seien A, B, C Mengen.
A ⊂ B, B ⊂ C
=⇒
A ∪ (B ∪ C)
=
A∪B
=
A ∩ (B ∪ C)
=
A ∩ (B ∩ C)
=
A∩B
=
A ∪ (B ∩ C)
=
A × (B ∪ C)
A × (B ∩ C) = (A × B) ∩ (A × C) .
=
A⊂C
(5.13)
(A ∩ B) ∩ C
(5.15)
B∩A
(5.17)
(A ∪ B) ∩ (A ∪ C)
(5.19)
(A ∪ B) ∪ C
(5.14)
B∪A
(5.16)
(A ∩ B) ∪ (A ∩ C)
(5.18)
(A × B) ∪ (A × C) .
(5.20)
(5.21)
Beweis von (5.18):
Wir haben zu zeigen: A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C), (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) .
Sei x ∈ A ∩ (B ∪ C). Dann gilt: x ∈ A, x ∈ B ∪ C . Daraus folgt: x ∈ A ∩ B oder x ∈ A ∩ C,
je nachdem, ob x ∈ B und/oder x ∈ C. Daraus schließen wir: x ∈ (A ∩ B) ∪ (A ∩ C). Für den
Beweis der anderen Inklusion lese man die eben vorgeführten Beweisschritte rückwärts.
Den Beweis der Regeln (5.20), (5.21) überlassen wir dem Leser.
Sprechweisen:
(5.13): Transitivität, (5.14),(5.15): Assoziativgesetze, (5.16),(5.17): Kommutativgesetze,
(5.18),(5.19): Distributivgesetze.
Hier sind noch ergänzende Regeln, die das Rechnen mit Mengen und Abbildungen verknüpfen.
Rechenregeln 5.4 Sei f : X −→ Y, A1 , A2 ⊂ X, B1 , B2 ⊂ Y .
A1 ⊂ A2
f (A1 ∪ A2 )
f (A1 ∩ A2 )
−1
B1 ⊂ B2
=⇒
=
⊂
=⇒
f (B1 ∪ B2 )
=
f (B1 ∩ B2 )
=
−1
f (A1 ) ⊂ f (A2 )
f (A1 ) ∪ f (A2 )
(5.23)
f (A1 ) ∩ f (A2 )
(5.24)
f (B1 ) ⊂ f (B2 )
(5.25)
f (B1 ) ∪ f (B2 )
(5.26)
f (B1 ) ∩ f (B2
(5.27)
−1
−1
−1
−1
−1
−1
Beweisen wir etwa (5.26).
Da eine Gleichheit von Mengen behauptet wird, sind zwei Inklusionen zu verifizieren.
154
(5.22)
−1
−1
−1
Zu f (B1 ∪ B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
Sei x ∈ f (B1 ∪ B2 ) . Also gilt f (x) ∈ B1 ∪ B2 . Ist f (x) ∈ B1 , dann ist x ∈ f (B1 ) ⊂
−1
−1
−1
−1
−1
f (B1 ) ∪ f (B2 ) . Ist f (x) ∈ B2 , dann ist x ∈ f (B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
−1
Zu f (B1 ) ∪ f (B2 ) ⊂ f (B1 ∪ B2 ) .
−1
−1
−1
−1
Sei x ∈ f (B1 ) ∪ f (B2 ) . Ist x ∈ f (B1 ), dann ist f (x) ∈ B1 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
−1
−1
Ist x ∈ f (B2 ), dann ist f (x) ∈ B2 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
Es ist häufig zweckmäßig, Mengen durch Indizes zu kennzeichnen. Ist I eine nichtleere Menge
und ist für jedes i ∈ I eine Menge Ai gegeben, so nennen wir (Ai )i∈I eine Mengenfamilie.
Dazu haben wir wieder Mengenoperationen:
\
Ai := {x|x ∈ Ai für alle i ∈ I} (Durchschnittsmenge)
i∈I
[
i∈I
Ai := {x|x ∈ Ai für wenigstens ein i ∈ I} (Vereinigungsmenge)
Es ist klar, dass wir das Produkt auf mehr als zwei Faktoren“ ausdehnen können. Etwa
”
kommt ein (gültiger) Lottoschein als Element der Menge
{x = (x1 , x2 , x3 , x4 , x5 , x6 ) ∈ Z × · · · × Z|x1 , . . . , x6 sind paarweise verschieden}
vor; dabei ist Z = {1, 2, 3, . . . , 49}. Ein Element (x1 , . . . , x6 ) der Menge nennt man ein 6-Tupel.
Das Gleichheitszeichen “ = “ verwenden wir in einer Menge unter der stillschweigenden Annahme der folgenden Regeln:
x = x ; (x = y =⇒ y = x) ; (x = y, y = z =⇒ x = z) .
Dies nehmen wir zum Anlaß für
Definition 5.5
Sei X eine Menge. Eine Teilmenge R ⊂ X × X heißt Äquivalenzrelation auf X, falls
(i) (x, x) ∈ R für alle x ∈ X
(Reflexivität)
(ii) (x, y) ∈ R =⇒ (y, x) ∈ R
(Symmetrie)
(iii) (x, y), (y, z) ∈ R =⇒ (x, z) ∈ R
(Transitivität)
gilt.
Liegt mit R auf X eine Äquivalenzrelation vor, so schreiben wir für (x, y) ∈ R (wie in der
R
Literatur üblich) x ∼ y oder kurz x ∼ y , wenn R uns aus dem Zusammenhang klar ist.
Die Bedeutung einer Äquivalenzrelation liegt darin, dass man damit die Menge X in Teilmengen (Klassen, Bündel) einteilen kann, eine Einteilung, die eventuell gröber ist, als die Aufteilung
in einelementige Mengen, und die bezüglich eines Merkmales“ (Blutgruppe, Haarfarbe, recht”
winklig, . . . ) doch noch aussagekräftig ist. Die Einteilung geschieht durch
R
[x] := {y ∈ X|y ∼ x} , x ∈ X .
Die Menge X/ R := {[x]|x ∈ X} heisst Quotientenmenge, die Objekte [x] heißen ÄquivalenzR
klassen, x heißt Repräsentant der Klasse [x] . Man beachte, dass jedes y ∈ X mit y ∼ x als
Repräsentant für [x] Verwendung finden kann. Im folgenden Lemma ist diese Aussage belegt.
155
Lemma 5.6
Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann gilt:
(a) Für jedes x ∈ X gibt es [y] ∈ X/ R mit x ∈ [y] .
(b) Es ist x ∼ y genau dann, wenn [x] = [y] gilt.
(c) Zwei Äquivalenzklassen besitzen genau dann nichtleeren Durchschnitt, wenn sie gleich sind.
Beweis:
Zu (a). Klar: x ∈ [x] für alle x ∈ X wegen der Reflexivität von “∼“.
Zu (b). Sei x ∼ y . Sei u ∈ [x]. Dann ist u ∼ x und aus der Symmetrie und der Transitivität folgt
u ∼ y, d.h. u ∈ [y]. Also ist [x] ⊂ [y] gezeigt. Die Aussage [y] ⊂ [x] folgt völlig analog.
Ist [x] = [y] dann ist x ∼ y, da wir x ∈ [y] = [x] haben.
Zu (c). Unter Beachtung der Transitivität, der Symmetrie von “∼“ und (b) folgt
z ∈ [x] ∩ [y] ⇐⇒ z ∼ x, z ∼ y ⇐⇒ x ∼ y ⇐⇒ [x] = [y]
was zu beweisen war.
Beispiel 5.7 Auf jeder Menge X ist durch
R := {(x, x)|x ∈ X}
eine Äquivalenzrelation gegeben. Wie sehen die Äquivalenzklassen aus?
Beispiel 5.8 Eine Kurve γ kann durch verschiedenen Parametrisierungen angegeben werden.
Wir nennen zwei Parametrisierungen x : [a, b] −→ Rn , y : [c, d] −→ Rn von γ äquivalent,
wenn es eine stetige, bijektive, monoton nicht fallende Abbildung τ : [c, d] −→ [a, b] gibt
mit y = x ◦ τ . Offenbar ist damit eine Äquivalenzrelation erklärt. Anschaulich bedeutet dies,
dass die Kurve γ in derselben Richtung, aber möglicherweise mit verschiedener Geschwindigkeit
durchlaufen wird.
Beispiel 5.9 Aus der Dreiecksgeometrie kennt man den Begriff der Kongruenz. Diese Kongruenz definiert auf der Menge der Dreiecke eine Äquivalenzrelation.
Sei X eine Menge und R eine Äquivalenzrelation auf X . Nach Lemma 5.6 haben wir damit
eine disjunkte Zerlegung X = ∪x∈X [x] . Damit verknüpft ist die Abbildung
π : X ∋ x 7−→ [x] ∈ X/ R ,
die so genannte Quotientenabbildung oder kanonische Projektion. Man sieht sofort, dass
diese Abbildung surjektiv ist, dass sie aber injektiv genau dann ist, wenn jede Klasse [x] nur aus
einem Element besteht. Das Vorgehen aus X mittels einer äquivalenrelation R die Menge X/ R
zu bilden, nennt man Quotientenbildung, die ein zentrales Definitionsprinzip der Mathematik
ist. Wir werden an vielen Stellen noch damit konfrontiert werden.
5.3
Gruppen
Die Gruppenstruktur ist von überrragender Bedeutung. Ihre Nutzung hinterließ eine Erfolgsspur
in der Mathematik. Von H. Poincaré ist die Aussage überliefert, Gruppen seien die ganze
”
Mathematik“.
156
Definition 5.10
Eine Menge G zusammen mit einer Verknüpfung • : G × G ∋ (a, b) 7−→ a • b ∈ G heißt eine
Gruppe genau dann, wenn gilt:
a) Es gibt ein Element e ∈ G mit a • e = e • a = a für alle a ∈ G .
b) Zu jedem a ∈ G gibt es ein Element a ∈ G mit a • a = a • a = e .
c) Für alle a, b, c ∈ G gilt
a • (b • c) = (a • b) • c .
Ist zusätzlich noch
d) Für alle a, b ∈ G gilt
a • b = b • a.
erfüllt, so heißt die Gruppe kommutativ.
Sei G eine Gruppe. Die Bedingung a) besagt, dass es ein bezüglich der Verknüpfung “•“
neutrales Element e in G gibt. Ist e′ ein weiteres neutrales Element in G, so lesen wir aus
e′ = e′ • e = e
– wir haben dabei a) zweimal verwendet – ab, dass das neutrale Element in einer Gruppe
eindeutig bestimmt ist.
Das in der Bedingung b) eingeführte Element ā heißt das zu a inverse Element. Es ist ebenfalls
eindeutig bestimmt, denn aus
a • a = a • a = e , a • a′ = a′ • a = e ,
folgt
a′ = a′ • e = a′ • (a • a) = (a′ • a) • a = e • a = a .
Die Bedingung c), die wir eben verwendet haben, nennt man das Assoziativgesetz. Es besagt,
dass Klammern bei der Reihenfolge der Verknüpfungen beliebig gesetzt werden dürfen und
deshalb, soweit sie nicht für die Lesbarkeit benötigt werden, weggelassen werden dürfen.
Wegen der Eindeutigkeit des inversen Elements (siehe oben) können wir nun ein inverses
Element in der Bezeichnung auszeichnen.
Bezeichnung: Wir schreiben für das inverse Element a von a im abstrakten Rahmen meist a−1 ,
in speziellen Fällen weichen wir davon ab.
Bemerkung 5.11 Die Forderungen a) und b) in Definition 5.10 kann man bei Beibehaltung
von b) auch schwächer formulieren ohne etwas zu verlieren. Es reicht, statt a) und b) zu fordern:
a’) ∃e ∈ G ∀a ∈ G (e • a = a) .
b’) ∀a ∈ G ∃ā ∈ G (ā • a = e) .
Den Beweis – man folgert zunächst b) aus a′ ) und b′ ) und dann a) – wollen wir übergehen.
Seit dem 17. Jahrhundert ist der Gruppenbegriff implizit bei Mathematikern zu finden,
zunächst wohl nur bei konkreten Beispielen. Zu Beginn des 20. Jahrhunderts kam dann die
Verbindung der Gruppentheorie zur Physik als Motivation für die Untersuchungen hinzu.
Wir führen nun eine Reihe von Beispielen an und zeigen damit, dass der Gruppenbegriff in der
Tat geeignet ist, viele Objekte unter einem gemeinsamen Gesichtspunkt zu betrachten. Dabei
schreiben wir dann Verknüpfung, Einselement, Inverses immer mit dem Symbol, das wir in der
speziellen Situation bereits kennen. Auf die Verifikation der Assoziativität bzw. Kommutativität
verzichten wir meist, da hier in der Regel kein Problem vorliegt.
157
Beispiel 5.12 (G := Z, • := +) ist eine kommutative Gruppe mit neutralem Element 0 und
Inversem −z für z ∈ Z .
Wenn die Verknüpfung eine Addition ist wie etwa in Beispiel 5.12, nennt man das Inverse
eines Elements meist das Negative. Ist die Verknüpfung • in einer Gruppe einer Addition
verwandt“, so nennt man sie, wenn sie kommutativ ist, auch abelsch. Der Begriff abelsch“
”
”
ist vom Namen des norwegischen Mathematikers Abel2 abgeleitet.
Beispiel 5.13 (G := Q, • := +) , (G := R, • := +) sind abelsche Gruppen. Das neutrale
Element ist jeweils 0, das Inverse (Negative) eines Elementes r ist −r.
Beispiel 5.14 (G := K∗ := K\{0}, • := ·) ist für K ∈ {Q, R, C} eine kommutative Gruppe mit
neutralem Element 1 und Inversem a−1 für a ∈ K∗ .
Die Rechenregeln einer Gruppe sind uns hier wohlvertraut. Man beachte, dass wir das Nullelement aus K entfernen mussten, da dieses Element kein Inverses bezüglich der Multiplikation
besitzt.
In einer Gruppe (G, •) mit Einselement e können wir die Potenzschreibweise einführen:
a0 := e , ak+1 := ak • a , k ∈ N0 ; a−k := (a−1 )k , k ∈ N , falls a 6= 0 .
Nun haben wir die Gruppenstrukturen in den Zahlen erkannt. Wir finden sie auch beim
Rechnen mit Restklassen, wie folgendes Beispiel zeigt.
Beispiel 5.15 Sei m ∈ N, m ≥ 2 . Wir kännen damit jede Zahl z ∈ Z danach unterscheiden,
welchen Rest sie nach Division mit m lösst. Dies führt zur Äquivalenzrelation
u ∼ v : ⇐⇒ u − v = km mit einem k ∈ Z .
Als Äquivalenzklasse mit Repräsentant z ∈ Z erhalten wir
[z] := [z]m := {x ∈ Z| m teilt x − z} .
Damit erhalten wir genau m verschiedene Restklassen, da bei Division einer ganzen Zahl durch
m genau m verschiedene Reste auftreten können, nämlich 0, 1, . . . , m − 1 . Also können wir
Zm := {[z]|z ∈ Z} durch
Zm = {[0], . . . , [m − 1]}
erfassen; wir haben dabei die kleinsten nichtnegativen Vertreter für Restklassen gewählt.
Durch
[k] ⊕ [l] := [k + l] , [k] ⊙ [l] := [k · l] , k, l ∈ Z,
wird eine “Addition“ und “Multiplikation“ erklärt ist. Man beachte dass die oben eingeführte
Addition und Multiplikation von den gewählten Vertretern der Restklassen unabhängig ist, denn
man verifiziert leicht
[k] = [k′ ], [l] = [l′ ] =⇒ [k] ⊕ [l] = [k′ ] ⊕ [l′ ] , [k] ⊙ [l] = [k′ ] ⊙ [l′ ] .
Nun haben wir bezüglich der Addition:
(G := Zm , • := ⊕) ist eine kommutative Gruppe .
2
Abel, Niels H., 1802 – 1829
158
Das neutrale Element ist die Klasse [0], das Negative zu a := [k] ist −a := [−k] = [m − k] .
Dieses Ergebnis gilt unabhängig von m.
Bei der Multiplikation liegt die Situation etwa anders:
(G := Zm \{[0]}, • := ⊙)
ist eine Gruppe genau dann, wenn m eine Primzahl ist, d.h. nur durch 1 und sich selbst teilbar
ist. Dass keine Gruppe vorliegt, wenn m keine Primzahl ist, sieht man exemplarisch daran, dass
etwa [2] ⊙ [2] = [0] in Z4 gilt, d.h. die Verknüpfung führt dort aus G heraus. (Wenn wir [0] zu
G wieder hinzunehmen, hat [0] kein Inverses!)
Ist nun m eine Primzahl, dann ist die Klasse [1] ein neutrales Element und als Konsequenz aus
der Division mit Rest wissen wir, dass es zu jeder Zahl k = 1, . . . , m − 1 ein l ∈ N gibt mit m
teilt kl − 1; d.h. [k] ⊙ [l] = [1] . Somit hat man für jedes Element in Zm \{[0]} ein Inverses.
Die Gruppentafeln – so bezeichnen wir eine vollständige Auflistung der Verknüpfungen der
Gruppenelemente – zu m = 5 sehen so aus, wie in Abbildung 5.2 vorgestellt.
⊕
[0] [1] [2] [3] [4]
[0]
[0] [1] [2] [3] [4]
⊙
[1] [2] [3] [4]
[1]
[1] [2] [3] [4] [0]
[1]
[1] [2] [3] [4]
[2]
[2] [3] [4] [0] [1]
[2]
[2] [4] [1] [3]
[3]
[3] [4] [0] [1] [2]
[3]
[3] [1] [4] [2]
[4]
[4] [0] [1] [2] [3]
[4]
[4] [3] [2] [1]
(b)
(a)
Abbildung 5.2: Gruppentafeln zu Z5
Ein und diesselbe Gruppe kann in verschiedenem Kleide“ daherkommen. Um zu klären,
”
welche Gruppen wirklich verschieden“ sind, bedient man sich des Abbildungsbegriffs. Sind
”
(G, •), (G′ , •′ ) Gruppen und φ : G −→ G′ eine Abbildung, die bijektiv ist und für die
φ(g • h) = φ(g) •′ φ(h) für alle g, h ∈ G gilt (das Bild der Hintereinanderausführung ist die
Hintereinanderausführung von Bildern), so nennt man die Gruppen G, G′ isomorph und φ
einen Gruppen–Isomorphismus. Die Klassifikation von Gruppen bedeutet dann, die Klassen
c
•
e a b
c
e
e a b
c
e
e a b
c
b
e a b
e
e a b
a
a b
c
e
a
a e
c
a b
b
b
c
e a
b
b
c
e a
c
c
e a b
c
c
b
a e
e a
e
e a
a
a e
b
(a)
e a b
•
•
a
•
b
(b)
e
e a
(c) Zyklische Gruppe
(d) Kleinsche Vierergruppe
Abbildung 5.3: Gruppentafeln
von Gruppen zu bestimmen, die sich höchstens um einen Isomorphismus unterscheiden. (Sind
etwa G, G′ isomorph, so ist G kommutativ genau dann, wenn G′ kommutativ ist.)
159
Alle einelementigen Gruppen sind isomorph. Realisierungen der zweielementigen Gruppen
sind:
• Die additive Gruppe Z2 .
• Die Symmetriegruppe des Buchstabens A als Figur der Ebene: A kann an der Symme”
trieachse“ gespiegelt werden.
• Die Symmetriegruppe des Buchstabens Z als Figur der Ebene: Z kann um π gedreht
werden.
Diese genannten zweielementigen Gruppen sind alle isomorph. Dies gilt aber allgemein, denn jede
zweielementige Gruppe {e, a} hat notwendigerweise eine Gruppentafel, wie sie in Abbildung 5.2
(a) zu sehen ist.
Die einzige Gruppentafel einer Gruppe {e, a, b}, also mit drei Elementen, hat das Aussehen,
wie sie in Abbildung 5.2 (b) aufgeführt ist (warum?). Also sind alle Gruppen mit drei Elementen
isomorph.
Bei Gruppen mit den 4 Elementen e, a, b, c trifft dies nicht zu. Es gibt zwei Typen von Gruppen, die nicht isomorph sind. Der eine Typ wird repräsentiert durch die zyklische Gruppe;
hier ist b = a2 , c = a3 , e = a4 . Der andere Typ wird repräsentiert durch die Kleinsche Vierergruppe; hier ist e2 = a2 = b2 = c2 = e . In Abbildung 5.2 (c), (d) sind sie zu sehen. (Die
Nichtisomorphie folgt schon aus der Tatsache, daß die eine Gruppe zyklisch“ die andere es
”
nicht ist.) Eine Realisierung der zyklischen Gruppe ist (Z4 , +) . Eine Realisierung der Kleinschen Vierergruppe ist die Symmetriegruppe eines Rechtecks, das kein Quadrat ist:
e := id;
a := Spiegelung an der senkrechten Achse durch den Diagonalenschnittpunkt;
b := Spiegelung an der waagrechten Achse durch den Diagonalenschnittpunkt;
c := Drehung um den Diagonalenschnittpunkt um 180o (c = a • b).
Es fällt auf, dass sich die Drehung c durch die Spiegelungen a, b ausdrücken lassen.
Beispiel 5.16 Sei M eine Menge. Wir setzen:
S(M ) := {f : M −→ M |f bijektiv} .
S(M ) bildet zusammen mit der Hintereinanderausführung ◦“ als Verknüpfung von Abbildun”
gen eine Gruppe, die Symmetrische Gruppe genannt wird. Die Namenswahl Symmetrische
”
Gruppe“ ergibt sich aus der Tatsache, dass für Mengen {1, . . . , m} sich S(M ) als eine Gruppe
von Abbildungen interpretieren lösst, die gewisse Figuren invariant lassen. Als einfaches Beispiel
sei genannt: Sind in M := {1, 2, 3} die Eckennummern eines gleichseitigen Dreiecks aufgeschrieben, so sind in S(M ) dann die Abbildungen zusammengefasst, die ein solches Dreieck starr
auf sich abbilden und dabei die Ecken vertauschen. Deshalb werden die Elemente von S(M )
als Permutationen bezeichnet. Beim Studium der Determinanten werden wir Gebrauch von
Permutationen machen.
Beispiel 5.17 Betrachte die Menge M := {1, 2, 3, 4} . Eine nützliche Schreibweise bei Permutationen ist hier verwendet:
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
σ0 := id :=
, σ1 :=
, σ2 :=
, σ3 :=
.
1 2 3 4
1 3 2 4
2 3 4 1
4 1 2 3
Es bedeutet etwa σ3 : 1 7−→ 4, 2 7−→ 1, 3 7−→ 2, 4 7−→ 3 .
Man rechnet nun nach, dass G := {σ0 , σ1 , σ2 , σ2 } bez”glich der Hintereinanderausführung eine
Gruppe bildet.
160
Über die Lösbarkeit einer linearen Gleichung“ in einer Gruppe gibt Auskunft
”
Folgerung 5.18
Sei (G, •) eine Gruppe und seien a, b ∈ G . Dann gilt:
∃1 x, y ∈ G (a • x = b , y • a = b) .
Beweis:
Klar: x := a • b , y := b • a sind Lösungen; hierbei ist a das Inverse zu a .
Die Eindeutigkeit folgt etwa im Fall a • x = b so: Aus a • x = b , a • z = b , x, z ∈ G , folgt
x = a • b = a • (a • z) = (a • a) • z = e • z = z .
Man beachte, dass wir in Folgerung 5.18 nicht die Kommutativität vorausgesetzt haben und
daher möglicherweise Links–“ und Rechtslösung“ verschieden sind.
”
”
Definition 5.19
Sei (G, •) eine Gruppe. Die Anzahl der Elemente von G heißt Ordnung von G. Wir schreiben
|G| für die Ordnung von G .
Wir verabreden, dass die Ordnung unendlich sei, falls G keine endliche Menge ist. Also |G| =
∞, falls #G = ∞ .
Wenn man eine Gruppe hat, liegt die Frage nahe, welche Teilmengen in der Verknüpfung von
G selbst wieder eine Gruppe bilden.
Definition 5.20
Sei (G, •) eine Gruppe. Eine nichtleere Teilmenge H von G heißt Untergruppe von G, falls
gilt:
g • h−1 ∈ H für alle g, h ∈ H .
Folgerung 5.21
Sei (G, •) eine Gruppe. Sei H eine Untergruppe von G . Dann ist (H, •) selbst eine Gruppe.
Beweis:
Sei h ∈ H ; beachte H 6= ∅ . Dann ist das Einselelement e = h • h−1 von G in H. Dann ist aber
für jedes h ∈ H auch h−1 = e • h−1 in H . Damit folgt nun sofort, dass H mit der Verknüpfung
• selbst eine Gruppe ist.
Beispiel 5.22 Hn := nZ := {nk|k ∈ Z} für jedes n ∈ N eine Untergruppe der additiven Gruppe
Z. Q ist Untergruppe von R bezüglich der Addition, Q\{0} ist Untergruppe von R\{0} bezüglich
der Multiplikation.
Lemma 5.23
Seien (G, •), (G′ , •′ ) Gruppen mit Einselement e bzw. e′ und sei φ : G −→ G′ ein Gruppenhomomorphismus, d. h.
φ(g • h) = φ(g) •′ φ(h) für alle g, h ∈ G .
(5.28)
Dann sind
Kern(φ) := {g ∈ G|φ(g) = e′ } , Bild(φ) := {g′ ∈ G′ |g′ = φ(g) für ein g ∈ G}
Untergruppen von G bzw. G′ .
161
(5.29)
Beweis:
Wir haben φ(e) = φ(e • e) = φ(e) •′ φ(e) und daher φ(e) = e′ . Also erhalten wir e′ = φ(g • g−1 ) =
φ(g) •′ φ(g−1 ), was φ(g−1 ) = φ(g)−1 zur Konsequenz hat. Also folgt für g, h ∈ Kern(φ) auch
φ(g • h−1 ) = φ(g) •′ φ(h)−1 = e′ • e′ = e′ . Damit ist die erste Aussage gezeigt. Den Beweis der
zweiten Aussage überlassen wir dem Leser.
Beispiel 5.24 In der Diedergruppe Dn werden die Abbildungen zusammengefasst, die ein
reguläres, im Ursprung zentriertes n–Eck invariant lassen. Dabei wird die Figur als (dänner)
Zweiflächner (Dieder) im Raum R3 betrachtet. Das n–Eck darf also starr im Raum bewegt
werden. Sind die Ecken v 0 , . . . , v n−1 ∈ R2 im Gegenuhrzeigersinn nummeriert, so ist die Drehung
R mit Winkel 2π/n in Dn und durch Rv i = v i+1 (v n := v 0 ) gegeben. Die Spiegelung S um die
durch v 0 und θ gehende Achse ist auch in Dn (Umklappung) und erfällt Sv i = v n−i . Man kann
nun elementar nachweisen, dass die Elemente von Dn genau durch
id, R, R ◦ R, . . . , R◦n := R
· · ◦ R}, S, RS, . . . , R◦(n−1) S
| ◦ ·{z
n–mal
gegeben sind. Die Ordnung der Gruppe Dn ist also 2n .
Folgerung 5.25
Sei (G, •) eine Gruppe mit Einselement e und H eine Untergruppe von G und seien g1 , g2 ∈ G .
Es gilt:
(a) eH = hH = H für alle h ∈ H .
(b) #g1 H = #g2 H .
(c) Wir haben folgende Alternative: Entweder ist g1 H = g2 H oder g1 H ∩ g2 H ist leer.
Beweis:
Zu (a). eH = H ist klar. hH = H für h ∈ H folgt aus der Tatsache, dass h−1 auch in H ist.
Zu (b). Die Abbildung
K : g1 H ∋ g1 • h 7−→ g2 • h ∈ g2 H
ist wohldefiniert und bijektiv, wie man leicht nachrechnet. Daraus folgt #g1 H = #g2 H. Ist
g ∈ g1 H ∩ g2 H, d.h. g = g1 • h1 = g2 • h2 mit h1 , h2 ∈ H, so folgt g1 = g2 • h2 • h−1
1 ∈ g2 H.
Daraus folgt g1 H ⊂ g2 H und aus Symmetriegründen auch g2 H ⊂ g1 H.
Zu (c). Dies folgt schon aus der Tatsache, dass wir es mit Äquivalenzklassen zu tun haben. Definition 5.26
Sei (G, •) eine Gruppe und H eine Untergruppe. Die Zahl [G : H] := #{gH|g ∈ G} heißt der
Index von H in G .
Beachte, dass wenn zwei der drei Zahlen |G|, |H|, [G : H] endlich sind, dann ist es auch die
dritte Zahl. Es gibt Gruppen G, H unendlicher Ordnung, für die [G : H] endlich ist.
Satz 5.27 (Satz von Lagrange)
Sei (G, •) eine endliche Gruppe und H eine Untergruppe von G. Dann ist die Ordnung |H| von
H ein Teiler der Ordnung |G| von G.
Beweis:
Offenbar gibt es nach Folgerung 5.25 g1 , . . . , gl ∈ G mit
G=
l
[
gi H ,
i=1
162
(5.30)
und diese Vereinigung ist disjunkt. Also gilt |G| = l|H| und [G : H] = l .
Es ist offensichtlich, dass der obige Satz 5.27 für unendliche Ordnung von G keinen Sinn
ergibt, die in (5.30) aufgeführte Darstellung kann aber trotzdem bestehen.
Beispiel 5.28 Sei (G, •) eine endliche Gruppe mit Einselement e und sei g ∈ G, g 6= e . Sei
H die kleinste Untergruppe von G, die das Element g enthält; die Existenz dieser Untergruppe
folgt aus der leicht zu verifizierenden Tatsache, dass der Durchschnitt von Untergruppen stets
wieder eine Untergruppe ist. Da die Menge G endlich ist, gibt es ein Paar (k, l) ∈ N × N mit
gk = gl und k > l . Es folgt gk−l = e . Sei N ∈ N die kleinste Zahl n mit gn = e . Damit gilt
H = {e, g, . . . , gN −1 } ,
denn: Offenbar ist H ′ := {e, g, . . . , gN −1 } eine Untergruppe mit g ∈ H ′ . Daraus folgt H ⊂ H ′
nach Definition von H . Da gr ∈ H für jedes r ∈ N0 gelten muss, folgt auch H ′ ⊂ H .
Nun ist auch noch klar, dass N die Ordnung von H ist, daher ein Teiler von |G| ist und g|H| = e
gilt.
5.4
(Angeordnete) Körper
Wir wollen nun Körper allgemein einführen. Damit ordnen wir das Beispiel R ein und stellen
weitere wichtige Zahlkörper vor. Doppelformulierungen zu Kapitel 1 sind unvermeidbar. Ein
Körper ist – sehr kurz formuliert – eine Menge, die die Struktur einer Gruppe in zweifacher
Hinsicht trägt.
Definition 5.29
Eine Menge K mit zwei Verknüpfungen
+ : K × K ∋ (a, b) 7−→ a + b ∈ K ,
(Addition)
· : K × K ∋ (a, b) 7−→ a · b ∈ K
(Multiplikation)
heißt ein Körper, wenn gilt:
a) (K, +) ist eine abelsche Gruppe mit neutralem Element 0.
b) (K∗ := K\{0}, ·) ist eine abelsche Gruppe mit neutralem Element 1 .
c) Für alle a, b, c ∈ K gilt: a · (b + c) = a · b + a · c .
Die Bedingungen a), b) sind uns wohlvertraut.
Mit der Tatsache 1 6= 0 ist schon klar, dass
ein Körper mindestens zwei Elemente besitzt,
nämlich das Nullelement 0 (neutrales Element
bzgl. der Addition) und das Einselement 1
(neutrales Element bzgl. der Multiplikation). Die
Bedingung c) heißt Distributivgesetz. Es erklärt, wie sich die beiden Verknüpfungen miteinander vertragen“.
”
Es ist einfach zu sehen, dass 0, 1 durch ihre Eigenschaft, neutrales Element zu sein, eindeutig
163
+
n
e
·
n
n
n
e
n
n n
e
e
n
e
n
(a)
e
e
(b)
Abbildung 5.4: Gruppentafeln zu F2
bestimmt sind. Das Inverse von a bzgl. der Addition schreiben wir mit −a, das Inverse von
a ∈ K∗ bezüglich der Multiplikation schreiben wir mit a−1 . Dies geschieht in Anlehnung an das
Rechnen in Q bzw. R.
Beispiel 5.30 Q, R sind mit der üblichen Addition und Multiplikation Körper. Kein Körper ist
Z, wenn man mit der üblichen Addition und Multiplikation rechnen will. Die (abstrakte) Menge
F2 := {n, e} ist ein Körper, wenn wir die Verknüpfungen durch die Gruppentafeln erklären; siehe
Abbildung 5.4 (a) für die Addition, 5.4 (b) für die Multiplikation. Damit haben wir auch einen
kleinsten“ Körper angegeben. Beachte, fass F∗2 = {e} gilt. Klar, n steht für 0, e steht für 1. ”
Folgerung 5.31
Sei K ein Körper und seien a, b ∈ K . Es gilt:
(1) Die Gleichung a + x = b hat die eindeutige Lösung x = b + (−a) .
(2) −(−a) = a , −(a + b) = (−a) + (−b) .
(3) Die Gleichung a · x = b hat die eindeutige Lösung x = a−1 b falls a 6= 0 .
(4) (a−1 )−1 = a , falls a 6= 0 .
(5) (a · b)−1 = b−1 · a−1 , falls a 6= 0, b 6= 0 .
(6) a · 0 = 0 .
(7) a · b = 0 ⇐⇒ a = 0 oder b = 0 .
(8) (−a) · b = −(a · b) , (−a) · (−b) = a · b .
Beweis:
(1) und (3) folgen aus Folgerung 5.18.
Zu (2). Aus (−a) + (−(−a)) = 0, (−a) + a = 0 folgt mit (1) die Aussage −(−a) = a .
Aus (a + b) + (−(a + b)) = 0 folgt durch Addition von (−a) auf jeder Seite
b + (−(a + b)) = −a , d.h. −(a + b) = −a + (−b) .
(4), (5) folgen analog (2) .
Zu (6). a · 0 = a · (0 + 0) = a · 0 + a · 0, also mit (1) a · 0 = 0 .
Zu (7). Offensichtlich folgt mit (6) aus a = 0 oder b = 0 sofort a · b = 0 .
Die Umkehrung folgt mit (6) , falls etwa a 6= 0 .
Zu (8). 0 = 0 · b = (a + (−a)) · b = a · b + (−a) · b , woraus die erste Aussage folgt. Die zweite
Aussage folgt mit −b aus der eben bewiesenen Aussage.
Die Aussage (3) in Folgerung 5.31 kann etwas umfassender formuliert werden: Die Gleichung
a · x = b hat die eindeutige Lösung x = a−1 b falls a 6= 0 , sie hat keine Lösung, falls a = 0 und
b 6= 0, und sie hat jedes x ∈ K als Lösung, falls a = b = 0 . Man hat dazu nur (6) aus Folgerung
5.31 heranzuziehen.
Von Nutzen ist die folgende Schreibweise nx , n ∈ N0 , x ∈ K :
Induktiv für x ∈ K : 0x := 0 ; (n + 1)x := x + nx , n ∈ N0 .
Nützlich ist auch die Potenzschreibweise, die in einem beliebigem Körper K Anwendung finden
kann:
Induktiv für x ∈ K : x0 := 1 ; xn+1 := x · xn , n ∈ N0 .
164
Im Körper der reellen und damit auch der rationalen Zahlen haben wir eine Anordnung,
indem wir Zahlenpaare auf kleiner (<) oder größer (>) überprüfen. Bei allgemeinen Körpern
formulieren wir das Axiom der Anordnung so:
Anordnungsaxiom
Ein Körper K heisst angeordnet, wenn es eine eine Teilmenge K+ von K gibt, so dass gilt:
(1) Für jedes x ∈ K gilt genau eine der folgenden Aussagen: x ∈ K+ , x = 0 , −x ∈ K+ .
(2) Ist x ∈ K+ und y ∈ K+ , so folgt x + y ∈ K+ .
(K+ ist abgeschlossen bezgl. Addition)
(3) Ist x ∈ K+ und y ∈ K+ , so folgt x · y ∈ K+ . (K+ ist abgeschlossen bezgl. Multiplikation)
Definition 5.32
Sei K ein angeordneter Körper. Die Elemente von K+ werden positiv genannt, die Elemente x
mit −x ∈ K+ heißen negativ.
Schreibweisen: Wir setzen für x, y ∈ K .
x > 0 : ⇐⇒
x ≥ y : ⇐⇒
x < y : ⇐⇒
x ∈ K+ ; x > y : ⇐⇒ x − y > 0 ;
x > y oder x = y ;
y > x ; x ≤ y : ⇐⇒ y ≥ x .
Folgerung 5.33
Sei K ein angeordneter Körper mit der Anordnung definiert durch K+ . Seien x, y, z ∈ K+ . Dann
gilt:
(1) Es gilt genau eine der folgenden Aussagen: x > 0 , x = 0 , x < 0 .
(2) x < y =⇒ x + z < y + z
(3) x < y, 0 < z =⇒ xz < yz
Beweis:
Die Aussagen sind Umformulierungen der Eigenschaft ∈ K“ in >“.
”
”
Bemerkung 5.34 Im Anordnungsaxiom haben wir eine Ordnungsstruktur, die durch K+ bzw.
“>“ definiert ist, eingeführt. Diese wird sich später im Spezialfall der reellen Zahlen als die
Größer–Beziehung in R zu erkennen geben.
Folgerung 5.35
Sei K ein angeordneter Körper. Seien v, w, x, y, z ∈ K . Wir haben:
1. x ≤ y, v < w =⇒ x + v < y + w .
2. x ≤ y =⇒ −x ≥ −y .
3. x ≤ y, z ≤ 0 =⇒ yz ≤ xz .
4. x2 ≥ 0 ; x2 > 0, falls x 6= 0 ; 1 > 0 .
5. x > 0 =⇒ x−1 > 0 .
165
6. 0 < x ≤ y =⇒ x−1 ≥ y −1 > 0 .
Beweis:
Zu 1.: Mit Folgerung 5.33 1. folgt x + v < x + w (für x > 0, für x = 0 ist die Aussage trivial)
und mit der Definition von ≤ folgt x + v < x + w ≤ y + w.
Zu 2.: (−x − (−y)) = (y − x) ≥ 0 .
Zu 3.: Aus 2. folgt 0 ≤ −z und damit −xz ≤ −yz, also yz ≤ xz.
Zu 4.: Ist x ≥ 0, so folgt x2 ≥ 0 aus der Monotonie der Multiplikation. Ist x ≤ 0, so folgt x2 ≥ 0
aus 3..
Aus 1 = 1 · 1 folgt daher auch 1 > 0 .
Zu 5.: Aus x−1 < 0 würde −1 · 1 = −1 = x(−x−1 ) > 0 folgen im Widerspruch zu 4..
Zu 6.: Aus der Monotonie bzgl. der Multiplikation folgt xy > 0 und damit (xy)−1 > 0 wegen 5..
Daraus folgt x−1 = (xy)−1 y ≥ (xy)−1 x = y −1 .
Beispiel 5.36 Der bereits angeführte Körper F2 kann kein angeordneter Körper sein, denn
anderenfalls müsste
n<e<e+e=n
gelten. Kein Körper mit endlich vielen Elementen lösst sich (mit Hilfe der Angabe einer Teilmenge K+ ) anordnen!
In einem angeordneten Körper finden wir eine Menge, die wir schon als natürliche Zahlen
kennen wieder:
N := {1, 1 + 1, 1 + 1 + 1, . . . } = {1, 2, 3, . . . } .
Ebenso finden wir dann damit die ganzen Zahlen Z und Q .
Definition 5.37
Sei K ein angeordneter Körper. Setze
|x| :=
x
−x
, falls x ≥ 0
.
, falls x < 0
Man nennt |x| den Betrag von x.
Lemma 5.38
Sei K ein angeordneter Körper. Seien x, y ∈ K . Dann ist |x| ≤ |y| genau dann, wenn x ≤ |y|
und −x ≤ |y| gilt.
Beweis:
Ist x ≥ 0, dann ist −x ≤ x = |x| ≤ |y| . Ist x < 0, dann ist x < −x = |x| ≤ |y| . Daraus liest
man alles ab.
Lemma 5.39
Sei K ein angeordneter Körper. Seien x, y ∈ K . Es gilt:
a) |x| = 0 ⇐⇒ x = 0 .
(Definitheit)
b) |xy| = |x||y| .
(Homogenität)
c) |x + y| ≤ |x| + |y| .
(Dreiecksungleichung)
Beweis:
a) und b) sind einfach nachzurechnen. Zu c).
Wegen x ≤ |x|, y ≤ |y| folgt x + y ≤ |x| + |y|. Wegen −x ≤ |x|, −y ≤ |y| folgt −(x + y) ≤ |x| + |y|.
Daraus folgt |x + y| ≤ |x| + |y| mit Lemma 5.38 .
166
Folgerung 5.40
Sei K ein angeordneter Körper. Seien x, y ∈ K . Es gilt:
| |x| − |y| | ≤ |x − y| .
Beweis:
Wir haben mit Lemma 5.39
|x| = |(x − y) + y| ≤ |x − y| + |y|, also |x| − |y| ≤ |x − y| ,
|y| = |(y − x) + x| ≤ |y − x| + |x|, also |y| − |x| ≤ |x − y| .
Daraus liest man die Aussage mit Lemma 5.38 ab.
Definition 5.41
Sei K ein angeordneter Körper. Eine Teilmenge A von K heißt nach oben beschränkt, wenn
∃x ∈ K ∀a ∈ A (a ≤ x)
gilt. Jedes x ∈ K, das die obige Eigenschaft hat, heißt eine obere Schranke von A.
Sei K ein angeordneter Körper. Sei A ⊂ K nach oben beschränkt, A 6= ∅. Dann ist also
S(A) := {x ∈ R|a ≤ x für alle a ∈ A}
nichtleer.
Vollständigkeitsaxiom
Ein angeordneter Körper K heisst vollständig, wenn jede nichtleere, nach oben beschränkte
Menge A ⊂ K eine kleinste obere Schranke x ∈ K besitzt.
Definition 5.42
Sei K ein vollständiger Körper. Sei A eine nichtleere, nach oben beschränkte Teilmenge. Wir
schreiben
x = sup a = sup{a|a ∈ A} oder kurz x = sup A
a∈A
für die kleinste obere Schranke und nennen x auch das Supremum von A . Ist x = sup A ein
Element von A, so schreiben wir
x = max a = max{a|a ∈ A} oder kurz x = max A
a∈A
und nennen x das Maximum von A .
Die Körperaxiome, das Anordnungsaxiom und das Vollständigkeitsaxiom bestimmen den
Körper der reellen Zahlen schon vollständig; wir verzichten auf die Verifikation dieser Aussage. Dies soll heißen, dass – bis auf Umbezeichnung durch eine bijektive Abbildung, die sich
gut mit der Addition und der Multiplikation verträgt (Isomorphismus) – ein Körper mit diesen
Eigenschaften schon eindeutig bestimmt ist. Diesen Körper bezeichnen wir von nun an mit R
und nennen ihn
Körper der reellen Zahlen.
Hat man nun eine Menge A reeller Zahlen, dann ist A nach oben beschränkt genau dann,
wenn −A := {−a|a ∈ A} nach unten beschränkt ist. Dies führt uns zu
167
Definition 5.43
Sei A eine nichtleere Teilmenge von R . Ist A nach unten beschränkt, dann schreiben wir
x = inf a = inf{a|a ∈ A} oder kurz x = inf A
a∈A
und nennen x größte untere Schranke oder Infimum von A . Ist x = inf A ein Element von
A, so schreiben wir
x = inf a = inf{a|a ∈ A} oder kurz x = min A
a∈A
und nennen x das Minimum von A .
Definition 5.44
Eine Menge A ⊂ R, A 6= ∅, heißt beschränkt, falls A nach unten und nach oben beschränkt ist,
d.h. falls
∃x ∈ R ∀a ∈ A (|a| ≤ x)
gilt.
Beispiel 5.45 Die Menge der natürlichen Zahlen ist nach unten (1 ist eine untere Schranke),
aber nicht nach oben beschränkt, denn:
Annahme: x ∈ R ist obere Schranke von N. Dann gibt es eine kleinste obere Schranke und wir
können o.E. annehmen: x − 12 ist keine obere Schranke. Also gibt es n ∈ N mit x − 21 ≤ n. Dann
ist aber n + 1 > x, was ein Widerspruch zur Tatsache ist, dass x obere Schranke ist.
Satz 5.46
Wir haben folgende Aussagen:
∀x > 0 ∀y ∈ R ∃n ∈ N (nx > y)
(5.31)
Beweis:
Sei x > 0, y ∈ R . Annahme: nx ≤ y für alle n ∈ N.
Daraus folgt n ≤ yx−1 für alle n ∈ N, was ein Widerspruch zu Beispiel 5.45 ist.
Die Eigenschaft des obigen Satzes wird als Archimedische Eigenschaft der reellen Zahlen bezeichnet. In einem gestuften Aufbau könnte man zunächst diese Eigenschaft als Axiom
einführen.
Wir tragen nun einige Fakten nach, die wir im 1. Kapitel z.T. schon verwendet haben.
Folgerung 5.47
Seien ǫ > 0, y > 0. Dann gilt:
1 ≤ ǫ)
(1) ∃n ∈ N ( n
(2) Falls y > 1 ist, gibt es n ∈ N mit y n ≥ ǫ .
(3) Falls y < 1 ist, gibt es n ∈ N mit y n ≤ ǫ.
Beweis:
Zu (1): Da
n > 1ǫ ; also
1 keine obere Schranke für N sein kann (siehe Beispiel 5.45), gibt es n ∈ N mit
ǫ
1 ≤ ǫ.
n
Zu (2): Es ist y = 1 + h mit h > 0. Dann ist
n
n
y = (1 + h) =
n X
n
j=0
168
j
hj ≥ 1 + nh ≥ ǫ
1
für alle n ∈ N mit n ≥ ǫ −
h .
Zu (3): Es ist y1 > 1. Also gibt es nach (2) n ∈ N mit ( y1 )n ≥ 1ǫ , d.h. y n ≤ ǫ.
Nun führen wir den Beweis, dass die Lücke in der Zahlengerade“, die durch die Tatsache,
”
dass die Gleichung x2 = 2 in Q keine Lösung besitzt, aufgezeigt wird, in R geschlossen ist. Mehr
noch:
Folgerung 5.48
Sei a ∈ R, a ≥ 0, n ∈ N . Die Gleichung
xn = a
(5.32)
besitzt genau eine Lösung x ∈ R mit x ≥ 0 .
Beweis:
Zuerst zur Eindeutigkeit. Dazu beweisen wir für 0 ≤ x, 0 ≤ y die Aussage
xn < y n ⇐⇒ x < y
(5.33)
induktiv; Eindeutigkeit folgt daraus offenbar. Wir führen den Beweis aber nur für =⇒ “.
”
n = 1 ist klar.
n + 1 : Sei xn+1 < y n+1 . Sicherlich ist dann y 6= 0, also y > 0 .
Annahme x ≥ y . Dann ist x−1 ≤ y −1 und daher xn < x−1 y n+1 ≤ y −1 y n+1 = y n . Mit der
Induktionsvoraussetzung x < y , was ein Widerspruch ist.
Nun zur Existenz. Für n = 1 ist nichts zu zeigen. Sei also n ≥ 2 . Betrachte A := {x ∈ R|x ≥
0, xn < a}. A ist nichtleer, da offenbar 0 in A ist. 1 + a ist eine obere Schranke von A, denn:
Sei x ∈ A. Dann ist auf Grund der Bernoullischen Ungleichung xn < a < 1 + na < (1 + a)n und
es folgt aus der Überlegung zur Eindeutigkeit x < 1 + a daraus. Also existiert x := sup A . Wir
behaupten xn = a .
Annahme: xn < a . Für m ∈ N gilt
1 n n−1
1 n
1 n
1
1 n n−2
n
(x + ) = x +
x
+ ··· + n
≤ xn + ξ
x
+ 2
m
m 1
m 2
m n
m
1 ξ < a−xn
mit ξ > 0 , und aus Folgerung 5.47 wissen wir, dass m so gewählt werden kann, dass m
gilt. Mit diesem m erhalten wir also einen Widerspruch.
Annahme: xn > a . Für jedes m ∈ N mit m > x−1 ist mit Hilfe der Bernoullischen Ungleichung
(x −
x−1 n
x−1 n
1 n
) = xn (1 −
) > xn (1 −
)
m
m
m
1 )n > a , wenn m > α := nxn−1 (xn − a)−1 ist. Wähle nun m ∈ N so, dass
und wir haben (x − m
m > x−1 und m > α ist, was wegen der archimedischen Eigenschaft möglich ist. Dann haben
1 n
1 ≤ y ≤ x . Dann folgt
wir (x − m
) > a . Aber nach Definition von x gibt es y ∈ A mit x − m
1 )n > a und y < a, was sich widerspricht.
aber y n ≥ (x − m
Wir führen (mit Hilfe von Folgerung 5.48) die n–te Wurzel so ein: Für b ≥ 0 setzen wir
√
n
b := x mit x ≥ 0, xn = b .
√
√
Bei n = 2 schreiben wir kurz b und nennen b eine Quadratwurzel von b . Wir haben als
n–te Wurzeln nur für nichtnegative reelle Zahlen erklärt. Für ungerades n kännten wir dies
ohne weiteres auch für negative Zahlen tun. Aber wenn wir später auch Wurzeln von komplexen
Zahlen betrachten werden, wird sich herausstellen, dass man gut dabei führt, dies nicht zu tun.
169
Die Existenz der n–ten Wurzel haben wir nicht konstruktiv eingeführt, d.h. der Existenzbeweis verrät uns keine umsetzbare Vorschrift für ihre Berechnung. Jedenfalls haben wir in R die
arithmetischen Operationen
√
+, −, ·, /, .
Zusätzlich haben wir die Potenzrechnung zur Verfügung: Für b ∈ R, b > 0 kännen wir setzen:
p
√
p
q
b q := bp , ∈ Q .
q
Man bestätigt damit ganz einfach die Rechenregel
p
bq
+u
v
p
u
= b q b v für
p u
, ∈ Q.
q v
(5.34)
Wir kennen nun die rationalen Zahlen Q und die irrationalen Zahlen R\Q . Dazu die
folgende Dichtheitsaussage.
Satz 5.49
Sei x ∈ R und sei ǫ > 0 (eine kleine“ Zahl). Dann gibt es q ∈ Q mit |q − x| < ǫ .
”
Beweis:
n
1
Wir kännen offenbar x > 0 annehmen. Wir wollen q = m
finden mit |x − q| = m
|mx − n| < ǫ .
1
Daraus lesen wir das Vorgehen ab: Wähle nach Folgerung 5.47 m ∈ N mit m < ε . Wähle nach
dem Satz von Archimedes 5.46 n ∈ N mit n > mx ; wir kännen annehmen, dass n die kleinste
natürliche Zahl mit dieser Eigenschaft ist. Also ist nun n − 1 ≤ mx < n ; dann haben wir mit
n
offenbar q−1
q := m
m ≤ x < q . Daraus folgt, dass q die gewänschte Eigenschaft hat.
Die irrationalen Zahlen in [0, 1] sind nicht abzählbar. Dazu genügt es zu zeigen, dass [0, 1]
nicht abzählbar ist, da wir schon wissen, dass Q ∩ [0, 1] abzählbar ist.
Wäre [0, 1] abzählbar, dann kännte man die Dezimalbrüche von Zahlen in [0, 1] abzählen. Sei in
0.a11 a12 a13 a14 · · ·
0.a21 a22 a23 a24 · · ·
0.a31 a32 a33 a34 · · ·
······
eine solche gegeben. Dann kommt der Dezimalbruch 0.a1 a2 a3 a4 · · · mit
(
4 , falls aii =
6 4
ai :=
6 , falls aii = 4
in dieser Abzählung sicher nicht vor.
Mittelwerte spielen eine nicht geringe Rolle. Hier können wir sie nun etwas genauer analysieren. Zu x1 , . . . , xn ∈ R, x1 > 0, . . . , xn > 0, sei definiert:
1 (x + · · · + x )
Arithmetisches Mittel: A(x1 , . . . , xn ) := n
1
n
√
Geometrisches Mittel: G(x1 , . . . , xn ) := n x1 · · · · · xn
Harmonisches Mittel: H(x1 , . . . , xn ) :=
170
1
1
1 (x1 > 0, . . . , xn > 0)
A( , . . . , )
x1
xn
Satz 5.50
Seien x1 , . . . , xn ∈ R, x1 > 0, . . . , xn > 0 . Es gilt
H(x1 , . . . , xn ) ≤ G(x1 , . . . , xn ) ≤ A(x1 , . . . , xn )
(5.35)
und wir haben Gleichheit in (5.35) genau dann, wenn x1 = · · · = xn ist.
Beweis:
Für den Beweis der geometrisch–arithmetischen Ungleichung können wir o.E. 1 = a := A(x1 , . . . , xn )
√
√
annehmen, denn wir können die Ungleichung (5.35) ja durch a = n a · · · n a dividieren. Sei also
nun x1 + · · · + xn = n . Daß Gleichheit in (5.35) gilt, wenn x1 = · · · = xn gilt, ist klar. Nun
beweisen wir induktiv:
n = 2 : Folgt aus der Binomialformel x2 − 2xy + y 2 = (x − y)2 ≥ 0 sofort.
n + 1 : Sei also x1 + · · · + xn+1 = n + 1 . Gilt x1 = · · · = xn+1 = 1, dann gilt sicher auch
G(x1 , . . . , xn+1 ) = A(x1 , . . . , xn+1 ) und die Ungleichung (5.35) gilt. Sei nun etwa x1 < 1 und
x2 > 1 , d.h. x1 = 1 − α, x2 = 1 + β mit α > 0, β > 0 . Mit x2 ′ := x1 + x2 − 1 = 1 − α + β
gilt x2 ′ + x3 + · · · + xn+1 = n also mit der Induktionsvoraussetzung x2 ′ x3 · · · · · xn ≤ 1 . Wegen
x1 x2 = 1−α+β −αβ < x2 ′ ist also x1 x2 ·· · ··xn+1 < x2 ′ x3 ·· · ··xn+1 ≤ 1 = A(x1 , . . . , xn+1 )n . Damit ist die Induktion beendet und man liest daraus die restlichen Behauptungen zur geometrisch–
arithmetischen Ungleichung ab.
Die Aussage zur harmonisch–geometrischen Ungleichung folgt aus der geometrisch–arithmetischen
Ungleichung durch Ersetzen von xi durch x1i für alle i = 1, . . . , n .
Sehen wir uns die Behauptung des Satzes nochmal für n = 2 an. Es gilt also a · b = 41 (a + b)2
genau dann, wenn a = b gilt. Liest man ũ := a + b als halben Umfang eines Rechtecks mit den
Seitenlängen a, b, so bedeutet dies nun, dass die Fläche eines Rechtecks von gegebenem Umfang
u := 2ũ genau dann maximal ist, wenn die Seitenlängen gleich sind, d.h. wenn ein Quadrat
vorliegt. Dieser Sachverhalt war schon in der Antike bekannt.
5.5
Körper der komplexen Zahlen
Die Tatsache, dass in R eine Anordnung existiert, zeigt, dass in R die Gleichung
x2 + 1 = 0
(5.36)
keine Lösung hat, da x2 nichtnegativ und 1 = 12 positiv ist. Keinen, der an physikalischen Fakten interessiert ist, wird zunächst einleuchten, warum wir uns um die Lösbarkeit der Gleichung
(5.36) kümmern sollten. Wir werden aber bald sehen, dass mit der Lösbarkeit der Gleichung
(5.36) in einem größeren Zahlbereich, wie wir sie nun herstellen wollen, in sehr unterschiedlichen Bereichen viel erreicht wird. Wir erweitern daher die reellen Zahlen zu einem Körper der
komplexen Zahlen. In diesem Körper hat dann die Gleichung (5.36) eine Lösung. Beachte aber,
dass der so konstruierte Körper nun kein angeordneter Körper mehr sein kann, da negatives“
”
Quadrat existiert.
Definiere in R2 die folgenden Verknüpfungen:
+ : R2 × R2 ∋ ((a, b), (c, d)) 7−→ (a + c, b + d) ∈ R2 ,
· : R2 × R2 ∋ ((a, b), (c, d)) 7−→ (ac − bd, ad + bc) ∈ R2 .
(Addition)
(Multiplikation)
Dann ist (0, 0) ein neutrales Element bzgl. der Addition und (1, 0) ein neutrales Element bzgl.
der Multiplikation. Das Inverse von (a, b) ∈ R2 bzgl. der Addition ist (−a, −b), das Inverse von
171
(a, b) 6= (0, 0) bzgl. der Multiplikation ist (a(a2 +b2 )−1 , −b(a2 +b2 )−1 ) . Mit diesen Verknüpfungen
wird R2 ein Körper, denn die restlichen Eigenschaften verifiziert man ohne Mähe. Diesen Körper
wollen wir nun den
Körper der komplexen Zahlen
nennen. Eine vielleicht eher bekannte Notation der Elemente von C ergibt sich aus der Darstellung
(a, b) = (1, 0)a + (0, 1)b , (a, b) ∈ R2 .
(5.37)
Wir haben
(1, 0) · (1, 0) = (1, 0) und (0, 1) · (0, 1) = (−1, 0) = −(1, 0) .
Nun schreiben wir für das Einselement (1, 0) kurz 1 und für (0, 1) führen wir die imaginäre
Einheit i ein. Dies bedeutet nun, dass wir wegen (5.37) jedes Element (a, b) ∈ C so
(a, b) = a + ib ,
schreiben können, wobei wir nochmal abgekürzt haben: Statt 1a haben wir einfach a geschrieben.
Damit fassen wir nun die komplexen Zahlen so:
C := {a + ib|a, b ∈ R}
und passen die Verknüpfungen an:
+ : C × C ∋ (a + ib, c + id) 7−→ (a + c) + i(b + d) ∈ C ,
· : C × C ∋ (a + ib, c + id) 7−→ (ac − bd) + i(ad + bc) ∈ C .
(Addition)
(Multiplikation)
Ist z = a + ib eine komplexe Zahl, so heißt a Realteil und b Imaginärteil von z; wir schreiben a = ℜz oder a = Re(z) , b = ℑz oder b = Im(z) . In R2 kännen wir also die komplexen
Zahlen hinzeichnen, wenn wir die Koordinatenachesen von R2 als Achsen betrachten, auf denen
wir den Realteil bzw. den Imaginärteil abtragen. In diesem Sinne nennen wir R2 die komplexe Zahlenebene. Wir kännen damit auch von Quadranten und oberer, unterer Halbebene
sprechen:
Quadranten: ±{z ∈ C|ℜ(z) ≥ 0, ℑ(z) ≥ 0} , ±{z ∈ C|ℜ(z) ≤ 0, ℑ(z) ≥ 0} .
Halbebenen: ±{z ∈ C|ℑ(z) ≥ 0} .
Kreisscheiben: Dr (w) := {z ∈ C||z − w| ≤ r} , w ∈ C, r ≥ 0 .
Der Körper C ist nun als Erweiterung des Körpers der reellen Zahlen aufzufassen, da wir in
J : R ∋ a 7−→ a + i0 ∈ C
eine injektive Einbettung“ haben. Wir finden die reellen Zahlen also in den komplexen Zahlen
”
wieder als komplexe Zahlen mit verschwindendem Imaginärteil. Wir unterscheiden nun nicht
zwischen a + i0 ∈ C und a ∈ R und schreiben für a + ib manchmal auch a + bi . Beachte auch,
daß in dieser Schreibweise nun aus a + ib = 0 stets a = b = 0 folgt.
Definition 5.51
Sei z = a + ib eine komplexe Zahl. Die zu z konjugierte Zahl ist z := a − ib, der Betrag von
√
z ist |z| := a2 + b2 .
172
Offenbar gilt für jede komplexe Zahl die Identität |z|2 = zz . Ein Quotient z1 z2−1 , z2 6= 0, läßt
sich dann wegen
z1 z 2
z1 z 2
z1 z2−1 =
=
z2 z 2
|z2 |2
in ein Produkt komplexer Zahlen mit anschließender Division durch eine reelle Zahl überführen
und wir haben für z1 z2−1 wieder eine Normaldarstellung gefunden. Etwa:
1
1−i
1−i
1 1
=
=
= − i.
1+i
(1 + i)(1 − i)
2
2 2
Lemma 5.52
Seien z, z1 , z2 ∈ C . Es gilt:
1. |z| = 0 ⇐⇒ z = 0 .
(Definitheit)
2. |z1 z2 | = |z1 ||z2 | .
(Homogenität)
3. |z1 + z2 | ≤ |z1 | + |z2 | .
(Dreiecksungleichung)
Beweis:
1. und 2. sind einfach nachzurechnen. Zur Dreiecksungleichung:
|z1 + z2 |2 = (z1 + z2 )(z¯1 + z¯2 ) = z1 z¯1 + z1 z¯2 + z2 z¯1 + z2 z¯2
= |z1 |2 + 2ℜ(z1 z¯2 ) + |z2 |2 ≤ |z1 |2 + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2
Die reellen Zahlen lassen sich angeordnet auf der
Zahlengerade verstehen. Für die komplexen Zahlen benötigen wir zwei Zahlengeraden, eine für
den Real– und eine für den Imaginärteil. Trägt
man auf diesen Zahlengeraden für eine Zahl z =
a + ib Realteil a und Imaginärteil b auf, so ergibt sich in der komplexen Zahlenebene“ R × R
”
entsprechend Abbildung 5.5 der Punkt (a, b), der
die komplexe Zahl z repräsentiert. Abzulesen ist
auch der Betrag von z als euklidischer Abstand
von z von der Null in C . Damit meinen wir, dass
im rechtwinkligen Dreieck OAB sich |z| gerade
als Länge der Hypothenuse OB gemäß dem Satz
von Pythagoras ergibt.
Im
B z=a+ib
b
O
z
a
A
Re
z = a-ib
Abbildung 5.5: Die komplexe Zahlenebene
Die Konvergenz komplexer Folgen lösst sich
nun sehr einfach studieren, indem man die Folgen
der Realteile und Imaginärteile untersucht und dazu die überlegungen zur Konvergenz reeller
Zahlenfolgen nutzt. Wir verschieben dies auf das Kapitel über die Konvergenz in metrischen
Räumen.
Für z 6= 0 haben wir auch eine Polardarstellung:
z = |z|(cos(φ) + sin(φ)) mit cos(φ) =
ℑ(z)
ℜ(z)
, sin(φ) =
;
|z|
|z|
(5.38)
siehe Abbildung 5.5. Hat man zwei Zahlen z, w ∈ C\{0}, dann haben wir
z = |z|(cos(φ) + sin(φ)) , w = |w|(cos(ψ) + sin(ψ)) , zw = |z||w|(cos(φ + ψ) + sin(φ + ψ)), (5.39)
173
wie man mit den Additionstheoreme nachweist. Insbesondere, wenn |z| = 1 gilt, ist die Multiplikation von w = x + iy mit z als Drehung des Vektors (x, y) ∈ R2 um den Winkel φ zu
interpretieren.
Der Ausgangspunkt unserer Überlegung war die Lösbarkeit der Gleichung (5.36). Diese hat
nun in der Tat in C eine Lösung, nämlich das Element i und das Element −i .
Wie sieht sonst mit Wurzelberechnung“ aus? Man kann nachrechnen, dass es zu jedem
”
z ∈ C\{0} genau zwei w ∈ C\{0} (Wurzeln) gibt mit z 2 = w . Dies kann man so anstellen: Man
stellt w dar durch w := u + iv (o.E. v 6= 0) und das gesuchte z dar durch z = x + iy und gleicht
ab:
x2 − y 2 + 2ixy = u + iv , d. h. x2 − y 2 = u, 2xy = v .
Daraus resultiert für p := y 2 die reelle Gleichung
p2 + pu −
v2
= 0,
4
die, da p ein Quadrat ist, nur eine Lösung zulösst:
p=
p
1
(−u + u2 + v 2 .
2
Man erhält durch Wurzelziehen (im Reellen) die folgenden zwei Lösungen für die Gleichung
z2 = w :
v
v
√
z+ =
+ iq , z− =
− iq mit q := p .
2q
−2q
Betrachte das (normierte) quadratische Polynom
p : C ∋ z 7−→ z 2 + 2az + b ∈ C (a, b ∈ C).
Quadratische Ergänzung führt auf die Darstellung
(z + a)2 = −b + a2 .
Daraus lesen wir formal als Nullstellen von p ab:
p
z± = −a ± −b + a2 .
Da uns nun ein negatives Vorzeichen unter dem Wurzelzeichen nicht stürt, scheint alles klar zu
sein. Allerdings ist später auf die Stetigkeit“ des Wurzelziehens in C noch ein Blick zu werfen.
”
Wir haben die Körper Zp mit Primzahl p erwähnt. Dies sind endliche Körper, also sicher nicht
angeordnet. Sind dies auch alle endlichen Körper? Die Antwort ist NEIN: Zu jeder Primzahl p
und jeder natürlichen Zahl k gibt es (bis auf Isomorphie) genau einen Körper mit pk Elementen;
sie werden mit Fpk bezeichnet. Offenbar kännen wir für F22 nicht Z4 verwenden. Das allgemeine
Konstruktionssprinzip geht so: Betrachte die Gleichung
k
xp − x = 0 .
Jedes Element von Zp ist eine Lösung. In C finden wir weitere pk − p Lösungen. Diese fügen
wir zu Zp geeignet hinzu, nennen diese Menge Fpk und erklären Addition und Multiplikation
in übereinstimmung mit den Operationen in Zp und den Identitäten, die sich für die Wurzeln
ergeben. Damit ist die Erweiterung von Zp zum Körper Fpk gelungen“.
”
174
Beispiel 5.53 Betrachte die Erweiterung von Z2 zu F4 = F22 . Die Gleichung
0 = x4 − x = x(x − 1)(x2 + x + 1)
hat die Nullstellen
√
√
1
1
0, 1, x = − (1 − i 3), y = − (1 + i 3) .
2
2
Die Gruppentafeln für die Addition und Multiplikation ergeben sich, wenn wir nur noch
x + 1 := y, x + x := 0, x + y := 1, y + y := 0 bzw. x · x := y, x · y := 1, y · y := x
festsetzen. (Betrachte die Gruppentafeln in 5.3.)
5.6
Matrixgruppen
Von besonderem Interesse sind Matrixgruppen. Damit gelingt eine kompakte Beschreibung der
Bewegung von Figuren in der Ebene bzw. des Raumes; der so wichtige Begriff der Symmetrie
hängt daran.
Wir wiederholen Begriffe zur Matrixrechnung. Eine Matrix A ist ein Schema der folgenden
Art:


a11 a12 . . . a1n
 a21 a22 . . . a2n 


A :=  .
..
..  := (aij )i=1 (1 )m , j =1 (1 )n
 ..
.
. 
am1 am2 . . . amn
Wir nennen A eine (m×n) – Matrix mit m Zeilen und n Spalten und Einträgen aij aus dem
Zahlbereich K ; K Körper. (Auch Matrizen mit Einträgen in Z sind interessant.) Die Matrizen
mit m Zeilen und n Spalten fassen wir zusammen in der Menge Km,n . Statt K1,1 , R1,1 bzw. C1,1
schreiben wir wieder K, R bzw. C . Wir setzen also
n
o
Km,n := A | A = (aij )i=1 (1 )m , j =1 (1 )n , aij ∈ K, i = 1(1)m, j = 1(1)n .
Zu einer Matrix A = (aij )i=1 (1 )m , j =1 (1 )n wird die dazu transponierte Matrix At wie folgt
erklärt:
At := (aji )j =1 (1 )n , i=1 (1 )m .
Addition:
⊕ : Km,n × Km,n ∋ (A, B)
Multiplikation:
⊙ : Km,n × Kn,l ∋ (A, B)
Skalare Multiplikation:
• : K × Km,n ∋ (r, A)
7−→
A ⊕ B := (aij + bij )i=1 (1 )m , j =1 (1 )n ∈ Km,n
wobei A = (aij )i=1 (1 )m , j =1 (1 )n , B = (bij )i=1 (1 )m , j =1 (1 )n .
7−→
A ⊙ B :=
n
X
k=1
aik · bkj
!
i=1 (1 )m , j =1 (1 )l
∈ Km,l
wobei A = (aij )i=1 (1 )m , j =1 (1 )n , B = (bij )i=1 (1 )n , j =1 (1 )l .
7−→
r • A := (r · aij )i=1 (1 )m , j =1 (1 )n ∈ Km,n
175
wobei A = (aij )i=1 (1 )m , j =1 (1 )n .
Die eben eingeführten Bezeichnungen für die Verknüpfungen wollen wir sofort wieder zugunsten der gebräuchlichen, schlankeren Notation abändern:
Km,n × Km,n ∋ (A, B)
7−→
A + B := A ⊕ B ∈ Km,n
K × Km,n ∋ (r, A)
7−→
rA := r · A := r • A ∈ Km,n
Km,n × Kn,l ∋ (A, B)
7−→
AB := A · B := A ⊙ B ∈ Km,l
Die ursprüngliche Verwendung von ⊕, ⊙, • dient nur der Verdeutlichung, dass + , · unterschiedliche Objekte verknüpft. Aus der Addition ergibt sich in üblicher Weise die Subtraktion:
A − B := A + (−B) , A, B ∈ Km,n ,
wobei das Negative −B von B durch
−B := (−bij )i=1 (1 )m , j =1 (1 )n mit B = (bij )i=1 (1 )m , j =1 (1 )n ,
definiert ist. Die Nullmatrix Θ ist die Matrix die nur Einträge Null besitzt. Die Einheitsmatrix ist folgendermaßen definiert:
E := (δij )i=1 (1 )n , j =1 (1 )n ,
wobei δij das sogenannte Kronecker–Symbol ist:
1 , falls i = j
δij =
0 , sonst
Halten wir fest:
Folgerung 5.54
Die Menge G := Km,n bildet zusammen mit der Matrixaddition eine kommutative Gruppe.
Beweis:
Nichts ist mehr zu zeigen.
Beispiel 5.55 Betrachte in Q oder R die Matrizen
0 −1
0 1
, B :=
.
A :=
4 0
0 2
Wir haben
0 0
, rA =
A+B = B+A=
4 2
0 2
−4
AB =
, BA =
0 −4
8
0 r
4r 0
0
.
0
Beachte die Tatsache, dass A + B = B + A, aber AB 6= BA ist.
,
Man beachte, dass G := Km,m oder naheliegender G := Km,m \{Θ} zusammen mit der Matrixmultiplikation keine Gruppe bildet. Betrachte etwa in R2,2 das Produkt
0 0
0 1
0 1
.
=
0 0
0 0
0 0
176
Diese Tatsache verträgt sich nicht mit einer multiplikativen Gruppenstruktur. Wir werden aber
noch interessante Teilmengen von Km,m kennenlernen, die eine Gruppe zusammen mit der Multiplikation bilden.
Eine Sonderrolle nehmen die Matrizen in Km,1 und K1,n ein. Wir nennen die Elemente in
Spaltenvektoren und die Elemente in K1,n Zeilenvektoren. Diese Bezeichnungsweise
wird anschaulich, wenn wir die zugehörigen Matrix–Schemata betrachten:
In Km,1 :


a11
 a21 


A = (aij )i=1 (1 )m , j =1 (1 )1 =  .  .
 .. 
Km,1
am1
In K1,n :
A = (aij )i=1 (1 )1 , j =1 (1 )n =
a11 a12 . . . a1n
.
Es ist offenbar ein enger Zusammenhang zwischen Km,1 und Km bzw. K1,n und Kn . Meist
identifizieren wir Km,1 , K1,n mit Km bzw. Kn . Addition, Subtraktion und skalare Multiplikation
übertragen sich sofort von Km,1 auf Km gemäß
x + y := (x1 + y1 , . . . , xm + ym ) , x − y := (x1 − y1 , . . . , xm − ym ) , rx := (rx1 , . . . , rxm ) ,
wobei x = (x1 , . . . , xm ) , y = (y1 , . . . , ym ) ∈ Km , r ∈ K . Dies sind gerade die Verknüpfungen in
Kn , die wir aus Abschnitt 1.5 schon kennen.
Definition 5.56
Eine Abbildung g : Kn → Kn heißt linear genau dann, wenn g(ax + by) = ag(x) + bg(y) für alle
a, b ∈ K und x, y ∈ Kn gilt.
Wir setzen
GL(n; K) := {f ∈ S(Kn )|f linear}
und nennen GL(n; K) die allgemeine lineare Gruppe auf Kn mit der Hintereinanderausführung
von Abbildungen als Multiplikation.
Damit GL(n; K) tatsächlich als Gruppe angesehen werden kann, ist noch zu klären, dass die
Inverse einer linearen Abbildung selbst wieder linear ist.
Sei also g : Kn → Kn linear und bijektiv. Seien x, y ∈ Kn , u, v ∈ Kn mit g(u) = x, g(v) = y, und
seien a, b ∈ K . Dann ist
g−1 (ax + by) = g−1 (ag(u) + bg(v)) = g−1 (g(au + bv)) = au + bv = ag−1 (x) + bg−1 (y) .
Damit ist die gewänschte Aussage gezeigt.
Jede Matrix A ∈ Km,n vermittelt durch
Kn,1 ∋ x 7−→ Ax ∈ Km,1
eine Abbildung TA . Es gilt offenbar:
TA (x + y) = TA (x) + TA (y) , TA (rx) = rTA (x) , x, y ∈ Km,1 , r ∈ K .
(5.40)
Auf Grund der Eigenschaften (12.45) nennen wir die Abbildung TA linear gemäßDefinition
5.56, denn sie belegen, dass TA das Rechnen mit Linearkombination vorzüglich respektiert. Die
Identität idKn,1 wird induziert durch die Einheitsmatrix E .
177
Liegt eine Matrix A = (aij )i=1 (1 )1 , j =1 (1 )n vor, so ist die dazu transponierte Matrix At
gegeben durch
At = (aji )i=1 (1 )1 , j =1 (1 )n .
Bezeichnung: Die Zeilenvektoren
e1 := (1, 0, 0, . . . , 0) , e2 := (0, 1, 0, . . . , 0) , . . . , en := (0, 0, . . . , 1)
in K1,n heißen Einheitszeilenvektoren. Durch Transposition entstehen die Einheitsspaltenvektoren. Die Einheitsmatrix E ∈ Kn,n schreibt sich damit als
E = ((e1 )t | · · · |(en )t ) .
Die Darstellung von Gruppen mit Hilfe von Matrizen ist ein kräftiges Instrument. Als einfaches Beispiel dafür sei hier der Körper der komplexen Zahlen genannt. Man hat eine bijektive
Abbildung
x y
φ : C ∋ z = a + iy 7−→
∈ R2,2
−y x
mit folgenden Eigenschaften:
φ(z + w) = φ(z) + φ(w) , φ(zw) = φ(z) + φ(w) , z, w ∈ C ,
t
φ(1) = E , φ(z) = φ(z) , z ∈ C .
(5.41)
(5.42)
Diese Identitäten sagen u.a., dass φ ein Gruppenisomorphismus ist.
Definition 5.57
Eine Matrix U ∈ Rn,n heißtorthogonal, wenn U t U = U U t = E gilt.
Wir setzen O(n) := {U ∈ Rn,n |U orthogonal} und nennen O(n) die orthogonale Gruppe
(ohne die Verknüpfung explizit anzuschreiben).
Die Identität U t U = E besagt nichts anderes, als dass die Spaltenvektoren u1 , . . . , un von U
orthonormal sind, also:
hui , uj i = δij , i, j = 1, . . . , n .
Offenbar ist O(n) tatsächlich eine Gruppe bezüglich der Matrixmultiplikation als Verknüpfung:
neutrales Element ist E, das Inverse von U ist U t . Bevor wir diese Gruppe für n = 1, 2, 3 uns
anschauen, eine Anmerkung, die wichtige geometrische Eigenschaften von O(n) betrifft.
Folgerung 5.58
Sei U ∈ O(n) . Dann gilt:
(a)
hU x, yi = hx, U t yi für alle x, y ∈ Rn .
(b) hU x, U yi = hx, yi für alle x, y ∈ Rn .
(c)
|U x| = |x| für alle x ∈ Rn .
Beweis:
Zu (a). Nachrechnen.
Zu (b).
hU x, U yi = hx, U t U yi = hx, Eyi = hx, yi für alle x, y ∈ Rn .
Zu (c). Folgt aus (b).
178
(c) aus Folgerung 5.58 drückt aus, dass eine orthogonale Transformation des Rn die Längen
(Längentreue) nicht verändert, (b) verschärft dies sogar dazu, dass auch die Winkel (Winkeltreue) erhalten bleiben.
Wir betrachten nun O(n) in Spezialfällen. Der Fall n = 1 ist unergiebig, denn es gibt nur die
beiden Möglichkeiten A = (±1) für A ∈ O(1) .
Für n = 2 hat man das Resultat
cos(α) − sin(α)
cos(α) sin(α)
O(2) =
, α ∈ [0, 2π) ∪
, α ∈ [0, 2π) .
sin(α) cos(α)
sin(α) − cos(α)
Denn aus
a b
A=
∈ O(2)
c d
folgt sofort die Existenz von α, α′ ∈ [0, 2π) mit a = cos(α), b = sin(α), c = cos(α′ ), d = sin(α′ ) .
Dann ist aber wegen der Orthogonalität der Spalten von A sicher 0 = sin(α + α′ ) und daher
α + α′ ein gerades oder ungerades Vielfaches von π . Daraus leitet man die obige Aussage nun
ab.
Die Darstellung von O(2) besagt nun, dass (vom Standpunkt der Topologie) die Gruppe O(2)
zwei Zusammenhangskomponenten hat, und jede ist parametrisierbar durch die Kreislinie in R2 .
Der Fall n = 3 ist erwartungsgemäß etwas aufwändiger. Spezielle Elemente in O(n) in diesem
Fall sind die Drehmatrizen, die wir in Abschnitt 2.4 kennengelernt haben:






1 0 0
c 0 −s
c s 0
(5.43)
A3 (φ) := −s c 0 , A2 (φ) := 0 1 0  , A1 (φ) := 0 c s ,
0 −s c
s 0 c
0 0 1
dabei ist c = cos(φ), s = sin(φ) .
In O(3) sind u.a. auch die Spiegelungen


−1 0 0
 0 1 0  (Spiegelung an der x1 − x2 –Ebene)
0 0 +1


−1 0 0
 0 1 0  (Spiegelung an der x2 –Achse)
0 0 −1
enthalten. Wir wollen ein allgemeines Element aus O(3) durch Drehungen der Form (5.43)
darstellen. Dazu schreiben wir ein Produkt A3 (γ)A2 (β)A3 (α) auf und zeigen, dass damit jedes
A ∈ O(3) dargestellt wird. Eine einfache Rechnung zeigt
A(α, β, γ) := A3 (γ)A2 (β)A3 (α)


cos(γ) cos(β) cos(α) − sin(γ) sin(α)
cos(γ) cos(β) sin(α) + sin(γ) cos(α) − cos(γ) sin(β)
=− sin(γ) cos(β) cos(α) − cos(γ) sin(α) − sin(γ) cos(β) sin(α) + cos(γ) cos(α) sin(γ) sin(β)  .
sin(β) cos(α)
sin(β) sin(α)
cos(β)
Sei nun


a11 a12 a13
A = a21 a22 a23  ∈ O(3)
a31 a32 a33
vorgelegt. Wir lesen die Forderung a33 = cos β ab und erhalten so wegen |a33 | ≤ 1 (die Spalten
von A sind orthonormal!) ein β ∈ [0, 2π) mit a33 = cos(β) . Wir vermeiden die Sonderbetrachtung
179
|a33 | = 1 und haben daher sin(β) 6= 0 . Dann kännen wir mit Hilfe der letzten Spalte von A den
Winkel γ ∈ [0, 2π) bestimmen. Mit Hilfe der 3. Zeile von A bestimmt man nun leicht auch den
Winkel α .
Die so erhaltene Darstellung von A ∈ O(3) nennt man eine Eulerzerlegung; die Winkel α, β, γ
heissen Eulerwinkel. Wir haben also drei Freiheitsgrade bei der Darstellung von A durch
Drehmatrizen ermittelt. Dies stimmt überein mit der Tatsache, dass wir bei einer Drehung
gerade soviele Freiheitsgrade erwarten: zwei für die Drehachse, einen für den Winkel, um den
gedreht wird. Die Zahl der Freiheitsgrade stimmt auch überein mit der Tatsache, dass durch die
Forderung At A = E ja 6 Gleichungen beschrieben werden für die 9 Parameter (Einträge in A).
Da wir 9 Parameter in einer Matrix A ∈ O(3) haben (Einträge), spricht man (in der Topologie)
bei O(3) von einer dreidimensionalen Untermannigfaltigkeit von R9 .
Beispiel 5.59 Betrachte die Matrix
√
√ 
 1√
− 4√ 2 − 21 3 41 √2
A :=  41 √6
− 14√ 6
− 21
1
1
0
2 2
2 2
Man sieht,√dass A ∈ O(3) gilt, denn offenbar gilt At A = E . √Ein erster Eulerwinkel ergibt
sich aus 12 2 = cos(β), d.h. β = π/4 . Aus − cos(γ) sin(β) = 14 2 ergibt sich γ = 2π/3 . Aus
0 = sin(β) sin(α) ergibt sich α = 0 . Man stellt fest, dass der Vektor
√
√
4√
1 √
( 2, − 6 −
3, − ( 2 + 2))
3
2
unter der Drehung A fix bleibt.
In O(n) liegen die Spiegelungen S := Diag(1, . . . , 1, −1, 1, . . . , 1) ; hier ist Diag(a1 , . . . , an ) die
Matrix, die in der Diagonalen die Einträge ai hat und sonst lauter Nullen. Hiermit wird das
kartesische Koordinatensystem nicht orientierungserhaltend in sich abgebildet. Wenn man diese
Spiegelungen aus O(n) entfernt, kommt man zur Gruppe SO(n), der speziellen orthogonalen
Gruppe. Was heisst entfernen“? Man setzt
”
SO(n) := {A ∈ O(n)| det(A) = 1} ,
Für allgemeines n müssen wir die Definition von det(A) noch schuldig bleiben, für n = 3 ist sie
einfach zu erklären: det(A) := ha1 , a2 × a3 i, wobei a1 , a2 , a3 die Spaltenvektoren von A sind.
Eine weitere Gruppe stellt
SL(n, K) := {A ∈ GL(n, K)| det(A) = 1}
dar. Sie heisst spezielle lineare Gruppe. Zum Nachweis, dass eine Gruppe bezüglich der
Multiplikation vorliegt, benötigt man den Multiplikationssatz für Determinanten: det(AB) =
det(A) det(B) . Dazu für den allgemeinen Fall mehr, im Fall n = 3 kann man dies etwas mähsam
direkt nachrechnen.
Bei den grundsätzlichen Betrachtungen der klassischen Mechanik (nichtrelativistisch !) spielen Abbildungen auf der Raum–Zeit R3 × R eine Rolle, die sogenannte Inertialsysteme auf
Inertialsysteme abbilden. Es sind dies Abbildungen der Form
GA,v,p,λ,τ : R3 × R ∋ (x, t) 7−→ (Ax + vt + p, λt + τ ) ∈ R3 × R ;
180
(5.44)
Eine solche Abbildung wird Galilei–Transformation genannt mit der Drehmatrix A ∈ O(3),
dem Geschwindigkeitsvektor v ∈ R3 , dem Translationsvektor p ∈ R3 , der eventuellen
Zeitumkehr λ = −1 und der Zeitverschiebung τ ∈ R. Die Menge
G↑+ := {GA,v,p,λ,τ |A ∈ O(3), det(A) = 1, v, p ∈ R3 , λ = 1, τ ∈ R}
(5.45)
bildet zusammen mit der Hintereinanderausführung eine Gruppe, die so genannte eigentliche
isochrone Galileigruppe. Das neutrale Element ist offenbar GE,θ,θ,1,0 . Das Inverse zu GA,v,p,1,τ
ist GAt ,−At v,τ At v−At p,1,−τ . In der Physik lernt man den Zusammenhang zwischen den 10 freien
Parametern in einer Galilei–Transformation GA,v,p,1,τ und den 10 Erhaltungsgrößen Impuls,
”
Schwerpunkt, Drehimpuls, Energie“ kennen.
Ein Ereignis in der Raum–Zeit wird beschrieben durch einen Punkt in R3 × R . Wir ziehen
uns zurück auf den modellhaften Sonderfall, dass wir nur eine Raumdimension betrachten. Die
Forderungen der speziellen Relativitätstheorie sind
• dass das Newtonsche Gesetz, dass Teilchen bei Abwesenheit einer äusseren Einflussnahme
sich entlang von Geraden bewegen, gilt;
• dass die Lichtgeschwindigkeit endlich ist und keine hähere Geschwindigkeit erlaubt ist.
Diese Forderungen haben zur Konsequenz, dass die Transformationen der Raum–Zeit die Zeitlinien x− t = 0, x+ t = 0 und den Vorwärtslichtkegel {(x, t) ∈ R × R|t2 > x2 , t > 0} invariant
lassen sollten. Dies leisten lineare Abbildungen der Form
x
Lr : R × R ∋ (x, t) 7−→ A(r)
∈R×R
(5.46)
t
mit
1
A(r) :=
2
Beachte, dass gilt:
2
r + r −1 r − r −1
r − r −1 r + r −1
, r > 0.
2
x′ − t′ = 0 , falls, (x′ , t′ ) = Lr (x, t) und x2 − t2 = 0 .
(5.47)
(5.48)
In einer anderen Parametrisierung fassen wir diese Matrizen A(r) zusammen in
L↑+ := {B(a)|B(a) := A(ea ), a ∈ R}
mit
B(a) :=
cosh(a) sinh(a)
sinh(a) cosh(a)
(5.49)
.
Man rechnet nun leicht nach, dass L↑+ zusammen mit der Matrixmultiplikation eine Gruppe
bilden. Die Matrizen B(a) sind den Drehmatrizen
cos(φ) − sin(φ)
D(φ) :=
sin(φ) cos(φ)
ähnlich. Eine weitere Parametrisierung der Gruppe L↑+ ist gegeben durch
(
!
)
r
1+v
↑
L+ := C(v)|C(v) := A
, v ∈ (−1, 1) .
1−v
(5.50)
v ist hier eine Geschwindigkeitsgröße (Geschwindigkeit relativ zur Lichtgeschwindigkeit). In dieser Parametrisierung haben wir
v + v′ )
, v, v ′ ∈ (−1, 1) .
(5.51)
C(v)C(v ′ ) = C √
′
1 − vv
Dies ist das Geschwindigkeitsgesetz der speziellen Relativitätstheorie.
181
5.7
Anhang: Quaternionen
Quaternionen wurden von R. Hamilton erfunden“ bei der Suche nach einer dreidimensionalen
”
Körpererweiterung der reellen Zahlen. Eine Multiplikation in R3 zu definieren stellte sich als
umäglich heraus – das Vektorprodukt in R3 führt zu keiner Körpermultiplikation! Erst durch
Hinzunahme der vierten Dimension gelang eine solche Multiplikation.
Beginnen wir zunächst mit der mengentheoretischen Beschreibung. (Wir verwenden Hamilton
zu Ehren den Buchstaben H):
H := {q = s + ix + jy + kz|(s, x, y, z) ∈ R4 } .
Hierbei sind i, j, k Symbole, deren Bedeutung erst klar werden wird, wenn wir addieren und
multiplizieren. Wir sagen, dass s + ix + jy + kz = s′ + ix′ + jy ′ + kz ′ gilt, wenn (s, x, y, z) =
(s′ , x′ , y ′ , z ′ ) gilt.
Die Addition ist einfach:
(s + ix + jy + zk) ⊕ (s′ + ix′ + jy ′ + kz ′ ) := (s + s′ ) + i(x + x′ ) + j(y + y ′ ) + k(z + z ′ ) .
Die Multiplikation sieht so aus:
(s + ix + jy + kz) ⊙ (s′ + ix′ + jy ′ + kz ′ ) := ss′ − xx′ − yy ′ − zz ′ + i(sx′ + s′ x + yz ′ − zy ′ ) +
j(sy ′ + s′ y + zx′ − xz ′ ) + k(sz ′ + s′ z + xy ′ − yx′ ) .
Wenn wir formale Multiplikationsregeln für die imaginären Symbole i, j, k so erklären
i · i = j · j = k · k = −1 , i · j = k, j · k = i, k · i = j, j · i = −k, k · j = −i, i · k = −j, ,
dann kann man die Multiplikation von s + ix + jy + kz, s′ + ix′ + jy ′ + kz ′ durch einfaches
distributives Ausmultiplizieren erledigen.
Bevor wir auf die Körpereigenschaften von H eingehen, noch eine Bezeichnung. Der Betrag
bzw. die Länge eines Quaternions q := s + ix + jy + zk wird so festgelegt:
p
|q| := s2 + x2 + y 2 + z 2 .
Folgerung 5.60
(H, ⊕, ⊙) bildet einen Schiefkörper, d.h. (H, ⊕, ⊙) erfüllt alle Axiome eines Körpers mit Ausnahme der Kommutativität in der Multiplikation ⊙ :
Das Nullelement ist n := 0 + i0 + j0 + k0, das Einselement ist e := 1 + i0 + j0 + k0, das Negative
eines Quaternions q := s + ix + jy + kz ist −q := −s + i(−x) + j(−y) + k(−z), das Inverse eines
Quaternions q := s + ix + jy + kz 6= n ist q −1 := q|q|−2 .
Beweis:
Dies ist alles einfach nachzurechnen. Die Nichtkommutativität ist schon angelegt in der formalen
Multiplikationsregel i · j = −j · i .
Nun liegt in H eine Erweiterung von C und damit von R vor. In
J : C ∋ x + iy 7−→ x + iy + j0 + k0 ∈ H
ist eine injektive Einbettung“ gegeben.
”
182
Von Gibbs stammt eine andere Beschreibung der Quaternionen: für q = s+ix+jy+kz schreibt
er q = [s, (x, y, z)], nennt s ∈ R den skalaren Anteil und (x, y, z) ∈ R3 den vektoriellen
Anteil. In dieser Schreibweise kann man dann die Addition so schreiben:
[s, (x, y, z)] ⊕ [s′ , (x′ , y ′ , z ′ )] := [s + s′ , (x, y, z) + (x′ , y ′ , z ′ )] ,
[s, (x, y, z)] ⊙ [s′ , (x′ , y ′ , z ′ )] := [ss′ − h(x, y, z), (x′ , y ′ , z ′ )i,
(x, y, z) × (x′ , y ′ , z ′ ) + s(x′ , y ′ , z ′ ) + s′ (x, y, z)] .
Das konjugierte Quaternion“ q zu q := [s, (x, y, z)] ist in dieser Schreibweise [s, −(x, y, z)] .
”
Handelt es sich um ein Quaternion der Länge 1 (Einheitsquaternion), dann kännen wir schreiben:
q = [cos(φ), sin(φ)u] mit u ∈ R3 , |u| = 1 ist.
Wir beschreiben eine Konjugation in H . Gegeben sei ein Einheitsquaternion q, also q ∈
H, |q| = 1 . Wir führen Rq : H −→ H ein durch
Rq (p) := qpq −1 = qpq , p ∈ H .
(5.52)
Klar, diese Konjugation(sabbildung) ist längenerhaltend, d.h. |Rq (p)| = |p| für alle p ∈ H ,
und das Quaternion q bleibt fix unter dieser Abbildung. Ferner gilt
Rq ◦ Rr = Rqr , q, r ∈ H .
(5.53)
Eine Potenz q m entspricht also einer m–fachen Anwendung der Abbildung Rq und umgekehrt.
Wir wollen uns nun diese Konjugation zunutze machen für die Drehung in R3 . Ein Punkt
p = (x, y, z) ∈ R3 soll um die Drehachse u = (u1 , u2 , u3 ) ∈ R3 um den Winkel ω = 2φ gedreht
werden. O.E. sei u schon normalisiert, d.h. es gelte schon |u| = 1 (in R3 ). Wir betten“ p und u
”
in Quaternionen in der Schreibweise von Gibbs folgendermaäen ein:
û := [cos(φ), sin(φ)u] , p̂ := [0, p] .
Berechne
Du (p) := Rû (p̂) = q̂ p̂q̂ −1 = [0, cos(ω) + (1 − cos(ω)hu, piu + (u × p) sin(ω)] .
(5.54)
Glücklicherweise entsteht im Vektor Du (p) wieder ein Quaternion, das in R3 interpretiert wer”
den kann, da der skalare Anteil verschwindet. Offenbar bleibt der Vektor u bei dieser Operation
Du fix; u steht also für die Drehachse der Rotation. Dass die Abbildung längenerhaltend ist,
ergibt sich aus der Eigenschaft, dass û ein Einheitsquaternion ist.
Beispiel 5.61 Der Punkt p = (0, 2, 6) soll um π/3 im Gegenuhrzeigersinn gedreht werden,
wobei die e3 –Achse fix bleiben soll. Wir haben zu wählen:
u := (0, 0, −1) , û = [c, s(0, 0, −1)] mit c = cos(π/6), s = sin(π/6) .
√
Der abgebildete Punkt Du (p) ist ( 3, 1, 6) .
Wir wollen der Operation Du nun eine Matrixschreibweise zur Seite stellen. Sei q = [c, su] =
[q4 , (q1 , q2 , q3 )] ∈ H ein Einheitsquaternion. Man kann nun nachrechnen, dass p′ = Du (p) durch
folgende Matrix/Vektor–Gleichung beschrieben wird:


1 − 2(q22 + q32 ) 2(q1 q2 − q4 q3 ) 2(q1 q3 + q4 q2 )
Mq p = p′ mit Mu := 2(q1 q2 + q4 q3 ) 1 − 2(q12 + q32 ) 2(q2 q3 − q4 q1 )
(5.55)
2(q1 q3 − q4 q2 ) 2(q2 q3 − q4 q1 ) 1 − 2(q12 + q22 )
183
Eine Drehmatrix M = (mij )1≤i,j≤3 ∈ R3,3 ist eine Matrix, deren Spalten orthogonale nichtverschwindende Vektoren sind. Für eine solche Drehmatrix M rechnet man einfach nach, dass
hM x, M yi = hx, yi für alle x, y ∈ R3
gilt.
Eine gegebene Drehmatrix M = (mij )1≤i,j≤3 ∈ R3,3 kännen wir nun in eine Rotation Du
umrechnen, d.h. ein Einheitsquaternion q berechnen, so dass M = Mq gilt. Aus (5.55) lesen wir
folgende Gleichungen ab:
m21 − m12 = 2q4 q3 , m13 − m31 = 2q4 q2 , m32 − m23 = 2q4 q1 .
Damit ist klar, dass q1 , q2 , q3 berechnet werden kännen, wenn q4 , also der Cosinus des halben
Drehwinkels, bekannt ist. q4 kann mit Hilfe der Spur von M (spur(M ) := m11 + m22 + m33 )
berechnet werden. Es ergibt sich die Gleichung
1+spur(M ) = 1+m11 +m22 +m33 = 4−4(q12 +q22 +q32 ) = 4(q12 +q22 +q32 +q42 )−4(q12 +q22 +q32 ) = 4q42 .
Fassen wir zusammen:
q4 =
m13 − m31
m21 − m12
m32 − m23
1p
, q2 =
, q3 =
.
1 + spur(M ) , q1 =
2
2q4
2q4
2q4
(5.56)
Damit haben wir eine Möglichkeit für die Berechnung von q angegeben. Sie ist nicht immer die
erste Wahl, denn man kann die Schwierigkeiten schon ahnen: ist q4 klein“, dann kännen große
”
Instabilitäten auftreten.
Was ist aber zu tun, wenn q4 verschwindet? Dann stehen die Gleichungen
1
1 + m11 + m22 + m33 = 0 , m22 + m33 = − q12
2
für den Berechnungsansatz zur Verfügung. Wir verzichten auf die dann leicht zu findenden
Rechenschritte.
Beispiel 5.62 Betrachte die Matrix
√
√ 
 1√
− 4√ 2 − 21 3 41 √2
 1 6
− 41√ 6
− 12
4√
1
1
0
2 2
2 2
Wir erhalten entlang (5.56)
r
√
√
√
√
1 1 1√
6
2
6+2 3
q4 =
+
, q2 = −
, q3 =
.
2, q1 =
2 2 4
8q4
8q4
8q4
Daraus liest man Drehachse u und Drehwinkel ω ab.
Bemerkung 5.63 Die Vorteile der Nutzung der Drehung mit Hilfe von Quaternionen ist im
Vergleich zur Zerlegung einer Drehung in Eulersche Drehmatrizen liegen auf der Hand: ohne
einen Umweg wird sehr schnell die Drehachse ermittelt und keine Konventionen über eine Reihenfolge von Drehungen sind einzuhalten. Da sich die Hintereinanderausführung von Drehungen
bei der Rotationsmethode mit Hilfe der Quaternionen auf die Multiplikation von zwei Quaternionen reduziert, ist eine Aufwandsersparnis gegeben. In der Computergraphik ist deshalb die
Berechnung von Rotationen mittels Quaternionen ein bedeutendes Werkzeug.
184
Wir haben die Quaternionen als Objekte eingeführt mit den doch recht imaginären“ Größen
”
i, j, k . Man kann dies ebenso wie bei den komplexen Zahlen vermeiden und ganz zu den Basisobjekten der reellen Zahlen zurückgehen. Wir machen einen halben“ Schritt zurück zu den
”
komplexen Zahlen, den zweiten halben Schritt zurück zu den reellen Zahlen kennen wir ja schon
aus Abschnitt 5.6.
Wir nehmen die Paulimatrizen
0 1
0 −i
1 0
σ1 :=
, σ2 :=
, σ3 :=
,
1 0
i 0
0 −1
und verwenden sie zusammen mit der Identität σ0 := E als Basis für die Quaternionen in
folgendem Sinne:
H = Rσ0 + Riσ1 + Riσ2 − Riσ3 .
Dies ist möglich, da wir folgende Regeln für das Rechnen mit den Paulimatrizen haben:
σs2 = σ0 , s = 1, 2, 3 ;
σr σs = −iσt , (r, s, t) ∈ {(1, 2, 3), (2, 3, 1), (3, 1, 2)} ;
σr σs + σs σr = 2δrs σ0 , r, s = 1, 2, 3 .
Bemerkung 5.64 Die Matrizen σr , r = 0, 1, 2, 3, werden in der nichtrelativistischen Theorie
des Elektronenspins benutzt.
5.8
Anhang: Geometrie, Symmetrie, Invarianz
Es lassen sich drei Entwicklungsphasen der Geometrie erkennen:
Die erste Phase führte zur synthetischen Geometrie. Hier werden die Strukturen ohne Bezüge
zu anderen Disziplinen direkt oder rein geometrisch“ in einer eigenen Axiomatik eingeführt, in
”
der nur mengentheoretisch deutbare Operationen ( Verbinden“, Schneiden“) vorkommen.
”
”
Die zweite Phase führte zur Analytischen Geometrie, in der man sich der Sprache der
linearen Algebra bedient. Punkte und geometrische Figuren der synthetischen Geometrie werden durch Koordinaten bzw. Gleichungen in den Koordinaten gegeben. Die Resultate werden
erzielt durch algebraisches Rechnen mit den Gleichungen. In ihrer modernen Fortentwicklung
ist die analytische Geometrie zu dem geworden, was heute mit der Algebraischen Geometrie
umschrieben wird.
Die dritte Phase lässt sich schließlich in der Entwicklung der Differentialgeometrie festmachen. Hier bedient man sich auch der Sprache der Analysis, und zwar u.a. zur Beschreibung
von Tangenten an Kurven und Flächen, Arbeitsmittel sind Ableitung“ und Integral“. Für die
”
”
mathematische Physik ist dieser Entwicklungszweig der Geometrie besonders fruchtbar (Hamiltonsche Mechanik, Relativitätstheorie).
Eng verknüpft mit der Geometrie ist der Begriff der Symmetrie.
Symmetrie, ob man ihre Bedeutung weit oder eng fasst, ist eine Idee, vermöge derer der Mensch durch
Jahrtausende seiner Geschichte versucht hat, Ordnung, Schönheit und Vollkommenheit zu begreifen und
zu schaffen.
H.Weyl, 1885–1955.
Vor dem eigentlichen, mathematisch gefassten Begrif der Symmetrie sollen einige bekannte Beispiele von Geometrien und Symmetrien erwähnt werden. Spezielle Geometrien sind die
euklidische Geometrie, die affine Geometrie und die projektive Geometrie. Zur Geometrie wird man im allgemeinen auch die Topologie oder aber zumindest Teile der algebraischen
185
Topologie und Differentialtopologie zählen. Bei der Spiegelsymmetrie handelt es sich um die
einfachste“ Symmetrie, für den Nichtfachmann mit der Symmetrie allgemein gleichgesetzt. Inva”
riant unter Achsenspiegelung sind etwa Strecken, Quadrate und Kreise in passender Lage. Zu den
allgemeinen diskreten Symmetrien gehören Symmetriebetrachtungen von/an regelmäßigen
Figuren in R2 oder Körpern in R3 . Ebenfalls hierher gehören Symmetrien von Ornamenten und
Parkettierungen. Unter höheren Geometrien fasst man Symmetriebetrachtungen zusammen,
die sich bevorzugt schon in abstrakten Strukturen bewegen. Etwa: Ähnlichkeitstransformationen der euklidischen Ebene, Drehungen des euklidischen Raumes Rn , Transformationsgruppen
in der Quantenmechanik (Spin, ...).
Als geeignetes mathematisches Werkzeug zur Beschreibung von Symmetrien erweist sich der
Gruppenbegriff. Der Zusammenhang zwischen dem Gruppenbegriff und dem Begriff der Symmetrie ist der folgende: Symmetrie im mathematischen Sinne wird zunächst durch Symmetrietransformationen beschrieben. Eine Symmetrietransformation eines Objektes ist eine Transformation, d. h. eine bijektive Abbildung auf diesem Objekt, welche das Objekt im Sinne einer
vorher festgelegten Struktur nicht verändert: das Objekt ist bezogen auf die Struktur invariant (unveränderlich) unter der Transformation. Zum Beispiel kann es sich um eine algebraische
Struktur wie Gruppenstruktur oder Vektorraumstruktur handeln. In diesem Falle heißen solche
strukturerhaltenden Transformationen Automorphismen.
Invarianz und Symmetrie sind Leitprinzipien mathematischer Ästhetik. Sie sind komplementäre Begriffe: Etwas ist in dem Maße symmetrisch, wie es invariant (unveränderlich) ist,
wenn es einer gewissen Transformation unterworfen wird. Einsteins Relativitätstheorie resultiert
aus der Vorstellung, dass die physikalischen Gesetze invariant unter der sogenannten Lorentz–
Transformation sein sollten3 .
Wichtig ist, dass die Symmetrietransformationen eines Objektes mit vorgegebener Struktur
eine Gruppe bilden. Diese Gruppe ist umso größer je symmetrischer das Objekt ist. Im Falle
der Vektorraumstruktur etwa ist diese Symmetriegruppe die allgemeine lineare Gruppe (siehe
unten).
Werden wir nun mathematisch. Wir haben die Begriffe Symmetrietransformation, Invarianz
und Struktur zu erläutern.
Definition 5.65
Sei (G, •) eine Gruppe mit Einselelement e und sei M eine nichtleere Menge.
Eine Wirkung von G auf M ist eine Abbildung φ : G × M −→ M mit
φ(e, m) = m, φ(x, φ(y, m)) = φ(x • y, m)
für alle x, y ∈ G, m ∈ M . (G, φ) heißt dann Transformationsgruppe auf M und man sagt: G
wirkt von links auf M (durch φ).
Folgerung 5.66
Sei (G, φ) Transformationsgruppe auf M .
(a) Für jedes x ∈ G ist die Abbildung
φx : M ∋ m 7−→ φ(x, m) ∈ M
bijektiv, d.h. φx ∈ S(M ).
3
Einstein, Albert, 1879 – 1955. Er dachte sogar daran, seine Relativitätstheorie Invariantentheorie zu nennen.
186
(b) Die Abbildung
φ̃ : G ∋ x 7−→ φx ∈ S(M )
ist ein Gruppenhomomorphismus, d.h.
φ̃(x • y) = φ̃(x) ◦ φ̃(y), x, y ∈ G.
Beweis:
Zu (a) : Sei x ∈ G.
Injektivität: Seien m, m′ ∈ M mit φ(x, m) = φ(x, m′ ). Dann gilt mit dem Inversen x−1 von x :
m = φ(e, m) = φ(x−1 • x, m) = φ(x−1 , φ(x, m)) =
= φ(x−1 , φ(x, m′ )) = φ(x−1 • x, m′ ) = φ(e, m′ ) = m′ .
Surjektivität: Sei m ∈ M. Dann gilt
m = φ(e, m) = φ(x • x−1 , m) = φ(x, φ(x−1 , m)) =
= φ(x, m′ )
mit
m′ := φ(x−1 , m).
Zu (b) :
Seien x, y ∈ G . Dann folgt für alle m ∈ M :
φx•y (m) = φ(x • y, m) = φ(x, φ(y, m)) =
= φx (φ(y, m)) = φx (φy (m)) = (φx ◦ φy )(m).
Beispiel 5.67 Sei G die additive Gruppe R und sei M := R2 . Wir setzen
φ(t, x) := (et x1 , e−t x2 ) , t ∈ R, x = (x1 , x2 ) ∈ R2 ,
und haben damit eine Wirkung auf R2 erklärt, denn φ(0, x) = x und
φ(t, φ(s, x)) = φ(t, (es x1 , e−s x2 )) = (et es x1 , e−t e−s x2 )
= (e(t+s) x1 , e−(t+s) x2 ) = φ(t + s, x) .
(Die Variable in der additiven Gruppe R haben wir mit t, s bezeichnet. Damit tragen wir der
liebgewordenen Gewohnheit Rechnung, im Kontext, wo eine physikalische Zeit auftritt, diese
mit t, s, . . . zu bezeichnen. In der Tat stellt die Wirkung φ nichts anderes dar als den Fluss einer
Bewegung eines Teilchens in der Ebene: φ(t, x) ist die Position des Teilchens zur Zeit t, das zur
Zeit t = 0 in der Position x war. Diese Bewegung wird beschrieben durch das Differentialgleichungssystem
y1′ = y1 , y1 (0) = x1 , y2′ = y2 , y2 (0) = x2 .
In der Theorie der dynamischen Systeme kommt zur algebraischen“ Forderung an eine Wirkung
”
noch eine topologische Forderung hinzu, nämlich die Stetigkeit von φ.
Die obige Folgerung (b) kann man so zu interpretieren, dass die Vorgabe einer Transformationsgruppe (G, φ) gleichbedeutend ist mit der Festlegung eines Gruppenhomomorphismus ϕ von
G nach S(M ). Jeder Gruppenhomomorphismus ϕ : G −→ S(M ) induziert nämlich durch
φ(x, m) := ϕ(x)(m), x ∈ G, m ∈ M,
eine Wirkung von φ von G auf M .
187
Definition 5.68
Sei M eine nichtleere Menge. Dann heißt jede Untergruppe von S(M ) eine Symmetrie-Gruppe.
Zur Erinnerung: Eine nichtleere Teilmenge U von G heißt Untergruppe von (G, •), falls
mit x, y ∈ U stets auch xy −1 ∈ U gilt.
Ist U eine Symmetriegruppe auf M – der Fall U = S(M ) ist zugelassen – , dann wird also
durch
φU : U × M ∋ (u, m) 7−→ u(m) ∈ M
eine Wirkung auf M definiert. Im allgemeinen spricht man von kontinuierlichen Symmetriegruppen, wenn #M = ∞ ist, sonst von diskreten Symmetriegruppen. Ihre Bedeutung erhalten
ausgezeichnete Symmetriegruppen dadurch, dass sie zu gewissen Strukturen passen. Den Strukturbegriff wollen wir hier nicht definieren, in Beispielen wird deutlich werden, was wir meinen.
Beispiel 5.69 Die Gruppe GL(n, K) der Isomorphismen auf Kn nennen wir die zur linearen
Struktur passende Symmetriegruppe.
Beispiel 5.70 Sei M eine nichtleere Menge. Die volle“ Symmetriegruppe S(M ) nennen wir
”
zur leeren Struktur passend. Leere Struktur“ sagen wir, weil ein f ∈ S(M ) ohne weitere
”
Überprüfung einer Vorgabe anderer Art zur Symmetriegruppe gehört.
Ein wichtiges Beispiel, das vor allem in der Theorie der Mannigfaltigkeiten von Interesse ist,
ist Inhalt des folgenden Beispiels.
Beispiel 5.71 Sei M ⊂ Rn offen. Die Gruppe
Diff(M ) := {f ∈ S(M )|f, f −1 differenzierbar}
der Diffeomorphismen von M nennen wir die zur differenzierbaren Struktur auf M passende Symmetriegruppe. (Der Satz über implizite Funktionen hat eine große Bedeutung bei der
Untersuchung von Diffeomorphismen.)
Nun können wir wohl erläutern, was das von F. Klein im Jahre 1872 formulierte Erlanger Programm zum Inhalt hat: Es ist eine Menge und eine Transformationsgruppe gegeben;
”
untersuche die der Menge angehörenden“ Gebilde auf Eigenschaften, die durch die Transforma”
tionsgruppe nicht geändert werden“. Gegenüber der Definition einer Symmetriegruppe hat sich
der Blickpunkt vollkommen umgedreht: Gegeben ist nicht eine Struktur und eine dazu passende
Symmetriegruppe, sondern vorgegeben ist eine Transformationsgruppe, welche eine Struktur auf
M , zu der dann die Transformationsgruppe die passende Symmetriegruppe ist, erst definiert.
Nach dem Standpunkt von F. Klein sind also nicht die geometrischen Größen wie Abstand,
Winkel,. . . die Grundgrößen der Geometrie, sondern das fundamentale Objekt der Geometrie
ist die Transformationsgruppe als Symmetriegruppe; die geometrischen Größen ergeben sich
daraus.
5.9
1.)
Übungen
Seien P, Q Aussagen. Stelle die Wahrheitstafel zu
(a) ¬(P ∨ Q) ⇐⇒ ¬P ∧ ¬Q
188
(b) P ∧ (P ∨ Q) ⇐⇒ P
auf.
2.)
3.)
4.)
Seien A, B Mengen. Welche Beziehung besteht zwischen A und B, falls A ∩ B = A oder
A ∪ B = B gilt?
Beweise für Mengen A, B, C : A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) .
Die symmetrische Differenz von Mengen A und B ist definiert durch
A △ B := {x ∈ A|x ∈
/ B} ∪ {x ∈ B|x ∈
/ A}
5.)
Beweise für Mengen A, B, C : A △ (B △ C) = (A △ B) △ C.
Seien A, B Mengen und definiere
((a, b)) := {{a}, {a, b}} , a ∈ A, b ∈ B .
Zeige für a, p ∈ A, b, q ∈ B: ((a, b)) = ((p, q)) ⇐⇒ a = p, b = q .
(Damit haben wir geordnete Paare neu definiert.)
6.)
7.)
Zeige für Mengen A, B die Äquivalenz der folgenden beiden Aussagen:
(a) A = B .
(b) A ∪ B = A ∩ B .
Formuliere die Aussage
∃x ∈ X (P (x))
mit dem All–Quantor unter Benutzung der Negation.
8.)
9.)
Sei X eine nichtleere Menge und sei (Xa )a∈A eine Familie nichtleerer Teilmengen von
X mit X = ∪a∈A Xa und Xa ∩ Xb = ∅, falls Xa 6= Xb . Zeige: Es gibt genau eine
Äquivalenzrelation ∼ auf X, so dass die Xa die Äquivalenzklassen dazu sind.
In den natürlichen Zahlen N := {1, 2, 3, . . . } sind wir mit der Addition + vertraut.
Verbirgt sich hinter
(a, b) ∼ (c, d) : ⇐⇒ a + d = b + c
eine Äquivalenzrelation auf N × N?
10.) Zwei kubische Polynome
p(x) := a3 x3 + · · · + a0 , q(x) := b3 x3 + · · · + b0 (a3 , . . . , a0 , b3 , . . . , b0 ∈ R, a3 , b3 6= 0)
heissen äquivalent, wenn es eine Abbildung (Schubstreckung)
T : x 7−→ x∗ := αx + β, y 7−→ y ∗ := γy + δ (α, β, γ, δ ∈ R, α, γ 6= 0)
gibt, so dass der Graph von p mittels T auf den Graphen von q abgebildet wird.
Zeige:
(a) Es wird oben eine Äquivalenzrelation erklärt.
(b) Es gibt genau drei Äquivalenzklassen und die Repräsentanten sind:
x 7−→ x3 − x , x 7−→ x3 , x 7−→ x3 + x .
11.) Sei X := {1, 2, 3, 4} und
R := {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4)} ⊂ X × X .
Untersuche, ob die Relation R reflexiv, symmetrisch oder transitiv ist (siehe Definition
5.5).
189
12.) Stelle die Permutation
σ :=
1 2 3 4 5 6 7
5 3 2 6 7 4 1
als Hintereinanderausführung von Permutationen dar, die jeweils nur zwei Elemente vertauschen.
13.) Betrachte die Paulimatrizen σ1 , σ2 , σ3 und dazu σ0 := I . Definiere
A := −iσ1 , B := −iσ2 , C := −iσ3 .
Beweise, dass die achtelementige Menge
G := {±σ0 , ±A, ±B, ±C}
zusammen mit der Matrixmultiplikation als Verknüpfung eine Gruppe darstellt.
14.) Seien σ0 , A, B, C die Matrizen aus der vorhergehenden Aufgabe. Betrachte
H := span(σ0 , A, B, C) := {x1 σ0 + x2 A + x3 B + x4 C|x1 , . . . , x4 ∈ R} .
(a)
Zeige, dass H zusammen mit der Matrixaddition als Verknüpfung eine Gruppe
darstellt.
(b) Zeige, dass H\{Θ} zusammen mit der Matrixmultiplikation als Verknüpfung eine
Gruppe darstellt.
(c)
Folgt aus (a), (b), dass H damit als Körper aufgefasst werden kann?
15.) Sei n ∈ N, n > 1 . Sei G := {z ∈ C|z n − 1 = 0} . Zeige, dass G zusammen mit der
Multiplikation in C eine Untergruppe von C\{0} ist.
16.) Betrachte die Matrix
(a)
1√
2 √2
A :=  14 √2
1
4 6
Zeige, dass eine Drehmatrix vorliegt.
√ 
− 21√ 2
1
.
2 3
4 √2
1
1
−2
4 6
0
√
1
(b) Welcher Vektor x ∈ R3 \{θ} wird bei der Drehung mit A nicht verändert?
(c)
Bestimme eine Eulerzerlegung.
Stoffkontrolle
• Man sollte die ähnlichkeit der Aussagenkonstrukte =⇒ , ⇐⇒ , ∧“ und der Mengenope”
rationen ⊂, =, ∩ “ erkennen.
”
• Was ist der Kern von Distributivgesetzen? Vergleiche diesbezüglich Aussagen und Mengen.
• Versuche Wohldefiniertheit, Injektivität, Surjektivität“ bei Abbildungen mit Hilfe von
”
Quantoren hinzuschreiben.
• Gruppen und Körper sind in Beispielen zu kennen.
190
Herunterladen