Skript - Institut für Mathematik

Werbung
Vorkurs für
Studierende in Mathematik und Physik
Skript 2017
Mathematisches Institut
Universität Zürich
Winterthurerstrasse 190
8057 Zürich
11. September – 15. September 2017
Vorkurs UZH
Inhaltsverzeichnis
1 Algebra
2
1.1
Polynomiale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2
Logik und Beweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.2.1
Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2.2
Prädikatenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.2.3
Beweisführungsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3
Potenzen und das Binomialtheorem . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1
Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2
Binomialtheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.3
Negative Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.4
Rationale Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4
Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5
Logarithmen und Flächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5.1
Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5.2
Berechnung von Flächen . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Unendliche Folgen und reelle Zahlen
23
2.1
Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2
Cauchy-Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3
Konstruktion der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4
2.3.1
Äquivalenzrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.2
Addition und Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3
Ordnungsrelation und absoluter Betrag . . . . . . . . . . . . . . . . . . . 28
Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1
Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.2
Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Reelle Funktionen und Stetigkeit
33
3.1
Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2
Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3
Uniforme Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4 Literatur
41
A Mengenlehre
42
1
Vorkurs UZH
1
Algebra
Die numerische formale Logik wird dargestellt durch Zahlen.
Die spezifische formale Logik hingegen wird dargestellt durch
gewisse Arten und Formen von Dingen: zum Beispiel durch
die Buchstaben des Alphabets.
(F. Vieta 1600, Algebra nova, Französische Ausgabe 1630)
Solange Algebra und Geometrie separat betrachtet wurden,
war ihr Fortschritt langsam und ihr Nutzen beschränkt; doch
seit die beiden Wissensgebiete vereint sind, unterstützen sie
sich gegenseitig und entwickeln sich zusammen nun rasch in
Richtung Perfektion. Wir sind Descartes die Anwendung der
Algebra in der Geometrie schuldig; diese wurde zum Schlüssel der grössten Entdeckungen in allen Gebieten der Mathematik.
(J.-L. Lagrange 1795, Oeuvres, vol. 7, p. 271)
Algebra ist ein Erbe der griechischen und orientalischen Antike. Das berühmte Buch Al-jabr
w’al muqâbala von Mohammed ben Musa Al-Khowârizmî (830) beginnt mit der Abhandlung
über Lösungen von quadratischen Gleichungen.
Al-Khowârizmî hatte für seine Ausführungen noch keine formale Schreibweise zur Verfügung
und drückte sich deshalb höchst kompliziert mit Worten aus:
«...zum Beispiel, ein Quadrat plus Einundzwanzig in Zahlen soll gleich zehn Wurzeln des
gleichen Quadrats sein. Das heisst, was ist der Betrag des Quadrates, welches, wenn Einundzwanzig (...) dazu gezählt werden, gleich dem Entsprechenden von zehn Wurzeln dieses
Quadrats ist? Lösung: Die Hälfte der Anzahl der Wurzel; die Hälfte ist Fünf. Multipliziere
dies mit sich selbst; das Produkt ist Fünfundzwanzig. Ziehe davon Einundzwanzig ab (...);
übrig bleiben Vier. Nehme davon die Wurzel; dies ist Zwei. Zähle dies ab von der Hälfte
der Wurzel, welche Fünf ist; übrig bleibt Drei. Dies ist die Wurzel des Quadrates welches
wir gesucht haben, und das Quadrat ist Neun. Oder wir addieren die Wurzel zur Hälfte
der Wurzel; die Summe ist Sieben; dies ist die Wurzel des Quadrates, welche wir gesucht
haben, und das Quadrat davon ist Neunundvierzig.»
Geometrisch kann dies wie folgt verstanden werden: Angenommen, die Länge eines Rechtecks
beträgt 10. Wie gross muss x in der folgenden Figur gewählt werden?
x2
21
10
2
Vorkurs UZH
In den alten Texten wurden nur bestimmte Beispiele beschrieben und «arithmetische» Berechnungen nur mit Zahlen durchgeführt. Erst F. Vieta (1540–1603) hatte 1600 in seinem Buch
Algebra nova die weitreichende Idee, für die bekannten und unbekannten Grössen eines (oft
geometrischen) Problems Buchstaben wie A, B, C, X, . . . einzuführen und diese Buchstaben in
algebraische Berechnungen zu benutzen.
Benutzen wir Vietas Schreibweise, dann lautet die Aussage von Al-Khowârizmî kurz und bündig
r
r
2
10
102
10
10
+
− 21 oder x =
−
− 21
x2 − 10x + 21 = 0
=⇒
x=
2
4
2
4
respektive allgemein für zwei Konstanten a, b
2
x + ax + b = 0
=⇒
a
x=− +
2
r
a2
−b
4
oder
a
x=− −
2
r
a2
− b.
4
Aus einem geometrischen Problem wird also eine algebraische Gleichung, welche dann aufgelöst
werden kann.
geometrisches
Problem
Buchstaben
einsetzen
algebraisches
Problem
Ausrechnen
Lösung
Oft hilft aber auch die Geometrie algebraische Probleme zu lösen – und nicht nur das: Die
Geometrie wirft ein ganz neues Licht auf die Algebra, wie wir im nächsten Abschnitt gleich
sehen werden.
3
Vorkurs UZH
1.1
Polynomiale Funktionen
Die Geometrie hilft der Algebra mit kartesischen Koordinaten. Statt x2 −10x+21 = 0 betrachten
wir die Gleichung
y = x2 − 10x + 21.
Zeichnen wir dies in ein kartesisches Koordinatensystem, erhalten wir:
20
15
10
5
0
1
2
3
4
5
6
7
8
9
10
-5
Definition 1.1. Ein Polynom ist ein Ausdruck der Form
an xn + an−1 xn−1 + · · · + a0 ,
mit a0 , . . . , an beliebigen Konstanten. Falls an 6= 0 hat das Polynom den Grad n.
Polynome sind aus vielen Gründen interessant. Ein häufiges Problem in Anwendungen ist das
Folgende:
Es seien n + 1 Punkte (xi , yi ) in R2 gegeben, wobei
x0 = 0,
x1 = 1,
x2 = 2,
...,
xn = n.
Wir suchen ein Polynom von Grad höchstens n, welches durch alle Punkte (xi , yi ) geht.
Beispiel 1.2. Angenommen, die Punkte seien
(0, 4), (1, 5), (2, 2), (3, 5), (4, 2), (5, 2).
Folgendes Polynom geht durch all diese Punkte:
8
7
6
(1,5)
Ordinate y
5
4
(3,5)
(0,4)
3
(2,2)
2
(4,2)
(5,2)
1
0
1
2
3
4
5
6
-1
Abszisse x
Abbildung 1: Das Polynom
43 5
x
120
− 92 x4 +
4
473 3
x
24
− 35x2 +
613
x
30
+ 4.
Vorkurs UZH
Newton (1676) bearbeitete das Problem im Fall von vier Punkten mit Hilfe von Vietas Formalismus der Algebra nova. Er schrieb
y = A + Bx + Cx2 + Dx3 ,
(1)
wobei die Buchstaben A, B, C und D Platzhalter für die gesuchten Zahlen sind. Wir erhalten
Abszisse
x=0
x=1
x=2
x=3
Ordinate
A
A+B+C +D
A + 2B + 4C + 8D
A + 3B + 9C + 27D
=
=
=
=
y0
y1
y2
y3
Ziehen wir die erste Zeile von der Zweiten, die Zweite von der Dritten und die Dritte von der
vierten Zeile ab, erhalten wir
B + C + D = y1 − y0 =: ∆y0
B + 3C + 7D = y2 − y1 =: ∆y1
B + 5C + 19D = y3 − y2 =: ∆y2 .
(2)
Ziehen wir erneut die erste Zeile von der Zweiten und die Zweite von der dritten Zeile ab,
erhalten wir1
2C + 6D = ∆y1 − ∆y0 =: ∆2 y0
2C + 12D = ∆y2 − ∆y1 =: ∆2 y1 ,
(3)
und erneutes Abziehen ergibt
6D = ∆2 y1 − ∆2 y0 =: ∆3 y0 .
(4)
Seit Newton ist es üblich, die Differenzen in folgendem Differenzen-Schema anzuordnen:
y0
∆y0
∆2 y0
y1
∆3 y0
∆y1
∆2 y1
y2
∆4 y0
3
∆y2
∆ y1
∆2 y2
y3
wobei
∆yi := yi+1 − yi
∆2 yi := ∆yi+1 − ∆yi
∆3 yi := ∆2 yi+1 − ∆2 yi
etc.
(i = 0, 1, 2, ...)
(5)
∆y3
y4
1
Wenn wir x := y oder y =: x schreiben, soll das heissen, dass x von nun an das gleiche wie y ist. Wir sagen,
dass wir x als y definieren.
5
Vorkurs UZH
Im Fall von Beispiel 1.2 (Seite 4) erhalten wir
4
1
−4
5
−3
10
2
−22
6
−12
3
−6
5
43
21
−3
9
2
3
0
2
Durch Rückwärtsauflösen von (2), (3) und (4) nach A, B, C und D und Einsetzen in (1) erhalten
wir die (allgemeine) Lösung
y = y0 + ∆y0 · x +
∆3 y0
∆2 y0
· (x2 − x) +
· (x3 − 3x2 + 2x).
2
6
Etwas umgeordnet entspricht dies
y = y0 +
x(x − 1)
x(x − 1)(x − 2)
x
· ∆y0 +
· ∆2 y0 +
· ∆3 y0 .
1
1·2
1·2·3
Die allgemeine Formel für mehr Stützstellen2 lässt sich aus diesem Spezialfall bereits erraten:
Theorem 1.3. Das Polynom von Grad höchstens n, welches die Werte
y0
(für x = 0),
y1
(für x = 1),
...
yn
(für x = n)
annimmt, ist gegeben durch die Formel
y = y0 +
x
x(x − 1)
x(x − 1) · · · (x − n + 1)
· ∆y0 +
· ∆2 y0 + · · · +
· ∆n y0 .
1
1·2
1 · 2···n
Für den Beweis dieses Theorems benötigen wir das Pascalsche Dreieck (siehe Abschnitt 1.3.2).
Bevor wir uns damit auseinandersetzen, wollen wir uns zuerst ein wenig mit Logik und Beweisen
beschäftigen.
1.2
Logik und Beweise
In der Mathematik versucht man seit jeher, wahre Aussagen zu finden. Sprachlich geführte
Argumentationen haben jedoch den Nachteil, dass sie teilweise ungenau sind, nicht eindeutig
definiert. Damit können leicht falsche Argumentationen entstehen, die sich ohne sehr genaues
Hinschauen richtig anhören, oder Argumentationsketten, bei denen man sehr lange diskutierern
kann ob sie richtig sind oder wie genau eigentlich argumentiert werden soll.
Auch wenn man in der Mathematik selten eine völlig formale Beweisführung im Rahmen des
Aussagenkalküls und Prädikatenkalküls findet, werden gerne und häufig Elemente der Aussagen2
Stützstellen sind Stellen x, an denen der Funktionswert y gegeben (und somit fest) ist.
6
Vorkurs UZH
und Prädikatenlogik verwendet. Dieser Abschnitt soll einen kleinen, eher informellen Überblick
über Grundlagen der Aussagenlogik und Prädikatenlogik sowie über elementare Beweistechniken geben. Ein kurzer Überblick über Grundlagen der Mengenlehre findet sich im Anhang A.
Diese Themen werden auch ausführlich in der Wahlpflicht-Veranstaltung «Grundlagen der Mathematik»/«Foundations of Mathematics» am Institut für Mathematik der Universität Zürich
behandelt.
1.2.1
Aussagenlogik
In der Aussagenlogik behandelt man sogenannte Aussagen. Dies sind Sätze, von denen man
sinnvoll sagen kann, ob sie wahr oder falsch sind.
Historisch geht die Aussagenlogik auf Aristoteles zurück, welcher bereits Grundsätze wie Argumentation durch Widerspruch3 und den Satz vom ausgeschlossenen Dritten4 diskutiert hat.
Vor über 2000 Jahren wurde dies mit andere Arbeiten von Chrysippos von Soloi zu einem ersten aussagenlogischen Kalkül ausgearbeitet. Das moderne aussagenlogische Kalkül geht u. A.
auf die Arbeiten von George Boole (1847), Gottlob Frege (1879) und Bertrand Russell zurück.
Russell hat 1910 ein Aussagenkalkül vorgestellt, welches sich schliesslich durchsetzte.
Beispiel 1.4. Der Satz «Die Zahl 4 ist ungerade» ist eine Aussage, die falsch ist. Der Satz
«Denk doch mal nach» ist dagegen keine Aussage.
Aussagen in der Aussagenlogik sind meist zusammengesetzt aus sogenannten Elementaraussagen. Wir wollen nun Möglichkeiten betrachten, wie man eine oder mehrere Aussagen zu
komplizierteren Aussagen kombinieren kann. Seien dazu A und B zwei Aussagen:
1. Mit «¬A» (Negation) bezeichnet man die Aussage «nicht A»; diese Aussage ist genau
dann wahr, wenn A nicht wahr ist.
2. Mit «A ∨ B» (Disjunktion) bezeichnet man die Aussage «A oder B oder beide»; diese
Aussage ist genau dann wahr, wenn die Aussage A wahr ist, die Aussage B wahr ist, oder
sowohl A wie auch B wahr sind.
3. Mit «A ∧ B» (Konjunktion) bezeichnet man die Aussage «A und B»; diese Aussage ist
genau dann wahr, wenn sowohl die Aussage A wahr ist wie auch die Aussage B wahr ist.
4. Mit «A ⇒ B» bezeichnet man die Aussage «wenn A gilt, dann auch B». Wenn A wahr
ist, dann ist «A ⇒ B» nur dann wahr, wenn auch B wahr ist. Wenn A dagegen falsch
ist, dann ist die Aussage «A ⇒ B» immer wahr.
Eine solche Aussage «A ⇒ B» nennt man auch Implikation: die Wahrheit der Aussage A
impliziert die Wahrheit der Aussage B.
Wenn A ⇒ B wahr ist, sagt man auch, dass A eine hinreichende Bedingung für B ist, und
umgekehrt, dass B eine notwendige Bedingung für A ist: Wenn A gilt, dann gilt wegen
A ⇒ B auch immer B – die Aussage A ist also hinreichend dafür, dass B gilt. Ebenso
kann es nicht sein, dass A gilt, aber nicht B, womit B notwendigerweise gelten muss,
wenn A gilt.
3
Siehe den Abschnitt 1.2.3, insbesondere auf Seite 11.
Dieser besagt: wenn man eine Aussage hat, so gilt entweder diese Aussage oder ihre Negation. Es gibt keine
weitere, dritte Möglichkeit.
4
7
Vorkurs UZH
5. Mit «A ⇔ B» bezeichnet man die Aussage «A gilt genau dann, wenn B gilt». Eine solche
Aussage nennt man auch Äquivalenz und man sagt, dass die Aussagen A und B äquivalent
sind.
Ein paar dieser Symbole werden bereits in der Schule verwendet; gerade «Implikationspfeile»
und «Äquivalenzpfeile» werden den meisten ein Begriff sein. Die Zeichen ∨ und ∧ werden auch
häufig in der Schule verwendet.
Eine einfache und gleichzeitig mächtige Methode, aussagenlogische Terme zu untersuchen, sind
Wahrheitstabellen. Bei diesen schreibt man zu allen Möglichkeiten der vorkommenden Elementaraussagen – jede kann falsch oder richtig sein – den Wert eines oder mehrerer Terme auf.
Wir wollen dies anhang den obigen kombinierten Ausdrücken der Elementaraussagen A und B
demonstrieren:
A
f
f
w
w
B
f
w
f
w
¬A A ∨ B
w
f
w
w
f
w
f
w
A∧B
f
f
f
w
A⇒B
w
w
f
w
A⇔B
w
f
f
w
Wir haben hier die Abkürzungen «w» und «f» für wahr und falsch verwendet.
Zu diesen Aussagen gibt es auch verschiedene Rechenregeln und Identitäten. Ein paar wichtige
seien hier aufgeführt. Wir verwenden «≡» (sprich: «identisch», oder «äquivalent zu») anstelle
des Gleichheitszeichen, um auszusagen, dass zwei aussagenlogische Ausdrücke als Funktionen
der in ihr vorkommenden Elementaraussagen identisch sind.
Rechenregeln Aussagenlogik
Sind A, B und C Aussagen, so gilt:
1. A ∨ B ≡ B ∨ A und A ∧ B ≡ B ∧ A (Kommutativität);
2. (A ∨ B) ∨ C ≡ A ∨ (B ∨ C) und (A ∧ B) ∧ C ≡ A ∧ (B ∧ C) (Assoziativität);
3. (A ∨ B) ∧ C ≡ (A ∧ C) ∨ (B ∧ C) und (A ∧ B) ∨ C ≡ (A ∨ C) ∧ (B ∨ C) (Distributivität);
4. ¬(A ∨ B) ≡ (¬A) ∧ (¬B) und ¬(A ∧ B) ≡ (¬A) ∨ (¬B) (De Morgansche Regeln);
5. A ∨ A ≡ A und A ∧ A ≡ A;
6. A ∨ (¬A) ist immer wahr und A ∧ (¬A) ist immer falsch;
7. ist B wahr und C falsch, so ist A ∨ B immer wahr und A ∧ C immer falsch; weiterhin
gilt dann immer A ∨ C ≡ A und A ∧ B ≡ A;
8. es gilt (A ⇒ B) ≡ ¬A ∨ B;
9. gelten A ⇒ B und B ⇒ C, so gilt auch A ⇒ C (Transitivität);
10. es gilt (A ⇔ B) ≡ (A ⇒ B) ∧ (B ⇒ A) ≡ (A ∧ B) ∨ (¬A ∧ ¬B).
Um eine solche Identität zu beweisen, kann man Ketten von anderen Identitäten verwenden oder
auch einfach Wahrheitstabellen. Wenn eine Wahrheitstabelle für beide Ausdrücke die gleichen
8
Vorkurs UZH
Werte liefert, sind die Ausdrücke identisch. Um etwa den ersten Teil der letzten Aussage zu
zeigen, kann man wie folgt vorgehen:
A
f
f
w
w
B
f
w
f
w
A⇒B
w
w
f
w
B⇒A
w
f
w
w
(A ⇒ B) ∧ (B ⇒ A)
w
f
f
w
A⇔B
w
f
f
w
Die letzten beiden Spalten sind gleich, womit die zugehörigen Ausdrücke «(A ⇒ B)∧(B ⇒ A)»
und «A ⇔ B» identisch sind.
1.2.2
Prädikatenlogik
Die Prädikatenlogik ist eine Erweiterung der Aussagenlogik, die unabhängig voneinander von
Gottlob Frege und Charles Sanders Peirce entwickelt wurde. Sie erlaubt neben einer besseren Formalisierung auch eine Quantifizierung von Aussagen; so lässt sich die Aussage «Alle
Velos sind gelb», die in der Aussagenlogik eine nicht zerlegbare Elementaraussage ist, in der
Prädikatenlogik in weitere Einzelteile zerlegen, die eine bessere Untersuchung erlauben. Beispielsweise erlaubt die Prädikatenlogik, diese Aussage zu negieren und beschreibt also ebenfalls
die Struktur der negierten Aussage.
Die grundlegenden Objekte in der Prädikatenlogik sind Prädikate: Ein Prädikat P ist eine Art
Funktion, die einem Objekt x einen Wahrheitswert P (x) zuordnet.
Beispiel 1.5. Setzt man PRB (x) genau dann als wahr, wenn x ein roter Ball ist, dann ist
PRB (x) ein Prädikat.
Wenn wir nun einen konkreten Ball haben, nennen wir ihn Ball 1, so können wir die Aussage
«PRB (Ball 1)» betrachten. In der Aussagenlogik hätte man die konkrete Aussage «Ball 1 ist ein
roter Ball». Wenn wir einen zweiten Ball haben, etwa Ball 2, so hätten wir die ähnliche Aussage
«Ball 2 ist ein roter Ball», die jedoch ebenso wie die erste Aussage eine Elementaraussage ist und
somit nicht genauer untersuchbar im Rahmen der Aussagenlogik. In der Prädikatenlogik hat
man dagegen zwei Aussagen «PRB (Ball 1)» und «PRB (Ball 2)», die beide die gleiche Struktur
haben: sie verwenden das Prädikat PRB .
In der Prädikatenlogik verwendet man neben Prädikaten auch noch sogenannte Quantoren, die
quantifizierende Aussagen erlauben:
1. Ist P (x) ein Prädikat, so bezeichnet «∃x : P (x)» die Aussage «Es gibt ein x, so dass P (x)
wahr ist». Dieser Quantor «∃» wird Existenzquantor genannt.
2. Ist P (x) ein Prädikat, so bezeichnet «∀x : P (x)» die Aussage «Für alle x ist P (x) wahr».
Dieser Quantor «∀» wird Allquantor genannt.
Mit unserem Prädikat PRB (x) von oben können wir die Aussagen «∀x : PRB (x)» – «Jedes x
ist ein roter Ball» – sowie «∃x : PRB (x)» – «Es gibt ein x, so dass x ein roter Ball ist», oder
kürzer «Es gibt einen roten Ball» – formulieren.
9
Vorkurs UZH
Rechenregeln Prädikatenlogik
Ist P (x) ein Prädikat, so gilt:
1. ¬(∀x : P (x)) gilt genau dann, wenn ∃x : ¬P (x) gilt;
2. ¬(∃x : P (x)) gilt genau dann, wenn ∀x : ¬P (x) gilt.
Prädikate können auch von mehr als einem Objekt x abhängen. Zum Beispiel kann man ein
Prädikat Q(x, y) betrachten, welches genau dann wahr ist, wenn x die Farbe y hat. Wenn man
dann noch das Prädikat R(x) anschaut, welches genau dann wahr ist, wenn x ein Ball ist, so
ist
PRB (x) = R(x) ∧ Q(x, rot).
Man kann also sehr einfache, elementare Prädikate definieren und diese als Bausteine für weitere,
kompliziertere Prädikate verwenden.
Gerade in der Mathematik verwendet man häufig eine etwas allgemeinere Schreibweise für
Existenz- und Allquantor. So schreibt man zum Beispiel ∀x ∈ A : P (x) und ∃x ∈ A : P (x), um
die Aussagen auf alle x einzuschränken, die in einer Menge A liegen (vergleiche Anhang A).
Dies sind jedoch nur Kurzformen von
∀x : ((x ∈ A) ⇒ P (x))
und
∃x : ((x ∈ A) ∧ P (x)).
Mit den Rechenregeln zur Prädikatenlogik und Aussagenlogik kann man nachweisen, dass
und
¬(∀x ∈ A : P (x))
¬(∃x ∈ A : P (x))
äquivalent zu
äquivalent zu
∃x ∈ A : ¬P (x)
∀x ∈ A : ¬P (x)
ist. Die Rechenregeln funktionieren also ebenfalls für diese allgemeinere Schreibweise.
1.2.3
Beweisführungsmethoden
Wir wollen hier nun drei wichtige Beweisführungsmethoden vorstellen. Eine vierte Methode
werden wir später im Abschnitt zum Binomialtheorem kennenlernen (Seite 13). Um die Methoden zu demonstrieren, wollen wir sie auf eine einfache Aussage anwenden:
Theorem 1.6. Die Summe von zwei aufeinander folgenden natürlichen Zahlen ist ungerade.
In anderen Worten: Ist n eine natürliche Zahl, so ist n + (n + 1) ungerade.
Zuerst beginnen wir mit dem direkten Beweis.
Beweisführung: direkter Beweis
Bei einem direkten Beweis zeigt man eine Implikation A ⇒ B, indem man Schritt für Schritt
Zwischenschritte zeigt: A ⇒ Z1 , Z1 ⇒ Z2 , Z2 ⇒ Z3 , . . . , Zn−1 ⇒ Zn , Zn ⇒ B. Nach den
Rechenregeln für «⇒» liefert diese Implikationskette die Aussage A ⇒ B.
Ein einfacher Fall von einem direkten Beweis ist eine Gleichungskette: dort hat man zwei
Ausdrücke S und T und will zeigen, dass diese gleich sind. Man formt nun S zu S1 um, S1 zu
S2 , etc., bis man schliesslich Sn zu T umformen kann.
10
Vorkurs UZH
Die obige Aussage kann direkt wie folgt bewiesen werden:
Beweis (Direkter Beweis). Sei n eine natürliche Zahl. Dann ist n + (n + 1) = 2 · n + 1, was
ungerade ist (da n eine natürliche Zahl ist).
Wir wollen nun die Beweisführung durch Kontraposition vorstellen.
Beweisführung: Kontraposition
Bei einem Beweis durch Kontraposition zeigt man eine Implikation A ⇒ B, indem man sich
zur Nutze macht, dass dies äquivalent zu ¬B ⇒ ¬A ist: wenn also die Aussage B nicht gilt,
muss die Aussage A ebenfalls nicht gelten.
Man nimmt also an, dass die zu beweisende Behauptung B nicht gilt. Nach mehreren (endlich
vielen) logischen, direkten Schritten möchte man die Aussage erhalten, dass die Voraussetzung A ebenfalls nicht gelten kann.
Dies zeigt die ursprüngliche Behauptung, denn sind die Voraussetzungen erfüllt, so muss
die Aussage wahr sein: andernfalls würde aus der nicht geltenden Aussage folgen, dass die
Voraussetzungen nicht erfüllt sind.
Damit lässt sich die obige Aussage wie folgt zeigen:
Beweis (durch Kontraposition). Wir nehmen an, dass n + (n + 1) nicht ungerade ist, und
wollen zeigen, dass n in diesem Fall keine natürliche Zahl sein kann. Per Kontraposition folgt
dann die Behauptung.
Damit muss n + (n + 1) gerade sein, da es offensichtlich eine natürliche Zahl ist. Also gibt
es eine natürliche Zahl m mit n + (n + 1) = 2 · m. Nun ist n + (n + 1) = 2 · n + 1, womit
2 · n + 1 = 2 · m ist. Damit ist jedoch n = m − 12 , womit n keine natürliche Zahl ist.
Als letzte Beweismethode in diesem Unterabschnitt stellen wir den indirekten Beweis vor.
Beweisführung: Widerspruch
Bei einem Beweis durch Widerspruch (auch genannt indirekter Beweis oder auch Reductio
ad absurdum) nimmt man an, dass sowohl die Voraussetzungen gelten, und gleichzeitig die
zu zeigende Behauptung nicht gilt. Jetzt versucht man, daraus einen Widerspruch zu einer
Folgerung aus den Annahmen herzuleiten, also durch logische Schritte eine Aussage, die sicher
falsch ist, herzuleiten.
Ein solcher Widerspruch wäre etwa «die Behauptung gilt nicht und gleichzeitig gilt sie doch».
Als Beispiel zeigen wir noch einmal die Aussage «Die Summe zweier aufeinander folgenden
natürlichen Zahlen ist ungerade»:
Beweis (durch Widerspruch). Sei n eine natürliche Zahl. Wir nehmen an, dass n + (n + 1)
nicht ungerade ist, also gerade ist.
Damit gibt es eine natürliche Zahl m mit 2 · n + 1 = n + (n + 1) = 2 · m. Betrachte nun m − n;
dies ist als Differenz zweier natürlicher Zahlen eine ganze Zahl. Jetzt ist jedoch m − n =
1
· (2m − 2n) = 12 · 1 = 12 , was ein Widerspruch dazu ist, dass m − n eine ganze Zahl ist.
2
Also muss unsere Annahme falsch gewesen sein, womit n + (n + 1) ungerade ist.
Wir werden in den Übungen noch weitere Beispiele für Widerspruchsbeweise kennenlernen.
Darunter sind diese beiden Aussagen:
11
Vorkurs UZH
a) Die Zahl
√
2 ist nicht rational.
b) Es gibt unendlich viele Primzahlen.
Beide lassen sich zwar auch direkt zeigen, der Aufwand dafür ist jedoch wesentlich höher.
1.3
1.3.1
Potenzen und das Binomialtheorem
Potenzen
Sei a eine gegebene Zahl (die Basis). Wir schreiben
a =: a1 ,
a · a =: a2 ,
a · a · a =: a3 ,
a · a · a · a =: a4 ,
etc.
(6)
Es ist einfach einzusehen, dass für positive Zahlen n und m (die Exponenten) gilt:
an · am = an+m .
(7)
In (6) wird in jedem Schritt mit a multipliziert. Diese Reihe können wir auch auf die negative
Seite fortsetzen, indem wir durch a dividieren statt multiplizieren:
a
a0 = ,
a
1
a−1 = ,
a
a−2 =
1
,
a2
...,
a−m =
1
,
am
etc.
Hier gehen wir natürlich davon aus, dass a 6= 0 ist.
So stimmt die Regel (7) auch für negative Exponenten
n und m. Nun nehmen wir an, dass
√
a > 0 ist, und multiplizieren wiederholt mit a:
√
√
√ √
√ √ √
√ √ √ √
1,
a,
a · a = a,
a · a · a = a3 ,
a · a · a · a = a2 , . . .
was die Notation
m
a n :=
√
n
am
nahelegt. Damit stimmt (7) auch für rationale5 Exponenten n und m.
5
Bemerkung 1.7. Wir betrachten hier nur positive Wurzeln, so dass zum Beispiel a 2 zwischen
a2 und a3 liegt.
Der nächste Schritt wären irrationale Exponenten, welche, wie L. Euler sagt, «schwieriger zum
Verstehen sind». Aber es ist sinnvoll, dass
√
a
(Beachte dazu, dass
5
√
7
zwischen
a2
26
a 10
264
a 100
2645
a 1000
..
.
und
und
und
und
7 ≈ 2.64575131106 ist.)
Die rationalen Zahlen sind die Brüche von ganzen Zahlen.
12
a3
liegt
27
a 10
265
a 100
2646
a 1000
Vorkurs UZH
1.3.2
Binomialtheorem
Nun wollen wir den Ausdruck (a + b)n etwas genauer betrachten.
(a + b)0
(a + b)1
(a + b)2
(a + b)3
(a + b)4
=
=
=
=
=
..
.
1
a+b
a2 + 2ab + b2
a3 + 3a2 b + 3ab2 + b3
a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
Die Koeffizienten der Terme ai bj bilden ein interessantes Dreieck (auch das Pascalsche Dreieck
genannt) bestehend aus «Binomialkoeffizienten»:
1
1
1
1
1
1
1
1
1
5
3
6
10
15
21
1
3
4
6
7
2
1
4
10
20
35
1
5
15
35
1
6
21
1
7
1
In diesem Dreieck ist jede Zahl die Summe ihrer zwei direkt oberhalb liegenden Zahlen.
Was ist die allgemeine Regel für diese Koeffizienten?
Diagonale
Koeffizienten
Vermutung für allg. Formel?
1. Diagonale:
(1, 1, 1, 1 . . .)
1
2. Diagonale:
(1, 2, 3, 4, . . .)
n
3. Diagonale:
(1, 3, 6, 10, . . .)
4. Diagonale:
(1, 4, 10, 20, . . .)
n(n−1)
1·2
n(n−1)(n−2)
1·2·3
Dies lässt folgendes allgemeines Theorem vermuten:
Theorem 1.8 (Pascal 1654). Für n = 0, 1, 2, . . . gilt
(a + b)n = an +
n n−1
n(n − 1) n−2 2 n(n − 1)(n − 2) n−3 3
·a b+
·a b +
· a b + ... .
1
1·2
1·2·3
Die Summe ist endlich und endet nach n + 1 Termen.
Für den Beweis dieses Theorems benötigen wir die folgende Beweismethode:
Vollständige Induktion
Um die Behauptungen B(n) für alle ganzen Zahlen n ≥ n0 zu beweisen, gehen wir wie folgt
vor. Zuerst zeigen wir die/den
Induktionsverankerung/
Induktionsanfang:
Die Behauptung stimmt für n = n0 ; das heisst, B(n0 ) ist richtig.
13
Vorkurs UZH
Wenn diese bewiesen ist, machen wir eine Annahme:
Induktionsannahme/
Wir nehmen an, dass für ein beliebiges aber festes n die BeInduktionsvoraussetzung: hauptung B(n) richtig ist.
Mit Hilfe dieser Annahme wird der Schritt zur Behauptung B(n + 1) vollzogen, was wieder
bewiesen werden muss:
Induktionsschritt/
Wir zeigen, dass falls B(n) richtig ist, auch B(n + 1) richtig ist.
Induktionsschluss:
Daraus folgt, dass die Aussage B(n) für jedes n ∈ Z mit n ≥ n0 gilt.
Eine gute Analogie dazu sind Dominosteine: stellt man sich für jede ganze Zahl einen aufgestellten Dominostein in einer (unendlich) langen Reihe vor, so stösst man mit dem Induktionsanfang den Stein n0 um. Laut dem Induktionsschritt stösst der Stein n0 beim Umfallen
den Stein n0 + 1 um. Dieser wiederum stösst den Stein n0 + 2 um, usw.
n0
n0 +1
n0 +2
n0 +3
n0 +4
n0 +5
n0 +6
n0 +7
n0 +8
n0 +9 n0 +10 n0 +11 n0 +12 n0 +13 n0 +14 n0 +15
Nimmt man irgendein n ≥ n0 , so wird der Stein n nach endlich vielen Schritten ebenfalls
umgestossen. Somit folgt aus Induktionsverankerung und Induktionsschritt, dass jedes B(n)
bewiesen wird, n ≥ n0 .
Definition 1.9. Die Koeffizienten
n(n − 1) · · · (n − j + 1) · (n − j)(n − j − 1) · · · 1
n(n − 1) · · · (n − j + 1)
=
1 · 2···j
(1 · 2 · · · j) · (1 · 2 · · · (n − j))
n!
n
=
=:
,
j! · (n − j)!
j
für 0 ≤ j ≤ n werden Binomialkoeffizienten genannt, wobei n! = 1 · 2 · · · n (sprich n Fakultät)
und 0! := 1 ist.
Mit dieser Definition lässt sich die Aussage von Theorem 1.8 schreiben als
n n
n n−1
n n−2 2
n
n n
n
n−1
(a + b) =
a +
a b+
a b + ··· +
ab
+
b .
0
1
2
n−1
n
Beweis (Theorem 1.8).
Induktionsanfang:
für n0 = 0 müssen wir (a+b)0 = 00 a0 zeigen. Da per Definition (a+b)0 =
1 = a0 ist und 00 = 1, ist der Induktionsanfang also korrekt.
14
Vorkurs UZH
Induktionsannahme: Wir nehmen an, dass für ein beliebiges, aber fest gewähltes n gilt
n n 0
n n−1 1
n n−2 2
n 0 n
n
(a + b) =
a b +
a b +
a b + ··· +
ab .
0
1
2
n
Induktionsschluss: Multiplizieren wir die Gleichung aus der Induktionsannahme mit a + b,
so erhalten wir
n n 0
n n−1 1
n n−2 2
n 0 n
n+1
(a + b)
= (a + b) ·
a b +
a b +
a b + ··· +
ab
0
1
2
n
n n+1 0
n n 1
n n−1 2
n 1 n
=
a b +
a b +
a b + ··· +
ab
0
1
2
n
n n−1 2
n n−2 3
n 0 n+1
n n 1
+
a b +
a b +
a b + ··· +
ab .
0
1
2
n
Wenn wir nun die Koeffizienten von ai bj zusammenfassen, erhalten wir
n n+1 0
n
n
n
n
n+1
n 1
(a + b)
=
a b +
+
a b +
+
an−1 b2
0
0
1
1
2
n
n
n 0 n+1
1 n
+ ··· +
+
ab +
ab .
n−1
n
n
n
n+1
Nun ist n0 = 1 = n+1
und
=
1
=
. Damit wir die zu zeigende Gleichung für
0
n n+1 n+1
n
n
n + 1 erhalten, müssen wir noch k + k+1 = k+1 für 0 ≤ k < n zeigen: damit wäre der
Induktionsschritt abgeschlossen.
Dazu verwenden wir Definition 1.9:
n
n
n!
n!
+
=
+
k
k+1
k! · (n − k)! (k + 1)! · (n − k − 1)!
n! · (k + 1) + n! · (n − k)
=
(k + 1)! · (n − k)!
n! · (n + 1)
(n + 1)!
n+1
=
=
=
(k + 1)! · (n − k)!
(k + 1)! · (n − k)!
k+1
Anwendung: Interpolationspolynom
Betrachten wir nochmals das Differenzen-Schema (5):
y0
∆y0
∆2 y0
y1
∆3 y0
∆y1
∆2 y1
y2
∆3 y1
∆y2
2
y3
∆4 y0
∆ y2
∆y3
y4
15
Vorkurs UZH
Wir ersetzen nun die Ausdrücke ∆i yj durch ihre Definition:
y0
y1 − y0
y2 − 2y1 + y0
y1
y2 − y1
y3 − 3y2 + 3y1 − y0
y3 − 2y2 + y1
y2
y4 − 4y3 + 6y2 − 4y1 + y0
y3 − y2
y4 − 3y3 + 3y2 − y1
y4 − 2y3 + y2
y3
y4 − y3
y4
Wir wollen nun alle Einträge in dem Schema mit Hilfe von ∆i y0 ausdrücken. Jeder Term ist die
Differenz der zwei links davon stehenden Terme. Somit ist jeder Term die Summe des darüber
stehenden Terms mit dem rechts darüber stehenden Term, und wir können das Schema auch
wie folgt aufschreiben:
y0
∆y0
∆ 2 y0
y0 + ∆y0
∆y0 + ∆2 y0
y0 + 2∆y0 +
∆2 y
∆ 3 y0
∆2 y
0
∆y0 +
2∆2 y0
+
0
+
∆3 y
y0 + 3∆y0 + 3∆2 y0 + ∆3 y0
∆ 4 y0
0
∆3 y0
∆3 y
0
+
∆4 y
0
∆2 y0 + 2∆3 y0 + ∆4 y0
∆y0 + 3∆2 y0 + 3∆3 y0 + ∆4 y0
y0 + 4∆y0 + 6∆2 y0 + 4∆3 y0 + ∆4 y0
Das Pascalsche Dreieck erscheint erneut. Zusammen mit der Definition 1.9 der Binomialkoeffizienten erhalten wir
m(m − 1)
m(m − 1)(m − 2)
m
· ∆y0 +
· ∆2 y0 +
· ∆3 y0
1
2!
3!
m(m − 1) · · · (m − (m − 1))
+ ··· +
· ∆m y0
m!
ym = y0 +
für m ∈ {1, . . . , n}. Dies liefert die Aussage von Theorem 1.3:
Beweis (Theorem 1.3). Wenn i > m ist, dann gilt m(m−1)···(m−i+1)
= 0, da im Produkt im
i!
Zähler der Faktor m − m = 0 vorkommt. Deswegen gilt auch
m
m(m − 1)
m(m − 1)(m − 2)
· ∆y0 +
· ∆2 y0 +
· ∆3 y0 + · · ·
1
2!
3!
m(m − 1) · · · (m − (m − 1))
m(m − 1) · · · (m − (n − 1))
+
· ∆m y0 + · · · +
· ∆n y0 ,
m!
n!
ym = y0 +
was gleich dem Polynom aus Theorem 1.3 ausgewertet in x = m ist. Damit nimmt das
Polynom aus Theorem 1.3 für x = m den Wert ym an, 0 ≤ m ≤ n.
16
Vorkurs UZH
1.3.3
Negative Exponenten
Wir starten mit
(a + b)−1 =
1
.
a+b
Nehmen wir an, dass |b| < |a|, dann können wir a1 als eine erste Annäherung an diesen Bruch
auffassen. Nun versuchen wir, diese Annäherung zu verbessern indem wir eine unbekannte
Grösse δ dazu addieren,
1
1
= +δ
a+b
a
=⇒
1=1+
b
+ aδ + bδ.
a
Da |b| < |a| gilt, vernachlässigen wir den Term bδ und erhalten δ = − ab2 . Wir wiederholen
diesen Prozess mehrmals (oder, um genauer zu sein, wir benutzen vollständige Induktion) und
erhalten
b
1
b2
b3
(a + b)−1 = − 2 + 3 − 4 + · · · ,
(8)
a a
a
a
was der Aussage von Theorem 1.8 für n = −1 entsprechen würde. Dieses Mal hingegen ist die
Reihe unendlich! Multiplizieren wir (8) mit a und setzen x = ab , dann erhalten wir für |x| < 1
1
= 1 − x + x 2 − x3 + x4 − x5 + · · · .
1+x
1.3.4
(9)
Rationale Exponenten
√
1
2 =
Nun
betrachten
wir
(a
+
b)
a + b. Wir nehmen erneut an, dass |b| klein ist, so dass
√
√
a + b ≈ a, und suchen ein δ, so dass
√
√
a+b= a+δ
eine bessere Approximation ist. Quadrieren ergibt
√
√
a + b = ( a + δ)2 = a + 2 aδ + δ 2 .
Da δ klein ist, können wir δ 2 vernachlässigen und erhalten δ =
|b| |a| (das heisst |b| viel, viel kleiner als |a|)
√
a+b≈
b
√
.
2 a
Somit erhalten wir für
√
b
a+ √ .
2 a
Für den nächsten Schritt betrachten wir
√
a+b=
und erhalten
a+b=a+b+
√
b
a+ √ +δ
2 a
√
b2
bδ
+ 2 aδ + √ + δ 2 ,
4a
a
wobei wir die zwei letzten Terme vernachlässigen können, da |b| und δ klein sind und somit ist
√
a+b≈
√
b
b2
√
√
a+
−
.
2 a 8 a3
17
Vorkurs UZH
3
N=5
N=3
N=1
(1+x)1/2
2
1
N=2
N=4
-4
-3
-2
-1
0
0
1
2
3
4
5
6
7
N=6
-1
1
Abbildung 2: Die Reihe für (1 + x) 2 = 1 + 12 · x − 18 · x2 +
xN für verschiedene Werte von N .
1
16
· x3 −
5
128
· x4 + · · · bis zur Potenz
Dies können wir nun induktiv fortsetzen. Wenn wir die Gleichung durch
x := ab setzen, erhalten wir schliesslich (Newton 1665)
√
a dividieren und
1
1
1
1
5 4
x + ··· .
(1 + x) 2 = 1 + x − x2 + x3 −
2
8
16
128
Siehe Abbildung 2. Wir erhalten die Aussage aus Theorem 1.8 für n = 21 .
Tatsächlich lässt sich die Aussage aus Theorem 1.8 für beliebige rationale Exponenten verallgemeinern:
Theorem 1.10 (Verallgemeinertes Binomialtheorem von Newton). Für jede rationale Zahl a und für |x| < 1 gilt
(1 + x)a = 1 +
a(a − 1) 2 a(a − 1)(a − 2) 3
a
·x+
·x +
· x + ··· .
1
1·2
1·2·3
Sogar Newton selbst hat dieses Interpolationsargument als gefährlich eingestuft. Euler hingegen
erwähnt in seinem Buch Introductio (1748, § 71) das verallgemeinerte Theorem ohne weiteren
Beweis oder Kommentar. Erst über hundert Jahre später (1826) fand N. H. Abel, dass es
notwendig sei, einen genauen Beweis aufzuschreiben. Wir werden hier aber darauf verzichten.
18
Vorkurs UZH
1.4
Exponentialfunktion
Wir berechnen mit Hilfe von Theorem 1.10 den Ausdruck 1 +
1 N
:
N
N
1
N
N (N − 1) 1
N (N − 1)(N − 2) 1
1+
= 1+
+
· 2+
· 3 + ···
N
N
1·2
N
1·2·3
N
2
1
1
1(1 − N ) 1(1 − N )(1 − N )
= 1+1+
+
+ ···
1·2
1·2·3
Euler behauptete 1748 in seinem Buch Introductio, dass «falls N eine Zahl grösser als jede
zuweisbare Zahl ist, dann ist 1 − N1 gleich 1». Somit folgt, dass wenn N gegen unendlich läuft,
dann läuft (1 + N1 )N gegen die sogenannte Eulersche Zahl
e := 1 + 1 +
1
1
1
+
+
+ ··· .
1·2 1·2·3 1·2·3·4
Dieses Argument ist höchst gefährlich, da es unendlich oft angewandt wird. Zum Beispiel könnte
mit demselben Argument bewiesen werden, dass
1=
1 1
1 1 1
1
1
1
+ = + + =
+
+ ··· +
= 0 + 0 + · · · + 0 = 0.
2 2
3 3 3
N
N
N
In diesem speziellen Fall ist die Aussage jedoch wahr, wir werden diese Woche jedoch auf den
Beweis verzichten.
Wir wenden uns nun einem etwas allgemeineren Fall zu. Erneut benutzen wir Theorem 1.10
um
x N
x2
x3
x4
1+
→1+x+
+
+
+ ...
N
1·2 1·2·3 1·2·3·4
zu erhalten (auch hier benötigen wir noch einmal die gefährliche Aussage, und auch in diesem
Fall ist sie wahr). Hier ist x eine beliebige aber feste rationale Zahl. Setzen wir nun M = Nx
und lassen M gegen unendlich laufen, so erhalten wir
M x
M !x
x N
1
1
1+
= 1+
=
1+
→ ex .
N
M
M
Theorem 1.11 (Euler 1748). Falls N gegen unendlich läuft, dann gilt
x N
x2 x3 x 4
1+
→ ex = 1 + x +
+
+
+ ··· .
N
2!
3!
4!
19
Vorkurs UZH
1.5
Logarithmen und Flächen
Tabularum autem logarithmicarum amplissimus est usus ...
(L. Euler 1748, Introductio)
Der Begriff Logarithmus wird von den Schülern im allgemeinen nur sehr schwer verstanden.
(B.L. van der Waerden 1957)
1.5.1
Logarithmen
M. Stifel (1544) betrachtete folgende zwei Reihen:
···
···
−3 −2 −1 0 1 2
1
1
1
1 2 4
8
4
2
3 4 5 6
7
8
8 16 32 64 128 256
···
···
Wenn wir von der unteren Zeile zur oberen Zeile wechseln, so werden Produkte in Summen
verwandelt. Zum Beispiel können wir statt 8 mal 32 (in der unteren Zeile) die Summe der
entsprechenden Zahlen (in der oberen Zeile), das heisst 3 plus 5, berechnen. Das Resultat 8 (in
der oberen Zeile) entspricht der Zahl 256 (in der unteren Zeile), was gerade gleich dem Produkt
8 · 32 ist.
Solche (etwas detailliertere) Tabellen waren früher äusserst nützlich, um Zahlen zu multiplizieren, da es viel einfacher ist, Zahlen zu addieren statt zu multiplizieren. Solche «Logarithmus»–
Tabellen wurden zuerst von J. Napier (1614), H. Briggs (1624) und J. Bürgi (1620) berechnet.
Logarithmus besteht aus den Wörtern λóγoζ (lógos) und ὰριθµóζ (arithmós), was auf altgriechisch «Beziehung» und «Zahl» bedeutet. Der Logarithmus beschreibt also eine Beziehung
zwischen Zahlen.
Definition 1.12. Eine für positive Werte von x definierte Funktion `(x) heisst logarithmische
Funktion, falls für alle x, y > 0 gilt
`(x · y) = `(x) + `(y).
Setzen wir y =
z
x
(10)
(respektive x = y = 1) in (10) ein, so erhalten wir
z `
= `(z) − `(x),
respektive `(1) = 0.
x
Weiter gilt für x · y · z = (x · y) · z
`(x · y · z) = `(x) + `(y) + `(z).
√ √ √
√
Wenden wir dies auf 3 x · 3 x · 3 x = x an, erhalten wir `( 3 x) = 31 `(x), respektive allgemein
m
m
` xn =
· `(x).
n
(11)
Nehmen wir nun an, dass eine logarithmische Funktion `(x) gegeben ist und dass eine Zahl a
existiert, so dass `(a) = 1 ist. Dann folgt aus (11), dass
m
m
` an = ,
n
20
Vorkurs UZH
das heisst die logarithmische Funktion `(x) ist die Umkehrfunktion der Exponentialfunktion
f (x) = ax . Wir nennen dies den Logarithmus zur Basis a und schreiben
y = loga x
falls
x = ay .
Logarithmen zur Basis 10 sind praktisch für numerische Berechnungen, da das Verschieben des
Dezimalkommas einfach eine ganze Zahl zum Logarithmus dazuaddiert. In der Theorie ist aber
die Eulersche Zahl e als Basis vorzuziehen.
1.5.2
Berechnung von Flächen
Die Bestimmung von Flächen und Volumen war schon seit der griechischen Antike von grossem
Interesse für Mathematikerinnen und Mathematiker. Archimedes hat bereits 283–212 v. u. Z.
die Fläche vom Kreis berechnet. Anfangs des 17. Jahrhundert konnten Bonaventura Cavaliere,
Roberval und Fermat die Fläche unter der Kurve y = xa bestimmen.
Problem 1.13. Sei a gegeben. Bestimme die Fläche F unter der Kurve y = xa zwischen x = 0
und x = B.
Lösung für a > −1 (Fermat 1636): Wir wählen für θ < 1 einen Wert nahe bei 1 und
betrachten die Rechtecke gegeben durch die geometrische Reihe B, θB, θ2 B, θ3 B, . . . mit den
Höhen B a , θa B a , θ2a B a , . . . (siehe Abbildung 3). Nun kann die gewünschte Fläche durch die
geometrische Reihe approximiert werden:
1. Rechteck + 2. Rechteck + 3. Rechteck + · · · =
= B(1 − θ)B a + B(θ − θ2 )θa B a + B(θ2 − θ3 )θ2a B a + · · ·
= B a+1 · (1 − θ)(1 + θa+1 + θ2a+2 + · · · )
1−θ
vgl. (9) auf a+1
,
=B
·
Seite 17
1 − θa+1
(12)
(13)
(14)
(15)
falls a + 1 > 0 respektive a > −1. Setzen wir nun θ = 1 − ε, wobei ε ganz klein sei. Dann folgt
aus Theorem 1.10, dass θa+1 = (1 − ε)a+1 = 1 − (a + 1)ε + (. . .)ε2 , wobei «(. . .)» vom Betrag
her beschränkt ist, solange ε ebenfalls beschränkt ist. Somit gilt
ε
1
1
1−θ
=
=
→
a+1
2
1−θ
(a + 1)ε + (. . .)ε
a + 1 + (. . .)ε
a+1
für ε → 0.
y = xa
Ba
ΘaBa
Θ2aBa
Θ3aBa
Θ4aBa
Θ 4B
Θ 3B
Θ2B
ΘB
B
Abbildung 3: Die Fläche unter der Kurve xa mit a = 13 .
21
Vorkurs UZH
Die Summe dieser Rechtecke approximiert (für a > −1) die gewünschte Fläche F von oben.
Ersetzen wir die Höhen der Rechtecke durch θa B a , θ2a B a , θ3a B a , . . ., erhalten wir eine Approximation von F von unten. In diesem zweiten Fall wird der Wert von (12) mit θa multipliziert,
welches für θ → 1 gegen 1 konvergiert. Somit müssen beide Approximationen gegen den gleichen
Wert konvergieren und es folgt folgendes Theorem:
Theorem 1.14 (Fermat 1636). Sei a > −1. Die Fläche unter der Kurve y = xa begrenzt
durch x = 0 und x = B ist gegeben durch
F =
B a+1
.
a+1
Wir wollen nun die Fläche unter einer Hyperbel y = x1 = x−1 berechnen. Fermats Methode kann hier nicht angewandt werden. In der Tat erhalten wir aus der geometrischen Reihe
B, θB, θ2 B, θ3 B, . . . für die Summe der Rechtecke den Wert
(1 − θ)(1 + 1 + 1 + · · · ),
deren partiellen Summen eine arithmetische Reihe bilden. Dies motiviert aber die folgende
Entdeckung von Gregory of St. Vincent (1547) und Alfons Anton de Sarasa (1649): Die Fläche
unter der Hyperbel y = x1 ist ein Logarithmus.
2
2
y = 1/x
y = 1/x
1
0
1
0
1
2
0
0
1
2
3
4
5
6
Abbildung 4: Die Fläche(1 → 2) und die Fläche(3 → 6) sind gleich gross.
Durch Zusammenstauchen der x-Achse und Dehnen der y-Achse mit jeweils dem Faktor 3
können wir sehen, dass
Fläche(3 → 6) = Fläche(1 → 2)
ist; siehe Abbildung 4. Somit gilt
Fläche(1 → 3) + Fläche(1 → 2) = Fläche(1 → 6).
Dies bedeutet, dass die Funktion ln(a) = Fläche(1 → a) folgende Identität erfüllt:
ln(a) + ln(b) = ln(a · b)
und somit ein Logarithmus (der natürliche Logarithmus) ist.
Theorem 1.15. Der natürliche Logarithmus ln(x) ist der Logarithmus zur Basis e.
22
Vorkurs UZH
2
Unendliche Folgen und reelle Zahlen
... bis jetzt wurden diese Behauptungen Axiome genannt.
(C. Méray 1869)
2.1
Grenzwerte
Nach Eulers Tod 1783 stagnierte die Mathematik. Euler hatte alles gelöst: Er behandelte Infinitesimalrechnung und Differenzialrechnung (1748/1755), berechnete lösbare Integrale und
Differenzialgleichungen (1768/1769), und lüftete die Geheimnisse von Flüssigkeiten (1755), der
Mechanik (1736/1788), der Variationsrechnung (1744) sowie der Algebra (1770). Es schien, als
blieb nur noch übrig, die 30’000 Seiten Eulers zu lesen und zu verstehen.
Die «Theorie der Funktionalanalysis» von J.-L. Lagrange (1797), die Thesis von Gauss (1799)
über das «Fundamentaltheorem der Algebra» und seine Abhandlungen über die Konvergenz von
hypergeometrischen Reihen (Gauss, 1812) markierten den Beginn einer neuen Ära. Bolzano bemerkte, dass in Gauss’ erstem Beweis jegliche Rigorosität fehlt. 1817 gab er einen «vollkommen
analytischen Beweis des Theorems, dass zwischen zwei Werten mit unterschiedlichen Vorzeichen, immer mindestens eine Wurzel der Gleichung existiert». Schliesslich etablierte Cauchy
1821 in seinem berühmten Buch «Cours d’Analyse» neue Anforderungen an die Rigorosität.
Die Fragen lauteten wie folgt:
Was ist...
• ... eine Ableitung wirklich? Antwort: ein Grenzwert!
• ... ein Integral wirklich? Antwort: ein Grenzwert!
• ... eine unendliche Summe a1 + a2 + a3 + · · · wirklich? Antwort: Ein Grenzwert!
• ... ein Grenzwert wirklich? Antwort: eine Zahl!
• ... eine Zahl wirklich?
Angenommen, es sei für jede positive ganze Zahl n eine Zahl sn gegeben. Dann sprechen wir
von einer (unendlichen) Folge und schreiben
{sn } = {s1 , s2 , s3 , s4 , . . .}.
Zum Beispiel ist
{1, 2, 3, 4, 5, 6, . . .}
eine arithmetische Folge (das heisst die Differenz von zwei aufeinander folgenden Folgenglieder
ist konstant) und
{q 0 , q 1 , q 2 , q 3 , q 4 , . . .}
für q 6= 0 eine geometrische Folge (das heisst, der Quotient von zwei aufeinander folgenden
Folgenglieder ist konstant).
Was bedeutet nun «eine Folge {sn } hat den Grenzwert s», oder mit anderen Worten «eine Folge
{sn } konvergiert gegen s»?
23
Vorkurs UZH
Definition 2.1 (D’Alembert 1765, Cauchy 1821). Eine Folge {sn } konvergiert, falls eine Zahl s existiert, so dass
∀ ε > 0 ∃ N ≥ 1,
so dass ∀ n ≥ N gilt:
|sn − s| < ε.
Die Zahl s wird Grenzwert von {sn } genannt, und wir schreiben limn→∞ sn = s oder auch
sn → s. Man sagt auch, dass {sn } gegen s konvergiert. Eine nicht konvergente Folge wird
schliesslich divergent genannt.
Bemerkung 2.2. In Worten lautet die Definition: Eine Folge {sn } konvergiert gegen s, falls
es für jedes ε > 0 ein N ≥ 1 gibt, so dass für alle n ≥ N gilt |sn − s| < ε.
Nun benötigen wir die Dreiecks-Ungleichung.
Lemma 2.3 (Dreiecks-Ungleichung). Für zwei beliebige Zahlen u und v gilt
|u + v| ≤ |u| + |v| und |u| − |v| ≤ |u − v|.
(Siehe Übungen für einen Beweis.)
Theorem 2.4. Eine Folge {sn }, welche konvergiert, ist beschränkt, das heisst
∃ B,
so dass ∀ n ≥ 1 gilt: |sn | ≤ B.
Die Umkehrung gilt nicht: Die Folge
{sn } = {1, 0, 1, 0, 1, 0, . . .}
ist beschränkt (wähle B = 1) aber nicht konvergent.
Wir betrachten nun das Konvergenzverhalten der geometrischen Folge.
Lemma 2.5. Für die geometrische Folge {1, q,


0
n
lim q = 1
n→∞


∞
q 2 , q 3 , . . .} gilt
für |q| < 1,
für q = 1,
für q > 1.
Die Folge divergiert für q ≤ −1.
Theorem 2.6. Seien sn → s und vn → v zwei konvergente Folgen. Dann konvergieren die
Summe, das Produkt und der Quotient der beiden Folgen und es gilt
lim (sn + vn ) = s + v
n→∞
lim (sn · vn ) = s · v
s s
n
lim
=
, falls vn 6= 0 für alle n und v 6= 0.
n→∞ vn
v
n→∞
24
Vorkurs UZH
2.2
Cauchy-Folgen
Die Konvergenz von Definition 2.1 hat einen gravierenden Nachteil: Um |sn − s| zu berechnen,
muss der Grenzwert s bekannt sein. Aber was tun wir, wenn s nicht bekannt ist? Um dieses
Hindernis zu umgehen, hatte Cauchy die Idee, statt |s − sn | < ε den Term |sn − sn+k | < ε für
alle Nachfolger sn+k von sn zu betrachten.
Definition 2.7. Eine Folge {sn } heisst Cauchy-Folge, falls
∀ ε > 0 ∃ N ≥ 1,
so dass ∀ n ≥ N und ∀ k ≥ 1 gilt:
|sn − sn+k | < ε.
Mit der Dreiecks-Ungleichung (Lemma 2.3) erhalten wir
|sn − sn+k | ≤ |sn − s| + |s − sn+k | < 2ε,
woraus folgt, dass eine konvergente Folge eine Cauchy-Folge sein muss.
Es gilt aber auch die umgekehrte Behauptung:
Theorem 2.8 (Cauchy 1821). Eine Folge {sn } von reelle Zahlen konvergiert zu einem reellen Grenzwert genau dann, wenn sie eine Cauchy-Folge ist.
Ein gründlicher Beweis dieses Theorems wird erst möglich sein, nachdem wir etwas mehr über
das Konzept der irrationalen und reellen Zahlen erfahren haben.
Zum Beispiel ist dieses Theorem falsch für rationale Zahlen! Betrachten wir die Folge
{1, 1.4, 1.41, 1.414, 1.4142, 1.41421, . . .}
−n+1
so ist dies
gilt), aber die Folge konvergiert
√ tatsächlich eine Cauchy-Folge (da |sn −sn+k | < 10
gegen 2, welches keine rationale Zahl ist.
25
Vorkurs UZH
2.3
Konstruktion der reellen Zahlen
Bitte vergessen Sie alles, was sie bis anhin in der Schule gelernt haben; denn Sie haben es nicht gelernt. ... Meine Tochter studiert seit einigen Jahren Chemie und denkt, sie hätte
Differential- und Integralrechnung in der Schule erlernt, aber
weiss selbst heute noch nicht, wieso x · y = y · x wahr ist.
(E. Landau 1930)
√
3 ist also nur ein Symbol für eine Zahl, welche zuerst noch
gefunden werden muss, aber es ist keine Definition. Die Definition hingegen ist befriedigend gegeben durch meine Methode, nämlich
(1.7, 1.73, 1.732, . . .)
(G. Cantor 1889)
... die Definition von irrationalen Zahlen, auf welche geometrische Darstellungen oft einen verwirrenden Einfluss hatte.
... Ich nehme in meiner Definition einen rein formalen Standpunkt ein, in dem einige gegebene Symbole Zahlen genannt
werden, so dass die Existenz dieser Zahlen von jedem Zweifel
erhaben sind.
(E. Heine 1872)
Erniedrigt die Analysis zu einem reinen Spiel mit Symbolen...
(P. du Bois-Reymond, 1882)
Während vielen Jahrhunderten war es niemandem so richtig klar, wie irrationale Zahlen mathematisch rigoros definiert werden sollten. Schliesslich haben viele Mathematiker (G. Cantor,
E. Heine, C. Méray, R. Dedekind) dieses Problem unabhängig voneinander gelöst. Eine der
einfachsten Lösungen ist die Folgende: jeder Cauchy-Folge von rationalen Zahlen sn wird eine
reelle Zahl zugeordnet. Das heisst, die Cauchy-Folge selbst definiert die reelle Zahl.
Es scheint, dass uns diese Definition einen eleganten Beweis für das Theorem 2.8 liefert. Es
bleibt allerdings immer noch viel zu tun: Verschiedene Cauchy-Folgen können die selbe reelle
Zahl repräsentieren und wir müssen algebraische Relationen für diese neuen Objekte definieren.
Schliesslich müssen wir auch noch Theorem 2.8 wirklich beweisen, denn die Terme sn können
nun auch selbst reelle Zahlen sein (das heisst rationale Cauchy-Folgen).
2.3.1
Äquivalenzrelation
Angenommen
√
√2 ist der Folge {1.4, 1.41, 1.414, . . .}
3 ist der Folge {1.7, 1.73, 1.732, . . .}
√ √
dann muss 2 · 3 der Folge der Produkte
zugeordnet, und
zugeordnet.
{2.38, 2.4393, 2.449048, . . .}
26
Vorkurs UZH
zugeordnet sein. Andererseits ist
√
6 auch der Folge
{2.4, 2.44, 2.449, . . .}
zugeordnet. Somit müssen wir diese zwei Folgen miteinander identifizieren.
Definition 2.9. Zwei rationale Cauchy-Folgen {sn } und {vn } heissen äquivalent, falls
lim (sn − vn ) = 0,
n→∞
das heisst
∀ ε > 0 ∃ N ≥ 1,
so dass ∀ n > N gilt: |sn − vn | < ε.
(16)
Ist dies der Fall, so schreiben wir {sn } ∼ {vn }.
Die Bedingung (16) definiert eine Äquivalenzrelation auf der Menge der rationalen CauchyFolgen. Das heisst, dass ∼ die folgenden drei Eigenschaften für alle Cauchy-Folgen {sn }, {vn }
und {wn } erfüllt:
{sn } ∼ {sn }
{sn } ∼ {vn } =⇒ {vn } ∼ {sn }
{sn } ∼ {vn } ∧ {vn } ∼ {wn } =⇒ {sn } ∼ {wn }
(∼ ist reflexiv),
(∼ ist symmetrisch),
(∼ ist transitiv).
(Für einen Beweis, siehe Übungen.)
Somit können wir die Menge der rationalen Cauchy-Folgen in Äquivalenzklassen unterteilen:
o
n
{sn } = {vn } {vn } ist eine rationale Cauchy-Folge und {vn } ∼ {sn } .
Ein Element einer Äquivalenzklasse wird auch Repräsentant von dieser genannt.
Definition 2.10. Die reellen Zahlen sind Äquivalenzklassen von rationalen Cauchy-Folgen,
das heisst
n
o
R = {sn } {sn } ist eine rationale Cauchy-Folge .
Die rationalen Zahlen Q können als Teilmenge der reellen Zahlen R betrachtet werden, indem ein
Element r ∈ Q als die Äquivalenzklasse {r, r, r, . . .} der konstanten Folge {r, r, r, . . .} betrachtet
wird.
2.3.2
Addition und Multiplikation
Damit wir mit den reellen Zahlen R rechnen können, müssen wir die üblichen Verknüpfungen
definieren.
Definition 2.11. Es seien s = {sn } und v = {vn } zwei reelle Zahlen. Wir definieren die
Summe (und die Differenz) sowie das Produkt (und den Quotienten) durch
s + v := {sn + vn },
und
27
s · v := {sn · vn }.
Vorkurs UZH
Diese Definition müssen wir mit Vorsicht geniessen:
• Sind {sn + vn } sowie {sn · vn } überhaupt Cauchy-Folgen?
• Sind s + v und s · v unabhängig von den Repräsentanten, mit denen sie definiert sind?
Das heisst, gilt auch s + v = {s0n + vn0 } und s · v = {s0n · vn0 } für andere Repräsentanten
{s0n } und {vn0 } von s und v?
• Gelten die bekannten Regeln für reelle Zahlen (Kommutativität, Assoziativität und Distributivität) überhaupt?
Bei den ersten beiden Punkten spricht man von der Wohldefiniertheit der Definition: dies bedeutet, dass das, was in der Definition beschrieben ist, auch tatsächlich genau ein Objekt liefert
(und nicht je nach Wahl der Repräsentanten ein anderes Objekt, oder vielleicht auch gar kein
Objekt wenn zum Beispiel {sn + vn } keine Cauchy-Folge ist).
2.3.3
Ordnungsrelation und absoluter Betrag
Es seien s = {sn } und v = {vn } zwei reelle Zahlen.
Definition 2.12.
s < v :⇐⇒ ∃ ε0 ∈ Q mit ε0 > 0 und ∃ M ≥ 1, so dass ∀ m ≥ M gilt: sm ≤ vm − ε0 .
s ≤ v :⇐⇒ s < v oder s = v.
Bemerkung 2.13. Damit die Definition sinnvoll ist, muss die Zahl ε0 rational sein. Schliesslich
wird hier erst definiert, was v > 0 für eine reelle Zahl v bedeutet.
Die etwas komplizierte Definition von s < v bedeutet folgendes: Für ein genügend grosses m müssen die Elemente sm und vm genügend weit auseinander liegen. Es würde nicht
reichen, nur sm < vm für alle m zu verlangen, da dies zum Beispiel von {0, 0, 0, . . .} und
{1, 0.1, 0.01, 0.001, . . .} erfüllt wäre, diese aber dieselbe reelle Zahl repräsentieren.
Die Relation s ≤ v definiert eine Ordnungsrelation. Dies bedeutet, dass ≤ für alle s, v, w ∈ R
die folgenden Bedingungen erfüllt:
s≤s
(reflexiv)
s ≤ v, v ≤ w =⇒ s ≤ w (transitiv)
s ≤ v, v ≤ s =⇒ s = v (antisymmetrisch).
(Für einen Beweis, siehe Übungen.)
Lemma 2.14. Die Ordnungsrelation ≤ ist eine totale Ordnungsrelation, das heisst für zwei
gegebene reelle Zahlen s und v mit s 6= v gilt entweder s < v oder v < s.
Definition 2.15. Der absolute Betrag einer reellen Zahl s ist definiert durch
(
s
falls s ≥ 0,
|s| :=
−s falls s < 0.
28
Vorkurs UZH
2.4
Unendliche Reihen
Ich werde all meine Kraft hingeben um etwas Licht in die
immense Dunkelheit zu bringen, welche heutzutage in der
Analysis regiert. Es fehlt an jeglichem Plan oder System, so
dass man wirklich sehr erstaunt sein muss, dass so viele Leute
sich ihr [der Analysis] hingeben – und, noch schlimmer, die
Genauigkeit fehlt vollends.
(N. H. Abel 1826, Oeuvres, vol. 2, p. 263)
Cauchy ist vollkommen verrückt und es ist absolut unmöglich mit ihm gut Freund zu sein, obwohl er im Moment der
einzige Mensch ist, welcher weiss, wie man mit der Mathematik umgehen soll. Was er macht ist grossartig, aber sehr
konfus und verworren...
(N. H. Abel 1826, Oeuvres, vol. 2, p. 259)
Seit Newton und Leibniz sind unendliche Reihen, das heisst Ausdrücke der Form
a0 + a1 + a2 + a3 + a4 + · · · ,
eins der wichtigsten Werkzeuge für Berechnungen. Wir wollen nun präzise beschreiben, was wir
unter unendlichen Reihen und deren Konvergenz verstehen. Die Idee ist, die Folge {sn } von
endlichen Teilsummen der Reihe
s 0 = a0 ,
s1 = a0 + a1 ,
s2 = a0 + a1 + a2 ,
...
zu betrachten.
Definition 2.16. Eine unendliche Reihe
∞
P
ai konvergiert, falls die Folge {sn } =
i=0
nP
n
ai
o
i=0
konvergiert. Wir schreiben
∞
X
i=0
ai := lim sn
n→∞
oder
X
i≥0
ai := lim sn .
n→∞
Beispiel 2.17. Wir betrachten die geometrische Reihe 1+q +q 2 +q 3 +· · · . Die n-te Teilsumme
ist sn = 1 + q + q 2 + · · · + q n . Multiplizieren wir diese mit (1 − q), streichen sich die meisten
Terme weg und wir erhalten
(1 − q)(1 + q + q 2 + · · · + q n )
1 − q n+1
sn =
=
.
1−q
1−q
Nun wenden wir Lemma 2.5 und Theorem 2.6 an und erhalten
(
1
falls |q| < 1,
1 + q + q 2 + q 3 + · · · = 1−q
divergiert sonst.
29
Vorkurs UZH
2.4.1
Konvergenzkriterien
Normalerweise ist es nicht möglich, einen einfachen Ausdruck für sn zu finden und es ist
schwierig, den expliziten Grenzwert von {sn } zu berechnen. Aber wir können das Kriterium
von Cauchy aus Theorem 2.8 auf die Folge der Teilsummen anzuwenden. Da sn+k − sn =
an+1 + an+2 + · · · + an+k gilt, erhalten wir folgendes Lemma:
Lemma 2.18. Eine unendliche Reihe a0 + a1 + a2 + · · · konvergiert gegen eine reelle Zahl
genau dann, wenn
∀ ε > 0 ∃ N ≥ 0, so dass ∀ n ≥ N und ∀ k ≥ 1 gilt: |an+1 + an+2 + · · · + an+k | < ε.
Setzen wir in diesem Lemma k = 1, so erhalten wir
lim ai = 0.
i→∞
Dies ist also ein notwendiges Kriterium für die Konvergenz. Aber es ist kein hinreichendes
Kriterium. Zum Beispiel divergiert die folgende Reihe:
1+
1 1 1 1 1 1 1 1 1 1
+ + + + + + + + + + · · · → ∞.
2 2 3 3 3 4 4 4 4 5
Wir werden nun eine hinreichende Bedingung für Konvergenz betrachten.
Eine unendliche Reihe, in welcher die Terme alternierende Vorzeichen haben,
X
a0 − a1 + a2 − a3 + a4 − · · · =
(−1)i ai ,
i≥0
wird alternierende Reihe genannt.
Theorem 2.19 (Leibniz 1682). Angenommen, die Terme ai einer alternierenden Reihe erfüllen folgende Bedingungen:
ai+1 ≤ ai ,
ai > 0,
lim ai = 0;
i→∞
dann konvergiert die Reihe gegen eine reelle Zahl s. Weiter gilt
|s − sn | ≤ an+1 .
Beispiel 2.20. Die alternierende Reihe
1 1 1 1
+ − + − ···
2 3 4 5
konvergiert (und zwar gegen ln(2)). Es ist hier wichtig zu bemerken, dass die harmonische Reihe
1−
1+
1 1 1 1
+ + + + ···
2 3 4 5
divergiert! Denn für
X
1 1 1 1 1 1 1 1
1
1
1
bi = 1 + + + + + + + + +
+ ··· +
+
+ ···
2 3 4 5 6 7 8 9 10
16 17
X
1 1 1 1 1 1 1
1
1
1
1
ai = 1 + + + + + + + +
+
+ ··· +
+ + ···
2 |4 {z 4} |8 8 {z 8 8} |16 16 {z
16} 32
1
2
1
2
1
2
30
Vorkurs UZH
gilt
X
bi >
X
ai → ∞.
(17)
Somit muss die harmonische Reihe divergieren.
Bemerkung 2.21. In (17) wird das sogenannte Majoranten-Kriterium benutzt, auf welches
wir hier nicht weiter eingehen wollen. Manchmal wird dieser Fall des allgemeineren MajorantenKriterium (vergleiche Aufgabe 5 auf Blatt 4) auch als Minoraten-Kriterium bezeichnet.
Lemma 2.22. Die Reihe
1
1
1
1
1
+ α + α + α + α + ···
α
1
2
3
4
5
konvergiert für alle α > 1 und divergiert für α ≤ 1.
2.4.2
Absolute Konvergenz
... ein Umstand, welcher von den Mathematikern des vorigen
Jahrhunderts übersehen wurde...
(B. Riemann 1854, Werke, p. 235)
Wir fangen mit einem erstaunlichen Beispiel an.
Beispiel 2.23. Wie wir bereits wissen, konvergiert die alternierende Reihe
1−
1 1 1 1 1
+ − + − ± ··· .
2 3 4 5 6
(18)
Durch Umgruppieren der Terme erhalten wir
1 1 1 1 1 1
1
1
1
1
1
1− − + − − + −
− + −
− + ···
| {z 2} 4 |3 {z 6} 8 |5 {z10} 12 |7 {z14} 16
1
2
und somit
1
6
1
10
1 1 1 1
1
1
− + − +
− ··· =
2 4 6 8 10
2
1
14
1 1 1 1
1 − + − + − ··· ,
2 3 4 5
was der Hälfte des Grenzwertes der ursprünglichen Reihe entspricht. Dies zeigt, dass der Wert
einer unendlichen Summe abhängt von der Reihenfolge der Summation.
Definition 2.24. Eine Reihe
genau einmal in
∞
P
∞
P
a0i ist eine Umordnung von
i=0
∞
P
i=0
ai , falls jeder Term von
∞
P
ai
i=0
a0i auftritt und umgekehrt.
i=0
Eine elegante Erklärung für dieses Phänomen gab B. Riemann 1854. Er bemerkte, dass für
jede beliebige reelle Zahl A eine Umordnung der Reihe (18) existiert, so dass diese gegen A
31
Vorkurs UZH
konvergiert. Der Grund dafür ist, dass die Summe der positiven Terme und die Summe der
negativen Terme von (18), nämlich
1+
1 1 1
+ + + ···
3 5 7
und
−
1 1 1 1
− − − − ··· ,
2 4 6 8
beide divergent sind, respektive dass die harmonische Reihe
1+
1 1 1 1
+ + + + ···
2 3 4 5
divergiert.
Dies motiviert folgende Definition, die von der alternierenden harmonischen Reihe 1 − 21 + 13 −
1
+ · · · nicht erfüllt wird:
4
Definition 2.25. Die Reihe a0 + a1 + a2 + a3 + · · · heisst absolut konvergent falls
|a0 | + |a1 | + |a2 | + |a3 | + · · ·
konvergiert.
Man kann zeigen, dass jede absolut konvergente Reihe bereits konvergiert. Weiterhin kann man
solche Reihen beliebig umordnen, ohne den Grenzwert zu verändern:
Theorem 2.26 (P. G. L. Dirichlet 1837). Falls die Reihe
∞
P
ai absolut konvergiert, dann
i=0
konvergieren alle ihre Umordnungen gegen denselben Grenzwert.
Die Aussage von Riemann zur alternierenden harmonischen Reihe lässt sich auf alle Reihen
ausweiten, die zwar konvergieren, aber nicht absolut konvergieren:
Theorem 2.27 (B. Riemann 1854). Falls die Reihe
∞
P
i=0
ai konvergiert, aber nicht absolut
konvergiert, dann gibt es zu jedem S ∈ R eine Umordnung der Reihe, welche gegen S konvergiert.
32
Vorkurs UZH
3
3.1
Reelle Funktionen und Stetigkeit
Reelle Funktionen
Eine Funktion einer variablen Grösse ist etwas, das auf irgend eine Art aus dieser variablen Grösse und Konstanten
zusammengesetzt ist.
(Joh. Bernoulli 1718, Opera, vol. 2, p. 241)
Falls nun jedem x ein eindeutiges, endliches y zugeordnet
ist, ... dann wird y eine Funktion von x auf diesem Intervall
genannt... . Diese Definition erfordert keine gemeinsame Regel für die verschiedenen Teile der Kurve; man kann sich die
Kurve vorstellen als Zusammensetzung von höchst heterogenen Komponenten oder als gezeichnet, ohne irgendwelchen
Gesetzen zu folgen.
(P. G. L. Dirichlet 1837)
Definition 3.1. Eine Funktion f : A → B besteht einerseits aus zwei Mengen, dem Definitionsbereich A und dem Wertebereich B, und andererseits aus einer Regel, welche jedem x ∈ A
ein eindeutiges Element y ∈ B zuordnet. Diese Zuordnung wird wie folgt aufgeschrieben:
y = f (x)
oder
x 7→ f (x).
Wir nennen y das Bild von x und x ein Urbild von y.
Der Definitions- und der Wertebereich werden in den folgenden Beispielen immer Teilmengen
von R sein. Für Intervalle benutzen wir die folgende Notation:
(a, b)
[a, b]
(a, b]
[a, ∞)
=
=
=
=
{x ∈ R | a < x < b}
{x ∈ R | a ≤ x ≤ b}
{x ∈ R | a < x ≤ b}
{x ∈ R | a ≤ x < ∞}
Wir nennen Intervalle der Form (a, b) offen und Intervall der Form [a, b] abgeschlossen.
33
Vorkurs UZH
Beispiele 3.2.
1. Die Funktion f : [0, 1] → R sei gegeben durch
(
x
falls 0 ≤ x ≤ 12 ,
f (x) =
1 − x falls 12 ≤ x ≤ 1.
(19)
Gewisse y ∈ R haben keine, andere hingegen mehrere Urbilder.
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
2. Nun eine Funktion, welche sowohl als Grenzwert, wie auch durch unterschiedliche Definition auf verschiedenen Intervallen beschrieben werden kann:

π

falls x > 0,
2
f (x) = lim arctan(nx) = 0
(20)
falls x = 0,
n→∞

 π
− 2 falls x < 0.
Wir bilden hier arctan(nx) für n = 1, 2, 4, 8, 16, . . . , 512 sowie n → ∞ ab:
2
1
-1
0
-0.5
0
0.5
1
-1
-2
3. Folgende Funktion (Dirichlet 1829) ist schwierig (unmöglich) aufzuzeichnen:
(
0 falls x irrational,
f (x) =
1 falls x rational.
1
0.8
0.6
0.4
0.2
0
0
0.2
0.4
34
0.6
0.8
1
(21)
Vorkurs UZH
4. Eine Funktion ähnlich wie diejenige von Dirichlet, aber die Peaks werden kleiner für
grössere Nenner von x:
(
0 falls x irrational,
(22)
f (x) = 1
p
falls
x
=
(als
gekürzter
Bruch).
q
q
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
5. Wenn x gegen 0 läuft, so divergiert x1 gegen ∞, und somit oszilliert die folgende Funktion
(Cauchy, 1821) beim Nullpunkt unendlich oft hin und her.
(
falls x 6= 0,
sin x1
(23)
f (x) =
0
falls x = 0.
1.1
-0.5
-0.4
-0.3
-0.2
0
-0.1
0
0.1
0.2
0.3
0.4
0.5
-1.1
6. In folgender Funktion (Weierstrass 1874) ist die Oszillation beim Nullpunkt auf Grund
des Faktors x weniger heftig, doch es sind immer noch unendliche viele Oszillationen.
(
x · sin x1
falls x 6= 0,
f (x) =
(24)
0
falls x = 0.
0.3
0.2
0.1
-0.5
-0.4
-0.3
-0.2
0
-0.1
-0.1
-0.2
-0.3
35
0
0.1
0.2
0.3
0.4
0.5
Vorkurs UZH
7. Die folgende Funktion (Weierstrass 1872) ist definiert via einer unendlichen konvergenten
Summe:
∞
X
sin(n2 x)
f (x) =
.
(25)
n2
n=1
Wir skizzieren hier die Summen
m
P
n=1
sin(n2 x)
n2
für m = 1, 2, 3, 6 und 40.
1.5
m=1
m=2
m=3
m=6
m=40
1
0.5
0
0
0.5
1
1.5
2
2.5
3
Definition 3.3. Seien A und B beliebige Mengen sowie f : A → B eine Funktion. Wir
nennen die Funktion f
• injektiv,
falls
f (x1 ) 6= f (x2 ) für x1 6= x2 ;
•
falls
∀y∈B
falls
injektiv und surjektiv.
surjektiv,
• bijektiv,
∃ x ∈ A, so dass f (x) = y;
Sind A und B Teilmengen von R, so nennen wir die Funktion f
• monoton steigend,
falls f (x1 ) ≤ f (x2 ) für x1 < x2 ;
• streng monoton steigend,
falls
• monoton fallend,
falls f (x1 ) ≥ f (x2 ) für x1 < x2 ;
• streng monoton fallend,
falls f (x1 ) > f (x2 ) für x1 < x2 .
f (x1 ) < f (x2 ) für x1 < x2 ;
Während monotone Funktionen bereits aus der Schule bekannt sind, wollen wir für die anderen
drei Begriffe – injektiv, surjektiv und bijektiv – noch in anderen Worten beschreiben.
Bemerkung 3.4. Sei f : A → B eine Funktion und seien x1 , x2 ∈ A, y1 , y2 ∈ B.
a) Die Funktion f heisst injektiv, wenn aus f (x1 ) = f (x2 ) folgt x1 = x2 .
b) Die Funktion f heisst surjektiv, wenn auf jedes Element aus dem Wertebereich etwas
abgebildet wird.
c) Die Funktion f heisst bijektiv, wenn jedes Element aus dem Definitionsbereich auf genau
ein Element aus dem Wertebereich abgebildet wird.
Beispiele zu diesen Begriffen werden in den Übungen untersucht.
36
Vorkurs UZH
3.2
Stetige Funktionen
Cauchy (1821) hat das Konzept der stetigen Funktion eingeführt. Er nannte eine Funktion
stetig, falls eine unendlich kleine Veränderung von x nur unendlich kleine Veränderungen für y
bewirken. Bolzano (1817) und Weierstrass (1874) waren etwas präziser: Damit eine Funktion f
stetig ist, muss die Differenz f (x) − f (x0 ) beliebig klein sein, falls die Differenz x − x0 genügend
klein ist.
Definition 3.5. Sei A eine Teilmenge von R und x0 ∈ A. Die Funktion f : A → R heisst
stetig in x0 , falls für jedes ε > 0 ein δ > 0 existiert, so dass für alle x ∈ A mit |x − x0 | < δ
gilt, dass |f (x) − f (x0 )| < ε:
∀ ε > 0 ∃ δ > 0,
so dass ∀ x ∈ A mit |x − x0 | < δ gilt: |f (x) − f (x0 )| < ε.
Eine Funktion f (x) heisst stetig, falls sie in allen Punkten x0 ∈ A stetig ist.
Hier ein paar Beispiele:
f (x0 )
ε
ε
f (x0 )
ε
ε
δδ
x0
(a) f (x) stetig in x0 .
f (x0 )
ε
ε
ε
ε
x0
x0
(b) f (x) nicht stetig in x0 .
f (x0 )
x0
(d) f (x) nicht stetig in x0 .
f (x0 )
ε
ε
(c) f (x) nicht stetig in x0 .
f (x0 )
ε
ε
x0
x0
(e) f (x) nicht stetig in x0 .
(f) f (x) nicht stetig in x0 .
Theorem 3.6. Eine Funktion f : A → R ist stetig in x0 ∈ A genau dann, wenn für jede
Folge {xn }n≥1 mit xn ∈ A gilt:
lim f (xn ) = f (x0 ) falls
n→∞
37
lim xn = x0 .
n→∞
Vorkurs UZH
3.3
Uniforme Konvergenz
Das folgende Theorem befindet sich in einer Arbeit von
Herrn Cauchy: «Falls die verschiedenen Terme der Reihe
u0 + u1 + u2 + u3 + · · · alle stetige Funktionen in x sind,...
dann ist die Summe s der Reihe auch eine stetige Funktion
in x.» Aber es scheint mir, dass dieses Theorem Ausnahmen
erlaubt. Zum Beispiel ist die Reihe
sin(x) −
1
1
sin(2x) + sin(3x) + · · ·
2
3
unstetig in jedem Wert (2m + 1)π von x, ...
(N. H. Abel, 1826, Oeuvres, vol. 1, pp. 224–225)
Betrachten wir eine Folge von Funktionen f1 , f2 , f3 , . . . : A → R. Für ein gegebenes x ∈ A ist
f1 (x), f2 (x), f3 (x), . . . eine Folge von Zahlen.
Definition 3.7. Wir sagen, {fn (x)} konvergiert auf A punktweise gegen f (x), falls
lim fn (x) = f (x)
n→∞
existiert für alle x ∈ A.
Cauchy behauptete 1821, dass falls fn punktweise gegen f konvergiert und alle fn stetig sind,
dann ist auch f stetig. Wir geben hier vier Gegenbeispiele zu dieser Behauptung; das erste
Beispiel verdanken wir Abel (1826).
Beispiele 3.8.
1. Es sei
sin(nx)
sin(2x) sin(3x) sin(4x)
+
−
+ ··· ±
.
2
3
4
n
Siehe Abbildung 6 für die ersten 100 Folgenglieder. Es kann gezeigt werden (mit Hilfe von
Fourier-Reihen), dass diese Folge für −π < x < π gegen y = x2 und für π < x < 2π gegen
y = x2 − π konvergiert und fn (π) = 0 für alle n. Somit ist die Grenzfunktion nicht stetig.
fn (x) = sin(x) −
2
n=100
n=10
n=3
n=2
1
0
n=1
0
1
2
3
4
5
6
-1
-2
Abbildung 6: Die Summe
Pn
i=1 (−1)
i+1 sin(ix)
i
38
für n = 1, 2, 3, 10 und 100.
Vorkurs UZH
2.
(
0 falls x < 1,
auf A = [0, 1], und lim fn (x) =
n→∞
1 falls x = 1.
fn (x) = xn
1
n=1
0.5
n=2
n=3
n=4
0
0
n=40
0.5
1
Abbildung 7: Die Funktion xn für n = 1, 2, 3, 4 und 40.
3.


−1 falls |x| < 1,
xn −1
fn (x) = xn +1 , und lim fn (x) = 0
falls x = 1,
n→∞


+1 falls x > 1.
1
0.5
-1
-0.5
0
0
0.5
1
1.5
2
n=1
-0.5
n=2
n=3
n=4
n=100
-1
Abbildung 8: Die Funktion
4.
fn (x) = (1 − x2 )n
xn −1
xn +1
für n = 1, 2, 3, 4 und 100.
(
0 falls x 6= 0,
auf A = [−1, 1], und lim fn (x) =
n→∞
1 falls x = 0.
1
n=1
n=2
0.5
n=3
n=4
n=100
-1
-0.5
0
0
0.5
1
Abbildung 9: Die Funktion (1 − x2 )n für n = 1, 2, 3, 4 und 100.
39
Vorkurs UZH
Die Erklärung für dieses Phänomen gab 1848 Seidel: Betrachten wir Abbildung 7. Je näher x
am Punkt x = 1 gewählt wird, desto langsamer ist die Konvergenz und desto grösser muss
n gewählt werden, um die gewählte Genauigkeit ε zu erreichen. Aus diesem Grund kann eine
Unstetigkeit entstehen. Deswegen müssen wir verlangen, dass für ein gegebenes ε > 0 die
Differenz fn (x) − f (x) kleiner als ε für alle x ∈ A ist, falls n ≥ N .
Definition 3.9 (Weierstrass 1841). Die Folge fn : A → R konvergiert uniform auf A
gegen f : A → R, falls
∀ ε > 0 ∃ N ≥ 1,
so dass ∀ x ∈ A und ∀ n ≥ N gilt:
|fn (x) − f (x)| < ε.
Der einzige Unterschied zwischen der Definition von punktweiser und uniformer Konvergenz
ist, dass die Reihenfolge der Quantoren ∀ und ∃ getauscht wird:
• punktweise Konvergenz:
∀ε > 0 ∀x ∈ A ∃N ≥ 0 ∀n ≥ N gilt: |fn (x) − f (x)| < ε
• uniforme Konvergenz:
∀ε > 0 ∃N ≥ 0 ∀x ∈ A ∀n ≥ N gilt: |fn (x) − f (x)| < ε
Wie die vorangegangenen Beispiele zusammen mit dem folgenden Theorem zeigen, können
Quantoren verschiedenen Typs nicht einfach vertauscht werden, ohne möglicherweise die Bedeutung der Aussage zu verändern.
Theorem 3.10 (Weierstrass 1861). Falls fn : A → R stetige Funktionen sind und fn (x)
uniform auf A gegen f (x) konvergiert, dann ist f : A → R stetig.
Frage. Existiert eine Folge von stetigen Funktionen fn (x), welche gegen eine stetige Funktion
f (x) konvergiert, so dass die Konvergenz fn (x) → f (x) nicht uniform ist? Wir haben gesehen,
dass die uniforme Konvergenz eine notwendige Voraussetzung für Theorem 3.10 ist, aber es
muss nicht unbedingt notwendig sein für ein bestimmtes Beispiel.
Nun, es gibt viele solche Funktionenfolgen. Eine davon ist die Folgende:
2nx
fn (x) =
.
1 + n 2 x2
Diese ist in Abbildung 10 dargestellt. Für jedes feste x 6= 0 gilt limn→∞ fn (x) = 0. Die Funktion
fn (x) besitzt in y = 1 ein Maximum bei x = n1 . Somit ist die Konvergenz nicht uniform. Aber
es gilt fn (0) = 0 für alle n und somit konvergiert die Folge auch im Nullpunkt gegen Null und
die Grenzfunktion ist stetig.
1
n=1
n=2
n=3
0.5
n=10
n=100
0
0
0.5
Abbildung 10: Die Funktion
1
2nx
1+n2 x2
40
1.5
2
für n = 1, 2, 3, 10 und 100.
Vorkurs UZH
4
Literatur
Die hier vorgestellten Bücher helfen beim Einstieg in das Mathematikstudium, können jedoch
auch später hilfreiche Einsichten liefern. Diese Bücher sind ergänzend zu der in den Fachvorlesungen empfohlenden Literatur zu betrachten.
Allgemein gilt bei Literaturempfehlungen in Einführungsveranstaltungen in den ersten Semestern, dass dies nur ein kleiner Ausschnitt der vorhandenen Literatur ist. Man sollte nicht vorschnell alle genannten Bücher kaufen, sondern sie sich erst genauer anschauen, ob der verwendete Zugang für einen selbst überhaupt hilfreich ist. Gerade für die Lineare Algebra und die
Analysis decken alle Einführungsbücher (fast) alle Themen ab, die in einer konkreten Vorlesung
im ersten Semester behandelt werden: deshalb ist es egal, welches Buch man konkret verwendet.
Man sollte ein Buch zuerst anschauen, bevor man es kauft. In der Bibliothek sind viele Einführungsbücher auffindbar, einige davon mittlerweile auch online.
• E. Hairer, G. Wanner, Analysis by its History, Springer (1996) New York.
Der Aufbau des Vorkurs-Skriptes lehnt sich an dieses Buch an. Das Buch wurde in Hinblick auf das Problem geschrieben, dass der Aufbau einer heutigen (formalen) AnalysisEinführungsveranstaltung ganz anders abläuft, als die darin enthaltenden Ergebnisse und
Formalismen historisch entwickelt wurden. Die historischen Informationen helfen häufig,
den formalen Zugang besser zu verstehen, etwa warum etwas so «umständlich» gemacht
wird.
• A. Beutelspacher, Das ist o.B.d.A. trivial!, 9. Auflage, Vieweg+Teubner Verlag (2009).
Dieses Buch erklärt viele Bezeichnungen, die einem im Mathematikstudium begegnen
(«trivial», «wohldefiniert», «Korollar», «eindeutig», «o.B.d.A.», etc.) und wie man diese
selber richtig verwendet. Es enthält viele konkrete Beispiele (wie man es machen bzw.
nicht machen sollte) und Ratschläge, wie man mathematische Texte formuliert. Dies ist
hilfreich – sowohl zum Aufschreiben von Lösungen von Übungsaufgaben, wie auch für
längere Texte, etwa Seminararbeiten sowie Abschlussarbeiten.
• D. Grieser, Mathematisches Problemlösen und Beweisen, 2. Auflage, Springer-Verlag (2017).
In diesem Buch geht es darum, wie man mathematische Probleme – insbesondere Übungsaufgaben – systematisch angehen kann. Es werden Problemlösungsstrategien vermittelt
und viele Beispiele explizit durchdiskutiert.
Das Buch hat im Literaturverzeichnis auch eine kommentierte Liste weiterer Bücher, die
sich mit Problemlösungsstrategien in der Mathematik beschäftigen.
41
Vorkurs UZH
A
Mengenlehre
You can define the barber as «one who shaves all those, and
those only, who do not shave themselves.» The question is,
does the barber shave himself?
(B. Russell, The Philosophy of Logical Atomism, 1918)
In der Mengenlehre betrachtet man Mengen. In der sogenannten naiven Mengenlehre definiert
man eine Menge einfach als eine unsortierte Ansammlung von Objekten, in der ein Objekt nur
einmal vorkommen kann. Da die naive Mengenlehre schnell zu Widersprüchen führt, wurde diese mit der Zeit durch andere Mengenlehren ersetzt. Diese umfassen einen Grossteil der naiven
Mengenlehre, weshalb man sich für viele einfache Zwecke, die den Grossteil der Mathematik
abdecken, nicht genauer damit beschäftigen muss. Nur manchmal treten in der Mathematik
Objekte auf, die Probleme bereiten, weil sie keine Mengen sein dürfen, etwa die «Menge aller
Mengen». Es gibt verschiedene Ansätze, wie man mit solchen Objekten umgeht. In manchen
Mengenlehren gibt es sogenannte «Klassen», die grösser als Mengen sind; die Menge aller Mengen ist dort eine echte Klasse. Dies zu diskutieren geht jedoch weit über den Rahmen dieses
Skriptes hinaus.
Ein bekanntes Beispiel für einen Widerspruch ist die Russellsche Antinomie, welche häufig
anschaulich anhand des Barbier-Paradoxons erklärt wird, welches oben bereits zitiert wurde:
«Man kann einen Barbier als einen definieren, der all jene und nur jene rasiert, die sich nicht
selbst rasieren. Die Frage ist: Rasiert der Barbier sich selbst?» In der Sprache der naiven
Mengenlehre betrachtet man die Menge X aller Mengen, die sich nicht selber enthalten. Daraus
folgert man, dass weder X ∈ X noch X 6∈ X gelten kann, was ein Widerspruch zum Satz vom
ausgeschlossenen Dritten (siehe Seite 7) ist.
Für uns ist eine Menge also eine unsortierte Ansammlung von Objekten, die man Elemente
dieser Menge nennt. Eine Menge kann nur aus wenigen (oder gar keinen) Elementen bestehen,
oder auch aus sehr vielen oder gar unendlich vielen.
Beispiele A.1.
1. Alle Menschen auf der Erde sind eine Menge. Diese Menge ist gross, aber nicht unendlich.
2. Alle Menschen, die dieses Skript gelesen haben, bilden ebenfalls eine Menge. Diese ist
schon wesentlich kleiner als die Menge aller Menschen.
3. Die Menge aller reellen Zahlen (siehe Abschnitt 2) ist etwa eine sehr grosse Menge, aber
bei weitem nicht die grösste Menge, die es gibt.6
4. Die Menge der natürlichen Zahlen ist ebenfalls eine grosse Menge, wenn auch echt kleiner
als die der reellen Zahlen. Sie ist eine der kleinsten unendlichen Mengen.
Wenn M eine Menge ist und x irgendein Objekt (das kann auch wiederum eine Menge sein),
dann schreibt man x ∈ M für die Aussage «x ist ein Element der Menge M », und x 6∈ M für
die Negation ¬(x ∈ M ), also für die Aussage «x ist kein Element der Menge M ».
6
Genauer gesagt: es gibt keine grösste Menge. Zu jeder Menge kann man durch die Potenzmengenkonstruktion eine weitere Menge finden, die echt grösser ist. Was die Potenzmenge einer Menge ist, wird auf Seite 44
beschrieben.
42
Vorkurs UZH
Eine Menge ist durch die Elemente, die in ihr liegen, eindeutig bestimmt. So sind zwei Mengen M und N genau dann gleich, in Zeichen M = N , wenn für jedes Element x mit x ∈ N
bereits x ∈ M gilt, und wenn für jedes Element x mit x ∈ M bereits x ∈ N gilt. Anders gesagt:
(M = N ) ⇐⇒ (∀x : x ∈ N ⇔ x ∈ M )
Daraus folgt auch, dass es genau eine Menge gibt, die gar kein Element enthält. Diese Menge
wird die leere Menge genannt und oft mit ∅ bezeichnet, manchmal auch mit {}.
Die Notation {} kommt daher, dass man Mengen meist mit geschweiften Klammern angibt.
Möchte man zum Beispiel die Menge hinschreiben, die aus den Objekten a, b und c besteht, so
schreibt man {a, b, c}. Hat man eine Menge M und ein Prädikat P (x), so kann man auch eine
weitere Menge N definieren als
N := {x ∈ M | P (x)}.
Manchmal schreibt man auch N := {x ∈ M : P (x)}, dies bedeutet genau das gleiche. Dies ist
dann die Menge, die aus allen x besteht, die in M liegen und die das Prädikat P (x) erfüllen.
Es ist also eine Teilmenge von M .
Allgemeiner sagt man, dass N eine Teilmenge von M ist, bzw. M eine Obermenge von N , wenn
für jedes x mit x ∈ N bereits x ∈ M gilt. Man schreibt diesen Sachverhalt als N ⊆ M bzw. M ⊇
N . Manche verwenden auch «⊂» und «⊃» für Teilmenge und Obermenge. Die Zeichen «⊆» und
«⊇» (alternativ «j» und «k») betonen jedoch mehr, dass die Mengen auch gleich sein können.
Dies ist insbesondere wichtig, da die Symbole «⊂» und «⊃» von manchen Mathematikern auch
verwendet werden, um echte Teilmengen und echte Obermengen zu beschreiben, bei denen
gerade keine Gleichheit herrscht. Andere verwenden dafür «(» und «)» (alternativ «$» und
«%»).
Auf Mengen gibt es ebenfalls Operationen. Sind N und M Mengen, so schreibt man:
1. N ∪ M für die Menge, die aus allen x besteht, die in N oder in M sind; also
N ∪ M = {x | x ∈ N ∨ x ∈ M }.
Diese Menge wird als Vereinigung der Mengen N und M bezeichnet.
2. N ∩ M für die Menge, die aus allen x besteht, die sowohl in N wie auch in M sind; also
N ∩ M = {x | x ∈ N ∧ x ∈ M }.
Diese Menge wird als (Durch-)Schnitt der Mengen N und M bezeichnet.
3. N \ M für die Menge, die aus allen x besteht, die zwar in N , aber nicht in M sind; also
N \ M = {x ∈ N | x 6∈ M }.
Diese Menge wird als Differenz der Mengen N und M bezeichnet.
4. N × M für die Menge, die aus allen Paaren (x, y) mit x ∈ N und y ∈ M besteht; also
N × M = {(x, y) | x ∈ N ∧ y ∈ M }.
Diese Menge wird als kartesisches Produkt der Mengen N und M bezeichnet. Hierbei sind
zwei Paare (x, y) und (x0 , y 0 ) genau dann gleich, wenn x = x0 und y = y 0 ist.
43
Vorkurs UZH
5. P(N ) für die Menge, die aus allen Teilmengen S ⊆ N besteht; also
P(N ) = {S | S ⊆ N }.
Diese Menge wird als Potenzmenge von N bezeichnet.
Auch für Mengen gibt es Rechenregeln, die sich meist direkt aus den entsprechenden Regeln
der Aussagenlogik herleiten:
Rechenregeln Mengenlehre
Seien M , N und O Mengen. Sei weiter A eine Menge, die Obermenge von M , N und O ist.
Dann gilt:
1. M ∪ N = N ∪ M und M ∩ N = N ∩ M (Kommutativität);
2. (M ∪ N ) ∪ O = M ∪ (N ∪ O) und (M ∩ N ) ∩ O = M ∩ (N ∩ O) (Assoziativität);
3. (M ∪N )∩O = (M ∩O)∪(N ∩O) und (M ∩N )∪O = (M ∪O)∩(N ∪O) (Distributivität);
4. A \ (M ∪ N ) = (A \ M ) ∩ (A \ N ) und A \ (M ∩ N ) = (A \ M ) ∪ (A \ N ) (De Morgansche
Regeln);
5. M ∪ M = M und M ∩ M = M ;
6. M ∪ (A \ M ) = A und M ∩ (A \ M ) = ∅;
7. M ∪ A = A und M ∩ A = M ; weiterhin gilt M ∪ ∅ = M und M ∩ ∅ = ∅;
8. (M ∪ N ) × O = (M × O) ∪ (N × O) und M × (N ∪ O) = (M × N ) ∪ (M × O)
(Distributivität);
9. es gibt eine kanonische7 bijektive8 Abbildung zwischen den Mengen M × N und N × M
(schwache Kommutativität);
10. es gibt eine kanonische bijektive Abbildung zwischen den Mengen (M × N ) × O und
M × (N × O) (schwache Assoziativität);
11. A = B ⇔ A ⊆ B ∧ B ⊆ A und A ⊆ B ⇔ ∀x ∈ A : x ∈ B.
7
Allgemein bezeichnet man ein Objekt als «kanonisch», wenn es besonders einfach ist, im Vergleich zu anderen
Objekten, die die gleichen Bedingungen erfüllen. Hier bedeutet «kanonisch», dass es eine besonders einfache
Funktion gibt, die die genannten Bedingungen erfüllt: und zwar die Abbildung (M × N ) × O → M × (N × O),
((m, n), o) 7→ (m, (n, o)).
8
Vergleiche Abschnitt 3.1. Eine bijektive Abbildung X → Y ist eine 1:1-Zuordnung von Elementen x der
Menge X zu den Elementen y der Menge Y .
44
Herunterladen