Das Buch 17 - Fachbereich Mathematik und Informatik

Das Buch 17
Friedrich Ischebeck
2
Einleitung
17
ist die siebte Primzahl und die Summe der ersten 4 Primzahlen: 2 + 3 + 5 + 7 = 17. Sie
2
lässt sich als 22 + 1 schreiben. Dies ist der Grund dafür, dass man ein regelmäßiges 17-Eck
mit Zirkel und Lineal konstruieren kann. Der Entdecker dieser Tatsache, Carl Friedrich
Gauss, wurde im Jahre 1777 geboren. (Er starb 1855.) Ferner ist 17 die Summe von zwei
Quadratzahlen (12 + 42 ), von drei dritten Potenzen (13 + 23 + 23 ) und von zwei 4. Potenzen
ganzer Zahlen (14 + 24 ). Und 17 = 23 + 32 = 34 − 43 sei auch nicht vergessen.
Der eigentliche Grund aber
für den Titel dieses Buches ist, dass ich mir Dich, liebe Leserin, lieber Leser, als etwa siebzehnjährigen jungen Menschen vorstelle, der sich für die Mathematik interessiert.
Man könnte dieses Buch also auch als Geschenk zum 17. Geburtstag eines jungen Menschen
”
der Mathe mag“ bezeichnen.
Es soll Dir nützlich sein, wenn Du vielleicht vorhast, einmal Mathematik, oder auch Physik,
Informatik oder Ingenieurwissenschaften zu studieren. Es soll Dir vor allem Vergnügen bereiten!
Es soll Dir schließlich auch Gelegenheit bieten, Dich an Hand der eingestreuten Fragen und
der Übungsaufgaben aktiv mit der Mathematik zu beschäftigen.
*******
Der (historische) Anfang der Mathematik war die Beschäftigung mit den natürlichen Zahlen
0, 1, 2, 3, . . .
und den geometrischen Figuren. Schon daran erkennt man, dass die Mathematik sich nicht
jenseits aller Wirklichkeit befindet – obwohl das manch einem so scheinen mag.
Schon früh erkannte man, dass Geometrie und Zahlen viel miteinander zu tun haben. Aber
gerade dieser Zusammenhang erzwingt es, mehr Zahlen als nur die natürlichen zu betrachten.
Nun kann man zur Not sagen: die Strecke a verhält sich zu einem Meter (Elle, Fuß) wie 3 zu
”
5“, statt a ist 3/5 Meter (Elle, Fuß) lang“ und auf diese Weise den Gebrauch der rationalen
”
Zahlen vermeiden. Aber ist das wirklich erstrebenswert?
Auch die rationalen Zahlen, d.h. die Brüche mit ganzem Zähler und ganzem Nenner, reichen
(zumindest dem Theoretiker) nicht aus. Z.B. kann man die Länge der Diagonale eines Quadrates
im Verhältnis zu einer Seite nicht (absolut genau) als rationale Zahl angeben. Man kann dieses
141
1414
14
, besser als
, noch besser als
usw. angeben, wobei das
Verhältnis nur ungefähr als
10
100
1000
usw.“ genauer zu erläutern wäre.
”
√
Da scheint es doch griffiger zu sagen√ die Diagonale ist 2-mal so lang wie die Seite“ und dann
”
eine Methode anzugeben, wie man 2 durch rationale Zahlen approximieren kann.
3
√
Nun ist 2 zwar keine rationale, aber eine reelle Zahl, und so steht es auch mit π und vielen
anderen Zahlen. Über den Begriff ‘reelle Zahl’ muss und will ich Dir in diesem Buch auch einiges
mitteilen.
Will man die Punkte einer Ebene (bzw. des Raumes) durch 2 (bzw. 3) Koordinaten beschreiben,
so kommt man offenbar ohne negative Zahlen nicht aus. Du siehst, die Betrachtung des
Rechenbereichs aller reellen Zahlen wird durch die Geometrie mehr oder weniger erzwungen.
Die Zahlen sind nicht nur zum Zählen und messen, sondern auch zum Rechnen da. Z.B. kann
man durch Rechnen das Zählen vereinfachen. Wenn etwa eine Partei im ersten Wahlbezirk 312,
im zweiten 298 und im dritten 99 Stimmen gewonnen hat, so wird man in der Wahlzentrale
diese Anzahlen addieren, statt die betreffenden Stimmzettel anliefern zu lassen, sie zusammen
zu werfen und dann zu zählen. Du wirst keine Probleme haben, die drei genannten Zahlen
‘schriftlich’ zu addieren. Aber versuche das einmal, wenn die Zahlen in römischer Schreibweise
gegeben sind: CCCXII, CCXCVIII, IC. Dies zeigt die Überlegenheit des uns geläufigen Dezimalsystems. (Im Altertum hat man mit der mechanischen Rechenmaschine ‘Abakus’ praktisch
eine Übertragung der römischen oder griechischen Zahlenschreibweise in das Dezimalsystem
vorgenommen!)
Wenn man akzeptiert, dass es beispielsweise auf dieselbe Zahl hinausläuft, ob man die 312
und die 298 und die 99 Wahlzettel zusammenwirft und dann zählt, oder ob man diese Zahlen
in beliebiger Reihenfolge addiert, dann akzeptiert man damit auch das Assoziativ- und das
Kommutativgesetz der Addition,
a + (b + c) = (a + b) + c, bzw. a + b = b + a
(Du kannst Dir darüber weitergehende Gedanken machen – musst es aber nicht. Dahinter
steckt schließlich die Einsicht, dass man beim Zählen einer endlichen Menge von Gegenständen
unabhängig von der Reihenfolge immer zum selben Ergebnis kommt. Die meisten Menschen
werden das in keiner Weise bezweifeln.)
Dem Dezimalsystem liegt die Grundzahl Zehn zugrunde. Dabei ist die Zehn natürlich nicht
die einzig mögliche, aber auch nicht die schlechteste Wahl, jedenfalls, was die Praxis des
Rechnens betrifft. Die kleinstmögliche Grundzahl 2 (mit den einzigen Ziffern 0 und 1) ist zwar
für Computer am geeignetsten, aber vielleicht nicht für den Menschen. Wir sprechen vom
Binärsystem oder von der Binärschreibweise, wenn wir von der Grundzahl Zwei ausgehen.
Die Multiplikation natürlicher Zahlen kann man als iterierte Addition definieren. Obwohl
man sie demnach auf die Addition zurückführen kann, ist es aber sinnvoll, sie als eigenständige
Rechenart anzuerkennen. Warum und wie ich das meine, erläutere ich jetzt mit vier Argumenten.
1. Die – wie gesehen – nützliche Dezimal-Darstellung natürlicher Zahlen benutzt implizit die
Multiplikation: 3024 = 3 · 10 · 10 · 10 + 0 · 10 · 10 + 2 · 10 + 4. (In den Summanden braucht man
auf Grund der Assoziativität der Multiplikation keine Klammern zu schreiben. Ferner haben
wir die geläufige Konvention ‘Punktrechnung vor Strichrechnung’ genutzt.) Beim schriftlichen
Addieren benutzt man implizit die Distributivität, a(b + c) = ab + ac, also eine Regel, in der
neben der Addition die Multiplikation eine Rolle spielt.
4
2. Man berechnet z.B. das Produkt 127·344 sicher nicht, indem man 127 mal 344 zu sich selbst
addiert, sondern schneller auf andere Weise, nämlich so wie Du das ‘schriftliche Multiplizieren’
auf der Schule gelernt hast. Wieder erkennt man die Nützlichkeit des Dezimalsystems, bzw. des
Binärsystems für Computer.
3. Es gilt – wie Du vielleicht weißt, aber auch ziemlich bald in diesem Buch lernen wirst – die
Formel:
n(n + 1)
1 + 2 + 3 + ··· + n =
2
Für nicht zu kleine n ist sicher die rechte Seite dieser Identität schneller zu berechnen als die
linke, obwohl man rechts nicht nur multiplizieren sondern auch noch dividieren muss. Und dies
ist natürlich nur eines unter vielen Beispielen.
4. Es ist nicht schwer, die Multiplikation natürlicher Zahlen sinnvoll auf die rationalen Zahlen
‘auszudehnen’, wo man sie nicht mehr als iterierte Addition auffassen kann.
Oben habe ich bereits erläutert, wieso die Grundgesetze der Addition, nämlich die Assoziativität
und Kommutativität eigentlich selbstverständlich sind. Wie steht es um die entsprechenden
Gesetze für die Multiplikation? Wenn man das Produkt m · n zweier natürlicher Zahlen als
Summe von m Summanden der Größe n definiert, ist es nicht von vorneherein klar, dass bei
der Addition von n Summanden der Größe m dasselbe herauskommt, d.h. ob m · n = n · m ist.
Wenn Du aber sagst, m · n ist die Anzahl der Apfelsinen, die in m Reihen zu je n Stück
angeordnet ist, wie in folgendem Bild, so wird das Gesetz m · n = n · m augenscheinlich.
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Wie würdest Du Dir das Distributivgesetz a(b + c) = ab + ac für natürliche Zahlen anschaulich
klarmachen?
Für Potenzen gilt weder die Kommutativität, noch die Assoziativität. Es ist ja 23 6= 32 , sowie
2
2(3 ) 6= (23 )2 .
Wunderbarer Weise kann man die Addition und die Multiplikation auf die rationalen Zahlen,
d.h. positive oder negative Brüche, ausdehnen, und es bleiben sogar dieselben Rechengesetze
erhalten.
Fasst man die rationalen Zahlen als Größen auf, ist eigentlich klar, wie man zwei solche zu
addieren hat. (S.u.)
Das Produkt zweier Brüche entspricht geometrisch der Flächengröße des Rechtecks mit den
Seitenlängen, die den Brüchen entsprechen. (S.u.)
Warum müssen wir Mathematiker – und mit diesem Wort sind im ganzen Buch alle Mathematikerinnen herzlich mitgemeint – die Bruchrechnung beherrschen? Das Addieren von Brüchen
5
ist schwerfällig. Ebenso ist es mühsam von zwei gegebenen Brüchen zu erkennen, welcher von
beiden der größere ist. Vergleiche z.B. 99/101 mit 98/100. (Es wäre schön, wenn Du dabei auch
ein Gesetz erkennen könntest!) Der Praktiker ist sicher gut beraten, abbrechende Dezimalbrüche zu benutzen – wenn auch mit einiger Vorsicht. Der Mathematiker sollte jedoch auch die
Hintergründe verstehen. Außerdem rechnet man mit Brüchen von Termen (etwa (sin α)/(c + b))
genauso wie mit Brüchen von ganzen Zahlen.
Die Bruchrechnung wird an der Schule in der 6. oder 7. Klasse erlernt – und später von vielen
vergessen. (Dazu tragen leider auch die an sich nützlichen Taschenrechner bei, die selber mit
Brüchen umgehen können und so den Schülern das mühsame Addieren von Brüchen ersparen!)
Das Rechnen mit konkreten Brüchen kann aber lehren, wie wichtig es ist, dass man nicht einfach
alles durcheinander wirft. Man muss unbedingt falsche Analogien vermeiden! Z.B. gilt zwar die
Regel
a b
a+b
c c
c
+ =
, aber keinesfalls allgemein + =
c c
c
a b
a+b
wie man etwa an der Identität
1 1
+ =1
2 2
sieht, die niemand bezweifeln wird, auch diejenigen nicht, welche die Bruchrechnung noch nicht
gelernt oder wieder vergessen haben.
Da gute Mathematiker sich u.a. dadurch auszeichnen, dass sie falsche Analogien vermeiden
(und richtige Analogien nützen!), erscheint mir die Beobachtung erklärlich, dass Studierende,
die zu Anfang ihres Studiums die Bruchrechnung beherrschen, am Ende meist einen guten
Studienerfolg in der Mathematik erreichen.
Ein Abiturient oder eine Abiturientin, die nicht mehr genau weiß, wie man mit Brüchen rechnet
hat, kann dennoch mit Erfolg Mathematik studieren. Man kann im Mathematikstudium im
Prinzip alles Vergessene nachholen. Man muss es allerdings auch wollen und tun!
Du kannst allerdings nicht erfolgreich Mathematik studieren, ohne an diesem Fach
Interesse und Freude zu haben! Ich bilde mir nicht ein, einen Menschen, der Mathematik
uninteressant oder gar ätzend findet, vom Gegenteil überzeugen zu können. Für einen solchen
ist dieses Buch nicht gedacht.
Dezimalzahlen. Rationale Zahlen, d.h. Brüche kann man als Dezimalzahlen schreiben.
36
Zum Beispiel
= 1,44. Meist kommt man nicht mit endlich vielen Nachkommeziffern aus.
25
1
Zum Beispiel
= 0,3 = 0,333 . . . wo nach dem Komma unendlich viele 3-en folgen; oder
3
45
= 1,0227 = 1,02272727 . . . wo nach 1,02 unendlich oft das Ziffernpaar 27 folgt.
44
Wenn man eine rationale Zahl als Dezimalzahl schreibt, ergibt sich immer ab einer gewissen
Stelle eine Periode. Im ersten Beispiel ist dies die Periode 0, im zweiten die Periode 3, im
dritten die Periode 27. (Der Fall, wo die Dezimalzahl abbricht, d.h. auf die Periode 0 endet,
tritt genau dann ein, wenn der Nenner des gekürzten Bruches die Form 2m 5n mit natürliche
Zahlen m, n hat. Das liegt natürlich daran, dass 2 und 5 die Primfaktoren von 10 sind.)
6
Umgekehrt kann man jede Dezimalzahl, die von einer Stelle an periodisch ist, als Bruch ganzer
Zahlen schreiben.
√
Nun gibt es allerdings ‘Zahlen’, wie etwa 2, die wir auf jeden Fall als Zahlen betrachten wollen,
und die man auch als Dezimalzahlen ‘schreiben’, kann. Diese haben keine Periode! Aber√man
kann theoretisch für jede natürliche Zahl n mit genügend ‘Fleiß’ die ersten n Ziffern von 2, π
etc. berechnen. Alle Zahlen, die man als Dezimalzahlen schreiben kann, nennt man die reellen
Zahlen. (Natürlich dürfen sie auch negativ sein.)
Im 2. Kapitel werden Rechenbereiche von einem allgemeinen Standpunkt aus betrachtet. Und
es werden Beispiele gegeben, die Dir vielleicht sehr exotisch vorkommen. Dieses Kapitel zu
lesen, wird Dir vielleicht nicht so leicht fallen. Es lohnt sich aber! Natürlich darfst Du seine
Lektüre auf später verschieben.
Mengen und Abbildungen sind Begriffe der modernen Mathematik, denen Du in einem
Mathematik- und Informatikstudium nicht entgehen kannst. Das entsprechende Kapitel ist
vielleicht schwer zu lesen, weil es so abstrakt ist. Es mag aber auch sein, dass Du es als sehr
leicht zu lesen empfindest, da in ihm alle Schlüsse eher simpel sind.
Geometrie. Auch der Geometrie ist ein Kapitel dieses Buches gewidmet. Dort setze ich allerdings noch mehr als sonst voraus, dass Du ordentliche Kenntnisse aus der Schule mitbringst.
Das Problem der Grundlagen ist für die Geometrie schwieriger als für die Zahlen. Welchen Sinn
hat es, bevorzugt die sogenannte Euklidische Geometrie zu behandeln, obwohl diese, wir man
heute weiß, nicht richtig ist, wenn man Lichtstrahlen (im Vakuum) als Geraden betrachtet? Die
Antwort, dass die Euklidische Geometrie keinen Sinn habe, kann man mit Fug bezweifeln.
In diesem Kapitel sollen insbesondere die Kreisfunktionen (Sinus, Cosinus) geometrisch erklärt
werden, die zu den wichtigsten Funktionen der Analysis und auch der Physik gehören.
Obwohl somit mein Hauptanliegen nicht die klassische Dreiecksgeometrie ist, mochte ich es mir
nicht versagen, ihre schönen Sätze über die Eulergerade, den Feuerbachkreis und das Morleydreieck zu beweisen, die erst im 18. und 19. Jahrhundert gefunden wurden.
Analysis: Die Differenzial-und Integralrechnung betrachtet Funktionen vom geometrischen
oder auch dynamischen Standpunkt aus. Du wirst vieles vom Schulunterricht her wissen, vielleicht aber auch neue Gesichtspunkte kennenlernen.
Komplexe Zahlen. Es gibt mehrere Gründe, warum die komplexen Zahlen aus der modernen
Mathematik nicht mehr wegzudenken sind. Im Kapitel über komplexe Zahlen will ich versuchen,
dies zu erläutern. Komplexe Zahlen lassen sich in der Form a + bi schreiben, wobei a, b reelle
Zahlen sind, während i eine neue Zahl mit der merkwürdigen Eigenschaft i2 = −1 ist. Die
reellen Zahlen werden als spezielle komplexe Zahlen aufgefasst, nämlich als diejenigen a + bi,
wo b = 0 ist. Die Addition komplexer Zahlen ist naheliegend, während man die Multiplikation
nach meinem Gefühl nur auf geometrische Weise wirklich verstehen kann. Eine der wichtigsten
Eigenschaft des Rechenbereichs der komplexen Zahlen ist der Fundamentalsatz der Algebra,
der besagt, dass jedes (nicht konstante) Polynom mit komplexen Koeffizienten mindestens eine
komplexe Nullstelle hat. Beachte, dass z.B. das Polynom x4 −4x3 +6x3 −3x2 +2 = (x−1)4 +x2 +1
keine reelle Nullstelle hat. Die Gültigkeit des Fundamentalsatzes der Algebra wird in diesem
Buch zumindest plausibel gemacht.
7
Zur gedanklichen Präzision in der Analysis und der Geometrie. Wenn eine Funktion zwischen zwei x-Werten a und b überall definiert und stetig ist und wenn ferner f (a) < 0
und f (b) > 0 ist, so hat sie zwischen a und b irgendwo (mindestens) eine Nullstelle. Dieser Satz
hat den Namen Zwischenwertsatz und wird gemeinhin im ersten Semester des Mathematikstudiums bewiesen. Ich hoffe, Du bist mir nicht böse, wenn ich ihn in diesem Buch als anschaulich
selbstverständlich ansehe. Und das ist nur ein Beispiel! Versteh mich richtig. Ich bin nicht der
Meinung, dass die präzisen Beweise der modernen Analysis überfüssig wären. Aber ich will ja
kein Buch für Erstsemester schreiben. Nicht ganz leichten Herzens opfere ich einen Teil der
gedanklichen Präzision, die die moderne Analysis erreicht hat, dem Ziel und hoffentlich auch
Deinem Wunsch, schneller zu Ergebnissen zu kommen, die Du nicht eh schon glaubst. Ich werde
mir an mehreren Stellen erlauben, mich anschaulicher Schlüsse zu bedienen. Dasselbe gilt erst
recht für die klassische Geometrie, für die Du in den Büchern von Hilbert oder Lorenzen
zwei grundsätzlich verschiedene Weisen der Präzisierung finden kannst.
Zum Schluss die Frage: Was hat die Mathematik mit der Wirklichkeit zu tun und was nutzt
sie?
Nach meiner Überzeugung ist die Mathematik eine Wissenschaft, die sich auf die Wirklichkeit
bezieht und sich mit ihr beschäftigt. Ihr Nutzen für die moderne technisierte Welt ist unbestreitbar. (Die Frage, ob wir ohne Autos, Händis und Supermarktkassen nicht glücklicher wären,
kann und will ich nicht beantworten.)
Da heißt nicht, dass es nicht auch prominente Ergebnisse der Mathematik gäbe, die wahrscheinlich auch in weiter Zukunft keinen volkswirtschaftlichen Nutzen bringen werden. Der berühmte
Satz, dass für n > 2 die Summe zweier n-ter Potenzen positiver ganzer Zahlen selbst keine
n-te Potenz ganzer Zahlen ist – vermutet (?) von Fermat im 17., bewiesen von Wiles im 20.
Jahrhundert – gehört wohl dazu.
Man kann zwei extreme Positionen einnehmen:
1. Die Mathematik hat nur einen Wert, soweit sie sich anwenden lässt. Schon aus ethischen
Gründen kann ich es nicht vertreten, mich für ein ‘Glasperlenspiel’ von der Gesellschaft bezahlen
zu lassen.
2. Ich befasse mich mit der Mathematik nur um ihrer Schönheit willen. Schließlich ist sie eine
großartige Kulturleistung. Anwendungen ziehen sie nur herab.
In meiner Jugend neigte ich der 2. Position zu – und habe andererseits manchmal wegen dieser
Meinung ein schlechtes Gewissen gehabt.
Heute ist mir klar: Es gibt nicht den geringsten Grund, eine dieser beiden Extrempositionen
einzunehmen. Betreibe die Mathematik mit Freude sowohl an ihrer Schönheit, als auch an ihren
Anwendungen, und suche Dir den Bereich aus, der Deinem Bedürfnis nach Wirklichkeitsnähe
oder -ferne am nächsten kommt.
8
Es ist ja möglich, dass der eine oder andere Punkt in dem Buch Dir einfach nicht klar werden
will oder dass die eine oder andere Aufgabe Dir völlig unlösbar erscheint. Nachdem Du das
Buch dann wütend in die Ecke geschmissen hast, hol es bitte wieder hervor und lies an einer
anderen Stelle weiter. Auch das Verstehen von Mathematik und das Lösen mathematischer
Aufgaben kann man trainieren.
Vielleicht fällt Dir z.B. im Kapitel über Ringe und Körper manches sehr schwer, während Dir
im Kapitel Differenzial- und Integralrechnung vieles bekannt erscheint.
Mir liegt nicht daran, Dich mit besonders schwierigen Dingen und Aufgaben zu ärgern. Manche
schönen und interessanten Ergebnisse sind aber nun mal nicht so leicht zu haben. Deshalb freut
mich ungemein, wenn es Dir gelingt, auftauchende Schwierigkeiten zu überwinden.
Hier für Nachfragen meine elektronische Adresse: [email protected]
Manchmal benutze ich verschiedene Schreibweisen für dasselbe:
n
X
Pn
a
a
= = a/b ,
ak ,
limn→∞ an = lim an .
k=1 ak =
b
n→∞
b
k=1
Mit , gelegentlich auch mit – bezeichne ich das Ende eines Beweises.
Das griechische Alphabet
A, α alpha, B, β beta, Γ, γ gamma, ∆, δ delta, E, ε epsilon, Z, ζ zeta, H, η eta, Θ, ϑ
theta, I, ι iota, K, κ kappa, Λ, λ lambda, M, µ my, N, ν ny, Ξ, ξ xi, O, o omikron, Π, π
pi, P, ρ rho, Σ, σ sigma, T, τ tau, Υ, υ ypsilon, Φ, ϕ phi, X, χ chi, Ψ, ψ psi, Ω, ω omega.
Unterscheide ζ von ξ.
Manchmal, aber nicht in diesem Buch, werden an Stelle von ε, ϑ, ϕ die Bezeichnungen , θ, φ
benutzt.
Kapitel 1
Vom Zählen, Rechnen und Vergleichen
1.1
Die natürlichen Zahlen
0, 1, 2, 3, 4, 5, . . .
Die natürlichen Zahlen hat der liebe Gott gemacht.“ (Kronecker)
”
Na, darüber will ich lieber nicht spekulieren. Aber, wozu sie gut sind, ist wohl klar. Man kann
jemandem mitteilen, wieviele Schafe man hat (etwa um sie zu verkaufen), ohne ihm die Herde
zeigen zu müssen. Man kann auch ihre Zahl notieren und im kommenden Jahr feststellen,
wieviel Zuwachs, bzw. Verlust man gemacht hat. Usw.
Natürliche Zahlen sind Symbole zum Zählen, zum Vergleichen und zum Rechnen.
Auch wenn man mit dem Zählen meist mit der 1 beginnt, ist es doch möglich, dass ein Einwohner Münsters, wie z.B. ich, gar kein Schaf besitzt und dies auf einer Liste aller Bewohner
Münsters dadurch angegeben wird, dass man eine 0 in die entsprechende Spalte einträgt. Die
0 ist auch eine Anzahl, weshalb ich sie zu den natürlichen Zahlen rechne. (Etwa die Hälfte der
Mathematiker sieht das allerdings anders.)
Notation: Die Gesamtheit aller natürlichen Zahlen – einschließlich der 0 – bezeichne ich mit N.
Eine solche Gesamtheit mathematischer Objekte wird gemeinhin als eine Menge bezeichnet.
Man redet somit von der Menge der natürlichen (ganzen, rationalen) Zahlen. Die Notation
a ∈ N soll ausdrücken, dass a zur Menge der natürlichen Zahlen gehört, d.h. eine natürliche
Zahl ist. (Die Menge der von Null verschiedenen natürlichen Zahlen bezeichne ich mit N1 . Dies
ist der einzige Punkt, wo ich mich nicht einer allgemein gebräuchlichen Notation bediene. Es
gibt für N1 auch die Bezeichnung J.)
1.1.1 Während die Regeln a + b = b + a und a + (b + c) = (a + b) + c nach der alltäglichen
Bedeutung der Addition in N selbstverständlich sind oder zumindest erscheinen, kann man sich
fragen: Ist die Regel a · b = b · a für natürliche Zahlen eigentlich auch so selbstverständlich?
Dass 3 · 7 = 7 + 7 + 7 dasselbe ergibt, wie 7 · 3 = 3 + 3 + 3 + 3 + 3 + 3 + 3, kann man leicht
nachrechnen. Aber das könnte ja Zufall sein.
9
10
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Für Potenzen ist die Sache jedenfalls komplizierter. Es ist zwar 24 = 16 = 42 , aber 73 = 7·7·7 =
343 und 37 = 3·3·3·3·3·3·3 = 2187. (Ich weiß nicht, ob man sich bei der Identität (3+4)3 = 343
irgendetwas denken soll. Ich glaube, eher nicht.)
Die Frage, wieso eigentlich a · b = b · a für natürliche Zahlen gilt, habe ich bereits in der
Einleitung beantwortet
(Einen formalen Beweis, der von einem Axiomensystem für die natürlichen Zahlen ausgeht, gibt
es natürlich auch.)
Die (nicht allzu wichtige) Frage, für welche positiven reellen Zahlen a, b mit a 6= b die Gleichung
ab = ba gilt, wird in diesem Buch in 7.6 behandelt. Dazu musst Du ja wissen, was reelle Zahlen sind,
und was man unter ab für positive reelle Zahlen a, b versteht. Aber natürlich darfst Du schon mal in
diesem Abschnitt nachlesen.
1.1.2 Zumindest ebenso wichtig wie das Gesetz der Kommutativität (ab = ba) ist das Gesetz der Assoziativität der Multiplikation natürlicher Zahlen: (ab)c = a(bc). Kannst Du Dir
seine Gültigkeit geometrisch (im dreidimensionalen Raum) veranschaulichen? (Auch die As3
soziativität gilt nicht für Potenzen? Vergleiche (102 )3 mit 102 , und beachte dabei, dass nach
3
3
allgemein gebräuchlicher Konvention 102 = 10(2 ) definiert ist.)
1.1.3 Das Gesetz, das den Zusammenhang zwischen Addition und Multiplikation beshreibt,
ist das Gesetz der Distributivität (m + n)k = mk + nk. (In der letzten Regel ist natürlich die
Konvention Punktrechnung geht vor Strichrechnung“ anzuwenden; d.h. mk + nk =
”
(mk) + (nk).) Zusammen mit der Festlegung 1k = k definiert das Distributivitätsgesetz sozusagen die Multiplikation natürlicher Zahlen. Nicht wahr? (Aufgrund der Distributivität ist ja
(1 + · · · + 1)k = 1 · k + · · · + 1 · k mit gleichvielen Summanden links und rechts.)
Auch dieses Gesetz kannst Du Dir anschaulich klar machen.
• • • •
• • • •
• • • •
• • • •
• • • •
Natürlich sieht man es auch so:
. . + k} = |k + .{z
. . + k}
mk + nk = |k + .{z
. . + k} + |k + .{z
m
n
m+n
1.1.4 Die grundlegenden Gesetze der Addition und Multiplikation im Bereich der natürlichen
Zahlen fassen wir noch mal zusammen:

mn = nm
Kommutativität
 m+n=n+m
(1) k + (m + n) = (k + m) + n k(mn) = (km)n Assoziativität

(m + n)k = mk + nk
Distributivität
1.1. DIE NATÜRLICHEN ZAHLEN
11
Beachte, dass das Distributivitätsgesetz die Addition und die Multiplikation vollkommen unterschiedlich behandelt und dass eine Unregel entstünde, wollte man die Addition mit der
Multiplikation vertauschen: Meist ist mn + k 6= (m + k)(n + k).
Die Assoziativität der Addition (bzw. Multiplikation) bedeutet, dass man in einer längeren
Summe (bzw. Produkt) keine Klammern benötigt, um anzuzeigen, welche Addition (bzw. Multiplikation) man vor welcher auszuführen hat. Z.B. ist (ab)(cd) = (a(bc))d etc. Klammern
benötigt man erst, wenn Summen und Produkte gemeinsam in einer Formel vorkommen.
Da zusätzlich die Kommutativität gilt, kann man die Summanden, bzw. Faktoren in beliebige
Reihenfolge bringen, ohne dass sich an der Summe, bzw. dem Produkt etwas ändert. Z.B. ist
abcd = cadb.
Im nächsten Kapitel wirst Du Rechenbereiche kennenlernen, wo die Multiplikation zwar assoziativ, aber nicht kommutativ ist.
Aus dem Distributivitätsgesetz, sowie der Kommutativität und Assoziativität der Addition und
Multiplikation kannst Du folgern, dass (a0 + a1 + · · · + am )(b0 + b1 + · · · + bn ) gleich der Summe
über folgende Produkte (in beliebiger Reihenfolge) ist
a0 b 0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b 3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5
a1 b 5
a2 b 5
a3 b 5
a4 b 5
a5 b 5
..
.
···
···
···
···
···
···
..
.
a0 b n
a1 b n
a2 b n
a3 b n
a4 b n
a5 b n
..
.
am b 0 am b 1 am b 2 am b 3 am b 4 am b 5 · · · am b n
Merke Dir dieses Schema und erinnere Dich daran, wenn es im Abschnitt 4.5 um Produkte
unendlicher Summen geht!
1.1.5 Die Zahlen 0 und 1 spielen für die Addition, bzw. Multiplikation eine Sonderrolle:
(2) 0 + n = n , 1n = n
Man nennt die 0 ein neutrales Element für die Addition und die 1 ein solches für die Multiplikation.
1.1.6 Du kennst sicher bereits größere Zahlbereiche als den der natürlichen Zahlen, nämlich
den der ganzen, den der rationalen und den der reellen Zahlen. In allen diesen gelten die Gesetze
(1) aus 1.1.4, und auch dort sind die Zahlen 0, bzw. 1 die neutralen Elemente für die Addition,
bzw. die Multiplikation.
1.1.7 Man kann natürliche Zahlen der Größe nach vergleichen. Genau dann gilt a ≤ b in N,
wenn es ein a0 ∈ N gibt mit a + a0 = b. Für die Relation ‘≤’ in N gelten folgende grundlegenden
Regeln:
12
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
a ≤ a;
a ≤ b, b ≤ c ⇒ a ≤ c;
a ≤ b, b ≤ a ⇒ a = b;
für je zwei natürliche Zahlen a, b ist a ≤ b oder b ≤ a.
a ≤ b ⇒ a + c ≤ b + c;
a ≤ b ⇒ ac ≤ bc.
Beachte, dass für eine negative Zahl c (die es in N nicht gibt) die letzte Regel falsch ist.
Ausgehend von ‘≤’ kann man ‘<’ durch
a < b ⇐⇒ a ≤ b und a 6= b
definieren. (Um deutlich zu machen, dass a < b durch [a ≤ b und a 6= b] definiert werden soll,
schreibt man auch einen Doppelpunkt vor das Zeichen ⇐⇒ , also a b dasselbe wie b < a bedeuten und a ≥ b dasselbe wie b ≤ a.
Was bedeuten die Zeichen ‘=⇒’ und ‘ ⇐⇒ ’ ?
Für zwei Aussagen A, B bedeutet A =⇒ B eine der folgenden untereinander äquivalenten Aussagen:
wenn A gilt, dann gilt auch B“
”
aus A folgt B“
”
A ist eine hinreichende Bedingung für B“
”
B ist eine notwendige Bedingung für A“
”
Man sagt dazu auch: A impliziert B“.
”
Die Aussage A ⇐⇒ B bedeutet, dass sowohl A =⇒ B als auch B =⇒ A erfüllt
ist. Man sagt in diesem Fall auch: A gilt genau dann (dann und nur dann), wenn B
gilt. Ebenso sagt man in diesem Fall auch: Die Aussagen A und B sind äquivalent.
Häufig wird =⇒ mit ⇐⇒ verwechselt!
Betrachte die Aussagen:
Wenn heute Fronleichnam ist, ist heute Donnerstag.
Bzw. Wenn heute Donnerstag ist, ist heute Fronleichnam.
Kein Mensch wird auf die Idee kommen, dass aus dem ersten dieser beiden Sätze der zweite
folgt, da ja jeder weiß, dass es viele Donnerstage gibt, an denen nicht Fronleichnam ist.
Aber in der Mathematik sind die Verhältnisse oft weniger leicht zu durchschauen. Angenommen,
Du hast folgenden (richtigen) Satz bewiesen: Wenn eine differenzierbare Funktion f (auf einem
offenen Intervall) im Punkt x0 einen (lokalen) Extremwert hat, so ist f 0 (x0 ) = 0.
Vielleicht möchtest Du daraus schließen: Wenn f 0 (x0 ) = 0 ist, so hat f in x0 einen Extremwert.
Das wäre aber ein falscher Schluss, wie Du an dem Beispiel f (x) = x3 mit x0 = 0 siehst.
1.2. PRIMZAHLEN
13
Dieses Beispiel springt aber nicht von selbst ins Auge, wie das der Donnerstage, an denen nicht
Fronleichnam ist.
Du darfst nie meinen, mit A ⇒ B hättest Du auch B ⇒ A gezeigt.
1.1.8 Hat man endlich viele natürliche (auch ganze, rationale oder reelle) Zahlen a1 , a2 , . . . , an
(mit n > 0) vorgegeben, so gibt es unter diesen eine kleinste und eine größte. Das ist Dir
vermutlich klar. (Ein formaler Beweis würde mit vollständiger Induktion, die später behandelt
wird, argumentieren.)
Darüber hinaus gilt folgende Aussage: Ist M irgendeine Menge natürlicher Zahlen, die auch aus
unendlich vielen Zahlen bestehen darf und mindestens eine Zahl enthält, so gibt es unter den
Zahlen aus M eine kleinste. Ist nämlich a eine Zahl aus M , so gibt es höchstens a + 1 natürliche
Zahlen aus M , die ≤ a sind. Die kleinste unter diesen ist auch die kleinste Zahl von M .
Beispiel: Die kleinste Zahl aus der Menge derjenigen natürlichen Zahlen, die nicht als Summe
von drei Quadraten natürlicher Zahlen geschrieben werden können, ist die 7. (02 ist dabei als
Quadrat der natürlichen Zahl 0 zugelassen.)
1.1.9 Erstaunlicher Weise gibt es über die natürlichen Zahlen eine reichhaltige Theorie, die
so genannte Zahlentheorie. Einer ihrer wundervollen Sätze ist, dass jede natürliche Zahl sich
als Summe von 4 Quadratzahlen schreiben lässt. Z.B. ist 103 = 12 + 22 + 72 + 72 und 3 =
02 + 12 + 12 + 12 . Schreibe 63 als Summe von 4 Quadraten.
Noch erstaunlicher ist vielleicht die Tatsache, dass es Anwendungen der Zahlentheorie für die
Geschäftswelt gibt. Die besten Verschlüsselungen von Zahlen oder Texten beruhen auf (einfachen) zahlentheoretischen Erkenntnissen. Am Schluss dieses Buches, will ich Dir hierüber etwas
erzählen.
1.2
Primzahlen
1.2.1 Frage: Gibt es (vielleicht sehr große) natürliche Zahlen m, n > 0, derart, dass 18m = 20n
ist?
Damit Du diese Frage beantworten kannst, will ich ein wenig auf die so genannten Primzahlen
eingehen.
Eine Primzahl ist eine natürliche Zahl > 1, die sich nur auf triviale Weise als Produkt zweier
natürlicher Zahlen darstellen lässt, d.h. wo einer der Faktoren 1 ist.
Primzahlen sind: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, . . . Achtung: 2 ist eine Primzahl, 1 nicht!
Es gelten folgende zwei Aussagen:
1. Jede natürliche Zahl > 1 ist ein Produkt von Primzahlen, wobei auch Produkte von nur
einem Faktor zugelassen sind.
14
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Z.B. 24 = 2 · 2 · 2 · 3, 25 = 5 · 5, 23 = 23. (Sähe man 2 nicht als Primzahl an, wie könnte man
24 in Primfaktoren zerlegen?)
2. Die Zerlegung einer natürlichen Zahl > 1 in Primfaktoren ist bis auf deren Reihenfolge
eindeutig. (Beachte: Wenn man die 1 als eine Primzahl ansähe, wäre diese Aussage falsch!
Es ist 6 = 2 · 3 = 1 · 2 · 3 = 1 · 1 · 2 · 3 usw.)
Z.B. Seien m, n natürliche Zahlen 6= 0 so ist immer 17m 6= 19n . Zeige das Entsprechende für
18m und 20n .
Ich vermag jedem zuzustimmen, der die Aussage 1. für selbstverständlich hält. Bei der Aussage
2. fällt mir das schon schwerer. Z.B. halte ich es gar nicht für selbstverständlich, dass für von
0 verschiedene natürliche Zahlen m, n immer 17m 6= 19n ist.
Ein weiteres Argument dafür, dass die Aussage 2. eines Beweises bedarf, erhält man, wenn man
Produkt-Zerlegungen nur im Bereich der natürlichen Zahlen n ≥ 3 betrachtet. Weder 4 noch 8
lassen sich zerlegen, wenn man den Faktor 2 nicht zulässt. Sie sind also in diesem Teilbereich
der natürlichen Zahlen unzerlegbar, sozusagen (in diesem Bereich) ‘Primzahlen’. Für diese gilt
aber 4 · 4 · 4 = 8 · 8.
Ich gebe im Folgenden einen Beweis der Eindeutigkeit der Primfaktorzerlegung, d.h. der Aussage
2. Er ist fast wörtlich derjenige, den Gauß in seinen Disquisitiones Arithmeticae gegeben hat.
Ich glaube, dass ein junger Mensch mit geringen Grundkenntnissen keinen verständlicheren
Beweis finden wird.
Beweis der Eindeutigkeit der Primfaktorzerlegung nach Gauß.
Erinnere dich an die sogenannte Division mit Rest, z.B.
16 : 6 = 2 Rest 4
Überraschender Weise spielt diese eine große Rolle in der Mathematik. Wir wollen allerdings
die angegebene ‘Gleichung’ (deren rechte Seite eigentlich keinen Sinn hat) folgendermaßen als
echte Gleichung schreiben
16 = 2 · 6 + 4 (oder auch 16 − 2 · 6 = 4)
Allgemein gibt es zu je zwei natürlichen Zahlen a, b mit b 6= 0 weitere natürliche Zahlen q, r
(denke an Quotient und Rest), so dass zweierlei gilt
a = qb + r und 0 ≤ r < b .
Wenn Du dies genauer einsehen (und nicht einfach Deiner Rechenerfahrung entnehmen) willst,
kannst Du nacheinander die immer kleiner werdenden Zahlen
a − 0 · b, a − 1 · b, a − 2 · b, . . .
betrachten. Die erste Zahl q für die a − qb < b ist, ist das gesuchte q, und r = a − qb ist dann
das gesuchte r. Du wirst bald einen Beweis mit Hilfe der sogenannten vollständigen Induktion
kennen lernen.
1.2. PRIMZAHLEN
15
Lemma 1.2.2 Seien p eine Primzahl und a, b von 0 verschiedene natürliche Zahlen, die kleiner
als p sind. Dann kann p kein Teiler von ab sein.
(Die Bezeichnung ‘Lemma’ wird meist im Sinne von ‘Hilfssatz’ benutzt.) (Beachte dass die
Voraussetzung a, b p nicht ausschließt. Es ist ja 2 · 3 > 5.)
Beweis: Angenommen p wäre ein Teiler von ab. D.h. b gehörte zur Menge aller von 0 verschiedenen natürlichen Zahlen x < p, für die p ein Teiler von ax ist. Sei dann c die kleinste
unter diesen Zahlen x. Dabei kann c = b, aber auch c < b sein. Jedenfalls ist 1 < c < p. (Die
Beziehung 1 < c gilt, da p kein Teiler von a · 1 ist.)
Dividiere p durch c mit Rest, d.h. finde natürliche Zahlen q, γ mit p = qc + γ und γ < c. Da
p prim und 1 < c < p ist, kann c kein Teiler von p und folglich γ nicht gleich 0 sein. Es ist
aber p ein Teiler von aγ = ap − qac, da p sowohl ap wie qac teilt. Die ist ein Widerspruch zur
Minimalität von c, der aus der Annahme, p sei ein Teiler von ab, folgt. Diese Annahme kann
also nicht wahr sein.
Folgerung 1.2.3 (Euklids Lemma.) Ist p eine Primzahl und ein Teiler von ab, wo a, b natürliche Zahlen sind. Dann ist p ein Teiler (mindestens) einer der Zahlen a, b.
Beweis: Nimm an, p wäre weder ein Teiler von a noch von b. Dann dividiere a und b durch
p mit Rest: a = pq1 + α, b = pq2 + β mit 1 ≤ α < p, 1 ≤ β < p. Es folgt, dass p ein Teiler
von αβ = (a − pq1 )(b − pq2 ) = ab − pq1 b − pq2 a + p2 q1 q2 ist. Dies widerspricht Lemma 1.2.2, da
α, β 1 wie folgt auf zwei Weisen in Primfaktoren zerlegt:
p 1 · · · p r = q1 · · · q s
Dann stehen links und rechts dieselben Primfaktoren, und zwar auch jeder Primfaktor gleich
oft.
Beweis:
Offenbar gilt: Ist eine Primzahl p Teiler einer Primzahl q, so muss p = q sein.
Da nach der letzten Folgerung jedes pi eines der qj teilt und umgekehrt, müssen rechts und
links dieselben Primzahlen stehen, allenfalls noch verschieden oft. Ist ein Primfaktor p auf der
rechten Seite m-mal und auf der linken Seite n-mal vertreten und etwa n ≤ m, so dividiere auf
beiden Seiten durch pn . Dann taucht p links nicht mehr und rechts (m − n)-mal auf. Das geht
aber nur, wenn m − n = 0 ist.
16
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.2.6 Frage: Wieviele Primzahlen gibt es? Betrachte dazu folgende Aussagen. Welche ist
schlüssig?
Je weiter man in der Reihe der natürlichen Zahlenreihe fortschreitet, um so seltener werden die Primzahlen. Irgendwann muss ihre Folge aufhören. Folglich gibt es nur endlich viele
Primzahlen.
Aus obiger Aussage über die abnehmende Häufigkeit der Primzahlen kann man nicht schließen, dass es nur endlich viele Primzahlen gibt. Auch die unendlich vielen Quadratzahlen 1, 4,
9, 16, 25 usw. werden ja immer seltener.
Euklid wusste bereits: Zu je endlich vielen Primzahlen p1 , p2 . . . . , pn gibt es immer noch eine
weitere. Euklid hat aus p1 , . . . , pn auf einfachste Weise eine Zahl N > 1 gebildet, die durch keine
der Primzahlen p1 , . . . , pn teilbar ist. Jeder der Primfaktoren von N ist also von den p1 , . . . , pn
verschieden.
Überlege Dir: Kann die Zahl 2 · 3 · 5 + 1 durch eine der Primzahlen 2, 3, 5 teilbar sein? Nun
3 zum Beispiel ist ja ein Teiler von 2 · 3 · 5, aber nicht von 1. Wäre 3 ein Teiler der Summe
2 · 3 · 5 + 1, so wäre 3 auch einer von (2 · 3 · 5 + 1) − 2 · 3 · 5 = 1. Ebensowenig sind 2 und 5
Teiler von 2 · 3 · 5 + 1.
Allgemein seien p1 , p2 , . . . , pn endlich viele Primzahlen, so kann keine von ihnen ein Teiler der
Zahl N = p1 · p2 · · · pn + 1 sein. Da N > 1 ist, hat N mindestens einen Primfaktor p, der aber
von den Primzahlen p1 , p2 , . . . , pn verschieden sein muss.
1.2.7 Erstaunlicher Weise kann man mit fast demselben Verfahren beweisen, dass die Lücken
zwischen aufeinander folgenden Primzahlen beliebig groß sein können. Seien nämlich p1 =
2, p2 = 3, . . . , pn , pn+1 die ersten (d.h. kleinsten) n + 1 Primzahlen (und n ≥ 1), und sei
m = p1 p2 · · · pn . Wir haben ja soeben gelernt, dass m + 1 durch keine der Primzahlen p1 , . . . , pn
teilbar ist. Aber im Gegensatz dazu ist jede der Zahlen m + 2, m + 3, m + 4, . . . , m + pn+1 − 1
durch eine der Primzahlen p1 , . . . , pn teilbar. Es ist ja m + 2 durch 2 teilbar, m + 3 durch 3,
m + 4 durch 2, und so weiter. Keine der Zahlen m + 2, . . . , m + pn+1 − 1 kann also eine Primzahl
sein.
(Im obigen Beispiel ist m = 30 und m + 2 durch 2, und m + 3 durch 3, und m + 4 durch 2,
ferner m + 5 durch 5 und schließlich m + 6 durch 2 (auch durch 3) teilbar.)
Beispiel 1.2.8 In obigem Beispiel ist 2 · 3 · 5 + 1 = 31 wieder eine Primzahl. Das muss nicht
immer so sein:
2 · 3 · 5 · 7 · 11 · 13 + 1 = 30031 = 59 · 509.
Man prüft leicht nach, dass 59 und 509 Primzahlen sind. Und sie sind – wie es sich gehört –
von den Primzahlen 2, 3, 5, 7, 11, 13 verschieden.
Wir haben uns überlegt, dass die Zahlen 30032, 30033, . . . , 30046 alle keine Primzahlen sind.
In der Tat sind (gemäß einer Primzahltafel) die Zahlen 30029 und 30047 Primzahlen, zwischen
denen es keine weiteren gibt.
1.2. PRIMZAHLEN
17
Bemerkung 1.2.9 Jede natürliche Zahl erhält man, indem man zur 0 eine gewisse Anzahl von
1-en addiert:
0 + 1 + 1 + ··· + 1
In Bezug auf die Multiplikation gilt etwas analoges jedenfalls für die von 0 verschiedenen natürlichen Zahlen. Nämlich man erhält jede solche Zahl, indem man 1 mit einer gewissen Anzahl von
Primzahlen multipliziert:
1 · p1 · p2 · · · pn
Die Primzahlen spielen also für die Multiplikation dieselbe Rolle wie die 1 für die Addition. Die
0 für die Addition entspricht der 1 für die Multiplikation, die man deshalb nicht als Primzahl
ansieht. (Der Zahl m = 1 · p1 · p2 · · · pn kommt man von 1 · p1 · · · pk aus, wo k < n ist, durch die
Multiplikation mit pk+1 einen Schritt näher. Das wäre nicht so, wenn man die 1 als Primzahl
auffasste und pk+1 = 1 wäre!)
Bezeichnung: Die Menge (Gesamtheit) der Primzahlen wird mit P bezeichnet.
1.2.10 Wozu sind Primzahlen gut?
Nachdem man mindestens 24 Jahrhunderte lang Primzahlen fast nur als interessante Objekte
der ‘reinen’ Mathematik angesehen hat (es gibt ein etwa 1000 Seiten dickes Buch über Primzahlen), haben Mathematiker und Informatiker vor einigen Jahrzehnten wichtige Verschlüsselungsmethoden erfunden, die Kenntnisse über Primzahlen verwenden.
Angenommen, Du hast einen verschlüsselten Text und weißt, wie die Verschlüsselung vorgenommen wurde. Dann sollte man doch meinen, Du könntest den verschlüsselten Text auch
wieder entschlüsseln.
Dem ist nicht so!
Was man bei kleinen natürlichen Zahlen noch nicht so richtig merkt, bei großen natürlichen
Zahlen ist es ungeheuer mühsam, diese in Primfaktoren zu zerlegen. Ja, bei sehr großen Zahlen
etwa mit 300 oder mehr Dezimalstellen ist es – außer in speziellen Fällen – schlechterdings
auch mit Computer-Hilfe nicht möglich. (Es sei denn Du hättest einen Computer, der die
Quantenstruktur der Materie ausnutzt, einen sogenannten Quantencomputer. Solche gibt es
zwar der Idee nach, aber in der Realität noch nicht wirklich.)
Ich muss gestehen, bislang ist es nur eine Erfahrungstatsache, dass man große Zahlen nur mit
großem Aufwand in ihre Primfaktoren zerlegen kann. Mathematisch bewiesen ist es bis jetzt
nicht.
Andererseits kann man sehr wohl, von Zahlen der angegebenen Größenordnung mit ComputerHilfe in wenigen Sekunden oder Minuten feststellen, ob sie prim sind – ohne eine Faktorzerlegung
im negativen Falle angeben zu können. Wie man das macht, kann ich leider im Rahmen dieses
Buches nicht beschreiben.
Auf Grund dieser Diskrepanz ist es möglich, Texte nach einem öffentlich gemachten Schlüssel
zu verschlüsseln, die man ohne eine zusätzliche Information nicht mehr enschlüsseln kann. Wie
dieses geht, erfährst Du ganz am Ende dieses Buches.
18
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
AUFGABEN
1. a) Zeige, dass jede natürliche Zahl n, die nicht durch 3 teilbar ist, sich in der Form
n = 3m ± 1 mit einem geeigneten m ∈ N schreiben lässt.
b) Welche Primzahlen p haben die Eigenschaft, dass auch 2p2 + 1 (bzw. p2 + 2) eine
Primzahl ist? (Du kannst a) benützen.)
2. Zerlege 15! := 1 · 2 · 3 · · · 15 in Primfaktoren.
3. Finde zu jeder geraden Zahl n mit 4 ≤ n ≤ 50 Primzahlen p, q mit p + q = n. (Dabei darf
p = q sein.) Leider weiß man bis heute nicht, ob dies für alle geraden Zahlen > 3 möglich
ist.
4. Zeige: Eine ganze Zahl zwischen 8 und 120 (einschließlich) ist genau dann eine Primzahl,
wenn sie durch keine der Zahlen 2, 3, 5 oder 7 teilbar ist. (Versuche, ein allgemeines
Gesetz zu formulieren.)
5. 101 Senatoren wählen 2 Konsuln. Jeder wählt zwei (verschiedene) Kandidaten. (Enthaltung sowie die Wahl nur einer Person sind verboten.)
Sind dann folgende Regeln oder auch nur eine von ihnen sinnvoll?
a) ‘Gewählt ist, wer mindestens 51 Stimmen hat.’
b) ‘Wer im ersten Wahlgang weniger als 51 Stimmen bekommen hat, wird kein Konsul.’
1.3
Potenzen mit natürlichen Exponenten
1.3.1 Potenzen: Bekanntlich definiert man an := a · · · a, wobei die Anzahl der Faktoren
gleich n ist. Dies ist eine klare Definition, wenn n ≥ 2 ist. Und ich denke auch a1 = a ist dann
klar. Wir haben ja bereits einmal ein Produkt aus nur einem Faktor anerkannt.
Offenbar ist an+1 = an · a. Damit diese Regel auch für n = 0 gilt, muss man a0 = 1 setzen –
jedenfalls wenn a 6= 0 ist. Es gibt gute Gründe, auch
00 = 1
zu definieren. Wir wollen dies so machen!
(Erinnere Dich daran, dass in der Potenz an die Zahl a als die Basis, die Zahl n als der
Exponent bezeichnet wird.)
Für natürliche Zahlen a, b, m, n gelten, wie Du wahrscheinlich bereits weißt oder leicht siehst,
folgende drei Gesetze (Regeln):
am+n = am · an ,
(ab)n = an · bn ,
Diese Regeln kannst Du wie folgt einsehen:
amn = (am )n
1.3. POTENZEN MIT NATÜRLICHEN EXPONENTEN
19
Wenn man ein Produkt aus m einander gleichen Faktoren a mit einem ebensolchen aus n
Faktoren multipliziert, erhält man ein ebensolches Produkt aus m + n Faktoren.
Ein Produkt aus n Faktoren der Form ab kann man durch Vertauschung der Faktoren als
ein Produkt aus 2n Faktoren schreiben, derart dass die ersten n gleich a und die letzten n
gleich b sind. Dabei benutzt man allerdings die Kommutativität der Multiplikation, während
zur Gültigkeit der ersten Regel nur die Assoziativität gebraucht wird.
Die dritte Regel kann man auf die erste zurückführen:
amn = am+···+m = am · · · am = (am )n
wobei im zweiten Term der Exponent die n-fache Summe von m ist und der dritte Term das nfache Produkt von am ist. Auch hier wird nur die Assoziativität und nicht die Kommutativität
der Multiplikation gebraucht.
Die ersten beiden Regeln entsprechen dem Distributivgesetz zwischen Multiplikation und Addition. Beachte aber, dass dabei die Basen und die Exponenten der Potenzen verschieden behandelt werden.
2
Aus dem dritten Gesetz folgt (23 )2 = 26 = 64, während = 2(3 ) = 29 = 512 ist! Potenzieren ist
c
c
2
nicht assoziativ! Beachte: Man definiert ab := a(b ) . Demgemäß ist 23 = 512.
Achtung: In der Potenzrechnung sind ‘Gesetze’, die nur so ähnlich wie die obigen
aussehen, meist falsch!
22+2 6= 22 + 22 ,
23−2 6= 23 − 22 ,
(1 + 1)2 6= 12 + 12 , 22·3 6= 22 · 23
√
√
√
Mit Wurzeln muss man genauso vorsichtig umgehen: Berechne 9 + 16 und 9 + 16. Ebenso
1+1
1
1
2
2
muss man bei iterierten Potenzen aufpassen: Berechne 23
und 23 · 23 , ferner 23 · 23 und
(23 · 23 )2 .
1.3.2 Wir studieren die Potenzen von 2, um uns einen Eindruck ihres Wachstums zu machen:
20 = 1, 21 = 2, 22 = 4, 23 = 8, . . . , 29 = 512, 210 = 1024, . . . .
Wir wollen versuchen, diese in einem (Funktions)-Diagramm darzustellen, und zwar mit der
Einheit 1 mm : Wandert man vom Nullpunkt aus auf der waagerechten Achse um 5 mm nach
rechts, so müssen wir von dort um 32 mm nach oben gehen, um den Wert 25 = 32 abzutragen. 4
mm weiter müssen wir schon um 51,2 cm nach oben gehen. Der entsprechende Punkt passt nicht
mehr auf die Buchseite. In einem Ballon, der 220 mm hoch über dem Meeresspiegel schwebt,
können wir bequem den Kahlen Asten überqueren. Und 223 mm ist etwa die Höhe des Himalaja.
Und ist man auf der x-Achse bei 39 mm angelangt, so ist der Punkt, der den Wert 239 beschreibt,
schon weiter als der Mond entfernt!
Man spricht von exponentiellem Wachstum.
Wäre es nicht schön, 2x auch für nichtganze x definieren zu können? Man kann! Davon handelt
das Kapitel 5.
20
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.3.3 Fakultät Noch stärker wächst die Folge der n! (n-Fakultät). Dabei wird
n! := 1 · 2 · 3 · · · n definiert.
Offenbar ist n!(n + 1) = (n + 1)! . Damit dies auch für n = 0 gilt, setzt man 0! = 1.
Berechne (3!) · (3!), (3 + 3)! und (3 · 3)! . (Bist Du zu faul zu rechnen, erkenne zumindest, dass
(3!) · (3!) < (3 + 3)! < (3 · 3)! gilt. Welche der angegebenen Zahlen haben den Primfaktor 5,
welche den Primfaktor 7?)
Bemerkungen 1.3.4 a) Auch wenn n! für gar nicht so große Zahlen schon riesig ist, sind doch
die Primfaktoren von n! nicht größer als n. Man kann verhältnismäßig leicht berechnen, wie oft
eine Primzahl in der Primfaktorzerlegung von n! vorkommt. Davon später.
b) Wäre es nicht schön, x! auch für nichtganze x definieren zu können? Man kann! Schlage
unter dem Stichwort ‘Gamma-Funktion’ nach – etwa in der Wikipedia oder in Forsters
Analysis I oder vielen anderen Texten.
Die beiden Aussagen aus Abschnitt 1.2.1 über die Möglichkeit und Eindeutigkeit der Primfaktorzerlegung positiver ganzer Zahlen kann man auch folgendermaßen ausdrücken:
Satz 1.3.5 Seien p1 , p2 , p3 , . . . die Primzahlen in ihrer natürlichen Reihenfolge, d.h. p1 =
2, p2 = 3, p3 = 5 usw. Jede natürliche Zahl n ≥ 1 lässt sich eindeutig als unendliches Potenzprodukt folgender Form schreiben:
n = pa11 pa22 pa33 · · ·
Dabei sind die ai ∈ N, dürfen insbesondere 0 sein. Ja, bis auf endlich viele i sind alle ai = 0.
Das Produkt hat dann unendlich viele Faktoren, die gleich 1 sind, und nur endlich viele Faktoren
die von 1 verschieden sind. Wir geben diesem (unendlichen) Produkt einen Sinn, indem wir das
Produkt unendlich vieler Einsen als 1 definieren.
1.3.6 Zum Beispiel wird der Zahl 24 auf diese Weise die Folge (3, 1, 0, 0, 0, . . .) zugeordnet und
der Zahl 25 die Folge (0, 0, 2, 0, 0, 0, . . .), da einerseits 24 = 23 · 31 · 50 · 70 · 110 · · · und andererseits
25 = 20 · 30 · 52 · 70 · 110 . . . ist. Der Zahl 1 wird die Folge (0, 0, 0, . . .) zugeordnet
In einem abstrakten Sinne gibt es also genau so viele Folgen der o.a. Art, wie natürliche Zahlen
≥ 1. Ist das nicht überraschend?
(In diesem abstrakten Sinne, gibt es auch nicht mehr Brüche natürlicher Zahlen als natürliche
Zahlen selbst. Versuche Dich an dieser Aussage! Sie wird im Kapitel 4 behandelt.)
Wenn man eine natürliche Zahl als Potenzprodukt von Primzahlen, d.h. als eine gewisse Folge
natürlicher Zahlen, auffasst, entspricht dem Produkt in N1 die Summe im Bereich der Folgen
natürlicher Zahlen, wobei
(a1 , a2 , a3 , . . .) + (b1 , b2 , b3 , . . .) := (a1 + b1 , a2 + b2 , a3 + b3 , . . .)
1.4. BRÜCHE
21
definiert ist. In einem abstrakten Sinn ist also die Multiplikation natürlicher Zahlen nicht viel
komplizierter als ihre Addition. (Das hilft allerdings gar nichts, wenn man die Primfaktozerlegung der Faktoren nicht leicht berechnen kann.)
Die Schwierigkeit und der Reiz der Zahlentheorie entstehen erst, wenn man Addition und
Multiplikation zugleich betrachtet.
1.4
Brüche
a
Vorbemerkung: Brüche schreibe ich meist in der Form , gelegentlich aber auch in der Form
b
a/b.
1.4.1 Seien a, b, a0 , b0 natürliche Zahlen mit b, b0 6= 0. Dann gilt bekanntlich
a a0
aa0
· 0 = 0
b b
bb
(1.1)
(Formal kann man diese Regel als Definition ansehen. Aber wenn man von ihr verlangt, dass
sie gewisse Anforderungen erfüllen soll, ergibt sie sich zwangsläufig, wie Du unten sehen wirst.)
Warum soll dann eigentlich nicht auch
a a0
a + a0
+ 0 =
gelten???
b
b
b + b0
(1.2)
Wäre das jedoch richtig, so müsste auch
2
1
1 1
+ = =
gelten.
2 2
4
2
Nun soll aber die Zahl
1
2
doch gerade diejenige Zahl sein, für die
2·
1
1 1
= 1, d.h. + = 1
2
2 2
gilt. Die letzte oben vorgeschlagene ‘Regel’ ist also eine Unregel !!!
1.4.2 Wir betrachten Brüche als ‘Größen’. (Etwa als Längen von Strecken.) Der Bruch m
als
n
‘Größe’ hat folgende Bedeutung. Teile die (Maß-)Einheit in n gleiche Teile und nehme das
m-fache eines solchen Teiles. Dabei ist natürlich m1 mit m zu identifizieren.
m
= 0 (für m 6= ∞) zu
Bemerkung: Es ist nicht völlig unsinnig, m0 = ∞ (für m 6= 0) und ∞
setzen. In gewissen Zusammenhängen wird das auch gemacht. Aber den Ausdrücken 00 , ∞
,
∞
∞−∞ kann man keine sinnvollen Bedeutungen geben. Wir wollen das hier nicht weiter vertiefen,
sondern 0 als Nenner nicht zulassen!
22
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Aus der Vorstellung von
m
n
als Größe entnimmt man
m
km
=
falls k 6= 0.
n
kn
D.h. man darf erweitern und kürzen (nicht mit 0). Am elegantesten definiert man die Gleichheit
von Brüchen durch
m
m0
= 0 ⇐⇒ mn0 = m0 n.
n
n
0
Dies ist äquivalent dazu, dass man mit Erweitern und Kürzen von m
zu m
kommt. (Beweise
n
n0
das!)
0
1.4.3 Aus der Größenvorstellung ergibt sich auch sofort, wie man Brüche m
addiert.
und m
n
n0
Ist n = n0 , so sollte
m m0
m + m0
+
=
(1.3)
n
n
n
sein. Andernfalls kann man durch Erweitern erreichen, dass die Nenner gleich werden. Man
bekommt so die Regel
mn0 + m0 n
m m0
+ 0 =
(1.4)
n
n
nn0
Einfacher ist eine allgemeine Formel für die Addition von Brüchen nicht zu haben! (In der
Schule hast Du vielleicht keine Formel, sondern folgendes Verfahren zur Berechnung der
Summe zweier Brüche kennengelernt: Bestimme den kleinsten gemeinsamen Nenner der
Brüche, d.h. das kleinste gemeinsame Vielfache k von n und n0 , erweitere beide Brüche
so, dass k ihr Nenner wird und addiere dann gemäß 1.3. Wenn n und n0 nicht teilerfremd
sind, bedeutet dies, dass man mit kleineren Zahlen rechnen kann als nach Formel 1.4. Allerdings ist auch dann nicht garantiert, dass das Ergebnis bereits gekürzt ist. Beispiel: 13 + 16 = 12 .
0
1
3
1
2
2
3
1
Da wird der Physiker doch sagen: Da nehm ich meinen Taschenrechner, rechne m/n und m0 /n0
als Dezimalzahlen aus und addiere diese dann mit dem Rechner. Dagegen ist auch nichts zu
sagen. Aber wenn er etwa
x
x3
+
x2 + 1 x2 + 5
auf einen Bruchstrich bringen soll, so muss er es ganz genau so wie mit Brüchen von Zahlen
machen. Schön, wenn er dann weiß, wie’s geht!
1.4.4 Die Definition (1.1) des Produktes zweier Brüche wollen wir auch geometrisch begründen:
Wenn man ein Rechteck mit den Seitenlängen 1/3, bzw. 1/5 Meter hat, so kann man es 15-mal
in einem Quadrat, dessen Seiten 1 m lang sind, unterbringen. Es ist also 1/15 m2 groß. Ein
Rechteck mit den Seitenlängen 2/3 und 4/5 Meter ist dann (2 · 4)/15 m2 groß.
1.5. NEGATIVE ZAHLEN
23
1.4.5 Ist a durch b in N (oder Z) teilbar, so ist natürlich
beim Teilen durch b wird.
a
b
gleich der ganzen Zahl, die aus a
1.4.6 Für den Größenvergleich von Brüchen (mit positiven Nennern) gilt:
m
m0
<
⇐⇒ m < m0
n
n
1
1
Wann ist also < 0 ?
n
n
und allgemein
m
m0
< 0 ⇐⇒ mn0 < m0 n
n
n
1.4.7 Für die Addition und Multiplikation von Brüchen gelten dieselben grundlegenden Gesetze wie bei den natürlichen Zahlen: Assoziativität, Kommutativität, Distributivität, Existenz
neutraler Elemente. Dies kannst Du leicht nachprüfen, d.h. auf die entsprechenden Gesetze für
die natürlichen Zahlen zurückführen – wenn es auch bei der Assoziativität der Addition und
der Distributivität etwas dauern mag.
1.5
Negative Zahlen
1.5.1 Im Bereich der natürlichen Zahlen kann man die Gleichung x + n = m genau dann nach
x auflösen, wenn n ≤ m ist. Es gibt dann genau eine natürliche Zahl d mit d + n = m. Diese
Zahl d wird mit m − n bezeichnet.
Dasselbe gilt für den Bereich der ‘nichtnegativen rationalen Zahlen, d.h. der Brüche natürlicher
Zahlen’, die wir bis jetzt betrachtet haben. Die Erweiterung dieser Bereiche um die sogenannten
negativen Zahlen erlaubt es, obige Gleichung immer zu lösen.
Die moderne Mathematik kann nicht auf negative Zahlen verzichten, z.B. um die Punkte einer
Ebene mit Koordinaten zu beschreiben. Bis jetzt haben wir natürliche Zahlen und Brüche von
solchen betrachtet. Zu jedem Bruch, bzw. jeder natürlichen Zahl q 6= 0 erfinden wir einen ‘entgegengesetzten’ Bruch, bzw. ’entgegengesetzte’ ganze Zahl −q. Ferner sei −0 = 0. Zusammen
mit den nichtnegativen Brüchen, bzw. natürlichen Zahlen ergeben sie die rationalen Zahlen,
bzw. die ganzen Zahlen. Bezeichnungen: Z bezeichnet die Menge der ganzen Zahlen, Q die
der rationalen Zahlen.
1.5.2 Geometrisch stellen wir uns die ganzen, bzw. rationalen Zahlen als Punkte auf einer
Geraden vor. Auf ihr ist ein Punkt als 0 (Nullpunkt) ausgezeichnet. Rechts von ihm liegen die
positiven Zahlen, insbesondere die 1, links von ihm die negativen Zahlen.
Insbesondere sind die Abstände aufeinanderfolgender ganzer Zahlen einander gleich. (Manchmal
betrachtet man ja auch einen logarithmischen Maßstab, hier nicht.) Wir sprechen von einer
Zahlengeraden. Allerdings werden wir bald sehen, dass man auf geometrische Weise Punkte auf
ihr konstruieren kann, die keiner rationalen Zahl entsprechen!
(Die Worte ‘rechts, links’ haben einen Sinn, wenn die Gerade in einem Buch oder auf einer
Tafel gezeichnet ist, wo die Richtungen ‘oben, unten’ ausgezeichnet sind und klar ist, von wo
man guckt.)
24
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.5.3 Wenn wir die nichtnegativen rationalen Zahlen durch die negativen rationalen Zahlen –
und damit auch die natürlichen Zahlen durch die negativen ganzen Zahlen – ergänzt haben, gibt
zu jeder rationalen Zahl r ein sogenanntes additiv Inverses −r = (−r). Dieses ist bestimmt
durch die Eigenschaft r + (−r) = (−r) + r = 0. Damit ist offenbar r auch ein additiv Inverses
von (−r), d.h. −(−r) = r.
Wenn man bereits negative Zahlen, also auch zu jeder Zahl ein additiv Inverses hat, braucht
man formal den Begriff einer Differenz nicht mehr. Statt a − b kann man ja a + (−b) schreiben.
Unter a − b − c + d versteht man a + (−b) + (−c) + d, etc.
1.5.4 Anordnung der rationalen Zahlen. Bezeichne mit Q+ die Menge derjengen rationalen Zahlen, die als Brüche natürlicher Zahlen geschrieben werden können. Wir wollen die Zahl
0 = 10 mit einschließen. (Mit Q− sei dann die Menge aller −a, für die a in Q+ liegt, bezeichnet.)
Die Ungleichung a ≥ b für a, b ∈ Q wird dann durch a − b ∈ Q+ definiert. Geometrisch bedeutet
das, dass a rechts von b liegt oder mit b übereinstimmt.
1.5.5 Ein paar Aufgaben zu Brüchen
a) Berechne
1 1
− ,
2 3
1 1
− ,
3 4
1
1
−
.
n n+1
Das Ergebnis der ersten Differenz hast Du oben bereits geometrisch gesehen.
b) Berechne damit
1
1
1
+
+ ··· +
.
1·2 2·3
n(n + 1)
c) Zeige:
1
1
1
1
+ 2 + 2 + · · · + 2 < 2,
2
1
2
3
n
sowie
1
1
1
1
1
+ + + + ··· +
< 3.
0! 1! 2! 3!
n!
1.5.6 Für ganze Zahlen m ≤ n definiert man
n
X
ak := am + am+1 + · · · + an , insbesondere
k=m
k=m
(Ist m > n so setzt man
m
X
n
X
ak = 0. )
k=m
Schreibe obige Summen in dieser Form.
ak = am
1.5. NEGATIVE ZAHLEN
25
1.5.7 Seien a, b positive rationale Zahlen. Warum ist eigentlich (−a)(−b) = ab?
Die richtige Frage ist: Warum definiert man dies so?“ Nun, wenn man naheliegender Weise
”
(−a)0 = 0 und (−a)b = −(ab) definiert, und das Distributivgesetz weiter gelten soll, so ist
einerseits (−a)(b + (−b)) = (−a)0 = 0, andererseits (−a)(b + (−b)) = (−a)b + (−a)(−b) =
−(ab) + (−a)(−b). Also ist (−a)(−b) das additiv Inverse von −(ab), also gleich ab.
Im nächsten Kapitel findest Du hierzu mehr.
Wir lassen auch Brüche
m
n
zu, wo m oder n negativ sind. Dafür gelten die Regeln
m
m
−m
m
−m
=
= − und
=
n
−n
n
−n
n
1.5.8 Hier ein Beispiel für den Nutzen negativer Zahlen. Die Gleichung
x2 + 312 = 37x
hat die Lösungen 13 und 24, wie man leicht durch Rechnen in N, also im Positiven nachprüft.
Das bekannte Lösungsverfahren – mit quadratischer Ergänzung – benutzt jedoch mit Gewinn
das Rechnen mit negativen Zahlen. An diesem Beispiel sieht man auch, wie richtig und wichtig
es ist, das Produkt negativer Zahlen so zu definieren, dass z.B. (−37)2 = 372 ist.
1.5.9 Der Satz über die Eindeutigkeit der Primfaktorzerlegung ist nicht nur für Bereich der
ganzen Zahlen von Bedeutung. Aus ihm folgt z.B., dass es keine rationale Zahl gibt, deren
Quadrat (2-te Potenz) gleich 5 ist. Das heißt, dass sich die Länge der Hypotenuse eines
rechtwinkligen Dreiecks dessen Katheten 1, bzw. 2 Fuß lang sind, sich zu 1 Fuß nicht wie m : n
mit – wie auch immer gewählten – natürlichen Zahlen m, n verhält.
√
Wenn Du mit einem Taschenrechner 5 = 2,2360679 ausrechnest und das Ergebnis quadrierst,
so erhältst Du 4,99999965341041, eine Zahl, die zwar ziemlich nahe bei 5 liegt, aber doch nicht
exakt gleich
√ 5 ist. Der Praktiker sagt – völlig zu Recht – ”Wenn Euch das noch nicht genügt,
genauer ausrechnen“. Aber uns Theoretiker
könnt ihr 5 mit einem Computer noch etwas √
interessiert nun einfach die Tatsache, dass man 5 durch einen endlichen (d.h. nach endlich
√
vielen Stellen abbrechenden) Dezimalbruch niemals völlig genau ausdrücken kann, ja dass 5
überhaupt kein Bruch ganzer Zahlen ist. (Abbrechende Dezimalbrüche lassen sich ja als Brüche
mit ganzem Zähler und ganzem Nenner schreiben, nicht wahr? Umgekehrt lassen sich allerdings
sehr viele Brüche ganzer Zahlen nicht als abbrechende Dezimalbrüche schreiben! Immerhin gibt
es in diesem Fall eine Periodizität.)
Satz 1.5.10 Es gibt keine ganzen Zahlen m, n mit
m 2
n
= 5.
m 2
Beweis: 5 ist sicher nicht das Quadrat einer ganzen Zahl. Wenn also
= 5 mit teilern
fremden m, n und n > 0 ist, so muss n > 1 sein. Wir zerlegen m und n in Primfaktoren:
m
p1 · · · pr
=
,
n
q1 · · · q s
26
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
wobei s ≥ 1 und wegen der Teilerfremdheit pi 6= qj für alle i, j ist. Durch Quadrieren erhält
man den Bruch
p21 · · · p2r
.
q12 · · · qs2
Neue Primzahlen treten nicht auf! Wegen der Eindeutigkeit der Primfaktorzerlegung kann man
hier sowenig kürzen wie vor dem Quadrieren. Der Bruch kann also keine ganze Zahl, also
insbesondere nicht gleich 5 sein.
Dem Beweis siehst Du sicher an, dass man in ihm die Zahl 5 ohne weiteres durch die Zahl 2
ersetzen kann. Ja, es gilt ganz allgemein:
Satz 1.5.11 Seien n, r natürliche Zahlen und r ≥ 2. Wenn n keine r-te Potenz einer ganzen
Zahl ist, kann n auch nicht die r-te Potenz einer rationalen Zahl sein.
Noch allgemeiner ist die Behauptung in Aufgabe 13.
1.5.12 Das Folgende darfst Du erst einmal überschlagen.
Wir wollen die Primfaktorzerlegung von n! bestimmen. Dazu treffe ich folgende Definitionen:
Sei n eine ganze Zahl 6= 0 und p eine Primzahl. vp (n) bezeichne die Anzahl der Primfaktoren
von n, die gleich p sind.
Also ist z.B. v2 (24) = 3, v3 (24) = 1 und vp (24) = 0 für alle Primzahlen p 6= 2, 3.
Man nennt vp (n) die Vielfachheit von p in n. Wir wollen eine Methode, vp (n!) zu berechnen,
angeben.
Gauß-Klammern. Für eine
rationale
3 (oder reelle) Zahl a sei mit [a] die größte ganze Zahl
3
≤ a bezeichnet, also z.B. 2 = 1, − 2 = −2
h i
h i h i h i
Behauptung: Es gilt vp (n!) = np + pn2 + pn3 + . . .. Ist m groß genug, wird pnm = 0.
D.h. wir haben in Wahrheit eine Summe, in der nur endlich viele Summanden ungleich 0 sind.
Eine solche Summe setzt man immer gleich der endlichen Summe ihrer von 0 verschiedenen
Summanden.
h i
Beweis der Behauptung: Der Summand np zählt aus jedem der Faktoren 1, 2, . . . , n von
h i
n!, der durch p teilbar ist, genau einen Primfaktor p. Der Summand pn2 zählt aus jedem der
h i
Faktoren 1, 2, . . . , n, der durch p2 teilbar ist, einen zweiten Primfaktor p. Der Summand pn3
zählt aus jedem der Faktoren 1, 2, . . . , n, der durch p3 teilbar ist, einen dritten Primfaktor p.
Und so weiter!
Insgesamt hat man jeden Primfaktor von n!, der gleich p ist, genau einmal gezählt.–
An dem speziellen Beispiel n = 13, p = 2 sei dieser Beweis noch einmal erläutert: Betrachte
(∗) 13! = 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8 · 9 · 10 · 11 · 12 · 13
1.5. NEGATIVE ZAHLEN
27
13
Es ist
= 6 die Anzahl der Faktoren, die durch 2 teilbar sind, d.h der Zahlen 2, 4, 6, 8, 10, 12
2
(Die anderen
Faktoren haben nicht den Primfaktor 2). Aus den Zahlen 2, 4, 6, 8, 10, 12 zähle
13
ich mit
= 6 zunächst nur je einmal den Primfaktor 2. Die Zahlen 2, 6, 10 sind damit
2
13
erledigt“, da sie den Primfaktor 2 nur einmal haben.
= 3 ist die Anzahl der Faktoren
”
22
13
2
aus (∗), die durch 2 teilbar sind, d.h. der Zahlen 4, 8, 12. Aus diesen zähle ich mit
=3
22
13
jetzt je einen zweiten Primfaktor 2. Es ist
= 1. D.h. es gibt in (∗) genau einen Faktor,
23
13
3
nämlich 8, der durch 2 teilbar ist. Dessen ‘dritten’ Primfaktor 2 zähle ich mit 3 = 1.
2
13
Für k ≥ 4 ist k = 0 und es ist auch keiner der Faktoren aus (∗) durch 2k mit k ≥ 4 teilbar.
2
13
13
13
Die Summe
+ 2 + 3 = 6 + 3 + 1 zählt
2
2
2
aus den Zahlen 2, 4, 6, 8, 10, 12 je einmal den Primfaktor 2, dazu
aus den Zahlen 4, 8, 12 je ein zweites Mal den Primfaktor 2 und dazu schließlich
aus der Zahl 8 ein drittes Mal den Primfaktor 2.
Ich hoffe, Du siehst, dass auf diese Weise jeder Primfaktor 2 in einer Primfaktorzerlegung aller
Faktoren aus (∗) genau einmal erwischt wird.
AUFGABEN
1. Löse die folgenden Gleichungen, oder zeige, dass es in dem einen oder anderen Fall nicht
möglich ist:
4
2
− 16
+ 76
3
3
=
1
,
1
7
1 = 1
3
−
+
4
x
6
x
2. Zwei Menschen wandern einander auf einer geraden Straße entgegen. Der eine startet
23 km
in A und wandert mit einer Geschwindigkeit von
. Der zweite startet im 19,5 km
6 h
entfernten B eine halbe Stunde später als der erste und wandert mit der Geschwindigkeit
21 km
. Wann und wo treffen sich die beiden?
4 h
3. Seien p1 , . . . , pn verschiedene Primzahlen mit n ≥ 2. Zeige: Der Nenner von
n
X
1
a :=
p
j=1 j
in der gekürzten Form ist p1 · · · pn . (D.h. nach erfolgter Addition der auf den kleinsten
gemeinsamen Nenner gebrachten Summanden kann man nicht kürzen.) Insbesondere gilt
a∈
/ Z. (Wenn Du die erste Aussage nicht sofort beweisen kannst, zeige zunächst die letzte.
Ist p1 · · · pn−1 a ∈ Z?)
28
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
4. Zeige: Für n ≥ 2 ist a :=
n
X
1
keine ganze Zahl. (Tipp: Sei m das kleinste gemeinsame
k
k=2
Vielfache aller Nenner. Was gilt für am/2 ? Betrachte die größte 2-Potenz unter den
Nennern.)
n
X
1
5. Zeige: Für n ≥ 2 ist a :=
keine ganze Zahl.
k!
k=2
6. Opa“, rief Peter Opapa! Wie alt wirst Du in 11 Tagen?“
”
”
Opa fühlte sich in seinem Mittagsnickerchen gestört und antwortete unwirsch: Na, das
”
weißt Du doch! Sechsundsechzig.“
Aber Opa, weißt Du auch, was herauskommt, wenn man eins und zwei und drei und so
”
weiter bis elf zusammenzählt?“
Na, lass mal sehen. Also elf mal zwölf, geteilt durch zwei macht sechsundsechzig, in der
”
Tat.“
Siehst du? Aber Du solltest doch zusammenzählen und nicht malnehmen und teilen.
”
Warum hast Du denn das gemacht?“
Um Zeit zu sparen. Sieh mal her! Ich denke mir die Zahlen von eins bis elf hingeschrieben,
”
und dann noch einmal darunter in umgekehrter Reihenfolge:
1 2 3 4 5 6 7 8 9 10 11
11 10 9 8 7 6 5 4 3 2 1
Wenn du je zwei Zahlen, die übereinander stehen, zusammenzählst, was kommt dann
heraus?“
Zwölf, Opa. Und zusammen bekomme ich elf mal zwölf. Dann muss ich aber noch durch
”
zwei teilen,“ sprudelte Peter immer hastiger hervor weil ich ja jede Zahl zweimal hinge”
schrieben habe. Toll!“
Da grinste der Opa, und Peter dachte: Opa ist ja wieder ganz wirsch. Na klar, wenn
”
er mit seiner Mathe angeben kann!“ Mit dieser feinen psychologischen Erkenntnis lag er
nicht ganz falsch.
P
Deine Aufgabe ist nun, für ganze Zahlen x, y mit x > y die Summe xk=y k in eine andere
Form zu bringen!
7. Bestimme die Summe der ersten n ungeraden natürlichen Zahlen, d.h.
n
X
(2k − 1)
k=1
◦
•
◦
◦
◦
• •
• •
◦
◦
◦
◦
◦
• • •
• • •
• • •
◦
◦
◦
◦
◦
◦
◦
1.5. NEGATIVE ZAHLEN
29
8. Seien a, b ganze Zahlen. Bestimme die (eindeutige) Lösung des folgenden linearen Gleichungssystems im Bereich Q der rationalen Zahlen.
x+y =a
x−y =b
Offenbar ist die Lösung genau dann ganzzahlig, wenn entweder a und b beide gerade oder
a und b beide ungerade sind.
9. Jede ganze Zahl ist trivialerweise eine Summe von zwei oder mehr aufeinander folgenden
ganzen Zahlen. Z.B. ist 2 = −1+0+1+2 (und 0 =?). Hingegen ist nicht jede positive ganze
Zahl eine Summe von zwei oder mehr aufeinanderfolgenden positiven ganzen Zahlen. Zum
Beispiel sind 1, 2, 4, 8 nicht von dieser Art.
Bestimme alle (positiven ganzen) Zahlen n, die sich als Summe von zwei oder mehr
aufeinander folgenden positiven ganzen Zahlen schreiben lassen.
P
(Benutze die beiden vorangehenden Aufgaben! Da n = xk=y k = 21 (x + y)(x − y + 1) und
x > y > 0 sein soll, kommt es darauf an, ob man 2n als Produkt eines geraden und eines
ungeraden Faktors schreiben kann, die beide ≥ 2 sind, nicht wahr?)
10. Ebenfalls mit Aufgabe 7 und 8 kann man folgende Fragen beantworten:
a) Welche ganzen Zahlen kann man als Differenz zweier Quadrate ganzer Zahlen schreiben?
b) Kann eine Gleichung der Form x2 − y 2 = a mit festem a ∈ Z im Bereich der ganzen
Zahlen unendlich viele Lösungen haben? Wie ist es im Bereich der reellen Zahlen?
d) Welche ganzen Zahlen sind von der Form
x2 + y 2 − z 2 (x, y, z ∈ Z) ?
e) (Am 6. Dezember zu lösen.) Frau Nicole Niklas wurde von ihrem Sohn Kolja gefragt,
wie alt sie sei. Aus verständlichen Gründen gab sie nur eine verschlüsselte Antwort: Wenn
Du die vierte Potenz meines Alters von der vierten Potenz des Alters Deines Vaters Klaus
abziehst, erhältst Du die Zahl 1606160. Wie alt sind Klaus uns Nicole Niklas? (Mit dem
Alter ist jeweils eine ganze Anzahl von Jahren gemeint.) Natürlich darfst Du zur Lösung
dieser Aufgabe einen Taschenrechner benutzen. Ein ziemlich primitiver reicht.
a
a
11. Vereinfache
+
.
(k + 1)!(n − k − 1)! k!(n − k)!
12. Gib systematisch alle Tripel (a, b, c) ganzer Zahlen an, für die folgendes gilt:
0 < a ≤ b ≤ c und
1 1 1
+ + ∈Z
a b c
13. Seien a1 , . . . , an ganze Zahlen und x eine rationale Zahl mit xn +a1 xn−1 +· · ·+an−1 x+an =
0. Zeige, dass x ganz ist. (Wichtig ist dabei, dass der Koeffizient von xn gleich 1 ist. Im
Bereich Z kann man ja nicht immer durch den Koeffizienten von xn dividieren!)
mr
1
14. Sei n > 1 eine ganze Zahl und n = pm
1 · · · pr ihre Primfaktorzerlegung mit untereinander
verschiedenen Primzahlen pi . Wieviele (positive) Teiler hat n?
30
1.6
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Vollständige Induktion
1.6.1 Ein sehr mächtiges Beweismittel für Aussagen, die man für alle natürlichen Zahlen beweisen möchte, ist die vollständige Induktion.
Sei A(x) eine Aussage über natürliche Zahlen x mit folgenden beiden Eigenschaften:
(i) (Induktionsanfang) A(0) ist richtig,
(ii) (Induktionsschritt) für alle n ∈ N folgt A(n + 1) aus A(n).
Dann gilt A(n) für alle n ∈ N.
Denn angenommen, ich soll A(m) für ein beliebiges (festes) m beweisen.
Wegen (i) gilt die Aussage A(0). Wegen (ii) folgt hieraus A(1); wieder wegen (ii) folgt (aus der
letzten Aussage) A(2); wieder wegen (ii) folgt A(3); und so weiter, bis ich bei A(m) angelangt
bin.
Statt direkt A(n) für alle n zu zeigen, muss man nur für alle n die bedingte Aussage
A(n) ⇒ A(n + 1)
beweisen. Und das ist häufig einfacher.
Der Name ‘Vollständige Induktion’ kommt folgendermaßen zustande: Ein Gesetz durch Induktion zu begründen, heißt, es aus Einzelfällen abzuleiten. So müssen es die Naturwissenschaftler tun.
‘Vollständige’ Induktion bedeutet, ein Gesetz zu beweisen, indem man es für jeden Einzelfall zeigt.
(Allerdings lässt man das Wort ‘vollständig’ aus Faulheit meist weg.)
Sollte Dir das Ganze etwas rätselhaft erscheinen, arbeite die folgenden Beispiele durch!
Beispiele 1.6.2 a) Wir beweisen, dass
n
X
2k := 20 + 21 + · · · + 2n = 2n+1 − 1 ist.
k=0
(Dies ist eine spezielle geometrische Reihe. Allgemeine geometrische Reihen werden später behandelt.)
Induktionsanfang: n = 0. Wir müssen
0
X
2k = 20+1 − 1 beweisen.
k=0
Nun, beide Seiten sind gleich 1.
Induktionsschritt: Wir müssen
n
X
k=0
k
n+1
2 =2
− 1 =⇒
n+1
X
k=0
2k = 2(n+1)+1 − 1 beweisen.
1.6. VOLLSTÄNDIGE INDUKTION
D.h. wir müssen
n+1
X
k
(n+1)+1
2 =2
−1 beweisen und dürfen dazu
k=0
31
n
X
2k = 2n+1 −1 voraussetzen.
k=0
Aus letzterer Gleichung folgt
n+1
X
k=0
k
2 =
n
X
2k + 2n+1 = 2n+1 − 1 + 2n+1 = 2 · 2n+1 − 1 = 2n+1+1 − 1.
k=0
b) Wir beweisen die ‘Bernoullische Ungleichung’
(1 + a)n ≥ 1 + na für alle natürliche Zahlen n und rationale a ≥ −1 .
Der Induktionsanfang n = 0 ist klar.
Wir beweisen die Ungleichung für n + 1 unter der Voraussetzung, dass sie für n gelte:
(1 + a)n+1 = (1 + a)n (1 + a) ≥ (1 + na)(1 + a) = 1 + (n + 1)a + na2 ≥ 1 + (n + 1)a .
Dabei haben wir benutzt, dass wegen der Voraussetzung (1 + a) ≥ 0 ist und dass a2 und n auch
beide ≥ 0 sind.
(Diese Ungleichung gilt natürlich auch für beliebige reelle Zahlen a ≥ −1. Sie gilt auch für
reelle Exponenten, die ≥ 1 oder ≤ 0 sind. Falls a ≥ −1 und 0 < r < 1 ist, gilt (1 + a)r ≤ 1 + ra.)
c) Eine hübsche Anwendung des Induktionsprinzips ist der Beweis, dass man in dem – im
folgenden beschriebenen – Spiel (Puzzle) der Türme von Hanoi“ (Lucas) immer zum Ziele
”
kommen kann.
Das Spiel besteht aus einem Stapel von n kreisrunden Scheiben, die gleich dick sind, aber
paarweise verschiedene Durchmesser haben. Sie liegen der Größe nach aufeinander, die größte
Scheibe unten, auf einem von 3 Spielfeldern.
Die Aufgabe ist nun, diesen Stapel in mehreren Schritten auf ein anderes der drei Spielfelder auf
folgende Weise zu bringen: Bei jedem Schritt ist eine Scheibe auf ein anderes Spielfeld bzw. auf
einen dort bereits befindlichen Stapel zu legen, ohne dass jemals eine größere Scheibe auf einer
kleineren zu liegen kommt. (In den praktischen Ausführungen dieses Spiels haben in der Regel
die Scheiben in der Mitte ein Loch und werden durch drei senkrecht stehende Stäbe fixiert.)
Beim Beweis verwende man Induktion nach n. Oder man schließe mit Induktion nach k, wobei
die Aussage A(k) bedeuten soll: Man kann die k obersten Scheiben des Ausgangsstapels auf
eines der beiden anderen Spielfelder den Spielregeln gemäß stapeln.
d) Vielleicht hast Du den Wunsch, die häufig benutzte Möglichkeit der Division mit Rest exakt
zu beweisen. Zu n, m ∈ N mit m > 0 gibt es eindeutig bestimmte q, r ∈ N mit n = qm + r und
r < m.
Verwende Induktion nach n, wobei der Fall n = 0 trivial ist. Induktionschritt. Nimm n = qm+r
mit r < m an. Dann ist n + 1 = qm + r + 1. Unterscheide zwei Fälle: 1. r < m − 1. Dann ist
r + 1 der neue Rest. 2. r = m − 1. Dann ist n + 1 = qm + m = (q + 1)m + 0.
32
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Zur Eindeutigkeit: Sei n = qm + r = q 0 m + r0 (mit r, r0 < m) und etwa r ≤ r0 . Dann ist
r0 − r = n − n + qm − q 0 m = (q − q 0 )m. Also gilt 0 ≤ r0 − r < m − 0 und andererseits ist r0 − r
durch m teilbar. Das ist aber nur möglich, wenn r0 − r = 0 ist. Dann ist qm = q 0 m, also q = q 0 ,
da m > 0 gilt.
Bemerkungen 1.6.3 Das Induktionsprinzip wird häufig etwas variiert.
a) Wenn man mit dem Induktionsprinzip eine Aussage A(x) nur für alle natürlichen Zahlen
zeigen will, die ≥ einer gewissen Zahl k sind (etwa weil A(n) für n < k falsch ist oder keinen Sinn
hat), so kann man als Induktionsanfang die Aussage A(k) beweisen und dann die Implikation
A(n) ⇒ A(n + 1) für alle n ≥ k zeigen. (Formal kann man diese Methode auf das erstgenannte
Induktionsprinzip zurückführen, indem man dieses auf die Aussage B(x) := A(x+k) anwendet.)
b) Häufig benutzt man die vollständige Induktion in der Art, dass man die Aussage A(n + 1)
aus allen A(k) mit k ≤ n ableitet.
(Auch dies lässt sich formal auf das o.a. Induktionsprinzip zurückführen, indem man dieses auf
die Aussage B anwendet, wo die Gültigkeit von B(n) bedeuten soll, dass A(k) für alle k ≤ n
gilt.)
1.6.4 Weitere Beispiele. a) Wir zeigen mit Induktion
n
X
n(n + 1)
n(n + 1)
1 + 2 + ··· + n =
d.h.
k=
für alle n ∈ N1 .
2
2
k=1
Du kennst das von Aufgabe 6 des letzten Abschnittes. Aber es sei hier zur Übung noch einmal
mit Induktion nach n gezeigt.
Wähle n = 1 als Induktionsanfang. Wir haben 1 = 1·2
zu zeigen. Kein Problem!
2
Pn
Pn+1
Induktionsschluss: Unter der Voraussetzung k=1 k = n(n+1)
zeigen
wir
k=1 k =
2
(n+1)(n+2)
.
2
Dazu rechnen wir
n+1
X
k=1
k=
n
X
k + (n + 1) =
k=1
n(n + 1)
n(n + 1) + 2(n + 1)
(n + 2)(n + 1)
+n+1=
=
2
2
2
Wenn wir jetzt noch die Kommutativität der Multiplikation nutzen, sind wir fertig.
b) Wir zeigen
n
X
n2 (n + 1)2
n2 (n + 1)2
3
1 + 2 + ··· + n =
d.h.
k =
4
4
k=1
3
3
3
für alle ganzen n ≥ 1. Wieder benutzen wir Induktion nach n. Der Induktionsanfang ist wieder
trivial.
Jetzt rechnen wir
n+1
X
k=1
3
k =
n
X
k=1
k 3 + (n + 1)3 =
n2 (n + 1)2
+ (n + 1)3 =
4
1.6. VOLLSTÄNDIGE INDUKTION
33
n2 (n + 1)2 + 4(n + 1)3
(n2 + 4(n + 1))(n + 1)2
(n + 1)2 (n + 2)2
=
=
4
4
4
Fertig!
c) Was kann man aus a) und b) sofort schließen? Na klar!
n
X
k=1
k3 =
n(n + 1)
2
2
=
n
X
!2
k
k=1
oder schön ausgeschrieben:
13 + 23 + · · · + n3 = (1 + 2 + · · · + n)2 .
Na, wenn das nichts ist?
1.6.5 Peano-Axiome. Will man die natürlichen Zahlen axiomatisch beschreiben, so wird aus
dem Induktionsprinzip ein Axiom.
Die Menge der natürlichen Zahlen kann man folgendermaßen axiomatisch beschreiben:
N ist eine Menge zusammen mit einem ausgezeichneten Element 0 ∈ N und einer Abbildung
N → N, n 7→ n0 derart, dass folgendes gilt:
(i) n0 = m0 ⇐⇒ n = m
(ii) 0 6= n0 für alle n ∈ N
Ist M eine Teilmenge von N mit den Eigenschaften 0 ∈ N und [n ∈ M ⇒ n0 ∈ M ], so ist
M = N.
Bemerkung 1.6.6 Hier wurde n0 (der Nachfolger von n) anstelle von n + 1 geschrieben, da
die Addition erst im Nachhinein definiert werden soll, und zwar so:
Es sei n + 0 := n und n + m0 = (n + m)0 . Dadurch wird die Addition eindeutig definiert.
Will man z.B. die Assoziativität der Addition zeigen, also (n + m) + k = n + (m + k), so
argumentiert man mit Induktion nach k.
Sei M die Menge der k, für welche (n + m) + k = n + (m + k) stimmt.
Induktionsanfang: Die Behauptung 0 ∈ M , d.h. (n + m) + 0 = n + (m + 0) ist klar, da nach
Definition (n + m) + 0 = n + m und m + 0 = m ist.
Induktionsschluss: Wir setzen k ∈ M , d.h. (n+m)+k = n+(m+k) voraus; es folgt (n+m)+k 0 =
((n + m) + k)0 = (n + (m + k))0 = n + (m + k)0 = n + (m + k 0 ), also k 0 ∈ M . –
Im Nachhinein wird auch erst 1 = 00 definiert. Die Multiplikation kann man dann auf folgende
Weise definieren: n · 0 = 0, n · m0 = n · m + n. (Damit siehst Du etwa: n · 1 = n · 00 = n · 0 + n =
0 + n = n.)
34
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
AUFGABEN
n(n + 1)(2n + 1)
6
n
X
n(n + 1)(2n + 13)
b) Zeige:
k(k + 4) =
.
6
k=1
1. a) Zeige 12 + 22 + · · · + n2 =
2. Zeige, dass man n verschiedene Gegenstände, etwa die Zahlen 1, 2, 3, . . . , n auf n! verschiedene Weisen in eine Reihenfolge bringen kann.
3. Zeige:
n
X
k · k! = (n + 1)! − 1.
k=0
(Dies geschieht mit vollständiger Induktion ohne Mühe. Wie man allerdings auf diese
Identität gekommen ist, ist dem Beweis nicht anzusehen.)
4. Zeige: Für jedes n ∈ N ist 2 · 53n+1 + 4n durch 11 teilbar, d.h. es gibt zu jedem n ein (von
n abhängiges) k ∈ N mit 11 · k = 2 · 53n+1 + 4n . (Auch hier führt ein Induktionsbeweis zum
Ziele, ohne dass Du leicht erkennen kannst, wie ich auf solch eine Behauptung überhaupt
gekommen bin.)
Bemerkung: Du magst die zu beweisende Behauptung, dass 2·53n+1 +4n immer durch 11
teilbar sei, nicht gerade naheliegend und vielleicht auch uninteressant finden. Du solltest
Dich trotzdem zur Übung an dem Beweis versuchen. Er ist nämlich kein automatischer
Beweis, andererseits auch nicht allzu schwer.
k
5. Zeige durch Induktion nach k: Für jedes ganze k ≥ 1 und jede ungerade Zahl u ist u2 − 1
k
k
durch 2k+2 teilbar. (Erinnere Dich, dass nach Definition u2 = u(2 ) ist.) Beachte: Für
k = 0 stimmt die Aussage nicht, und das wird ja auch nicht behauptet.
√
6. In dieser Aufgabe benutzen wir die Zahl 5. Diese ist nicht rational! Aber ich nehme an,
dass Du trotzdem in der Lage bist, mit ihr umzugehen. Da sie dazu benutzt wird, ganze
Zahlen auszurechnen, sollte Dir dies ein Ansporn sein, sich mit allgemeinen reellen Zahlen
zu beschäftigen.
Die Folge (Fn ) der Fibonacci-Zahlen ist folgendermaßen definiert:
F1 := F2 := 1,
Zeige:
1
Fn = √
5
Fn := Fn−2 + Fn−1 für n ≥ 3.
√ !n
1+ 5
−
2
√ !n !
1− 5
2
(1.5)
Setze dazu Gn gleich der rechten Seite der behaupteten Gleichung, ferner
√
√
1+ 5
1− 5
u :=
,
v :=
2
2
u und v erfüllen u2 = u + 1 und v 2 = v + 1. Berechne dann Gn−2 + Gn−1 und ersetze darin
u + 1 durch u2 , sowie v + 1 durch v 2 . Du erhältst damit Gn . Schließlich musst Du noch
G1 = G2 = 1 nachprüfen.
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
35
7. Zur effizienten Berechnung der Fn mittels der Formel 1.5 benötigt man nur den ersten
Summanden, da
√ !n 1
1
−
5 1
<
√
2
5
2
ist,
8. Definiere H1 = a, H2 = b. Hn = Hn−1 + Hn−2 . Wie lässt sich Hn mit Hilfe der FibonacciZahlen (sowie a und b) ausdrücken?
1.7
Größter gemeinsamer Teiler, Euklidischer Algorithmus
Angenommen, Du bist im Jahr 1987 geboren. Da es mir (und auch Dir?) nun mal die Zahlen
7 und 17 besonders angetan haben, wollen wir versuchen, diese Zahl 1987als Summe eines
Vielfachen von 7 und eines Vielfachen von 17, d.h in der Form 7a + 17b mit ganzen Zahlen a
und b darzustellen. Dazu versuchen wir zunächst die 1 so zu schreiben. Kein Problem: denn es
gilt ja 7 · 5 + 17 · (−2) = 1. (Dass hierbei nicht beide Faktoren a und b positiv sein können, ist
ja klar.)
Dann ist aber auch 1987 = (7 · 5 + 17 · (−2)) · 1987 = 7 · (5 · 1987) + 17 · (−2 · 1987), also
1987 = 7 · 9935 + 17 · (−3974) (∗)
Weil 1987 groß genug ist, können wir hier auch positive ganze Faktoren a0 , b0 mit 1987 = 7a0 +17b0
finden. Das tun wir wie folgt: Für jede ganze Zahl n ist sicher
0 = 7 · (−17n) + 17 · (7n)
(**)
Nun ist 3974/7 < 568 (knapp) und deshalb 7 · 568 > 3974. Mit der Wahl n = 568 addieren wir
(∗∗) zu (∗) und erhalten
1987 = 7 · (9935 − 17 · 568) + 17 · (−3974 + 7 · 568) = 7 · 279 + 17 · 2
Um es gleich zu sagen, ich möchte in diesem Abschnitt keineswegs eine mysteriöse Eigenschaft
der Zahlen 7 und 17 studieren, sondern Dir zeigen, dass es zu beliebigen ganzen Zahlen m, n,
die teilerfremd sind, d.h. keinen gemeinsamen Primfaktor haben, ganze Zahlen a und b mit
ma + nb = 1 gibt. Für größere natürliche Zahlen k gibt es dann auch natürliche Zahlen a0 , b0 mit
ma0 + nb0 = k. Diese Aussage ist aber nicht so wichtig, weshalb ich ihren Beweis als Aufgabe
stelle.
36
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Definition 1.7.1 Seien a, b ∈ Z. Man sagt, a ist ein Teiler von b oder a teilt b, und schreibt
a|b, wenn es ein c ∈ Z mit a · c = b gibt. Wenn a kein Teiler von b ist, schreiben wir a - b.
Beachte, dass die Relation ‘|’ nicht symmetrisch ist. Beispielsweise gilt 2|6, aber 6 - 2. Auch
gibt es (viele) Zahlenpaare a, b, für die weder a|b noch b|a gilt, z.B. a = 6, b = 10.
1.7.2 Grundlegende Eigenschaften von |“: a) Für alle a ∈ Z gilt 1|a, − 1|a und a|0.
”
Du hast Dich nicht verlesen, da a · 0 = 0 ist. In der obigen Definition ist c = 0 nicht ausgeschlossen.
b) a|b ⇐⇒ |a| |b|.
(Dabei ist |a|, der Betrag von a, als die größere der beiden Zahlen a, −a definiert.)
c) a|b, b|c ⇒ a|c.
d) a|b ⇒ a|bb0 für eine beliebige ganze Zahl b0 ,
d’) a|b, a|c ⇒ a|b + c, also insgesamt
d”) a|b, a|c ⇒ a|bb0 + cc0 für beliebige ganze Zahlen b0 , c0 .
e) a|b, a - c ⇒ a - bb0 + c für jede ganze Zahl b0 .
Sonst wäre a|bb0 + c − bb0 , wo die rechte Zahl gleich c ist.
f) Sind a, b > 0 und gilt a|b, so ist a ≤ b. (Aber natürlich nicht umgekehrt!)
Ich habe einen großen Strich geschrieben, wo man den den Strich, der für ‘teilt’ steht von den
‘Betragsstrichen’ unterscheiden möchte.
Definition 1.7.3 Seien a, b ∈ Z. Unter einem größten gemeinsamen Teiler von a, b versteht man eine natürliche Zahl d mit folgenden Eigenschaften: (i) d|a, d|b ; (ii) c|a, c|b =⇒
c|d .
Bemerkungen 1.7.4 a) Wenn es einen größten gemeinsamen Teiler von a, b gibt, ist dieser
eindeutig bestimmt. Seien nämlich d, d0 solche, so muss d|d0 und d0 |d gelten. Da wir listiger
Weise vorgeschrieben haben, dass d, d0 ≥ 0 sein sollen, folgt die Gleichheit d = d0 . Falls a, b ∈ Z
einen größten gemeinsamen Teiler haben bezeichnen wir ihn mit ggT(a, b)
b) ggT(a, 0) = |a|. Insbesondere ist ggT(0, 0) = 0. (Die Bezeichnung ‘größter gemeinsamer
Teiler’ ist im letzten Fall nicht wörtlich zu verstehen.)
1.7.5 Du hast sicher in der Schule gelernt, wie man den größten gemeinsamen Teiler zweier
ganzer Zahlen findet, wenn man deren Primfaktorzerlegung kennt.
Z.B. ist ggT(12, 90) = ggT(22 · 31 · 50 , 21 · 32 · 51 ) = 21 · 31 · 50 = 6
M in(r ,s )
M in(rn ,sn )
1 1
· · · pn
Allgemein gilt ggT(±pr11 · · · prnn , ± ps11 · · · psnn ) = p1
die ersten n Primzahlen, und die Exponenten dürfen 0 sein.
. Dabei sind p1 , . . . , pn
Eine Primfaktorzerlegung herzustellen ist bei größeren Zahlen bekanntlich ziemlich zeitaufwändig. Deshalb sollst Du hier eine schnellere Methode kennenlernen, den ggT zu berechnen,
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
37
von der bereits Euklid wusste. Da diese für jedes Paar ganzer Zahlen funktioniert, hat man damit natürlich auch die Existenz des ggT bewiesen.
Darüberhinaus werden wir mit diesem Verfahren zu a, b ganze Zahlen a0 , b0 bestimmen, derart
dass aa0 + bb0 = ggT(a, b) gilt.
Der Euklidische Algorithmus
Ein schnelles Verfahren zur Berechnung des größten gemeinsamen Teilers.
Hilfsbemerkung: In Z gelte a = bc + d. Dann ist jeder gemeinsame Teiler von a und b
auch ein solcher von b und d und umgekehrt. D.h. für t ∈ Z hat man:
t|a, t|b ⇐⇒ t|b, t|d.
Der Algorithmus läuft wie folgt: Seien a, b ∈ Z − {0}. (ggT(a, 0) = |a|.) Setze r0 := a, r1 = b.
Dividiere mit Rest nach und nach:
r 0 = r 1 q1 + r 2
r 1 = r 2 q2 + r 3
r 2 = r 3 q3 + r 4
usw.
mit
mit
mit
|r2 | < |r1 |
|r3 | < |r2 |
|r4 | < |r3 |
Solange ri 6= 0 ist, kann man qi , ri+1 finden mit
ri−1 = ri qi + ri+1
|ri+1 | < |ri |.
und
Da aber |r1 | > |r2 | > . . . > |ri | > |ri+1 | usw. gilt, muss zweifellos für ein n der Rest rn+1 gleich
0 sein. Das Verfahren bricht also ab:
rn−2 = rn−1 qn−1 + rn
rn−1 = rn qn + 0.
Behauptung:
mit
0 < |rn | < |rn−1 |
|rn | = ggT(a, b).
Wegen obiger Hilfsbemerkung hat man für t ∈ Z die Äquivalenzen
t|r0 , r1 ⇐⇒ t|r1 , r2 ⇐⇒ t|r2 , r3 ⇐⇒ . . . ⇐⇒ t|rn−1 , rn ⇐⇒ t|rn , 0.
Unter Beachtung von a = r0 , b = r1 folgt ggT(a, b) = ggT(rn , 0) = |rn |.
Man bekommt mit obigem Algorithmus auch eine Darstellung von rn in der Form aa0 + bb0 .
Einen Ausdruck aa0 + bb0 nennt man eine Linearkombination von a und b.
Hilfsbemerkung: Seien c = aa1 + bb1 und d = aa2 + bb2 als Linearkombinationen von
a und b gegeben. Dann erhält man jede Linearkombination cc0 + dd0 von c und d explizit als
Linearkombination von a und b; es ist nämlich cc0 + dd0 = (aa1 + bb1 )c0 + (aa2 + bb2 )d0 =
38
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
a(a1 c0 + a2 d0 ) + b(b1 c0 + b2 d0 ).
Wir betrachten nun wieder die Gleichungsfolge aus 1.7.5. Zunächst sind r1 = b und r2 = a − bq1
als Linearkombinationen von a und b gegeben. Falls man schon induktiv ri−1 und ri als
Linearkombinationen von a und b gewonnen hat, gewinnt man auch ri+1 als eine solche, da
ri+1 = ri−1 − ri qi gilt. (Manchmal wird diese Methode auch der erweiterte Euklidische
Algorithmus genannt.)
Bemerkung 1.7.6 Wenn man beim euklidischen Algorithmus mit möglichst wenigen Schritten
auskommen will, muss man negative Reste zulassen, um bei jedem Schritt |ri+1 | ≤ |ri |/2 zu
erreichen. (Es muss zugestanden werden, dass der Gewinn beim Gebrauch negativer Reste
nicht sehr groß ist. Gilt nämlich a > b > 0 und a = bq + r mit 0 ≤ r < b, so ist immer noch
a ≥ b + r > r + r, also r < a/2, was nicht viel schlechter als |r| ≤ b/2 ist.)
Definition 1.7.7 a, b ∈ Z heißen (zueinander) teilerfremd, wenn ggT(a, b) = 1 ist. (Man
benutzt auch die Sprechweise, dass in diesem Fall a zu b teilerfremd ist.)
Bemerkungen 1.7.8 a) Natürlich sind a, b genau dann teilerfremd, wenn sie keinen gemeinsamen Primfaktor besitzen.
b) Die ganzen Zahlen a, b sind teilerfremd genau dann, wenn es a0 und b0 in Z mit aa0 + bb0 = 1
gibt. Denn, wenn a und b teilerfremd sind, liefert der euklidische Algorithmus die gesuchten
a0 , b0 . Wenn umgekehrt t ein Teiler von a und von b ist, ist t auch ein Teiler von aa0 + bb0 = 1 .
c) Wenn a, b teilerfremd sind, gibt es für alle c ∈ Z Zahlen a, b ∈ Z mit aa + bb = c.
(c = 1 · c = a(a0 c) + b(b0 c).)
Wir erhalten einen neuen Beweis von Euklids Lemma.
Lemma 1.7.9 Seien p eine Primzahl, a, b ∈ Z und p|ab. Dann teilt p mindestens eine der
beiden Zahlen a, b.
Beweis: Wenn p|b gilt, sind wir glücklich. Andernfalls sind b, p teilerfremd und es gibt deshalb
c, d ∈ Z mit bc + pd = 1. Dann gilt p | abc + apd, wo abc + apd = a ist.
Erinnere Dich, dass aus Euklids Lemma ziemlich direkt die Eindeutigkeit der Primfaktorzerlegung folgt.
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
39
AUFGABEN
1. Welche Massen kannst Du mit einer Balkenwaage wiegen, wenn Du beliebig viele Gewichte
von 70g und von 125g zur Verfügung hast und in beide Waagschalen Gewichte legen
darfst?
2. Zwei große, etwa halbvolle Badewannen stehen nebeneinander. Kannst Du mit einem
7- und einem 19-Litermaß durch Hin- und Hergießen (der vollen Maße) erreichen, dass
schließlich das Wasser der einen Badewanne um einen Liter vermehrt, das der anderen
um einen Liter vermindert ist?
3. Seien a, b teilerfremde ganze Zahlen. Bestimme alle ganzen Zahlen x, y mit ax + by = 0.
4. Sei ggT(a, b) = 1. Dann gibt es ja a0 , b0 ∈ Z mit aa0 + bb0 = 1.
Überlege, auf welche (einfache) Weise man a0 und b0 verändern kann, ohne dass diese
Gleichung an Gültigkeit verliert.
Kann man zum Beispiel a0 ≥ 0 erreichen? (Dies geht, wenn b 6= 0 ist.) Man kann sämtliche
a0 , b0 mit aa0 + bb0 = 1 bestimmen. Vgl. Aufgabe 3.
5. Seien a, b, c ∈ N1 , ggT(a, b) = 1 und c ≥ (a − 1)(b − 1).
a) Zeige: Es gibt a0 , b0 ∈ N(!) mit c = aa0 + bb0 . D.h. c ist eine Linearkombination mit
nicht negativen Koeffizienten.
b) Zeige: d = ab−a−b lässt sich nicht in der Form aa0 +bb0 mit natürlichen a0 , b0 schreiben.
6. Schreibe die Jahreszahl Deiner Geburt in der Form n · 30 + m · 49 mit n, m ∈ N.
7. Mach Dir Gedanken darüber, wie viele Divisionen mit Rest Du ausführen musst, um den
ggT zweier natürlicher Zahlen zu bestimmen. Unterscheide dabei, ob Du nur nichtnegative
oder auch negative Reste zulassen willst. Im ersten Fall erhältst Du bei der Division von
26 durch 7 die Darstellung 26 = 7 · 3 + 5, im zweiten Fall darfst Du auch 26 = 7 · 4 − 2
schreiben.
a) Sind a, b > 0 ganz und a ≥ b, so schreibe im 1. Fall a = bq + r mit 0 ≤ r < b. Dann ist
q ≥ 1, also a ≥ b + r > r + r und deshalb schließlich a > 2r. Für die ri im euklidischen
Algorithmus erhält man somit ri > 2ri+2 . Das bedeutet: Ist a ≤ 2k so benötigt man
weniger als 2k Schritte.
. Ist also
b) Sind a, b 6= 0 ganz und |a| ≥ |b|, so schreibe im 2. Fall a = bq + r mit |r| ≤ |b|
2
k
|b| ≤ 2 , so benötigt man höchstens k Schritte. Das bedeutet gegenüber a) eine leichte
Verbesserung.
8. Seien m, n ∈ N1 zueinander teilerfremd. Beweise:
a) Es gibt ein k ∈ N mit m|k und n|k + 1. (Benutze Aufgabe 4.)
b) Die Gleichung xm + y m = z n hat eine Lösung in natürlichen Zahlen > 0.
(Löse zunächst xk + y k = z k+1 .)
(Zu a) Es gibt natürliche Zahlen m0 , n0 mit −mm0 + nn0 = 1 also nn0 = mm0 + 1. Setze
k = mm0 .
40
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Beachte: Wenn es zu m, n ∈ Z eine ganze Zahl k mit m|k und n|k + 1 gibt, sind m, n
zueinander teilerfremd.) (Zu b) 2k + 2k = 2k+1 . Hat man also m0 , n0 mit nn0 = mm0 + 1
0
0
0
gefunden, so gilt (2m )m + (2m )m = (2n )n .)
9. a) Bestimme ggT(11 111 111, 111 111 111 111 111). b) Allgemeiner: Bestimme
ggT(1.....1, 1.....1) ,
wenn die erste Zahl m, die zweite n Stellen hat.
c) Noch allgemeiner: Bestimme
ggT
n−1
X
i=0
di ,
m−1
X
!
di
für n, m, d ∈ N1 .
i=0
10. Berechne ggT(408277 , 222191) und stelle diesen als Linearkombination dieser beiden
Zahlen da.
Wenn Du einen Computer die Primfaktorzerlegung dieser beiden Zahlen bestimmen lässt,
bringst Du Dich um die Erkenntnis, wie effektiv die Berechnung des ggT mit Hilfe des
euklidischen Algorithmus ist. Gut wäre es natürlich, Du könntest einem Computer den
euklidischen Algorithmus beibringen.
m
n
1
=
+ .
225
9
25
b) Allgemeiner seien a, b zueinander teilerfremde Zahlen > 0. Wie kann man ganze m, n
bestimmen, so dass
m n
1
=
+ gilt?
ab
a
b
11. a) Finde ganze Zahlen m, n mit
12. Sei m ∈ N2 und M die Menge aller positiven Teiler von m (einschließlich 1 und m). Auf
der Menge M kann man folgendes Spiel für 2 Spieler spielen:
Abwechselnd belegen die Spieler je eine der Zahlen aus M mit einem Spielstein unter
Beachtung folgender Regel: Ist bereits d ∈ M belegt und gilt d0 |d, so darf d0 nicht mehr
belegt werden.
Wer m belegt, hat verloren.
Zeige: Es gibt eine Gewinnstrategie für den beginnenden Spieler. (D.h. er hat die Möglichkeit zu gewinnen, was auch immer der andere Spieler für Züge macht.)
(Hinweis: Eine besondere Rolle spielt die Zahl 1. Allgemeiner als angegeben, darf M eine beliebige endliche teilweise – d.h. nicht notwendig total – geordnete Menge mit einem
kleinsten und einem davon verschiedenen größten Element sein. Ich kenne übrigens keinen
Beweis obiger Behauptung, der eine Gewinnstrategie konkret angibt.)
13. Die Farey-Folge der Ordnung n(≥ 1) ist die nach aufsteigender Größe geordnete Folge
derjenigen rationalen Zahlen a aus dem Intervall [0, 1], d.h. mit 0 ≤ a ≤ 1, deren Nenner
in der Standardform (d.h. gekürzt mit positivem Nenner) ≤ n ist. Z.B. ist die Farey-Folge
der Ordnung 4 die Folge:
0 1 1 1 2 3 1
, , , , , , .
1 4 3 2 3 4 1
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
41
Für die Farey-Folge der Ordnung n gilt:
a) Wenn a1 /b1 , a2 /b2 aufeinanderfolgende Glieder dieser Folge in der Standardform sind,
so ist
• 1. a2 b1 − a1 b2 = 1,
• 2. b1 + b2 > n,
• 3. b1 6= b2 im Falle n > 1.
b) Wenn a1 /b1 , a2 /b2 , a3 /b3 drei aufeinanderfolgende Glieder der Farey-Folge (in ihrer
Standardform) sind, so ist a2 /b2 = (a1 + a3 )/(b1 + b3 ). (Der letzte Bruch ist nicht
notwendig gekürzt.)
Um a) und b) zu beweisen, zeige zunächst c) bis e):
c) Aus a1 /b1 < a2 /b2 folgt a1 /b1 < (a1 + a2 )/(b1 + b2 ) < a2 /b2 .
d) Wenn a2 b1 − a1 b2 = 1 ist, gilt auch
(a1 + a2 )b1 − a1 (b1 + b2 ) = 1 und a2 (b1 + b2 ) − (a1 + a2 )b2 = 1.
Sind ai , bi ∈ Z, so folgt also insbesondere: Der Bruch (a1 + a2 )/(b1 + b2 ) ist gekürzt.
e) Aus ai , bi , u, v ∈ Z, bi , v > 0, a2 b1 − a1 b2 = 1 und a1 /b1 < u/v < a2 /b2 folgt v ≥ b1 + b2 .
Anschließend kannst Du die Farey-Folge der Ordnung n auf folgende Weise konstruieren:
Beginne mit 0/1, 1/1. Ist n > 1, füge 1/2 = (0 + 1)/(1 + 1) ein und fahre so fort.
Nämlich, solange es in Deiner Folge noch zwei aufeinanderfolgende Glieder a1 /b1 , a2 /b2
mit b1 + b2 ≤ n gibt, füge (a1 + a2 )/(b1 + b2 ) gemäß c) zwischen ihnen ein.
Für die am Ende erhaltene Folge ist a) 2. offenbar erfüllt, und a) 1. folgt aus d).
Aus a) 1. kannst Du leicht b) folgern. Ferner folgt a) 3. aus den Ungleichungen
a/b < a/(b − 1) < (a + 1)/b für a + 1 < b. Schließlich siehst Du mit e), dass Du die
Farey-Folge der Ordnung n konstruiert hast.
42
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Kapitel 2
Neue Rechenbereiche
2.1
Grundlegende Definitionen
Betrachte dieses Kapitel als Abenteuer! Ich glaube nämlich, Du wirst etwas Neues lernen.
In (1.1.4) haben wir elementare Rechengesetze für die natürlichen Zahlen angegeben. Dann
haben wir die Menge (i.e. Gesamtheit) N der natürlichen Zahlen zur Menge Q der rationalen
Zahlen (die auch negativ sein dürfen) erweitert. Hierin findet sich die Menge Z der ganzen
Zahlen (die auch negativ sein dürfen). Wenn wir noch die Menge der rationalen Zahlen ≥ 0 mit
Q+ bezeichnen, erhalten wir folgendes Schema:
N −→ Z
↓
↓
Q+ −→ Q
(Man kann, um von den natürlichen zu den rationalen Zahlen zu gelangen, sowohl den Weg
über die nicht-negativen rationalen Zahlen, als auch den Weg über die ganzen Zahlen wählen!)
In all diesen Mengen kann man addieren und multiplizieren. Es gibt in ihnen neutrale Elemente
– übrigens immer 0 und 1 – und zu manchen Elementen auch additiv, bzw. multiplikativ Inverse.
Definition 2.1.1 Ein Ring R ist eine Menge zusammen mit zwei Verknüpfungen (Rechenarten) ‘+’ und ‘·’ (Addition und Multiplikation), für welche folgende Regeln gelten:
Assoziativität: a + (b + c) = (a + b) + c und a(bc) = (ab)c
Kommutativität der Addition: a + b = b + a
Distributivität: a(b + c) = ab + ac, (b + c)a = ba + ca
Existenz neutraler Elemente: In R gibt es ein Element 0 mit der Eigenschaft a + 0 = a und
ein Element 1 mit der Eigenschaft 1a = a1 = a
Existenz additiv Inverser: Zu jedem a ∈ R existiert ein Element (−a) (auch einfach −a
geschrieben) mit der Eigenschaft a + (−a) = 0.
Es lohnt sich nicht, den hier definierten algebraischen Begriff ‘Ring’ mit dem alltäglichen (geometrischen) Begriff eines Ringes zu vergleichen.
43
44
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkungen 2.1.2 a) Wie üblich, lässt man den Multiplikationspunkt häufig weg. Und wir
beachten die Konvention ‘Punktrechnung geht vor Strichrechnung’, um Klammern zu sparen.
b) Die neutralen Elemente sind eindeutig bestimmt: Seien etwa 0, 00 neutrale Elemente der
Addition, so ist 0 = 0 + 00 = 00 + 0 = 00 . Dasselbe gilt für neutrale Elemente der Multiplikation.
(Bei der Forderung der Existenz additiv Inverser braucht man also nicht anzugeben, welchem
neutralen Element der Addition die Summe a + (−a) gleich sein soll.)
c) Ebenso gibt es zu a nur ein additiv Inverses. Sind nämlich (−a), (+ a) zu a additiv invers,
so gilt: (−a) = (−a) + 0 = (−a) + (a + (+ a)) = ((−a) + a) + (+ a) = 0 + (+ a) = (+ a).
Insbesondere gibt es auch nur ein additiv Inverses von (−a), nämlich welches?
d) Die Kommutativität der Multiplikation fordern wir nicht, da es interessante Beispiele gibt,
wo diese nicht erfüllt ist. Siehe Abschnitt 2. Ohne die Kommutativiät ist es nicht allgemein
möglich, eines der beiden Distributivgesetze aus dem anderen zu folgern.
Natürlich kann man auch Rechenbereiche betrachten, in denen auf die Forderung der Assoziativität der Multiplikation verzichtet wird – und tut dies manchmal auch! Wir wollen hier aber
diese Allgemeinheit nicht anstreben.
e) Es wird nicht verlangt, dass 0 und 1 verschiedene Elemente sind. Allerdings besteht in dem
Fall 0 = 1 der Ring nur aus einem Element, welches sowohl 1 wie 0 ist. (Dies steht in der
folgenden Bemerkung a).) Ein solcher Ring heißt ‘der’ Nullring.
f) Die ersten Beispiele für Ringe sind Z und Q, während N kein Ring ist, da zumeist die additiv
Inversen fehlen.
Bemerkungen 2.1.3 a) Aus 0 + 0 = 0 folgt a0 = a(0 + 0) = a0 + a0. Indem man auf beiden
Seiten von a0 = a0 + a0 das Element −(a0) addiert, erhält man a0 = 0. Ebenso zeigt man
0a = 0. Sollte 0 = 1 gelten, folgt a = a · 1 = a0 = 0, und der Ring ist der Nullring.
b) Es ist ab + a(−b) = a(b + (−b)) = a0 = 0. Also ist a(−b) das additiv Inverse zu ab,
d.h. a(−b) = −(ab). Ebenso ist (−a)b = −(ab). Ferner ist a das additiv Inverse zu −a, d.h.
a = −(−a). In jedem Ring gilt deshalb (−a)(−b) = −a(−b) = −(−ab) = ab.
Wenn also Z und Q Ringe sein sollen, so muss man für positive ganze, bzw. rationale Zahlen
a, b das Produkt der negativen Zahlen (−a), (−b) wie oben definieren, nämlich: (−a)(−b) = ab.
Dasselbe gilt für die reellen Zahlen, die wir später einführen.
2.1.4 In einem Ring R sind Potenzen mit Exponenten aus N definiert. Genauer, für a ∈ R, n ∈
N ist an definiert. (Die Kommutativität der Multiplikation wird dazu nicht benötigt. Allerdings
benötigt man die Assoziativität bereits, wenn man die Gleichheit (aa)(aa) = ((aa)a)a wünscht.)
Ich erinnere an die Definition a0 = 1, auch wenn a = 0 sein sollte.
Es gelten die grundlegenden Potenz-Regeln
am+n = am an sowie amn = (am )n .
(2.1)
(Die Gültigkeit dieser Regeln ergibt sich genau so, wie wir es für den Fall dass a eine natürliche
Zahl ist oben gesehen haben. Zu ihrem Beweis benötigt man die Assoziativität, aber nicht die
Kommutativität der Multiplikation.)
2.1. GRUNDLEGENDE DEFINITIONEN
45
In einem Ring, dessen Multiplikation kommutativ ist, gilt zusätzlich die Regel
(ab)n = an bn
(2.2)
Für die meisten Ringe R kann man ab mit a, b ∈ R nicht vernünftig definieren. Wir werden
allerdings ab definieren, falls a und b reelle Zahlen sind und a > 0 ist. Dies wird im Kapitel 5
ausgeführt.
Bemerkung 2.1.5 Die Definition an := a · · · a mit n Faktoren würde n − 1 Multiplikationen
zur Berechnung von an erfordern. Man kann dies aber abkürzen. Z.B. erfordert die linke Seite
von (((a2 )2 )2 )2 = a16 nur 4 statt 15 Multiplikationen. Wenn man etwa a25 berechnen möchte,
stellt man 25 im Binärsystem dar: 25 = 24 + 23 + 20 dar und rechnet
4
3
0
a25 = a2 · a2 · a2 = (((a2 )2 )2 )2 · ((a2 )2 )2 · a
mit Hilfe von 6 Multiplikationen aus. (Warum benötigt man nicht 9 Multiplikationen?)
(Diese Berechnungsabkürzung beim Potenzieren entspricht dem schriftlichen Rechnen beim
Multiplizieren, wobei der Exponent in Binärschreibweise gedacht ist. Sollte Dir diese Bemerkung
schleierhaft erscheinen, überschlage sie.)
Für Anwendungen in der Codierung muss man Potenzen mit natürlichen Exponenten berechnen, die als Dezimalzahlen mehrere hundert Stellen haben. Eine solche Berechnung wäre ohne
die oben beschriebene Abkürzung schlechterdings nicht möglich. (Hat der Exponent z.B. 300
Stellen im Dezimalsystem, so hat er etwa 900 Stellen im Binärsystem. Man braucht zur Berechnung der Potenz also etwa 900 Quadrierungen und durchschnittlich noch etwa 450 weitere
Multiplikationen. Das sind nun wirklich wenige im Vergleich zu 10300 .)
Du kannst mit Recht einwenden, dass man im Bereich der natürlichen Zahlen eine Potenz der
Form ab , wo a ≥ 2 und b von Größenordnung 10300 ist, schon allein deshalb nicht berechnen
kann, weil man die berechnete Zahl von mindestens 10100 Dezimalstellen schlechterdings nicht
aufschreiben kann!
Die Erklärung ist: Man rechnet gar nicht in N, sondern in einem endlichen Ring. Und solche
wirst Du bereits im Abschnitt 4 kennen lernen.
Definition 2.1.6 Ein kommutativer Ring ist ein Ring, in dem die Kommutativität für die
Multiplikation, d.h. ab = ba gilt.
2.1.7 In einem kommutativen Ring R gilt für n ∈ N die Regel (ab)n = an bn , in einem nichtkommutativen Ring meist nicht! Beispiele findest Du im Ring der 2 × 2-Matrizen über beliebigen
Ringen, die vom Nullring verschieden sind. Siehe Abschnitt 3.
Definition 2.1.8 Ein Schiefkörper ist ein (nicht notwendig kommutativer) Ring K, in dem
1 6= 0 ist und für alle Elemente a 6= 0 ein multiplikativ Inverses a−1 existiert. Dabei heißt
a−1 multiplikativ invers zu a, wenn a−1 a = aa−1 = 1 ist. Spricht man von dem Inversen ohne
genauere Spezifikation, so ist das multiplikativ Inverse gemeint.
46
KAPITEL 2. NEUE RECHENBEREICHE
Wie für das additiv Inverse sieht man auch, dass das multiplikativ Inverse eines Elementes
eindeutig bestimmt ist.
Bemerkung 2.1.9 Seien a, b von 0 verschiedene Elemente eines Schiefkörpers. Ist ab 6= ba, so
ist auch (ab)−1 6= a−1 b−1 . Hingegen gilt (unter der Voraussetzung der Assoziativität) immer
(ab)−1 = b−1 a−1 . Zeige dies! (Wenn Du zuerst ein Hemd und dann darüber einen Pullover
angezogen hast und das ohne Verrenkungen rückgängig machen willst, musst Du zuerst den
Pullover und dann das Hemd ausziehen!)
2.1.10 In einem Schiefkörper kann man von Elementen a 6= 0 Potenzen mit beliebigen (also
auch negativen) ganzzahligen Exponenten bilden: Für n ≥ 0 sei a−n := (a−1 )n . Dabei verstehe
man zunächst unter a−1 das multiplikativ Inverse von a; als Potenz kann man es nachträglich
verstehen.
Auch für Potenzen mit beliebigen ganzen Exponenten gelten o.a. Regeln am+n = am an und
amn = (am )n . (Aus (ab)2 = a2 b2 folgt ab = ba in jedem Schiefkörper. Zeige dies!)
Definition 2.1.11 Ein Körper ist ein Schiefkörper, in dem die Kommutativität der Multiplikation gilt.
Bemerkung: Dem allgemeinen Sprachgebrauch nach sollte ein Schiefkörper ein Körper spezieller Art
sein. Dummerweise ist hier umgekehrt ein Körper ein Schiefkörper spezieller Art. Das liegt natürlich
an der historischen Entwicklung, daran, dass man den Begriff des Körpers zuerst erfunden hat und
später gute Gründe fand, auch körperähnliche Gebilde zu betrachten, in denen die Multiplikation nicht
kommutativ ist. Als Ausweg wurde z.B. vorgeschlagen, Schiefkörper als ‘Örper’ zu bezeichnen. Eine
andere Möglichkeit wäre der Name ‘Divisionsring’. (Im Englischen heißt ‘Körper’ – im hier definierten
Sinn – ‘field’, ein ‘Schiefkörper’ ‘skew field’, ‘sfield’ oder ‘division ring’.) Diese sprachliche Kalamität
tritt allerdings in der Mathematik immer wieder auf, und man hat sich daran gewöhnt, z.B. unter
einer Garbe eine Prägarbe spezieller Art zu verstehen, usw. Was Garben sind, brauchst Du jetzt noch
nicht, vielleicht sogar nie, verstehen.
2.1.12 In einem Körper gilt wegen der Kommutativität für alle Elemente a, b und beliebige
ganze Zahlen n die Regel (ab)n = an bn .
In einem Körper definieren wir ab = ab−1 . Du kannst und solltest die Regeln für die Bruchrechnung aus den Körpergesetzen ableiten. Soll also Q ein Körper werden, müssen wir Addition
und Multiplikation so definieren, wie wir es getan haben – und wie Du es in der Schule gelernt
hast!
Übrigens, wenn man den rationalen Zahlen ein Element ∞ hinzufügt, um dem Bruch
Sinn zu geben, erhält man keinen Körper. Die Struktur kompliziert sich nur.
2.2
1
0
einen
Beispiele von Ringen und Körpern
Von der Schule her solltest Du in etwa den Körper R der reellen Zahlen kennen. Von dem wird
später noch die Rede sein.
2.2. BEISPIELE VON RINGEN UND KÖRPERN
47
Beispiel 2.2.1 Ringe zwischen Z und Q
1. Sind u, v ungerade ganze Zahlen, so ist bekanntlich auch uv ungerade. Sind ferner a, b ∈ Z,
so gilt
av + bu
a b
ab
a b
+ =
,
· =
u v
uv
u v
uv
Das bedeutet, dass die Brüche, deren Nenner ungerade sind, genauer: die mit ungeraden Nennern geschrieben werden können, einen (kommutativen) Ring bilden. In diesem Ring R hat 2
kein multiplikativ Inverses, also ist er kein Körper und somit auch nicht gleich Q. Andererseits
enthält er die Zahl 1/3. Der Ring R umfasst Z und liegt in Q.
2. Auch die rationalen Zahlen, deren Nenner eine Potenz von 2 ist bilden einen Ring S. (1 = 20
ist als Nenner zugelassen.)
Diese Ringe R und S verhalten sich unterschiedlich. In R besitzt 3 = 1 + 1 + 1 ein Inverses,
aber 2 = 1 + 1 nicht. In S ist es gerade umgekehrt.
3. Allgemein sei Q eine Menge von Primzahlen. Betrachte die Menge A derjenigen rationalen
Zahlen, die sich mit einem Nenner schreiben lassen, der 1 oder ein Produkt von Primzahlen aus
Q ist. (Jede Primzahl aus Q darf auch ein mehrfacher Primfaktor sein.) Dieses A ist ein Ring,
der in Q liegt und Z umfasst. (Den Begriff ‘Menge’ als eine gewisse Gesamtheit mathematischer
Objekte betrachten wir hier ganz naiv.)
Besteht Q aus allen von 2 verschiedenen Primzahlen, so erhält man den Ring R aus 1., besteht
Q nur aus der Primzahl 2, erhält man S.
Besteht Q aus allen Primzahlen, so erhalten wir Q, besteht Q aus gar keiner Primzahl, dann
Z.
Bemerkung 2.2.2 Allgemein kann man, ausgehend von einem kommutativen Ring R, Brüche
betrachten. Häufig lässt sich auf diese Weise der Ring – wie beim Übergang von Z zu Q – zu
einem Körper erweitern. Dazu muss allerdings R nullteilerfrei sein. S.u.
Man kann wie in den o.a. Beispielen die zulässigen Nenner einschränken, um weitere Ringe zu
erhalten.
Beispiel 2.2.3 Weiß man von zwei ganzen Zahlen lediglich, ob sie gerade oder ungerade sind,
so weiß man dieses auch über ihre Summe und ihr Produkt. Es gilt:
gerade+gerade = ungerade+ungerade = gerade, gerade+ungerade = ungerade
gerade·gerade = gerade·ungerade = gerade,
ungerade·ungerade = ungerade
Wir können also die Begriffe ‘gerade’ und ‘ungerade’ als die Elemente einer Menge (von 2
Elementen) auffassen, in der man die Verknüpfungen ‘+’ und ‘·’ hat. Wir setzen 0 =gerade,
1 =ungerade. Denn offenbar ist gerade ein neutrales Element für die Addition, ungerade ein
solches für die Multiplikation. Die Additions- und die Multiplikationstafel sehen wie folgt aus:
+ 0
0 0
1 1
1
1
0
48
KAPITEL 2. NEUE RECHENBEREICHE
· 0
0 0
1 0
1
0
1
Bis auf die Rechnung 1 + 1 = 0 ist alles wie gewohnt. 1 ist sowohl das additiv, wie das multiplikativ Inverse von sich selbst.
Man nennt diese Menge zusammen mit den Verknüpfungen F2 . Wir haben es mit einem (etwas
dürftigen) Körper zu tun.
Die Elemente 0 und 1 von F2 sind nicht dieselben Gegenstände, wie die ganzen Zahlen 0
und 1. (Vielleicht sollte man sie deshalb mit 0, 1 bezeichnen. Alternativ könnte man auch das
Additionszeichen ‘+’ umbezeichnen.) Im Bereich der ganzen Zahlen gilt ja 1 + 1 6= 0.
Um zu zeigen, dass F2 wirklich ein Körper ist, muss man insbesondere die beiden Assoziativgesetze, sowie die Distributivität zeigen. Will man diese Gesetze Fall für Fall untersuchen, so hat
man dreimal 23 Fälle zu betrachten. Aber man kann sich ja darauf berufen, dass diese Gesetze
für N (und Z) gelten. Deshalb müssen sie doch auch für den Bereich {gerade, ungerade} gelten,
nicht wahr?
2.2.4 Wir können für jede natürliche Zahl m > 1 etwas ähnliches tun, wie wir gerade für
m = 2 getan haben. Wir können einen kommutativen Ring von m Elementen konstruieren,
der übrigens, falls m eine Primzahl ist, ein Körper ist. Wir werden dieser wichtigen Idee den
Abschnitt 4 widmen.
2.2.5 Direktes Produkt: Nehmen wir zwei Ringe R, S und bilden wir ihr cartesisches Produkt R × S, d.h. die Menge aller Paare (r, s) mit r ∈ R, s ∈ S. Für solche Paare (r, s), (r0 , s0 )
definieren wir
(r, s) + (r0 , s0 ) := (r + r0 , s + s0 ) und (r, s)(r0 , s0 ) := (rr0 , ss0 ).
R × S mit diesen Verknüpfungen wird das direkte Produkt von R mit S genannt. Offenbar ist
R × S wieder ein Ring, kommutativ, wenn R und S es sind. Was ergibt (1, 0)(0, 1)? Wir sehen,
wenn in den Ringen R und S jeweils 0 6= 1 ist, gibt es in R × S immer von 0 verschiedene
Elemente, deren Produkt 0 ist. Das direkte Produkt zweier Körper ist deshalb nie ein Körper.
2.2.6 Im Gegensatz zu dem letzten Beispiel gilt in Z und Q die sogenannte Nullteilerfreiheit.
Damit ist folgende Regel gemeint:
ab = 0 =⇒ a = 0 oder b = 0.
(Überlege, dass dies in jedem Schiefkörper gilt.)
Definition 2.2.7 In einem Ring R nennen wir a einen Links-Nullteiler, wenn es in R ein
b 6= 0 mit ab = 0 gibt. Analog wird ein Rechts-Nullteiler definiert. Bei einem kommutativen
Ring spricht man natürlich schlicht von Nullteilern.
2.3. MATRIZEN
49
(Da immer a0 = 0 ist, teilt jedes Element eines Ringes die 0. Ein Nullteiler ist aber nach
Definition ein Element, welches die 0 auf nicht triviale Weise teilt.) Die 0 selbst zählt man zu
den Nullteilern, vorausgesetzt, der Ring ist nicht der Nullring. Es gibt Beispiele, wo a ein Links-,
aber kein Rechts-Nullteiler ist, und umgekehrt. In unserem Buch kommen solche Beispiele nicht
vor.
Definition 2.2.8 Ein kommutativer Ring heißt nullteilerfrei (auch integer oder ein Integritätsring oder ein Integritätsbereich), wenn er nicht der Nullring ist und außer 0 keine
Nullteiler besitzt.
Bemerkung 2.2.9 Kürzungsregel: Sei c kein Rechts-Nullteiler und ac = bc, so ist a = b.
Beweis hierfür: Aus ac = bc folgt (a − b)c = ac − bc = 0 also a − b = 0, da c kein Nullteiler
ist. –
2.3
Matrizen
2.3.1 Matrizen (Singular: Matrix) sind sehr interessante nützliche mathematische Gegenstände. Ich beschränke mich in diesem Buch auf einen Spezialfall.
Sei R ein Ring. Wir betrachten sogenannte 2×2-Matrizen über R, d.h. quadratische Schemata
a b
mit a, b, c, d ∈ R
c d
Die Gesamtheit dieser Matrizen sei mit M2 (R) bezeichnet.
Das Paar (a, b) wird die erste Zeile,
genannt. Das
das Paar (c, d) die zweite Zeile obiger
Matrix
a
b
(senkrecht geschriebene) Paar
heißt die erste Spalte, das Paar
die zweite Spalte
c
d
der Matrix.
Wir definieren die Addition zweier solcher Matrizen wie folgt:
0 0 a b
a b
a + a0 b + b 0
+
=
,
c d
c0 d0
c + c0 d + d0
d.h. auf recht naheliegende Art. Die Addition erfüllt offenbar alle Gesetze, welche die Addition
bei Ringen erfüllt. Bestimme das neutrale Element der Addition, sowie das additiv Inverse einer
Matrix.
a b
Ist λ ∈ R und A =
∈ M2 (R)so setzen wir
c d
λA =
λa λb
λc λd
50
KAPITEL 2. NEUE RECHENBEREICHE
Die Multiplikation zweier Matrizen aus M2 (R) ist komplizierter definiert. Ich will sie schrittweise
einführen. Zunächstsei für
ein als Zeile geschriebenes Paar (a1 , a2 ) und für ein als Spalte
b1
geschriebenes Paar
ein Produkt, wie folgt, definiert:
b2
b1
(a1 , a2 )
= a1 b 1 + a2 b 2 .
b2
(Den ersten Faktor kann man als 1 × 2-Matrix, den zweiten als 2 × 1-Matrix und das Ergebnis
als 1 × 1-Matrix ansehen.)
A, B seien 2 × 2-Matrizen. Die 1., bzw. 2. Zeile von A seien mit Z1 , bzw. Z2 bezeichnet. Die 1.,
bzw. 2. Spalte von B seien S1 , bzw. S2 . Dann ist
Z1
Z1 S1 Z1 S2
AB =
(S1 , S2 ) :=
Z2
Z2 S1 Z2 S2
D.h. der Eintrag in der i-ten Zeile und j-ten Spalte der Ergebnismatrix ist das Produkt der
i-ten Zeile von A mit der j-ten Spalte von B. (Oder so: Man multipliziere die Zeilen von A mit
den Spalten von B, und setze die Ergebnisse an die entsprechenden Stellen einer 2 × 2-Matrix.)
Ausgeschrieben ergibt sich:
0 0 0
aa + bc0 ab0 + bd0
a b
a b
=
·
ca0 + dc0 cb0 + dd0
c0 d0
c d
Bemerkung 2.3.2 Später – im Kapitel 6 – werden wir noch folgendes Produkt verwenden:
Sei A eine 2 × 2-Matrix mit den Zeilen Z1 und Z2 und B eine 2 × 1-Matrix, d.h. eine Spalte.
Dann sei
Z1 B
AB =
.
Z2 B
Das Ergebnis ist eine Spalte. Ausgeschrieben ergibt sich
a11 a12
b1
a11 b1 + a12 b2
=
a21 a22
b2
a21 b1 + a22 b2
2.3.3 Gibt es im Bereich der 2 × 2-Matrizen für die Multiplikation ein neutrales Element?
Antwort:
1 0
E :=
ist ein solches.
0 1
Rechne das nach!
Die Assoziativität der Multiplikation und die beiden Distributivgesetze lassen sich nachrechnen.
Tu das! Die Menge M2 (R) ist also ein Ring.
Angenommen, der Ausgangsring R sei kommutativ und nicht der Nullring. Ist dann auch M2 (R)
kommutativ? Berechne
0 1
0 0
0 0
0 1
·
und
·
0 0
0 1
0 1
0 0
2.3. MATRIZEN
51
Wir lernen: In M2 (R) ist die Multiplikation nicht kommutativ; auch kann das Produkt zweier
von der Nullmatrix verschiedenen Matrizen
0 0
A, B 6= 0 :=
0 0
gleich 0 sein.
Wenn Du, wie ich, kein Genie bist, solltest Du die Rechnungen mit Matrizen zur Übung unbedingt nachvollziehen und vielleicht noch das eine oder andere Produkt konkreter Matrizen
berechnen!
Beispiel 2.3.4 Berechne
1 1
0 1
2 2
2
1 0
1 1
1 0
·
und
·
1 1
0 1
1 1
Die für rationale (reelle, komplexe) Zahlen a, b gültige Regel an bn = (ab)n gilt nicht mehr
allgemein, wenn a, b Matrizen sind! Das liegt an der fehlenden Kommutativität.
Bemerkung 2.3.5 Allgemeiner, als wir es hier tun, betrachtet man m×n-Matrizen über einem
Ring, d.h. solche mit m Zeilen und n Spalten. Die Summe zweier m × n-Matrizen bildet man
wie oben. Das Produkt AB zweier Matrizen ist definiert, wenn die Zahl der Spalten von A
gleich der Zahl der Zeilen von B ist. (Wie würdest Du es definieren?) Das Ergebnis ist eine
Matrix, die soviele Zeilen wie A und soviele Spalten wie B besitzt.
Somit kann man zwei n × n-Matrizen (mit demselben n) sowohl zueinander addieren wie miteinander multiplizieren. Zu jedem n ∈ N1 bilden die n × n-Matrizen einen Ring.
In der Linearen Algebra spielen Matrizen eine Hauptrolle. Wenn Du Dich hier mit den
2 × 2-Matrizen vertraut machst, wird Dir das beim späteren Umgang mit allgemeinen Matrizen
wahrscheinlich sehr helfen.
2.3.6 Berechne
a b
0 d
0 0 a b
·
.
0 d0
Man sieht, dass die Matrizen der Form
a b
0 d
einen Ring bilden, einen sogenannten Unterring von M2 (R). Dasselbe gilt für die Matrizen
der Form
a 0
.
c d
52
KAPITEL 2. NEUE RECHENBEREICHE
Die Matrizen der Form
1 b
0 1
bilden keinen Unterring, wenn 0 6= 1 in R gilt. (Warum?) Aber das Produkt zweier solcher ist
wieder von dieser Form und spiegelt die Summe in R wieder, nicht wahr? Wie ich das gemeint
habe, siehst Du sofort, wenn Du zwei Matrizen solcher Art multiplizierst.
2.3.7 Determinante: Wir setzen hier voraus, dass R kommutativ ist. Die Determinante
einer 2 × 2-Matrix ist dann folgendermaßen definiert:
a b
det
:= ad − bc
c d
Sie ist also ein Element aus R.
Versuche, Eigenschaften der Determinanten von Matrizen aufzuspüren. Gilt z.B. det(A + B) =
det(A) + det(B) für beliebige 2 × 2-Matrizen A, B? Finde ein Gegenbeispiel! Gilt det(AB) =
det(A)·det(B)? Dies stimmt! Es zu beweisen erfordert keine Idee, nur eine sorgfältige Rechnung.
Bringe dazu beide Seiten auf eine Summe von vier Produkten von je vier Einträgen, die ‘mit
Vorzeichen versehen sind’. Was ist det(E), wenn E, wie oben das multiplikativ neutrale, also
Einselement von M2 (R) bezeichnet.
Vergleiche
det
a b
c d
mit det
a + ce b + de
c
d
Bemerkung 2.3.8 Auch für n × n-Matrizen mit n > 2 über einem kommutativen Ring kann
man Determinanten definieren. Und es gilt det(AB) = det(A) det(B).
2.3.9 Weiterhin sei R kommutativ. Welche 2 × 2-Matrizen sind invertierbar? Wie kann man
ihr Inverses berechnen?
Sei A in M2 (R) invertierbar, d.h. es gebe eine Matrix B ∈ M2 (R) mit AB = E. Dann ist
det(A) · det(B) = det(AB) = det(E) = 1. Also muss det(A) in R invertierbar sein.
a b
Umgekehrt, sei det
= ad − bc in R invertierbar. Man rechnet leicht nach, dass
c d
a b
d −b
ad − bc
0
·
=
= (ad − bc)E
c d
−c a
0
ad − bc
ist, und dass bei Vertauschung der Faktoren dasselbe herauskommt. Deshalb ist
d
−b
ad−bc
−c
ad−bc
die zu
a b
c d
inverse Matrix.
ad−bc
a
ad−bc
2.3. MATRIZEN
53
2.3.10 Ist
A=
so ist
a b
c d
a b
c d
mit det(A) = 0
ad − bc
0
0 0
d −b
·
=
=
.
−c a
0
ad − bc
0 0
Also ist A ein Links-Nullteiler und auch ein Rechtsnullteiler, da man in diesem Fall die beiden
Faktoren vertauschen darf. Wenn R ein Körper ist, ist eine 2 × 2-Matrix entweder sowohl ein
Links- wie ein Rechts-Nullteiler oder invertierbar. Frage: Gilt dies auch im Falle R = Z?
2 0
Antwort: Die Matrix
hat die Determinante 2, ist also über Z nicht invertierbar.
0 1
Andererseits ist sie über Q invertierbar, kann also in dem Unterring M2 (Z) von M2 (Q) kein
Nullteiler sein.
2.3.11 Berechne
a b
−b a
0 0 0
a b
a b
a b0
.
und
·
·
0
0
b 0 a0
−b a
b a
Man sieht, das sowohl die Matrizen der ersten Form, wie die der zweiten jeweils einen kommutativen Unterring von M2 (R) bilden. (Die Kommutativität von R ist vorausgesetzt.)
Wir interessieren uns hier nur für den ersten Fall. Wir setzen voraus, dass R ein Körper ist. Es
gilt
a b
det
= a2 + b 2
−b a
Im Körper Q (und auch im später zu besprechenden Körper R der reellen Zahlen) gilt die
folgende Regel:
a2 + b2 = 0 ⇐⇒ a = b = 0 (∗)
Sei jetzt K ein Körper, in dem diese Regel gilt. Dann ist auch die Menge der Matrizen
a b
∈ M2 (K)
−b a
ein Körper. Ist K = R, so erhält man den Körper C der komplexen Zahlen, den wir im Kapitel
8 besprechen.
AUFGABEN
1. Berechne folgende Matrizenprodukte, ebenso die Produkte, wenn Du die Faktoren vertauscht
hast:
a b
0 1
a b
1 e
c d
1 0
c d
0 1
54
KAPITEL 2. NEUE RECHENBEREICHE
2. a) Berechne
a+b b
b
a
1 1
1 0
.
b) Bestimme mit Hilfe der Fibonacci-Folge die Werte der Potenzen (in M2 (Z))
1 1
1 0
n
, n∈N.
Berechne dabei (für spätere Aufgaben) mindestens die ersten 3, besser noch die ersten 8 Potenzen konkret.
3. Zeige, dass die Menge K der folgenden 4 Matrizen aus M2 (F2 )
A :=
0 1
1 1
2
, A =
1 1
1 0
3
, A = E, und 0 =
0 0
0 0
(deren Einträge aus dem ‘Minikörper’ F2 stammen) in Bezug auf die Addition und Multiplikation ein Körper ist. (Es gibt also einen Körper, der aus 4 Elementen besteht.) Versuche, mit
möglichst wenigen Rechnungen auszukommen.
4. Sei A eine Matrix von n Zeilen und n Spalten, mit folgenden Eigenschaften:
(i) In jeder Zeile und jeder Spalte komme jede der Zahlen 1, . . . , n vor. (Dann kommt jede dieser
Zahlen auch nur einmal in jeder Zeile, bzw. Spalte vor. Warum?) (Dies ist übrigens eine der
Bedingungen beim Sudoku.)
(ii) A sei symmetrisch (bzgl. der ‘(Haupt)-Diagonale’), d.h. es sei aij = aji für alle i, j.
a) Zeige: Wenn n ungerade ist, kommt auch in der Diagonale (a11 , a22 , . . . , ann ) jede der Zahlen
1, . . . , n genau einmal vor.
b) Zeige: Wenn n gerade (und > 0) ist, gilt dies nie, d.h. es kommt mindestens eine Zahl doppelt
vor.
5. Seien a, b ∈ Z. Zeige: Im Bereich der 2×2-Matrizen über Z gibt es genau dann eine invertierbare
Matrix, deren erste Zeile (a, b) ist, wenn ggT(a, b) = 1 ist.
6. Erinnere Dich an den Paragrafen 2.3.9, insbesondere an die Regel
a b
c d
d −b
−c a
= (ad − bc)E
d −b
a b
Die Matrix
heißt auch die zur Matrix A =
komplementäre Matrix. Sie
−c a
c d
sei mit c(A) bezeichnet. Zeige: c(AB) = c(B)c(A). Folgere hieraus und aus c(A)A = Ac(A) =
det(A)E, dass det(AB) = det(A) det(B) gilt.
2.4. RESTKLASSEN
2.4
55
Restklassen
Es ist nicht nötig, dass Du das Folgende jetzt sofort liest und verstehst. Solltest Du allerdings
Mathematik studieren, wirst Du mit diesen Dingen konfrontiert werden.
2.4.1 Die Folge der natürlichen Zahlen
0, 1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . .
weist keine Wiederholung auf. Immer ist ja n + 1 > n. Aber nichts hindert uns daran, einen
Bereich zu betrachten, in dem man wieder bei 0 landet, wenn man zur Null m-mal die 1 addiert.
Natürlich ist dies dann nicht mehr der Bereich der natürlichen Zahlen, sondern etwas Neues.
Immerhin wirst Du sehen, dass man auf diese Weise einen Ring erhält.
Du weißt, wie man n ∈ N durch m ∈ N1 mit Rest dividiert, also n = qm + r mit natürlichen
Zahlen q, r und 0 ≤ r ≤ m − 1 schreibt. Wir nennen in diesem Fall r den Rest, den n bei
Division durch m lässt.
Wenn Zahlen als Größen betrachtet, so wird man bei der Division mit Rest den ‘Quotienten’ q
n
als das wichtigste ansehen. Denn es ist ja m
= q + mr , wo 0 ≤ mr < 1 ist.
Hier wollen wir jedoch umgekehrt dem Rest r unsere Aufmerksamkeit zukehren. Beliebige ganze
Zahlen n, also auch negative, können durch m > 0 mit Rest dividiert werden. In der Tat gibt
es zu gegebenen n, m ∈ Z mit m > 0 ganze Zahlen q, r mit 0 ≤ r ≤ m − 1 mit n = qm + r. Für
m = 10 gilt z.B. −4 = (−1) · 10 + 6 und 34 = 3 · 10 + 4.
Bezeichnung: Ist m festgelegt, so bezeichnen wir den Rest, den eine ganze Zahl n bei Division
durch m lässt, mit ρ(n).
Beispiele 2.4.2 Erinnere Dich an den Körper F2 , der aus den Elementen gerade und ungerade
besteht. Die geraden Zahlen sind diejenigen, die Bei Division durch 2 den Rest 0 lassen, während
die ungeraden Zahlen diejenigen sind, die bei Division durch 2 den Rest 1 lassen.
Du hast gesehen, dass diese beiden Begriffe gerade und ungerade einen Ring bilden. Die Verknüpfungen + und · entstehen durch die entsprechenden Verknüpfungen der Reste bei Division
durch 2. Dabei ist zunächst 1 + 1 = 2, aber 2 lässt bei Division durch 2 den Rest 0.
Du weißt vielleicht auch folgendes: Wenn du von zwei im Dezimalsystem geschriebenen natürlichen Zahlen nur die jeweils letzte Stelle kennst, so kennst Du auch die letzte Stelle ihrer Summe,
bzw. die ihres Produktes. Nun ist die letzte Stelle einer im Dezimalsystem geschriebenen natürlichen Zahl nichts anderes als der Rest, den diese Zahl bei Division durch 10 lässt. (Bei negativen
ganzen Zahlen ergibt sich der Rest bei Division durch 10 als 0, wenn die letzte Dezimalziffer eine
0 ist, hingegen gleich 10 − r, wenn die letzte Ziffer r ist. Der Rest soll ja im Bereich {0, 1, . . . , 9}
liegen.)
Du kannst somit im Bereich der zehn Ziffern 0, 1, . . . , 9 auch eine ‘Summe’ und ein ‘Produkt’
definieren, indem Du von der in N gebildeten Summe, bzw. dem Produkt nur die letzte Ziffer
betrachtest. In dem Sinne ist etwa 6+7 = 3, 6+4 = 0; 6·3 = 8, 2·5 = 4·5 = 6·5 = 0, 3·7 = 1
usw. Wir werden bald sehen, dass Du auf diese Weise einen Ring aus 10 Elementen erhältst,
der allerdings kein Körper ist.
56
KAPITEL 2. NEUE RECHENBEREICHE
Bevor Du jetzt meinst, dies seien völlig uninteressante und für einen normalen Menschen ganz irrelevante Gedankenspielereien von weltfremden Mathematikern, lass Dir sagen, dass diese Art zu rechnen
zusammen mit Kenntnissen über Primzahlen uns zu den modernen Verschlüsselungsmethoden geführt
haben, die ich im 1. Kapitel bereits angesprochen habe, auf die ich am Ende des Buches zurückkommen
werde und die Du übrigens nutzt, wenn Du Dein Konto mit Online-Banking verwaltest.
2.4.3 Seien m ∈ N1 , d.h. eine ganze Zahl > 0, und n1 , n2 ∈ Z. Für i = 1, 2 dividieren wir ni
mit Rest durch m. Wir erhalten Darstellungen
n1 = q1 m + r1 und n2 = q2 m + r2 mit 0 ≤ ri ≤ m − 1
Daraus ergibt sich n1 +n2 = (q1 +q2 )m+(r1 +r2 ), sowie n1 n2 = q1 q2 m2 +q1 r2 m+q2 r1 m+r1 r2 =
(q1 q2 m + q1 r2 + q2 r1 )m + (r1 r2 ). Hieraus erhältst Du:
Satz 2.4.4 Der Rest, den n1 + n2 bei Division durch m lässt, ist derselbe, den r1 + r2 bei
Division durch m lässt. Ebenso ist der Rest, den n1 n2 bei Division durch m lässt, derselbe, den
r1 r2 bei Division durch m lässt.
In Formeln: ρ(n1 + n2 ) = ρ(ρ(n1 ) + ρ(n2 )) und ρ(n1 n2 ) = ρ(ρ(n1 )ρ(n2 )).
Folgerung 2.4.5 Die ganzen Zahlen n1 und n01 mögen bei Divison durch m denselben Rest
lassen; ferner mögen auch n2 und n02 bei Division durch m denselben Rest lassen. Dann lassen
sowohl n1 + n2 und n01 + n02 , als auch n1 n2 und n01 n02 bei Division durch m denselben Rest.
Anders ausgedrückt: Wenn ρ(ni ) = ρ(n0i )gilt, dann auch ρ(n1 + n2 ) = ρ(n01 + n02 ) und ρ(n1 n2 ) =
ρ(n01 n02 ).
Natürlich erhältst Du hiermit: ρ(n) = ρ(n0 ) ⇒ ρ(nk ) = ρ(n0k ) für k ∈ N. Aber
0
Vorsicht: Aus ρ(k) = ρ(k 0 ) folgt fast nie ρ(nk ) = ρ(nk ). Zum Beispiel sei m = 10. Dann ist
ρ(1) = ρ(11), aber ρ(21 ) = 2 und ρ(211 ) = ρ(2048) = 8.
Definition 2.4.6 Sei m ∈ N1 fest gewählt. Für ganze Zahlen j, k ∈ {0, 1, 2, . . . , m − 1} (der
Menge der natürlichen Zahlen, die kleiner als m sind) definieren wir eine neue Addition ⊕ und
eine neue Multiplikation ⊗ wie folgt:
Addition: j ⊕ k sei der Rest, den j + k bei Division durch m lässt.
Multiplikation: j ⊗ k sei der Rest, den jk bei Division durch m lässt.
Symbolisch j ⊕ k = ρ(j + k), j ⊗ k := ρ(jk).
Die Menge {0, 1, 2, . . . , m − 1} zusammen mit den beiden Verknüpfungen ⊕, ⊗ bezeichnen wir
mit Zm .
Die Zeichen ⊕, ⊗ benutzen wir nur vorläufig!
2.4. RESTKLASSEN
57
Theorem 2.4.7 Zm ist ein kommutativer Ring.
Beweis: Die Ring-Gesetze übertragen sich vermittels ρ von Z auf Zm . Ich führe beispielshaft
die Beweise des Kommutativgesetzes und des Distributivitätsgesetzes aus:
j ⊕ k = ρ(j + k) = ρ(k + j) = k ⊕ j ,
i ⊗ (j ⊕ k) = i ⊗ ρ(j + k) = ρ(i(j + k)) = ρ(ij + ik) = ρ(ρ(ij) ⊕ ρ(ik)) = (i ⊗ j) ⊕ (i ⊗ k)
Darüber hinaus ist klar, dass 0 das neutrale Element für die Addition und 1 dasjenige für die
Multiplikation in Zm ist. Letzteres gilt zumindest im Falle m > 1.
Falls m = 1 ist, erhalten wir den Nullring.
Beispiele 2.4.8 a) Sei m = 5. Wir stellen die Additions- und Multiplikationstafel von Z5 auf.
⊕
0
1
2
3
4
0
0
1
2
3
4
1
1
2
3
4
0
2
2
3
4
0
1
3
3
4
0
1
2
4
4
0
1
2
3
⊗
0
1
2
3
4
0
0
0
0
0
0
1
0
1
2
3
4
2
0
2
4
1
3
3
0
3
1
4
2
4
0
4
3
2
1
In der Tat ist z.B. 3 ⊕ 2 = ρ(5) = 0, 4 ⊕ 3 = ρ(7) = 2; 4 ⊗ 4 = ρ(16) = 1, 3 ⊗ 4 = ρ(12) = 2
In jeder Zeile der Multiplikationstafel außer der ersten steht eine 1. Erkenne daran, dass jedes
Element 6= 0 ein multiplikativ Inverses hat, dass also ein Körper vorliegt!
b) Dasselbe machen wir im Falle m = 6.
⊕
0
1
2
3
4
5
0
0
1
2
3
4
5
1
1
2
3
4
5
0
2
2
3
4
5
0
1
3
3
4
5
0
1
2
4
4
5
0
1
2
3
5
5
0
1
2
3
4
⊗
0
1
2
3
4
5
0
0
0
0
0
0
0
1
0
1
2
3
4
5
2
0
2
4
0
2
4
3
0
3
0
3
0
3
4
0
4
2
0
4
2
5
0
5
4
3
2
1
58
KAPITEL 2. NEUE RECHENBEREICHE
Während die Additionstabellen von Z5 und Z6 einander ziemlich ‘ähnlich’ sehen, siehst Du bei
den Multiplikationstabellen große Unterschiede!
In der von Z6 findet sich nur in der zweiten und der letzten eine 1. Zudem findet man öfter das
Produkt 0, wo beide Faktoren 6= 0 sind: z.B. 2 ⊗ 3 = 0. Denn es ist 2 · 3 = 6 und 6 lässt bei
Division durch 6 den Rest 0. In dem Ring Zm gibt es Nullteiler.
Der Unterschied zwischen 5 und 6, der die Unterschiede in den Multiplikationstabellen nach
sich zieht, liegt darin, dass 5 eine Primzahl ist, 6 aber nicht. Das werden wir unten allgemeiner
feststellen.
Eine andere Sichtweise.
Man kann die Ringe Zm auch auf andere Weise konstruieren. Wir fassen nämlich die Zahlen,
die bei Division durch m denselben Rest lassen, jeweils zu einer Menge zusammen, die wir als
Element einer Menge Z/(m) auffassen.
Definition 2.4.9 Seien r, m ∈ Z und m > 0. Die Restklasse von r modulo m ist die Menge
r + mZ := {r + mk | k ∈ Z},
d.h. die Menge, die aus allen Zahlen der Form r + mk besteht, wo k ganz Z durchläuft (während
r und m festgehalten werden). Diese Menge wird auch mit (r mod m) bezeichnet.
Satz 2.4.10 a) Ist 0 ≤ r < m, so ist r + mZ die Menge aller ganzen Zahlen, die bei der
Division durch m den Rest r lassen.
b) Allgemeiner gilt für beliebige r ∈ Z, dass r + mZ die Menge aller ganzen Zahlen ist, die bei
Division durch m den Rest ρ(r) lassen, wo ρ wie oben definiert ist.
Beweis:
a) ist klar.
b) Nach Definition von ρ kann man r = ρ(r) + mu schreiben. Für jedes k ∈ Z gilt dann
r + mk = ρ(r) + mu + mk = ρ(r) + m(u + k). Also lässt jede Zahl r + mk ∈ r + mZ bei Division
durch m den Rest ρ(r). Und umgekehrt, wenn eine Zahl den Rest ρ(r) lässt, also s = ρ(r) + mv
gilt, so ist s = r − mu + mv = r + m(v − u) ∈ r + mZ.
2.4.11 Es ist wichtig, dass Du folgendes beachtest: Restklassen r + mZ und s + mZ sind genau
dann einander gleich, wenn sie aus denselben Zahlen bestehen, d.h. wenn jede Zahl der Form
r + mk sich auch in der Form s + ml schreiben lässt und umgekehrt. Aus r + mZ = s + mZ
folgt nicht allgemein, dass r = s sein müsste! Ein Beispiel ist
31 + 10Z = 51 + 10Z
Betrachte den folgenden Satz auch im Lichte dieser Bemerkung!
2.4. RESTKLASSEN
59
Satz 2.4.12 Sei m > 0 eine festgewählte ganze Zahl und ρ(n) – wie oben – der Rest, den eine
ganze Zahl n bei Division durch m lässt. Für ganze Zahlen r, s sind dann folgende Aussagen
äquivalent:
(i) r − s ist durch m teilbar;
(ii) r ∈ s + mZ;
(iii) ρ(r) = ρ(s);
(iv) r + mZ = s + mZ.
Beweis:
s + mZ.
(i) ⇒ (ii): Wegen m|r − s gibt es ein k ∈ Z mit r − s = mk. Also gilt r = s + mk ∈
(ii) ⇒ (iii): Da s + mZ aus denjenigen ganzen Zahlen besteht, die bei Division durch m den
Rest ρ(s) lassen, folgt aus (ii) die Gleichung ρ(r) = ρ(s).
(iii) ⇐⇒ (iv): r + mZ (bzw. s + mZ) besteht aus denjenigen ganzen Zahlen, die bei Division
durch m den Rest ρ(r) (bzw. ρ(s)) lassen. Die Gleichheit der Zahlen ρ(r) = ρ(s) ist also
äquivalent zur Gleichheit der Mengen r + mZ = s + mZ.
(iii) ⇒ (i): Auf Grund der Definition von ρ kann man r = ρ(r) + mu und s = ρ(s) + mv
schreiben. Aus der Gleichheit ρ(r) = ρ(s) ergibt sich dann r − s = mu − mv = m(u − v). Definition 2.4.13 Zwei ganze Zahlen r, s heißen zueinander kongruent modulo m, wenn
die äquivalenten Aussagen (i)–(iv) des letzten Satzes gelten. In diesem Falle schreibt man
r ≡ s (mod m).
Ergänzungen: Wir wollen die Kongruenz modulo m für beliebiges m ∈ Z erklären. Dies tun
wir, indem wir sie durch die äquivalenten Aussagen (i) und (iv) definieren. Das bedeutet im
Einzelnen:
a) Im Fall m = 1 (der oben nicht ausgeschlossen war) gilt r ≡ s (mod 1) für alle ganzen Zahlen
r und s.
b) Im Gegensatz dazu gilt r ≡ s (mod 0) nur dann, wenn r = s ist.
c) r ≡ s (mod m) gilt genau dann, wenn r ≡ s (mod − m) ist. Es bedeutet also keine
Einschränkung der Allgemeinheit, wenn wir im Folgenden m ∈ N voraussetzen.
Bemerkungen 2.4.14 Sei m ∈ N. Du wirst ohne Probleme folgende Aussagen beweisen
können:
a) n ≡ n (mod m) für jede ganze Zahl n.
b) n ≡ n0 (mod m) ⇒ n0 ≡ n (mod m)
c) n ≡ n0 (mod m), n0 ≡ n00 (mod m) ⇒ n ≡ n00 (mod m)
d) n ≡ ρ(n) (mod m)
60
KAPITEL 2. NEUE RECHENBEREICHE
Beispiele 2.4.15 a) Sei m = 2. Zwei Zahlen sind genau dann modulo 2 kongruent, wenn sie
entweder beide gerade oder beide ungerade sind.
b) Sei m = 10. Zwei natürliche Zahlen sind modulo 10 genau dann kongruent, wenn sie dieselbe
letzte Ziffer in ihrer Dezimalzahldarstellung haben, z.B. 4 ≡ 34 ≡ 1024 (mod 10). Bei den
negativen Zahlen musst Du aufpassen: −6 ≡ −336 ≡ 4 (mod 10), nicht wahr?
d) Sei m = 5. In dem folgenden (im Prinzip unendlich großen) Diagramm stehen die Zahlen,
die kongruent modulo 5 sind, untereinander.
..
..
..
..
..
.
.
.
.
.
−10 −9 −8 −7 −6
−5 −4 −3 −2 −1
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14
15 16 17 18 19
..
..
..
..
..
.
.
.
.
.
Jede Spalte besteht also aus Zahlen die zueinander modulo 5 kongruent sind. Und zwei modulo
5 kongruente Zahlen befinden sich in derselben Spalte. Die Spalten obigen Diagramms, als
Mengen aufgefasst sind die Restklassen modulo 5.
Jede ganze Zahl kommt in dem Diagramm genau einmal vor, liegt also in einer, aber auch nur
einer der Spalten, d.h. einer Restklasse modulo 5. Die mittlere Spalte ist z.B. die Restklasse
von 7 modulo 5, aber auch die Restklasse von 2, auch die von -3, modulo 5.
Es gibt 5 Spalten.
Diese Dinge wollen wir allgemein einsehen.
Bemerkungen 2.4.16 Sei m ≥ 0 festgelegt.
a) Jede ganze Zahl liegt in einer Restklasse. Denn r = r + 0 · m liegt in r + mZ.
b) Die Zahlen, die in einer Restklasse modulo m liegen, sind modulo m zueinander kongruent.
c) Jede ganze Zahl n liegt in einer, aber auch nur einer Restklasse modulo m, nämlich – im
Falle m > 0 – in derjenigen, in der auch ρ(n) liegt. Siehe Bemerkung e) für den Fall m = 0.
Insbesondere sind je zwei verschiedene Restklassen disjunkt, d.h. sie haben kein Element
gemeinsam.
d) Ist m > 0, so gibt es genau m Restklassen modulo m, nämlich die folgenden
0 + mZ, 1 + mZ, 2 + mZ, . . . , (m − 1) + mZ
Ist nämlich n ganz, so dividiere n durch m mit Rest: n = r+km, wo 0 ≤ r ≤ m−1 ist. Dann gilt
n ≡ r (mod m). Deshalb ist n + mZ = r + mZ. Somit ist jede Restklasse von der angegebenen
Art. Seien nun r, s zwei ganze Zahlen mit 0 ≤ r ≤ s ≤ |m| − 1. Ist dann r + mZ = s + mZ, so
2.4. RESTKLASSEN
61
muss s − r durch m teilbar sein. Das geht nur, wenn s − r = 0 oder s − r ≥ m ist. Da s und r
kleiner als m sind, bleibt nur die Möglichkeit, dass r = s ist.
In dem nicht so interessanten Fall m = 1 gibt es eine einzige Restklasse modulo m, nämlich
ganz Z.
e) Die Restklassen modulo 0 sind die aus je einer Zahl bestehenden Teilmengen von Z. Es gibt
also unendlich viele von diesen.
Weiterhin sei ein m ∈ N gewählt, und wir wollen die Menge Z/(m) aller Restklassen modulo
m betrachten. Im Falle m > 0 besteht Z/(m) aus m Elementen. Um Z/(m) zu einem Ring zu
machen, beweisen wir zunächst
Lemma 2.4.17 Seien r ≡ r0 (mod m) und s ≡ s0 (mod m). Dann sind auch
r + s ≡ r0 + s0 (mod m) und rs ≡ r0 s0 (mod m).
Beweis: Nach Voraussetzung gibt es u, v ∈ Z mit r0 = r +mu, s0 = s+mv. Dann ist r0 +s0 =
r+s+(u+v)m und r0 s0 = (r+mu)(s+mv) = rs+mrv +msu+mumv = rs+m(rv +su+muv).
D.h. die Differenzen (r0 + s0 ) − (r + s) und r0 s0 − rs sind Vielfache von m.
Da die Aussage r + mZ = r0 + mZ (für ganze r, r0 ) äquivalent zu r ≡ r0 (mod m) ist, kann man
das o.a. Lemma auch wie folgt aussprechen:
Folgerung 2.4.18 Es gelte r + mZ = r0 + mZ und s + mZ = s0 + mZ. Dann gilt auch
(r + s) + mZ = (r0 + s0 ) + mZ, sowie (rs) + mZ = (r0 s0 ) + mZ.
Definition 2.4.19 Seien r + mZ, s + mZ Restklassen modulo m. Dann definieren wir ihre
Summe und ihr Produkt wie folgt:
(r + mZ) + (s + mZ) := (r + s) + mZ , (r + mZ) · (s + mZ) := (rs) + mZ
Dies ist eine richtige Definition. Denn wegen der o.a. Folgerung hängt das Ergebnis der Addition
und der Multiplikation nur von den Restklassen r+mZ und s+mZ und nicht von den speziellen
Wahlen der r, s ab.
Wir sagen in diesem und analogen Fällen: Die Addition (r + mZ) + (s + mZ) = (r + s) + mZ
und die Multiplikation (r + mZ) · (s + mZ) := (rs) + mZ seien wohldefiniert.
Ein Beispiel, wo das nicht der Fall ist, wäre der Versuch Potenzen, in denen Basis und Exponet
Restklassen modulo desselben m sind, auf folgende Weise zu definieren:
(j + mZ)(k+mZ) := (j k ) + mZ ???
Ein spezielles Beispiel kennst Du bereits. (S. nach 4.5). Es ist ja 1 + 10Z = 11 + 10Z, aber
21 + 10Z 6= 211 + 10Z. Noch ein Beispiel: Es ist zwar 2 + 3Z = 5 + 3Z, aber (22 ) + 3Z 6= (25 ) + 3Z.
Denn 22 ≡ 1 (mod 3), 25 ≡ 2 (mod3).
62
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkung 2.4.20 Man kann die Summe und das Produkt zweier Restklassen C1 , C2 auch
folgendermaßen definieren: Wähle c1 ∈ C1 und c2 ∈ C2 . Dann sei C1 + C2 diejenige Restklasse,
in der c1 + c2 liegt, und C1 C2 diejenige Restklasse, in der c1 c2 liegt.
2.4.21 Wir wollen jetzt einsehen, dass (für m > 0) der zuerst definierte Ring Zm und Z/(m)
im Wesentlichen dasselbe sind!
Dazu identifizieren wir Zm mit Z/(m) auf folgende Weise: Jedes r = 0, 1, . . . , m−1 identifizieren
wir mit der Restklasse r + mZ. (Das bedeute, dass umgekehrt die Restklasse r + mZ mit
ρ(r) identifiziert wird.) Addition und Multiplikation, die wir sowohl in Zm , als auch in Z/(m)
definiert haben, stimmen dann überein. Denn es gilt ja für r, s ∈ Zm , d.h. r, s ∈ {0, 1, . . . , m−1}
folgendes
(r + mZ) + (s + mZ) = (r + s) + mZ = ρ(r + s) + mZ = (r ⊕ s) + mZ
und dasselbe, wenn man ‘+’ durch ‘·’ und ‘⊕’ durch ‘⊗’ ersetzt.
Im folgenden will ich keinen Unterschied mehr zwischen den beiden Ringen Zm und Z/(m)
machen. Ich verwende nur noch die Bezeichnung Z/(m). (Es gibt auch die Bezeichnungen
Z/mZ, sowie Z/m.) Man sagt Z modulo m oder ausführlicher der Restklassenring von Z
modulo m.
Ich überlasse Dir, wie Du den Ring Z/(m) verstehen willst. Persönlich ziehe ich es vor, ihn
als Ring von Restklassen aufzufassen. Die Auffassung als Ring der Zahlen 0, 1, . . . , m − 1 mit
angepassten Rechenarten ist sicher anfangs einfacher zu verstehen, ist aber möglicherweise etwas
willkürlich und starr.
Anschaulich sollte man sich die Elemente von Z/(m) ‘kreisförmig angeordnet’ vorstellen. (Für
m = 6 zum Beispiel.)
2•
•1
3•
•0
4•
•5
Die Addition entspricht dann der Addition von Winkeln.
2.4.22 Repräsentanten. Erinnere Dich, dass Du mit 0 + mZ, 1 + mZ, 2 + mZ, . . . , (m −
1) + mZ, bereits alle Restklassen modulo m erfasst hast. Das System der ganzen Zahlen
(0, 1, 2, . . . , m − 1) ist ein sogenanntes Repräsentantensystem modulo m. Wie Du oben gesehen hast, ist ein solches gut dafür, in Z/(m) konkret zu rechnen.
Definition 2.4.23 Sei m > 0. Ein Repräsentantensystem modulo m ist ein System ganzer
Zahlen n1 , . . . , nm , derart das in jeder Restklasse modulo m genau eine der Zahlen ni liegt.
2.4. RESTKLASSEN
63
Beispiele 2.4.24 m aufeinander folgende Zahlen bilden immer ein Repräsentantensystem.
Folgende Repräsentantensyteme sind manchmal nützlich:
a) Das System 1, 2, . . . , m. (Beachte, dass die Restklasse von m das Nullelement von Z/(m) ist.
b) Falls m ungerade ist, das System (− m−1
, . . . , −1, 0, 1, . . . , m−1
).
2
2
Für m = 11 bekommst Du das Repräsentantensystem −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5. Um die
Multiplikation in Z/(11) vollständig zu beschreiben, genügt es, eine Tabelle für die Produkte
der Restklassen 0, 1, . . . , 5 anzugeben:
⊗
0
1
2
3
4
5
0
0
0
0
0
0
0
1 2 3 4 5
0 0 0 0 0
1 2 3 4 5
2 4 -5 -3 -1
3 -5 -2 1 4
4 -3 1 5 -2
5 -1 4 -2 3
Wenn Du z.B. (−3)·2 ausrechnen willst, zieh das Gesetz für die Multiplikation mit Vorzeichen in
Ringen heran, und Du erhältst (−3)·2 = −(3·2) = −(−5) = 5. D.h., es ist (−3+11Z)(2+11Z) =
5 + 11Z.
Du erkennst an dieser Tabelle auch, dass jedes Element ein multiplikativ Inverses hat. Denn in
jeder Zeile außer der obersten findet sich eine 1 oder eine −1. Z.B. ist 5 · 2 = −1. Daraus folgt
5 · (−2) = 1. Mithin ist −2 ein multiplikativ Inverses von 5. Du siehst: Z/(13) ist ein Körper.
c) Falls m gerade ist, die Systeme (− m2 +1, . . . , −1, 0, 1, . . . , m2 ) und (− m2 , . . . , −1, 0, 1, . . . , m2 −1).
Frage: Wann, d.h. für welche m, besitzt der Ring Z/(m) Nullteiler? Die Antwort ist einfach:
Satz 2.4.25 Sei m > 1. Der Ring Z/(m) besitzt genau dann Nullteiler, wenn m zerlegbar, d.h.
keine Primzahl ist.
Beweis: Sei m zerlegbar, m = k1 k2 , wo die (positiven) ki weder 1 noch m sind. Dann sind
die Restklassen (ki mod m) beide von 0 (der Restklasse (0 mod m)) verschieden, aber es gilt
(k1 mod m)(k2 mod m) = (m mod m) = (0 mod m).
Sei m = p eine Primzahl, und es gelte (k1 k2 mod p) = (0 modp). Dann ist p ein Teiler von
k1 k2 . Nach Euklids Lemma ist dann p ein Teiler von k1 oder von k2 . Etwa sei p|k1 . Dann ist
(k1 mod p) die Nullrestklasse.
Wenn p eine Primzahl ist, ist Z/p wegen folgenden Satzes sogar ein Körper.
Satz 2.4.26 Sei R ein endlicher Ring. Ist c ∈ R kein Nullteiler, so ist c (multiplikativ) invertierbar, d.h. es gibt zu c ein multiplikativ Inverses.
Ein endlicher nullteilerfreier Ring ist ein Körper.
64
KAPITEL 2. NEUE RECHENBEREICHE
Beweis: Seien a1 , . . . , an die endlich vielen untereinander verschiedenen Elemente von R.
Dann sind die n Elemente ca1 , ca2 , . . . , can nach der Kürzungsregel untereinander verschieden.
Sie machen also alle Elemente von R aus. Eines unter ihnen, etwa caj ist also gleich 1. Das
bedeutet aber, dass aj das Inverse von c ist.
Beispiele 2.4.27 a) Im Körper Z/13 ist 2 das multiplikativ Inverse von 7 und 3 das multiplikativ Inverse von 9.
b) In dem Ring Z/26 ist 15 das multiplikativ Inverse von 7. Beachte hierzu, dass (a mod m) in
Z/(m) genau dann multiplikativ invertierbar ist, wenn a zu m teilerfremd ist. Dies ergibt sich
z.B. aus der nächsten Bemerkung.
c) Der unendliche Ring Z ist zwar nullteilerfrei, aber kein Körper.
Bemerkung 2.4.28 Du kannst das multiplikativ Inverse eines Elementes von Z/(m) durch
zeitaufwändiges Probieren finden. Glücklicherweise kann man mit Hilfe des euklidischen Algorithmus dasselbe viel schneller berechnen. (Beachte dabei, dass Euklid unser Problem gar nicht
kannte.)
Frage: Wie berechnet man das multiplikativ Inverse der Restklasse von a in Z/(m), wenn a
zu m teilerfremd ist?
Antwort: Mit Hilfe des euklidischen Algorithmus bestimmt man a0 , m0 ∈ Z, für die
aa0 + mm0 = 1 gilt. Dann ist die Restklasse von a0 modulo m multiplikativ invers zu der von a.
2.4.29 Wir kennen jetzt unendlich viele endliche Körper, da es unendlich viele Primzahlen
gibt. Es gibt weitere endliche Körper, nämlich einen zu jeder Primzahlpotenz pn mit ganzem
positiven n. Beachte aber, dass Z/(pn ) für n ≥ 2 Nullteiler 6= 0 hat, also nicht etwa der gesuchte
Körper aus pn Elementen sein kann.
Bemerkung 2.4.30 Du kannst ja mal versuchen, ob Du Restklassen in der Menge Q der
rationalen Zahlen bilden und auch mit ihnen rechnen kannst. Sei m eine positive ganze (oder
auch rationale) Zahl. Betrache ’Restklassen’ a + mZ für beliebige rationale Zahlen a. Du kannst
zeigen, dass jede rationale Zahl in genau einer solchen Restklasse liegt.
Willst Du zwei solche Restklassen wie oben addieren, geht das gut. (Zeige das!) Willst Du
sie multiplizieren, kommst Du in Schwierigkeiten. Seien etwa m = 1, a = 1/2, a0 = 3/2 und
b = 1/2. Dann gilt a + Z = a0 + Z aber ab + Z 6= a0 b + Z, da 3/4 − 1/4 nicht ganz ist.
Die Menge Q/mZ erfüllt in Bezug auf die Addition die Axiome, die für die Addition in einem
Ring gelten.
2.4. RESTKLASSEN
65
AUFGABEN
1. Man kann den Körper Z/(3), wie Du oben gesehen hast, auch wie folgt beschreiben. Die Elemente seien mit −1, 0, 1 bezeichnet. Die Multiplikation ist so definiert als handle es sich um die
entsprechenden Elemente von Z. Für die Addition gelte 1 + 1 = −1 , (−1) + (−1) = 1, und
die übrigen sieben Summen seien wieder so definiert, als handle es sich um die entsprechenden
Elemente von Z.
2. a) Bestimme die Quadrate in dem Ring Z/(8).
b) Eine im Dezimalsystem geschriebene mindestens dreistellige natürliche Zahl, die als letzte
drei Ziffern 2 Einsen und eine 0 in beliebiger Reihenfolge hat (...011, ...101, ...110), ist keine
Quadratzahl. (Zeige dies etwa mit Hilfe von a).)
3. Sei M eine endliche Menge von n + 1 (verschiedenen) ganzen Zahlen und n ≥ 1. Zeige, dass
mindestens eine der Differenzen von zwei verschiedenen Elementen von M durch n teilbar ist.
4. Es soll eine Fahne mit einem Muster folgender Art entworfen werden:
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
D.h. n Sterne sollen in zwei Quadrate von m1 × m1 bzw. m2 × m2 Sternen angeordnet werden,
die sich in einem Quadrat von k × k Sternen überlappen. Dabei soll zwar n, aber keine der
drei Zahlen m1 , m2 , k ein Vielfaches von 5 sein. (Darum sind m1 = 0, m2 = 0 und k = 0 auch
ausgeschlossen.) Ist das möglich?
5. a) Sei m ∈ N, m =
k
X
ai 10i mit ai ∈ Z. (Sind die ai aus der Menge der ’Ziffern’ 0, 1, 2, . . . , 9
i=0
gewählt, so beschreibt dies die Dezimalzahldarstellung von m.) Zeige:
k
k
k
X
X
X
m≡
ai (mod 3) und m ≡
ai (mod 9) und m ≡
(−1)i ai (mod 11).
i=0
i=0
i=0
Den jeweiligen Ausdruck auf der rechten Seite der Kongruenzen nennt man, wenn die ai die
Ziffern der Dezimalzahldarstellung von m sind, in den ersten beiden Fälle die Quersumme, im
letzten Fall die alternierende Quersumme der Zahl m. Dieser Begriff ist kein wirklich mathematischer Begriff, insofern als er von der Schreibweise im Dezimalsystem abhängt.
b) Leite daraus die bekannten Kriterien für die Teilbarkeit von in Dezimalschreibweise gegebenen Zahlen durch 3, 9 bzw. 11 ab.
66
KAPITEL 2. NEUE RECHENBEREICHE
c) Schreibe die natürliche Zahl n im Dezimalsystem mit ungerade vielen Ziffern. Dabei darf
die erste Ziffer eine 0 sein. Bilde die Spiegelzahl n0 von n. (Die Spiegelzahl von z.B. 01234 ist
43210.) Zeige: 99 teilt n − n0 .
d) Gilt dies auch, wenn n mit gerade vielen Ziffern geschrieben ist? Gilt in diesem Fall zumindest
noch 9|n − n0 ?
e) Bei einer Unterhaltung bittet Dich Dein Gegenüber, Du mögest eine beliebige 5-stellige
(natürliche) Zahl, die nicht kleiner als 10050 ist, im Dezimalsystem – vor ihm verborgen –
notieren, und die Quersumme von dieser Zahl subtrahieren. Wenn Du ihm dann die letzten 4
Ziffern dieser Differenz in beliebiger Reihenfolge angibst, so macht er sich anheischig, die erste
zu nennen. Wie macht er das?
6. Von der Schule her ist Dir vielleicht die Neunerprobe“ geläufig. Eine ausgeführte Multiplikation
”
zweier (größerer) Zahlen kann man auf ihre Richtigkeit folgendermaßen testen: Der Neunerrest“
”
(d.h. der Rest bei der Division durch 9) des Produktes muss gleich dem Neunerrest“ des
”
Produktes der Neunerreste“ der Faktoren sein. Wieso gilt das? Ist es möglich, dass eine falsche
”
Multiplikation diesen Test besteht?
7. Sei d ∈ N2 . Entwickle für d–adisch geschriebene Zahlen (d.h. wo die Grundzahl 10 für das
Dezimalsystem durch eine natürliche Zahl d ≥ 2 ersetzt ist) Kriterien für die Teilbarkeit durch
2 (bzw. 3). Die Art eines solchen Kriteriums sollte nur von der Restklasse (d mod 2) (bzw. (d
mod 3)) abhängen.
8. Auf einem Blatt stehen alle natürlichen Zahlen von 1 bis 101 – jede genau einmal – geschrieben.
Indem man willkürlich zwei von ihnen, genannt x und y, ausradiert und die Zahl x5 +y hinzufügt,
vermindert man die Anzahl der Zahlen um 1. (Jede Zahl wird so oft gezählt, wie sie auf dem
Papier steht.) Indem man dieses (nicht völlig determinierte) Verfahren noch 99 mal wiederholt,
bleibt schließlich eine Zahl übrig. Kannst Du die letzte Ziffer dieser Zahl angeben, ohne mehr
zu wissen, als oben angegeben ist?
Löse diese Aufgabe zunächst rein theoretisch. Dann mache Dir klar, das die praktische
Ausführung obiger Anweisung leicht an ihre Grenzen stößt, da die Zahlen riesig werden.
9. Angenommen, Du gießt Deine Topfpflanzen jeden 2. (bzw. 3., bzw. 4., bzw. 5., bzw. 6.) Tag
und beginnst damit an einem Sonntag. Gibt es einen Wochentag, an welchem Du nie gießt?
10. Kalendarisches: Nach dem – aus der Mode gekommenen –Julianischen Kalender ist genau dann
ein Schaltjahr, wenn die Jahreszahl durch 4 teilbar ist. Nach dem heute gültigen Gregorianischen
Kalender ist dies in der Regel auch so, allerdings mit Ausnahme der Jahre, deren Jahreszahl
durch 100, aber nicht durch 400 teilbar ist. letztere sind keine Schaltjahre.
a) Zeige: Für den Julianischen (bzw. Gregorianischen) Kalender gilt (mit n, m ∈ N1 ):
n ≡ m(mod 28)
(bzw. n ≡ m(mod 400)
=⇒
Die Jahre n und m beginnen
mit demselben Wochentag.
2.4. RESTKLASSEN
67
b) Angenommen, der Julianische Kalender wäre seit dem Jahre 1 unverändert in Kraft, so wäre
der Wochentag, mit dem das Jahr n beginnt, der Tag
n−1
n+
mod 7 ,
4
wobei (1 mod 7) derjenige Wochentag ist, mit dem das Jahr 1 begann, (2 mod 7) der nächste
Wochentag usw. ([ ] ist die Gaußklammer.)
Diese Formel kann man auf die Jahre 1901 bis 2100 anwenden. Dabei ist (1 mod 7) der Sonntag,
da 1989 ≡ 1 (mod 28) ist und das Jahr 1989 mit einem Sonntag begann.
Übrigens ist
n−1
≡ 5q + r ≡ −2q + r (mod 7),
n+
4
wenn
n = 4q + r mit r ∈ {1, 2, 3, 4}
ist.
Überzeuge Dich von der Richtigkeit aller Behauptungen.
c) Für den Gregorianischen Kalender ergibt sich: Das Jahr n beginnt mit dem Wochentag
n−1
n−1
n−1
n+
−
+
mod 7 .
4
100
400
Dabei ist (1 mod 7) der Dienstag, da das Jahr 1991 mit einem Dienstag begann.
Stimmt’s?
d) Zeige: Nach dem Julianischen Kalender fällt im langjährigen Durchschnitt der 13. eines jeden
Monats auf jeden Wochentag gleich oft.
e) Dies ist nicht so nach dem Gregorianischen Kalender. Nach [Forster], Aufgabe 1.5 fällt er
am häufigsten auf den Freitag. Wer dies nachprüfen möchte, sollte – um Arbeit zu sparen – das
Jahr am 1. März beginnen lassen.
11. Bestimme die Inversen (bzgl. der Multiplikation) von (2 mod m) für ungerade und von (3 mod
m) für nicht durch 3 teilbare m.
12. a) Ist (1777 mod 1855) in dem Ring Z/(1855) multiplikativ invertierbar? Bestimme gegebenenfalls das Inverse!
b) Welche Bedeutung haben die beiden in a) genannten Zahlen für die Mathematikgeschichte?
13. Seien x, y ∈ Z. Zeige: Ist 3x + 2y durch 17 teilbar, so auch 5x + 9y.
14. Bestimme die drei letzten Ziffern von 19951995! + 1 .
15. Welche Teilbarkeitsaussage kann man über natürliche Zahlen der folgenden Art machen? Bei
ihrer Darstellung im Dezimalsystem kommen alle Ziffern von 1 bis 8 gleich oft vor. (Die Anzahl
der 0-en und 9-en ist beliebig.)
68
KAPITEL 2. NEUE RECHENBEREICHE
16. Bestimme sämtliche Primzahlen p mit folgender Eigenschaft: In Z/(p) ist die Restklasse von
7 zu der von 13 multiplikativ invers. Insbesondere sollst Du begründen, dass die angegebenen
Primzahlen wirklich alle mit dieser Eigenschaft sind.
17. Betrachte in M2 (Z/3) die Potenzen
n
A der Matrix A :=
1 1
1 0
, n∈N.
a) Zeige An = An+8 , und berechne dabei die Potenzen A0 , . . . , A7 .
b) Zeige dass die Matrizen A0 , . . . , A7 , 0 einen Körper bilden. Es gibt also einen Körper von 9
Elementen.
1 1
Bemerkung: Betrachte die Matrix
in M2 (Z/5). Genau genommen, ist diese eine
1 0
andere Matrix als die o.a. Matrix A, da ihre Einträge einem anderen Ring angehören. Ihre
Potenzen, zusammen mit der 0-Matrix bilden keinen Ring. Mit ein paar grundlegenden algebraischen Tatsachen, die allerdings in diesem Buch nicht bewiesen werden, ist das leicht zu
zeigen.
2.5
Geometrische Reihe, binomischer Lehrsatz
Ich habe mir sagen lassen, es gäbe 3 binomische Lehrsätze:
1. binomischer Lehrsatz: (a + b)2 = a2 + 2ab + c2 .
2. binomischer Lehrsatz: (a − b)2 = a2 − 2ab + b2 .
3. binomischer Lehrsatz: (a − b)(a + b) = a2 − b2 .
(Im Bereich der reellen (oder rationalen) Zahlen kann man diese Sätze auch geometrisch beweisen. Tu
das!)
Die obigen Bezeichnungen sind in meinen Augen irritierend.
Denn erstens ist der sog. 2. binomische Lehrsatz ja gar nichts anderes als der 1. Wenn man
nämlich b0 = −b setzt und (a + b0 )2 nach dem 1. binomischen Lehrsatz berechnet, erhält man
(a + b0 )2 = a2 + 2ab0 + b02 = a2 + 2a(−b) + (−b)2 = a2 − 2ab + b2 .
Zweitens ist der binomische Lehrsatz viel allgemeiner, als die oben angegebene simple
Formel. Er gibt nämlich allgemein eine Formel für die n-te Potenz (a + b)n an.
Drittens ist der sogenannte 3. binomische Lehrsatz eigentlich ein Spezialfall der geometrischen
Reihe.
Mit dieser fangen wir an.
Wir rechnen in einem kommutativen Ring R. In nicht kommutativen Ringen gelten die Formeln,
die wir erhalten werden, meist nicht. Z.B. ist (a + b)(a − b) = a2 + ba − ab − b2 und letzteres ist
nur dann gleich a2 − b2 , wenn ab = ba gilt.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
69
2.5.1 Geometrische Reihe. Wir berechnen folgendes Produkt, wo der zweite Faktor eine
geometrische Reihe ist:
(a − b)(an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn ) =
an+1 + an b1 + an−1 b2 + · · · · · · + a1 bn
− an b1 − an−1 b2 − · · · · · · − a1 bn − bn+1
= an+1 − bn+1
Ist a 6= b und der Ring R ein Körper, so folgt:
an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn =
Mit dem
an+1 − bn+1
a−b
P
-Zeichen geschrieben haben wir unter den jeweils erforderlichen Voraussetzungen:
(a − b)
n
X
a
n−i i
b =a
n+1
−b
n+1
, und
i=0
n
X
an−i bi =
i=0
an+1 − bn+1
.
a−b
Speziell erhält man für a = 1, b = x:
(1 − x)
n
X
i
x =1−x
n+1
i=0
und
n
X
xi =
i=0
1 − xn+1
.
1−x
(Die zweite Aussage gilt für x 6= −1.)
Satz 2.5.2 Sei f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ein sogenanntes Polynom mit den
Koeffizienten ai in einem kommutativen Ring R, welches ein α ∈ R als Nullstelle hat, so kann
man es folgendermaßen schreiben:
f (x) = (x − α) · g(x) ,
wo g(x) ein weiteres Polynom über R ist.
Der Faktor x − α heißt der zu α gehörige Linearfaktor.
Beweis:
(∗)
Nach Voraussetzung ist f (α) = an αn + · · · + a1 α + a0 = 0. Also gilt
f (x) = f (x) − f (α) = an (xn − αn ) + an−1 (xn−1 − αn−1 ) + · · · + a1 (x − α) + 0
Nach der Formel für die geometrische Reihe ist
xk − αk = (x − α)(xk−1 + xk−2 α + · · · + xαk−2 + αk−1 ) .
Aus jedem Summanden auf der rechten Seite der zweiten Identität in (∗) lässt sich also der
Faktor (x − α) herausziehen.
70
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkung 2.5.3 Sei R ein Ring. Ein Polynom über R ist ein ‘Ausdruck’ der Form
a0 + a1 x + a2 x2 + · · · + an xn mit ai ∈ R
Die ai heißen die Koeffizienten des Polynoms. Ein solcher Ausdruck kann als ‘Funktion’
der Variablen x aufgefasst werden, wobei man für x die Elemente von R oder auch eines
Erweiterungsringes von R ‘durchläuft’.
Folgerung 2.5.4 Sei f (x) ein vom Nullpolynom verschiedenes Polynom vom Grade n mit
Koeffizienten in einem nullteilerfreien, kommutativen Ring (etwa einem Körper) R, so hat es
in R höchstens n verschiedene Nullstellen.
Beweis: Sei α1 eine Nullstelle von f (x), so kann man f (x) = (x − α1 )g(x) schreiben mit
einem Polynom g(x) über R vom Grad n − 1. Hat nun g(x) eine Nullstelle α2 , so kann man den
zugehörigen Linearfaktor abspalten. Dies Verfahren kann man fortsetzen und erhält schließlich
f (x) = (x − α1 ) · · · (x − αm )h(x)
wo h(x) ein Polynom über R ist, das in R keine weiteren Nullstellen hat. Da R nullteilerfrei
ist, ist f (β) = 0 nur dann, wenn einer der Faktoren (β − αi ), bzw. h(β) gleich 0 ist. Letzteres
kann nicht sein, wenn β ∈ R ist. Also ist die Anzahl der Nullstellen von f (x) höchstens gleich
m und natürlich m ≤ n. (Es ist nicht ausgeschlossen, dass αi = αj für verschiedene i, j ist.) Beispiel 2.5.5 Der Ring R = Z × Z ist nicht nullteilerfrei. Das Polynom x2 − x hat in diesem
Ring die vier Nullstellen (0, 0), (0, 1), (1, 0), (1, 1). Dies ist nur eins von vielen Beispielen.
2.5.6 Geometrische Reihen spielen in der Mathematik eine große Rolle, insbesondere da man
unendlichen geometrischen Reihen oft einen Sinn zu geben vermag. Im Reellen hat die unendliche Reihe
∞
X
xn = 1 + x + x2 + x3 + · · ·
k=0
1
, wenn −1 < x < 1 ist. Durch Vergleich mit
immer dann einen sinnvollen Wert, nämlich 1−x
dieser Reihe kann man sehen, dass auch viele andere unendliche Reihen einen sinnvollen Wert
besitzen.
2.5.7 Jetzt wenden wir uns der binomischen Formel zu. Unser Ziel ist es, möglichst gut zu
beschreiben, was beim ‘Ausmultiplizieren’ von (a + b)n für beliebige natürliche Zahlen n herauskommt.
Wenn man in einem Ring R rechnet, der den Ring Z der ganzen Zahlen als Unterring besitzt,
etwa in den Körpern Q oder R, dann ist natürlich ka für k ∈ Z, a ∈ R definiert, weil ja dann
auch k ∈ R ist. Diesen speziellen Fall wollen wir im Folgenden bevorzugt betrachten.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
71
Man kann aber auch für eine ganze Zahl k und ein Element a aus einem beliebigen Ring R den
Ausdruck ka definieren.
Ist k > 0, so sei ka = a + · · · + a, wo die Anzahl der Summanden k sei. Ferner sei 0a = 0R , wo wir
der Deutlichkeit halber mit 0R das Nullelement von R bezeichnen. Ist schließlich k < 0, etwa k = −n.
Dann sei ka = (−n)a := −(na).
Es gelten folgende Gesetze:
1a=a, wo 1 das Einselement von Z bezeichnet;
(kl)a=k(la)
k(ab)=(ka)b=a(kb)
(k+l)a=ka+la
k(a+b)=ka+kb.
2.5.8 Jetzt behandeln wir den eigentlichen binomischen Lehrsatz.
Um das Muster zu erkennen, nach welchem (a + b)n umgeformt wird, wollen wir die ersten Fälle
nacheinander behandeln:
(a + b)2 = (a + b)(a + b) =
a2 + ab
+ ab +b2
= a2 + 2ab + b2 .
(a + b)3 = (a + b)(a2 + 2ab + b2 ) =
a3 + 2a2 b + ab2
+ a2 b + 2ab2 + b3
= a3 + 3a2 b + 3ab2 + b3 .
(a + b)4 = (a + b)(a3 + 3a2 b + 3ab2 + b3 ) =
a4 + 3a3 b + 3a2 b2 + ab3
+ a3 b + 3a2 b2 + 3ab3 + b4
= a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
(a + b)5 = (a + b)(a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 ) =
a5 + 4a4 b + 6a3 b2 + 4a2 b3 + ab4
+ a4 b + 4a3 b2 + 6a2 b3 + 4ab4 + b5
= a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5
72
KAPITEL 2. NEUE RECHENBEREICHE
2.5.9 Die n-te Potenz von a + b lässt sich im Prinzip wie folgt schreiben:
(a + b)n = an +?an−1 b+?an−2 b2 + · · · +?a2 bn−2 +?abn−1 + bn ,
wo anstelle der Fragezeichen gewisse ganzzahlige Koeffizienten, die so genannten Binomialkoeffizienten, stehen. Wir stellen uns die Aufgabe, diese genauer zu bestimmen. Zunächst
erkennen wir, dass die Koeffizienten für die (n + 1)-te Potenz sich aus denen der n-ten ergeben,
indem man jeweils zwei benachbarte Koeffizienten für die n-te Potenz addiert.
Genauer gilt: Der Koeffizient von an+1−k bk (in der Entwicklung von (a + b)n+1 ) ist die Summe
der Koeffizienten von an−k bk und von an−k+1 bk−1 (in der Etwicklung von (a + b)n ).
Es ergibt sich folgendes Schema, das sogenannte Pascal’sche Dreieck:
1
1
1
1
1
2
3
1
3
1
1
4
6
4
1
1
5
10
10
5
1
. . . . . . . . . . . . .
An der Spitze dieses ‘Dreiecks’ (sozusagen in der 0-ten Zeile) steht der Koeffizient von a0 b0
der ‘Entwicklung’ von (a + b)0 . In der folgenden ‘ersten’ Zeile stehen die Koeffizienten von a,
bzw. b in der Entwicklung von (a + b)1 In der n-ten Zeile stehen dann die Koeffizienten von
an , an−1 b, an−2 b2 , . . . , bn der Entwicklung von (a + b)n . Man darf man sich das Schema rechts
und links durch 0-en ausgefüllt denken. Jede Zahl in diesem Schema, abgesehen von der 1 an
der Spitze, ist dann die Summe der beiden unmittelbar schräg über ihr stehenden Zahlen. Zur
Übung solltest Du zumindest die nächsten beiden Zeilen des Pascalschen Dreiecks ausfüllen.
Es ist übrigens gar nicht die schlechteste Idee, die Binomialkoeffizienten durch wiederholte
Addition mit dem Pascalschen Dreieck zu berechnen, besonders dann, wenn Du nicht nur einen
einzelnen bestimmen willst. Wir werden im folgenden Abschnitt geschlossene Formeln für sie
finden. Diese sind aber auch nicht schnell auszurechnen.
2.5.10 Mit Hilfe der Fakultät kann man die Binomialkoeffizienten geschlossen hinschreiben.
Das wollen wir jetzt tun. Zunächst definieren wir für natürliche Zahlen n, k mit 0 ≤ k ≤ n:
n(n − 1) · · · (n − (k − 1))
n
n!
=
:=
k!(n − k)!
k!
k
(Sowohl Zähler wie Nenner des letzten Bruches bestehen, ausgeschrieben, aus k Faktoren,
während Zähler und Nenner des ersten Bruches aus je n Faktoren bestehen. Das erste Gleichheitszeichen mit dem Doppelpunkt davor ist eine Definitionsgleichung, das zweite ist eine mittels
‘Kürzen’ leicht einzusehende Identität.) Beachte
n
n
n
n
=
= 1 und
=
.
0
n
k
n−k
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
73
Lemma 2.5.11 Für natürliche Zahlen k, n mit 0 ≤ k ≤ n − 1 gilt:
n
n
n+1
+
=
k
k+1
k+1
Der Beweis ist eine leichte Bruchrechnungsübung.
n!
(k + 1)n! + (n − k)n!
(n + 1)!
n!
+
=
=
k!(n − k)! (k + 1)!(n − k − 1)!
(k + 1)!(n − k)!
(k + 1)!(n + 1 − (k + 1))!
Beachte: Da 10 = 11 = 1 ist, erkennt man sofort, dass nk gleich der Zahl ist, die an der
entsprechenden Stelle im Pascalschen Dreieck auftaucht, d.h. als k-te Zahl in der n-ten Zeile.
Dabei haben wir das Zählen jeweils mit 0 begonnen, weil es hier zweckmäßig ist.
Jedenfalls sind somit offenbar die nk die gesuchten Binomialkoeffizienten. Der Beweis folgenden
Theorems ist eigentlich nur eine Wiederholung.
Theorem 2.5.12
n
(a + b) =
n X
n
an−k bk =
k
k=0
n n−1
n n−2 2
n
n
n
2 n−2
a +
a b+
a b + ··· +
ab
+
abn−1 + bn
1
2
n−2
n−1
n
D.h. wenn man (a + b)n ausmultipliziert, ist k der Koefizient von an−k bk .
Beweis:
Induktion nach n, wobei der Fall n = 1 trivial ist, da
1
0
=
1
1
= 1 gilt.
Induktionsschritt: Wir nehmen an, obige Formel gelte für ein n und müssen sie dann für n + 1
zeigen.
(a + b)n+1 = (a + b)(a + b)n =
n n 1
n n−1 2
n 1 n
a
+
a b +
a b + ······· +
ab
1
2
n
n n 1
n n−1 2
n
+
a b +
a b + ······· +
a1 bn + bn+1
0
1
n−1
n+1 n 1
n + 1 n−1 2
n+1 1 n
n+1
=a
+
a b +
a b · ········· +
a b + bn+1 .
1
2
n
n+1
2.5.13 Die Bedeutung der Binomialkoeffizienten beschränkt sich nicht auf den binomischen
Lehrsatz.
Angenommen, Du möchtest als Lottospieler wissen, wieviele Möglichkeiten es gibt, aus den
Zahlen 1, 2, 3, . . . , 49 sechs Zahlen auszuwählen.
74
KAPITEL 2. NEUE RECHENBEREICHE
Nun für die Wahl der ersten Zahl hast Du 49 Möglichkeiten. Für die Wahl der zweiten Zahl
bleiben noch 48 Möglichkeiten usw. Insgesamt hast Du 49 · 48 · 47 · 46 · 45 · 44 Möglichkeiten,
nacheinander 6 Zahlen aus den 49 Zahlen zu wählen, ohne dass sich eine wiederholt.
Dabei hast Du allerdings zwei Auswahlen von 6 Zahlen unterschieden, wenn die Reihenfolge der Auswahlen verschieden war. Z.B. hast Du die Wahl 7,14,21,28,35,42 von der Wahl
14,7,21,28,35,42 unterschieden, d.h. beide gesondert gezählt. In wieviel verschiedenen Reihenfolgen kann man die sechs Zahlen 7,14,21,28,35,42 auswählen? Nun wir wissen bereits, dass
man sechs Zahlen in 6! verschiedenen Reihenfolgen angeben kann. Wenn Du also nur wissen
willst, wieviele Möglichkeiten es gibt, aus 49 Zahlen sechs auszuwählen, ohne deren Reihenfolge
zu beachten, so erhältst Du die Zahl
49 · 48 · 47 · 46 · 45 · 44
49
=
6!
6
Rechne diese Zahl aus! (Kürze vor dem Multiplizieren!)
Allgemein besitzt eine Menge von n Elementen nk Teilmengen von k Elementen. (Das gilt auch
wenn man nk = n(n−1)···(n−k+1)
definiert und k > n ist. Denn dann taucht im Zähler der Faktor
k!
0 auf.)
Auf dieser Grundlage gibt es eine weitere Möglichkeit, den Binomialsatz zu beweisen:
Man stelle sich (a + b)n als Produkt von n Faktoren geschrieben vor:
(a + b)(a + b)(a + b) · · · (a + b)
Wenn man dieses Produkt ausmultipliziert, bedeutet dies, dass man alle möglichen Produkte
bildet, wo aus jedem Faktor einer der beiden Summanden
ausgewählt wird und anschließend
n
diese Produkte addiert werden. Offenbar gibt es
Möglichkeiten, aus k Faktoren den Sumk
manden b und aus
den
übrigen n − k Faktoren den Summanden a auszuwählen. Das Produkt
n
an−k bk tritt also
-mal auf.
k
Bemerkung 2.5.14 Die Binomialkoeffizienten, so wie wir sie bislang kennengelernt haben,
sind natürliche Zahlen. Denn wenn man sie z.B. nacheinander in dem Pascalschen Dreieck
durch Addition gewinnt, muss man immer zwei natürliche Zahlen addieren.
Hieraus folgt,dass
k! Teiler eines jeden Produktes von k aufeinander folgenden ganzen Zahlen
n
n(n − 1) · · · (n − k + 1)
ist. Es ist ja
=
. Bedenke, dass es nicht genügt, zu zeigen, dass
k
k!
jede der Zahlen 1, . . . , k eine der k Zahlen n, n − 1, . . . , n − k + 1 teilt.
Ist k > n, so tritt in dem Produkt n(n − 1) · · · (n − k + 1) der Faktor 0 auf, so dass dieses
Produkt auch in diesem Fall durch k! teilbar ist.
a
Man betrachtet auch verallgemeinerte Binomialkoeffizienten
, wo a nicht notwendig ganz
k
ist. Ein solcher braucht nicht ganz zu sein.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
75
2.5.15 Man kann die Binomialkoeffizienten benutzen, um elementare Aussagen über Primzahlen zu beweisen. Das hat zwei Gründe:
Erstens kann man die Größe der Binomialkoeffizienten gut abschätzen. Z.B. gilt:
n X
n
n
(1 + 1) =
k
k=0
weshalb auch der größte unter den nk , k = 0, 1, . . . , n (für n ≥ 1)kleiner als 2n ist. Entsprechendes gilt für die Summe einiger dieser Binomialkoeffizienten.
Zweitens kann man verhältnismäßig starke Aussagen über die Primfaktoren von nk beweisen.
Als Beispiel beweisen wir:
Satz 2.5.16 Für jede natürliche Zahl n ≥ 2 gilt: Das Produkt der Primzahlen p ≤ n ist kleiner
als 4n−1 . Symbolisch:
Y
p < 4n−1
p≤n
Dabei istPp eine Variable für Primzahlen. Und
zeichen
verwendet.
Q
wird als Produktzeichen analog zum Summen-
(Sicher ist dies eine ziemlich grobe Abschätzung. Bedenke aber, dass diese Abschätzung falsch
wird, wenn man die Primzahlen ≤ n etwa durch alle – oder auch nur alle ungeraden – positiven
ganzen Zahlen ≤ n ersetzt.)
Beweis:
Zunächst zeige ich folgende
Behauptung: 2n+1
≤ 4n .
n
P
2n+1
Beweis hierfür: Da 2n+1
= 22n+1 ist, gilt
k=0
k
2n + 1
2n + 1
+
< 22n+1
n
n+1
Ferner ist 2n+1
= 2n+1
, also
n
n+1
2n + 1
2·
< 22n+1 ,
n
woraus die Behauptung unmittelbar folgt. –
Zum Beweis des Satzes benutzen wir Induktion nach n und vergewissern uns zunächst, dass er
für n = 2 richtig ist.
Sei jetzt n ≥ 3; und wir nehmen die Gültigkeit des Satzes für alle kleineren ganzen Zahlen
(≥ 2) an.
1. Fall: n sei gerade. Dann ist n keine Primzahl (da 2 die einzige gerade Primzahl ist). In diesem
Falle ist also
Y
Y
p=
< 4n−2 < 4n−1 .
p≤n
p≤n−1
76
KAPITEL 2. NEUE RECHENBEREICHE
2. Fall: n sei ungerade, etwa n = 2m + 1 (mit m ≥ 1). Dann ist nach Induktionsvoraussetzung
Y
p < 4m
p≤m+1
In der Primfaktorzerlegung von 2m+1
=
m
m + 1 < p ≤ 2m + 1 auf. Somit gilt
(m+1)(m+2)···(2m+1)
1·2···m
Y
p≤
m+1<p≤2m+1
tauchen alle Primzahlen p mit
2m + 1
< 4m .
m
Insgesamt ist
Y
p < 4m 4m = 42m = 4(2m+1)−1
p≤2m+1
Bemerkung 2.5.17 Nicht beweisen will ich hier das sogenannte Bertrandsche Postulat. Es
lautet:
Zu jedem n ∈ N1 gibt es eine Primzahl p mit n < p ≤ 2n.
Es lässt sich mit Hilfe von Binomialkoeffizienten elementar (d.h. ohne Hilfe komplexer Zahlen
und deren Analysis) verhältnismäßig einfach beweisen. (Obiger Satz wird dafür gebraucht.)
Ich verweise Dich aufs Internet.
AUFGABEN
n
1. Seien x, y, m, n ∈ Z, m, n ≥ 1 und p eine Primzahl. a) Zeige: Ist x ≡ y mod pm , so ist xp ≡
n
y p mod pm+n .
b) Gilt die Behauptung auch für m = 0?
c) Zeige, dass die Umkehrung nicht gilt.
2. Zeige: Wenn a, b > 0 sind und n ≥ 2 ganz ist, so ist
√
n
an + bn < a + b.
3. a) Wenn a, n ∈ N2 gilt und an + 1 eine Primzahl ist, so ist a gerade und n = 2m mit einem
m ∈ N.
b) Wenn a, n ∈ N und an − 1 prim ist, so ist a = 2 und n prim.
(Hinweis: Geometrische Reihe.)
c) Es ist 82 + 1 keine Primzahl und auch 211 − 1 = 2047 = 23 · 89 keine solche. Warum steht
dieses nicht im Widerspruch zu a), bzw. b)?
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
77
4. a) Im Bereich der natürlichen Zahlen sei c ein Teiler von ab und c < a sowie c < b. Zeige, dass
dann ab/c keine Primzahl ist.
b) 11 ist eine Primzahl, 111 nicht (warum?). Zeige: Ist im Dezimalsystem eine n-stellige Zahl,
deren sämtliche Ziffern gleich 1 sind, eine Primzahl, so muss auch n eine Primzahl sein. Die
Umkehrung ist leider falsch, wie das Beispiel 111 lehrt.
c) 101 ist eine Primzahl, 10101 nicht. Gibt es neben 101 überhaupt Primzahlen, die im Dezimalsystem abwechselnd die Ziffern 1 und 0 haben? (Tipp: Stelle 1010 . . . 101 als geometrische
Reihe dar und benutze a).)
5. Bestimme (mit Hilfe der Formel für die geometrische Reihe) einen Primfaktor von 2148 + 1.
Bemerkung: Der komplementäre Faktor ist ebenfalls prim, wie A. Ferrier (von dem ich leider
nichts weiß) ohne elektronische Rechner (allerdings mit einer mechanischen Rechenmaschine)
um 1950 nachgewiesen hat. Damals war das ein Rekord!
√
√
6. a) Zeige: Für jede natürliche Zahl n ist (1 + 2)n + (1 − 2)n eine gerade ganze Zahl. (Hinweis:
Binomialsatz.)
X
n n+1
m
b) Zeige:
=
, (n ≥ k).
k+1
k
m=k
(Hinweis: Bei Induktion nach n kann man den Hilfsatz zum Beweis des Binomialsatzes benutzen.)
7. Betrachte im Pascalschen Dreieck eine ‘Parallele zum linken Schenkel’ also die Folge
n
n+1
n+2
n+k
,
,
,...,
,...
n
n
n
n
a) Überlege, dass die ‘folgende Parallele’, also
n+1
n+2
n+3
n+1+k
,
,
,...,
,...
n+1
n+1
n+1
n+1
die summatorische Folge der vorangehenden ist. Dabei soll die summatorische Folge der
Folge
(ak )k∈N = (a0 , a1 , a2 , . . .)
als die Folge
k
X
(a0 , a0 + a1 , a0 + a1 + a2 , . . .) = (
ai )k∈N
i=0
definiert sein. (Es ist gar nicht schwer, dies einzusehen.)
n+k
b) Überlege Dir auch, dass
ein Polynom n-ten Grades in k ist.
n
n
n
8. Seien r, s, n ∈ N. Zeige: Aus 0 ≤ r < s ≤ n/2 folgt
<
.
r
s
78
KAPITEL 2. NEUE RECHENBEREICHE
9. a) Zeige: Für jedes n ∈ N gilt:
n
X
(1/2)i < 2.
i=0
b) Folgere:
n X
i=m
1
2
i
<
2
.
2m
n
c) Zeige 2 < n! für n ≥ 4. (Wenn man nicht mit Induktion argumentieren will, geht es so:
24+k = 16 · 2 · · · 2 < 24 · (4 + 1) · · · (4 + k), wo links nach dem Faktor 16 = 24 ein Produkt von
k Faktoren 2 und rechts nach dem Faktor 24 das Produkt der k Zahlen 4 + 1, . . . , 4 + k steht.)
1
n 1
d) Zeige: Für alle natürlichen Zahlen n ≥ 1 und k gilt:
≤ .
k
k!
k n
n X
n
1
1
e) Zeige: Unter denselben Voraussetzungen gilt: 1 +
≤
< 3.
n
k!
k=0
(Hinweis: d) für die 1. und b), c) für die 2. Ungleichung)
10. a) Zeige, dass mk(mk − 1) · · · (mk − k + 1) durch mk! teilbar ist. (m, k ∈ N.)
b) Folgere, dass (mn)! durch m!(n!)m teilbar ist. (Der zweite Ausdruck ist unsymmetrisch in n
und m. Es ist (2 · 2)! durch 2!(2!)2 teilbar, aber nicht durch (2!)2 (2!)2 .)
11. Peter fragt seine Mutter, wie alt sie sei. Da sie ihr Alter aber nicht so locker verraten mag,
antwortet sie: Wenn Du von der dritten Potenz des Alters Deines Vaters die dritte Potenz
meines Alters abziehst, erhältst Du die Zahl 26551. Wie alt sind Peters Eltern? (Das Alter von
Mutter und Vater wird als ganze Anzahl von Jahren angenommen.)
12. Seien n, a ∈ N, n ≥ 2, a ≥ 1. Zeige: Es gibt nur endlich viele Paare ganzer Zahlen (x, y), so dass
xn − y n = a gilt. (Vielleicht fällt es Dir leichter, die stärkere Behauptung zu zeigen, dass es nur
endlich viele Paare ganzer Zahlen (x, y) mit 0 < xn − y n ≤ a gibt.)
13. a) Sei n ≥ 3 eine ganze Zahl. Zeige (n+1)n < nn+1 . (Entwickle (n+1)n gemäß dem binomischen
Lehrsatz. Vergleiche die ersten n−1 Summanden und die Summe der letzten beiden Summanden
dieser Entwicklung jeweils mit nn . Für den letzten Vergleich benötigst Du n ≥ 3. Was gilt für
n = 2?)
b) Mit Hilfe von Wurzeln, die man oft erst im Bereich der reellen (und nicht innerhalb der
rationalen) Zahlen ziehen kann, kann man aus a) folgern: Sind m, n ∈ N mit 3 ≤ m < n,
so gilt nm < mn . (Welche Folgerung in Bezug auf die Lösungen der Gleichung xy = y x im
Bereich der ganzen Zahlen kann man daraus ziehen?) Wenn man allgemeine Potenzen mit
reellen Exponenten kennt, kann man auch für reelle Zahlen a, b mit e ≤ a < b die Ungleichung
ba < ab zeigen. Siehe 7.6.4 . (Hier habe ich mit e die Eulersche Zahl bezeichnet, die im Beispiel
5 von Abschnitt 3.1 behandelt wird.)
14. Seien a, m, n positive ganze Zahlen mit a ≥ 2. Sei m = qn + r eine Division mit Rest (in N),
wo 0 ≤ r < n ist.
a) Zeige: Dann gibt es ein q 0 ∈ N mit am − 1 = q 0 (an − 1) + ar − 1.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
b) Folgere: n|m ⇐⇒ an − 1|am − 1
c) Folgere: aggt(m,n) − 1 = ggt(am − 1 , an − 1).
79
80
KAPITEL 2. NEUE RECHENBEREICHE
Kapitel 3
Grenzwerte und reelle Zahlen
3.1
Unendliche Reihen
‘Unendliche Reihen’ sind nur eine andere Bezeichnung für unendliche Summen. Auch wenn ich
in diesem Abschnitt ein wenig unpräzise bin, kannst Du, wie ich glaube, eine Menge lernen.
Beispiel 1:
1
1 1 1
+ + +
+ ··· = ?
2 4 8 16
Wir schreiben diese unendliche Summe auch wie folgt:
∞
∞
X
X
1
1 1 1
1
−1
−2
−3
−4
=
+
+
+
+
·
·
·
=
2
+
2
+
2
+
2
+
·
·
·
=
2−k =?
n
2
2
4
8
16
n=1
k=1
Welche Meinung hast Du zu unendlichen Summen, insbesondere zu der
angegebenen?
Es ist Unsinn, solche zu betrachten.
Ihr Studium mag
zwar für Mathematiker ganz lustig sein, aber sicher nicht für Physiker und
Informatiker.
Obiger Summe legt man sinnvoller Weise den Wert 1 zu.
Um der o.a. unendlichen Summe auf sinnvolle Weise einen Wert zu geben,
benutze ich ein anschauliches Argument: Stelle Dir einen Glaszylinder vor,
der 1 Liter fasst. Dieser wird zuerst halb gefüllt, dann wird durch hinzugießen von einem viertel Liter vom freien Rest wieder die Hälfte gefüllt,
und es bleibt 1/4 Liter frei. Dann bleibt nach Hinzufügen von 1/8 l wieder
1/8 l frei. So geht es weiter: im n-ten Schritt fügt man 2−n l hinzu, und
der Literzylinder ist bis auf 2−n l gefüllt. Der einzig sinnvolle Wert für o.a.
unendliche Reihe (Summe) ist
∞
X
k=1
2−k =
1 1 1
1
1
+ + +
+ ··· + k + ··· = 1
2 4 8 16
2
(Rechts hast Du Platz zum zeichnen.)
81
82
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Was haben wir gemacht? Wir haben nacheinander die endlichen Partialsummen
2
3
1
X
1
1 X 1
1 X 1
1
=1− ,
= 1 − 2,
= 1 − 3,...
k
k
k
2
2 k=1 2
2
2
2
k=1
k=1
betrachtet und uns überlegt, wogegen die Folge dieser Partialsummen geht, d.h. welchen
Grenzwert sie hat.
∞
Beispiel 2: a)
X
1
1
1
1
1
1
+
+
+
+ ··· +
+ ··· =
=?
1·2 2·3 3·4 4·5
n(n + 1)
k(k + 1)
k=1
Ich will die einzelnen Summanden umformen.
1
1
(n + 1) − n
1
1 1
1
−
=
=
, z.B. − = . (Solltest Du je Probleme mit
n n+1
n(n + 1)
n(n + 1)
2 3
6
der Bruchrechnung gehabt haben, so sind diese jetzt doch überwunden, nicht wahr?)
Es gilt
Obige unendliche Reihe kann man also auch so schreiben:
∞
X
k=1
1
=
k(k + 1)
1 1
−
1 2
+
1 1
−
2 3
+
1 1
−
3 4
+
1 1
−
4 5
+ ···
Du siehst: Wenn man die ersten n Glieder der Reihe (in ihrer zweiten Gestalt) addiert, so hebt
sich nach Entfernen der Klammern viel weg und man erhält als Summe der ersten n Glieder
1
die Zahl 1 −
. (Sehr anschaulich bezeichnet man eine solche Summe als Teleskopsumn+1
me; sie ist wie ein Teleskop zusammenschiebbar.) Wieder ist der einzig sinnvolle Wert unserer
unendlichen Reihe
∞
X
k=1
1
1
1
1
1
1
=
+
+
+
+ ··· +
+ ··· = 1
k(k + 1)
1·2 2·3 3·4 4·5
n(n + 1)
b) Für später notieren wir: Lässt man die ersten N Summanden dieser Reihe weg, so erhält
man auf dieselbe Weise
∞
X
1
1
1
1
1
=
+
+
+ ··· =
k(k + 1)
(N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4)
N +1
k=N +1
Prüfe das nach.
∞
Beispiel 3:
X1
1 1 1 1 1
1
+ + + + + ··· + + ··· =
= ? ( Harmonische Reihe“)
”
1 2 3 4 5
n
n
n=1
Was glaubst Du?
Da die Glieder dieser Reihe gegen 0 gehen, erhält man, wie bei den
obigen Reihen einen endlichen Wert.
Obwohl die Glieder dieser Reihe gegen 0 gehen, hat
sie keinen endlichen Wert.
Das ist bis heute unbekannt.
3.1. UNENDLICHE REIHEN
83
Wir fassen die Glieder dieser Reihe wie folgt zusammen:
1
1 1
1 1 1 1
1
1
1
1
+
+
+
+ + +
+
+ ··· +
+
+ ··· +
+ ···
2
3 4
5 6 7 8
9
16
17
32
1 1
1 1
1
1
+ ≥ + =2· = ,
3 4
4 4
4
2
1
1
1
1
+ ··· +
≥8·
= , usw.
9
16
16
2
Deshalb gilt
Nun ist
1
1
1
1
1
1
+ ··· + ≥ + ··· + = 4 · =
5
8
8
8
8
2
1 1 1 1 1
1 1 1
+ + + + + ··· ≥ 1 + + + + ···
1 2 3 4 5
2 2 2
Also bleibt als einzig sinnvoller Wert der harmonischen Reihe:
∞
X
1 1 1 1 1
1
= + + + + + · · · = ∞ = unendlich.
n
1 2 3 4 5
n=1
(Wir betrachten ∞ nicht als (reelle) Zahl, weil man mit ∞ schlecht rechnen kann. Aber es
spricht nichts dagegen, ∞ als Wert einer unendlichen Reihe, als ‘uneigentlichen Grenzwert’
zuzulassen.)
In den Beispielen 4 und 6 werden wir die harmonische Reihe auf zweierlei Weise modifizieren
und endliche Werte erhalten.
Beispiel 4: Wir quadrieren die Summanden der harmonischen Reihe:
∞
X
1
1
1
1
1
1
= 1 + 2 + 2 + 2 + 2 + ··· + 2 + ··· =?
2
n
2
3
4
5
n
n=1
1
1
1
1
1
1
<
, also 2 <
, 2 <
usw. Durch
2
(n + 1)
n(n + 1)
2
1·2 3
2·3
Vergleich mit Beispiel 2 erhält man hieraus, vorausgesetzt unsere Reihe hat einen vernünftigen
Wert,
Es gilt (für n ≥ 1) die Beziehung
1
1
1
1
+ 2 + 2 + 2 + ··· < 1 + 1 = 2
2
2
3
4
5
Wenn man die reellen Zahlen axiomatisch einführt, kann man als eines der Axiome z.B. folgendes
nehmen:
1+
Jede unendliche Summe positiver Summanden, deren Partialsummen nach oben beschränkt
sind, hat einen (endlichen) reellen Wert.
π2
In der Tat ist der Wert o.a. unendlicher Summe
. Dies ist allerdings keineswegs einfach zu
6
sehen. Wenn Du Glück hast, hörst Du einen Beweis dafür am Ende des 1. Semesters in der
Vorlesung Analysis 1“. Jedenfalls findest Du einen Beweis im Buch O. Forster: Analysis 1.
”
Frage: Was ist π?
84
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Der sechzehnte (kleingeschriebene) Buchstabe des griechischen Alphabets. Ungefähr
gleich 3,14159. Das Verhältnis des Umfangs eines Kreises zu seinem Durchmesser. Das Verhältnis der Fläche eines Kreises zum Quadrat über seinem Radius. Das Verhältnis der Oberfläche einer Kugel zum Quadrat über ihrem Durchmesser. Drei viertel des
Verhältnisses des Volumens einer Kugel zum Volumen des Würfels über ihrem Radius. (In
den letzten vier Antworten ist die euklidische Geometrie zugrunde gelegt.)
Antwort: Alle gegebenen Antworten sind richtig. (Dabei muss man vielleicht eine feinsinnige
Zusatzbemerkung machen, was die erste Antwort von den andern unterscheidet.)
Frage: Warum schreibt man π und nicht 3,14159?
π schreibt sich kürzer als 3,14159. π = 3,14159 ist nicht exakt richtig. π lässt sich
nicht als endlicher Dezimalbruch, ja überhaupt nicht als Bruch mit ganzzahligem Zähler und
Nenner schreiben. D.h. π ist irrational.
Antwort: Die erste Antwort ist natürlich nicht falsch, die zweite ist aber besser, und die dritte
hat die größte mathematische Substanz! Dazu gibt es in 7.7 eine Aufgabe. Hier werden wir nur
beweisen, dass der Wert der folgenden Reihe irrational ist.
∞
Beispiel 5: 1 +
X 1
1
1
1
+
+
+ ··· =
1 1·2 1·2·3
k!
k=0
(Erinnere Dich an die Definition 0! := 1, n! := 1 · 2 · · · n für ganze n > 0.) Wenn wir, für jedes
1
1
n, den Summanden
mit dem Summanden
der Reihe aus Beispiel
1 · 2 · · · n · (n + 1)
n(n + 1)
2 vergleichen, sehen wir dass unsere Summe – wenn überhaupt – einen Wert < 3 hat. Wie im
Beispiel 4. hat diese Reihe im Bereich der reellen Zahlen Wert. Dieser wird in der Regel mit e
bezeichnet. Es gilt also 2 < e < 3. Angenähert ist e = 2, 718281828 . . ..
Was meinst Du? e hat die Periode 1828, ist also rational.
Da man immer nur
endlich viele Dezimalstellen von e berechnen kann, ist dies nicht zu entscheiden.
Es
könnte trotzdem einen Beweis für eine der beiden Behauptungen geben: e ist rational bzw. e
ist irrational.
Die Ziffernfolge 1828 wiederholt sich nicht ein drittes Mal. Mit Hilfe von Beispiel 2 kann man
vielmehr zeigen:
Satz: e ist keine rationale, sondern eine irrationale Zahl, d.h. kein Bruch mit ganzem Zähler
und Nenner.
m
Beweis: Indirekt! Wäre e eine rationale Zahl mit dem Nenner N ≥ 2, etwa e = N
(mit
m
natürlichen Zahlen m, N ), so wäre nicht nur N e, sondern erst recht N ! · e = 1 · 2 · · · N · N eine
ganze Zahl. Wir zeigen, dass dies für keine natürliche Zahl N möglich ist.
Multiplizieren wir die ersten N + 1 Summanden
von e mit N ! = 1 · 2 · · · N , so erhalten wir
P
lauter ganze Zahlen. Für den Rest r := N ! ∞
n=N +1 1/n! genügt es also 0 < r < 1 zu zeigen.
Denn N !e ist ja dann die Summe von r und einer ganzen Zahl, also nicht ganz, da r nicht ganz
ist.
3.1. UNENDLICHE REIHEN
85
Offenbar gilt
r=
1
1
1
+
+
+ ···
N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3)
Vergleichen wir diese Reihe, anfangend mit dem 2. Summanden, mit Beispiel 2 b), so erhalten
wir
r=
1
1
1
1
+
+
+
+· · · <
N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3) (N + 1)(N + 2)(N + 3)(N + 4)
1
1
1
1
1
1
+
+
+
+ ··· =
+
<1
(N + 1) (N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4)
N +1 N +1
da N ≥ 2 ist. Also ist N ! · e für keine natürliche Zahl N ganz und deshalb e irrational.
Beispiel 6: Wir versehen die Hälfte“ der Summanden der harmonischen Reihe mit dem Minus”
Zeichen, d.h. wir bilden die sogenannte alternierende harmonische Reihe:
∞
X (−1)k+1
1 1 1 1
(−1)n+1
1 − + − + − +··· +
+ ··· =
= ?.
2 3 4 5
n
k
k=1
1
1 1
1 1 1
Wenn wir die Teilsummen s1 = 1, s2 = 1 − , s3 = 1 − + , s4 = 1 − + − usw. auf
2
2 3
2 3 4
der Zahlengeraden betrachten, so sehen wir sie hin- und herhüpfen; dabei werden die Sprünge
immer kleiner und ihre Länge geht gegen 0. Es ist also plausibel, dass die Teilsummen gegen
einen Grenzwert gehen, den Wert der unendlichen Reihe. (‘Leibnizsches Konvergenzkriterium’)
Dieser Wert liegt offenbar zwischen 1/2 und 1. Er ist gleich ln 2, dem natürlichen Logarithmus
von 2, wie man in den meisten Vorlesungen Analysis 1“ lernt.
”
Frage: Darf man in einer unendlichen Reihe die Reihenfolge der Summanden beliebig vertauschen, ohne dass sich an ihrer Konvergenz oder ihrem Wert etwas ändert?
Ja.
Nicht immer.
Beispiel 7: Wir schreiben die Summanden der alternierenden harmonischen Reihe in folgender Reihenfolge:
∞
X
1 1 1 1 1
1 − − + − − + ··· =
2 4 3 6 8
k=0
1
1
1
−
−
2k + 1 2(2k + 1) 2(2k + 2)
.
(Auf je einen positiven Summanden folgen je zwei negative. Innerhalb der Folge der positiven,
sowie innerhalb der Folge der negativen Summanden bleibt die Reihenfolge bestehen.) Dabei
bedeutet das Gleichheitszeichen dass die Werte der beiden Reihen gleich sind, nicht aber die
Reihen als solche. Wenn Du genauer weißt, wie der Wert einer Reihe definiert ist, kannst Du
leicht das Folgende zeigen: Ist eine Reihe konvergent, d.h. hat sie einen endlichen Wert, so darf
man beliebige endliche Teile aufeinander folgender Glieder der Reihe zu je einem Summanden
zusammenfassen, ohne dass sich an ihrem Wert etwas ändert.
86
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Behauptung: Der Wert der o.a. Reihe ist genau halb so groß wie der der ursprünglichen
alternierenden harmonischen Reihe, der ja nicht 0 ist. Denn es gilt:
1
1
1
1
1
1
−
−
=
−
.
2k + 1 2(2k + 1)
2(2k + 2)
2 2k + 1 2k + 2
Wenn wir jetzt diese Glieder für beginnend mit k = 0 der Reihe nach aufsummieren, die
Klammern weglassen und den gemeinsamen Faktor 12 herausziehen, erhalten wir
1
1 1 1 1
1 − + − + − ··· ,
2
2 3 4 5
das heißt die alternierende harmonische Reihe, mit
1
2
multipliziert.
Beispiel 8: Jetzt ordnen wir die alternierende harmonische Reihe wie folgt um:
1−
1 1 1 1 1 1 1
1
1
1
1
1
1
1
1
1
+ − + − − + −
−
−
−
+ −
− ··· −
+
−
− ···
2 3 4 5 6 8 7 10 12 14 16 9 18
32 11 34
Beginnend mit 1/3 nimmt man immer abwechselnd einen positiven und 2n negative Summanden
auf. Genauer: nach dem positiven Summanden 1/3 nimmt man 20 negative Summanden; nach
dem nächsten positiven Summanden 1/5 nimmt man die nächsten 21 negativen Summanden,
usw.
1
1
1
1
1 1
Da − − ≤ − , − − · · · −
≤ − , usw. ist, gilt für einen möglichen Wert w der o.a.
6 8
4
10
16
4
1 1 1 1 1 1 1 1
umgeordneten alternierenden harmonischen Reihe w ≤ 1 − + − + − + − + −
2 3 4 5 4 7 4 9
1
1
+
− + · · ·. Mit
4 11
1 1
1
1
1 1
1
− + =−
=−
ist − + ≤ −
für n ≥ 5 .
4 5
4·5
20
4 n
20
Also gilt
w ≤1−
1 1
1
1
1
+ −
−
−
− · · · = −∞ .
2 3 20 20 20
Überlege Dir, dass hinter den letzten beiden Beispielen ein ‘Geheimnis des Unendlichen’ steckt.
Wenn man aus einem ‘Fass’ mit den Zahlen 1, 2, 3, . . . , 1 000 000 zu Anfang sehr viele gerade
n und nur wenige ungerade n herausnimmt und schließlich das ganze Fass leeren will, so muss
man irgendwann zum Ausgleich sehr viele ungerade Zahlen herausnehmen. Sind etwa unter den
ersten 500 000 herausgenommene Zahlen 499 000 gerade Zahlen, so müssen notwendigerweise
unter den letzten 500 000 herausgenommenen Zahlen auch 499 000 ungerade Zahlen sein.
Das ist ganz anders, wenn das Fass mit unendlich vielen, etwa allen natürlichen Zahlen gefüllt
ist. Dann kann man für jedes m die ersten 10m herausgenommenen Zahlen so wählen, dass
sich unter ihnen nur m ungerade, aber 10m − m gerade n finden, und fischt trotzdem auch
jedes ungerade n irgendwann aus dem Fass.
3.1. UNENDLICHE REIHEN
87
Zusatzbemerkungen
Zu Beispiel 1: Wie Du weißt, gilt für q 6= 1 die Formel
Pn
k
2
n
k=0 q = 1+q+q +· · ·+q =
1 − q n+1
,
1−q
1
, vorausgesetzt, es
1−q
ist −1 < q < 1. S.u. Wählt man q = 1/2, so erhält man die Reihe aus Beispiel 1 mit einem
zusätzlichen Summanden 1.
also für die unendliche Reihe
P∞
k=0
qk = 1 + q + q2 + · · · + qn + · · · =
Zu den Beispielen 3 und 4: Die Quadratzahlen bilden eine Teilmenge der Menge aller
positiven ganzen Zahlen. Wir haben gesehen, dass die Summe der Kehrwerte aller natürlichen
Zahlen unendlich, dagegen die der Kehrwerte aller Quadratzahlen endlich ist. Man kann sich
für jede Teilmenge der natürlichen Zahlen fragen, ob die Summe ihrer Kehrwerte endlich oder
unendlich ist. Man weiß, dass die Summe der Kehrwerte aller Primzahlen unendlich ist. Das
ist nicht trivial, aber auch nicht allzu schwer zu zeigen. Siehe Chapter 1 in dem hübschen
Buch Proofs from THE BOOK“ von M. Aigner und G.M. Ziegler (Springer Verlag). Dass die
”
Summe der Kehrwerte der Primzahlen unendlich, die der Quadratzahlen aber endlich ist, kann
man so interpretieren, dass die Primzahlen dichter im Bereich der natürlichen Zahlen liegen als
die Quadratzahlen. (Das heißt nicht, dass man aus dieser Erkenntnis gleich folgern kann, dass
zwischen je zwei verschiedenen Quadratzahlen 6= 0 mindestens eine Primzahl liegt. Das glaubt
zwar jeder, kann aber dummerweise noch keiner beweisen.)
Zu Beispiel 6: Die sogenannte Taylorentwicklung der Funktion ln(1 + x) ist ln(1 + x) =
x x2 x3
−
+
− + · · ·. Diese Gleichung gilt für alle x mit −1 < x ≤ 1, und man erhält unsere
1
2
3
Behauptung, indem man x = 1 setzt.
1
Unvollständige Begründung: Die Funktion ln(1 + x) ist die Stammfunktion von
.
1+x
1
(D.h. die Ableitung der Funktion ln(1 + x) ist die Funktion
. (Diese Begriffe kennst Du
1+x
vielleicht schon. Sie werden auch weiter unten in diesem Buch behandelt.) Letztere Funktion
kann man, wie in der Bemerkung zu Beispiel 1 angegeben, als unendliche Reihe schreiben:
setze q = −x. Die sogenannte Taylorentwicklung von ln(1 + x) erhält man durch ‘gliedweise
Integration’. Das alles funktioniert zunächst jedoch nur für −1 < x < 1. Für x = 1 braucht
man ein zusätzliches Argument, den ‘Abelschen Grenzwertsatz’.
Zu Beispiel 7: Durch geeignete Umordnung kann die alternierende harmonische Reihe jede vorgegebene reelle Zahl als Wert annehmen. Wer mathematisch geschickt ist, mag selbst
versuchen, dies zu zeigen.
P
n
Ein Beispiel, das unsere Vorfahren irritiert hat: Die unendliche Reihe ∞
n=0 (−1) = 1 −
1+1−1+· · · hat keinen vernünftigen Wert. Man kann allerdings ihre Summanden so klammern,
dass einmal der Wert 0, ein andermal der Wert 1 herauskommt. (1 − 1) + (1 − 1) + (1 − 1) + · · ·,
bzw 1 + (−1 + 1) + (−1 + 1) + (−1 + 1) + · · ·.
Dieses Beispiel mag in Dir den Wunsch nach einer präzisen Definition für den Wert einer unendichen Reihe wecken. Versuchen wir es so: Wir betrachten die sogenannten Partialsummen
88
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
einer unendlichen Reihe
∞
X
an
n=0
Das sind die Summen
s0 := a0 ,
s1 := a0 + a1 ,
s2 := a0 + a1 + a2 ,
...,
sk :=
k
X
an ,
...
n=0
P
Und den Wert der Reihe ∞
n=0 an definiert man als ‘Grenzwert’ dieser Folge der Partialsummen,
so es denn einen gibt. Grenzwerte von Folgen definieren wir später.
P
n
Partialsummen der Reihe ∞
n=0 (−1) sind
1, 0, 1, 0, 1, 0, . . .
Diese bilden eine Folge, die keinen Grenzwert hat. Z.B. liegt nur die Hälfte der Folgenglieder
beliebig nahe bei 0.
Diese Beispiel lehrt uns, dass die Assoziativität bei unendlichen Summen nicht allgemein
richtig ist!
3.2
Grenzwerte und reelle Zahlen
3.2.1 Du kennst den Körper Q der rationalen Zahlen und weißt auch, wie man seine Elemente
als Punkte auf der Zahlengerade auffassen kann – nachdem man die Punkte 0 und 1 festgelegt
hat. Der Körper Q besitzt außer seiner arithmetischen (oder algebraischen) Struktur, d.h. den
Rechenarten, noch eine Anordnungsstruktur. Diese wird durch die Relation ‘≤’ gegeben. Wenn
man, wie üblich die Zahlengerade waagerecht zeichnet und dabei den Punkt 1 rechts von der 0
legt, so bedeutet a ≤ b, dass der Punkt a links von b liegt oder mit ihm übereinstimmt.
Haben zwei Brüche den gleichen positiven Nenner n, so gilt natürlich
m1
m2
≤
⇐⇒ m1 ≤ m2 .
n
n
m1 m2
Im Allgemeinen macht man durch Erweitern der Brüche
,
die Nenner gleich und hat
n1 n1
m1 n2
m2 n1
dann die Brüche
und
zu vergleichen. Es ergibt sich die Regel: Sind n1 , n2 > 0 so
n1 n2
n1 n2
ist
m1
m2
≤
⇐⇒ m1 n2 ≤ m2 n1
n1
n2
Die Relation ‘≤’ hat folgende Eigenschaften:
a ≤ a (Reflexivität)
a ≤ b, b ≤ c ⇒ a ≤ c (Transitivität)
3.2. GRENZWERTE UND REELLE ZAHLEN
89
a ≤ b, b ≤ a ⇒ a = b (Antisymmetrie)
für je zwei Zahlen a, b gilt a ≤ b oder b ≤ a (Totalität)
a≤b⇒a+c≤b+c
0 ≤ c, a ≤ b ⇒ ac ≤ bc (Monotonie der Addition und der Multiplikation)
Definition 3.2.2 Ein angeordneter Körper, ist ein Körper mit einer Relation ‘≤’, derart,
dass obige Eigenschaften erfüllt sind. Die Elemente a ∈ K, die ≥ 0 sind, nennt man nichtnegativ. Die von 0 verschiedenen nichtnegativen Elemente von K heißen positiv.
Welche Elemente würdest Du nichtpositiv, bzw. negativ nennen?
(Ich muss gestehen, dass die Wörter nichtnegativ“ und nichtpositiv“ nicht nicht die größte
”
”
sprachliche Eleganz ausstrahlen; sie sind aber üblich.)
Die Relation ‘<’ ist durch ‘a b dann
bedeuten sollen, ist Dir sicher klar.
Bemerkungen 3.2.3 Sei K ein angeordneter Körper. Die folgenden Regeln gelten in K.
a) Die Monotonieregel der Addition lässt sich auch folgendermaßen ausdrücken:
a<b⇒a+c<b+c
Denn wenn a ≤ b und a 6= b gilt, ist a + c ≤ b + c und a + c 6= b + c, nicht wahr?
b) Aus 0 ≤ a, 0 ≤ b folgt 0 ≤ a + b und 0 ≤ ab.
c) Gilt a ≤ b, so folgt a + (−a − b) ≤ b + (−a − b) also −b ≤ −a. Insbesondere gelten:
a ≤ 0 ⇐⇒ −a ≥ 0; sowie a ≥ 0 ⇐⇒ −a ≤ 0.
d) a2 ≥ 0 gilt für jedes a ∈ K. Ist nämlich a ≥ 0, so folgt a2 ≥ a · 0 = 0. Ist hingegen a ≤ 0, so
ist −a ≥ 0, also a2 = (−a)2 ≥ 0.
Insbesondere ist 1 = 12 ≥ 0. Da aber 1 6= 0, folgt 1 > 0.
e) Ist a > 0, so ist auch a−1 > 0. Wäre nämlich a−1 < 0, so wäre −a−1 > 0, also −1 =
−(aa−1 ) = a(−a−1 ) > 0, im Widerspruch zu c) und d).
Entsprechend kannst Du a < 0 =⇒ a−1 < 0 beweisen.
f) Aus 0 < a ≤ b folgt a−1 ≥ b−1 . Dies ergibt sich, wenn man die Ungleichung a ≤ b mit dem
positiven Element a−1 b−1 multipliziert.
Entsprechend folgt aus a ≤ b < 0, dass a−1 ≥ b−1 ist.
Sind also a, b beide positiv, oder beide negativ, so kehren sich durch das multiplikative Invertieren die Größenverhältnisse um. Ist allerdings a < 0 < b, so ist auch a−1 < 0 < b−1 .
g) Es ist a ≤ b ⇐⇒ 0 ≤ b − a. Deshalb kennt man eine Anordnung eines Körpers bereits
dann, wenn man weiß, welche Elemente nichtnegativ (oder auch positiv) sind.
Satz 3.2.4 Der Körper Q besitzt außer der uns bereits bekannten Anordnungen keine weiteren.
90
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Beweis: Wir wissen, dass auf jeden Fall 1 positiv ist. Dann sind aber auch 1 + 1, 1 + 1 + 1,
und so weiter positiv. Jede natürliche Zahl ist somit ≥ 0. Ist n 6= 0 eine natürliche Zahl, so ist
m
auch n−1 positiv, dann ist aber auch jeder Bruch
= m · n−1 (in dem natürlich n 6= 0 ist) von
n
natürlichen Zahlen nichtnegativ, also genau diejenigen Elemente, die auch bei der bekannten
Anordnung von Q nichtnegativ sind.
3.2.5 Sei K weiterhin ein angeordneter Körper. Dann ist in ihm 1 > 0, folglich sind alle
endlichen Summen (aber nicht die leere Summe) von 1 mit sich selbst positiv. Daraus folgt,
dass eine Gleichung zwischen solchen Summen a := 1 + 1 + · · · + 1 = b := 1 + 1 + · · · + 1 nur
dann gelten kann, wenn auf beiden Seiten gleichviele Summanden stehen. (Beachte, dass diese
Aussage in einem endlichen Körper falsch ist!) Denn wenn etwa rechts mehr Summanden als
links stünden, gäbe es eine nichtleere Summe c von 1 mit sich selbst, so dass b = a + c und
b = a wäre.
Dies bedeutet, dass man die Menge N mit Menge der 1-Summen (einschließlich der leeren
Summe, die als 0 verstanden wird) eines beliebigen angeordneten Körpers identifizieren kann,
und zwar so, dass Addition, Multiplikation und die Relation ‘≤’ dabei nicht verändert werden.
Dann kann man auch Z mit der Menge der Elemente aus K, die 1-Summen oder deren additiv
Inverse sind, identifizieren, so dass die Rechenoperationen und die Ordnungsrelation dabei
berücksichtigt wird. Da K ein Körper ist, kann man jeden Bruch m
mit dem Körperelement
n
−1
mn identifizieren.
Man darf also annehmen, dass Q als Teilkörper in einem jeden angeordneten Körpern liegt.
Zur axiomatischen Definition der reellen Zahlen benötigen wir unter anderem ein Axiom, das
für den Körper Q erfüllt ist:
Definition 3.2.6 Ein archimedisch angordneter Körper K ist ein angeordneter Körper,
derart dass zu Elementen a, b ∈ K mit a, b > 0 ein n ∈ N mit na ≥ b existiert. (Nach Annahme
liegt ja Q, also auch N in dem Körper. Man kann allerdings auch ohne diese Annahme na
definieren, nämlich als n-fache Summe von a zu sich selbst.)
Bemerkung 3.2.7 Q ist ein archimedisch angeordneter Körper. Sind nämlich m1 , m2 , n1 , n3
natürliche Zahlen 6= 0, so ist offenbar
(m2 n1 )
m1
m2
≥
n1
n2
Satz 3.2.8 Sei K ein angeordneter Körper. Folgende Aussagen sind äquivalent:
(i) K ist archimedisch angeordnet.
(ii) Jedes positive a ∈ K liegt zwischen zwei positiven rationalen Zahlen.
Beweis: Sei K archimedisch angeordnet, so gibt es eine natürliche Zahl n mit n · 1 ≥ a. Also
ist a ≤ n mit der rationalen (sogar natürlichen) Zahl n.
3.2. GRENZWERTE UND REELLE ZAHLEN
Ferner gibt es eine natürliche Zahl n0 mit
1
a
≤ n0 , also a ≥
91
1
.
n0
Umgekehrt erfülle ein angeordneter Körper K obige Aussage und seien a, b ∈ K positiv. Dann
gibt es natürliche Zahlen m1 , n1 , m2 , n2 mit
a≥
m1
m2
und b ≤
, also m2 n1 a ≥ b .
n1
n2
3.2.9 Die ganzen Zahlen liegen auf der Zahlengerade voneinander isoliert. Anders die rationalen Zahlen. Zwischen ihnen siehst Du auf den ersten Blick keine Lücken. Zwischen je zwei
verschiedenen rationalen Zahlen liegen noch unendlich viele weitere. Man könnte vermuten,
die rationalen Zahlen füllten die Zahlengerade aus!?
ABER
betrachte die Funktion x2 − 5 auf dem Bereich der rationalen Zahlen ≥ 0. Wenn Du sie, d.h.
ihren Graph zeichnest, erhältst Du eine schöne Kurve, welche die x-Achse zwischen 2 und 3
zu schneiden scheint.
Gibt es eine rationale Zahl x, für die x2 − 5 = 0 ist? Du weißt, dass die Antwort ‘nein’ lautet.
Der Schnittpunkt der Kurve mit der x-Achse ist also kein rationaler Punkt.
Und das
nicht die einzige Ausnahme. Wir wissen z.B. auch, dass die unendliche
P ist natürlich
1
Reihe ∞
im
Bereich
der rationalen Zahlen keinen (Grenz-)Wert hat, obwohl die Folge
n=0 n!
ihrer Partialsummen monoton wächst und nach oben beschränkt ist. Und so weiter, und so
fort.
Gewisse Lücken scheinen irgendwie doch zwischen den rationalen Zahlen zu existieren, mögen
sie auch ‘unendlich kleine Lücken’ sein.
Später wirst Du sogar zu der etwas paradoxen Erkenntnis kommen, dass es in einem gewissen
Sinne mehr Lücken zwischen den rationalen Zahlen als rationale Zahlen gibt.
Ganz offenbar hat der Körper Q der rationalen Zahlen seine Defizite. Ich will einen größeren
angeordneten Körper R, den Körper der reellen Zahlen axiomatisch einführen und später
auch ein wenig dazu sagen, wie man ihn konstruieren kann.
Einfach, aber höchst nützlich ist der Begriff des Absolutbetrags. Sei K ein angeordneter
Körper. Der Abstand zweier seiner Elemente a und b ist a − b oder b − a je nachdem, welche
Differenz nicht negativ ist. Mit Hilfe des sogenannten Absolutbetrages kann man den Abstand
einfach in der Form |a − b| schreiben.
Definition 3.2.10 Sei a ein Element eines geordneten Körpers, so definieren wir den Absolutbetrag (kurz Betrag) |a| von a als die größere der beiden Zahlen a, −a. (Für a = 0 meine
ich damit natürlich |0| = 0.)
92
Eigenschaften: |a| ≥ 0.
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
|a| = 0 ⇐⇒ a = 0,
|a + b| ≤ |a| + |b|.
|ab| = |a| · |b|.
Sei ε > 0, dann bedeutet |a − b| < ε dasselbe wie a − ε < b < a + ε (und natürlich auch dasselbe
wie b − ε < a < b + ε).
3.2.11 Ich will im Folgenden klären, was man unter einem Grenzwert einer (unendlichen)
Folge (an ) = (an )n = (an )n∈N = (a0 , a1 , a2 , . . .) verstehen soll.
1
Vielleicht hast Du ja schon ein gewisses Gefühl dafür, dass etwa die Folge ( n+1
) den Grenzwert
n
0 bzw. die Folge n+1
den Grenzwert 1 hat.
Man muss sich fragen, ob notwendiger Weise der Begriff Grenzwert“ ein vager Begriff ist,
”
ob man etwa von jedem Mathematiker verlangen muss, dass ihm intuitiv klar ist, dass die
genannten Folgen die genannten Grenzwerte haben – oder ob man dies präzise fassen kann.
Nun, die folgende Definition ist präzise; aber Du musst Dir schon ordentlich Mühe geben, sie
zu verstehen.
Definitionen 3.2.12 Sei (an )n∈N eine Folge in einem angeordneten Körper K und a ein Element dessselben.
a) Man sagt: Die Folge (an )n∈N habe den Grenzwert oder Limes a, oder auch konvergiert
gegen a, wenn es zu jedem (noch so kleinen) Element ε > 0 von K ein N ∈ N gibt, so dass
|an − a| < ε für alle n ≥ N gilt. Mit lim an oder limn→∞ an wird der Limes bezeichnet, wenn
n→∞
es ihn gibt.
b) Die Folge heißt – unspezifiziert – konvergent, oder man sagt, sie konvergiert, wenn es
ein a ∈ K gibt, gegen welches sie konvergiert.
c) Eine Folge heißt divergent, wenn sie nicht konvergent ist.
Beachte: Eine Folge, die in einem vernünftigen Sinn den Grenzwert ∞ oder auch −∞ hat,
nennen wir nicht konvergent, sondern divergent!
Um o.a. Definition a) etwas anders zu formulieren, definieren wir zunächst den Begriff
ε-Umgebung einer Zahl a.
Definition 3.2.13 Sei ε > 0 ein Element eines angeordneter Körpers K. Die ε-Umgebung von
a besteht aus den Elementen b ∈ K mit |b − a| < ε.
Obige Definition des Grenzwertes besagt dann:
limn→∞ an = a bedeutet: Jede ε-Umgebung (mit ε > 0) von a (und sei ε noch so klein) enthält,
bis auf endlich viele n, alle an .
Bemerkung 3.2.14 Wenn eine Folge in einem angeordneten Körper überhaupt einen Grenzwert hat, so hat sie nur einen einzigen.
Denn wären etwa verschiedene a, a0 Grenzwerte einer Folge (an )n , so wäre ε := |a − a0 |/2 > 0.
Aber die ε-Umgebungen von a und a0 haben kein Element gemeinsam. Es ist also nicht möglich,
dass sowohl in der ε-Umgebung von a als auch in der von a0 alle an bis auf endlich viele n liegen.
3.2. GRENZWERTE UND REELLE ZAHLEN
93
Beispiele 3.2.15 Jetzt wollen wir uns Beispiele für Konvergenz, aber auch für Nichtkonvergenz
überlegen und beschränken uns dabei auf archimedisch angeordnete Körper!
a) Die Folge (1/n), n ≥ 1, also die Folge (1, 12 , 13 , . . .) konvergiert in einem archimedisch angeordneten Körper gegen 0, ebenso die Folge (2−n ), n ≥ 0, d.h. die Folge (1, 12 , 14 , 18 , . . .).
Sei nämlich ε ≥ k/m mit ganzen k, m > 0. Dann ist
für alle n ≥ N .
1
m
≤ ε. Ist nun N = m+1, so ist
1
n
<
1
m
≤ε
Jedes Glied der Folge (2−n )n ist auch ein Glied der Folge ( n1 )n≥1 . Die Folge (2−n )n ist eine
sogenannte Teilfolge der Folge (n−1 ). (Es ist sogar 2−n ≤ n−1 .) Deshalb trifft die Definition
der Konvergenz gegen 0 auch auf sie zu.
b) Die Folge ((−2)−n ), n ≥ 0, also die Folge (+1, − 21 , + 14 , − 18 , . . .) konvergiert ebenfalls gegen
0. Es kommt ja nur auf den Abstand der Folgenglieder zu 0 an. Allgemeiner gilt: Wann immer
eine Folge (an )n gegen 0 konvergiert, so gilt dies auch für die Folge ((−1)n an )n . Allgemeiner
gilt: lim an = lim |an |; und wenn einer der Limites existiert, dann auh der andere.
c) Sei in einem archimedisch angeordneten Körper |q| < 1. Dann gilt limn→∞ q n = 0.
Sei nämlich ε > 0 und setze |q|−1 = 1 + a mit a > 0. Dann ist nach der Bernoullischen
Ungleichung |q|n ≥ 1 + na. Wegen der Archimedizität gibt es dann ein N , derart dass na > ε−1
für alle n ≥ N gilt. Für diese n ist dann auch |q|−n > ε−1 , also |q|n < ε.
d) Betrachte die Folge ((−1)n + 2−n ), n ∈ N. Sie nähert sich sozusagen den Zahlen −1 und 1.
(Genauer nähert sich die ‘Hälfte’ der Folgenglieder der 1, die andere ‘Hälfte’ der −1.) Diese sind
keine Grenzwerte im Sinne obiger Definition, sondern sogenannte Häufungspunkte. Obwohl
der Begriff ‘Häufungspunkt’ nicht unwichtig ist, will ich in diesem Buch auf seine Definition
verzichten.
n
f) Die Folge (n(−1) ), n ≥ 1 verhält sich nicht viel anders. Sie hat außer dem ‘Häufungspunkt’
0 noch den ‘uneigentlichen Häufungspunkt’ ∞. Auch diese Reihe ist nicht konvergent, d.h. hat
keinen Grenzwert.
g) Betrachte die Folge (an )n∈N , wo an folgendermaßen definiert sei:
an :=
(n + 2)−1 für gerade
n
−1
n
für ungerade n
d.h. die Folge ( 21 , 1, 14 , 13 , 16 , 15 , . . .). Diese Folge nähert sich der 0 wie die Echternacher Springprozession. D.h. in jedem 2. Schritt weicht sie wieder etwas zurück. Trotzdem konvergiert sie gegen
0 im Sinne unserer Definition. (Beweis?) Nach meiner Meinung wäre es auch sehr engherzig,
wollte man eine solche Folge nicht als eine Folge mit dem Grenzwert 0 ansehen.
h) Die Folge (1+ n1 ) hat zwar die Eigenschaft, dass ihre Glieder immer kleiner werden, trotzdem
geht sie nicht gegen 0, sondern gegen 1,
i) Schließlich hat eine ‘konstante’ Folge, in der alle Glieder gleich ein und demselben Element
a sind, also eine Folge der Form (a, a, a, . . .) den Grenzwert a.
94
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Frage: Ist folgende Aussage äquivalent dazu, dass eine Folge (an ) den Grenzwert 0 hat?
Vom Vorzeichen abgesehen ist jedes Folgenglied kleiner als das vorangehende.“
”
Ja
Nein
Beachte die Beispiele g) und h)! Diesen Vorschlag, Konvergenz (gegen 0) so zu definieren habe
ich tatsächlich irgendwo gelesen.
3.2.16 Körper der reellen Zahlen. Der Körper der reellen Zahlen hat vor dem Körper
der rationalen Zahlen den Vorzug, dass in ihm die Folgen, ‘die eigentlich konvergieren sollten’,
auch wirklich konvergieren.
Die Folgen, ‘die eigentlich konvergieren sollten’, sind die sogenannten ‘Cauchy-Folgen’. Während
die Glieder einer konvergenten Folge ‘schließlich beliebig nahe bei ihrem Limes’ liegen, liegen
die Glieder einer Cauchy-Folge ‘schließlich beliebig nahe beieinander’. Genauer
Definition 3.2.17 Eine Folge (an )n∈N heißt eine Cauchy-Folge, wenn es zu jedem ε > 0 ein
N ∈ N gibt, so dass |an − am | < ε für alle n, m ≥ N gilt.
Wie Du weiter unten sehen wirst, ist jede konvergente Folge in einem (archimedisch) angeordneten Körper eine Cauchy-Folge.
Beispiele 3.2.18 a) Die unendliche Reihe
P∞
1
n=0 n!
hat die Partialsummen
k
X 1
1
1
1
1
1
1
= 1, s1 = + = 2, s2 = + + = 2,5 , . . . , sk =
, ...
s0 =
0!
0! 1!
0! 1! 2!
n!
n=0
Man erhält für 1 ≤ k < l leicht die Abschätzung (Ungleichung) (vgl. Abschnitt 3.1, Beispiel 2
b))
1
1
1
1
1
sl − sk =
+ ··· + ≤
+ ··· +
<
(k + 1)!
l!
(k + 1)(k + 2)
(n − 1)n
k+1
P∞ 1
Mithin ist die Reihe n=0 n! , aufgefasst als Folge ihrer Partialsummen, eine Cauchy-Folge.
b) Die harmonische
als Folge ihrer Partialsummen aufgefasst, ist keine
Cauchy-Folge.
P∞
P∞ Reihe,
1
Zeige dazu: Da n=1 n schließlich jede Schranke überschreitet, so muss auch n=k n1 , wo man
die ersten k − 1 Glieder weggelassen hat, dies tun.
c) Die Folgen (an ) mit an = n, bzw. an = (−1)n sind keine Cauchy-Folgen.
d) Sei m,α1 α2 α3 . . . ein unendlicher Dezimalbruch mit m ∈ N, αi ∈ {0, 1, . . . , 9}. (Hier sind mit
m die ‘Vorkommazahl’ und mit α1 , α2 , α3 , . . . die Stellen nach dem Komma bezeichnet worden.)
Wir interpretieren ihn als Folge der abbrechenden Dezimalbrüche a0 = m, a1 = m,α1 , a2 =
m,α1 α2 , . . .. Sei k ≤ n. Dann ist an − ak ≤ 10−k . also die genannte Folge eine Cauchy-Folge.
e) Ist (an )n∈N eine in Q konvergente Folge rationaler Zahlen, so ist sie eine Cauchy-Folge. Sei
nämlich a ihr Limes und ε > 0 rational. Dann gibt es ein N ∈ N mit |an − a| < ε/2 für alle
n > N . Für m, n > N gilt dann |an − am | = |an − a + a − am | ≤ |an − a| + |a − am | < ε/2 + ε/2.
3.2. GRENZWERTE UND REELLE ZAHLEN
95
3.2.19 Man kann nun den Körper der reellen Zahlen axiomatisch einführen, d.h. als archimedisch angeordneten Körper definieren, in dem jede Cauchy-Folge konvergiert.
Man kann nachweisen, dass es ‘im Wesentlichen’ nur einen solchen Körper gibt. D.h., sind
R, R0 zwei solche Körper, so gibt es eine Beziehung a ↔ a0 zwischen den Elementen a ∈ R und
a0 ∈ R0 , so dass diese Beziehung jedem a ∈ R genau ein a0 ∈ R0 zuordnet und umgekehrt, und
dass a + b ↔ a0 + b0 , ab ↔ a0 b0 , sowie a ≤ b ⇐⇒ a0 ≤ b0 aus a ↔ a0 , b ↔ b0 folgt.
3.2.20 Nun ist es aber keineswegs klar, dass es so einen Körper der reellen Zahlen wirklich
gibt.
Ein anschauliches Argument wäre, dass sich eine Cauchy-Folge auf der Zahlengeraden ja ‘augenscheinlich zu einem Punkt zusammenzieht’.
Möglicherweise wirst Du ein solches ‘anschauliches’ Argument doch mit sehr skeptischen Augen
betrachten.
Es gibt mehrere Möglichkeiten, den Körper der reellen Zahlen zu konstruieren. Eine möchte ich
hier vorstellen.
Sie besitzt eine gewisse Analogie zur Konstruktion der rationalen Zahlen. Da man eine ganze
Zahl nur selten durch eine andere ganze Zahl im Bereich der ganzen Zahlen dividieren kann,
m
, d.h als das
drückt man das virtuelle Ergebnis der Division von m durch n einfach als
n
0
m
m
und 0 als zueinander gleich betrachten,
Zahlenpaar (m, n) aus. Dabei muss man allerdings
n
n
wenn die virtuellen Divisionsergebnisse m : n und m0 : n0 sinnvollerweise als gleich anzusehen
sind, d.h. wenn sie als ‘Verhältnisse’ gleich sind, d.h. wenn mn0 = m0 n ist.
So kann man auch bei der Konstruktion von R vorgehen. Cauchy-Folgen rationaler Zahlen
konvergieren nur selten im Bereich der rationalen Zahlen. Deshalb wird man die reellen Zahlen
einfach als Cauchy-Folgen rationaler Zahlen ansehen. Dabei stellen zwei Cauchy-Folgen (an )n∈N
und (bn )n∈N rationaler Zahlen genau dann dieselbe reelle Zahl dar, wenn diese beiden Folgen
gegen denselben virtuellen Grenzwert konvergieren, d.h. wenn die Folge der Differenzen (an −
bn )n∈N eine Nullfolge ist, d.h. gegen 0 konvergiert.
3.2.21 Dann ist natürlich noch eine Menge zu tun. Um die Addition zu definieren, musst Du
etwa zeigen: Wenn (an ) und (a0n ) sich nur um eine Nullfolge unterscheiden, so tun dies auch
(an + bn ) und (a0n + bn ). Entsprechendes ist für die Multiplikation zu tun, und da auch etwas
schwieriger. Ist (an ) eine Cauchy-, aber keine Nullfolge, so muss man zeigen, dass an = 0 nur
für endlich viele n gilt, damit man ein multiplikativ Inverses bilden kann. Die Anordnung auf
R ist zu definieren. Und schließlich muss man zeigen, dass R archimedisch angeordnet ist und
dass reelle Cauchy-Folgen konvergieren.
3.2.22 Die Dir vertrauteste Darstellung der reellen Zahlen ist vermutlich die durch (unendliche) Dezimalbrüche. Ein Dezimalbruch kann als Cauchy-Folge aufgefasst werden, siehe Beispiel
3.2.18 d). Umgekehrt kann man jede reelle Zahl als Dezimalbruch schreiben. Vgl. [Forster].
96
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Reelle Zahlen als Dezimalbrüche zu schreiben, hat den Vorteil dass eine reelle Zahl meist auf
nur eine Weise als Dezimalbruch geschrieben werden kann. (Beachte jedoch, dass z.B. 1,3 =
1,29 = 1,299999 . . . ist.) Vor allem aber sind sie wohlvertraut.
Das Rechnen mit unendlichen Dezimalbrüchen hat allerdings so seine Tücken. Aber das Rechnen
mit abbrechenden Dezimalbrüchen, welche die allgemeinen Dezimalbrüche approximieren, ist
unproblematisch.
3.2.23 Wie willst Du also mit reellen Zahlen umgehen? Hier mein Vorschlag: Anschaulich fasse
sie als die Punkte auf der Zahlengeraden auf. Rechne mit ihnen approximativ mit abbrechenden
Dezimalbrüchen. Für theoretische Überlegungen verwende ihre o.a. axiomatische Beschreibung:
R ist ein archimedisch angeordneter Körper, in dem jede Cauchy-Folge konvergiert.
3.2.24 Man kann den Körper R auf mehrere andere Weisen kennzeichnen. Z.B.
(i) R ist ein archimedisch angeordneter Körper, in dem jede monoton wachsende Folge, die nach
oben beschränkt ist, konvergiert.
(ii) R ist ein archimedisch angeordneter Körper, in dem es zu jeder nichtleeren nach oben
beschränkten Menge M ein sogenanntes Supremum (s.u.) gibt.
(Übrigens kann man in beiden Definitionen das Wort ‘archimedisch’ weglassen. Die Archimedizität ist eine Folge der jeweils angegebenen anderen Eigenschaft.)
Definitionen 3.2.25 a) Ein Supremum einer Menge reeller Zahlen ist eine reelle Zahl s mit
x ≤ s für alle x ∈ M derart, dass in M eine Folge (an ) mit limn→∞ an = s existiert. b) Sei M
eine Menge reeller Zahlen. Ein Infimum von M ist eine reelle Zahl s, derart, dass s ≤ x für
alle x ∈ M gilt und in M eine Folge (xn )n∈N mit limn→∞ xn = s existiert.
3.2.26 Seien (an )n und (bn )n konvergente Folgen. Was gilt dann für die Folgen
(an + bn )n , (an bn )n und (an /bn )n ? Es ist so, wie man es sich besser nicht denken kann.
Satz 3.2.27 Seien die Folgen (an )n , (bn )n konvergent mit den Grenzwerten a, bzw. b. Dann
gilt:
a) Auch die Folge (an + bn )n konvergiert und es ist limn→∞ (an + bn ) = a + b.
b) Auch die Folge (an bn )n konvergiert und es ist limn→∞ an bn = ab.
c) Ist b = limn→∞ bn 6= 0, dann kann bn = 0 nur für endlich viele n gelten. Ferner ist
limn→∞ (an /bn ) = a/b, wenn in der Folge der (an /bn ) die endlich vielen Glieder, wo bn = 0
ist, weggelassen sind.
Beweis: a) ist fast trivial, wenn man |an + bn − (a + b)| ≤ |an − a| + |bn − b| (Dreiecksungleichung!) beachtet. Man will ja zeigen, dass es zu gegebenem ε > 0 ein N gibt so dass
|an + bn − (a + b)| < ε für n ≥ N gilt. Man darf voraussetzen, dass es zu ε/2 (!) ein N 0 gibt
3.2. GRENZWERTE UND REELLE ZAHLEN
97
mit |an − a| < ε/2 für n ≥ N 0 und es ebenso ein N 00 gibt mit |bn − b| < ε/2 für n ≥ N 00 . Das
gesuchte N ist dann die größere der Zahlen N 0 , N 00 (d.h. N = Max{N 0 , N 00 }.) (Wenn N 0 = N 00
sein sollte, ist natürlich N = N 0 = N 00 gemeint.)
b) Für die zweite Behauptung benötigt man, dass eine konvergente Folge beschränkt ist, d.h.
ganz zwischen festen Schranken bleibt: Es gibt ein c mit |an | ≤ c für alle n. (Warum ist das
so?) Somit ist |an bn − ab| = |an bn − an b + an b − ab| ≤ |an ||bn − b| + |an − a||b|, wo letzterer
Ausdruck beliebig klein für große n wird, da |an | ≤ c ist. Ein hübscher kleiner Trick!
an
1
1
c) Da
= an · , genügt es die Folge
zu betrachten, um dann b) anzuwenden. Setze
bn
bn
bn n
c := |b|/2. Da bis auf endlich viele n alle bn in dem Intervall ]b − c, b + c[ liegen, kann bn ≤ c
nur für endlich viele n gelten. (Du darfst ja ε = c verlangen.) Wenn wir die Folgenglieder mit
|bn | ≤ c weglassen, konvergiert der Rest der Folge immer noch gegen b. Für die restlichen n gilt
dann
1
− 1 = |b − bn | < |b − bn |
bn
b
|bbn |
|bc|
Sei jetzt ε > 0 beliebig. Ist nun N so groß, dass |bn − b| < ε|bc| für alle n > N gilt, so ist
1
1
− <ε.
bn
b
3.2.28 Anwendung: Wir betrachten die unendliche geometrische Reihe
∞
X
qn = 1 + q + q2 + q3 + · · ·
n=0
Wir wissen bereits, dass für endliche geometrische Reihen mit q 6= 1 folgendes gilt:
k
X
qn = 1 + q + q2 + q3 + · · · + qk =
n=0
1 − q k+1
.
1−q
Die unendliche geometrische Reihe konvergiert also genau dann, wenn die Folge
konvergiert.
1 − q k+1
1−q
k∈N
Nun ist limk→∞ q k = 0 (also auch limk→∞ q k+1 = 0, nicht wahr?), wenn |q| < 1 ist. Nach obigem
Satz folgt
∞
X
1
qn =
für |q| < 1.
1
−
q
n=0
Für |q| ≥ 1 erkennt man leicht, dass die Reihe divergiert.
Das Konvergenzverhalten der geometrischen Reihe findet häufige Anwendung.
98
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
P
(−1)n+1
konver3.2.29 Absolute Konvergenz. Die alternierende harmonische Reihe ∞
n=1
n
giert bekanntlich. Aber, wenn man in ihr jedes Glied durch seinen Absolutbetrag ersetzt, erhält
man die divergente harmonische Reihe.
Definition
3.2.30 Eine unendliche Reihe
P∞
he k=0 |ak | konvergiert.
P∞
k=0
ak heißt absolut konvergent, wenn die Rei-
Satz 3.2.31 Im Bereich der reellen Zahle ist jede absolut konvergente Reihe auch konvergent.
Beweis:
P Wir zeigen mit Hilfe der Dreiecksungleichung, dass die zu
Pneiner absolut konvergenten
Pn
Reihe ∞
a
gehörende
Folge
eine
Cauchy-Folge
ist.
Setze
s
:=
n
k=0 k
k=0 ak und tn :=
k=0 |ak |.
Wir haben zu zeigen, dass zu jedem ε > 0 ein N ∈ N existiert, für das |sm − sn | < ε gilt, falls
m, n ≥ N ist. Wir haben
|sm − sn | = |
m
X
k=n+1
ak | ≤
∞
X
|ak | = |tm − tn |
k=n+1
Da nach Voraussetzung die Folge der tn konvergiert, gibt es ein N ∈ N mit |tm − tn | < ε falls
m, n ≥ N ist. Unter derselben Voraussetzung ist auch |sm − sn | < ε.
Die
ist, wie oben gesehen, falsch. Man kann auch den Wert von
P∞ Umkehrung diesesPSatzes
∞
|a
|
a
aus
dem
von
k nicht durch eine allgemeine Methode berechnen.
k=0
k=0 k
Kapitel 4
Vom primitiven Urgrund moderner
Mathematik
4.1
Mengen
Die in diesem Kapitel angesprochenen Begriffe sind zwar schrecklich abstrakt, aber im Grunde
einfach zu verstehen. Versuche zu erkennen, wie simpel, ja geradezu primitiv diese Dinge sind.
Die Mengensprache ist eine einfache, aber wichtige und grundlegende Sprache der modernen
Mathematik.
Solltest Du einst Mathematik, Physik oder Informatik studieren, wirst Du mit Mengen und
Abbildungen täglich umgehen müssen.
Achtung: So einfach die folgenden Dinge sind, so pedantisch musst Du sie und ihre Bezeichnungen allerdings behandeln. Zum Beispiel bezeichnet {0, 2} die Menge der beiden Zahlen 0
und 2, während mit [0, 2] die Menge aller (unendlich vielen) reellen Zahlen zwischen 0 und 2
einschließlich 0 und 2 bezeichnet wird. S.u.
4.1.1 Eine Menge M wird dadurch konstituiert, dass man auf widerspruchsfreie Weise angibt,
welche Dinge zu ihr gehören sollen, d.h. für welche x das Symbol x ∈ M gelten soll, d.h. welche
Dinge Elemente der Menge sind.
Gilt dies für nur endlich viele Dinge, d.h ist die Menge M endlich, so kann man sie prinzipiell
durch Angabe aller ihrer Elemente beschreiben, die man gemeinhin in geschweifte Klammern
setzt, wobei es auf die Reihenfolge nicht ankommt, und auch nicht darauf, ob man (zufällig)
eines ihrer Elemente mehrfach angibt:
{3, 7, 2, 7, 1, 7} = {3, 7, 2, 3, 7, 1, 2} = {3, 7, 2, 1} = {1, 2, 3, 7}
Bezeichnung: Die Anzahl der Elemente einer endlichen Menge M wird mit #M bezeichnet.
Häufig findet man stattdessen auch die Bezeichnung |M |. Man nennt #M auch die Kardinalzahl von M .
99
100
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Unendliche Mengen, d.h. solche mit unendlich vielen Elementen, muss man anders beschreiben. Wir wollen z.B. die Mengen N, Z, Q, R als wohlbeschrieben ansehen und aus ihnen weitere
Mengen gewinnen, z.B. die Menge der geraden ganzen Zahlen, die man wie folgt (auf zweierlei
Art) schreiben kann:
{n n ∈ Z, 2|n} = {n ∈ Z 2|n}
Die zweite Bezeichnung ist nur eine Abkürzung der ersten. (Den ersten senkrechten Strich habe
ich hier so groß geschrieben, um ihn von
dem Strich zu unterscheiden, der angibt, dass 2 ein
Teiler von n ist.) Ebenso ist {n ∈ Z 2 - n} die Menge der ungeraden Zahlen. (Statt des
senkrechten Striches schreiben manche auch ;“ oder :“ .)
”
”
Wichtige Mengen reeller Zahlen sind die Intervalle. Seien a, b ∈ R mit a < b, so schreibt man:
[a, b] := {x ∈ R | a ≤ x ≤ b} , ]a, b[ := {x ∈ R | a < x < b} ,
]a, b] := {x ∈ R | a < x ≤ b} , [a, b[ := {x ∈ R | a ≤ x < b}
Also ist [a, b] die Menge aller reellen Zahlen zwischen a und b einschließlich a und b. Und
]a, b[ besteht aus allen reellen Zahlen zwischen a und b, wobei aber a und b ausgeschlossen
sind. Bei den Intervallen ]a, b] und [a, b[ ist jeweils ein Endpunkt eingeschlossen, der andere
ausgeschlossen.
Bei festem a, b unterscheiden sich je zwei von diesen Mengen in höchstens 2 Elementen. Frage:
Darf man sie deshalb miteinander verwechseln?
Ohne Probleme, denn es kann ja wohl nichts ausmachen, ob man einen oder beide ‘Endpunkte’ eines Intervalls zu diesem rechnet oder nicht. Man möge bitte bedenken, dass alle o.a.
Intervalle die gleiche Länge b − a haben. Außerdem kann man sie zeichnerisch (als Strecken auf
der Zahlengeraden) nicht wirklich voneinander unterscheiden.
Keinesfalls, denn das Intervall ]a, b[ hat z.B. in Bezug auf Konvergenz völlig andere Eigenschaften als das Intervall [a, b]. (Betrachte, für b > a + 1, z.B. die Folge (a + 1/n)n =
(a + 1, a + 1/2, a + 1/3, . . .).)
Neben den oben genannten beschränkten Intervallen betrachten wir auch unendliche große
Intervalle
[a, ∞[ := {x ∈ R | a ≤ x} , ]a, ∞[:= {x ∈ R | a < x}
] − ∞, b] := {x ∈ R | x ≤ b} , ] − ∞, b[:= {x ∈ R | x < b}
N.B. Es ist R+ = [0, ∞[ , R∗+ = ]0, ∞[. Alle solche Mengen bezeichnen wir als Intervalle.
(Beachte, dass wir nur Intervalle positiver oder unendlicher Länge betrachten, also weder [a, a] =
{a}, noch ]a, a[ als Intervall bezeichnen. Somit sind alle Intervalle unendliche Mengen! D.h. sie
haben unendlich viele Elemente.)
Beachte: Intervalle der Form [a, ∞] usw., die nicht ganz in R liegen, werden in diesem Buch
nicht betrachtet.
Man zieht auch die Menge in Betracht, die gar keine Elemente besitzt, die sogenannte leere
Menge, die mit ∅ bezeichnet wird. Z.B. ist {x ∈ R | a < x < a} = ∅.
4.1. MENGEN
101
Was meinst Du dazu?
Es ist wirklich formaler Quatsch, ∅ zu betrachten.
Man kann leicht Mengen M definieren, von denen es nicht von vorneherein klar ist, ob sie
leer sind. Es kann also ungewollt passieren, dass M = ∅ ist. Deshalb hat es nicht viel Sinn, ∅
von der Betrachtung auszuschließen.
4.1.2 Seien M, N Mengen. Man nennt M eine Teilmenge von N (und manchmal N eine
Obermenge von M ) und schreibt M ⊂ N oder N ⊃ M , wenn jedes Element von M auch ein
solches von N ist:
h
i
M ⊂ N ⇐⇒ x ∈ M =⇒ x ∈ N
h i
Die eckigen Klammern , sind hier logische Klammern! Die Aussage M ⊂ N kann man auch
so ausdrücken: Für alle x gilt [x ∈ M =⇒ x ∈ N ].
”
Dabei schließen wir die Gleichheit nicht aus. Es gilt mit dieser Definition also M ⊂ M . (Manche
benutzen deshalb statt ‘M ⊂ N ’ lieber die Bezeichnung ‘M ⊆ N ’.)
Zum Beispiel gelten
{1, 3, 7} ⊂ {1, 2, 3, 7} , {n ∈ Z 6|n} ⊂ {n ∈ Z
3|n} , [a, b[⊂ [a, b]
4.1.3 Der Durchschnitt M1 ∩ M2 zweier Mengen M1 und M2 ist die Menge aller Elemente,
die sowohl Elemente von M1 , als auch solche von M2 sind:
M1 ∩ M2 = {x | x ∈ M1 und x ∈ M2 }
Beispiele: {1, 7, 3, 8, 4, 9} ∩ {3, 7, 2, 7, 1, 7} = {1, 3, 7} ,
= {n ∈ Z 6|n} , ]0, 3[ ∩ Z = {1, 2}.
{n ∈ Z 2|n} ∩ {n ∈ Z 3|n}
Man beachte dass das Wort ‘Durchschnitt’ hier in einem ganz anderen Sinne gebraucht wird
als in dem Satz Der Durchschnitt der Schokoladenpreise in diesem Supermarkt ist 79 Cent“.
”
Der Durchschnitt von Mengen bedeutet nicht ein arithmetisches Mittel.
Die Vereinigung M1 ∪ M2 zweier Mengen M1 und M2 ist die Menge aller derjenigen Elemente,
die in M1 oder M2 liegen, d.h. die ein Element mindestens einer der beiden Mengen sind.
M1 ∪ M2 := {x | x ∈ M1 oder x ∈ M2 }
Beispiele {1, 7, 3, 8, 4, 9} ∪ {3, 7, 2, 7, 1, 7} = {1, 2, 3, 4, 7, 8, 9}, [0, 2] ∪ [2, 3] = [0, 3],
[0, 3[ ∪ [2, 4[= [0, 4[, ] − ∞, 0[ ∪ ]0, ∞[= R∗ .
Man mag geneigt sein zu sagen, die Elemente von M1 ∪ M2 seien die Elemente von M1 und von
M2 . Du solltest Dir aber darüber im Klaren sein, dass bei dieser Sprechweise nicht gemeint ist:
M1 ∪ M2 besteht aus den Elementen x, für die x ∈ M1 und x ∈ M2 gilt. Letztere Menge wäre
gerade der Durchschnitt M1 ∩ M2 .
Man muss unterscheiden, ob das Wort ‘und’ Aussagen oder Gegenstände verbindet.
102
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
(Die ursprünglichen Bezeichnungen ‘Durchschnitt’ und ‘Vereinigung’ wurden später mit ‘intersection’
und ‘union’ ins Englische und Französische übersetzt. Es gibt keinen Grund, sie auch im Deutschen
so zu nennen.)
Offenbar gelten folgende Aussagen:
M 1 ⊂ M1 ∪ M 2 ,
M2 ⊂ M 1 ∪ M 2 ,
M1 ∩ M 2 ⊂ M 1 ,
M1 ∩ M 2 ⊂ M 2
Man kann auch den Durchschnitt und die Vereinigung von mehr als zwei Mengen bilden, ja
sogar von unendlich vielen Mengen.
Beispiele: a) 2Z ∩ 3Z ∩ 5Z = 30Z. Dabei habe ich mit mZ die Menge {mk | k ∈ Z} =
{n ∈ Z | es gibt ein k mit n = mk}, also die Menge der durch m teilbaren ganzen Zahlen
bezeichnet.
b) Die Menge 2Z ∪ 3Z ∪ 5Z, also die Menge der ganzen Zahlen, die durch 2 oder 3 oder 5 teilbar
sind, lässt sich nicht in der Form mZ schreiben.
c) Mit P bezeichne
\ ich die Menge der Primzahlen. Der unendliche Durchschnitt 2Z∩3Z∩5Z∩. . .,
pZ bezeichnet wird, besteht nur aus der 0, da jede von 0 verschiedene ganze
der auch mit
p∈P
Zahl durch nur endlich viele Primzahlen teilbar ist.
4.1.4 Man betrachtet auch die Mengendifferenz, auch Differenzmenge M −N (auch M \N
geschrieben):
M − N := {x ∈ M | x ∈
/ N } = {x | x ∈ M und x ∈
/ N}
Beispiele: a) {1, 3, 4, 7, 8, 9}−{1, 2, 3, 5, 7} = {4, 8, 9} oder Z−{n ∈ Z 2 - n} = {n ∈ Z 2|n}
oder R − {0} = R∗ .
[
pZ bezeichnet wird, ist die
b) Die unendliche Vereinigung 2Z ∪ 3Z ∪ 5Z ∪ . . ., die auch mit
p∈P
Mengendifferenz Z − {1, −1}.
Die – selten gebrauchte – symmetrische Differenz zweier Mengen M1 , M2 ist
(M1 ∪ M2 ) − (M1 ∩ M2 ) = (M1 − M2 ) ∪ (M2 − M1 ). Beweise diese Gleichheit.
4.1.5 Logische Symbole. Die Absätze 4.1.5 bis 4.1.8 musst Du nicht unbedingt lesen. Sie
bilden auch keine Einführung in die (formale) Logik. Sie fügen sich in etwa in den abstrakten
Rahmen der Mengenlehre ein und sollen Dir nützen, wenn sie in Deinem späteren Studium
gelegentlich von Dozenten oder Kommilitonen verwendet werden. Und solltest Du einmal eine
Vorlesung zur Logik besuchen, dann weißt Du schon ein wenig über die benutzten Symbole.
Zwei Aussagen A, B kann man logisch verknüpfen durch die Junktoren“ ‘und’ und ‘oder’.
”
Diese werden manchmal abgekürzt: ∧ heißt ‘und’, ∨ heißt ‘oder’. Dabei bedeutet ∨ kein
ausschließendes ‘oder’.
A ∨ B ist genau dann wahr, wenn mindestens eine der Aussagen A, B wahr ist.
A ∧ B ist genau dann wahr, wenn beide Aussagen wahr sind.
4.1. MENGEN
103
Obige Definitionen von Durchschnitt und Vereinigung schreiben sich mit diesen Symbolen so:
M ∪ N = {a | a ∈ M ∨ a ∈ N }, M ∩ N = {a | a ∈ M ∧ a ∈ N }
Beachte: (A ∧ B) ∨ C bedeutet etwas anderes als A ∧ (B ∨ C). Manche Unklarheiten in nicht
formalisierten Texten entstehen dadurch, dass man solcherlei nicht leicht unterschiedlich ausdrücken kann. In verbalen Sätzen haben die Klammern – so man sie überhaupt verwendet –
eine andere Bedeutung als in mathematischen und logischen Formeln.
Die beiden folgenden Ausdrücke sind äquivalent: (A ∧ B) ∨ C und (A ∨ C) ∧ (B ∨ C).
Selbiges gilt für A ∧ (B ∨ C) und (A ∧ B) ∨ (A ∧ C).
Für Mengen bedeutet dies:
L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) , L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ) .
D.h. es gelten bezüglich ∪ und ∩ Distributivitätsgesetze. Und zwar eines, wo sich der Durchschnitt wie das Produkt und die Vereingung wie die Summe in einem Ring verhält, und eines
wo es gerade umgekehrt ist. (In einem Ring, der nicht der Nullring ist, gilt neben dem bekannten Distributivgesetz kein solches, wo die Rollen von ’+’ und ’·’ vertauscht sind. Dann müsste
nämlich 1 + (1 · 0) = (1 + 1) · (1 + 0), also 1 = 1 + 1 sein. Aus der Existenz additiv Inverser
folgte dann ein Widerspruch. Für jede Menge M gilt hingegen M = M ∪ M = M ∩ M .)
Die Menge aller Teilmengen einer Menge M kann man als Rechenbereich mit den beiden Verknüpfungen ∩, ∪ betrachten. In diesem Rechenbereich gibt es neutrale Elemente, nämlich M bezüglich ∩ und
∅ bezüglich ∪. Inverse Elemente gibt es aber nicht, es sei denn, es ist M = ∅.
4.1.6 Ferner kann man die Aussage A verneinen durch ‘nicht A’ , das man auch ¬A schreibt.
Genau dann ist ¬A richtig, wenn A falsch ist.
In der sogenannten klassischen Logik, die ich in diesem Buch (wie die allermeisten Mathematiker) benutze, ist ¬(¬A) mit A äquivalent. Dabei geht man davon aus, dass eine – sinnvolle –
Aussage auch über unendlich viele Objekte entweder wahr oder falsch ist: Tertium non datur“,
”
d.h. ein drittes gibt es nicht“.
”
(In der sogenannten intuitionistischen Logik akzeptiert man das nicht unbedingt. Möglicherweise könnte sich ja weder die Wahrheit noch die Falschheit einer Aussage beweisen lassen.
Auch in der intuitionistischen Logik folgt ¬(¬A) aus A. Wenn man hingegen ¬(¬A), d.h. dass
A nicht falsch ist, voraussetzt, aber nicht davon ausgeht, dass A entweder falsch oder richtig
ist, wie wollte man dann erkennen, dass A richtig ist?)
(Im Sprachgebrauch wird manchmal die doppelte Verneinung zur Betonung einer Verneinung
benutzt. Das ist, wie gesagt ein Sprachgebrauch, der sich als solcher nicht vor der Logik rechtfertigen muss. Das heißt aber nicht, dass manchmal die Verneinung der Verneinung einer –
nichtleeren – Aussage dasselbe wie die Verneinung dieser Aussage bedeuten könnte.)
Die Aussage ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B).
Und ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B).
104
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Bemerkung: Die Aussage
(1) ‘A =⇒ B’ bedeutet (in der klassischen Logik) nichts anderes als
(2) ‘(¬A) ∨ B’.
Denn wenn B richtig ist, so sind beide Aussagen (1) und (2) richtig, unabhängig davon, ob
A richtig oder falsch ist. Ist aber B falsch und A richtig, so sind (1) und (2) beide falsch. Ist
hingegen B falsch und A falsch, so sind wieder (1) und (2) beide richtig. D.h. aber: In allen
Fällen, wo eine der beiden Aussagen (1) oder (2) richtig ist, ist es auch die andere.
Und A ⇐⇒ B bedeutet natürlich (A =⇒ B) ∧ (B =⇒ A).
4.1.7 Außer den Junktoren braucht man in der formalisierten Logik noch die sogenannten
Quantoren: für alle“ und es gibt“, welch letzteres nichts anderes bedeutet als für minde”
”
”
stens ein“. Man braucht dazu Aussagen über eine Variable“, etwa x. Man schreibt A(x), was
”
bedeuten soll: A gilt für x. Ein Beispiel ist die Aussage x ∈ R =⇒ 2x = x + x.
V
Die abkürzenden Bezeichnungen sind: x A(x) in der Bedeutung: für alle x gilt A“ (Allquan”
tor).
W
und: x A(x) in der Bedeutung: für (mindestens) ein x gilt A“ (Existenzquantor).
”
V
W
Mathematiker benutzen häufiger die Abkürzungen ∀ statt und ∃ statt . W
Vorsicht: ∀ bedeutet – trotz ähnlichen Aussehens – gerade nicht dasselbe wie !
Zwei Allquantoren darf man miteinander vertauschen; dasselbe gilt für zwei Existenzquantoren.
Frage: Darf man einen All- mit einem Existenzquantor vertauschen?.
Ja
Nein
Denke an die Definition der Konvergenz und in welcher Weise man sie nicht ändern darf!
In den natürlichen Sprachen werden Allquantoren häufig versteckt. Z.B. gilt folgender Satz:
Seien x, y (beliebige) reelle Zahlen. Dann gilt xy = yx.“ Damit ist gemeint:
”
^^
(x ∈ R ∧ y ∈ R) =⇒ xy = yx
x
y
Oder, wenn man sagt für eine reelle Zahl x gilt 2x = x + x“, so meint man meist: für alle
”
”
reellen Zahlen x gilt 2x = x + x“. Aus diesem Grunde empfiehlt es sich, den Existenzquantor
mit es gibt“ zu verbalisieren. Statt Für eine reelle Zahl x gilt xx = x2“ sollte man sagen es
”
”
”
gibt eine reelle Zahl x mit xx = x2“. (Dies ist eine richtige Aussage, nicht wahr??)
Beachte: Die Aussage Es gibt ein x, für das A(x) gilt“ schließt nicht aus, dass es mehrere
”
solche x gibt. Z.B. ist xx = x2 für x = 1 und für x = 2 richtig.
V
V
Beispiele 4.1.8 a) Die Aussagen x (x ∈ N =⇒ xx = x2 ) und x (x ∈ N =⇒ xx 6= x2 ) sind
beide falsch.
W
W
b) Hingegen sind die Aussagen x (x ∈ N ∧ xx = x2 ) und x (x ∈ N ∧ xx 6= x2 ) beide richtig.
4.1. MENGEN
105
c) Für alle Mengen M, N gilt
M ⊂ N ⇐⇒
^
(x ∈ M =⇒ x ∈ N )
x
4.1.9 Seien X, Y Mengen. Unter dem cartesischen Produkt X × Y (genannt nach Descartes, der in latinisierter Form Cartesius genannt wurde) versteht man die Menge aller Paare
(x, y) mit x ∈ X, y ∈ Y . Zum Beispiel kann man die euklidische Ebene bekanntlich als Menge
aller Paare (x, y) reeller Zahlen auffassen. Also ist“ sie R × R.
”
Ebenso kann man das cartesische Produkt von 3 oder mehr Mengen bilden. R × R × R ist die
Menge aller Tripel (x1 , x2 , x3 ) reeller Zahlen. Statt R × R schreibt man auch R2 und statt
R × R × R. Entsprechend ist R4 usw. und Rn zu verstehen. Die Elemente (x1 , x2 , . . . , xn ) des
Rn heißen n-tupel reeller Zahlen. Ebenso gut kann man von n-tupeln ganzer Zahlen, d.h. von
Elementen des Zn , usw.
Ein n-tupel ist ein formales Nacheinandersetzen (Nacheinanderschreiben) von Elementen. Zwei
n-tupel (x1 , . . . , xn ), (y1 , . . . , yn ) sind genau dann einander gleich, wenn x1 = y1 , . . . , xn = yn
gilt. Die Tripel (d.h. 3-tupel) (1, 1, 2), (1, 2, 2), (1, 2, 1), (2, 1, 1) sind also alle untereinander verschieden, während die Mengen {1, 1, 2}, {1, 2, 2}, {1, 2, 1}, {2, 1, 1} untereinander
gleich sind. Es ist also ein großer Unterschied zwischen dem Begriff einer endlichen Menge
{x1 , x2 , . . . , xn } und dem eines n-tupels (x1 , x2 , . . . , xn ) !
Ist K ein beliebiger Körper, so definiert man auf dem K n eine Addition wie folgt:
(a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) := (a1 + b1 , a2 + b2 , . . . , an + bn )
(4.1)
Alle Axiome der Addition in einem Körper (oder Ring) sind für diese Addition erfüllt. Definiert
man noch eine Multiplikation durch
(a1 , a2 , . . . , an ) · (b1 , b2 , . . . , bn ) := (a1 b1 , a2 b2 , . . . , an bn )
so wird der K n zu einem Ring, der aber für n > 1 kein Körper ist. (Warum nicht?)
Wichtiger ist die Multiplikation eines Elementes von K mit einem solchen von K n :
a · (b1 , . . . , bn ) := (ab1 , . . . , abn )
(4.2)
für a, b1 , . . . , bn ∈ K. Es ist K n zusammen mit der Addition (4.1) und der Multiplikation (4.2)
ein sog. Vektorraum.
AUFGABEN
1. Prinzip der Inklusion-Exklusion a) Seien A, B endliche Mengen aus a, bzw. b Elementen.
Ferner sei d die Zahl der Elemente von A ∩ B. Wieviele Elemente besitzt A ∪ B?
b) Seien A1 , A2 , A3 endliche Mengen aus a1 , a2 , a3 Elementen. Für i 6= j sei aij =
#(Ai ∩ Aj ), ferner a123 = #(A1 ∩ A2 ∩ A3 ). Zeige #(A1 ∪ A2 ∪ A3 ) = a1 + a2 + a3 − a12 − a13 −
a23 + a123 .
106
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
c) (Dieser Aufgabenteil ist einigermaßen aufwendig. Du solltest keinenfalls seinetwegen die
Lektüre des Buches hier abbrechen! Lass ihn lieber weg, und bearbeite ihn später oder überhaupt nicht. Oder ersetze ihn durch Teil b) mit 4 statt T
3 Mengen.) Seien A1 , . . . , An endliche
Mengen. Für jedes nichtleere I ⊂ {1, . . . , n} sei aI := # i∈I Ai . Dann gilt
X
#(A1 ∪ . . . ∪ An ) =
(−1)#I+1 aI .
∅6=I⊂{1,...,n}
Setzt man a∅ = #(A1 ∪ . . . ∪ An ), so kann man die behauptete Gleichung auch wie folgt
schreiben:
X
(−1)#I aI = 0 .
I⊂{1,...,n}
2. Seien A, B Teilmengen von N. Betrachte die beiden Mengen
X = A ∩ B, Y = N − (A ∪ B).
Zeige durch Beispiele, dass, je nach Wahl von A, B jeder der folgenden 4 Fälle eintreten kann:
a),b) X, Y sind beide endlich bzw. beide unendlich; c) X ist endlich, Y unendlich. d) X ist
unendlich, Y endlich.
3. Betrachte für ganze n ≥ 1 die Menge V := (Z/2)n = Fn2 . In ihr gibt es ja die Addition
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
Diese ist assoziativ und kommutativ, und ein neutrales Element (bzgl. der Addition) ist
(0, . . . , 0). Ferner gilt für jedes a = (a1 , . . . , an ) die Regel a + a = 0 := (0, . . . , 0), da 1 + 1 = 0
in Fs gilt.
Zeige, dass für n ≥ 2 die Summe aller Elemente von V gleich (0, . . . , 0) ist. (Die Summe dieser
Elemente für n = 1 ist das 1-tupel (1).)
4.2
Abbildungen
4.2.1 Ohne den Begriff ‘Abbildung’ geht in der modernen Mathematik gar nichts. Zu einer
Abbildung gehören eine Startmenge (Definitionsbereich) X und eine Zielmenge Y . Eine Abbildung f : X → Y , d.h. von X nach Y besteht nun darin, dass jedem Element x ∈ X genau
ein (d.h. ein, aber auch nur ein) Element f (x) ∈ Y zugeordnet wird. Wird durch f auch nur
einem einzigen Element x ∈ X kein oder mehr als ein Element aus Y zugeordnet, so ist f keine
Abbildung von X nach Y .
Damit soll nicht gesagt sein, dass es keinen Sinn hat, auch andere ‘Korrespondenzen’ zu betrachten, wo etwa jeder positiven reellen Zahl ihre beiden Quadratwurzeln ‘zugeordnet werden’.
Definition: Die Teilmenge {(x, y) ∈ X × Y | y = f (x)} von X × Y wird der Graph von f
genannt und meist mit Γ(f ) bezeichnet.
4.2. ABBILDUNGEN
107
Wenn Du Skrupel hast, obige Erklärung Jedem Element aus X wird genau ein Element aus Y
”
zugeordnet“ als richtige Definition anzuerkennen, kannst Du eine Abbildung als ihren Graphen
betrachten, d.h. als eine Teilmenge Γ(f ) ⊂ X ×Y definieren, die folgende Eigenschaft besitzt: Zu
jedem x ∈ X gibt es genau ein – also mindestens und höchstens ein – y ∈ Y mit (x, y) ∈ Γ(f ).
Natürlich hat f (x) = y dieselbe Bedeutung wie (x, y) ∈ Γ(f ).
Sind X und Y Teilmengen von R, so ist der Graph jeder Abbildung f : X → Y eine Teilmenge
von R2 , die Du, wie gewohnt, manchmal (teilweise) zeichnen kannst.
4
3
2
1
1
2
3
4
Frage: Ist f : R → R, f (x) := 1/x eine Abbildung?
Ja. Warum sollte sie keine sein?
ordnet.
Nein; denn dem Element 0 wird kein Element zuge-
Frage: Ist f : R − {0} → R, f (x) := 1/x eine Abbildung?
Ja
Nein
Man kann durch geschickte Wahl der Startmenge (oder auch der Zielmenge) oft eine Abbildung
definieren, wo eine solche in strengem Sinn vorher noch nicht bestand.
Frage: Ist folgendes eine Abbildung?
f : R → R definiert durch f (x) = 1 für x ∈ Q,
Ja
f (x) = 0 sonst.
Nein
Diese Abbildung ist zwar nirgendwo stetig, jedoch für den Mathematiker präzise definiert.
Aber kann man – für einen beschränkten Teilbereich der Startmenge R – den Graphen dieser
Funktion zeichnen? Bedenke, dass ein gezeichneter Punkt, also ein Punkt, den man sehen kann,
kein echter Punkt ist, sondern eine positive Ausdehnung hat.
(Der Begriff der Stetigkeit wird weiter unten genau definiert. Ich hoffe allerdings, dass Du ein
Gefühl dafür hast.)
Ferner ist zuzugeben, dass es bei einer gemessenen physikalischen Größe keinen Sinn hat, zu
fragen, ob sie rational oder irrational ist. Beachte dazu folgendes: Sogar wenn Du die ersten
10
1010 Dezimalstellen einer reellen Zahl x0 kennst, weißt Du nicht, welchen Wert die genannte
108
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Funktion bei x0 auch nur angenähert hat! Andererseits scheint es auch nicht sinnvoll, sich allein
auf die stetigen Funktionen zu beschränken. Auch in der Physik betrachtet man manchmal
unstetige Funktionen.
Ein weiteres Beispiel ist:
g : R → R,
g(x) = x2 für x ≥ 0, g(x) = −x2 für x < 0
Diese Abbildung ist stetig, sogar differenzierbar, aber nicht 2-mal differenzierbar, jedenfalls
nicht in 0. (Letzteres heißt, dass die Ableitung g 0 von g in 0 nicht differenzierbar ist. Prüfe das
nach! Wenn Du erst lernen willst, was eine differenzierbare Funktion und ihre Ableitung ist, so
kannst Du das weiter unten im Kapitel 7 dieses Buches tun.)
Bezeichnung: Wir benutzen gerne folgende Bezeichnung, um diese Funktion g und ähnliche
zu beschreiben:
2
x
für x ≥ 0
g : R → R, g(x) =
−x2 sonst
Bei endlichen Mengen kann man konkret angeben, wohin jedes einzelne Element abgebildet
wird, z.B.
α : {1, 2, 3} → {1, 2, 3}, 1 7→ 2, 2 7→ 2, 3 7→ 3
β : {1, 2, 3} → {1, 2, 3},
1 7→ 2, 2 7→ 3, 3 7→ 1
Ich benutze das Zeichen A → B, um von einer Abbildung der Menge A in die Menge B zu
reden, hingegen das Zeichen a 7→ b um anzugeben, dass bei dieser Abbildung dem Element a
das Element b zugeordnet wird, anders gesagt: das Element a auf das Element b abgebildet
wird.
Definitionen 4.2.2 Sei f : X → Y eine Abbildung.
a) X heißt die Startmenge (kurz: der Start) und Y die Zielmenge (kurz: das Ziel) von f .
(In manchen Situationen, insbesondere in diesem Kapitel, ist man sehr streng und unterscheidet zwischen Abbildungen, die nur bis auf die Start- oder die Zielmenge übereinstimmen, z.B.
zwischen den Abbildungen f : R → R, x 7→ x2 und g : R → R+ , x 7→ x2 .)
b) Die Bildmenge (auch das Bild), von f , die manchmal mit im(f ) (von lateinisch imago),
manchmal mit f (X) bezeichnet wird, ist die Menge {fW
(x) | x ∈ X} =
{y ∈ Y | es existiert ein x ∈ X mit f (x) = y} = {y | x∈X f (x) = y}. Die Bildmenge ist eine
Teilmenge der Zielmenge, stimmt aber nicht immer mit dieser überein!.
c) f heißt injektiv, wenn verschiedene Elemente von X auch verschiedene Bilder haben, d.h.
wenn aus f (x) = f (x0 ) immer x = x0 folgt. (Dass aus x = x0 immer f (x) = f (x0 ) folgt, ist
aufgrund des Begriffes einer Abbildung klar, und hat deshalb überhaupt nichts mit ‘injektiv’ zu
tun!)
d) f heißt surjektiv, wenn jedes Element y ∈ Y das Bild (mindestens) eines x ∈ X ist, d.h.
wenn f (X) = Y , also die Bildmenge gleich der Zielmenge ist.
4.2. ABBILDUNGEN
109
e) f heißt bijektiv, wenn f sowohl injektiv wie surjektiv ist.
f ) Sind f : X → Y, g : Y → Z Abbildungen, so definiert man ihre Verkettung (auch
Hintereinanderausführung) g ◦f : X → Z durch (g ◦f )(x) := g(f (x)).
Achtung; Die älteren Bezeichnungen eineindeutig“ anstelle von injektiv“, sowie Abbildung
”
”
”
auf“ anstelle von surjektive Abbildung“ werden in diesem Buch nicht verwendet.
”
Beispiele 4.2.3 a) Die oben am Ende von 4.1.1 angegebene Abbildung α ist weder injektiv,
noch surjektiv; β hingegen ist bijektiv.
b) Durch x 7→ x2 können, je nach Wahl von Start und Ziel, Abbildungen mit verschiedenen der
o.a. Eigenschaften definiert werden:
1) R → R, weder surjektiv noch injektiv,
2) R → R+ , surjektiv aber nicht injektiv,
3) R+ → R, injektiv aber nicht surjektiv,
4) R+ → R+ , sowohl surjektiv wie injektiv, also bijektiv.
c) Die Abbildung Z → N, n 7→ |n| ist surjektiv, aber nicht injektiv. Gibt es auch eine bijektive
Abbildung Z → N?
Eine Antwort findest Du unten, am Ende von 4.2.4.
√
d) Beispiele für Verkettungen kennst Du sicher. Z.B. ist dir Funktion h(x) := 1 + x2 die
√
Verkettung der Funktionen f : R → R, f (x) := 1 + x2 und g : R → R, g(y) := y. D.h. für
diese Funktionen gilt h = g ◦f .
Was meinst Du zu meinen Ausführungen?
Diese Begriffshuberei ist doch völlig uninteressant. Ich werde mich in meinem Studium auf
die Gebiete beschränken, die ohne solchen formalen Quatsch auskommen.
Die obigen Begriffe sind zwar einfach, aber doch geeignet, die Situation zu klären. Du kannst
ihnen in keinem Gebiet der modernen Mathematik entgehen.
Was meine ich? Ich habe sehr viel Verständnis dafür, wenn Du die erste Antwort angekreuzt
hast. Es braucht wirklich viel Erfahrung mit moderner Mathematik, um zu erkennen, dass die
zweite Antwort doch die bessere ist.
4.2.4 Sei f : X → Y eine bijektive Abbildung. Dann gibt es zu jedem y ∈ Y genau ein (d.h. ein
eindeutig bestimmtes) x ∈ X mit f (x) = y. (Die Existenz dieses x folgt aus der Surjektivität,
seine Eindeutigkeit aus der Injektivität von f .)
Dieses x wird mit f −1 (y) bezeichnet. Macht man obiges für alle y ∈ Y , so erhält man eine
Abbildung f −1 : Y → X. Man nennt f −1 auch die Umkehrabbildung oder Umkehrfunktion
von f . Sie ist nur dann definiert, wenn f bijektiv ist. Natürlich ist auch f −1 bijektiv, wenn es
überhaupt definiert ist.
110
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Achtung: Die Abbildung
x 7→
1
f (x)
hat nichts, aber auch gar nichts mit f −1 , wie wir es definiert haben, zu tun! (Ich kann natürlich
nicht dafür garantieren, dass nicht in dem einen oder anderen Buch oder einer Vorlesung die
Abbildung x 7→ 1/f (x) doch mit f −1 bezeichnet wird. Da muss Du einfach aufpassen! Jeder
Autor hat – leider oder zum Glück? – das Recht auf seine eigenen Definitionen.)
Beispiele: a) Ist f : R → R durch f (x) := ax + b mit a, b ∈ R, a 6= 0 definiert, so wird
f −1 : R → R gegeben durch f −1 (y) = a−1 y − a−1 b. Die Graphen von f und von f −1 sind
Geraden. Hingegen ist 1/f (x) = (ax + b)−1 . Hier ist der Graph eher krumm!
√
b) Ist f : R∗+ → R∗+ gegeben durch f (x) = 1/x2 , so wird f −1 durch f −1 (y) = 1/ y gegeben.
Hingegen ist 1/f (x) = x2 .
c) Die Abbildung f : N → Z, definiert durch
n/2
f (n) =
−(n + 1)/2
für gerade n
für ungerade n
ist bijektiv und hat die Umkehrabbildung f −1 : Z → N, definiert durch
2m
für m ≥ 0
−1
f (m) =
−2m − 1 für m < 0
4.2.5 Ist f : X → Y eine bijektive Abbildung, so gilt f ◦f −1 = idY und f −1 ◦f = idX .
Sind umgekehrt f : X → Y und g : Y → X Abbildungen mit g ◦f = idX und f ◦g = idY , so
sind f, g bijektiv, und es ist g = f −1 und f = g −1 .
Lemma 4.2.6 Seien
β
α
W −→ X −→ Y .
Abbildungen. Dann gilt: Wenn α, β injektiv (bzw. surjektiv, bzw. bijektiv sind, so ist auch β ◦α
injektiv (bzw. surjektiv, bzw. bijektiv).
Lemma 4.2.7 Sei
α
β
γ
W −→ X −→ Y −→ Z
eine Folge von Abbildungen. Dann gilt γ ◦(β ◦α) = (γ ◦β)◦α.
Beweis:
Für w ∈ W gilt
(γ ◦(β ◦α))(w) = γ((β ◦α)(w)) = γ(β(α(w)))
und
((γ ◦β)◦α)(w) = (γ ◦β)(α(w)) = γ(β(α(w)))
4.2. ABBILDUNGEN
111
Mit anderen Worten: Sowohl γ ◦(β ◦α) als auch (γ ◦β)◦α ist die Abbildung, die entsteht, indem
man zuerst α, dann β und schließlich γ ausführt.
Beachte, dass α◦β in obiger Situation meistens nicht definiert ist. (Sie ist im Falle W = Y
definiert, allerdings eine Abbildung X → X, während β ◦α – im Falle W = Y – die Menge W in
sich abbildet. Die Frage, ob α◦β = β ◦α ist, kann also nur gestellt werden, wenn W = X = Y ist.
Betrachte hierzu die Menge X := {1, 2} und α, β : X → X, definiert durch α(x) := 1, β(x) = 2
für jeweils alle x ∈ X: Bestimme β ◦α und α◦β.
Sei Y := {1, 2, 3}. Finde bijektive α, β : Y → Y mit α◦β 6= β ◦α.
(Siehe 8.1.7, wenn Du die Aufgabe nicht selber lösen magst.)
4.2.8 Sei f : X → Y eine beliebige Abbildung – die weder injektiv noch surjektiv sein muss.
Dann definiert man manchmal für Teilmengen V ⊂ Y die folgende Menge:
f −1 (V ) := {x ∈ X | f (x) ∈ V }, die Urbildmenge von V
Vorsicht:Trotz gleicher Bezeichnung bedeutet f −1 hier nicht die Umkehrabbildung von f ,
welche ja nur dann definiert ist, wenn f bijektiv ist. f −1 (V ) ist eine Teilmenge von X. Auch
wenn V nur aus einem Element besteht, gilt dies nicht unbedingt für f −1 (V ).
Ist V ∩ im(f ) = ∅, so ist f −1 (V ) = ∅, und umgekehrt.
Man kann f −1 (V ) im Allgemeinen nicht als f −1 (V ) := {f −1 (y) | y ∈ V } definieren. Das geht
nur, wenn f bijektiv ist.
Ist U ⊂ X eine Teilmenge, so wird definiert:
f (U ) := {f (x) | x ∈ U }.
√ √
Beispiele: a) Ist f : R → R definiert durch f (x) = x2 , so ist f −1 ({2}) = {− 2, 2} und
f −1 ({−2}) = ∅.
b) Für dieselbe Funktion gilt f (R) = f (] − ∞, 0]) = [0, ∞[.
Bemerkung: Manchmal schreibt man f −1 (y) := f −1 ({y}). Hier musst Du besonders aufpassen!
4.2.9 Mächtigkeit. Wenn zwei endliche Mengen gleichviele Elemente haben, so gibt es
eine bijektive Abbildung zwischen ihnen – und umgekehrt. In diesem Fall nennt man sie
gleichmächtig. Wir verallgemeinern dies auf beliebige (endliche oder unendliche) Mengen.
Definition 4.2.10 Mengen M, N heißen gleichmächtig, symbolisch M ∼
= N , wenn es eine
bijektive Abbildung f : M → N gibt.
Ist immer M ∼
= M ? Gilt immer: Aus M ∼
= N folgt N ∼
= M ? Gilt immer: Aus L ∼
= M, M ∼
=N
folgt L ∼
= N ? Na klar!
112
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
4.2.11 Frage: Ist jede unendliche Teilmenge M von N gleichmächtig zu N. d.h. gibt es in
diesem Fall eine bijektive Abbildung N → M ?
Klar!
Ich glaube es schon, möchte aber über einen Beweis doch nachdenken.
Betrachte z.B. die Menge P aller Primzahlen. Dann kann man doch eine bijektive Abbildung
f : N → P dadurch angeben, dass man die Primzahlen der Reihe nach abzählt, also
f (0) = 2, f (1) = 3, f (2) = 5, f (3) = 7, f (4) = 11, f (5) = 13 usw.
Noch viel einfacher ist es es, die Menge N1 der natürlichen Zahlen ≥ 1 als gleichmächtig zu N
zu erkennenn, nämlich mittels f : N → N1 , f (n) = n + 1. Ferner haben wir oben gesehen, dass
N zu Z gleichmächtig ist.
Wie mit P kann man es natürlich mit jeder unendlichen Teilmenge von N machen. Nur darf man
dabei folgendes bedenken: Für komplizierter definierte Teilmengen X von N mag es – anders als
für die Menge P – prinzipiell schwierig sein, jeweils nach einem bereits gefundenen x0 ∈ X das
nächstgrößere x ∈ X effektiv nach einem konkreten Rezept zu bestimmen. Jedenfalls gibt es
kein allgemeingültiges Verfahren, diese Aufgabe für jede Teilmenge X von N zu lösen. Insofern
ist die Aussage, dass jede unendliche Teilmenge von N gleichmächtig zu N ist, eine ziemlich
theoretische Aussage. Wohlgemerkt, es mag zwar sehr zeitaufwendig sein, die kleinste Primzahl
10
zu bestimmen, die größer als 1010 ist, aber man weiß prinzipiell, wie man es machen muss.
Definition 4.2.12 Eine Menge heißt abzählbar, wenn sie endlich oder zu N gleichmächtig
ist.
Gemäß der obigen Bemerkung ist jede Teilmenge einer abzählbaren Menge abzählbar. Deshalb
ergibt sich die
Folgerung 4.2.13 Eine Menge M ist genau dann abzählbar, wenn es eine injektive Abbildung
M → N gibt.
Diese Aussage könnte man natürlich auch als Definition der Abzählbarkeit nehmen.
Definition 4.2.14 Eine Nullfolge natürlicher Zahlen ist eine Folge (ai )i∈N , für die ai ∈ N
für alle i ∈ N und ai = 0 für fast alle, d.h. alle i ∈ N bis auf endlich viele Ausnahmen gilt.
Z.B. ist die Folge (3, 7, 6, 0, 1, 0, 0, 0, . . .), wo alle Folgenglieder nach dem fünften Glied gleich 0
sind, eine Nullfolge natürlicher Zahlen. Die Folge, deren sämtliche Glieder gleich 1 sind, ist es
hingegen nicht. Auch nicht die Folge, in der für jedes n das n!-te Glied 1 ist und alle anderen
Glieder Null sind.
Eine Folge natürlicher Zahlen, die entsprechend der Grenzwertdefinition in R gegen 0 konvergiert, ist auch im Sinne der eben getroffenen Definition eine Nullfolge natürlicher Zahlen und
umgekehrt. (Beweis?)
4.2. ABBILDUNGEN
113
Satz 4.2.15 Es gibt eine bijektive Abbildung der Menge N aller Nullfolgen natürlicher Zahlen
nach N1 . Mithin ist N gleichmächtig zu N1 , also zu N. Die Menge N ist abzählbar.
Beweis: Dies haben wir bereits in Satz 1.3.5 gesehen. Eine bijektive Abbildung f : N → N1
wird durch
f (a1 , a2 , a3 , . . .) := pa11 · pa22 · pa33 · · ·
wobei p1 , p2 , p3 . . . die Primzahlen in ihrer natürlichen Reihenfolge und das rechtsstehende Produkt als das Produkt der endlich (!) vielen Faktoren, die ungleich 1 sind, definiert ist. (Hier
habe ich mit dem Index 1 statt 0 begonnen, da es bei der Folge der Primzahlen üblich ist.)
Die Surjektivität ergibt sich aus der Existenz der Primfaktorzerlegung, die Injektivität aus
deren Eindeutigkeit.
Den obigen Satz wirst Du kaum für spektakulär halten, weil er so abstrakt ist. Aber aus ihm
ergibt sich
Folgerung 4.2.16 Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis: Erinnere Dich, dass es genügt, eine injektive Abbildung Q → N anzugeben. Jede
schreiben. Wir definieren
rationale Zahl 6= 0 lässt sich eindeutig in gekürzter Form a = ± m
n
m
f : Q → N durch f (a) = (0, m, n, 0, 0, 0, . . .), wenn a = n (in gekürzter Form) ist, und
f (a) = (1, m, n, 0, 0, 0, . . .), wenn a = − m
ist, und schließlich f (0) = (0, 0, 1, 0, 0, 0, . . .).
n
Man kann also die rationalen Zahlen nacheinander aufschreiben und erreicht dabei jede, wenn
man nur lange genug schreibt. Im nächsten Abschnitt will ich einen etwas anderen Beweis
angeben, der möglicher Weise etwas anschaulicher ist.
AUFGABEN
1. Seien
f
g
M →N →P
Abbildungen.
a) Zeige: Ist g ◦f injektiv, so ist f injektiv.
b) Zeige: Ist g ◦f surjektiv, so ist g surjektiv.
c) Gib ein Beispiel, wo g ◦f bijektiv, aber weder f surjektiv, noch g injektiv ist. Gib auch ein
solches Beispiel, wo zusätzlich M = N = P = N ist.
2. Sei f : M → N eine Abbildung. Zeige:
a) Ist f surjektiv, so gibt es eine Abbildung g : N → M mit f ◦g = idN . Jedes solche g ist
injektiv. Aber es ist g ◦f 6= idM , wenn f nicht auch injektiv ist.
Hierzu wird allerdings das sogenannte Auswahlaxiom benutzt (dessen Gültigkeit wir annehmen): Ist {Mi | i ∈ I} eine Menge von nichtleeren Mengen – mit einer sogenannten Indexmenge
114
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
S
I – so gibt es eine Abbildung ϕ : I → i∈I Mi mit ϕ(i) ∈ Mi . D.h. man kann ‘mit einem Schlag’
aus allen Mengen Mi je ein Element ϕ(i) auswählen.
b) Ist f injektiv und M 6= ∅, so gibt es eine Abbildung g : N → M mit g ◦f = idM . Aber es ist
f ◦g 6= idN , wenn f nicht auch surjektiv ist.
3. Definiere analog zu den Nullfolgen natürlicher Zahlen auch Nullfolgen ganzer Zahlen, und zeige,
wie man auf naheliegende Weise die Menge der Nullfolgen ganzer Zahlen bijektiv auf die Menge
Q∗ der von 0 verschiedenen rationalen Zahlen abbilden kann.
4. Seien M, N endliche Mengen von m, bzw. n Elementen.
a) Wieviele Abbildungen von M nach N gibt es?
b) Wieviele injektive Abbildungen von M nach N gibt es?
c) Wieviele bijektive Abbildungen gibt es.
d) Viel schwerer als b) ist die Frage zu beantworten, wieviele surjektive Abbildungen von
M nach N es gibt. Aber Du darfst Dich an ihr versuchen. Du kannst dabei das Prinzip der
Inklusion-Exklusion benutzen.
4.3
Stetige Funktionen
4.3.1 Funktionen sind nichts anderes als Abbildungen, wobei man den Begriff ‘Funktion’ traditioneller Weise in der Regel für Abbildungen gebraucht, deren Zielmenge ein Körper, meist
der Körper der reellen oder derjenige der komplexen Zahlen, ist.
Auch wenn die formale Definition einer Funktion als Abbildung gewissermaßen statisch ist,
so wird eine solche in der Analysis (d.h. dem Gebiet der Mathematik, dem die Differenzialund Integralrechnungin angehört) in dynamischer Weise betrachtet: Die Variable x variiert,
wächst z.B., und damit variiert die von x abhängige Funktion f (x). Von dieser dynamischen
Auffassung ausgehend, versteht man am besten, warum man überhaupt die Ableitung einer
Funktion betrachtet. Denn diese misst ja, wie stark f (x) im Verhältnis zu x nahe bei einem
Punkt variiert.
Der Graph einer Funktion f : D → R, wo D ⊂ R ein Definitionsbereich ist, ist ja eine
Teilmenge von D×R, nämlich die Menge aller Paare (x, f (x)), wo x die Menge D durchläuft. Da
der Graph somit eine Teilmenge der ‘Ebene’ R2 ist, kann man versuchen, ihn zu zeichnen. Eine
solche Zeichnung gibt häufig ein gutes Bild einer Funktion, wobei man einschränkend bemerken
muss, dass erstens die Dicke des Bleistiftstriches die Präzision dieses Bildes beeinträchtigt,
zweitens man immer nur einen beschränkten Teil des Graphen zeichnen kann.
Beispiele 4.3.2 a) Wir betrachten folgende Funktion f (x) = x3 − 5x2 + 6x + 1, d.h. die
Abbildung f : R → R, definiert durch f (x) = x3 − 5x2 + 6x + 1. Funktionen dieser Art hast Du
sicher auf der Schule kennengelernt. Ihr Graph, genauer ein Teil ihres Graphen, sieht so aus:
4.3. STETIGE FUNKTIONEN
115
4
3
2
1
1
2
3
4
b) Eine Funktion mit dem Graphen
1
2
–3
–2
–1
0
1
2
ist Dir vielleicht weniger vertraut. Wir wollen sie ‘zak’ nennen, wobei man sie wie folgt definieren
kann:
zak(x) ist der Abstand von x zur nächstgelegenen
ganzen Zahl (oder zu den nächstgelegenen
beiden ganzen Zahlen), also gleich Min{|x − n| n ∈ Z}. (Es kann sein, dass es zwei nächstgelegene ganze Zahlen gibt, z.B. falls x = 1/2 ist. Dann sind aber die beiden Abstände zu diesen
ganzen Zahlen gleich.)
c) Kaum wirst Du in der Schule jene seltsame Funktion kennengelernt haben, die bei jeder
rationalen Zahl den Wert 1 und bei jeder irrationalen Zahl den Wert 0 annimmt. Diese Funktion
ist nirgendwo stetig, und ihren Graphem kann man auch nicht wirklich zeichnen.
Bemerkung 4.3.3 Es gibt viele interessante Funktionen, die im Gegensatz zu den oben angegebenen Funktionen, nicht für alle x ∈ R definiert sind, z.B. die Funktion f (x) = 1/x oder der
Tangens. Die Definitionsbereiche der letztgenannten Funktionen sind Vereinigungen von Intervallen. Wenn wir eine Funktion in der Nähe eines Punktes betrachten, etwa in einem Punkt
differenzieren wollen, reicht es, diese Funktion, eingeschränkt auf ein Intervall zu betrachten.
4.3.4 Wir wollen hier stetige Funktionen betrachten. Die beiden Beispiele unter a) und unter
b) sind stetig. Beachte dass der Graph einer stetigen Funktion durchaus ‘Ecken’ haben darf.
Auch die Funktion f (x) = 1/x ist überall dort stetig, wo sie definiert ist. Allerdings würde
jeder Versuch, sie auch in 0 (als Funktion nach R) zu definieren zu einer Unstetigkeit in diesem
Punkt führen. Anschaulich wird die Stetigkeit einer Funktion, die auf einem Intervall definiert
ist, häufig dadurch beschrieben, dass man ihren Graphen, ohne abzusetzen, zeichnen kann.
116
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Definition 4.3.5 a) Sei I ein Intervall. Eine Funktion f : I → R heißt stetig in dem Punkt
a ∈ I, wenn für jede Folge (xn ) in I mit limn→∞ xn = a gilt, dass auch die Folge (f (xn )) der
Funktionswerte in den xn gegen f (a) konvergiert.
(Hierzu mache ich eine spitzfindige Bemerkung: Es genügt, zu fordern, dass unter o.a. Voraussetzung die Folge (f (xn )) überhaupt konvergiert. Denn die Folge (x0 , a, x1 , a, x2 , a, . . .) konvergiert
natürlich auch gegen a. Wenn die Bildfolge (f (x0 ), f (a), f (x1 ), f (a), f (x2 ), f (a), . . .) überhaupt
konvergiert, kann aber ihr Limes nur gleich f (a) sein. Dann ist aber auch der Limes der Folge
(f (xn )) gleich f (a).)
b) f heißt stetig auf ganz I, wenn f stetig in jedem a ∈ I ist.
Für f : I → R, a ∈ I gilt: f ist genau dann stetig in a, wenn zu jedem ε > 0 ein δ > 0 existiert,
derart dass aus x ∈ I, |x − a| < δ die Aussage |f (x) − f (a)| < ε folgt.
4.3.6 Der so genannte Zwischenwertsatz besagt: Sei f : [a, b] → R eine stetige Funktion, so
nimmt f in dem Intervall [a, b] jeden reellen Wert zwischen f (a) und f (b) an. (Damit ist nicht
ausgeschlossen, dass möglicherweise auch noch weitere Werte angenommen werden. Betrachte
etwa f (x) = x2 zwischen −1 und +2 .)
Diesen Satz wollen wir ohne Beweis als richtig ansehen. Damit er gilt, muss man allerdings die
reellen Zahlen richtig definieren! Du weißt ja bereits folgendes: Die Funktion f (x) = x2 nimmt
auf der Menge der rationalen Zahlen zwar die Werte 1 und 4 an, aber nicht den Wert 2.
Definitionen 4.3.7 a) Eine Funktion f : I → R heißt streng monoton wachsend (bzw.
fallend), wenn aus x, x0 ∈ I, x < x0 die Beziehung f (x) < f (x0 ) (bzw. f (x) > f (x0 ) folgt. Sie
heißt streng monoton, wenn sie streng monoton wachsend oder streng monoton fallend ist.
b) Eine Funktion f : I → R heißt (schwach) monoton wachsend (bzw. fallend), wenn aus
x, x0 ∈ I, x < x0 die Beziehung f (x) ≤ f (x0 ) (bzw. f (x)gef (x0 ) folgt. Analog zu a) ist definiert,
wann f (schwach) monoton ist.
Eine streng monotone Funktion ist sicher injektiv.
Folgerung 4.3.8 Sei f : [a, b] → R stetig und streng monoton wachsend (bzw. fallend), ferner
f (a) = c, f (b) = d, dann ist [c, d] (bzw. [d, c]) gleich dem Bild f ([a, b]). Das heißt, f ist als
Abbildung [a, b] → [c, d] (bzw. [a, b] → [d, c]) bijektiv.
Beweis: Wir beschränken uns auf den Fall, dass f streng monoton wachsend ist. Der ander
Fall wird analog erledigt. Ist a ≤ x ≤ b, so folgt c = f (a) ≤ f (x) ≤ f (b) = d. Somit gilt
f ([a, b]) ⊂ [c, d]. Ist nun y ∈ [c, d], so wird der Wert y nach dem Zwischenwertsatz angenommen.
Insgesamt siehst Du, dass f [a, b] = [c, d] ist.
Da f als streng monotone Funktion zusätzlich injektiv ist, ist f als Abbildung [a, b] → [c, d]
bijektiv.
4.4. WURZELN
117
4.3.9 Unter den obigen Voraussetzungen ist auch die Umkehrabbildung f −1 : [c, d] → [a, b]
(bzw. f −1 : [d, c] → [a, b]) stetig. Das ist allerdings nicht so unmittelbar zu zeigen.
In dieser Hinsicht musst Du aber vorsichtig sein, wenn der Definitionsbereich von f kein Intervall
ist. Betrachte z.B. die Abbildung
x
für x < 1
f : [0, 1[ ∪ [2, 3] → [0, 2], mit f (x) :=
x − 1 für x ≥ 2
Sie ist bijektiv und streng monoton wachsend. Aber die Umkehrabbildung ist nicht stetig!
4.4
Wurzeln
4.4.1 Betrachte für reelle x ≥ 0 die n-te Potenz xn auf dem Definitionsbereich (der Startmenge)
R+ . Sie wächst dort streng monoton von 0 bis ∞.
Sei n ≥ 2 ganz. Wir wissen, dass es keine rationale Zahl r mit rn = 2 gibt. Ein Gewinn der
Einführung der reellen Zahlen liegt nun darin, dass es sehr wohl eine, √
und auch nur eine, reelle
n
Zahl r >√0 mit dieser Eigenschaft gibt. Diese bezeichnet man mit 2. (Ist n gerade, so ist
auch (− n 2)n = 2.) Allgemeiner gilt: Zu jeder nichtnegativen reellen Zahl y gibt es genau eine
√
nichtnegative reelle Zahl x mit xn = y. Dieses x wird mit n y bezeichnet und die n-te Wurzel
aus y genannt. (Eine reelle Zahl heißt nicht negativ, wenn sie positiv oder gleich 0 ist.)
√
√
4.4.2 Die Wurzel a ist also eine Lösung der Gleichung x2 =√ a, wenn a ≥ 0 ist. − a ist
eine weitere Lösung dieser Gleichung, die nur im Fall a =√0 mit √a übereinstimmt. Noch mehr
Lösungen kann es nicht geben. Denn es ist x2 − a = (x − a)(x + a) und jedes Produkt reeller
Zahlen ist nur dann 0, wenn einer der Faktoren es ist.
Mit Hilfe von Quadratwurzeln kann man auch allgemeine quadratische Gleichungen lösen,
wie Du sicher weißt. Ich habe mir sagen lassen, die Gleichung
r
p
p2
x2 + px + q = 0 habe die Lösungen − ±
−q
2
4
2
falls p4 − q ≥ 0 ist. (Andernfalls hat sie keine Lösung in R.) Eigentlich kann ich mir nicht
vorstellen, dass Du damit zufrieden bist, diese Formel zu kennen, ohne zu wissen, wie man sie
beweist. Versuche Dich zu erinnern, denke an die quadratische Ergänzung.
AUFGABEN
1. Zeige: a) Seien a, b positive reelle Zahlen. Dann ist
√
ab < a+b
.
2
√
ab ≤
a+b
.
2
Wenn a 6= b ist, gilt sogar
b) Für jedes a in einem angeordneten Körper gilt a2 ≥ 0. In R ist demgemäß a ≥ 0 genau dann,
wenn es ein b ∈ R mit b2 = a gibt.
118
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
c) In Q gilt die zweite Ausage von b) nicht.
PnHier2 gilt nur die schwächere Aussage: a ≥ 0 ⇐⇒
es gibt ein n ∈ N und a1 , . . . , an ∈ Q mit k=1 ak = b. (Beachte dazu: Jede rationale Zahl lässt
sich als Bruch schreiben, dessen Nenner eine (ganze) Quadratzahl ist.)
Bemerkung: Nicht so einfach ist folgender Satz von [Euler, Lagrange] zu beweisen: Jede
nichtnegative rationale Zahl ist die Summe von 4 Quadraten rationaler Zahlen (und umgekehrt).
Euler hat diesen Satz bewiesen. Später hat Lagrange sogar gezeigt, dass jede natürliche
Zahl eine Summe vierer ganzer Quadratzahlen ist. Überlege, dass Eulers Satz aus dem von
Lagrange folgt.
2an bn
2. In R gelte 0 < a < b. Definiere Folgen (an ), (bn ) durch a0 = a, b0 = b und an+1 =
, bn+1 =
a+b
√
an + b n
. Zeige limn→∞ an = limn→∞ bn = ab.
2
Solltest Du nicht darauf vertrauen, dass es Quadratwurzeln aus positiven reellen Zahlen wirklich
gibt, darfst Du deren Existenz mit Hilfe dieser Aufgabe beweisen!
3. Hinweis, wie man manche Aufgaben nicht angehen sollte:
a) Betrachte die Frage: Was ist der größte Primfaktor der Zahl 86400? Kannst Du diese Frage
schneller beantworten, wenn Du weißt, dass diese Zahl die Anzahl der Sekunden eines Tages
ist?
Wenn man den größten Primfaktor oder auch die Primfaktorzerlegung von 60 · 60 · 24 = 86400
finden will, so ist es einfacher von der Zerlegung 60 · 60 · 24 auszugehen, als erst das Produkt
86400 auszurechnen und dieses dann zu zerlegen! Das ist doch klar!
b) Welche reellen Nullstellen hat das Polynom x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5)?
x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5) = x6 (x2 − 25) − (42x3 − 216)(x − 5)(x + 5) = x6 (x −
5)(x + 5) − (42x3 − 216)(x − 5)(x + 5) = (x6 − 42x3 + 216)(x − 5)(x + 5).
Die Nullstellen des Polynoms sind also 5, − 5, sowie die des Polynoms x6 − 42x3 + 216. Die
Nullstellen des letzteren sind die x ∈ R, für die y = x3 eine Nullstelle des quadratischen
Polynoms
y 2 − 42y + 216 ist. Dessen Nullstellen errechnen sich nach der bekannten Formel zu
√
225 also
21 ± √
√ 36 und 6. Sämtliche reellen Nullstellen des ursprünglichen Polynoms sind somit
5, −5, 3 36, 3 6.
Wenn eine (natürliche) Zahl oder eine Funktion als Produkt gegeben ist, ist es dann immer
zielführend, dieses Produkt zunächst (reflexartig) ‘auszurechnen’, um erst dann gewisse Aufgaben
anzugehen?
√
4. Zeige dass die Menge {a + b 2 | a, b ∈ Q} ein Teilkörper von R ist. Damit ist gemeint, dass sie
in Bezug auf die in R gegebenen Rechenarten ein Körper ist. Du musst also zeigen, dass 0 und 1
in ihr liegen, dass mit zweien ihrer Elemente auch ihre Summe und ihr Produkt zu ihr gehören.
Schließlich müssen noch zu jedem ihrer Elemente 6= 0 das additiv und das multiplikativ Inverse
zu ihr gehören. (Nur für das multiplikativ Inverse ist eine kleine Idee nötig.) Die Körpergesetze
(etwa das Distributivgesetz) werden von R ‘geerbt’.
4.5. CAUCHY- UND CANTOR-DIAGONALEN
4.5
119
Cauchy- und Cantor-Diagonalen
4.5.1 Unter der Menge N × N versteht man ja die Menge aller Paare (n, m) natürlicher Zahlen.
Während man sich N als fortlaufende Folge vorstellen kann:
0 1 2 3 4 5
...
kann man sich die Gesamtheit der Paare natürlicher Zahlen als
Schema vorstellen:
(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5)
(1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5)
(2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5)
(3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5)
(4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5)
(5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5)
..
..
..
..
..
..
.
.
.
.
.
.
unendliches ‘quadratisches’
···
···
···
···
···
···
..
.
Frage: Kann man die Elemente von N × N auch in einer Folge darstellen? Kann man sie
nacheinander ‘hinschreiben’, und zwar so, dass jedes Paar auch ‘irgendwann mal drankommt’ ?
In der Sprache der Abbildungen würde dies bedeuten: Gibt es eine bijektive Abbildung N →
N × N?
Im Prinzip haben wir das bereits positiv beantwortet. Hier gebe ich eine andere Möglichkeit
an, die im folgenden Bild angedeutet sei
(0, 0)
(0, 1)
%
(1, 0)
(0, 2)
%
(1, 1)
%
(2, 0)
(3, 0)
%
(3, 1)
%
%
(3, 3)
%
(3, 4)
%
(4, 3)
%
%
(2, 4)
%
%
(4, 2)
%
%
(1, 4)
(2, 3)
(3, 2)
(4, 1)
%
%
%
%
(0, 4)
(1, 3)
(2, 2)
%
%
(4, 0)
%
(1, 2)
(2, 1)
%
(0, 3)
%
(4, 4)
%
%
(5, 0)
(5, 1)
(5, 2)
(5, 3)
(5, 4)
..
..
..
..
..
.
%
.
%
.
%
.
%
.
%
(0, 5) · · ·
%
(1, 5) · · ·
%
(2, 5) · · ·
%
(3, 5) · · ·
%
(4, 5) · · ·
%
(5, 5) · · ·
...
Die Pfeile deuten an, wie man nacheinander die Paare zu durchlaufen hat.
Man beginnt mit (0, 0), dann durchläuft man die erste sogenannte Cauchy-Diagonale:
(1, 0), (0, 1), dann die zweite Cauchy-Diagonale: (2, 0), (1, 1), (0, 2), dann die dritte CauchyDiagonale (3, 0), (2, 1), (1, 2), (03), dann die vierte: (4, 0), (3, 1), (2, 2), (1, 3), (0, 4), und so fort.
Auf diese Weise erkennst Du, dass die Menge aller Paare natürlicher Zahlen abzählbar ist.
In der n-ten Cauchy-Diagonale stehen die n + 1 Paare natürlicher Zahlen (i, j) mit i + j = n.
Vergleiche das mit den Exponentenpaaren in der Formel, die gemäß dem Binomialsatz aus
(a + b)n berechnet wird.
120
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
4.5.2 Der Name ‘Cauchy-Diagonale’ rührt daher, dass Cauchy sie benutzt hat, um das sogenannte Cauchy-Produkt von unendlichen Reihen zu definieren.
P
P∞
Gegeben seien zwei unendliche Reihen ∞
n=0 an und
n=0 bn . Sämtliche Produkte von je einem
Glied der ersten Reihe mit je einem Glied der zweiten kann man in ein unendliches ‘quadratisches’ Schema schreiben.
a0 b0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5 · · ·
a1 b 5 · · ·
a2 b 5 · · ·
a3 b 5 · · ·
a4 b 5 · · ·
a5 b 5 · · ·
..
..
.
.
Irgendwie sollte eine geeignete Summierung über alle Einträge dieses Schemas gegen das Produkt der Werte der beiden Ausgangsreihen konvergieren.
Das Cauchy-Produkt der beiden Reihen ist definiert, als
∞ X
n
X
(
ak bn−k )
n=0 k=0
D.h. es ist eine unendliche Reihe, deren Glieder
Pndie Summen über die Cauchy-Diagonalen obigen
Diagramms sind. Beachte, dass die Summe k=0 ak bn−k für jedes n eine endliche ist, nämlich
die Summe über die n-te Cauchy-Diagonale, in der n + 1 Einträge stehen.
Wenn die beiden Ausgangsreihen konvergieren, und zwar gegen a, bzw. b, so hofft man doch,
ihr Cauchy-Produkt solle gegen ab konvergieren. Ganz allgemein, d.h. für konvergente,
aber
P∞
a
oder
nicht
absolut
konvergente
Reihen
gilt
das
leider
nicht
!
Falls
aber
eine
der
Reihen
n=0 n
P∞
b
absolut
konvergiert,
gilt
diese
Aussage.
Leider
ist
der
Beweis
dieser
Tatsache
nicht so
n=0 n
einfach, weshalb ich hier darauf verzichte.
Bemerkung 4.5.3 Gibt es eine Reihenfolge, in der man die ai bj summieren kann, so dass
immer der Grenzwert ab herauskommt?
P
Pn
Erinnere dich an den Satz 3.2.27. Da der (Grenz-)Wert der Reihe ∞
i=0 ai als limn→∞
i=0 ai
definiert ist, erhält man aus dem genannten Satz die Formel
n
n
X
X
ab = lim (
ai )(
bj )
n→∞
i=0
j=0
P
P
Das Produkt ( ni=0 ai )( nj=0 bj ) ist aber die Summe über alle Einträge folgenden endlichen
4.5. CAUCHY- UND CANTOR-DIAGONALEN
121
quadratischen Schemas:
a0 b 0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b 3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5
a1 b 5
a2 b 5
a3 b 5
a4 b 5
a5 b 5
..
.
···
···
···
···
···
···
..
.
a0 b n
a1 b n
a2 b n
a3 b n
a4 b n
a5 b n
..
.
an b 0 an b 1 an b 2 an b 3 an b 4 an b 5 · · · an b n
Beim Schritt von n auf n + 1, kommen immer die 2n + 3 Summanden entlang eines ‘Hakens’
der Form
a0 bn+1
a1 bn+1
a2 bn+1
a3 bn+1
a4 bn+1
a5 bn+1
..
.
an+1 b0 an+1 b1 an+1 b2 an+1 b3 an+1 b4 an+1 b5 · · · an+1 bn+1
hinzu. Wenn man entlang der angegebenen Haken und nicht entlang der Cauchy-Diagonalen
addiert, erhält man immer das richtige Ergebnis.
Wir haben also folgende Verfahren, die Einzelprodukte zu summieren:
1. Entlang der Cauchy-Diagonalen: Das ist elegant, führt aber nicht immer zum richtigen Ergebnis.
2. Entlang der oben beschriebenen Haken: Das führt zwar immer zum richtigen Ergebnis, ist
aber holprig.
Im Falle, dass die Ausgangsreihen absolut konvergieren, wirst Du wohl das elegantere CauchyProdukt bilden.
(Übrigens kann man N × N natürlich auch entlang der ‘Haken’ anstelle der Cauchy-Diagonalen
abzählen!)
Beispiel 4.5.4 Seien x, y reelle Zahlen. Die unendlichen Reihen
exp(x) :=
∞
X
xn
k=0
n!
,
exp(y) :=
∞
X
yn
k=0
n!
konvergieren absolut für alle reellen x, y. Mit Hilfe des binomischen Lehrsatzes kannst Du zeigen,
dass das Cauchy-Produkt der Reihen exp(x), exp(y) mit der Reihe
∞
X
(x + y)n
k=0
n!
122
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
übereinstimmt. (Führe das aus!) Mit anderen Worten: Es gilt das Additionstheorem
exp(x + y) = exp(x) exp(y)
Beachte, dass ich zwei große Lücken gelassen haben: Die absolute Konvergenz der Exponentialreihe und der oben angegebene Satz über die ’richtige’ Konvergenz des Cauchy-Produktes
absolut konvergenter Reihen wären noch zu zeigen!
Im nächsten Kapitel werde ich das Additionstheorem beweisen.
4.5.5 Die nichtnegativen rationalen Zahlen sind ja formal gesehen nichts anderes als Paare
natürlicher Zahlen, wobei man viele Paare weglassen kann: Der Nenner darf ja nicht 0 sein,
und es genügt die gekürzten Brüche zu betrachten. Wir bekommen das folgende unendliche
quadratische Schema:
0 1 2 3 ···
1
3
5
7
···
2
2
2
2
1
2
4
5
···
3
3
3
3
1
3
5
7
···
4
4
4
4
.. .. .. .. . .
.
. . . .
In der n-ten Zeile stehen die gekürzten Brüche mit dem Nenner n, aufsteigender Größe nach
geordnet. Indem man dieses Schema entlang der Cauchy-Diagonalen abzählt, bekommt man
eine bijektive Abbildung N → Q+ .
Indem Du nach jeder Zeile des obigen Schemas noch eine neue Zeile hinzufügst, in der die Glieder
mit einem Minus-Zeichen versehen sind, kannst Du einsehen, dass auch ganz Q abzählbar ist.
Wir halten fest:
Satz 4.5.6 Die Menge Q der rationalen Zahlen ist abzählbar.
Indem Du schließlich noch bemerkst, dass es gar nichts ausmacht, ob in einem Schema, ähnlich
dem, womit wir unseren Abschnitt begonnen haben, etliche Zeilen oder Spalten nach endlich
vielen Einträgen aufhören, kannst Du die Gültigkeit des folgenden Satzes einsehen.
Satz 4.5.7 Die Vereinigung abzählbar vieler abzählbarer Mengen ist abzählbar.
(Dies schließt natürlich endliche Vereinigungen abzählbarer Mengen, sowie abzählbare Vereinigungen endlicher Mengen ein.) Folgende Sätze sind unmittelbare Folgerungen:
Satz 4.5.8 Sind M1 , M2 abzählbare Mengen, so ist auch M1 × M2 eine solche.
Satz 4.5.9 Sind M1 , M2 , . . . , Mn endlich viele abzählbare Mengen, so ist auch
M1 × M2 × · · · × Mn eine solche.
4.5. CAUCHY- UND CANTOR-DIAGONALEN
123
Vielleicht überrascht es Dich jetzt der folgende
Satz 4.5.10 Die Menge R der reellen Zahlen ist überabzählbar, d.h. nicht abzählbar.
Beweis: Wäre sie abzählbar, so wäre es auch ihre Teilmenge [0, 1[ der x mit 0 ≤ x < 1.
Wir nehmen an, es gäbe eine solche Abzählung f : N1 → [0, 1[. Denke Dir die x ∈ [0, 1[ als
Dezimalbrüche ‘abgezählt untereinander geschrieben’. Dann erhältst Du folgendes Schema:
f (1) = 0, a11 a12 a13 a14 . . .
f (2) = 0, a21 a22 a23 a24 . . .
f (3) = 0, a31 a32 a33 a34 . . .
f (4) = 0, a41 a42 a43 a44 . . .
············
Hier sind die Indizes Doppelindizes: also a23 bedeutet a2,3 , gesprochen ‘a zwei drei’ und nicht
‘a dreiundzwanzig’. (Es ist allgemein üblich, hier das Komma wegzulassen, wenn es nicht zu
Zweideutigkeiten führt.) In der n-ten Zeile steht die n-te Zahl als Dezimalzahl. D.h. die aij sind
Dezimalziffern, und zwar ist aij die j-te Nachkommastelle der i-ten Zahl.
9er-Perioden seien verboten, damit jede reelle Zahl aus [0, 1[ nur einmal vorkommt.
Nun sehen wir uns die Diagonale“ a11 , a22 , a33 , . . . in diesem Schema an und bilden den Dezi”
malbruch c = 0,b1 b2 b3 b4 . . . nach folgender Vorschrift: es sei bi = 5, wenn aii 6= 5 ist, aber bi = 6,
wenn aii = 5 ist. Dann gilt c ∈ [0, 1[, aber c ist verschieden von allen Zahlen des Schemas. Denn
c unterscheidet sich in der i-ten Nachkommastelle von f (i), ist aber eindeutig als Dezimalbruch
darstellbar, da die Ziffer 0 sowenig vorkommt wie die Ziffer 9. Eine Abzählung der o.a. reellen
Zahlen kann es also nicht geben.
Das hier verwendete Verfahren heißt Cantorsches Diagonalverfahren, da Cantor es erfunden hat, um die Überabzählbarkeit von R zu zeigen.
Ich will nicht verschweigen, dass es von philosophischer Seite gewisse Vorbehalte gegen unseren
unkritischen Umgang mit der Menge ‘aller’ reeller Zahlen gibt. Mit einem endlichen
Alphabet
√
kann man nur abzählbar viele reelle Zahlen beschreiben. (Z.B. kann man 5 alsP‘diejenige
positive reelle Zahl, deren Quadrat 5 ist’ beschreiben. Die Zahl e lässt sich als ‘ ∞
n=0 1/n!’
beschreiben.) Wenn ich also nach Cantor zu allen abzählbar vielen ‘beschreibbaren’ reellen
Zahlen eine neue konstruiere, so muss ich mir bewusst sein, dies auf einer ‘höheren’ Sprachstufe
zu tun, einer Stufe, auf der ich zur Konstruktion die Menge der bisher bereits bekannten reellen
Zahlen benutze. Sonst hätte ich ja einen Widerspruch: ‘Zu allen beschreibbaren reellen Zahlen
gibt es noch eine weitere beschreibbare reelle Zahl.’
Im Prinzip retten sich die Mathematiker hier in eine axiomatische Mengenlehre, deren Axiome
möglicherweise etwas willkürlich sind. Die meisten Mathematiker nehmen diese Problematik
kaum zur Kenntnis. So darfst Du es getrost auch halten. Ehrlich!
Mit dem Cantorschen Diagonalverfahren kannst Du folgende beide Sätze beweisen:
124
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Satz 4.5.11 Seien M1 , M2 , M3 , . . . unendlich viele Mengen, deren jede mindestens 2 Elemente
besitzt, so ist das unendliche Produkt M1 × M2 × M3 × · · ·, das aus allen Folgen (mi )i∈N mit
mi ∈ Mi besteht, überabzählbar.
Definition 4.5.12 Eine 0-1-Folge ist eine Folge (an )n∈N , wo jedes Folgenglied 0 oder 1 ist.
Dabei will ich meist unter 0 und 1 die bekannten ganzen Zahlen verstehen, gelegentlich aber
auch die Restklassen von 0 bzw. 1 in F2 = Z/(2).
Satz 4.5.13 Die Menge aller 0-1-Folgen ist überabzählbar.
Wir können aus unseren Betrachtungen noch einen weiteren Schluss ziehen, nämlich den, dass
es viele (genauer: überabzählbar viele) sogenannte transzendente reelle Zahlen gibt.
Definition 4.5.14 Eine reelle (auch komplexe) Zahl heißt algebraisch, wenn sie eine Nullstelle eines vom Nullpolynom verschiedenen Polynoms mit rationalen Koeffizienten ist. (Da die
Nullstellen eines Polynoms dieselben bleiben, wenn man dieses Polynom mit einer von 0 verschiedenen Konstanten multipliziert, genügt es, entweder Polynome mit ganzen Koeffizienten
zu betrachten, oder solche, deren höchster Koeffizient gleich 1 ist.)
Eine reelle (oder komplexe) Zahl heißt transzendent, wenn sie nicht algebraisch ist.
Satz 4.5.15 Es gibt nur abzählbar viele algebraische und überabzählbar viele transzendente reelle (komplexe) Zahlen.
Beweis: Es genügt zu zeigen, dass die Menge der (reellen) algebraischen Zahlen abzählbar
ist. Wäre dann nämlich auch die Menge der reellen transzendenten Zahlen abzählbar, so wäre
R die Vereinigung zweier abzählbarer Mengen, also selbst abzählbar.
Zeige selber, dass es zu jedem möglichen Grad n nur abzählbar viele Polynome vom Grad n
gibt, deren Koeffizienten rational sind. (Man kann ja jedem Element aus Qn+1 in bijektiver
Weise ein solches Polynom zuordnen.)
Folgere: Es gibt nur abzählbar viele Polynome mit rationalen (ganzen) Koeffizienten.
Mit Hilfe der Tatsache, dass (abgesehen vom Nullpolynom) jedes Polynom in R (auch in C)
nur endlich viele Nullstellen hat, folgere, dass es (in R, bzw. C) insgesamt nur abzählbar viele
Nullstellen von beliebigen Polynomen mit rationalen Koeffizienten gibt.
Bemerkung 4.5.16 Die Aussage ist insofern sehr theoretisch, als es äußerst mühsam und
wenig erhellend ist, mit ihrer Hilfe ein konkretes Beispiel einer transzendenten Zahl anzugeben.
(Man müsste eine konkrete Abzählung der algebraischen Zahlen angeben und für jedes n die n-te
Nachkommastelle der n-ten Zahl bestimmen. Das Cantorsche Diagonalverfahren liefert dann
eine transzendente Zahl als unendlichen Dezimalbruch. Beachte, dass dies im Prinzip möglich
ist!) Wir wissen heute, dass z.B. e und π transzendent sind. Beweise hierfür sind alles andere als
einfach.
Cantor kannte man nur die sogenannten Liouvilleschen Transzendenten,
P∞Vor−n!
z.B. n=1 2 . Auf diese will ich an dieser Stelle eingehen, obwohl sie mit Mengentheorie nicht
viel zu tun haben.
Ich beginne mit einem Hilfssatz:
4.5. CAUCHY- UND CANTOR-DIAGONALEN
125
Lemma 4.5.17 Sei g : R → R ein Polynom. Ist I ⊂ R ein Intervall endlicher Länge, so ist
die Menge g(I) beschränkt. D.h. es gibt ein s ∈ R mit |g(x)| ≤ s für alle x ∈ I.
Allgemeiner gilt dies, falls g auf R lediglich stetig ist. Das wirst Du auf der Uni lernen.
Beweis: Die Behauptung gilt offenbar für jede konstante Funktion und für die Funktion der
Form f (x) = x. Gilt sie für Funktionen f1 , f2 , so gilt sie auch für die Funktionen f1 f2 und
f1 + f2 . Denn aus |fi (x)| ≤ si für x ∈ I folgt |f1 (x)f2 (x)| = |f1 (x)| · |f2 (x) ≤ s1 s2 , sowie
|f1 (x) + f2 (x)| ≤ |f1 (x)| + |f2 (x)| ≤ s1 + s2 für alle x ∈ I.
Jedes Polynom lässt sich durch Summen und Produkte von konstanten Funktionen und der
Funktion f (x) = x aufbauen.
Satz 4.5.18 Sei α eine reelle Nullstelle eines Polynoms vom Grade n > 0 mit rationalen
Koeffizienten. Dann gibt es ein reelles c > 0, so dass für jede von α verschiedene rationale Zahl
p
mit p, q ∈ Z, q > 0 folgende Ungleichung gilt:
q
α − p ≥ c .
q qn
(Hier sind p, q keine Bezeichnungen speziell für Primzahlen, sondern für beliebige ganze Zahlen.) Der Satz besagt in etwa folgendes: Will man eine algebraische Zahl durch rationale Zahlen
approximieren, so wird die Güte der Approximation mit wachsendem Nenner nur in ‘bescheidenem Maße’ besser. Er gilt auch für Polynome vom Grad 1 und besagt dann, dass man eine
rationale Zahl α durch von α verschiedene rationale Zahlen gar nicht so gut approximieren
kann.
Beweis: Sei α Nullstelle von f (x) = an xn + · · · + a0 mit ak ∈ Z. (Dies kann man annehmen,
nachdem man mit dem Hauptnenner der Koeffizienten multipliziert hat.) Wir wissen aus (2.5.2),
dass man f (x) = (x − α)g(x) schreiben kann, wo g(x) ein Polynom mit reellen Koeffizienten
ist.
Wähle c1 > 0 so, dass in dem Intervall I = [α − c1 , α + c1 ] keine von α verschiedene Nullstelle
von f (x) liegt. Dies ist möglich, da f (x) = 0 nur für endlich viele x gilt. (2.5.4) Nach obigem
Lemma gibt es ein c2 > 0 mit der Eigenschaft: ‘Es ist |g(x)| < c2 , wenn immer |x − α| ≤ c1 ist.’
1
p
c
p
Setze c := Min{c1 , } und nimm an, es wäre α − < n (mit p, q ∈ Z, q > 0 und 6= α.)
c2
q
q
q
p
Zunächst folgt aus dieser Annahme − α < c ≤ c1 und deshalb – nach Wahl von c2 –
q
p
g
≤ c2 . Aus c ≤ 1/c2 ergibt sich
q f p = p − α · g p < c · c2 ≤ 1 .
q q
q qn
qn
126
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
p < 1. Da f (x) ganze Koeffizienten hat, ist die linke Seite dieser UngleiSomit gilt q · f
q p
p
chung eine natürliche Zahl. Deshalb ist f
= 0. Das ist ein Widerspruch zu 6= α und
q
q
p
∈ I, einem Intervall, in dem außer α keine Nullstelle von f liegt.
q
n
P∞
Folgerung 4.5.19 Die Zahl α :=
k=0
2−k! ist transzendent.
Es ist klar, dass die Reihe konvergiert. Dies ist das angekündigte Beispiel einer Liouvilleschen
Transzendenten.
P
−k!
Beweis: Die Partialsumme sm := m
ist gleich einem Bruch mit dem Nenner 2m! ,
k=0 2
pm
etwa gleich m! mit einer natürlichen Zahl pm . (2m! ist der Hauptnenner.)
2
Die (positive) Differenz α − sm ist nur sehr wenig größer als 2−(m+1)! . Genauer gilt
α − sm = α −
m
X
−k!
2
=
k=0
∞
X
k!
−(m+1)!
2 <2
k=m+1
∞
X
2j =
j=0
2
2−(m+1)!
.
Nimm an, α wäre Nullstelle eines Polynoms vom Grade n mit rationalen Koeffizienten. Nach
obigem Satz gäbe es ein c > 0 mit
α−
pm
c
≥
für alle m ∈ N.
2m!
2n·m!
Andererseits haben wir
2
2(m+1)!
>α−
pm
2
c
, folglich (m+1)! > n·m!
m!
2
2
2
Es folgte
(2m! )m+1
2
<
m!
n
(2 )
c
Die linke Seite geht mit m (bei konstanten n, c) gegen unendlich. Widerspruch!
P∞ −n!
Der Beweis funktioniert für jede Reihe n=0 a
mit einer ganzen Zahl a ≥ 2, insbesondere
für a = 10, wo man sich die Dezimalbruchdarstellung gut vorstellen kann.
AUFGABEN
1. a) Betrachte die Menge A derjenigen 0-1-Folgen, welche die Eigenschaft haben, dass nie eine
Null auf eine Null folgt. Ist A abzählbar oder überabzählbar?
b) Betrachte die Menge B aller 0-1-Folgen mit der Eigenschaft, dass nie eine Eins auf eine Null
folgt. Ist B abzählbar oder überabzählbar?
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 127
2. Zeige, dasss es eine (naheliegende) bijektive Abbildung von der Menge E aller 0-1-Folgen zur
Potenzmenge von N, (d.h. der Menge aller Teilmengen von N) gibt.
Folgere, dass die Potenzmenge von N überabzählbar ist.
3. Zeige, dass die Menge aller endlichen Teilmengen von N abzählbar ist.
4. Zeige, dass die Menge aller Null-Eins-Folgen, die von einer gewissen Stelle an periodisch sind,
abzählbar ist. (Was meine ich wohl mit der Aussage ‘von einer gewissen Stelle an periodisch’ ?)
5. Wie hängen die beiden letzten Aufgaben zusammen? Genügt es, eine von ihnen zu lösen, damit
die Lösung der anderen auf der Hand liegt?
6. Es gibt eine Abbildung E → [0, 1], die jeder Folge aus E den entsprechenden Binärbruch
zuordnet, z.B. (0, 1, 1, 0, 1, 1, 1, 0, 0, . . .) 7→ 0, 011011100 . . .. Links trennen die Kommata die
einzelnen Folgenglieder, rechts trennt das Komma den ganzen Anteil der binär geschriebenen
Zahl von dem gebrochenen Anteil.
Ist diese Abbildung injektiv, surjektiv?
7. Wir betrachten Ternärbrüche (d.h. solche, wo die Grundzahl die 3 ist) der Form 0, a1 a2 a3 . . .,
wo die ai nur die Ziffern 0 oder 2 sind. Lassen sich 0, 31 , 23 , 1 durch einen solchen (unendlichen)
Ternärbruch darstellen? Wie steht es mit Zahlen aus ] 31 , 23 [? Und wie mit solchen aus ] 19 , 29 [, bzw.
solchen aus ] 97 , 89 [? Kannst Du das fortsetzen?
Die Menge C der reellen Zahlen, die man als Ternärbrüche der genannten Art schreiben kann,
heißt das Cantorsche Diskontinuum.
Beachte, dass die Darstellung der Zahlen aus dem Cantorschen Diskontinuum als
Ternärbrüche der genannten Art eindeutig ist!
Gib eine bijktive Abbildung C → E an. Welche Art Abbildung (injektiv, surjektiv) C → [0, 1]
erhält man daraus?
8. Zeige für das Cantorsche Diskontinuum C: Es gibt eine leicht zu beschreibende bijektive
Abbildung C × C → C. Aus jedem Paar von Folgen kann man auf kanonische Weise eine einzige
Folge machen.
9. Gib eine naheliegende surjektive Abbildung C → [0, 1] an.
4.6
Ein allgemeiner Satz über die Vergleichbarkeit von
Mengen
Es mag sein, dass Dir die folgenden Ausführungen nicht besonders gefallen, zu abstrakt oder zu
schwer vorkommen. Du kannst sie ohne Schaden übergehen. Vielleicht hast Du ja später mehr
Spaß an ihnen.
128
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Bemerkung 4.6.1 Seien M, N Mengen. Dann gibt es eine zu M gleichmächtige Menge M 0
und eine zu N gleichmächtige Menge N 0 , derart das M 0 ∩ N 0 = ∅ ist.
Man kann nämlich jedes Element m ∈ M durch das Paar (m, 0) ersetzen, also M 0 :=
{(m, 0) | m ∈ M } und entsprechend N 0 := {(n, 1) | n ∈ N } definieren.
Beachte, dass keiner garantieren kann, dass bereits M 0 ∩ N = ∅ ist. Hingegen sind (m, 0) und
(n, 1) auf jeden Fall verschiedene Paare, ganz egal wie m und n aussehen.
4.6.2 Unendliche Mengen M haben die Eigenschaft, dass es Abbildungen f : M → M gibt,
die zwar injektiv, aber nicht surjektiv sind. Dies kann man – so man will – als Definition für
die Unendlichkeit einer Menge nehmen. (Schon Galilei hatte bemerkt, dass die Abbildung
N → N, x 7→ x2 von dieser Art ist.)
Sei ferner eine bijektive Abbildung g : N → M gegeben, so ist die Abbildung f ◦g : N → M nur
injektiv, aber nicht surjektiv. Analog gibt es in diesem Fall auch eine injektive, nicht surjektive
Abbildung M → N , nämlich welche?
Wenn es also eine injektive, nicht surjektive Abbildung unendlicher Mengen ϕ : M → N gibt,
darfst Du dies nicht in dem Sinne interpretieren, als hätte M echt weniger Elemente als N .
Es gilt vielmehr folgender
Satz 4.6.3 (Cantor, Bernstein) Gibt es injektive Abbildungen g : M → N und
h : N → M , so gibt es auch eine bijektive Abbildung
f :M →N .
Beweis:
Wir dürfen nach Bemerkung 4.6.1 annehmen, M ∩ N = ∅.
Ist m ∈ M , so gibt es genau ein n ∈ N mit g(m) = n und höchstens ein n0 ∈ N mit h(n0 ) = m,
letzteres, da h injektiv ist. Das Analoge gilt für alle n ∈ N .
Wir betrachten ‘Stammlinien‘, d.h. ‘maximale Ketten’
· · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ n1 7→ · · ·
wobei die Abbildungen abwechselnd g, bzw. h sind. Die Eigenschaft ‘maximal’ soll bedeutet,
dass wir die Kette nur abbrechen, falls es nicht anders geht. Nach rechts bricht eine solche
Stammlinie nie ab, da jedes m ∈ M ein Bild unter g und jedes n ∈ N ein Bild unter h hat.
Auch nach links kann eine solche Stammlinie unendlich lang sein, sie kann aber auch mit einem
Element m ∈ M anfangen, wenn nämlich dieses m nicht im Bild von h liegt, oder sie kann mit
einem n ∈ N anfangen, wenn dieses n nicht im Bild von g liegt.
Jedes x ∈ M ∪ N liegt in einer Stammlinie. Wenn x in mehreren Stammlinien liegt, so stimmen
diese bis auf eine mögliche Indexverschiebung überein. In diesem Falle betrachten wir sie als
gleich! Jedes Element aus M ∪ N liegt dann in genau einer Stammlinie.
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 129
Hier eine Skizze der verschiedenen Arten von Stammlinien.
· · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ · · ·
m00 7→ n00 7→ m01 7→ n01 7→ m02 7→ · · ·
n000 7→ m001 7→ n001 7→ m002 7→ n002 7→ · · ·
(Ein x ∈ M ∪N kann in einer Stammlinie mehrfach vorkommen. Dann ist diese Stammlinie nach
beiden Seiten unendlich lang und das Vorkommen von x, sowie eines jeden anderen Elements
in dieser Stammlinie, periodisch.)
Jetzt definieren wir F : M → N wie folgt:
F (m) := g(m), wenn m in einer Stammlinie liegt, die entweder links keinen Anfang hat oder
links mit einem Element aus M anfängt.
Liegt aber m in einer Stammlinie, die links mit einem Element von N anfängt, so sei F (m) das
eindeutig bestimmte Urbild von m unter h (d.h. dasjenige n ∈ N , das h(n) = m erfüllt).
Innerhalb jeder Stammlinie bildet F die Menge der Elemente von M , die in dieser Stammlinie
liegen, bijektiv auf die Menge der Elemente von N in dieser Stammlinie ab.
Da jedes Element von M in einer und nur einer Stammlinie liegt, ist F eine Abbildung von M
nach N .
Da jedes Element von N in einer Stammlinie liegt, ist F surjektiv. Da aber jedes Element von
N nur in einer Stammlinie liegt ist F auch injektiv.
Folgerung 4.6.4 Je zwei beschränkte Intervalle sind gleichmächtig.
Beweis:
Seien a, b, c, d reelle Zahlen mit a < b und c < d. Sei I eines der Intervalle
[a, b], [a, b[, ]a, b], ]a, b[ und J eines der Intervalle [c, d], [c, d[, ]c, d], ]c, d[. Dann findet man leicht
eine Abbildung f : R → R der Form f (x) = px + q mit geeigneten p, q ∈ R, die I injektiv in J
abbilden. Etc.
Bemerkungen 4.6.5 Es gibt allerdings keine stetige bijektive Abbildung [0, 1] → [0, 1[, noch
eine solche [0, 1[→]0, 1[, noch eine solche [0, 1] →]0, 1[. Ebensowenig gibt es bijektive stetige
Abbildungen in jeweils umgekehrter Richtung. Ich verzichte auf einen Beweis, da wir den Begriff
der Stetigkeit zu wenig studiert haben.
Beachte, dass die Abbildungen tan : ] − π/2, π/2[→ R und tan : [0, π/2[→ R+ bijektiv und
stetig sind. Ihre Umkehrabbildungen sind ebenfalls stetig. Auch hier appelliere ich an Deine
Anschauung und verzichte auf einen strengen Beweis.
Frage: Welche ‘einfachere’ Funktion als der Tangens bildet das beschränkte Intervall ]0, 1]
bijektiv auf das unbeschränkte Intervall [1, ∞[ ab?
Antwort: x 7→ 1/x. Diese Funktion kehrt allerdings die Anordnung um.
Mit Hilfe der Folgerung sieht man auch, dass es eine bijektive Abbildung R∗+ → R gibt. Konkreter weiß man aber, dass der Logarithmus (zu einer beliebigen Basis 6= 1) eine stetige bijektive
Abbildung R∗+ → R ist, und dass eine Exponentialfunktion (zu einer beliebigen Basis 6= 1)s
eine stetige bijektive Abbildung in umgekehrter Richtung ist.
130
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Beispiele 4.6.6 a) Die Menge C0 aller 0-1-Folgen ist gleichmächtig zu R.
Beachte dabei, dass die Abbildung, die jeder 0-1-Folge (a0 , a1 , a2 , . . .) den Binärbruch
0, a0 a1 a2 . . . zuordnet nicht injektiv ist, da z.B. die Binärbrüche 0,01 und 0,1 dieselbe reelle
Zahl darstellen.
Also ordne etwa der 0-1-Folge (a0 , a1 , a2 , . . .) den Ternärbruch (oder, wenn es Dir lieber ist, den
Dezimalbruch oder . . . ) 0, a0 a1 a2 . . . zu. Diese Abbildung ist sicher injektiv.
Umgekehrt wird durch x 7→ 21 + π −1 arctan x eine bijektive Abbildung R →]0, 1[ definiert.
Schreibe dann jede Zahl aus ]0, 1[ als Binärbruch, wo z.B. solche, die auf lauter Einsen enden,
verboten sind. Ordne jedem Binärbruch, der dieser Einschränkung unterliegt, die Folge seiner
Nachkommastellen zu. Insgesamt erhältst Du eine injektive Abbildung R → C0 .
Der Satz von Cantor und Bernstein ergibt dann die Behauptung.
b) C0 und C02 := C0 × C0 sind gleichmächtig. Dasselbe gilt dann natürlich auch für R und R2 .
Denn die Abbildung
C0 → C02 , (an )n∈N 7→ ((a2n )n∈N , (a2n+1 )n∈N )
ist offensichtlich bijektiv.
Beachte: Da man reelle Zahlen nicht immer eindeutig als Dezimalbrüche (auch nicht als
Binäbrüche oder . . . ) darstellen kann, muss man für einen direkten Beweis der Gleichmächtigkeit etwa von [0, 1[ und [0, 1[×[0, 1[ eine gewisse Vorsicht walten lassen. Wenn man z.B. der
als Dezimalbruch geschriebenen rellen Zahl 0,1109 das Paar (0,1999 . . . , 0,100 . . .) zuordnete,
und das Entsprechende mit der Zahl 0, 120 machte, bekäme man dasselbe Paar reeller Zahlen
als Bild. Die Abbildung wäre nicht injektiv, da 0,1109 6= 0,120 ist.
Wie kann man sich da helfen, wenn man nicht den Cantor-Bernstein-‘Hammer’ verwenden will?
Nun, man verbiete zunächst (etwa) die Neunerperiode. Um ein Paar reeller Zahlen als Bild eines
Dezimalbruches (< 1) zu bekommen, verteilt man nicht die Dezimalstellen abwechselnd auf die
beiden Komponenten des Paares, sondern zerlegt zunächst die Folge der Nachkommastellen in
möglichst kurze Päckchen, deren Endziffer nicht die 9 ist, z.B.
0, 29987690999743915 . . . = 0, 2|998|7|6|90|9997|4|3|91|5| . . .
und verteilt nun diese ‘Päckchen’ abwechselnd auf zwei Dezimalbrüche. Als Bild obiger Zahl
erhält man das Paar
(0, 2 7 90 4 91 . . . , 0, 998 6 9997 3 5 . . .) .
Entsprechend bildet man die Umkehrabbildung. (Wieder einmal siehst Du, dass es oft mehrere
Beweise für ein und denselben Satz geben kann, deren jeder seine Verdienste haben kann.)
c) Du kannst nun leicht folgern, dass auch R und Rn für ganze n > 0 gleichmächtig sind.
d) Betrachte jetzt die Menge RN , womit ich das cartesische Produkt von abzählbar vielen
Faktoren R meine, also die Menge aller Folgen reeller Zahlen, die ich auch als Menge aller
Abbildungen N → R auffassen kann. Natürlich ist sie gleichmächtig zur Menge C0N . Könnte es
sein, dass auch diese Menge gleichmächtig zu R ist? Die Antwort ist: Ja.
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 131
Dies zu beweisen, hilft uns das Cauchy’sche Diagonal-Verfahren. Denn eine Folge von Elementen
aus C0 ist ja nichts anderes als eine Doppelfolge:
a00
a10
a20
a30
a40
a50
..
.
a01
a11
a21
a31
a41
a51
..
.
a02
a12
a22
a32
a42
a52
..
.
a03
a13
a23
a33
a43
a53
..
.
a04
a14
a24
a34
a44
a54
..
.
a05 · · ·
a15 · · ·
a25 · · ·
a35 · · ·
a45 · · ·
a55 · · ·
.. . .
.
.
mit aij ∈ {0, 1}. Jede Zeile ist eine 0-1-Folge und die Folge der Zeilen eine Folge von Elementen
aus C0 . Durch das Cauchy’sche Diagonalverfahren macht man aus jedem solchen Schema (jeder
Doppelfolge) eine 0-1-Folge und erhält damit eine Abbildung C0N → C0 . Dass es eine Umkehrabbildung gibt, siehst Du sicher leicht ein: Mache aus der 0-1-Folge (bn )n∈N die Doppelfolge
(aij )ij∈N×N durch a00 := b0 , a10 := b1 , a01 := b2 , a20 := b3 , a11 := b4 , a02 := b5 , a30 := b6 , usw.
e) Umgekehrt ist die Menge NR , womit ich die Menge aller Abbildungen R → N meine,
nicht mehr zu R gleichmächtig, da nicht einmal die Menge {0, 1}R es ist. Denn letztere ist
gleichmächtig zur Menge aller Teilmengen von R. Wie?
f) Die Menge S aller stetigen Abbildungen f : R → R ist gleichmächtig zu R. Den jede solche
Abbildung ist schon durch ihre ‘Einschränkung’ auf Q festgelegt. Mit der Einschränkung von
f auf meine ich die Abbildung f|Q : Q → R, definiert durch f|Q (x) = f (x) für alle x ∈ Q, d.h.
im Grunde die Abbildung f selbst, allerdings nur für rationale Argumente betrachtet. Und RQ
ist sicher gleichmächtig zu RN . Es gibt also injektive Abbildungen S → R und R → S (nämlich
welche?).
Bemerkung 4.6.7 Eine scheinbar naheliegende Frage ist, ob es eine Teilmenge M von R
gibt, die zwar nicht abzählbar, aber auch nicht gleichmächtig zu R ist. Cantor selbst hat
sich mit diesem sogenannten Kontinuumproblem vergeblich herumgeschlagen. Gödel hat
gezeigt, dass man eine genügend reichhaltige ‘mathematische Welt’ konstruieren kann, in der
diese Frage negativ zu beantworten ist. D.h. in dieser Welt ist jede Teilmenge von R entweder
abzählbar oder zu R gleichmächtig.
Es liegt nahe, diese Frage zu untersuchen, nachdem man die Mengenlehre axiomatisiert hat. Das
genannte Gödelsche Ergebnis benutzt eine solche Axiomatisierung und fügt ihr sozusagen ein
weiteres ‘Axiom’ hinzu, das die Möglichkeit, Mengen zu konstituieren soweit einschränkt, dass
es eine solche seltsame Teilmenge von R nicht gibt. Aber dies Einschränkung ist so schwach,
dass kein Satz der Mathematik, der bis dato bewiesen war, seine Gültigkeit verloren hätte.
Jahrzehnte später hat Cohen gezeigt, dass die klassischen Axiomensysteme der Mengenlehre
(ohne die Gödelsche Einschränkung) das Kontinuumproblem nicht zu entscheiden vermögen.
Er konnte im Rahmen der klassischen Axiomatik der Mengenlehre die Existenz solcher mathematischer Welten erzwingen, in der es Teilmengen von R gibt, die weder abzählbar noch zu R
gleichmächtig sind.
132
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Es gibt heute Mengentheoretiker, die meinen, ‘vernünftige Axiome’ angeben zu können, die
es gestatten, das Kontinuumproblem zu lösen. Meiner Meinung nach gehören manche ihrer
Argumente dafür, dass man gewisse Axiome für ganz besonders einsichtig halten sollte, eher
der Theologie als der Mathematik an. (Delahaye in Spektrum der Wissenschaft März 2009)
Das bedeutet natürlich nicht, dass ich es für unseriös hielte, die Auswirkung ‘neuer’ Axiome
der Mengenlehre auf das Kontinuumproblem zu studieren.
Ich glaube, dass das Kontinuumproblem ein Scheinproblem ist, geboren aus der etwas schwammigen Definition von R, etwa als Menge ‘aller’ Cauchyfolgen modulo Nullfolgen. Bei dieser
Definition bleibt letztlich offen, welche sprachlichen Mittel zur Konstruktion von Cauchyfolgen
man verwenden darf. Wenn man einfach sagt: alle“, verstrickt man sich in Widersprüche.
”
Man kann genügend viel Mathematik machen, ohne das Kontinuumproblem gelöst zu haben.
Dasselbe gilt auch, wenn man die Gödelsche Einschränkung akzeptiert. Diese Einschränkung
braucht man nicht als Glaubenssatz anzunehmen. Man kann sie ganz einfach als Beschränkung
desjenigen Mathematischen Kosmos betrachten, den man (gerade) untersuchen will.
4.7
Äquivalenzrelationen und Äquivalenzklassen
Bereits in dem 2. Kapitel hast Du die Ringe Z/(m) kennengelernt, deren Elemente man als Teilmengen von Z auffassen kann. Diese Teilmengen sind eng verknüpft mit der Kongruenzrelation
modulo m.
Ähnlich ist es mit der Einführung der rationalen Zahlen. Diese sind – formal gesehen – Paare
m m0
ganzer Zahlen (m, n) mit n 6= 0. Zwei Brüche , 0 nennt man genau dann einander gleich,
n n
m
wenn mn0 = m0 n gilt. Man kann die rationale Zahl
auch als Menge aller Zahlenpaare
n
(m0 , n0 mit mn0 = m0 n auffassen. (Manchmal unterscheidet man zwischen einem Bruch m
n
0
0
als Zahlenpaar und der rationalen Zahl, die durch jeden Bruch m
gegeben
ist,
der
m
n
=
0
n
mn0 erfüllt. Ich muss gestehen, diese feinsinnige Unterscheidung am Anfang des Buches nicht
gemacht zu haben.)
Auch bei der Einführung der reellen Zahlen durch Cauchy-Folgen betrachtet man zunächst
den Ring R aller Cauchyfolgen und darin die Menge N aller Nullfolgen. Cauchyfolgen (an ), (bn )
heißen zueinander äquivalent, wenn ihre Differenz (an )n − (bn )n := (an − bn )n eine Nullfolge ist.
Man schreibt hierfür auch (an )n ≡ (bn )n (mod N ). Die reellen Zahlen enstehen dann, indem
man äquivalente Cauchyfolgen als gleich betrachtet.
Wir wollen dieses Prinzip später noch mehrfach verwenden. Deshalb soll es in diesem Abschnitt
ganz allgemein betrachtet werden.
4.7.1 Eine Relation ∼ auf einer Menge M kommt gewissen Paaren (a, b) von Elementen aus
M zu. Beispiele sind ≤, >, |, ≡ (mod m) auf Z. Formal kannst Du eine Relation als
Teilmenge von M × M auffassen: {(a, b) ∈ M × M | a ∼ b}.
4.7. ÄQUIVALENZRELATIONEN UND ÄQUIVALENZKLASSEN
133
Definition 4.7.2 Sei M eine Menge. Eine Äquivalenzrelation auf M ist eine Relation ∼
mit folgenden Eigenschaften:
a ∼ a für alle a (Reflexivität)
a ∼ b ⇒ b ∼ a (Symmetrie)
a ∼ b, b ∼ c ⇒ a ∼ c (Transitivität).
Beispiele 4.7.3 Beispiele sind die Gleichheit, sowie die Kongruenz modulo einem festgewählten m. Ist f : M → N eine Abbildung, so ist die Relation a ∼ b auf M , definiert durch
f (a) = f (b) ebenfalls eine Äquivalenzrelation. Die Relation ‘<’ zum Beispiel ist keine Äquivalenzrelation.
Definition 4.7.4 Sei ∼ eine Äquivalenzrelation auf einer Menge M . Eine Äquivalenzklasse
bezüglich ∼ ist eine nichtleere Teilmenge C von M , mit folgenden Eigenschaften:
(i) Für beliebige a, b ∈ C gilt a ∼ b.
(ii) Gilt c ∼ a für ein c ∈ M und ein a ∈ C, so ist auch c ∈ C.
Beispiel 4.7.5 Die Äquivalenzklassen bezüglich der Äquivalenzrelation ≡ (mod m) sind die
Restklassen r + Zm.
Seien nämlich a, b ∈ r + Zm, etwa a = r + a0 m, b = r + b0 m, so ist a − b = (a0 − b0 )m durch m
teilbar. D.h. a ≡ b (mod m).
Sei ferner c = r + c0 m ∈ r + Zm und a ∈ Z, sowie a ≡ c (mod m). So ist a − c = a − r − c0 m
ein Vielfaches von m, etwa gleich dm, so ist a = r + c0 m + dm = r + (c0 + d)m ∈ r + Zm.
Für das Beispiel a ∼ b ⇐⇒ f (a) = f (b) aus (4.7.3) sind die Äquivalenzklassen die Urbildmengen f −1 ({y}) aller y ∈ im(f ).
Bemerkungen 4.7.6 Sei im Folgenden ∼ eine Äquivalenzrelation auf einer Menge M .
a) Seien C, D Äquivalenzklassen mit C ∩ D 6= ∅. Dann ist C = D.
Denn sei b ∈ C ∩ D. Für a ∈ C gilt a ∼ b gemäß Eigenschaft (i) der Definition 4.7.4. Gemäß
(ii) folgt daraus a ∈ D. Somit gilt C ⊂ D. Und D ⊂ C folgt aus Symmetriegründen.
b) Jedes Element a ∈ M liegt genau in einer Äquivalenzklasse bezüglich ∼. Mit anderen
Worten: M ist die Vereinigung aller Äquivalenzklassen bezüglich ∼. Und zwei verschiedene
Äquivalenzklassen bezüglich ∼ sind disjunkt, d.h. ihr Durchschnitt ist leer.
Die letzte Aussage haben wir unter a) gezeigt.
Sei jetzt a ∈ M . Ich behaupte: Die Menge Ca := {x ∈ M | x ∼ a} ist eine Äquivalenzklasse.
Wegen der Reflexivität gilt a ∈ Ca .
Sind x, y ∈ Ca , d.h. x ∼ a, y ∼ a, so sieht man mit Hilfe der Symmetrie und Transitivität,
dass x ∼ y gilt.
x ∼ a, y ∼ a ⇒ x ∼ a, a ∼ y ⇒ x ∼ y
134
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Gilt nun x ∼ b für x ∈ M, b ∈ Ca , so folgt wegen b ∼ a aus der Tansitivität, dass x ∼ a, also
x ∈ Ca gilt.
c) Aus Obigem ergibt sich: Ca = Cb ⇐⇒ a ∼ b
Definition 4.7.7 Die Menge der Äquivalenzklassen in M bezüglich der Äquivalenzrelation ∼
wird auch mit M/ ∼ bezeichnet.
Bemerkung 4.7.8 Wir haben die naheliegende kanonische Abbildung κ : M → M/ ∼,
die jedem a ∈ M die Äquivalenzklasse Ca , d.h. diejenige Äquivalenzklasse, deren Element a
ist, zuordnet. Die Abbildung κ ist surjektiv. (Beachte, dass Äquivalenzklassen per definitionem
nicht leer sind.)
4.7.9 Du kannst die Menge M/ ∼ auch auf andere Weise verstehen: M/ ∼ ist die Menge M ,
allerdings mit einer anderen Gleichheit, nämlich der Relation ∼.
Zum praktischen Umgang mit M/ ∼ ist häufig folgende Definition nützlich.
Definition 4.7.10 Ein Repräsentantensystem bezüglich ∼ ist eine Menge, die aus jeder
Äquivalenzklasse bzgl. ∼ genau ein Element besitzt.
Beispiele 4.7.11 a) Sei m > 0 eine natürliche Zahl. Dann ist die (endliche) Menge
{0, 1, . . . , m − 1} ein Repräsentantensystem bezüglich der Kongruenz modulo m. Die gilt
natürlich auch für jede Menge von m aufeinander folgenden ganzen Zahlen, etwa der Menge
{−(m − 1)/2, . . . , −1, 0, 1, . . . , (m − 1)/2}
wenn m ungerade ist. Auch die Menge {2, 3, . . . , m + 1} ist ein Repräsentantensystem, welches
aber wohl von geringem Nutzen ist.
b) Ist M die Menge aller Paare (m, n) ganzer Zahlen mit n 6= 0 und die Relation ∼ definiert
durch
(m, n) ∼ (m0 , n0 ) : ⇐⇒ mn0 = m0 n
so bilden die teilerfremden Paare (m, n) mit n > 0 ein Repräsentantensystem.
c) Auf der Menge der Geraden in der sogenannten euklidischen Ebene ist die Relation ‘g
parallel zu h’ eine Äquivalenzrelation. Ein Repräsentantensystem der zugehörigen Äquivalenzklassen besteht aus den Geraden, die durch einen festgewählten Punkt gehen.
4.8. BEINAHE EINE PARADOXIE
4.8
135
Beinahe eine Paradoxie
4.8.1 Ein Text ist eine Zahl. Denn man kann ja jeden Buchstaben, jede Ziffer, jedes Satzzeichen, die Leerstelle zwischen Wörtern eingeschlossen, durch eine zweistellige Dezimalzahl codieren. Der ganze Text wird dann durch die Zahl beschrieben, deren Dezimaldarstellung durch
die Aneinanderreihung der den Buchstaben und anderen Zeichen entsprechenden zweistelligen
Codes entsteht.
Das gilt natürlich auch für mathematische Texte. Jeder der (wie ich) das Schreibsystem TEX
kennt, weiß, wie man Formeln durch eine (sozusagen eindimensionale) Abfolge von Zeichen darstellen kann, auch wenn sie – wie etwa Brüche, Potenzen, Binomialkoeffizienten oder Matrizen
– traditionell ‘zweidimensional’ geschrieben werden.
Natürlich kann man statt des Dezimalsystems das Binärsystem verwenden, wo man natürlich
für zur Codierung der Buchstaben mehr als 2 Stellen benötigt.
(Ich habe einst den Ausdruck Gödelisierung für dieses Verfahren gelesen.)
Umgekehrt entspricht allerdings nicht jeder natürlichen Zahl, die im Dezimalsystem gerade viele
Stellen hat, ein sinnvoller Text.
Aber zwei verschiedenen Texten entsprechen verschiedene Zahlen.
4.8.2 Wir betrachten Abbildungen N → X, sogenannte zahlentheoretische Funktionen, wo
X eine beliebige Menge ist. In den meisten Fällen ist X ein Körper etwa X = R. Wir betrachten
hier speziell den Fall X = N. Natürlich kann man jede solche zahlentheoretische Funktion auch
als Folge (f (0), f (1), f (2), . . .) = (f (n))n∈N auffassen – und umgekehrt. Du weißt bereits, dass
es überabzählbar viele solche Folgen gibt, wenn X aus mindestens 2 Elementen besteht, was
für X = N sicher der Fall ist.
Ein Beispiel einer solchen Funktion ist: f (n) sei per Definitionem der kleinste Primfaktor von
n2 + 2.
Die Werte dieser Funktion kann man im Prinzip berechnen, da man etwa durch Probieren für
jedes n den kleinsten Primfaktor von n2 + 2 aufzuspüren vermag – mag dies auch unheimlich
lange dauern. Es gibt eine ‘Methode’, ein ‘Rezept’, den Wert f (n) für jedes n zu bestimmen.
Dasselbe gilt für die Funktion f mit f (0) = 1 und f (n) = pn , wo pn für n ≥ 1 die n-te Primzahl
bezeichnet.
In beiden genannten Fällen kann man die Funktion zwar nicht durch eine Formel beschreiben,
aber eben doch konkret angeben, wie man zu jedem gegebenen n den Wert f (n) bestimmt.
Es wird uns in diesem Abschied gelingen, eine Funktion zu finden, deren Werte man so nicht
bestimmen kann.
Definition 4.8.3 Eine Funktion f : N → N heißt berechenbar, wenn es eine Methode gibt,
die es erlaubt, zu jedem n ∈ N den Wert f (n) zu bestimmen.
136
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Diese Definition erscheint Dir womöglich etwas vage. In der Tat gibt man sich in der Logik große
Mühe, sie zu präzisieren. Ich glaube allerdings, dass Du prinzipiell verstehen wirst, worum es
geht.
Satz 4.8.4 Die Menge der berechenbaren Funktionen N → N ist abzählbar. Es gibt also Funktionen N → N, die nicht berechenbar sind, sogar überabzählbar viele.
Beweis: Zu jeder berechenbaren Funktion gibt es ein Rezept zur Bestimmung der Funktionswerte. Dieses Rezept ist ein endlicher Text. Zu verschiedenen berechenbaren Funktionen
gehören natürlich verschiedene Rezepte. Nicht wahr? (Es mögen zwar zwei Kuchen, die nach
demselben Rezept gebacken sind, verschieden schmecken. Aber zwei Zahlen, die man nach
demselben Rezept bestimmt hat, sind sicher gleich.)
Nach dem Beginn dieses Abschnittes entspricht jedem Text eine natürliche Zahl. Die Menge
aller möglichen Texte, erst recht die Menge aller Rezepte zur Bestimmung der Funktionswerte
von Funktionen N → N ist also gleichmächtig zu einer Teilmenge von N und deshalb abzählbar.
4.8.5 Seien f0 , f1 , f2 , . . . die berechenbaren Funktionen. (Auch die fn sind Texte, die ich als
natürliche Zahlen auffassen kann.) Betrachte die Funktion ϕ : N → N, definiert durch ϕ(n) :=
fn (n) + 1. Dann gilt ϕ(n) 6= fn (n) für jedes n ∈ N. Dann muss aber ϕ 6= fn sein, weil beide
Funktionen verschiedene Werte bei n haben.
Die Funktion ϕ gehört also nicht zu den berechenbaren Funktionen f0 , f1 , f2 , . . .. Das scheint
paradox. Denn wenn man fn (n) berechnen kann, dann doch wohl auch fn (n) + 1.
Gibt es einen Widerspruch in der Mathematik???
Die Auflösung dieses scheinbaren Widerspruchs ist die Folgende:
Die Funktion ϕ, die jeder natürlichen Zahl n die Funktion fn zuordnet, kann nicht
berechenbar sein! Denn ϕ ist die Verkettung dieser Zuordnung mit der Abbildung,
die jedem fn die Zahl fn (n) + 1 zuordnet. Und letztere Abbildung ist sicher berechenbar, da man fn (n) und damit auch fn (n) + 1 berechnen kann.
Satz 4.8.6 Die folgende Funktion ψ : N → N ist nicht berechenbar: Wenn die Zahl m einem
Text entspricht, der ein Rezept zur Berechnung einer berechenbaren Funktion N → N darstellt,
so sei ψ(m) = 1; in allen anderen Fällen sei ψ(m) = 0.
Beweis: Wenn ψ berechenbar wäre, könnte man die Zuordnung n 7→ fn folgendermaßen
herstellen.
Zunächst wird f0 bestimmt. Teste die Zahlen 0, 1, 2, . . . nacheinander mit der – nach Annahme
berechenbaren – Funktion ψ. Finde damit das kleinste m0 mit ψ(m0 ) = 1. Dieses m0 beschreibt
eine berechenbare Funktion; diese sei f0
4.8. BEINAHE EINE PARADOXIE
137
Seien f0 , f1 , . . . , fn−1 bereits bestimmt und mn−1 die zu fn−1 gehörige Zahl. Berechne dann
ψ(mn−1 + 1), ψ(mn−1 + 2, . . . bis Du auf die kleinste natürliche Zahl mn > mn−1 mit ψ(mn ) = 1
triffst. Dieses mn beschreibt also eine berechenbare Funktion fn .
Zusammen ergibt sich eine berechenbare Methode, jedem n ∈ N eine berchenbare Funktion fn
zuzuordnen. Man erreicht auf diese Weise auch alle berechenbaren Funktionen. Denn zu jeder
gehört ja eine natürliche Zahl m.
Da dies aber, wie oben gezeigt, nicht möglich ist, kann ψ nicht berechenbar sein.
138
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Kapitel 5
√
Was bedeutet π 2?
Sehr interessant und für Anwendungen wichtig ist die Potenzrechnung besonders dann,
wenn man nicht nur ganzzahlige Exponenten betrachtet.
In diesem kurzen Kapitel definieren wir Potenzen ax , wenn a eine positive und x eine beliebige
reelle Zahl ist. Zunächst betrachten wir den Fall, wo x rational ist. (Dabei wird sich nebenbei
ergeben, dass ab irrational sein kann, auch wenn a und b beide rational sind.)
Danach definieren wir ex für beliebige reelle x, wobei e die aus dem 1. Abschnitt des 3. Kapitels
bekannte Eulersche Zahl ist. Die Funktion ex wird wie die Zahl e durch eine Reihe definiert.
Um zu sehen, dass für rationale x die beiden Definitionen von ex zum selben Ergebnis führen,
benötigen wir das Cauchyprodukt von Reihen, welches wir im letzten Kapitel betrachtet haben. Wir definieren dann (für positive a) allgemein ax := ex ln a , wobei ln den natürlichen
Logarithmus bezeichnet, der durch eln a = a definiert ist.
5.1
Potenzen mit rationalen Exponenten
Beispiel: Man weiß etwa: Bei einer speziellen Bakterienkultur verdoppelt sich die Anzahl der
Bakterien alle 24 Stunden. Frage: Wieviele Bakterien hat man nach 8 Stunden?
Antwort: Nach 8 Stunden möge die Anzahl das x-fache der Ausgangszahl sein. Dann habe
ich nach 16 Stunden das x-fache des x-fachen der Ausgangszahl, also das x · x-fache der Ausgangszahl und schließlich nach 24 Stunden √
das x · x · x-fache der Ausgangszahl. Es gilt also
3
x = 2. Somit habe ich nach 8 Stunden das 3 2-fache der Ausgangszahl. Andererseits, da nach
n Tagen, die Anzahl der Bakterien das 2n - fache der Ausgangszahl beträgt, liegt es nahe, die
Zahl der Bakterien nach einem drittel Tag als das 21/3 -fache der Ausgangszahl zu betrachten,
also
√
1
3
2 3 = 2 zu definieren.
(Natürlich ist
√ die Anzahl n der zu Anfang vorhandenen Bakterien so groß, dass Du den Unterschied von 3 2 · n zur nächsten ganzen Zahl als unerheblich betrachten darfst.)
139
√
140
KAPITEL 5. WAS BEDEUTET π
2
?
5.1.1 Ist a ein Element eines Ringes, so kennst Du bereits Potenzen der Form an , wo n ∈ N
ist. Falls a ein von 0 verschiedenes Körperelement ist, so ist an sogar für beliebige ganze Zahlen
n sinnvoll und eindeutig definiert.
Du kennst auch folgende Regeln:
(∗)
am+n = am · an ,
(∗∗) amn = (am )n
Auf Grund der Kommutativität ab = ba hat man als dritte Regel
(∗ ∗ ∗)
(ab)n = an bn
5.1.2 Wie will man am/n definieren, wenn m, n ∈ Z, n > 0 ist? Wenn die Regel (∗∗) für n ∈ Z
weiter gelten soll, muss x := am/n die Gleichung xn = am erfüllen. Nun kann im Allgemeinen
die Gleichung xn = b mehrere Lösungen oder auch gar keine Lösung haben.
Im Körper R der reellen Zahlen gibt es für gerade n und negative b keine Lösung. Hingegen
gibt es 2 reelle Lösungen, wenn n gerade und b > 0 ist. Wenn n ungerade ist, gibt es immer
genau eine Lösung. (Im Körper Q der rationalen Zahlen gibt es auch für ein positives b eher
selten Lösungen! Später wirst Du sehen, dass die Gleichung xn = b im Bereich der komplexen
Zahlen immer Lösungen hat, und zwar für b 6= 0, sogar n Lösungen. )
In der Menge R+ der reellen Zahlen ≥ 0 gibt es glücklicherweise
zu jedem ganzen n > 0 und
√
n
n
b
bezeichnet.
(Wie gewohnt definiert man
jedem
b
genau
ein
c
mit
c
=
b.
Dieses
c
wird
mit
√
√
2
∗
m/n
b = b.) Für a √
∈ R+ , der Menge der reellen Zahle > 0, ist also a
∈ R∗ eindeutig definiert,
n
nämlich am/n := am . D.h. wenn man a > 0 voraussetzt und am/n > 0 fordert, hat man keine
Probleme. Es darf sogar m < 0 sein!
Du solltest Dir überlegen, dass für a, b ∈ R∗+ die Regeln (∗), (∗∗), (∗ ∗ ∗) auch für gebrochene
Exponenten aus Q gelten.
Nochmal: Sei a > 0. Dann ist für alle rationalen x die x-te Potenz von a, also ax durch die
Vorgabe ax > 0 eindeutig definiert.
Was soll man nun unter ax verstehen, wenn x reell, aber nicht mehr rational ist? Ein Praktiker
wird sagen: Sei x genügend genau durch die rationale Zahl (etwa den abbrechenden Dezimalbruch) r approximiert. Dann approximiert auch ar genügend genau die Potenz ax . (Das stimmt
zwar, sollte aber eigentlich bewiesen worden sein.)
Als Theoretiker möchte ich gerne ax für beliebige reelle, nicht nur für rationale Zahlen x präzise
definieren. Dazu wähle ich einen Umweg.
Warum macht man in der Mathematik – hier und in vielen anderen Fällen – gerne einen
Umweg? Die Antwort ist dieselbe wie im täglichen Leben. Es ist ja gar nicht so selten, dass
man auf einem Umweg schneller zum Ziel kommt als auf dem kürzesten Weg. Der direkte Weg
kann durch enge verkehrsreiche Straßen führen, ein Umweg über die Autobahn. Oder, auf dem
geraden Weg mag ein Sumpf liegen, den man durch einen Umweg vermeiden kann. Usw.
Der direkte Weg, ax für beliebige reelle x zu definieren, wäre der Folgende: Jede reelle Zahl
lässt sich ja beliebig durch rationale Zahlen approximieren. D.h. zu jedem x ∈ R gibt es eine
5.2. DIE EXPONENTIALFUNKTION
141
Folge (yn ) mit yn ∈ Q, so dass x = limn→∞ yn ist. Dann kann man definieren: ax := limn→∞ ayn .
Damit das funktioniert, bleibt allerdings folgendes zu zeigen:
1. Die Folge (ayn ) ist konvergent.
2. Wenn man (yn ) durch eine andere gegen x konvergente Folge ersetzt, kommt man zum
gleichen Ergebnis.
5.1.3 Jetzt stelle ich Dir die indirekte Methode zur Einführung allgemeiner Potenzen vor. Im
nächsten Abschnitt wird sie dann genauer ausgeführt.
∞
X
xn
Zunächst definiert man auf R eine Funktion ‘exp’ durch exp(x) :=
. Mit Hilfe des
n!
n=0
Cauchy-Produktes und des Binomialsatzes zeigt man das Additionstheorem exp(x + y) =
exp(x) exp(y). Nun setzt man e := exp(1), und zeigt mit Hilfe des Additionstheorems, dass
exp(x) = ex für alle rationalen x gilt. (Noch mal: exp(x) ist durch eine Reihe, ex als Wurzel
aus einer Potenz mit ganzem Exponenten definiert.)
Dann definiert man ex := (x) für alle reellen (später sogar für alle komplexen) x. Da exp auf R
stetig ist, und zwei stetige Funktionen auf R, die auf Q übereinstimmen, schon gleich sind, ist
diese Definition zwingend, wenn man die Stetigkeit der Funktion f (x) = ex haben möchte.
Um ax für allgemeine a > 0 zu definieren, machen wir dann noch folgende Betrachtungen.
Es gilt ex > 0 für alle reellen x. Die Funktion f (x) = ex ist stetig und streng monoton wachsend.
Letzteres heißt x > y =⇒ ex > ey“. Die Funktion ex wächst über alle Grenzen. Andererseits
”
ist 0 ihre untere Grenze, d.h. zu jedem (noch so kleinen) r > 0 gibt es ein x mit ex < r. Aus
all dem folgt mit Hilfe des Zwischenwertsatzes:
Zu jedem reellen x > 0 gibt es genau ein y mit ey = x. Dieses y nennt man den (natürlichen)
Logarithmus von x.
Er wird in diesem Buch mit ln x bezeichnet. Die Abbildung ln : R∗+ → R ist die Umkehrabbildung von exp : R → R∗+ , d.h. es ist exp(ln(y)) = y, ln(exp(x)) = x für alle x ∈ R, y ∈ R∗+ .
Ferner gilt ln(xy) = ln(x) + ln(y), was aus exp(x + y) = exp(x) exp(y) folgt.
Nachdem all dieses bedacht und getan ist, definiert man ax für positive a und beliebige reelle
x durch
ax := ex ln a .
Dann hängt auch ax stetig von x ab und stimmt für rationale x mit der üblichen Definition
überein. Weiterhin gilt, wie man leicht rechnet:
ax+y = ax ay ,
5.2
(ax )y = axy ,
(ab)x = ax bx .
Die Exponentialfunktion
Definition 5.2.1 Die unendliche Reihe
∞
X
xn
x
x2
x3
=1+ +
+
+ ···.
n!
1
1
·
2
1
·
2
·
3
k=0
√
142
KAPITEL 5. WAS BEDEUTET π
2
?
heißt die Exponentialreihe.
Satz 5.2.2 Die Eponentialreihe konvergiert für alle reellen x.
Beweis: Da es genügt, die absolute Konvergenz zu zeigen, können wir x ≥ 0 voraussetzen.
Sei N ganz mit N > Max{2, x + 1}. Es genügt, die Konvergenz der Reihe
R=
∞
∞
X
X
xn−N
xn
= xN
n!
n!
n=N
n=N
(wo die ersten N Glieder weggelassen sind) zu zeigen. Dazu reicht es, die Konvergenz von
∞
X
xn−N
n!
n=N
zu beweisen. Ein allgemeines Glied der letzgenannten Reihe lässt sich für n ≥ N + 2 wie folgt
als Produkt dreier Faktoren schreiben:
1
xn−N
1
·
·
n(n − 1) (n − 2) · · · N (N − 1) (N − 2)!
Der mittlere Faktor ist nicht größer als 1, da die (n−2)−(N −2) = n−N Faktoren seines Nenners
nach Wahl von N sämtlich ≥ x sind. Ebenso ist der dritte Faktor ≤ 1. Die Partialsummen der
bekanntermaßen konvergenten Reihe
∞
X
n=N
1
n(n − 1)
sind also größer oder gleich denen der Reihe R/xN . Also ist R konvergent und damit auch die
Exponentialreihe.
Definition 5.2.3 Für jedes x ∈ R definieren wir die Funktion
exp(x) :=
∞
X
xn
k=0
n!
d.h. als Wert der Exponentialreihe. Die so definierte Funktion exp : R → R heißt die Exponentialfunktion.
Die grundlegende Aussage über die Eponentialfunktion ist das Additionstheorem:
Theorem 5.2.4 exp(x + y) = exp(x) · exp(y)
5.2. DIE EXPONENTIALFUNKTION
143
Der folgende Beweis ist etwas tüftelig, da wir zeigen müssen, dass in unserem Spezialfall das
Cauchyprodukt der Exponentialreihen gegen das Produkt ihrer Werte konvergiert. Und das ist
ja leider nicht selbstverständlich. Beweis: Wir betrachten die beiden Reihen
∞
X
xi
i=0
i!
und
∞
X
yj
j=0
j!
Wenn man jedes Glied der ersten mit jedem Glied der zweiten Reihe multipliziert, kann man die
Produkte in einem unendlichen quadratischen Schema anordnen, wie es in (4.5.2) beschrieben
ist.
a0 b0 a0 b1 a0 b2 a0 b3 a0 b4 a0 b5 · · ·
a1 b 0 a1 b 1 a1 b 2 a1 b 3 a1 b 4 a1 b 5 · · ·
a2 b 0 a2 b 1 a2 b 2 a2 b 3 a2 b 4 a2 b 5 · · ·
a3 b 0 a3 b 1 a3 b 2 a3 b 3 a3 b 4 a3 b 5 · · ·
a4 b 0 a4 b 1 a4 b 2 a4 b 3 a4 b 4 a4 b 5 · · ·
a5 b0 a5 b1 a5 b2 a5 b3 a5 b4 a5 b5 · · ·
..
..
..
..
..
..
..
.
.
.
.
.
.
.
wobei ai = xi /i!, bj = y j /j! gesetzt ist.
Die Funktion en (x) sei als die n-te Partialsumme der Exponentialreihe definiert:
en (x) :=
n
X
xk
k=0
k!
Dann gilt (∗) exp(x) = limn→∞ en (x), also auch exp(x) · exp(y) = limn→∞ en (x)en (y)
Da nj = n!/((n − j)!j!) ist, können wir die Summe dn (x, y) über die n-te Cauchy-Diagonale
wie folgt berechnen:
n n
X
1 X n n−j j (x + y)n
xn−j y j
dn (x, y) :=
=
x y =
(n
−
j)!j!
n!
j
n!
j=0
j=0
Das bedeutet: Wenn wir die (unendliche) Summe über die Cauchy-Diagonalen dn (x, y) berechnen, erhalten wir
∞
∞
X
X
(x + y)n
dn (x, y) =
= exp(x + y) .
n!
n=0
n=0
Wenn wir also gezeigt haben, dass
lim en (x)en (y) =
n→∞
∞
X
dn (x, y)
n=0
gilt, dann haben wir das Theorem bewiesen!
Dafür wollen wir zunächst x, y ≥ 0 annehmen. Dann sind alle Einträge in unserem Schema ≥ 0
und Du erkennst
en (x)en (y) ≤
2n
X
k=0
dk (x, y) ≤ e2n (x)e2n (y) ≤ exp(x) exp(y) .
√
144
KAPITEL 5. WAS BEDEUTET π
2
?
(Wenn Du magst, kannst Du Dir dies mit folgendem Bild veranschaulichen, wo die verschiedenen
Kreissymbole •, ⊗ und ◦ für die Einträge ai bj = (xi /i!)(y j /j!) mit i, j ≤ 2n stehen. Dabei
betrachte ich den Fall n = 3 in der Hoffnung, der allgemeine Fall möge Dir dann klar sein.
0
•
•
•
•
•
•
•
•
•
•
•
•
⊗
⊗
⊗
⊗
⊗
⊗
◦
◦ ◦
n
•
•
•
•
◦
◦
◦
2n
⊗
⊗
⊗
⊗
⊗
⊗
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
Wenn wir die Einträge, die mit • bezeichnet sind, addieren, erhaltenPwir en (x)en (y). Addieren
wir die Einträge, die mit ⊗ bezeichnet sind, hinzu, so erhalten wir 2n
k=0 dk (x, y). Die Summe
aller Einträge summiert ergibt e2n (x)e2n (y).)
Da sowohl die Folge (en (x)en (y))n als auch die
Pn Folge (e2n (x)e2n (y))n gegen exp(x) exp(y)
konvergiert, muss die Folge der Teilsummen ( k=0 dk (x, y))n∈N gegen denselben Grenzwert
exp(x) exp(y) konvergieren, und wir haben das Theorem für nichtnegative x, y gezeigt.
Jetzt behandeln wir den allgemeinen Fall. Zunächst bemerke ich noch, dass für x, y ≥ 0 sich
aus obigem folgendes ergibt
!
2n
X
lim e2n (x) · e2n (y) −
dk (x, y) = 0
n→∞
k=0
P
Für beliebige x, y ∈ R ist die Differenz e2n (x) · e2n (y) − 2n
k=0 dk (x, y) gleich der Summe der
Terme
xi y j
mit i + j > 2n, i ≤ 2n, j ≤ 2n
i!j!
(d.h. der in obigem Bild mit ◦ bezeichneten Terme) und deshalb nach der Dreiecksungleichung
der Betrag dieser Summe kleiner oder gleich der Summe
|x|i |y|j
mit denselben Bedingungen an i, j
i!j!
Das lässt sich auch folgendermaßen ausdrücken
2n
2n
X
X
e
(x)e
(y)
−
d
(x,
y)
≤
e
(|x|)e
(|y|)
−
dk (|x|, |y|)
n
n
k
n
n
k=0
k=0
Da die rechte Seite mit wachsendem n gegen 0 geht, gilt dies erst recht für die linke Seite. Und
damit ist der Satz bewiesen.
Die Stetigkeit der Exponentialfunktion beweisen wir mit Hilfe des Additionstheorems.
5.2. DIE EXPONENTIALFUNKTION
145
Lemma 5.2.5 a) Für |x| < 1 gilt | exp(x) − 1 − x| ≤ x2 .
b) Die Exponentialfunktion ist in x0 = 0 stetig.
Beweis:
2
3
4
x
|x|2 |x|3 |x|4
x
x
a) | exp(x) − 1 − x| = +
+
+ · · · ≤
+
+
+ ···
2!
3!
4!
2!
3!
4!
1
|x| |x|2
1
1
1
2
2
=x
+
+
+ ··· ≤ x
+ + + · · · ≤ x2 (e − 2) ≤ x2 .
2!
3!
4!
2! 3! 4!
Die letzte Ungleichung folgt aus e < 3.
b) Wir müssen zeigen, dass limx→0 exp(x) = 1 ist. Nach a) und der Dreiecksungleichung ist
| exp(x) − 1| = | exp(x) − 1 − x + x| ≤ | exp(x) − 1 − x| + |x| ≤ |x| + x2 . Deshalb gilt 0 ≤
limx→0 | exp(x) − 1| ≤ limx→0 (|x| + x2 ) = 0.
Teil a) werden wir noch anwenden, wenn wir die Ableitung der Exponentialfunktion berechnen
wollen.
Erinnere Dich, dass der Wert exp(1) der Exponentialfunktion bei 1 mit e bezeichnet wird.
Trivialerweise ist exp(0) = 1.
Folgerung 5.2.6 Die Exponentialfunktion ist überall stetig.
Beweis: Für jedes x ∈ R haben wir limx0 →x exp(x0 ) = exp(x) zu zeigen. Dabei genügt es
natürlich, dies für |x0 − x| < 1 zu tun (d.h. nur Folgen (x0n ) mit |x0n − x| < 1 zu betrachten). Es
gilt hierfür nach Teil b) obigen Lemmas
lim | exp(x0 ) − exp(x)| = | exp(x)| · lim
| exp(x0 − x) − 1| = 0 .
0
x0 →x
x →x
Folgerung 5.2.7 a) Für natürliche Zahlen a gilt exp(a) = ea .
b) Selbiges stimmt auch noch, wenn a ∈ Z, also möglicherweise negativ ist.
c) Selbiges gilt auch für beliebige a ∈ Q.
d) exp(a) > 0 für alle x ∈ R. Genauer gilt exp(a) > 1 für a > 0 und 0 < exp(a) < 1 für a < 0
e) exp ist streng monoton wachsend. D.h. a < b ⇒ exp(a) < exp(b).
Beweis: a) exp(1+1+· · ·+1) = e·e · · · e. Wenn Du es für nötig hältst, verwende vollständige
Induktion.
b) exp(−a) exp(a) = exp(0) = 1. Für jede natürliche Zahl n ist also exp(−n) = 1/en .
√
c) exp(m/n)n = exp(n · (m/n)) = exp(m). D.h. exp(m/n) = n em .
P
n
n
d) Sei a > 0. Es ist exp(a) = 1 + ∞
n=1 a /n! und für n ≥ 1 ist a /n! ≥ 0. In diesem Fall ist
exp(a) > 1.
Sei a < 0. Dann ist exp(a) = exp(−a)−1 . Es folgt die Behauptung.
e) exp(b) = exp(a + (b − a)) = exp(b − a) exp(a). Da b − a > 0 ist, gilt exp(b − a) > 1. Daraus
folgt die Behauptung.
√
146
KAPITEL 5. WAS BEDEUTET π
2
?
Lemma 5.2.8 Seien I ein Intervall und f, g : I → R stetige Funktionen. Wenn die Einschränkungen von f und g auf I ∩ Q übereinstimmen, so stimmen f und g auf ganz I überein.
Die reellen Zahlen sind ja so definiert, dass jede solche ein Limes einer Folge rationaler Zahlen
ist. (Gehört die reelle Zahl x zu einem Intervall I, kann auch eine Folge rationaler Zahlen,
die gegen x konvergiert in diesem Intervall gewählt werden.) Wegen der Stetigkeit folgt die
Behauptung.
Aus Punkt c) obiger Folgerung und dem Lemma ergibt sich, dass die folgende Definition sinnvoll
ist.
Definition 5.2.9 Sei x ∈ R beliebig. Dann definieren wir ex := exp(x).
Natürlich wollen wir ax für möglichst allgemeine a definieren. Und das wird auch bald geschehen.
Allerdings ist die Bedingung a > 0 unumgänglich, wenn wir im Bereich der reellen Zahlen
bleiben wollen.
5.2.10 Da die Abbildung exp : R → R streng monoton steigend ist, ist sie injektiv. Was ist
das Bild dieser Abbildung? Wir wissen schon, dass exp(x) für jedes reelle x positiv ist. Ferner
wird exp(x) mit wachsendem x beliebig groß. Denn nach der Bernoulli’schen Ungleichung ist
exp(n) = en ≥ 1+n(e−1) für natürliche n. Entsprechend geht exp(x) (von oben) gegen 0, wenn
x gegen −∞ geht. Es ist ja e−x = 1/ex . Sei jetzt y eine beliebige positive reelle Zahl. Dann gibt
es ein reelles x0 mit ex0 ≤ y und ein reelles x1 mit ex1 ≥ y. Auf Grund des Zwischenwertsatzes
gibt es also ein x ∈ [x0 , x1 ] mit ex = y. Also ist das Bild von exp die Menge aller positiven reellen
Zahlen, d.h. R∗+ . Somit ist exp als Abbildung R → R∗+ bijektiv. Und wir können definieren:
Definitionen 5.2.11 a) Der natürliche Logarithmus ist die Umkehrabbildung der Exponentialfunktion, d.h. diejenige Abbildung ln : R∗+ → R mit ln ◦ exp = idR und exp ◦ ln = idR∗+ .
Man kann auch sagen, der natürliche Logarithmus von x(>=) ist dasjenige (eindeutig bestimmte) y, für welches ey = x ist.
b) Seien a, x ∈ R und a > 0, so sei ax := ex ln a definiert.
Nach Definition a) ist ja eln a = a, also ex ln a = ax zunächst für x ∈ N, dann für x ∈ Z und
schließlich für x ∈ Q. Dies rechtfertigt die Definition b).
Theorem 5.2.12 Seien a, b > 0 und x, y ∈ R. Dann gilt:
a) ax+y = ax · ay ,
b) axy = (ax )y ,
c) (ab)x = ax · bx
Beweise diese Regeln selbst. Nicht einmal im Traum darfst Du in diesen Regeln Plus
c
c
mit Mal verwechseln! Beachte auch, dass ab , welches nach Definition gleich a(b ) ist, meist
von (ab )c = abc verschieden ist.
5.2. DIE EXPONENTIALFUNKTION
147
Bemerkung 5.2.13 Der natürliche Logarithmus wird häufig auch mit ‘log’ bezeichnet, ganz
besonders in Büchern zur Zahlentheorie.
Definition 5.2.14 Seien a, x > 0. Der Logarithmus zur Basis a von x ist diejenige reelle Zahl
y für die ay = x ist. Er wird mit loga (x) bezeichnet.
Bemerkungen 5.2.15 a) Beachte, dass damit ln x = loge (x) ist.
b) Für a > 0 ist
loga (x) =
ln x
.
ln a
Denn nach Definition gilt
ln x
ln x
a ln a = eln(a) ln a = eln x = x .
c) Für a, b > 0 folgt aus b) unmittelbar
loga (x)
ln b
=
.
logb (x)
ln a
√
148
KAPITEL 5. WAS BEDEUTET π
2
?
Kapitel 6
Geometrie
6.1
Vorbemerkungen
Ohne Zweifel haben für die meisten Menschen die geometrischen Begriffe, wie Punkt, Gerade, Dreieck usw. eine anschauliche Bedeutung. Und seit mindestens zweieinhalb tausend
Jahren geht man damit auch mathematisch um. D.h. man beweist geometrische Aussagen, etwa
dass die Winkelsumme in jedem Dreieck 180◦ sei, indem man diese Aussage auf eine anschaulich naheliegende (vielleicht sogar selbstverständliche?) Aussage über die Größe der Winkel
zurückführt, in denen eine Gerade zwei parallele Geraden schneidet.
α
α’
g
g’
Hier ist g parallel zu g 0 genau dann, wenn α = α0 gilt.
Dabei heißen zwei Geraden in einer Ebene genau dann zueinander parallel, wenn sie entweder
übereinstimmen oder keinen Punkt gemeinsam haben. Zwei Geraden im Raum heißen zueinander parallel, wenn sie in einer gemeinsamen Ebene liegen und in dieser parallel sind. Die
Aussage, die unter der obigen Zeichnung steht, ist mehr oder weniger das berühmte (oder
berüchtigte) Parallelenaxiom Euklids, welches von allen seinen Axiomen und Postulaten
am wenigsten selbstverständlich erscheint.
Aus diesem Axiom folgt, dass die Winkelsumme im Dreieck 180◦ beträgt:
149
150
KAPITEL 6. GEOMETRIE
α’
β’
γ
α
β
Wähle g 0 parallel zu g. Dann ist α = α0 und β = β 0 . Daraus ergibt sich α + γ + β = 180◦
6.1.1 In der euklidischen Geometrie gibt es neben dem Begriff der Kongruenz von Dreiecken
(und anderen Figuren) auch den Begriff der Ähnlichkeit. Z.B. sind in der folgenden Zeichnung
die Dreiecke A0 B 0 C 0 und AB 00 C 00 zueinander kongruent, sowie beide ähnlich zu dem Dreieck
ABC. (Die Längen der Seiten A0 B 0 und AB 00 sind zueinander gleich. Die Seiten B 00 C 00 und BC
sind zueinander parallel. Ferner sind die Längenverhältnisse der Seiten AB zu A0 B 0 , BC zu
B 0 C 0 und CA zu C 0 A0 einander gleich.
C
γ
A’
α
C’
C’’
γ
γ
β
B’
A
α
β
B’’
β
B
Die Ähnlichkeit zweier Dreiecke kann man auf zweierlei äquivalente Weisen definieren: Einerseits durch die Gleichheit der Längenverhältnisse der Seiten, andererseits durch die Gleichheit
entsprechender Winkel.
1) a : a0 = b : b0 = c : c0 oder äquivalent dazu a : b = a0 : b0 , a : c = a0 : c0
2) α = α0 , β = β 0 , weswegen natürlich auch γ = γ 0 ist.
Für Vierecke stimmt dies nicht mehr. Meist sind zwei Rechtecke trotz der Gleichheit entsprechender Winkel einander nicht ähnlich. Entsprechendes gilt für zwei Rauten, d.h. Vierecken
mit 4 gleichlangen Seiten. Hier sind die Verhältnisse entsprechender Seitenlänge gleich, aber
die entsprechenden Winkel meist nicht. Ein Quadrat ist sowohl ein Rechteck wie eine Raute,
aber zu den meisten Rechtecken und Rauten nicht ähnlich.
6.1. VORBEMERKUNGEN
151
Die Ähnlichkeit zweier n-Ecke kann man dadurch definieren, dass man sowohl die Gleichheit
der Winkel, als auch die der Verhältnisse entsprechender Seitenlängen fordert.
6.1.2 Seien zwei Kreise K1 , K2 mit den Radien r1 bzw r2 und ein Winkel α gegeben. (Dabei sei
α zwischen 0 und 180◦ gewählt.) Aus beiden Kreisen schneide einen Sektor heraus der zu dem
(gemeinsamen) Winkel α gehört. Dann verhalten sich die Längen l1 und l2 der ausgeschnittenen
Teile der Kreislinien zueinander wie r1 zu r2 .
ℓ1
α
ℓ2
α
γ1
γ2
(Versehentlich sind in der Zeichnung die Radien r1 , r2 mit γ1 , γ2 bezeichnet worden.) Dies kann
man sich, wie folgt, anschaulich klar machen. Zerlege den Winkel α in n Teilwinkel: α =
α1 + · · · αn . Daraus ergeben sich den beiden Kreislinienstücken einbeschriebene Streckenzüge
wie in folgendem Bild:
T14
α4
α3
α2
M1
γ1
α1
T13
T12
T11
T10
α4
α3
M2
α2
γ2
α1
T24
T23
T22
T21
T20
152
KAPITEL 6. GEOMETRIE
Dann sind je zwei Dreiecke, deren Ecken der Mittelpunkt des jeweiligen Kreises und analoge benachbarte Eckpunkte des approximierenden Streckenzuges sind, einander ähnlich. (Das Dreieck
M1 T1i T1,i+1 ist ähnlich zum Dreieck M2 T2i T2,i+1 .)
Die Längen der Streckenzüge verhalten sich deshalb wie r1 zu r2 .
Die Länge einer Kurve kann man gut als Limes der Längen einbeschriebener Streckenzüge
definieren, wenn man die Längen der einzelnen Strecken gegen 0 gehen lässt. Es ergibt sich die
obige Behauptung.
6.1.3 Bemerkung zur Winkelmessung. Vorläufig betrachten wir Winkel zwischen Strahlen (d.h. Halbgeraden) mit dem gleichen Anfangspunkt mit Werten im Intervall [0◦ , 180◦ ]. Die
Wahl des Grades ◦ , derart der rechte Winkel ein solcher von 90◦ ist, ist natürlich willkürlich,
hat aber den Vorteil, dass ein Innenwinkel eines regelmäßigen n-ecks (genau) dann ganzzahlig
in Bezug auf den Grad ist, wenn n einer der vielen Teiler von 360 = 23 · 32 · 5 ist.
Mehr und mehr werden wir Winkel auch in ‘Radiant’ angeben, d.h. als Bogenlänge des (kleineren) Teiles der Einheitskreislinie um den gemeinsamen Anfangspunktes der beiden Strahlen,
den dieselben ausschneiden. Per definitionem ist der Einheitskreis der Kreis, dessen Radius
gleich einer Längeneinheit ist. Wegen Absatz 6.1.2 ist dieses Winkelmaß unabhängig von der
Wahl der Längeneinheit.
α
1
Winkel als Länge eines Kreisbogens
6.1.4 Gauss war sich, wie einige seiner Zeitgenossen, darüber im Klaren, dass man auch eine
Geometrie entwickeln kann, in der Euklids Parallelenaxiom ungültig ist. Wenn man Lichtstrahlen (im Vakuum) als gerade ansieht, ist die Geometrie – wie die Physiker heute wissen
– nicht euklidisch. Manche Philosophen erheben gegenüber dieser Sicht der meisten heutigen
Physiker den Einwand, dass man, bevor man überhaupt messen kann, wissen muss, was dieses Messen bedeutet. (Wie kann man z.B. definieren, dass zwei Punkte auf einem Planeten
in einer entfernten Galaxie einen Abstand von 1 km haben?) Dies scheint sehr schwierig zu
sein, wenn man nicht von der euklidischen Geometrie ausgeht, die zudem für alle Menschen die
anschaulichste ist.
6.2. KOORDINATEN
153
Mathematikerinnen und Mathematiker möchten sich in der Regel aus solcherlei Diskussionen
heraushalten. Sie legen durch Axiome fest, von welcher Geometrie sie gerade sprechen. Ich will
in diesem Buch nur von der aus dem Schulunterricht bekannten euklidischen Geometrie
handeln, in der Euklids Parallelenaxiom gilt.
In diesem Buch ist zu wenig Platz für eine strenge moderne Einführung in die Geometrie, sei
sie axiomatisch [Hilbert] oder nicht [Lorenzen].
Mein eigentliches Anliegen ist weniger, Dir die klassische Geometrie – wie sie schon zum großen
Teil in Euklids berühmten Elementen“ steht – nahezubringen, sondern insbesondere ihren
”
Zusammenhang mit der Linearen Algebra, dem Skalarprodukt und den Kreisfunktionen (Sinus, Cosinus) zu erklären. Drei klassisch-geometrische Sätze über Dreiecke, die erst nach 1700
gefunden wurden, will ich Dir aber nicht vorenthalten.
6.2
Koordinaten
6.2.1 Eine Gerade kann man als Zahlengerade auffassen, d.h. mit der Menge der reellen Zahlen
identifizieren. Dies ist natürlich auf viele verschiedene Weise möglich. Aber sobald man einen
Punkt als Nullpunkt und einen anderen als Einspunkt festglegt hat, ist diese Identifizierung
eindeutig. (Natürlich verlangt man dabei, dass z.B. die Punkte 1 und 2 denselben Abstand
haben, wie die Punkte 0 und 1 und dass der Punkt 1 zwischen den Punkten 0 und 2 liegt, usw.,
usw. – alles wie Du es gewohnt bist. Es gibt ja auch sogenannte logarithmische Skalen, wo man
sich die positiven Zahlen so auf einer Geraden vorstellt, dass die Abstände von 1 und 2, von
2 und 4, von 4 und 8, sowie von 12 und 1 usw. alle einander gleich sind. Diese lassen wir hier
außer Betracht.)
–π
–3
2
–2
–1
0
1
2
3
Eine Gerade in der (einer) Ebene oder im Raum, die ich auf solche Weise mit der R identifiziert
habe, will ich eine Zahlengerade nennen.
6.2.2 So wie man eine Gerade mit R identifizieren kann, kann man eine Ebene mit R2 , der
Menge aller Paare reeller Zahlen, identifizieren. Wie Du sicher weißt, muss man dazu ein Koordinatensystem in die Ebene legen. Dieses besteht aus zwei Zahlengeraden, die genau einen
gemeinsamen Punkt haben, der auf beiden Zahlengeraden der Nullpunkt ist.
154
KAPITEL 6. GEOMETRIE
(3,3)
(0,1)
(–1,0)
(1,0)
(0,1)
(3,0)
(–2,0)
(2,1)
O (1,0) (2,0)
(0,–1)
(0,–3)
Im ersten Bild habe ich die Koordinatenachsen senkrecht (orthogonal) zueinander und zudem die beiden Einspunkte auf den Koordinatenachsen so gewählt, dass ihre Abstände vom
gemeinsamen Nullpunkt, dem (Koordinaten)-Ursprung gleichgroß sind. Ein solches Koordinatensystem wird auch ein orthonormales Koordinatensystem genannt. Dabei wird meist
noch verlangt, dass die Abstände der Einspunkte vom Ursprung gleich einer gegebenen Einheitslänge sind.
Eine allgemeinere Art eines Koordinatensystems wird im zweite Bild angedeutet. In der Regel
verwende ich orthonormale Koordinatensysteme.
6.2.3 Man kann so weiter machen und den Raum mit dem R3 identifizieren, indem man ein
Koordinatensystem mit drei Achsen wählt, die sich in einem gemeinsamen Punkt schneiden,
aber nicht in einer gemeinsamen Ebene liegen.
In diesem Buch will ich mich auf die Geometrie der Ebene konzentrieren.
Neben der Geometrie im Raum und der in der Ebene gibt es auch eine etwas magere Geometrie
in der Geraden. Eine Zahlengerade ist sozusagen eine Gerade mit einem Koordinatensystem,
bestehend aus einer Koordinatenachse. Jeder Punkt hat dort eine einzige Koordinate.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
6.3
155
Geometrische und algebraische Vektoren
Definitionen 6.3.1 a) Ein Pfeil ist eine gerichtete Strecke in (der Geraden,) der Ebene
oder im Raum. Eine gerichtete Strecke ist eine Strecke, deren Endpunkte man nicht als gleichberechtigt ansieht, sondern einen als Anfangspunkt, den anderer als Endpunkt bezeichnet.
Wenn man will, kann man einen Pfeil als Paar dieser Punkte definieren. Pfeile der Länge 0,
also Punktepaare der Form (a, a) wollen wir nicht ausschließen!
b) Pfeile (a, b), (a0 , b0 ) heißen zueinander parallel verschoben, wenn entweder (a, b) = (a0 , b0 ) ist
oder
sowohl 1. die Gerade durch a, b zur Geraden durch a0 , b0 parallel ist und die Strecke von a nach
b gleichlang der von a0 nach b0 ist,
als auch 2. dasselbe für die Paare (a, a0 ) und (b, b0 ) gilt. (Achtung: Ich habe hier mit a, b, . . .
Punkte und nicht Zahlen bezeichnet.)
Beispiele:
b
b’
a
a’
oder
a
b
a’
b’
Die Punkte a, b, b0 , a0 bilden also ein Parallelogramm, das allerdings auch ausgeartet sein, d.h.
ganz in einer Geraden liegen kann. (Bei Pfeilen innerhalb einer Geraden ist es immer ausgeartet!)
Nur im nichtausgearteten Fall kann man in 1. und 2. auf die Gleichheit der Längen verzichten.
(Insbesondere sind ie Pfeile der Länge 0, also Punktepaare der Form (a, a) zueinander parallel
verschoben!) Die o.a. Bedingung 2. kann man auch wie folgt verstehen: ‘(a, b) und (a0 , b0 ) gehen
in die gleiche Richtung’.
m m0
, 0 einander gleich nennt, wenn mn0 = m0 n gilt, so nennt man
n
n
zwei Pfeile (a, b), (a0 , b0 ) den gleichen Vektor, wenn sie zueinander parallelverschoben sind.
c) So wie man zwei Brüche
d) Ein Vektor ist also eine Äquivalenzklasse von Pfeilen bezüglich der Äquivalenzrelation ‘parallelverschoben’.
156
KAPITEL 6. GEOMETRIE
6.3.2 a) Sei ein Ursprungspunkt O in der Ebene oder im Raum festgelegt.
Jeder Pfeil in der Ebene ist parallelverschoben zu genau einem solchen, dessen Anfangspunkt
O ist. (Du darfst Dir bei dem Buchstaben O die Null denken, aber auch den ersten Buchstaben
des lateinischen Wortes ’origo’, auf deutsch ’Ursprung’.)
b) Die Menge der Pfeile von O aus bilden ein Repräsentantensystem für die Menge der Vektoren,
d.h. der Äquivalenzklassen von Pfeilen. Die Menge aller geometrischen Vektoren steht also
in bijektiver Beziehung zu der Menge der Pfeile von O aus, d.h.mit Anfangspunkt O. Somit
wollen wir je nach Nützlichkeit unter einem (geometrischen) Vektor mal eine Äquivalenzklasse
von Pfeilen bezüglich der Relation parallelverschoben“, mal einen Pfeil von O aus verstehen.
”
Letztere Möglichkeit setzt allerdings voraus, dass vorher ein Ursprungspunkt O festgelegt ist.
c) Wenn man einen Ursprungspunkt O festgelegt hat, entsprechen den Pfeilen von O aus, also
den geometrischen Vektoren, in bijektiver Weise die Punkte (der Geraden), der Ebene (bzw.
des Raumes). Es entspricht nämlich jedem Punkt a der Pfeil (O, a) und jedem Pfeil (O, a)
der Punkt a. Allerdings heißt das nicht, dass Punkte und Vektoren im Grunde dasselbe sind.
Es hat ja keinen geometrischen Sinn, zwei Punkte zu addieren oder einen Punkt mit einer
reellen Zahl zu multiplizieren, während das für Vektoren sinnvoll ist. Siehe unten! Vor Allem ist
die Entsprechung von Punkten und Vektoren davon abhängig, welchen Ursprungspunkt man
gewählt hat.
6.3.3 Algebraische Vektoren. Bereits oben, nach der Einführung des cartesischen Produktes, haben wir von der Menge Rn der n-tupel reeeller Zahlen gesprochen, also von
1-tupel (a1 )
2-tupel (Paar) (a1 , a2 )
3-tupel (Tripel) (a1 , a2 , a3 )
4-tupel (Quadrupel) (a1 , a2 , a3 , a4 )
..
.
allgemein n-tupel (a1 , . . . , an ) mit ai ∈ R.
Nichts hindert uns allerdings daran, die ai als Elemente eines beliebigen gemeinsamen Körpers
zu wählen. (Hier ist der Name ‘Körper’ im algebraischen Sinne gemeint, also als Rechenbereich.)
Sie noch allgemeiner als Elemente eines beliebigen Ringes zu wählen, ist auch nützlich. Aber
soweit will ich in diesem Buch nicht gehen.
Wenn man die Gerade, die Ebene, den Raum mit einem Koordinatensystem versehen hat wird
jeder Punkt der Geraden, der Ebene, des Raumes durch ein Element des Rn mit n = 1, bzw.
n = 2, bzw. n = 3 beschrieben. Da jeder Punkt nach Wahl eines Koordinatensystems (bereits
nach Wahl des Ursprungs) einem Vektor entspricht, entspricht auch jeder Vektor einem Element
aus Rn (n = 1, 2, 3).
Man hat also (nach Wahl eines Koordinatensystems) im 1-, bzw. 2-, bzw. 3-dimensionalen
Raum (=Gerade, bzw. Ebene, bzw. Raum) folgende bijektive Beziehungen:
Punkte ↔ Vektoren ↔ n-tupel (n = 1, 2, 3)
Man bezeichnet deshalb auch n-tupel reeller Zahlen als Vektoren. Dasselbe gilt für die Elemente
eines K n , wo K ein beliebiger Körper ist. Ich möchte in diesen Fällen von algebraischen
Vektoren reden.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
157
6.3.4 Geometrische Vektoren kann man addieren. Seien v, w Vektoren und v durch die gerichtete Strecke (a, b) repräsentiert. Dann kann man w durch eine gerichtete Strecke repräsentieren,
deren Anfangspunkt b ist. Sei also w durch (b, c) gegeben. Dann definiert man v + w durch die
gerichtete Strecke (a, c). Will man die entsprechende Summe im Bereich der Pfeile mit Anfangspunkt O definieren, muss man in der Regel ein Parallelogramm konstruieren. (Denke an
das ‘Parallelogramm der Kräfte’.)
v+w
w
v
Man kann auch einen geometrischen Vektor v mit einer reellen Zahl λ multiplizieren, indem man
ihn entsprechend verlängert oder schrumpft, und, falls λ < 0 ist, noch die Richtung umkehrt“.
”
Eine geometrische Konstruktion ergibt sich für v 6= 0 wie folgt: Repräsentiere v durch die gerichtete Strecke (O, b). Wähle eine Zahlengerade Z so, dass ihr Nullpunkt mit O zusammenfällt,
der Punkt b, der ja nach Voraussetzung nicht mit O zusammenfällt aber nicht auf ihr liegt.
Ziehe die Gerade durch 1 und b und die Parallele zu dieser durch den Punkt λ auf der Zahlengeraden. Diese Parallele schneidet die Gerade durch 0 und b in einem Punkt c, Der Vektor λv
wird dann durch den Pfeil (0, c) gegeben. (Denke an den Strahlensatz.) Ist b = O, d.h. v der
Nullvektor, so ist auch λv der Nullvektor.
λ
1
O
λ∙(O,b) = (O,c)
b
c
6.3.5 Orthogonalprojektion. Sei in der Ebene (bzw. im Raum) R eine Zahlengerade G
gegeben. Dann kann man die Ebene (bzw. den Raum), aufgefasst als Menge ihrer (seiner)
Punkte, auf die Gerade G orthogonal projizieren.
a
O
p(a)
158
KAPITEL 6. GEOMETRIE
Die Orthogonalprojektion auf G ist also eine Abbildung p : R → G, wo R die Ebene
(bzw. den Raum) bezeichnet. Und zwar ist p(a) der eindeutig bestimmte Punkt auf G, dessen
Verbindungsgerade mit a auf G senkrecht steht. (Für a ∈ G gilt p(a) = a.)
Für Pfeile und Vektoren in der Ebene (bzw. im Raum) gelten folgende beiden Sätze:
Satz 6.3.6 Seien a, b, a0 , b ∈ R so dass (a, b) parallel verschoben zu (a0 , b0 ) ist, so ist p(b) −
p(a) = p(b0 ) − p(a0 ).
a
O
v
p(a)
b
v
a’
p(b)
p(a’)
b’
p(b’)
Dieser Satz bedeutet, dass durch die Abbildung p auch eine Abbildung p0 : V → W definiert
ist! Dabei bezeichnet V die Menge der Vektoren in der Ebene (bzw. im Raum) sowie W die
Menge der Vektoren in der Geraden G. Mit den genannten Bezeichnungen haben wir
Satz 6.3.7 Seien λ ∈ R, v, v 0 ∈ V . Dann ist p0 (v + v 0 ) = p0 (v) + p0 (v 0 ) und p0 (λv) = λp0 (v).
λv
v
p’(v)
p’(λv)
v
w
p’(v)
p’(w)
p’(v+w)
Definitionen 6.3.8 Sei K ein Körper, n ≥ 1 eine natürliche Zahl.
a) Man kann je zwei Elemente aus K n addieren:
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
(Die i-te Komponente der Summe ist gleich der Summe der i-ten Komponenten der Summanden, und zwar für jedes ganze i mit 1 ≤ i ≤ n.)
b) Ist λ ∈ K, so definiert man
λ(a1 , . . . , an ) := (λa1 , . . . , λan ) .
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
159
6.3.9 Wir legen (für n = 1, 2, 3 in den n-dimensionalen Raum R ein orthonormales Koordinatensystem und betrachten einen geometrischen Vektor als Pfeil von O aus und nennen die
Koordinaten seines Endpunktes die Koordinaten des Vektors. Die Koordinaten eines Vektors
sind nun einfach die Projektionen seines Endpunktes auf die Koordinatenachsen. Deshalb folgt
aus Satz 6.3.7 die Erkenntnis, dass die bijektive Beziehung zwischen den geometrischen Vektoren von R und den algebraischen Vektoren aus dem R1 , R2 , bzw. R3 mit der Addition und auch
mit der Multiplikation mit Skalaren verträglich ist. D.h. Wenn (für n = 1, 2, 3) den Vektoren
v, w die n-tupel (a1 , . . . , an ), bzw. (b1 , . . . , bn ) entsprechen, so entspricht dem geometrischen
Vektor v + w das n-tupel (a1 + b1 , . . . , an + bn ) und dem geometrischen Vektor λv das n-tupel
(λa1 , . . . , λan ).
Satz 6.3.10 Seien v, v1 , v2 , v3 entweder geometrische Vektoren in der Ebene (dem Raum) oder
Elemente eines K n (mit einem Körper K); seien ferner λ, µ ∈ K. (Im Falle geometrischer
Vektoren sei K = R.) Dann gilt
a) v1 + v2 = v2 + v1 ,
b) (v1 + v2 ) + v3 = v1 + (v2 + v3 )
c) es gibt genau einen geometrischen Vektor, bzw. ein n-tupel o mit v + o = v; Bezeichnungen:
neutrales Element, Nullvektor
d) zu jedem v gibt es genau ein −v mit (−v) + v = o. Man nennt −v das additiv Inverse von
v.
e) 1v = v
f ) (λµ)v = λ(µv)
g) (λ + µ)v = λv + µv
h) λ(v1 + v2 ) = λv1 + λv2
Beweis: Der Fall algebraischer Vektoren ist nahezu trivial! Der Fall geometrischer Vektoren
ergibt sich hieraus mit Hilfe des Abschnittes 6.3.9.
Noch einmal: Du solltest Dir darüber im Klaren sein, dass geometrische Vektoren in der Ebene
(im Raum) und Elemente des R2 (bzw. R3 ) doch nicht so ganz dasselbe sind. Man muss zunächst
Koordinatensystem festlegen, bevor man die oben angegebene bijektive Beziehung angeben
kann.
Definition 6.3.11 Sei K ein Körper (im algebraischen Sinn). Ein K-Vektorraum ist eine
Menge V zusammen mit zwei Verknüpfungen, einer Addition ‘+’ innerhalb V und einer Multiplikation ‘(λ, v) 7→ λv’, wo λ ∈ K, v ∈ V und λv ∈ V ist, derart dass die im Satz 6.3.10
genannten Rechenregeln a) bis h) gelten. (Zu λ ∈ K, v, w ∈ V sind v + w ∈ V und λv ∈ V
definiert.)
160
KAPITEL 6. GEOMETRIE
Beispiele 6.3.12 a) Beispiele von R-Vektorräumen sind die Mengen der geometrischen Vektoren in der Geraden, in der Ebene, im Raum.
b) Jeder K n ist, wie oben beschrieben, ein K-Vektorraum.
c) Es gibt K-Vektorräume, die echt von allen K n verschieden, d.h. zu keinem K n isomorf sind.
(Den Begriff isomorf“ wirst Du bald kennenlernen.) Zum Beispiel bilden die (unendlichen)
”
Folgen von Elementen aus K einen Vektorraum, der in gewissem Sinne zu groß ist, um mit
einem K n verglichen zu werden.
d) Den Körper R kann man als Q-Vektorraum auffassen, indem man von allen in R möglichen
Multiplikationen nur diejenigen betrachtet, wo der erste Faktor aus Q ist. Auch dieser Vektorraum ist zu keinem Qn mit n ∈ N isomorf. Wir wissen ja, dass Qn (für n ∈ N) im Gegensatz
zu R abzählbar ist.
e) Sind K, L Körper mit K ⊂ L, und sind die Verknüpfungen in K dieselben wie in L, d.h.
Einschränkungen der letzteren, so nennt man K einen Teilkörper (auch Unterkörper) von
L und L einen Erweiterungskörper (auch Oberkörper) von K.
Immer wenn L ein Erweiterungskörper von K ist, kann man L auch als K-Vektorraum auffassen.
Ist L ein endlicher Körper (d.h. ein solcher, der nur endlich viele Elemente hat), so kann man
folgendes zeigen:
Es gibt eine Primzahl p und einen Unterkörper K von L, der isomorf zu Z/(p) ist. Da L
ein Erweiterungskörper von K ist, ist L als K-Vektorraum isomorf zu K n mit einer positiven
ganzen Zahl n, hat also pn Elemente. Ferner gibt es zu jeder Primzahlpotenz pn , wo n ≥ 1 ganz
ist, einen Körper aus pn Elementen.
Es gibt also keinen Körper von 6 oder 10 Elementen; aber es gibt solche von 2, 3, 4, 5, 7, 8 oder
9 Elementen, usw. Ich will hierauf nicht weiter eingehen.
Bemerkung 6.3.13 Das neutrale Element der Addition in einem Vektorraum wird häufig mit
0 anstelle von o bezeichnet, d.h. demselben Symbol, welches das neutrale Element der Addition
in einem Körper bezeichnet. Insbesondere bezeichnet 0 in K n das n-tupel (0, . . . , 0). Genau
genommen ist das eine missbräuchliche Bezeichnung. Gewöhne Dich daran, aufzupassen, von
welcher 0 die Rede ist.
Übrigens ist die 0 in einem Vektorraum, ebenso wie in einem Ring immer das einzige Element x,
welches die Gleichung x+x = x erfüllt. Das liegt an der Existenz additiv Inverser. (Du erinnerst
Dich sicher, dass die 1 in einem Körper nicht das einzige Element x ist, welches x · x = x erfüllt.
Die 0 tut’s ja auch. In einem Ring kann es noch mehr solche Elemente geben. Wenn etwa K
ein Körper ist, so ist K × K bezüglich der komponentenweisen Addition und Multiplikation
ein Ring, in dem jedes der vier Elemente (0, 0), (1, 0), (0, 1) und (1, 1) die Gleichung x · x = x
erfüllt.)
Definition 6.3.14 Sei V ein K-Vektorraum. Ein Teil(vektor)raum (auch Untervektorraum von V ist eine Teilmenge U von V , die bezüglich derselben Verknüpfungen, die in V
gelten, wieder ein Vektorraum ist.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
161
Dazu genügt natürlich, dass U gegenüber den Verknüpfungen von V abgeschlossen ist. Und
dafür reicht das Folgende:
(1) o ∈ U, (2) u, v ∈ U ⇒ u + v ∈ U, (3)u ∈ U, λ ∈ K ⇒ λu ∈ U
Da (−1)u = −u ist folgt nämlich ‘u ∈ U ⇒ −u ∈ U ’ aus (3).
Beispiele 6.3.15 a) Wir wollen die Teilräume des Vektorraums V der Ebene E bestimmen.
Diese wollen wir auch geometrisch verstehen. Deshalb versehen wir die Ebene mit einem Ursprungspunkt O und repräsentieren die Vektoren durch Pfeile mit dem Anfang O und beschreiben sie letztendlich durch den Endpunkt dieser Pfeile. Insbesondere entspricht dabei der
Nullvektor dem Punkt O.
Natürlich sind {0} und V Teilräume von V . Das sind die trivialen Fälle.
Sei v ∈ V − {0} gegeben durch den Pfeil (O, a) mit a 6= O, entspreche also dem Punkt a. Dann
ist λv gegeben durch durch den Pfeil λ(O, a), dessen Endpunkt auf der Geraden durch O, a
liegt.
Die Menge Rv := {λv | λ ∈ R} ein Teilraum von V und die den Vektoren aus Rv entsprechenden
Punkte sind alle Punkte auf der Geraden durch O, a. Die auf diese Weise erhaltenen Teilräume
sind also die Geraden durch O.
Ferner muss jeder jeder Teilraum, der v enthält, den Teilraum Rv umfassen.
Jetzt wollen wir sehen, dass es außer den genannten keine weiteren Teilvektorräume von V gibt.
Sei U ein beliebiger Teilraum. Gibt es keinen von 0 verschiedenen Vektor in U , so ist U = {0}.
Ansonsten sei v ∈ U − {0}. Dann ist Rv ⊂ U . Angenommen U 6= Rv, dann gibt es ein w ∈ U
mit w 6= λv für alle λ ∈ R. Dann umfasst U die Vereinigung zweier verschiedener Geraden
(nachdem wir Vektoren mit Punkten identifiziert haben). Geometrisch siehst Du dann leicht,
dass jeder Vektor von der Ebene sich in der Form λv + µw mit λ, µ ∈ R schreiben lässt, also
zu U gehört. Dabei dürfen λ, µ auch negativ sein.
b) Der Vektorraum des Raumes hat genau die folgenden Teilräume. Nachdem man ihn durch
Festlegung eines Ursprungs O mit dem Raum identifiziert hat, ergeben sich folgende Teilräume:
{0} = O, die Geraden durch O, die Ebenen durch O, der ganze Raum.
6.3.16 Es sind vor allem zwei Gründe, weshalb ich mich bemüht habe, die Teilräume (Untervektorräume) eines K 2 zu bestimmen:
1. Du sollst erkennen, dass Teilräume keineswegs ‘wilde’ Teilmengen sind, sondern (z. B. für
K = R, n = 2 oder n = 3) einfachen geometrischen Gegenständen entsprechen: Punkt, Gerade,
Ebene.
2. Du sollst erst gar nicht auf die leider häufig geglaubte Idee kommen, es gäbe außer den trivialen Teilräumen des K 2 nur noch die beiden folgenden: {(a, 0) | a ∈ K} und {(0, b) | b ∈ K}.
Wir haben ja gesehen, dass der R2 unendlich viele Teilräume hat, da es in der Eben unendlich
viele Geraden durch einen Punkt gibt. Sogar der F22 hat außer den beiden trivialen noch 3
(und nicht nur 2) weitere Teilräume, nämlich: {(0, 0), (1, 0)}, {(0, 0), (1, 1)}, {(0, 0), (0, 1)}
162
KAPITEL 6. GEOMETRIE
AUFGABE
Betrachte Z2 als Teilmenge des Vektorraums R2 , der mit der Ebene identifiziert sei. Für welche
Punkte aus Z2 liegt auf ihrer Verbindungsstrecke mit dem Ursprung (0, 0) außer den Endpunkten kein weiterer Punkt aus Z2 ?
6.4
Das Skalarprodukt
Wir wollen wollen zu je zwei Vektoren v, w im Vektorraum V der Ebene (oder auch des Raumes) eine reelle Zahl als ihr sogenanntes Skalarprodukt hv, wi definieren, das sowohl von den
Längen der beiden Vektoren v und w, als auch von dem Winkel, den sie einschließen, abhängt.
(Der Name Skalarprodukt kommt daher, dass das Ergebnis des Skalarproduktes ein Skalar, d.h.
eine reelle Zahl, und kein Vektor ist. Reelle Zahlen stellt man sich auf einer ‘Skala’ vor.)
6.4.1 Wir legen in der Ebene (oder dem Raum) eine Einheitslänge (d.h. eine Längeneinheit)
fest. Jede Strecke hat dann eine reelle Zahl als Länge, die man in diesem Längenmaß ausdrücken
kann. Das gilt dann natürlich auch für gerichtete Strecken. (Man vergesse einfach die Richtung.)
Bei Parallelverschiebungändert sich die Länge nicht. Also besitzt dann jeder Vektor v in der
Ebene (Raum, Gerade) eine Länge, die ich mit |v| bezeichnen will.
Auf jeder Zahlengerade, die wir betrachten, sei dann natürlich der Abstand zwischen den Punkten 0 und 1 gleich 1.
Definition 6.4.2 Für einen Winkel α ∈ [0, π] definieren wir seinen Cosinus cos α wie folgt:
α
–1
cos α
0
1
Diese Definition ist insofern vorläufig, als wir später cos x für beliebige x ∈ R definieren werden.
Für den Cosinus werden sich dabei keine Probleme ergeben. (Traditionell schreibt man cos α
statt cos(α).)
Bemerkungen 6.4.3 a) Es gilt cos 0 = 1, cos 90◦ = cos(π/2) = 0, cos 180◦ = cos π = −1 .
b) Aus 0 ≤ α < β ≤ π folgt 1 ≥ cos α > cos β ≥ −1. Insbesondere ist die Abbildung
cos : [0, π] → [−1, 1] injektiv. Wegen des Zwischenwertsatzes ist sie auch bijektiv.
c) cos α = − cos(π − α).
d) Der Funktionsgraf sieht, wie folgt, aus:
6.4. DAS SKALARPRODUKT
163
1
0
π/3 π/2
2 π/3
π
–1
Definition 6.4.4 Mit obigen Bezeichnungen sei definiert:
Sind v, w beide vom Nullvektor verschieden, kann man von dem Winkel α sprechen, den v und
w einschließen. Dann sei ihr Skalarprodukt hv, wi definiert durch
hv, wi := |v| · |w| · cos α .
Ist v = 0 oder w = 0, so gelte dieselbe Formel mit einem beliebigen α ∈ [0, π]. In diesem Fall
ergibt sich hv, wi = 0 unabhängig von dem gewählten α.
6.4.5 Eigenschaften. a) hv, wi = hw, vi.
b) hv, vi = |v|2 .
c) hv, wi = 0 ⇐⇒ v⊥w. Dabei schreiben wir v⊥w, wenn v senkrecht auf w steht, oder einer
beiden Vektoren gleich 0 ist.
d) hv, λwi = λhv, wi.
Dies ist zunächst klar für λ ≥ 0. Ist λ < 0 und α der von v, w eingeschlossene Winkel, so ist
π − α der von v, λw eingeschlossene Winkel. Die Aussage folgt dann, da cos(π − α) = − cos α
ist.
Eine weitere Eigenschaft des Skalarproduktes ist die Folgende:
Satz 6.4.6 Seien v, w, w0 Vektoren in der Ebene (oder im Raum). Dann gilt
hv, w + w0 i = hv, wi + hv, w0 i .
Beweis:
Da im Falle v = 0 die Behauptung trivial ist, sei im Folgenden v 6= 0.
Betrachte die Vektoren als Pfeile mit einem gemeinsamen Anfangspunkt O. Lege eine Zahlengerade G so durch den Pfeil v, dass O = 0 und der Endpunkt von v gleich der Zahl |v|,
also insbesondere positiv ist. Sei p : V → G die Orthogonalprojektion. (V ist der Vektorraum
der Ebene, bzw. des Raumes.) Für einen Vektor w, der mit v den Winkel α einschließt, gilt
dann: p(w) wird durch den Pfeil (0, |w| cos α) gegeben, d.h. der Vektor p(w) entspricht als
Punkt auf der Zahlengerade G der Zahl |w| cos α, dem Produkt der letzten beiden Faktoren in
|v| · |w| · cos α = hv, w, i.
164
KAPITEL 6. GEOMETRIE
w
α
v
|v|
|w|·cos α
Da p die Eigenschaft p(w + w0 ) = p(w) + p(w0 ) hat, folgt die Behauptung des Satzes.
6.4.7 Satz des Pythagoras. Wir wählen in der Ebene eine Basis b1 , b2 mit |b1 | = |b2 | = 1
und b1 ⊥b2 , d.h. eine Orthonormalbasis. Im Raum wählen wir eine Basis b1 , b2 , b3 mit |bi | = 1
und b1 ⊥b2 ⊥b3 ⊥b1 . Dann gilt
1 für i = j
hbi , bj i = δij :=
0 für i 6= j
also
hλ1 b1 + λ2 b2 , µ1 b1 + µ2 b2 i = λ1 µ1 + λ2 µ2
(bzw. im Raum
hλ1 b1 + λ2 b2 + λ3 b3 , µ1 b1 + µ2 b2 + µ3 b3 i = λ1 µ1 + λ2 µ2 + λ3 µ3 .)
Es folgt der Satz des Pythagoras:
Theorem 6.4.8 |λb1 + µb2 |2 = λ2 + µ2 .
Ist dies wirklich der Satz des Pythagoras? Mache Dir das klar!
Im 3-dimensionalen erhält man: |λb1 +µb2 +νb3 |2 = λ2 +µ2 +ν 2 . Das Quadrat über der Diagonale
eines Quaders ist die Summe der Quadrate über den Kanten, die von einem gemeinasamen
Eckpunkt aus gehen.
Beachte, dass wir das Skalarprodukt der Vektoren λ1 b1 +λ2 b2 +λ3 b3 und µ1 b1 +µ2 b2 +µ3 b3 nicht
etwa als λ1 µ1 + λ2 µ2 + λ3 µ3 definiert haben, sondern diese Identität aus einer geometrischen
Definition des Skalarproduktes gefolgert haben!
AUFGABE
Beweise nachfolgenden Satz von Euklid als Korollar zum Satz des Pythagoras.
Sei ABC ein rechtwinkliges Dreieck mit dem rechten Winkel bei C und D der Fußpunkt der
C-Höhe, d.h. des Lotes von C auf AB. Da α und β spitz sind, liegt P zwischen A und B. Sei
s := l(AP ), t := l(BP ), h := l(CP ). Dann gilt st = h2 , sc = b2 und tc = a2 .
6.5. LINEARE ABBILDUNGEN
6.5
165
Lineare Abbildungen
Definition 6.5.1 Seien W, W 0 Vektorräume über einem Körper K. Eine Abbildung f : W →
W heißt linear, wenn folgende beiden Bedingungen erfüllt sind:
(i) f (v + w) = f (v) + f (w) und (ii) f (λw) = λf (w) für v, w ∈ W1 , λ ∈ K.
Du kannst diese Bedingungen auch zu (iii) f (λv + µw) = λf (v) + µf (w) zusammenfassen.
Bemerkungen 6.5.2 a) Ist f : W → W 0 linear und 0 der Nullvektor in W , sowie 00 derjenige
von W 0 , so gilt f (0) = 00 .
Denn es ist 0 = 0 + 0, folglich f (0) = f (0 + 0) = f (0) + f (0). Wenn man in der Gleichung
f (0) = f (0) + f (0) auf beiden Seiten −f (0) addiert, erhält man 00 = f (0). (Zu diesem Beweis
wurde nur die Eigenschaft (i) einer linearen Abbildung benutzt.)
b) Wenn f linear ist, gilt f (−v) = −f (v). Denn f (v) + f (−v) = f (v − v) = f (0) = 00 , und aus
f (v) + f (−v) = 00 folgt f (−v) = f (v).
c) Seien f : W → W 0 und g : W 0 → W 00 lineare Abbildungen von Vektorräumen. Dann ist auch
ihre Verkettung g ◦f linear.
Wenn Dir das nicht klar ist, musst Du es nachrechnen.
d) Sei f : W → W 0 eine bijektive lineare Abbildung. Dann ist auch die Umkehrabbildung
f −1 : W 0 → W linear. Seien nämlich v 0 , w0 ∈ W 0 und v, w ∈ W die eindeutig bestimmten
Elemente von W mit f (v) = v 0 , f (w) = w0 , d.h.
(∗) f −1 (v 0 ) = v, f −1 (w0 ) = w.
Da f linear ist, gilt f (λv + µw) = λf (v) + µf (w) = λv 0 + µw0 . Nach Definition von f −1 und
wegen (∗) ist also f −1 (λv 0 + µw0 ) = λv + µw = λf −1 (v 0 ) + µf −1 (w0 ).
Definitionen 6.5.3 a) Eine bijektive lineare Abbildung zwischen Vektorräumen f : W → W 0
heißt ein Isomorfismus.
b) Vektorräume W, W 0 heißen zueinander isomorf und man schreibt W ∼
= W 0 , wenn es einen
0
Isomorfismus f : W → W gibt.
Da nach obigen Bemerkungen mit f auch f −1 ein Isomorfismus ist, ist die Isomorfie (d.h. die
Eigenschaft, isomorf zu sein) ein symmetrischer Begriff, d.h. W ∼
= W 0 ⇐⇒ W 0 ∼
= W.
Da auch die Verkettung bijektiver Abbildungen wieder bijektiv ist und die Verkettung linearer
Abbldungen wieder linear ist, gilt auch die Implikation W ∼
= W 0, W 0 ∼
= W 00 =⇒ W ∼
= W 00 .
6.5.4 Versieh für n = 1, 2, 3 den n-dimensionalen Raum R mit einem Koordinaatensystem.
Betrachte den Vektorraum V dieses Raumes. Vermöge des gewählten Koordinatensystems wird
jedes v ∈ V durch ein n-tupel reeller Zahlen beschrieben. Den Inhalt des Abschnittes 6.3.9
kann man auch so ausdrücken: Die Abbildung V → Rn , die jedem geometrischen Vektor in R
das zugehörige n-tupel zuordnet, ist linear! Insbesondere ist die Abbildung V → R, die jedem
Vektor seine erste, bzw. zweite, bzw. dritte Koordinate zuordnet, linear.
166
KAPITEL 6. GEOMETRIE
6.5.5 Lineare Abbildungen und Matrizen. Sei V der Vektorraum der Ebene und sei
eine Basis (e1 , e2 ) desselben ausgewählt. Wie gerade gesehen, entspricht dann jeder Vektor von
V einem (reellen) Zahlenpaar, nämlich dem Vektor λ1 e1 + λ2 e2 das Zahlenpaar (λ1 , λ2 ) (die
Koordinaten).
Aus Gründen der Notation wollen wir dieses Zahlenpaar als ‘Spalte’ schreiben:
λ1
λ2
Ich werde die Vektor-Zahlenpaar-Entsprechung wie folgt schreiben
λ1
λ1 e1 + λ2 e2 ↔
λ2
Sei jetzt f : V → V eine lineare Abbildung mit
f (e1 ) = a11 e1 + a21 e2 ↔
f (e2 ) = a12 e1 + a22 e2 ↔
a11
a21
a12
a22
,
,
Da f durch die Bilder f (e1 ), f (e2 ) bereits bestimmt ist, wird f auch durch die Matrix
a11 a12
a21 a22
bestimmt, deren Spalten die den Vektoren f (e1 ), f (e2 ) entsprechende Zahlenpaare sind.
Welches Bild (unter f ) hat der durch das Zahlenpaar
λ1
λ2
gegebene Vektor? Durch welches Zahlenpaar wird das Bild dieses Vektors beschrieben?
Für die zu f (e1 ), f (e2 ) gehörigen Zahlenpaare gilt
a11
a12
f (e1 ) ↔
, f (e2 ) ↔
a21
a22
Nun, rechnen wir los:
f (λ1 e1 + λ2 e2 ) = λ1 f (e1 ) + λ2 f (e2 ) ←→
a11
a12
a11 λ1 + a12 λ2
λ1
+ λ2
=
a21
a22
a21 λ1 + a22 λ2
a11 a12
λ1
=
a21 a22
λ2
6.6. KREISFUNKTIONEN
167
λ
1
Bemerkung 6.5.6 Sei K ein beliebiger Körper. Wenn die Elemente des K 2 als Spalten
λ2
2
2
geschrieben werden, gilt für lineare Abbildungen f : K → K dasselbe. Sie werden in der oben
angegebenen Art durch 2 × 2 Matrizen beschrieben.
f, g
: K 2
→
K 2 lineare Abbildungen.
Und es werde
a11 a12
b11 b12
f durch die Matrix
und g durch die Matrix
beschrieben, so
a21 a22
b21 b22
b11 b12
a11 a12
wird g ◦f durch die Matrix
beschrieben.
b21 b22
a21 a22
Satz 6.5.7 Seien
Spätestens an dieser Stelle, sollte Dir klar werden, wie wichtig die Multiplikation von Matrizen
ist. Und wenn Du sie bislang etwas stiefmütterlich behandelt hast, dann . . .
Den Beweis dieses Satzes möchte ich gerne Dir überlassen. Er erfordert keine Idee, aber
sorgfältiges Rechnen.
6.6
Kreisfunktionen
Wir versehen die (euklidische) Ebene nach Wahl einer Längeneineit mit einem orthonormalen
Koordinatensystem, so dass die Punkte (1, 0) und (0, 1) eine Längeneinheit vom Ursprung
(Nullpunkt) entfernt sind. Der Kreis um (0, 0) vom Radius 1 geht dann durch die Punkte
(1, 0), (0, 1), (−1, 0), (0, −1). Wir denken uns einen Punkt, der abhängig von der Zeit t ∈ R
den Kreis mit der (gleichbleibenden) (Absolut-)Geschwindigkeit 1 in der im Bild angedeuteten
Richtung durchläuft und sich zum Zeitpunkt 0 beim Punkt (1, 0) befindet.
(0, 1)
(cos t, sin t)
(0, sin t)
(–1, 0)
t
(cos t, 0)
(1, 0)
(0, –1)
Definition 6.6.1 Die Koordinaten des Punktes zum Zeitpunkt t werden mit cos t und sin t
bezeichnet. D.h., wenn γ : R → R2 den Weg unseres Punktes beschreibt, ist γ(t) = (cos t, sin t).
168
KAPITEL 6. GEOMETRIE
Wohlgemerkt, wir nehmen diese Beschreibung als Definition von sin t, dem Sinus von t, und
cos t, dem Cosinus von t. Selbstverständlich ist dann der Einheitskreis der parametrisierte Weg
(cos t, sin t), wie er in dem Kapitel 7 Abschnitt 4 definiert werden wird. Aber die Definition
geht von der Geometrie, nicht von der Analysis aus. Natürlich ist die Zeit nicht auf die Werte
0 ≤ t ≤ 2π beschränkt! (Wie oben bezeichnen wir mit π die Länge der halben Einheitskreislinie.)
6.6.2 Offensichtlich haben die beiden Funktionen cos und sin die Periode 2π. D.h. es ist cos(x+
2π) = cos x und sin(x+2π) = sin x. Bachte, dass innerhalb einer Periode etwa auf dem Intervall
[0, 2π[ bis auf die Werte ±1 jeder Wert vom Sinus, wie auch vom Cosinus zweimal angenommen
wird.
Wir haben folgende speziellen Funktionswerte:
−π −π/2 0 π/2 π 3π/2
t
cos t −1
0
1 0 −1
0
−1 0 1
0
−1
sin t 0
Hieraus erkennt man auch, dass die Funktionen sin und cos keine kleinere Periode als 2π haben.
D.h. gilt sin t = sin(t+a) für alle t ∈ R, so ist a ein ganzzahliges Vielfaches von 2π; und dasselbe
stimmt auch für den Cosinus.
Bemerkung 6.6.3 Beachte bitte, dass wir oben in Definition 6.4.2 Winkel zwischen zwei Halbgeraden und damit zwischen zwei (von 0 verschiedenen) geometrischen Vektoren unabhängig
von deren Reihenfolge betrachtet haben. Hier wird hingegen ein Winkel als Länge eines gerichteten Weges auf dem Einheitskreis betrachtet, der als negativ betrachtet wird, wenn er im
Uhrzeigersinn durchlaufen wird. Da cos(−α) = cos α ist, betrifft dieser Unterschied lediglich
den Sinus.
6.6.4 Wichtige lineare Abbildungen sind Drehungen um den Ursprung:
Wenn (e1 , e2 ) eine Basis des Vektorraums V der Ebene ist und die lineare Abbildung fα : V → V
so definiert ist, dass sie die Vektoren e1 , e2 um denselben Winkel (in dieselbe Richtung) α um
O dreht, tut sie das offenbar mit jedem Vektor.
α
α
α
6.6. KREISFUNKTIONEN
169
Wir wählen ein Einheitslängenmaß und setzen jetzt voraus, dass (e1 , e2 ) bezüglich dieser
Längeneinheit eine orthonormale Basis ist. Dann gilt für die oben beschriebene Drehung f
fα (e1 ) = cos(α) · e1 + sin(α) · e2 und fα (e1 ) = − sin(α) · e1 + cos(α) · e2
Aufgefasst als Spalten – bzgl. der Basis (e1 , e2 ) – gilt also für fα (e1 ), fα (e2 ):
cos α
− sin α
fα (e1 ) =
, und fα (e2 ) =
.
sin α
cos α
Das bedeutet, dass fα bezüglich der Basis (e1 , e2 ) durch die Matrix
cos α − sin α
sin α cos α
beschrieben wird.
Diese Erkenntnis ermöglicht es, ganz einfach Formeln für sin(α + β) und cos(α + β) anzugeben.
Satz 6.6.5 Es gelten die Formeln:
cos(α + β) = cos α · cos β − sin α · sin β,
sin(α + β) = sin α · cos β + cos α · sin β .
Beweis: Die Drehung um α + β kann man auch dadurch erreichen, indem man zunächst um
β, danach um α dreht. D.h. fα+β = fα ◦fβ . Für Matrizen bedeutet dies
cos(α + β) − sin(α + β)
cos α − sin α
cos β − sin β
=
=
sin(α + β) cos(α + β)
sin α cos α
sin β cos β
cos α cos β − sin α sin β − sin α cos β − cos α sin β
sin α cos β + cos α sin β cos α cos β − sin α sin β
Ein Vergleich der Einträge beweist den Satz.
Folgerung 6.6.6 a) sin 2α = 2 sin α cos α, cos 2α = cos2 α−sin2 α = 1−2 sin2 α = 2 cos2 α−1
b) sin(α + β) sin(α − β) = sin2 α − sin2 β
Hier ist sin 2α = sin(2α), sin2 α = (sin α)2 usw.
Beweis:
Nur b) ist zu zeigen.
b) sin(α + β) sin(α − β) = (sin α cos β + cos α sin β)(sin α cos β − cos α sin β) = sin2 α cos2 β −
cos2 α sin2 β = sin2 α(1 − sin2 β) − (1 − sin2 α) sin2 β = sin2 α − sin2 β.
Satz 6.6.7 Sinussatz. In einem Dreieck mit den Seitenlängen a, b, c, den Winkel(größe)n
α, β, γ, (wo wie gewohnt a und α einander gegenüber liegen usw.) und dem Umkreisradius
r gilt
b
c
a
=
=
= 2r
sin α
sin β
sin γ
170
KAPITEL 6. GEOMETRIE
Beachte, dass für einen Dreieckswinkel ϕ, der ja 0 < ϕ < π erfüllt, der Wert sin ϕ positiv ist.
Deshalb sind die obigen Nenner nicht Null.
Beweis:
Es ist
b sin α = hc = a sin β
C
γ
b
α
A
a
hc
β
B
c
Das beweist auf einfache Weise die ersten beiden Gleichheiten.
Die dritte sieht man mit Hilfe des Satzes über die Winkel im Kreis (??).
C
γ
r
A
γ γ
B
Hieraus folgen natürlich auch die ersten beiden Gleichheiten.
Satz 6.6.8 Cosinussatz. In einem Dreieck gilt (mit den üblichen Bezeichnungen)
a2 + b2 − 2ab cos γ = c2
Beweis: (Wir verwenden die schulmäßigen Bezeichnungen: A, B, C seinen die Eckpunkte
eines Dreiecks, a die Seite, die A gegenüber liegt, und auch ihre Länge, usw., ferner α, β, γ die
Innenwinkel und deren Größen, wobei α der Winkel bei A ist usw.)
~ CA,
~ bzw. AB
~ die durch die Pfeile (C, B), (C, A), bzw. (A, B)
Betrachte die Vektoren CB,
~ = CB
~ − CA.
~
gegeben werden; sie haben die Längen a, b,bzw. c. Es ist AB
~ 2 = hCB
~ − CA,
~ CB
~ − CAi
~ = a2 + b2 − 2ab cos γ.
Dann rechne c2 = |AB|
6.7. DER SATZ VON MORLEY
171
AUFGABE
Betrachte die Erde als perfekte Kugel mit dem Radius 6366 km. (Diese Länge, die man sich
verhältnismäßig leicht merken kann, ist kleiner als der Radius des Äquators und größer als der
halbe Abstand der Pole. Die Erde ist nicht wirklich eine Kugel, auch wenn man von kleinen
Unregelmäßigkeiten, wie dem Himalaja absieht.) Denke Dir eine Eisenbahnlinie von 10 km (20
km) Länge, die vollkommen gerade ist, also auch nicht der Erdkrümmung folgt (d.h. im Innern
der idealen Erdkugel verläuft, so dass man einen Graben oder gar einen Tunnel für die Bahn
anlegen muss.) Sie soll an einem Punkt der Erdoberfäche beginnen und an einem solchen enden.
Wie tief verläuft sie an der tiefsten Stelle unter der Erdoberfäche.
6.7
Der Satz von Morley
C
γ γ γ
A’
B’
A
α
α
α
C’
β
β
β
B
Satz 6.7.1 Bringt man die jeweils benachbarten Drittellinien der Winkel eines beliebigen Dreiecks zum Schnitt, so bilden die drei erhaltenen Schnittpunkte ein gleichseitiges Dreieck.
Beweis: Gilt die Behauptung des Satzes für ein Dreieck, so gilt sie auch für alle ähnlichen
Dreiecke. Kann man also zu je drei (positiven) Winkeln, deren Summe π ist, ein Dreieck mit
diesen Winkeln konstruieren, dessen Morley-Dreieck gleichseitig ist, so ist der Satz richtig.
Seien α, β, γ drei positive Winkel mit 3α+3β +3γ = π. Wir haben ein Dreieck mit den Winkeln
3α, 3β, 3γ zu konstruieren, dessen Morley-Dreieck gleichseitig ist.
Zur Abkürzung setzen wir ϕ+ := ϕ + π3 für jeden Winkel ϕ. Dann sind z.B. α, β + , γ + die drei
Winkel eines Dreiecks, d.h. ihre Summe ist π.
172
KAPITEL 6. GEOMETRIE
C
+ β+
A’
B’ α
+
+
γ
γ
β+
α+
C’
A
B
Sei A0 B 0 C 0 ein gleichseitiges Dreieck der Seitenlänge 1. (Dies bedeutet eine Längeneinheit, die
man natürlich willkürlich wählen darf. Nur musst Du sie innerhalb des Beweises beibehalten.)
Über den drei Seiten dieses Dreiecks konstruieren wir Dreiecke AB 0 C 0 , BC 0 A0 und CA0 B 0 , derart
dass A und A0 (bzw. B und B 0 , bzw. C und C 0 ) auf verschiedenen Seiten der Geraden durch
B 0 , C 0 (bzw. C 0 , A0 , bzw. A0 , B 0 ) liegen, mit den in der Zeichnung angegebenen Winkeln. (Bitte
beachte genau, welche Winkel wo angegeben sind! Z.B. hat der Winkel des Dreiecks AC 0 B 0 bei
C 0 die Größe β + und der bei B 0 desselben Dreiecks die Größe γ + – und nicht etwa umgekehrt!)
Wir behaupten: A0 B 0 C 0 ist das Morley-Dreieck des Dreiecks ABC. Dazu genügt es zu zeigen,
dass z.B. ∠C 0 AB = α ist. Denn für die weiteren Winkel ∠CAB 0 usw. gilt aus Analogiegründen
das entsprechende.
Wir betrachten das Dreieck ABC 0 . Bezeichne ∠C 0 AB mit α, und ∠C 0 BA mit β. Ferner sei u
die Länge der Strecke AC 0 und v die der Strecke BC 0 .
C
B’
γ+
A
α
α’
u
β+
A’
γ+
α+
C’
v
β’
β
B
Der Winkel ∠AC 0 B berechnet sich zu 2π − π/3 − β + − α+ = π − β − α = γ + 2π/3, folglich ist
α + β + γ + 2π/3 = α + β + γ + 2π/3, also α + β = α + β.
Dann rechnen wir durch Anwendung des Sinus-Satzes auf drei Dreiecke
sin α
v
sin γ + / sin β
sin α
= =
=
+
u
sin γ / sin α
sin β
sin β
6.8. EULERGERADE UND FEUERBACHKREIS
173
Wir bemerken: Die vier Winkel α, α, β, β liegen alle in dem Intervall ]0, π/3]. Denn es ist α, β <
α + β + γ = π/3, und α, β < α + β = α + β < α + β + γ = π/3. Auf diesem Intervall, sogar auf
[0, π/2], ist die Sinusfunktion streng monoton wachsend und positiv.
Aus den beiden bisher bewiesenen Gleichungen
sin α
sin α
=
sin β
sin β
und α + β = α + β
können wir deshalb ableiten, dass α = α (und β = β) ist.
Denn wäre etwa α > α, so würde die erste Gleichung β > β, die zweite hingegen β < β
implizieren. Analoges gilt im Falle α < α.
6.8
Eulergerade und Feuerbachkreis
Sei ABC ein Dreieck. Das Mittendreieck dieses Dreiecks ist das Dreieck A0 B 0 C 0 , wo A0 der
Mittelpunkt der Seite BC und B 0 derjenige von CA und C 0 derjenige von AB ist.
C
B’
A
A’
C’
B
Bemerkungen 6.8.1 Mit obigen Bezeichnungen gilt:
a) A0 B 0 (bzw. B 0 C 0 , bzw. C 0 A0 ) ist parallel zu AB (bzw. BC, bzw. CA) und halb so lang.
b) Die seitenhalbierenden Geraden von ABC sind dieselben wie die von A0 B 0 C 0 , wobei die
Seitenhalbierende durch A von ABC auch durch A0 geht, usw. Insbesondere haben ABC und
A0 B 0 C 0 denselben Schwerpunkt S.
Dies folgt wie a) aus dem Strahlensatz und seiner Umkehrung.
c) Die Mittelsenkrechte von AB ist die Höhengerade von A0 B 0 C 0 durch C 0 , usw. Also ist der
Höhenschnittpunkt von A0 B 0 C 0 der Umkreismittelpunkt U von ABC.
174
KAPITEL 6. GEOMETRIE
d) Das Dreieck A0 B 0 C 0 entsteht aus dem Dreieck ABC durch Drehung um S um 180o und
Halbierung aller Abstände von S. Es handelt sich also hier um eine Ähnlichkeitsabbildung, d.h.
eine Abbildung der Ebene auf sich, die ein Dreieck immer in ein ähnliches Dreieck abbildet.
Wenn man also den Höhenschnittpunkt H von ABC am Punkt S spiegelt und einen Punkt K
erhält, so ist der Höhenschnittpunkt H 0 von A0 B 0 C 0 der Mittelpunkt der Strecke SK. D.h H 0
liegt auf der Geraden HS auf der anderen Seite von S und ist von S halbsoweit entfernt wie
H. Nach c) gilt aber H 0 = U .
C
H
B’
A’
S=S’
H’=U
A
C’
B
Es folgt also
Satz 6.8.2 (Euler) In einem Dreieck ABC liegen Höhenschnittpunkt H, Schwerpunkt S und
Umkreismittelpunkt U in dieser Reihenfolge auf einer Geraden. Für die Streckenlängen gilt
l(HS) : l(SU ) = 2 : 1. (Ist das Dreieck gleichseitig, fallen diese drei Punkte zusammen. Die
Aussage des Satzes ist dann leer. Überlege Dir: Wenn in einem Dreieck der Umkreismittelpunkt
mit dem Schwerpunkt zusammenfällt, ist das Dreieck gleichseitig.)
Definition 6.8.3 Die Gerade, auf welcher Höhenschnittpunkt, Schwerpunkt und Umkreismittelpunkt eines nicht gleichseitigen Dreiecks liegen, heißt seine Eulergerade.
Bemerkungen 6.8.4 a) Ist ABC gleichschenklig (aber nicht gleichseitig), so ist die Symmetrieachse die Eulergerade.
b) Ist ABC rechtwinklig mit γ = 90o , so ist die Seitenhalbierende s durch C die Eulergerade.
Denn der Höhenschnittpunkt ist der Punkt C und der Schwerpunkt liegt auf s.
c) Sei ABC rechtwinklig, aber nicht gleichschenklig, so fallen die Eulergerade, d.h. die Seitenhalbierende s durch C und die Winkelhalbierende w durch C nicht zusammen, da letztere die
Seite AB im Verhältnis b/a 6= 1/1 teilt. Da aber der Inkreismittelpunkt nicht der Schnittpunkt
C von w und s sein kann, liegt zumindest in diesem Fall der Inkreismittelpunkt nicht auf der
Eulergeraden.
6.8. EULERGERADE UND FEUERBACHKREIS
175
Bemerkungen 6.8.5 Mit den obigen Bezeichnungen gilt:
a) Sei U 0 der Umkreismittelpunkt von A0 B 0 C 0 . Dann liegt U 0 auf der Geraden U S, der Eulergeraden, auf der U gegenüberliegenden Seite von S und ist halbsoweit von S entfernt wie
U . Gemäß der ‘berühmten’ Identität 31 + 16 = 12 ist er also der Mittelpunkt der Strecke U H.
Durch U geht die Mittelsenkrechte von AB, d.h. die Senkrechte auf AB durch C 0 . Durch H
geht die dazu parallele Höhe von ABC durch C. Der Kreis um U 0 durch A0 geht also auch
durch den Fußpunkt der Höhe durch C. Dieser Kreis, der Feuerbachkreis geht also durch die
Seitenmittelpunkte und die Höhenfußpunkte von ABC.
Eulergerade
C’
B
A
H
U’
FeuerbachKreis
U=H’
B’
A’
C
b) Nun bringen wir die Gerade C 0 U 0 mit der Höhengeraden von ABC durch C zum Schnitt, der
von dem Fußpunkt der Höhe verschieden ist. Der Schnittpunkt heiße D. Die Dreiecke U 0 U C 0 und
U 0 HD sind kongruent. Denn die Strecken U 0 U und U 0 H sind gleichlang, die Winkel bei U 0 sind
gleichgroß, ebenso die bei H bzw. U . Folglich gilt l(A0 U ) = l(DH). Da wir schon wissen, das die
Strecke C 0 U halb so groß ist wie CH – sie korrespondieren bei der Mittendreieck-Korrespondenz
– ist D der Mittelpunkt von CH. Ferner folgt aus obiger Kongruenz l(U 0 D) = l(U 0 C 0 ). Somit
geht der Feuerbachkreis durch die Mittelpunkte der Strecken CH, AH und BH. (Mit l(DE)
wurde die Länge der Strecke CD bezeichnet.)
c) Ohne Beweis zitiere ich: Der Feuerbachkreis berührt den Inkreis und die Ankreise.
176
KAPITEL 6. GEOMETRIE
Kapitel 7
Differenzial- und Integralrechnung
7.1
Differenzieren
Wie im Kapitel über die Geometrie verzichte ich auch hier bewusst auf die größtmögliche
Präzision. Ich möchte nämlich nicht, dass Du Dich in einem unübersichtlichen Wust kleinteiliger Beweise verfängst, sondern zunächst einmal die großen Linien kennenlernst. Im Studium
wirst Du dann, hoffentlich mit Genuss, erkennen, dass man alles auch ohne Appellation an die
Anschauung (die ja möglicherweise nicht für alle dieselbe ist) rein logisch beweisen kann.
Hier werde ich es z.B. als anschaulich klar ansehen, dass eine Funktion, die auf einem Intervall
die (konstante) Ableitung 0 hat, dort konstant ist. Ebenso werde ich nicht beweisen, dass eine
Funktion, deren Ableitung auf einem Intervall I positiv ist, dort auch streng monoton wachsend
ist, d.h. dass aus x, y ∈ I und x < y die Ungleichung f (x) < f (y) folgt. So werde ich auch den
Zwischenwertsatz als anschaulich klar ansehen. Dieser besagt ja, dass eine auf einem Intervall
I stetige Funktion f zwischen zwei Punkten x1 , x2 ∈ I alle Werte zwischen f (x1 ) und f (x2 )
annimmt. Solltest Du mein Vorgehen als unbefriedigend empfinden, so kannst Du die exakten
Beweise im Buch von Forster (z.B.) nachlesen oder sie selber finden.
Wahrscheinlich wirst Du bereits wissen, was das Differenzieren bzw. die Ableitung einer Funktion bedeuten. Wegen der Wichtigkeit dieser Begriffe wollen wir sie hier ausführlich besprechen.
7.1.1 Die einfachsten Funktionen sind die Polynome vom Grad ≤ 1, auch lineare Funktionen
genannt, also solche von der Art
f : R → R, f (x) = ax + b,
wo a, b feste reelle Zahlen sind. (Zu ihnen gehören auch die konstanten Funktionen, wo a = 0
ist.)
Oben haben wir lineare Abbildungen von Vektorräumen definiert. Wenn man R als RVektorraum betrachtet, so ist die Abbildung x 7→ ax + b nur dann linear als Abbildung von
Vektorräumen, wenn b = 0 ist. Hier wollen wir aber unter einer linearen Funktion allgemein
ein Polynom vom Grad ≤ 1 auffassen.
177
178
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Wenn x0 , x1 verschiedene reelle Zahlen sind, gilt für ein solches f immer
f (x1 ) − f (x0 )
f (x0 + h) − f (x0 )
= a, d.h. für h 6= 0 ist
=a.
x1 − x0
h
1
2
f(x) = — x + 1
3
f(x1)–f(x0)
2
x1–x0
1
0
1
x0 2
3 x1 4
5
6
Der Graph einer solchen Funktion ist eine Gerade. Aber nicht alle Geraden in der ‘(x, y)’-Ebene
sind Graphen solcher Funktionen. Nämlich, für beliebiges c ∈ R ist die Gerade, die durch die
Gleichung x = c gegeben wird, nicht der Graph einer Funktion (von x)! (Warum?)
Man nennt den Koeffizienten a der Funktion f (x) = ax + b die Steigung dieser Funktion. Ist
x0 ∈ R und betrachten wir die Werte an der Stelle x0 und x0 + h, so ist f (x0 + h) = f (x0 ) + ah.
D.h. wächst der ‘x-Wert’ um h, so wächst der Funktionswert um ah. Die Steigung ist also ein
Maß für das Wachstum. (Beachte, dass a bzw. h selbstverständlich auch negativ sein dürfen,
das Wort ‘wachsen’ hier also auch ‘kleiner werden’ bedeuten kann.)
Angenommen, ein Auto fährt entlang einer (geraden) Straße, in der Weise, dass es sich im
Zeitpunkt t bei ‘Kilometer’ at + b befindet. Dann hat a die Bedeutung der Geschwindigkeit
dieses Autos, die in diesem Fall konstant ist.
Differenzieren bedeutet, auch einer komplizierteren Funktion in einem beliebigen Punkt ihres
Graphen eine Steigung zuzuordnen.
Diese lokale Steigung in x0 einer Funktion f , die wir die Ableitung von f in x nennen, soll
folgendes leisten:
1.) Sie soll die Steigung der vernünftig definierten Tangente (die ja eine Gerade ist) an den
Funktionsgraphen im Punkte (x0 , f (x0 )) sein.
2.) Sie soll bestmöglich eine angenäherte Berechnung von f (x) in der Nähe von x0 durch eine
lineare Funktion erlauben.
3.) Sie soll die Momentangeschwindigkeit angeben, mit der sich ein Punkt (auf einer Geraden)
bewegt, wenn der Ort des Punktes im Zeitpunkt t durch f (t) gegeben wird.
Die Ableitung einer Funktion f im Punkte x0 ist also ein Maß dafür, wie und wie stark die
Funktion f im Punkt x0 variiert. Das hört sich zunächst etwas verrückt an, da die Funktion ja
7.1. DIFFERENZIEREN
179
im Punkte x0 den Wert f (x0 ) hat. Was soll da variieren? Aber man kann ja für x ‘in der Nähe
von x0 ’ die Veränderung f (x) − f (x0 ) zur Differenz x − x0 ins Verhältnis setzen, d.h. den sog.
Differenzenquotienten
f (x) − f (x0 )
x − x0
betrachten und dann beobachten, welchem Wert (wenn es denn einen solchen gibt) sich dieser
Quotient nähert, wenn x gegen x0 geht.
f(x) = x 3 – 5x 2 + 6x + 1
4
3
2
1
1
2
3
4
Beispiel 7.1.2 Wir betrachten als Beispiel die Funktion f (x) = x3 − 5x2 + 6x + 1 und werden
diese in der Nähe des Punktes x0 = 3 genauer betrachten. (Du darfst natürlich dasselbe für
die einfachere Funktion f (x) = x3 machen, wodurch das Ganze sicher übersichtlicher wird.)
Gleichzeitig wollen wir die physikalische Bedeutung der Ableitung als Momentangeschwindigkeit
der Funktion des Ortes in Abhängigkeit von der Zeit begreiflich machen. Wir denken uns einen
kleinen (am besten punktförmigen) Wagen auf einer geraden Straße (der Breite 0, wenn man
will) der zum Zeitpunkt 0 sich bei bei Meter 1 befindet und zum Zeitpunkt x sec bei Meter
x3 − 5x2 + 6x + 1. Ihr oben gezeichneter Graph macht diesen Zusammenhang deutlich. Beachte,
dass das Auto zwischendurch auch mal zurückfährt.
Wir fragen: Wie groß ist die Durchschnittsgeschwindigkeit zwischen den Zeitpunkten 3 sec und
5 sec? Nun f (3) = 1, f (5) = 31. Deshalb fährt das Auto zwischen diesen beiden Zeitpunkten
insgesamt 30 m, d.h. die Durchschnittsgeschwindigkeit ist 15 m/sec.
Wieviel beträgt sie zwischen den Zeitpunkten 3 sec und 4 sec? Nun, es ist f (3) = 1, f (4) =
9. Also fährt das Auto zwischen den Zeitpunkten 3 sec und 4 sec insgesamt 8 m. und die
Durchschnittsgeschwindigkeit ist 8 m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,5 sec? Nun es ist f (3) = 1, f (3,5) = 3,625,
also die Durchschnittsgeschwindigkeit 5,25(= 2,625/0,5) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,1 sec? Nun es ist f (3) = 1, f (3,1) = 1,341,
also die Durchschnittsgeschwindigkeit 3,41 m/sec (= 0,341/0,1) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,01 sec? Nun es ist f (3) = 1, f (3,01) =
1,030401, also die Durchschnittsgeschwindigkeit 3,0401(= 0,030401/0,01) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 2,99 sec und 3 sec? Nun es ist f (2,99) =
1 − 0,029601, f (3) = 1, also die Durchschnittsgeschwindigkeit 2,9601 m/sec.
180
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Kann man von der Augenblicksgeschwindigkeit im Zeitpunkt 3 sec sprechen?
Als Praktiker würde man doch sagen: Ja, etwa 3 m/sec. Und das ist auch sinnvoll und für die
Praxis meist hinreichend.
Wir Theoretiker sehen es im Prinzip ganz ähnlich. Der Praktiker berechnet ja den folgenden
Differenzenquotienten
f (x0 + h) − f (x0 )
(mit x0 = 3 im obigen Beispiel)
h
für (positive oder negative) Zahlen h, die so richtig nahe bei 0 liegen, aber von 0 verschieden
sind. (0/0 zu berechnen, fällt auch dem Praktiker schwer! Ich kann mir nicht vorstellen, dass
Du dies in jedem Fall gleich 1 setzen würdest, nachdem du unser obiges Beispiel studiert hast.)
Der Theoretiker wird nun ‘einfach’ die Augenblicksgeschwindigkeit im Zeitpunkt x0 durch
f (x0 + h) − f (x0 )
h→0
h
lim
definieren, wobei zu beachten ist, das der Differenzenquotient für h = 0 nicht definiert ist,
also zur Berechnung nur Nullfolgen (hn )n betrachtet werden, deren Glieder sämtlich 6= 0 sind.
(Andererseits steht nirgendwo geschrieben, dass hn > 0 sein muss!)
Und da die Theoretiker auch ein paar knackige Regeln entwickeln werden, solche Grenzwerte
zu berechnen, können sie damit auch dem Praktiker höchst hilfreich sein.
Allein den entsprechenden Limes für unsere spezielle Funktion f in dem Punkte x0 = 3 auszurechnen, scheint mir schon einfacher als die oben gemachten approximativen Berechnungen:
f (x0 + h) − f (x0 )
(3 + h)3 − 5(3 + h)2 + 6(3 + h) − 33 + 5 · 32 − 6 · 3
= lim
h→0
h→0
h
h
lim
(27 + 27h + 9h2 + h3 ) − (45 + 30h + 5h2 ) + (18 + 6h) − 27 + 45 − 18
h→0
h
2
= lim (27 + 9h + h − 30 + h + 6) = 3.
= lim
h→0
Wie gesagt, es geht noch einfacher, und nicht nur für einzelne Punkte x0 . Du weißt das sicher
aus dem Schulunterricht, und hier wird es auch bald behandelt.
Definition 7.1.3 Sei D ein Intervall, x0 ∈ D und f : D → R eine Funktion. Wir definieren
die Ableitung oder Differenzialquotienten f 0 (x0 ) von f in x0 durch
f (x0 + h) − f (x0 )
f (x) − f (x0 )
= lim
x→x0
h→0
h
x − x0
f 0 (x0 ) := lim
wobei die beiden Limiten offenbar dieselben sind. (Natürlich muss dieser Limes nicht in jedem
Fall existieren!)
Ferner heißt f in x0 differenzierbar, wenn o.a. Limes existiert, genauer als reelle Zahl existiert. Die Limiten ±∞ wollen wir vorsichtshalber nicht als Ableitung zulassen!
7.1. DIFFERENZIEREN
181
7.1.4 Es ist keineswegs jede Funktion differenzierbar, z.B. nicht die Funktion, die für alle
rationalen x den Wert 1 und für die irrationalen x den Wert 0 annimmt. Diese ist überall
unstetig, und deshalb auch nirgendwo differenzierbar, wie Du gleich sehen wirst. Aber auch die
Funktion f (x) = |x| ist in 0 nicht differenzierbar. Allerdings gibt es dort eine links- und eine
rechtsseitige Ableitung. Was meine ich wohl damit?
Bei folgender (stetigen) Funktion gibt es in 0 nicht einmal diese:
1
für x 6= 0, f (0) = 0.
f : R → R, f (x) := x · sin
x
Überlege das schon einmal, wenn Du magst. Im 4. Abschnitt erfährst Du mehr hierzu.
Man kann sogar Funktionen konstruieren, die überall stetig, aber nirgendwo differenzierbar
sind.
7.1.5 Um zu sehen, dass jede in a differenzierbare Funktion f dort auch stetig ist, betrachte
eine Folge (xn )n∈N im Definitionsbereich von f , die gegen a konvergiert und xn 6= a für alle n
erfüllt. Da nach Voraussetzung die Folge
f (xn ) − f (a)
xn − a
n∈N
konvergiert, ist sie beschränkt, d.h. es gibt ein s mit
|f (xn ) − f (a)|
< s, also |f (xn ) − f (a)| < s|xn − a| für alle n.
|xn − a|
Man sieht dann leicht, dass limn→∞ f (xn ) = f (a) aus limn→∞ xn = a folgt.
7.1.6 Approximation, Tangente. Man kann die Ableitung einer Funktion f in einem Punkt
x0 ihres Definitionsbereiches auch anders beschreiben. Man kann sich fragen, wie man f in der
Nähe von x0 am besten durch eine lineare Funktion aproximieren kann, also
f (x0 + h) = f (x0 ) + c · h + ϕ(h)
schreiben kann, wobei der Korrekturterm ϕ ‘mit größerer Beschleunigung als h gegen 0 geht’.
Damit meine ich, dass
ϕ(h)
=0
lim
h→0 h
ist. Nun kann man die Gleichung 7.1.6 folgendermaßen umformen
ϕ(h)
f (x0 + h) − f (x0 )
=
−c
h
h
so dass
ϕ(h)
f (x0 + h) − f (x0 )
= 0 ⇐⇒ lim
=c
h→0 h
h→0
h
gilt. Es ergibt sich folgender
lim
182
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Satz 7.1.7 Die Funktion f ist in x0 genau dann differenzierbar und hat dort die Ableitung
f 0 (x0 ) = c, wenn sich f folgendermaßen schreiben lässt
ϕ(h)
= 0.
h→0 h
f (x0 + h) = f (x0 ) + c · h + ϕ(h) mit lim
Der Graph der Funktion g(x) = f (x0 ) + c · (x − x0 ) ist dann eine Gerade, die durch den
Punkt (x0 , f (x0 )) läuft und nahe x0 den Graphen der Funktion besser als linear, d.h. besser
als jede andere Gerade approximiert, also ihn in (x0 , f (x0 )) ‘berührt’ – d.h. die sogenannte
Tangente an den Graphen von f in diesem Punkt ist. (Wir wollen die Tangente an den
Graphen einer Funktion in einem Punkt schlicht auf diese Weise formal definieren. Es gibt
allerdings Tangenten an Graphen√von Funktionen, die
√ so nicht erfasst werden können. Z.B. hat
der Graph der Funktion f (x) = 3 x (auch g(x) = x) im Nullpunkt eine sinnvolle Tangente,
nämlich die ‘y-Achse’, ohne dass diese Funktion dort differenzierbar wäre. Wenn überhaupt
hätte dort die Ableitung den Wert ∞, den wir aber bei der Definition der Differenzierbarkeit
als Wert√der Ableitung bewusst ausgeschlossen haben. Ähnlich verhält es sich mit der Funktion,
f (x) = 1 − x2 , deren Graph ein Halbkreis ist, bei x = ±1.)
7.1.8 Das Differenzieren einer Funktion ist längst nicht so spannend, wenn man es nur in
einzelnen Punkten, als wenn man es in allen Punkten oder wenigstens den meisten Punkten des
Definitionsbereiches macht. Und wie Du vielleicht schon weißt, geht das bei vielen Funktionen
gut, z.B. bei Polynomfunktionen, oder Quotienten von solchen, dort, wo sie definiert sind. Ist
eine Funktion f : D → R auf einer Teilmenge D0 ihres Definitionsbereiches D differenzierbar, so
ist f 0 (x) für jedes x ∈ D0 definiert, mit anderen Worten, wir haben eine Abbildung f 0 : D0 → R,
die Ableitung von f .
Beispiele 7.1.9 a) Seien a, b ∈ R und f : R → R definiert durch f (x) := ax + b, so ist f
überall differenzierbar und hat die konstante Ableitung f 0 (x) = a. Du wirst keine Schwierigkeit
haben, das zu zeigen. (Es wäre ja auch saublöd, wenn eine lineare Funktion mit der Steigung a
nicht in jedem Punkt die Steigung a hätte.) Übrigens ist jede Funktion, die auf einem Intervall
überall die konstante Ableitung a hat, von der Form f (x) = ax + b. Dies ist allerdings nicht
trivial, soll aber hier als anschaulich klar angesehen werden.
b) Ein Beispiel, wo die Ableitung einer Funktion f nicht auf dem ganzen
Definitionsbereich
√
3
von f definiert ist, ist die bereits oben betrachtete Funktion f (x) = x. Hier ist D = R und
D 0 = R∗ .
7.2
Berechnungsmöglichkeiten von Ableitungen
Wir beginnn jetzt damit, für recht viele Funktionen zu zeigen, dass sie differenzierbar sind, und
gleichzeitig einfache Regeln zur Berechnung ihrer Ableitungen anzugeben. Ohne diese Regeln
wäre die Differenzialrechnung nicht halb so wichtig und berühmt, wie sie ist!
Wir benötigen dafür folgende fast selbstverständlichen Definitionen.
7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN
183
Definitionen 7.2.1 Seien f, g : D → R Funktionen und a ∈ R, so wird af , bzw. f + g, bzw.
f g durch (af )(x) := a(f (x)), bzw. (f + g)x = f (x) + g(x), bzw. (f g)(x) = f (x)g(x) für alle
x ∈ D definiert.
Ist D0 ⊂ D die Menge aller x mit g(x) 6= 0, dann definieren wir für alle x ∈ D0 die Funktion
f
f (x)
f
durch (x) =
.
g
g
g(x)
Achtung: Unterscheide zwischen dem Produkt f g und der Verkettung (Hintereinander1
ausführung) f ◦g ! Und verwechsle auch nicht f (x)
mit der Umkehrfunktion f −1 !
Satz 7.2.2 Seien a, b ∈ R und f, g : D → R auf D differenzierbare Funktionen, wobei D eine
Vereinigung von Intervallen positiver Länge ist. Dann gilt:
a) Die Funktion af + bg ist auf D differenzierbar und es ist (af + bg)0 = af 0 + bg 0 . (Man kann
dies auch in zwei Regeln aufteilen: f + g und af sind differenzierbar und haben die Ableitungen
f 0 + g 0 , bzw. af 0 .)
b) Produktregel: Die Funktion f g ist auf D differenzierbar und es ist (f g)0 = f 0 g + g 0 f .
(Vorsicht! Fast immer ist (f g)0 6= f 0 g 0 .)
c) Quotientenregel: Sei D0 die Menge
wo g(x) 6= 0 ist. Dann ist die Funktion
0 aller0 x ∈ D,
0
f
f
f
g
−
g
f
auf D0 differenzierbar und es gilt
=
.
g
g
g2
Beweis:
Den Beweis von a) überlasse ich Dir.
b) Wir benutzen die beliebte Umformung
ab − a0 b0 = ab − a0 b + a0 b − a0 b0 = (a − a0 )b + a0 (b − b0 ) und rechnen:
f (x + h)g(x + h) − f (x)g(x)
=
h→0
h
f (x + h)g(x + h) − f (x)g(x + h)
f (x)g(x + h) − f (x)g(x)
lim
+ lim
=
h→0
h→0
h
h
f (x + h) − f (x)
g(x + h) − g(x)
= lim
· g(x + h) + lim f (x) ·
= f 0 (x)g(x) + f (x)g 0 (x)
h→0
h→0
h
h
Insbesondere ist ja g in x stetig und deshalb limh→0 g(x + h) = g(x).
lim
c) Ich behandle zunächst den Fall f (x) = 1 (für alle x ∈ D) und überlasse es dann Dir, b) auf
1
das Produkt f · anzuwenden.
g
1
Wir berechnen die Ableitung der Funktion :
g
0
1
1
1
1
1 g(x) − g(x + h)
(x) = lim
−
= lim ·
=
h→0 h
h→0 h
g
g(x + h) g(x)
g(x)g(x + h)
1
g(x + h) − g(x)
g 0 (x)
lim
· lim −
=−
.
h→0 g(x)g(x + h) h→0
h
(g(x))2
Den Rest überlasse ich – wie gesagt – Dir.
184
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beispiele 7.2.3 a) Zeige mit Hilfe der Produktregel: Ist f (x) = xn mit einer natürlichen Zahl
n > 0, so gilt f 0 (x) = nxn−1 . Dies ist eine einfache Übung zur vollständigen Induktion.
b) Zeige, dass dies (für x 6= 0) auch für beliebige ganze, also auch negative n gilt. Die Ableitung
der Funktion f (x) = x0 ist 0, die 0-Funktion, auch in x = 0, jedenfalls, wenn man 00 = 1
setzt. (Die 0-Funktion ist die Funktion, die überall den Wert 0 hat.)
xn
die Funktion xn−1 . D.h.
n
zu jeder Funktion g(x) = xn mit n 6= −1 gibt es eine Funktion, deren Ableitung gleich g ist,
xn+1
eine sogenannte Stammfunktion von g, nämlich die Funktion f (x) =
. Dieser Ausdruck
n+1
1
hat keinen Sinn für n = −1. Gibt es auch eine Stammfunktion von ? Vielleicht kennst Du
x
eine solche bereits. Sonst musst Du Dich noch etwas gedulden.
c) Für n ∈ Z, aber n 6= 0 ist also die Ableitung der Funktion f (x) =
d) Berechne die Ableitung der Funktion f (x) = x3 − 5x2 + 6x + 1.
d’) Zeige allgemeiner:
Ist f (x) =
n
X
k=0
ak xk , so ist f 0 (x) =
n
X
kak xk−1
k=1
Folglich erhältst Du: Ist f (x) = an xn + · · · + a1 x + a0 ein Polynom vom Grade n ≥ 1, so
ist f 0 ein Polynom vom Grade n − 1. Hat f den Grad 0, d.h. ist f konstant, aber nicht 0,
so ist f 0 = 0, d.h. die 0-Funktion. Die Ableitung der 0-Funktion ist wieder die 0-Funktion.
Somit ist ein Polynom unendlich oft differenzierbar. Die Ableitung eines Polynoms, das nicht
konstant gleich 0 ist, ist also ‘einfacher’, nämlich von kleinerem Grad, als das Polynom selber.
Für allgemeinere Funktionen ist das aber nicht die Regel. Sehr häufig ist die Ableitung einer
Funktion komplizierter als diese selbst, wie Du schon in folgendem Beispiel siehst.
x4 + x + 1
. Allgemein besitzt eine rationale Funktion,
x2 + 1
d.h. ein Quotient zweier Polynome eine Ableitung überall da, wo sie definiert ist. Und diese
Ableitung ist wieder eine rationale Funktion.
e) Berechne die Ableitung von f (x) =
√
7.2.4 Wir wollen auch Funktionen wie n x differenzieren und erinnern uns daran, dass diese
die Umkehrfunktion von g(y) = y n ist. Genau genommen wird für jede ungerade Zahl n > 0
durch g(y) = y n eine bijektive Abbildung R → R definiert. Ist n > 0 gerade, so ist die
Funktion g(y) = y n jedenfalls als Abbildung von R+ nach R+ bijektiv. Deshalb
gibt es eine
√
−1
−1
n
Umkehrfunktion f = g : R → R, bzw. f = g : R+ → R+ , die mit f (x) = x bezeichnet
wird. Um die Ableitung von Umkehrfunktionen wollen wir uns sofort kümmern und damit auch
die Ableitungen von Wurzelfunktionen berechnen.
Dass die Abbildungen g : R → R mit g(x) = xn für ungerade n > 0, sowie
g : R∗+ → R∗+ mit g(x) = xn für gerade n > 0, bijektiv sind, ist ziemlich plausibel, aber doch
nicht ganz selbstverständlich. Die Injektivität lässt sich leicht zeigen: x1 < x2 =⇒ xn1 < xn2 . Die
Surjektivität folgt aus dem Zwischenwertsatz.
7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN
185
Satz 7.2.5 Seien I, J Intervalle, g : J → I eine bijektive stetige Funktion und f = g −1 . Ist g
in y0 ∈ J differenzierbar mit g 0 (y0 ) 6= 0, so ist f in x0 = g(y0 ) differenzierbar mit der Ableitung
1
1
= 0
.
f 0 (x0 ) = 0
g (y0 )
g (f (x0 ))
Beweis: Ich begnüge mich mit einer Plausibilitätsbetrachtung:
Betrachte eine Gerade in der x, y-Ebene, die zu keiner der beiden Achsen parallel ist. Sie ist
sowohl der Graph einer Funktion, die jedem y-Wert einen x-Wert, als auch der Graph einer
Funktion die jedem x-Wert einen y-Wert zuordnet. Ist x = ay + b, so ist y = a−1 x − a−1 b.
Sei a = g 0 (y0 ). Dann wird die Tangente an den Graphen der Funktion g im Punkte (y0 , x0 )
durch eine Gleichung der Form x = ay + b beschrieben. Der Graph der Funktion f ist derselbe,
wie der der Funktion g, wo nur die Rollen von x und y vertauscht sind. (Wenn Du, wie üblich
die ‘unabhängige Variable’ auf der waagerechten Achse variieren lassen möchtest, musst Du den
Graphen an der Geraden ‘y = x’ spiegeln.) Die Tangente im Punkte (y0 , x0 ) ist dann natürlich
dieselbe. (Genau hier wird etwas gemogelt, da die Tangente nach obiger Definition nicht völlig
symmetrisch in x, y definiert ist.) Wenn ich die Tangentengleichung nach y auflöse, erhalte ich
1
y = a−1 x − ba− 1, so dass ihre Steigung a−1 = 0
ist.
g (y0 )
√
Folgerung 7.2.6 Die √
Funktion f : R+ → R+ , x 7→ n x ist für x > 0 differenzierbar und hat
n
√
x
1 1
0
die Ableitung f (x) =
= x n −1 . (Ist n ungerade, so ist die Funktion f : R → R, x 7→ n x
nx
n
für x 6= 0 differenzierbar und hat die angegebene Ableitung.)
Beweis:
Die Umkehrfunktion von f (x) =
f 0 (x0 ) =
√
n
x ist g(y) = y n . Dann ist
1
1 √
1 n1 −1
1−n
n
=
(
x
)
=
x
.
0
n( x0 )n−1
n
n 0
√
n
Bemerkung 7.2.7 Seien f1 , . . . , fn differenzierbare Funktionen mit demselben Definitionsbereich. So ist ihr Produkt f1 f2 · · · fn ebenfalls differenzierbar und hat die Ableitung
f10 · f2 · · · fn + f1 · f20 · f3 · · · fn + . . . + f1 · · · fn−1 · fn0
(Gemeint ist eine Summe von n Produkten aus jeweils n Faktoren, wo im k-ten Summanden
der k-te Faktor die Ableitung fk0 , und für die anderen i 6= k der i-te Faktor fi ist.) Du wirst
dies sicher mit Induktion beweisen können.
Das gilt natürlich auch wenn die Faktoren einander gleich sind:
Ist n > 0 ganz und g(x) = f (x)n , so ist mit f auch g differenzierbar und g 0 (x) = nf 0 (x)·f (x)n−1 .
√ m
Schreibt man xm/n = ( n x) , so erhält man
186
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Folgerung 7.2.8 Ist a eine positive rationale Zahl, so ist f : R∗+ → R∗+ , x 7→ xa differenzierbar
und es gilt f 0 (x) = axa−1 . (Lässt sich a mit einem ungeraden Nenner schreiben, so kann man
R∗+ durch R∗ ersetzen. Für a ≥ 1 ist die Funktion auch in 0 differenzierbar.)
Mit Hilfe der Quotientenregel erhalten wir:
Folgerung 7.2.9 Dasselbe gilt, wenn a eine negative rationale Zahl (und x > 0) ist.
Bemerkung 7.2.10 Im nächsten Abschnitt werden wir zeigen, dass f 0 (x) = axa−1 für beliebige
reelle a gilt.
Bemerkungen 7.2.11 Für den Beweis des nächsten Satzes brauchen wir das Folgende:
ϕ(h)
= 0, dann ist auch
h→0 h
ϕ(ah)
ϕ(ah)
ϕ(ah)
lim
= 0. Denn dies ist für a = 0 ohnehin klar, und für a 6= 0 kann man
= a·
h→0
h
h
ah
schreiben.
a) Sei ϕ, definiert auf einer Umgebung der 0, mit der Eigenschaft lim
b) Sei a 6= 0 und ϕ wie oben, dann gibt es ein δ > 0, derart dass für alle h mit 0 < |h| < δ
die Ungleichung |ϕ(h)| < |ah| gilt. Denn angenommen, für jedes n ∈ N1 gäbe es ein hn mit
ϕ(hn )
|hn | < 1/n und |ϕ(hn )| ≥ |ahn |, dann wäre lim
6= 0 oder nichtexistent. Also muss für
n→∞ hn
ein (genügend großes) n für alle h mit |h| < 1/n die Ungleichung |ϕ(h)| < ah gelten.
c) Sei ψ eine weitere Funktion mit den genannten Eigenschaften von ϕ, dann folgt aus a) und
b) dass auch die zusammengesetzte Funktion ψ(ah + ϕ(h)) diese Eigenschaften hat. Denn für
genügend kleine |h| ist ja dann |ϕ(h)| < |ah| und folglich |ah + ϕ(h)| ≤ |ah| + |ϕ(h)| < 2|ah|.
Wie kann man z.B. die Funktion f (x) =
Regel:
√
1 + x2 differenzieren? Dazu dient folgende wichtige
Satz 7.2.12 Kettenregel: Seien I, J Intervalle und f : I → J, g : J → R Funktionen und
x0 ∈ I. Sei ferner f in x0 und g in f (x0 ) differenzierbar. Dann ist g ◦f in x0 differenzierbar
und es gilt (g ◦f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Anders ausgedrückt: Ist das lokale Wachstum von f im Punkte x0 gleich a und das lokale
Wachstum von g im Punkte f (x0 ) gleich b, so ist das lokale Wachstum von g ◦f im Punkte x0
gleich ba.
Beweis: Zunächst eine Plausibilitätsbetrachtung: Wenn man f in der Nähe von x0 durch die
approximierende lineare Funktion x 7→ ax + c ersetzt und entsprechend g in der Nähe von f (x0 )
durch die approximierende lineare Funktion y 7→ by + d, so ist die Verkettung dieser linearen
Funktionen die lineare Funktion b(ax + c) + d = bax + (bc + d), deren Wachstum gleich ba ist.
Genauer, sei f (x+h) = f (x)+ah+ϕ(h) mit limh→0 (ϕ(h)/h) = 0 und g(y+k) = g(y)+bk+ψ(k)
mit limk→0 (ψ(k)/k) = 0 für kleine |h|, |k|.
7.3. EXPONENTIAL- UND POTENZFUNKTIONEN
187
Dann ist g ◦f (x + h) = g(f (x) + ah + ϕ(h)) = g ◦f (x) + bah + bϕ(h) + ψ(ah + ϕ(h)). Es genügt
folgendes zu zeigen
bϕ(h)
ψ(ah + ϕ(h))
= 0 und lim
=0,
lim
h→0
h→0
h
h
wobei die erste Aussage trivial ist. Die zweite haben wir oben gezeigt.
Beispiel 7.2.13 Die Ableitung von f (x) =
7.3
√
2x
x
1 + x2 ist f 0 (x) = √
=√
.
2
2 1+x
1 + x2
Exponential- und Potenzfunktionen
7.3.1 Über die Funktion exp(x) = ex wissen wir aus Lemma 5.2.5 bereits folgendes:
(∗) Für |x| < 1 gilt |ex − 1 − x| < x2 .
Hieraus folgt
Lemma 7.3.2
Beweis:
ex − 1
=1
x→0,x6=0
x
lim
Wenn Du die Ungleichung (∗) durch |x| (mit 0 < |x| < 1) dividierst, erhältst Du
x
x
e − 1 − x
e − 1
< |x|
x − 1 = x
was die Behauptung des Lemmas beweist.
Theorem 7.3.3 Die Funktion exp ist differenzierbar und hat die Ableitung exp0 = exp.
Beweis:
Da ex+h = ex eh ist, gilt (mit h 6= 0)
exp(x + h) − exp(x)
eh − 1
= ex lim
= ex .
h→0
h→0
h
h
lim
Die letzte Gleichung gilt auf Grund obigen Lemmas.
Bemerkung 7.3.4 Wenn man die Exponentialreihe gliedweise differenziert, kommt man zum
selben Ergebnis. Allerdings haben wir nicht bewiesen, dass dies gerechtfertigt ist! Es gibt viele
Beispiele von Reihen (Folgen) von Funktionen, wo die gliedweise Ableitung nicht zum richtigen
Ergebnis führt.
d
Bezeichnung. Man schreibt oft dx
f (x) := f 0 (x), besonders dann, wenn die Funktion durch
einen Ausdruck gegeben ist, den man nicht erst mit f (x) benennen will. Also statt des Satzes
Ist f (x) = x2 −
√
3
(1 + 4x3 )
2 + x + x4 , so ist f 0 (x) = 2x − p
3 3 (2 + x + x4 )2
schreibt man kürzer
d 2 √
(1 + 4x3 )
3
(x − 2 + x + x4 ) = 2x − p
dx
3 3 (2 + x + x4 )2
188
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Satz 7.3.5 a) Für die Ableitung des natürlichen Logarithmus gilt:
ln0 (x) =
1
für x > 0 , ja sogar
x
d
1
ln |x| = für alle x 6= 0 .
dx
x
b) Allgemeiner gilt folglich
d
1
loga |x| =
für a > 0.
dx
x ln a
c) Für die Ableitung der Exponentialfunktion f (x) = ax (mit a > 0) gilt:
d x
a := f 0 (x) = ln(a) · ax
dx
d) Für die Ableitung der Potenzfunktion g(x) = xa (die für alle reellen a und jedenfalls für
x > 0 definiert ist) gilt
d a
x := g 0 (x) = axa−1
dx
Beweis:
a) Nach der Regel für die Ableitung der Umkehrfunktion ist
ln0 x =
1
exp0 (ln x)
=
1
1
= .
exp(ln x)
x
a’) Ist x > 0, so ist |x| = x und die Behauptung bereits bewiesen. Für x < 0 ist |x| = −x. Nach
1
1
d
ln(−x) = −
=
der Kettenregel gilt dann
dx
−x
x
b) folgt aus loga |x| = ln |x|/ ln(a)
c) Da ax = ex ln a ist, kannst Du die Kettenregel auf f (x) = ex ln a anwenden.
d) Es ist xa = ea ln x . Mit Hilfe der Kettenregel siehst Du
d a ln x a a ln x a · xa
e
= e
=
= a · xa−1 .
dx
x
x
Die Ableitung der Funktion ax ist also proportional zu ax . Und der Proportionalitätsfaktor ist
genau dann gleich 1, wenn a = e ist.
Wenn ich von der Exponentialfunktion f (x) = ax und von der Potenzfunktion g(x) = xa rede,
ist jedesmal mit x eine Variable (die sog. unabhängige Variable) und mit a eine Konstante
gemeint. Deshalb haben die Ableitungen (nach x) dieser beiden Funktionen nichts miteinander
zu tun!
Bemühe Dich, die Namen ‘Potenzfunktion’ bzw. ‘Exponentialfunktion’ immer richtig zuzuordnen.
Leider werden häufig, sogar in naturwissenschaftlichen Abhandlungen, die Begriffe ‘exponentielles Wachstum’ und ‘exponentielle Abnahme’ falsch verwendet! Alles was nicht linear ist, wird
‘exponentiell’ genannt. Diesem Missbrauch solltest Du nicht folgen.
7.4. SINUS UND COSINUS
189
7.3.6 Wir wissen jetzt, was die Ableitungen der Funktionen g(x) = xa und h(x) = ax sind.
Frage: Was ist die Ableitung der Funktion f : R∗+ → R, definiert durch f (x) = xx ?
f 0 (x) =
xx−1
x
= xx−2
ln(x) · xx
(1 + ln x)xx
Antwort: Schreibe xx = ex ln x und Du erhältst mit Hilfe der Ketten- und Produktregel die
dritte Möglichkeit als richtige Antwort! (Die Ableitung von x ln x ist ja 1 · ln x + x · x1 .)
Zur ersten Möglichkeit: Die Funktion f ist keine Funktion der Form xa mit einer Konstanten
a.
Zur zweiten Möglichkeit: Die Funktion f ist auch nicht eine Funktion der Form ax mit einer
Konstanten a.
7.4
Sinus und Cosinus
Da wir hier Abbildungen I → R2 mit einem Intervall I betrachten, wollen wir zunächst definieren, wann eine Folge von Elementen des R2 , also von Punkten oder Vektoren der Ebene, gegen
ein Element des R2 konvergiert.
Definition 7.4.1 Sei (an )n eine Folge von Elementen des R2 mit an = (an1 , an2 ). Man sagt,
die Folge (an )n konvergiert gegen ein a = (a1 , a2 ) ∈ R2 , wenn die Folge (an1 )n gegen a1 und die
Folge (an2 )n gegen a2 konvergiert.
Bemerkung 7.4.2 Wie Du weißt, kann man den Vektorraum der Ebene, oder auch die Ebene
auf vielerlei Weise mit dem R2 identifizieren. Und Du wirst fragen, ob verschiedene solche
Identifikationen zu verschiedenen Definitionen der Konvergenz führen. Glücklicher Weise ist
das nicht so.
Wenn nämlich ϕ : R2 → R2 linear ist, so sind die Komponenten von ϕ(an ) von der Form
ban1 +can2 mit geeigneten reellen Zahlen b, c. Aus Satz 3.2.27 folgt dann, dass die Komponenten
der ϕ(an ) gegen die jeweiligen Komponenten von ϕ(a) konvergieren. Ist ϕ invertierbar, so gilt
das Entsprechende für ϕ−1 .
Und wenn man die Ebene zusätzlich durch eine Verschiebung des Ursprungs auf andere Weise
mit dem Vektorraum der Ebene identifiziert, hat das erst recht keinen Einfluss auf die Konvergenz einer Folge.
7.4.3 Sei I ein Intervall in R. (Allgemeiner darf I eine beliebige Menge sein.) Eine Abbildung
γ : I → R2 bedeutet, dass jedem t ∈ I ein Paar (x, y) mit x, y ∈ R zugeordnet wird. Das heißt,
die Abbildung γ ist durch dasjenige Paar von Abbildugen (γ1 , γ2 ) gegeben, welches γ(t) =
(γ1 (t), γ2 (t)) für jedes t ∈ I erfüllt.
(Beachte, dass man eine Abbildung R2 → R, also in umgekehrter Richtung, meist nicht durch
ein Paar von Abbildungen beschreiben kann! Eines von vielen möglichen Beispielen ist die
Abbildung f , die durch f (x, y) = xy + x + y beschrieben wird.)
190
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Definition 7.4.4 Eine ebene parametrisierte Kurve ist eine stetige Abbildung γ : I → R2 ,
wobei I ein Intervall ist.
Dabei heißt γ : I → R2 eine stetige Abbildung, wenn limx→a γ(x) = γ(a) für jedes a ∈ I
gilt, das heißt, wenn sie als Paar stetiger Abbildungen (γ1 , γ2 ) mit γi : I → R gegeben ist.
Wegen obiger Bemerkung gilt die Stetigkeit der Abbildung, wenn sie bzgl. eines Koordinatensystems gilt, auch für alle anderen.
Anschaulich bedeutet eine parametrisierte Kurve, dass man einen Punkt, abhängig von der
Zeit, in der Ebene bewegt – und zwar stetig, d.h. ohne Sprünge. Wenn man z.B einen Kreis
mit dem Zirkel zeichnet, macht man so etwas.
Natürlich kann man allgemein Abbildungen γ : I → Rn betrachten. Ist n = 3, so spricht man
von Raumkurven.
Manchmal nennt man das Bild von γ (in obigem Beispiel den fertig gezeichneten Kreis) die
Spur von γ. Achte darauf, dass eine parametrisierte Kurve begrifflich nicht dasselbe bedeutet,
wie ihre Spur. Erstere ist eine Abbildung von einem Intervall nach R2 , letztere eine Teilmenge
des R2 .
γ(0)
γ(1) = γ(2)
γ(3)
3
γ(—)
2
Beispiele 7.4.5 a) Die parametrisierte Kurve γ : R → R2 , t 7→ (t, , t2 ) durchläuft die Parabel
{(x, x2 ) | x ∈ R}, d.h. den Graphen der Funktion f (x) = x2 . Die Parabel ist die Spur dieser
parametrisierten Kurve.
b) Allgemeiner: Ist f : I → R eine stetige Funktion, so ist γ : I → R2 , t 7→ (t, f (t)) eine
parametrisierte Kurve, deren Spur der Graph von f ist.
c) Peano-Kurven. Man sollte nicht glauben, dass es so etwas Verücktes wirklich gibt, nämlich
surjektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1]. Die Stetigkeit γ : I → R2 ist also eine
schwächere Bedingung als man denkt. Bijektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1] gibt
es aber nicht.
7.4.6 Ableitung einer parametrisierten Kurve. Sei γ : I → R2 eine parametrisierte
Kurve. Für t ∈ I fassen wir γ(t) als Vektor auf:
γ1 (t)
γ(t) =
γ2 (t)
7.4. SINUS UND COSINUS
191
Wenn t0 , t0 + h ∈ I also γ(t0 ), γ(t0 + h) definiert sind, dann soll natürlich γ(t0 + h) − γ(t0 ) die
Differenz der Vektoren γ(t0 + h) und γ(t0 ) bedeuten. Wir können also den ’Differenzenquotienten’
!
γ1 (t0 +h)−γ1 (t0 )
1
h
(γ(t0 + h) − γ(t0 )) =
.
γ2 (t0 +h)−γ2 (t0 )
h
h
definieren. Dann kann man auch von einer möglichen Ableitung sprechen. Wir setzen
1
γ 0 (t0 ) := lim (γ(t0 + h) − γ(t0 )) =
h→0 h
! γ1 (t0 +h)−γ1 (t0 )
0
γ
(t
)
0
1
h
lim
=
γ2 (t0 +h)−γ2 (t0 )
γ20 (t0 )
h→0
h
so dieser Limes denn existiert. Offenbar ist das genau dann so, wenn die Ableitungen γ10 (t0 )
und γ20 (t0 ) in t0 existieren. Der Differenzenquotient h1 (γ(t0 + h) − γ(t0 )) ist ein Vielfaches des
Vektors, der durch den Pfeil (γ(x0 ), γ(x0 + h)) gegeben wird.
γ(t0)
γ(t0+h0) – γ(t0)
γ(t0+h1) – γ(t0)
γ(t0+h0)
γ(t0+h1)
Wenn wir h gegen 0 gehen lassen, nähert sich der Differenzenquotient einem Vektor, der, wenn
man ihn in γ(x0 ) beginnen lässt, im anschaulichen Sinn ein Tangentenvektor an die Kurve γ(I)
ist.
Definition 7.4.7 Eine parametrisierte Kurve γ : I → R2 heißt differenzierbar, wenn in
allen t ∈ I die Ableitung von γ existiert.
7.4.8 Sei jetzt die Ebene mit einem orthonormierten Koordinatensystem versehen. Dann nennt
man den Vektor γ 0 (t) = (γ10 (t), γ20p
(t)) auch den Geschwindigkeitsvektor von γ in (d.h. zum
Zeitpunkt) t0 . Er hat die Länge γ10 (t0 )2 + γ20 (t0 )2 . Diese nennen wir die Absolutgeschwindigkeit von γ in t0 .
Bemerkungen 7.4.9 Es kann sein, dass in einem (Zeit-)Punkt t0 sowohl γ10 (t0 ) = 0 als auch
γ20 (t0 ) = 0 ist. In diesem Fall kannst Du Überraschungen erleben:
192
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
a) Betrachte z.B. γ1 (t) = γ2 (t) = t2 insbesondere im Punkte (0, 0). Die Spur dieser Kurve ist
die Halbgerade
{(x, x) ∈ R2 | x ≥ 0}
Verfolge den Weg, den γ(t) = (γ1 (t), γ2 (t) auf dem Intervall [−1, 1] durchläuft. Man startet im
Punkt (1, 1) läuft geradenwegs nach (0, 0) und von dort wieder auf geradem Weg zurück nach
(1, 1).
b) Ein weiteres Beispiel: γ(t) = (γ1 (t), γ2 (t))
γ1 (t) =
−t2 für t ≤ 0
t2 für t > 0
und γ2 (t) = t2 .
Die Spur dieser Kurve ist der Graph der Funktion f : R → R mit f (x) = |x|.
7.4.10 Der Kreis als parametrisierte Kurve. Wir haben die Funktionen Sinus und
Cosinus so definiert, dass die Abbildung
R → R2 , t 7→ (cos t, sin t)
den Einheitskreis parametrisiert, d.h. eine parametrisierte Kurve beschreibt, deren Spur der
Einheitskreis ist.
Nach Definition ist der Betrag des Geschwindigkeitsvektors für jeden Zeitpunkt gleich 1. Ferner
ist er immer gegen den Ortsvektor in mathematisch positiver Richtung um π/2 = 90o verdreht,
ist also gleich (− sin t, cos t). Das bedeutet
(cos0 t, sin0 t) = (− sin t, cos t), d.h. sin0 t = cos t, cos0 t = − sin t .
γ'(t)
cos t
γ(t)
π/2
t
–sin t
Satz 7.4.11 Die Funktionen cos, sin : R → R sind differenzierbar. Und es gilt
sin0 t = cos t, cos0 t = − sin t .
7.4. SINUS UND COSINUS
193
Beispiele 7.4.12 Mit Hilfe des Sinus (der Cosinus tut’s auch) lassen sich auf einfache Weise
Beispiele von Funktionen bilden, die sich außergewöhnlich verhalten.
a) Betrachte die Funktion ϕ(x) = sin( x1 ), die auf R∗ = R − {0} definiert ist. Nähert sich x der
Zahl 0, so ‘oszilliert’ sie immer schneller. In jedem noch so kleinen Intervall ]0, ε[ nimmt sie jede
Zahl des Intervalles [−1, 1] unendlich oft als Wert an. (Dasselbe gilt natürlich auch für jedes
Intervall ] − ε, 0[.) Somit gibt es kein a ∈ R derart, dass die Funktion
f1 : R → R mit f1 (0) = a und f1 (x) = ϕ(x) für x 6= 0
stetig wäre.
b) Betrachte nun die Funktion
f2 : R → R mit f2 (0) = 0 und f2 (x) = x · ϕ(x) für x 6= 0
Für jedes x ∈ R gilt |f2 (x)| ≤ |x|. Ist also (xn )n∈N eine Folge mit limn→∞ xn = 0, so muss
wegen |f2 (xn ) − 0| ≤ |xn − 0| auch die Folge (f2 (xn ))n∈N gegen 0 konvergieren. Diese Funktion
ist also in 0 stetig; ihre Stetigkeit und Differenzierbarkeit außerhalb 0 folgt, da sie dort eine
Verknüpfung differenzierbarer Funktionen ist.
Allerdings ist f2 in 0 nicht differenzierbar. Ihre Ableitung in 0 müsste folgender Limes sein:
f (x)
.
x→0 x
lim
Für x 6= 0 ist aber
f (x)
= ϕ(x), und gemäß a) existiert limx→0 ϕ(x) nicht!
x
c) Die Funktion
f3 : R → R mit f3 (0) = 0 und f3 (x) = x2 · ϕ(x) für x 6= 0
ist überall – auch in 0 differenzierbar. Aber ihre Ableitung ist in 0 nicht mehr stetig. Denn
f30 (0) = 0 und für x 6= 0 gilt
1
1
1
1
1
2
0
f3 (x) = 2x · sin − x
cos = 2x · sin − cos
2
x
x
x
x
x
Nun ist die Summe einer in einem Punkt x0 stetigen und einer in x0 unstetigen Funktion in
x0 unstetig. Daraus folgt, dass f30 in 0 nicht stetig ist. (Sind α, β, γ Funktionen auf demselben
Intervall mit α + β = γ und sind α, γ im Punkt a stetig, so ist β = α − γ es auch.)
d) Definiere f4 (x) := f3 (x) − 2x2 . Da |f3 (x)| ≤ x2 , also f4 (x) ≤ −x2 , ferner f4 (0) = 0 für alle x
gilt, hat f4 in 0 ein ‘absolutes’ Maximum; d.h. f4 (0) > f4 (x) für alle x 6= 0. Andererseits gibt
es beliebig nahe bei 0 Punkte x < 0 mit f40 (x) < 0 und ebenso Punkte x > 0 mit f40 (x) > 0. Es
gibt also keine ε-Umgebung in der links von 0 die Funktion monoton wächst und rechts von 0
monoton fällt, mag ε > 0 noch so klein sein.
Berechne dazu außerhalb 0 die Ableitung f40 = f30 − 2x = 2x(sin x1 − 1) − cos x1 . Es gilt
|2x(sin x1 − 1)| ≤ 2|x|(1 + 1) = 4|x| < 1 für |x| < 1/4, während cos x1 für x ∈ ] − 14 , 14 [−{0}
unendlich oft sowohl den Wert 1, wie den Wert −1 annimmt.
194
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
sin x
7.4.13 Tangens. Die Funktion tan(x) :=
ist überall da definiert, wo cos x 6= 0 ist. Sie
cos x
heißt der Tangens von x.
Die Nullstellen des Cosinus sind alle π/2 + nπ, wo n die ganzen Zahlen durchläuft. Das heißt,
dass der Definitionsbereich des Tangens die Vereinigung der unendlich vielen offenen Intervalle
]nπ − π/2 , nπ + π/2[ ist, wo n die ganzen Zahlen durchläuft.
(Geometrisch gesehen, ist tan α die Steigung der Geraden durch den Nullpunkt, die mit der
positiven x-Achse, den Winkel α bildet.)
Die Ableitung des Tangens ist nach der Quotientenregel
tan0 x =
sin0 (x) cos(x) − sin(x) cos0 (x)
cos2 x + sin2 x
1
=
=
.
2
2
cos x
cos x
cos2 x
Diese ist auf dem ganzen Definitionsbereich des Tangens positiv. Also ist der Tangens auf jedem
der Intervalle ]nπ − π/2 , nπ + π/2[ streng monoton wachsend. Geht x von unten gegen π/2,
so geht tan x gegen ∞. Geht hingegen x von oben gegen −π/2, so geht der Zähler sin gegen −1
und der Nenner von oben gegen 0, also der Tangens gegen −∞. In 0 liegt eine Nullstelle vor,
da der Zähler dort 0 und der Nenner 1 ist. Es ist
tan(−x) =
sin(−x)
− sin x
=
= − tan(x).
cos(−x)
cos x
Also ist der Graph punktsymmetrisch bzgl. des Ursprungs. Geht x von unten gegen π/2, so
geht tan x gegen ∞.
Da sin(x + π) = − sin x und cos(x + π) = − cos x, ist tan(x + π) = tan x,
Offenbar ist die Einschränkung des Tangens auf das Intervall ] − π/2 , π/2[ eine bijektive
Abildung von diesem Intervall nach R. Es gibt also eine Umkehrfunktion
arctan : R → ]− π/2 , π/2[ .
Sie wird Arcus-Tangens genannt. Beachte, dass man eine Umkehrfunktion des Tangens nur
dann (als Abbildung im strengen Sinn) bilden kann, wenn man seinen Definitionsbereich geeignet einschränkt, z.B. auf das oben genannte Intervall ] − π/2 , π/2[. Dies ist auch möglich,
wenn man den Tangens auf ein anderes Intervall der Form ]nπ − π/2 , nπ + π/2[ einschränkt.
Die Wahl n = 0 ist jedoch in gewisser Weise ausgezeichnet.
7.4.14 Auch wenn man Umkehrfunktionen des Sinus und des Cosinus bilden möchte, muss
man durch geeignete Einschränkungen den Sinus bzw. Cosinus bijektiv machen.
Für den Sinus wählt man gemeinhin den Definitionsbereich [−π/2 , π/2], für den Cosinus [0, π].
Denn offenbar hat man bijektive differenzierbare Funktionen
sin : [−π/2 , π/2] → [−1 , 1] , sowie cos : [0 , π] → [−1 , 1] .
7.4. SINUS UND COSINUS
195
1
1
0
–π/2
π/2
–1
0
π/2
π
–1
Die Umkehrfunktionen heißen Arcus-Sinus, bzw. Arcus-Cosinus und werden mit arcsin,
bzw. arccos bezeichnet. Sie haben als Definitionsbereich das abgeschlossene Intervall [−1 , 1],
sind aber nur auf dem offenen Intervall ]− 1 , 1[ differenzierbar.
7.4.15 Wir wollen noch die Ableitungen der genannten Umkehrfunktionen
p bestimmen.
2
2
Zunächst erinnern wir uns an die Formel cos x + sin x = 1, d.h. cos x = 1 − sin2 x, jedenfalls dort, wo cos x ≥ 0 ist.
a) Zum Arcus-Sinus: Nach der Regel der Ableitung einer Umkehrfunktion ist
arcsin0 x =
1
1
1
1
√
=
=p
=
.
sin (arcsin x)
cos(arcsin x)
1 − x2
1 − sin2 (arcsin)
0
Die Wurzel ist in R+ zu wählen, da der Cosinus im wie oben eingeschränkten Definitionsbereich
des Sinus nichtnegativ ist.
b) Entsprechend ergibt sich als Ableitung des Arcus-Cosinus: arccos0 x = − √
c) Zum Arcus-Tangens: arctan0 (x) =
x2 . Ferner ist
tan2 (y) =
cos2 y =
1
.
1 − x2
1
= cos2 (arctan x). Nun gilt tan2 (arctan x) =
tan (arctan x)
0
sin2 y
1 − cos2 y
1
=
=
− 1 , also
2
2
cos y
cos y
cos2 y
1
1
, und deshalb arctan0 (x) = cos2 (arctan x) =
2
1 + tan y
1 + x2
Wie die Ableitung des Logarithmus ist also auch die Ableitung des des Arcus-Tangens eine
rationale Funktion.
sin x
arcsin x
. Gilt deshalb auch arctan x =
???
cos x
arccos x
Ich muss gestehen, ich hätte nie geglaubt, dass irgendjemand auf die Idee kommen würde, dies
könnte gelten. Leider habe ich das doch erlebt!
7.4.16 Frage. Es gilt ja tan x =
196
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Antwort. Nun für x = 0 gilt diese Gleichung sogar, da sin 0 = 0, also arcsin 0 = 0 = arctan 0
ist. Aber, da sin(π/4) = cos(π/4) = 2−1/2 ist, ist tan(π/4) = 1, also arctan 1 = π/4.
Daraus folgt arctan(−1) = −π/4. Aber es ist arccos(−1) = π und arcsin(−1) = −π/2, also
arcsin(−1)
= −1/2 6= π/4. Abgesehen davon ist arctan auf ganz R definiert, arcsin und arccos
arccos(−1)
hingegen nur auf [−1, 1].
7.4.17 Eine Reihe die gegen π/4 konvergiert. Die Funktion f (x) = (1 + x2 )−1 , d.h. die
Ableitung des Arcus-Tangens lässt sich für |x| < 1 als folgende geometrische Reihe schreiben:
∞
X
1
2
4
6
=
1
−
x
+
x
−
x
±
·
·
·
=
(−1)n x2n
1 − (−x2 )
n=0
Betrachte dazu die folgende Funktion
∞
X
x2n+1
x3 x5 x7
F (x) = x −
+
−
± ··· =
(−1)n
3
5
7
2n + 1
n=0
Wie Du an der Uni lernen wirst, darf man Potenzreihen gliedweise differenzieren (s. z.B. Forster). Also ist F 0 = f und andererseits arctan0 = f . Deshalb ist F (x) − arctan(x) = c, eine
Konstante, was ich als anschaulich klar ansehen will. Da ferner offenbar arctan(0) = 0 = F (0)
ist, gilt schließlich arctan(x) = F (x) für |x| < 1. Für x = 1 konvergiert die Reihe F nach dem
Leibnizkriterium. Nach dem Abelschen Grenzwertsatz, auf dessen Beweis im ersten Semester
Du Dich freuen darfst, ist dann F (1) = arctan(1) = π/4, ausgeschrieben (Leibniz):
∞
X (−1)n
π
1 1 1
= 1 − + − ± ··· =
4
3 5 7
2n + 1
n=0
Außer den großen Lücken, die ich im Beweis gelassen habe, gibt es noch den weiteren Wermutstropfen, dass diese Reihe nicht besonders gut konvergiert.
7.5
Zur Gestalt von Funktionsgraphen
Betrachte die uns bekannte Funktion f : R → R, f (x) = x3 − 5x2 + 6x + 1.
4
3
2
1
1
2
3
4
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
197
Bis zu dem Punkt x1 ≈ 0,8 wächst diese Funktion, um anschließend wieder bis zum Punkt x2 ≈
2,6 zu fallen, von dem aus sie wieder wächst. (Weiter unten werden x1 , x2 genauer bestimmt.)
Wie kann man das erkennen, wenn man nicht allzu viele Funktionswerte berechnen möchte?
(Und selbst, wenn man die Funktionswerte an sehr vielen Stellen bestimmt hat, wissen wir
kritischen Mathematiker im Grunde nicht, was zwischen diesen Stellen passiert, auch wenn der
Praktiker unnötig finden mag.)
Du weißt vielleicht schon, dass hierzu die Differenzialrechnung nützlich ist. Dies wollen wir in
diesem Abschnitt genauer untersuchen. Dabei wirst Du, möglicherweise überrascht, feststellen,
dass es zur Bestimmung lokaler Extrema manchmal sinnvoll ist, die zweite Ableitung f 00 (s.u.)
der untersuchten Funktion f außer Betracht zu lassen, und sich stattdessen die erste Ableitung
genauer anzusehen, und nicht nur ihre Nullstellen auszurechnen. Möchte man allerdings wissen,
in welche Richtung der Graph der Funktion f gekrümmt ist, lohnt es sich schon f 00 zu berechnen.
Definition 7.5.1 Sei f : I → R eine differenzierbare Funktion und f 0 ihre Ableitung. Möglicherweise kann man f 0 wieder differenzieren. Dann wollen wir mit f 00 die Ableitung von f 0
bezeichnen. (f 00 := (f 0 )0 .) Dieses f 00 nennt man dann die zweite Ableitung von f .
Indem man das Verfahren iteriert, kann man auch versuchen, f 000 , die dritte Ableitung usw. zu
bilden. Werden Dir der Striche zuviele, schreibe f (4) für die vierte Ableitung usw., f (n) für die
n-te Ableitung. Eine Funktion f heißt n-mal differenzierbar, wenn f (n) existiert. Sie heißt
n-mal stetig differenzierbar, wenn f (n) existiert und stetig ist.
In den beiden Punkten x1 und x2 hat die obige Funktion f (x) = x3 − 5x2 + 6x + 1 lokale
Extremwerte im Sinne der folgenden Definition:
Definitionen 7.5.2 Sei f : I → R eine Funktion auf einem (endlichen oder unendlichen)
Intervall I und x0 ∈ I.
a) f heißt (auf I) monoton wachsend, wenn für alle x, y ∈ I mit x < y die Ungleichung
f (x) ≤ f (y) gilt. f heißt streng monoton wachsend, wenn aus x < y immer f (x) <
f (y) folgt. (Manchmal nennt man eine monoton wachsende Funktion auch schwach monoton
wachsend, wenn man betonen will, dass sie nicht notwendig streng monoton wachsend ist.)
b) Analog verwendet man die Bezeichnungen (schwach) monoton fallend und streng monoton fallend.
c) Man sagt, f habe in x0 ein lokales Maximum (bzw. ein lokales Minimum), wenn es
in I eine ε-Umgebung von x0 gibt, in der f keine größeren, (bzw. kleineren) Werte als f (x0 )
annimmt.
Ein lokales Extremum ist ein lokales Maximum oder ein lokales Minimum.
d) Man sagt f habe in x0 ein absolutes Maximum bzw. absolutes Minimum, falls
f (x0 ) ≥ f (x) bzw. f (x0 ) ≤ f (x) für alle x ∈ I ist.
Analog zu c) vermagst Du sicher zu definieren, was ein absolutes Extremum bedeutet.
198
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beachte, dass f : I → R ein lokales Extremum nach obiger Definition nicht in einem Randpunkt
von I annehmen kann. (Du darfst natürlich die Definition nach eigenem Gusto treffen, musst
allerdings im folgenden Satz ausschließen, dass x0 ein Randpunkt ist.)
Folgender Zuammenhang besteht zwischen den lokalen Extremwerten einer differenzierbaren
Funktion und den Nullstellen ihrer Ableitung.
Satz 7.5.3 Ist I ein Intervall, f : I → R eine differenzierbare Funktion, die in x0 ∈ I ein
lokales Extremum hat, so gilt f 0 (x0 ) = 0.
Beachte folgende Punkte: a) Nach Voraussetzung ist f 0 (x0 ) definiert und x0 kein Randpunkt
von I.
b) Die Umkehrung dieses Satzes gilt nicht. Die Funktion f (x) = x3 hat in 0 die Ableitung 0
(d.h. ihr Graph hat dort eine waagerechte Tangente). Trotzdem ist sie überall streng monoton
wachsend.
c) Wenn x0 ein Randpunkt von I ist, braucht die Behauptung des Satzes nicht zu gelten, auch
wenn f dort ein absolutes Extremum hat. Die Funktion f : [0, 1] → R mit f (x) = x hat in 0
ein absolutes Minimum, in 1 ein absolutes Maximum.
Beweis:
Sei etwa f (x0 ) ≥ f (x) für alle x in einer geeigneten ε-Umgebung in I von x0 , so ist
f (x) − f (x0 )
f (x) − f (x0 )
≥ 0 für x0 − ε < x < x0 und
≤ 0 für x0 + ε > x > x0 .
x − x0
x − x0
Daraus folgt, dass der nach Voraussetzung existierende Grenzwert
lim
x→x0
f (x) − f (x0 )
x − x0
sowohl ≤ 0 als auch ≥ 0 sein muss, also nur gleich 0 sein kann.
Die lokalen Extrema einer auf einem offenen Intervall definierten differenzierbaren Funktion
liegen also bei gewissen Nullstellen ihrer Ableitung.
Den folgenden Satz gebe ich ohne Beweis. Ich sehe ihn vielmehr als anschaulich klar an.
Satz 7.5.4 Sei f : I → R eine differenzierbare Funktion auf einem Intervall I. Gilt f 0 (x) > 0
(bzw. f 0 (x) < 0) für alle x ∈ I, so ist f auf I streng monoton wachsend (bzw. fallend).
Die Voraussetzung kann man abschwächen. Es genügt zu fordern, dass überall f 0 (x) ≥ 0 (bzw.
f 0 (x) ≤ 0) ist, aber f 0 (x) = 0 nur an endlich (oder auch nur an abzählbar) vielen Stellen
stattfindet.
Beispiel 7.5.5 Wir behandeln die o.a. Funktion f (x) = x3 − 5x2 + 6x + 1 und sehen uns ihre
Ableitung f 0 an: f 0 (x) = 3x2 − 10x + 6. Deren Nullstellen finden wir mit Hilfe quadratischer
Ergänzung:
f 0 (x) = 3(x2 −
10
5
25
5
7
x + 2) = 3((x − )2 + 2 − ) = 3((x − )2 − )
3
3
9
3
9
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
199
Die Nullstellen der Ableitung sind also
5
x1 := −
3
r
7
5
und x2 := +
9
3
Ferner siehst Du: 1. Überall dort, wo (x − 53 )2 >
wachsend.
2. Wo (x − 53 )2 <
7
9
7
9
r
7
.
9
ist, ist f 0 (x) > 0. Dort ist f streng monoton
ist, ist f 0 (x) < 0. Dort ist f streng monoton fallend.
Der 1. Fall tritt für alle x < x1 und für alle x > x2 ein.
Der 2. Fall tritt ein, falls x in dem offenen Intervall ]x1 , x2 [ liegt.
Somit haben wir obige Aussagen über den Graph von f bestätigt.
Möglicher Weise bist Du es gewohnt, die Werte der 2. Ableitung in den Punkten x1 und x2 zu
betrachten. Es ist f 00 (x) = 6x − 10, und Du kannst rechnen:
p
p
5 p
f 00 (a) = 6( − 7/9) − 10 = −6 7/9 < 0 , f 00 (b) = 6 7/9 > 0 .
3
Da f 00 (als Polynom) stetig ist, gilt f 00 (x) < 0 (bzw. f 00 (x) > 0) in einer ε-Umgebung von x1
(bzw. von x2 ) für ein geeignetes ε > 0. Also ist f 0 in einer Umgebung von x1 streng monoton
fallend (bzw. in einer Umgebung von x2 streng monoton wachsend).
Also hat f 0 nahe x1 links von x1 positive und rechts von x1 negative Werte. Entsprechend hat
f 0 nahe x2 links von x2 negative und rechts von x2 positive Werte. Somit ist f nahe x1 links
von x1 streng monoton steigend und rechts von x1 monoton fallend. D.h. f hat in a ein lokales
Maximum. Entsprechend hat f in b ein lokales Minimum.
Indem Du die oben angewandten Argumente in einer allgemeineren Situation benutzt, siehst
Du sicher folgenden Satz ein:
Satz 7.5.6 Sei I ein offenes Intervall, f : I → R eine 2-mal stetig differenzierbare Funktion. (Letzteres bedeutet, dass f 0 und f 00 auf ganz I existieren und f 00 dort stetig ist. f und f 0
sind dann – weil differenzierbar – auch stetig.) Sei a ∈ I, f 0 (a) = 0, ferner f 00 (a) < 0 (bzw.
f 00 (a) > 0) so hat f in a ein lokales Maximum (bzw. ein lokales Minimum).
Beachte die Zuordnung: Maximum, wenn f 00 (a) < 0, und Minimum, wenn f 00 (a) > 0 – nicht
etwa umgekehrt!
Bemerkung 7.5.7 Es gibt aber viele Fälle, wo es einfacher ist, die Ableitung f 0 in der Nähe
ihrer Nullstellen genauer anzusehen als in diesen das Vorzeichen von f 00 zu bestimmen, und
zwar aus folgenden Gründen:
1) Die Berechnung von f 00 mag kompliziert sein. Nur bei Polynomen ist f 00 von einfacherer
Gestalt als f 0 .
200
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
2) Manchmal ist ein Punkt a gleichermaßen eine Nullstelle von f 0 wie von f 00 , zum Beispiel
a = 0 für f (x) = ±xn , wenn n ≥ 3 ist. In einem solchen Fall kann in a ein lokales Maximum,
ein lokales Minimum oder keines von beidem vorliegen.
Wenn Du magst, kannst Du versuchen, Aussagen darüber zu beweisen, was passiert, wenn k > 0
die kleinste Zahl mit f (k) 6= 0 ist und dieses k gerade oder ungerade ist.
Aber es gibt sogar nichtkonstante Funktionen, für die alle Ableitungen f (n) existieren, und
f (n) (a) = 0 für alle n gilt. Ein Beispiel findest Du in den Übungen.
Sogar, wenn die Ableitung zwar nicht in a, aber für alle x ∈ I − {a} existiert, kann die Betrachtung der Ableitung in der Nähe von a nützlich sein. Dies zeigt folgender Satz, der fast trivial
ist.
Satz 7.5.8 Sei I ein Intervall und f : I → R stetig. Sei a ∈ I kein Randpunkt und f auf
I − {a} differenzierbar.
a) Es gebe ein ε > 0, derart dass f 0 (x) > 0 für alle x ∈]a−ε, a[ und f (x) < 0 für alle x ∈]a, a+ε[
ist, dann hat f in a ein lokales Maximum. Analog gilt: f hat in a ein lokales Minimum, wenn
...
b) Gilt f 0 (x) > 0 für alle x ∈]a − ε, a + ε[, x 6= a, so liegt in a kein lokales Extremum vor.
Dasselbe gilt, wenn f 0 (x) < 0 in einem solchem Bereich ist.
Die Umkehrung von a) gilt leider nicht, wie Beispiel d) in (7.4.12) uns gelehrt hat. (Die Aussage
b) wirst Du kaum umkehren wollen.)
Beispiele 7.5.9 a) Ein Beispiel ist f (x) = |x|, welche nach diesem Satz in 0 ein lokales Minimum hat, was du natürlich eh weißt.
b) Ein Beispiel für b) ist die Funktion f (x) = xu , wo u eine ungerade natürliche Zahl ist.
√
3
c) (Neilsche Parabel) Betrachte f : R → R, definiert durch f (x) = x2/3 = x2 . Diese Funktion
ist in der Tat überall definiert und stetig. Ihre Ableitung f 0 (x) = 32 x−1/3 ist allerdings nur auf
R∗ , d.h. überall außer in 0, definiert. Links vom Nullpunkt ist sie negativ, rechts positiv. Also
hat f in 0 ein lokales (sogar absolutes) Minimum. Ferner gilt: Nähert man sich dem Nullpunkt
von links (bzw. rechts), so geht die Ableitung monoton gegen −∞ (bzw. ∞). In 0 hat der Graph
von f eine Spitze.
1
–1
1
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
201
Definitionen 7.5.10 Sei f : I → R eine Funktion auf dem Intervall I. Sie heißt dort konvex,
wenn für je zwei Punkte x1 , x2 ∈ I und jedes λ ∈ [0, 1] die Ungleichung
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 )
gilt.
Die Funktion f heißt auf I konkav, wenn −f konvex ist.
Bemerkung 7.5.11 Konvex zu sein bedeutet also, dass zu je zwei x-Stellen der Graph der
Funktion unterhalb der zugehörigen Sekante verläuft. Das heißt aber, dass der Graph der Funktion (mit wachsendem x) linksgekrümmt ist. (Im Grenzfall ist er gerade.)
Die Definition von ‘konvex’ ist einigermaßen willkürlich. Meiner Meinung nach könnte man
die Bezeichnungen konvex und konkav genau so gut vertauschen. Gemäß obiger (allgemein
üblichen) Definition wölbt sich der Graph einer konvexen Funktion nach unten.
7.5.12 Die zweite Ableitung kann man benutzen, um zu sehen, ob die Funktion in einem
Intervall konvex oder konkav ist. Denn wenn f 00 auf einem Intervall I existiert und dort überall
≥ 0 ist, bedeutet das, dass die lokale Steigung der Funktion mit wachsendem x zunimmt, oder
zumindest nie abnimmt, d.h. dass die Funktion auf I konvex ist.
Definition 7.5.13 Sei f : I → R eine differenzierbare Funktion auf dem Intervall I und x0
ein innerer Punkt von I. Man sagt, der Punkt (x0 , f (x0 )) ist ein Wendepunkt von f , wenn
es ein ε > 0 derart gibt, dass f entweder auf ]x0 − ε, x0 ] konvex und auf [x0 , x0 + ε[ konkav ist,
oder auf ]x0 − ε, x0 ] konkav und auf [x0 , x0 + ε[ konvex ist.
7.5.14 Wenn eine Funktion auf einem Intervall I zweimal stetig differenzierbar ist (d.h. ihre
zweite Ableitung existiert und stetig ist) und den Wendepunkt (x0 , f (x0 )) (mit x0 ∈ I) hat,
gilt f 00 (x0 ) = 0.
Denn f 00 wechselt bei x0 das Vorzeichen, da der Graph von f auf der einen Seite von x0 konvex,
auf der anderen konkav ist.
Hinreichend, dafür, dass (x0 , f (x0 )) ein Wendepunkt sei, ist die Bedingung f 00 (x0 ) = 0 keineswegs, wie das Beispiel f (x) = x4 , x0 = 0 zeigt. Bei dieser Funktion ist f 00 (x) ≥ 0 auf beiden
Seiten von 0. Also ist diese Funktion auf beiden Seiten konvex.
Hingegen hat die Funktion f (x) = x5 in 0 einen Wendepunkt. Sie ist links von 0 konkav, rechts
von 0 konvex.
AUFGABEN
Eine Polynomfunktion hat die Form f (x) = an xn + an−1 xn−1 + · · · + a1 x1 + a0 x0 . (Natürlich
schreibt man die letzten beiden Summanden in der Regel a1 x, a0 .) Das Nullpolynom ist als Polynomfunktion die Nullfunktion. Dessen Grad ist per definitionem gleich −∞. Ansonsten gibt
es ein n mit an 6= 0 und ak = 0 für alle k > n. In diesem Fall ist der Grad der Polynomfunktion
202
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
gleich n und an wird als der Leitkoeffizient bezeichnet. Wenn man durch an dividiert, erhält man
eine Polynomfunktion mit dem Leitkoeffizienten 1, die sich von der ursprünglichen Funktion
nur durch einen konstanten Faktor unterscheidet. Der Graph der ursprünglichen Funktion entsteht aus der neuen durch Streckung oder Stauchung in Richtung der y-Achse“ und möglicher
”
Weise noch einer Spiegelung an der x-Achse“. Die x ∈ R, wo f eine Nullstelle, bzw. in Extre”
mum hat, bleiben dieselben. Allerdings, war an < 0, so liegt ein Minimum (bzw. Maximum)
dort, wo vorher ein Maximum (bzw. Minimum) lag. Jedenfalls bedeutet es keine ernsthafte
Einschränkung, wenn man sich auf Polynomfunktionen beschränkt, deren Leitkoeffizient gleich
1 ist.
1. Diskutiere allgemeine Polynomfunktionen f vom Grad ≤ 3. Zeige:
a) Ist grad(f ) ≤ 0, d.h. grad(f ) = −∞ oder grad(f ) = 0, so ist der Graph von f eine Gerade
parallel zur x-Achse.
b) Ist grad(f ) = 1, so ist der Graph von f eine Gerade, die weder parallel zur x- noch zur
y-Achse ist. (Eine Parallele zur y-Achse ist kein Graph einer Funktion.) f hat genau eine
Nullstelle.
c) Ist grad(f ) = 2, so gibt es genau ein x0 , in dem f ein lokales Extremum hat. Dieses ist auch ein
globales Extremum. Je nach dem Vorzeichen des Leitkoeffizienten ist der Graph überall konvex
oder überall konkav. Sei etwa der Leitkoeffizient positiv. Dann ist das (lokale und globale)
Extremum ein Minimum. Je nachdem ob f (x0 ) > 0 oder = 0 oder < 0 ist, hat f keine, eine
oder 2 Nullstellen im Reellen.
d) Sei f (x) = a3 x3 + a2 x2 + a1 x + a0 und a3 > 0. Dann ist f für x ≤ a2 /(3a3 ) konkav, für
x ≥ a2 /(3a3 ) konvex und hat in a2 /(3a3 ) einen Wendepunkt.
Unterscheide nun zwei Fälle:
1. f 0 hat höchstens eine Nullstelle, d.h. f 0 (x) ≥ 0 gilt für alle x ∈ R und f 0 (x) > 0 für x 6= 0.
Dann ist f überall streng monoton wachsend. Somit hat f nur eine reelle Nullstelle.
2. f 0 hat zwei verschiedene Nullstellen x1 und x2 . Dann ist f für x ≥ x1 streng monoton
wachsend für x ≤ x1 , streng monoton fallend für x1 ≤ x ≤ x2 und wieder streng monoton
wachsend für x2 ≤ x. Durch Veränderung des konstanten Koeffizienten, kann man erreichen,
dass f eine, zwei, oder drei reelle Nullstellen hat.
e) Wenn Du magst, kannst Du noch ein wenig über Polynome 4. Grades herausfinden. Bei
positivem Leitkoeffizienten kann es zwei lokale Minima und dazwischen ein lokales Maximum
geben. das ist der Fall, wenn die Ableitung drei verschiedene Nullstellen hat. Usw. Überlege
insbesondere, dass ein Polynom 4. Grades entweder zwei verschiedene Wendepunkte oder gar
keinen solchen hat!
2. a) Zeige, dass die Abbildung ] − 1, 1] → R+ , gegeben durch x 7→
1−x
1+x
b) Zeige selbiges für die Abbildung ] − 1, 1[→ R, gegeben durch x 7→
bijektiv ist.
x
1−x2
3. Betrachte für x =
6 0 die Funktion f (x) = exp(−1/x2 ). Wenn x gegen 0 geht, so geht −1/x2
gegen −∞, also f (x) gegen 0. Deshalb definieren wir f auf ganz R, indem wir noch f (0) = 0
7.6. AMÜSANTE FRAGEN ZU POTENZEN
203
setzen. Da f (x) > 0 für x 6= 0 gilt, hat f in 0 ein (absolutes) Minimum. Das kann
man auch
2
−1
mit Hilfe der ersten Ableitung sehen. Diese ist nämlich f 0 (x) = 3 · exp
, also negativ
x
x2
für x < 0 und positiv für x > 0. Auf der anderen Seite kann man mit einiger Mühe beweisen,
dass f auch im 0-Punkt unendlich oft differenzierbar ist und f (n) (0) = 0 für alle n ≥ 0 gilt.
(Mit f (n) wird die n-te Ableitung von f bezeichnet, wo f (0) = f sei.)
4. Sei f die Funktion der vorigen Aufgabe und g : R → R definiert durch
−f (x) für x < 0
.
g(x) :=
f (x) für x ≥ 0
Auch diese Funktion ist überall unendlich oft differenzierbar und es gilt g (n) (0) = 0 für alle
n ≥ 0. Ferner hat g in 0 kein (lokales) Extremum.
√
5. Diskutiere die Funktionsgraphen von a) f (x) = x5 −x3 b) g(x) = x3 − 3 x c) h(x) = x2/3 +x−1
ln x
6. Der Graph der Funktion f (x) =
, die auf R∗+ definiert ist, wird im folgendem Abschnitt
x
diskutiert. Das darfst Du natürlich bereits jetzt selber machen.
7. Definiere f : ]− 1, 1[→ R durch f (0) = 0 und f (x) = |x|/(ln |x|) für x 6= 0. Außerhalb 0 ist
diese Funktion differenzierbar. Zeige, dass sie auch in 0 differenzierbar ist. Sie hat dort offenbar
ein absolutes Maximum.
7.6
Amüsante Fragen zu Potenzen
7.6.1 Für beliebige reelle Zahlen a, b gilt: a + b = b + a und ab = ba.
Für Potenzen ist das bekanntlich anders:
23 = 8, aber 32 = 9.
Allgemein gilt: Sind a, b natürliche Zahlen, a gerade, b ungerade, so ist ab gerade und ba ungerade. Für ganze Zahlen a, b mit 3 ≤ a < b ist ba < ab .
Hingegen gilt 24 = 42 . Gibt es weitere solche Fälle?
Wir vergleichen
278
94
9
27
mit
4
8
und rechnen:
278
9
=
4
2 ! 32 · 94 2· 32 · 94
3
3
=
=
2
2
3 ! 94 94
3
27
=
2
8
204
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Allgemeiner zeigt man ganz analog zur dieser Rechnung: Ist
n
n+1
1
1
a= 1+
, b= 1+
,
n
n
so gilt ab = ba . Man erkennt schon hier, dass es unendlich viele Paare verschiedener rationaler
Zahlen (a, b) mit ab = ba gibt.
7.6.2 Wir wollen alle Paare (x, y) positiver reeller Zahlen mit xy = y x finden. Will man Potenzen vergleichen, lohnt es sich häufig, sie zu logarithmieren! Es gilt:
xy = y x ⇐⇒ ln(xy ) = ln(y x ) ⇐⇒ y ln x = x ln y ⇐⇒
ln x
ln y
=
x
y
Will man also Paare (x, y) positiver reeller Zahlen mit xy = y x , x 6= y finden, so hat man die
ln x
Funktion f (x) =
darauf zu untersuchen, ob sie mehrfach denselben Wert annimmt!
x
Deshalb werden wir diese Funktion auf ihrem Definitionsbereich, d.h. dem Bereich der positiven
reellen Zahlen, jetzt diskutieren. Dabei benutzen wir die Differentialrechnung.
i. Nullstellen:
f (x) = 0 ⇐⇒ ln x = 0 ⇐⇒ x = 1.
Offenbar ist f (x) < 0 für 0 < x < 1 und f (x) > 0 für x > 1.
ii. Verhalten der Funktion nahe 0. Offenbar geht f (x) gegen −∞, wenn x (von oben) gegen 0
geht.
iii. Die Ableitung:
(1/x) · x − 1 · ln x
1 − ln x
=
2
x
x2
Also ist f 0 (x) = 0 genau dann, wenn x = e ist. Ferner ist f 0 (x) > 0 für 0 < x < e und f 0 (x) < 0
für x > e.
f 0 (x) =
Also kann man sich bereits ein Bild der Funktion machen. Ihr Graph steigt zwischen 0 und e
monoton an, läuft bei 1 durch die x-Achse, erreicht bei e ein Maximum und fällt für x > e
monoton, bleibt aber positiv.
iv. Verhalten für große x. Man weiß, dass die Logarithmusfunktion sehr langsam wächst. Deshalb
gilt limx→∞ f (x) = 0. Dies kannst Du leicht folgendermaßen sehen:
Da f (x) für x ≥ e monoton fallend ist, genügt es, eine monoton wachsende Folge (xn )n>0 zu
finden, für welche limn→∞ f (n) = 0 gilt. Eine solche Folge wird durch xn := en gegeben. Denn
für diese gilt: f (n) = n/en . Nun folgt aus der Exponentialreihe en > 1 + n + n2 /2 > n2 /2. Somit
ist
n
2n
2
f (n) = n < 2 =
e
n
n
Da letzter Bruch für n → ∞ gegen 0 geht, tut dies auch f (n).
Was erkennst Du aus den Eigenschaften i. bis iv.?
7.6. AMÜSANTE FRAGEN ZU POTENZEN
205
Zu jeder reellen Zahl x mit 1 < x < e gibt es genau eine weitere Zahl y mit f (x) = f (y), und
dieses y ist größer als e. Nicht wahr?
Es gibt also sehr viele Paare positiver reeller Zahlen (x, y), für die xy = y x , aber x 6= y gilt.
Verlangt man allerdings, dass x, y beide ganz und positiv sind, so ist, bis auf die Reihenfolge,
(2, 4) das einzige solche Paar, da 2 die einzige ganze Zahl ist die größer als 1 und kleiner als e
ist.
Beachte aber, dass auch (−2)−4 =
1
(−2)4
=
1
16
= (−4)−2 gilt.
7.6.3 Betrachte die Funktionen
1
1
f (x) := (1 + )x und g(x) := (1 + )x+1
x
x
für x > 0. Mit einiger Mühe kann man zeigen: Die Funktion f ist streng monoton wachsend,
während g streng monoton fallend ist. Ferner gilt:
1
1
lim (1 + )x = 1 und lim (1 + )x = e.
x→0
x→∞
x
x
Man berechnet leicht f (x)g(x) = g(x)f (x) . Somit hat man eine Parametrisierung der Paare (a, b)
positiver reeller verschiedener Zahlen mit ab = ba gewonnen.
Aus obigen Überlegungen folgt auch
Satz 7.6.4 a) Es gelte 0 < a < b ≤ e. Dann ist ab < ba .
b) Es gelte e ≤ a < b. Dann ist ba < ab . Z.B. ist π e < eπ .
ln x
ist auf dem Intervall ]0, e] streng monoton wachsend, wie wir
x
ln a
ln b
oben gesehen haben. Deshalb folgt aus der Voraussetzung, dass
<
. Dies impliziert
a
b
b ln a < a ln b. (Beachte a, b > 0.) Da exp streng monoton wächst, ergibt sich exp(b ln a) <
exp(a ln b), das heißt ab < ba .
Beweis:
a) Die Funktion
b) Auf dem Intervall [e, ∞[ hingegen ist o.a. Funktion streng monoton fallend. Deshalb ergibt
sich die umgekehrte Ungleichung.
Bemerkungen 7.6.5 a) Du hast vielleicht das Gefühl, dass der Exponent in einer Potenz in
stärkerem Maße ihre Größe bestimmt als die Basis. Das gilt aber nur, falls beide ≥ e sind.
Falls beide ≤ e und positiv sind, gilt das umgekehrte. Im Fall a < e 32,5 ≈ 15,59. Zu Anfang dieses Abschnittes haben
wir für die Zahlen a = 9/4, welches kleiner als e, und b = 27/8, welches größer als e ist, die
Gleichheit ab = ba besteht.
206
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
b) Zu meinem Erstaunen habe ich in einem neuen Mathe-Buch gelesen, im 19. Jahrhundert sei
es eine Herausforderung gewesen, zu entscheiden, welche der beiden Zahlen π e und eπ die größere
sei. Ich kann mir nicht vorstellen, dass Euler, der im 18. Jahrhundert gelebt hat, auch nur die
geringste Schwierigkeit mit diesem Problem gehabt hätte. Der Unterschied zwischen den beiden
Zahlen ist einerseits nicht allzu groß, andererseits nicht gerade winzig: π e ≈ 22,46, eπ ≈ 23,14.
7.6.6 Wir betrachten Potenztürme
·
··
a
aa
In der Literatur habe für einen solchen Potenzturm folgende abkürzende Notation gefunden:
nämlich n a, sprich ‘a Turm n’, wenn der Potenzturm n Stockwerke hat. Induktiv definiert, heißt
das:
n
1
a = a, n+1 a = a( a)
Beachte aber, dass fast immer
n+1
a 6= (n a)a ist!
Man kann die induktive Definition auch mit 0 a = 1 oder, sage und schreibe, mit
beginnen.
−1
a = 0
2
7.6.7 Die Folge (2, 22 , 22 , . . .) ist streng monoton√wachsend und besteht aus ganzen Zahlen.
Deshalb gilt limn→∞ n 2 = ∞. Auch die Folge (n ( 2))n ist streng monoton wachsend.
Denn
√ x
√
√ √2
die Funktion √f (x) := 2 ist streng monoton wachsend. Deshalb ist 2 < 2 , folglich
√ √ 2 √ √2 2
√
√
2 < 2
. Usw. Man sieht (mit vollständiger Induktion) n ( 2) < n+1 ( 2). Analog gehts
für alle (n b)n mit b > 1.
Sind die Limites dieser Folgen immer ∞?
Überraschender Weise gilt
√
lim n ( 2) = 2
n→∞
√
Beweis: Wenn man in dem Potenzturm n ( √
2) das oberste Stockwerk durch 2 ersetzt, erhält
man eine Zahl T , die sicher größer ist als n ( 2). Andererseits überlegt man sich leicht, dass
T = 2 ist. In einem exemplarischen Beispiel sieht man das so.
√
√
2
√ 2
2
√
√
2
2
=
2
=
√
2
2 =2.
√ 2
√
In √
jedem Schritt wird 2 = 2 genutzt. Es ist also n ( 2) < 2 für alle n ≥ 1. Da die Folge
(n ( 2))n monoton wachsend und durch 2 nach oben beschränkt ist, hat sie einen endlichen
Limes t ≤ 2.
2
Um t zu bestimmen, rechnen wir
√
t
2 =
√
√
limn→∞ n ( 2)
2
√
= lim n ( 2) = t
n→∞
√ t
Die Gleichung 2 = t hat die Lösungen t = 2 und t = 4. Durch eine Kurvendiskussion kannst
Du feststellen, dass sie keine weiteren haben kann. Wegen t ≤ 2 folgt t = 2. –
7.6. AMÜSANTE FRAGEN ZU POTENZEN
207
Diese Überlegungen kann man allgemeiner, statt nur für 21/2 für a1/a mit a ≥ 1 anstellen. Da
ln(a1/a ) =
ln a
a
ist, ist die größte der Zahlen unter den a1/a – mit a > 0 – die Zahl e1/e . (Beachte, dass nach
obigen Betrachtungen die Funktion ln x/x ein Maximum bei x = e hat.)
Für a ∈ [1, e] ist limn→∞ n (a1/a ) = a. Für a > e ist limn→∞ n (a1/a ) = b, wobei b ∈]1, e[ so
gewählt ist, dass ab = ba ist. Nicht wahr?
Zum Schluss beweisen wir
lim n b = ∞, falls b > e1/e gilt.
n→∞
Da die Folge (n b) monoton wachsend ist, genügt es zu zeigen, dass sie keinen endlichen Limes
hat. Wäre dieser gleich t, so würde bt = t, also b ≤ t1/t gelten (s.o.). Deshalb wäre b ≤ e1/e . –
Fragt man nach der Konvergenz von (n b)n für 0 < b < 1, so kann man beweisen, dass dieselbe
genau für die b ≥ (1/e)e gilt. Dabei ist zu beachten, dass die Folge (n b)n hier nicht mehr
monoton ist.
AUFGABEN
1. Sei ein gewisses Kapital auf Zinseszins mit 1 Prozent jährlicher Verzinsung angelegt. Nach
wievielen Jahren hat es sich (mindestens) verdoppelt?
2. Haben die Gleichungen
x2 = 3 und 2x = 3
eine gemeinsame Lösung? (Die Beantwortung dieser Frage ist sicher mit einem Taschenrechner,
der allgemeine Potenzen beherrscht, am schnellsten zu leisten. Aber versuche es ohne einen
solchen.) Hat eine dieser Gleichungen eine rationale Lösung?
3. Berechne ohne Taschenrechner
88
1/3
− (88 )1/3
5
3
+ 13
5
4. Welche Zahl ist größer, (1000 + 1/7)1000 oder 10001000+1/7 ?
√
√
5. a) Welche Zahl ist größer, 2 oder 3 3?
√
√
b) Sei n ≥ 3 ganz. Welche Zahl ist größer, n n oder n+1 n + 1?
√
c) Bestimme – falls möglich – limn→∞ n n.
6. Welche Zahl ist größer,
√
√
3
2
2
oder
√
3
√
2 2?
7. a) Seien a n 9, wenn m ≥ n+1, d.h. wenn der Dreierturm mindestens
ein ‘Stockwerk’ mehr als der Neunerturm hat.
208
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
8. Sei a > 2 reell und b = aa−1 (> a). Zeige für die Potenztürme
n+1
a > nb .
9. a) Die Idee (7.6.7) kann man zur Berechnung vieler Limites verwenden: Sei I ein Intervall
und f : I → I eine stetige Funktion, ferner b ∈ I. Betrachte die Folge (an ), definiert durch
a0 = b, an+1 = f (an ). Zeige: Wenn diese Folge den Limes a hat, so ist a eine Lösung der
Gleichung x = f (x).
b) Beachte, dass manchmal die Gleichung x = f (x) eine Lösung haben kann, ohne dass die
Folge (an ) konvergiert. Z.B. sei – mit obigen Bezeichnungen – I = R, f (x) = x2 , b = 2. Wenn
Du willst, kannst Du Dir überlegen, für welche b die Folge (an ) konvergiert.
√
c) Behandle den Fall I = R+ , b = 0, f (x) = c + x, wo c > 0 ist. (Zum Beweis der Konvergenz
der Folge (an ) zeige, dass diese monoton wachsend ist und eine obere Schranke hat. Ich glaube,
man sollte die Fälle c < 2 und c ≥ 2 unterscheiden. Im ersten Fall ist 2, im zweiten c eine obere
Schranke.)
x
10. Löse die Gleichung x(x ) = (xx )x im Bereich R∗+ der positiven reellen Zahlen.
2
11. Löse die Gleichungen a) 2x + 2111110 = 2111111 und b) 2x = 512x+28 .
7.7
Integration
Bereits die Mathematiker der Antike befassten sich damit, die Länge einer Kurve, z.B. des
Kreisumfangs, und die Größe eines ‘krumm’ begrenzten Flächenstücks, z.B. der Kreisfläche zu
bestimmen. Sie wussten, das das Verhältnis des Kreisumfangs zum Durchmesser gleich dem
Verhältnis der Kreisfläche zum Quadrat über dem Radius ist. Den Proportionalitätsfaktor nennen wir heute π. Archimedes hat ein Verfahren angegeben, π näherungsweise zu berechnen und
auch gezeigt, dass das Volumen einer Kugel vom Radius r gleich 34 πr3 ist. Archimedes ist es
auch gelungen, die Fläche eines Parabelabschnittes zu bestimmen.
Während diese Berechnungen eher Einzelfälle betrafen, kennen wir seit der zweiten Hälfte des
17. Jahrhunderten eine Methode, solcherart Fragestellungen anzugehen. Wir betrachten eine
stetige Funktion f und Flächenstücke zwischen zwei Grenzen unterhalb des Graphen von f und
oberhalb der x-Achse, wenn denn f (x) ≥ 0 in diesem Bereich ist. Ist f (x) stellenweise negativ,
so sollen die Flächenstücke, die nach unten durch den Funktionsgraphen und nach oben durch
die x-Achse begrenzt werden, negativ angerechnet werden.
7.7. INTEGRATION
209
+
–
Die große Idee von Newton, Leibniz und auch Vorgängern war es, eine der Grenzen als
variabel aufzufassen, so dass die Flächengröße wieder zu einer Funktion wird, die man häufig
(allerdings nicht immer) durch die uns bekannten Funktionen angeben kann.
Dies liegt an dem berühmten ‘Hauptsatz der Differential- und Integralrechnung’, den ich Dir
jetzt ans Herz legen möchte.
7.7.1 Ich will zunächst eine präzise Definition für Integrale (nach Riemann) angeben, damit
Du siehst, dass es eine solche überhaupt gibt, die zudem noch verhältnismäßig einfach ist.
Einige Sätze der Integralrechnung will ich dann aber als anschaulich einleuchtend ohne Beweis
angeben.
Wir beginnen mit Funktionen, die zwar im Allgemeinen nicht stetig sind, deren Integral aber
trivial zu definieren ist.
Definitionen 7.7.2 a) Eine Treppenfunktion auf einem endlichen abgeschlossenen Intervall
[a, b] ist eine Funktion f , für die es endlich viele reelle Zahlen t0 , . . . , tn mit a = t0 < t1 < · · · <
tn = b gibt, derart dass f auf jedem der offenen Intervalle ]ti−1 , ti [ konstant ist. (Für die Werte
f (ti ) wird nichts gefordert.)
b) Sei f : [a, b] → R eine Treppenfunktion mit zugehörigen t0 , . . . , tn wie oben und f (x) = ci
für x ∈]ti−1 , ti [. Das Integral von f ist dann folgendermaßen definiert:
Z b
n
X
f (x)dx :=
ci · (ti − ti−1 )
a
i=1
Das ist natürlich schlicht die Summe der Rechteckflächen, wobei die Rechtecke unterhalb der
x-Achse negativ gerechnet werden.
+
–
+
210
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Definitionen 7.7.3 a) Sei f : [a, b] → R eine beschränkte Funktion. (‘Beschränkt’ bedeutet: es gibt ein S ∈ R mit |f (x)| ≤ S für alle x ∈ [a, b].) Betrachte die Menge M aller
Treppenfunktionen s auf [a, b] mit s(x) ≥ f (x) für alle x ∈ [a, b]. Sie ist nicht leer, da die
konstante Funktion mit dem Wert S zu M gehört. Die Menge der Integrale
Z b
s(x)dx mit s ∈ M
a
ist nach unten durch −S · (b − a) beschränkt. Also hat sie ein Infimum. (S. 3.2.24.) Dieses
nennt man das Oberintegral von f .
b) Entsprechend ist das Unterintegral von f das Supremum der Menge aller Integrale über die
Treppenfunktionen, deren Werte überall kleiner oder gleich den jeweiligen Werte von f sind.
c) In dem Falle, dass das Oberintegral von f mit seinem Unterintegral übereinstimmt, heißt f
Riemann-integrierbar, und das gemeinsame Ober- und Unterintegral von f wird dann das
Integral von f genannt. Die Bezeichnung ist
Z b
f (x)dx.
a
Bemerkungen 7.7.4 a) Nicht jede beschränkte Funktion auf [a, b] ist Riemann-integrierbar,
z.B. nicht die Funktion, die auf den rationalen Zahlen den Wert 1, auf den irrationalen den
Wert 0 annimmt. Es gibt allerdings einen Integralbegriff, nämlich denjenigen nach Lebesgue
(sprich Lebeck, mit Ton auf der zweiten Silbe), der es gestattet, diese Funktion zu integrieren.
Sie hat das Integral 0, da sie nur in abzählbar vielen Punkten von der 0-Funktion abweicht.
Der Lebesguesche Integralbegriff ist weniger wegen obigen Beispiels, als für Funktionen von
mehreren (unabhängigen) Variablen von größter Wichtigkeit!
R
Rb
b) Das -Zeichen ist ein stilisiertes S für Summe, und a f (x)dx soll etwa folgende bedeuten:
Für jedes x ∈ [a, b] multipliziere f (x) mit der Länge dx eines unendlich kleinen Intervalls und
addiere alle diese Produkte. Du musst das nicht verstehen und darfst das dx schlicht als Zeichen
dafür ansehen, bezüglich welcher Variablen man integrieren soll, wenn etwa f eine Funktion
zweier Variablen ist.
Definition 7.7.5 Wir wollen auch das Integral definieren, wenn die Genzen vertauscht sind
und setzen
Z b
Z a
f (x)dx,
f (x)dx := −
a
b
wenn letzteres Integral existiert.
Ferner sei
Z
a
f (x)dx = 0.
a
Jetzt gebe ich drei Sätze ohne ihren Beweis an. Anschaulich sind sie allerdings sehr plausibel.
7.7. INTEGRATION
211
Satz 7.7.6 Jede stetige Funktion auf einem endlichen abgeschlossenen Intervall ist Riemannintegrierbar.
Satz 7.7.7 Seien a ≤ b ≤ c, so ist
Z c
Z b
Z c
f (x)dx =
f (x)dx +
f (x)dx,
a
a
b
wenn die linke (oder die rechte) Seite definiert ist.
a
b
c
Folgerung 7.7.8 Dasselbe gilt auch, wenn a, b, c in beliebiger Größenbeziehung zueinander stehen und f auf dem größten der Intervalle, die zwei der drei Punkte als Randpunkte haben,
integrierbar ist.
Satz 7.7.9 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R eine stetige
Funktion, dann gibt es ein ξ ∈ [a, b] mit
Z
b
f (x)dx = (b − a)f (ξ)
a
(f (ξ) ist der ‘Mittelwert’ der Funktion f auf [a, b].)
a
ξ
b
212
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Als Folgerung beweisen wir jetzt den Hauptsatz der Differential- und Integralrechnung:
Theorem 7.7.10 Sei I eine Intervall, a ∈ I und f : I → R eine stetige Funktion, dann ist die
Funktion
Z x
F (x) :=
f (t)dt
a
0
eine Stammfunktion von f . D.h. es gilt F (x) = f (x) für alle x ∈ I.
In diesem Sinne ist das Integrieren die Umkehrung des Differenzierens!
Beweis: Wir müssen für jedes x ∈ I die Differenzierbarkeit von F in x zeigen und F 0 (x) =
f (x) nachweisen. Wir betrachten einen Differenzenquotienten:
Z x+h
Z x
Z
1
1 x+h
1
F (x + h) − F (x)
=
f (x)dx −
f (x)dx =
f (x)dx = · h · f (ξ),
h
h
h x
h
a
a
wobei ξ eine (von h – nicht unbedingt eindeutig – abhängige) geeignete Zahl zwischen x und
x+h ist, die nach dem Mittelwertsatz der Integralrechnung existiert. Sei nun (hn ) eine Nullfolge
und jeweils ξn zwischen x und x + hn so gewählt, dass
Z x+hn
Z x+hn
1
f (t)dt = hn f (ξn ) , d.h.
f (t)dt = f (ξn )
hn x
x
gilt, so konvergiert die Folge (ξn ) gegen x. Wegen der Stetigkeit von f ist somit
F (x + h) − F (x)
= f (x)
h→0
h
lim
Folgerung 7.7.11 Sei f : [a, b] → R stetig und F : [a, b] → R eine Stammfunktion von f , d.h.
F sei differenzierbar mit F 0 = f . Dann gilt
Z b
f (x)dx = F (b) − F (a)
a
Beweis:
Definiere
Z
G(x) :=
x
f (t)dt
a
Wegen des Hauptsatzes 7.7.10 ist G eine Stammfunktion von f . Da nach Voraussetzung auch
F eine solche ist, gilt (G − F )0 = G0 − F 0 = f − f = 0, also ist G − F eine Konstante, die ich
mit c bezeichne. Ferner ist G(a) = 0. Dann ergibt sich
Z b
f (x)dx = G(b) = G(b) − G(a) = F (b) + c − (F (a) + c) = F (b) − F (a) .
a
b
Schreibweisen: F (b) − F (a) = F (x) = [F (x)]ba .
a
7.7. INTEGRATION
213
7.7.12 Auf Grund unserer Kenntnisse in der Differenzialrechnung wird es uns möglich sein, für
viele (durch einen Rechenausdruck gegebene) Funktionen f eine Stammfunktion F zu finden
(genauer: einen Rechenausdruck für F anzugeben). Du wirst z.B. keine Probleme haben, eine
Stammfunktion einer Polynomfunktion als eine ebensolche anzugeben.
Eine Stammfunktion F einer stetigen Funktion f (auf einem Intervall) nennt man auch (ein)
unbestimmtes Integral von f und schreibt häufig
Z
Z
f (x)dx = F (x) oder
f (x)dx = F (x) + C
F ist ja bis auf einen konstanten Summanden (der durch das +C angedeutet wird) eindeutig
bestimmt. Ebenso ersetzt man häufig den Ausdruck ‘eine Stammfunktion von f bestimmen’
durch ‘f integrieren’.
In folgender Tabelle sind in der rechten Spalte Stammfunktionen der linksstehenden Funktionen
verzeichnet:
xa , a ∈ R, a 6= −1
x−1
(1+x2 )−1
(1-x2 )−1/2
ex
sin x
cos x
cos−2 x
(a+1)−1 xa+1
ln |x|
arctan x
arcsin x
ex
-cos x
sin x
tan x
Der Hauptsatz der Differenzial- und Integralrechnung lehrt uns, dass jede stetige Funktion
auf einem Intervall eine Stammfunktion besitzt. Das bedeutet allerdings nicht, dass man eine
solche als eine Zusammensetzung, der uns bekannten Funktionen schreiben kann. Dies ist z.B.
2
für eine Stammfunktion von ex nicht möglich. (Das besagt ein Satz von Liouville. Für
neuere Literatur siehe das Stichwort Elementare Funktion“ in der Wikipedia. ) Natürlich
”
2
bedeutet dieser Satz nicht, dass es keine Stammfunktion von ex gäbe! Jede auf einem Intervall
stetige Funktion hat schließlich dort eine Stammfunktion. Man kann sie nur nicht wie gewohnt
schreiben.
Und so schrecklich ist das ja auch nicht, wenn man folgendes bemerkt:
x2
e
=
∞
X
x2n
n=0
n!
.
Nun gibt es einen Satz, dass man Potenzreihen gliedweise integrieren darf (jedenfalls im ‘Innern’
2
ihres Konvergenzbereiches). Als eine Stammfunktion von f (x) = ex erhält man somit
F (x) =
∞
X
n=0
x2n+1
.
n!(2n + 1)
214
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Wenn man eine rationale Funktion (d.h. einen Bruch von zwei Polynomen) differenziert, entsteht wieder eine rationale Funktion. Wenn man aber die rationale Funktion x1 integriert, so
erhält man ln x, eine Funktion, von der man zeigen kann, das sie nicht rational ist. An diesem
2
Beispiel und am Beispiel ex sieht man, dass es im Allgemeinen nicht so einfach sein kann,
Stammfunktionen so zu berechnen, wie wir es bei der Bestimmung von Ableitungen gewohnt
sind. (Das ist der Sinn der manchmal geäußerten Ansicht: ‘Differenzieren ist ein Handwerk,
Integrieren eine Kunst.’) Z.B. kann man ja die Funktionen, die aus c, x, exp, sin (wo mit c eine
konstante Funktion, mit x die identische Abbildung R → R gemeint sind) entstehen, indem
wir die Operationen Summe, Produkt, Quotient, Umkehrabbildung, Verkettung – auch iteriert
– anwenden, nach den bekannten Regeln differenzieren.
Diese Regeln liefern allerdings meist nur Hinweise darauf, wie man möglicher Weise Stammfunktionen findet. Zum Glück gilt noch folgendes: Sind F, G Stammfunktionen der Funktionen
f, g. so ist F +G eine Stammfunktion von f +g und cF eine solche von cf , falls c eine Konstante
ist. Nicht wahr? Aber schon die Anwendung der Produktregel der Differentiation liefert keine
so bequeme Regel.
Seien F, G Stammfunktionen von stetigen Funktionen f , bzw, g. Dann ist (F G)0 = F 0 G+F G0 =
f G + F g. Also gilt:
Theorem 7.7.13 (Partielle Integration) Unter obigen Voraussetzungen ist
Z
Z
Z
Z
0
f Gdx = F G − F gdx, oder anders geschrieben
F Gdx = F G − F G0 dx.
Für das bestimmte Integral, erhält man
Z b
b Z b
0
F G0 dx.
F Gdx = F G −
a
a
a
Beispiele 7.7.14 Die Methode der partiellen Integration ist erstaunlich nützlich, und zwar
nicht nur zur Berechnung spezieller Stammfunktionen und Integrale, sondern auch in allgemeinen Zusammenhängen.
Man kann die partielle Integration auf ein Produkt f G von Funktionen immer dann anwenden,
wenn man eine Stammfunktion F von f kennt und das Produkt F g = F G0 leichter als f G =
F 0 G integrieren kann.
Beispiel 1. Ist z.B. f = 1 konstant und G(x) = ln x, so erhält man
Z
Z
Z
1
ln xdx = 1 · ln x dx = x ln x − x · dx = x ln x − x
x
Zu demselben Ergebnis kommt man natürlich auch, wenn man versuchsweise die Funktion x ln x
differenziert.
Beispiel 2. Versuche (für ganze n ≥ 2) die Funktion sinn x zu integrieren, indem Du sinn x in
die Faktoren sin x und sinn−1 x zerlegst:
Z
Z
n
n−1
sin xdx = − cos x sin
x + cos2 x · (n − 1) sinn−2 x =
7.7. INTEGRATION
215
− cos x sin
n−1
Z
x+
(n − 1)(1 − sin2 x) sinn−2 xdx
(Du
die Ableitung von sinn−1 x berechnen.) Indem Du auf beiden Seiten das Integral
R musst dazu
(n − 1) sinn xdx addierst, erhältst Du
Z
Z
n
n−1
n sin xdx = − cos x sin
x + (n − 1) sinn−2 xdx .
So reduzierst Du die Berechnung einer Stammfunktion von sinn x zu einer solchen von sinn−2 x.
Wenn Du dies Verfahren iterierst, kommst Du schließlich bei sin x oder 1 an, je nachdem ob n
ungerade oder gerade ist.
7.7.15 Wenn man die verkettete Funktion F (ϕ(t)) (mit differenzierbaren F, ϕ) nach t ableitet,
erhält man nach der Kettenregel:
F 0 (ϕ(t)) · ϕ0 (t).
Daraus ergibt sich
Theorem 7.7.16 (Substitutionsregel.) Ist I ein Intervall, f : I → R stetig, ϕ : [a, b] → I stetig
differenzierbar (d.h. ϕ ist differenzierbar und ϕ0 ist stetig), so gilt
Z ϕ(b)
Z b
0
f (x)dx .
f (ϕ(t))ϕ (t)dt =
ϕ(a)
a
Beweis:
Sei F eine Stammfunktion von f . Dann ist F (ϕ(t)) eine Stammfunktion von
0
f (ϕ(t))ϕ (t) bezüglich t, also
Z b
ϕ(b) Z ϕ(b)
b
0
f (x)dx .
=
f (ϕ(t))ϕ (t)dt = F (ϕ(t)) = F (x)
a
a
ϕ(a)
ϕ(a)
b
Bist Du verwirrt? Bedenke, dass ich unter F (ϕ(t)) die Differenz F (ϕ(b)) − F (ϕ(a)) und
a
ϕ(b)
dieselbe Differenz F (ϕ(b)) − F (ϕ(a)) verstehe! Vielleicht ziehst Du es vor, der
unter F (x)
ϕ(a)
b
t=b
ϕ(b)
Genauigkeit halber statt F (ϕ(t)) den Ausdruck F (ϕ(t)) und statt F (x)
den Ausdruck
a
t=a
ϕ(a)
x=ϕ(b)
zu schreiben.
F (x)
x=ϕ(a)
Beispiele 7.7.17 a) Ist F eine Stammfunktion von f , so ist 1c F (cx+d) eine solche von f (cx+d),
wenn c, d Konstanten mit c 6= 0 sind. Wenn man eine Stammfunktion von f kennt, kennt man
auch eine solche von f (cx + d)
b) Wenn man eine Stammfunktion F einer stetigen Funktion f : I → R (mit einem Intervall I)
bestimmen kann, so kann man auch eine Stammfunktion (bezüglich t) von der Funktion t · f (t2 )
216
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
auf einem Intervall J bestimmen, wenn nur {x2 | x ∈ J} in I liegt. Eine solche Stammfunktion
1 2
2
ist 12 F (t2 ). (Woher kommt der Faktor 21 ?) Insbesondere ist ex eine Stammfunktion von x · ex .
2 2
Dies ist bemerkenswert, da man ja eine Stammfunktion von ex nicht durch die uns geläufigen
Funktionen ausdrücken kann.
c) Wir wollen die Fläche eines Halbkreises vom Radius 1 bestimmen. Erinnere Dich, dass die
Zahl π als die halbe Länge des Umfangs des Einheitskreises definiert ist. Ferner wird durch den
Sinus das Intervall [−π/2, π/2] bijektiv und monoton auf das Intervall [−1, 1] abgebildet. Dabei
ist sin(−π/2) = −1, sin(π/2) = 1. Weitere Eigenschaften von sin und cos sind:
sin2 t + cos2 t = 1,
cos(2t) = cos2 t − sin2 t
Hieraus folgt
cos t =
p
1 − sin2 t für diejenigen t wo cos t ≥ 0 ist,
und cos(2t) = 2 cos2 t − cos2 t − sin2 t = 2 cos2 t − 1 .
Wir rechnen, indem wir x = sin t setzen (substituieren)
Z π/2 p
Z
Z 1√
2
1 − x2 dx =
1 − sin t cos tdt =
−1
−π/2
Z
π/2
−π/2
π/2
cos2 tdt =
−π/2
1
1
1 π/2
π
(cos(2t) + 1)dt = ( sin(2t) + t)
= ,
2
4
2 −π/2
2
da sin(−π) = sin(π) = 0 ist. Die Flächengröße des ganzen Kreises ist doppelt so groß also gleich
π. Dies gilt für einen Kreis vom Radius 1. Ein Kreis vom Radius r hat dann die Flächengröße
πr2 . Beachte: Wir haben π als halben Umfang des Einheitskreises definiert. Jetzt haben wir
gezeigt, dass mit dieser Definition π die Flächengröße des Einheitskreises ist. Das ist nicht
tautologisch.
d) Das Riemannsche Integral bestimmt die Größe der Fläche unter einem Funktionsgraphen,
indem es diese Fläche durch die Vereinigung von gewissen Rechtecksflächen approximiert.
Natürlich darfst Du fragen: Wie kanonisch ist dies? Glücklicherweise kommt beim Kreis dasselbe
heraus, wenn man seine Fläche durch regelmäßige n-Ecke approximiert, die ihre Mittelpunkte
mit dem Kreis gemeinsam haben. Aber das könnte ja Zufall sein.
e) Wir wollen uns aber über diese Skrupel hinwegsetzen und das Volumen der Einheitskugel
im R3 bestimmen, indem wir die Kugel durch Vereinigungen von Kreiszylinderscheiben approximieren, deren Achsen mit der x-Achse übereinstimmen. Das bedeutet, dass das Volumen
das Integral von −1 bis 1 über die Flächengröße der Schnittkreise (mit der Kugel) derjenigen
Ebenen ist, die senkrecht auf der x-Achse stehen und√diese im Punkt x schneiden. D.h. wir betrachten die Funktion f : [−1, 1] → R, wo f (x) = π( 1 − x2 )2 = π(1 − x2 ) ist, und berechnen
das Integral über diese Funktion von −1 bis 1.
Als Volumen der Einheitskugel ergibt sich so
Z 1 √
Z 1
3 1
x
1
1
4
2
2
V =
π( 1 − x2 ) dx = π
(1 − x )dx = π x −
= π((1 − ) − (−1 + )) = π
3 −1
3
3
3
−1
−1
7.8. DAS INTEGRALVERGLEICHSKRITERIUM
217
Das Volumen der Kugel vom Radius r ist somit 43 πr3 .
AUFGABEN
1. Bestimme Stammfunktionen von arcsin x und arctan x. (Verwende partielle Integration, wo der
erste Faktor 1 ist, ferner die Beispiele a) und b) aus (7.7.17).)
2. Zeige, dass π irrational ist.
Angenommen es wäre π = a/b mit a, b ∈ N1 . Berechne
Z
1 π n
x (a − bx)n sin xdx
n! 0
und Du erhältst eine ganzzahligen Wert, der natürlich > 0 ist. Andererseits kann er nach oben
durch eine Zahl abgeschätzt werden, die mit wachsendem n beliebig klein wird.
7.8
Das Integralvergleichskriterium
Definition 7.8.1 Sei a ∈ R und f : [a, ∞[→ R eine stetige Funktion. Dann definiert man das
uneigentliche Integral
Z b
Z ∞
f (x)dx := lim
f (x)dx ,
a
b→∞
a
so denn der Limes definiert ist.
(Verwechsle nicht die Adjektive ‘unbestimmt’ und ‘uneigentlich’.) Man kann auch in anderen
Fällen versuchen, uneigentliche Integrale zu definieren, z.B. wenn f auf ] − ∞, a] definiert ist,
aber auch wenn f auf einem (halb)offenen Intervall, aber nicht in den Randpunkten oder einem
von ihnen definiert ist.
Beispiel 7.8.2 Sei zum Beispiel r > 1, so gilt
b
Z ∞
1
1
1
1
1
dx
=
lim
−
=
lim
−
+
=
b→∞
xr
(r − 1)xr−1 1 b→∞
(r − 1)br−1 r − 1
r−1
1
Beachte r − 1 > 0.
Es gilt folgendes sehr nützliche Konvergenzkriterium für unendliche Reihen.
Theorem 7.8.3 Sei f : [1, ∞[→ R+ eine stetige monoton fallende Funktion. Die unendliche
∞
X
Reihe
f (n) ist genau dann konvergent (mit einem endlichen Limes), wenn das uneigentliche
n=1
R∞
Integral 1 f (x)dx existiert (und einen endlichen Wert hat).
218
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beweis: Die ‘Treppen’-Funktion go : [1, ∞[→ R, die durch go (x) = f (n) für x ∈ [n, n + 1[
definiert ist, erfüllt go (x) ≥ f (x) für alle x ∈ [1, ∞[. Die Funktion gu , die durch gu (x) = f (n+1)
für x ∈ [n, n + 1[ definiert ist, erfüllt gu (x) ≤ f (x).
Daraus folgt
k−1
X
n=1
Z
k
k
Z
go (x)dx ≥
f (n) =
1
f (x)dx und
1
k
X
Z
k
Z
gu (x)dx ≤
f (n) =
1
n=2
k
f (x)dx .
1
Die Partialsummen der Ausgangsreihe kann man also durch Integrale von f über endliche
Abschnitte nach unten abschätzen. Lässt man den ersten Summanden der Reihe weg, ergibt
sich eine Abschätzung nach oben.
Wir hatten Treppenfunktionen auf beschränkten Intervallen mit endlich vielen ‘Stufen’ definiert.
Die Funktionen go , gu sind auf dem unbeschänkten Intervall [1, ∞[ definiert und haben unendlich
viele Stufen, sind aber doch so etwas ähnliches.
Beispiele 7.8.4 a) Das Integral
Z
∞
x−s dx
1
ist für s > 1 endlich, hingegen unendlich für s ≤ 1. Deshalb konvergiert die Reihe
für s > 1 und divergiert für s ≤ 1.
P∞
n=1
n−s
Wir bekommen also eine Funktion
ζ : ]1, ∞[ → R, ζ(s) :=
∞
X
n−s .
n=1
(ζ ist der kleine griechische Buchstabe zeta, nicht zu verwechseln mit ξ, gesprochen xi.) Diese
sogenannte Zeta-Funktion ist für die Primzahltheorie sehr nützlich, wenn man sie zu einer
Funktion einer komplexen Veränderlichen erweitert. Im Rahmen der Einführung der komplexen
Zahlen will ich Dir (ohne Beweis) einiges dazu sagen.
b) Betrachte die Funktion f (x) = ln(ln x). Wo ist sie definiert, wenn man den natürlichen
Logarithmus nur für positive Zahlen definiert? Berechne f 0 . Zeige, dass
∞
X
n=2
1
divergiert.
n · ln n
c) Berechne die Ableitung der Funktion −(ln x)−1 und zeige, dass die Reihe
∞
X
n=2
1
konvergiert.
n · (ln n)2
Kapitel 8
Komplexe Zahlen
Eine Ebene voller Zahlen
8.1
Was sind die komplexen Zahlen?
Glaub mir: Die Erfindung oder – so man will – Entdeckung der komplexen Zahlen ist sicher
eine der wunderbarsten Leistungen unserer mathematischen Vorfahren.
Wenn man von den natürlichen Zahlen aus über die ganzen und rationalen Zahlen schließlich zu
den reellen Zahlen gelangt ist, ist ein gewisser Abschluss erreicht. Man kann z.B. jeden Punkt
des (euklidischen) Raumes – nach Festlegung eines Koordinatensystems – durch ein Tripel
reeller Zahlen beschreiben, was bekanntlich nicht möglich ist, wenn man sich auf die rationalen
oder die positiven reellen Zahlen beschränkt. Wen stört es eigentlich ernsthaft, dass man aus
negativen Zahlen keine Quadratwurzeln ziehen kann? Man verzichtet ja auch darauf, durch 0
zu dividieren.
8.1.1 Die erste Ahnung davon, dass sich möglicherweise doch hinter der durch reelle Zahlen beschriebenen Realität eine mathematisch relevante Wirklichkeit verbirgt, bekamen unsere
Vorfahren in der Renaissance.
Kubische Gleichungen: Du bist sicher in der Lage, quadratische Gleichungen – d.h. solche
der Form x2 +px+q = 0 – zu lösen. Auf die sogenannte ‘p-q-Formel’ kommt man durch die ‘quadratische Ergänzung’. Wenn man analog eine ‘kubische Ergänzung’ auf kubische Gleichungen
(d.h. solche 3. Grades) anzuwenden versucht, erreicht man lediglich eine Reduktion auf Gleichungen der Form x3 + px + q = 0. (D.h. das quadratische Glied kann man zum Verschwinden
bringen.) Eine Lösungsformel für diese Gleichung fand (wahrscheinlich) Tartaglia im Jahre
1535:
s
s
r
r
3
3
q
q 2 p3
q
q 2 p3
+
+ − −
+
x= − +
2
4
27
2
4
27
p
√
3
3
Für
die
Gleichung
x
−3x+2
=
0
z.B.
liefert
Tartaglias
Formel
die
Lösung
x
=
−1
+
1 − 1+
p
√
3
−1 − 1 − 1 = −2, die offenbar richtig ist. (Allerdings ist 1 eine weitere Lösung.) Ebenso
219
220
KAPITEL 8. KOMPLEXE ZAHLEN
erhält man mit Tartaglias Formel die Lösung 0 der Gleichung x3 + x = 0. (Diese ist übrigens
ihre einzige Lösung im Bereich der reellen Zahlen.)
Bei der ebenso simplen Gleichung x3 − x = 0 scheint allerdings Tartaglias Formel zu versagen.
Sie ergibt
sr
s r
1
1
3
3
x=
− + − −
27
27
Die (richtige) Lösung 0 erhält man nur dann,
q wenn man sich großzügig darüber hinwegsetzt,
1
dass der zweimal vorkommende Ausdruck − 27
im Bereich der reellen Zahlen gar keinen Sinn
hat. An dieser Stelle würde man eben doch ganz gerne Quadratwurzeln aus negativen Zahlen
ziehen können! Die weiteren Lösungen 1 und -1 scheint man mit Tartaglias Formel gar nicht zu
finden.
Dies sollte weniger ein Grund zur Resignation sein, als einer dafür, Quadratwurzeln aus negativen Zahlen einen Sinn zu geben. Umso mehr, als in Tartaglias Formel solche merkwürdigen
Ausdrücke häufig genug auftreten, nämlich immer gerade dann, wenn die Gleichung drei
verschiedene reelle Lösungen hat. (Es gibt auch keine besseren anderen Formeln, die außer
den Grundrechenarten lediglich Wurzeln verwenden, mit denen man dieses unangenehme
Phänomen, casus irreducibilis genannt, vermeiden kann!)
8.1.2 Die komplexen Zahlen bilden einen Körper, der mit C bezeichnet wird, und dessen Elemente man in der Form a + bi schreiben kann, wo a, b reelle Zahlen sind, und i eine neue Zahl
mit der Eigenschaft i2 = −1 ist. Wie Du bald sehen wirst, darfst Du ganz naiv mit diesen
‘Zahlen’ rechnen und jedesmal i2 durch −1 ersetzen.
Es gibt viele Gründe, warum die komplexen Zahlen aus der modernen Mathematik nicht mehr
wegzudenken sind. Dass man Tartaglias Formel immer einen Sinn geben kann, ist nur ein
kleines Beispiel. Ich nenne Dir weitere Gründe:
1. In Bezug auf die Existenz von Lösungen algebraischer Gleichungen gilt der so genannte Fundamentalsatz der Algebra. Dieser besagt: Jedes nichtkonstante Polynom mit komplexen
Koeffizienten hat mindestens eine komplexe Nullstelle.
Z.B. ist x2 −2x+2 = (x−1)2 +1, also im Reellen immer echt größer als 0, hat aber im Komplexen
die Nullstellen 1+i, 1−i, besitzt also die Linearfaktorzerlegung x2 −2x+2 = (x−1−i)(x−1+i).
Ein weiteres Beispiel ist x4 + 1, welches keine reellen, aber die folgenden vier komplexen Nullstellen hat:
√
√
2
2
±
i.
±
2
2
Dieses wirst Du unten sehen.
Wenn ein Polynom f erst einmal eine Nullstelle α hat, kann man, wie Du weißt, den entsprechenden Linearfaktor x − α abspalten, d.h. man kann f = (x − α) · g mit einem Polynom g
schreiben. Deshalb bedeutet der Fundamentalsatz der Algebra letztlich, dass jedes Polynom
über den komplexen Zahlen in Linearfaktoren zerfällt. Insbesondere gilt dies für das Polynom
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
221
xn − 1, welches trivialerweise die Nullstelle 1, und bei geradem n noch die Nullstelle −1 hat. Es
hat darüber hinaus noch n − 1, bzw. n − 2 komplexe nicht reelle Nullstellen! Wenn man sich die
komplexen Zahlen als Punkte einer Ebene veranschaulicht, liegen die Nullstellen des Polynoms
xn − 1 auf dem Einheitskreis und bilden dort die Ecken eines regelmäßigen n-Ecks. (Dies wollen
wir weiter unten beweisen!) Von dieser Beobachtung ausgehend hat Gauss die Frage angehen
können, welche regelmäßigen n-Ecke mit Zirkel und Lineal konstruierbar sind.
2. Nach einem interessanten und grundlegenden Satz von Hilbert, seinem sogenannten Nullstellensatz, folgt aus dem Fundamentalsatz der Algebra, dass auch Systeme von Polynomen
in mehreren Variablen gemeinsame (komplexe) Nullstellen haben, es sei denn, dies ist aus trivialen Gründen nicht möglich. Betrachte als Beispiel die Polynome x2 + y 2 − 1 und x − 2, deren
Nullstellen in der reellen Ebene einen Kreis, bzw. eine außerhalb dieses Kreises verlaufende Gerade ausmachen, die demnach keine gemeinsame reelle
haben
√ Nullstelle haben. Im Komplexen
√
sie jedoch die gemeinsamen Nullstellen (x1 , y1 ) = (2, 3·i) und (x2 , y2 ) = (2, − 3·i). Hingegen
können die 3 Polynome x, y, 2x + 3y + 1 offenbar trivialerweise keine gemeinsame Nullstelle
haben. (Wenn Dir diese Bedingung zu schwammig erscheint, darfst Du sie folgendermaßen definieren: Man sagt, Polynome f1 , . . . , fn in einer oder mehreren Variablen haben trivialerweise
keine gemeinsame Nullstelle, wenn es Polynome g1 , . . . , gn mit f1 g1 + · · · + fn gn = 1 gibt.)
Hilberts Nullstellensatz gehört zu den Grundlagen der klassischen Algebraischen Geometrie. Leider kann ich hierauf nicht näher eingehen.
3. Die Funktion exp kann man auch für beliebige komplexe Argumente erklären, nämlich durch
die bekannte Potenzreihe. Es ergibt sich ein Zusammenhang zwischen exp, sin, cos, den man
im Reellen nicht herstellen kann. S.u.
4. Diesen Zusammenhang nutzen die Elektrotechnik und die Physik, insbesondere die Quantentheorie. Nicht nur in der Mathematik werden die komplexen Zahlen gebraucht!
5. Es gibt eine reichhaltige und schöne Theorie der differenzierbaren komplexwertigen Funktionen auf Bereichen der komplexen Zahlenebene, die so genannte Funktionentheorie. Als
erstes zeigt man, dass sich eine solche Funktion in der Nähe eines jeden Punktes, wo sie definiert ist, als Potenzreihe darstellen lässt. (Funktionen f : I → R, wo I ⊂ R ein Intervall ist,
können sogar unendlich oft differenzierbar sein, ohne dass sie sich um jeden Punkt von I in
eine Potenzreihe entwickeln lassen.)
6. Es gibt überraschende Anwendungen der Funktionentheorie in der Theorie der Primzahlen.
Eine Ahnung davon gebe ich Dir im 2. Abschnitt.
7. In der Algebra und der algebraischen Zahlentheorie sind die komplexen Zahlen genau so wie
die reellen beheimatet.
8. Die berühmte Fermat’sche Vermutung, dass es nämlich für ganze n ≥ 3 keine von 0 verschiedenen ganzen Zahlen x, y, z gibt, so dass xn + y n = z n ist, wurde erst vor etwa 25 Jahren
von A. Wiles (mit Vor- und Nacharbeiten anderer Mathematiker) bewiesen und zwar mit
Hilfsmitteln, die ohne komplexe Zahlen nicht auskommen.
Bemerkung hierzu: In dem überaus spannenden Buch ‘Verdammnis’ von Stieg Larsson bekommst Du
vielleicht den Eindruck, die Fermatschen Vermutung beziehe sich nur auf den Fall n = 3. Dieser Fall
222
KAPITEL 8. KOMPLEXE ZAHLEN
wurde allerdings möglicher Weise bereits von Fermat selbst (ohne dass wir wüssten, wie) später von
Euler mit einer gewissen Ungenauigkeit, schließlich aber von Gauss, Kummer u.a. makellos erledigt.
8.1.3 Wir konstruieren jetzt den Körper C der komplexen Zahlen. Die Abbildung
a 0
F : R → M2 (R) , definiert durch F (a) :=
0 a
0
ist injektiv, erfüllt
F (a+a
) = F (a)+F (a0 ), F (aa0 ) = F (a)F (a0 ) und bildet die 1 von R auf das
1 0
Einselement
von M2 (R) ab. Vermöge dieser Abbildung betrachten wir den Körper R
0 1
als Unterring des Ringes M2 (R). In diesem Ring werden wir C als Erweiterungskörper von R
finden.
(Wie Du weißt, fasst man ja auch die ganzen Zahlen als gewisse
Brüche
auf, nämlich n als den
n
a 0
Bruch . Indem wir hier die reelle Zahl a als die Matrix
auffassen, tun wir etwas
0 a
1
ganz analoges!)
Zunächst sei C die Menge der Matrizen folgender Gestalt
a −b
1 0
0 −1
=a
+b
b a
0 1
1 0
Vielleicht hast Du Dir anhand früherer Aufgaben bereits überlegt, dass C ein kommutativer Unterring von M2 (R) ist. Dass die Nullmatrix, die Einsmatrix, die Summe zweier solcher Matrizen
und das additiv Inverse einer solchen Matrix von obiger Gestalt sind, ist trivial. Du musst aber
unbedingt nachrechnen (oder bereits nachgerechnet haben), dass das Produkt zweier solcher
Matrizen auch wieder von dieser Gestalt und dass die Multiplikation dieser speziellen Matrizen
kommutativ ist. In dem vollen Matrizenring ist sie es ja nicht!
8.1.4 Es gilt
det
a −b
b a
= a2 + b 2 .
2
2
Die Quadratsumme
mit a, b ∈ R ist aber nur dann gleich 0, wenn sowohl a = 0, als auch
a +b a −b
b = 0 ist. Ist also
nicht die Nullmatrix, d.h. mindestens eine der beiden Zahlen a, b
b a
ungleich 0, so gibt es ein (multiplikativ) Inverses dieser Matrix, nämlich
1
a b
.
a2 + b2 −b a
Du siehst, die Menge C der betrachteten Matrizen ist ein Körper.
0 −1
8.1.5 Wir bezeichnen die Matrix
jetzt mit i. Dann dürfen wir schreiben
1 0
a −b
1 0
0 −1
=a·
+b·
= a + bi
1 0
b a
0 1
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
223
Die komplexen Zahlen bilden insbesondere einen R-Vektorraum, der isomorf zu R2 ist. Eine
Basis wird von den Elementen 1 und i gebildet. Insbesondere ist
(a1 + b1 i) + (a2 + b2 i) = (a1 + a2 ) + (b1 + b2 )i .
Offenbar ist
2
i =
2
0 −1
1 0
=
−1 0
0 −1
= −1
Da für komplexe Zahlen die Körpergesetze gelten, dürfen wir wie gewohnt rechnen und dabei
immer i2 = −1 setzen. Zum Beispiel ist
(a1 + b1 i)(a2 + b2 i) = a1 a2 + a1 b2 i + a2 b1 i + b1 b2 i2 = (a1 a2 − b1 b2 ) + (a1 b2 + a2 b1 )i
Als Matrix geschrieben ist letzter Ausdruck gleich
a1 a2 − b1 b2
a1 b 2 + a2 b 1
a1 −b1
a2 −b2
=
.
−(a1 b2 + a2 b1 ) a1 a2 − b1 b2
b 1 a1
b2 a2
Und so muss es ja auch sein, nicht wahr?
Eine Matrix der Form
a −b
b a
ist natürlich durch das Paar (a, b) gegeben. Letzteres kann man nun als Vektor oder Punkt in
einer Ebene mit einem orthonormalen Koordinatensystem auffassen. Wenn Du dieses Paar mit
der komplexen Zahl a + bi identifizierst, so siehst Du, dass man jede komplexe Zahl auf folgende
drei Weisen schreiben kann:
a −b
= a + bi = (a, b)
b a
Das multiplikativ Inverse von a + bi ist
a2
b
a
− 2
i, falls a + bi 6= 0 gilt, nicht wahr?
2
+b
a + b2
√
Achtung: Ich möchte Dich davor warnen, i = −1 zu √
schreiben
dann unvorsichtig
√ damit
√ undp
2
umzugehen! Du könntest ja etwa folgendes rechnen i = −1· −1 = (−1) · (−1) = 1 = 1 .
8.1.6 Sei nun (a, b) 6= (0, 0). Betrachte folgendes Bild:
2i
(a,b)
i
ϕ
–2
–1
1
–i
1
2
3
224
KAPITEL 8. KOMPLEXE ZAHLEN
Wenn ϕ der in diesem Bild angegebene Winkel ist, gilt also
√
(a, b) = a2 + b2 · (cos ϕ , sin ϕ)
√
Dabei ist a2 + b2 die Länge des Vektors (a, b). In der Matrizenschreibweise bedeutet dies
√
a −b
cos ϕ − sin ϕ
2
2
= a +b ·
b a
sin ϕ cos ϕ
Die Matrix auf der rechten Seite ist die Drehmatrix um den Winkel ϕ. Wir wissen, dass das
Produkt zweier solcher Drehmatrizen um die Winkel ϕ, bzw. ψ die Drehmatrix um den Winkel
ϕ + ψ ist. Es ergibt sich:
Satz 8.1.7 Seien a + bi, a0 + b0 i komplexe Zahlen 6= 0 (mit a, b, a0 , b0 ∈ R) und ϕ, bzw. ϕ0 die
Winkel der Vektoren v = (a, b), bzw. w = (a0 , b0 ) mit der positiven√reellen Halbachse.
Dann hat
√
das Produkt der beiden Zahlen, aufgefasst als Vektor, die Länge a2 + b2 · a02 + b02 und den
Winkel ϕ + ϕ0 mit der positiven reellen Halbachse.
Definitionen 8.1.8 Sei a + bi mit reellen a, b eine komplexe Zahl.
a) Die reelle Zahl a heißt der Realteil von a + bi. Bezeichnung: a = Re(a + bi).
b) Die reelle Zahl b heißt der Imaginärteil von a + bi. Bezeichnung: b = Im(a + bi). (Beachte,
dass nach dieser – allgemein üblichen – Definition der Imaginärteil einer komplexen Zahl eine
reelle Zahl ist. Man könnte es natürlich auch anders machen.)
√
√
c) Der Betrag von a + bi ist a2 + b2 . Bezeichnung |a + bi| = a2 + b2 .
d) Der Winkel, den der Vektor (a, b) mit der positiven reellen Halbachse bildet, heißt das Argument von a + bi. Dieser Winkel ist lediglich bis auf Vielfache von 2π = 360◦ definiert.
Schreibweise: arg(a + bi) = ϕ, wobei ϕ wie im letzten Satz definiert wird.
e) Die zu a + bi konjugierte komplexe Zahl ist a − bi. Bezeichnung: a + bi = a − bi.
Bemerkungen 8.1.9 a) Der letzte Satz drückt sich in Formeln, wie folgt aus: Sind c, d ∈ C∗ ,
so gilt |cd| = |c| · |d| und arg(cd) = arg(c) + arg(d).
√
√
b) |Re(a + bi)| = a2 ≤ a2 + b2 = |a + bi|, ebenso gilt |Im(a + bi)| ≤ |a + bi|. D.h. für eine
komplexe Zahl c ist |Re(c)| ≤ |c| und |Im(c)| ≤ |c|
c) Sind c, d ∈ C, so gilt c + d = c + d, sowie c · d = c · d. Die offensichtlich bijektive Abbildung C → C, definiert durch c 7→ c, ist also ein Ringisomorfismus und somit auch einen
Körperisomorfismus. (Letzteres bedeutet, dass auch (c)−1 = c−1 ist.)
Ein Isomorfismus mit gleichem Start und Ziel wird ein Automorfismus genannt. Die Konjugation c 7→ c ist also ein Automorfismus des Körpers C.
Offenbar ist c = c .
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
225
d) Die Dreiecksungleichung. Diese ist
|c + d| ≤ |c| + |d|
Geometrisch bedeutet sie, dass die Summe der Längen zweier Seiten eines Dreiecks größer oder
gleich der dritten Seite ist. Hier wollen wir das ’ungeometrisch’ zeigen:
Für jede komplexe Zahl c gilt 2 · Re(c) = (c + c) und cd = cd, sowie |c| = |c|. Es folgt
|c+d|2 = (c+d)(c+d) = cc+dd+cd+cd = |c|2 +|d|2 +2Re(cd) ≤ |c|2 +|d|2 +2|c||d| = (|c|+|d|)2
und daraus die Dreiecksungleichung.
e) Ist z 6= 0, so gilt |z −1 | = |z|−1 und arg(z −1 ) = − arg(z). Mache Dir klar, was das geometrisch
bedeutet!
8.1.10 Potenzen mit natürlichen Exponenten. Sei n ganz und > 0. Wenn z den Betrag
r hat, d.h. auf einem Kreis vom Radius r um 0 liegt, so hat z n den Betrag rn , liegt somit auf
dem Kreis vom Radius rn um 0.
Wenn z das Argument α hat, so hat z n das Argument n · α, zumindest bis auf ein Vielfaches
von 2π.
Wir lassen z den Kreis Sr um 0 vom Radius r > 0 mit konstanter Winkelgeschwindigkeit 1
durchlaufen und beobachten, welchen Weg dabei z n nimmt. Nach dem, was wir uns gerade
überlegt haben, durchläuft z n den Kreis Srn vom Radius rn und zwar mit der Winkelgeschwindigkeit n. Wenn z den Kreis Sr einmal durchläuft, so durchläuft z n den Kreis Srn genau n-mal.
Es trifft dabei jeden Punkt auf Srn genau n-mal.
Was bedeutet das für die Existenz und Vielfachheit von Wurzeln, d.h. die Lösungen der Gleichung xn = c?
p
Sei c 6= 0 eine komplexe Zahl mit dem Argument ϕ und d := n |c|(cos(ϕ/n) + i sin(ϕ/n)), so
gilt offenbar dn = c. D.h. man kann aus jeder komplexen Zahl für jede natürliche Zahl n > 0
eine n-te Wurzel ziehen.
Allerdings ist das Wurzelziehen nicht eindeutig: Es gibt genau n verschiedene komplexe Zahlen
d mit dn = c, wenn nicht gerade c = 0 ist. Es ist cos(ϕ + k ·p
2π) + i sin(ϕ + k · 2π) = cos ϕ + i sin ϕ
n
für jede ganze Zahl k. Also ist jede komplexe Zahl dk := |c|(cos(ϕ/n + k · 2π/n)+
i sin(ϕ/n + k · 2π/n)) eine n-te Wurzel aus c, d.h. dnk = c. Die Zahlen d0 , d1 , . . . , dn−1 sind
untereinander verschieden, aber danach wiederholen sie sich: dn = d0 , dn+1 = d1 , . . .. Sie
bilden offenbar die Ecken eines regelmäßigen n-Ecks.
Insbesondere gibt es n verschiedene komplexe Zahlen z0 , z1 , . . . , zn−1 , die alle die Gleichung
z n = 1 erfüllen. Eine von ihnen ist 1, alle haben den Betrag 1, d.h. sie befinden sich auf dem
Einheitskreis. Sie bilden dort ein regelmäßiges n-Eck mit dem Mittelpunkt 0.
(Von dieser Tatsache ist Gauss ausgegangen, als es ihm kurz vor 1800 gelang, ein regelmäßiges
17-Eck allein mit Zirkel und Lineal zu konstruieren.)
226
KAPITEL 8. KOMPLEXE ZAHLEN
Definition 8.1.11 Die Nullstellen von xn − 1 in C heißen die n-ten Einheitswurzeln.
Bemerkung 8.1.12 Du weißt vielleicht noch von der Herleitung der Summenformel
Pn−1 k für die
n
n−1
n−2
geometrische Reihe, dass z − 1 = P
(z − 1)(z
+z
+ · · · + z + 1) = (z − 1) k=0 z ist. Dass
k
bedeutet, dass die Nullstellen von n−1
z
die
von
1
verschiedenen
n-ten Einheitswurzeln sind.
k=0
Beispiele 8.1.13 Wir berechnen einige spezielle Beispiele. Mit ihrer Hilfe bestimmen wir spezielle Werte des Cosinus und Sinus.
a) Rechne (1+i)2 = 1+2i−1 = 2i, also ( √12 + √12 i)2 = 12 ·2i = i, mithin ( √12 + √12 i)4 = i2 = −1. Du
siehst erneut, diesmal ohne geometrische Argumente, dass −1 im Bereich der komplexen Zahlen
nicht nur ein Quadrat, sondern auch eine 4. Potenz ist. Wenn Du dies mit der geometrischen
Beschreibung der Multiplikaton zusammenbringst, kannst Du
√
1
2
sin(π/4) = cos(π/4) = √ (=
)
2
2
ableiten.
Wir bleiben bei diesem Beispiel und setzen abkürzend v := √12 + √12 i. Dann ist v 3 = v 2 v =
iv = − √12 + √12 i,
v 5 = v 4 v = −v,
v 6 = v 4 v 2 = −i
v 7 = v 4 v 3 = −v 3 = √12 − √12 i
und schließlich v 8 = (v 4 )2 = (−1)2 = 1. Dann wiederholen sich die Werte der Potenzen, also
v 9 = v 8 v = v, v 10 = v 8 v 2 = v 2 = i, v 11 = v 8 v 3 = v 3 = − √12 + √12 i usw. Für jede beliebige
(ganze) Potenz v k gilt offenbar (v k )8 = (v 8 )k = 1k = 1. D.h. wir haben insgesamt 8 verschiedene
Zahlen gefunden, deren 8. Potenz 1 ergibt, nämlich 1, v, v 2 , . . . , v 7 .
√
√
√
b) Ein weiteres Beispiel.
Setze√ w := 21 + 23 i. Dann ist w2 = 14 − 34 + 2 · 12 23 i = − 12 + 23 i und
√
w3 = ww2 = ( 21 + 23 i)(− 12 + 23 i) = − 14 − 34 = −1. Weiter erhält man w4 = w3 w = −w, w5 =
w3 w2 = −w2 und w6 = w3 w3 = (−1)(−1) = 1. Wie oben wiederholen sich jetzt die Potenzen:
w7 = w1 , w8 = w2 usw. Ebenso siehst Du, dass für jede ganze Potenz wk von w gilt: (wk )6 = 1.
Es gibt also (mindestens) 6 verschiedene komplexe Zahlen, die die Gleichung x6 = 1 erfüllen.
Da diese Gleichung den Grad 6 hat, hat sie auch auch nur 6 Lösungen.
Man kann hieraus
√
1
3
cos(π/3) = und sin(π/3) =
2
2
ableiten. (Was folgt daraus für sin(π/6), cos(π/6)?)
8.1.14 Zusätzliche Bemerkungen.
Zu Tartaglias Formel: Wenn man sie im Komplexen anwenden will, hatq
man es mit
q2
p3
mehrdeutigen Wurzeln zu tun. Mit den Quadratwurzeln ist es einfach: Mit
+ 27
sei
4
q
2
p3
willkürlich eine der beiden möglichen Wurzeln bezeichnet; − q4 + 27
ist dann automatisch die
andere. Jeder der beiden Summanden in Tartaglias Formel ist nun eine kubische Wurzel mit 3
möglichen Werten. So hat man insgesamt 9 mögliche Kombinationen. Es gibt nun eine Regel,
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
227
welche 3 Kombinationen die Nullstellen des kubischen Polynoms ergeben. Hierauf will ich
nicht genauer eingehen und verweise stattdessen auf das Buch Kubische und biquadratische
”
Gleichungen“ von Heinrich Dörrie (Leibniz Verlag München 1948).
Plausibilität des Fundamentalsatzes der Algebra. Sei n ∈ N1 . Die Funktion
g : C → C, definiert durch g(z) = z n , bildet die Kreislinie Sr vom Radius r > 0 um 0 auf die
Kreislinie Srn vom Radius rn um 0 ab, und zwar so, dass ein Umlauf um Sr zu n Umläufen um
Srn wird. Sei jetzt f (z) = z n + a1 z n−1 + · · · + an−1 z + an Wir setzen an 6= 0 voraus, da f sonst
bereits die Nullstelle 0 hat.
Ist der Betrag von z sehr groß, so überwiegt der Anteil von z n in starkem Maße die Anteile der
übrigen Summanden in f . Also gilt: Wenn z die Kreislinie Sr einmal durchläuft und r ‘sehr
groß’ ist, so läuft f (z) ‘in der Nähe’ von Srn genau n-mal um den Nullpunkt herum. Lässt man
jetzt r gegen 0 gehen, so zieht sich die Bildkurve von Sr auf den Punkt an zusammen. Irgendwann muss sie unterwegs über den Punkt 0 hinweggehen. Das heißt, es gibt eine Nullstelle von f .
Die komplexe Exponentialfunktion: Man definiert sie, wie im Reellen durch
z
e =
∞
X
zn
n=0
n!
für beliebige z ∈ C und beweist auch das Additionstheorem wie im Reellen.
Im Folgenden halte ich mich etwas kurz. Insbesondere gilt ex+iy = ex · eiy für x, y ∈ R. Da
uns die Funktion ex bereits einigermaßen bekannt ist, wollen wir die Abbildung R → C, y 7→
eiy studieren. Überlege Dir, dass die zu eiy konjugierte komplexe Zahl gleich e−iy ist. (Die
Konjugation ist nicht nur mit endlichen Summen und Produkten verträglich, sondern auch mit
Limesbildung.) Daraus folgt
iy 2
e = eiy · e−iy = 1
D.h. Die Spur der parametrisierten Kurve R → C, y 7→ eiy liegt also im Einheitskreis. Durch
genauere Untersuchung, stellt man fest, dass sie diesen entgegen dem Uhrzeigersinn mit der
Absolutgeschwindigkeit 1 durchläuft. Da zudem noch e0i = 1 gilt, erhält man gemäß unserer
Definition der Kreisfunktionen
eiy = cos y + i sin y und somit ex+iy := ex (cos y + i sin y)
Die aus diesen Überlegungen folgende Gleichung eiπ + 1 = 0 hat den bekannten Physiker
Feynman seit seiner Jugend fasziniert. (Sie involviert die wahrscheinlich wichtigsten Zahlen
der Mathematik, nämlich 0, 1, i, π, e.)
Wenn man den Zielbereich der Funktion exp auf C∗ = C−{0} einschränkt, so ist die Abbildung
exp : C → C∗ surjektiv, aber nicht injektiv. Für jedes z ∈ C gilt, dass die z + 2nπi für alle
n ∈ Z dasselbe Bild unter exp haben.
Allgemeine Potenzen. Seien c, z ∈ C, c 6= 0 Man kann versuchen cz := exp(z ln(c)) zu
definieren. Dies hat den Vorzug, dass man bis auf die Bedingung c 6= 0 keine Einschränkung
228
KAPITEL 8. KOMPLEXE ZAHLEN
machen muss. Der Nachteil liegt darin, dass die ‘Funktion’ ln auf C× = C − {0} von Natur
aus unendlich viele Werte hat, die sich um Vielfache von 2πi unterscheiden. Das kommt daher,
dass im Komplexen die Funktion exp nicht injektiv, sondern periodisch mit der Periode 2πi ist.
Jeder noch so geschickt ausgewählte, auf ganz C× eindeutig definierte Logarithmus ist weder
überall stetig, noch erfüllt er allgemein die Gleichung ln(z1 z2 ) = ln(z1 ) + ln(z2 ).
Man muss also damit leben, dass etwa der Ausdruck ii zunächst unendlich viele Werte hat – wie
wir gleich sehen werden – und wenn man mit ihm rechnen will, angeben, welcher der möglichen
Werte gemeint ist.
Wenn man ii als exp(i · ln i) definiert, so muss man die möglichen Werte von ln i bestimmen.
Für c 6= 0 gilt ln c = ln |c| + i arg(c). Dabei ist arg(c) aber nicht eindeutig, sondern nur bis
auf ganzzahlige Vielfache von 2π bestimmt. (Dies alles ergibt sich, wenn man exp wie oben
definiert und versucht, diese nicht bijektive Funktion umzukehren.)
In unserem Fall ist |i| = 1 und arg i = π/2 + 2nπ, also ln i = i(π/2 + 2nπ), wo n ∈ Z beliebig
ist. Für ii ergeben sich also die unendlich vielen möglichen Werte: exp(−π/2 + 2mπ), m ∈ Z,
die alle reell sind.
AUFGABEN
Die Aufgaben beschäftigen sich mit Einheitswurzeln.
1. Sei n eine ungerade natürliche P
Zahl. Welche gemeinsamen Nullstellen haben alle Polynome
(über C) der folgenden Gestalt: nk=0 ak z k mit an 6= 0 und ak = an−k ∈ {−1, 0, 1} für alle k?
2. Bestimme die gemeinsamen Nullstellen der Polynome f = z 3 +2z 2 +2z+1 und g = z 2015 +z 121 +1
in C.
8.2
Sind Primzahlen einsam?
Hier will ich nichts beweisen, sondern nur versuchen, Dir einiges aus der Theorie der Primzahlen
zu erläutern.
Du weißt hoffentlich noch, dass es unendlich viele Primzahlen gibt (und wie man dies beweist),
ferner dass es zwischen zwei aufeinanderfolgenden Primzahlen beliebig große Lücken gibt. Über
diese eher qualitativen“ Aussagen hinaus kann man sich natürlich auch quantitative“ Fragen
”
”
stellen, etwa: Gibt es zu jeder ganzen Zahl n ≥ 1 eine (im Dezimalsystem) n-stellige Primzahl?
Der experimentielle Befund ist eindeutig: Es gibt 4 einstellige, 21 zweistellige, 143 dreistellige
Primzahlen – und soweit es Primzahltafeln gibt, setzt sich dieser Trend fort. Wir Mathematiker
und Mathematikerinnen wünschen natürlich, einen Beweis dafür zu haben. Und einen solchen
gibt es in der Tat; aber dieser ist überhaupt nicht trivial.
Du wirst vielleicht dem Dezimalsystem das Binärsystem vorziehen. Und in der Tat gilt die entsprechende Aussage auch hier: Zu jedem ganzen n ≥ 2 gibt es eine im Binärsystem geschriebene
n-stellige Primzahl. Dies folgt – wie Du sofort siehst – aus dem sogenannten Bertrand’schen
8.2. SIND PRIMZAHLEN EINSAM?
229
Postulat: Zu jeder ganzen Zahl n ≥ 1 gibt es immer eine Primzahl p mit n < p ≤ 2n. (Bertrand konnte dies nicht beweisen, hat es aber als wahr unterstellt, um einen anderen Satz zu
zeigen.) Dieses Postulat“ wurde später von Čebyšev bewiesen.
”
Man kann solche Fragen in Beziehung zu dem sogenannten Primzahlsatz bringen. Wir betrachten dazu die Funktion π, die jedem reellen x die Anzahl der (positiven) Primzahlen ≤ x
zuordnet. (Diese Funktion hat nichts mit der Kreiszahl π zu tun!) Die Funktion π(x) ist 0 für
x < 2 und springt bei jeder Primzahl um 1 nach oben. (Sie ist insbesondere nicht stetig, aber
‘von Weitem gesehen’ merkt man das nicht.)
Der Primzahlsatz vergleicht die Funktion π mit der für x > 1 definierten Funktion x/ ln(x). Er
besagt
π(x)
lim
=1.
x→∞ x/ ln(x)
Man kann ihn auch wie folgt ausdrücken: Sei ε > 0 beliebig klein. So gibt es eine Zahl Y , so
dass für alle x ≥ Y die Ungleichungen
(∗)
(1 − ε)
x
x
≤ π(x) ≤ (1 + ε)
gilt.
ln x
ln x
Bemerkungen 8.2.1 a) Ich will nicht verschweigen, dass es eine bessere Vergleichsfunktion
für π(x) als x/ ln(x) gibt, nämlich den sogenannten Integrallogarithmus Li, definiert durch
Z x
dx
,
Li(x) =
2 ln(x)
die für x ≥ 2 definiert ist.
b) Der Primzahlsatz wurde von Gauß vermutet und erst Ende des 19. Jahrhunderts von Hadamard und de la Vallee Poussin (unabhängig voneinander) bewiesen. Beide benutzen
eine Aussage über die Nullstellen der Zeta-Funktion.
8.2.2 Nun folgt etwas zu dem behaupteten Zusammenhang mit der Funktionentheorie. Die im
letzten Kapitel für reelle x > 1 definierte Zetafunktion lässt sich für alle komplexen Zahlen, mit
Ausnahme der 1 definieren. Seltsamer Weise hängen die Nullstellen der Zetafunktion mit der
Primzahlverteilung zusammen, wie Riemann erkannt hat. Es gibt die (sogenannten trivialen)
Nullstellen −2n für n = 1, 2, . . ., dazu aber noch unendlich viele andere in dem Streifen 0 ≤
Re(z) ≤ 1. Hadamard und de la Vallee Poussin konnten zeigen, dass am Rande dieses
Streifens (wo Re(z) = 0 oder 1 ist) keine Nullstellen liegen, und damit den Primzahlsatz
beweisen. Die bislang unbewiesene Riemannsche Vermutung besagt, dass alle nichttrivialen
Nullstellen auf der mittleren Geraden Re(z) = 1/2 dieses Streifens liegen. Aus ihr würden sehr
genaue Abschätzungen für die Primzahlverteilung folgen.
8.2.3 Sei x < y. Die Anzahl der Primzahlen p mit x < p ≤ y ist gleich π(y) − π(x). Diese
Differenz kann man mit Hilfe der Ungleichungen (∗) nach unten abschätzen:
π(y) − π(x) ≥ (1 − ε)(y/ ln y) − (1 + ε)(x/ ln x)
230
KAPITEL 8. KOMPLEXE ZAHLEN
Im Hinblick auf das Bertrandsche Postulat betrachten wir den Fall y = 2x und erhalten
π(2x) − π(x) ≥ (1 − ε)(2x/ ln(2x)) − (1 + ε)(x/ ln(x))
Nun ist ln(2x) = ln(x) + ln(2) < ln(x) + 1. Das bedeutet, dass 2x/ ln(2x) nicht viel kleiner als
2 · (x/ ln(x)) ist. Wir wählen nun δ(x), so dass x/ ln(2x) = (1 − δ)x/ ln(x) ist. Dann gilt
π(2x) − π(x) ≥ (1 − ε)((2x/ ln(2x)) − (1 + ε)(x/ ln(x)) = (2(1 − ε)(1 − δ(x)) − (1 + ε)) · x/ ln(x)
Beachte limx→∞ δ(x) = 0. Ist nun
(∗∗)
2>
1+ε
,
(1 − ε)(1 − δ)
so ist π(2x) − π(x) > 0, also gibt es dann mindestens eine Primzahl p mit x < p ≤ 2x. Ist nun
ε klein genug, dass (1 + ε)(1 − ε) < 2 gilt, so gilt die Ungleichung (∗∗) für genügend große x.
Es folgt sogar, dass die Anzahl der Primzahlen zwischen x und 2x mit x gegen unendlich geht,
nicht wahr?
Num konnte Čebyšev zwar den Primzahlsatz noch nicht beweisen, aber die Ungleichungen (∗)
für ε = 1/9 zeigen, falls nur x genügend groß ist.
1 + 19
< 2 ist, folgt das Bertrand’sche Postulat – zunächst für große x. Es ist dann noch
1 − 19
etwas Feinarbeit zum vollständigen Beweis zu leisten.
Da
8.2.4 Was wir oben für den Faktor 2 getan haben geht ebenso gut für den Faktor 1,1 oder
1,01, allgemeiner für jeden Faktor der Form 1 + γ mit beliebig kleinem γ > 0. Dann allerdings
ist die Anzahl der Primzahlen zwischen x und (1 + γ)x nur für genügend große x nicht null.
Zum Beweis muss man außerdem den vollen Primzahlsatz benutzen.
Was sollen wir nun zur Frage sagen, ob Primzahlen einsam sind?
Man mag ja eine Primzahl, die zur nächsten Primzahl einen großen Abstand hat als einsam
ansehen. Dann gibt es einsame Primzahlen. Wenn man aber den Abstand der n-ten Primzahl
pn zur (n + 1)-ten Primzahl pn+1 im Verhältnis zur Größe von pn als Maß für seine Einsamkeits
nimmt, sieht die Sache anders aus. Für jede noch so kleine Zahl γ > 0 gibt es ja eine reelle Zahl
x, so dass zu jeder Primzahl p > x die nächstgrößere Primzahl kleiner als (1 + γ) · p ist.
Kapitel 9
Gruppen
Ist es sinnvoll, Bereiche mit nur einer Rechnungsart zu betrachten?
9.1
Was sind Gruppen?
Bislang hast Du die algebraischen Begriffe Ring und Körper kennengelernt. Möglicherweise
hast Du sogar ein gewisses Verständnis dafür bekommen, warum man sie in aller Allgemeinheit
studiert. Es gibt ja viele interessante Ringe, und unter diesen auch viele interessante Körper.
Neben Z, Q, R, C gibt es z.B. noch die Restklassenringe Z/(m), die genau dann Körper sind,
wenn m eine Primzahl ist, ferner die Matrizenringe. Glaub mir, das ist nur der Anfang!
Hältst Du es für sinnvoll, algebraische Strukturen zu definieren, bei denen es nur eine Verknüpfung (Rechenart) gibt? Vielleicht nicht.
Auch ich kann Dir hier nur eine Ahnung davon geben, zu welchem Zweck man den Gruppenbegriff einführt, und dich einfach bitten, zu glauben, dass er in der Mathematik und der Physik
eine große Rolle spielt.
Definition 9.1.1 Eine Gruppe ist eine Menge G zusammen mit einer Verknüpfung (Rechenart), die vorläufig mit ◦“ bezeichnet sei, so dass folgendes gilt:
”
0) (a ◦ b) ◦ c = a ◦ (b ◦ c) für alle a, b, c ∈ G. (Assoziativität)
1) Es gibt ein neutrales Element e ∈ G mit e ◦ a = a ◦ e = a für alle a ∈ G. (Existenz eines
neutralen Elementes) (Hier ist mit e nicht die Eulersche Zahl 2,718... gemeint.)
2) Für ein solches neutrales Element e gilt: Zu jedem a ∈ G gibt es ein Inverses a− ∈ G mit
a− ◦ a = a ◦ a− = e. (Existenz inverser Elemente)
Definition 9.1.2 Eine Gruppe G (mit der Verknüpfung ◦“) heißt abelsch (oder kommuta”
tiv), wenn a ◦ b = b ◦ a für alle a, b ∈ G gilt.
Nils Hendrik Abel (1802-1829) war einer der ganz großen Mathematiker – trotz seines
kurzen Lebens. (Eine abelsche Gruppe ist kaine Gruppe von Männern, die von ihren Brüdern
erschlagen wurden.)
231
232
KAPITEL 9. GRUPPEN
Bemerkungen 9.1.3 a) Das neutrale Element ist eindeutig definiert. Denn für jedes weitere
neutrale Element e0 gilt: e = e ◦ e0 = e0 gemäß 1).
In einer Gruppe gelte x ◦ x = x. Dann ist x = x− ◦ (x ◦ x) = x− ◦ x = e.
b) Auch gibt es zu jedem a ∈ G nur ein Inverses. Sei etwa a( ein weiteres solches, so erhält
man a− = e ◦ a− = (a( ◦ a) ◦ a− = a( ◦ (a ◦ a− ) = a( ◦ e = a(
Offenbar ist a invers zu a− und wegen der Eindeutigkeit des Inversen deshalb (a− )− = a .
(Du hast diese Überlegungen bereits für die Addition in Ringen gemacht!)
c) Ein sparsameres Axiomensystem ersetzt 1) und 2) durch:
Es gibt ein e ∈ G, so dass gilt:
1’) e ◦ a = a für alle a ∈ G,
2’) zu jedem a ∈ G existiert ein a− ∈ G mit a− ◦ a = e.
Es ist nicht ganz einfach zu zeigen, dass aus 0), 1’) und 2’) (bei fehlender Kommutativität)
auch 1) und 2) folgen. Und ich halte das auch nicht für so wichtig, da in den meisten Beispielen
von Gruppen die Gesetze 1) und 2) leicht zu zeigen sind.
d) Die Assoziativität besagt, dass es in iterierten ‘Produkten’, etwa (a ◦ b) ◦ (c ◦ (d ◦ f )) auf die
Klammerung nicht ankommt, man also die Klammern weglassen darf.
Die Reihenfolge der ‘Faktoren’ bleibt allerdings wichtig – es sei denn die Gruppe ist abelsch.
e) Achtung: (a ◦ b)− = b− ◦ a− . Du erinnerst Dich: Wenn man zuerst ein Hemd und danach
einen Pullover anzieht und dies (ohne Verrenkungen) wieder rückgängig machen will, muss man
zuerst den Pullover und danach das Hemd ausziehen.
Für a, b mit (a ◦ b)− = a− ◦ b− gilt somit a ◦ b = ((a ◦ b)− )− = (a− ◦ b− )− = (b− )− ◦ (a− )− = b ◦ a .
f) Man kann in einer Gruppe sinnvoll Potenzen mit ganzzahligen Exponenten definieren: Die
Definition ist dieselbe, wie für Elemente 6= 0 eines Körpers. Und es gelten auch die Regeln:
am ◦ an = am+n , (am )n = amn , aber nicht allgemein (ab)m = am ◦ bm .
Zeige: Gilt in einer Gruppe (a ◦ b)2 = a2 ◦ b2 , so ist b ◦ a = a ◦ b.
g) Das neutrale Element hat die Eigenschaft e ◦ e = e. Umgekehrt ist es das einzige Element
mit dieser Eigenschaft. Aus x ◦ x = x erhält man nämlich x− ◦ x ◦ x = x− ◦ x, also x = e. (Doch
erinnere Dich: In jedem Ring gilt sowohl 1 · 1 = 1 als auch 0 · 0 = 0.)
h) Wir konstruieren eine Gruppe von 2 Elementen: G = {e, a} mit dem neutralen Element e
und einem weiteren a 6= e. Die Verknüpfungen e ◦ e = e, e ◦ a = a ◦ e = a sind durch ein Axiom
direkt vorgeschrieben. Aus a ◦ a = a würde a = e folgen. Also ist a ◦ a = e. Die Assoziativität
kannst Du natürlich durch Untersuchung aller Fälle nachprüfen. (Ist e ein beidseitig neutrales
Element, so folgt (x ◦ e) ◦ y = x ◦ (e ◦ y). Ebenso (e ◦ x) ◦ y = e ◦ (x ◦ y) und (x ◦ y) ◦ e = x ◦ (y ◦ e).
Es bleibt der Fall (a ◦ a) ◦ a = a ◦ (a ◦ a), der unmittelbar aus a ◦ a = e folgt.) Eine andere
9.1. WAS SIND GRUPPEN?
233
Möglichkeit, dies einzusehen, ergibt sich durch die Betrachtung der sogenannten Gruppentafel
(Multiplikationstabelle):
◦ e a
e e a
a a e
Diese ist nämlich offenbar die gleiche wie die Additionstabelle unseres ‘Minikörpers’ F2 , wenn
man nur e durch 0 und a durch 1 ersetzt. Da die Verknüpfungen zwangsläufig sind, ist jede
Gruppe von 2 Elementen zu der konstruierten ‘isomorf’, d.h. nicht wesentlich von ihr verschieden. (Was das genau bedeutet, muss und werde ich natürlich noch definieren.) Diese Gruppe
kommt häufig vor: In jedem Ring, in dem 1 6= −1 gilt, ist die Menge {1, −1} in Bezug auf die
Multiplikation eine Gruppe aus 2 Elementen. Hier entspricht e der 1 und a der -1.
9.1.4 Etwas zur Schreibweise: Im Allgemeinen werden alternativ zwei mögliche Schreibweisen
für die Verknüpfung, das neutrale Element und das zu a Inverse benutzt:
a) Die multiplikative Schreibweise: ab oder a · b für a ◦ b, sowie 1 für e und a−1 für a− .
(Wenn die Gruppe aus bijektiven Abbildungen einer Menge auf sich selbst besteht und die
Verknüpfung deren Verkettung bedeutet, schreibt man natürlich auch a◦b für die Verknüpfung
und id oder z.B. auch I für das neutrale Element.)
Bei multiplikativer Schreibweise schreibt man Potenzen wie gewohnt.
b) Die additive Schreibweise: a + b für a ◦ b, sowie 0 für e und −a für a− . In diesem Fall
schreibt man auch a − b an Stelle von a + (−b) usw. Die additive Schreibweise wird in der Regel
nur bei abelschen Gruppen benutzt.
Bei der additiven Schreibweise entspricht dem Begriff ‘Potenz’ der Begriff ‘Vielfaches’. Beispiel
aaa schreibt man als a3 , während a + a + a als als 3a geschrieben wird. Entspechend bedeutet
a−2 bei multiplikativer Schreibweise (aa)−1 , während man bei additiver Schreibweise (−2)a =
−(a + a) setzt. (Natürlich gilt (aa)−1 = a−1 a−1 und somit auch −(a + a) = (−a) + (−a), welch
letzteres auch −a − a geschrieben wird.)
Ich benutze hier meist, aber nicht immer, die multiplikative Schreibweise. Manchmal liegt
natürlich die additive Schreibweise nahe.
Definition 9.1.5 Die Kardinalzahl (d.h. die Elementezahl) einer endlichen Gruppe wird auch
ihre Ordnung genannt.
Beispiel 9.1.6 Ein typisches erstes Beispiel einer nicht abelschen Gruppe ist das Folgende:
Die Menge S3 ist die Menge aller bijektiven Abbildungen ϕ : {1, 2, 3} → {1, 2, 3}. Wir schreiben
solche Abbildungen in der Form
1
2
3
ϕ(1) ϕ(2) ϕ(3)
also ist z.B.
σ1 :=
1 2 3
1 3 2
234
KAPITEL 9. GRUPPEN
diejenige Abbildung, die 1 auf 1, 2 auf 3 und 3 auf 2 abbildet.
Welche Ordnung hat S3 ? Nun, sie hat offenbar soviele Elemente, wie es Anordnungen der Menge
{1, 2, 3} gibt, d.h. 3!=6 Stück.
Außer der genannten Abbildung σ1 gibt es noch die folgenden 5
1 2 3
1 2 3
σ2 :=
, σ3 :=
3 2 1
2 1 3
(σi lässt i fest, d.h. bildet i auf sich selbst ab, und vertauscht die beiden anderen Elemente aus
{1, 2, 3}.)
1 2 3
1 2 3
0
δ :=
, δ :=
2 3 1
3 1 2
und – nicht zu vergessen – die Identität (identische Abbildung)
I :=
1 2 3
1 2 3
9.1.7 Die Verknüpfung ◦“ ist die Verkettung (Hintereinanderausführung) der Abbildungen.
”
Dabei verabreden wir, die rechtsstehende zuerst auszuführen. Z.B.
1 2 3
1 2 3
1 2 3
◦
σ2 ◦σ1 =
=
= δ0
3 2 1
1 3 2
3 1 2
Hingegen
σ1 ◦σ2 =
1 2 3
1 3 2
◦
1 2 3
3 2 1
=
1 2 3
2 3 1
=δ
Es ist also σ1 ◦σ2 6= σ2 ◦σ1 .
Wir können eine Tabelle aller Produkte, die Gruppentafel, aufstellen
◦
I
σ1
σ2
σ3
δ
δ0
I
I
σ1
σ2
σ3
δ
δ0
σ1
σ1
I
δ0
δ
σ3
σ2
σ2
σ2
δ
I
δ0
σ1
σ3
σ3
σ3
δ0
δ
I
σ2
σ1
δ
δ
σ2
σ3
σ1
δ0
I
δ0
δ0
σ3
σ1
σ2
I
δ
In der α-Zeile und β-Spalte steht das Element α◦β.
In jeder Zeile steht jedes Element von S3 genau einmal. Das ist auch in jeder Spalte so. Dies gilt
für jede Gruppe. Denn für je zwei Elemente a, b der Gruppe hat die Gleichung ax = b genau
eine Lösung, nämlich x = a−1 b. Entsprechend hat die Gleichung xa = b genau eine Lösung.
Welche?
Die Assoziativität ist ein Spezialfall einer allgemeinen Feststellung über die Assoziativität der
Verkettung von Abbildungen, die wir im Abschnitt über Abbildungen bereits gezeigt haben.
Das neutrale Element ist I. Das Inverse einer Abbildung ist die Umkehrabbildung.
9.1. WAS SIND GRUPPEN?
235
Beispiele 9.1.8 Weitere Beispiele von Gruppen:
a) (Z, +), d.h. die Menge der ganzen Zahlen zusammen (allein) mit der Addition, ist eine
Gruppe. Das neutrale Element ist 0, das Inverse von n ist −n.
b) Jeder Ring (und auch jeder Vektorraum) mit der Addition allein (d.h. wenn man die Multiplikation unberücksichtigt lässt) ist eine Gruppe. Man spricht man von der additiven Gruppe
des Rings, bzw. Vektorraums, auch von der unterliegenden (additiven) Gruppe des Vektorraumes.) Wieder bezeichnet die 0 das neutrale Element und −a das zu a Inverse.
Eine besondere Rolle spielen die additiven Gruppen der Ringe Z/(m). Diese Gruppen sind von
besonders einfacher Gestalt. Erinnere Dich an die Additionstabelle 2.4.8. Für m > 1 sieht sie
allgemein so aus:
0
1
2 · · · · · · · · · m-1
+
0
0
1
2 · · · · · · · · · m-1
1
2
· · · · · · · · · m-1
0
1
2
· · · · · · · · · m-1
0
1
2
..
..
..
..
..
..
..
..
.
.
.
.
.
.
.
.
m-2 m-2
m-1 m-1
m-1
0
0
1
···
···
···
···
· · · m-3
m-3 m-2
c) Sei K ein Körper und K ∗ = K − {0}. Dann ist K ∗ zusammen mit der Multiplikation eine
Gruppe, die multiplikative Gruppe des Körpers. Hier ist das neutrale Element die 1 und
das Inverse von a ist a−1 = 1/a. In Bezug auf die Multiplikation ist Z − {0} keineswegs eine
Gruppe; fast immer fehlt das Inverse.
d) Sei n > 0 eine natürliche Zahl. Mit Sn , der n-ten symmetrischen Gruppe wird die Menge
der bijektiven Abbildungen α : {1, 2, . . . , n} → {1, 2, . . . , n} zusammen mit der Verkettung als
Verknüpfung bezeichnet. Dies ist eine naheliegende Verallgemeinerung der oben betrachteten
S3 – und natürlich eine Gruppe. Im Gegensatz zu den Beispielen a), b), c) gilt für n ≥ 3 in der
Sn das Kommutativitätsgesetz nicht. D.h. es gibt α, β ∈ Sn mit α◦β 6= β ◦α (falls n ≥ 3). Das
hast Du für n = 3 oben bereits gesehen. Für n ≥ 4 ist das erst recht so. (Warum?)
e) Noch allgemeiner als unter d) kann man allgemein eine (möglicherweise unendliche) Menge
M betrachten und zu dieser die symmetrische Gruppe von M“, die aus sämtlichen bijektiven
”
Abbildungen M → M besteht, wo die Verknüpfung die Verkettung ist.
f) Sei K ein Körper. Dann bilden die 2×2-Matrizen über K, deren Determinante ungleich 0 ist,
bezüglich der Matrizenmultiplikation eine Gruppe. Diese Gruppe wird mit Gl2 (K) bezeichnet.
(“General linear group“) Berechne in dieser Gruppe
1 0
1 1
2
2
2 1 1
1 0
1 1
.
und
·
·
1 1
0 1
0 1
Die Gruppe Gl2 (K) ist also für keinen Körper K kommutativ.
Es gibt natürlich mehrere Verallgemeinerungsmöglichkeiten: Du kannst n×n-Matrizen betrachten. Du kannst anstelle eines Körpers einen kommutativen Ring R betrachten und in M2 (R)
236
KAPITEL 9. GRUPPEN
die Matrizen, deren Determinante in R invertierbar ist. Ist R = Z so bedeutet das, dass die
Determinante 1 oder −1 ist. Ein Beispiel eines solchen Elementes ist hier die Matrix
5 17
2 7
Schließlich darf der Ring auch nichtkommutativ sein. Dann betrachte die (multiplikativ) invertierbaren Matrizen. Determinanten helfen hier allerdings nicht.
Wie man bei Vektorräumen Untervektorräume betrachtet, gibt es auch in der Theorie der
Gruppen den Begriff der Untergruppe.
Definition 9.1.9 Sei G eine Gruppe. Eine Untergruppe U von G ist eine Teilmenge von G,
die bezüglich der Verknüpfung in G wieder eine Gruppe ist. D.h. es wird verlangt, dass 1 ∈ U
ist und aus a, b ∈ U sowohl ab ∈ U als auch a−1 ∈ U folgt.
(Es reicht hierfür zu verlangen, dass U 6= ∅ und mit a, b ∈ U auch ab−1 ∈ U ist. Beweis?)
Beispiele 9.1.10 a) In jeder Gruppe G sind sowohl {1} (bei additiver Schreibweise {0}) als
auch G selbst Untergruppen. Diese nennt man manchmal die trivialen Untergruppen
b) Sei G := Z mit der Verknüpfung +“ und m ∈ N. Die Menge mZ := {mx | x ∈ Z} ist eine
”
Untergruppe von G. Du wirst später erfahren, dass jede Untergruppe der additiven Gruppe
von Z so aussieht. Du kannst natürlich versuchen, dies jetzt schon selbst zu beweisen. (Tipp:
Division mit Rest.)
c) Sei K ein Körper. Dann ist die Menge {1, −1} eine Untergruppe von K ∗ . Für den Körper
C gilt, dass R∗ , R∗+ und {z ∈ C | |z| = 1} Untergruppen von C∗ sind. Ferner bilden für jedes
ganze n ≥ 1 die n-ten Einheitswurzeln eine Untergruppe von C∗ .
d) Seien m, n mit 1 ≤ m ≤ n natürliche Zahlen. Dann hat Sn folgende zur Sm isomorfe
Untergruppe U . Sie besteht aus denjenigen bijektiven Abbildungen α : {1, . . . , n} → {1, . . . , n},
für welche α(j) = j für alle j mit m < j ≤ n gilt. (Die Elemente von U lassen die letzten n − m
Zahlen fest.) (Den Begriff ‘isomorf’ werde ich bald einführen, nämlich in Definition 9.1.12.)
Wendet man dies auf den Fall m = 3 an, sieht man, dass Sn für n ≥ 3 nicht abelsch ist.
Natürlich gilt dies auch für SM , wenn M eine unendliche Menge ist.
e) Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Dann ist die Menge hai :=
{an | n ∈ Z} eine Untergruppe von G. (Bei additiv geschriebenen Gruppen ist hai =
{na | n ∈ Z}.) Man nennt hai die von a erzeugte Untergruppe von G.
Weiter unten gehen wir genauer auf solche Untergruppe ein.
f) Sei K ein Körper. Die 2 × 2-Matrizen der Form
a −b
A=
mit det A 6= 0
b a
bilden eine Untergruppe der Gl2 (K). Insbesondere musst Du zeigen, dass mit A auch A−1 die
verlangte Form hat.
9.1. WAS SIND GRUPPEN?
237
Beispiel 9.1.11 Wir wollen die Untergruppen der S3 bestimmen. Zunächst haben wir die
beiden Untergruppen {I} und S3 .
Da σi2 := σi ◦σi = I ist, sind die drei Mengen Ui := (hσi i :=){I, σi } Untergruppen. Und da
δ 2 = δ 0 und δ 3 = δ 2 ◦δ = I gilt, ist V := {I, δ, δ 0 } eine Untergruppe. (Es gibt drei Untergruppen
der Ordnung 2 und eine solche der Ordnung 3.)
Wir haben also außer den beiden trivialen Untergruppen {I} und S3 noch die o.a. vier Untergruppen. Wir wollen jetzt überlegen, dass es keine weiteren Untergruppen gibt.
Jede der vier Untergruppen U1 , U2 , U3 , V besitzt außer {I} und sich selbst keine weiteren Untergruppen. Ferner liegt jedes Element von S3 in einer dieser vier Untergruppen. Jede weitere
von {I} verschiedene Untergruppe H von S3 muss also zwei Elemente enthalten, die nicht gemeinsam in einer der Untergruppen U1 , U2 , U3 , V liegen. Es genügt jetzt zu zeigen, dass unter
dieser Voraussetzung H = S3 ist.
Es gelte etwa σ1 , σ2 ∈ H. Dann ist auch δ = σ1 ◦σ2 ∈ H, ebenso δ 0 = δ 2 , ferner noch σ3 = σ1 ◦δ 0 .
Da ohnehin I ∈ H gilt, muss H = S3 sein. Ebenso einfach zeigt man die folgenden Implikationen
σ1 , σ3 ∈ H =⇒ H = S3 ;
σ2 , σ3 ∈ H =⇒ H = S3 ;
σi , δ ∈ H =⇒ H = S3 ;
σi , δ 0 ∈ H =⇒ H = S3
Wir sehen insbesondere, dass S3 keine Untergruppe der Ordnung (d.h. Elementezahl) 4 oder 5
hat. Später werden wir ganz allgemein zeigen: Ist G eine endliche Gruppe der Ordnung n und
U eine Untergruppe von G, so wird n von der Ordnung von U geteilt.
Die Untergruppen von S3 ergeben folgendes Bild:
S3
U1 U2
U3
V
{I}
Die Gruppen U1 , U2 , U3 , V umfassen alle die Gruppe {I} und liegen alle in der S3 . Zwischen
ihnen gibt es keine Inklusionsrelationen.
Der Begriff der Isomorfie. Wann wollen wir Gruppen G und H zueinander isomorf
nennen, d.h. dass sie bis auf die Bezeichnung der Elemente (und der Verknüpfung) überein”
stimmen“ sollen? Am klarsten kann man dies mit Hilfe des Abbildungsbegriffes ausdrücken:
Definitionen 9.1.12 a) Seien G, H Gruppen. Ein Gruppenhomomorfismus (kurz: Homomorfismus) von G nach H ist eine Abbildung f : G → H, die
f (a ◦ b) = f (a) ◦0 f (b) für alle a, b ∈ G erfüllt.
(∗)
(Dabei bezeichne ◦ die Verknüpfung in G und ◦0 diejenige in H.
b) Ein Isomorfismus, auch Isomorfie von Gruppen ist ein bijektiver Homomorfismus.
c) Gruppen G und H heißen zueinander isomorf, wenn es einen Isomorfismus G → H gibt.
238
KAPITEL 9. GRUPPEN
Bemerkungen 9.1.13 Im Folgenden sei die multiplikative Schreibweise benutzt.
a) Die Umkehrabbildung eines Isomorfismus f : G → H ist wieder ein solcher.
Zunächst ist ja f −1 : H → G wieder bijektiv.
Seien nun zu gegebenen a0 , b0 ∈ H die Elemente a, b ∈ G durch a := f −1 (a0 ), b := f −1 (b0 )
definiert. Dann ist a0 = f (a), b0 = f (b), also a0 b0 = f (a)f (b) = f (ab). Hieraus folgt f −1 (a0 b0 ) =
f −1 (f (ab)) = ab. Mit ab = f −1 (a0 )f −1 (b0 ) erhält man dann f −1 (a0 b0 ) = f −1 (a0 )f −1 (b0 ).
b) Ist f : G → H ein Gruppenhomomorfismus und 1 das neutrale Element von G, so ist f (1)
das neutrale Element von H. Denn es ist ja f (1)2 = f (12 ) = f (1). Wende die Bemerkung (9.1.3
a) an.
c) Ist f ein Gruppenhomomorfismus, so gilt f (a−1 ) = f (a)−1 . Denn f (a)◦f (a−1 ) = f (a◦a−1 ) =
f (1) = 1.
Beispiele 9.1.14 a) Sei m > 0 ganz. Wir betrachten einerseits die additive Gruppe von Z/(m),
andererseits die multiplikative Gruppe Em der m-ten Einheitswurzeln, d.h. derjenigen komplexen Zahlen z, die die Gleichung z m = 1 erfüllen.
Diese beiden Gruppen sind isomorf! Wir wissen ja, dass für jede m-te Einheitswurzel ζ die
Gleichung ζ a = ζ b gilt, wenn a, b ganze Zahlen sind, die modulo m kongruent sind. Sei jetzt
ζ1 := cos(2π/m) + i sin(2π/m).
Dann ist die folgende Abbildung wohldefiniert:
ϕ : Z/(m) → Em , (a mod m) 7→ ζ1a .
Da für beliebige a, b ∈ Z, z ∈ C die Regel z a+b = z a · z b gilt, ist ϕ ein Homomorfismus. Die Bijektivität gilt, da auf Grund der Wahl von ζ1 die Zahlen ζ10 , . . . ζ1m−1 untereinander verschieden
sind. (Beachte, dass man ζ1 nicht durch jede m-te Einheitswurzel ersetzen kann. Sei nämlich etwa m = 4. Die Abbildung Z/(4) → {1, i, −1, −i} mit a 7→ ζ a ist zwar für jedes ζ ∈ {1, i, −1, −i}
wohldefiniert, aber nur für ζ = ±i surjektiv!)
b) Allgemeiner: Sei G eine multiplikativ geschriebene Gruppe und a ∈ G. Dann ist die Abbildung
f : Z → G, n 7→ an
ein Gruppenhomomorfismus, wenn wir von Z nur die additive Struktur betrachten. Dabei
braucht f weder injektiv noch surjektiv zu sein.
c) Je zwei Gruppen G, H von 2 Elementen sind zueinander isomorf.
Denn jede solche Gruppe besteht ja aus Elementen e, a mit dem neutralen Element e und einem
von e verschiedenen a, deren Verknüpfung, wie oben gesehen zwangsläufig ist.
9.1.15 Jetzt bestimmen wir die Gruppen der Ordnung 3. Sei G eine solche und seien a, b die
beiden von 1 verschiedenen Elemente.
9.1. WAS SIND GRUPPEN?
239
Die drei Elemente a1, aa, ab müssen die drei verschiedenen Elemente von G sein. Aus ab = b
würde a = abb−1 = bb−1 = 1 folgen. Analog ist ab = a nicht möglich. Also bleibt ab = 1 und
a2 = b.
In der folgenden Multiplikationstabelle ist die erste Zeile klar, die zweite gerade bestimmt
worden. Die dritte ergibt sich zwangsläufig daraus, dass in jeder Spalte jedes Element genau
einmal auftritt.
1 a b
1 1 a b
a a b 1
b b 1 a
Betrachte die oben gefundene Untergruppe V = {I, δ, δ 0 } ⊂ S3 . Ihre Gruppentafel ist
I
I I
δ δ
δ0 δ0
δ
δ
δ0
I
δ0
δ0
1
δ
Du siehst, die zweite Tabelle geht aus der ersten hervor, wenn man 1 durch I, a durch δ und
b durch δ 0 ersetzt. Also ist die erste Multiplikationstabelle die einer Gruppe; insbesondere gilt
für G die Assoziativität. Da die erste Gruppentafel sich zwangsläufig aus der Voraussetzung
ergibt, dass G aus den Elementen 1, a, b besteht, erkennst Du dass es bis auf Isomorfie nur eine
Gruppe von 3 Elementen gibt.
Ferner siehst Du a2 = b, b2 = a, a3 = b3 = ab = 1. Die Elemente kann man als Potenzen
von a schreiben: a0 = 1, a1 = a, a2 = b, a3 = 1, a4 = a, wonach sie sich periodisch wiederholen.
Ebenso geht es mit den Potenzen von b, nämlich b0 = 1, b1 = b, b2 = a, b3 = 1 usw. Offenbar
kann man die Rollen von a und b vertauschen. Das heißt, die Abbildung α : G → G, definiert
durch α(1) = 1, α(a) = b, α(b) = a ist ein Isomorfismus von G nach G, ein sogenannter
Automorfismus. Aber α ist nicht die identische Abbildung idG .
Nochmal: Wie im Fall der Ordnung 2 gibt es bis auf Isomorfie genau eine Gruppe der Ordnung 3.
Diese ist abelsch. Dies lässt sich verallgemeinern. Für jede Primzahl p gibt es bis auf Isomorfie
genau eine Gruppe der Ordnung p, nämlich die (abelsche) additive Gruppe von Z/(p). Das
werden wir weiter unten sehen. Hingegen gibt es bis auf Isomorfie zwei Gruppen der Ordnung
4, die beide abelsch sind, sowie zwei Gruppen der Ordnung 6. Die eine Gruppe der Ordnung 6
ist die additve Gruppe von Z/(6), also insbesondere abelsch, die andere unsere S3 , also nicht
abelsch. (Der Beweis dafür, dass es bis auf Isomorfie keine andere Gruppe der Ordnungen 4
oder 6 gibt, ist leider nicht so einfach.)
Beispiele 9.1.16 In der Gruppe Gl2 (Q) der invertierbaren 2 × 2-Matrizen über Q gibt es zwei
Untergruppen der Ordnung 4, die nicht zueinander isomorf sind, nämlich einerseits die aus
folgenden Elementen bestehende
1 0
−1 0
1 0
−1 0
E=
,
,
,
;
0 1
0 1
0 −1
0 −1
240
KAPITEL 9. GRUPPEN
andererseits die aus folgenden Elementen bestehende
1 0
0 −1
−1 0
E=
,
,
,
0 1
1 0
0 −1
0 1
−1 0
.
Prüfe nach, dass es sich wirklich um Untergruppen handelt.
In der ersten gilt für alle Elemente A2 = E, in der zweiten ist
0 −1
1 0
2
=
−1 0
0 −1
,
0 −1
1 0
3
=
0 1
−1 0
,
0 −1
1 0
4
=E .
Die erste Gruppe besitzt drei Untergruppen der Ordnung 2, die zweite Gruppe nur eine Untergruppe der Ordnung 2. Letztere ist isomorf zur additiven Gruppe von Z/(4).
Untergruppen der additiven Gruppe von Z. Sei m eine natürliche Zahl. Du weißt schon,
dass die Menge mZ = {mz | z ∈ Z}, also die Menge der durch m teilbaren ganzen Zahlen eine
Untergruppe der additiven Gruppe von Z ist. Umgekehrt kann man zeigen:
Satz 9.1.17 Zu jeder Untergruppe H der additiven Gruppe von Z gibt es genau eine natürliche
Zahl m mit H = mZ.
Beweis:
Ist H = {0} so ist H = 0Z, aber H 6= mZ für m 6= 0.
Ist H 6= {0}, so gibt es ein a ∈ H, a 6= 0. Da mit a auch −a ∈ H ist, gibt es sogar ein positives
a ∈ H. Sei m die kleinste positive Zahl, die zu H gehört. Ich behaupte, dass H = mZ ist.
Um dies zu beweisen nimm an, a sei ein beliebiges Element von H. Dividiere a durch m mit
Rest: a = qm + r mit 0 ≤ r < m.
Ist r = 0, so ist a ein Vielfaches von m.
Wäre hingegen r > 0, so wäre r = a − qm ein positives Element von H, das aber kleiner als m
wäre. Das widerspräche der minimalen Wahl von m. Es bleibt nur die Möglichkeit, dass a ein
Vielfaches von m ist.
Sind m, m0 positive ganze Zahlen mit mZ = m0 Z, so ist sowohl m als auch m0 das kleinste
positive Element von mZ, was m = m0 zur Folge hat.
AUFGABEN
1. Sei G eine (multiplikativ geschriebene) endliche abelsche Gruppe. Was kann man über das
Produkt aller ihrer Elemente sagen? Beantworte diese Frage speziell unter der Voraussetzung,
dass es genau ein Element der Ordnung 2 im G gibt, also genau ein a 6= 1 mit a2 = 1.
2. Zeige: In einem Körper K erfüllen nur 1 und −1 die Gleichung x2 = 1. Das gilt auch, falls
1 = −1 in K gilt.
9.2. NEBENKLASSEN
241
3. Folgere aus den letzten beiden Aufgaben (p − 1)! ≡ −1 (mod p), falls p eine Primzahl ist. (Satz
von Wilson).
4. Zeige auch die Umkehrung: Ist n > 1 keine Primzahl, so ist (n − 1)! 6≡ −1 (mod n). (Unterscheide, ob n = 4 oder n > 4.)
5. Beantworte (etwa mit Hilfe des Satzes von Wilson) die Frage, ob 100! + 1 eine Primzahl ist.
6. Sei p eine Primzahl mit p ≡ 1 (mod 4). Folgere aus dem Satz von Wilson, dass −1 in dem
Körper Z/(p) ein Quadrat ist.
7. Zeige dass in einem Körper die Menge aller von 0 verschiedenen Elemente der Form a2 + b2 eine
Untergruppe der multiplikativen Gruppe ist. (Dabei darf einer der Summanden 0 sein.) (Tipp:
Beispiel f) in (9.1.10).)
8. Zeige, dass die additive Gruppe aller reellen Zahlen zur multiplikativen Gruppe der positiven
reellen Zahlen isomorf ist.
9. Ist die additive Gruppe aller rationalen Zahlen isomorf zur multiplikativen Gruppe aller positiven rationalen Zahlen?
10. Betrachte die Potenzmenge P (M ) einer Menge M . Zeige, dass P (M ) eine abelsche Gruppe wird,
wenn man als Verknüpfung die symmetrische Differenz wählt, also (etwa additiv geschrieben)
A + B := A ∪ B − (A ∩ B) definiert.
11. Sei G eine Gruppe, derart, dass alle ihre Elemente a die Gleichung a2 = 1 erfüllen. Zeige: G ist
abelsch.
12. Du magst Dich fragen, warum man von der additiven Gruppe eines Ringes verlangt, dass sie
kommutativ ist. Genauer. Warum betrachtet man keine ‘ringähnlichen’ Rechenbereiche, deren
additive Gruppe nicht kommutativ ist?
Nun berechne (a+b)(1+1) mit Hilfe der beiden Distributivgesetze: Einmal als (a+b)+(a+b) =
a + b + a + b, zum andern als a(1 + 1) + b(1 + 1) = a + a + b + b.
13. Zeige: Die Gruppen S3 und Gl2 (F2 ) sind isomorf.
9.2
Nebenklassen
Es handelt sich hier um eine Verallgemeinerung der bekannten Restklassen r + mZ in Z.
Der grundlegende Satz über endliche Gruppen besagt, dass die Ordnung einer (beliebigen) Untergruppe H einer endlichen Gruppe G deren Ordnung teilt.
Dies zeigen wir, indem wir G in Teilmengen zerlegen, deren jede soviele Elemente wie H besitzt.
242
KAPITEL 9. GRUPPEN
Diese Zerlegung existiert unabhängig davon, ob G endlich ist. Unter einer zusätzlichen Voraussetzung über die Untergruppe H kann man die entsprechenden Teilmengen von G zu den
Elementen einer Gruppe machen! Das besprechen wir im nächsten Abschnitt. Ein Beispiel davon kennst Du schon, nämlich wie man Z/(m) aus Z gewinnt. (Beachte: Z/(m) ist als Ring ja
insbesondere eine Gruppe bezüglich der Addition.)
Definition 9.2.1 Sei also G eine Gruppe und H eine Untergruppe und a ein Element von G.
Die Linksnebenklasse von a nach H ist die Menge aH := {ax | x ∈ H}. Die Rechtsnebenklasse von a nach H ist die Menge Ha := {xa | x ∈ H}. Wenn klar ist, was von beiden
gemeint ist, sagen wir kurz Nebenklasse.
Wir benutzen hier die multiplikative Schreibweise! D.h. die Nebenklasse aH ist völlig analog
der Restklasse r + mZ in Z gebildet, wo wir die additive Schreibweise benutzen. G entspricht Z,
und H entspricht mZ und schließlich a ∈ G der Zahl r ∈ Z. D.h. die Nebenklasse aH entspricht
der Restklasse r + mZ.
Bemerkung 9.2.2 Ist G nichtabelsch, so kann durchaus aH 6= Ha sein. S.u.
Satz 9.2.3 Für Nebenklassen aH, bH, (bzw. Ha, Hb) in G gilt:
a) Es gibt (für ein fest gegebenes a) eine bijektive Abbildung f : H → aH. Mithin haben H und
aH gleichviele Elemente.
b) aH = bH ⇐⇒ b ∈ aH ⇐⇒ a−1 b ∈ H.
Beachte: Zwei Nebenklassen aH, bH sind nicht schon dann verschieden, wenn a 6= b
ist, sondern erst, wenn sie als Mengen verschieden sind, d.h. wenn es ein Element
in einer gibt, das nicht in der anderen liegt. Erinnere Dich daran, dass r + mZ = s + mZ
genau dann gilt, wenn r ≡ s (mod m) ist.
b’) Ha = Hb ⇐⇒ ba−1 ∈ H. Beachte den kleinen Unterschied zu b).
c) Es ist entweder aH = bH oder aH ∩ bH = ∅.
Beweis: a) Definiere f : H → aH durch f (x) := ax. Nach Definition von aH ist f surjektiv.
Um die Injektivität von f zu zeigen, nimm an, es sei f (x) = f (y), also ax = ay. Dann ist
auch a−1 (ax) = a−1 (ay). Mittels der Assoziativität und a−1 a = 1 folgt dann die gewünschte
Gleichheit x = y.
b) Wir zeigen, dass aus der ersten Aussage die zweite, aus der zweiten die dritte und schließlich
aus der dritten wieder die erste folgt. Damit folgt aber aus jeder der drei Aussagen auch jede
andere.
Ist aH = bH, so gilt insbesondere b ∈ aH, da ja b = b1 ∈ bH ist.
Ist b ∈ aH, so gibt es (nach Definition von aH) ein x ∈ H mit b = ax. Hieraus folgt a−1 b =
x ∈ H.
9.2. NEBENKLASSEN
243
Sei a−1 b ∈ H, also a−1 b = y, d.h. b = ay für ein geeignetes y ∈ H. Nach Definition ist bH die
Menge der bx mit x ∈ H, also die Menge der ayx mit x ∈ H. Überlege Dir jetzt, dass mit x
auch yx die ganze Menge H durchläuft. Demnach ist aH = ayH = bH. (Nicht wahr: mit x
und y gehört auch xy zur Untergruppe H. Ist umgekehrt z irgendein Element von H, so ist
z = (zy −1 )y von der Form xy mit einem x ∈ H, nämlich x = zy −1 .)
c) Nimm an, es sei aH ∩ bH 6= ∅. Also gibt es x, y ∈ H mit ax = by. Wir haben zu zeigen,
dass dann aH = bH ist. Aus ax = by folgt b = axy −1 Dabei ist xy −1 ∈ H. Also ist b ∈ aH und
gemäß b) deshalb aH = bH.
Beispiele 9.2.4 a) H selbst ist immer eine Nebenklasse nach H, nämlich H = xH für alle
x ∈ H, insbesondere H = 1H.
b) Ist H = G, so gibt es nur eine Nebenklasse nach H, nämlich H.
c) Ist H = {1}, so besteht jede Nebenklasse aus genau einem Element. Die einelementigen
Teilmengen von G sind die Nebenklassen nach {1}.
d) Sei G = S3 , unsere bekannte Gruppe der Permutationen der Menge {1, 2, 3}, und H = U1 =
{I, σ1 . Die Nebenklassen nach U1 sind:
U1 = {I, σ1 } = σ1 U1 , σ2 U1 = {σ2 , δ 0 } = δ 0 U1 , σ3 U1 = {σ3 , δ} = δU1
Je schwerer es Dir gefallen ist, obigen Satz zu verstehen, umso intensiver solltest Du dieses
Beispiel studieren. Übrigens ist U1 σ2 = {σ2 , δ} =
6 σ2 U1 .
e) Sei wiederum G = S3 , aber jetzt H = V . Die Nebenklassen nach V sind die 2 folgenden
Mengen:
V = {I, δ, δ 0 } = δV = δ 0 V, σ1 V = {σ1 , σ2 , σ3 } = σ2 V = σ3 V
Du kannst leicht nachrechnen, dass auch
V = V δ = V δ 0 und σ1 V = V σ1 = V σ2 = V σ3
gilt. Für V gilt also xV = V x für alle x ∈ S3 , im Gegensatz zu Ui !
f) Der Ring Z ist in Bezug auf die Multiplikation keine Gruppe. Deshalb ist auch mZ :=
{mz | z ∈ Z} für m > 1 keine Nebenklasse nach Z !
9.2.5 Sei jetzt G wieder eine beliebige (multiplikativ geschriebene) Gruppe und H eine Untergruppe von G.
Jedes Element a von G liegt in einer Nebenklasse nach H, nämlich in aH. Liegt a auch in
der Nebenklasse bH, so ist schon aH = bH. Jedes Element von G liegt somit in genau einer
Nebenklasse nach H.
G ist also die Vereinigung aller Nebenklassen nach H, und zwar die disjunkte Vereinigung
dieser Nebenklassen. Mit ‘disjunkt’ meine ich: Je zwei verschiedene Nebenklassen haben einen
leeren Durchschnitt.
244
KAPITEL 9. GRUPPEN
Sei nun G endlich. Dann sind natürlich auch H und die Anzahl r der Nebenklassen nach
H endlich. (Jede endliche Menge hat nur endlich viele Teilmengen.) Seien nun a1 , . . . , ar so
gewählt, dass a1 H, a2 H, . . . ar H die r verschiedenen Nebenklassen von G nach H sind. (Jedes
ai darf durch ein beliebiges a0i ∈ ai H ersetzt werden.) Dann wissen wir:
1. G = a1 H ∪ a2 H ∪ . . . ∪ ar H;
2. ai H ∩ aj H = ∅, wenn i 6= j ist;
3. jedes ai H hat soviele Elemente wie H.
Es folgt: G hat r-mal soviele Elemente wie H. Wir haben folgendes bewiesen:
Satz 9.2.6 Sei G eine endliche Gruppe und H eine Untergruppe von G, dann ist die Ordnung
von H ein Teiler der Ordnung von G.
9.2.7 Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Die Potenzen an mit
n ∈ Z bilden offenbar eine abelsche Untergruppe von G, die von a erzeugte Untergruppe,
die mit hai bezeichnet wird. Man kann zwei Fälle unterscheiden:
1. Falls m 6= n, ist immer auch am 6= an . D.h. alle Potenzen
. . . , a−2 , a−1 , 1, a, a2 , . . .
sind untereinander verschieden. In diesem Fall ist die Abbildung
Z → hai, n 7→ an
ein Isomorfismus, wo Z als additive Gruppe betrachtete wird.
Z.B. gilt dies für a = 2 in Q∗ , der multiplikativen Gruppe aller von 0 verschiedenen rationalen
Zahlen.
2. Es gibt ganze Zahlen m 6= n mit am = an . Dies gilt z.B. für a = −1 in Q∗ , da (−1)2 = (−1)4
ist, und allgemeiner (−1)m = (−1)n genau dann stimmt, wenn m, n beide gerade oder beide
ungerade sind, m.a.W. wenn m ≡ n (mod 2) ist. Ein anderes Beispiel ist das Element δ ∈ S3 .
Die von δ erzeugte Gruppe ist {I, δ, δ 0 } = V , da δ 2 = δ 0 und δ 3 = I ist. Hier gilt δ m = δ n ⇐⇒
m ≡ n (mod 3).
Im Fall 1. ist die von a erzeugte Gruppe und mit ihr auch G unendlich. Ist G endlich, muss
demnach der 2. Fall eintreten.
Im 2. Fall gelte am = an mit m 6= n, etwa m > n. Dann ist am−n = 1. Mithin gibt es dann eine
positive ganze Zahl r mit ar = 1. Sei k die kleinste positive ganze Zahl mit ak = 1.
Behauptung. Unter den o.a. Voraussetzungen gilt
m ≡ n (mod k) ⇐⇒ am = an
Beweis hierfür: Ist ak = 1, so ist auch akl = (ak )l = 1 für jede ganze Zahl l. Aus m ≡ n (mod k)
folgt m − n = kl für ein l, hieraus am−n = 1, also am = an .
9.2. NEBENKLASSEN
245
Sei umgekehrt am = an , also am−n = 1. Dividiere m − n durch k mit Rest: m − n = qk + r,
wo q, r ∈ Z und 0 ≤ r < k. Es folgt ar = am−n−qk = am−n (ak )−q = 1. Wäre r > 0, so wäre r
eine positive ganze Zahl mit ar = 1, die kleiner als k wäre. Das widerspräche der Wahl von k.
Somit ist r = 0, d.h. m − n = qk, also m ≡ n (mod k). –
Die verschiedenen Potenzen von a sind demnach a0 , a1 , a2 , . . . , ak−1 . Diese bilden eine Untergruppe von G aus k Elementen. Diese Untergruppe ist isomorf zur additiven Gruppe Z/(k),
sowie zur multiplikativen Gruppe der n-ten Einheitswurzeln.
Definition 9.2.8 Die Ordnung eines Elementes a einer (multiplikativ geschriebenen) Gruppe
ist:
∞, wenn die Potenzen an sämtlich verschieden sind.
k, wenn die Potenzen an nicht sämtlich verschieden sind und k die kleinste positive ganze
Zahl mit ak = 1 ist.
Bemerkung 9.2.9 Die Ordnung k eines Elementes a einer Gruppe G ist die Ordnung der von
a erzeugten Untergruppe. Ist insbesondere G endlich, so ist k (natürlich endlich) und ein Teiler
von #G.
Satz 9.2.10 Sei G eine endliche (multiplikativ geschriebene) Gruppe aus g Elementen und
a ∈ G. Dann ist ag = 1.
Beweis:
1l = 1.
Die Ordnung k von a ist ein Teiler von g, etwa g = kl. Somit ist ag = akl = (ak )l =
Folgerung 9.2.11 Zu jeder Primzahl p gibt es bis auf Isomorfie nur eine Gruppe der Ordnung
p. Diese ist isomorf zur additiven Gruppe von Z/(p) und somit abelsch.
Beweis: Sei G eine Gruppe der Ordnung p und a ∈ G nicht das neutrale Element. Die
Ordnung der von a erzeugten Untergruppe hai ist ein Teiler von p. Andererseits ist ihre Ordnung
größer als 1, da sie außer dem neutralen Element mindestens ein weiteres Element enthält. Also
ist ihre Ordnung p. Somit ist G gleich hai, also isomorf zur additiven Gruppe von Z/p.
Folgerung 9.2.12 (Fermat) Sei p eine Primzahl und a ∈ Z nicht durch p teilbar. Dann gilt
ap−1 ≡ 1 (mod p).
Beweis: Wir betrachten den Körper Z/(p). Dieser hat p Elemente. Seine multiplikative
Gruppe besteht aus allen Elementen außer der Restklasse von 0, also aus p − 1 Elementen. Für
jedes Element x 6= 0 dieses Körpers gilt also xp−1 = 1. Die Restklasse jeder ganzen Zahl a, die
nicht durch p teilbar ist, ist ein Element x 6= 0 dieses Körpers. Die Gleichung xp−1 = 1 in dem
Körper Z/(p) bedeutet dann die Kongruenz ap−1 ≡ 1 (mod p) in Z.
246
KAPITEL 9. GRUPPEN
Bemerkung 9.2.13 Die fundamentale Tatsache (9.2.10) über endliche Gruppen ergibt also
unmittelbar den angegebenen zahlentheoretischen Satz von Fermat.
Beachte, dass aus diesem Satz für ganz beliebige a ∈ Z und eine Primzahl p die Kongruenz
ap ≡ a (mod p) folgt (auch wenn a durch p teilbar sein sollte).
Auch gilt allgemein für a, b, m, n ∈ Z und jede Primzahl p die Implikation:
a ≡ b (mod p) und m ≡ n (mod p − 1) =⇒ am ≡ bn (mod p)
Beachte: Um eine Kongruenz modulo p von Potenzen zu erhalten, hat man also für die Basen die
Kongruenz modulo p, hingegen für die Exponenten die Kongruenz modulo p−1 vorauszusetzen!
Natürlich kann man allgemeiner Ringe der Form Z/(m) betrachten und darin die multiplikative
Gruppe der (multiplikativ) invertierbaren Elemente (Z/(m))∗ . Die Anzahl der Elemente dieser
Gruppe wird seit Euler mit ϕ(m) bezeichnet. Für ganze Zahlen a, die zu m teilerfremd sind,
d.h. deren Restklassen in Z/(m) invertierbar sind, gilt dann
aϕ(m) ≡ 1 (mod m) (Euler)
Dieser Satz wird erst dann interessant, wenn man ϕ(m) berechnen kann. Dies ist leicht möglich,
wenn man die Primfaktorzerlegung von m kennt. Sei nämlich
m = pk11 · · · pkr r
mit verschiedenen Primzahlen p1 , . . . , pr und natürlichen Zahlen ki ≥ 1; dann ist
ϕ(m) = (pk11 − pk11 −1 ) · · · (pkr r − pkr r −1 )
Falls m = pk eine Primzahlpotenz ist, gilt ϕ(pk ) = pk − pk−1 . Das kannst Du vielleicht selbst
nachprüfen. Zum allgemeinen Fall benötigt man den sogenannten chinesischen Restsatz, der
weiter unten bewiesen wird.
Definition 9.2.14 Eine Gruppe G heißt zyklisch, wenn es ein a ∈ G mit hai = G gibt.
Bemerkung 9.2.15 Bis auf Isomorfie gibt es genau eine zyklische Gruppe unendlicher Ordnung. Diese ist isomorf zur additiven Gruppe von Z.
Zu jeder endlichen Ordnung m ≥ 1 gibt es bis auf Isomorfie genau eine zyklische Gruppe. Diese
ist isomorf zur additiven Gruppe von Z/(m) und zur multiplikativen Gruppe Em der m-ten
Einheitswurzeln. Das wird weiter unten bewiesen.
AUFGABEN
1. Endliche Untergruppen von C∗ , der multiplikativen Gruppe des Körpers C. Sei G eine endliche
Untergruppe der Ordnung n von C∗ . Dann gilt an = 1 für alle a ∈ G. Also gilt G ⊂ En , wobei
En die Gruppe der n-ten Einheitswurzeln ist. Es folgt G = En , da auch En aus n Elementen
besteht.
9.3. FAKTORGRUPPEN
247
2. Sei G eine (multiplikativ geschriebene) endliche zyklische Gruppe. Zeige: Hat G eine ungerade
Ordnung, so ist in G jedes Element das Quadrat eines geeigneten Elementes von G. Hat hingegen
G eine gerade Ordnung, so ist genau die Hälfte der Elemente von G ein Quadrat in G.
3. Sei G eine zyklische Gruppe von der Ordnung g und g zu m > 0 teilerfremd. Dann ist jedes
Element von G eine m-te Potenz in G. Ist hingegen die Ordnung von G durch m teilbar, so ist
jedes m-te Element von G eine m-te Potenz in G.
4. a) Ist die Zahl 10 · 210 + 1 eine Primzahl?
b) Sei p 6= 101 eine Primzahl. Kann dann 100 · p100 + 1 eine Primzahl sein?
c) Seien p, q verschiedene Primzahlen. Kann dann (q − 1) · pq−1 + 1 eine Primzahl sein?
5. Bestimme (bis auf Isomorfie) alle Gruppen der Ordnung 4.
Bemerkung: Natürlich bleibt es Dir unbenommen, zu zeigen, das es bis auf Isomorfie nur 2
Gruppen der Ordnung 6 gibt, nämlich die S3 und die Z/(6). Es scheint mir allerdings nicht
unbedingt sinnvoll, mit den wenigen in diesem Buch bereit gestellten Mitteln für zuviele n die
Gruppen der Ordnung n zu bestimmen. Schon der Fall der Ordnung 6 ist nicht trivial.
Auch wenn man mit verhältnismäßig elementaren Mitteln etwas weiter kommt – ich selber
habe einst die Gruppen der Ordnungen 48 und 52 bestimmt – bleibt letztlich der Versuch, alle
endlichen Gruppen zu beschreiben, unbefriedigend.
Anders ist die Sache bei endlichen abelschen Gruppen. Kennt man die Primfaktorzerlegung
einer natürlichen Zahl n, kann man die abelschen Gruppen der Ordnung n leicht beschreiben.
9.3
Faktorgruppen
Betrachte die additive Gruppe von Z. Du weißt bereits, dass die Mengen mZ mit m ∈ N die
Untergruppen von Z sind.
Wenn man von den multiplikativen Strukturen auf Z und Z/(m) absieht, so sind beide additive
Gruppen und die Abbildung k 7→ k + mZ von Z nach Z/(m) ist ein surjektiver Gruppenhomomorfismus.
9.3.1 Wir verallgemeinern die Konstrukion von Z/(m). Zu einer Untergruppe U einer abelschen
(multiplikativ geschriebenen) Gruppe G bilden wir die Nebenklassen aU , wo a ∈ G ist. Wir
wissen bereits, dass verschiedene Nebenklassen disjunkt sind und ihre Vereinigung ganz G ausmacht. Die Menge der Nebenklassen bezeichnet man mit G/U . Nun definiert man das Produkt
zweier Nebenklassen, wie folgt: (aU )(bU ) := (ab)U . Es stellt sich die Frage nach der Wohldefiniertheit. D.h. wir müssen uns vergewissern, dass aus aU = a0 U, bU = b0 U die Gleichheit
(ab)U = (a0 b0 )U folgt. (Dabei brauchen wir die Voraussetzung, dass G abelsch ist.)
Beweis hierfür: Die Voraussetzungen bedeuten a−1 a0 ∈ U, b−1 b0 ∈ U . Dann ist (ab)−1 a0 b0 =
a−1 a0 b−1 b0 ∈ U , da G abelsch und U eine Gruppe ist. –
248
KAPITEL 9. GRUPPEN
Man erhält eine surjektive Abbildung κ : G → G/U, a 7→ aU mit der Eigenschaft κ(ab) =
κ(a)κ(b). Auf Grund dieser Eigenschaft und der Surjektivität überträgt sich die Gruppenstruktur von G auf G/U . Das neutrale Element ist 1U = U , das Inverse von aU ist die Nebenklasse
a−1 U .
Mache Dir klar, dass tatsächlich die Konstruktion der additiven Gruppe Z/(m) ein
Spezialfall der der Konstruktion von G/U als Gruppe ist. Lediglich die Schreibweise
‘additiv’, bzw. ‘multiplikativ’ ist verschieden!
Ist G nicht abelsch, kann man nicht wie oben argumentieren. In der Tat muss U eine gewisse
Eigenschaft haben, die im abelschen Fall immer erfüllt ist. Für alle a ∈ G muss nämlich
aU = U a gelten.
Im folgenden Beispiel gibt es Gruppenelemente x, y mit xU = yU , aber (xx)U 6= (yy)U .
Beispiel 9.3.2 Sei mit den Bezeichnungen aus dem ersten Abschnitt G = S3 , U = U1 =
{I, σ1 }. Dann ist σ3 U = {σ3 , δ}, also σ3 U = δU . Aber σ3 ◦σ3 und δ ◦δ liegen in verschiedenen
Linksnebenklassen nach U1 . Es ist nämlich σ3 ◦σ3 = I, und δ ◦δ = δ 0 , hingegen IU = U und
δ 0 U = {δ 0 , σ2 } =
6 {I, σ1 } = U .
Definition 9.3.3 Ein Normalteiler einer Gruppe G ist eine Untergruppe U von G, für die
folgendes gilt: Für jedes a ∈ G ist aU = U a.
Satz 9.3.4 Sei G eine Gruppe, U ⊂ G eine Untergruppe. Durch die Vorschrift (aU )(bU ) :=
(ab)U (für alle a, b ∈ G) wird genau dann eine Multiplikaton in der Menge der Nebenklassen
nach U wohldefiniert, wenn U ein Normalteiler von G ist.
Beweis: a) Sei U ein Normalteiler. Wir setzen aU = a0 U und bU = b0 U voraus. Dann ist
a0 = au und b0 = bv für geeignete u, v ∈ U . Es gilt also a0 b0 = aubv. Da U ein Normalteiler
ist, ist U b = bU . Also gibt es ein u0 ∈ U mit ub = bu0 . Es folgt a0 b0 = aubv = abu0 v ∈ (ab)U .
Deshalb haben wir die Gleichheit (ab)U = (a0 b0 )U .
b) Sei o.a. Produkt für alle a, b ∈ G wohldefiniert, sowie a = u ∈ U , d.h. aU = 1U . Dann muss
(ub)U = (1b)U sein, d.h. ub ∈ bU . Da dies für beliebige u ∈ U gilt, folgt U b ⊂ bU . Daraus ergibt
sich offenbar b−1 U ⊂ U b−1 . Beides gilt für alle b ∈ G. Da mit b auch b−1 ganz G durchläuft,
gilt für alle a ∈ G sowohl U a ⊂ aU als auch aU ⊂ U a. Mithin ist U ein Normalteiler.
9.3.5 Sei U ein Normalteiler einer Gruppe G. Wie oben (im abelschen Fall) wird mit G/U die
Menge der Nebenklassen von G nach U bezeichnet. Wie dort siehst Du, dass G/U wieder eine
Gruppe ist.
Definition 9.3.6 Wenn U ein Normalteiler einer Gruppe G ist, heißt G/U die Faktorgruppe
von G nach U .
9.3. FAKTORGRUPPEN
249
Beispiel 9.3.7 Sei wieder G = S3 . Zeige, dass die Untergruppe V = {I, δ, δ 0 } ein Normalteiler
ist, und dass S3 /V eine Gruppe von 2 Elementen ist. Die Nebenklasse V ist das neutrale,
die Nebenklasse σ1 V das weitere Element. Erinnere Dich daran, dass V = δV = δ 0 V und
σ1 V = σ2 V = σ3 V gelten. Es gibt genau 2 Nebenklassen von S3 nach V . Die Faktorgruppe
S3 /V ist also eine Gruppe von 2 Elementen, d.h. isomorf zur aditiven Gruppe Z/(2) und zur
Untergruppe {1, −1} von Q∗ .
In obigen Beispiel haben wir gesehen, dass U1 kein Normalteiler von S3 ist. Dasselbe gilt
natürlich für U2 und U3 .
Theorem 9.3.8 Homomorfiesatz. Sei f : G → H ein Gruppenhomomorfismus und K :=
f −1 ({1H }) sein sogenannter Kern. (1H bezeichnet das neutrale Element von H.) Dann ist
K ein Normalteiler von G und im(f ) = f (G) eine Untergruppe von H. Und es wird durch
ϕ(xK) := f (x) eine Abbildung ϕ : G/K → f (G) wohldefiniert. Diese ist ein Isomorfismus.
Man kennt also die Struktur des Bildes eines Gruppenhomomorfismus G → H, wenn man
seinen Kern als Teilmenge von G kennt.
Beweis: Seien f (a), f (b) beliebige Elemente von f (G). Dann ist f (a−1 b) = f (a)−1 f (b), ferner
gilt 1H = f (1G ). Also ist f (G) eine Untergruppe von H.
Sicher ist 1G ∈ K. Ferner, seien a, b ∈ K. Dann gilt f (a−1 b) = f (a)−1 f (b) = 1. Also ist K
eine Untergruppe von G. Ist x ∈ G, a ∈ K, so ist f (xax−1 ) = f (x)f (a)f (x)−1 = f (x) · 1H ·
f (x)−1 = 1H . D.h. mit a ∈ K gilt xax−1 ∈ K, d.h. xa ∈ Kx. Also ist xK ⊂ Kx und aus
Symmetriegründen Kx ⊂ xK. Mithin ist xK = Kx und K ein Normalteiler.
Wir müssen zeigen, dass ϕ wohldefiniert ist. Sei also xK = yK, d.h. es gibt ein a ∈ K mit
y = xa. Es folgt f (y) = f (x)f (a) = f (x), was zu zeigen war.
ϕ ist ein Homomorfismus. Denn ϕ((xK)(yK)) = ϕ((xy)K) = f (xy) = f (x)f (y) =
ϕ(xK)ϕ(yK).
Das Bild der Abbildung ϕ ist natürlich dasselbe wie das Bild von f . Also ist ϕ surjektiv.
Schließlich sei ϕ(xK) = ϕ(yK), so ist f (x) = f (y). Es folgt f (x−1 y) = 1H , d.h. x−1 y ∈ K, also
xK = yK. Somit ist ϕ injektiv.
Beispiele 9.3.9 a)Betrachte det : Gl2 (K) → K ∗ . Der Gruppenhomomorfismus det ist surjeka 0
tiv, da det
= a gilt. Der Kern von det, der aus den Matrizen mit der Determinante 1
0 1
besteht, wird Sl2 (K), die spezielle lineare Gruppe, genannt. Nach dem Homomorfiesatz ist
Gl2 (K)/Sl2 (K) isomorf zur Gruppe K ∗ .
b) Betrachte die Abbildung R → C∗ , x 7→ exp(xi). Wenn ich R als additive Gruppe auffasse, ist dies ein
Gruppenhomomorfismus. Das Bild dieser Abbildung ist die Untergruppe
1
S := {Z ∈ C |z| = 1} von C∗ . Der Kern ist 2πZ, d.h. besteht aus den ganzzahligen Vielfachen von 2π. Es ist also R/2πZ isomorph zur multiplikativen Gruppe S 1 . Übrigens ergibt
250
KAPITEL 9. GRUPPEN
sich kein wesentlicher Unterschied, wenn ich anstelle der genannten Abbildung die Abbildung
x 7→ exp(2πxi) betrachte. Dann ist der Kern einfach die (additive) Untergruppe Z von R.
Die Gruppenhomomorfismen in den genannten Beispielen sind in keiner Weise Ringhomomorfismen. Es bereichert also ganz sicher die Mathematik, wenn man neben Ringen (und Körpern)
auch Gruppen betrachtet.
Satz 9.3.10 Sei G eine zyklische Gruppe. Dann ist G isomorf zur additiven Gruppe von Z/(m)
für ein eindeutig bestimmtes m ∈ N. Und zwar ist m = 0 genau dann, wenn G unendlich ist.
Anderfalls ist m = #G.
Beweis: Im Grunde wissen wir das schon. Aber es folgt auch direkt aus dem Homomorfiesatz,
indem man für ein erzeugendes Element a den Gruppenhomomorfismus
Z → G, n 7→ an
betrachtet. (Hier wird Z als die additive Gruppe von Z aufgefasst.) Dieser Homomorfismus ist
surjektiv und sein Kern ist eine Untergruppe von Z, also gleich mZ für ein gewisses m ∈ N.
Somit ist G ∼
= Z/mZ. Beachte: Ist m = 0, so ist Z/0Z, und damit G isomorf zu Z, betrachtet
als additive Gruppe.
9.3.11 Ziemlich weit oben, im Kapitel 2 über Ringe und Körper habe ich das direkte Produkt
von Ringen definiert: R1 × R2 × · · · × Rn definiert. Dieses besteht aus den n-tupeln (a1 , . . . , an )
mit ai ∈ Ri , wo Summe und Produkt auf naheliegende Weise, nämlich komponentenweise
definiert sind: (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) und (a1 , . . . , an ) · (b1 , . . . , bn ) :=
(a1 · b1 , . . . , an · bn ) . Wenn die Ri lediglich Gruppen sind, kann man natürlich auch ein direktes
Produkt von diesen Gruppen ganz analog definieren, nämlich als cartesisches Produkt der
Mengen mit komponentenweiser Verknüpfung.
a 0
Beispiel: Die Untergruppe der Gl2 (Q) der Ordnung 4, die aus den Matrizen
mit
0 b
a, b ∈ {1, −1} besteht (vgl. 9.1.16), ist isomorf der (additiven) Gruppe (Z/(2)) × (Z/(2)).
Sind R1 , . . . , Rn Ringe, so ist die additive Gruppe des direkten Produktes der Ringe R1 , . . . , Rn
natürlich das direkte Produkt der additiven Gruppen der R1 , . . . , Rn . Betrachte nun auch die
Gruppen Ri∗ der invertierbaren Elemente der Ri , so gilt (R1 ×· · ·×Rn )∗ = R1∗ ×· · ·×Rn∗ . Denn ein
n-tupel (a1 , . . . , an ) besitzt genau dann ein multiplikativ Inverses in dem direkten Produkt, wenn
jede Komponente ai in Ri ein Inverses besitzt. Denn es ist ja (a1 , . . . , an )(b1 , . . . , bn ) = (1, . . . , 1)
genau dann, wenn ai bi = 1 für alle i = 1, . . . , n gilt.
Betrachte nun speziell Ringe der Form Z/(mi ) und die kanonischen Ringhomomorfismen
κi : Z → Z/(mi ), definiert durch κi (a) = a + mi Z. Beachte, dass die κi auch Gruppenhomomorfismen der additiven Gruppen sind!
Zu n solchen mi kann man dann einen Ringhomomorfismus F : Z → Z/(m1 ) × · · · × Z/(mn )
durch F (a) := (κ1 (a), . . . , κn (a)) = (a + m1 Z, . . . , a + mn Z) definieren.
9.3. FAKTORGRUPPEN
251
Beispiele 9.3.12 a) n = 2, m1 = m2 = 3. Das Bild der Abbildung F besteht aus den
Restklassen-Paaren: (0, 0), (1, 1), (2, 2). Die Abbildung F ist also keineswegs surjektiv!
b) n = 2, m1 = 2, m2 = 3. Das Bild von F ist die Menge {F (0) = (0, 0), F (1) = (1, 1), F (2) =
(0, 2), F (3) = (1, 0), F (4) = (0, 1), F (5) = (1, 2)}. Dabei bedeutet der Querstrich in der linken
Komponente die Restklasse modulo 2, die in der rechten Komponente die Restklasse modulo
3.
Du siehst, das Bild von F ist der ganze Ring Z/(2) × Z/(3). Die Abbildung F ist also surjektiv!
Nach dem Homomorfiesatz ist dann Z/(2) × Z/(3) isomorf zu Z/(6), zunächst als additive
Gruppe. Da aber die Abbildung F auch mit der Multiplikation verträglich ist, sind die beiden
Ringe auch als solche isomorf.
Der Unterschied zwischen den beiden Beispielen liegt darin, dass im zweiten die Zahlen 2, 3
zueinander teilerfremd sind, nicht aber die Zahlen 3, 3 im ersten Beispiel.
Um einen dem zweiten Beispiel entsprechenden Satz allgemein zu zeigen, benötigen wir das
Lemma 9.3.13 Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. D.h. für i 6= j sei
ggT(mi , mj ) = 1. Wenn dann eine ganze Zahl k durch jedes der mi teilbar ist, ist k auch
durch das Produkt m1 · · · mn teilbar.
Beweis: Die Primfaktorzerlegung von m1 · · · mn sei pα1 1 · · · pαr r mit untereinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Jeder Primzahlpotenz-Faktor pαi i teilt wegen der
Teilerfremdheit genau eines der mj , da ansonsten mehrere mj einen Primfaktor gemeinsam
hätten. Also gilt pαi i |k für jedes i. Wegen der Eindeutigkeit der Primfaktorzerlegung von k wird
k durch das Produkt aller pαi i also von m1 · · · mn geteilt.
Satz 9.3.14 (Chinesischer Restsatz. Sun Tsu, Chhin Chiu–Shao)
Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. Die kanonischen Homomorfismen
κi : Z −→ Z/(mi ), a 7→ a + mi Z
definieren dann einen surjektiven Homomorfismus
Z −→ Z/(m1 ) × · · · × Z/(mn ) durch a 7→ (κ1 (a), . . . , κn (a))
und einen Isomorfismus
∼
=
G : Z/(m1 · · · mn ) −→ Z/(mi ) × · · · × Z/(mn ) .
Beweis:
Betrachte den oben definierten Homomorfismus
F : Z −→ Z/(m1 ) × · · · × Z/(mn ) .
Sein Kern besteht aus allen a ∈ Z, für die m1 |a, m2 |a, . . . , mn |a gilt. Dies ist nach obigem Lemma gleichbedeutend mit m1 · · · mn |a, da die mi paarweise teilerfremd sind. Somit ist m1 · · · mn Z
252
KAPITEL 9. GRUPPEN
der Kern von F . Nach dem Homomorfiesatz wird also durch F ein injektiver Homomorfismus
induziert:
G : Z/(m1 · · · mn ) −→ Z/(m1 ) × · · · × Z/(mn ) .
Da die Start- und die Zielmenge von G die gleiche endliche Anzahl von Elementen haben,
nämlich m1 · · · mn , ist G auch surjektiv. Und hieraus folgt die Surjektivität der Abbildung F .
Folgerung 9.3.15 Seien m1 , . . . , mn paarweise teilerfremde ganze Zahlen 6=
a1 , . . . , am ∈ Z beliebig. Dann hat das Kongruenzsystem
x ≡ ai
(mod mi )
0 und
(i = 1, . . . , n)
eine Lösung, d.h. es gibt ein x ∈ Z, welches alle n angegebenen Kongruenzen erfüllt. Die Lösung
ist bis auf Kongruenz modulo m1 · · · mn eindeutig bestimmt.
Beweis: Die Existenzaussage folgt aus der Surjektivität, die Eindeutigkeitsaussage aus der
Injektivität der Abbildung G.
Folgerung 9.3.16 Sei m > 1 eine ganze Zahl und m = pα1 1 · · · pαr r ihre Primfaktorzerlegung
mit zueinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Dann ist ϕ(m) = (p1 −
1)pα1 1 −1 · · · (pr − 1)pαr −1 für Eulers ϕ.
Beweis: Betrachte zunächst den Fall m = pα mit einer Primzahl p und α ≥ 1. Die Elemente
des Ringes Z/(pα ) sind die Restklassen der Zahlen 1, 2, . . . , pα . (Um das folgende Argument
durchsichtiger zu machen, habe ich die 0-Restklasse hier durch pα repräsentiert!) Diejenigen
Zahlen dieser Menge, die zu pα nicht teilerfremd sind, sind die Vielfachen von p, also die pα−1
Zahlen p, 2p, . . . , pα−1 p. In dem Ring Z/(pα ) gibt es somit pα − pα−1 = (p − 1)pα−1 zu pα
teilerfremde Restklassen, d.h. Einheiten.
Nach Voraussetzung sind die r Zahlen pα1 1 , . . . , pαr r zueinander paarweise teilerfremd. Also ist
nach dem chinesischen Restsatz Z/(m) isomorf zu dem direkten Produkt Z/(pα1 1 )×· · ·×Z/(pαr r ),
hat also die behauptete Anzahl von Einheiten.
Bemerkung 9.3.17 (RSA-Verschlüsselung) Falls m = pq mit verschiedenen Primzahlen p, q
ist, ist ϕ(m) = (p − 1)(q − 1), wie man aus der letzten Folgerung sieht.
(Dies kannst Du allerdings auch ohne den chinesischen Restsatz direkt einsehen: Von den Zahlen
0, 1, . . . , pq − 1 sind genau p Zahlen durch q teilbar, sowie q Zahlen durch p und genau eine
Zahl, nämlich die 0 sowohl durch p wie durch q. Du erhältst ϕ(pq) = pq−p−q+1 = (p−1)(q−1).)
Ohne die Primfaktorzerlegung von m zu kennen, kann man ϕ(m) nicht wirklich berechnen.
(Wenn man m und ϕ(m) kennt, kann man p und q mittels einer quadratischen Gleichung
bestimmen. Wie? D.h. die Aufgaben, einerseits ϕ(m) zu berechnen, andererseits m in Primfaktoren zu zerlegen sind im wesentlichen gleich mühsam.) Und falls p und q jeweils mehr als
200 Dezimalstellen besitzen, kann einer, dem nur ihr Produkt m bekannt ist, die Faktoren p, q
9.3. FAKTORGRUPPEN
253
meist auch mit Computer-Hilfe nicht finden. Das ist kein mathematischer Satz, sondern ein Erfahrungssatz! Sollte es eines Tages sogenannte Quantencomputer geben, würde diese Aussage
auch nicht mehr stimmen. (Quantencomputer nützen für aufwendige Rechnungen die quantentheoretische Natur der Materie aus. Es gibt solche der Idee nach, aber noch nicht wirklich in
der Realität.)
Einen Text von 200 Zeichen (Buchstaben, Satzzeichen, Leerstellen, ...) kann man durch ein
Zahl von 400 Dezimalstellen codieren. Einen längeren Text kann man in Teile von 200 Zeichen
zerlegen. Es genügt also etwa 400-stellige Zahlen zu verschlüsseln.
Sind k und a natürliche Zahlen, so gilt ak(p−1)(q−1)+1 ≡ a (mod pq). Derjenige, der p und q,
also (p − 1)(q − 1) kennt, kann mit Hilfe des euklidischen Algorithmus leicht natürliche Zahlen
k, c, d mit cd = k(p − 1)(q − 1) + 1 finden. Er kann dann jedermann auffordern, ihm Nachrichten
zu schicken, nachdem sie folgendermaßen verschlüsselt wurden: Ist die Nachricht durch eine
natürliche Zahl a < m, d.h. auch als Element von Z/(m) beschrieben, bilde ac modulo m. Das
ist durch die im 1. Kapitel beschriebene abgekürzte Berechnung von Potenzen möglich, wenn
man nach jeder Einzelrechnung den Rest modulo m bestimmt. Er selber kann sie dann durch
Potenzieren von ac mit d, wieder modulo m, entschlüsseln. Denn da cd = k(p − 1)(q − 1) + 1
ist, gilt
acd = ak(p−1)(q−1)+1 = ak(p−1)(q−1) · a1 ≡ a (mod m) .
Mache Dir klar, dass man xy modulo m verhältnismäßig schnell berechnen kann, dass man
aber d aus m und c nur berechnen kann, wenn man ϕ(m) kennt.
AUFGABEN
1. Sei U eine Untergruppe einer Gruppe G. Zeige: Wenn U kein Normalteiler von G ist, so gibt
es a, b ∈ G mit aU = bU , aber U a 6= U b.
2. Unter der Voraussetzung der letzten Aufgabe gilt aber: aU = bU ⇐⇒ U a−1 = U b−1 . Folglich
gibt es eine bijektive Abbildung von der Menge der Linksnebenklassen nach U auf die Menge
der Rechtsnebenklassen gegeben durch aU 7→ U a−1 . Die Kardinalzahl der Menge der Linksoder der Rechtsnebenklassen von G nach U heißt der Index von U in G. Er wird mit [G : U ]
bezeichnet.
3. Zeige: Gilt unter obiger Voraussetzung [G : U ] = 2, so sind U und G − U sowohl die beiden
Linksnebenklassen als auch die beiden Rechtsnebenklassen von G nach U . Folglich ist U ein
Normalteiler von G.
4. Wann gilt für eine natürliche Zahl n, dass ϕ(n) eine Potenz von 2, also durch keine ungerade
Primzahl teilbar ist?
Zeige: Dies gilt genau für die Zahlen der Form n = 2k p1 · · · pr , wo die Faktoren p1 , . . . , pr
verschiedene sogenannte Fermat’schen Primzahlen sind.
254
KAPITEL 9. GRUPPEN
m
Eine Fermatsche Primzahl ist eine solche der Form 22 + 1. (Du weißt schon, wenn 2n + 1
eine Primzahl ist, muss n = 0 oder n = 2m sein.) Beispiele Fermat’scher Primzahlen sind die
folgenden 2 = 20 + 1, 3 = 21 + 1, 5 = 22 + 1, 17 = 24 + 1, 257 = 28 + 1, 65537 = 216 + 1. Bis
m
jetzt kennt man keine weiteren Primzahlen der Form 22 + 1 als die genannten und weiß von
vielen Zahlen dieser Form, dass sie nicht prim sind.
5. Seien G1 , G2 , H abelsche Gruppen und fi : Gi → H Homomorfismen. Zeige: Die Abbildung
F : G1 × G2 → H mit F (a1 , a2 ) = f1 (a1 ) + f2 (a2 ) (additive Schreibweise in H) ist ein Homomorfismus.
6. Sei H eine endliche Gruppe, in der jedes Element eine Ordnung ≤ 2 hat. Zeige: H ist isomorf
zu Z/(2) × Z/(2) × · · · × Z/(2) mit einer geeigneten Anzahl von Faktoren. (Hinweis: Wir
wissen schon, dass H abelsch ist. Benutze jetzt die additive Schreibweise für H: Betrachte
Untergruppen von H, die zu direkten Produkten Z/(2) × · · · × Z/(2) isomorf sind und unter
diesen eine maximalmögliche U . Das soll heißen: Ist V eine Untergruppe mit V ⊃ U , die zu
einer Gruppe der Form Z/(2) × · · · × Z/(2) isomorf ist, so gilt schon V = U . Ist nun U = H,
so gilt die Behauptung. Ist aber U eine echte Unterguppe von H, so kann man mit Hilfe der
letzten Aufgabe eine Untergruppe V konstruieren, die U echt umfasst und isomorf zu einer
Gruppe der Form Z/(2) × · · · × Z/(2) ist. )
7. Sei H eine Untergruppe der multiplikativen Gruppe eines Körpers K. Sei G die Menge derjenigen Matrizen aus Gl2 (K), die entweder von der Form
a 0
0 c
oder von der Form
0 b
d 0
mit a, b, c, d ∈ H sind. Zeige
a) G ist eine Untergruppe der Gl2 (K).
b) Die Teilmenge N von G, die aus den Matrizen der Form
a 0
mit a, b ∈ H
0 b
besteht, ist ein Normalteiler vom Index 2 in G. Somit ist G/N die – bis auf Isomorfie eindeutig
bestimmte Gruppe der Ordnung 2.
b’) Die nichttriviale (d.h. von N verschiedene) Nebenklasse von G nach N besteht aus den
Matrizen der Form
0 c
d 0
mit c, d ∈ H.
c) In K gelte 1 6= −1, und es sei im Folgenden H = {1, −1}. Dann ist G eine nichtabelsche
Gruppe der Ordnung 8.
Bestimme die Elemente der Ordnung 2 (davon gibt es 5) sowie die der Ordnung 4 (davon gibt
es 2).
8. Bestimme die letzten 3 Ziffern von 19981998! .
Kapitel 10
Lineare Gleichungssysteme
Die Behandlung linearer Gleichungssysteme ist ein wichtiger Teil des Gebietes der Linearen
Algebra.
Hier möchte ich Dir eine systematische Methode, lineare Gleichungssysteme zu lösen vorstellen,
nämlich das sogenannte Gaußsche Verfahren. Ich habe die Erfahrung gemacht, dass es vielen
jungen Studierenden schwerfällt, eine allgemeine Beschreibung dieses Verfahrens zu verstehen.
Deshalb behandle ich zunächst Spezialfälle.
10.0.18 Wir wollen z.B. die rationalen Lösungen des folgenden Gleichungssystems finden.
3x +2y +4z = 6
2x −3y + 21 z = 4
5x +4y −3z = 20
Wir formen das Gleichungssystem um, indem wir
zweiten addieren:
3x +2y +4z
0x − 13
y − 13
z
3
6
5x +4y −3z
das (− 23 )-fache der ersten Gleichung zur
= 6
= 0
= 20
Es ist klar, dass jede Lösung des ersten Systems auch eine des zweiten ist. Umgekehrt, da man
aber das erste System aus dem zweiten zurückerhält, indem man das (+ 23 )-fache der ersten
Gleichung zur zweiten addiert, ist jede Lösung des zweiten Gleichungssytems auch eine des
ersten. Durch die obige Umformung hat man die Lösungsgesamtheit des Gleichungssystems
nicht verändert. D.h. ein Tripel von (etwa rationalen) Zahlen (ξ, η, ζ) für (x, y, z) eingesetzt
erfüllt genau dann das erste System, wenn es das zweite erfüllt.
Indem wir das (− 53 )-fache der ersten Gleichung zur dritten addieren, erhalten wir:
3x +2y +4z = 6
0x − 13
y − 13
z = 0
3
6
2
z = 10
0x + 3 y − 29
3
Wieder hat sich an der Menge der Lösungen nichts geändert!
255
256
Nun addieren wir das
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
2
-fache
13
der zweiten Gleichung zur dritten:
3x +2y +4z = 6
0x − 13
y − 13
z = 0
3
6
0x +0y −10z = 10
Dieses Gleichungssystem können wir von hinten aufrollen“ und die einzig mögliche Lösung
”
ausrechnen: x = 3, y = 12 , z = −1. Diese, und nur diese, erfüllt (natürlich) auch das erste
System. (Eine Lösung eines Gleichungssystems mit 3 Unbekannten ist immer ein Tripel von
Zahlen, hier das Tripel (3, 21 , −1). Bei n Unbekannten ist eine Lösung ein n-tupel (a1 , . . . , an ).)
Man kann aber auch das letzte Gleichungssystem noch weiter modifizieren, so dass die Lösung
schließlich ganz durchsichtig erkennbar ist. Zunächst multiplizieren wir die erste Gleichung mit
1
3
1
, die zweite mit − 13
und die dritte mit − 10
:
3
1x + 23 y + 43 z =
2
1
0x +1y + 2 z =
0
0x +0y +1z = −1
Da wir durch Multiplikation mit den inversen Faktoren wieder zum vorletzten System zurückkommen, hat sich wieder nichts an der Lösungsmenge geändert.
Nun addieren wir das − 21 -fache der letzten Gleichung zur zweiten, dann das − 34 -fache der letzten
Gleichung zur ersten:
1x + 23 y +0z = 10
3
1
0x +1y +0z =
2
0x +0y +1z = −1
Schließlich addieren wir das − 32 -fache der zweiten Gleichung zur ersten:
1x +0y +0z =
3
1
0x +1y +0z =
2
0x +0y +1z = −1
Hier kann man die (einzige) Lösung in der Tat direkt ablesen.
10.0.19 Ein weiteres Beispiel:
3x +2y +4z = 6
2x −3y + 12 z = 4
7x −4y +5z = 13
Addiere das − 23 -fache der ersten Gleichung zur zweiten und dann das − 37 -fache der ersten zur
dritten:
3x +2y +4z =
6
13
0x − 13
y
−
z
=
0
3
6
13
0x − 26
y
−
z = −1
3
3
257
Nun addiere das −2-fache der zweiten Gleichung zur dritten:
3x +2y +4z =
6
13
0x − 13
y
−
z
=
0
3
6
0x +0y +0z = −1
Da es kein z ∈ Q mit 0z = −1 gibt, hat dieses Gleichungssystem keine Lösung! Die Lösungsmenge ist ∅, die leere Menge.
Ein weiteres Beispiel:
3x +2y +4z = 6
2x −3y + 12 z = 5
7x −4y +5z = 16
Das Gleichungssystem unterscheidet sich von dem zuletzt behandelten nur durch die rechten
Seiten der zweiten und dritten Gleichung. Wir behandeln es so wie das vorangegangene System.
3x +2y +4z = 6
0x − 13
y − 13
z = 1
3
6
26
13
0x − 3 y − 3 z = 2
Weiter:
3x +2y +4z = 6
0x − 13
y − 13
z = 1
3
6
0x +0y +0z = 0
Dieses System hat offenbar ∞-viele Lösungen. Man kann für z ein beliebiges ζ (oder für y ein
beliebiges η) einsetzen und dann die zugehörigen ξ, η (bzw. ξ, ζ) ausrechnen.
Wir wollen alle möglichen Lösungen noch expliziter angeben. Dafür formen wir noch weiter um,
zunächst durch Multiplikation der ersten beiden Gleichungen durch geeignete Faktoren 6= 0:
1x + 32 y + 43 z =
2
1
3
0x +1y + 2 z = − 13
0x +0y +0z =
0
Dann addieren wir das − 23 -fache der zweiten Gleichung zur ersten:
28
1x +0y +1z =
13
1
3
0x +1y + 2 z = − 13
0x +0y +0z =
0
Man bekommt die folgende Parameterdarstellung aller möglichen Lösungen (ξ, η, ζ) des o.a.
Gleichungssystems:
ξ=
28
13
3
− t, η = − 13
− 12 t, ζ = t.
Der Parameter t darf dabei alle rationalen (oder reellen oder auch komplexen) Zahlen durchlaufen (je nachdem welche Zahlen wir zulassen wollen).
Hierfür wollen wir auch schreiben:
258
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
3
, − 13
, 0) + t(−1, − 12 , 1).
(ξ, η, ζ) = ( 28
13
Dabei gelte wie gewohnt:
t(a, b, c) := (ta, tb, tc) und (a, b, c) + (a0 , b0 , c0 ) := (a + a0 , b + b0 , c + c0 ).
10.0.20 Wir wollen das letzte Beispiel noch etwas genauer analysieren.
3
, − 13
, 0) + t(−1, − 12 , 1), wo t die Menge Q durchläuft, ist
Von allen Lösungen (ξ, η, ζ) = ( 28
13
28
3
( 13 , − 13 , 0) eine spezielle – wie man etwa sieht, indem man t = 0 setzt.
Die Tripel t(−1, − 12 , 1) hingegen sind Lösungen des folgenden Gleichungssystems:
3x +2y +4z = 0
2x −3y + 12 z = 0
7x −4y +5z = 0
welches aus dem letztbehandelten dadurch entsteht, dass man die rechten Seiten aller Gleichungen durch Nullen ersetzt. Denn, wenn man mit dem neuen Gleichungssystem dieselben
Manipulationen vornimmt wie mit dem alten, so bleiben auf den rechten Seiten immer die
Nullen stehen und auf den linken Seiten erhält man dasselbe wie oben.
1x +0y +1z = 0
0x +1y + 12 z = 0
0x +0y +0z = 0
Und dieses Gleichungssystem hat eben offensichtlich die Lösungen t(−1, − 21 , 1), wo t alle (rationale) Zahlen durchläuft.
Satz 10.0.21 Sei
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= b1
= b2
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = bm
ein (ganz allgemeines) lineares Gleichungssystem und (ξ1 , . . . , ξn ) eine seiner Lösungen, so ist
die Gesamtheit der Lösungen gleich (ξ1 , . . . , ξn ) + X, wo X die Menge aller Lösungen des
folgenden zugehörigen homogenen“ Gleichungssystems ist:
”
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= 0
= 0
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = 0
259
Dabei sei definiert:
(ξ1 , . . . , ξn ) + X := {(ξ1 , . . . , ξn ) + (η1 , . . . , ηn ) | (η1 , . . . , ηn ) ∈ X}.
Beweis:
Eigentlich ist die Behauptung trivial:
Sei etwa (η1 , . . . , ηn ) eine Lösung des homogenen Gleichungssystems, so gilt offenbar:
ai1 (ξ1 + η1 ) + ai2 (ξ2 + η2 ) + · · · + ain (ξn + ηn ) =
ai1 ξ1 + ai2 ξ2 + · · · + ain ξn + ai1 η1 + ai2 η2 + · · · + ain ηn = bi + 0 = bi
Und das für alle i = 1, . . . , n. Das bedeutet, dass jedes n-tupel aus (ξ1 , . . . , ξn ) + X eine Lösung
unseres Gleichungssystems ist.
Sei umgekehrt (ζ1 , . . . , ζn ) eine solche Lösung und (η1 , . . . , ηn ) := (ζ1 , . . . , ζn ) − (ξ1 , . . . , ξn ).
Dann gilt
ai1 η1 + ai2 η2 + · · · + ain ηn =
ai1 (ζ1 − ξ1 ) + ai2 (ζ2 − ξ2 ) + · · · + ain (ζn − ξn )
= ai1 ζ1 + ai2 ζ2 + · · · + ain ζn − (ai1 ξ1 + ai2 ξ2 + · · · + ain ξn ) = bi − bi = 0
Das heißt: (η1 , . . . , ηn ) ist eine Lösung des zug. homogenen Gleichungssystems, gehört also zu
X. Für die Lösung (ζ1 , . . . , ζn ) des ursprünglichen Systems gilt also (ζ1 , . . . , ζn ) = (ξ1 , . . . , ξn ) +
(η1 , . . . , ηn ) ∈ (ξ1 , . . . , ξn ) + X.
10.0.22 Wenn ein lineares Gleichungssystem überhaupt Lösungen hat und man eine solche
kennt, so erhält man mit Hilfe der Lösungsmenge des zugehörigen homogenen Gleichungssystems alle Lösungen.
Ein homogenes lineares Gleichungssystem besitzt immer (mindestens) eine Lösung, nämlich
(0, 0, . . . , 0), die sogenannte triviale Lösung.
Hat ein lineares Gleichungssystem eine Lösung und hat das zugehörige homogene Gleichungssystem nur die triviale Lösung, so ist das ursprüngliche Gleichungssystem eindeutig lösbar.
Die Lösungsmenge X eines homogenen linearen Gleichungssystems ist gegenüber gewissen Verknüpfungen (Operationen) abgeschlossen:
ξ, η ∈ X =⇒ ξ + η ∈ X. Ist zusätzlich a eine (rationale) Zahl und ξ ∈ X, so gilt aξ ∈ X. (Man
kann dies zusammenfassen zu a, b ∈ Q, ξ, η ∈ X =⇒ aξ + bη ∈ X.)
Das bedeutet, dass die Menge der (rationalen) Lösungen eines homogenen linearen Gleichungssystems in n Variablen ein Teilvektorraum des Qn ist. Rechnet man allgemein in einem Körper
K, so ist Qn durch K n zu ersetzen.
Bemerkungen 10.0.23 a) Es kann natürlich vorkommen dass der Koeffizient der ersten“
”
Unbekannten der ersten Gleichung gleich 0 ist. Dann ist es zweckmäßig, diese Gleichung mit
einer zu vertauschen, in der das nicht der Fall ist. Durch die Vertauschung von Gleichungen
ändert sich gewiss nicht die Lösungsmenge des Systems.
b) Natürlich ist es auch nicht verboten, dass in jeder Gleichung der Koeffizient der ersten
Unbekannten gleich 0 ist. Was bedeutet das für die Lösungsmenge?
260
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
10.0.24 Wir wollen ein Hilfsmittel einführen, welches zunächst lediglich als abgekürzte Schreibweise von linearen Gleichungssysemen dient, aber später von größter Bedeutung sein wird:
Eine Matrix ist ein rechteckiges“ Schema von Zahlen:
”


a11 · · · a1n
 ..
.. 
...
 .
. 
am1 · · · amn
Man kann sie als m-Tupel von n-Tupeln auffassen. Die aij heißen die Einträge der Matrix.
Die waagerechten“ n-Tupel (ai1 , . . . , ain ) heißen die Zeilen, die senkrechten“ m-Tupel
”
”


a1j
 .. 
 . 
amj
die Spalten der Matrix.
Es ist eine Konvention, dass der erste Index die Zeile, der zweite die Spalte bezeichnet. (Zeile
zuerst, Spalte später.)
Die (eingeschränkte) Koeffizientenmatrix des LGS
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= b1
= b2
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = bm
ist

a11 · · · a1n
 ..
.. 
...
 .
. 
am1 · · · amn

Die erweiterte Koeffizientenmatrix desselben LGS ist

a11 · · · a1n
 ..
..
...
 .
.
am1 · · · amn

b1
.. 
. 
bm
Definition 10.0.25 Die folgenden Manipulationen mit einer Matrix heißen elementare
Zeilen-Umformungen:
(I) Eine Zeile wird geändert, indem man ein Vielfaches einer anderen zu ihr addiert.
(II) Zeilen werden vertauscht.
(III) Eine Zeile wird mit einer von 0 verschiedenen Zahl multipliziert.
Zeilen-Umformungen vom Typ (I) heißen auch spezielle elementare Zeilenumformungen.
261
10.0.26 Sei nun

a11 · · · a1n b1
 ..
..
.. 
..
 .
.
.
. 
am1 · · · amn bm

die erweiterte Koeffizientenmatrix eines LGS.
Wir haben oben – allerdings nur exemplarisch – gesehen, dass folgendes gilt: Durch eine Folge
elementarer Zeilenumformungen vom Typ (I) und Typ (II) kann man sie auf die folgende Gestalt
bringen:

0 · · · 0 a01j1 · · ·
···
0 · · · 0 0 · · · 0 a02j2 · · ·
0 ···
0 ···
..
.







 0 ···

 0 ···

 0 ···
.. . .
.
.
a03j3
0
..
···
a01n
a02n
a03n
..
.
···
.
0
b01
b02
b03
..
.
a0rjr · · · a0rn b0r
0 b0r+1
0
0
..
..
.
.













Hier ist 1 ≤ j1 < j2 < j3 < · · · < jr und a0kjk 6= 0 für k = 1, . . . , r.
Ist j1 = 1, so besteht die erste Spalte nicht aus
Form

a011
 0

 ..
 .
lauter Nullen. Vielmehr ist sie dann von der





0
mit a011 6= 0. Im Allgemeinen bestehen die ersten j1 − 1 Spalten aus lauter Nullen. Die nächsten
j2 − j1 Spalten haben die Eigenschaft, dass alle Komponenten, bis auf möglicherweise die erste,
gleich 0 sind. Auf jeden Fall ist a1j1 6= 0. Sowohl br+1 = 0 wie br+1 6= 0 ist möglich.
Die letzte Matrix heißt die Zeilenstufenform der Ausgangsmatrix. Die Plätze“ mit den
”
Indices 1j1 , 2j2 , . . . , rjr heißen die Stufen der Matrix in Zeilenstufenform, die Zahlen j1 , . . . , jr
die Stufenindices. Die Einträge a0kjk heißen die Stufeneinträge.
10.0.27 Wir haben oben exemplarisch überlegt, dass das LGS, das zur umgeformten Matrix
gehört, dieselben Lösungen hat wie das ursprüngliche.
An der Matrix in Zeilenstufenform können wir jetzt sofort erkennen, ob das zug. LGS eine
Lösung hat oder nicht. Offensichtlich gibt es keine Lösung, wenn b0r+1 6= 0 ist. Denn dann hat
schon die (r + 1)-te Gleichung 0x1 + · · · + 0xn = b0r+1 keine Lösung.
Ist hingegen b0r+1 = 0, so kann man für alle j ∈ {1, . . . , n} − {j1 , j2 , . . . , jr } die Unbekannten xj
gleich 0 setzen und dann das LGS von unten her aufrollen“. D.h. eine Lösung sieht so aus
”
(0, . . . , 0, ξj1 , 0, . . . , 0, ξj2 , . . . , ξjr , 0, . . . , 0),
262
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
wobei ξjr = b0r /a0rjr , ξjr−1 = (b0r−1 − a0r−1,jr ξjr )/a0r−1,jr−1 etc. ist.
Um die Lösungsmenge (im Falle br+1 = 0) teoretisch besser zu durchschauen, unternehmen wir
noch Folgendes:
1. Wir machen die Stufeneinträge zu 1, indem wir für jedes k = 1, . . . , r die k-te Zeile mit 1/a0kjk
multiplizieren. (Es ist ja a0kjk 6= 0.)
2. Dann machen wir durch spezielle Zeilenumformungen (also solche vom Typ I) alles oberhalb
der Stufen zu 0. In der jk -ten Spalte steht als danach an der k-ten Stelle eine 1, sonst überall
Nullen.
3. Schließlich machen wir etwas für die Praxis Gefährliches. Wir vertauschen die Unbekannten,
d.h. die Spalten der bisher erreichten Matrix. (Die letzte Spalte, in der die rechten Seiten der
Gleichungen stehen, muss natürlich an ihrem Platz bleiben. Wenn man am Ende die Lösungsmenge korrekt angeben will, muss man die Vertauschung der Unbekannten natürlich berücksichtigen!) Wir bringen die Spalten mit den Stufen nach vorn, d.h. wir machen die jk -te Spalte
zur k-ten.
Wenn wir die uninteressanten n − k letzten Zeilen, die ja aus lauter Nullen bestehen, weglassen,
kommen wir schließlich zu einer Matrix von folgender Gestalt:


1 0 0 · · · 0 a1,r+1 · · · a1n b1
 0 1 0 · · · 0 a2,r+1 · · · a2n b2 




..
...
...


.
0
1 ar,r+1 · · · arn br
Eine spezielle Lösung des LGS ist dann (b1 , . . . , bn , 0, . . . , 0)
Um nun alle Lösungen zu finden, lösen wir das zug. homogene LGS, d.h. ersetzen die bi durch
Nullen.
Wir können die letzten n − r Unbekannten durch beliebige Zahlen ersetzen. Die ersten r sind
dann eindeutig bestimmt. Die Lösungen des homogenen LGS sehen dann so aus:
(−
n
X
n
X
tk a1k , . . . , −
k=r+1
tk ark , tr+1 , . . . , tn ),
k=r+1
wo die tr+1 , . . . , tn unabhängig voneinander alle (rationalen) Zahlen durchlaufen. Man kann
diese n-Tupel auch so schreiben:
tr+1 (−a1,r+1 , . . . , −ar,r+1 , 1, 0, . . . , 0) + · · · + tn (−a1,n , . . . , −ar,n , 0, . . . , 0, 1)
AUFGABEN
1. Geben Sie die Lösungsmenge des folgenden LGS an:
x1 + 3x2
3x1 + 9x2
2x2
2x1 + 8x2
+ 5x3
+ 10x3
+ 7x3
+ 12x3
+ 2x4
+ x4 + 2x5
+ 3x4 − x5
+ 2x4 + x5
=
=
=
=
1
0
3
1
263
2. Bestimmen Sie die Lösungsmenge des Gleichungssystems
x1
−x1
2x1
x1
+
−
+
+
2x2
2x2
4x2
2x2
+ x3
− 2x3
+ 3x3
+ 2x3
+ x4 + x5
+ 2x4 + x5
− x4
− 2x4 − x5
=
=
=
=
b1
b2
b3
b4
in den Fällen a) (b1 , b2 , b3 , b4 ) = (0, 0, 0, 0), b) (b1 , b2 , b3 , b4 ) = (2, 5, −1, −3),
c) (b1 , b2 , b3 , b4 ) = (2, 5, −1, 8).
(Versuchen Sie, möglichst lange die drei Fälle a), b), c) gemeinsam zu behandeln!)
3. Für welche c ∈ Q ist das LGS
a) eindeutig lösbar,
x − cy = 1
(c − 1)x − 2y = 1
b) lösbar, aber nicht eindeutig lösbar,
4. Zeigen Sie, dass das LGS
x1 + 2x2 + 3x3 = 0
4x1 + 5x2 + 6x3 = 0
7x1 + 8x2 + 9x3 = 0
nicht nur die triviale Lösung besitzt.
c) unlösbar?
264
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
Anhang A
Lösungen
1.2.A1. a) Teile n durch 3 mit Rest: n = 3k + r mit r = 0, 1 oder 2. Ist r = 0, so ist n durch 3
teilbar. Andernfalls ist n = 3k + 1 oder n = 3(k + 1) − 1. Setze m := k im ersten und m = k + 1
im zweiten Fall.
b) Ist p = 3, so ist 2 · 32 + 1 = 19 eine Primzahl. Ist p 6= 3, so ist p auch nicht durch 3 teilbar.
Deshalb lässt sich p wegen a) in der Form p = 3m ± 1 schreiben. Dann ist p2 = 9m2 ± 6m + 1,
also 2p2 + 1 = 18m2 ± 12m + 3, also durch 3 teilbar. p = 3 ist somit die einzige Primzahl, für
die auch 2p2 + 1 eine Primzahl ist.
Der Fall p2 + 2 erledigt sich genau so.
1.2.A2. Es ist 15! = 2·3·(2·2)·5·(2·3)·7·(2·2·2)·(3·3)·(2·5)·11·(2·2·3)·13·(2·7)·(3·5) (Wenn
Du willst kannst Du anschließend noch die gleichen Faktoren zu Potenzen zusammenfassen.)
Du siehst, es ist ziemlich einfach. Wenn Du es Dir schwer machen willst, rechne zuerst 15! aus
und versuche dann, das Ergebnis zu zerlegen. ;-)
1.2.A4. Sei m ∈ N1 keine Primzahl und p der kleinste Primfaktor von m. Dann lässt sich
m in der Form m = kp mit k ≥ p schreiben. Wäre nämlich k < p, so hätte k und damit m
eine kleineren Primfaktor als p, im Widerspruch zur Wahl von p. Wenn aber p ≤ k ist, ist
p2 ≤ pk = m. Nun sind 2, 3, 5, 7 die einzigen Primzahlen p mit p < 11, d.h. p2 < 121. Ist also
m ≤ 120 nicht prim, so hat es einen Primfaktor unter den Primzahlen 2, 3, 5, 7 Ist m ≥ 8 und
hat unter diesen Zahlen einen Primfaktor, so kann es nicht selbst prim sein.
Allgemein gilt: Sind p1 , . . . , pn+1 die ersten n+1 Primzahlen, so ist eine Zahl k mit pn < k < p2n+1
genau dann prim, wenn k durch keine der Primzahlen p1 , . . . , pn teilbar ist.
1.2.A5. Zur Regel a): Nimm an, dass nur 3 Kandidaten A, B und C Stimmen bekommen.
Wenn 33 Senatoren A und B, 34 Senatoren A und C und schließlich 34 Senatoren B und C
wählen, bekommt jeder der drei Kandidaten mindestens 67 Stimmen!
Zur Regel b): Angenommen die Kandidaten A, B, C und D bekommen Stimmen. Wenn 26
Senatoren A und B , 25 weitere A und C , 25 weitere A und D, schließlich 25 Senatoren C und
D wählen, so bekommen A 76, B 26, C 50 und D 50 Stimmen! (Wenn nur drei Kandidaten
Stimmen bekommen, so entfallen auf einen maximal 101 der insgesamt 202 Stimmen, also auf
mindestens einen weiteren mindestens 51 Stimmen.)
265
266
ANHANG A. LÖSUNGEN
Man muss immer eine gewisse Vorsicht walten lassen, wenn man Abstimmungsregeln aufstellt!
Ich kenne mindestens einen mathematischen Fachbereich, der diesen Ratschlag bei der
Aufstellung seiner Satzung nicht beachtet hat.
0
1.4.2. Zur Gleichheit von Brüchen: Seien m0 = km, n0 = kn. Dann geht der Bruch m
aus dem
n0
m
m
m0
Bruch n durch Erweitern, und der Bruch n aus dem Bruch n0 durch Kürzen hervor. In diesem
0
Falle gilt mn0 = kmn = m0 n. D.h. wenn m
aus m
durch Erweitern und anschließendes Kürzen
n0
n
0
0
hervorgeht, muss mn = m n sein.
0
Sei umgekehrt mn0 = m0 n. Dann wird m
durch Erweitern zu mn
. Der Zähler letzteren Bruches
n
nn0
0
m0 n
.
ist nach Voraussetzung gleich dem von nn0 . Und diesem Bruch wird durch Kürzen m
n0
1.5.5.
1
1
n+1−n
1
−
=
=
.
n n+1
n(n + 1)
n(n + 1)
1
1
1
1 1
1 1
1
1
1
+
+ ··· +
=
−
+
−
+ ··· + (
− =1−
1·2 2·3
(n − 1)n
1 2
2 3
n−1 n
n
1
1
1
1
1
1
1
+
+
+
·
·
·
+
≤
1
+
+
·
·
·
+
=
1
+
1
−
.
12 22 32
n2
1·2
(n − 1)n
n
1
1
1
1
1
1
1
1
+ + + + ··· +
≤2+
+ ··· +
=3−
0! 1! 2! 3!
n!
1·2
(n − 1)n
n
1.5.A1. Die erste Gleichung hat die Lösung x = − 12
, die zweite ist nicht lösbar.
13
1.5.A3. Man kann a mit dem Nenner p1 · · · pn schreiben. Könnte
man kürzen, etwa
durch pn , so
1
1
wäre ap1 · · · pn−1 bereits ganz. Andererseits ist ap1 · · · pn−1 =
+ ··· +
p1 · · · pn−1 +
p1
pn−1
p1 · · · pn−1
; das ist eine Summe zweier Summanden, von denen der erste eine ganze Zahl, der
pn
zweite aber wegen der Eindeutigkeit der Primfaktorzerlegung keine ganze Zahl ist. Eine solche
Summe ist nie ganz.
1.5.A4. Diese Aufgabe löst man ähnlich wie die vorangehende. Wäre a ganz, dann auch am/2.
· k1 ist für k = 2, . . . , n genau dann eine ganze Zahl, wenn k nicht die größte
Der Ausdruck am
2
2-Potenz ≤ n ist.
1.5.A5. (n − 1)!a ist nicht ganz.
1.5.A6. Die Summe ist gleich (x + y)(x − y + 1)/2.
1.5.A7. Das Ergebnis ist n2 . Das kannst Du anschaulich an der Figur unterhalb der Aufgabe
sehen, wo bei jedem Schritt durch Addition der nächsten ungeraden Anzahl von Kringeln
wieder ein Quadrat entsteht. Die Lösung nach ‘Opas’ Schema geht wie folgt. Die Anzahl der
Summanden ist n. Die Summe des ersten und n-ten Summande ist 2n. Dasselbe gilt für die
Summe des zweiten und des (n − 1)-ten, auch für die des dritten und des (n − 2)-ten, usw.
Deshalb ist das Ergebnis gleich n · 2n/2.
267
1.5.A8. Die Summe der beiden Gleichungen ist 2x = a + b, ihre Differenz ist 2y = a − b. Nun
ist a + b genau dann gerade, wenn a und b entweder beide gerade oder beide ungerade sind.
Dasselbe gilt für a − b.
1.5.A9. Sind x, y ganze Zahlen, so ist von den beiden Zahlen x + y und x − y + 1 die eine
gerade und die andere ungerade. Und wenn zusätzlich x > y > 0 ist, sind x + y und x − y + 1
beide mindestens gleich 2. Ist also n > 0 eine Summe aufeinander folgender positiver ganzer
Zahlen, so muss 2n ein Produkt einer geraden und einer ungeraden Zahl ≥ 2 sein. Das schließt
alle 2-Potenzen aus.
Sei n > 0 keine 2-Potenz (insbesondere n > 2) so ist 2n = 2r u mit einer ungeraden Zahl u > 2
und r ≥ 1. Seien ferner a die größere der beiden Zahlen 2r und u, sowie b + 1 die kleinere von
diesen. Dann sind a und b beide gerade oder beide ungerade, und es ist b > 0. Also lässt sich
das folgende Gleichungssystem in ganzen Zahlen x, y mit x > y > 0 lösen.
x+y =a
x−y =b
Ist das Zahlenpaar (x, y) eine Lösung dieses Gleichungssystems, so gilt n =
Px
k=y
k.
1.5.A10. a) Es gilt bekanntlich x2 − y 2 = (x + y)(x − y). Man kann also eine ganze Zahle n
genau dann als Differenz zweier Quadratzahlen darstellen, wenn ein Produkt zweier gerader
oder zweier ungerader Zahlen ist. Dabei darf im zweiten Fall einer der Faktoren die 1 sein.
Es folgt, dass jede ungerade Zahl eine Differenz zweier Quadratzahlen ist. Eine gerade Zahl,
die nicht durch 4 teilbar ist, ist von der Form 2u mit ungeradem u. Wie immer man sie in
zwei Faktoren zerlegen mag, so ist einer gerade und der andere ungerade. Jede durch 4 teilbare
Zahl ist von der Form 4m = 2 · (2m) also ein Produkt zweier gerader Zahlen und deshalb
eine Differenz zweier Quadratzahlen. Zusammengefasst, sind genau die Ganzen Zahlen eine
Differenz zweier Quadrate, die entweder ungerade oder durch 4 teilbar sind. (Später wirst Du
diese Bedingung durch n 6≡ 2 (mod 4) ausdrücken können.)
b) Alle ganzen Zahlen lassen sich so schreiben. Ist n ungerade, so gibt es y, z mit n = 02 +y 2 −z 2 .
Ist n gerade, so ist n − 1 ungerade, also n = 12 + y 2 − z 2 mit geeigneten y, z. Die Lösung ist
überraschend einfach.
c) Ist a = 0, so gibt es trivialer Weise unendlich viele Lösungen, ansonsten nur endlich viele.
Dafür habe ich sogar 2 Argumente: Erstens kann man a innerhalb Z nur auf endlich viele
Weisen in zwei Faktoren zerlegen. Zweitens: Für x > y > 0 (was man immer annehmen kann)
und x > n gilt x2 − y 2 ≥ (n + 1)2 − n2 = 2n + 1. Und es gibt nur endlich viele n mit 2n + 1 ≤ |a|.
d) Nikolausaufgabe: Setze n0 := 1606160. Sei x das Alter von Klaus, y dasjenige von Nicole,
jeweils als ganze Zahl > 0. Nach Voraussetzung ist n0 = x4 − y 4 = (x2 − y 2 )(x2 + y 2 ). Da n0
gerade ist, müssen x2 + y 2 und x2 − y 2 beide gerade sein. (Das folgt daraus, dass zunächst einer
der beiden Faktoren gerade ist.) Dann muss aber auch x2 − y 2 = (x + y)(x − y) durch 4 teilbar
sein, nicht wahr? Ferner ist 0 < y < x.
Wir haben die (mit Taschenrechnerhilfe berechnete) Primfaktorzerlegung
n0 = 24 · 5 · 17 · 1181
268
ANHANG A. LÖSUNGEN
Wir betrachten alle Möglichkeiten x2 − y 2 = k, x2 + y 2 = l, wo n0 = kl eine Zerlegung in zwei
ganze Faktoren, ferner 0 < k < l und k durch 4 und l durch 2 teilbar ist.
1. Der Faktor k ist größtmöglich im Falle k = 8 · 5 · 17 = 2 · 340, l = 2 · 1181. Dann errechnet
man
k+l
k−l
x2 =
= 1181 + 340 = 1521, y 2 =
= 1181 − 340 = 841
2
2
Nun ist 1521 = 1600 − 80 + 1 = (40 − 1)2 und 841 = 900 − 60 + 1 = (30 − 1)2 . Also gilt in
diesem Falle: Klaus ist 39 und Nicole 29 Jahre alt. Wir zeigen, dass es keine weiteren Lösungen
gibt.
2. Im Falle k = 4 · 5 · 17 = 2 · 170 und l = 4 · 1181 = 2 · 2362 müsste x2 = 2362 + 170 = 2532
sein. Da 502 = 2500 < 2532 < 2601 = 512 gilt, ist aber x2 6= 2532 für jede natürliche Zahl x.
3. In allen anderen Fällen ist k ≤ 23 · 17 und l ≥ 2 · 5 · 1181. Dann ist x + y ≤ k/2 ≤ 4 · 17 = 68
also x2 + y 2 ≤ (x + y)2 ≤ 682 = 4624 < 11810. Auch hier ergibt sich keine Lösung.
1.5.A11. Wenn man den linken Bruch mit n − k, den rechten mit k + 1 erweitert, bekommt
man gleiche Nenner.
1.5.A12. Um die geforderte Vollständigkeit zu erreichen, genügt es, eine gewisse Systematik
in die Menge aller Tripel (a, b, c) ∈ N3 mit 1 ≤ a ≤ b ≤ c zu bringen.
Zunächst betrachte man Tripel der Form (1, 1, c) (mit 1 ≤ c). Dann die der Form (1, 2, c) (mit
2 ≤ c). Dann die der Form (1, b, c) mit 3 ≤ b ≤ c.
Damit hat man offenbar alle Fälle mit a = 1 behandelt. Jetzt folgen die Fälle (2, 2, c), (2, 3, c)
und (2, 4, c), ferner (2, b, c) mit 5 ≤ b ≤ c).
Jetzt folgen (3, 3, c) und (3, b, c) mit 4 ≤ b.
Schließlich (a, b, c) mit 4 ≤ a).
Die möglichen Lösungen sind: (1, 1, 1) , (1, 2, 2) , (2, 3, 6) , (2, 4, 4) , (3, 3, 3).
1.5.A13. Nimm an, m/q mit zueinander teilerfremden m, q ∈ Z sei eine Lösung. Dann gilt
mn−1
mn−2
m
mn
=
−a
−
a
− · · · − an − 1 − an
1
2
n
n−1
n−2
q
q
q
q
mn
q
ganz ist. Wäre nun m/q nicht ganz, d.h. q 6= ±1, so hätte es einen Primfaktor p, der auch
mn teilen würde. Wegen der Eindeutigkeit der Primfaktorzerlegung müsste p auch m teilen, im
Widerspruch zur Teilerfremdheit von m und q.
Da m, q und alle ai ganz sind, sieht man nach Multiplikation der Gleichung mit q n−1 , dass
1.5.A13 Die Antwort ist (m1 + 1)(m2 + 1) · · · (mr + 1).
1.6.A1. Man kann die Induktionsbeweise mit n = 0 beginnen. Dann stehen auf den rechten
Seiten leere Summen. Eine solche hat nach Definition den Wert 0. Das mag Dir sehr formal
vorkommen.
269
Wenn Du Hemmungen hast, damit zu argumentieren, schreibe die linken Seiten der ersten
Gleichung wie folgt:
02 + 12 + 22 + · · · + n2 ,
entsprechend die der zweiten Gleichung. Oder beginne gemäß Absatz 1.6.3 die Induktion mit
n = 1.
In allen Fällen ist der Induktionsanfang für die behaupteten Gleichheiten trivial.
Induktionsschritt für a): Zu zeigen ist 12 + 22 + · · · + n2 + (n + 1)2 = (n+1)(n+2)(2n+3)
unter der
6
n(n+1)(2n+1)
2
2
2
Voraussetzung 1 + 2 + · · · + n =
. Unter dieser Voaussetzung gilt aber
6
12 + 22 + · · · + n2 + (n + 1)2 =
=
n(n + 1)(2n + 1)
n(n + 1)(2n + 1) + 6(n + 1)2
+ (n + 1)2 =
6
6
(n(2n + 1) + 6(n + 1))(n + 1)
(n + 1)(2n2 + n + 6n + 6)
=
=
6
6
(n + 1)(n + 2)(2n + 3)
(n + 1)(2n2 + 3n + 4n + 6)
=
6
6
1.6.A2. Dies gilt zunächst für n = 1
Induktionsschritt: Sei (a1 , . . . , an ) irgend eine Anordnung der Zahlen 1, . . . , n. Dann kann man
die Zahl n + 1 auf n + 1 verschiedene Weise einordnen:
(n + 1, a1 , . . . , an ), (a1 , n + 1, a2 , . . . , an ), . . . , (a1 , . . . , an−1 , n + 1, an ), (a1 , . . . , an , n + 1)
Man erhält also (n + 1)-mal soviele Anordnungen der Zahlen 1, . . . , n, n + 1, wie es Anordungen
der Zahlen 1, . . . , n gibt. Ist die letztere Anzahl nach Induktionsvoraussetzung gleich n!, so ist
erstere gleich n!(n + 1) = (n + 1)!.
1.6.A4. Wenn Du bislang nicht auf die Lösung gekommen bist, versuche es mit dem Tipp:
53 = 125 = 11 · 11 + 4.
Induktionsanfang n = 0. Es ist 2 · 51 + 40 = 11, also durch 11 teilbar.
Induktionsschritt: Zu zeigen ist, dass 2·53n+4 +4n+1 durch 11 teilbar ist – vorausgesetzt, dies gilt
für 2·53n+1 +4n . Nun es ist 2·53n+4 +4n+1 = 125·2·53n+1 +4·4n = 121·2·53n+1 +4(2·53n+1 +4n ).
Der erste Summand in diesem Ausdruck ist durch 11 teilbar, weil 121 es ist. Für den zweiten
Summand gilt dies, weil der Klammerausdruck nach Induktionsvoraussetzung durch 11 teilbar
ist.
1.6.A5. Wir machen den Induktionsanfang bei k = 1: Sei u = 2m + 1. Dann ist u2 − 1 =
4m2 + 4m + 1 − 1 = 4m(m + 1), also durch 23 teilbar, da eine der Zahlen m, m + 1 gerade ist.
Induktionsschluss: Sei die Aussage richtig für ein k ≥ 1. Wir haben zu zeigen, dass sie dann
auch für k + 1 gilt. Nun es gilt
u2
k+1
k 2
k
k
− 1 = u2
− 1 = (u2 + 1)(u2 − 1) .
270
ANHANG A. LÖSUNGEN
Da u ungerade ist, ist der erste Faktor gerade. Der zweite ist nach Induktionsvoraussetzung
durch 2k+2 teilbar, und somit das Produkt durch 2k+3 teilbar.
1.7.A1. Es gilt ggT(70, 125) = 5. Deshalb ist 5 die kleinste positive Zahl, die sich in der Form
70m + 125n mit ganzen m, n darstellen lässt. Alle anderen sind Vielfache von 5.
1.7.A3. Die Gleichung ist äquivalent mit xa = −yb. Da a und b zueinander teilerfremd sind,
haben sie Primfaktorzerlegungen ohne gemeinsamen Faktor. Deshalb muss x durch b und y
durch a teilbar sein. Die möglichen Lösungen sind somit von der Form (x, y) = (kb, k 0 a). Damit
die Gleichung erfüllt ist, muss noch k 0 = −k sein. Die Gesamtheit der Lösungen besteht also
aus den Zahlenpaaren (kb, −ka), wo k alle ganzen Zahlen durchläuft.
1.7.A5. a) Sei a0 ∈ N minimal gewählt, so dass c = aa0 + bb0 mit einem b0 ∈ Z ist. Dann gilt
a0 ≤ b − 1. Aus b0 < 0 würde aa0 + bb0 < (a − 1)(b − 1) folgen.
b) Es ist d = a(b − 1) + b(−1). Jede Änderung, die den Faktor von b zu einer nichtnegativen
Zahl macht, erhöht ihn um ein positives Vielfaches von a, muss also den Faktor von a um ein
positives Vielfaches von b vermindern, also negativ machen.
1.7.A11 b) Die angegebene Gleichung ist äquivalent zu 1 = mb + na. Dies siehst Du sofort,
wenn Du weißt, wie man Brüche addiert!
2.3.A3. Zeige zunächst, dass die Summe je zweier verschiedener Matrizen der Form Ak gleich
der dritten Matrix dieser Form ist. Dass sind 3 nahezu triviale Rechnungen. Ferner gilt natürlich
Ak + Ak = 0 und Ak + 0 = Ak . Also ist K gegenüber der Addition und auch gegenüber der
Bildung additiv Inverser abgeschlossen.
In Bezug auf die Multiplikation beachte, dass K ∗ , die Menge der von 0 verschiedenen Matrizen
∈ K aus den Potenzen von A besteht. Es ist nur A4 = A usw. Es gilt Ak · Am = Ak+m , ferner
Ak · 0 = 0. Also ist K gegenüber Multiplikation und bis auf die 0 auch der Bildung multiplikativ
Inverser abgeschlossen.
Mit 0 und E gehören die neutralen Elemente auch zu K. Also ist K ein Schiefkörper. Die
Multiplikation ist kommutativ, da Ak · Am = Ak+m = Am+k = Am · Ak gilt. Alles in allem ist
somit K ein Körper.
Beachte, dass die grundlegenden Ringgesetze (Assoziativität der Addition und Multiplikation,
die Kommutativität der Addition, die Distributivgesetze) deshalb gelten, da sie bereits in dem
Ring M2 (F2 ) erfüllt sind.
2.3.A4. a) Jede der Zahlen 1, . . . , n kommt wegen (i) genau n-mal, also ungerade oft in der
Matrix vor. Wegen (ii) kommt sie außerhalb der Diagonalen gerade oft vor, muss also auch
mindestens einmal in der Diagonalen vorkommen. Da in der Diagonalen insgesamt n Zahlen
und dabei jede der n Zahlen 1, . . . , n mindestens einmal steht, kann auch keine von ihnen mehr
als einmal dort auftauchen.
b) Analog zu a) sieht man, dass jede der Zahlen 1, . . . , n in der ganzen Matrix gerade oft und
auch außerhalb der Diagonale gerade oft auftaucht. Also muss sie auch in der Diagonale gerade
oft auftauchen. Das geht aber nur wenn einige der Zahlen gar nicht, andere mindestens 2-mal
dort vorkommen.
271
2.4.A2. a) Die Quadrate der Restklassen 0, 4 sind gleich 0, die der Restklassen 2, 6 sind gleich
4 und die der Restklassen 1, 3, 5, 7 sind gleich 1 Insgesamt sind 0, 1, 4 alle Quadrate in Z/(8).
Beachte, dass das Element 1 in Z/(8) vier verschiedene ’Quadratwurzeln’ hat. Es gibt also 4
Nullstellen des Polynoms x2 − 1 in diesem Ring. Die Regel, dass ein Polynom n-ten Grades
höchstens n Nullstellen hat gilt nicht für Polynome mit Koeffizienten in einem beliebigen Ring
R. Sie gilt allerdings falls R nullteilerfrei und kommutativ, also z.B. ein Körper ist.
b) Da 1000 durch 8 teilbar ist, sind die Zahlen der Form ...011 zu 3, die der Form ...101 zu 5,
die der Form ...110 zu 6 modulo 8 kongruent. Die Restklasse des Quadrates einer natürlichen
Zahl (nach einem Modul m) muss aber natürlich ein Quadrat in Z/(m) sein.
2.4.A3. Zerlege Z in die n Restklassen modulo n. In mindestens einer dieser Restklassen müssen
mindestens 2 Zahlen der Menge M liegen. D.h. es gibt 2 Zahlen aus M , die konguent modulo
n sind, deren Differenz also durch n teilbar ist.
2.4.A4. Behauptung: Eine solche Fahne gibt es nicht. Begründung: Die Anzahl der Sterne ist
m21 + m22 − k 2 . Die von 0 verschiedenen Quadrate in Z/(5) sind die Restklassen von 1 und −1.
Um die Behauptung zu beweisen, genügt es deshalb folgendes zu zeigen. In dem Ring Z/(5) ist
eine Summe von drei Summanden der Form ±1 nie 0.
Nun, seien k1 , k2 , k3 ∈ {1, −1}. Sind alle ki untereinander gleich, so ist ihre Summe gleich ±3.
Ist eine dieser Zahlen von den andern verschieden, so ist ihre Summe gleich ±1. Ihre Summe
ist nie durch 5 teilbar.
2.4.A5. a) Es gilt 10 ≡ 1 (mod 3) und 10 ≡ 1 (mod 9) , ferner 10 ≡ −1 (mod 11). Die
Behauptungen folgen daraus unmittelbar.
c) Die Zahl n und ihre Spiegelzahl haben die gleiche Quersumme und die gleiche alternierende
Summe. Also sind sie kongruent sowohl modulo 9, als auch modulo 11. Ihre Differenz ist also
sowohl durch 9 wie durch 11 und somit durch 99 teilbar.
d) Schreibt man n mit gerade vielen Ziffern, so ist ihre Spiegelzahl meist nicht kongruent zu
n modulo 11, hat allerdings dieselbe Quersumme. Deshalb ist die angegebene Differenz zwar
meist nicht durch 11, aber noch durch 9 teilbar. Beispiel 63 − 36 = 27.
e) Sei n die gewählte Zahl, q ihre Quersumme. Da q ≤ 45 und n ≥ 10050 ist n − q auch
5-Stellig. Ferner ist n − q durch 9 teilbar, da n ≡ q(mod 9) gilt. Die Restklasse modulo 9 der
ersten Ziffervon n − q ist durch die Summe der weiteren 4 Ziffern also eindeutig bestimmt.
Da sie nicht 0 ist, ist die erste Ziffer als solche eindeutig bestimmt. Beispiel: n = 12345. Die
Quersumme ist 15. Die Differenz somit n = 12330. Die Summe der letzten 4 Ziffern ist 8. Damit
die Quersumme von n durch 9 teilbar ist, muss die erste Ziffer 1 sein.
2.4.A6. Zur letzten Frage: Natürlich ist dies möglich, z.B., wenn man zwei Ziffern irrtümlich
vertauscht. Statt der Neunerprobe kann man natürlich auch die analoge Elferprobe verwenden,
wo eine Vertauschung zweier Nachbarziffern aufgedeckt wird.
2.4.A7. a) Teilbarkeit durch 2. Ist d gerade, so ist die gegebene Zahl genau dann durch 2 teilbar
(d.h. gerade), wenn die letzte Ziffer es ist. Ist d ungerade, so ist die gegebene Zahl genau dann
durch 2 teilbar, wenn die Quersumme es ist.
272
ANHANG A. LÖSUNGEN
b) Teilbarkeit durch 3. Ist d durch 3 teilbar, so ist die gegebene Zahl genau dann durch 3 teilbar,
wenn die letzte Ziffer es ist. Ist d ≡ 1 (mod 3), so ist die gegebene Zahl genau dann durch 3
teilbar, wenn ihre Quersumme es ist. Ist d ≡ −1 (mod 3), so ist die gegebene Zahl genau dann
durch 3 teilbar, wenn ihre alternierende Quersumme es ist.
2.4.A8. Man stellt leicht fest, dass für jede ganze Zahl n die Kongruenz n5 ≡ n (mod 10)
gilt. Modulo 10 ist also das Ergebnis schlicht zur Summe aller ganzen Zahlen von 1 bis 101
kongruent. Diese Summe ist 101 · 102/2 = 5151. Die gesuchte letzte Ziffer ist also die 1.
2.4.A.10.b Zerlege die absteigende Folge der ganzen Zahlen mn, mn−1, . . . , 1 in m absteigende
Folgen von je n ganzen Zahlen:
mn, mn − 1, . . . , mn − n + 1 || (m − 1)n, . . . , (m − 1)n − n + 1 || (m − 2)n, . . . , (m − 2)n − n +
1 || . . . | 1 · n, . . . , 1 · n − n + 1 .
Für k = 0, . . . , m − 1 ist dann das Produkt der n Faktoren ((m − k)n) · · · ((m − k)(n − n + 1))
durch (m − k)n! teilbar. Für das Produkt aller mn Zahlen mn, . . . , 1 bekommt man so die
behauptete Teilbarkeit.
2.4.A11. Ist m ungerade, so ist offenbar ( m+1
mod m) zu (2 mod m) invers.
2
Nach Voraussetzung ist m 6≡ 0 (mod 3). Also ist m modulo 3 zu −1 oder zu 1 kongruent Im
mod m), im zweiten ist (− m−1
mod m) zu (3 mod m) invers.
ersten Fall ist ( m+1
3
3
2.4.A12. b) Geburts- und Todesjahr von Carl Friedrich Gauss.
2.4.A13. Da die Restklassen von 9 und von 2 in Z/(17) invertierbar sind, sind die Kongruenzen
(1) 3x + 2y ≡ 0 (mod 17) und (10 ) 9(3x + 2y) ≡ 0 (mod 17) zueinander äquivalent. Dasselbe
gilt für die Kongruenzen (2) 5x + 9y ≡ 0 (mod 17) und (20 ) 2(5x + 9y) ≡ 0 (mod 17) Nun ist
9(3x+2y) = 27x+18y und 2(5x+9y) = 10x+18y. Da 27 ≡ 10 (mod 17), sind die Kongruenzen
(10 ) und (20 ) zueinander äquivalent und deshalb schließlich auch die Kongruenzen (1) und (2).
2.4.A14. (−5)3 = −125, (−5)4 = 625, (−5)5 = −3125 ≡ −125 (mod 1000). Du erkennst, dass
ab dem Exponenten 3 die Potenzen von −5 modulo 1000 sich mit der Periode 2 wiederholen.
Sei n ≥ 3. Dann gilt für ungerade n die Kongruenz (−5)n ≡ −125 ≡ 875 (mod 1000). Da 1995!
gerade, also 1995! + 1 ungerade ist, hat die erstgenannte Potenz die letzten drei Ziffern 875.
2.4.A16. Die Eigenschaft kann man auch so schreiben: 7 · 13 ≡ 1 (mod p). Und das bedeutet, dass p ein Teiler von 7 · 13 − 1 = 90 ist. Die gesuchten Primzahlen sind also genau die
Primfaktoren von 90, d.h. 2, 3 und 5.
2.4.A17. a) Wir bezeichnen die Elemente von Z/3 mit −1, 0, 1. (M. a. W. wir schreiben −1
für (−1 mod 3) usw.) Dann ist:
1 1
−1 1
0 −1
0
2
3
A = E, A =
, A =
A =
1 0
1 1
−1 1
4
A =
−1 −1
1 −1
6
, A =
, A =
,
−1 0
−1 −1
1 1
7
A =
, A8 = E = A 0 .
1 0
−1 0
0 −1
5
273
b) Die Abgeschlossenheit bezüglich der Multiplikation ist klar, da A0 , . . . , A7 die sämtlichen
Potenzen mit ganzzahligem Exponenten von A sind. Auch jedes (multiplikativ) Inverse gehört
dazu.
Um die Abgeschlossenheit bezüglich der Addition zu zeigen, berechne zunächst A0 − E, A1 −
E, . . . , A7 − E, 0 − E, und stelle fest, dass Du die Matrizen A0 , . . . , A7 , 0 in anderer Reihenfolge erhältst. Wenn Du diese Differenzen also mit einer der Matrizen A1 , . . . , A7 multiplizierst,
erhältst Du wieder alle diese Matrizen. Insgesamt gehören sämtliche Differenzen zweier der
angegebenen Elemente wieder zu den Matrizen A0 , . . . , A7 , 0. Dann gehören auch alle additiv
Inversen und mit ihnen auch alle Summen dazu. (X + Y = X − (−Y ).)
2.5.A.1. Es genügt, den Fall n = 1 zu betrachten, also pm+1 |xp − y p zu zeigen. Schreibe
xp − y p = (x − y)(xp−1 + xp−2 y + · · · + y p−1 ). Modulo pm besteht der zweite Faktor aus p
zueinander kongruenten Summanden, ist also, da m ≥ 1, durch p teilbar.
2.5.A2. Binomialsatz!
2.5.A3. a) Wenn a ungerade ist und a, n ≥ 2 gilt, so ist an + 1 > 2 und gerade, also keine
Primzahl. Ist n keine Zweierpotenz, so gibt es eine ungerade Zahl u > 2 mit n = 2m · u, also
m
an + 1 = bu + 1 = 1 − (−b)u , wobei b = a2 ist. Wegen 1 − (−b)u = (1 − (−b))(1 + (−b) + (−b)2 +
· · · + (−b)u−1 ) (geometrische Reihe) ist 1 + bu durch 1 + b teilbar, also nicht prim. (Beachte
b, u > 1, also 1 + bu > 1 + b.)
b) Nach der Formel der geometrischen Reihe ist an − 1 durch a − 1 teilbar. Wenn a > 2 ist, ist
dieser Teiler größer als 1, zudem wegen n ≥ 2 kleiner als an − 1. Wenn nun zwar a = 2, aber n
nicht prim ist, gibt es k, m > 1 mit n = km. Dann ist an − 1 = bm − 1, wo b = 2k > 2 ist.
c) In a) und b) haben wir nur gezeigt: Wenn an ± 1 prim ist, dann gilt . . . .“ Die angegebenen
”
Beispiele besagen nur, dass die Umkehrungen von a) und b) nicht richtig sind!
2.5.A4. a) Denke Dir c in Primfaktoren zerlegt. Jeden solchen kann man gegen einen Primfaktor
von a oder b kürzen, da ja c ein Teiler von ab ist. Am Ende ist der Nenner 1, aber sowohl von
a, als auch von b bleibt wegen c < a, c 1 übrig, so dass ab/c ein nichttriviales
Produkt ist.
P
k
b) Eine n-stellige Zahl aus lauter 1-en schreibt sich als geometrische Reihe wie folgt: n−1
k=0 10 =
n
(10 − 1)/(10 − 1). Ist n = rs, so gilt
rs
r
r
10 − 1 = (10 )s − 1 = (10 − 1)
s−1
X
10rk
k=0
Sind r, s > 1, so sind beide Faktoren größer als 9. Wende a) an.
c) Eine solche Zahl ist von folgender Form:
n
X
100k =
k=0
Wende (für n > 1) Teil a) an.
(10n+1 − 1)(10n+1 + 1)
100n+1 − 1
=
100 − 1
99
274
ANHANG A. LÖSUNGEN
n
2.5.A5. Bekanntlich ist an −bn durch a−b teilbar: Wenn n ungerade ist gilt aP
+bn = an −(−b)n .
4 37−k
(−1)k .
Nun ist 148 = 4 · 37 und deshalb 2148 + 1 = 24·37 − (−1)37 = (24 − (−1)) · 37
k=0 (2 )
4
Also ist 2 + 1 = 17 ein Primfaktor.
2.5 A13. Ziehe aus der Ungleichung (m + 1)m < mm+1 die m(m + 1)-te Wurzel. So bekommst
Du – da die Wurzel im positiven Bereich streng monoton wachsend ist – die Ungleichung
√
√
m+1
m + 1 < m m für m ≥ 3.
Daraus folgt (wenn Du willst, mit Induktion)
√
√
m+k
m + k < m m für m ≥ 3 und k ≥ 1.
2.5.A14. Beachte zunächst: Für beliebige b, d ∈ N ist bd − 1 durch b − 1 auf Grund der Formel
für die geometrische Reihe teilbar.
Dann rechne:
am − 1 = aqn+r − 1 = ar (aqn − 1) + (ar − 1) = q 0 (an − 1) + (ar − 1), (mit einem geeigneten
ganzen q 0 , da nach obigem aqn − 1 durch an − 1) teilbar ist.
Da Du somit parallel zum euklidischen Algorithmus für m, n (mit positiven Resten) den für
am − 1, an − 1 durchführen kannst, folgt b) .
3.1 Zusatzbemerkung zu Beispiel 7. Jede reelle Zahl ist der Wert einer Reihe, die aus der
alternierenden harmonischen Reihe durch Umordnung hervorgeht.
Beweis: Die Reihe R der positiven Summanden hat den Wert ∞. Denn es gilt für ihre m-te
Partialsumme
m−1
1
1
1
1X1
+
+ ··· +
>
2·0+1 2·1+1
2m + 1
2 k=1 k
Rechts steht die mit 21 multiplizierte (m − 1)-te Partialsumme der harmonischen Reihe, die mit
m gegen ∞ geht. Ebenso leicht siehst Du, dass die Summe der negativen Summanden gegen
−∞ geht.
Sei α ∈ R beliebig. Nimm ihrer Reihenfolge nach soviele positive Summanden wie gerade nötig
sind, damit ihre Summe S0 größer als α ist. Setze die gesuchte Reihe fort, indem Du ihrer
Reihenfolge nach soviele negative Summanden nimmst, dass für ihre Summe S1 so gerade die
Ungleichung S0 + S1 < α gilt. Jetzt nimm wieder ihrer Reihenfolge nach so viele positive
Summanden, dass für ihre Summe S2 die Ungleichung S0 + S1 + S2 > α gilt. Usw.
4.1.A.1. a) Es ist #(A ∪ B) = a + b − d = #A + #B − #(A ∩ B). Denn wenn man die Elemente
von A zählt, zählt man genau d Elemente von B bereits mit.
b) Betrachte A1 ∪ A2 ∪ A3 als Vereinigung der beiden Mengen A3 und A1 ∪ A2 . Nach Teil a)
gilt #(A1 ∪ A2 ) ∪ A3 ) = #(A1 ∪ A2 ) + a3 − #((A1 ∪ A2 ) ∩ A3 ).
Nun ist (A1 ∪ A2 ) ∩ A3 ) = (A1 ∩ A3 ) ∪ (A2 ∩ A3 ). Jetzt wende auf die beiden Summenden in der
rechten Seite der letzten Gleichung beides Mal a) an: Du erhältst #(A1 ∪ A2 ) = a1 + a2 − a12 ,
sowie #(A1 ∩ A3 ) ∪ (A2 ∩ A3 ) = a13 + a23 − a123 und damit die Behauptung.
275
c) Wir gehen analog zur Lösung von b) vor und benutzen Induktion nach n, wobei der Fall
n = 1 trivial ist. (Du kannst auch mit dem unter a) behandelten Fall n = 2 beginnen.)
Für den Induktionsschritt (n → n + 1) wende a) auf die Vereinigung der beiden Mengen
A1 ∪ . . . ∪ An und An+1 an. Demgemäß ist
(∗)
#(A1 ∪ . . . ∪ An+1 ) = #(A1 ∪ . . . ∪ An ) + an+1 − #((A1 ∪ . . . ∪ An ) ∩ An+1 )
Es gilt (A1 ∪ . . . ∪ An ) ∩ An+1 = (A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An+1 ). Nun wende die Induktionsvoraussetzung auf den ersten S
und dritten Summanden
obiger Gleichheit d.h. auf die beiden
Sn
n
Vereinigungen von je n Mengen i=1 Ai und i=1 (Ai ∩ An+1 ) an. Du erhältst
#(A1 ∪ . . . ∪ An ) =
X
(−1)#J+1 aJ , sowie
∅6=J⊂{1,...,n}
−#((A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An )) =
X
(−1)#J · #(AJ ∩ An+1 ).
∅6=J⊂{1,...,n}
Beachte dass jede nichtleere Teilmenge I ⊂ {1, . . . , n + 1} entweder bereits eine nichtleere
Teilmenge von {1, . . . , n} oder eine Menge der Form J ∪ {n + 1}mit J ⊂ {1, . . . , n} ist, wobei
in letzterem Fall auch J = ∅ zugelassen ist.
Der erste Summand auf der rechten Seite von (∗) behandelt die Teilmengen von {1, . . . , n},
der zweite Summand, nämlich an+1 , die Menge ∅ ∪ {n + 1} = {n + 1}, der dritte Summand
schließlich die Mengen J ∪ {n + 1} mit ∅ =
6 J ⊂ {1, . . . , n}, und zwar auch mit dem richtigen
Vorzeichen, nicht wahr?
4.1.A2. a) A = 2N := {2k | k ∈ N}, B := N − A. Da hier X = Y = ∅ gilt, sind X, Y beide
endlich.
b) A := 2N, B := 3N := {3k | k ∈ N}. Es gibt ja unendlich viele Vielfache von 6. Und diese sind
(genau) die Vielfachen von sowohl 2 wie 3. Andererseits gibt es unendlich viele ganze Zahlen,
die weder durch 2 noch durch 3 teilbar sind, z.B. alle Potenzen von 5.
c) A := {2n |n ∈ N}, B := {3n | n ∈ N}. X = A ∩ B := {1}, Y ⊃ {5n | n ∈ N1 }
d) A = B := N. Natürlich gibt es auch weniger triviale Beispiele.
4.1.A3 Bezeichne die Elemente von F2 mit 0, 1. Erinnere Dich, dass in F2 folgendes gilt:
0 + 0 = 1 + 1 = 0, 0 + 1 = 1 + 0 = 1, − 1 = 1. Eine Summe von gerade vielen 1-en ist 0.
Das n-tupel (1, . . . , 1) sei mit e bezeichnet. Jedem v ∈ V ordne das n-tupel e + v = e − v zu.
Die Komponenten von e + v sind genau an den Stellen gleich 1, wo die von v gleich 0 sind. Es
gilt v + (e + v) = e und v 6= e + v. Man kann die Menge V in 2-elementige Teilmengen der
Form {v, e + v} zerlegen. Von diesen gibt es #(V )/2 = 2n−1 Stück. Da v + (e + v) = e ist, ist
die Summe über alle Elemente von V gleich der Summe von 2n−1 Summanden, die alle gleich
e sind. Da für n ≥ 2 die Zahl 2n−1 gerade ist, ist diese Summe gleich (0, . . . , 0).
4.2.A1 a) Wäre f nicht injektiv, so gäbe es verschiedene x, x0 ∈ M mit f (x) = f (x0 ). Dann ist
auch g(f (x)) = g(f (x0 )).
276
ANHANG A. LÖSUNGEN
b) Sei z ∈ P . Da g ◦f surjektiv ist, gibt es ein x ∈ M mit g(f (x)) = g ◦f (x) = z. Für y = f (x)
gilt dann g(y) = z.
c) 1. M = P := {0}, N := {0, 1}, f (0) = 0, g(0) = g(1) = 0.
2. M = N = P := N. f (n) := n + 1, g(0) := 0, g(n) := n − 1 für n ≥ 1.
4.2.A2 a) Sei y ∈ N . Da f surjektiv ist, gibt es mindestens ein x ∈ M mit f (x) = y. Setze
g(y) := x für ein solches ausgewähltes x. Da für ein solches x ja gilt, dass f (x) = y ist, ist
f ◦g(y) = y für jedes y ∈ N .
Weil idM injektiv ist, muss nach Aufgabe 1. auch f es sein, wenn g ◦f = idM gilt.
b) Sei x0 ∈ M fest gewählt. Sei y ∈ N . Liegt y nicht im Bild von f , d.h. y ∈
/ im(f ), setze
g(y) := x0 . Ist aber y ∈ im(f ), so gibt es ein (aber auch nur ein) x ∈ M mit f (x) = y. Dann
setze g(y) = x.
Ist f ◦g = idN , so ist f surjektiv.
4.2.A3 a) Antwort: nm . Die Menge der Abbildungen von M nach N wird deshalb manchmal
auch mit N M bezeichnet. (Beachte: Der Exponent ist die Startmenge, die Basis die Zielmenge.
b) Ist m > n, so gibt es keine solche Abbildungen. Ansonsten nimm M = {1, 2, . . . , m} an. Um
eine beliebige injektive Abbildung zu beschreiben, hat man als Bild der 1 noch n Möglichkeiten,
als Bild der 2 noch n − 1 solche, usw. usw., als Bild der m nur noch n − m + 1 solche. Insgesamt
gibt es n · (n − 1) · · · (n − m + 1) = n!/(n − m)! injektive Abbildungen, wobei die rechte Seite
dieser Identität im Fall m > n nicht definiert ist, da k! für negative ganze Zahlen nicht sinnvoll
definiert werden kann. Die linke Seite gibt allerdings auch in diesem Fall die richtige Antwort,
da dann einer der Faktoren gleich 0 ist.
c) Bijektive Abbildungen M → N gibt es genau dann, wenn m = n ist. Gemäß b) gibt es
n! solche. Vielleicht hast du früher schon gezeigt, dass man eine n-elementige Menge auf n!
verschiedene Weise anordnen kann. Dann kannst Du die Antwort auch folgendermaßen begründen: Jede bijektive Abbildung f : {1, 2, . . . , n} → N liefert eine Anordnung vom M ,
nämlich (f (1), f (2), . . . , f (n)). Umgekehrt liefert eine solche Anordnung eine bijektive Abbildung.
d) Eine Abbildung M → N ist genau dann surjektiv, wenn ihr Bild in keiner der Teilmengen
Nx := N − {x} mit einem x ∈ N liegt. Die Anzahl aller Abbildungen M → N ist nm . Ist Ax
die Menge aller Abbildungen M
[→ N , deren Bild inSNx liegt, so ist die Anzahl aller surjektiven
m
Abbildungen gleich n − #
Ax . Die Zahl # x∈N Ax kannst Du mit dem Prinzip der
x∈N
\
Inklusion-Exklusion berechnen. Ist nämlich J ⊂ N und AJ :=
Ax , so ist AJ offenbar die
x∈J
\
Menge der Abbildungen M → N , deren Bild in NJ :=
Nx liegt. (Denn eine Abbildung,
x∈J
deren Bild in U1 ∩ . . . ∩ Uk liegt, ist eine solche, der Bild sowohl in U1 , als auch in U2 , als auch
usw., als auch in Uk liegt. Die entsprechende Aussage für die Vereinigung gilt nicht: Das Bild
einer Abbildung, deren Bild in U ∪ V liegt, liegt nicht immer ganz in U oder ganz in V .)
277
n
Nun besteht NJ aus n − #J Elementen. Ferner gibt es für jedes k ≤ n genau
Teilmengen
k
aus k Elementen von N .
Die Anzahl der surjektiven Abildungen M → N ist also
n−1
X
n
n
n
n
m
m
m
m
k n
(−1)
(n − k)m
n −
(n − 1) +
(n − 2) −
(n − 3) + . . . ±
1 =
1
2
3
n−1
k
k=0
m
√
4.4.A4 Ich gebe nur das multiplikativ Inverse von a + b 2 an, wenn a, b nicht beide 0 sind.
√
√
a
−b
a−b 2
1
√ = 2
=
+
·
2
a − 2b2
a2 − 2b2 a2 − 2b2
a+b 2
Beachte, dass a2 − 2b2 für rationale a, b nur dann zu 0 werden kann, wenn a = b = 0 ist.
4.5.A1 a) Ordne einer solchen Folge die Folge der Abstände zwischen den Nullen zu. Der nullte
Abstand soll dabei die Anzahl der 1en sein, mit denen die Folge beginnt. Die Menge A ist also
gleichmächtig zur Menge aller Folgen natürlicher Zahlen (bei denen alle Folgenglieder nach der
ersten ≥ 1 sind), also überabzählbar.
b) Eine der betrachteten Folgen ist die konstante Folge (1, 1, 1, . . .), alle anderen brechen in
dem Sinne ab, das ab einer Stelle nur noch Nullen stehen. Die Menge ist abzählbar.
4.5.A2 Sei a = (an )n∈N eine 0-1-Folge. Definiere hierzu eine Menge M = ϕ(a) durch: n ∈
M ⇐⇒ an = 1.
4.5.A3 Zu jeder endlichen Teilmenge E von N gibt es ein n ∈ N, derart dass E eine Teilmenge
der Menge Mn := {0, . . . , n} ist. Jedes Mn hat aber nur endlich viele Teilmengen. Die Menge
aller endlichen Teilmengen von N ist also die abzählbare Vereinigung der endlichen Mengen
(Mn ), also abzählbar. (Auf diese Weise zählt man allerdings jede endliche Menge unendlich oft.
Willst Du dies vermeiden, betrachte außer der leeren Menge von jeder Menge Mn nur diejenigen
Teilmengen, die das Element n enthalten.)
Es gibt noch eine weitere Möglichkeit: Für jedes n gibt es nur abzählbar viele Teilmengen der
Kardinalzahl n.
4.5.A6. Ebenso, wie man jede reelle Zahl als (möglicherweise unendlichen) Dezimalbruch schreiben kann, so so kann man ihn auch als Binärbruch schreiben. Deshalb ist die angegebene Abbildung surjektiv. Sie ist aber nicht injektiv, da z.B. 0,1 = 0,01 ist.
5.3. Die Verbindungsstrecke der Punkte (0, 0) und (m, n) besteht aus den Punkten λ(m, n)
mit λ ∈ [0, 1], wobei = 0 und λ = 1 die Endpunkte dieser Strecke ergeben. Für ein λ ∈ ]0, 1[
sind offenbar λm und λn genau dann beide aus Z, wenn λ rational ist und sich in der Form kd
schreiben lässt, wo d ∈ N ein gemeinsamer Teiler von m und n und 0 < k < d gilt. Die Antwort
ist also: Genau dann, wenn ggT(m, n) = 1 ist, gibt es außer den Endpunkten keinen Punkt mit
ganzen Koeffizienten auf der Verbindungstrecke von (0, 0) nsch (m, n).
Seien jetzt m, n teilerfremd zueinander, so gibt es ganze Zahlen a, b mit am+bn = 1. Wären nun
λ ∈ ]0, 1[ und λm, λn ∈ Z, so wäre a(m) + b(λn) = λ einerseits ganz, andererseits nicht ganz.
278
ANHANG A. LÖSUNGEN
Also gibt es in diesem Fall keinen Punkt mit ganzen Koordinaten auf der Verbindungsstrecke,
außer den Endpunkten.
6.4. Der Satz des Pythagoras, angewendet auf drei Dreiecke besagt:
(s + t)2 = a2 + b2 , a2 = t2 + h2 , b2 = s2 + h2
Folgere aus diesen Gleichungen
s2 + 2st + t2 = t2 + h2 + s2 + h2 , also st = h2 .
Rechne schließlich
sc = s2 + st = s2 + h2 = b2 .
7.5.A1. a),b) sind bekannt oder trivial.
c) f (x) = a2 x2 + a1 x + a0 , f 0 (x) = 2a2 x + a1 , f 00 (x) = 2a2
f ist konvex, wenn a2 > 0, bzw. konkav, wenn a2 < 0 ist.
a1
a1
gilt. Für x > −
ist
Sei jetzt etwa a2 > 0. Dann ist f 0 (x) < 0, falls f 0 (x) < 0, d.h. x < −
2a2
2a2
a1
a1
f 0 (x) > 0. Also ist f im Intervall −∞, −
streng monoton fallend, in −
, ∞ streng
2a2
2a2
a1
monoton wachsend. Im Punkt x0 = −
liegt ein Minimum vor.
2a2
d) f 0 (x) = 3a3 x2 + 2a2 x + a1 .
7.5.A2 a) Da der Nenner auf dem Intervall ] − 1, 1] keine Nullstelle hat, ist die Funktion dort
definiert. Ferner sind Zähler und Nenner, also auch f (x) auf diesem Intervall überall ≥ 0. Es
−2
ist f 0 (x) = (1+x)
2 < 0 für alle x ∈ ] − 1, 1]. Deshalb ist f (x) auf dem Intervall streng monoton
fallend und somit injektiv. Schließlich ist f (1) = 0 und lim f (x) = ∞. Darum werden alle
x&−1
Zahlen aus
+
als Wert angenommen.
b) Analog.
7.5.A5. a) Da f (x) = (x2 − 1)x3 ist, lassen sich die Nullstellen leicht bestimmen. Dasselbe gilt
für die Nullstellen der ersten und zweiten Ableitung. Die Diskussion des Funktionsgraphen ist
also leicht.
√
b) Die Nullstellen der Funktion liegen dort, wo x3 = 3 x. Da die 3-te Potenz streng monoton
wächst und deshalb eine injektive
Funktion ist, ist diese Gleichung äquivalent zu x9 = x. Die
√
Nullstellen der Funktion x3 + 3 x sind also ±1 und 0.
Die Ableitung 3x2 − 13 x−2/3 ist in 0 nicht definiert, sonst überall. Falls |x| klein genug, ist sie
negativ und geht von beiden Seiten mit x gegen 0 gegen −∞. Der Funktionsgraph
hat in 0
√
√
4
4
die Gerade x = 0 als Tangente.
Die Nullstellen der Ableitungsind ±1/ 3. Bei −1/ 3 liegt ein
√
lokales Maximum, bei 1/ 4 3 ein lokales Minimum vor.
c) Die Funktion h ist in 0 nicht definiert. von ‘links’ geht sie dort gegen −∞, von ‘rechts’ gegen
∞. Denn der zweite Summand tut dies, während der erste dort von beiden Seiten gegen 0 geht.
279
(Wenn man den ersten Summand durch irgendeine in 0 definierte und dort stetige Funktion
ersetzt, gilt dasselbe.)
Eine Nullstelle von h ist −1. Wir werden bald sehen, dass es die einzige ist. Zumindest in R∗+
hat h keine Nullstelle, da dort beide Summanden positiv sind.
Die Ableitung ist h0 (x) = 32 x−1/3 − x−2 . Für alle x < 0 ist h0 (x) < 0, nicht wahr? (x−2 > 0
für alle x 6= 0.) Deshalb ist h im Bereich der negativen Zahlen streng monoton fallend. Die
Funktion h hat also nur die Nullstelle −1 .
Jetzt bestimme ich das Verhalten der Ableitung in R∗+ . Sei R eine der Relationen <, >, =.
Für x > 0 gilt dann
h0 (x) R 0 ⇐⇒
2 −1/3
3
x
R x−2 ⇐⇒ x5/3 R .
3
2
Da x5/3 eine streng monoton wachsende
Funktion ist, sehen wir, dass p
h0 (x) < 0 für 0 < x 0 für x > 5 27/8 ist.
p
In 5 27/8 ≈ 1,275 liegt also ein lokales Minimum vor.
7.5.A7. Da f (0) = 0 ist sieht ein allgemeiner Differenzenquotienten im Punkte 0 wie folgt aus:
|x|/(ln |x|)
1
=±
x
ln |x|
Da limx→0 ln |x| = −∞ ist gilt limx→0 ±1/(ln |x|) = 0.
7.6.A2. Ist x ≤ 0, so ist 2√x ≤ 1, also 2x 6= 3. Sei also im Folgenden x > 0. Die einzige Lösung
2
der ersten
√ Gleichung ist 3. Da 2 > 3 und die Wurzelfunktion streng monoton wachsend
ist,
gilt 3 < 2. Da außerdem e = 1 + 1 + 1/2 + · · · ist, gilt 2 < e. Satz 7.6.4 ergibt somit
√
√ 2
3
2 < 3 = 3.
√
Dass 3 irrational ist, wirst Du bereits wissen. Nimm an, es gäbe natürliche Zahlen m, n
mit n 6= 0 und 2m/n = 3, so wäre 2m = 3n , was der Eindeutigkeit der Primfaktorzerlegung
widerspräche.
7.6.A3
−117.
7.6.A4. Nach Satz 7.6.4 ist die zweite der Zahlen gößer.
7.6.A.5 a) Es ist 23 < 32 . Die 6. Wurzelfunktion ist streng monoton wachsend. Also
√
√
√
√
6
6
3
23 < 32 , d.h. 2 < 3
b) Wegen
n ≥ 3 > e ist nn+1 > (n + 1)n . Durch Ziehen
der n(n + 1)-ten Wurzel siehst Du
√
√
√
n+1
n
n
n>
n + 1. Es ist also so: Wenn man die Zahlen n miteinander vergleicht, so wachsen
sie von 1 bis 3, danach fallen sie.
√
√
√
c) Es ist ln( n n) = ln(n)/n. Aus (7.6.2 iv.) folgt limn→∞ ln( n n) = 0, also limn→∞ n n = 1
√
√
7.6.A6. Da e > 2, gilt 0 < 3 2 < 2 < e. Aus Satz 7.6.4 folgt, dass die erste Zahl größer ist.
280
ANHANG A. LÖSUNGEN
7.6.A8. Häufig ist es bei einem Induktionsbeweis einfacher, eine stärkere Aussage zu beweisen.
(Diese steht ja auch in der Induktionsvoraussetzung.) So auch hier. Zeige
n+1
a ≥ a · nb
Induktionsanfang: 2 a ≥ a · 1 b. Sei jetzt bereits
n+2
a = a(
n+1 a)
≥ aa·
nb
n+1
a ≥ a · n b gezeigt, so gilt:
nb
≥ a · (a(a−1) )
= a · n+1 b .
2
x
2
7.6.A10. Da (xx )x = xx gilt, kann man die Gleichung auch in der Form xx = xx schreiben.
Offenbar ist x = 1 eine Lösung. Ist x > 0 und x 6= 1 so gilt xa = xb genau dann, wenn a = b
x
2
ist. Aus xx = xx folgt dann, dass (für positive x 6= 1) die Gleichung xx = x2 , dass also aus
demselben Grunde x = 2 gelten muss. Umgekehrt erfüllt x = 2 die Gleichung.
7.6.A11. a) Es ist 2111111 = 2 · 2111110 , also 2111111 − 2111110 = 2111110 . Die einzige reelle Lösung
der Gleichung ist also x = 111110.
b) Es gilt 512 = 29 . Dividiere die Gleichung durch die echte Seite. Dann ergibt sich
2x
2
29x+252
= 1 d.h. 2x
2 −9x−252
=1
Letztere Gleichung ist genau dann erfüllt, wenn x2 − 9x − 252 = 0 gilt.
8.1.A1. Die Menge der Polynome der genannten Art bezeichnen wir mit S (’symmetrisch’).
Jedenfalls ist −1 eine gemeinsame Nullstelle derPolynome aus S. Wir zeigen, dass keine weitere
komplexe Zahl Nullstelle aller Polynome aus S ist, indem wir zwei Polynome aus S angeben, die
lediglich die Nullstelle −1 gemeinsam haben. Das Polynom z n + 1 gehört zu S. Da n ungerade
ist, hat es die mit einem Minuszeichen versehenen n-ten Einheitswurzeln als Nullstellen, d.h. die
Zahlen −1, −ζ, −ζ 2 , . . . , , −ζ n−1 , wo ζ = cos(2π/n) + i sin(2π/n) ist. Das Polynom ϕ = z n−1 +
z n−2 + · · · + z + 1 hat die von 1 verschiedenen n-ten Einheitswurzeln als Nullstellen. (z + 1) · ϕ =
z n + 2z n−1 + 2z n−2 + · · · + 2z + 1 gehört auch zu S und hat neben −1 die von 1 verschiedenen
n-ten Einheitswurzeln als Nullstellen. Das additiv Inverse einer n-ten Einheitswurzel ist aber
bei ungeradem n nie eine n-te Einheitswurzel! (Für ungerades n ist (−a)n = −(an ).) Die beiden
zu S gehörenden Polynome (z + 1)ϕ und z n + 1, haben außer −1 keine gemeinsame Nullstelle.
8.1.A2. Wir wissen aus der Lösung der Aufgabe 1) dass f = (z + 1)(z 2 + z + 1) gilt. Also hat f
einerseits die Nullstelle −1, andererseits√die von 1 verschiedenen dritten Einheitswurzeln ζ, ζ 2
mit ζ = cos(2π/3) + i sin(2π/3) = (1 + i 3)/2. Das Polynom g hat, wie man nachrechnet, nicht
die Nullstelle −1. Hingegen hat g die Nullstellen ζ und ζ 2 . Sei nämlich ξ eine der beiden Zahlen
ζ, ζ 2 . Dann ist ξ 3 = 1, also ξ 3k+m = ξ m . Ferner gilt ξ 2 + ξ + 1 = 0. Es folgt ξ 2015 + ξ 121 + 1 =
ξ 2 + ξ 1 + 1 = 0.
9.1 A1. Man sagt, ein Gruppenelement a habe die Ordnung 2, wenn a2 = 1, aber a 6= 1 gilt.
Ein Element a 6= 1 hat genau dann die Ordnung 2, wenn a = a−1 ist. Die Elemente a mit
a 6= a−1 kann man zu Paaren zueinander Inverser zusammenfassen. Jedes solche Paar hat das
Produkt 1. Das Produkt aller Gruppenelemente ist also gleich dem Produkt der Elemente der
Ordnung 2, sofern man das leere Produkt gleich 1 setzt. Wenn es ein einziges Element der
281
Ordnung 2 gibt, ist also dieses das Produkt aller Elemente der Gruppe. (Man kann zeigen, dass
das Produkt aller Elemente einer endlichen abelschen Gruppe gleich 1 ist, wenn es mehrere
Elemente der Ordnung 2 gibt.)
9.1.A2. Die Gleichung x2 = 1 ist äquivalent zur Gleichung (x + 1)(x − 1) = 0. Und in einem
Körper ist ein Produkt genau dann gleich 0, wenn einer der Faktoren es ist. (Beachte, dass die
zu beweisende Behauptung für den Ring Z/(pq) mit zwei verschiedenen Primzahlen p, q > 2
falsch ist. Dies kann man mit Hilfe des chinesischen Restsatzes, der weiter unten bewiesen wird
leicht sehen. Zeige es für pq = 15.)
9.1.A3. Die Restklasse von (p − 1)! ist das Produkt aller Elemente von (Z/(p))∗ , also gleich
der Restklasse von −1, der einzigen, die in der Gruppe (Z/(p))∗ für p 6= 2 die Ordnung 2 hat.
Für p = 2 ist die Aussage trivial, da 1 ≡ −1 (mod 2) ist.
9.1.A4 (4 − 1)! = 6 ≡ 2(mod 4). Sei m > 4. Fall 1. m = p2 mit einer Primzahl p > 2. Dann gilt
p, 2p ≤ m − 1. Also ist (m − 1)! durch p · 2p teilbar, mithin ≡ 0 (mod p2 ). Fall 2. m > 2 ist weder
eine Primzahl, noch das Quadrat einer Primzahl. Dann ist m das Produkt zweier verschiedener
natürlicher Zahlen > 1, die kleiner als m sind. Also ist (m − 1)! ≡ 0 (mod m).
9.1.A5. Ist p eine Primzahl, so ist nach Wilson (p−1)!+1 durch p teilbar. Da 101 eine Primzahl
ist, ist demnach 100! + 1 durch 101 teilbar. Ferner ist 100! + 1 (viel) größer als 101, da bereits
5! > 101 gilt. Also besitzt 100! + 1 einen nichttrivialen Teiler und ist deshalb nicht prim.
9.1.A6. Alle p Restklassen modulo p kann man ja in der Form k + pZ schreiben, wobei k die
Zahlen 0, 1, . . . , p − 1 durchläuft. Setze nun m = (p − 1)/2. (Nach Voraussetzung ist p ungerade,
also m ∈ N.) Du erhältst jede Restklasse k + pZ modulo p genau einmal, wenn Du k die Zahlen
−m, . . . , −1, 0, 1, . . . , m durchlaufen lässt. (Beispiel p = 5. Hier erhält man alle Restklassen in
der Form −2 + 5Z, −1 + 5Z, 5Z, 1 + 5Z, 2 + 5Z.) Modulo p ist dann −1 ≡ (p − 1)! kongruent
dem Produkt der Zahlen −m, . . . , −1, 1, . . . , m. Also ist −1 ≡ (−1)m (m!)2 (mod p). Nun ist
m = (p − 1)/2 genau dann gerade, wenn p ≡ 1 (mod 4) ist. Deshalb ist dann die Restklasse
von −1 ein Quadrat.
a −b
9.1.A7 Die Matrizen der Form
sind invertierbar, genau dann, wenn ihre Determib a
nannte a2 + b2 6= 0 ist. Diese bilden eine Untergruppe G ⊂ Gl2 (k). Die Determinante gibt uns
eine surjektive Abbildung f von G auf die Menge der von 0 verschiedenen Elemente der Form
a2 + b2 in K, welche f (AB) = f (A)f (B) erfüllt. Das Bild von f ist dann natürlich eine Gruppe.
9.1.A8. Die Abbildung exp : R → R∗+ ist ein Isomorfismus.
9.1.A9. Angenommen, es gäbe einen Isomorfismus: f : Q → Q∗+ . Sei dann α ∈ Q ein Element
mit f (α) = 2. Dann hat α/2 die Eigenschaft f (α/2)2 = f ((α/2) + (α/2)) = f (α) = 2. D.h.
das Element β = f (α/2) ∈ Q hätte die Eigenschaft β 2 = 2. Ein Widerspruch, da ein solches β
nicht rational sein kann.
9.1.A10. Als ich zum ersten Mal auf diese Aufgabe stieß, habe ich die Assoziativität mühevoll
durch unmittelbares Rechnen mit Mengen gemäß der Definition hergeleitet. Erst später habe
ich erkannt, dass es viel sinnvoller ist, zunächst die Teilmengen E von M durch ihre charakteristischen Funktionen χE : M → F2 zu beschreiben. Die charakteristische Funktion χE ist
282
ANHANG A. LÖSUNGEN
durch χE (x) = 1 ⇐⇒ x ∈ E definiert. Dann entspricht der symmetrischen Differenz nämlich
die Summe dieser Funktionen.
9.1.A11. Nach Voraussetzung gilt für a, b ∈ G sowohl a2 b2 = 1, als auch abab = (ab)2 = 1.
Multipliziert man die Gleichung aabb = abab von links mit a−1 und von rechts mit b−1 , so erhält
man ab = ba.
Alternativ: a2 = 1 ist gleichbedeutend mit a = a−1 . Somit gilt ab = a−1 b−1 = (ba)−1 = ba.
Beachte: Es Ist durchaus möglich, dass a2 = b2 = 1 und trotzdem ab 6= ba ist. Sei etwa
a = σ1 , b = σ2 in der S3 . Für den Beweis der Behauptung in der Aufgabe muss man ja zusätzlich
(ab)2 = 1 benutzen.
9.1.A13 Betrachte die Elemente
1
0
,
0
1
,
1
1
∈ F22
Wenn man sie von links mit den Matrizen aus Gl2 (F2 ) multipliziert so vertauscht man sie – in
genau der Weise, wie die Elemente von S3 die Zahlen 1,2,3 vertauschen.
9.2.A4 c) Da p eine von q verschiedene Primzahl ist, ist p nicht durch q teilbar, also nach
Fermat pq−1 ≡ 1 (mod q). Es folgt (q − 1)pq−1 + 1 ≡ q − 1 + 1 (mod q). Also ist (q − 1) · pq−1 + 1
durch q teilbar und größer als q.
b) und a) folgen aus c). Was a) betrifft wirst Du natürlich ohnehin sofort sehen, dass 10·210 +1 =
10241 nach dem bekannten Kriterium durch 11 teilbar ist.
9.2.A5 Die Ordnung eines jeden Elements einer Gruppe G der Ordnung 4 ist 1,2 oder 4.
1. Fall: Es gibt in G ein Element der Ordnung 4. Dessen Potenzen machen dann ganz G aus,
d.h. G ist zyklisch. Je zwei zyklische Gruppen derselben Ordnung sind natürlich isomorf.
2. Fall: Jedes von 1 verschiedene Elements von G hat die Ordnung 2. Dann ist G abelsch nach
der Aufgabe 1.A11. Seien 1, a, b, c mit dem neutralen Element 1 die (verschiedenen) Elemente
von G. Die Produkte 1a = a, 1b = b, 1c = c, a2 = b2 = c2 = 1 sind bekannt. Was ist ab? Wäre
ab = 1, so wäre b = a−1 = a im Widerspruch zu b 6= a. Wäre ab = a, ergäbe die Multiplikation
mit a−1 = a die Gleichung b = 1. Ebenso würde ab = b zu a = 1 führen. Als einzige Möglichkeit
bleibt ab = c. Ebenso muss bc = a und ca = b gelten. Die Produkte ergeben sich zwangsläufig.
Das bedeutet: In einer nichtzyklischen Gruppe der Ordnung 4 gilt, dass das Produkt zweier verschiedener von 1 verschiedenen Elemente das dritte unter denselben ist. Je zwei nichtzyklische
Gruppen der Ordnung 4 sind also zueinander isomorf.
Aber, dass es eine solche überhaupt gibt, wissen wir schon, nämlich die Gruppe der folgenden
4 Matrizen über Q:
1 0
−1 0
1 0
−1 0
1=
, a=
, b=
, c=
.
0 1
0 1
0 −1
0 −1
Und diese ist natürlich auch isomorf zum direkten Produkt (Z/(2)) × (Z/(2)).
283
9.3.A1. Wenn U kein Normalteiler ist, dann gibt es ein a ∈ G mit aU 6= U a. Das bedeutet,
dass es ein u ∈ U mit au ∈
/ U a oder ua ∈
/ aU gibt. (Beachte, dass U a ( aU nicht automatisch
ausgeschlossen ist und man deshalb beide genannten Möglichkeiten in Betracht ziehen muss.)
1. Fall: Setze b := au; dann ist bU = aU , aber U b 6⊂ U a, also U b 6= U a.
2. Fall: Ersetze a durch a−1 und u durch u−1 . Dann gilt a−1 u−1 ∈
/ U a−1 . Nach Fall 1 ist dann
−1
−1 −1
−1
−1 −1
a U = (a u )U , aber U a 6= U a u .
9.3.A2. Sei aU = bU . Für jedes u ∈ U gibt es dann ein v ∈ U mit au = bv. Daraus folgt
u−1 a−1 = (au)−1 = (bv)−1 = v −1 b−1 . Somit liegen a−1 und b−1 in derselben Rechtsnebenklasse
nach U , d.h. U a−1 = U b−1 .
9.3.A3. Wie Du weißt, ist G die disjunkte Vereinigung der beiden Linksnebenklassen nach U .
Eine der beiden Linksnebenklassen ist U , die andere deshalb G − U . Dasselbe gilt für die beiden
Rechtsnebenklassen.
Es gilt also aU = U oder aU = G − U , und ebenso U a = U oder U a = G − U , je nachdem, ob
a ∈ U oder a ∈ G − U ist. In jedem Falle ist also aU = U a.
9.3.A6. Sei f10 : (Z/(2))m → U ein Gruppenisomorfismus. Ihn kann man auch als (injektiven)
Gruppenhomomorfismus f1 : (Z/(2))m → G auffassen. (Es wird nur die Zielmenge vergrößert.
Ansonsten ist f1 (x) = f10 (x).)
Wäre nun U 6= H, so gäbe es ein c ∈ H − U . Da nach Voraussetzung c2 = 1 ist, ist {1, c}
eine zu Z/(2) = {0, 1 isomorfe Untergruppe von H. Die Abbildung f2 : Z/(2) → H, definiert
durch f2 (0) = 0H , f2 (1) = c, ist ein Homomorfismus nach der vorangehenden Aufgabe. Dieser
ist immer noch injektiv. Dazu genügt es, zu zeigen, dass der Kern von F nicht nur aus der 0
besteht. Nun sei F (a, b) = 0. Dann gilt f2 (b) = −f1 (a) ∈ U . Da aber f2 (1) = c ∈
/ U gewählt
war, ist b = 0. Dann muss auch
9.3.A7. Modulo 1000 gilt: 1998 ≡ −2. Es ist 1000 = 8 · 125. Wenn also N := 19981998! je eine
Kongruenz modulo 8 und modulo 125 erfüllt, kannst Du nach dem chinesischen Restsatz eine
Kongruenz modulo 1000 angeben und damit die letzten 3 Ziffern bestimmen. Es gilt (−2)m ≡
0 (mod 8 für m ≥ 3, und deshalb ist N ≡ 0 (mod 8. Da −2 zu 125 teilerfremd und ϕ(125) = 100
ist, gilt (−2)k·100 ≡ (1 mod 125). Da einerseits 1998! ≥ 3, andererseits 1998! durch 100 teilbar ist,
gilt N ≡ 0 (mod 8) und N ≡ 1 (mod 125). Die Zahl 376 erfüllt die Kongruenzen 376 ≡ 0 (mod 8)
und 376 ≡ 1 (mod 125). Deshalb ist nach der Eindeutigkeitsaussag des chinesischen Restsatzes
N ≡ 376 (mod 1000). D.h. die letzten 3 Ziffern von N sind 376.