Das Buch 17 - Fachbereich Mathematik und Informatik

Werbung
Das Buch 17
Friedrich Ischebeck
2
Einleitung
17
ist die siebte Primzahl und die Summe der ersten 4 Primzahlen: 2 + 3 + 5 + 7 = 17. Sie
2
lässt sich als 22 + 1 schreiben. Dies ist der Grund dafür, dass man ein regelmäßiges 17-Eck
mit Zirkel und Lineal konstruieren kann. Der Entdecker dieser Tatsache, Carl Friedrich
Gauss, wurde im Jahre 1777 geboren. (Er starb 1855.) Ferner ist 17 die Summe von zwei
Quadratzahlen (12 + 42 ), von drei dritten Potenzen (13 + 23 + 23 ) und von zwei 4. Potenzen
ganzer Zahlen (14 + 24 ). Und 17 = 23 + 32 = 34 − 43 sei auch nicht vergessen.
Der eigentliche Grund aber
für den Titel dieses Buches ist, dass ich mir Dich, liebe Leserin, lieber Leser, als etwa siebzehnjährigen jungen Menschen vorstelle, der sich für die Mathematik interessiert.
Man könnte dieses Buch also auch als Geschenk zum 17. Geburtstag eines jungen Menschen
”
der Mathe mag“ bezeichnen.
Es soll Dir nützlich sein, wenn Du vielleicht vorhast, einmal Mathematik, oder auch Physik,
Informatik oder Ingenieurwissenschaften zu studieren. Es soll Dir vor allem Vergnügen bereiten!
Es soll Dir schließlich auch Gelegenheit bieten, Dich an Hand der eingestreuten Fragen und
der Übungsaufgaben aktiv mit der Mathematik zu beschäftigen.
*******
Der (historische) Anfang der Mathematik war die Beschäftigung mit den natürlichen Zahlen
0, 1, 2, 3, . . .
und den geometrischen Figuren. Schon daran erkennt man, dass die Mathematik sich nicht
jenseits aller Wirklichkeit befindet – obwohl das manch einem so scheinen mag.
Schon früh erkannte man, dass Geometrie und Zahlen viel miteinander zu tun haben. Aber
gerade dieser Zusammenhang erzwingt es, mehr Zahlen als nur die natürlichen zu betrachten.
Nun kann man zur Not sagen: die Strecke a verhält sich zu einem Meter (Elle, Fuß) wie 3 zu
”
5“, statt a ist 3/5 Meter (Elle, Fuß) lang“ und auf diese Weise den Gebrauch der rationalen
”
Zahlen vermeiden. Aber ist das wirklich erstrebenswert?
Auch die rationalen Zahlen, d.h. die Brüche mit ganzem Zähler und ganzem Nenner, reichen
(zumindest dem Theoretiker) nicht aus. Z.B. kann man die Länge der Diagonale eines Quadrates
im Verhältnis zu einer Seite nicht (absolut genau) als rationale Zahl angeben. Man kann dieses
141
1414
14
, besser als
, noch besser als
usw. angeben, wobei das
Verhältnis nur ungefähr als
10
100
1000
usw.“ genauer zu erläutern wäre.
”
√
Da scheint es doch griffiger zu sagen√ die Diagonale ist 2-mal so lang wie die Seite“ und dann
”
eine Methode anzugeben, wie man 2 durch rationale Zahlen approximieren kann.
3
√
Nun ist 2 zwar keine rationale, aber eine reelle Zahl, und so steht es auch mit π und vielen
anderen Zahlen. Über den Begriff ‘reelle Zahl’ muss und will ich Dir in diesem Buch auch einiges
mitteilen.
Will man die Punkte einer Ebene (bzw. des Raumes) durch 2 (bzw. 3) Koordinaten beschreiben,
so kommt man offenbar ohne negative Zahlen nicht aus. Du siehst, die Betrachtung des
Rechenbereichs aller reellen Zahlen wird durch die Geometrie mehr oder weniger erzwungen.
Die Zahlen sind nicht nur zum Zählen und messen, sondern auch zum Rechnen da. Z.B. kann
man durch Rechnen das Zählen vereinfachen. Wenn etwa eine Partei im ersten Wahlbezirk 312,
im zweiten 298 und im dritten 99 Stimmen gewonnen hat, so wird man in der Wahlzentrale
diese Anzahlen addieren, statt die betreffenden Stimmzettel anliefern zu lassen, sie zusammen
zu werfen und dann zu zählen. Du wirst keine Probleme haben, die drei genannten Zahlen
‘schriftlich’ zu addieren. Aber versuche das einmal, wenn die Zahlen in römischer Schreibweise
gegeben sind: CCCXII, CCXCVIII, IC. Dies zeigt die Überlegenheit des uns geläufigen Dezimalsystems. (Im Altertum hat man mit der mechanischen Rechenmaschine ‘Abakus’ praktisch
eine Übertragung der römischen oder griechischen Zahlenschreibweise in das Dezimalsystem
vorgenommen!)
Wenn man akzeptiert, dass es beispielsweise auf dieselbe Zahl hinausläuft, ob man die 312
und die 298 und die 99 Wahlzettel zusammenwirft und dann zählt, oder ob man diese Zahlen
in beliebiger Reihenfolge addiert, dann akzeptiert man damit auch das Assoziativ- und das
Kommutativgesetz der Addition,
a + (b + c) = (a + b) + c, bzw. a + b = b + a
(Du kannst Dir darüber weitergehende Gedanken machen – musst es aber nicht. Dahinter
steckt schließlich die Einsicht, dass man beim Zählen einer endlichen Menge von Gegenständen
unabhängig von der Reihenfolge immer zum selben Ergebnis kommt. Die meisten Menschen
werden das in keiner Weise bezweifeln.)
Dem Dezimalsystem liegt die Grundzahl Zehn zugrunde. Dabei ist die Zehn natürlich nicht
die einzig mögliche, aber auch nicht die schlechteste Wahl, jedenfalls, was die Praxis des
Rechnens betrifft. Die kleinstmögliche Grundzahl 2 (mit den einzigen Ziffern 0 und 1) ist zwar
für Computer am geeignetsten, aber vielleicht nicht für den Menschen. Wir sprechen vom
Binärsystem oder von der Binärschreibweise, wenn wir von der Grundzahl Zwei ausgehen.
Die Multiplikation natürlicher Zahlen kann man als iterierte Addition definieren. Obwohl
man sie demnach auf die Addition zurückführen kann, ist es aber sinnvoll, sie als eigenständige
Rechenart anzuerkennen. Warum und wie ich das meine, erläutere ich jetzt mit vier Argumenten.
1. Die – wie gesehen – nützliche Dezimal-Darstellung natürlicher Zahlen benutzt implizit die
Multiplikation: 3024 = 3 · 10 · 10 · 10 + 0 · 10 · 10 + 2 · 10 + 4. (In den Summanden braucht man
auf Grund der Assoziativität der Multiplikation keine Klammern zu schreiben. Ferner haben
wir die geläufige Konvention ‘Punktrechnung vor Strichrechnung’ genutzt.) Beim schriftlichen
Addieren benutzt man implizit die Distributivität, a(b + c) = ab + ac, also eine Regel, in der
neben der Addition die Multiplikation eine Rolle spielt.
4
2. Man berechnet z.B. das Produkt 127·344 sicher nicht, indem man 127 mal 344 zu sich selbst
addiert, sondern schneller auf andere Weise, nämlich so wie Du das ‘schriftliche Multiplizieren’
auf der Schule gelernt hast. Wieder erkennt man die Nützlichkeit des Dezimalsystems, bzw. des
Binärsystems für Computer.
3. Es gilt – wie Du vielleicht weißt, aber auch ziemlich bald in diesem Buch lernen wirst – die
Formel:
n(n + 1)
1 + 2 + 3 + ··· + n =
2
Für nicht zu kleine n ist sicher die rechte Seite dieser Identität schneller zu berechnen als die
linke, obwohl man rechts nicht nur multiplizieren sondern auch noch dividieren muss. Und dies
ist natürlich nur eines unter vielen Beispielen.
4. Es ist nicht schwer, die Multiplikation natürlicher Zahlen sinnvoll auf die rationalen Zahlen
‘auszudehnen’, wo man sie nicht mehr als iterierte Addition auffassen kann.
Oben habe ich bereits erläutert, wieso die Grundgesetze der Addition, nämlich die Assoziativität
und Kommutativität eigentlich selbstverständlich sind. Wie steht es um die entsprechenden
Gesetze für die Multiplikation? Wenn man das Produkt m · n zweier natürlicher Zahlen als
Summe von m Summanden der Größe n definiert, ist es nicht von vorneherein klar, dass bei
der Addition von n Summanden der Größe m dasselbe herauskommt, d.h. ob m · n = n · m ist.
Wenn Du aber sagst, m · n ist die Anzahl der Apfelsinen, die in m Reihen zu je n Stück
angeordnet ist, wie in folgendem Bild, so wird das Gesetz m · n = n · m augenscheinlich.
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Wie würdest Du Dir das Distributivgesetz a(b + c) = ab + ac für natürliche Zahlen anschaulich
klarmachen?
Für Potenzen gilt weder die Kommutativität, noch die Assoziativität. Es ist ja 23 6= 32 , sowie
2
2(3 ) 6= (23 )2 .
Wunderbarer Weise kann man die Addition und die Multiplikation auf die rationalen Zahlen,
d.h. positive oder negative Brüche, ausdehnen, und es bleiben sogar dieselben Rechengesetze
erhalten.
Fasst man die rationalen Zahlen als Größen auf, ist eigentlich klar, wie man zwei solche zu
addieren hat. (S.u.)
Das Produkt zweier Brüche entspricht geometrisch der Flächengröße des Rechtecks mit den
Seitenlängen, die den Brüchen entsprechen. (S.u.)
Warum müssen wir Mathematiker – und mit diesem Wort sind im ganzen Buch alle Mathematikerinnen herzlich mitgemeint – die Bruchrechnung beherrschen? Das Addieren von Brüchen
5
ist schwerfällig. Ebenso ist es mühsam von zwei gegebenen Brüchen zu erkennen, welcher von
beiden der größere ist. Vergleiche z.B. 99/101 mit 98/100. (Es wäre schön, wenn Du dabei auch
ein Gesetz erkennen könntest!) Der Praktiker ist sicher gut beraten, abbrechende Dezimalbrüche zu benutzen – wenn auch mit einiger Vorsicht. Der Mathematiker sollte jedoch auch die
Hintergründe verstehen. Außerdem rechnet man mit Brüchen von Termen (etwa (sin α)/(c + b))
genauso wie mit Brüchen von ganzen Zahlen.
Die Bruchrechnung wird an der Schule in der 6. oder 7. Klasse erlernt – und später von vielen
vergessen. (Dazu tragen leider auch die an sich nützlichen Taschenrechner bei, die selber mit
Brüchen umgehen können und so den Schülern das mühsame Addieren von Brüchen ersparen!)
Das Rechnen mit konkreten Brüchen kann aber lehren, wie wichtig es ist, dass man nicht einfach
alles durcheinander wirft. Man muss unbedingt falsche Analogien vermeiden! Z.B. gilt zwar die
Regel
a b
a+b
c c
c
+ =
, aber keinesfalls allgemein + =
c c
c
a b
a+b
wie man etwa an der Identität
1 1
+ =1
2 2
sieht, die niemand bezweifeln wird, auch diejenigen nicht, welche die Bruchrechnung noch nicht
gelernt oder wieder vergessen haben.
Da gute Mathematiker sich u.a. dadurch auszeichnen, dass sie falsche Analogien vermeiden
(und richtige Analogien nützen!), erscheint mir die Beobachtung erklärlich, dass Studierende,
die zu Anfang ihres Studiums die Bruchrechnung beherrschen, am Ende meist einen guten
Studienerfolg in der Mathematik erreichen.
Ein Abiturient oder eine Abiturientin, die nicht mehr genau weiß, wie man mit Brüchen rechnet
hat, kann dennoch mit Erfolg Mathematik studieren. Man kann im Mathematikstudium im
Prinzip alles Vergessene nachholen. Man muss es allerdings auch wollen und tun!
Du kannst allerdings nicht erfolgreich Mathematik studieren, ohne an diesem Fach
Interesse und Freude zu haben! Ich bilde mir nicht ein, einen Menschen, der Mathematik
uninteressant oder gar ätzend findet, vom Gegenteil überzeugen zu können. Für einen solchen
ist dieses Buch nicht gedacht.
Dezimalzahlen. Rationale Zahlen, d.h. Brüche kann man als Dezimalzahlen schreiben.
36
Zum Beispiel
= 1,44. Meist kommt man nicht mit endlich vielen Nachkommeziffern aus.
25
1
Zum Beispiel
= 0,3 = 0,333 . . . wo nach dem Komma unendlich viele 3-en folgen; oder
3
45
= 1,0227 = 1,02272727 . . . wo nach 1,02 unendlich oft das Ziffernpaar 27 folgt.
44
Wenn man eine rationale Zahl als Dezimalzahl schreibt, ergibt sich immer ab einer gewissen
Stelle eine Periode. Im ersten Beispiel ist dies die Periode 0, im zweiten die Periode 3, im
dritten die Periode 27. (Der Fall, wo die Dezimalzahl abbricht, d.h. auf die Periode 0 endet,
tritt genau dann ein, wenn der Nenner des gekürzten Bruches die Form 2m 5n mit natürliche
Zahlen m, n hat. Das liegt natürlich daran, dass 2 und 5 die Primfaktoren von 10 sind.)
6
Umgekehrt kann man jede Dezimalzahl, die von einer Stelle an periodisch ist, als Bruch ganzer
Zahlen schreiben.
√
Nun gibt es allerdings ‘Zahlen’, wie etwa 2, die wir auf jeden Fall als Zahlen betrachten wollen,
und die man auch als Dezimalzahlen ‘schreiben’, kann. Diese haben keine Periode! Aber√man
kann theoretisch für jede natürliche Zahl n mit genügend ‘Fleiß’ die ersten n Ziffern von 2, π
etc. berechnen. Alle Zahlen, die man als Dezimalzahlen schreiben kann, nennt man die reellen
Zahlen. (Natürlich dürfen sie auch negativ sein.)
Im 2. Kapitel werden Rechenbereiche von einem allgemeinen Standpunkt aus betrachtet. Und
es werden Beispiele gegeben, die Dir vielleicht sehr exotisch vorkommen. Dieses Kapitel zu
lesen, wird Dir vielleicht nicht so leicht fallen. Es lohnt sich aber! Natürlich darfst Du seine
Lektüre auf später verschieben.
Mengen und Abbildungen sind Begriffe der modernen Mathematik, denen Du in einem
Mathematik- und Informatikstudium nicht entgehen kannst. Das entsprechende Kapitel ist
vielleicht schwer zu lesen, weil es so abstrakt ist. Es mag aber auch sein, dass Du es als sehr
leicht zu lesen empfindest, da in ihm alle Schlüsse eher simpel sind.
Geometrie. Auch der Geometrie ist ein Kapitel dieses Buches gewidmet. Dort setze ich allerdings noch mehr als sonst voraus, dass Du ordentliche Kenntnisse aus der Schule mitbringst.
Das Problem der Grundlagen ist für die Geometrie schwieriger als für die Zahlen. Welchen Sinn
hat es, bevorzugt die sogenannte Euklidische Geometrie zu behandeln, obwohl diese, wir man
heute weiß, nicht richtig ist, wenn man Lichtstrahlen (im Vakuum) als Geraden betrachtet? Die
Antwort, dass die Euklidische Geometrie keinen Sinn habe, kann man mit Fug bezweifeln.
In diesem Kapitel sollen insbesondere die Kreisfunktionen (Sinus, Cosinus) geometrisch erklärt
werden, die zu den wichtigsten Funktionen der Analysis und auch der Physik gehören.
Obwohl somit mein Hauptanliegen nicht die klassische Dreiecksgeometrie ist, mochte ich es mir
nicht versagen, ihre schönen Sätze über die Eulergerade, den Feuerbachkreis und das Morleydreieck zu beweisen, die erst im 18. und 19. Jahrhundert gefunden wurden.
Analysis: Die Differenzial-und Integralrechnung betrachtet Funktionen vom geometrischen
oder auch dynamischen Standpunkt aus. Du wirst vieles vom Schulunterricht her wissen, vielleicht aber auch neue Gesichtspunkte kennenlernen.
Komplexe Zahlen. Es gibt mehrere Gründe, warum die komplexen Zahlen aus der modernen
Mathematik nicht mehr wegzudenken sind. Im Kapitel über komplexe Zahlen will ich versuchen,
dies zu erläutern. Komplexe Zahlen lassen sich in der Form a + bi schreiben, wobei a, b reelle
Zahlen sind, während i eine neue Zahl mit der merkwürdigen Eigenschaft i2 = −1 ist. Die
reellen Zahlen werden als spezielle komplexe Zahlen aufgefasst, nämlich als diejenigen a + bi,
wo b = 0 ist. Die Addition komplexer Zahlen ist naheliegend, während man die Multiplikation
nach meinem Gefühl nur auf geometrische Weise wirklich verstehen kann. Eine der wichtigsten
Eigenschaft des Rechenbereichs der komplexen Zahlen ist der Fundamentalsatz der Algebra,
der besagt, dass jedes (nicht konstante) Polynom mit komplexen Koeffizienten mindestens eine
komplexe Nullstelle hat. Beachte, dass z.B. das Polynom x4 −4x3 +6x3 −3x2 +2 = (x−1)4 +x2 +1
keine reelle Nullstelle hat. Die Gültigkeit des Fundamentalsatzes der Algebra wird in diesem
Buch zumindest plausibel gemacht.
7
Zur gedanklichen Präzision in der Analysis und der Geometrie. Wenn eine Funktion zwischen zwei x-Werten a und b überall definiert und stetig ist und wenn ferner f (a) < 0
und f (b) > 0 ist, so hat sie zwischen a und b irgendwo (mindestens) eine Nullstelle. Dieser Satz
hat den Namen Zwischenwertsatz und wird gemeinhin im ersten Semester des Mathematikstudiums bewiesen. Ich hoffe, Du bist mir nicht böse, wenn ich ihn in diesem Buch als anschaulich
selbstverständlich ansehe. Und das ist nur ein Beispiel! Versteh mich richtig. Ich bin nicht der
Meinung, dass die präzisen Beweise der modernen Analysis überfüssig wären. Aber ich will ja
kein Buch für Erstsemester schreiben. Nicht ganz leichten Herzens opfere ich einen Teil der
gedanklichen Präzision, die die moderne Analysis erreicht hat, dem Ziel und hoffentlich auch
Deinem Wunsch, schneller zu Ergebnissen zu kommen, die Du nicht eh schon glaubst. Ich werde
mir an mehreren Stellen erlauben, mich anschaulicher Schlüsse zu bedienen. Dasselbe gilt erst
recht für die klassische Geometrie, für die Du in den Büchern von Hilbert oder Lorenzen
zwei grundsätzlich verschiedene Weisen der Präzisierung finden kannst.
Zum Schluss die Frage: Was hat die Mathematik mit der Wirklichkeit zu tun und was nutzt
sie?
Nach meiner Überzeugung ist die Mathematik eine Wissenschaft, die sich auf die Wirklichkeit
bezieht und sich mit ihr beschäftigt. Ihr Nutzen für die moderne technisierte Welt ist unbestreitbar. (Die Frage, ob wir ohne Autos, Händis und Supermarktkassen nicht glücklicher wären,
kann und will ich nicht beantworten.)
Da heißt nicht, dass es nicht auch prominente Ergebnisse der Mathematik gäbe, die wahrscheinlich auch in weiter Zukunft keinen volkswirtschaftlichen Nutzen bringen werden. Der berühmte
Satz, dass für n > 2 die Summe zweier n-ter Potenzen positiver ganzer Zahlen selbst keine
n-te Potenz ganzer Zahlen ist – vermutet (?) von Fermat im 17., bewiesen von Wiles im 20.
Jahrhundert – gehört wohl dazu.
Man kann zwei extreme Positionen einnehmen:
1. Die Mathematik hat nur einen Wert, soweit sie sich anwenden lässt. Schon aus ethischen
Gründen kann ich es nicht vertreten, mich für ein ‘Glasperlenspiel’ von der Gesellschaft bezahlen
zu lassen.
2. Ich befasse mich mit der Mathematik nur um ihrer Schönheit willen. Schließlich ist sie eine
großartige Kulturleistung. Anwendungen ziehen sie nur herab.
In meiner Jugend neigte ich der 2. Position zu – und habe andererseits manchmal wegen dieser
Meinung ein schlechtes Gewissen gehabt.
Heute ist mir klar: Es gibt nicht den geringsten Grund, eine dieser beiden Extrempositionen
einzunehmen. Betreibe die Mathematik mit Freude sowohl an ihrer Schönheit, als auch an ihren
Anwendungen, und suche Dir den Bereich aus, der Deinem Bedürfnis nach Wirklichkeitsnähe
oder -ferne am nächsten kommt.
8
Es ist ja möglich, dass der eine oder andere Punkt in dem Buch Dir einfach nicht klar werden
will oder dass die eine oder andere Aufgabe Dir völlig unlösbar erscheint. Nachdem Du das
Buch dann wütend in die Ecke geschmissen hast, hol es bitte wieder hervor und lies an einer
anderen Stelle weiter. Auch das Verstehen von Mathematik und das Lösen mathematischer
Aufgaben kann man trainieren.
Vielleicht fällt Dir z.B. im Kapitel über Ringe und Körper manches sehr schwer, während Dir
im Kapitel Differenzial- und Integralrechnung vieles bekannt erscheint.
Mir liegt nicht daran, Dich mit besonders schwierigen Dingen und Aufgaben zu ärgern. Manche
schönen und interessanten Ergebnisse sind aber nun mal nicht so leicht zu haben. Deshalb freut
mich ungemein, wenn es Dir gelingt, auftauchende Schwierigkeiten zu überwinden.
Hier für Nachfragen meine elektronische Adresse: [email protected]
Manchmal benutze ich verschiedene Schreibweisen für dasselbe:
n
X
Pn
a
a
= = a/b ,
ak ,
limn→∞ an = lim an .
k=1 ak =
b
n→∞
b
k=1
Mit , gelegentlich auch mit – bezeichne ich das Ende eines Beweises.
Das griechische Alphabet
A, α alpha, B, β beta, Γ, γ gamma, ∆, δ delta, E, ε epsilon, Z, ζ zeta, H, η eta, Θ, ϑ
theta, I, ι iota, K, κ kappa, Λ, λ lambda, M, µ my, N, ν ny, Ξ, ξ xi, O, o omikron, Π, π
pi, P, ρ rho, Σ, σ sigma, T, τ tau, Υ, υ ypsilon, Φ, ϕ phi, X, χ chi, Ψ, ψ psi, Ω, ω omega.
Unterscheide ζ von ξ.
Manchmal, aber nicht in diesem Buch, werden an Stelle von ε, ϑ, ϕ die Bezeichnungen , θ, φ
benutzt.
Kapitel 1
Vom Zählen, Rechnen und Vergleichen
1.1
Die natürlichen Zahlen
0, 1, 2, 3, 4, 5, . . .
Die natürlichen Zahlen hat der liebe Gott gemacht.“ (Kronecker)
”
Na, darüber will ich lieber nicht spekulieren. Aber, wozu sie gut sind, ist wohl klar. Man kann
jemandem mitteilen, wieviele Schafe man hat (etwa um sie zu verkaufen), ohne ihm die Herde
zeigen zu müssen. Man kann auch ihre Zahl notieren und im kommenden Jahr feststellen,
wieviel Zuwachs, bzw. Verlust man gemacht hat. Usw.
Natürliche Zahlen sind Symbole zum Zählen, zum Vergleichen und zum Rechnen.
Auch wenn man mit dem Zählen meist mit der 1 beginnt, ist es doch möglich, dass ein Einwohner Münsters, wie z.B. ich, gar kein Schaf besitzt und dies auf einer Liste aller Bewohner
Münsters dadurch angegeben wird, dass man eine 0 in die entsprechende Spalte einträgt. Die
0 ist auch eine Anzahl, weshalb ich sie zu den natürlichen Zahlen rechne. (Etwa die Hälfte der
Mathematiker sieht das allerdings anders.)
Notation: Die Gesamtheit aller natürlichen Zahlen – einschließlich der 0 – bezeichne ich mit N.
Eine solche Gesamtheit mathematischer Objekte wird gemeinhin als eine Menge bezeichnet.
Man redet somit von der Menge der natürlichen (ganzen, rationalen) Zahlen. Die Notation
a ∈ N soll ausdrücken, dass a zur Menge der natürlichen Zahlen gehört, d.h. eine natürliche
Zahl ist. (Die Menge der von Null verschiedenen natürlichen Zahlen bezeichne ich mit N1 . Dies
ist der einzige Punkt, wo ich mich nicht einer allgemein gebräuchlichen Notation bediene. Es
gibt für N1 auch die Bezeichnung J.)
1.1.1 Während die Regeln a + b = b + a und a + (b + c) = (a + b) + c nach der alltäglichen
Bedeutung der Addition in N selbstverständlich sind oder zumindest erscheinen, kann man sich
fragen: Ist die Regel a · b = b · a für natürliche Zahlen eigentlich auch so selbstverständlich?
Dass 3 · 7 = 7 + 7 + 7 dasselbe ergibt, wie 7 · 3 = 3 + 3 + 3 + 3 + 3 + 3 + 3, kann man leicht
nachrechnen. Aber das könnte ja Zufall sein.
9
10
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Für Potenzen ist die Sache jedenfalls komplizierter. Es ist zwar 24 = 16 = 42 , aber 73 = 7·7·7 =
343 und 37 = 3·3·3·3·3·3·3 = 2187. (Ich weiß nicht, ob man sich bei der Identität (3+4)3 = 343
irgendetwas denken soll. Ich glaube, eher nicht.)
Die Frage, wieso eigentlich a · b = b · a für natürliche Zahlen gilt, habe ich bereits in der
Einleitung beantwortet
(Einen formalen Beweis, der von einem Axiomensystem für die natürlichen Zahlen ausgeht, gibt
es natürlich auch.)
Die (nicht allzu wichtige) Frage, für welche positiven reellen Zahlen a, b mit a 6= b die Gleichung
ab = ba gilt, wird in diesem Buch in 7.6 behandelt. Dazu musst Du ja wissen, was reelle Zahlen sind,
und was man unter ab für positive reelle Zahlen a, b versteht. Aber natürlich darfst Du schon mal in
diesem Abschnitt nachlesen.
1.1.2 Zumindest ebenso wichtig wie das Gesetz der Kommutativität (ab = ba) ist das Gesetz der Assoziativität der Multiplikation natürlicher Zahlen: (ab)c = a(bc). Kannst Du Dir
seine Gültigkeit geometrisch (im dreidimensionalen Raum) veranschaulichen? (Auch die As3
soziativität gilt nicht für Potenzen? Vergleiche (102 )3 mit 102 , und beachte dabei, dass nach
3
3
allgemein gebräuchlicher Konvention 102 = 10(2 ) definiert ist.)
1.1.3 Das Gesetz, das den Zusammenhang zwischen Addition und Multiplikation beshreibt,
ist das Gesetz der Distributivität (m + n)k = mk + nk. (In der letzten Regel ist natürlich die
Konvention Punktrechnung geht vor Strichrechnung“ anzuwenden; d.h. mk + nk =
”
(mk) + (nk).) Zusammen mit der Festlegung 1k = k definiert das Distributivitätsgesetz sozusagen die Multiplikation natürlicher Zahlen. Nicht wahr? (Aufgrund der Distributivität ist ja
(1 + · · · + 1)k = 1 · k + · · · + 1 · k mit gleichvielen Summanden links und rechts.)
Auch dieses Gesetz kannst Du Dir anschaulich klar machen.
• • • •
• • • •
• • • •
• • • •
• • • •
Natürlich sieht man es auch so:
. . + k} = |k + .{z
. . + k}
mk + nk = |k + .{z
. . + k} + |k + .{z
m
n
m+n
1.1.4 Die grundlegenden Gesetze der Addition und Multiplikation im Bereich der natürlichen
Zahlen fassen wir noch mal zusammen:

mn = nm
Kommutativität
 m+n=n+m
(1) k + (m + n) = (k + m) + n k(mn) = (km)n Assoziativität

(m + n)k = mk + nk
Distributivität
1.1. DIE NATÜRLICHEN ZAHLEN
11
Beachte, dass das Distributivitätsgesetz die Addition und die Multiplikation vollkommen unterschiedlich behandelt und dass eine Unregel entstünde, wollte man die Addition mit der
Multiplikation vertauschen: Meist ist mn + k 6= (m + k)(n + k).
Die Assoziativität der Addition (bzw. Multiplikation) bedeutet, dass man in einer längeren
Summe (bzw. Produkt) keine Klammern benötigt, um anzuzeigen, welche Addition (bzw. Multiplikation) man vor welcher auszuführen hat. Z.B. ist (ab)(cd) = (a(bc))d etc. Klammern
benötigt man erst, wenn Summen und Produkte gemeinsam in einer Formel vorkommen.
Da zusätzlich die Kommutativität gilt, kann man die Summanden, bzw. Faktoren in beliebige
Reihenfolge bringen, ohne dass sich an der Summe, bzw. dem Produkt etwas ändert. Z.B. ist
abcd = cadb.
Im nächsten Kapitel wirst Du Rechenbereiche kennenlernen, wo die Multiplikation zwar assoziativ, aber nicht kommutativ ist.
Aus dem Distributivitätsgesetz, sowie der Kommutativität und Assoziativität der Addition und
Multiplikation kannst Du folgern, dass (a0 + a1 + · · · + am )(b0 + b1 + · · · + bn ) gleich der Summe
über folgende Produkte (in beliebiger Reihenfolge) ist
a0 b 0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b 3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5
a1 b 5
a2 b 5
a3 b 5
a4 b 5
a5 b 5
..
.
···
···
···
···
···
···
..
.
a0 b n
a1 b n
a2 b n
a3 b n
a4 b n
a5 b n
..
.
am b 0 am b 1 am b 2 am b 3 am b 4 am b 5 · · · am b n
Merke Dir dieses Schema und erinnere Dich daran, wenn es im Abschnitt 4.5 um Produkte
unendlicher Summen geht!
1.1.5 Die Zahlen 0 und 1 spielen für die Addition, bzw. Multiplikation eine Sonderrolle:
(2) 0 + n = n , 1n = n
Man nennt die 0 ein neutrales Element für die Addition und die 1 ein solches für die Multiplikation.
1.1.6 Du kennst sicher bereits größere Zahlbereiche als den der natürlichen Zahlen, nämlich
den der ganzen, den der rationalen und den der reellen Zahlen. In allen diesen gelten die Gesetze
(1) aus 1.1.4, und auch dort sind die Zahlen 0, bzw. 1 die neutralen Elemente für die Addition,
bzw. die Multiplikation.
1.1.7 Man kann natürliche Zahlen der Größe nach vergleichen. Genau dann gilt a ≤ b in N,
wenn es ein a0 ∈ N gibt mit a + a0 = b. Für die Relation ‘≤’ in N gelten folgende grundlegenden
Regeln:
12
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
a ≤ a;
a ≤ b, b ≤ c ⇒ a ≤ c;
a ≤ b, b ≤ a ⇒ a = b;
für je zwei natürliche Zahlen a, b ist a ≤ b oder b ≤ a.
a ≤ b ⇒ a + c ≤ b + c;
a ≤ b ⇒ ac ≤ bc.
Beachte, dass für eine negative Zahl c (die es in N nicht gibt) die letzte Regel falsch ist.
Ausgehend von ‘≤’ kann man ‘<’ durch
a < b ⇐⇒ a ≤ b und a 6= b
definieren. (Um deutlich zu machen, dass a < b durch [a ≤ b und a 6= b] definiert werden soll,
schreibt man auch einen Doppelpunkt vor das Zeichen ⇐⇒ , also a < b : ⇐⇒
[a ≤ b und a 6= b]. Hier, wie oben sind die Klammern [, ] logische Klammern.)
Natürlich soll a > b dasselbe wie b < a bedeuten und a ≥ b dasselbe wie b ≤ a.
Was bedeuten die Zeichen ‘=⇒’ und ‘ ⇐⇒ ’ ?
Für zwei Aussagen A, B bedeutet A =⇒ B eine der folgenden untereinander äquivalenten Aussagen:
wenn A gilt, dann gilt auch B“
”
aus A folgt B“
”
A ist eine hinreichende Bedingung für B“
”
B ist eine notwendige Bedingung für A“
”
Man sagt dazu auch: A impliziert B“.
”
Die Aussage A ⇐⇒ B bedeutet, dass sowohl A =⇒ B als auch B =⇒ A erfüllt
ist. Man sagt in diesem Fall auch: A gilt genau dann (dann und nur dann), wenn B
gilt. Ebenso sagt man in diesem Fall auch: Die Aussagen A und B sind äquivalent.
Häufig wird =⇒ mit ⇐⇒ verwechselt!
Betrachte die Aussagen:
Wenn heute Fronleichnam ist, ist heute Donnerstag.
Bzw. Wenn heute Donnerstag ist, ist heute Fronleichnam.
Kein Mensch wird auf die Idee kommen, dass aus dem ersten dieser beiden Sätze der zweite
folgt, da ja jeder weiß, dass es viele Donnerstage gibt, an denen nicht Fronleichnam ist.
Aber in der Mathematik sind die Verhältnisse oft weniger leicht zu durchschauen. Angenommen,
Du hast folgenden (richtigen) Satz bewiesen: Wenn eine differenzierbare Funktion f (auf einem
offenen Intervall) im Punkt x0 einen (lokalen) Extremwert hat, so ist f 0 (x0 ) = 0.
Vielleicht möchtest Du daraus schließen: Wenn f 0 (x0 ) = 0 ist, so hat f in x0 einen Extremwert.
Das wäre aber ein falscher Schluss, wie Du an dem Beispiel f (x) = x3 mit x0 = 0 siehst.
1.2. PRIMZAHLEN
13
Dieses Beispiel springt aber nicht von selbst ins Auge, wie das der Donnerstage, an denen nicht
Fronleichnam ist.
Du darfst nie meinen, mit A ⇒ B hättest Du auch B ⇒ A gezeigt.
1.1.8 Hat man endlich viele natürliche (auch ganze, rationale oder reelle) Zahlen a1 , a2 , . . . , an
(mit n > 0) vorgegeben, so gibt es unter diesen eine kleinste und eine größte. Das ist Dir
vermutlich klar. (Ein formaler Beweis würde mit vollständiger Induktion, die später behandelt
wird, argumentieren.)
Darüber hinaus gilt folgende Aussage: Ist M irgendeine Menge natürlicher Zahlen, die auch aus
unendlich vielen Zahlen bestehen darf und mindestens eine Zahl enthält, so gibt es unter den
Zahlen aus M eine kleinste. Ist nämlich a eine Zahl aus M , so gibt es höchstens a + 1 natürliche
Zahlen aus M , die ≤ a sind. Die kleinste unter diesen ist auch die kleinste Zahl von M .
Beispiel: Die kleinste Zahl aus der Menge derjenigen natürlichen Zahlen, die nicht als Summe
von drei Quadraten natürlicher Zahlen geschrieben werden können, ist die 7. (02 ist dabei als
Quadrat der natürlichen Zahl 0 zugelassen.)
1.1.9 Erstaunlicher Weise gibt es über die natürlichen Zahlen eine reichhaltige Theorie, die
so genannte Zahlentheorie. Einer ihrer wundervollen Sätze ist, dass jede natürliche Zahl sich
als Summe von 4 Quadratzahlen schreiben lässt. Z.B. ist 103 = 12 + 22 + 72 + 72 und 3 =
02 + 12 + 12 + 12 . Schreibe 63 als Summe von 4 Quadraten.
Noch erstaunlicher ist vielleicht die Tatsache, dass es Anwendungen der Zahlentheorie für die
Geschäftswelt gibt. Die besten Verschlüsselungen von Zahlen oder Texten beruhen auf (einfachen) zahlentheoretischen Erkenntnissen. Am Schluss dieses Buches, will ich Dir hierüber etwas
erzählen.
1.2
Primzahlen
1.2.1 Frage: Gibt es (vielleicht sehr große) natürliche Zahlen m, n > 0, derart, dass 18m = 20n
ist?
Damit Du diese Frage beantworten kannst, will ich ein wenig auf die so genannten Primzahlen
eingehen.
Eine Primzahl ist eine natürliche Zahl > 1, die sich nur auf triviale Weise als Produkt zweier
natürlicher Zahlen darstellen lässt, d.h. wo einer der Faktoren 1 ist.
Primzahlen sind: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, . . . Achtung: 2 ist eine Primzahl, 1 nicht!
Es gelten folgende zwei Aussagen:
1. Jede natürliche Zahl > 1 ist ein Produkt von Primzahlen, wobei auch Produkte von nur
einem Faktor zugelassen sind.
14
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Z.B. 24 = 2 · 2 · 2 · 3, 25 = 5 · 5, 23 = 23. (Sähe man 2 nicht als Primzahl an, wie könnte man
24 in Primfaktoren zerlegen?)
2. Die Zerlegung einer natürlichen Zahl > 1 in Primfaktoren ist bis auf deren Reihenfolge
eindeutig. (Beachte: Wenn man die 1 als eine Primzahl ansähe, wäre diese Aussage falsch!
Es ist 6 = 2 · 3 = 1 · 2 · 3 = 1 · 1 · 2 · 3 usw.)
Z.B. Seien m, n natürliche Zahlen 6= 0 so ist immer 17m 6= 19n . Zeige das Entsprechende für
18m und 20n .
Ich vermag jedem zuzustimmen, der die Aussage 1. für selbstverständlich hält. Bei der Aussage
2. fällt mir das schon schwerer. Z.B. halte ich es gar nicht für selbstverständlich, dass für von
0 verschiedene natürliche Zahlen m, n immer 17m 6= 19n ist.
Ein weiteres Argument dafür, dass die Aussage 2. eines Beweises bedarf, erhält man, wenn man
Produkt-Zerlegungen nur im Bereich der natürlichen Zahlen n ≥ 3 betrachtet. Weder 4 noch 8
lassen sich zerlegen, wenn man den Faktor 2 nicht zulässt. Sie sind also in diesem Teilbereich
der natürlichen Zahlen unzerlegbar, sozusagen (in diesem Bereich) ‘Primzahlen’. Für diese gilt
aber 4 · 4 · 4 = 8 · 8.
Ich gebe im Folgenden einen Beweis der Eindeutigkeit der Primfaktorzerlegung, d.h. der Aussage
2. Er ist fast wörtlich derjenige, den Gauß in seinen Disquisitiones Arithmeticae gegeben hat.
Ich glaube, dass ein junger Mensch mit geringen Grundkenntnissen keinen verständlicheren
Beweis finden wird.
Beweis der Eindeutigkeit der Primfaktorzerlegung nach Gauß.
Erinnere dich an die sogenannte Division mit Rest, z.B.
16 : 6 = 2 Rest 4
Überraschender Weise spielt diese eine große Rolle in der Mathematik. Wir wollen allerdings
die angegebene ‘Gleichung’ (deren rechte Seite eigentlich keinen Sinn hat) folgendermaßen als
echte Gleichung schreiben
16 = 2 · 6 + 4 (oder auch 16 − 2 · 6 = 4)
Allgemein gibt es zu je zwei natürlichen Zahlen a, b mit b 6= 0 weitere natürliche Zahlen q, r
(denke an Quotient und Rest), so dass zweierlei gilt
a = qb + r und 0 ≤ r < b .
Wenn Du dies genauer einsehen (und nicht einfach Deiner Rechenerfahrung entnehmen) willst,
kannst Du nacheinander die immer kleiner werdenden Zahlen
a − 0 · b, a − 1 · b, a − 2 · b, . . .
betrachten. Die erste Zahl q für die a − qb < b ist, ist das gesuchte q, und r = a − qb ist dann
das gesuchte r. Du wirst bald einen Beweis mit Hilfe der sogenannten vollständigen Induktion
kennen lernen.
1.2. PRIMZAHLEN
15
Lemma 1.2.2 Seien p eine Primzahl und a, b von 0 verschiedene natürliche Zahlen, die kleiner
als p sind. Dann kann p kein Teiler von ab sein.
(Die Bezeichnung ‘Lemma’ wird meist im Sinne von ‘Hilfssatz’ benutzt.) (Beachte dass die
Voraussetzung a, b < p die Beziehung ab > p nicht ausschließt. Es ist ja 2 · 3 > 5.)
Beweis: Angenommen p wäre ein Teiler von ab. D.h. b gehörte zur Menge aller von 0 verschiedenen natürlichen Zahlen x < p, für die p ein Teiler von ax ist. Sei dann c die kleinste
unter diesen Zahlen x. Dabei kann c = b, aber auch c < b sein. Jedenfalls ist 1 < c < p. (Die
Beziehung 1 < c gilt, da p kein Teiler von a · 1 ist.)
Dividiere p durch c mit Rest, d.h. finde natürliche Zahlen q, γ mit p = qc + γ und γ < c. Da
p prim und 1 < c < p ist, kann c kein Teiler von p und folglich γ nicht gleich 0 sein. Es ist
aber p ein Teiler von aγ = ap − qac, da p sowohl ap wie qac teilt. Die ist ein Widerspruch zur
Minimalität von c, der aus der Annahme, p sei ein Teiler von ab, folgt. Diese Annahme kann
also nicht wahr sein.
Folgerung 1.2.3 (Euklids Lemma.) Ist p eine Primzahl und ein Teiler von ab, wo a, b natürliche Zahlen sind. Dann ist p ein Teiler (mindestens) einer der Zahlen a, b.
Beweis: Nimm an, p wäre weder ein Teiler von a noch von b. Dann dividiere a und b durch
p mit Rest: a = pq1 + α, b = pq2 + β mit 1 ≤ α < p, 1 ≤ β < p. Es folgt, dass p ein Teiler
von αβ = (a − pq1 )(b − pq2 ) = ab − pq1 b − pq2 a + p2 q1 q2 ist. Dies widerspricht Lemma 1.2.2, da
α, β < p sind.
Folgerung 1.2.4 Ist eine Primzahl Teiler eines Produkts a1 · · · am natürlicher Zahlen, so teilt
sie einen der Faktoren.
Theorem 1.2.5 Sei eine ganze Zahl > 1 wie folgt auf zwei Weisen in Primfaktoren zerlegt:
p 1 · · · p r = q1 · · · q s
Dann stehen links und rechts dieselben Primfaktoren, und zwar auch jeder Primfaktor gleich
oft.
Beweis:
Offenbar gilt: Ist eine Primzahl p Teiler einer Primzahl q, so muss p = q sein.
Da nach der letzten Folgerung jedes pi eines der qj teilt und umgekehrt, müssen rechts und
links dieselben Primzahlen stehen, allenfalls noch verschieden oft. Ist ein Primfaktor p auf der
rechten Seite m-mal und auf der linken Seite n-mal vertreten und etwa n ≤ m, so dividiere auf
beiden Seiten durch pn . Dann taucht p links nicht mehr und rechts (m − n)-mal auf. Das geht
aber nur, wenn m − n = 0 ist.
16
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.2.6 Frage: Wieviele Primzahlen gibt es? Betrachte dazu folgende Aussagen. Welche ist
schlüssig?
Je weiter man in der Reihe der natürlichen Zahlenreihe fortschreitet, um so seltener werden die Primzahlen. Irgendwann muss ihre Folge aufhören. Folglich gibt es nur endlich viele
Primzahlen.
Aus obiger Aussage über die abnehmende Häufigkeit der Primzahlen kann man nicht schließen, dass es nur endlich viele Primzahlen gibt. Auch die unendlich vielen Quadratzahlen 1, 4,
9, 16, 25 usw. werden ja immer seltener.
Euklid wusste bereits: Zu je endlich vielen Primzahlen p1 , p2 . . . . , pn gibt es immer noch eine
weitere. Euklid hat aus p1 , . . . , pn auf einfachste Weise eine Zahl N > 1 gebildet, die durch keine
der Primzahlen p1 , . . . , pn teilbar ist. Jeder der Primfaktoren von N ist also von den p1 , . . . , pn
verschieden.
Überlege Dir: Kann die Zahl 2 · 3 · 5 + 1 durch eine der Primzahlen 2, 3, 5 teilbar sein? Nun
3 zum Beispiel ist ja ein Teiler von 2 · 3 · 5, aber nicht von 1. Wäre 3 ein Teiler der Summe
2 · 3 · 5 + 1, so wäre 3 auch einer von (2 · 3 · 5 + 1) − 2 · 3 · 5 = 1. Ebensowenig sind 2 und 5
Teiler von 2 · 3 · 5 + 1.
Allgemein seien p1 , p2 , . . . , pn endlich viele Primzahlen, so kann keine von ihnen ein Teiler der
Zahl N = p1 · p2 · · · pn + 1 sein. Da N > 1 ist, hat N mindestens einen Primfaktor p, der aber
von den Primzahlen p1 , p2 , . . . , pn verschieden sein muss.
1.2.7 Erstaunlicher Weise kann man mit fast demselben Verfahren beweisen, dass die Lücken
zwischen aufeinander folgenden Primzahlen beliebig groß sein können. Seien nämlich p1 =
2, p2 = 3, . . . , pn , pn+1 die ersten (d.h. kleinsten) n + 1 Primzahlen (und n ≥ 1), und sei
m = p1 p2 · · · pn . Wir haben ja soeben gelernt, dass m + 1 durch keine der Primzahlen p1 , . . . , pn
teilbar ist. Aber im Gegensatz dazu ist jede der Zahlen m + 2, m + 3, m + 4, . . . , m + pn+1 − 1
durch eine der Primzahlen p1 , . . . , pn teilbar. Es ist ja m + 2 durch 2 teilbar, m + 3 durch 3,
m + 4 durch 2, und so weiter. Keine der Zahlen m + 2, . . . , m + pn+1 − 1 kann also eine Primzahl
sein.
(Im obigen Beispiel ist m = 30 und m + 2 durch 2, und m + 3 durch 3, und m + 4 durch 2,
ferner m + 5 durch 5 und schließlich m + 6 durch 2 (auch durch 3) teilbar.)
Beispiel 1.2.8 In obigem Beispiel ist 2 · 3 · 5 + 1 = 31 wieder eine Primzahl. Das muss nicht
immer so sein:
2 · 3 · 5 · 7 · 11 · 13 + 1 = 30031 = 59 · 509.
Man prüft leicht nach, dass 59 und 509 Primzahlen sind. Und sie sind – wie es sich gehört –
von den Primzahlen 2, 3, 5, 7, 11, 13 verschieden.
Wir haben uns überlegt, dass die Zahlen 30032, 30033, . . . , 30046 alle keine Primzahlen sind.
In der Tat sind (gemäß einer Primzahltafel) die Zahlen 30029 und 30047 Primzahlen, zwischen
denen es keine weiteren gibt.
1.2. PRIMZAHLEN
17
Bemerkung 1.2.9 Jede natürliche Zahl erhält man, indem man zur 0 eine gewisse Anzahl von
1-en addiert:
0 + 1 + 1 + ··· + 1
In Bezug auf die Multiplikation gilt etwas analoges jedenfalls für die von 0 verschiedenen natürlichen Zahlen. Nämlich man erhält jede solche Zahl, indem man 1 mit einer gewissen Anzahl von
Primzahlen multipliziert:
1 · p1 · p2 · · · pn
Die Primzahlen spielen also für die Multiplikation dieselbe Rolle wie die 1 für die Addition. Die
0 für die Addition entspricht der 1 für die Multiplikation, die man deshalb nicht als Primzahl
ansieht. (Der Zahl m = 1 · p1 · p2 · · · pn kommt man von 1 · p1 · · · pk aus, wo k < n ist, durch die
Multiplikation mit pk+1 einen Schritt näher. Das wäre nicht so, wenn man die 1 als Primzahl
auffasste und pk+1 = 1 wäre!)
Bezeichnung: Die Menge (Gesamtheit) der Primzahlen wird mit P bezeichnet.
1.2.10 Wozu sind Primzahlen gut?
Nachdem man mindestens 24 Jahrhunderte lang Primzahlen fast nur als interessante Objekte
der ‘reinen’ Mathematik angesehen hat (es gibt ein etwa 1000 Seiten dickes Buch über Primzahlen), haben Mathematiker und Informatiker vor einigen Jahrzehnten wichtige Verschlüsselungsmethoden erfunden, die Kenntnisse über Primzahlen verwenden.
Angenommen, Du hast einen verschlüsselten Text und weißt, wie die Verschlüsselung vorgenommen wurde. Dann sollte man doch meinen, Du könntest den verschlüsselten Text auch
wieder entschlüsseln.
Dem ist nicht so!
Was man bei kleinen natürlichen Zahlen noch nicht so richtig merkt, bei großen natürlichen
Zahlen ist es ungeheuer mühsam, diese in Primfaktoren zu zerlegen. Ja, bei sehr großen Zahlen
etwa mit 300 oder mehr Dezimalstellen ist es – außer in speziellen Fällen – schlechterdings
auch mit Computer-Hilfe nicht möglich. (Es sei denn Du hättest einen Computer, der die
Quantenstruktur der Materie ausnutzt, einen sogenannten Quantencomputer. Solche gibt es
zwar der Idee nach, aber in der Realität noch nicht wirklich.)
Ich muss gestehen, bislang ist es nur eine Erfahrungstatsache, dass man große Zahlen nur mit
großem Aufwand in ihre Primfaktoren zerlegen kann. Mathematisch bewiesen ist es bis jetzt
nicht.
Andererseits kann man sehr wohl, von Zahlen der angegebenen Größenordnung mit ComputerHilfe in wenigen Sekunden oder Minuten feststellen, ob sie prim sind – ohne eine Faktorzerlegung
im negativen Falle angeben zu können. Wie man das macht, kann ich leider im Rahmen dieses
Buches nicht beschreiben.
Auf Grund dieser Diskrepanz ist es möglich, Texte nach einem öffentlich gemachten Schlüssel
zu verschlüsseln, die man ohne eine zusätzliche Information nicht mehr enschlüsseln kann. Wie
dieses geht, erfährst Du ganz am Ende dieses Buches.
18
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
AUFGABEN
1. a) Zeige, dass jede natürliche Zahl n, die nicht durch 3 teilbar ist, sich in der Form
n = 3m ± 1 mit einem geeigneten m ∈ N schreiben lässt.
b) Welche Primzahlen p haben die Eigenschaft, dass auch 2p2 + 1 (bzw. p2 + 2) eine
Primzahl ist? (Du kannst a) benützen.)
2. Zerlege 15! := 1 · 2 · 3 · · · 15 in Primfaktoren.
3. Finde zu jeder geraden Zahl n mit 4 ≤ n ≤ 50 Primzahlen p, q mit p + q = n. (Dabei darf
p = q sein.) Leider weiß man bis heute nicht, ob dies für alle geraden Zahlen > 3 möglich
ist.
4. Zeige: Eine ganze Zahl zwischen 8 und 120 (einschließlich) ist genau dann eine Primzahl,
wenn sie durch keine der Zahlen 2, 3, 5 oder 7 teilbar ist. (Versuche, ein allgemeines
Gesetz zu formulieren.)
5. 101 Senatoren wählen 2 Konsuln. Jeder wählt zwei (verschiedene) Kandidaten. (Enthaltung sowie die Wahl nur einer Person sind verboten.)
Sind dann folgende Regeln oder auch nur eine von ihnen sinnvoll?
a) ‘Gewählt ist, wer mindestens 51 Stimmen hat.’
b) ‘Wer im ersten Wahlgang weniger als 51 Stimmen bekommen hat, wird kein Konsul.’
1.3
Potenzen mit natürlichen Exponenten
1.3.1 Potenzen: Bekanntlich definiert man an := a · · · a, wobei die Anzahl der Faktoren
gleich n ist. Dies ist eine klare Definition, wenn n ≥ 2 ist. Und ich denke auch a1 = a ist dann
klar. Wir haben ja bereits einmal ein Produkt aus nur einem Faktor anerkannt.
Offenbar ist an+1 = an · a. Damit diese Regel auch für n = 0 gilt, muss man a0 = 1 setzen –
jedenfalls wenn a 6= 0 ist. Es gibt gute Gründe, auch
00 = 1
zu definieren. Wir wollen dies so machen!
(Erinnere Dich daran, dass in der Potenz an die Zahl a als die Basis, die Zahl n als der
Exponent bezeichnet wird.)
Für natürliche Zahlen a, b, m, n gelten, wie Du wahrscheinlich bereits weißt oder leicht siehst,
folgende drei Gesetze (Regeln):
am+n = am · an ,
(ab)n = an · bn ,
Diese Regeln kannst Du wie folgt einsehen:
amn = (am )n
1.3. POTENZEN MIT NATÜRLICHEN EXPONENTEN
19
Wenn man ein Produkt aus m einander gleichen Faktoren a mit einem ebensolchen aus n
Faktoren multipliziert, erhält man ein ebensolches Produkt aus m + n Faktoren.
Ein Produkt aus n Faktoren der Form ab kann man durch Vertauschung der Faktoren als
ein Produkt aus 2n Faktoren schreiben, derart dass die ersten n gleich a und die letzten n
gleich b sind. Dabei benutzt man allerdings die Kommutativität der Multiplikation, während
zur Gültigkeit der ersten Regel nur die Assoziativität gebraucht wird.
Die dritte Regel kann man auf die erste zurückführen:
amn = am+···+m = am · · · am = (am )n
wobei im zweiten Term der Exponent die n-fache Summe von m ist und der dritte Term das nfache Produkt von am ist. Auch hier wird nur die Assoziativität und nicht die Kommutativität
der Multiplikation gebraucht.
Die ersten beiden Regeln entsprechen dem Distributivgesetz zwischen Multiplikation und Addition. Beachte aber, dass dabei die Basen und die Exponenten der Potenzen verschieden behandelt werden.
2
Aus dem dritten Gesetz folgt (23 )2 = 26 = 64, während = 2(3 ) = 29 = 512 ist! Potenzieren ist
c
c
2
nicht assoziativ! Beachte: Man definiert ab := a(b ) . Demgemäß ist 23 = 512.
Achtung: In der Potenzrechnung sind ‘Gesetze’, die nur so ähnlich wie die obigen
aussehen, meist falsch!
22+2 6= 22 + 22 ,
23−2 6= 23 − 22 ,
(1 + 1)2 6= 12 + 12 , 22·3 6= 22 · 23
√
√
√
Mit Wurzeln muss man genauso vorsichtig umgehen: Berechne 9 + 16 und 9 + 16. Ebenso
1+1
1
1
2
2
muss man bei iterierten Potenzen aufpassen: Berechne 23
und 23 · 23 , ferner 23 · 23 und
(23 · 23 )2 .
1.3.2 Wir studieren die Potenzen von 2, um uns einen Eindruck ihres Wachstums zu machen:
20 = 1, 21 = 2, 22 = 4, 23 = 8, . . . , 29 = 512, 210 = 1024, . . . .
Wir wollen versuchen, diese in einem (Funktions)-Diagramm darzustellen, und zwar mit der
Einheit 1 mm : Wandert man vom Nullpunkt aus auf der waagerechten Achse um 5 mm nach
rechts, so müssen wir von dort um 32 mm nach oben gehen, um den Wert 25 = 32 abzutragen. 4
mm weiter müssen wir schon um 51,2 cm nach oben gehen. Der entsprechende Punkt passt nicht
mehr auf die Buchseite. In einem Ballon, der 220 mm hoch über dem Meeresspiegel schwebt,
können wir bequem den Kahlen Asten überqueren. Und 223 mm ist etwa die Höhe des Himalaja.
Und ist man auf der x-Achse bei 39 mm angelangt, so ist der Punkt, der den Wert 239 beschreibt,
schon weiter als der Mond entfernt!
Man spricht von exponentiellem Wachstum.
Wäre es nicht schön, 2x auch für nichtganze x definieren zu können? Man kann! Davon handelt
das Kapitel 5.
20
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.3.3 Fakultät Noch stärker wächst die Folge der n! (n-Fakultät). Dabei wird
n! := 1 · 2 · 3 · · · n definiert.
Offenbar ist n!(n + 1) = (n + 1)! . Damit dies auch für n = 0 gilt, setzt man 0! = 1.
Berechne (3!) · (3!), (3 + 3)! und (3 · 3)! . (Bist Du zu faul zu rechnen, erkenne zumindest, dass
(3!) · (3!) < (3 + 3)! < (3 · 3)! gilt. Welche der angegebenen Zahlen haben den Primfaktor 5,
welche den Primfaktor 7?)
Bemerkungen 1.3.4 a) Auch wenn n! für gar nicht so große Zahlen schon riesig ist, sind doch
die Primfaktoren von n! nicht größer als n. Man kann verhältnismäßig leicht berechnen, wie oft
eine Primzahl in der Primfaktorzerlegung von n! vorkommt. Davon später.
b) Wäre es nicht schön, x! auch für nichtganze x definieren zu können? Man kann! Schlage
unter dem Stichwort ‘Gamma-Funktion’ nach – etwa in der Wikipedia oder in Forsters
Analysis I oder vielen anderen Texten.
Die beiden Aussagen aus Abschnitt 1.2.1 über die Möglichkeit und Eindeutigkeit der Primfaktorzerlegung positiver ganzer Zahlen kann man auch folgendermaßen ausdrücken:
Satz 1.3.5 Seien p1 , p2 , p3 , . . . die Primzahlen in ihrer natürlichen Reihenfolge, d.h. p1 =
2, p2 = 3, p3 = 5 usw. Jede natürliche Zahl n ≥ 1 lässt sich eindeutig als unendliches Potenzprodukt folgender Form schreiben:
n = pa11 pa22 pa33 · · ·
Dabei sind die ai ∈ N, dürfen insbesondere 0 sein. Ja, bis auf endlich viele i sind alle ai = 0.
Das Produkt hat dann unendlich viele Faktoren, die gleich 1 sind, und nur endlich viele Faktoren
die von 1 verschieden sind. Wir geben diesem (unendlichen) Produkt einen Sinn, indem wir das
Produkt unendlich vieler Einsen als 1 definieren.
1.3.6 Zum Beispiel wird der Zahl 24 auf diese Weise die Folge (3, 1, 0, 0, 0, . . .) zugeordnet und
der Zahl 25 die Folge (0, 0, 2, 0, 0, 0, . . .), da einerseits 24 = 23 · 31 · 50 · 70 · 110 · · · und andererseits
25 = 20 · 30 · 52 · 70 · 110 . . . ist. Der Zahl 1 wird die Folge (0, 0, 0, . . .) zugeordnet
In einem abstrakten Sinne gibt es also genau so viele Folgen der o.a. Art, wie natürliche Zahlen
≥ 1. Ist das nicht überraschend?
(In diesem abstrakten Sinne, gibt es auch nicht mehr Brüche natürlicher Zahlen als natürliche
Zahlen selbst. Versuche Dich an dieser Aussage! Sie wird im Kapitel 4 behandelt.)
Wenn man eine natürliche Zahl als Potenzprodukt von Primzahlen, d.h. als eine gewisse Folge
natürlicher Zahlen, auffasst, entspricht dem Produkt in N1 die Summe im Bereich der Folgen
natürlicher Zahlen, wobei
(a1 , a2 , a3 , . . .) + (b1 , b2 , b3 , . . .) := (a1 + b1 , a2 + b2 , a3 + b3 , . . .)
1.4. BRÜCHE
21
definiert ist. In einem abstrakten Sinn ist also die Multiplikation natürlicher Zahlen nicht viel
komplizierter als ihre Addition. (Das hilft allerdings gar nichts, wenn man die Primfaktozerlegung der Faktoren nicht leicht berechnen kann.)
Die Schwierigkeit und der Reiz der Zahlentheorie entstehen erst, wenn man Addition und
Multiplikation zugleich betrachtet.
1.4
Brüche
a
Vorbemerkung: Brüche schreibe ich meist in der Form , gelegentlich aber auch in der Form
b
a/b.
1.4.1 Seien a, b, a0 , b0 natürliche Zahlen mit b, b0 6= 0. Dann gilt bekanntlich
a a0
aa0
· 0 = 0
b b
bb
(1.1)
(Formal kann man diese Regel als Definition ansehen. Aber wenn man von ihr verlangt, dass
sie gewisse Anforderungen erfüllen soll, ergibt sie sich zwangsläufig, wie Du unten sehen wirst.)
Warum soll dann eigentlich nicht auch
a a0
a + a0
+ 0 =
gelten???
b
b
b + b0
(1.2)
Wäre das jedoch richtig, so müsste auch
2
1
1 1
+ = =
gelten.
2 2
4
2
Nun soll aber die Zahl
1
2
doch gerade diejenige Zahl sein, für die
2·
1
1 1
= 1, d.h. + = 1
2
2 2
gilt. Die letzte oben vorgeschlagene ‘Regel’ ist also eine Unregel !!!
1.4.2 Wir betrachten Brüche als ‘Größen’. (Etwa als Längen von Strecken.) Der Bruch m
als
n
‘Größe’ hat folgende Bedeutung. Teile die (Maß-)Einheit in n gleiche Teile und nehme das
m-fache eines solchen Teiles. Dabei ist natürlich m1 mit m zu identifizieren.
m
= 0 (für m 6= ∞) zu
Bemerkung: Es ist nicht völlig unsinnig, m0 = ∞ (für m 6= 0) und ∞
setzen. In gewissen Zusammenhängen wird das auch gemacht. Aber den Ausdrücken 00 , ∞
,
∞
∞−∞ kann man keine sinnvollen Bedeutungen geben. Wir wollen das hier nicht weiter vertiefen,
sondern 0 als Nenner nicht zulassen!
22
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Aus der Vorstellung von
m
n
als Größe entnimmt man
m
km
=
falls k 6= 0.
n
kn
D.h. man darf erweitern und kürzen (nicht mit 0). Am elegantesten definiert man die Gleichheit
von Brüchen durch
m
m0
= 0 ⇐⇒ mn0 = m0 n.
n
n
0
Dies ist äquivalent dazu, dass man mit Erweitern und Kürzen von m
zu m
kommt. (Beweise
n
n0
das!)
0
1.4.3 Aus der Größenvorstellung ergibt sich auch sofort, wie man Brüche m
addiert.
und m
n
n0
Ist n = n0 , so sollte
m m0
m + m0
+
=
(1.3)
n
n
n
sein. Andernfalls kann man durch Erweitern erreichen, dass die Nenner gleich werden. Man
bekommt so die Regel
mn0 + m0 n
m m0
+ 0 =
(1.4)
n
n
nn0
Einfacher ist eine allgemeine Formel für die Addition von Brüchen nicht zu haben! (In der
Schule hast Du vielleicht keine Formel, sondern folgendes Verfahren zur Berechnung der
Summe zweier Brüche kennengelernt: Bestimme den kleinsten gemeinsamen Nenner der
Brüche, d.h. das kleinste gemeinsame Vielfache k von n und n0 , erweitere beide Brüche
so, dass k ihr Nenner wird und addiere dann gemäß 1.3. Wenn n und n0 nicht teilerfremd
sind, bedeutet dies, dass man mit kleineren Zahlen rechnen kann als nach Formel 1.4. Allerdings ist auch dann nicht garantiert, dass das Ergebnis bereits gekürzt ist. Beispiel: 13 + 16 = 12 .
0
1
3
1
2
2
3
1
Da wird der Physiker doch sagen: Da nehm ich meinen Taschenrechner, rechne m/n und m0 /n0
als Dezimalzahlen aus und addiere diese dann mit dem Rechner. Dagegen ist auch nichts zu
sagen. Aber wenn er etwa
x
x3
+
x2 + 1 x2 + 5
auf einen Bruchstrich bringen soll, so muss er es ganz genau so wie mit Brüchen von Zahlen
machen. Schön, wenn er dann weiß, wie’s geht!
1.4.4 Die Definition (1.1) des Produktes zweier Brüche wollen wir auch geometrisch begründen:
Wenn man ein Rechteck mit den Seitenlängen 1/3, bzw. 1/5 Meter hat, so kann man es 15-mal
in einem Quadrat, dessen Seiten 1 m lang sind, unterbringen. Es ist also 1/15 m2 groß. Ein
Rechteck mit den Seitenlängen 2/3 und 4/5 Meter ist dann (2 · 4)/15 m2 groß.
1.5. NEGATIVE ZAHLEN
23
1.4.5 Ist a durch b in N (oder Z) teilbar, so ist natürlich
beim Teilen durch b wird.
a
b
gleich der ganzen Zahl, die aus a
1.4.6 Für den Größenvergleich von Brüchen (mit positiven Nennern) gilt:
m
m0
<
⇐⇒ m < m0
n
n
1
1
Wann ist also < 0 ?
n
n
und allgemein
m
m0
< 0 ⇐⇒ mn0 < m0 n
n
n
1.4.7 Für die Addition und Multiplikation von Brüchen gelten dieselben grundlegenden Gesetze wie bei den natürlichen Zahlen: Assoziativität, Kommutativität, Distributivität, Existenz
neutraler Elemente. Dies kannst Du leicht nachprüfen, d.h. auf die entsprechenden Gesetze für
die natürlichen Zahlen zurückführen – wenn es auch bei der Assoziativität der Addition und
der Distributivität etwas dauern mag.
1.5
Negative Zahlen
1.5.1 Im Bereich der natürlichen Zahlen kann man die Gleichung x + n = m genau dann nach
x auflösen, wenn n ≤ m ist. Es gibt dann genau eine natürliche Zahl d mit d + n = m. Diese
Zahl d wird mit m − n bezeichnet.
Dasselbe gilt für den Bereich der ‘nichtnegativen rationalen Zahlen, d.h. der Brüche natürlicher
Zahlen’, die wir bis jetzt betrachtet haben. Die Erweiterung dieser Bereiche um die sogenannten
negativen Zahlen erlaubt es, obige Gleichung immer zu lösen.
Die moderne Mathematik kann nicht auf negative Zahlen verzichten, z.B. um die Punkte einer
Ebene mit Koordinaten zu beschreiben. Bis jetzt haben wir natürliche Zahlen und Brüche von
solchen betrachtet. Zu jedem Bruch, bzw. jeder natürlichen Zahl q 6= 0 erfinden wir einen ‘entgegengesetzten’ Bruch, bzw. ’entgegengesetzte’ ganze Zahl −q. Ferner sei −0 = 0. Zusammen
mit den nichtnegativen Brüchen, bzw. natürlichen Zahlen ergeben sie die rationalen Zahlen,
bzw. die ganzen Zahlen. Bezeichnungen: Z bezeichnet die Menge der ganzen Zahlen, Q die
der rationalen Zahlen.
1.5.2 Geometrisch stellen wir uns die ganzen, bzw. rationalen Zahlen als Punkte auf einer
Geraden vor. Auf ihr ist ein Punkt als 0 (Nullpunkt) ausgezeichnet. Rechts von ihm liegen die
positiven Zahlen, insbesondere die 1, links von ihm die negativen Zahlen.
Insbesondere sind die Abstände aufeinanderfolgender ganzer Zahlen einander gleich. (Manchmal
betrachtet man ja auch einen logarithmischen Maßstab, hier nicht.) Wir sprechen von einer
Zahlengeraden. Allerdings werden wir bald sehen, dass man auf geometrische Weise Punkte auf
ihr konstruieren kann, die keiner rationalen Zahl entsprechen!
(Die Worte ‘rechts, links’ haben einen Sinn, wenn die Gerade in einem Buch oder auf einer
Tafel gezeichnet ist, wo die Richtungen ‘oben, unten’ ausgezeichnet sind und klar ist, von wo
man guckt.)
24
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
1.5.3 Wenn wir die nichtnegativen rationalen Zahlen durch die negativen rationalen Zahlen –
und damit auch die natürlichen Zahlen durch die negativen ganzen Zahlen – ergänzt haben, gibt
zu jeder rationalen Zahl r ein sogenanntes additiv Inverses −r = (−r). Dieses ist bestimmt
durch die Eigenschaft r + (−r) = (−r) + r = 0. Damit ist offenbar r auch ein additiv Inverses
von (−r), d.h. −(−r) = r.
Wenn man bereits negative Zahlen, also auch zu jeder Zahl ein additiv Inverses hat, braucht
man formal den Begriff einer Differenz nicht mehr. Statt a − b kann man ja a + (−b) schreiben.
Unter a − b − c + d versteht man a + (−b) + (−c) + d, etc.
1.5.4 Anordnung der rationalen Zahlen. Bezeichne mit Q+ die Menge derjengen rationalen Zahlen, die als Brüche natürlicher Zahlen geschrieben werden können. Wir wollen die Zahl
0 = 10 mit einschließen. (Mit Q− sei dann die Menge aller −a, für die a in Q+ liegt, bezeichnet.)
Die Ungleichung a ≥ b für a, b ∈ Q wird dann durch a − b ∈ Q+ definiert. Geometrisch bedeutet
das, dass a rechts von b liegt oder mit b übereinstimmt.
1.5.5 Ein paar Aufgaben zu Brüchen
a) Berechne
1 1
− ,
2 3
1 1
− ,
3 4
1
1
−
.
n n+1
Das Ergebnis der ersten Differenz hast Du oben bereits geometrisch gesehen.
b) Berechne damit
1
1
1
+
+ ··· +
.
1·2 2·3
n(n + 1)
c) Zeige:
1
1
1
1
+ 2 + 2 + · · · + 2 < 2,
2
1
2
3
n
sowie
1
1
1
1
1
+ + + + ··· +
< 3.
0! 1! 2! 3!
n!
1.5.6 Für ganze Zahlen m ≤ n definiert man
n
X
ak := am + am+1 + · · · + an , insbesondere
k=m
k=m
(Ist m > n so setzt man
m
X
n
X
ak = 0. )
k=m
Schreibe obige Summen in dieser Form.
ak = am
1.5. NEGATIVE ZAHLEN
25
1.5.7 Seien a, b positive rationale Zahlen. Warum ist eigentlich (−a)(−b) = ab?
Die richtige Frage ist: Warum definiert man dies so?“ Nun, wenn man naheliegender Weise
”
(−a)0 = 0 und (−a)b = −(ab) definiert, und das Distributivgesetz weiter gelten soll, so ist
einerseits (−a)(b + (−b)) = (−a)0 = 0, andererseits (−a)(b + (−b)) = (−a)b + (−a)(−b) =
−(ab) + (−a)(−b). Also ist (−a)(−b) das additiv Inverse von −(ab), also gleich ab.
Im nächsten Kapitel findest Du hierzu mehr.
Wir lassen auch Brüche
m
n
zu, wo m oder n negativ sind. Dafür gelten die Regeln
m
m
−m
m
−m
=
= − und
=
n
−n
n
−n
n
1.5.8 Hier ein Beispiel für den Nutzen negativer Zahlen. Die Gleichung
x2 + 312 = 37x
hat die Lösungen 13 und 24, wie man leicht durch Rechnen in N, also im Positiven nachprüft.
Das bekannte Lösungsverfahren – mit quadratischer Ergänzung – benutzt jedoch mit Gewinn
das Rechnen mit negativen Zahlen. An diesem Beispiel sieht man auch, wie richtig und wichtig
es ist, das Produkt negativer Zahlen so zu definieren, dass z.B. (−37)2 = 372 ist.
1.5.9 Der Satz über die Eindeutigkeit der Primfaktorzerlegung ist nicht nur für Bereich der
ganzen Zahlen von Bedeutung. Aus ihm folgt z.B., dass es keine rationale Zahl gibt, deren
Quadrat (2-te Potenz) gleich 5 ist. Das heißt, dass sich die Länge der Hypotenuse eines
rechtwinkligen Dreiecks dessen Katheten 1, bzw. 2 Fuß lang sind, sich zu 1 Fuß nicht wie m : n
mit – wie auch immer gewählten – natürlichen Zahlen m, n verhält.
√
Wenn Du mit einem Taschenrechner 5 = 2,2360679 ausrechnest und das Ergebnis quadrierst,
so erhältst Du 4,99999965341041, eine Zahl, die zwar ziemlich nahe bei 5 liegt, aber doch nicht
exakt gleich
√ 5 ist. Der Praktiker sagt – völlig zu Recht – ”Wenn Euch das noch nicht genügt,
genauer ausrechnen“. Aber uns Theoretiker
könnt ihr 5 mit einem Computer noch etwas √
interessiert nun einfach die Tatsache, dass man 5 durch einen endlichen (d.h. nach endlich
√
vielen Stellen abbrechenden) Dezimalbruch niemals völlig genau ausdrücken kann, ja dass 5
überhaupt kein Bruch ganzer Zahlen ist. (Abbrechende Dezimalbrüche lassen sich ja als Brüche
mit ganzem Zähler und ganzem Nenner schreiben, nicht wahr? Umgekehrt lassen sich allerdings
sehr viele Brüche ganzer Zahlen nicht als abbrechende Dezimalbrüche schreiben! Immerhin gibt
es in diesem Fall eine Periodizität.)
Satz 1.5.10 Es gibt keine ganzen Zahlen m, n mit
m 2
n
= 5.
m 2
Beweis: 5 ist sicher nicht das Quadrat einer ganzen Zahl. Wenn also
= 5 mit teilern
fremden m, n und n > 0 ist, so muss n > 1 sein. Wir zerlegen m und n in Primfaktoren:
m
p1 · · · pr
=
,
n
q1 · · · q s
26
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
wobei s ≥ 1 und wegen der Teilerfremdheit pi 6= qj für alle i, j ist. Durch Quadrieren erhält
man den Bruch
p21 · · · p2r
.
q12 · · · qs2
Neue Primzahlen treten nicht auf! Wegen der Eindeutigkeit der Primfaktorzerlegung kann man
hier sowenig kürzen wie vor dem Quadrieren. Der Bruch kann also keine ganze Zahl, also
insbesondere nicht gleich 5 sein.
Dem Beweis siehst Du sicher an, dass man in ihm die Zahl 5 ohne weiteres durch die Zahl 2
ersetzen kann. Ja, es gilt ganz allgemein:
Satz 1.5.11 Seien n, r natürliche Zahlen und r ≥ 2. Wenn n keine r-te Potenz einer ganzen
Zahl ist, kann n auch nicht die r-te Potenz einer rationalen Zahl sein.
Noch allgemeiner ist die Behauptung in Aufgabe 13.
1.5.12 Das Folgende darfst Du erst einmal überschlagen.
Wir wollen die Primfaktorzerlegung von n! bestimmen. Dazu treffe ich folgende Definitionen:
Sei n eine ganze Zahl 6= 0 und p eine Primzahl. vp (n) bezeichne die Anzahl der Primfaktoren
von n, die gleich p sind.
Also ist z.B. v2 (24) = 3, v3 (24) = 1 und vp (24) = 0 für alle Primzahlen p 6= 2, 3.
Man nennt vp (n) die Vielfachheit von p in n. Wir wollen eine Methode, vp (n!) zu berechnen,
angeben.
Gauß-Klammern. Für eine
rationale
3 (oder reelle) Zahl a sei mit [a] die größte ganze Zahl
3
≤ a bezeichnet, also z.B. 2 = 1, − 2 = −2
h i
h i h i h i
Behauptung: Es gilt vp (n!) = np + pn2 + pn3 + . . .. Ist m groß genug, wird pnm = 0.
D.h. wir haben in Wahrheit eine Summe, in der nur endlich viele Summanden ungleich 0 sind.
Eine solche Summe setzt man immer gleich der endlichen Summe ihrer von 0 verschiedenen
Summanden.
h i
Beweis der Behauptung: Der Summand np zählt aus jedem der Faktoren 1, 2, . . . , n von
h i
n!, der durch p teilbar ist, genau einen Primfaktor p. Der Summand pn2 zählt aus jedem der
h i
Faktoren 1, 2, . . . , n, der durch p2 teilbar ist, einen zweiten Primfaktor p. Der Summand pn3
zählt aus jedem der Faktoren 1, 2, . . . , n, der durch p3 teilbar ist, einen dritten Primfaktor p.
Und so weiter!
Insgesamt hat man jeden Primfaktor von n!, der gleich p ist, genau einmal gezählt.–
An dem speziellen Beispiel n = 13, p = 2 sei dieser Beweis noch einmal erläutert: Betrachte
(∗) 13! = 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8 · 9 · 10 · 11 · 12 · 13
1.5. NEGATIVE ZAHLEN
27
13
Es ist
= 6 die Anzahl der Faktoren, die durch 2 teilbar sind, d.h der Zahlen 2, 4, 6, 8, 10, 12
2
(Die anderen
Faktoren haben nicht den Primfaktor 2). Aus den Zahlen 2, 4, 6, 8, 10, 12 zähle
13
ich mit
= 6 zunächst nur je einmal den Primfaktor 2. Die Zahlen 2, 6, 10 sind damit
2
13
erledigt“, da sie den Primfaktor 2 nur einmal haben.
= 3 ist die Anzahl der Faktoren
”
22
13
2
aus (∗), die durch 2 teilbar sind, d.h. der Zahlen 4, 8, 12. Aus diesen zähle ich mit
=3
22
13
jetzt je einen zweiten Primfaktor 2. Es ist
= 1. D.h. es gibt in (∗) genau einen Faktor,
23
13
3
nämlich 8, der durch 2 teilbar ist. Dessen ‘dritten’ Primfaktor 2 zähle ich mit 3 = 1.
2
13
Für k ≥ 4 ist k = 0 und es ist auch keiner der Faktoren aus (∗) durch 2k mit k ≥ 4 teilbar.
2
13
13
13
Die Summe
+ 2 + 3 = 6 + 3 + 1 zählt
2
2
2
aus den Zahlen 2, 4, 6, 8, 10, 12 je einmal den Primfaktor 2, dazu
aus den Zahlen 4, 8, 12 je ein zweites Mal den Primfaktor 2 und dazu schließlich
aus der Zahl 8 ein drittes Mal den Primfaktor 2.
Ich hoffe, Du siehst, dass auf diese Weise jeder Primfaktor 2 in einer Primfaktorzerlegung aller
Faktoren aus (∗) genau einmal erwischt wird.
AUFGABEN
1. Löse die folgenden Gleichungen, oder zeige, dass es in dem einen oder anderen Fall nicht
möglich ist:
4
2
− 16
+ 76
3
3
=
1
,
1
7
1 = 1
3
−
+
4
x
6
x
2. Zwei Menschen wandern einander auf einer geraden Straße entgegen. Der eine startet
23 km
in A und wandert mit einer Geschwindigkeit von
. Der zweite startet im 19,5 km
6 h
entfernten B eine halbe Stunde später als der erste und wandert mit der Geschwindigkeit
21 km
. Wann und wo treffen sich die beiden?
4 h
3. Seien p1 , . . . , pn verschiedene Primzahlen mit n ≥ 2. Zeige: Der Nenner von
n
X
1
a :=
p
j=1 j
in der gekürzten Form ist p1 · · · pn . (D.h. nach erfolgter Addition der auf den kleinsten
gemeinsamen Nenner gebrachten Summanden kann man nicht kürzen.) Insbesondere gilt
a∈
/ Z. (Wenn Du die erste Aussage nicht sofort beweisen kannst, zeige zunächst die letzte.
Ist p1 · · · pn−1 a ∈ Z?)
28
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
4. Zeige: Für n ≥ 2 ist a :=
n
X
1
keine ganze Zahl. (Tipp: Sei m das kleinste gemeinsame
k
k=2
Vielfache aller Nenner. Was gilt für am/2 ? Betrachte die größte 2-Potenz unter den
Nennern.)
n
X
1
5. Zeige: Für n ≥ 2 ist a :=
keine ganze Zahl.
k!
k=2
6. Opa“, rief Peter Opapa! Wie alt wirst Du in 11 Tagen?“
”
”
Opa fühlte sich in seinem Mittagsnickerchen gestört und antwortete unwirsch: Na, das
”
weißt Du doch! Sechsundsechzig.“
Aber Opa, weißt Du auch, was herauskommt, wenn man eins und zwei und drei und so
”
weiter bis elf zusammenzählt?“
Na, lass mal sehen. Also elf mal zwölf, geteilt durch zwei macht sechsundsechzig, in der
”
Tat.“
Siehst du? Aber Du solltest doch zusammenzählen und nicht malnehmen und teilen.
”
Warum hast Du denn das gemacht?“
Um Zeit zu sparen. Sieh mal her! Ich denke mir die Zahlen von eins bis elf hingeschrieben,
”
und dann noch einmal darunter in umgekehrter Reihenfolge:
1 2 3 4 5 6 7 8 9 10 11
11 10 9 8 7 6 5 4 3 2 1
Wenn du je zwei Zahlen, die übereinander stehen, zusammenzählst, was kommt dann
heraus?“
Zwölf, Opa. Und zusammen bekomme ich elf mal zwölf. Dann muss ich aber noch durch
”
zwei teilen,“ sprudelte Peter immer hastiger hervor weil ich ja jede Zahl zweimal hinge”
schrieben habe. Toll!“
Da grinste der Opa, und Peter dachte: Opa ist ja wieder ganz wirsch. Na klar, wenn
”
er mit seiner Mathe angeben kann!“ Mit dieser feinen psychologischen Erkenntnis lag er
nicht ganz falsch.
P
Deine Aufgabe ist nun, für ganze Zahlen x, y mit x > y die Summe xk=y k in eine andere
Form zu bringen!
7. Bestimme die Summe der ersten n ungeraden natürlichen Zahlen, d.h.
n
X
(2k − 1)
k=1
◦
•
◦
◦
◦
• •
• •
◦
◦
◦
◦
◦
• • •
• • •
• • •
◦
◦
◦
◦
◦
◦
◦
1.5. NEGATIVE ZAHLEN
29
8. Seien a, b ganze Zahlen. Bestimme die (eindeutige) Lösung des folgenden linearen Gleichungssystems im Bereich Q der rationalen Zahlen.
x+y =a
x−y =b
Offenbar ist die Lösung genau dann ganzzahlig, wenn entweder a und b beide gerade oder
a und b beide ungerade sind.
9. Jede ganze Zahl ist trivialerweise eine Summe von zwei oder mehr aufeinander folgenden
ganzen Zahlen. Z.B. ist 2 = −1+0+1+2 (und 0 =?). Hingegen ist nicht jede positive ganze
Zahl eine Summe von zwei oder mehr aufeinanderfolgenden positiven ganzen Zahlen. Zum
Beispiel sind 1, 2, 4, 8 nicht von dieser Art.
Bestimme alle (positiven ganzen) Zahlen n, die sich als Summe von zwei oder mehr
aufeinander folgenden positiven ganzen Zahlen schreiben lassen.
P
(Benutze die beiden vorangehenden Aufgaben! Da n = xk=y k = 21 (x + y)(x − y + 1) und
x > y > 0 sein soll, kommt es darauf an, ob man 2n als Produkt eines geraden und eines
ungeraden Faktors schreiben kann, die beide ≥ 2 sind, nicht wahr?)
10. Ebenfalls mit Aufgabe 7 und 8 kann man folgende Fragen beantworten:
a) Welche ganzen Zahlen kann man als Differenz zweier Quadrate ganzer Zahlen schreiben?
b) Kann eine Gleichung der Form x2 − y 2 = a mit festem a ∈ Z im Bereich der ganzen
Zahlen unendlich viele Lösungen haben? Wie ist es im Bereich der reellen Zahlen?
d) Welche ganzen Zahlen sind von der Form
x2 + y 2 − z 2 (x, y, z ∈ Z) ?
e) (Am 6. Dezember zu lösen.) Frau Nicole Niklas wurde von ihrem Sohn Kolja gefragt,
wie alt sie sei. Aus verständlichen Gründen gab sie nur eine verschlüsselte Antwort: Wenn
Du die vierte Potenz meines Alters von der vierten Potenz des Alters Deines Vaters Klaus
abziehst, erhältst Du die Zahl 1606160. Wie alt sind Klaus uns Nicole Niklas? (Mit dem
Alter ist jeweils eine ganze Anzahl von Jahren gemeint.) Natürlich darfst Du zur Lösung
dieser Aufgabe einen Taschenrechner benutzen. Ein ziemlich primitiver reicht.
a
a
11. Vereinfache
+
.
(k + 1)!(n − k − 1)! k!(n − k)!
12. Gib systematisch alle Tripel (a, b, c) ganzer Zahlen an, für die folgendes gilt:
0 < a ≤ b ≤ c und
1 1 1
+ + ∈Z
a b c
13. Seien a1 , . . . , an ganze Zahlen und x eine rationale Zahl mit xn +a1 xn−1 +· · ·+an−1 x+an =
0. Zeige, dass x ganz ist. (Wichtig ist dabei, dass der Koeffizient von xn gleich 1 ist. Im
Bereich Z kann man ja nicht immer durch den Koeffizienten von xn dividieren!)
mr
1
14. Sei n > 1 eine ganze Zahl und n = pm
1 · · · pr ihre Primfaktorzerlegung mit untereinander
verschiedenen Primzahlen pi . Wieviele (positive) Teiler hat n?
30
1.6
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Vollständige Induktion
1.6.1 Ein sehr mächtiges Beweismittel für Aussagen, die man für alle natürlichen Zahlen beweisen möchte, ist die vollständige Induktion.
Sei A(x) eine Aussage über natürliche Zahlen x mit folgenden beiden Eigenschaften:
(i) (Induktionsanfang) A(0) ist richtig,
(ii) (Induktionsschritt) für alle n ∈ N folgt A(n + 1) aus A(n).
Dann gilt A(n) für alle n ∈ N.
Denn angenommen, ich soll A(m) für ein beliebiges (festes) m beweisen.
Wegen (i) gilt die Aussage A(0). Wegen (ii) folgt hieraus A(1); wieder wegen (ii) folgt (aus der
letzten Aussage) A(2); wieder wegen (ii) folgt A(3); und so weiter, bis ich bei A(m) angelangt
bin.
Statt direkt A(n) für alle n zu zeigen, muss man nur für alle n die bedingte Aussage
A(n) ⇒ A(n + 1)
beweisen. Und das ist häufig einfacher.
Der Name ‘Vollständige Induktion’ kommt folgendermaßen zustande: Ein Gesetz durch Induktion zu begründen, heißt, es aus Einzelfällen abzuleiten. So müssen es die Naturwissenschaftler tun.
‘Vollständige’ Induktion bedeutet, ein Gesetz zu beweisen, indem man es für jeden Einzelfall zeigt.
(Allerdings lässt man das Wort ‘vollständig’ aus Faulheit meist weg.)
Sollte Dir das Ganze etwas rätselhaft erscheinen, arbeite die folgenden Beispiele durch!
Beispiele 1.6.2 a) Wir beweisen, dass
n
X
2k := 20 + 21 + · · · + 2n = 2n+1 − 1 ist.
k=0
(Dies ist eine spezielle geometrische Reihe. Allgemeine geometrische Reihen werden später behandelt.)
Induktionsanfang: n = 0. Wir müssen
0
X
2k = 20+1 − 1 beweisen.
k=0
Nun, beide Seiten sind gleich 1.
Induktionsschritt: Wir müssen
n
X
k=0
k
n+1
2 =2
− 1 =⇒
n+1
X
k=0
2k = 2(n+1)+1 − 1 beweisen.
1.6. VOLLSTÄNDIGE INDUKTION
D.h. wir müssen
n+1
X
k
(n+1)+1
2 =2
−1 beweisen und dürfen dazu
k=0
31
n
X
2k = 2n+1 −1 voraussetzen.
k=0
Aus letzterer Gleichung folgt
n+1
X
k=0
k
2 =
n
X
2k + 2n+1 = 2n+1 − 1 + 2n+1 = 2 · 2n+1 − 1 = 2n+1+1 − 1.
k=0
b) Wir beweisen die ‘Bernoullische Ungleichung’
(1 + a)n ≥ 1 + na für alle natürliche Zahlen n und rationale a ≥ −1 .
Der Induktionsanfang n = 0 ist klar.
Wir beweisen die Ungleichung für n + 1 unter der Voraussetzung, dass sie für n gelte:
(1 + a)n+1 = (1 + a)n (1 + a) ≥ (1 + na)(1 + a) = 1 + (n + 1)a + na2 ≥ 1 + (n + 1)a .
Dabei haben wir benutzt, dass wegen der Voraussetzung (1 + a) ≥ 0 ist und dass a2 und n auch
beide ≥ 0 sind.
(Diese Ungleichung gilt natürlich auch für beliebige reelle Zahlen a ≥ −1. Sie gilt auch für
reelle Exponenten, die ≥ 1 oder ≤ 0 sind. Falls a ≥ −1 und 0 < r < 1 ist, gilt (1 + a)r ≤ 1 + ra.)
c) Eine hübsche Anwendung des Induktionsprinzips ist der Beweis, dass man in dem – im
folgenden beschriebenen – Spiel (Puzzle) der Türme von Hanoi“ (Lucas) immer zum Ziele
”
kommen kann.
Das Spiel besteht aus einem Stapel von n kreisrunden Scheiben, die gleich dick sind, aber
paarweise verschiedene Durchmesser haben. Sie liegen der Größe nach aufeinander, die größte
Scheibe unten, auf einem von 3 Spielfeldern.
Die Aufgabe ist nun, diesen Stapel in mehreren Schritten auf ein anderes der drei Spielfelder auf
folgende Weise zu bringen: Bei jedem Schritt ist eine Scheibe auf ein anderes Spielfeld bzw. auf
einen dort bereits befindlichen Stapel zu legen, ohne dass jemals eine größere Scheibe auf einer
kleineren zu liegen kommt. (In den praktischen Ausführungen dieses Spiels haben in der Regel
die Scheiben in der Mitte ein Loch und werden durch drei senkrecht stehende Stäbe fixiert.)
Beim Beweis verwende man Induktion nach n. Oder man schließe mit Induktion nach k, wobei
die Aussage A(k) bedeuten soll: Man kann die k obersten Scheiben des Ausgangsstapels auf
eines der beiden anderen Spielfelder den Spielregeln gemäß stapeln.
d) Vielleicht hast Du den Wunsch, die häufig benutzte Möglichkeit der Division mit Rest exakt
zu beweisen. Zu n, m ∈ N mit m > 0 gibt es eindeutig bestimmte q, r ∈ N mit n = qm + r und
r < m.
Verwende Induktion nach n, wobei der Fall n = 0 trivial ist. Induktionschritt. Nimm n = qm+r
mit r < m an. Dann ist n + 1 = qm + r + 1. Unterscheide zwei Fälle: 1. r < m − 1. Dann ist
r + 1 der neue Rest. 2. r = m − 1. Dann ist n + 1 = qm + m = (q + 1)m + 0.
32
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Zur Eindeutigkeit: Sei n = qm + r = q 0 m + r0 (mit r, r0 < m) und etwa r ≤ r0 . Dann ist
r0 − r = n − n + qm − q 0 m = (q − q 0 )m. Also gilt 0 ≤ r0 − r < m − 0 und andererseits ist r0 − r
durch m teilbar. Das ist aber nur möglich, wenn r0 − r = 0 ist. Dann ist qm = q 0 m, also q = q 0 ,
da m > 0 gilt.
Bemerkungen 1.6.3 Das Induktionsprinzip wird häufig etwas variiert.
a) Wenn man mit dem Induktionsprinzip eine Aussage A(x) nur für alle natürlichen Zahlen
zeigen will, die ≥ einer gewissen Zahl k sind (etwa weil A(n) für n < k falsch ist oder keinen Sinn
hat), so kann man als Induktionsanfang die Aussage A(k) beweisen und dann die Implikation
A(n) ⇒ A(n + 1) für alle n ≥ k zeigen. (Formal kann man diese Methode auf das erstgenannte
Induktionsprinzip zurückführen, indem man dieses auf die Aussage B(x) := A(x+k) anwendet.)
b) Häufig benutzt man die vollständige Induktion in der Art, dass man die Aussage A(n + 1)
aus allen A(k) mit k ≤ n ableitet.
(Auch dies lässt sich formal auf das o.a. Induktionsprinzip zurückführen, indem man dieses auf
die Aussage B anwendet, wo die Gültigkeit von B(n) bedeuten soll, dass A(k) für alle k ≤ n
gilt.)
1.6.4 Weitere Beispiele. a) Wir zeigen mit Induktion
n
X
n(n + 1)
n(n + 1)
1 + 2 + ··· + n =
d.h.
k=
für alle n ∈ N1 .
2
2
k=1
Du kennst das von Aufgabe 6 des letzten Abschnittes. Aber es sei hier zur Übung noch einmal
mit Induktion nach n gezeigt.
Wähle n = 1 als Induktionsanfang. Wir haben 1 = 1·2
zu zeigen. Kein Problem!
2
Pn
Pn+1
Induktionsschluss: Unter der Voraussetzung k=1 k = n(n+1)
zeigen
wir
k=1 k =
2
(n+1)(n+2)
.
2
Dazu rechnen wir
n+1
X
k=1
k=
n
X
k + (n + 1) =
k=1
n(n + 1)
n(n + 1) + 2(n + 1)
(n + 2)(n + 1)
+n+1=
=
2
2
2
Wenn wir jetzt noch die Kommutativität der Multiplikation nutzen, sind wir fertig.
b) Wir zeigen
n
X
n2 (n + 1)2
n2 (n + 1)2
3
1 + 2 + ··· + n =
d.h.
k =
4
4
k=1
3
3
3
für alle ganzen n ≥ 1. Wieder benutzen wir Induktion nach n. Der Induktionsanfang ist wieder
trivial.
Jetzt rechnen wir
n+1
X
k=1
3
k =
n
X
k=1
k 3 + (n + 1)3 =
n2 (n + 1)2
+ (n + 1)3 =
4
1.6. VOLLSTÄNDIGE INDUKTION
33
n2 (n + 1)2 + 4(n + 1)3
(n2 + 4(n + 1))(n + 1)2
(n + 1)2 (n + 2)2
=
=
4
4
4
Fertig!
c) Was kann man aus a) und b) sofort schließen? Na klar!
n
X
k=1
k3 =
n(n + 1)
2
2
=
n
X
!2
k
k=1
oder schön ausgeschrieben:
13 + 23 + · · · + n3 = (1 + 2 + · · · + n)2 .
Na, wenn das nichts ist?
1.6.5 Peano-Axiome. Will man die natürlichen Zahlen axiomatisch beschreiben, so wird aus
dem Induktionsprinzip ein Axiom.
Die Menge der natürlichen Zahlen kann man folgendermaßen axiomatisch beschreiben:
N ist eine Menge zusammen mit einem ausgezeichneten Element 0 ∈ N und einer Abbildung
N → N, n 7→ n0 derart, dass folgendes gilt:
(i) n0 = m0 ⇐⇒ n = m
(ii) 0 6= n0 für alle n ∈ N
Ist M eine Teilmenge von N mit den Eigenschaften 0 ∈ N und [n ∈ M ⇒ n0 ∈ M ], so ist
M = N.
Bemerkung 1.6.6 Hier wurde n0 (der Nachfolger von n) anstelle von n + 1 geschrieben, da
die Addition erst im Nachhinein definiert werden soll, und zwar so:
Es sei n + 0 := n und n + m0 = (n + m)0 . Dadurch wird die Addition eindeutig definiert.
Will man z.B. die Assoziativität der Addition zeigen, also (n + m) + k = n + (m + k), so
argumentiert man mit Induktion nach k.
Sei M die Menge der k, für welche (n + m) + k = n + (m + k) stimmt.
Induktionsanfang: Die Behauptung 0 ∈ M , d.h. (n + m) + 0 = n + (m + 0) ist klar, da nach
Definition (n + m) + 0 = n + m und m + 0 = m ist.
Induktionsschluss: Wir setzen k ∈ M , d.h. (n+m)+k = n+(m+k) voraus; es folgt (n+m)+k 0 =
((n + m) + k)0 = (n + (m + k))0 = n + (m + k)0 = n + (m + k 0 ), also k 0 ∈ M . –
Im Nachhinein wird auch erst 1 = 00 definiert. Die Multiplikation kann man dann auf folgende
Weise definieren: n · 0 = 0, n · m0 = n · m + n. (Damit siehst Du etwa: n · 1 = n · 00 = n · 0 + n =
0 + n = n.)
34
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
AUFGABEN
n(n + 1)(2n + 1)
6
n
X
n(n + 1)(2n + 13)
b) Zeige:
k(k + 4) =
.
6
k=1
1. a) Zeige 12 + 22 + · · · + n2 =
2. Zeige, dass man n verschiedene Gegenstände, etwa die Zahlen 1, 2, 3, . . . , n auf n! verschiedene Weisen in eine Reihenfolge bringen kann.
3. Zeige:
n
X
k · k! = (n + 1)! − 1.
k=0
(Dies geschieht mit vollständiger Induktion ohne Mühe. Wie man allerdings auf diese
Identität gekommen ist, ist dem Beweis nicht anzusehen.)
4. Zeige: Für jedes n ∈ N ist 2 · 53n+1 + 4n durch 11 teilbar, d.h. es gibt zu jedem n ein (von
n abhängiges) k ∈ N mit 11 · k = 2 · 53n+1 + 4n . (Auch hier führt ein Induktionsbeweis zum
Ziele, ohne dass Du leicht erkennen kannst, wie ich auf solch eine Behauptung überhaupt
gekommen bin.)
Bemerkung: Du magst die zu beweisende Behauptung, dass 2·53n+1 +4n immer durch 11
teilbar sei, nicht gerade naheliegend und vielleicht auch uninteressant finden. Du solltest
Dich trotzdem zur Übung an dem Beweis versuchen. Er ist nämlich kein automatischer
Beweis, andererseits auch nicht allzu schwer.
k
5. Zeige durch Induktion nach k: Für jedes ganze k ≥ 1 und jede ungerade Zahl u ist u2 − 1
k
k
durch 2k+2 teilbar. (Erinnere Dich, dass nach Definition u2 = u(2 ) ist.) Beachte: Für
k = 0 stimmt die Aussage nicht, und das wird ja auch nicht behauptet.
√
6. In dieser Aufgabe benutzen wir die Zahl 5. Diese ist nicht rational! Aber ich nehme an,
dass Du trotzdem in der Lage bist, mit ihr umzugehen. Da sie dazu benutzt wird, ganze
Zahlen auszurechnen, sollte Dir dies ein Ansporn sein, sich mit allgemeinen reellen Zahlen
zu beschäftigen.
Die Folge (Fn ) der Fibonacci-Zahlen ist folgendermaßen definiert:
F1 := F2 := 1,
Zeige:
1
Fn = √
5
Fn := Fn−2 + Fn−1 für n ≥ 3.
√ !n
1+ 5
−
2
√ !n !
1− 5
2
(1.5)
Setze dazu Gn gleich der rechten Seite der behaupteten Gleichung, ferner
√
√
1+ 5
1− 5
u :=
,
v :=
2
2
u und v erfüllen u2 = u + 1 und v 2 = v + 1. Berechne dann Gn−2 + Gn−1 und ersetze darin
u + 1 durch u2 , sowie v + 1 durch v 2 . Du erhältst damit Gn . Schließlich musst Du noch
G1 = G2 = 1 nachprüfen.
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
35
7. Zur effizienten Berechnung der Fn mittels der Formel 1.5 benötigt man nur den ersten
Summanden, da
√ !n 1
1
−
5 1
<
√
2
5
2
ist,
8. Definiere H1 = a, H2 = b. Hn = Hn−1 + Hn−2 . Wie lässt sich Hn mit Hilfe der FibonacciZahlen (sowie a und b) ausdrücken?
1.7
Größter gemeinsamer Teiler, Euklidischer Algorithmus
Angenommen, Du bist im Jahr 1987 geboren. Da es mir (und auch Dir?) nun mal die Zahlen
7 und 17 besonders angetan haben, wollen wir versuchen, diese Zahl 1987als Summe eines
Vielfachen von 7 und eines Vielfachen von 17, d.h in der Form 7a + 17b mit ganzen Zahlen a
und b darzustellen. Dazu versuchen wir zunächst die 1 so zu schreiben. Kein Problem: denn es
gilt ja 7 · 5 + 17 · (−2) = 1. (Dass hierbei nicht beide Faktoren a und b positiv sein können, ist
ja klar.)
Dann ist aber auch 1987 = (7 · 5 + 17 · (−2)) · 1987 = 7 · (5 · 1987) + 17 · (−2 · 1987), also
1987 = 7 · 9935 + 17 · (−3974) (∗)
Weil 1987 groß genug ist, können wir hier auch positive ganze Faktoren a0 , b0 mit 1987 = 7a0 +17b0
finden. Das tun wir wie folgt: Für jede ganze Zahl n ist sicher
0 = 7 · (−17n) + 17 · (7n)
(**)
Nun ist 3974/7 < 568 (knapp) und deshalb 7 · 568 > 3974. Mit der Wahl n = 568 addieren wir
(∗∗) zu (∗) und erhalten
1987 = 7 · (9935 − 17 · 568) + 17 · (−3974 + 7 · 568) = 7 · 279 + 17 · 2
Um es gleich zu sagen, ich möchte in diesem Abschnitt keineswegs eine mysteriöse Eigenschaft
der Zahlen 7 und 17 studieren, sondern Dir zeigen, dass es zu beliebigen ganzen Zahlen m, n,
die teilerfremd sind, d.h. keinen gemeinsamen Primfaktor haben, ganze Zahlen a und b mit
ma + nb = 1 gibt. Für größere natürliche Zahlen k gibt es dann auch natürliche Zahlen a0 , b0 mit
ma0 + nb0 = k. Diese Aussage ist aber nicht so wichtig, weshalb ich ihren Beweis als Aufgabe
stelle.
36
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Definition 1.7.1 Seien a, b ∈ Z. Man sagt, a ist ein Teiler von b oder a teilt b, und schreibt
a|b, wenn es ein c ∈ Z mit a · c = b gibt. Wenn a kein Teiler von b ist, schreiben wir a - b.
Beachte, dass die Relation ‘|’ nicht symmetrisch ist. Beispielsweise gilt 2|6, aber 6 - 2. Auch
gibt es (viele) Zahlenpaare a, b, für die weder a|b noch b|a gilt, z.B. a = 6, b = 10.
1.7.2 Grundlegende Eigenschaften von |“: a) Für alle a ∈ Z gilt 1|a, − 1|a und a|0.
”
Du hast Dich nicht verlesen, da a · 0 = 0 ist. In der obigen Definition ist c = 0 nicht ausgeschlossen.
b) a|b ⇐⇒ |a| |b|.
(Dabei ist |a|, der Betrag von a, als die größere der beiden Zahlen a, −a definiert.)
c) a|b, b|c ⇒ a|c.
d) a|b ⇒ a|bb0 für eine beliebige ganze Zahl b0 ,
d’) a|b, a|c ⇒ a|b + c, also insgesamt
d”) a|b, a|c ⇒ a|bb0 + cc0 für beliebige ganze Zahlen b0 , c0 .
e) a|b, a - c ⇒ a - bb0 + c für jede ganze Zahl b0 .
Sonst wäre a|bb0 + c − bb0 , wo die rechte Zahl gleich c ist.
f) Sind a, b > 0 und gilt a|b, so ist a ≤ b. (Aber natürlich nicht umgekehrt!)
Ich habe einen großen Strich geschrieben, wo man den den Strich, der für ‘teilt’ steht von den
‘Betragsstrichen’ unterscheiden möchte.
Definition 1.7.3 Seien a, b ∈ Z. Unter einem größten gemeinsamen Teiler von a, b versteht man eine natürliche Zahl d mit folgenden Eigenschaften: (i) d|a, d|b ; (ii) c|a, c|b =⇒
c|d .
Bemerkungen 1.7.4 a) Wenn es einen größten gemeinsamen Teiler von a, b gibt, ist dieser
eindeutig bestimmt. Seien nämlich d, d0 solche, so muss d|d0 und d0 |d gelten. Da wir listiger
Weise vorgeschrieben haben, dass d, d0 ≥ 0 sein sollen, folgt die Gleichheit d = d0 . Falls a, b ∈ Z
einen größten gemeinsamen Teiler haben bezeichnen wir ihn mit ggT(a, b)
b) ggT(a, 0) = |a|. Insbesondere ist ggT(0, 0) = 0. (Die Bezeichnung ‘größter gemeinsamer
Teiler’ ist im letzten Fall nicht wörtlich zu verstehen.)
1.7.5 Du hast sicher in der Schule gelernt, wie man den größten gemeinsamen Teiler zweier
ganzer Zahlen findet, wenn man deren Primfaktorzerlegung kennt.
Z.B. ist ggT(12, 90) = ggT(22 · 31 · 50 , 21 · 32 · 51 ) = 21 · 31 · 50 = 6
M in(r ,s )
M in(rn ,sn )
1 1
· · · pn
Allgemein gilt ggT(±pr11 · · · prnn , ± ps11 · · · psnn ) = p1
die ersten n Primzahlen, und die Exponenten dürfen 0 sein.
. Dabei sind p1 , . . . , pn
Eine Primfaktorzerlegung herzustellen ist bei größeren Zahlen bekanntlich ziemlich zeitaufwändig. Deshalb sollst Du hier eine schnellere Methode kennenlernen, den ggT zu berechnen,
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
37
von der bereits Euklid wusste. Da diese für jedes Paar ganzer Zahlen funktioniert, hat man damit natürlich auch die Existenz des ggT bewiesen.
Darüberhinaus werden wir mit diesem Verfahren zu a, b ganze Zahlen a0 , b0 bestimmen, derart
dass aa0 + bb0 = ggT(a, b) gilt.
Der Euklidische Algorithmus
Ein schnelles Verfahren zur Berechnung des größten gemeinsamen Teilers.
Hilfsbemerkung: In Z gelte a = bc + d. Dann ist jeder gemeinsame Teiler von a und b
auch ein solcher von b und d und umgekehrt. D.h. für t ∈ Z hat man:
t|a, t|b ⇐⇒ t|b, t|d.
Der Algorithmus läuft wie folgt: Seien a, b ∈ Z − {0}. (ggT(a, 0) = |a|.) Setze r0 := a, r1 = b.
Dividiere mit Rest nach und nach:
r 0 = r 1 q1 + r 2
r 1 = r 2 q2 + r 3
r 2 = r 3 q3 + r 4
usw.
mit
mit
mit
|r2 | < |r1 |
|r3 | < |r2 |
|r4 | < |r3 |
Solange ri 6= 0 ist, kann man qi , ri+1 finden mit
ri−1 = ri qi + ri+1
|ri+1 | < |ri |.
und
Da aber |r1 | > |r2 | > . . . > |ri | > |ri+1 | usw. gilt, muss zweifellos für ein n der Rest rn+1 gleich
0 sein. Das Verfahren bricht also ab:
rn−2 = rn−1 qn−1 + rn
rn−1 = rn qn + 0.
Behauptung:
mit
0 < |rn | < |rn−1 |
|rn | = ggT(a, b).
Wegen obiger Hilfsbemerkung hat man für t ∈ Z die Äquivalenzen
t|r0 , r1 ⇐⇒ t|r1 , r2 ⇐⇒ t|r2 , r3 ⇐⇒ . . . ⇐⇒ t|rn−1 , rn ⇐⇒ t|rn , 0.
Unter Beachtung von a = r0 , b = r1 folgt ggT(a, b) = ggT(rn , 0) = |rn |.
Man bekommt mit obigem Algorithmus auch eine Darstellung von rn in der Form aa0 + bb0 .
Einen Ausdruck aa0 + bb0 nennt man eine Linearkombination von a und b.
Hilfsbemerkung: Seien c = aa1 + bb1 und d = aa2 + bb2 als Linearkombinationen von
a und b gegeben. Dann erhält man jede Linearkombination cc0 + dd0 von c und d explizit als
Linearkombination von a und b; es ist nämlich cc0 + dd0 = (aa1 + bb1 )c0 + (aa2 + bb2 )d0 =
38
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
a(a1 c0 + a2 d0 ) + b(b1 c0 + b2 d0 ).
Wir betrachten nun wieder die Gleichungsfolge aus 1.7.5. Zunächst sind r1 = b und r2 = a − bq1
als Linearkombinationen von a und b gegeben. Falls man schon induktiv ri−1 und ri als
Linearkombinationen von a und b gewonnen hat, gewinnt man auch ri+1 als eine solche, da
ri+1 = ri−1 − ri qi gilt. (Manchmal wird diese Methode auch der erweiterte Euklidische
Algorithmus genannt.)
Bemerkung 1.7.6 Wenn man beim euklidischen Algorithmus mit möglichst wenigen Schritten
auskommen will, muss man negative Reste zulassen, um bei jedem Schritt |ri+1 | ≤ |ri |/2 zu
erreichen. (Es muss zugestanden werden, dass der Gewinn beim Gebrauch negativer Reste
nicht sehr groß ist. Gilt nämlich a > b > 0 und a = bq + r mit 0 ≤ r < b, so ist immer noch
a ≥ b + r > r + r, also r < a/2, was nicht viel schlechter als |r| ≤ b/2 ist.)
Definition 1.7.7 a, b ∈ Z heißen (zueinander) teilerfremd, wenn ggT(a, b) = 1 ist. (Man
benutzt auch die Sprechweise, dass in diesem Fall a zu b teilerfremd ist.)
Bemerkungen 1.7.8 a) Natürlich sind a, b genau dann teilerfremd, wenn sie keinen gemeinsamen Primfaktor besitzen.
b) Die ganzen Zahlen a, b sind teilerfremd genau dann, wenn es a0 und b0 in Z mit aa0 + bb0 = 1
gibt. Denn, wenn a und b teilerfremd sind, liefert der euklidische Algorithmus die gesuchten
a0 , b0 . Wenn umgekehrt t ein Teiler von a und von b ist, ist t auch ein Teiler von aa0 + bb0 = 1 .
c) Wenn a, b teilerfremd sind, gibt es für alle c ∈ Z Zahlen a, b ∈ Z mit aa + bb = c.
(c = 1 · c = a(a0 c) + b(b0 c).)
Wir erhalten einen neuen Beweis von Euklids Lemma.
Lemma 1.7.9 Seien p eine Primzahl, a, b ∈ Z und p|ab. Dann teilt p mindestens eine der
beiden Zahlen a, b.
Beweis: Wenn p|b gilt, sind wir glücklich. Andernfalls sind b, p teilerfremd und es gibt deshalb
c, d ∈ Z mit bc + pd = 1. Dann gilt p | abc + apd, wo abc + apd = a ist.
Erinnere Dich, dass aus Euklids Lemma ziemlich direkt die Eindeutigkeit der Primfaktorzerlegung folgt.
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
39
AUFGABEN
1. Welche Massen kannst Du mit einer Balkenwaage wiegen, wenn Du beliebig viele Gewichte
von 70g und von 125g zur Verfügung hast und in beide Waagschalen Gewichte legen
darfst?
2. Zwei große, etwa halbvolle Badewannen stehen nebeneinander. Kannst Du mit einem
7- und einem 19-Litermaß durch Hin- und Hergießen (der vollen Maße) erreichen, dass
schließlich das Wasser der einen Badewanne um einen Liter vermehrt, das der anderen
um einen Liter vermindert ist?
3. Seien a, b teilerfremde ganze Zahlen. Bestimme alle ganzen Zahlen x, y mit ax + by = 0.
4. Sei ggT(a, b) = 1. Dann gibt es ja a0 , b0 ∈ Z mit aa0 + bb0 = 1.
Überlege, auf welche (einfache) Weise man a0 und b0 verändern kann, ohne dass diese
Gleichung an Gültigkeit verliert.
Kann man zum Beispiel a0 ≥ 0 erreichen? (Dies geht, wenn b 6= 0 ist.) Man kann sämtliche
a0 , b0 mit aa0 + bb0 = 1 bestimmen. Vgl. Aufgabe 3.
5. Seien a, b, c ∈ N1 , ggT(a, b) = 1 und c ≥ (a − 1)(b − 1).
a) Zeige: Es gibt a0 , b0 ∈ N(!) mit c = aa0 + bb0 . D.h. c ist eine Linearkombination mit
nicht negativen Koeffizienten.
b) Zeige: d = ab−a−b lässt sich nicht in der Form aa0 +bb0 mit natürlichen a0 , b0 schreiben.
6. Schreibe die Jahreszahl Deiner Geburt in der Form n · 30 + m · 49 mit n, m ∈ N.
7. Mach Dir Gedanken darüber, wie viele Divisionen mit Rest Du ausführen musst, um den
ggT zweier natürlicher Zahlen zu bestimmen. Unterscheide dabei, ob Du nur nichtnegative
oder auch negative Reste zulassen willst. Im ersten Fall erhältst Du bei der Division von
26 durch 7 die Darstellung 26 = 7 · 3 + 5, im zweiten Fall darfst Du auch 26 = 7 · 4 − 2
schreiben.
a) Sind a, b > 0 ganz und a ≥ b, so schreibe im 1. Fall a = bq + r mit 0 ≤ r < b. Dann ist
q ≥ 1, also a ≥ b + r > r + r und deshalb schließlich a > 2r. Für die ri im euklidischen
Algorithmus erhält man somit ri > 2ri+2 . Das bedeutet: Ist a ≤ 2k so benötigt man
weniger als 2k Schritte.
. Ist also
b) Sind a, b 6= 0 ganz und |a| ≥ |b|, so schreibe im 2. Fall a = bq + r mit |r| ≤ |b|
2
k
|b| ≤ 2 , so benötigt man höchstens k Schritte. Das bedeutet gegenüber a) eine leichte
Verbesserung.
8. Seien m, n ∈ N1 zueinander teilerfremd. Beweise:
a) Es gibt ein k ∈ N mit m|k und n|k + 1. (Benutze Aufgabe 4.)
b) Die Gleichung xm + y m = z n hat eine Lösung in natürlichen Zahlen > 0.
(Löse zunächst xk + y k = z k+1 .)
(Zu a) Es gibt natürliche Zahlen m0 , n0 mit −mm0 + nn0 = 1 also nn0 = mm0 + 1. Setze
k = mm0 .
40
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Beachte: Wenn es zu m, n ∈ Z eine ganze Zahl k mit m|k und n|k + 1 gibt, sind m, n
zueinander teilerfremd.) (Zu b) 2k + 2k = 2k+1 . Hat man also m0 , n0 mit nn0 = mm0 + 1
0
0
0
gefunden, so gilt (2m )m + (2m )m = (2n )n .)
9. a) Bestimme ggT(11 111 111, 111 111 111 111 111). b) Allgemeiner: Bestimme
ggT(1.....1, 1.....1) ,
wenn die erste Zahl m, die zweite n Stellen hat.
c) Noch allgemeiner: Bestimme
ggT
n−1
X
i=0
di ,
m−1
X
!
di
für n, m, d ∈ N1 .
i=0
10. Berechne ggT(408277 , 222191) und stelle diesen als Linearkombination dieser beiden
Zahlen da.
Wenn Du einen Computer die Primfaktorzerlegung dieser beiden Zahlen bestimmen lässt,
bringst Du Dich um die Erkenntnis, wie effektiv die Berechnung des ggT mit Hilfe des
euklidischen Algorithmus ist. Gut wäre es natürlich, Du könntest einem Computer den
euklidischen Algorithmus beibringen.
m
n
1
=
+ .
225
9
25
b) Allgemeiner seien a, b zueinander teilerfremde Zahlen > 0. Wie kann man ganze m, n
bestimmen, so dass
m n
1
=
+ gilt?
ab
a
b
11. a) Finde ganze Zahlen m, n mit
12. Sei m ∈ N2 und M die Menge aller positiven Teiler von m (einschließlich 1 und m). Auf
der Menge M kann man folgendes Spiel für 2 Spieler spielen:
Abwechselnd belegen die Spieler je eine der Zahlen aus M mit einem Spielstein unter
Beachtung folgender Regel: Ist bereits d ∈ M belegt und gilt d0 |d, so darf d0 nicht mehr
belegt werden.
Wer m belegt, hat verloren.
Zeige: Es gibt eine Gewinnstrategie für den beginnenden Spieler. (D.h. er hat die Möglichkeit zu gewinnen, was auch immer der andere Spieler für Züge macht.)
(Hinweis: Eine besondere Rolle spielt die Zahl 1. Allgemeiner als angegeben, darf M eine beliebige endliche teilweise – d.h. nicht notwendig total – geordnete Menge mit einem
kleinsten und einem davon verschiedenen größten Element sein. Ich kenne übrigens keinen
Beweis obiger Behauptung, der eine Gewinnstrategie konkret angibt.)
13. Die Farey-Folge der Ordnung n(≥ 1) ist die nach aufsteigender Größe geordnete Folge
derjenigen rationalen Zahlen a aus dem Intervall [0, 1], d.h. mit 0 ≤ a ≤ 1, deren Nenner
in der Standardform (d.h. gekürzt mit positivem Nenner) ≤ n ist. Z.B. ist die Farey-Folge
der Ordnung 4 die Folge:
0 1 1 1 2 3 1
, , , , , , .
1 4 3 2 3 4 1
1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS
41
Für die Farey-Folge der Ordnung n gilt:
a) Wenn a1 /b1 , a2 /b2 aufeinanderfolgende Glieder dieser Folge in der Standardform sind,
so ist
• 1. a2 b1 − a1 b2 = 1,
• 2. b1 + b2 > n,
• 3. b1 6= b2 im Falle n > 1.
b) Wenn a1 /b1 , a2 /b2 , a3 /b3 drei aufeinanderfolgende Glieder der Farey-Folge (in ihrer
Standardform) sind, so ist a2 /b2 = (a1 + a3 )/(b1 + b3 ). (Der letzte Bruch ist nicht
notwendig gekürzt.)
Um a) und b) zu beweisen, zeige zunächst c) bis e):
c) Aus a1 /b1 < a2 /b2 folgt a1 /b1 < (a1 + a2 )/(b1 + b2 ) < a2 /b2 .
d) Wenn a2 b1 − a1 b2 = 1 ist, gilt auch
(a1 + a2 )b1 − a1 (b1 + b2 ) = 1 und a2 (b1 + b2 ) − (a1 + a2 )b2 = 1.
Sind ai , bi ∈ Z, so folgt also insbesondere: Der Bruch (a1 + a2 )/(b1 + b2 ) ist gekürzt.
e) Aus ai , bi , u, v ∈ Z, bi , v > 0, a2 b1 − a1 b2 = 1 und a1 /b1 < u/v < a2 /b2 folgt v ≥ b1 + b2 .
Anschließend kannst Du die Farey-Folge der Ordnung n auf folgende Weise konstruieren:
Beginne mit 0/1, 1/1. Ist n > 1, füge 1/2 = (0 + 1)/(1 + 1) ein und fahre so fort.
Nämlich, solange es in Deiner Folge noch zwei aufeinanderfolgende Glieder a1 /b1 , a2 /b2
mit b1 + b2 ≤ n gibt, füge (a1 + a2 )/(b1 + b2 ) gemäß c) zwischen ihnen ein.
Für die am Ende erhaltene Folge ist a) 2. offenbar erfüllt, und a) 1. folgt aus d).
Aus a) 1. kannst Du leicht b) folgern. Ferner folgt a) 3. aus den Ungleichungen
a/b < a/(b − 1) < (a + 1)/b für a + 1 < b. Schließlich siehst Du mit e), dass Du die
Farey-Folge der Ordnung n konstruiert hast.
42
KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN
Kapitel 2
Neue Rechenbereiche
2.1
Grundlegende Definitionen
Betrachte dieses Kapitel als Abenteuer! Ich glaube nämlich, Du wirst etwas Neues lernen.
In (1.1.4) haben wir elementare Rechengesetze für die natürlichen Zahlen angegeben. Dann
haben wir die Menge (i.e. Gesamtheit) N der natürlichen Zahlen zur Menge Q der rationalen
Zahlen (die auch negativ sein dürfen) erweitert. Hierin findet sich die Menge Z der ganzen
Zahlen (die auch negativ sein dürfen). Wenn wir noch die Menge der rationalen Zahlen ≥ 0 mit
Q+ bezeichnen, erhalten wir folgendes Schema:
N −→ Z
↓
↓
Q+ −→ Q
(Man kann, um von den natürlichen zu den rationalen Zahlen zu gelangen, sowohl den Weg
über die nicht-negativen rationalen Zahlen, als auch den Weg über die ganzen Zahlen wählen!)
In all diesen Mengen kann man addieren und multiplizieren. Es gibt in ihnen neutrale Elemente
– übrigens immer 0 und 1 – und zu manchen Elementen auch additiv, bzw. multiplikativ Inverse.
Definition 2.1.1 Ein Ring R ist eine Menge zusammen mit zwei Verknüpfungen (Rechenarten) ‘+’ und ‘·’ (Addition und Multiplikation), für welche folgende Regeln gelten:
Assoziativität: a + (b + c) = (a + b) + c und a(bc) = (ab)c
Kommutativität der Addition: a + b = b + a
Distributivität: a(b + c) = ab + ac, (b + c)a = ba + ca
Existenz neutraler Elemente: In R gibt es ein Element 0 mit der Eigenschaft a + 0 = a und
ein Element 1 mit der Eigenschaft 1a = a1 = a
Existenz additiv Inverser: Zu jedem a ∈ R existiert ein Element (−a) (auch einfach −a
geschrieben) mit der Eigenschaft a + (−a) = 0.
Es lohnt sich nicht, den hier definierten algebraischen Begriff ‘Ring’ mit dem alltäglichen (geometrischen) Begriff eines Ringes zu vergleichen.
43
44
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkungen 2.1.2 a) Wie üblich, lässt man den Multiplikationspunkt häufig weg. Und wir
beachten die Konvention ‘Punktrechnung geht vor Strichrechnung’, um Klammern zu sparen.
b) Die neutralen Elemente sind eindeutig bestimmt: Seien etwa 0, 00 neutrale Elemente der
Addition, so ist 0 = 0 + 00 = 00 + 0 = 00 . Dasselbe gilt für neutrale Elemente der Multiplikation.
(Bei der Forderung der Existenz additiv Inverser braucht man also nicht anzugeben, welchem
neutralen Element der Addition die Summe a + (−a) gleich sein soll.)
c) Ebenso gibt es zu a nur ein additiv Inverses. Sind nämlich (−a), (+ a) zu a additiv invers,
so gilt: (−a) = (−a) + 0 = (−a) + (a + (+ a)) = ((−a) + a) + (+ a) = 0 + (+ a) = (+ a).
Insbesondere gibt es auch nur ein additiv Inverses von (−a), nämlich welches?
d) Die Kommutativität der Multiplikation fordern wir nicht, da es interessante Beispiele gibt,
wo diese nicht erfüllt ist. Siehe Abschnitt 2. Ohne die Kommutativiät ist es nicht allgemein
möglich, eines der beiden Distributivgesetze aus dem anderen zu folgern.
Natürlich kann man auch Rechenbereiche betrachten, in denen auf die Forderung der Assoziativität der Multiplikation verzichtet wird – und tut dies manchmal auch! Wir wollen hier aber
diese Allgemeinheit nicht anstreben.
e) Es wird nicht verlangt, dass 0 und 1 verschiedene Elemente sind. Allerdings besteht in dem
Fall 0 = 1 der Ring nur aus einem Element, welches sowohl 1 wie 0 ist. (Dies steht in der
folgenden Bemerkung a).) Ein solcher Ring heißt ‘der’ Nullring.
f) Die ersten Beispiele für Ringe sind Z und Q, während N kein Ring ist, da zumeist die additiv
Inversen fehlen.
Bemerkungen 2.1.3 a) Aus 0 + 0 = 0 folgt a0 = a(0 + 0) = a0 + a0. Indem man auf beiden
Seiten von a0 = a0 + a0 das Element −(a0) addiert, erhält man a0 = 0. Ebenso zeigt man
0a = 0. Sollte 0 = 1 gelten, folgt a = a · 1 = a0 = 0, und der Ring ist der Nullring.
b) Es ist ab + a(−b) = a(b + (−b)) = a0 = 0. Also ist a(−b) das additiv Inverse zu ab,
d.h. a(−b) = −(ab). Ebenso ist (−a)b = −(ab). Ferner ist a das additiv Inverse zu −a, d.h.
a = −(−a). In jedem Ring gilt deshalb (−a)(−b) = −a(−b) = −(−ab) = ab.
Wenn also Z und Q Ringe sein sollen, so muss man für positive ganze, bzw. rationale Zahlen
a, b das Produkt der negativen Zahlen (−a), (−b) wie oben definieren, nämlich: (−a)(−b) = ab.
Dasselbe gilt für die reellen Zahlen, die wir später einführen.
2.1.4 In einem Ring R sind Potenzen mit Exponenten aus N definiert. Genauer, für a ∈ R, n ∈
N ist an definiert. (Die Kommutativität der Multiplikation wird dazu nicht benötigt. Allerdings
benötigt man die Assoziativität bereits, wenn man die Gleichheit (aa)(aa) = ((aa)a)a wünscht.)
Ich erinnere an die Definition a0 = 1, auch wenn a = 0 sein sollte.
Es gelten die grundlegenden Potenz-Regeln
am+n = am an sowie amn = (am )n .
(2.1)
(Die Gültigkeit dieser Regeln ergibt sich genau so, wie wir es für den Fall dass a eine natürliche
Zahl ist oben gesehen haben. Zu ihrem Beweis benötigt man die Assoziativität, aber nicht die
Kommutativität der Multiplikation.)
2.1. GRUNDLEGENDE DEFINITIONEN
45
In einem Ring, dessen Multiplikation kommutativ ist, gilt zusätzlich die Regel
(ab)n = an bn
(2.2)
Für die meisten Ringe R kann man ab mit a, b ∈ R nicht vernünftig definieren. Wir werden
allerdings ab definieren, falls a und b reelle Zahlen sind und a > 0 ist. Dies wird im Kapitel 5
ausgeführt.
Bemerkung 2.1.5 Die Definition an := a · · · a mit n Faktoren würde n − 1 Multiplikationen
zur Berechnung von an erfordern. Man kann dies aber abkürzen. Z.B. erfordert die linke Seite
von (((a2 )2 )2 )2 = a16 nur 4 statt 15 Multiplikationen. Wenn man etwa a25 berechnen möchte,
stellt man 25 im Binärsystem dar: 25 = 24 + 23 + 20 dar und rechnet
4
3
0
a25 = a2 · a2 · a2 = (((a2 )2 )2 )2 · ((a2 )2 )2 · a
mit Hilfe von 6 Multiplikationen aus. (Warum benötigt man nicht 9 Multiplikationen?)
(Diese Berechnungsabkürzung beim Potenzieren entspricht dem schriftlichen Rechnen beim
Multiplizieren, wobei der Exponent in Binärschreibweise gedacht ist. Sollte Dir diese Bemerkung
schleierhaft erscheinen, überschlage sie.)
Für Anwendungen in der Codierung muss man Potenzen mit natürlichen Exponenten berechnen, die als Dezimalzahlen mehrere hundert Stellen haben. Eine solche Berechnung wäre ohne
die oben beschriebene Abkürzung schlechterdings nicht möglich. (Hat der Exponent z.B. 300
Stellen im Dezimalsystem, so hat er etwa 900 Stellen im Binärsystem. Man braucht zur Berechnung der Potenz also etwa 900 Quadrierungen und durchschnittlich noch etwa 450 weitere
Multiplikationen. Das sind nun wirklich wenige im Vergleich zu 10300 .)
Du kannst mit Recht einwenden, dass man im Bereich der natürlichen Zahlen eine Potenz der
Form ab , wo a ≥ 2 und b von Größenordnung 10300 ist, schon allein deshalb nicht berechnen
kann, weil man die berechnete Zahl von mindestens 10100 Dezimalstellen schlechterdings nicht
aufschreiben kann!
Die Erklärung ist: Man rechnet gar nicht in N, sondern in einem endlichen Ring. Und solche
wirst Du bereits im Abschnitt 4 kennen lernen.
Definition 2.1.6 Ein kommutativer Ring ist ein Ring, in dem die Kommutativität für die
Multiplikation, d.h. ab = ba gilt.
2.1.7 In einem kommutativen Ring R gilt für n ∈ N die Regel (ab)n = an bn , in einem nichtkommutativen Ring meist nicht! Beispiele findest Du im Ring der 2 × 2-Matrizen über beliebigen
Ringen, die vom Nullring verschieden sind. Siehe Abschnitt 3.
Definition 2.1.8 Ein Schiefkörper ist ein (nicht notwendig kommutativer) Ring K, in dem
1 6= 0 ist und für alle Elemente a 6= 0 ein multiplikativ Inverses a−1 existiert. Dabei heißt
a−1 multiplikativ invers zu a, wenn a−1 a = aa−1 = 1 ist. Spricht man von dem Inversen ohne
genauere Spezifikation, so ist das multiplikativ Inverse gemeint.
46
KAPITEL 2. NEUE RECHENBEREICHE
Wie für das additiv Inverse sieht man auch, dass das multiplikativ Inverse eines Elementes
eindeutig bestimmt ist.
Bemerkung 2.1.9 Seien a, b von 0 verschiedene Elemente eines Schiefkörpers. Ist ab 6= ba, so
ist auch (ab)−1 6= a−1 b−1 . Hingegen gilt (unter der Voraussetzung der Assoziativität) immer
(ab)−1 = b−1 a−1 . Zeige dies! (Wenn Du zuerst ein Hemd und dann darüber einen Pullover
angezogen hast und das ohne Verrenkungen rückgängig machen willst, musst Du zuerst den
Pullover und dann das Hemd ausziehen!)
2.1.10 In einem Schiefkörper kann man von Elementen a 6= 0 Potenzen mit beliebigen (also
auch negativen) ganzzahligen Exponenten bilden: Für n ≥ 0 sei a−n := (a−1 )n . Dabei verstehe
man zunächst unter a−1 das multiplikativ Inverse von a; als Potenz kann man es nachträglich
verstehen.
Auch für Potenzen mit beliebigen ganzen Exponenten gelten o.a. Regeln am+n = am an und
amn = (am )n . (Aus (ab)2 = a2 b2 folgt ab = ba in jedem Schiefkörper. Zeige dies!)
Definition 2.1.11 Ein Körper ist ein Schiefkörper, in dem die Kommutativität der Multiplikation gilt.
Bemerkung: Dem allgemeinen Sprachgebrauch nach sollte ein Schiefkörper ein Körper spezieller Art
sein. Dummerweise ist hier umgekehrt ein Körper ein Schiefkörper spezieller Art. Das liegt natürlich
an der historischen Entwicklung, daran, dass man den Begriff des Körpers zuerst erfunden hat und
später gute Gründe fand, auch körperähnliche Gebilde zu betrachten, in denen die Multiplikation nicht
kommutativ ist. Als Ausweg wurde z.B. vorgeschlagen, Schiefkörper als ‘Örper’ zu bezeichnen. Eine
andere Möglichkeit wäre der Name ‘Divisionsring’. (Im Englischen heißt ‘Körper’ – im hier definierten
Sinn – ‘field’, ein ‘Schiefkörper’ ‘skew field’, ‘sfield’ oder ‘division ring’.) Diese sprachliche Kalamität
tritt allerdings in der Mathematik immer wieder auf, und man hat sich daran gewöhnt, z.B. unter
einer Garbe eine Prägarbe spezieller Art zu verstehen, usw. Was Garben sind, brauchst Du jetzt noch
nicht, vielleicht sogar nie, verstehen.
2.1.12 In einem Körper gilt wegen der Kommutativität für alle Elemente a, b und beliebige
ganze Zahlen n die Regel (ab)n = an bn .
In einem Körper definieren wir ab = ab−1 . Du kannst und solltest die Regeln für die Bruchrechnung aus den Körpergesetzen ableiten. Soll also Q ein Körper werden, müssen wir Addition
und Multiplikation so definieren, wie wir es getan haben – und wie Du es in der Schule gelernt
hast!
Übrigens, wenn man den rationalen Zahlen ein Element ∞ hinzufügt, um dem Bruch
Sinn zu geben, erhält man keinen Körper. Die Struktur kompliziert sich nur.
2.2
1
0
einen
Beispiele von Ringen und Körpern
Von der Schule her solltest Du in etwa den Körper R der reellen Zahlen kennen. Von dem wird
später noch die Rede sein.
2.2. BEISPIELE VON RINGEN UND KÖRPERN
47
Beispiel 2.2.1 Ringe zwischen Z und Q
1. Sind u, v ungerade ganze Zahlen, so ist bekanntlich auch uv ungerade. Sind ferner a, b ∈ Z,
so gilt
av + bu
a b
ab
a b
+ =
,
· =
u v
uv
u v
uv
Das bedeutet, dass die Brüche, deren Nenner ungerade sind, genauer: die mit ungeraden Nennern geschrieben werden können, einen (kommutativen) Ring bilden. In diesem Ring R hat 2
kein multiplikativ Inverses, also ist er kein Körper und somit auch nicht gleich Q. Andererseits
enthält er die Zahl 1/3. Der Ring R umfasst Z und liegt in Q.
2. Auch die rationalen Zahlen, deren Nenner eine Potenz von 2 ist bilden einen Ring S. (1 = 20
ist als Nenner zugelassen.)
Diese Ringe R und S verhalten sich unterschiedlich. In R besitzt 3 = 1 + 1 + 1 ein Inverses,
aber 2 = 1 + 1 nicht. In S ist es gerade umgekehrt.
3. Allgemein sei Q eine Menge von Primzahlen. Betrachte die Menge A derjenigen rationalen
Zahlen, die sich mit einem Nenner schreiben lassen, der 1 oder ein Produkt von Primzahlen aus
Q ist. (Jede Primzahl aus Q darf auch ein mehrfacher Primfaktor sein.) Dieses A ist ein Ring,
der in Q liegt und Z umfasst. (Den Begriff ‘Menge’ als eine gewisse Gesamtheit mathematischer
Objekte betrachten wir hier ganz naiv.)
Besteht Q aus allen von 2 verschiedenen Primzahlen, so erhält man den Ring R aus 1., besteht
Q nur aus der Primzahl 2, erhält man S.
Besteht Q aus allen Primzahlen, so erhalten wir Q, besteht Q aus gar keiner Primzahl, dann
Z.
Bemerkung 2.2.2 Allgemein kann man, ausgehend von einem kommutativen Ring R, Brüche
betrachten. Häufig lässt sich auf diese Weise der Ring – wie beim Übergang von Z zu Q – zu
einem Körper erweitern. Dazu muss allerdings R nullteilerfrei sein. S.u.
Man kann wie in den o.a. Beispielen die zulässigen Nenner einschränken, um weitere Ringe zu
erhalten.
Beispiel 2.2.3 Weiß man von zwei ganzen Zahlen lediglich, ob sie gerade oder ungerade sind,
so weiß man dieses auch über ihre Summe und ihr Produkt. Es gilt:
gerade+gerade = ungerade+ungerade = gerade, gerade+ungerade = ungerade
gerade·gerade = gerade·ungerade = gerade,
ungerade·ungerade = ungerade
Wir können also die Begriffe ‘gerade’ und ‘ungerade’ als die Elemente einer Menge (von 2
Elementen) auffassen, in der man die Verknüpfungen ‘+’ und ‘·’ hat. Wir setzen 0 =gerade,
1 =ungerade. Denn offenbar ist gerade ein neutrales Element für die Addition, ungerade ein
solches für die Multiplikation. Die Additions- und die Multiplikationstafel sehen wie folgt aus:
+ 0
0 0
1 1
1
1
0
48
KAPITEL 2. NEUE RECHENBEREICHE
· 0
0 0
1 0
1
0
1
Bis auf die Rechnung 1 + 1 = 0 ist alles wie gewohnt. 1 ist sowohl das additiv, wie das multiplikativ Inverse von sich selbst.
Man nennt diese Menge zusammen mit den Verknüpfungen F2 . Wir haben es mit einem (etwas
dürftigen) Körper zu tun.
Die Elemente 0 und 1 von F2 sind nicht dieselben Gegenstände, wie die ganzen Zahlen 0
und 1. (Vielleicht sollte man sie deshalb mit 0, 1 bezeichnen. Alternativ könnte man auch das
Additionszeichen ‘+’ umbezeichnen.) Im Bereich der ganzen Zahlen gilt ja 1 + 1 6= 0.
Um zu zeigen, dass F2 wirklich ein Körper ist, muss man insbesondere die beiden Assoziativgesetze, sowie die Distributivität zeigen. Will man diese Gesetze Fall für Fall untersuchen, so hat
man dreimal 23 Fälle zu betrachten. Aber man kann sich ja darauf berufen, dass diese Gesetze
für N (und Z) gelten. Deshalb müssen sie doch auch für den Bereich {gerade, ungerade} gelten,
nicht wahr?
2.2.4 Wir können für jede natürliche Zahl m > 1 etwas ähnliches tun, wie wir gerade für
m = 2 getan haben. Wir können einen kommutativen Ring von m Elementen konstruieren,
der übrigens, falls m eine Primzahl ist, ein Körper ist. Wir werden dieser wichtigen Idee den
Abschnitt 4 widmen.
2.2.5 Direktes Produkt: Nehmen wir zwei Ringe R, S und bilden wir ihr cartesisches Produkt R × S, d.h. die Menge aller Paare (r, s) mit r ∈ R, s ∈ S. Für solche Paare (r, s), (r0 , s0 )
definieren wir
(r, s) + (r0 , s0 ) := (r + r0 , s + s0 ) und (r, s)(r0 , s0 ) := (rr0 , ss0 ).
R × S mit diesen Verknüpfungen wird das direkte Produkt von R mit S genannt. Offenbar ist
R × S wieder ein Ring, kommutativ, wenn R und S es sind. Was ergibt (1, 0)(0, 1)? Wir sehen,
wenn in den Ringen R und S jeweils 0 6= 1 ist, gibt es in R × S immer von 0 verschiedene
Elemente, deren Produkt 0 ist. Das direkte Produkt zweier Körper ist deshalb nie ein Körper.
2.2.6 Im Gegensatz zu dem letzten Beispiel gilt in Z und Q die sogenannte Nullteilerfreiheit.
Damit ist folgende Regel gemeint:
ab = 0 =⇒ a = 0 oder b = 0.
(Überlege, dass dies in jedem Schiefkörper gilt.)
Definition 2.2.7 In einem Ring R nennen wir a einen Links-Nullteiler, wenn es in R ein
b 6= 0 mit ab = 0 gibt. Analog wird ein Rechts-Nullteiler definiert. Bei einem kommutativen
Ring spricht man natürlich schlicht von Nullteilern.
2.3. MATRIZEN
49
(Da immer a0 = 0 ist, teilt jedes Element eines Ringes die 0. Ein Nullteiler ist aber nach
Definition ein Element, welches die 0 auf nicht triviale Weise teilt.) Die 0 selbst zählt man zu
den Nullteilern, vorausgesetzt, der Ring ist nicht der Nullring. Es gibt Beispiele, wo a ein Links-,
aber kein Rechts-Nullteiler ist, und umgekehrt. In unserem Buch kommen solche Beispiele nicht
vor.
Definition 2.2.8 Ein kommutativer Ring heißt nullteilerfrei (auch integer oder ein Integritätsring oder ein Integritätsbereich), wenn er nicht der Nullring ist und außer 0 keine
Nullteiler besitzt.
Bemerkung 2.2.9 Kürzungsregel: Sei c kein Rechts-Nullteiler und ac = bc, so ist a = b.
Beweis hierfür: Aus ac = bc folgt (a − b)c = ac − bc = 0 also a − b = 0, da c kein Nullteiler
ist. –
2.3
Matrizen
2.3.1 Matrizen (Singular: Matrix) sind sehr interessante nützliche mathematische Gegenstände. Ich beschränke mich in diesem Buch auf einen Spezialfall.
Sei R ein Ring. Wir betrachten sogenannte 2×2-Matrizen über R, d.h. quadratische Schemata
a b
mit a, b, c, d ∈ R
c d
Die Gesamtheit dieser Matrizen sei mit M2 (R) bezeichnet.
Das Paar (a, b) wird die erste Zeile,
genannt. Das
das Paar (c, d) die zweite Zeile obiger
Matrix
a
b
(senkrecht geschriebene) Paar
heißt die erste Spalte, das Paar
die zweite Spalte
c
d
der Matrix.
Wir definieren die Addition zweier solcher Matrizen wie folgt:
0 0 a b
a b
a + a0 b + b 0
+
=
,
c d
c0 d0
c + c0 d + d0
d.h. auf recht naheliegende Art. Die Addition erfüllt offenbar alle Gesetze, welche die Addition
bei Ringen erfüllt. Bestimme das neutrale Element der Addition, sowie das additiv Inverse einer
Matrix.
a b
Ist λ ∈ R und A =
∈ M2 (R)so setzen wir
c d
λA =
λa λb
λc λd
50
KAPITEL 2. NEUE RECHENBEREICHE
Die Multiplikation zweier Matrizen aus M2 (R) ist komplizierter definiert. Ich will sie schrittweise
einführen. Zunächstsei für
ein als Zeile geschriebenes Paar (a1 , a2 ) und für ein als Spalte
b1
geschriebenes Paar
ein Produkt, wie folgt, definiert:
b2
b1
(a1 , a2 )
= a1 b 1 + a2 b 2 .
b2
(Den ersten Faktor kann man als 1 × 2-Matrix, den zweiten als 2 × 1-Matrix und das Ergebnis
als 1 × 1-Matrix ansehen.)
A, B seien 2 × 2-Matrizen. Die 1., bzw. 2. Zeile von A seien mit Z1 , bzw. Z2 bezeichnet. Die 1.,
bzw. 2. Spalte von B seien S1 , bzw. S2 . Dann ist
Z1
Z1 S1 Z1 S2
AB =
(S1 , S2 ) :=
Z2
Z2 S1 Z2 S2
D.h. der Eintrag in der i-ten Zeile und j-ten Spalte der Ergebnismatrix ist das Produkt der
i-ten Zeile von A mit der j-ten Spalte von B. (Oder so: Man multipliziere die Zeilen von A mit
den Spalten von B, und setze die Ergebnisse an die entsprechenden Stellen einer 2 × 2-Matrix.)
Ausgeschrieben ergibt sich:
0 0 0
aa + bc0 ab0 + bd0
a b
a b
=
·
ca0 + dc0 cb0 + dd0
c0 d0
c d
Bemerkung 2.3.2 Später – im Kapitel 6 – werden wir noch folgendes Produkt verwenden:
Sei A eine 2 × 2-Matrix mit den Zeilen Z1 und Z2 und B eine 2 × 1-Matrix, d.h. eine Spalte.
Dann sei
Z1 B
AB =
.
Z2 B
Das Ergebnis ist eine Spalte. Ausgeschrieben ergibt sich
a11 a12
b1
a11 b1 + a12 b2
=
a21 a22
b2
a21 b1 + a22 b2
2.3.3 Gibt es im Bereich der 2 × 2-Matrizen für die Multiplikation ein neutrales Element?
Antwort:
1 0
E :=
ist ein solches.
0 1
Rechne das nach!
Die Assoziativität der Multiplikation und die beiden Distributivgesetze lassen sich nachrechnen.
Tu das! Die Menge M2 (R) ist also ein Ring.
Angenommen, der Ausgangsring R sei kommutativ und nicht der Nullring. Ist dann auch M2 (R)
kommutativ? Berechne
0 1
0 0
0 0
0 1
·
und
·
0 0
0 1
0 1
0 0
2.3. MATRIZEN
51
Wir lernen: In M2 (R) ist die Multiplikation nicht kommutativ; auch kann das Produkt zweier
von der Nullmatrix verschiedenen Matrizen
0 0
A, B 6= 0 :=
0 0
gleich 0 sein.
Wenn Du, wie ich, kein Genie bist, solltest Du die Rechnungen mit Matrizen zur Übung unbedingt nachvollziehen und vielleicht noch das eine oder andere Produkt konkreter Matrizen
berechnen!
Beispiel 2.3.4 Berechne
1 1
0 1
2 2
2
1 0
1 1
1 0
·
und
·
1 1
0 1
1 1
Die für rationale (reelle, komplexe) Zahlen a, b gültige Regel an bn = (ab)n gilt nicht mehr
allgemein, wenn a, b Matrizen sind! Das liegt an der fehlenden Kommutativität.
Bemerkung 2.3.5 Allgemeiner, als wir es hier tun, betrachtet man m×n-Matrizen über einem
Ring, d.h. solche mit m Zeilen und n Spalten. Die Summe zweier m × n-Matrizen bildet man
wie oben. Das Produkt AB zweier Matrizen ist definiert, wenn die Zahl der Spalten von A
gleich der Zahl der Zeilen von B ist. (Wie würdest Du es definieren?) Das Ergebnis ist eine
Matrix, die soviele Zeilen wie A und soviele Spalten wie B besitzt.
Somit kann man zwei n × n-Matrizen (mit demselben n) sowohl zueinander addieren wie miteinander multiplizieren. Zu jedem n ∈ N1 bilden die n × n-Matrizen einen Ring.
In der Linearen Algebra spielen Matrizen eine Hauptrolle. Wenn Du Dich hier mit den
2 × 2-Matrizen vertraut machst, wird Dir das beim späteren Umgang mit allgemeinen Matrizen
wahrscheinlich sehr helfen.
2.3.6 Berechne
a b
0 d
0 0 a b
·
.
0 d0
Man sieht, dass die Matrizen der Form
a b
0 d
einen Ring bilden, einen sogenannten Unterring von M2 (R). Dasselbe gilt für die Matrizen
der Form
a 0
.
c d
52
KAPITEL 2. NEUE RECHENBEREICHE
Die Matrizen der Form
1 b
0 1
bilden keinen Unterring, wenn 0 6= 1 in R gilt. (Warum?) Aber das Produkt zweier solcher ist
wieder von dieser Form und spiegelt die Summe in R wieder, nicht wahr? Wie ich das gemeint
habe, siehst Du sofort, wenn Du zwei Matrizen solcher Art multiplizierst.
2.3.7 Determinante: Wir setzen hier voraus, dass R kommutativ ist. Die Determinante
einer 2 × 2-Matrix ist dann folgendermaßen definiert:
a b
det
:= ad − bc
c d
Sie ist also ein Element aus R.
Versuche, Eigenschaften der Determinanten von Matrizen aufzuspüren. Gilt z.B. det(A + B) =
det(A) + det(B) für beliebige 2 × 2-Matrizen A, B? Finde ein Gegenbeispiel! Gilt det(AB) =
det(A)·det(B)? Dies stimmt! Es zu beweisen erfordert keine Idee, nur eine sorgfältige Rechnung.
Bringe dazu beide Seiten auf eine Summe von vier Produkten von je vier Einträgen, die ‘mit
Vorzeichen versehen sind’. Was ist det(E), wenn E, wie oben das multiplikativ neutrale, also
Einselement von M2 (R) bezeichnet.
Vergleiche
det
a b
c d
mit det
a + ce b + de
c
d
Bemerkung 2.3.8 Auch für n × n-Matrizen mit n > 2 über einem kommutativen Ring kann
man Determinanten definieren. Und es gilt det(AB) = det(A) det(B).
2.3.9 Weiterhin sei R kommutativ. Welche 2 × 2-Matrizen sind invertierbar? Wie kann man
ihr Inverses berechnen?
Sei A in M2 (R) invertierbar, d.h. es gebe eine Matrix B ∈ M2 (R) mit AB = E. Dann ist
det(A) · det(B) = det(AB) = det(E) = 1. Also muss det(A) in R invertierbar sein.
a b
Umgekehrt, sei det
= ad − bc in R invertierbar. Man rechnet leicht nach, dass
c d
a b
d −b
ad − bc
0
·
=
= (ad − bc)E
c d
−c a
0
ad − bc
ist, und dass bei Vertauschung der Faktoren dasselbe herauskommt. Deshalb ist
d
−b
ad−bc
−c
ad−bc
die zu
a b
c d
inverse Matrix.
ad−bc
a
ad−bc
2.3. MATRIZEN
53
2.3.10 Ist
A=
so ist
a b
c d
a b
c d
mit det(A) = 0
ad − bc
0
0 0
d −b
·
=
=
.
−c a
0
ad − bc
0 0
Also ist A ein Links-Nullteiler und auch ein Rechtsnullteiler, da man in diesem Fall die beiden
Faktoren vertauschen darf. Wenn R ein Körper ist, ist eine 2 × 2-Matrix entweder sowohl ein
Links- wie ein Rechts-Nullteiler oder invertierbar. Frage: Gilt dies auch im Falle R = Z?
2 0
Antwort: Die Matrix
hat die Determinante 2, ist also über Z nicht invertierbar.
0 1
Andererseits ist sie über Q invertierbar, kann also in dem Unterring M2 (Z) von M2 (Q) kein
Nullteiler sein.
2.3.11 Berechne
a b
−b a
0 0 0
a b
a b
a b0
.
und
·
·
0
0
b 0 a0
−b a
b a
Man sieht, das sowohl die Matrizen der ersten Form, wie die der zweiten jeweils einen kommutativen Unterring von M2 (R) bilden. (Die Kommutativität von R ist vorausgesetzt.)
Wir interessieren uns hier nur für den ersten Fall. Wir setzen voraus, dass R ein Körper ist. Es
gilt
a b
det
= a2 + b 2
−b a
Im Körper Q (und auch im später zu besprechenden Körper R der reellen Zahlen) gilt die
folgende Regel:
a2 + b2 = 0 ⇐⇒ a = b = 0 (∗)
Sei jetzt K ein Körper, in dem diese Regel gilt. Dann ist auch die Menge der Matrizen
a b
∈ M2 (K)
−b a
ein Körper. Ist K = R, so erhält man den Körper C der komplexen Zahlen, den wir im Kapitel
8 besprechen.
AUFGABEN
1. Berechne folgende Matrizenprodukte, ebenso die Produkte, wenn Du die Faktoren vertauscht
hast:
a b
0 1
a b
1 e
c d
1 0
c d
0 1
54
KAPITEL 2. NEUE RECHENBEREICHE
2. a) Berechne
a+b b
b
a
1 1
1 0
.
b) Bestimme mit Hilfe der Fibonacci-Folge die Werte der Potenzen (in M2 (Z))
1 1
1 0
n
, n∈N.
Berechne dabei (für spätere Aufgaben) mindestens die ersten 3, besser noch die ersten 8 Potenzen konkret.
3. Zeige, dass die Menge K der folgenden 4 Matrizen aus M2 (F2 )
A :=
0 1
1 1
2
, A =
1 1
1 0
3
, A = E, und 0 =
0 0
0 0
(deren Einträge aus dem ‘Minikörper’ F2 stammen) in Bezug auf die Addition und Multiplikation ein Körper ist. (Es gibt also einen Körper, der aus 4 Elementen besteht.) Versuche, mit
möglichst wenigen Rechnungen auszukommen.
4. Sei A eine Matrix von n Zeilen und n Spalten, mit folgenden Eigenschaften:
(i) In jeder Zeile und jeder Spalte komme jede der Zahlen 1, . . . , n vor. (Dann kommt jede dieser
Zahlen auch nur einmal in jeder Zeile, bzw. Spalte vor. Warum?) (Dies ist übrigens eine der
Bedingungen beim Sudoku.)
(ii) A sei symmetrisch (bzgl. der ‘(Haupt)-Diagonale’), d.h. es sei aij = aji für alle i, j.
a) Zeige: Wenn n ungerade ist, kommt auch in der Diagonale (a11 , a22 , . . . , ann ) jede der Zahlen
1, . . . , n genau einmal vor.
b) Zeige: Wenn n gerade (und > 0) ist, gilt dies nie, d.h. es kommt mindestens eine Zahl doppelt
vor.
5. Seien a, b ∈ Z. Zeige: Im Bereich der 2×2-Matrizen über Z gibt es genau dann eine invertierbare
Matrix, deren erste Zeile (a, b) ist, wenn ggT(a, b) = 1 ist.
6. Erinnere Dich an den Paragrafen 2.3.9, insbesondere an die Regel
a b
c d
d −b
−c a
= (ad − bc)E
d −b
a b
Die Matrix
heißt auch die zur Matrix A =
komplementäre Matrix. Sie
−c a
c d
sei mit c(A) bezeichnet. Zeige: c(AB) = c(B)c(A). Folgere hieraus und aus c(A)A = Ac(A) =
det(A)E, dass det(AB) = det(A) det(B) gilt.
2.4. RESTKLASSEN
2.4
55
Restklassen
Es ist nicht nötig, dass Du das Folgende jetzt sofort liest und verstehst. Solltest Du allerdings
Mathematik studieren, wirst Du mit diesen Dingen konfrontiert werden.
2.4.1 Die Folge der natürlichen Zahlen
0, 1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . .
weist keine Wiederholung auf. Immer ist ja n + 1 > n. Aber nichts hindert uns daran, einen
Bereich zu betrachten, in dem man wieder bei 0 landet, wenn man zur Null m-mal die 1 addiert.
Natürlich ist dies dann nicht mehr der Bereich der natürlichen Zahlen, sondern etwas Neues.
Immerhin wirst Du sehen, dass man auf diese Weise einen Ring erhält.
Du weißt, wie man n ∈ N durch m ∈ N1 mit Rest dividiert, also n = qm + r mit natürlichen
Zahlen q, r und 0 ≤ r ≤ m − 1 schreibt. Wir nennen in diesem Fall r den Rest, den n bei
Division durch m lässt.
Wenn Zahlen als Größen betrachtet, so wird man bei der Division mit Rest den ‘Quotienten’ q
n
als das wichtigste ansehen. Denn es ist ja m
= q + mr , wo 0 ≤ mr < 1 ist.
Hier wollen wir jedoch umgekehrt dem Rest r unsere Aufmerksamkeit zukehren. Beliebige ganze
Zahlen n, also auch negative, können durch m > 0 mit Rest dividiert werden. In der Tat gibt
es zu gegebenen n, m ∈ Z mit m > 0 ganze Zahlen q, r mit 0 ≤ r ≤ m − 1 mit n = qm + r. Für
m = 10 gilt z.B. −4 = (−1) · 10 + 6 und 34 = 3 · 10 + 4.
Bezeichnung: Ist m festgelegt, so bezeichnen wir den Rest, den eine ganze Zahl n bei Division
durch m lässt, mit ρ(n).
Beispiele 2.4.2 Erinnere Dich an den Körper F2 , der aus den Elementen gerade und ungerade
besteht. Die geraden Zahlen sind diejenigen, die Bei Division durch 2 den Rest 0 lassen, während
die ungeraden Zahlen diejenigen sind, die bei Division durch 2 den Rest 1 lassen.
Du hast gesehen, dass diese beiden Begriffe gerade und ungerade einen Ring bilden. Die Verknüpfungen + und · entstehen durch die entsprechenden Verknüpfungen der Reste bei Division
durch 2. Dabei ist zunächst 1 + 1 = 2, aber 2 lässt bei Division durch 2 den Rest 0.
Du weißt vielleicht auch folgendes: Wenn du von zwei im Dezimalsystem geschriebenen natürlichen Zahlen nur die jeweils letzte Stelle kennst, so kennst Du auch die letzte Stelle ihrer Summe,
bzw. die ihres Produktes. Nun ist die letzte Stelle einer im Dezimalsystem geschriebenen natürlichen Zahl nichts anderes als der Rest, den diese Zahl bei Division durch 10 lässt. (Bei negativen
ganzen Zahlen ergibt sich der Rest bei Division durch 10 als 0, wenn die letzte Dezimalziffer eine
0 ist, hingegen gleich 10 − r, wenn die letzte Ziffer r ist. Der Rest soll ja im Bereich {0, 1, . . . , 9}
liegen.)
Du kannst somit im Bereich der zehn Ziffern 0, 1, . . . , 9 auch eine ‘Summe’ und ein ‘Produkt’
definieren, indem Du von der in N gebildeten Summe, bzw. dem Produkt nur die letzte Ziffer
betrachtest. In dem Sinne ist etwa 6+7 = 3, 6+4 = 0; 6·3 = 8, 2·5 = 4·5 = 6·5 = 0, 3·7 = 1
usw. Wir werden bald sehen, dass Du auf diese Weise einen Ring aus 10 Elementen erhältst,
der allerdings kein Körper ist.
56
KAPITEL 2. NEUE RECHENBEREICHE
Bevor Du jetzt meinst, dies seien völlig uninteressante und für einen normalen Menschen ganz irrelevante Gedankenspielereien von weltfremden Mathematikern, lass Dir sagen, dass diese Art zu rechnen
zusammen mit Kenntnissen über Primzahlen uns zu den modernen Verschlüsselungsmethoden geführt
haben, die ich im 1. Kapitel bereits angesprochen habe, auf die ich am Ende des Buches zurückkommen
werde und die Du übrigens nutzt, wenn Du Dein Konto mit Online-Banking verwaltest.
2.4.3 Seien m ∈ N1 , d.h. eine ganze Zahl > 0, und n1 , n2 ∈ Z. Für i = 1, 2 dividieren wir ni
mit Rest durch m. Wir erhalten Darstellungen
n1 = q1 m + r1 und n2 = q2 m + r2 mit 0 ≤ ri ≤ m − 1
Daraus ergibt sich n1 +n2 = (q1 +q2 )m+(r1 +r2 ), sowie n1 n2 = q1 q2 m2 +q1 r2 m+q2 r1 m+r1 r2 =
(q1 q2 m + q1 r2 + q2 r1 )m + (r1 r2 ). Hieraus erhältst Du:
Satz 2.4.4 Der Rest, den n1 + n2 bei Division durch m lässt, ist derselbe, den r1 + r2 bei
Division durch m lässt. Ebenso ist der Rest, den n1 n2 bei Division durch m lässt, derselbe, den
r1 r2 bei Division durch m lässt.
In Formeln: ρ(n1 + n2 ) = ρ(ρ(n1 ) + ρ(n2 )) und ρ(n1 n2 ) = ρ(ρ(n1 )ρ(n2 )).
Folgerung 2.4.5 Die ganzen Zahlen n1 und n01 mögen bei Divison durch m denselben Rest
lassen; ferner mögen auch n2 und n02 bei Division durch m denselben Rest lassen. Dann lassen
sowohl n1 + n2 und n01 + n02 , als auch n1 n2 und n01 n02 bei Division durch m denselben Rest.
Anders ausgedrückt: Wenn ρ(ni ) = ρ(n0i )gilt, dann auch ρ(n1 + n2 ) = ρ(n01 + n02 ) und ρ(n1 n2 ) =
ρ(n01 n02 ).
Natürlich erhältst Du hiermit: ρ(n) = ρ(n0 ) ⇒ ρ(nk ) = ρ(n0k ) für k ∈ N. Aber
0
Vorsicht: Aus ρ(k) = ρ(k 0 ) folgt fast nie ρ(nk ) = ρ(nk ). Zum Beispiel sei m = 10. Dann ist
ρ(1) = ρ(11), aber ρ(21 ) = 2 und ρ(211 ) = ρ(2048) = 8.
Definition 2.4.6 Sei m ∈ N1 fest gewählt. Für ganze Zahlen j, k ∈ {0, 1, 2, . . . , m − 1} (der
Menge der natürlichen Zahlen, die kleiner als m sind) definieren wir eine neue Addition ⊕ und
eine neue Multiplikation ⊗ wie folgt:
Addition: j ⊕ k sei der Rest, den j + k bei Division durch m lässt.
Multiplikation: j ⊗ k sei der Rest, den jk bei Division durch m lässt.
Symbolisch j ⊕ k = ρ(j + k), j ⊗ k := ρ(jk).
Die Menge {0, 1, 2, . . . , m − 1} zusammen mit den beiden Verknüpfungen ⊕, ⊗ bezeichnen wir
mit Zm .
Die Zeichen ⊕, ⊗ benutzen wir nur vorläufig!
2.4. RESTKLASSEN
57
Theorem 2.4.7 Zm ist ein kommutativer Ring.
Beweis: Die Ring-Gesetze übertragen sich vermittels ρ von Z auf Zm . Ich führe beispielshaft
die Beweise des Kommutativgesetzes und des Distributivitätsgesetzes aus:
j ⊕ k = ρ(j + k) = ρ(k + j) = k ⊕ j ,
i ⊗ (j ⊕ k) = i ⊗ ρ(j + k) = ρ(i(j + k)) = ρ(ij + ik) = ρ(ρ(ij) ⊕ ρ(ik)) = (i ⊗ j) ⊕ (i ⊗ k)
Darüber hinaus ist klar, dass 0 das neutrale Element für die Addition und 1 dasjenige für die
Multiplikation in Zm ist. Letzteres gilt zumindest im Falle m > 1.
Falls m = 1 ist, erhalten wir den Nullring.
Beispiele 2.4.8 a) Sei m = 5. Wir stellen die Additions- und Multiplikationstafel von Z5 auf.
⊕
0
1
2
3
4
0
0
1
2
3
4
1
1
2
3
4
0
2
2
3
4
0
1
3
3
4
0
1
2
4
4
0
1
2
3
⊗
0
1
2
3
4
0
0
0
0
0
0
1
0
1
2
3
4
2
0
2
4
1
3
3
0
3
1
4
2
4
0
4
3
2
1
In der Tat ist z.B. 3 ⊕ 2 = ρ(5) = 0, 4 ⊕ 3 = ρ(7) = 2; 4 ⊗ 4 = ρ(16) = 1, 3 ⊗ 4 = ρ(12) = 2
In jeder Zeile der Multiplikationstafel außer der ersten steht eine 1. Erkenne daran, dass jedes
Element 6= 0 ein multiplikativ Inverses hat, dass also ein Körper vorliegt!
b) Dasselbe machen wir im Falle m = 6.
⊕
0
1
2
3
4
5
0
0
1
2
3
4
5
1
1
2
3
4
5
0
2
2
3
4
5
0
1
3
3
4
5
0
1
2
4
4
5
0
1
2
3
5
5
0
1
2
3
4
⊗
0
1
2
3
4
5
0
0
0
0
0
0
0
1
0
1
2
3
4
5
2
0
2
4
0
2
4
3
0
3
0
3
0
3
4
0
4
2
0
4
2
5
0
5
4
3
2
1
58
KAPITEL 2. NEUE RECHENBEREICHE
Während die Additionstabellen von Z5 und Z6 einander ziemlich ‘ähnlich’ sehen, siehst Du bei
den Multiplikationstabellen große Unterschiede!
In der von Z6 findet sich nur in der zweiten und der letzten eine 1. Zudem findet man öfter das
Produkt 0, wo beide Faktoren 6= 0 sind: z.B. 2 ⊗ 3 = 0. Denn es ist 2 · 3 = 6 und 6 lässt bei
Division durch 6 den Rest 0. In dem Ring Zm gibt es Nullteiler.
Der Unterschied zwischen 5 und 6, der die Unterschiede in den Multiplikationstabellen nach
sich zieht, liegt darin, dass 5 eine Primzahl ist, 6 aber nicht. Das werden wir unten allgemeiner
feststellen.
Eine andere Sichtweise.
Man kann die Ringe Zm auch auf andere Weise konstruieren. Wir fassen nämlich die Zahlen,
die bei Division durch m denselben Rest lassen, jeweils zu einer Menge zusammen, die wir als
Element einer Menge Z/(m) auffassen.
Definition 2.4.9 Seien r, m ∈ Z und m > 0. Die Restklasse von r modulo m ist die Menge
r + mZ := {r + mk | k ∈ Z},
d.h. die Menge, die aus allen Zahlen der Form r + mk besteht, wo k ganz Z durchläuft (während
r und m festgehalten werden). Diese Menge wird auch mit (r mod m) bezeichnet.
Satz 2.4.10 a) Ist 0 ≤ r < m, so ist r + mZ die Menge aller ganzen Zahlen, die bei der
Division durch m den Rest r lassen.
b) Allgemeiner gilt für beliebige r ∈ Z, dass r + mZ die Menge aller ganzen Zahlen ist, die bei
Division durch m den Rest ρ(r) lassen, wo ρ wie oben definiert ist.
Beweis:
a) ist klar.
b) Nach Definition von ρ kann man r = ρ(r) + mu schreiben. Für jedes k ∈ Z gilt dann
r + mk = ρ(r) + mu + mk = ρ(r) + m(u + k). Also lässt jede Zahl r + mk ∈ r + mZ bei Division
durch m den Rest ρ(r). Und umgekehrt, wenn eine Zahl den Rest ρ(r) lässt, also s = ρ(r) + mv
gilt, so ist s = r − mu + mv = r + m(v − u) ∈ r + mZ.
2.4.11 Es ist wichtig, dass Du folgendes beachtest: Restklassen r + mZ und s + mZ sind genau
dann einander gleich, wenn sie aus denselben Zahlen bestehen, d.h. wenn jede Zahl der Form
r + mk sich auch in der Form s + ml schreiben lässt und umgekehrt. Aus r + mZ = s + mZ
folgt nicht allgemein, dass r = s sein müsste! Ein Beispiel ist
31 + 10Z = 51 + 10Z
Betrachte den folgenden Satz auch im Lichte dieser Bemerkung!
2.4. RESTKLASSEN
59
Satz 2.4.12 Sei m > 0 eine festgewählte ganze Zahl und ρ(n) – wie oben – der Rest, den eine
ganze Zahl n bei Division durch m lässt. Für ganze Zahlen r, s sind dann folgende Aussagen
äquivalent:
(i) r − s ist durch m teilbar;
(ii) r ∈ s + mZ;
(iii) ρ(r) = ρ(s);
(iv) r + mZ = s + mZ.
Beweis:
s + mZ.
(i) ⇒ (ii): Wegen m|r − s gibt es ein k ∈ Z mit r − s = mk. Also gilt r = s + mk ∈
(ii) ⇒ (iii): Da s + mZ aus denjenigen ganzen Zahlen besteht, die bei Division durch m den
Rest ρ(s) lassen, folgt aus (ii) die Gleichung ρ(r) = ρ(s).
(iii) ⇐⇒ (iv): r + mZ (bzw. s + mZ) besteht aus denjenigen ganzen Zahlen, die bei Division
durch m den Rest ρ(r) (bzw. ρ(s)) lassen. Die Gleichheit der Zahlen ρ(r) = ρ(s) ist also
äquivalent zur Gleichheit der Mengen r + mZ = s + mZ.
(iii) ⇒ (i): Auf Grund der Definition von ρ kann man r = ρ(r) + mu und s = ρ(s) + mv
schreiben. Aus der Gleichheit ρ(r) = ρ(s) ergibt sich dann r − s = mu − mv = m(u − v). Definition 2.4.13 Zwei ganze Zahlen r, s heißen zueinander kongruent modulo m, wenn
die äquivalenten Aussagen (i)–(iv) des letzten Satzes gelten. In diesem Falle schreibt man
r ≡ s (mod m).
Ergänzungen: Wir wollen die Kongruenz modulo m für beliebiges m ∈ Z erklären. Dies tun
wir, indem wir sie durch die äquivalenten Aussagen (i) und (iv) definieren. Das bedeutet im
Einzelnen:
a) Im Fall m = 1 (der oben nicht ausgeschlossen war) gilt r ≡ s (mod 1) für alle ganzen Zahlen
r und s.
b) Im Gegensatz dazu gilt r ≡ s (mod 0) nur dann, wenn r = s ist.
c) r ≡ s (mod m) gilt genau dann, wenn r ≡ s (mod − m) ist. Es bedeutet also keine
Einschränkung der Allgemeinheit, wenn wir im Folgenden m ∈ N voraussetzen.
Bemerkungen 2.4.14 Sei m ∈ N. Du wirst ohne Probleme folgende Aussagen beweisen
können:
a) n ≡ n (mod m) für jede ganze Zahl n.
b) n ≡ n0 (mod m) ⇒ n0 ≡ n (mod m)
c) n ≡ n0 (mod m), n0 ≡ n00 (mod m) ⇒ n ≡ n00 (mod m)
d) n ≡ ρ(n) (mod m)
60
KAPITEL 2. NEUE RECHENBEREICHE
Beispiele 2.4.15 a) Sei m = 2. Zwei Zahlen sind genau dann modulo 2 kongruent, wenn sie
entweder beide gerade oder beide ungerade sind.
b) Sei m = 10. Zwei natürliche Zahlen sind modulo 10 genau dann kongruent, wenn sie dieselbe
letzte Ziffer in ihrer Dezimalzahldarstellung haben, z.B. 4 ≡ 34 ≡ 1024 (mod 10). Bei den
negativen Zahlen musst Du aufpassen: −6 ≡ −336 ≡ 4 (mod 10), nicht wahr?
d) Sei m = 5. In dem folgenden (im Prinzip unendlich großen) Diagramm stehen die Zahlen,
die kongruent modulo 5 sind, untereinander.
..
..
..
..
..
.
.
.
.
.
−10 −9 −8 −7 −6
−5 −4 −3 −2 −1
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14
15 16 17 18 19
..
..
..
..
..
.
.
.
.
.
Jede Spalte besteht also aus Zahlen die zueinander modulo 5 kongruent sind. Und zwei modulo
5 kongruente Zahlen befinden sich in derselben Spalte. Die Spalten obigen Diagramms, als
Mengen aufgefasst sind die Restklassen modulo 5.
Jede ganze Zahl kommt in dem Diagramm genau einmal vor, liegt also in einer, aber auch nur
einer der Spalten, d.h. einer Restklasse modulo 5. Die mittlere Spalte ist z.B. die Restklasse
von 7 modulo 5, aber auch die Restklasse von 2, auch die von -3, modulo 5.
Es gibt 5 Spalten.
Diese Dinge wollen wir allgemein einsehen.
Bemerkungen 2.4.16 Sei m ≥ 0 festgelegt.
a) Jede ganze Zahl liegt in einer Restklasse. Denn r = r + 0 · m liegt in r + mZ.
b) Die Zahlen, die in einer Restklasse modulo m liegen, sind modulo m zueinander kongruent.
c) Jede ganze Zahl n liegt in einer, aber auch nur einer Restklasse modulo m, nämlich – im
Falle m > 0 – in derjenigen, in der auch ρ(n) liegt. Siehe Bemerkung e) für den Fall m = 0.
Insbesondere sind je zwei verschiedene Restklassen disjunkt, d.h. sie haben kein Element
gemeinsam.
d) Ist m > 0, so gibt es genau m Restklassen modulo m, nämlich die folgenden
0 + mZ, 1 + mZ, 2 + mZ, . . . , (m − 1) + mZ
Ist nämlich n ganz, so dividiere n durch m mit Rest: n = r+km, wo 0 ≤ r ≤ m−1 ist. Dann gilt
n ≡ r (mod m). Deshalb ist n + mZ = r + mZ. Somit ist jede Restklasse von der angegebenen
Art. Seien nun r, s zwei ganze Zahlen mit 0 ≤ r ≤ s ≤ |m| − 1. Ist dann r + mZ = s + mZ, so
2.4. RESTKLASSEN
61
muss s − r durch m teilbar sein. Das geht nur, wenn s − r = 0 oder s − r ≥ m ist. Da s und r
kleiner als m sind, bleibt nur die Möglichkeit, dass r = s ist.
In dem nicht so interessanten Fall m = 1 gibt es eine einzige Restklasse modulo m, nämlich
ganz Z.
e) Die Restklassen modulo 0 sind die aus je einer Zahl bestehenden Teilmengen von Z. Es gibt
also unendlich viele von diesen.
Weiterhin sei ein m ∈ N gewählt, und wir wollen die Menge Z/(m) aller Restklassen modulo
m betrachten. Im Falle m > 0 besteht Z/(m) aus m Elementen. Um Z/(m) zu einem Ring zu
machen, beweisen wir zunächst
Lemma 2.4.17 Seien r ≡ r0 (mod m) und s ≡ s0 (mod m). Dann sind auch
r + s ≡ r0 + s0 (mod m) und rs ≡ r0 s0 (mod m).
Beweis: Nach Voraussetzung gibt es u, v ∈ Z mit r0 = r +mu, s0 = s+mv. Dann ist r0 +s0 =
r+s+(u+v)m und r0 s0 = (r+mu)(s+mv) = rs+mrv +msu+mumv = rs+m(rv +su+muv).
D.h. die Differenzen (r0 + s0 ) − (r + s) und r0 s0 − rs sind Vielfache von m.
Da die Aussage r + mZ = r0 + mZ (für ganze r, r0 ) äquivalent zu r ≡ r0 (mod m) ist, kann man
das o.a. Lemma auch wie folgt aussprechen:
Folgerung 2.4.18 Es gelte r + mZ = r0 + mZ und s + mZ = s0 + mZ. Dann gilt auch
(r + s) + mZ = (r0 + s0 ) + mZ, sowie (rs) + mZ = (r0 s0 ) + mZ.
Definition 2.4.19 Seien r + mZ, s + mZ Restklassen modulo m. Dann definieren wir ihre
Summe und ihr Produkt wie folgt:
(r + mZ) + (s + mZ) := (r + s) + mZ , (r + mZ) · (s + mZ) := (rs) + mZ
Dies ist eine richtige Definition. Denn wegen der o.a. Folgerung hängt das Ergebnis der Addition
und der Multiplikation nur von den Restklassen r+mZ und s+mZ und nicht von den speziellen
Wahlen der r, s ab.
Wir sagen in diesem und analogen Fällen: Die Addition (r + mZ) + (s + mZ) = (r + s) + mZ
und die Multiplikation (r + mZ) · (s + mZ) := (rs) + mZ seien wohldefiniert.
Ein Beispiel, wo das nicht der Fall ist, wäre der Versuch Potenzen, in denen Basis und Exponet
Restklassen modulo desselben m sind, auf folgende Weise zu definieren:
(j + mZ)(k+mZ) := (j k ) + mZ ???
Ein spezielles Beispiel kennst Du bereits. (S. nach 4.5). Es ist ja 1 + 10Z = 11 + 10Z, aber
21 + 10Z 6= 211 + 10Z. Noch ein Beispiel: Es ist zwar 2 + 3Z = 5 + 3Z, aber (22 ) + 3Z 6= (25 ) + 3Z.
Denn 22 ≡ 1 (mod 3), 25 ≡ 2 (mod3).
62
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkung 2.4.20 Man kann die Summe und das Produkt zweier Restklassen C1 , C2 auch
folgendermaßen definieren: Wähle c1 ∈ C1 und c2 ∈ C2 . Dann sei C1 + C2 diejenige Restklasse,
in der c1 + c2 liegt, und C1 C2 diejenige Restklasse, in der c1 c2 liegt.
2.4.21 Wir wollen jetzt einsehen, dass (für m > 0) der zuerst definierte Ring Zm und Z/(m)
im Wesentlichen dasselbe sind!
Dazu identifizieren wir Zm mit Z/(m) auf folgende Weise: Jedes r = 0, 1, . . . , m−1 identifizieren
wir mit der Restklasse r + mZ. (Das bedeute, dass umgekehrt die Restklasse r + mZ mit
ρ(r) identifiziert wird.) Addition und Multiplikation, die wir sowohl in Zm , als auch in Z/(m)
definiert haben, stimmen dann überein. Denn es gilt ja für r, s ∈ Zm , d.h. r, s ∈ {0, 1, . . . , m−1}
folgendes
(r + mZ) + (s + mZ) = (r + s) + mZ = ρ(r + s) + mZ = (r ⊕ s) + mZ
und dasselbe, wenn man ‘+’ durch ‘·’ und ‘⊕’ durch ‘⊗’ ersetzt.
Im folgenden will ich keinen Unterschied mehr zwischen den beiden Ringen Zm und Z/(m)
machen. Ich verwende nur noch die Bezeichnung Z/(m). (Es gibt auch die Bezeichnungen
Z/mZ, sowie Z/m.) Man sagt Z modulo m oder ausführlicher der Restklassenring von Z
modulo m.
Ich überlasse Dir, wie Du den Ring Z/(m) verstehen willst. Persönlich ziehe ich es vor, ihn
als Ring von Restklassen aufzufassen. Die Auffassung als Ring der Zahlen 0, 1, . . . , m − 1 mit
angepassten Rechenarten ist sicher anfangs einfacher zu verstehen, ist aber möglicherweise etwas
willkürlich und starr.
Anschaulich sollte man sich die Elemente von Z/(m) ‘kreisförmig angeordnet’ vorstellen. (Für
m = 6 zum Beispiel.)
2•
•1
3•
•0
4•
•5
Die Addition entspricht dann der Addition von Winkeln.
2.4.22 Repräsentanten. Erinnere Dich, dass Du mit 0 + mZ, 1 + mZ, 2 + mZ, . . . , (m −
1) + mZ, bereits alle Restklassen modulo m erfasst hast. Das System der ganzen Zahlen
(0, 1, 2, . . . , m − 1) ist ein sogenanntes Repräsentantensystem modulo m. Wie Du oben gesehen hast, ist ein solches gut dafür, in Z/(m) konkret zu rechnen.
Definition 2.4.23 Sei m > 0. Ein Repräsentantensystem modulo m ist ein System ganzer
Zahlen n1 , . . . , nm , derart das in jeder Restklasse modulo m genau eine der Zahlen ni liegt.
2.4. RESTKLASSEN
63
Beispiele 2.4.24 m aufeinander folgende Zahlen bilden immer ein Repräsentantensystem.
Folgende Repräsentantensyteme sind manchmal nützlich:
a) Das System 1, 2, . . . , m. (Beachte, dass die Restklasse von m das Nullelement von Z/(m) ist.
b) Falls m ungerade ist, das System (− m−1
, . . . , −1, 0, 1, . . . , m−1
).
2
2
Für m = 11 bekommst Du das Repräsentantensystem −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5. Um die
Multiplikation in Z/(11) vollständig zu beschreiben, genügt es, eine Tabelle für die Produkte
der Restklassen 0, 1, . . . , 5 anzugeben:
⊗
0
1
2
3
4
5
0
0
0
0
0
0
0
1 2 3 4 5
0 0 0 0 0
1 2 3 4 5
2 4 -5 -3 -1
3 -5 -2 1 4
4 -3 1 5 -2
5 -1 4 -2 3
Wenn Du z.B. (−3)·2 ausrechnen willst, zieh das Gesetz für die Multiplikation mit Vorzeichen in
Ringen heran, und Du erhältst (−3)·2 = −(3·2) = −(−5) = 5. D.h., es ist (−3+11Z)(2+11Z) =
5 + 11Z.
Du erkennst an dieser Tabelle auch, dass jedes Element ein multiplikativ Inverses hat. Denn in
jeder Zeile außer der obersten findet sich eine 1 oder eine −1. Z.B. ist 5 · 2 = −1. Daraus folgt
5 · (−2) = 1. Mithin ist −2 ein multiplikativ Inverses von 5. Du siehst: Z/(13) ist ein Körper.
c) Falls m gerade ist, die Systeme (− m2 +1, . . . , −1, 0, 1, . . . , m2 ) und (− m2 , . . . , −1, 0, 1, . . . , m2 −1).
Frage: Wann, d.h. für welche m, besitzt der Ring Z/(m) Nullteiler? Die Antwort ist einfach:
Satz 2.4.25 Sei m > 1. Der Ring Z/(m) besitzt genau dann Nullteiler, wenn m zerlegbar, d.h.
keine Primzahl ist.
Beweis: Sei m zerlegbar, m = k1 k2 , wo die (positiven) ki weder 1 noch m sind. Dann sind
die Restklassen (ki mod m) beide von 0 (der Restklasse (0 mod m)) verschieden, aber es gilt
(k1 mod m)(k2 mod m) = (m mod m) = (0 mod m).
Sei m = p eine Primzahl, und es gelte (k1 k2 mod p) = (0 modp). Dann ist p ein Teiler von
k1 k2 . Nach Euklids Lemma ist dann p ein Teiler von k1 oder von k2 . Etwa sei p|k1 . Dann ist
(k1 mod p) die Nullrestklasse.
Wenn p eine Primzahl ist, ist Z/p wegen folgenden Satzes sogar ein Körper.
Satz 2.4.26 Sei R ein endlicher Ring. Ist c ∈ R kein Nullteiler, so ist c (multiplikativ) invertierbar, d.h. es gibt zu c ein multiplikativ Inverses.
Ein endlicher nullteilerfreier Ring ist ein Körper.
64
KAPITEL 2. NEUE RECHENBEREICHE
Beweis: Seien a1 , . . . , an die endlich vielen untereinander verschiedenen Elemente von R.
Dann sind die n Elemente ca1 , ca2 , . . . , can nach der Kürzungsregel untereinander verschieden.
Sie machen also alle Elemente von R aus. Eines unter ihnen, etwa caj ist also gleich 1. Das
bedeutet aber, dass aj das Inverse von c ist.
Beispiele 2.4.27 a) Im Körper Z/13 ist 2 das multiplikativ Inverse von 7 und 3 das multiplikativ Inverse von 9.
b) In dem Ring Z/26 ist 15 das multiplikativ Inverse von 7. Beachte hierzu, dass (a mod m) in
Z/(m) genau dann multiplikativ invertierbar ist, wenn a zu m teilerfremd ist. Dies ergibt sich
z.B. aus der nächsten Bemerkung.
c) Der unendliche Ring Z ist zwar nullteilerfrei, aber kein Körper.
Bemerkung 2.4.28 Du kannst das multiplikativ Inverse eines Elementes von Z/(m) durch
zeitaufwändiges Probieren finden. Glücklicherweise kann man mit Hilfe des euklidischen Algorithmus dasselbe viel schneller berechnen. (Beachte dabei, dass Euklid unser Problem gar nicht
kannte.)
Frage: Wie berechnet man das multiplikativ Inverse der Restklasse von a in Z/(m), wenn a
zu m teilerfremd ist?
Antwort: Mit Hilfe des euklidischen Algorithmus bestimmt man a0 , m0 ∈ Z, für die
aa0 + mm0 = 1 gilt. Dann ist die Restklasse von a0 modulo m multiplikativ invers zu der von a.
2.4.29 Wir kennen jetzt unendlich viele endliche Körper, da es unendlich viele Primzahlen
gibt. Es gibt weitere endliche Körper, nämlich einen zu jeder Primzahlpotenz pn mit ganzem
positiven n. Beachte aber, dass Z/(pn ) für n ≥ 2 Nullteiler 6= 0 hat, also nicht etwa der gesuchte
Körper aus pn Elementen sein kann.
Bemerkung 2.4.30 Du kannst ja mal versuchen, ob Du Restklassen in der Menge Q der
rationalen Zahlen bilden und auch mit ihnen rechnen kannst. Sei m eine positive ganze (oder
auch rationale) Zahl. Betrache ’Restklassen’ a + mZ für beliebige rationale Zahlen a. Du kannst
zeigen, dass jede rationale Zahl in genau einer solchen Restklasse liegt.
Willst Du zwei solche Restklassen wie oben addieren, geht das gut. (Zeige das!) Willst Du
sie multiplizieren, kommst Du in Schwierigkeiten. Seien etwa m = 1, a = 1/2, a0 = 3/2 und
b = 1/2. Dann gilt a + Z = a0 + Z aber ab + Z 6= a0 b + Z, da 3/4 − 1/4 nicht ganz ist.
Die Menge Q/mZ erfüllt in Bezug auf die Addition die Axiome, die für die Addition in einem
Ring gelten.
2.4. RESTKLASSEN
65
AUFGABEN
1. Man kann den Körper Z/(3), wie Du oben gesehen hast, auch wie folgt beschreiben. Die Elemente seien mit −1, 0, 1 bezeichnet. Die Multiplikation ist so definiert als handle es sich um die
entsprechenden Elemente von Z. Für die Addition gelte 1 + 1 = −1 , (−1) + (−1) = 1, und
die übrigen sieben Summen seien wieder so definiert, als handle es sich um die entsprechenden
Elemente von Z.
2. a) Bestimme die Quadrate in dem Ring Z/(8).
b) Eine im Dezimalsystem geschriebene mindestens dreistellige natürliche Zahl, die als letzte
drei Ziffern 2 Einsen und eine 0 in beliebiger Reihenfolge hat (...011, ...101, ...110), ist keine
Quadratzahl. (Zeige dies etwa mit Hilfe von a).)
3. Sei M eine endliche Menge von n + 1 (verschiedenen) ganzen Zahlen und n ≥ 1. Zeige, dass
mindestens eine der Differenzen von zwei verschiedenen Elementen von M durch n teilbar ist.
4. Es soll eine Fahne mit einem Muster folgender Art entworfen werden:
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
∗
D.h. n Sterne sollen in zwei Quadrate von m1 × m1 bzw. m2 × m2 Sternen angeordnet werden,
die sich in einem Quadrat von k × k Sternen überlappen. Dabei soll zwar n, aber keine der
drei Zahlen m1 , m2 , k ein Vielfaches von 5 sein. (Darum sind m1 = 0, m2 = 0 und k = 0 auch
ausgeschlossen.) Ist das möglich?
5. a) Sei m ∈ N, m =
k
X
ai 10i mit ai ∈ Z. (Sind die ai aus der Menge der ’Ziffern’ 0, 1, 2, . . . , 9
i=0
gewählt, so beschreibt dies die Dezimalzahldarstellung von m.) Zeige:
k
k
k
X
X
X
m≡
ai (mod 3) und m ≡
ai (mod 9) und m ≡
(−1)i ai (mod 11).
i=0
i=0
i=0
Den jeweiligen Ausdruck auf der rechten Seite der Kongruenzen nennt man, wenn die ai die
Ziffern der Dezimalzahldarstellung von m sind, in den ersten beiden Fälle die Quersumme, im
letzten Fall die alternierende Quersumme der Zahl m. Dieser Begriff ist kein wirklich mathematischer Begriff, insofern als er von der Schreibweise im Dezimalsystem abhängt.
b) Leite daraus die bekannten Kriterien für die Teilbarkeit von in Dezimalschreibweise gegebenen Zahlen durch 3, 9 bzw. 11 ab.
66
KAPITEL 2. NEUE RECHENBEREICHE
c) Schreibe die natürliche Zahl n im Dezimalsystem mit ungerade vielen Ziffern. Dabei darf
die erste Ziffer eine 0 sein. Bilde die Spiegelzahl n0 von n. (Die Spiegelzahl von z.B. 01234 ist
43210.) Zeige: 99 teilt n − n0 .
d) Gilt dies auch, wenn n mit gerade vielen Ziffern geschrieben ist? Gilt in diesem Fall zumindest
noch 9|n − n0 ?
e) Bei einer Unterhaltung bittet Dich Dein Gegenüber, Du mögest eine beliebige 5-stellige
(natürliche) Zahl, die nicht kleiner als 10050 ist, im Dezimalsystem – vor ihm verborgen –
notieren, und die Quersumme von dieser Zahl subtrahieren. Wenn Du ihm dann die letzten 4
Ziffern dieser Differenz in beliebiger Reihenfolge angibst, so macht er sich anheischig, die erste
zu nennen. Wie macht er das?
6. Von der Schule her ist Dir vielleicht die Neunerprobe“ geläufig. Eine ausgeführte Multiplikation
”
zweier (größerer) Zahlen kann man auf ihre Richtigkeit folgendermaßen testen: Der Neunerrest“
”
(d.h. der Rest bei der Division durch 9) des Produktes muss gleich dem Neunerrest“ des
”
Produktes der Neunerreste“ der Faktoren sein. Wieso gilt das? Ist es möglich, dass eine falsche
”
Multiplikation diesen Test besteht?
7. Sei d ∈ N2 . Entwickle für d–adisch geschriebene Zahlen (d.h. wo die Grundzahl 10 für das
Dezimalsystem durch eine natürliche Zahl d ≥ 2 ersetzt ist) Kriterien für die Teilbarkeit durch
2 (bzw. 3). Die Art eines solchen Kriteriums sollte nur von der Restklasse (d mod 2) (bzw. (d
mod 3)) abhängen.
8. Auf einem Blatt stehen alle natürlichen Zahlen von 1 bis 101 – jede genau einmal – geschrieben.
Indem man willkürlich zwei von ihnen, genannt x und y, ausradiert und die Zahl x5 +y hinzufügt,
vermindert man die Anzahl der Zahlen um 1. (Jede Zahl wird so oft gezählt, wie sie auf dem
Papier steht.) Indem man dieses (nicht völlig determinierte) Verfahren noch 99 mal wiederholt,
bleibt schließlich eine Zahl übrig. Kannst Du die letzte Ziffer dieser Zahl angeben, ohne mehr
zu wissen, als oben angegeben ist?
Löse diese Aufgabe zunächst rein theoretisch. Dann mache Dir klar, das die praktische
Ausführung obiger Anweisung leicht an ihre Grenzen stößt, da die Zahlen riesig werden.
9. Angenommen, Du gießt Deine Topfpflanzen jeden 2. (bzw. 3., bzw. 4., bzw. 5., bzw. 6.) Tag
und beginnst damit an einem Sonntag. Gibt es einen Wochentag, an welchem Du nie gießt?
10. Kalendarisches: Nach dem – aus der Mode gekommenen –Julianischen Kalender ist genau dann
ein Schaltjahr, wenn die Jahreszahl durch 4 teilbar ist. Nach dem heute gültigen Gregorianischen
Kalender ist dies in der Regel auch so, allerdings mit Ausnahme der Jahre, deren Jahreszahl
durch 100, aber nicht durch 400 teilbar ist. letztere sind keine Schaltjahre.
a) Zeige: Für den Julianischen (bzw. Gregorianischen) Kalender gilt (mit n, m ∈ N1 ):
n ≡ m(mod 28)
(bzw. n ≡ m(mod 400)
=⇒
Die Jahre n und m beginnen
mit demselben Wochentag.
2.4. RESTKLASSEN
67
b) Angenommen, der Julianische Kalender wäre seit dem Jahre 1 unverändert in Kraft, so wäre
der Wochentag, mit dem das Jahr n beginnt, der Tag
n−1
n+
mod 7 ,
4
wobei (1 mod 7) derjenige Wochentag ist, mit dem das Jahr 1 begann, (2 mod 7) der nächste
Wochentag usw. ([ ] ist die Gaußklammer.)
Diese Formel kann man auf die Jahre 1901 bis 2100 anwenden. Dabei ist (1 mod 7) der Sonntag,
da 1989 ≡ 1 (mod 28) ist und das Jahr 1989 mit einem Sonntag begann.
Übrigens ist
n−1
≡ 5q + r ≡ −2q + r (mod 7),
n+
4
wenn
n = 4q + r mit r ∈ {1, 2, 3, 4}
ist.
Überzeuge Dich von der Richtigkeit aller Behauptungen.
c) Für den Gregorianischen Kalender ergibt sich: Das Jahr n beginnt mit dem Wochentag
n−1
n−1
n−1
n+
−
+
mod 7 .
4
100
400
Dabei ist (1 mod 7) der Dienstag, da das Jahr 1991 mit einem Dienstag begann.
Stimmt’s?
d) Zeige: Nach dem Julianischen Kalender fällt im langjährigen Durchschnitt der 13. eines jeden
Monats auf jeden Wochentag gleich oft.
e) Dies ist nicht so nach dem Gregorianischen Kalender. Nach [Forster], Aufgabe 1.5 fällt er
am häufigsten auf den Freitag. Wer dies nachprüfen möchte, sollte – um Arbeit zu sparen – das
Jahr am 1. März beginnen lassen.
11. Bestimme die Inversen (bzgl. der Multiplikation) von (2 mod m) für ungerade und von (3 mod
m) für nicht durch 3 teilbare m.
12. a) Ist (1777 mod 1855) in dem Ring Z/(1855) multiplikativ invertierbar? Bestimme gegebenenfalls das Inverse!
b) Welche Bedeutung haben die beiden in a) genannten Zahlen für die Mathematikgeschichte?
13. Seien x, y ∈ Z. Zeige: Ist 3x + 2y durch 17 teilbar, so auch 5x + 9y.
14. Bestimme die drei letzten Ziffern von 19951995! + 1 .
15. Welche Teilbarkeitsaussage kann man über natürliche Zahlen der folgenden Art machen? Bei
ihrer Darstellung im Dezimalsystem kommen alle Ziffern von 1 bis 8 gleich oft vor. (Die Anzahl
der 0-en und 9-en ist beliebig.)
68
KAPITEL 2. NEUE RECHENBEREICHE
16. Bestimme sämtliche Primzahlen p mit folgender Eigenschaft: In Z/(p) ist die Restklasse von
7 zu der von 13 multiplikativ invers. Insbesondere sollst Du begründen, dass die angegebenen
Primzahlen wirklich alle mit dieser Eigenschaft sind.
17. Betrachte in M2 (Z/3) die Potenzen
n
A der Matrix A :=
1 1
1 0
, n∈N.
a) Zeige An = An+8 , und berechne dabei die Potenzen A0 , . . . , A7 .
b) Zeige dass die Matrizen A0 , . . . , A7 , 0 einen Körper bilden. Es gibt also einen Körper von 9
Elementen.
1 1
Bemerkung: Betrachte die Matrix
in M2 (Z/5). Genau genommen, ist diese eine
1 0
andere Matrix als die o.a. Matrix A, da ihre Einträge einem anderen Ring angehören. Ihre
Potenzen, zusammen mit der 0-Matrix bilden keinen Ring. Mit ein paar grundlegenden algebraischen Tatsachen, die allerdings in diesem Buch nicht bewiesen werden, ist das leicht zu
zeigen.
2.5
Geometrische Reihe, binomischer Lehrsatz
Ich habe mir sagen lassen, es gäbe 3 binomische Lehrsätze:
1. binomischer Lehrsatz: (a + b)2 = a2 + 2ab + c2 .
2. binomischer Lehrsatz: (a − b)2 = a2 − 2ab + b2 .
3. binomischer Lehrsatz: (a − b)(a + b) = a2 − b2 .
(Im Bereich der reellen (oder rationalen) Zahlen kann man diese Sätze auch geometrisch beweisen. Tu
das!)
Die obigen Bezeichnungen sind in meinen Augen irritierend.
Denn erstens ist der sog. 2. binomische Lehrsatz ja gar nichts anderes als der 1. Wenn man
nämlich b0 = −b setzt und (a + b0 )2 nach dem 1. binomischen Lehrsatz berechnet, erhält man
(a + b0 )2 = a2 + 2ab0 + b02 = a2 + 2a(−b) + (−b)2 = a2 − 2ab + b2 .
Zweitens ist der binomische Lehrsatz viel allgemeiner, als die oben angegebene simple
Formel. Er gibt nämlich allgemein eine Formel für die n-te Potenz (a + b)n an.
Drittens ist der sogenannte 3. binomische Lehrsatz eigentlich ein Spezialfall der geometrischen
Reihe.
Mit dieser fangen wir an.
Wir rechnen in einem kommutativen Ring R. In nicht kommutativen Ringen gelten die Formeln,
die wir erhalten werden, meist nicht. Z.B. ist (a + b)(a − b) = a2 + ba − ab − b2 und letzteres ist
nur dann gleich a2 − b2 , wenn ab = ba gilt.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
69
2.5.1 Geometrische Reihe. Wir berechnen folgendes Produkt, wo der zweite Faktor eine
geometrische Reihe ist:
(a − b)(an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn ) =
an+1 + an b1 + an−1 b2 + · · · · · · + a1 bn
− an b1 − an−1 b2 − · · · · · · − a1 bn − bn+1
= an+1 − bn+1
Ist a 6= b und der Ring R ein Körper, so folgt:
an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn =
Mit dem
an+1 − bn+1
a−b
P
-Zeichen geschrieben haben wir unter den jeweils erforderlichen Voraussetzungen:
(a − b)
n
X
a
n−i i
b =a
n+1
−b
n+1
, und
i=0
n
X
an−i bi =
i=0
an+1 − bn+1
.
a−b
Speziell erhält man für a = 1, b = x:
(1 − x)
n
X
i
x =1−x
n+1
i=0
und
n
X
xi =
i=0
1 − xn+1
.
1−x
(Die zweite Aussage gilt für x 6= −1.)
Satz 2.5.2 Sei f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ein sogenanntes Polynom mit den
Koeffizienten ai in einem kommutativen Ring R, welches ein α ∈ R als Nullstelle hat, so kann
man es folgendermaßen schreiben:
f (x) = (x − α) · g(x) ,
wo g(x) ein weiteres Polynom über R ist.
Der Faktor x − α heißt der zu α gehörige Linearfaktor.
Beweis:
(∗)
Nach Voraussetzung ist f (α) = an αn + · · · + a1 α + a0 = 0. Also gilt
f (x) = f (x) − f (α) = an (xn − αn ) + an−1 (xn−1 − αn−1 ) + · · · + a1 (x − α) + 0
Nach der Formel für die geometrische Reihe ist
xk − αk = (x − α)(xk−1 + xk−2 α + · · · + xαk−2 + αk−1 ) .
Aus jedem Summanden auf der rechten Seite der zweiten Identität in (∗) lässt sich also der
Faktor (x − α) herausziehen.
70
KAPITEL 2. NEUE RECHENBEREICHE
Bemerkung 2.5.3 Sei R ein Ring. Ein Polynom über R ist ein ‘Ausdruck’ der Form
a0 + a1 x + a2 x2 + · · · + an xn mit ai ∈ R
Die ai heißen die Koeffizienten des Polynoms. Ein solcher Ausdruck kann als ‘Funktion’
der Variablen x aufgefasst werden, wobei man für x die Elemente von R oder auch eines
Erweiterungsringes von R ‘durchläuft’.
Folgerung 2.5.4 Sei f (x) ein vom Nullpolynom verschiedenes Polynom vom Grade n mit
Koeffizienten in einem nullteilerfreien, kommutativen Ring (etwa einem Körper) R, so hat es
in R höchstens n verschiedene Nullstellen.
Beweis: Sei α1 eine Nullstelle von f (x), so kann man f (x) = (x − α1 )g(x) schreiben mit
einem Polynom g(x) über R vom Grad n − 1. Hat nun g(x) eine Nullstelle α2 , so kann man den
zugehörigen Linearfaktor abspalten. Dies Verfahren kann man fortsetzen und erhält schließlich
f (x) = (x − α1 ) · · · (x − αm )h(x)
wo h(x) ein Polynom über R ist, das in R keine weiteren Nullstellen hat. Da R nullteilerfrei
ist, ist f (β) = 0 nur dann, wenn einer der Faktoren (β − αi ), bzw. h(β) gleich 0 ist. Letzteres
kann nicht sein, wenn β ∈ R ist. Also ist die Anzahl der Nullstellen von f (x) höchstens gleich
m und natürlich m ≤ n. (Es ist nicht ausgeschlossen, dass αi = αj für verschiedene i, j ist.) Beispiel 2.5.5 Der Ring R = Z × Z ist nicht nullteilerfrei. Das Polynom x2 − x hat in diesem
Ring die vier Nullstellen (0, 0), (0, 1), (1, 0), (1, 1). Dies ist nur eins von vielen Beispielen.
2.5.6 Geometrische Reihen spielen in der Mathematik eine große Rolle, insbesondere da man
unendlichen geometrischen Reihen oft einen Sinn zu geben vermag. Im Reellen hat die unendliche Reihe
∞
X
xn = 1 + x + x2 + x3 + · · ·
k=0
1
, wenn −1 < x < 1 ist. Durch Vergleich mit
immer dann einen sinnvollen Wert, nämlich 1−x
dieser Reihe kann man sehen, dass auch viele andere unendliche Reihen einen sinnvollen Wert
besitzen.
2.5.7 Jetzt wenden wir uns der binomischen Formel zu. Unser Ziel ist es, möglichst gut zu
beschreiben, was beim ‘Ausmultiplizieren’ von (a + b)n für beliebige natürliche Zahlen n herauskommt.
Wenn man in einem Ring R rechnet, der den Ring Z der ganzen Zahlen als Unterring besitzt,
etwa in den Körpern Q oder R, dann ist natürlich ka für k ∈ Z, a ∈ R definiert, weil ja dann
auch k ∈ R ist. Diesen speziellen Fall wollen wir im Folgenden bevorzugt betrachten.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
71
Man kann aber auch für eine ganze Zahl k und ein Element a aus einem beliebigen Ring R den
Ausdruck ka definieren.
Ist k > 0, so sei ka = a + · · · + a, wo die Anzahl der Summanden k sei. Ferner sei 0a = 0R , wo wir
der Deutlichkeit halber mit 0R das Nullelement von R bezeichnen. Ist schließlich k < 0, etwa k = −n.
Dann sei ka = (−n)a := −(na).
Es gelten folgende Gesetze:
1a=a, wo 1 das Einselement von Z bezeichnet;
(kl)a=k(la)
k(ab)=(ka)b=a(kb)
(k+l)a=ka+la
k(a+b)=ka+kb.
2.5.8 Jetzt behandeln wir den eigentlichen binomischen Lehrsatz.
Um das Muster zu erkennen, nach welchem (a + b)n umgeformt wird, wollen wir die ersten Fälle
nacheinander behandeln:
(a + b)2 = (a + b)(a + b) =
a2 + ab
+ ab +b2
= a2 + 2ab + b2 .
(a + b)3 = (a + b)(a2 + 2ab + b2 ) =
a3 + 2a2 b + ab2
+ a2 b + 2ab2 + b3
= a3 + 3a2 b + 3ab2 + b3 .
(a + b)4 = (a + b)(a3 + 3a2 b + 3ab2 + b3 ) =
a4 + 3a3 b + 3a2 b2 + ab3
+ a3 b + 3a2 b2 + 3ab3 + b4
= a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
(a + b)5 = (a + b)(a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 ) =
a5 + 4a4 b + 6a3 b2 + 4a2 b3 + ab4
+ a4 b + 4a3 b2 + 6a2 b3 + 4ab4 + b5
= a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5
72
KAPITEL 2. NEUE RECHENBEREICHE
2.5.9 Die n-te Potenz von a + b lässt sich im Prinzip wie folgt schreiben:
(a + b)n = an +?an−1 b+?an−2 b2 + · · · +?a2 bn−2 +?abn−1 + bn ,
wo anstelle der Fragezeichen gewisse ganzzahlige Koeffizienten, die so genannten Binomialkoeffizienten, stehen. Wir stellen uns die Aufgabe, diese genauer zu bestimmen. Zunächst
erkennen wir, dass die Koeffizienten für die (n + 1)-te Potenz sich aus denen der n-ten ergeben,
indem man jeweils zwei benachbarte Koeffizienten für die n-te Potenz addiert.
Genauer gilt: Der Koeffizient von an+1−k bk (in der Entwicklung von (a + b)n+1 ) ist die Summe
der Koeffizienten von an−k bk und von an−k+1 bk−1 (in der Etwicklung von (a + b)n ).
Es ergibt sich folgendes Schema, das sogenannte Pascal’sche Dreieck:
1
1
1
1
1
2
3
1
3
1
1
4
6
4
1
1
5
10
10
5
1
. . . . . . . . . . . . .
An der Spitze dieses ‘Dreiecks’ (sozusagen in der 0-ten Zeile) steht der Koeffizient von a0 b0
der ‘Entwicklung’ von (a + b)0 . In der folgenden ‘ersten’ Zeile stehen die Koeffizienten von a,
bzw. b in der Entwicklung von (a + b)1 In der n-ten Zeile stehen dann die Koeffizienten von
an , an−1 b, an−2 b2 , . . . , bn der Entwicklung von (a + b)n . Man darf man sich das Schema rechts
und links durch 0-en ausgefüllt denken. Jede Zahl in diesem Schema, abgesehen von der 1 an
der Spitze, ist dann die Summe der beiden unmittelbar schräg über ihr stehenden Zahlen. Zur
Übung solltest Du zumindest die nächsten beiden Zeilen des Pascalschen Dreiecks ausfüllen.
Es ist übrigens gar nicht die schlechteste Idee, die Binomialkoeffizienten durch wiederholte
Addition mit dem Pascalschen Dreieck zu berechnen, besonders dann, wenn Du nicht nur einen
einzelnen bestimmen willst. Wir werden im folgenden Abschnitt geschlossene Formeln für sie
finden. Diese sind aber auch nicht schnell auszurechnen.
2.5.10 Mit Hilfe der Fakultät kann man die Binomialkoeffizienten geschlossen hinschreiben.
Das wollen wir jetzt tun. Zunächst definieren wir für natürliche Zahlen n, k mit 0 ≤ k ≤ n:
n(n − 1) · · · (n − (k − 1))
n
n!
=
:=
k!(n − k)!
k!
k
(Sowohl Zähler wie Nenner des letzten Bruches bestehen, ausgeschrieben, aus k Faktoren,
während Zähler und Nenner des ersten Bruches aus je n Faktoren bestehen. Das erste Gleichheitszeichen mit dem Doppelpunkt davor ist eine Definitionsgleichung, das zweite ist eine mittels
‘Kürzen’ leicht einzusehende Identität.) Beachte
n
n
n
n
=
= 1 und
=
.
0
n
k
n−k
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
73
Lemma 2.5.11 Für natürliche Zahlen k, n mit 0 ≤ k ≤ n − 1 gilt:
n
n
n+1
+
=
k
k+1
k+1
Der Beweis ist eine leichte Bruchrechnungsübung.
n!
(k + 1)n! + (n − k)n!
(n + 1)!
n!
+
=
=
k!(n − k)! (k + 1)!(n − k − 1)!
(k + 1)!(n − k)!
(k + 1)!(n + 1 − (k + 1))!
Beachte: Da 10 = 11 = 1 ist, erkennt man sofort, dass nk gleich der Zahl ist, die an der
entsprechenden Stelle im Pascalschen Dreieck auftaucht, d.h. als k-te Zahl in der n-ten Zeile.
Dabei haben wir das Zählen jeweils mit 0 begonnen, weil es hier zweckmäßig ist.
Jedenfalls sind somit offenbar die nk die gesuchten Binomialkoeffizienten. Der Beweis folgenden
Theorems ist eigentlich nur eine Wiederholung.
Theorem 2.5.12
n
(a + b) =
n X
n
an−k bk =
k
k=0
n n−1
n n−2 2
n
n
n
2 n−2
a +
a b+
a b + ··· +
ab
+
abn−1 + bn
1
2
n−2
n−1
n
D.h. wenn man (a + b)n ausmultipliziert, ist k der Koefizient von an−k bk .
Beweis:
Induktion nach n, wobei der Fall n = 1 trivial ist, da
1
0
=
1
1
= 1 gilt.
Induktionsschritt: Wir nehmen an, obige Formel gelte für ein n und müssen sie dann für n + 1
zeigen.
(a + b)n+1 = (a + b)(a + b)n =
n n 1
n n−1 2
n 1 n
a
+
a b +
a b + ······· +
ab
1
2
n
n n 1
n n−1 2
n
+
a b +
a b + ······· +
a1 bn + bn+1
0
1
n−1
n+1 n 1
n + 1 n−1 2
n+1 1 n
n+1
=a
+
a b +
a b · ········· +
a b + bn+1 .
1
2
n
n+1
2.5.13 Die Bedeutung der Binomialkoeffizienten beschränkt sich nicht auf den binomischen
Lehrsatz.
Angenommen, Du möchtest als Lottospieler wissen, wieviele Möglichkeiten es gibt, aus den
Zahlen 1, 2, 3, . . . , 49 sechs Zahlen auszuwählen.
74
KAPITEL 2. NEUE RECHENBEREICHE
Nun für die Wahl der ersten Zahl hast Du 49 Möglichkeiten. Für die Wahl der zweiten Zahl
bleiben noch 48 Möglichkeiten usw. Insgesamt hast Du 49 · 48 · 47 · 46 · 45 · 44 Möglichkeiten,
nacheinander 6 Zahlen aus den 49 Zahlen zu wählen, ohne dass sich eine wiederholt.
Dabei hast Du allerdings zwei Auswahlen von 6 Zahlen unterschieden, wenn die Reihenfolge der Auswahlen verschieden war. Z.B. hast Du die Wahl 7,14,21,28,35,42 von der Wahl
14,7,21,28,35,42 unterschieden, d.h. beide gesondert gezählt. In wieviel verschiedenen Reihenfolgen kann man die sechs Zahlen 7,14,21,28,35,42 auswählen? Nun wir wissen bereits, dass
man sechs Zahlen in 6! verschiedenen Reihenfolgen angeben kann. Wenn Du also nur wissen
willst, wieviele Möglichkeiten es gibt, aus 49 Zahlen sechs auszuwählen, ohne deren Reihenfolge
zu beachten, so erhältst Du die Zahl
49 · 48 · 47 · 46 · 45 · 44
49
=
6!
6
Rechne diese Zahl aus! (Kürze vor dem Multiplizieren!)
Allgemein besitzt eine Menge von n Elementen nk Teilmengen von k Elementen. (Das gilt auch
wenn man nk = n(n−1)···(n−k+1)
definiert und k > n ist. Denn dann taucht im Zähler der Faktor
k!
0 auf.)
Auf dieser Grundlage gibt es eine weitere Möglichkeit, den Binomialsatz zu beweisen:
Man stelle sich (a + b)n als Produkt von n Faktoren geschrieben vor:
(a + b)(a + b)(a + b) · · · (a + b)
Wenn man dieses Produkt ausmultipliziert, bedeutet dies, dass man alle möglichen Produkte
bildet, wo aus jedem Faktor einer der beiden Summanden
ausgewählt wird und anschließend
n
diese Produkte addiert werden. Offenbar gibt es
Möglichkeiten, aus k Faktoren den Sumk
manden b und aus
den
übrigen n − k Faktoren den Summanden a auszuwählen. Das Produkt
n
an−k bk tritt also
-mal auf.
k
Bemerkung 2.5.14 Die Binomialkoeffizienten, so wie wir sie bislang kennengelernt haben,
sind natürliche Zahlen. Denn wenn man sie z.B. nacheinander in dem Pascalschen Dreieck
durch Addition gewinnt, muss man immer zwei natürliche Zahlen addieren.
Hieraus folgt,dass
k! Teiler eines jeden Produktes von k aufeinander folgenden ganzen Zahlen
n
n(n − 1) · · · (n − k + 1)
ist. Es ist ja
=
. Bedenke, dass es nicht genügt, zu zeigen, dass
k
k!
jede der Zahlen 1, . . . , k eine der k Zahlen n, n − 1, . . . , n − k + 1 teilt.
Ist k > n, so tritt in dem Produkt n(n − 1) · · · (n − k + 1) der Faktor 0 auf, so dass dieses
Produkt auch in diesem Fall durch k! teilbar ist.
a
Man betrachtet auch verallgemeinerte Binomialkoeffizienten
, wo a nicht notwendig ganz
k
ist. Ein solcher braucht nicht ganz zu sein.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
75
2.5.15 Man kann die Binomialkoeffizienten benutzen, um elementare Aussagen über Primzahlen zu beweisen. Das hat zwei Gründe:
Erstens kann man die Größe der Binomialkoeffizienten gut abschätzen. Z.B. gilt:
n X
n
n
(1 + 1) =
k
k=0
weshalb auch der größte unter den nk , k = 0, 1, . . . , n (für n ≥ 1)kleiner als 2n ist. Entsprechendes gilt für die Summe einiger dieser Binomialkoeffizienten.
Zweitens kann man verhältnismäßig starke Aussagen über die Primfaktoren von nk beweisen.
Als Beispiel beweisen wir:
Satz 2.5.16 Für jede natürliche Zahl n ≥ 2 gilt: Das Produkt der Primzahlen p ≤ n ist kleiner
als 4n−1 . Symbolisch:
Y
p < 4n−1
p≤n
Dabei istPp eine Variable für Primzahlen. Und
zeichen
verwendet.
Q
wird als Produktzeichen analog zum Summen-
(Sicher ist dies eine ziemlich grobe Abschätzung. Bedenke aber, dass diese Abschätzung falsch
wird, wenn man die Primzahlen ≤ n etwa durch alle – oder auch nur alle ungeraden – positiven
ganzen Zahlen ≤ n ersetzt.)
Beweis:
Zunächst zeige ich folgende
Behauptung: 2n+1
≤ 4n .
n
P
2n+1
Beweis hierfür: Da 2n+1
= 22n+1 ist, gilt
k=0
k
2n + 1
2n + 1
+
< 22n+1
n
n+1
Ferner ist 2n+1
= 2n+1
, also
n
n+1
2n + 1
2·
< 22n+1 ,
n
woraus die Behauptung unmittelbar folgt. –
Zum Beweis des Satzes benutzen wir Induktion nach n und vergewissern uns zunächst, dass er
für n = 2 richtig ist.
Sei jetzt n ≥ 3; und wir nehmen die Gültigkeit des Satzes für alle kleineren ganzen Zahlen
(≥ 2) an.
1. Fall: n sei gerade. Dann ist n keine Primzahl (da 2 die einzige gerade Primzahl ist). In diesem
Falle ist also
Y
Y
p=
< 4n−2 < 4n−1 .
p≤n
p≤n−1
76
KAPITEL 2. NEUE RECHENBEREICHE
2. Fall: n sei ungerade, etwa n = 2m + 1 (mit m ≥ 1). Dann ist nach Induktionsvoraussetzung
Y
p < 4m
p≤m+1
In der Primfaktorzerlegung von 2m+1
=
m
m + 1 < p ≤ 2m + 1 auf. Somit gilt
(m+1)(m+2)···(2m+1)
1·2···m
Y
p≤
m+1<p≤2m+1
tauchen alle Primzahlen p mit
2m + 1
< 4m .
m
Insgesamt ist
Y
p < 4m 4m = 42m = 4(2m+1)−1
p≤2m+1
Bemerkung 2.5.17 Nicht beweisen will ich hier das sogenannte Bertrandsche Postulat. Es
lautet:
Zu jedem n ∈ N1 gibt es eine Primzahl p mit n < p ≤ 2n.
Es lässt sich mit Hilfe von Binomialkoeffizienten elementar (d.h. ohne Hilfe komplexer Zahlen
und deren Analysis) verhältnismäßig einfach beweisen. (Obiger Satz wird dafür gebraucht.)
Ich verweise Dich aufs Internet.
AUFGABEN
n
1. Seien x, y, m, n ∈ Z, m, n ≥ 1 und p eine Primzahl. a) Zeige: Ist x ≡ y mod pm , so ist xp ≡
n
y p mod pm+n .
b) Gilt die Behauptung auch für m = 0?
c) Zeige, dass die Umkehrung nicht gilt.
2. Zeige: Wenn a, b > 0 sind und n ≥ 2 ganz ist, so ist
√
n
an + bn < a + b.
3. a) Wenn a, n ∈ N2 gilt und an + 1 eine Primzahl ist, so ist a gerade und n = 2m mit einem
m ∈ N.
b) Wenn a, n ∈ N und an − 1 prim ist, so ist a = 2 und n prim.
(Hinweis: Geometrische Reihe.)
c) Es ist 82 + 1 keine Primzahl und auch 211 − 1 = 2047 = 23 · 89 keine solche. Warum steht
dieses nicht im Widerspruch zu a), bzw. b)?
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
77
4. a) Im Bereich der natürlichen Zahlen sei c ein Teiler von ab und c < a sowie c < b. Zeige, dass
dann ab/c keine Primzahl ist.
b) 11 ist eine Primzahl, 111 nicht (warum?). Zeige: Ist im Dezimalsystem eine n-stellige Zahl,
deren sämtliche Ziffern gleich 1 sind, eine Primzahl, so muss auch n eine Primzahl sein. Die
Umkehrung ist leider falsch, wie das Beispiel 111 lehrt.
c) 101 ist eine Primzahl, 10101 nicht. Gibt es neben 101 überhaupt Primzahlen, die im Dezimalsystem abwechselnd die Ziffern 1 und 0 haben? (Tipp: Stelle 1010 . . . 101 als geometrische
Reihe dar und benutze a).)
5. Bestimme (mit Hilfe der Formel für die geometrische Reihe) einen Primfaktor von 2148 + 1.
Bemerkung: Der komplementäre Faktor ist ebenfalls prim, wie A. Ferrier (von dem ich leider
nichts weiß) ohne elektronische Rechner (allerdings mit einer mechanischen Rechenmaschine)
um 1950 nachgewiesen hat. Damals war das ein Rekord!
√
√
6. a) Zeige: Für jede natürliche Zahl n ist (1 + 2)n + (1 − 2)n eine gerade ganze Zahl. (Hinweis:
Binomialsatz.)
X
n n+1
m
b) Zeige:
=
, (n ≥ k).
k+1
k
m=k
(Hinweis: Bei Induktion nach n kann man den Hilfsatz zum Beweis des Binomialsatzes benutzen.)
7. Betrachte im Pascalschen Dreieck eine ‘Parallele zum linken Schenkel’ also die Folge
n
n+1
n+2
n+k
,
,
,...,
,...
n
n
n
n
a) Überlege, dass die ‘folgende Parallele’, also
n+1
n+2
n+3
n+1+k
,
,
,...,
,...
n+1
n+1
n+1
n+1
die summatorische Folge der vorangehenden ist. Dabei soll die summatorische Folge der
Folge
(ak )k∈N = (a0 , a1 , a2 , . . .)
als die Folge
k
X
(a0 , a0 + a1 , a0 + a1 + a2 , . . .) = (
ai )k∈N
i=0
definiert sein. (Es ist gar nicht schwer, dies einzusehen.)
n+k
b) Überlege Dir auch, dass
ein Polynom n-ten Grades in k ist.
n
n
n
8. Seien r, s, n ∈ N. Zeige: Aus 0 ≤ r < s ≤ n/2 folgt
<
.
r
s
78
KAPITEL 2. NEUE RECHENBEREICHE
9. a) Zeige: Für jedes n ∈ N gilt:
n
X
(1/2)i < 2.
i=0
b) Folgere:
n X
i=m
1
2
i
<
2
.
2m
n
c) Zeige 2 < n! für n ≥ 4. (Wenn man nicht mit Induktion argumentieren will, geht es so:
24+k = 16 · 2 · · · 2 < 24 · (4 + 1) · · · (4 + k), wo links nach dem Faktor 16 = 24 ein Produkt von
k Faktoren 2 und rechts nach dem Faktor 24 das Produkt der k Zahlen 4 + 1, . . . , 4 + k steht.)
1
n 1
d) Zeige: Für alle natürlichen Zahlen n ≥ 1 und k gilt:
≤ .
k
k!
k n
n X
n
1
1
e) Zeige: Unter denselben Voraussetzungen gilt: 1 +
≤
< 3.
n
k!
k=0
(Hinweis: d) für die 1. und b), c) für die 2. Ungleichung)
10. a) Zeige, dass mk(mk − 1) · · · (mk − k + 1) durch mk! teilbar ist. (m, k ∈ N.)
b) Folgere, dass (mn)! durch m!(n!)m teilbar ist. (Der zweite Ausdruck ist unsymmetrisch in n
und m. Es ist (2 · 2)! durch 2!(2!)2 teilbar, aber nicht durch (2!)2 (2!)2 .)
11. Peter fragt seine Mutter, wie alt sie sei. Da sie ihr Alter aber nicht so locker verraten mag,
antwortet sie: Wenn Du von der dritten Potenz des Alters Deines Vaters die dritte Potenz
meines Alters abziehst, erhältst Du die Zahl 26551. Wie alt sind Peters Eltern? (Das Alter von
Mutter und Vater wird als ganze Anzahl von Jahren angenommen.)
12. Seien n, a ∈ N, n ≥ 2, a ≥ 1. Zeige: Es gibt nur endlich viele Paare ganzer Zahlen (x, y), so dass
xn − y n = a gilt. (Vielleicht fällt es Dir leichter, die stärkere Behauptung zu zeigen, dass es nur
endlich viele Paare ganzer Zahlen (x, y) mit 0 < xn − y n ≤ a gibt.)
13. a) Sei n ≥ 3 eine ganze Zahl. Zeige (n+1)n < nn+1 . (Entwickle (n+1)n gemäß dem binomischen
Lehrsatz. Vergleiche die ersten n−1 Summanden und die Summe der letzten beiden Summanden
dieser Entwicklung jeweils mit nn . Für den letzten Vergleich benötigst Du n ≥ 3. Was gilt für
n = 2?)
b) Mit Hilfe von Wurzeln, die man oft erst im Bereich der reellen (und nicht innerhalb der
rationalen) Zahlen ziehen kann, kann man aus a) folgern: Sind m, n ∈ N mit 3 ≤ m < n,
so gilt nm < mn . (Welche Folgerung in Bezug auf die Lösungen der Gleichung xy = y x im
Bereich der ganzen Zahlen kann man daraus ziehen?) Wenn man allgemeine Potenzen mit
reellen Exponenten kennt, kann man auch für reelle Zahlen a, b mit e ≤ a < b die Ungleichung
ba < ab zeigen. Siehe 7.6.4 . (Hier habe ich mit e die Eulersche Zahl bezeichnet, die im Beispiel
5 von Abschnitt 3.1 behandelt wird.)
14. Seien a, m, n positive ganze Zahlen mit a ≥ 2. Sei m = qn + r eine Division mit Rest (in N),
wo 0 ≤ r < n ist.
a) Zeige: Dann gibt es ein q 0 ∈ N mit am − 1 = q 0 (an − 1) + ar − 1.
2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ
b) Folgere: n|m ⇐⇒ an − 1|am − 1
c) Folgere: aggt(m,n) − 1 = ggt(am − 1 , an − 1).
79
80
KAPITEL 2. NEUE RECHENBEREICHE
Kapitel 3
Grenzwerte und reelle Zahlen
3.1
Unendliche Reihen
‘Unendliche Reihen’ sind nur eine andere Bezeichnung für unendliche Summen. Auch wenn ich
in diesem Abschnitt ein wenig unpräzise bin, kannst Du, wie ich glaube, eine Menge lernen.
Beispiel 1:
1
1 1 1
+ + +
+ ··· = ?
2 4 8 16
Wir schreiben diese unendliche Summe auch wie folgt:
∞
∞
X
X
1
1 1 1
1
−1
−2
−3
−4
=
+
+
+
+
·
·
·
=
2
+
2
+
2
+
2
+
·
·
·
=
2−k =?
n
2
2
4
8
16
n=1
k=1
Welche Meinung hast Du zu unendlichen Summen, insbesondere zu der
angegebenen?
Es ist Unsinn, solche zu betrachten.
Ihr Studium mag
zwar für Mathematiker ganz lustig sein, aber sicher nicht für Physiker und
Informatiker.
Obiger Summe legt man sinnvoller Weise den Wert 1 zu.
Um der o.a. unendlichen Summe auf sinnvolle Weise einen Wert zu geben,
benutze ich ein anschauliches Argument: Stelle Dir einen Glaszylinder vor,
der 1 Liter fasst. Dieser wird zuerst halb gefüllt, dann wird durch hinzugießen von einem viertel Liter vom freien Rest wieder die Hälfte gefüllt,
und es bleibt 1/4 Liter frei. Dann bleibt nach Hinzufügen von 1/8 l wieder
1/8 l frei. So geht es weiter: im n-ten Schritt fügt man 2−n l hinzu, und
der Literzylinder ist bis auf 2−n l gefüllt. Der einzig sinnvolle Wert für o.a.
unendliche Reihe (Summe) ist
∞
X
k=1
2−k =
1 1 1
1
1
+ + +
+ ··· + k + ··· = 1
2 4 8 16
2
(Rechts hast Du Platz zum zeichnen.)
81
82
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Was haben wir gemacht? Wir haben nacheinander die endlichen Partialsummen
2
3
1
X
1
1 X 1
1 X 1
1
=1− ,
= 1 − 2,
= 1 − 3,...
k
k
k
2
2 k=1 2
2
2
2
k=1
k=1
betrachtet und uns überlegt, wogegen die Folge dieser Partialsummen geht, d.h. welchen
Grenzwert sie hat.
∞
Beispiel 2: a)
X
1
1
1
1
1
1
+
+
+
+ ··· +
+ ··· =
=?
1·2 2·3 3·4 4·5
n(n + 1)
k(k + 1)
k=1
Ich will die einzelnen Summanden umformen.
1
1
(n + 1) − n
1
1 1
1
−
=
=
, z.B. − = . (Solltest Du je Probleme mit
n n+1
n(n + 1)
n(n + 1)
2 3
6
der Bruchrechnung gehabt haben, so sind diese jetzt doch überwunden, nicht wahr?)
Es gilt
Obige unendliche Reihe kann man also auch so schreiben:
∞
X
k=1
1
=
k(k + 1)
1 1
−
1 2
+
1 1
−
2 3
+
1 1
−
3 4
+
1 1
−
4 5
+ ···
Du siehst: Wenn man die ersten n Glieder der Reihe (in ihrer zweiten Gestalt) addiert, so hebt
sich nach Entfernen der Klammern viel weg und man erhält als Summe der ersten n Glieder
1
die Zahl 1 −
. (Sehr anschaulich bezeichnet man eine solche Summe als Teleskopsumn+1
me; sie ist wie ein Teleskop zusammenschiebbar.) Wieder ist der einzig sinnvolle Wert unserer
unendlichen Reihe
∞
X
k=1
1
1
1
1
1
1
=
+
+
+
+ ··· +
+ ··· = 1
k(k + 1)
1·2 2·3 3·4 4·5
n(n + 1)
b) Für später notieren wir: Lässt man die ersten N Summanden dieser Reihe weg, so erhält
man auf dieselbe Weise
∞
X
1
1
1
1
1
=
+
+
+ ··· =
k(k + 1)
(N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4)
N +1
k=N +1
Prüfe das nach.
∞
Beispiel 3:
X1
1 1 1 1 1
1
+ + + + + ··· + + ··· =
= ? ( Harmonische Reihe“)
”
1 2 3 4 5
n
n
n=1
Was glaubst Du?
Da die Glieder dieser Reihe gegen 0 gehen, erhält man, wie bei den
obigen Reihen einen endlichen Wert.
Obwohl die Glieder dieser Reihe gegen 0 gehen, hat
sie keinen endlichen Wert.
Das ist bis heute unbekannt.
3.1. UNENDLICHE REIHEN
83
Wir fassen die Glieder dieser Reihe wie folgt zusammen:
1
1 1
1 1 1 1
1
1
1
1
+
+
+
+ + +
+
+ ··· +
+
+ ··· +
+ ···
2
3 4
5 6 7 8
9
16
17
32
1 1
1 1
1
1
+ ≥ + =2· = ,
3 4
4 4
4
2
1
1
1
1
+ ··· +
≥8·
= , usw.
9
16
16
2
Deshalb gilt
Nun ist
1
1
1
1
1
1
+ ··· + ≥ + ··· + = 4 · =
5
8
8
8
8
2
1 1 1 1 1
1 1 1
+ + + + + ··· ≥ 1 + + + + ···
1 2 3 4 5
2 2 2
Also bleibt als einzig sinnvoller Wert der harmonischen Reihe:
∞
X
1 1 1 1 1
1
= + + + + + · · · = ∞ = unendlich.
n
1 2 3 4 5
n=1
(Wir betrachten ∞ nicht als (reelle) Zahl, weil man mit ∞ schlecht rechnen kann. Aber es
spricht nichts dagegen, ∞ als Wert einer unendlichen Reihe, als ‘uneigentlichen Grenzwert’
zuzulassen.)
In den Beispielen 4 und 6 werden wir die harmonische Reihe auf zweierlei Weise modifizieren
und endliche Werte erhalten.
Beispiel 4: Wir quadrieren die Summanden der harmonischen Reihe:
∞
X
1
1
1
1
1
1
= 1 + 2 + 2 + 2 + 2 + ··· + 2 + ··· =?
2
n
2
3
4
5
n
n=1
1
1
1
1
1
1
<
, also 2 <
, 2 <
usw. Durch
2
(n + 1)
n(n + 1)
2
1·2 3
2·3
Vergleich mit Beispiel 2 erhält man hieraus, vorausgesetzt unsere Reihe hat einen vernünftigen
Wert,
Es gilt (für n ≥ 1) die Beziehung
1
1
1
1
+ 2 + 2 + 2 + ··· < 1 + 1 = 2
2
2
3
4
5
Wenn man die reellen Zahlen axiomatisch einführt, kann man als eines der Axiome z.B. folgendes
nehmen:
1+
Jede unendliche Summe positiver Summanden, deren Partialsummen nach oben beschränkt
sind, hat einen (endlichen) reellen Wert.
π2
In der Tat ist der Wert o.a. unendlicher Summe
. Dies ist allerdings keineswegs einfach zu
6
sehen. Wenn Du Glück hast, hörst Du einen Beweis dafür am Ende des 1. Semesters in der
Vorlesung Analysis 1“. Jedenfalls findest Du einen Beweis im Buch O. Forster: Analysis 1.
”
Frage: Was ist π?
84
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Der sechzehnte (kleingeschriebene) Buchstabe des griechischen Alphabets. Ungefähr
gleich 3,14159. Das Verhältnis des Umfangs eines Kreises zu seinem Durchmesser. Das Verhältnis der Fläche eines Kreises zum Quadrat über seinem Radius. Das Verhältnis der Oberfläche einer Kugel zum Quadrat über ihrem Durchmesser. Drei viertel des
Verhältnisses des Volumens einer Kugel zum Volumen des Würfels über ihrem Radius. (In
den letzten vier Antworten ist die euklidische Geometrie zugrunde gelegt.)
Antwort: Alle gegebenen Antworten sind richtig. (Dabei muss man vielleicht eine feinsinnige
Zusatzbemerkung machen, was die erste Antwort von den andern unterscheidet.)
Frage: Warum schreibt man π und nicht 3,14159?
π schreibt sich kürzer als 3,14159. π = 3,14159 ist nicht exakt richtig. π lässt sich
nicht als endlicher Dezimalbruch, ja überhaupt nicht als Bruch mit ganzzahligem Zähler und
Nenner schreiben. D.h. π ist irrational.
Antwort: Die erste Antwort ist natürlich nicht falsch, die zweite ist aber besser, und die dritte
hat die größte mathematische Substanz! Dazu gibt es in 7.7 eine Aufgabe. Hier werden wir nur
beweisen, dass der Wert der folgenden Reihe irrational ist.
∞
Beispiel 5: 1 +
X 1
1
1
1
+
+
+ ··· =
1 1·2 1·2·3
k!
k=0
(Erinnere Dich an die Definition 0! := 1, n! := 1 · 2 · · · n für ganze n > 0.) Wenn wir, für jedes
1
1
n, den Summanden
mit dem Summanden
der Reihe aus Beispiel
1 · 2 · · · n · (n + 1)
n(n + 1)
2 vergleichen, sehen wir dass unsere Summe – wenn überhaupt – einen Wert < 3 hat. Wie im
Beispiel 4. hat diese Reihe im Bereich der reellen Zahlen Wert. Dieser wird in der Regel mit e
bezeichnet. Es gilt also 2 < e < 3. Angenähert ist e = 2, 718281828 . . ..
Was meinst Du? e hat die Periode 1828, ist also rational.
Da man immer nur
endlich viele Dezimalstellen von e berechnen kann, ist dies nicht zu entscheiden.
Es
könnte trotzdem einen Beweis für eine der beiden Behauptungen geben: e ist rational bzw. e
ist irrational.
Die Ziffernfolge 1828 wiederholt sich nicht ein drittes Mal. Mit Hilfe von Beispiel 2 kann man
vielmehr zeigen:
Satz: e ist keine rationale, sondern eine irrationale Zahl, d.h. kein Bruch mit ganzem Zähler
und Nenner.
m
Beweis: Indirekt! Wäre e eine rationale Zahl mit dem Nenner N ≥ 2, etwa e = N
(mit
m
natürlichen Zahlen m, N ), so wäre nicht nur N e, sondern erst recht N ! · e = 1 · 2 · · · N · N eine
ganze Zahl. Wir zeigen, dass dies für keine natürliche Zahl N möglich ist.
Multiplizieren wir die ersten N + 1 Summanden
von e mit N ! = 1 · 2 · · · N , so erhalten wir
P
lauter ganze Zahlen. Für den Rest r := N ! ∞
n=N +1 1/n! genügt es also 0 < r < 1 zu zeigen.
Denn N !e ist ja dann die Summe von r und einer ganzen Zahl, also nicht ganz, da r nicht ganz
ist.
3.1. UNENDLICHE REIHEN
85
Offenbar gilt
r=
1
1
1
+
+
+ ···
N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3)
Vergleichen wir diese Reihe, anfangend mit dem 2. Summanden, mit Beispiel 2 b), so erhalten
wir
r=
1
1
1
1
+
+
+
+· · · <
N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3) (N + 1)(N + 2)(N + 3)(N + 4)
1
1
1
1
1
1
+
+
+
+ ··· =
+
<1
(N + 1) (N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4)
N +1 N +1
da N ≥ 2 ist. Also ist N ! · e für keine natürliche Zahl N ganz und deshalb e irrational.
Beispiel 6: Wir versehen die Hälfte“ der Summanden der harmonischen Reihe mit dem Minus”
Zeichen, d.h. wir bilden die sogenannte alternierende harmonische Reihe:
∞
X (−1)k+1
1 1 1 1
(−1)n+1
1 − + − + − +··· +
+ ··· =
= ?.
2 3 4 5
n
k
k=1
1
1 1
1 1 1
Wenn wir die Teilsummen s1 = 1, s2 = 1 − , s3 = 1 − + , s4 = 1 − + − usw. auf
2
2 3
2 3 4
der Zahlengeraden betrachten, so sehen wir sie hin- und herhüpfen; dabei werden die Sprünge
immer kleiner und ihre Länge geht gegen 0. Es ist also plausibel, dass die Teilsummen gegen
einen Grenzwert gehen, den Wert der unendlichen Reihe. (‘Leibnizsches Konvergenzkriterium’)
Dieser Wert liegt offenbar zwischen 1/2 und 1. Er ist gleich ln 2, dem natürlichen Logarithmus
von 2, wie man in den meisten Vorlesungen Analysis 1“ lernt.
”
Frage: Darf man in einer unendlichen Reihe die Reihenfolge der Summanden beliebig vertauschen, ohne dass sich an ihrer Konvergenz oder ihrem Wert etwas ändert?
Ja.
Nicht immer.
Beispiel 7: Wir schreiben die Summanden der alternierenden harmonischen Reihe in folgender Reihenfolge:
∞
X
1 1 1 1 1
1 − − + − − + ··· =
2 4 3 6 8
k=0
1
1
1
−
−
2k + 1 2(2k + 1) 2(2k + 2)
.
(Auf je einen positiven Summanden folgen je zwei negative. Innerhalb der Folge der positiven,
sowie innerhalb der Folge der negativen Summanden bleibt die Reihenfolge bestehen.) Dabei
bedeutet das Gleichheitszeichen dass die Werte der beiden Reihen gleich sind, nicht aber die
Reihen als solche. Wenn Du genauer weißt, wie der Wert einer Reihe definiert ist, kannst Du
leicht das Folgende zeigen: Ist eine Reihe konvergent, d.h. hat sie einen endlichen Wert, so darf
man beliebige endliche Teile aufeinander folgender Glieder der Reihe zu je einem Summanden
zusammenfassen, ohne dass sich an ihrem Wert etwas ändert.
86
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Behauptung: Der Wert der o.a. Reihe ist genau halb so groß wie der der ursprünglichen
alternierenden harmonischen Reihe, der ja nicht 0 ist. Denn es gilt:
1
1
1
1
1
1
−
−
=
−
.
2k + 1 2(2k + 1)
2(2k + 2)
2 2k + 1 2k + 2
Wenn wir jetzt diese Glieder für beginnend mit k = 0 der Reihe nach aufsummieren, die
Klammern weglassen und den gemeinsamen Faktor 12 herausziehen, erhalten wir
1
1 1 1 1
1 − + − + − ··· ,
2
2 3 4 5
das heißt die alternierende harmonische Reihe, mit
1
2
multipliziert.
Beispiel 8: Jetzt ordnen wir die alternierende harmonische Reihe wie folgt um:
1−
1 1 1 1 1 1 1
1
1
1
1
1
1
1
1
1
+ − + − − + −
−
−
−
+ −
− ··· −
+
−
− ···
2 3 4 5 6 8 7 10 12 14 16 9 18
32 11 34
Beginnend mit 1/3 nimmt man immer abwechselnd einen positiven und 2n negative Summanden
auf. Genauer: nach dem positiven Summanden 1/3 nimmt man 20 negative Summanden; nach
dem nächsten positiven Summanden 1/5 nimmt man die nächsten 21 negativen Summanden,
usw.
1
1
1
1
1 1
Da − − ≤ − , − − · · · −
≤ − , usw. ist, gilt für einen möglichen Wert w der o.a.
6 8
4
10
16
4
1 1 1 1 1 1 1 1
umgeordneten alternierenden harmonischen Reihe w ≤ 1 − + − + − + − + −
2 3 4 5 4 7 4 9
1
1
+
− + · · ·. Mit
4 11
1 1
1
1
1 1
1
− + =−
=−
ist − + ≤ −
für n ≥ 5 .
4 5
4·5
20
4 n
20
Also gilt
w ≤1−
1 1
1
1
1
+ −
−
−
− · · · = −∞ .
2 3 20 20 20
Überlege Dir, dass hinter den letzten beiden Beispielen ein ‘Geheimnis des Unendlichen’ steckt.
Wenn man aus einem ‘Fass’ mit den Zahlen 1, 2, 3, . . . , 1 000 000 zu Anfang sehr viele gerade
n und nur wenige ungerade n herausnimmt und schließlich das ganze Fass leeren will, so muss
man irgendwann zum Ausgleich sehr viele ungerade Zahlen herausnehmen. Sind etwa unter den
ersten 500 000 herausgenommene Zahlen 499 000 gerade Zahlen, so müssen notwendigerweise
unter den letzten 500 000 herausgenommenen Zahlen auch 499 000 ungerade Zahlen sein.
Das ist ganz anders, wenn das Fass mit unendlich vielen, etwa allen natürlichen Zahlen gefüllt
ist. Dann kann man für jedes m die ersten 10m herausgenommenen Zahlen so wählen, dass
sich unter ihnen nur m ungerade, aber 10m − m gerade n finden, und fischt trotzdem auch
jedes ungerade n irgendwann aus dem Fass.
3.1. UNENDLICHE REIHEN
87
Zusatzbemerkungen
Zu Beispiel 1: Wie Du weißt, gilt für q 6= 1 die Formel
Pn
k
2
n
k=0 q = 1+q+q +· · ·+q =
1 − q n+1
,
1−q
1
, vorausgesetzt, es
1−q
ist −1 < q < 1. S.u. Wählt man q = 1/2, so erhält man die Reihe aus Beispiel 1 mit einem
zusätzlichen Summanden 1.
also für die unendliche Reihe
P∞
k=0
qk = 1 + q + q2 + · · · + qn + · · · =
Zu den Beispielen 3 und 4: Die Quadratzahlen bilden eine Teilmenge der Menge aller
positiven ganzen Zahlen. Wir haben gesehen, dass die Summe der Kehrwerte aller natürlichen
Zahlen unendlich, dagegen die der Kehrwerte aller Quadratzahlen endlich ist. Man kann sich
für jede Teilmenge der natürlichen Zahlen fragen, ob die Summe ihrer Kehrwerte endlich oder
unendlich ist. Man weiß, dass die Summe der Kehrwerte aller Primzahlen unendlich ist. Das
ist nicht trivial, aber auch nicht allzu schwer zu zeigen. Siehe Chapter 1 in dem hübschen
Buch Proofs from THE BOOK“ von M. Aigner und G.M. Ziegler (Springer Verlag). Dass die
”
Summe der Kehrwerte der Primzahlen unendlich, die der Quadratzahlen aber endlich ist, kann
man so interpretieren, dass die Primzahlen dichter im Bereich der natürlichen Zahlen liegen als
die Quadratzahlen. (Das heißt nicht, dass man aus dieser Erkenntnis gleich folgern kann, dass
zwischen je zwei verschiedenen Quadratzahlen 6= 0 mindestens eine Primzahl liegt. Das glaubt
zwar jeder, kann aber dummerweise noch keiner beweisen.)
Zu Beispiel 6: Die sogenannte Taylorentwicklung der Funktion ln(1 + x) ist ln(1 + x) =
x x2 x3
−
+
− + · · ·. Diese Gleichung gilt für alle x mit −1 < x ≤ 1, und man erhält unsere
1
2
3
Behauptung, indem man x = 1 setzt.
1
Unvollständige Begründung: Die Funktion ln(1 + x) ist die Stammfunktion von
.
1+x
1
(D.h. die Ableitung der Funktion ln(1 + x) ist die Funktion
. (Diese Begriffe kennst Du
1+x
vielleicht schon. Sie werden auch weiter unten in diesem Buch behandelt.) Letztere Funktion
kann man, wie in der Bemerkung zu Beispiel 1 angegeben, als unendliche Reihe schreiben:
setze q = −x. Die sogenannte Taylorentwicklung von ln(1 + x) erhält man durch ‘gliedweise
Integration’. Das alles funktioniert zunächst jedoch nur für −1 < x < 1. Für x = 1 braucht
man ein zusätzliches Argument, den ‘Abelschen Grenzwertsatz’.
Zu Beispiel 7: Durch geeignete Umordnung kann die alternierende harmonische Reihe jede vorgegebene reelle Zahl als Wert annehmen. Wer mathematisch geschickt ist, mag selbst
versuchen, dies zu zeigen.
P
n
Ein Beispiel, das unsere Vorfahren irritiert hat: Die unendliche Reihe ∞
n=0 (−1) = 1 −
1+1−1+· · · hat keinen vernünftigen Wert. Man kann allerdings ihre Summanden so klammern,
dass einmal der Wert 0, ein andermal der Wert 1 herauskommt. (1 − 1) + (1 − 1) + (1 − 1) + · · ·,
bzw 1 + (−1 + 1) + (−1 + 1) + (−1 + 1) + · · ·.
Dieses Beispiel mag in Dir den Wunsch nach einer präzisen Definition für den Wert einer unendichen Reihe wecken. Versuchen wir es so: Wir betrachten die sogenannten Partialsummen
88
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
einer unendlichen Reihe
∞
X
an
n=0
Das sind die Summen
s0 := a0 ,
s1 := a0 + a1 ,
s2 := a0 + a1 + a2 ,
...,
sk :=
k
X
an ,
...
n=0
P
Und den Wert der Reihe ∞
n=0 an definiert man als ‘Grenzwert’ dieser Folge der Partialsummen,
so es denn einen gibt. Grenzwerte von Folgen definieren wir später.
P
n
Partialsummen der Reihe ∞
n=0 (−1) sind
1, 0, 1, 0, 1, 0, . . .
Diese bilden eine Folge, die keinen Grenzwert hat. Z.B. liegt nur die Hälfte der Folgenglieder
beliebig nahe bei 0.
Diese Beispiel lehrt uns, dass die Assoziativität bei unendlichen Summen nicht allgemein
richtig ist!
3.2
Grenzwerte und reelle Zahlen
3.2.1 Du kennst den Körper Q der rationalen Zahlen und weißt auch, wie man seine Elemente
als Punkte auf der Zahlengerade auffassen kann – nachdem man die Punkte 0 und 1 festgelegt
hat. Der Körper Q besitzt außer seiner arithmetischen (oder algebraischen) Struktur, d.h. den
Rechenarten, noch eine Anordnungsstruktur. Diese wird durch die Relation ‘≤’ gegeben. Wenn
man, wie üblich die Zahlengerade waagerecht zeichnet und dabei den Punkt 1 rechts von der 0
legt, so bedeutet a ≤ b, dass der Punkt a links von b liegt oder mit ihm übereinstimmt.
Haben zwei Brüche den gleichen positiven Nenner n, so gilt natürlich
m1
m2
≤
⇐⇒ m1 ≤ m2 .
n
n
m1 m2
Im Allgemeinen macht man durch Erweitern der Brüche
,
die Nenner gleich und hat
n1 n1
m1 n2
m2 n1
dann die Brüche
und
zu vergleichen. Es ergibt sich die Regel: Sind n1 , n2 > 0 so
n1 n2
n1 n2
ist
m1
m2
≤
⇐⇒ m1 n2 ≤ m2 n1
n1
n2
Die Relation ‘≤’ hat folgende Eigenschaften:
a ≤ a (Reflexivität)
a ≤ b, b ≤ c ⇒ a ≤ c (Transitivität)
3.2. GRENZWERTE UND REELLE ZAHLEN
89
a ≤ b, b ≤ a ⇒ a = b (Antisymmetrie)
für je zwei Zahlen a, b gilt a ≤ b oder b ≤ a (Totalität)
a≤b⇒a+c≤b+c
0 ≤ c, a ≤ b ⇒ ac ≤ bc (Monotonie der Addition und der Multiplikation)
Definition 3.2.2 Ein angeordneter Körper, ist ein Körper mit einer Relation ‘≤’, derart,
dass obige Eigenschaften erfüllt sind. Die Elemente a ∈ K, die ≥ 0 sind, nennt man nichtnegativ. Die von 0 verschiedenen nichtnegativen Elemente von K heißen positiv.
Welche Elemente würdest Du nichtpositiv, bzw. negativ nennen?
(Ich muss gestehen, dass die Wörter nichtnegativ“ und nichtpositiv“ nicht nicht die größte
”
”
sprachliche Eleganz ausstrahlen; sie sind aber üblich.)
Die Relation ‘<’ ist durch ‘a < b ⇐⇒ a ≤ b, a 6= b definiert. Was a ≥ b und a > b dann
bedeuten sollen, ist Dir sicher klar.
Bemerkungen 3.2.3 Sei K ein angeordneter Körper. Die folgenden Regeln gelten in K.
a) Die Monotonieregel der Addition lässt sich auch folgendermaßen ausdrücken:
a<b⇒a+c<b+c
Denn wenn a ≤ b und a 6= b gilt, ist a + c ≤ b + c und a + c 6= b + c, nicht wahr?
b) Aus 0 ≤ a, 0 ≤ b folgt 0 ≤ a + b und 0 ≤ ab.
c) Gilt a ≤ b, so folgt a + (−a − b) ≤ b + (−a − b) also −b ≤ −a. Insbesondere gelten:
a ≤ 0 ⇐⇒ −a ≥ 0; sowie a ≥ 0 ⇐⇒ −a ≤ 0.
d) a2 ≥ 0 gilt für jedes a ∈ K. Ist nämlich a ≥ 0, so folgt a2 ≥ a · 0 = 0. Ist hingegen a ≤ 0, so
ist −a ≥ 0, also a2 = (−a)2 ≥ 0.
Insbesondere ist 1 = 12 ≥ 0. Da aber 1 6= 0, folgt 1 > 0.
e) Ist a > 0, so ist auch a−1 > 0. Wäre nämlich a−1 < 0, so wäre −a−1 > 0, also −1 =
−(aa−1 ) = a(−a−1 ) > 0, im Widerspruch zu c) und d).
Entsprechend kannst Du a < 0 =⇒ a−1 < 0 beweisen.
f) Aus 0 < a ≤ b folgt a−1 ≥ b−1 . Dies ergibt sich, wenn man die Ungleichung a ≤ b mit dem
positiven Element a−1 b−1 multipliziert.
Entsprechend folgt aus a ≤ b < 0, dass a−1 ≥ b−1 ist.
Sind also a, b beide positiv, oder beide negativ, so kehren sich durch das multiplikative Invertieren die Größenverhältnisse um. Ist allerdings a < 0 < b, so ist auch a−1 < 0 < b−1 .
g) Es ist a ≤ b ⇐⇒ 0 ≤ b − a. Deshalb kennt man eine Anordnung eines Körpers bereits
dann, wenn man weiß, welche Elemente nichtnegativ (oder auch positiv) sind.
Satz 3.2.4 Der Körper Q besitzt außer der uns bereits bekannten Anordnungen keine weiteren.
90
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Beweis: Wir wissen, dass auf jeden Fall 1 positiv ist. Dann sind aber auch 1 + 1, 1 + 1 + 1,
und so weiter positiv. Jede natürliche Zahl ist somit ≥ 0. Ist n 6= 0 eine natürliche Zahl, so ist
m
auch n−1 positiv, dann ist aber auch jeder Bruch
= m · n−1 (in dem natürlich n 6= 0 ist) von
n
natürlichen Zahlen nichtnegativ, also genau diejenigen Elemente, die auch bei der bekannten
Anordnung von Q nichtnegativ sind.
3.2.5 Sei K weiterhin ein angeordneter Körper. Dann ist in ihm 1 > 0, folglich sind alle
endlichen Summen (aber nicht die leere Summe) von 1 mit sich selbst positiv. Daraus folgt,
dass eine Gleichung zwischen solchen Summen a := 1 + 1 + · · · + 1 = b := 1 + 1 + · · · + 1 nur
dann gelten kann, wenn auf beiden Seiten gleichviele Summanden stehen. (Beachte, dass diese
Aussage in einem endlichen Körper falsch ist!) Denn wenn etwa rechts mehr Summanden als
links stünden, gäbe es eine nichtleere Summe c von 1 mit sich selbst, so dass b = a + c und
b = a wäre.
Dies bedeutet, dass man die Menge N mit Menge der 1-Summen (einschließlich der leeren
Summe, die als 0 verstanden wird) eines beliebigen angeordneten Körpers identifizieren kann,
und zwar so, dass Addition, Multiplikation und die Relation ‘≤’ dabei nicht verändert werden.
Dann kann man auch Z mit der Menge der Elemente aus K, die 1-Summen oder deren additiv
Inverse sind, identifizieren, so dass die Rechenoperationen und die Ordnungsrelation dabei
berücksichtigt wird. Da K ein Körper ist, kann man jeden Bruch m
mit dem Körperelement
n
−1
mn identifizieren.
Man darf also annehmen, dass Q als Teilkörper in einem jeden angeordneten Körpern liegt.
Zur axiomatischen Definition der reellen Zahlen benötigen wir unter anderem ein Axiom, das
für den Körper Q erfüllt ist:
Definition 3.2.6 Ein archimedisch angordneter Körper K ist ein angeordneter Körper,
derart dass zu Elementen a, b ∈ K mit a, b > 0 ein n ∈ N mit na ≥ b existiert. (Nach Annahme
liegt ja Q, also auch N in dem Körper. Man kann allerdings auch ohne diese Annahme na
definieren, nämlich als n-fache Summe von a zu sich selbst.)
Bemerkung 3.2.7 Q ist ein archimedisch angeordneter Körper. Sind nämlich m1 , m2 , n1 , n3
natürliche Zahlen 6= 0, so ist offenbar
(m2 n1 )
m1
m2
≥
n1
n2
Satz 3.2.8 Sei K ein angeordneter Körper. Folgende Aussagen sind äquivalent:
(i) K ist archimedisch angeordnet.
(ii) Jedes positive a ∈ K liegt zwischen zwei positiven rationalen Zahlen.
Beweis: Sei K archimedisch angeordnet, so gibt es eine natürliche Zahl n mit n · 1 ≥ a. Also
ist a ≤ n mit der rationalen (sogar natürlichen) Zahl n.
3.2. GRENZWERTE UND REELLE ZAHLEN
Ferner gibt es eine natürliche Zahl n0 mit
1
a
≤ n0 , also a ≥
91
1
.
n0
Umgekehrt erfülle ein angeordneter Körper K obige Aussage und seien a, b ∈ K positiv. Dann
gibt es natürliche Zahlen m1 , n1 , m2 , n2 mit
a≥
m1
m2
und b ≤
, also m2 n1 a ≥ b .
n1
n2
3.2.9 Die ganzen Zahlen liegen auf der Zahlengerade voneinander isoliert. Anders die rationalen Zahlen. Zwischen ihnen siehst Du auf den ersten Blick keine Lücken. Zwischen je zwei
verschiedenen rationalen Zahlen liegen noch unendlich viele weitere. Man könnte vermuten,
die rationalen Zahlen füllten die Zahlengerade aus!?
ABER
betrachte die Funktion x2 − 5 auf dem Bereich der rationalen Zahlen ≥ 0. Wenn Du sie, d.h.
ihren Graph zeichnest, erhältst Du eine schöne Kurve, welche die x-Achse zwischen 2 und 3
zu schneiden scheint.
Gibt es eine rationale Zahl x, für die x2 − 5 = 0 ist? Du weißt, dass die Antwort ‘nein’ lautet.
Der Schnittpunkt der Kurve mit der x-Achse ist also kein rationaler Punkt.
Und das
nicht die einzige Ausnahme. Wir wissen z.B. auch, dass die unendliche
P ist natürlich
1
Reihe ∞
im
Bereich
der rationalen Zahlen keinen (Grenz-)Wert hat, obwohl die Folge
n=0 n!
ihrer Partialsummen monoton wächst und nach oben beschränkt ist. Und so weiter, und so
fort.
Gewisse Lücken scheinen irgendwie doch zwischen den rationalen Zahlen zu existieren, mögen
sie auch ‘unendlich kleine Lücken’ sein.
Später wirst Du sogar zu der etwas paradoxen Erkenntnis kommen, dass es in einem gewissen
Sinne mehr Lücken zwischen den rationalen Zahlen als rationale Zahlen gibt.
Ganz offenbar hat der Körper Q der rationalen Zahlen seine Defizite. Ich will einen größeren
angeordneten Körper R, den Körper der reellen Zahlen axiomatisch einführen und später
auch ein wenig dazu sagen, wie man ihn konstruieren kann.
Einfach, aber höchst nützlich ist der Begriff des Absolutbetrags. Sei K ein angeordneter
Körper. Der Abstand zweier seiner Elemente a und b ist a − b oder b − a je nachdem, welche
Differenz nicht negativ ist. Mit Hilfe des sogenannten Absolutbetrages kann man den Abstand
einfach in der Form |a − b| schreiben.
Definition 3.2.10 Sei a ein Element eines geordneten Körpers, so definieren wir den Absolutbetrag (kurz Betrag) |a| von a als die größere der beiden Zahlen a, −a. (Für a = 0 meine
ich damit natürlich |0| = 0.)
92
Eigenschaften: |a| ≥ 0.
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
|a| = 0 ⇐⇒ a = 0,
|a + b| ≤ |a| + |b|.
|ab| = |a| · |b|.
Sei ε > 0, dann bedeutet |a − b| < ε dasselbe wie a − ε < b < a + ε (und natürlich auch dasselbe
wie b − ε < a < b + ε).
3.2.11 Ich will im Folgenden klären, was man unter einem Grenzwert einer (unendlichen)
Folge (an ) = (an )n = (an )n∈N = (a0 , a1 , a2 , . . .) verstehen soll.
1
Vielleicht hast Du ja schon ein gewisses Gefühl dafür, dass etwa die Folge ( n+1
) den Grenzwert
n
0 bzw. die Folge n+1
den Grenzwert 1 hat.
Man muss sich fragen, ob notwendiger Weise der Begriff Grenzwert“ ein vager Begriff ist,
”
ob man etwa von jedem Mathematiker verlangen muss, dass ihm intuitiv klar ist, dass die
genannten Folgen die genannten Grenzwerte haben – oder ob man dies präzise fassen kann.
Nun, die folgende Definition ist präzise; aber Du musst Dir schon ordentlich Mühe geben, sie
zu verstehen.
Definitionen 3.2.12 Sei (an )n∈N eine Folge in einem angeordneten Körper K und a ein Element dessselben.
a) Man sagt: Die Folge (an )n∈N habe den Grenzwert oder Limes a, oder auch konvergiert
gegen a, wenn es zu jedem (noch so kleinen) Element ε > 0 von K ein N ∈ N gibt, so dass
|an − a| < ε für alle n ≥ N gilt. Mit lim an oder limn→∞ an wird der Limes bezeichnet, wenn
n→∞
es ihn gibt.
b) Die Folge heißt – unspezifiziert – konvergent, oder man sagt, sie konvergiert, wenn es
ein a ∈ K gibt, gegen welches sie konvergiert.
c) Eine Folge heißt divergent, wenn sie nicht konvergent ist.
Beachte: Eine Folge, die in einem vernünftigen Sinn den Grenzwert ∞ oder auch −∞ hat,
nennen wir nicht konvergent, sondern divergent!
Um o.a. Definition a) etwas anders zu formulieren, definieren wir zunächst den Begriff
ε-Umgebung einer Zahl a.
Definition 3.2.13 Sei ε > 0 ein Element eines angeordneter Körpers K. Die ε-Umgebung von
a besteht aus den Elementen b ∈ K mit |b − a| < ε.
Obige Definition des Grenzwertes besagt dann:
limn→∞ an = a bedeutet: Jede ε-Umgebung (mit ε > 0) von a (und sei ε noch so klein) enthält,
bis auf endlich viele n, alle an .
Bemerkung 3.2.14 Wenn eine Folge in einem angeordneten Körper überhaupt einen Grenzwert hat, so hat sie nur einen einzigen.
Denn wären etwa verschiedene a, a0 Grenzwerte einer Folge (an )n , so wäre ε := |a − a0 |/2 > 0.
Aber die ε-Umgebungen von a und a0 haben kein Element gemeinsam. Es ist also nicht möglich,
dass sowohl in der ε-Umgebung von a als auch in der von a0 alle an bis auf endlich viele n liegen.
3.2. GRENZWERTE UND REELLE ZAHLEN
93
Beispiele 3.2.15 Jetzt wollen wir uns Beispiele für Konvergenz, aber auch für Nichtkonvergenz
überlegen und beschränken uns dabei auf archimedisch angeordnete Körper!
a) Die Folge (1/n), n ≥ 1, also die Folge (1, 12 , 13 , . . .) konvergiert in einem archimedisch angeordneten Körper gegen 0, ebenso die Folge (2−n ), n ≥ 0, d.h. die Folge (1, 12 , 14 , 18 , . . .).
Sei nämlich ε ≥ k/m mit ganzen k, m > 0. Dann ist
für alle n ≥ N .
1
m
≤ ε. Ist nun N = m+1, so ist
1
n
<
1
m
≤ε
Jedes Glied der Folge (2−n )n ist auch ein Glied der Folge ( n1 )n≥1 . Die Folge (2−n )n ist eine
sogenannte Teilfolge der Folge (n−1 ). (Es ist sogar 2−n ≤ n−1 .) Deshalb trifft die Definition
der Konvergenz gegen 0 auch auf sie zu.
b) Die Folge ((−2)−n ), n ≥ 0, also die Folge (+1, − 21 , + 14 , − 18 , . . .) konvergiert ebenfalls gegen
0. Es kommt ja nur auf den Abstand der Folgenglieder zu 0 an. Allgemeiner gilt: Wann immer
eine Folge (an )n gegen 0 konvergiert, so gilt dies auch für die Folge ((−1)n an )n . Allgemeiner
gilt: lim an = lim |an |; und wenn einer der Limites existiert, dann auh der andere.
c) Sei in einem archimedisch angeordneten Körper |q| < 1. Dann gilt limn→∞ q n = 0.
Sei nämlich ε > 0 und setze |q|−1 = 1 + a mit a > 0. Dann ist nach der Bernoullischen
Ungleichung |q|n ≥ 1 + na. Wegen der Archimedizität gibt es dann ein N , derart dass na > ε−1
für alle n ≥ N gilt. Für diese n ist dann auch |q|−n > ε−1 , also |q|n < ε.
d) Betrachte die Folge ((−1)n + 2−n ), n ∈ N. Sie nähert sich sozusagen den Zahlen −1 und 1.
(Genauer nähert sich die ‘Hälfte’ der Folgenglieder der 1, die andere ‘Hälfte’ der −1.) Diese sind
keine Grenzwerte im Sinne obiger Definition, sondern sogenannte Häufungspunkte. Obwohl
der Begriff ‘Häufungspunkt’ nicht unwichtig ist, will ich in diesem Buch auf seine Definition
verzichten.
n
f) Die Folge (n(−1) ), n ≥ 1 verhält sich nicht viel anders. Sie hat außer dem ‘Häufungspunkt’
0 noch den ‘uneigentlichen Häufungspunkt’ ∞. Auch diese Reihe ist nicht konvergent, d.h. hat
keinen Grenzwert.
g) Betrachte die Folge (an )n∈N , wo an folgendermaßen definiert sei:
an :=
(n + 2)−1 für gerade
n
−1
n
für ungerade n
d.h. die Folge ( 21 , 1, 14 , 13 , 16 , 15 , . . .). Diese Folge nähert sich der 0 wie die Echternacher Springprozession. D.h. in jedem 2. Schritt weicht sie wieder etwas zurück. Trotzdem konvergiert sie gegen
0 im Sinne unserer Definition. (Beweis?) Nach meiner Meinung wäre es auch sehr engherzig,
wollte man eine solche Folge nicht als eine Folge mit dem Grenzwert 0 ansehen.
h) Die Folge (1+ n1 ) hat zwar die Eigenschaft, dass ihre Glieder immer kleiner werden, trotzdem
geht sie nicht gegen 0, sondern gegen 1,
i) Schließlich hat eine ‘konstante’ Folge, in der alle Glieder gleich ein und demselben Element
a sind, also eine Folge der Form (a, a, a, . . .) den Grenzwert a.
94
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Frage: Ist folgende Aussage äquivalent dazu, dass eine Folge (an ) den Grenzwert 0 hat?
Vom Vorzeichen abgesehen ist jedes Folgenglied kleiner als das vorangehende.“
”
Ja
Nein
Beachte die Beispiele g) und h)! Diesen Vorschlag, Konvergenz (gegen 0) so zu definieren habe
ich tatsächlich irgendwo gelesen.
3.2.16 Körper der reellen Zahlen. Der Körper der reellen Zahlen hat vor dem Körper
der rationalen Zahlen den Vorzug, dass in ihm die Folgen, ‘die eigentlich konvergieren sollten’,
auch wirklich konvergieren.
Die Folgen, ‘die eigentlich konvergieren sollten’, sind die sogenannten ‘Cauchy-Folgen’. Während
die Glieder einer konvergenten Folge ‘schließlich beliebig nahe bei ihrem Limes’ liegen, liegen
die Glieder einer Cauchy-Folge ‘schließlich beliebig nahe beieinander’. Genauer
Definition 3.2.17 Eine Folge (an )n∈N heißt eine Cauchy-Folge, wenn es zu jedem ε > 0 ein
N ∈ N gibt, so dass |an − am | < ε für alle n, m ≥ N gilt.
Wie Du weiter unten sehen wirst, ist jede konvergente Folge in einem (archimedisch) angeordneten Körper eine Cauchy-Folge.
Beispiele 3.2.18 a) Die unendliche Reihe
P∞
1
n=0 n!
hat die Partialsummen
k
X 1
1
1
1
1
1
1
= 1, s1 = + = 2, s2 = + + = 2,5 , . . . , sk =
, ...
s0 =
0!
0! 1!
0! 1! 2!
n!
n=0
Man erhält für 1 ≤ k < l leicht die Abschätzung (Ungleichung) (vgl. Abschnitt 3.1, Beispiel 2
b))
1
1
1
1
1
sl − sk =
+ ··· + ≤
+ ··· +
<
(k + 1)!
l!
(k + 1)(k + 2)
(n − 1)n
k+1
P∞ 1
Mithin ist die Reihe n=0 n! , aufgefasst als Folge ihrer Partialsummen, eine Cauchy-Folge.
b) Die harmonische
als Folge ihrer Partialsummen aufgefasst, ist keine
Cauchy-Folge.
P∞
P∞ Reihe,
1
Zeige dazu: Da n=1 n schließlich jede Schranke überschreitet, so muss auch n=k n1 , wo man
die ersten k − 1 Glieder weggelassen hat, dies tun.
c) Die Folgen (an ) mit an = n, bzw. an = (−1)n sind keine Cauchy-Folgen.
d) Sei m,α1 α2 α3 . . . ein unendlicher Dezimalbruch mit m ∈ N, αi ∈ {0, 1, . . . , 9}. (Hier sind mit
m die ‘Vorkommazahl’ und mit α1 , α2 , α3 , . . . die Stellen nach dem Komma bezeichnet worden.)
Wir interpretieren ihn als Folge der abbrechenden Dezimalbrüche a0 = m, a1 = m,α1 , a2 =
m,α1 α2 , . . .. Sei k ≤ n. Dann ist an − ak ≤ 10−k . also die genannte Folge eine Cauchy-Folge.
e) Ist (an )n∈N eine in Q konvergente Folge rationaler Zahlen, so ist sie eine Cauchy-Folge. Sei
nämlich a ihr Limes und ε > 0 rational. Dann gibt es ein N ∈ N mit |an − a| < ε/2 für alle
n > N . Für m, n > N gilt dann |an − am | = |an − a + a − am | ≤ |an − a| + |a − am | < ε/2 + ε/2.
3.2. GRENZWERTE UND REELLE ZAHLEN
95
3.2.19 Man kann nun den Körper der reellen Zahlen axiomatisch einführen, d.h. als archimedisch angeordneten Körper definieren, in dem jede Cauchy-Folge konvergiert.
Man kann nachweisen, dass es ‘im Wesentlichen’ nur einen solchen Körper gibt. D.h., sind
R, R0 zwei solche Körper, so gibt es eine Beziehung a ↔ a0 zwischen den Elementen a ∈ R und
a0 ∈ R0 , so dass diese Beziehung jedem a ∈ R genau ein a0 ∈ R0 zuordnet und umgekehrt, und
dass a + b ↔ a0 + b0 , ab ↔ a0 b0 , sowie a ≤ b ⇐⇒ a0 ≤ b0 aus a ↔ a0 , b ↔ b0 folgt.
3.2.20 Nun ist es aber keineswegs klar, dass es so einen Körper der reellen Zahlen wirklich
gibt.
Ein anschauliches Argument wäre, dass sich eine Cauchy-Folge auf der Zahlengeraden ja ‘augenscheinlich zu einem Punkt zusammenzieht’.
Möglicherweise wirst Du ein solches ‘anschauliches’ Argument doch mit sehr skeptischen Augen
betrachten.
Es gibt mehrere Möglichkeiten, den Körper der reellen Zahlen zu konstruieren. Eine möchte ich
hier vorstellen.
Sie besitzt eine gewisse Analogie zur Konstruktion der rationalen Zahlen. Da man eine ganze
Zahl nur selten durch eine andere ganze Zahl im Bereich der ganzen Zahlen dividieren kann,
m
, d.h als das
drückt man das virtuelle Ergebnis der Division von m durch n einfach als
n
0
m
m
und 0 als zueinander gleich betrachten,
Zahlenpaar (m, n) aus. Dabei muss man allerdings
n
n
wenn die virtuellen Divisionsergebnisse m : n und m0 : n0 sinnvollerweise als gleich anzusehen
sind, d.h. wenn sie als ‘Verhältnisse’ gleich sind, d.h. wenn mn0 = m0 n ist.
So kann man auch bei der Konstruktion von R vorgehen. Cauchy-Folgen rationaler Zahlen
konvergieren nur selten im Bereich der rationalen Zahlen. Deshalb wird man die reellen Zahlen
einfach als Cauchy-Folgen rationaler Zahlen ansehen. Dabei stellen zwei Cauchy-Folgen (an )n∈N
und (bn )n∈N rationaler Zahlen genau dann dieselbe reelle Zahl dar, wenn diese beiden Folgen
gegen denselben virtuellen Grenzwert konvergieren, d.h. wenn die Folge der Differenzen (an −
bn )n∈N eine Nullfolge ist, d.h. gegen 0 konvergiert.
3.2.21 Dann ist natürlich noch eine Menge zu tun. Um die Addition zu definieren, musst Du
etwa zeigen: Wenn (an ) und (a0n ) sich nur um eine Nullfolge unterscheiden, so tun dies auch
(an + bn ) und (a0n + bn ). Entsprechendes ist für die Multiplikation zu tun, und da auch etwas
schwieriger. Ist (an ) eine Cauchy-, aber keine Nullfolge, so muss man zeigen, dass an = 0 nur
für endlich viele n gilt, damit man ein multiplikativ Inverses bilden kann. Die Anordnung auf
R ist zu definieren. Und schließlich muss man zeigen, dass R archimedisch angeordnet ist und
dass reelle Cauchy-Folgen konvergieren.
3.2.22 Die Dir vertrauteste Darstellung der reellen Zahlen ist vermutlich die durch (unendliche) Dezimalbrüche. Ein Dezimalbruch kann als Cauchy-Folge aufgefasst werden, siehe Beispiel
3.2.18 d). Umgekehrt kann man jede reelle Zahl als Dezimalbruch schreiben. Vgl. [Forster].
96
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
Reelle Zahlen als Dezimalbrüche zu schreiben, hat den Vorteil dass eine reelle Zahl meist auf
nur eine Weise als Dezimalbruch geschrieben werden kann. (Beachte jedoch, dass z.B. 1,3 =
1,29 = 1,299999 . . . ist.) Vor allem aber sind sie wohlvertraut.
Das Rechnen mit unendlichen Dezimalbrüchen hat allerdings so seine Tücken. Aber das Rechnen
mit abbrechenden Dezimalbrüchen, welche die allgemeinen Dezimalbrüche approximieren, ist
unproblematisch.
3.2.23 Wie willst Du also mit reellen Zahlen umgehen? Hier mein Vorschlag: Anschaulich fasse
sie als die Punkte auf der Zahlengeraden auf. Rechne mit ihnen approximativ mit abbrechenden
Dezimalbrüchen. Für theoretische Überlegungen verwende ihre o.a. axiomatische Beschreibung:
R ist ein archimedisch angeordneter Körper, in dem jede Cauchy-Folge konvergiert.
3.2.24 Man kann den Körper R auf mehrere andere Weisen kennzeichnen. Z.B.
(i) R ist ein archimedisch angeordneter Körper, in dem jede monoton wachsende Folge, die nach
oben beschränkt ist, konvergiert.
(ii) R ist ein archimedisch angeordneter Körper, in dem es zu jeder nichtleeren nach oben
beschränkten Menge M ein sogenanntes Supremum (s.u.) gibt.
(Übrigens kann man in beiden Definitionen das Wort ‘archimedisch’ weglassen. Die Archimedizität ist eine Folge der jeweils angegebenen anderen Eigenschaft.)
Definitionen 3.2.25 a) Ein Supremum einer Menge reeller Zahlen ist eine reelle Zahl s mit
x ≤ s für alle x ∈ M derart, dass in M eine Folge (an ) mit limn→∞ an = s existiert. b) Sei M
eine Menge reeller Zahlen. Ein Infimum von M ist eine reelle Zahl s, derart, dass s ≤ x für
alle x ∈ M gilt und in M eine Folge (xn )n∈N mit limn→∞ xn = s existiert.
3.2.26 Seien (an )n und (bn )n konvergente Folgen. Was gilt dann für die Folgen
(an + bn )n , (an bn )n und (an /bn )n ? Es ist so, wie man es sich besser nicht denken kann.
Satz 3.2.27 Seien die Folgen (an )n , (bn )n konvergent mit den Grenzwerten a, bzw. b. Dann
gilt:
a) Auch die Folge (an + bn )n konvergiert und es ist limn→∞ (an + bn ) = a + b.
b) Auch die Folge (an bn )n konvergiert und es ist limn→∞ an bn = ab.
c) Ist b = limn→∞ bn 6= 0, dann kann bn = 0 nur für endlich viele n gelten. Ferner ist
limn→∞ (an /bn ) = a/b, wenn in der Folge der (an /bn ) die endlich vielen Glieder, wo bn = 0
ist, weggelassen sind.
Beweis: a) ist fast trivial, wenn man |an + bn − (a + b)| ≤ |an − a| + |bn − b| (Dreiecksungleichung!) beachtet. Man will ja zeigen, dass es zu gegebenem ε > 0 ein N gibt so dass
|an + bn − (a + b)| < ε für n ≥ N gilt. Man darf voraussetzen, dass es zu ε/2 (!) ein N 0 gibt
3.2. GRENZWERTE UND REELLE ZAHLEN
97
mit |an − a| < ε/2 für n ≥ N 0 und es ebenso ein N 00 gibt mit |bn − b| < ε/2 für n ≥ N 00 . Das
gesuchte N ist dann die größere der Zahlen N 0 , N 00 (d.h. N = Max{N 0 , N 00 }.) (Wenn N 0 = N 00
sein sollte, ist natürlich N = N 0 = N 00 gemeint.)
b) Für die zweite Behauptung benötigt man, dass eine konvergente Folge beschränkt ist, d.h.
ganz zwischen festen Schranken bleibt: Es gibt ein c mit |an | ≤ c für alle n. (Warum ist das
so?) Somit ist |an bn − ab| = |an bn − an b + an b − ab| ≤ |an ||bn − b| + |an − a||b|, wo letzterer
Ausdruck beliebig klein für große n wird, da |an | ≤ c ist. Ein hübscher kleiner Trick!
an
1
1
c) Da
= an · , genügt es die Folge
zu betrachten, um dann b) anzuwenden. Setze
bn
bn
bn n
c := |b|/2. Da bis auf endlich viele n alle bn in dem Intervall ]b − c, b + c[ liegen, kann bn ≤ c
nur für endlich viele n gelten. (Du darfst ja ε = c verlangen.) Wenn wir die Folgenglieder mit
|bn | ≤ c weglassen, konvergiert der Rest der Folge immer noch gegen b. Für die restlichen n gilt
dann
1
− 1 = |b − bn | < |b − bn |
bn
b
|bbn |
|bc|
Sei jetzt ε > 0 beliebig. Ist nun N so groß, dass |bn − b| < ε|bc| für alle n > N gilt, so ist
1
1
− <ε.
bn
b
3.2.28 Anwendung: Wir betrachten die unendliche geometrische Reihe
∞
X
qn = 1 + q + q2 + q3 + · · ·
n=0
Wir wissen bereits, dass für endliche geometrische Reihen mit q 6= 1 folgendes gilt:
k
X
qn = 1 + q + q2 + q3 + · · · + qk =
n=0
1 − q k+1
.
1−q
Die unendliche geometrische Reihe konvergiert also genau dann, wenn die Folge
konvergiert.
1 − q k+1
1−q
k∈N
Nun ist limk→∞ q k = 0 (also auch limk→∞ q k+1 = 0, nicht wahr?), wenn |q| < 1 ist. Nach obigem
Satz folgt
∞
X
1
qn =
für |q| < 1.
1
−
q
n=0
Für |q| ≥ 1 erkennt man leicht, dass die Reihe divergiert.
Das Konvergenzverhalten der geometrischen Reihe findet häufige Anwendung.
98
KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN
P
(−1)n+1
konver3.2.29 Absolute Konvergenz. Die alternierende harmonische Reihe ∞
n=1
n
giert bekanntlich. Aber, wenn man in ihr jedes Glied durch seinen Absolutbetrag ersetzt, erhält
man die divergente harmonische Reihe.
Definition
3.2.30 Eine unendliche Reihe
P∞
he k=0 |ak | konvergiert.
P∞
k=0
ak heißt absolut konvergent, wenn die Rei-
Satz 3.2.31 Im Bereich der reellen Zahle ist jede absolut konvergente Reihe auch konvergent.
Beweis:
P Wir zeigen mit Hilfe der Dreiecksungleichung, dass die zu
Pneiner absolut konvergenten
Pn
Reihe ∞
a
gehörende
Folge
eine
Cauchy-Folge
ist.
Setze
s
:=
n
k=0 k
k=0 ak und tn :=
k=0 |ak |.
Wir haben zu zeigen, dass zu jedem ε > 0 ein N ∈ N existiert, für das |sm − sn | < ε gilt, falls
m, n ≥ N ist. Wir haben
|sm − sn | = |
m
X
k=n+1
ak | ≤
∞
X
|ak | = |tm − tn |
k=n+1
Da nach Voraussetzung die Folge der tn konvergiert, gibt es ein N ∈ N mit |tm − tn | < ε falls
m, n ≥ N ist. Unter derselben Voraussetzung ist auch |sm − sn | < ε.
Die
ist, wie oben gesehen, falsch. Man kann auch den Wert von
P∞ Umkehrung diesesPSatzes
∞
|a
|
a
aus
dem
von
k nicht durch eine allgemeine Methode berechnen.
k=0
k=0 k
Kapitel 4
Vom primitiven Urgrund moderner
Mathematik
4.1
Mengen
Die in diesem Kapitel angesprochenen Begriffe sind zwar schrecklich abstrakt, aber im Grunde
einfach zu verstehen. Versuche zu erkennen, wie simpel, ja geradezu primitiv diese Dinge sind.
Die Mengensprache ist eine einfache, aber wichtige und grundlegende Sprache der modernen
Mathematik.
Solltest Du einst Mathematik, Physik oder Informatik studieren, wirst Du mit Mengen und
Abbildungen täglich umgehen müssen.
Achtung: So einfach die folgenden Dinge sind, so pedantisch musst Du sie und ihre Bezeichnungen allerdings behandeln. Zum Beispiel bezeichnet {0, 2} die Menge der beiden Zahlen 0
und 2, während mit [0, 2] die Menge aller (unendlich vielen) reellen Zahlen zwischen 0 und 2
einschließlich 0 und 2 bezeichnet wird. S.u.
4.1.1 Eine Menge M wird dadurch konstituiert, dass man auf widerspruchsfreie Weise angibt,
welche Dinge zu ihr gehören sollen, d.h. für welche x das Symbol x ∈ M gelten soll, d.h. welche
Dinge Elemente der Menge sind.
Gilt dies für nur endlich viele Dinge, d.h ist die Menge M endlich, so kann man sie prinzipiell
durch Angabe aller ihrer Elemente beschreiben, die man gemeinhin in geschweifte Klammern
setzt, wobei es auf die Reihenfolge nicht ankommt, und auch nicht darauf, ob man (zufällig)
eines ihrer Elemente mehrfach angibt:
{3, 7, 2, 7, 1, 7} = {3, 7, 2, 3, 7, 1, 2} = {3, 7, 2, 1} = {1, 2, 3, 7}
Bezeichnung: Die Anzahl der Elemente einer endlichen Menge M wird mit #M bezeichnet.
Häufig findet man stattdessen auch die Bezeichnung |M |. Man nennt #M auch die Kardinalzahl von M .
99
100
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Unendliche Mengen, d.h. solche mit unendlich vielen Elementen, muss man anders beschreiben. Wir wollen z.B. die Mengen N, Z, Q, R als wohlbeschrieben ansehen und aus ihnen weitere
Mengen gewinnen, z.B. die Menge der geraden ganzen Zahlen, die man wie folgt (auf zweierlei
Art) schreiben kann:
{n n ∈ Z, 2|n} = {n ∈ Z 2|n}
Die zweite Bezeichnung ist nur eine Abkürzung der ersten. (Den ersten senkrechten Strich habe
ich hier so groß geschrieben, um ihn von
dem Strich zu unterscheiden, der angibt, dass 2 ein
Teiler von n ist.) Ebenso ist {n ∈ Z 2 - n} die Menge der ungeraden Zahlen. (Statt des
senkrechten Striches schreiben manche auch ;“ oder :“ .)
”
”
Wichtige Mengen reeller Zahlen sind die Intervalle. Seien a, b ∈ R mit a < b, so schreibt man:
[a, b] := {x ∈ R | a ≤ x ≤ b} , ]a, b[ := {x ∈ R | a < x < b} ,
]a, b] := {x ∈ R | a < x ≤ b} , [a, b[ := {x ∈ R | a ≤ x < b}
Also ist [a, b] die Menge aller reellen Zahlen zwischen a und b einschließlich a und b. Und
]a, b[ besteht aus allen reellen Zahlen zwischen a und b, wobei aber a und b ausgeschlossen
sind. Bei den Intervallen ]a, b] und [a, b[ ist jeweils ein Endpunkt eingeschlossen, der andere
ausgeschlossen.
Bei festem a, b unterscheiden sich je zwei von diesen Mengen in höchstens 2 Elementen. Frage:
Darf man sie deshalb miteinander verwechseln?
Ohne Probleme, denn es kann ja wohl nichts ausmachen, ob man einen oder beide ‘Endpunkte’ eines Intervalls zu diesem rechnet oder nicht. Man möge bitte bedenken, dass alle o.a.
Intervalle die gleiche Länge b − a haben. Außerdem kann man sie zeichnerisch (als Strecken auf
der Zahlengeraden) nicht wirklich voneinander unterscheiden.
Keinesfalls, denn das Intervall ]a, b[ hat z.B. in Bezug auf Konvergenz völlig andere Eigenschaften als das Intervall [a, b]. (Betrachte, für b > a + 1, z.B. die Folge (a + 1/n)n =
(a + 1, a + 1/2, a + 1/3, . . .).)
Neben den oben genannten beschränkten Intervallen betrachten wir auch unendliche große
Intervalle
[a, ∞[ := {x ∈ R | a ≤ x} , ]a, ∞[:= {x ∈ R | a < x}
] − ∞, b] := {x ∈ R | x ≤ b} , ] − ∞, b[:= {x ∈ R | x < b}
N.B. Es ist R+ = [0, ∞[ , R∗+ = ]0, ∞[. Alle solche Mengen bezeichnen wir als Intervalle.
(Beachte, dass wir nur Intervalle positiver oder unendlicher Länge betrachten, also weder [a, a] =
{a}, noch ]a, a[ als Intervall bezeichnen. Somit sind alle Intervalle unendliche Mengen! D.h. sie
haben unendlich viele Elemente.)
Beachte: Intervalle der Form [a, ∞] usw., die nicht ganz in R liegen, werden in diesem Buch
nicht betrachtet.
Man zieht auch die Menge in Betracht, die gar keine Elemente besitzt, die sogenannte leere
Menge, die mit ∅ bezeichnet wird. Z.B. ist {x ∈ R | a < x < a} = ∅.
4.1. MENGEN
101
Was meinst Du dazu?
Es ist wirklich formaler Quatsch, ∅ zu betrachten.
Man kann leicht Mengen M definieren, von denen es nicht von vorneherein klar ist, ob sie
leer sind. Es kann also ungewollt passieren, dass M = ∅ ist. Deshalb hat es nicht viel Sinn, ∅
von der Betrachtung auszuschließen.
4.1.2 Seien M, N Mengen. Man nennt M eine Teilmenge von N (und manchmal N eine
Obermenge von M ) und schreibt M ⊂ N oder N ⊃ M , wenn jedes Element von M auch ein
solches von N ist:
h
i
M ⊂ N ⇐⇒ x ∈ M =⇒ x ∈ N
h i
Die eckigen Klammern , sind hier logische Klammern! Die Aussage M ⊂ N kann man auch
so ausdrücken: Für alle x gilt [x ∈ M =⇒ x ∈ N ].
”
Dabei schließen wir die Gleichheit nicht aus. Es gilt mit dieser Definition also M ⊂ M . (Manche
benutzen deshalb statt ‘M ⊂ N ’ lieber die Bezeichnung ‘M ⊆ N ’.)
Zum Beispiel gelten
{1, 3, 7} ⊂ {1, 2, 3, 7} , {n ∈ Z 6|n} ⊂ {n ∈ Z
3|n} , [a, b[⊂ [a, b]
4.1.3 Der Durchschnitt M1 ∩ M2 zweier Mengen M1 und M2 ist die Menge aller Elemente,
die sowohl Elemente von M1 , als auch solche von M2 sind:
M1 ∩ M2 = {x | x ∈ M1 und x ∈ M2 }
Beispiele: {1, 7, 3, 8, 4, 9} ∩ {3, 7, 2, 7, 1, 7} = {1, 3, 7} ,
= {n ∈ Z 6|n} , ]0, 3[ ∩ Z = {1, 2}.
{n ∈ Z 2|n} ∩ {n ∈ Z 3|n}
Man beachte dass das Wort ‘Durchschnitt’ hier in einem ganz anderen Sinne gebraucht wird
als in dem Satz Der Durchschnitt der Schokoladenpreise in diesem Supermarkt ist 79 Cent“.
”
Der Durchschnitt von Mengen bedeutet nicht ein arithmetisches Mittel.
Die Vereinigung M1 ∪ M2 zweier Mengen M1 und M2 ist die Menge aller derjenigen Elemente,
die in M1 oder M2 liegen, d.h. die ein Element mindestens einer der beiden Mengen sind.
M1 ∪ M2 := {x | x ∈ M1 oder x ∈ M2 }
Beispiele {1, 7, 3, 8, 4, 9} ∪ {3, 7, 2, 7, 1, 7} = {1, 2, 3, 4, 7, 8, 9}, [0, 2] ∪ [2, 3] = [0, 3],
[0, 3[ ∪ [2, 4[= [0, 4[, ] − ∞, 0[ ∪ ]0, ∞[= R∗ .
Man mag geneigt sein zu sagen, die Elemente von M1 ∪ M2 seien die Elemente von M1 und von
M2 . Du solltest Dir aber darüber im Klaren sein, dass bei dieser Sprechweise nicht gemeint ist:
M1 ∪ M2 besteht aus den Elementen x, für die x ∈ M1 und x ∈ M2 gilt. Letztere Menge wäre
gerade der Durchschnitt M1 ∩ M2 .
Man muss unterscheiden, ob das Wort ‘und’ Aussagen oder Gegenstände verbindet.
102
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
(Die ursprünglichen Bezeichnungen ‘Durchschnitt’ und ‘Vereinigung’ wurden später mit ‘intersection’
und ‘union’ ins Englische und Französische übersetzt. Es gibt keinen Grund, sie auch im Deutschen
so zu nennen.)
Offenbar gelten folgende Aussagen:
M 1 ⊂ M1 ∪ M 2 ,
M2 ⊂ M 1 ∪ M 2 ,
M1 ∩ M 2 ⊂ M 1 ,
M1 ∩ M 2 ⊂ M 2
Man kann auch den Durchschnitt und die Vereinigung von mehr als zwei Mengen bilden, ja
sogar von unendlich vielen Mengen.
Beispiele: a) 2Z ∩ 3Z ∩ 5Z = 30Z. Dabei habe ich mit mZ die Menge {mk | k ∈ Z} =
{n ∈ Z | es gibt ein k mit n = mk}, also die Menge der durch m teilbaren ganzen Zahlen
bezeichnet.
b) Die Menge 2Z ∪ 3Z ∪ 5Z, also die Menge der ganzen Zahlen, die durch 2 oder 3 oder 5 teilbar
sind, lässt sich nicht in der Form mZ schreiben.
c) Mit P bezeichne
\ ich die Menge der Primzahlen. Der unendliche Durchschnitt 2Z∩3Z∩5Z∩. . .,
pZ bezeichnet wird, besteht nur aus der 0, da jede von 0 verschiedene ganze
der auch mit
p∈P
Zahl durch nur endlich viele Primzahlen teilbar ist.
4.1.4 Man betrachtet auch die Mengendifferenz, auch Differenzmenge M −N (auch M \N
geschrieben):
M − N := {x ∈ M | x ∈
/ N } = {x | x ∈ M und x ∈
/ N}
Beispiele: a) {1, 3, 4, 7, 8, 9}−{1, 2, 3, 5, 7} = {4, 8, 9} oder Z−{n ∈ Z 2 - n} = {n ∈ Z 2|n}
oder R − {0} = R∗ .
[
pZ bezeichnet wird, ist die
b) Die unendliche Vereinigung 2Z ∪ 3Z ∪ 5Z ∪ . . ., die auch mit
p∈P
Mengendifferenz Z − {1, −1}.
Die – selten gebrauchte – symmetrische Differenz zweier Mengen M1 , M2 ist
(M1 ∪ M2 ) − (M1 ∩ M2 ) = (M1 − M2 ) ∪ (M2 − M1 ). Beweise diese Gleichheit.
4.1.5 Logische Symbole. Die Absätze 4.1.5 bis 4.1.8 musst Du nicht unbedingt lesen. Sie
bilden auch keine Einführung in die (formale) Logik. Sie fügen sich in etwa in den abstrakten
Rahmen der Mengenlehre ein und sollen Dir nützen, wenn sie in Deinem späteren Studium
gelegentlich von Dozenten oder Kommilitonen verwendet werden. Und solltest Du einmal eine
Vorlesung zur Logik besuchen, dann weißt Du schon ein wenig über die benutzten Symbole.
Zwei Aussagen A, B kann man logisch verknüpfen durch die Junktoren“ ‘und’ und ‘oder’.
”
Diese werden manchmal abgekürzt: ∧ heißt ‘und’, ∨ heißt ‘oder’. Dabei bedeutet ∨ kein
ausschließendes ‘oder’.
A ∨ B ist genau dann wahr, wenn mindestens eine der Aussagen A, B wahr ist.
A ∧ B ist genau dann wahr, wenn beide Aussagen wahr sind.
4.1. MENGEN
103
Obige Definitionen von Durchschnitt und Vereinigung schreiben sich mit diesen Symbolen so:
M ∪ N = {a | a ∈ M ∨ a ∈ N }, M ∩ N = {a | a ∈ M ∧ a ∈ N }
Beachte: (A ∧ B) ∨ C bedeutet etwas anderes als A ∧ (B ∨ C). Manche Unklarheiten in nicht
formalisierten Texten entstehen dadurch, dass man solcherlei nicht leicht unterschiedlich ausdrücken kann. In verbalen Sätzen haben die Klammern – so man sie überhaupt verwendet –
eine andere Bedeutung als in mathematischen und logischen Formeln.
Die beiden folgenden Ausdrücke sind äquivalent: (A ∧ B) ∨ C und (A ∨ C) ∧ (B ∨ C).
Selbiges gilt für A ∧ (B ∨ C) und (A ∧ B) ∨ (A ∧ C).
Für Mengen bedeutet dies:
L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) , L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ) .
D.h. es gelten bezüglich ∪ und ∩ Distributivitätsgesetze. Und zwar eines, wo sich der Durchschnitt wie das Produkt und die Vereingung wie die Summe in einem Ring verhält, und eines
wo es gerade umgekehrt ist. (In einem Ring, der nicht der Nullring ist, gilt neben dem bekannten Distributivgesetz kein solches, wo die Rollen von ’+’ und ’·’ vertauscht sind. Dann müsste
nämlich 1 + (1 · 0) = (1 + 1) · (1 + 0), also 1 = 1 + 1 sein. Aus der Existenz additiv Inverser
folgte dann ein Widerspruch. Für jede Menge M gilt hingegen M = M ∪ M = M ∩ M .)
Die Menge aller Teilmengen einer Menge M kann man als Rechenbereich mit den beiden Verknüpfungen ∩, ∪ betrachten. In diesem Rechenbereich gibt es neutrale Elemente, nämlich M bezüglich ∩ und
∅ bezüglich ∪. Inverse Elemente gibt es aber nicht, es sei denn, es ist M = ∅.
4.1.6 Ferner kann man die Aussage A verneinen durch ‘nicht A’ , das man auch ¬A schreibt.
Genau dann ist ¬A richtig, wenn A falsch ist.
In der sogenannten klassischen Logik, die ich in diesem Buch (wie die allermeisten Mathematiker) benutze, ist ¬(¬A) mit A äquivalent. Dabei geht man davon aus, dass eine – sinnvolle –
Aussage auch über unendlich viele Objekte entweder wahr oder falsch ist: Tertium non datur“,
”
d.h. ein drittes gibt es nicht“.
”
(In der sogenannten intuitionistischen Logik akzeptiert man das nicht unbedingt. Möglicherweise könnte sich ja weder die Wahrheit noch die Falschheit einer Aussage beweisen lassen.
Auch in der intuitionistischen Logik folgt ¬(¬A) aus A. Wenn man hingegen ¬(¬A), d.h. dass
A nicht falsch ist, voraussetzt, aber nicht davon ausgeht, dass A entweder falsch oder richtig
ist, wie wollte man dann erkennen, dass A richtig ist?)
(Im Sprachgebrauch wird manchmal die doppelte Verneinung zur Betonung einer Verneinung
benutzt. Das ist, wie gesagt ein Sprachgebrauch, der sich als solcher nicht vor der Logik rechtfertigen muss. Das heißt aber nicht, dass manchmal die Verneinung der Verneinung einer –
nichtleeren – Aussage dasselbe wie die Verneinung dieser Aussage bedeuten könnte.)
Die Aussage ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B).
Und ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B).
104
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Bemerkung: Die Aussage
(1) ‘A =⇒ B’ bedeutet (in der klassischen Logik) nichts anderes als
(2) ‘(¬A) ∨ B’.
Denn wenn B richtig ist, so sind beide Aussagen (1) und (2) richtig, unabhängig davon, ob
A richtig oder falsch ist. Ist aber B falsch und A richtig, so sind (1) und (2) beide falsch. Ist
hingegen B falsch und A falsch, so sind wieder (1) und (2) beide richtig. D.h. aber: In allen
Fällen, wo eine der beiden Aussagen (1) oder (2) richtig ist, ist es auch die andere.
Und A ⇐⇒ B bedeutet natürlich (A =⇒ B) ∧ (B =⇒ A).
4.1.7 Außer den Junktoren braucht man in der formalisierten Logik noch die sogenannten
Quantoren: für alle“ und es gibt“, welch letzteres nichts anderes bedeutet als für minde”
”
”
stens ein“. Man braucht dazu Aussagen über eine Variable“, etwa x. Man schreibt A(x), was
”
bedeuten soll: A gilt für x. Ein Beispiel ist die Aussage x ∈ R =⇒ 2x = x + x.
V
Die abkürzenden Bezeichnungen sind: x A(x) in der Bedeutung: für alle x gilt A“ (Allquan”
tor).
W
und: x A(x) in der Bedeutung: für (mindestens) ein x gilt A“ (Existenzquantor).
”
V
W
Mathematiker benutzen häufiger die Abkürzungen ∀ statt und ∃ statt . W
Vorsicht: ∀ bedeutet – trotz ähnlichen Aussehens – gerade nicht dasselbe wie !
Zwei Allquantoren darf man miteinander vertauschen; dasselbe gilt für zwei Existenzquantoren.
Frage: Darf man einen All- mit einem Existenzquantor vertauschen?.
Ja
Nein
Denke an die Definition der Konvergenz und in welcher Weise man sie nicht ändern darf!
In den natürlichen Sprachen werden Allquantoren häufig versteckt. Z.B. gilt folgender Satz:
Seien x, y (beliebige) reelle Zahlen. Dann gilt xy = yx.“ Damit ist gemeint:
”
^^
(x ∈ R ∧ y ∈ R) =⇒ xy = yx
x
y
Oder, wenn man sagt für eine reelle Zahl x gilt 2x = x + x“, so meint man meist: für alle
”
”
reellen Zahlen x gilt 2x = x + x“. Aus diesem Grunde empfiehlt es sich, den Existenzquantor
mit es gibt“ zu verbalisieren. Statt Für eine reelle Zahl x gilt xx = x2“ sollte man sagen es
”
”
”
gibt eine reelle Zahl x mit xx = x2“. (Dies ist eine richtige Aussage, nicht wahr??)
Beachte: Die Aussage Es gibt ein x, für das A(x) gilt“ schließt nicht aus, dass es mehrere
”
solche x gibt. Z.B. ist xx = x2 für x = 1 und für x = 2 richtig.
V
V
Beispiele 4.1.8 a) Die Aussagen x (x ∈ N =⇒ xx = x2 ) und x (x ∈ N =⇒ xx 6= x2 ) sind
beide falsch.
W
W
b) Hingegen sind die Aussagen x (x ∈ N ∧ xx = x2 ) und x (x ∈ N ∧ xx 6= x2 ) beide richtig.
4.1. MENGEN
105
c) Für alle Mengen M, N gilt
M ⊂ N ⇐⇒
^
(x ∈ M =⇒ x ∈ N )
x
4.1.9 Seien X, Y Mengen. Unter dem cartesischen Produkt X × Y (genannt nach Descartes, der in latinisierter Form Cartesius genannt wurde) versteht man die Menge aller Paare
(x, y) mit x ∈ X, y ∈ Y . Zum Beispiel kann man die euklidische Ebene bekanntlich als Menge
aller Paare (x, y) reeller Zahlen auffassen. Also ist“ sie R × R.
”
Ebenso kann man das cartesische Produkt von 3 oder mehr Mengen bilden. R × R × R ist die
Menge aller Tripel (x1 , x2 , x3 ) reeller Zahlen. Statt R × R schreibt man auch R2 und statt
R × R × R. Entsprechend ist R4 usw. und Rn zu verstehen. Die Elemente (x1 , x2 , . . . , xn ) des
Rn heißen n-tupel reeller Zahlen. Ebenso gut kann man von n-tupeln ganzer Zahlen, d.h. von
Elementen des Zn , usw.
Ein n-tupel ist ein formales Nacheinandersetzen (Nacheinanderschreiben) von Elementen. Zwei
n-tupel (x1 , . . . , xn ), (y1 , . . . , yn ) sind genau dann einander gleich, wenn x1 = y1 , . . . , xn = yn
gilt. Die Tripel (d.h. 3-tupel) (1, 1, 2), (1, 2, 2), (1, 2, 1), (2, 1, 1) sind also alle untereinander verschieden, während die Mengen {1, 1, 2}, {1, 2, 2}, {1, 2, 1}, {2, 1, 1} untereinander
gleich sind. Es ist also ein großer Unterschied zwischen dem Begriff einer endlichen Menge
{x1 , x2 , . . . , xn } und dem eines n-tupels (x1 , x2 , . . . , xn ) !
Ist K ein beliebiger Körper, so definiert man auf dem K n eine Addition wie folgt:
(a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) := (a1 + b1 , a2 + b2 , . . . , an + bn )
(4.1)
Alle Axiome der Addition in einem Körper (oder Ring) sind für diese Addition erfüllt. Definiert
man noch eine Multiplikation durch
(a1 , a2 , . . . , an ) · (b1 , b2 , . . . , bn ) := (a1 b1 , a2 b2 , . . . , an bn )
so wird der K n zu einem Ring, der aber für n > 1 kein Körper ist. (Warum nicht?)
Wichtiger ist die Multiplikation eines Elementes von K mit einem solchen von K n :
a · (b1 , . . . , bn ) := (ab1 , . . . , abn )
(4.2)
für a, b1 , . . . , bn ∈ K. Es ist K n zusammen mit der Addition (4.1) und der Multiplikation (4.2)
ein sog. Vektorraum.
AUFGABEN
1. Prinzip der Inklusion-Exklusion a) Seien A, B endliche Mengen aus a, bzw. b Elementen.
Ferner sei d die Zahl der Elemente von A ∩ B. Wieviele Elemente besitzt A ∪ B?
b) Seien A1 , A2 , A3 endliche Mengen aus a1 , a2 , a3 Elementen. Für i 6= j sei aij =
#(Ai ∩ Aj ), ferner a123 = #(A1 ∩ A2 ∩ A3 ). Zeige #(A1 ∪ A2 ∪ A3 ) = a1 + a2 + a3 − a12 − a13 −
a23 + a123 .
106
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
c) (Dieser Aufgabenteil ist einigermaßen aufwendig. Du solltest keinenfalls seinetwegen die
Lektüre des Buches hier abbrechen! Lass ihn lieber weg, und bearbeite ihn später oder überhaupt nicht. Oder ersetze ihn durch Teil b) mit 4 statt T
3 Mengen.) Seien A1 , . . . , An endliche
Mengen. Für jedes nichtleere I ⊂ {1, . . . , n} sei aI := # i∈I Ai . Dann gilt
X
#(A1 ∪ . . . ∪ An ) =
(−1)#I+1 aI .
∅6=I⊂{1,...,n}
Setzt man a∅ = #(A1 ∪ . . . ∪ An ), so kann man die behauptete Gleichung auch wie folgt
schreiben:
X
(−1)#I aI = 0 .
I⊂{1,...,n}
2. Seien A, B Teilmengen von N. Betrachte die beiden Mengen
X = A ∩ B, Y = N − (A ∪ B).
Zeige durch Beispiele, dass, je nach Wahl von A, B jeder der folgenden 4 Fälle eintreten kann:
a),b) X, Y sind beide endlich bzw. beide unendlich; c) X ist endlich, Y unendlich. d) X ist
unendlich, Y endlich.
3. Betrachte für ganze n ≥ 1 die Menge V := (Z/2)n = Fn2 . In ihr gibt es ja die Addition
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
Diese ist assoziativ und kommutativ, und ein neutrales Element (bzgl. der Addition) ist
(0, . . . , 0). Ferner gilt für jedes a = (a1 , . . . , an ) die Regel a + a = 0 := (0, . . . , 0), da 1 + 1 = 0
in Fs gilt.
Zeige, dass für n ≥ 2 die Summe aller Elemente von V gleich (0, . . . , 0) ist. (Die Summe dieser
Elemente für n = 1 ist das 1-tupel (1).)
4.2
Abbildungen
4.2.1 Ohne den Begriff ‘Abbildung’ geht in der modernen Mathematik gar nichts. Zu einer
Abbildung gehören eine Startmenge (Definitionsbereich) X und eine Zielmenge Y . Eine Abbildung f : X → Y , d.h. von X nach Y besteht nun darin, dass jedem Element x ∈ X genau
ein (d.h. ein, aber auch nur ein) Element f (x) ∈ Y zugeordnet wird. Wird durch f auch nur
einem einzigen Element x ∈ X kein oder mehr als ein Element aus Y zugeordnet, so ist f keine
Abbildung von X nach Y .
Damit soll nicht gesagt sein, dass es keinen Sinn hat, auch andere ‘Korrespondenzen’ zu betrachten, wo etwa jeder positiven reellen Zahl ihre beiden Quadratwurzeln ‘zugeordnet werden’.
Definition: Die Teilmenge {(x, y) ∈ X × Y | y = f (x)} von X × Y wird der Graph von f
genannt und meist mit Γ(f ) bezeichnet.
4.2. ABBILDUNGEN
107
Wenn Du Skrupel hast, obige Erklärung Jedem Element aus X wird genau ein Element aus Y
”
zugeordnet“ als richtige Definition anzuerkennen, kannst Du eine Abbildung als ihren Graphen
betrachten, d.h. als eine Teilmenge Γ(f ) ⊂ X ×Y definieren, die folgende Eigenschaft besitzt: Zu
jedem x ∈ X gibt es genau ein – also mindestens und höchstens ein – y ∈ Y mit (x, y) ∈ Γ(f ).
Natürlich hat f (x) = y dieselbe Bedeutung wie (x, y) ∈ Γ(f ).
Sind X und Y Teilmengen von R, so ist der Graph jeder Abbildung f : X → Y eine Teilmenge
von R2 , die Du, wie gewohnt, manchmal (teilweise) zeichnen kannst.
4
3
2
1
1
2
3
4
Frage: Ist f : R → R, f (x) := 1/x eine Abbildung?
Ja. Warum sollte sie keine sein?
ordnet.
Nein; denn dem Element 0 wird kein Element zuge-
Frage: Ist f : R − {0} → R, f (x) := 1/x eine Abbildung?
Ja
Nein
Man kann durch geschickte Wahl der Startmenge (oder auch der Zielmenge) oft eine Abbildung
definieren, wo eine solche in strengem Sinn vorher noch nicht bestand.
Frage: Ist folgendes eine Abbildung?
f : R → R definiert durch f (x) = 1 für x ∈ Q,
Ja
f (x) = 0 sonst.
Nein
Diese Abbildung ist zwar nirgendwo stetig, jedoch für den Mathematiker präzise definiert.
Aber kann man – für einen beschränkten Teilbereich der Startmenge R – den Graphen dieser
Funktion zeichnen? Bedenke, dass ein gezeichneter Punkt, also ein Punkt, den man sehen kann,
kein echter Punkt ist, sondern eine positive Ausdehnung hat.
(Der Begriff der Stetigkeit wird weiter unten genau definiert. Ich hoffe allerdings, dass Du ein
Gefühl dafür hast.)
Ferner ist zuzugeben, dass es bei einer gemessenen physikalischen Größe keinen Sinn hat, zu
fragen, ob sie rational oder irrational ist. Beachte dazu folgendes: Sogar wenn Du die ersten
10
1010 Dezimalstellen einer reellen Zahl x0 kennst, weißt Du nicht, welchen Wert die genannte
108
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Funktion bei x0 auch nur angenähert hat! Andererseits scheint es auch nicht sinnvoll, sich allein
auf die stetigen Funktionen zu beschränken. Auch in der Physik betrachtet man manchmal
unstetige Funktionen.
Ein weiteres Beispiel ist:
g : R → R,
g(x) = x2 für x ≥ 0, g(x) = −x2 für x < 0
Diese Abbildung ist stetig, sogar differenzierbar, aber nicht 2-mal differenzierbar, jedenfalls
nicht in 0. (Letzteres heißt, dass die Ableitung g 0 von g in 0 nicht differenzierbar ist. Prüfe das
nach! Wenn Du erst lernen willst, was eine differenzierbare Funktion und ihre Ableitung ist, so
kannst Du das weiter unten im Kapitel 7 dieses Buches tun.)
Bezeichnung: Wir benutzen gerne folgende Bezeichnung, um diese Funktion g und ähnliche
zu beschreiben:
2
x
für x ≥ 0
g : R → R, g(x) =
−x2 sonst
Bei endlichen Mengen kann man konkret angeben, wohin jedes einzelne Element abgebildet
wird, z.B.
α : {1, 2, 3} → {1, 2, 3}, 1 7→ 2, 2 7→ 2, 3 7→ 3
β : {1, 2, 3} → {1, 2, 3},
1 7→ 2, 2 7→ 3, 3 7→ 1
Ich benutze das Zeichen A → B, um von einer Abbildung der Menge A in die Menge B zu
reden, hingegen das Zeichen a 7→ b um anzugeben, dass bei dieser Abbildung dem Element a
das Element b zugeordnet wird, anders gesagt: das Element a auf das Element b abgebildet
wird.
Definitionen 4.2.2 Sei f : X → Y eine Abbildung.
a) X heißt die Startmenge (kurz: der Start) und Y die Zielmenge (kurz: das Ziel) von f .
(In manchen Situationen, insbesondere in diesem Kapitel, ist man sehr streng und unterscheidet zwischen Abbildungen, die nur bis auf die Start- oder die Zielmenge übereinstimmen, z.B.
zwischen den Abbildungen f : R → R, x 7→ x2 und g : R → R+ , x 7→ x2 .)
b) Die Bildmenge (auch das Bild), von f , die manchmal mit im(f ) (von lateinisch imago),
manchmal mit f (X) bezeichnet wird, ist die Menge {fW
(x) | x ∈ X} =
{y ∈ Y | es existiert ein x ∈ X mit f (x) = y} = {y | x∈X f (x) = y}. Die Bildmenge ist eine
Teilmenge der Zielmenge, stimmt aber nicht immer mit dieser überein!.
c) f heißt injektiv, wenn verschiedene Elemente von X auch verschiedene Bilder haben, d.h.
wenn aus f (x) = f (x0 ) immer x = x0 folgt. (Dass aus x = x0 immer f (x) = f (x0 ) folgt, ist
aufgrund des Begriffes einer Abbildung klar, und hat deshalb überhaupt nichts mit ‘injektiv’ zu
tun!)
d) f heißt surjektiv, wenn jedes Element y ∈ Y das Bild (mindestens) eines x ∈ X ist, d.h.
wenn f (X) = Y , also die Bildmenge gleich der Zielmenge ist.
4.2. ABBILDUNGEN
109
e) f heißt bijektiv, wenn f sowohl injektiv wie surjektiv ist.
f ) Sind f : X → Y, g : Y → Z Abbildungen, so definiert man ihre Verkettung (auch
Hintereinanderausführung) g ◦f : X → Z durch (g ◦f )(x) := g(f (x)).
Achtung; Die älteren Bezeichnungen eineindeutig“ anstelle von injektiv“, sowie Abbildung
”
”
”
auf“ anstelle von surjektive Abbildung“ werden in diesem Buch nicht verwendet.
”
Beispiele 4.2.3 a) Die oben am Ende von 4.1.1 angegebene Abbildung α ist weder injektiv,
noch surjektiv; β hingegen ist bijektiv.
b) Durch x 7→ x2 können, je nach Wahl von Start und Ziel, Abbildungen mit verschiedenen der
o.a. Eigenschaften definiert werden:
1) R → R, weder surjektiv noch injektiv,
2) R → R+ , surjektiv aber nicht injektiv,
3) R+ → R, injektiv aber nicht surjektiv,
4) R+ → R+ , sowohl surjektiv wie injektiv, also bijektiv.
c) Die Abbildung Z → N, n 7→ |n| ist surjektiv, aber nicht injektiv. Gibt es auch eine bijektive
Abbildung Z → N?
Eine Antwort findest Du unten, am Ende von 4.2.4.
√
d) Beispiele für Verkettungen kennst Du sicher. Z.B. ist dir Funktion h(x) := 1 + x2 die
√
Verkettung der Funktionen f : R → R, f (x) := 1 + x2 und g : R → R, g(y) := y. D.h. für
diese Funktionen gilt h = g ◦f .
Was meinst Du zu meinen Ausführungen?
Diese Begriffshuberei ist doch völlig uninteressant. Ich werde mich in meinem Studium auf
die Gebiete beschränken, die ohne solchen formalen Quatsch auskommen.
Die obigen Begriffe sind zwar einfach, aber doch geeignet, die Situation zu klären. Du kannst
ihnen in keinem Gebiet der modernen Mathematik entgehen.
Was meine ich? Ich habe sehr viel Verständnis dafür, wenn Du die erste Antwort angekreuzt
hast. Es braucht wirklich viel Erfahrung mit moderner Mathematik, um zu erkennen, dass die
zweite Antwort doch die bessere ist.
4.2.4 Sei f : X → Y eine bijektive Abbildung. Dann gibt es zu jedem y ∈ Y genau ein (d.h. ein
eindeutig bestimmtes) x ∈ X mit f (x) = y. (Die Existenz dieses x folgt aus der Surjektivität,
seine Eindeutigkeit aus der Injektivität von f .)
Dieses x wird mit f −1 (y) bezeichnet. Macht man obiges für alle y ∈ Y , so erhält man eine
Abbildung f −1 : Y → X. Man nennt f −1 auch die Umkehrabbildung oder Umkehrfunktion
von f . Sie ist nur dann definiert, wenn f bijektiv ist. Natürlich ist auch f −1 bijektiv, wenn es
überhaupt definiert ist.
110
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Achtung: Die Abbildung
x 7→
1
f (x)
hat nichts, aber auch gar nichts mit f −1 , wie wir es definiert haben, zu tun! (Ich kann natürlich
nicht dafür garantieren, dass nicht in dem einen oder anderen Buch oder einer Vorlesung die
Abbildung x 7→ 1/f (x) doch mit f −1 bezeichnet wird. Da muss Du einfach aufpassen! Jeder
Autor hat – leider oder zum Glück? – das Recht auf seine eigenen Definitionen.)
Beispiele: a) Ist f : R → R durch f (x) := ax + b mit a, b ∈ R, a 6= 0 definiert, so wird
f −1 : R → R gegeben durch f −1 (y) = a−1 y − a−1 b. Die Graphen von f und von f −1 sind
Geraden. Hingegen ist 1/f (x) = (ax + b)−1 . Hier ist der Graph eher krumm!
√
b) Ist f : R∗+ → R∗+ gegeben durch f (x) = 1/x2 , so wird f −1 durch f −1 (y) = 1/ y gegeben.
Hingegen ist 1/f (x) = x2 .
c) Die Abbildung f : N → Z, definiert durch
n/2
f (n) =
−(n + 1)/2
für gerade n
für ungerade n
ist bijektiv und hat die Umkehrabbildung f −1 : Z → N, definiert durch
2m
für m ≥ 0
−1
f (m) =
−2m − 1 für m < 0
4.2.5 Ist f : X → Y eine bijektive Abbildung, so gilt f ◦f −1 = idY und f −1 ◦f = idX .
Sind umgekehrt f : X → Y und g : Y → X Abbildungen mit g ◦f = idX und f ◦g = idY , so
sind f, g bijektiv, und es ist g = f −1 und f = g −1 .
Lemma 4.2.6 Seien
β
α
W −→ X −→ Y .
Abbildungen. Dann gilt: Wenn α, β injektiv (bzw. surjektiv, bzw. bijektiv sind, so ist auch β ◦α
injektiv (bzw. surjektiv, bzw. bijektiv).
Lemma 4.2.7 Sei
α
β
γ
W −→ X −→ Y −→ Z
eine Folge von Abbildungen. Dann gilt γ ◦(β ◦α) = (γ ◦β)◦α.
Beweis:
Für w ∈ W gilt
(γ ◦(β ◦α))(w) = γ((β ◦α)(w)) = γ(β(α(w)))
und
((γ ◦β)◦α)(w) = (γ ◦β)(α(w)) = γ(β(α(w)))
4.2. ABBILDUNGEN
111
Mit anderen Worten: Sowohl γ ◦(β ◦α) als auch (γ ◦β)◦α ist die Abbildung, die entsteht, indem
man zuerst α, dann β und schließlich γ ausführt.
Beachte, dass α◦β in obiger Situation meistens nicht definiert ist. (Sie ist im Falle W = Y
definiert, allerdings eine Abbildung X → X, während β ◦α – im Falle W = Y – die Menge W in
sich abbildet. Die Frage, ob α◦β = β ◦α ist, kann also nur gestellt werden, wenn W = X = Y ist.
Betrachte hierzu die Menge X := {1, 2} und α, β : X → X, definiert durch α(x) := 1, β(x) = 2
für jeweils alle x ∈ X: Bestimme β ◦α und α◦β.
Sei Y := {1, 2, 3}. Finde bijektive α, β : Y → Y mit α◦β 6= β ◦α.
(Siehe 8.1.7, wenn Du die Aufgabe nicht selber lösen magst.)
4.2.8 Sei f : X → Y eine beliebige Abbildung – die weder injektiv noch surjektiv sein muss.
Dann definiert man manchmal für Teilmengen V ⊂ Y die folgende Menge:
f −1 (V ) := {x ∈ X | f (x) ∈ V }, die Urbildmenge von V
Vorsicht:Trotz gleicher Bezeichnung bedeutet f −1 hier nicht die Umkehrabbildung von f ,
welche ja nur dann definiert ist, wenn f bijektiv ist. f −1 (V ) ist eine Teilmenge von X. Auch
wenn V nur aus einem Element besteht, gilt dies nicht unbedingt für f −1 (V ).
Ist V ∩ im(f ) = ∅, so ist f −1 (V ) = ∅, und umgekehrt.
Man kann f −1 (V ) im Allgemeinen nicht als f −1 (V ) := {f −1 (y) | y ∈ V } definieren. Das geht
nur, wenn f bijektiv ist.
Ist U ⊂ X eine Teilmenge, so wird definiert:
f (U ) := {f (x) | x ∈ U }.
√ √
Beispiele: a) Ist f : R → R definiert durch f (x) = x2 , so ist f −1 ({2}) = {− 2, 2} und
f −1 ({−2}) = ∅.
b) Für dieselbe Funktion gilt f (R) = f (] − ∞, 0]) = [0, ∞[.
Bemerkung: Manchmal schreibt man f −1 (y) := f −1 ({y}). Hier musst Du besonders aufpassen!
4.2.9 Mächtigkeit. Wenn zwei endliche Mengen gleichviele Elemente haben, so gibt es
eine bijektive Abbildung zwischen ihnen – und umgekehrt. In diesem Fall nennt man sie
gleichmächtig. Wir verallgemeinern dies auf beliebige (endliche oder unendliche) Mengen.
Definition 4.2.10 Mengen M, N heißen gleichmächtig, symbolisch M ∼
= N , wenn es eine
bijektive Abbildung f : M → N gibt.
Ist immer M ∼
= M ? Gilt immer: Aus M ∼
= N folgt N ∼
= M ? Gilt immer: Aus L ∼
= M, M ∼
=N
folgt L ∼
= N ? Na klar!
112
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
4.2.11 Frage: Ist jede unendliche Teilmenge M von N gleichmächtig zu N. d.h. gibt es in
diesem Fall eine bijektive Abbildung N → M ?
Klar!
Ich glaube es schon, möchte aber über einen Beweis doch nachdenken.
Betrachte z.B. die Menge P aller Primzahlen. Dann kann man doch eine bijektive Abbildung
f : N → P dadurch angeben, dass man die Primzahlen der Reihe nach abzählt, also
f (0) = 2, f (1) = 3, f (2) = 5, f (3) = 7, f (4) = 11, f (5) = 13 usw.
Noch viel einfacher ist es es, die Menge N1 der natürlichen Zahlen ≥ 1 als gleichmächtig zu N
zu erkennenn, nämlich mittels f : N → N1 , f (n) = n + 1. Ferner haben wir oben gesehen, dass
N zu Z gleichmächtig ist.
Wie mit P kann man es natürlich mit jeder unendlichen Teilmenge von N machen. Nur darf man
dabei folgendes bedenken: Für komplizierter definierte Teilmengen X von N mag es – anders als
für die Menge P – prinzipiell schwierig sein, jeweils nach einem bereits gefundenen x0 ∈ X das
nächstgrößere x ∈ X effektiv nach einem konkreten Rezept zu bestimmen. Jedenfalls gibt es
kein allgemeingültiges Verfahren, diese Aufgabe für jede Teilmenge X von N zu lösen. Insofern
ist die Aussage, dass jede unendliche Teilmenge von N gleichmächtig zu N ist, eine ziemlich
theoretische Aussage. Wohlgemerkt, es mag zwar sehr zeitaufwendig sein, die kleinste Primzahl
10
zu bestimmen, die größer als 1010 ist, aber man weiß prinzipiell, wie man es machen muss.
Definition 4.2.12 Eine Menge heißt abzählbar, wenn sie endlich oder zu N gleichmächtig
ist.
Gemäß der obigen Bemerkung ist jede Teilmenge einer abzählbaren Menge abzählbar. Deshalb
ergibt sich die
Folgerung 4.2.13 Eine Menge M ist genau dann abzählbar, wenn es eine injektive Abbildung
M → N gibt.
Diese Aussage könnte man natürlich auch als Definition der Abzählbarkeit nehmen.
Definition 4.2.14 Eine Nullfolge natürlicher Zahlen ist eine Folge (ai )i∈N , für die ai ∈ N
für alle i ∈ N und ai = 0 für fast alle, d.h. alle i ∈ N bis auf endlich viele Ausnahmen gilt.
Z.B. ist die Folge (3, 7, 6, 0, 1, 0, 0, 0, . . .), wo alle Folgenglieder nach dem fünften Glied gleich 0
sind, eine Nullfolge natürlicher Zahlen. Die Folge, deren sämtliche Glieder gleich 1 sind, ist es
hingegen nicht. Auch nicht die Folge, in der für jedes n das n!-te Glied 1 ist und alle anderen
Glieder Null sind.
Eine Folge natürlicher Zahlen, die entsprechend der Grenzwertdefinition in R gegen 0 konvergiert, ist auch im Sinne der eben getroffenen Definition eine Nullfolge natürlicher Zahlen und
umgekehrt. (Beweis?)
4.2. ABBILDUNGEN
113
Satz 4.2.15 Es gibt eine bijektive Abbildung der Menge N aller Nullfolgen natürlicher Zahlen
nach N1 . Mithin ist N gleichmächtig zu N1 , also zu N. Die Menge N ist abzählbar.
Beweis: Dies haben wir bereits in Satz 1.3.5 gesehen. Eine bijektive Abbildung f : N → N1
wird durch
f (a1 , a2 , a3 , . . .) := pa11 · pa22 · pa33 · · ·
wobei p1 , p2 , p3 . . . die Primzahlen in ihrer natürlichen Reihenfolge und das rechtsstehende Produkt als das Produkt der endlich (!) vielen Faktoren, die ungleich 1 sind, definiert ist. (Hier
habe ich mit dem Index 1 statt 0 begonnen, da es bei der Folge der Primzahlen üblich ist.)
Die Surjektivität ergibt sich aus der Existenz der Primfaktorzerlegung, die Injektivität aus
deren Eindeutigkeit.
Den obigen Satz wirst Du kaum für spektakulär halten, weil er so abstrakt ist. Aber aus ihm
ergibt sich
Folgerung 4.2.16 Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis: Erinnere Dich, dass es genügt, eine injektive Abbildung Q → N anzugeben. Jede
schreiben. Wir definieren
rationale Zahl 6= 0 lässt sich eindeutig in gekürzter Form a = ± m
n
m
f : Q → N durch f (a) = (0, m, n, 0, 0, 0, . . .), wenn a = n (in gekürzter Form) ist, und
f (a) = (1, m, n, 0, 0, 0, . . .), wenn a = − m
ist, und schließlich f (0) = (0, 0, 1, 0, 0, 0, . . .).
n
Man kann also die rationalen Zahlen nacheinander aufschreiben und erreicht dabei jede, wenn
man nur lange genug schreibt. Im nächsten Abschnitt will ich einen etwas anderen Beweis
angeben, der möglicher Weise etwas anschaulicher ist.
AUFGABEN
1. Seien
f
g
M →N →P
Abbildungen.
a) Zeige: Ist g ◦f injektiv, so ist f injektiv.
b) Zeige: Ist g ◦f surjektiv, so ist g surjektiv.
c) Gib ein Beispiel, wo g ◦f bijektiv, aber weder f surjektiv, noch g injektiv ist. Gib auch ein
solches Beispiel, wo zusätzlich M = N = P = N ist.
2. Sei f : M → N eine Abbildung. Zeige:
a) Ist f surjektiv, so gibt es eine Abbildung g : N → M mit f ◦g = idN . Jedes solche g ist
injektiv. Aber es ist g ◦f 6= idM , wenn f nicht auch injektiv ist.
Hierzu wird allerdings das sogenannte Auswahlaxiom benutzt (dessen Gültigkeit wir annehmen): Ist {Mi | i ∈ I} eine Menge von nichtleeren Mengen – mit einer sogenannten Indexmenge
114
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
S
I – so gibt es eine Abbildung ϕ : I → i∈I Mi mit ϕ(i) ∈ Mi . D.h. man kann ‘mit einem Schlag’
aus allen Mengen Mi je ein Element ϕ(i) auswählen.
b) Ist f injektiv und M 6= ∅, so gibt es eine Abbildung g : N → M mit g ◦f = idM . Aber es ist
f ◦g 6= idN , wenn f nicht auch surjektiv ist.
3. Definiere analog zu den Nullfolgen natürlicher Zahlen auch Nullfolgen ganzer Zahlen, und zeige,
wie man auf naheliegende Weise die Menge der Nullfolgen ganzer Zahlen bijektiv auf die Menge
Q∗ der von 0 verschiedenen rationalen Zahlen abbilden kann.
4. Seien M, N endliche Mengen von m, bzw. n Elementen.
a) Wieviele Abbildungen von M nach N gibt es?
b) Wieviele injektive Abbildungen von M nach N gibt es?
c) Wieviele bijektive Abbildungen gibt es.
d) Viel schwerer als b) ist die Frage zu beantworten, wieviele surjektive Abbildungen von
M nach N es gibt. Aber Du darfst Dich an ihr versuchen. Du kannst dabei das Prinzip der
Inklusion-Exklusion benutzen.
4.3
Stetige Funktionen
4.3.1 Funktionen sind nichts anderes als Abbildungen, wobei man den Begriff ‘Funktion’ traditioneller Weise in der Regel für Abbildungen gebraucht, deren Zielmenge ein Körper, meist
der Körper der reellen oder derjenige der komplexen Zahlen, ist.
Auch wenn die formale Definition einer Funktion als Abbildung gewissermaßen statisch ist,
so wird eine solche in der Analysis (d.h. dem Gebiet der Mathematik, dem die Differenzialund Integralrechnungin angehört) in dynamischer Weise betrachtet: Die Variable x variiert,
wächst z.B., und damit variiert die von x abhängige Funktion f (x). Von dieser dynamischen
Auffassung ausgehend, versteht man am besten, warum man überhaupt die Ableitung einer
Funktion betrachtet. Denn diese misst ja, wie stark f (x) im Verhältnis zu x nahe bei einem
Punkt variiert.
Der Graph einer Funktion f : D → R, wo D ⊂ R ein Definitionsbereich ist, ist ja eine
Teilmenge von D×R, nämlich die Menge aller Paare (x, f (x)), wo x die Menge D durchläuft. Da
der Graph somit eine Teilmenge der ‘Ebene’ R2 ist, kann man versuchen, ihn zu zeichnen. Eine
solche Zeichnung gibt häufig ein gutes Bild einer Funktion, wobei man einschränkend bemerken
muss, dass erstens die Dicke des Bleistiftstriches die Präzision dieses Bildes beeinträchtigt,
zweitens man immer nur einen beschränkten Teil des Graphen zeichnen kann.
Beispiele 4.3.2 a) Wir betrachten folgende Funktion f (x) = x3 − 5x2 + 6x + 1, d.h. die
Abbildung f : R → R, definiert durch f (x) = x3 − 5x2 + 6x + 1. Funktionen dieser Art hast Du
sicher auf der Schule kennengelernt. Ihr Graph, genauer ein Teil ihres Graphen, sieht so aus:
4.3. STETIGE FUNKTIONEN
115
4
3
2
1
1
2
3
4
b) Eine Funktion mit dem Graphen
1
2
–3
–2
–1
0
1
2
ist Dir vielleicht weniger vertraut. Wir wollen sie ‘zak’ nennen, wobei man sie wie folgt definieren
kann:
zak(x) ist der Abstand von x zur nächstgelegenen
ganzen Zahl (oder zu den nächstgelegenen
beiden ganzen Zahlen), also gleich Min{|x − n| n ∈ Z}. (Es kann sein, dass es zwei nächstgelegene ganze Zahlen gibt, z.B. falls x = 1/2 ist. Dann sind aber die beiden Abstände zu diesen
ganzen Zahlen gleich.)
c) Kaum wirst Du in der Schule jene seltsame Funktion kennengelernt haben, die bei jeder
rationalen Zahl den Wert 1 und bei jeder irrationalen Zahl den Wert 0 annimmt. Diese Funktion
ist nirgendwo stetig, und ihren Graphem kann man auch nicht wirklich zeichnen.
Bemerkung 4.3.3 Es gibt viele interessante Funktionen, die im Gegensatz zu den oben angegebenen Funktionen, nicht für alle x ∈ R definiert sind, z.B. die Funktion f (x) = 1/x oder der
Tangens. Die Definitionsbereiche der letztgenannten Funktionen sind Vereinigungen von Intervallen. Wenn wir eine Funktion in der Nähe eines Punktes betrachten, etwa in einem Punkt
differenzieren wollen, reicht es, diese Funktion, eingeschränkt auf ein Intervall zu betrachten.
4.3.4 Wir wollen hier stetige Funktionen betrachten. Die beiden Beispiele unter a) und unter
b) sind stetig. Beachte dass der Graph einer stetigen Funktion durchaus ‘Ecken’ haben darf.
Auch die Funktion f (x) = 1/x ist überall dort stetig, wo sie definiert ist. Allerdings würde
jeder Versuch, sie auch in 0 (als Funktion nach R) zu definieren zu einer Unstetigkeit in diesem
Punkt führen. Anschaulich wird die Stetigkeit einer Funktion, die auf einem Intervall definiert
ist, häufig dadurch beschrieben, dass man ihren Graphen, ohne abzusetzen, zeichnen kann.
116
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Definition 4.3.5 a) Sei I ein Intervall. Eine Funktion f : I → R heißt stetig in dem Punkt
a ∈ I, wenn für jede Folge (xn ) in I mit limn→∞ xn = a gilt, dass auch die Folge (f (xn )) der
Funktionswerte in den xn gegen f (a) konvergiert.
(Hierzu mache ich eine spitzfindige Bemerkung: Es genügt, zu fordern, dass unter o.a. Voraussetzung die Folge (f (xn )) überhaupt konvergiert. Denn die Folge (x0 , a, x1 , a, x2 , a, . . .) konvergiert
natürlich auch gegen a. Wenn die Bildfolge (f (x0 ), f (a), f (x1 ), f (a), f (x2 ), f (a), . . .) überhaupt
konvergiert, kann aber ihr Limes nur gleich f (a) sein. Dann ist aber auch der Limes der Folge
(f (xn )) gleich f (a).)
b) f heißt stetig auf ganz I, wenn f stetig in jedem a ∈ I ist.
Für f : I → R, a ∈ I gilt: f ist genau dann stetig in a, wenn zu jedem ε > 0 ein δ > 0 existiert,
derart dass aus x ∈ I, |x − a| < δ die Aussage |f (x) − f (a)| < ε folgt.
4.3.6 Der so genannte Zwischenwertsatz besagt: Sei f : [a, b] → R eine stetige Funktion, so
nimmt f in dem Intervall [a, b] jeden reellen Wert zwischen f (a) und f (b) an. (Damit ist nicht
ausgeschlossen, dass möglicherweise auch noch weitere Werte angenommen werden. Betrachte
etwa f (x) = x2 zwischen −1 und +2 .)
Diesen Satz wollen wir ohne Beweis als richtig ansehen. Damit er gilt, muss man allerdings die
reellen Zahlen richtig definieren! Du weißt ja bereits folgendes: Die Funktion f (x) = x2 nimmt
auf der Menge der rationalen Zahlen zwar die Werte 1 und 4 an, aber nicht den Wert 2.
Definitionen 4.3.7 a) Eine Funktion f : I → R heißt streng monoton wachsend (bzw.
fallend), wenn aus x, x0 ∈ I, x < x0 die Beziehung f (x) < f (x0 ) (bzw. f (x) > f (x0 ) folgt. Sie
heißt streng monoton, wenn sie streng monoton wachsend oder streng monoton fallend ist.
b) Eine Funktion f : I → R heißt (schwach) monoton wachsend (bzw. fallend), wenn aus
x, x0 ∈ I, x < x0 die Beziehung f (x) ≤ f (x0 ) (bzw. f (x)gef (x0 ) folgt. Analog zu a) ist definiert,
wann f (schwach) monoton ist.
Eine streng monotone Funktion ist sicher injektiv.
Folgerung 4.3.8 Sei f : [a, b] → R stetig und streng monoton wachsend (bzw. fallend), ferner
f (a) = c, f (b) = d, dann ist [c, d] (bzw. [d, c]) gleich dem Bild f ([a, b]). Das heißt, f ist als
Abbildung [a, b] → [c, d] (bzw. [a, b] → [d, c]) bijektiv.
Beweis: Wir beschränken uns auf den Fall, dass f streng monoton wachsend ist. Der ander
Fall wird analog erledigt. Ist a ≤ x ≤ b, so folgt c = f (a) ≤ f (x) ≤ f (b) = d. Somit gilt
f ([a, b]) ⊂ [c, d]. Ist nun y ∈ [c, d], so wird der Wert y nach dem Zwischenwertsatz angenommen.
Insgesamt siehst Du, dass f [a, b] = [c, d] ist.
Da f als streng monotone Funktion zusätzlich injektiv ist, ist f als Abbildung [a, b] → [c, d]
bijektiv.
4.4. WURZELN
117
4.3.9 Unter den obigen Voraussetzungen ist auch die Umkehrabbildung f −1 : [c, d] → [a, b]
(bzw. f −1 : [d, c] → [a, b]) stetig. Das ist allerdings nicht so unmittelbar zu zeigen.
In dieser Hinsicht musst Du aber vorsichtig sein, wenn der Definitionsbereich von f kein Intervall
ist. Betrachte z.B. die Abbildung
x
für x < 1
f : [0, 1[ ∪ [2, 3] → [0, 2], mit f (x) :=
x − 1 für x ≥ 2
Sie ist bijektiv und streng monoton wachsend. Aber die Umkehrabbildung ist nicht stetig!
4.4
Wurzeln
4.4.1 Betrachte für reelle x ≥ 0 die n-te Potenz xn auf dem Definitionsbereich (der Startmenge)
R+ . Sie wächst dort streng monoton von 0 bis ∞.
Sei n ≥ 2 ganz. Wir wissen, dass es keine rationale Zahl r mit rn = 2 gibt. Ein Gewinn der
Einführung der reellen Zahlen liegt nun darin, dass es sehr wohl eine, √
und auch nur eine, reelle
n
Zahl r >√0 mit dieser Eigenschaft gibt. Diese bezeichnet man mit 2. (Ist n gerade, so ist
auch (− n 2)n = 2.) Allgemeiner gilt: Zu jeder nichtnegativen reellen Zahl y gibt es genau eine
√
nichtnegative reelle Zahl x mit xn = y. Dieses x wird mit n y bezeichnet und die n-te Wurzel
aus y genannt. (Eine reelle Zahl heißt nicht negativ, wenn sie positiv oder gleich 0 ist.)
√
√
4.4.2 Die Wurzel a ist also eine Lösung der Gleichung x2 =√ a, wenn a ≥ 0 ist. − a ist
eine weitere Lösung dieser Gleichung, die nur im Fall a =√0 mit √a übereinstimmt. Noch mehr
Lösungen kann es nicht geben. Denn es ist x2 − a = (x − a)(x + a) und jedes Produkt reeller
Zahlen ist nur dann 0, wenn einer der Faktoren es ist.
Mit Hilfe von Quadratwurzeln kann man auch allgemeine quadratische Gleichungen lösen,
wie Du sicher weißt. Ich habe mir sagen lassen, die Gleichung
r
p
p2
x2 + px + q = 0 habe die Lösungen − ±
−q
2
4
2
falls p4 − q ≥ 0 ist. (Andernfalls hat sie keine Lösung in R.) Eigentlich kann ich mir nicht
vorstellen, dass Du damit zufrieden bist, diese Formel zu kennen, ohne zu wissen, wie man sie
beweist. Versuche Dich zu erinnern, denke an die quadratische Ergänzung.
AUFGABEN
1. Zeige: a) Seien a, b positive reelle Zahlen. Dann ist
√
ab < a+b
.
2
√
ab ≤
a+b
.
2
Wenn a 6= b ist, gilt sogar
b) Für jedes a in einem angeordneten Körper gilt a2 ≥ 0. In R ist demgemäß a ≥ 0 genau dann,
wenn es ein b ∈ R mit b2 = a gibt.
118
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
c) In Q gilt die zweite Ausage von b) nicht.
PnHier2 gilt nur die schwächere Aussage: a ≥ 0 ⇐⇒
es gibt ein n ∈ N und a1 , . . . , an ∈ Q mit k=1 ak = b. (Beachte dazu: Jede rationale Zahl lässt
sich als Bruch schreiben, dessen Nenner eine (ganze) Quadratzahl ist.)
Bemerkung: Nicht so einfach ist folgender Satz von [Euler, Lagrange] zu beweisen: Jede
nichtnegative rationale Zahl ist die Summe von 4 Quadraten rationaler Zahlen (und umgekehrt).
Euler hat diesen Satz bewiesen. Später hat Lagrange sogar gezeigt, dass jede natürliche
Zahl eine Summe vierer ganzer Quadratzahlen ist. Überlege, dass Eulers Satz aus dem von
Lagrange folgt.
2an bn
2. In R gelte 0 < a < b. Definiere Folgen (an ), (bn ) durch a0 = a, b0 = b und an+1 =
, bn+1 =
a+b
√
an + b n
. Zeige limn→∞ an = limn→∞ bn = ab.
2
Solltest Du nicht darauf vertrauen, dass es Quadratwurzeln aus positiven reellen Zahlen wirklich
gibt, darfst Du deren Existenz mit Hilfe dieser Aufgabe beweisen!
3. Hinweis, wie man manche Aufgaben nicht angehen sollte:
a) Betrachte die Frage: Was ist der größte Primfaktor der Zahl 86400? Kannst Du diese Frage
schneller beantworten, wenn Du weißt, dass diese Zahl die Anzahl der Sekunden eines Tages
ist?
Wenn man den größten Primfaktor oder auch die Primfaktorzerlegung von 60 · 60 · 24 = 86400
finden will, so ist es einfacher von der Zerlegung 60 · 60 · 24 auszugehen, als erst das Produkt
86400 auszurechnen und dieses dann zu zerlegen! Das ist doch klar!
b) Welche reellen Nullstellen hat das Polynom x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5)?
x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5) = x6 (x2 − 25) − (42x3 − 216)(x − 5)(x + 5) = x6 (x −
5)(x + 5) − (42x3 − 216)(x − 5)(x + 5) = (x6 − 42x3 + 216)(x − 5)(x + 5).
Die Nullstellen des Polynoms sind also 5, − 5, sowie die des Polynoms x6 − 42x3 + 216. Die
Nullstellen des letzteren sind die x ∈ R, für die y = x3 eine Nullstelle des quadratischen
Polynoms
y 2 − 42y + 216 ist. Dessen Nullstellen errechnen sich nach der bekannten Formel zu
√
225 also
21 ± √
√ 36 und 6. Sämtliche reellen Nullstellen des ursprünglichen Polynoms sind somit
5, −5, 3 36, 3 6.
Wenn eine (natürliche) Zahl oder eine Funktion als Produkt gegeben ist, ist es dann immer
zielführend, dieses Produkt zunächst (reflexartig) ‘auszurechnen’, um erst dann gewisse Aufgaben
anzugehen?
√
4. Zeige dass die Menge {a + b 2 | a, b ∈ Q} ein Teilkörper von R ist. Damit ist gemeint, dass sie
in Bezug auf die in R gegebenen Rechenarten ein Körper ist. Du musst also zeigen, dass 0 und 1
in ihr liegen, dass mit zweien ihrer Elemente auch ihre Summe und ihr Produkt zu ihr gehören.
Schließlich müssen noch zu jedem ihrer Elemente 6= 0 das additiv und das multiplikativ Inverse
zu ihr gehören. (Nur für das multiplikativ Inverse ist eine kleine Idee nötig.) Die Körpergesetze
(etwa das Distributivgesetz) werden von R ‘geerbt’.
4.5. CAUCHY- UND CANTOR-DIAGONALEN
4.5
119
Cauchy- und Cantor-Diagonalen
4.5.1 Unter der Menge N × N versteht man ja die Menge aller Paare (n, m) natürlicher Zahlen.
Während man sich N als fortlaufende Folge vorstellen kann:
0 1 2 3 4 5
...
kann man sich die Gesamtheit der Paare natürlicher Zahlen als
Schema vorstellen:
(0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5)
(1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5)
(2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5)
(3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5)
(4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5)
(5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5)
..
..
..
..
..
..
.
.
.
.
.
.
unendliches ‘quadratisches’
···
···
···
···
···
···
..
.
Frage: Kann man die Elemente von N × N auch in einer Folge darstellen? Kann man sie
nacheinander ‘hinschreiben’, und zwar so, dass jedes Paar auch ‘irgendwann mal drankommt’ ?
In der Sprache der Abbildungen würde dies bedeuten: Gibt es eine bijektive Abbildung N →
N × N?
Im Prinzip haben wir das bereits positiv beantwortet. Hier gebe ich eine andere Möglichkeit
an, die im folgenden Bild angedeutet sei
(0, 0)
(0, 1)
%
(1, 0)
(0, 2)
%
(1, 1)
%
(2, 0)
(3, 0)
%
(3, 1)
%
%
(3, 3)
%
(3, 4)
%
(4, 3)
%
%
(2, 4)
%
%
(4, 2)
%
%
(1, 4)
(2, 3)
(3, 2)
(4, 1)
%
%
%
%
(0, 4)
(1, 3)
(2, 2)
%
%
(4, 0)
%
(1, 2)
(2, 1)
%
(0, 3)
%
(4, 4)
%
%
(5, 0)
(5, 1)
(5, 2)
(5, 3)
(5, 4)
..
..
..
..
..
.
%
.
%
.
%
.
%
.
%
(0, 5) · · ·
%
(1, 5) · · ·
%
(2, 5) · · ·
%
(3, 5) · · ·
%
(4, 5) · · ·
%
(5, 5) · · ·
...
Die Pfeile deuten an, wie man nacheinander die Paare zu durchlaufen hat.
Man beginnt mit (0, 0), dann durchläuft man die erste sogenannte Cauchy-Diagonale:
(1, 0), (0, 1), dann die zweite Cauchy-Diagonale: (2, 0), (1, 1), (0, 2), dann die dritte CauchyDiagonale (3, 0), (2, 1), (1, 2), (03), dann die vierte: (4, 0), (3, 1), (2, 2), (1, 3), (0, 4), und so fort.
Auf diese Weise erkennst Du, dass die Menge aller Paare natürlicher Zahlen abzählbar ist.
In der n-ten Cauchy-Diagonale stehen die n + 1 Paare natürlicher Zahlen (i, j) mit i + j = n.
Vergleiche das mit den Exponentenpaaren in der Formel, die gemäß dem Binomialsatz aus
(a + b)n berechnet wird.
120
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
4.5.2 Der Name ‘Cauchy-Diagonale’ rührt daher, dass Cauchy sie benutzt hat, um das sogenannte Cauchy-Produkt von unendlichen Reihen zu definieren.
P
P∞
Gegeben seien zwei unendliche Reihen ∞
n=0 an und
n=0 bn . Sämtliche Produkte von je einem
Glied der ersten Reihe mit je einem Glied der zweiten kann man in ein unendliches ‘quadratisches’ Schema schreiben.
a0 b0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5 · · ·
a1 b 5 · · ·
a2 b 5 · · ·
a3 b 5 · · ·
a4 b 5 · · ·
a5 b 5 · · ·
..
..
.
.
Irgendwie sollte eine geeignete Summierung über alle Einträge dieses Schemas gegen das Produkt der Werte der beiden Ausgangsreihen konvergieren.
Das Cauchy-Produkt der beiden Reihen ist definiert, als
∞ X
n
X
(
ak bn−k )
n=0 k=0
D.h. es ist eine unendliche Reihe, deren Glieder
Pndie Summen über die Cauchy-Diagonalen obigen
Diagramms sind. Beachte, dass die Summe k=0 ak bn−k für jedes n eine endliche ist, nämlich
die Summe über die n-te Cauchy-Diagonale, in der n + 1 Einträge stehen.
Wenn die beiden Ausgangsreihen konvergieren, und zwar gegen a, bzw. b, so hofft man doch,
ihr Cauchy-Produkt solle gegen ab konvergieren. Ganz allgemein, d.h. für konvergente,
aber
P∞
a
oder
nicht
absolut
konvergente
Reihen
gilt
das
leider
nicht
!
Falls
aber
eine
der
Reihen
n=0 n
P∞
b
absolut
konvergiert,
gilt
diese
Aussage.
Leider
ist
der
Beweis
dieser
Tatsache
nicht so
n=0 n
einfach, weshalb ich hier darauf verzichte.
Bemerkung 4.5.3 Gibt es eine Reihenfolge, in der man die ai bj summieren kann, so dass
immer der Grenzwert ab herauskommt?
P
Pn
Erinnere dich an den Satz 3.2.27. Da der (Grenz-)Wert der Reihe ∞
i=0 ai als limn→∞
i=0 ai
definiert ist, erhält man aus dem genannten Satz die Formel
n
n
X
X
ab = lim (
ai )(
bj )
n→∞
i=0
j=0
P
P
Das Produkt ( ni=0 ai )( nj=0 bj ) ist aber die Summe über alle Einträge folgenden endlichen
4.5. CAUCHY- UND CANTOR-DIAGONALEN
121
quadratischen Schemas:
a0 b 0
a1 b 0
a2 b 0
a3 b 0
a4 b 0
a5 b 0
..
.
a0 b 1
a1 b 1
a2 b 1
a3 b 1
a4 b 1
a5 b 1
..
.
a0 b 2
a1 b 2
a2 b 2
a3 b 2
a4 b 2
a5 b 2
..
.
a0 b 3
a1 b 3
a2 b 3
a3 b 3
a4 b 3
a5 b 3
..
.
a0 b 4
a1 b 4
a2 b 4
a3 b 4
a4 b 4
a5 b 4
..
.
a0 b 5
a1 b 5
a2 b 5
a3 b 5
a4 b 5
a5 b 5
..
.
···
···
···
···
···
···
..
.
a0 b n
a1 b n
a2 b n
a3 b n
a4 b n
a5 b n
..
.
an b 0 an b 1 an b 2 an b 3 an b 4 an b 5 · · · an b n
Beim Schritt von n auf n + 1, kommen immer die 2n + 3 Summanden entlang eines ‘Hakens’
der Form
a0 bn+1
a1 bn+1
a2 bn+1
a3 bn+1
a4 bn+1
a5 bn+1
..
.
an+1 b0 an+1 b1 an+1 b2 an+1 b3 an+1 b4 an+1 b5 · · · an+1 bn+1
hinzu. Wenn man entlang der angegebenen Haken und nicht entlang der Cauchy-Diagonalen
addiert, erhält man immer das richtige Ergebnis.
Wir haben also folgende Verfahren, die Einzelprodukte zu summieren:
1. Entlang der Cauchy-Diagonalen: Das ist elegant, führt aber nicht immer zum richtigen Ergebnis.
2. Entlang der oben beschriebenen Haken: Das führt zwar immer zum richtigen Ergebnis, ist
aber holprig.
Im Falle, dass die Ausgangsreihen absolut konvergieren, wirst Du wohl das elegantere CauchyProdukt bilden.
(Übrigens kann man N × N natürlich auch entlang der ‘Haken’ anstelle der Cauchy-Diagonalen
abzählen!)
Beispiel 4.5.4 Seien x, y reelle Zahlen. Die unendlichen Reihen
exp(x) :=
∞
X
xn
k=0
n!
,
exp(y) :=
∞
X
yn
k=0
n!
konvergieren absolut für alle reellen x, y. Mit Hilfe des binomischen Lehrsatzes kannst Du zeigen,
dass das Cauchy-Produkt der Reihen exp(x), exp(y) mit der Reihe
∞
X
(x + y)n
k=0
n!
122
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
übereinstimmt. (Führe das aus!) Mit anderen Worten: Es gilt das Additionstheorem
exp(x + y) = exp(x) exp(y)
Beachte, dass ich zwei große Lücken gelassen haben: Die absolute Konvergenz der Exponentialreihe und der oben angegebene Satz über die ’richtige’ Konvergenz des Cauchy-Produktes
absolut konvergenter Reihen wären noch zu zeigen!
Im nächsten Kapitel werde ich das Additionstheorem beweisen.
4.5.5 Die nichtnegativen rationalen Zahlen sind ja formal gesehen nichts anderes als Paare
natürlicher Zahlen, wobei man viele Paare weglassen kann: Der Nenner darf ja nicht 0 sein,
und es genügt die gekürzten Brüche zu betrachten. Wir bekommen das folgende unendliche
quadratische Schema:
0 1 2 3 ···
1
3
5
7
···
2
2
2
2
1
2
4
5
···
3
3
3
3
1
3
5
7
···
4
4
4
4
.. .. .. .. . .
.
. . . .
In der n-ten Zeile stehen die gekürzten Brüche mit dem Nenner n, aufsteigender Größe nach
geordnet. Indem man dieses Schema entlang der Cauchy-Diagonalen abzählt, bekommt man
eine bijektive Abbildung N → Q+ .
Indem Du nach jeder Zeile des obigen Schemas noch eine neue Zeile hinzufügst, in der die Glieder
mit einem Minus-Zeichen versehen sind, kannst Du einsehen, dass auch ganz Q abzählbar ist.
Wir halten fest:
Satz 4.5.6 Die Menge Q der rationalen Zahlen ist abzählbar.
Indem Du schließlich noch bemerkst, dass es gar nichts ausmacht, ob in einem Schema, ähnlich
dem, womit wir unseren Abschnitt begonnen haben, etliche Zeilen oder Spalten nach endlich
vielen Einträgen aufhören, kannst Du die Gültigkeit des folgenden Satzes einsehen.
Satz 4.5.7 Die Vereinigung abzählbar vieler abzählbarer Mengen ist abzählbar.
(Dies schließt natürlich endliche Vereinigungen abzählbarer Mengen, sowie abzählbare Vereinigungen endlicher Mengen ein.) Folgende Sätze sind unmittelbare Folgerungen:
Satz 4.5.8 Sind M1 , M2 abzählbare Mengen, so ist auch M1 × M2 eine solche.
Satz 4.5.9 Sind M1 , M2 , . . . , Mn endlich viele abzählbare Mengen, so ist auch
M1 × M2 × · · · × Mn eine solche.
4.5. CAUCHY- UND CANTOR-DIAGONALEN
123
Vielleicht überrascht es Dich jetzt der folgende
Satz 4.5.10 Die Menge R der reellen Zahlen ist überabzählbar, d.h. nicht abzählbar.
Beweis: Wäre sie abzählbar, so wäre es auch ihre Teilmenge [0, 1[ der x mit 0 ≤ x < 1.
Wir nehmen an, es gäbe eine solche Abzählung f : N1 → [0, 1[. Denke Dir die x ∈ [0, 1[ als
Dezimalbrüche ‘abgezählt untereinander geschrieben’. Dann erhältst Du folgendes Schema:
f (1) = 0, a11 a12 a13 a14 . . .
f (2) = 0, a21 a22 a23 a24 . . .
f (3) = 0, a31 a32 a33 a34 . . .
f (4) = 0, a41 a42 a43 a44 . . .
············
Hier sind die Indizes Doppelindizes: also a23 bedeutet a2,3 , gesprochen ‘a zwei drei’ und nicht
‘a dreiundzwanzig’. (Es ist allgemein üblich, hier das Komma wegzulassen, wenn es nicht zu
Zweideutigkeiten führt.) In der n-ten Zeile steht die n-te Zahl als Dezimalzahl. D.h. die aij sind
Dezimalziffern, und zwar ist aij die j-te Nachkommastelle der i-ten Zahl.
9er-Perioden seien verboten, damit jede reelle Zahl aus [0, 1[ nur einmal vorkommt.
Nun sehen wir uns die Diagonale“ a11 , a22 , a33 , . . . in diesem Schema an und bilden den Dezi”
malbruch c = 0,b1 b2 b3 b4 . . . nach folgender Vorschrift: es sei bi = 5, wenn aii 6= 5 ist, aber bi = 6,
wenn aii = 5 ist. Dann gilt c ∈ [0, 1[, aber c ist verschieden von allen Zahlen des Schemas. Denn
c unterscheidet sich in der i-ten Nachkommastelle von f (i), ist aber eindeutig als Dezimalbruch
darstellbar, da die Ziffer 0 sowenig vorkommt wie die Ziffer 9. Eine Abzählung der o.a. reellen
Zahlen kann es also nicht geben.
Das hier verwendete Verfahren heißt Cantorsches Diagonalverfahren, da Cantor es erfunden hat, um die Überabzählbarkeit von R zu zeigen.
Ich will nicht verschweigen, dass es von philosophischer Seite gewisse Vorbehalte gegen unseren
unkritischen Umgang mit der Menge ‘aller’ reeller Zahlen gibt. Mit einem endlichen
Alphabet
√
kann man nur abzählbar viele reelle Zahlen beschreiben. (Z.B. kann man 5 alsP‘diejenige
positive reelle Zahl, deren Quadrat 5 ist’ beschreiben. Die Zahl e lässt sich als ‘ ∞
n=0 1/n!’
beschreiben.) Wenn ich also nach Cantor zu allen abzählbar vielen ‘beschreibbaren’ reellen
Zahlen eine neue konstruiere, so muss ich mir bewusst sein, dies auf einer ‘höheren’ Sprachstufe
zu tun, einer Stufe, auf der ich zur Konstruktion die Menge der bisher bereits bekannten reellen
Zahlen benutze. Sonst hätte ich ja einen Widerspruch: ‘Zu allen beschreibbaren reellen Zahlen
gibt es noch eine weitere beschreibbare reelle Zahl.’
Im Prinzip retten sich die Mathematiker hier in eine axiomatische Mengenlehre, deren Axiome
möglicherweise etwas willkürlich sind. Die meisten Mathematiker nehmen diese Problematik
kaum zur Kenntnis. So darfst Du es getrost auch halten. Ehrlich!
Mit dem Cantorschen Diagonalverfahren kannst Du folgende beide Sätze beweisen:
124
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Satz 4.5.11 Seien M1 , M2 , M3 , . . . unendlich viele Mengen, deren jede mindestens 2 Elemente
besitzt, so ist das unendliche Produkt M1 × M2 × M3 × · · ·, das aus allen Folgen (mi )i∈N mit
mi ∈ Mi besteht, überabzählbar.
Definition 4.5.12 Eine 0-1-Folge ist eine Folge (an )n∈N , wo jedes Folgenglied 0 oder 1 ist.
Dabei will ich meist unter 0 und 1 die bekannten ganzen Zahlen verstehen, gelegentlich aber
auch die Restklassen von 0 bzw. 1 in F2 = Z/(2).
Satz 4.5.13 Die Menge aller 0-1-Folgen ist überabzählbar.
Wir können aus unseren Betrachtungen noch einen weiteren Schluss ziehen, nämlich den, dass
es viele (genauer: überabzählbar viele) sogenannte transzendente reelle Zahlen gibt.
Definition 4.5.14 Eine reelle (auch komplexe) Zahl heißt algebraisch, wenn sie eine Nullstelle eines vom Nullpolynom verschiedenen Polynoms mit rationalen Koeffizienten ist. (Da die
Nullstellen eines Polynoms dieselben bleiben, wenn man dieses Polynom mit einer von 0 verschiedenen Konstanten multipliziert, genügt es, entweder Polynome mit ganzen Koeffizienten
zu betrachten, oder solche, deren höchster Koeffizient gleich 1 ist.)
Eine reelle (oder komplexe) Zahl heißt transzendent, wenn sie nicht algebraisch ist.
Satz 4.5.15 Es gibt nur abzählbar viele algebraische und überabzählbar viele transzendente reelle (komplexe) Zahlen.
Beweis: Es genügt zu zeigen, dass die Menge der (reellen) algebraischen Zahlen abzählbar
ist. Wäre dann nämlich auch die Menge der reellen transzendenten Zahlen abzählbar, so wäre
R die Vereinigung zweier abzählbarer Mengen, also selbst abzählbar.
Zeige selber, dass es zu jedem möglichen Grad n nur abzählbar viele Polynome vom Grad n
gibt, deren Koeffizienten rational sind. (Man kann ja jedem Element aus Qn+1 in bijektiver
Weise ein solches Polynom zuordnen.)
Folgere: Es gibt nur abzählbar viele Polynome mit rationalen (ganzen) Koeffizienten.
Mit Hilfe der Tatsache, dass (abgesehen vom Nullpolynom) jedes Polynom in R (auch in C)
nur endlich viele Nullstellen hat, folgere, dass es (in R, bzw. C) insgesamt nur abzählbar viele
Nullstellen von beliebigen Polynomen mit rationalen Koeffizienten gibt.
Bemerkung 4.5.16 Die Aussage ist insofern sehr theoretisch, als es äußerst mühsam und
wenig erhellend ist, mit ihrer Hilfe ein konkretes Beispiel einer transzendenten Zahl anzugeben.
(Man müsste eine konkrete Abzählung der algebraischen Zahlen angeben und für jedes n die n-te
Nachkommastelle der n-ten Zahl bestimmen. Das Cantorsche Diagonalverfahren liefert dann
eine transzendente Zahl als unendlichen Dezimalbruch. Beachte, dass dies im Prinzip möglich
ist!) Wir wissen heute, dass z.B. e und π transzendent sind. Beweise hierfür sind alles andere als
einfach.
Cantor kannte man nur die sogenannten Liouvilleschen Transzendenten,
P∞Vor−n!
z.B. n=1 2 . Auf diese will ich an dieser Stelle eingehen, obwohl sie mit Mengentheorie nicht
viel zu tun haben.
Ich beginne mit einem Hilfssatz:
4.5. CAUCHY- UND CANTOR-DIAGONALEN
125
Lemma 4.5.17 Sei g : R → R ein Polynom. Ist I ⊂ R ein Intervall endlicher Länge, so ist
die Menge g(I) beschränkt. D.h. es gibt ein s ∈ R mit |g(x)| ≤ s für alle x ∈ I.
Allgemeiner gilt dies, falls g auf R lediglich stetig ist. Das wirst Du auf der Uni lernen.
Beweis: Die Behauptung gilt offenbar für jede konstante Funktion und für die Funktion der
Form f (x) = x. Gilt sie für Funktionen f1 , f2 , so gilt sie auch für die Funktionen f1 f2 und
f1 + f2 . Denn aus |fi (x)| ≤ si für x ∈ I folgt |f1 (x)f2 (x)| = |f1 (x)| · |f2 (x) ≤ s1 s2 , sowie
|f1 (x) + f2 (x)| ≤ |f1 (x)| + |f2 (x)| ≤ s1 + s2 für alle x ∈ I.
Jedes Polynom lässt sich durch Summen und Produkte von konstanten Funktionen und der
Funktion f (x) = x aufbauen.
Satz 4.5.18 Sei α eine reelle Nullstelle eines Polynoms vom Grade n > 0 mit rationalen
Koeffizienten. Dann gibt es ein reelles c > 0, so dass für jede von α verschiedene rationale Zahl
p
mit p, q ∈ Z, q > 0 folgende Ungleichung gilt:
q
α − p ≥ c .
q qn
(Hier sind p, q keine Bezeichnungen speziell für Primzahlen, sondern für beliebige ganze Zahlen.) Der Satz besagt in etwa folgendes: Will man eine algebraische Zahl durch rationale Zahlen
approximieren, so wird die Güte der Approximation mit wachsendem Nenner nur in ‘bescheidenem Maße’ besser. Er gilt auch für Polynome vom Grad 1 und besagt dann, dass man eine
rationale Zahl α durch von α verschiedene rationale Zahlen gar nicht so gut approximieren
kann.
Beweis: Sei α Nullstelle von f (x) = an xn + · · · + a0 mit ak ∈ Z. (Dies kann man annehmen,
nachdem man mit dem Hauptnenner der Koeffizienten multipliziert hat.) Wir wissen aus (2.5.2),
dass man f (x) = (x − α)g(x) schreiben kann, wo g(x) ein Polynom mit reellen Koeffizienten
ist.
Wähle c1 > 0 so, dass in dem Intervall I = [α − c1 , α + c1 ] keine von α verschiedene Nullstelle
von f (x) liegt. Dies ist möglich, da f (x) = 0 nur für endlich viele x gilt. (2.5.4) Nach obigem
Lemma gibt es ein c2 > 0 mit der Eigenschaft: ‘Es ist |g(x)| < c2 , wenn immer |x − α| ≤ c1 ist.’
1
p
c
p
Setze c := Min{c1 , } und nimm an, es wäre α − < n (mit p, q ∈ Z, q > 0 und 6= α.)
c2
q
q
q
p
Zunächst folgt aus dieser Annahme − α < c ≤ c1 und deshalb – nach Wahl von c2 –
q
p
g
≤ c2 . Aus c ≤ 1/c2 ergibt sich
q f p = p − α · g p < c · c2 ≤ 1 .
q q
q qn
qn
126
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
p < 1. Da f (x) ganze Koeffizienten hat, ist die linke Seite dieser UngleiSomit gilt q · f
q p
p
chung eine natürliche Zahl. Deshalb ist f
= 0. Das ist ein Widerspruch zu 6= α und
q
q
p
∈ I, einem Intervall, in dem außer α keine Nullstelle von f liegt.
q
n
P∞
Folgerung 4.5.19 Die Zahl α :=
k=0
2−k! ist transzendent.
Es ist klar, dass die Reihe konvergiert. Dies ist das angekündigte Beispiel einer Liouvilleschen
Transzendenten.
P
−k!
Beweis: Die Partialsumme sm := m
ist gleich einem Bruch mit dem Nenner 2m! ,
k=0 2
pm
etwa gleich m! mit einer natürlichen Zahl pm . (2m! ist der Hauptnenner.)
2
Die (positive) Differenz α − sm ist nur sehr wenig größer als 2−(m+1)! . Genauer gilt
α − sm = α −
m
X
−k!
2
=
k=0
∞
X
k!
−(m+1)!
2 <2
k=m+1
∞
X
2j =
j=0
2
2−(m+1)!
.
Nimm an, α wäre Nullstelle eines Polynoms vom Grade n mit rationalen Koeffizienten. Nach
obigem Satz gäbe es ein c > 0 mit
α−
pm
c
≥
für alle m ∈ N.
2m!
2n·m!
Andererseits haben wir
2
2(m+1)!
>α−
pm
2
c
, folglich (m+1)! > n·m!
m!
2
2
2
Es folgte
(2m! )m+1
2
<
m!
n
(2 )
c
Die linke Seite geht mit m (bei konstanten n, c) gegen unendlich. Widerspruch!
P∞ −n!
Der Beweis funktioniert für jede Reihe n=0 a
mit einer ganzen Zahl a ≥ 2, insbesondere
für a = 10, wo man sich die Dezimalbruchdarstellung gut vorstellen kann.
AUFGABEN
1. a) Betrachte die Menge A derjenigen 0-1-Folgen, welche die Eigenschaft haben, dass nie eine
Null auf eine Null folgt. Ist A abzählbar oder überabzählbar?
b) Betrachte die Menge B aller 0-1-Folgen mit der Eigenschaft, dass nie eine Eins auf eine Null
folgt. Ist B abzählbar oder überabzählbar?
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 127
2. Zeige, dasss es eine (naheliegende) bijektive Abbildung von der Menge E aller 0-1-Folgen zur
Potenzmenge von N, (d.h. der Menge aller Teilmengen von N) gibt.
Folgere, dass die Potenzmenge von N überabzählbar ist.
3. Zeige, dass die Menge aller endlichen Teilmengen von N abzählbar ist.
4. Zeige, dass die Menge aller Null-Eins-Folgen, die von einer gewissen Stelle an periodisch sind,
abzählbar ist. (Was meine ich wohl mit der Aussage ‘von einer gewissen Stelle an periodisch’ ?)
5. Wie hängen die beiden letzten Aufgaben zusammen? Genügt es, eine von ihnen zu lösen, damit
die Lösung der anderen auf der Hand liegt?
6. Es gibt eine Abbildung E → [0, 1], die jeder Folge aus E den entsprechenden Binärbruch
zuordnet, z.B. (0, 1, 1, 0, 1, 1, 1, 0, 0, . . .) 7→ 0, 011011100 . . .. Links trennen die Kommata die
einzelnen Folgenglieder, rechts trennt das Komma den ganzen Anteil der binär geschriebenen
Zahl von dem gebrochenen Anteil.
Ist diese Abbildung injektiv, surjektiv?
7. Wir betrachten Ternärbrüche (d.h. solche, wo die Grundzahl die 3 ist) der Form 0, a1 a2 a3 . . .,
wo die ai nur die Ziffern 0 oder 2 sind. Lassen sich 0, 31 , 23 , 1 durch einen solchen (unendlichen)
Ternärbruch darstellen? Wie steht es mit Zahlen aus ] 31 , 23 [? Und wie mit solchen aus ] 19 , 29 [, bzw.
solchen aus ] 97 , 89 [? Kannst Du das fortsetzen?
Die Menge C der reellen Zahlen, die man als Ternärbrüche der genannten Art schreiben kann,
heißt das Cantorsche Diskontinuum.
Beachte, dass die Darstellung der Zahlen aus dem Cantorschen Diskontinuum als
Ternärbrüche der genannten Art eindeutig ist!
Gib eine bijktive Abbildung C → E an. Welche Art Abbildung (injektiv, surjektiv) C → [0, 1]
erhält man daraus?
8. Zeige für das Cantorsche Diskontinuum C: Es gibt eine leicht zu beschreibende bijektive
Abbildung C × C → C. Aus jedem Paar von Folgen kann man auf kanonische Weise eine einzige
Folge machen.
9. Gib eine naheliegende surjektive Abbildung C → [0, 1] an.
4.6
Ein allgemeiner Satz über die Vergleichbarkeit von
Mengen
Es mag sein, dass Dir die folgenden Ausführungen nicht besonders gefallen, zu abstrakt oder zu
schwer vorkommen. Du kannst sie ohne Schaden übergehen. Vielleicht hast Du ja später mehr
Spaß an ihnen.
128
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Bemerkung 4.6.1 Seien M, N Mengen. Dann gibt es eine zu M gleichmächtige Menge M 0
und eine zu N gleichmächtige Menge N 0 , derart das M 0 ∩ N 0 = ∅ ist.
Man kann nämlich jedes Element m ∈ M durch das Paar (m, 0) ersetzen, also M 0 :=
{(m, 0) | m ∈ M } und entsprechend N 0 := {(n, 1) | n ∈ N } definieren.
Beachte, dass keiner garantieren kann, dass bereits M 0 ∩ N = ∅ ist. Hingegen sind (m, 0) und
(n, 1) auf jeden Fall verschiedene Paare, ganz egal wie m und n aussehen.
4.6.2 Unendliche Mengen M haben die Eigenschaft, dass es Abbildungen f : M → M gibt,
die zwar injektiv, aber nicht surjektiv sind. Dies kann man – so man will – als Definition für
die Unendlichkeit einer Menge nehmen. (Schon Galilei hatte bemerkt, dass die Abbildung
N → N, x 7→ x2 von dieser Art ist.)
Sei ferner eine bijektive Abbildung g : N → M gegeben, so ist die Abbildung f ◦g : N → M nur
injektiv, aber nicht surjektiv. Analog gibt es in diesem Fall auch eine injektive, nicht surjektive
Abbildung M → N , nämlich welche?
Wenn es also eine injektive, nicht surjektive Abbildung unendlicher Mengen ϕ : M → N gibt,
darfst Du dies nicht in dem Sinne interpretieren, als hätte M echt weniger Elemente als N .
Es gilt vielmehr folgender
Satz 4.6.3 (Cantor, Bernstein) Gibt es injektive Abbildungen g : M → N und
h : N → M , so gibt es auch eine bijektive Abbildung
f :M →N .
Beweis:
Wir dürfen nach Bemerkung 4.6.1 annehmen, M ∩ N = ∅.
Ist m ∈ M , so gibt es genau ein n ∈ N mit g(m) = n und höchstens ein n0 ∈ N mit h(n0 ) = m,
letzteres, da h injektiv ist. Das Analoge gilt für alle n ∈ N .
Wir betrachten ‘Stammlinien‘, d.h. ‘maximale Ketten’
· · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ n1 7→ · · ·
wobei die Abbildungen abwechselnd g, bzw. h sind. Die Eigenschaft ‘maximal’ soll bedeutet,
dass wir die Kette nur abbrechen, falls es nicht anders geht. Nach rechts bricht eine solche
Stammlinie nie ab, da jedes m ∈ M ein Bild unter g und jedes n ∈ N ein Bild unter h hat.
Auch nach links kann eine solche Stammlinie unendlich lang sein, sie kann aber auch mit einem
Element m ∈ M anfangen, wenn nämlich dieses m nicht im Bild von h liegt, oder sie kann mit
einem n ∈ N anfangen, wenn dieses n nicht im Bild von g liegt.
Jedes x ∈ M ∪ N liegt in einer Stammlinie. Wenn x in mehreren Stammlinien liegt, so stimmen
diese bis auf eine mögliche Indexverschiebung überein. In diesem Falle betrachten wir sie als
gleich! Jedes Element aus M ∪ N liegt dann in genau einer Stammlinie.
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 129
Hier eine Skizze der verschiedenen Arten von Stammlinien.
· · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ · · ·
m00 7→ n00 7→ m01 7→ n01 7→ m02 7→ · · ·
n000 7→ m001 7→ n001 7→ m002 7→ n002 7→ · · ·
(Ein x ∈ M ∪N kann in einer Stammlinie mehrfach vorkommen. Dann ist diese Stammlinie nach
beiden Seiten unendlich lang und das Vorkommen von x, sowie eines jeden anderen Elements
in dieser Stammlinie, periodisch.)
Jetzt definieren wir F : M → N wie folgt:
F (m) := g(m), wenn m in einer Stammlinie liegt, die entweder links keinen Anfang hat oder
links mit einem Element aus M anfängt.
Liegt aber m in einer Stammlinie, die links mit einem Element von N anfängt, so sei F (m) das
eindeutig bestimmte Urbild von m unter h (d.h. dasjenige n ∈ N , das h(n) = m erfüllt).
Innerhalb jeder Stammlinie bildet F die Menge der Elemente von M , die in dieser Stammlinie
liegen, bijektiv auf die Menge der Elemente von N in dieser Stammlinie ab.
Da jedes Element von M in einer und nur einer Stammlinie liegt, ist F eine Abbildung von M
nach N .
Da jedes Element von N in einer Stammlinie liegt, ist F surjektiv. Da aber jedes Element von
N nur in einer Stammlinie liegt ist F auch injektiv.
Folgerung 4.6.4 Je zwei beschränkte Intervalle sind gleichmächtig.
Beweis:
Seien a, b, c, d reelle Zahlen mit a < b und c < d. Sei I eines der Intervalle
[a, b], [a, b[, ]a, b], ]a, b[ und J eines der Intervalle [c, d], [c, d[, ]c, d], ]c, d[. Dann findet man leicht
eine Abbildung f : R → R der Form f (x) = px + q mit geeigneten p, q ∈ R, die I injektiv in J
abbilden. Etc.
Bemerkungen 4.6.5 Es gibt allerdings keine stetige bijektive Abbildung [0, 1] → [0, 1[, noch
eine solche [0, 1[→]0, 1[, noch eine solche [0, 1] →]0, 1[. Ebensowenig gibt es bijektive stetige
Abbildungen in jeweils umgekehrter Richtung. Ich verzichte auf einen Beweis, da wir den Begriff
der Stetigkeit zu wenig studiert haben.
Beachte, dass die Abbildungen tan : ] − π/2, π/2[→ R und tan : [0, π/2[→ R+ bijektiv und
stetig sind. Ihre Umkehrabbildungen sind ebenfalls stetig. Auch hier appelliere ich an Deine
Anschauung und verzichte auf einen strengen Beweis.
Frage: Welche ‘einfachere’ Funktion als der Tangens bildet das beschränkte Intervall ]0, 1]
bijektiv auf das unbeschränkte Intervall [1, ∞[ ab?
Antwort: x 7→ 1/x. Diese Funktion kehrt allerdings die Anordnung um.
Mit Hilfe der Folgerung sieht man auch, dass es eine bijektive Abbildung R∗+ → R gibt. Konkreter weiß man aber, dass der Logarithmus (zu einer beliebigen Basis 6= 1) eine stetige bijektive
Abbildung R∗+ → R ist, und dass eine Exponentialfunktion (zu einer beliebigen Basis 6= 1)s
eine stetige bijektive Abbildung in umgekehrter Richtung ist.
130
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Beispiele 4.6.6 a) Die Menge C0 aller 0-1-Folgen ist gleichmächtig zu R.
Beachte dabei, dass die Abbildung, die jeder 0-1-Folge (a0 , a1 , a2 , . . .) den Binärbruch
0, a0 a1 a2 . . . zuordnet nicht injektiv ist, da z.B. die Binärbrüche 0,01 und 0,1 dieselbe reelle
Zahl darstellen.
Also ordne etwa der 0-1-Folge (a0 , a1 , a2 , . . .) den Ternärbruch (oder, wenn es Dir lieber ist, den
Dezimalbruch oder . . . ) 0, a0 a1 a2 . . . zu. Diese Abbildung ist sicher injektiv.
Umgekehrt wird durch x 7→ 21 + π −1 arctan x eine bijektive Abbildung R →]0, 1[ definiert.
Schreibe dann jede Zahl aus ]0, 1[ als Binärbruch, wo z.B. solche, die auf lauter Einsen enden,
verboten sind. Ordne jedem Binärbruch, der dieser Einschränkung unterliegt, die Folge seiner
Nachkommastellen zu. Insgesamt erhältst Du eine injektive Abbildung R → C0 .
Der Satz von Cantor und Bernstein ergibt dann die Behauptung.
b) C0 und C02 := C0 × C0 sind gleichmächtig. Dasselbe gilt dann natürlich auch für R und R2 .
Denn die Abbildung
C0 → C02 , (an )n∈N 7→ ((a2n )n∈N , (a2n+1 )n∈N )
ist offensichtlich bijektiv.
Beachte: Da man reelle Zahlen nicht immer eindeutig als Dezimalbrüche (auch nicht als
Binäbrüche oder . . . ) darstellen kann, muss man für einen direkten Beweis der Gleichmächtigkeit etwa von [0, 1[ und [0, 1[×[0, 1[ eine gewisse Vorsicht walten lassen. Wenn man z.B. der
als Dezimalbruch geschriebenen rellen Zahl 0,1109 das Paar (0,1999 . . . , 0,100 . . .) zuordnete,
und das Entsprechende mit der Zahl 0, 120 machte, bekäme man dasselbe Paar reeller Zahlen
als Bild. Die Abbildung wäre nicht injektiv, da 0,1109 6= 0,120 ist.
Wie kann man sich da helfen, wenn man nicht den Cantor-Bernstein-‘Hammer’ verwenden will?
Nun, man verbiete zunächst (etwa) die Neunerperiode. Um ein Paar reeller Zahlen als Bild eines
Dezimalbruches (< 1) zu bekommen, verteilt man nicht die Dezimalstellen abwechselnd auf die
beiden Komponenten des Paares, sondern zerlegt zunächst die Folge der Nachkommastellen in
möglichst kurze Päckchen, deren Endziffer nicht die 9 ist, z.B.
0, 29987690999743915 . . . = 0, 2|998|7|6|90|9997|4|3|91|5| . . .
und verteilt nun diese ‘Päckchen’ abwechselnd auf zwei Dezimalbrüche. Als Bild obiger Zahl
erhält man das Paar
(0, 2 7 90 4 91 . . . , 0, 998 6 9997 3 5 . . .) .
Entsprechend bildet man die Umkehrabbildung. (Wieder einmal siehst Du, dass es oft mehrere
Beweise für ein und denselben Satz geben kann, deren jeder seine Verdienste haben kann.)
c) Du kannst nun leicht folgern, dass auch R und Rn für ganze n > 0 gleichmächtig sind.
d) Betrachte jetzt die Menge RN , womit ich das cartesische Produkt von abzählbar vielen
Faktoren R meine, also die Menge aller Folgen reeller Zahlen, die ich auch als Menge aller
Abbildungen N → R auffassen kann. Natürlich ist sie gleichmächtig zur Menge C0N . Könnte es
sein, dass auch diese Menge gleichmächtig zu R ist? Die Antwort ist: Ja.
4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 131
Dies zu beweisen, hilft uns das Cauchy’sche Diagonal-Verfahren. Denn eine Folge von Elementen
aus C0 ist ja nichts anderes als eine Doppelfolge:
a00
a10
a20
a30
a40
a50
..
.
a01
a11
a21
a31
a41
a51
..
.
a02
a12
a22
a32
a42
a52
..
.
a03
a13
a23
a33
a43
a53
..
.
a04
a14
a24
a34
a44
a54
..
.
a05 · · ·
a15 · · ·
a25 · · ·
a35 · · ·
a45 · · ·
a55 · · ·
.. . .
.
.
mit aij ∈ {0, 1}. Jede Zeile ist eine 0-1-Folge und die Folge der Zeilen eine Folge von Elementen
aus C0 . Durch das Cauchy’sche Diagonalverfahren macht man aus jedem solchen Schema (jeder
Doppelfolge) eine 0-1-Folge und erhält damit eine Abbildung C0N → C0 . Dass es eine Umkehrabbildung gibt, siehst Du sicher leicht ein: Mache aus der 0-1-Folge (bn )n∈N die Doppelfolge
(aij )ij∈N×N durch a00 := b0 , a10 := b1 , a01 := b2 , a20 := b3 , a11 := b4 , a02 := b5 , a30 := b6 , usw.
e) Umgekehrt ist die Menge NR , womit ich die Menge aller Abbildungen R → N meine,
nicht mehr zu R gleichmächtig, da nicht einmal die Menge {0, 1}R es ist. Denn letztere ist
gleichmächtig zur Menge aller Teilmengen von R. Wie?
f) Die Menge S aller stetigen Abbildungen f : R → R ist gleichmächtig zu R. Den jede solche
Abbildung ist schon durch ihre ‘Einschränkung’ auf Q festgelegt. Mit der Einschränkung von
f auf meine ich die Abbildung f|Q : Q → R, definiert durch f|Q (x) = f (x) für alle x ∈ Q, d.h.
im Grunde die Abbildung f selbst, allerdings nur für rationale Argumente betrachtet. Und RQ
ist sicher gleichmächtig zu RN . Es gibt also injektive Abbildungen S → R und R → S (nämlich
welche?).
Bemerkung 4.6.7 Eine scheinbar naheliegende Frage ist, ob es eine Teilmenge M von R
gibt, die zwar nicht abzählbar, aber auch nicht gleichmächtig zu R ist. Cantor selbst hat
sich mit diesem sogenannten Kontinuumproblem vergeblich herumgeschlagen. Gödel hat
gezeigt, dass man eine genügend reichhaltige ‘mathematische Welt’ konstruieren kann, in der
diese Frage negativ zu beantworten ist. D.h. in dieser Welt ist jede Teilmenge von R entweder
abzählbar oder zu R gleichmächtig.
Es liegt nahe, diese Frage zu untersuchen, nachdem man die Mengenlehre axiomatisiert hat. Das
genannte Gödelsche Ergebnis benutzt eine solche Axiomatisierung und fügt ihr sozusagen ein
weiteres ‘Axiom’ hinzu, das die Möglichkeit, Mengen zu konstituieren soweit einschränkt, dass
es eine solche seltsame Teilmenge von R nicht gibt. Aber dies Einschränkung ist so schwach,
dass kein Satz der Mathematik, der bis dato bewiesen war, seine Gültigkeit verloren hätte.
Jahrzehnte später hat Cohen gezeigt, dass die klassischen Axiomensysteme der Mengenlehre
(ohne die Gödelsche Einschränkung) das Kontinuumproblem nicht zu entscheiden vermögen.
Er konnte im Rahmen der klassischen Axiomatik der Mengenlehre die Existenz solcher mathematischer Welten erzwingen, in der es Teilmengen von R gibt, die weder abzählbar noch zu R
gleichmächtig sind.
132
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Es gibt heute Mengentheoretiker, die meinen, ‘vernünftige Axiome’ angeben zu können, die
es gestatten, das Kontinuumproblem zu lösen. Meiner Meinung nach gehören manche ihrer
Argumente dafür, dass man gewisse Axiome für ganz besonders einsichtig halten sollte, eher
der Theologie als der Mathematik an. (Delahaye in Spektrum der Wissenschaft März 2009)
Das bedeutet natürlich nicht, dass ich es für unseriös hielte, die Auswirkung ‘neuer’ Axiome
der Mengenlehre auf das Kontinuumproblem zu studieren.
Ich glaube, dass das Kontinuumproblem ein Scheinproblem ist, geboren aus der etwas schwammigen Definition von R, etwa als Menge ‘aller’ Cauchyfolgen modulo Nullfolgen. Bei dieser
Definition bleibt letztlich offen, welche sprachlichen Mittel zur Konstruktion von Cauchyfolgen
man verwenden darf. Wenn man einfach sagt: alle“, verstrickt man sich in Widersprüche.
”
Man kann genügend viel Mathematik machen, ohne das Kontinuumproblem gelöst zu haben.
Dasselbe gilt auch, wenn man die Gödelsche Einschränkung akzeptiert. Diese Einschränkung
braucht man nicht als Glaubenssatz anzunehmen. Man kann sie ganz einfach als Beschränkung
desjenigen Mathematischen Kosmos betrachten, den man (gerade) untersuchen will.
4.7
Äquivalenzrelationen und Äquivalenzklassen
Bereits in dem 2. Kapitel hast Du die Ringe Z/(m) kennengelernt, deren Elemente man als Teilmengen von Z auffassen kann. Diese Teilmengen sind eng verknüpft mit der Kongruenzrelation
modulo m.
Ähnlich ist es mit der Einführung der rationalen Zahlen. Diese sind – formal gesehen – Paare
m m0
ganzer Zahlen (m, n) mit n 6= 0. Zwei Brüche , 0 nennt man genau dann einander gleich,
n n
m
wenn mn0 = m0 n gilt. Man kann die rationale Zahl
auch als Menge aller Zahlenpaare
n
(m0 , n0 mit mn0 = m0 n auffassen. (Manchmal unterscheidet man zwischen einem Bruch m
n
0
0
als Zahlenpaar und der rationalen Zahl, die durch jeden Bruch m
gegeben
ist,
der
m
n
=
0
n
mn0 erfüllt. Ich muss gestehen, diese feinsinnige Unterscheidung am Anfang des Buches nicht
gemacht zu haben.)
Auch bei der Einführung der reellen Zahlen durch Cauchy-Folgen betrachtet man zunächst
den Ring R aller Cauchyfolgen und darin die Menge N aller Nullfolgen. Cauchyfolgen (an ), (bn )
heißen zueinander äquivalent, wenn ihre Differenz (an )n − (bn )n := (an − bn )n eine Nullfolge ist.
Man schreibt hierfür auch (an )n ≡ (bn )n (mod N ). Die reellen Zahlen enstehen dann, indem
man äquivalente Cauchyfolgen als gleich betrachtet.
Wir wollen dieses Prinzip später noch mehrfach verwenden. Deshalb soll es in diesem Abschnitt
ganz allgemein betrachtet werden.
4.7.1 Eine Relation ∼ auf einer Menge M kommt gewissen Paaren (a, b) von Elementen aus
M zu. Beispiele sind ≤, >, |, ≡ (mod m) auf Z. Formal kannst Du eine Relation als
Teilmenge von M × M auffassen: {(a, b) ∈ M × M | a ∼ b}.
4.7. ÄQUIVALENZRELATIONEN UND ÄQUIVALENZKLASSEN
133
Definition 4.7.2 Sei M eine Menge. Eine Äquivalenzrelation auf M ist eine Relation ∼
mit folgenden Eigenschaften:
a ∼ a für alle a (Reflexivität)
a ∼ b ⇒ b ∼ a (Symmetrie)
a ∼ b, b ∼ c ⇒ a ∼ c (Transitivität).
Beispiele 4.7.3 Beispiele sind die Gleichheit, sowie die Kongruenz modulo einem festgewählten m. Ist f : M → N eine Abbildung, so ist die Relation a ∼ b auf M , definiert durch
f (a) = f (b) ebenfalls eine Äquivalenzrelation. Die Relation ‘<’ zum Beispiel ist keine Äquivalenzrelation.
Definition 4.7.4 Sei ∼ eine Äquivalenzrelation auf einer Menge M . Eine Äquivalenzklasse
bezüglich ∼ ist eine nichtleere Teilmenge C von M , mit folgenden Eigenschaften:
(i) Für beliebige a, b ∈ C gilt a ∼ b.
(ii) Gilt c ∼ a für ein c ∈ M und ein a ∈ C, so ist auch c ∈ C.
Beispiel 4.7.5 Die Äquivalenzklassen bezüglich der Äquivalenzrelation ≡ (mod m) sind die
Restklassen r + Zm.
Seien nämlich a, b ∈ r + Zm, etwa a = r + a0 m, b = r + b0 m, so ist a − b = (a0 − b0 )m durch m
teilbar. D.h. a ≡ b (mod m).
Sei ferner c = r + c0 m ∈ r + Zm und a ∈ Z, sowie a ≡ c (mod m). So ist a − c = a − r − c0 m
ein Vielfaches von m, etwa gleich dm, so ist a = r + c0 m + dm = r + (c0 + d)m ∈ r + Zm.
Für das Beispiel a ∼ b ⇐⇒ f (a) = f (b) aus (4.7.3) sind die Äquivalenzklassen die Urbildmengen f −1 ({y}) aller y ∈ im(f ).
Bemerkungen 4.7.6 Sei im Folgenden ∼ eine Äquivalenzrelation auf einer Menge M .
a) Seien C, D Äquivalenzklassen mit C ∩ D 6= ∅. Dann ist C = D.
Denn sei b ∈ C ∩ D. Für a ∈ C gilt a ∼ b gemäß Eigenschaft (i) der Definition 4.7.4. Gemäß
(ii) folgt daraus a ∈ D. Somit gilt C ⊂ D. Und D ⊂ C folgt aus Symmetriegründen.
b) Jedes Element a ∈ M liegt genau in einer Äquivalenzklasse bezüglich ∼. Mit anderen
Worten: M ist die Vereinigung aller Äquivalenzklassen bezüglich ∼. Und zwei verschiedene
Äquivalenzklassen bezüglich ∼ sind disjunkt, d.h. ihr Durchschnitt ist leer.
Die letzte Aussage haben wir unter a) gezeigt.
Sei jetzt a ∈ M . Ich behaupte: Die Menge Ca := {x ∈ M | x ∼ a} ist eine Äquivalenzklasse.
Wegen der Reflexivität gilt a ∈ Ca .
Sind x, y ∈ Ca , d.h. x ∼ a, y ∼ a, so sieht man mit Hilfe der Symmetrie und Transitivität,
dass x ∼ y gilt.
x ∼ a, y ∼ a ⇒ x ∼ a, a ∼ y ⇒ x ∼ y
134
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Gilt nun x ∼ b für x ∈ M, b ∈ Ca , so folgt wegen b ∼ a aus der Tansitivität, dass x ∼ a, also
x ∈ Ca gilt.
c) Aus Obigem ergibt sich: Ca = Cb ⇐⇒ a ∼ b
Definition 4.7.7 Die Menge der Äquivalenzklassen in M bezüglich der Äquivalenzrelation ∼
wird auch mit M/ ∼ bezeichnet.
Bemerkung 4.7.8 Wir haben die naheliegende kanonische Abbildung κ : M → M/ ∼,
die jedem a ∈ M die Äquivalenzklasse Ca , d.h. diejenige Äquivalenzklasse, deren Element a
ist, zuordnet. Die Abbildung κ ist surjektiv. (Beachte, dass Äquivalenzklassen per definitionem
nicht leer sind.)
4.7.9 Du kannst die Menge M/ ∼ auch auf andere Weise verstehen: M/ ∼ ist die Menge M ,
allerdings mit einer anderen Gleichheit, nämlich der Relation ∼.
Zum praktischen Umgang mit M/ ∼ ist häufig folgende Definition nützlich.
Definition 4.7.10 Ein Repräsentantensystem bezüglich ∼ ist eine Menge, die aus jeder
Äquivalenzklasse bzgl. ∼ genau ein Element besitzt.
Beispiele 4.7.11 a) Sei m > 0 eine natürliche Zahl. Dann ist die (endliche) Menge
{0, 1, . . . , m − 1} ein Repräsentantensystem bezüglich der Kongruenz modulo m. Die gilt
natürlich auch für jede Menge von m aufeinander folgenden ganzen Zahlen, etwa der Menge
{−(m − 1)/2, . . . , −1, 0, 1, . . . , (m − 1)/2}
wenn m ungerade ist. Auch die Menge {2, 3, . . . , m + 1} ist ein Repräsentantensystem, welches
aber wohl von geringem Nutzen ist.
b) Ist M die Menge aller Paare (m, n) ganzer Zahlen mit n 6= 0 und die Relation ∼ definiert
durch
(m, n) ∼ (m0 , n0 ) : ⇐⇒ mn0 = m0 n
so bilden die teilerfremden Paare (m, n) mit n > 0 ein Repräsentantensystem.
c) Auf der Menge der Geraden in der sogenannten euklidischen Ebene ist die Relation ‘g
parallel zu h’ eine Äquivalenzrelation. Ein Repräsentantensystem der zugehörigen Äquivalenzklassen besteht aus den Geraden, die durch einen festgewählten Punkt gehen.
4.8. BEINAHE EINE PARADOXIE
4.8
135
Beinahe eine Paradoxie
4.8.1 Ein Text ist eine Zahl. Denn man kann ja jeden Buchstaben, jede Ziffer, jedes Satzzeichen, die Leerstelle zwischen Wörtern eingeschlossen, durch eine zweistellige Dezimalzahl codieren. Der ganze Text wird dann durch die Zahl beschrieben, deren Dezimaldarstellung durch
die Aneinanderreihung der den Buchstaben und anderen Zeichen entsprechenden zweistelligen
Codes entsteht.
Das gilt natürlich auch für mathematische Texte. Jeder der (wie ich) das Schreibsystem TEX
kennt, weiß, wie man Formeln durch eine (sozusagen eindimensionale) Abfolge von Zeichen darstellen kann, auch wenn sie – wie etwa Brüche, Potenzen, Binomialkoeffizienten oder Matrizen
– traditionell ‘zweidimensional’ geschrieben werden.
Natürlich kann man statt des Dezimalsystems das Binärsystem verwenden, wo man natürlich
für zur Codierung der Buchstaben mehr als 2 Stellen benötigt.
(Ich habe einst den Ausdruck Gödelisierung für dieses Verfahren gelesen.)
Umgekehrt entspricht allerdings nicht jeder natürlichen Zahl, die im Dezimalsystem gerade viele
Stellen hat, ein sinnvoller Text.
Aber zwei verschiedenen Texten entsprechen verschiedene Zahlen.
4.8.2 Wir betrachten Abbildungen N → X, sogenannte zahlentheoretische Funktionen, wo
X eine beliebige Menge ist. In den meisten Fällen ist X ein Körper etwa X = R. Wir betrachten
hier speziell den Fall X = N. Natürlich kann man jede solche zahlentheoretische Funktion auch
als Folge (f (0), f (1), f (2), . . .) = (f (n))n∈N auffassen – und umgekehrt. Du weißt bereits, dass
es überabzählbar viele solche Folgen gibt, wenn X aus mindestens 2 Elementen besteht, was
für X = N sicher der Fall ist.
Ein Beispiel einer solchen Funktion ist: f (n) sei per Definitionem der kleinste Primfaktor von
n2 + 2.
Die Werte dieser Funktion kann man im Prinzip berechnen, da man etwa durch Probieren für
jedes n den kleinsten Primfaktor von n2 + 2 aufzuspüren vermag – mag dies auch unheimlich
lange dauern. Es gibt eine ‘Methode’, ein ‘Rezept’, den Wert f (n) für jedes n zu bestimmen.
Dasselbe gilt für die Funktion f mit f (0) = 1 und f (n) = pn , wo pn für n ≥ 1 die n-te Primzahl
bezeichnet.
In beiden genannten Fällen kann man die Funktion zwar nicht durch eine Formel beschreiben,
aber eben doch konkret angeben, wie man zu jedem gegebenen n den Wert f (n) bestimmt.
Es wird uns in diesem Abschied gelingen, eine Funktion zu finden, deren Werte man so nicht
bestimmen kann.
Definition 4.8.3 Eine Funktion f : N → N heißt berechenbar, wenn es eine Methode gibt,
die es erlaubt, zu jedem n ∈ N den Wert f (n) zu bestimmen.
136
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Diese Definition erscheint Dir womöglich etwas vage. In der Tat gibt man sich in der Logik große
Mühe, sie zu präzisieren. Ich glaube allerdings, dass Du prinzipiell verstehen wirst, worum es
geht.
Satz 4.8.4 Die Menge der berechenbaren Funktionen N → N ist abzählbar. Es gibt also Funktionen N → N, die nicht berechenbar sind, sogar überabzählbar viele.
Beweis: Zu jeder berechenbaren Funktion gibt es ein Rezept zur Bestimmung der Funktionswerte. Dieses Rezept ist ein endlicher Text. Zu verschiedenen berechenbaren Funktionen
gehören natürlich verschiedene Rezepte. Nicht wahr? (Es mögen zwar zwei Kuchen, die nach
demselben Rezept gebacken sind, verschieden schmecken. Aber zwei Zahlen, die man nach
demselben Rezept bestimmt hat, sind sicher gleich.)
Nach dem Beginn dieses Abschnittes entspricht jedem Text eine natürliche Zahl. Die Menge
aller möglichen Texte, erst recht die Menge aller Rezepte zur Bestimmung der Funktionswerte
von Funktionen N → N ist also gleichmächtig zu einer Teilmenge von N und deshalb abzählbar.
4.8.5 Seien f0 , f1 , f2 , . . . die berechenbaren Funktionen. (Auch die fn sind Texte, die ich als
natürliche Zahlen auffassen kann.) Betrachte die Funktion ϕ : N → N, definiert durch ϕ(n) :=
fn (n) + 1. Dann gilt ϕ(n) 6= fn (n) für jedes n ∈ N. Dann muss aber ϕ 6= fn sein, weil beide
Funktionen verschiedene Werte bei n haben.
Die Funktion ϕ gehört also nicht zu den berechenbaren Funktionen f0 , f1 , f2 , . . .. Das scheint
paradox. Denn wenn man fn (n) berechnen kann, dann doch wohl auch fn (n) + 1.
Gibt es einen Widerspruch in der Mathematik???
Die Auflösung dieses scheinbaren Widerspruchs ist die Folgende:
Die Funktion ϕ, die jeder natürlichen Zahl n die Funktion fn zuordnet, kann nicht
berechenbar sein! Denn ϕ ist die Verkettung dieser Zuordnung mit der Abbildung,
die jedem fn die Zahl fn (n) + 1 zuordnet. Und letztere Abbildung ist sicher berechenbar, da man fn (n) und damit auch fn (n) + 1 berechnen kann.
Satz 4.8.6 Die folgende Funktion ψ : N → N ist nicht berechenbar: Wenn die Zahl m einem
Text entspricht, der ein Rezept zur Berechnung einer berechenbaren Funktion N → N darstellt,
so sei ψ(m) = 1; in allen anderen Fällen sei ψ(m) = 0.
Beweis: Wenn ψ berechenbar wäre, könnte man die Zuordnung n 7→ fn folgendermaßen
herstellen.
Zunächst wird f0 bestimmt. Teste die Zahlen 0, 1, 2, . . . nacheinander mit der – nach Annahme
berechenbaren – Funktion ψ. Finde damit das kleinste m0 mit ψ(m0 ) = 1. Dieses m0 beschreibt
eine berechenbare Funktion; diese sei f0
4.8. BEINAHE EINE PARADOXIE
137
Seien f0 , f1 , . . . , fn−1 bereits bestimmt und mn−1 die zu fn−1 gehörige Zahl. Berechne dann
ψ(mn−1 + 1), ψ(mn−1 + 2, . . . bis Du auf die kleinste natürliche Zahl mn > mn−1 mit ψ(mn ) = 1
triffst. Dieses mn beschreibt also eine berechenbare Funktion fn .
Zusammen ergibt sich eine berechenbare Methode, jedem n ∈ N eine berchenbare Funktion fn
zuzuordnen. Man erreicht auf diese Weise auch alle berechenbaren Funktionen. Denn zu jeder
gehört ja eine natürliche Zahl m.
Da dies aber, wie oben gezeigt, nicht möglich ist, kann ψ nicht berechenbar sein.
138
KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK
Kapitel 5
√
Was bedeutet π 2?
Sehr interessant und für Anwendungen wichtig ist die Potenzrechnung besonders dann,
wenn man nicht nur ganzzahlige Exponenten betrachtet.
In diesem kurzen Kapitel definieren wir Potenzen ax , wenn a eine positive und x eine beliebige
reelle Zahl ist. Zunächst betrachten wir den Fall, wo x rational ist. (Dabei wird sich nebenbei
ergeben, dass ab irrational sein kann, auch wenn a und b beide rational sind.)
Danach definieren wir ex für beliebige reelle x, wobei e die aus dem 1. Abschnitt des 3. Kapitels
bekannte Eulersche Zahl ist. Die Funktion ex wird wie die Zahl e durch eine Reihe definiert.
Um zu sehen, dass für rationale x die beiden Definitionen von ex zum selben Ergebnis führen,
benötigen wir das Cauchyprodukt von Reihen, welches wir im letzten Kapitel betrachtet haben. Wir definieren dann (für positive a) allgemein ax := ex ln a , wobei ln den natürlichen
Logarithmus bezeichnet, der durch eln a = a definiert ist.
5.1
Potenzen mit rationalen Exponenten
Beispiel: Man weiß etwa: Bei einer speziellen Bakterienkultur verdoppelt sich die Anzahl der
Bakterien alle 24 Stunden. Frage: Wieviele Bakterien hat man nach 8 Stunden?
Antwort: Nach 8 Stunden möge die Anzahl das x-fache der Ausgangszahl sein. Dann habe
ich nach 16 Stunden das x-fache des x-fachen der Ausgangszahl, also das x · x-fache der Ausgangszahl und schließlich nach 24 Stunden √
das x · x · x-fache der Ausgangszahl. Es gilt also
3
x = 2. Somit habe ich nach 8 Stunden das 3 2-fache der Ausgangszahl. Andererseits, da nach
n Tagen, die Anzahl der Bakterien das 2n - fache der Ausgangszahl beträgt, liegt es nahe, die
Zahl der Bakterien nach einem drittel Tag als das 21/3 -fache der Ausgangszahl zu betrachten,
also
√
1
3
2 3 = 2 zu definieren.
(Natürlich ist
√ die Anzahl n der zu Anfang vorhandenen Bakterien so groß, dass Du den Unterschied von 3 2 · n zur nächsten ganzen Zahl als unerheblich betrachten darfst.)
139
√
140
KAPITEL 5. WAS BEDEUTET π
2
?
5.1.1 Ist a ein Element eines Ringes, so kennst Du bereits Potenzen der Form an , wo n ∈ N
ist. Falls a ein von 0 verschiedenes Körperelement ist, so ist an sogar für beliebige ganze Zahlen
n sinnvoll und eindeutig definiert.
Du kennst auch folgende Regeln:
(∗)
am+n = am · an ,
(∗∗) amn = (am )n
Auf Grund der Kommutativität ab = ba hat man als dritte Regel
(∗ ∗ ∗)
(ab)n = an bn
5.1.2 Wie will man am/n definieren, wenn m, n ∈ Z, n > 0 ist? Wenn die Regel (∗∗) für n ∈ Z
weiter gelten soll, muss x := am/n die Gleichung xn = am erfüllen. Nun kann im Allgemeinen
die Gleichung xn = b mehrere Lösungen oder auch gar keine Lösung haben.
Im Körper R der reellen Zahlen gibt es für gerade n und negative b keine Lösung. Hingegen
gibt es 2 reelle Lösungen, wenn n gerade und b > 0 ist. Wenn n ungerade ist, gibt es immer
genau eine Lösung. (Im Körper Q der rationalen Zahlen gibt es auch für ein positives b eher
selten Lösungen! Später wirst Du sehen, dass die Gleichung xn = b im Bereich der komplexen
Zahlen immer Lösungen hat, und zwar für b 6= 0, sogar n Lösungen. )
In der Menge R+ der reellen Zahlen ≥ 0 gibt es glücklicherweise
zu jedem ganzen n > 0 und
√
n
n
b
bezeichnet.
(Wie gewohnt definiert man
jedem
b
genau
ein
c
mit
c
=
b.
Dieses
c
wird
mit
√
√
2
∗
m/n
b = b.) Für a √
∈ R+ , der Menge der reellen Zahle > 0, ist also a
∈ R∗ eindeutig definiert,
n
nämlich am/n := am . D.h. wenn man a > 0 voraussetzt und am/n > 0 fordert, hat man keine
Probleme. Es darf sogar m < 0 sein!
Du solltest Dir überlegen, dass für a, b ∈ R∗+ die Regeln (∗), (∗∗), (∗ ∗ ∗) auch für gebrochene
Exponenten aus Q gelten.
Nochmal: Sei a > 0. Dann ist für alle rationalen x die x-te Potenz von a, also ax durch die
Vorgabe ax > 0 eindeutig definiert.
Was soll man nun unter ax verstehen, wenn x reell, aber nicht mehr rational ist? Ein Praktiker
wird sagen: Sei x genügend genau durch die rationale Zahl (etwa den abbrechenden Dezimalbruch) r approximiert. Dann approximiert auch ar genügend genau die Potenz ax . (Das stimmt
zwar, sollte aber eigentlich bewiesen worden sein.)
Als Theoretiker möchte ich gerne ax für beliebige reelle, nicht nur für rationale Zahlen x präzise
definieren. Dazu wähle ich einen Umweg.
Warum macht man in der Mathematik – hier und in vielen anderen Fällen – gerne einen
Umweg? Die Antwort ist dieselbe wie im täglichen Leben. Es ist ja gar nicht so selten, dass
man auf einem Umweg schneller zum Ziel kommt als auf dem kürzesten Weg. Der direkte Weg
kann durch enge verkehrsreiche Straßen führen, ein Umweg über die Autobahn. Oder, auf dem
geraden Weg mag ein Sumpf liegen, den man durch einen Umweg vermeiden kann. Usw.
Der direkte Weg, ax für beliebige reelle x zu definieren, wäre der Folgende: Jede reelle Zahl
lässt sich ja beliebig durch rationale Zahlen approximieren. D.h. zu jedem x ∈ R gibt es eine
5.2. DIE EXPONENTIALFUNKTION
141
Folge (yn ) mit yn ∈ Q, so dass x = limn→∞ yn ist. Dann kann man definieren: ax := limn→∞ ayn .
Damit das funktioniert, bleibt allerdings folgendes zu zeigen:
1. Die Folge (ayn ) ist konvergent.
2. Wenn man (yn ) durch eine andere gegen x konvergente Folge ersetzt, kommt man zum
gleichen Ergebnis.
5.1.3 Jetzt stelle ich Dir die indirekte Methode zur Einführung allgemeiner Potenzen vor. Im
nächsten Abschnitt wird sie dann genauer ausgeführt.
∞
X
xn
Zunächst definiert man auf R eine Funktion ‘exp’ durch exp(x) :=
. Mit Hilfe des
n!
n=0
Cauchy-Produktes und des Binomialsatzes zeigt man das Additionstheorem exp(x + y) =
exp(x) exp(y). Nun setzt man e := exp(1), und zeigt mit Hilfe des Additionstheorems, dass
exp(x) = ex für alle rationalen x gilt. (Noch mal: exp(x) ist durch eine Reihe, ex als Wurzel
aus einer Potenz mit ganzem Exponenten definiert.)
Dann definiert man ex := (x) für alle reellen (später sogar für alle komplexen) x. Da exp auf R
stetig ist, und zwei stetige Funktionen auf R, die auf Q übereinstimmen, schon gleich sind, ist
diese Definition zwingend, wenn man die Stetigkeit der Funktion f (x) = ex haben möchte.
Um ax für allgemeine a > 0 zu definieren, machen wir dann noch folgende Betrachtungen.
Es gilt ex > 0 für alle reellen x. Die Funktion f (x) = ex ist stetig und streng monoton wachsend.
Letzteres heißt x > y =⇒ ex > ey“. Die Funktion ex wächst über alle Grenzen. Andererseits
”
ist 0 ihre untere Grenze, d.h. zu jedem (noch so kleinen) r > 0 gibt es ein x mit ex < r. Aus
all dem folgt mit Hilfe des Zwischenwertsatzes:
Zu jedem reellen x > 0 gibt es genau ein y mit ey = x. Dieses y nennt man den (natürlichen)
Logarithmus von x.
Er wird in diesem Buch mit ln x bezeichnet. Die Abbildung ln : R∗+ → R ist die Umkehrabbildung von exp : R → R∗+ , d.h. es ist exp(ln(y)) = y, ln(exp(x)) = x für alle x ∈ R, y ∈ R∗+ .
Ferner gilt ln(xy) = ln(x) + ln(y), was aus exp(x + y) = exp(x) exp(y) folgt.
Nachdem all dieses bedacht und getan ist, definiert man ax für positive a und beliebige reelle
x durch
ax := ex ln a .
Dann hängt auch ax stetig von x ab und stimmt für rationale x mit der üblichen Definition
überein. Weiterhin gilt, wie man leicht rechnet:
ax+y = ax ay ,
5.2
(ax )y = axy ,
(ab)x = ax bx .
Die Exponentialfunktion
Definition 5.2.1 Die unendliche Reihe
∞
X
xn
x
x2
x3
=1+ +
+
+ ···.
n!
1
1
·
2
1
·
2
·
3
k=0
√
142
KAPITEL 5. WAS BEDEUTET π
2
?
heißt die Exponentialreihe.
Satz 5.2.2 Die Eponentialreihe konvergiert für alle reellen x.
Beweis: Da es genügt, die absolute Konvergenz zu zeigen, können wir x ≥ 0 voraussetzen.
Sei N ganz mit N > Max{2, x + 1}. Es genügt, die Konvergenz der Reihe
R=
∞
∞
X
X
xn−N
xn
= xN
n!
n!
n=N
n=N
(wo die ersten N Glieder weggelassen sind) zu zeigen. Dazu reicht es, die Konvergenz von
∞
X
xn−N
n!
n=N
zu beweisen. Ein allgemeines Glied der letzgenannten Reihe lässt sich für n ≥ N + 2 wie folgt
als Produkt dreier Faktoren schreiben:
1
xn−N
1
·
·
n(n − 1) (n − 2) · · · N (N − 1) (N − 2)!
Der mittlere Faktor ist nicht größer als 1, da die (n−2)−(N −2) = n−N Faktoren seines Nenners
nach Wahl von N sämtlich ≥ x sind. Ebenso ist der dritte Faktor ≤ 1. Die Partialsummen der
bekanntermaßen konvergenten Reihe
∞
X
n=N
1
n(n − 1)
sind also größer oder gleich denen der Reihe R/xN . Also ist R konvergent und damit auch die
Exponentialreihe.
Definition 5.2.3 Für jedes x ∈ R definieren wir die Funktion
exp(x) :=
∞
X
xn
k=0
n!
d.h. als Wert der Exponentialreihe. Die so definierte Funktion exp : R → R heißt die Exponentialfunktion.
Die grundlegende Aussage über die Eponentialfunktion ist das Additionstheorem:
Theorem 5.2.4 exp(x + y) = exp(x) · exp(y)
5.2. DIE EXPONENTIALFUNKTION
143
Der folgende Beweis ist etwas tüftelig, da wir zeigen müssen, dass in unserem Spezialfall das
Cauchyprodukt der Exponentialreihen gegen das Produkt ihrer Werte konvergiert. Und das ist
ja leider nicht selbstverständlich. Beweis: Wir betrachten die beiden Reihen
∞
X
xi
i=0
i!
und
∞
X
yj
j=0
j!
Wenn man jedes Glied der ersten mit jedem Glied der zweiten Reihe multipliziert, kann man die
Produkte in einem unendlichen quadratischen Schema anordnen, wie es in (4.5.2) beschrieben
ist.
a0 b0 a0 b1 a0 b2 a0 b3 a0 b4 a0 b5 · · ·
a1 b 0 a1 b 1 a1 b 2 a1 b 3 a1 b 4 a1 b 5 · · ·
a2 b 0 a2 b 1 a2 b 2 a2 b 3 a2 b 4 a2 b 5 · · ·
a3 b 0 a3 b 1 a3 b 2 a3 b 3 a3 b 4 a3 b 5 · · ·
a4 b 0 a4 b 1 a4 b 2 a4 b 3 a4 b 4 a4 b 5 · · ·
a5 b0 a5 b1 a5 b2 a5 b3 a5 b4 a5 b5 · · ·
..
..
..
..
..
..
..
.
.
.
.
.
.
.
wobei ai = xi /i!, bj = y j /j! gesetzt ist.
Die Funktion en (x) sei als die n-te Partialsumme der Exponentialreihe definiert:
en (x) :=
n
X
xk
k=0
k!
Dann gilt (∗) exp(x) = limn→∞ en (x), also auch exp(x) · exp(y) = limn→∞ en (x)en (y)
Da nj = n!/((n − j)!j!) ist, können wir die Summe dn (x, y) über die n-te Cauchy-Diagonale
wie folgt berechnen:
n n
X
1 X n n−j j (x + y)n
xn−j y j
dn (x, y) :=
=
x y =
(n
−
j)!j!
n!
j
n!
j=0
j=0
Das bedeutet: Wenn wir die (unendliche) Summe über die Cauchy-Diagonalen dn (x, y) berechnen, erhalten wir
∞
∞
X
X
(x + y)n
dn (x, y) =
= exp(x + y) .
n!
n=0
n=0
Wenn wir also gezeigt haben, dass
lim en (x)en (y) =
n→∞
∞
X
dn (x, y)
n=0
gilt, dann haben wir das Theorem bewiesen!
Dafür wollen wir zunächst x, y ≥ 0 annehmen. Dann sind alle Einträge in unserem Schema ≥ 0
und Du erkennst
en (x)en (y) ≤
2n
X
k=0
dk (x, y) ≤ e2n (x)e2n (y) ≤ exp(x) exp(y) .
√
144
KAPITEL 5. WAS BEDEUTET π
2
?
(Wenn Du magst, kannst Du Dir dies mit folgendem Bild veranschaulichen, wo die verschiedenen
Kreissymbole •, ⊗ und ◦ für die Einträge ai bj = (xi /i!)(y j /j!) mit i, j ≤ 2n stehen. Dabei
betrachte ich den Fall n = 3 in der Hoffnung, der allgemeine Fall möge Dir dann klar sein.
0
•
•
•
•
•
•
•
•
•
•
•
•
⊗
⊗
⊗
⊗
⊗
⊗
◦
◦ ◦
n
•
•
•
•
◦
◦
◦
2n
⊗
⊗
⊗
⊗
⊗
⊗
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
◦
Wenn wir die Einträge, die mit • bezeichnet sind, addieren, erhaltenPwir en (x)en (y). Addieren
wir die Einträge, die mit ⊗ bezeichnet sind, hinzu, so erhalten wir 2n
k=0 dk (x, y). Die Summe
aller Einträge summiert ergibt e2n (x)e2n (y).)
Da sowohl die Folge (en (x)en (y))n als auch die
Pn Folge (e2n (x)e2n (y))n gegen exp(x) exp(y)
konvergiert, muss die Folge der Teilsummen ( k=0 dk (x, y))n∈N gegen denselben Grenzwert
exp(x) exp(y) konvergieren, und wir haben das Theorem für nichtnegative x, y gezeigt.
Jetzt behandeln wir den allgemeinen Fall. Zunächst bemerke ich noch, dass für x, y ≥ 0 sich
aus obigem folgendes ergibt
!
2n
X
lim e2n (x) · e2n (y) −
dk (x, y) = 0
n→∞
k=0
P
Für beliebige x, y ∈ R ist die Differenz e2n (x) · e2n (y) − 2n
k=0 dk (x, y) gleich der Summe der
Terme
xi y j
mit i + j > 2n, i ≤ 2n, j ≤ 2n
i!j!
(d.h. der in obigem Bild mit ◦ bezeichneten Terme) und deshalb nach der Dreiecksungleichung
der Betrag dieser Summe kleiner oder gleich der Summe
|x|i |y|j
mit denselben Bedingungen an i, j
i!j!
Das lässt sich auch folgendermaßen ausdrücken
2n
2n
X
X
e
(x)e
(y)
−
d
(x,
y)
≤
e
(|x|)e
(|y|)
−
dk (|x|, |y|)
n
n
k
n
n
k=0
k=0
Da die rechte Seite mit wachsendem n gegen 0 geht, gilt dies erst recht für die linke Seite. Und
damit ist der Satz bewiesen.
Die Stetigkeit der Exponentialfunktion beweisen wir mit Hilfe des Additionstheorems.
5.2. DIE EXPONENTIALFUNKTION
145
Lemma 5.2.5 a) Für |x| < 1 gilt | exp(x) − 1 − x| ≤ x2 .
b) Die Exponentialfunktion ist in x0 = 0 stetig.
Beweis:
2
3
4
x
|x|2 |x|3 |x|4
x
x
a) | exp(x) − 1 − x| = +
+
+ · · · ≤
+
+
+ ···
2!
3!
4!
2!
3!
4!
1
|x| |x|2
1
1
1
2
2
=x
+
+
+ ··· ≤ x
+ + + · · · ≤ x2 (e − 2) ≤ x2 .
2!
3!
4!
2! 3! 4!
Die letzte Ungleichung folgt aus e < 3.
b) Wir müssen zeigen, dass limx→0 exp(x) = 1 ist. Nach a) und der Dreiecksungleichung ist
| exp(x) − 1| = | exp(x) − 1 − x + x| ≤ | exp(x) − 1 − x| + |x| ≤ |x| + x2 . Deshalb gilt 0 ≤
limx→0 | exp(x) − 1| ≤ limx→0 (|x| + x2 ) = 0.
Teil a) werden wir noch anwenden, wenn wir die Ableitung der Exponentialfunktion berechnen
wollen.
Erinnere Dich, dass der Wert exp(1) der Exponentialfunktion bei 1 mit e bezeichnet wird.
Trivialerweise ist exp(0) = 1.
Folgerung 5.2.6 Die Exponentialfunktion ist überall stetig.
Beweis: Für jedes x ∈ R haben wir limx0 →x exp(x0 ) = exp(x) zu zeigen. Dabei genügt es
natürlich, dies für |x0 − x| < 1 zu tun (d.h. nur Folgen (x0n ) mit |x0n − x| < 1 zu betrachten). Es
gilt hierfür nach Teil b) obigen Lemmas
lim | exp(x0 ) − exp(x)| = | exp(x)| · lim
| exp(x0 − x) − 1| = 0 .
0
x0 →x
x →x
Folgerung 5.2.7 a) Für natürliche Zahlen a gilt exp(a) = ea .
b) Selbiges stimmt auch noch, wenn a ∈ Z, also möglicherweise negativ ist.
c) Selbiges gilt auch für beliebige a ∈ Q.
d) exp(a) > 0 für alle x ∈ R. Genauer gilt exp(a) > 1 für a > 0 und 0 < exp(a) < 1 für a < 0
e) exp ist streng monoton wachsend. D.h. a < b ⇒ exp(a) < exp(b).
Beweis: a) exp(1+1+· · ·+1) = e·e · · · e. Wenn Du es für nötig hältst, verwende vollständige
Induktion.
b) exp(−a) exp(a) = exp(0) = 1. Für jede natürliche Zahl n ist also exp(−n) = 1/en .
√
c) exp(m/n)n = exp(n · (m/n)) = exp(m). D.h. exp(m/n) = n em .
P
n
n
d) Sei a > 0. Es ist exp(a) = 1 + ∞
n=1 a /n! und für n ≥ 1 ist a /n! ≥ 0. In diesem Fall ist
exp(a) > 1.
Sei a < 0. Dann ist exp(a) = exp(−a)−1 . Es folgt die Behauptung.
e) exp(b) = exp(a + (b − a)) = exp(b − a) exp(a). Da b − a > 0 ist, gilt exp(b − a) > 1. Daraus
folgt die Behauptung.
√
146
KAPITEL 5. WAS BEDEUTET π
2
?
Lemma 5.2.8 Seien I ein Intervall und f, g : I → R stetige Funktionen. Wenn die Einschränkungen von f und g auf I ∩ Q übereinstimmen, so stimmen f und g auf ganz I überein.
Die reellen Zahlen sind ja so definiert, dass jede solche ein Limes einer Folge rationaler Zahlen
ist. (Gehört die reelle Zahl x zu einem Intervall I, kann auch eine Folge rationaler Zahlen,
die gegen x konvergiert in diesem Intervall gewählt werden.) Wegen der Stetigkeit folgt die
Behauptung.
Aus Punkt c) obiger Folgerung und dem Lemma ergibt sich, dass die folgende Definition sinnvoll
ist.
Definition 5.2.9 Sei x ∈ R beliebig. Dann definieren wir ex := exp(x).
Natürlich wollen wir ax für möglichst allgemeine a definieren. Und das wird auch bald geschehen.
Allerdings ist die Bedingung a > 0 unumgänglich, wenn wir im Bereich der reellen Zahlen
bleiben wollen.
5.2.10 Da die Abbildung exp : R → R streng monoton steigend ist, ist sie injektiv. Was ist
das Bild dieser Abbildung? Wir wissen schon, dass exp(x) für jedes reelle x positiv ist. Ferner
wird exp(x) mit wachsendem x beliebig groß. Denn nach der Bernoulli’schen Ungleichung ist
exp(n) = en ≥ 1+n(e−1) für natürliche n. Entsprechend geht exp(x) (von oben) gegen 0, wenn
x gegen −∞ geht. Es ist ja e−x = 1/ex . Sei jetzt y eine beliebige positive reelle Zahl. Dann gibt
es ein reelles x0 mit ex0 ≤ y und ein reelles x1 mit ex1 ≥ y. Auf Grund des Zwischenwertsatzes
gibt es also ein x ∈ [x0 , x1 ] mit ex = y. Also ist das Bild von exp die Menge aller positiven reellen
Zahlen, d.h. R∗+ . Somit ist exp als Abbildung R → R∗+ bijektiv. Und wir können definieren:
Definitionen 5.2.11 a) Der natürliche Logarithmus ist die Umkehrabbildung der Exponentialfunktion, d.h. diejenige Abbildung ln : R∗+ → R mit ln ◦ exp = idR und exp ◦ ln = idR∗+ .
Man kann auch sagen, der natürliche Logarithmus von x(>=) ist dasjenige (eindeutig bestimmte) y, für welches ey = x ist.
b) Seien a, x ∈ R und a > 0, so sei ax := ex ln a definiert.
Nach Definition a) ist ja eln a = a, also ex ln a = ax zunächst für x ∈ N, dann für x ∈ Z und
schließlich für x ∈ Q. Dies rechtfertigt die Definition b).
Theorem 5.2.12 Seien a, b > 0 und x, y ∈ R. Dann gilt:
a) ax+y = ax · ay ,
b) axy = (ax )y ,
c) (ab)x = ax · bx
Beweise diese Regeln selbst. Nicht einmal im Traum darfst Du in diesen Regeln Plus
c
c
mit Mal verwechseln! Beachte auch, dass ab , welches nach Definition gleich a(b ) ist, meist
von (ab )c = abc verschieden ist.
5.2. DIE EXPONENTIALFUNKTION
147
Bemerkung 5.2.13 Der natürliche Logarithmus wird häufig auch mit ‘log’ bezeichnet, ganz
besonders in Büchern zur Zahlentheorie.
Definition 5.2.14 Seien a, x > 0. Der Logarithmus zur Basis a von x ist diejenige reelle Zahl
y für die ay = x ist. Er wird mit loga (x) bezeichnet.
Bemerkungen 5.2.15 a) Beachte, dass damit ln x = loge (x) ist.
b) Für a > 0 ist
loga (x) =
ln x
.
ln a
Denn nach Definition gilt
ln x
ln x
a ln a = eln(a) ln a = eln x = x .
c) Für a, b > 0 folgt aus b) unmittelbar
loga (x)
ln b
=
.
logb (x)
ln a
√
148
KAPITEL 5. WAS BEDEUTET π
2
?
Kapitel 6
Geometrie
6.1
Vorbemerkungen
Ohne Zweifel haben für die meisten Menschen die geometrischen Begriffe, wie Punkt, Gerade, Dreieck usw. eine anschauliche Bedeutung. Und seit mindestens zweieinhalb tausend
Jahren geht man damit auch mathematisch um. D.h. man beweist geometrische Aussagen, etwa
dass die Winkelsumme in jedem Dreieck 180◦ sei, indem man diese Aussage auf eine anschaulich naheliegende (vielleicht sogar selbstverständliche?) Aussage über die Größe der Winkel
zurückführt, in denen eine Gerade zwei parallele Geraden schneidet.
α
α’
g
g’
Hier ist g parallel zu g 0 genau dann, wenn α = α0 gilt.
Dabei heißen zwei Geraden in einer Ebene genau dann zueinander parallel, wenn sie entweder
übereinstimmen oder keinen Punkt gemeinsam haben. Zwei Geraden im Raum heißen zueinander parallel, wenn sie in einer gemeinsamen Ebene liegen und in dieser parallel sind. Die
Aussage, die unter der obigen Zeichnung steht, ist mehr oder weniger das berühmte (oder
berüchtigte) Parallelenaxiom Euklids, welches von allen seinen Axiomen und Postulaten
am wenigsten selbstverständlich erscheint.
Aus diesem Axiom folgt, dass die Winkelsumme im Dreieck 180◦ beträgt:
149
150
KAPITEL 6. GEOMETRIE
α’
β’
γ
α
β
Wähle g 0 parallel zu g. Dann ist α = α0 und β = β 0 . Daraus ergibt sich α + γ + β = 180◦
6.1.1 In der euklidischen Geometrie gibt es neben dem Begriff der Kongruenz von Dreiecken
(und anderen Figuren) auch den Begriff der Ähnlichkeit. Z.B. sind in der folgenden Zeichnung
die Dreiecke A0 B 0 C 0 und AB 00 C 00 zueinander kongruent, sowie beide ähnlich zu dem Dreieck
ABC. (Die Längen der Seiten A0 B 0 und AB 00 sind zueinander gleich. Die Seiten B 00 C 00 und BC
sind zueinander parallel. Ferner sind die Längenverhältnisse der Seiten AB zu A0 B 0 , BC zu
B 0 C 0 und CA zu C 0 A0 einander gleich.
C
γ
A’
α
C’
C’’
γ
γ
β
B’
A
α
β
B’’
β
B
Die Ähnlichkeit zweier Dreiecke kann man auf zweierlei äquivalente Weisen definieren: Einerseits durch die Gleichheit der Längenverhältnisse der Seiten, andererseits durch die Gleichheit
entsprechender Winkel.
1) a : a0 = b : b0 = c : c0 oder äquivalent dazu a : b = a0 : b0 , a : c = a0 : c0
2) α = α0 , β = β 0 , weswegen natürlich auch γ = γ 0 ist.
Für Vierecke stimmt dies nicht mehr. Meist sind zwei Rechtecke trotz der Gleichheit entsprechender Winkel einander nicht ähnlich. Entsprechendes gilt für zwei Rauten, d.h. Vierecken
mit 4 gleichlangen Seiten. Hier sind die Verhältnisse entsprechender Seitenlänge gleich, aber
die entsprechenden Winkel meist nicht. Ein Quadrat ist sowohl ein Rechteck wie eine Raute,
aber zu den meisten Rechtecken und Rauten nicht ähnlich.
6.1. VORBEMERKUNGEN
151
Die Ähnlichkeit zweier n-Ecke kann man dadurch definieren, dass man sowohl die Gleichheit
der Winkel, als auch die der Verhältnisse entsprechender Seitenlängen fordert.
6.1.2 Seien zwei Kreise K1 , K2 mit den Radien r1 bzw r2 und ein Winkel α gegeben. (Dabei sei
α zwischen 0 und 180◦ gewählt.) Aus beiden Kreisen schneide einen Sektor heraus der zu dem
(gemeinsamen) Winkel α gehört. Dann verhalten sich die Längen l1 und l2 der ausgeschnittenen
Teile der Kreislinien zueinander wie r1 zu r2 .
ℓ1
α
ℓ2
α
γ1
γ2
(Versehentlich sind in der Zeichnung die Radien r1 , r2 mit γ1 , γ2 bezeichnet worden.) Dies kann
man sich, wie folgt, anschaulich klar machen. Zerlege den Winkel α in n Teilwinkel: α =
α1 + · · · αn . Daraus ergeben sich den beiden Kreislinienstücken einbeschriebene Streckenzüge
wie in folgendem Bild:
T14
α4
α3
α2
M1
γ1
α1
T13
T12
T11
T10
α4
α3
M2
α2
γ2
α1
T24
T23
T22
T21
T20
152
KAPITEL 6. GEOMETRIE
Dann sind je zwei Dreiecke, deren Ecken der Mittelpunkt des jeweiligen Kreises und analoge benachbarte Eckpunkte des approximierenden Streckenzuges sind, einander ähnlich. (Das Dreieck
M1 T1i T1,i+1 ist ähnlich zum Dreieck M2 T2i T2,i+1 .)
Die Längen der Streckenzüge verhalten sich deshalb wie r1 zu r2 .
Die Länge einer Kurve kann man gut als Limes der Längen einbeschriebener Streckenzüge
definieren, wenn man die Längen der einzelnen Strecken gegen 0 gehen lässt. Es ergibt sich die
obige Behauptung.
6.1.3 Bemerkung zur Winkelmessung. Vorläufig betrachten wir Winkel zwischen Strahlen (d.h. Halbgeraden) mit dem gleichen Anfangspunkt mit Werten im Intervall [0◦ , 180◦ ]. Die
Wahl des Grades ◦ , derart der rechte Winkel ein solcher von 90◦ ist, ist natürlich willkürlich,
hat aber den Vorteil, dass ein Innenwinkel eines regelmäßigen n-ecks (genau) dann ganzzahlig
in Bezug auf den Grad ist, wenn n einer der vielen Teiler von 360 = 23 · 32 · 5 ist.
Mehr und mehr werden wir Winkel auch in ‘Radiant’ angeben, d.h. als Bogenlänge des (kleineren) Teiles der Einheitskreislinie um den gemeinsamen Anfangspunktes der beiden Strahlen,
den dieselben ausschneiden. Per definitionem ist der Einheitskreis der Kreis, dessen Radius
gleich einer Längeneinheit ist. Wegen Absatz 6.1.2 ist dieses Winkelmaß unabhängig von der
Wahl der Längeneinheit.
α
1
Winkel als Länge eines Kreisbogens
6.1.4 Gauss war sich, wie einige seiner Zeitgenossen, darüber im Klaren, dass man auch eine
Geometrie entwickeln kann, in der Euklids Parallelenaxiom ungültig ist. Wenn man Lichtstrahlen (im Vakuum) als gerade ansieht, ist die Geometrie – wie die Physiker heute wissen
– nicht euklidisch. Manche Philosophen erheben gegenüber dieser Sicht der meisten heutigen
Physiker den Einwand, dass man, bevor man überhaupt messen kann, wissen muss, was dieses Messen bedeutet. (Wie kann man z.B. definieren, dass zwei Punkte auf einem Planeten
in einer entfernten Galaxie einen Abstand von 1 km haben?) Dies scheint sehr schwierig zu
sein, wenn man nicht von der euklidischen Geometrie ausgeht, die zudem für alle Menschen die
anschaulichste ist.
6.2. KOORDINATEN
153
Mathematikerinnen und Mathematiker möchten sich in der Regel aus solcherlei Diskussionen
heraushalten. Sie legen durch Axiome fest, von welcher Geometrie sie gerade sprechen. Ich will
in diesem Buch nur von der aus dem Schulunterricht bekannten euklidischen Geometrie
handeln, in der Euklids Parallelenaxiom gilt.
In diesem Buch ist zu wenig Platz für eine strenge moderne Einführung in die Geometrie, sei
sie axiomatisch [Hilbert] oder nicht [Lorenzen].
Mein eigentliches Anliegen ist weniger, Dir die klassische Geometrie – wie sie schon zum großen
Teil in Euklids berühmten Elementen“ steht – nahezubringen, sondern insbesondere ihren
”
Zusammenhang mit der Linearen Algebra, dem Skalarprodukt und den Kreisfunktionen (Sinus, Cosinus) zu erklären. Drei klassisch-geometrische Sätze über Dreiecke, die erst nach 1700
gefunden wurden, will ich Dir aber nicht vorenthalten.
6.2
Koordinaten
6.2.1 Eine Gerade kann man als Zahlengerade auffassen, d.h. mit der Menge der reellen Zahlen
identifizieren. Dies ist natürlich auf viele verschiedene Weise möglich. Aber sobald man einen
Punkt als Nullpunkt und einen anderen als Einspunkt festglegt hat, ist diese Identifizierung
eindeutig. (Natürlich verlangt man dabei, dass z.B. die Punkte 1 und 2 denselben Abstand
haben, wie die Punkte 0 und 1 und dass der Punkt 1 zwischen den Punkten 0 und 2 liegt, usw.,
usw. – alles wie Du es gewohnt bist. Es gibt ja auch sogenannte logarithmische Skalen, wo man
sich die positiven Zahlen so auf einer Geraden vorstellt, dass die Abstände von 1 und 2, von
2 und 4, von 4 und 8, sowie von 12 und 1 usw. alle einander gleich sind. Diese lassen wir hier
außer Betracht.)
–π
–3
2
–2
–1
0
1
2
3
Eine Gerade in der (einer) Ebene oder im Raum, die ich auf solche Weise mit der R identifiziert
habe, will ich eine Zahlengerade nennen.
6.2.2 So wie man eine Gerade mit R identifizieren kann, kann man eine Ebene mit R2 , der
Menge aller Paare reeller Zahlen, identifizieren. Wie Du sicher weißt, muss man dazu ein Koordinatensystem in die Ebene legen. Dieses besteht aus zwei Zahlengeraden, die genau einen
gemeinsamen Punkt haben, der auf beiden Zahlengeraden der Nullpunkt ist.
154
KAPITEL 6. GEOMETRIE
(3,3)
(0,1)
(–1,0)
(1,0)
(0,1)
(3,0)
(–2,0)
(2,1)
O (1,0) (2,0)
(0,–1)
(0,–3)
Im ersten Bild habe ich die Koordinatenachsen senkrecht (orthogonal) zueinander und zudem die beiden Einspunkte auf den Koordinatenachsen so gewählt, dass ihre Abstände vom
gemeinsamen Nullpunkt, dem (Koordinaten)-Ursprung gleichgroß sind. Ein solches Koordinatensystem wird auch ein orthonormales Koordinatensystem genannt. Dabei wird meist
noch verlangt, dass die Abstände der Einspunkte vom Ursprung gleich einer gegebenen Einheitslänge sind.
Eine allgemeinere Art eines Koordinatensystems wird im zweite Bild angedeutet. In der Regel
verwende ich orthonormale Koordinatensysteme.
6.2.3 Man kann so weiter machen und den Raum mit dem R3 identifizieren, indem man ein
Koordinatensystem mit drei Achsen wählt, die sich in einem gemeinsamen Punkt schneiden,
aber nicht in einer gemeinsamen Ebene liegen.
In diesem Buch will ich mich auf die Geometrie der Ebene konzentrieren.
Neben der Geometrie im Raum und der in der Ebene gibt es auch eine etwas magere Geometrie
in der Geraden. Eine Zahlengerade ist sozusagen eine Gerade mit einem Koordinatensystem,
bestehend aus einer Koordinatenachse. Jeder Punkt hat dort eine einzige Koordinate.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
6.3
155
Geometrische und algebraische Vektoren
Definitionen 6.3.1 a) Ein Pfeil ist eine gerichtete Strecke in (der Geraden,) der Ebene
oder im Raum. Eine gerichtete Strecke ist eine Strecke, deren Endpunkte man nicht als gleichberechtigt ansieht, sondern einen als Anfangspunkt, den anderer als Endpunkt bezeichnet.
Wenn man will, kann man einen Pfeil als Paar dieser Punkte definieren. Pfeile der Länge 0,
also Punktepaare der Form (a, a) wollen wir nicht ausschließen!
b) Pfeile (a, b), (a0 , b0 ) heißen zueinander parallel verschoben, wenn entweder (a, b) = (a0 , b0 ) ist
oder
sowohl 1. die Gerade durch a, b zur Geraden durch a0 , b0 parallel ist und die Strecke von a nach
b gleichlang der von a0 nach b0 ist,
als auch 2. dasselbe für die Paare (a, a0 ) und (b, b0 ) gilt. (Achtung: Ich habe hier mit a, b, . . .
Punkte und nicht Zahlen bezeichnet.)
Beispiele:
b
b’
a
a’
oder
a
b
a’
b’
Die Punkte a, b, b0 , a0 bilden also ein Parallelogramm, das allerdings auch ausgeartet sein, d.h.
ganz in einer Geraden liegen kann. (Bei Pfeilen innerhalb einer Geraden ist es immer ausgeartet!)
Nur im nichtausgearteten Fall kann man in 1. und 2. auf die Gleichheit der Längen verzichten.
(Insbesondere sind ie Pfeile der Länge 0, also Punktepaare der Form (a, a) zueinander parallel
verschoben!) Die o.a. Bedingung 2. kann man auch wie folgt verstehen: ‘(a, b) und (a0 , b0 ) gehen
in die gleiche Richtung’.
m m0
, 0 einander gleich nennt, wenn mn0 = m0 n gilt, so nennt man
n
n
zwei Pfeile (a, b), (a0 , b0 ) den gleichen Vektor, wenn sie zueinander parallelverschoben sind.
c) So wie man zwei Brüche
d) Ein Vektor ist also eine Äquivalenzklasse von Pfeilen bezüglich der Äquivalenzrelation ‘parallelverschoben’.
156
KAPITEL 6. GEOMETRIE
6.3.2 a) Sei ein Ursprungspunkt O in der Ebene oder im Raum festgelegt.
Jeder Pfeil in der Ebene ist parallelverschoben zu genau einem solchen, dessen Anfangspunkt
O ist. (Du darfst Dir bei dem Buchstaben O die Null denken, aber auch den ersten Buchstaben
des lateinischen Wortes ’origo’, auf deutsch ’Ursprung’.)
b) Die Menge der Pfeile von O aus bilden ein Repräsentantensystem für die Menge der Vektoren,
d.h. der Äquivalenzklassen von Pfeilen. Die Menge aller geometrischen Vektoren steht also
in bijektiver Beziehung zu der Menge der Pfeile von O aus, d.h.mit Anfangspunkt O. Somit
wollen wir je nach Nützlichkeit unter einem (geometrischen) Vektor mal eine Äquivalenzklasse
von Pfeilen bezüglich der Relation parallelverschoben“, mal einen Pfeil von O aus verstehen.
”
Letztere Möglichkeit setzt allerdings voraus, dass vorher ein Ursprungspunkt O festgelegt ist.
c) Wenn man einen Ursprungspunkt O festgelegt hat, entsprechen den Pfeilen von O aus, also
den geometrischen Vektoren, in bijektiver Weise die Punkte (der Geraden), der Ebene (bzw.
des Raumes). Es entspricht nämlich jedem Punkt a der Pfeil (O, a) und jedem Pfeil (O, a)
der Punkt a. Allerdings heißt das nicht, dass Punkte und Vektoren im Grunde dasselbe sind.
Es hat ja keinen geometrischen Sinn, zwei Punkte zu addieren oder einen Punkt mit einer
reellen Zahl zu multiplizieren, während das für Vektoren sinnvoll ist. Siehe unten! Vor Allem ist
die Entsprechung von Punkten und Vektoren davon abhängig, welchen Ursprungspunkt man
gewählt hat.
6.3.3 Algebraische Vektoren. Bereits oben, nach der Einführung des cartesischen Produktes, haben wir von der Menge Rn der n-tupel reeeller Zahlen gesprochen, also von
1-tupel (a1 )
2-tupel (Paar) (a1 , a2 )
3-tupel (Tripel) (a1 , a2 , a3 )
4-tupel (Quadrupel) (a1 , a2 , a3 , a4 )
..
.
allgemein n-tupel (a1 , . . . , an ) mit ai ∈ R.
Nichts hindert uns allerdings daran, die ai als Elemente eines beliebigen gemeinsamen Körpers
zu wählen. (Hier ist der Name ‘Körper’ im algebraischen Sinne gemeint, also als Rechenbereich.)
Sie noch allgemeiner als Elemente eines beliebigen Ringes zu wählen, ist auch nützlich. Aber
soweit will ich in diesem Buch nicht gehen.
Wenn man die Gerade, die Ebene, den Raum mit einem Koordinatensystem versehen hat wird
jeder Punkt der Geraden, der Ebene, des Raumes durch ein Element des Rn mit n = 1, bzw.
n = 2, bzw. n = 3 beschrieben. Da jeder Punkt nach Wahl eines Koordinatensystems (bereits
nach Wahl des Ursprungs) einem Vektor entspricht, entspricht auch jeder Vektor einem Element
aus Rn (n = 1, 2, 3).
Man hat also (nach Wahl eines Koordinatensystems) im 1-, bzw. 2-, bzw. 3-dimensionalen
Raum (=Gerade, bzw. Ebene, bzw. Raum) folgende bijektive Beziehungen:
Punkte ↔ Vektoren ↔ n-tupel (n = 1, 2, 3)
Man bezeichnet deshalb auch n-tupel reeller Zahlen als Vektoren. Dasselbe gilt für die Elemente
eines K n , wo K ein beliebiger Körper ist. Ich möchte in diesen Fällen von algebraischen
Vektoren reden.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
157
6.3.4 Geometrische Vektoren kann man addieren. Seien v, w Vektoren und v durch die gerichtete Strecke (a, b) repräsentiert. Dann kann man w durch eine gerichtete Strecke repräsentieren,
deren Anfangspunkt b ist. Sei also w durch (b, c) gegeben. Dann definiert man v + w durch die
gerichtete Strecke (a, c). Will man die entsprechende Summe im Bereich der Pfeile mit Anfangspunkt O definieren, muss man in der Regel ein Parallelogramm konstruieren. (Denke an
das ‘Parallelogramm der Kräfte’.)
v+w
w
v
Man kann auch einen geometrischen Vektor v mit einer reellen Zahl λ multiplizieren, indem man
ihn entsprechend verlängert oder schrumpft, und, falls λ < 0 ist, noch die Richtung umkehrt“.
”
Eine geometrische Konstruktion ergibt sich für v 6= 0 wie folgt: Repräsentiere v durch die gerichtete Strecke (O, b). Wähle eine Zahlengerade Z so, dass ihr Nullpunkt mit O zusammenfällt,
der Punkt b, der ja nach Voraussetzung nicht mit O zusammenfällt aber nicht auf ihr liegt.
Ziehe die Gerade durch 1 und b und die Parallele zu dieser durch den Punkt λ auf der Zahlengeraden. Diese Parallele schneidet die Gerade durch 0 und b in einem Punkt c, Der Vektor λv
wird dann durch den Pfeil (0, c) gegeben. (Denke an den Strahlensatz.) Ist b = O, d.h. v der
Nullvektor, so ist auch λv der Nullvektor.
λ
1
O
λ∙(O,b) = (O,c)
b
c
6.3.5 Orthogonalprojektion. Sei in der Ebene (bzw. im Raum) R eine Zahlengerade G
gegeben. Dann kann man die Ebene (bzw. den Raum), aufgefasst als Menge ihrer (seiner)
Punkte, auf die Gerade G orthogonal projizieren.
a
O
p(a)
158
KAPITEL 6. GEOMETRIE
Die Orthogonalprojektion auf G ist also eine Abbildung p : R → G, wo R die Ebene
(bzw. den Raum) bezeichnet. Und zwar ist p(a) der eindeutig bestimmte Punkt auf G, dessen
Verbindungsgerade mit a auf G senkrecht steht. (Für a ∈ G gilt p(a) = a.)
Für Pfeile und Vektoren in der Ebene (bzw. im Raum) gelten folgende beiden Sätze:
Satz 6.3.6 Seien a, b, a0 , b ∈ R so dass (a, b) parallel verschoben zu (a0 , b0 ) ist, so ist p(b) −
p(a) = p(b0 ) − p(a0 ).
a
O
v
p(a)
b
v
a’
p(b)
p(a’)
b’
p(b’)
Dieser Satz bedeutet, dass durch die Abbildung p auch eine Abbildung p0 : V → W definiert
ist! Dabei bezeichnet V die Menge der Vektoren in der Ebene (bzw. im Raum) sowie W die
Menge der Vektoren in der Geraden G. Mit den genannten Bezeichnungen haben wir
Satz 6.3.7 Seien λ ∈ R, v, v 0 ∈ V . Dann ist p0 (v + v 0 ) = p0 (v) + p0 (v 0 ) und p0 (λv) = λp0 (v).
λv
v
p’(v)
p’(λv)
v
w
p’(v)
p’(w)
p’(v+w)
Definitionen 6.3.8 Sei K ein Körper, n ≥ 1 eine natürliche Zahl.
a) Man kann je zwei Elemente aus K n addieren:
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn )
(Die i-te Komponente der Summe ist gleich der Summe der i-ten Komponenten der Summanden, und zwar für jedes ganze i mit 1 ≤ i ≤ n.)
b) Ist λ ∈ K, so definiert man
λ(a1 , . . . , an ) := (λa1 , . . . , λan ) .
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
159
6.3.9 Wir legen (für n = 1, 2, 3 in den n-dimensionalen Raum R ein orthonormales Koordinatensystem und betrachten einen geometrischen Vektor als Pfeil von O aus und nennen die
Koordinaten seines Endpunktes die Koordinaten des Vektors. Die Koordinaten eines Vektors
sind nun einfach die Projektionen seines Endpunktes auf die Koordinatenachsen. Deshalb folgt
aus Satz 6.3.7 die Erkenntnis, dass die bijektive Beziehung zwischen den geometrischen Vektoren von R und den algebraischen Vektoren aus dem R1 , R2 , bzw. R3 mit der Addition und auch
mit der Multiplikation mit Skalaren verträglich ist. D.h. Wenn (für n = 1, 2, 3) den Vektoren
v, w die n-tupel (a1 , . . . , an ), bzw. (b1 , . . . , bn ) entsprechen, so entspricht dem geometrischen
Vektor v + w das n-tupel (a1 + b1 , . . . , an + bn ) und dem geometrischen Vektor λv das n-tupel
(λa1 , . . . , λan ).
Satz 6.3.10 Seien v, v1 , v2 , v3 entweder geometrische Vektoren in der Ebene (dem Raum) oder
Elemente eines K n (mit einem Körper K); seien ferner λ, µ ∈ K. (Im Falle geometrischer
Vektoren sei K = R.) Dann gilt
a) v1 + v2 = v2 + v1 ,
b) (v1 + v2 ) + v3 = v1 + (v2 + v3 )
c) es gibt genau einen geometrischen Vektor, bzw. ein n-tupel o mit v + o = v; Bezeichnungen:
neutrales Element, Nullvektor
d) zu jedem v gibt es genau ein −v mit (−v) + v = o. Man nennt −v das additiv Inverse von
v.
e) 1v = v
f ) (λµ)v = λ(µv)
g) (λ + µ)v = λv + µv
h) λ(v1 + v2 ) = λv1 + λv2
Beweis: Der Fall algebraischer Vektoren ist nahezu trivial! Der Fall geometrischer Vektoren
ergibt sich hieraus mit Hilfe des Abschnittes 6.3.9.
Noch einmal: Du solltest Dir darüber im Klaren sein, dass geometrische Vektoren in der Ebene
(im Raum) und Elemente des R2 (bzw. R3 ) doch nicht so ganz dasselbe sind. Man muss zunächst
Koordinatensystem festlegen, bevor man die oben angegebene bijektive Beziehung angeben
kann.
Definition 6.3.11 Sei K ein Körper (im algebraischen Sinn). Ein K-Vektorraum ist eine
Menge V zusammen mit zwei Verknüpfungen, einer Addition ‘+’ innerhalb V und einer Multiplikation ‘(λ, v) 7→ λv’, wo λ ∈ K, v ∈ V und λv ∈ V ist, derart dass die im Satz 6.3.10
genannten Rechenregeln a) bis h) gelten. (Zu λ ∈ K, v, w ∈ V sind v + w ∈ V und λv ∈ V
definiert.)
160
KAPITEL 6. GEOMETRIE
Beispiele 6.3.12 a) Beispiele von R-Vektorräumen sind die Mengen der geometrischen Vektoren in der Geraden, in der Ebene, im Raum.
b) Jeder K n ist, wie oben beschrieben, ein K-Vektorraum.
c) Es gibt K-Vektorräume, die echt von allen K n verschieden, d.h. zu keinem K n isomorf sind.
(Den Begriff isomorf“ wirst Du bald kennenlernen.) Zum Beispiel bilden die (unendlichen)
”
Folgen von Elementen aus K einen Vektorraum, der in gewissem Sinne zu groß ist, um mit
einem K n verglichen zu werden.
d) Den Körper R kann man als Q-Vektorraum auffassen, indem man von allen in R möglichen
Multiplikationen nur diejenigen betrachtet, wo der erste Faktor aus Q ist. Auch dieser Vektorraum ist zu keinem Qn mit n ∈ N isomorf. Wir wissen ja, dass Qn (für n ∈ N) im Gegensatz
zu R abzählbar ist.
e) Sind K, L Körper mit K ⊂ L, und sind die Verknüpfungen in K dieselben wie in L, d.h.
Einschränkungen der letzteren, so nennt man K einen Teilkörper (auch Unterkörper) von
L und L einen Erweiterungskörper (auch Oberkörper) von K.
Immer wenn L ein Erweiterungskörper von K ist, kann man L auch als K-Vektorraum auffassen.
Ist L ein endlicher Körper (d.h. ein solcher, der nur endlich viele Elemente hat), so kann man
folgendes zeigen:
Es gibt eine Primzahl p und einen Unterkörper K von L, der isomorf zu Z/(p) ist. Da L
ein Erweiterungskörper von K ist, ist L als K-Vektorraum isomorf zu K n mit einer positiven
ganzen Zahl n, hat also pn Elemente. Ferner gibt es zu jeder Primzahlpotenz pn , wo n ≥ 1 ganz
ist, einen Körper aus pn Elementen.
Es gibt also keinen Körper von 6 oder 10 Elementen; aber es gibt solche von 2, 3, 4, 5, 7, 8 oder
9 Elementen, usw. Ich will hierauf nicht weiter eingehen.
Bemerkung 6.3.13 Das neutrale Element der Addition in einem Vektorraum wird häufig mit
0 anstelle von o bezeichnet, d.h. demselben Symbol, welches das neutrale Element der Addition
in einem Körper bezeichnet. Insbesondere bezeichnet 0 in K n das n-tupel (0, . . . , 0). Genau
genommen ist das eine missbräuchliche Bezeichnung. Gewöhne Dich daran, aufzupassen, von
welcher 0 die Rede ist.
Übrigens ist die 0 in einem Vektorraum, ebenso wie in einem Ring immer das einzige Element x,
welches die Gleichung x+x = x erfüllt. Das liegt an der Existenz additiv Inverser. (Du erinnerst
Dich sicher, dass die 1 in einem Körper nicht das einzige Element x ist, welches x · x = x erfüllt.
Die 0 tut’s ja auch. In einem Ring kann es noch mehr solche Elemente geben. Wenn etwa K
ein Körper ist, so ist K × K bezüglich der komponentenweisen Addition und Multiplikation
ein Ring, in dem jedes der vier Elemente (0, 0), (1, 0), (0, 1) und (1, 1) die Gleichung x · x = x
erfüllt.)
Definition 6.3.14 Sei V ein K-Vektorraum. Ein Teil(vektor)raum (auch Untervektorraum von V ist eine Teilmenge U von V , die bezüglich derselben Verknüpfungen, die in V
gelten, wieder ein Vektorraum ist.
6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN
161
Dazu genügt natürlich, dass U gegenüber den Verknüpfungen von V abgeschlossen ist. Und
dafür reicht das Folgende:
(1) o ∈ U, (2) u, v ∈ U ⇒ u + v ∈ U, (3)u ∈ U, λ ∈ K ⇒ λu ∈ U
Da (−1)u = −u ist folgt nämlich ‘u ∈ U ⇒ −u ∈ U ’ aus (3).
Beispiele 6.3.15 a) Wir wollen die Teilräume des Vektorraums V der Ebene E bestimmen.
Diese wollen wir auch geometrisch verstehen. Deshalb versehen wir die Ebene mit einem Ursprungspunkt O und repräsentieren die Vektoren durch Pfeile mit dem Anfang O und beschreiben sie letztendlich durch den Endpunkt dieser Pfeile. Insbesondere entspricht dabei der
Nullvektor dem Punkt O.
Natürlich sind {0} und V Teilräume von V . Das sind die trivialen Fälle.
Sei v ∈ V − {0} gegeben durch den Pfeil (O, a) mit a 6= O, entspreche also dem Punkt a. Dann
ist λv gegeben durch durch den Pfeil λ(O, a), dessen Endpunkt auf der Geraden durch O, a
liegt.
Die Menge Rv := {λv | λ ∈ R} ein Teilraum von V und die den Vektoren aus Rv entsprechenden
Punkte sind alle Punkte auf der Geraden durch O, a. Die auf diese Weise erhaltenen Teilräume
sind also die Geraden durch O.
Ferner muss jeder jeder Teilraum, der v enthält, den Teilraum Rv umfassen.
Jetzt wollen wir sehen, dass es außer den genannten keine weiteren Teilvektorräume von V gibt.
Sei U ein beliebiger Teilraum. Gibt es keinen von 0 verschiedenen Vektor in U , so ist U = {0}.
Ansonsten sei v ∈ U − {0}. Dann ist Rv ⊂ U . Angenommen U 6= Rv, dann gibt es ein w ∈ U
mit w 6= λv für alle λ ∈ R. Dann umfasst U die Vereinigung zweier verschiedener Geraden
(nachdem wir Vektoren mit Punkten identifiziert haben). Geometrisch siehst Du dann leicht,
dass jeder Vektor von der Ebene sich in der Form λv + µw mit λ, µ ∈ R schreiben lässt, also
zu U gehört. Dabei dürfen λ, µ auch negativ sein.
b) Der Vektorraum des Raumes hat genau die folgenden Teilräume. Nachdem man ihn durch
Festlegung eines Ursprungs O mit dem Raum identifiziert hat, ergeben sich folgende Teilräume:
{0} = O, die Geraden durch O, die Ebenen durch O, der ganze Raum.
6.3.16 Es sind vor allem zwei Gründe, weshalb ich mich bemüht habe, die Teilräume (Untervektorräume) eines K 2 zu bestimmen:
1. Du sollst erkennen, dass Teilräume keineswegs ‘wilde’ Teilmengen sind, sondern (z. B. für
K = R, n = 2 oder n = 3) einfachen geometrischen Gegenständen entsprechen: Punkt, Gerade,
Ebene.
2. Du sollst erst gar nicht auf die leider häufig geglaubte Idee kommen, es gäbe außer den trivialen Teilräumen des K 2 nur noch die beiden folgenden: {(a, 0) | a ∈ K} und {(0, b) | b ∈ K}.
Wir haben ja gesehen, dass der R2 unendlich viele Teilräume hat, da es in der Eben unendlich
viele Geraden durch einen Punkt gibt. Sogar der F22 hat außer den beiden trivialen noch 3
(und nicht nur 2) weitere Teilräume, nämlich: {(0, 0), (1, 0)}, {(0, 0), (1, 1)}, {(0, 0), (0, 1)}
162
KAPITEL 6. GEOMETRIE
AUFGABE
Betrachte Z2 als Teilmenge des Vektorraums R2 , der mit der Ebene identifiziert sei. Für welche
Punkte aus Z2 liegt auf ihrer Verbindungsstrecke mit dem Ursprung (0, 0) außer den Endpunkten kein weiterer Punkt aus Z2 ?
6.4
Das Skalarprodukt
Wir wollen wollen zu je zwei Vektoren v, w im Vektorraum V der Ebene (oder auch des Raumes) eine reelle Zahl als ihr sogenanntes Skalarprodukt hv, wi definieren, das sowohl von den
Längen der beiden Vektoren v und w, als auch von dem Winkel, den sie einschließen, abhängt.
(Der Name Skalarprodukt kommt daher, dass das Ergebnis des Skalarproduktes ein Skalar, d.h.
eine reelle Zahl, und kein Vektor ist. Reelle Zahlen stellt man sich auf einer ‘Skala’ vor.)
6.4.1 Wir legen in der Ebene (oder dem Raum) eine Einheitslänge (d.h. eine Längeneinheit)
fest. Jede Strecke hat dann eine reelle Zahl als Länge, die man in diesem Längenmaß ausdrücken
kann. Das gilt dann natürlich auch für gerichtete Strecken. (Man vergesse einfach die Richtung.)
Bei Parallelverschiebungändert sich die Länge nicht. Also besitzt dann jeder Vektor v in der
Ebene (Raum, Gerade) eine Länge, die ich mit |v| bezeichnen will.
Auf jeder Zahlengerade, die wir betrachten, sei dann natürlich der Abstand zwischen den Punkten 0 und 1 gleich 1.
Definition 6.4.2 Für einen Winkel α ∈ [0, π] definieren wir seinen Cosinus cos α wie folgt:
α
–1
cos α
0
1
Diese Definition ist insofern vorläufig, als wir später cos x für beliebige x ∈ R definieren werden.
Für den Cosinus werden sich dabei keine Probleme ergeben. (Traditionell schreibt man cos α
statt cos(α).)
Bemerkungen 6.4.3 a) Es gilt cos 0 = 1, cos 90◦ = cos(π/2) = 0, cos 180◦ = cos π = −1 .
b) Aus 0 ≤ α < β ≤ π folgt 1 ≥ cos α > cos β ≥ −1. Insbesondere ist die Abbildung
cos : [0, π] → [−1, 1] injektiv. Wegen des Zwischenwertsatzes ist sie auch bijektiv.
c) cos α = − cos(π − α).
d) Der Funktionsgraf sieht, wie folgt, aus:
6.4. DAS SKALARPRODUKT
163
1
0
π/3 π/2
2 π/3
π
–1
Definition 6.4.4 Mit obigen Bezeichnungen sei definiert:
Sind v, w beide vom Nullvektor verschieden, kann man von dem Winkel α sprechen, den v und
w einschließen. Dann sei ihr Skalarprodukt hv, wi definiert durch
hv, wi := |v| · |w| · cos α .
Ist v = 0 oder w = 0, so gelte dieselbe Formel mit einem beliebigen α ∈ [0, π]. In diesem Fall
ergibt sich hv, wi = 0 unabhängig von dem gewählten α.
6.4.5 Eigenschaften. a) hv, wi = hw, vi.
b) hv, vi = |v|2 .
c) hv, wi = 0 ⇐⇒ v⊥w. Dabei schreiben wir v⊥w, wenn v senkrecht auf w steht, oder einer
beiden Vektoren gleich 0 ist.
d) hv, λwi = λhv, wi.
Dies ist zunächst klar für λ ≥ 0. Ist λ < 0 und α der von v, w eingeschlossene Winkel, so ist
π − α der von v, λw eingeschlossene Winkel. Die Aussage folgt dann, da cos(π − α) = − cos α
ist.
Eine weitere Eigenschaft des Skalarproduktes ist die Folgende:
Satz 6.4.6 Seien v, w, w0 Vektoren in der Ebene (oder im Raum). Dann gilt
hv, w + w0 i = hv, wi + hv, w0 i .
Beweis:
Da im Falle v = 0 die Behauptung trivial ist, sei im Folgenden v 6= 0.
Betrachte die Vektoren als Pfeile mit einem gemeinsamen Anfangspunkt O. Lege eine Zahlengerade G so durch den Pfeil v, dass O = 0 und der Endpunkt von v gleich der Zahl |v|,
also insbesondere positiv ist. Sei p : V → G die Orthogonalprojektion. (V ist der Vektorraum
der Ebene, bzw. des Raumes.) Für einen Vektor w, der mit v den Winkel α einschließt, gilt
dann: p(w) wird durch den Pfeil (0, |w| cos α) gegeben, d.h. der Vektor p(w) entspricht als
Punkt auf der Zahlengerade G der Zahl |w| cos α, dem Produkt der letzten beiden Faktoren in
|v| · |w| · cos α = hv, w, i.
164
KAPITEL 6. GEOMETRIE
w
α
v
|v|
|w|·cos α
Da p die Eigenschaft p(w + w0 ) = p(w) + p(w0 ) hat, folgt die Behauptung des Satzes.
6.4.7 Satz des Pythagoras. Wir wählen in der Ebene eine Basis b1 , b2 mit |b1 | = |b2 | = 1
und b1 ⊥b2 , d.h. eine Orthonormalbasis. Im Raum wählen wir eine Basis b1 , b2 , b3 mit |bi | = 1
und b1 ⊥b2 ⊥b3 ⊥b1 . Dann gilt
1 für i = j
hbi , bj i = δij :=
0 für i 6= j
also
hλ1 b1 + λ2 b2 , µ1 b1 + µ2 b2 i = λ1 µ1 + λ2 µ2
(bzw. im Raum
hλ1 b1 + λ2 b2 + λ3 b3 , µ1 b1 + µ2 b2 + µ3 b3 i = λ1 µ1 + λ2 µ2 + λ3 µ3 .)
Es folgt der Satz des Pythagoras:
Theorem 6.4.8 |λb1 + µb2 |2 = λ2 + µ2 .
Ist dies wirklich der Satz des Pythagoras? Mache Dir das klar!
Im 3-dimensionalen erhält man: |λb1 +µb2 +νb3 |2 = λ2 +µ2 +ν 2 . Das Quadrat über der Diagonale
eines Quaders ist die Summe der Quadrate über den Kanten, die von einem gemeinasamen
Eckpunkt aus gehen.
Beachte, dass wir das Skalarprodukt der Vektoren λ1 b1 +λ2 b2 +λ3 b3 und µ1 b1 +µ2 b2 +µ3 b3 nicht
etwa als λ1 µ1 + λ2 µ2 + λ3 µ3 definiert haben, sondern diese Identität aus einer geometrischen
Definition des Skalarproduktes gefolgert haben!
AUFGABE
Beweise nachfolgenden Satz von Euklid als Korollar zum Satz des Pythagoras.
Sei ABC ein rechtwinkliges Dreieck mit dem rechten Winkel bei C und D der Fußpunkt der
C-Höhe, d.h. des Lotes von C auf AB. Da α und β spitz sind, liegt P zwischen A und B. Sei
s := l(AP ), t := l(BP ), h := l(CP ). Dann gilt st = h2 , sc = b2 und tc = a2 .
6.5. LINEARE ABBILDUNGEN
6.5
165
Lineare Abbildungen
Definition 6.5.1 Seien W, W 0 Vektorräume über einem Körper K. Eine Abbildung f : W →
W heißt linear, wenn folgende beiden Bedingungen erfüllt sind:
(i) f (v + w) = f (v) + f (w) und (ii) f (λw) = λf (w) für v, w ∈ W1 , λ ∈ K.
Du kannst diese Bedingungen auch zu (iii) f (λv + µw) = λf (v) + µf (w) zusammenfassen.
Bemerkungen 6.5.2 a) Ist f : W → W 0 linear und 0 der Nullvektor in W , sowie 00 derjenige
von W 0 , so gilt f (0) = 00 .
Denn es ist 0 = 0 + 0, folglich f (0) = f (0 + 0) = f (0) + f (0). Wenn man in der Gleichung
f (0) = f (0) + f (0) auf beiden Seiten −f (0) addiert, erhält man 00 = f (0). (Zu diesem Beweis
wurde nur die Eigenschaft (i) einer linearen Abbildung benutzt.)
b) Wenn f linear ist, gilt f (−v) = −f (v). Denn f (v) + f (−v) = f (v − v) = f (0) = 00 , und aus
f (v) + f (−v) = 00 folgt f (−v) = f (v).
c) Seien f : W → W 0 und g : W 0 → W 00 lineare Abbildungen von Vektorräumen. Dann ist auch
ihre Verkettung g ◦f linear.
Wenn Dir das nicht klar ist, musst Du es nachrechnen.
d) Sei f : W → W 0 eine bijektive lineare Abbildung. Dann ist auch die Umkehrabbildung
f −1 : W 0 → W linear. Seien nämlich v 0 , w0 ∈ W 0 und v, w ∈ W die eindeutig bestimmten
Elemente von W mit f (v) = v 0 , f (w) = w0 , d.h.
(∗) f −1 (v 0 ) = v, f −1 (w0 ) = w.
Da f linear ist, gilt f (λv + µw) = λf (v) + µf (w) = λv 0 + µw0 . Nach Definition von f −1 und
wegen (∗) ist also f −1 (λv 0 + µw0 ) = λv + µw = λf −1 (v 0 ) + µf −1 (w0 ).
Definitionen 6.5.3 a) Eine bijektive lineare Abbildung zwischen Vektorräumen f : W → W 0
heißt ein Isomorfismus.
b) Vektorräume W, W 0 heißen zueinander isomorf und man schreibt W ∼
= W 0 , wenn es einen
0
Isomorfismus f : W → W gibt.
Da nach obigen Bemerkungen mit f auch f −1 ein Isomorfismus ist, ist die Isomorfie (d.h. die
Eigenschaft, isomorf zu sein) ein symmetrischer Begriff, d.h. W ∼
= W 0 ⇐⇒ W 0 ∼
= W.
Da auch die Verkettung bijektiver Abbildungen wieder bijektiv ist und die Verkettung linearer
Abbldungen wieder linear ist, gilt auch die Implikation W ∼
= W 0, W 0 ∼
= W 00 =⇒ W ∼
= W 00 .
6.5.4 Versieh für n = 1, 2, 3 den n-dimensionalen Raum R mit einem Koordinaatensystem.
Betrachte den Vektorraum V dieses Raumes. Vermöge des gewählten Koordinatensystems wird
jedes v ∈ V durch ein n-tupel reeller Zahlen beschrieben. Den Inhalt des Abschnittes 6.3.9
kann man auch so ausdrücken: Die Abbildung V → Rn , die jedem geometrischen Vektor in R
das zugehörige n-tupel zuordnet, ist linear! Insbesondere ist die Abbildung V → R, die jedem
Vektor seine erste, bzw. zweite, bzw. dritte Koordinate zuordnet, linear.
166
KAPITEL 6. GEOMETRIE
6.5.5 Lineare Abbildungen und Matrizen. Sei V der Vektorraum der Ebene und sei
eine Basis (e1 , e2 ) desselben ausgewählt. Wie gerade gesehen, entspricht dann jeder Vektor von
V einem (reellen) Zahlenpaar, nämlich dem Vektor λ1 e1 + λ2 e2 das Zahlenpaar (λ1 , λ2 ) (die
Koordinaten).
Aus Gründen der Notation wollen wir dieses Zahlenpaar als ‘Spalte’ schreiben:
λ1
λ2
Ich werde die Vektor-Zahlenpaar-Entsprechung wie folgt schreiben
λ1
λ1 e1 + λ2 e2 ↔
λ2
Sei jetzt f : V → V eine lineare Abbildung mit
f (e1 ) = a11 e1 + a21 e2 ↔
f (e2 ) = a12 e1 + a22 e2 ↔
a11
a21
a12
a22
,
,
Da f durch die Bilder f (e1 ), f (e2 ) bereits bestimmt ist, wird f auch durch die Matrix
a11 a12
a21 a22
bestimmt, deren Spalten die den Vektoren f (e1 ), f (e2 ) entsprechende Zahlenpaare sind.
Welches Bild (unter f ) hat der durch das Zahlenpaar
λ1
λ2
gegebene Vektor? Durch welches Zahlenpaar wird das Bild dieses Vektors beschrieben?
Für die zu f (e1 ), f (e2 ) gehörigen Zahlenpaare gilt
a11
a12
f (e1 ) ↔
, f (e2 ) ↔
a21
a22
Nun, rechnen wir los:
f (λ1 e1 + λ2 e2 ) = λ1 f (e1 ) + λ2 f (e2 ) ←→
a11
a12
a11 λ1 + a12 λ2
λ1
+ λ2
=
a21
a22
a21 λ1 + a22 λ2
a11 a12
λ1
=
a21 a22
λ2
6.6. KREISFUNKTIONEN
167
λ
1
Bemerkung 6.5.6 Sei K ein beliebiger Körper. Wenn die Elemente des K 2 als Spalten
λ2
2
2
geschrieben werden, gilt für lineare Abbildungen f : K → K dasselbe. Sie werden in der oben
angegebenen Art durch 2 × 2 Matrizen beschrieben.
f, g
: K 2
→
K 2 lineare Abbildungen.
Und es werde
a11 a12
b11 b12
f durch die Matrix
und g durch die Matrix
beschrieben, so
a21 a22
b21 b22
b11 b12
a11 a12
wird g ◦f durch die Matrix
beschrieben.
b21 b22
a21 a22
Satz 6.5.7 Seien
Spätestens an dieser Stelle, sollte Dir klar werden, wie wichtig die Multiplikation von Matrizen
ist. Und wenn Du sie bislang etwas stiefmütterlich behandelt hast, dann . . .
Den Beweis dieses Satzes möchte ich gerne Dir überlassen. Er erfordert keine Idee, aber
sorgfältiges Rechnen.
6.6
Kreisfunktionen
Wir versehen die (euklidische) Ebene nach Wahl einer Längeneineit mit einem orthonormalen
Koordinatensystem, so dass die Punkte (1, 0) und (0, 1) eine Längeneinheit vom Ursprung
(Nullpunkt) entfernt sind. Der Kreis um (0, 0) vom Radius 1 geht dann durch die Punkte
(1, 0), (0, 1), (−1, 0), (0, −1). Wir denken uns einen Punkt, der abhängig von der Zeit t ∈ R
den Kreis mit der (gleichbleibenden) (Absolut-)Geschwindigkeit 1 in der im Bild angedeuteten
Richtung durchläuft und sich zum Zeitpunkt 0 beim Punkt (1, 0) befindet.
(0, 1)
(cos t, sin t)
(0, sin t)
(–1, 0)
t
(cos t, 0)
(1, 0)
(0, –1)
Definition 6.6.1 Die Koordinaten des Punktes zum Zeitpunkt t werden mit cos t und sin t
bezeichnet. D.h., wenn γ : R → R2 den Weg unseres Punktes beschreibt, ist γ(t) = (cos t, sin t).
168
KAPITEL 6. GEOMETRIE
Wohlgemerkt, wir nehmen diese Beschreibung als Definition von sin t, dem Sinus von t, und
cos t, dem Cosinus von t. Selbstverständlich ist dann der Einheitskreis der parametrisierte Weg
(cos t, sin t), wie er in dem Kapitel 7 Abschnitt 4 definiert werden wird. Aber die Definition
geht von der Geometrie, nicht von der Analysis aus. Natürlich ist die Zeit nicht auf die Werte
0 ≤ t ≤ 2π beschränkt! (Wie oben bezeichnen wir mit π die Länge der halben Einheitskreislinie.)
6.6.2 Offensichtlich haben die beiden Funktionen cos und sin die Periode 2π. D.h. es ist cos(x+
2π) = cos x und sin(x+2π) = sin x. Bachte, dass innerhalb einer Periode etwa auf dem Intervall
[0, 2π[ bis auf die Werte ±1 jeder Wert vom Sinus, wie auch vom Cosinus zweimal angenommen
wird.
Wir haben folgende speziellen Funktionswerte:
−π −π/2 0 π/2 π 3π/2
t
cos t −1
0
1 0 −1
0
−1 0 1
0
−1
sin t 0
Hieraus erkennt man auch, dass die Funktionen sin und cos keine kleinere Periode als 2π haben.
D.h. gilt sin t = sin(t+a) für alle t ∈ R, so ist a ein ganzzahliges Vielfaches von 2π; und dasselbe
stimmt auch für den Cosinus.
Bemerkung 6.6.3 Beachte bitte, dass wir oben in Definition 6.4.2 Winkel zwischen zwei Halbgeraden und damit zwischen zwei (von 0 verschiedenen) geometrischen Vektoren unabhängig
von deren Reihenfolge betrachtet haben. Hier wird hingegen ein Winkel als Länge eines gerichteten Weges auf dem Einheitskreis betrachtet, der als negativ betrachtet wird, wenn er im
Uhrzeigersinn durchlaufen wird. Da cos(−α) = cos α ist, betrifft dieser Unterschied lediglich
den Sinus.
6.6.4 Wichtige lineare Abbildungen sind Drehungen um den Ursprung:
Wenn (e1 , e2 ) eine Basis des Vektorraums V der Ebene ist und die lineare Abbildung fα : V → V
so definiert ist, dass sie die Vektoren e1 , e2 um denselben Winkel (in dieselbe Richtung) α um
O dreht, tut sie das offenbar mit jedem Vektor.
α
α
α
6.6. KREISFUNKTIONEN
169
Wir wählen ein Einheitslängenmaß und setzen jetzt voraus, dass (e1 , e2 ) bezüglich dieser
Längeneinheit eine orthonormale Basis ist. Dann gilt für die oben beschriebene Drehung f
fα (e1 ) = cos(α) · e1 + sin(α) · e2 und fα (e1 ) = − sin(α) · e1 + cos(α) · e2
Aufgefasst als Spalten – bzgl. der Basis (e1 , e2 ) – gilt also für fα (e1 ), fα (e2 ):
cos α
− sin α
fα (e1 ) =
, und fα (e2 ) =
.
sin α
cos α
Das bedeutet, dass fα bezüglich der Basis (e1 , e2 ) durch die Matrix
cos α − sin α
sin α cos α
beschrieben wird.
Diese Erkenntnis ermöglicht es, ganz einfach Formeln für sin(α + β) und cos(α + β) anzugeben.
Satz 6.6.5 Es gelten die Formeln:
cos(α + β) = cos α · cos β − sin α · sin β,
sin(α + β) = sin α · cos β + cos α · sin β .
Beweis: Die Drehung um α + β kann man auch dadurch erreichen, indem man zunächst um
β, danach um α dreht. D.h. fα+β = fα ◦fβ . Für Matrizen bedeutet dies
cos(α + β) − sin(α + β)
cos α − sin α
cos β − sin β
=
=
sin(α + β) cos(α + β)
sin α cos α
sin β cos β
cos α cos β − sin α sin β − sin α cos β − cos α sin β
sin α cos β + cos α sin β cos α cos β − sin α sin β
Ein Vergleich der Einträge beweist den Satz.
Folgerung 6.6.6 a) sin 2α = 2 sin α cos α, cos 2α = cos2 α−sin2 α = 1−2 sin2 α = 2 cos2 α−1
b) sin(α + β) sin(α − β) = sin2 α − sin2 β
Hier ist sin 2α = sin(2α), sin2 α = (sin α)2 usw.
Beweis:
Nur b) ist zu zeigen.
b) sin(α + β) sin(α − β) = (sin α cos β + cos α sin β)(sin α cos β − cos α sin β) = sin2 α cos2 β −
cos2 α sin2 β = sin2 α(1 − sin2 β) − (1 − sin2 α) sin2 β = sin2 α − sin2 β.
Satz 6.6.7 Sinussatz. In einem Dreieck mit den Seitenlängen a, b, c, den Winkel(größe)n
α, β, γ, (wo wie gewohnt a und α einander gegenüber liegen usw.) und dem Umkreisradius
r gilt
b
c
a
=
=
= 2r
sin α
sin β
sin γ
170
KAPITEL 6. GEOMETRIE
Beachte, dass für einen Dreieckswinkel ϕ, der ja 0 < ϕ < π erfüllt, der Wert sin ϕ positiv ist.
Deshalb sind die obigen Nenner nicht Null.
Beweis:
Es ist
b sin α = hc = a sin β
C
γ
b
α
A
a
hc
β
B
c
Das beweist auf einfache Weise die ersten beiden Gleichheiten.
Die dritte sieht man mit Hilfe des Satzes über die Winkel im Kreis (??).
C
γ
r
A
γ γ
B
Hieraus folgen natürlich auch die ersten beiden Gleichheiten.
Satz 6.6.8 Cosinussatz. In einem Dreieck gilt (mit den üblichen Bezeichnungen)
a2 + b2 − 2ab cos γ = c2
Beweis: (Wir verwenden die schulmäßigen Bezeichnungen: A, B, C seinen die Eckpunkte
eines Dreiecks, a die Seite, die A gegenüber liegt, und auch ihre Länge, usw., ferner α, β, γ die
Innenwinkel und deren Größen, wobei α der Winkel bei A ist usw.)
~ CA,
~ bzw. AB
~ die durch die Pfeile (C, B), (C, A), bzw. (A, B)
Betrachte die Vektoren CB,
~ = CB
~ − CA.
~
gegeben werden; sie haben die Längen a, b,bzw. c. Es ist AB
~ 2 = hCB
~ − CA,
~ CB
~ − CAi
~ = a2 + b2 − 2ab cos γ.
Dann rechne c2 = |AB|
6.7. DER SATZ VON MORLEY
171
AUFGABE
Betrachte die Erde als perfekte Kugel mit dem Radius 6366 km. (Diese Länge, die man sich
verhältnismäßig leicht merken kann, ist kleiner als der Radius des Äquators und größer als der
halbe Abstand der Pole. Die Erde ist nicht wirklich eine Kugel, auch wenn man von kleinen
Unregelmäßigkeiten, wie dem Himalaja absieht.) Denke Dir eine Eisenbahnlinie von 10 km (20
km) Länge, die vollkommen gerade ist, also auch nicht der Erdkrümmung folgt (d.h. im Innern
der idealen Erdkugel verläuft, so dass man einen Graben oder gar einen Tunnel für die Bahn
anlegen muss.) Sie soll an einem Punkt der Erdoberfäche beginnen und an einem solchen enden.
Wie tief verläuft sie an der tiefsten Stelle unter der Erdoberfäche.
6.7
Der Satz von Morley
C
γ γ γ
A’
B’
A
α
α
α
C’
β
β
β
B
Satz 6.7.1 Bringt man die jeweils benachbarten Drittellinien der Winkel eines beliebigen Dreiecks zum Schnitt, so bilden die drei erhaltenen Schnittpunkte ein gleichseitiges Dreieck.
Beweis: Gilt die Behauptung des Satzes für ein Dreieck, so gilt sie auch für alle ähnlichen
Dreiecke. Kann man also zu je drei (positiven) Winkeln, deren Summe π ist, ein Dreieck mit
diesen Winkeln konstruieren, dessen Morley-Dreieck gleichseitig ist, so ist der Satz richtig.
Seien α, β, γ drei positive Winkel mit 3α+3β +3γ = π. Wir haben ein Dreieck mit den Winkeln
3α, 3β, 3γ zu konstruieren, dessen Morley-Dreieck gleichseitig ist.
Zur Abkürzung setzen wir ϕ+ := ϕ + π3 für jeden Winkel ϕ. Dann sind z.B. α, β + , γ + die drei
Winkel eines Dreiecks, d.h. ihre Summe ist π.
172
KAPITEL 6. GEOMETRIE
C
+ β+
A’
B’ α
+
+
γ
γ
β+
α+
C’
A
B
Sei A0 B 0 C 0 ein gleichseitiges Dreieck der Seitenlänge 1. (Dies bedeutet eine Längeneinheit, die
man natürlich willkürlich wählen darf. Nur musst Du sie innerhalb des Beweises beibehalten.)
Über den drei Seiten dieses Dreiecks konstruieren wir Dreiecke AB 0 C 0 , BC 0 A0 und CA0 B 0 , derart
dass A und A0 (bzw. B und B 0 , bzw. C und C 0 ) auf verschiedenen Seiten der Geraden durch
B 0 , C 0 (bzw. C 0 , A0 , bzw. A0 , B 0 ) liegen, mit den in der Zeichnung angegebenen Winkeln. (Bitte
beachte genau, welche Winkel wo angegeben sind! Z.B. hat der Winkel des Dreiecks AC 0 B 0 bei
C 0 die Größe β + und der bei B 0 desselben Dreiecks die Größe γ + – und nicht etwa umgekehrt!)
Wir behaupten: A0 B 0 C 0 ist das Morley-Dreieck des Dreiecks ABC. Dazu genügt es zu zeigen,
dass z.B. ∠C 0 AB = α ist. Denn für die weiteren Winkel ∠CAB 0 usw. gilt aus Analogiegründen
das entsprechende.
Wir betrachten das Dreieck ABC 0 . Bezeichne ∠C 0 AB mit α, und ∠C 0 BA mit β. Ferner sei u
die Länge der Strecke AC 0 und v die der Strecke BC 0 .
C
B’
γ+
A
α
α’
u
β+
A’
γ+
α+
C’
v
β’
β
B
Der Winkel ∠AC 0 B berechnet sich zu 2π − π/3 − β + − α+ = π − β − α = γ + 2π/3, folglich ist
α + β + γ + 2π/3 = α + β + γ + 2π/3, also α + β = α + β.
Dann rechnen wir durch Anwendung des Sinus-Satzes auf drei Dreiecke
sin α
v
sin γ + / sin β
sin α
= =
=
+
u
sin γ / sin α
sin β
sin β
6.8. EULERGERADE UND FEUERBACHKREIS
173
Wir bemerken: Die vier Winkel α, α, β, β liegen alle in dem Intervall ]0, π/3]. Denn es ist α, β <
α + β + γ = π/3, und α, β < α + β = α + β < α + β + γ = π/3. Auf diesem Intervall, sogar auf
[0, π/2], ist die Sinusfunktion streng monoton wachsend und positiv.
Aus den beiden bisher bewiesenen Gleichungen
sin α
sin α
=
sin β
sin β
und α + β = α + β
können wir deshalb ableiten, dass α = α (und β = β) ist.
Denn wäre etwa α > α, so würde die erste Gleichung β > β, die zweite hingegen β < β
implizieren. Analoges gilt im Falle α < α.
6.8
Eulergerade und Feuerbachkreis
Sei ABC ein Dreieck. Das Mittendreieck dieses Dreiecks ist das Dreieck A0 B 0 C 0 , wo A0 der
Mittelpunkt der Seite BC und B 0 derjenige von CA und C 0 derjenige von AB ist.
C
B’
A
A’
C’
B
Bemerkungen 6.8.1 Mit obigen Bezeichnungen gilt:
a) A0 B 0 (bzw. B 0 C 0 , bzw. C 0 A0 ) ist parallel zu AB (bzw. BC, bzw. CA) und halb so lang.
b) Die seitenhalbierenden Geraden von ABC sind dieselben wie die von A0 B 0 C 0 , wobei die
Seitenhalbierende durch A von ABC auch durch A0 geht, usw. Insbesondere haben ABC und
A0 B 0 C 0 denselben Schwerpunkt S.
Dies folgt wie a) aus dem Strahlensatz und seiner Umkehrung.
c) Die Mittelsenkrechte von AB ist die Höhengerade von A0 B 0 C 0 durch C 0 , usw. Also ist der
Höhenschnittpunkt von A0 B 0 C 0 der Umkreismittelpunkt U von ABC.
174
KAPITEL 6. GEOMETRIE
d) Das Dreieck A0 B 0 C 0 entsteht aus dem Dreieck ABC durch Drehung um S um 180o und
Halbierung aller Abstände von S. Es handelt sich also hier um eine Ähnlichkeitsabbildung, d.h.
eine Abbildung der Ebene auf sich, die ein Dreieck immer in ein ähnliches Dreieck abbildet.
Wenn man also den Höhenschnittpunkt H von ABC am Punkt S spiegelt und einen Punkt K
erhält, so ist der Höhenschnittpunkt H 0 von A0 B 0 C 0 der Mittelpunkt der Strecke SK. D.h H 0
liegt auf der Geraden HS auf der anderen Seite von S und ist von S halbsoweit entfernt wie
H. Nach c) gilt aber H 0 = U .
C
H
B’
A’
S=S’
H’=U
A
C’
B
Es folgt also
Satz 6.8.2 (Euler) In einem Dreieck ABC liegen Höhenschnittpunkt H, Schwerpunkt S und
Umkreismittelpunkt U in dieser Reihenfolge auf einer Geraden. Für die Streckenlängen gilt
l(HS) : l(SU ) = 2 : 1. (Ist das Dreieck gleichseitig, fallen diese drei Punkte zusammen. Die
Aussage des Satzes ist dann leer. Überlege Dir: Wenn in einem Dreieck der Umkreismittelpunkt
mit dem Schwerpunkt zusammenfällt, ist das Dreieck gleichseitig.)
Definition 6.8.3 Die Gerade, auf welcher Höhenschnittpunkt, Schwerpunkt und Umkreismittelpunkt eines nicht gleichseitigen Dreiecks liegen, heißt seine Eulergerade.
Bemerkungen 6.8.4 a) Ist ABC gleichschenklig (aber nicht gleichseitig), so ist die Symmetrieachse die Eulergerade.
b) Ist ABC rechtwinklig mit γ = 90o , so ist die Seitenhalbierende s durch C die Eulergerade.
Denn der Höhenschnittpunkt ist der Punkt C und der Schwerpunkt liegt auf s.
c) Sei ABC rechtwinklig, aber nicht gleichschenklig, so fallen die Eulergerade, d.h. die Seitenhalbierende s durch C und die Winkelhalbierende w durch C nicht zusammen, da letztere die
Seite AB im Verhältnis b/a 6= 1/1 teilt. Da aber der Inkreismittelpunkt nicht der Schnittpunkt
C von w und s sein kann, liegt zumindest in diesem Fall der Inkreismittelpunkt nicht auf der
Eulergeraden.
6.8. EULERGERADE UND FEUERBACHKREIS
175
Bemerkungen 6.8.5 Mit den obigen Bezeichnungen gilt:
a) Sei U 0 der Umkreismittelpunkt von A0 B 0 C 0 . Dann liegt U 0 auf der Geraden U S, der Eulergeraden, auf der U gegenüberliegenden Seite von S und ist halbsoweit von S entfernt wie
U . Gemäß der ‘berühmten’ Identität 31 + 16 = 12 ist er also der Mittelpunkt der Strecke U H.
Durch U geht die Mittelsenkrechte von AB, d.h. die Senkrechte auf AB durch C 0 . Durch H
geht die dazu parallele Höhe von ABC durch C. Der Kreis um U 0 durch A0 geht also auch
durch den Fußpunkt der Höhe durch C. Dieser Kreis, der Feuerbachkreis geht also durch die
Seitenmittelpunkte und die Höhenfußpunkte von ABC.
Eulergerade
C’
B
A
H
U’
FeuerbachKreis
U=H’
B’
A’
C
b) Nun bringen wir die Gerade C 0 U 0 mit der Höhengeraden von ABC durch C zum Schnitt, der
von dem Fußpunkt der Höhe verschieden ist. Der Schnittpunkt heiße D. Die Dreiecke U 0 U C 0 und
U 0 HD sind kongruent. Denn die Strecken U 0 U und U 0 H sind gleichlang, die Winkel bei U 0 sind
gleichgroß, ebenso die bei H bzw. U . Folglich gilt l(A0 U ) = l(DH). Da wir schon wissen, das die
Strecke C 0 U halb so groß ist wie CH – sie korrespondieren bei der Mittendreieck-Korrespondenz
– ist D der Mittelpunkt von CH. Ferner folgt aus obiger Kongruenz l(U 0 D) = l(U 0 C 0 ). Somit
geht der Feuerbachkreis durch die Mittelpunkte der Strecken CH, AH und BH. (Mit l(DE)
wurde die Länge der Strecke CD bezeichnet.)
c) Ohne Beweis zitiere ich: Der Feuerbachkreis berührt den Inkreis und die Ankreise.
176
KAPITEL 6. GEOMETRIE
Kapitel 7
Differenzial- und Integralrechnung
7.1
Differenzieren
Wie im Kapitel über die Geometrie verzichte ich auch hier bewusst auf die größtmögliche
Präzision. Ich möchte nämlich nicht, dass Du Dich in einem unübersichtlichen Wust kleinteiliger Beweise verfängst, sondern zunächst einmal die großen Linien kennenlernst. Im Studium
wirst Du dann, hoffentlich mit Genuss, erkennen, dass man alles auch ohne Appellation an die
Anschauung (die ja möglicherweise nicht für alle dieselbe ist) rein logisch beweisen kann.
Hier werde ich es z.B. als anschaulich klar ansehen, dass eine Funktion, die auf einem Intervall
die (konstante) Ableitung 0 hat, dort konstant ist. Ebenso werde ich nicht beweisen, dass eine
Funktion, deren Ableitung auf einem Intervall I positiv ist, dort auch streng monoton wachsend
ist, d.h. dass aus x, y ∈ I und x < y die Ungleichung f (x) < f (y) folgt. So werde ich auch den
Zwischenwertsatz als anschaulich klar ansehen. Dieser besagt ja, dass eine auf einem Intervall
I stetige Funktion f zwischen zwei Punkten x1 , x2 ∈ I alle Werte zwischen f (x1 ) und f (x2 )
annimmt. Solltest Du mein Vorgehen als unbefriedigend empfinden, so kannst Du die exakten
Beweise im Buch von Forster (z.B.) nachlesen oder sie selber finden.
Wahrscheinlich wirst Du bereits wissen, was das Differenzieren bzw. die Ableitung einer Funktion bedeuten. Wegen der Wichtigkeit dieser Begriffe wollen wir sie hier ausführlich besprechen.
7.1.1 Die einfachsten Funktionen sind die Polynome vom Grad ≤ 1, auch lineare Funktionen
genannt, also solche von der Art
f : R → R, f (x) = ax + b,
wo a, b feste reelle Zahlen sind. (Zu ihnen gehören auch die konstanten Funktionen, wo a = 0
ist.)
Oben haben wir lineare Abbildungen von Vektorräumen definiert. Wenn man R als RVektorraum betrachtet, so ist die Abbildung x 7→ ax + b nur dann linear als Abbildung von
Vektorräumen, wenn b = 0 ist. Hier wollen wir aber unter einer linearen Funktion allgemein
ein Polynom vom Grad ≤ 1 auffassen.
177
178
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Wenn x0 , x1 verschiedene reelle Zahlen sind, gilt für ein solches f immer
f (x1 ) − f (x0 )
f (x0 + h) − f (x0 )
= a, d.h. für h 6= 0 ist
=a.
x1 − x0
h
1
2
f(x) = — x + 1
3
f(x1)–f(x0)
2
x1–x0
1
0
1
x0 2
3 x1 4
5
6
Der Graph einer solchen Funktion ist eine Gerade. Aber nicht alle Geraden in der ‘(x, y)’-Ebene
sind Graphen solcher Funktionen. Nämlich, für beliebiges c ∈ R ist die Gerade, die durch die
Gleichung x = c gegeben wird, nicht der Graph einer Funktion (von x)! (Warum?)
Man nennt den Koeffizienten a der Funktion f (x) = ax + b die Steigung dieser Funktion. Ist
x0 ∈ R und betrachten wir die Werte an der Stelle x0 und x0 + h, so ist f (x0 + h) = f (x0 ) + ah.
D.h. wächst der ‘x-Wert’ um h, so wächst der Funktionswert um ah. Die Steigung ist also ein
Maß für das Wachstum. (Beachte, dass a bzw. h selbstverständlich auch negativ sein dürfen,
das Wort ‘wachsen’ hier also auch ‘kleiner werden’ bedeuten kann.)
Angenommen, ein Auto fährt entlang einer (geraden) Straße, in der Weise, dass es sich im
Zeitpunkt t bei ‘Kilometer’ at + b befindet. Dann hat a die Bedeutung der Geschwindigkeit
dieses Autos, die in diesem Fall konstant ist.
Differenzieren bedeutet, auch einer komplizierteren Funktion in einem beliebigen Punkt ihres
Graphen eine Steigung zuzuordnen.
Diese lokale Steigung in x0 einer Funktion f , die wir die Ableitung von f in x nennen, soll
folgendes leisten:
1.) Sie soll die Steigung der vernünftig definierten Tangente (die ja eine Gerade ist) an den
Funktionsgraphen im Punkte (x0 , f (x0 )) sein.
2.) Sie soll bestmöglich eine angenäherte Berechnung von f (x) in der Nähe von x0 durch eine
lineare Funktion erlauben.
3.) Sie soll die Momentangeschwindigkeit angeben, mit der sich ein Punkt (auf einer Geraden)
bewegt, wenn der Ort des Punktes im Zeitpunkt t durch f (t) gegeben wird.
Die Ableitung einer Funktion f im Punkte x0 ist also ein Maß dafür, wie und wie stark die
Funktion f im Punkt x0 variiert. Das hört sich zunächst etwas verrückt an, da die Funktion ja
7.1. DIFFERENZIEREN
179
im Punkte x0 den Wert f (x0 ) hat. Was soll da variieren? Aber man kann ja für x ‘in der Nähe
von x0 ’ die Veränderung f (x) − f (x0 ) zur Differenz x − x0 ins Verhältnis setzen, d.h. den sog.
Differenzenquotienten
f (x) − f (x0 )
x − x0
betrachten und dann beobachten, welchem Wert (wenn es denn einen solchen gibt) sich dieser
Quotient nähert, wenn x gegen x0 geht.
f(x) = x 3 – 5x 2 + 6x + 1
4
3
2
1
1
2
3
4
Beispiel 7.1.2 Wir betrachten als Beispiel die Funktion f (x) = x3 − 5x2 + 6x + 1 und werden
diese in der Nähe des Punktes x0 = 3 genauer betrachten. (Du darfst natürlich dasselbe für
die einfachere Funktion f (x) = x3 machen, wodurch das Ganze sicher übersichtlicher wird.)
Gleichzeitig wollen wir die physikalische Bedeutung der Ableitung als Momentangeschwindigkeit
der Funktion des Ortes in Abhängigkeit von der Zeit begreiflich machen. Wir denken uns einen
kleinen (am besten punktförmigen) Wagen auf einer geraden Straße (der Breite 0, wenn man
will) der zum Zeitpunkt 0 sich bei bei Meter 1 befindet und zum Zeitpunkt x sec bei Meter
x3 − 5x2 + 6x + 1. Ihr oben gezeichneter Graph macht diesen Zusammenhang deutlich. Beachte,
dass das Auto zwischendurch auch mal zurückfährt.
Wir fragen: Wie groß ist die Durchschnittsgeschwindigkeit zwischen den Zeitpunkten 3 sec und
5 sec? Nun f (3) = 1, f (5) = 31. Deshalb fährt das Auto zwischen diesen beiden Zeitpunkten
insgesamt 30 m, d.h. die Durchschnittsgeschwindigkeit ist 15 m/sec.
Wieviel beträgt sie zwischen den Zeitpunkten 3 sec und 4 sec? Nun, es ist f (3) = 1, f (4) =
9. Also fährt das Auto zwischen den Zeitpunkten 3 sec und 4 sec insgesamt 8 m. und die
Durchschnittsgeschwindigkeit ist 8 m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,5 sec? Nun es ist f (3) = 1, f (3,5) = 3,625,
also die Durchschnittsgeschwindigkeit 5,25(= 2,625/0,5) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,1 sec? Nun es ist f (3) = 1, f (3,1) = 1,341,
also die Durchschnittsgeschwindigkeit 3,41 m/sec (= 0,341/0,1) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,01 sec? Nun es ist f (3) = 1, f (3,01) =
1,030401, also die Durchschnittsgeschwindigkeit 3,0401(= 0,030401/0,01) m/sec.
Wie groß ist sie zwischen den Zeitpunkten 2,99 sec und 3 sec? Nun es ist f (2,99) =
1 − 0,029601, f (3) = 1, also die Durchschnittsgeschwindigkeit 2,9601 m/sec.
180
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Kann man von der Augenblicksgeschwindigkeit im Zeitpunkt 3 sec sprechen?
Als Praktiker würde man doch sagen: Ja, etwa 3 m/sec. Und das ist auch sinnvoll und für die
Praxis meist hinreichend.
Wir Theoretiker sehen es im Prinzip ganz ähnlich. Der Praktiker berechnet ja den folgenden
Differenzenquotienten
f (x0 + h) − f (x0 )
(mit x0 = 3 im obigen Beispiel)
h
für (positive oder negative) Zahlen h, die so richtig nahe bei 0 liegen, aber von 0 verschieden
sind. (0/0 zu berechnen, fällt auch dem Praktiker schwer! Ich kann mir nicht vorstellen, dass
Du dies in jedem Fall gleich 1 setzen würdest, nachdem du unser obiges Beispiel studiert hast.)
Der Theoretiker wird nun ‘einfach’ die Augenblicksgeschwindigkeit im Zeitpunkt x0 durch
f (x0 + h) − f (x0 )
h→0
h
lim
definieren, wobei zu beachten ist, das der Differenzenquotient für h = 0 nicht definiert ist,
also zur Berechnung nur Nullfolgen (hn )n betrachtet werden, deren Glieder sämtlich 6= 0 sind.
(Andererseits steht nirgendwo geschrieben, dass hn > 0 sein muss!)
Und da die Theoretiker auch ein paar knackige Regeln entwickeln werden, solche Grenzwerte
zu berechnen, können sie damit auch dem Praktiker höchst hilfreich sein.
Allein den entsprechenden Limes für unsere spezielle Funktion f in dem Punkte x0 = 3 auszurechnen, scheint mir schon einfacher als die oben gemachten approximativen Berechnungen:
f (x0 + h) − f (x0 )
(3 + h)3 − 5(3 + h)2 + 6(3 + h) − 33 + 5 · 32 − 6 · 3
= lim
h→0
h→0
h
h
lim
(27 + 27h + 9h2 + h3 ) − (45 + 30h + 5h2 ) + (18 + 6h) − 27 + 45 − 18
h→0
h
2
= lim (27 + 9h + h − 30 + h + 6) = 3.
= lim
h→0
Wie gesagt, es geht noch einfacher, und nicht nur für einzelne Punkte x0 . Du weißt das sicher
aus dem Schulunterricht, und hier wird es auch bald behandelt.
Definition 7.1.3 Sei D ein Intervall, x0 ∈ D und f : D → R eine Funktion. Wir definieren
die Ableitung oder Differenzialquotienten f 0 (x0 ) von f in x0 durch
f (x0 + h) − f (x0 )
f (x) − f (x0 )
= lim
x→x0
h→0
h
x − x0
f 0 (x0 ) := lim
wobei die beiden Limiten offenbar dieselben sind. (Natürlich muss dieser Limes nicht in jedem
Fall existieren!)
Ferner heißt f in x0 differenzierbar, wenn o.a. Limes existiert, genauer als reelle Zahl existiert. Die Limiten ±∞ wollen wir vorsichtshalber nicht als Ableitung zulassen!
7.1. DIFFERENZIEREN
181
7.1.4 Es ist keineswegs jede Funktion differenzierbar, z.B. nicht die Funktion, die für alle
rationalen x den Wert 1 und für die irrationalen x den Wert 0 annimmt. Diese ist überall
unstetig, und deshalb auch nirgendwo differenzierbar, wie Du gleich sehen wirst. Aber auch die
Funktion f (x) = |x| ist in 0 nicht differenzierbar. Allerdings gibt es dort eine links- und eine
rechtsseitige Ableitung. Was meine ich wohl damit?
Bei folgender (stetigen) Funktion gibt es in 0 nicht einmal diese:
1
für x 6= 0, f (0) = 0.
f : R → R, f (x) := x · sin
x
Überlege das schon einmal, wenn Du magst. Im 4. Abschnitt erfährst Du mehr hierzu.
Man kann sogar Funktionen konstruieren, die überall stetig, aber nirgendwo differenzierbar
sind.
7.1.5 Um zu sehen, dass jede in a differenzierbare Funktion f dort auch stetig ist, betrachte
eine Folge (xn )n∈N im Definitionsbereich von f , die gegen a konvergiert und xn 6= a für alle n
erfüllt. Da nach Voraussetzung die Folge
f (xn ) − f (a)
xn − a
n∈N
konvergiert, ist sie beschränkt, d.h. es gibt ein s mit
|f (xn ) − f (a)|
< s, also |f (xn ) − f (a)| < s|xn − a| für alle n.
|xn − a|
Man sieht dann leicht, dass limn→∞ f (xn ) = f (a) aus limn→∞ xn = a folgt.
7.1.6 Approximation, Tangente. Man kann die Ableitung einer Funktion f in einem Punkt
x0 ihres Definitionsbereiches auch anders beschreiben. Man kann sich fragen, wie man f in der
Nähe von x0 am besten durch eine lineare Funktion aproximieren kann, also
f (x0 + h) = f (x0 ) + c · h + ϕ(h)
schreiben kann, wobei der Korrekturterm ϕ ‘mit größerer Beschleunigung als h gegen 0 geht’.
Damit meine ich, dass
ϕ(h)
=0
lim
h→0 h
ist. Nun kann man die Gleichung 7.1.6 folgendermaßen umformen
ϕ(h)
f (x0 + h) − f (x0 )
=
−c
h
h
so dass
ϕ(h)
f (x0 + h) − f (x0 )
= 0 ⇐⇒ lim
=c
h→0 h
h→0
h
gilt. Es ergibt sich folgender
lim
182
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Satz 7.1.7 Die Funktion f ist in x0 genau dann differenzierbar und hat dort die Ableitung
f 0 (x0 ) = c, wenn sich f folgendermaßen schreiben lässt
ϕ(h)
= 0.
h→0 h
f (x0 + h) = f (x0 ) + c · h + ϕ(h) mit lim
Der Graph der Funktion g(x) = f (x0 ) + c · (x − x0 ) ist dann eine Gerade, die durch den
Punkt (x0 , f (x0 )) läuft und nahe x0 den Graphen der Funktion besser als linear, d.h. besser
als jede andere Gerade approximiert, also ihn in (x0 , f (x0 )) ‘berührt’ – d.h. die sogenannte
Tangente an den Graphen von f in diesem Punkt ist. (Wir wollen die Tangente an den
Graphen einer Funktion in einem Punkt schlicht auf diese Weise formal definieren. Es gibt
allerdings Tangenten an Graphen√von Funktionen, die
√ so nicht erfasst werden können. Z.B. hat
der Graph der Funktion f (x) = 3 x (auch g(x) = x) im Nullpunkt eine sinnvolle Tangente,
nämlich die ‘y-Achse’, ohne dass diese Funktion dort differenzierbar wäre. Wenn überhaupt
hätte dort die Ableitung den Wert ∞, den wir aber bei der Definition der Differenzierbarkeit
als Wert√der Ableitung bewusst ausgeschlossen haben. Ähnlich verhält es sich mit der Funktion,
f (x) = 1 − x2 , deren Graph ein Halbkreis ist, bei x = ±1.)
7.1.8 Das Differenzieren einer Funktion ist längst nicht so spannend, wenn man es nur in
einzelnen Punkten, als wenn man es in allen Punkten oder wenigstens den meisten Punkten des
Definitionsbereiches macht. Und wie Du vielleicht schon weißt, geht das bei vielen Funktionen
gut, z.B. bei Polynomfunktionen, oder Quotienten von solchen, dort, wo sie definiert sind. Ist
eine Funktion f : D → R auf einer Teilmenge D0 ihres Definitionsbereiches D differenzierbar, so
ist f 0 (x) für jedes x ∈ D0 definiert, mit anderen Worten, wir haben eine Abbildung f 0 : D0 → R,
die Ableitung von f .
Beispiele 7.1.9 a) Seien a, b ∈ R und f : R → R definiert durch f (x) := ax + b, so ist f
überall differenzierbar und hat die konstante Ableitung f 0 (x) = a. Du wirst keine Schwierigkeit
haben, das zu zeigen. (Es wäre ja auch saublöd, wenn eine lineare Funktion mit der Steigung a
nicht in jedem Punkt die Steigung a hätte.) Übrigens ist jede Funktion, die auf einem Intervall
überall die konstante Ableitung a hat, von der Form f (x) = ax + b. Dies ist allerdings nicht
trivial, soll aber hier als anschaulich klar angesehen werden.
b) Ein Beispiel, wo die Ableitung einer Funktion f nicht auf dem ganzen
Definitionsbereich
√
3
von f definiert ist, ist die bereits oben betrachtete Funktion f (x) = x. Hier ist D = R und
D 0 = R∗ .
7.2
Berechnungsmöglichkeiten von Ableitungen
Wir beginnn jetzt damit, für recht viele Funktionen zu zeigen, dass sie differenzierbar sind, und
gleichzeitig einfache Regeln zur Berechnung ihrer Ableitungen anzugeben. Ohne diese Regeln
wäre die Differenzialrechnung nicht halb so wichtig und berühmt, wie sie ist!
Wir benötigen dafür folgende fast selbstverständlichen Definitionen.
7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN
183
Definitionen 7.2.1 Seien f, g : D → R Funktionen und a ∈ R, so wird af , bzw. f + g, bzw.
f g durch (af )(x) := a(f (x)), bzw. (f + g)x = f (x) + g(x), bzw. (f g)(x) = f (x)g(x) für alle
x ∈ D definiert.
Ist D0 ⊂ D die Menge aller x mit g(x) 6= 0, dann definieren wir für alle x ∈ D0 die Funktion
f
f (x)
f
durch (x) =
.
g
g
g(x)
Achtung: Unterscheide zwischen dem Produkt f g und der Verkettung (Hintereinander1
ausführung) f ◦g ! Und verwechsle auch nicht f (x)
mit der Umkehrfunktion f −1 !
Satz 7.2.2 Seien a, b ∈ R und f, g : D → R auf D differenzierbare Funktionen, wobei D eine
Vereinigung von Intervallen positiver Länge ist. Dann gilt:
a) Die Funktion af + bg ist auf D differenzierbar und es ist (af + bg)0 = af 0 + bg 0 . (Man kann
dies auch in zwei Regeln aufteilen: f + g und af sind differenzierbar und haben die Ableitungen
f 0 + g 0 , bzw. af 0 .)
b) Produktregel: Die Funktion f g ist auf D differenzierbar und es ist (f g)0 = f 0 g + g 0 f .
(Vorsicht! Fast immer ist (f g)0 6= f 0 g 0 .)
c) Quotientenregel: Sei D0 die Menge
wo g(x) 6= 0 ist. Dann ist die Funktion
0 aller0 x ∈ D,
0
f
f
f
g
−
g
f
auf D0 differenzierbar und es gilt
=
.
g
g
g2
Beweis:
Den Beweis von a) überlasse ich Dir.
b) Wir benutzen die beliebte Umformung
ab − a0 b0 = ab − a0 b + a0 b − a0 b0 = (a − a0 )b + a0 (b − b0 ) und rechnen:
f (x + h)g(x + h) − f (x)g(x)
=
h→0
h
f (x + h)g(x + h) − f (x)g(x + h)
f (x)g(x + h) − f (x)g(x)
lim
+ lim
=
h→0
h→0
h
h
f (x + h) − f (x)
g(x + h) − g(x)
= lim
· g(x + h) + lim f (x) ·
= f 0 (x)g(x) + f (x)g 0 (x)
h→0
h→0
h
h
Insbesondere ist ja g in x stetig und deshalb limh→0 g(x + h) = g(x).
lim
c) Ich behandle zunächst den Fall f (x) = 1 (für alle x ∈ D) und überlasse es dann Dir, b) auf
1
das Produkt f · anzuwenden.
g
1
Wir berechnen die Ableitung der Funktion :
g
0
1
1
1
1
1 g(x) − g(x + h)
(x) = lim
−
= lim ·
=
h→0 h
h→0 h
g
g(x + h) g(x)
g(x)g(x + h)
1
g(x + h) − g(x)
g 0 (x)
lim
· lim −
=−
.
h→0 g(x)g(x + h) h→0
h
(g(x))2
Den Rest überlasse ich – wie gesagt – Dir.
184
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beispiele 7.2.3 a) Zeige mit Hilfe der Produktregel: Ist f (x) = xn mit einer natürlichen Zahl
n > 0, so gilt f 0 (x) = nxn−1 . Dies ist eine einfache Übung zur vollständigen Induktion.
b) Zeige, dass dies (für x 6= 0) auch für beliebige ganze, also auch negative n gilt. Die Ableitung
der Funktion f (x) = x0 ist 0, die 0-Funktion, auch in x = 0, jedenfalls, wenn man 00 = 1
setzt. (Die 0-Funktion ist die Funktion, die überall den Wert 0 hat.)
xn
die Funktion xn−1 . D.h.
n
zu jeder Funktion g(x) = xn mit n 6= −1 gibt es eine Funktion, deren Ableitung gleich g ist,
xn+1
eine sogenannte Stammfunktion von g, nämlich die Funktion f (x) =
. Dieser Ausdruck
n+1
1
hat keinen Sinn für n = −1. Gibt es auch eine Stammfunktion von ? Vielleicht kennst Du
x
eine solche bereits. Sonst musst Du Dich noch etwas gedulden.
c) Für n ∈ Z, aber n 6= 0 ist also die Ableitung der Funktion f (x) =
d) Berechne die Ableitung der Funktion f (x) = x3 − 5x2 + 6x + 1.
d’) Zeige allgemeiner:
Ist f (x) =
n
X
k=0
ak xk , so ist f 0 (x) =
n
X
kak xk−1
k=1
Folglich erhältst Du: Ist f (x) = an xn + · · · + a1 x + a0 ein Polynom vom Grade n ≥ 1, so
ist f 0 ein Polynom vom Grade n − 1. Hat f den Grad 0, d.h. ist f konstant, aber nicht 0,
so ist f 0 = 0, d.h. die 0-Funktion. Die Ableitung der 0-Funktion ist wieder die 0-Funktion.
Somit ist ein Polynom unendlich oft differenzierbar. Die Ableitung eines Polynoms, das nicht
konstant gleich 0 ist, ist also ‘einfacher’, nämlich von kleinerem Grad, als das Polynom selber.
Für allgemeinere Funktionen ist das aber nicht die Regel. Sehr häufig ist die Ableitung einer
Funktion komplizierter als diese selbst, wie Du schon in folgendem Beispiel siehst.
x4 + x + 1
. Allgemein besitzt eine rationale Funktion,
x2 + 1
d.h. ein Quotient zweier Polynome eine Ableitung überall da, wo sie definiert ist. Und diese
Ableitung ist wieder eine rationale Funktion.
e) Berechne die Ableitung von f (x) =
√
7.2.4 Wir wollen auch Funktionen wie n x differenzieren und erinnern uns daran, dass diese
die Umkehrfunktion von g(y) = y n ist. Genau genommen wird für jede ungerade Zahl n > 0
durch g(y) = y n eine bijektive Abbildung R → R definiert. Ist n > 0 gerade, so ist die
Funktion g(y) = y n jedenfalls als Abbildung von R+ nach R+ bijektiv. Deshalb
gibt es eine
√
−1
−1
n
Umkehrfunktion f = g : R → R, bzw. f = g : R+ → R+ , die mit f (x) = x bezeichnet
wird. Um die Ableitung von Umkehrfunktionen wollen wir uns sofort kümmern und damit auch
die Ableitungen von Wurzelfunktionen berechnen.
Dass die Abbildungen g : R → R mit g(x) = xn für ungerade n > 0, sowie
g : R∗+ → R∗+ mit g(x) = xn für gerade n > 0, bijektiv sind, ist ziemlich plausibel, aber doch
nicht ganz selbstverständlich. Die Injektivität lässt sich leicht zeigen: x1 < x2 =⇒ xn1 < xn2 . Die
Surjektivität folgt aus dem Zwischenwertsatz.
7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN
185
Satz 7.2.5 Seien I, J Intervalle, g : J → I eine bijektive stetige Funktion und f = g −1 . Ist g
in y0 ∈ J differenzierbar mit g 0 (y0 ) 6= 0, so ist f in x0 = g(y0 ) differenzierbar mit der Ableitung
1
1
= 0
.
f 0 (x0 ) = 0
g (y0 )
g (f (x0 ))
Beweis: Ich begnüge mich mit einer Plausibilitätsbetrachtung:
Betrachte eine Gerade in der x, y-Ebene, die zu keiner der beiden Achsen parallel ist. Sie ist
sowohl der Graph einer Funktion, die jedem y-Wert einen x-Wert, als auch der Graph einer
Funktion die jedem x-Wert einen y-Wert zuordnet. Ist x = ay + b, so ist y = a−1 x − a−1 b.
Sei a = g 0 (y0 ). Dann wird die Tangente an den Graphen der Funktion g im Punkte (y0 , x0 )
durch eine Gleichung der Form x = ay + b beschrieben. Der Graph der Funktion f ist derselbe,
wie der der Funktion g, wo nur die Rollen von x und y vertauscht sind. (Wenn Du, wie üblich
die ‘unabhängige Variable’ auf der waagerechten Achse variieren lassen möchtest, musst Du den
Graphen an der Geraden ‘y = x’ spiegeln.) Die Tangente im Punkte (y0 , x0 ) ist dann natürlich
dieselbe. (Genau hier wird etwas gemogelt, da die Tangente nach obiger Definition nicht völlig
symmetrisch in x, y definiert ist.) Wenn ich die Tangentengleichung nach y auflöse, erhalte ich
1
y = a−1 x − ba− 1, so dass ihre Steigung a−1 = 0
ist.
g (y0 )
√
Folgerung 7.2.6 Die √
Funktion f : R+ → R+ , x 7→ n x ist für x > 0 differenzierbar und hat
n
√
x
1 1
0
die Ableitung f (x) =
= x n −1 . (Ist n ungerade, so ist die Funktion f : R → R, x 7→ n x
nx
n
für x 6= 0 differenzierbar und hat die angegebene Ableitung.)
Beweis:
Die Umkehrfunktion von f (x) =
f 0 (x0 ) =
√
n
x ist g(y) = y n . Dann ist
1
1 √
1 n1 −1
1−n
n
=
(
x
)
=
x
.
0
n( x0 )n−1
n
n 0
√
n
Bemerkung 7.2.7 Seien f1 , . . . , fn differenzierbare Funktionen mit demselben Definitionsbereich. So ist ihr Produkt f1 f2 · · · fn ebenfalls differenzierbar und hat die Ableitung
f10 · f2 · · · fn + f1 · f20 · f3 · · · fn + . . . + f1 · · · fn−1 · fn0
(Gemeint ist eine Summe von n Produkten aus jeweils n Faktoren, wo im k-ten Summanden
der k-te Faktor die Ableitung fk0 , und für die anderen i 6= k der i-te Faktor fi ist.) Du wirst
dies sicher mit Induktion beweisen können.
Das gilt natürlich auch wenn die Faktoren einander gleich sind:
Ist n > 0 ganz und g(x) = f (x)n , so ist mit f auch g differenzierbar und g 0 (x) = nf 0 (x)·f (x)n−1 .
√ m
Schreibt man xm/n = ( n x) , so erhält man
186
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Folgerung 7.2.8 Ist a eine positive rationale Zahl, so ist f : R∗+ → R∗+ , x 7→ xa differenzierbar
und es gilt f 0 (x) = axa−1 . (Lässt sich a mit einem ungeraden Nenner schreiben, so kann man
R∗+ durch R∗ ersetzen. Für a ≥ 1 ist die Funktion auch in 0 differenzierbar.)
Mit Hilfe der Quotientenregel erhalten wir:
Folgerung 7.2.9 Dasselbe gilt, wenn a eine negative rationale Zahl (und x > 0) ist.
Bemerkung 7.2.10 Im nächsten Abschnitt werden wir zeigen, dass f 0 (x) = axa−1 für beliebige
reelle a gilt.
Bemerkungen 7.2.11 Für den Beweis des nächsten Satzes brauchen wir das Folgende:
ϕ(h)
= 0, dann ist auch
h→0 h
ϕ(ah)
ϕ(ah)
ϕ(ah)
lim
= 0. Denn dies ist für a = 0 ohnehin klar, und für a 6= 0 kann man
= a·
h→0
h
h
ah
schreiben.
a) Sei ϕ, definiert auf einer Umgebung der 0, mit der Eigenschaft lim
b) Sei a 6= 0 und ϕ wie oben, dann gibt es ein δ > 0, derart dass für alle h mit 0 < |h| < δ
die Ungleichung |ϕ(h)| < |ah| gilt. Denn angenommen, für jedes n ∈ N1 gäbe es ein hn mit
ϕ(hn )
|hn | < 1/n und |ϕ(hn )| ≥ |ahn |, dann wäre lim
6= 0 oder nichtexistent. Also muss für
n→∞ hn
ein (genügend großes) n für alle h mit |h| < 1/n die Ungleichung |ϕ(h)| < ah gelten.
c) Sei ψ eine weitere Funktion mit den genannten Eigenschaften von ϕ, dann folgt aus a) und
b) dass auch die zusammengesetzte Funktion ψ(ah + ϕ(h)) diese Eigenschaften hat. Denn für
genügend kleine |h| ist ja dann |ϕ(h)| < |ah| und folglich |ah + ϕ(h)| ≤ |ah| + |ϕ(h)| < 2|ah|.
Wie kann man z.B. die Funktion f (x) =
Regel:
√
1 + x2 differenzieren? Dazu dient folgende wichtige
Satz 7.2.12 Kettenregel: Seien I, J Intervalle und f : I → J, g : J → R Funktionen und
x0 ∈ I. Sei ferner f in x0 und g in f (x0 ) differenzierbar. Dann ist g ◦f in x0 differenzierbar
und es gilt (g ◦f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Anders ausgedrückt: Ist das lokale Wachstum von f im Punkte x0 gleich a und das lokale
Wachstum von g im Punkte f (x0 ) gleich b, so ist das lokale Wachstum von g ◦f im Punkte x0
gleich ba.
Beweis: Zunächst eine Plausibilitätsbetrachtung: Wenn man f in der Nähe von x0 durch die
approximierende lineare Funktion x 7→ ax + c ersetzt und entsprechend g in der Nähe von f (x0 )
durch die approximierende lineare Funktion y 7→ by + d, so ist die Verkettung dieser linearen
Funktionen die lineare Funktion b(ax + c) + d = bax + (bc + d), deren Wachstum gleich ba ist.
Genauer, sei f (x+h) = f (x)+ah+ϕ(h) mit limh→0 (ϕ(h)/h) = 0 und g(y+k) = g(y)+bk+ψ(k)
mit limk→0 (ψ(k)/k) = 0 für kleine |h|, |k|.
7.3. EXPONENTIAL- UND POTENZFUNKTIONEN
187
Dann ist g ◦f (x + h) = g(f (x) + ah + ϕ(h)) = g ◦f (x) + bah + bϕ(h) + ψ(ah + ϕ(h)). Es genügt
folgendes zu zeigen
bϕ(h)
ψ(ah + ϕ(h))
= 0 und lim
=0,
lim
h→0
h→0
h
h
wobei die erste Aussage trivial ist. Die zweite haben wir oben gezeigt.
Beispiel 7.2.13 Die Ableitung von f (x) =
7.3
√
2x
x
1 + x2 ist f 0 (x) = √
=√
.
2
2 1+x
1 + x2
Exponential- und Potenzfunktionen
7.3.1 Über die Funktion exp(x) = ex wissen wir aus Lemma 5.2.5 bereits folgendes:
(∗) Für |x| < 1 gilt |ex − 1 − x| < x2 .
Hieraus folgt
Lemma 7.3.2
Beweis:
ex − 1
=1
x→0,x6=0
x
lim
Wenn Du die Ungleichung (∗) durch |x| (mit 0 < |x| < 1) dividierst, erhältst Du
x
x
e − 1 − x
e − 1
< |x|
x − 1 = x
was die Behauptung des Lemmas beweist.
Theorem 7.3.3 Die Funktion exp ist differenzierbar und hat die Ableitung exp0 = exp.
Beweis:
Da ex+h = ex eh ist, gilt (mit h 6= 0)
exp(x + h) − exp(x)
eh − 1
= ex lim
= ex .
h→0
h→0
h
h
lim
Die letzte Gleichung gilt auf Grund obigen Lemmas.
Bemerkung 7.3.4 Wenn man die Exponentialreihe gliedweise differenziert, kommt man zum
selben Ergebnis. Allerdings haben wir nicht bewiesen, dass dies gerechtfertigt ist! Es gibt viele
Beispiele von Reihen (Folgen) von Funktionen, wo die gliedweise Ableitung nicht zum richtigen
Ergebnis führt.
d
Bezeichnung. Man schreibt oft dx
f (x) := f 0 (x), besonders dann, wenn die Funktion durch
einen Ausdruck gegeben ist, den man nicht erst mit f (x) benennen will. Also statt des Satzes
Ist f (x) = x2 −
√
3
(1 + 4x3 )
2 + x + x4 , so ist f 0 (x) = 2x − p
3 3 (2 + x + x4 )2
schreibt man kürzer
d 2 √
(1 + 4x3 )
3
(x − 2 + x + x4 ) = 2x − p
dx
3 3 (2 + x + x4 )2
188
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Satz 7.3.5 a) Für die Ableitung des natürlichen Logarithmus gilt:
ln0 (x) =
1
für x > 0 , ja sogar
x
d
1
ln |x| = für alle x 6= 0 .
dx
x
b) Allgemeiner gilt folglich
d
1
loga |x| =
für a > 0.
dx
x ln a
c) Für die Ableitung der Exponentialfunktion f (x) = ax (mit a > 0) gilt:
d x
a := f 0 (x) = ln(a) · ax
dx
d) Für die Ableitung der Potenzfunktion g(x) = xa (die für alle reellen a und jedenfalls für
x > 0 definiert ist) gilt
d a
x := g 0 (x) = axa−1
dx
Beweis:
a) Nach der Regel für die Ableitung der Umkehrfunktion ist
ln0 x =
1
exp0 (ln x)
=
1
1
= .
exp(ln x)
x
a’) Ist x > 0, so ist |x| = x und die Behauptung bereits bewiesen. Für x < 0 ist |x| = −x. Nach
1
1
d
ln(−x) = −
=
der Kettenregel gilt dann
dx
−x
x
b) folgt aus loga |x| = ln |x|/ ln(a)
c) Da ax = ex ln a ist, kannst Du die Kettenregel auf f (x) = ex ln a anwenden.
d) Es ist xa = ea ln x . Mit Hilfe der Kettenregel siehst Du
d a ln x a a ln x a · xa
e
= e
=
= a · xa−1 .
dx
x
x
Die Ableitung der Funktion ax ist also proportional zu ax . Und der Proportionalitätsfaktor ist
genau dann gleich 1, wenn a = e ist.
Wenn ich von der Exponentialfunktion f (x) = ax und von der Potenzfunktion g(x) = xa rede,
ist jedesmal mit x eine Variable (die sog. unabhängige Variable) und mit a eine Konstante
gemeint. Deshalb haben die Ableitungen (nach x) dieser beiden Funktionen nichts miteinander
zu tun!
Bemühe Dich, die Namen ‘Potenzfunktion’ bzw. ‘Exponentialfunktion’ immer richtig zuzuordnen.
Leider werden häufig, sogar in naturwissenschaftlichen Abhandlungen, die Begriffe ‘exponentielles Wachstum’ und ‘exponentielle Abnahme’ falsch verwendet! Alles was nicht linear ist, wird
‘exponentiell’ genannt. Diesem Missbrauch solltest Du nicht folgen.
7.4. SINUS UND COSINUS
189
7.3.6 Wir wissen jetzt, was die Ableitungen der Funktionen g(x) = xa und h(x) = ax sind.
Frage: Was ist die Ableitung der Funktion f : R∗+ → R, definiert durch f (x) = xx ?
f 0 (x) =
xx−1
x
= xx−2
ln(x) · xx
(1 + ln x)xx
Antwort: Schreibe xx = ex ln x und Du erhältst mit Hilfe der Ketten- und Produktregel die
dritte Möglichkeit als richtige Antwort! (Die Ableitung von x ln x ist ja 1 · ln x + x · x1 .)
Zur ersten Möglichkeit: Die Funktion f ist keine Funktion der Form xa mit einer Konstanten
a.
Zur zweiten Möglichkeit: Die Funktion f ist auch nicht eine Funktion der Form ax mit einer
Konstanten a.
7.4
Sinus und Cosinus
Da wir hier Abbildungen I → R2 mit einem Intervall I betrachten, wollen wir zunächst definieren, wann eine Folge von Elementen des R2 , also von Punkten oder Vektoren der Ebene, gegen
ein Element des R2 konvergiert.
Definition 7.4.1 Sei (an )n eine Folge von Elementen des R2 mit an = (an1 , an2 ). Man sagt,
die Folge (an )n konvergiert gegen ein a = (a1 , a2 ) ∈ R2 , wenn die Folge (an1 )n gegen a1 und die
Folge (an2 )n gegen a2 konvergiert.
Bemerkung 7.4.2 Wie Du weißt, kann man den Vektorraum der Ebene, oder auch die Ebene
auf vielerlei Weise mit dem R2 identifizieren. Und Du wirst fragen, ob verschiedene solche
Identifikationen zu verschiedenen Definitionen der Konvergenz führen. Glücklicher Weise ist
das nicht so.
Wenn nämlich ϕ : R2 → R2 linear ist, so sind die Komponenten von ϕ(an ) von der Form
ban1 +can2 mit geeigneten reellen Zahlen b, c. Aus Satz 3.2.27 folgt dann, dass die Komponenten
der ϕ(an ) gegen die jeweiligen Komponenten von ϕ(a) konvergieren. Ist ϕ invertierbar, so gilt
das Entsprechende für ϕ−1 .
Und wenn man die Ebene zusätzlich durch eine Verschiebung des Ursprungs auf andere Weise
mit dem Vektorraum der Ebene identifiziert, hat das erst recht keinen Einfluss auf die Konvergenz einer Folge.
7.4.3 Sei I ein Intervall in R. (Allgemeiner darf I eine beliebige Menge sein.) Eine Abbildung
γ : I → R2 bedeutet, dass jedem t ∈ I ein Paar (x, y) mit x, y ∈ R zugeordnet wird. Das heißt,
die Abbildung γ ist durch dasjenige Paar von Abbildugen (γ1 , γ2 ) gegeben, welches γ(t) =
(γ1 (t), γ2 (t)) für jedes t ∈ I erfüllt.
(Beachte, dass man eine Abbildung R2 → R, also in umgekehrter Richtung, meist nicht durch
ein Paar von Abbildungen beschreiben kann! Eines von vielen möglichen Beispielen ist die
Abbildung f , die durch f (x, y) = xy + x + y beschrieben wird.)
190
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Definition 7.4.4 Eine ebene parametrisierte Kurve ist eine stetige Abbildung γ : I → R2 ,
wobei I ein Intervall ist.
Dabei heißt γ : I → R2 eine stetige Abbildung, wenn limx→a γ(x) = γ(a) für jedes a ∈ I
gilt, das heißt, wenn sie als Paar stetiger Abbildungen (γ1 , γ2 ) mit γi : I → R gegeben ist.
Wegen obiger Bemerkung gilt die Stetigkeit der Abbildung, wenn sie bzgl. eines Koordinatensystems gilt, auch für alle anderen.
Anschaulich bedeutet eine parametrisierte Kurve, dass man einen Punkt, abhängig von der
Zeit, in der Ebene bewegt – und zwar stetig, d.h. ohne Sprünge. Wenn man z.B einen Kreis
mit dem Zirkel zeichnet, macht man so etwas.
Natürlich kann man allgemein Abbildungen γ : I → Rn betrachten. Ist n = 3, so spricht man
von Raumkurven.
Manchmal nennt man das Bild von γ (in obigem Beispiel den fertig gezeichneten Kreis) die
Spur von γ. Achte darauf, dass eine parametrisierte Kurve begrifflich nicht dasselbe bedeutet,
wie ihre Spur. Erstere ist eine Abbildung von einem Intervall nach R2 , letztere eine Teilmenge
des R2 .
γ(0)
γ(1) = γ(2)
γ(3)
3
γ(—)
2
Beispiele 7.4.5 a) Die parametrisierte Kurve γ : R → R2 , t 7→ (t, , t2 ) durchläuft die Parabel
{(x, x2 ) | x ∈ R}, d.h. den Graphen der Funktion f (x) = x2 . Die Parabel ist die Spur dieser
parametrisierten Kurve.
b) Allgemeiner: Ist f : I → R eine stetige Funktion, so ist γ : I → R2 , t 7→ (t, f (t)) eine
parametrisierte Kurve, deren Spur der Graph von f ist.
c) Peano-Kurven. Man sollte nicht glauben, dass es so etwas Verücktes wirklich gibt, nämlich
surjektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1]. Die Stetigkeit γ : I → R2 ist also eine
schwächere Bedingung als man denkt. Bijektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1] gibt
es aber nicht.
7.4.6 Ableitung einer parametrisierten Kurve. Sei γ : I → R2 eine parametrisierte
Kurve. Für t ∈ I fassen wir γ(t) als Vektor auf:
γ1 (t)
γ(t) =
γ2 (t)
7.4. SINUS UND COSINUS
191
Wenn t0 , t0 + h ∈ I also γ(t0 ), γ(t0 + h) definiert sind, dann soll natürlich γ(t0 + h) − γ(t0 ) die
Differenz der Vektoren γ(t0 + h) und γ(t0 ) bedeuten. Wir können also den ’Differenzenquotienten’
!
γ1 (t0 +h)−γ1 (t0 )
1
h
(γ(t0 + h) − γ(t0 )) =
.
γ2 (t0 +h)−γ2 (t0 )
h
h
definieren. Dann kann man auch von einer möglichen Ableitung sprechen. Wir setzen
1
γ 0 (t0 ) := lim (γ(t0 + h) − γ(t0 )) =
h→0 h
! γ1 (t0 +h)−γ1 (t0 )
0
γ
(t
)
0
1
h
lim
=
γ2 (t0 +h)−γ2 (t0 )
γ20 (t0 )
h→0
h
so dieser Limes denn existiert. Offenbar ist das genau dann so, wenn die Ableitungen γ10 (t0 )
und γ20 (t0 ) in t0 existieren. Der Differenzenquotient h1 (γ(t0 + h) − γ(t0 )) ist ein Vielfaches des
Vektors, der durch den Pfeil (γ(x0 ), γ(x0 + h)) gegeben wird.
γ(t0)
γ(t0+h0) – γ(t0)
γ(t0+h1) – γ(t0)
γ(t0+h0)
γ(t0+h1)
Wenn wir h gegen 0 gehen lassen, nähert sich der Differenzenquotient einem Vektor, der, wenn
man ihn in γ(x0 ) beginnen lässt, im anschaulichen Sinn ein Tangentenvektor an die Kurve γ(I)
ist.
Definition 7.4.7 Eine parametrisierte Kurve γ : I → R2 heißt differenzierbar, wenn in
allen t ∈ I die Ableitung von γ existiert.
7.4.8 Sei jetzt die Ebene mit einem orthonormierten Koordinatensystem versehen. Dann nennt
man den Vektor γ 0 (t) = (γ10 (t), γ20p
(t)) auch den Geschwindigkeitsvektor von γ in (d.h. zum
Zeitpunkt) t0 . Er hat die Länge γ10 (t0 )2 + γ20 (t0 )2 . Diese nennen wir die Absolutgeschwindigkeit von γ in t0 .
Bemerkungen 7.4.9 Es kann sein, dass in einem (Zeit-)Punkt t0 sowohl γ10 (t0 ) = 0 als auch
γ20 (t0 ) = 0 ist. In diesem Fall kannst Du Überraschungen erleben:
192
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
a) Betrachte z.B. γ1 (t) = γ2 (t) = t2 insbesondere im Punkte (0, 0). Die Spur dieser Kurve ist
die Halbgerade
{(x, x) ∈ R2 | x ≥ 0}
Verfolge den Weg, den γ(t) = (γ1 (t), γ2 (t) auf dem Intervall [−1, 1] durchläuft. Man startet im
Punkt (1, 1) läuft geradenwegs nach (0, 0) und von dort wieder auf geradem Weg zurück nach
(1, 1).
b) Ein weiteres Beispiel: γ(t) = (γ1 (t), γ2 (t))
γ1 (t) =
−t2 für t ≤ 0
t2 für t > 0
und γ2 (t) = t2 .
Die Spur dieser Kurve ist der Graph der Funktion f : R → R mit f (x) = |x|.
7.4.10 Der Kreis als parametrisierte Kurve. Wir haben die Funktionen Sinus und
Cosinus so definiert, dass die Abbildung
R → R2 , t 7→ (cos t, sin t)
den Einheitskreis parametrisiert, d.h. eine parametrisierte Kurve beschreibt, deren Spur der
Einheitskreis ist.
Nach Definition ist der Betrag des Geschwindigkeitsvektors für jeden Zeitpunkt gleich 1. Ferner
ist er immer gegen den Ortsvektor in mathematisch positiver Richtung um π/2 = 90o verdreht,
ist also gleich (− sin t, cos t). Das bedeutet
(cos0 t, sin0 t) = (− sin t, cos t), d.h. sin0 t = cos t, cos0 t = − sin t .
γ'(t)
cos t
γ(t)
π/2
t
–sin t
Satz 7.4.11 Die Funktionen cos, sin : R → R sind differenzierbar. Und es gilt
sin0 t = cos t, cos0 t = − sin t .
7.4. SINUS UND COSINUS
193
Beispiele 7.4.12 Mit Hilfe des Sinus (der Cosinus tut’s auch) lassen sich auf einfache Weise
Beispiele von Funktionen bilden, die sich außergewöhnlich verhalten.
a) Betrachte die Funktion ϕ(x) = sin( x1 ), die auf R∗ = R − {0} definiert ist. Nähert sich x der
Zahl 0, so ‘oszilliert’ sie immer schneller. In jedem noch so kleinen Intervall ]0, ε[ nimmt sie jede
Zahl des Intervalles [−1, 1] unendlich oft als Wert an. (Dasselbe gilt natürlich auch für jedes
Intervall ] − ε, 0[.) Somit gibt es kein a ∈ R derart, dass die Funktion
f1 : R → R mit f1 (0) = a und f1 (x) = ϕ(x) für x 6= 0
stetig wäre.
b) Betrachte nun die Funktion
f2 : R → R mit f2 (0) = 0 und f2 (x) = x · ϕ(x) für x 6= 0
Für jedes x ∈ R gilt |f2 (x)| ≤ |x|. Ist also (xn )n∈N eine Folge mit limn→∞ xn = 0, so muss
wegen |f2 (xn ) − 0| ≤ |xn − 0| auch die Folge (f2 (xn ))n∈N gegen 0 konvergieren. Diese Funktion
ist also in 0 stetig; ihre Stetigkeit und Differenzierbarkeit außerhalb 0 folgt, da sie dort eine
Verknüpfung differenzierbarer Funktionen ist.
Allerdings ist f2 in 0 nicht differenzierbar. Ihre Ableitung in 0 müsste folgender Limes sein:
f (x)
.
x→0 x
lim
Für x 6= 0 ist aber
f (x)
= ϕ(x), und gemäß a) existiert limx→0 ϕ(x) nicht!
x
c) Die Funktion
f3 : R → R mit f3 (0) = 0 und f3 (x) = x2 · ϕ(x) für x 6= 0
ist überall – auch in 0 differenzierbar. Aber ihre Ableitung ist in 0 nicht mehr stetig. Denn
f30 (0) = 0 und für x 6= 0 gilt
1
1
1
1
1
2
0
f3 (x) = 2x · sin − x
cos = 2x · sin − cos
2
x
x
x
x
x
Nun ist die Summe einer in einem Punkt x0 stetigen und einer in x0 unstetigen Funktion in
x0 unstetig. Daraus folgt, dass f30 in 0 nicht stetig ist. (Sind α, β, γ Funktionen auf demselben
Intervall mit α + β = γ und sind α, γ im Punkt a stetig, so ist β = α − γ es auch.)
d) Definiere f4 (x) := f3 (x) − 2x2 . Da |f3 (x)| ≤ x2 , also f4 (x) ≤ −x2 , ferner f4 (0) = 0 für alle x
gilt, hat f4 in 0 ein ‘absolutes’ Maximum; d.h. f4 (0) > f4 (x) für alle x 6= 0. Andererseits gibt
es beliebig nahe bei 0 Punkte x < 0 mit f40 (x) < 0 und ebenso Punkte x > 0 mit f40 (x) > 0. Es
gibt also keine ε-Umgebung in der links von 0 die Funktion monoton wächst und rechts von 0
monoton fällt, mag ε > 0 noch so klein sein.
Berechne dazu außerhalb 0 die Ableitung f40 = f30 − 2x = 2x(sin x1 − 1) − cos x1 . Es gilt
|2x(sin x1 − 1)| ≤ 2|x|(1 + 1) = 4|x| < 1 für |x| < 1/4, während cos x1 für x ∈ ] − 14 , 14 [−{0}
unendlich oft sowohl den Wert 1, wie den Wert −1 annimmt.
194
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
sin x
7.4.13 Tangens. Die Funktion tan(x) :=
ist überall da definiert, wo cos x 6= 0 ist. Sie
cos x
heißt der Tangens von x.
Die Nullstellen des Cosinus sind alle π/2 + nπ, wo n die ganzen Zahlen durchläuft. Das heißt,
dass der Definitionsbereich des Tangens die Vereinigung der unendlich vielen offenen Intervalle
]nπ − π/2 , nπ + π/2[ ist, wo n die ganzen Zahlen durchläuft.
(Geometrisch gesehen, ist tan α die Steigung der Geraden durch den Nullpunkt, die mit der
positiven x-Achse, den Winkel α bildet.)
Die Ableitung des Tangens ist nach der Quotientenregel
tan0 x =
sin0 (x) cos(x) − sin(x) cos0 (x)
cos2 x + sin2 x
1
=
=
.
2
2
cos x
cos x
cos2 x
Diese ist auf dem ganzen Definitionsbereich des Tangens positiv. Also ist der Tangens auf jedem
der Intervalle ]nπ − π/2 , nπ + π/2[ streng monoton wachsend. Geht x von unten gegen π/2,
so geht tan x gegen ∞. Geht hingegen x von oben gegen −π/2, so geht der Zähler sin gegen −1
und der Nenner von oben gegen 0, also der Tangens gegen −∞. In 0 liegt eine Nullstelle vor,
da der Zähler dort 0 und der Nenner 1 ist. Es ist
tan(−x) =
sin(−x)
− sin x
=
= − tan(x).
cos(−x)
cos x
Also ist der Graph punktsymmetrisch bzgl. des Ursprungs. Geht x von unten gegen π/2, so
geht tan x gegen ∞.
Da sin(x + π) = − sin x und cos(x + π) = − cos x, ist tan(x + π) = tan x,
Offenbar ist die Einschränkung des Tangens auf das Intervall ] − π/2 , π/2[ eine bijektive
Abildung von diesem Intervall nach R. Es gibt also eine Umkehrfunktion
arctan : R → ]− π/2 , π/2[ .
Sie wird Arcus-Tangens genannt. Beachte, dass man eine Umkehrfunktion des Tangens nur
dann (als Abbildung im strengen Sinn) bilden kann, wenn man seinen Definitionsbereich geeignet einschränkt, z.B. auf das oben genannte Intervall ] − π/2 , π/2[. Dies ist auch möglich,
wenn man den Tangens auf ein anderes Intervall der Form ]nπ − π/2 , nπ + π/2[ einschränkt.
Die Wahl n = 0 ist jedoch in gewisser Weise ausgezeichnet.
7.4.14 Auch wenn man Umkehrfunktionen des Sinus und des Cosinus bilden möchte, muss
man durch geeignete Einschränkungen den Sinus bzw. Cosinus bijektiv machen.
Für den Sinus wählt man gemeinhin den Definitionsbereich [−π/2 , π/2], für den Cosinus [0, π].
Denn offenbar hat man bijektive differenzierbare Funktionen
sin : [−π/2 , π/2] → [−1 , 1] , sowie cos : [0 , π] → [−1 , 1] .
7.4. SINUS UND COSINUS
195
1
1
0
–π/2
π/2
–1
0
π/2
π
–1
Die Umkehrfunktionen heißen Arcus-Sinus, bzw. Arcus-Cosinus und werden mit arcsin,
bzw. arccos bezeichnet. Sie haben als Definitionsbereich das abgeschlossene Intervall [−1 , 1],
sind aber nur auf dem offenen Intervall ]− 1 , 1[ differenzierbar.
7.4.15 Wir wollen noch die Ableitungen der genannten Umkehrfunktionen
p bestimmen.
2
2
Zunächst erinnern wir uns an die Formel cos x + sin x = 1, d.h. cos x = 1 − sin2 x, jedenfalls dort, wo cos x ≥ 0 ist.
a) Zum Arcus-Sinus: Nach der Regel der Ableitung einer Umkehrfunktion ist
arcsin0 x =
1
1
1
1
√
=
=p
=
.
sin (arcsin x)
cos(arcsin x)
1 − x2
1 − sin2 (arcsin)
0
Die Wurzel ist in R+ zu wählen, da der Cosinus im wie oben eingeschränkten Definitionsbereich
des Sinus nichtnegativ ist.
b) Entsprechend ergibt sich als Ableitung des Arcus-Cosinus: arccos0 x = − √
c) Zum Arcus-Tangens: arctan0 (x) =
x2 . Ferner ist
tan2 (y) =
cos2 y =
1
.
1 − x2
1
= cos2 (arctan x). Nun gilt tan2 (arctan x) =
tan (arctan x)
0
sin2 y
1 − cos2 y
1
=
=
− 1 , also
2
2
cos y
cos y
cos2 y
1
1
, und deshalb arctan0 (x) = cos2 (arctan x) =
2
1 + tan y
1 + x2
Wie die Ableitung des Logarithmus ist also auch die Ableitung des des Arcus-Tangens eine
rationale Funktion.
sin x
arcsin x
. Gilt deshalb auch arctan x =
???
cos x
arccos x
Ich muss gestehen, ich hätte nie geglaubt, dass irgendjemand auf die Idee kommen würde, dies
könnte gelten. Leider habe ich das doch erlebt!
7.4.16 Frage. Es gilt ja tan x =
196
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Antwort. Nun für x = 0 gilt diese Gleichung sogar, da sin 0 = 0, also arcsin 0 = 0 = arctan 0
ist. Aber, da sin(π/4) = cos(π/4) = 2−1/2 ist, ist tan(π/4) = 1, also arctan 1 = π/4.
Daraus folgt arctan(−1) = −π/4. Aber es ist arccos(−1) = π und arcsin(−1) = −π/2, also
arcsin(−1)
= −1/2 6= π/4. Abgesehen davon ist arctan auf ganz R definiert, arcsin und arccos
arccos(−1)
hingegen nur auf [−1, 1].
7.4.17 Eine Reihe die gegen π/4 konvergiert. Die Funktion f (x) = (1 + x2 )−1 , d.h. die
Ableitung des Arcus-Tangens lässt sich für |x| < 1 als folgende geometrische Reihe schreiben:
∞
X
1
2
4
6
=
1
−
x
+
x
−
x
±
·
·
·
=
(−1)n x2n
1 − (−x2 )
n=0
Betrachte dazu die folgende Funktion
∞
X
x2n+1
x3 x5 x7
F (x) = x −
+
−
± ··· =
(−1)n
3
5
7
2n + 1
n=0
Wie Du an der Uni lernen wirst, darf man Potenzreihen gliedweise differenzieren (s. z.B. Forster). Also ist F 0 = f und andererseits arctan0 = f . Deshalb ist F (x) − arctan(x) = c, eine
Konstante, was ich als anschaulich klar ansehen will. Da ferner offenbar arctan(0) = 0 = F (0)
ist, gilt schließlich arctan(x) = F (x) für |x| < 1. Für x = 1 konvergiert die Reihe F nach dem
Leibnizkriterium. Nach dem Abelschen Grenzwertsatz, auf dessen Beweis im ersten Semester
Du Dich freuen darfst, ist dann F (1) = arctan(1) = π/4, ausgeschrieben (Leibniz):
∞
X (−1)n
π
1 1 1
= 1 − + − ± ··· =
4
3 5 7
2n + 1
n=0
Außer den großen Lücken, die ich im Beweis gelassen habe, gibt es noch den weiteren Wermutstropfen, dass diese Reihe nicht besonders gut konvergiert.
7.5
Zur Gestalt von Funktionsgraphen
Betrachte die uns bekannte Funktion f : R → R, f (x) = x3 − 5x2 + 6x + 1.
4
3
2
1
1
2
3
4
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
197
Bis zu dem Punkt x1 ≈ 0,8 wächst diese Funktion, um anschließend wieder bis zum Punkt x2 ≈
2,6 zu fallen, von dem aus sie wieder wächst. (Weiter unten werden x1 , x2 genauer bestimmt.)
Wie kann man das erkennen, wenn man nicht allzu viele Funktionswerte berechnen möchte?
(Und selbst, wenn man die Funktionswerte an sehr vielen Stellen bestimmt hat, wissen wir
kritischen Mathematiker im Grunde nicht, was zwischen diesen Stellen passiert, auch wenn der
Praktiker unnötig finden mag.)
Du weißt vielleicht schon, dass hierzu die Differenzialrechnung nützlich ist. Dies wollen wir in
diesem Abschnitt genauer untersuchen. Dabei wirst Du, möglicherweise überrascht, feststellen,
dass es zur Bestimmung lokaler Extrema manchmal sinnvoll ist, die zweite Ableitung f 00 (s.u.)
der untersuchten Funktion f außer Betracht zu lassen, und sich stattdessen die erste Ableitung
genauer anzusehen, und nicht nur ihre Nullstellen auszurechnen. Möchte man allerdings wissen,
in welche Richtung der Graph der Funktion f gekrümmt ist, lohnt es sich schon f 00 zu berechnen.
Definition 7.5.1 Sei f : I → R eine differenzierbare Funktion und f 0 ihre Ableitung. Möglicherweise kann man f 0 wieder differenzieren. Dann wollen wir mit f 00 die Ableitung von f 0
bezeichnen. (f 00 := (f 0 )0 .) Dieses f 00 nennt man dann die zweite Ableitung von f .
Indem man das Verfahren iteriert, kann man auch versuchen, f 000 , die dritte Ableitung usw. zu
bilden. Werden Dir der Striche zuviele, schreibe f (4) für die vierte Ableitung usw., f (n) für die
n-te Ableitung. Eine Funktion f heißt n-mal differenzierbar, wenn f (n) existiert. Sie heißt
n-mal stetig differenzierbar, wenn f (n) existiert und stetig ist.
In den beiden Punkten x1 und x2 hat die obige Funktion f (x) = x3 − 5x2 + 6x + 1 lokale
Extremwerte im Sinne der folgenden Definition:
Definitionen 7.5.2 Sei f : I → R eine Funktion auf einem (endlichen oder unendlichen)
Intervall I und x0 ∈ I.
a) f heißt (auf I) monoton wachsend, wenn für alle x, y ∈ I mit x < y die Ungleichung
f (x) ≤ f (y) gilt. f heißt streng monoton wachsend, wenn aus x < y immer f (x) <
f (y) folgt. (Manchmal nennt man eine monoton wachsende Funktion auch schwach monoton
wachsend, wenn man betonen will, dass sie nicht notwendig streng monoton wachsend ist.)
b) Analog verwendet man die Bezeichnungen (schwach) monoton fallend und streng monoton fallend.
c) Man sagt, f habe in x0 ein lokales Maximum (bzw. ein lokales Minimum), wenn es
in I eine ε-Umgebung von x0 gibt, in der f keine größeren, (bzw. kleineren) Werte als f (x0 )
annimmt.
Ein lokales Extremum ist ein lokales Maximum oder ein lokales Minimum.
d) Man sagt f habe in x0 ein absolutes Maximum bzw. absolutes Minimum, falls
f (x0 ) ≥ f (x) bzw. f (x0 ) ≤ f (x) für alle x ∈ I ist.
Analog zu c) vermagst Du sicher zu definieren, was ein absolutes Extremum bedeutet.
198
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beachte, dass f : I → R ein lokales Extremum nach obiger Definition nicht in einem Randpunkt
von I annehmen kann. (Du darfst natürlich die Definition nach eigenem Gusto treffen, musst
allerdings im folgenden Satz ausschließen, dass x0 ein Randpunkt ist.)
Folgender Zuammenhang besteht zwischen den lokalen Extremwerten einer differenzierbaren
Funktion und den Nullstellen ihrer Ableitung.
Satz 7.5.3 Ist I ein Intervall, f : I → R eine differenzierbare Funktion, die in x0 ∈ I ein
lokales Extremum hat, so gilt f 0 (x0 ) = 0.
Beachte folgende Punkte: a) Nach Voraussetzung ist f 0 (x0 ) definiert und x0 kein Randpunkt
von I.
b) Die Umkehrung dieses Satzes gilt nicht. Die Funktion f (x) = x3 hat in 0 die Ableitung 0
(d.h. ihr Graph hat dort eine waagerechte Tangente). Trotzdem ist sie überall streng monoton
wachsend.
c) Wenn x0 ein Randpunkt von I ist, braucht die Behauptung des Satzes nicht zu gelten, auch
wenn f dort ein absolutes Extremum hat. Die Funktion f : [0, 1] → R mit f (x) = x hat in 0
ein absolutes Minimum, in 1 ein absolutes Maximum.
Beweis:
Sei etwa f (x0 ) ≥ f (x) für alle x in einer geeigneten ε-Umgebung in I von x0 , so ist
f (x) − f (x0 )
f (x) − f (x0 )
≥ 0 für x0 − ε < x < x0 und
≤ 0 für x0 + ε > x > x0 .
x − x0
x − x0
Daraus folgt, dass der nach Voraussetzung existierende Grenzwert
lim
x→x0
f (x) − f (x0 )
x − x0
sowohl ≤ 0 als auch ≥ 0 sein muss, also nur gleich 0 sein kann.
Die lokalen Extrema einer auf einem offenen Intervall definierten differenzierbaren Funktion
liegen also bei gewissen Nullstellen ihrer Ableitung.
Den folgenden Satz gebe ich ohne Beweis. Ich sehe ihn vielmehr als anschaulich klar an.
Satz 7.5.4 Sei f : I → R eine differenzierbare Funktion auf einem Intervall I. Gilt f 0 (x) > 0
(bzw. f 0 (x) < 0) für alle x ∈ I, so ist f auf I streng monoton wachsend (bzw. fallend).
Die Voraussetzung kann man abschwächen. Es genügt zu fordern, dass überall f 0 (x) ≥ 0 (bzw.
f 0 (x) ≤ 0) ist, aber f 0 (x) = 0 nur an endlich (oder auch nur an abzählbar) vielen Stellen
stattfindet.
Beispiel 7.5.5 Wir behandeln die o.a. Funktion f (x) = x3 − 5x2 + 6x + 1 und sehen uns ihre
Ableitung f 0 an: f 0 (x) = 3x2 − 10x + 6. Deren Nullstellen finden wir mit Hilfe quadratischer
Ergänzung:
f 0 (x) = 3(x2 −
10
5
25
5
7
x + 2) = 3((x − )2 + 2 − ) = 3((x − )2 − )
3
3
9
3
9
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
199
Die Nullstellen der Ableitung sind also
5
x1 := −
3
r
7
5
und x2 := +
9
3
Ferner siehst Du: 1. Überall dort, wo (x − 53 )2 >
wachsend.
2. Wo (x − 53 )2 <
7
9
7
9
r
7
.
9
ist, ist f 0 (x) > 0. Dort ist f streng monoton
ist, ist f 0 (x) < 0. Dort ist f streng monoton fallend.
Der 1. Fall tritt für alle x < x1 und für alle x > x2 ein.
Der 2. Fall tritt ein, falls x in dem offenen Intervall ]x1 , x2 [ liegt.
Somit haben wir obige Aussagen über den Graph von f bestätigt.
Möglicher Weise bist Du es gewohnt, die Werte der 2. Ableitung in den Punkten x1 und x2 zu
betrachten. Es ist f 00 (x) = 6x − 10, und Du kannst rechnen:
p
p
5 p
f 00 (a) = 6( − 7/9) − 10 = −6 7/9 < 0 , f 00 (b) = 6 7/9 > 0 .
3
Da f 00 (als Polynom) stetig ist, gilt f 00 (x) < 0 (bzw. f 00 (x) > 0) in einer ε-Umgebung von x1
(bzw. von x2 ) für ein geeignetes ε > 0. Also ist f 0 in einer Umgebung von x1 streng monoton
fallend (bzw. in einer Umgebung von x2 streng monoton wachsend).
Also hat f 0 nahe x1 links von x1 positive und rechts von x1 negative Werte. Entsprechend hat
f 0 nahe x2 links von x2 negative und rechts von x2 positive Werte. Somit ist f nahe x1 links
von x1 streng monoton steigend und rechts von x1 monoton fallend. D.h. f hat in a ein lokales
Maximum. Entsprechend hat f in b ein lokales Minimum.
Indem Du die oben angewandten Argumente in einer allgemeineren Situation benutzt, siehst
Du sicher folgenden Satz ein:
Satz 7.5.6 Sei I ein offenes Intervall, f : I → R eine 2-mal stetig differenzierbare Funktion. (Letzteres bedeutet, dass f 0 und f 00 auf ganz I existieren und f 00 dort stetig ist. f und f 0
sind dann – weil differenzierbar – auch stetig.) Sei a ∈ I, f 0 (a) = 0, ferner f 00 (a) < 0 (bzw.
f 00 (a) > 0) so hat f in a ein lokales Maximum (bzw. ein lokales Minimum).
Beachte die Zuordnung: Maximum, wenn f 00 (a) < 0, und Minimum, wenn f 00 (a) > 0 – nicht
etwa umgekehrt!
Bemerkung 7.5.7 Es gibt aber viele Fälle, wo es einfacher ist, die Ableitung f 0 in der Nähe
ihrer Nullstellen genauer anzusehen als in diesen das Vorzeichen von f 00 zu bestimmen, und
zwar aus folgenden Gründen:
1) Die Berechnung von f 00 mag kompliziert sein. Nur bei Polynomen ist f 00 von einfacherer
Gestalt als f 0 .
200
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
2) Manchmal ist ein Punkt a gleichermaßen eine Nullstelle von f 0 wie von f 00 , zum Beispiel
a = 0 für f (x) = ±xn , wenn n ≥ 3 ist. In einem solchen Fall kann in a ein lokales Maximum,
ein lokales Minimum oder keines von beidem vorliegen.
Wenn Du magst, kannst Du versuchen, Aussagen darüber zu beweisen, was passiert, wenn k > 0
die kleinste Zahl mit f (k) 6= 0 ist und dieses k gerade oder ungerade ist.
Aber es gibt sogar nichtkonstante Funktionen, für die alle Ableitungen f (n) existieren, und
f (n) (a) = 0 für alle n gilt. Ein Beispiel findest Du in den Übungen.
Sogar, wenn die Ableitung zwar nicht in a, aber für alle x ∈ I − {a} existiert, kann die Betrachtung der Ableitung in der Nähe von a nützlich sein. Dies zeigt folgender Satz, der fast trivial
ist.
Satz 7.5.8 Sei I ein Intervall und f : I → R stetig. Sei a ∈ I kein Randpunkt und f auf
I − {a} differenzierbar.
a) Es gebe ein ε > 0, derart dass f 0 (x) > 0 für alle x ∈]a−ε, a[ und f (x) < 0 für alle x ∈]a, a+ε[
ist, dann hat f in a ein lokales Maximum. Analog gilt: f hat in a ein lokales Minimum, wenn
...
b) Gilt f 0 (x) > 0 für alle x ∈]a − ε, a + ε[, x 6= a, so liegt in a kein lokales Extremum vor.
Dasselbe gilt, wenn f 0 (x) < 0 in einem solchem Bereich ist.
Die Umkehrung von a) gilt leider nicht, wie Beispiel d) in (7.4.12) uns gelehrt hat. (Die Aussage
b) wirst Du kaum umkehren wollen.)
Beispiele 7.5.9 a) Ein Beispiel ist f (x) = |x|, welche nach diesem Satz in 0 ein lokales Minimum hat, was du natürlich eh weißt.
b) Ein Beispiel für b) ist die Funktion f (x) = xu , wo u eine ungerade natürliche Zahl ist.
√
3
c) (Neilsche Parabel) Betrachte f : R → R, definiert durch f (x) = x2/3 = x2 . Diese Funktion
ist in der Tat überall definiert und stetig. Ihre Ableitung f 0 (x) = 32 x−1/3 ist allerdings nur auf
R∗ , d.h. überall außer in 0, definiert. Links vom Nullpunkt ist sie negativ, rechts positiv. Also
hat f in 0 ein lokales (sogar absolutes) Minimum. Ferner gilt: Nähert man sich dem Nullpunkt
von links (bzw. rechts), so geht die Ableitung monoton gegen −∞ (bzw. ∞). In 0 hat der Graph
von f eine Spitze.
1
–1
1
7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN
201
Definitionen 7.5.10 Sei f : I → R eine Funktion auf dem Intervall I. Sie heißt dort konvex,
wenn für je zwei Punkte x1 , x2 ∈ I und jedes λ ∈ [0, 1] die Ungleichung
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 )
gilt.
Die Funktion f heißt auf I konkav, wenn −f konvex ist.
Bemerkung 7.5.11 Konvex zu sein bedeutet also, dass zu je zwei x-Stellen der Graph der
Funktion unterhalb der zugehörigen Sekante verläuft. Das heißt aber, dass der Graph der Funktion (mit wachsendem x) linksgekrümmt ist. (Im Grenzfall ist er gerade.)
Die Definition von ‘konvex’ ist einigermaßen willkürlich. Meiner Meinung nach könnte man
die Bezeichnungen konvex und konkav genau so gut vertauschen. Gemäß obiger (allgemein
üblichen) Definition wölbt sich der Graph einer konvexen Funktion nach unten.
7.5.12 Die zweite Ableitung kann man benutzen, um zu sehen, ob die Funktion in einem
Intervall konvex oder konkav ist. Denn wenn f 00 auf einem Intervall I existiert und dort überall
≥ 0 ist, bedeutet das, dass die lokale Steigung der Funktion mit wachsendem x zunimmt, oder
zumindest nie abnimmt, d.h. dass die Funktion auf I konvex ist.
Definition 7.5.13 Sei f : I → R eine differenzierbare Funktion auf dem Intervall I und x0
ein innerer Punkt von I. Man sagt, der Punkt (x0 , f (x0 )) ist ein Wendepunkt von f , wenn
es ein ε > 0 derart gibt, dass f entweder auf ]x0 − ε, x0 ] konvex und auf [x0 , x0 + ε[ konkav ist,
oder auf ]x0 − ε, x0 ] konkav und auf [x0 , x0 + ε[ konvex ist.
7.5.14 Wenn eine Funktion auf einem Intervall I zweimal stetig differenzierbar ist (d.h. ihre
zweite Ableitung existiert und stetig ist) und den Wendepunkt (x0 , f (x0 )) (mit x0 ∈ I) hat,
gilt f 00 (x0 ) = 0.
Denn f 00 wechselt bei x0 das Vorzeichen, da der Graph von f auf der einen Seite von x0 konvex,
auf der anderen konkav ist.
Hinreichend, dafür, dass (x0 , f (x0 )) ein Wendepunkt sei, ist die Bedingung f 00 (x0 ) = 0 keineswegs, wie das Beispiel f (x) = x4 , x0 = 0 zeigt. Bei dieser Funktion ist f 00 (x) ≥ 0 auf beiden
Seiten von 0. Also ist diese Funktion auf beiden Seiten konvex.
Hingegen hat die Funktion f (x) = x5 in 0 einen Wendepunkt. Sie ist links von 0 konkav, rechts
von 0 konvex.
AUFGABEN
Eine Polynomfunktion hat die Form f (x) = an xn + an−1 xn−1 + · · · + a1 x1 + a0 x0 . (Natürlich
schreibt man die letzten beiden Summanden in der Regel a1 x, a0 .) Das Nullpolynom ist als Polynomfunktion die Nullfunktion. Dessen Grad ist per definitionem gleich −∞. Ansonsten gibt
es ein n mit an 6= 0 und ak = 0 für alle k > n. In diesem Fall ist der Grad der Polynomfunktion
202
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
gleich n und an wird als der Leitkoeffizient bezeichnet. Wenn man durch an dividiert, erhält man
eine Polynomfunktion mit dem Leitkoeffizienten 1, die sich von der ursprünglichen Funktion
nur durch einen konstanten Faktor unterscheidet. Der Graph der ursprünglichen Funktion entsteht aus der neuen durch Streckung oder Stauchung in Richtung der y-Achse“ und möglicher
”
Weise noch einer Spiegelung an der x-Achse“. Die x ∈ R, wo f eine Nullstelle, bzw. in Extre”
mum hat, bleiben dieselben. Allerdings, war an < 0, so liegt ein Minimum (bzw. Maximum)
dort, wo vorher ein Maximum (bzw. Minimum) lag. Jedenfalls bedeutet es keine ernsthafte
Einschränkung, wenn man sich auf Polynomfunktionen beschränkt, deren Leitkoeffizient gleich
1 ist.
1. Diskutiere allgemeine Polynomfunktionen f vom Grad ≤ 3. Zeige:
a) Ist grad(f ) ≤ 0, d.h. grad(f ) = −∞ oder grad(f ) = 0, so ist der Graph von f eine Gerade
parallel zur x-Achse.
b) Ist grad(f ) = 1, so ist der Graph von f eine Gerade, die weder parallel zur x- noch zur
y-Achse ist. (Eine Parallele zur y-Achse ist kein Graph einer Funktion.) f hat genau eine
Nullstelle.
c) Ist grad(f ) = 2, so gibt es genau ein x0 , in dem f ein lokales Extremum hat. Dieses ist auch ein
globales Extremum. Je nach dem Vorzeichen des Leitkoeffizienten ist der Graph überall konvex
oder überall konkav. Sei etwa der Leitkoeffizient positiv. Dann ist das (lokale und globale)
Extremum ein Minimum. Je nachdem ob f (x0 ) > 0 oder = 0 oder < 0 ist, hat f keine, eine
oder 2 Nullstellen im Reellen.
d) Sei f (x) = a3 x3 + a2 x2 + a1 x + a0 und a3 > 0. Dann ist f für x ≤ a2 /(3a3 ) konkav, für
x ≥ a2 /(3a3 ) konvex und hat in a2 /(3a3 ) einen Wendepunkt.
Unterscheide nun zwei Fälle:
1. f 0 hat höchstens eine Nullstelle, d.h. f 0 (x) ≥ 0 gilt für alle x ∈ R und f 0 (x) > 0 für x 6= 0.
Dann ist f überall streng monoton wachsend. Somit hat f nur eine reelle Nullstelle.
2. f 0 hat zwei verschiedene Nullstellen x1 und x2 . Dann ist f für x ≥ x1 streng monoton
wachsend für x ≤ x1 , streng monoton fallend für x1 ≤ x ≤ x2 und wieder streng monoton
wachsend für x2 ≤ x. Durch Veränderung des konstanten Koeffizienten, kann man erreichen,
dass f eine, zwei, oder drei reelle Nullstellen hat.
e) Wenn Du magst, kannst Du noch ein wenig über Polynome 4. Grades herausfinden. Bei
positivem Leitkoeffizienten kann es zwei lokale Minima und dazwischen ein lokales Maximum
geben. das ist der Fall, wenn die Ableitung drei verschiedene Nullstellen hat. Usw. Überlege
insbesondere, dass ein Polynom 4. Grades entweder zwei verschiedene Wendepunkte oder gar
keinen solchen hat!
2. a) Zeige, dass die Abbildung ] − 1, 1] → R+ , gegeben durch x 7→
1−x
1+x
b) Zeige selbiges für die Abbildung ] − 1, 1[→ R, gegeben durch x 7→
bijektiv ist.
x
1−x2
3. Betrachte für x =
6 0 die Funktion f (x) = exp(−1/x2 ). Wenn x gegen 0 geht, so geht −1/x2
gegen −∞, also f (x) gegen 0. Deshalb definieren wir f auf ganz R, indem wir noch f (0) = 0
7.6. AMÜSANTE FRAGEN ZU POTENZEN
203
setzen. Da f (x) > 0 für x 6= 0 gilt, hat f in 0 ein (absolutes) Minimum. Das kann
man auch
2
−1
mit Hilfe der ersten Ableitung sehen. Diese ist nämlich f 0 (x) = 3 · exp
, also negativ
x
x2
für x < 0 und positiv für x > 0. Auf der anderen Seite kann man mit einiger Mühe beweisen,
dass f auch im 0-Punkt unendlich oft differenzierbar ist und f (n) (0) = 0 für alle n ≥ 0 gilt.
(Mit f (n) wird die n-te Ableitung von f bezeichnet, wo f (0) = f sei.)
4. Sei f die Funktion der vorigen Aufgabe und g : R → R definiert durch
−f (x) für x < 0
.
g(x) :=
f (x) für x ≥ 0
Auch diese Funktion ist überall unendlich oft differenzierbar und es gilt g (n) (0) = 0 für alle
n ≥ 0. Ferner hat g in 0 kein (lokales) Extremum.
√
5. Diskutiere die Funktionsgraphen von a) f (x) = x5 −x3 b) g(x) = x3 − 3 x c) h(x) = x2/3 +x−1
ln x
6. Der Graph der Funktion f (x) =
, die auf R∗+ definiert ist, wird im folgendem Abschnitt
x
diskutiert. Das darfst Du natürlich bereits jetzt selber machen.
7. Definiere f : ]− 1, 1[→ R durch f (0) = 0 und f (x) = |x|/(ln |x|) für x 6= 0. Außerhalb 0 ist
diese Funktion differenzierbar. Zeige, dass sie auch in 0 differenzierbar ist. Sie hat dort offenbar
ein absolutes Maximum.
7.6
Amüsante Fragen zu Potenzen
7.6.1 Für beliebige reelle Zahlen a, b gilt: a + b = b + a und ab = ba.
Für Potenzen ist das bekanntlich anders:
23 = 8, aber 32 = 9.
Allgemein gilt: Sind a, b natürliche Zahlen, a gerade, b ungerade, so ist ab gerade und ba ungerade. Für ganze Zahlen a, b mit 3 ≤ a < b ist ba < ab .
Hingegen gilt 24 = 42 . Gibt es weitere solche Fälle?
Wir vergleichen
278
94
9
27
mit
4
8
und rechnen:
278
9
=
4
2 ! 32 · 94 2· 32 · 94
3
3
=
=
2
2
3 ! 94 94
3
27
=
2
8
204
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Allgemeiner zeigt man ganz analog zur dieser Rechnung: Ist
n
n+1
1
1
a= 1+
, b= 1+
,
n
n
so gilt ab = ba . Man erkennt schon hier, dass es unendlich viele Paare verschiedener rationaler
Zahlen (a, b) mit ab = ba gibt.
7.6.2 Wir wollen alle Paare (x, y) positiver reeller Zahlen mit xy = y x finden. Will man Potenzen vergleichen, lohnt es sich häufig, sie zu logarithmieren! Es gilt:
xy = y x ⇐⇒ ln(xy ) = ln(y x ) ⇐⇒ y ln x = x ln y ⇐⇒
ln x
ln y
=
x
y
Will man also Paare (x, y) positiver reeller Zahlen mit xy = y x , x 6= y finden, so hat man die
ln x
Funktion f (x) =
darauf zu untersuchen, ob sie mehrfach denselben Wert annimmt!
x
Deshalb werden wir diese Funktion auf ihrem Definitionsbereich, d.h. dem Bereich der positiven
reellen Zahlen, jetzt diskutieren. Dabei benutzen wir die Differentialrechnung.
i. Nullstellen:
f (x) = 0 ⇐⇒ ln x = 0 ⇐⇒ x = 1.
Offenbar ist f (x) < 0 für 0 < x < 1 und f (x) > 0 für x > 1.
ii. Verhalten der Funktion nahe 0. Offenbar geht f (x) gegen −∞, wenn x (von oben) gegen 0
geht.
iii. Die Ableitung:
(1/x) · x − 1 · ln x
1 − ln x
=
2
x
x2
Also ist f 0 (x) = 0 genau dann, wenn x = e ist. Ferner ist f 0 (x) > 0 für 0 < x < e und f 0 (x) < 0
für x > e.
f 0 (x) =
Also kann man sich bereits ein Bild der Funktion machen. Ihr Graph steigt zwischen 0 und e
monoton an, läuft bei 1 durch die x-Achse, erreicht bei e ein Maximum und fällt für x > e
monoton, bleibt aber positiv.
iv. Verhalten für große x. Man weiß, dass die Logarithmusfunktion sehr langsam wächst. Deshalb
gilt limx→∞ f (x) = 0. Dies kannst Du leicht folgendermaßen sehen:
Da f (x) für x ≥ e monoton fallend ist, genügt es, eine monoton wachsende Folge (xn )n>0 zu
finden, für welche limn→∞ f (n) = 0 gilt. Eine solche Folge wird durch xn := en gegeben. Denn
für diese gilt: f (n) = n/en . Nun folgt aus der Exponentialreihe en > 1 + n + n2 /2 > n2 /2. Somit
ist
n
2n
2
f (n) = n < 2 =
e
n
n
Da letzter Bruch für n → ∞ gegen 0 geht, tut dies auch f (n).
Was erkennst Du aus den Eigenschaften i. bis iv.?
7.6. AMÜSANTE FRAGEN ZU POTENZEN
205
Zu jeder reellen Zahl x mit 1 < x < e gibt es genau eine weitere Zahl y mit f (x) = f (y), und
dieses y ist größer als e. Nicht wahr?
Es gibt also sehr viele Paare positiver reeller Zahlen (x, y), für die xy = y x , aber x 6= y gilt.
Verlangt man allerdings, dass x, y beide ganz und positiv sind, so ist, bis auf die Reihenfolge,
(2, 4) das einzige solche Paar, da 2 die einzige ganze Zahl ist die größer als 1 und kleiner als e
ist.
Beachte aber, dass auch (−2)−4 =
1
(−2)4
=
1
16
= (−4)−2 gilt.
7.6.3 Betrachte die Funktionen
1
1
f (x) := (1 + )x und g(x) := (1 + )x+1
x
x
für x > 0. Mit einiger Mühe kann man zeigen: Die Funktion f ist streng monoton wachsend,
während g streng monoton fallend ist. Ferner gilt:
1
1
lim (1 + )x = 1 und lim (1 + )x = e.
x→0
x→∞
x
x
Man berechnet leicht f (x)g(x) = g(x)f (x) . Somit hat man eine Parametrisierung der Paare (a, b)
positiver reeller verschiedener Zahlen mit ab = ba gewonnen.
Aus obigen Überlegungen folgt auch
Satz 7.6.4 a) Es gelte 0 < a < b ≤ e. Dann ist ab < ba .
b) Es gelte e ≤ a < b. Dann ist ba < ab . Z.B. ist π e < eπ .
ln x
ist auf dem Intervall ]0, e] streng monoton wachsend, wie wir
x
ln a
ln b
oben gesehen haben. Deshalb folgt aus der Voraussetzung, dass
<
. Dies impliziert
a
b
b ln a < a ln b. (Beachte a, b > 0.) Da exp streng monoton wächst, ergibt sich exp(b ln a) <
exp(a ln b), das heißt ab < ba .
Beweis:
a) Die Funktion
b) Auf dem Intervall [e, ∞[ hingegen ist o.a. Funktion streng monoton fallend. Deshalb ergibt
sich die umgekehrte Ungleichung.
Bemerkungen 7.6.5 a) Du hast vielleicht das Gefühl, dass der Exponent in einer Potenz in
stärkerem Maße ihre Größe bestimmt als die Basis. Das gilt aber nur, falls beide ≥ e sind.
Falls beide ≤ e und positiv sind, gilt das umgekehrte. Im Fall a < e < b kann alles Mögliche
passieren! Es ist 23 < 32 und 2,53 = 15,625 > 32,5 ≈ 15,59. Zu Anfang dieses Abschnittes haben
wir für die Zahlen a = 9/4, welches kleiner als e, und b = 27/8, welches größer als e ist, die
Gleichheit ab = ba besteht.
206
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
b) Zu meinem Erstaunen habe ich in einem neuen Mathe-Buch gelesen, im 19. Jahrhundert sei
es eine Herausforderung gewesen, zu entscheiden, welche der beiden Zahlen π e und eπ die größere
sei. Ich kann mir nicht vorstellen, dass Euler, der im 18. Jahrhundert gelebt hat, auch nur die
geringste Schwierigkeit mit diesem Problem gehabt hätte. Der Unterschied zwischen den beiden
Zahlen ist einerseits nicht allzu groß, andererseits nicht gerade winzig: π e ≈ 22,46, eπ ≈ 23,14.
7.6.6 Wir betrachten Potenztürme
·
··
a
aa
In der Literatur habe für einen solchen Potenzturm folgende abkürzende Notation gefunden:
nämlich n a, sprich ‘a Turm n’, wenn der Potenzturm n Stockwerke hat. Induktiv definiert, heißt
das:
n
1
a = a, n+1 a = a( a)
Beachte aber, dass fast immer
n+1
a 6= (n a)a ist!
Man kann die induktive Definition auch mit 0 a = 1 oder, sage und schreibe, mit
beginnen.
−1
a = 0
2
7.6.7 Die Folge (2, 22 , 22 , . . .) ist streng monoton√wachsend und besteht aus ganzen Zahlen.
Deshalb gilt limn→∞ n 2 = ∞. Auch die Folge (n ( 2))n ist streng monoton wachsend.
Denn
√ x
√
√ √2
die Funktion √f (x) := 2 ist streng monoton wachsend. Deshalb ist 2 < 2 , folglich
√ √ 2 √ √2 2
√
√
2 < 2
. Usw. Man sieht (mit vollständiger Induktion) n ( 2) < n+1 ( 2). Analog gehts
für alle (n b)n mit b > 1.
Sind die Limites dieser Folgen immer ∞?
Überraschender Weise gilt
√
lim n ( 2) = 2
n→∞
√
Beweis: Wenn man in dem Potenzturm n ( √
2) das oberste Stockwerk durch 2 ersetzt, erhält
man eine Zahl T , die sicher größer ist als n ( 2). Andererseits überlegt man sich leicht, dass
T = 2 ist. In einem exemplarischen Beispiel sieht man das so.
√
√
2
√ 2
2
√
√
2
2
=
2
=
√
2
2 =2.
√ 2
√
In √
jedem Schritt wird 2 = 2 genutzt. Es ist also n ( 2) < 2 für alle n ≥ 1. Da die Folge
(n ( 2))n monoton wachsend und durch 2 nach oben beschränkt ist, hat sie einen endlichen
Limes t ≤ 2.
2
Um t zu bestimmen, rechnen wir
√
t
2 =
√
√
limn→∞ n ( 2)
2
√
= lim n ( 2) = t
n→∞
√ t
Die Gleichung 2 = t hat die Lösungen t = 2 und t = 4. Durch eine Kurvendiskussion kannst
Du feststellen, dass sie keine weiteren haben kann. Wegen t ≤ 2 folgt t = 2. –
7.6. AMÜSANTE FRAGEN ZU POTENZEN
207
Diese Überlegungen kann man allgemeiner, statt nur für 21/2 für a1/a mit a ≥ 1 anstellen. Da
ln(a1/a ) =
ln a
a
ist, ist die größte der Zahlen unter den a1/a – mit a > 0 – die Zahl e1/e . (Beachte, dass nach
obigen Betrachtungen die Funktion ln x/x ein Maximum bei x = e hat.)
Für a ∈ [1, e] ist limn→∞ n (a1/a ) = a. Für a > e ist limn→∞ n (a1/a ) = b, wobei b ∈]1, e[ so
gewählt ist, dass ab = ba ist. Nicht wahr?
Zum Schluss beweisen wir
lim n b = ∞, falls b > e1/e gilt.
n→∞
Da die Folge (n b) monoton wachsend ist, genügt es zu zeigen, dass sie keinen endlichen Limes
hat. Wäre dieser gleich t, so würde bt = t, also b ≤ t1/t gelten (s.o.). Deshalb wäre b ≤ e1/e . –
Fragt man nach der Konvergenz von (n b)n für 0 < b < 1, so kann man beweisen, dass dieselbe
genau für die b ≥ (1/e)e gilt. Dabei ist zu beachten, dass die Folge (n b)n hier nicht mehr
monoton ist.
AUFGABEN
1. Sei ein gewisses Kapital auf Zinseszins mit 1 Prozent jährlicher Verzinsung angelegt. Nach
wievielen Jahren hat es sich (mindestens) verdoppelt?
2. Haben die Gleichungen
x2 = 3 und 2x = 3
eine gemeinsame Lösung? (Die Beantwortung dieser Frage ist sicher mit einem Taschenrechner,
der allgemeine Potenzen beherrscht, am schnellsten zu leisten. Aber versuche es ohne einen
solchen.) Hat eine dieser Gleichungen eine rationale Lösung?
3. Berechne ohne Taschenrechner
88
1/3
− (88 )1/3
5
3
+ 13
5
4. Welche Zahl ist größer, (1000 + 1/7)1000 oder 10001000+1/7 ?
√
√
5. a) Welche Zahl ist größer, 2 oder 3 3?
√
√
b) Sei n ≥ 3 ganz. Welche Zahl ist größer, n n oder n+1 n + 1?
√
c) Bestimme – falls möglich – limn→∞ n n.
6. Welche Zahl ist größer,
√
√
3
2
2
oder
√
3
√
2 2?
7. a) Seien a < b natürliche Zahlen. Zeige, dass 2 · 3a < 3b ist.
b) Folgere für die Potenztürme: m 3 > n 9, wenn m ≥ n+1, d.h. wenn der Dreierturm mindestens
ein ‘Stockwerk’ mehr als der Neunerturm hat.
208
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
8. Sei a > 2 reell und b = aa−1 (> a). Zeige für die Potenztürme
n+1
a > nb .
9. a) Die Idee (7.6.7) kann man zur Berechnung vieler Limites verwenden: Sei I ein Intervall
und f : I → I eine stetige Funktion, ferner b ∈ I. Betrachte die Folge (an ), definiert durch
a0 = b, an+1 = f (an ). Zeige: Wenn diese Folge den Limes a hat, so ist a eine Lösung der
Gleichung x = f (x).
b) Beachte, dass manchmal die Gleichung x = f (x) eine Lösung haben kann, ohne dass die
Folge (an ) konvergiert. Z.B. sei – mit obigen Bezeichnungen – I = R, f (x) = x2 , b = 2. Wenn
Du willst, kannst Du Dir überlegen, für welche b die Folge (an ) konvergiert.
√
c) Behandle den Fall I = R+ , b = 0, f (x) = c + x, wo c > 0 ist. (Zum Beweis der Konvergenz
der Folge (an ) zeige, dass diese monoton wachsend ist und eine obere Schranke hat. Ich glaube,
man sollte die Fälle c < 2 und c ≥ 2 unterscheiden. Im ersten Fall ist 2, im zweiten c eine obere
Schranke.)
x
10. Löse die Gleichung x(x ) = (xx )x im Bereich R∗+ der positiven reellen Zahlen.
2
11. Löse die Gleichungen a) 2x + 2111110 = 2111111 und b) 2x = 512x+28 .
7.7
Integration
Bereits die Mathematiker der Antike befassten sich damit, die Länge einer Kurve, z.B. des
Kreisumfangs, und die Größe eines ‘krumm’ begrenzten Flächenstücks, z.B. der Kreisfläche zu
bestimmen. Sie wussten, das das Verhältnis des Kreisumfangs zum Durchmesser gleich dem
Verhältnis der Kreisfläche zum Quadrat über dem Radius ist. Den Proportionalitätsfaktor nennen wir heute π. Archimedes hat ein Verfahren angegeben, π näherungsweise zu berechnen und
auch gezeigt, dass das Volumen einer Kugel vom Radius r gleich 34 πr3 ist. Archimedes ist es
auch gelungen, die Fläche eines Parabelabschnittes zu bestimmen.
Während diese Berechnungen eher Einzelfälle betrafen, kennen wir seit der zweiten Hälfte des
17. Jahrhunderten eine Methode, solcherart Fragestellungen anzugehen. Wir betrachten eine
stetige Funktion f und Flächenstücke zwischen zwei Grenzen unterhalb des Graphen von f und
oberhalb der x-Achse, wenn denn f (x) ≥ 0 in diesem Bereich ist. Ist f (x) stellenweise negativ,
so sollen die Flächenstücke, die nach unten durch den Funktionsgraphen und nach oben durch
die x-Achse begrenzt werden, negativ angerechnet werden.
7.7. INTEGRATION
209
+
–
Die große Idee von Newton, Leibniz und auch Vorgängern war es, eine der Grenzen als
variabel aufzufassen, so dass die Flächengröße wieder zu einer Funktion wird, die man häufig
(allerdings nicht immer) durch die uns bekannten Funktionen angeben kann.
Dies liegt an dem berühmten ‘Hauptsatz der Differential- und Integralrechnung’, den ich Dir
jetzt ans Herz legen möchte.
7.7.1 Ich will zunächst eine präzise Definition für Integrale (nach Riemann) angeben, damit
Du siehst, dass es eine solche überhaupt gibt, die zudem noch verhältnismäßig einfach ist.
Einige Sätze der Integralrechnung will ich dann aber als anschaulich einleuchtend ohne Beweis
angeben.
Wir beginnen mit Funktionen, die zwar im Allgemeinen nicht stetig sind, deren Integral aber
trivial zu definieren ist.
Definitionen 7.7.2 a) Eine Treppenfunktion auf einem endlichen abgeschlossenen Intervall
[a, b] ist eine Funktion f , für die es endlich viele reelle Zahlen t0 , . . . , tn mit a = t0 < t1 < · · · <
tn = b gibt, derart dass f auf jedem der offenen Intervalle ]ti−1 , ti [ konstant ist. (Für die Werte
f (ti ) wird nichts gefordert.)
b) Sei f : [a, b] → R eine Treppenfunktion mit zugehörigen t0 , . . . , tn wie oben und f (x) = ci
für x ∈]ti−1 , ti [. Das Integral von f ist dann folgendermaßen definiert:
Z b
n
X
f (x)dx :=
ci · (ti − ti−1 )
a
i=1
Das ist natürlich schlicht die Summe der Rechteckflächen, wobei die Rechtecke unterhalb der
x-Achse negativ gerechnet werden.
+
–
+
210
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Definitionen 7.7.3 a) Sei f : [a, b] → R eine beschränkte Funktion. (‘Beschränkt’ bedeutet: es gibt ein S ∈ R mit |f (x)| ≤ S für alle x ∈ [a, b].) Betrachte die Menge M aller
Treppenfunktionen s auf [a, b] mit s(x) ≥ f (x) für alle x ∈ [a, b]. Sie ist nicht leer, da die
konstante Funktion mit dem Wert S zu M gehört. Die Menge der Integrale
Z b
s(x)dx mit s ∈ M
a
ist nach unten durch −S · (b − a) beschränkt. Also hat sie ein Infimum. (S. 3.2.24.) Dieses
nennt man das Oberintegral von f .
b) Entsprechend ist das Unterintegral von f das Supremum der Menge aller Integrale über die
Treppenfunktionen, deren Werte überall kleiner oder gleich den jeweiligen Werte von f sind.
c) In dem Falle, dass das Oberintegral von f mit seinem Unterintegral übereinstimmt, heißt f
Riemann-integrierbar, und das gemeinsame Ober- und Unterintegral von f wird dann das
Integral von f genannt. Die Bezeichnung ist
Z b
f (x)dx.
a
Bemerkungen 7.7.4 a) Nicht jede beschränkte Funktion auf [a, b] ist Riemann-integrierbar,
z.B. nicht die Funktion, die auf den rationalen Zahlen den Wert 1, auf den irrationalen den
Wert 0 annimmt. Es gibt allerdings einen Integralbegriff, nämlich denjenigen nach Lebesgue
(sprich Lebeck, mit Ton auf der zweiten Silbe), der es gestattet, diese Funktion zu integrieren.
Sie hat das Integral 0, da sie nur in abzählbar vielen Punkten von der 0-Funktion abweicht.
Der Lebesguesche Integralbegriff ist weniger wegen obigen Beispiels, als für Funktionen von
mehreren (unabhängigen) Variablen von größter Wichtigkeit!
R
Rb
b) Das -Zeichen ist ein stilisiertes S für Summe, und a f (x)dx soll etwa folgende bedeuten:
Für jedes x ∈ [a, b] multipliziere f (x) mit der Länge dx eines unendlich kleinen Intervalls und
addiere alle diese Produkte. Du musst das nicht verstehen und darfst das dx schlicht als Zeichen
dafür ansehen, bezüglich welcher Variablen man integrieren soll, wenn etwa f eine Funktion
zweier Variablen ist.
Definition 7.7.5 Wir wollen auch das Integral definieren, wenn die Genzen vertauscht sind
und setzen
Z b
Z a
f (x)dx,
f (x)dx := −
a
b
wenn letzteres Integral existiert.
Ferner sei
Z
a
f (x)dx = 0.
a
Jetzt gebe ich drei Sätze ohne ihren Beweis an. Anschaulich sind sie allerdings sehr plausibel.
7.7. INTEGRATION
211
Satz 7.7.6 Jede stetige Funktion auf einem endlichen abgeschlossenen Intervall ist Riemannintegrierbar.
Satz 7.7.7 Seien a ≤ b ≤ c, so ist
Z c
Z b
Z c
f (x)dx =
f (x)dx +
f (x)dx,
a
a
b
wenn die linke (oder die rechte) Seite definiert ist.
a
b
c
Folgerung 7.7.8 Dasselbe gilt auch, wenn a, b, c in beliebiger Größenbeziehung zueinander stehen und f auf dem größten der Intervalle, die zwei der drei Punkte als Randpunkte haben,
integrierbar ist.
Satz 7.7.9 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R eine stetige
Funktion, dann gibt es ein ξ ∈ [a, b] mit
Z
b
f (x)dx = (b − a)f (ξ)
a
(f (ξ) ist der ‘Mittelwert’ der Funktion f auf [a, b].)
a
ξ
b
212
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Als Folgerung beweisen wir jetzt den Hauptsatz der Differential- und Integralrechnung:
Theorem 7.7.10 Sei I eine Intervall, a ∈ I und f : I → R eine stetige Funktion, dann ist die
Funktion
Z x
F (x) :=
f (t)dt
a
0
eine Stammfunktion von f . D.h. es gilt F (x) = f (x) für alle x ∈ I.
In diesem Sinne ist das Integrieren die Umkehrung des Differenzierens!
Beweis: Wir müssen für jedes x ∈ I die Differenzierbarkeit von F in x zeigen und F 0 (x) =
f (x) nachweisen. Wir betrachten einen Differenzenquotienten:
Z x+h
Z x
Z
1
1 x+h
1
F (x + h) − F (x)
=
f (x)dx −
f (x)dx =
f (x)dx = · h · f (ξ),
h
h
h x
h
a
a
wobei ξ eine (von h – nicht unbedingt eindeutig – abhängige) geeignete Zahl zwischen x und
x+h ist, die nach dem Mittelwertsatz der Integralrechnung existiert. Sei nun (hn ) eine Nullfolge
und jeweils ξn zwischen x und x + hn so gewählt, dass
Z x+hn
Z x+hn
1
f (t)dt = hn f (ξn ) , d.h.
f (t)dt = f (ξn )
hn x
x
gilt, so konvergiert die Folge (ξn ) gegen x. Wegen der Stetigkeit von f ist somit
F (x + h) − F (x)
= f (x)
h→0
h
lim
Folgerung 7.7.11 Sei f : [a, b] → R stetig und F : [a, b] → R eine Stammfunktion von f , d.h.
F sei differenzierbar mit F 0 = f . Dann gilt
Z b
f (x)dx = F (b) − F (a)
a
Beweis:
Definiere
Z
G(x) :=
x
f (t)dt
a
Wegen des Hauptsatzes 7.7.10 ist G eine Stammfunktion von f . Da nach Voraussetzung auch
F eine solche ist, gilt (G − F )0 = G0 − F 0 = f − f = 0, also ist G − F eine Konstante, die ich
mit c bezeichne. Ferner ist G(a) = 0. Dann ergibt sich
Z b
f (x)dx = G(b) = G(b) − G(a) = F (b) + c − (F (a) + c) = F (b) − F (a) .
a
b
Schreibweisen: F (b) − F (a) = F (x) = [F (x)]ba .
a
7.7. INTEGRATION
213
7.7.12 Auf Grund unserer Kenntnisse in der Differenzialrechnung wird es uns möglich sein, für
viele (durch einen Rechenausdruck gegebene) Funktionen f eine Stammfunktion F zu finden
(genauer: einen Rechenausdruck für F anzugeben). Du wirst z.B. keine Probleme haben, eine
Stammfunktion einer Polynomfunktion als eine ebensolche anzugeben.
Eine Stammfunktion F einer stetigen Funktion f (auf einem Intervall) nennt man auch (ein)
unbestimmtes Integral von f und schreibt häufig
Z
Z
f (x)dx = F (x) oder
f (x)dx = F (x) + C
F ist ja bis auf einen konstanten Summanden (der durch das +C angedeutet wird) eindeutig
bestimmt. Ebenso ersetzt man häufig den Ausdruck ‘eine Stammfunktion von f bestimmen’
durch ‘f integrieren’.
In folgender Tabelle sind in der rechten Spalte Stammfunktionen der linksstehenden Funktionen
verzeichnet:
xa , a ∈ R, a 6= −1
x−1
(1+x2 )−1
(1-x2 )−1/2
ex
sin x
cos x
cos−2 x
(a+1)−1 xa+1
ln |x|
arctan x
arcsin x
ex
-cos x
sin x
tan x
Der Hauptsatz der Differenzial- und Integralrechnung lehrt uns, dass jede stetige Funktion
auf einem Intervall eine Stammfunktion besitzt. Das bedeutet allerdings nicht, dass man eine
solche als eine Zusammensetzung, der uns bekannten Funktionen schreiben kann. Dies ist z.B.
2
für eine Stammfunktion von ex nicht möglich. (Das besagt ein Satz von Liouville. Für
neuere Literatur siehe das Stichwort Elementare Funktion“ in der Wikipedia. ) Natürlich
”
2
bedeutet dieser Satz nicht, dass es keine Stammfunktion von ex gäbe! Jede auf einem Intervall
stetige Funktion hat schließlich dort eine Stammfunktion. Man kann sie nur nicht wie gewohnt
schreiben.
Und so schrecklich ist das ja auch nicht, wenn man folgendes bemerkt:
x2
e
=
∞
X
x2n
n=0
n!
.
Nun gibt es einen Satz, dass man Potenzreihen gliedweise integrieren darf (jedenfalls im ‘Innern’
2
ihres Konvergenzbereiches). Als eine Stammfunktion von f (x) = ex erhält man somit
F (x) =
∞
X
n=0
x2n+1
.
n!(2n + 1)
214
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Wenn man eine rationale Funktion (d.h. einen Bruch von zwei Polynomen) differenziert, entsteht wieder eine rationale Funktion. Wenn man aber die rationale Funktion x1 integriert, so
erhält man ln x, eine Funktion, von der man zeigen kann, das sie nicht rational ist. An diesem
2
Beispiel und am Beispiel ex sieht man, dass es im Allgemeinen nicht so einfach sein kann,
Stammfunktionen so zu berechnen, wie wir es bei der Bestimmung von Ableitungen gewohnt
sind. (Das ist der Sinn der manchmal geäußerten Ansicht: ‘Differenzieren ist ein Handwerk,
Integrieren eine Kunst.’) Z.B. kann man ja die Funktionen, die aus c, x, exp, sin (wo mit c eine
konstante Funktion, mit x die identische Abbildung R → R gemeint sind) entstehen, indem
wir die Operationen Summe, Produkt, Quotient, Umkehrabbildung, Verkettung – auch iteriert
– anwenden, nach den bekannten Regeln differenzieren.
Diese Regeln liefern allerdings meist nur Hinweise darauf, wie man möglicher Weise Stammfunktionen findet. Zum Glück gilt noch folgendes: Sind F, G Stammfunktionen der Funktionen
f, g. so ist F +G eine Stammfunktion von f +g und cF eine solche von cf , falls c eine Konstante
ist. Nicht wahr? Aber schon die Anwendung der Produktregel der Differentiation liefert keine
so bequeme Regel.
Seien F, G Stammfunktionen von stetigen Funktionen f , bzw, g. Dann ist (F G)0 = F 0 G+F G0 =
f G + F g. Also gilt:
Theorem 7.7.13 (Partielle Integration) Unter obigen Voraussetzungen ist
Z
Z
Z
Z
0
f Gdx = F G − F gdx, oder anders geschrieben
F Gdx = F G − F G0 dx.
Für das bestimmte Integral, erhält man
Z b
b Z b
0
F G0 dx.
F Gdx = F G −
a
a
a
Beispiele 7.7.14 Die Methode der partiellen Integration ist erstaunlich nützlich, und zwar
nicht nur zur Berechnung spezieller Stammfunktionen und Integrale, sondern auch in allgemeinen Zusammenhängen.
Man kann die partielle Integration auf ein Produkt f G von Funktionen immer dann anwenden,
wenn man eine Stammfunktion F von f kennt und das Produkt F g = F G0 leichter als f G =
F 0 G integrieren kann.
Beispiel 1. Ist z.B. f = 1 konstant und G(x) = ln x, so erhält man
Z
Z
Z
1
ln xdx = 1 · ln x dx = x ln x − x · dx = x ln x − x
x
Zu demselben Ergebnis kommt man natürlich auch, wenn man versuchsweise die Funktion x ln x
differenziert.
Beispiel 2. Versuche (für ganze n ≥ 2) die Funktion sinn x zu integrieren, indem Du sinn x in
die Faktoren sin x und sinn−1 x zerlegst:
Z
Z
n
n−1
sin xdx = − cos x sin
x + cos2 x · (n − 1) sinn−2 x =
7.7. INTEGRATION
215
− cos x sin
n−1
Z
x+
(n − 1)(1 − sin2 x) sinn−2 xdx
(Du
die Ableitung von sinn−1 x berechnen.) Indem Du auf beiden Seiten das Integral
R musst dazu
(n − 1) sinn xdx addierst, erhältst Du
Z
Z
n
n−1
n sin xdx = − cos x sin
x + (n − 1) sinn−2 xdx .
So reduzierst Du die Berechnung einer Stammfunktion von sinn x zu einer solchen von sinn−2 x.
Wenn Du dies Verfahren iterierst, kommst Du schließlich bei sin x oder 1 an, je nachdem ob n
ungerade oder gerade ist.
7.7.15 Wenn man die verkettete Funktion F (ϕ(t)) (mit differenzierbaren F, ϕ) nach t ableitet,
erhält man nach der Kettenregel:
F 0 (ϕ(t)) · ϕ0 (t).
Daraus ergibt sich
Theorem 7.7.16 (Substitutionsregel.) Ist I ein Intervall, f : I → R stetig, ϕ : [a, b] → I stetig
differenzierbar (d.h. ϕ ist differenzierbar und ϕ0 ist stetig), so gilt
Z ϕ(b)
Z b
0
f (x)dx .
f (ϕ(t))ϕ (t)dt =
ϕ(a)
a
Beweis:
Sei F eine Stammfunktion von f . Dann ist F (ϕ(t)) eine Stammfunktion von
0
f (ϕ(t))ϕ (t) bezüglich t, also
Z b
ϕ(b) Z ϕ(b)
b
0
f (x)dx .
=
f (ϕ(t))ϕ (t)dt = F (ϕ(t)) = F (x)
a
a
ϕ(a)
ϕ(a)
b
Bist Du verwirrt? Bedenke, dass ich unter F (ϕ(t)) die Differenz F (ϕ(b)) − F (ϕ(a)) und
a
ϕ(b)
dieselbe Differenz F (ϕ(b)) − F (ϕ(a)) verstehe! Vielleicht ziehst Du es vor, der
unter F (x)
ϕ(a)
b
t=b
ϕ(b)
Genauigkeit halber statt F (ϕ(t)) den Ausdruck F (ϕ(t)) und statt F (x)
den Ausdruck
a
t=a
ϕ(a)
x=ϕ(b)
zu schreiben.
F (x)
x=ϕ(a)
Beispiele 7.7.17 a) Ist F eine Stammfunktion von f , so ist 1c F (cx+d) eine solche von f (cx+d),
wenn c, d Konstanten mit c 6= 0 sind. Wenn man eine Stammfunktion von f kennt, kennt man
auch eine solche von f (cx + d)
b) Wenn man eine Stammfunktion F einer stetigen Funktion f : I → R (mit einem Intervall I)
bestimmen kann, so kann man auch eine Stammfunktion (bezüglich t) von der Funktion t · f (t2 )
216
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
auf einem Intervall J bestimmen, wenn nur {x2 | x ∈ J} in I liegt. Eine solche Stammfunktion
1 2
2
ist 12 F (t2 ). (Woher kommt der Faktor 21 ?) Insbesondere ist ex eine Stammfunktion von x · ex .
2 2
Dies ist bemerkenswert, da man ja eine Stammfunktion von ex nicht durch die uns geläufigen
Funktionen ausdrücken kann.
c) Wir wollen die Fläche eines Halbkreises vom Radius 1 bestimmen. Erinnere Dich, dass die
Zahl π als die halbe Länge des Umfangs des Einheitskreises definiert ist. Ferner wird durch den
Sinus das Intervall [−π/2, π/2] bijektiv und monoton auf das Intervall [−1, 1] abgebildet. Dabei
ist sin(−π/2) = −1, sin(π/2) = 1. Weitere Eigenschaften von sin und cos sind:
sin2 t + cos2 t = 1,
cos(2t) = cos2 t − sin2 t
Hieraus folgt
cos t =
p
1 − sin2 t für diejenigen t wo cos t ≥ 0 ist,
und cos(2t) = 2 cos2 t − cos2 t − sin2 t = 2 cos2 t − 1 .
Wir rechnen, indem wir x = sin t setzen (substituieren)
Z π/2 p
Z
Z 1√
2
1 − x2 dx =
1 − sin t cos tdt =
−1
−π/2
Z
π/2
−π/2
π/2
cos2 tdt =
−π/2
1
1
1 π/2
π
(cos(2t) + 1)dt = ( sin(2t) + t)
= ,
2
4
2 −π/2
2
da sin(−π) = sin(π) = 0 ist. Die Flächengröße des ganzen Kreises ist doppelt so groß also gleich
π. Dies gilt für einen Kreis vom Radius 1. Ein Kreis vom Radius r hat dann die Flächengröße
πr2 . Beachte: Wir haben π als halben Umfang des Einheitskreises definiert. Jetzt haben wir
gezeigt, dass mit dieser Definition π die Flächengröße des Einheitskreises ist. Das ist nicht
tautologisch.
d) Das Riemannsche Integral bestimmt die Größe der Fläche unter einem Funktionsgraphen,
indem es diese Fläche durch die Vereinigung von gewissen Rechtecksflächen approximiert.
Natürlich darfst Du fragen: Wie kanonisch ist dies? Glücklicherweise kommt beim Kreis dasselbe
heraus, wenn man seine Fläche durch regelmäßige n-Ecke approximiert, die ihre Mittelpunkte
mit dem Kreis gemeinsam haben. Aber das könnte ja Zufall sein.
e) Wir wollen uns aber über diese Skrupel hinwegsetzen und das Volumen der Einheitskugel
im R3 bestimmen, indem wir die Kugel durch Vereinigungen von Kreiszylinderscheiben approximieren, deren Achsen mit der x-Achse übereinstimmen. Das bedeutet, dass das Volumen
das Integral von −1 bis 1 über die Flächengröße der Schnittkreise (mit der Kugel) derjenigen
Ebenen ist, die senkrecht auf der x-Achse stehen und√diese im Punkt x schneiden. D.h. wir betrachten die Funktion f : [−1, 1] → R, wo f (x) = π( 1 − x2 )2 = π(1 − x2 ) ist, und berechnen
das Integral über diese Funktion von −1 bis 1.
Als Volumen der Einheitskugel ergibt sich so
Z 1 √
Z 1
3 1
x
1
1
4
2
2
V =
π( 1 − x2 ) dx = π
(1 − x )dx = π x −
= π((1 − ) − (−1 + )) = π
3 −1
3
3
3
−1
−1
7.8. DAS INTEGRALVERGLEICHSKRITERIUM
217
Das Volumen der Kugel vom Radius r ist somit 43 πr3 .
AUFGABEN
1. Bestimme Stammfunktionen von arcsin x und arctan x. (Verwende partielle Integration, wo der
erste Faktor 1 ist, ferner die Beispiele a) und b) aus (7.7.17).)
2. Zeige, dass π irrational ist.
Angenommen es wäre π = a/b mit a, b ∈ N1 . Berechne
Z
1 π n
x (a − bx)n sin xdx
n! 0
und Du erhältst eine ganzzahligen Wert, der natürlich > 0 ist. Andererseits kann er nach oben
durch eine Zahl abgeschätzt werden, die mit wachsendem n beliebig klein wird.
7.8
Das Integralvergleichskriterium
Definition 7.8.1 Sei a ∈ R und f : [a, ∞[→ R eine stetige Funktion. Dann definiert man das
uneigentliche Integral
Z b
Z ∞
f (x)dx := lim
f (x)dx ,
a
b→∞
a
so denn der Limes definiert ist.
(Verwechsle nicht die Adjektive ‘unbestimmt’ und ‘uneigentlich’.) Man kann auch in anderen
Fällen versuchen, uneigentliche Integrale zu definieren, z.B. wenn f auf ] − ∞, a] definiert ist,
aber auch wenn f auf einem (halb)offenen Intervall, aber nicht in den Randpunkten oder einem
von ihnen definiert ist.
Beispiel 7.8.2 Sei zum Beispiel r > 1, so gilt
b
Z ∞
1
1
1
1
1
dx
=
lim
−
=
lim
−
+
=
b→∞
xr
(r − 1)xr−1 1 b→∞
(r − 1)br−1 r − 1
r−1
1
Beachte r − 1 > 0.
Es gilt folgendes sehr nützliche Konvergenzkriterium für unendliche Reihen.
Theorem 7.8.3 Sei f : [1, ∞[→ R+ eine stetige monoton fallende Funktion. Die unendliche
∞
X
Reihe
f (n) ist genau dann konvergent (mit einem endlichen Limes), wenn das uneigentliche
n=1
R∞
Integral 1 f (x)dx existiert (und einen endlichen Wert hat).
218
KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG
Beweis: Die ‘Treppen’-Funktion go : [1, ∞[→ R, die durch go (x) = f (n) für x ∈ [n, n + 1[
definiert ist, erfüllt go (x) ≥ f (x) für alle x ∈ [1, ∞[. Die Funktion gu , die durch gu (x) = f (n+1)
für x ∈ [n, n + 1[ definiert ist, erfüllt gu (x) ≤ f (x).
Daraus folgt
k−1
X
n=1
Z
k
k
Z
go (x)dx ≥
f (n) =
1
f (x)dx und
1
k
X
Z
k
Z
gu (x)dx ≤
f (n) =
1
n=2
k
f (x)dx .
1
Die Partialsummen der Ausgangsreihe kann man also durch Integrale von f über endliche
Abschnitte nach unten abschätzen. Lässt man den ersten Summanden der Reihe weg, ergibt
sich eine Abschätzung nach oben.
Wir hatten Treppenfunktionen auf beschränkten Intervallen mit endlich vielen ‘Stufen’ definiert.
Die Funktionen go , gu sind auf dem unbeschänkten Intervall [1, ∞[ definiert und haben unendlich
viele Stufen, sind aber doch so etwas ähnliches.
Beispiele 7.8.4 a) Das Integral
Z
∞
x−s dx
1
ist für s > 1 endlich, hingegen unendlich für s ≤ 1. Deshalb konvergiert die Reihe
für s > 1 und divergiert für s ≤ 1.
P∞
n=1
n−s
Wir bekommen also eine Funktion
ζ : ]1, ∞[ → R, ζ(s) :=
∞
X
n−s .
n=1
(ζ ist der kleine griechische Buchstabe zeta, nicht zu verwechseln mit ξ, gesprochen xi.) Diese
sogenannte Zeta-Funktion ist für die Primzahltheorie sehr nützlich, wenn man sie zu einer
Funktion einer komplexen Veränderlichen erweitert. Im Rahmen der Einführung der komplexen
Zahlen will ich Dir (ohne Beweis) einiges dazu sagen.
b) Betrachte die Funktion f (x) = ln(ln x). Wo ist sie definiert, wenn man den natürlichen
Logarithmus nur für positive Zahlen definiert? Berechne f 0 . Zeige, dass
∞
X
n=2
1
divergiert.
n · ln n
c) Berechne die Ableitung der Funktion −(ln x)−1 und zeige, dass die Reihe
∞
X
n=2
1
konvergiert.
n · (ln n)2
Kapitel 8
Komplexe Zahlen
Eine Ebene voller Zahlen
8.1
Was sind die komplexen Zahlen?
Glaub mir: Die Erfindung oder – so man will – Entdeckung der komplexen Zahlen ist sicher
eine der wunderbarsten Leistungen unserer mathematischen Vorfahren.
Wenn man von den natürlichen Zahlen aus über die ganzen und rationalen Zahlen schließlich zu
den reellen Zahlen gelangt ist, ist ein gewisser Abschluss erreicht. Man kann z.B. jeden Punkt
des (euklidischen) Raumes – nach Festlegung eines Koordinatensystems – durch ein Tripel
reeller Zahlen beschreiben, was bekanntlich nicht möglich ist, wenn man sich auf die rationalen
oder die positiven reellen Zahlen beschränkt. Wen stört es eigentlich ernsthaft, dass man aus
negativen Zahlen keine Quadratwurzeln ziehen kann? Man verzichtet ja auch darauf, durch 0
zu dividieren.
8.1.1 Die erste Ahnung davon, dass sich möglicherweise doch hinter der durch reelle Zahlen beschriebenen Realität eine mathematisch relevante Wirklichkeit verbirgt, bekamen unsere
Vorfahren in der Renaissance.
Kubische Gleichungen: Du bist sicher in der Lage, quadratische Gleichungen – d.h. solche
der Form x2 +px+q = 0 – zu lösen. Auf die sogenannte ‘p-q-Formel’ kommt man durch die ‘quadratische Ergänzung’. Wenn man analog eine ‘kubische Ergänzung’ auf kubische Gleichungen
(d.h. solche 3. Grades) anzuwenden versucht, erreicht man lediglich eine Reduktion auf Gleichungen der Form x3 + px + q = 0. (D.h. das quadratische Glied kann man zum Verschwinden
bringen.) Eine Lösungsformel für diese Gleichung fand (wahrscheinlich) Tartaglia im Jahre
1535:
s
s
r
r
3
3
q
q 2 p3
q
q 2 p3
+
+ − −
+
x= − +
2
4
27
2
4
27
p
√
3
3
Für
die
Gleichung
x
−3x+2
=
0
z.B.
liefert
Tartaglias
Formel
die
Lösung
x
=
−1
+
1 − 1+
p
√
3
−1 − 1 − 1 = −2, die offenbar richtig ist. (Allerdings ist 1 eine weitere Lösung.) Ebenso
219
220
KAPITEL 8. KOMPLEXE ZAHLEN
erhält man mit Tartaglias Formel die Lösung 0 der Gleichung x3 + x = 0. (Diese ist übrigens
ihre einzige Lösung im Bereich der reellen Zahlen.)
Bei der ebenso simplen Gleichung x3 − x = 0 scheint allerdings Tartaglias Formel zu versagen.
Sie ergibt
sr
s r
1
1
3
3
x=
− + − −
27
27
Die (richtige) Lösung 0 erhält man nur dann,
q wenn man sich großzügig darüber hinwegsetzt,
1
dass der zweimal vorkommende Ausdruck − 27
im Bereich der reellen Zahlen gar keinen Sinn
hat. An dieser Stelle würde man eben doch ganz gerne Quadratwurzeln aus negativen Zahlen
ziehen können! Die weiteren Lösungen 1 und -1 scheint man mit Tartaglias Formel gar nicht zu
finden.
Dies sollte weniger ein Grund zur Resignation sein, als einer dafür, Quadratwurzeln aus negativen Zahlen einen Sinn zu geben. Umso mehr, als in Tartaglias Formel solche merkwürdigen
Ausdrücke häufig genug auftreten, nämlich immer gerade dann, wenn die Gleichung drei
verschiedene reelle Lösungen hat. (Es gibt auch keine besseren anderen Formeln, die außer
den Grundrechenarten lediglich Wurzeln verwenden, mit denen man dieses unangenehme
Phänomen, casus irreducibilis genannt, vermeiden kann!)
8.1.2 Die komplexen Zahlen bilden einen Körper, der mit C bezeichnet wird, und dessen Elemente man in der Form a + bi schreiben kann, wo a, b reelle Zahlen sind, und i eine neue Zahl
mit der Eigenschaft i2 = −1 ist. Wie Du bald sehen wirst, darfst Du ganz naiv mit diesen
‘Zahlen’ rechnen und jedesmal i2 durch −1 ersetzen.
Es gibt viele Gründe, warum die komplexen Zahlen aus der modernen Mathematik nicht mehr
wegzudenken sind. Dass man Tartaglias Formel immer einen Sinn geben kann, ist nur ein
kleines Beispiel. Ich nenne Dir weitere Gründe:
1. In Bezug auf die Existenz von Lösungen algebraischer Gleichungen gilt der so genannte Fundamentalsatz der Algebra. Dieser besagt: Jedes nichtkonstante Polynom mit komplexen
Koeffizienten hat mindestens eine komplexe Nullstelle.
Z.B. ist x2 −2x+2 = (x−1)2 +1, also im Reellen immer echt größer als 0, hat aber im Komplexen
die Nullstellen 1+i, 1−i, besitzt also die Linearfaktorzerlegung x2 −2x+2 = (x−1−i)(x−1+i).
Ein weiteres Beispiel ist x4 + 1, welches keine reellen, aber die folgenden vier komplexen Nullstellen hat:
√
√
2
2
±
i.
±
2
2
Dieses wirst Du unten sehen.
Wenn ein Polynom f erst einmal eine Nullstelle α hat, kann man, wie Du weißt, den entsprechenden Linearfaktor x − α abspalten, d.h. man kann f = (x − α) · g mit einem Polynom g
schreiben. Deshalb bedeutet der Fundamentalsatz der Algebra letztlich, dass jedes Polynom
über den komplexen Zahlen in Linearfaktoren zerfällt. Insbesondere gilt dies für das Polynom
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
221
xn − 1, welches trivialerweise die Nullstelle 1, und bei geradem n noch die Nullstelle −1 hat. Es
hat darüber hinaus noch n − 1, bzw. n − 2 komplexe nicht reelle Nullstellen! Wenn man sich die
komplexen Zahlen als Punkte einer Ebene veranschaulicht, liegen die Nullstellen des Polynoms
xn − 1 auf dem Einheitskreis und bilden dort die Ecken eines regelmäßigen n-Ecks. (Dies wollen
wir weiter unten beweisen!) Von dieser Beobachtung ausgehend hat Gauss die Frage angehen
können, welche regelmäßigen n-Ecke mit Zirkel und Lineal konstruierbar sind.
2. Nach einem interessanten und grundlegenden Satz von Hilbert, seinem sogenannten Nullstellensatz, folgt aus dem Fundamentalsatz der Algebra, dass auch Systeme von Polynomen
in mehreren Variablen gemeinsame (komplexe) Nullstellen haben, es sei denn, dies ist aus trivialen Gründen nicht möglich. Betrachte als Beispiel die Polynome x2 + y 2 − 1 und x − 2, deren
Nullstellen in der reellen Ebene einen Kreis, bzw. eine außerhalb dieses Kreises verlaufende Gerade ausmachen, die demnach keine gemeinsame reelle
haben
√ Nullstelle haben. Im Komplexen
√
sie jedoch die gemeinsamen Nullstellen (x1 , y1 ) = (2, 3·i) und (x2 , y2 ) = (2, − 3·i). Hingegen
können die 3 Polynome x, y, 2x + 3y + 1 offenbar trivialerweise keine gemeinsame Nullstelle
haben. (Wenn Dir diese Bedingung zu schwammig erscheint, darfst Du sie folgendermaßen definieren: Man sagt, Polynome f1 , . . . , fn in einer oder mehreren Variablen haben trivialerweise
keine gemeinsame Nullstelle, wenn es Polynome g1 , . . . , gn mit f1 g1 + · · · + fn gn = 1 gibt.)
Hilberts Nullstellensatz gehört zu den Grundlagen der klassischen Algebraischen Geometrie. Leider kann ich hierauf nicht näher eingehen.
3. Die Funktion exp kann man auch für beliebige komplexe Argumente erklären, nämlich durch
die bekannte Potenzreihe. Es ergibt sich ein Zusammenhang zwischen exp, sin, cos, den man
im Reellen nicht herstellen kann. S.u.
4. Diesen Zusammenhang nutzen die Elektrotechnik und die Physik, insbesondere die Quantentheorie. Nicht nur in der Mathematik werden die komplexen Zahlen gebraucht!
5. Es gibt eine reichhaltige und schöne Theorie der differenzierbaren komplexwertigen Funktionen auf Bereichen der komplexen Zahlenebene, die so genannte Funktionentheorie. Als
erstes zeigt man, dass sich eine solche Funktion in der Nähe eines jeden Punktes, wo sie definiert ist, als Potenzreihe darstellen lässt. (Funktionen f : I → R, wo I ⊂ R ein Intervall ist,
können sogar unendlich oft differenzierbar sein, ohne dass sie sich um jeden Punkt von I in
eine Potenzreihe entwickeln lassen.)
6. Es gibt überraschende Anwendungen der Funktionentheorie in der Theorie der Primzahlen.
Eine Ahnung davon gebe ich Dir im 2. Abschnitt.
7. In der Algebra und der algebraischen Zahlentheorie sind die komplexen Zahlen genau so wie
die reellen beheimatet.
8. Die berühmte Fermat’sche Vermutung, dass es nämlich für ganze n ≥ 3 keine von 0 verschiedenen ganzen Zahlen x, y, z gibt, so dass xn + y n = z n ist, wurde erst vor etwa 25 Jahren
von A. Wiles (mit Vor- und Nacharbeiten anderer Mathematiker) bewiesen und zwar mit
Hilfsmitteln, die ohne komplexe Zahlen nicht auskommen.
Bemerkung hierzu: In dem überaus spannenden Buch ‘Verdammnis’ von Stieg Larsson bekommst Du
vielleicht den Eindruck, die Fermatschen Vermutung beziehe sich nur auf den Fall n = 3. Dieser Fall
222
KAPITEL 8. KOMPLEXE ZAHLEN
wurde allerdings möglicher Weise bereits von Fermat selbst (ohne dass wir wüssten, wie) später von
Euler mit einer gewissen Ungenauigkeit, schließlich aber von Gauss, Kummer u.a. makellos erledigt.
8.1.3 Wir konstruieren jetzt den Körper C der komplexen Zahlen. Die Abbildung
a 0
F : R → M2 (R) , definiert durch F (a) :=
0 a
0
ist injektiv, erfüllt
F (a+a
) = F (a)+F (a0 ), F (aa0 ) = F (a)F (a0 ) und bildet die 1 von R auf das
1 0
Einselement
von M2 (R) ab. Vermöge dieser Abbildung betrachten wir den Körper R
0 1
als Unterring des Ringes M2 (R). In diesem Ring werden wir C als Erweiterungskörper von R
finden.
(Wie Du weißt, fasst man ja auch die ganzen Zahlen als gewisse
Brüche
auf, nämlich n als den
n
a 0
Bruch . Indem wir hier die reelle Zahl a als die Matrix
auffassen, tun wir etwas
0 a
1
ganz analoges!)
Zunächst sei C die Menge der Matrizen folgender Gestalt
a −b
1 0
0 −1
=a
+b
b a
0 1
1 0
Vielleicht hast Du Dir anhand früherer Aufgaben bereits überlegt, dass C ein kommutativer Unterring von M2 (R) ist. Dass die Nullmatrix, die Einsmatrix, die Summe zweier solcher Matrizen
und das additiv Inverse einer solchen Matrix von obiger Gestalt sind, ist trivial. Du musst aber
unbedingt nachrechnen (oder bereits nachgerechnet haben), dass das Produkt zweier solcher
Matrizen auch wieder von dieser Gestalt und dass die Multiplikation dieser speziellen Matrizen
kommutativ ist. In dem vollen Matrizenring ist sie es ja nicht!
8.1.4 Es gilt
det
a −b
b a
= a2 + b 2 .
2
2
Die Quadratsumme
mit a, b ∈ R ist aber nur dann gleich 0, wenn sowohl a = 0, als auch
a +b a −b
b = 0 ist. Ist also
nicht die Nullmatrix, d.h. mindestens eine der beiden Zahlen a, b
b a
ungleich 0, so gibt es ein (multiplikativ) Inverses dieser Matrix, nämlich
1
a b
.
a2 + b2 −b a
Du siehst, die Menge C der betrachteten Matrizen ist ein Körper.
0 −1
8.1.5 Wir bezeichnen die Matrix
jetzt mit i. Dann dürfen wir schreiben
1 0
a −b
1 0
0 −1
=a·
+b·
= a + bi
1 0
b a
0 1
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
223
Die komplexen Zahlen bilden insbesondere einen R-Vektorraum, der isomorf zu R2 ist. Eine
Basis wird von den Elementen 1 und i gebildet. Insbesondere ist
(a1 + b1 i) + (a2 + b2 i) = (a1 + a2 ) + (b1 + b2 )i .
Offenbar ist
2
i =
2
0 −1
1 0
=
−1 0
0 −1
= −1
Da für komplexe Zahlen die Körpergesetze gelten, dürfen wir wie gewohnt rechnen und dabei
immer i2 = −1 setzen. Zum Beispiel ist
(a1 + b1 i)(a2 + b2 i) = a1 a2 + a1 b2 i + a2 b1 i + b1 b2 i2 = (a1 a2 − b1 b2 ) + (a1 b2 + a2 b1 )i
Als Matrix geschrieben ist letzter Ausdruck gleich
a1 a2 − b1 b2
a1 b 2 + a2 b 1
a1 −b1
a2 −b2
=
.
−(a1 b2 + a2 b1 ) a1 a2 − b1 b2
b 1 a1
b2 a2
Und so muss es ja auch sein, nicht wahr?
Eine Matrix der Form
a −b
b a
ist natürlich durch das Paar (a, b) gegeben. Letzteres kann man nun als Vektor oder Punkt in
einer Ebene mit einem orthonormalen Koordinatensystem auffassen. Wenn Du dieses Paar mit
der komplexen Zahl a + bi identifizierst, so siehst Du, dass man jede komplexe Zahl auf folgende
drei Weisen schreiben kann:
a −b
= a + bi = (a, b)
b a
Das multiplikativ Inverse von a + bi ist
a2
b
a
− 2
i, falls a + bi 6= 0 gilt, nicht wahr?
2
+b
a + b2
√
Achtung: Ich möchte Dich davor warnen, i = −1 zu √
schreiben
dann unvorsichtig
√ damit
√ undp
2
umzugehen! Du könntest ja etwa folgendes rechnen i = −1· −1 = (−1) · (−1) = 1 = 1 .
8.1.6 Sei nun (a, b) 6= (0, 0). Betrachte folgendes Bild:
2i
(a,b)
i
ϕ
–2
–1
1
–i
1
2
3
224
KAPITEL 8. KOMPLEXE ZAHLEN
Wenn ϕ der in diesem Bild angegebene Winkel ist, gilt also
√
(a, b) = a2 + b2 · (cos ϕ , sin ϕ)
√
Dabei ist a2 + b2 die Länge des Vektors (a, b). In der Matrizenschreibweise bedeutet dies
√
a −b
cos ϕ − sin ϕ
2
2
= a +b ·
b a
sin ϕ cos ϕ
Die Matrix auf der rechten Seite ist die Drehmatrix um den Winkel ϕ. Wir wissen, dass das
Produkt zweier solcher Drehmatrizen um die Winkel ϕ, bzw. ψ die Drehmatrix um den Winkel
ϕ + ψ ist. Es ergibt sich:
Satz 8.1.7 Seien a + bi, a0 + b0 i komplexe Zahlen 6= 0 (mit a, b, a0 , b0 ∈ R) und ϕ, bzw. ϕ0 die
Winkel der Vektoren v = (a, b), bzw. w = (a0 , b0 ) mit der positiven√reellen Halbachse.
Dann hat
√
das Produkt der beiden Zahlen, aufgefasst als Vektor, die Länge a2 + b2 · a02 + b02 und den
Winkel ϕ + ϕ0 mit der positiven reellen Halbachse.
Definitionen 8.1.8 Sei a + bi mit reellen a, b eine komplexe Zahl.
a) Die reelle Zahl a heißt der Realteil von a + bi. Bezeichnung: a = Re(a + bi).
b) Die reelle Zahl b heißt der Imaginärteil von a + bi. Bezeichnung: b = Im(a + bi). (Beachte,
dass nach dieser – allgemein üblichen – Definition der Imaginärteil einer komplexen Zahl eine
reelle Zahl ist. Man könnte es natürlich auch anders machen.)
√
√
c) Der Betrag von a + bi ist a2 + b2 . Bezeichnung |a + bi| = a2 + b2 .
d) Der Winkel, den der Vektor (a, b) mit der positiven reellen Halbachse bildet, heißt das Argument von a + bi. Dieser Winkel ist lediglich bis auf Vielfache von 2π = 360◦ definiert.
Schreibweise: arg(a + bi) = ϕ, wobei ϕ wie im letzten Satz definiert wird.
e) Die zu a + bi konjugierte komplexe Zahl ist a − bi. Bezeichnung: a + bi = a − bi.
Bemerkungen 8.1.9 a) Der letzte Satz drückt sich in Formeln, wie folgt aus: Sind c, d ∈ C∗ ,
so gilt |cd| = |c| · |d| und arg(cd) = arg(c) + arg(d).
√
√
b) |Re(a + bi)| = a2 ≤ a2 + b2 = |a + bi|, ebenso gilt |Im(a + bi)| ≤ |a + bi|. D.h. für eine
komplexe Zahl c ist |Re(c)| ≤ |c| und |Im(c)| ≤ |c|
c) Sind c, d ∈ C, so gilt c + d = c + d, sowie c · d = c · d. Die offensichtlich bijektive Abbildung C → C, definiert durch c 7→ c, ist also ein Ringisomorfismus und somit auch einen
Körperisomorfismus. (Letzteres bedeutet, dass auch (c)−1 = c−1 ist.)
Ein Isomorfismus mit gleichem Start und Ziel wird ein Automorfismus genannt. Die Konjugation c 7→ c ist also ein Automorfismus des Körpers C.
Offenbar ist c = c .
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
225
d) Die Dreiecksungleichung. Diese ist
|c + d| ≤ |c| + |d|
Geometrisch bedeutet sie, dass die Summe der Längen zweier Seiten eines Dreiecks größer oder
gleich der dritten Seite ist. Hier wollen wir das ’ungeometrisch’ zeigen:
Für jede komplexe Zahl c gilt 2 · Re(c) = (c + c) und cd = cd, sowie |c| = |c|. Es folgt
|c+d|2 = (c+d)(c+d) = cc+dd+cd+cd = |c|2 +|d|2 +2Re(cd) ≤ |c|2 +|d|2 +2|c||d| = (|c|+|d|)2
und daraus die Dreiecksungleichung.
e) Ist z 6= 0, so gilt |z −1 | = |z|−1 und arg(z −1 ) = − arg(z). Mache Dir klar, was das geometrisch
bedeutet!
8.1.10 Potenzen mit natürlichen Exponenten. Sei n ganz und > 0. Wenn z den Betrag
r hat, d.h. auf einem Kreis vom Radius r um 0 liegt, so hat z n den Betrag rn , liegt somit auf
dem Kreis vom Radius rn um 0.
Wenn z das Argument α hat, so hat z n das Argument n · α, zumindest bis auf ein Vielfaches
von 2π.
Wir lassen z den Kreis Sr um 0 vom Radius r > 0 mit konstanter Winkelgeschwindigkeit 1
durchlaufen und beobachten, welchen Weg dabei z n nimmt. Nach dem, was wir uns gerade
überlegt haben, durchläuft z n den Kreis Srn vom Radius rn und zwar mit der Winkelgeschwindigkeit n. Wenn z den Kreis Sr einmal durchläuft, so durchläuft z n den Kreis Srn genau n-mal.
Es trifft dabei jeden Punkt auf Srn genau n-mal.
Was bedeutet das für die Existenz und Vielfachheit von Wurzeln, d.h. die Lösungen der Gleichung xn = c?
p
Sei c 6= 0 eine komplexe Zahl mit dem Argument ϕ und d := n |c|(cos(ϕ/n) + i sin(ϕ/n)), so
gilt offenbar dn = c. D.h. man kann aus jeder komplexen Zahl für jede natürliche Zahl n > 0
eine n-te Wurzel ziehen.
Allerdings ist das Wurzelziehen nicht eindeutig: Es gibt genau n verschiedene komplexe Zahlen
d mit dn = c, wenn nicht gerade c = 0 ist. Es ist cos(ϕ + k ·p
2π) + i sin(ϕ + k · 2π) = cos ϕ + i sin ϕ
n
für jede ganze Zahl k. Also ist jede komplexe Zahl dk := |c|(cos(ϕ/n + k · 2π/n)+
i sin(ϕ/n + k · 2π/n)) eine n-te Wurzel aus c, d.h. dnk = c. Die Zahlen d0 , d1 , . . . , dn−1 sind
untereinander verschieden, aber danach wiederholen sie sich: dn = d0 , dn+1 = d1 , . . .. Sie
bilden offenbar die Ecken eines regelmäßigen n-Ecks.
Insbesondere gibt es n verschiedene komplexe Zahlen z0 , z1 , . . . , zn−1 , die alle die Gleichung
z n = 1 erfüllen. Eine von ihnen ist 1, alle haben den Betrag 1, d.h. sie befinden sich auf dem
Einheitskreis. Sie bilden dort ein regelmäßiges n-Eck mit dem Mittelpunkt 0.
(Von dieser Tatsache ist Gauss ausgegangen, als es ihm kurz vor 1800 gelang, ein regelmäßiges
17-Eck allein mit Zirkel und Lineal zu konstruieren.)
226
KAPITEL 8. KOMPLEXE ZAHLEN
Definition 8.1.11 Die Nullstellen von xn − 1 in C heißen die n-ten Einheitswurzeln.
Bemerkung 8.1.12 Du weißt vielleicht noch von der Herleitung der Summenformel
Pn−1 k für die
n
n−1
n−2
geometrische Reihe, dass z − 1 = P
(z − 1)(z
+z
+ · · · + z + 1) = (z − 1) k=0 z ist. Dass
k
bedeutet, dass die Nullstellen von n−1
z
die
von
1
verschiedenen
n-ten Einheitswurzeln sind.
k=0
Beispiele 8.1.13 Wir berechnen einige spezielle Beispiele. Mit ihrer Hilfe bestimmen wir spezielle Werte des Cosinus und Sinus.
a) Rechne (1+i)2 = 1+2i−1 = 2i, also ( √12 + √12 i)2 = 12 ·2i = i, mithin ( √12 + √12 i)4 = i2 = −1. Du
siehst erneut, diesmal ohne geometrische Argumente, dass −1 im Bereich der komplexen Zahlen
nicht nur ein Quadrat, sondern auch eine 4. Potenz ist. Wenn Du dies mit der geometrischen
Beschreibung der Multiplikaton zusammenbringst, kannst Du
√
1
2
sin(π/4) = cos(π/4) = √ (=
)
2
2
ableiten.
Wir bleiben bei diesem Beispiel und setzen abkürzend v := √12 + √12 i. Dann ist v 3 = v 2 v =
iv = − √12 + √12 i,
v 5 = v 4 v = −v,
v 6 = v 4 v 2 = −i
v 7 = v 4 v 3 = −v 3 = √12 − √12 i
und schließlich v 8 = (v 4 )2 = (−1)2 = 1. Dann wiederholen sich die Werte der Potenzen, also
v 9 = v 8 v = v, v 10 = v 8 v 2 = v 2 = i, v 11 = v 8 v 3 = v 3 = − √12 + √12 i usw. Für jede beliebige
(ganze) Potenz v k gilt offenbar (v k )8 = (v 8 )k = 1k = 1. D.h. wir haben insgesamt 8 verschiedene
Zahlen gefunden, deren 8. Potenz 1 ergibt, nämlich 1, v, v 2 , . . . , v 7 .
√
√
√
b) Ein weiteres Beispiel.
Setze√ w := 21 + 23 i. Dann ist w2 = 14 − 34 + 2 · 12 23 i = − 12 + 23 i und
√
w3 = ww2 = ( 21 + 23 i)(− 12 + 23 i) = − 14 − 34 = −1. Weiter erhält man w4 = w3 w = −w, w5 =
w3 w2 = −w2 und w6 = w3 w3 = (−1)(−1) = 1. Wie oben wiederholen sich jetzt die Potenzen:
w7 = w1 , w8 = w2 usw. Ebenso siehst Du, dass für jede ganze Potenz wk von w gilt: (wk )6 = 1.
Es gibt also (mindestens) 6 verschiedene komplexe Zahlen, die die Gleichung x6 = 1 erfüllen.
Da diese Gleichung den Grad 6 hat, hat sie auch auch nur 6 Lösungen.
Man kann hieraus
√
1
3
cos(π/3) = und sin(π/3) =
2
2
ableiten. (Was folgt daraus für sin(π/6), cos(π/6)?)
8.1.14 Zusätzliche Bemerkungen.
Zu Tartaglias Formel: Wenn man sie im Komplexen anwenden will, hatq
man es mit
q2
p3
mehrdeutigen Wurzeln zu tun. Mit den Quadratwurzeln ist es einfach: Mit
+ 27
sei
4
q
2
p3
willkürlich eine der beiden möglichen Wurzeln bezeichnet; − q4 + 27
ist dann automatisch die
andere. Jeder der beiden Summanden in Tartaglias Formel ist nun eine kubische Wurzel mit 3
möglichen Werten. So hat man insgesamt 9 mögliche Kombinationen. Es gibt nun eine Regel,
8.1. WAS SIND DIE KOMPLEXEN ZAHLEN?
227
welche 3 Kombinationen die Nullstellen des kubischen Polynoms ergeben. Hierauf will ich
nicht genauer eingehen und verweise stattdessen auf das Buch Kubische und biquadratische
”
Gleichungen“ von Heinrich Dörrie (Leibniz Verlag München 1948).
Plausibilität des Fundamentalsatzes der Algebra. Sei n ∈ N1 . Die Funktion
g : C → C, definiert durch g(z) = z n , bildet die Kreislinie Sr vom Radius r > 0 um 0 auf die
Kreislinie Srn vom Radius rn um 0 ab, und zwar so, dass ein Umlauf um Sr zu n Umläufen um
Srn wird. Sei jetzt f (z) = z n + a1 z n−1 + · · · + an−1 z + an Wir setzen an 6= 0 voraus, da f sonst
bereits die Nullstelle 0 hat.
Ist der Betrag von z sehr groß, so überwiegt der Anteil von z n in starkem Maße die Anteile der
übrigen Summanden in f . Also gilt: Wenn z die Kreislinie Sr einmal durchläuft und r ‘sehr
groß’ ist, so läuft f (z) ‘in der Nähe’ von Srn genau n-mal um den Nullpunkt herum. Lässt man
jetzt r gegen 0 gehen, so zieht sich die Bildkurve von Sr auf den Punkt an zusammen. Irgendwann muss sie unterwegs über den Punkt 0 hinweggehen. Das heißt, es gibt eine Nullstelle von f .
Die komplexe Exponentialfunktion: Man definiert sie, wie im Reellen durch
z
e =
∞
X
zn
n=0
n!
für beliebige z ∈ C und beweist auch das Additionstheorem wie im Reellen.
Im Folgenden halte ich mich etwas kurz. Insbesondere gilt ex+iy = ex · eiy für x, y ∈ R. Da
uns die Funktion ex bereits einigermaßen bekannt ist, wollen wir die Abbildung R → C, y 7→
eiy studieren. Überlege Dir, dass die zu eiy konjugierte komplexe Zahl gleich e−iy ist. (Die
Konjugation ist nicht nur mit endlichen Summen und Produkten verträglich, sondern auch mit
Limesbildung.) Daraus folgt
iy 2
e = eiy · e−iy = 1
D.h. Die Spur der parametrisierten Kurve R → C, y 7→ eiy liegt also im Einheitskreis. Durch
genauere Untersuchung, stellt man fest, dass sie diesen entgegen dem Uhrzeigersinn mit der
Absolutgeschwindigkeit 1 durchläuft. Da zudem noch e0i = 1 gilt, erhält man gemäß unserer
Definition der Kreisfunktionen
eiy = cos y + i sin y und somit ex+iy := ex (cos y + i sin y)
Die aus diesen Überlegungen folgende Gleichung eiπ + 1 = 0 hat den bekannten Physiker
Feynman seit seiner Jugend fasziniert. (Sie involviert die wahrscheinlich wichtigsten Zahlen
der Mathematik, nämlich 0, 1, i, π, e.)
Wenn man den Zielbereich der Funktion exp auf C∗ = C−{0} einschränkt, so ist die Abbildung
exp : C → C∗ surjektiv, aber nicht injektiv. Für jedes z ∈ C gilt, dass die z + 2nπi für alle
n ∈ Z dasselbe Bild unter exp haben.
Allgemeine Potenzen. Seien c, z ∈ C, c 6= 0 Man kann versuchen cz := exp(z ln(c)) zu
definieren. Dies hat den Vorzug, dass man bis auf die Bedingung c 6= 0 keine Einschränkung
228
KAPITEL 8. KOMPLEXE ZAHLEN
machen muss. Der Nachteil liegt darin, dass die ‘Funktion’ ln auf C× = C − {0} von Natur
aus unendlich viele Werte hat, die sich um Vielfache von 2πi unterscheiden. Das kommt daher,
dass im Komplexen die Funktion exp nicht injektiv, sondern periodisch mit der Periode 2πi ist.
Jeder noch so geschickt ausgewählte, auf ganz C× eindeutig definierte Logarithmus ist weder
überall stetig, noch erfüllt er allgemein die Gleichung ln(z1 z2 ) = ln(z1 ) + ln(z2 ).
Man muss also damit leben, dass etwa der Ausdruck ii zunächst unendlich viele Werte hat – wie
wir gleich sehen werden – und wenn man mit ihm rechnen will, angeben, welcher der möglichen
Werte gemeint ist.
Wenn man ii als exp(i · ln i) definiert, so muss man die möglichen Werte von ln i bestimmen.
Für c 6= 0 gilt ln c = ln |c| + i arg(c). Dabei ist arg(c) aber nicht eindeutig, sondern nur bis
auf ganzzahlige Vielfache von 2π bestimmt. (Dies alles ergibt sich, wenn man exp wie oben
definiert und versucht, diese nicht bijektive Funktion umzukehren.)
In unserem Fall ist |i| = 1 und arg i = π/2 + 2nπ, also ln i = i(π/2 + 2nπ), wo n ∈ Z beliebig
ist. Für ii ergeben sich also die unendlich vielen möglichen Werte: exp(−π/2 + 2mπ), m ∈ Z,
die alle reell sind.
AUFGABEN
Die Aufgaben beschäftigen sich mit Einheitswurzeln.
1. Sei n eine ungerade natürliche P
Zahl. Welche gemeinsamen Nullstellen haben alle Polynome
(über C) der folgenden Gestalt: nk=0 ak z k mit an 6= 0 und ak = an−k ∈ {−1, 0, 1} für alle k?
2. Bestimme die gemeinsamen Nullstellen der Polynome f = z 3 +2z 2 +2z+1 und g = z 2015 +z 121 +1
in C.
8.2
Sind Primzahlen einsam?
Hier will ich nichts beweisen, sondern nur versuchen, Dir einiges aus der Theorie der Primzahlen
zu erläutern.
Du weißt hoffentlich noch, dass es unendlich viele Primzahlen gibt (und wie man dies beweist),
ferner dass es zwischen zwei aufeinanderfolgenden Primzahlen beliebig große Lücken gibt. Über
diese eher qualitativen“ Aussagen hinaus kann man sich natürlich auch quantitative“ Fragen
”
”
stellen, etwa: Gibt es zu jeder ganzen Zahl n ≥ 1 eine (im Dezimalsystem) n-stellige Primzahl?
Der experimentielle Befund ist eindeutig: Es gibt 4 einstellige, 21 zweistellige, 143 dreistellige
Primzahlen – und soweit es Primzahltafeln gibt, setzt sich dieser Trend fort. Wir Mathematiker
und Mathematikerinnen wünschen natürlich, einen Beweis dafür zu haben. Und einen solchen
gibt es in der Tat; aber dieser ist überhaupt nicht trivial.
Du wirst vielleicht dem Dezimalsystem das Binärsystem vorziehen. Und in der Tat gilt die entsprechende Aussage auch hier: Zu jedem ganzen n ≥ 2 gibt es eine im Binärsystem geschriebene
n-stellige Primzahl. Dies folgt – wie Du sofort siehst – aus dem sogenannten Bertrand’schen
8.2. SIND PRIMZAHLEN EINSAM?
229
Postulat: Zu jeder ganzen Zahl n ≥ 1 gibt es immer eine Primzahl p mit n < p ≤ 2n. (Bertrand konnte dies nicht beweisen, hat es aber als wahr unterstellt, um einen anderen Satz zu
zeigen.) Dieses Postulat“ wurde später von Čebyšev bewiesen.
”
Man kann solche Fragen in Beziehung zu dem sogenannten Primzahlsatz bringen. Wir betrachten dazu die Funktion π, die jedem reellen x die Anzahl der (positiven) Primzahlen ≤ x
zuordnet. (Diese Funktion hat nichts mit der Kreiszahl π zu tun!) Die Funktion π(x) ist 0 für
x < 2 und springt bei jeder Primzahl um 1 nach oben. (Sie ist insbesondere nicht stetig, aber
‘von Weitem gesehen’ merkt man das nicht.)
Der Primzahlsatz vergleicht die Funktion π mit der für x > 1 definierten Funktion x/ ln(x). Er
besagt
π(x)
lim
=1.
x→∞ x/ ln(x)
Man kann ihn auch wie folgt ausdrücken: Sei ε > 0 beliebig klein. So gibt es eine Zahl Y , so
dass für alle x ≥ Y die Ungleichungen
(∗)
(1 − ε)
x
x
≤ π(x) ≤ (1 + ε)
gilt.
ln x
ln x
Bemerkungen 8.2.1 a) Ich will nicht verschweigen, dass es eine bessere Vergleichsfunktion
für π(x) als x/ ln(x) gibt, nämlich den sogenannten Integrallogarithmus Li, definiert durch
Z x
dx
,
Li(x) =
2 ln(x)
die für x ≥ 2 definiert ist.
b) Der Primzahlsatz wurde von Gauß vermutet und erst Ende des 19. Jahrhunderts von Hadamard und de la Vallee Poussin (unabhängig voneinander) bewiesen. Beide benutzen
eine Aussage über die Nullstellen der Zeta-Funktion.
8.2.2 Nun folgt etwas zu dem behaupteten Zusammenhang mit der Funktionentheorie. Die im
letzten Kapitel für reelle x > 1 definierte Zetafunktion lässt sich für alle komplexen Zahlen, mit
Ausnahme der 1 definieren. Seltsamer Weise hängen die Nullstellen der Zetafunktion mit der
Primzahlverteilung zusammen, wie Riemann erkannt hat. Es gibt die (sogenannten trivialen)
Nullstellen −2n für n = 1, 2, . . ., dazu aber noch unendlich viele andere in dem Streifen 0 ≤
Re(z) ≤ 1. Hadamard und de la Vallee Poussin konnten zeigen, dass am Rande dieses
Streifens (wo Re(z) = 0 oder 1 ist) keine Nullstellen liegen, und damit den Primzahlsatz
beweisen. Die bislang unbewiesene Riemannsche Vermutung besagt, dass alle nichttrivialen
Nullstellen auf der mittleren Geraden Re(z) = 1/2 dieses Streifens liegen. Aus ihr würden sehr
genaue Abschätzungen für die Primzahlverteilung folgen.
8.2.3 Sei x < y. Die Anzahl der Primzahlen p mit x < p ≤ y ist gleich π(y) − π(x). Diese
Differenz kann man mit Hilfe der Ungleichungen (∗) nach unten abschätzen:
π(y) − π(x) ≥ (1 − ε)(y/ ln y) − (1 + ε)(x/ ln x)
230
KAPITEL 8. KOMPLEXE ZAHLEN
Im Hinblick auf das Bertrandsche Postulat betrachten wir den Fall y = 2x und erhalten
π(2x) − π(x) ≥ (1 − ε)(2x/ ln(2x)) − (1 + ε)(x/ ln(x))
Nun ist ln(2x) = ln(x) + ln(2) < ln(x) + 1. Das bedeutet, dass 2x/ ln(2x) nicht viel kleiner als
2 · (x/ ln(x)) ist. Wir wählen nun δ(x), so dass x/ ln(2x) = (1 − δ)x/ ln(x) ist. Dann gilt
π(2x) − π(x) ≥ (1 − ε)((2x/ ln(2x)) − (1 + ε)(x/ ln(x)) = (2(1 − ε)(1 − δ(x)) − (1 + ε)) · x/ ln(x)
Beachte limx→∞ δ(x) = 0. Ist nun
(∗∗)
2>
1+ε
,
(1 − ε)(1 − δ)
so ist π(2x) − π(x) > 0, also gibt es dann mindestens eine Primzahl p mit x < p ≤ 2x. Ist nun
ε klein genug, dass (1 + ε)(1 − ε) < 2 gilt, so gilt die Ungleichung (∗∗) für genügend große x.
Es folgt sogar, dass die Anzahl der Primzahlen zwischen x und 2x mit x gegen unendlich geht,
nicht wahr?
Num konnte Čebyšev zwar den Primzahlsatz noch nicht beweisen, aber die Ungleichungen (∗)
für ε = 1/9 zeigen, falls nur x genügend groß ist.
1 + 19
< 2 ist, folgt das Bertrand’sche Postulat – zunächst für große x. Es ist dann noch
1 − 19
etwas Feinarbeit zum vollständigen Beweis zu leisten.
Da
8.2.4 Was wir oben für den Faktor 2 getan haben geht ebenso gut für den Faktor 1,1 oder
1,01, allgemeiner für jeden Faktor der Form 1 + γ mit beliebig kleinem γ > 0. Dann allerdings
ist die Anzahl der Primzahlen zwischen x und (1 + γ)x nur für genügend große x nicht null.
Zum Beweis muss man außerdem den vollen Primzahlsatz benutzen.
Was sollen wir nun zur Frage sagen, ob Primzahlen einsam sind?
Man mag ja eine Primzahl, die zur nächsten Primzahl einen großen Abstand hat als einsam
ansehen. Dann gibt es einsame Primzahlen. Wenn man aber den Abstand der n-ten Primzahl
pn zur (n + 1)-ten Primzahl pn+1 im Verhältnis zur Größe von pn als Maß für seine Einsamkeits
nimmt, sieht die Sache anders aus. Für jede noch so kleine Zahl γ > 0 gibt es ja eine reelle Zahl
x, so dass zu jeder Primzahl p > x die nächstgrößere Primzahl kleiner als (1 + γ) · p ist.
Kapitel 9
Gruppen
Ist es sinnvoll, Bereiche mit nur einer Rechnungsart zu betrachten?
9.1
Was sind Gruppen?
Bislang hast Du die algebraischen Begriffe Ring und Körper kennengelernt. Möglicherweise
hast Du sogar ein gewisses Verständnis dafür bekommen, warum man sie in aller Allgemeinheit
studiert. Es gibt ja viele interessante Ringe, und unter diesen auch viele interessante Körper.
Neben Z, Q, R, C gibt es z.B. noch die Restklassenringe Z/(m), die genau dann Körper sind,
wenn m eine Primzahl ist, ferner die Matrizenringe. Glaub mir, das ist nur der Anfang!
Hältst Du es für sinnvoll, algebraische Strukturen zu definieren, bei denen es nur eine Verknüpfung (Rechenart) gibt? Vielleicht nicht.
Auch ich kann Dir hier nur eine Ahnung davon geben, zu welchem Zweck man den Gruppenbegriff einführt, und dich einfach bitten, zu glauben, dass er in der Mathematik und der Physik
eine große Rolle spielt.
Definition 9.1.1 Eine Gruppe ist eine Menge G zusammen mit einer Verknüpfung (Rechenart), die vorläufig mit ◦“ bezeichnet sei, so dass folgendes gilt:
”
0) (a ◦ b) ◦ c = a ◦ (b ◦ c) für alle a, b, c ∈ G. (Assoziativität)
1) Es gibt ein neutrales Element e ∈ G mit e ◦ a = a ◦ e = a für alle a ∈ G. (Existenz eines
neutralen Elementes) (Hier ist mit e nicht die Eulersche Zahl 2,718... gemeint.)
2) Für ein solches neutrales Element e gilt: Zu jedem a ∈ G gibt es ein Inverses a− ∈ G mit
a− ◦ a = a ◦ a− = e. (Existenz inverser Elemente)
Definition 9.1.2 Eine Gruppe G (mit der Verknüpfung ◦“) heißt abelsch (oder kommuta”
tiv), wenn a ◦ b = b ◦ a für alle a, b ∈ G gilt.
Nils Hendrik Abel (1802-1829) war einer der ganz großen Mathematiker – trotz seines
kurzen Lebens. (Eine abelsche Gruppe ist kaine Gruppe von Männern, die von ihren Brüdern
erschlagen wurden.)
231
232
KAPITEL 9. GRUPPEN
Bemerkungen 9.1.3 a) Das neutrale Element ist eindeutig definiert. Denn für jedes weitere
neutrale Element e0 gilt: e = e ◦ e0 = e0 gemäß 1).
In einer Gruppe gelte x ◦ x = x. Dann ist x = x− ◦ (x ◦ x) = x− ◦ x = e.
b) Auch gibt es zu jedem a ∈ G nur ein Inverses. Sei etwa a( ein weiteres solches, so erhält
man a− = e ◦ a− = (a( ◦ a) ◦ a− = a( ◦ (a ◦ a− ) = a( ◦ e = a(
Offenbar ist a invers zu a− und wegen der Eindeutigkeit des Inversen deshalb (a− )− = a .
(Du hast diese Überlegungen bereits für die Addition in Ringen gemacht!)
c) Ein sparsameres Axiomensystem ersetzt 1) und 2) durch:
Es gibt ein e ∈ G, so dass gilt:
1’) e ◦ a = a für alle a ∈ G,
2’) zu jedem a ∈ G existiert ein a− ∈ G mit a− ◦ a = e.
Es ist nicht ganz einfach zu zeigen, dass aus 0), 1’) und 2’) (bei fehlender Kommutativität)
auch 1) und 2) folgen. Und ich halte das auch nicht für so wichtig, da in den meisten Beispielen
von Gruppen die Gesetze 1) und 2) leicht zu zeigen sind.
d) Die Assoziativität besagt, dass es in iterierten ‘Produkten’, etwa (a ◦ b) ◦ (c ◦ (d ◦ f )) auf die
Klammerung nicht ankommt, man also die Klammern weglassen darf.
Die Reihenfolge der ‘Faktoren’ bleibt allerdings wichtig – es sei denn die Gruppe ist abelsch.
e) Achtung: (a ◦ b)− = b− ◦ a− . Du erinnerst Dich: Wenn man zuerst ein Hemd und danach
einen Pullover anzieht und dies (ohne Verrenkungen) wieder rückgängig machen will, muss man
zuerst den Pullover und danach das Hemd ausziehen.
Für a, b mit (a ◦ b)− = a− ◦ b− gilt somit a ◦ b = ((a ◦ b)− )− = (a− ◦ b− )− = (b− )− ◦ (a− )− = b ◦ a .
f) Man kann in einer Gruppe sinnvoll Potenzen mit ganzzahligen Exponenten definieren: Die
Definition ist dieselbe, wie für Elemente 6= 0 eines Körpers. Und es gelten auch die Regeln:
am ◦ an = am+n , (am )n = amn , aber nicht allgemein (ab)m = am ◦ bm .
Zeige: Gilt in einer Gruppe (a ◦ b)2 = a2 ◦ b2 , so ist b ◦ a = a ◦ b.
g) Das neutrale Element hat die Eigenschaft e ◦ e = e. Umgekehrt ist es das einzige Element
mit dieser Eigenschaft. Aus x ◦ x = x erhält man nämlich x− ◦ x ◦ x = x− ◦ x, also x = e. (Doch
erinnere Dich: In jedem Ring gilt sowohl 1 · 1 = 1 als auch 0 · 0 = 0.)
h) Wir konstruieren eine Gruppe von 2 Elementen: G = {e, a} mit dem neutralen Element e
und einem weiteren a 6= e. Die Verknüpfungen e ◦ e = e, e ◦ a = a ◦ e = a sind durch ein Axiom
direkt vorgeschrieben. Aus a ◦ a = a würde a = e folgen. Also ist a ◦ a = e. Die Assoziativität
kannst Du natürlich durch Untersuchung aller Fälle nachprüfen. (Ist e ein beidseitig neutrales
Element, so folgt (x ◦ e) ◦ y = x ◦ (e ◦ y). Ebenso (e ◦ x) ◦ y = e ◦ (x ◦ y) und (x ◦ y) ◦ e = x ◦ (y ◦ e).
Es bleibt der Fall (a ◦ a) ◦ a = a ◦ (a ◦ a), der unmittelbar aus a ◦ a = e folgt.) Eine andere
9.1. WAS SIND GRUPPEN?
233
Möglichkeit, dies einzusehen, ergibt sich durch die Betrachtung der sogenannten Gruppentafel
(Multiplikationstabelle):
◦ e a
e e a
a a e
Diese ist nämlich offenbar die gleiche wie die Additionstabelle unseres ‘Minikörpers’ F2 , wenn
man nur e durch 0 und a durch 1 ersetzt. Da die Verknüpfungen zwangsläufig sind, ist jede
Gruppe von 2 Elementen zu der konstruierten ‘isomorf’, d.h. nicht wesentlich von ihr verschieden. (Was das genau bedeutet, muss und werde ich natürlich noch definieren.) Diese Gruppe
kommt häufig vor: In jedem Ring, in dem 1 6= −1 gilt, ist die Menge {1, −1} in Bezug auf die
Multiplikation eine Gruppe aus 2 Elementen. Hier entspricht e der 1 und a der -1.
9.1.4 Etwas zur Schreibweise: Im Allgemeinen werden alternativ zwei mögliche Schreibweisen
für die Verknüpfung, das neutrale Element und das zu a Inverse benutzt:
a) Die multiplikative Schreibweise: ab oder a · b für a ◦ b, sowie 1 für e und a−1 für a− .
(Wenn die Gruppe aus bijektiven Abbildungen einer Menge auf sich selbst besteht und die
Verknüpfung deren Verkettung bedeutet, schreibt man natürlich auch a◦b für die Verknüpfung
und id oder z.B. auch I für das neutrale Element.)
Bei multiplikativer Schreibweise schreibt man Potenzen wie gewohnt.
b) Die additive Schreibweise: a + b für a ◦ b, sowie 0 für e und −a für a− . In diesem Fall
schreibt man auch a − b an Stelle von a + (−b) usw. Die additive Schreibweise wird in der Regel
nur bei abelschen Gruppen benutzt.
Bei der additiven Schreibweise entspricht dem Begriff ‘Potenz’ der Begriff ‘Vielfaches’. Beispiel
aaa schreibt man als a3 , während a + a + a als als 3a geschrieben wird. Entspechend bedeutet
a−2 bei multiplikativer Schreibweise (aa)−1 , während man bei additiver Schreibweise (−2)a =
−(a + a) setzt. (Natürlich gilt (aa)−1 = a−1 a−1 und somit auch −(a + a) = (−a) + (−a), welch
letzteres auch −a − a geschrieben wird.)
Ich benutze hier meist, aber nicht immer, die multiplikative Schreibweise. Manchmal liegt
natürlich die additive Schreibweise nahe.
Definition 9.1.5 Die Kardinalzahl (d.h. die Elementezahl) einer endlichen Gruppe wird auch
ihre Ordnung genannt.
Beispiel 9.1.6 Ein typisches erstes Beispiel einer nicht abelschen Gruppe ist das Folgende:
Die Menge S3 ist die Menge aller bijektiven Abbildungen ϕ : {1, 2, 3} → {1, 2, 3}. Wir schreiben
solche Abbildungen in der Form
1
2
3
ϕ(1) ϕ(2) ϕ(3)
also ist z.B.
σ1 :=
1 2 3
1 3 2
234
KAPITEL 9. GRUPPEN
diejenige Abbildung, die 1 auf 1, 2 auf 3 und 3 auf 2 abbildet.
Welche Ordnung hat S3 ? Nun, sie hat offenbar soviele Elemente, wie es Anordnungen der Menge
{1, 2, 3} gibt, d.h. 3!=6 Stück.
Außer der genannten Abbildung σ1 gibt es noch die folgenden 5
1 2 3
1 2 3
σ2 :=
, σ3 :=
3 2 1
2 1 3
(σi lässt i fest, d.h. bildet i auf sich selbst ab, und vertauscht die beiden anderen Elemente aus
{1, 2, 3}.)
1 2 3
1 2 3
0
δ :=
, δ :=
2 3 1
3 1 2
und – nicht zu vergessen – die Identität (identische Abbildung)
I :=
1 2 3
1 2 3
9.1.7 Die Verknüpfung ◦“ ist die Verkettung (Hintereinanderausführung) der Abbildungen.
”
Dabei verabreden wir, die rechtsstehende zuerst auszuführen. Z.B.
1 2 3
1 2 3
1 2 3
◦
σ2 ◦σ1 =
=
= δ0
3 2 1
1 3 2
3 1 2
Hingegen
σ1 ◦σ2 =
1 2 3
1 3 2
◦
1 2 3
3 2 1
=
1 2 3
2 3 1
=δ
Es ist also σ1 ◦σ2 6= σ2 ◦σ1 .
Wir können eine Tabelle aller Produkte, die Gruppentafel, aufstellen
◦
I
σ1
σ2
σ3
δ
δ0
I
I
σ1
σ2
σ3
δ
δ0
σ1
σ1
I
δ0
δ
σ3
σ2
σ2
σ2
δ
I
δ0
σ1
σ3
σ3
σ3
δ0
δ
I
σ2
σ1
δ
δ
σ2
σ3
σ1
δ0
I
δ0
δ0
σ3
σ1
σ2
I
δ
In der α-Zeile und β-Spalte steht das Element α◦β.
In jeder Zeile steht jedes Element von S3 genau einmal. Das ist auch in jeder Spalte so. Dies gilt
für jede Gruppe. Denn für je zwei Elemente a, b der Gruppe hat die Gleichung ax = b genau
eine Lösung, nämlich x = a−1 b. Entsprechend hat die Gleichung xa = b genau eine Lösung.
Welche?
Die Assoziativität ist ein Spezialfall einer allgemeinen Feststellung über die Assoziativität der
Verkettung von Abbildungen, die wir im Abschnitt über Abbildungen bereits gezeigt haben.
Das neutrale Element ist I. Das Inverse einer Abbildung ist die Umkehrabbildung.
9.1. WAS SIND GRUPPEN?
235
Beispiele 9.1.8 Weitere Beispiele von Gruppen:
a) (Z, +), d.h. die Menge der ganzen Zahlen zusammen (allein) mit der Addition, ist eine
Gruppe. Das neutrale Element ist 0, das Inverse von n ist −n.
b) Jeder Ring (und auch jeder Vektorraum) mit der Addition allein (d.h. wenn man die Multiplikation unberücksichtigt lässt) ist eine Gruppe. Man spricht man von der additiven Gruppe
des Rings, bzw. Vektorraums, auch von der unterliegenden (additiven) Gruppe des Vektorraumes.) Wieder bezeichnet die 0 das neutrale Element und −a das zu a Inverse.
Eine besondere Rolle spielen die additiven Gruppen der Ringe Z/(m). Diese Gruppen sind von
besonders einfacher Gestalt. Erinnere Dich an die Additionstabelle 2.4.8. Für m > 1 sieht sie
allgemein so aus:
0
1
2 · · · · · · · · · m-1
+
0
0
1
2 · · · · · · · · · m-1
1
2
· · · · · · · · · m-1
0
1
2
· · · · · · · · · m-1
0
1
2
..
..
..
..
..
..
..
..
.
.
.
.
.
.
.
.
m-2 m-2
m-1 m-1
m-1
0
0
1
···
···
···
···
· · · m-3
m-3 m-2
c) Sei K ein Körper und K ∗ = K − {0}. Dann ist K ∗ zusammen mit der Multiplikation eine
Gruppe, die multiplikative Gruppe des Körpers. Hier ist das neutrale Element die 1 und
das Inverse von a ist a−1 = 1/a. In Bezug auf die Multiplikation ist Z − {0} keineswegs eine
Gruppe; fast immer fehlt das Inverse.
d) Sei n > 0 eine natürliche Zahl. Mit Sn , der n-ten symmetrischen Gruppe wird die Menge
der bijektiven Abbildungen α : {1, 2, . . . , n} → {1, 2, . . . , n} zusammen mit der Verkettung als
Verknüpfung bezeichnet. Dies ist eine naheliegende Verallgemeinerung der oben betrachteten
S3 – und natürlich eine Gruppe. Im Gegensatz zu den Beispielen a), b), c) gilt für n ≥ 3 in der
Sn das Kommutativitätsgesetz nicht. D.h. es gibt α, β ∈ Sn mit α◦β 6= β ◦α (falls n ≥ 3). Das
hast Du für n = 3 oben bereits gesehen. Für n ≥ 4 ist das erst recht so. (Warum?)
e) Noch allgemeiner als unter d) kann man allgemein eine (möglicherweise unendliche) Menge
M betrachten und zu dieser die symmetrische Gruppe von M“, die aus sämtlichen bijektiven
”
Abbildungen M → M besteht, wo die Verknüpfung die Verkettung ist.
f) Sei K ein Körper. Dann bilden die 2×2-Matrizen über K, deren Determinante ungleich 0 ist,
bezüglich der Matrizenmultiplikation eine Gruppe. Diese Gruppe wird mit Gl2 (K) bezeichnet.
(“General linear group“) Berechne in dieser Gruppe
1 0
1 1
2
2
2 1 1
1 0
1 1
.
und
·
·
1 1
0 1
0 1
Die Gruppe Gl2 (K) ist also für keinen Körper K kommutativ.
Es gibt natürlich mehrere Verallgemeinerungsmöglichkeiten: Du kannst n×n-Matrizen betrachten. Du kannst anstelle eines Körpers einen kommutativen Ring R betrachten und in M2 (R)
236
KAPITEL 9. GRUPPEN
die Matrizen, deren Determinante in R invertierbar ist. Ist R = Z so bedeutet das, dass die
Determinante 1 oder −1 ist. Ein Beispiel eines solchen Elementes ist hier die Matrix
5 17
2 7
Schließlich darf der Ring auch nichtkommutativ sein. Dann betrachte die (multiplikativ) invertierbaren Matrizen. Determinanten helfen hier allerdings nicht.
Wie man bei Vektorräumen Untervektorräume betrachtet, gibt es auch in der Theorie der
Gruppen den Begriff der Untergruppe.
Definition 9.1.9 Sei G eine Gruppe. Eine Untergruppe U von G ist eine Teilmenge von G,
die bezüglich der Verknüpfung in G wieder eine Gruppe ist. D.h. es wird verlangt, dass 1 ∈ U
ist und aus a, b ∈ U sowohl ab ∈ U als auch a−1 ∈ U folgt.
(Es reicht hierfür zu verlangen, dass U 6= ∅ und mit a, b ∈ U auch ab−1 ∈ U ist. Beweis?)
Beispiele 9.1.10 a) In jeder Gruppe G sind sowohl {1} (bei additiver Schreibweise {0}) als
auch G selbst Untergruppen. Diese nennt man manchmal die trivialen Untergruppen
b) Sei G := Z mit der Verknüpfung +“ und m ∈ N. Die Menge mZ := {mx | x ∈ Z} ist eine
”
Untergruppe von G. Du wirst später erfahren, dass jede Untergruppe der additiven Gruppe
von Z so aussieht. Du kannst natürlich versuchen, dies jetzt schon selbst zu beweisen. (Tipp:
Division mit Rest.)
c) Sei K ein Körper. Dann ist die Menge {1, −1} eine Untergruppe von K ∗ . Für den Körper
C gilt, dass R∗ , R∗+ und {z ∈ C | |z| = 1} Untergruppen von C∗ sind. Ferner bilden für jedes
ganze n ≥ 1 die n-ten Einheitswurzeln eine Untergruppe von C∗ .
d) Seien m, n mit 1 ≤ m ≤ n natürliche Zahlen. Dann hat Sn folgende zur Sm isomorfe
Untergruppe U . Sie besteht aus denjenigen bijektiven Abbildungen α : {1, . . . , n} → {1, . . . , n},
für welche α(j) = j für alle j mit m < j ≤ n gilt. (Die Elemente von U lassen die letzten n − m
Zahlen fest.) (Den Begriff ‘isomorf’ werde ich bald einführen, nämlich in Definition 9.1.12.)
Wendet man dies auf den Fall m = 3 an, sieht man, dass Sn für n ≥ 3 nicht abelsch ist.
Natürlich gilt dies auch für SM , wenn M eine unendliche Menge ist.
e) Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Dann ist die Menge hai :=
{an | n ∈ Z} eine Untergruppe von G. (Bei additiv geschriebenen Gruppen ist hai =
{na | n ∈ Z}.) Man nennt hai die von a erzeugte Untergruppe von G.
Weiter unten gehen wir genauer auf solche Untergruppe ein.
f) Sei K ein Körper. Die 2 × 2-Matrizen der Form
a −b
A=
mit det A 6= 0
b a
bilden eine Untergruppe der Gl2 (K). Insbesondere musst Du zeigen, dass mit A auch A−1 die
verlangte Form hat.
9.1. WAS SIND GRUPPEN?
237
Beispiel 9.1.11 Wir wollen die Untergruppen der S3 bestimmen. Zunächst haben wir die
beiden Untergruppen {I} und S3 .
Da σi2 := σi ◦σi = I ist, sind die drei Mengen Ui := (hσi i :=){I, σi } Untergruppen. Und da
δ 2 = δ 0 und δ 3 = δ 2 ◦δ = I gilt, ist V := {I, δ, δ 0 } eine Untergruppe. (Es gibt drei Untergruppen
der Ordnung 2 und eine solche der Ordnung 3.)
Wir haben also außer den beiden trivialen Untergruppen {I} und S3 noch die o.a. vier Untergruppen. Wir wollen jetzt überlegen, dass es keine weiteren Untergruppen gibt.
Jede der vier Untergruppen U1 , U2 , U3 , V besitzt außer {I} und sich selbst keine weiteren Untergruppen. Ferner liegt jedes Element von S3 in einer dieser vier Untergruppen. Jede weitere
von {I} verschiedene Untergruppe H von S3 muss also zwei Elemente enthalten, die nicht gemeinsam in einer der Untergruppen U1 , U2 , U3 , V liegen. Es genügt jetzt zu zeigen, dass unter
dieser Voraussetzung H = S3 ist.
Es gelte etwa σ1 , σ2 ∈ H. Dann ist auch δ = σ1 ◦σ2 ∈ H, ebenso δ 0 = δ 2 , ferner noch σ3 = σ1 ◦δ 0 .
Da ohnehin I ∈ H gilt, muss H = S3 sein. Ebenso einfach zeigt man die folgenden Implikationen
σ1 , σ3 ∈ H =⇒ H = S3 ;
σ2 , σ3 ∈ H =⇒ H = S3 ;
σi , δ ∈ H =⇒ H = S3 ;
σi , δ 0 ∈ H =⇒ H = S3
Wir sehen insbesondere, dass S3 keine Untergruppe der Ordnung (d.h. Elementezahl) 4 oder 5
hat. Später werden wir ganz allgemein zeigen: Ist G eine endliche Gruppe der Ordnung n und
U eine Untergruppe von G, so wird n von der Ordnung von U geteilt.
Die Untergruppen von S3 ergeben folgendes Bild:
S3
U1 U2
U3
V
{I}
Die Gruppen U1 , U2 , U3 , V umfassen alle die Gruppe {I} und liegen alle in der S3 . Zwischen
ihnen gibt es keine Inklusionsrelationen.
Der Begriff der Isomorfie. Wann wollen wir Gruppen G und H zueinander isomorf
nennen, d.h. dass sie bis auf die Bezeichnung der Elemente (und der Verknüpfung) überein”
stimmen“ sollen? Am klarsten kann man dies mit Hilfe des Abbildungsbegriffes ausdrücken:
Definitionen 9.1.12 a) Seien G, H Gruppen. Ein Gruppenhomomorfismus (kurz: Homomorfismus) von G nach H ist eine Abbildung f : G → H, die
f (a ◦ b) = f (a) ◦0 f (b) für alle a, b ∈ G erfüllt.
(∗)
(Dabei bezeichne ◦ die Verknüpfung in G und ◦0 diejenige in H.
b) Ein Isomorfismus, auch Isomorfie von Gruppen ist ein bijektiver Homomorfismus.
c) Gruppen G und H heißen zueinander isomorf, wenn es einen Isomorfismus G → H gibt.
238
KAPITEL 9. GRUPPEN
Bemerkungen 9.1.13 Im Folgenden sei die multiplikative Schreibweise benutzt.
a) Die Umkehrabbildung eines Isomorfismus f : G → H ist wieder ein solcher.
Zunächst ist ja f −1 : H → G wieder bijektiv.
Seien nun zu gegebenen a0 , b0 ∈ H die Elemente a, b ∈ G durch a := f −1 (a0 ), b := f −1 (b0 )
definiert. Dann ist a0 = f (a), b0 = f (b), also a0 b0 = f (a)f (b) = f (ab). Hieraus folgt f −1 (a0 b0 ) =
f −1 (f (ab)) = ab. Mit ab = f −1 (a0 )f −1 (b0 ) erhält man dann f −1 (a0 b0 ) = f −1 (a0 )f −1 (b0 ).
b) Ist f : G → H ein Gruppenhomomorfismus und 1 das neutrale Element von G, so ist f (1)
das neutrale Element von H. Denn es ist ja f (1)2 = f (12 ) = f (1). Wende die Bemerkung (9.1.3
a) an.
c) Ist f ein Gruppenhomomorfismus, so gilt f (a−1 ) = f (a)−1 . Denn f (a)◦f (a−1 ) = f (a◦a−1 ) =
f (1) = 1.
Beispiele 9.1.14 a) Sei m > 0 ganz. Wir betrachten einerseits die additive Gruppe von Z/(m),
andererseits die multiplikative Gruppe Em der m-ten Einheitswurzeln, d.h. derjenigen komplexen Zahlen z, die die Gleichung z m = 1 erfüllen.
Diese beiden Gruppen sind isomorf! Wir wissen ja, dass für jede m-te Einheitswurzel ζ die
Gleichung ζ a = ζ b gilt, wenn a, b ganze Zahlen sind, die modulo m kongruent sind. Sei jetzt
ζ1 := cos(2π/m) + i sin(2π/m).
Dann ist die folgende Abbildung wohldefiniert:
ϕ : Z/(m) → Em , (a mod m) 7→ ζ1a .
Da für beliebige a, b ∈ Z, z ∈ C die Regel z a+b = z a · z b gilt, ist ϕ ein Homomorfismus. Die Bijektivität gilt, da auf Grund der Wahl von ζ1 die Zahlen ζ10 , . . . ζ1m−1 untereinander verschieden
sind. (Beachte, dass man ζ1 nicht durch jede m-te Einheitswurzel ersetzen kann. Sei nämlich etwa m = 4. Die Abbildung Z/(4) → {1, i, −1, −i} mit a 7→ ζ a ist zwar für jedes ζ ∈ {1, i, −1, −i}
wohldefiniert, aber nur für ζ = ±i surjektiv!)
b) Allgemeiner: Sei G eine multiplikativ geschriebene Gruppe und a ∈ G. Dann ist die Abbildung
f : Z → G, n 7→ an
ein Gruppenhomomorfismus, wenn wir von Z nur die additive Struktur betrachten. Dabei
braucht f weder injektiv noch surjektiv zu sein.
c) Je zwei Gruppen G, H von 2 Elementen sind zueinander isomorf.
Denn jede solche Gruppe besteht ja aus Elementen e, a mit dem neutralen Element e und einem
von e verschiedenen a, deren Verknüpfung, wie oben gesehen zwangsläufig ist.
9.1.15 Jetzt bestimmen wir die Gruppen der Ordnung 3. Sei G eine solche und seien a, b die
beiden von 1 verschiedenen Elemente.
9.1. WAS SIND GRUPPEN?
239
Die drei Elemente a1, aa, ab müssen die drei verschiedenen Elemente von G sein. Aus ab = b
würde a = abb−1 = bb−1 = 1 folgen. Analog ist ab = a nicht möglich. Also bleibt ab = 1 und
a2 = b.
In der folgenden Multiplikationstabelle ist die erste Zeile klar, die zweite gerade bestimmt
worden. Die dritte ergibt sich zwangsläufig daraus, dass in jeder Spalte jedes Element genau
einmal auftritt.
1 a b
1 1 a b
a a b 1
b b 1 a
Betrachte die oben gefundene Untergruppe V = {I, δ, δ 0 } ⊂ S3 . Ihre Gruppentafel ist
I
I I
δ δ
δ0 δ0
δ
δ
δ0
I
δ0
δ0
1
δ
Du siehst, die zweite Tabelle geht aus der ersten hervor, wenn man 1 durch I, a durch δ und
b durch δ 0 ersetzt. Also ist die erste Multiplikationstabelle die einer Gruppe; insbesondere gilt
für G die Assoziativität. Da die erste Gruppentafel sich zwangsläufig aus der Voraussetzung
ergibt, dass G aus den Elementen 1, a, b besteht, erkennst Du dass es bis auf Isomorfie nur eine
Gruppe von 3 Elementen gibt.
Ferner siehst Du a2 = b, b2 = a, a3 = b3 = ab = 1. Die Elemente kann man als Potenzen
von a schreiben: a0 = 1, a1 = a, a2 = b, a3 = 1, a4 = a, wonach sie sich periodisch wiederholen.
Ebenso geht es mit den Potenzen von b, nämlich b0 = 1, b1 = b, b2 = a, b3 = 1 usw. Offenbar
kann man die Rollen von a und b vertauschen. Das heißt, die Abbildung α : G → G, definiert
durch α(1) = 1, α(a) = b, α(b) = a ist ein Isomorfismus von G nach G, ein sogenannter
Automorfismus. Aber α ist nicht die identische Abbildung idG .
Nochmal: Wie im Fall der Ordnung 2 gibt es bis auf Isomorfie genau eine Gruppe der Ordnung 3.
Diese ist abelsch. Dies lässt sich verallgemeinern. Für jede Primzahl p gibt es bis auf Isomorfie
genau eine Gruppe der Ordnung p, nämlich die (abelsche) additive Gruppe von Z/(p). Das
werden wir weiter unten sehen. Hingegen gibt es bis auf Isomorfie zwei Gruppen der Ordnung
4, die beide abelsch sind, sowie zwei Gruppen der Ordnung 6. Die eine Gruppe der Ordnung 6
ist die additve Gruppe von Z/(6), also insbesondere abelsch, die andere unsere S3 , also nicht
abelsch. (Der Beweis dafür, dass es bis auf Isomorfie keine andere Gruppe der Ordnungen 4
oder 6 gibt, ist leider nicht so einfach.)
Beispiele 9.1.16 In der Gruppe Gl2 (Q) der invertierbaren 2 × 2-Matrizen über Q gibt es zwei
Untergruppen der Ordnung 4, die nicht zueinander isomorf sind, nämlich einerseits die aus
folgenden Elementen bestehende
1 0
−1 0
1 0
−1 0
E=
,
,
,
;
0 1
0 1
0 −1
0 −1
240
KAPITEL 9. GRUPPEN
andererseits die aus folgenden Elementen bestehende
1 0
0 −1
−1 0
E=
,
,
,
0 1
1 0
0 −1
0 1
−1 0
.
Prüfe nach, dass es sich wirklich um Untergruppen handelt.
In der ersten gilt für alle Elemente A2 = E, in der zweiten ist
0 −1
1 0
2
=
−1 0
0 −1
,
0 −1
1 0
3
=
0 1
−1 0
,
0 −1
1 0
4
=E .
Die erste Gruppe besitzt drei Untergruppen der Ordnung 2, die zweite Gruppe nur eine Untergruppe der Ordnung 2. Letztere ist isomorf zur additiven Gruppe von Z/(4).
Untergruppen der additiven Gruppe von Z. Sei m eine natürliche Zahl. Du weißt schon,
dass die Menge mZ = {mz | z ∈ Z}, also die Menge der durch m teilbaren ganzen Zahlen eine
Untergruppe der additiven Gruppe von Z ist. Umgekehrt kann man zeigen:
Satz 9.1.17 Zu jeder Untergruppe H der additiven Gruppe von Z gibt es genau eine natürliche
Zahl m mit H = mZ.
Beweis:
Ist H = {0} so ist H = 0Z, aber H 6= mZ für m 6= 0.
Ist H 6= {0}, so gibt es ein a ∈ H, a 6= 0. Da mit a auch −a ∈ H ist, gibt es sogar ein positives
a ∈ H. Sei m die kleinste positive Zahl, die zu H gehört. Ich behaupte, dass H = mZ ist.
Um dies zu beweisen nimm an, a sei ein beliebiges Element von H. Dividiere a durch m mit
Rest: a = qm + r mit 0 ≤ r < m.
Ist r = 0, so ist a ein Vielfaches von m.
Wäre hingegen r > 0, so wäre r = a − qm ein positives Element von H, das aber kleiner als m
wäre. Das widerspräche der minimalen Wahl von m. Es bleibt nur die Möglichkeit, dass a ein
Vielfaches von m ist.
Sind m, m0 positive ganze Zahlen mit mZ = m0 Z, so ist sowohl m als auch m0 das kleinste
positive Element von mZ, was m = m0 zur Folge hat.
AUFGABEN
1. Sei G eine (multiplikativ geschriebene) endliche abelsche Gruppe. Was kann man über das
Produkt aller ihrer Elemente sagen? Beantworte diese Frage speziell unter der Voraussetzung,
dass es genau ein Element der Ordnung 2 im G gibt, also genau ein a 6= 1 mit a2 = 1.
2. Zeige: In einem Körper K erfüllen nur 1 und −1 die Gleichung x2 = 1. Das gilt auch, falls
1 = −1 in K gilt.
9.2. NEBENKLASSEN
241
3. Folgere aus den letzten beiden Aufgaben (p − 1)! ≡ −1 (mod p), falls p eine Primzahl ist. (Satz
von Wilson).
4. Zeige auch die Umkehrung: Ist n > 1 keine Primzahl, so ist (n − 1)! 6≡ −1 (mod n). (Unterscheide, ob n = 4 oder n > 4.)
5. Beantworte (etwa mit Hilfe des Satzes von Wilson) die Frage, ob 100! + 1 eine Primzahl ist.
6. Sei p eine Primzahl mit p ≡ 1 (mod 4). Folgere aus dem Satz von Wilson, dass −1 in dem
Körper Z/(p) ein Quadrat ist.
7. Zeige dass in einem Körper die Menge aller von 0 verschiedenen Elemente der Form a2 + b2 eine
Untergruppe der multiplikativen Gruppe ist. (Dabei darf einer der Summanden 0 sein.) (Tipp:
Beispiel f) in (9.1.10).)
8. Zeige, dass die additive Gruppe aller reellen Zahlen zur multiplikativen Gruppe der positiven
reellen Zahlen isomorf ist.
9. Ist die additive Gruppe aller rationalen Zahlen isomorf zur multiplikativen Gruppe aller positiven rationalen Zahlen?
10. Betrachte die Potenzmenge P (M ) einer Menge M . Zeige, dass P (M ) eine abelsche Gruppe wird,
wenn man als Verknüpfung die symmetrische Differenz wählt, also (etwa additiv geschrieben)
A + B := A ∪ B − (A ∩ B) definiert.
11. Sei G eine Gruppe, derart, dass alle ihre Elemente a die Gleichung a2 = 1 erfüllen. Zeige: G ist
abelsch.
12. Du magst Dich fragen, warum man von der additiven Gruppe eines Ringes verlangt, dass sie
kommutativ ist. Genauer. Warum betrachtet man keine ‘ringähnlichen’ Rechenbereiche, deren
additive Gruppe nicht kommutativ ist?
Nun berechne (a+b)(1+1) mit Hilfe der beiden Distributivgesetze: Einmal als (a+b)+(a+b) =
a + b + a + b, zum andern als a(1 + 1) + b(1 + 1) = a + a + b + b.
13. Zeige: Die Gruppen S3 und Gl2 (F2 ) sind isomorf.
9.2
Nebenklassen
Es handelt sich hier um eine Verallgemeinerung der bekannten Restklassen r + mZ in Z.
Der grundlegende Satz über endliche Gruppen besagt, dass die Ordnung einer (beliebigen) Untergruppe H einer endlichen Gruppe G deren Ordnung teilt.
Dies zeigen wir, indem wir G in Teilmengen zerlegen, deren jede soviele Elemente wie H besitzt.
242
KAPITEL 9. GRUPPEN
Diese Zerlegung existiert unabhängig davon, ob G endlich ist. Unter einer zusätzlichen Voraussetzung über die Untergruppe H kann man die entsprechenden Teilmengen von G zu den
Elementen einer Gruppe machen! Das besprechen wir im nächsten Abschnitt. Ein Beispiel davon kennst Du schon, nämlich wie man Z/(m) aus Z gewinnt. (Beachte: Z/(m) ist als Ring ja
insbesondere eine Gruppe bezüglich der Addition.)
Definition 9.2.1 Sei also G eine Gruppe und H eine Untergruppe und a ein Element von G.
Die Linksnebenklasse von a nach H ist die Menge aH := {ax | x ∈ H}. Die Rechtsnebenklasse von a nach H ist die Menge Ha := {xa | x ∈ H}. Wenn klar ist, was von beiden
gemeint ist, sagen wir kurz Nebenklasse.
Wir benutzen hier die multiplikative Schreibweise! D.h. die Nebenklasse aH ist völlig analog
der Restklasse r + mZ in Z gebildet, wo wir die additive Schreibweise benutzen. G entspricht Z,
und H entspricht mZ und schließlich a ∈ G der Zahl r ∈ Z. D.h. die Nebenklasse aH entspricht
der Restklasse r + mZ.
Bemerkung 9.2.2 Ist G nichtabelsch, so kann durchaus aH 6= Ha sein. S.u.
Satz 9.2.3 Für Nebenklassen aH, bH, (bzw. Ha, Hb) in G gilt:
a) Es gibt (für ein fest gegebenes a) eine bijektive Abbildung f : H → aH. Mithin haben H und
aH gleichviele Elemente.
b) aH = bH ⇐⇒ b ∈ aH ⇐⇒ a−1 b ∈ H.
Beachte: Zwei Nebenklassen aH, bH sind nicht schon dann verschieden, wenn a 6= b
ist, sondern erst, wenn sie als Mengen verschieden sind, d.h. wenn es ein Element
in einer gibt, das nicht in der anderen liegt. Erinnere Dich daran, dass r + mZ = s + mZ
genau dann gilt, wenn r ≡ s (mod m) ist.
b’) Ha = Hb ⇐⇒ ba−1 ∈ H. Beachte den kleinen Unterschied zu b).
c) Es ist entweder aH = bH oder aH ∩ bH = ∅.
Beweis: a) Definiere f : H → aH durch f (x) := ax. Nach Definition von aH ist f surjektiv.
Um die Injektivität von f zu zeigen, nimm an, es sei f (x) = f (y), also ax = ay. Dann ist
auch a−1 (ax) = a−1 (ay). Mittels der Assoziativität und a−1 a = 1 folgt dann die gewünschte
Gleichheit x = y.
b) Wir zeigen, dass aus der ersten Aussage die zweite, aus der zweiten die dritte und schließlich
aus der dritten wieder die erste folgt. Damit folgt aber aus jeder der drei Aussagen auch jede
andere.
Ist aH = bH, so gilt insbesondere b ∈ aH, da ja b = b1 ∈ bH ist.
Ist b ∈ aH, so gibt es (nach Definition von aH) ein x ∈ H mit b = ax. Hieraus folgt a−1 b =
x ∈ H.
9.2. NEBENKLASSEN
243
Sei a−1 b ∈ H, also a−1 b = y, d.h. b = ay für ein geeignetes y ∈ H. Nach Definition ist bH die
Menge der bx mit x ∈ H, also die Menge der ayx mit x ∈ H. Überlege Dir jetzt, dass mit x
auch yx die ganze Menge H durchläuft. Demnach ist aH = ayH = bH. (Nicht wahr: mit x
und y gehört auch xy zur Untergruppe H. Ist umgekehrt z irgendein Element von H, so ist
z = (zy −1 )y von der Form xy mit einem x ∈ H, nämlich x = zy −1 .)
c) Nimm an, es sei aH ∩ bH 6= ∅. Also gibt es x, y ∈ H mit ax = by. Wir haben zu zeigen,
dass dann aH = bH ist. Aus ax = by folgt b = axy −1 Dabei ist xy −1 ∈ H. Also ist b ∈ aH und
gemäß b) deshalb aH = bH.
Beispiele 9.2.4 a) H selbst ist immer eine Nebenklasse nach H, nämlich H = xH für alle
x ∈ H, insbesondere H = 1H.
b) Ist H = G, so gibt es nur eine Nebenklasse nach H, nämlich H.
c) Ist H = {1}, so besteht jede Nebenklasse aus genau einem Element. Die einelementigen
Teilmengen von G sind die Nebenklassen nach {1}.
d) Sei G = S3 , unsere bekannte Gruppe der Permutationen der Menge {1, 2, 3}, und H = U1 =
{I, σ1 . Die Nebenklassen nach U1 sind:
U1 = {I, σ1 } = σ1 U1 , σ2 U1 = {σ2 , δ 0 } = δ 0 U1 , σ3 U1 = {σ3 , δ} = δU1
Je schwerer es Dir gefallen ist, obigen Satz zu verstehen, umso intensiver solltest Du dieses
Beispiel studieren. Übrigens ist U1 σ2 = {σ2 , δ} =
6 σ2 U1 .
e) Sei wiederum G = S3 , aber jetzt H = V . Die Nebenklassen nach V sind die 2 folgenden
Mengen:
V = {I, δ, δ 0 } = δV = δ 0 V, σ1 V = {σ1 , σ2 , σ3 } = σ2 V = σ3 V
Du kannst leicht nachrechnen, dass auch
V = V δ = V δ 0 und σ1 V = V σ1 = V σ2 = V σ3
gilt. Für V gilt also xV = V x für alle x ∈ S3 , im Gegensatz zu Ui !
f) Der Ring Z ist in Bezug auf die Multiplikation keine Gruppe. Deshalb ist auch mZ :=
{mz | z ∈ Z} für m > 1 keine Nebenklasse nach Z !
9.2.5 Sei jetzt G wieder eine beliebige (multiplikativ geschriebene) Gruppe und H eine Untergruppe von G.
Jedes Element a von G liegt in einer Nebenklasse nach H, nämlich in aH. Liegt a auch in
der Nebenklasse bH, so ist schon aH = bH. Jedes Element von G liegt somit in genau einer
Nebenklasse nach H.
G ist also die Vereinigung aller Nebenklassen nach H, und zwar die disjunkte Vereinigung
dieser Nebenklassen. Mit ‘disjunkt’ meine ich: Je zwei verschiedene Nebenklassen haben einen
leeren Durchschnitt.
244
KAPITEL 9. GRUPPEN
Sei nun G endlich. Dann sind natürlich auch H und die Anzahl r der Nebenklassen nach
H endlich. (Jede endliche Menge hat nur endlich viele Teilmengen.) Seien nun a1 , . . . , ar so
gewählt, dass a1 H, a2 H, . . . ar H die r verschiedenen Nebenklassen von G nach H sind. (Jedes
ai darf durch ein beliebiges a0i ∈ ai H ersetzt werden.) Dann wissen wir:
1. G = a1 H ∪ a2 H ∪ . . . ∪ ar H;
2. ai H ∩ aj H = ∅, wenn i 6= j ist;
3. jedes ai H hat soviele Elemente wie H.
Es folgt: G hat r-mal soviele Elemente wie H. Wir haben folgendes bewiesen:
Satz 9.2.6 Sei G eine endliche Gruppe und H eine Untergruppe von G, dann ist die Ordnung
von H ein Teiler der Ordnung von G.
9.2.7 Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Die Potenzen an mit
n ∈ Z bilden offenbar eine abelsche Untergruppe von G, die von a erzeugte Untergruppe,
die mit hai bezeichnet wird. Man kann zwei Fälle unterscheiden:
1. Falls m 6= n, ist immer auch am 6= an . D.h. alle Potenzen
. . . , a−2 , a−1 , 1, a, a2 , . . .
sind untereinander verschieden. In diesem Fall ist die Abbildung
Z → hai, n 7→ an
ein Isomorfismus, wo Z als additive Gruppe betrachtete wird.
Z.B. gilt dies für a = 2 in Q∗ , der multiplikativen Gruppe aller von 0 verschiedenen rationalen
Zahlen.
2. Es gibt ganze Zahlen m 6= n mit am = an . Dies gilt z.B. für a = −1 in Q∗ , da (−1)2 = (−1)4
ist, und allgemeiner (−1)m = (−1)n genau dann stimmt, wenn m, n beide gerade oder beide
ungerade sind, m.a.W. wenn m ≡ n (mod 2) ist. Ein anderes Beispiel ist das Element δ ∈ S3 .
Die von δ erzeugte Gruppe ist {I, δ, δ 0 } = V , da δ 2 = δ 0 und δ 3 = I ist. Hier gilt δ m = δ n ⇐⇒
m ≡ n (mod 3).
Im Fall 1. ist die von a erzeugte Gruppe und mit ihr auch G unendlich. Ist G endlich, muss
demnach der 2. Fall eintreten.
Im 2. Fall gelte am = an mit m 6= n, etwa m > n. Dann ist am−n = 1. Mithin gibt es dann eine
positive ganze Zahl r mit ar = 1. Sei k die kleinste positive ganze Zahl mit ak = 1.
Behauptung. Unter den o.a. Voraussetzungen gilt
m ≡ n (mod k) ⇐⇒ am = an
Beweis hierfür: Ist ak = 1, so ist auch akl = (ak )l = 1 für jede ganze Zahl l. Aus m ≡ n (mod k)
folgt m − n = kl für ein l, hieraus am−n = 1, also am = an .
9.2. NEBENKLASSEN
245
Sei umgekehrt am = an , also am−n = 1. Dividiere m − n durch k mit Rest: m − n = qk + r,
wo q, r ∈ Z und 0 ≤ r < k. Es folgt ar = am−n−qk = am−n (ak )−q = 1. Wäre r > 0, so wäre r
eine positive ganze Zahl mit ar = 1, die kleiner als k wäre. Das widerspräche der Wahl von k.
Somit ist r = 0, d.h. m − n = qk, also m ≡ n (mod k). –
Die verschiedenen Potenzen von a sind demnach a0 , a1 , a2 , . . . , ak−1 . Diese bilden eine Untergruppe von G aus k Elementen. Diese Untergruppe ist isomorf zur additiven Gruppe Z/(k),
sowie zur multiplikativen Gruppe der n-ten Einheitswurzeln.
Definition 9.2.8 Die Ordnung eines Elementes a einer (multiplikativ geschriebenen) Gruppe
ist:
∞, wenn die Potenzen an sämtlich verschieden sind.
k, wenn die Potenzen an nicht sämtlich verschieden sind und k die kleinste positive ganze
Zahl mit ak = 1 ist.
Bemerkung 9.2.9 Die Ordnung k eines Elementes a einer Gruppe G ist die Ordnung der von
a erzeugten Untergruppe. Ist insbesondere G endlich, so ist k (natürlich endlich) und ein Teiler
von #G.
Satz 9.2.10 Sei G eine endliche (multiplikativ geschriebene) Gruppe aus g Elementen und
a ∈ G. Dann ist ag = 1.
Beweis:
1l = 1.
Die Ordnung k von a ist ein Teiler von g, etwa g = kl. Somit ist ag = akl = (ak )l =
Folgerung 9.2.11 Zu jeder Primzahl p gibt es bis auf Isomorfie nur eine Gruppe der Ordnung
p. Diese ist isomorf zur additiven Gruppe von Z/(p) und somit abelsch.
Beweis: Sei G eine Gruppe der Ordnung p und a ∈ G nicht das neutrale Element. Die
Ordnung der von a erzeugten Untergruppe hai ist ein Teiler von p. Andererseits ist ihre Ordnung
größer als 1, da sie außer dem neutralen Element mindestens ein weiteres Element enthält. Also
ist ihre Ordnung p. Somit ist G gleich hai, also isomorf zur additiven Gruppe von Z/p.
Folgerung 9.2.12 (Fermat) Sei p eine Primzahl und a ∈ Z nicht durch p teilbar. Dann gilt
ap−1 ≡ 1 (mod p).
Beweis: Wir betrachten den Körper Z/(p). Dieser hat p Elemente. Seine multiplikative
Gruppe besteht aus allen Elementen außer der Restklasse von 0, also aus p − 1 Elementen. Für
jedes Element x 6= 0 dieses Körpers gilt also xp−1 = 1. Die Restklasse jeder ganzen Zahl a, die
nicht durch p teilbar ist, ist ein Element x 6= 0 dieses Körpers. Die Gleichung xp−1 = 1 in dem
Körper Z/(p) bedeutet dann die Kongruenz ap−1 ≡ 1 (mod p) in Z.
246
KAPITEL 9. GRUPPEN
Bemerkung 9.2.13 Die fundamentale Tatsache (9.2.10) über endliche Gruppen ergibt also
unmittelbar den angegebenen zahlentheoretischen Satz von Fermat.
Beachte, dass aus diesem Satz für ganz beliebige a ∈ Z und eine Primzahl p die Kongruenz
ap ≡ a (mod p) folgt (auch wenn a durch p teilbar sein sollte).
Auch gilt allgemein für a, b, m, n ∈ Z und jede Primzahl p die Implikation:
a ≡ b (mod p) und m ≡ n (mod p − 1) =⇒ am ≡ bn (mod p)
Beachte: Um eine Kongruenz modulo p von Potenzen zu erhalten, hat man also für die Basen die
Kongruenz modulo p, hingegen für die Exponenten die Kongruenz modulo p−1 vorauszusetzen!
Natürlich kann man allgemeiner Ringe der Form Z/(m) betrachten und darin die multiplikative
Gruppe der (multiplikativ) invertierbaren Elemente (Z/(m))∗ . Die Anzahl der Elemente dieser
Gruppe wird seit Euler mit ϕ(m) bezeichnet. Für ganze Zahlen a, die zu m teilerfremd sind,
d.h. deren Restklassen in Z/(m) invertierbar sind, gilt dann
aϕ(m) ≡ 1 (mod m) (Euler)
Dieser Satz wird erst dann interessant, wenn man ϕ(m) berechnen kann. Dies ist leicht möglich,
wenn man die Primfaktorzerlegung von m kennt. Sei nämlich
m = pk11 · · · pkr r
mit verschiedenen Primzahlen p1 , . . . , pr und natürlichen Zahlen ki ≥ 1; dann ist
ϕ(m) = (pk11 − pk11 −1 ) · · · (pkr r − pkr r −1 )
Falls m = pk eine Primzahlpotenz ist, gilt ϕ(pk ) = pk − pk−1 . Das kannst Du vielleicht selbst
nachprüfen. Zum allgemeinen Fall benötigt man den sogenannten chinesischen Restsatz, der
weiter unten bewiesen wird.
Definition 9.2.14 Eine Gruppe G heißt zyklisch, wenn es ein a ∈ G mit hai = G gibt.
Bemerkung 9.2.15 Bis auf Isomorfie gibt es genau eine zyklische Gruppe unendlicher Ordnung. Diese ist isomorf zur additiven Gruppe von Z.
Zu jeder endlichen Ordnung m ≥ 1 gibt es bis auf Isomorfie genau eine zyklische Gruppe. Diese
ist isomorf zur additiven Gruppe von Z/(m) und zur multiplikativen Gruppe Em der m-ten
Einheitswurzeln. Das wird weiter unten bewiesen.
AUFGABEN
1. Endliche Untergruppen von C∗ , der multiplikativen Gruppe des Körpers C. Sei G eine endliche
Untergruppe der Ordnung n von C∗ . Dann gilt an = 1 für alle a ∈ G. Also gilt G ⊂ En , wobei
En die Gruppe der n-ten Einheitswurzeln ist. Es folgt G = En , da auch En aus n Elementen
besteht.
9.3. FAKTORGRUPPEN
247
2. Sei G eine (multiplikativ geschriebene) endliche zyklische Gruppe. Zeige: Hat G eine ungerade
Ordnung, so ist in G jedes Element das Quadrat eines geeigneten Elementes von G. Hat hingegen
G eine gerade Ordnung, so ist genau die Hälfte der Elemente von G ein Quadrat in G.
3. Sei G eine zyklische Gruppe von der Ordnung g und g zu m > 0 teilerfremd. Dann ist jedes
Element von G eine m-te Potenz in G. Ist hingegen die Ordnung von G durch m teilbar, so ist
jedes m-te Element von G eine m-te Potenz in G.
4. a) Ist die Zahl 10 · 210 + 1 eine Primzahl?
b) Sei p 6= 101 eine Primzahl. Kann dann 100 · p100 + 1 eine Primzahl sein?
c) Seien p, q verschiedene Primzahlen. Kann dann (q − 1) · pq−1 + 1 eine Primzahl sein?
5. Bestimme (bis auf Isomorfie) alle Gruppen der Ordnung 4.
Bemerkung: Natürlich bleibt es Dir unbenommen, zu zeigen, das es bis auf Isomorfie nur 2
Gruppen der Ordnung 6 gibt, nämlich die S3 und die Z/(6). Es scheint mir allerdings nicht
unbedingt sinnvoll, mit den wenigen in diesem Buch bereit gestellten Mitteln für zuviele n die
Gruppen der Ordnung n zu bestimmen. Schon der Fall der Ordnung 6 ist nicht trivial.
Auch wenn man mit verhältnismäßig elementaren Mitteln etwas weiter kommt – ich selber
habe einst die Gruppen der Ordnungen 48 und 52 bestimmt – bleibt letztlich der Versuch, alle
endlichen Gruppen zu beschreiben, unbefriedigend.
Anders ist die Sache bei endlichen abelschen Gruppen. Kennt man die Primfaktorzerlegung
einer natürlichen Zahl n, kann man die abelschen Gruppen der Ordnung n leicht beschreiben.
9.3
Faktorgruppen
Betrachte die additive Gruppe von Z. Du weißt bereits, dass die Mengen mZ mit m ∈ N die
Untergruppen von Z sind.
Wenn man von den multiplikativen Strukturen auf Z und Z/(m) absieht, so sind beide additive
Gruppen und die Abbildung k 7→ k + mZ von Z nach Z/(m) ist ein surjektiver Gruppenhomomorfismus.
9.3.1 Wir verallgemeinern die Konstrukion von Z/(m). Zu einer Untergruppe U einer abelschen
(multiplikativ geschriebenen) Gruppe G bilden wir die Nebenklassen aU , wo a ∈ G ist. Wir
wissen bereits, dass verschiedene Nebenklassen disjunkt sind und ihre Vereinigung ganz G ausmacht. Die Menge der Nebenklassen bezeichnet man mit G/U . Nun definiert man das Produkt
zweier Nebenklassen, wie folgt: (aU )(bU ) := (ab)U . Es stellt sich die Frage nach der Wohldefiniertheit. D.h. wir müssen uns vergewissern, dass aus aU = a0 U, bU = b0 U die Gleichheit
(ab)U = (a0 b0 )U folgt. (Dabei brauchen wir die Voraussetzung, dass G abelsch ist.)
Beweis hierfür: Die Voraussetzungen bedeuten a−1 a0 ∈ U, b−1 b0 ∈ U . Dann ist (ab)−1 a0 b0 =
a−1 a0 b−1 b0 ∈ U , da G abelsch und U eine Gruppe ist. –
248
KAPITEL 9. GRUPPEN
Man erhält eine surjektive Abbildung κ : G → G/U, a 7→ aU mit der Eigenschaft κ(ab) =
κ(a)κ(b). Auf Grund dieser Eigenschaft und der Surjektivität überträgt sich die Gruppenstruktur von G auf G/U . Das neutrale Element ist 1U = U , das Inverse von aU ist die Nebenklasse
a−1 U .
Mache Dir klar, dass tatsächlich die Konstruktion der additiven Gruppe Z/(m) ein
Spezialfall der der Konstruktion von G/U als Gruppe ist. Lediglich die Schreibweise
‘additiv’, bzw. ‘multiplikativ’ ist verschieden!
Ist G nicht abelsch, kann man nicht wie oben argumentieren. In der Tat muss U eine gewisse
Eigenschaft haben, die im abelschen Fall immer erfüllt ist. Für alle a ∈ G muss nämlich
aU = U a gelten.
Im folgenden Beispiel gibt es Gruppenelemente x, y mit xU = yU , aber (xx)U 6= (yy)U .
Beispiel 9.3.2 Sei mit den Bezeichnungen aus dem ersten Abschnitt G = S3 , U = U1 =
{I, σ1 }. Dann ist σ3 U = {σ3 , δ}, also σ3 U = δU . Aber σ3 ◦σ3 und δ ◦δ liegen in verschiedenen
Linksnebenklassen nach U1 . Es ist nämlich σ3 ◦σ3 = I, und δ ◦δ = δ 0 , hingegen IU = U und
δ 0 U = {δ 0 , σ2 } =
6 {I, σ1 } = U .
Definition 9.3.3 Ein Normalteiler einer Gruppe G ist eine Untergruppe U von G, für die
folgendes gilt: Für jedes a ∈ G ist aU = U a.
Satz 9.3.4 Sei G eine Gruppe, U ⊂ G eine Untergruppe. Durch die Vorschrift (aU )(bU ) :=
(ab)U (für alle a, b ∈ G) wird genau dann eine Multiplikaton in der Menge der Nebenklassen
nach U wohldefiniert, wenn U ein Normalteiler von G ist.
Beweis: a) Sei U ein Normalteiler. Wir setzen aU = a0 U und bU = b0 U voraus. Dann ist
a0 = au und b0 = bv für geeignete u, v ∈ U . Es gilt also a0 b0 = aubv. Da U ein Normalteiler
ist, ist U b = bU . Also gibt es ein u0 ∈ U mit ub = bu0 . Es folgt a0 b0 = aubv = abu0 v ∈ (ab)U .
Deshalb haben wir die Gleichheit (ab)U = (a0 b0 )U .
b) Sei o.a. Produkt für alle a, b ∈ G wohldefiniert, sowie a = u ∈ U , d.h. aU = 1U . Dann muss
(ub)U = (1b)U sein, d.h. ub ∈ bU . Da dies für beliebige u ∈ U gilt, folgt U b ⊂ bU . Daraus ergibt
sich offenbar b−1 U ⊂ U b−1 . Beides gilt für alle b ∈ G. Da mit b auch b−1 ganz G durchläuft,
gilt für alle a ∈ G sowohl U a ⊂ aU als auch aU ⊂ U a. Mithin ist U ein Normalteiler.
9.3.5 Sei U ein Normalteiler einer Gruppe G. Wie oben (im abelschen Fall) wird mit G/U die
Menge der Nebenklassen von G nach U bezeichnet. Wie dort siehst Du, dass G/U wieder eine
Gruppe ist.
Definition 9.3.6 Wenn U ein Normalteiler einer Gruppe G ist, heißt G/U die Faktorgruppe
von G nach U .
9.3. FAKTORGRUPPEN
249
Beispiel 9.3.7 Sei wieder G = S3 . Zeige, dass die Untergruppe V = {I, δ, δ 0 } ein Normalteiler
ist, und dass S3 /V eine Gruppe von 2 Elementen ist. Die Nebenklasse V ist das neutrale,
die Nebenklasse σ1 V das weitere Element. Erinnere Dich daran, dass V = δV = δ 0 V und
σ1 V = σ2 V = σ3 V gelten. Es gibt genau 2 Nebenklassen von S3 nach V . Die Faktorgruppe
S3 /V ist also eine Gruppe von 2 Elementen, d.h. isomorf zur aditiven Gruppe Z/(2) und zur
Untergruppe {1, −1} von Q∗ .
In obigen Beispiel haben wir gesehen, dass U1 kein Normalteiler von S3 ist. Dasselbe gilt
natürlich für U2 und U3 .
Theorem 9.3.8 Homomorfiesatz. Sei f : G → H ein Gruppenhomomorfismus und K :=
f −1 ({1H }) sein sogenannter Kern. (1H bezeichnet das neutrale Element von H.) Dann ist
K ein Normalteiler von G und im(f ) = f (G) eine Untergruppe von H. Und es wird durch
ϕ(xK) := f (x) eine Abbildung ϕ : G/K → f (G) wohldefiniert. Diese ist ein Isomorfismus.
Man kennt also die Struktur des Bildes eines Gruppenhomomorfismus G → H, wenn man
seinen Kern als Teilmenge von G kennt.
Beweis: Seien f (a), f (b) beliebige Elemente von f (G). Dann ist f (a−1 b) = f (a)−1 f (b), ferner
gilt 1H = f (1G ). Also ist f (G) eine Untergruppe von H.
Sicher ist 1G ∈ K. Ferner, seien a, b ∈ K. Dann gilt f (a−1 b) = f (a)−1 f (b) = 1. Also ist K
eine Untergruppe von G. Ist x ∈ G, a ∈ K, so ist f (xax−1 ) = f (x)f (a)f (x)−1 = f (x) · 1H ·
f (x)−1 = 1H . D.h. mit a ∈ K gilt xax−1 ∈ K, d.h. xa ∈ Kx. Also ist xK ⊂ Kx und aus
Symmetriegründen Kx ⊂ xK. Mithin ist xK = Kx und K ein Normalteiler.
Wir müssen zeigen, dass ϕ wohldefiniert ist. Sei also xK = yK, d.h. es gibt ein a ∈ K mit
y = xa. Es folgt f (y) = f (x)f (a) = f (x), was zu zeigen war.
ϕ ist ein Homomorfismus. Denn ϕ((xK)(yK)) = ϕ((xy)K) = f (xy) = f (x)f (y) =
ϕ(xK)ϕ(yK).
Das Bild der Abbildung ϕ ist natürlich dasselbe wie das Bild von f . Also ist ϕ surjektiv.
Schließlich sei ϕ(xK) = ϕ(yK), so ist f (x) = f (y). Es folgt f (x−1 y) = 1H , d.h. x−1 y ∈ K, also
xK = yK. Somit ist ϕ injektiv.
Beispiele 9.3.9 a)Betrachte det : Gl2 (K) → K ∗ . Der Gruppenhomomorfismus det ist surjeka 0
tiv, da det
= a gilt. Der Kern von det, der aus den Matrizen mit der Determinante 1
0 1
besteht, wird Sl2 (K), die spezielle lineare Gruppe, genannt. Nach dem Homomorfiesatz ist
Gl2 (K)/Sl2 (K) isomorf zur Gruppe K ∗ .
b) Betrachte die Abbildung R → C∗ , x 7→ exp(xi). Wenn ich R als additive Gruppe auffasse, ist dies ein
Gruppenhomomorfismus. Das Bild dieser Abbildung ist die Untergruppe
1
S := {Z ∈ C |z| = 1} von C∗ . Der Kern ist 2πZ, d.h. besteht aus den ganzzahligen Vielfachen von 2π. Es ist also R/2πZ isomorph zur multiplikativen Gruppe S 1 . Übrigens ergibt
250
KAPITEL 9. GRUPPEN
sich kein wesentlicher Unterschied, wenn ich anstelle der genannten Abbildung die Abbildung
x 7→ exp(2πxi) betrachte. Dann ist der Kern einfach die (additive) Untergruppe Z von R.
Die Gruppenhomomorfismen in den genannten Beispielen sind in keiner Weise Ringhomomorfismen. Es bereichert also ganz sicher die Mathematik, wenn man neben Ringen (und Körpern)
auch Gruppen betrachtet.
Satz 9.3.10 Sei G eine zyklische Gruppe. Dann ist G isomorf zur additiven Gruppe von Z/(m)
für ein eindeutig bestimmtes m ∈ N. Und zwar ist m = 0 genau dann, wenn G unendlich ist.
Anderfalls ist m = #G.
Beweis: Im Grunde wissen wir das schon. Aber es folgt auch direkt aus dem Homomorfiesatz,
indem man für ein erzeugendes Element a den Gruppenhomomorfismus
Z → G, n 7→ an
betrachtet. (Hier wird Z als die additive Gruppe von Z aufgefasst.) Dieser Homomorfismus ist
surjektiv und sein Kern ist eine Untergruppe von Z, also gleich mZ für ein gewisses m ∈ N.
Somit ist G ∼
= Z/mZ. Beachte: Ist m = 0, so ist Z/0Z, und damit G isomorf zu Z, betrachtet
als additive Gruppe.
9.3.11 Ziemlich weit oben, im Kapitel 2 über Ringe und Körper habe ich das direkte Produkt
von Ringen definiert: R1 × R2 × · · · × Rn definiert. Dieses besteht aus den n-tupeln (a1 , . . . , an )
mit ai ∈ Ri , wo Summe und Produkt auf naheliegende Weise, nämlich komponentenweise
definiert sind: (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) und (a1 , . . . , an ) · (b1 , . . . , bn ) :=
(a1 · b1 , . . . , an · bn ) . Wenn die Ri lediglich Gruppen sind, kann man natürlich auch ein direktes
Produkt von diesen Gruppen ganz analog definieren, nämlich als cartesisches Produkt der
Mengen mit komponentenweiser Verknüpfung.
a 0
Beispiel: Die Untergruppe der Gl2 (Q) der Ordnung 4, die aus den Matrizen
mit
0 b
a, b ∈ {1, −1} besteht (vgl. 9.1.16), ist isomorf der (additiven) Gruppe (Z/(2)) × (Z/(2)).
Sind R1 , . . . , Rn Ringe, so ist die additive Gruppe des direkten Produktes der Ringe R1 , . . . , Rn
natürlich das direkte Produkt der additiven Gruppen der R1 , . . . , Rn . Betrachte nun auch die
Gruppen Ri∗ der invertierbaren Elemente der Ri , so gilt (R1 ×· · ·×Rn )∗ = R1∗ ×· · ·×Rn∗ . Denn ein
n-tupel (a1 , . . . , an ) besitzt genau dann ein multiplikativ Inverses in dem direkten Produkt, wenn
jede Komponente ai in Ri ein Inverses besitzt. Denn es ist ja (a1 , . . . , an )(b1 , . . . , bn ) = (1, . . . , 1)
genau dann, wenn ai bi = 1 für alle i = 1, . . . , n gilt.
Betrachte nun speziell Ringe der Form Z/(mi ) und die kanonischen Ringhomomorfismen
κi : Z → Z/(mi ), definiert durch κi (a) = a + mi Z. Beachte, dass die κi auch Gruppenhomomorfismen der additiven Gruppen sind!
Zu n solchen mi kann man dann einen Ringhomomorfismus F : Z → Z/(m1 ) × · · · × Z/(mn )
durch F (a) := (κ1 (a), . . . , κn (a)) = (a + m1 Z, . . . , a + mn Z) definieren.
9.3. FAKTORGRUPPEN
251
Beispiele 9.3.12 a) n = 2, m1 = m2 = 3. Das Bild der Abbildung F besteht aus den
Restklassen-Paaren: (0, 0), (1, 1), (2, 2). Die Abbildung F ist also keineswegs surjektiv!
b) n = 2, m1 = 2, m2 = 3. Das Bild von F ist die Menge {F (0) = (0, 0), F (1) = (1, 1), F (2) =
(0, 2), F (3) = (1, 0), F (4) = (0, 1), F (5) = (1, 2)}. Dabei bedeutet der Querstrich in der linken
Komponente die Restklasse modulo 2, die in der rechten Komponente die Restklasse modulo
3.
Du siehst, das Bild von F ist der ganze Ring Z/(2) × Z/(3). Die Abbildung F ist also surjektiv!
Nach dem Homomorfiesatz ist dann Z/(2) × Z/(3) isomorf zu Z/(6), zunächst als additive
Gruppe. Da aber die Abbildung F auch mit der Multiplikation verträglich ist, sind die beiden
Ringe auch als solche isomorf.
Der Unterschied zwischen den beiden Beispielen liegt darin, dass im zweiten die Zahlen 2, 3
zueinander teilerfremd sind, nicht aber die Zahlen 3, 3 im ersten Beispiel.
Um einen dem zweiten Beispiel entsprechenden Satz allgemein zu zeigen, benötigen wir das
Lemma 9.3.13 Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. D.h. für i 6= j sei
ggT(mi , mj ) = 1. Wenn dann eine ganze Zahl k durch jedes der mi teilbar ist, ist k auch
durch das Produkt m1 · · · mn teilbar.
Beweis: Die Primfaktorzerlegung von m1 · · · mn sei pα1 1 · · · pαr r mit untereinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Jeder Primzahlpotenz-Faktor pαi i teilt wegen der
Teilerfremdheit genau eines der mj , da ansonsten mehrere mj einen Primfaktor gemeinsam
hätten. Also gilt pαi i |k für jedes i. Wegen der Eindeutigkeit der Primfaktorzerlegung von k wird
k durch das Produkt aller pαi i also von m1 · · · mn geteilt.
Satz 9.3.14 (Chinesischer Restsatz. Sun Tsu, Chhin Chiu–Shao)
Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. Die kanonischen Homomorfismen
κi : Z −→ Z/(mi ), a 7→ a + mi Z
definieren dann einen surjektiven Homomorfismus
Z −→ Z/(m1 ) × · · · × Z/(mn ) durch a 7→ (κ1 (a), . . . , κn (a))
und einen Isomorfismus
∼
=
G : Z/(m1 · · · mn ) −→ Z/(mi ) × · · · × Z/(mn ) .
Beweis:
Betrachte den oben definierten Homomorfismus
F : Z −→ Z/(m1 ) × · · · × Z/(mn ) .
Sein Kern besteht aus allen a ∈ Z, für die m1 |a, m2 |a, . . . , mn |a gilt. Dies ist nach obigem Lemma gleichbedeutend mit m1 · · · mn |a, da die mi paarweise teilerfremd sind. Somit ist m1 · · · mn Z
252
KAPITEL 9. GRUPPEN
der Kern von F . Nach dem Homomorfiesatz wird also durch F ein injektiver Homomorfismus
induziert:
G : Z/(m1 · · · mn ) −→ Z/(m1 ) × · · · × Z/(mn ) .
Da die Start- und die Zielmenge von G die gleiche endliche Anzahl von Elementen haben,
nämlich m1 · · · mn , ist G auch surjektiv. Und hieraus folgt die Surjektivität der Abbildung F .
Folgerung 9.3.15 Seien m1 , . . . , mn paarweise teilerfremde ganze Zahlen 6=
a1 , . . . , am ∈ Z beliebig. Dann hat das Kongruenzsystem
x ≡ ai
(mod mi )
0 und
(i = 1, . . . , n)
eine Lösung, d.h. es gibt ein x ∈ Z, welches alle n angegebenen Kongruenzen erfüllt. Die Lösung
ist bis auf Kongruenz modulo m1 · · · mn eindeutig bestimmt.
Beweis: Die Existenzaussage folgt aus der Surjektivität, die Eindeutigkeitsaussage aus der
Injektivität der Abbildung G.
Folgerung 9.3.16 Sei m > 1 eine ganze Zahl und m = pα1 1 · · · pαr r ihre Primfaktorzerlegung
mit zueinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Dann ist ϕ(m) = (p1 −
1)pα1 1 −1 · · · (pr − 1)pαr −1 für Eulers ϕ.
Beweis: Betrachte zunächst den Fall m = pα mit einer Primzahl p und α ≥ 1. Die Elemente
des Ringes Z/(pα ) sind die Restklassen der Zahlen 1, 2, . . . , pα . (Um das folgende Argument
durchsichtiger zu machen, habe ich die 0-Restklasse hier durch pα repräsentiert!) Diejenigen
Zahlen dieser Menge, die zu pα nicht teilerfremd sind, sind die Vielfachen von p, also die pα−1
Zahlen p, 2p, . . . , pα−1 p. In dem Ring Z/(pα ) gibt es somit pα − pα−1 = (p − 1)pα−1 zu pα
teilerfremde Restklassen, d.h. Einheiten.
Nach Voraussetzung sind die r Zahlen pα1 1 , . . . , pαr r zueinander paarweise teilerfremd. Also ist
nach dem chinesischen Restsatz Z/(m) isomorf zu dem direkten Produkt Z/(pα1 1 )×· · ·×Z/(pαr r ),
hat also die behauptete Anzahl von Einheiten.
Bemerkung 9.3.17 (RSA-Verschlüsselung) Falls m = pq mit verschiedenen Primzahlen p, q
ist, ist ϕ(m) = (p − 1)(q − 1), wie man aus der letzten Folgerung sieht.
(Dies kannst Du allerdings auch ohne den chinesischen Restsatz direkt einsehen: Von den Zahlen
0, 1, . . . , pq − 1 sind genau p Zahlen durch q teilbar, sowie q Zahlen durch p und genau eine
Zahl, nämlich die 0 sowohl durch p wie durch q. Du erhältst ϕ(pq) = pq−p−q+1 = (p−1)(q−1).)
Ohne die Primfaktorzerlegung von m zu kennen, kann man ϕ(m) nicht wirklich berechnen.
(Wenn man m und ϕ(m) kennt, kann man p und q mittels einer quadratischen Gleichung
bestimmen. Wie? D.h. die Aufgaben, einerseits ϕ(m) zu berechnen, andererseits m in Primfaktoren zu zerlegen sind im wesentlichen gleich mühsam.) Und falls p und q jeweils mehr als
200 Dezimalstellen besitzen, kann einer, dem nur ihr Produkt m bekannt ist, die Faktoren p, q
9.3. FAKTORGRUPPEN
253
meist auch mit Computer-Hilfe nicht finden. Das ist kein mathematischer Satz, sondern ein Erfahrungssatz! Sollte es eines Tages sogenannte Quantencomputer geben, würde diese Aussage
auch nicht mehr stimmen. (Quantencomputer nützen für aufwendige Rechnungen die quantentheoretische Natur der Materie aus. Es gibt solche der Idee nach, aber noch nicht wirklich in
der Realität.)
Einen Text von 200 Zeichen (Buchstaben, Satzzeichen, Leerstellen, ...) kann man durch ein
Zahl von 400 Dezimalstellen codieren. Einen längeren Text kann man in Teile von 200 Zeichen
zerlegen. Es genügt also etwa 400-stellige Zahlen zu verschlüsseln.
Sind k und a natürliche Zahlen, so gilt ak(p−1)(q−1)+1 ≡ a (mod pq). Derjenige, der p und q,
also (p − 1)(q − 1) kennt, kann mit Hilfe des euklidischen Algorithmus leicht natürliche Zahlen
k, c, d mit cd = k(p − 1)(q − 1) + 1 finden. Er kann dann jedermann auffordern, ihm Nachrichten
zu schicken, nachdem sie folgendermaßen verschlüsselt wurden: Ist die Nachricht durch eine
natürliche Zahl a < m, d.h. auch als Element von Z/(m) beschrieben, bilde ac modulo m. Das
ist durch die im 1. Kapitel beschriebene abgekürzte Berechnung von Potenzen möglich, wenn
man nach jeder Einzelrechnung den Rest modulo m bestimmt. Er selber kann sie dann durch
Potenzieren von ac mit d, wieder modulo m, entschlüsseln. Denn da cd = k(p − 1)(q − 1) + 1
ist, gilt
acd = ak(p−1)(q−1)+1 = ak(p−1)(q−1) · a1 ≡ a (mod m) .
Mache Dir klar, dass man xy modulo m verhältnismäßig schnell berechnen kann, dass man
aber d aus m und c nur berechnen kann, wenn man ϕ(m) kennt.
AUFGABEN
1. Sei U eine Untergruppe einer Gruppe G. Zeige: Wenn U kein Normalteiler von G ist, so gibt
es a, b ∈ G mit aU = bU , aber U a 6= U b.
2. Unter der Voraussetzung der letzten Aufgabe gilt aber: aU = bU ⇐⇒ U a−1 = U b−1 . Folglich
gibt es eine bijektive Abbildung von der Menge der Linksnebenklassen nach U auf die Menge
der Rechtsnebenklassen gegeben durch aU 7→ U a−1 . Die Kardinalzahl der Menge der Linksoder der Rechtsnebenklassen von G nach U heißt der Index von U in G. Er wird mit [G : U ]
bezeichnet.
3. Zeige: Gilt unter obiger Voraussetzung [G : U ] = 2, so sind U und G − U sowohl die beiden
Linksnebenklassen als auch die beiden Rechtsnebenklassen von G nach U . Folglich ist U ein
Normalteiler von G.
4. Wann gilt für eine natürliche Zahl n, dass ϕ(n) eine Potenz von 2, also durch keine ungerade
Primzahl teilbar ist?
Zeige: Dies gilt genau für die Zahlen der Form n = 2k p1 · · · pr , wo die Faktoren p1 , . . . , pr
verschiedene sogenannte Fermat’schen Primzahlen sind.
254
KAPITEL 9. GRUPPEN
m
Eine Fermatsche Primzahl ist eine solche der Form 22 + 1. (Du weißt schon, wenn 2n + 1
eine Primzahl ist, muss n = 0 oder n = 2m sein.) Beispiele Fermat’scher Primzahlen sind die
folgenden 2 = 20 + 1, 3 = 21 + 1, 5 = 22 + 1, 17 = 24 + 1, 257 = 28 + 1, 65537 = 216 + 1. Bis
m
jetzt kennt man keine weiteren Primzahlen der Form 22 + 1 als die genannten und weiß von
vielen Zahlen dieser Form, dass sie nicht prim sind.
5. Seien G1 , G2 , H abelsche Gruppen und fi : Gi → H Homomorfismen. Zeige: Die Abbildung
F : G1 × G2 → H mit F (a1 , a2 ) = f1 (a1 ) + f2 (a2 ) (additive Schreibweise in H) ist ein Homomorfismus.
6. Sei H eine endliche Gruppe, in der jedes Element eine Ordnung ≤ 2 hat. Zeige: H ist isomorf
zu Z/(2) × Z/(2) × · · · × Z/(2) mit einer geeigneten Anzahl von Faktoren. (Hinweis: Wir
wissen schon, dass H abelsch ist. Benutze jetzt die additive Schreibweise für H: Betrachte
Untergruppen von H, die zu direkten Produkten Z/(2) × · · · × Z/(2) isomorf sind und unter
diesen eine maximalmögliche U . Das soll heißen: Ist V eine Untergruppe mit V ⊃ U , die zu
einer Gruppe der Form Z/(2) × · · · × Z/(2) isomorf ist, so gilt schon V = U . Ist nun U = H,
so gilt die Behauptung. Ist aber U eine echte Unterguppe von H, so kann man mit Hilfe der
letzten Aufgabe eine Untergruppe V konstruieren, die U echt umfasst und isomorf zu einer
Gruppe der Form Z/(2) × · · · × Z/(2) ist. )
7. Sei H eine Untergruppe der multiplikativen Gruppe eines Körpers K. Sei G die Menge derjenigen Matrizen aus Gl2 (K), die entweder von der Form
a 0
0 c
oder von der Form
0 b
d 0
mit a, b, c, d ∈ H sind. Zeige
a) G ist eine Untergruppe der Gl2 (K).
b) Die Teilmenge N von G, die aus den Matrizen der Form
a 0
mit a, b ∈ H
0 b
besteht, ist ein Normalteiler vom Index 2 in G. Somit ist G/N die – bis auf Isomorfie eindeutig
bestimmte Gruppe der Ordnung 2.
b’) Die nichttriviale (d.h. von N verschiedene) Nebenklasse von G nach N besteht aus den
Matrizen der Form
0 c
d 0
mit c, d ∈ H.
c) In K gelte 1 6= −1, und es sei im Folgenden H = {1, −1}. Dann ist G eine nichtabelsche
Gruppe der Ordnung 8.
Bestimme die Elemente der Ordnung 2 (davon gibt es 5) sowie die der Ordnung 4 (davon gibt
es 2).
8. Bestimme die letzten 3 Ziffern von 19981998! .
Kapitel 10
Lineare Gleichungssysteme
Die Behandlung linearer Gleichungssysteme ist ein wichtiger Teil des Gebietes der Linearen
Algebra.
Hier möchte ich Dir eine systematische Methode, lineare Gleichungssysteme zu lösen vorstellen,
nämlich das sogenannte Gaußsche Verfahren. Ich habe die Erfahrung gemacht, dass es vielen
jungen Studierenden schwerfällt, eine allgemeine Beschreibung dieses Verfahrens zu verstehen.
Deshalb behandle ich zunächst Spezialfälle.
10.0.18 Wir wollen z.B. die rationalen Lösungen des folgenden Gleichungssystems finden.
3x +2y +4z = 6
2x −3y + 21 z = 4
5x +4y −3z = 20
Wir formen das Gleichungssystem um, indem wir
zweiten addieren:
3x +2y +4z
0x − 13
y − 13
z
3
6
5x +4y −3z
das (− 23 )-fache der ersten Gleichung zur
= 6
= 0
= 20
Es ist klar, dass jede Lösung des ersten Systems auch eine des zweiten ist. Umgekehrt, da man
aber das erste System aus dem zweiten zurückerhält, indem man das (+ 23 )-fache der ersten
Gleichung zur zweiten addiert, ist jede Lösung des zweiten Gleichungssytems auch eine des
ersten. Durch die obige Umformung hat man die Lösungsgesamtheit des Gleichungssystems
nicht verändert. D.h. ein Tripel von (etwa rationalen) Zahlen (ξ, η, ζ) für (x, y, z) eingesetzt
erfüllt genau dann das erste System, wenn es das zweite erfüllt.
Indem wir das (− 53 )-fache der ersten Gleichung zur dritten addieren, erhalten wir:
3x +2y +4z = 6
0x − 13
y − 13
z = 0
3
6
2
z = 10
0x + 3 y − 29
3
Wieder hat sich an der Menge der Lösungen nichts geändert!
255
256
Nun addieren wir das
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
2
-fache
13
der zweiten Gleichung zur dritten:
3x +2y +4z = 6
0x − 13
y − 13
z = 0
3
6
0x +0y −10z = 10
Dieses Gleichungssystem können wir von hinten aufrollen“ und die einzig mögliche Lösung
”
ausrechnen: x = 3, y = 12 , z = −1. Diese, und nur diese, erfüllt (natürlich) auch das erste
System. (Eine Lösung eines Gleichungssystems mit 3 Unbekannten ist immer ein Tripel von
Zahlen, hier das Tripel (3, 21 , −1). Bei n Unbekannten ist eine Lösung ein n-tupel (a1 , . . . , an ).)
Man kann aber auch das letzte Gleichungssystem noch weiter modifizieren, so dass die Lösung
schließlich ganz durchsichtig erkennbar ist. Zunächst multiplizieren wir die erste Gleichung mit
1
3
1
, die zweite mit − 13
und die dritte mit − 10
:
3
1x + 23 y + 43 z =
2
1
0x +1y + 2 z =
0
0x +0y +1z = −1
Da wir durch Multiplikation mit den inversen Faktoren wieder zum vorletzten System zurückkommen, hat sich wieder nichts an der Lösungsmenge geändert.
Nun addieren wir das − 21 -fache der letzten Gleichung zur zweiten, dann das − 34 -fache der letzten
Gleichung zur ersten:
1x + 23 y +0z = 10
3
1
0x +1y +0z =
2
0x +0y +1z = −1
Schließlich addieren wir das − 32 -fache der zweiten Gleichung zur ersten:
1x +0y +0z =
3
1
0x +1y +0z =
2
0x +0y +1z = −1
Hier kann man die (einzige) Lösung in der Tat direkt ablesen.
10.0.19 Ein weiteres Beispiel:
3x +2y +4z = 6
2x −3y + 12 z = 4
7x −4y +5z = 13
Addiere das − 23 -fache der ersten Gleichung zur zweiten und dann das − 37 -fache der ersten zur
dritten:
3x +2y +4z =
6
13
0x − 13
y
−
z
=
0
3
6
13
0x − 26
y
−
z = −1
3
3
257
Nun addiere das −2-fache der zweiten Gleichung zur dritten:
3x +2y +4z =
6
13
0x − 13
y
−
z
=
0
3
6
0x +0y +0z = −1
Da es kein z ∈ Q mit 0z = −1 gibt, hat dieses Gleichungssystem keine Lösung! Die Lösungsmenge ist ∅, die leere Menge.
Ein weiteres Beispiel:
3x +2y +4z = 6
2x −3y + 12 z = 5
7x −4y +5z = 16
Das Gleichungssystem unterscheidet sich von dem zuletzt behandelten nur durch die rechten
Seiten der zweiten und dritten Gleichung. Wir behandeln es so wie das vorangegangene System.
3x +2y +4z = 6
0x − 13
y − 13
z = 1
3
6
26
13
0x − 3 y − 3 z = 2
Weiter:
3x +2y +4z = 6
0x − 13
y − 13
z = 1
3
6
0x +0y +0z = 0
Dieses System hat offenbar ∞-viele Lösungen. Man kann für z ein beliebiges ζ (oder für y ein
beliebiges η) einsetzen und dann die zugehörigen ξ, η (bzw. ξ, ζ) ausrechnen.
Wir wollen alle möglichen Lösungen noch expliziter angeben. Dafür formen wir noch weiter um,
zunächst durch Multiplikation der ersten beiden Gleichungen durch geeignete Faktoren 6= 0:
1x + 32 y + 43 z =
2
1
3
0x +1y + 2 z = − 13
0x +0y +0z =
0
Dann addieren wir das − 23 -fache der zweiten Gleichung zur ersten:
28
1x +0y +1z =
13
1
3
0x +1y + 2 z = − 13
0x +0y +0z =
0
Man bekommt die folgende Parameterdarstellung aller möglichen Lösungen (ξ, η, ζ) des o.a.
Gleichungssystems:
ξ=
28
13
3
− t, η = − 13
− 12 t, ζ = t.
Der Parameter t darf dabei alle rationalen (oder reellen oder auch komplexen) Zahlen durchlaufen (je nachdem welche Zahlen wir zulassen wollen).
Hierfür wollen wir auch schreiben:
258
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
3
, − 13
, 0) + t(−1, − 12 , 1).
(ξ, η, ζ) = ( 28
13
Dabei gelte wie gewohnt:
t(a, b, c) := (ta, tb, tc) und (a, b, c) + (a0 , b0 , c0 ) := (a + a0 , b + b0 , c + c0 ).
10.0.20 Wir wollen das letzte Beispiel noch etwas genauer analysieren.
3
, − 13
, 0) + t(−1, − 12 , 1), wo t die Menge Q durchläuft, ist
Von allen Lösungen (ξ, η, ζ) = ( 28
13
28
3
( 13 , − 13 , 0) eine spezielle – wie man etwa sieht, indem man t = 0 setzt.
Die Tripel t(−1, − 12 , 1) hingegen sind Lösungen des folgenden Gleichungssystems:
3x +2y +4z = 0
2x −3y + 12 z = 0
7x −4y +5z = 0
welches aus dem letztbehandelten dadurch entsteht, dass man die rechten Seiten aller Gleichungen durch Nullen ersetzt. Denn, wenn man mit dem neuen Gleichungssystem dieselben
Manipulationen vornimmt wie mit dem alten, so bleiben auf den rechten Seiten immer die
Nullen stehen und auf den linken Seiten erhält man dasselbe wie oben.
1x +0y +1z = 0
0x +1y + 12 z = 0
0x +0y +0z = 0
Und dieses Gleichungssystem hat eben offensichtlich die Lösungen t(−1, − 21 , 1), wo t alle (rationale) Zahlen durchläuft.
Satz 10.0.21 Sei
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= b1
= b2
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = bm
ein (ganz allgemeines) lineares Gleichungssystem und (ξ1 , . . . , ξn ) eine seiner Lösungen, so ist
die Gesamtheit der Lösungen gleich (ξ1 , . . . , ξn ) + X, wo X die Menge aller Lösungen des
folgenden zugehörigen homogenen“ Gleichungssystems ist:
”
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= 0
= 0
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = 0
259
Dabei sei definiert:
(ξ1 , . . . , ξn ) + X := {(ξ1 , . . . , ξn ) + (η1 , . . . , ηn ) | (η1 , . . . , ηn ) ∈ X}.
Beweis:
Eigentlich ist die Behauptung trivial:
Sei etwa (η1 , . . . , ηn ) eine Lösung des homogenen Gleichungssystems, so gilt offenbar:
ai1 (ξ1 + η1 ) + ai2 (ξ2 + η2 ) + · · · + ain (ξn + ηn ) =
ai1 ξ1 + ai2 ξ2 + · · · + ain ξn + ai1 η1 + ai2 η2 + · · · + ain ηn = bi + 0 = bi
Und das für alle i = 1, . . . , n. Das bedeutet, dass jedes n-tupel aus (ξ1 , . . . , ξn ) + X eine Lösung
unseres Gleichungssystems ist.
Sei umgekehrt (ζ1 , . . . , ζn ) eine solche Lösung und (η1 , . . . , ηn ) := (ζ1 , . . . , ζn ) − (ξ1 , . . . , ξn ).
Dann gilt
ai1 η1 + ai2 η2 + · · · + ain ηn =
ai1 (ζ1 − ξ1 ) + ai2 (ζ2 − ξ2 ) + · · · + ain (ζn − ξn )
= ai1 ζ1 + ai2 ζ2 + · · · + ain ζn − (ai1 ξ1 + ai2 ξ2 + · · · + ain ξn ) = bi − bi = 0
Das heißt: (η1 , . . . , ηn ) ist eine Lösung des zug. homogenen Gleichungssystems, gehört also zu
X. Für die Lösung (ζ1 , . . . , ζn ) des ursprünglichen Systems gilt also (ζ1 , . . . , ζn ) = (ξ1 , . . . , ξn ) +
(η1 , . . . , ηn ) ∈ (ξ1 , . . . , ξn ) + X.
10.0.22 Wenn ein lineares Gleichungssystem überhaupt Lösungen hat und man eine solche
kennt, so erhält man mit Hilfe der Lösungsmenge des zugehörigen homogenen Gleichungssystems alle Lösungen.
Ein homogenes lineares Gleichungssystem besitzt immer (mindestens) eine Lösung, nämlich
(0, 0, . . . , 0), die sogenannte triviale Lösung.
Hat ein lineares Gleichungssystem eine Lösung und hat das zugehörige homogene Gleichungssystem nur die triviale Lösung, so ist das ursprüngliche Gleichungssystem eindeutig lösbar.
Die Lösungsmenge X eines homogenen linearen Gleichungssystems ist gegenüber gewissen Verknüpfungen (Operationen) abgeschlossen:
ξ, η ∈ X =⇒ ξ + η ∈ X. Ist zusätzlich a eine (rationale) Zahl und ξ ∈ X, so gilt aξ ∈ X. (Man
kann dies zusammenfassen zu a, b ∈ Q, ξ, η ∈ X =⇒ aξ + bη ∈ X.)
Das bedeutet, dass die Menge der (rationalen) Lösungen eines homogenen linearen Gleichungssystems in n Variablen ein Teilvektorraum des Qn ist. Rechnet man allgemein in einem Körper
K, so ist Qn durch K n zu ersetzen.
Bemerkungen 10.0.23 a) Es kann natürlich vorkommen dass der Koeffizient der ersten“
”
Unbekannten der ersten Gleichung gleich 0 ist. Dann ist es zweckmäßig, diese Gleichung mit
einer zu vertauschen, in der das nicht der Fall ist. Durch die Vertauschung von Gleichungen
ändert sich gewiss nicht die Lösungsmenge des Systems.
b) Natürlich ist es auch nicht verboten, dass in jeder Gleichung der Koeffizient der ersten
Unbekannten gleich 0 ist. Was bedeutet das für die Lösungsmenge?
260
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
10.0.24 Wir wollen ein Hilfsmittel einführen, welches zunächst lediglich als abgekürzte Schreibweise von linearen Gleichungssysemen dient, aber später von größter Bedeutung sein wird:
Eine Matrix ist ein rechteckiges“ Schema von Zahlen:
”


a11 · · · a1n
 ..
.. 
...
 .
. 
am1 · · · amn
Man kann sie als m-Tupel von n-Tupeln auffassen. Die aij heißen die Einträge der Matrix.
Die waagerechten“ n-Tupel (ai1 , . . . , ain ) heißen die Zeilen, die senkrechten“ m-Tupel
”
”


a1j
 .. 
 . 
amj
die Spalten der Matrix.
Es ist eine Konvention, dass der erste Index die Zeile, der zweite die Spalte bezeichnet. (Zeile
zuerst, Spalte später.)
Die (eingeschränkte) Koeffizientenmatrix des LGS
a11 x1
a21 x1
···
+a12 x2
+a22 x2
···
+ · · · +a1n xn
+ · · · +a2n xn
···
...
···
= b1
= b2
..
···
···
.
···
···
···
am1 x1 +am2 x2 + · · · +amn xn = bm
ist

a11 · · · a1n
 ..
.. 
...
 .
. 
am1 · · · amn

Die erweiterte Koeffizientenmatrix desselben LGS ist

a11 · · · a1n
 ..
..
...
 .
.
am1 · · · amn

b1
.. 
. 
bm
Definition 10.0.25 Die folgenden Manipulationen mit einer Matrix heißen elementare
Zeilen-Umformungen:
(I) Eine Zeile wird geändert, indem man ein Vielfaches einer anderen zu ihr addiert.
(II) Zeilen werden vertauscht.
(III) Eine Zeile wird mit einer von 0 verschiedenen Zahl multipliziert.
Zeilen-Umformungen vom Typ (I) heißen auch spezielle elementare Zeilenumformungen.
261
10.0.26 Sei nun

a11 · · · a1n b1
 ..
..
.. 
..
 .
.
.
. 
am1 · · · amn bm

die erweiterte Koeffizientenmatrix eines LGS.
Wir haben oben – allerdings nur exemplarisch – gesehen, dass folgendes gilt: Durch eine Folge
elementarer Zeilenumformungen vom Typ (I) und Typ (II) kann man sie auf die folgende Gestalt
bringen:

0 · · · 0 a01j1 · · ·
···
0 · · · 0 0 · · · 0 a02j2 · · ·
0 ···
0 ···
..
.







 0 ···

 0 ···

 0 ···
.. . .
.
.
a03j3
0
..
···
a01n
a02n
a03n
..
.
···
.
0
b01
b02
b03
..
.
a0rjr · · · a0rn b0r
0 b0r+1
0
0
..
..
.
.













Hier ist 1 ≤ j1 < j2 < j3 < · · · < jr und a0kjk 6= 0 für k = 1, . . . , r.
Ist j1 = 1, so besteht die erste Spalte nicht aus
Form

a011
 0

 ..
 .
lauter Nullen. Vielmehr ist sie dann von der





0
mit a011 6= 0. Im Allgemeinen bestehen die ersten j1 − 1 Spalten aus lauter Nullen. Die nächsten
j2 − j1 Spalten haben die Eigenschaft, dass alle Komponenten, bis auf möglicherweise die erste,
gleich 0 sind. Auf jeden Fall ist a1j1 6= 0. Sowohl br+1 = 0 wie br+1 6= 0 ist möglich.
Die letzte Matrix heißt die Zeilenstufenform der Ausgangsmatrix. Die Plätze“ mit den
”
Indices 1j1 , 2j2 , . . . , rjr heißen die Stufen der Matrix in Zeilenstufenform, die Zahlen j1 , . . . , jr
die Stufenindices. Die Einträge a0kjk heißen die Stufeneinträge.
10.0.27 Wir haben oben exemplarisch überlegt, dass das LGS, das zur umgeformten Matrix
gehört, dieselben Lösungen hat wie das ursprüngliche.
An der Matrix in Zeilenstufenform können wir jetzt sofort erkennen, ob das zug. LGS eine
Lösung hat oder nicht. Offensichtlich gibt es keine Lösung, wenn b0r+1 6= 0 ist. Denn dann hat
schon die (r + 1)-te Gleichung 0x1 + · · · + 0xn = b0r+1 keine Lösung.
Ist hingegen b0r+1 = 0, so kann man für alle j ∈ {1, . . . , n} − {j1 , j2 , . . . , jr } die Unbekannten xj
gleich 0 setzen und dann das LGS von unten her aufrollen“. D.h. eine Lösung sieht so aus
”
(0, . . . , 0, ξj1 , 0, . . . , 0, ξj2 , . . . , ξjr , 0, . . . , 0),
262
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
wobei ξjr = b0r /a0rjr , ξjr−1 = (b0r−1 − a0r−1,jr ξjr )/a0r−1,jr−1 etc. ist.
Um die Lösungsmenge (im Falle br+1 = 0) teoretisch besser zu durchschauen, unternehmen wir
noch Folgendes:
1. Wir machen die Stufeneinträge zu 1, indem wir für jedes k = 1, . . . , r die k-te Zeile mit 1/a0kjk
multiplizieren. (Es ist ja a0kjk 6= 0.)
2. Dann machen wir durch spezielle Zeilenumformungen (also solche vom Typ I) alles oberhalb
der Stufen zu 0. In der jk -ten Spalte steht als danach an der k-ten Stelle eine 1, sonst überall
Nullen.
3. Schließlich machen wir etwas für die Praxis Gefährliches. Wir vertauschen die Unbekannten,
d.h. die Spalten der bisher erreichten Matrix. (Die letzte Spalte, in der die rechten Seiten der
Gleichungen stehen, muss natürlich an ihrem Platz bleiben. Wenn man am Ende die Lösungsmenge korrekt angeben will, muss man die Vertauschung der Unbekannten natürlich berücksichtigen!) Wir bringen die Spalten mit den Stufen nach vorn, d.h. wir machen die jk -te Spalte
zur k-ten.
Wenn wir die uninteressanten n − k letzten Zeilen, die ja aus lauter Nullen bestehen, weglassen,
kommen wir schließlich zu einer Matrix von folgender Gestalt:


1 0 0 · · · 0 a1,r+1 · · · a1n b1
 0 1 0 · · · 0 a2,r+1 · · · a2n b2 




..
...
...


.
0
1 ar,r+1 · · · arn br
Eine spezielle Lösung des LGS ist dann (b1 , . . . , bn , 0, . . . , 0)
Um nun alle Lösungen zu finden, lösen wir das zug. homogene LGS, d.h. ersetzen die bi durch
Nullen.
Wir können die letzten n − r Unbekannten durch beliebige Zahlen ersetzen. Die ersten r sind
dann eindeutig bestimmt. Die Lösungen des homogenen LGS sehen dann so aus:
(−
n
X
n
X
tk a1k , . . . , −
k=r+1
tk ark , tr+1 , . . . , tn ),
k=r+1
wo die tr+1 , . . . , tn unabhängig voneinander alle (rationalen) Zahlen durchlaufen. Man kann
diese n-Tupel auch so schreiben:
tr+1 (−a1,r+1 , . . . , −ar,r+1 , 1, 0, . . . , 0) + · · · + tn (−a1,n , . . . , −ar,n , 0, . . . , 0, 1)
AUFGABEN
1. Geben Sie die Lösungsmenge des folgenden LGS an:
x1 + 3x2
3x1 + 9x2
2x2
2x1 + 8x2
+ 5x3
+ 10x3
+ 7x3
+ 12x3
+ 2x4
+ x4 + 2x5
+ 3x4 − x5
+ 2x4 + x5
=
=
=
=
1
0
3
1
263
2. Bestimmen Sie die Lösungsmenge des Gleichungssystems
x1
−x1
2x1
x1
+
−
+
+
2x2
2x2
4x2
2x2
+ x3
− 2x3
+ 3x3
+ 2x3
+ x4 + x5
+ 2x4 + x5
− x4
− 2x4 − x5
=
=
=
=
b1
b2
b3
b4
in den Fällen a) (b1 , b2 , b3 , b4 ) = (0, 0, 0, 0), b) (b1 , b2 , b3 , b4 ) = (2, 5, −1, −3),
c) (b1 , b2 , b3 , b4 ) = (2, 5, −1, 8).
(Versuchen Sie, möglichst lange die drei Fälle a), b), c) gemeinsam zu behandeln!)
3. Für welche c ∈ Q ist das LGS
a) eindeutig lösbar,
x − cy = 1
(c − 1)x − 2y = 1
b) lösbar, aber nicht eindeutig lösbar,
4. Zeigen Sie, dass das LGS
x1 + 2x2 + 3x3 = 0
4x1 + 5x2 + 6x3 = 0
7x1 + 8x2 + 9x3 = 0
nicht nur die triviale Lösung besitzt.
c) unlösbar?
264
KAPITEL 10. LINEARE GLEICHUNGSSYSTEME
Anhang A
Lösungen
1.2.A1. a) Teile n durch 3 mit Rest: n = 3k + r mit r = 0, 1 oder 2. Ist r = 0, so ist n durch 3
teilbar. Andernfalls ist n = 3k + 1 oder n = 3(k + 1) − 1. Setze m := k im ersten und m = k + 1
im zweiten Fall.
b) Ist p = 3, so ist 2 · 32 + 1 = 19 eine Primzahl. Ist p 6= 3, so ist p auch nicht durch 3 teilbar.
Deshalb lässt sich p wegen a) in der Form p = 3m ± 1 schreiben. Dann ist p2 = 9m2 ± 6m + 1,
also 2p2 + 1 = 18m2 ± 12m + 3, also durch 3 teilbar. p = 3 ist somit die einzige Primzahl, für
die auch 2p2 + 1 eine Primzahl ist.
Der Fall p2 + 2 erledigt sich genau so.
1.2.A2. Es ist 15! = 2·3·(2·2)·5·(2·3)·7·(2·2·2)·(3·3)·(2·5)·11·(2·2·3)·13·(2·7)·(3·5) (Wenn
Du willst kannst Du anschließend noch die gleichen Faktoren zu Potenzen zusammenfassen.)
Du siehst, es ist ziemlich einfach. Wenn Du es Dir schwer machen willst, rechne zuerst 15! aus
und versuche dann, das Ergebnis zu zerlegen. ;-)
1.2.A4. Sei m ∈ N1 keine Primzahl und p der kleinste Primfaktor von m. Dann lässt sich
m in der Form m = kp mit k ≥ p schreiben. Wäre nämlich k < p, so hätte k und damit m
eine kleineren Primfaktor als p, im Widerspruch zur Wahl von p. Wenn aber p ≤ k ist, ist
p2 ≤ pk = m. Nun sind 2, 3, 5, 7 die einzigen Primzahlen p mit p < 11, d.h. p2 < 121. Ist also
m ≤ 120 nicht prim, so hat es einen Primfaktor unter den Primzahlen 2, 3, 5, 7 Ist m ≥ 8 und
hat unter diesen Zahlen einen Primfaktor, so kann es nicht selbst prim sein.
Allgemein gilt: Sind p1 , . . . , pn+1 die ersten n+1 Primzahlen, so ist eine Zahl k mit pn < k < p2n+1
genau dann prim, wenn k durch keine der Primzahlen p1 , . . . , pn teilbar ist.
1.2.A5. Zur Regel a): Nimm an, dass nur 3 Kandidaten A, B und C Stimmen bekommen.
Wenn 33 Senatoren A und B, 34 Senatoren A und C und schließlich 34 Senatoren B und C
wählen, bekommt jeder der drei Kandidaten mindestens 67 Stimmen!
Zur Regel b): Angenommen die Kandidaten A, B, C und D bekommen Stimmen. Wenn 26
Senatoren A und B , 25 weitere A und C , 25 weitere A und D, schließlich 25 Senatoren C und
D wählen, so bekommen A 76, B 26, C 50 und D 50 Stimmen! (Wenn nur drei Kandidaten
Stimmen bekommen, so entfallen auf einen maximal 101 der insgesamt 202 Stimmen, also auf
mindestens einen weiteren mindestens 51 Stimmen.)
265
266
ANHANG A. LÖSUNGEN
Man muss immer eine gewisse Vorsicht walten lassen, wenn man Abstimmungsregeln aufstellt!
Ich kenne mindestens einen mathematischen Fachbereich, der diesen Ratschlag bei der
Aufstellung seiner Satzung nicht beachtet hat.
0
1.4.2. Zur Gleichheit von Brüchen: Seien m0 = km, n0 = kn. Dann geht der Bruch m
aus dem
n0
m
m
m0
Bruch n durch Erweitern, und der Bruch n aus dem Bruch n0 durch Kürzen hervor. In diesem
0
Falle gilt mn0 = kmn = m0 n. D.h. wenn m
aus m
durch Erweitern und anschließendes Kürzen
n0
n
0
0
hervorgeht, muss mn = m n sein.
0
Sei umgekehrt mn0 = m0 n. Dann wird m
durch Erweitern zu mn
. Der Zähler letzteren Bruches
n
nn0
0
m0 n
.
ist nach Voraussetzung gleich dem von nn0 . Und diesem Bruch wird durch Kürzen m
n0
1.5.5.
1
1
n+1−n
1
−
=
=
.
n n+1
n(n + 1)
n(n + 1)
1
1
1
1 1
1 1
1
1
1
+
+ ··· +
=
−
+
−
+ ··· + (
− =1−
1·2 2·3
(n − 1)n
1 2
2 3
n−1 n
n
1
1
1
1
1
1
1
+
+
+
·
·
·
+
≤
1
+
+
·
·
·
+
=
1
+
1
−
.
12 22 32
n2
1·2
(n − 1)n
n
1
1
1
1
1
1
1
1
+ + + + ··· +
≤2+
+ ··· +
=3−
0! 1! 2! 3!
n!
1·2
(n − 1)n
n
1.5.A1. Die erste Gleichung hat die Lösung x = − 12
, die zweite ist nicht lösbar.
13
1.5.A3. Man kann a mit dem Nenner p1 · · · pn schreiben. Könnte
man kürzen, etwa
durch pn , so
1
1
wäre ap1 · · · pn−1 bereits ganz. Andererseits ist ap1 · · · pn−1 =
+ ··· +
p1 · · · pn−1 +
p1
pn−1
p1 · · · pn−1
; das ist eine Summe zweier Summanden, von denen der erste eine ganze Zahl, der
pn
zweite aber wegen der Eindeutigkeit der Primfaktorzerlegung keine ganze Zahl ist. Eine solche
Summe ist nie ganz.
1.5.A4. Diese Aufgabe löst man ähnlich wie die vorangehende. Wäre a ganz, dann auch am/2.
· k1 ist für k = 2, . . . , n genau dann eine ganze Zahl, wenn k nicht die größte
Der Ausdruck am
2
2-Potenz ≤ n ist.
1.5.A5. (n − 1)!a ist nicht ganz.
1.5.A6. Die Summe ist gleich (x + y)(x − y + 1)/2.
1.5.A7. Das Ergebnis ist n2 . Das kannst Du anschaulich an der Figur unterhalb der Aufgabe
sehen, wo bei jedem Schritt durch Addition der nächsten ungeraden Anzahl von Kringeln
wieder ein Quadrat entsteht. Die Lösung nach ‘Opas’ Schema geht wie folgt. Die Anzahl der
Summanden ist n. Die Summe des ersten und n-ten Summande ist 2n. Dasselbe gilt für die
Summe des zweiten und des (n − 1)-ten, auch für die des dritten und des (n − 2)-ten, usw.
Deshalb ist das Ergebnis gleich n · 2n/2.
267
1.5.A8. Die Summe der beiden Gleichungen ist 2x = a + b, ihre Differenz ist 2y = a − b. Nun
ist a + b genau dann gerade, wenn a und b entweder beide gerade oder beide ungerade sind.
Dasselbe gilt für a − b.
1.5.A9. Sind x, y ganze Zahlen, so ist von den beiden Zahlen x + y und x − y + 1 die eine
gerade und die andere ungerade. Und wenn zusätzlich x > y > 0 ist, sind x + y und x − y + 1
beide mindestens gleich 2. Ist also n > 0 eine Summe aufeinander folgender positiver ganzer
Zahlen, so muss 2n ein Produkt einer geraden und einer ungeraden Zahl ≥ 2 sein. Das schließt
alle 2-Potenzen aus.
Sei n > 0 keine 2-Potenz (insbesondere n > 2) so ist 2n = 2r u mit einer ungeraden Zahl u > 2
und r ≥ 1. Seien ferner a die größere der beiden Zahlen 2r und u, sowie b + 1 die kleinere von
diesen. Dann sind a und b beide gerade oder beide ungerade, und es ist b > 0. Also lässt sich
das folgende Gleichungssystem in ganzen Zahlen x, y mit x > y > 0 lösen.
x+y =a
x−y =b
Ist das Zahlenpaar (x, y) eine Lösung dieses Gleichungssystems, so gilt n =
Px
k=y
k.
1.5.A10. a) Es gilt bekanntlich x2 − y 2 = (x + y)(x − y). Man kann also eine ganze Zahle n
genau dann als Differenz zweier Quadratzahlen darstellen, wenn ein Produkt zweier gerader
oder zweier ungerader Zahlen ist. Dabei darf im zweiten Fall einer der Faktoren die 1 sein.
Es folgt, dass jede ungerade Zahl eine Differenz zweier Quadratzahlen ist. Eine gerade Zahl,
die nicht durch 4 teilbar ist, ist von der Form 2u mit ungeradem u. Wie immer man sie in
zwei Faktoren zerlegen mag, so ist einer gerade und der andere ungerade. Jede durch 4 teilbare
Zahl ist von der Form 4m = 2 · (2m) also ein Produkt zweier gerader Zahlen und deshalb
eine Differenz zweier Quadratzahlen. Zusammengefasst, sind genau die Ganzen Zahlen eine
Differenz zweier Quadrate, die entweder ungerade oder durch 4 teilbar sind. (Später wirst Du
diese Bedingung durch n 6≡ 2 (mod 4) ausdrücken können.)
b) Alle ganzen Zahlen lassen sich so schreiben. Ist n ungerade, so gibt es y, z mit n = 02 +y 2 −z 2 .
Ist n gerade, so ist n − 1 ungerade, also n = 12 + y 2 − z 2 mit geeigneten y, z. Die Lösung ist
überraschend einfach.
c) Ist a = 0, so gibt es trivialer Weise unendlich viele Lösungen, ansonsten nur endlich viele.
Dafür habe ich sogar 2 Argumente: Erstens kann man a innerhalb Z nur auf endlich viele
Weisen in zwei Faktoren zerlegen. Zweitens: Für x > y > 0 (was man immer annehmen kann)
und x > n gilt x2 − y 2 ≥ (n + 1)2 − n2 = 2n + 1. Und es gibt nur endlich viele n mit 2n + 1 ≤ |a|.
d) Nikolausaufgabe: Setze n0 := 1606160. Sei x das Alter von Klaus, y dasjenige von Nicole,
jeweils als ganze Zahl > 0. Nach Voraussetzung ist n0 = x4 − y 4 = (x2 − y 2 )(x2 + y 2 ). Da n0
gerade ist, müssen x2 + y 2 und x2 − y 2 beide gerade sein. (Das folgt daraus, dass zunächst einer
der beiden Faktoren gerade ist.) Dann muss aber auch x2 − y 2 = (x + y)(x − y) durch 4 teilbar
sein, nicht wahr? Ferner ist 0 < y < x.
Wir haben die (mit Taschenrechnerhilfe berechnete) Primfaktorzerlegung
n0 = 24 · 5 · 17 · 1181
268
ANHANG A. LÖSUNGEN
Wir betrachten alle Möglichkeiten x2 − y 2 = k, x2 + y 2 = l, wo n0 = kl eine Zerlegung in zwei
ganze Faktoren, ferner 0 < k < l und k durch 4 und l durch 2 teilbar ist.
1. Der Faktor k ist größtmöglich im Falle k = 8 · 5 · 17 = 2 · 340, l = 2 · 1181. Dann errechnet
man
k+l
k−l
x2 =
= 1181 + 340 = 1521, y 2 =
= 1181 − 340 = 841
2
2
Nun ist 1521 = 1600 − 80 + 1 = (40 − 1)2 und 841 = 900 − 60 + 1 = (30 − 1)2 . Also gilt in
diesem Falle: Klaus ist 39 und Nicole 29 Jahre alt. Wir zeigen, dass es keine weiteren Lösungen
gibt.
2. Im Falle k = 4 · 5 · 17 = 2 · 170 und l = 4 · 1181 = 2 · 2362 müsste x2 = 2362 + 170 = 2532
sein. Da 502 = 2500 < 2532 < 2601 = 512 gilt, ist aber x2 6= 2532 für jede natürliche Zahl x.
3. In allen anderen Fällen ist k ≤ 23 · 17 und l ≥ 2 · 5 · 1181. Dann ist x + y ≤ k/2 ≤ 4 · 17 = 68
also x2 + y 2 ≤ (x + y)2 ≤ 682 = 4624 < 11810. Auch hier ergibt sich keine Lösung.
1.5.A11. Wenn man den linken Bruch mit n − k, den rechten mit k + 1 erweitert, bekommt
man gleiche Nenner.
1.5.A12. Um die geforderte Vollständigkeit zu erreichen, genügt es, eine gewisse Systematik
in die Menge aller Tripel (a, b, c) ∈ N3 mit 1 ≤ a ≤ b ≤ c zu bringen.
Zunächst betrachte man Tripel der Form (1, 1, c) (mit 1 ≤ c). Dann die der Form (1, 2, c) (mit
2 ≤ c). Dann die der Form (1, b, c) mit 3 ≤ b ≤ c.
Damit hat man offenbar alle Fälle mit a = 1 behandelt. Jetzt folgen die Fälle (2, 2, c), (2, 3, c)
und (2, 4, c), ferner (2, b, c) mit 5 ≤ b ≤ c).
Jetzt folgen (3, 3, c) und (3, b, c) mit 4 ≤ b.
Schließlich (a, b, c) mit 4 ≤ a).
Die möglichen Lösungen sind: (1, 1, 1) , (1, 2, 2) , (2, 3, 6) , (2, 4, 4) , (3, 3, 3).
1.5.A13. Nimm an, m/q mit zueinander teilerfremden m, q ∈ Z sei eine Lösung. Dann gilt
mn−1
mn−2
m
mn
=
−a
−
a
− · · · − an − 1 − an
1
2
n
n−1
n−2
q
q
q
q
mn
q
ganz ist. Wäre nun m/q nicht ganz, d.h. q 6= ±1, so hätte es einen Primfaktor p, der auch
mn teilen würde. Wegen der Eindeutigkeit der Primfaktorzerlegung müsste p auch m teilen, im
Widerspruch zur Teilerfremdheit von m und q.
Da m, q und alle ai ganz sind, sieht man nach Multiplikation der Gleichung mit q n−1 , dass
1.5.A13 Die Antwort ist (m1 + 1)(m2 + 1) · · · (mr + 1).
1.6.A1. Man kann die Induktionsbeweise mit n = 0 beginnen. Dann stehen auf den rechten
Seiten leere Summen. Eine solche hat nach Definition den Wert 0. Das mag Dir sehr formal
vorkommen.
269
Wenn Du Hemmungen hast, damit zu argumentieren, schreibe die linken Seiten der ersten
Gleichung wie folgt:
02 + 12 + 22 + · · · + n2 ,
entsprechend die der zweiten Gleichung. Oder beginne gemäß Absatz 1.6.3 die Induktion mit
n = 1.
In allen Fällen ist der Induktionsanfang für die behaupteten Gleichheiten trivial.
Induktionsschritt für a): Zu zeigen ist 12 + 22 + · · · + n2 + (n + 1)2 = (n+1)(n+2)(2n+3)
unter der
6
n(n+1)(2n+1)
2
2
2
Voraussetzung 1 + 2 + · · · + n =
. Unter dieser Voaussetzung gilt aber
6
12 + 22 + · · · + n2 + (n + 1)2 =
=
n(n + 1)(2n + 1)
n(n + 1)(2n + 1) + 6(n + 1)2
+ (n + 1)2 =
6
6
(n(2n + 1) + 6(n + 1))(n + 1)
(n + 1)(2n2 + n + 6n + 6)
=
=
6
6
(n + 1)(n + 2)(2n + 3)
(n + 1)(2n2 + 3n + 4n + 6)
=
6
6
1.6.A2. Dies gilt zunächst für n = 1
Induktionsschritt: Sei (a1 , . . . , an ) irgend eine Anordnung der Zahlen 1, . . . , n. Dann kann man
die Zahl n + 1 auf n + 1 verschiedene Weise einordnen:
(n + 1, a1 , . . . , an ), (a1 , n + 1, a2 , . . . , an ), . . . , (a1 , . . . , an−1 , n + 1, an ), (a1 , . . . , an , n + 1)
Man erhält also (n + 1)-mal soviele Anordnungen der Zahlen 1, . . . , n, n + 1, wie es Anordungen
der Zahlen 1, . . . , n gibt. Ist die letztere Anzahl nach Induktionsvoraussetzung gleich n!, so ist
erstere gleich n!(n + 1) = (n + 1)!.
1.6.A4. Wenn Du bislang nicht auf die Lösung gekommen bist, versuche es mit dem Tipp:
53 = 125 = 11 · 11 + 4.
Induktionsanfang n = 0. Es ist 2 · 51 + 40 = 11, also durch 11 teilbar.
Induktionsschritt: Zu zeigen ist, dass 2·53n+4 +4n+1 durch 11 teilbar ist – vorausgesetzt, dies gilt
für 2·53n+1 +4n . Nun es ist 2·53n+4 +4n+1 = 125·2·53n+1 +4·4n = 121·2·53n+1 +4(2·53n+1 +4n ).
Der erste Summand in diesem Ausdruck ist durch 11 teilbar, weil 121 es ist. Für den zweiten
Summand gilt dies, weil der Klammerausdruck nach Induktionsvoraussetzung durch 11 teilbar
ist.
1.6.A5. Wir machen den Induktionsanfang bei k = 1: Sei u = 2m + 1. Dann ist u2 − 1 =
4m2 + 4m + 1 − 1 = 4m(m + 1), also durch 23 teilbar, da eine der Zahlen m, m + 1 gerade ist.
Induktionsschluss: Sei die Aussage richtig für ein k ≥ 1. Wir haben zu zeigen, dass sie dann
auch für k + 1 gilt. Nun es gilt
u2
k+1
k 2
k
k
− 1 = u2
− 1 = (u2 + 1)(u2 − 1) .
270
ANHANG A. LÖSUNGEN
Da u ungerade ist, ist der erste Faktor gerade. Der zweite ist nach Induktionsvoraussetzung
durch 2k+2 teilbar, und somit das Produkt durch 2k+3 teilbar.
1.7.A1. Es gilt ggT(70, 125) = 5. Deshalb ist 5 die kleinste positive Zahl, die sich in der Form
70m + 125n mit ganzen m, n darstellen lässt. Alle anderen sind Vielfache von 5.
1.7.A3. Die Gleichung ist äquivalent mit xa = −yb. Da a und b zueinander teilerfremd sind,
haben sie Primfaktorzerlegungen ohne gemeinsamen Faktor. Deshalb muss x durch b und y
durch a teilbar sein. Die möglichen Lösungen sind somit von der Form (x, y) = (kb, k 0 a). Damit
die Gleichung erfüllt ist, muss noch k 0 = −k sein. Die Gesamtheit der Lösungen besteht also
aus den Zahlenpaaren (kb, −ka), wo k alle ganzen Zahlen durchläuft.
1.7.A5. a) Sei a0 ∈ N minimal gewählt, so dass c = aa0 + bb0 mit einem b0 ∈ Z ist. Dann gilt
a0 ≤ b − 1. Aus b0 < 0 würde aa0 + bb0 < (a − 1)(b − 1) folgen.
b) Es ist d = a(b − 1) + b(−1). Jede Änderung, die den Faktor von b zu einer nichtnegativen
Zahl macht, erhöht ihn um ein positives Vielfaches von a, muss also den Faktor von a um ein
positives Vielfaches von b vermindern, also negativ machen.
1.7.A11 b) Die angegebene Gleichung ist äquivalent zu 1 = mb + na. Dies siehst Du sofort,
wenn Du weißt, wie man Brüche addiert!
2.3.A3. Zeige zunächst, dass die Summe je zweier verschiedener Matrizen der Form Ak gleich
der dritten Matrix dieser Form ist. Dass sind 3 nahezu triviale Rechnungen. Ferner gilt natürlich
Ak + Ak = 0 und Ak + 0 = Ak . Also ist K gegenüber der Addition und auch gegenüber der
Bildung additiv Inverser abgeschlossen.
In Bezug auf die Multiplikation beachte, dass K ∗ , die Menge der von 0 verschiedenen Matrizen
∈ K aus den Potenzen von A besteht. Es ist nur A4 = A usw. Es gilt Ak · Am = Ak+m , ferner
Ak · 0 = 0. Also ist K gegenüber Multiplikation und bis auf die 0 auch der Bildung multiplikativ
Inverser abgeschlossen.
Mit 0 und E gehören die neutralen Elemente auch zu K. Also ist K ein Schiefkörper. Die
Multiplikation ist kommutativ, da Ak · Am = Ak+m = Am+k = Am · Ak gilt. Alles in allem ist
somit K ein Körper.
Beachte, dass die grundlegenden Ringgesetze (Assoziativität der Addition und Multiplikation,
die Kommutativität der Addition, die Distributivgesetze) deshalb gelten, da sie bereits in dem
Ring M2 (F2 ) erfüllt sind.
2.3.A4. a) Jede der Zahlen 1, . . . , n kommt wegen (i) genau n-mal, also ungerade oft in der
Matrix vor. Wegen (ii) kommt sie außerhalb der Diagonalen gerade oft vor, muss also auch
mindestens einmal in der Diagonalen vorkommen. Da in der Diagonalen insgesamt n Zahlen
und dabei jede der n Zahlen 1, . . . , n mindestens einmal steht, kann auch keine von ihnen mehr
als einmal dort auftauchen.
b) Analog zu a) sieht man, dass jede der Zahlen 1, . . . , n in der ganzen Matrix gerade oft und
auch außerhalb der Diagonale gerade oft auftaucht. Also muss sie auch in der Diagonale gerade
oft auftauchen. Das geht aber nur wenn einige der Zahlen gar nicht, andere mindestens 2-mal
dort vorkommen.
271
2.4.A2. a) Die Quadrate der Restklassen 0, 4 sind gleich 0, die der Restklassen 2, 6 sind gleich
4 und die der Restklassen 1, 3, 5, 7 sind gleich 1 Insgesamt sind 0, 1, 4 alle Quadrate in Z/(8).
Beachte, dass das Element 1 in Z/(8) vier verschiedene ’Quadratwurzeln’ hat. Es gibt also 4
Nullstellen des Polynoms x2 − 1 in diesem Ring. Die Regel, dass ein Polynom n-ten Grades
höchstens n Nullstellen hat gilt nicht für Polynome mit Koeffizienten in einem beliebigen Ring
R. Sie gilt allerdings falls R nullteilerfrei und kommutativ, also z.B. ein Körper ist.
b) Da 1000 durch 8 teilbar ist, sind die Zahlen der Form ...011 zu 3, die der Form ...101 zu 5,
die der Form ...110 zu 6 modulo 8 kongruent. Die Restklasse des Quadrates einer natürlichen
Zahl (nach einem Modul m) muss aber natürlich ein Quadrat in Z/(m) sein.
2.4.A3. Zerlege Z in die n Restklassen modulo n. In mindestens einer dieser Restklassen müssen
mindestens 2 Zahlen der Menge M liegen. D.h. es gibt 2 Zahlen aus M , die konguent modulo
n sind, deren Differenz also durch n teilbar ist.
2.4.A4. Behauptung: Eine solche Fahne gibt es nicht. Begründung: Die Anzahl der Sterne ist
m21 + m22 − k 2 . Die von 0 verschiedenen Quadrate in Z/(5) sind die Restklassen von 1 und −1.
Um die Behauptung zu beweisen, genügt es deshalb folgendes zu zeigen. In dem Ring Z/(5) ist
eine Summe von drei Summanden der Form ±1 nie 0.
Nun, seien k1 , k2 , k3 ∈ {1, −1}. Sind alle ki untereinander gleich, so ist ihre Summe gleich ±3.
Ist eine dieser Zahlen von den andern verschieden, so ist ihre Summe gleich ±1. Ihre Summe
ist nie durch 5 teilbar.
2.4.A5. a) Es gilt 10 ≡ 1 (mod 3) und 10 ≡ 1 (mod 9) , ferner 10 ≡ −1 (mod 11). Die
Behauptungen folgen daraus unmittelbar.
c) Die Zahl n und ihre Spiegelzahl haben die gleiche Quersumme und die gleiche alternierende
Summe. Also sind sie kongruent sowohl modulo 9, als auch modulo 11. Ihre Differenz ist also
sowohl durch 9 wie durch 11 und somit durch 99 teilbar.
d) Schreibt man n mit gerade vielen Ziffern, so ist ihre Spiegelzahl meist nicht kongruent zu
n modulo 11, hat allerdings dieselbe Quersumme. Deshalb ist die angegebene Differenz zwar
meist nicht durch 11, aber noch durch 9 teilbar. Beispiel 63 − 36 = 27.
e) Sei n die gewählte Zahl, q ihre Quersumme. Da q ≤ 45 und n ≥ 10050 ist n − q auch
5-Stellig. Ferner ist n − q durch 9 teilbar, da n ≡ q(mod 9) gilt. Die Restklasse modulo 9 der
ersten Ziffervon n − q ist durch die Summe der weiteren 4 Ziffern also eindeutig bestimmt.
Da sie nicht 0 ist, ist die erste Ziffer als solche eindeutig bestimmt. Beispiel: n = 12345. Die
Quersumme ist 15. Die Differenz somit n = 12330. Die Summe der letzten 4 Ziffern ist 8. Damit
die Quersumme von n durch 9 teilbar ist, muss die erste Ziffer 1 sein.
2.4.A6. Zur letzten Frage: Natürlich ist dies möglich, z.B., wenn man zwei Ziffern irrtümlich
vertauscht. Statt der Neunerprobe kann man natürlich auch die analoge Elferprobe verwenden,
wo eine Vertauschung zweier Nachbarziffern aufgedeckt wird.
2.4.A7. a) Teilbarkeit durch 2. Ist d gerade, so ist die gegebene Zahl genau dann durch 2 teilbar
(d.h. gerade), wenn die letzte Ziffer es ist. Ist d ungerade, so ist die gegebene Zahl genau dann
durch 2 teilbar, wenn die Quersumme es ist.
272
ANHANG A. LÖSUNGEN
b) Teilbarkeit durch 3. Ist d durch 3 teilbar, so ist die gegebene Zahl genau dann durch 3 teilbar,
wenn die letzte Ziffer es ist. Ist d ≡ 1 (mod 3), so ist die gegebene Zahl genau dann durch 3
teilbar, wenn ihre Quersumme es ist. Ist d ≡ −1 (mod 3), so ist die gegebene Zahl genau dann
durch 3 teilbar, wenn ihre alternierende Quersumme es ist.
2.4.A8. Man stellt leicht fest, dass für jede ganze Zahl n die Kongruenz n5 ≡ n (mod 10)
gilt. Modulo 10 ist also das Ergebnis schlicht zur Summe aller ganzen Zahlen von 1 bis 101
kongruent. Diese Summe ist 101 · 102/2 = 5151. Die gesuchte letzte Ziffer ist also die 1.
2.4.A.10.b Zerlege die absteigende Folge der ganzen Zahlen mn, mn−1, . . . , 1 in m absteigende
Folgen von je n ganzen Zahlen:
mn, mn − 1, . . . , mn − n + 1 || (m − 1)n, . . . , (m − 1)n − n + 1 || (m − 2)n, . . . , (m − 2)n − n +
1 || . . . | 1 · n, . . . , 1 · n − n + 1 .
Für k = 0, . . . , m − 1 ist dann das Produkt der n Faktoren ((m − k)n) · · · ((m − k)(n − n + 1))
durch (m − k)n! teilbar. Für das Produkt aller mn Zahlen mn, . . . , 1 bekommt man so die
behauptete Teilbarkeit.
2.4.A11. Ist m ungerade, so ist offenbar ( m+1
mod m) zu (2 mod m) invers.
2
Nach Voraussetzung ist m 6≡ 0 (mod 3). Also ist m modulo 3 zu −1 oder zu 1 kongruent Im
mod m), im zweiten ist (− m−1
mod m) zu (3 mod m) invers.
ersten Fall ist ( m+1
3
3
2.4.A12. b) Geburts- und Todesjahr von Carl Friedrich Gauss.
2.4.A13. Da die Restklassen von 9 und von 2 in Z/(17) invertierbar sind, sind die Kongruenzen
(1) 3x + 2y ≡ 0 (mod 17) und (10 ) 9(3x + 2y) ≡ 0 (mod 17) zueinander äquivalent. Dasselbe
gilt für die Kongruenzen (2) 5x + 9y ≡ 0 (mod 17) und (20 ) 2(5x + 9y) ≡ 0 (mod 17) Nun ist
9(3x+2y) = 27x+18y und 2(5x+9y) = 10x+18y. Da 27 ≡ 10 (mod 17), sind die Kongruenzen
(10 ) und (20 ) zueinander äquivalent und deshalb schließlich auch die Kongruenzen (1) und (2).
2.4.A14. (−5)3 = −125, (−5)4 = 625, (−5)5 = −3125 ≡ −125 (mod 1000). Du erkennst, dass
ab dem Exponenten 3 die Potenzen von −5 modulo 1000 sich mit der Periode 2 wiederholen.
Sei n ≥ 3. Dann gilt für ungerade n die Kongruenz (−5)n ≡ −125 ≡ 875 (mod 1000). Da 1995!
gerade, also 1995! + 1 ungerade ist, hat die erstgenannte Potenz die letzten drei Ziffern 875.
2.4.A16. Die Eigenschaft kann man auch so schreiben: 7 · 13 ≡ 1 (mod p). Und das bedeutet, dass p ein Teiler von 7 · 13 − 1 = 90 ist. Die gesuchten Primzahlen sind also genau die
Primfaktoren von 90, d.h. 2, 3 und 5.
2.4.A17. a) Wir bezeichnen die Elemente von Z/3 mit −1, 0, 1. (M. a. W. wir schreiben −1
für (−1 mod 3) usw.) Dann ist:
1 1
−1 1
0 −1
0
2
3
A = E, A =
, A =
A =
1 0
1 1
−1 1
4
A =
−1 −1
1 −1
6
, A =
, A =
,
−1 0
−1 −1
1 1
7
A =
, A8 = E = A 0 .
1 0
−1 0
0 −1
5
273
b) Die Abgeschlossenheit bezüglich der Multiplikation ist klar, da A0 , . . . , A7 die sämtlichen
Potenzen mit ganzzahligem Exponenten von A sind. Auch jedes (multiplikativ) Inverse gehört
dazu.
Um die Abgeschlossenheit bezüglich der Addition zu zeigen, berechne zunächst A0 − E, A1 −
E, . . . , A7 − E, 0 − E, und stelle fest, dass Du die Matrizen A0 , . . . , A7 , 0 in anderer Reihenfolge erhältst. Wenn Du diese Differenzen also mit einer der Matrizen A1 , . . . , A7 multiplizierst,
erhältst Du wieder alle diese Matrizen. Insgesamt gehören sämtliche Differenzen zweier der
angegebenen Elemente wieder zu den Matrizen A0 , . . . , A7 , 0. Dann gehören auch alle additiv
Inversen und mit ihnen auch alle Summen dazu. (X + Y = X − (−Y ).)
2.5.A.1. Es genügt, den Fall n = 1 zu betrachten, also pm+1 |xp − y p zu zeigen. Schreibe
xp − y p = (x − y)(xp−1 + xp−2 y + · · · + y p−1 ). Modulo pm besteht der zweite Faktor aus p
zueinander kongruenten Summanden, ist also, da m ≥ 1, durch p teilbar.
2.5.A2. Binomialsatz!
2.5.A3. a) Wenn a ungerade ist und a, n ≥ 2 gilt, so ist an + 1 > 2 und gerade, also keine
Primzahl. Ist n keine Zweierpotenz, so gibt es eine ungerade Zahl u > 2 mit n = 2m · u, also
m
an + 1 = bu + 1 = 1 − (−b)u , wobei b = a2 ist. Wegen 1 − (−b)u = (1 − (−b))(1 + (−b) + (−b)2 +
· · · + (−b)u−1 ) (geometrische Reihe) ist 1 + bu durch 1 + b teilbar, also nicht prim. (Beachte
b, u > 1, also 1 + bu > 1 + b.)
b) Nach der Formel der geometrischen Reihe ist an − 1 durch a − 1 teilbar. Wenn a > 2 ist, ist
dieser Teiler größer als 1, zudem wegen n ≥ 2 kleiner als an − 1. Wenn nun zwar a = 2, aber n
nicht prim ist, gibt es k, m > 1 mit n = km. Dann ist an − 1 = bm − 1, wo b = 2k > 2 ist.
c) In a) und b) haben wir nur gezeigt: Wenn an ± 1 prim ist, dann gilt . . . .“ Die angegebenen
”
Beispiele besagen nur, dass die Umkehrungen von a) und b) nicht richtig sind!
2.5.A4. a) Denke Dir c in Primfaktoren zerlegt. Jeden solchen kann man gegen einen Primfaktor
von a oder b kürzen, da ja c ein Teiler von ab ist. Am Ende ist der Nenner 1, aber sowohl von
a, als auch von b bleibt wegen c < a, c < b ein Teiler > 1 übrig, so dass ab/c ein nichttriviales
Produkt ist.
P
k
b) Eine n-stellige Zahl aus lauter 1-en schreibt sich als geometrische Reihe wie folgt: n−1
k=0 10 =
n
(10 − 1)/(10 − 1). Ist n = rs, so gilt
rs
r
r
10 − 1 = (10 )s − 1 = (10 − 1)
s−1
X
10rk
k=0
Sind r, s > 1, so sind beide Faktoren größer als 9. Wende a) an.
c) Eine solche Zahl ist von folgender Form:
n
X
100k =
k=0
Wende (für n > 1) Teil a) an.
(10n+1 − 1)(10n+1 + 1)
100n+1 − 1
=
100 − 1
99
274
ANHANG A. LÖSUNGEN
n
2.5.A5. Bekanntlich ist an −bn durch a−b teilbar: Wenn n ungerade ist gilt aP
+bn = an −(−b)n .
4 37−k
(−1)k .
Nun ist 148 = 4 · 37 und deshalb 2148 + 1 = 24·37 − (−1)37 = (24 − (−1)) · 37
k=0 (2 )
4
Also ist 2 + 1 = 17 ein Primfaktor.
2.5 A13. Ziehe aus der Ungleichung (m + 1)m < mm+1 die m(m + 1)-te Wurzel. So bekommst
Du – da die Wurzel im positiven Bereich streng monoton wachsend ist – die Ungleichung
√
√
m+1
m + 1 < m m für m ≥ 3.
Daraus folgt (wenn Du willst, mit Induktion)
√
√
m+k
m + k < m m für m ≥ 3 und k ≥ 1.
2.5.A14. Beachte zunächst: Für beliebige b, d ∈ N ist bd − 1 durch b − 1 auf Grund der Formel
für die geometrische Reihe teilbar.
Dann rechne:
am − 1 = aqn+r − 1 = ar (aqn − 1) + (ar − 1) = q 0 (an − 1) + (ar − 1), (mit einem geeigneten
ganzen q 0 , da nach obigem aqn − 1 durch an − 1) teilbar ist.
Da Du somit parallel zum euklidischen Algorithmus für m, n (mit positiven Resten) den für
am − 1, an − 1 durchführen kannst, folgt b) .
3.1 Zusatzbemerkung zu Beispiel 7. Jede reelle Zahl ist der Wert einer Reihe, die aus der
alternierenden harmonischen Reihe durch Umordnung hervorgeht.
Beweis: Die Reihe R der positiven Summanden hat den Wert ∞. Denn es gilt für ihre m-te
Partialsumme
m−1
1
1
1
1X1
+
+ ··· +
>
2·0+1 2·1+1
2m + 1
2 k=1 k
Rechts steht die mit 21 multiplizierte (m − 1)-te Partialsumme der harmonischen Reihe, die mit
m gegen ∞ geht. Ebenso leicht siehst Du, dass die Summe der negativen Summanden gegen
−∞ geht.
Sei α ∈ R beliebig. Nimm ihrer Reihenfolge nach soviele positive Summanden wie gerade nötig
sind, damit ihre Summe S0 größer als α ist. Setze die gesuchte Reihe fort, indem Du ihrer
Reihenfolge nach soviele negative Summanden nimmst, dass für ihre Summe S1 so gerade die
Ungleichung S0 + S1 < α gilt. Jetzt nimm wieder ihrer Reihenfolge nach so viele positive
Summanden, dass für ihre Summe S2 die Ungleichung S0 + S1 + S2 > α gilt. Usw.
4.1.A.1. a) Es ist #(A ∪ B) = a + b − d = #A + #B − #(A ∩ B). Denn wenn man die Elemente
von A zählt, zählt man genau d Elemente von B bereits mit.
b) Betrachte A1 ∪ A2 ∪ A3 als Vereinigung der beiden Mengen A3 und A1 ∪ A2 . Nach Teil a)
gilt #(A1 ∪ A2 ) ∪ A3 ) = #(A1 ∪ A2 ) + a3 − #((A1 ∪ A2 ) ∩ A3 ).
Nun ist (A1 ∪ A2 ) ∩ A3 ) = (A1 ∩ A3 ) ∪ (A2 ∩ A3 ). Jetzt wende auf die beiden Summenden in der
rechten Seite der letzten Gleichung beides Mal a) an: Du erhältst #(A1 ∪ A2 ) = a1 + a2 − a12 ,
sowie #(A1 ∩ A3 ) ∪ (A2 ∩ A3 ) = a13 + a23 − a123 und damit die Behauptung.
275
c) Wir gehen analog zur Lösung von b) vor und benutzen Induktion nach n, wobei der Fall
n = 1 trivial ist. (Du kannst auch mit dem unter a) behandelten Fall n = 2 beginnen.)
Für den Induktionsschritt (n → n + 1) wende a) auf die Vereinigung der beiden Mengen
A1 ∪ . . . ∪ An und An+1 an. Demgemäß ist
(∗)
#(A1 ∪ . . . ∪ An+1 ) = #(A1 ∪ . . . ∪ An ) + an+1 − #((A1 ∪ . . . ∪ An ) ∩ An+1 )
Es gilt (A1 ∪ . . . ∪ An ) ∩ An+1 = (A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An+1 ). Nun wende die Induktionsvoraussetzung auf den ersten S
und dritten Summanden
obiger Gleichheit d.h. auf die beiden
Sn
n
Vereinigungen von je n Mengen i=1 Ai und i=1 (Ai ∩ An+1 ) an. Du erhältst
#(A1 ∪ . . . ∪ An ) =
X
(−1)#J+1 aJ , sowie
∅6=J⊂{1,...,n}
−#((A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An )) =
X
(−1)#J · #(AJ ∩ An+1 ).
∅6=J⊂{1,...,n}
Beachte dass jede nichtleere Teilmenge I ⊂ {1, . . . , n + 1} entweder bereits eine nichtleere
Teilmenge von {1, . . . , n} oder eine Menge der Form J ∪ {n + 1}mit J ⊂ {1, . . . , n} ist, wobei
in letzterem Fall auch J = ∅ zugelassen ist.
Der erste Summand auf der rechten Seite von (∗) behandelt die Teilmengen von {1, . . . , n},
der zweite Summand, nämlich an+1 , die Menge ∅ ∪ {n + 1} = {n + 1}, der dritte Summand
schließlich die Mengen J ∪ {n + 1} mit ∅ =
6 J ⊂ {1, . . . , n}, und zwar auch mit dem richtigen
Vorzeichen, nicht wahr?
4.1.A2. a) A = 2N := {2k | k ∈ N}, B := N − A. Da hier X = Y = ∅ gilt, sind X, Y beide
endlich.
b) A := 2N, B := 3N := {3k | k ∈ N}. Es gibt ja unendlich viele Vielfache von 6. Und diese sind
(genau) die Vielfachen von sowohl 2 wie 3. Andererseits gibt es unendlich viele ganze Zahlen,
die weder durch 2 noch durch 3 teilbar sind, z.B. alle Potenzen von 5.
c) A := {2n |n ∈ N}, B := {3n | n ∈ N}. X = A ∩ B := {1}, Y ⊃ {5n | n ∈ N1 }
d) A = B := N. Natürlich gibt es auch weniger triviale Beispiele.
4.1.A3 Bezeichne die Elemente von F2 mit 0, 1. Erinnere Dich, dass in F2 folgendes gilt:
0 + 0 = 1 + 1 = 0, 0 + 1 = 1 + 0 = 1, − 1 = 1. Eine Summe von gerade vielen 1-en ist 0.
Das n-tupel (1, . . . , 1) sei mit e bezeichnet. Jedem v ∈ V ordne das n-tupel e + v = e − v zu.
Die Komponenten von e + v sind genau an den Stellen gleich 1, wo die von v gleich 0 sind. Es
gilt v + (e + v) = e und v 6= e + v. Man kann die Menge V in 2-elementige Teilmengen der
Form {v, e + v} zerlegen. Von diesen gibt es #(V )/2 = 2n−1 Stück. Da v + (e + v) = e ist, ist
die Summe über alle Elemente von V gleich der Summe von 2n−1 Summanden, die alle gleich
e sind. Da für n ≥ 2 die Zahl 2n−1 gerade ist, ist diese Summe gleich (0, . . . , 0).
4.2.A1 a) Wäre f nicht injektiv, so gäbe es verschiedene x, x0 ∈ M mit f (x) = f (x0 ). Dann ist
auch g(f (x)) = g(f (x0 )).
276
ANHANG A. LÖSUNGEN
b) Sei z ∈ P . Da g ◦f surjektiv ist, gibt es ein x ∈ M mit g(f (x)) = g ◦f (x) = z. Für y = f (x)
gilt dann g(y) = z.
c) 1. M = P := {0}, N := {0, 1}, f (0) = 0, g(0) = g(1) = 0.
2. M = N = P := N. f (n) := n + 1, g(0) := 0, g(n) := n − 1 für n ≥ 1.
4.2.A2 a) Sei y ∈ N . Da f surjektiv ist, gibt es mindestens ein x ∈ M mit f (x) = y. Setze
g(y) := x für ein solches ausgewähltes x. Da für ein solches x ja gilt, dass f (x) = y ist, ist
f ◦g(y) = y für jedes y ∈ N .
Weil idM injektiv ist, muss nach Aufgabe 1. auch f es sein, wenn g ◦f = idM gilt.
b) Sei x0 ∈ M fest gewählt. Sei y ∈ N . Liegt y nicht im Bild von f , d.h. y ∈
/ im(f ), setze
g(y) := x0 . Ist aber y ∈ im(f ), so gibt es ein (aber auch nur ein) x ∈ M mit f (x) = y. Dann
setze g(y) = x.
Ist f ◦g = idN , so ist f surjektiv.
4.2.A3 a) Antwort: nm . Die Menge der Abbildungen von M nach N wird deshalb manchmal
auch mit N M bezeichnet. (Beachte: Der Exponent ist die Startmenge, die Basis die Zielmenge.
b) Ist m > n, so gibt es keine solche Abbildungen. Ansonsten nimm M = {1, 2, . . . , m} an. Um
eine beliebige injektive Abbildung zu beschreiben, hat man als Bild der 1 noch n Möglichkeiten,
als Bild der 2 noch n − 1 solche, usw. usw., als Bild der m nur noch n − m + 1 solche. Insgesamt
gibt es n · (n − 1) · · · (n − m + 1) = n!/(n − m)! injektive Abbildungen, wobei die rechte Seite
dieser Identität im Fall m > n nicht definiert ist, da k! für negative ganze Zahlen nicht sinnvoll
definiert werden kann. Die linke Seite gibt allerdings auch in diesem Fall die richtige Antwort,
da dann einer der Faktoren gleich 0 ist.
c) Bijektive Abbildungen M → N gibt es genau dann, wenn m = n ist. Gemäß b) gibt es
n! solche. Vielleicht hast du früher schon gezeigt, dass man eine n-elementige Menge auf n!
verschiedene Weise anordnen kann. Dann kannst Du die Antwort auch folgendermaßen begründen: Jede bijektive Abbildung f : {1, 2, . . . , n} → N liefert eine Anordnung vom M ,
nämlich (f (1), f (2), . . . , f (n)). Umgekehrt liefert eine solche Anordnung eine bijektive Abbildung.
d) Eine Abbildung M → N ist genau dann surjektiv, wenn ihr Bild in keiner der Teilmengen
Nx := N − {x} mit einem x ∈ N liegt. Die Anzahl aller Abbildungen M → N ist nm . Ist Ax
die Menge aller Abbildungen M
[→ N , deren Bild inSNx liegt, so ist die Anzahl aller surjektiven
m
Abbildungen gleich n − #
Ax . Die Zahl # x∈N Ax kannst Du mit dem Prinzip der
x∈N
\
Inklusion-Exklusion berechnen. Ist nämlich J ⊂ N und AJ :=
Ax , so ist AJ offenbar die
x∈J
\
Menge der Abbildungen M → N , deren Bild in NJ :=
Nx liegt. (Denn eine Abbildung,
x∈J
deren Bild in U1 ∩ . . . ∩ Uk liegt, ist eine solche, der Bild sowohl in U1 , als auch in U2 , als auch
usw., als auch in Uk liegt. Die entsprechende Aussage für die Vereinigung gilt nicht: Das Bild
einer Abbildung, deren Bild in U ∪ V liegt, liegt nicht immer ganz in U oder ganz in V .)
277
n
Nun besteht NJ aus n − #J Elementen. Ferner gibt es für jedes k ≤ n genau
Teilmengen
k
aus k Elementen von N .
Die Anzahl der surjektiven Abildungen M → N ist also
n−1
X
n
n
n
n
m
m
m
m
k n
(−1)
(n − k)m
n −
(n − 1) +
(n − 2) −
(n − 3) + . . . ±
1 =
1
2
3
n−1
k
k=0
m
√
4.4.A4 Ich gebe nur das multiplikativ Inverse von a + b 2 an, wenn a, b nicht beide 0 sind.
√
√
a
−b
a−b 2
1
√ = 2
=
+
·
2
a − 2b2
a2 − 2b2 a2 − 2b2
a+b 2
Beachte, dass a2 − 2b2 für rationale a, b nur dann zu 0 werden kann, wenn a = b = 0 ist.
4.5.A1 a) Ordne einer solchen Folge die Folge der Abstände zwischen den Nullen zu. Der nullte
Abstand soll dabei die Anzahl der 1en sein, mit denen die Folge beginnt. Die Menge A ist also
gleichmächtig zur Menge aller Folgen natürlicher Zahlen (bei denen alle Folgenglieder nach der
ersten ≥ 1 sind), also überabzählbar.
b) Eine der betrachteten Folgen ist die konstante Folge (1, 1, 1, . . .), alle anderen brechen in
dem Sinne ab, das ab einer Stelle nur noch Nullen stehen. Die Menge ist abzählbar.
4.5.A2 Sei a = (an )n∈N eine 0-1-Folge. Definiere hierzu eine Menge M = ϕ(a) durch: n ∈
M ⇐⇒ an = 1.
4.5.A3 Zu jeder endlichen Teilmenge E von N gibt es ein n ∈ N, derart dass E eine Teilmenge
der Menge Mn := {0, . . . , n} ist. Jedes Mn hat aber nur endlich viele Teilmengen. Die Menge
aller endlichen Teilmengen von N ist also die abzählbare Vereinigung der endlichen Mengen
(Mn ), also abzählbar. (Auf diese Weise zählt man allerdings jede endliche Menge unendlich oft.
Willst Du dies vermeiden, betrachte außer der leeren Menge von jeder Menge Mn nur diejenigen
Teilmengen, die das Element n enthalten.)
Es gibt noch eine weitere Möglichkeit: Für jedes n gibt es nur abzählbar viele Teilmengen der
Kardinalzahl n.
4.5.A6. Ebenso, wie man jede reelle Zahl als (möglicherweise unendlichen) Dezimalbruch schreiben kann, so so kann man ihn auch als Binärbruch schreiben. Deshalb ist die angegebene Abbildung surjektiv. Sie ist aber nicht injektiv, da z.B. 0,1 = 0,01 ist.
5.3. Die Verbindungsstrecke der Punkte (0, 0) und (m, n) besteht aus den Punkten λ(m, n)
mit λ ∈ [0, 1], wobei = 0 und λ = 1 die Endpunkte dieser Strecke ergeben. Für ein λ ∈ ]0, 1[
sind offenbar λm und λn genau dann beide aus Z, wenn λ rational ist und sich in der Form kd
schreiben lässt, wo d ∈ N ein gemeinsamer Teiler von m und n und 0 < k < d gilt. Die Antwort
ist also: Genau dann, wenn ggT(m, n) = 1 ist, gibt es außer den Endpunkten keinen Punkt mit
ganzen Koeffizienten auf der Verbindungstrecke von (0, 0) nsch (m, n).
Seien jetzt m, n teilerfremd zueinander, so gibt es ganze Zahlen a, b mit am+bn = 1. Wären nun
λ ∈ ]0, 1[ und λm, λn ∈ Z, so wäre a(m) + b(λn) = λ einerseits ganz, andererseits nicht ganz.
278
ANHANG A. LÖSUNGEN
Also gibt es in diesem Fall keinen Punkt mit ganzen Koordinaten auf der Verbindungsstrecke,
außer den Endpunkten.
6.4. Der Satz des Pythagoras, angewendet auf drei Dreiecke besagt:
(s + t)2 = a2 + b2 , a2 = t2 + h2 , b2 = s2 + h2
Folgere aus diesen Gleichungen
s2 + 2st + t2 = t2 + h2 + s2 + h2 , also st = h2 .
Rechne schließlich
sc = s2 + st = s2 + h2 = b2 .
7.5.A1. a),b) sind bekannt oder trivial.
c) f (x) = a2 x2 + a1 x + a0 , f 0 (x) = 2a2 x + a1 , f 00 (x) = 2a2
f ist konvex, wenn a2 > 0, bzw. konkav, wenn a2 < 0 ist.
a1
a1
gilt. Für x > −
ist
Sei jetzt etwa a2 > 0. Dann ist f 0 (x) < 0, falls f 0 (x) < 0, d.h. x < −
2a2
2a2
a1
a1
f 0 (x) > 0. Also ist f im Intervall −∞, −
streng monoton fallend, in −
, ∞ streng
2a2
2a2
a1
monoton wachsend. Im Punkt x0 = −
liegt ein Minimum vor.
2a2
d) f 0 (x) = 3a3 x2 + 2a2 x + a1 .
7.5.A2 a) Da der Nenner auf dem Intervall ] − 1, 1] keine Nullstelle hat, ist die Funktion dort
definiert. Ferner sind Zähler und Nenner, also auch f (x) auf diesem Intervall überall ≥ 0. Es
−2
ist f 0 (x) = (1+x)
2 < 0 für alle x ∈ ] − 1, 1]. Deshalb ist f (x) auf dem Intervall streng monoton
fallend und somit injektiv. Schließlich ist f (1) = 0 und lim f (x) = ∞. Darum werden alle
x&−1
Zahlen aus
+
als Wert angenommen.
b) Analog.
7.5.A5. a) Da f (x) = (x2 − 1)x3 ist, lassen sich die Nullstellen leicht bestimmen. Dasselbe gilt
für die Nullstellen der ersten und zweiten Ableitung. Die Diskussion des Funktionsgraphen ist
also leicht.
√
b) Die Nullstellen der Funktion liegen dort, wo x3 = 3 x. Da die 3-te Potenz streng monoton
wächst und deshalb eine injektive
Funktion ist, ist diese Gleichung äquivalent zu x9 = x. Die
√
Nullstellen der Funktion x3 + 3 x sind also ±1 und 0.
Die Ableitung 3x2 − 13 x−2/3 ist in 0 nicht definiert, sonst überall. Falls |x| klein genug, ist sie
negativ und geht von beiden Seiten mit x gegen 0 gegen −∞. Der Funktionsgraph
hat in 0
√
√
4
4
die Gerade x = 0 als Tangente.
Die Nullstellen der Ableitungsind ±1/ 3. Bei −1/ 3 liegt ein
√
lokales Maximum, bei 1/ 4 3 ein lokales Minimum vor.
c) Die Funktion h ist in 0 nicht definiert. von ‘links’ geht sie dort gegen −∞, von ‘rechts’ gegen
∞. Denn der zweite Summand tut dies, während der erste dort von beiden Seiten gegen 0 geht.
279
(Wenn man den ersten Summand durch irgendeine in 0 definierte und dort stetige Funktion
ersetzt, gilt dasselbe.)
Eine Nullstelle von h ist −1. Wir werden bald sehen, dass es die einzige ist. Zumindest in R∗+
hat h keine Nullstelle, da dort beide Summanden positiv sind.
Die Ableitung ist h0 (x) = 32 x−1/3 − x−2 . Für alle x < 0 ist h0 (x) < 0, nicht wahr? (x−2 > 0
für alle x 6= 0.) Deshalb ist h im Bereich der negativen Zahlen streng monoton fallend. Die
Funktion h hat also nur die Nullstelle −1 .
Jetzt bestimme ich das Verhalten der Ableitung in R∗+ . Sei R eine der Relationen <, >, =.
Für x > 0 gilt dann
h0 (x) R 0 ⇐⇒
2 −1/3
3
x
R x−2 ⇐⇒ x5/3 R .
3
2
Da x5/3 eine streng monoton wachsende
Funktion ist, sehen wir, dass p
h0 (x) < 0 für 0 < x <
p
p
5
5
0
0
27/8, und h (x) = 0 für x = 27/8 und schließlich h (x) > 0 für x > 5 27/8 ist.
p
In 5 27/8 ≈ 1,275 liegt also ein lokales Minimum vor.
7.5.A7. Da f (0) = 0 ist sieht ein allgemeiner Differenzenquotienten im Punkte 0 wie folgt aus:
|x|/(ln |x|)
1
=±
x
ln |x|
Da limx→0 ln |x| = −∞ ist gilt limx→0 ±1/(ln |x|) = 0.
7.6.A2. Ist x ≤ 0, so ist 2√x ≤ 1, also 2x 6= 3. Sei also im Folgenden x > 0. Die einzige Lösung
2
der ersten
√ Gleichung ist 3. Da 2 > 3 und die Wurzelfunktion streng monoton wachsend
ist,
gilt 3 < 2. Da außerdem e = 1 + 1 + 1/2 + · · · ist, gilt 2 < e. Satz 7.6.4 ergibt somit
√
√ 2
3
2 < 3 = 3.
√
Dass 3 irrational ist, wirst Du bereits wissen. Nimm an, es gäbe natürliche Zahlen m, n
mit n 6= 0 und 2m/n = 3, so wäre 2m = 3n , was der Eindeutigkeit der Primfaktorzerlegung
widerspräche.
7.6.A3
−117.
7.6.A4. Nach Satz 7.6.4 ist die zweite der Zahlen gößer.
7.6.A.5 a) Es ist 23 < 32 . Die 6. Wurzelfunktion ist streng monoton wachsend. Also
√
√
√
√
6
6
3
23 < 32 , d.h. 2 < 3
b) Wegen
n ≥ 3 > e ist nn+1 > (n + 1)n . Durch Ziehen
der n(n + 1)-ten Wurzel siehst Du
√
√
√
n+1
n
n
n>
n + 1. Es ist also so: Wenn man die Zahlen n miteinander vergleicht, so wachsen
sie von 1 bis 3, danach fallen sie.
√
√
√
c) Es ist ln( n n) = ln(n)/n. Aus (7.6.2 iv.) folgt limn→∞ ln( n n) = 0, also limn→∞ n n = 1
√
√
7.6.A6. Da e > 2, gilt 0 < 3 2 < 2 < e. Aus Satz 7.6.4 folgt, dass die erste Zahl größer ist.
280
ANHANG A. LÖSUNGEN
7.6.A8. Häufig ist es bei einem Induktionsbeweis einfacher, eine stärkere Aussage zu beweisen.
(Diese steht ja auch in der Induktionsvoraussetzung.) So auch hier. Zeige
n+1
a ≥ a · nb
Induktionsanfang: 2 a ≥ a · 1 b. Sei jetzt bereits
n+2
a = a(
n+1 a)
≥ aa·
nb
n+1
a ≥ a · n b gezeigt, so gilt:
nb
≥ a · (a(a−1) )
= a · n+1 b .
2
x
2
7.6.A10. Da (xx )x = xx gilt, kann man die Gleichung auch in der Form xx = xx schreiben.
Offenbar ist x = 1 eine Lösung. Ist x > 0 und x 6= 1 so gilt xa = xb genau dann, wenn a = b
x
2
ist. Aus xx = xx folgt dann, dass (für positive x 6= 1) die Gleichung xx = x2 , dass also aus
demselben Grunde x = 2 gelten muss. Umgekehrt erfüllt x = 2 die Gleichung.
7.6.A11. a) Es ist 2111111 = 2 · 2111110 , also 2111111 − 2111110 = 2111110 . Die einzige reelle Lösung
der Gleichung ist also x = 111110.
b) Es gilt 512 = 29 . Dividiere die Gleichung durch die echte Seite. Dann ergibt sich
2x
2
29x+252
= 1 d.h. 2x
2 −9x−252
=1
Letztere Gleichung ist genau dann erfüllt, wenn x2 − 9x − 252 = 0 gilt.
8.1.A1. Die Menge der Polynome der genannten Art bezeichnen wir mit S (’symmetrisch’).
Jedenfalls ist −1 eine gemeinsame Nullstelle derPolynome aus S. Wir zeigen, dass keine weitere
komplexe Zahl Nullstelle aller Polynome aus S ist, indem wir zwei Polynome aus S angeben, die
lediglich die Nullstelle −1 gemeinsam haben. Das Polynom z n + 1 gehört zu S. Da n ungerade
ist, hat es die mit einem Minuszeichen versehenen n-ten Einheitswurzeln als Nullstellen, d.h. die
Zahlen −1, −ζ, −ζ 2 , . . . , , −ζ n−1 , wo ζ = cos(2π/n) + i sin(2π/n) ist. Das Polynom ϕ = z n−1 +
z n−2 + · · · + z + 1 hat die von 1 verschiedenen n-ten Einheitswurzeln als Nullstellen. (z + 1) · ϕ =
z n + 2z n−1 + 2z n−2 + · · · + 2z + 1 gehört auch zu S und hat neben −1 die von 1 verschiedenen
n-ten Einheitswurzeln als Nullstellen. Das additiv Inverse einer n-ten Einheitswurzel ist aber
bei ungeradem n nie eine n-te Einheitswurzel! (Für ungerades n ist (−a)n = −(an ).) Die beiden
zu S gehörenden Polynome (z + 1)ϕ und z n + 1, haben außer −1 keine gemeinsame Nullstelle.
8.1.A2. Wir wissen aus der Lösung der Aufgabe 1) dass f = (z + 1)(z 2 + z + 1) gilt. Also hat f
einerseits die Nullstelle −1, andererseits√die von 1 verschiedenen dritten Einheitswurzeln ζ, ζ 2
mit ζ = cos(2π/3) + i sin(2π/3) = (1 + i 3)/2. Das Polynom g hat, wie man nachrechnet, nicht
die Nullstelle −1. Hingegen hat g die Nullstellen ζ und ζ 2 . Sei nämlich ξ eine der beiden Zahlen
ζ, ζ 2 . Dann ist ξ 3 = 1, also ξ 3k+m = ξ m . Ferner gilt ξ 2 + ξ + 1 = 0. Es folgt ξ 2015 + ξ 121 + 1 =
ξ 2 + ξ 1 + 1 = 0.
9.1 A1. Man sagt, ein Gruppenelement a habe die Ordnung 2, wenn a2 = 1, aber a 6= 1 gilt.
Ein Element a 6= 1 hat genau dann die Ordnung 2, wenn a = a−1 ist. Die Elemente a mit
a 6= a−1 kann man zu Paaren zueinander Inverser zusammenfassen. Jedes solche Paar hat das
Produkt 1. Das Produkt aller Gruppenelemente ist also gleich dem Produkt der Elemente der
Ordnung 2, sofern man das leere Produkt gleich 1 setzt. Wenn es ein einziges Element der
281
Ordnung 2 gibt, ist also dieses das Produkt aller Elemente der Gruppe. (Man kann zeigen, dass
das Produkt aller Elemente einer endlichen abelschen Gruppe gleich 1 ist, wenn es mehrere
Elemente der Ordnung 2 gibt.)
9.1.A2. Die Gleichung x2 = 1 ist äquivalent zur Gleichung (x + 1)(x − 1) = 0. Und in einem
Körper ist ein Produkt genau dann gleich 0, wenn einer der Faktoren es ist. (Beachte, dass die
zu beweisende Behauptung für den Ring Z/(pq) mit zwei verschiedenen Primzahlen p, q > 2
falsch ist. Dies kann man mit Hilfe des chinesischen Restsatzes, der weiter unten bewiesen wird
leicht sehen. Zeige es für pq = 15.)
9.1.A3. Die Restklasse von (p − 1)! ist das Produkt aller Elemente von (Z/(p))∗ , also gleich
der Restklasse von −1, der einzigen, die in der Gruppe (Z/(p))∗ für p 6= 2 die Ordnung 2 hat.
Für p = 2 ist die Aussage trivial, da 1 ≡ −1 (mod 2) ist.
9.1.A4 (4 − 1)! = 6 ≡ 2(mod 4). Sei m > 4. Fall 1. m = p2 mit einer Primzahl p > 2. Dann gilt
p, 2p ≤ m − 1. Also ist (m − 1)! durch p · 2p teilbar, mithin ≡ 0 (mod p2 ). Fall 2. m > 2 ist weder
eine Primzahl, noch das Quadrat einer Primzahl. Dann ist m das Produkt zweier verschiedener
natürlicher Zahlen > 1, die kleiner als m sind. Also ist (m − 1)! ≡ 0 (mod m).
9.1.A5. Ist p eine Primzahl, so ist nach Wilson (p−1)!+1 durch p teilbar. Da 101 eine Primzahl
ist, ist demnach 100! + 1 durch 101 teilbar. Ferner ist 100! + 1 (viel) größer als 101, da bereits
5! > 101 gilt. Also besitzt 100! + 1 einen nichttrivialen Teiler und ist deshalb nicht prim.
9.1.A6. Alle p Restklassen modulo p kann man ja in der Form k + pZ schreiben, wobei k die
Zahlen 0, 1, . . . , p − 1 durchläuft. Setze nun m = (p − 1)/2. (Nach Voraussetzung ist p ungerade,
also m ∈ N.) Du erhältst jede Restklasse k + pZ modulo p genau einmal, wenn Du k die Zahlen
−m, . . . , −1, 0, 1, . . . , m durchlaufen lässt. (Beispiel p = 5. Hier erhält man alle Restklassen in
der Form −2 + 5Z, −1 + 5Z, 5Z, 1 + 5Z, 2 + 5Z.) Modulo p ist dann −1 ≡ (p − 1)! kongruent
dem Produkt der Zahlen −m, . . . , −1, 1, . . . , m. Also ist −1 ≡ (−1)m (m!)2 (mod p). Nun ist
m = (p − 1)/2 genau dann gerade, wenn p ≡ 1 (mod 4) ist. Deshalb ist dann die Restklasse
von −1 ein Quadrat.
a −b
9.1.A7 Die Matrizen der Form
sind invertierbar, genau dann, wenn ihre Determib a
nannte a2 + b2 6= 0 ist. Diese bilden eine Untergruppe G ⊂ Gl2 (k). Die Determinante gibt uns
eine surjektive Abbildung f von G auf die Menge der von 0 verschiedenen Elemente der Form
a2 + b2 in K, welche f (AB) = f (A)f (B) erfüllt. Das Bild von f ist dann natürlich eine Gruppe.
9.1.A8. Die Abbildung exp : R → R∗+ ist ein Isomorfismus.
9.1.A9. Angenommen, es gäbe einen Isomorfismus: f : Q → Q∗+ . Sei dann α ∈ Q ein Element
mit f (α) = 2. Dann hat α/2 die Eigenschaft f (α/2)2 = f ((α/2) + (α/2)) = f (α) = 2. D.h.
das Element β = f (α/2) ∈ Q hätte die Eigenschaft β 2 = 2. Ein Widerspruch, da ein solches β
nicht rational sein kann.
9.1.A10. Als ich zum ersten Mal auf diese Aufgabe stieß, habe ich die Assoziativität mühevoll
durch unmittelbares Rechnen mit Mengen gemäß der Definition hergeleitet. Erst später habe
ich erkannt, dass es viel sinnvoller ist, zunächst die Teilmengen E von M durch ihre charakteristischen Funktionen χE : M → F2 zu beschreiben. Die charakteristische Funktion χE ist
282
ANHANG A. LÖSUNGEN
durch χE (x) = 1 ⇐⇒ x ∈ E definiert. Dann entspricht der symmetrischen Differenz nämlich
die Summe dieser Funktionen.
9.1.A11. Nach Voraussetzung gilt für a, b ∈ G sowohl a2 b2 = 1, als auch abab = (ab)2 = 1.
Multipliziert man die Gleichung aabb = abab von links mit a−1 und von rechts mit b−1 , so erhält
man ab = ba.
Alternativ: a2 = 1 ist gleichbedeutend mit a = a−1 . Somit gilt ab = a−1 b−1 = (ba)−1 = ba.
Beachte: Es Ist durchaus möglich, dass a2 = b2 = 1 und trotzdem ab 6= ba ist. Sei etwa
a = σ1 , b = σ2 in der S3 . Für den Beweis der Behauptung in der Aufgabe muss man ja zusätzlich
(ab)2 = 1 benutzen.
9.1.A13 Betrachte die Elemente
1
0
,
0
1
,
1
1
∈ F22
Wenn man sie von links mit den Matrizen aus Gl2 (F2 ) multipliziert so vertauscht man sie – in
genau der Weise, wie die Elemente von S3 die Zahlen 1,2,3 vertauschen.
9.2.A4 c) Da p eine von q verschiedene Primzahl ist, ist p nicht durch q teilbar, also nach
Fermat pq−1 ≡ 1 (mod q). Es folgt (q − 1)pq−1 + 1 ≡ q − 1 + 1 (mod q). Also ist (q − 1) · pq−1 + 1
durch q teilbar und größer als q.
b) und a) folgen aus c). Was a) betrifft wirst Du natürlich ohnehin sofort sehen, dass 10·210 +1 =
10241 nach dem bekannten Kriterium durch 11 teilbar ist.
9.2.A5 Die Ordnung eines jeden Elements einer Gruppe G der Ordnung 4 ist 1,2 oder 4.
1. Fall: Es gibt in G ein Element der Ordnung 4. Dessen Potenzen machen dann ganz G aus,
d.h. G ist zyklisch. Je zwei zyklische Gruppen derselben Ordnung sind natürlich isomorf.
2. Fall: Jedes von 1 verschiedene Elements von G hat die Ordnung 2. Dann ist G abelsch nach
der Aufgabe 1.A11. Seien 1, a, b, c mit dem neutralen Element 1 die (verschiedenen) Elemente
von G. Die Produkte 1a = a, 1b = b, 1c = c, a2 = b2 = c2 = 1 sind bekannt. Was ist ab? Wäre
ab = 1, so wäre b = a−1 = a im Widerspruch zu b 6= a. Wäre ab = a, ergäbe die Multiplikation
mit a−1 = a die Gleichung b = 1. Ebenso würde ab = b zu a = 1 führen. Als einzige Möglichkeit
bleibt ab = c. Ebenso muss bc = a und ca = b gelten. Die Produkte ergeben sich zwangsläufig.
Das bedeutet: In einer nichtzyklischen Gruppe der Ordnung 4 gilt, dass das Produkt zweier verschiedener von 1 verschiedenen Elemente das dritte unter denselben ist. Je zwei nichtzyklische
Gruppen der Ordnung 4 sind also zueinander isomorf.
Aber, dass es eine solche überhaupt gibt, wissen wir schon, nämlich die Gruppe der folgenden
4 Matrizen über Q:
1 0
−1 0
1 0
−1 0
1=
, a=
, b=
, c=
.
0 1
0 1
0 −1
0 −1
Und diese ist natürlich auch isomorf zum direkten Produkt (Z/(2)) × (Z/(2)).
283
9.3.A1. Wenn U kein Normalteiler ist, dann gibt es ein a ∈ G mit aU 6= U a. Das bedeutet,
dass es ein u ∈ U mit au ∈
/ U a oder ua ∈
/ aU gibt. (Beachte, dass U a ( aU nicht automatisch
ausgeschlossen ist und man deshalb beide genannten Möglichkeiten in Betracht ziehen muss.)
1. Fall: Setze b := au; dann ist bU = aU , aber U b 6⊂ U a, also U b 6= U a.
2. Fall: Ersetze a durch a−1 und u durch u−1 . Dann gilt a−1 u−1 ∈
/ U a−1 . Nach Fall 1 ist dann
−1
−1 −1
−1
−1 −1
a U = (a u )U , aber U a 6= U a u .
9.3.A2. Sei aU = bU . Für jedes u ∈ U gibt es dann ein v ∈ U mit au = bv. Daraus folgt
u−1 a−1 = (au)−1 = (bv)−1 = v −1 b−1 . Somit liegen a−1 und b−1 in derselben Rechtsnebenklasse
nach U , d.h. U a−1 = U b−1 .
9.3.A3. Wie Du weißt, ist G die disjunkte Vereinigung der beiden Linksnebenklassen nach U .
Eine der beiden Linksnebenklassen ist U , die andere deshalb G − U . Dasselbe gilt für die beiden
Rechtsnebenklassen.
Es gilt also aU = U oder aU = G − U , und ebenso U a = U oder U a = G − U , je nachdem, ob
a ∈ U oder a ∈ G − U ist. In jedem Falle ist also aU = U a.
9.3.A6. Sei f10 : (Z/(2))m → U ein Gruppenisomorfismus. Ihn kann man auch als (injektiven)
Gruppenhomomorfismus f1 : (Z/(2))m → G auffassen. (Es wird nur die Zielmenge vergrößert.
Ansonsten ist f1 (x) = f10 (x).)
Wäre nun U 6= H, so gäbe es ein c ∈ H − U . Da nach Voraussetzung c2 = 1 ist, ist {1, c}
eine zu Z/(2) = {0, 1 isomorfe Untergruppe von H. Die Abbildung f2 : Z/(2) → H, definiert
durch f2 (0) = 0H , f2 (1) = c, ist ein Homomorfismus nach der vorangehenden Aufgabe. Dieser
ist immer noch injektiv. Dazu genügt es, zu zeigen, dass der Kern von F nicht nur aus der 0
besteht. Nun sei F (a, b) = 0. Dann gilt f2 (b) = −f1 (a) ∈ U . Da aber f2 (1) = c ∈
/ U gewählt
war, ist b = 0. Dann muss auch
9.3.A7. Modulo 1000 gilt: 1998 ≡ −2. Es ist 1000 = 8 · 125. Wenn also N := 19981998! je eine
Kongruenz modulo 8 und modulo 125 erfüllt, kannst Du nach dem chinesischen Restsatz eine
Kongruenz modulo 1000 angeben und damit die letzten 3 Ziffern bestimmen. Es gilt (−2)m ≡
0 (mod 8 für m ≥ 3, und deshalb ist N ≡ 0 (mod 8. Da −2 zu 125 teilerfremd und ϕ(125) = 100
ist, gilt (−2)k·100 ≡ (1 mod 125). Da einerseits 1998! ≥ 3, andererseits 1998! durch 100 teilbar ist,
gilt N ≡ 0 (mod 8) und N ≡ 1 (mod 125). Die Zahl 376 erfüllt die Kongruenzen 376 ≡ 0 (mod 8)
und 376 ≡ 1 (mod 125). Deshalb ist nach der Eindeutigkeitsaussag des chinesischen Restsatzes
N ≡ 376 (mod 1000). D.h. die letzten 3 Ziffern von N sind 376.
Herunterladen