Das Buch 17 Friedrich Ischebeck 2 Einleitung 17 ist die siebte Primzahl und die Summe der ersten 4 Primzahlen: 2 + 3 + 5 + 7 = 17. Sie 2 lässt sich als 22 + 1 schreiben. Dies ist der Grund dafür, dass man ein regelmäßiges 17-Eck mit Zirkel und Lineal konstruieren kann. Der Entdecker dieser Tatsache, Carl Friedrich Gauss, wurde im Jahre 1777 geboren. (Er starb 1855.) Ferner ist 17 die Summe von zwei Quadratzahlen (12 + 42 ), von drei dritten Potenzen (13 + 23 + 23 ) und von zwei 4. Potenzen ganzer Zahlen (14 + 24 ). Und 17 = 23 + 32 = 34 − 43 sei auch nicht vergessen. Der eigentliche Grund aber für den Titel dieses Buches ist, dass ich mir Dich, liebe Leserin, lieber Leser, als etwa siebzehnjährigen jungen Menschen vorstelle, der sich für die Mathematik interessiert. Man könnte dieses Buch also auch als Geschenk zum 17. Geburtstag eines jungen Menschen ” der Mathe mag“ bezeichnen. Es soll Dir nützlich sein, wenn Du vielleicht vorhast, einmal Mathematik, oder auch Physik, Informatik oder Ingenieurwissenschaften zu studieren. Es soll Dir vor allem Vergnügen bereiten! Es soll Dir schließlich auch Gelegenheit bieten, Dich an Hand der eingestreuten Fragen und der Übungsaufgaben aktiv mit der Mathematik zu beschäftigen. ******* Der (historische) Anfang der Mathematik war die Beschäftigung mit den natürlichen Zahlen 0, 1, 2, 3, . . . und den geometrischen Figuren. Schon daran erkennt man, dass die Mathematik sich nicht jenseits aller Wirklichkeit befindet – obwohl das manch einem so scheinen mag. Schon früh erkannte man, dass Geometrie und Zahlen viel miteinander zu tun haben. Aber gerade dieser Zusammenhang erzwingt es, mehr Zahlen als nur die natürlichen zu betrachten. Nun kann man zur Not sagen: die Strecke a verhält sich zu einem Meter (Elle, Fuß) wie 3 zu ” 5“, statt a ist 3/5 Meter (Elle, Fuß) lang“ und auf diese Weise den Gebrauch der rationalen ” Zahlen vermeiden. Aber ist das wirklich erstrebenswert? Auch die rationalen Zahlen, d.h. die Brüche mit ganzem Zähler und ganzem Nenner, reichen (zumindest dem Theoretiker) nicht aus. Z.B. kann man die Länge der Diagonale eines Quadrates im Verhältnis zu einer Seite nicht (absolut genau) als rationale Zahl angeben. Man kann dieses 141 1414 14 , besser als , noch besser als usw. angeben, wobei das Verhältnis nur ungefähr als 10 100 1000 usw.“ genauer zu erläutern wäre. ” √ Da scheint es doch griffiger zu sagen√ die Diagonale ist 2-mal so lang wie die Seite“ und dann ” eine Methode anzugeben, wie man 2 durch rationale Zahlen approximieren kann. 3 √ Nun ist 2 zwar keine rationale, aber eine reelle Zahl, und so steht es auch mit π und vielen anderen Zahlen. Über den Begriff ‘reelle Zahl’ muss und will ich Dir in diesem Buch auch einiges mitteilen. Will man die Punkte einer Ebene (bzw. des Raumes) durch 2 (bzw. 3) Koordinaten beschreiben, so kommt man offenbar ohne negative Zahlen nicht aus. Du siehst, die Betrachtung des Rechenbereichs aller reellen Zahlen wird durch die Geometrie mehr oder weniger erzwungen. Die Zahlen sind nicht nur zum Zählen und messen, sondern auch zum Rechnen da. Z.B. kann man durch Rechnen das Zählen vereinfachen. Wenn etwa eine Partei im ersten Wahlbezirk 312, im zweiten 298 und im dritten 99 Stimmen gewonnen hat, so wird man in der Wahlzentrale diese Anzahlen addieren, statt die betreffenden Stimmzettel anliefern zu lassen, sie zusammen zu werfen und dann zu zählen. Du wirst keine Probleme haben, die drei genannten Zahlen ‘schriftlich’ zu addieren. Aber versuche das einmal, wenn die Zahlen in römischer Schreibweise gegeben sind: CCCXII, CCXCVIII, IC. Dies zeigt die Überlegenheit des uns geläufigen Dezimalsystems. (Im Altertum hat man mit der mechanischen Rechenmaschine ‘Abakus’ praktisch eine Übertragung der römischen oder griechischen Zahlenschreibweise in das Dezimalsystem vorgenommen!) Wenn man akzeptiert, dass es beispielsweise auf dieselbe Zahl hinausläuft, ob man die 312 und die 298 und die 99 Wahlzettel zusammenwirft und dann zählt, oder ob man diese Zahlen in beliebiger Reihenfolge addiert, dann akzeptiert man damit auch das Assoziativ- und das Kommutativgesetz der Addition, a + (b + c) = (a + b) + c, bzw. a + b = b + a (Du kannst Dir darüber weitergehende Gedanken machen – musst es aber nicht. Dahinter steckt schließlich die Einsicht, dass man beim Zählen einer endlichen Menge von Gegenständen unabhängig von der Reihenfolge immer zum selben Ergebnis kommt. Die meisten Menschen werden das in keiner Weise bezweifeln.) Dem Dezimalsystem liegt die Grundzahl Zehn zugrunde. Dabei ist die Zehn natürlich nicht die einzig mögliche, aber auch nicht die schlechteste Wahl, jedenfalls, was die Praxis des Rechnens betrifft. Die kleinstmögliche Grundzahl 2 (mit den einzigen Ziffern 0 und 1) ist zwar für Computer am geeignetsten, aber vielleicht nicht für den Menschen. Wir sprechen vom Binärsystem oder von der Binärschreibweise, wenn wir von der Grundzahl Zwei ausgehen. Die Multiplikation natürlicher Zahlen kann man als iterierte Addition definieren. Obwohl man sie demnach auf die Addition zurückführen kann, ist es aber sinnvoll, sie als eigenständige Rechenart anzuerkennen. Warum und wie ich das meine, erläutere ich jetzt mit vier Argumenten. 1. Die – wie gesehen – nützliche Dezimal-Darstellung natürlicher Zahlen benutzt implizit die Multiplikation: 3024 = 3 · 10 · 10 · 10 + 0 · 10 · 10 + 2 · 10 + 4. (In den Summanden braucht man auf Grund der Assoziativität der Multiplikation keine Klammern zu schreiben. Ferner haben wir die geläufige Konvention ‘Punktrechnung vor Strichrechnung’ genutzt.) Beim schriftlichen Addieren benutzt man implizit die Distributivität, a(b + c) = ab + ac, also eine Regel, in der neben der Addition die Multiplikation eine Rolle spielt. 4 2. Man berechnet z.B. das Produkt 127·344 sicher nicht, indem man 127 mal 344 zu sich selbst addiert, sondern schneller auf andere Weise, nämlich so wie Du das ‘schriftliche Multiplizieren’ auf der Schule gelernt hast. Wieder erkennt man die Nützlichkeit des Dezimalsystems, bzw. des Binärsystems für Computer. 3. Es gilt – wie Du vielleicht weißt, aber auch ziemlich bald in diesem Buch lernen wirst – die Formel: n(n + 1) 1 + 2 + 3 + ··· + n = 2 Für nicht zu kleine n ist sicher die rechte Seite dieser Identität schneller zu berechnen als die linke, obwohl man rechts nicht nur multiplizieren sondern auch noch dividieren muss. Und dies ist natürlich nur eines unter vielen Beispielen. 4. Es ist nicht schwer, die Multiplikation natürlicher Zahlen sinnvoll auf die rationalen Zahlen ‘auszudehnen’, wo man sie nicht mehr als iterierte Addition auffassen kann. Oben habe ich bereits erläutert, wieso die Grundgesetze der Addition, nämlich die Assoziativität und Kommutativität eigentlich selbstverständlich sind. Wie steht es um die entsprechenden Gesetze für die Multiplikation? Wenn man das Produkt m · n zweier natürlicher Zahlen als Summe von m Summanden der Größe n definiert, ist es nicht von vorneherein klar, dass bei der Addition von n Summanden der Größe m dasselbe herauskommt, d.h. ob m · n = n · m ist. Wenn Du aber sagst, m · n ist die Anzahl der Apfelsinen, die in m Reihen zu je n Stück angeordnet ist, wie in folgendem Bild, so wird das Gesetz m · n = n · m augenscheinlich. • • • • • • • • • • • • • • • • • • • • Wie würdest Du Dir das Distributivgesetz a(b + c) = ab + ac für natürliche Zahlen anschaulich klarmachen? Für Potenzen gilt weder die Kommutativität, noch die Assoziativität. Es ist ja 23 6= 32 , sowie 2 2(3 ) 6= (23 )2 . Wunderbarer Weise kann man die Addition und die Multiplikation auf die rationalen Zahlen, d.h. positive oder negative Brüche, ausdehnen, und es bleiben sogar dieselben Rechengesetze erhalten. Fasst man die rationalen Zahlen als Größen auf, ist eigentlich klar, wie man zwei solche zu addieren hat. (S.u.) Das Produkt zweier Brüche entspricht geometrisch der Flächengröße des Rechtecks mit den Seitenlängen, die den Brüchen entsprechen. (S.u.) Warum müssen wir Mathematiker – und mit diesem Wort sind im ganzen Buch alle Mathematikerinnen herzlich mitgemeint – die Bruchrechnung beherrschen? Das Addieren von Brüchen 5 ist schwerfällig. Ebenso ist es mühsam von zwei gegebenen Brüchen zu erkennen, welcher von beiden der größere ist. Vergleiche z.B. 99/101 mit 98/100. (Es wäre schön, wenn Du dabei auch ein Gesetz erkennen könntest!) Der Praktiker ist sicher gut beraten, abbrechende Dezimalbrüche zu benutzen – wenn auch mit einiger Vorsicht. Der Mathematiker sollte jedoch auch die Hintergründe verstehen. Außerdem rechnet man mit Brüchen von Termen (etwa (sin α)/(c + b)) genauso wie mit Brüchen von ganzen Zahlen. Die Bruchrechnung wird an der Schule in der 6. oder 7. Klasse erlernt – und später von vielen vergessen. (Dazu tragen leider auch die an sich nützlichen Taschenrechner bei, die selber mit Brüchen umgehen können und so den Schülern das mühsame Addieren von Brüchen ersparen!) Das Rechnen mit konkreten Brüchen kann aber lehren, wie wichtig es ist, dass man nicht einfach alles durcheinander wirft. Man muss unbedingt falsche Analogien vermeiden! Z.B. gilt zwar die Regel a b a+b c c c + = , aber keinesfalls allgemein + = c c c a b a+b wie man etwa an der Identität 1 1 + =1 2 2 sieht, die niemand bezweifeln wird, auch diejenigen nicht, welche die Bruchrechnung noch nicht gelernt oder wieder vergessen haben. Da gute Mathematiker sich u.a. dadurch auszeichnen, dass sie falsche Analogien vermeiden (und richtige Analogien nützen!), erscheint mir die Beobachtung erklärlich, dass Studierende, die zu Anfang ihres Studiums die Bruchrechnung beherrschen, am Ende meist einen guten Studienerfolg in der Mathematik erreichen. Ein Abiturient oder eine Abiturientin, die nicht mehr genau weiß, wie man mit Brüchen rechnet hat, kann dennoch mit Erfolg Mathematik studieren. Man kann im Mathematikstudium im Prinzip alles Vergessene nachholen. Man muss es allerdings auch wollen und tun! Du kannst allerdings nicht erfolgreich Mathematik studieren, ohne an diesem Fach Interesse und Freude zu haben! Ich bilde mir nicht ein, einen Menschen, der Mathematik uninteressant oder gar ätzend findet, vom Gegenteil überzeugen zu können. Für einen solchen ist dieses Buch nicht gedacht. Dezimalzahlen. Rationale Zahlen, d.h. Brüche kann man als Dezimalzahlen schreiben. 36 Zum Beispiel = 1,44. Meist kommt man nicht mit endlich vielen Nachkommeziffern aus. 25 1 Zum Beispiel = 0,3 = 0,333 . . . wo nach dem Komma unendlich viele 3-en folgen; oder 3 45 = 1,0227 = 1,02272727 . . . wo nach 1,02 unendlich oft das Ziffernpaar 27 folgt. 44 Wenn man eine rationale Zahl als Dezimalzahl schreibt, ergibt sich immer ab einer gewissen Stelle eine Periode. Im ersten Beispiel ist dies die Periode 0, im zweiten die Periode 3, im dritten die Periode 27. (Der Fall, wo die Dezimalzahl abbricht, d.h. auf die Periode 0 endet, tritt genau dann ein, wenn der Nenner des gekürzten Bruches die Form 2m 5n mit natürliche Zahlen m, n hat. Das liegt natürlich daran, dass 2 und 5 die Primfaktoren von 10 sind.) 6 Umgekehrt kann man jede Dezimalzahl, die von einer Stelle an periodisch ist, als Bruch ganzer Zahlen schreiben. √ Nun gibt es allerdings ‘Zahlen’, wie etwa 2, die wir auf jeden Fall als Zahlen betrachten wollen, und die man auch als Dezimalzahlen ‘schreiben’, kann. Diese haben keine Periode! Aber√man kann theoretisch für jede natürliche Zahl n mit genügend ‘Fleiß’ die ersten n Ziffern von 2, π etc. berechnen. Alle Zahlen, die man als Dezimalzahlen schreiben kann, nennt man die reellen Zahlen. (Natürlich dürfen sie auch negativ sein.) Im 2. Kapitel werden Rechenbereiche von einem allgemeinen Standpunkt aus betrachtet. Und es werden Beispiele gegeben, die Dir vielleicht sehr exotisch vorkommen. Dieses Kapitel zu lesen, wird Dir vielleicht nicht so leicht fallen. Es lohnt sich aber! Natürlich darfst Du seine Lektüre auf später verschieben. Mengen und Abbildungen sind Begriffe der modernen Mathematik, denen Du in einem Mathematik- und Informatikstudium nicht entgehen kannst. Das entsprechende Kapitel ist vielleicht schwer zu lesen, weil es so abstrakt ist. Es mag aber auch sein, dass Du es als sehr leicht zu lesen empfindest, da in ihm alle Schlüsse eher simpel sind. Geometrie. Auch der Geometrie ist ein Kapitel dieses Buches gewidmet. Dort setze ich allerdings noch mehr als sonst voraus, dass Du ordentliche Kenntnisse aus der Schule mitbringst. Das Problem der Grundlagen ist für die Geometrie schwieriger als für die Zahlen. Welchen Sinn hat es, bevorzugt die sogenannte Euklidische Geometrie zu behandeln, obwohl diese, wir man heute weiß, nicht richtig ist, wenn man Lichtstrahlen (im Vakuum) als Geraden betrachtet? Die Antwort, dass die Euklidische Geometrie keinen Sinn habe, kann man mit Fug bezweifeln. In diesem Kapitel sollen insbesondere die Kreisfunktionen (Sinus, Cosinus) geometrisch erklärt werden, die zu den wichtigsten Funktionen der Analysis und auch der Physik gehören. Obwohl somit mein Hauptanliegen nicht die klassische Dreiecksgeometrie ist, mochte ich es mir nicht versagen, ihre schönen Sätze über die Eulergerade, den Feuerbachkreis und das Morleydreieck zu beweisen, die erst im 18. und 19. Jahrhundert gefunden wurden. Analysis: Die Differenzial-und Integralrechnung betrachtet Funktionen vom geometrischen oder auch dynamischen Standpunkt aus. Du wirst vieles vom Schulunterricht her wissen, vielleicht aber auch neue Gesichtspunkte kennenlernen. Komplexe Zahlen. Es gibt mehrere Gründe, warum die komplexen Zahlen aus der modernen Mathematik nicht mehr wegzudenken sind. Im Kapitel über komplexe Zahlen will ich versuchen, dies zu erläutern. Komplexe Zahlen lassen sich in der Form a + bi schreiben, wobei a, b reelle Zahlen sind, während i eine neue Zahl mit der merkwürdigen Eigenschaft i2 = −1 ist. Die reellen Zahlen werden als spezielle komplexe Zahlen aufgefasst, nämlich als diejenigen a + bi, wo b = 0 ist. Die Addition komplexer Zahlen ist naheliegend, während man die Multiplikation nach meinem Gefühl nur auf geometrische Weise wirklich verstehen kann. Eine der wichtigsten Eigenschaft des Rechenbereichs der komplexen Zahlen ist der Fundamentalsatz der Algebra, der besagt, dass jedes (nicht konstante) Polynom mit komplexen Koeffizienten mindestens eine komplexe Nullstelle hat. Beachte, dass z.B. das Polynom x4 −4x3 +6x3 −3x2 +2 = (x−1)4 +x2 +1 keine reelle Nullstelle hat. Die Gültigkeit des Fundamentalsatzes der Algebra wird in diesem Buch zumindest plausibel gemacht. 7 Zur gedanklichen Präzision in der Analysis und der Geometrie. Wenn eine Funktion zwischen zwei x-Werten a und b überall definiert und stetig ist und wenn ferner f (a) < 0 und f (b) > 0 ist, so hat sie zwischen a und b irgendwo (mindestens) eine Nullstelle. Dieser Satz hat den Namen Zwischenwertsatz und wird gemeinhin im ersten Semester des Mathematikstudiums bewiesen. Ich hoffe, Du bist mir nicht böse, wenn ich ihn in diesem Buch als anschaulich selbstverständlich ansehe. Und das ist nur ein Beispiel! Versteh mich richtig. Ich bin nicht der Meinung, dass die präzisen Beweise der modernen Analysis überfüssig wären. Aber ich will ja kein Buch für Erstsemester schreiben. Nicht ganz leichten Herzens opfere ich einen Teil der gedanklichen Präzision, die die moderne Analysis erreicht hat, dem Ziel und hoffentlich auch Deinem Wunsch, schneller zu Ergebnissen zu kommen, die Du nicht eh schon glaubst. Ich werde mir an mehreren Stellen erlauben, mich anschaulicher Schlüsse zu bedienen. Dasselbe gilt erst recht für die klassische Geometrie, für die Du in den Büchern von Hilbert oder Lorenzen zwei grundsätzlich verschiedene Weisen der Präzisierung finden kannst. Zum Schluss die Frage: Was hat die Mathematik mit der Wirklichkeit zu tun und was nutzt sie? Nach meiner Überzeugung ist die Mathematik eine Wissenschaft, die sich auf die Wirklichkeit bezieht und sich mit ihr beschäftigt. Ihr Nutzen für die moderne technisierte Welt ist unbestreitbar. (Die Frage, ob wir ohne Autos, Händis und Supermarktkassen nicht glücklicher wären, kann und will ich nicht beantworten.) Da heißt nicht, dass es nicht auch prominente Ergebnisse der Mathematik gäbe, die wahrscheinlich auch in weiter Zukunft keinen volkswirtschaftlichen Nutzen bringen werden. Der berühmte Satz, dass für n > 2 die Summe zweier n-ter Potenzen positiver ganzer Zahlen selbst keine n-te Potenz ganzer Zahlen ist – vermutet (?) von Fermat im 17., bewiesen von Wiles im 20. Jahrhundert – gehört wohl dazu. Man kann zwei extreme Positionen einnehmen: 1. Die Mathematik hat nur einen Wert, soweit sie sich anwenden lässt. Schon aus ethischen Gründen kann ich es nicht vertreten, mich für ein ‘Glasperlenspiel’ von der Gesellschaft bezahlen zu lassen. 2. Ich befasse mich mit der Mathematik nur um ihrer Schönheit willen. Schließlich ist sie eine großartige Kulturleistung. Anwendungen ziehen sie nur herab. In meiner Jugend neigte ich der 2. Position zu – und habe andererseits manchmal wegen dieser Meinung ein schlechtes Gewissen gehabt. Heute ist mir klar: Es gibt nicht den geringsten Grund, eine dieser beiden Extrempositionen einzunehmen. Betreibe die Mathematik mit Freude sowohl an ihrer Schönheit, als auch an ihren Anwendungen, und suche Dir den Bereich aus, der Deinem Bedürfnis nach Wirklichkeitsnähe oder -ferne am nächsten kommt. 8 Es ist ja möglich, dass der eine oder andere Punkt in dem Buch Dir einfach nicht klar werden will oder dass die eine oder andere Aufgabe Dir völlig unlösbar erscheint. Nachdem Du das Buch dann wütend in die Ecke geschmissen hast, hol es bitte wieder hervor und lies an einer anderen Stelle weiter. Auch das Verstehen von Mathematik und das Lösen mathematischer Aufgaben kann man trainieren. Vielleicht fällt Dir z.B. im Kapitel über Ringe und Körper manches sehr schwer, während Dir im Kapitel Differenzial- und Integralrechnung vieles bekannt erscheint. Mir liegt nicht daran, Dich mit besonders schwierigen Dingen und Aufgaben zu ärgern. Manche schönen und interessanten Ergebnisse sind aber nun mal nicht so leicht zu haben. Deshalb freut mich ungemein, wenn es Dir gelingt, auftauchende Schwierigkeiten zu überwinden. Hier für Nachfragen meine elektronische Adresse: [email protected] Manchmal benutze ich verschiedene Schreibweisen für dasselbe: n X Pn a a = = a/b , ak , limn→∞ an = lim an . k=1 ak = b n→∞ b k=1 Mit , gelegentlich auch mit – bezeichne ich das Ende eines Beweises. Das griechische Alphabet A, α alpha, B, β beta, Γ, γ gamma, ∆, δ delta, E, ε epsilon, Z, ζ zeta, H, η eta, Θ, ϑ theta, I, ι iota, K, κ kappa, Λ, λ lambda, M, µ my, N, ν ny, Ξ, ξ xi, O, o omikron, Π, π pi, P, ρ rho, Σ, σ sigma, T, τ tau, Υ, υ ypsilon, Φ, ϕ phi, X, χ chi, Ψ, ψ psi, Ω, ω omega. Unterscheide ζ von ξ. Manchmal, aber nicht in diesem Buch, werden an Stelle von ε, ϑ, ϕ die Bezeichnungen , θ, φ benutzt. Kapitel 1 Vom Zählen, Rechnen und Vergleichen 1.1 Die natürlichen Zahlen 0, 1, 2, 3, 4, 5, . . . Die natürlichen Zahlen hat der liebe Gott gemacht.“ (Kronecker) ” Na, darüber will ich lieber nicht spekulieren. Aber, wozu sie gut sind, ist wohl klar. Man kann jemandem mitteilen, wieviele Schafe man hat (etwa um sie zu verkaufen), ohne ihm die Herde zeigen zu müssen. Man kann auch ihre Zahl notieren und im kommenden Jahr feststellen, wieviel Zuwachs, bzw. Verlust man gemacht hat. Usw. Natürliche Zahlen sind Symbole zum Zählen, zum Vergleichen und zum Rechnen. Auch wenn man mit dem Zählen meist mit der 1 beginnt, ist es doch möglich, dass ein Einwohner Münsters, wie z.B. ich, gar kein Schaf besitzt und dies auf einer Liste aller Bewohner Münsters dadurch angegeben wird, dass man eine 0 in die entsprechende Spalte einträgt. Die 0 ist auch eine Anzahl, weshalb ich sie zu den natürlichen Zahlen rechne. (Etwa die Hälfte der Mathematiker sieht das allerdings anders.) Notation: Die Gesamtheit aller natürlichen Zahlen – einschließlich der 0 – bezeichne ich mit N. Eine solche Gesamtheit mathematischer Objekte wird gemeinhin als eine Menge bezeichnet. Man redet somit von der Menge der natürlichen (ganzen, rationalen) Zahlen. Die Notation a ∈ N soll ausdrücken, dass a zur Menge der natürlichen Zahlen gehört, d.h. eine natürliche Zahl ist. (Die Menge der von Null verschiedenen natürlichen Zahlen bezeichne ich mit N1 . Dies ist der einzige Punkt, wo ich mich nicht einer allgemein gebräuchlichen Notation bediene. Es gibt für N1 auch die Bezeichnung J.) 1.1.1 Während die Regeln a + b = b + a und a + (b + c) = (a + b) + c nach der alltäglichen Bedeutung der Addition in N selbstverständlich sind oder zumindest erscheinen, kann man sich fragen: Ist die Regel a · b = b · a für natürliche Zahlen eigentlich auch so selbstverständlich? Dass 3 · 7 = 7 + 7 + 7 dasselbe ergibt, wie 7 · 3 = 3 + 3 + 3 + 3 + 3 + 3 + 3, kann man leicht nachrechnen. Aber das könnte ja Zufall sein. 9 10 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Für Potenzen ist die Sache jedenfalls komplizierter. Es ist zwar 24 = 16 = 42 , aber 73 = 7·7·7 = 343 und 37 = 3·3·3·3·3·3·3 = 2187. (Ich weiß nicht, ob man sich bei der Identität (3+4)3 = 343 irgendetwas denken soll. Ich glaube, eher nicht.) Die Frage, wieso eigentlich a · b = b · a für natürliche Zahlen gilt, habe ich bereits in der Einleitung beantwortet (Einen formalen Beweis, der von einem Axiomensystem für die natürlichen Zahlen ausgeht, gibt es natürlich auch.) Die (nicht allzu wichtige) Frage, für welche positiven reellen Zahlen a, b mit a 6= b die Gleichung ab = ba gilt, wird in diesem Buch in 7.6 behandelt. Dazu musst Du ja wissen, was reelle Zahlen sind, und was man unter ab für positive reelle Zahlen a, b versteht. Aber natürlich darfst Du schon mal in diesem Abschnitt nachlesen. 1.1.2 Zumindest ebenso wichtig wie das Gesetz der Kommutativität (ab = ba) ist das Gesetz der Assoziativität der Multiplikation natürlicher Zahlen: (ab)c = a(bc). Kannst Du Dir seine Gültigkeit geometrisch (im dreidimensionalen Raum) veranschaulichen? (Auch die As3 soziativität gilt nicht für Potenzen? Vergleiche (102 )3 mit 102 , und beachte dabei, dass nach 3 3 allgemein gebräuchlicher Konvention 102 = 10(2 ) definiert ist.) 1.1.3 Das Gesetz, das den Zusammenhang zwischen Addition und Multiplikation beshreibt, ist das Gesetz der Distributivität (m + n)k = mk + nk. (In der letzten Regel ist natürlich die Konvention Punktrechnung geht vor Strichrechnung“ anzuwenden; d.h. mk + nk = ” (mk) + (nk).) Zusammen mit der Festlegung 1k = k definiert das Distributivitätsgesetz sozusagen die Multiplikation natürlicher Zahlen. Nicht wahr? (Aufgrund der Distributivität ist ja (1 + · · · + 1)k = 1 · k + · · · + 1 · k mit gleichvielen Summanden links und rechts.) Auch dieses Gesetz kannst Du Dir anschaulich klar machen. • • • • • • • • • • • • • • • • • • • • Natürlich sieht man es auch so: . . + k} = |k + .{z . . + k} mk + nk = |k + .{z . . + k} + |k + .{z m n m+n 1.1.4 Die grundlegenden Gesetze der Addition und Multiplikation im Bereich der natürlichen Zahlen fassen wir noch mal zusammen: mn = nm Kommutativität m+n=n+m (1) k + (m + n) = (k + m) + n k(mn) = (km)n Assoziativität (m + n)k = mk + nk Distributivität 1.1. DIE NATÜRLICHEN ZAHLEN 11 Beachte, dass das Distributivitätsgesetz die Addition und die Multiplikation vollkommen unterschiedlich behandelt und dass eine Unregel entstünde, wollte man die Addition mit der Multiplikation vertauschen: Meist ist mn + k 6= (m + k)(n + k). Die Assoziativität der Addition (bzw. Multiplikation) bedeutet, dass man in einer längeren Summe (bzw. Produkt) keine Klammern benötigt, um anzuzeigen, welche Addition (bzw. Multiplikation) man vor welcher auszuführen hat. Z.B. ist (ab)(cd) = (a(bc))d etc. Klammern benötigt man erst, wenn Summen und Produkte gemeinsam in einer Formel vorkommen. Da zusätzlich die Kommutativität gilt, kann man die Summanden, bzw. Faktoren in beliebige Reihenfolge bringen, ohne dass sich an der Summe, bzw. dem Produkt etwas ändert. Z.B. ist abcd = cadb. Im nächsten Kapitel wirst Du Rechenbereiche kennenlernen, wo die Multiplikation zwar assoziativ, aber nicht kommutativ ist. Aus dem Distributivitätsgesetz, sowie der Kommutativität und Assoziativität der Addition und Multiplikation kannst Du folgern, dass (a0 + a1 + · · · + am )(b0 + b1 + · · · + bn ) gleich der Summe über folgende Produkte (in beliebiger Reihenfolge) ist a0 b 0 a1 b 0 a2 b 0 a3 b 0 a4 b 0 a5 b 0 .. . a0 b 1 a1 b 1 a2 b 1 a3 b 1 a4 b 1 a5 b 1 .. . a0 b 2 a1 b 2 a2 b 2 a3 b 2 a4 b 2 a5 b 2 .. . a0 b 3 a1 b 3 a2 b 3 a3 b 3 a4 b 3 a5 b 3 .. . a0 b 4 a1 b 4 a2 b 4 a3 b 4 a4 b 4 a5 b 4 .. . a0 b 5 a1 b 5 a2 b 5 a3 b 5 a4 b 5 a5 b 5 .. . ··· ··· ··· ··· ··· ··· .. . a0 b n a1 b n a2 b n a3 b n a4 b n a5 b n .. . am b 0 am b 1 am b 2 am b 3 am b 4 am b 5 · · · am b n Merke Dir dieses Schema und erinnere Dich daran, wenn es im Abschnitt 4.5 um Produkte unendlicher Summen geht! 1.1.5 Die Zahlen 0 und 1 spielen für die Addition, bzw. Multiplikation eine Sonderrolle: (2) 0 + n = n , 1n = n Man nennt die 0 ein neutrales Element für die Addition und die 1 ein solches für die Multiplikation. 1.1.6 Du kennst sicher bereits größere Zahlbereiche als den der natürlichen Zahlen, nämlich den der ganzen, den der rationalen und den der reellen Zahlen. In allen diesen gelten die Gesetze (1) aus 1.1.4, und auch dort sind die Zahlen 0, bzw. 1 die neutralen Elemente für die Addition, bzw. die Multiplikation. 1.1.7 Man kann natürliche Zahlen der Größe nach vergleichen. Genau dann gilt a ≤ b in N, wenn es ein a0 ∈ N gibt mit a + a0 = b. Für die Relation ‘≤’ in N gelten folgende grundlegenden Regeln: 12 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN a ≤ a; a ≤ b, b ≤ c ⇒ a ≤ c; a ≤ b, b ≤ a ⇒ a = b; für je zwei natürliche Zahlen a, b ist a ≤ b oder b ≤ a. a ≤ b ⇒ a + c ≤ b + c; a ≤ b ⇒ ac ≤ bc. Beachte, dass für eine negative Zahl c (die es in N nicht gibt) die letzte Regel falsch ist. Ausgehend von ‘≤’ kann man ‘<’ durch a < b ⇐⇒ a ≤ b und a 6= b definieren. (Um deutlich zu machen, dass a < b durch [a ≤ b und a 6= b] definiert werden soll, schreibt man auch einen Doppelpunkt vor das Zeichen ⇐⇒ , also a < b : ⇐⇒ [a ≤ b und a 6= b]. Hier, wie oben sind die Klammern [, ] logische Klammern.) Natürlich soll a > b dasselbe wie b < a bedeuten und a ≥ b dasselbe wie b ≤ a. Was bedeuten die Zeichen ‘=⇒’ und ‘ ⇐⇒ ’ ? Für zwei Aussagen A, B bedeutet A =⇒ B eine der folgenden untereinander äquivalenten Aussagen: wenn A gilt, dann gilt auch B“ ” aus A folgt B“ ” A ist eine hinreichende Bedingung für B“ ” B ist eine notwendige Bedingung für A“ ” Man sagt dazu auch: A impliziert B“. ” Die Aussage A ⇐⇒ B bedeutet, dass sowohl A =⇒ B als auch B =⇒ A erfüllt ist. Man sagt in diesem Fall auch: A gilt genau dann (dann und nur dann), wenn B gilt. Ebenso sagt man in diesem Fall auch: Die Aussagen A und B sind äquivalent. Häufig wird =⇒ mit ⇐⇒ verwechselt! Betrachte die Aussagen: Wenn heute Fronleichnam ist, ist heute Donnerstag. Bzw. Wenn heute Donnerstag ist, ist heute Fronleichnam. Kein Mensch wird auf die Idee kommen, dass aus dem ersten dieser beiden Sätze der zweite folgt, da ja jeder weiß, dass es viele Donnerstage gibt, an denen nicht Fronleichnam ist. Aber in der Mathematik sind die Verhältnisse oft weniger leicht zu durchschauen. Angenommen, Du hast folgenden (richtigen) Satz bewiesen: Wenn eine differenzierbare Funktion f (auf einem offenen Intervall) im Punkt x0 einen (lokalen) Extremwert hat, so ist f 0 (x0 ) = 0. Vielleicht möchtest Du daraus schließen: Wenn f 0 (x0 ) = 0 ist, so hat f in x0 einen Extremwert. Das wäre aber ein falscher Schluss, wie Du an dem Beispiel f (x) = x3 mit x0 = 0 siehst. 1.2. PRIMZAHLEN 13 Dieses Beispiel springt aber nicht von selbst ins Auge, wie das der Donnerstage, an denen nicht Fronleichnam ist. Du darfst nie meinen, mit A ⇒ B hättest Du auch B ⇒ A gezeigt. 1.1.8 Hat man endlich viele natürliche (auch ganze, rationale oder reelle) Zahlen a1 , a2 , . . . , an (mit n > 0) vorgegeben, so gibt es unter diesen eine kleinste und eine größte. Das ist Dir vermutlich klar. (Ein formaler Beweis würde mit vollständiger Induktion, die später behandelt wird, argumentieren.) Darüber hinaus gilt folgende Aussage: Ist M irgendeine Menge natürlicher Zahlen, die auch aus unendlich vielen Zahlen bestehen darf und mindestens eine Zahl enthält, so gibt es unter den Zahlen aus M eine kleinste. Ist nämlich a eine Zahl aus M , so gibt es höchstens a + 1 natürliche Zahlen aus M , die ≤ a sind. Die kleinste unter diesen ist auch die kleinste Zahl von M . Beispiel: Die kleinste Zahl aus der Menge derjenigen natürlichen Zahlen, die nicht als Summe von drei Quadraten natürlicher Zahlen geschrieben werden können, ist die 7. (02 ist dabei als Quadrat der natürlichen Zahl 0 zugelassen.) 1.1.9 Erstaunlicher Weise gibt es über die natürlichen Zahlen eine reichhaltige Theorie, die so genannte Zahlentheorie. Einer ihrer wundervollen Sätze ist, dass jede natürliche Zahl sich als Summe von 4 Quadratzahlen schreiben lässt. Z.B. ist 103 = 12 + 22 + 72 + 72 und 3 = 02 + 12 + 12 + 12 . Schreibe 63 als Summe von 4 Quadraten. Noch erstaunlicher ist vielleicht die Tatsache, dass es Anwendungen der Zahlentheorie für die Geschäftswelt gibt. Die besten Verschlüsselungen von Zahlen oder Texten beruhen auf (einfachen) zahlentheoretischen Erkenntnissen. Am Schluss dieses Buches, will ich Dir hierüber etwas erzählen. 1.2 Primzahlen 1.2.1 Frage: Gibt es (vielleicht sehr große) natürliche Zahlen m, n > 0, derart, dass 18m = 20n ist? Damit Du diese Frage beantworten kannst, will ich ein wenig auf die so genannten Primzahlen eingehen. Eine Primzahl ist eine natürliche Zahl > 1, die sich nur auf triviale Weise als Produkt zweier natürlicher Zahlen darstellen lässt, d.h. wo einer der Faktoren 1 ist. Primzahlen sind: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, . . . Achtung: 2 ist eine Primzahl, 1 nicht! Es gelten folgende zwei Aussagen: 1. Jede natürliche Zahl > 1 ist ein Produkt von Primzahlen, wobei auch Produkte von nur einem Faktor zugelassen sind. 14 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Z.B. 24 = 2 · 2 · 2 · 3, 25 = 5 · 5, 23 = 23. (Sähe man 2 nicht als Primzahl an, wie könnte man 24 in Primfaktoren zerlegen?) 2. Die Zerlegung einer natürlichen Zahl > 1 in Primfaktoren ist bis auf deren Reihenfolge eindeutig. (Beachte: Wenn man die 1 als eine Primzahl ansähe, wäre diese Aussage falsch! Es ist 6 = 2 · 3 = 1 · 2 · 3 = 1 · 1 · 2 · 3 usw.) Z.B. Seien m, n natürliche Zahlen 6= 0 so ist immer 17m 6= 19n . Zeige das Entsprechende für 18m und 20n . Ich vermag jedem zuzustimmen, der die Aussage 1. für selbstverständlich hält. Bei der Aussage 2. fällt mir das schon schwerer. Z.B. halte ich es gar nicht für selbstverständlich, dass für von 0 verschiedene natürliche Zahlen m, n immer 17m 6= 19n ist. Ein weiteres Argument dafür, dass die Aussage 2. eines Beweises bedarf, erhält man, wenn man Produkt-Zerlegungen nur im Bereich der natürlichen Zahlen n ≥ 3 betrachtet. Weder 4 noch 8 lassen sich zerlegen, wenn man den Faktor 2 nicht zulässt. Sie sind also in diesem Teilbereich der natürlichen Zahlen unzerlegbar, sozusagen (in diesem Bereich) ‘Primzahlen’. Für diese gilt aber 4 · 4 · 4 = 8 · 8. Ich gebe im Folgenden einen Beweis der Eindeutigkeit der Primfaktorzerlegung, d.h. der Aussage 2. Er ist fast wörtlich derjenige, den Gauß in seinen Disquisitiones Arithmeticae gegeben hat. Ich glaube, dass ein junger Mensch mit geringen Grundkenntnissen keinen verständlicheren Beweis finden wird. Beweis der Eindeutigkeit der Primfaktorzerlegung nach Gauß. Erinnere dich an die sogenannte Division mit Rest, z.B. 16 : 6 = 2 Rest 4 Überraschender Weise spielt diese eine große Rolle in der Mathematik. Wir wollen allerdings die angegebene ‘Gleichung’ (deren rechte Seite eigentlich keinen Sinn hat) folgendermaßen als echte Gleichung schreiben 16 = 2 · 6 + 4 (oder auch 16 − 2 · 6 = 4) Allgemein gibt es zu je zwei natürlichen Zahlen a, b mit b 6= 0 weitere natürliche Zahlen q, r (denke an Quotient und Rest), so dass zweierlei gilt a = qb + r und 0 ≤ r < b . Wenn Du dies genauer einsehen (und nicht einfach Deiner Rechenerfahrung entnehmen) willst, kannst Du nacheinander die immer kleiner werdenden Zahlen a − 0 · b, a − 1 · b, a − 2 · b, . . . betrachten. Die erste Zahl q für die a − qb < b ist, ist das gesuchte q, und r = a − qb ist dann das gesuchte r. Du wirst bald einen Beweis mit Hilfe der sogenannten vollständigen Induktion kennen lernen. 1.2. PRIMZAHLEN 15 Lemma 1.2.2 Seien p eine Primzahl und a, b von 0 verschiedene natürliche Zahlen, die kleiner als p sind. Dann kann p kein Teiler von ab sein. (Die Bezeichnung ‘Lemma’ wird meist im Sinne von ‘Hilfssatz’ benutzt.) (Beachte dass die Voraussetzung a, b < p die Beziehung ab > p nicht ausschließt. Es ist ja 2 · 3 > 5.) Beweis: Angenommen p wäre ein Teiler von ab. D.h. b gehörte zur Menge aller von 0 verschiedenen natürlichen Zahlen x < p, für die p ein Teiler von ax ist. Sei dann c die kleinste unter diesen Zahlen x. Dabei kann c = b, aber auch c < b sein. Jedenfalls ist 1 < c < p. (Die Beziehung 1 < c gilt, da p kein Teiler von a · 1 ist.) Dividiere p durch c mit Rest, d.h. finde natürliche Zahlen q, γ mit p = qc + γ und γ < c. Da p prim und 1 < c < p ist, kann c kein Teiler von p und folglich γ nicht gleich 0 sein. Es ist aber p ein Teiler von aγ = ap − qac, da p sowohl ap wie qac teilt. Die ist ein Widerspruch zur Minimalität von c, der aus der Annahme, p sei ein Teiler von ab, folgt. Diese Annahme kann also nicht wahr sein. Folgerung 1.2.3 (Euklids Lemma.) Ist p eine Primzahl und ein Teiler von ab, wo a, b natürliche Zahlen sind. Dann ist p ein Teiler (mindestens) einer der Zahlen a, b. Beweis: Nimm an, p wäre weder ein Teiler von a noch von b. Dann dividiere a und b durch p mit Rest: a = pq1 + α, b = pq2 + β mit 1 ≤ α < p, 1 ≤ β < p. Es folgt, dass p ein Teiler von αβ = (a − pq1 )(b − pq2 ) = ab − pq1 b − pq2 a + p2 q1 q2 ist. Dies widerspricht Lemma 1.2.2, da α, β < p sind. Folgerung 1.2.4 Ist eine Primzahl Teiler eines Produkts a1 · · · am natürlicher Zahlen, so teilt sie einen der Faktoren. Theorem 1.2.5 Sei eine ganze Zahl > 1 wie folgt auf zwei Weisen in Primfaktoren zerlegt: p 1 · · · p r = q1 · · · q s Dann stehen links und rechts dieselben Primfaktoren, und zwar auch jeder Primfaktor gleich oft. Beweis: Offenbar gilt: Ist eine Primzahl p Teiler einer Primzahl q, so muss p = q sein. Da nach der letzten Folgerung jedes pi eines der qj teilt und umgekehrt, müssen rechts und links dieselben Primzahlen stehen, allenfalls noch verschieden oft. Ist ein Primfaktor p auf der rechten Seite m-mal und auf der linken Seite n-mal vertreten und etwa n ≤ m, so dividiere auf beiden Seiten durch pn . Dann taucht p links nicht mehr und rechts (m − n)-mal auf. Das geht aber nur, wenn m − n = 0 ist. 16 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN 1.2.6 Frage: Wieviele Primzahlen gibt es? Betrachte dazu folgende Aussagen. Welche ist schlüssig? Je weiter man in der Reihe der natürlichen Zahlenreihe fortschreitet, um so seltener werden die Primzahlen. Irgendwann muss ihre Folge aufhören. Folglich gibt es nur endlich viele Primzahlen. Aus obiger Aussage über die abnehmende Häufigkeit der Primzahlen kann man nicht schließen, dass es nur endlich viele Primzahlen gibt. Auch die unendlich vielen Quadratzahlen 1, 4, 9, 16, 25 usw. werden ja immer seltener. Euklid wusste bereits: Zu je endlich vielen Primzahlen p1 , p2 . . . . , pn gibt es immer noch eine weitere. Euklid hat aus p1 , . . . , pn auf einfachste Weise eine Zahl N > 1 gebildet, die durch keine der Primzahlen p1 , . . . , pn teilbar ist. Jeder der Primfaktoren von N ist also von den p1 , . . . , pn verschieden. Überlege Dir: Kann die Zahl 2 · 3 · 5 + 1 durch eine der Primzahlen 2, 3, 5 teilbar sein? Nun 3 zum Beispiel ist ja ein Teiler von 2 · 3 · 5, aber nicht von 1. Wäre 3 ein Teiler der Summe 2 · 3 · 5 + 1, so wäre 3 auch einer von (2 · 3 · 5 + 1) − 2 · 3 · 5 = 1. Ebensowenig sind 2 und 5 Teiler von 2 · 3 · 5 + 1. Allgemein seien p1 , p2 , . . . , pn endlich viele Primzahlen, so kann keine von ihnen ein Teiler der Zahl N = p1 · p2 · · · pn + 1 sein. Da N > 1 ist, hat N mindestens einen Primfaktor p, der aber von den Primzahlen p1 , p2 , . . . , pn verschieden sein muss. 1.2.7 Erstaunlicher Weise kann man mit fast demselben Verfahren beweisen, dass die Lücken zwischen aufeinander folgenden Primzahlen beliebig groß sein können. Seien nämlich p1 = 2, p2 = 3, . . . , pn , pn+1 die ersten (d.h. kleinsten) n + 1 Primzahlen (und n ≥ 1), und sei m = p1 p2 · · · pn . Wir haben ja soeben gelernt, dass m + 1 durch keine der Primzahlen p1 , . . . , pn teilbar ist. Aber im Gegensatz dazu ist jede der Zahlen m + 2, m + 3, m + 4, . . . , m + pn+1 − 1 durch eine der Primzahlen p1 , . . . , pn teilbar. Es ist ja m + 2 durch 2 teilbar, m + 3 durch 3, m + 4 durch 2, und so weiter. Keine der Zahlen m + 2, . . . , m + pn+1 − 1 kann also eine Primzahl sein. (Im obigen Beispiel ist m = 30 und m + 2 durch 2, und m + 3 durch 3, und m + 4 durch 2, ferner m + 5 durch 5 und schließlich m + 6 durch 2 (auch durch 3) teilbar.) Beispiel 1.2.8 In obigem Beispiel ist 2 · 3 · 5 + 1 = 31 wieder eine Primzahl. Das muss nicht immer so sein: 2 · 3 · 5 · 7 · 11 · 13 + 1 = 30031 = 59 · 509. Man prüft leicht nach, dass 59 und 509 Primzahlen sind. Und sie sind – wie es sich gehört – von den Primzahlen 2, 3, 5, 7, 11, 13 verschieden. Wir haben uns überlegt, dass die Zahlen 30032, 30033, . . . , 30046 alle keine Primzahlen sind. In der Tat sind (gemäß einer Primzahltafel) die Zahlen 30029 und 30047 Primzahlen, zwischen denen es keine weiteren gibt. 1.2. PRIMZAHLEN 17 Bemerkung 1.2.9 Jede natürliche Zahl erhält man, indem man zur 0 eine gewisse Anzahl von 1-en addiert: 0 + 1 + 1 + ··· + 1 In Bezug auf die Multiplikation gilt etwas analoges jedenfalls für die von 0 verschiedenen natürlichen Zahlen. Nämlich man erhält jede solche Zahl, indem man 1 mit einer gewissen Anzahl von Primzahlen multipliziert: 1 · p1 · p2 · · · pn Die Primzahlen spielen also für die Multiplikation dieselbe Rolle wie die 1 für die Addition. Die 0 für die Addition entspricht der 1 für die Multiplikation, die man deshalb nicht als Primzahl ansieht. (Der Zahl m = 1 · p1 · p2 · · · pn kommt man von 1 · p1 · · · pk aus, wo k < n ist, durch die Multiplikation mit pk+1 einen Schritt näher. Das wäre nicht so, wenn man die 1 als Primzahl auffasste und pk+1 = 1 wäre!) Bezeichnung: Die Menge (Gesamtheit) der Primzahlen wird mit P bezeichnet. 1.2.10 Wozu sind Primzahlen gut? Nachdem man mindestens 24 Jahrhunderte lang Primzahlen fast nur als interessante Objekte der ‘reinen’ Mathematik angesehen hat (es gibt ein etwa 1000 Seiten dickes Buch über Primzahlen), haben Mathematiker und Informatiker vor einigen Jahrzehnten wichtige Verschlüsselungsmethoden erfunden, die Kenntnisse über Primzahlen verwenden. Angenommen, Du hast einen verschlüsselten Text und weißt, wie die Verschlüsselung vorgenommen wurde. Dann sollte man doch meinen, Du könntest den verschlüsselten Text auch wieder entschlüsseln. Dem ist nicht so! Was man bei kleinen natürlichen Zahlen noch nicht so richtig merkt, bei großen natürlichen Zahlen ist es ungeheuer mühsam, diese in Primfaktoren zu zerlegen. Ja, bei sehr großen Zahlen etwa mit 300 oder mehr Dezimalstellen ist es – außer in speziellen Fällen – schlechterdings auch mit Computer-Hilfe nicht möglich. (Es sei denn Du hättest einen Computer, der die Quantenstruktur der Materie ausnutzt, einen sogenannten Quantencomputer. Solche gibt es zwar der Idee nach, aber in der Realität noch nicht wirklich.) Ich muss gestehen, bislang ist es nur eine Erfahrungstatsache, dass man große Zahlen nur mit großem Aufwand in ihre Primfaktoren zerlegen kann. Mathematisch bewiesen ist es bis jetzt nicht. Andererseits kann man sehr wohl, von Zahlen der angegebenen Größenordnung mit ComputerHilfe in wenigen Sekunden oder Minuten feststellen, ob sie prim sind – ohne eine Faktorzerlegung im negativen Falle angeben zu können. Wie man das macht, kann ich leider im Rahmen dieses Buches nicht beschreiben. Auf Grund dieser Diskrepanz ist es möglich, Texte nach einem öffentlich gemachten Schlüssel zu verschlüsseln, die man ohne eine zusätzliche Information nicht mehr enschlüsseln kann. Wie dieses geht, erfährst Du ganz am Ende dieses Buches. 18 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN AUFGABEN 1. a) Zeige, dass jede natürliche Zahl n, die nicht durch 3 teilbar ist, sich in der Form n = 3m ± 1 mit einem geeigneten m ∈ N schreiben lässt. b) Welche Primzahlen p haben die Eigenschaft, dass auch 2p2 + 1 (bzw. p2 + 2) eine Primzahl ist? (Du kannst a) benützen.) 2. Zerlege 15! := 1 · 2 · 3 · · · 15 in Primfaktoren. 3. Finde zu jeder geraden Zahl n mit 4 ≤ n ≤ 50 Primzahlen p, q mit p + q = n. (Dabei darf p = q sein.) Leider weiß man bis heute nicht, ob dies für alle geraden Zahlen > 3 möglich ist. 4. Zeige: Eine ganze Zahl zwischen 8 und 120 (einschließlich) ist genau dann eine Primzahl, wenn sie durch keine der Zahlen 2, 3, 5 oder 7 teilbar ist. (Versuche, ein allgemeines Gesetz zu formulieren.) 5. 101 Senatoren wählen 2 Konsuln. Jeder wählt zwei (verschiedene) Kandidaten. (Enthaltung sowie die Wahl nur einer Person sind verboten.) Sind dann folgende Regeln oder auch nur eine von ihnen sinnvoll? a) ‘Gewählt ist, wer mindestens 51 Stimmen hat.’ b) ‘Wer im ersten Wahlgang weniger als 51 Stimmen bekommen hat, wird kein Konsul.’ 1.3 Potenzen mit natürlichen Exponenten 1.3.1 Potenzen: Bekanntlich definiert man an := a · · · a, wobei die Anzahl der Faktoren gleich n ist. Dies ist eine klare Definition, wenn n ≥ 2 ist. Und ich denke auch a1 = a ist dann klar. Wir haben ja bereits einmal ein Produkt aus nur einem Faktor anerkannt. Offenbar ist an+1 = an · a. Damit diese Regel auch für n = 0 gilt, muss man a0 = 1 setzen – jedenfalls wenn a 6= 0 ist. Es gibt gute Gründe, auch 00 = 1 zu definieren. Wir wollen dies so machen! (Erinnere Dich daran, dass in der Potenz an die Zahl a als die Basis, die Zahl n als der Exponent bezeichnet wird.) Für natürliche Zahlen a, b, m, n gelten, wie Du wahrscheinlich bereits weißt oder leicht siehst, folgende drei Gesetze (Regeln): am+n = am · an , (ab)n = an · bn , Diese Regeln kannst Du wie folgt einsehen: amn = (am )n 1.3. POTENZEN MIT NATÜRLICHEN EXPONENTEN 19 Wenn man ein Produkt aus m einander gleichen Faktoren a mit einem ebensolchen aus n Faktoren multipliziert, erhält man ein ebensolches Produkt aus m + n Faktoren. Ein Produkt aus n Faktoren der Form ab kann man durch Vertauschung der Faktoren als ein Produkt aus 2n Faktoren schreiben, derart dass die ersten n gleich a und die letzten n gleich b sind. Dabei benutzt man allerdings die Kommutativität der Multiplikation, während zur Gültigkeit der ersten Regel nur die Assoziativität gebraucht wird. Die dritte Regel kann man auf die erste zurückführen: amn = am+···+m = am · · · am = (am )n wobei im zweiten Term der Exponent die n-fache Summe von m ist und der dritte Term das nfache Produkt von am ist. Auch hier wird nur die Assoziativität und nicht die Kommutativität der Multiplikation gebraucht. Die ersten beiden Regeln entsprechen dem Distributivgesetz zwischen Multiplikation und Addition. Beachte aber, dass dabei die Basen und die Exponenten der Potenzen verschieden behandelt werden. 2 Aus dem dritten Gesetz folgt (23 )2 = 26 = 64, während = 2(3 ) = 29 = 512 ist! Potenzieren ist c c 2 nicht assoziativ! Beachte: Man definiert ab := a(b ) . Demgemäß ist 23 = 512. Achtung: In der Potenzrechnung sind ‘Gesetze’, die nur so ähnlich wie die obigen aussehen, meist falsch! 22+2 6= 22 + 22 , 23−2 6= 23 − 22 , (1 + 1)2 6= 12 + 12 , 22·3 6= 22 · 23 √ √ √ Mit Wurzeln muss man genauso vorsichtig umgehen: Berechne 9 + 16 und 9 + 16. Ebenso 1+1 1 1 2 2 muss man bei iterierten Potenzen aufpassen: Berechne 23 und 23 · 23 , ferner 23 · 23 und (23 · 23 )2 . 1.3.2 Wir studieren die Potenzen von 2, um uns einen Eindruck ihres Wachstums zu machen: 20 = 1, 21 = 2, 22 = 4, 23 = 8, . . . , 29 = 512, 210 = 1024, . . . . Wir wollen versuchen, diese in einem (Funktions)-Diagramm darzustellen, und zwar mit der Einheit 1 mm : Wandert man vom Nullpunkt aus auf der waagerechten Achse um 5 mm nach rechts, so müssen wir von dort um 32 mm nach oben gehen, um den Wert 25 = 32 abzutragen. 4 mm weiter müssen wir schon um 51,2 cm nach oben gehen. Der entsprechende Punkt passt nicht mehr auf die Buchseite. In einem Ballon, der 220 mm hoch über dem Meeresspiegel schwebt, können wir bequem den Kahlen Asten überqueren. Und 223 mm ist etwa die Höhe des Himalaja. Und ist man auf der x-Achse bei 39 mm angelangt, so ist der Punkt, der den Wert 239 beschreibt, schon weiter als der Mond entfernt! Man spricht von exponentiellem Wachstum. Wäre es nicht schön, 2x auch für nichtganze x definieren zu können? Man kann! Davon handelt das Kapitel 5. 20 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN 1.3.3 Fakultät Noch stärker wächst die Folge der n! (n-Fakultät). Dabei wird n! := 1 · 2 · 3 · · · n definiert. Offenbar ist n!(n + 1) = (n + 1)! . Damit dies auch für n = 0 gilt, setzt man 0! = 1. Berechne (3!) · (3!), (3 + 3)! und (3 · 3)! . (Bist Du zu faul zu rechnen, erkenne zumindest, dass (3!) · (3!) < (3 + 3)! < (3 · 3)! gilt. Welche der angegebenen Zahlen haben den Primfaktor 5, welche den Primfaktor 7?) Bemerkungen 1.3.4 a) Auch wenn n! für gar nicht so große Zahlen schon riesig ist, sind doch die Primfaktoren von n! nicht größer als n. Man kann verhältnismäßig leicht berechnen, wie oft eine Primzahl in der Primfaktorzerlegung von n! vorkommt. Davon später. b) Wäre es nicht schön, x! auch für nichtganze x definieren zu können? Man kann! Schlage unter dem Stichwort ‘Gamma-Funktion’ nach – etwa in der Wikipedia oder in Forsters Analysis I oder vielen anderen Texten. Die beiden Aussagen aus Abschnitt 1.2.1 über die Möglichkeit und Eindeutigkeit der Primfaktorzerlegung positiver ganzer Zahlen kann man auch folgendermaßen ausdrücken: Satz 1.3.5 Seien p1 , p2 , p3 , . . . die Primzahlen in ihrer natürlichen Reihenfolge, d.h. p1 = 2, p2 = 3, p3 = 5 usw. Jede natürliche Zahl n ≥ 1 lässt sich eindeutig als unendliches Potenzprodukt folgender Form schreiben: n = pa11 pa22 pa33 · · · Dabei sind die ai ∈ N, dürfen insbesondere 0 sein. Ja, bis auf endlich viele i sind alle ai = 0. Das Produkt hat dann unendlich viele Faktoren, die gleich 1 sind, und nur endlich viele Faktoren die von 1 verschieden sind. Wir geben diesem (unendlichen) Produkt einen Sinn, indem wir das Produkt unendlich vieler Einsen als 1 definieren. 1.3.6 Zum Beispiel wird der Zahl 24 auf diese Weise die Folge (3, 1, 0, 0, 0, . . .) zugeordnet und der Zahl 25 die Folge (0, 0, 2, 0, 0, 0, . . .), da einerseits 24 = 23 · 31 · 50 · 70 · 110 · · · und andererseits 25 = 20 · 30 · 52 · 70 · 110 . . . ist. Der Zahl 1 wird die Folge (0, 0, 0, . . .) zugeordnet In einem abstrakten Sinne gibt es also genau so viele Folgen der o.a. Art, wie natürliche Zahlen ≥ 1. Ist das nicht überraschend? (In diesem abstrakten Sinne, gibt es auch nicht mehr Brüche natürlicher Zahlen als natürliche Zahlen selbst. Versuche Dich an dieser Aussage! Sie wird im Kapitel 4 behandelt.) Wenn man eine natürliche Zahl als Potenzprodukt von Primzahlen, d.h. als eine gewisse Folge natürlicher Zahlen, auffasst, entspricht dem Produkt in N1 die Summe im Bereich der Folgen natürlicher Zahlen, wobei (a1 , a2 , a3 , . . .) + (b1 , b2 , b3 , . . .) := (a1 + b1 , a2 + b2 , a3 + b3 , . . .) 1.4. BRÜCHE 21 definiert ist. In einem abstrakten Sinn ist also die Multiplikation natürlicher Zahlen nicht viel komplizierter als ihre Addition. (Das hilft allerdings gar nichts, wenn man die Primfaktozerlegung der Faktoren nicht leicht berechnen kann.) Die Schwierigkeit und der Reiz der Zahlentheorie entstehen erst, wenn man Addition und Multiplikation zugleich betrachtet. 1.4 Brüche a Vorbemerkung: Brüche schreibe ich meist in der Form , gelegentlich aber auch in der Form b a/b. 1.4.1 Seien a, b, a0 , b0 natürliche Zahlen mit b, b0 6= 0. Dann gilt bekanntlich a a0 aa0 · 0 = 0 b b bb (1.1) (Formal kann man diese Regel als Definition ansehen. Aber wenn man von ihr verlangt, dass sie gewisse Anforderungen erfüllen soll, ergibt sie sich zwangsläufig, wie Du unten sehen wirst.) Warum soll dann eigentlich nicht auch a a0 a + a0 + 0 = gelten??? b b b + b0 (1.2) Wäre das jedoch richtig, so müsste auch 2 1 1 1 + = = gelten. 2 2 4 2 Nun soll aber die Zahl 1 2 doch gerade diejenige Zahl sein, für die 2· 1 1 1 = 1, d.h. + = 1 2 2 2 gilt. Die letzte oben vorgeschlagene ‘Regel’ ist also eine Unregel !!! 1.4.2 Wir betrachten Brüche als ‘Größen’. (Etwa als Längen von Strecken.) Der Bruch m als n ‘Größe’ hat folgende Bedeutung. Teile die (Maß-)Einheit in n gleiche Teile und nehme das m-fache eines solchen Teiles. Dabei ist natürlich m1 mit m zu identifizieren. m = 0 (für m 6= ∞) zu Bemerkung: Es ist nicht völlig unsinnig, m0 = ∞ (für m 6= 0) und ∞ setzen. In gewissen Zusammenhängen wird das auch gemacht. Aber den Ausdrücken 00 , ∞ , ∞ ∞−∞ kann man keine sinnvollen Bedeutungen geben. Wir wollen das hier nicht weiter vertiefen, sondern 0 als Nenner nicht zulassen! 22 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Aus der Vorstellung von m n als Größe entnimmt man m km = falls k 6= 0. n kn D.h. man darf erweitern und kürzen (nicht mit 0). Am elegantesten definiert man die Gleichheit von Brüchen durch m m0 = 0 ⇐⇒ mn0 = m0 n. n n 0 Dies ist äquivalent dazu, dass man mit Erweitern und Kürzen von m zu m kommt. (Beweise n n0 das!) 0 1.4.3 Aus der Größenvorstellung ergibt sich auch sofort, wie man Brüche m addiert. und m n n0 Ist n = n0 , so sollte m m0 m + m0 + = (1.3) n n n sein. Andernfalls kann man durch Erweitern erreichen, dass die Nenner gleich werden. Man bekommt so die Regel mn0 + m0 n m m0 + 0 = (1.4) n n nn0 Einfacher ist eine allgemeine Formel für die Addition von Brüchen nicht zu haben! (In der Schule hast Du vielleicht keine Formel, sondern folgendes Verfahren zur Berechnung der Summe zweier Brüche kennengelernt: Bestimme den kleinsten gemeinsamen Nenner der Brüche, d.h. das kleinste gemeinsame Vielfache k von n und n0 , erweitere beide Brüche so, dass k ihr Nenner wird und addiere dann gemäß 1.3. Wenn n und n0 nicht teilerfremd sind, bedeutet dies, dass man mit kleineren Zahlen rechnen kann als nach Formel 1.4. Allerdings ist auch dann nicht garantiert, dass das Ergebnis bereits gekürzt ist. Beispiel: 13 + 16 = 12 . 0 1 3 1 2 2 3 1 Da wird der Physiker doch sagen: Da nehm ich meinen Taschenrechner, rechne m/n und m0 /n0 als Dezimalzahlen aus und addiere diese dann mit dem Rechner. Dagegen ist auch nichts zu sagen. Aber wenn er etwa x x3 + x2 + 1 x2 + 5 auf einen Bruchstrich bringen soll, so muss er es ganz genau so wie mit Brüchen von Zahlen machen. Schön, wenn er dann weiß, wie’s geht! 1.4.4 Die Definition (1.1) des Produktes zweier Brüche wollen wir auch geometrisch begründen: Wenn man ein Rechteck mit den Seitenlängen 1/3, bzw. 1/5 Meter hat, so kann man es 15-mal in einem Quadrat, dessen Seiten 1 m lang sind, unterbringen. Es ist also 1/15 m2 groß. Ein Rechteck mit den Seitenlängen 2/3 und 4/5 Meter ist dann (2 · 4)/15 m2 groß. 1.5. NEGATIVE ZAHLEN 23 1.4.5 Ist a durch b in N (oder Z) teilbar, so ist natürlich beim Teilen durch b wird. a b gleich der ganzen Zahl, die aus a 1.4.6 Für den Größenvergleich von Brüchen (mit positiven Nennern) gilt: m m0 < ⇐⇒ m < m0 n n 1 1 Wann ist also < 0 ? n n und allgemein m m0 < 0 ⇐⇒ mn0 < m0 n n n 1.4.7 Für die Addition und Multiplikation von Brüchen gelten dieselben grundlegenden Gesetze wie bei den natürlichen Zahlen: Assoziativität, Kommutativität, Distributivität, Existenz neutraler Elemente. Dies kannst Du leicht nachprüfen, d.h. auf die entsprechenden Gesetze für die natürlichen Zahlen zurückführen – wenn es auch bei der Assoziativität der Addition und der Distributivität etwas dauern mag. 1.5 Negative Zahlen 1.5.1 Im Bereich der natürlichen Zahlen kann man die Gleichung x + n = m genau dann nach x auflösen, wenn n ≤ m ist. Es gibt dann genau eine natürliche Zahl d mit d + n = m. Diese Zahl d wird mit m − n bezeichnet. Dasselbe gilt für den Bereich der ‘nichtnegativen rationalen Zahlen, d.h. der Brüche natürlicher Zahlen’, die wir bis jetzt betrachtet haben. Die Erweiterung dieser Bereiche um die sogenannten negativen Zahlen erlaubt es, obige Gleichung immer zu lösen. Die moderne Mathematik kann nicht auf negative Zahlen verzichten, z.B. um die Punkte einer Ebene mit Koordinaten zu beschreiben. Bis jetzt haben wir natürliche Zahlen und Brüche von solchen betrachtet. Zu jedem Bruch, bzw. jeder natürlichen Zahl q 6= 0 erfinden wir einen ‘entgegengesetzten’ Bruch, bzw. ’entgegengesetzte’ ganze Zahl −q. Ferner sei −0 = 0. Zusammen mit den nichtnegativen Brüchen, bzw. natürlichen Zahlen ergeben sie die rationalen Zahlen, bzw. die ganzen Zahlen. Bezeichnungen: Z bezeichnet die Menge der ganzen Zahlen, Q die der rationalen Zahlen. 1.5.2 Geometrisch stellen wir uns die ganzen, bzw. rationalen Zahlen als Punkte auf einer Geraden vor. Auf ihr ist ein Punkt als 0 (Nullpunkt) ausgezeichnet. Rechts von ihm liegen die positiven Zahlen, insbesondere die 1, links von ihm die negativen Zahlen. Insbesondere sind die Abstände aufeinanderfolgender ganzer Zahlen einander gleich. (Manchmal betrachtet man ja auch einen logarithmischen Maßstab, hier nicht.) Wir sprechen von einer Zahlengeraden. Allerdings werden wir bald sehen, dass man auf geometrische Weise Punkte auf ihr konstruieren kann, die keiner rationalen Zahl entsprechen! (Die Worte ‘rechts, links’ haben einen Sinn, wenn die Gerade in einem Buch oder auf einer Tafel gezeichnet ist, wo die Richtungen ‘oben, unten’ ausgezeichnet sind und klar ist, von wo man guckt.) 24 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN 1.5.3 Wenn wir die nichtnegativen rationalen Zahlen durch die negativen rationalen Zahlen – und damit auch die natürlichen Zahlen durch die negativen ganzen Zahlen – ergänzt haben, gibt zu jeder rationalen Zahl r ein sogenanntes additiv Inverses −r = (−r). Dieses ist bestimmt durch die Eigenschaft r + (−r) = (−r) + r = 0. Damit ist offenbar r auch ein additiv Inverses von (−r), d.h. −(−r) = r. Wenn man bereits negative Zahlen, also auch zu jeder Zahl ein additiv Inverses hat, braucht man formal den Begriff einer Differenz nicht mehr. Statt a − b kann man ja a + (−b) schreiben. Unter a − b − c + d versteht man a + (−b) + (−c) + d, etc. 1.5.4 Anordnung der rationalen Zahlen. Bezeichne mit Q+ die Menge derjengen rationalen Zahlen, die als Brüche natürlicher Zahlen geschrieben werden können. Wir wollen die Zahl 0 = 10 mit einschließen. (Mit Q− sei dann die Menge aller −a, für die a in Q+ liegt, bezeichnet.) Die Ungleichung a ≥ b für a, b ∈ Q wird dann durch a − b ∈ Q+ definiert. Geometrisch bedeutet das, dass a rechts von b liegt oder mit b übereinstimmt. 1.5.5 Ein paar Aufgaben zu Brüchen a) Berechne 1 1 − , 2 3 1 1 − , 3 4 1 1 − . n n+1 Das Ergebnis der ersten Differenz hast Du oben bereits geometrisch gesehen. b) Berechne damit 1 1 1 + + ··· + . 1·2 2·3 n(n + 1) c) Zeige: 1 1 1 1 + 2 + 2 + · · · + 2 < 2, 2 1 2 3 n sowie 1 1 1 1 1 + + + + ··· + < 3. 0! 1! 2! 3! n! 1.5.6 Für ganze Zahlen m ≤ n definiert man n X ak := am + am+1 + · · · + an , insbesondere k=m k=m (Ist m > n so setzt man m X n X ak = 0. ) k=m Schreibe obige Summen in dieser Form. ak = am 1.5. NEGATIVE ZAHLEN 25 1.5.7 Seien a, b positive rationale Zahlen. Warum ist eigentlich (−a)(−b) = ab? Die richtige Frage ist: Warum definiert man dies so?“ Nun, wenn man naheliegender Weise ” (−a)0 = 0 und (−a)b = −(ab) definiert, und das Distributivgesetz weiter gelten soll, so ist einerseits (−a)(b + (−b)) = (−a)0 = 0, andererseits (−a)(b + (−b)) = (−a)b + (−a)(−b) = −(ab) + (−a)(−b). Also ist (−a)(−b) das additiv Inverse von −(ab), also gleich ab. Im nächsten Kapitel findest Du hierzu mehr. Wir lassen auch Brüche m n zu, wo m oder n negativ sind. Dafür gelten die Regeln m m −m m −m = = − und = n −n n −n n 1.5.8 Hier ein Beispiel für den Nutzen negativer Zahlen. Die Gleichung x2 + 312 = 37x hat die Lösungen 13 und 24, wie man leicht durch Rechnen in N, also im Positiven nachprüft. Das bekannte Lösungsverfahren – mit quadratischer Ergänzung – benutzt jedoch mit Gewinn das Rechnen mit negativen Zahlen. An diesem Beispiel sieht man auch, wie richtig und wichtig es ist, das Produkt negativer Zahlen so zu definieren, dass z.B. (−37)2 = 372 ist. 1.5.9 Der Satz über die Eindeutigkeit der Primfaktorzerlegung ist nicht nur für Bereich der ganzen Zahlen von Bedeutung. Aus ihm folgt z.B., dass es keine rationale Zahl gibt, deren Quadrat (2-te Potenz) gleich 5 ist. Das heißt, dass sich die Länge der Hypotenuse eines rechtwinkligen Dreiecks dessen Katheten 1, bzw. 2 Fuß lang sind, sich zu 1 Fuß nicht wie m : n mit – wie auch immer gewählten – natürlichen Zahlen m, n verhält. √ Wenn Du mit einem Taschenrechner 5 = 2,2360679 ausrechnest und das Ergebnis quadrierst, so erhältst Du 4,99999965341041, eine Zahl, die zwar ziemlich nahe bei 5 liegt, aber doch nicht exakt gleich √ 5 ist. Der Praktiker sagt – völlig zu Recht – ”Wenn Euch das noch nicht genügt, genauer ausrechnen“. Aber uns Theoretiker könnt ihr 5 mit einem Computer noch etwas √ interessiert nun einfach die Tatsache, dass man 5 durch einen endlichen (d.h. nach endlich √ vielen Stellen abbrechenden) Dezimalbruch niemals völlig genau ausdrücken kann, ja dass 5 überhaupt kein Bruch ganzer Zahlen ist. (Abbrechende Dezimalbrüche lassen sich ja als Brüche mit ganzem Zähler und ganzem Nenner schreiben, nicht wahr? Umgekehrt lassen sich allerdings sehr viele Brüche ganzer Zahlen nicht als abbrechende Dezimalbrüche schreiben! Immerhin gibt es in diesem Fall eine Periodizität.) Satz 1.5.10 Es gibt keine ganzen Zahlen m, n mit m 2 n = 5. m 2 Beweis: 5 ist sicher nicht das Quadrat einer ganzen Zahl. Wenn also = 5 mit teilern fremden m, n und n > 0 ist, so muss n > 1 sein. Wir zerlegen m und n in Primfaktoren: m p1 · · · pr = , n q1 · · · q s 26 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN wobei s ≥ 1 und wegen der Teilerfremdheit pi 6= qj für alle i, j ist. Durch Quadrieren erhält man den Bruch p21 · · · p2r . q12 · · · qs2 Neue Primzahlen treten nicht auf! Wegen der Eindeutigkeit der Primfaktorzerlegung kann man hier sowenig kürzen wie vor dem Quadrieren. Der Bruch kann also keine ganze Zahl, also insbesondere nicht gleich 5 sein. Dem Beweis siehst Du sicher an, dass man in ihm die Zahl 5 ohne weiteres durch die Zahl 2 ersetzen kann. Ja, es gilt ganz allgemein: Satz 1.5.11 Seien n, r natürliche Zahlen und r ≥ 2. Wenn n keine r-te Potenz einer ganzen Zahl ist, kann n auch nicht die r-te Potenz einer rationalen Zahl sein. Noch allgemeiner ist die Behauptung in Aufgabe 13. 1.5.12 Das Folgende darfst Du erst einmal überschlagen. Wir wollen die Primfaktorzerlegung von n! bestimmen. Dazu treffe ich folgende Definitionen: Sei n eine ganze Zahl 6= 0 und p eine Primzahl. vp (n) bezeichne die Anzahl der Primfaktoren von n, die gleich p sind. Also ist z.B. v2 (24) = 3, v3 (24) = 1 und vp (24) = 0 für alle Primzahlen p 6= 2, 3. Man nennt vp (n) die Vielfachheit von p in n. Wir wollen eine Methode, vp (n!) zu berechnen, angeben. Gauß-Klammern. Für eine rationale 3 (oder reelle) Zahl a sei mit [a] die größte ganze Zahl 3 ≤ a bezeichnet, also z.B. 2 = 1, − 2 = −2 h i h i h i h i Behauptung: Es gilt vp (n!) = np + pn2 + pn3 + . . .. Ist m groß genug, wird pnm = 0. D.h. wir haben in Wahrheit eine Summe, in der nur endlich viele Summanden ungleich 0 sind. Eine solche Summe setzt man immer gleich der endlichen Summe ihrer von 0 verschiedenen Summanden. h i Beweis der Behauptung: Der Summand np zählt aus jedem der Faktoren 1, 2, . . . , n von h i n!, der durch p teilbar ist, genau einen Primfaktor p. Der Summand pn2 zählt aus jedem der h i Faktoren 1, 2, . . . , n, der durch p2 teilbar ist, einen zweiten Primfaktor p. Der Summand pn3 zählt aus jedem der Faktoren 1, 2, . . . , n, der durch p3 teilbar ist, einen dritten Primfaktor p. Und so weiter! Insgesamt hat man jeden Primfaktor von n!, der gleich p ist, genau einmal gezählt.– An dem speziellen Beispiel n = 13, p = 2 sei dieser Beweis noch einmal erläutert: Betrachte (∗) 13! = 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8 · 9 · 10 · 11 · 12 · 13 1.5. NEGATIVE ZAHLEN 27 13 Es ist = 6 die Anzahl der Faktoren, die durch 2 teilbar sind, d.h der Zahlen 2, 4, 6, 8, 10, 12 2 (Die anderen Faktoren haben nicht den Primfaktor 2). Aus den Zahlen 2, 4, 6, 8, 10, 12 zähle 13 ich mit = 6 zunächst nur je einmal den Primfaktor 2. Die Zahlen 2, 6, 10 sind damit 2 13 erledigt“, da sie den Primfaktor 2 nur einmal haben. = 3 ist die Anzahl der Faktoren ” 22 13 2 aus (∗), die durch 2 teilbar sind, d.h. der Zahlen 4, 8, 12. Aus diesen zähle ich mit =3 22 13 jetzt je einen zweiten Primfaktor 2. Es ist = 1. D.h. es gibt in (∗) genau einen Faktor, 23 13 3 nämlich 8, der durch 2 teilbar ist. Dessen ‘dritten’ Primfaktor 2 zähle ich mit 3 = 1. 2 13 Für k ≥ 4 ist k = 0 und es ist auch keiner der Faktoren aus (∗) durch 2k mit k ≥ 4 teilbar. 2 13 13 13 Die Summe + 2 + 3 = 6 + 3 + 1 zählt 2 2 2 aus den Zahlen 2, 4, 6, 8, 10, 12 je einmal den Primfaktor 2, dazu aus den Zahlen 4, 8, 12 je ein zweites Mal den Primfaktor 2 und dazu schließlich aus der Zahl 8 ein drittes Mal den Primfaktor 2. Ich hoffe, Du siehst, dass auf diese Weise jeder Primfaktor 2 in einer Primfaktorzerlegung aller Faktoren aus (∗) genau einmal erwischt wird. AUFGABEN 1. Löse die folgenden Gleichungen, oder zeige, dass es in dem einen oder anderen Fall nicht möglich ist: 4 2 − 16 + 76 3 3 = 1 , 1 7 1 = 1 3 − + 4 x 6 x 2. Zwei Menschen wandern einander auf einer geraden Straße entgegen. Der eine startet 23 km in A und wandert mit einer Geschwindigkeit von . Der zweite startet im 19,5 km 6 h entfernten B eine halbe Stunde später als der erste und wandert mit der Geschwindigkeit 21 km . Wann und wo treffen sich die beiden? 4 h 3. Seien p1 , . . . , pn verschiedene Primzahlen mit n ≥ 2. Zeige: Der Nenner von n X 1 a := p j=1 j in der gekürzten Form ist p1 · · · pn . (D.h. nach erfolgter Addition der auf den kleinsten gemeinsamen Nenner gebrachten Summanden kann man nicht kürzen.) Insbesondere gilt a∈ / Z. (Wenn Du die erste Aussage nicht sofort beweisen kannst, zeige zunächst die letzte. Ist p1 · · · pn−1 a ∈ Z?) 28 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN 4. Zeige: Für n ≥ 2 ist a := n X 1 keine ganze Zahl. (Tipp: Sei m das kleinste gemeinsame k k=2 Vielfache aller Nenner. Was gilt für am/2 ? Betrachte die größte 2-Potenz unter den Nennern.) n X 1 5. Zeige: Für n ≥ 2 ist a := keine ganze Zahl. k! k=2 6. Opa“, rief Peter Opapa! Wie alt wirst Du in 11 Tagen?“ ” ” Opa fühlte sich in seinem Mittagsnickerchen gestört und antwortete unwirsch: Na, das ” weißt Du doch! Sechsundsechzig.“ Aber Opa, weißt Du auch, was herauskommt, wenn man eins und zwei und drei und so ” weiter bis elf zusammenzählt?“ Na, lass mal sehen. Also elf mal zwölf, geteilt durch zwei macht sechsundsechzig, in der ” Tat.“ Siehst du? Aber Du solltest doch zusammenzählen und nicht malnehmen und teilen. ” Warum hast Du denn das gemacht?“ Um Zeit zu sparen. Sieh mal her! Ich denke mir die Zahlen von eins bis elf hingeschrieben, ” und dann noch einmal darunter in umgekehrter Reihenfolge: 1 2 3 4 5 6 7 8 9 10 11 11 10 9 8 7 6 5 4 3 2 1 Wenn du je zwei Zahlen, die übereinander stehen, zusammenzählst, was kommt dann heraus?“ Zwölf, Opa. Und zusammen bekomme ich elf mal zwölf. Dann muss ich aber noch durch ” zwei teilen,“ sprudelte Peter immer hastiger hervor weil ich ja jede Zahl zweimal hinge” schrieben habe. Toll!“ Da grinste der Opa, und Peter dachte: Opa ist ja wieder ganz wirsch. Na klar, wenn ” er mit seiner Mathe angeben kann!“ Mit dieser feinen psychologischen Erkenntnis lag er nicht ganz falsch. P Deine Aufgabe ist nun, für ganze Zahlen x, y mit x > y die Summe xk=y k in eine andere Form zu bringen! 7. Bestimme die Summe der ersten n ungeraden natürlichen Zahlen, d.h. n X (2k − 1) k=1 ◦ • ◦ ◦ ◦ • • • • ◦ ◦ ◦ ◦ ◦ • • • • • • • • • ◦ ◦ ◦ ◦ ◦ ◦ ◦ 1.5. NEGATIVE ZAHLEN 29 8. Seien a, b ganze Zahlen. Bestimme die (eindeutige) Lösung des folgenden linearen Gleichungssystems im Bereich Q der rationalen Zahlen. x+y =a x−y =b Offenbar ist die Lösung genau dann ganzzahlig, wenn entweder a und b beide gerade oder a und b beide ungerade sind. 9. Jede ganze Zahl ist trivialerweise eine Summe von zwei oder mehr aufeinander folgenden ganzen Zahlen. Z.B. ist 2 = −1+0+1+2 (und 0 =?). Hingegen ist nicht jede positive ganze Zahl eine Summe von zwei oder mehr aufeinanderfolgenden positiven ganzen Zahlen. Zum Beispiel sind 1, 2, 4, 8 nicht von dieser Art. Bestimme alle (positiven ganzen) Zahlen n, die sich als Summe von zwei oder mehr aufeinander folgenden positiven ganzen Zahlen schreiben lassen. P (Benutze die beiden vorangehenden Aufgaben! Da n = xk=y k = 21 (x + y)(x − y + 1) und x > y > 0 sein soll, kommt es darauf an, ob man 2n als Produkt eines geraden und eines ungeraden Faktors schreiben kann, die beide ≥ 2 sind, nicht wahr?) 10. Ebenfalls mit Aufgabe 7 und 8 kann man folgende Fragen beantworten: a) Welche ganzen Zahlen kann man als Differenz zweier Quadrate ganzer Zahlen schreiben? b) Kann eine Gleichung der Form x2 − y 2 = a mit festem a ∈ Z im Bereich der ganzen Zahlen unendlich viele Lösungen haben? Wie ist es im Bereich der reellen Zahlen? d) Welche ganzen Zahlen sind von der Form x2 + y 2 − z 2 (x, y, z ∈ Z) ? e) (Am 6. Dezember zu lösen.) Frau Nicole Niklas wurde von ihrem Sohn Kolja gefragt, wie alt sie sei. Aus verständlichen Gründen gab sie nur eine verschlüsselte Antwort: Wenn Du die vierte Potenz meines Alters von der vierten Potenz des Alters Deines Vaters Klaus abziehst, erhältst Du die Zahl 1606160. Wie alt sind Klaus uns Nicole Niklas? (Mit dem Alter ist jeweils eine ganze Anzahl von Jahren gemeint.) Natürlich darfst Du zur Lösung dieser Aufgabe einen Taschenrechner benutzen. Ein ziemlich primitiver reicht. a a 11. Vereinfache + . (k + 1)!(n − k − 1)! k!(n − k)! 12. Gib systematisch alle Tripel (a, b, c) ganzer Zahlen an, für die folgendes gilt: 0 < a ≤ b ≤ c und 1 1 1 + + ∈Z a b c 13. Seien a1 , . . . , an ganze Zahlen und x eine rationale Zahl mit xn +a1 xn−1 +· · ·+an−1 x+an = 0. Zeige, dass x ganz ist. (Wichtig ist dabei, dass der Koeffizient von xn gleich 1 ist. Im Bereich Z kann man ja nicht immer durch den Koeffizienten von xn dividieren!) mr 1 14. Sei n > 1 eine ganze Zahl und n = pm 1 · · · pr ihre Primfaktorzerlegung mit untereinander verschiedenen Primzahlen pi . Wieviele (positive) Teiler hat n? 30 1.6 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Vollständige Induktion 1.6.1 Ein sehr mächtiges Beweismittel für Aussagen, die man für alle natürlichen Zahlen beweisen möchte, ist die vollständige Induktion. Sei A(x) eine Aussage über natürliche Zahlen x mit folgenden beiden Eigenschaften: (i) (Induktionsanfang) A(0) ist richtig, (ii) (Induktionsschritt) für alle n ∈ N folgt A(n + 1) aus A(n). Dann gilt A(n) für alle n ∈ N. Denn angenommen, ich soll A(m) für ein beliebiges (festes) m beweisen. Wegen (i) gilt die Aussage A(0). Wegen (ii) folgt hieraus A(1); wieder wegen (ii) folgt (aus der letzten Aussage) A(2); wieder wegen (ii) folgt A(3); und so weiter, bis ich bei A(m) angelangt bin. Statt direkt A(n) für alle n zu zeigen, muss man nur für alle n die bedingte Aussage A(n) ⇒ A(n + 1) beweisen. Und das ist häufig einfacher. Der Name ‘Vollständige Induktion’ kommt folgendermaßen zustande: Ein Gesetz durch Induktion zu begründen, heißt, es aus Einzelfällen abzuleiten. So müssen es die Naturwissenschaftler tun. ‘Vollständige’ Induktion bedeutet, ein Gesetz zu beweisen, indem man es für jeden Einzelfall zeigt. (Allerdings lässt man das Wort ‘vollständig’ aus Faulheit meist weg.) Sollte Dir das Ganze etwas rätselhaft erscheinen, arbeite die folgenden Beispiele durch! Beispiele 1.6.2 a) Wir beweisen, dass n X 2k := 20 + 21 + · · · + 2n = 2n+1 − 1 ist. k=0 (Dies ist eine spezielle geometrische Reihe. Allgemeine geometrische Reihen werden später behandelt.) Induktionsanfang: n = 0. Wir müssen 0 X 2k = 20+1 − 1 beweisen. k=0 Nun, beide Seiten sind gleich 1. Induktionsschritt: Wir müssen n X k=0 k n+1 2 =2 − 1 =⇒ n+1 X k=0 2k = 2(n+1)+1 − 1 beweisen. 1.6. VOLLSTÄNDIGE INDUKTION D.h. wir müssen n+1 X k (n+1)+1 2 =2 −1 beweisen und dürfen dazu k=0 31 n X 2k = 2n+1 −1 voraussetzen. k=0 Aus letzterer Gleichung folgt n+1 X k=0 k 2 = n X 2k + 2n+1 = 2n+1 − 1 + 2n+1 = 2 · 2n+1 − 1 = 2n+1+1 − 1. k=0 b) Wir beweisen die ‘Bernoullische Ungleichung’ (1 + a)n ≥ 1 + na für alle natürliche Zahlen n und rationale a ≥ −1 . Der Induktionsanfang n = 0 ist klar. Wir beweisen die Ungleichung für n + 1 unter der Voraussetzung, dass sie für n gelte: (1 + a)n+1 = (1 + a)n (1 + a) ≥ (1 + na)(1 + a) = 1 + (n + 1)a + na2 ≥ 1 + (n + 1)a . Dabei haben wir benutzt, dass wegen der Voraussetzung (1 + a) ≥ 0 ist und dass a2 und n auch beide ≥ 0 sind. (Diese Ungleichung gilt natürlich auch für beliebige reelle Zahlen a ≥ −1. Sie gilt auch für reelle Exponenten, die ≥ 1 oder ≤ 0 sind. Falls a ≥ −1 und 0 < r < 1 ist, gilt (1 + a)r ≤ 1 + ra.) c) Eine hübsche Anwendung des Induktionsprinzips ist der Beweis, dass man in dem – im folgenden beschriebenen – Spiel (Puzzle) der Türme von Hanoi“ (Lucas) immer zum Ziele ” kommen kann. Das Spiel besteht aus einem Stapel von n kreisrunden Scheiben, die gleich dick sind, aber paarweise verschiedene Durchmesser haben. Sie liegen der Größe nach aufeinander, die größte Scheibe unten, auf einem von 3 Spielfeldern. Die Aufgabe ist nun, diesen Stapel in mehreren Schritten auf ein anderes der drei Spielfelder auf folgende Weise zu bringen: Bei jedem Schritt ist eine Scheibe auf ein anderes Spielfeld bzw. auf einen dort bereits befindlichen Stapel zu legen, ohne dass jemals eine größere Scheibe auf einer kleineren zu liegen kommt. (In den praktischen Ausführungen dieses Spiels haben in der Regel die Scheiben in der Mitte ein Loch und werden durch drei senkrecht stehende Stäbe fixiert.) Beim Beweis verwende man Induktion nach n. Oder man schließe mit Induktion nach k, wobei die Aussage A(k) bedeuten soll: Man kann die k obersten Scheiben des Ausgangsstapels auf eines der beiden anderen Spielfelder den Spielregeln gemäß stapeln. d) Vielleicht hast Du den Wunsch, die häufig benutzte Möglichkeit der Division mit Rest exakt zu beweisen. Zu n, m ∈ N mit m > 0 gibt es eindeutig bestimmte q, r ∈ N mit n = qm + r und r < m. Verwende Induktion nach n, wobei der Fall n = 0 trivial ist. Induktionschritt. Nimm n = qm+r mit r < m an. Dann ist n + 1 = qm + r + 1. Unterscheide zwei Fälle: 1. r < m − 1. Dann ist r + 1 der neue Rest. 2. r = m − 1. Dann ist n + 1 = qm + m = (q + 1)m + 0. 32 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Zur Eindeutigkeit: Sei n = qm + r = q 0 m + r0 (mit r, r0 < m) und etwa r ≤ r0 . Dann ist r0 − r = n − n + qm − q 0 m = (q − q 0 )m. Also gilt 0 ≤ r0 − r < m − 0 und andererseits ist r0 − r durch m teilbar. Das ist aber nur möglich, wenn r0 − r = 0 ist. Dann ist qm = q 0 m, also q = q 0 , da m > 0 gilt. Bemerkungen 1.6.3 Das Induktionsprinzip wird häufig etwas variiert. a) Wenn man mit dem Induktionsprinzip eine Aussage A(x) nur für alle natürlichen Zahlen zeigen will, die ≥ einer gewissen Zahl k sind (etwa weil A(n) für n < k falsch ist oder keinen Sinn hat), so kann man als Induktionsanfang die Aussage A(k) beweisen und dann die Implikation A(n) ⇒ A(n + 1) für alle n ≥ k zeigen. (Formal kann man diese Methode auf das erstgenannte Induktionsprinzip zurückführen, indem man dieses auf die Aussage B(x) := A(x+k) anwendet.) b) Häufig benutzt man die vollständige Induktion in der Art, dass man die Aussage A(n + 1) aus allen A(k) mit k ≤ n ableitet. (Auch dies lässt sich formal auf das o.a. Induktionsprinzip zurückführen, indem man dieses auf die Aussage B anwendet, wo die Gültigkeit von B(n) bedeuten soll, dass A(k) für alle k ≤ n gilt.) 1.6.4 Weitere Beispiele. a) Wir zeigen mit Induktion n X n(n + 1) n(n + 1) 1 + 2 + ··· + n = d.h. k= für alle n ∈ N1 . 2 2 k=1 Du kennst das von Aufgabe 6 des letzten Abschnittes. Aber es sei hier zur Übung noch einmal mit Induktion nach n gezeigt. Wähle n = 1 als Induktionsanfang. Wir haben 1 = 1·2 zu zeigen. Kein Problem! 2 Pn Pn+1 Induktionsschluss: Unter der Voraussetzung k=1 k = n(n+1) zeigen wir k=1 k = 2 (n+1)(n+2) . 2 Dazu rechnen wir n+1 X k=1 k= n X k + (n + 1) = k=1 n(n + 1) n(n + 1) + 2(n + 1) (n + 2)(n + 1) +n+1= = 2 2 2 Wenn wir jetzt noch die Kommutativität der Multiplikation nutzen, sind wir fertig. b) Wir zeigen n X n2 (n + 1)2 n2 (n + 1)2 3 1 + 2 + ··· + n = d.h. k = 4 4 k=1 3 3 3 für alle ganzen n ≥ 1. Wieder benutzen wir Induktion nach n. Der Induktionsanfang ist wieder trivial. Jetzt rechnen wir n+1 X k=1 3 k = n X k=1 k 3 + (n + 1)3 = n2 (n + 1)2 + (n + 1)3 = 4 1.6. VOLLSTÄNDIGE INDUKTION 33 n2 (n + 1)2 + 4(n + 1)3 (n2 + 4(n + 1))(n + 1)2 (n + 1)2 (n + 2)2 = = 4 4 4 Fertig! c) Was kann man aus a) und b) sofort schließen? Na klar! n X k=1 k3 = n(n + 1) 2 2 = n X !2 k k=1 oder schön ausgeschrieben: 13 + 23 + · · · + n3 = (1 + 2 + · · · + n)2 . Na, wenn das nichts ist? 1.6.5 Peano-Axiome. Will man die natürlichen Zahlen axiomatisch beschreiben, so wird aus dem Induktionsprinzip ein Axiom. Die Menge der natürlichen Zahlen kann man folgendermaßen axiomatisch beschreiben: N ist eine Menge zusammen mit einem ausgezeichneten Element 0 ∈ N und einer Abbildung N → N, n 7→ n0 derart, dass folgendes gilt: (i) n0 = m0 ⇐⇒ n = m (ii) 0 6= n0 für alle n ∈ N Ist M eine Teilmenge von N mit den Eigenschaften 0 ∈ N und [n ∈ M ⇒ n0 ∈ M ], so ist M = N. Bemerkung 1.6.6 Hier wurde n0 (der Nachfolger von n) anstelle von n + 1 geschrieben, da die Addition erst im Nachhinein definiert werden soll, und zwar so: Es sei n + 0 := n und n + m0 = (n + m)0 . Dadurch wird die Addition eindeutig definiert. Will man z.B. die Assoziativität der Addition zeigen, also (n + m) + k = n + (m + k), so argumentiert man mit Induktion nach k. Sei M die Menge der k, für welche (n + m) + k = n + (m + k) stimmt. Induktionsanfang: Die Behauptung 0 ∈ M , d.h. (n + m) + 0 = n + (m + 0) ist klar, da nach Definition (n + m) + 0 = n + m und m + 0 = m ist. Induktionsschluss: Wir setzen k ∈ M , d.h. (n+m)+k = n+(m+k) voraus; es folgt (n+m)+k 0 = ((n + m) + k)0 = (n + (m + k))0 = n + (m + k)0 = n + (m + k 0 ), also k 0 ∈ M . – Im Nachhinein wird auch erst 1 = 00 definiert. Die Multiplikation kann man dann auf folgende Weise definieren: n · 0 = 0, n · m0 = n · m + n. (Damit siehst Du etwa: n · 1 = n · 00 = n · 0 + n = 0 + n = n.) 34 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN AUFGABEN n(n + 1)(2n + 1) 6 n X n(n + 1)(2n + 13) b) Zeige: k(k + 4) = . 6 k=1 1. a) Zeige 12 + 22 + · · · + n2 = 2. Zeige, dass man n verschiedene Gegenstände, etwa die Zahlen 1, 2, 3, . . . , n auf n! verschiedene Weisen in eine Reihenfolge bringen kann. 3. Zeige: n X k · k! = (n + 1)! − 1. k=0 (Dies geschieht mit vollständiger Induktion ohne Mühe. Wie man allerdings auf diese Identität gekommen ist, ist dem Beweis nicht anzusehen.) 4. Zeige: Für jedes n ∈ N ist 2 · 53n+1 + 4n durch 11 teilbar, d.h. es gibt zu jedem n ein (von n abhängiges) k ∈ N mit 11 · k = 2 · 53n+1 + 4n . (Auch hier führt ein Induktionsbeweis zum Ziele, ohne dass Du leicht erkennen kannst, wie ich auf solch eine Behauptung überhaupt gekommen bin.) Bemerkung: Du magst die zu beweisende Behauptung, dass 2·53n+1 +4n immer durch 11 teilbar sei, nicht gerade naheliegend und vielleicht auch uninteressant finden. Du solltest Dich trotzdem zur Übung an dem Beweis versuchen. Er ist nämlich kein automatischer Beweis, andererseits auch nicht allzu schwer. k 5. Zeige durch Induktion nach k: Für jedes ganze k ≥ 1 und jede ungerade Zahl u ist u2 − 1 k k durch 2k+2 teilbar. (Erinnere Dich, dass nach Definition u2 = u(2 ) ist.) Beachte: Für k = 0 stimmt die Aussage nicht, und das wird ja auch nicht behauptet. √ 6. In dieser Aufgabe benutzen wir die Zahl 5. Diese ist nicht rational! Aber ich nehme an, dass Du trotzdem in der Lage bist, mit ihr umzugehen. Da sie dazu benutzt wird, ganze Zahlen auszurechnen, sollte Dir dies ein Ansporn sein, sich mit allgemeinen reellen Zahlen zu beschäftigen. Die Folge (Fn ) der Fibonacci-Zahlen ist folgendermaßen definiert: F1 := F2 := 1, Zeige: 1 Fn = √ 5 Fn := Fn−2 + Fn−1 für n ≥ 3. √ !n 1+ 5 − 2 √ !n ! 1− 5 2 (1.5) Setze dazu Gn gleich der rechten Seite der behaupteten Gleichung, ferner √ √ 1+ 5 1− 5 u := , v := 2 2 u und v erfüllen u2 = u + 1 und v 2 = v + 1. Berechne dann Gn−2 + Gn−1 und ersetze darin u + 1 durch u2 , sowie v + 1 durch v 2 . Du erhältst damit Gn . Schließlich musst Du noch G1 = G2 = 1 nachprüfen. 1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS 35 7. Zur effizienten Berechnung der Fn mittels der Formel 1.5 benötigt man nur den ersten Summanden, da √ !n 1 1 − 5 1 < √ 2 5 2 ist, 8. Definiere H1 = a, H2 = b. Hn = Hn−1 + Hn−2 . Wie lässt sich Hn mit Hilfe der FibonacciZahlen (sowie a und b) ausdrücken? 1.7 Größter gemeinsamer Teiler, Euklidischer Algorithmus Angenommen, Du bist im Jahr 1987 geboren. Da es mir (und auch Dir?) nun mal die Zahlen 7 und 17 besonders angetan haben, wollen wir versuchen, diese Zahl 1987als Summe eines Vielfachen von 7 und eines Vielfachen von 17, d.h in der Form 7a + 17b mit ganzen Zahlen a und b darzustellen. Dazu versuchen wir zunächst die 1 so zu schreiben. Kein Problem: denn es gilt ja 7 · 5 + 17 · (−2) = 1. (Dass hierbei nicht beide Faktoren a und b positiv sein können, ist ja klar.) Dann ist aber auch 1987 = (7 · 5 + 17 · (−2)) · 1987 = 7 · (5 · 1987) + 17 · (−2 · 1987), also 1987 = 7 · 9935 + 17 · (−3974) (∗) Weil 1987 groß genug ist, können wir hier auch positive ganze Faktoren a0 , b0 mit 1987 = 7a0 +17b0 finden. Das tun wir wie folgt: Für jede ganze Zahl n ist sicher 0 = 7 · (−17n) + 17 · (7n) (**) Nun ist 3974/7 < 568 (knapp) und deshalb 7 · 568 > 3974. Mit der Wahl n = 568 addieren wir (∗∗) zu (∗) und erhalten 1987 = 7 · (9935 − 17 · 568) + 17 · (−3974 + 7 · 568) = 7 · 279 + 17 · 2 Um es gleich zu sagen, ich möchte in diesem Abschnitt keineswegs eine mysteriöse Eigenschaft der Zahlen 7 und 17 studieren, sondern Dir zeigen, dass es zu beliebigen ganzen Zahlen m, n, die teilerfremd sind, d.h. keinen gemeinsamen Primfaktor haben, ganze Zahlen a und b mit ma + nb = 1 gibt. Für größere natürliche Zahlen k gibt es dann auch natürliche Zahlen a0 , b0 mit ma0 + nb0 = k. Diese Aussage ist aber nicht so wichtig, weshalb ich ihren Beweis als Aufgabe stelle. 36 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Definition 1.7.1 Seien a, b ∈ Z. Man sagt, a ist ein Teiler von b oder a teilt b, und schreibt a|b, wenn es ein c ∈ Z mit a · c = b gibt. Wenn a kein Teiler von b ist, schreiben wir a - b. Beachte, dass die Relation ‘|’ nicht symmetrisch ist. Beispielsweise gilt 2|6, aber 6 - 2. Auch gibt es (viele) Zahlenpaare a, b, für die weder a|b noch b|a gilt, z.B. a = 6, b = 10. 1.7.2 Grundlegende Eigenschaften von |“: a) Für alle a ∈ Z gilt 1|a, − 1|a und a|0. ” Du hast Dich nicht verlesen, da a · 0 = 0 ist. In der obigen Definition ist c = 0 nicht ausgeschlossen. b) a|b ⇐⇒ |a| |b|. (Dabei ist |a|, der Betrag von a, als die größere der beiden Zahlen a, −a definiert.) c) a|b, b|c ⇒ a|c. d) a|b ⇒ a|bb0 für eine beliebige ganze Zahl b0 , d’) a|b, a|c ⇒ a|b + c, also insgesamt d”) a|b, a|c ⇒ a|bb0 + cc0 für beliebige ganze Zahlen b0 , c0 . e) a|b, a - c ⇒ a - bb0 + c für jede ganze Zahl b0 . Sonst wäre a|bb0 + c − bb0 , wo die rechte Zahl gleich c ist. f) Sind a, b > 0 und gilt a|b, so ist a ≤ b. (Aber natürlich nicht umgekehrt!) Ich habe einen großen Strich geschrieben, wo man den den Strich, der für ‘teilt’ steht von den ‘Betragsstrichen’ unterscheiden möchte. Definition 1.7.3 Seien a, b ∈ Z. Unter einem größten gemeinsamen Teiler von a, b versteht man eine natürliche Zahl d mit folgenden Eigenschaften: (i) d|a, d|b ; (ii) c|a, c|b =⇒ c|d . Bemerkungen 1.7.4 a) Wenn es einen größten gemeinsamen Teiler von a, b gibt, ist dieser eindeutig bestimmt. Seien nämlich d, d0 solche, so muss d|d0 und d0 |d gelten. Da wir listiger Weise vorgeschrieben haben, dass d, d0 ≥ 0 sein sollen, folgt die Gleichheit d = d0 . Falls a, b ∈ Z einen größten gemeinsamen Teiler haben bezeichnen wir ihn mit ggT(a, b) b) ggT(a, 0) = |a|. Insbesondere ist ggT(0, 0) = 0. (Die Bezeichnung ‘größter gemeinsamer Teiler’ ist im letzten Fall nicht wörtlich zu verstehen.) 1.7.5 Du hast sicher in der Schule gelernt, wie man den größten gemeinsamen Teiler zweier ganzer Zahlen findet, wenn man deren Primfaktorzerlegung kennt. Z.B. ist ggT(12, 90) = ggT(22 · 31 · 50 , 21 · 32 · 51 ) = 21 · 31 · 50 = 6 M in(r ,s ) M in(rn ,sn ) 1 1 · · · pn Allgemein gilt ggT(±pr11 · · · prnn , ± ps11 · · · psnn ) = p1 die ersten n Primzahlen, und die Exponenten dürfen 0 sein. . Dabei sind p1 , . . . , pn Eine Primfaktorzerlegung herzustellen ist bei größeren Zahlen bekanntlich ziemlich zeitaufwändig. Deshalb sollst Du hier eine schnellere Methode kennenlernen, den ggT zu berechnen, 1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS 37 von der bereits Euklid wusste. Da diese für jedes Paar ganzer Zahlen funktioniert, hat man damit natürlich auch die Existenz des ggT bewiesen. Darüberhinaus werden wir mit diesem Verfahren zu a, b ganze Zahlen a0 , b0 bestimmen, derart dass aa0 + bb0 = ggT(a, b) gilt. Der Euklidische Algorithmus Ein schnelles Verfahren zur Berechnung des größten gemeinsamen Teilers. Hilfsbemerkung: In Z gelte a = bc + d. Dann ist jeder gemeinsame Teiler von a und b auch ein solcher von b und d und umgekehrt. D.h. für t ∈ Z hat man: t|a, t|b ⇐⇒ t|b, t|d. Der Algorithmus läuft wie folgt: Seien a, b ∈ Z − {0}. (ggT(a, 0) = |a|.) Setze r0 := a, r1 = b. Dividiere mit Rest nach und nach: r 0 = r 1 q1 + r 2 r 1 = r 2 q2 + r 3 r 2 = r 3 q3 + r 4 usw. mit mit mit |r2 | < |r1 | |r3 | < |r2 | |r4 | < |r3 | Solange ri 6= 0 ist, kann man qi , ri+1 finden mit ri−1 = ri qi + ri+1 |ri+1 | < |ri |. und Da aber |r1 | > |r2 | > . . . > |ri | > |ri+1 | usw. gilt, muss zweifellos für ein n der Rest rn+1 gleich 0 sein. Das Verfahren bricht also ab: rn−2 = rn−1 qn−1 + rn rn−1 = rn qn + 0. Behauptung: mit 0 < |rn | < |rn−1 | |rn | = ggT(a, b). Wegen obiger Hilfsbemerkung hat man für t ∈ Z die Äquivalenzen t|r0 , r1 ⇐⇒ t|r1 , r2 ⇐⇒ t|r2 , r3 ⇐⇒ . . . ⇐⇒ t|rn−1 , rn ⇐⇒ t|rn , 0. Unter Beachtung von a = r0 , b = r1 folgt ggT(a, b) = ggT(rn , 0) = |rn |. Man bekommt mit obigem Algorithmus auch eine Darstellung von rn in der Form aa0 + bb0 . Einen Ausdruck aa0 + bb0 nennt man eine Linearkombination von a und b. Hilfsbemerkung: Seien c = aa1 + bb1 und d = aa2 + bb2 als Linearkombinationen von a und b gegeben. Dann erhält man jede Linearkombination cc0 + dd0 von c und d explizit als Linearkombination von a und b; es ist nämlich cc0 + dd0 = (aa1 + bb1 )c0 + (aa2 + bb2 )d0 = 38 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN a(a1 c0 + a2 d0 ) + b(b1 c0 + b2 d0 ). Wir betrachten nun wieder die Gleichungsfolge aus 1.7.5. Zunächst sind r1 = b und r2 = a − bq1 als Linearkombinationen von a und b gegeben. Falls man schon induktiv ri−1 und ri als Linearkombinationen von a und b gewonnen hat, gewinnt man auch ri+1 als eine solche, da ri+1 = ri−1 − ri qi gilt. (Manchmal wird diese Methode auch der erweiterte Euklidische Algorithmus genannt.) Bemerkung 1.7.6 Wenn man beim euklidischen Algorithmus mit möglichst wenigen Schritten auskommen will, muss man negative Reste zulassen, um bei jedem Schritt |ri+1 | ≤ |ri |/2 zu erreichen. (Es muss zugestanden werden, dass der Gewinn beim Gebrauch negativer Reste nicht sehr groß ist. Gilt nämlich a > b > 0 und a = bq + r mit 0 ≤ r < b, so ist immer noch a ≥ b + r > r + r, also r < a/2, was nicht viel schlechter als |r| ≤ b/2 ist.) Definition 1.7.7 a, b ∈ Z heißen (zueinander) teilerfremd, wenn ggT(a, b) = 1 ist. (Man benutzt auch die Sprechweise, dass in diesem Fall a zu b teilerfremd ist.) Bemerkungen 1.7.8 a) Natürlich sind a, b genau dann teilerfremd, wenn sie keinen gemeinsamen Primfaktor besitzen. b) Die ganzen Zahlen a, b sind teilerfremd genau dann, wenn es a0 und b0 in Z mit aa0 + bb0 = 1 gibt. Denn, wenn a und b teilerfremd sind, liefert der euklidische Algorithmus die gesuchten a0 , b0 . Wenn umgekehrt t ein Teiler von a und von b ist, ist t auch ein Teiler von aa0 + bb0 = 1 . c) Wenn a, b teilerfremd sind, gibt es für alle c ∈ Z Zahlen a, b ∈ Z mit aa + bb = c. (c = 1 · c = a(a0 c) + b(b0 c).) Wir erhalten einen neuen Beweis von Euklids Lemma. Lemma 1.7.9 Seien p eine Primzahl, a, b ∈ Z und p|ab. Dann teilt p mindestens eine der beiden Zahlen a, b. Beweis: Wenn p|b gilt, sind wir glücklich. Andernfalls sind b, p teilerfremd und es gibt deshalb c, d ∈ Z mit bc + pd = 1. Dann gilt p | abc + apd, wo abc + apd = a ist. Erinnere Dich, dass aus Euklids Lemma ziemlich direkt die Eindeutigkeit der Primfaktorzerlegung folgt. 1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS 39 AUFGABEN 1. Welche Massen kannst Du mit einer Balkenwaage wiegen, wenn Du beliebig viele Gewichte von 70g und von 125g zur Verfügung hast und in beide Waagschalen Gewichte legen darfst? 2. Zwei große, etwa halbvolle Badewannen stehen nebeneinander. Kannst Du mit einem 7- und einem 19-Litermaß durch Hin- und Hergießen (der vollen Maße) erreichen, dass schließlich das Wasser der einen Badewanne um einen Liter vermehrt, das der anderen um einen Liter vermindert ist? 3. Seien a, b teilerfremde ganze Zahlen. Bestimme alle ganzen Zahlen x, y mit ax + by = 0. 4. Sei ggT(a, b) = 1. Dann gibt es ja a0 , b0 ∈ Z mit aa0 + bb0 = 1. Überlege, auf welche (einfache) Weise man a0 und b0 verändern kann, ohne dass diese Gleichung an Gültigkeit verliert. Kann man zum Beispiel a0 ≥ 0 erreichen? (Dies geht, wenn b 6= 0 ist.) Man kann sämtliche a0 , b0 mit aa0 + bb0 = 1 bestimmen. Vgl. Aufgabe 3. 5. Seien a, b, c ∈ N1 , ggT(a, b) = 1 und c ≥ (a − 1)(b − 1). a) Zeige: Es gibt a0 , b0 ∈ N(!) mit c = aa0 + bb0 . D.h. c ist eine Linearkombination mit nicht negativen Koeffizienten. b) Zeige: d = ab−a−b lässt sich nicht in der Form aa0 +bb0 mit natürlichen a0 , b0 schreiben. 6. Schreibe die Jahreszahl Deiner Geburt in der Form n · 30 + m · 49 mit n, m ∈ N. 7. Mach Dir Gedanken darüber, wie viele Divisionen mit Rest Du ausführen musst, um den ggT zweier natürlicher Zahlen zu bestimmen. Unterscheide dabei, ob Du nur nichtnegative oder auch negative Reste zulassen willst. Im ersten Fall erhältst Du bei der Division von 26 durch 7 die Darstellung 26 = 7 · 3 + 5, im zweiten Fall darfst Du auch 26 = 7 · 4 − 2 schreiben. a) Sind a, b > 0 ganz und a ≥ b, so schreibe im 1. Fall a = bq + r mit 0 ≤ r < b. Dann ist q ≥ 1, also a ≥ b + r > r + r und deshalb schließlich a > 2r. Für die ri im euklidischen Algorithmus erhält man somit ri > 2ri+2 . Das bedeutet: Ist a ≤ 2k so benötigt man weniger als 2k Schritte. . Ist also b) Sind a, b 6= 0 ganz und |a| ≥ |b|, so schreibe im 2. Fall a = bq + r mit |r| ≤ |b| 2 k |b| ≤ 2 , so benötigt man höchstens k Schritte. Das bedeutet gegenüber a) eine leichte Verbesserung. 8. Seien m, n ∈ N1 zueinander teilerfremd. Beweise: a) Es gibt ein k ∈ N mit m|k und n|k + 1. (Benutze Aufgabe 4.) b) Die Gleichung xm + y m = z n hat eine Lösung in natürlichen Zahlen > 0. (Löse zunächst xk + y k = z k+1 .) (Zu a) Es gibt natürliche Zahlen m0 , n0 mit −mm0 + nn0 = 1 also nn0 = mm0 + 1. Setze k = mm0 . 40 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Beachte: Wenn es zu m, n ∈ Z eine ganze Zahl k mit m|k und n|k + 1 gibt, sind m, n zueinander teilerfremd.) (Zu b) 2k + 2k = 2k+1 . Hat man also m0 , n0 mit nn0 = mm0 + 1 0 0 0 gefunden, so gilt (2m )m + (2m )m = (2n )n .) 9. a) Bestimme ggT(11 111 111, 111 111 111 111 111). b) Allgemeiner: Bestimme ggT(1.....1, 1.....1) , wenn die erste Zahl m, die zweite n Stellen hat. c) Noch allgemeiner: Bestimme ggT n−1 X i=0 di , m−1 X ! di für n, m, d ∈ N1 . i=0 10. Berechne ggT(408277 , 222191) und stelle diesen als Linearkombination dieser beiden Zahlen da. Wenn Du einen Computer die Primfaktorzerlegung dieser beiden Zahlen bestimmen lässt, bringst Du Dich um die Erkenntnis, wie effektiv die Berechnung des ggT mit Hilfe des euklidischen Algorithmus ist. Gut wäre es natürlich, Du könntest einem Computer den euklidischen Algorithmus beibringen. m n 1 = + . 225 9 25 b) Allgemeiner seien a, b zueinander teilerfremde Zahlen > 0. Wie kann man ganze m, n bestimmen, so dass m n 1 = + gilt? ab a b 11. a) Finde ganze Zahlen m, n mit 12. Sei m ∈ N2 und M die Menge aller positiven Teiler von m (einschließlich 1 und m). Auf der Menge M kann man folgendes Spiel für 2 Spieler spielen: Abwechselnd belegen die Spieler je eine der Zahlen aus M mit einem Spielstein unter Beachtung folgender Regel: Ist bereits d ∈ M belegt und gilt d0 |d, so darf d0 nicht mehr belegt werden. Wer m belegt, hat verloren. Zeige: Es gibt eine Gewinnstrategie für den beginnenden Spieler. (D.h. er hat die Möglichkeit zu gewinnen, was auch immer der andere Spieler für Züge macht.) (Hinweis: Eine besondere Rolle spielt die Zahl 1. Allgemeiner als angegeben, darf M eine beliebige endliche teilweise – d.h. nicht notwendig total – geordnete Menge mit einem kleinsten und einem davon verschiedenen größten Element sein. Ich kenne übrigens keinen Beweis obiger Behauptung, der eine Gewinnstrategie konkret angibt.) 13. Die Farey-Folge der Ordnung n(≥ 1) ist die nach aufsteigender Größe geordnete Folge derjenigen rationalen Zahlen a aus dem Intervall [0, 1], d.h. mit 0 ≤ a ≤ 1, deren Nenner in der Standardform (d.h. gekürzt mit positivem Nenner) ≤ n ist. Z.B. ist die Farey-Folge der Ordnung 4 die Folge: 0 1 1 1 2 3 1 , , , , , , . 1 4 3 2 3 4 1 1.7. GRÖSSTER GEMEINSAMER TEILER, EUKLIDISCHER ALGORITHMUS 41 Für die Farey-Folge der Ordnung n gilt: a) Wenn a1 /b1 , a2 /b2 aufeinanderfolgende Glieder dieser Folge in der Standardform sind, so ist • 1. a2 b1 − a1 b2 = 1, • 2. b1 + b2 > n, • 3. b1 6= b2 im Falle n > 1. b) Wenn a1 /b1 , a2 /b2 , a3 /b3 drei aufeinanderfolgende Glieder der Farey-Folge (in ihrer Standardform) sind, so ist a2 /b2 = (a1 + a3 )/(b1 + b3 ). (Der letzte Bruch ist nicht notwendig gekürzt.) Um a) und b) zu beweisen, zeige zunächst c) bis e): c) Aus a1 /b1 < a2 /b2 folgt a1 /b1 < (a1 + a2 )/(b1 + b2 ) < a2 /b2 . d) Wenn a2 b1 − a1 b2 = 1 ist, gilt auch (a1 + a2 )b1 − a1 (b1 + b2 ) = 1 und a2 (b1 + b2 ) − (a1 + a2 )b2 = 1. Sind ai , bi ∈ Z, so folgt also insbesondere: Der Bruch (a1 + a2 )/(b1 + b2 ) ist gekürzt. e) Aus ai , bi , u, v ∈ Z, bi , v > 0, a2 b1 − a1 b2 = 1 und a1 /b1 < u/v < a2 /b2 folgt v ≥ b1 + b2 . Anschließend kannst Du die Farey-Folge der Ordnung n auf folgende Weise konstruieren: Beginne mit 0/1, 1/1. Ist n > 1, füge 1/2 = (0 + 1)/(1 + 1) ein und fahre so fort. Nämlich, solange es in Deiner Folge noch zwei aufeinanderfolgende Glieder a1 /b1 , a2 /b2 mit b1 + b2 ≤ n gibt, füge (a1 + a2 )/(b1 + b2 ) gemäß c) zwischen ihnen ein. Für die am Ende erhaltene Folge ist a) 2. offenbar erfüllt, und a) 1. folgt aus d). Aus a) 1. kannst Du leicht b) folgern. Ferner folgt a) 3. aus den Ungleichungen a/b < a/(b − 1) < (a + 1)/b für a + 1 < b. Schließlich siehst Du mit e), dass Du die Farey-Folge der Ordnung n konstruiert hast. 42 KAPITEL 1. VOM ZÄHLEN, RECHNEN UND VERGLEICHEN Kapitel 2 Neue Rechenbereiche 2.1 Grundlegende Definitionen Betrachte dieses Kapitel als Abenteuer! Ich glaube nämlich, Du wirst etwas Neues lernen. In (1.1.4) haben wir elementare Rechengesetze für die natürlichen Zahlen angegeben. Dann haben wir die Menge (i.e. Gesamtheit) N der natürlichen Zahlen zur Menge Q der rationalen Zahlen (die auch negativ sein dürfen) erweitert. Hierin findet sich die Menge Z der ganzen Zahlen (die auch negativ sein dürfen). Wenn wir noch die Menge der rationalen Zahlen ≥ 0 mit Q+ bezeichnen, erhalten wir folgendes Schema: N −→ Z ↓ ↓ Q+ −→ Q (Man kann, um von den natürlichen zu den rationalen Zahlen zu gelangen, sowohl den Weg über die nicht-negativen rationalen Zahlen, als auch den Weg über die ganzen Zahlen wählen!) In all diesen Mengen kann man addieren und multiplizieren. Es gibt in ihnen neutrale Elemente – übrigens immer 0 und 1 – und zu manchen Elementen auch additiv, bzw. multiplikativ Inverse. Definition 2.1.1 Ein Ring R ist eine Menge zusammen mit zwei Verknüpfungen (Rechenarten) ‘+’ und ‘·’ (Addition und Multiplikation), für welche folgende Regeln gelten: Assoziativität: a + (b + c) = (a + b) + c und a(bc) = (ab)c Kommutativität der Addition: a + b = b + a Distributivität: a(b + c) = ab + ac, (b + c)a = ba + ca Existenz neutraler Elemente: In R gibt es ein Element 0 mit der Eigenschaft a + 0 = a und ein Element 1 mit der Eigenschaft 1a = a1 = a Existenz additiv Inverser: Zu jedem a ∈ R existiert ein Element (−a) (auch einfach −a geschrieben) mit der Eigenschaft a + (−a) = 0. Es lohnt sich nicht, den hier definierten algebraischen Begriff ‘Ring’ mit dem alltäglichen (geometrischen) Begriff eines Ringes zu vergleichen. 43 44 KAPITEL 2. NEUE RECHENBEREICHE Bemerkungen 2.1.2 a) Wie üblich, lässt man den Multiplikationspunkt häufig weg. Und wir beachten die Konvention ‘Punktrechnung geht vor Strichrechnung’, um Klammern zu sparen. b) Die neutralen Elemente sind eindeutig bestimmt: Seien etwa 0, 00 neutrale Elemente der Addition, so ist 0 = 0 + 00 = 00 + 0 = 00 . Dasselbe gilt für neutrale Elemente der Multiplikation. (Bei der Forderung der Existenz additiv Inverser braucht man also nicht anzugeben, welchem neutralen Element der Addition die Summe a + (−a) gleich sein soll.) c) Ebenso gibt es zu a nur ein additiv Inverses. Sind nämlich (−a), (+ a) zu a additiv invers, so gilt: (−a) = (−a) + 0 = (−a) + (a + (+ a)) = ((−a) + a) + (+ a) = 0 + (+ a) = (+ a). Insbesondere gibt es auch nur ein additiv Inverses von (−a), nämlich welches? d) Die Kommutativität der Multiplikation fordern wir nicht, da es interessante Beispiele gibt, wo diese nicht erfüllt ist. Siehe Abschnitt 2. Ohne die Kommutativiät ist es nicht allgemein möglich, eines der beiden Distributivgesetze aus dem anderen zu folgern. Natürlich kann man auch Rechenbereiche betrachten, in denen auf die Forderung der Assoziativität der Multiplikation verzichtet wird – und tut dies manchmal auch! Wir wollen hier aber diese Allgemeinheit nicht anstreben. e) Es wird nicht verlangt, dass 0 und 1 verschiedene Elemente sind. Allerdings besteht in dem Fall 0 = 1 der Ring nur aus einem Element, welches sowohl 1 wie 0 ist. (Dies steht in der folgenden Bemerkung a).) Ein solcher Ring heißt ‘der’ Nullring. f) Die ersten Beispiele für Ringe sind Z und Q, während N kein Ring ist, da zumeist die additiv Inversen fehlen. Bemerkungen 2.1.3 a) Aus 0 + 0 = 0 folgt a0 = a(0 + 0) = a0 + a0. Indem man auf beiden Seiten von a0 = a0 + a0 das Element −(a0) addiert, erhält man a0 = 0. Ebenso zeigt man 0a = 0. Sollte 0 = 1 gelten, folgt a = a · 1 = a0 = 0, und der Ring ist der Nullring. b) Es ist ab + a(−b) = a(b + (−b)) = a0 = 0. Also ist a(−b) das additiv Inverse zu ab, d.h. a(−b) = −(ab). Ebenso ist (−a)b = −(ab). Ferner ist a das additiv Inverse zu −a, d.h. a = −(−a). In jedem Ring gilt deshalb (−a)(−b) = −a(−b) = −(−ab) = ab. Wenn also Z und Q Ringe sein sollen, so muss man für positive ganze, bzw. rationale Zahlen a, b das Produkt der negativen Zahlen (−a), (−b) wie oben definieren, nämlich: (−a)(−b) = ab. Dasselbe gilt für die reellen Zahlen, die wir später einführen. 2.1.4 In einem Ring R sind Potenzen mit Exponenten aus N definiert. Genauer, für a ∈ R, n ∈ N ist an definiert. (Die Kommutativität der Multiplikation wird dazu nicht benötigt. Allerdings benötigt man die Assoziativität bereits, wenn man die Gleichheit (aa)(aa) = ((aa)a)a wünscht.) Ich erinnere an die Definition a0 = 1, auch wenn a = 0 sein sollte. Es gelten die grundlegenden Potenz-Regeln am+n = am an sowie amn = (am )n . (2.1) (Die Gültigkeit dieser Regeln ergibt sich genau so, wie wir es für den Fall dass a eine natürliche Zahl ist oben gesehen haben. Zu ihrem Beweis benötigt man die Assoziativität, aber nicht die Kommutativität der Multiplikation.) 2.1. GRUNDLEGENDE DEFINITIONEN 45 In einem Ring, dessen Multiplikation kommutativ ist, gilt zusätzlich die Regel (ab)n = an bn (2.2) Für die meisten Ringe R kann man ab mit a, b ∈ R nicht vernünftig definieren. Wir werden allerdings ab definieren, falls a und b reelle Zahlen sind und a > 0 ist. Dies wird im Kapitel 5 ausgeführt. Bemerkung 2.1.5 Die Definition an := a · · · a mit n Faktoren würde n − 1 Multiplikationen zur Berechnung von an erfordern. Man kann dies aber abkürzen. Z.B. erfordert die linke Seite von (((a2 )2 )2 )2 = a16 nur 4 statt 15 Multiplikationen. Wenn man etwa a25 berechnen möchte, stellt man 25 im Binärsystem dar: 25 = 24 + 23 + 20 dar und rechnet 4 3 0 a25 = a2 · a2 · a2 = (((a2 )2 )2 )2 · ((a2 )2 )2 · a mit Hilfe von 6 Multiplikationen aus. (Warum benötigt man nicht 9 Multiplikationen?) (Diese Berechnungsabkürzung beim Potenzieren entspricht dem schriftlichen Rechnen beim Multiplizieren, wobei der Exponent in Binärschreibweise gedacht ist. Sollte Dir diese Bemerkung schleierhaft erscheinen, überschlage sie.) Für Anwendungen in der Codierung muss man Potenzen mit natürlichen Exponenten berechnen, die als Dezimalzahlen mehrere hundert Stellen haben. Eine solche Berechnung wäre ohne die oben beschriebene Abkürzung schlechterdings nicht möglich. (Hat der Exponent z.B. 300 Stellen im Dezimalsystem, so hat er etwa 900 Stellen im Binärsystem. Man braucht zur Berechnung der Potenz also etwa 900 Quadrierungen und durchschnittlich noch etwa 450 weitere Multiplikationen. Das sind nun wirklich wenige im Vergleich zu 10300 .) Du kannst mit Recht einwenden, dass man im Bereich der natürlichen Zahlen eine Potenz der Form ab , wo a ≥ 2 und b von Größenordnung 10300 ist, schon allein deshalb nicht berechnen kann, weil man die berechnete Zahl von mindestens 10100 Dezimalstellen schlechterdings nicht aufschreiben kann! Die Erklärung ist: Man rechnet gar nicht in N, sondern in einem endlichen Ring. Und solche wirst Du bereits im Abschnitt 4 kennen lernen. Definition 2.1.6 Ein kommutativer Ring ist ein Ring, in dem die Kommutativität für die Multiplikation, d.h. ab = ba gilt. 2.1.7 In einem kommutativen Ring R gilt für n ∈ N die Regel (ab)n = an bn , in einem nichtkommutativen Ring meist nicht! Beispiele findest Du im Ring der 2 × 2-Matrizen über beliebigen Ringen, die vom Nullring verschieden sind. Siehe Abschnitt 3. Definition 2.1.8 Ein Schiefkörper ist ein (nicht notwendig kommutativer) Ring K, in dem 1 6= 0 ist und für alle Elemente a 6= 0 ein multiplikativ Inverses a−1 existiert. Dabei heißt a−1 multiplikativ invers zu a, wenn a−1 a = aa−1 = 1 ist. Spricht man von dem Inversen ohne genauere Spezifikation, so ist das multiplikativ Inverse gemeint. 46 KAPITEL 2. NEUE RECHENBEREICHE Wie für das additiv Inverse sieht man auch, dass das multiplikativ Inverse eines Elementes eindeutig bestimmt ist. Bemerkung 2.1.9 Seien a, b von 0 verschiedene Elemente eines Schiefkörpers. Ist ab 6= ba, so ist auch (ab)−1 6= a−1 b−1 . Hingegen gilt (unter der Voraussetzung der Assoziativität) immer (ab)−1 = b−1 a−1 . Zeige dies! (Wenn Du zuerst ein Hemd und dann darüber einen Pullover angezogen hast und das ohne Verrenkungen rückgängig machen willst, musst Du zuerst den Pullover und dann das Hemd ausziehen!) 2.1.10 In einem Schiefkörper kann man von Elementen a 6= 0 Potenzen mit beliebigen (also auch negativen) ganzzahligen Exponenten bilden: Für n ≥ 0 sei a−n := (a−1 )n . Dabei verstehe man zunächst unter a−1 das multiplikativ Inverse von a; als Potenz kann man es nachträglich verstehen. Auch für Potenzen mit beliebigen ganzen Exponenten gelten o.a. Regeln am+n = am an und amn = (am )n . (Aus (ab)2 = a2 b2 folgt ab = ba in jedem Schiefkörper. Zeige dies!) Definition 2.1.11 Ein Körper ist ein Schiefkörper, in dem die Kommutativität der Multiplikation gilt. Bemerkung: Dem allgemeinen Sprachgebrauch nach sollte ein Schiefkörper ein Körper spezieller Art sein. Dummerweise ist hier umgekehrt ein Körper ein Schiefkörper spezieller Art. Das liegt natürlich an der historischen Entwicklung, daran, dass man den Begriff des Körpers zuerst erfunden hat und später gute Gründe fand, auch körperähnliche Gebilde zu betrachten, in denen die Multiplikation nicht kommutativ ist. Als Ausweg wurde z.B. vorgeschlagen, Schiefkörper als ‘Örper’ zu bezeichnen. Eine andere Möglichkeit wäre der Name ‘Divisionsring’. (Im Englischen heißt ‘Körper’ – im hier definierten Sinn – ‘field’, ein ‘Schiefkörper’ ‘skew field’, ‘sfield’ oder ‘division ring’.) Diese sprachliche Kalamität tritt allerdings in der Mathematik immer wieder auf, und man hat sich daran gewöhnt, z.B. unter einer Garbe eine Prägarbe spezieller Art zu verstehen, usw. Was Garben sind, brauchst Du jetzt noch nicht, vielleicht sogar nie, verstehen. 2.1.12 In einem Körper gilt wegen der Kommutativität für alle Elemente a, b und beliebige ganze Zahlen n die Regel (ab)n = an bn . In einem Körper definieren wir ab = ab−1 . Du kannst und solltest die Regeln für die Bruchrechnung aus den Körpergesetzen ableiten. Soll also Q ein Körper werden, müssen wir Addition und Multiplikation so definieren, wie wir es getan haben – und wie Du es in der Schule gelernt hast! Übrigens, wenn man den rationalen Zahlen ein Element ∞ hinzufügt, um dem Bruch Sinn zu geben, erhält man keinen Körper. Die Struktur kompliziert sich nur. 2.2 1 0 einen Beispiele von Ringen und Körpern Von der Schule her solltest Du in etwa den Körper R der reellen Zahlen kennen. Von dem wird später noch die Rede sein. 2.2. BEISPIELE VON RINGEN UND KÖRPERN 47 Beispiel 2.2.1 Ringe zwischen Z und Q 1. Sind u, v ungerade ganze Zahlen, so ist bekanntlich auch uv ungerade. Sind ferner a, b ∈ Z, so gilt av + bu a b ab a b + = , · = u v uv u v uv Das bedeutet, dass die Brüche, deren Nenner ungerade sind, genauer: die mit ungeraden Nennern geschrieben werden können, einen (kommutativen) Ring bilden. In diesem Ring R hat 2 kein multiplikativ Inverses, also ist er kein Körper und somit auch nicht gleich Q. Andererseits enthält er die Zahl 1/3. Der Ring R umfasst Z und liegt in Q. 2. Auch die rationalen Zahlen, deren Nenner eine Potenz von 2 ist bilden einen Ring S. (1 = 20 ist als Nenner zugelassen.) Diese Ringe R und S verhalten sich unterschiedlich. In R besitzt 3 = 1 + 1 + 1 ein Inverses, aber 2 = 1 + 1 nicht. In S ist es gerade umgekehrt. 3. Allgemein sei Q eine Menge von Primzahlen. Betrachte die Menge A derjenigen rationalen Zahlen, die sich mit einem Nenner schreiben lassen, der 1 oder ein Produkt von Primzahlen aus Q ist. (Jede Primzahl aus Q darf auch ein mehrfacher Primfaktor sein.) Dieses A ist ein Ring, der in Q liegt und Z umfasst. (Den Begriff ‘Menge’ als eine gewisse Gesamtheit mathematischer Objekte betrachten wir hier ganz naiv.) Besteht Q aus allen von 2 verschiedenen Primzahlen, so erhält man den Ring R aus 1., besteht Q nur aus der Primzahl 2, erhält man S. Besteht Q aus allen Primzahlen, so erhalten wir Q, besteht Q aus gar keiner Primzahl, dann Z. Bemerkung 2.2.2 Allgemein kann man, ausgehend von einem kommutativen Ring R, Brüche betrachten. Häufig lässt sich auf diese Weise der Ring – wie beim Übergang von Z zu Q – zu einem Körper erweitern. Dazu muss allerdings R nullteilerfrei sein. S.u. Man kann wie in den o.a. Beispielen die zulässigen Nenner einschränken, um weitere Ringe zu erhalten. Beispiel 2.2.3 Weiß man von zwei ganzen Zahlen lediglich, ob sie gerade oder ungerade sind, so weiß man dieses auch über ihre Summe und ihr Produkt. Es gilt: gerade+gerade = ungerade+ungerade = gerade, gerade+ungerade = ungerade gerade·gerade = gerade·ungerade = gerade, ungerade·ungerade = ungerade Wir können also die Begriffe ‘gerade’ und ‘ungerade’ als die Elemente einer Menge (von 2 Elementen) auffassen, in der man die Verknüpfungen ‘+’ und ‘·’ hat. Wir setzen 0 =gerade, 1 =ungerade. Denn offenbar ist gerade ein neutrales Element für die Addition, ungerade ein solches für die Multiplikation. Die Additions- und die Multiplikationstafel sehen wie folgt aus: + 0 0 0 1 1 1 1 0 48 KAPITEL 2. NEUE RECHENBEREICHE · 0 0 0 1 0 1 0 1 Bis auf die Rechnung 1 + 1 = 0 ist alles wie gewohnt. 1 ist sowohl das additiv, wie das multiplikativ Inverse von sich selbst. Man nennt diese Menge zusammen mit den Verknüpfungen F2 . Wir haben es mit einem (etwas dürftigen) Körper zu tun. Die Elemente 0 und 1 von F2 sind nicht dieselben Gegenstände, wie die ganzen Zahlen 0 und 1. (Vielleicht sollte man sie deshalb mit 0, 1 bezeichnen. Alternativ könnte man auch das Additionszeichen ‘+’ umbezeichnen.) Im Bereich der ganzen Zahlen gilt ja 1 + 1 6= 0. Um zu zeigen, dass F2 wirklich ein Körper ist, muss man insbesondere die beiden Assoziativgesetze, sowie die Distributivität zeigen. Will man diese Gesetze Fall für Fall untersuchen, so hat man dreimal 23 Fälle zu betrachten. Aber man kann sich ja darauf berufen, dass diese Gesetze für N (und Z) gelten. Deshalb müssen sie doch auch für den Bereich {gerade, ungerade} gelten, nicht wahr? 2.2.4 Wir können für jede natürliche Zahl m > 1 etwas ähnliches tun, wie wir gerade für m = 2 getan haben. Wir können einen kommutativen Ring von m Elementen konstruieren, der übrigens, falls m eine Primzahl ist, ein Körper ist. Wir werden dieser wichtigen Idee den Abschnitt 4 widmen. 2.2.5 Direktes Produkt: Nehmen wir zwei Ringe R, S und bilden wir ihr cartesisches Produkt R × S, d.h. die Menge aller Paare (r, s) mit r ∈ R, s ∈ S. Für solche Paare (r, s), (r0 , s0 ) definieren wir (r, s) + (r0 , s0 ) := (r + r0 , s + s0 ) und (r, s)(r0 , s0 ) := (rr0 , ss0 ). R × S mit diesen Verknüpfungen wird das direkte Produkt von R mit S genannt. Offenbar ist R × S wieder ein Ring, kommutativ, wenn R und S es sind. Was ergibt (1, 0)(0, 1)? Wir sehen, wenn in den Ringen R und S jeweils 0 6= 1 ist, gibt es in R × S immer von 0 verschiedene Elemente, deren Produkt 0 ist. Das direkte Produkt zweier Körper ist deshalb nie ein Körper. 2.2.6 Im Gegensatz zu dem letzten Beispiel gilt in Z und Q die sogenannte Nullteilerfreiheit. Damit ist folgende Regel gemeint: ab = 0 =⇒ a = 0 oder b = 0. (Überlege, dass dies in jedem Schiefkörper gilt.) Definition 2.2.7 In einem Ring R nennen wir a einen Links-Nullteiler, wenn es in R ein b 6= 0 mit ab = 0 gibt. Analog wird ein Rechts-Nullteiler definiert. Bei einem kommutativen Ring spricht man natürlich schlicht von Nullteilern. 2.3. MATRIZEN 49 (Da immer a0 = 0 ist, teilt jedes Element eines Ringes die 0. Ein Nullteiler ist aber nach Definition ein Element, welches die 0 auf nicht triviale Weise teilt.) Die 0 selbst zählt man zu den Nullteilern, vorausgesetzt, der Ring ist nicht der Nullring. Es gibt Beispiele, wo a ein Links-, aber kein Rechts-Nullteiler ist, und umgekehrt. In unserem Buch kommen solche Beispiele nicht vor. Definition 2.2.8 Ein kommutativer Ring heißt nullteilerfrei (auch integer oder ein Integritätsring oder ein Integritätsbereich), wenn er nicht der Nullring ist und außer 0 keine Nullteiler besitzt. Bemerkung 2.2.9 Kürzungsregel: Sei c kein Rechts-Nullteiler und ac = bc, so ist a = b. Beweis hierfür: Aus ac = bc folgt (a − b)c = ac − bc = 0 also a − b = 0, da c kein Nullteiler ist. – 2.3 Matrizen 2.3.1 Matrizen (Singular: Matrix) sind sehr interessante nützliche mathematische Gegenstände. Ich beschränke mich in diesem Buch auf einen Spezialfall. Sei R ein Ring. Wir betrachten sogenannte 2×2-Matrizen über R, d.h. quadratische Schemata a b mit a, b, c, d ∈ R c d Die Gesamtheit dieser Matrizen sei mit M2 (R) bezeichnet. Das Paar (a, b) wird die erste Zeile, genannt. Das das Paar (c, d) die zweite Zeile obiger Matrix a b (senkrecht geschriebene) Paar heißt die erste Spalte, das Paar die zweite Spalte c d der Matrix. Wir definieren die Addition zweier solcher Matrizen wie folgt: 0 0 a b a b a + a0 b + b 0 + = , c d c0 d0 c + c0 d + d0 d.h. auf recht naheliegende Art. Die Addition erfüllt offenbar alle Gesetze, welche die Addition bei Ringen erfüllt. Bestimme das neutrale Element der Addition, sowie das additiv Inverse einer Matrix. a b Ist λ ∈ R und A = ∈ M2 (R)so setzen wir c d λA = λa λb λc λd 50 KAPITEL 2. NEUE RECHENBEREICHE Die Multiplikation zweier Matrizen aus M2 (R) ist komplizierter definiert. Ich will sie schrittweise einführen. Zunächstsei für ein als Zeile geschriebenes Paar (a1 , a2 ) und für ein als Spalte b1 geschriebenes Paar ein Produkt, wie folgt, definiert: b2 b1 (a1 , a2 ) = a1 b 1 + a2 b 2 . b2 (Den ersten Faktor kann man als 1 × 2-Matrix, den zweiten als 2 × 1-Matrix und das Ergebnis als 1 × 1-Matrix ansehen.) A, B seien 2 × 2-Matrizen. Die 1., bzw. 2. Zeile von A seien mit Z1 , bzw. Z2 bezeichnet. Die 1., bzw. 2. Spalte von B seien S1 , bzw. S2 . Dann ist Z1 Z1 S1 Z1 S2 AB = (S1 , S2 ) := Z2 Z2 S1 Z2 S2 D.h. der Eintrag in der i-ten Zeile und j-ten Spalte der Ergebnismatrix ist das Produkt der i-ten Zeile von A mit der j-ten Spalte von B. (Oder so: Man multipliziere die Zeilen von A mit den Spalten von B, und setze die Ergebnisse an die entsprechenden Stellen einer 2 × 2-Matrix.) Ausgeschrieben ergibt sich: 0 0 0 aa + bc0 ab0 + bd0 a b a b = · ca0 + dc0 cb0 + dd0 c0 d0 c d Bemerkung 2.3.2 Später – im Kapitel 6 – werden wir noch folgendes Produkt verwenden: Sei A eine 2 × 2-Matrix mit den Zeilen Z1 und Z2 und B eine 2 × 1-Matrix, d.h. eine Spalte. Dann sei Z1 B AB = . Z2 B Das Ergebnis ist eine Spalte. Ausgeschrieben ergibt sich a11 a12 b1 a11 b1 + a12 b2 = a21 a22 b2 a21 b1 + a22 b2 2.3.3 Gibt es im Bereich der 2 × 2-Matrizen für die Multiplikation ein neutrales Element? Antwort: 1 0 E := ist ein solches. 0 1 Rechne das nach! Die Assoziativität der Multiplikation und die beiden Distributivgesetze lassen sich nachrechnen. Tu das! Die Menge M2 (R) ist also ein Ring. Angenommen, der Ausgangsring R sei kommutativ und nicht der Nullring. Ist dann auch M2 (R) kommutativ? Berechne 0 1 0 0 0 0 0 1 · und · 0 0 0 1 0 1 0 0 2.3. MATRIZEN 51 Wir lernen: In M2 (R) ist die Multiplikation nicht kommutativ; auch kann das Produkt zweier von der Nullmatrix verschiedenen Matrizen 0 0 A, B 6= 0 := 0 0 gleich 0 sein. Wenn Du, wie ich, kein Genie bist, solltest Du die Rechnungen mit Matrizen zur Übung unbedingt nachvollziehen und vielleicht noch das eine oder andere Produkt konkreter Matrizen berechnen! Beispiel 2.3.4 Berechne 1 1 0 1 2 2 2 1 0 1 1 1 0 · und · 1 1 0 1 1 1 Die für rationale (reelle, komplexe) Zahlen a, b gültige Regel an bn = (ab)n gilt nicht mehr allgemein, wenn a, b Matrizen sind! Das liegt an der fehlenden Kommutativität. Bemerkung 2.3.5 Allgemeiner, als wir es hier tun, betrachtet man m×n-Matrizen über einem Ring, d.h. solche mit m Zeilen und n Spalten. Die Summe zweier m × n-Matrizen bildet man wie oben. Das Produkt AB zweier Matrizen ist definiert, wenn die Zahl der Spalten von A gleich der Zahl der Zeilen von B ist. (Wie würdest Du es definieren?) Das Ergebnis ist eine Matrix, die soviele Zeilen wie A und soviele Spalten wie B besitzt. Somit kann man zwei n × n-Matrizen (mit demselben n) sowohl zueinander addieren wie miteinander multiplizieren. Zu jedem n ∈ N1 bilden die n × n-Matrizen einen Ring. In der Linearen Algebra spielen Matrizen eine Hauptrolle. Wenn Du Dich hier mit den 2 × 2-Matrizen vertraut machst, wird Dir das beim späteren Umgang mit allgemeinen Matrizen wahrscheinlich sehr helfen. 2.3.6 Berechne a b 0 d 0 0 a b · . 0 d0 Man sieht, dass die Matrizen der Form a b 0 d einen Ring bilden, einen sogenannten Unterring von M2 (R). Dasselbe gilt für die Matrizen der Form a 0 . c d 52 KAPITEL 2. NEUE RECHENBEREICHE Die Matrizen der Form 1 b 0 1 bilden keinen Unterring, wenn 0 6= 1 in R gilt. (Warum?) Aber das Produkt zweier solcher ist wieder von dieser Form und spiegelt die Summe in R wieder, nicht wahr? Wie ich das gemeint habe, siehst Du sofort, wenn Du zwei Matrizen solcher Art multiplizierst. 2.3.7 Determinante: Wir setzen hier voraus, dass R kommutativ ist. Die Determinante einer 2 × 2-Matrix ist dann folgendermaßen definiert: a b det := ad − bc c d Sie ist also ein Element aus R. Versuche, Eigenschaften der Determinanten von Matrizen aufzuspüren. Gilt z.B. det(A + B) = det(A) + det(B) für beliebige 2 × 2-Matrizen A, B? Finde ein Gegenbeispiel! Gilt det(AB) = det(A)·det(B)? Dies stimmt! Es zu beweisen erfordert keine Idee, nur eine sorgfältige Rechnung. Bringe dazu beide Seiten auf eine Summe von vier Produkten von je vier Einträgen, die ‘mit Vorzeichen versehen sind’. Was ist det(E), wenn E, wie oben das multiplikativ neutrale, also Einselement von M2 (R) bezeichnet. Vergleiche det a b c d mit det a + ce b + de c d Bemerkung 2.3.8 Auch für n × n-Matrizen mit n > 2 über einem kommutativen Ring kann man Determinanten definieren. Und es gilt det(AB) = det(A) det(B). 2.3.9 Weiterhin sei R kommutativ. Welche 2 × 2-Matrizen sind invertierbar? Wie kann man ihr Inverses berechnen? Sei A in M2 (R) invertierbar, d.h. es gebe eine Matrix B ∈ M2 (R) mit AB = E. Dann ist det(A) · det(B) = det(AB) = det(E) = 1. Also muss det(A) in R invertierbar sein. a b Umgekehrt, sei det = ad − bc in R invertierbar. Man rechnet leicht nach, dass c d a b d −b ad − bc 0 · = = (ad − bc)E c d −c a 0 ad − bc ist, und dass bei Vertauschung der Faktoren dasselbe herauskommt. Deshalb ist d −b ad−bc −c ad−bc die zu a b c d inverse Matrix. ad−bc a ad−bc 2.3. MATRIZEN 53 2.3.10 Ist A= so ist a b c d a b c d mit det(A) = 0 ad − bc 0 0 0 d −b · = = . −c a 0 ad − bc 0 0 Also ist A ein Links-Nullteiler und auch ein Rechtsnullteiler, da man in diesem Fall die beiden Faktoren vertauschen darf. Wenn R ein Körper ist, ist eine 2 × 2-Matrix entweder sowohl ein Links- wie ein Rechts-Nullteiler oder invertierbar. Frage: Gilt dies auch im Falle R = Z? 2 0 Antwort: Die Matrix hat die Determinante 2, ist also über Z nicht invertierbar. 0 1 Andererseits ist sie über Q invertierbar, kann also in dem Unterring M2 (Z) von M2 (Q) kein Nullteiler sein. 2.3.11 Berechne a b −b a 0 0 0 a b a b a b0 . und · · 0 0 b 0 a0 −b a b a Man sieht, das sowohl die Matrizen der ersten Form, wie die der zweiten jeweils einen kommutativen Unterring von M2 (R) bilden. (Die Kommutativität von R ist vorausgesetzt.) Wir interessieren uns hier nur für den ersten Fall. Wir setzen voraus, dass R ein Körper ist. Es gilt a b det = a2 + b 2 −b a Im Körper Q (und auch im später zu besprechenden Körper R der reellen Zahlen) gilt die folgende Regel: a2 + b2 = 0 ⇐⇒ a = b = 0 (∗) Sei jetzt K ein Körper, in dem diese Regel gilt. Dann ist auch die Menge der Matrizen a b ∈ M2 (K) −b a ein Körper. Ist K = R, so erhält man den Körper C der komplexen Zahlen, den wir im Kapitel 8 besprechen. AUFGABEN 1. Berechne folgende Matrizenprodukte, ebenso die Produkte, wenn Du die Faktoren vertauscht hast: a b 0 1 a b 1 e c d 1 0 c d 0 1 54 KAPITEL 2. NEUE RECHENBEREICHE 2. a) Berechne a+b b b a 1 1 1 0 . b) Bestimme mit Hilfe der Fibonacci-Folge die Werte der Potenzen (in M2 (Z)) 1 1 1 0 n , n∈N. Berechne dabei (für spätere Aufgaben) mindestens die ersten 3, besser noch die ersten 8 Potenzen konkret. 3. Zeige, dass die Menge K der folgenden 4 Matrizen aus M2 (F2 ) A := 0 1 1 1 2 , A = 1 1 1 0 3 , A = E, und 0 = 0 0 0 0 (deren Einträge aus dem ‘Minikörper’ F2 stammen) in Bezug auf die Addition und Multiplikation ein Körper ist. (Es gibt also einen Körper, der aus 4 Elementen besteht.) Versuche, mit möglichst wenigen Rechnungen auszukommen. 4. Sei A eine Matrix von n Zeilen und n Spalten, mit folgenden Eigenschaften: (i) In jeder Zeile und jeder Spalte komme jede der Zahlen 1, . . . , n vor. (Dann kommt jede dieser Zahlen auch nur einmal in jeder Zeile, bzw. Spalte vor. Warum?) (Dies ist übrigens eine der Bedingungen beim Sudoku.) (ii) A sei symmetrisch (bzgl. der ‘(Haupt)-Diagonale’), d.h. es sei aij = aji für alle i, j. a) Zeige: Wenn n ungerade ist, kommt auch in der Diagonale (a11 , a22 , . . . , ann ) jede der Zahlen 1, . . . , n genau einmal vor. b) Zeige: Wenn n gerade (und > 0) ist, gilt dies nie, d.h. es kommt mindestens eine Zahl doppelt vor. 5. Seien a, b ∈ Z. Zeige: Im Bereich der 2×2-Matrizen über Z gibt es genau dann eine invertierbare Matrix, deren erste Zeile (a, b) ist, wenn ggT(a, b) = 1 ist. 6. Erinnere Dich an den Paragrafen 2.3.9, insbesondere an die Regel a b c d d −b −c a = (ad − bc)E d −b a b Die Matrix heißt auch die zur Matrix A = komplementäre Matrix. Sie −c a c d sei mit c(A) bezeichnet. Zeige: c(AB) = c(B)c(A). Folgere hieraus und aus c(A)A = Ac(A) = det(A)E, dass det(AB) = det(A) det(B) gilt. 2.4. RESTKLASSEN 2.4 55 Restklassen Es ist nicht nötig, dass Du das Folgende jetzt sofort liest und verstehst. Solltest Du allerdings Mathematik studieren, wirst Du mit diesen Dingen konfrontiert werden. 2.4.1 Die Folge der natürlichen Zahlen 0, 1, 1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . . weist keine Wiederholung auf. Immer ist ja n + 1 > n. Aber nichts hindert uns daran, einen Bereich zu betrachten, in dem man wieder bei 0 landet, wenn man zur Null m-mal die 1 addiert. Natürlich ist dies dann nicht mehr der Bereich der natürlichen Zahlen, sondern etwas Neues. Immerhin wirst Du sehen, dass man auf diese Weise einen Ring erhält. Du weißt, wie man n ∈ N durch m ∈ N1 mit Rest dividiert, also n = qm + r mit natürlichen Zahlen q, r und 0 ≤ r ≤ m − 1 schreibt. Wir nennen in diesem Fall r den Rest, den n bei Division durch m lässt. Wenn Zahlen als Größen betrachtet, so wird man bei der Division mit Rest den ‘Quotienten’ q n als das wichtigste ansehen. Denn es ist ja m = q + mr , wo 0 ≤ mr < 1 ist. Hier wollen wir jedoch umgekehrt dem Rest r unsere Aufmerksamkeit zukehren. Beliebige ganze Zahlen n, also auch negative, können durch m > 0 mit Rest dividiert werden. In der Tat gibt es zu gegebenen n, m ∈ Z mit m > 0 ganze Zahlen q, r mit 0 ≤ r ≤ m − 1 mit n = qm + r. Für m = 10 gilt z.B. −4 = (−1) · 10 + 6 und 34 = 3 · 10 + 4. Bezeichnung: Ist m festgelegt, so bezeichnen wir den Rest, den eine ganze Zahl n bei Division durch m lässt, mit ρ(n). Beispiele 2.4.2 Erinnere Dich an den Körper F2 , der aus den Elementen gerade und ungerade besteht. Die geraden Zahlen sind diejenigen, die Bei Division durch 2 den Rest 0 lassen, während die ungeraden Zahlen diejenigen sind, die bei Division durch 2 den Rest 1 lassen. Du hast gesehen, dass diese beiden Begriffe gerade und ungerade einen Ring bilden. Die Verknüpfungen + und · entstehen durch die entsprechenden Verknüpfungen der Reste bei Division durch 2. Dabei ist zunächst 1 + 1 = 2, aber 2 lässt bei Division durch 2 den Rest 0. Du weißt vielleicht auch folgendes: Wenn du von zwei im Dezimalsystem geschriebenen natürlichen Zahlen nur die jeweils letzte Stelle kennst, so kennst Du auch die letzte Stelle ihrer Summe, bzw. die ihres Produktes. Nun ist die letzte Stelle einer im Dezimalsystem geschriebenen natürlichen Zahl nichts anderes als der Rest, den diese Zahl bei Division durch 10 lässt. (Bei negativen ganzen Zahlen ergibt sich der Rest bei Division durch 10 als 0, wenn die letzte Dezimalziffer eine 0 ist, hingegen gleich 10 − r, wenn die letzte Ziffer r ist. Der Rest soll ja im Bereich {0, 1, . . . , 9} liegen.) Du kannst somit im Bereich der zehn Ziffern 0, 1, . . . , 9 auch eine ‘Summe’ und ein ‘Produkt’ definieren, indem Du von der in N gebildeten Summe, bzw. dem Produkt nur die letzte Ziffer betrachtest. In dem Sinne ist etwa 6+7 = 3, 6+4 = 0; 6·3 = 8, 2·5 = 4·5 = 6·5 = 0, 3·7 = 1 usw. Wir werden bald sehen, dass Du auf diese Weise einen Ring aus 10 Elementen erhältst, der allerdings kein Körper ist. 56 KAPITEL 2. NEUE RECHENBEREICHE Bevor Du jetzt meinst, dies seien völlig uninteressante und für einen normalen Menschen ganz irrelevante Gedankenspielereien von weltfremden Mathematikern, lass Dir sagen, dass diese Art zu rechnen zusammen mit Kenntnissen über Primzahlen uns zu den modernen Verschlüsselungsmethoden geführt haben, die ich im 1. Kapitel bereits angesprochen habe, auf die ich am Ende des Buches zurückkommen werde und die Du übrigens nutzt, wenn Du Dein Konto mit Online-Banking verwaltest. 2.4.3 Seien m ∈ N1 , d.h. eine ganze Zahl > 0, und n1 , n2 ∈ Z. Für i = 1, 2 dividieren wir ni mit Rest durch m. Wir erhalten Darstellungen n1 = q1 m + r1 und n2 = q2 m + r2 mit 0 ≤ ri ≤ m − 1 Daraus ergibt sich n1 +n2 = (q1 +q2 )m+(r1 +r2 ), sowie n1 n2 = q1 q2 m2 +q1 r2 m+q2 r1 m+r1 r2 = (q1 q2 m + q1 r2 + q2 r1 )m + (r1 r2 ). Hieraus erhältst Du: Satz 2.4.4 Der Rest, den n1 + n2 bei Division durch m lässt, ist derselbe, den r1 + r2 bei Division durch m lässt. Ebenso ist der Rest, den n1 n2 bei Division durch m lässt, derselbe, den r1 r2 bei Division durch m lässt. In Formeln: ρ(n1 + n2 ) = ρ(ρ(n1 ) + ρ(n2 )) und ρ(n1 n2 ) = ρ(ρ(n1 )ρ(n2 )). Folgerung 2.4.5 Die ganzen Zahlen n1 und n01 mögen bei Divison durch m denselben Rest lassen; ferner mögen auch n2 und n02 bei Division durch m denselben Rest lassen. Dann lassen sowohl n1 + n2 und n01 + n02 , als auch n1 n2 und n01 n02 bei Division durch m denselben Rest. Anders ausgedrückt: Wenn ρ(ni ) = ρ(n0i )gilt, dann auch ρ(n1 + n2 ) = ρ(n01 + n02 ) und ρ(n1 n2 ) = ρ(n01 n02 ). Natürlich erhältst Du hiermit: ρ(n) = ρ(n0 ) ⇒ ρ(nk ) = ρ(n0k ) für k ∈ N. Aber 0 Vorsicht: Aus ρ(k) = ρ(k 0 ) folgt fast nie ρ(nk ) = ρ(nk ). Zum Beispiel sei m = 10. Dann ist ρ(1) = ρ(11), aber ρ(21 ) = 2 und ρ(211 ) = ρ(2048) = 8. Definition 2.4.6 Sei m ∈ N1 fest gewählt. Für ganze Zahlen j, k ∈ {0, 1, 2, . . . , m − 1} (der Menge der natürlichen Zahlen, die kleiner als m sind) definieren wir eine neue Addition ⊕ und eine neue Multiplikation ⊗ wie folgt: Addition: j ⊕ k sei der Rest, den j + k bei Division durch m lässt. Multiplikation: j ⊗ k sei der Rest, den jk bei Division durch m lässt. Symbolisch j ⊕ k = ρ(j + k), j ⊗ k := ρ(jk). Die Menge {0, 1, 2, . . . , m − 1} zusammen mit den beiden Verknüpfungen ⊕, ⊗ bezeichnen wir mit Zm . Die Zeichen ⊕, ⊗ benutzen wir nur vorläufig! 2.4. RESTKLASSEN 57 Theorem 2.4.7 Zm ist ein kommutativer Ring. Beweis: Die Ring-Gesetze übertragen sich vermittels ρ von Z auf Zm . Ich führe beispielshaft die Beweise des Kommutativgesetzes und des Distributivitätsgesetzes aus: j ⊕ k = ρ(j + k) = ρ(k + j) = k ⊕ j , i ⊗ (j ⊕ k) = i ⊗ ρ(j + k) = ρ(i(j + k)) = ρ(ij + ik) = ρ(ρ(ij) ⊕ ρ(ik)) = (i ⊗ j) ⊕ (i ⊗ k) Darüber hinaus ist klar, dass 0 das neutrale Element für die Addition und 1 dasjenige für die Multiplikation in Zm ist. Letzteres gilt zumindest im Falle m > 1. Falls m = 1 ist, erhalten wir den Nullring. Beispiele 2.4.8 a) Sei m = 5. Wir stellen die Additions- und Multiplikationstafel von Z5 auf. ⊕ 0 1 2 3 4 0 0 1 2 3 4 1 1 2 3 4 0 2 2 3 4 0 1 3 3 4 0 1 2 4 4 0 1 2 3 ⊗ 0 1 2 3 4 0 0 0 0 0 0 1 0 1 2 3 4 2 0 2 4 1 3 3 0 3 1 4 2 4 0 4 3 2 1 In der Tat ist z.B. 3 ⊕ 2 = ρ(5) = 0, 4 ⊕ 3 = ρ(7) = 2; 4 ⊗ 4 = ρ(16) = 1, 3 ⊗ 4 = ρ(12) = 2 In jeder Zeile der Multiplikationstafel außer der ersten steht eine 1. Erkenne daran, dass jedes Element 6= 0 ein multiplikativ Inverses hat, dass also ein Körper vorliegt! b) Dasselbe machen wir im Falle m = 6. ⊕ 0 1 2 3 4 5 0 0 1 2 3 4 5 1 1 2 3 4 5 0 2 2 3 4 5 0 1 3 3 4 5 0 1 2 4 4 5 0 1 2 3 5 5 0 1 2 3 4 ⊗ 0 1 2 3 4 5 0 0 0 0 0 0 0 1 0 1 2 3 4 5 2 0 2 4 0 2 4 3 0 3 0 3 0 3 4 0 4 2 0 4 2 5 0 5 4 3 2 1 58 KAPITEL 2. NEUE RECHENBEREICHE Während die Additionstabellen von Z5 und Z6 einander ziemlich ‘ähnlich’ sehen, siehst Du bei den Multiplikationstabellen große Unterschiede! In der von Z6 findet sich nur in der zweiten und der letzten eine 1. Zudem findet man öfter das Produkt 0, wo beide Faktoren 6= 0 sind: z.B. 2 ⊗ 3 = 0. Denn es ist 2 · 3 = 6 und 6 lässt bei Division durch 6 den Rest 0. In dem Ring Zm gibt es Nullteiler. Der Unterschied zwischen 5 und 6, der die Unterschiede in den Multiplikationstabellen nach sich zieht, liegt darin, dass 5 eine Primzahl ist, 6 aber nicht. Das werden wir unten allgemeiner feststellen. Eine andere Sichtweise. Man kann die Ringe Zm auch auf andere Weise konstruieren. Wir fassen nämlich die Zahlen, die bei Division durch m denselben Rest lassen, jeweils zu einer Menge zusammen, die wir als Element einer Menge Z/(m) auffassen. Definition 2.4.9 Seien r, m ∈ Z und m > 0. Die Restklasse von r modulo m ist die Menge r + mZ := {r + mk | k ∈ Z}, d.h. die Menge, die aus allen Zahlen der Form r + mk besteht, wo k ganz Z durchläuft (während r und m festgehalten werden). Diese Menge wird auch mit (r mod m) bezeichnet. Satz 2.4.10 a) Ist 0 ≤ r < m, so ist r + mZ die Menge aller ganzen Zahlen, die bei der Division durch m den Rest r lassen. b) Allgemeiner gilt für beliebige r ∈ Z, dass r + mZ die Menge aller ganzen Zahlen ist, die bei Division durch m den Rest ρ(r) lassen, wo ρ wie oben definiert ist. Beweis: a) ist klar. b) Nach Definition von ρ kann man r = ρ(r) + mu schreiben. Für jedes k ∈ Z gilt dann r + mk = ρ(r) + mu + mk = ρ(r) + m(u + k). Also lässt jede Zahl r + mk ∈ r + mZ bei Division durch m den Rest ρ(r). Und umgekehrt, wenn eine Zahl den Rest ρ(r) lässt, also s = ρ(r) + mv gilt, so ist s = r − mu + mv = r + m(v − u) ∈ r + mZ. 2.4.11 Es ist wichtig, dass Du folgendes beachtest: Restklassen r + mZ und s + mZ sind genau dann einander gleich, wenn sie aus denselben Zahlen bestehen, d.h. wenn jede Zahl der Form r + mk sich auch in der Form s + ml schreiben lässt und umgekehrt. Aus r + mZ = s + mZ folgt nicht allgemein, dass r = s sein müsste! Ein Beispiel ist 31 + 10Z = 51 + 10Z Betrachte den folgenden Satz auch im Lichte dieser Bemerkung! 2.4. RESTKLASSEN 59 Satz 2.4.12 Sei m > 0 eine festgewählte ganze Zahl und ρ(n) – wie oben – der Rest, den eine ganze Zahl n bei Division durch m lässt. Für ganze Zahlen r, s sind dann folgende Aussagen äquivalent: (i) r − s ist durch m teilbar; (ii) r ∈ s + mZ; (iii) ρ(r) = ρ(s); (iv) r + mZ = s + mZ. Beweis: s + mZ. (i) ⇒ (ii): Wegen m|r − s gibt es ein k ∈ Z mit r − s = mk. Also gilt r = s + mk ∈ (ii) ⇒ (iii): Da s + mZ aus denjenigen ganzen Zahlen besteht, die bei Division durch m den Rest ρ(s) lassen, folgt aus (ii) die Gleichung ρ(r) = ρ(s). (iii) ⇐⇒ (iv): r + mZ (bzw. s + mZ) besteht aus denjenigen ganzen Zahlen, die bei Division durch m den Rest ρ(r) (bzw. ρ(s)) lassen. Die Gleichheit der Zahlen ρ(r) = ρ(s) ist also äquivalent zur Gleichheit der Mengen r + mZ = s + mZ. (iii) ⇒ (i): Auf Grund der Definition von ρ kann man r = ρ(r) + mu und s = ρ(s) + mv schreiben. Aus der Gleichheit ρ(r) = ρ(s) ergibt sich dann r − s = mu − mv = m(u − v). Definition 2.4.13 Zwei ganze Zahlen r, s heißen zueinander kongruent modulo m, wenn die äquivalenten Aussagen (i)–(iv) des letzten Satzes gelten. In diesem Falle schreibt man r ≡ s (mod m). Ergänzungen: Wir wollen die Kongruenz modulo m für beliebiges m ∈ Z erklären. Dies tun wir, indem wir sie durch die äquivalenten Aussagen (i) und (iv) definieren. Das bedeutet im Einzelnen: a) Im Fall m = 1 (der oben nicht ausgeschlossen war) gilt r ≡ s (mod 1) für alle ganzen Zahlen r und s. b) Im Gegensatz dazu gilt r ≡ s (mod 0) nur dann, wenn r = s ist. c) r ≡ s (mod m) gilt genau dann, wenn r ≡ s (mod − m) ist. Es bedeutet also keine Einschränkung der Allgemeinheit, wenn wir im Folgenden m ∈ N voraussetzen. Bemerkungen 2.4.14 Sei m ∈ N. Du wirst ohne Probleme folgende Aussagen beweisen können: a) n ≡ n (mod m) für jede ganze Zahl n. b) n ≡ n0 (mod m) ⇒ n0 ≡ n (mod m) c) n ≡ n0 (mod m), n0 ≡ n00 (mod m) ⇒ n ≡ n00 (mod m) d) n ≡ ρ(n) (mod m) 60 KAPITEL 2. NEUE RECHENBEREICHE Beispiele 2.4.15 a) Sei m = 2. Zwei Zahlen sind genau dann modulo 2 kongruent, wenn sie entweder beide gerade oder beide ungerade sind. b) Sei m = 10. Zwei natürliche Zahlen sind modulo 10 genau dann kongruent, wenn sie dieselbe letzte Ziffer in ihrer Dezimalzahldarstellung haben, z.B. 4 ≡ 34 ≡ 1024 (mod 10). Bei den negativen Zahlen musst Du aufpassen: −6 ≡ −336 ≡ 4 (mod 10), nicht wahr? d) Sei m = 5. In dem folgenden (im Prinzip unendlich großen) Diagramm stehen die Zahlen, die kongruent modulo 5 sind, untereinander. .. .. .. .. .. . . . . . −10 −9 −8 −7 −6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 .. .. .. .. .. . . . . . Jede Spalte besteht also aus Zahlen die zueinander modulo 5 kongruent sind. Und zwei modulo 5 kongruente Zahlen befinden sich in derselben Spalte. Die Spalten obigen Diagramms, als Mengen aufgefasst sind die Restklassen modulo 5. Jede ganze Zahl kommt in dem Diagramm genau einmal vor, liegt also in einer, aber auch nur einer der Spalten, d.h. einer Restklasse modulo 5. Die mittlere Spalte ist z.B. die Restklasse von 7 modulo 5, aber auch die Restklasse von 2, auch die von -3, modulo 5. Es gibt 5 Spalten. Diese Dinge wollen wir allgemein einsehen. Bemerkungen 2.4.16 Sei m ≥ 0 festgelegt. a) Jede ganze Zahl liegt in einer Restklasse. Denn r = r + 0 · m liegt in r + mZ. b) Die Zahlen, die in einer Restklasse modulo m liegen, sind modulo m zueinander kongruent. c) Jede ganze Zahl n liegt in einer, aber auch nur einer Restklasse modulo m, nämlich – im Falle m > 0 – in derjenigen, in der auch ρ(n) liegt. Siehe Bemerkung e) für den Fall m = 0. Insbesondere sind je zwei verschiedene Restklassen disjunkt, d.h. sie haben kein Element gemeinsam. d) Ist m > 0, so gibt es genau m Restklassen modulo m, nämlich die folgenden 0 + mZ, 1 + mZ, 2 + mZ, . . . , (m − 1) + mZ Ist nämlich n ganz, so dividiere n durch m mit Rest: n = r+km, wo 0 ≤ r ≤ m−1 ist. Dann gilt n ≡ r (mod m). Deshalb ist n + mZ = r + mZ. Somit ist jede Restklasse von der angegebenen Art. Seien nun r, s zwei ganze Zahlen mit 0 ≤ r ≤ s ≤ |m| − 1. Ist dann r + mZ = s + mZ, so 2.4. RESTKLASSEN 61 muss s − r durch m teilbar sein. Das geht nur, wenn s − r = 0 oder s − r ≥ m ist. Da s und r kleiner als m sind, bleibt nur die Möglichkeit, dass r = s ist. In dem nicht so interessanten Fall m = 1 gibt es eine einzige Restklasse modulo m, nämlich ganz Z. e) Die Restklassen modulo 0 sind die aus je einer Zahl bestehenden Teilmengen von Z. Es gibt also unendlich viele von diesen. Weiterhin sei ein m ∈ N gewählt, und wir wollen die Menge Z/(m) aller Restklassen modulo m betrachten. Im Falle m > 0 besteht Z/(m) aus m Elementen. Um Z/(m) zu einem Ring zu machen, beweisen wir zunächst Lemma 2.4.17 Seien r ≡ r0 (mod m) und s ≡ s0 (mod m). Dann sind auch r + s ≡ r0 + s0 (mod m) und rs ≡ r0 s0 (mod m). Beweis: Nach Voraussetzung gibt es u, v ∈ Z mit r0 = r +mu, s0 = s+mv. Dann ist r0 +s0 = r+s+(u+v)m und r0 s0 = (r+mu)(s+mv) = rs+mrv +msu+mumv = rs+m(rv +su+muv). D.h. die Differenzen (r0 + s0 ) − (r + s) und r0 s0 − rs sind Vielfache von m. Da die Aussage r + mZ = r0 + mZ (für ganze r, r0 ) äquivalent zu r ≡ r0 (mod m) ist, kann man das o.a. Lemma auch wie folgt aussprechen: Folgerung 2.4.18 Es gelte r + mZ = r0 + mZ und s + mZ = s0 + mZ. Dann gilt auch (r + s) + mZ = (r0 + s0 ) + mZ, sowie (rs) + mZ = (r0 s0 ) + mZ. Definition 2.4.19 Seien r + mZ, s + mZ Restklassen modulo m. Dann definieren wir ihre Summe und ihr Produkt wie folgt: (r + mZ) + (s + mZ) := (r + s) + mZ , (r + mZ) · (s + mZ) := (rs) + mZ Dies ist eine richtige Definition. Denn wegen der o.a. Folgerung hängt das Ergebnis der Addition und der Multiplikation nur von den Restklassen r+mZ und s+mZ und nicht von den speziellen Wahlen der r, s ab. Wir sagen in diesem und analogen Fällen: Die Addition (r + mZ) + (s + mZ) = (r + s) + mZ und die Multiplikation (r + mZ) · (s + mZ) := (rs) + mZ seien wohldefiniert. Ein Beispiel, wo das nicht der Fall ist, wäre der Versuch Potenzen, in denen Basis und Exponet Restklassen modulo desselben m sind, auf folgende Weise zu definieren: (j + mZ)(k+mZ) := (j k ) + mZ ??? Ein spezielles Beispiel kennst Du bereits. (S. nach 4.5). Es ist ja 1 + 10Z = 11 + 10Z, aber 21 + 10Z 6= 211 + 10Z. Noch ein Beispiel: Es ist zwar 2 + 3Z = 5 + 3Z, aber (22 ) + 3Z 6= (25 ) + 3Z. Denn 22 ≡ 1 (mod 3), 25 ≡ 2 (mod3). 62 KAPITEL 2. NEUE RECHENBEREICHE Bemerkung 2.4.20 Man kann die Summe und das Produkt zweier Restklassen C1 , C2 auch folgendermaßen definieren: Wähle c1 ∈ C1 und c2 ∈ C2 . Dann sei C1 + C2 diejenige Restklasse, in der c1 + c2 liegt, und C1 C2 diejenige Restklasse, in der c1 c2 liegt. 2.4.21 Wir wollen jetzt einsehen, dass (für m > 0) der zuerst definierte Ring Zm und Z/(m) im Wesentlichen dasselbe sind! Dazu identifizieren wir Zm mit Z/(m) auf folgende Weise: Jedes r = 0, 1, . . . , m−1 identifizieren wir mit der Restklasse r + mZ. (Das bedeute, dass umgekehrt die Restklasse r + mZ mit ρ(r) identifiziert wird.) Addition und Multiplikation, die wir sowohl in Zm , als auch in Z/(m) definiert haben, stimmen dann überein. Denn es gilt ja für r, s ∈ Zm , d.h. r, s ∈ {0, 1, . . . , m−1} folgendes (r + mZ) + (s + mZ) = (r + s) + mZ = ρ(r + s) + mZ = (r ⊕ s) + mZ und dasselbe, wenn man ‘+’ durch ‘·’ und ‘⊕’ durch ‘⊗’ ersetzt. Im folgenden will ich keinen Unterschied mehr zwischen den beiden Ringen Zm und Z/(m) machen. Ich verwende nur noch die Bezeichnung Z/(m). (Es gibt auch die Bezeichnungen Z/mZ, sowie Z/m.) Man sagt Z modulo m oder ausführlicher der Restklassenring von Z modulo m. Ich überlasse Dir, wie Du den Ring Z/(m) verstehen willst. Persönlich ziehe ich es vor, ihn als Ring von Restklassen aufzufassen. Die Auffassung als Ring der Zahlen 0, 1, . . . , m − 1 mit angepassten Rechenarten ist sicher anfangs einfacher zu verstehen, ist aber möglicherweise etwas willkürlich und starr. Anschaulich sollte man sich die Elemente von Z/(m) ‘kreisförmig angeordnet’ vorstellen. (Für m = 6 zum Beispiel.) 2• •1 3• •0 4• •5 Die Addition entspricht dann der Addition von Winkeln. 2.4.22 Repräsentanten. Erinnere Dich, dass Du mit 0 + mZ, 1 + mZ, 2 + mZ, . . . , (m − 1) + mZ, bereits alle Restklassen modulo m erfasst hast. Das System der ganzen Zahlen (0, 1, 2, . . . , m − 1) ist ein sogenanntes Repräsentantensystem modulo m. Wie Du oben gesehen hast, ist ein solches gut dafür, in Z/(m) konkret zu rechnen. Definition 2.4.23 Sei m > 0. Ein Repräsentantensystem modulo m ist ein System ganzer Zahlen n1 , . . . , nm , derart das in jeder Restklasse modulo m genau eine der Zahlen ni liegt. 2.4. RESTKLASSEN 63 Beispiele 2.4.24 m aufeinander folgende Zahlen bilden immer ein Repräsentantensystem. Folgende Repräsentantensyteme sind manchmal nützlich: a) Das System 1, 2, . . . , m. (Beachte, dass die Restklasse von m das Nullelement von Z/(m) ist. b) Falls m ungerade ist, das System (− m−1 , . . . , −1, 0, 1, . . . , m−1 ). 2 2 Für m = 11 bekommst Du das Repräsentantensystem −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5. Um die Multiplikation in Z/(11) vollständig zu beschreiben, genügt es, eine Tabelle für die Produkte der Restklassen 0, 1, . . . , 5 anzugeben: ⊗ 0 1 2 3 4 5 0 0 0 0 0 0 0 1 2 3 4 5 0 0 0 0 0 1 2 3 4 5 2 4 -5 -3 -1 3 -5 -2 1 4 4 -3 1 5 -2 5 -1 4 -2 3 Wenn Du z.B. (−3)·2 ausrechnen willst, zieh das Gesetz für die Multiplikation mit Vorzeichen in Ringen heran, und Du erhältst (−3)·2 = −(3·2) = −(−5) = 5. D.h., es ist (−3+11Z)(2+11Z) = 5 + 11Z. Du erkennst an dieser Tabelle auch, dass jedes Element ein multiplikativ Inverses hat. Denn in jeder Zeile außer der obersten findet sich eine 1 oder eine −1. Z.B. ist 5 · 2 = −1. Daraus folgt 5 · (−2) = 1. Mithin ist −2 ein multiplikativ Inverses von 5. Du siehst: Z/(13) ist ein Körper. c) Falls m gerade ist, die Systeme (− m2 +1, . . . , −1, 0, 1, . . . , m2 ) und (− m2 , . . . , −1, 0, 1, . . . , m2 −1). Frage: Wann, d.h. für welche m, besitzt der Ring Z/(m) Nullteiler? Die Antwort ist einfach: Satz 2.4.25 Sei m > 1. Der Ring Z/(m) besitzt genau dann Nullteiler, wenn m zerlegbar, d.h. keine Primzahl ist. Beweis: Sei m zerlegbar, m = k1 k2 , wo die (positiven) ki weder 1 noch m sind. Dann sind die Restklassen (ki mod m) beide von 0 (der Restklasse (0 mod m)) verschieden, aber es gilt (k1 mod m)(k2 mod m) = (m mod m) = (0 mod m). Sei m = p eine Primzahl, und es gelte (k1 k2 mod p) = (0 modp). Dann ist p ein Teiler von k1 k2 . Nach Euklids Lemma ist dann p ein Teiler von k1 oder von k2 . Etwa sei p|k1 . Dann ist (k1 mod p) die Nullrestklasse. Wenn p eine Primzahl ist, ist Z/p wegen folgenden Satzes sogar ein Körper. Satz 2.4.26 Sei R ein endlicher Ring. Ist c ∈ R kein Nullteiler, so ist c (multiplikativ) invertierbar, d.h. es gibt zu c ein multiplikativ Inverses. Ein endlicher nullteilerfreier Ring ist ein Körper. 64 KAPITEL 2. NEUE RECHENBEREICHE Beweis: Seien a1 , . . . , an die endlich vielen untereinander verschiedenen Elemente von R. Dann sind die n Elemente ca1 , ca2 , . . . , can nach der Kürzungsregel untereinander verschieden. Sie machen also alle Elemente von R aus. Eines unter ihnen, etwa caj ist also gleich 1. Das bedeutet aber, dass aj das Inverse von c ist. Beispiele 2.4.27 a) Im Körper Z/13 ist 2 das multiplikativ Inverse von 7 und 3 das multiplikativ Inverse von 9. b) In dem Ring Z/26 ist 15 das multiplikativ Inverse von 7. Beachte hierzu, dass (a mod m) in Z/(m) genau dann multiplikativ invertierbar ist, wenn a zu m teilerfremd ist. Dies ergibt sich z.B. aus der nächsten Bemerkung. c) Der unendliche Ring Z ist zwar nullteilerfrei, aber kein Körper. Bemerkung 2.4.28 Du kannst das multiplikativ Inverse eines Elementes von Z/(m) durch zeitaufwändiges Probieren finden. Glücklicherweise kann man mit Hilfe des euklidischen Algorithmus dasselbe viel schneller berechnen. (Beachte dabei, dass Euklid unser Problem gar nicht kannte.) Frage: Wie berechnet man das multiplikativ Inverse der Restklasse von a in Z/(m), wenn a zu m teilerfremd ist? Antwort: Mit Hilfe des euklidischen Algorithmus bestimmt man a0 , m0 ∈ Z, für die aa0 + mm0 = 1 gilt. Dann ist die Restklasse von a0 modulo m multiplikativ invers zu der von a. 2.4.29 Wir kennen jetzt unendlich viele endliche Körper, da es unendlich viele Primzahlen gibt. Es gibt weitere endliche Körper, nämlich einen zu jeder Primzahlpotenz pn mit ganzem positiven n. Beachte aber, dass Z/(pn ) für n ≥ 2 Nullteiler 6= 0 hat, also nicht etwa der gesuchte Körper aus pn Elementen sein kann. Bemerkung 2.4.30 Du kannst ja mal versuchen, ob Du Restklassen in der Menge Q der rationalen Zahlen bilden und auch mit ihnen rechnen kannst. Sei m eine positive ganze (oder auch rationale) Zahl. Betrache ’Restklassen’ a + mZ für beliebige rationale Zahlen a. Du kannst zeigen, dass jede rationale Zahl in genau einer solchen Restklasse liegt. Willst Du zwei solche Restklassen wie oben addieren, geht das gut. (Zeige das!) Willst Du sie multiplizieren, kommst Du in Schwierigkeiten. Seien etwa m = 1, a = 1/2, a0 = 3/2 und b = 1/2. Dann gilt a + Z = a0 + Z aber ab + Z 6= a0 b + Z, da 3/4 − 1/4 nicht ganz ist. Die Menge Q/mZ erfüllt in Bezug auf die Addition die Axiome, die für die Addition in einem Ring gelten. 2.4. RESTKLASSEN 65 AUFGABEN 1. Man kann den Körper Z/(3), wie Du oben gesehen hast, auch wie folgt beschreiben. Die Elemente seien mit −1, 0, 1 bezeichnet. Die Multiplikation ist so definiert als handle es sich um die entsprechenden Elemente von Z. Für die Addition gelte 1 + 1 = −1 , (−1) + (−1) = 1, und die übrigen sieben Summen seien wieder so definiert, als handle es sich um die entsprechenden Elemente von Z. 2. a) Bestimme die Quadrate in dem Ring Z/(8). b) Eine im Dezimalsystem geschriebene mindestens dreistellige natürliche Zahl, die als letzte drei Ziffern 2 Einsen und eine 0 in beliebiger Reihenfolge hat (...011, ...101, ...110), ist keine Quadratzahl. (Zeige dies etwa mit Hilfe von a).) 3. Sei M eine endliche Menge von n + 1 (verschiedenen) ganzen Zahlen und n ≥ 1. Zeige, dass mindestens eine der Differenzen von zwei verschiedenen Elementen von M durch n teilbar ist. 4. Es soll eine Fahne mit einem Muster folgender Art entworfen werden: ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ D.h. n Sterne sollen in zwei Quadrate von m1 × m1 bzw. m2 × m2 Sternen angeordnet werden, die sich in einem Quadrat von k × k Sternen überlappen. Dabei soll zwar n, aber keine der drei Zahlen m1 , m2 , k ein Vielfaches von 5 sein. (Darum sind m1 = 0, m2 = 0 und k = 0 auch ausgeschlossen.) Ist das möglich? 5. a) Sei m ∈ N, m = k X ai 10i mit ai ∈ Z. (Sind die ai aus der Menge der ’Ziffern’ 0, 1, 2, . . . , 9 i=0 gewählt, so beschreibt dies die Dezimalzahldarstellung von m.) Zeige: k k k X X X m≡ ai (mod 3) und m ≡ ai (mod 9) und m ≡ (−1)i ai (mod 11). i=0 i=0 i=0 Den jeweiligen Ausdruck auf der rechten Seite der Kongruenzen nennt man, wenn die ai die Ziffern der Dezimalzahldarstellung von m sind, in den ersten beiden Fälle die Quersumme, im letzten Fall die alternierende Quersumme der Zahl m. Dieser Begriff ist kein wirklich mathematischer Begriff, insofern als er von der Schreibweise im Dezimalsystem abhängt. b) Leite daraus die bekannten Kriterien für die Teilbarkeit von in Dezimalschreibweise gegebenen Zahlen durch 3, 9 bzw. 11 ab. 66 KAPITEL 2. NEUE RECHENBEREICHE c) Schreibe die natürliche Zahl n im Dezimalsystem mit ungerade vielen Ziffern. Dabei darf die erste Ziffer eine 0 sein. Bilde die Spiegelzahl n0 von n. (Die Spiegelzahl von z.B. 01234 ist 43210.) Zeige: 99 teilt n − n0 . d) Gilt dies auch, wenn n mit gerade vielen Ziffern geschrieben ist? Gilt in diesem Fall zumindest noch 9|n − n0 ? e) Bei einer Unterhaltung bittet Dich Dein Gegenüber, Du mögest eine beliebige 5-stellige (natürliche) Zahl, die nicht kleiner als 10050 ist, im Dezimalsystem – vor ihm verborgen – notieren, und die Quersumme von dieser Zahl subtrahieren. Wenn Du ihm dann die letzten 4 Ziffern dieser Differenz in beliebiger Reihenfolge angibst, so macht er sich anheischig, die erste zu nennen. Wie macht er das? 6. Von der Schule her ist Dir vielleicht die Neunerprobe“ geläufig. Eine ausgeführte Multiplikation ” zweier (größerer) Zahlen kann man auf ihre Richtigkeit folgendermaßen testen: Der Neunerrest“ ” (d.h. der Rest bei der Division durch 9) des Produktes muss gleich dem Neunerrest“ des ” Produktes der Neunerreste“ der Faktoren sein. Wieso gilt das? Ist es möglich, dass eine falsche ” Multiplikation diesen Test besteht? 7. Sei d ∈ N2 . Entwickle für d–adisch geschriebene Zahlen (d.h. wo die Grundzahl 10 für das Dezimalsystem durch eine natürliche Zahl d ≥ 2 ersetzt ist) Kriterien für die Teilbarkeit durch 2 (bzw. 3). Die Art eines solchen Kriteriums sollte nur von der Restklasse (d mod 2) (bzw. (d mod 3)) abhängen. 8. Auf einem Blatt stehen alle natürlichen Zahlen von 1 bis 101 – jede genau einmal – geschrieben. Indem man willkürlich zwei von ihnen, genannt x und y, ausradiert und die Zahl x5 +y hinzufügt, vermindert man die Anzahl der Zahlen um 1. (Jede Zahl wird so oft gezählt, wie sie auf dem Papier steht.) Indem man dieses (nicht völlig determinierte) Verfahren noch 99 mal wiederholt, bleibt schließlich eine Zahl übrig. Kannst Du die letzte Ziffer dieser Zahl angeben, ohne mehr zu wissen, als oben angegeben ist? Löse diese Aufgabe zunächst rein theoretisch. Dann mache Dir klar, das die praktische Ausführung obiger Anweisung leicht an ihre Grenzen stößt, da die Zahlen riesig werden. 9. Angenommen, Du gießt Deine Topfpflanzen jeden 2. (bzw. 3., bzw. 4., bzw. 5., bzw. 6.) Tag und beginnst damit an einem Sonntag. Gibt es einen Wochentag, an welchem Du nie gießt? 10. Kalendarisches: Nach dem – aus der Mode gekommenen –Julianischen Kalender ist genau dann ein Schaltjahr, wenn die Jahreszahl durch 4 teilbar ist. Nach dem heute gültigen Gregorianischen Kalender ist dies in der Regel auch so, allerdings mit Ausnahme der Jahre, deren Jahreszahl durch 100, aber nicht durch 400 teilbar ist. letztere sind keine Schaltjahre. a) Zeige: Für den Julianischen (bzw. Gregorianischen) Kalender gilt (mit n, m ∈ N1 ): n ≡ m(mod 28) (bzw. n ≡ m(mod 400) =⇒ Die Jahre n und m beginnen mit demselben Wochentag. 2.4. RESTKLASSEN 67 b) Angenommen, der Julianische Kalender wäre seit dem Jahre 1 unverändert in Kraft, so wäre der Wochentag, mit dem das Jahr n beginnt, der Tag n−1 n+ mod 7 , 4 wobei (1 mod 7) derjenige Wochentag ist, mit dem das Jahr 1 begann, (2 mod 7) der nächste Wochentag usw. ([ ] ist die Gaußklammer.) Diese Formel kann man auf die Jahre 1901 bis 2100 anwenden. Dabei ist (1 mod 7) der Sonntag, da 1989 ≡ 1 (mod 28) ist und das Jahr 1989 mit einem Sonntag begann. Übrigens ist n−1 ≡ 5q + r ≡ −2q + r (mod 7), n+ 4 wenn n = 4q + r mit r ∈ {1, 2, 3, 4} ist. Überzeuge Dich von der Richtigkeit aller Behauptungen. c) Für den Gregorianischen Kalender ergibt sich: Das Jahr n beginnt mit dem Wochentag n−1 n−1 n−1 n+ − + mod 7 . 4 100 400 Dabei ist (1 mod 7) der Dienstag, da das Jahr 1991 mit einem Dienstag begann. Stimmt’s? d) Zeige: Nach dem Julianischen Kalender fällt im langjährigen Durchschnitt der 13. eines jeden Monats auf jeden Wochentag gleich oft. e) Dies ist nicht so nach dem Gregorianischen Kalender. Nach [Forster], Aufgabe 1.5 fällt er am häufigsten auf den Freitag. Wer dies nachprüfen möchte, sollte – um Arbeit zu sparen – das Jahr am 1. März beginnen lassen. 11. Bestimme die Inversen (bzgl. der Multiplikation) von (2 mod m) für ungerade und von (3 mod m) für nicht durch 3 teilbare m. 12. a) Ist (1777 mod 1855) in dem Ring Z/(1855) multiplikativ invertierbar? Bestimme gegebenenfalls das Inverse! b) Welche Bedeutung haben die beiden in a) genannten Zahlen für die Mathematikgeschichte? 13. Seien x, y ∈ Z. Zeige: Ist 3x + 2y durch 17 teilbar, so auch 5x + 9y. 14. Bestimme die drei letzten Ziffern von 19951995! + 1 . 15. Welche Teilbarkeitsaussage kann man über natürliche Zahlen der folgenden Art machen? Bei ihrer Darstellung im Dezimalsystem kommen alle Ziffern von 1 bis 8 gleich oft vor. (Die Anzahl der 0-en und 9-en ist beliebig.) 68 KAPITEL 2. NEUE RECHENBEREICHE 16. Bestimme sämtliche Primzahlen p mit folgender Eigenschaft: In Z/(p) ist die Restklasse von 7 zu der von 13 multiplikativ invers. Insbesondere sollst Du begründen, dass die angegebenen Primzahlen wirklich alle mit dieser Eigenschaft sind. 17. Betrachte in M2 (Z/3) die Potenzen n A der Matrix A := 1 1 1 0 , n∈N. a) Zeige An = An+8 , und berechne dabei die Potenzen A0 , . . . , A7 . b) Zeige dass die Matrizen A0 , . . . , A7 , 0 einen Körper bilden. Es gibt also einen Körper von 9 Elementen. 1 1 Bemerkung: Betrachte die Matrix in M2 (Z/5). Genau genommen, ist diese eine 1 0 andere Matrix als die o.a. Matrix A, da ihre Einträge einem anderen Ring angehören. Ihre Potenzen, zusammen mit der 0-Matrix bilden keinen Ring. Mit ein paar grundlegenden algebraischen Tatsachen, die allerdings in diesem Buch nicht bewiesen werden, ist das leicht zu zeigen. 2.5 Geometrische Reihe, binomischer Lehrsatz Ich habe mir sagen lassen, es gäbe 3 binomische Lehrsätze: 1. binomischer Lehrsatz: (a + b)2 = a2 + 2ab + c2 . 2. binomischer Lehrsatz: (a − b)2 = a2 − 2ab + b2 . 3. binomischer Lehrsatz: (a − b)(a + b) = a2 − b2 . (Im Bereich der reellen (oder rationalen) Zahlen kann man diese Sätze auch geometrisch beweisen. Tu das!) Die obigen Bezeichnungen sind in meinen Augen irritierend. Denn erstens ist der sog. 2. binomische Lehrsatz ja gar nichts anderes als der 1. Wenn man nämlich b0 = −b setzt und (a + b0 )2 nach dem 1. binomischen Lehrsatz berechnet, erhält man (a + b0 )2 = a2 + 2ab0 + b02 = a2 + 2a(−b) + (−b)2 = a2 − 2ab + b2 . Zweitens ist der binomische Lehrsatz viel allgemeiner, als die oben angegebene simple Formel. Er gibt nämlich allgemein eine Formel für die n-te Potenz (a + b)n an. Drittens ist der sogenannte 3. binomische Lehrsatz eigentlich ein Spezialfall der geometrischen Reihe. Mit dieser fangen wir an. Wir rechnen in einem kommutativen Ring R. In nicht kommutativen Ringen gelten die Formeln, die wir erhalten werden, meist nicht. Z.B. ist (a + b)(a − b) = a2 + ba − ab − b2 und letzteres ist nur dann gleich a2 − b2 , wenn ab = ba gilt. 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ 69 2.5.1 Geometrische Reihe. Wir berechnen folgendes Produkt, wo der zweite Faktor eine geometrische Reihe ist: (a − b)(an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn ) = an+1 + an b1 + an−1 b2 + · · · · · · + a1 bn − an b1 − an−1 b2 − · · · · · · − a1 bn − bn+1 = an+1 − bn+1 Ist a 6= b und der Ring R ein Körper, so folgt: an b0 + an−1 b1 + · · · + a1 bn−1 + a0 bn = Mit dem an+1 − bn+1 a−b P -Zeichen geschrieben haben wir unter den jeweils erforderlichen Voraussetzungen: (a − b) n X a n−i i b =a n+1 −b n+1 , und i=0 n X an−i bi = i=0 an+1 − bn+1 . a−b Speziell erhält man für a = 1, b = x: (1 − x) n X i x =1−x n+1 i=0 und n X xi = i=0 1 − xn+1 . 1−x (Die zweite Aussage gilt für x 6= −1.) Satz 2.5.2 Sei f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ein sogenanntes Polynom mit den Koeffizienten ai in einem kommutativen Ring R, welches ein α ∈ R als Nullstelle hat, so kann man es folgendermaßen schreiben: f (x) = (x − α) · g(x) , wo g(x) ein weiteres Polynom über R ist. Der Faktor x − α heißt der zu α gehörige Linearfaktor. Beweis: (∗) Nach Voraussetzung ist f (α) = an αn + · · · + a1 α + a0 = 0. Also gilt f (x) = f (x) − f (α) = an (xn − αn ) + an−1 (xn−1 − αn−1 ) + · · · + a1 (x − α) + 0 Nach der Formel für die geometrische Reihe ist xk − αk = (x − α)(xk−1 + xk−2 α + · · · + xαk−2 + αk−1 ) . Aus jedem Summanden auf der rechten Seite der zweiten Identität in (∗) lässt sich also der Faktor (x − α) herausziehen. 70 KAPITEL 2. NEUE RECHENBEREICHE Bemerkung 2.5.3 Sei R ein Ring. Ein Polynom über R ist ein ‘Ausdruck’ der Form a0 + a1 x + a2 x2 + · · · + an xn mit ai ∈ R Die ai heißen die Koeffizienten des Polynoms. Ein solcher Ausdruck kann als ‘Funktion’ der Variablen x aufgefasst werden, wobei man für x die Elemente von R oder auch eines Erweiterungsringes von R ‘durchläuft’. Folgerung 2.5.4 Sei f (x) ein vom Nullpolynom verschiedenes Polynom vom Grade n mit Koeffizienten in einem nullteilerfreien, kommutativen Ring (etwa einem Körper) R, so hat es in R höchstens n verschiedene Nullstellen. Beweis: Sei α1 eine Nullstelle von f (x), so kann man f (x) = (x − α1 )g(x) schreiben mit einem Polynom g(x) über R vom Grad n − 1. Hat nun g(x) eine Nullstelle α2 , so kann man den zugehörigen Linearfaktor abspalten. Dies Verfahren kann man fortsetzen und erhält schließlich f (x) = (x − α1 ) · · · (x − αm )h(x) wo h(x) ein Polynom über R ist, das in R keine weiteren Nullstellen hat. Da R nullteilerfrei ist, ist f (β) = 0 nur dann, wenn einer der Faktoren (β − αi ), bzw. h(β) gleich 0 ist. Letzteres kann nicht sein, wenn β ∈ R ist. Also ist die Anzahl der Nullstellen von f (x) höchstens gleich m und natürlich m ≤ n. (Es ist nicht ausgeschlossen, dass αi = αj für verschiedene i, j ist.) Beispiel 2.5.5 Der Ring R = Z × Z ist nicht nullteilerfrei. Das Polynom x2 − x hat in diesem Ring die vier Nullstellen (0, 0), (0, 1), (1, 0), (1, 1). Dies ist nur eins von vielen Beispielen. 2.5.6 Geometrische Reihen spielen in der Mathematik eine große Rolle, insbesondere da man unendlichen geometrischen Reihen oft einen Sinn zu geben vermag. Im Reellen hat die unendliche Reihe ∞ X xn = 1 + x + x2 + x3 + · · · k=0 1 , wenn −1 < x < 1 ist. Durch Vergleich mit immer dann einen sinnvollen Wert, nämlich 1−x dieser Reihe kann man sehen, dass auch viele andere unendliche Reihen einen sinnvollen Wert besitzen. 2.5.7 Jetzt wenden wir uns der binomischen Formel zu. Unser Ziel ist es, möglichst gut zu beschreiben, was beim ‘Ausmultiplizieren’ von (a + b)n für beliebige natürliche Zahlen n herauskommt. Wenn man in einem Ring R rechnet, der den Ring Z der ganzen Zahlen als Unterring besitzt, etwa in den Körpern Q oder R, dann ist natürlich ka für k ∈ Z, a ∈ R definiert, weil ja dann auch k ∈ R ist. Diesen speziellen Fall wollen wir im Folgenden bevorzugt betrachten. 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ 71 Man kann aber auch für eine ganze Zahl k und ein Element a aus einem beliebigen Ring R den Ausdruck ka definieren. Ist k > 0, so sei ka = a + · · · + a, wo die Anzahl der Summanden k sei. Ferner sei 0a = 0R , wo wir der Deutlichkeit halber mit 0R das Nullelement von R bezeichnen. Ist schließlich k < 0, etwa k = −n. Dann sei ka = (−n)a := −(na). Es gelten folgende Gesetze: 1a=a, wo 1 das Einselement von Z bezeichnet; (kl)a=k(la) k(ab)=(ka)b=a(kb) (k+l)a=ka+la k(a+b)=ka+kb. 2.5.8 Jetzt behandeln wir den eigentlichen binomischen Lehrsatz. Um das Muster zu erkennen, nach welchem (a + b)n umgeformt wird, wollen wir die ersten Fälle nacheinander behandeln: (a + b)2 = (a + b)(a + b) = a2 + ab + ab +b2 = a2 + 2ab + b2 . (a + b)3 = (a + b)(a2 + 2ab + b2 ) = a3 + 2a2 b + ab2 + a2 b + 2ab2 + b3 = a3 + 3a2 b + 3ab2 + b3 . (a + b)4 = (a + b)(a3 + 3a2 b + 3ab2 + b3 ) = a4 + 3a3 b + 3a2 b2 + ab3 + a3 b + 3a2 b2 + 3ab3 + b4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 (a + b)5 = (a + b)(a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 ) = a5 + 4a4 b + 6a3 b2 + 4a2 b3 + ab4 + a4 b + 4a3 b2 + 6a2 b3 + 4ab4 + b5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 72 KAPITEL 2. NEUE RECHENBEREICHE 2.5.9 Die n-te Potenz von a + b lässt sich im Prinzip wie folgt schreiben: (a + b)n = an +?an−1 b+?an−2 b2 + · · · +?a2 bn−2 +?abn−1 + bn , wo anstelle der Fragezeichen gewisse ganzzahlige Koeffizienten, die so genannten Binomialkoeffizienten, stehen. Wir stellen uns die Aufgabe, diese genauer zu bestimmen. Zunächst erkennen wir, dass die Koeffizienten für die (n + 1)-te Potenz sich aus denen der n-ten ergeben, indem man jeweils zwei benachbarte Koeffizienten für die n-te Potenz addiert. Genauer gilt: Der Koeffizient von an+1−k bk (in der Entwicklung von (a + b)n+1 ) ist die Summe der Koeffizienten von an−k bk und von an−k+1 bk−1 (in der Etwicklung von (a + b)n ). Es ergibt sich folgendes Schema, das sogenannte Pascal’sche Dreieck: 1 1 1 1 1 2 3 1 3 1 1 4 6 4 1 1 5 10 10 5 1 . . . . . . . . . . . . . An der Spitze dieses ‘Dreiecks’ (sozusagen in der 0-ten Zeile) steht der Koeffizient von a0 b0 der ‘Entwicklung’ von (a + b)0 . In der folgenden ‘ersten’ Zeile stehen die Koeffizienten von a, bzw. b in der Entwicklung von (a + b)1 In der n-ten Zeile stehen dann die Koeffizienten von an , an−1 b, an−2 b2 , . . . , bn der Entwicklung von (a + b)n . Man darf man sich das Schema rechts und links durch 0-en ausgefüllt denken. Jede Zahl in diesem Schema, abgesehen von der 1 an der Spitze, ist dann die Summe der beiden unmittelbar schräg über ihr stehenden Zahlen. Zur Übung solltest Du zumindest die nächsten beiden Zeilen des Pascalschen Dreiecks ausfüllen. Es ist übrigens gar nicht die schlechteste Idee, die Binomialkoeffizienten durch wiederholte Addition mit dem Pascalschen Dreieck zu berechnen, besonders dann, wenn Du nicht nur einen einzelnen bestimmen willst. Wir werden im folgenden Abschnitt geschlossene Formeln für sie finden. Diese sind aber auch nicht schnell auszurechnen. 2.5.10 Mit Hilfe der Fakultät kann man die Binomialkoeffizienten geschlossen hinschreiben. Das wollen wir jetzt tun. Zunächst definieren wir für natürliche Zahlen n, k mit 0 ≤ k ≤ n: n(n − 1) · · · (n − (k − 1)) n n! = := k!(n − k)! k! k (Sowohl Zähler wie Nenner des letzten Bruches bestehen, ausgeschrieben, aus k Faktoren, während Zähler und Nenner des ersten Bruches aus je n Faktoren bestehen. Das erste Gleichheitszeichen mit dem Doppelpunkt davor ist eine Definitionsgleichung, das zweite ist eine mittels ‘Kürzen’ leicht einzusehende Identität.) Beachte n n n n = = 1 und = . 0 n k n−k 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ 73 Lemma 2.5.11 Für natürliche Zahlen k, n mit 0 ≤ k ≤ n − 1 gilt: n n n+1 + = k k+1 k+1 Der Beweis ist eine leichte Bruchrechnungsübung. n! (k + 1)n! + (n − k)n! (n + 1)! n! + = = k!(n − k)! (k + 1)!(n − k − 1)! (k + 1)!(n − k)! (k + 1)!(n + 1 − (k + 1))! Beachte: Da 10 = 11 = 1 ist, erkennt man sofort, dass nk gleich der Zahl ist, die an der entsprechenden Stelle im Pascalschen Dreieck auftaucht, d.h. als k-te Zahl in der n-ten Zeile. Dabei haben wir das Zählen jeweils mit 0 begonnen, weil es hier zweckmäßig ist. Jedenfalls sind somit offenbar die nk die gesuchten Binomialkoeffizienten. Der Beweis folgenden Theorems ist eigentlich nur eine Wiederholung. Theorem 2.5.12 n (a + b) = n X n an−k bk = k k=0 n n−1 n n−2 2 n n n 2 n−2 a + a b+ a b + ··· + ab + abn−1 + bn 1 2 n−2 n−1 n D.h. wenn man (a + b)n ausmultipliziert, ist k der Koefizient von an−k bk . Beweis: Induktion nach n, wobei der Fall n = 1 trivial ist, da 1 0 = 1 1 = 1 gilt. Induktionsschritt: Wir nehmen an, obige Formel gelte für ein n und müssen sie dann für n + 1 zeigen. (a + b)n+1 = (a + b)(a + b)n = n n 1 n n−1 2 n 1 n a + a b + a b + ······· + ab 1 2 n n n 1 n n−1 2 n + a b + a b + ······· + a1 bn + bn+1 0 1 n−1 n+1 n 1 n + 1 n−1 2 n+1 1 n n+1 =a + a b + a b · ········· + a b + bn+1 . 1 2 n n+1 2.5.13 Die Bedeutung der Binomialkoeffizienten beschränkt sich nicht auf den binomischen Lehrsatz. Angenommen, Du möchtest als Lottospieler wissen, wieviele Möglichkeiten es gibt, aus den Zahlen 1, 2, 3, . . . , 49 sechs Zahlen auszuwählen. 74 KAPITEL 2. NEUE RECHENBEREICHE Nun für die Wahl der ersten Zahl hast Du 49 Möglichkeiten. Für die Wahl der zweiten Zahl bleiben noch 48 Möglichkeiten usw. Insgesamt hast Du 49 · 48 · 47 · 46 · 45 · 44 Möglichkeiten, nacheinander 6 Zahlen aus den 49 Zahlen zu wählen, ohne dass sich eine wiederholt. Dabei hast Du allerdings zwei Auswahlen von 6 Zahlen unterschieden, wenn die Reihenfolge der Auswahlen verschieden war. Z.B. hast Du die Wahl 7,14,21,28,35,42 von der Wahl 14,7,21,28,35,42 unterschieden, d.h. beide gesondert gezählt. In wieviel verschiedenen Reihenfolgen kann man die sechs Zahlen 7,14,21,28,35,42 auswählen? Nun wir wissen bereits, dass man sechs Zahlen in 6! verschiedenen Reihenfolgen angeben kann. Wenn Du also nur wissen willst, wieviele Möglichkeiten es gibt, aus 49 Zahlen sechs auszuwählen, ohne deren Reihenfolge zu beachten, so erhältst Du die Zahl 49 · 48 · 47 · 46 · 45 · 44 49 = 6! 6 Rechne diese Zahl aus! (Kürze vor dem Multiplizieren!) Allgemein besitzt eine Menge von n Elementen nk Teilmengen von k Elementen. (Das gilt auch wenn man nk = n(n−1)···(n−k+1) definiert und k > n ist. Denn dann taucht im Zähler der Faktor k! 0 auf.) Auf dieser Grundlage gibt es eine weitere Möglichkeit, den Binomialsatz zu beweisen: Man stelle sich (a + b)n als Produkt von n Faktoren geschrieben vor: (a + b)(a + b)(a + b) · · · (a + b) Wenn man dieses Produkt ausmultipliziert, bedeutet dies, dass man alle möglichen Produkte bildet, wo aus jedem Faktor einer der beiden Summanden ausgewählt wird und anschließend n diese Produkte addiert werden. Offenbar gibt es Möglichkeiten, aus k Faktoren den Sumk manden b und aus den übrigen n − k Faktoren den Summanden a auszuwählen. Das Produkt n an−k bk tritt also -mal auf. k Bemerkung 2.5.14 Die Binomialkoeffizienten, so wie wir sie bislang kennengelernt haben, sind natürliche Zahlen. Denn wenn man sie z.B. nacheinander in dem Pascalschen Dreieck durch Addition gewinnt, muss man immer zwei natürliche Zahlen addieren. Hieraus folgt,dass k! Teiler eines jeden Produktes von k aufeinander folgenden ganzen Zahlen n n(n − 1) · · · (n − k + 1) ist. Es ist ja = . Bedenke, dass es nicht genügt, zu zeigen, dass k k! jede der Zahlen 1, . . . , k eine der k Zahlen n, n − 1, . . . , n − k + 1 teilt. Ist k > n, so tritt in dem Produkt n(n − 1) · · · (n − k + 1) der Faktor 0 auf, so dass dieses Produkt auch in diesem Fall durch k! teilbar ist. a Man betrachtet auch verallgemeinerte Binomialkoeffizienten , wo a nicht notwendig ganz k ist. Ein solcher braucht nicht ganz zu sein. 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ 75 2.5.15 Man kann die Binomialkoeffizienten benutzen, um elementare Aussagen über Primzahlen zu beweisen. Das hat zwei Gründe: Erstens kann man die Größe der Binomialkoeffizienten gut abschätzen. Z.B. gilt: n X n n (1 + 1) = k k=0 weshalb auch der größte unter den nk , k = 0, 1, . . . , n (für n ≥ 1)kleiner als 2n ist. Entsprechendes gilt für die Summe einiger dieser Binomialkoeffizienten. Zweitens kann man verhältnismäßig starke Aussagen über die Primfaktoren von nk beweisen. Als Beispiel beweisen wir: Satz 2.5.16 Für jede natürliche Zahl n ≥ 2 gilt: Das Produkt der Primzahlen p ≤ n ist kleiner als 4n−1 . Symbolisch: Y p < 4n−1 p≤n Dabei istPp eine Variable für Primzahlen. Und zeichen verwendet. Q wird als Produktzeichen analog zum Summen- (Sicher ist dies eine ziemlich grobe Abschätzung. Bedenke aber, dass diese Abschätzung falsch wird, wenn man die Primzahlen ≤ n etwa durch alle – oder auch nur alle ungeraden – positiven ganzen Zahlen ≤ n ersetzt.) Beweis: Zunächst zeige ich folgende Behauptung: 2n+1 ≤ 4n . n P 2n+1 Beweis hierfür: Da 2n+1 = 22n+1 ist, gilt k=0 k 2n + 1 2n + 1 + < 22n+1 n n+1 Ferner ist 2n+1 = 2n+1 , also n n+1 2n + 1 2· < 22n+1 , n woraus die Behauptung unmittelbar folgt. – Zum Beweis des Satzes benutzen wir Induktion nach n und vergewissern uns zunächst, dass er für n = 2 richtig ist. Sei jetzt n ≥ 3; und wir nehmen die Gültigkeit des Satzes für alle kleineren ganzen Zahlen (≥ 2) an. 1. Fall: n sei gerade. Dann ist n keine Primzahl (da 2 die einzige gerade Primzahl ist). In diesem Falle ist also Y Y p= < 4n−2 < 4n−1 . p≤n p≤n−1 76 KAPITEL 2. NEUE RECHENBEREICHE 2. Fall: n sei ungerade, etwa n = 2m + 1 (mit m ≥ 1). Dann ist nach Induktionsvoraussetzung Y p < 4m p≤m+1 In der Primfaktorzerlegung von 2m+1 = m m + 1 < p ≤ 2m + 1 auf. Somit gilt (m+1)(m+2)···(2m+1) 1·2···m Y p≤ m+1<p≤2m+1 tauchen alle Primzahlen p mit 2m + 1 < 4m . m Insgesamt ist Y p < 4m 4m = 42m = 4(2m+1)−1 p≤2m+1 Bemerkung 2.5.17 Nicht beweisen will ich hier das sogenannte Bertrandsche Postulat. Es lautet: Zu jedem n ∈ N1 gibt es eine Primzahl p mit n < p ≤ 2n. Es lässt sich mit Hilfe von Binomialkoeffizienten elementar (d.h. ohne Hilfe komplexer Zahlen und deren Analysis) verhältnismäßig einfach beweisen. (Obiger Satz wird dafür gebraucht.) Ich verweise Dich aufs Internet. AUFGABEN n 1. Seien x, y, m, n ∈ Z, m, n ≥ 1 und p eine Primzahl. a) Zeige: Ist x ≡ y mod pm , so ist xp ≡ n y p mod pm+n . b) Gilt die Behauptung auch für m = 0? c) Zeige, dass die Umkehrung nicht gilt. 2. Zeige: Wenn a, b > 0 sind und n ≥ 2 ganz ist, so ist √ n an + bn < a + b. 3. a) Wenn a, n ∈ N2 gilt und an + 1 eine Primzahl ist, so ist a gerade und n = 2m mit einem m ∈ N. b) Wenn a, n ∈ N und an − 1 prim ist, so ist a = 2 und n prim. (Hinweis: Geometrische Reihe.) c) Es ist 82 + 1 keine Primzahl und auch 211 − 1 = 2047 = 23 · 89 keine solche. Warum steht dieses nicht im Widerspruch zu a), bzw. b)? 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ 77 4. a) Im Bereich der natürlichen Zahlen sei c ein Teiler von ab und c < a sowie c < b. Zeige, dass dann ab/c keine Primzahl ist. b) 11 ist eine Primzahl, 111 nicht (warum?). Zeige: Ist im Dezimalsystem eine n-stellige Zahl, deren sämtliche Ziffern gleich 1 sind, eine Primzahl, so muss auch n eine Primzahl sein. Die Umkehrung ist leider falsch, wie das Beispiel 111 lehrt. c) 101 ist eine Primzahl, 10101 nicht. Gibt es neben 101 überhaupt Primzahlen, die im Dezimalsystem abwechselnd die Ziffern 1 und 0 haben? (Tipp: Stelle 1010 . . . 101 als geometrische Reihe dar und benutze a).) 5. Bestimme (mit Hilfe der Formel für die geometrische Reihe) einen Primfaktor von 2148 + 1. Bemerkung: Der komplementäre Faktor ist ebenfalls prim, wie A. Ferrier (von dem ich leider nichts weiß) ohne elektronische Rechner (allerdings mit einer mechanischen Rechenmaschine) um 1950 nachgewiesen hat. Damals war das ein Rekord! √ √ 6. a) Zeige: Für jede natürliche Zahl n ist (1 + 2)n + (1 − 2)n eine gerade ganze Zahl. (Hinweis: Binomialsatz.) X n n+1 m b) Zeige: = , (n ≥ k). k+1 k m=k (Hinweis: Bei Induktion nach n kann man den Hilfsatz zum Beweis des Binomialsatzes benutzen.) 7. Betrachte im Pascalschen Dreieck eine ‘Parallele zum linken Schenkel’ also die Folge n n+1 n+2 n+k , , ,..., ,... n n n n a) Überlege, dass die ‘folgende Parallele’, also n+1 n+2 n+3 n+1+k , , ,..., ,... n+1 n+1 n+1 n+1 die summatorische Folge der vorangehenden ist. Dabei soll die summatorische Folge der Folge (ak )k∈N = (a0 , a1 , a2 , . . .) als die Folge k X (a0 , a0 + a1 , a0 + a1 + a2 , . . .) = ( ai )k∈N i=0 definiert sein. (Es ist gar nicht schwer, dies einzusehen.) n+k b) Überlege Dir auch, dass ein Polynom n-ten Grades in k ist. n n n 8. Seien r, s, n ∈ N. Zeige: Aus 0 ≤ r < s ≤ n/2 folgt < . r s 78 KAPITEL 2. NEUE RECHENBEREICHE 9. a) Zeige: Für jedes n ∈ N gilt: n X (1/2)i < 2. i=0 b) Folgere: n X i=m 1 2 i < 2 . 2m n c) Zeige 2 < n! für n ≥ 4. (Wenn man nicht mit Induktion argumentieren will, geht es so: 24+k = 16 · 2 · · · 2 < 24 · (4 + 1) · · · (4 + k), wo links nach dem Faktor 16 = 24 ein Produkt von k Faktoren 2 und rechts nach dem Faktor 24 das Produkt der k Zahlen 4 + 1, . . . , 4 + k steht.) 1 n 1 d) Zeige: Für alle natürlichen Zahlen n ≥ 1 und k gilt: ≤ . k k! k n n X n 1 1 e) Zeige: Unter denselben Voraussetzungen gilt: 1 + ≤ < 3. n k! k=0 (Hinweis: d) für die 1. und b), c) für die 2. Ungleichung) 10. a) Zeige, dass mk(mk − 1) · · · (mk − k + 1) durch mk! teilbar ist. (m, k ∈ N.) b) Folgere, dass (mn)! durch m!(n!)m teilbar ist. (Der zweite Ausdruck ist unsymmetrisch in n und m. Es ist (2 · 2)! durch 2!(2!)2 teilbar, aber nicht durch (2!)2 (2!)2 .) 11. Peter fragt seine Mutter, wie alt sie sei. Da sie ihr Alter aber nicht so locker verraten mag, antwortet sie: Wenn Du von der dritten Potenz des Alters Deines Vaters die dritte Potenz meines Alters abziehst, erhältst Du die Zahl 26551. Wie alt sind Peters Eltern? (Das Alter von Mutter und Vater wird als ganze Anzahl von Jahren angenommen.) 12. Seien n, a ∈ N, n ≥ 2, a ≥ 1. Zeige: Es gibt nur endlich viele Paare ganzer Zahlen (x, y), so dass xn − y n = a gilt. (Vielleicht fällt es Dir leichter, die stärkere Behauptung zu zeigen, dass es nur endlich viele Paare ganzer Zahlen (x, y) mit 0 < xn − y n ≤ a gibt.) 13. a) Sei n ≥ 3 eine ganze Zahl. Zeige (n+1)n < nn+1 . (Entwickle (n+1)n gemäß dem binomischen Lehrsatz. Vergleiche die ersten n−1 Summanden und die Summe der letzten beiden Summanden dieser Entwicklung jeweils mit nn . Für den letzten Vergleich benötigst Du n ≥ 3. Was gilt für n = 2?) b) Mit Hilfe von Wurzeln, die man oft erst im Bereich der reellen (und nicht innerhalb der rationalen) Zahlen ziehen kann, kann man aus a) folgern: Sind m, n ∈ N mit 3 ≤ m < n, so gilt nm < mn . (Welche Folgerung in Bezug auf die Lösungen der Gleichung xy = y x im Bereich der ganzen Zahlen kann man daraus ziehen?) Wenn man allgemeine Potenzen mit reellen Exponenten kennt, kann man auch für reelle Zahlen a, b mit e ≤ a < b die Ungleichung ba < ab zeigen. Siehe 7.6.4 . (Hier habe ich mit e die Eulersche Zahl bezeichnet, die im Beispiel 5 von Abschnitt 3.1 behandelt wird.) 14. Seien a, m, n positive ganze Zahlen mit a ≥ 2. Sei m = qn + r eine Division mit Rest (in N), wo 0 ≤ r < n ist. a) Zeige: Dann gibt es ein q 0 ∈ N mit am − 1 = q 0 (an − 1) + ar − 1. 2.5. GEOMETRISCHE REIHE, BINOMISCHER LEHRSATZ b) Folgere: n|m ⇐⇒ an − 1|am − 1 c) Folgere: aggt(m,n) − 1 = ggt(am − 1 , an − 1). 79 80 KAPITEL 2. NEUE RECHENBEREICHE Kapitel 3 Grenzwerte und reelle Zahlen 3.1 Unendliche Reihen ‘Unendliche Reihen’ sind nur eine andere Bezeichnung für unendliche Summen. Auch wenn ich in diesem Abschnitt ein wenig unpräzise bin, kannst Du, wie ich glaube, eine Menge lernen. Beispiel 1: 1 1 1 1 + + + + ··· = ? 2 4 8 16 Wir schreiben diese unendliche Summe auch wie folgt: ∞ ∞ X X 1 1 1 1 1 −1 −2 −3 −4 = + + + + · · · = 2 + 2 + 2 + 2 + · · · = 2−k =? n 2 2 4 8 16 n=1 k=1 Welche Meinung hast Du zu unendlichen Summen, insbesondere zu der angegebenen? Es ist Unsinn, solche zu betrachten. Ihr Studium mag zwar für Mathematiker ganz lustig sein, aber sicher nicht für Physiker und Informatiker. Obiger Summe legt man sinnvoller Weise den Wert 1 zu. Um der o.a. unendlichen Summe auf sinnvolle Weise einen Wert zu geben, benutze ich ein anschauliches Argument: Stelle Dir einen Glaszylinder vor, der 1 Liter fasst. Dieser wird zuerst halb gefüllt, dann wird durch hinzugießen von einem viertel Liter vom freien Rest wieder die Hälfte gefüllt, und es bleibt 1/4 Liter frei. Dann bleibt nach Hinzufügen von 1/8 l wieder 1/8 l frei. So geht es weiter: im n-ten Schritt fügt man 2−n l hinzu, und der Literzylinder ist bis auf 2−n l gefüllt. Der einzig sinnvolle Wert für o.a. unendliche Reihe (Summe) ist ∞ X k=1 2−k = 1 1 1 1 1 + + + + ··· + k + ··· = 1 2 4 8 16 2 (Rechts hast Du Platz zum zeichnen.) 81 82 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Was haben wir gemacht? Wir haben nacheinander die endlichen Partialsummen 2 3 1 X 1 1 X 1 1 X 1 1 =1− , = 1 − 2, = 1 − 3,... k k k 2 2 k=1 2 2 2 2 k=1 k=1 betrachtet und uns überlegt, wogegen die Folge dieser Partialsummen geht, d.h. welchen Grenzwert sie hat. ∞ Beispiel 2: a) X 1 1 1 1 1 1 + + + + ··· + + ··· = =? 1·2 2·3 3·4 4·5 n(n + 1) k(k + 1) k=1 Ich will die einzelnen Summanden umformen. 1 1 (n + 1) − n 1 1 1 1 − = = , z.B. − = . (Solltest Du je Probleme mit n n+1 n(n + 1) n(n + 1) 2 3 6 der Bruchrechnung gehabt haben, so sind diese jetzt doch überwunden, nicht wahr?) Es gilt Obige unendliche Reihe kann man also auch so schreiben: ∞ X k=1 1 = k(k + 1) 1 1 − 1 2 + 1 1 − 2 3 + 1 1 − 3 4 + 1 1 − 4 5 + ··· Du siehst: Wenn man die ersten n Glieder der Reihe (in ihrer zweiten Gestalt) addiert, so hebt sich nach Entfernen der Klammern viel weg und man erhält als Summe der ersten n Glieder 1 die Zahl 1 − . (Sehr anschaulich bezeichnet man eine solche Summe als Teleskopsumn+1 me; sie ist wie ein Teleskop zusammenschiebbar.) Wieder ist der einzig sinnvolle Wert unserer unendlichen Reihe ∞ X k=1 1 1 1 1 1 1 = + + + + ··· + + ··· = 1 k(k + 1) 1·2 2·3 3·4 4·5 n(n + 1) b) Für später notieren wir: Lässt man die ersten N Summanden dieser Reihe weg, so erhält man auf dieselbe Weise ∞ X 1 1 1 1 1 = + + + ··· = k(k + 1) (N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4) N +1 k=N +1 Prüfe das nach. ∞ Beispiel 3: X1 1 1 1 1 1 1 + + + + + ··· + + ··· = = ? ( Harmonische Reihe“) ” 1 2 3 4 5 n n n=1 Was glaubst Du? Da die Glieder dieser Reihe gegen 0 gehen, erhält man, wie bei den obigen Reihen einen endlichen Wert. Obwohl die Glieder dieser Reihe gegen 0 gehen, hat sie keinen endlichen Wert. Das ist bis heute unbekannt. 3.1. UNENDLICHE REIHEN 83 Wir fassen die Glieder dieser Reihe wie folgt zusammen: 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + ··· + + + ··· + + ··· 2 3 4 5 6 7 8 9 16 17 32 1 1 1 1 1 1 + ≥ + =2· = , 3 4 4 4 4 2 1 1 1 1 + ··· + ≥8· = , usw. 9 16 16 2 Deshalb gilt Nun ist 1 1 1 1 1 1 + ··· + ≥ + ··· + = 4 · = 5 8 8 8 8 2 1 1 1 1 1 1 1 1 + + + + + ··· ≥ 1 + + + + ··· 1 2 3 4 5 2 2 2 Also bleibt als einzig sinnvoller Wert der harmonischen Reihe: ∞ X 1 1 1 1 1 1 = + + + + + · · · = ∞ = unendlich. n 1 2 3 4 5 n=1 (Wir betrachten ∞ nicht als (reelle) Zahl, weil man mit ∞ schlecht rechnen kann. Aber es spricht nichts dagegen, ∞ als Wert einer unendlichen Reihe, als ‘uneigentlichen Grenzwert’ zuzulassen.) In den Beispielen 4 und 6 werden wir die harmonische Reihe auf zweierlei Weise modifizieren und endliche Werte erhalten. Beispiel 4: Wir quadrieren die Summanden der harmonischen Reihe: ∞ X 1 1 1 1 1 1 = 1 + 2 + 2 + 2 + 2 + ··· + 2 + ··· =? 2 n 2 3 4 5 n n=1 1 1 1 1 1 1 < , also 2 < , 2 < usw. Durch 2 (n + 1) n(n + 1) 2 1·2 3 2·3 Vergleich mit Beispiel 2 erhält man hieraus, vorausgesetzt unsere Reihe hat einen vernünftigen Wert, Es gilt (für n ≥ 1) die Beziehung 1 1 1 1 + 2 + 2 + 2 + ··· < 1 + 1 = 2 2 2 3 4 5 Wenn man die reellen Zahlen axiomatisch einführt, kann man als eines der Axiome z.B. folgendes nehmen: 1+ Jede unendliche Summe positiver Summanden, deren Partialsummen nach oben beschränkt sind, hat einen (endlichen) reellen Wert. π2 In der Tat ist der Wert o.a. unendlicher Summe . Dies ist allerdings keineswegs einfach zu 6 sehen. Wenn Du Glück hast, hörst Du einen Beweis dafür am Ende des 1. Semesters in der Vorlesung Analysis 1“. Jedenfalls findest Du einen Beweis im Buch O. Forster: Analysis 1. ” Frage: Was ist π? 84 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Der sechzehnte (kleingeschriebene) Buchstabe des griechischen Alphabets. Ungefähr gleich 3,14159. Das Verhältnis des Umfangs eines Kreises zu seinem Durchmesser. Das Verhältnis der Fläche eines Kreises zum Quadrat über seinem Radius. Das Verhältnis der Oberfläche einer Kugel zum Quadrat über ihrem Durchmesser. Drei viertel des Verhältnisses des Volumens einer Kugel zum Volumen des Würfels über ihrem Radius. (In den letzten vier Antworten ist die euklidische Geometrie zugrunde gelegt.) Antwort: Alle gegebenen Antworten sind richtig. (Dabei muss man vielleicht eine feinsinnige Zusatzbemerkung machen, was die erste Antwort von den andern unterscheidet.) Frage: Warum schreibt man π und nicht 3,14159? π schreibt sich kürzer als 3,14159. π = 3,14159 ist nicht exakt richtig. π lässt sich nicht als endlicher Dezimalbruch, ja überhaupt nicht als Bruch mit ganzzahligem Zähler und Nenner schreiben. D.h. π ist irrational. Antwort: Die erste Antwort ist natürlich nicht falsch, die zweite ist aber besser, und die dritte hat die größte mathematische Substanz! Dazu gibt es in 7.7 eine Aufgabe. Hier werden wir nur beweisen, dass der Wert der folgenden Reihe irrational ist. ∞ Beispiel 5: 1 + X 1 1 1 1 + + + ··· = 1 1·2 1·2·3 k! k=0 (Erinnere Dich an die Definition 0! := 1, n! := 1 · 2 · · · n für ganze n > 0.) Wenn wir, für jedes 1 1 n, den Summanden mit dem Summanden der Reihe aus Beispiel 1 · 2 · · · n · (n + 1) n(n + 1) 2 vergleichen, sehen wir dass unsere Summe – wenn überhaupt – einen Wert < 3 hat. Wie im Beispiel 4. hat diese Reihe im Bereich der reellen Zahlen Wert. Dieser wird in der Regel mit e bezeichnet. Es gilt also 2 < e < 3. Angenähert ist e = 2, 718281828 . . .. Was meinst Du? e hat die Periode 1828, ist also rational. Da man immer nur endlich viele Dezimalstellen von e berechnen kann, ist dies nicht zu entscheiden. Es könnte trotzdem einen Beweis für eine der beiden Behauptungen geben: e ist rational bzw. e ist irrational. Die Ziffernfolge 1828 wiederholt sich nicht ein drittes Mal. Mit Hilfe von Beispiel 2 kann man vielmehr zeigen: Satz: e ist keine rationale, sondern eine irrationale Zahl, d.h. kein Bruch mit ganzem Zähler und Nenner. m Beweis: Indirekt! Wäre e eine rationale Zahl mit dem Nenner N ≥ 2, etwa e = N (mit m natürlichen Zahlen m, N ), so wäre nicht nur N e, sondern erst recht N ! · e = 1 · 2 · · · N · N eine ganze Zahl. Wir zeigen, dass dies für keine natürliche Zahl N möglich ist. Multiplizieren wir die ersten N + 1 Summanden von e mit N ! = 1 · 2 · · · N , so erhalten wir P lauter ganze Zahlen. Für den Rest r := N ! ∞ n=N +1 1/n! genügt es also 0 < r < 1 zu zeigen. Denn N !e ist ja dann die Summe von r und einer ganzen Zahl, also nicht ganz, da r nicht ganz ist. 3.1. UNENDLICHE REIHEN 85 Offenbar gilt r= 1 1 1 + + + ··· N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3) Vergleichen wir diese Reihe, anfangend mit dem 2. Summanden, mit Beispiel 2 b), so erhalten wir r= 1 1 1 1 + + + +· · · < N + 1 (N + 1)(N + 2) (N + 1)(N + 2)(N + 3) (N + 1)(N + 2)(N + 3)(N + 4) 1 1 1 1 1 1 + + + + ··· = + <1 (N + 1) (N + 1)(N + 2) (N + 2)(N + 3) (N + 3)(N + 4) N +1 N +1 da N ≥ 2 ist. Also ist N ! · e für keine natürliche Zahl N ganz und deshalb e irrational. Beispiel 6: Wir versehen die Hälfte“ der Summanden der harmonischen Reihe mit dem Minus” Zeichen, d.h. wir bilden die sogenannte alternierende harmonische Reihe: ∞ X (−1)k+1 1 1 1 1 (−1)n+1 1 − + − + − +··· + + ··· = = ?. 2 3 4 5 n k k=1 1 1 1 1 1 1 Wenn wir die Teilsummen s1 = 1, s2 = 1 − , s3 = 1 − + , s4 = 1 − + − usw. auf 2 2 3 2 3 4 der Zahlengeraden betrachten, so sehen wir sie hin- und herhüpfen; dabei werden die Sprünge immer kleiner und ihre Länge geht gegen 0. Es ist also plausibel, dass die Teilsummen gegen einen Grenzwert gehen, den Wert der unendlichen Reihe. (‘Leibnizsches Konvergenzkriterium’) Dieser Wert liegt offenbar zwischen 1/2 und 1. Er ist gleich ln 2, dem natürlichen Logarithmus von 2, wie man in den meisten Vorlesungen Analysis 1“ lernt. ” Frage: Darf man in einer unendlichen Reihe die Reihenfolge der Summanden beliebig vertauschen, ohne dass sich an ihrer Konvergenz oder ihrem Wert etwas ändert? Ja. Nicht immer. Beispiel 7: Wir schreiben die Summanden der alternierenden harmonischen Reihe in folgender Reihenfolge: ∞ X 1 1 1 1 1 1 − − + − − + ··· = 2 4 3 6 8 k=0 1 1 1 − − 2k + 1 2(2k + 1) 2(2k + 2) . (Auf je einen positiven Summanden folgen je zwei negative. Innerhalb der Folge der positiven, sowie innerhalb der Folge der negativen Summanden bleibt die Reihenfolge bestehen.) Dabei bedeutet das Gleichheitszeichen dass die Werte der beiden Reihen gleich sind, nicht aber die Reihen als solche. Wenn Du genauer weißt, wie der Wert einer Reihe definiert ist, kannst Du leicht das Folgende zeigen: Ist eine Reihe konvergent, d.h. hat sie einen endlichen Wert, so darf man beliebige endliche Teile aufeinander folgender Glieder der Reihe zu je einem Summanden zusammenfassen, ohne dass sich an ihrem Wert etwas ändert. 86 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Behauptung: Der Wert der o.a. Reihe ist genau halb so groß wie der der ursprünglichen alternierenden harmonischen Reihe, der ja nicht 0 ist. Denn es gilt: 1 1 1 1 1 1 − − = − . 2k + 1 2(2k + 1) 2(2k + 2) 2 2k + 1 2k + 2 Wenn wir jetzt diese Glieder für beginnend mit k = 0 der Reihe nach aufsummieren, die Klammern weglassen und den gemeinsamen Faktor 12 herausziehen, erhalten wir 1 1 1 1 1 1 − + − + − ··· , 2 2 3 4 5 das heißt die alternierende harmonische Reihe, mit 1 2 multipliziert. Beispiel 8: Jetzt ordnen wir die alternierende harmonische Reihe wie folgt um: 1− 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + − + − − + − − − − + − − ··· − + − − ··· 2 3 4 5 6 8 7 10 12 14 16 9 18 32 11 34 Beginnend mit 1/3 nimmt man immer abwechselnd einen positiven und 2n negative Summanden auf. Genauer: nach dem positiven Summanden 1/3 nimmt man 20 negative Summanden; nach dem nächsten positiven Summanden 1/5 nimmt man die nächsten 21 negativen Summanden, usw. 1 1 1 1 1 1 Da − − ≤ − , − − · · · − ≤ − , usw. ist, gilt für einen möglichen Wert w der o.a. 6 8 4 10 16 4 1 1 1 1 1 1 1 1 umgeordneten alternierenden harmonischen Reihe w ≤ 1 − + − + − + − + − 2 3 4 5 4 7 4 9 1 1 + − + · · ·. Mit 4 11 1 1 1 1 1 1 1 − + =− =− ist − + ≤ − für n ≥ 5 . 4 5 4·5 20 4 n 20 Also gilt w ≤1− 1 1 1 1 1 + − − − − · · · = −∞ . 2 3 20 20 20 Überlege Dir, dass hinter den letzten beiden Beispielen ein ‘Geheimnis des Unendlichen’ steckt. Wenn man aus einem ‘Fass’ mit den Zahlen 1, 2, 3, . . . , 1 000 000 zu Anfang sehr viele gerade n und nur wenige ungerade n herausnimmt und schließlich das ganze Fass leeren will, so muss man irgendwann zum Ausgleich sehr viele ungerade Zahlen herausnehmen. Sind etwa unter den ersten 500 000 herausgenommene Zahlen 499 000 gerade Zahlen, so müssen notwendigerweise unter den letzten 500 000 herausgenommenen Zahlen auch 499 000 ungerade Zahlen sein. Das ist ganz anders, wenn das Fass mit unendlich vielen, etwa allen natürlichen Zahlen gefüllt ist. Dann kann man für jedes m die ersten 10m herausgenommenen Zahlen so wählen, dass sich unter ihnen nur m ungerade, aber 10m − m gerade n finden, und fischt trotzdem auch jedes ungerade n irgendwann aus dem Fass. 3.1. UNENDLICHE REIHEN 87 Zusatzbemerkungen Zu Beispiel 1: Wie Du weißt, gilt für q 6= 1 die Formel Pn k 2 n k=0 q = 1+q+q +· · ·+q = 1 − q n+1 , 1−q 1 , vorausgesetzt, es 1−q ist −1 < q < 1. S.u. Wählt man q = 1/2, so erhält man die Reihe aus Beispiel 1 mit einem zusätzlichen Summanden 1. also für die unendliche Reihe P∞ k=0 qk = 1 + q + q2 + · · · + qn + · · · = Zu den Beispielen 3 und 4: Die Quadratzahlen bilden eine Teilmenge der Menge aller positiven ganzen Zahlen. Wir haben gesehen, dass die Summe der Kehrwerte aller natürlichen Zahlen unendlich, dagegen die der Kehrwerte aller Quadratzahlen endlich ist. Man kann sich für jede Teilmenge der natürlichen Zahlen fragen, ob die Summe ihrer Kehrwerte endlich oder unendlich ist. Man weiß, dass die Summe der Kehrwerte aller Primzahlen unendlich ist. Das ist nicht trivial, aber auch nicht allzu schwer zu zeigen. Siehe Chapter 1 in dem hübschen Buch Proofs from THE BOOK“ von M. Aigner und G.M. Ziegler (Springer Verlag). Dass die ” Summe der Kehrwerte der Primzahlen unendlich, die der Quadratzahlen aber endlich ist, kann man so interpretieren, dass die Primzahlen dichter im Bereich der natürlichen Zahlen liegen als die Quadratzahlen. (Das heißt nicht, dass man aus dieser Erkenntnis gleich folgern kann, dass zwischen je zwei verschiedenen Quadratzahlen 6= 0 mindestens eine Primzahl liegt. Das glaubt zwar jeder, kann aber dummerweise noch keiner beweisen.) Zu Beispiel 6: Die sogenannte Taylorentwicklung der Funktion ln(1 + x) ist ln(1 + x) = x x2 x3 − + − + · · ·. Diese Gleichung gilt für alle x mit −1 < x ≤ 1, und man erhält unsere 1 2 3 Behauptung, indem man x = 1 setzt. 1 Unvollständige Begründung: Die Funktion ln(1 + x) ist die Stammfunktion von . 1+x 1 (D.h. die Ableitung der Funktion ln(1 + x) ist die Funktion . (Diese Begriffe kennst Du 1+x vielleicht schon. Sie werden auch weiter unten in diesem Buch behandelt.) Letztere Funktion kann man, wie in der Bemerkung zu Beispiel 1 angegeben, als unendliche Reihe schreiben: setze q = −x. Die sogenannte Taylorentwicklung von ln(1 + x) erhält man durch ‘gliedweise Integration’. Das alles funktioniert zunächst jedoch nur für −1 < x < 1. Für x = 1 braucht man ein zusätzliches Argument, den ‘Abelschen Grenzwertsatz’. Zu Beispiel 7: Durch geeignete Umordnung kann die alternierende harmonische Reihe jede vorgegebene reelle Zahl als Wert annehmen. Wer mathematisch geschickt ist, mag selbst versuchen, dies zu zeigen. P n Ein Beispiel, das unsere Vorfahren irritiert hat: Die unendliche Reihe ∞ n=0 (−1) = 1 − 1+1−1+· · · hat keinen vernünftigen Wert. Man kann allerdings ihre Summanden so klammern, dass einmal der Wert 0, ein andermal der Wert 1 herauskommt. (1 − 1) + (1 − 1) + (1 − 1) + · · ·, bzw 1 + (−1 + 1) + (−1 + 1) + (−1 + 1) + · · ·. Dieses Beispiel mag in Dir den Wunsch nach einer präzisen Definition für den Wert einer unendichen Reihe wecken. Versuchen wir es so: Wir betrachten die sogenannten Partialsummen 88 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN einer unendlichen Reihe ∞ X an n=0 Das sind die Summen s0 := a0 , s1 := a0 + a1 , s2 := a0 + a1 + a2 , ..., sk := k X an , ... n=0 P Und den Wert der Reihe ∞ n=0 an definiert man als ‘Grenzwert’ dieser Folge der Partialsummen, so es denn einen gibt. Grenzwerte von Folgen definieren wir später. P n Partialsummen der Reihe ∞ n=0 (−1) sind 1, 0, 1, 0, 1, 0, . . . Diese bilden eine Folge, die keinen Grenzwert hat. Z.B. liegt nur die Hälfte der Folgenglieder beliebig nahe bei 0. Diese Beispiel lehrt uns, dass die Assoziativität bei unendlichen Summen nicht allgemein richtig ist! 3.2 Grenzwerte und reelle Zahlen 3.2.1 Du kennst den Körper Q der rationalen Zahlen und weißt auch, wie man seine Elemente als Punkte auf der Zahlengerade auffassen kann – nachdem man die Punkte 0 und 1 festgelegt hat. Der Körper Q besitzt außer seiner arithmetischen (oder algebraischen) Struktur, d.h. den Rechenarten, noch eine Anordnungsstruktur. Diese wird durch die Relation ‘≤’ gegeben. Wenn man, wie üblich die Zahlengerade waagerecht zeichnet und dabei den Punkt 1 rechts von der 0 legt, so bedeutet a ≤ b, dass der Punkt a links von b liegt oder mit ihm übereinstimmt. Haben zwei Brüche den gleichen positiven Nenner n, so gilt natürlich m1 m2 ≤ ⇐⇒ m1 ≤ m2 . n n m1 m2 Im Allgemeinen macht man durch Erweitern der Brüche , die Nenner gleich und hat n1 n1 m1 n2 m2 n1 dann die Brüche und zu vergleichen. Es ergibt sich die Regel: Sind n1 , n2 > 0 so n1 n2 n1 n2 ist m1 m2 ≤ ⇐⇒ m1 n2 ≤ m2 n1 n1 n2 Die Relation ‘≤’ hat folgende Eigenschaften: a ≤ a (Reflexivität) a ≤ b, b ≤ c ⇒ a ≤ c (Transitivität) 3.2. GRENZWERTE UND REELLE ZAHLEN 89 a ≤ b, b ≤ a ⇒ a = b (Antisymmetrie) für je zwei Zahlen a, b gilt a ≤ b oder b ≤ a (Totalität) a≤b⇒a+c≤b+c 0 ≤ c, a ≤ b ⇒ ac ≤ bc (Monotonie der Addition und der Multiplikation) Definition 3.2.2 Ein angeordneter Körper, ist ein Körper mit einer Relation ‘≤’, derart, dass obige Eigenschaften erfüllt sind. Die Elemente a ∈ K, die ≥ 0 sind, nennt man nichtnegativ. Die von 0 verschiedenen nichtnegativen Elemente von K heißen positiv. Welche Elemente würdest Du nichtpositiv, bzw. negativ nennen? (Ich muss gestehen, dass die Wörter nichtnegativ“ und nichtpositiv“ nicht nicht die größte ” ” sprachliche Eleganz ausstrahlen; sie sind aber üblich.) Die Relation ‘<’ ist durch ‘a < b ⇐⇒ a ≤ b, a 6= b definiert. Was a ≥ b und a > b dann bedeuten sollen, ist Dir sicher klar. Bemerkungen 3.2.3 Sei K ein angeordneter Körper. Die folgenden Regeln gelten in K. a) Die Monotonieregel der Addition lässt sich auch folgendermaßen ausdrücken: a<b⇒a+c<b+c Denn wenn a ≤ b und a 6= b gilt, ist a + c ≤ b + c und a + c 6= b + c, nicht wahr? b) Aus 0 ≤ a, 0 ≤ b folgt 0 ≤ a + b und 0 ≤ ab. c) Gilt a ≤ b, so folgt a + (−a − b) ≤ b + (−a − b) also −b ≤ −a. Insbesondere gelten: a ≤ 0 ⇐⇒ −a ≥ 0; sowie a ≥ 0 ⇐⇒ −a ≤ 0. d) a2 ≥ 0 gilt für jedes a ∈ K. Ist nämlich a ≥ 0, so folgt a2 ≥ a · 0 = 0. Ist hingegen a ≤ 0, so ist −a ≥ 0, also a2 = (−a)2 ≥ 0. Insbesondere ist 1 = 12 ≥ 0. Da aber 1 6= 0, folgt 1 > 0. e) Ist a > 0, so ist auch a−1 > 0. Wäre nämlich a−1 < 0, so wäre −a−1 > 0, also −1 = −(aa−1 ) = a(−a−1 ) > 0, im Widerspruch zu c) und d). Entsprechend kannst Du a < 0 =⇒ a−1 < 0 beweisen. f) Aus 0 < a ≤ b folgt a−1 ≥ b−1 . Dies ergibt sich, wenn man die Ungleichung a ≤ b mit dem positiven Element a−1 b−1 multipliziert. Entsprechend folgt aus a ≤ b < 0, dass a−1 ≥ b−1 ist. Sind also a, b beide positiv, oder beide negativ, so kehren sich durch das multiplikative Invertieren die Größenverhältnisse um. Ist allerdings a < 0 < b, so ist auch a−1 < 0 < b−1 . g) Es ist a ≤ b ⇐⇒ 0 ≤ b − a. Deshalb kennt man eine Anordnung eines Körpers bereits dann, wenn man weiß, welche Elemente nichtnegativ (oder auch positiv) sind. Satz 3.2.4 Der Körper Q besitzt außer der uns bereits bekannten Anordnungen keine weiteren. 90 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Beweis: Wir wissen, dass auf jeden Fall 1 positiv ist. Dann sind aber auch 1 + 1, 1 + 1 + 1, und so weiter positiv. Jede natürliche Zahl ist somit ≥ 0. Ist n 6= 0 eine natürliche Zahl, so ist m auch n−1 positiv, dann ist aber auch jeder Bruch = m · n−1 (in dem natürlich n 6= 0 ist) von n natürlichen Zahlen nichtnegativ, also genau diejenigen Elemente, die auch bei der bekannten Anordnung von Q nichtnegativ sind. 3.2.5 Sei K weiterhin ein angeordneter Körper. Dann ist in ihm 1 > 0, folglich sind alle endlichen Summen (aber nicht die leere Summe) von 1 mit sich selbst positiv. Daraus folgt, dass eine Gleichung zwischen solchen Summen a := 1 + 1 + · · · + 1 = b := 1 + 1 + · · · + 1 nur dann gelten kann, wenn auf beiden Seiten gleichviele Summanden stehen. (Beachte, dass diese Aussage in einem endlichen Körper falsch ist!) Denn wenn etwa rechts mehr Summanden als links stünden, gäbe es eine nichtleere Summe c von 1 mit sich selbst, so dass b = a + c und b = a wäre. Dies bedeutet, dass man die Menge N mit Menge der 1-Summen (einschließlich der leeren Summe, die als 0 verstanden wird) eines beliebigen angeordneten Körpers identifizieren kann, und zwar so, dass Addition, Multiplikation und die Relation ‘≤’ dabei nicht verändert werden. Dann kann man auch Z mit der Menge der Elemente aus K, die 1-Summen oder deren additiv Inverse sind, identifizieren, so dass die Rechenoperationen und die Ordnungsrelation dabei berücksichtigt wird. Da K ein Körper ist, kann man jeden Bruch m mit dem Körperelement n −1 mn identifizieren. Man darf also annehmen, dass Q als Teilkörper in einem jeden angeordneten Körpern liegt. Zur axiomatischen Definition der reellen Zahlen benötigen wir unter anderem ein Axiom, das für den Körper Q erfüllt ist: Definition 3.2.6 Ein archimedisch angordneter Körper K ist ein angeordneter Körper, derart dass zu Elementen a, b ∈ K mit a, b > 0 ein n ∈ N mit na ≥ b existiert. (Nach Annahme liegt ja Q, also auch N in dem Körper. Man kann allerdings auch ohne diese Annahme na definieren, nämlich als n-fache Summe von a zu sich selbst.) Bemerkung 3.2.7 Q ist ein archimedisch angeordneter Körper. Sind nämlich m1 , m2 , n1 , n3 natürliche Zahlen 6= 0, so ist offenbar (m2 n1 ) m1 m2 ≥ n1 n2 Satz 3.2.8 Sei K ein angeordneter Körper. Folgende Aussagen sind äquivalent: (i) K ist archimedisch angeordnet. (ii) Jedes positive a ∈ K liegt zwischen zwei positiven rationalen Zahlen. Beweis: Sei K archimedisch angeordnet, so gibt es eine natürliche Zahl n mit n · 1 ≥ a. Also ist a ≤ n mit der rationalen (sogar natürlichen) Zahl n. 3.2. GRENZWERTE UND REELLE ZAHLEN Ferner gibt es eine natürliche Zahl n0 mit 1 a ≤ n0 , also a ≥ 91 1 . n0 Umgekehrt erfülle ein angeordneter Körper K obige Aussage und seien a, b ∈ K positiv. Dann gibt es natürliche Zahlen m1 , n1 , m2 , n2 mit a≥ m1 m2 und b ≤ , also m2 n1 a ≥ b . n1 n2 3.2.9 Die ganzen Zahlen liegen auf der Zahlengerade voneinander isoliert. Anders die rationalen Zahlen. Zwischen ihnen siehst Du auf den ersten Blick keine Lücken. Zwischen je zwei verschiedenen rationalen Zahlen liegen noch unendlich viele weitere. Man könnte vermuten, die rationalen Zahlen füllten die Zahlengerade aus!? ABER betrachte die Funktion x2 − 5 auf dem Bereich der rationalen Zahlen ≥ 0. Wenn Du sie, d.h. ihren Graph zeichnest, erhältst Du eine schöne Kurve, welche die x-Achse zwischen 2 und 3 zu schneiden scheint. Gibt es eine rationale Zahl x, für die x2 − 5 = 0 ist? Du weißt, dass die Antwort ‘nein’ lautet. Der Schnittpunkt der Kurve mit der x-Achse ist also kein rationaler Punkt. Und das nicht die einzige Ausnahme. Wir wissen z.B. auch, dass die unendliche P ist natürlich 1 Reihe ∞ im Bereich der rationalen Zahlen keinen (Grenz-)Wert hat, obwohl die Folge n=0 n! ihrer Partialsummen monoton wächst und nach oben beschränkt ist. Und so weiter, und so fort. Gewisse Lücken scheinen irgendwie doch zwischen den rationalen Zahlen zu existieren, mögen sie auch ‘unendlich kleine Lücken’ sein. Später wirst Du sogar zu der etwas paradoxen Erkenntnis kommen, dass es in einem gewissen Sinne mehr Lücken zwischen den rationalen Zahlen als rationale Zahlen gibt. Ganz offenbar hat der Körper Q der rationalen Zahlen seine Defizite. Ich will einen größeren angeordneten Körper R, den Körper der reellen Zahlen axiomatisch einführen und später auch ein wenig dazu sagen, wie man ihn konstruieren kann. Einfach, aber höchst nützlich ist der Begriff des Absolutbetrags. Sei K ein angeordneter Körper. Der Abstand zweier seiner Elemente a und b ist a − b oder b − a je nachdem, welche Differenz nicht negativ ist. Mit Hilfe des sogenannten Absolutbetrages kann man den Abstand einfach in der Form |a − b| schreiben. Definition 3.2.10 Sei a ein Element eines geordneten Körpers, so definieren wir den Absolutbetrag (kurz Betrag) |a| von a als die größere der beiden Zahlen a, −a. (Für a = 0 meine ich damit natürlich |0| = 0.) 92 Eigenschaften: |a| ≥ 0. KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN |a| = 0 ⇐⇒ a = 0, |a + b| ≤ |a| + |b|. |ab| = |a| · |b|. Sei ε > 0, dann bedeutet |a − b| < ε dasselbe wie a − ε < b < a + ε (und natürlich auch dasselbe wie b − ε < a < b + ε). 3.2.11 Ich will im Folgenden klären, was man unter einem Grenzwert einer (unendlichen) Folge (an ) = (an )n = (an )n∈N = (a0 , a1 , a2 , . . .) verstehen soll. 1 Vielleicht hast Du ja schon ein gewisses Gefühl dafür, dass etwa die Folge ( n+1 ) den Grenzwert n 0 bzw. die Folge n+1 den Grenzwert 1 hat. Man muss sich fragen, ob notwendiger Weise der Begriff Grenzwert“ ein vager Begriff ist, ” ob man etwa von jedem Mathematiker verlangen muss, dass ihm intuitiv klar ist, dass die genannten Folgen die genannten Grenzwerte haben – oder ob man dies präzise fassen kann. Nun, die folgende Definition ist präzise; aber Du musst Dir schon ordentlich Mühe geben, sie zu verstehen. Definitionen 3.2.12 Sei (an )n∈N eine Folge in einem angeordneten Körper K und a ein Element dessselben. a) Man sagt: Die Folge (an )n∈N habe den Grenzwert oder Limes a, oder auch konvergiert gegen a, wenn es zu jedem (noch so kleinen) Element ε > 0 von K ein N ∈ N gibt, so dass |an − a| < ε für alle n ≥ N gilt. Mit lim an oder limn→∞ an wird der Limes bezeichnet, wenn n→∞ es ihn gibt. b) Die Folge heißt – unspezifiziert – konvergent, oder man sagt, sie konvergiert, wenn es ein a ∈ K gibt, gegen welches sie konvergiert. c) Eine Folge heißt divergent, wenn sie nicht konvergent ist. Beachte: Eine Folge, die in einem vernünftigen Sinn den Grenzwert ∞ oder auch −∞ hat, nennen wir nicht konvergent, sondern divergent! Um o.a. Definition a) etwas anders zu formulieren, definieren wir zunächst den Begriff ε-Umgebung einer Zahl a. Definition 3.2.13 Sei ε > 0 ein Element eines angeordneter Körpers K. Die ε-Umgebung von a besteht aus den Elementen b ∈ K mit |b − a| < ε. Obige Definition des Grenzwertes besagt dann: limn→∞ an = a bedeutet: Jede ε-Umgebung (mit ε > 0) von a (und sei ε noch so klein) enthält, bis auf endlich viele n, alle an . Bemerkung 3.2.14 Wenn eine Folge in einem angeordneten Körper überhaupt einen Grenzwert hat, so hat sie nur einen einzigen. Denn wären etwa verschiedene a, a0 Grenzwerte einer Folge (an )n , so wäre ε := |a − a0 |/2 > 0. Aber die ε-Umgebungen von a und a0 haben kein Element gemeinsam. Es ist also nicht möglich, dass sowohl in der ε-Umgebung von a als auch in der von a0 alle an bis auf endlich viele n liegen. 3.2. GRENZWERTE UND REELLE ZAHLEN 93 Beispiele 3.2.15 Jetzt wollen wir uns Beispiele für Konvergenz, aber auch für Nichtkonvergenz überlegen und beschränken uns dabei auf archimedisch angeordnete Körper! a) Die Folge (1/n), n ≥ 1, also die Folge (1, 12 , 13 , . . .) konvergiert in einem archimedisch angeordneten Körper gegen 0, ebenso die Folge (2−n ), n ≥ 0, d.h. die Folge (1, 12 , 14 , 18 , . . .). Sei nämlich ε ≥ k/m mit ganzen k, m > 0. Dann ist für alle n ≥ N . 1 m ≤ ε. Ist nun N = m+1, so ist 1 n < 1 m ≤ε Jedes Glied der Folge (2−n )n ist auch ein Glied der Folge ( n1 )n≥1 . Die Folge (2−n )n ist eine sogenannte Teilfolge der Folge (n−1 ). (Es ist sogar 2−n ≤ n−1 .) Deshalb trifft die Definition der Konvergenz gegen 0 auch auf sie zu. b) Die Folge ((−2)−n ), n ≥ 0, also die Folge (+1, − 21 , + 14 , − 18 , . . .) konvergiert ebenfalls gegen 0. Es kommt ja nur auf den Abstand der Folgenglieder zu 0 an. Allgemeiner gilt: Wann immer eine Folge (an )n gegen 0 konvergiert, so gilt dies auch für die Folge ((−1)n an )n . Allgemeiner gilt: lim an = lim |an |; und wenn einer der Limites existiert, dann auh der andere. c) Sei in einem archimedisch angeordneten Körper |q| < 1. Dann gilt limn→∞ q n = 0. Sei nämlich ε > 0 und setze |q|−1 = 1 + a mit a > 0. Dann ist nach der Bernoullischen Ungleichung |q|n ≥ 1 + na. Wegen der Archimedizität gibt es dann ein N , derart dass na > ε−1 für alle n ≥ N gilt. Für diese n ist dann auch |q|−n > ε−1 , also |q|n < ε. d) Betrachte die Folge ((−1)n + 2−n ), n ∈ N. Sie nähert sich sozusagen den Zahlen −1 und 1. (Genauer nähert sich die ‘Hälfte’ der Folgenglieder der 1, die andere ‘Hälfte’ der −1.) Diese sind keine Grenzwerte im Sinne obiger Definition, sondern sogenannte Häufungspunkte. Obwohl der Begriff ‘Häufungspunkt’ nicht unwichtig ist, will ich in diesem Buch auf seine Definition verzichten. n f) Die Folge (n(−1) ), n ≥ 1 verhält sich nicht viel anders. Sie hat außer dem ‘Häufungspunkt’ 0 noch den ‘uneigentlichen Häufungspunkt’ ∞. Auch diese Reihe ist nicht konvergent, d.h. hat keinen Grenzwert. g) Betrachte die Folge (an )n∈N , wo an folgendermaßen definiert sei: an := (n + 2)−1 für gerade n −1 n für ungerade n d.h. die Folge ( 21 , 1, 14 , 13 , 16 , 15 , . . .). Diese Folge nähert sich der 0 wie die Echternacher Springprozession. D.h. in jedem 2. Schritt weicht sie wieder etwas zurück. Trotzdem konvergiert sie gegen 0 im Sinne unserer Definition. (Beweis?) Nach meiner Meinung wäre es auch sehr engherzig, wollte man eine solche Folge nicht als eine Folge mit dem Grenzwert 0 ansehen. h) Die Folge (1+ n1 ) hat zwar die Eigenschaft, dass ihre Glieder immer kleiner werden, trotzdem geht sie nicht gegen 0, sondern gegen 1, i) Schließlich hat eine ‘konstante’ Folge, in der alle Glieder gleich ein und demselben Element a sind, also eine Folge der Form (a, a, a, . . .) den Grenzwert a. 94 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Frage: Ist folgende Aussage äquivalent dazu, dass eine Folge (an ) den Grenzwert 0 hat? Vom Vorzeichen abgesehen ist jedes Folgenglied kleiner als das vorangehende.“ ” Ja Nein Beachte die Beispiele g) und h)! Diesen Vorschlag, Konvergenz (gegen 0) so zu definieren habe ich tatsächlich irgendwo gelesen. 3.2.16 Körper der reellen Zahlen. Der Körper der reellen Zahlen hat vor dem Körper der rationalen Zahlen den Vorzug, dass in ihm die Folgen, ‘die eigentlich konvergieren sollten’, auch wirklich konvergieren. Die Folgen, ‘die eigentlich konvergieren sollten’, sind die sogenannten ‘Cauchy-Folgen’. Während die Glieder einer konvergenten Folge ‘schließlich beliebig nahe bei ihrem Limes’ liegen, liegen die Glieder einer Cauchy-Folge ‘schließlich beliebig nahe beieinander’. Genauer Definition 3.2.17 Eine Folge (an )n∈N heißt eine Cauchy-Folge, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass |an − am | < ε für alle n, m ≥ N gilt. Wie Du weiter unten sehen wirst, ist jede konvergente Folge in einem (archimedisch) angeordneten Körper eine Cauchy-Folge. Beispiele 3.2.18 a) Die unendliche Reihe P∞ 1 n=0 n! hat die Partialsummen k X 1 1 1 1 1 1 1 = 1, s1 = + = 2, s2 = + + = 2,5 , . . . , sk = , ... s0 = 0! 0! 1! 0! 1! 2! n! n=0 Man erhält für 1 ≤ k < l leicht die Abschätzung (Ungleichung) (vgl. Abschnitt 3.1, Beispiel 2 b)) 1 1 1 1 1 sl − sk = + ··· + ≤ + ··· + < (k + 1)! l! (k + 1)(k + 2) (n − 1)n k+1 P∞ 1 Mithin ist die Reihe n=0 n! , aufgefasst als Folge ihrer Partialsummen, eine Cauchy-Folge. b) Die harmonische als Folge ihrer Partialsummen aufgefasst, ist keine Cauchy-Folge. P∞ P∞ Reihe, 1 Zeige dazu: Da n=1 n schließlich jede Schranke überschreitet, so muss auch n=k n1 , wo man die ersten k − 1 Glieder weggelassen hat, dies tun. c) Die Folgen (an ) mit an = n, bzw. an = (−1)n sind keine Cauchy-Folgen. d) Sei m,α1 α2 α3 . . . ein unendlicher Dezimalbruch mit m ∈ N, αi ∈ {0, 1, . . . , 9}. (Hier sind mit m die ‘Vorkommazahl’ und mit α1 , α2 , α3 , . . . die Stellen nach dem Komma bezeichnet worden.) Wir interpretieren ihn als Folge der abbrechenden Dezimalbrüche a0 = m, a1 = m,α1 , a2 = m,α1 α2 , . . .. Sei k ≤ n. Dann ist an − ak ≤ 10−k . also die genannte Folge eine Cauchy-Folge. e) Ist (an )n∈N eine in Q konvergente Folge rationaler Zahlen, so ist sie eine Cauchy-Folge. Sei nämlich a ihr Limes und ε > 0 rational. Dann gibt es ein N ∈ N mit |an − a| < ε/2 für alle n > N . Für m, n > N gilt dann |an − am | = |an − a + a − am | ≤ |an − a| + |a − am | < ε/2 + ε/2. 3.2. GRENZWERTE UND REELLE ZAHLEN 95 3.2.19 Man kann nun den Körper der reellen Zahlen axiomatisch einführen, d.h. als archimedisch angeordneten Körper definieren, in dem jede Cauchy-Folge konvergiert. Man kann nachweisen, dass es ‘im Wesentlichen’ nur einen solchen Körper gibt. D.h., sind R, R0 zwei solche Körper, so gibt es eine Beziehung a ↔ a0 zwischen den Elementen a ∈ R und a0 ∈ R0 , so dass diese Beziehung jedem a ∈ R genau ein a0 ∈ R0 zuordnet und umgekehrt, und dass a + b ↔ a0 + b0 , ab ↔ a0 b0 , sowie a ≤ b ⇐⇒ a0 ≤ b0 aus a ↔ a0 , b ↔ b0 folgt. 3.2.20 Nun ist es aber keineswegs klar, dass es so einen Körper der reellen Zahlen wirklich gibt. Ein anschauliches Argument wäre, dass sich eine Cauchy-Folge auf der Zahlengeraden ja ‘augenscheinlich zu einem Punkt zusammenzieht’. Möglicherweise wirst Du ein solches ‘anschauliches’ Argument doch mit sehr skeptischen Augen betrachten. Es gibt mehrere Möglichkeiten, den Körper der reellen Zahlen zu konstruieren. Eine möchte ich hier vorstellen. Sie besitzt eine gewisse Analogie zur Konstruktion der rationalen Zahlen. Da man eine ganze Zahl nur selten durch eine andere ganze Zahl im Bereich der ganzen Zahlen dividieren kann, m , d.h als das drückt man das virtuelle Ergebnis der Division von m durch n einfach als n 0 m m und 0 als zueinander gleich betrachten, Zahlenpaar (m, n) aus. Dabei muss man allerdings n n wenn die virtuellen Divisionsergebnisse m : n und m0 : n0 sinnvollerweise als gleich anzusehen sind, d.h. wenn sie als ‘Verhältnisse’ gleich sind, d.h. wenn mn0 = m0 n ist. So kann man auch bei der Konstruktion von R vorgehen. Cauchy-Folgen rationaler Zahlen konvergieren nur selten im Bereich der rationalen Zahlen. Deshalb wird man die reellen Zahlen einfach als Cauchy-Folgen rationaler Zahlen ansehen. Dabei stellen zwei Cauchy-Folgen (an )n∈N und (bn )n∈N rationaler Zahlen genau dann dieselbe reelle Zahl dar, wenn diese beiden Folgen gegen denselben virtuellen Grenzwert konvergieren, d.h. wenn die Folge der Differenzen (an − bn )n∈N eine Nullfolge ist, d.h. gegen 0 konvergiert. 3.2.21 Dann ist natürlich noch eine Menge zu tun. Um die Addition zu definieren, musst Du etwa zeigen: Wenn (an ) und (a0n ) sich nur um eine Nullfolge unterscheiden, so tun dies auch (an + bn ) und (a0n + bn ). Entsprechendes ist für die Multiplikation zu tun, und da auch etwas schwieriger. Ist (an ) eine Cauchy-, aber keine Nullfolge, so muss man zeigen, dass an = 0 nur für endlich viele n gilt, damit man ein multiplikativ Inverses bilden kann. Die Anordnung auf R ist zu definieren. Und schließlich muss man zeigen, dass R archimedisch angeordnet ist und dass reelle Cauchy-Folgen konvergieren. 3.2.22 Die Dir vertrauteste Darstellung der reellen Zahlen ist vermutlich die durch (unendliche) Dezimalbrüche. Ein Dezimalbruch kann als Cauchy-Folge aufgefasst werden, siehe Beispiel 3.2.18 d). Umgekehrt kann man jede reelle Zahl als Dezimalbruch schreiben. Vgl. [Forster]. 96 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN Reelle Zahlen als Dezimalbrüche zu schreiben, hat den Vorteil dass eine reelle Zahl meist auf nur eine Weise als Dezimalbruch geschrieben werden kann. (Beachte jedoch, dass z.B. 1,3 = 1,29 = 1,299999 . . . ist.) Vor allem aber sind sie wohlvertraut. Das Rechnen mit unendlichen Dezimalbrüchen hat allerdings so seine Tücken. Aber das Rechnen mit abbrechenden Dezimalbrüchen, welche die allgemeinen Dezimalbrüche approximieren, ist unproblematisch. 3.2.23 Wie willst Du also mit reellen Zahlen umgehen? Hier mein Vorschlag: Anschaulich fasse sie als die Punkte auf der Zahlengeraden auf. Rechne mit ihnen approximativ mit abbrechenden Dezimalbrüchen. Für theoretische Überlegungen verwende ihre o.a. axiomatische Beschreibung: R ist ein archimedisch angeordneter Körper, in dem jede Cauchy-Folge konvergiert. 3.2.24 Man kann den Körper R auf mehrere andere Weisen kennzeichnen. Z.B. (i) R ist ein archimedisch angeordneter Körper, in dem jede monoton wachsende Folge, die nach oben beschränkt ist, konvergiert. (ii) R ist ein archimedisch angeordneter Körper, in dem es zu jeder nichtleeren nach oben beschränkten Menge M ein sogenanntes Supremum (s.u.) gibt. (Übrigens kann man in beiden Definitionen das Wort ‘archimedisch’ weglassen. Die Archimedizität ist eine Folge der jeweils angegebenen anderen Eigenschaft.) Definitionen 3.2.25 a) Ein Supremum einer Menge reeller Zahlen ist eine reelle Zahl s mit x ≤ s für alle x ∈ M derart, dass in M eine Folge (an ) mit limn→∞ an = s existiert. b) Sei M eine Menge reeller Zahlen. Ein Infimum von M ist eine reelle Zahl s, derart, dass s ≤ x für alle x ∈ M gilt und in M eine Folge (xn )n∈N mit limn→∞ xn = s existiert. 3.2.26 Seien (an )n und (bn )n konvergente Folgen. Was gilt dann für die Folgen (an + bn )n , (an bn )n und (an /bn )n ? Es ist so, wie man es sich besser nicht denken kann. Satz 3.2.27 Seien die Folgen (an )n , (bn )n konvergent mit den Grenzwerten a, bzw. b. Dann gilt: a) Auch die Folge (an + bn )n konvergiert und es ist limn→∞ (an + bn ) = a + b. b) Auch die Folge (an bn )n konvergiert und es ist limn→∞ an bn = ab. c) Ist b = limn→∞ bn 6= 0, dann kann bn = 0 nur für endlich viele n gelten. Ferner ist limn→∞ (an /bn ) = a/b, wenn in der Folge der (an /bn ) die endlich vielen Glieder, wo bn = 0 ist, weggelassen sind. Beweis: a) ist fast trivial, wenn man |an + bn − (a + b)| ≤ |an − a| + |bn − b| (Dreiecksungleichung!) beachtet. Man will ja zeigen, dass es zu gegebenem ε > 0 ein N gibt so dass |an + bn − (a + b)| < ε für n ≥ N gilt. Man darf voraussetzen, dass es zu ε/2 (!) ein N 0 gibt 3.2. GRENZWERTE UND REELLE ZAHLEN 97 mit |an − a| < ε/2 für n ≥ N 0 und es ebenso ein N 00 gibt mit |bn − b| < ε/2 für n ≥ N 00 . Das gesuchte N ist dann die größere der Zahlen N 0 , N 00 (d.h. N = Max{N 0 , N 00 }.) (Wenn N 0 = N 00 sein sollte, ist natürlich N = N 0 = N 00 gemeint.) b) Für die zweite Behauptung benötigt man, dass eine konvergente Folge beschränkt ist, d.h. ganz zwischen festen Schranken bleibt: Es gibt ein c mit |an | ≤ c für alle n. (Warum ist das so?) Somit ist |an bn − ab| = |an bn − an b + an b − ab| ≤ |an ||bn − b| + |an − a||b|, wo letzterer Ausdruck beliebig klein für große n wird, da |an | ≤ c ist. Ein hübscher kleiner Trick! an 1 1 c) Da = an · , genügt es die Folge zu betrachten, um dann b) anzuwenden. Setze bn bn bn n c := |b|/2. Da bis auf endlich viele n alle bn in dem Intervall ]b − c, b + c[ liegen, kann bn ≤ c nur für endlich viele n gelten. (Du darfst ja ε = c verlangen.) Wenn wir die Folgenglieder mit |bn | ≤ c weglassen, konvergiert der Rest der Folge immer noch gegen b. Für die restlichen n gilt dann 1 − 1 = |b − bn | < |b − bn | bn b |bbn | |bc| Sei jetzt ε > 0 beliebig. Ist nun N so groß, dass |bn − b| < ε|bc| für alle n > N gilt, so ist 1 1 − <ε. bn b 3.2.28 Anwendung: Wir betrachten die unendliche geometrische Reihe ∞ X qn = 1 + q + q2 + q3 + · · · n=0 Wir wissen bereits, dass für endliche geometrische Reihen mit q 6= 1 folgendes gilt: k X qn = 1 + q + q2 + q3 + · · · + qk = n=0 1 − q k+1 . 1−q Die unendliche geometrische Reihe konvergiert also genau dann, wenn die Folge konvergiert. 1 − q k+1 1−q k∈N Nun ist limk→∞ q k = 0 (also auch limk→∞ q k+1 = 0, nicht wahr?), wenn |q| < 1 ist. Nach obigem Satz folgt ∞ X 1 qn = für |q| < 1. 1 − q n=0 Für |q| ≥ 1 erkennt man leicht, dass die Reihe divergiert. Das Konvergenzverhalten der geometrischen Reihe findet häufige Anwendung. 98 KAPITEL 3. GRENZWERTE UND REELLE ZAHLEN P (−1)n+1 konver3.2.29 Absolute Konvergenz. Die alternierende harmonische Reihe ∞ n=1 n giert bekanntlich. Aber, wenn man in ihr jedes Glied durch seinen Absolutbetrag ersetzt, erhält man die divergente harmonische Reihe. Definition 3.2.30 Eine unendliche Reihe P∞ he k=0 |ak | konvergiert. P∞ k=0 ak heißt absolut konvergent, wenn die Rei- Satz 3.2.31 Im Bereich der reellen Zahle ist jede absolut konvergente Reihe auch konvergent. Beweis: P Wir zeigen mit Hilfe der Dreiecksungleichung, dass die zu Pneiner absolut konvergenten Pn Reihe ∞ a gehörende Folge eine Cauchy-Folge ist. Setze s := n k=0 k k=0 ak und tn := k=0 |ak |. Wir haben zu zeigen, dass zu jedem ε > 0 ein N ∈ N existiert, für das |sm − sn | < ε gilt, falls m, n ≥ N ist. Wir haben |sm − sn | = | m X k=n+1 ak | ≤ ∞ X |ak | = |tm − tn | k=n+1 Da nach Voraussetzung die Folge der tn konvergiert, gibt es ein N ∈ N mit |tm − tn | < ε falls m, n ≥ N ist. Unter derselben Voraussetzung ist auch |sm − sn | < ε. Die ist, wie oben gesehen, falsch. Man kann auch den Wert von P∞ Umkehrung diesesPSatzes ∞ |a | a aus dem von k nicht durch eine allgemeine Methode berechnen. k=0 k=0 k Kapitel 4 Vom primitiven Urgrund moderner Mathematik 4.1 Mengen Die in diesem Kapitel angesprochenen Begriffe sind zwar schrecklich abstrakt, aber im Grunde einfach zu verstehen. Versuche zu erkennen, wie simpel, ja geradezu primitiv diese Dinge sind. Die Mengensprache ist eine einfache, aber wichtige und grundlegende Sprache der modernen Mathematik. Solltest Du einst Mathematik, Physik oder Informatik studieren, wirst Du mit Mengen und Abbildungen täglich umgehen müssen. Achtung: So einfach die folgenden Dinge sind, so pedantisch musst Du sie und ihre Bezeichnungen allerdings behandeln. Zum Beispiel bezeichnet {0, 2} die Menge der beiden Zahlen 0 und 2, während mit [0, 2] die Menge aller (unendlich vielen) reellen Zahlen zwischen 0 und 2 einschließlich 0 und 2 bezeichnet wird. S.u. 4.1.1 Eine Menge M wird dadurch konstituiert, dass man auf widerspruchsfreie Weise angibt, welche Dinge zu ihr gehören sollen, d.h. für welche x das Symbol x ∈ M gelten soll, d.h. welche Dinge Elemente der Menge sind. Gilt dies für nur endlich viele Dinge, d.h ist die Menge M endlich, so kann man sie prinzipiell durch Angabe aller ihrer Elemente beschreiben, die man gemeinhin in geschweifte Klammern setzt, wobei es auf die Reihenfolge nicht ankommt, und auch nicht darauf, ob man (zufällig) eines ihrer Elemente mehrfach angibt: {3, 7, 2, 7, 1, 7} = {3, 7, 2, 3, 7, 1, 2} = {3, 7, 2, 1} = {1, 2, 3, 7} Bezeichnung: Die Anzahl der Elemente einer endlichen Menge M wird mit #M bezeichnet. Häufig findet man stattdessen auch die Bezeichnung |M |. Man nennt #M auch die Kardinalzahl von M . 99 100 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Unendliche Mengen, d.h. solche mit unendlich vielen Elementen, muss man anders beschreiben. Wir wollen z.B. die Mengen N, Z, Q, R als wohlbeschrieben ansehen und aus ihnen weitere Mengen gewinnen, z.B. die Menge der geraden ganzen Zahlen, die man wie folgt (auf zweierlei Art) schreiben kann: {n n ∈ Z, 2|n} = {n ∈ Z 2|n} Die zweite Bezeichnung ist nur eine Abkürzung der ersten. (Den ersten senkrechten Strich habe ich hier so groß geschrieben, um ihn von dem Strich zu unterscheiden, der angibt, dass 2 ein Teiler von n ist.) Ebenso ist {n ∈ Z 2 - n} die Menge der ungeraden Zahlen. (Statt des senkrechten Striches schreiben manche auch ;“ oder :“ .) ” ” Wichtige Mengen reeller Zahlen sind die Intervalle. Seien a, b ∈ R mit a < b, so schreibt man: [a, b] := {x ∈ R | a ≤ x ≤ b} , ]a, b[ := {x ∈ R | a < x < b} , ]a, b] := {x ∈ R | a < x ≤ b} , [a, b[ := {x ∈ R | a ≤ x < b} Also ist [a, b] die Menge aller reellen Zahlen zwischen a und b einschließlich a und b. Und ]a, b[ besteht aus allen reellen Zahlen zwischen a und b, wobei aber a und b ausgeschlossen sind. Bei den Intervallen ]a, b] und [a, b[ ist jeweils ein Endpunkt eingeschlossen, der andere ausgeschlossen. Bei festem a, b unterscheiden sich je zwei von diesen Mengen in höchstens 2 Elementen. Frage: Darf man sie deshalb miteinander verwechseln? Ohne Probleme, denn es kann ja wohl nichts ausmachen, ob man einen oder beide ‘Endpunkte’ eines Intervalls zu diesem rechnet oder nicht. Man möge bitte bedenken, dass alle o.a. Intervalle die gleiche Länge b − a haben. Außerdem kann man sie zeichnerisch (als Strecken auf der Zahlengeraden) nicht wirklich voneinander unterscheiden. Keinesfalls, denn das Intervall ]a, b[ hat z.B. in Bezug auf Konvergenz völlig andere Eigenschaften als das Intervall [a, b]. (Betrachte, für b > a + 1, z.B. die Folge (a + 1/n)n = (a + 1, a + 1/2, a + 1/3, . . .).) Neben den oben genannten beschränkten Intervallen betrachten wir auch unendliche große Intervalle [a, ∞[ := {x ∈ R | a ≤ x} , ]a, ∞[:= {x ∈ R | a < x} ] − ∞, b] := {x ∈ R | x ≤ b} , ] − ∞, b[:= {x ∈ R | x < b} N.B. Es ist R+ = [0, ∞[ , R∗+ = ]0, ∞[. Alle solche Mengen bezeichnen wir als Intervalle. (Beachte, dass wir nur Intervalle positiver oder unendlicher Länge betrachten, also weder [a, a] = {a}, noch ]a, a[ als Intervall bezeichnen. Somit sind alle Intervalle unendliche Mengen! D.h. sie haben unendlich viele Elemente.) Beachte: Intervalle der Form [a, ∞] usw., die nicht ganz in R liegen, werden in diesem Buch nicht betrachtet. Man zieht auch die Menge in Betracht, die gar keine Elemente besitzt, die sogenannte leere Menge, die mit ∅ bezeichnet wird. Z.B. ist {x ∈ R | a < x < a} = ∅. 4.1. MENGEN 101 Was meinst Du dazu? Es ist wirklich formaler Quatsch, ∅ zu betrachten. Man kann leicht Mengen M definieren, von denen es nicht von vorneherein klar ist, ob sie leer sind. Es kann also ungewollt passieren, dass M = ∅ ist. Deshalb hat es nicht viel Sinn, ∅ von der Betrachtung auszuschließen. 4.1.2 Seien M, N Mengen. Man nennt M eine Teilmenge von N (und manchmal N eine Obermenge von M ) und schreibt M ⊂ N oder N ⊃ M , wenn jedes Element von M auch ein solches von N ist: h i M ⊂ N ⇐⇒ x ∈ M =⇒ x ∈ N h i Die eckigen Klammern , sind hier logische Klammern! Die Aussage M ⊂ N kann man auch so ausdrücken: Für alle x gilt [x ∈ M =⇒ x ∈ N ]. ” Dabei schließen wir die Gleichheit nicht aus. Es gilt mit dieser Definition also M ⊂ M . (Manche benutzen deshalb statt ‘M ⊂ N ’ lieber die Bezeichnung ‘M ⊆ N ’.) Zum Beispiel gelten {1, 3, 7} ⊂ {1, 2, 3, 7} , {n ∈ Z 6|n} ⊂ {n ∈ Z 3|n} , [a, b[⊂ [a, b] 4.1.3 Der Durchschnitt M1 ∩ M2 zweier Mengen M1 und M2 ist die Menge aller Elemente, die sowohl Elemente von M1 , als auch solche von M2 sind: M1 ∩ M2 = {x | x ∈ M1 und x ∈ M2 } Beispiele: {1, 7, 3, 8, 4, 9} ∩ {3, 7, 2, 7, 1, 7} = {1, 3, 7} , = {n ∈ Z 6|n} , ]0, 3[ ∩ Z = {1, 2}. {n ∈ Z 2|n} ∩ {n ∈ Z 3|n} Man beachte dass das Wort ‘Durchschnitt’ hier in einem ganz anderen Sinne gebraucht wird als in dem Satz Der Durchschnitt der Schokoladenpreise in diesem Supermarkt ist 79 Cent“. ” Der Durchschnitt von Mengen bedeutet nicht ein arithmetisches Mittel. Die Vereinigung M1 ∪ M2 zweier Mengen M1 und M2 ist die Menge aller derjenigen Elemente, die in M1 oder M2 liegen, d.h. die ein Element mindestens einer der beiden Mengen sind. M1 ∪ M2 := {x | x ∈ M1 oder x ∈ M2 } Beispiele {1, 7, 3, 8, 4, 9} ∪ {3, 7, 2, 7, 1, 7} = {1, 2, 3, 4, 7, 8, 9}, [0, 2] ∪ [2, 3] = [0, 3], [0, 3[ ∪ [2, 4[= [0, 4[, ] − ∞, 0[ ∪ ]0, ∞[= R∗ . Man mag geneigt sein zu sagen, die Elemente von M1 ∪ M2 seien die Elemente von M1 und von M2 . Du solltest Dir aber darüber im Klaren sein, dass bei dieser Sprechweise nicht gemeint ist: M1 ∪ M2 besteht aus den Elementen x, für die x ∈ M1 und x ∈ M2 gilt. Letztere Menge wäre gerade der Durchschnitt M1 ∩ M2 . Man muss unterscheiden, ob das Wort ‘und’ Aussagen oder Gegenstände verbindet. 102 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK (Die ursprünglichen Bezeichnungen ‘Durchschnitt’ und ‘Vereinigung’ wurden später mit ‘intersection’ und ‘union’ ins Englische und Französische übersetzt. Es gibt keinen Grund, sie auch im Deutschen so zu nennen.) Offenbar gelten folgende Aussagen: M 1 ⊂ M1 ∪ M 2 , M2 ⊂ M 1 ∪ M 2 , M1 ∩ M 2 ⊂ M 1 , M1 ∩ M 2 ⊂ M 2 Man kann auch den Durchschnitt und die Vereinigung von mehr als zwei Mengen bilden, ja sogar von unendlich vielen Mengen. Beispiele: a) 2Z ∩ 3Z ∩ 5Z = 30Z. Dabei habe ich mit mZ die Menge {mk | k ∈ Z} = {n ∈ Z | es gibt ein k mit n = mk}, also die Menge der durch m teilbaren ganzen Zahlen bezeichnet. b) Die Menge 2Z ∪ 3Z ∪ 5Z, also die Menge der ganzen Zahlen, die durch 2 oder 3 oder 5 teilbar sind, lässt sich nicht in der Form mZ schreiben. c) Mit P bezeichne \ ich die Menge der Primzahlen. Der unendliche Durchschnitt 2Z∩3Z∩5Z∩. . ., pZ bezeichnet wird, besteht nur aus der 0, da jede von 0 verschiedene ganze der auch mit p∈P Zahl durch nur endlich viele Primzahlen teilbar ist. 4.1.4 Man betrachtet auch die Mengendifferenz, auch Differenzmenge M −N (auch M \N geschrieben): M − N := {x ∈ M | x ∈ / N } = {x | x ∈ M und x ∈ / N} Beispiele: a) {1, 3, 4, 7, 8, 9}−{1, 2, 3, 5, 7} = {4, 8, 9} oder Z−{n ∈ Z 2 - n} = {n ∈ Z 2|n} oder R − {0} = R∗ . [ pZ bezeichnet wird, ist die b) Die unendliche Vereinigung 2Z ∪ 3Z ∪ 5Z ∪ . . ., die auch mit p∈P Mengendifferenz Z − {1, −1}. Die – selten gebrauchte – symmetrische Differenz zweier Mengen M1 , M2 ist (M1 ∪ M2 ) − (M1 ∩ M2 ) = (M1 − M2 ) ∪ (M2 − M1 ). Beweise diese Gleichheit. 4.1.5 Logische Symbole. Die Absätze 4.1.5 bis 4.1.8 musst Du nicht unbedingt lesen. Sie bilden auch keine Einführung in die (formale) Logik. Sie fügen sich in etwa in den abstrakten Rahmen der Mengenlehre ein und sollen Dir nützen, wenn sie in Deinem späteren Studium gelegentlich von Dozenten oder Kommilitonen verwendet werden. Und solltest Du einmal eine Vorlesung zur Logik besuchen, dann weißt Du schon ein wenig über die benutzten Symbole. Zwei Aussagen A, B kann man logisch verknüpfen durch die Junktoren“ ‘und’ und ‘oder’. ” Diese werden manchmal abgekürzt: ∧ heißt ‘und’, ∨ heißt ‘oder’. Dabei bedeutet ∨ kein ausschließendes ‘oder’. A ∨ B ist genau dann wahr, wenn mindestens eine der Aussagen A, B wahr ist. A ∧ B ist genau dann wahr, wenn beide Aussagen wahr sind. 4.1. MENGEN 103 Obige Definitionen von Durchschnitt und Vereinigung schreiben sich mit diesen Symbolen so: M ∪ N = {a | a ∈ M ∨ a ∈ N }, M ∩ N = {a | a ∈ M ∧ a ∈ N } Beachte: (A ∧ B) ∨ C bedeutet etwas anderes als A ∧ (B ∨ C). Manche Unklarheiten in nicht formalisierten Texten entstehen dadurch, dass man solcherlei nicht leicht unterschiedlich ausdrücken kann. In verbalen Sätzen haben die Klammern – so man sie überhaupt verwendet – eine andere Bedeutung als in mathematischen und logischen Formeln. Die beiden folgenden Ausdrücke sind äquivalent: (A ∧ B) ∨ C und (A ∨ C) ∧ (B ∨ C). Selbiges gilt für A ∧ (B ∨ C) und (A ∧ B) ∨ (A ∧ C). Für Mengen bedeutet dies: L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) , L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ) . D.h. es gelten bezüglich ∪ und ∩ Distributivitätsgesetze. Und zwar eines, wo sich der Durchschnitt wie das Produkt und die Vereingung wie die Summe in einem Ring verhält, und eines wo es gerade umgekehrt ist. (In einem Ring, der nicht der Nullring ist, gilt neben dem bekannten Distributivgesetz kein solches, wo die Rollen von ’+’ und ’·’ vertauscht sind. Dann müsste nämlich 1 + (1 · 0) = (1 + 1) · (1 + 0), also 1 = 1 + 1 sein. Aus der Existenz additiv Inverser folgte dann ein Widerspruch. Für jede Menge M gilt hingegen M = M ∪ M = M ∩ M .) Die Menge aller Teilmengen einer Menge M kann man als Rechenbereich mit den beiden Verknüpfungen ∩, ∪ betrachten. In diesem Rechenbereich gibt es neutrale Elemente, nämlich M bezüglich ∩ und ∅ bezüglich ∪. Inverse Elemente gibt es aber nicht, es sei denn, es ist M = ∅. 4.1.6 Ferner kann man die Aussage A verneinen durch ‘nicht A’ , das man auch ¬A schreibt. Genau dann ist ¬A richtig, wenn A falsch ist. In der sogenannten klassischen Logik, die ich in diesem Buch (wie die allermeisten Mathematiker) benutze, ist ¬(¬A) mit A äquivalent. Dabei geht man davon aus, dass eine – sinnvolle – Aussage auch über unendlich viele Objekte entweder wahr oder falsch ist: Tertium non datur“, ” d.h. ein drittes gibt es nicht“. ” (In der sogenannten intuitionistischen Logik akzeptiert man das nicht unbedingt. Möglicherweise könnte sich ja weder die Wahrheit noch die Falschheit einer Aussage beweisen lassen. Auch in der intuitionistischen Logik folgt ¬(¬A) aus A. Wenn man hingegen ¬(¬A), d.h. dass A nicht falsch ist, voraussetzt, aber nicht davon ausgeht, dass A entweder falsch oder richtig ist, wie wollte man dann erkennen, dass A richtig ist?) (Im Sprachgebrauch wird manchmal die doppelte Verneinung zur Betonung einer Verneinung benutzt. Das ist, wie gesagt ein Sprachgebrauch, der sich als solcher nicht vor der Logik rechtfertigen muss. Das heißt aber nicht, dass manchmal die Verneinung der Verneinung einer – nichtleeren – Aussage dasselbe wie die Verneinung dieser Aussage bedeuten könnte.) Die Aussage ¬(A ∧ B) ist äquivalent zu (¬A) ∨ (¬B). Und ¬(A ∨ B) ist äquivalent zu (¬A) ∧ (¬B). 104 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Bemerkung: Die Aussage (1) ‘A =⇒ B’ bedeutet (in der klassischen Logik) nichts anderes als (2) ‘(¬A) ∨ B’. Denn wenn B richtig ist, so sind beide Aussagen (1) und (2) richtig, unabhängig davon, ob A richtig oder falsch ist. Ist aber B falsch und A richtig, so sind (1) und (2) beide falsch. Ist hingegen B falsch und A falsch, so sind wieder (1) und (2) beide richtig. D.h. aber: In allen Fällen, wo eine der beiden Aussagen (1) oder (2) richtig ist, ist es auch die andere. Und A ⇐⇒ B bedeutet natürlich (A =⇒ B) ∧ (B =⇒ A). 4.1.7 Außer den Junktoren braucht man in der formalisierten Logik noch die sogenannten Quantoren: für alle“ und es gibt“, welch letzteres nichts anderes bedeutet als für minde” ” ” stens ein“. Man braucht dazu Aussagen über eine Variable“, etwa x. Man schreibt A(x), was ” bedeuten soll: A gilt für x. Ein Beispiel ist die Aussage x ∈ R =⇒ 2x = x + x. V Die abkürzenden Bezeichnungen sind: x A(x) in der Bedeutung: für alle x gilt A“ (Allquan” tor). W und: x A(x) in der Bedeutung: für (mindestens) ein x gilt A“ (Existenzquantor). ” V W Mathematiker benutzen häufiger die Abkürzungen ∀ statt und ∃ statt . W Vorsicht: ∀ bedeutet – trotz ähnlichen Aussehens – gerade nicht dasselbe wie ! Zwei Allquantoren darf man miteinander vertauschen; dasselbe gilt für zwei Existenzquantoren. Frage: Darf man einen All- mit einem Existenzquantor vertauschen?. Ja Nein Denke an die Definition der Konvergenz und in welcher Weise man sie nicht ändern darf! In den natürlichen Sprachen werden Allquantoren häufig versteckt. Z.B. gilt folgender Satz: Seien x, y (beliebige) reelle Zahlen. Dann gilt xy = yx.“ Damit ist gemeint: ” ^^ (x ∈ R ∧ y ∈ R) =⇒ xy = yx x y Oder, wenn man sagt für eine reelle Zahl x gilt 2x = x + x“, so meint man meist: für alle ” ” reellen Zahlen x gilt 2x = x + x“. Aus diesem Grunde empfiehlt es sich, den Existenzquantor mit es gibt“ zu verbalisieren. Statt Für eine reelle Zahl x gilt xx = x2“ sollte man sagen es ” ” ” gibt eine reelle Zahl x mit xx = x2“. (Dies ist eine richtige Aussage, nicht wahr??) Beachte: Die Aussage Es gibt ein x, für das A(x) gilt“ schließt nicht aus, dass es mehrere ” solche x gibt. Z.B. ist xx = x2 für x = 1 und für x = 2 richtig. V V Beispiele 4.1.8 a) Die Aussagen x (x ∈ N =⇒ xx = x2 ) und x (x ∈ N =⇒ xx 6= x2 ) sind beide falsch. W W b) Hingegen sind die Aussagen x (x ∈ N ∧ xx = x2 ) und x (x ∈ N ∧ xx 6= x2 ) beide richtig. 4.1. MENGEN 105 c) Für alle Mengen M, N gilt M ⊂ N ⇐⇒ ^ (x ∈ M =⇒ x ∈ N ) x 4.1.9 Seien X, Y Mengen. Unter dem cartesischen Produkt X × Y (genannt nach Descartes, der in latinisierter Form Cartesius genannt wurde) versteht man die Menge aller Paare (x, y) mit x ∈ X, y ∈ Y . Zum Beispiel kann man die euklidische Ebene bekanntlich als Menge aller Paare (x, y) reeller Zahlen auffassen. Also ist“ sie R × R. ” Ebenso kann man das cartesische Produkt von 3 oder mehr Mengen bilden. R × R × R ist die Menge aller Tripel (x1 , x2 , x3 ) reeller Zahlen. Statt R × R schreibt man auch R2 und statt R × R × R. Entsprechend ist R4 usw. und Rn zu verstehen. Die Elemente (x1 , x2 , . . . , xn ) des Rn heißen n-tupel reeller Zahlen. Ebenso gut kann man von n-tupeln ganzer Zahlen, d.h. von Elementen des Zn , usw. Ein n-tupel ist ein formales Nacheinandersetzen (Nacheinanderschreiben) von Elementen. Zwei n-tupel (x1 , . . . , xn ), (y1 , . . . , yn ) sind genau dann einander gleich, wenn x1 = y1 , . . . , xn = yn gilt. Die Tripel (d.h. 3-tupel) (1, 1, 2), (1, 2, 2), (1, 2, 1), (2, 1, 1) sind also alle untereinander verschieden, während die Mengen {1, 1, 2}, {1, 2, 2}, {1, 2, 1}, {2, 1, 1} untereinander gleich sind. Es ist also ein großer Unterschied zwischen dem Begriff einer endlichen Menge {x1 , x2 , . . . , xn } und dem eines n-tupels (x1 , x2 , . . . , xn ) ! Ist K ein beliebiger Körper, so definiert man auf dem K n eine Addition wie folgt: (a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) := (a1 + b1 , a2 + b2 , . . . , an + bn ) (4.1) Alle Axiome der Addition in einem Körper (oder Ring) sind für diese Addition erfüllt. Definiert man noch eine Multiplikation durch (a1 , a2 , . . . , an ) · (b1 , b2 , . . . , bn ) := (a1 b1 , a2 b2 , . . . , an bn ) so wird der K n zu einem Ring, der aber für n > 1 kein Körper ist. (Warum nicht?) Wichtiger ist die Multiplikation eines Elementes von K mit einem solchen von K n : a · (b1 , . . . , bn ) := (ab1 , . . . , abn ) (4.2) für a, b1 , . . . , bn ∈ K. Es ist K n zusammen mit der Addition (4.1) und der Multiplikation (4.2) ein sog. Vektorraum. AUFGABEN 1. Prinzip der Inklusion-Exklusion a) Seien A, B endliche Mengen aus a, bzw. b Elementen. Ferner sei d die Zahl der Elemente von A ∩ B. Wieviele Elemente besitzt A ∪ B? b) Seien A1 , A2 , A3 endliche Mengen aus a1 , a2 , a3 Elementen. Für i 6= j sei aij = #(Ai ∩ Aj ), ferner a123 = #(A1 ∩ A2 ∩ A3 ). Zeige #(A1 ∪ A2 ∪ A3 ) = a1 + a2 + a3 − a12 − a13 − a23 + a123 . 106 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK c) (Dieser Aufgabenteil ist einigermaßen aufwendig. Du solltest keinenfalls seinetwegen die Lektüre des Buches hier abbrechen! Lass ihn lieber weg, und bearbeite ihn später oder überhaupt nicht. Oder ersetze ihn durch Teil b) mit 4 statt T 3 Mengen.) Seien A1 , . . . , An endliche Mengen. Für jedes nichtleere I ⊂ {1, . . . , n} sei aI := # i∈I Ai . Dann gilt X #(A1 ∪ . . . ∪ An ) = (−1)#I+1 aI . ∅6=I⊂{1,...,n} Setzt man a∅ = #(A1 ∪ . . . ∪ An ), so kann man die behauptete Gleichung auch wie folgt schreiben: X (−1)#I aI = 0 . I⊂{1,...,n} 2. Seien A, B Teilmengen von N. Betrachte die beiden Mengen X = A ∩ B, Y = N − (A ∪ B). Zeige durch Beispiele, dass, je nach Wahl von A, B jeder der folgenden 4 Fälle eintreten kann: a),b) X, Y sind beide endlich bzw. beide unendlich; c) X ist endlich, Y unendlich. d) X ist unendlich, Y endlich. 3. Betrachte für ganze n ≥ 1 die Menge V := (Z/2)n = Fn2 . In ihr gibt es ja die Addition (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) Diese ist assoziativ und kommutativ, und ein neutrales Element (bzgl. der Addition) ist (0, . . . , 0). Ferner gilt für jedes a = (a1 , . . . , an ) die Regel a + a = 0 := (0, . . . , 0), da 1 + 1 = 0 in Fs gilt. Zeige, dass für n ≥ 2 die Summe aller Elemente von V gleich (0, . . . , 0) ist. (Die Summe dieser Elemente für n = 1 ist das 1-tupel (1).) 4.2 Abbildungen 4.2.1 Ohne den Begriff ‘Abbildung’ geht in der modernen Mathematik gar nichts. Zu einer Abbildung gehören eine Startmenge (Definitionsbereich) X und eine Zielmenge Y . Eine Abbildung f : X → Y , d.h. von X nach Y besteht nun darin, dass jedem Element x ∈ X genau ein (d.h. ein, aber auch nur ein) Element f (x) ∈ Y zugeordnet wird. Wird durch f auch nur einem einzigen Element x ∈ X kein oder mehr als ein Element aus Y zugeordnet, so ist f keine Abbildung von X nach Y . Damit soll nicht gesagt sein, dass es keinen Sinn hat, auch andere ‘Korrespondenzen’ zu betrachten, wo etwa jeder positiven reellen Zahl ihre beiden Quadratwurzeln ‘zugeordnet werden’. Definition: Die Teilmenge {(x, y) ∈ X × Y | y = f (x)} von X × Y wird der Graph von f genannt und meist mit Γ(f ) bezeichnet. 4.2. ABBILDUNGEN 107 Wenn Du Skrupel hast, obige Erklärung Jedem Element aus X wird genau ein Element aus Y ” zugeordnet“ als richtige Definition anzuerkennen, kannst Du eine Abbildung als ihren Graphen betrachten, d.h. als eine Teilmenge Γ(f ) ⊂ X ×Y definieren, die folgende Eigenschaft besitzt: Zu jedem x ∈ X gibt es genau ein – also mindestens und höchstens ein – y ∈ Y mit (x, y) ∈ Γ(f ). Natürlich hat f (x) = y dieselbe Bedeutung wie (x, y) ∈ Γ(f ). Sind X und Y Teilmengen von R, so ist der Graph jeder Abbildung f : X → Y eine Teilmenge von R2 , die Du, wie gewohnt, manchmal (teilweise) zeichnen kannst. 4 3 2 1 1 2 3 4 Frage: Ist f : R → R, f (x) := 1/x eine Abbildung? Ja. Warum sollte sie keine sein? ordnet. Nein; denn dem Element 0 wird kein Element zuge- Frage: Ist f : R − {0} → R, f (x) := 1/x eine Abbildung? Ja Nein Man kann durch geschickte Wahl der Startmenge (oder auch der Zielmenge) oft eine Abbildung definieren, wo eine solche in strengem Sinn vorher noch nicht bestand. Frage: Ist folgendes eine Abbildung? f : R → R definiert durch f (x) = 1 für x ∈ Q, Ja f (x) = 0 sonst. Nein Diese Abbildung ist zwar nirgendwo stetig, jedoch für den Mathematiker präzise definiert. Aber kann man – für einen beschränkten Teilbereich der Startmenge R – den Graphen dieser Funktion zeichnen? Bedenke, dass ein gezeichneter Punkt, also ein Punkt, den man sehen kann, kein echter Punkt ist, sondern eine positive Ausdehnung hat. (Der Begriff der Stetigkeit wird weiter unten genau definiert. Ich hoffe allerdings, dass Du ein Gefühl dafür hast.) Ferner ist zuzugeben, dass es bei einer gemessenen physikalischen Größe keinen Sinn hat, zu fragen, ob sie rational oder irrational ist. Beachte dazu folgendes: Sogar wenn Du die ersten 10 1010 Dezimalstellen einer reellen Zahl x0 kennst, weißt Du nicht, welchen Wert die genannte 108 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Funktion bei x0 auch nur angenähert hat! Andererseits scheint es auch nicht sinnvoll, sich allein auf die stetigen Funktionen zu beschränken. Auch in der Physik betrachtet man manchmal unstetige Funktionen. Ein weiteres Beispiel ist: g : R → R, g(x) = x2 für x ≥ 0, g(x) = −x2 für x < 0 Diese Abbildung ist stetig, sogar differenzierbar, aber nicht 2-mal differenzierbar, jedenfalls nicht in 0. (Letzteres heißt, dass die Ableitung g 0 von g in 0 nicht differenzierbar ist. Prüfe das nach! Wenn Du erst lernen willst, was eine differenzierbare Funktion und ihre Ableitung ist, so kannst Du das weiter unten im Kapitel 7 dieses Buches tun.) Bezeichnung: Wir benutzen gerne folgende Bezeichnung, um diese Funktion g und ähnliche zu beschreiben: 2 x für x ≥ 0 g : R → R, g(x) = −x2 sonst Bei endlichen Mengen kann man konkret angeben, wohin jedes einzelne Element abgebildet wird, z.B. α : {1, 2, 3} → {1, 2, 3}, 1 7→ 2, 2 7→ 2, 3 7→ 3 β : {1, 2, 3} → {1, 2, 3}, 1 7→ 2, 2 7→ 3, 3 7→ 1 Ich benutze das Zeichen A → B, um von einer Abbildung der Menge A in die Menge B zu reden, hingegen das Zeichen a 7→ b um anzugeben, dass bei dieser Abbildung dem Element a das Element b zugeordnet wird, anders gesagt: das Element a auf das Element b abgebildet wird. Definitionen 4.2.2 Sei f : X → Y eine Abbildung. a) X heißt die Startmenge (kurz: der Start) und Y die Zielmenge (kurz: das Ziel) von f . (In manchen Situationen, insbesondere in diesem Kapitel, ist man sehr streng und unterscheidet zwischen Abbildungen, die nur bis auf die Start- oder die Zielmenge übereinstimmen, z.B. zwischen den Abbildungen f : R → R, x 7→ x2 und g : R → R+ , x 7→ x2 .) b) Die Bildmenge (auch das Bild), von f , die manchmal mit im(f ) (von lateinisch imago), manchmal mit f (X) bezeichnet wird, ist die Menge {fW (x) | x ∈ X} = {y ∈ Y | es existiert ein x ∈ X mit f (x) = y} = {y | x∈X f (x) = y}. Die Bildmenge ist eine Teilmenge der Zielmenge, stimmt aber nicht immer mit dieser überein!. c) f heißt injektiv, wenn verschiedene Elemente von X auch verschiedene Bilder haben, d.h. wenn aus f (x) = f (x0 ) immer x = x0 folgt. (Dass aus x = x0 immer f (x) = f (x0 ) folgt, ist aufgrund des Begriffes einer Abbildung klar, und hat deshalb überhaupt nichts mit ‘injektiv’ zu tun!) d) f heißt surjektiv, wenn jedes Element y ∈ Y das Bild (mindestens) eines x ∈ X ist, d.h. wenn f (X) = Y , also die Bildmenge gleich der Zielmenge ist. 4.2. ABBILDUNGEN 109 e) f heißt bijektiv, wenn f sowohl injektiv wie surjektiv ist. f ) Sind f : X → Y, g : Y → Z Abbildungen, so definiert man ihre Verkettung (auch Hintereinanderausführung) g ◦f : X → Z durch (g ◦f )(x) := g(f (x)). Achtung; Die älteren Bezeichnungen eineindeutig“ anstelle von injektiv“, sowie Abbildung ” ” ” auf“ anstelle von surjektive Abbildung“ werden in diesem Buch nicht verwendet. ” Beispiele 4.2.3 a) Die oben am Ende von 4.1.1 angegebene Abbildung α ist weder injektiv, noch surjektiv; β hingegen ist bijektiv. b) Durch x 7→ x2 können, je nach Wahl von Start und Ziel, Abbildungen mit verschiedenen der o.a. Eigenschaften definiert werden: 1) R → R, weder surjektiv noch injektiv, 2) R → R+ , surjektiv aber nicht injektiv, 3) R+ → R, injektiv aber nicht surjektiv, 4) R+ → R+ , sowohl surjektiv wie injektiv, also bijektiv. c) Die Abbildung Z → N, n 7→ |n| ist surjektiv, aber nicht injektiv. Gibt es auch eine bijektive Abbildung Z → N? Eine Antwort findest Du unten, am Ende von 4.2.4. √ d) Beispiele für Verkettungen kennst Du sicher. Z.B. ist dir Funktion h(x) := 1 + x2 die √ Verkettung der Funktionen f : R → R, f (x) := 1 + x2 und g : R → R, g(y) := y. D.h. für diese Funktionen gilt h = g ◦f . Was meinst Du zu meinen Ausführungen? Diese Begriffshuberei ist doch völlig uninteressant. Ich werde mich in meinem Studium auf die Gebiete beschränken, die ohne solchen formalen Quatsch auskommen. Die obigen Begriffe sind zwar einfach, aber doch geeignet, die Situation zu klären. Du kannst ihnen in keinem Gebiet der modernen Mathematik entgehen. Was meine ich? Ich habe sehr viel Verständnis dafür, wenn Du die erste Antwort angekreuzt hast. Es braucht wirklich viel Erfahrung mit moderner Mathematik, um zu erkennen, dass die zweite Antwort doch die bessere ist. 4.2.4 Sei f : X → Y eine bijektive Abbildung. Dann gibt es zu jedem y ∈ Y genau ein (d.h. ein eindeutig bestimmtes) x ∈ X mit f (x) = y. (Die Existenz dieses x folgt aus der Surjektivität, seine Eindeutigkeit aus der Injektivität von f .) Dieses x wird mit f −1 (y) bezeichnet. Macht man obiges für alle y ∈ Y , so erhält man eine Abbildung f −1 : Y → X. Man nennt f −1 auch die Umkehrabbildung oder Umkehrfunktion von f . Sie ist nur dann definiert, wenn f bijektiv ist. Natürlich ist auch f −1 bijektiv, wenn es überhaupt definiert ist. 110 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Achtung: Die Abbildung x 7→ 1 f (x) hat nichts, aber auch gar nichts mit f −1 , wie wir es definiert haben, zu tun! (Ich kann natürlich nicht dafür garantieren, dass nicht in dem einen oder anderen Buch oder einer Vorlesung die Abbildung x 7→ 1/f (x) doch mit f −1 bezeichnet wird. Da muss Du einfach aufpassen! Jeder Autor hat – leider oder zum Glück? – das Recht auf seine eigenen Definitionen.) Beispiele: a) Ist f : R → R durch f (x) := ax + b mit a, b ∈ R, a 6= 0 definiert, so wird f −1 : R → R gegeben durch f −1 (y) = a−1 y − a−1 b. Die Graphen von f und von f −1 sind Geraden. Hingegen ist 1/f (x) = (ax + b)−1 . Hier ist der Graph eher krumm! √ b) Ist f : R∗+ → R∗+ gegeben durch f (x) = 1/x2 , so wird f −1 durch f −1 (y) = 1/ y gegeben. Hingegen ist 1/f (x) = x2 . c) Die Abbildung f : N → Z, definiert durch n/2 f (n) = −(n + 1)/2 für gerade n für ungerade n ist bijektiv und hat die Umkehrabbildung f −1 : Z → N, definiert durch 2m für m ≥ 0 −1 f (m) = −2m − 1 für m < 0 4.2.5 Ist f : X → Y eine bijektive Abbildung, so gilt f ◦f −1 = idY und f −1 ◦f = idX . Sind umgekehrt f : X → Y und g : Y → X Abbildungen mit g ◦f = idX und f ◦g = idY , so sind f, g bijektiv, und es ist g = f −1 und f = g −1 . Lemma 4.2.6 Seien β α W −→ X −→ Y . Abbildungen. Dann gilt: Wenn α, β injektiv (bzw. surjektiv, bzw. bijektiv sind, so ist auch β ◦α injektiv (bzw. surjektiv, bzw. bijektiv). Lemma 4.2.7 Sei α β γ W −→ X −→ Y −→ Z eine Folge von Abbildungen. Dann gilt γ ◦(β ◦α) = (γ ◦β)◦α. Beweis: Für w ∈ W gilt (γ ◦(β ◦α))(w) = γ((β ◦α)(w)) = γ(β(α(w))) und ((γ ◦β)◦α)(w) = (γ ◦β)(α(w)) = γ(β(α(w))) 4.2. ABBILDUNGEN 111 Mit anderen Worten: Sowohl γ ◦(β ◦α) als auch (γ ◦β)◦α ist die Abbildung, die entsteht, indem man zuerst α, dann β und schließlich γ ausführt. Beachte, dass α◦β in obiger Situation meistens nicht definiert ist. (Sie ist im Falle W = Y definiert, allerdings eine Abbildung X → X, während β ◦α – im Falle W = Y – die Menge W in sich abbildet. Die Frage, ob α◦β = β ◦α ist, kann also nur gestellt werden, wenn W = X = Y ist. Betrachte hierzu die Menge X := {1, 2} und α, β : X → X, definiert durch α(x) := 1, β(x) = 2 für jeweils alle x ∈ X: Bestimme β ◦α und α◦β. Sei Y := {1, 2, 3}. Finde bijektive α, β : Y → Y mit α◦β 6= β ◦α. (Siehe 8.1.7, wenn Du die Aufgabe nicht selber lösen magst.) 4.2.8 Sei f : X → Y eine beliebige Abbildung – die weder injektiv noch surjektiv sein muss. Dann definiert man manchmal für Teilmengen V ⊂ Y die folgende Menge: f −1 (V ) := {x ∈ X | f (x) ∈ V }, die Urbildmenge von V Vorsicht:Trotz gleicher Bezeichnung bedeutet f −1 hier nicht die Umkehrabbildung von f , welche ja nur dann definiert ist, wenn f bijektiv ist. f −1 (V ) ist eine Teilmenge von X. Auch wenn V nur aus einem Element besteht, gilt dies nicht unbedingt für f −1 (V ). Ist V ∩ im(f ) = ∅, so ist f −1 (V ) = ∅, und umgekehrt. Man kann f −1 (V ) im Allgemeinen nicht als f −1 (V ) := {f −1 (y) | y ∈ V } definieren. Das geht nur, wenn f bijektiv ist. Ist U ⊂ X eine Teilmenge, so wird definiert: f (U ) := {f (x) | x ∈ U }. √ √ Beispiele: a) Ist f : R → R definiert durch f (x) = x2 , so ist f −1 ({2}) = {− 2, 2} und f −1 ({−2}) = ∅. b) Für dieselbe Funktion gilt f (R) = f (] − ∞, 0]) = [0, ∞[. Bemerkung: Manchmal schreibt man f −1 (y) := f −1 ({y}). Hier musst Du besonders aufpassen! 4.2.9 Mächtigkeit. Wenn zwei endliche Mengen gleichviele Elemente haben, so gibt es eine bijektive Abbildung zwischen ihnen – und umgekehrt. In diesem Fall nennt man sie gleichmächtig. Wir verallgemeinern dies auf beliebige (endliche oder unendliche) Mengen. Definition 4.2.10 Mengen M, N heißen gleichmächtig, symbolisch M ∼ = N , wenn es eine bijektive Abbildung f : M → N gibt. Ist immer M ∼ = M ? Gilt immer: Aus M ∼ = N folgt N ∼ = M ? Gilt immer: Aus L ∼ = M, M ∼ =N folgt L ∼ = N ? Na klar! 112 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK 4.2.11 Frage: Ist jede unendliche Teilmenge M von N gleichmächtig zu N. d.h. gibt es in diesem Fall eine bijektive Abbildung N → M ? Klar! Ich glaube es schon, möchte aber über einen Beweis doch nachdenken. Betrachte z.B. die Menge P aller Primzahlen. Dann kann man doch eine bijektive Abbildung f : N → P dadurch angeben, dass man die Primzahlen der Reihe nach abzählt, also f (0) = 2, f (1) = 3, f (2) = 5, f (3) = 7, f (4) = 11, f (5) = 13 usw. Noch viel einfacher ist es es, die Menge N1 der natürlichen Zahlen ≥ 1 als gleichmächtig zu N zu erkennenn, nämlich mittels f : N → N1 , f (n) = n + 1. Ferner haben wir oben gesehen, dass N zu Z gleichmächtig ist. Wie mit P kann man es natürlich mit jeder unendlichen Teilmenge von N machen. Nur darf man dabei folgendes bedenken: Für komplizierter definierte Teilmengen X von N mag es – anders als für die Menge P – prinzipiell schwierig sein, jeweils nach einem bereits gefundenen x0 ∈ X das nächstgrößere x ∈ X effektiv nach einem konkreten Rezept zu bestimmen. Jedenfalls gibt es kein allgemeingültiges Verfahren, diese Aufgabe für jede Teilmenge X von N zu lösen. Insofern ist die Aussage, dass jede unendliche Teilmenge von N gleichmächtig zu N ist, eine ziemlich theoretische Aussage. Wohlgemerkt, es mag zwar sehr zeitaufwendig sein, die kleinste Primzahl 10 zu bestimmen, die größer als 1010 ist, aber man weiß prinzipiell, wie man es machen muss. Definition 4.2.12 Eine Menge heißt abzählbar, wenn sie endlich oder zu N gleichmächtig ist. Gemäß der obigen Bemerkung ist jede Teilmenge einer abzählbaren Menge abzählbar. Deshalb ergibt sich die Folgerung 4.2.13 Eine Menge M ist genau dann abzählbar, wenn es eine injektive Abbildung M → N gibt. Diese Aussage könnte man natürlich auch als Definition der Abzählbarkeit nehmen. Definition 4.2.14 Eine Nullfolge natürlicher Zahlen ist eine Folge (ai )i∈N , für die ai ∈ N für alle i ∈ N und ai = 0 für fast alle, d.h. alle i ∈ N bis auf endlich viele Ausnahmen gilt. Z.B. ist die Folge (3, 7, 6, 0, 1, 0, 0, 0, . . .), wo alle Folgenglieder nach dem fünften Glied gleich 0 sind, eine Nullfolge natürlicher Zahlen. Die Folge, deren sämtliche Glieder gleich 1 sind, ist es hingegen nicht. Auch nicht die Folge, in der für jedes n das n!-te Glied 1 ist und alle anderen Glieder Null sind. Eine Folge natürlicher Zahlen, die entsprechend der Grenzwertdefinition in R gegen 0 konvergiert, ist auch im Sinne der eben getroffenen Definition eine Nullfolge natürlicher Zahlen und umgekehrt. (Beweis?) 4.2. ABBILDUNGEN 113 Satz 4.2.15 Es gibt eine bijektive Abbildung der Menge N aller Nullfolgen natürlicher Zahlen nach N1 . Mithin ist N gleichmächtig zu N1 , also zu N. Die Menge N ist abzählbar. Beweis: Dies haben wir bereits in Satz 1.3.5 gesehen. Eine bijektive Abbildung f : N → N1 wird durch f (a1 , a2 , a3 , . . .) := pa11 · pa22 · pa33 · · · wobei p1 , p2 , p3 . . . die Primzahlen in ihrer natürlichen Reihenfolge und das rechtsstehende Produkt als das Produkt der endlich (!) vielen Faktoren, die ungleich 1 sind, definiert ist. (Hier habe ich mit dem Index 1 statt 0 begonnen, da es bei der Folge der Primzahlen üblich ist.) Die Surjektivität ergibt sich aus der Existenz der Primfaktorzerlegung, die Injektivität aus deren Eindeutigkeit. Den obigen Satz wirst Du kaum für spektakulär halten, weil er so abstrakt ist. Aber aus ihm ergibt sich Folgerung 4.2.16 Die Menge Q der rationalen Zahlen ist abzählbar. Beweis: Erinnere Dich, dass es genügt, eine injektive Abbildung Q → N anzugeben. Jede schreiben. Wir definieren rationale Zahl 6= 0 lässt sich eindeutig in gekürzter Form a = ± m n m f : Q → N durch f (a) = (0, m, n, 0, 0, 0, . . .), wenn a = n (in gekürzter Form) ist, und f (a) = (1, m, n, 0, 0, 0, . . .), wenn a = − m ist, und schließlich f (0) = (0, 0, 1, 0, 0, 0, . . .). n Man kann also die rationalen Zahlen nacheinander aufschreiben und erreicht dabei jede, wenn man nur lange genug schreibt. Im nächsten Abschnitt will ich einen etwas anderen Beweis angeben, der möglicher Weise etwas anschaulicher ist. AUFGABEN 1. Seien f g M →N →P Abbildungen. a) Zeige: Ist g ◦f injektiv, so ist f injektiv. b) Zeige: Ist g ◦f surjektiv, so ist g surjektiv. c) Gib ein Beispiel, wo g ◦f bijektiv, aber weder f surjektiv, noch g injektiv ist. Gib auch ein solches Beispiel, wo zusätzlich M = N = P = N ist. 2. Sei f : M → N eine Abbildung. Zeige: a) Ist f surjektiv, so gibt es eine Abbildung g : N → M mit f ◦g = idN . Jedes solche g ist injektiv. Aber es ist g ◦f 6= idM , wenn f nicht auch injektiv ist. Hierzu wird allerdings das sogenannte Auswahlaxiom benutzt (dessen Gültigkeit wir annehmen): Ist {Mi | i ∈ I} eine Menge von nichtleeren Mengen – mit einer sogenannten Indexmenge 114 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK S I – so gibt es eine Abbildung ϕ : I → i∈I Mi mit ϕ(i) ∈ Mi . D.h. man kann ‘mit einem Schlag’ aus allen Mengen Mi je ein Element ϕ(i) auswählen. b) Ist f injektiv und M 6= ∅, so gibt es eine Abbildung g : N → M mit g ◦f = idM . Aber es ist f ◦g 6= idN , wenn f nicht auch surjektiv ist. 3. Definiere analog zu den Nullfolgen natürlicher Zahlen auch Nullfolgen ganzer Zahlen, und zeige, wie man auf naheliegende Weise die Menge der Nullfolgen ganzer Zahlen bijektiv auf die Menge Q∗ der von 0 verschiedenen rationalen Zahlen abbilden kann. 4. Seien M, N endliche Mengen von m, bzw. n Elementen. a) Wieviele Abbildungen von M nach N gibt es? b) Wieviele injektive Abbildungen von M nach N gibt es? c) Wieviele bijektive Abbildungen gibt es. d) Viel schwerer als b) ist die Frage zu beantworten, wieviele surjektive Abbildungen von M nach N es gibt. Aber Du darfst Dich an ihr versuchen. Du kannst dabei das Prinzip der Inklusion-Exklusion benutzen. 4.3 Stetige Funktionen 4.3.1 Funktionen sind nichts anderes als Abbildungen, wobei man den Begriff ‘Funktion’ traditioneller Weise in der Regel für Abbildungen gebraucht, deren Zielmenge ein Körper, meist der Körper der reellen oder derjenige der komplexen Zahlen, ist. Auch wenn die formale Definition einer Funktion als Abbildung gewissermaßen statisch ist, so wird eine solche in der Analysis (d.h. dem Gebiet der Mathematik, dem die Differenzialund Integralrechnungin angehört) in dynamischer Weise betrachtet: Die Variable x variiert, wächst z.B., und damit variiert die von x abhängige Funktion f (x). Von dieser dynamischen Auffassung ausgehend, versteht man am besten, warum man überhaupt die Ableitung einer Funktion betrachtet. Denn diese misst ja, wie stark f (x) im Verhältnis zu x nahe bei einem Punkt variiert. Der Graph einer Funktion f : D → R, wo D ⊂ R ein Definitionsbereich ist, ist ja eine Teilmenge von D×R, nämlich die Menge aller Paare (x, f (x)), wo x die Menge D durchläuft. Da der Graph somit eine Teilmenge der ‘Ebene’ R2 ist, kann man versuchen, ihn zu zeichnen. Eine solche Zeichnung gibt häufig ein gutes Bild einer Funktion, wobei man einschränkend bemerken muss, dass erstens die Dicke des Bleistiftstriches die Präzision dieses Bildes beeinträchtigt, zweitens man immer nur einen beschränkten Teil des Graphen zeichnen kann. Beispiele 4.3.2 a) Wir betrachten folgende Funktion f (x) = x3 − 5x2 + 6x + 1, d.h. die Abbildung f : R → R, definiert durch f (x) = x3 − 5x2 + 6x + 1. Funktionen dieser Art hast Du sicher auf der Schule kennengelernt. Ihr Graph, genauer ein Teil ihres Graphen, sieht so aus: 4.3. STETIGE FUNKTIONEN 115 4 3 2 1 1 2 3 4 b) Eine Funktion mit dem Graphen 1 2 –3 –2 –1 0 1 2 ist Dir vielleicht weniger vertraut. Wir wollen sie ‘zak’ nennen, wobei man sie wie folgt definieren kann: zak(x) ist der Abstand von x zur nächstgelegenen ganzen Zahl (oder zu den nächstgelegenen beiden ganzen Zahlen), also gleich Min{|x − n| n ∈ Z}. (Es kann sein, dass es zwei nächstgelegene ganze Zahlen gibt, z.B. falls x = 1/2 ist. Dann sind aber die beiden Abstände zu diesen ganzen Zahlen gleich.) c) Kaum wirst Du in der Schule jene seltsame Funktion kennengelernt haben, die bei jeder rationalen Zahl den Wert 1 und bei jeder irrationalen Zahl den Wert 0 annimmt. Diese Funktion ist nirgendwo stetig, und ihren Graphem kann man auch nicht wirklich zeichnen. Bemerkung 4.3.3 Es gibt viele interessante Funktionen, die im Gegensatz zu den oben angegebenen Funktionen, nicht für alle x ∈ R definiert sind, z.B. die Funktion f (x) = 1/x oder der Tangens. Die Definitionsbereiche der letztgenannten Funktionen sind Vereinigungen von Intervallen. Wenn wir eine Funktion in der Nähe eines Punktes betrachten, etwa in einem Punkt differenzieren wollen, reicht es, diese Funktion, eingeschränkt auf ein Intervall zu betrachten. 4.3.4 Wir wollen hier stetige Funktionen betrachten. Die beiden Beispiele unter a) und unter b) sind stetig. Beachte dass der Graph einer stetigen Funktion durchaus ‘Ecken’ haben darf. Auch die Funktion f (x) = 1/x ist überall dort stetig, wo sie definiert ist. Allerdings würde jeder Versuch, sie auch in 0 (als Funktion nach R) zu definieren zu einer Unstetigkeit in diesem Punkt führen. Anschaulich wird die Stetigkeit einer Funktion, die auf einem Intervall definiert ist, häufig dadurch beschrieben, dass man ihren Graphen, ohne abzusetzen, zeichnen kann. 116 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Definition 4.3.5 a) Sei I ein Intervall. Eine Funktion f : I → R heißt stetig in dem Punkt a ∈ I, wenn für jede Folge (xn ) in I mit limn→∞ xn = a gilt, dass auch die Folge (f (xn )) der Funktionswerte in den xn gegen f (a) konvergiert. (Hierzu mache ich eine spitzfindige Bemerkung: Es genügt, zu fordern, dass unter o.a. Voraussetzung die Folge (f (xn )) überhaupt konvergiert. Denn die Folge (x0 , a, x1 , a, x2 , a, . . .) konvergiert natürlich auch gegen a. Wenn die Bildfolge (f (x0 ), f (a), f (x1 ), f (a), f (x2 ), f (a), . . .) überhaupt konvergiert, kann aber ihr Limes nur gleich f (a) sein. Dann ist aber auch der Limes der Folge (f (xn )) gleich f (a).) b) f heißt stetig auf ganz I, wenn f stetig in jedem a ∈ I ist. Für f : I → R, a ∈ I gilt: f ist genau dann stetig in a, wenn zu jedem ε > 0 ein δ > 0 existiert, derart dass aus x ∈ I, |x − a| < δ die Aussage |f (x) − f (a)| < ε folgt. 4.3.6 Der so genannte Zwischenwertsatz besagt: Sei f : [a, b] → R eine stetige Funktion, so nimmt f in dem Intervall [a, b] jeden reellen Wert zwischen f (a) und f (b) an. (Damit ist nicht ausgeschlossen, dass möglicherweise auch noch weitere Werte angenommen werden. Betrachte etwa f (x) = x2 zwischen −1 und +2 .) Diesen Satz wollen wir ohne Beweis als richtig ansehen. Damit er gilt, muss man allerdings die reellen Zahlen richtig definieren! Du weißt ja bereits folgendes: Die Funktion f (x) = x2 nimmt auf der Menge der rationalen Zahlen zwar die Werte 1 und 4 an, aber nicht den Wert 2. Definitionen 4.3.7 a) Eine Funktion f : I → R heißt streng monoton wachsend (bzw. fallend), wenn aus x, x0 ∈ I, x < x0 die Beziehung f (x) < f (x0 ) (bzw. f (x) > f (x0 ) folgt. Sie heißt streng monoton, wenn sie streng monoton wachsend oder streng monoton fallend ist. b) Eine Funktion f : I → R heißt (schwach) monoton wachsend (bzw. fallend), wenn aus x, x0 ∈ I, x < x0 die Beziehung f (x) ≤ f (x0 ) (bzw. f (x)gef (x0 ) folgt. Analog zu a) ist definiert, wann f (schwach) monoton ist. Eine streng monotone Funktion ist sicher injektiv. Folgerung 4.3.8 Sei f : [a, b] → R stetig und streng monoton wachsend (bzw. fallend), ferner f (a) = c, f (b) = d, dann ist [c, d] (bzw. [d, c]) gleich dem Bild f ([a, b]). Das heißt, f ist als Abbildung [a, b] → [c, d] (bzw. [a, b] → [d, c]) bijektiv. Beweis: Wir beschränken uns auf den Fall, dass f streng monoton wachsend ist. Der ander Fall wird analog erledigt. Ist a ≤ x ≤ b, so folgt c = f (a) ≤ f (x) ≤ f (b) = d. Somit gilt f ([a, b]) ⊂ [c, d]. Ist nun y ∈ [c, d], so wird der Wert y nach dem Zwischenwertsatz angenommen. Insgesamt siehst Du, dass f [a, b] = [c, d] ist. Da f als streng monotone Funktion zusätzlich injektiv ist, ist f als Abbildung [a, b] → [c, d] bijektiv. 4.4. WURZELN 117 4.3.9 Unter den obigen Voraussetzungen ist auch die Umkehrabbildung f −1 : [c, d] → [a, b] (bzw. f −1 : [d, c] → [a, b]) stetig. Das ist allerdings nicht so unmittelbar zu zeigen. In dieser Hinsicht musst Du aber vorsichtig sein, wenn der Definitionsbereich von f kein Intervall ist. Betrachte z.B. die Abbildung x für x < 1 f : [0, 1[ ∪ [2, 3] → [0, 2], mit f (x) := x − 1 für x ≥ 2 Sie ist bijektiv und streng monoton wachsend. Aber die Umkehrabbildung ist nicht stetig! 4.4 Wurzeln 4.4.1 Betrachte für reelle x ≥ 0 die n-te Potenz xn auf dem Definitionsbereich (der Startmenge) R+ . Sie wächst dort streng monoton von 0 bis ∞. Sei n ≥ 2 ganz. Wir wissen, dass es keine rationale Zahl r mit rn = 2 gibt. Ein Gewinn der Einführung der reellen Zahlen liegt nun darin, dass es sehr wohl eine, √ und auch nur eine, reelle n Zahl r >√0 mit dieser Eigenschaft gibt. Diese bezeichnet man mit 2. (Ist n gerade, so ist auch (− n 2)n = 2.) Allgemeiner gilt: Zu jeder nichtnegativen reellen Zahl y gibt es genau eine √ nichtnegative reelle Zahl x mit xn = y. Dieses x wird mit n y bezeichnet und die n-te Wurzel aus y genannt. (Eine reelle Zahl heißt nicht negativ, wenn sie positiv oder gleich 0 ist.) √ √ 4.4.2 Die Wurzel a ist also eine Lösung der Gleichung x2 =√ a, wenn a ≥ 0 ist. − a ist eine weitere Lösung dieser Gleichung, die nur im Fall a =√0 mit √a übereinstimmt. Noch mehr Lösungen kann es nicht geben. Denn es ist x2 − a = (x − a)(x + a) und jedes Produkt reeller Zahlen ist nur dann 0, wenn einer der Faktoren es ist. Mit Hilfe von Quadratwurzeln kann man auch allgemeine quadratische Gleichungen lösen, wie Du sicher weißt. Ich habe mir sagen lassen, die Gleichung r p p2 x2 + px + q = 0 habe die Lösungen − ± −q 2 4 2 falls p4 − q ≥ 0 ist. (Andernfalls hat sie keine Lösung in R.) Eigentlich kann ich mir nicht vorstellen, dass Du damit zufrieden bist, diese Formel zu kennen, ohne zu wissen, wie man sie beweist. Versuche Dich zu erinnern, denke an die quadratische Ergänzung. AUFGABEN 1. Zeige: a) Seien a, b positive reelle Zahlen. Dann ist √ ab < a+b . 2 √ ab ≤ a+b . 2 Wenn a 6= b ist, gilt sogar b) Für jedes a in einem angeordneten Körper gilt a2 ≥ 0. In R ist demgemäß a ≥ 0 genau dann, wenn es ein b ∈ R mit b2 = a gibt. 118 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK c) In Q gilt die zweite Ausage von b) nicht. PnHier2 gilt nur die schwächere Aussage: a ≥ 0 ⇐⇒ es gibt ein n ∈ N und a1 , . . . , an ∈ Q mit k=1 ak = b. (Beachte dazu: Jede rationale Zahl lässt sich als Bruch schreiben, dessen Nenner eine (ganze) Quadratzahl ist.) Bemerkung: Nicht so einfach ist folgender Satz von [Euler, Lagrange] zu beweisen: Jede nichtnegative rationale Zahl ist die Summe von 4 Quadraten rationaler Zahlen (und umgekehrt). Euler hat diesen Satz bewiesen. Später hat Lagrange sogar gezeigt, dass jede natürliche Zahl eine Summe vierer ganzer Quadratzahlen ist. Überlege, dass Eulers Satz aus dem von Lagrange folgt. 2an bn 2. In R gelte 0 < a < b. Definiere Folgen (an ), (bn ) durch a0 = a, b0 = b und an+1 = , bn+1 = a+b √ an + b n . Zeige limn→∞ an = limn→∞ bn = ab. 2 Solltest Du nicht darauf vertrauen, dass es Quadratwurzeln aus positiven reellen Zahlen wirklich gibt, darfst Du deren Existenz mit Hilfe dieser Aufgabe beweisen! 3. Hinweis, wie man manche Aufgaben nicht angehen sollte: a) Betrachte die Frage: Was ist der größte Primfaktor der Zahl 86400? Kannst Du diese Frage schneller beantworten, wenn Du weißt, dass diese Zahl die Anzahl der Sekunden eines Tages ist? Wenn man den größten Primfaktor oder auch die Primfaktorzerlegung von 60 · 60 · 24 = 86400 finden will, so ist es einfacher von der Zerlegung 60 · 60 · 24 auszugehen, als erst das Produkt 86400 auszurechnen und dieses dann zu zerlegen! Das ist doch klar! b) Welche reellen Nullstellen hat das Polynom x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5)? x8 − 25x6 − (42x3 − 216)(x − 5)(x + 5) = x6 (x2 − 25) − (42x3 − 216)(x − 5)(x + 5) = x6 (x − 5)(x + 5) − (42x3 − 216)(x − 5)(x + 5) = (x6 − 42x3 + 216)(x − 5)(x + 5). Die Nullstellen des Polynoms sind also 5, − 5, sowie die des Polynoms x6 − 42x3 + 216. Die Nullstellen des letzteren sind die x ∈ R, für die y = x3 eine Nullstelle des quadratischen Polynoms y 2 − 42y + 216 ist. Dessen Nullstellen errechnen sich nach der bekannten Formel zu √ 225 also 21 ± √ √ 36 und 6. Sämtliche reellen Nullstellen des ursprünglichen Polynoms sind somit 5, −5, 3 36, 3 6. Wenn eine (natürliche) Zahl oder eine Funktion als Produkt gegeben ist, ist es dann immer zielführend, dieses Produkt zunächst (reflexartig) ‘auszurechnen’, um erst dann gewisse Aufgaben anzugehen? √ 4. Zeige dass die Menge {a + b 2 | a, b ∈ Q} ein Teilkörper von R ist. Damit ist gemeint, dass sie in Bezug auf die in R gegebenen Rechenarten ein Körper ist. Du musst also zeigen, dass 0 und 1 in ihr liegen, dass mit zweien ihrer Elemente auch ihre Summe und ihr Produkt zu ihr gehören. Schließlich müssen noch zu jedem ihrer Elemente 6= 0 das additiv und das multiplikativ Inverse zu ihr gehören. (Nur für das multiplikativ Inverse ist eine kleine Idee nötig.) Die Körpergesetze (etwa das Distributivgesetz) werden von R ‘geerbt’. 4.5. CAUCHY- UND CANTOR-DIAGONALEN 4.5 119 Cauchy- und Cantor-Diagonalen 4.5.1 Unter der Menge N × N versteht man ja die Menge aller Paare (n, m) natürlicher Zahlen. Während man sich N als fortlaufende Folge vorstellen kann: 0 1 2 3 4 5 ... kann man sich die Gesamtheit der Paare natürlicher Zahlen als Schema vorstellen: (0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) .. .. .. .. .. .. . . . . . . unendliches ‘quadratisches’ ··· ··· ··· ··· ··· ··· .. . Frage: Kann man die Elemente von N × N auch in einer Folge darstellen? Kann man sie nacheinander ‘hinschreiben’, und zwar so, dass jedes Paar auch ‘irgendwann mal drankommt’ ? In der Sprache der Abbildungen würde dies bedeuten: Gibt es eine bijektive Abbildung N → N × N? Im Prinzip haben wir das bereits positiv beantwortet. Hier gebe ich eine andere Möglichkeit an, die im folgenden Bild angedeutet sei (0, 0) (0, 1) % (1, 0) (0, 2) % (1, 1) % (2, 0) (3, 0) % (3, 1) % % (3, 3) % (3, 4) % (4, 3) % % (2, 4) % % (4, 2) % % (1, 4) (2, 3) (3, 2) (4, 1) % % % % (0, 4) (1, 3) (2, 2) % % (4, 0) % (1, 2) (2, 1) % (0, 3) % (4, 4) % % (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) .. .. .. .. .. . % . % . % . % . % (0, 5) · · · % (1, 5) · · · % (2, 5) · · · % (3, 5) · · · % (4, 5) · · · % (5, 5) · · · ... Die Pfeile deuten an, wie man nacheinander die Paare zu durchlaufen hat. Man beginnt mit (0, 0), dann durchläuft man die erste sogenannte Cauchy-Diagonale: (1, 0), (0, 1), dann die zweite Cauchy-Diagonale: (2, 0), (1, 1), (0, 2), dann die dritte CauchyDiagonale (3, 0), (2, 1), (1, 2), (03), dann die vierte: (4, 0), (3, 1), (2, 2), (1, 3), (0, 4), und so fort. Auf diese Weise erkennst Du, dass die Menge aller Paare natürlicher Zahlen abzählbar ist. In der n-ten Cauchy-Diagonale stehen die n + 1 Paare natürlicher Zahlen (i, j) mit i + j = n. Vergleiche das mit den Exponentenpaaren in der Formel, die gemäß dem Binomialsatz aus (a + b)n berechnet wird. 120 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK 4.5.2 Der Name ‘Cauchy-Diagonale’ rührt daher, dass Cauchy sie benutzt hat, um das sogenannte Cauchy-Produkt von unendlichen Reihen zu definieren. P P∞ Gegeben seien zwei unendliche Reihen ∞ n=0 an und n=0 bn . Sämtliche Produkte von je einem Glied der ersten Reihe mit je einem Glied der zweiten kann man in ein unendliches ‘quadratisches’ Schema schreiben. a0 b0 a1 b 0 a2 b 0 a3 b 0 a4 b 0 a5 b 0 .. . a0 b 1 a1 b 1 a2 b 1 a3 b 1 a4 b 1 a5 b 1 .. . a0 b 2 a1 b 2 a2 b 2 a3 b 2 a4 b 2 a5 b 2 .. . a0 b 3 a1 b3 a2 b 3 a3 b 3 a4 b 3 a5 b 3 .. . a0 b 4 a1 b 4 a2 b 4 a3 b 4 a4 b 4 a5 b 4 .. . a0 b 5 · · · a1 b 5 · · · a2 b 5 · · · a3 b 5 · · · a4 b 5 · · · a5 b 5 · · · .. .. . . Irgendwie sollte eine geeignete Summierung über alle Einträge dieses Schemas gegen das Produkt der Werte der beiden Ausgangsreihen konvergieren. Das Cauchy-Produkt der beiden Reihen ist definiert, als ∞ X n X ( ak bn−k ) n=0 k=0 D.h. es ist eine unendliche Reihe, deren Glieder Pndie Summen über die Cauchy-Diagonalen obigen Diagramms sind. Beachte, dass die Summe k=0 ak bn−k für jedes n eine endliche ist, nämlich die Summe über die n-te Cauchy-Diagonale, in der n + 1 Einträge stehen. Wenn die beiden Ausgangsreihen konvergieren, und zwar gegen a, bzw. b, so hofft man doch, ihr Cauchy-Produkt solle gegen ab konvergieren. Ganz allgemein, d.h. für konvergente, aber P∞ a oder nicht absolut konvergente Reihen gilt das leider nicht ! Falls aber eine der Reihen n=0 n P∞ b absolut konvergiert, gilt diese Aussage. Leider ist der Beweis dieser Tatsache nicht so n=0 n einfach, weshalb ich hier darauf verzichte. Bemerkung 4.5.3 Gibt es eine Reihenfolge, in der man die ai bj summieren kann, so dass immer der Grenzwert ab herauskommt? P Pn Erinnere dich an den Satz 3.2.27. Da der (Grenz-)Wert der Reihe ∞ i=0 ai als limn→∞ i=0 ai definiert ist, erhält man aus dem genannten Satz die Formel n n X X ab = lim ( ai )( bj ) n→∞ i=0 j=0 P P Das Produkt ( ni=0 ai )( nj=0 bj ) ist aber die Summe über alle Einträge folgenden endlichen 4.5. CAUCHY- UND CANTOR-DIAGONALEN 121 quadratischen Schemas: a0 b 0 a1 b 0 a2 b 0 a3 b 0 a4 b 0 a5 b 0 .. . a0 b 1 a1 b 1 a2 b 1 a3 b 1 a4 b 1 a5 b 1 .. . a0 b 2 a1 b 2 a2 b 2 a3 b 2 a4 b 2 a5 b 2 .. . a0 b 3 a1 b 3 a2 b 3 a3 b 3 a4 b 3 a5 b 3 .. . a0 b 4 a1 b 4 a2 b 4 a3 b 4 a4 b 4 a5 b 4 .. . a0 b 5 a1 b 5 a2 b 5 a3 b 5 a4 b 5 a5 b 5 .. . ··· ··· ··· ··· ··· ··· .. . a0 b n a1 b n a2 b n a3 b n a4 b n a5 b n .. . an b 0 an b 1 an b 2 an b 3 an b 4 an b 5 · · · an b n Beim Schritt von n auf n + 1, kommen immer die 2n + 3 Summanden entlang eines ‘Hakens’ der Form a0 bn+1 a1 bn+1 a2 bn+1 a3 bn+1 a4 bn+1 a5 bn+1 .. . an+1 b0 an+1 b1 an+1 b2 an+1 b3 an+1 b4 an+1 b5 · · · an+1 bn+1 hinzu. Wenn man entlang der angegebenen Haken und nicht entlang der Cauchy-Diagonalen addiert, erhält man immer das richtige Ergebnis. Wir haben also folgende Verfahren, die Einzelprodukte zu summieren: 1. Entlang der Cauchy-Diagonalen: Das ist elegant, führt aber nicht immer zum richtigen Ergebnis. 2. Entlang der oben beschriebenen Haken: Das führt zwar immer zum richtigen Ergebnis, ist aber holprig. Im Falle, dass die Ausgangsreihen absolut konvergieren, wirst Du wohl das elegantere CauchyProdukt bilden. (Übrigens kann man N × N natürlich auch entlang der ‘Haken’ anstelle der Cauchy-Diagonalen abzählen!) Beispiel 4.5.4 Seien x, y reelle Zahlen. Die unendlichen Reihen exp(x) := ∞ X xn k=0 n! , exp(y) := ∞ X yn k=0 n! konvergieren absolut für alle reellen x, y. Mit Hilfe des binomischen Lehrsatzes kannst Du zeigen, dass das Cauchy-Produkt der Reihen exp(x), exp(y) mit der Reihe ∞ X (x + y)n k=0 n! 122 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK übereinstimmt. (Führe das aus!) Mit anderen Worten: Es gilt das Additionstheorem exp(x + y) = exp(x) exp(y) Beachte, dass ich zwei große Lücken gelassen haben: Die absolute Konvergenz der Exponentialreihe und der oben angegebene Satz über die ’richtige’ Konvergenz des Cauchy-Produktes absolut konvergenter Reihen wären noch zu zeigen! Im nächsten Kapitel werde ich das Additionstheorem beweisen. 4.5.5 Die nichtnegativen rationalen Zahlen sind ja formal gesehen nichts anderes als Paare natürlicher Zahlen, wobei man viele Paare weglassen kann: Der Nenner darf ja nicht 0 sein, und es genügt die gekürzten Brüche zu betrachten. Wir bekommen das folgende unendliche quadratische Schema: 0 1 2 3 ··· 1 3 5 7 ··· 2 2 2 2 1 2 4 5 ··· 3 3 3 3 1 3 5 7 ··· 4 4 4 4 .. .. .. .. . . . . . . . In der n-ten Zeile stehen die gekürzten Brüche mit dem Nenner n, aufsteigender Größe nach geordnet. Indem man dieses Schema entlang der Cauchy-Diagonalen abzählt, bekommt man eine bijektive Abbildung N → Q+ . Indem Du nach jeder Zeile des obigen Schemas noch eine neue Zeile hinzufügst, in der die Glieder mit einem Minus-Zeichen versehen sind, kannst Du einsehen, dass auch ganz Q abzählbar ist. Wir halten fest: Satz 4.5.6 Die Menge Q der rationalen Zahlen ist abzählbar. Indem Du schließlich noch bemerkst, dass es gar nichts ausmacht, ob in einem Schema, ähnlich dem, womit wir unseren Abschnitt begonnen haben, etliche Zeilen oder Spalten nach endlich vielen Einträgen aufhören, kannst Du die Gültigkeit des folgenden Satzes einsehen. Satz 4.5.7 Die Vereinigung abzählbar vieler abzählbarer Mengen ist abzählbar. (Dies schließt natürlich endliche Vereinigungen abzählbarer Mengen, sowie abzählbare Vereinigungen endlicher Mengen ein.) Folgende Sätze sind unmittelbare Folgerungen: Satz 4.5.8 Sind M1 , M2 abzählbare Mengen, so ist auch M1 × M2 eine solche. Satz 4.5.9 Sind M1 , M2 , . . . , Mn endlich viele abzählbare Mengen, so ist auch M1 × M2 × · · · × Mn eine solche. 4.5. CAUCHY- UND CANTOR-DIAGONALEN 123 Vielleicht überrascht es Dich jetzt der folgende Satz 4.5.10 Die Menge R der reellen Zahlen ist überabzählbar, d.h. nicht abzählbar. Beweis: Wäre sie abzählbar, so wäre es auch ihre Teilmenge [0, 1[ der x mit 0 ≤ x < 1. Wir nehmen an, es gäbe eine solche Abzählung f : N1 → [0, 1[. Denke Dir die x ∈ [0, 1[ als Dezimalbrüche ‘abgezählt untereinander geschrieben’. Dann erhältst Du folgendes Schema: f (1) = 0, a11 a12 a13 a14 . . . f (2) = 0, a21 a22 a23 a24 . . . f (3) = 0, a31 a32 a33 a34 . . . f (4) = 0, a41 a42 a43 a44 . . . ············ Hier sind die Indizes Doppelindizes: also a23 bedeutet a2,3 , gesprochen ‘a zwei drei’ und nicht ‘a dreiundzwanzig’. (Es ist allgemein üblich, hier das Komma wegzulassen, wenn es nicht zu Zweideutigkeiten führt.) In der n-ten Zeile steht die n-te Zahl als Dezimalzahl. D.h. die aij sind Dezimalziffern, und zwar ist aij die j-te Nachkommastelle der i-ten Zahl. 9er-Perioden seien verboten, damit jede reelle Zahl aus [0, 1[ nur einmal vorkommt. Nun sehen wir uns die Diagonale“ a11 , a22 , a33 , . . . in diesem Schema an und bilden den Dezi” malbruch c = 0,b1 b2 b3 b4 . . . nach folgender Vorschrift: es sei bi = 5, wenn aii 6= 5 ist, aber bi = 6, wenn aii = 5 ist. Dann gilt c ∈ [0, 1[, aber c ist verschieden von allen Zahlen des Schemas. Denn c unterscheidet sich in der i-ten Nachkommastelle von f (i), ist aber eindeutig als Dezimalbruch darstellbar, da die Ziffer 0 sowenig vorkommt wie die Ziffer 9. Eine Abzählung der o.a. reellen Zahlen kann es also nicht geben. Das hier verwendete Verfahren heißt Cantorsches Diagonalverfahren, da Cantor es erfunden hat, um die Überabzählbarkeit von R zu zeigen. Ich will nicht verschweigen, dass es von philosophischer Seite gewisse Vorbehalte gegen unseren unkritischen Umgang mit der Menge ‘aller’ reeller Zahlen gibt. Mit einem endlichen Alphabet √ kann man nur abzählbar viele reelle Zahlen beschreiben. (Z.B. kann man 5 alsP‘diejenige positive reelle Zahl, deren Quadrat 5 ist’ beschreiben. Die Zahl e lässt sich als ‘ ∞ n=0 1/n!’ beschreiben.) Wenn ich also nach Cantor zu allen abzählbar vielen ‘beschreibbaren’ reellen Zahlen eine neue konstruiere, so muss ich mir bewusst sein, dies auf einer ‘höheren’ Sprachstufe zu tun, einer Stufe, auf der ich zur Konstruktion die Menge der bisher bereits bekannten reellen Zahlen benutze. Sonst hätte ich ja einen Widerspruch: ‘Zu allen beschreibbaren reellen Zahlen gibt es noch eine weitere beschreibbare reelle Zahl.’ Im Prinzip retten sich die Mathematiker hier in eine axiomatische Mengenlehre, deren Axiome möglicherweise etwas willkürlich sind. Die meisten Mathematiker nehmen diese Problematik kaum zur Kenntnis. So darfst Du es getrost auch halten. Ehrlich! Mit dem Cantorschen Diagonalverfahren kannst Du folgende beide Sätze beweisen: 124 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Satz 4.5.11 Seien M1 , M2 , M3 , . . . unendlich viele Mengen, deren jede mindestens 2 Elemente besitzt, so ist das unendliche Produkt M1 × M2 × M3 × · · ·, das aus allen Folgen (mi )i∈N mit mi ∈ Mi besteht, überabzählbar. Definition 4.5.12 Eine 0-1-Folge ist eine Folge (an )n∈N , wo jedes Folgenglied 0 oder 1 ist. Dabei will ich meist unter 0 und 1 die bekannten ganzen Zahlen verstehen, gelegentlich aber auch die Restklassen von 0 bzw. 1 in F2 = Z/(2). Satz 4.5.13 Die Menge aller 0-1-Folgen ist überabzählbar. Wir können aus unseren Betrachtungen noch einen weiteren Schluss ziehen, nämlich den, dass es viele (genauer: überabzählbar viele) sogenannte transzendente reelle Zahlen gibt. Definition 4.5.14 Eine reelle (auch komplexe) Zahl heißt algebraisch, wenn sie eine Nullstelle eines vom Nullpolynom verschiedenen Polynoms mit rationalen Koeffizienten ist. (Da die Nullstellen eines Polynoms dieselben bleiben, wenn man dieses Polynom mit einer von 0 verschiedenen Konstanten multipliziert, genügt es, entweder Polynome mit ganzen Koeffizienten zu betrachten, oder solche, deren höchster Koeffizient gleich 1 ist.) Eine reelle (oder komplexe) Zahl heißt transzendent, wenn sie nicht algebraisch ist. Satz 4.5.15 Es gibt nur abzählbar viele algebraische und überabzählbar viele transzendente reelle (komplexe) Zahlen. Beweis: Es genügt zu zeigen, dass die Menge der (reellen) algebraischen Zahlen abzählbar ist. Wäre dann nämlich auch die Menge der reellen transzendenten Zahlen abzählbar, so wäre R die Vereinigung zweier abzählbarer Mengen, also selbst abzählbar. Zeige selber, dass es zu jedem möglichen Grad n nur abzählbar viele Polynome vom Grad n gibt, deren Koeffizienten rational sind. (Man kann ja jedem Element aus Qn+1 in bijektiver Weise ein solches Polynom zuordnen.) Folgere: Es gibt nur abzählbar viele Polynome mit rationalen (ganzen) Koeffizienten. Mit Hilfe der Tatsache, dass (abgesehen vom Nullpolynom) jedes Polynom in R (auch in C) nur endlich viele Nullstellen hat, folgere, dass es (in R, bzw. C) insgesamt nur abzählbar viele Nullstellen von beliebigen Polynomen mit rationalen Koeffizienten gibt. Bemerkung 4.5.16 Die Aussage ist insofern sehr theoretisch, als es äußerst mühsam und wenig erhellend ist, mit ihrer Hilfe ein konkretes Beispiel einer transzendenten Zahl anzugeben. (Man müsste eine konkrete Abzählung der algebraischen Zahlen angeben und für jedes n die n-te Nachkommastelle der n-ten Zahl bestimmen. Das Cantorsche Diagonalverfahren liefert dann eine transzendente Zahl als unendlichen Dezimalbruch. Beachte, dass dies im Prinzip möglich ist!) Wir wissen heute, dass z.B. e und π transzendent sind. Beweise hierfür sind alles andere als einfach. Cantor kannte man nur die sogenannten Liouvilleschen Transzendenten, P∞Vor−n! z.B. n=1 2 . Auf diese will ich an dieser Stelle eingehen, obwohl sie mit Mengentheorie nicht viel zu tun haben. Ich beginne mit einem Hilfssatz: 4.5. CAUCHY- UND CANTOR-DIAGONALEN 125 Lemma 4.5.17 Sei g : R → R ein Polynom. Ist I ⊂ R ein Intervall endlicher Länge, so ist die Menge g(I) beschränkt. D.h. es gibt ein s ∈ R mit |g(x)| ≤ s für alle x ∈ I. Allgemeiner gilt dies, falls g auf R lediglich stetig ist. Das wirst Du auf der Uni lernen. Beweis: Die Behauptung gilt offenbar für jede konstante Funktion und für die Funktion der Form f (x) = x. Gilt sie für Funktionen f1 , f2 , so gilt sie auch für die Funktionen f1 f2 und f1 + f2 . Denn aus |fi (x)| ≤ si für x ∈ I folgt |f1 (x)f2 (x)| = |f1 (x)| · |f2 (x) ≤ s1 s2 , sowie |f1 (x) + f2 (x)| ≤ |f1 (x)| + |f2 (x)| ≤ s1 + s2 für alle x ∈ I. Jedes Polynom lässt sich durch Summen und Produkte von konstanten Funktionen und der Funktion f (x) = x aufbauen. Satz 4.5.18 Sei α eine reelle Nullstelle eines Polynoms vom Grade n > 0 mit rationalen Koeffizienten. Dann gibt es ein reelles c > 0, so dass für jede von α verschiedene rationale Zahl p mit p, q ∈ Z, q > 0 folgende Ungleichung gilt: q α − p ≥ c . q qn (Hier sind p, q keine Bezeichnungen speziell für Primzahlen, sondern für beliebige ganze Zahlen.) Der Satz besagt in etwa folgendes: Will man eine algebraische Zahl durch rationale Zahlen approximieren, so wird die Güte der Approximation mit wachsendem Nenner nur in ‘bescheidenem Maße’ besser. Er gilt auch für Polynome vom Grad 1 und besagt dann, dass man eine rationale Zahl α durch von α verschiedene rationale Zahlen gar nicht so gut approximieren kann. Beweis: Sei α Nullstelle von f (x) = an xn + · · · + a0 mit ak ∈ Z. (Dies kann man annehmen, nachdem man mit dem Hauptnenner der Koeffizienten multipliziert hat.) Wir wissen aus (2.5.2), dass man f (x) = (x − α)g(x) schreiben kann, wo g(x) ein Polynom mit reellen Koeffizienten ist. Wähle c1 > 0 so, dass in dem Intervall I = [α − c1 , α + c1 ] keine von α verschiedene Nullstelle von f (x) liegt. Dies ist möglich, da f (x) = 0 nur für endlich viele x gilt. (2.5.4) Nach obigem Lemma gibt es ein c2 > 0 mit der Eigenschaft: ‘Es ist |g(x)| < c2 , wenn immer |x − α| ≤ c1 ist.’ 1 p c p Setze c := Min{c1 , } und nimm an, es wäre α − < n (mit p, q ∈ Z, q > 0 und 6= α.) c2 q q q p Zunächst folgt aus dieser Annahme − α < c ≤ c1 und deshalb – nach Wahl von c2 – q p g ≤ c2 . Aus c ≤ 1/c2 ergibt sich q f p = p − α · g p < c · c2 ≤ 1 . q q q qn qn 126 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK p < 1. Da f (x) ganze Koeffizienten hat, ist die linke Seite dieser UngleiSomit gilt q · f q p p chung eine natürliche Zahl. Deshalb ist f = 0. Das ist ein Widerspruch zu 6= α und q q p ∈ I, einem Intervall, in dem außer α keine Nullstelle von f liegt. q n P∞ Folgerung 4.5.19 Die Zahl α := k=0 2−k! ist transzendent. Es ist klar, dass die Reihe konvergiert. Dies ist das angekündigte Beispiel einer Liouvilleschen Transzendenten. P −k! Beweis: Die Partialsumme sm := m ist gleich einem Bruch mit dem Nenner 2m! , k=0 2 pm etwa gleich m! mit einer natürlichen Zahl pm . (2m! ist der Hauptnenner.) 2 Die (positive) Differenz α − sm ist nur sehr wenig größer als 2−(m+1)! . Genauer gilt α − sm = α − m X −k! 2 = k=0 ∞ X k! −(m+1)! 2 <2 k=m+1 ∞ X 2j = j=0 2 2−(m+1)! . Nimm an, α wäre Nullstelle eines Polynoms vom Grade n mit rationalen Koeffizienten. Nach obigem Satz gäbe es ein c > 0 mit α− pm c ≥ für alle m ∈ N. 2m! 2n·m! Andererseits haben wir 2 2(m+1)! >α− pm 2 c , folglich (m+1)! > n·m! m! 2 2 2 Es folgte (2m! )m+1 2 < m! n (2 ) c Die linke Seite geht mit m (bei konstanten n, c) gegen unendlich. Widerspruch! P∞ −n! Der Beweis funktioniert für jede Reihe n=0 a mit einer ganzen Zahl a ≥ 2, insbesondere für a = 10, wo man sich die Dezimalbruchdarstellung gut vorstellen kann. AUFGABEN 1. a) Betrachte die Menge A derjenigen 0-1-Folgen, welche die Eigenschaft haben, dass nie eine Null auf eine Null folgt. Ist A abzählbar oder überabzählbar? b) Betrachte die Menge B aller 0-1-Folgen mit der Eigenschaft, dass nie eine Eins auf eine Null folgt. Ist B abzählbar oder überabzählbar? 4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 127 2. Zeige, dasss es eine (naheliegende) bijektive Abbildung von der Menge E aller 0-1-Folgen zur Potenzmenge von N, (d.h. der Menge aller Teilmengen von N) gibt. Folgere, dass die Potenzmenge von N überabzählbar ist. 3. Zeige, dass die Menge aller endlichen Teilmengen von N abzählbar ist. 4. Zeige, dass die Menge aller Null-Eins-Folgen, die von einer gewissen Stelle an periodisch sind, abzählbar ist. (Was meine ich wohl mit der Aussage ‘von einer gewissen Stelle an periodisch’ ?) 5. Wie hängen die beiden letzten Aufgaben zusammen? Genügt es, eine von ihnen zu lösen, damit die Lösung der anderen auf der Hand liegt? 6. Es gibt eine Abbildung E → [0, 1], die jeder Folge aus E den entsprechenden Binärbruch zuordnet, z.B. (0, 1, 1, 0, 1, 1, 1, 0, 0, . . .) 7→ 0, 011011100 . . .. Links trennen die Kommata die einzelnen Folgenglieder, rechts trennt das Komma den ganzen Anteil der binär geschriebenen Zahl von dem gebrochenen Anteil. Ist diese Abbildung injektiv, surjektiv? 7. Wir betrachten Ternärbrüche (d.h. solche, wo die Grundzahl die 3 ist) der Form 0, a1 a2 a3 . . ., wo die ai nur die Ziffern 0 oder 2 sind. Lassen sich 0, 31 , 23 , 1 durch einen solchen (unendlichen) Ternärbruch darstellen? Wie steht es mit Zahlen aus ] 31 , 23 [? Und wie mit solchen aus ] 19 , 29 [, bzw. solchen aus ] 97 , 89 [? Kannst Du das fortsetzen? Die Menge C der reellen Zahlen, die man als Ternärbrüche der genannten Art schreiben kann, heißt das Cantorsche Diskontinuum. Beachte, dass die Darstellung der Zahlen aus dem Cantorschen Diskontinuum als Ternärbrüche der genannten Art eindeutig ist! Gib eine bijktive Abbildung C → E an. Welche Art Abbildung (injektiv, surjektiv) C → [0, 1] erhält man daraus? 8. Zeige für das Cantorsche Diskontinuum C: Es gibt eine leicht zu beschreibende bijektive Abbildung C × C → C. Aus jedem Paar von Folgen kann man auf kanonische Weise eine einzige Folge machen. 9. Gib eine naheliegende surjektive Abbildung C → [0, 1] an. 4.6 Ein allgemeiner Satz über die Vergleichbarkeit von Mengen Es mag sein, dass Dir die folgenden Ausführungen nicht besonders gefallen, zu abstrakt oder zu schwer vorkommen. Du kannst sie ohne Schaden übergehen. Vielleicht hast Du ja später mehr Spaß an ihnen. 128 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Bemerkung 4.6.1 Seien M, N Mengen. Dann gibt es eine zu M gleichmächtige Menge M 0 und eine zu N gleichmächtige Menge N 0 , derart das M 0 ∩ N 0 = ∅ ist. Man kann nämlich jedes Element m ∈ M durch das Paar (m, 0) ersetzen, also M 0 := {(m, 0) | m ∈ M } und entsprechend N 0 := {(n, 1) | n ∈ N } definieren. Beachte, dass keiner garantieren kann, dass bereits M 0 ∩ N = ∅ ist. Hingegen sind (m, 0) und (n, 1) auf jeden Fall verschiedene Paare, ganz egal wie m und n aussehen. 4.6.2 Unendliche Mengen M haben die Eigenschaft, dass es Abbildungen f : M → M gibt, die zwar injektiv, aber nicht surjektiv sind. Dies kann man – so man will – als Definition für die Unendlichkeit einer Menge nehmen. (Schon Galilei hatte bemerkt, dass die Abbildung N → N, x 7→ x2 von dieser Art ist.) Sei ferner eine bijektive Abbildung g : N → M gegeben, so ist die Abbildung f ◦g : N → M nur injektiv, aber nicht surjektiv. Analog gibt es in diesem Fall auch eine injektive, nicht surjektive Abbildung M → N , nämlich welche? Wenn es also eine injektive, nicht surjektive Abbildung unendlicher Mengen ϕ : M → N gibt, darfst Du dies nicht in dem Sinne interpretieren, als hätte M echt weniger Elemente als N . Es gilt vielmehr folgender Satz 4.6.3 (Cantor, Bernstein) Gibt es injektive Abbildungen g : M → N und h : N → M , so gibt es auch eine bijektive Abbildung f :M →N . Beweis: Wir dürfen nach Bemerkung 4.6.1 annehmen, M ∩ N = ∅. Ist m ∈ M , so gibt es genau ein n ∈ N mit g(m) = n und höchstens ein n0 ∈ N mit h(n0 ) = m, letzteres, da h injektiv ist. Das Analoge gilt für alle n ∈ N . Wir betrachten ‘Stammlinien‘, d.h. ‘maximale Ketten’ · · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ n1 7→ · · · wobei die Abbildungen abwechselnd g, bzw. h sind. Die Eigenschaft ‘maximal’ soll bedeutet, dass wir die Kette nur abbrechen, falls es nicht anders geht. Nach rechts bricht eine solche Stammlinie nie ab, da jedes m ∈ M ein Bild unter g und jedes n ∈ N ein Bild unter h hat. Auch nach links kann eine solche Stammlinie unendlich lang sein, sie kann aber auch mit einem Element m ∈ M anfangen, wenn nämlich dieses m nicht im Bild von h liegt, oder sie kann mit einem n ∈ N anfangen, wenn dieses n nicht im Bild von g liegt. Jedes x ∈ M ∪ N liegt in einer Stammlinie. Wenn x in mehreren Stammlinien liegt, so stimmen diese bis auf eine mögliche Indexverschiebung überein. In diesem Falle betrachten wir sie als gleich! Jedes Element aus M ∪ N liegt dann in genau einer Stammlinie. 4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 129 Hier eine Skizze der verschiedenen Arten von Stammlinien. · · · 7→ n−1 7→ m0 7→ n0 7→ m1 7→ · · · m00 7→ n00 7→ m01 7→ n01 7→ m02 7→ · · · n000 7→ m001 7→ n001 7→ m002 7→ n002 7→ · · · (Ein x ∈ M ∪N kann in einer Stammlinie mehrfach vorkommen. Dann ist diese Stammlinie nach beiden Seiten unendlich lang und das Vorkommen von x, sowie eines jeden anderen Elements in dieser Stammlinie, periodisch.) Jetzt definieren wir F : M → N wie folgt: F (m) := g(m), wenn m in einer Stammlinie liegt, die entweder links keinen Anfang hat oder links mit einem Element aus M anfängt. Liegt aber m in einer Stammlinie, die links mit einem Element von N anfängt, so sei F (m) das eindeutig bestimmte Urbild von m unter h (d.h. dasjenige n ∈ N , das h(n) = m erfüllt). Innerhalb jeder Stammlinie bildet F die Menge der Elemente von M , die in dieser Stammlinie liegen, bijektiv auf die Menge der Elemente von N in dieser Stammlinie ab. Da jedes Element von M in einer und nur einer Stammlinie liegt, ist F eine Abbildung von M nach N . Da jedes Element von N in einer Stammlinie liegt, ist F surjektiv. Da aber jedes Element von N nur in einer Stammlinie liegt ist F auch injektiv. Folgerung 4.6.4 Je zwei beschränkte Intervalle sind gleichmächtig. Beweis: Seien a, b, c, d reelle Zahlen mit a < b und c < d. Sei I eines der Intervalle [a, b], [a, b[, ]a, b], ]a, b[ und J eines der Intervalle [c, d], [c, d[, ]c, d], ]c, d[. Dann findet man leicht eine Abbildung f : R → R der Form f (x) = px + q mit geeigneten p, q ∈ R, die I injektiv in J abbilden. Etc. Bemerkungen 4.6.5 Es gibt allerdings keine stetige bijektive Abbildung [0, 1] → [0, 1[, noch eine solche [0, 1[→]0, 1[, noch eine solche [0, 1] →]0, 1[. Ebensowenig gibt es bijektive stetige Abbildungen in jeweils umgekehrter Richtung. Ich verzichte auf einen Beweis, da wir den Begriff der Stetigkeit zu wenig studiert haben. Beachte, dass die Abbildungen tan : ] − π/2, π/2[→ R und tan : [0, π/2[→ R+ bijektiv und stetig sind. Ihre Umkehrabbildungen sind ebenfalls stetig. Auch hier appelliere ich an Deine Anschauung und verzichte auf einen strengen Beweis. Frage: Welche ‘einfachere’ Funktion als der Tangens bildet das beschränkte Intervall ]0, 1] bijektiv auf das unbeschränkte Intervall [1, ∞[ ab? Antwort: x 7→ 1/x. Diese Funktion kehrt allerdings die Anordnung um. Mit Hilfe der Folgerung sieht man auch, dass es eine bijektive Abbildung R∗+ → R gibt. Konkreter weiß man aber, dass der Logarithmus (zu einer beliebigen Basis 6= 1) eine stetige bijektive Abbildung R∗+ → R ist, und dass eine Exponentialfunktion (zu einer beliebigen Basis 6= 1)s eine stetige bijektive Abbildung in umgekehrter Richtung ist. 130 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Beispiele 4.6.6 a) Die Menge C0 aller 0-1-Folgen ist gleichmächtig zu R. Beachte dabei, dass die Abbildung, die jeder 0-1-Folge (a0 , a1 , a2 , . . .) den Binärbruch 0, a0 a1 a2 . . . zuordnet nicht injektiv ist, da z.B. die Binärbrüche 0,01 und 0,1 dieselbe reelle Zahl darstellen. Also ordne etwa der 0-1-Folge (a0 , a1 , a2 , . . .) den Ternärbruch (oder, wenn es Dir lieber ist, den Dezimalbruch oder . . . ) 0, a0 a1 a2 . . . zu. Diese Abbildung ist sicher injektiv. Umgekehrt wird durch x 7→ 21 + π −1 arctan x eine bijektive Abbildung R →]0, 1[ definiert. Schreibe dann jede Zahl aus ]0, 1[ als Binärbruch, wo z.B. solche, die auf lauter Einsen enden, verboten sind. Ordne jedem Binärbruch, der dieser Einschränkung unterliegt, die Folge seiner Nachkommastellen zu. Insgesamt erhältst Du eine injektive Abbildung R → C0 . Der Satz von Cantor und Bernstein ergibt dann die Behauptung. b) C0 und C02 := C0 × C0 sind gleichmächtig. Dasselbe gilt dann natürlich auch für R und R2 . Denn die Abbildung C0 → C02 , (an )n∈N 7→ ((a2n )n∈N , (a2n+1 )n∈N ) ist offensichtlich bijektiv. Beachte: Da man reelle Zahlen nicht immer eindeutig als Dezimalbrüche (auch nicht als Binäbrüche oder . . . ) darstellen kann, muss man für einen direkten Beweis der Gleichmächtigkeit etwa von [0, 1[ und [0, 1[×[0, 1[ eine gewisse Vorsicht walten lassen. Wenn man z.B. der als Dezimalbruch geschriebenen rellen Zahl 0,1109 das Paar (0,1999 . . . , 0,100 . . .) zuordnete, und das Entsprechende mit der Zahl 0, 120 machte, bekäme man dasselbe Paar reeller Zahlen als Bild. Die Abbildung wäre nicht injektiv, da 0,1109 6= 0,120 ist. Wie kann man sich da helfen, wenn man nicht den Cantor-Bernstein-‘Hammer’ verwenden will? Nun, man verbiete zunächst (etwa) die Neunerperiode. Um ein Paar reeller Zahlen als Bild eines Dezimalbruches (< 1) zu bekommen, verteilt man nicht die Dezimalstellen abwechselnd auf die beiden Komponenten des Paares, sondern zerlegt zunächst die Folge der Nachkommastellen in möglichst kurze Päckchen, deren Endziffer nicht die 9 ist, z.B. 0, 29987690999743915 . . . = 0, 2|998|7|6|90|9997|4|3|91|5| . . . und verteilt nun diese ‘Päckchen’ abwechselnd auf zwei Dezimalbrüche. Als Bild obiger Zahl erhält man das Paar (0, 2 7 90 4 91 . . . , 0, 998 6 9997 3 5 . . .) . Entsprechend bildet man die Umkehrabbildung. (Wieder einmal siehst Du, dass es oft mehrere Beweise für ein und denselben Satz geben kann, deren jeder seine Verdienste haben kann.) c) Du kannst nun leicht folgern, dass auch R und Rn für ganze n > 0 gleichmächtig sind. d) Betrachte jetzt die Menge RN , womit ich das cartesische Produkt von abzählbar vielen Faktoren R meine, also die Menge aller Folgen reeller Zahlen, die ich auch als Menge aller Abbildungen N → R auffassen kann. Natürlich ist sie gleichmächtig zur Menge C0N . Könnte es sein, dass auch diese Menge gleichmächtig zu R ist? Die Antwort ist: Ja. 4.6. EIN ALLGEMEINER SATZ ÜBER DIE VERGLEICHBARKEIT VON MENGEN 131 Dies zu beweisen, hilft uns das Cauchy’sche Diagonal-Verfahren. Denn eine Folge von Elementen aus C0 ist ja nichts anderes als eine Doppelfolge: a00 a10 a20 a30 a40 a50 .. . a01 a11 a21 a31 a41 a51 .. . a02 a12 a22 a32 a42 a52 .. . a03 a13 a23 a33 a43 a53 .. . a04 a14 a24 a34 a44 a54 .. . a05 · · · a15 · · · a25 · · · a35 · · · a45 · · · a55 · · · .. . . . . mit aij ∈ {0, 1}. Jede Zeile ist eine 0-1-Folge und die Folge der Zeilen eine Folge von Elementen aus C0 . Durch das Cauchy’sche Diagonalverfahren macht man aus jedem solchen Schema (jeder Doppelfolge) eine 0-1-Folge und erhält damit eine Abbildung C0N → C0 . Dass es eine Umkehrabbildung gibt, siehst Du sicher leicht ein: Mache aus der 0-1-Folge (bn )n∈N die Doppelfolge (aij )ij∈N×N durch a00 := b0 , a10 := b1 , a01 := b2 , a20 := b3 , a11 := b4 , a02 := b5 , a30 := b6 , usw. e) Umgekehrt ist die Menge NR , womit ich die Menge aller Abbildungen R → N meine, nicht mehr zu R gleichmächtig, da nicht einmal die Menge {0, 1}R es ist. Denn letztere ist gleichmächtig zur Menge aller Teilmengen von R. Wie? f) Die Menge S aller stetigen Abbildungen f : R → R ist gleichmächtig zu R. Den jede solche Abbildung ist schon durch ihre ‘Einschränkung’ auf Q festgelegt. Mit der Einschränkung von f auf meine ich die Abbildung f|Q : Q → R, definiert durch f|Q (x) = f (x) für alle x ∈ Q, d.h. im Grunde die Abbildung f selbst, allerdings nur für rationale Argumente betrachtet. Und RQ ist sicher gleichmächtig zu RN . Es gibt also injektive Abbildungen S → R und R → S (nämlich welche?). Bemerkung 4.6.7 Eine scheinbar naheliegende Frage ist, ob es eine Teilmenge M von R gibt, die zwar nicht abzählbar, aber auch nicht gleichmächtig zu R ist. Cantor selbst hat sich mit diesem sogenannten Kontinuumproblem vergeblich herumgeschlagen. Gödel hat gezeigt, dass man eine genügend reichhaltige ‘mathematische Welt’ konstruieren kann, in der diese Frage negativ zu beantworten ist. D.h. in dieser Welt ist jede Teilmenge von R entweder abzählbar oder zu R gleichmächtig. Es liegt nahe, diese Frage zu untersuchen, nachdem man die Mengenlehre axiomatisiert hat. Das genannte Gödelsche Ergebnis benutzt eine solche Axiomatisierung und fügt ihr sozusagen ein weiteres ‘Axiom’ hinzu, das die Möglichkeit, Mengen zu konstituieren soweit einschränkt, dass es eine solche seltsame Teilmenge von R nicht gibt. Aber dies Einschränkung ist so schwach, dass kein Satz der Mathematik, der bis dato bewiesen war, seine Gültigkeit verloren hätte. Jahrzehnte später hat Cohen gezeigt, dass die klassischen Axiomensysteme der Mengenlehre (ohne die Gödelsche Einschränkung) das Kontinuumproblem nicht zu entscheiden vermögen. Er konnte im Rahmen der klassischen Axiomatik der Mengenlehre die Existenz solcher mathematischer Welten erzwingen, in der es Teilmengen von R gibt, die weder abzählbar noch zu R gleichmächtig sind. 132 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Es gibt heute Mengentheoretiker, die meinen, ‘vernünftige Axiome’ angeben zu können, die es gestatten, das Kontinuumproblem zu lösen. Meiner Meinung nach gehören manche ihrer Argumente dafür, dass man gewisse Axiome für ganz besonders einsichtig halten sollte, eher der Theologie als der Mathematik an. (Delahaye in Spektrum der Wissenschaft März 2009) Das bedeutet natürlich nicht, dass ich es für unseriös hielte, die Auswirkung ‘neuer’ Axiome der Mengenlehre auf das Kontinuumproblem zu studieren. Ich glaube, dass das Kontinuumproblem ein Scheinproblem ist, geboren aus der etwas schwammigen Definition von R, etwa als Menge ‘aller’ Cauchyfolgen modulo Nullfolgen. Bei dieser Definition bleibt letztlich offen, welche sprachlichen Mittel zur Konstruktion von Cauchyfolgen man verwenden darf. Wenn man einfach sagt: alle“, verstrickt man sich in Widersprüche. ” Man kann genügend viel Mathematik machen, ohne das Kontinuumproblem gelöst zu haben. Dasselbe gilt auch, wenn man die Gödelsche Einschränkung akzeptiert. Diese Einschränkung braucht man nicht als Glaubenssatz anzunehmen. Man kann sie ganz einfach als Beschränkung desjenigen Mathematischen Kosmos betrachten, den man (gerade) untersuchen will. 4.7 Äquivalenzrelationen und Äquivalenzklassen Bereits in dem 2. Kapitel hast Du die Ringe Z/(m) kennengelernt, deren Elemente man als Teilmengen von Z auffassen kann. Diese Teilmengen sind eng verknüpft mit der Kongruenzrelation modulo m. Ähnlich ist es mit der Einführung der rationalen Zahlen. Diese sind – formal gesehen – Paare m m0 ganzer Zahlen (m, n) mit n 6= 0. Zwei Brüche , 0 nennt man genau dann einander gleich, n n m wenn mn0 = m0 n gilt. Man kann die rationale Zahl auch als Menge aller Zahlenpaare n (m0 , n0 mit mn0 = m0 n auffassen. (Manchmal unterscheidet man zwischen einem Bruch m n 0 0 als Zahlenpaar und der rationalen Zahl, die durch jeden Bruch m gegeben ist, der m n = 0 n mn0 erfüllt. Ich muss gestehen, diese feinsinnige Unterscheidung am Anfang des Buches nicht gemacht zu haben.) Auch bei der Einführung der reellen Zahlen durch Cauchy-Folgen betrachtet man zunächst den Ring R aller Cauchyfolgen und darin die Menge N aller Nullfolgen. Cauchyfolgen (an ), (bn ) heißen zueinander äquivalent, wenn ihre Differenz (an )n − (bn )n := (an − bn )n eine Nullfolge ist. Man schreibt hierfür auch (an )n ≡ (bn )n (mod N ). Die reellen Zahlen enstehen dann, indem man äquivalente Cauchyfolgen als gleich betrachtet. Wir wollen dieses Prinzip später noch mehrfach verwenden. Deshalb soll es in diesem Abschnitt ganz allgemein betrachtet werden. 4.7.1 Eine Relation ∼ auf einer Menge M kommt gewissen Paaren (a, b) von Elementen aus M zu. Beispiele sind ≤, >, |, ≡ (mod m) auf Z. Formal kannst Du eine Relation als Teilmenge von M × M auffassen: {(a, b) ∈ M × M | a ∼ b}. 4.7. ÄQUIVALENZRELATIONEN UND ÄQUIVALENZKLASSEN 133 Definition 4.7.2 Sei M eine Menge. Eine Äquivalenzrelation auf M ist eine Relation ∼ mit folgenden Eigenschaften: a ∼ a für alle a (Reflexivität) a ∼ b ⇒ b ∼ a (Symmetrie) a ∼ b, b ∼ c ⇒ a ∼ c (Transitivität). Beispiele 4.7.3 Beispiele sind die Gleichheit, sowie die Kongruenz modulo einem festgewählten m. Ist f : M → N eine Abbildung, so ist die Relation a ∼ b auf M , definiert durch f (a) = f (b) ebenfalls eine Äquivalenzrelation. Die Relation ‘<’ zum Beispiel ist keine Äquivalenzrelation. Definition 4.7.4 Sei ∼ eine Äquivalenzrelation auf einer Menge M . Eine Äquivalenzklasse bezüglich ∼ ist eine nichtleere Teilmenge C von M , mit folgenden Eigenschaften: (i) Für beliebige a, b ∈ C gilt a ∼ b. (ii) Gilt c ∼ a für ein c ∈ M und ein a ∈ C, so ist auch c ∈ C. Beispiel 4.7.5 Die Äquivalenzklassen bezüglich der Äquivalenzrelation ≡ (mod m) sind die Restklassen r + Zm. Seien nämlich a, b ∈ r + Zm, etwa a = r + a0 m, b = r + b0 m, so ist a − b = (a0 − b0 )m durch m teilbar. D.h. a ≡ b (mod m). Sei ferner c = r + c0 m ∈ r + Zm und a ∈ Z, sowie a ≡ c (mod m). So ist a − c = a − r − c0 m ein Vielfaches von m, etwa gleich dm, so ist a = r + c0 m + dm = r + (c0 + d)m ∈ r + Zm. Für das Beispiel a ∼ b ⇐⇒ f (a) = f (b) aus (4.7.3) sind die Äquivalenzklassen die Urbildmengen f −1 ({y}) aller y ∈ im(f ). Bemerkungen 4.7.6 Sei im Folgenden ∼ eine Äquivalenzrelation auf einer Menge M . a) Seien C, D Äquivalenzklassen mit C ∩ D 6= ∅. Dann ist C = D. Denn sei b ∈ C ∩ D. Für a ∈ C gilt a ∼ b gemäß Eigenschaft (i) der Definition 4.7.4. Gemäß (ii) folgt daraus a ∈ D. Somit gilt C ⊂ D. Und D ⊂ C folgt aus Symmetriegründen. b) Jedes Element a ∈ M liegt genau in einer Äquivalenzklasse bezüglich ∼. Mit anderen Worten: M ist die Vereinigung aller Äquivalenzklassen bezüglich ∼. Und zwei verschiedene Äquivalenzklassen bezüglich ∼ sind disjunkt, d.h. ihr Durchschnitt ist leer. Die letzte Aussage haben wir unter a) gezeigt. Sei jetzt a ∈ M . Ich behaupte: Die Menge Ca := {x ∈ M | x ∼ a} ist eine Äquivalenzklasse. Wegen der Reflexivität gilt a ∈ Ca . Sind x, y ∈ Ca , d.h. x ∼ a, y ∼ a, so sieht man mit Hilfe der Symmetrie und Transitivität, dass x ∼ y gilt. x ∼ a, y ∼ a ⇒ x ∼ a, a ∼ y ⇒ x ∼ y 134 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Gilt nun x ∼ b für x ∈ M, b ∈ Ca , so folgt wegen b ∼ a aus der Tansitivität, dass x ∼ a, also x ∈ Ca gilt. c) Aus Obigem ergibt sich: Ca = Cb ⇐⇒ a ∼ b Definition 4.7.7 Die Menge der Äquivalenzklassen in M bezüglich der Äquivalenzrelation ∼ wird auch mit M/ ∼ bezeichnet. Bemerkung 4.7.8 Wir haben die naheliegende kanonische Abbildung κ : M → M/ ∼, die jedem a ∈ M die Äquivalenzklasse Ca , d.h. diejenige Äquivalenzklasse, deren Element a ist, zuordnet. Die Abbildung κ ist surjektiv. (Beachte, dass Äquivalenzklassen per definitionem nicht leer sind.) 4.7.9 Du kannst die Menge M/ ∼ auch auf andere Weise verstehen: M/ ∼ ist die Menge M , allerdings mit einer anderen Gleichheit, nämlich der Relation ∼. Zum praktischen Umgang mit M/ ∼ ist häufig folgende Definition nützlich. Definition 4.7.10 Ein Repräsentantensystem bezüglich ∼ ist eine Menge, die aus jeder Äquivalenzklasse bzgl. ∼ genau ein Element besitzt. Beispiele 4.7.11 a) Sei m > 0 eine natürliche Zahl. Dann ist die (endliche) Menge {0, 1, . . . , m − 1} ein Repräsentantensystem bezüglich der Kongruenz modulo m. Die gilt natürlich auch für jede Menge von m aufeinander folgenden ganzen Zahlen, etwa der Menge {−(m − 1)/2, . . . , −1, 0, 1, . . . , (m − 1)/2} wenn m ungerade ist. Auch die Menge {2, 3, . . . , m + 1} ist ein Repräsentantensystem, welches aber wohl von geringem Nutzen ist. b) Ist M die Menge aller Paare (m, n) ganzer Zahlen mit n 6= 0 und die Relation ∼ definiert durch (m, n) ∼ (m0 , n0 ) : ⇐⇒ mn0 = m0 n so bilden die teilerfremden Paare (m, n) mit n > 0 ein Repräsentantensystem. c) Auf der Menge der Geraden in der sogenannten euklidischen Ebene ist die Relation ‘g parallel zu h’ eine Äquivalenzrelation. Ein Repräsentantensystem der zugehörigen Äquivalenzklassen besteht aus den Geraden, die durch einen festgewählten Punkt gehen. 4.8. BEINAHE EINE PARADOXIE 4.8 135 Beinahe eine Paradoxie 4.8.1 Ein Text ist eine Zahl. Denn man kann ja jeden Buchstaben, jede Ziffer, jedes Satzzeichen, die Leerstelle zwischen Wörtern eingeschlossen, durch eine zweistellige Dezimalzahl codieren. Der ganze Text wird dann durch die Zahl beschrieben, deren Dezimaldarstellung durch die Aneinanderreihung der den Buchstaben und anderen Zeichen entsprechenden zweistelligen Codes entsteht. Das gilt natürlich auch für mathematische Texte. Jeder der (wie ich) das Schreibsystem TEX kennt, weiß, wie man Formeln durch eine (sozusagen eindimensionale) Abfolge von Zeichen darstellen kann, auch wenn sie – wie etwa Brüche, Potenzen, Binomialkoeffizienten oder Matrizen – traditionell ‘zweidimensional’ geschrieben werden. Natürlich kann man statt des Dezimalsystems das Binärsystem verwenden, wo man natürlich für zur Codierung der Buchstaben mehr als 2 Stellen benötigt. (Ich habe einst den Ausdruck Gödelisierung für dieses Verfahren gelesen.) Umgekehrt entspricht allerdings nicht jeder natürlichen Zahl, die im Dezimalsystem gerade viele Stellen hat, ein sinnvoller Text. Aber zwei verschiedenen Texten entsprechen verschiedene Zahlen. 4.8.2 Wir betrachten Abbildungen N → X, sogenannte zahlentheoretische Funktionen, wo X eine beliebige Menge ist. In den meisten Fällen ist X ein Körper etwa X = R. Wir betrachten hier speziell den Fall X = N. Natürlich kann man jede solche zahlentheoretische Funktion auch als Folge (f (0), f (1), f (2), . . .) = (f (n))n∈N auffassen – und umgekehrt. Du weißt bereits, dass es überabzählbar viele solche Folgen gibt, wenn X aus mindestens 2 Elementen besteht, was für X = N sicher der Fall ist. Ein Beispiel einer solchen Funktion ist: f (n) sei per Definitionem der kleinste Primfaktor von n2 + 2. Die Werte dieser Funktion kann man im Prinzip berechnen, da man etwa durch Probieren für jedes n den kleinsten Primfaktor von n2 + 2 aufzuspüren vermag – mag dies auch unheimlich lange dauern. Es gibt eine ‘Methode’, ein ‘Rezept’, den Wert f (n) für jedes n zu bestimmen. Dasselbe gilt für die Funktion f mit f (0) = 1 und f (n) = pn , wo pn für n ≥ 1 die n-te Primzahl bezeichnet. In beiden genannten Fällen kann man die Funktion zwar nicht durch eine Formel beschreiben, aber eben doch konkret angeben, wie man zu jedem gegebenen n den Wert f (n) bestimmt. Es wird uns in diesem Abschied gelingen, eine Funktion zu finden, deren Werte man so nicht bestimmen kann. Definition 4.8.3 Eine Funktion f : N → N heißt berechenbar, wenn es eine Methode gibt, die es erlaubt, zu jedem n ∈ N den Wert f (n) zu bestimmen. 136 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Diese Definition erscheint Dir womöglich etwas vage. In der Tat gibt man sich in der Logik große Mühe, sie zu präzisieren. Ich glaube allerdings, dass Du prinzipiell verstehen wirst, worum es geht. Satz 4.8.4 Die Menge der berechenbaren Funktionen N → N ist abzählbar. Es gibt also Funktionen N → N, die nicht berechenbar sind, sogar überabzählbar viele. Beweis: Zu jeder berechenbaren Funktion gibt es ein Rezept zur Bestimmung der Funktionswerte. Dieses Rezept ist ein endlicher Text. Zu verschiedenen berechenbaren Funktionen gehören natürlich verschiedene Rezepte. Nicht wahr? (Es mögen zwar zwei Kuchen, die nach demselben Rezept gebacken sind, verschieden schmecken. Aber zwei Zahlen, die man nach demselben Rezept bestimmt hat, sind sicher gleich.) Nach dem Beginn dieses Abschnittes entspricht jedem Text eine natürliche Zahl. Die Menge aller möglichen Texte, erst recht die Menge aller Rezepte zur Bestimmung der Funktionswerte von Funktionen N → N ist also gleichmächtig zu einer Teilmenge von N und deshalb abzählbar. 4.8.5 Seien f0 , f1 , f2 , . . . die berechenbaren Funktionen. (Auch die fn sind Texte, die ich als natürliche Zahlen auffassen kann.) Betrachte die Funktion ϕ : N → N, definiert durch ϕ(n) := fn (n) + 1. Dann gilt ϕ(n) 6= fn (n) für jedes n ∈ N. Dann muss aber ϕ 6= fn sein, weil beide Funktionen verschiedene Werte bei n haben. Die Funktion ϕ gehört also nicht zu den berechenbaren Funktionen f0 , f1 , f2 , . . .. Das scheint paradox. Denn wenn man fn (n) berechnen kann, dann doch wohl auch fn (n) + 1. Gibt es einen Widerspruch in der Mathematik??? Die Auflösung dieses scheinbaren Widerspruchs ist die Folgende: Die Funktion ϕ, die jeder natürlichen Zahl n die Funktion fn zuordnet, kann nicht berechenbar sein! Denn ϕ ist die Verkettung dieser Zuordnung mit der Abbildung, die jedem fn die Zahl fn (n) + 1 zuordnet. Und letztere Abbildung ist sicher berechenbar, da man fn (n) und damit auch fn (n) + 1 berechnen kann. Satz 4.8.6 Die folgende Funktion ψ : N → N ist nicht berechenbar: Wenn die Zahl m einem Text entspricht, der ein Rezept zur Berechnung einer berechenbaren Funktion N → N darstellt, so sei ψ(m) = 1; in allen anderen Fällen sei ψ(m) = 0. Beweis: Wenn ψ berechenbar wäre, könnte man die Zuordnung n 7→ fn folgendermaßen herstellen. Zunächst wird f0 bestimmt. Teste die Zahlen 0, 1, 2, . . . nacheinander mit der – nach Annahme berechenbaren – Funktion ψ. Finde damit das kleinste m0 mit ψ(m0 ) = 1. Dieses m0 beschreibt eine berechenbare Funktion; diese sei f0 4.8. BEINAHE EINE PARADOXIE 137 Seien f0 , f1 , . . . , fn−1 bereits bestimmt und mn−1 die zu fn−1 gehörige Zahl. Berechne dann ψ(mn−1 + 1), ψ(mn−1 + 2, . . . bis Du auf die kleinste natürliche Zahl mn > mn−1 mit ψ(mn ) = 1 triffst. Dieses mn beschreibt also eine berechenbare Funktion fn . Zusammen ergibt sich eine berechenbare Methode, jedem n ∈ N eine berchenbare Funktion fn zuzuordnen. Man erreicht auf diese Weise auch alle berechenbaren Funktionen. Denn zu jeder gehört ja eine natürliche Zahl m. Da dies aber, wie oben gezeigt, nicht möglich ist, kann ψ nicht berechenbar sein. 138 KAPITEL 4. VOM PRIMITIVEN URGRUND MODERNER MATHEMATIK Kapitel 5 √ Was bedeutet π 2? Sehr interessant und für Anwendungen wichtig ist die Potenzrechnung besonders dann, wenn man nicht nur ganzzahlige Exponenten betrachtet. In diesem kurzen Kapitel definieren wir Potenzen ax , wenn a eine positive und x eine beliebige reelle Zahl ist. Zunächst betrachten wir den Fall, wo x rational ist. (Dabei wird sich nebenbei ergeben, dass ab irrational sein kann, auch wenn a und b beide rational sind.) Danach definieren wir ex für beliebige reelle x, wobei e die aus dem 1. Abschnitt des 3. Kapitels bekannte Eulersche Zahl ist. Die Funktion ex wird wie die Zahl e durch eine Reihe definiert. Um zu sehen, dass für rationale x die beiden Definitionen von ex zum selben Ergebnis führen, benötigen wir das Cauchyprodukt von Reihen, welches wir im letzten Kapitel betrachtet haben. Wir definieren dann (für positive a) allgemein ax := ex ln a , wobei ln den natürlichen Logarithmus bezeichnet, der durch eln a = a definiert ist. 5.1 Potenzen mit rationalen Exponenten Beispiel: Man weiß etwa: Bei einer speziellen Bakterienkultur verdoppelt sich die Anzahl der Bakterien alle 24 Stunden. Frage: Wieviele Bakterien hat man nach 8 Stunden? Antwort: Nach 8 Stunden möge die Anzahl das x-fache der Ausgangszahl sein. Dann habe ich nach 16 Stunden das x-fache des x-fachen der Ausgangszahl, also das x · x-fache der Ausgangszahl und schließlich nach 24 Stunden √ das x · x · x-fache der Ausgangszahl. Es gilt also 3 x = 2. Somit habe ich nach 8 Stunden das 3 2-fache der Ausgangszahl. Andererseits, da nach n Tagen, die Anzahl der Bakterien das 2n - fache der Ausgangszahl beträgt, liegt es nahe, die Zahl der Bakterien nach einem drittel Tag als das 21/3 -fache der Ausgangszahl zu betrachten, also √ 1 3 2 3 = 2 zu definieren. (Natürlich ist √ die Anzahl n der zu Anfang vorhandenen Bakterien so groß, dass Du den Unterschied von 3 2 · n zur nächsten ganzen Zahl als unerheblich betrachten darfst.) 139 √ 140 KAPITEL 5. WAS BEDEUTET π 2 ? 5.1.1 Ist a ein Element eines Ringes, so kennst Du bereits Potenzen der Form an , wo n ∈ N ist. Falls a ein von 0 verschiedenes Körperelement ist, so ist an sogar für beliebige ganze Zahlen n sinnvoll und eindeutig definiert. Du kennst auch folgende Regeln: (∗) am+n = am · an , (∗∗) amn = (am )n Auf Grund der Kommutativität ab = ba hat man als dritte Regel (∗ ∗ ∗) (ab)n = an bn 5.1.2 Wie will man am/n definieren, wenn m, n ∈ Z, n > 0 ist? Wenn die Regel (∗∗) für n ∈ Z weiter gelten soll, muss x := am/n die Gleichung xn = am erfüllen. Nun kann im Allgemeinen die Gleichung xn = b mehrere Lösungen oder auch gar keine Lösung haben. Im Körper R der reellen Zahlen gibt es für gerade n und negative b keine Lösung. Hingegen gibt es 2 reelle Lösungen, wenn n gerade und b > 0 ist. Wenn n ungerade ist, gibt es immer genau eine Lösung. (Im Körper Q der rationalen Zahlen gibt es auch für ein positives b eher selten Lösungen! Später wirst Du sehen, dass die Gleichung xn = b im Bereich der komplexen Zahlen immer Lösungen hat, und zwar für b 6= 0, sogar n Lösungen. ) In der Menge R+ der reellen Zahlen ≥ 0 gibt es glücklicherweise zu jedem ganzen n > 0 und √ n n b bezeichnet. (Wie gewohnt definiert man jedem b genau ein c mit c = b. Dieses c wird mit √ √ 2 ∗ m/n b = b.) Für a √ ∈ R+ , der Menge der reellen Zahle > 0, ist also a ∈ R∗ eindeutig definiert, n nämlich am/n := am . D.h. wenn man a > 0 voraussetzt und am/n > 0 fordert, hat man keine Probleme. Es darf sogar m < 0 sein! Du solltest Dir überlegen, dass für a, b ∈ R∗+ die Regeln (∗), (∗∗), (∗ ∗ ∗) auch für gebrochene Exponenten aus Q gelten. Nochmal: Sei a > 0. Dann ist für alle rationalen x die x-te Potenz von a, also ax durch die Vorgabe ax > 0 eindeutig definiert. Was soll man nun unter ax verstehen, wenn x reell, aber nicht mehr rational ist? Ein Praktiker wird sagen: Sei x genügend genau durch die rationale Zahl (etwa den abbrechenden Dezimalbruch) r approximiert. Dann approximiert auch ar genügend genau die Potenz ax . (Das stimmt zwar, sollte aber eigentlich bewiesen worden sein.) Als Theoretiker möchte ich gerne ax für beliebige reelle, nicht nur für rationale Zahlen x präzise definieren. Dazu wähle ich einen Umweg. Warum macht man in der Mathematik – hier und in vielen anderen Fällen – gerne einen Umweg? Die Antwort ist dieselbe wie im täglichen Leben. Es ist ja gar nicht so selten, dass man auf einem Umweg schneller zum Ziel kommt als auf dem kürzesten Weg. Der direkte Weg kann durch enge verkehrsreiche Straßen führen, ein Umweg über die Autobahn. Oder, auf dem geraden Weg mag ein Sumpf liegen, den man durch einen Umweg vermeiden kann. Usw. Der direkte Weg, ax für beliebige reelle x zu definieren, wäre der Folgende: Jede reelle Zahl lässt sich ja beliebig durch rationale Zahlen approximieren. D.h. zu jedem x ∈ R gibt es eine 5.2. DIE EXPONENTIALFUNKTION 141 Folge (yn ) mit yn ∈ Q, so dass x = limn→∞ yn ist. Dann kann man definieren: ax := limn→∞ ayn . Damit das funktioniert, bleibt allerdings folgendes zu zeigen: 1. Die Folge (ayn ) ist konvergent. 2. Wenn man (yn ) durch eine andere gegen x konvergente Folge ersetzt, kommt man zum gleichen Ergebnis. 5.1.3 Jetzt stelle ich Dir die indirekte Methode zur Einführung allgemeiner Potenzen vor. Im nächsten Abschnitt wird sie dann genauer ausgeführt. ∞ X xn Zunächst definiert man auf R eine Funktion ‘exp’ durch exp(x) := . Mit Hilfe des n! n=0 Cauchy-Produktes und des Binomialsatzes zeigt man das Additionstheorem exp(x + y) = exp(x) exp(y). Nun setzt man e := exp(1), und zeigt mit Hilfe des Additionstheorems, dass exp(x) = ex für alle rationalen x gilt. (Noch mal: exp(x) ist durch eine Reihe, ex als Wurzel aus einer Potenz mit ganzem Exponenten definiert.) Dann definiert man ex := (x) für alle reellen (später sogar für alle komplexen) x. Da exp auf R stetig ist, und zwei stetige Funktionen auf R, die auf Q übereinstimmen, schon gleich sind, ist diese Definition zwingend, wenn man die Stetigkeit der Funktion f (x) = ex haben möchte. Um ax für allgemeine a > 0 zu definieren, machen wir dann noch folgende Betrachtungen. Es gilt ex > 0 für alle reellen x. Die Funktion f (x) = ex ist stetig und streng monoton wachsend. Letzteres heißt x > y =⇒ ex > ey“. Die Funktion ex wächst über alle Grenzen. Andererseits ” ist 0 ihre untere Grenze, d.h. zu jedem (noch so kleinen) r > 0 gibt es ein x mit ex < r. Aus all dem folgt mit Hilfe des Zwischenwertsatzes: Zu jedem reellen x > 0 gibt es genau ein y mit ey = x. Dieses y nennt man den (natürlichen) Logarithmus von x. Er wird in diesem Buch mit ln x bezeichnet. Die Abbildung ln : R∗+ → R ist die Umkehrabbildung von exp : R → R∗+ , d.h. es ist exp(ln(y)) = y, ln(exp(x)) = x für alle x ∈ R, y ∈ R∗+ . Ferner gilt ln(xy) = ln(x) + ln(y), was aus exp(x + y) = exp(x) exp(y) folgt. Nachdem all dieses bedacht und getan ist, definiert man ax für positive a und beliebige reelle x durch ax := ex ln a . Dann hängt auch ax stetig von x ab und stimmt für rationale x mit der üblichen Definition überein. Weiterhin gilt, wie man leicht rechnet: ax+y = ax ay , 5.2 (ax )y = axy , (ab)x = ax bx . Die Exponentialfunktion Definition 5.2.1 Die unendliche Reihe ∞ X xn x x2 x3 =1+ + + + ···. n! 1 1 · 2 1 · 2 · 3 k=0 √ 142 KAPITEL 5. WAS BEDEUTET π 2 ? heißt die Exponentialreihe. Satz 5.2.2 Die Eponentialreihe konvergiert für alle reellen x. Beweis: Da es genügt, die absolute Konvergenz zu zeigen, können wir x ≥ 0 voraussetzen. Sei N ganz mit N > Max{2, x + 1}. Es genügt, die Konvergenz der Reihe R= ∞ ∞ X X xn−N xn = xN n! n! n=N n=N (wo die ersten N Glieder weggelassen sind) zu zeigen. Dazu reicht es, die Konvergenz von ∞ X xn−N n! n=N zu beweisen. Ein allgemeines Glied der letzgenannten Reihe lässt sich für n ≥ N + 2 wie folgt als Produkt dreier Faktoren schreiben: 1 xn−N 1 · · n(n − 1) (n − 2) · · · N (N − 1) (N − 2)! Der mittlere Faktor ist nicht größer als 1, da die (n−2)−(N −2) = n−N Faktoren seines Nenners nach Wahl von N sämtlich ≥ x sind. Ebenso ist der dritte Faktor ≤ 1. Die Partialsummen der bekanntermaßen konvergenten Reihe ∞ X n=N 1 n(n − 1) sind also größer oder gleich denen der Reihe R/xN . Also ist R konvergent und damit auch die Exponentialreihe. Definition 5.2.3 Für jedes x ∈ R definieren wir die Funktion exp(x) := ∞ X xn k=0 n! d.h. als Wert der Exponentialreihe. Die so definierte Funktion exp : R → R heißt die Exponentialfunktion. Die grundlegende Aussage über die Eponentialfunktion ist das Additionstheorem: Theorem 5.2.4 exp(x + y) = exp(x) · exp(y) 5.2. DIE EXPONENTIALFUNKTION 143 Der folgende Beweis ist etwas tüftelig, da wir zeigen müssen, dass in unserem Spezialfall das Cauchyprodukt der Exponentialreihen gegen das Produkt ihrer Werte konvergiert. Und das ist ja leider nicht selbstverständlich. Beweis: Wir betrachten die beiden Reihen ∞ X xi i=0 i! und ∞ X yj j=0 j! Wenn man jedes Glied der ersten mit jedem Glied der zweiten Reihe multipliziert, kann man die Produkte in einem unendlichen quadratischen Schema anordnen, wie es in (4.5.2) beschrieben ist. a0 b0 a0 b1 a0 b2 a0 b3 a0 b4 a0 b5 · · · a1 b 0 a1 b 1 a1 b 2 a1 b 3 a1 b 4 a1 b 5 · · · a2 b 0 a2 b 1 a2 b 2 a2 b 3 a2 b 4 a2 b 5 · · · a3 b 0 a3 b 1 a3 b 2 a3 b 3 a3 b 4 a3 b 5 · · · a4 b 0 a4 b 1 a4 b 2 a4 b 3 a4 b 4 a4 b 5 · · · a5 b0 a5 b1 a5 b2 a5 b3 a5 b4 a5 b5 · · · .. .. .. .. .. .. .. . . . . . . . wobei ai = xi /i!, bj = y j /j! gesetzt ist. Die Funktion en (x) sei als die n-te Partialsumme der Exponentialreihe definiert: en (x) := n X xk k=0 k! Dann gilt (∗) exp(x) = limn→∞ en (x), also auch exp(x) · exp(y) = limn→∞ en (x)en (y) Da nj = n!/((n − j)!j!) ist, können wir die Summe dn (x, y) über die n-te Cauchy-Diagonale wie folgt berechnen: n n X 1 X n n−j j (x + y)n xn−j y j dn (x, y) := = x y = (n − j)!j! n! j n! j=0 j=0 Das bedeutet: Wenn wir die (unendliche) Summe über die Cauchy-Diagonalen dn (x, y) berechnen, erhalten wir ∞ ∞ X X (x + y)n dn (x, y) = = exp(x + y) . n! n=0 n=0 Wenn wir also gezeigt haben, dass lim en (x)en (y) = n→∞ ∞ X dn (x, y) n=0 gilt, dann haben wir das Theorem bewiesen! Dafür wollen wir zunächst x, y ≥ 0 annehmen. Dann sind alle Einträge in unserem Schema ≥ 0 und Du erkennst en (x)en (y) ≤ 2n X k=0 dk (x, y) ≤ e2n (x)e2n (y) ≤ exp(x) exp(y) . √ 144 KAPITEL 5. WAS BEDEUTET π 2 ? (Wenn Du magst, kannst Du Dir dies mit folgendem Bild veranschaulichen, wo die verschiedenen Kreissymbole •, ⊗ und ◦ für die Einträge ai bj = (xi /i!)(y j /j!) mit i, j ≤ 2n stehen. Dabei betrachte ich den Fall n = 3 in der Hoffnung, der allgemeine Fall möge Dir dann klar sein. 0 • • • • • • • • • • • • ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ◦ ◦ ◦ n • • • • ◦ ◦ ◦ 2n ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦ Wenn wir die Einträge, die mit • bezeichnet sind, addieren, erhaltenPwir en (x)en (y). Addieren wir die Einträge, die mit ⊗ bezeichnet sind, hinzu, so erhalten wir 2n k=0 dk (x, y). Die Summe aller Einträge summiert ergibt e2n (x)e2n (y).) Da sowohl die Folge (en (x)en (y))n als auch die Pn Folge (e2n (x)e2n (y))n gegen exp(x) exp(y) konvergiert, muss die Folge der Teilsummen ( k=0 dk (x, y))n∈N gegen denselben Grenzwert exp(x) exp(y) konvergieren, und wir haben das Theorem für nichtnegative x, y gezeigt. Jetzt behandeln wir den allgemeinen Fall. Zunächst bemerke ich noch, dass für x, y ≥ 0 sich aus obigem folgendes ergibt ! 2n X lim e2n (x) · e2n (y) − dk (x, y) = 0 n→∞ k=0 P Für beliebige x, y ∈ R ist die Differenz e2n (x) · e2n (y) − 2n k=0 dk (x, y) gleich der Summe der Terme xi y j mit i + j > 2n, i ≤ 2n, j ≤ 2n i!j! (d.h. der in obigem Bild mit ◦ bezeichneten Terme) und deshalb nach der Dreiecksungleichung der Betrag dieser Summe kleiner oder gleich der Summe |x|i |y|j mit denselben Bedingungen an i, j i!j! Das lässt sich auch folgendermaßen ausdrücken 2n 2n X X e (x)e (y) − d (x, y) ≤ e (|x|)e (|y|) − dk (|x|, |y|) n n k n n k=0 k=0 Da die rechte Seite mit wachsendem n gegen 0 geht, gilt dies erst recht für die linke Seite. Und damit ist der Satz bewiesen. Die Stetigkeit der Exponentialfunktion beweisen wir mit Hilfe des Additionstheorems. 5.2. DIE EXPONENTIALFUNKTION 145 Lemma 5.2.5 a) Für |x| < 1 gilt | exp(x) − 1 − x| ≤ x2 . b) Die Exponentialfunktion ist in x0 = 0 stetig. Beweis: 2 3 4 x |x|2 |x|3 |x|4 x x a) | exp(x) − 1 − x| = + + + · · · ≤ + + + ··· 2! 3! 4! 2! 3! 4! 1 |x| |x|2 1 1 1 2 2 =x + + + ··· ≤ x + + + · · · ≤ x2 (e − 2) ≤ x2 . 2! 3! 4! 2! 3! 4! Die letzte Ungleichung folgt aus e < 3. b) Wir müssen zeigen, dass limx→0 exp(x) = 1 ist. Nach a) und der Dreiecksungleichung ist | exp(x) − 1| = | exp(x) − 1 − x + x| ≤ | exp(x) − 1 − x| + |x| ≤ |x| + x2 . Deshalb gilt 0 ≤ limx→0 | exp(x) − 1| ≤ limx→0 (|x| + x2 ) = 0. Teil a) werden wir noch anwenden, wenn wir die Ableitung der Exponentialfunktion berechnen wollen. Erinnere Dich, dass der Wert exp(1) der Exponentialfunktion bei 1 mit e bezeichnet wird. Trivialerweise ist exp(0) = 1. Folgerung 5.2.6 Die Exponentialfunktion ist überall stetig. Beweis: Für jedes x ∈ R haben wir limx0 →x exp(x0 ) = exp(x) zu zeigen. Dabei genügt es natürlich, dies für |x0 − x| < 1 zu tun (d.h. nur Folgen (x0n ) mit |x0n − x| < 1 zu betrachten). Es gilt hierfür nach Teil b) obigen Lemmas lim | exp(x0 ) − exp(x)| = | exp(x)| · lim | exp(x0 − x) − 1| = 0 . 0 x0 →x x →x Folgerung 5.2.7 a) Für natürliche Zahlen a gilt exp(a) = ea . b) Selbiges stimmt auch noch, wenn a ∈ Z, also möglicherweise negativ ist. c) Selbiges gilt auch für beliebige a ∈ Q. d) exp(a) > 0 für alle x ∈ R. Genauer gilt exp(a) > 1 für a > 0 und 0 < exp(a) < 1 für a < 0 e) exp ist streng monoton wachsend. D.h. a < b ⇒ exp(a) < exp(b). Beweis: a) exp(1+1+· · ·+1) = e·e · · · e. Wenn Du es für nötig hältst, verwende vollständige Induktion. b) exp(−a) exp(a) = exp(0) = 1. Für jede natürliche Zahl n ist also exp(−n) = 1/en . √ c) exp(m/n)n = exp(n · (m/n)) = exp(m). D.h. exp(m/n) = n em . P n n d) Sei a > 0. Es ist exp(a) = 1 + ∞ n=1 a /n! und für n ≥ 1 ist a /n! ≥ 0. In diesem Fall ist exp(a) > 1. Sei a < 0. Dann ist exp(a) = exp(−a)−1 . Es folgt die Behauptung. e) exp(b) = exp(a + (b − a)) = exp(b − a) exp(a). Da b − a > 0 ist, gilt exp(b − a) > 1. Daraus folgt die Behauptung. √ 146 KAPITEL 5. WAS BEDEUTET π 2 ? Lemma 5.2.8 Seien I ein Intervall und f, g : I → R stetige Funktionen. Wenn die Einschränkungen von f und g auf I ∩ Q übereinstimmen, so stimmen f und g auf ganz I überein. Die reellen Zahlen sind ja so definiert, dass jede solche ein Limes einer Folge rationaler Zahlen ist. (Gehört die reelle Zahl x zu einem Intervall I, kann auch eine Folge rationaler Zahlen, die gegen x konvergiert in diesem Intervall gewählt werden.) Wegen der Stetigkeit folgt die Behauptung. Aus Punkt c) obiger Folgerung und dem Lemma ergibt sich, dass die folgende Definition sinnvoll ist. Definition 5.2.9 Sei x ∈ R beliebig. Dann definieren wir ex := exp(x). Natürlich wollen wir ax für möglichst allgemeine a definieren. Und das wird auch bald geschehen. Allerdings ist die Bedingung a > 0 unumgänglich, wenn wir im Bereich der reellen Zahlen bleiben wollen. 5.2.10 Da die Abbildung exp : R → R streng monoton steigend ist, ist sie injektiv. Was ist das Bild dieser Abbildung? Wir wissen schon, dass exp(x) für jedes reelle x positiv ist. Ferner wird exp(x) mit wachsendem x beliebig groß. Denn nach der Bernoulli’schen Ungleichung ist exp(n) = en ≥ 1+n(e−1) für natürliche n. Entsprechend geht exp(x) (von oben) gegen 0, wenn x gegen −∞ geht. Es ist ja e−x = 1/ex . Sei jetzt y eine beliebige positive reelle Zahl. Dann gibt es ein reelles x0 mit ex0 ≤ y und ein reelles x1 mit ex1 ≥ y. Auf Grund des Zwischenwertsatzes gibt es also ein x ∈ [x0 , x1 ] mit ex = y. Also ist das Bild von exp die Menge aller positiven reellen Zahlen, d.h. R∗+ . Somit ist exp als Abbildung R → R∗+ bijektiv. Und wir können definieren: Definitionen 5.2.11 a) Der natürliche Logarithmus ist die Umkehrabbildung der Exponentialfunktion, d.h. diejenige Abbildung ln : R∗+ → R mit ln ◦ exp = idR und exp ◦ ln = idR∗+ . Man kann auch sagen, der natürliche Logarithmus von x(>=) ist dasjenige (eindeutig bestimmte) y, für welches ey = x ist. b) Seien a, x ∈ R und a > 0, so sei ax := ex ln a definiert. Nach Definition a) ist ja eln a = a, also ex ln a = ax zunächst für x ∈ N, dann für x ∈ Z und schließlich für x ∈ Q. Dies rechtfertigt die Definition b). Theorem 5.2.12 Seien a, b > 0 und x, y ∈ R. Dann gilt: a) ax+y = ax · ay , b) axy = (ax )y , c) (ab)x = ax · bx Beweise diese Regeln selbst. Nicht einmal im Traum darfst Du in diesen Regeln Plus c c mit Mal verwechseln! Beachte auch, dass ab , welches nach Definition gleich a(b ) ist, meist von (ab )c = abc verschieden ist. 5.2. DIE EXPONENTIALFUNKTION 147 Bemerkung 5.2.13 Der natürliche Logarithmus wird häufig auch mit ‘log’ bezeichnet, ganz besonders in Büchern zur Zahlentheorie. Definition 5.2.14 Seien a, x > 0. Der Logarithmus zur Basis a von x ist diejenige reelle Zahl y für die ay = x ist. Er wird mit loga (x) bezeichnet. Bemerkungen 5.2.15 a) Beachte, dass damit ln x = loge (x) ist. b) Für a > 0 ist loga (x) = ln x . ln a Denn nach Definition gilt ln x ln x a ln a = eln(a) ln a = eln x = x . c) Für a, b > 0 folgt aus b) unmittelbar loga (x) ln b = . logb (x) ln a √ 148 KAPITEL 5. WAS BEDEUTET π 2 ? Kapitel 6 Geometrie 6.1 Vorbemerkungen Ohne Zweifel haben für die meisten Menschen die geometrischen Begriffe, wie Punkt, Gerade, Dreieck usw. eine anschauliche Bedeutung. Und seit mindestens zweieinhalb tausend Jahren geht man damit auch mathematisch um. D.h. man beweist geometrische Aussagen, etwa dass die Winkelsumme in jedem Dreieck 180◦ sei, indem man diese Aussage auf eine anschaulich naheliegende (vielleicht sogar selbstverständliche?) Aussage über die Größe der Winkel zurückführt, in denen eine Gerade zwei parallele Geraden schneidet. α α’ g g’ Hier ist g parallel zu g 0 genau dann, wenn α = α0 gilt. Dabei heißen zwei Geraden in einer Ebene genau dann zueinander parallel, wenn sie entweder übereinstimmen oder keinen Punkt gemeinsam haben. Zwei Geraden im Raum heißen zueinander parallel, wenn sie in einer gemeinsamen Ebene liegen und in dieser parallel sind. Die Aussage, die unter der obigen Zeichnung steht, ist mehr oder weniger das berühmte (oder berüchtigte) Parallelenaxiom Euklids, welches von allen seinen Axiomen und Postulaten am wenigsten selbstverständlich erscheint. Aus diesem Axiom folgt, dass die Winkelsumme im Dreieck 180◦ beträgt: 149 150 KAPITEL 6. GEOMETRIE α’ β’ γ α β Wähle g 0 parallel zu g. Dann ist α = α0 und β = β 0 . Daraus ergibt sich α + γ + β = 180◦ 6.1.1 In der euklidischen Geometrie gibt es neben dem Begriff der Kongruenz von Dreiecken (und anderen Figuren) auch den Begriff der Ähnlichkeit. Z.B. sind in der folgenden Zeichnung die Dreiecke A0 B 0 C 0 und AB 00 C 00 zueinander kongruent, sowie beide ähnlich zu dem Dreieck ABC. (Die Längen der Seiten A0 B 0 und AB 00 sind zueinander gleich. Die Seiten B 00 C 00 und BC sind zueinander parallel. Ferner sind die Längenverhältnisse der Seiten AB zu A0 B 0 , BC zu B 0 C 0 und CA zu C 0 A0 einander gleich. C γ A’ α C’ C’’ γ γ β B’ A α β B’’ β B Die Ähnlichkeit zweier Dreiecke kann man auf zweierlei äquivalente Weisen definieren: Einerseits durch die Gleichheit der Längenverhältnisse der Seiten, andererseits durch die Gleichheit entsprechender Winkel. 1) a : a0 = b : b0 = c : c0 oder äquivalent dazu a : b = a0 : b0 , a : c = a0 : c0 2) α = α0 , β = β 0 , weswegen natürlich auch γ = γ 0 ist. Für Vierecke stimmt dies nicht mehr. Meist sind zwei Rechtecke trotz der Gleichheit entsprechender Winkel einander nicht ähnlich. Entsprechendes gilt für zwei Rauten, d.h. Vierecken mit 4 gleichlangen Seiten. Hier sind die Verhältnisse entsprechender Seitenlänge gleich, aber die entsprechenden Winkel meist nicht. Ein Quadrat ist sowohl ein Rechteck wie eine Raute, aber zu den meisten Rechtecken und Rauten nicht ähnlich. 6.1. VORBEMERKUNGEN 151 Die Ähnlichkeit zweier n-Ecke kann man dadurch definieren, dass man sowohl die Gleichheit der Winkel, als auch die der Verhältnisse entsprechender Seitenlängen fordert. 6.1.2 Seien zwei Kreise K1 , K2 mit den Radien r1 bzw r2 und ein Winkel α gegeben. (Dabei sei α zwischen 0 und 180◦ gewählt.) Aus beiden Kreisen schneide einen Sektor heraus der zu dem (gemeinsamen) Winkel α gehört. Dann verhalten sich die Längen l1 und l2 der ausgeschnittenen Teile der Kreislinien zueinander wie r1 zu r2 . ℓ1 α ℓ2 α γ1 γ2 (Versehentlich sind in der Zeichnung die Radien r1 , r2 mit γ1 , γ2 bezeichnet worden.) Dies kann man sich, wie folgt, anschaulich klar machen. Zerlege den Winkel α in n Teilwinkel: α = α1 + · · · αn . Daraus ergeben sich den beiden Kreislinienstücken einbeschriebene Streckenzüge wie in folgendem Bild: T14 α4 α3 α2 M1 γ1 α1 T13 T12 T11 T10 α4 α3 M2 α2 γ2 α1 T24 T23 T22 T21 T20 152 KAPITEL 6. GEOMETRIE Dann sind je zwei Dreiecke, deren Ecken der Mittelpunkt des jeweiligen Kreises und analoge benachbarte Eckpunkte des approximierenden Streckenzuges sind, einander ähnlich. (Das Dreieck M1 T1i T1,i+1 ist ähnlich zum Dreieck M2 T2i T2,i+1 .) Die Längen der Streckenzüge verhalten sich deshalb wie r1 zu r2 . Die Länge einer Kurve kann man gut als Limes der Längen einbeschriebener Streckenzüge definieren, wenn man die Längen der einzelnen Strecken gegen 0 gehen lässt. Es ergibt sich die obige Behauptung. 6.1.3 Bemerkung zur Winkelmessung. Vorläufig betrachten wir Winkel zwischen Strahlen (d.h. Halbgeraden) mit dem gleichen Anfangspunkt mit Werten im Intervall [0◦ , 180◦ ]. Die Wahl des Grades ◦ , derart der rechte Winkel ein solcher von 90◦ ist, ist natürlich willkürlich, hat aber den Vorteil, dass ein Innenwinkel eines regelmäßigen n-ecks (genau) dann ganzzahlig in Bezug auf den Grad ist, wenn n einer der vielen Teiler von 360 = 23 · 32 · 5 ist. Mehr und mehr werden wir Winkel auch in ‘Radiant’ angeben, d.h. als Bogenlänge des (kleineren) Teiles der Einheitskreislinie um den gemeinsamen Anfangspunktes der beiden Strahlen, den dieselben ausschneiden. Per definitionem ist der Einheitskreis der Kreis, dessen Radius gleich einer Längeneinheit ist. Wegen Absatz 6.1.2 ist dieses Winkelmaß unabhängig von der Wahl der Längeneinheit. α 1 Winkel als Länge eines Kreisbogens 6.1.4 Gauss war sich, wie einige seiner Zeitgenossen, darüber im Klaren, dass man auch eine Geometrie entwickeln kann, in der Euklids Parallelenaxiom ungültig ist. Wenn man Lichtstrahlen (im Vakuum) als gerade ansieht, ist die Geometrie – wie die Physiker heute wissen – nicht euklidisch. Manche Philosophen erheben gegenüber dieser Sicht der meisten heutigen Physiker den Einwand, dass man, bevor man überhaupt messen kann, wissen muss, was dieses Messen bedeutet. (Wie kann man z.B. definieren, dass zwei Punkte auf einem Planeten in einer entfernten Galaxie einen Abstand von 1 km haben?) Dies scheint sehr schwierig zu sein, wenn man nicht von der euklidischen Geometrie ausgeht, die zudem für alle Menschen die anschaulichste ist. 6.2. KOORDINATEN 153 Mathematikerinnen und Mathematiker möchten sich in der Regel aus solcherlei Diskussionen heraushalten. Sie legen durch Axiome fest, von welcher Geometrie sie gerade sprechen. Ich will in diesem Buch nur von der aus dem Schulunterricht bekannten euklidischen Geometrie handeln, in der Euklids Parallelenaxiom gilt. In diesem Buch ist zu wenig Platz für eine strenge moderne Einführung in die Geometrie, sei sie axiomatisch [Hilbert] oder nicht [Lorenzen]. Mein eigentliches Anliegen ist weniger, Dir die klassische Geometrie – wie sie schon zum großen Teil in Euklids berühmten Elementen“ steht – nahezubringen, sondern insbesondere ihren ” Zusammenhang mit der Linearen Algebra, dem Skalarprodukt und den Kreisfunktionen (Sinus, Cosinus) zu erklären. Drei klassisch-geometrische Sätze über Dreiecke, die erst nach 1700 gefunden wurden, will ich Dir aber nicht vorenthalten. 6.2 Koordinaten 6.2.1 Eine Gerade kann man als Zahlengerade auffassen, d.h. mit der Menge der reellen Zahlen identifizieren. Dies ist natürlich auf viele verschiedene Weise möglich. Aber sobald man einen Punkt als Nullpunkt und einen anderen als Einspunkt festglegt hat, ist diese Identifizierung eindeutig. (Natürlich verlangt man dabei, dass z.B. die Punkte 1 und 2 denselben Abstand haben, wie die Punkte 0 und 1 und dass der Punkt 1 zwischen den Punkten 0 und 2 liegt, usw., usw. – alles wie Du es gewohnt bist. Es gibt ja auch sogenannte logarithmische Skalen, wo man sich die positiven Zahlen so auf einer Geraden vorstellt, dass die Abstände von 1 und 2, von 2 und 4, von 4 und 8, sowie von 12 und 1 usw. alle einander gleich sind. Diese lassen wir hier außer Betracht.) –π –3 2 –2 –1 0 1 2 3 Eine Gerade in der (einer) Ebene oder im Raum, die ich auf solche Weise mit der R identifiziert habe, will ich eine Zahlengerade nennen. 6.2.2 So wie man eine Gerade mit R identifizieren kann, kann man eine Ebene mit R2 , der Menge aller Paare reeller Zahlen, identifizieren. Wie Du sicher weißt, muss man dazu ein Koordinatensystem in die Ebene legen. Dieses besteht aus zwei Zahlengeraden, die genau einen gemeinsamen Punkt haben, der auf beiden Zahlengeraden der Nullpunkt ist. 154 KAPITEL 6. GEOMETRIE (3,3) (0,1) (–1,0) (1,0) (0,1) (3,0) (–2,0) (2,1) O (1,0) (2,0) (0,–1) (0,–3) Im ersten Bild habe ich die Koordinatenachsen senkrecht (orthogonal) zueinander und zudem die beiden Einspunkte auf den Koordinatenachsen so gewählt, dass ihre Abstände vom gemeinsamen Nullpunkt, dem (Koordinaten)-Ursprung gleichgroß sind. Ein solches Koordinatensystem wird auch ein orthonormales Koordinatensystem genannt. Dabei wird meist noch verlangt, dass die Abstände der Einspunkte vom Ursprung gleich einer gegebenen Einheitslänge sind. Eine allgemeinere Art eines Koordinatensystems wird im zweite Bild angedeutet. In der Regel verwende ich orthonormale Koordinatensysteme. 6.2.3 Man kann so weiter machen und den Raum mit dem R3 identifizieren, indem man ein Koordinatensystem mit drei Achsen wählt, die sich in einem gemeinsamen Punkt schneiden, aber nicht in einer gemeinsamen Ebene liegen. In diesem Buch will ich mich auf die Geometrie der Ebene konzentrieren. Neben der Geometrie im Raum und der in der Ebene gibt es auch eine etwas magere Geometrie in der Geraden. Eine Zahlengerade ist sozusagen eine Gerade mit einem Koordinatensystem, bestehend aus einer Koordinatenachse. Jeder Punkt hat dort eine einzige Koordinate. 6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN 6.3 155 Geometrische und algebraische Vektoren Definitionen 6.3.1 a) Ein Pfeil ist eine gerichtete Strecke in (der Geraden,) der Ebene oder im Raum. Eine gerichtete Strecke ist eine Strecke, deren Endpunkte man nicht als gleichberechtigt ansieht, sondern einen als Anfangspunkt, den anderer als Endpunkt bezeichnet. Wenn man will, kann man einen Pfeil als Paar dieser Punkte definieren. Pfeile der Länge 0, also Punktepaare der Form (a, a) wollen wir nicht ausschließen! b) Pfeile (a, b), (a0 , b0 ) heißen zueinander parallel verschoben, wenn entweder (a, b) = (a0 , b0 ) ist oder sowohl 1. die Gerade durch a, b zur Geraden durch a0 , b0 parallel ist und die Strecke von a nach b gleichlang der von a0 nach b0 ist, als auch 2. dasselbe für die Paare (a, a0 ) und (b, b0 ) gilt. (Achtung: Ich habe hier mit a, b, . . . Punkte und nicht Zahlen bezeichnet.) Beispiele: b b’ a a’ oder a b a’ b’ Die Punkte a, b, b0 , a0 bilden also ein Parallelogramm, das allerdings auch ausgeartet sein, d.h. ganz in einer Geraden liegen kann. (Bei Pfeilen innerhalb einer Geraden ist es immer ausgeartet!) Nur im nichtausgearteten Fall kann man in 1. und 2. auf die Gleichheit der Längen verzichten. (Insbesondere sind ie Pfeile der Länge 0, also Punktepaare der Form (a, a) zueinander parallel verschoben!) Die o.a. Bedingung 2. kann man auch wie folgt verstehen: ‘(a, b) und (a0 , b0 ) gehen in die gleiche Richtung’. m m0 , 0 einander gleich nennt, wenn mn0 = m0 n gilt, so nennt man n n zwei Pfeile (a, b), (a0 , b0 ) den gleichen Vektor, wenn sie zueinander parallelverschoben sind. c) So wie man zwei Brüche d) Ein Vektor ist also eine Äquivalenzklasse von Pfeilen bezüglich der Äquivalenzrelation ‘parallelverschoben’. 156 KAPITEL 6. GEOMETRIE 6.3.2 a) Sei ein Ursprungspunkt O in der Ebene oder im Raum festgelegt. Jeder Pfeil in der Ebene ist parallelverschoben zu genau einem solchen, dessen Anfangspunkt O ist. (Du darfst Dir bei dem Buchstaben O die Null denken, aber auch den ersten Buchstaben des lateinischen Wortes ’origo’, auf deutsch ’Ursprung’.) b) Die Menge der Pfeile von O aus bilden ein Repräsentantensystem für die Menge der Vektoren, d.h. der Äquivalenzklassen von Pfeilen. Die Menge aller geometrischen Vektoren steht also in bijektiver Beziehung zu der Menge der Pfeile von O aus, d.h.mit Anfangspunkt O. Somit wollen wir je nach Nützlichkeit unter einem (geometrischen) Vektor mal eine Äquivalenzklasse von Pfeilen bezüglich der Relation parallelverschoben“, mal einen Pfeil von O aus verstehen. ” Letztere Möglichkeit setzt allerdings voraus, dass vorher ein Ursprungspunkt O festgelegt ist. c) Wenn man einen Ursprungspunkt O festgelegt hat, entsprechen den Pfeilen von O aus, also den geometrischen Vektoren, in bijektiver Weise die Punkte (der Geraden), der Ebene (bzw. des Raumes). Es entspricht nämlich jedem Punkt a der Pfeil (O, a) und jedem Pfeil (O, a) der Punkt a. Allerdings heißt das nicht, dass Punkte und Vektoren im Grunde dasselbe sind. Es hat ja keinen geometrischen Sinn, zwei Punkte zu addieren oder einen Punkt mit einer reellen Zahl zu multiplizieren, während das für Vektoren sinnvoll ist. Siehe unten! Vor Allem ist die Entsprechung von Punkten und Vektoren davon abhängig, welchen Ursprungspunkt man gewählt hat. 6.3.3 Algebraische Vektoren. Bereits oben, nach der Einführung des cartesischen Produktes, haben wir von der Menge Rn der n-tupel reeeller Zahlen gesprochen, also von 1-tupel (a1 ) 2-tupel (Paar) (a1 , a2 ) 3-tupel (Tripel) (a1 , a2 , a3 ) 4-tupel (Quadrupel) (a1 , a2 , a3 , a4 ) .. . allgemein n-tupel (a1 , . . . , an ) mit ai ∈ R. Nichts hindert uns allerdings daran, die ai als Elemente eines beliebigen gemeinsamen Körpers zu wählen. (Hier ist der Name ‘Körper’ im algebraischen Sinne gemeint, also als Rechenbereich.) Sie noch allgemeiner als Elemente eines beliebigen Ringes zu wählen, ist auch nützlich. Aber soweit will ich in diesem Buch nicht gehen. Wenn man die Gerade, die Ebene, den Raum mit einem Koordinatensystem versehen hat wird jeder Punkt der Geraden, der Ebene, des Raumes durch ein Element des Rn mit n = 1, bzw. n = 2, bzw. n = 3 beschrieben. Da jeder Punkt nach Wahl eines Koordinatensystems (bereits nach Wahl des Ursprungs) einem Vektor entspricht, entspricht auch jeder Vektor einem Element aus Rn (n = 1, 2, 3). Man hat also (nach Wahl eines Koordinatensystems) im 1-, bzw. 2-, bzw. 3-dimensionalen Raum (=Gerade, bzw. Ebene, bzw. Raum) folgende bijektive Beziehungen: Punkte ↔ Vektoren ↔ n-tupel (n = 1, 2, 3) Man bezeichnet deshalb auch n-tupel reeller Zahlen als Vektoren. Dasselbe gilt für die Elemente eines K n , wo K ein beliebiger Körper ist. Ich möchte in diesen Fällen von algebraischen Vektoren reden. 6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN 157 6.3.4 Geometrische Vektoren kann man addieren. Seien v, w Vektoren und v durch die gerichtete Strecke (a, b) repräsentiert. Dann kann man w durch eine gerichtete Strecke repräsentieren, deren Anfangspunkt b ist. Sei also w durch (b, c) gegeben. Dann definiert man v + w durch die gerichtete Strecke (a, c). Will man die entsprechende Summe im Bereich der Pfeile mit Anfangspunkt O definieren, muss man in der Regel ein Parallelogramm konstruieren. (Denke an das ‘Parallelogramm der Kräfte’.) v+w w v Man kann auch einen geometrischen Vektor v mit einer reellen Zahl λ multiplizieren, indem man ihn entsprechend verlängert oder schrumpft, und, falls λ < 0 ist, noch die Richtung umkehrt“. ” Eine geometrische Konstruktion ergibt sich für v 6= 0 wie folgt: Repräsentiere v durch die gerichtete Strecke (O, b). Wähle eine Zahlengerade Z so, dass ihr Nullpunkt mit O zusammenfällt, der Punkt b, der ja nach Voraussetzung nicht mit O zusammenfällt aber nicht auf ihr liegt. Ziehe die Gerade durch 1 und b und die Parallele zu dieser durch den Punkt λ auf der Zahlengeraden. Diese Parallele schneidet die Gerade durch 0 und b in einem Punkt c, Der Vektor λv wird dann durch den Pfeil (0, c) gegeben. (Denke an den Strahlensatz.) Ist b = O, d.h. v der Nullvektor, so ist auch λv der Nullvektor. λ 1 O λ∙(O,b) = (O,c) b c 6.3.5 Orthogonalprojektion. Sei in der Ebene (bzw. im Raum) R eine Zahlengerade G gegeben. Dann kann man die Ebene (bzw. den Raum), aufgefasst als Menge ihrer (seiner) Punkte, auf die Gerade G orthogonal projizieren. a O p(a) 158 KAPITEL 6. GEOMETRIE Die Orthogonalprojektion auf G ist also eine Abbildung p : R → G, wo R die Ebene (bzw. den Raum) bezeichnet. Und zwar ist p(a) der eindeutig bestimmte Punkt auf G, dessen Verbindungsgerade mit a auf G senkrecht steht. (Für a ∈ G gilt p(a) = a.) Für Pfeile und Vektoren in der Ebene (bzw. im Raum) gelten folgende beiden Sätze: Satz 6.3.6 Seien a, b, a0 , b ∈ R so dass (a, b) parallel verschoben zu (a0 , b0 ) ist, so ist p(b) − p(a) = p(b0 ) − p(a0 ). a O v p(a) b v a’ p(b) p(a’) b’ p(b’) Dieser Satz bedeutet, dass durch die Abbildung p auch eine Abbildung p0 : V → W definiert ist! Dabei bezeichnet V die Menge der Vektoren in der Ebene (bzw. im Raum) sowie W die Menge der Vektoren in der Geraden G. Mit den genannten Bezeichnungen haben wir Satz 6.3.7 Seien λ ∈ R, v, v 0 ∈ V . Dann ist p0 (v + v 0 ) = p0 (v) + p0 (v 0 ) und p0 (λv) = λp0 (v). λv v p’(v) p’(λv) v w p’(v) p’(w) p’(v+w) Definitionen 6.3.8 Sei K ein Körper, n ≥ 1 eine natürliche Zahl. a) Man kann je zwei Elemente aus K n addieren: (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) (Die i-te Komponente der Summe ist gleich der Summe der i-ten Komponenten der Summanden, und zwar für jedes ganze i mit 1 ≤ i ≤ n.) b) Ist λ ∈ K, so definiert man λ(a1 , . . . , an ) := (λa1 , . . . , λan ) . 6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN 159 6.3.9 Wir legen (für n = 1, 2, 3 in den n-dimensionalen Raum R ein orthonormales Koordinatensystem und betrachten einen geometrischen Vektor als Pfeil von O aus und nennen die Koordinaten seines Endpunktes die Koordinaten des Vektors. Die Koordinaten eines Vektors sind nun einfach die Projektionen seines Endpunktes auf die Koordinatenachsen. Deshalb folgt aus Satz 6.3.7 die Erkenntnis, dass die bijektive Beziehung zwischen den geometrischen Vektoren von R und den algebraischen Vektoren aus dem R1 , R2 , bzw. R3 mit der Addition und auch mit der Multiplikation mit Skalaren verträglich ist. D.h. Wenn (für n = 1, 2, 3) den Vektoren v, w die n-tupel (a1 , . . . , an ), bzw. (b1 , . . . , bn ) entsprechen, so entspricht dem geometrischen Vektor v + w das n-tupel (a1 + b1 , . . . , an + bn ) und dem geometrischen Vektor λv das n-tupel (λa1 , . . . , λan ). Satz 6.3.10 Seien v, v1 , v2 , v3 entweder geometrische Vektoren in der Ebene (dem Raum) oder Elemente eines K n (mit einem Körper K); seien ferner λ, µ ∈ K. (Im Falle geometrischer Vektoren sei K = R.) Dann gilt a) v1 + v2 = v2 + v1 , b) (v1 + v2 ) + v3 = v1 + (v2 + v3 ) c) es gibt genau einen geometrischen Vektor, bzw. ein n-tupel o mit v + o = v; Bezeichnungen: neutrales Element, Nullvektor d) zu jedem v gibt es genau ein −v mit (−v) + v = o. Man nennt −v das additiv Inverse von v. e) 1v = v f ) (λµ)v = λ(µv) g) (λ + µ)v = λv + µv h) λ(v1 + v2 ) = λv1 + λv2 Beweis: Der Fall algebraischer Vektoren ist nahezu trivial! Der Fall geometrischer Vektoren ergibt sich hieraus mit Hilfe des Abschnittes 6.3.9. Noch einmal: Du solltest Dir darüber im Klaren sein, dass geometrische Vektoren in der Ebene (im Raum) und Elemente des R2 (bzw. R3 ) doch nicht so ganz dasselbe sind. Man muss zunächst Koordinatensystem festlegen, bevor man die oben angegebene bijektive Beziehung angeben kann. Definition 6.3.11 Sei K ein Körper (im algebraischen Sinn). Ein K-Vektorraum ist eine Menge V zusammen mit zwei Verknüpfungen, einer Addition ‘+’ innerhalb V und einer Multiplikation ‘(λ, v) 7→ λv’, wo λ ∈ K, v ∈ V und λv ∈ V ist, derart dass die im Satz 6.3.10 genannten Rechenregeln a) bis h) gelten. (Zu λ ∈ K, v, w ∈ V sind v + w ∈ V und λv ∈ V definiert.) 160 KAPITEL 6. GEOMETRIE Beispiele 6.3.12 a) Beispiele von R-Vektorräumen sind die Mengen der geometrischen Vektoren in der Geraden, in der Ebene, im Raum. b) Jeder K n ist, wie oben beschrieben, ein K-Vektorraum. c) Es gibt K-Vektorräume, die echt von allen K n verschieden, d.h. zu keinem K n isomorf sind. (Den Begriff isomorf“ wirst Du bald kennenlernen.) Zum Beispiel bilden die (unendlichen) ” Folgen von Elementen aus K einen Vektorraum, der in gewissem Sinne zu groß ist, um mit einem K n verglichen zu werden. d) Den Körper R kann man als Q-Vektorraum auffassen, indem man von allen in R möglichen Multiplikationen nur diejenigen betrachtet, wo der erste Faktor aus Q ist. Auch dieser Vektorraum ist zu keinem Qn mit n ∈ N isomorf. Wir wissen ja, dass Qn (für n ∈ N) im Gegensatz zu R abzählbar ist. e) Sind K, L Körper mit K ⊂ L, und sind die Verknüpfungen in K dieselben wie in L, d.h. Einschränkungen der letzteren, so nennt man K einen Teilkörper (auch Unterkörper) von L und L einen Erweiterungskörper (auch Oberkörper) von K. Immer wenn L ein Erweiterungskörper von K ist, kann man L auch als K-Vektorraum auffassen. Ist L ein endlicher Körper (d.h. ein solcher, der nur endlich viele Elemente hat), so kann man folgendes zeigen: Es gibt eine Primzahl p und einen Unterkörper K von L, der isomorf zu Z/(p) ist. Da L ein Erweiterungskörper von K ist, ist L als K-Vektorraum isomorf zu K n mit einer positiven ganzen Zahl n, hat also pn Elemente. Ferner gibt es zu jeder Primzahlpotenz pn , wo n ≥ 1 ganz ist, einen Körper aus pn Elementen. Es gibt also keinen Körper von 6 oder 10 Elementen; aber es gibt solche von 2, 3, 4, 5, 7, 8 oder 9 Elementen, usw. Ich will hierauf nicht weiter eingehen. Bemerkung 6.3.13 Das neutrale Element der Addition in einem Vektorraum wird häufig mit 0 anstelle von o bezeichnet, d.h. demselben Symbol, welches das neutrale Element der Addition in einem Körper bezeichnet. Insbesondere bezeichnet 0 in K n das n-tupel (0, . . . , 0). Genau genommen ist das eine missbräuchliche Bezeichnung. Gewöhne Dich daran, aufzupassen, von welcher 0 die Rede ist. Übrigens ist die 0 in einem Vektorraum, ebenso wie in einem Ring immer das einzige Element x, welches die Gleichung x+x = x erfüllt. Das liegt an der Existenz additiv Inverser. (Du erinnerst Dich sicher, dass die 1 in einem Körper nicht das einzige Element x ist, welches x · x = x erfüllt. Die 0 tut’s ja auch. In einem Ring kann es noch mehr solche Elemente geben. Wenn etwa K ein Körper ist, so ist K × K bezüglich der komponentenweisen Addition und Multiplikation ein Ring, in dem jedes der vier Elemente (0, 0), (1, 0), (0, 1) und (1, 1) die Gleichung x · x = x erfüllt.) Definition 6.3.14 Sei V ein K-Vektorraum. Ein Teil(vektor)raum (auch Untervektorraum von V ist eine Teilmenge U von V , die bezüglich derselben Verknüpfungen, die in V gelten, wieder ein Vektorraum ist. 6.3. GEOMETRISCHE UND ALGEBRAISCHE VEKTOREN 161 Dazu genügt natürlich, dass U gegenüber den Verknüpfungen von V abgeschlossen ist. Und dafür reicht das Folgende: (1) o ∈ U, (2) u, v ∈ U ⇒ u + v ∈ U, (3)u ∈ U, λ ∈ K ⇒ λu ∈ U Da (−1)u = −u ist folgt nämlich ‘u ∈ U ⇒ −u ∈ U ’ aus (3). Beispiele 6.3.15 a) Wir wollen die Teilräume des Vektorraums V der Ebene E bestimmen. Diese wollen wir auch geometrisch verstehen. Deshalb versehen wir die Ebene mit einem Ursprungspunkt O und repräsentieren die Vektoren durch Pfeile mit dem Anfang O und beschreiben sie letztendlich durch den Endpunkt dieser Pfeile. Insbesondere entspricht dabei der Nullvektor dem Punkt O. Natürlich sind {0} und V Teilräume von V . Das sind die trivialen Fälle. Sei v ∈ V − {0} gegeben durch den Pfeil (O, a) mit a 6= O, entspreche also dem Punkt a. Dann ist λv gegeben durch durch den Pfeil λ(O, a), dessen Endpunkt auf der Geraden durch O, a liegt. Die Menge Rv := {λv | λ ∈ R} ein Teilraum von V und die den Vektoren aus Rv entsprechenden Punkte sind alle Punkte auf der Geraden durch O, a. Die auf diese Weise erhaltenen Teilräume sind also die Geraden durch O. Ferner muss jeder jeder Teilraum, der v enthält, den Teilraum Rv umfassen. Jetzt wollen wir sehen, dass es außer den genannten keine weiteren Teilvektorräume von V gibt. Sei U ein beliebiger Teilraum. Gibt es keinen von 0 verschiedenen Vektor in U , so ist U = {0}. Ansonsten sei v ∈ U − {0}. Dann ist Rv ⊂ U . Angenommen U 6= Rv, dann gibt es ein w ∈ U mit w 6= λv für alle λ ∈ R. Dann umfasst U die Vereinigung zweier verschiedener Geraden (nachdem wir Vektoren mit Punkten identifiziert haben). Geometrisch siehst Du dann leicht, dass jeder Vektor von der Ebene sich in der Form λv + µw mit λ, µ ∈ R schreiben lässt, also zu U gehört. Dabei dürfen λ, µ auch negativ sein. b) Der Vektorraum des Raumes hat genau die folgenden Teilräume. Nachdem man ihn durch Festlegung eines Ursprungs O mit dem Raum identifiziert hat, ergeben sich folgende Teilräume: {0} = O, die Geraden durch O, die Ebenen durch O, der ganze Raum. 6.3.16 Es sind vor allem zwei Gründe, weshalb ich mich bemüht habe, die Teilräume (Untervektorräume) eines K 2 zu bestimmen: 1. Du sollst erkennen, dass Teilräume keineswegs ‘wilde’ Teilmengen sind, sondern (z. B. für K = R, n = 2 oder n = 3) einfachen geometrischen Gegenständen entsprechen: Punkt, Gerade, Ebene. 2. Du sollst erst gar nicht auf die leider häufig geglaubte Idee kommen, es gäbe außer den trivialen Teilräumen des K 2 nur noch die beiden folgenden: {(a, 0) | a ∈ K} und {(0, b) | b ∈ K}. Wir haben ja gesehen, dass der R2 unendlich viele Teilräume hat, da es in der Eben unendlich viele Geraden durch einen Punkt gibt. Sogar der F22 hat außer den beiden trivialen noch 3 (und nicht nur 2) weitere Teilräume, nämlich: {(0, 0), (1, 0)}, {(0, 0), (1, 1)}, {(0, 0), (0, 1)} 162 KAPITEL 6. GEOMETRIE AUFGABE Betrachte Z2 als Teilmenge des Vektorraums R2 , der mit der Ebene identifiziert sei. Für welche Punkte aus Z2 liegt auf ihrer Verbindungsstrecke mit dem Ursprung (0, 0) außer den Endpunkten kein weiterer Punkt aus Z2 ? 6.4 Das Skalarprodukt Wir wollen wollen zu je zwei Vektoren v, w im Vektorraum V der Ebene (oder auch des Raumes) eine reelle Zahl als ihr sogenanntes Skalarprodukt hv, wi definieren, das sowohl von den Längen der beiden Vektoren v und w, als auch von dem Winkel, den sie einschließen, abhängt. (Der Name Skalarprodukt kommt daher, dass das Ergebnis des Skalarproduktes ein Skalar, d.h. eine reelle Zahl, und kein Vektor ist. Reelle Zahlen stellt man sich auf einer ‘Skala’ vor.) 6.4.1 Wir legen in der Ebene (oder dem Raum) eine Einheitslänge (d.h. eine Längeneinheit) fest. Jede Strecke hat dann eine reelle Zahl als Länge, die man in diesem Längenmaß ausdrücken kann. Das gilt dann natürlich auch für gerichtete Strecken. (Man vergesse einfach die Richtung.) Bei Parallelverschiebungändert sich die Länge nicht. Also besitzt dann jeder Vektor v in der Ebene (Raum, Gerade) eine Länge, die ich mit |v| bezeichnen will. Auf jeder Zahlengerade, die wir betrachten, sei dann natürlich der Abstand zwischen den Punkten 0 und 1 gleich 1. Definition 6.4.2 Für einen Winkel α ∈ [0, π] definieren wir seinen Cosinus cos α wie folgt: α –1 cos α 0 1 Diese Definition ist insofern vorläufig, als wir später cos x für beliebige x ∈ R definieren werden. Für den Cosinus werden sich dabei keine Probleme ergeben. (Traditionell schreibt man cos α statt cos(α).) Bemerkungen 6.4.3 a) Es gilt cos 0 = 1, cos 90◦ = cos(π/2) = 0, cos 180◦ = cos π = −1 . b) Aus 0 ≤ α < β ≤ π folgt 1 ≥ cos α > cos β ≥ −1. Insbesondere ist die Abbildung cos : [0, π] → [−1, 1] injektiv. Wegen des Zwischenwertsatzes ist sie auch bijektiv. c) cos α = − cos(π − α). d) Der Funktionsgraf sieht, wie folgt, aus: 6.4. DAS SKALARPRODUKT 163 1 0 π/3 π/2 2 π/3 π –1 Definition 6.4.4 Mit obigen Bezeichnungen sei definiert: Sind v, w beide vom Nullvektor verschieden, kann man von dem Winkel α sprechen, den v und w einschließen. Dann sei ihr Skalarprodukt hv, wi definiert durch hv, wi := |v| · |w| · cos α . Ist v = 0 oder w = 0, so gelte dieselbe Formel mit einem beliebigen α ∈ [0, π]. In diesem Fall ergibt sich hv, wi = 0 unabhängig von dem gewählten α. 6.4.5 Eigenschaften. a) hv, wi = hw, vi. b) hv, vi = |v|2 . c) hv, wi = 0 ⇐⇒ v⊥w. Dabei schreiben wir v⊥w, wenn v senkrecht auf w steht, oder einer beiden Vektoren gleich 0 ist. d) hv, λwi = λhv, wi. Dies ist zunächst klar für λ ≥ 0. Ist λ < 0 und α der von v, w eingeschlossene Winkel, so ist π − α der von v, λw eingeschlossene Winkel. Die Aussage folgt dann, da cos(π − α) = − cos α ist. Eine weitere Eigenschaft des Skalarproduktes ist die Folgende: Satz 6.4.6 Seien v, w, w0 Vektoren in der Ebene (oder im Raum). Dann gilt hv, w + w0 i = hv, wi + hv, w0 i . Beweis: Da im Falle v = 0 die Behauptung trivial ist, sei im Folgenden v 6= 0. Betrachte die Vektoren als Pfeile mit einem gemeinsamen Anfangspunkt O. Lege eine Zahlengerade G so durch den Pfeil v, dass O = 0 und der Endpunkt von v gleich der Zahl |v|, also insbesondere positiv ist. Sei p : V → G die Orthogonalprojektion. (V ist der Vektorraum der Ebene, bzw. des Raumes.) Für einen Vektor w, der mit v den Winkel α einschließt, gilt dann: p(w) wird durch den Pfeil (0, |w| cos α) gegeben, d.h. der Vektor p(w) entspricht als Punkt auf der Zahlengerade G der Zahl |w| cos α, dem Produkt der letzten beiden Faktoren in |v| · |w| · cos α = hv, w, i. 164 KAPITEL 6. GEOMETRIE w α v |v| |w|·cos α Da p die Eigenschaft p(w + w0 ) = p(w) + p(w0 ) hat, folgt die Behauptung des Satzes. 6.4.7 Satz des Pythagoras. Wir wählen in der Ebene eine Basis b1 , b2 mit |b1 | = |b2 | = 1 und b1 ⊥b2 , d.h. eine Orthonormalbasis. Im Raum wählen wir eine Basis b1 , b2 , b3 mit |bi | = 1 und b1 ⊥b2 ⊥b3 ⊥b1 . Dann gilt 1 für i = j hbi , bj i = δij := 0 für i 6= j also hλ1 b1 + λ2 b2 , µ1 b1 + µ2 b2 i = λ1 µ1 + λ2 µ2 (bzw. im Raum hλ1 b1 + λ2 b2 + λ3 b3 , µ1 b1 + µ2 b2 + µ3 b3 i = λ1 µ1 + λ2 µ2 + λ3 µ3 .) Es folgt der Satz des Pythagoras: Theorem 6.4.8 |λb1 + µb2 |2 = λ2 + µ2 . Ist dies wirklich der Satz des Pythagoras? Mache Dir das klar! Im 3-dimensionalen erhält man: |λb1 +µb2 +νb3 |2 = λ2 +µ2 +ν 2 . Das Quadrat über der Diagonale eines Quaders ist die Summe der Quadrate über den Kanten, die von einem gemeinasamen Eckpunkt aus gehen. Beachte, dass wir das Skalarprodukt der Vektoren λ1 b1 +λ2 b2 +λ3 b3 und µ1 b1 +µ2 b2 +µ3 b3 nicht etwa als λ1 µ1 + λ2 µ2 + λ3 µ3 definiert haben, sondern diese Identität aus einer geometrischen Definition des Skalarproduktes gefolgert haben! AUFGABE Beweise nachfolgenden Satz von Euklid als Korollar zum Satz des Pythagoras. Sei ABC ein rechtwinkliges Dreieck mit dem rechten Winkel bei C und D der Fußpunkt der C-Höhe, d.h. des Lotes von C auf AB. Da α und β spitz sind, liegt P zwischen A und B. Sei s := l(AP ), t := l(BP ), h := l(CP ). Dann gilt st = h2 , sc = b2 und tc = a2 . 6.5. LINEARE ABBILDUNGEN 6.5 165 Lineare Abbildungen Definition 6.5.1 Seien W, W 0 Vektorräume über einem Körper K. Eine Abbildung f : W → W heißt linear, wenn folgende beiden Bedingungen erfüllt sind: (i) f (v + w) = f (v) + f (w) und (ii) f (λw) = λf (w) für v, w ∈ W1 , λ ∈ K. Du kannst diese Bedingungen auch zu (iii) f (λv + µw) = λf (v) + µf (w) zusammenfassen. Bemerkungen 6.5.2 a) Ist f : W → W 0 linear und 0 der Nullvektor in W , sowie 00 derjenige von W 0 , so gilt f (0) = 00 . Denn es ist 0 = 0 + 0, folglich f (0) = f (0 + 0) = f (0) + f (0). Wenn man in der Gleichung f (0) = f (0) + f (0) auf beiden Seiten −f (0) addiert, erhält man 00 = f (0). (Zu diesem Beweis wurde nur die Eigenschaft (i) einer linearen Abbildung benutzt.) b) Wenn f linear ist, gilt f (−v) = −f (v). Denn f (v) + f (−v) = f (v − v) = f (0) = 00 , und aus f (v) + f (−v) = 00 folgt f (−v) = f (v). c) Seien f : W → W 0 und g : W 0 → W 00 lineare Abbildungen von Vektorräumen. Dann ist auch ihre Verkettung g ◦f linear. Wenn Dir das nicht klar ist, musst Du es nachrechnen. d) Sei f : W → W 0 eine bijektive lineare Abbildung. Dann ist auch die Umkehrabbildung f −1 : W 0 → W linear. Seien nämlich v 0 , w0 ∈ W 0 und v, w ∈ W die eindeutig bestimmten Elemente von W mit f (v) = v 0 , f (w) = w0 , d.h. (∗) f −1 (v 0 ) = v, f −1 (w0 ) = w. Da f linear ist, gilt f (λv + µw) = λf (v) + µf (w) = λv 0 + µw0 . Nach Definition von f −1 und wegen (∗) ist also f −1 (λv 0 + µw0 ) = λv + µw = λf −1 (v 0 ) + µf −1 (w0 ). Definitionen 6.5.3 a) Eine bijektive lineare Abbildung zwischen Vektorräumen f : W → W 0 heißt ein Isomorfismus. b) Vektorräume W, W 0 heißen zueinander isomorf und man schreibt W ∼ = W 0 , wenn es einen 0 Isomorfismus f : W → W gibt. Da nach obigen Bemerkungen mit f auch f −1 ein Isomorfismus ist, ist die Isomorfie (d.h. die Eigenschaft, isomorf zu sein) ein symmetrischer Begriff, d.h. W ∼ = W 0 ⇐⇒ W 0 ∼ = W. Da auch die Verkettung bijektiver Abbildungen wieder bijektiv ist und die Verkettung linearer Abbldungen wieder linear ist, gilt auch die Implikation W ∼ = W 0, W 0 ∼ = W 00 =⇒ W ∼ = W 00 . 6.5.4 Versieh für n = 1, 2, 3 den n-dimensionalen Raum R mit einem Koordinaatensystem. Betrachte den Vektorraum V dieses Raumes. Vermöge des gewählten Koordinatensystems wird jedes v ∈ V durch ein n-tupel reeller Zahlen beschrieben. Den Inhalt des Abschnittes 6.3.9 kann man auch so ausdrücken: Die Abbildung V → Rn , die jedem geometrischen Vektor in R das zugehörige n-tupel zuordnet, ist linear! Insbesondere ist die Abbildung V → R, die jedem Vektor seine erste, bzw. zweite, bzw. dritte Koordinate zuordnet, linear. 166 KAPITEL 6. GEOMETRIE 6.5.5 Lineare Abbildungen und Matrizen. Sei V der Vektorraum der Ebene und sei eine Basis (e1 , e2 ) desselben ausgewählt. Wie gerade gesehen, entspricht dann jeder Vektor von V einem (reellen) Zahlenpaar, nämlich dem Vektor λ1 e1 + λ2 e2 das Zahlenpaar (λ1 , λ2 ) (die Koordinaten). Aus Gründen der Notation wollen wir dieses Zahlenpaar als ‘Spalte’ schreiben: λ1 λ2 Ich werde die Vektor-Zahlenpaar-Entsprechung wie folgt schreiben λ1 λ1 e1 + λ2 e2 ↔ λ2 Sei jetzt f : V → V eine lineare Abbildung mit f (e1 ) = a11 e1 + a21 e2 ↔ f (e2 ) = a12 e1 + a22 e2 ↔ a11 a21 a12 a22 , , Da f durch die Bilder f (e1 ), f (e2 ) bereits bestimmt ist, wird f auch durch die Matrix a11 a12 a21 a22 bestimmt, deren Spalten die den Vektoren f (e1 ), f (e2 ) entsprechende Zahlenpaare sind. Welches Bild (unter f ) hat der durch das Zahlenpaar λ1 λ2 gegebene Vektor? Durch welches Zahlenpaar wird das Bild dieses Vektors beschrieben? Für die zu f (e1 ), f (e2 ) gehörigen Zahlenpaare gilt a11 a12 f (e1 ) ↔ , f (e2 ) ↔ a21 a22 Nun, rechnen wir los: f (λ1 e1 + λ2 e2 ) = λ1 f (e1 ) + λ2 f (e2 ) ←→ a11 a12 a11 λ1 + a12 λ2 λ1 + λ2 = a21 a22 a21 λ1 + a22 λ2 a11 a12 λ1 = a21 a22 λ2 6.6. KREISFUNKTIONEN 167 λ 1 Bemerkung 6.5.6 Sei K ein beliebiger Körper. Wenn die Elemente des K 2 als Spalten λ2 2 2 geschrieben werden, gilt für lineare Abbildungen f : K → K dasselbe. Sie werden in der oben angegebenen Art durch 2 × 2 Matrizen beschrieben. f, g : K 2 → K 2 lineare Abbildungen. Und es werde a11 a12 b11 b12 f durch die Matrix und g durch die Matrix beschrieben, so a21 a22 b21 b22 b11 b12 a11 a12 wird g ◦f durch die Matrix beschrieben. b21 b22 a21 a22 Satz 6.5.7 Seien Spätestens an dieser Stelle, sollte Dir klar werden, wie wichtig die Multiplikation von Matrizen ist. Und wenn Du sie bislang etwas stiefmütterlich behandelt hast, dann . . . Den Beweis dieses Satzes möchte ich gerne Dir überlassen. Er erfordert keine Idee, aber sorgfältiges Rechnen. 6.6 Kreisfunktionen Wir versehen die (euklidische) Ebene nach Wahl einer Längeneineit mit einem orthonormalen Koordinatensystem, so dass die Punkte (1, 0) und (0, 1) eine Längeneinheit vom Ursprung (Nullpunkt) entfernt sind. Der Kreis um (0, 0) vom Radius 1 geht dann durch die Punkte (1, 0), (0, 1), (−1, 0), (0, −1). Wir denken uns einen Punkt, der abhängig von der Zeit t ∈ R den Kreis mit der (gleichbleibenden) (Absolut-)Geschwindigkeit 1 in der im Bild angedeuteten Richtung durchläuft und sich zum Zeitpunkt 0 beim Punkt (1, 0) befindet. (0, 1) (cos t, sin t) (0, sin t) (–1, 0) t (cos t, 0) (1, 0) (0, –1) Definition 6.6.1 Die Koordinaten des Punktes zum Zeitpunkt t werden mit cos t und sin t bezeichnet. D.h., wenn γ : R → R2 den Weg unseres Punktes beschreibt, ist γ(t) = (cos t, sin t). 168 KAPITEL 6. GEOMETRIE Wohlgemerkt, wir nehmen diese Beschreibung als Definition von sin t, dem Sinus von t, und cos t, dem Cosinus von t. Selbstverständlich ist dann der Einheitskreis der parametrisierte Weg (cos t, sin t), wie er in dem Kapitel 7 Abschnitt 4 definiert werden wird. Aber die Definition geht von der Geometrie, nicht von der Analysis aus. Natürlich ist die Zeit nicht auf die Werte 0 ≤ t ≤ 2π beschränkt! (Wie oben bezeichnen wir mit π die Länge der halben Einheitskreislinie.) 6.6.2 Offensichtlich haben die beiden Funktionen cos und sin die Periode 2π. D.h. es ist cos(x+ 2π) = cos x und sin(x+2π) = sin x. Bachte, dass innerhalb einer Periode etwa auf dem Intervall [0, 2π[ bis auf die Werte ±1 jeder Wert vom Sinus, wie auch vom Cosinus zweimal angenommen wird. Wir haben folgende speziellen Funktionswerte: −π −π/2 0 π/2 π 3π/2 t cos t −1 0 1 0 −1 0 −1 0 1 0 −1 sin t 0 Hieraus erkennt man auch, dass die Funktionen sin und cos keine kleinere Periode als 2π haben. D.h. gilt sin t = sin(t+a) für alle t ∈ R, so ist a ein ganzzahliges Vielfaches von 2π; und dasselbe stimmt auch für den Cosinus. Bemerkung 6.6.3 Beachte bitte, dass wir oben in Definition 6.4.2 Winkel zwischen zwei Halbgeraden und damit zwischen zwei (von 0 verschiedenen) geometrischen Vektoren unabhängig von deren Reihenfolge betrachtet haben. Hier wird hingegen ein Winkel als Länge eines gerichteten Weges auf dem Einheitskreis betrachtet, der als negativ betrachtet wird, wenn er im Uhrzeigersinn durchlaufen wird. Da cos(−α) = cos α ist, betrifft dieser Unterschied lediglich den Sinus. 6.6.4 Wichtige lineare Abbildungen sind Drehungen um den Ursprung: Wenn (e1 , e2 ) eine Basis des Vektorraums V der Ebene ist und die lineare Abbildung fα : V → V so definiert ist, dass sie die Vektoren e1 , e2 um denselben Winkel (in dieselbe Richtung) α um O dreht, tut sie das offenbar mit jedem Vektor. α α α 6.6. KREISFUNKTIONEN 169 Wir wählen ein Einheitslängenmaß und setzen jetzt voraus, dass (e1 , e2 ) bezüglich dieser Längeneinheit eine orthonormale Basis ist. Dann gilt für die oben beschriebene Drehung f fα (e1 ) = cos(α) · e1 + sin(α) · e2 und fα (e1 ) = − sin(α) · e1 + cos(α) · e2 Aufgefasst als Spalten – bzgl. der Basis (e1 , e2 ) – gilt also für fα (e1 ), fα (e2 ): cos α − sin α fα (e1 ) = , und fα (e2 ) = . sin α cos α Das bedeutet, dass fα bezüglich der Basis (e1 , e2 ) durch die Matrix cos α − sin α sin α cos α beschrieben wird. Diese Erkenntnis ermöglicht es, ganz einfach Formeln für sin(α + β) und cos(α + β) anzugeben. Satz 6.6.5 Es gelten die Formeln: cos(α + β) = cos α · cos β − sin α · sin β, sin(α + β) = sin α · cos β + cos α · sin β . Beweis: Die Drehung um α + β kann man auch dadurch erreichen, indem man zunächst um β, danach um α dreht. D.h. fα+β = fα ◦fβ . Für Matrizen bedeutet dies cos(α + β) − sin(α + β) cos α − sin α cos β − sin β = = sin(α + β) cos(α + β) sin α cos α sin β cos β cos α cos β − sin α sin β − sin α cos β − cos α sin β sin α cos β + cos α sin β cos α cos β − sin α sin β Ein Vergleich der Einträge beweist den Satz. Folgerung 6.6.6 a) sin 2α = 2 sin α cos α, cos 2α = cos2 α−sin2 α = 1−2 sin2 α = 2 cos2 α−1 b) sin(α + β) sin(α − β) = sin2 α − sin2 β Hier ist sin 2α = sin(2α), sin2 α = (sin α)2 usw. Beweis: Nur b) ist zu zeigen. b) sin(α + β) sin(α − β) = (sin α cos β + cos α sin β)(sin α cos β − cos α sin β) = sin2 α cos2 β − cos2 α sin2 β = sin2 α(1 − sin2 β) − (1 − sin2 α) sin2 β = sin2 α − sin2 β. Satz 6.6.7 Sinussatz. In einem Dreieck mit den Seitenlängen a, b, c, den Winkel(größe)n α, β, γ, (wo wie gewohnt a und α einander gegenüber liegen usw.) und dem Umkreisradius r gilt b c a = = = 2r sin α sin β sin γ 170 KAPITEL 6. GEOMETRIE Beachte, dass für einen Dreieckswinkel ϕ, der ja 0 < ϕ < π erfüllt, der Wert sin ϕ positiv ist. Deshalb sind die obigen Nenner nicht Null. Beweis: Es ist b sin α = hc = a sin β C γ b α A a hc β B c Das beweist auf einfache Weise die ersten beiden Gleichheiten. Die dritte sieht man mit Hilfe des Satzes über die Winkel im Kreis (??). C γ r A γ γ B Hieraus folgen natürlich auch die ersten beiden Gleichheiten. Satz 6.6.8 Cosinussatz. In einem Dreieck gilt (mit den üblichen Bezeichnungen) a2 + b2 − 2ab cos γ = c2 Beweis: (Wir verwenden die schulmäßigen Bezeichnungen: A, B, C seinen die Eckpunkte eines Dreiecks, a die Seite, die A gegenüber liegt, und auch ihre Länge, usw., ferner α, β, γ die Innenwinkel und deren Größen, wobei α der Winkel bei A ist usw.) ~ CA, ~ bzw. AB ~ die durch die Pfeile (C, B), (C, A), bzw. (A, B) Betrachte die Vektoren CB, ~ = CB ~ − CA. ~ gegeben werden; sie haben die Längen a, b,bzw. c. Es ist AB ~ 2 = hCB ~ − CA, ~ CB ~ − CAi ~ = a2 + b2 − 2ab cos γ. Dann rechne c2 = |AB| 6.7. DER SATZ VON MORLEY 171 AUFGABE Betrachte die Erde als perfekte Kugel mit dem Radius 6366 km. (Diese Länge, die man sich verhältnismäßig leicht merken kann, ist kleiner als der Radius des Äquators und größer als der halbe Abstand der Pole. Die Erde ist nicht wirklich eine Kugel, auch wenn man von kleinen Unregelmäßigkeiten, wie dem Himalaja absieht.) Denke Dir eine Eisenbahnlinie von 10 km (20 km) Länge, die vollkommen gerade ist, also auch nicht der Erdkrümmung folgt (d.h. im Innern der idealen Erdkugel verläuft, so dass man einen Graben oder gar einen Tunnel für die Bahn anlegen muss.) Sie soll an einem Punkt der Erdoberfäche beginnen und an einem solchen enden. Wie tief verläuft sie an der tiefsten Stelle unter der Erdoberfäche. 6.7 Der Satz von Morley C γ γ γ A’ B’ A α α α C’ β β β B Satz 6.7.1 Bringt man die jeweils benachbarten Drittellinien der Winkel eines beliebigen Dreiecks zum Schnitt, so bilden die drei erhaltenen Schnittpunkte ein gleichseitiges Dreieck. Beweis: Gilt die Behauptung des Satzes für ein Dreieck, so gilt sie auch für alle ähnlichen Dreiecke. Kann man also zu je drei (positiven) Winkeln, deren Summe π ist, ein Dreieck mit diesen Winkeln konstruieren, dessen Morley-Dreieck gleichseitig ist, so ist der Satz richtig. Seien α, β, γ drei positive Winkel mit 3α+3β +3γ = π. Wir haben ein Dreieck mit den Winkeln 3α, 3β, 3γ zu konstruieren, dessen Morley-Dreieck gleichseitig ist. Zur Abkürzung setzen wir ϕ+ := ϕ + π3 für jeden Winkel ϕ. Dann sind z.B. α, β + , γ + die drei Winkel eines Dreiecks, d.h. ihre Summe ist π. 172 KAPITEL 6. GEOMETRIE C + β+ A’ B’ α + + γ γ β+ α+ C’ A B Sei A0 B 0 C 0 ein gleichseitiges Dreieck der Seitenlänge 1. (Dies bedeutet eine Längeneinheit, die man natürlich willkürlich wählen darf. Nur musst Du sie innerhalb des Beweises beibehalten.) Über den drei Seiten dieses Dreiecks konstruieren wir Dreiecke AB 0 C 0 , BC 0 A0 und CA0 B 0 , derart dass A und A0 (bzw. B und B 0 , bzw. C und C 0 ) auf verschiedenen Seiten der Geraden durch B 0 , C 0 (bzw. C 0 , A0 , bzw. A0 , B 0 ) liegen, mit den in der Zeichnung angegebenen Winkeln. (Bitte beachte genau, welche Winkel wo angegeben sind! Z.B. hat der Winkel des Dreiecks AC 0 B 0 bei C 0 die Größe β + und der bei B 0 desselben Dreiecks die Größe γ + – und nicht etwa umgekehrt!) Wir behaupten: A0 B 0 C 0 ist das Morley-Dreieck des Dreiecks ABC. Dazu genügt es zu zeigen, dass z.B. ∠C 0 AB = α ist. Denn für die weiteren Winkel ∠CAB 0 usw. gilt aus Analogiegründen das entsprechende. Wir betrachten das Dreieck ABC 0 . Bezeichne ∠C 0 AB mit α, und ∠C 0 BA mit β. Ferner sei u die Länge der Strecke AC 0 und v die der Strecke BC 0 . C B’ γ+ A α α’ u β+ A’ γ+ α+ C’ v β’ β B Der Winkel ∠AC 0 B berechnet sich zu 2π − π/3 − β + − α+ = π − β − α = γ + 2π/3, folglich ist α + β + γ + 2π/3 = α + β + γ + 2π/3, also α + β = α + β. Dann rechnen wir durch Anwendung des Sinus-Satzes auf drei Dreiecke sin α v sin γ + / sin β sin α = = = + u sin γ / sin α sin β sin β 6.8. EULERGERADE UND FEUERBACHKREIS 173 Wir bemerken: Die vier Winkel α, α, β, β liegen alle in dem Intervall ]0, π/3]. Denn es ist α, β < α + β + γ = π/3, und α, β < α + β = α + β < α + β + γ = π/3. Auf diesem Intervall, sogar auf [0, π/2], ist die Sinusfunktion streng monoton wachsend und positiv. Aus den beiden bisher bewiesenen Gleichungen sin α sin α = sin β sin β und α + β = α + β können wir deshalb ableiten, dass α = α (und β = β) ist. Denn wäre etwa α > α, so würde die erste Gleichung β > β, die zweite hingegen β < β implizieren. Analoges gilt im Falle α < α. 6.8 Eulergerade und Feuerbachkreis Sei ABC ein Dreieck. Das Mittendreieck dieses Dreiecks ist das Dreieck A0 B 0 C 0 , wo A0 der Mittelpunkt der Seite BC und B 0 derjenige von CA und C 0 derjenige von AB ist. C B’ A A’ C’ B Bemerkungen 6.8.1 Mit obigen Bezeichnungen gilt: a) A0 B 0 (bzw. B 0 C 0 , bzw. C 0 A0 ) ist parallel zu AB (bzw. BC, bzw. CA) und halb so lang. b) Die seitenhalbierenden Geraden von ABC sind dieselben wie die von A0 B 0 C 0 , wobei die Seitenhalbierende durch A von ABC auch durch A0 geht, usw. Insbesondere haben ABC und A0 B 0 C 0 denselben Schwerpunkt S. Dies folgt wie a) aus dem Strahlensatz und seiner Umkehrung. c) Die Mittelsenkrechte von AB ist die Höhengerade von A0 B 0 C 0 durch C 0 , usw. Also ist der Höhenschnittpunkt von A0 B 0 C 0 der Umkreismittelpunkt U von ABC. 174 KAPITEL 6. GEOMETRIE d) Das Dreieck A0 B 0 C 0 entsteht aus dem Dreieck ABC durch Drehung um S um 180o und Halbierung aller Abstände von S. Es handelt sich also hier um eine Ähnlichkeitsabbildung, d.h. eine Abbildung der Ebene auf sich, die ein Dreieck immer in ein ähnliches Dreieck abbildet. Wenn man also den Höhenschnittpunkt H von ABC am Punkt S spiegelt und einen Punkt K erhält, so ist der Höhenschnittpunkt H 0 von A0 B 0 C 0 der Mittelpunkt der Strecke SK. D.h H 0 liegt auf der Geraden HS auf der anderen Seite von S und ist von S halbsoweit entfernt wie H. Nach c) gilt aber H 0 = U . C H B’ A’ S=S’ H’=U A C’ B Es folgt also Satz 6.8.2 (Euler) In einem Dreieck ABC liegen Höhenschnittpunkt H, Schwerpunkt S und Umkreismittelpunkt U in dieser Reihenfolge auf einer Geraden. Für die Streckenlängen gilt l(HS) : l(SU ) = 2 : 1. (Ist das Dreieck gleichseitig, fallen diese drei Punkte zusammen. Die Aussage des Satzes ist dann leer. Überlege Dir: Wenn in einem Dreieck der Umkreismittelpunkt mit dem Schwerpunkt zusammenfällt, ist das Dreieck gleichseitig.) Definition 6.8.3 Die Gerade, auf welcher Höhenschnittpunkt, Schwerpunkt und Umkreismittelpunkt eines nicht gleichseitigen Dreiecks liegen, heißt seine Eulergerade. Bemerkungen 6.8.4 a) Ist ABC gleichschenklig (aber nicht gleichseitig), so ist die Symmetrieachse die Eulergerade. b) Ist ABC rechtwinklig mit γ = 90o , so ist die Seitenhalbierende s durch C die Eulergerade. Denn der Höhenschnittpunkt ist der Punkt C und der Schwerpunkt liegt auf s. c) Sei ABC rechtwinklig, aber nicht gleichschenklig, so fallen die Eulergerade, d.h. die Seitenhalbierende s durch C und die Winkelhalbierende w durch C nicht zusammen, da letztere die Seite AB im Verhältnis b/a 6= 1/1 teilt. Da aber der Inkreismittelpunkt nicht der Schnittpunkt C von w und s sein kann, liegt zumindest in diesem Fall der Inkreismittelpunkt nicht auf der Eulergeraden. 6.8. EULERGERADE UND FEUERBACHKREIS 175 Bemerkungen 6.8.5 Mit den obigen Bezeichnungen gilt: a) Sei U 0 der Umkreismittelpunkt von A0 B 0 C 0 . Dann liegt U 0 auf der Geraden U S, der Eulergeraden, auf der U gegenüberliegenden Seite von S und ist halbsoweit von S entfernt wie U . Gemäß der ‘berühmten’ Identität 31 + 16 = 12 ist er also der Mittelpunkt der Strecke U H. Durch U geht die Mittelsenkrechte von AB, d.h. die Senkrechte auf AB durch C 0 . Durch H geht die dazu parallele Höhe von ABC durch C. Der Kreis um U 0 durch A0 geht also auch durch den Fußpunkt der Höhe durch C. Dieser Kreis, der Feuerbachkreis geht also durch die Seitenmittelpunkte und die Höhenfußpunkte von ABC. Eulergerade C’ B A H U’ FeuerbachKreis U=H’ B’ A’ C b) Nun bringen wir die Gerade C 0 U 0 mit der Höhengeraden von ABC durch C zum Schnitt, der von dem Fußpunkt der Höhe verschieden ist. Der Schnittpunkt heiße D. Die Dreiecke U 0 U C 0 und U 0 HD sind kongruent. Denn die Strecken U 0 U und U 0 H sind gleichlang, die Winkel bei U 0 sind gleichgroß, ebenso die bei H bzw. U . Folglich gilt l(A0 U ) = l(DH). Da wir schon wissen, das die Strecke C 0 U halb so groß ist wie CH – sie korrespondieren bei der Mittendreieck-Korrespondenz – ist D der Mittelpunkt von CH. Ferner folgt aus obiger Kongruenz l(U 0 D) = l(U 0 C 0 ). Somit geht der Feuerbachkreis durch die Mittelpunkte der Strecken CH, AH und BH. (Mit l(DE) wurde die Länge der Strecke CD bezeichnet.) c) Ohne Beweis zitiere ich: Der Feuerbachkreis berührt den Inkreis und die Ankreise. 176 KAPITEL 6. GEOMETRIE Kapitel 7 Differenzial- und Integralrechnung 7.1 Differenzieren Wie im Kapitel über die Geometrie verzichte ich auch hier bewusst auf die größtmögliche Präzision. Ich möchte nämlich nicht, dass Du Dich in einem unübersichtlichen Wust kleinteiliger Beweise verfängst, sondern zunächst einmal die großen Linien kennenlernst. Im Studium wirst Du dann, hoffentlich mit Genuss, erkennen, dass man alles auch ohne Appellation an die Anschauung (die ja möglicherweise nicht für alle dieselbe ist) rein logisch beweisen kann. Hier werde ich es z.B. als anschaulich klar ansehen, dass eine Funktion, die auf einem Intervall die (konstante) Ableitung 0 hat, dort konstant ist. Ebenso werde ich nicht beweisen, dass eine Funktion, deren Ableitung auf einem Intervall I positiv ist, dort auch streng monoton wachsend ist, d.h. dass aus x, y ∈ I und x < y die Ungleichung f (x) < f (y) folgt. So werde ich auch den Zwischenwertsatz als anschaulich klar ansehen. Dieser besagt ja, dass eine auf einem Intervall I stetige Funktion f zwischen zwei Punkten x1 , x2 ∈ I alle Werte zwischen f (x1 ) und f (x2 ) annimmt. Solltest Du mein Vorgehen als unbefriedigend empfinden, so kannst Du die exakten Beweise im Buch von Forster (z.B.) nachlesen oder sie selber finden. Wahrscheinlich wirst Du bereits wissen, was das Differenzieren bzw. die Ableitung einer Funktion bedeuten. Wegen der Wichtigkeit dieser Begriffe wollen wir sie hier ausführlich besprechen. 7.1.1 Die einfachsten Funktionen sind die Polynome vom Grad ≤ 1, auch lineare Funktionen genannt, also solche von der Art f : R → R, f (x) = ax + b, wo a, b feste reelle Zahlen sind. (Zu ihnen gehören auch die konstanten Funktionen, wo a = 0 ist.) Oben haben wir lineare Abbildungen von Vektorräumen definiert. Wenn man R als RVektorraum betrachtet, so ist die Abbildung x 7→ ax + b nur dann linear als Abbildung von Vektorräumen, wenn b = 0 ist. Hier wollen wir aber unter einer linearen Funktion allgemein ein Polynom vom Grad ≤ 1 auffassen. 177 178 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Wenn x0 , x1 verschiedene reelle Zahlen sind, gilt für ein solches f immer f (x1 ) − f (x0 ) f (x0 + h) − f (x0 ) = a, d.h. für h 6= 0 ist =a. x1 − x0 h 1 2 f(x) = — x + 1 3 f(x1)–f(x0) 2 x1–x0 1 0 1 x0 2 3 x1 4 5 6 Der Graph einer solchen Funktion ist eine Gerade. Aber nicht alle Geraden in der ‘(x, y)’-Ebene sind Graphen solcher Funktionen. Nämlich, für beliebiges c ∈ R ist die Gerade, die durch die Gleichung x = c gegeben wird, nicht der Graph einer Funktion (von x)! (Warum?) Man nennt den Koeffizienten a der Funktion f (x) = ax + b die Steigung dieser Funktion. Ist x0 ∈ R und betrachten wir die Werte an der Stelle x0 und x0 + h, so ist f (x0 + h) = f (x0 ) + ah. D.h. wächst der ‘x-Wert’ um h, so wächst der Funktionswert um ah. Die Steigung ist also ein Maß für das Wachstum. (Beachte, dass a bzw. h selbstverständlich auch negativ sein dürfen, das Wort ‘wachsen’ hier also auch ‘kleiner werden’ bedeuten kann.) Angenommen, ein Auto fährt entlang einer (geraden) Straße, in der Weise, dass es sich im Zeitpunkt t bei ‘Kilometer’ at + b befindet. Dann hat a die Bedeutung der Geschwindigkeit dieses Autos, die in diesem Fall konstant ist. Differenzieren bedeutet, auch einer komplizierteren Funktion in einem beliebigen Punkt ihres Graphen eine Steigung zuzuordnen. Diese lokale Steigung in x0 einer Funktion f , die wir die Ableitung von f in x nennen, soll folgendes leisten: 1.) Sie soll die Steigung der vernünftig definierten Tangente (die ja eine Gerade ist) an den Funktionsgraphen im Punkte (x0 , f (x0 )) sein. 2.) Sie soll bestmöglich eine angenäherte Berechnung von f (x) in der Nähe von x0 durch eine lineare Funktion erlauben. 3.) Sie soll die Momentangeschwindigkeit angeben, mit der sich ein Punkt (auf einer Geraden) bewegt, wenn der Ort des Punktes im Zeitpunkt t durch f (t) gegeben wird. Die Ableitung einer Funktion f im Punkte x0 ist also ein Maß dafür, wie und wie stark die Funktion f im Punkt x0 variiert. Das hört sich zunächst etwas verrückt an, da die Funktion ja 7.1. DIFFERENZIEREN 179 im Punkte x0 den Wert f (x0 ) hat. Was soll da variieren? Aber man kann ja für x ‘in der Nähe von x0 ’ die Veränderung f (x) − f (x0 ) zur Differenz x − x0 ins Verhältnis setzen, d.h. den sog. Differenzenquotienten f (x) − f (x0 ) x − x0 betrachten und dann beobachten, welchem Wert (wenn es denn einen solchen gibt) sich dieser Quotient nähert, wenn x gegen x0 geht. f(x) = x 3 – 5x 2 + 6x + 1 4 3 2 1 1 2 3 4 Beispiel 7.1.2 Wir betrachten als Beispiel die Funktion f (x) = x3 − 5x2 + 6x + 1 und werden diese in der Nähe des Punktes x0 = 3 genauer betrachten. (Du darfst natürlich dasselbe für die einfachere Funktion f (x) = x3 machen, wodurch das Ganze sicher übersichtlicher wird.) Gleichzeitig wollen wir die physikalische Bedeutung der Ableitung als Momentangeschwindigkeit der Funktion des Ortes in Abhängigkeit von der Zeit begreiflich machen. Wir denken uns einen kleinen (am besten punktförmigen) Wagen auf einer geraden Straße (der Breite 0, wenn man will) der zum Zeitpunkt 0 sich bei bei Meter 1 befindet und zum Zeitpunkt x sec bei Meter x3 − 5x2 + 6x + 1. Ihr oben gezeichneter Graph macht diesen Zusammenhang deutlich. Beachte, dass das Auto zwischendurch auch mal zurückfährt. Wir fragen: Wie groß ist die Durchschnittsgeschwindigkeit zwischen den Zeitpunkten 3 sec und 5 sec? Nun f (3) = 1, f (5) = 31. Deshalb fährt das Auto zwischen diesen beiden Zeitpunkten insgesamt 30 m, d.h. die Durchschnittsgeschwindigkeit ist 15 m/sec. Wieviel beträgt sie zwischen den Zeitpunkten 3 sec und 4 sec? Nun, es ist f (3) = 1, f (4) = 9. Also fährt das Auto zwischen den Zeitpunkten 3 sec und 4 sec insgesamt 8 m. und die Durchschnittsgeschwindigkeit ist 8 m/sec. Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,5 sec? Nun es ist f (3) = 1, f (3,5) = 3,625, also die Durchschnittsgeschwindigkeit 5,25(= 2,625/0,5) m/sec. Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,1 sec? Nun es ist f (3) = 1, f (3,1) = 1,341, also die Durchschnittsgeschwindigkeit 3,41 m/sec (= 0,341/0,1) m/sec. Wie groß ist sie zwischen den Zeitpunkten 3 sec und 3,01 sec? Nun es ist f (3) = 1, f (3,01) = 1,030401, also die Durchschnittsgeschwindigkeit 3,0401(= 0,030401/0,01) m/sec. Wie groß ist sie zwischen den Zeitpunkten 2,99 sec und 3 sec? Nun es ist f (2,99) = 1 − 0,029601, f (3) = 1, also die Durchschnittsgeschwindigkeit 2,9601 m/sec. 180 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Kann man von der Augenblicksgeschwindigkeit im Zeitpunkt 3 sec sprechen? Als Praktiker würde man doch sagen: Ja, etwa 3 m/sec. Und das ist auch sinnvoll und für die Praxis meist hinreichend. Wir Theoretiker sehen es im Prinzip ganz ähnlich. Der Praktiker berechnet ja den folgenden Differenzenquotienten f (x0 + h) − f (x0 ) (mit x0 = 3 im obigen Beispiel) h für (positive oder negative) Zahlen h, die so richtig nahe bei 0 liegen, aber von 0 verschieden sind. (0/0 zu berechnen, fällt auch dem Praktiker schwer! Ich kann mir nicht vorstellen, dass Du dies in jedem Fall gleich 1 setzen würdest, nachdem du unser obiges Beispiel studiert hast.) Der Theoretiker wird nun ‘einfach’ die Augenblicksgeschwindigkeit im Zeitpunkt x0 durch f (x0 + h) − f (x0 ) h→0 h lim definieren, wobei zu beachten ist, das der Differenzenquotient für h = 0 nicht definiert ist, also zur Berechnung nur Nullfolgen (hn )n betrachtet werden, deren Glieder sämtlich 6= 0 sind. (Andererseits steht nirgendwo geschrieben, dass hn > 0 sein muss!) Und da die Theoretiker auch ein paar knackige Regeln entwickeln werden, solche Grenzwerte zu berechnen, können sie damit auch dem Praktiker höchst hilfreich sein. Allein den entsprechenden Limes für unsere spezielle Funktion f in dem Punkte x0 = 3 auszurechnen, scheint mir schon einfacher als die oben gemachten approximativen Berechnungen: f (x0 + h) − f (x0 ) (3 + h)3 − 5(3 + h)2 + 6(3 + h) − 33 + 5 · 32 − 6 · 3 = lim h→0 h→0 h h lim (27 + 27h + 9h2 + h3 ) − (45 + 30h + 5h2 ) + (18 + 6h) − 27 + 45 − 18 h→0 h 2 = lim (27 + 9h + h − 30 + h + 6) = 3. = lim h→0 Wie gesagt, es geht noch einfacher, und nicht nur für einzelne Punkte x0 . Du weißt das sicher aus dem Schulunterricht, und hier wird es auch bald behandelt. Definition 7.1.3 Sei D ein Intervall, x0 ∈ D und f : D → R eine Funktion. Wir definieren die Ableitung oder Differenzialquotienten f 0 (x0 ) von f in x0 durch f (x0 + h) − f (x0 ) f (x) − f (x0 ) = lim x→x0 h→0 h x − x0 f 0 (x0 ) := lim wobei die beiden Limiten offenbar dieselben sind. (Natürlich muss dieser Limes nicht in jedem Fall existieren!) Ferner heißt f in x0 differenzierbar, wenn o.a. Limes existiert, genauer als reelle Zahl existiert. Die Limiten ±∞ wollen wir vorsichtshalber nicht als Ableitung zulassen! 7.1. DIFFERENZIEREN 181 7.1.4 Es ist keineswegs jede Funktion differenzierbar, z.B. nicht die Funktion, die für alle rationalen x den Wert 1 und für die irrationalen x den Wert 0 annimmt. Diese ist überall unstetig, und deshalb auch nirgendwo differenzierbar, wie Du gleich sehen wirst. Aber auch die Funktion f (x) = |x| ist in 0 nicht differenzierbar. Allerdings gibt es dort eine links- und eine rechtsseitige Ableitung. Was meine ich wohl damit? Bei folgender (stetigen) Funktion gibt es in 0 nicht einmal diese: 1 für x 6= 0, f (0) = 0. f : R → R, f (x) := x · sin x Überlege das schon einmal, wenn Du magst. Im 4. Abschnitt erfährst Du mehr hierzu. Man kann sogar Funktionen konstruieren, die überall stetig, aber nirgendwo differenzierbar sind. 7.1.5 Um zu sehen, dass jede in a differenzierbare Funktion f dort auch stetig ist, betrachte eine Folge (xn )n∈N im Definitionsbereich von f , die gegen a konvergiert und xn 6= a für alle n erfüllt. Da nach Voraussetzung die Folge f (xn ) − f (a) xn − a n∈N konvergiert, ist sie beschränkt, d.h. es gibt ein s mit |f (xn ) − f (a)| < s, also |f (xn ) − f (a)| < s|xn − a| für alle n. |xn − a| Man sieht dann leicht, dass limn→∞ f (xn ) = f (a) aus limn→∞ xn = a folgt. 7.1.6 Approximation, Tangente. Man kann die Ableitung einer Funktion f in einem Punkt x0 ihres Definitionsbereiches auch anders beschreiben. Man kann sich fragen, wie man f in der Nähe von x0 am besten durch eine lineare Funktion aproximieren kann, also f (x0 + h) = f (x0 ) + c · h + ϕ(h) schreiben kann, wobei der Korrekturterm ϕ ‘mit größerer Beschleunigung als h gegen 0 geht’. Damit meine ich, dass ϕ(h) =0 lim h→0 h ist. Nun kann man die Gleichung 7.1.6 folgendermaßen umformen ϕ(h) f (x0 + h) − f (x0 ) = −c h h so dass ϕ(h) f (x0 + h) − f (x0 ) = 0 ⇐⇒ lim =c h→0 h h→0 h gilt. Es ergibt sich folgender lim 182 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Satz 7.1.7 Die Funktion f ist in x0 genau dann differenzierbar und hat dort die Ableitung f 0 (x0 ) = c, wenn sich f folgendermaßen schreiben lässt ϕ(h) = 0. h→0 h f (x0 + h) = f (x0 ) + c · h + ϕ(h) mit lim Der Graph der Funktion g(x) = f (x0 ) + c · (x − x0 ) ist dann eine Gerade, die durch den Punkt (x0 , f (x0 )) läuft und nahe x0 den Graphen der Funktion besser als linear, d.h. besser als jede andere Gerade approximiert, also ihn in (x0 , f (x0 )) ‘berührt’ – d.h. die sogenannte Tangente an den Graphen von f in diesem Punkt ist. (Wir wollen die Tangente an den Graphen einer Funktion in einem Punkt schlicht auf diese Weise formal definieren. Es gibt allerdings Tangenten an Graphen√von Funktionen, die √ so nicht erfasst werden können. Z.B. hat der Graph der Funktion f (x) = 3 x (auch g(x) = x) im Nullpunkt eine sinnvolle Tangente, nämlich die ‘y-Achse’, ohne dass diese Funktion dort differenzierbar wäre. Wenn überhaupt hätte dort die Ableitung den Wert ∞, den wir aber bei der Definition der Differenzierbarkeit als Wert√der Ableitung bewusst ausgeschlossen haben. Ähnlich verhält es sich mit der Funktion, f (x) = 1 − x2 , deren Graph ein Halbkreis ist, bei x = ±1.) 7.1.8 Das Differenzieren einer Funktion ist längst nicht so spannend, wenn man es nur in einzelnen Punkten, als wenn man es in allen Punkten oder wenigstens den meisten Punkten des Definitionsbereiches macht. Und wie Du vielleicht schon weißt, geht das bei vielen Funktionen gut, z.B. bei Polynomfunktionen, oder Quotienten von solchen, dort, wo sie definiert sind. Ist eine Funktion f : D → R auf einer Teilmenge D0 ihres Definitionsbereiches D differenzierbar, so ist f 0 (x) für jedes x ∈ D0 definiert, mit anderen Worten, wir haben eine Abbildung f 0 : D0 → R, die Ableitung von f . Beispiele 7.1.9 a) Seien a, b ∈ R und f : R → R definiert durch f (x) := ax + b, so ist f überall differenzierbar und hat die konstante Ableitung f 0 (x) = a. Du wirst keine Schwierigkeit haben, das zu zeigen. (Es wäre ja auch saublöd, wenn eine lineare Funktion mit der Steigung a nicht in jedem Punkt die Steigung a hätte.) Übrigens ist jede Funktion, die auf einem Intervall überall die konstante Ableitung a hat, von der Form f (x) = ax + b. Dies ist allerdings nicht trivial, soll aber hier als anschaulich klar angesehen werden. b) Ein Beispiel, wo die Ableitung einer Funktion f nicht auf dem ganzen Definitionsbereich √ 3 von f definiert ist, ist die bereits oben betrachtete Funktion f (x) = x. Hier ist D = R und D 0 = R∗ . 7.2 Berechnungsmöglichkeiten von Ableitungen Wir beginnn jetzt damit, für recht viele Funktionen zu zeigen, dass sie differenzierbar sind, und gleichzeitig einfache Regeln zur Berechnung ihrer Ableitungen anzugeben. Ohne diese Regeln wäre die Differenzialrechnung nicht halb so wichtig und berühmt, wie sie ist! Wir benötigen dafür folgende fast selbstverständlichen Definitionen. 7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN 183 Definitionen 7.2.1 Seien f, g : D → R Funktionen und a ∈ R, so wird af , bzw. f + g, bzw. f g durch (af )(x) := a(f (x)), bzw. (f + g)x = f (x) + g(x), bzw. (f g)(x) = f (x)g(x) für alle x ∈ D definiert. Ist D0 ⊂ D die Menge aller x mit g(x) 6= 0, dann definieren wir für alle x ∈ D0 die Funktion f f (x) f durch (x) = . g g g(x) Achtung: Unterscheide zwischen dem Produkt f g und der Verkettung (Hintereinander1 ausführung) f ◦g ! Und verwechsle auch nicht f (x) mit der Umkehrfunktion f −1 ! Satz 7.2.2 Seien a, b ∈ R und f, g : D → R auf D differenzierbare Funktionen, wobei D eine Vereinigung von Intervallen positiver Länge ist. Dann gilt: a) Die Funktion af + bg ist auf D differenzierbar und es ist (af + bg)0 = af 0 + bg 0 . (Man kann dies auch in zwei Regeln aufteilen: f + g und af sind differenzierbar und haben die Ableitungen f 0 + g 0 , bzw. af 0 .) b) Produktregel: Die Funktion f g ist auf D differenzierbar und es ist (f g)0 = f 0 g + g 0 f . (Vorsicht! Fast immer ist (f g)0 6= f 0 g 0 .) c) Quotientenregel: Sei D0 die Menge wo g(x) 6= 0 ist. Dann ist die Funktion 0 aller0 x ∈ D, 0 f f f g − g f auf D0 differenzierbar und es gilt = . g g g2 Beweis: Den Beweis von a) überlasse ich Dir. b) Wir benutzen die beliebte Umformung ab − a0 b0 = ab − a0 b + a0 b − a0 b0 = (a − a0 )b + a0 (b − b0 ) und rechnen: f (x + h)g(x + h) − f (x)g(x) = h→0 h f (x + h)g(x + h) − f (x)g(x + h) f (x)g(x + h) − f (x)g(x) lim + lim = h→0 h→0 h h f (x + h) − f (x) g(x + h) − g(x) = lim · g(x + h) + lim f (x) · = f 0 (x)g(x) + f (x)g 0 (x) h→0 h→0 h h Insbesondere ist ja g in x stetig und deshalb limh→0 g(x + h) = g(x). lim c) Ich behandle zunächst den Fall f (x) = 1 (für alle x ∈ D) und überlasse es dann Dir, b) auf 1 das Produkt f · anzuwenden. g 1 Wir berechnen die Ableitung der Funktion : g 0 1 1 1 1 1 g(x) − g(x + h) (x) = lim − = lim · = h→0 h h→0 h g g(x + h) g(x) g(x)g(x + h) 1 g(x + h) − g(x) g 0 (x) lim · lim − =− . h→0 g(x)g(x + h) h→0 h (g(x))2 Den Rest überlasse ich – wie gesagt – Dir. 184 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Beispiele 7.2.3 a) Zeige mit Hilfe der Produktregel: Ist f (x) = xn mit einer natürlichen Zahl n > 0, so gilt f 0 (x) = nxn−1 . Dies ist eine einfache Übung zur vollständigen Induktion. b) Zeige, dass dies (für x 6= 0) auch für beliebige ganze, also auch negative n gilt. Die Ableitung der Funktion f (x) = x0 ist 0, die 0-Funktion, auch in x = 0, jedenfalls, wenn man 00 = 1 setzt. (Die 0-Funktion ist die Funktion, die überall den Wert 0 hat.) xn die Funktion xn−1 . D.h. n zu jeder Funktion g(x) = xn mit n 6= −1 gibt es eine Funktion, deren Ableitung gleich g ist, xn+1 eine sogenannte Stammfunktion von g, nämlich die Funktion f (x) = . Dieser Ausdruck n+1 1 hat keinen Sinn für n = −1. Gibt es auch eine Stammfunktion von ? Vielleicht kennst Du x eine solche bereits. Sonst musst Du Dich noch etwas gedulden. c) Für n ∈ Z, aber n 6= 0 ist also die Ableitung der Funktion f (x) = d) Berechne die Ableitung der Funktion f (x) = x3 − 5x2 + 6x + 1. d’) Zeige allgemeiner: Ist f (x) = n X k=0 ak xk , so ist f 0 (x) = n X kak xk−1 k=1 Folglich erhältst Du: Ist f (x) = an xn + · · · + a1 x + a0 ein Polynom vom Grade n ≥ 1, so ist f 0 ein Polynom vom Grade n − 1. Hat f den Grad 0, d.h. ist f konstant, aber nicht 0, so ist f 0 = 0, d.h. die 0-Funktion. Die Ableitung der 0-Funktion ist wieder die 0-Funktion. Somit ist ein Polynom unendlich oft differenzierbar. Die Ableitung eines Polynoms, das nicht konstant gleich 0 ist, ist also ‘einfacher’, nämlich von kleinerem Grad, als das Polynom selber. Für allgemeinere Funktionen ist das aber nicht die Regel. Sehr häufig ist die Ableitung einer Funktion komplizierter als diese selbst, wie Du schon in folgendem Beispiel siehst. x4 + x + 1 . Allgemein besitzt eine rationale Funktion, x2 + 1 d.h. ein Quotient zweier Polynome eine Ableitung überall da, wo sie definiert ist. Und diese Ableitung ist wieder eine rationale Funktion. e) Berechne die Ableitung von f (x) = √ 7.2.4 Wir wollen auch Funktionen wie n x differenzieren und erinnern uns daran, dass diese die Umkehrfunktion von g(y) = y n ist. Genau genommen wird für jede ungerade Zahl n > 0 durch g(y) = y n eine bijektive Abbildung R → R definiert. Ist n > 0 gerade, so ist die Funktion g(y) = y n jedenfalls als Abbildung von R+ nach R+ bijektiv. Deshalb gibt es eine √ −1 −1 n Umkehrfunktion f = g : R → R, bzw. f = g : R+ → R+ , die mit f (x) = x bezeichnet wird. Um die Ableitung von Umkehrfunktionen wollen wir uns sofort kümmern und damit auch die Ableitungen von Wurzelfunktionen berechnen. Dass die Abbildungen g : R → R mit g(x) = xn für ungerade n > 0, sowie g : R∗+ → R∗+ mit g(x) = xn für gerade n > 0, bijektiv sind, ist ziemlich plausibel, aber doch nicht ganz selbstverständlich. Die Injektivität lässt sich leicht zeigen: x1 < x2 =⇒ xn1 < xn2 . Die Surjektivität folgt aus dem Zwischenwertsatz. 7.2. BERECHNUNGSMÖGLICHKEITEN VON ABLEITUNGEN 185 Satz 7.2.5 Seien I, J Intervalle, g : J → I eine bijektive stetige Funktion und f = g −1 . Ist g in y0 ∈ J differenzierbar mit g 0 (y0 ) 6= 0, so ist f in x0 = g(y0 ) differenzierbar mit der Ableitung 1 1 = 0 . f 0 (x0 ) = 0 g (y0 ) g (f (x0 )) Beweis: Ich begnüge mich mit einer Plausibilitätsbetrachtung: Betrachte eine Gerade in der x, y-Ebene, die zu keiner der beiden Achsen parallel ist. Sie ist sowohl der Graph einer Funktion, die jedem y-Wert einen x-Wert, als auch der Graph einer Funktion die jedem x-Wert einen y-Wert zuordnet. Ist x = ay + b, so ist y = a−1 x − a−1 b. Sei a = g 0 (y0 ). Dann wird die Tangente an den Graphen der Funktion g im Punkte (y0 , x0 ) durch eine Gleichung der Form x = ay + b beschrieben. Der Graph der Funktion f ist derselbe, wie der der Funktion g, wo nur die Rollen von x und y vertauscht sind. (Wenn Du, wie üblich die ‘unabhängige Variable’ auf der waagerechten Achse variieren lassen möchtest, musst Du den Graphen an der Geraden ‘y = x’ spiegeln.) Die Tangente im Punkte (y0 , x0 ) ist dann natürlich dieselbe. (Genau hier wird etwas gemogelt, da die Tangente nach obiger Definition nicht völlig symmetrisch in x, y definiert ist.) Wenn ich die Tangentengleichung nach y auflöse, erhalte ich 1 y = a−1 x − ba− 1, so dass ihre Steigung a−1 = 0 ist. g (y0 ) √ Folgerung 7.2.6 Die √ Funktion f : R+ → R+ , x 7→ n x ist für x > 0 differenzierbar und hat n √ x 1 1 0 die Ableitung f (x) = = x n −1 . (Ist n ungerade, so ist die Funktion f : R → R, x 7→ n x nx n für x 6= 0 differenzierbar und hat die angegebene Ableitung.) Beweis: Die Umkehrfunktion von f (x) = f 0 (x0 ) = √ n x ist g(y) = y n . Dann ist 1 1 √ 1 n1 −1 1−n n = ( x ) = x . 0 n( x0 )n−1 n n 0 √ n Bemerkung 7.2.7 Seien f1 , . . . , fn differenzierbare Funktionen mit demselben Definitionsbereich. So ist ihr Produkt f1 f2 · · · fn ebenfalls differenzierbar und hat die Ableitung f10 · f2 · · · fn + f1 · f20 · f3 · · · fn + . . . + f1 · · · fn−1 · fn0 (Gemeint ist eine Summe von n Produkten aus jeweils n Faktoren, wo im k-ten Summanden der k-te Faktor die Ableitung fk0 , und für die anderen i 6= k der i-te Faktor fi ist.) Du wirst dies sicher mit Induktion beweisen können. Das gilt natürlich auch wenn die Faktoren einander gleich sind: Ist n > 0 ganz und g(x) = f (x)n , so ist mit f auch g differenzierbar und g 0 (x) = nf 0 (x)·f (x)n−1 . √ m Schreibt man xm/n = ( n x) , so erhält man 186 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Folgerung 7.2.8 Ist a eine positive rationale Zahl, so ist f : R∗+ → R∗+ , x 7→ xa differenzierbar und es gilt f 0 (x) = axa−1 . (Lässt sich a mit einem ungeraden Nenner schreiben, so kann man R∗+ durch R∗ ersetzen. Für a ≥ 1 ist die Funktion auch in 0 differenzierbar.) Mit Hilfe der Quotientenregel erhalten wir: Folgerung 7.2.9 Dasselbe gilt, wenn a eine negative rationale Zahl (und x > 0) ist. Bemerkung 7.2.10 Im nächsten Abschnitt werden wir zeigen, dass f 0 (x) = axa−1 für beliebige reelle a gilt. Bemerkungen 7.2.11 Für den Beweis des nächsten Satzes brauchen wir das Folgende: ϕ(h) = 0, dann ist auch h→0 h ϕ(ah) ϕ(ah) ϕ(ah) lim = 0. Denn dies ist für a = 0 ohnehin klar, und für a 6= 0 kann man = a· h→0 h h ah schreiben. a) Sei ϕ, definiert auf einer Umgebung der 0, mit der Eigenschaft lim b) Sei a 6= 0 und ϕ wie oben, dann gibt es ein δ > 0, derart dass für alle h mit 0 < |h| < δ die Ungleichung |ϕ(h)| < |ah| gilt. Denn angenommen, für jedes n ∈ N1 gäbe es ein hn mit ϕ(hn ) |hn | < 1/n und |ϕ(hn )| ≥ |ahn |, dann wäre lim 6= 0 oder nichtexistent. Also muss für n→∞ hn ein (genügend großes) n für alle h mit |h| < 1/n die Ungleichung |ϕ(h)| < ah gelten. c) Sei ψ eine weitere Funktion mit den genannten Eigenschaften von ϕ, dann folgt aus a) und b) dass auch die zusammengesetzte Funktion ψ(ah + ϕ(h)) diese Eigenschaften hat. Denn für genügend kleine |h| ist ja dann |ϕ(h)| < |ah| und folglich |ah + ϕ(h)| ≤ |ah| + |ϕ(h)| < 2|ah|. Wie kann man z.B. die Funktion f (x) = Regel: √ 1 + x2 differenzieren? Dazu dient folgende wichtige Satz 7.2.12 Kettenregel: Seien I, J Intervalle und f : I → J, g : J → R Funktionen und x0 ∈ I. Sei ferner f in x0 und g in f (x0 ) differenzierbar. Dann ist g ◦f in x0 differenzierbar und es gilt (g ◦f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ). Anders ausgedrückt: Ist das lokale Wachstum von f im Punkte x0 gleich a und das lokale Wachstum von g im Punkte f (x0 ) gleich b, so ist das lokale Wachstum von g ◦f im Punkte x0 gleich ba. Beweis: Zunächst eine Plausibilitätsbetrachtung: Wenn man f in der Nähe von x0 durch die approximierende lineare Funktion x 7→ ax + c ersetzt und entsprechend g in der Nähe von f (x0 ) durch die approximierende lineare Funktion y 7→ by + d, so ist die Verkettung dieser linearen Funktionen die lineare Funktion b(ax + c) + d = bax + (bc + d), deren Wachstum gleich ba ist. Genauer, sei f (x+h) = f (x)+ah+ϕ(h) mit limh→0 (ϕ(h)/h) = 0 und g(y+k) = g(y)+bk+ψ(k) mit limk→0 (ψ(k)/k) = 0 für kleine |h|, |k|. 7.3. EXPONENTIAL- UND POTENZFUNKTIONEN 187 Dann ist g ◦f (x + h) = g(f (x) + ah + ϕ(h)) = g ◦f (x) + bah + bϕ(h) + ψ(ah + ϕ(h)). Es genügt folgendes zu zeigen bϕ(h) ψ(ah + ϕ(h)) = 0 und lim =0, lim h→0 h→0 h h wobei die erste Aussage trivial ist. Die zweite haben wir oben gezeigt. Beispiel 7.2.13 Die Ableitung von f (x) = 7.3 √ 2x x 1 + x2 ist f 0 (x) = √ =√ . 2 2 1+x 1 + x2 Exponential- und Potenzfunktionen 7.3.1 Über die Funktion exp(x) = ex wissen wir aus Lemma 5.2.5 bereits folgendes: (∗) Für |x| < 1 gilt |ex − 1 − x| < x2 . Hieraus folgt Lemma 7.3.2 Beweis: ex − 1 =1 x→0,x6=0 x lim Wenn Du die Ungleichung (∗) durch |x| (mit 0 < |x| < 1) dividierst, erhältst Du x x e − 1 − x e − 1 < |x| x − 1 = x was die Behauptung des Lemmas beweist. Theorem 7.3.3 Die Funktion exp ist differenzierbar und hat die Ableitung exp0 = exp. Beweis: Da ex+h = ex eh ist, gilt (mit h 6= 0) exp(x + h) − exp(x) eh − 1 = ex lim = ex . h→0 h→0 h h lim Die letzte Gleichung gilt auf Grund obigen Lemmas. Bemerkung 7.3.4 Wenn man die Exponentialreihe gliedweise differenziert, kommt man zum selben Ergebnis. Allerdings haben wir nicht bewiesen, dass dies gerechtfertigt ist! Es gibt viele Beispiele von Reihen (Folgen) von Funktionen, wo die gliedweise Ableitung nicht zum richtigen Ergebnis führt. d Bezeichnung. Man schreibt oft dx f (x) := f 0 (x), besonders dann, wenn die Funktion durch einen Ausdruck gegeben ist, den man nicht erst mit f (x) benennen will. Also statt des Satzes Ist f (x) = x2 − √ 3 (1 + 4x3 ) 2 + x + x4 , so ist f 0 (x) = 2x − p 3 3 (2 + x + x4 )2 schreibt man kürzer d 2 √ (1 + 4x3 ) 3 (x − 2 + x + x4 ) = 2x − p dx 3 3 (2 + x + x4 )2 188 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Satz 7.3.5 a) Für die Ableitung des natürlichen Logarithmus gilt: ln0 (x) = 1 für x > 0 , ja sogar x d 1 ln |x| = für alle x 6= 0 . dx x b) Allgemeiner gilt folglich d 1 loga |x| = für a > 0. dx x ln a c) Für die Ableitung der Exponentialfunktion f (x) = ax (mit a > 0) gilt: d x a := f 0 (x) = ln(a) · ax dx d) Für die Ableitung der Potenzfunktion g(x) = xa (die für alle reellen a und jedenfalls für x > 0 definiert ist) gilt d a x := g 0 (x) = axa−1 dx Beweis: a) Nach der Regel für die Ableitung der Umkehrfunktion ist ln0 x = 1 exp0 (ln x) = 1 1 = . exp(ln x) x a’) Ist x > 0, so ist |x| = x und die Behauptung bereits bewiesen. Für x < 0 ist |x| = −x. Nach 1 1 d ln(−x) = − = der Kettenregel gilt dann dx −x x b) folgt aus loga |x| = ln |x|/ ln(a) c) Da ax = ex ln a ist, kannst Du die Kettenregel auf f (x) = ex ln a anwenden. d) Es ist xa = ea ln x . Mit Hilfe der Kettenregel siehst Du d a ln x a a ln x a · xa e = e = = a · xa−1 . dx x x Die Ableitung der Funktion ax ist also proportional zu ax . Und der Proportionalitätsfaktor ist genau dann gleich 1, wenn a = e ist. Wenn ich von der Exponentialfunktion f (x) = ax und von der Potenzfunktion g(x) = xa rede, ist jedesmal mit x eine Variable (die sog. unabhängige Variable) und mit a eine Konstante gemeint. Deshalb haben die Ableitungen (nach x) dieser beiden Funktionen nichts miteinander zu tun! Bemühe Dich, die Namen ‘Potenzfunktion’ bzw. ‘Exponentialfunktion’ immer richtig zuzuordnen. Leider werden häufig, sogar in naturwissenschaftlichen Abhandlungen, die Begriffe ‘exponentielles Wachstum’ und ‘exponentielle Abnahme’ falsch verwendet! Alles was nicht linear ist, wird ‘exponentiell’ genannt. Diesem Missbrauch solltest Du nicht folgen. 7.4. SINUS UND COSINUS 189 7.3.6 Wir wissen jetzt, was die Ableitungen der Funktionen g(x) = xa und h(x) = ax sind. Frage: Was ist die Ableitung der Funktion f : R∗+ → R, definiert durch f (x) = xx ? f 0 (x) = xx−1 x = xx−2 ln(x) · xx (1 + ln x)xx Antwort: Schreibe xx = ex ln x und Du erhältst mit Hilfe der Ketten- und Produktregel die dritte Möglichkeit als richtige Antwort! (Die Ableitung von x ln x ist ja 1 · ln x + x · x1 .) Zur ersten Möglichkeit: Die Funktion f ist keine Funktion der Form xa mit einer Konstanten a. Zur zweiten Möglichkeit: Die Funktion f ist auch nicht eine Funktion der Form ax mit einer Konstanten a. 7.4 Sinus und Cosinus Da wir hier Abbildungen I → R2 mit einem Intervall I betrachten, wollen wir zunächst definieren, wann eine Folge von Elementen des R2 , also von Punkten oder Vektoren der Ebene, gegen ein Element des R2 konvergiert. Definition 7.4.1 Sei (an )n eine Folge von Elementen des R2 mit an = (an1 , an2 ). Man sagt, die Folge (an )n konvergiert gegen ein a = (a1 , a2 ) ∈ R2 , wenn die Folge (an1 )n gegen a1 und die Folge (an2 )n gegen a2 konvergiert. Bemerkung 7.4.2 Wie Du weißt, kann man den Vektorraum der Ebene, oder auch die Ebene auf vielerlei Weise mit dem R2 identifizieren. Und Du wirst fragen, ob verschiedene solche Identifikationen zu verschiedenen Definitionen der Konvergenz führen. Glücklicher Weise ist das nicht so. Wenn nämlich ϕ : R2 → R2 linear ist, so sind die Komponenten von ϕ(an ) von der Form ban1 +can2 mit geeigneten reellen Zahlen b, c. Aus Satz 3.2.27 folgt dann, dass die Komponenten der ϕ(an ) gegen die jeweiligen Komponenten von ϕ(a) konvergieren. Ist ϕ invertierbar, so gilt das Entsprechende für ϕ−1 . Und wenn man die Ebene zusätzlich durch eine Verschiebung des Ursprungs auf andere Weise mit dem Vektorraum der Ebene identifiziert, hat das erst recht keinen Einfluss auf die Konvergenz einer Folge. 7.4.3 Sei I ein Intervall in R. (Allgemeiner darf I eine beliebige Menge sein.) Eine Abbildung γ : I → R2 bedeutet, dass jedem t ∈ I ein Paar (x, y) mit x, y ∈ R zugeordnet wird. Das heißt, die Abbildung γ ist durch dasjenige Paar von Abbildugen (γ1 , γ2 ) gegeben, welches γ(t) = (γ1 (t), γ2 (t)) für jedes t ∈ I erfüllt. (Beachte, dass man eine Abbildung R2 → R, also in umgekehrter Richtung, meist nicht durch ein Paar von Abbildungen beschreiben kann! Eines von vielen möglichen Beispielen ist die Abbildung f , die durch f (x, y) = xy + x + y beschrieben wird.) 190 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Definition 7.4.4 Eine ebene parametrisierte Kurve ist eine stetige Abbildung γ : I → R2 , wobei I ein Intervall ist. Dabei heißt γ : I → R2 eine stetige Abbildung, wenn limx→a γ(x) = γ(a) für jedes a ∈ I gilt, das heißt, wenn sie als Paar stetiger Abbildungen (γ1 , γ2 ) mit γi : I → R gegeben ist. Wegen obiger Bemerkung gilt die Stetigkeit der Abbildung, wenn sie bzgl. eines Koordinatensystems gilt, auch für alle anderen. Anschaulich bedeutet eine parametrisierte Kurve, dass man einen Punkt, abhängig von der Zeit, in der Ebene bewegt – und zwar stetig, d.h. ohne Sprünge. Wenn man z.B einen Kreis mit dem Zirkel zeichnet, macht man so etwas. Natürlich kann man allgemein Abbildungen γ : I → Rn betrachten. Ist n = 3, so spricht man von Raumkurven. Manchmal nennt man das Bild von γ (in obigem Beispiel den fertig gezeichneten Kreis) die Spur von γ. Achte darauf, dass eine parametrisierte Kurve begrifflich nicht dasselbe bedeutet, wie ihre Spur. Erstere ist eine Abbildung von einem Intervall nach R2 , letztere eine Teilmenge des R2 . γ(0) γ(1) = γ(2) γ(3) 3 γ(—) 2 Beispiele 7.4.5 a) Die parametrisierte Kurve γ : R → R2 , t 7→ (t, , t2 ) durchläuft die Parabel {(x, x2 ) | x ∈ R}, d.h. den Graphen der Funktion f (x) = x2 . Die Parabel ist die Spur dieser parametrisierten Kurve. b) Allgemeiner: Ist f : I → R eine stetige Funktion, so ist γ : I → R2 , t 7→ (t, f (t)) eine parametrisierte Kurve, deren Spur der Graph von f ist. c) Peano-Kurven. Man sollte nicht glauben, dass es so etwas Verücktes wirklich gibt, nämlich surjektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1]. Die Stetigkeit γ : I → R2 ist also eine schwächere Bedingung als man denkt. Bijektive stetige Abbildungen [0, 1] → [0, 1] × [0, 1] gibt es aber nicht. 7.4.6 Ableitung einer parametrisierten Kurve. Sei γ : I → R2 eine parametrisierte Kurve. Für t ∈ I fassen wir γ(t) als Vektor auf: γ1 (t) γ(t) = γ2 (t) 7.4. SINUS UND COSINUS 191 Wenn t0 , t0 + h ∈ I also γ(t0 ), γ(t0 + h) definiert sind, dann soll natürlich γ(t0 + h) − γ(t0 ) die Differenz der Vektoren γ(t0 + h) und γ(t0 ) bedeuten. Wir können also den ’Differenzenquotienten’ ! γ1 (t0 +h)−γ1 (t0 ) 1 h (γ(t0 + h) − γ(t0 )) = . γ2 (t0 +h)−γ2 (t0 ) h h definieren. Dann kann man auch von einer möglichen Ableitung sprechen. Wir setzen 1 γ 0 (t0 ) := lim (γ(t0 + h) − γ(t0 )) = h→0 h ! γ1 (t0 +h)−γ1 (t0 ) 0 γ (t ) 0 1 h lim = γ2 (t0 +h)−γ2 (t0 ) γ20 (t0 ) h→0 h so dieser Limes denn existiert. Offenbar ist das genau dann so, wenn die Ableitungen γ10 (t0 ) und γ20 (t0 ) in t0 existieren. Der Differenzenquotient h1 (γ(t0 + h) − γ(t0 )) ist ein Vielfaches des Vektors, der durch den Pfeil (γ(x0 ), γ(x0 + h)) gegeben wird. γ(t0) γ(t0+h0) – γ(t0) γ(t0+h1) – γ(t0) γ(t0+h0) γ(t0+h1) Wenn wir h gegen 0 gehen lassen, nähert sich der Differenzenquotient einem Vektor, der, wenn man ihn in γ(x0 ) beginnen lässt, im anschaulichen Sinn ein Tangentenvektor an die Kurve γ(I) ist. Definition 7.4.7 Eine parametrisierte Kurve γ : I → R2 heißt differenzierbar, wenn in allen t ∈ I die Ableitung von γ existiert. 7.4.8 Sei jetzt die Ebene mit einem orthonormierten Koordinatensystem versehen. Dann nennt man den Vektor γ 0 (t) = (γ10 (t), γ20p (t)) auch den Geschwindigkeitsvektor von γ in (d.h. zum Zeitpunkt) t0 . Er hat die Länge γ10 (t0 )2 + γ20 (t0 )2 . Diese nennen wir die Absolutgeschwindigkeit von γ in t0 . Bemerkungen 7.4.9 Es kann sein, dass in einem (Zeit-)Punkt t0 sowohl γ10 (t0 ) = 0 als auch γ20 (t0 ) = 0 ist. In diesem Fall kannst Du Überraschungen erleben: 192 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG a) Betrachte z.B. γ1 (t) = γ2 (t) = t2 insbesondere im Punkte (0, 0). Die Spur dieser Kurve ist die Halbgerade {(x, x) ∈ R2 | x ≥ 0} Verfolge den Weg, den γ(t) = (γ1 (t), γ2 (t) auf dem Intervall [−1, 1] durchläuft. Man startet im Punkt (1, 1) läuft geradenwegs nach (0, 0) und von dort wieder auf geradem Weg zurück nach (1, 1). b) Ein weiteres Beispiel: γ(t) = (γ1 (t), γ2 (t)) γ1 (t) = −t2 für t ≤ 0 t2 für t > 0 und γ2 (t) = t2 . Die Spur dieser Kurve ist der Graph der Funktion f : R → R mit f (x) = |x|. 7.4.10 Der Kreis als parametrisierte Kurve. Wir haben die Funktionen Sinus und Cosinus so definiert, dass die Abbildung R → R2 , t 7→ (cos t, sin t) den Einheitskreis parametrisiert, d.h. eine parametrisierte Kurve beschreibt, deren Spur der Einheitskreis ist. Nach Definition ist der Betrag des Geschwindigkeitsvektors für jeden Zeitpunkt gleich 1. Ferner ist er immer gegen den Ortsvektor in mathematisch positiver Richtung um π/2 = 90o verdreht, ist also gleich (− sin t, cos t). Das bedeutet (cos0 t, sin0 t) = (− sin t, cos t), d.h. sin0 t = cos t, cos0 t = − sin t . γ'(t) cos t γ(t) π/2 t –sin t Satz 7.4.11 Die Funktionen cos, sin : R → R sind differenzierbar. Und es gilt sin0 t = cos t, cos0 t = − sin t . 7.4. SINUS UND COSINUS 193 Beispiele 7.4.12 Mit Hilfe des Sinus (der Cosinus tut’s auch) lassen sich auf einfache Weise Beispiele von Funktionen bilden, die sich außergewöhnlich verhalten. a) Betrachte die Funktion ϕ(x) = sin( x1 ), die auf R∗ = R − {0} definiert ist. Nähert sich x der Zahl 0, so ‘oszilliert’ sie immer schneller. In jedem noch so kleinen Intervall ]0, ε[ nimmt sie jede Zahl des Intervalles [−1, 1] unendlich oft als Wert an. (Dasselbe gilt natürlich auch für jedes Intervall ] − ε, 0[.) Somit gibt es kein a ∈ R derart, dass die Funktion f1 : R → R mit f1 (0) = a und f1 (x) = ϕ(x) für x 6= 0 stetig wäre. b) Betrachte nun die Funktion f2 : R → R mit f2 (0) = 0 und f2 (x) = x · ϕ(x) für x 6= 0 Für jedes x ∈ R gilt |f2 (x)| ≤ |x|. Ist also (xn )n∈N eine Folge mit limn→∞ xn = 0, so muss wegen |f2 (xn ) − 0| ≤ |xn − 0| auch die Folge (f2 (xn ))n∈N gegen 0 konvergieren. Diese Funktion ist also in 0 stetig; ihre Stetigkeit und Differenzierbarkeit außerhalb 0 folgt, da sie dort eine Verknüpfung differenzierbarer Funktionen ist. Allerdings ist f2 in 0 nicht differenzierbar. Ihre Ableitung in 0 müsste folgender Limes sein: f (x) . x→0 x lim Für x 6= 0 ist aber f (x) = ϕ(x), und gemäß a) existiert limx→0 ϕ(x) nicht! x c) Die Funktion f3 : R → R mit f3 (0) = 0 und f3 (x) = x2 · ϕ(x) für x 6= 0 ist überall – auch in 0 differenzierbar. Aber ihre Ableitung ist in 0 nicht mehr stetig. Denn f30 (0) = 0 und für x 6= 0 gilt 1 1 1 1 1 2 0 f3 (x) = 2x · sin − x cos = 2x · sin − cos 2 x x x x x Nun ist die Summe einer in einem Punkt x0 stetigen und einer in x0 unstetigen Funktion in x0 unstetig. Daraus folgt, dass f30 in 0 nicht stetig ist. (Sind α, β, γ Funktionen auf demselben Intervall mit α + β = γ und sind α, γ im Punkt a stetig, so ist β = α − γ es auch.) d) Definiere f4 (x) := f3 (x) − 2x2 . Da |f3 (x)| ≤ x2 , also f4 (x) ≤ −x2 , ferner f4 (0) = 0 für alle x gilt, hat f4 in 0 ein ‘absolutes’ Maximum; d.h. f4 (0) > f4 (x) für alle x 6= 0. Andererseits gibt es beliebig nahe bei 0 Punkte x < 0 mit f40 (x) < 0 und ebenso Punkte x > 0 mit f40 (x) > 0. Es gibt also keine ε-Umgebung in der links von 0 die Funktion monoton wächst und rechts von 0 monoton fällt, mag ε > 0 noch so klein sein. Berechne dazu außerhalb 0 die Ableitung f40 = f30 − 2x = 2x(sin x1 − 1) − cos x1 . Es gilt |2x(sin x1 − 1)| ≤ 2|x|(1 + 1) = 4|x| < 1 für |x| < 1/4, während cos x1 für x ∈ ] − 14 , 14 [−{0} unendlich oft sowohl den Wert 1, wie den Wert −1 annimmt. 194 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG sin x 7.4.13 Tangens. Die Funktion tan(x) := ist überall da definiert, wo cos x 6= 0 ist. Sie cos x heißt der Tangens von x. Die Nullstellen des Cosinus sind alle π/2 + nπ, wo n die ganzen Zahlen durchläuft. Das heißt, dass der Definitionsbereich des Tangens die Vereinigung der unendlich vielen offenen Intervalle ]nπ − π/2 , nπ + π/2[ ist, wo n die ganzen Zahlen durchläuft. (Geometrisch gesehen, ist tan α die Steigung der Geraden durch den Nullpunkt, die mit der positiven x-Achse, den Winkel α bildet.) Die Ableitung des Tangens ist nach der Quotientenregel tan0 x = sin0 (x) cos(x) − sin(x) cos0 (x) cos2 x + sin2 x 1 = = . 2 2 cos x cos x cos2 x Diese ist auf dem ganzen Definitionsbereich des Tangens positiv. Also ist der Tangens auf jedem der Intervalle ]nπ − π/2 , nπ + π/2[ streng monoton wachsend. Geht x von unten gegen π/2, so geht tan x gegen ∞. Geht hingegen x von oben gegen −π/2, so geht der Zähler sin gegen −1 und der Nenner von oben gegen 0, also der Tangens gegen −∞. In 0 liegt eine Nullstelle vor, da der Zähler dort 0 und der Nenner 1 ist. Es ist tan(−x) = sin(−x) − sin x = = − tan(x). cos(−x) cos x Also ist der Graph punktsymmetrisch bzgl. des Ursprungs. Geht x von unten gegen π/2, so geht tan x gegen ∞. Da sin(x + π) = − sin x und cos(x + π) = − cos x, ist tan(x + π) = tan x, Offenbar ist die Einschränkung des Tangens auf das Intervall ] − π/2 , π/2[ eine bijektive Abildung von diesem Intervall nach R. Es gibt also eine Umkehrfunktion arctan : R → ]− π/2 , π/2[ . Sie wird Arcus-Tangens genannt. Beachte, dass man eine Umkehrfunktion des Tangens nur dann (als Abbildung im strengen Sinn) bilden kann, wenn man seinen Definitionsbereich geeignet einschränkt, z.B. auf das oben genannte Intervall ] − π/2 , π/2[. Dies ist auch möglich, wenn man den Tangens auf ein anderes Intervall der Form ]nπ − π/2 , nπ + π/2[ einschränkt. Die Wahl n = 0 ist jedoch in gewisser Weise ausgezeichnet. 7.4.14 Auch wenn man Umkehrfunktionen des Sinus und des Cosinus bilden möchte, muss man durch geeignete Einschränkungen den Sinus bzw. Cosinus bijektiv machen. Für den Sinus wählt man gemeinhin den Definitionsbereich [−π/2 , π/2], für den Cosinus [0, π]. Denn offenbar hat man bijektive differenzierbare Funktionen sin : [−π/2 , π/2] → [−1 , 1] , sowie cos : [0 , π] → [−1 , 1] . 7.4. SINUS UND COSINUS 195 1 1 0 –π/2 π/2 –1 0 π/2 π –1 Die Umkehrfunktionen heißen Arcus-Sinus, bzw. Arcus-Cosinus und werden mit arcsin, bzw. arccos bezeichnet. Sie haben als Definitionsbereich das abgeschlossene Intervall [−1 , 1], sind aber nur auf dem offenen Intervall ]− 1 , 1[ differenzierbar. 7.4.15 Wir wollen noch die Ableitungen der genannten Umkehrfunktionen p bestimmen. 2 2 Zunächst erinnern wir uns an die Formel cos x + sin x = 1, d.h. cos x = 1 − sin2 x, jedenfalls dort, wo cos x ≥ 0 ist. a) Zum Arcus-Sinus: Nach der Regel der Ableitung einer Umkehrfunktion ist arcsin0 x = 1 1 1 1 √ = =p = . sin (arcsin x) cos(arcsin x) 1 − x2 1 − sin2 (arcsin) 0 Die Wurzel ist in R+ zu wählen, da der Cosinus im wie oben eingeschränkten Definitionsbereich des Sinus nichtnegativ ist. b) Entsprechend ergibt sich als Ableitung des Arcus-Cosinus: arccos0 x = − √ c) Zum Arcus-Tangens: arctan0 (x) = x2 . Ferner ist tan2 (y) = cos2 y = 1 . 1 − x2 1 = cos2 (arctan x). Nun gilt tan2 (arctan x) = tan (arctan x) 0 sin2 y 1 − cos2 y 1 = = − 1 , also 2 2 cos y cos y cos2 y 1 1 , und deshalb arctan0 (x) = cos2 (arctan x) = 2 1 + tan y 1 + x2 Wie die Ableitung des Logarithmus ist also auch die Ableitung des des Arcus-Tangens eine rationale Funktion. sin x arcsin x . Gilt deshalb auch arctan x = ??? cos x arccos x Ich muss gestehen, ich hätte nie geglaubt, dass irgendjemand auf die Idee kommen würde, dies könnte gelten. Leider habe ich das doch erlebt! 7.4.16 Frage. Es gilt ja tan x = 196 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Antwort. Nun für x = 0 gilt diese Gleichung sogar, da sin 0 = 0, also arcsin 0 = 0 = arctan 0 ist. Aber, da sin(π/4) = cos(π/4) = 2−1/2 ist, ist tan(π/4) = 1, also arctan 1 = π/4. Daraus folgt arctan(−1) = −π/4. Aber es ist arccos(−1) = π und arcsin(−1) = −π/2, also arcsin(−1) = −1/2 6= π/4. Abgesehen davon ist arctan auf ganz R definiert, arcsin und arccos arccos(−1) hingegen nur auf [−1, 1]. 7.4.17 Eine Reihe die gegen π/4 konvergiert. Die Funktion f (x) = (1 + x2 )−1 , d.h. die Ableitung des Arcus-Tangens lässt sich für |x| < 1 als folgende geometrische Reihe schreiben: ∞ X 1 2 4 6 = 1 − x + x − x ± · · · = (−1)n x2n 1 − (−x2 ) n=0 Betrachte dazu die folgende Funktion ∞ X x2n+1 x3 x5 x7 F (x) = x − + − ± ··· = (−1)n 3 5 7 2n + 1 n=0 Wie Du an der Uni lernen wirst, darf man Potenzreihen gliedweise differenzieren (s. z.B. Forster). Also ist F 0 = f und andererseits arctan0 = f . Deshalb ist F (x) − arctan(x) = c, eine Konstante, was ich als anschaulich klar ansehen will. Da ferner offenbar arctan(0) = 0 = F (0) ist, gilt schließlich arctan(x) = F (x) für |x| < 1. Für x = 1 konvergiert die Reihe F nach dem Leibnizkriterium. Nach dem Abelschen Grenzwertsatz, auf dessen Beweis im ersten Semester Du Dich freuen darfst, ist dann F (1) = arctan(1) = π/4, ausgeschrieben (Leibniz): ∞ X (−1)n π 1 1 1 = 1 − + − ± ··· = 4 3 5 7 2n + 1 n=0 Außer den großen Lücken, die ich im Beweis gelassen habe, gibt es noch den weiteren Wermutstropfen, dass diese Reihe nicht besonders gut konvergiert. 7.5 Zur Gestalt von Funktionsgraphen Betrachte die uns bekannte Funktion f : R → R, f (x) = x3 − 5x2 + 6x + 1. 4 3 2 1 1 2 3 4 7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN 197 Bis zu dem Punkt x1 ≈ 0,8 wächst diese Funktion, um anschließend wieder bis zum Punkt x2 ≈ 2,6 zu fallen, von dem aus sie wieder wächst. (Weiter unten werden x1 , x2 genauer bestimmt.) Wie kann man das erkennen, wenn man nicht allzu viele Funktionswerte berechnen möchte? (Und selbst, wenn man die Funktionswerte an sehr vielen Stellen bestimmt hat, wissen wir kritischen Mathematiker im Grunde nicht, was zwischen diesen Stellen passiert, auch wenn der Praktiker unnötig finden mag.) Du weißt vielleicht schon, dass hierzu die Differenzialrechnung nützlich ist. Dies wollen wir in diesem Abschnitt genauer untersuchen. Dabei wirst Du, möglicherweise überrascht, feststellen, dass es zur Bestimmung lokaler Extrema manchmal sinnvoll ist, die zweite Ableitung f 00 (s.u.) der untersuchten Funktion f außer Betracht zu lassen, und sich stattdessen die erste Ableitung genauer anzusehen, und nicht nur ihre Nullstellen auszurechnen. Möchte man allerdings wissen, in welche Richtung der Graph der Funktion f gekrümmt ist, lohnt es sich schon f 00 zu berechnen. Definition 7.5.1 Sei f : I → R eine differenzierbare Funktion und f 0 ihre Ableitung. Möglicherweise kann man f 0 wieder differenzieren. Dann wollen wir mit f 00 die Ableitung von f 0 bezeichnen. (f 00 := (f 0 )0 .) Dieses f 00 nennt man dann die zweite Ableitung von f . Indem man das Verfahren iteriert, kann man auch versuchen, f 000 , die dritte Ableitung usw. zu bilden. Werden Dir der Striche zuviele, schreibe f (4) für die vierte Ableitung usw., f (n) für die n-te Ableitung. Eine Funktion f heißt n-mal differenzierbar, wenn f (n) existiert. Sie heißt n-mal stetig differenzierbar, wenn f (n) existiert und stetig ist. In den beiden Punkten x1 und x2 hat die obige Funktion f (x) = x3 − 5x2 + 6x + 1 lokale Extremwerte im Sinne der folgenden Definition: Definitionen 7.5.2 Sei f : I → R eine Funktion auf einem (endlichen oder unendlichen) Intervall I und x0 ∈ I. a) f heißt (auf I) monoton wachsend, wenn für alle x, y ∈ I mit x < y die Ungleichung f (x) ≤ f (y) gilt. f heißt streng monoton wachsend, wenn aus x < y immer f (x) < f (y) folgt. (Manchmal nennt man eine monoton wachsende Funktion auch schwach monoton wachsend, wenn man betonen will, dass sie nicht notwendig streng monoton wachsend ist.) b) Analog verwendet man die Bezeichnungen (schwach) monoton fallend und streng monoton fallend. c) Man sagt, f habe in x0 ein lokales Maximum (bzw. ein lokales Minimum), wenn es in I eine ε-Umgebung von x0 gibt, in der f keine größeren, (bzw. kleineren) Werte als f (x0 ) annimmt. Ein lokales Extremum ist ein lokales Maximum oder ein lokales Minimum. d) Man sagt f habe in x0 ein absolutes Maximum bzw. absolutes Minimum, falls f (x0 ) ≥ f (x) bzw. f (x0 ) ≤ f (x) für alle x ∈ I ist. Analog zu c) vermagst Du sicher zu definieren, was ein absolutes Extremum bedeutet. 198 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Beachte, dass f : I → R ein lokales Extremum nach obiger Definition nicht in einem Randpunkt von I annehmen kann. (Du darfst natürlich die Definition nach eigenem Gusto treffen, musst allerdings im folgenden Satz ausschließen, dass x0 ein Randpunkt ist.) Folgender Zuammenhang besteht zwischen den lokalen Extremwerten einer differenzierbaren Funktion und den Nullstellen ihrer Ableitung. Satz 7.5.3 Ist I ein Intervall, f : I → R eine differenzierbare Funktion, die in x0 ∈ I ein lokales Extremum hat, so gilt f 0 (x0 ) = 0. Beachte folgende Punkte: a) Nach Voraussetzung ist f 0 (x0 ) definiert und x0 kein Randpunkt von I. b) Die Umkehrung dieses Satzes gilt nicht. Die Funktion f (x) = x3 hat in 0 die Ableitung 0 (d.h. ihr Graph hat dort eine waagerechte Tangente). Trotzdem ist sie überall streng monoton wachsend. c) Wenn x0 ein Randpunkt von I ist, braucht die Behauptung des Satzes nicht zu gelten, auch wenn f dort ein absolutes Extremum hat. Die Funktion f : [0, 1] → R mit f (x) = x hat in 0 ein absolutes Minimum, in 1 ein absolutes Maximum. Beweis: Sei etwa f (x0 ) ≥ f (x) für alle x in einer geeigneten ε-Umgebung in I von x0 , so ist f (x) − f (x0 ) f (x) − f (x0 ) ≥ 0 für x0 − ε < x < x0 und ≤ 0 für x0 + ε > x > x0 . x − x0 x − x0 Daraus folgt, dass der nach Voraussetzung existierende Grenzwert lim x→x0 f (x) − f (x0 ) x − x0 sowohl ≤ 0 als auch ≥ 0 sein muss, also nur gleich 0 sein kann. Die lokalen Extrema einer auf einem offenen Intervall definierten differenzierbaren Funktion liegen also bei gewissen Nullstellen ihrer Ableitung. Den folgenden Satz gebe ich ohne Beweis. Ich sehe ihn vielmehr als anschaulich klar an. Satz 7.5.4 Sei f : I → R eine differenzierbare Funktion auf einem Intervall I. Gilt f 0 (x) > 0 (bzw. f 0 (x) < 0) für alle x ∈ I, so ist f auf I streng monoton wachsend (bzw. fallend). Die Voraussetzung kann man abschwächen. Es genügt zu fordern, dass überall f 0 (x) ≥ 0 (bzw. f 0 (x) ≤ 0) ist, aber f 0 (x) = 0 nur an endlich (oder auch nur an abzählbar) vielen Stellen stattfindet. Beispiel 7.5.5 Wir behandeln die o.a. Funktion f (x) = x3 − 5x2 + 6x + 1 und sehen uns ihre Ableitung f 0 an: f 0 (x) = 3x2 − 10x + 6. Deren Nullstellen finden wir mit Hilfe quadratischer Ergänzung: f 0 (x) = 3(x2 − 10 5 25 5 7 x + 2) = 3((x − )2 + 2 − ) = 3((x − )2 − ) 3 3 9 3 9 7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN 199 Die Nullstellen der Ableitung sind also 5 x1 := − 3 r 7 5 und x2 := + 9 3 Ferner siehst Du: 1. Überall dort, wo (x − 53 )2 > wachsend. 2. Wo (x − 53 )2 < 7 9 7 9 r 7 . 9 ist, ist f 0 (x) > 0. Dort ist f streng monoton ist, ist f 0 (x) < 0. Dort ist f streng monoton fallend. Der 1. Fall tritt für alle x < x1 und für alle x > x2 ein. Der 2. Fall tritt ein, falls x in dem offenen Intervall ]x1 , x2 [ liegt. Somit haben wir obige Aussagen über den Graph von f bestätigt. Möglicher Weise bist Du es gewohnt, die Werte der 2. Ableitung in den Punkten x1 und x2 zu betrachten. Es ist f 00 (x) = 6x − 10, und Du kannst rechnen: p p 5 p f 00 (a) = 6( − 7/9) − 10 = −6 7/9 < 0 , f 00 (b) = 6 7/9 > 0 . 3 Da f 00 (als Polynom) stetig ist, gilt f 00 (x) < 0 (bzw. f 00 (x) > 0) in einer ε-Umgebung von x1 (bzw. von x2 ) für ein geeignetes ε > 0. Also ist f 0 in einer Umgebung von x1 streng monoton fallend (bzw. in einer Umgebung von x2 streng monoton wachsend). Also hat f 0 nahe x1 links von x1 positive und rechts von x1 negative Werte. Entsprechend hat f 0 nahe x2 links von x2 negative und rechts von x2 positive Werte. Somit ist f nahe x1 links von x1 streng monoton steigend und rechts von x1 monoton fallend. D.h. f hat in a ein lokales Maximum. Entsprechend hat f in b ein lokales Minimum. Indem Du die oben angewandten Argumente in einer allgemeineren Situation benutzt, siehst Du sicher folgenden Satz ein: Satz 7.5.6 Sei I ein offenes Intervall, f : I → R eine 2-mal stetig differenzierbare Funktion. (Letzteres bedeutet, dass f 0 und f 00 auf ganz I existieren und f 00 dort stetig ist. f und f 0 sind dann – weil differenzierbar – auch stetig.) Sei a ∈ I, f 0 (a) = 0, ferner f 00 (a) < 0 (bzw. f 00 (a) > 0) so hat f in a ein lokales Maximum (bzw. ein lokales Minimum). Beachte die Zuordnung: Maximum, wenn f 00 (a) < 0, und Minimum, wenn f 00 (a) > 0 – nicht etwa umgekehrt! Bemerkung 7.5.7 Es gibt aber viele Fälle, wo es einfacher ist, die Ableitung f 0 in der Nähe ihrer Nullstellen genauer anzusehen als in diesen das Vorzeichen von f 00 zu bestimmen, und zwar aus folgenden Gründen: 1) Die Berechnung von f 00 mag kompliziert sein. Nur bei Polynomen ist f 00 von einfacherer Gestalt als f 0 . 200 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG 2) Manchmal ist ein Punkt a gleichermaßen eine Nullstelle von f 0 wie von f 00 , zum Beispiel a = 0 für f (x) = ±xn , wenn n ≥ 3 ist. In einem solchen Fall kann in a ein lokales Maximum, ein lokales Minimum oder keines von beidem vorliegen. Wenn Du magst, kannst Du versuchen, Aussagen darüber zu beweisen, was passiert, wenn k > 0 die kleinste Zahl mit f (k) 6= 0 ist und dieses k gerade oder ungerade ist. Aber es gibt sogar nichtkonstante Funktionen, für die alle Ableitungen f (n) existieren, und f (n) (a) = 0 für alle n gilt. Ein Beispiel findest Du in den Übungen. Sogar, wenn die Ableitung zwar nicht in a, aber für alle x ∈ I − {a} existiert, kann die Betrachtung der Ableitung in der Nähe von a nützlich sein. Dies zeigt folgender Satz, der fast trivial ist. Satz 7.5.8 Sei I ein Intervall und f : I → R stetig. Sei a ∈ I kein Randpunkt und f auf I − {a} differenzierbar. a) Es gebe ein ε > 0, derart dass f 0 (x) > 0 für alle x ∈]a−ε, a[ und f (x) < 0 für alle x ∈]a, a+ε[ ist, dann hat f in a ein lokales Maximum. Analog gilt: f hat in a ein lokales Minimum, wenn ... b) Gilt f 0 (x) > 0 für alle x ∈]a − ε, a + ε[, x 6= a, so liegt in a kein lokales Extremum vor. Dasselbe gilt, wenn f 0 (x) < 0 in einem solchem Bereich ist. Die Umkehrung von a) gilt leider nicht, wie Beispiel d) in (7.4.12) uns gelehrt hat. (Die Aussage b) wirst Du kaum umkehren wollen.) Beispiele 7.5.9 a) Ein Beispiel ist f (x) = |x|, welche nach diesem Satz in 0 ein lokales Minimum hat, was du natürlich eh weißt. b) Ein Beispiel für b) ist die Funktion f (x) = xu , wo u eine ungerade natürliche Zahl ist. √ 3 c) (Neilsche Parabel) Betrachte f : R → R, definiert durch f (x) = x2/3 = x2 . Diese Funktion ist in der Tat überall definiert und stetig. Ihre Ableitung f 0 (x) = 32 x−1/3 ist allerdings nur auf R∗ , d.h. überall außer in 0, definiert. Links vom Nullpunkt ist sie negativ, rechts positiv. Also hat f in 0 ein lokales (sogar absolutes) Minimum. Ferner gilt: Nähert man sich dem Nullpunkt von links (bzw. rechts), so geht die Ableitung monoton gegen −∞ (bzw. ∞). In 0 hat der Graph von f eine Spitze. 1 –1 1 7.5. ZUR GESTALT VON FUNKTIONSGRAPHEN 201 Definitionen 7.5.10 Sei f : I → R eine Funktion auf dem Intervall I. Sie heißt dort konvex, wenn für je zwei Punkte x1 , x2 ∈ I und jedes λ ∈ [0, 1] die Ungleichung f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ) gilt. Die Funktion f heißt auf I konkav, wenn −f konvex ist. Bemerkung 7.5.11 Konvex zu sein bedeutet also, dass zu je zwei x-Stellen der Graph der Funktion unterhalb der zugehörigen Sekante verläuft. Das heißt aber, dass der Graph der Funktion (mit wachsendem x) linksgekrümmt ist. (Im Grenzfall ist er gerade.) Die Definition von ‘konvex’ ist einigermaßen willkürlich. Meiner Meinung nach könnte man die Bezeichnungen konvex und konkav genau so gut vertauschen. Gemäß obiger (allgemein üblichen) Definition wölbt sich der Graph einer konvexen Funktion nach unten. 7.5.12 Die zweite Ableitung kann man benutzen, um zu sehen, ob die Funktion in einem Intervall konvex oder konkav ist. Denn wenn f 00 auf einem Intervall I existiert und dort überall ≥ 0 ist, bedeutet das, dass die lokale Steigung der Funktion mit wachsendem x zunimmt, oder zumindest nie abnimmt, d.h. dass die Funktion auf I konvex ist. Definition 7.5.13 Sei f : I → R eine differenzierbare Funktion auf dem Intervall I und x0 ein innerer Punkt von I. Man sagt, der Punkt (x0 , f (x0 )) ist ein Wendepunkt von f , wenn es ein ε > 0 derart gibt, dass f entweder auf ]x0 − ε, x0 ] konvex und auf [x0 , x0 + ε[ konkav ist, oder auf ]x0 − ε, x0 ] konkav und auf [x0 , x0 + ε[ konvex ist. 7.5.14 Wenn eine Funktion auf einem Intervall I zweimal stetig differenzierbar ist (d.h. ihre zweite Ableitung existiert und stetig ist) und den Wendepunkt (x0 , f (x0 )) (mit x0 ∈ I) hat, gilt f 00 (x0 ) = 0. Denn f 00 wechselt bei x0 das Vorzeichen, da der Graph von f auf der einen Seite von x0 konvex, auf der anderen konkav ist. Hinreichend, dafür, dass (x0 , f (x0 )) ein Wendepunkt sei, ist die Bedingung f 00 (x0 ) = 0 keineswegs, wie das Beispiel f (x) = x4 , x0 = 0 zeigt. Bei dieser Funktion ist f 00 (x) ≥ 0 auf beiden Seiten von 0. Also ist diese Funktion auf beiden Seiten konvex. Hingegen hat die Funktion f (x) = x5 in 0 einen Wendepunkt. Sie ist links von 0 konkav, rechts von 0 konvex. AUFGABEN Eine Polynomfunktion hat die Form f (x) = an xn + an−1 xn−1 + · · · + a1 x1 + a0 x0 . (Natürlich schreibt man die letzten beiden Summanden in der Regel a1 x, a0 .) Das Nullpolynom ist als Polynomfunktion die Nullfunktion. Dessen Grad ist per definitionem gleich −∞. Ansonsten gibt es ein n mit an 6= 0 und ak = 0 für alle k > n. In diesem Fall ist der Grad der Polynomfunktion 202 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG gleich n und an wird als der Leitkoeffizient bezeichnet. Wenn man durch an dividiert, erhält man eine Polynomfunktion mit dem Leitkoeffizienten 1, die sich von der ursprünglichen Funktion nur durch einen konstanten Faktor unterscheidet. Der Graph der ursprünglichen Funktion entsteht aus der neuen durch Streckung oder Stauchung in Richtung der y-Achse“ und möglicher ” Weise noch einer Spiegelung an der x-Achse“. Die x ∈ R, wo f eine Nullstelle, bzw. in Extre” mum hat, bleiben dieselben. Allerdings, war an < 0, so liegt ein Minimum (bzw. Maximum) dort, wo vorher ein Maximum (bzw. Minimum) lag. Jedenfalls bedeutet es keine ernsthafte Einschränkung, wenn man sich auf Polynomfunktionen beschränkt, deren Leitkoeffizient gleich 1 ist. 1. Diskutiere allgemeine Polynomfunktionen f vom Grad ≤ 3. Zeige: a) Ist grad(f ) ≤ 0, d.h. grad(f ) = −∞ oder grad(f ) = 0, so ist der Graph von f eine Gerade parallel zur x-Achse. b) Ist grad(f ) = 1, so ist der Graph von f eine Gerade, die weder parallel zur x- noch zur y-Achse ist. (Eine Parallele zur y-Achse ist kein Graph einer Funktion.) f hat genau eine Nullstelle. c) Ist grad(f ) = 2, so gibt es genau ein x0 , in dem f ein lokales Extremum hat. Dieses ist auch ein globales Extremum. Je nach dem Vorzeichen des Leitkoeffizienten ist der Graph überall konvex oder überall konkav. Sei etwa der Leitkoeffizient positiv. Dann ist das (lokale und globale) Extremum ein Minimum. Je nachdem ob f (x0 ) > 0 oder = 0 oder < 0 ist, hat f keine, eine oder 2 Nullstellen im Reellen. d) Sei f (x) = a3 x3 + a2 x2 + a1 x + a0 und a3 > 0. Dann ist f für x ≤ a2 /(3a3 ) konkav, für x ≥ a2 /(3a3 ) konvex und hat in a2 /(3a3 ) einen Wendepunkt. Unterscheide nun zwei Fälle: 1. f 0 hat höchstens eine Nullstelle, d.h. f 0 (x) ≥ 0 gilt für alle x ∈ R und f 0 (x) > 0 für x 6= 0. Dann ist f überall streng monoton wachsend. Somit hat f nur eine reelle Nullstelle. 2. f 0 hat zwei verschiedene Nullstellen x1 und x2 . Dann ist f für x ≥ x1 streng monoton wachsend für x ≤ x1 , streng monoton fallend für x1 ≤ x ≤ x2 und wieder streng monoton wachsend für x2 ≤ x. Durch Veränderung des konstanten Koeffizienten, kann man erreichen, dass f eine, zwei, oder drei reelle Nullstellen hat. e) Wenn Du magst, kannst Du noch ein wenig über Polynome 4. Grades herausfinden. Bei positivem Leitkoeffizienten kann es zwei lokale Minima und dazwischen ein lokales Maximum geben. das ist der Fall, wenn die Ableitung drei verschiedene Nullstellen hat. Usw. Überlege insbesondere, dass ein Polynom 4. Grades entweder zwei verschiedene Wendepunkte oder gar keinen solchen hat! 2. a) Zeige, dass die Abbildung ] − 1, 1] → R+ , gegeben durch x 7→ 1−x 1+x b) Zeige selbiges für die Abbildung ] − 1, 1[→ R, gegeben durch x 7→ bijektiv ist. x 1−x2 3. Betrachte für x = 6 0 die Funktion f (x) = exp(−1/x2 ). Wenn x gegen 0 geht, so geht −1/x2 gegen −∞, also f (x) gegen 0. Deshalb definieren wir f auf ganz R, indem wir noch f (0) = 0 7.6. AMÜSANTE FRAGEN ZU POTENZEN 203 setzen. Da f (x) > 0 für x 6= 0 gilt, hat f in 0 ein (absolutes) Minimum. Das kann man auch 2 −1 mit Hilfe der ersten Ableitung sehen. Diese ist nämlich f 0 (x) = 3 · exp , also negativ x x2 für x < 0 und positiv für x > 0. Auf der anderen Seite kann man mit einiger Mühe beweisen, dass f auch im 0-Punkt unendlich oft differenzierbar ist und f (n) (0) = 0 für alle n ≥ 0 gilt. (Mit f (n) wird die n-te Ableitung von f bezeichnet, wo f (0) = f sei.) 4. Sei f die Funktion der vorigen Aufgabe und g : R → R definiert durch −f (x) für x < 0 . g(x) := f (x) für x ≥ 0 Auch diese Funktion ist überall unendlich oft differenzierbar und es gilt g (n) (0) = 0 für alle n ≥ 0. Ferner hat g in 0 kein (lokales) Extremum. √ 5. Diskutiere die Funktionsgraphen von a) f (x) = x5 −x3 b) g(x) = x3 − 3 x c) h(x) = x2/3 +x−1 ln x 6. Der Graph der Funktion f (x) = , die auf R∗+ definiert ist, wird im folgendem Abschnitt x diskutiert. Das darfst Du natürlich bereits jetzt selber machen. 7. Definiere f : ]− 1, 1[→ R durch f (0) = 0 und f (x) = |x|/(ln |x|) für x 6= 0. Außerhalb 0 ist diese Funktion differenzierbar. Zeige, dass sie auch in 0 differenzierbar ist. Sie hat dort offenbar ein absolutes Maximum. 7.6 Amüsante Fragen zu Potenzen 7.6.1 Für beliebige reelle Zahlen a, b gilt: a + b = b + a und ab = ba. Für Potenzen ist das bekanntlich anders: 23 = 8, aber 32 = 9. Allgemein gilt: Sind a, b natürliche Zahlen, a gerade, b ungerade, so ist ab gerade und ba ungerade. Für ganze Zahlen a, b mit 3 ≤ a < b ist ba < ab . Hingegen gilt 24 = 42 . Gibt es weitere solche Fälle? Wir vergleichen 278 94 9 27 mit 4 8 und rechnen: 278 9 = 4 2 ! 32 · 94 2· 32 · 94 3 3 = = 2 2 3 ! 94 94 3 27 = 2 8 204 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Allgemeiner zeigt man ganz analog zur dieser Rechnung: Ist n n+1 1 1 a= 1+ , b= 1+ , n n so gilt ab = ba . Man erkennt schon hier, dass es unendlich viele Paare verschiedener rationaler Zahlen (a, b) mit ab = ba gibt. 7.6.2 Wir wollen alle Paare (x, y) positiver reeller Zahlen mit xy = y x finden. Will man Potenzen vergleichen, lohnt es sich häufig, sie zu logarithmieren! Es gilt: xy = y x ⇐⇒ ln(xy ) = ln(y x ) ⇐⇒ y ln x = x ln y ⇐⇒ ln x ln y = x y Will man also Paare (x, y) positiver reeller Zahlen mit xy = y x , x 6= y finden, so hat man die ln x Funktion f (x) = darauf zu untersuchen, ob sie mehrfach denselben Wert annimmt! x Deshalb werden wir diese Funktion auf ihrem Definitionsbereich, d.h. dem Bereich der positiven reellen Zahlen, jetzt diskutieren. Dabei benutzen wir die Differentialrechnung. i. Nullstellen: f (x) = 0 ⇐⇒ ln x = 0 ⇐⇒ x = 1. Offenbar ist f (x) < 0 für 0 < x < 1 und f (x) > 0 für x > 1. ii. Verhalten der Funktion nahe 0. Offenbar geht f (x) gegen −∞, wenn x (von oben) gegen 0 geht. iii. Die Ableitung: (1/x) · x − 1 · ln x 1 − ln x = 2 x x2 Also ist f 0 (x) = 0 genau dann, wenn x = e ist. Ferner ist f 0 (x) > 0 für 0 < x < e und f 0 (x) < 0 für x > e. f 0 (x) = Also kann man sich bereits ein Bild der Funktion machen. Ihr Graph steigt zwischen 0 und e monoton an, läuft bei 1 durch die x-Achse, erreicht bei e ein Maximum und fällt für x > e monoton, bleibt aber positiv. iv. Verhalten für große x. Man weiß, dass die Logarithmusfunktion sehr langsam wächst. Deshalb gilt limx→∞ f (x) = 0. Dies kannst Du leicht folgendermaßen sehen: Da f (x) für x ≥ e monoton fallend ist, genügt es, eine monoton wachsende Folge (xn )n>0 zu finden, für welche limn→∞ f (n) = 0 gilt. Eine solche Folge wird durch xn := en gegeben. Denn für diese gilt: f (n) = n/en . Nun folgt aus der Exponentialreihe en > 1 + n + n2 /2 > n2 /2. Somit ist n 2n 2 f (n) = n < 2 = e n n Da letzter Bruch für n → ∞ gegen 0 geht, tut dies auch f (n). Was erkennst Du aus den Eigenschaften i. bis iv.? 7.6. AMÜSANTE FRAGEN ZU POTENZEN 205 Zu jeder reellen Zahl x mit 1 < x < e gibt es genau eine weitere Zahl y mit f (x) = f (y), und dieses y ist größer als e. Nicht wahr? Es gibt also sehr viele Paare positiver reeller Zahlen (x, y), für die xy = y x , aber x 6= y gilt. Verlangt man allerdings, dass x, y beide ganz und positiv sind, so ist, bis auf die Reihenfolge, (2, 4) das einzige solche Paar, da 2 die einzige ganze Zahl ist die größer als 1 und kleiner als e ist. Beachte aber, dass auch (−2)−4 = 1 (−2)4 = 1 16 = (−4)−2 gilt. 7.6.3 Betrachte die Funktionen 1 1 f (x) := (1 + )x und g(x) := (1 + )x+1 x x für x > 0. Mit einiger Mühe kann man zeigen: Die Funktion f ist streng monoton wachsend, während g streng monoton fallend ist. Ferner gilt: 1 1 lim (1 + )x = 1 und lim (1 + )x = e. x→0 x→∞ x x Man berechnet leicht f (x)g(x) = g(x)f (x) . Somit hat man eine Parametrisierung der Paare (a, b) positiver reeller verschiedener Zahlen mit ab = ba gewonnen. Aus obigen Überlegungen folgt auch Satz 7.6.4 a) Es gelte 0 < a < b ≤ e. Dann ist ab < ba . b) Es gelte e ≤ a < b. Dann ist ba < ab . Z.B. ist π e < eπ . ln x ist auf dem Intervall ]0, e] streng monoton wachsend, wie wir x ln a ln b oben gesehen haben. Deshalb folgt aus der Voraussetzung, dass < . Dies impliziert a b b ln a < a ln b. (Beachte a, b > 0.) Da exp streng monoton wächst, ergibt sich exp(b ln a) < exp(a ln b), das heißt ab < ba . Beweis: a) Die Funktion b) Auf dem Intervall [e, ∞[ hingegen ist o.a. Funktion streng monoton fallend. Deshalb ergibt sich die umgekehrte Ungleichung. Bemerkungen 7.6.5 a) Du hast vielleicht das Gefühl, dass der Exponent in einer Potenz in stärkerem Maße ihre Größe bestimmt als die Basis. Das gilt aber nur, falls beide ≥ e sind. Falls beide ≤ e und positiv sind, gilt das umgekehrte. Im Fall a < e < b kann alles Mögliche passieren! Es ist 23 < 32 und 2,53 = 15,625 > 32,5 ≈ 15,59. Zu Anfang dieses Abschnittes haben wir für die Zahlen a = 9/4, welches kleiner als e, und b = 27/8, welches größer als e ist, die Gleichheit ab = ba besteht. 206 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG b) Zu meinem Erstaunen habe ich in einem neuen Mathe-Buch gelesen, im 19. Jahrhundert sei es eine Herausforderung gewesen, zu entscheiden, welche der beiden Zahlen π e und eπ die größere sei. Ich kann mir nicht vorstellen, dass Euler, der im 18. Jahrhundert gelebt hat, auch nur die geringste Schwierigkeit mit diesem Problem gehabt hätte. Der Unterschied zwischen den beiden Zahlen ist einerseits nicht allzu groß, andererseits nicht gerade winzig: π e ≈ 22,46, eπ ≈ 23,14. 7.6.6 Wir betrachten Potenztürme · ·· a aa In der Literatur habe für einen solchen Potenzturm folgende abkürzende Notation gefunden: nämlich n a, sprich ‘a Turm n’, wenn der Potenzturm n Stockwerke hat. Induktiv definiert, heißt das: n 1 a = a, n+1 a = a( a) Beachte aber, dass fast immer n+1 a 6= (n a)a ist! Man kann die induktive Definition auch mit 0 a = 1 oder, sage und schreibe, mit beginnen. −1 a = 0 2 7.6.7 Die Folge (2, 22 , 22 , . . .) ist streng monoton√wachsend und besteht aus ganzen Zahlen. Deshalb gilt limn→∞ n 2 = ∞. Auch die Folge (n ( 2))n ist streng monoton wachsend. Denn √ x √ √ √2 die Funktion √f (x) := 2 ist streng monoton wachsend. Deshalb ist 2 < 2 , folglich √ √ 2 √ √2 2 √ √ 2 < 2 . Usw. Man sieht (mit vollständiger Induktion) n ( 2) < n+1 ( 2). Analog gehts für alle (n b)n mit b > 1. Sind die Limites dieser Folgen immer ∞? Überraschender Weise gilt √ lim n ( 2) = 2 n→∞ √ Beweis: Wenn man in dem Potenzturm n ( √ 2) das oberste Stockwerk durch 2 ersetzt, erhält man eine Zahl T , die sicher größer ist als n ( 2). Andererseits überlegt man sich leicht, dass T = 2 ist. In einem exemplarischen Beispiel sieht man das so. √ √ 2 √ 2 2 √ √ 2 2 = 2 = √ 2 2 =2. √ 2 √ In √ jedem Schritt wird 2 = 2 genutzt. Es ist also n ( 2) < 2 für alle n ≥ 1. Da die Folge (n ( 2))n monoton wachsend und durch 2 nach oben beschränkt ist, hat sie einen endlichen Limes t ≤ 2. 2 Um t zu bestimmen, rechnen wir √ t 2 = √ √ limn→∞ n ( 2) 2 √ = lim n ( 2) = t n→∞ √ t Die Gleichung 2 = t hat die Lösungen t = 2 und t = 4. Durch eine Kurvendiskussion kannst Du feststellen, dass sie keine weiteren haben kann. Wegen t ≤ 2 folgt t = 2. – 7.6. AMÜSANTE FRAGEN ZU POTENZEN 207 Diese Überlegungen kann man allgemeiner, statt nur für 21/2 für a1/a mit a ≥ 1 anstellen. Da ln(a1/a ) = ln a a ist, ist die größte der Zahlen unter den a1/a – mit a > 0 – die Zahl e1/e . (Beachte, dass nach obigen Betrachtungen die Funktion ln x/x ein Maximum bei x = e hat.) Für a ∈ [1, e] ist limn→∞ n (a1/a ) = a. Für a > e ist limn→∞ n (a1/a ) = b, wobei b ∈]1, e[ so gewählt ist, dass ab = ba ist. Nicht wahr? Zum Schluss beweisen wir lim n b = ∞, falls b > e1/e gilt. n→∞ Da die Folge (n b) monoton wachsend ist, genügt es zu zeigen, dass sie keinen endlichen Limes hat. Wäre dieser gleich t, so würde bt = t, also b ≤ t1/t gelten (s.o.). Deshalb wäre b ≤ e1/e . – Fragt man nach der Konvergenz von (n b)n für 0 < b < 1, so kann man beweisen, dass dieselbe genau für die b ≥ (1/e)e gilt. Dabei ist zu beachten, dass die Folge (n b)n hier nicht mehr monoton ist. AUFGABEN 1. Sei ein gewisses Kapital auf Zinseszins mit 1 Prozent jährlicher Verzinsung angelegt. Nach wievielen Jahren hat es sich (mindestens) verdoppelt? 2. Haben die Gleichungen x2 = 3 und 2x = 3 eine gemeinsame Lösung? (Die Beantwortung dieser Frage ist sicher mit einem Taschenrechner, der allgemeine Potenzen beherrscht, am schnellsten zu leisten. Aber versuche es ohne einen solchen.) Hat eine dieser Gleichungen eine rationale Lösung? 3. Berechne ohne Taschenrechner 88 1/3 − (88 )1/3 5 3 + 13 5 4. Welche Zahl ist größer, (1000 + 1/7)1000 oder 10001000+1/7 ? √ √ 5. a) Welche Zahl ist größer, 2 oder 3 3? √ √ b) Sei n ≥ 3 ganz. Welche Zahl ist größer, n n oder n+1 n + 1? √ c) Bestimme – falls möglich – limn→∞ n n. 6. Welche Zahl ist größer, √ √ 3 2 2 oder √ 3 √ 2 2? 7. a) Seien a < b natürliche Zahlen. Zeige, dass 2 · 3a < 3b ist. b) Folgere für die Potenztürme: m 3 > n 9, wenn m ≥ n+1, d.h. wenn der Dreierturm mindestens ein ‘Stockwerk’ mehr als der Neunerturm hat. 208 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG 8. Sei a > 2 reell und b = aa−1 (> a). Zeige für die Potenztürme n+1 a > nb . 9. a) Die Idee (7.6.7) kann man zur Berechnung vieler Limites verwenden: Sei I ein Intervall und f : I → I eine stetige Funktion, ferner b ∈ I. Betrachte die Folge (an ), definiert durch a0 = b, an+1 = f (an ). Zeige: Wenn diese Folge den Limes a hat, so ist a eine Lösung der Gleichung x = f (x). b) Beachte, dass manchmal die Gleichung x = f (x) eine Lösung haben kann, ohne dass die Folge (an ) konvergiert. Z.B. sei – mit obigen Bezeichnungen – I = R, f (x) = x2 , b = 2. Wenn Du willst, kannst Du Dir überlegen, für welche b die Folge (an ) konvergiert. √ c) Behandle den Fall I = R+ , b = 0, f (x) = c + x, wo c > 0 ist. (Zum Beweis der Konvergenz der Folge (an ) zeige, dass diese monoton wachsend ist und eine obere Schranke hat. Ich glaube, man sollte die Fälle c < 2 und c ≥ 2 unterscheiden. Im ersten Fall ist 2, im zweiten c eine obere Schranke.) x 10. Löse die Gleichung x(x ) = (xx )x im Bereich R∗+ der positiven reellen Zahlen. 2 11. Löse die Gleichungen a) 2x + 2111110 = 2111111 und b) 2x = 512x+28 . 7.7 Integration Bereits die Mathematiker der Antike befassten sich damit, die Länge einer Kurve, z.B. des Kreisumfangs, und die Größe eines ‘krumm’ begrenzten Flächenstücks, z.B. der Kreisfläche zu bestimmen. Sie wussten, das das Verhältnis des Kreisumfangs zum Durchmesser gleich dem Verhältnis der Kreisfläche zum Quadrat über dem Radius ist. Den Proportionalitätsfaktor nennen wir heute π. Archimedes hat ein Verfahren angegeben, π näherungsweise zu berechnen und auch gezeigt, dass das Volumen einer Kugel vom Radius r gleich 34 πr3 ist. Archimedes ist es auch gelungen, die Fläche eines Parabelabschnittes zu bestimmen. Während diese Berechnungen eher Einzelfälle betrafen, kennen wir seit der zweiten Hälfte des 17. Jahrhunderten eine Methode, solcherart Fragestellungen anzugehen. Wir betrachten eine stetige Funktion f und Flächenstücke zwischen zwei Grenzen unterhalb des Graphen von f und oberhalb der x-Achse, wenn denn f (x) ≥ 0 in diesem Bereich ist. Ist f (x) stellenweise negativ, so sollen die Flächenstücke, die nach unten durch den Funktionsgraphen und nach oben durch die x-Achse begrenzt werden, negativ angerechnet werden. 7.7. INTEGRATION 209 + – Die große Idee von Newton, Leibniz und auch Vorgängern war es, eine der Grenzen als variabel aufzufassen, so dass die Flächengröße wieder zu einer Funktion wird, die man häufig (allerdings nicht immer) durch die uns bekannten Funktionen angeben kann. Dies liegt an dem berühmten ‘Hauptsatz der Differential- und Integralrechnung’, den ich Dir jetzt ans Herz legen möchte. 7.7.1 Ich will zunächst eine präzise Definition für Integrale (nach Riemann) angeben, damit Du siehst, dass es eine solche überhaupt gibt, die zudem noch verhältnismäßig einfach ist. Einige Sätze der Integralrechnung will ich dann aber als anschaulich einleuchtend ohne Beweis angeben. Wir beginnen mit Funktionen, die zwar im Allgemeinen nicht stetig sind, deren Integral aber trivial zu definieren ist. Definitionen 7.7.2 a) Eine Treppenfunktion auf einem endlichen abgeschlossenen Intervall [a, b] ist eine Funktion f , für die es endlich viele reelle Zahlen t0 , . . . , tn mit a = t0 < t1 < · · · < tn = b gibt, derart dass f auf jedem der offenen Intervalle ]ti−1 , ti [ konstant ist. (Für die Werte f (ti ) wird nichts gefordert.) b) Sei f : [a, b] → R eine Treppenfunktion mit zugehörigen t0 , . . . , tn wie oben und f (x) = ci für x ∈]ti−1 , ti [. Das Integral von f ist dann folgendermaßen definiert: Z b n X f (x)dx := ci · (ti − ti−1 ) a i=1 Das ist natürlich schlicht die Summe der Rechteckflächen, wobei die Rechtecke unterhalb der x-Achse negativ gerechnet werden. + – + 210 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Definitionen 7.7.3 a) Sei f : [a, b] → R eine beschränkte Funktion. (‘Beschränkt’ bedeutet: es gibt ein S ∈ R mit |f (x)| ≤ S für alle x ∈ [a, b].) Betrachte die Menge M aller Treppenfunktionen s auf [a, b] mit s(x) ≥ f (x) für alle x ∈ [a, b]. Sie ist nicht leer, da die konstante Funktion mit dem Wert S zu M gehört. Die Menge der Integrale Z b s(x)dx mit s ∈ M a ist nach unten durch −S · (b − a) beschränkt. Also hat sie ein Infimum. (S. 3.2.24.) Dieses nennt man das Oberintegral von f . b) Entsprechend ist das Unterintegral von f das Supremum der Menge aller Integrale über die Treppenfunktionen, deren Werte überall kleiner oder gleich den jeweiligen Werte von f sind. c) In dem Falle, dass das Oberintegral von f mit seinem Unterintegral übereinstimmt, heißt f Riemann-integrierbar, und das gemeinsame Ober- und Unterintegral von f wird dann das Integral von f genannt. Die Bezeichnung ist Z b f (x)dx. a Bemerkungen 7.7.4 a) Nicht jede beschränkte Funktion auf [a, b] ist Riemann-integrierbar, z.B. nicht die Funktion, die auf den rationalen Zahlen den Wert 1, auf den irrationalen den Wert 0 annimmt. Es gibt allerdings einen Integralbegriff, nämlich denjenigen nach Lebesgue (sprich Lebeck, mit Ton auf der zweiten Silbe), der es gestattet, diese Funktion zu integrieren. Sie hat das Integral 0, da sie nur in abzählbar vielen Punkten von der 0-Funktion abweicht. Der Lebesguesche Integralbegriff ist weniger wegen obigen Beispiels, als für Funktionen von mehreren (unabhängigen) Variablen von größter Wichtigkeit! R Rb b) Das -Zeichen ist ein stilisiertes S für Summe, und a f (x)dx soll etwa folgende bedeuten: Für jedes x ∈ [a, b] multipliziere f (x) mit der Länge dx eines unendlich kleinen Intervalls und addiere alle diese Produkte. Du musst das nicht verstehen und darfst das dx schlicht als Zeichen dafür ansehen, bezüglich welcher Variablen man integrieren soll, wenn etwa f eine Funktion zweier Variablen ist. Definition 7.7.5 Wir wollen auch das Integral definieren, wenn die Genzen vertauscht sind und setzen Z b Z a f (x)dx, f (x)dx := − a b wenn letzteres Integral existiert. Ferner sei Z a f (x)dx = 0. a Jetzt gebe ich drei Sätze ohne ihren Beweis an. Anschaulich sind sie allerdings sehr plausibel. 7.7. INTEGRATION 211 Satz 7.7.6 Jede stetige Funktion auf einem endlichen abgeschlossenen Intervall ist Riemannintegrierbar. Satz 7.7.7 Seien a ≤ b ≤ c, so ist Z c Z b Z c f (x)dx = f (x)dx + f (x)dx, a a b wenn die linke (oder die rechte) Seite definiert ist. a b c Folgerung 7.7.8 Dasselbe gilt auch, wenn a, b, c in beliebiger Größenbeziehung zueinander stehen und f auf dem größten der Intervalle, die zwei der drei Punkte als Randpunkte haben, integrierbar ist. Satz 7.7.9 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R eine stetige Funktion, dann gibt es ein ξ ∈ [a, b] mit Z b f (x)dx = (b − a)f (ξ) a (f (ξ) ist der ‘Mittelwert’ der Funktion f auf [a, b].) a ξ b 212 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Als Folgerung beweisen wir jetzt den Hauptsatz der Differential- und Integralrechnung: Theorem 7.7.10 Sei I eine Intervall, a ∈ I und f : I → R eine stetige Funktion, dann ist die Funktion Z x F (x) := f (t)dt a 0 eine Stammfunktion von f . D.h. es gilt F (x) = f (x) für alle x ∈ I. In diesem Sinne ist das Integrieren die Umkehrung des Differenzierens! Beweis: Wir müssen für jedes x ∈ I die Differenzierbarkeit von F in x zeigen und F 0 (x) = f (x) nachweisen. Wir betrachten einen Differenzenquotienten: Z x+h Z x Z 1 1 x+h 1 F (x + h) − F (x) = f (x)dx − f (x)dx = f (x)dx = · h · f (ξ), h h h x h a a wobei ξ eine (von h – nicht unbedingt eindeutig – abhängige) geeignete Zahl zwischen x und x+h ist, die nach dem Mittelwertsatz der Integralrechnung existiert. Sei nun (hn ) eine Nullfolge und jeweils ξn zwischen x und x + hn so gewählt, dass Z x+hn Z x+hn 1 f (t)dt = hn f (ξn ) , d.h. f (t)dt = f (ξn ) hn x x gilt, so konvergiert die Folge (ξn ) gegen x. Wegen der Stetigkeit von f ist somit F (x + h) − F (x) = f (x) h→0 h lim Folgerung 7.7.11 Sei f : [a, b] → R stetig und F : [a, b] → R eine Stammfunktion von f , d.h. F sei differenzierbar mit F 0 = f . Dann gilt Z b f (x)dx = F (b) − F (a) a Beweis: Definiere Z G(x) := x f (t)dt a Wegen des Hauptsatzes 7.7.10 ist G eine Stammfunktion von f . Da nach Voraussetzung auch F eine solche ist, gilt (G − F )0 = G0 − F 0 = f − f = 0, also ist G − F eine Konstante, die ich mit c bezeichne. Ferner ist G(a) = 0. Dann ergibt sich Z b f (x)dx = G(b) = G(b) − G(a) = F (b) + c − (F (a) + c) = F (b) − F (a) . a b Schreibweisen: F (b) − F (a) = F (x) = [F (x)]ba . a 7.7. INTEGRATION 213 7.7.12 Auf Grund unserer Kenntnisse in der Differenzialrechnung wird es uns möglich sein, für viele (durch einen Rechenausdruck gegebene) Funktionen f eine Stammfunktion F zu finden (genauer: einen Rechenausdruck für F anzugeben). Du wirst z.B. keine Probleme haben, eine Stammfunktion einer Polynomfunktion als eine ebensolche anzugeben. Eine Stammfunktion F einer stetigen Funktion f (auf einem Intervall) nennt man auch (ein) unbestimmtes Integral von f und schreibt häufig Z Z f (x)dx = F (x) oder f (x)dx = F (x) + C F ist ja bis auf einen konstanten Summanden (der durch das +C angedeutet wird) eindeutig bestimmt. Ebenso ersetzt man häufig den Ausdruck ‘eine Stammfunktion von f bestimmen’ durch ‘f integrieren’. In folgender Tabelle sind in der rechten Spalte Stammfunktionen der linksstehenden Funktionen verzeichnet: xa , a ∈ R, a 6= −1 x−1 (1+x2 )−1 (1-x2 )−1/2 ex sin x cos x cos−2 x (a+1)−1 xa+1 ln |x| arctan x arcsin x ex -cos x sin x tan x Der Hauptsatz der Differenzial- und Integralrechnung lehrt uns, dass jede stetige Funktion auf einem Intervall eine Stammfunktion besitzt. Das bedeutet allerdings nicht, dass man eine solche als eine Zusammensetzung, der uns bekannten Funktionen schreiben kann. Dies ist z.B. 2 für eine Stammfunktion von ex nicht möglich. (Das besagt ein Satz von Liouville. Für neuere Literatur siehe das Stichwort Elementare Funktion“ in der Wikipedia. ) Natürlich ” 2 bedeutet dieser Satz nicht, dass es keine Stammfunktion von ex gäbe! Jede auf einem Intervall stetige Funktion hat schließlich dort eine Stammfunktion. Man kann sie nur nicht wie gewohnt schreiben. Und so schrecklich ist das ja auch nicht, wenn man folgendes bemerkt: x2 e = ∞ X x2n n=0 n! . Nun gibt es einen Satz, dass man Potenzreihen gliedweise integrieren darf (jedenfalls im ‘Innern’ 2 ihres Konvergenzbereiches). Als eine Stammfunktion von f (x) = ex erhält man somit F (x) = ∞ X n=0 x2n+1 . n!(2n + 1) 214 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Wenn man eine rationale Funktion (d.h. einen Bruch von zwei Polynomen) differenziert, entsteht wieder eine rationale Funktion. Wenn man aber die rationale Funktion x1 integriert, so erhält man ln x, eine Funktion, von der man zeigen kann, das sie nicht rational ist. An diesem 2 Beispiel und am Beispiel ex sieht man, dass es im Allgemeinen nicht so einfach sein kann, Stammfunktionen so zu berechnen, wie wir es bei der Bestimmung von Ableitungen gewohnt sind. (Das ist der Sinn der manchmal geäußerten Ansicht: ‘Differenzieren ist ein Handwerk, Integrieren eine Kunst.’) Z.B. kann man ja die Funktionen, die aus c, x, exp, sin (wo mit c eine konstante Funktion, mit x die identische Abbildung R → R gemeint sind) entstehen, indem wir die Operationen Summe, Produkt, Quotient, Umkehrabbildung, Verkettung – auch iteriert – anwenden, nach den bekannten Regeln differenzieren. Diese Regeln liefern allerdings meist nur Hinweise darauf, wie man möglicher Weise Stammfunktionen findet. Zum Glück gilt noch folgendes: Sind F, G Stammfunktionen der Funktionen f, g. so ist F +G eine Stammfunktion von f +g und cF eine solche von cf , falls c eine Konstante ist. Nicht wahr? Aber schon die Anwendung der Produktregel der Differentiation liefert keine so bequeme Regel. Seien F, G Stammfunktionen von stetigen Funktionen f , bzw, g. Dann ist (F G)0 = F 0 G+F G0 = f G + F g. Also gilt: Theorem 7.7.13 (Partielle Integration) Unter obigen Voraussetzungen ist Z Z Z Z 0 f Gdx = F G − F gdx, oder anders geschrieben F Gdx = F G − F G0 dx. Für das bestimmte Integral, erhält man Z b b Z b 0 F G0 dx. F Gdx = F G − a a a Beispiele 7.7.14 Die Methode der partiellen Integration ist erstaunlich nützlich, und zwar nicht nur zur Berechnung spezieller Stammfunktionen und Integrale, sondern auch in allgemeinen Zusammenhängen. Man kann die partielle Integration auf ein Produkt f G von Funktionen immer dann anwenden, wenn man eine Stammfunktion F von f kennt und das Produkt F g = F G0 leichter als f G = F 0 G integrieren kann. Beispiel 1. Ist z.B. f = 1 konstant und G(x) = ln x, so erhält man Z Z Z 1 ln xdx = 1 · ln x dx = x ln x − x · dx = x ln x − x x Zu demselben Ergebnis kommt man natürlich auch, wenn man versuchsweise die Funktion x ln x differenziert. Beispiel 2. Versuche (für ganze n ≥ 2) die Funktion sinn x zu integrieren, indem Du sinn x in die Faktoren sin x und sinn−1 x zerlegst: Z Z n n−1 sin xdx = − cos x sin x + cos2 x · (n − 1) sinn−2 x = 7.7. INTEGRATION 215 − cos x sin n−1 Z x+ (n − 1)(1 − sin2 x) sinn−2 xdx (Du die Ableitung von sinn−1 x berechnen.) Indem Du auf beiden Seiten das Integral R musst dazu (n − 1) sinn xdx addierst, erhältst Du Z Z n n−1 n sin xdx = − cos x sin x + (n − 1) sinn−2 xdx . So reduzierst Du die Berechnung einer Stammfunktion von sinn x zu einer solchen von sinn−2 x. Wenn Du dies Verfahren iterierst, kommst Du schließlich bei sin x oder 1 an, je nachdem ob n ungerade oder gerade ist. 7.7.15 Wenn man die verkettete Funktion F (ϕ(t)) (mit differenzierbaren F, ϕ) nach t ableitet, erhält man nach der Kettenregel: F 0 (ϕ(t)) · ϕ0 (t). Daraus ergibt sich Theorem 7.7.16 (Substitutionsregel.) Ist I ein Intervall, f : I → R stetig, ϕ : [a, b] → I stetig differenzierbar (d.h. ϕ ist differenzierbar und ϕ0 ist stetig), so gilt Z ϕ(b) Z b 0 f (x)dx . f (ϕ(t))ϕ (t)dt = ϕ(a) a Beweis: Sei F eine Stammfunktion von f . Dann ist F (ϕ(t)) eine Stammfunktion von 0 f (ϕ(t))ϕ (t) bezüglich t, also Z b ϕ(b) Z ϕ(b) b 0 f (x)dx . = f (ϕ(t))ϕ (t)dt = F (ϕ(t)) = F (x) a a ϕ(a) ϕ(a) b Bist Du verwirrt? Bedenke, dass ich unter F (ϕ(t)) die Differenz F (ϕ(b)) − F (ϕ(a)) und a ϕ(b) dieselbe Differenz F (ϕ(b)) − F (ϕ(a)) verstehe! Vielleicht ziehst Du es vor, der unter F (x) ϕ(a) b t=b ϕ(b) Genauigkeit halber statt F (ϕ(t)) den Ausdruck F (ϕ(t)) und statt F (x) den Ausdruck a t=a ϕ(a) x=ϕ(b) zu schreiben. F (x) x=ϕ(a) Beispiele 7.7.17 a) Ist F eine Stammfunktion von f , so ist 1c F (cx+d) eine solche von f (cx+d), wenn c, d Konstanten mit c 6= 0 sind. Wenn man eine Stammfunktion von f kennt, kennt man auch eine solche von f (cx + d) b) Wenn man eine Stammfunktion F einer stetigen Funktion f : I → R (mit einem Intervall I) bestimmen kann, so kann man auch eine Stammfunktion (bezüglich t) von der Funktion t · f (t2 ) 216 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG auf einem Intervall J bestimmen, wenn nur {x2 | x ∈ J} in I liegt. Eine solche Stammfunktion 1 2 2 ist 12 F (t2 ). (Woher kommt der Faktor 21 ?) Insbesondere ist ex eine Stammfunktion von x · ex . 2 2 Dies ist bemerkenswert, da man ja eine Stammfunktion von ex nicht durch die uns geläufigen Funktionen ausdrücken kann. c) Wir wollen die Fläche eines Halbkreises vom Radius 1 bestimmen. Erinnere Dich, dass die Zahl π als die halbe Länge des Umfangs des Einheitskreises definiert ist. Ferner wird durch den Sinus das Intervall [−π/2, π/2] bijektiv und monoton auf das Intervall [−1, 1] abgebildet. Dabei ist sin(−π/2) = −1, sin(π/2) = 1. Weitere Eigenschaften von sin und cos sind: sin2 t + cos2 t = 1, cos(2t) = cos2 t − sin2 t Hieraus folgt cos t = p 1 − sin2 t für diejenigen t wo cos t ≥ 0 ist, und cos(2t) = 2 cos2 t − cos2 t − sin2 t = 2 cos2 t − 1 . Wir rechnen, indem wir x = sin t setzen (substituieren) Z π/2 p Z Z 1√ 2 1 − x2 dx = 1 − sin t cos tdt = −1 −π/2 Z π/2 −π/2 π/2 cos2 tdt = −π/2 1 1 1 π/2 π (cos(2t) + 1)dt = ( sin(2t) + t) = , 2 4 2 −π/2 2 da sin(−π) = sin(π) = 0 ist. Die Flächengröße des ganzen Kreises ist doppelt so groß also gleich π. Dies gilt für einen Kreis vom Radius 1. Ein Kreis vom Radius r hat dann die Flächengröße πr2 . Beachte: Wir haben π als halben Umfang des Einheitskreises definiert. Jetzt haben wir gezeigt, dass mit dieser Definition π die Flächengröße des Einheitskreises ist. Das ist nicht tautologisch. d) Das Riemannsche Integral bestimmt die Größe der Fläche unter einem Funktionsgraphen, indem es diese Fläche durch die Vereinigung von gewissen Rechtecksflächen approximiert. Natürlich darfst Du fragen: Wie kanonisch ist dies? Glücklicherweise kommt beim Kreis dasselbe heraus, wenn man seine Fläche durch regelmäßige n-Ecke approximiert, die ihre Mittelpunkte mit dem Kreis gemeinsam haben. Aber das könnte ja Zufall sein. e) Wir wollen uns aber über diese Skrupel hinwegsetzen und das Volumen der Einheitskugel im R3 bestimmen, indem wir die Kugel durch Vereinigungen von Kreiszylinderscheiben approximieren, deren Achsen mit der x-Achse übereinstimmen. Das bedeutet, dass das Volumen das Integral von −1 bis 1 über die Flächengröße der Schnittkreise (mit der Kugel) derjenigen Ebenen ist, die senkrecht auf der x-Achse stehen und√diese im Punkt x schneiden. D.h. wir betrachten die Funktion f : [−1, 1] → R, wo f (x) = π( 1 − x2 )2 = π(1 − x2 ) ist, und berechnen das Integral über diese Funktion von −1 bis 1. Als Volumen der Einheitskugel ergibt sich so Z 1 √ Z 1 3 1 x 1 1 4 2 2 V = π( 1 − x2 ) dx = π (1 − x )dx = π x − = π((1 − ) − (−1 + )) = π 3 −1 3 3 3 −1 −1 7.8. DAS INTEGRALVERGLEICHSKRITERIUM 217 Das Volumen der Kugel vom Radius r ist somit 43 πr3 . AUFGABEN 1. Bestimme Stammfunktionen von arcsin x und arctan x. (Verwende partielle Integration, wo der erste Faktor 1 ist, ferner die Beispiele a) und b) aus (7.7.17).) 2. Zeige, dass π irrational ist. Angenommen es wäre π = a/b mit a, b ∈ N1 . Berechne Z 1 π n x (a − bx)n sin xdx n! 0 und Du erhältst eine ganzzahligen Wert, der natürlich > 0 ist. Andererseits kann er nach oben durch eine Zahl abgeschätzt werden, die mit wachsendem n beliebig klein wird. 7.8 Das Integralvergleichskriterium Definition 7.8.1 Sei a ∈ R und f : [a, ∞[→ R eine stetige Funktion. Dann definiert man das uneigentliche Integral Z b Z ∞ f (x)dx := lim f (x)dx , a b→∞ a so denn der Limes definiert ist. (Verwechsle nicht die Adjektive ‘unbestimmt’ und ‘uneigentlich’.) Man kann auch in anderen Fällen versuchen, uneigentliche Integrale zu definieren, z.B. wenn f auf ] − ∞, a] definiert ist, aber auch wenn f auf einem (halb)offenen Intervall, aber nicht in den Randpunkten oder einem von ihnen definiert ist. Beispiel 7.8.2 Sei zum Beispiel r > 1, so gilt b Z ∞ 1 1 1 1 1 dx = lim − = lim − + = b→∞ xr (r − 1)xr−1 1 b→∞ (r − 1)br−1 r − 1 r−1 1 Beachte r − 1 > 0. Es gilt folgendes sehr nützliche Konvergenzkriterium für unendliche Reihen. Theorem 7.8.3 Sei f : [1, ∞[→ R+ eine stetige monoton fallende Funktion. Die unendliche ∞ X Reihe f (n) ist genau dann konvergent (mit einem endlichen Limes), wenn das uneigentliche n=1 R∞ Integral 1 f (x)dx existiert (und einen endlichen Wert hat). 218 KAPITEL 7. DIFFERENZIAL- UND INTEGRALRECHNUNG Beweis: Die ‘Treppen’-Funktion go : [1, ∞[→ R, die durch go (x) = f (n) für x ∈ [n, n + 1[ definiert ist, erfüllt go (x) ≥ f (x) für alle x ∈ [1, ∞[. Die Funktion gu , die durch gu (x) = f (n+1) für x ∈ [n, n + 1[ definiert ist, erfüllt gu (x) ≤ f (x). Daraus folgt k−1 X n=1 Z k k Z go (x)dx ≥ f (n) = 1 f (x)dx und 1 k X Z k Z gu (x)dx ≤ f (n) = 1 n=2 k f (x)dx . 1 Die Partialsummen der Ausgangsreihe kann man also durch Integrale von f über endliche Abschnitte nach unten abschätzen. Lässt man den ersten Summanden der Reihe weg, ergibt sich eine Abschätzung nach oben. Wir hatten Treppenfunktionen auf beschränkten Intervallen mit endlich vielen ‘Stufen’ definiert. Die Funktionen go , gu sind auf dem unbeschänkten Intervall [1, ∞[ definiert und haben unendlich viele Stufen, sind aber doch so etwas ähnliches. Beispiele 7.8.4 a) Das Integral Z ∞ x−s dx 1 ist für s > 1 endlich, hingegen unendlich für s ≤ 1. Deshalb konvergiert die Reihe für s > 1 und divergiert für s ≤ 1. P∞ n=1 n−s Wir bekommen also eine Funktion ζ : ]1, ∞[ → R, ζ(s) := ∞ X n−s . n=1 (ζ ist der kleine griechische Buchstabe zeta, nicht zu verwechseln mit ξ, gesprochen xi.) Diese sogenannte Zeta-Funktion ist für die Primzahltheorie sehr nützlich, wenn man sie zu einer Funktion einer komplexen Veränderlichen erweitert. Im Rahmen der Einführung der komplexen Zahlen will ich Dir (ohne Beweis) einiges dazu sagen. b) Betrachte die Funktion f (x) = ln(ln x). Wo ist sie definiert, wenn man den natürlichen Logarithmus nur für positive Zahlen definiert? Berechne f 0 . Zeige, dass ∞ X n=2 1 divergiert. n · ln n c) Berechne die Ableitung der Funktion −(ln x)−1 und zeige, dass die Reihe ∞ X n=2 1 konvergiert. n · (ln n)2 Kapitel 8 Komplexe Zahlen Eine Ebene voller Zahlen 8.1 Was sind die komplexen Zahlen? Glaub mir: Die Erfindung oder – so man will – Entdeckung der komplexen Zahlen ist sicher eine der wunderbarsten Leistungen unserer mathematischen Vorfahren. Wenn man von den natürlichen Zahlen aus über die ganzen und rationalen Zahlen schließlich zu den reellen Zahlen gelangt ist, ist ein gewisser Abschluss erreicht. Man kann z.B. jeden Punkt des (euklidischen) Raumes – nach Festlegung eines Koordinatensystems – durch ein Tripel reeller Zahlen beschreiben, was bekanntlich nicht möglich ist, wenn man sich auf die rationalen oder die positiven reellen Zahlen beschränkt. Wen stört es eigentlich ernsthaft, dass man aus negativen Zahlen keine Quadratwurzeln ziehen kann? Man verzichtet ja auch darauf, durch 0 zu dividieren. 8.1.1 Die erste Ahnung davon, dass sich möglicherweise doch hinter der durch reelle Zahlen beschriebenen Realität eine mathematisch relevante Wirklichkeit verbirgt, bekamen unsere Vorfahren in der Renaissance. Kubische Gleichungen: Du bist sicher in der Lage, quadratische Gleichungen – d.h. solche der Form x2 +px+q = 0 – zu lösen. Auf die sogenannte ‘p-q-Formel’ kommt man durch die ‘quadratische Ergänzung’. Wenn man analog eine ‘kubische Ergänzung’ auf kubische Gleichungen (d.h. solche 3. Grades) anzuwenden versucht, erreicht man lediglich eine Reduktion auf Gleichungen der Form x3 + px + q = 0. (D.h. das quadratische Glied kann man zum Verschwinden bringen.) Eine Lösungsformel für diese Gleichung fand (wahrscheinlich) Tartaglia im Jahre 1535: s s r r 3 3 q q 2 p3 q q 2 p3 + + − − + x= − + 2 4 27 2 4 27 p √ 3 3 Für die Gleichung x −3x+2 = 0 z.B. liefert Tartaglias Formel die Lösung x = −1 + 1 − 1+ p √ 3 −1 − 1 − 1 = −2, die offenbar richtig ist. (Allerdings ist 1 eine weitere Lösung.) Ebenso 219 220 KAPITEL 8. KOMPLEXE ZAHLEN erhält man mit Tartaglias Formel die Lösung 0 der Gleichung x3 + x = 0. (Diese ist übrigens ihre einzige Lösung im Bereich der reellen Zahlen.) Bei der ebenso simplen Gleichung x3 − x = 0 scheint allerdings Tartaglias Formel zu versagen. Sie ergibt sr s r 1 1 3 3 x= − + − − 27 27 Die (richtige) Lösung 0 erhält man nur dann, q wenn man sich großzügig darüber hinwegsetzt, 1 dass der zweimal vorkommende Ausdruck − 27 im Bereich der reellen Zahlen gar keinen Sinn hat. An dieser Stelle würde man eben doch ganz gerne Quadratwurzeln aus negativen Zahlen ziehen können! Die weiteren Lösungen 1 und -1 scheint man mit Tartaglias Formel gar nicht zu finden. Dies sollte weniger ein Grund zur Resignation sein, als einer dafür, Quadratwurzeln aus negativen Zahlen einen Sinn zu geben. Umso mehr, als in Tartaglias Formel solche merkwürdigen Ausdrücke häufig genug auftreten, nämlich immer gerade dann, wenn die Gleichung drei verschiedene reelle Lösungen hat. (Es gibt auch keine besseren anderen Formeln, die außer den Grundrechenarten lediglich Wurzeln verwenden, mit denen man dieses unangenehme Phänomen, casus irreducibilis genannt, vermeiden kann!) 8.1.2 Die komplexen Zahlen bilden einen Körper, der mit C bezeichnet wird, und dessen Elemente man in der Form a + bi schreiben kann, wo a, b reelle Zahlen sind, und i eine neue Zahl mit der Eigenschaft i2 = −1 ist. Wie Du bald sehen wirst, darfst Du ganz naiv mit diesen ‘Zahlen’ rechnen und jedesmal i2 durch −1 ersetzen. Es gibt viele Gründe, warum die komplexen Zahlen aus der modernen Mathematik nicht mehr wegzudenken sind. Dass man Tartaglias Formel immer einen Sinn geben kann, ist nur ein kleines Beispiel. Ich nenne Dir weitere Gründe: 1. In Bezug auf die Existenz von Lösungen algebraischer Gleichungen gilt der so genannte Fundamentalsatz der Algebra. Dieser besagt: Jedes nichtkonstante Polynom mit komplexen Koeffizienten hat mindestens eine komplexe Nullstelle. Z.B. ist x2 −2x+2 = (x−1)2 +1, also im Reellen immer echt größer als 0, hat aber im Komplexen die Nullstellen 1+i, 1−i, besitzt also die Linearfaktorzerlegung x2 −2x+2 = (x−1−i)(x−1+i). Ein weiteres Beispiel ist x4 + 1, welches keine reellen, aber die folgenden vier komplexen Nullstellen hat: √ √ 2 2 ± i. ± 2 2 Dieses wirst Du unten sehen. Wenn ein Polynom f erst einmal eine Nullstelle α hat, kann man, wie Du weißt, den entsprechenden Linearfaktor x − α abspalten, d.h. man kann f = (x − α) · g mit einem Polynom g schreiben. Deshalb bedeutet der Fundamentalsatz der Algebra letztlich, dass jedes Polynom über den komplexen Zahlen in Linearfaktoren zerfällt. Insbesondere gilt dies für das Polynom 8.1. WAS SIND DIE KOMPLEXEN ZAHLEN? 221 xn − 1, welches trivialerweise die Nullstelle 1, und bei geradem n noch die Nullstelle −1 hat. Es hat darüber hinaus noch n − 1, bzw. n − 2 komplexe nicht reelle Nullstellen! Wenn man sich die komplexen Zahlen als Punkte einer Ebene veranschaulicht, liegen die Nullstellen des Polynoms xn − 1 auf dem Einheitskreis und bilden dort die Ecken eines regelmäßigen n-Ecks. (Dies wollen wir weiter unten beweisen!) Von dieser Beobachtung ausgehend hat Gauss die Frage angehen können, welche regelmäßigen n-Ecke mit Zirkel und Lineal konstruierbar sind. 2. Nach einem interessanten und grundlegenden Satz von Hilbert, seinem sogenannten Nullstellensatz, folgt aus dem Fundamentalsatz der Algebra, dass auch Systeme von Polynomen in mehreren Variablen gemeinsame (komplexe) Nullstellen haben, es sei denn, dies ist aus trivialen Gründen nicht möglich. Betrachte als Beispiel die Polynome x2 + y 2 − 1 und x − 2, deren Nullstellen in der reellen Ebene einen Kreis, bzw. eine außerhalb dieses Kreises verlaufende Gerade ausmachen, die demnach keine gemeinsame reelle haben √ Nullstelle haben. Im Komplexen √ sie jedoch die gemeinsamen Nullstellen (x1 , y1 ) = (2, 3·i) und (x2 , y2 ) = (2, − 3·i). Hingegen können die 3 Polynome x, y, 2x + 3y + 1 offenbar trivialerweise keine gemeinsame Nullstelle haben. (Wenn Dir diese Bedingung zu schwammig erscheint, darfst Du sie folgendermaßen definieren: Man sagt, Polynome f1 , . . . , fn in einer oder mehreren Variablen haben trivialerweise keine gemeinsame Nullstelle, wenn es Polynome g1 , . . . , gn mit f1 g1 + · · · + fn gn = 1 gibt.) Hilberts Nullstellensatz gehört zu den Grundlagen der klassischen Algebraischen Geometrie. Leider kann ich hierauf nicht näher eingehen. 3. Die Funktion exp kann man auch für beliebige komplexe Argumente erklären, nämlich durch die bekannte Potenzreihe. Es ergibt sich ein Zusammenhang zwischen exp, sin, cos, den man im Reellen nicht herstellen kann. S.u. 4. Diesen Zusammenhang nutzen die Elektrotechnik und die Physik, insbesondere die Quantentheorie. Nicht nur in der Mathematik werden die komplexen Zahlen gebraucht! 5. Es gibt eine reichhaltige und schöne Theorie der differenzierbaren komplexwertigen Funktionen auf Bereichen der komplexen Zahlenebene, die so genannte Funktionentheorie. Als erstes zeigt man, dass sich eine solche Funktion in der Nähe eines jeden Punktes, wo sie definiert ist, als Potenzreihe darstellen lässt. (Funktionen f : I → R, wo I ⊂ R ein Intervall ist, können sogar unendlich oft differenzierbar sein, ohne dass sie sich um jeden Punkt von I in eine Potenzreihe entwickeln lassen.) 6. Es gibt überraschende Anwendungen der Funktionentheorie in der Theorie der Primzahlen. Eine Ahnung davon gebe ich Dir im 2. Abschnitt. 7. In der Algebra und der algebraischen Zahlentheorie sind die komplexen Zahlen genau so wie die reellen beheimatet. 8. Die berühmte Fermat’sche Vermutung, dass es nämlich für ganze n ≥ 3 keine von 0 verschiedenen ganzen Zahlen x, y, z gibt, so dass xn + y n = z n ist, wurde erst vor etwa 25 Jahren von A. Wiles (mit Vor- und Nacharbeiten anderer Mathematiker) bewiesen und zwar mit Hilfsmitteln, die ohne komplexe Zahlen nicht auskommen. Bemerkung hierzu: In dem überaus spannenden Buch ‘Verdammnis’ von Stieg Larsson bekommst Du vielleicht den Eindruck, die Fermatschen Vermutung beziehe sich nur auf den Fall n = 3. Dieser Fall 222 KAPITEL 8. KOMPLEXE ZAHLEN wurde allerdings möglicher Weise bereits von Fermat selbst (ohne dass wir wüssten, wie) später von Euler mit einer gewissen Ungenauigkeit, schließlich aber von Gauss, Kummer u.a. makellos erledigt. 8.1.3 Wir konstruieren jetzt den Körper C der komplexen Zahlen. Die Abbildung a 0 F : R → M2 (R) , definiert durch F (a) := 0 a 0 ist injektiv, erfüllt F (a+a ) = F (a)+F (a0 ), F (aa0 ) = F (a)F (a0 ) und bildet die 1 von R auf das 1 0 Einselement von M2 (R) ab. Vermöge dieser Abbildung betrachten wir den Körper R 0 1 als Unterring des Ringes M2 (R). In diesem Ring werden wir C als Erweiterungskörper von R finden. (Wie Du weißt, fasst man ja auch die ganzen Zahlen als gewisse Brüche auf, nämlich n als den n a 0 Bruch . Indem wir hier die reelle Zahl a als die Matrix auffassen, tun wir etwas 0 a 1 ganz analoges!) Zunächst sei C die Menge der Matrizen folgender Gestalt a −b 1 0 0 −1 =a +b b a 0 1 1 0 Vielleicht hast Du Dir anhand früherer Aufgaben bereits überlegt, dass C ein kommutativer Unterring von M2 (R) ist. Dass die Nullmatrix, die Einsmatrix, die Summe zweier solcher Matrizen und das additiv Inverse einer solchen Matrix von obiger Gestalt sind, ist trivial. Du musst aber unbedingt nachrechnen (oder bereits nachgerechnet haben), dass das Produkt zweier solcher Matrizen auch wieder von dieser Gestalt und dass die Multiplikation dieser speziellen Matrizen kommutativ ist. In dem vollen Matrizenring ist sie es ja nicht! 8.1.4 Es gilt det a −b b a = a2 + b 2 . 2 2 Die Quadratsumme mit a, b ∈ R ist aber nur dann gleich 0, wenn sowohl a = 0, als auch a +b a −b b = 0 ist. Ist also nicht die Nullmatrix, d.h. mindestens eine der beiden Zahlen a, b b a ungleich 0, so gibt es ein (multiplikativ) Inverses dieser Matrix, nämlich 1 a b . a2 + b2 −b a Du siehst, die Menge C der betrachteten Matrizen ist ein Körper. 0 −1 8.1.5 Wir bezeichnen die Matrix jetzt mit i. Dann dürfen wir schreiben 1 0 a −b 1 0 0 −1 =a· +b· = a + bi 1 0 b a 0 1 8.1. WAS SIND DIE KOMPLEXEN ZAHLEN? 223 Die komplexen Zahlen bilden insbesondere einen R-Vektorraum, der isomorf zu R2 ist. Eine Basis wird von den Elementen 1 und i gebildet. Insbesondere ist (a1 + b1 i) + (a2 + b2 i) = (a1 + a2 ) + (b1 + b2 )i . Offenbar ist 2 i = 2 0 −1 1 0 = −1 0 0 −1 = −1 Da für komplexe Zahlen die Körpergesetze gelten, dürfen wir wie gewohnt rechnen und dabei immer i2 = −1 setzen. Zum Beispiel ist (a1 + b1 i)(a2 + b2 i) = a1 a2 + a1 b2 i + a2 b1 i + b1 b2 i2 = (a1 a2 − b1 b2 ) + (a1 b2 + a2 b1 )i Als Matrix geschrieben ist letzter Ausdruck gleich a1 a2 − b1 b2 a1 b 2 + a2 b 1 a1 −b1 a2 −b2 = . −(a1 b2 + a2 b1 ) a1 a2 − b1 b2 b 1 a1 b2 a2 Und so muss es ja auch sein, nicht wahr? Eine Matrix der Form a −b b a ist natürlich durch das Paar (a, b) gegeben. Letzteres kann man nun als Vektor oder Punkt in einer Ebene mit einem orthonormalen Koordinatensystem auffassen. Wenn Du dieses Paar mit der komplexen Zahl a + bi identifizierst, so siehst Du, dass man jede komplexe Zahl auf folgende drei Weisen schreiben kann: a −b = a + bi = (a, b) b a Das multiplikativ Inverse von a + bi ist a2 b a − 2 i, falls a + bi 6= 0 gilt, nicht wahr? 2 +b a + b2 √ Achtung: Ich möchte Dich davor warnen, i = −1 zu √ schreiben dann unvorsichtig √ damit √ undp 2 umzugehen! Du könntest ja etwa folgendes rechnen i = −1· −1 = (−1) · (−1) = 1 = 1 . 8.1.6 Sei nun (a, b) 6= (0, 0). Betrachte folgendes Bild: 2i (a,b) i ϕ –2 –1 1 –i 1 2 3 224 KAPITEL 8. KOMPLEXE ZAHLEN Wenn ϕ der in diesem Bild angegebene Winkel ist, gilt also √ (a, b) = a2 + b2 · (cos ϕ , sin ϕ) √ Dabei ist a2 + b2 die Länge des Vektors (a, b). In der Matrizenschreibweise bedeutet dies √ a −b cos ϕ − sin ϕ 2 2 = a +b · b a sin ϕ cos ϕ Die Matrix auf der rechten Seite ist die Drehmatrix um den Winkel ϕ. Wir wissen, dass das Produkt zweier solcher Drehmatrizen um die Winkel ϕ, bzw. ψ die Drehmatrix um den Winkel ϕ + ψ ist. Es ergibt sich: Satz 8.1.7 Seien a + bi, a0 + b0 i komplexe Zahlen 6= 0 (mit a, b, a0 , b0 ∈ R) und ϕ, bzw. ϕ0 die Winkel der Vektoren v = (a, b), bzw. w = (a0 , b0 ) mit der positiven√reellen Halbachse. Dann hat √ das Produkt der beiden Zahlen, aufgefasst als Vektor, die Länge a2 + b2 · a02 + b02 und den Winkel ϕ + ϕ0 mit der positiven reellen Halbachse. Definitionen 8.1.8 Sei a + bi mit reellen a, b eine komplexe Zahl. a) Die reelle Zahl a heißt der Realteil von a + bi. Bezeichnung: a = Re(a + bi). b) Die reelle Zahl b heißt der Imaginärteil von a + bi. Bezeichnung: b = Im(a + bi). (Beachte, dass nach dieser – allgemein üblichen – Definition der Imaginärteil einer komplexen Zahl eine reelle Zahl ist. Man könnte es natürlich auch anders machen.) √ √ c) Der Betrag von a + bi ist a2 + b2 . Bezeichnung |a + bi| = a2 + b2 . d) Der Winkel, den der Vektor (a, b) mit der positiven reellen Halbachse bildet, heißt das Argument von a + bi. Dieser Winkel ist lediglich bis auf Vielfache von 2π = 360◦ definiert. Schreibweise: arg(a + bi) = ϕ, wobei ϕ wie im letzten Satz definiert wird. e) Die zu a + bi konjugierte komplexe Zahl ist a − bi. Bezeichnung: a + bi = a − bi. Bemerkungen 8.1.9 a) Der letzte Satz drückt sich in Formeln, wie folgt aus: Sind c, d ∈ C∗ , so gilt |cd| = |c| · |d| und arg(cd) = arg(c) + arg(d). √ √ b) |Re(a + bi)| = a2 ≤ a2 + b2 = |a + bi|, ebenso gilt |Im(a + bi)| ≤ |a + bi|. D.h. für eine komplexe Zahl c ist |Re(c)| ≤ |c| und |Im(c)| ≤ |c| c) Sind c, d ∈ C, so gilt c + d = c + d, sowie c · d = c · d. Die offensichtlich bijektive Abbildung C → C, definiert durch c 7→ c, ist also ein Ringisomorfismus und somit auch einen Körperisomorfismus. (Letzteres bedeutet, dass auch (c)−1 = c−1 ist.) Ein Isomorfismus mit gleichem Start und Ziel wird ein Automorfismus genannt. Die Konjugation c 7→ c ist also ein Automorfismus des Körpers C. Offenbar ist c = c . 8.1. WAS SIND DIE KOMPLEXEN ZAHLEN? 225 d) Die Dreiecksungleichung. Diese ist |c + d| ≤ |c| + |d| Geometrisch bedeutet sie, dass die Summe der Längen zweier Seiten eines Dreiecks größer oder gleich der dritten Seite ist. Hier wollen wir das ’ungeometrisch’ zeigen: Für jede komplexe Zahl c gilt 2 · Re(c) = (c + c) und cd = cd, sowie |c| = |c|. Es folgt |c+d|2 = (c+d)(c+d) = cc+dd+cd+cd = |c|2 +|d|2 +2Re(cd) ≤ |c|2 +|d|2 +2|c||d| = (|c|+|d|)2 und daraus die Dreiecksungleichung. e) Ist z 6= 0, so gilt |z −1 | = |z|−1 und arg(z −1 ) = − arg(z). Mache Dir klar, was das geometrisch bedeutet! 8.1.10 Potenzen mit natürlichen Exponenten. Sei n ganz und > 0. Wenn z den Betrag r hat, d.h. auf einem Kreis vom Radius r um 0 liegt, so hat z n den Betrag rn , liegt somit auf dem Kreis vom Radius rn um 0. Wenn z das Argument α hat, so hat z n das Argument n · α, zumindest bis auf ein Vielfaches von 2π. Wir lassen z den Kreis Sr um 0 vom Radius r > 0 mit konstanter Winkelgeschwindigkeit 1 durchlaufen und beobachten, welchen Weg dabei z n nimmt. Nach dem, was wir uns gerade überlegt haben, durchläuft z n den Kreis Srn vom Radius rn und zwar mit der Winkelgeschwindigkeit n. Wenn z den Kreis Sr einmal durchläuft, so durchläuft z n den Kreis Srn genau n-mal. Es trifft dabei jeden Punkt auf Srn genau n-mal. Was bedeutet das für die Existenz und Vielfachheit von Wurzeln, d.h. die Lösungen der Gleichung xn = c? p Sei c 6= 0 eine komplexe Zahl mit dem Argument ϕ und d := n |c|(cos(ϕ/n) + i sin(ϕ/n)), so gilt offenbar dn = c. D.h. man kann aus jeder komplexen Zahl für jede natürliche Zahl n > 0 eine n-te Wurzel ziehen. Allerdings ist das Wurzelziehen nicht eindeutig: Es gibt genau n verschiedene komplexe Zahlen d mit dn = c, wenn nicht gerade c = 0 ist. Es ist cos(ϕ + k ·p 2π) + i sin(ϕ + k · 2π) = cos ϕ + i sin ϕ n für jede ganze Zahl k. Also ist jede komplexe Zahl dk := |c|(cos(ϕ/n + k · 2π/n)+ i sin(ϕ/n + k · 2π/n)) eine n-te Wurzel aus c, d.h. dnk = c. Die Zahlen d0 , d1 , . . . , dn−1 sind untereinander verschieden, aber danach wiederholen sie sich: dn = d0 , dn+1 = d1 , . . .. Sie bilden offenbar die Ecken eines regelmäßigen n-Ecks. Insbesondere gibt es n verschiedene komplexe Zahlen z0 , z1 , . . . , zn−1 , die alle die Gleichung z n = 1 erfüllen. Eine von ihnen ist 1, alle haben den Betrag 1, d.h. sie befinden sich auf dem Einheitskreis. Sie bilden dort ein regelmäßiges n-Eck mit dem Mittelpunkt 0. (Von dieser Tatsache ist Gauss ausgegangen, als es ihm kurz vor 1800 gelang, ein regelmäßiges 17-Eck allein mit Zirkel und Lineal zu konstruieren.) 226 KAPITEL 8. KOMPLEXE ZAHLEN Definition 8.1.11 Die Nullstellen von xn − 1 in C heißen die n-ten Einheitswurzeln. Bemerkung 8.1.12 Du weißt vielleicht noch von der Herleitung der Summenformel Pn−1 k für die n n−1 n−2 geometrische Reihe, dass z − 1 = P (z − 1)(z +z + · · · + z + 1) = (z − 1) k=0 z ist. Dass k bedeutet, dass die Nullstellen von n−1 z die von 1 verschiedenen n-ten Einheitswurzeln sind. k=0 Beispiele 8.1.13 Wir berechnen einige spezielle Beispiele. Mit ihrer Hilfe bestimmen wir spezielle Werte des Cosinus und Sinus. a) Rechne (1+i)2 = 1+2i−1 = 2i, also ( √12 + √12 i)2 = 12 ·2i = i, mithin ( √12 + √12 i)4 = i2 = −1. Du siehst erneut, diesmal ohne geometrische Argumente, dass −1 im Bereich der komplexen Zahlen nicht nur ein Quadrat, sondern auch eine 4. Potenz ist. Wenn Du dies mit der geometrischen Beschreibung der Multiplikaton zusammenbringst, kannst Du √ 1 2 sin(π/4) = cos(π/4) = √ (= ) 2 2 ableiten. Wir bleiben bei diesem Beispiel und setzen abkürzend v := √12 + √12 i. Dann ist v 3 = v 2 v = iv = − √12 + √12 i, v 5 = v 4 v = −v, v 6 = v 4 v 2 = −i v 7 = v 4 v 3 = −v 3 = √12 − √12 i und schließlich v 8 = (v 4 )2 = (−1)2 = 1. Dann wiederholen sich die Werte der Potenzen, also v 9 = v 8 v = v, v 10 = v 8 v 2 = v 2 = i, v 11 = v 8 v 3 = v 3 = − √12 + √12 i usw. Für jede beliebige (ganze) Potenz v k gilt offenbar (v k )8 = (v 8 )k = 1k = 1. D.h. wir haben insgesamt 8 verschiedene Zahlen gefunden, deren 8. Potenz 1 ergibt, nämlich 1, v, v 2 , . . . , v 7 . √ √ √ b) Ein weiteres Beispiel. Setze√ w := 21 + 23 i. Dann ist w2 = 14 − 34 + 2 · 12 23 i = − 12 + 23 i und √ w3 = ww2 = ( 21 + 23 i)(− 12 + 23 i) = − 14 − 34 = −1. Weiter erhält man w4 = w3 w = −w, w5 = w3 w2 = −w2 und w6 = w3 w3 = (−1)(−1) = 1. Wie oben wiederholen sich jetzt die Potenzen: w7 = w1 , w8 = w2 usw. Ebenso siehst Du, dass für jede ganze Potenz wk von w gilt: (wk )6 = 1. Es gibt also (mindestens) 6 verschiedene komplexe Zahlen, die die Gleichung x6 = 1 erfüllen. Da diese Gleichung den Grad 6 hat, hat sie auch auch nur 6 Lösungen. Man kann hieraus √ 1 3 cos(π/3) = und sin(π/3) = 2 2 ableiten. (Was folgt daraus für sin(π/6), cos(π/6)?) 8.1.14 Zusätzliche Bemerkungen. Zu Tartaglias Formel: Wenn man sie im Komplexen anwenden will, hatq man es mit q2 p3 mehrdeutigen Wurzeln zu tun. Mit den Quadratwurzeln ist es einfach: Mit + 27 sei 4 q 2 p3 willkürlich eine der beiden möglichen Wurzeln bezeichnet; − q4 + 27 ist dann automatisch die andere. Jeder der beiden Summanden in Tartaglias Formel ist nun eine kubische Wurzel mit 3 möglichen Werten. So hat man insgesamt 9 mögliche Kombinationen. Es gibt nun eine Regel, 8.1. WAS SIND DIE KOMPLEXEN ZAHLEN? 227 welche 3 Kombinationen die Nullstellen des kubischen Polynoms ergeben. Hierauf will ich nicht genauer eingehen und verweise stattdessen auf das Buch Kubische und biquadratische ” Gleichungen“ von Heinrich Dörrie (Leibniz Verlag München 1948). Plausibilität des Fundamentalsatzes der Algebra. Sei n ∈ N1 . Die Funktion g : C → C, definiert durch g(z) = z n , bildet die Kreislinie Sr vom Radius r > 0 um 0 auf die Kreislinie Srn vom Radius rn um 0 ab, und zwar so, dass ein Umlauf um Sr zu n Umläufen um Srn wird. Sei jetzt f (z) = z n + a1 z n−1 + · · · + an−1 z + an Wir setzen an 6= 0 voraus, da f sonst bereits die Nullstelle 0 hat. Ist der Betrag von z sehr groß, so überwiegt der Anteil von z n in starkem Maße die Anteile der übrigen Summanden in f . Also gilt: Wenn z die Kreislinie Sr einmal durchläuft und r ‘sehr groß’ ist, so läuft f (z) ‘in der Nähe’ von Srn genau n-mal um den Nullpunkt herum. Lässt man jetzt r gegen 0 gehen, so zieht sich die Bildkurve von Sr auf den Punkt an zusammen. Irgendwann muss sie unterwegs über den Punkt 0 hinweggehen. Das heißt, es gibt eine Nullstelle von f . Die komplexe Exponentialfunktion: Man definiert sie, wie im Reellen durch z e = ∞ X zn n=0 n! für beliebige z ∈ C und beweist auch das Additionstheorem wie im Reellen. Im Folgenden halte ich mich etwas kurz. Insbesondere gilt ex+iy = ex · eiy für x, y ∈ R. Da uns die Funktion ex bereits einigermaßen bekannt ist, wollen wir die Abbildung R → C, y 7→ eiy studieren. Überlege Dir, dass die zu eiy konjugierte komplexe Zahl gleich e−iy ist. (Die Konjugation ist nicht nur mit endlichen Summen und Produkten verträglich, sondern auch mit Limesbildung.) Daraus folgt iy 2 e = eiy · e−iy = 1 D.h. Die Spur der parametrisierten Kurve R → C, y 7→ eiy liegt also im Einheitskreis. Durch genauere Untersuchung, stellt man fest, dass sie diesen entgegen dem Uhrzeigersinn mit der Absolutgeschwindigkeit 1 durchläuft. Da zudem noch e0i = 1 gilt, erhält man gemäß unserer Definition der Kreisfunktionen eiy = cos y + i sin y und somit ex+iy := ex (cos y + i sin y) Die aus diesen Überlegungen folgende Gleichung eiπ + 1 = 0 hat den bekannten Physiker Feynman seit seiner Jugend fasziniert. (Sie involviert die wahrscheinlich wichtigsten Zahlen der Mathematik, nämlich 0, 1, i, π, e.) Wenn man den Zielbereich der Funktion exp auf C∗ = C−{0} einschränkt, so ist die Abbildung exp : C → C∗ surjektiv, aber nicht injektiv. Für jedes z ∈ C gilt, dass die z + 2nπi für alle n ∈ Z dasselbe Bild unter exp haben. Allgemeine Potenzen. Seien c, z ∈ C, c 6= 0 Man kann versuchen cz := exp(z ln(c)) zu definieren. Dies hat den Vorzug, dass man bis auf die Bedingung c 6= 0 keine Einschränkung 228 KAPITEL 8. KOMPLEXE ZAHLEN machen muss. Der Nachteil liegt darin, dass die ‘Funktion’ ln auf C× = C − {0} von Natur aus unendlich viele Werte hat, die sich um Vielfache von 2πi unterscheiden. Das kommt daher, dass im Komplexen die Funktion exp nicht injektiv, sondern periodisch mit der Periode 2πi ist. Jeder noch so geschickt ausgewählte, auf ganz C× eindeutig definierte Logarithmus ist weder überall stetig, noch erfüllt er allgemein die Gleichung ln(z1 z2 ) = ln(z1 ) + ln(z2 ). Man muss also damit leben, dass etwa der Ausdruck ii zunächst unendlich viele Werte hat – wie wir gleich sehen werden – und wenn man mit ihm rechnen will, angeben, welcher der möglichen Werte gemeint ist. Wenn man ii als exp(i · ln i) definiert, so muss man die möglichen Werte von ln i bestimmen. Für c 6= 0 gilt ln c = ln |c| + i arg(c). Dabei ist arg(c) aber nicht eindeutig, sondern nur bis auf ganzzahlige Vielfache von 2π bestimmt. (Dies alles ergibt sich, wenn man exp wie oben definiert und versucht, diese nicht bijektive Funktion umzukehren.) In unserem Fall ist |i| = 1 und arg i = π/2 + 2nπ, also ln i = i(π/2 + 2nπ), wo n ∈ Z beliebig ist. Für ii ergeben sich also die unendlich vielen möglichen Werte: exp(−π/2 + 2mπ), m ∈ Z, die alle reell sind. AUFGABEN Die Aufgaben beschäftigen sich mit Einheitswurzeln. 1. Sei n eine ungerade natürliche P Zahl. Welche gemeinsamen Nullstellen haben alle Polynome (über C) der folgenden Gestalt: nk=0 ak z k mit an 6= 0 und ak = an−k ∈ {−1, 0, 1} für alle k? 2. Bestimme die gemeinsamen Nullstellen der Polynome f = z 3 +2z 2 +2z+1 und g = z 2015 +z 121 +1 in C. 8.2 Sind Primzahlen einsam? Hier will ich nichts beweisen, sondern nur versuchen, Dir einiges aus der Theorie der Primzahlen zu erläutern. Du weißt hoffentlich noch, dass es unendlich viele Primzahlen gibt (und wie man dies beweist), ferner dass es zwischen zwei aufeinanderfolgenden Primzahlen beliebig große Lücken gibt. Über diese eher qualitativen“ Aussagen hinaus kann man sich natürlich auch quantitative“ Fragen ” ” stellen, etwa: Gibt es zu jeder ganzen Zahl n ≥ 1 eine (im Dezimalsystem) n-stellige Primzahl? Der experimentielle Befund ist eindeutig: Es gibt 4 einstellige, 21 zweistellige, 143 dreistellige Primzahlen – und soweit es Primzahltafeln gibt, setzt sich dieser Trend fort. Wir Mathematiker und Mathematikerinnen wünschen natürlich, einen Beweis dafür zu haben. Und einen solchen gibt es in der Tat; aber dieser ist überhaupt nicht trivial. Du wirst vielleicht dem Dezimalsystem das Binärsystem vorziehen. Und in der Tat gilt die entsprechende Aussage auch hier: Zu jedem ganzen n ≥ 2 gibt es eine im Binärsystem geschriebene n-stellige Primzahl. Dies folgt – wie Du sofort siehst – aus dem sogenannten Bertrand’schen 8.2. SIND PRIMZAHLEN EINSAM? 229 Postulat: Zu jeder ganzen Zahl n ≥ 1 gibt es immer eine Primzahl p mit n < p ≤ 2n. (Bertrand konnte dies nicht beweisen, hat es aber als wahr unterstellt, um einen anderen Satz zu zeigen.) Dieses Postulat“ wurde später von Čebyšev bewiesen. ” Man kann solche Fragen in Beziehung zu dem sogenannten Primzahlsatz bringen. Wir betrachten dazu die Funktion π, die jedem reellen x die Anzahl der (positiven) Primzahlen ≤ x zuordnet. (Diese Funktion hat nichts mit der Kreiszahl π zu tun!) Die Funktion π(x) ist 0 für x < 2 und springt bei jeder Primzahl um 1 nach oben. (Sie ist insbesondere nicht stetig, aber ‘von Weitem gesehen’ merkt man das nicht.) Der Primzahlsatz vergleicht die Funktion π mit der für x > 1 definierten Funktion x/ ln(x). Er besagt π(x) lim =1. x→∞ x/ ln(x) Man kann ihn auch wie folgt ausdrücken: Sei ε > 0 beliebig klein. So gibt es eine Zahl Y , so dass für alle x ≥ Y die Ungleichungen (∗) (1 − ε) x x ≤ π(x) ≤ (1 + ε) gilt. ln x ln x Bemerkungen 8.2.1 a) Ich will nicht verschweigen, dass es eine bessere Vergleichsfunktion für π(x) als x/ ln(x) gibt, nämlich den sogenannten Integrallogarithmus Li, definiert durch Z x dx , Li(x) = 2 ln(x) die für x ≥ 2 definiert ist. b) Der Primzahlsatz wurde von Gauß vermutet und erst Ende des 19. Jahrhunderts von Hadamard und de la Vallee Poussin (unabhängig voneinander) bewiesen. Beide benutzen eine Aussage über die Nullstellen der Zeta-Funktion. 8.2.2 Nun folgt etwas zu dem behaupteten Zusammenhang mit der Funktionentheorie. Die im letzten Kapitel für reelle x > 1 definierte Zetafunktion lässt sich für alle komplexen Zahlen, mit Ausnahme der 1 definieren. Seltsamer Weise hängen die Nullstellen der Zetafunktion mit der Primzahlverteilung zusammen, wie Riemann erkannt hat. Es gibt die (sogenannten trivialen) Nullstellen −2n für n = 1, 2, . . ., dazu aber noch unendlich viele andere in dem Streifen 0 ≤ Re(z) ≤ 1. Hadamard und de la Vallee Poussin konnten zeigen, dass am Rande dieses Streifens (wo Re(z) = 0 oder 1 ist) keine Nullstellen liegen, und damit den Primzahlsatz beweisen. Die bislang unbewiesene Riemannsche Vermutung besagt, dass alle nichttrivialen Nullstellen auf der mittleren Geraden Re(z) = 1/2 dieses Streifens liegen. Aus ihr würden sehr genaue Abschätzungen für die Primzahlverteilung folgen. 8.2.3 Sei x < y. Die Anzahl der Primzahlen p mit x < p ≤ y ist gleich π(y) − π(x). Diese Differenz kann man mit Hilfe der Ungleichungen (∗) nach unten abschätzen: π(y) − π(x) ≥ (1 − ε)(y/ ln y) − (1 + ε)(x/ ln x) 230 KAPITEL 8. KOMPLEXE ZAHLEN Im Hinblick auf das Bertrandsche Postulat betrachten wir den Fall y = 2x und erhalten π(2x) − π(x) ≥ (1 − ε)(2x/ ln(2x)) − (1 + ε)(x/ ln(x)) Nun ist ln(2x) = ln(x) + ln(2) < ln(x) + 1. Das bedeutet, dass 2x/ ln(2x) nicht viel kleiner als 2 · (x/ ln(x)) ist. Wir wählen nun δ(x), so dass x/ ln(2x) = (1 − δ)x/ ln(x) ist. Dann gilt π(2x) − π(x) ≥ (1 − ε)((2x/ ln(2x)) − (1 + ε)(x/ ln(x)) = (2(1 − ε)(1 − δ(x)) − (1 + ε)) · x/ ln(x) Beachte limx→∞ δ(x) = 0. Ist nun (∗∗) 2> 1+ε , (1 − ε)(1 − δ) so ist π(2x) − π(x) > 0, also gibt es dann mindestens eine Primzahl p mit x < p ≤ 2x. Ist nun ε klein genug, dass (1 + ε)(1 − ε) < 2 gilt, so gilt die Ungleichung (∗∗) für genügend große x. Es folgt sogar, dass die Anzahl der Primzahlen zwischen x und 2x mit x gegen unendlich geht, nicht wahr? Num konnte Čebyšev zwar den Primzahlsatz noch nicht beweisen, aber die Ungleichungen (∗) für ε = 1/9 zeigen, falls nur x genügend groß ist. 1 + 19 < 2 ist, folgt das Bertrand’sche Postulat – zunächst für große x. Es ist dann noch 1 − 19 etwas Feinarbeit zum vollständigen Beweis zu leisten. Da 8.2.4 Was wir oben für den Faktor 2 getan haben geht ebenso gut für den Faktor 1,1 oder 1,01, allgemeiner für jeden Faktor der Form 1 + γ mit beliebig kleinem γ > 0. Dann allerdings ist die Anzahl der Primzahlen zwischen x und (1 + γ)x nur für genügend große x nicht null. Zum Beweis muss man außerdem den vollen Primzahlsatz benutzen. Was sollen wir nun zur Frage sagen, ob Primzahlen einsam sind? Man mag ja eine Primzahl, die zur nächsten Primzahl einen großen Abstand hat als einsam ansehen. Dann gibt es einsame Primzahlen. Wenn man aber den Abstand der n-ten Primzahl pn zur (n + 1)-ten Primzahl pn+1 im Verhältnis zur Größe von pn als Maß für seine Einsamkeits nimmt, sieht die Sache anders aus. Für jede noch so kleine Zahl γ > 0 gibt es ja eine reelle Zahl x, so dass zu jeder Primzahl p > x die nächstgrößere Primzahl kleiner als (1 + γ) · p ist. Kapitel 9 Gruppen Ist es sinnvoll, Bereiche mit nur einer Rechnungsart zu betrachten? 9.1 Was sind Gruppen? Bislang hast Du die algebraischen Begriffe Ring und Körper kennengelernt. Möglicherweise hast Du sogar ein gewisses Verständnis dafür bekommen, warum man sie in aller Allgemeinheit studiert. Es gibt ja viele interessante Ringe, und unter diesen auch viele interessante Körper. Neben Z, Q, R, C gibt es z.B. noch die Restklassenringe Z/(m), die genau dann Körper sind, wenn m eine Primzahl ist, ferner die Matrizenringe. Glaub mir, das ist nur der Anfang! Hältst Du es für sinnvoll, algebraische Strukturen zu definieren, bei denen es nur eine Verknüpfung (Rechenart) gibt? Vielleicht nicht. Auch ich kann Dir hier nur eine Ahnung davon geben, zu welchem Zweck man den Gruppenbegriff einführt, und dich einfach bitten, zu glauben, dass er in der Mathematik und der Physik eine große Rolle spielt. Definition 9.1.1 Eine Gruppe ist eine Menge G zusammen mit einer Verknüpfung (Rechenart), die vorläufig mit ◦“ bezeichnet sei, so dass folgendes gilt: ” 0) (a ◦ b) ◦ c = a ◦ (b ◦ c) für alle a, b, c ∈ G. (Assoziativität) 1) Es gibt ein neutrales Element e ∈ G mit e ◦ a = a ◦ e = a für alle a ∈ G. (Existenz eines neutralen Elementes) (Hier ist mit e nicht die Eulersche Zahl 2,718... gemeint.) 2) Für ein solches neutrales Element e gilt: Zu jedem a ∈ G gibt es ein Inverses a− ∈ G mit a− ◦ a = a ◦ a− = e. (Existenz inverser Elemente) Definition 9.1.2 Eine Gruppe G (mit der Verknüpfung ◦“) heißt abelsch (oder kommuta” tiv), wenn a ◦ b = b ◦ a für alle a, b ∈ G gilt. Nils Hendrik Abel (1802-1829) war einer der ganz großen Mathematiker – trotz seines kurzen Lebens. (Eine abelsche Gruppe ist kaine Gruppe von Männern, die von ihren Brüdern erschlagen wurden.) 231 232 KAPITEL 9. GRUPPEN Bemerkungen 9.1.3 a) Das neutrale Element ist eindeutig definiert. Denn für jedes weitere neutrale Element e0 gilt: e = e ◦ e0 = e0 gemäß 1). In einer Gruppe gelte x ◦ x = x. Dann ist x = x− ◦ (x ◦ x) = x− ◦ x = e. b) Auch gibt es zu jedem a ∈ G nur ein Inverses. Sei etwa a( ein weiteres solches, so erhält man a− = e ◦ a− = (a( ◦ a) ◦ a− = a( ◦ (a ◦ a− ) = a( ◦ e = a( Offenbar ist a invers zu a− und wegen der Eindeutigkeit des Inversen deshalb (a− )− = a . (Du hast diese Überlegungen bereits für die Addition in Ringen gemacht!) c) Ein sparsameres Axiomensystem ersetzt 1) und 2) durch: Es gibt ein e ∈ G, so dass gilt: 1’) e ◦ a = a für alle a ∈ G, 2’) zu jedem a ∈ G existiert ein a− ∈ G mit a− ◦ a = e. Es ist nicht ganz einfach zu zeigen, dass aus 0), 1’) und 2’) (bei fehlender Kommutativität) auch 1) und 2) folgen. Und ich halte das auch nicht für so wichtig, da in den meisten Beispielen von Gruppen die Gesetze 1) und 2) leicht zu zeigen sind. d) Die Assoziativität besagt, dass es in iterierten ‘Produkten’, etwa (a ◦ b) ◦ (c ◦ (d ◦ f )) auf die Klammerung nicht ankommt, man also die Klammern weglassen darf. Die Reihenfolge der ‘Faktoren’ bleibt allerdings wichtig – es sei denn die Gruppe ist abelsch. e) Achtung: (a ◦ b)− = b− ◦ a− . Du erinnerst Dich: Wenn man zuerst ein Hemd und danach einen Pullover anzieht und dies (ohne Verrenkungen) wieder rückgängig machen will, muss man zuerst den Pullover und danach das Hemd ausziehen. Für a, b mit (a ◦ b)− = a− ◦ b− gilt somit a ◦ b = ((a ◦ b)− )− = (a− ◦ b− )− = (b− )− ◦ (a− )− = b ◦ a . f) Man kann in einer Gruppe sinnvoll Potenzen mit ganzzahligen Exponenten definieren: Die Definition ist dieselbe, wie für Elemente 6= 0 eines Körpers. Und es gelten auch die Regeln: am ◦ an = am+n , (am )n = amn , aber nicht allgemein (ab)m = am ◦ bm . Zeige: Gilt in einer Gruppe (a ◦ b)2 = a2 ◦ b2 , so ist b ◦ a = a ◦ b. g) Das neutrale Element hat die Eigenschaft e ◦ e = e. Umgekehrt ist es das einzige Element mit dieser Eigenschaft. Aus x ◦ x = x erhält man nämlich x− ◦ x ◦ x = x− ◦ x, also x = e. (Doch erinnere Dich: In jedem Ring gilt sowohl 1 · 1 = 1 als auch 0 · 0 = 0.) h) Wir konstruieren eine Gruppe von 2 Elementen: G = {e, a} mit dem neutralen Element e und einem weiteren a 6= e. Die Verknüpfungen e ◦ e = e, e ◦ a = a ◦ e = a sind durch ein Axiom direkt vorgeschrieben. Aus a ◦ a = a würde a = e folgen. Also ist a ◦ a = e. Die Assoziativität kannst Du natürlich durch Untersuchung aller Fälle nachprüfen. (Ist e ein beidseitig neutrales Element, so folgt (x ◦ e) ◦ y = x ◦ (e ◦ y). Ebenso (e ◦ x) ◦ y = e ◦ (x ◦ y) und (x ◦ y) ◦ e = x ◦ (y ◦ e). Es bleibt der Fall (a ◦ a) ◦ a = a ◦ (a ◦ a), der unmittelbar aus a ◦ a = e folgt.) Eine andere 9.1. WAS SIND GRUPPEN? 233 Möglichkeit, dies einzusehen, ergibt sich durch die Betrachtung der sogenannten Gruppentafel (Multiplikationstabelle): ◦ e a e e a a a e Diese ist nämlich offenbar die gleiche wie die Additionstabelle unseres ‘Minikörpers’ F2 , wenn man nur e durch 0 und a durch 1 ersetzt. Da die Verknüpfungen zwangsläufig sind, ist jede Gruppe von 2 Elementen zu der konstruierten ‘isomorf’, d.h. nicht wesentlich von ihr verschieden. (Was das genau bedeutet, muss und werde ich natürlich noch definieren.) Diese Gruppe kommt häufig vor: In jedem Ring, in dem 1 6= −1 gilt, ist die Menge {1, −1} in Bezug auf die Multiplikation eine Gruppe aus 2 Elementen. Hier entspricht e der 1 und a der -1. 9.1.4 Etwas zur Schreibweise: Im Allgemeinen werden alternativ zwei mögliche Schreibweisen für die Verknüpfung, das neutrale Element und das zu a Inverse benutzt: a) Die multiplikative Schreibweise: ab oder a · b für a ◦ b, sowie 1 für e und a−1 für a− . (Wenn die Gruppe aus bijektiven Abbildungen einer Menge auf sich selbst besteht und die Verknüpfung deren Verkettung bedeutet, schreibt man natürlich auch a◦b für die Verknüpfung und id oder z.B. auch I für das neutrale Element.) Bei multiplikativer Schreibweise schreibt man Potenzen wie gewohnt. b) Die additive Schreibweise: a + b für a ◦ b, sowie 0 für e und −a für a− . In diesem Fall schreibt man auch a − b an Stelle von a + (−b) usw. Die additive Schreibweise wird in der Regel nur bei abelschen Gruppen benutzt. Bei der additiven Schreibweise entspricht dem Begriff ‘Potenz’ der Begriff ‘Vielfaches’. Beispiel aaa schreibt man als a3 , während a + a + a als als 3a geschrieben wird. Entspechend bedeutet a−2 bei multiplikativer Schreibweise (aa)−1 , während man bei additiver Schreibweise (−2)a = −(a + a) setzt. (Natürlich gilt (aa)−1 = a−1 a−1 und somit auch −(a + a) = (−a) + (−a), welch letzteres auch −a − a geschrieben wird.) Ich benutze hier meist, aber nicht immer, die multiplikative Schreibweise. Manchmal liegt natürlich die additive Schreibweise nahe. Definition 9.1.5 Die Kardinalzahl (d.h. die Elementezahl) einer endlichen Gruppe wird auch ihre Ordnung genannt. Beispiel 9.1.6 Ein typisches erstes Beispiel einer nicht abelschen Gruppe ist das Folgende: Die Menge S3 ist die Menge aller bijektiven Abbildungen ϕ : {1, 2, 3} → {1, 2, 3}. Wir schreiben solche Abbildungen in der Form 1 2 3 ϕ(1) ϕ(2) ϕ(3) also ist z.B. σ1 := 1 2 3 1 3 2 234 KAPITEL 9. GRUPPEN diejenige Abbildung, die 1 auf 1, 2 auf 3 und 3 auf 2 abbildet. Welche Ordnung hat S3 ? Nun, sie hat offenbar soviele Elemente, wie es Anordnungen der Menge {1, 2, 3} gibt, d.h. 3!=6 Stück. Außer der genannten Abbildung σ1 gibt es noch die folgenden 5 1 2 3 1 2 3 σ2 := , σ3 := 3 2 1 2 1 3 (σi lässt i fest, d.h. bildet i auf sich selbst ab, und vertauscht die beiden anderen Elemente aus {1, 2, 3}.) 1 2 3 1 2 3 0 δ := , δ := 2 3 1 3 1 2 und – nicht zu vergessen – die Identität (identische Abbildung) I := 1 2 3 1 2 3 9.1.7 Die Verknüpfung ◦“ ist die Verkettung (Hintereinanderausführung) der Abbildungen. ” Dabei verabreden wir, die rechtsstehende zuerst auszuführen. Z.B. 1 2 3 1 2 3 1 2 3 ◦ σ2 ◦σ1 = = = δ0 3 2 1 1 3 2 3 1 2 Hingegen σ1 ◦σ2 = 1 2 3 1 3 2 ◦ 1 2 3 3 2 1 = 1 2 3 2 3 1 =δ Es ist also σ1 ◦σ2 6= σ2 ◦σ1 . Wir können eine Tabelle aller Produkte, die Gruppentafel, aufstellen ◦ I σ1 σ2 σ3 δ δ0 I I σ1 σ2 σ3 δ δ0 σ1 σ1 I δ0 δ σ3 σ2 σ2 σ2 δ I δ0 σ1 σ3 σ3 σ3 δ0 δ I σ2 σ1 δ δ σ2 σ3 σ1 δ0 I δ0 δ0 σ3 σ1 σ2 I δ In der α-Zeile und β-Spalte steht das Element α◦β. In jeder Zeile steht jedes Element von S3 genau einmal. Das ist auch in jeder Spalte so. Dies gilt für jede Gruppe. Denn für je zwei Elemente a, b der Gruppe hat die Gleichung ax = b genau eine Lösung, nämlich x = a−1 b. Entsprechend hat die Gleichung xa = b genau eine Lösung. Welche? Die Assoziativität ist ein Spezialfall einer allgemeinen Feststellung über die Assoziativität der Verkettung von Abbildungen, die wir im Abschnitt über Abbildungen bereits gezeigt haben. Das neutrale Element ist I. Das Inverse einer Abbildung ist die Umkehrabbildung. 9.1. WAS SIND GRUPPEN? 235 Beispiele 9.1.8 Weitere Beispiele von Gruppen: a) (Z, +), d.h. die Menge der ganzen Zahlen zusammen (allein) mit der Addition, ist eine Gruppe. Das neutrale Element ist 0, das Inverse von n ist −n. b) Jeder Ring (und auch jeder Vektorraum) mit der Addition allein (d.h. wenn man die Multiplikation unberücksichtigt lässt) ist eine Gruppe. Man spricht man von der additiven Gruppe des Rings, bzw. Vektorraums, auch von der unterliegenden (additiven) Gruppe des Vektorraumes.) Wieder bezeichnet die 0 das neutrale Element und −a das zu a Inverse. Eine besondere Rolle spielen die additiven Gruppen der Ringe Z/(m). Diese Gruppen sind von besonders einfacher Gestalt. Erinnere Dich an die Additionstabelle 2.4.8. Für m > 1 sieht sie allgemein so aus: 0 1 2 · · · · · · · · · m-1 + 0 0 1 2 · · · · · · · · · m-1 1 2 · · · · · · · · · m-1 0 1 2 · · · · · · · · · m-1 0 1 2 .. .. .. .. .. .. .. .. . . . . . . . . m-2 m-2 m-1 m-1 m-1 0 0 1 ··· ··· ··· ··· · · · m-3 m-3 m-2 c) Sei K ein Körper und K ∗ = K − {0}. Dann ist K ∗ zusammen mit der Multiplikation eine Gruppe, die multiplikative Gruppe des Körpers. Hier ist das neutrale Element die 1 und das Inverse von a ist a−1 = 1/a. In Bezug auf die Multiplikation ist Z − {0} keineswegs eine Gruppe; fast immer fehlt das Inverse. d) Sei n > 0 eine natürliche Zahl. Mit Sn , der n-ten symmetrischen Gruppe wird die Menge der bijektiven Abbildungen α : {1, 2, . . . , n} → {1, 2, . . . , n} zusammen mit der Verkettung als Verknüpfung bezeichnet. Dies ist eine naheliegende Verallgemeinerung der oben betrachteten S3 – und natürlich eine Gruppe. Im Gegensatz zu den Beispielen a), b), c) gilt für n ≥ 3 in der Sn das Kommutativitätsgesetz nicht. D.h. es gibt α, β ∈ Sn mit α◦β 6= β ◦α (falls n ≥ 3). Das hast Du für n = 3 oben bereits gesehen. Für n ≥ 4 ist das erst recht so. (Warum?) e) Noch allgemeiner als unter d) kann man allgemein eine (möglicherweise unendliche) Menge M betrachten und zu dieser die symmetrische Gruppe von M“, die aus sämtlichen bijektiven ” Abbildungen M → M besteht, wo die Verknüpfung die Verkettung ist. f) Sei K ein Körper. Dann bilden die 2×2-Matrizen über K, deren Determinante ungleich 0 ist, bezüglich der Matrizenmultiplikation eine Gruppe. Diese Gruppe wird mit Gl2 (K) bezeichnet. (“General linear group“) Berechne in dieser Gruppe 1 0 1 1 2 2 2 1 1 1 0 1 1 . und · · 1 1 0 1 0 1 Die Gruppe Gl2 (K) ist also für keinen Körper K kommutativ. Es gibt natürlich mehrere Verallgemeinerungsmöglichkeiten: Du kannst n×n-Matrizen betrachten. Du kannst anstelle eines Körpers einen kommutativen Ring R betrachten und in M2 (R) 236 KAPITEL 9. GRUPPEN die Matrizen, deren Determinante in R invertierbar ist. Ist R = Z so bedeutet das, dass die Determinante 1 oder −1 ist. Ein Beispiel eines solchen Elementes ist hier die Matrix 5 17 2 7 Schließlich darf der Ring auch nichtkommutativ sein. Dann betrachte die (multiplikativ) invertierbaren Matrizen. Determinanten helfen hier allerdings nicht. Wie man bei Vektorräumen Untervektorräume betrachtet, gibt es auch in der Theorie der Gruppen den Begriff der Untergruppe. Definition 9.1.9 Sei G eine Gruppe. Eine Untergruppe U von G ist eine Teilmenge von G, die bezüglich der Verknüpfung in G wieder eine Gruppe ist. D.h. es wird verlangt, dass 1 ∈ U ist und aus a, b ∈ U sowohl ab ∈ U als auch a−1 ∈ U folgt. (Es reicht hierfür zu verlangen, dass U 6= ∅ und mit a, b ∈ U auch ab−1 ∈ U ist. Beweis?) Beispiele 9.1.10 a) In jeder Gruppe G sind sowohl {1} (bei additiver Schreibweise {0}) als auch G selbst Untergruppen. Diese nennt man manchmal die trivialen Untergruppen b) Sei G := Z mit der Verknüpfung +“ und m ∈ N. Die Menge mZ := {mx | x ∈ Z} ist eine ” Untergruppe von G. Du wirst später erfahren, dass jede Untergruppe der additiven Gruppe von Z so aussieht. Du kannst natürlich versuchen, dies jetzt schon selbst zu beweisen. (Tipp: Division mit Rest.) c) Sei K ein Körper. Dann ist die Menge {1, −1} eine Untergruppe von K ∗ . Für den Körper C gilt, dass R∗ , R∗+ und {z ∈ C | |z| = 1} Untergruppen von C∗ sind. Ferner bilden für jedes ganze n ≥ 1 die n-ten Einheitswurzeln eine Untergruppe von C∗ . d) Seien m, n mit 1 ≤ m ≤ n natürliche Zahlen. Dann hat Sn folgende zur Sm isomorfe Untergruppe U . Sie besteht aus denjenigen bijektiven Abbildungen α : {1, . . . , n} → {1, . . . , n}, für welche α(j) = j für alle j mit m < j ≤ n gilt. (Die Elemente von U lassen die letzten n − m Zahlen fest.) (Den Begriff ‘isomorf’ werde ich bald einführen, nämlich in Definition 9.1.12.) Wendet man dies auf den Fall m = 3 an, sieht man, dass Sn für n ≥ 3 nicht abelsch ist. Natürlich gilt dies auch für SM , wenn M eine unendliche Menge ist. e) Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Dann ist die Menge hai := {an | n ∈ Z} eine Untergruppe von G. (Bei additiv geschriebenen Gruppen ist hai = {na | n ∈ Z}.) Man nennt hai die von a erzeugte Untergruppe von G. Weiter unten gehen wir genauer auf solche Untergruppe ein. f) Sei K ein Körper. Die 2 × 2-Matrizen der Form a −b A= mit det A 6= 0 b a bilden eine Untergruppe der Gl2 (K). Insbesondere musst Du zeigen, dass mit A auch A−1 die verlangte Form hat. 9.1. WAS SIND GRUPPEN? 237 Beispiel 9.1.11 Wir wollen die Untergruppen der S3 bestimmen. Zunächst haben wir die beiden Untergruppen {I} und S3 . Da σi2 := σi ◦σi = I ist, sind die drei Mengen Ui := (hσi i :=){I, σi } Untergruppen. Und da δ 2 = δ 0 und δ 3 = δ 2 ◦δ = I gilt, ist V := {I, δ, δ 0 } eine Untergruppe. (Es gibt drei Untergruppen der Ordnung 2 und eine solche der Ordnung 3.) Wir haben also außer den beiden trivialen Untergruppen {I} und S3 noch die o.a. vier Untergruppen. Wir wollen jetzt überlegen, dass es keine weiteren Untergruppen gibt. Jede der vier Untergruppen U1 , U2 , U3 , V besitzt außer {I} und sich selbst keine weiteren Untergruppen. Ferner liegt jedes Element von S3 in einer dieser vier Untergruppen. Jede weitere von {I} verschiedene Untergruppe H von S3 muss also zwei Elemente enthalten, die nicht gemeinsam in einer der Untergruppen U1 , U2 , U3 , V liegen. Es genügt jetzt zu zeigen, dass unter dieser Voraussetzung H = S3 ist. Es gelte etwa σ1 , σ2 ∈ H. Dann ist auch δ = σ1 ◦σ2 ∈ H, ebenso δ 0 = δ 2 , ferner noch σ3 = σ1 ◦δ 0 . Da ohnehin I ∈ H gilt, muss H = S3 sein. Ebenso einfach zeigt man die folgenden Implikationen σ1 , σ3 ∈ H =⇒ H = S3 ; σ2 , σ3 ∈ H =⇒ H = S3 ; σi , δ ∈ H =⇒ H = S3 ; σi , δ 0 ∈ H =⇒ H = S3 Wir sehen insbesondere, dass S3 keine Untergruppe der Ordnung (d.h. Elementezahl) 4 oder 5 hat. Später werden wir ganz allgemein zeigen: Ist G eine endliche Gruppe der Ordnung n und U eine Untergruppe von G, so wird n von der Ordnung von U geteilt. Die Untergruppen von S3 ergeben folgendes Bild: S3 U1 U2 U3 V {I} Die Gruppen U1 , U2 , U3 , V umfassen alle die Gruppe {I} und liegen alle in der S3 . Zwischen ihnen gibt es keine Inklusionsrelationen. Der Begriff der Isomorfie. Wann wollen wir Gruppen G und H zueinander isomorf nennen, d.h. dass sie bis auf die Bezeichnung der Elemente (und der Verknüpfung) überein” stimmen“ sollen? Am klarsten kann man dies mit Hilfe des Abbildungsbegriffes ausdrücken: Definitionen 9.1.12 a) Seien G, H Gruppen. Ein Gruppenhomomorfismus (kurz: Homomorfismus) von G nach H ist eine Abbildung f : G → H, die f (a ◦ b) = f (a) ◦0 f (b) für alle a, b ∈ G erfüllt. (∗) (Dabei bezeichne ◦ die Verknüpfung in G und ◦0 diejenige in H. b) Ein Isomorfismus, auch Isomorfie von Gruppen ist ein bijektiver Homomorfismus. c) Gruppen G und H heißen zueinander isomorf, wenn es einen Isomorfismus G → H gibt. 238 KAPITEL 9. GRUPPEN Bemerkungen 9.1.13 Im Folgenden sei die multiplikative Schreibweise benutzt. a) Die Umkehrabbildung eines Isomorfismus f : G → H ist wieder ein solcher. Zunächst ist ja f −1 : H → G wieder bijektiv. Seien nun zu gegebenen a0 , b0 ∈ H die Elemente a, b ∈ G durch a := f −1 (a0 ), b := f −1 (b0 ) definiert. Dann ist a0 = f (a), b0 = f (b), also a0 b0 = f (a)f (b) = f (ab). Hieraus folgt f −1 (a0 b0 ) = f −1 (f (ab)) = ab. Mit ab = f −1 (a0 )f −1 (b0 ) erhält man dann f −1 (a0 b0 ) = f −1 (a0 )f −1 (b0 ). b) Ist f : G → H ein Gruppenhomomorfismus und 1 das neutrale Element von G, so ist f (1) das neutrale Element von H. Denn es ist ja f (1)2 = f (12 ) = f (1). Wende die Bemerkung (9.1.3 a) an. c) Ist f ein Gruppenhomomorfismus, so gilt f (a−1 ) = f (a)−1 . Denn f (a)◦f (a−1 ) = f (a◦a−1 ) = f (1) = 1. Beispiele 9.1.14 a) Sei m > 0 ganz. Wir betrachten einerseits die additive Gruppe von Z/(m), andererseits die multiplikative Gruppe Em der m-ten Einheitswurzeln, d.h. derjenigen komplexen Zahlen z, die die Gleichung z m = 1 erfüllen. Diese beiden Gruppen sind isomorf! Wir wissen ja, dass für jede m-te Einheitswurzel ζ die Gleichung ζ a = ζ b gilt, wenn a, b ganze Zahlen sind, die modulo m kongruent sind. Sei jetzt ζ1 := cos(2π/m) + i sin(2π/m). Dann ist die folgende Abbildung wohldefiniert: ϕ : Z/(m) → Em , (a mod m) 7→ ζ1a . Da für beliebige a, b ∈ Z, z ∈ C die Regel z a+b = z a · z b gilt, ist ϕ ein Homomorfismus. Die Bijektivität gilt, da auf Grund der Wahl von ζ1 die Zahlen ζ10 , . . . ζ1m−1 untereinander verschieden sind. (Beachte, dass man ζ1 nicht durch jede m-te Einheitswurzel ersetzen kann. Sei nämlich etwa m = 4. Die Abbildung Z/(4) → {1, i, −1, −i} mit a 7→ ζ a ist zwar für jedes ζ ∈ {1, i, −1, −i} wohldefiniert, aber nur für ζ = ±i surjektiv!) b) Allgemeiner: Sei G eine multiplikativ geschriebene Gruppe und a ∈ G. Dann ist die Abbildung f : Z → G, n 7→ an ein Gruppenhomomorfismus, wenn wir von Z nur die additive Struktur betrachten. Dabei braucht f weder injektiv noch surjektiv zu sein. c) Je zwei Gruppen G, H von 2 Elementen sind zueinander isomorf. Denn jede solche Gruppe besteht ja aus Elementen e, a mit dem neutralen Element e und einem von e verschiedenen a, deren Verknüpfung, wie oben gesehen zwangsläufig ist. 9.1.15 Jetzt bestimmen wir die Gruppen der Ordnung 3. Sei G eine solche und seien a, b die beiden von 1 verschiedenen Elemente. 9.1. WAS SIND GRUPPEN? 239 Die drei Elemente a1, aa, ab müssen die drei verschiedenen Elemente von G sein. Aus ab = b würde a = abb−1 = bb−1 = 1 folgen. Analog ist ab = a nicht möglich. Also bleibt ab = 1 und a2 = b. In der folgenden Multiplikationstabelle ist die erste Zeile klar, die zweite gerade bestimmt worden. Die dritte ergibt sich zwangsläufig daraus, dass in jeder Spalte jedes Element genau einmal auftritt. 1 a b 1 1 a b a a b 1 b b 1 a Betrachte die oben gefundene Untergruppe V = {I, δ, δ 0 } ⊂ S3 . Ihre Gruppentafel ist I I I δ δ δ0 δ0 δ δ δ0 I δ0 δ0 1 δ Du siehst, die zweite Tabelle geht aus der ersten hervor, wenn man 1 durch I, a durch δ und b durch δ 0 ersetzt. Also ist die erste Multiplikationstabelle die einer Gruppe; insbesondere gilt für G die Assoziativität. Da die erste Gruppentafel sich zwangsläufig aus der Voraussetzung ergibt, dass G aus den Elementen 1, a, b besteht, erkennst Du dass es bis auf Isomorfie nur eine Gruppe von 3 Elementen gibt. Ferner siehst Du a2 = b, b2 = a, a3 = b3 = ab = 1. Die Elemente kann man als Potenzen von a schreiben: a0 = 1, a1 = a, a2 = b, a3 = 1, a4 = a, wonach sie sich periodisch wiederholen. Ebenso geht es mit den Potenzen von b, nämlich b0 = 1, b1 = b, b2 = a, b3 = 1 usw. Offenbar kann man die Rollen von a und b vertauschen. Das heißt, die Abbildung α : G → G, definiert durch α(1) = 1, α(a) = b, α(b) = a ist ein Isomorfismus von G nach G, ein sogenannter Automorfismus. Aber α ist nicht die identische Abbildung idG . Nochmal: Wie im Fall der Ordnung 2 gibt es bis auf Isomorfie genau eine Gruppe der Ordnung 3. Diese ist abelsch. Dies lässt sich verallgemeinern. Für jede Primzahl p gibt es bis auf Isomorfie genau eine Gruppe der Ordnung p, nämlich die (abelsche) additive Gruppe von Z/(p). Das werden wir weiter unten sehen. Hingegen gibt es bis auf Isomorfie zwei Gruppen der Ordnung 4, die beide abelsch sind, sowie zwei Gruppen der Ordnung 6. Die eine Gruppe der Ordnung 6 ist die additve Gruppe von Z/(6), also insbesondere abelsch, die andere unsere S3 , also nicht abelsch. (Der Beweis dafür, dass es bis auf Isomorfie keine andere Gruppe der Ordnungen 4 oder 6 gibt, ist leider nicht so einfach.) Beispiele 9.1.16 In der Gruppe Gl2 (Q) der invertierbaren 2 × 2-Matrizen über Q gibt es zwei Untergruppen der Ordnung 4, die nicht zueinander isomorf sind, nämlich einerseits die aus folgenden Elementen bestehende 1 0 −1 0 1 0 −1 0 E= , , , ; 0 1 0 1 0 −1 0 −1 240 KAPITEL 9. GRUPPEN andererseits die aus folgenden Elementen bestehende 1 0 0 −1 −1 0 E= , , , 0 1 1 0 0 −1 0 1 −1 0 . Prüfe nach, dass es sich wirklich um Untergruppen handelt. In der ersten gilt für alle Elemente A2 = E, in der zweiten ist 0 −1 1 0 2 = −1 0 0 −1 , 0 −1 1 0 3 = 0 1 −1 0 , 0 −1 1 0 4 =E . Die erste Gruppe besitzt drei Untergruppen der Ordnung 2, die zweite Gruppe nur eine Untergruppe der Ordnung 2. Letztere ist isomorf zur additiven Gruppe von Z/(4). Untergruppen der additiven Gruppe von Z. Sei m eine natürliche Zahl. Du weißt schon, dass die Menge mZ = {mz | z ∈ Z}, also die Menge der durch m teilbaren ganzen Zahlen eine Untergruppe der additiven Gruppe von Z ist. Umgekehrt kann man zeigen: Satz 9.1.17 Zu jeder Untergruppe H der additiven Gruppe von Z gibt es genau eine natürliche Zahl m mit H = mZ. Beweis: Ist H = {0} so ist H = 0Z, aber H 6= mZ für m 6= 0. Ist H 6= {0}, so gibt es ein a ∈ H, a 6= 0. Da mit a auch −a ∈ H ist, gibt es sogar ein positives a ∈ H. Sei m die kleinste positive Zahl, die zu H gehört. Ich behaupte, dass H = mZ ist. Um dies zu beweisen nimm an, a sei ein beliebiges Element von H. Dividiere a durch m mit Rest: a = qm + r mit 0 ≤ r < m. Ist r = 0, so ist a ein Vielfaches von m. Wäre hingegen r > 0, so wäre r = a − qm ein positives Element von H, das aber kleiner als m wäre. Das widerspräche der minimalen Wahl von m. Es bleibt nur die Möglichkeit, dass a ein Vielfaches von m ist. Sind m, m0 positive ganze Zahlen mit mZ = m0 Z, so ist sowohl m als auch m0 das kleinste positive Element von mZ, was m = m0 zur Folge hat. AUFGABEN 1. Sei G eine (multiplikativ geschriebene) endliche abelsche Gruppe. Was kann man über das Produkt aller ihrer Elemente sagen? Beantworte diese Frage speziell unter der Voraussetzung, dass es genau ein Element der Ordnung 2 im G gibt, also genau ein a 6= 1 mit a2 = 1. 2. Zeige: In einem Körper K erfüllen nur 1 und −1 die Gleichung x2 = 1. Das gilt auch, falls 1 = −1 in K gilt. 9.2. NEBENKLASSEN 241 3. Folgere aus den letzten beiden Aufgaben (p − 1)! ≡ −1 (mod p), falls p eine Primzahl ist. (Satz von Wilson). 4. Zeige auch die Umkehrung: Ist n > 1 keine Primzahl, so ist (n − 1)! 6≡ −1 (mod n). (Unterscheide, ob n = 4 oder n > 4.) 5. Beantworte (etwa mit Hilfe des Satzes von Wilson) die Frage, ob 100! + 1 eine Primzahl ist. 6. Sei p eine Primzahl mit p ≡ 1 (mod 4). Folgere aus dem Satz von Wilson, dass −1 in dem Körper Z/(p) ein Quadrat ist. 7. Zeige dass in einem Körper die Menge aller von 0 verschiedenen Elemente der Form a2 + b2 eine Untergruppe der multiplikativen Gruppe ist. (Dabei darf einer der Summanden 0 sein.) (Tipp: Beispiel f) in (9.1.10).) 8. Zeige, dass die additive Gruppe aller reellen Zahlen zur multiplikativen Gruppe der positiven reellen Zahlen isomorf ist. 9. Ist die additive Gruppe aller rationalen Zahlen isomorf zur multiplikativen Gruppe aller positiven rationalen Zahlen? 10. Betrachte die Potenzmenge P (M ) einer Menge M . Zeige, dass P (M ) eine abelsche Gruppe wird, wenn man als Verknüpfung die symmetrische Differenz wählt, also (etwa additiv geschrieben) A + B := A ∪ B − (A ∩ B) definiert. 11. Sei G eine Gruppe, derart, dass alle ihre Elemente a die Gleichung a2 = 1 erfüllen. Zeige: G ist abelsch. 12. Du magst Dich fragen, warum man von der additiven Gruppe eines Ringes verlangt, dass sie kommutativ ist. Genauer. Warum betrachtet man keine ‘ringähnlichen’ Rechenbereiche, deren additive Gruppe nicht kommutativ ist? Nun berechne (a+b)(1+1) mit Hilfe der beiden Distributivgesetze: Einmal als (a+b)+(a+b) = a + b + a + b, zum andern als a(1 + 1) + b(1 + 1) = a + a + b + b. 13. Zeige: Die Gruppen S3 und Gl2 (F2 ) sind isomorf. 9.2 Nebenklassen Es handelt sich hier um eine Verallgemeinerung der bekannten Restklassen r + mZ in Z. Der grundlegende Satz über endliche Gruppen besagt, dass die Ordnung einer (beliebigen) Untergruppe H einer endlichen Gruppe G deren Ordnung teilt. Dies zeigen wir, indem wir G in Teilmengen zerlegen, deren jede soviele Elemente wie H besitzt. 242 KAPITEL 9. GRUPPEN Diese Zerlegung existiert unabhängig davon, ob G endlich ist. Unter einer zusätzlichen Voraussetzung über die Untergruppe H kann man die entsprechenden Teilmengen von G zu den Elementen einer Gruppe machen! Das besprechen wir im nächsten Abschnitt. Ein Beispiel davon kennst Du schon, nämlich wie man Z/(m) aus Z gewinnt. (Beachte: Z/(m) ist als Ring ja insbesondere eine Gruppe bezüglich der Addition.) Definition 9.2.1 Sei also G eine Gruppe und H eine Untergruppe und a ein Element von G. Die Linksnebenklasse von a nach H ist die Menge aH := {ax | x ∈ H}. Die Rechtsnebenklasse von a nach H ist die Menge Ha := {xa | x ∈ H}. Wenn klar ist, was von beiden gemeint ist, sagen wir kurz Nebenklasse. Wir benutzen hier die multiplikative Schreibweise! D.h. die Nebenklasse aH ist völlig analog der Restklasse r + mZ in Z gebildet, wo wir die additive Schreibweise benutzen. G entspricht Z, und H entspricht mZ und schließlich a ∈ G der Zahl r ∈ Z. D.h. die Nebenklasse aH entspricht der Restklasse r + mZ. Bemerkung 9.2.2 Ist G nichtabelsch, so kann durchaus aH 6= Ha sein. S.u. Satz 9.2.3 Für Nebenklassen aH, bH, (bzw. Ha, Hb) in G gilt: a) Es gibt (für ein fest gegebenes a) eine bijektive Abbildung f : H → aH. Mithin haben H und aH gleichviele Elemente. b) aH = bH ⇐⇒ b ∈ aH ⇐⇒ a−1 b ∈ H. Beachte: Zwei Nebenklassen aH, bH sind nicht schon dann verschieden, wenn a 6= b ist, sondern erst, wenn sie als Mengen verschieden sind, d.h. wenn es ein Element in einer gibt, das nicht in der anderen liegt. Erinnere Dich daran, dass r + mZ = s + mZ genau dann gilt, wenn r ≡ s (mod m) ist. b’) Ha = Hb ⇐⇒ ba−1 ∈ H. Beachte den kleinen Unterschied zu b). c) Es ist entweder aH = bH oder aH ∩ bH = ∅. Beweis: a) Definiere f : H → aH durch f (x) := ax. Nach Definition von aH ist f surjektiv. Um die Injektivität von f zu zeigen, nimm an, es sei f (x) = f (y), also ax = ay. Dann ist auch a−1 (ax) = a−1 (ay). Mittels der Assoziativität und a−1 a = 1 folgt dann die gewünschte Gleichheit x = y. b) Wir zeigen, dass aus der ersten Aussage die zweite, aus der zweiten die dritte und schließlich aus der dritten wieder die erste folgt. Damit folgt aber aus jeder der drei Aussagen auch jede andere. Ist aH = bH, so gilt insbesondere b ∈ aH, da ja b = b1 ∈ bH ist. Ist b ∈ aH, so gibt es (nach Definition von aH) ein x ∈ H mit b = ax. Hieraus folgt a−1 b = x ∈ H. 9.2. NEBENKLASSEN 243 Sei a−1 b ∈ H, also a−1 b = y, d.h. b = ay für ein geeignetes y ∈ H. Nach Definition ist bH die Menge der bx mit x ∈ H, also die Menge der ayx mit x ∈ H. Überlege Dir jetzt, dass mit x auch yx die ganze Menge H durchläuft. Demnach ist aH = ayH = bH. (Nicht wahr: mit x und y gehört auch xy zur Untergruppe H. Ist umgekehrt z irgendein Element von H, so ist z = (zy −1 )y von der Form xy mit einem x ∈ H, nämlich x = zy −1 .) c) Nimm an, es sei aH ∩ bH 6= ∅. Also gibt es x, y ∈ H mit ax = by. Wir haben zu zeigen, dass dann aH = bH ist. Aus ax = by folgt b = axy −1 Dabei ist xy −1 ∈ H. Also ist b ∈ aH und gemäß b) deshalb aH = bH. Beispiele 9.2.4 a) H selbst ist immer eine Nebenklasse nach H, nämlich H = xH für alle x ∈ H, insbesondere H = 1H. b) Ist H = G, so gibt es nur eine Nebenklasse nach H, nämlich H. c) Ist H = {1}, so besteht jede Nebenklasse aus genau einem Element. Die einelementigen Teilmengen von G sind die Nebenklassen nach {1}. d) Sei G = S3 , unsere bekannte Gruppe der Permutationen der Menge {1, 2, 3}, und H = U1 = {I, σ1 . Die Nebenklassen nach U1 sind: U1 = {I, σ1 } = σ1 U1 , σ2 U1 = {σ2 , δ 0 } = δ 0 U1 , σ3 U1 = {σ3 , δ} = δU1 Je schwerer es Dir gefallen ist, obigen Satz zu verstehen, umso intensiver solltest Du dieses Beispiel studieren. Übrigens ist U1 σ2 = {σ2 , δ} = 6 σ2 U1 . e) Sei wiederum G = S3 , aber jetzt H = V . Die Nebenklassen nach V sind die 2 folgenden Mengen: V = {I, δ, δ 0 } = δV = δ 0 V, σ1 V = {σ1 , σ2 , σ3 } = σ2 V = σ3 V Du kannst leicht nachrechnen, dass auch V = V δ = V δ 0 und σ1 V = V σ1 = V σ2 = V σ3 gilt. Für V gilt also xV = V x für alle x ∈ S3 , im Gegensatz zu Ui ! f) Der Ring Z ist in Bezug auf die Multiplikation keine Gruppe. Deshalb ist auch mZ := {mz | z ∈ Z} für m > 1 keine Nebenklasse nach Z ! 9.2.5 Sei jetzt G wieder eine beliebige (multiplikativ geschriebene) Gruppe und H eine Untergruppe von G. Jedes Element a von G liegt in einer Nebenklasse nach H, nämlich in aH. Liegt a auch in der Nebenklasse bH, so ist schon aH = bH. Jedes Element von G liegt somit in genau einer Nebenklasse nach H. G ist also die Vereinigung aller Nebenklassen nach H, und zwar die disjunkte Vereinigung dieser Nebenklassen. Mit ‘disjunkt’ meine ich: Je zwei verschiedene Nebenklassen haben einen leeren Durchschnitt. 244 KAPITEL 9. GRUPPEN Sei nun G endlich. Dann sind natürlich auch H und die Anzahl r der Nebenklassen nach H endlich. (Jede endliche Menge hat nur endlich viele Teilmengen.) Seien nun a1 , . . . , ar so gewählt, dass a1 H, a2 H, . . . ar H die r verschiedenen Nebenklassen von G nach H sind. (Jedes ai darf durch ein beliebiges a0i ∈ ai H ersetzt werden.) Dann wissen wir: 1. G = a1 H ∪ a2 H ∪ . . . ∪ ar H; 2. ai H ∩ aj H = ∅, wenn i 6= j ist; 3. jedes ai H hat soviele Elemente wie H. Es folgt: G hat r-mal soviele Elemente wie H. Wir haben folgendes bewiesen: Satz 9.2.6 Sei G eine endliche Gruppe und H eine Untergruppe von G, dann ist die Ordnung von H ein Teiler der Ordnung von G. 9.2.7 Sei a ein Element einer (multiplikativ geschriebenen) Gruppe G. Die Potenzen an mit n ∈ Z bilden offenbar eine abelsche Untergruppe von G, die von a erzeugte Untergruppe, die mit hai bezeichnet wird. Man kann zwei Fälle unterscheiden: 1. Falls m 6= n, ist immer auch am 6= an . D.h. alle Potenzen . . . , a−2 , a−1 , 1, a, a2 , . . . sind untereinander verschieden. In diesem Fall ist die Abbildung Z → hai, n 7→ an ein Isomorfismus, wo Z als additive Gruppe betrachtete wird. Z.B. gilt dies für a = 2 in Q∗ , der multiplikativen Gruppe aller von 0 verschiedenen rationalen Zahlen. 2. Es gibt ganze Zahlen m 6= n mit am = an . Dies gilt z.B. für a = −1 in Q∗ , da (−1)2 = (−1)4 ist, und allgemeiner (−1)m = (−1)n genau dann stimmt, wenn m, n beide gerade oder beide ungerade sind, m.a.W. wenn m ≡ n (mod 2) ist. Ein anderes Beispiel ist das Element δ ∈ S3 . Die von δ erzeugte Gruppe ist {I, δ, δ 0 } = V , da δ 2 = δ 0 und δ 3 = I ist. Hier gilt δ m = δ n ⇐⇒ m ≡ n (mod 3). Im Fall 1. ist die von a erzeugte Gruppe und mit ihr auch G unendlich. Ist G endlich, muss demnach der 2. Fall eintreten. Im 2. Fall gelte am = an mit m 6= n, etwa m > n. Dann ist am−n = 1. Mithin gibt es dann eine positive ganze Zahl r mit ar = 1. Sei k die kleinste positive ganze Zahl mit ak = 1. Behauptung. Unter den o.a. Voraussetzungen gilt m ≡ n (mod k) ⇐⇒ am = an Beweis hierfür: Ist ak = 1, so ist auch akl = (ak )l = 1 für jede ganze Zahl l. Aus m ≡ n (mod k) folgt m − n = kl für ein l, hieraus am−n = 1, also am = an . 9.2. NEBENKLASSEN 245 Sei umgekehrt am = an , also am−n = 1. Dividiere m − n durch k mit Rest: m − n = qk + r, wo q, r ∈ Z und 0 ≤ r < k. Es folgt ar = am−n−qk = am−n (ak )−q = 1. Wäre r > 0, so wäre r eine positive ganze Zahl mit ar = 1, die kleiner als k wäre. Das widerspräche der Wahl von k. Somit ist r = 0, d.h. m − n = qk, also m ≡ n (mod k). – Die verschiedenen Potenzen von a sind demnach a0 , a1 , a2 , . . . , ak−1 . Diese bilden eine Untergruppe von G aus k Elementen. Diese Untergruppe ist isomorf zur additiven Gruppe Z/(k), sowie zur multiplikativen Gruppe der n-ten Einheitswurzeln. Definition 9.2.8 Die Ordnung eines Elementes a einer (multiplikativ geschriebenen) Gruppe ist: ∞, wenn die Potenzen an sämtlich verschieden sind. k, wenn die Potenzen an nicht sämtlich verschieden sind und k die kleinste positive ganze Zahl mit ak = 1 ist. Bemerkung 9.2.9 Die Ordnung k eines Elementes a einer Gruppe G ist die Ordnung der von a erzeugten Untergruppe. Ist insbesondere G endlich, so ist k (natürlich endlich) und ein Teiler von #G. Satz 9.2.10 Sei G eine endliche (multiplikativ geschriebene) Gruppe aus g Elementen und a ∈ G. Dann ist ag = 1. Beweis: 1l = 1. Die Ordnung k von a ist ein Teiler von g, etwa g = kl. Somit ist ag = akl = (ak )l = Folgerung 9.2.11 Zu jeder Primzahl p gibt es bis auf Isomorfie nur eine Gruppe der Ordnung p. Diese ist isomorf zur additiven Gruppe von Z/(p) und somit abelsch. Beweis: Sei G eine Gruppe der Ordnung p und a ∈ G nicht das neutrale Element. Die Ordnung der von a erzeugten Untergruppe hai ist ein Teiler von p. Andererseits ist ihre Ordnung größer als 1, da sie außer dem neutralen Element mindestens ein weiteres Element enthält. Also ist ihre Ordnung p. Somit ist G gleich hai, also isomorf zur additiven Gruppe von Z/p. Folgerung 9.2.12 (Fermat) Sei p eine Primzahl und a ∈ Z nicht durch p teilbar. Dann gilt ap−1 ≡ 1 (mod p). Beweis: Wir betrachten den Körper Z/(p). Dieser hat p Elemente. Seine multiplikative Gruppe besteht aus allen Elementen außer der Restklasse von 0, also aus p − 1 Elementen. Für jedes Element x 6= 0 dieses Körpers gilt also xp−1 = 1. Die Restklasse jeder ganzen Zahl a, die nicht durch p teilbar ist, ist ein Element x 6= 0 dieses Körpers. Die Gleichung xp−1 = 1 in dem Körper Z/(p) bedeutet dann die Kongruenz ap−1 ≡ 1 (mod p) in Z. 246 KAPITEL 9. GRUPPEN Bemerkung 9.2.13 Die fundamentale Tatsache (9.2.10) über endliche Gruppen ergibt also unmittelbar den angegebenen zahlentheoretischen Satz von Fermat. Beachte, dass aus diesem Satz für ganz beliebige a ∈ Z und eine Primzahl p die Kongruenz ap ≡ a (mod p) folgt (auch wenn a durch p teilbar sein sollte). Auch gilt allgemein für a, b, m, n ∈ Z und jede Primzahl p die Implikation: a ≡ b (mod p) und m ≡ n (mod p − 1) =⇒ am ≡ bn (mod p) Beachte: Um eine Kongruenz modulo p von Potenzen zu erhalten, hat man also für die Basen die Kongruenz modulo p, hingegen für die Exponenten die Kongruenz modulo p−1 vorauszusetzen! Natürlich kann man allgemeiner Ringe der Form Z/(m) betrachten und darin die multiplikative Gruppe der (multiplikativ) invertierbaren Elemente (Z/(m))∗ . Die Anzahl der Elemente dieser Gruppe wird seit Euler mit ϕ(m) bezeichnet. Für ganze Zahlen a, die zu m teilerfremd sind, d.h. deren Restklassen in Z/(m) invertierbar sind, gilt dann aϕ(m) ≡ 1 (mod m) (Euler) Dieser Satz wird erst dann interessant, wenn man ϕ(m) berechnen kann. Dies ist leicht möglich, wenn man die Primfaktorzerlegung von m kennt. Sei nämlich m = pk11 · · · pkr r mit verschiedenen Primzahlen p1 , . . . , pr und natürlichen Zahlen ki ≥ 1; dann ist ϕ(m) = (pk11 − pk11 −1 ) · · · (pkr r − pkr r −1 ) Falls m = pk eine Primzahlpotenz ist, gilt ϕ(pk ) = pk − pk−1 . Das kannst Du vielleicht selbst nachprüfen. Zum allgemeinen Fall benötigt man den sogenannten chinesischen Restsatz, der weiter unten bewiesen wird. Definition 9.2.14 Eine Gruppe G heißt zyklisch, wenn es ein a ∈ G mit hai = G gibt. Bemerkung 9.2.15 Bis auf Isomorfie gibt es genau eine zyklische Gruppe unendlicher Ordnung. Diese ist isomorf zur additiven Gruppe von Z. Zu jeder endlichen Ordnung m ≥ 1 gibt es bis auf Isomorfie genau eine zyklische Gruppe. Diese ist isomorf zur additiven Gruppe von Z/(m) und zur multiplikativen Gruppe Em der m-ten Einheitswurzeln. Das wird weiter unten bewiesen. AUFGABEN 1. Endliche Untergruppen von C∗ , der multiplikativen Gruppe des Körpers C. Sei G eine endliche Untergruppe der Ordnung n von C∗ . Dann gilt an = 1 für alle a ∈ G. Also gilt G ⊂ En , wobei En die Gruppe der n-ten Einheitswurzeln ist. Es folgt G = En , da auch En aus n Elementen besteht. 9.3. FAKTORGRUPPEN 247 2. Sei G eine (multiplikativ geschriebene) endliche zyklische Gruppe. Zeige: Hat G eine ungerade Ordnung, so ist in G jedes Element das Quadrat eines geeigneten Elementes von G. Hat hingegen G eine gerade Ordnung, so ist genau die Hälfte der Elemente von G ein Quadrat in G. 3. Sei G eine zyklische Gruppe von der Ordnung g und g zu m > 0 teilerfremd. Dann ist jedes Element von G eine m-te Potenz in G. Ist hingegen die Ordnung von G durch m teilbar, so ist jedes m-te Element von G eine m-te Potenz in G. 4. a) Ist die Zahl 10 · 210 + 1 eine Primzahl? b) Sei p 6= 101 eine Primzahl. Kann dann 100 · p100 + 1 eine Primzahl sein? c) Seien p, q verschiedene Primzahlen. Kann dann (q − 1) · pq−1 + 1 eine Primzahl sein? 5. Bestimme (bis auf Isomorfie) alle Gruppen der Ordnung 4. Bemerkung: Natürlich bleibt es Dir unbenommen, zu zeigen, das es bis auf Isomorfie nur 2 Gruppen der Ordnung 6 gibt, nämlich die S3 und die Z/(6). Es scheint mir allerdings nicht unbedingt sinnvoll, mit den wenigen in diesem Buch bereit gestellten Mitteln für zuviele n die Gruppen der Ordnung n zu bestimmen. Schon der Fall der Ordnung 6 ist nicht trivial. Auch wenn man mit verhältnismäßig elementaren Mitteln etwas weiter kommt – ich selber habe einst die Gruppen der Ordnungen 48 und 52 bestimmt – bleibt letztlich der Versuch, alle endlichen Gruppen zu beschreiben, unbefriedigend. Anders ist die Sache bei endlichen abelschen Gruppen. Kennt man die Primfaktorzerlegung einer natürlichen Zahl n, kann man die abelschen Gruppen der Ordnung n leicht beschreiben. 9.3 Faktorgruppen Betrachte die additive Gruppe von Z. Du weißt bereits, dass die Mengen mZ mit m ∈ N die Untergruppen von Z sind. Wenn man von den multiplikativen Strukturen auf Z und Z/(m) absieht, so sind beide additive Gruppen und die Abbildung k 7→ k + mZ von Z nach Z/(m) ist ein surjektiver Gruppenhomomorfismus. 9.3.1 Wir verallgemeinern die Konstrukion von Z/(m). Zu einer Untergruppe U einer abelschen (multiplikativ geschriebenen) Gruppe G bilden wir die Nebenklassen aU , wo a ∈ G ist. Wir wissen bereits, dass verschiedene Nebenklassen disjunkt sind und ihre Vereinigung ganz G ausmacht. Die Menge der Nebenklassen bezeichnet man mit G/U . Nun definiert man das Produkt zweier Nebenklassen, wie folgt: (aU )(bU ) := (ab)U . Es stellt sich die Frage nach der Wohldefiniertheit. D.h. wir müssen uns vergewissern, dass aus aU = a0 U, bU = b0 U die Gleichheit (ab)U = (a0 b0 )U folgt. (Dabei brauchen wir die Voraussetzung, dass G abelsch ist.) Beweis hierfür: Die Voraussetzungen bedeuten a−1 a0 ∈ U, b−1 b0 ∈ U . Dann ist (ab)−1 a0 b0 = a−1 a0 b−1 b0 ∈ U , da G abelsch und U eine Gruppe ist. – 248 KAPITEL 9. GRUPPEN Man erhält eine surjektive Abbildung κ : G → G/U, a 7→ aU mit der Eigenschaft κ(ab) = κ(a)κ(b). Auf Grund dieser Eigenschaft und der Surjektivität überträgt sich die Gruppenstruktur von G auf G/U . Das neutrale Element ist 1U = U , das Inverse von aU ist die Nebenklasse a−1 U . Mache Dir klar, dass tatsächlich die Konstruktion der additiven Gruppe Z/(m) ein Spezialfall der der Konstruktion von G/U als Gruppe ist. Lediglich die Schreibweise ‘additiv’, bzw. ‘multiplikativ’ ist verschieden! Ist G nicht abelsch, kann man nicht wie oben argumentieren. In der Tat muss U eine gewisse Eigenschaft haben, die im abelschen Fall immer erfüllt ist. Für alle a ∈ G muss nämlich aU = U a gelten. Im folgenden Beispiel gibt es Gruppenelemente x, y mit xU = yU , aber (xx)U 6= (yy)U . Beispiel 9.3.2 Sei mit den Bezeichnungen aus dem ersten Abschnitt G = S3 , U = U1 = {I, σ1 }. Dann ist σ3 U = {σ3 , δ}, also σ3 U = δU . Aber σ3 ◦σ3 und δ ◦δ liegen in verschiedenen Linksnebenklassen nach U1 . Es ist nämlich σ3 ◦σ3 = I, und δ ◦δ = δ 0 , hingegen IU = U und δ 0 U = {δ 0 , σ2 } = 6 {I, σ1 } = U . Definition 9.3.3 Ein Normalteiler einer Gruppe G ist eine Untergruppe U von G, für die folgendes gilt: Für jedes a ∈ G ist aU = U a. Satz 9.3.4 Sei G eine Gruppe, U ⊂ G eine Untergruppe. Durch die Vorschrift (aU )(bU ) := (ab)U (für alle a, b ∈ G) wird genau dann eine Multiplikaton in der Menge der Nebenklassen nach U wohldefiniert, wenn U ein Normalteiler von G ist. Beweis: a) Sei U ein Normalteiler. Wir setzen aU = a0 U und bU = b0 U voraus. Dann ist a0 = au und b0 = bv für geeignete u, v ∈ U . Es gilt also a0 b0 = aubv. Da U ein Normalteiler ist, ist U b = bU . Also gibt es ein u0 ∈ U mit ub = bu0 . Es folgt a0 b0 = aubv = abu0 v ∈ (ab)U . Deshalb haben wir die Gleichheit (ab)U = (a0 b0 )U . b) Sei o.a. Produkt für alle a, b ∈ G wohldefiniert, sowie a = u ∈ U , d.h. aU = 1U . Dann muss (ub)U = (1b)U sein, d.h. ub ∈ bU . Da dies für beliebige u ∈ U gilt, folgt U b ⊂ bU . Daraus ergibt sich offenbar b−1 U ⊂ U b−1 . Beides gilt für alle b ∈ G. Da mit b auch b−1 ganz G durchläuft, gilt für alle a ∈ G sowohl U a ⊂ aU als auch aU ⊂ U a. Mithin ist U ein Normalteiler. 9.3.5 Sei U ein Normalteiler einer Gruppe G. Wie oben (im abelschen Fall) wird mit G/U die Menge der Nebenklassen von G nach U bezeichnet. Wie dort siehst Du, dass G/U wieder eine Gruppe ist. Definition 9.3.6 Wenn U ein Normalteiler einer Gruppe G ist, heißt G/U die Faktorgruppe von G nach U . 9.3. FAKTORGRUPPEN 249 Beispiel 9.3.7 Sei wieder G = S3 . Zeige, dass die Untergruppe V = {I, δ, δ 0 } ein Normalteiler ist, und dass S3 /V eine Gruppe von 2 Elementen ist. Die Nebenklasse V ist das neutrale, die Nebenklasse σ1 V das weitere Element. Erinnere Dich daran, dass V = δV = δ 0 V und σ1 V = σ2 V = σ3 V gelten. Es gibt genau 2 Nebenklassen von S3 nach V . Die Faktorgruppe S3 /V ist also eine Gruppe von 2 Elementen, d.h. isomorf zur aditiven Gruppe Z/(2) und zur Untergruppe {1, −1} von Q∗ . In obigen Beispiel haben wir gesehen, dass U1 kein Normalteiler von S3 ist. Dasselbe gilt natürlich für U2 und U3 . Theorem 9.3.8 Homomorfiesatz. Sei f : G → H ein Gruppenhomomorfismus und K := f −1 ({1H }) sein sogenannter Kern. (1H bezeichnet das neutrale Element von H.) Dann ist K ein Normalteiler von G und im(f ) = f (G) eine Untergruppe von H. Und es wird durch ϕ(xK) := f (x) eine Abbildung ϕ : G/K → f (G) wohldefiniert. Diese ist ein Isomorfismus. Man kennt also die Struktur des Bildes eines Gruppenhomomorfismus G → H, wenn man seinen Kern als Teilmenge von G kennt. Beweis: Seien f (a), f (b) beliebige Elemente von f (G). Dann ist f (a−1 b) = f (a)−1 f (b), ferner gilt 1H = f (1G ). Also ist f (G) eine Untergruppe von H. Sicher ist 1G ∈ K. Ferner, seien a, b ∈ K. Dann gilt f (a−1 b) = f (a)−1 f (b) = 1. Also ist K eine Untergruppe von G. Ist x ∈ G, a ∈ K, so ist f (xax−1 ) = f (x)f (a)f (x)−1 = f (x) · 1H · f (x)−1 = 1H . D.h. mit a ∈ K gilt xax−1 ∈ K, d.h. xa ∈ Kx. Also ist xK ⊂ Kx und aus Symmetriegründen Kx ⊂ xK. Mithin ist xK = Kx und K ein Normalteiler. Wir müssen zeigen, dass ϕ wohldefiniert ist. Sei also xK = yK, d.h. es gibt ein a ∈ K mit y = xa. Es folgt f (y) = f (x)f (a) = f (x), was zu zeigen war. ϕ ist ein Homomorfismus. Denn ϕ((xK)(yK)) = ϕ((xy)K) = f (xy) = f (x)f (y) = ϕ(xK)ϕ(yK). Das Bild der Abbildung ϕ ist natürlich dasselbe wie das Bild von f . Also ist ϕ surjektiv. Schließlich sei ϕ(xK) = ϕ(yK), so ist f (x) = f (y). Es folgt f (x−1 y) = 1H , d.h. x−1 y ∈ K, also xK = yK. Somit ist ϕ injektiv. Beispiele 9.3.9 a)Betrachte det : Gl2 (K) → K ∗ . Der Gruppenhomomorfismus det ist surjeka 0 tiv, da det = a gilt. Der Kern von det, der aus den Matrizen mit der Determinante 1 0 1 besteht, wird Sl2 (K), die spezielle lineare Gruppe, genannt. Nach dem Homomorfiesatz ist Gl2 (K)/Sl2 (K) isomorf zur Gruppe K ∗ . b) Betrachte die Abbildung R → C∗ , x 7→ exp(xi). Wenn ich R als additive Gruppe auffasse, ist dies ein Gruppenhomomorfismus. Das Bild dieser Abbildung ist die Untergruppe 1 S := {Z ∈ C |z| = 1} von C∗ . Der Kern ist 2πZ, d.h. besteht aus den ganzzahligen Vielfachen von 2π. Es ist also R/2πZ isomorph zur multiplikativen Gruppe S 1 . Übrigens ergibt 250 KAPITEL 9. GRUPPEN sich kein wesentlicher Unterschied, wenn ich anstelle der genannten Abbildung die Abbildung x 7→ exp(2πxi) betrachte. Dann ist der Kern einfach die (additive) Untergruppe Z von R. Die Gruppenhomomorfismen in den genannten Beispielen sind in keiner Weise Ringhomomorfismen. Es bereichert also ganz sicher die Mathematik, wenn man neben Ringen (und Körpern) auch Gruppen betrachtet. Satz 9.3.10 Sei G eine zyklische Gruppe. Dann ist G isomorf zur additiven Gruppe von Z/(m) für ein eindeutig bestimmtes m ∈ N. Und zwar ist m = 0 genau dann, wenn G unendlich ist. Anderfalls ist m = #G. Beweis: Im Grunde wissen wir das schon. Aber es folgt auch direkt aus dem Homomorfiesatz, indem man für ein erzeugendes Element a den Gruppenhomomorfismus Z → G, n 7→ an betrachtet. (Hier wird Z als die additive Gruppe von Z aufgefasst.) Dieser Homomorfismus ist surjektiv und sein Kern ist eine Untergruppe von Z, also gleich mZ für ein gewisses m ∈ N. Somit ist G ∼ = Z/mZ. Beachte: Ist m = 0, so ist Z/0Z, und damit G isomorf zu Z, betrachtet als additive Gruppe. 9.3.11 Ziemlich weit oben, im Kapitel 2 über Ringe und Körper habe ich das direkte Produkt von Ringen definiert: R1 × R2 × · · · × Rn definiert. Dieses besteht aus den n-tupeln (a1 , . . . , an ) mit ai ∈ Ri , wo Summe und Produkt auf naheliegende Weise, nämlich komponentenweise definiert sind: (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) und (a1 , . . . , an ) · (b1 , . . . , bn ) := (a1 · b1 , . . . , an · bn ) . Wenn die Ri lediglich Gruppen sind, kann man natürlich auch ein direktes Produkt von diesen Gruppen ganz analog definieren, nämlich als cartesisches Produkt der Mengen mit komponentenweiser Verknüpfung. a 0 Beispiel: Die Untergruppe der Gl2 (Q) der Ordnung 4, die aus den Matrizen mit 0 b a, b ∈ {1, −1} besteht (vgl. 9.1.16), ist isomorf der (additiven) Gruppe (Z/(2)) × (Z/(2)). Sind R1 , . . . , Rn Ringe, so ist die additive Gruppe des direkten Produktes der Ringe R1 , . . . , Rn natürlich das direkte Produkt der additiven Gruppen der R1 , . . . , Rn . Betrachte nun auch die Gruppen Ri∗ der invertierbaren Elemente der Ri , so gilt (R1 ×· · ·×Rn )∗ = R1∗ ×· · ·×Rn∗ . Denn ein n-tupel (a1 , . . . , an ) besitzt genau dann ein multiplikativ Inverses in dem direkten Produkt, wenn jede Komponente ai in Ri ein Inverses besitzt. Denn es ist ja (a1 , . . . , an )(b1 , . . . , bn ) = (1, . . . , 1) genau dann, wenn ai bi = 1 für alle i = 1, . . . , n gilt. Betrachte nun speziell Ringe der Form Z/(mi ) und die kanonischen Ringhomomorfismen κi : Z → Z/(mi ), definiert durch κi (a) = a + mi Z. Beachte, dass die κi auch Gruppenhomomorfismen der additiven Gruppen sind! Zu n solchen mi kann man dann einen Ringhomomorfismus F : Z → Z/(m1 ) × · · · × Z/(mn ) durch F (a) := (κ1 (a), . . . , κn (a)) = (a + m1 Z, . . . , a + mn Z) definieren. 9.3. FAKTORGRUPPEN 251 Beispiele 9.3.12 a) n = 2, m1 = m2 = 3. Das Bild der Abbildung F besteht aus den Restklassen-Paaren: (0, 0), (1, 1), (2, 2). Die Abbildung F ist also keineswegs surjektiv! b) n = 2, m1 = 2, m2 = 3. Das Bild von F ist die Menge {F (0) = (0, 0), F (1) = (1, 1), F (2) = (0, 2), F (3) = (1, 0), F (4) = (0, 1), F (5) = (1, 2)}. Dabei bedeutet der Querstrich in der linken Komponente die Restklasse modulo 2, die in der rechten Komponente die Restklasse modulo 3. Du siehst, das Bild von F ist der ganze Ring Z/(2) × Z/(3). Die Abbildung F ist also surjektiv! Nach dem Homomorfiesatz ist dann Z/(2) × Z/(3) isomorf zu Z/(6), zunächst als additive Gruppe. Da aber die Abbildung F auch mit der Multiplikation verträglich ist, sind die beiden Ringe auch als solche isomorf. Der Unterschied zwischen den beiden Beispielen liegt darin, dass im zweiten die Zahlen 2, 3 zueinander teilerfremd sind, nicht aber die Zahlen 3, 3 im ersten Beispiel. Um einen dem zweiten Beispiel entsprechenden Satz allgemein zu zeigen, benötigen wir das Lemma 9.3.13 Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. D.h. für i 6= j sei ggT(mi , mj ) = 1. Wenn dann eine ganze Zahl k durch jedes der mi teilbar ist, ist k auch durch das Produkt m1 · · · mn teilbar. Beweis: Die Primfaktorzerlegung von m1 · · · mn sei pα1 1 · · · pαr r mit untereinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Jeder Primzahlpotenz-Faktor pαi i teilt wegen der Teilerfremdheit genau eines der mj , da ansonsten mehrere mj einen Primfaktor gemeinsam hätten. Also gilt pαi i |k für jedes i. Wegen der Eindeutigkeit der Primfaktorzerlegung von k wird k durch das Produkt aller pαi i also von m1 · · · mn geteilt. Satz 9.3.14 (Chinesischer Restsatz. Sun Tsu, Chhin Chiu–Shao) Seien m1 , . . . , mn ∈ N1 paarweise teilerfremd. Die kanonischen Homomorfismen κi : Z −→ Z/(mi ), a 7→ a + mi Z definieren dann einen surjektiven Homomorfismus Z −→ Z/(m1 ) × · · · × Z/(mn ) durch a 7→ (κ1 (a), . . . , κn (a)) und einen Isomorfismus ∼ = G : Z/(m1 · · · mn ) −→ Z/(mi ) × · · · × Z/(mn ) . Beweis: Betrachte den oben definierten Homomorfismus F : Z −→ Z/(m1 ) × · · · × Z/(mn ) . Sein Kern besteht aus allen a ∈ Z, für die m1 |a, m2 |a, . . . , mn |a gilt. Dies ist nach obigem Lemma gleichbedeutend mit m1 · · · mn |a, da die mi paarweise teilerfremd sind. Somit ist m1 · · · mn Z 252 KAPITEL 9. GRUPPEN der Kern von F . Nach dem Homomorfiesatz wird also durch F ein injektiver Homomorfismus induziert: G : Z/(m1 · · · mn ) −→ Z/(m1 ) × · · · × Z/(mn ) . Da die Start- und die Zielmenge von G die gleiche endliche Anzahl von Elementen haben, nämlich m1 · · · mn , ist G auch surjektiv. Und hieraus folgt die Surjektivität der Abbildung F . Folgerung 9.3.15 Seien m1 , . . . , mn paarweise teilerfremde ganze Zahlen 6= a1 , . . . , am ∈ Z beliebig. Dann hat das Kongruenzsystem x ≡ ai (mod mi ) 0 und (i = 1, . . . , n) eine Lösung, d.h. es gibt ein x ∈ Z, welches alle n angegebenen Kongruenzen erfüllt. Die Lösung ist bis auf Kongruenz modulo m1 · · · mn eindeutig bestimmt. Beweis: Die Existenzaussage folgt aus der Surjektivität, die Eindeutigkeitsaussage aus der Injektivität der Abbildung G. Folgerung 9.3.16 Sei m > 1 eine ganze Zahl und m = pα1 1 · · · pαr r ihre Primfaktorzerlegung mit zueinander verschiedenen Primzahlen pi und ganzen αi ≥ 1. Dann ist ϕ(m) = (p1 − 1)pα1 1 −1 · · · (pr − 1)pαr −1 für Eulers ϕ. Beweis: Betrachte zunächst den Fall m = pα mit einer Primzahl p und α ≥ 1. Die Elemente des Ringes Z/(pα ) sind die Restklassen der Zahlen 1, 2, . . . , pα . (Um das folgende Argument durchsichtiger zu machen, habe ich die 0-Restklasse hier durch pα repräsentiert!) Diejenigen Zahlen dieser Menge, die zu pα nicht teilerfremd sind, sind die Vielfachen von p, also die pα−1 Zahlen p, 2p, . . . , pα−1 p. In dem Ring Z/(pα ) gibt es somit pα − pα−1 = (p − 1)pα−1 zu pα teilerfremde Restklassen, d.h. Einheiten. Nach Voraussetzung sind die r Zahlen pα1 1 , . . . , pαr r zueinander paarweise teilerfremd. Also ist nach dem chinesischen Restsatz Z/(m) isomorf zu dem direkten Produkt Z/(pα1 1 )×· · ·×Z/(pαr r ), hat also die behauptete Anzahl von Einheiten. Bemerkung 9.3.17 (RSA-Verschlüsselung) Falls m = pq mit verschiedenen Primzahlen p, q ist, ist ϕ(m) = (p − 1)(q − 1), wie man aus der letzten Folgerung sieht. (Dies kannst Du allerdings auch ohne den chinesischen Restsatz direkt einsehen: Von den Zahlen 0, 1, . . . , pq − 1 sind genau p Zahlen durch q teilbar, sowie q Zahlen durch p und genau eine Zahl, nämlich die 0 sowohl durch p wie durch q. Du erhältst ϕ(pq) = pq−p−q+1 = (p−1)(q−1).) Ohne die Primfaktorzerlegung von m zu kennen, kann man ϕ(m) nicht wirklich berechnen. (Wenn man m und ϕ(m) kennt, kann man p und q mittels einer quadratischen Gleichung bestimmen. Wie? D.h. die Aufgaben, einerseits ϕ(m) zu berechnen, andererseits m in Primfaktoren zu zerlegen sind im wesentlichen gleich mühsam.) Und falls p und q jeweils mehr als 200 Dezimalstellen besitzen, kann einer, dem nur ihr Produkt m bekannt ist, die Faktoren p, q 9.3. FAKTORGRUPPEN 253 meist auch mit Computer-Hilfe nicht finden. Das ist kein mathematischer Satz, sondern ein Erfahrungssatz! Sollte es eines Tages sogenannte Quantencomputer geben, würde diese Aussage auch nicht mehr stimmen. (Quantencomputer nützen für aufwendige Rechnungen die quantentheoretische Natur der Materie aus. Es gibt solche der Idee nach, aber noch nicht wirklich in der Realität.) Einen Text von 200 Zeichen (Buchstaben, Satzzeichen, Leerstellen, ...) kann man durch ein Zahl von 400 Dezimalstellen codieren. Einen längeren Text kann man in Teile von 200 Zeichen zerlegen. Es genügt also etwa 400-stellige Zahlen zu verschlüsseln. Sind k und a natürliche Zahlen, so gilt ak(p−1)(q−1)+1 ≡ a (mod pq). Derjenige, der p und q, also (p − 1)(q − 1) kennt, kann mit Hilfe des euklidischen Algorithmus leicht natürliche Zahlen k, c, d mit cd = k(p − 1)(q − 1) + 1 finden. Er kann dann jedermann auffordern, ihm Nachrichten zu schicken, nachdem sie folgendermaßen verschlüsselt wurden: Ist die Nachricht durch eine natürliche Zahl a < m, d.h. auch als Element von Z/(m) beschrieben, bilde ac modulo m. Das ist durch die im 1. Kapitel beschriebene abgekürzte Berechnung von Potenzen möglich, wenn man nach jeder Einzelrechnung den Rest modulo m bestimmt. Er selber kann sie dann durch Potenzieren von ac mit d, wieder modulo m, entschlüsseln. Denn da cd = k(p − 1)(q − 1) + 1 ist, gilt acd = ak(p−1)(q−1)+1 = ak(p−1)(q−1) · a1 ≡ a (mod m) . Mache Dir klar, dass man xy modulo m verhältnismäßig schnell berechnen kann, dass man aber d aus m und c nur berechnen kann, wenn man ϕ(m) kennt. AUFGABEN 1. Sei U eine Untergruppe einer Gruppe G. Zeige: Wenn U kein Normalteiler von G ist, so gibt es a, b ∈ G mit aU = bU , aber U a 6= U b. 2. Unter der Voraussetzung der letzten Aufgabe gilt aber: aU = bU ⇐⇒ U a−1 = U b−1 . Folglich gibt es eine bijektive Abbildung von der Menge der Linksnebenklassen nach U auf die Menge der Rechtsnebenklassen gegeben durch aU 7→ U a−1 . Die Kardinalzahl der Menge der Linksoder der Rechtsnebenklassen von G nach U heißt der Index von U in G. Er wird mit [G : U ] bezeichnet. 3. Zeige: Gilt unter obiger Voraussetzung [G : U ] = 2, so sind U und G − U sowohl die beiden Linksnebenklassen als auch die beiden Rechtsnebenklassen von G nach U . Folglich ist U ein Normalteiler von G. 4. Wann gilt für eine natürliche Zahl n, dass ϕ(n) eine Potenz von 2, also durch keine ungerade Primzahl teilbar ist? Zeige: Dies gilt genau für die Zahlen der Form n = 2k p1 · · · pr , wo die Faktoren p1 , . . . , pr verschiedene sogenannte Fermat’schen Primzahlen sind. 254 KAPITEL 9. GRUPPEN m Eine Fermatsche Primzahl ist eine solche der Form 22 + 1. (Du weißt schon, wenn 2n + 1 eine Primzahl ist, muss n = 0 oder n = 2m sein.) Beispiele Fermat’scher Primzahlen sind die folgenden 2 = 20 + 1, 3 = 21 + 1, 5 = 22 + 1, 17 = 24 + 1, 257 = 28 + 1, 65537 = 216 + 1. Bis m jetzt kennt man keine weiteren Primzahlen der Form 22 + 1 als die genannten und weiß von vielen Zahlen dieser Form, dass sie nicht prim sind. 5. Seien G1 , G2 , H abelsche Gruppen und fi : Gi → H Homomorfismen. Zeige: Die Abbildung F : G1 × G2 → H mit F (a1 , a2 ) = f1 (a1 ) + f2 (a2 ) (additive Schreibweise in H) ist ein Homomorfismus. 6. Sei H eine endliche Gruppe, in der jedes Element eine Ordnung ≤ 2 hat. Zeige: H ist isomorf zu Z/(2) × Z/(2) × · · · × Z/(2) mit einer geeigneten Anzahl von Faktoren. (Hinweis: Wir wissen schon, dass H abelsch ist. Benutze jetzt die additive Schreibweise für H: Betrachte Untergruppen von H, die zu direkten Produkten Z/(2) × · · · × Z/(2) isomorf sind und unter diesen eine maximalmögliche U . Das soll heißen: Ist V eine Untergruppe mit V ⊃ U , die zu einer Gruppe der Form Z/(2) × · · · × Z/(2) isomorf ist, so gilt schon V = U . Ist nun U = H, so gilt die Behauptung. Ist aber U eine echte Unterguppe von H, so kann man mit Hilfe der letzten Aufgabe eine Untergruppe V konstruieren, die U echt umfasst und isomorf zu einer Gruppe der Form Z/(2) × · · · × Z/(2) ist. ) 7. Sei H eine Untergruppe der multiplikativen Gruppe eines Körpers K. Sei G die Menge derjenigen Matrizen aus Gl2 (K), die entweder von der Form a 0 0 c oder von der Form 0 b d 0 mit a, b, c, d ∈ H sind. Zeige a) G ist eine Untergruppe der Gl2 (K). b) Die Teilmenge N von G, die aus den Matrizen der Form a 0 mit a, b ∈ H 0 b besteht, ist ein Normalteiler vom Index 2 in G. Somit ist G/N die – bis auf Isomorfie eindeutig bestimmte Gruppe der Ordnung 2. b’) Die nichttriviale (d.h. von N verschiedene) Nebenklasse von G nach N besteht aus den Matrizen der Form 0 c d 0 mit c, d ∈ H. c) In K gelte 1 6= −1, und es sei im Folgenden H = {1, −1}. Dann ist G eine nichtabelsche Gruppe der Ordnung 8. Bestimme die Elemente der Ordnung 2 (davon gibt es 5) sowie die der Ordnung 4 (davon gibt es 2). 8. Bestimme die letzten 3 Ziffern von 19981998! . Kapitel 10 Lineare Gleichungssysteme Die Behandlung linearer Gleichungssysteme ist ein wichtiger Teil des Gebietes der Linearen Algebra. Hier möchte ich Dir eine systematische Methode, lineare Gleichungssysteme zu lösen vorstellen, nämlich das sogenannte Gaußsche Verfahren. Ich habe die Erfahrung gemacht, dass es vielen jungen Studierenden schwerfällt, eine allgemeine Beschreibung dieses Verfahrens zu verstehen. Deshalb behandle ich zunächst Spezialfälle. 10.0.18 Wir wollen z.B. die rationalen Lösungen des folgenden Gleichungssystems finden. 3x +2y +4z = 6 2x −3y + 21 z = 4 5x +4y −3z = 20 Wir formen das Gleichungssystem um, indem wir zweiten addieren: 3x +2y +4z 0x − 13 y − 13 z 3 6 5x +4y −3z das (− 23 )-fache der ersten Gleichung zur = 6 = 0 = 20 Es ist klar, dass jede Lösung des ersten Systems auch eine des zweiten ist. Umgekehrt, da man aber das erste System aus dem zweiten zurückerhält, indem man das (+ 23 )-fache der ersten Gleichung zur zweiten addiert, ist jede Lösung des zweiten Gleichungssytems auch eine des ersten. Durch die obige Umformung hat man die Lösungsgesamtheit des Gleichungssystems nicht verändert. D.h. ein Tripel von (etwa rationalen) Zahlen (ξ, η, ζ) für (x, y, z) eingesetzt erfüllt genau dann das erste System, wenn es das zweite erfüllt. Indem wir das (− 53 )-fache der ersten Gleichung zur dritten addieren, erhalten wir: 3x +2y +4z = 6 0x − 13 y − 13 z = 0 3 6 2 z = 10 0x + 3 y − 29 3 Wieder hat sich an der Menge der Lösungen nichts geändert! 255 256 Nun addieren wir das KAPITEL 10. LINEARE GLEICHUNGSSYSTEME 2 -fache 13 der zweiten Gleichung zur dritten: 3x +2y +4z = 6 0x − 13 y − 13 z = 0 3 6 0x +0y −10z = 10 Dieses Gleichungssystem können wir von hinten aufrollen“ und die einzig mögliche Lösung ” ausrechnen: x = 3, y = 12 , z = −1. Diese, und nur diese, erfüllt (natürlich) auch das erste System. (Eine Lösung eines Gleichungssystems mit 3 Unbekannten ist immer ein Tripel von Zahlen, hier das Tripel (3, 21 , −1). Bei n Unbekannten ist eine Lösung ein n-tupel (a1 , . . . , an ).) Man kann aber auch das letzte Gleichungssystem noch weiter modifizieren, so dass die Lösung schließlich ganz durchsichtig erkennbar ist. Zunächst multiplizieren wir die erste Gleichung mit 1 3 1 , die zweite mit − 13 und die dritte mit − 10 : 3 1x + 23 y + 43 z = 2 1 0x +1y + 2 z = 0 0x +0y +1z = −1 Da wir durch Multiplikation mit den inversen Faktoren wieder zum vorletzten System zurückkommen, hat sich wieder nichts an der Lösungsmenge geändert. Nun addieren wir das − 21 -fache der letzten Gleichung zur zweiten, dann das − 34 -fache der letzten Gleichung zur ersten: 1x + 23 y +0z = 10 3 1 0x +1y +0z = 2 0x +0y +1z = −1 Schließlich addieren wir das − 32 -fache der zweiten Gleichung zur ersten: 1x +0y +0z = 3 1 0x +1y +0z = 2 0x +0y +1z = −1 Hier kann man die (einzige) Lösung in der Tat direkt ablesen. 10.0.19 Ein weiteres Beispiel: 3x +2y +4z = 6 2x −3y + 12 z = 4 7x −4y +5z = 13 Addiere das − 23 -fache der ersten Gleichung zur zweiten und dann das − 37 -fache der ersten zur dritten: 3x +2y +4z = 6 13 0x − 13 y − z = 0 3 6 13 0x − 26 y − z = −1 3 3 257 Nun addiere das −2-fache der zweiten Gleichung zur dritten: 3x +2y +4z = 6 13 0x − 13 y − z = 0 3 6 0x +0y +0z = −1 Da es kein z ∈ Q mit 0z = −1 gibt, hat dieses Gleichungssystem keine Lösung! Die Lösungsmenge ist ∅, die leere Menge. Ein weiteres Beispiel: 3x +2y +4z = 6 2x −3y + 12 z = 5 7x −4y +5z = 16 Das Gleichungssystem unterscheidet sich von dem zuletzt behandelten nur durch die rechten Seiten der zweiten und dritten Gleichung. Wir behandeln es so wie das vorangegangene System. 3x +2y +4z = 6 0x − 13 y − 13 z = 1 3 6 26 13 0x − 3 y − 3 z = 2 Weiter: 3x +2y +4z = 6 0x − 13 y − 13 z = 1 3 6 0x +0y +0z = 0 Dieses System hat offenbar ∞-viele Lösungen. Man kann für z ein beliebiges ζ (oder für y ein beliebiges η) einsetzen und dann die zugehörigen ξ, η (bzw. ξ, ζ) ausrechnen. Wir wollen alle möglichen Lösungen noch expliziter angeben. Dafür formen wir noch weiter um, zunächst durch Multiplikation der ersten beiden Gleichungen durch geeignete Faktoren 6= 0: 1x + 32 y + 43 z = 2 1 3 0x +1y + 2 z = − 13 0x +0y +0z = 0 Dann addieren wir das − 23 -fache der zweiten Gleichung zur ersten: 28 1x +0y +1z = 13 1 3 0x +1y + 2 z = − 13 0x +0y +0z = 0 Man bekommt die folgende Parameterdarstellung aller möglichen Lösungen (ξ, η, ζ) des o.a. Gleichungssystems: ξ= 28 13 3 − t, η = − 13 − 12 t, ζ = t. Der Parameter t darf dabei alle rationalen (oder reellen oder auch komplexen) Zahlen durchlaufen (je nachdem welche Zahlen wir zulassen wollen). Hierfür wollen wir auch schreiben: 258 KAPITEL 10. LINEARE GLEICHUNGSSYSTEME 3 , − 13 , 0) + t(−1, − 12 , 1). (ξ, η, ζ) = ( 28 13 Dabei gelte wie gewohnt: t(a, b, c) := (ta, tb, tc) und (a, b, c) + (a0 , b0 , c0 ) := (a + a0 , b + b0 , c + c0 ). 10.0.20 Wir wollen das letzte Beispiel noch etwas genauer analysieren. 3 , − 13 , 0) + t(−1, − 12 , 1), wo t die Menge Q durchläuft, ist Von allen Lösungen (ξ, η, ζ) = ( 28 13 28 3 ( 13 , − 13 , 0) eine spezielle – wie man etwa sieht, indem man t = 0 setzt. Die Tripel t(−1, − 12 , 1) hingegen sind Lösungen des folgenden Gleichungssystems: 3x +2y +4z = 0 2x −3y + 12 z = 0 7x −4y +5z = 0 welches aus dem letztbehandelten dadurch entsteht, dass man die rechten Seiten aller Gleichungen durch Nullen ersetzt. Denn, wenn man mit dem neuen Gleichungssystem dieselben Manipulationen vornimmt wie mit dem alten, so bleiben auf den rechten Seiten immer die Nullen stehen und auf den linken Seiten erhält man dasselbe wie oben. 1x +0y +1z = 0 0x +1y + 12 z = 0 0x +0y +0z = 0 Und dieses Gleichungssystem hat eben offensichtlich die Lösungen t(−1, − 21 , 1), wo t alle (rationale) Zahlen durchläuft. Satz 10.0.21 Sei a11 x1 a21 x1 ··· +a12 x2 +a22 x2 ··· + · · · +a1n xn + · · · +a2n xn ··· ... ··· = b1 = b2 .. ··· ··· . ··· ··· ··· am1 x1 +am2 x2 + · · · +amn xn = bm ein (ganz allgemeines) lineares Gleichungssystem und (ξ1 , . . . , ξn ) eine seiner Lösungen, so ist die Gesamtheit der Lösungen gleich (ξ1 , . . . , ξn ) + X, wo X die Menge aller Lösungen des folgenden zugehörigen homogenen“ Gleichungssystems ist: ” a11 x1 a21 x1 ··· +a12 x2 +a22 x2 ··· + · · · +a1n xn + · · · +a2n xn ··· ... ··· = 0 = 0 .. ··· ··· . ··· ··· ··· am1 x1 +am2 x2 + · · · +amn xn = 0 259 Dabei sei definiert: (ξ1 , . . . , ξn ) + X := {(ξ1 , . . . , ξn ) + (η1 , . . . , ηn ) | (η1 , . . . , ηn ) ∈ X}. Beweis: Eigentlich ist die Behauptung trivial: Sei etwa (η1 , . . . , ηn ) eine Lösung des homogenen Gleichungssystems, so gilt offenbar: ai1 (ξ1 + η1 ) + ai2 (ξ2 + η2 ) + · · · + ain (ξn + ηn ) = ai1 ξ1 + ai2 ξ2 + · · · + ain ξn + ai1 η1 + ai2 η2 + · · · + ain ηn = bi + 0 = bi Und das für alle i = 1, . . . , n. Das bedeutet, dass jedes n-tupel aus (ξ1 , . . . , ξn ) + X eine Lösung unseres Gleichungssystems ist. Sei umgekehrt (ζ1 , . . . , ζn ) eine solche Lösung und (η1 , . . . , ηn ) := (ζ1 , . . . , ζn ) − (ξ1 , . . . , ξn ). Dann gilt ai1 η1 + ai2 η2 + · · · + ain ηn = ai1 (ζ1 − ξ1 ) + ai2 (ζ2 − ξ2 ) + · · · + ain (ζn − ξn ) = ai1 ζ1 + ai2 ζ2 + · · · + ain ζn − (ai1 ξ1 + ai2 ξ2 + · · · + ain ξn ) = bi − bi = 0 Das heißt: (η1 , . . . , ηn ) ist eine Lösung des zug. homogenen Gleichungssystems, gehört also zu X. Für die Lösung (ζ1 , . . . , ζn ) des ursprünglichen Systems gilt also (ζ1 , . . . , ζn ) = (ξ1 , . . . , ξn ) + (η1 , . . . , ηn ) ∈ (ξ1 , . . . , ξn ) + X. 10.0.22 Wenn ein lineares Gleichungssystem überhaupt Lösungen hat und man eine solche kennt, so erhält man mit Hilfe der Lösungsmenge des zugehörigen homogenen Gleichungssystems alle Lösungen. Ein homogenes lineares Gleichungssystem besitzt immer (mindestens) eine Lösung, nämlich (0, 0, . . . , 0), die sogenannte triviale Lösung. Hat ein lineares Gleichungssystem eine Lösung und hat das zugehörige homogene Gleichungssystem nur die triviale Lösung, so ist das ursprüngliche Gleichungssystem eindeutig lösbar. Die Lösungsmenge X eines homogenen linearen Gleichungssystems ist gegenüber gewissen Verknüpfungen (Operationen) abgeschlossen: ξ, η ∈ X =⇒ ξ + η ∈ X. Ist zusätzlich a eine (rationale) Zahl und ξ ∈ X, so gilt aξ ∈ X. (Man kann dies zusammenfassen zu a, b ∈ Q, ξ, η ∈ X =⇒ aξ + bη ∈ X.) Das bedeutet, dass die Menge der (rationalen) Lösungen eines homogenen linearen Gleichungssystems in n Variablen ein Teilvektorraum des Qn ist. Rechnet man allgemein in einem Körper K, so ist Qn durch K n zu ersetzen. Bemerkungen 10.0.23 a) Es kann natürlich vorkommen dass der Koeffizient der ersten“ ” Unbekannten der ersten Gleichung gleich 0 ist. Dann ist es zweckmäßig, diese Gleichung mit einer zu vertauschen, in der das nicht der Fall ist. Durch die Vertauschung von Gleichungen ändert sich gewiss nicht die Lösungsmenge des Systems. b) Natürlich ist es auch nicht verboten, dass in jeder Gleichung der Koeffizient der ersten Unbekannten gleich 0 ist. Was bedeutet das für die Lösungsmenge? 260 KAPITEL 10. LINEARE GLEICHUNGSSYSTEME 10.0.24 Wir wollen ein Hilfsmittel einführen, welches zunächst lediglich als abgekürzte Schreibweise von linearen Gleichungssysemen dient, aber später von größter Bedeutung sein wird: Eine Matrix ist ein rechteckiges“ Schema von Zahlen: ” a11 · · · a1n .. .. ... . . am1 · · · amn Man kann sie als m-Tupel von n-Tupeln auffassen. Die aij heißen die Einträge der Matrix. Die waagerechten“ n-Tupel (ai1 , . . . , ain ) heißen die Zeilen, die senkrechten“ m-Tupel ” ” a1j .. . amj die Spalten der Matrix. Es ist eine Konvention, dass der erste Index die Zeile, der zweite die Spalte bezeichnet. (Zeile zuerst, Spalte später.) Die (eingeschränkte) Koeffizientenmatrix des LGS a11 x1 a21 x1 ··· +a12 x2 +a22 x2 ··· + · · · +a1n xn + · · · +a2n xn ··· ... ··· = b1 = b2 .. ··· ··· . ··· ··· ··· am1 x1 +am2 x2 + · · · +amn xn = bm ist a11 · · · a1n .. .. ... . . am1 · · · amn Die erweiterte Koeffizientenmatrix desselben LGS ist a11 · · · a1n .. .. ... . . am1 · · · amn b1 .. . bm Definition 10.0.25 Die folgenden Manipulationen mit einer Matrix heißen elementare Zeilen-Umformungen: (I) Eine Zeile wird geändert, indem man ein Vielfaches einer anderen zu ihr addiert. (II) Zeilen werden vertauscht. (III) Eine Zeile wird mit einer von 0 verschiedenen Zahl multipliziert. Zeilen-Umformungen vom Typ (I) heißen auch spezielle elementare Zeilenumformungen. 261 10.0.26 Sei nun a11 · · · a1n b1 .. .. .. .. . . . . am1 · · · amn bm die erweiterte Koeffizientenmatrix eines LGS. Wir haben oben – allerdings nur exemplarisch – gesehen, dass folgendes gilt: Durch eine Folge elementarer Zeilenumformungen vom Typ (I) und Typ (II) kann man sie auf die folgende Gestalt bringen: 0 · · · 0 a01j1 · · · ··· 0 · · · 0 0 · · · 0 a02j2 · · · 0 ··· 0 ··· .. . 0 ··· 0 ··· 0 ··· .. . . . . a03j3 0 .. ··· a01n a02n a03n .. . ··· . 0 b01 b02 b03 .. . a0rjr · · · a0rn b0r 0 b0r+1 0 0 .. .. . . Hier ist 1 ≤ j1 < j2 < j3 < · · · < jr und a0kjk 6= 0 für k = 1, . . . , r. Ist j1 = 1, so besteht die erste Spalte nicht aus Form a011 0 .. . lauter Nullen. Vielmehr ist sie dann von der 0 mit a011 6= 0. Im Allgemeinen bestehen die ersten j1 − 1 Spalten aus lauter Nullen. Die nächsten j2 − j1 Spalten haben die Eigenschaft, dass alle Komponenten, bis auf möglicherweise die erste, gleich 0 sind. Auf jeden Fall ist a1j1 6= 0. Sowohl br+1 = 0 wie br+1 6= 0 ist möglich. Die letzte Matrix heißt die Zeilenstufenform der Ausgangsmatrix. Die Plätze“ mit den ” Indices 1j1 , 2j2 , . . . , rjr heißen die Stufen der Matrix in Zeilenstufenform, die Zahlen j1 , . . . , jr die Stufenindices. Die Einträge a0kjk heißen die Stufeneinträge. 10.0.27 Wir haben oben exemplarisch überlegt, dass das LGS, das zur umgeformten Matrix gehört, dieselben Lösungen hat wie das ursprüngliche. An der Matrix in Zeilenstufenform können wir jetzt sofort erkennen, ob das zug. LGS eine Lösung hat oder nicht. Offensichtlich gibt es keine Lösung, wenn b0r+1 6= 0 ist. Denn dann hat schon die (r + 1)-te Gleichung 0x1 + · · · + 0xn = b0r+1 keine Lösung. Ist hingegen b0r+1 = 0, so kann man für alle j ∈ {1, . . . , n} − {j1 , j2 , . . . , jr } die Unbekannten xj gleich 0 setzen und dann das LGS von unten her aufrollen“. D.h. eine Lösung sieht so aus ” (0, . . . , 0, ξj1 , 0, . . . , 0, ξj2 , . . . , ξjr , 0, . . . , 0), 262 KAPITEL 10. LINEARE GLEICHUNGSSYSTEME wobei ξjr = b0r /a0rjr , ξjr−1 = (b0r−1 − a0r−1,jr ξjr )/a0r−1,jr−1 etc. ist. Um die Lösungsmenge (im Falle br+1 = 0) teoretisch besser zu durchschauen, unternehmen wir noch Folgendes: 1. Wir machen die Stufeneinträge zu 1, indem wir für jedes k = 1, . . . , r die k-te Zeile mit 1/a0kjk multiplizieren. (Es ist ja a0kjk 6= 0.) 2. Dann machen wir durch spezielle Zeilenumformungen (also solche vom Typ I) alles oberhalb der Stufen zu 0. In der jk -ten Spalte steht als danach an der k-ten Stelle eine 1, sonst überall Nullen. 3. Schließlich machen wir etwas für die Praxis Gefährliches. Wir vertauschen die Unbekannten, d.h. die Spalten der bisher erreichten Matrix. (Die letzte Spalte, in der die rechten Seiten der Gleichungen stehen, muss natürlich an ihrem Platz bleiben. Wenn man am Ende die Lösungsmenge korrekt angeben will, muss man die Vertauschung der Unbekannten natürlich berücksichtigen!) Wir bringen die Spalten mit den Stufen nach vorn, d.h. wir machen die jk -te Spalte zur k-ten. Wenn wir die uninteressanten n − k letzten Zeilen, die ja aus lauter Nullen bestehen, weglassen, kommen wir schließlich zu einer Matrix von folgender Gestalt: 1 0 0 · · · 0 a1,r+1 · · · a1n b1 0 1 0 · · · 0 a2,r+1 · · · a2n b2 .. ... ... . 0 1 ar,r+1 · · · arn br Eine spezielle Lösung des LGS ist dann (b1 , . . . , bn , 0, . . . , 0) Um nun alle Lösungen zu finden, lösen wir das zug. homogene LGS, d.h. ersetzen die bi durch Nullen. Wir können die letzten n − r Unbekannten durch beliebige Zahlen ersetzen. Die ersten r sind dann eindeutig bestimmt. Die Lösungen des homogenen LGS sehen dann so aus: (− n X n X tk a1k , . . . , − k=r+1 tk ark , tr+1 , . . . , tn ), k=r+1 wo die tr+1 , . . . , tn unabhängig voneinander alle (rationalen) Zahlen durchlaufen. Man kann diese n-Tupel auch so schreiben: tr+1 (−a1,r+1 , . . . , −ar,r+1 , 1, 0, . . . , 0) + · · · + tn (−a1,n , . . . , −ar,n , 0, . . . , 0, 1) AUFGABEN 1. Geben Sie die Lösungsmenge des folgenden LGS an: x1 + 3x2 3x1 + 9x2 2x2 2x1 + 8x2 + 5x3 + 10x3 + 7x3 + 12x3 + 2x4 + x4 + 2x5 + 3x4 − x5 + 2x4 + x5 = = = = 1 0 3 1 263 2. Bestimmen Sie die Lösungsmenge des Gleichungssystems x1 −x1 2x1 x1 + − + + 2x2 2x2 4x2 2x2 + x3 − 2x3 + 3x3 + 2x3 + x4 + x5 + 2x4 + x5 − x4 − 2x4 − x5 = = = = b1 b2 b3 b4 in den Fällen a) (b1 , b2 , b3 , b4 ) = (0, 0, 0, 0), b) (b1 , b2 , b3 , b4 ) = (2, 5, −1, −3), c) (b1 , b2 , b3 , b4 ) = (2, 5, −1, 8). (Versuchen Sie, möglichst lange die drei Fälle a), b), c) gemeinsam zu behandeln!) 3. Für welche c ∈ Q ist das LGS a) eindeutig lösbar, x − cy = 1 (c − 1)x − 2y = 1 b) lösbar, aber nicht eindeutig lösbar, 4. Zeigen Sie, dass das LGS x1 + 2x2 + 3x3 = 0 4x1 + 5x2 + 6x3 = 0 7x1 + 8x2 + 9x3 = 0 nicht nur die triviale Lösung besitzt. c) unlösbar? 264 KAPITEL 10. LINEARE GLEICHUNGSSYSTEME Anhang A Lösungen 1.2.A1. a) Teile n durch 3 mit Rest: n = 3k + r mit r = 0, 1 oder 2. Ist r = 0, so ist n durch 3 teilbar. Andernfalls ist n = 3k + 1 oder n = 3(k + 1) − 1. Setze m := k im ersten und m = k + 1 im zweiten Fall. b) Ist p = 3, so ist 2 · 32 + 1 = 19 eine Primzahl. Ist p 6= 3, so ist p auch nicht durch 3 teilbar. Deshalb lässt sich p wegen a) in der Form p = 3m ± 1 schreiben. Dann ist p2 = 9m2 ± 6m + 1, also 2p2 + 1 = 18m2 ± 12m + 3, also durch 3 teilbar. p = 3 ist somit die einzige Primzahl, für die auch 2p2 + 1 eine Primzahl ist. Der Fall p2 + 2 erledigt sich genau so. 1.2.A2. Es ist 15! = 2·3·(2·2)·5·(2·3)·7·(2·2·2)·(3·3)·(2·5)·11·(2·2·3)·13·(2·7)·(3·5) (Wenn Du willst kannst Du anschließend noch die gleichen Faktoren zu Potenzen zusammenfassen.) Du siehst, es ist ziemlich einfach. Wenn Du es Dir schwer machen willst, rechne zuerst 15! aus und versuche dann, das Ergebnis zu zerlegen. ;-) 1.2.A4. Sei m ∈ N1 keine Primzahl und p der kleinste Primfaktor von m. Dann lässt sich m in der Form m = kp mit k ≥ p schreiben. Wäre nämlich k < p, so hätte k und damit m eine kleineren Primfaktor als p, im Widerspruch zur Wahl von p. Wenn aber p ≤ k ist, ist p2 ≤ pk = m. Nun sind 2, 3, 5, 7 die einzigen Primzahlen p mit p < 11, d.h. p2 < 121. Ist also m ≤ 120 nicht prim, so hat es einen Primfaktor unter den Primzahlen 2, 3, 5, 7 Ist m ≥ 8 und hat unter diesen Zahlen einen Primfaktor, so kann es nicht selbst prim sein. Allgemein gilt: Sind p1 , . . . , pn+1 die ersten n+1 Primzahlen, so ist eine Zahl k mit pn < k < p2n+1 genau dann prim, wenn k durch keine der Primzahlen p1 , . . . , pn teilbar ist. 1.2.A5. Zur Regel a): Nimm an, dass nur 3 Kandidaten A, B und C Stimmen bekommen. Wenn 33 Senatoren A und B, 34 Senatoren A und C und schließlich 34 Senatoren B und C wählen, bekommt jeder der drei Kandidaten mindestens 67 Stimmen! Zur Regel b): Angenommen die Kandidaten A, B, C und D bekommen Stimmen. Wenn 26 Senatoren A und B , 25 weitere A und C , 25 weitere A und D, schließlich 25 Senatoren C und D wählen, so bekommen A 76, B 26, C 50 und D 50 Stimmen! (Wenn nur drei Kandidaten Stimmen bekommen, so entfallen auf einen maximal 101 der insgesamt 202 Stimmen, also auf mindestens einen weiteren mindestens 51 Stimmen.) 265 266 ANHANG A. LÖSUNGEN Man muss immer eine gewisse Vorsicht walten lassen, wenn man Abstimmungsregeln aufstellt! Ich kenne mindestens einen mathematischen Fachbereich, der diesen Ratschlag bei der Aufstellung seiner Satzung nicht beachtet hat. 0 1.4.2. Zur Gleichheit von Brüchen: Seien m0 = km, n0 = kn. Dann geht der Bruch m aus dem n0 m m m0 Bruch n durch Erweitern, und der Bruch n aus dem Bruch n0 durch Kürzen hervor. In diesem 0 Falle gilt mn0 = kmn = m0 n. D.h. wenn m aus m durch Erweitern und anschließendes Kürzen n0 n 0 0 hervorgeht, muss mn = m n sein. 0 Sei umgekehrt mn0 = m0 n. Dann wird m durch Erweitern zu mn . Der Zähler letzteren Bruches n nn0 0 m0 n . ist nach Voraussetzung gleich dem von nn0 . Und diesem Bruch wird durch Kürzen m n0 1.5.5. 1 1 n+1−n 1 − = = . n n+1 n(n + 1) n(n + 1) 1 1 1 1 1 1 1 1 1 1 + + ··· + = − + − + ··· + ( − =1− 1·2 2·3 (n − 1)n 1 2 2 3 n−1 n n 1 1 1 1 1 1 1 + + + · · · + ≤ 1 + + · · · + = 1 + 1 − . 12 22 32 n2 1·2 (n − 1)n n 1 1 1 1 1 1 1 1 + + + + ··· + ≤2+ + ··· + =3− 0! 1! 2! 3! n! 1·2 (n − 1)n n 1.5.A1. Die erste Gleichung hat die Lösung x = − 12 , die zweite ist nicht lösbar. 13 1.5.A3. Man kann a mit dem Nenner p1 · · · pn schreiben. Könnte man kürzen, etwa durch pn , so 1 1 wäre ap1 · · · pn−1 bereits ganz. Andererseits ist ap1 · · · pn−1 = + ··· + p1 · · · pn−1 + p1 pn−1 p1 · · · pn−1 ; das ist eine Summe zweier Summanden, von denen der erste eine ganze Zahl, der pn zweite aber wegen der Eindeutigkeit der Primfaktorzerlegung keine ganze Zahl ist. Eine solche Summe ist nie ganz. 1.5.A4. Diese Aufgabe löst man ähnlich wie die vorangehende. Wäre a ganz, dann auch am/2. · k1 ist für k = 2, . . . , n genau dann eine ganze Zahl, wenn k nicht die größte Der Ausdruck am 2 2-Potenz ≤ n ist. 1.5.A5. (n − 1)!a ist nicht ganz. 1.5.A6. Die Summe ist gleich (x + y)(x − y + 1)/2. 1.5.A7. Das Ergebnis ist n2 . Das kannst Du anschaulich an der Figur unterhalb der Aufgabe sehen, wo bei jedem Schritt durch Addition der nächsten ungeraden Anzahl von Kringeln wieder ein Quadrat entsteht. Die Lösung nach ‘Opas’ Schema geht wie folgt. Die Anzahl der Summanden ist n. Die Summe des ersten und n-ten Summande ist 2n. Dasselbe gilt für die Summe des zweiten und des (n − 1)-ten, auch für die des dritten und des (n − 2)-ten, usw. Deshalb ist das Ergebnis gleich n · 2n/2. 267 1.5.A8. Die Summe der beiden Gleichungen ist 2x = a + b, ihre Differenz ist 2y = a − b. Nun ist a + b genau dann gerade, wenn a und b entweder beide gerade oder beide ungerade sind. Dasselbe gilt für a − b. 1.5.A9. Sind x, y ganze Zahlen, so ist von den beiden Zahlen x + y und x − y + 1 die eine gerade und die andere ungerade. Und wenn zusätzlich x > y > 0 ist, sind x + y und x − y + 1 beide mindestens gleich 2. Ist also n > 0 eine Summe aufeinander folgender positiver ganzer Zahlen, so muss 2n ein Produkt einer geraden und einer ungeraden Zahl ≥ 2 sein. Das schließt alle 2-Potenzen aus. Sei n > 0 keine 2-Potenz (insbesondere n > 2) so ist 2n = 2r u mit einer ungeraden Zahl u > 2 und r ≥ 1. Seien ferner a die größere der beiden Zahlen 2r und u, sowie b + 1 die kleinere von diesen. Dann sind a und b beide gerade oder beide ungerade, und es ist b > 0. Also lässt sich das folgende Gleichungssystem in ganzen Zahlen x, y mit x > y > 0 lösen. x+y =a x−y =b Ist das Zahlenpaar (x, y) eine Lösung dieses Gleichungssystems, so gilt n = Px k=y k. 1.5.A10. a) Es gilt bekanntlich x2 − y 2 = (x + y)(x − y). Man kann also eine ganze Zahle n genau dann als Differenz zweier Quadratzahlen darstellen, wenn ein Produkt zweier gerader oder zweier ungerader Zahlen ist. Dabei darf im zweiten Fall einer der Faktoren die 1 sein. Es folgt, dass jede ungerade Zahl eine Differenz zweier Quadratzahlen ist. Eine gerade Zahl, die nicht durch 4 teilbar ist, ist von der Form 2u mit ungeradem u. Wie immer man sie in zwei Faktoren zerlegen mag, so ist einer gerade und der andere ungerade. Jede durch 4 teilbare Zahl ist von der Form 4m = 2 · (2m) also ein Produkt zweier gerader Zahlen und deshalb eine Differenz zweier Quadratzahlen. Zusammengefasst, sind genau die Ganzen Zahlen eine Differenz zweier Quadrate, die entweder ungerade oder durch 4 teilbar sind. (Später wirst Du diese Bedingung durch n 6≡ 2 (mod 4) ausdrücken können.) b) Alle ganzen Zahlen lassen sich so schreiben. Ist n ungerade, so gibt es y, z mit n = 02 +y 2 −z 2 . Ist n gerade, so ist n − 1 ungerade, also n = 12 + y 2 − z 2 mit geeigneten y, z. Die Lösung ist überraschend einfach. c) Ist a = 0, so gibt es trivialer Weise unendlich viele Lösungen, ansonsten nur endlich viele. Dafür habe ich sogar 2 Argumente: Erstens kann man a innerhalb Z nur auf endlich viele Weisen in zwei Faktoren zerlegen. Zweitens: Für x > y > 0 (was man immer annehmen kann) und x > n gilt x2 − y 2 ≥ (n + 1)2 − n2 = 2n + 1. Und es gibt nur endlich viele n mit 2n + 1 ≤ |a|. d) Nikolausaufgabe: Setze n0 := 1606160. Sei x das Alter von Klaus, y dasjenige von Nicole, jeweils als ganze Zahl > 0. Nach Voraussetzung ist n0 = x4 − y 4 = (x2 − y 2 )(x2 + y 2 ). Da n0 gerade ist, müssen x2 + y 2 und x2 − y 2 beide gerade sein. (Das folgt daraus, dass zunächst einer der beiden Faktoren gerade ist.) Dann muss aber auch x2 − y 2 = (x + y)(x − y) durch 4 teilbar sein, nicht wahr? Ferner ist 0 < y < x. Wir haben die (mit Taschenrechnerhilfe berechnete) Primfaktorzerlegung n0 = 24 · 5 · 17 · 1181 268 ANHANG A. LÖSUNGEN Wir betrachten alle Möglichkeiten x2 − y 2 = k, x2 + y 2 = l, wo n0 = kl eine Zerlegung in zwei ganze Faktoren, ferner 0 < k < l und k durch 4 und l durch 2 teilbar ist. 1. Der Faktor k ist größtmöglich im Falle k = 8 · 5 · 17 = 2 · 340, l = 2 · 1181. Dann errechnet man k+l k−l x2 = = 1181 + 340 = 1521, y 2 = = 1181 − 340 = 841 2 2 Nun ist 1521 = 1600 − 80 + 1 = (40 − 1)2 und 841 = 900 − 60 + 1 = (30 − 1)2 . Also gilt in diesem Falle: Klaus ist 39 und Nicole 29 Jahre alt. Wir zeigen, dass es keine weiteren Lösungen gibt. 2. Im Falle k = 4 · 5 · 17 = 2 · 170 und l = 4 · 1181 = 2 · 2362 müsste x2 = 2362 + 170 = 2532 sein. Da 502 = 2500 < 2532 < 2601 = 512 gilt, ist aber x2 6= 2532 für jede natürliche Zahl x. 3. In allen anderen Fällen ist k ≤ 23 · 17 und l ≥ 2 · 5 · 1181. Dann ist x + y ≤ k/2 ≤ 4 · 17 = 68 also x2 + y 2 ≤ (x + y)2 ≤ 682 = 4624 < 11810. Auch hier ergibt sich keine Lösung. 1.5.A11. Wenn man den linken Bruch mit n − k, den rechten mit k + 1 erweitert, bekommt man gleiche Nenner. 1.5.A12. Um die geforderte Vollständigkeit zu erreichen, genügt es, eine gewisse Systematik in die Menge aller Tripel (a, b, c) ∈ N3 mit 1 ≤ a ≤ b ≤ c zu bringen. Zunächst betrachte man Tripel der Form (1, 1, c) (mit 1 ≤ c). Dann die der Form (1, 2, c) (mit 2 ≤ c). Dann die der Form (1, b, c) mit 3 ≤ b ≤ c. Damit hat man offenbar alle Fälle mit a = 1 behandelt. Jetzt folgen die Fälle (2, 2, c), (2, 3, c) und (2, 4, c), ferner (2, b, c) mit 5 ≤ b ≤ c). Jetzt folgen (3, 3, c) und (3, b, c) mit 4 ≤ b. Schließlich (a, b, c) mit 4 ≤ a). Die möglichen Lösungen sind: (1, 1, 1) , (1, 2, 2) , (2, 3, 6) , (2, 4, 4) , (3, 3, 3). 1.5.A13. Nimm an, m/q mit zueinander teilerfremden m, q ∈ Z sei eine Lösung. Dann gilt mn−1 mn−2 m mn = −a − a − · · · − an − 1 − an 1 2 n n−1 n−2 q q q q mn q ganz ist. Wäre nun m/q nicht ganz, d.h. q 6= ±1, so hätte es einen Primfaktor p, der auch mn teilen würde. Wegen der Eindeutigkeit der Primfaktorzerlegung müsste p auch m teilen, im Widerspruch zur Teilerfremdheit von m und q. Da m, q und alle ai ganz sind, sieht man nach Multiplikation der Gleichung mit q n−1 , dass 1.5.A13 Die Antwort ist (m1 + 1)(m2 + 1) · · · (mr + 1). 1.6.A1. Man kann die Induktionsbeweise mit n = 0 beginnen. Dann stehen auf den rechten Seiten leere Summen. Eine solche hat nach Definition den Wert 0. Das mag Dir sehr formal vorkommen. 269 Wenn Du Hemmungen hast, damit zu argumentieren, schreibe die linken Seiten der ersten Gleichung wie folgt: 02 + 12 + 22 + · · · + n2 , entsprechend die der zweiten Gleichung. Oder beginne gemäß Absatz 1.6.3 die Induktion mit n = 1. In allen Fällen ist der Induktionsanfang für die behaupteten Gleichheiten trivial. Induktionsschritt für a): Zu zeigen ist 12 + 22 + · · · + n2 + (n + 1)2 = (n+1)(n+2)(2n+3) unter der 6 n(n+1)(2n+1) 2 2 2 Voraussetzung 1 + 2 + · · · + n = . Unter dieser Voaussetzung gilt aber 6 12 + 22 + · · · + n2 + (n + 1)2 = = n(n + 1)(2n + 1) n(n + 1)(2n + 1) + 6(n + 1)2 + (n + 1)2 = 6 6 (n(2n + 1) + 6(n + 1))(n + 1) (n + 1)(2n2 + n + 6n + 6) = = 6 6 (n + 1)(n + 2)(2n + 3) (n + 1)(2n2 + 3n + 4n + 6) = 6 6 1.6.A2. Dies gilt zunächst für n = 1 Induktionsschritt: Sei (a1 , . . . , an ) irgend eine Anordnung der Zahlen 1, . . . , n. Dann kann man die Zahl n + 1 auf n + 1 verschiedene Weise einordnen: (n + 1, a1 , . . . , an ), (a1 , n + 1, a2 , . . . , an ), . . . , (a1 , . . . , an−1 , n + 1, an ), (a1 , . . . , an , n + 1) Man erhält also (n + 1)-mal soviele Anordnungen der Zahlen 1, . . . , n, n + 1, wie es Anordungen der Zahlen 1, . . . , n gibt. Ist die letztere Anzahl nach Induktionsvoraussetzung gleich n!, so ist erstere gleich n!(n + 1) = (n + 1)!. 1.6.A4. Wenn Du bislang nicht auf die Lösung gekommen bist, versuche es mit dem Tipp: 53 = 125 = 11 · 11 + 4. Induktionsanfang n = 0. Es ist 2 · 51 + 40 = 11, also durch 11 teilbar. Induktionsschritt: Zu zeigen ist, dass 2·53n+4 +4n+1 durch 11 teilbar ist – vorausgesetzt, dies gilt für 2·53n+1 +4n . Nun es ist 2·53n+4 +4n+1 = 125·2·53n+1 +4·4n = 121·2·53n+1 +4(2·53n+1 +4n ). Der erste Summand in diesem Ausdruck ist durch 11 teilbar, weil 121 es ist. Für den zweiten Summand gilt dies, weil der Klammerausdruck nach Induktionsvoraussetzung durch 11 teilbar ist. 1.6.A5. Wir machen den Induktionsanfang bei k = 1: Sei u = 2m + 1. Dann ist u2 − 1 = 4m2 + 4m + 1 − 1 = 4m(m + 1), also durch 23 teilbar, da eine der Zahlen m, m + 1 gerade ist. Induktionsschluss: Sei die Aussage richtig für ein k ≥ 1. Wir haben zu zeigen, dass sie dann auch für k + 1 gilt. Nun es gilt u2 k+1 k 2 k k − 1 = u2 − 1 = (u2 + 1)(u2 − 1) . 270 ANHANG A. LÖSUNGEN Da u ungerade ist, ist der erste Faktor gerade. Der zweite ist nach Induktionsvoraussetzung durch 2k+2 teilbar, und somit das Produkt durch 2k+3 teilbar. 1.7.A1. Es gilt ggT(70, 125) = 5. Deshalb ist 5 die kleinste positive Zahl, die sich in der Form 70m + 125n mit ganzen m, n darstellen lässt. Alle anderen sind Vielfache von 5. 1.7.A3. Die Gleichung ist äquivalent mit xa = −yb. Da a und b zueinander teilerfremd sind, haben sie Primfaktorzerlegungen ohne gemeinsamen Faktor. Deshalb muss x durch b und y durch a teilbar sein. Die möglichen Lösungen sind somit von der Form (x, y) = (kb, k 0 a). Damit die Gleichung erfüllt ist, muss noch k 0 = −k sein. Die Gesamtheit der Lösungen besteht also aus den Zahlenpaaren (kb, −ka), wo k alle ganzen Zahlen durchläuft. 1.7.A5. a) Sei a0 ∈ N minimal gewählt, so dass c = aa0 + bb0 mit einem b0 ∈ Z ist. Dann gilt a0 ≤ b − 1. Aus b0 < 0 würde aa0 + bb0 < (a − 1)(b − 1) folgen. b) Es ist d = a(b − 1) + b(−1). Jede Änderung, die den Faktor von b zu einer nichtnegativen Zahl macht, erhöht ihn um ein positives Vielfaches von a, muss also den Faktor von a um ein positives Vielfaches von b vermindern, also negativ machen. 1.7.A11 b) Die angegebene Gleichung ist äquivalent zu 1 = mb + na. Dies siehst Du sofort, wenn Du weißt, wie man Brüche addiert! 2.3.A3. Zeige zunächst, dass die Summe je zweier verschiedener Matrizen der Form Ak gleich der dritten Matrix dieser Form ist. Dass sind 3 nahezu triviale Rechnungen. Ferner gilt natürlich Ak + Ak = 0 und Ak + 0 = Ak . Also ist K gegenüber der Addition und auch gegenüber der Bildung additiv Inverser abgeschlossen. In Bezug auf die Multiplikation beachte, dass K ∗ , die Menge der von 0 verschiedenen Matrizen ∈ K aus den Potenzen von A besteht. Es ist nur A4 = A usw. Es gilt Ak · Am = Ak+m , ferner Ak · 0 = 0. Also ist K gegenüber Multiplikation und bis auf die 0 auch der Bildung multiplikativ Inverser abgeschlossen. Mit 0 und E gehören die neutralen Elemente auch zu K. Also ist K ein Schiefkörper. Die Multiplikation ist kommutativ, da Ak · Am = Ak+m = Am+k = Am · Ak gilt. Alles in allem ist somit K ein Körper. Beachte, dass die grundlegenden Ringgesetze (Assoziativität der Addition und Multiplikation, die Kommutativität der Addition, die Distributivgesetze) deshalb gelten, da sie bereits in dem Ring M2 (F2 ) erfüllt sind. 2.3.A4. a) Jede der Zahlen 1, . . . , n kommt wegen (i) genau n-mal, also ungerade oft in der Matrix vor. Wegen (ii) kommt sie außerhalb der Diagonalen gerade oft vor, muss also auch mindestens einmal in der Diagonalen vorkommen. Da in der Diagonalen insgesamt n Zahlen und dabei jede der n Zahlen 1, . . . , n mindestens einmal steht, kann auch keine von ihnen mehr als einmal dort auftauchen. b) Analog zu a) sieht man, dass jede der Zahlen 1, . . . , n in der ganzen Matrix gerade oft und auch außerhalb der Diagonale gerade oft auftaucht. Also muss sie auch in der Diagonale gerade oft auftauchen. Das geht aber nur wenn einige der Zahlen gar nicht, andere mindestens 2-mal dort vorkommen. 271 2.4.A2. a) Die Quadrate der Restklassen 0, 4 sind gleich 0, die der Restklassen 2, 6 sind gleich 4 und die der Restklassen 1, 3, 5, 7 sind gleich 1 Insgesamt sind 0, 1, 4 alle Quadrate in Z/(8). Beachte, dass das Element 1 in Z/(8) vier verschiedene ’Quadratwurzeln’ hat. Es gibt also 4 Nullstellen des Polynoms x2 − 1 in diesem Ring. Die Regel, dass ein Polynom n-ten Grades höchstens n Nullstellen hat gilt nicht für Polynome mit Koeffizienten in einem beliebigen Ring R. Sie gilt allerdings falls R nullteilerfrei und kommutativ, also z.B. ein Körper ist. b) Da 1000 durch 8 teilbar ist, sind die Zahlen der Form ...011 zu 3, die der Form ...101 zu 5, die der Form ...110 zu 6 modulo 8 kongruent. Die Restklasse des Quadrates einer natürlichen Zahl (nach einem Modul m) muss aber natürlich ein Quadrat in Z/(m) sein. 2.4.A3. Zerlege Z in die n Restklassen modulo n. In mindestens einer dieser Restklassen müssen mindestens 2 Zahlen der Menge M liegen. D.h. es gibt 2 Zahlen aus M , die konguent modulo n sind, deren Differenz also durch n teilbar ist. 2.4.A4. Behauptung: Eine solche Fahne gibt es nicht. Begründung: Die Anzahl der Sterne ist m21 + m22 − k 2 . Die von 0 verschiedenen Quadrate in Z/(5) sind die Restklassen von 1 und −1. Um die Behauptung zu beweisen, genügt es deshalb folgendes zu zeigen. In dem Ring Z/(5) ist eine Summe von drei Summanden der Form ±1 nie 0. Nun, seien k1 , k2 , k3 ∈ {1, −1}. Sind alle ki untereinander gleich, so ist ihre Summe gleich ±3. Ist eine dieser Zahlen von den andern verschieden, so ist ihre Summe gleich ±1. Ihre Summe ist nie durch 5 teilbar. 2.4.A5. a) Es gilt 10 ≡ 1 (mod 3) und 10 ≡ 1 (mod 9) , ferner 10 ≡ −1 (mod 11). Die Behauptungen folgen daraus unmittelbar. c) Die Zahl n und ihre Spiegelzahl haben die gleiche Quersumme und die gleiche alternierende Summe. Also sind sie kongruent sowohl modulo 9, als auch modulo 11. Ihre Differenz ist also sowohl durch 9 wie durch 11 und somit durch 99 teilbar. d) Schreibt man n mit gerade vielen Ziffern, so ist ihre Spiegelzahl meist nicht kongruent zu n modulo 11, hat allerdings dieselbe Quersumme. Deshalb ist die angegebene Differenz zwar meist nicht durch 11, aber noch durch 9 teilbar. Beispiel 63 − 36 = 27. e) Sei n die gewählte Zahl, q ihre Quersumme. Da q ≤ 45 und n ≥ 10050 ist n − q auch 5-Stellig. Ferner ist n − q durch 9 teilbar, da n ≡ q(mod 9) gilt. Die Restklasse modulo 9 der ersten Ziffervon n − q ist durch die Summe der weiteren 4 Ziffern also eindeutig bestimmt. Da sie nicht 0 ist, ist die erste Ziffer als solche eindeutig bestimmt. Beispiel: n = 12345. Die Quersumme ist 15. Die Differenz somit n = 12330. Die Summe der letzten 4 Ziffern ist 8. Damit die Quersumme von n durch 9 teilbar ist, muss die erste Ziffer 1 sein. 2.4.A6. Zur letzten Frage: Natürlich ist dies möglich, z.B., wenn man zwei Ziffern irrtümlich vertauscht. Statt der Neunerprobe kann man natürlich auch die analoge Elferprobe verwenden, wo eine Vertauschung zweier Nachbarziffern aufgedeckt wird. 2.4.A7. a) Teilbarkeit durch 2. Ist d gerade, so ist die gegebene Zahl genau dann durch 2 teilbar (d.h. gerade), wenn die letzte Ziffer es ist. Ist d ungerade, so ist die gegebene Zahl genau dann durch 2 teilbar, wenn die Quersumme es ist. 272 ANHANG A. LÖSUNGEN b) Teilbarkeit durch 3. Ist d durch 3 teilbar, so ist die gegebene Zahl genau dann durch 3 teilbar, wenn die letzte Ziffer es ist. Ist d ≡ 1 (mod 3), so ist die gegebene Zahl genau dann durch 3 teilbar, wenn ihre Quersumme es ist. Ist d ≡ −1 (mod 3), so ist die gegebene Zahl genau dann durch 3 teilbar, wenn ihre alternierende Quersumme es ist. 2.4.A8. Man stellt leicht fest, dass für jede ganze Zahl n die Kongruenz n5 ≡ n (mod 10) gilt. Modulo 10 ist also das Ergebnis schlicht zur Summe aller ganzen Zahlen von 1 bis 101 kongruent. Diese Summe ist 101 · 102/2 = 5151. Die gesuchte letzte Ziffer ist also die 1. 2.4.A.10.b Zerlege die absteigende Folge der ganzen Zahlen mn, mn−1, . . . , 1 in m absteigende Folgen von je n ganzen Zahlen: mn, mn − 1, . . . , mn − n + 1 || (m − 1)n, . . . , (m − 1)n − n + 1 || (m − 2)n, . . . , (m − 2)n − n + 1 || . . . | 1 · n, . . . , 1 · n − n + 1 . Für k = 0, . . . , m − 1 ist dann das Produkt der n Faktoren ((m − k)n) · · · ((m − k)(n − n + 1)) durch (m − k)n! teilbar. Für das Produkt aller mn Zahlen mn, . . . , 1 bekommt man so die behauptete Teilbarkeit. 2.4.A11. Ist m ungerade, so ist offenbar ( m+1 mod m) zu (2 mod m) invers. 2 Nach Voraussetzung ist m 6≡ 0 (mod 3). Also ist m modulo 3 zu −1 oder zu 1 kongruent Im mod m), im zweiten ist (− m−1 mod m) zu (3 mod m) invers. ersten Fall ist ( m+1 3 3 2.4.A12. b) Geburts- und Todesjahr von Carl Friedrich Gauss. 2.4.A13. Da die Restklassen von 9 und von 2 in Z/(17) invertierbar sind, sind die Kongruenzen (1) 3x + 2y ≡ 0 (mod 17) und (10 ) 9(3x + 2y) ≡ 0 (mod 17) zueinander äquivalent. Dasselbe gilt für die Kongruenzen (2) 5x + 9y ≡ 0 (mod 17) und (20 ) 2(5x + 9y) ≡ 0 (mod 17) Nun ist 9(3x+2y) = 27x+18y und 2(5x+9y) = 10x+18y. Da 27 ≡ 10 (mod 17), sind die Kongruenzen (10 ) und (20 ) zueinander äquivalent und deshalb schließlich auch die Kongruenzen (1) und (2). 2.4.A14. (−5)3 = −125, (−5)4 = 625, (−5)5 = −3125 ≡ −125 (mod 1000). Du erkennst, dass ab dem Exponenten 3 die Potenzen von −5 modulo 1000 sich mit der Periode 2 wiederholen. Sei n ≥ 3. Dann gilt für ungerade n die Kongruenz (−5)n ≡ −125 ≡ 875 (mod 1000). Da 1995! gerade, also 1995! + 1 ungerade ist, hat die erstgenannte Potenz die letzten drei Ziffern 875. 2.4.A16. Die Eigenschaft kann man auch so schreiben: 7 · 13 ≡ 1 (mod p). Und das bedeutet, dass p ein Teiler von 7 · 13 − 1 = 90 ist. Die gesuchten Primzahlen sind also genau die Primfaktoren von 90, d.h. 2, 3 und 5. 2.4.A17. a) Wir bezeichnen die Elemente von Z/3 mit −1, 0, 1. (M. a. W. wir schreiben −1 für (−1 mod 3) usw.) Dann ist: 1 1 −1 1 0 −1 0 2 3 A = E, A = , A = A = 1 0 1 1 −1 1 4 A = −1 −1 1 −1 6 , A = , A = , −1 0 −1 −1 1 1 7 A = , A8 = E = A 0 . 1 0 −1 0 0 −1 5 273 b) Die Abgeschlossenheit bezüglich der Multiplikation ist klar, da A0 , . . . , A7 die sämtlichen Potenzen mit ganzzahligem Exponenten von A sind. Auch jedes (multiplikativ) Inverse gehört dazu. Um die Abgeschlossenheit bezüglich der Addition zu zeigen, berechne zunächst A0 − E, A1 − E, . . . , A7 − E, 0 − E, und stelle fest, dass Du die Matrizen A0 , . . . , A7 , 0 in anderer Reihenfolge erhältst. Wenn Du diese Differenzen also mit einer der Matrizen A1 , . . . , A7 multiplizierst, erhältst Du wieder alle diese Matrizen. Insgesamt gehören sämtliche Differenzen zweier der angegebenen Elemente wieder zu den Matrizen A0 , . . . , A7 , 0. Dann gehören auch alle additiv Inversen und mit ihnen auch alle Summen dazu. (X + Y = X − (−Y ).) 2.5.A.1. Es genügt, den Fall n = 1 zu betrachten, also pm+1 |xp − y p zu zeigen. Schreibe xp − y p = (x − y)(xp−1 + xp−2 y + · · · + y p−1 ). Modulo pm besteht der zweite Faktor aus p zueinander kongruenten Summanden, ist also, da m ≥ 1, durch p teilbar. 2.5.A2. Binomialsatz! 2.5.A3. a) Wenn a ungerade ist und a, n ≥ 2 gilt, so ist an + 1 > 2 und gerade, also keine Primzahl. Ist n keine Zweierpotenz, so gibt es eine ungerade Zahl u > 2 mit n = 2m · u, also m an + 1 = bu + 1 = 1 − (−b)u , wobei b = a2 ist. Wegen 1 − (−b)u = (1 − (−b))(1 + (−b) + (−b)2 + · · · + (−b)u−1 ) (geometrische Reihe) ist 1 + bu durch 1 + b teilbar, also nicht prim. (Beachte b, u > 1, also 1 + bu > 1 + b.) b) Nach der Formel der geometrischen Reihe ist an − 1 durch a − 1 teilbar. Wenn a > 2 ist, ist dieser Teiler größer als 1, zudem wegen n ≥ 2 kleiner als an − 1. Wenn nun zwar a = 2, aber n nicht prim ist, gibt es k, m > 1 mit n = km. Dann ist an − 1 = bm − 1, wo b = 2k > 2 ist. c) In a) und b) haben wir nur gezeigt: Wenn an ± 1 prim ist, dann gilt . . . .“ Die angegebenen ” Beispiele besagen nur, dass die Umkehrungen von a) und b) nicht richtig sind! 2.5.A4. a) Denke Dir c in Primfaktoren zerlegt. Jeden solchen kann man gegen einen Primfaktor von a oder b kürzen, da ja c ein Teiler von ab ist. Am Ende ist der Nenner 1, aber sowohl von a, als auch von b bleibt wegen c < a, c < b ein Teiler > 1 übrig, so dass ab/c ein nichttriviales Produkt ist. P k b) Eine n-stellige Zahl aus lauter 1-en schreibt sich als geometrische Reihe wie folgt: n−1 k=0 10 = n (10 − 1)/(10 − 1). Ist n = rs, so gilt rs r r 10 − 1 = (10 )s − 1 = (10 − 1) s−1 X 10rk k=0 Sind r, s > 1, so sind beide Faktoren größer als 9. Wende a) an. c) Eine solche Zahl ist von folgender Form: n X 100k = k=0 Wende (für n > 1) Teil a) an. (10n+1 − 1)(10n+1 + 1) 100n+1 − 1 = 100 − 1 99 274 ANHANG A. LÖSUNGEN n 2.5.A5. Bekanntlich ist an −bn durch a−b teilbar: Wenn n ungerade ist gilt aP +bn = an −(−b)n . 4 37−k (−1)k . Nun ist 148 = 4 · 37 und deshalb 2148 + 1 = 24·37 − (−1)37 = (24 − (−1)) · 37 k=0 (2 ) 4 Also ist 2 + 1 = 17 ein Primfaktor. 2.5 A13. Ziehe aus der Ungleichung (m + 1)m < mm+1 die m(m + 1)-te Wurzel. So bekommst Du – da die Wurzel im positiven Bereich streng monoton wachsend ist – die Ungleichung √ √ m+1 m + 1 < m m für m ≥ 3. Daraus folgt (wenn Du willst, mit Induktion) √ √ m+k m + k < m m für m ≥ 3 und k ≥ 1. 2.5.A14. Beachte zunächst: Für beliebige b, d ∈ N ist bd − 1 durch b − 1 auf Grund der Formel für die geometrische Reihe teilbar. Dann rechne: am − 1 = aqn+r − 1 = ar (aqn − 1) + (ar − 1) = q 0 (an − 1) + (ar − 1), (mit einem geeigneten ganzen q 0 , da nach obigem aqn − 1 durch an − 1) teilbar ist. Da Du somit parallel zum euklidischen Algorithmus für m, n (mit positiven Resten) den für am − 1, an − 1 durchführen kannst, folgt b) . 3.1 Zusatzbemerkung zu Beispiel 7. Jede reelle Zahl ist der Wert einer Reihe, die aus der alternierenden harmonischen Reihe durch Umordnung hervorgeht. Beweis: Die Reihe R der positiven Summanden hat den Wert ∞. Denn es gilt für ihre m-te Partialsumme m−1 1 1 1 1X1 + + ··· + > 2·0+1 2·1+1 2m + 1 2 k=1 k Rechts steht die mit 21 multiplizierte (m − 1)-te Partialsumme der harmonischen Reihe, die mit m gegen ∞ geht. Ebenso leicht siehst Du, dass die Summe der negativen Summanden gegen −∞ geht. Sei α ∈ R beliebig. Nimm ihrer Reihenfolge nach soviele positive Summanden wie gerade nötig sind, damit ihre Summe S0 größer als α ist. Setze die gesuchte Reihe fort, indem Du ihrer Reihenfolge nach soviele negative Summanden nimmst, dass für ihre Summe S1 so gerade die Ungleichung S0 + S1 < α gilt. Jetzt nimm wieder ihrer Reihenfolge nach so viele positive Summanden, dass für ihre Summe S2 die Ungleichung S0 + S1 + S2 > α gilt. Usw. 4.1.A.1. a) Es ist #(A ∪ B) = a + b − d = #A + #B − #(A ∩ B). Denn wenn man die Elemente von A zählt, zählt man genau d Elemente von B bereits mit. b) Betrachte A1 ∪ A2 ∪ A3 als Vereinigung der beiden Mengen A3 und A1 ∪ A2 . Nach Teil a) gilt #(A1 ∪ A2 ) ∪ A3 ) = #(A1 ∪ A2 ) + a3 − #((A1 ∪ A2 ) ∩ A3 ). Nun ist (A1 ∪ A2 ) ∩ A3 ) = (A1 ∩ A3 ) ∪ (A2 ∩ A3 ). Jetzt wende auf die beiden Summenden in der rechten Seite der letzten Gleichung beides Mal a) an: Du erhältst #(A1 ∪ A2 ) = a1 + a2 − a12 , sowie #(A1 ∩ A3 ) ∪ (A2 ∩ A3 ) = a13 + a23 − a123 und damit die Behauptung. 275 c) Wir gehen analog zur Lösung von b) vor und benutzen Induktion nach n, wobei der Fall n = 1 trivial ist. (Du kannst auch mit dem unter a) behandelten Fall n = 2 beginnen.) Für den Induktionsschritt (n → n + 1) wende a) auf die Vereinigung der beiden Mengen A1 ∪ . . . ∪ An und An+1 an. Demgemäß ist (∗) #(A1 ∪ . . . ∪ An+1 ) = #(A1 ∪ . . . ∪ An ) + an+1 − #((A1 ∪ . . . ∪ An ) ∩ An+1 ) Es gilt (A1 ∪ . . . ∪ An ) ∩ An+1 = (A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An+1 ). Nun wende die Induktionsvoraussetzung auf den ersten S und dritten Summanden obiger Gleichheit d.h. auf die beiden Sn n Vereinigungen von je n Mengen i=1 Ai und i=1 (Ai ∩ An+1 ) an. Du erhältst #(A1 ∪ . . . ∪ An ) = X (−1)#J+1 aJ , sowie ∅6=J⊂{1,...,n} −#((A1 ∩ An+1 ) ∪ . . . ∪ (An ∩ An )) = X (−1)#J · #(AJ ∩ An+1 ). ∅6=J⊂{1,...,n} Beachte dass jede nichtleere Teilmenge I ⊂ {1, . . . , n + 1} entweder bereits eine nichtleere Teilmenge von {1, . . . , n} oder eine Menge der Form J ∪ {n + 1}mit J ⊂ {1, . . . , n} ist, wobei in letzterem Fall auch J = ∅ zugelassen ist. Der erste Summand auf der rechten Seite von (∗) behandelt die Teilmengen von {1, . . . , n}, der zweite Summand, nämlich an+1 , die Menge ∅ ∪ {n + 1} = {n + 1}, der dritte Summand schließlich die Mengen J ∪ {n + 1} mit ∅ = 6 J ⊂ {1, . . . , n}, und zwar auch mit dem richtigen Vorzeichen, nicht wahr? 4.1.A2. a) A = 2N := {2k | k ∈ N}, B := N − A. Da hier X = Y = ∅ gilt, sind X, Y beide endlich. b) A := 2N, B := 3N := {3k | k ∈ N}. Es gibt ja unendlich viele Vielfache von 6. Und diese sind (genau) die Vielfachen von sowohl 2 wie 3. Andererseits gibt es unendlich viele ganze Zahlen, die weder durch 2 noch durch 3 teilbar sind, z.B. alle Potenzen von 5. c) A := {2n |n ∈ N}, B := {3n | n ∈ N}. X = A ∩ B := {1}, Y ⊃ {5n | n ∈ N1 } d) A = B := N. Natürlich gibt es auch weniger triviale Beispiele. 4.1.A3 Bezeichne die Elemente von F2 mit 0, 1. Erinnere Dich, dass in F2 folgendes gilt: 0 + 0 = 1 + 1 = 0, 0 + 1 = 1 + 0 = 1, − 1 = 1. Eine Summe von gerade vielen 1-en ist 0. Das n-tupel (1, . . . , 1) sei mit e bezeichnet. Jedem v ∈ V ordne das n-tupel e + v = e − v zu. Die Komponenten von e + v sind genau an den Stellen gleich 1, wo die von v gleich 0 sind. Es gilt v + (e + v) = e und v 6= e + v. Man kann die Menge V in 2-elementige Teilmengen der Form {v, e + v} zerlegen. Von diesen gibt es #(V )/2 = 2n−1 Stück. Da v + (e + v) = e ist, ist die Summe über alle Elemente von V gleich der Summe von 2n−1 Summanden, die alle gleich e sind. Da für n ≥ 2 die Zahl 2n−1 gerade ist, ist diese Summe gleich (0, . . . , 0). 4.2.A1 a) Wäre f nicht injektiv, so gäbe es verschiedene x, x0 ∈ M mit f (x) = f (x0 ). Dann ist auch g(f (x)) = g(f (x0 )). 276 ANHANG A. LÖSUNGEN b) Sei z ∈ P . Da g ◦f surjektiv ist, gibt es ein x ∈ M mit g(f (x)) = g ◦f (x) = z. Für y = f (x) gilt dann g(y) = z. c) 1. M = P := {0}, N := {0, 1}, f (0) = 0, g(0) = g(1) = 0. 2. M = N = P := N. f (n) := n + 1, g(0) := 0, g(n) := n − 1 für n ≥ 1. 4.2.A2 a) Sei y ∈ N . Da f surjektiv ist, gibt es mindestens ein x ∈ M mit f (x) = y. Setze g(y) := x für ein solches ausgewähltes x. Da für ein solches x ja gilt, dass f (x) = y ist, ist f ◦g(y) = y für jedes y ∈ N . Weil idM injektiv ist, muss nach Aufgabe 1. auch f es sein, wenn g ◦f = idM gilt. b) Sei x0 ∈ M fest gewählt. Sei y ∈ N . Liegt y nicht im Bild von f , d.h. y ∈ / im(f ), setze g(y) := x0 . Ist aber y ∈ im(f ), so gibt es ein (aber auch nur ein) x ∈ M mit f (x) = y. Dann setze g(y) = x. Ist f ◦g = idN , so ist f surjektiv. 4.2.A3 a) Antwort: nm . Die Menge der Abbildungen von M nach N wird deshalb manchmal auch mit N M bezeichnet. (Beachte: Der Exponent ist die Startmenge, die Basis die Zielmenge. b) Ist m > n, so gibt es keine solche Abbildungen. Ansonsten nimm M = {1, 2, . . . , m} an. Um eine beliebige injektive Abbildung zu beschreiben, hat man als Bild der 1 noch n Möglichkeiten, als Bild der 2 noch n − 1 solche, usw. usw., als Bild der m nur noch n − m + 1 solche. Insgesamt gibt es n · (n − 1) · · · (n − m + 1) = n!/(n − m)! injektive Abbildungen, wobei die rechte Seite dieser Identität im Fall m > n nicht definiert ist, da k! für negative ganze Zahlen nicht sinnvoll definiert werden kann. Die linke Seite gibt allerdings auch in diesem Fall die richtige Antwort, da dann einer der Faktoren gleich 0 ist. c) Bijektive Abbildungen M → N gibt es genau dann, wenn m = n ist. Gemäß b) gibt es n! solche. Vielleicht hast du früher schon gezeigt, dass man eine n-elementige Menge auf n! verschiedene Weise anordnen kann. Dann kannst Du die Antwort auch folgendermaßen begründen: Jede bijektive Abbildung f : {1, 2, . . . , n} → N liefert eine Anordnung vom M , nämlich (f (1), f (2), . . . , f (n)). Umgekehrt liefert eine solche Anordnung eine bijektive Abbildung. d) Eine Abbildung M → N ist genau dann surjektiv, wenn ihr Bild in keiner der Teilmengen Nx := N − {x} mit einem x ∈ N liegt. Die Anzahl aller Abbildungen M → N ist nm . Ist Ax die Menge aller Abbildungen M [→ N , deren Bild inSNx liegt, so ist die Anzahl aller surjektiven m Abbildungen gleich n − # Ax . Die Zahl # x∈N Ax kannst Du mit dem Prinzip der x∈N \ Inklusion-Exklusion berechnen. Ist nämlich J ⊂ N und AJ := Ax , so ist AJ offenbar die x∈J \ Menge der Abbildungen M → N , deren Bild in NJ := Nx liegt. (Denn eine Abbildung, x∈J deren Bild in U1 ∩ . . . ∩ Uk liegt, ist eine solche, der Bild sowohl in U1 , als auch in U2 , als auch usw., als auch in Uk liegt. Die entsprechende Aussage für die Vereinigung gilt nicht: Das Bild einer Abbildung, deren Bild in U ∪ V liegt, liegt nicht immer ganz in U oder ganz in V .) 277 n Nun besteht NJ aus n − #J Elementen. Ferner gibt es für jedes k ≤ n genau Teilmengen k aus k Elementen von N . Die Anzahl der surjektiven Abildungen M → N ist also n−1 X n n n n m m m m k n (−1) (n − k)m n − (n − 1) + (n − 2) − (n − 3) + . . . ± 1 = 1 2 3 n−1 k k=0 m √ 4.4.A4 Ich gebe nur das multiplikativ Inverse von a + b 2 an, wenn a, b nicht beide 0 sind. √ √ a −b a−b 2 1 √ = 2 = + · 2 a − 2b2 a2 − 2b2 a2 − 2b2 a+b 2 Beachte, dass a2 − 2b2 für rationale a, b nur dann zu 0 werden kann, wenn a = b = 0 ist. 4.5.A1 a) Ordne einer solchen Folge die Folge der Abstände zwischen den Nullen zu. Der nullte Abstand soll dabei die Anzahl der 1en sein, mit denen die Folge beginnt. Die Menge A ist also gleichmächtig zur Menge aller Folgen natürlicher Zahlen (bei denen alle Folgenglieder nach der ersten ≥ 1 sind), also überabzählbar. b) Eine der betrachteten Folgen ist die konstante Folge (1, 1, 1, . . .), alle anderen brechen in dem Sinne ab, das ab einer Stelle nur noch Nullen stehen. Die Menge ist abzählbar. 4.5.A2 Sei a = (an )n∈N eine 0-1-Folge. Definiere hierzu eine Menge M = ϕ(a) durch: n ∈ M ⇐⇒ an = 1. 4.5.A3 Zu jeder endlichen Teilmenge E von N gibt es ein n ∈ N, derart dass E eine Teilmenge der Menge Mn := {0, . . . , n} ist. Jedes Mn hat aber nur endlich viele Teilmengen. Die Menge aller endlichen Teilmengen von N ist also die abzählbare Vereinigung der endlichen Mengen (Mn ), also abzählbar. (Auf diese Weise zählt man allerdings jede endliche Menge unendlich oft. Willst Du dies vermeiden, betrachte außer der leeren Menge von jeder Menge Mn nur diejenigen Teilmengen, die das Element n enthalten.) Es gibt noch eine weitere Möglichkeit: Für jedes n gibt es nur abzählbar viele Teilmengen der Kardinalzahl n. 4.5.A6. Ebenso, wie man jede reelle Zahl als (möglicherweise unendlichen) Dezimalbruch schreiben kann, so so kann man ihn auch als Binärbruch schreiben. Deshalb ist die angegebene Abbildung surjektiv. Sie ist aber nicht injektiv, da z.B. 0,1 = 0,01 ist. 5.3. Die Verbindungsstrecke der Punkte (0, 0) und (m, n) besteht aus den Punkten λ(m, n) mit λ ∈ [0, 1], wobei = 0 und λ = 1 die Endpunkte dieser Strecke ergeben. Für ein λ ∈ ]0, 1[ sind offenbar λm und λn genau dann beide aus Z, wenn λ rational ist und sich in der Form kd schreiben lässt, wo d ∈ N ein gemeinsamer Teiler von m und n und 0 < k < d gilt. Die Antwort ist also: Genau dann, wenn ggT(m, n) = 1 ist, gibt es außer den Endpunkten keinen Punkt mit ganzen Koeffizienten auf der Verbindungstrecke von (0, 0) nsch (m, n). Seien jetzt m, n teilerfremd zueinander, so gibt es ganze Zahlen a, b mit am+bn = 1. Wären nun λ ∈ ]0, 1[ und λm, λn ∈ Z, so wäre a(m) + b(λn) = λ einerseits ganz, andererseits nicht ganz. 278 ANHANG A. LÖSUNGEN Also gibt es in diesem Fall keinen Punkt mit ganzen Koordinaten auf der Verbindungsstrecke, außer den Endpunkten. 6.4. Der Satz des Pythagoras, angewendet auf drei Dreiecke besagt: (s + t)2 = a2 + b2 , a2 = t2 + h2 , b2 = s2 + h2 Folgere aus diesen Gleichungen s2 + 2st + t2 = t2 + h2 + s2 + h2 , also st = h2 . Rechne schließlich sc = s2 + st = s2 + h2 = b2 . 7.5.A1. a),b) sind bekannt oder trivial. c) f (x) = a2 x2 + a1 x + a0 , f 0 (x) = 2a2 x + a1 , f 00 (x) = 2a2 f ist konvex, wenn a2 > 0, bzw. konkav, wenn a2 < 0 ist. a1 a1 gilt. Für x > − ist Sei jetzt etwa a2 > 0. Dann ist f 0 (x) < 0, falls f 0 (x) < 0, d.h. x < − 2a2 2a2 a1 a1 f 0 (x) > 0. Also ist f im Intervall −∞, − streng monoton fallend, in − , ∞ streng 2a2 2a2 a1 monoton wachsend. Im Punkt x0 = − liegt ein Minimum vor. 2a2 d) f 0 (x) = 3a3 x2 + 2a2 x + a1 . 7.5.A2 a) Da der Nenner auf dem Intervall ] − 1, 1] keine Nullstelle hat, ist die Funktion dort definiert. Ferner sind Zähler und Nenner, also auch f (x) auf diesem Intervall überall ≥ 0. Es −2 ist f 0 (x) = (1+x) 2 < 0 für alle x ∈ ] − 1, 1]. Deshalb ist f (x) auf dem Intervall streng monoton fallend und somit injektiv. Schließlich ist f (1) = 0 und lim f (x) = ∞. Darum werden alle x&−1 Zahlen aus + als Wert angenommen. b) Analog. 7.5.A5. a) Da f (x) = (x2 − 1)x3 ist, lassen sich die Nullstellen leicht bestimmen. Dasselbe gilt für die Nullstellen der ersten und zweiten Ableitung. Die Diskussion des Funktionsgraphen ist also leicht. √ b) Die Nullstellen der Funktion liegen dort, wo x3 = 3 x. Da die 3-te Potenz streng monoton wächst und deshalb eine injektive Funktion ist, ist diese Gleichung äquivalent zu x9 = x. Die √ Nullstellen der Funktion x3 + 3 x sind also ±1 und 0. Die Ableitung 3x2 − 13 x−2/3 ist in 0 nicht definiert, sonst überall. Falls |x| klein genug, ist sie negativ und geht von beiden Seiten mit x gegen 0 gegen −∞. Der Funktionsgraph hat in 0 √ √ 4 4 die Gerade x = 0 als Tangente. Die Nullstellen der Ableitungsind ±1/ 3. Bei −1/ 3 liegt ein √ lokales Maximum, bei 1/ 4 3 ein lokales Minimum vor. c) Die Funktion h ist in 0 nicht definiert. von ‘links’ geht sie dort gegen −∞, von ‘rechts’ gegen ∞. Denn der zweite Summand tut dies, während der erste dort von beiden Seiten gegen 0 geht. 279 (Wenn man den ersten Summand durch irgendeine in 0 definierte und dort stetige Funktion ersetzt, gilt dasselbe.) Eine Nullstelle von h ist −1. Wir werden bald sehen, dass es die einzige ist. Zumindest in R∗+ hat h keine Nullstelle, da dort beide Summanden positiv sind. Die Ableitung ist h0 (x) = 32 x−1/3 − x−2 . Für alle x < 0 ist h0 (x) < 0, nicht wahr? (x−2 > 0 für alle x 6= 0.) Deshalb ist h im Bereich der negativen Zahlen streng monoton fallend. Die Funktion h hat also nur die Nullstelle −1 . Jetzt bestimme ich das Verhalten der Ableitung in R∗+ . Sei R eine der Relationen <, >, =. Für x > 0 gilt dann h0 (x) R 0 ⇐⇒ 2 −1/3 3 x R x−2 ⇐⇒ x5/3 R . 3 2 Da x5/3 eine streng monoton wachsende Funktion ist, sehen wir, dass p h0 (x) < 0 für 0 < x < p p 5 5 0 0 27/8, und h (x) = 0 für x = 27/8 und schließlich h (x) > 0 für x > 5 27/8 ist. p In 5 27/8 ≈ 1,275 liegt also ein lokales Minimum vor. 7.5.A7. Da f (0) = 0 ist sieht ein allgemeiner Differenzenquotienten im Punkte 0 wie folgt aus: |x|/(ln |x|) 1 =± x ln |x| Da limx→0 ln |x| = −∞ ist gilt limx→0 ±1/(ln |x|) = 0. 7.6.A2. Ist x ≤ 0, so ist 2√x ≤ 1, also 2x 6= 3. Sei also im Folgenden x > 0. Die einzige Lösung 2 der ersten √ Gleichung ist 3. Da 2 > 3 und die Wurzelfunktion streng monoton wachsend ist, gilt 3 < 2. Da außerdem e = 1 + 1 + 1/2 + · · · ist, gilt 2 < e. Satz 7.6.4 ergibt somit √ √ 2 3 2 < 3 = 3. √ Dass 3 irrational ist, wirst Du bereits wissen. Nimm an, es gäbe natürliche Zahlen m, n mit n 6= 0 und 2m/n = 3, so wäre 2m = 3n , was der Eindeutigkeit der Primfaktorzerlegung widerspräche. 7.6.A3 −117. 7.6.A4. Nach Satz 7.6.4 ist die zweite der Zahlen gößer. 7.6.A.5 a) Es ist 23 < 32 . Die 6. Wurzelfunktion ist streng monoton wachsend. Also √ √ √ √ 6 6 3 23 < 32 , d.h. 2 < 3 b) Wegen n ≥ 3 > e ist nn+1 > (n + 1)n . Durch Ziehen der n(n + 1)-ten Wurzel siehst Du √ √ √ n+1 n n n> n + 1. Es ist also so: Wenn man die Zahlen n miteinander vergleicht, so wachsen sie von 1 bis 3, danach fallen sie. √ √ √ c) Es ist ln( n n) = ln(n)/n. Aus (7.6.2 iv.) folgt limn→∞ ln( n n) = 0, also limn→∞ n n = 1 √ √ 7.6.A6. Da e > 2, gilt 0 < 3 2 < 2 < e. Aus Satz 7.6.4 folgt, dass die erste Zahl größer ist. 280 ANHANG A. LÖSUNGEN 7.6.A8. Häufig ist es bei einem Induktionsbeweis einfacher, eine stärkere Aussage zu beweisen. (Diese steht ja auch in der Induktionsvoraussetzung.) So auch hier. Zeige n+1 a ≥ a · nb Induktionsanfang: 2 a ≥ a · 1 b. Sei jetzt bereits n+2 a = a( n+1 a) ≥ aa· nb n+1 a ≥ a · n b gezeigt, so gilt: nb ≥ a · (a(a−1) ) = a · n+1 b . 2 x 2 7.6.A10. Da (xx )x = xx gilt, kann man die Gleichung auch in der Form xx = xx schreiben. Offenbar ist x = 1 eine Lösung. Ist x > 0 und x 6= 1 so gilt xa = xb genau dann, wenn a = b x 2 ist. Aus xx = xx folgt dann, dass (für positive x 6= 1) die Gleichung xx = x2 , dass also aus demselben Grunde x = 2 gelten muss. Umgekehrt erfüllt x = 2 die Gleichung. 7.6.A11. a) Es ist 2111111 = 2 · 2111110 , also 2111111 − 2111110 = 2111110 . Die einzige reelle Lösung der Gleichung ist also x = 111110. b) Es gilt 512 = 29 . Dividiere die Gleichung durch die echte Seite. Dann ergibt sich 2x 2 29x+252 = 1 d.h. 2x 2 −9x−252 =1 Letztere Gleichung ist genau dann erfüllt, wenn x2 − 9x − 252 = 0 gilt. 8.1.A1. Die Menge der Polynome der genannten Art bezeichnen wir mit S (’symmetrisch’). Jedenfalls ist −1 eine gemeinsame Nullstelle derPolynome aus S. Wir zeigen, dass keine weitere komplexe Zahl Nullstelle aller Polynome aus S ist, indem wir zwei Polynome aus S angeben, die lediglich die Nullstelle −1 gemeinsam haben. Das Polynom z n + 1 gehört zu S. Da n ungerade ist, hat es die mit einem Minuszeichen versehenen n-ten Einheitswurzeln als Nullstellen, d.h. die Zahlen −1, −ζ, −ζ 2 , . . . , , −ζ n−1 , wo ζ = cos(2π/n) + i sin(2π/n) ist. Das Polynom ϕ = z n−1 + z n−2 + · · · + z + 1 hat die von 1 verschiedenen n-ten Einheitswurzeln als Nullstellen. (z + 1) · ϕ = z n + 2z n−1 + 2z n−2 + · · · + 2z + 1 gehört auch zu S und hat neben −1 die von 1 verschiedenen n-ten Einheitswurzeln als Nullstellen. Das additiv Inverse einer n-ten Einheitswurzel ist aber bei ungeradem n nie eine n-te Einheitswurzel! (Für ungerades n ist (−a)n = −(an ).) Die beiden zu S gehörenden Polynome (z + 1)ϕ und z n + 1, haben außer −1 keine gemeinsame Nullstelle. 8.1.A2. Wir wissen aus der Lösung der Aufgabe 1) dass f = (z + 1)(z 2 + z + 1) gilt. Also hat f einerseits die Nullstelle −1, andererseits√die von 1 verschiedenen dritten Einheitswurzeln ζ, ζ 2 mit ζ = cos(2π/3) + i sin(2π/3) = (1 + i 3)/2. Das Polynom g hat, wie man nachrechnet, nicht die Nullstelle −1. Hingegen hat g die Nullstellen ζ und ζ 2 . Sei nämlich ξ eine der beiden Zahlen ζ, ζ 2 . Dann ist ξ 3 = 1, also ξ 3k+m = ξ m . Ferner gilt ξ 2 + ξ + 1 = 0. Es folgt ξ 2015 + ξ 121 + 1 = ξ 2 + ξ 1 + 1 = 0. 9.1 A1. Man sagt, ein Gruppenelement a habe die Ordnung 2, wenn a2 = 1, aber a 6= 1 gilt. Ein Element a 6= 1 hat genau dann die Ordnung 2, wenn a = a−1 ist. Die Elemente a mit a 6= a−1 kann man zu Paaren zueinander Inverser zusammenfassen. Jedes solche Paar hat das Produkt 1. Das Produkt aller Gruppenelemente ist also gleich dem Produkt der Elemente der Ordnung 2, sofern man das leere Produkt gleich 1 setzt. Wenn es ein einziges Element der 281 Ordnung 2 gibt, ist also dieses das Produkt aller Elemente der Gruppe. (Man kann zeigen, dass das Produkt aller Elemente einer endlichen abelschen Gruppe gleich 1 ist, wenn es mehrere Elemente der Ordnung 2 gibt.) 9.1.A2. Die Gleichung x2 = 1 ist äquivalent zur Gleichung (x + 1)(x − 1) = 0. Und in einem Körper ist ein Produkt genau dann gleich 0, wenn einer der Faktoren es ist. (Beachte, dass die zu beweisende Behauptung für den Ring Z/(pq) mit zwei verschiedenen Primzahlen p, q > 2 falsch ist. Dies kann man mit Hilfe des chinesischen Restsatzes, der weiter unten bewiesen wird leicht sehen. Zeige es für pq = 15.) 9.1.A3. Die Restklasse von (p − 1)! ist das Produkt aller Elemente von (Z/(p))∗ , also gleich der Restklasse von −1, der einzigen, die in der Gruppe (Z/(p))∗ für p 6= 2 die Ordnung 2 hat. Für p = 2 ist die Aussage trivial, da 1 ≡ −1 (mod 2) ist. 9.1.A4 (4 − 1)! = 6 ≡ 2(mod 4). Sei m > 4. Fall 1. m = p2 mit einer Primzahl p > 2. Dann gilt p, 2p ≤ m − 1. Also ist (m − 1)! durch p · 2p teilbar, mithin ≡ 0 (mod p2 ). Fall 2. m > 2 ist weder eine Primzahl, noch das Quadrat einer Primzahl. Dann ist m das Produkt zweier verschiedener natürlicher Zahlen > 1, die kleiner als m sind. Also ist (m − 1)! ≡ 0 (mod m). 9.1.A5. Ist p eine Primzahl, so ist nach Wilson (p−1)!+1 durch p teilbar. Da 101 eine Primzahl ist, ist demnach 100! + 1 durch 101 teilbar. Ferner ist 100! + 1 (viel) größer als 101, da bereits 5! > 101 gilt. Also besitzt 100! + 1 einen nichttrivialen Teiler und ist deshalb nicht prim. 9.1.A6. Alle p Restklassen modulo p kann man ja in der Form k + pZ schreiben, wobei k die Zahlen 0, 1, . . . , p − 1 durchläuft. Setze nun m = (p − 1)/2. (Nach Voraussetzung ist p ungerade, also m ∈ N.) Du erhältst jede Restklasse k + pZ modulo p genau einmal, wenn Du k die Zahlen −m, . . . , −1, 0, 1, . . . , m durchlaufen lässt. (Beispiel p = 5. Hier erhält man alle Restklassen in der Form −2 + 5Z, −1 + 5Z, 5Z, 1 + 5Z, 2 + 5Z.) Modulo p ist dann −1 ≡ (p − 1)! kongruent dem Produkt der Zahlen −m, . . . , −1, 1, . . . , m. Also ist −1 ≡ (−1)m (m!)2 (mod p). Nun ist m = (p − 1)/2 genau dann gerade, wenn p ≡ 1 (mod 4) ist. Deshalb ist dann die Restklasse von −1 ein Quadrat. a −b 9.1.A7 Die Matrizen der Form sind invertierbar, genau dann, wenn ihre Determib a nannte a2 + b2 6= 0 ist. Diese bilden eine Untergruppe G ⊂ Gl2 (k). Die Determinante gibt uns eine surjektive Abbildung f von G auf die Menge der von 0 verschiedenen Elemente der Form a2 + b2 in K, welche f (AB) = f (A)f (B) erfüllt. Das Bild von f ist dann natürlich eine Gruppe. 9.1.A8. Die Abbildung exp : R → R∗+ ist ein Isomorfismus. 9.1.A9. Angenommen, es gäbe einen Isomorfismus: f : Q → Q∗+ . Sei dann α ∈ Q ein Element mit f (α) = 2. Dann hat α/2 die Eigenschaft f (α/2)2 = f ((α/2) + (α/2)) = f (α) = 2. D.h. das Element β = f (α/2) ∈ Q hätte die Eigenschaft β 2 = 2. Ein Widerspruch, da ein solches β nicht rational sein kann. 9.1.A10. Als ich zum ersten Mal auf diese Aufgabe stieß, habe ich die Assoziativität mühevoll durch unmittelbares Rechnen mit Mengen gemäß der Definition hergeleitet. Erst später habe ich erkannt, dass es viel sinnvoller ist, zunächst die Teilmengen E von M durch ihre charakteristischen Funktionen χE : M → F2 zu beschreiben. Die charakteristische Funktion χE ist 282 ANHANG A. LÖSUNGEN durch χE (x) = 1 ⇐⇒ x ∈ E definiert. Dann entspricht der symmetrischen Differenz nämlich die Summe dieser Funktionen. 9.1.A11. Nach Voraussetzung gilt für a, b ∈ G sowohl a2 b2 = 1, als auch abab = (ab)2 = 1. Multipliziert man die Gleichung aabb = abab von links mit a−1 und von rechts mit b−1 , so erhält man ab = ba. Alternativ: a2 = 1 ist gleichbedeutend mit a = a−1 . Somit gilt ab = a−1 b−1 = (ba)−1 = ba. Beachte: Es Ist durchaus möglich, dass a2 = b2 = 1 und trotzdem ab 6= ba ist. Sei etwa a = σ1 , b = σ2 in der S3 . Für den Beweis der Behauptung in der Aufgabe muss man ja zusätzlich (ab)2 = 1 benutzen. 9.1.A13 Betrachte die Elemente 1 0 , 0 1 , 1 1 ∈ F22 Wenn man sie von links mit den Matrizen aus Gl2 (F2 ) multipliziert so vertauscht man sie – in genau der Weise, wie die Elemente von S3 die Zahlen 1,2,3 vertauschen. 9.2.A4 c) Da p eine von q verschiedene Primzahl ist, ist p nicht durch q teilbar, also nach Fermat pq−1 ≡ 1 (mod q). Es folgt (q − 1)pq−1 + 1 ≡ q − 1 + 1 (mod q). Also ist (q − 1) · pq−1 + 1 durch q teilbar und größer als q. b) und a) folgen aus c). Was a) betrifft wirst Du natürlich ohnehin sofort sehen, dass 10·210 +1 = 10241 nach dem bekannten Kriterium durch 11 teilbar ist. 9.2.A5 Die Ordnung eines jeden Elements einer Gruppe G der Ordnung 4 ist 1,2 oder 4. 1. Fall: Es gibt in G ein Element der Ordnung 4. Dessen Potenzen machen dann ganz G aus, d.h. G ist zyklisch. Je zwei zyklische Gruppen derselben Ordnung sind natürlich isomorf. 2. Fall: Jedes von 1 verschiedene Elements von G hat die Ordnung 2. Dann ist G abelsch nach der Aufgabe 1.A11. Seien 1, a, b, c mit dem neutralen Element 1 die (verschiedenen) Elemente von G. Die Produkte 1a = a, 1b = b, 1c = c, a2 = b2 = c2 = 1 sind bekannt. Was ist ab? Wäre ab = 1, so wäre b = a−1 = a im Widerspruch zu b 6= a. Wäre ab = a, ergäbe die Multiplikation mit a−1 = a die Gleichung b = 1. Ebenso würde ab = b zu a = 1 führen. Als einzige Möglichkeit bleibt ab = c. Ebenso muss bc = a und ca = b gelten. Die Produkte ergeben sich zwangsläufig. Das bedeutet: In einer nichtzyklischen Gruppe der Ordnung 4 gilt, dass das Produkt zweier verschiedener von 1 verschiedenen Elemente das dritte unter denselben ist. Je zwei nichtzyklische Gruppen der Ordnung 4 sind also zueinander isomorf. Aber, dass es eine solche überhaupt gibt, wissen wir schon, nämlich die Gruppe der folgenden 4 Matrizen über Q: 1 0 −1 0 1 0 −1 0 1= , a= , b= , c= . 0 1 0 1 0 −1 0 −1 Und diese ist natürlich auch isomorf zum direkten Produkt (Z/(2)) × (Z/(2)). 283 9.3.A1. Wenn U kein Normalteiler ist, dann gibt es ein a ∈ G mit aU 6= U a. Das bedeutet, dass es ein u ∈ U mit au ∈ / U a oder ua ∈ / aU gibt. (Beachte, dass U a ( aU nicht automatisch ausgeschlossen ist und man deshalb beide genannten Möglichkeiten in Betracht ziehen muss.) 1. Fall: Setze b := au; dann ist bU = aU , aber U b 6⊂ U a, also U b 6= U a. 2. Fall: Ersetze a durch a−1 und u durch u−1 . Dann gilt a−1 u−1 ∈ / U a−1 . Nach Fall 1 ist dann −1 −1 −1 −1 −1 −1 a U = (a u )U , aber U a 6= U a u . 9.3.A2. Sei aU = bU . Für jedes u ∈ U gibt es dann ein v ∈ U mit au = bv. Daraus folgt u−1 a−1 = (au)−1 = (bv)−1 = v −1 b−1 . Somit liegen a−1 und b−1 in derselben Rechtsnebenklasse nach U , d.h. U a−1 = U b−1 . 9.3.A3. Wie Du weißt, ist G die disjunkte Vereinigung der beiden Linksnebenklassen nach U . Eine der beiden Linksnebenklassen ist U , die andere deshalb G − U . Dasselbe gilt für die beiden Rechtsnebenklassen. Es gilt also aU = U oder aU = G − U , und ebenso U a = U oder U a = G − U , je nachdem, ob a ∈ U oder a ∈ G − U ist. In jedem Falle ist also aU = U a. 9.3.A6. Sei f10 : (Z/(2))m → U ein Gruppenisomorfismus. Ihn kann man auch als (injektiven) Gruppenhomomorfismus f1 : (Z/(2))m → G auffassen. (Es wird nur die Zielmenge vergrößert. Ansonsten ist f1 (x) = f10 (x).) Wäre nun U 6= H, so gäbe es ein c ∈ H − U . Da nach Voraussetzung c2 = 1 ist, ist {1, c} eine zu Z/(2) = {0, 1 isomorfe Untergruppe von H. Die Abbildung f2 : Z/(2) → H, definiert durch f2 (0) = 0H , f2 (1) = c, ist ein Homomorfismus nach der vorangehenden Aufgabe. Dieser ist immer noch injektiv. Dazu genügt es, zu zeigen, dass der Kern von F nicht nur aus der 0 besteht. Nun sei F (a, b) = 0. Dann gilt f2 (b) = −f1 (a) ∈ U . Da aber f2 (1) = c ∈ / U gewählt war, ist b = 0. Dann muss auch 9.3.A7. Modulo 1000 gilt: 1998 ≡ −2. Es ist 1000 = 8 · 125. Wenn also N := 19981998! je eine Kongruenz modulo 8 und modulo 125 erfüllt, kannst Du nach dem chinesischen Restsatz eine Kongruenz modulo 1000 angeben und damit die letzten 3 Ziffern bestimmen. Es gilt (−2)m ≡ 0 (mod 8 für m ≥ 3, und deshalb ist N ≡ 0 (mod 8. Da −2 zu 125 teilerfremd und ϕ(125) = 100 ist, gilt (−2)k·100 ≡ (1 mod 125). Da einerseits 1998! ≥ 3, andererseits 1998! durch 100 teilbar ist, gilt N ≡ 0 (mod 8) und N ≡ 1 (mod 125). Die Zahl 376 erfüllt die Kongruenzen 376 ≡ 0 (mod 8) und 376 ≡ 1 (mod 125). Deshalb ist nach der Eindeutigkeitsaussag des chinesischen Restsatzes N ≡ 376 (mod 1000). D.h. die letzten 3 Ziffern von N sind 376.