Grundlagen der Mathematik (WiSe 11/12) Susanne Koch Fachbereich Mathematik Universität Hamburg [email protected] 30. März 2012 Inhaltsverzeichnis Einleitung 3 1 Logische Grundlagen 1.1 Aussagen . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Verknüpfungen (Junktionen) . . . . . . . . . . . . . . 1.3 Tautologien und Kontradiktionen . . . . . . . . . . . 1.4 De Morgansche Gesetze . . . . . . . . . . . . . . . 1.5 Implikation und Kontraposition . . . . . . . . . . . . 1.6 Aussageformen . . . . . . . . . . . . . . . . . . . . . 1.7 Quantoren . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Beweistechniken . . . . . . . . . . . . . . . . . . . . . 1.8.1 Zum Beweisen von Implikationen . . . . . . . 1.8.2 Zum Beweisen von Existenz- und Allaussagen 2 Mengen 2.1 Begriffsklärung . . . . . . . . . . . . . . . . . . . . 2.2 Potenzmenge . . . . . . . . . . . . . . . . . . . . . 2.3 Mengen-Algebra . . . . . . . . . . . . . . . . . . . . 2.4 Differenzen von Mengen . . . . . . . . . . . . . . . 2.5 Das kartesisches Produkt . . . . . . . . . . . . . . . 2.6 Bedeutende Teilmengen der reellen Zahlen:Intervalle 3 Relationen 3.1 Begriffsklärung . . . . . . . . . . . . . . . . 3.2 Eigenschaften von Relationen . . . . . . . . 3.3 Äquivalenzrelationen und Äquivalenzklassen 3.4 Halbordnungs- und Ordnungsrelationen . . . 4 Abbildungen und Funktionen 4.1 Begriffsklärung . . . . . . . . . 4.2 Eigenschaften von Abbildungen 4.3 Komposition von Abbildungen . 4.4 Mächtigkeit von Mengen . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 9 15 18 19 20 21 24 26 31 . . . . . . 34 34 39 40 47 48 50 . . . . 54 54 61 64 70 . . . . 78 78 88 97 102 Einleitung 5 Die 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 natürlichen Zahlen Definition der natürlichen Zahlen . . . . . . . . . . . . . . . Vollständige Induktion: Teil I . . . . . . . . . . . . . . . . . Die Addition auf N als Spezialfall einer binären Verknüpfung Die Ordnung der natürlichen Zahlen . . . . . . . . . . . . . Eindeutigkeit der natürlichen Zahlen . . . . . . . . . . . . . Multiplikation auf N . . . . . . . . . . . . . . . . . . . . . . Potenzen natürlicher Zahlen . . . . . . . . . . . . . . . . . . Vollständige Induktion: Teil II . . . . . . . . . . . . . . . . . Subtraktion und Division natürlicher Zahlen . . . . . . . . . Operationen mit beliebig vielen Mengen . . . . . . . . . . . Literaturverzeichnis 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 111 116 117 126 131 136 141 143 146 150 153 Einleitung Die Art und Weise, in der Mathematik an der Universität betrieben wird, unterscheidet sich in ganz erheblichem Maße von der Art und Weise, in der Sie Mathematik an der Schule betrieben haben: Zum einen ist (wie in allen anderen Disziplinen übrigens auch) das Tempo, in dem die Inhalte abgehandelt werden, unvergleichlich viel höher; zum anderen - und das ist der wichtigere und die (wissenschaftlich betriebene) Mathematik charakterisierende Unterschied ist der Aufbau (mehr oder weniger streng) axiomatisch. Das bedeutet, dass zunächst einige wenige Grundannahmen, die als richtig postuliert werden und weder zu beweisen noch zu widerlegen sind, zusammengetragen werden (die sogenannten Axiome) und aus diesen Grundannahmen durch logische Schlussweisen weitere Aussagen abgeleitet werden. So werden wir die Menge 1 N := {1, 2, 3, 4, . . .} der Ihnen (teilweise) bereits aus der frühen Kindheit bekannten natürlichen Zahlen durch die sogenannten Peano-Axiome 2 charakterisieren und diese Menge durch logische Schlussweisen in mehreren Semestern schrittweise erweitern hin zu den ganzen, rationalen und reellen Zahlen. Im Zuge dieser Erweiterung werden wir ganz genau analysieren, warum 3 + 5 = 5 + 3 ist und weshalb 1 · 1 = 1 ist. Sie werden einen Eindruck davon bekommen, dass etwas scheinbar Einfaches - wie zum Beispiel der Zahlenstrahl, der zur Veranschaulichung der Menge der reellen Zahlen bereits in der Sekundarstufe herangezogen wird - eine enorme mathematische Komplexität beinhalten kann. Sie werden dabei (hoffentlich) die Erfahrung machen, dass etwas als verstanden Geglaubtes plötzlich ganz unverstanden ist und einer neuen, eingehenderen Betrachtung bedarf! Die axiomatische Methode bringt es natürlicherweise mit sich, dass sich manche Inhalte in ganz neuem Gewand präsentieren. Ich will Ihnen mal ein Beispiel für eine mathematische Aussage geben, welche für gewöhnlich im dritten Fachsemester bewiesen werden wird. Die hier vorkommenden Begriffe (und vielleicht sogar den Inhalt der Aussage) kennen Sie aller Voraussicht nach aus der Schule: Satz: Ist eine Funktion f : R → R differenzierbar in x0 ∈ R, so ist sie dort auch stetig. Sie erkennen, dass - um den Satz wirklich zu verstehen - klar sein muss, was R ist, was eine Funktion f : R → R ist, was x0 ∈ R bedeutet, was man unter Differenzierbarkeit in einem Punkt x0 zu verstehen hat, und was Stetigkeit ist. Außerdem erkennen Sie, dass ein logischer 1 Der Doppelpunkt vor dem Gleichheitszeichen in N := {1, 2, 3, 4, . . .} zeigt an, dass der linken Seite der Gleichung (also dem Symbol N) die rechte Seite der Gleichung (also die Menge {1, 2, 3, 4, . . .}) zugewiesen wird. Hierdurch wird das Symbol N also definiert. Vergleichbares wird uns ganz häufig begegnen! 2 Giuseppe Peano, ∗ 27. August 1858 in Spinetta, Piemont, † 20. April 1932 in Turin, war ein italienischer Mathematiker, der sich überwiegend mit mathematischer Logik befasste. Insbesondere entwickelte er die Axiomatik der natürlichen Zahlen. 3 Einleitung 4 Zusammenhang zwischen den beiden Teilaussagen die Funktion f : R → R ist in x0 ∈ R ” differenzierbar“ und die Funktion f : R → R ist in x0 ∈ R stetig“ formuliert wird, nämlich ” der, dass die Gültigkeit der ersten Teilaussage die Gültigkeit der zweiten Teilaussage nach sich zieht. An diesem Satz wird vieles, was Mathematik als wissenschaftliche Disziplin charakterisiert, deutlich: 1. Die Begriffe, über die man redet, müssen bekannt sein - Mathematiker treffen hierzu ganz präzise Definitionen. 2. Die präzise definierten Begriffe werden durch logische Schlussweisen miteinander in Beziehung gesetzt; die Beziehung wird für gewöhnlich in Form eines Satzes oder eines Lemmas, gelegentlich auch in Form einer Folgerung (auch Korollar genannt) formuliert. Wichtig ist, dass die Gültigkeit dieser Beziehung durch einen Beweis, der logischen Gesetzen genügen muss, zu belegen ist. Um zu verhindern, dass Sie sich von diesen Ausführungen verschrecken lassen, will ich mal eine Behauptung, vor der Sie sicher keinen allzu großen Respekt haben und von deren Richtigkeit Sie sich schnell alleine überzeugen könnten, in eine Form gießen, wie sie typisch ist für die Mathematik an der Universität - und zwar folgende: Das Quadrat einer geraden natürlichen Zahl ist wieder gerade. Wir werden dies in Kürze wie folgt ausdrücken und belegen: Satz: Ist n ∈ 2N := {2, 4, 6, 8, . . .}, so gilt n2 ∈ 2N. Beweis: Ist n ∈ 2N, so existiert ein k ∈ N, so dass n = 2k (nämlich k = n2 ). Damit ist n2 = (2k)2 = 4k 2 = 2 · (2k 2 ) und diese Zahl ist wieder gerade (weil sie ein Vielfaches von 2 ist). q.e.d.3 Nun kommt hinzu, dass Mathematikerinnen und Mathematiker, was ihre (mathematische) Ausdrucksweise betrifft, im Allgemeinen sehr sparsam sind - für fortgeschrittenere Studierende würde man den Satz und die Aussage zumindest an der Tafel etwa wie folgt formulieren: Satz: n ∈ 2N := {2k : k ∈ N} ⇒ n2 ∈ 2N. Beweis: n ∈ 2N ⇒ ∃ k ∈ N : n = 2k ⇒ n2 = (2k)2 = 4k 2 = 2 · (2k 2 ) ∈ 2N. Hieran erkennen Sie zum einen, dass etwas durchaus Bekanntes mitunter ungewohnt ausgedrückt wird und zum anderen, dass man - um Mathematik im beschriebenen Sinne betreiben zu können - logisch argumentieren können muss! (Dies ist übrigens nicht nur im Rahmen der Mathematik sinnvoll und nützlich.) Und daher wollen wir in unserem ersten Kapitel das Augenmerk auf einige logische Grundlagen richten. Im zweiten Kapitel werden wir uns mit Mengen beschäftigen. Sie werden sehen, dass die beiden Gebiete eng miteinander verwandt und für die Mathematik in jeder Beziehung grundlegend sind (hatten wir es doch 3 q.e.d. ist die Abkürzung für quod erat demonstrandum, was lateinisch ist und was zu beweisen war bedeutet. Alternativ kann man an das Ende eines Beweises auch ein Quadrat (also das Symbol ) setzen. Letzteres werden wir in Zukunft vorzugsweise tun. Einleitung 5 bereits mit ersten Beispielen für Mengen zu tun: N, 2N, Menge der ganzen Zahlen, etc.). Im Anschluss daran widmen wir uns dem Begriff der Relation und wichtigen Spezialfällen wie Äquivalenzrelation und Ordnungsrelation. In diesem Zusammenhang beleuchten wir auch den Begriff der Abbildung bzw. Funktion, den Sie sicher aus der Schule kennen, von der axiomatischen Seite. Hierbei werden wir versuchen zu verstehen, wie sich die Anzahl der natürlichen Zahlen zur Anzahl der ganzen Zahlen verhält - und warum die Menge der reellen Zahlen viel größer“ ist. In gewissem Sinne stellt diese Untersuchung, genauso wie alle anderen ” Überlegungen, in denen bis hierhin mit natürlichen, ganzen, rationalen oder, noch allgemeiner, reellen Zahlen gearbeitet worden sein wird, einen Vorgriff dar. Denn erst im dann folgenden Kapitel beginnen wir mit dem axiomatischen Aufbau der Zahlbereiche, innerhalb dessen wir zunächst in aller Ausführlichkeit die Menge N der natürlichen Zahlen charakterisieren und formal definieren werden, um im Anschluss hieran auf dieser Menge sowohl die (vertrauten) Rechenoperationen Addition und Multiplikation einzuführen als auch die Ordnungsstruktur kleiner-gleich zu etablieren. Wenn ich es mit dem axiomatischen Aufbau der Mathematik ganz genau nähme, dürften die natürlichen Zahlen (und damit erst recht auch deren oben bereits genannte Obermengen, also beispielsweise die reellen Zahlen) bis zu diesem Zeitpunkt weder in der Vorlesung noch in den Übungen vorgekommen sein. Das würde aber bedeuten, dass ich Sie in den ersten Kapiteln dieser Veranstaltung nur mit sehr abstrakten Beispielen konfrontieren könnte. Da derartige Beispiele erfahrungsgemäß jedoch häufig nicht ganz einfach zu begreifen sind, werde ich, was diesen Punkt betrifft, zu Gunsten einer besseren Verständlichkeit von einem streng axiomatischen Aufbau der Theorie absehen und (zunächst) annehmen, dass Sie die verschiedenen Zahlbereiche und die dort jeweils bestehenden Rechenregeln schon kennen. Insbesondere setze ich in diesem Zusammenhang einen sicheren Umgang mit Bruchrechnung, Potenz- und Wurzelrechnung, Logarithmen, Termumformungen, etc. voraus. Sollten Sie mit arithmetischen Umformungen wider Erwarten Unsicherheiten oder Schwierigkeiten haben, empfehle ich Ihnen dringend, diese selbstständig und zeitnah zu beheben - diese Dinge werden nicht Gegenstand der Veranstaltung sein! 4 Kommen wir nun zurück zu dem inhaltlichen Aufbau der Vorlesung: Nachdem der Zahlenbereich N mit einer Addition und einer Multiplikation versehen ist, werden wir bemerken, dass diese Menge bezüglich der Gegenspieler“ Subtraktion und Division grundlegend ande” re Eigenschaften aufweist. Außerdem werden wir uns Gedanken darüber machen, wie man natürliche Zahlen darstellen kann und ein Ein-Mal-Eins kennenlernen, welches in eine 3x3Tabelle passt. Im Anschluss daran werden wir den Aufbau der Zahlbereiche weiter treiben und, auf das Konzept der Äquivalenzrelation zurückgreifend, die Menge der ganzen Zahlen und die Menge der rationalen Zahlen einführen. Es wird deutlich werden, dass viele Rechenregeln, die Sie bislang einfach so verwendet haben, aufwendig zu beweisen sind und in der hier dargebotenen Form nie und nimmer in der Grundschule behandelt werden könnten. Trotzdem bin ich überzeugt davon, dass die Kenntnisse, die ich Ihnen im Rahmen dieser Einführungsveranstaltung in Ihr Mathematikstudium nahe bringen möchte, später im Beruf von fundamental wichtiger Bedeutung sind. Oder können Sie jetzt schon ganz genau erklären, 4 Die Regeln für das Rechnen mit reellen Zahlen sind in Abschnitt 1.3 in [AA05] zusammengefasst. Wer seine Rechenfertigkeiten mittels einer Aufgabensammlung auffrischen will, sei auf [Pos11] verwiesen. 6 warum 9 − 5 − 3 eigentlich ein unsinniger Ausdruck ist, während man 9 + 5 + 3 bedenkenlos hinschreiben kann? Im Übrigen werden einige der Bedeutungen fundamental wichtiger strukturmathematischer Begriffe wie Gruppe, Ring und Körper, die Sie im Rahmen eines Mathematikstudiums auf jeden Fall kennen lernen müssen, beim Aufbau der Zahlbereiche auf ganz natürliche Art und Weise deutlich werden. Im letzten Kapitel werden wir uns intensiv mit Primzahlen und dem Begriff der Teilbarkeit beschäftigen. Sie werden bemerken, dass die Teilbarkeitseigenschaft und die kleiner-gleichRelation viel gemeinsam haben und (mindestens) einen Beweis dafür sehen, dass es unendlich viele Primzahlen gibt. In diesem Kapitel werden besonders viele Begriffe thematisiert werden, die Ihnen aus der Schule bereits bekannt sind (z. Bsp. größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches); die Art und Weise, wie das hier gemacht wird, wird Ihnen aber vermutlich noch viel Spielraum für neue Entdeckungen und Erkenntnisse lassen! Zuletzt noch eine Bitte, die die Qualität dieses Skripts betrifft: Sollten Sie beim Lesen Fehler jeglicher Art entdecken, wäre ich Ihnen sehr dankbar, wenn Sie mich per E-Mail darauf aufmerksam machen könnten. Ich werde diese Fehler dann korrigieren und Ihnen am Ende des Semesters eine korrigierte Gesamtversion zur Verfügung stellen. Anmerkungen zu den Bezeichnungen Das Ende eines Beweises wird im vorliegenden Skript durch das Zeichen kenntlich gemacht. Beweise von Hilfssätzen werden mit dem Symbol abgeschlossen. Am Ende eines (umfangreicheren) Beispiels findet sich jeweils das Symbol . N Folgende Bezeichnungen werden wir für Zahlenmengen verwenden: N := {1, 2, 3, . . .}: Menge der natürlichen Zahlen (die 0 gehört nicht dazu!), N0 := {0, 1, 2, 3, . . .}: Menge der natürlichen Zahlen erweitert um 0, Z := {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}: Menge der ganzen Zahlen, Q := { pq : p, q ∈ Z, q 6= 0}: Menge der rationalen Zahlen, R: Menge der reellen Zahlen. Für den Anfang setze ich voraus, dass Sie diese Mengen und ihre Relationen zueinander kennen und mit ihren Elementen rechnen können (s.o.). Im weiteren Verlauf der Vorlesung werden wir die genannten Mengen auch formal exakt einführen und studieren. Internetlink • Zum Begriff Axiom: http://de.wikipedia.org/wiki/Axiom Und nun viel Spaß bei der Lektüre dieses Skriptes und viel Erfolg für Ihr Mathematikstudium! Kapitel 1 Logische Grundlagen Literaturempfehlung: L [Fri07]: Fritzsche, Klaus: Mathematik für Einsteiger - Vor- und Brückenkurs zum Studienbeginn (4. Auflage). Spektrum Akademischer Verlag (2007). L [MM11]: Meinel, Christoph und Mundhenk, Martin: Mathematische Grundlagen der Informatik - Mathematisches Denken und Beweisen - Eine Einführung (5. Auflage). Vieweg/Teubner (2011). 1.1 Aussagen Eine exakte Definition des Begriffs Aussage soll hier nicht angegeben werden - für uns reicht es aus, mit Aussagen umgehen zu können; wir legen daher folgendes fest: R Eine Aussage ist ein sprachliches bzw. schriftliches Konstrukt, welches eindeutig entscheidbar wahr oder falsch ist, also nie beides zugleich. Ist eine Aussage wahr, so sagt man, dass sie den Wahrheitswert w hat, falsche Aussagen dagegen haben den Wahrheitswert f. Insbesondere muss also die Frage danach, ob eine Aussage wahr oder falsch ist, sinnvoll gestellt werden können und prinzipiell beantwortbar sein. Bei Fragesätzen, Ausrufen oder Wünschen ist das sicher nicht der Fall! Daher sind derartige Konstrukte auf jeden Fall keine Aussagen. Im Übrigen beinhaltet die oben genannte Forderung an Aussagen nicht, dass eine richtige Entscheidung bezüglich Gültig- oder Ungültigkeit auf jeden Fall hier und jetzt oder irgendwo und irgendwann getroffen werden können muss (derartige Entscheidungsfindungen können mitunter ganze Generationen von Wissenschaftlerinnen und Wissenschaftlern beschäftigen 1 ), aber es muss sichergestellt sein, dass grundsätzlich genau einer der beiden Fälle trifft zu“ ” oder trifft nicht zu“ eintritt. ” 1 Der Wahrheitsgehalt des Satzes Die Ausdehnungsgeschwindigkeit des Universums nimmt zu ist sicherlich nicht leicht zu ermitteln; dennoch handelt es sich hier um eine Aussage. Am 4. Oktober 2011 haben die USamerikanischen Astrophysiker Saul Perlmutter, Brian P. Schmidt und Adam G. Riess den Nobelpreis für Physik erhalten, weil sie einen wichtigen Beitrag zur Entscheidung der Frage nach der Richtigkeit dieser Aussage geleistet haben. 7 1.1 Aussagen 8 Beispiel 1.1 Aussagen in unserem Sinne sind also beispielsweise die folgenden: • Heute ist Montag. • Die Temperatur in diesem Zimmer beträgt mehr als 20◦ C. • 2 + 7 = 10. • Es gibt unendlich viele Primzahlen. • Im Jahr 2100 wird der Meeresspiegel gegenüber heute um 1,30 m angestiegen sein. • Jede gerade natürliche Zahl, die größer als zwei ist, ist als Summe zweier Primzahlen darstellbar (Goldbach-Vermutung 2 ). • Für keine natürliche Zahl n, die größer ist als zwei, existieren drei positive ganze Zahlen x, y, z, so dass xn + y n = z n ist (Großer Satz von Fermat 3 ). Keine Aussagen im angegebenen Sinn sind dagegen folgende Konstrukte: • Weihnachten steht vor der Tür. • Was gibt es morgen in der Mensa? • Fahrräder anlehnen verboten! • Ich würde gerne mal auf dem Mond spazieren gehen. • 5−7 • Dieser Satz ist falsch. 4 2 N Christian Goldbach, ∗ 1690 in Königsberg (Preußen), † 1764 in Moskau, war ein deutscher Mathematiker. Er formulierte die nach ihm benannte Vermutung 1742 in einem Brief an den überaus erfolgreichen Mathematiker Leonhard Euler, ∗ 1707 in Basel, † 1783 in St. Petersburg. Die Goldbach-Vermutung ist bis heute weder bewiesen noch widerlegt, sie stellt eines der bedeutendsten offenen Probleme der Zahlentheorie dar. 3 Pierre de Fermat, ∗ Beginn des 17. Jh., † 1665, war ein französischer Mathematiker. Er formulierte die Aussage des Großen Satzes von Fermat 1637 so allgemein wie oben angegeben, lieferte aber nur für den Fall n = 4 einen expliziten Beweis. Euler konnte die Aussage für den Fall n = 3 beweisen. In ihrer Allgemeinheit blieb die Aussage aber bis Mitte der 1990er Jahre eines der berühmtesten ungelösten Probleme der Mathematik - und wurde von daher auch als Fermatsche Vermutung bezeichnet. Erst dann gelang es dem britischen Mathematiker Andrew Wiles, ∗ 11. April 1953 in Cambridge, assistiert von seinem ehemaligen Doktoranden Richard Taylor, ∗ 19. Mai 1962, die Fermatsche Vermutung zu beweisen. 4 Bertrand Russell, ∗ 18. Mai 1872, † 2. Februar 1970, war ein britischer Philosoph, Mathematiker und Logiker. Mit einer Variante des angegebenen Satzes, nämlich der Formulierung Ein Barbier rasiert alle Männer seines Dorfes, die sich nicht selbst rasieren erschütterte er zu Beginn des 20. Jahrhunderts viele Mathematiker: Hatte er doch hiermit einen Satz formuliert, der weder wahr noch falsch war. Bis dahin hatte man geglaubt, jedem Satz eindeutig einen der Wahrheitswerte falsch oder wahr zuordnen zu können. 1.2 Verknüpfungen (Junktionen) 9 Im Folgenden werden wir Aussagen oft durch lateinische Großbuchstaben A, B, C, . . . abkürzen. Das sieht dann beispielsweise aus wie folgt: A := 7 ist eine Primzahl“. ” (1.1) Auf Seite 3 war uns das um den Doppelpunkt erweiterte Gleichheitszeichen, also das Symbol :=, schon einmal begegnet. Dort wurde hierdurch das auf der Seite des Doppelpunktes stehenden Symbol N durch die rechts des Gleichheitszeichens stehende Menge {1, 2, 3, . . .} der natürlichen Zahlen definiert. Allgemein verwendet man das Symbol := (lies: [. . . ] ist definitionsgemäß gleich [. . . ]), um einen links des Doppelpunktes stehenden (bis dahin unbekannten) Ausdruck durch den rechts des Gleichheitszeichens stehenden bekannten Ausdruck zu definieren; anders ausgedrückt: Man weist dem links stehenden und bis dahin bedeutungslosen Ausdruck den rechts stehenden, bereits mit Bedeutung versehenen, Ausdruck zu. Andere Beispiele hierfür sind x := 5, y := −7 und z := (x + y)2. Nachdem den Variablen x und y die Werte 5 und 7 zugewiesen worden sind, erhält man z = 4. An dieser Stelle steht übrigens nur noch ein gewöhnliches Gleichheitszeichen, weil diese Gleichheit keine Definition mehr ist, sondern direkt aus den Zuweisungen der konkreten Werte zu den Variablen x und y und aus der Definition von z folgt. 5 Nach der Zuweisung (1.1) können wir sagen, dass A eine wahre Aussage ist, oder dass A wahr ist, oder - noch kürzer -, dass A gilt. Hätten wir dagegen die Definition A := 8 ist eine Primzahl“ vorgenommen, wäre A eine falsche Aussage gewesen. ” 1.2 Verknüpfungen (Junktionen) (Verschiedene) Aussagen können mittels bestimmter Symbole, sogenannter Junktoren 6 (oder auch Konnektoren 7 ), zu neuen Aussagen verknüpft werden. Für uns sind die fünf Junktoren ¬, ∧, ∨, ⇒, ⇔ von größter Bedeutung. Dabei unterscheidet man den einstelligen Junktor ¬, der auf eine Aussage angewendet wird, von den zweistelligen Junktoren ∧, ∨, ⇒ und ⇔, die jeweils auf ein Paar aus zwei Aussagen angewendet werden. Sind A und B Aussagen, so können wir aus diesen per Junktion also beispielsweise die Ausdrücke ¬A (oder ¬B), A ∧ B, B ∧ A, A ∧ A, B ∨ B, A ⇒ B, A ⇒ A oder B ⇔ A bilden. (Beachten Sie, dass hier keineswegs gefordert wird, dass die beiden Aussagen, auf die die zweistelligen Junktoren angewendet werden, verschieden voneinander sind! Die Wirkungsweise eines Junktors ist in gewisser Weise mit der Wirkungsweise des + - Zeichens vergleichbar: Seine Anwendung macht nur Sinn, wenn (mindestens) zwei Zahlen zur Addition vorliegen, aber diese beiden müssen natürlich nicht verschieden voneinander sein!) 5 Es sei noch angemerkt, dass das Symbol := auch umgekehrt werden kann: Der neu zu erklärende Ausdruck hat einfach immer nur auf der Seite des Doppelpunktes zu stehen. Das oben gegebene Beispiel hätte man also auch durch 7 ist eine Primzahl“ =: A beschreiben können. ” 6 lat. iungere = verknüpfen, verbinden 7 engl. to connect = verknüpfen, verbinden 1.2 Verknüpfungen (Junktionen) 10 Wichtige Einzelheiten zum sprachlichen Umgang mit den ersten vier Junktoren lassen sich Tabelle 1.1 entnehmen; hier seien A und B beliebige Aussagen. Für konkrete Aussagen erhalten wir damit Beispiel 1.2. Junktor Name der Junktion Sprechweise ¬ ¬A: Negation (von A) ∧ A ∧ B: Konjunktion (von A und B) ∨ A ∨ B: Disjunktion (von A und B) ⇒ A ⇒ B: Implikation (von A und B) nicht A“ ” A und B“ ” A oder B“ ” aus A folgt B“ oder ” wenn A, dann B“ oder ” A ist hinreichend für B“ oder ” B ist notwendig für A“. ” Tabelle 1.1: Junktionen und ihre Sprechweisen. Beispiel 1.2 A Sei A := Madrid ist die Hauptstadt von Spanien“, B := Madrid ist die Hauptstadt von ” ” Schweden“ und C := Madrid ist die Hauptstadt von Deutschland“. ” Dann ist A wahr, und B und C sind falsch. Außerdem ist 1. (¬A) = Madrid ist nicht die Hauptstadt von Spanien“,8 ” 2. (A ∧ B) = Madrid ist die Hauptstadt von Spanien und (Madrid ist die Hauptstadt von) ” Schweden“, 3. (A ∨ C) = Madrid ist die Hauptstadt von Spanien oder (Madrid ist die Hauptstadt ” von) Deutschland“, 4. (B ∨ C) = Madrid ist die Hauptstadt von Schweden oder (Madrid ist die Hauptstadt ” von) Deutschland“, 5. (B ⇒ A) = wenn Madrid die Hauptstadt von Schweden ist, dann ist Madrid die ” Hauptstadt von Spanien“. B Sei P := xy bereitet sich auf die Klausur vor“, Q := xy besteht die Klausur“. Dann kann ” ” sowohl P als auch Q wahr oder falsch sein.9 Wir betrachten einige Junktionen von P und Q: 1. (¬P ) = xy bereitet sich nicht auf die Klausur vor“, ” 8 An dieser Stelle steht das Gleichheitszeichen = ohne den Doppelpunkt, weil die Aussage ¬A nicht mehr definiert werden muss, sondern sich, nachdem A bereits eine Aussage zugewiesen wurde, aus dieser Zuweisung und der Definition der Negation ergibt. 9 Wir gehen hier davon aus, dass es sich bei P um eine Aussage handelt, obwohl dies sicher diskussionswürdig ist. 1.2 Verknüpfungen (Junktionen) 11 2. (P ∧ Q) = xy bereitet sich auf die Klausur vor und besteht sie“, ” 3. (P ⇒ Q) = wenn sich xy auf die Klausur vorbereitet, besteht xy die Klausur“. ” Die 3. Aussage ist - vom gesunden Menschenverstand her - sicherlich falsch, wenn xy durch die Klausur durchfällt (also Q falsch ist), obwohl sich darauf vorbereitet wurde (also P wahr ist). Aber wie steht es um den Wahrheitsgehalt der Aussage, wenn xy sich nicht auf die Klausur vorbereitet (also P falsch ist) und die Klausur besteht oder nicht besteht? Wir kommen darauf in Kürze zurück. C Sei S := Ptolemäus 10 hat Recht“ und T := Die Sonne dreht sich um die Erde“. ” ” Interessant sind die Junktionen 1. (S ⇒ T ) = wenn Ptolemäus Recht hat, dreht sich die Sonne um die Erde“ und ” 2. (S ⇒ ¬T ) = wenn Ptolemäus Recht hat, dreht sich die Sonne nicht um die Erde“. ” R N In einer Implikation A ⇒ B bezeichnet man die erste Aussage A als Voraussetzung, Prämisse oder hinreichende Bedingung für B, die zweite Aussage B als Folgerung, Konklusion oder notwendige Bedingung für A. Auf die zuletzt genannte Bezeichnungsweise werden wir in Abschnitt 1.5 noch einmal zurückkommen. Junktionen von Aussagen sind selber wieder Aussagen, können also wahr oder falsch sein. In der zweiwertigen Aussagenlogik, mit der wir uns hier befassen, wird ein Junktor dadurch definiert, dass man angibt, wie der Wahrheitsgehalt einer nur diesen Junktor enthaltenden Junktion vom Wahrheitsgehalt der in ihr vorkommenden Aussagen abhängt. Die konkreten Aussagen sind dabei völlig irrelevant (diese Eigenschaft nennt man auch Extensionalitätsprinzip). Zur Verdeutlichung betrachten wir ein Beispiel: Die Konjunktion Die Sonne ist größer als ” Saturn und Saturn ist größer als die Erde“ soll als wahr betrachtet werden, weil beide Teilaussagen, Die Sonne ist größer als Saturn“ und Saturn ist größer als die Erde“, wahr sind. ” ” Dagegen soll die Konjunktion Die Sonne ist größer als Saturn und die Erde ist größer als ” Saturn“ als falsch betrachtet werden, weil hier eine wahre und eine falsche Aussage mit und verknüpft wird. Völlig analog wird aber auch die Konjunktion Wale sind Säugetiere und Am” seln sind Vögel“ aus den beiden wahren Teilaussagen Wale sind Säugetiere“ und Amseln ” ” sind Vögel“ als wahr betrachtet, wohingegen Wale sind Säugetiere und Amseln sind Amphi” bien“ als falsch ausgewertet wird, weil die zweite Aussage jetzt falsch ist. Zur Auswertung der Konjunktion betrachten wir also nicht den konkreten Inhalt der beteiligten Teilaussagen, sondern nur deren Wahrheitsgehalt! Im Zuge dieser Abstraktion werden wir im Folgenden 10 Claudius Ptolemäus, ∗ um 100 n. Chr. in Ägypten, † um 175 n. Chr., vermutlich in Alexandria, war Mathematiker, Geograph, Astronom, Astrologe, Musiktheoretiker und Philosoph. Ptolemäus schrieb eine heute als Almagest bezeichnete Abhandlung zur Mathematik und Astronomie in 13 Büchern. Sie war bis zum Ende des Mittelalters ein Standardwerk der Astronomie und enthielt eine Darstellung des geozentrischen Weltbildes, das später nach ihm Ptolemäisches Weltbild genannt wurde. 1.2 Verknüpfungen (Junktionen) 12 Aussagenvariablen einführen: Das sind Variablen 11 , die nur genau einen der Wahrheitswerte w oder f annehmen können; der Variabilitätsbereich von Aussagenvariablen ist also die Menge, die genau diese beiden Elemente enthält. Für gewöhnlich werden wir Aussagenvariablen mittels lateinischer Kleinbuchstaben p, q, r, s, . . . benennen. Anstelle von Ausdrücken wie A∧B, in denen A und B irgendwelche Aussagen sind, betrachten wir also Ausdrücke wie p ∧q, in denen p und q Aussagenvariablen sind, also jeweils die Werte w und f annehmen können. Aufgrund dieser Abstraktion ist es nun möglich, Junktoren mittels sogenannter Wahrheitstafeln zu definieren; das sind Tabellen, in denen in jeder Zeile genau eine mögliche Belegung der in einer Junktion vorkommenden Aussagenvariablen mit einem der Wahrheitswerte w oder f enthalten ist, und in der alle diese möglichen Belegungen vorkommen. Tabelle 1.2 stellt die Wahrheitstafel für die Negation dar. Die Definition der zweistelligen Junktoren ∧, ∨ und ⇒ ist in der Wahrheitstafel 1.3 angegeben. p ¬p w f f w Tabelle 1.2: Wahrheitstafel zur Definition der Negation. p q p∧q p∨q p⇒q w w w w w w f f w f f w f w w f f f f w Tabelle 1.3: Wahrheitstafel zur Definition der zweistelligen Junktoren ∧, ∨ und ⇒. R Das Symbol ∨ bezeichnet kein ausschließendes oder (im Sinne von entweder ... oder ...). Ist beispielsweise E := Ich esse ein Brötchen“ und F := Ich trinke einen Kaffee“, so ” ” ist E ∨ F auch wahr, wenn ich ein Brötchen esse und dazu einen Kaffee trinke. Schauen wir uns jetzt Junktionen unserer Aussagen aus Beispiel 1.2 auf ihren Wahrheitsgehalt hin an: 11 Der Begriff der Variablen soll hier nicht formal exakt definiert werden. Wir verstehen darunter ein Zeichen, für welches beliebige Ausdrücke einer bestimmten Art eingesetzt werden können. Variablen haben also selber keine Bedeutung, aber sie zeigen an, an welchen Stellen bedeutungsvolle Objekte einzusetzen sind. Unter dem Variabilitätsbereich einer Variablen versteht man die Menge aller Elemente, die für die Variable eingesetzt werden dürfen. Häufig ist dies eine Zahlenmenge, etwa N oder R, im Fall von Aussagenvariablen sind es die beiden Wahrheitswerte w und f . 1.2 Verknüpfungen (Junktionen) 13 Fortsetzung von Beispiel 1.2 A Nach Definition ist 1. (¬A) = Madrid ist nicht die Hauptstadt von Spanien“ falsch, ” 2. (A ∧ B) = Madrid ist die Hauptstadt von Spanien und Schweden“ auch falsch, ” 3. (A ∨ C) = Madrid ist die Hauptstadt von Spanien oder Deutschland“ wahr, ” 4. (B ∨ C) = Madrid ist die Hauptstadt von Schweden oder Deutschland“ falsch, ” 5. (B ⇒ A) = wenn Madrid die Hauptstadt von Schweden ist, dann ist Madrid die ” Hauptstadt von Spanien“ wahr (!), denn B ist falsch und jede Implikation aus etwas Falschem ist wahr, 5⋆. (A ⇒ B) = wenn Madrid die Hauptstadt von Spanien ist, dann ist Madrid die Haupt” stadt von Schweden“ falsch, denn A ist wahr und B ist falsch. B Zu den Punkten 1. und 2. muss wohl nichts gesagt werden. 3. (P ⇒ Q) = wenn xy sich auf die Klausur vorbereitet, besteht xy die Klausur“ : Diese ” Aussage ist gemäß der Definition der Implikation nur falsch, wenn P wahr und Q falsch ist, xy sich also auf die Klausur vorbereitet und trotzdem nicht besteht (unser gesunder Menschenverstand sagte uns dies auch ganz genauso). C Da Ptolemäus nicht Recht hat, sind sowohl 1. (S ⇒ T ) = wenn Ptolemäus Recht hat, dreht sich die Sonne um die Erde“ und ” 2. (S ⇒ ¬T ) = wenn Ptolemäus Recht hat, dreht sich die Sonne nicht um die Erde“ ” wahr. Dass S ⇒ T richtig ist, stimmt mit unseren umgangssprachlichen Gewohnheiten überein! Zu akzeptieren, dass auch die zweite Aussage richtig sein soll, fällt vielleicht etwas schwerer. Es macht aber wenig Sinn, sich über diesen Aspekt zu wundern oder gar aufzuregen - die Definition der Junktoren ist im Prinzip willkürlich, wir müssen damit einfach den Vorgaben entsprechend umgehen. Zu Beginn dieses Abschnitts war erwähnt worden, dass für uns auch der Junktor ⇔ wichtig sein würde. Bisher ist uns der aber nicht begegnet, das wollen wir jetzt nachholen. Junktor ⇔ Name der Junktion Sprechweise p ⇔ q: Äquivalenz (von p und q) p ist äquivalent zu q“ oder ” q genau dann, wenn p“ oder ” q dann und nur dann, wenn p“ ” Tabelle 1.4: Zu den Sprechweisen der Äquivalenz. 1.2 Verknüpfungen (Junktionen) 14 Bezugnehmend auf unsere oben behandelten Beispiele erhalten wir mit den Vereinbarungen aus Tabelle 1.4 zum sprachlichen Umgang mit dem Äquivalenz-Junktor 12 folgende Aussagen: A 6. (A ⇔ C) = Madrid ist die Hauptstadt von Spanien genau dann, wenn Madrid die ” Hauptstadt von Deutschland ist“, B 4. (P ⇔ Q) = xy besteht die Klausur genau dann, wenn sich xy darauf vorbereitet“. ” Wie sich in Tabelle 1.4 schon angedeutet hat, soll durch den ⇔-Junktor eine Äquivalenz, also Gleichwertigkeit, von zwei Aussagen ausgedrückt werden. Konkret soll das bedeuten, dass die Gültigkeit (bzw. Ungültigkeit) der einen Aussage die Gültigkeit (bzw. Ungültigkeit) der jeweils anderen Aussage nach sich zieht. So erklären sich die Einträge in der die Äquivalenz definierenden Wahrheitstafel 1.5. p q p⇔q w w w w f f f w f f f w Tabelle 1.5: Wahrheitstafel zur Definition der Äquivalenz. Demnach ist A 6. (A ⇔ C) = Madrid ist die Hauptstadt von Spanien genau dann, wenn Madrid die ” Hauptstadt von Deutschland ist“ falsch, denn A ist wahr, C aber nicht, B 4. (P ⇔ Q) = xy besteht die Klausur genau dann, wenn xy sich darauf vorbereitet“ nur ” wahr, wenn P und Q entweder beide wahr oder beide falsch sind. Ist P falsch und Q wahr (d.h., dass sich xy nicht auf die Klausur vorbereitet und sie dennoch besteht), so ist P ⇒ Q zwar wahr, P ⇔ Q aber falsch. Übrigens ist auch eine Aussage wie Die Elbe fließt durch Hamburg genau dann, wenn 3 + 2 = ” 5 ist“ wahr, weil ja beide Teilaussagen wahr sind; inhaltlich brauchen diese Bestandteile miteinander nichts zu tun zu haben. Das Symbol ⇔ für die Äquivalenz ist keineswegs zufällig gewählt: Tatsächlich hat p ⇔ q, in Abhängigkeit der Wahrheitswerte von p und q, die gleichen Wahrheitswerte wie (p ⇒ q)∧(q ⇒ p). In Tabelle 1.6 lässt sich das einfach ablesen (3. und 6. Spalte). Die Aussage p ⇔ q ist also wahr, wenn die Aussage p die Aussage q impliziert und die Aussage q die Aussage p impliziert; ist diese Konjunktion nicht wahr, so ist auch p ⇔ q falsch. Daher zeigt der Implikationspfeil im Äquivalenzsymbol in beide Richtungen. Sprachlich wird dieser Tatsache durch die alternativen Formulierungen p gilt genau dann, wenn q gilt oder p gilt dann und nur dann, wenn q gilt Rechnung getragen (siehe Tabelle 1.4). 12 lat. aequus = gleich und valenz = Wertigkeit, Äquivalenz bedeutet also Gleichwertigkeit 1.3 Tautologien und Kontradiktionen 15 p q p⇔q p⇒q q⇒p (p ⇒ q) ∧ (q ⇒ p) (p ⇔ q) ⇔ (p ⇒ q) ∧ (q ⇒ p) w w w w w w w w f f f w f w f w f w f f w f f w w w w w Tabelle 1.6: Zur Bedeutung der Äquivalenz. Durch die letzte Spalte der Wahrheitstafel in Tabelle 1.6 wird belegt, dass die aussagenlogische Formel 13 p ⇔ q äquivalent ist zu der Formel (p ⇒ q) ∧ (q ⇒ p), denn die Aussagen p ⇔ q und (p ⇒ q) ∧ (q ⇒ p) haben ja für jede mögliche Kombination von w und f für p und q den gleichen Wahrheitswert. Genauso richtig wäre es aber auch zu sagen, dass (p ⇒ q) ∧ (q ⇒ p) äquivalent ist zu p ⇔ q (klar?!); daher sagt man allgemeiner auch, dass die beiden Aussagen p ⇔ q und (p ⇒ q) ∧ (q ⇒ p) äquivalent zueinander sind. 1.3 Tautologien und Kontradiktionen In diesem Abschnitt sollen die Begriffe Tautologie und Kontradiktion eingeführt werden: Definition 1.1 Sind mehrere Aussagenvariablen p, q, r, . . . gegeben, aus denen durch Junktion(en) aussagenlogische Formeln φ und ψ gebildet werden 14 , so nennt man (a) φ eine Tautologie (oder allgemeingültige Aussage) genau dann, wenn φ für alle möglichen Wahrheitswerte der Aussagenvariablen p, q, r, . . . wahr ist, (b) φ eine Kontradiktion genau dann, wenn φ für alle möglichen Wahrheitswerte der Aussagenvariablen p, q, r, . . . falsch ist, (c) die Aussagen φ und ψ logisch gleichwertig oder logisch äquivalent genau dann, wenn die Aussage φ ⇔ ψ eine Tautologie ist. In diesem Fall schreibt man auch φ ≡ ψ. Für die Wahrheitswertbestimmung können demnach logisch äquivalente Aussagen durcheinander ersetzt werden. Dies ist eine ganz wichtige Beobachtung, von der wir im Folgenden noch sehr oft Gebrauch machen werden! Insbesondere wird uns diese Tatsache ermöglichen, auf den ersten Blick recht komplizierte aussagenlogische Formeln durch sehr viel einfachere zu ersetzen. 13 Eine aussagenlogische Formel ist eine aussagenlogische Verknüpfung sogenannter atomarer Formeln. Dabei setzt sich die Menge atomarer Formeln aus allen Aussagenvariablen und den beiden Wahrheitswerten w und f (aufgefasst als Aussagenvariablen mit nur je einem möglichen Wert) zusammen. Durch aussagenlogische Verknüpfung dieser Ausgangsobjekte kann man kompliziertere aussagenlogische Ausdrücke, sozusagen Moleküle, bilden. Diese kann man dann wieder verknüpfen, deren Resultate wieder, usw., usw. 14 Da die lateinischen Buchstaben für die Bezeichnungen in der Mathematik oft nicht ausreichen, verwendet man auch das griechische Alphabet, und zwar die großen wie die kleinen Buchstaben! Machen Sie sich also mit der Schreibweise und Aussprache vertraut (siehe Tabelle 1.8). 1.3 Tautologien und Kontradiktionen 16 In Tabelle 1.6 haben wir die Tautologie (p ⇔ q) ⇔ (p ⇒ q) ∧ (q ⇒ p) (1.2) nachgewiesen, es ist also (p ⇔ q) ≡ (p ⇒ q) ∧ (q ⇒ p) . Ein anderes, einfaches Beispiel für eine Tautologie ist die Formel p ∨ (¬p), (1.3) wie man anhand der Wahrheitstafel 1.7 sieht. p ¬p p ∨ ¬p w f w f w w Tabelle 1.7: Wahrheitstafel für das Prinzip vom ausgeschlossenen Dritten. (1.3) bezeichnet man auch als das Prinzip vom ausgeschlossenen Dritten, denn innerhalb der hier von uns studierten Aussagenlogik gibt es nur genau zwei Wahrheitswerte: Für jede Aussage A gilt, dass entweder sie selbst oder ihre Negation ¬A wahr ist. Weitere einfache, aber wichtige Tautologien, die Sie an elementare Rechenregeln bezüglich der Addition und Multiplikation in N erinnern dürften, sind: (K∧) (p ∧ q) ⇔ (q ∧ p) (Kommutativität von ∧) (K∨) (p ∨ q) ⇔ (q ∨ p) (A∧) (p ∧ q) ∧ r ⇔ p ∧ (q ∧ r) (A∨) (p ∨ q) ∨ r ⇔ p ∨ (q ∨ r) (DI) p ∨ (q ∧ r) ⇔ (p ∨ q) ∧ (p ∨ r) (DII) p ∧ (q ∨ r) ⇔ (p ∧ q) ∨ (p ∧ r) (DN) ¬(¬p) ⇔ p (Kommutativität von ∨) (Assoziativität von ∧) (Assoziativität von ∨) (Distributivität I) (Distributivität II) (Doppelnegation). Überzeugen Sie sich hiervon selbst durch Aufstellen der entsprechenden Wahrheitstafeln! Sie sollten mir übrigens generell nichts glauben, was ich Ihnen ohne Beweis einfach so dahin schreibe (weder hier im Skript noch an der Tafel) - das kritische Lesen ist mitunter zwar mühsam, aber unabdingbar für einen soliden Verstehensprozess! Ein Beispiel für eine Kontradiktion ist die Formel p ∧ (¬p), die auch als Prinzip vom ausgeschlossenen Widerspruch bezeichnet wird. Unabhängig vom Wahrheitswert von p und damit erst recht unabhängig von der durch p repräsentierten Aussage ist die Konjunktion einer Aussage und ihres Gegenteils immer falsch. 1.3 Tautologien und Kontradiktionen Name Alpha Beta Gamma Delta Epsilon Zeta Eta Theta Iota Kappa Lambda Mu Nu Xi Omikron Pi Rho Sigma Tau Ypsilon Phi Chi Psi Omega Kleinbuchstabe α β γ δ ǫ, ε ζ η θ, ϑ ι κ λ µ ν ξ o π ρ, ̺ σ, ς τ υ φ, ϕ χ ψ ω 17 Großbuchstabe A B Γ ∆ E Z E Θ I K Λ M N Ξ O Π P Σ T Υ Φ X Ψ Ω Tabelle 1.8: Das griechische Alphabet. Bevor wir im nächsten Abschnitt eine Familie von besonders wichtigen Tautologien studieren wollen, seien ein paar Worte zur Klammersetzung bei Verknüpfungen von Aussagen bzw. Aussagenvariablen gesagt. Der Übersichtlichkeit zuliebe treffen wir folgende Vereinbarungen: • Klammern werden weggelassen, wenn der Wahrheitswerteverlauf der betrachteten Formel von der Klammersetzung nicht abhängt. Beispielsweise können wir also wegen der Assoziativität der Konjunktion p ∧ q ∧ r anstelle von (p ∧ q) ∧ r oder p ∧ (q ∧ r) schreiben. • ¬ bindet stärker als ∧, ∨, ⇒ und ⇔: Anstelle von (¬p) ∧ q schreiben wir also ¬p ∧ q. Zu unterscheiden hiervon ist ¬(p ∧ q)! • ∧ und ∨ bindet stärker als ⇒ und ⇔: Beispielsweise schreiben wir anstelle von (¬p) ∨ q ⇔ (p ⇒ q) kürzer ¬p ∨ q ⇔ (p ⇒ q). Beachten Sie, dass wir hier die hinteren Klammern nicht weglassen dürfen! Wir haben ja keine Bindungspriorisierung für ⇒ und ⇔ vereinbart. 1.4 De Morgansche Gesetze 1.4 18 De Morgansche Gesetze In diesem Abschnitt widmen wir uns der Verneinung von Konjunktion und Disjunktion. Konjunktion Es gilt folgende Tautologie: ¬(p ∧ q) ⇔ ¬p ∨ ¬q. (1.4) In Worten: ¬(p ∧ q) ist genau dann wahr, wenn ¬p oder ¬q wahr ist; anders ausgedrückt ist p ∧ q ist genau dann falsch, wenn p oder q falsch ist. Dies ist plausibel, wie folgendes Beispiel verdeutlicht: Nehmen Sie einmal an, Sie wollten eine Straße überqueren. Ist dann P := rechts ” ist frei“ und Q := links ist frei“, so gehen Sie sicher erst los, wenn P ∧ Q gilt. Anders ” ausgedrückt: Sie gehen nicht los, wenn P oder Q falsch ist, also von mindestens einer Seite ein Fahrzeug kommt. Mathematisch überzeugen wir uns von der Richtigkeit von (1.4), indem wir die entsprechende Wahrheitstafel aufstellen (Tabelle 1.9). p q p∧q ¬(p ∧ q) ¬p ¬q ¬p ∨ ¬q ¬(p ∧ q) ⇔ (¬p ∨ ¬q) w w w f f f f w w f f w f w w w f w f w w f w w f f f w w w w w Tabelle 1.9: Zur Negation der Konjunktion. Disjunktion Es gilt folgende Tautologie: ¬(p ∨ q) ⇔ ¬p ∧ ¬q. (1.5) Von der Richtigkeit dieser Aussage überzeugen Sie sich in den Übungen. Die Aussagen (1.4) und (1.5) bezeichnet man als die de Morganschen Gesetze15 . Sie stellen eine Möglichkeit dar, durch Verwendung von Negationen eine Konjunktion durch eine Disjunktion und eine Disjunktion durch eine Konjunktion darzustellen, nämlich wie folgt 16 : p ∧ q ⇔ ¬ ¬(p ∧ q) ⇔ ¬(¬p ∨ ¬q), p ∨ q ⇔ ¬ ¬(p ∨ q) ⇔ ¬(¬p ∧ ¬q). Insbesondere kann man also die Formel p ∨ q als eine Junktion darstellen, in der nur die Junktoren ¬ und ∧ vorkommen. Der Vollständigkeit halber sei ohne Beweis ein Satz angegeben, der diesen Sachverhalt verallgemeinert: 15 Augustus de Morgan, ∗ 27. Juni 1806 in Madurai, Indien, † 18. März 1871 in London, war englischer Mathematiker und Mitbegründer der formalen Logik. 16 Hier wird implizit die Transitivität der Äquivalenz verwendet: Diese besagt, dass, wenn φ ≡ ψ und ψ ≡ χ, auch φ ≡ χ gilt. Überzeugen Sie sich hiervon wieder selbst durch Aufstellen der entsprechenden Wahrheitstafel! 1.5 Implikation und Kontraposition 19 Satz 1.1 Sei φ eine aussagenlogische Formel. Dann gibt es eine zu φ logisch äquivalente aussagenlogische Formel ψ, in der nur die Junktoren ∧ und ¬ vorkommen. Beweis: Siehe [MM11], S. 142f. 1.5 Implikation und Kontraposition Im letzten Abschnitt haben wir die Konjunktion und die Disjunktion negiert. Nun wollen wir untersuchen, was es bedeutet, die Implikation zu negieren. Zunächst überzeugen wir uns dazu von folgender Tautologie: (p ⇒ q) ⇔ ¬p ∨ q. (1.6) (Nachweis in den Übungen.) Beispiel 1.3 Sei P := Ich komme mit ins Kino“ und Q := Ich bin pünktlich“. Dann ist P ⇒ Q die ” ” Aussage wenn ich ins Kino mitkomme, bin ich pünktlich“. Was leiten Sie aus einer derartigen ” Information im realen Leben ab? Wohl, dass Sie auf jeden Fall nicht lange vor dem Kino warten müssen - wenn die betreffende Person nicht pünktlich ist, wird sie gar nicht erscheinen. Anders ausgedrückt: Die Person ist pünktlich oder sie kommt nicht mit ins Kino - und das entspricht der Aussage Q ∨ ¬P bzw. ¬P ∨ Q, wie in (1.6) behauptet. N Diese logisch äquivalente Formulierung für p ⇒ q illustriert besser, warum die Implikation p ⇒ q wahr ist, wenn p falsch ist: Ist nämlich p falsch, so ist ¬p wahr und damit ¬p ∨ q unabhängig vom Wahrheitswert von q auch wahr. Intuitiv verständlich ist auch die Tautologie ¬(p ⇒ q) ⇔ p ∧ ¬q, (1.7) von deren Richtigkeit Sie sich auch in den Übungen überzeugen werden. Folgt also nicht aus der Richtigkeit von p die von q, so ist das gleichbedeutend damit, dass p wahr und q falsch ist. Auch dies wollen wir an einem Beispiel verdeutlichen: Beispiel 1.4 Sei E := Das Küchenutensil ab ist ein Besteckteil“ und F := Das Küchenutensil ab ist eine ” ” Gabel“. Dann ist offensichtlich - egal, ob ab nun wirklich eine Gabel ist oder nicht - F ⇒ E wahr. Dagegen ist E ⇒ F nicht wahr, wenn ab zum Beispiel ein Löffel ist. In diesem Fall ist also ¬(E ⇒ F ) wahr. Und tatsächlich ist der Löffel ab ein Besteckteil (E ist also wahr) und keine Gabel (¬F ist also auch wahr). Die Implikation E ⇒ F ist also falsch, wenn die Voraussetzung E zwar erfüllt ist, die Folgerung F aber nicht eintritt. Logisch, oder? N Nun kommen wir zur Kontraposition, die sich für das spätere Beweisen als sehr nützlich erweisen wird. Definition 1.2 Die Kontraposition von p ⇒ q ist die Implikation ¬q ⇒ ¬p. 1.6 Aussageformen 20 Die entscheidende Tatsache ist nun die, dass eine Implikation und ihre Kontraposition logisch äquivalent sind, d.h. es gilt (p ⇒ q) ≡ (¬q ⇒ ¬p). (1.8) R (Auch hiervon überzeugen Sie sich in den Übungen.) R Die Kontraposition ¬q ⇒ ¬p von p ⇒ q ist nicht zu verwechseln mit der Umkehrung q ⇒ p von p ⇒ q! Betrachten wir zur Illustration wieder die Aussagen aus Beispiel 1.4. Die Kontraposition der wahren Aussage F ⇒ E (also wenn ab eine Gabel ist, dann ist ” ab auch ein Besteckteil“ ) ist die ebenso wahre Aussage ¬E ⇒ ¬F (also wenn ab kein ” Besteckteil ist, ist es auch keine Gabel“). Die Umkehrung E ⇒ F ist dagegen (wie oben bereits erläutert) beispielsweise nicht richtig, wenn ab ein Löffel oder ein Messer ist. Die Tautologie (1.8) ist der Grund für die in Tabelle 1.1 bereits einmal erwähnte alternative Sprechweise für die Implikation p ⇒ q: q ist notwendig für p“: Gilt nämlich q nicht, ” so gilt p auch nicht, d.h., p kann höchstens gelten, wenn q auch gilt. Aber Achtung: Dass q gilt, ist keine Garantie für die Gültigkeit von p. Letzteres wäre die Aussage q ⇒ p, also genau die Umkehrung von p ⇒ q. Und nun noch einmal alles zusammen: p ⇒ q spricht sich als p ist hinreichend für q“ oder als q ist notwendig für p“, ” ” p ⇐ q spricht sich als p ist notwendig für q“ oder als q ist hinreichend für p“, ” ” p ⇔ q spricht sich folglich als p ist notwendig und hinreichend für q“; genauso richtig ” wäre aber auch die Formulierung q ist notwendig und hinreichend für p“. ” An diese Begrifflichkeiten sollten Sie sich so schnell wie möglich gewöhnen! 1.6 Aussageformen Aussageformen stehen in engem Zusammenhang mit den oben ausführlich behandelten Aussagen. Hierbei handelt es sich um sprachliche oder schriftliche Konstrukte, die eine oder mehrere Variablen enthalten und die zu einer Aussage werden, wenn man alle Variablen durch jeweils ein Element aus ihrem Variabilitätsbereich ersetzt. Ich will Ihnen ein Beispiel geben, um dies zu konkretisieren. Beispiel 1.5 A Sei x eine Variable mit Variabilitätsbereich N und P (x) := x ist eine Primzahl“. ” Auf der rechten Seite dieser Zuweisung steht ein Satz, der wahr ist, wenn man für die Variable x den Zahlenwert 7 einsetzt, jedoch falsch ist, wenn man anstelle dessen den Wert 8 einsetzt. Von diesem Satz ist also nicht zu entscheiden, ob er wahr oder falsch ist, bevor man die Variable x durch einen konkreten Wert aus dem Variabilitätsbereich von x ersetzt hat. B Seien a, b, c Variablen mit Variabilitätsbereich R. Dann ist D(a, b, c) := a2 + b2 = c2 1.7 Quantoren 21 eine Aussageform, die beispielsweise immer dann wahr ist, wenn es sich bei a und b um die beiden Katheten in einem rechtwinkligen Dreieck und bei c um dessen Hypotenuse handelt (wie heißt der entsprechende Satz?!). N Allgemein schreibt man eine Aussageform 17 also als A(x1 , . . . , xn ), wobei x1 , . . . , xn die in der Aussageform frei vorkommenden Variablen bezeichnen (hierbei ist n eine beliebige natürliche Zahl). Durch Ersetzen aller Variablen durch konkrete Elemente aus deren Variabilitätsbereich(en) erhält man dann eine Aussage, deren Wahrheitsgehalt in der Regel von der Wahl der eingesetzten Elemente abhängt. Ebenso wie Aussagen können Aussageformen mittels der oben eingeführten Junktoren zu sehr komplex verknüpften Aussageformen werden. Die Bestimmung von deren Wahrheitsgehalt ist natürlich immer nur in Abhängigkeit der für die Variablen eingesetzten Werte möglich. 1.7 Quantoren Neben den bislang behandelten Junktoren ¬, ∧, ∨, ⇒, ⇔ sind für uns noch zwei sogenannte Quantoren18 von großer Bedeutung, der Allquantor ∀ und der Existenzquantor ∃. Durch ihren Einsatz lassen sich aus einer Familie von Aussageformen Aussagen machen. Informationen zur Verwendung der Symbole und zur Sprechweise sind Tabelle 1.10 zu entnehmen 19 . Darin ist A(x) eine beliebige Aussage und V(x) der Variabilitätsbereich von x, also die Gesamtheit aller Werte, die man für die Variable x einsetzen kann. Die Konvention darüber, Quantor Schreibweise Sprechweise bzw. Bedeutung ∀ ∀ x ∈ V(x) : A(x) ∃ ∃ x ∈ V(x) : A(x) für alle x in V(x) gilt A(x)“ ” es existiert ein x in V(x), für welches A(x) gilt“ ” Tabelle 1.10: Zum Gebrauch der Quantoren. wann eine Allaussage ∀ x ∈ V(x) : A(x) bzw. eine Existenzaussage ∃ x ∈ V(x) : A(x) wahr oder falsch ist, stimmt mit unserem intuitiven Verständnis für diesen Sachverhalt überein: Die Allaussage ist wahr, falls A(x) für alle möglichen Werte x aus dem Variabilitätsbereich V(x) dieser Variable wahr ist, die Existenzaussage ist wahr, falls man mindestens ein x in V(x) angeben kann, für welches die Aussage A(x) wahr ist. 17 Eine Aussageform A(x) mit einer Variablen x beschreibt eine Eigenschaft, die für die für x einzusetzenden Objekte vorliegen oder nicht vorliegen kann - die durch Einsetzen entstehende Aussage ist ja wahr oder falsch. Man sagt, dass die Variable x auf diese Weise ein Prädikat erhält und nennt die Theorie der Aussageformen daher auch Prädikatenlogik; sie ist als Erweiterung der bisher behandelten Aussagenlogik zu verstehen. 18 lat. quantum = wie viel 19 Das Elementsymbol ∈ werden wir im folgenden Kapitel im Kontext der Mengenlehre genau besprechen. Man liest es (enthalten) in. 1.7 Quantoren 22 Beispiel 1.6 A Für jede natürliche Zahl n sei U(n) die Aussageform n ist ungerade“. Dann kann man ” eine wahre Aussage U wie folgt definieren: U := ∀ Primzahlen > 2 : U(n). Wichtig ist zu bemerken, dass U, obwohl es aus Aussageformen gebildet worden ist, selber keine Aussageform mehr ist. Die freie Variable n aus der Aussageform U(n) wurde durch den Einsatz des Allquantors sozusagen gebunden - U enthält keine Variable mehr. B Sei, für alle natürlichen Zahlen x, die Aussage E(x) := x + 5 = 7 erklärt. Weiter sei E := ∃ x ∈ N : E(x). Dann ist, wie eben, E keine Aussageform mehr, sondern eine Aussage. Deren Richtigkeit können wir belegen, indem wir mindestens eine natürliche Zahl x angeben, für die E(x) richtig ist, hier also x = 2. C Ist für alle natürlichen Zahlen m und n die Aussageform B(m, n) := m ≥ n2 definiert, so ist beispielsweise B(10, 3) wahr und B(24, 5) falsch. Wenn wir die Aussage, dass es zu jeder natürlichen Zahl n eine natürliche Zahl m gibt, so dass m ≥ n2 ist, formal ausdrücken wollen, tun wir das mittels der Quantoren wie folgt: G := ∀ n ∈ N : ∃ m ∈ N : m ≥ n2 . Dieses Konstrukt ist nun wieder keine Aussageform mehr! Durch die Quantifizierung mittels zweier Quantoren sind die beiden vorher freien Variablen m und n in der Aussageform B(m, n) gebunden worden. Wir können also entscheiden, ob G wahr ist oder falsch: Tatsächlich ist G wahr, man muss nur für jedes natürliche n für m den Wert m = n2 wählen. Die folgenden beiden Beispiele versteht man völlig analog hierzu: D ∃ n ∈ N : ∀ m ∈ 2N : n ≤ m (nämlich n = 1). E ∀ n ∈ N : ∀ m ∈ N : ∃ t ∈ N : m + n = t. Kürzer kann man das auch schreiben, indem man die Variablen mit übereinstimmenden Variabilitätsbereichen, die demselben Quantor unterworfen werden, gemeinsam hinter den entsprechenden Quantor schreibt: ∀ m, n ∈ N : ∃ t ∈ N : m + n = t. N Mithilfe der beiden genannten Quantoren lassen sich also aus Aussageformen Aussagen machen. Generell gilt, dass man durch den Einsatz eines Quantors je eine freie Variable binden kann. Hat man also eine Aussageform mit n freien Variablen, so muss man mindestens n Quantoren einsetzen, um hieraus eine Aussage zu machen. Derartig konstruierte Aussagen können natürlich auch negiert werden; dabei ist wichtig, dass ∃ und ∀ ihre Rollen tauschen. Bevor wir dies formal aufschreiben, betrachten wir ein realitätsnahes Beispiel. 1.7 Quantoren 23 Beispiel 1.7 Sei K := alle Studierenden haben eine Matrikelnummer“. Die Negation dieser Aussage ist si” cherlich ¬K = es gibt (mindestens) eine(n) Studierenden, die oder der keine Matrikelnummer ” hat.“ Wollen wir uns mit einer formalen Umsetzung dieses Beispiels versuchen, so müssen wir für einen Augenblick auf die Mengenlehre vorgreifen: Sei S die Menge aller Studierenden und für jedes s ∈ S (also für jede(n) spezielle(n) Studierende(n) s) M(s) die Aussageform s hat eine ” Matrikelnummer“. Dann können wir K und ¬K wie folgt beschreiben: K = ∀ s ∈ S : M(s)“ ” ¬K = ∃ s ∈ S : ¬M(s)“. ” Sei nun L := es gibt eine(n) Studierende(n), die oder der schon einmal im Lotto gewonnen ” hat“. Dann ist ¬L = es gibt keine(n) Studierende(n), die oder der schon einmal im Lotto ” gewonnen hat“ = alle Studierenden haben noch nie im Lotto gewonnen“. Definieren wir ” nun für jedes s ∈ S die Aussageform N(s) := s hat schon einmal im Lotto gewonnen“, so ” schreiben sich L und ¬L formal als L = ∃ s ∈ S : N(s)“ ” ¬L = ∀ s ∈ S : ¬N(s)“. ” N In einem Satz halten wir die allgemeine Regel für die Negation von Existenz- bzw. Allaussagen fest: Satz 1.2 Im Folgenden sei x eine Variable mit Variabilitätsbereich V(x) und A(x) eine Aussageform. Für die Verneinung von Existenz- und Allaussagen gelten folgende Regeln: ¬(∀ x ∈ V(x) : A(x)) ⇔ ∃ x ∈ V(x) : ¬A(x), ¬(∃ x ∈ V(x) : A(x)) ⇔ ∀ x ∈ V(x) : ¬A(x). (1.10) (1.11) Beweis: Einen Beweis für diese beiden Aussagen werden wir im nächsten Kapitel mittels Mengen führen. Zum Abschluss dieses Abschnitts sei noch eine Ergänzung zu den Tautologien gegeben: Wir hatten gelernt, dass Tautologien aussagenlogische Formeln sind, die allein aufgrund ihrer logischen Struktur immer wahr sind, unabhängig davon, welche Wahrheitswerte die einzelnen Bausteine der Formel haben. Derartige Konstrukte sind also auch dann immer wahr, wenn man die einzelnen Aussagenvariablen, die in einer solchen Formel verknüpft werden, durch Aussageformen ersetzt. Da die Formel für alle Elemente aus dem Variabilitätsbereich der Aussageform richtig ist, kann man auf diese Weise geschickt richtige Aussagen für sehr viele verschiedene Situationen formulieren. 1.8 Beweistechniken 1.8 24 Beweistechniken Wir knüpfen jetzt an die Einleitung an, in der bereits erwähnt wurde, dass der wohl gravierendste Unterschied zwischen Uni-Mathematik“ und Schul-Mathematik“ die axiomatische ” ” Methode ist, nach der wissenschaftlich gearbeitet wird. Abb. 1.1 Eine mathematische Theorie als Baum. Um diese Methode zu veranschaulichen, stellen wir uns einen Baum oder einen großen Strauch vor (siehe Abbildung 1.1): Dessen Wurzelwerk umfasst alle Axiome einer mathematischen Theorie 20 : Axiome sind Aussagen, die selber weder zu beweisen noch zu widerlegen sind, die aber das Initialgefüge für eine durch logische Argumente aufzubauende Theorie darstellen; sie werden sozusagen als wahr festgesetzt. Die Gesamtheit dieser Axiome bezeichnen wir in unserem Bild mit A. Im Stamm und in der Baumkrone befinden sich alle Aussagen, die sich durch logische Schlüsse aus Aussagen in A ableiten lassen und die daher auch als wahre Aussagen bezeichnet werden 21 . Die Gesamtheit aller wahren Aussagen bezeichnen wir als Wahrheiten“ und kürzen sie mit W ab (insbesondere ist also A in W enthalten). Zu jeder ” Aussage W aus W gibt es demnach eine Kette A1 → A2 → . . . → An → W (hierbei ist n eine 20 21 Das Wort Axiom kommt aus dem Griechischen und bedeutet als wahr angenommener Grundsatz. Streng genommen müsste man statt wahr immer wahr bezüglich des Axiomensystems A sagen. 1.8 Beweistechniken 25 nichtnegative ganze Zahl 22 - im Bild gilt n = 5) von Aussagen, an deren Ende W steht und für deren Glieder A1 , . . . , An und W , i.F. stellvertretend A genannt, jeweils eines der folgenden Kriterien erfüllt ist (vgl. [Fri07], S. 28 f.): 1. A ist ein Axiom aus der Menge A. 2. A ist eine Definition. Damit führt A nur eine neue Bezeichnung für etwas bereits Bekanntes ein. 3. A ist eine Tautologie, also eine allgemeingültige Aussage. 4. A entsteht aus einer bereits als wahr nachgewiesen, aus mehreren Teilen bestehenden, Aussage B, indem man eine Teilaussage aus B durch eine äquivalente Aussage ersetzt. Man spricht in diesem Zusammenhang vom Ersetzungsprinzip. 5. Es gibt in der Kette vor A eine Aussage B und die Implikation B ⇒ A. Zur Erläuterung dieses Kriteriums sei folgendes gesagt: Es ist einfach sich zu überlegen, dass die Implikation p ∧ (p ⇒ q) ⇒ q eine Tautologie ist. Diese heißt auch Abtrennungsregel, weil sie es mit sich bringt, dass aus der Richtigkeit einer Aussage B und der Richtigkeit der zusammengesetzten Aussage B ⇒ A die Richtigkeit der allein stehenden Aussage A folgt. Als direktes Beweisverfahren 23 (für die Richtigkeit der Aussage B) trägt diese Tautologie den Namen modus ponens 24 . 6. A ist eine wahre Existenz- oder Allaussage. Die Kette A1 → A2 → . . . → An → W bezeichnet man dann als Beweis für die Aussage W . Um schriftlich auszudrücken, dass W durch logische Schlüsse aus dem Axiomensystem A ableitbar ist, schreibt man A ⊢ W. Die mathematischen Wahrheiten“, also die Elemente aus W, lassen sich in zwei Kategorien ” einteilen: Die Axiome und die Definitionen bedürfen keines logischen Beweises, alle übrigen Aussagen jedoch haben den Charakter einer mathematischen Behauptung und müssen mehr oder weniger aufwändig bewiesen werden. Diese Behauptungen werden meistens in Form von Sätzen, manchmal auch in Form von Lemmata25 oder Korollaren26 formuliert. Die folgenden Ausführungen sollen dazu dienen, einige grundlegende Beweistechniken für derartige Aussagen vorzustellen und an Beispielen zu demonstrieren. 22 Ist W ein Axiom aus A, so ist n = 0; da die Indizes der Kettenglieder Ai aufsteigend sind und bei 1 beginnen, kann für n = 0 vernünftig keine Vorkette“ A1 → . . . → An = A0 gebildet werden. Diese ” Unmöglichkeit“ ist so zu interpretieren, dass die Vorkette“ die Länge 0 hat, also gar nicht existiert. ” 23 ” Auf die Details eines direkten Beweises kommen wir in Kürze zu sprechen. 24 lat. modus = Schlussfigur, ponere = stellen, setzen; diese Bezeichnung soll andeuten, dass durch das Setzen einer Annahme, hier B, unter der Voraussetzung B ⇒ A, eine zweite Aussage, nämlich A, gesetzt wird. 25 Ein Lemma ist eine mathematische Aussage, die den Charakter eines Hilfssatzes hat. Die entsprechende Aussage wird also formuliert, um mit ihrer Hilfe später einen anderen, evtl. bedeutenderen Satz zu beweisen. Das Wort Lemma ist griechischen Ursprungs, ληµµα bedeutet Einnahme, Annahme, der Plural von Lemma ist Lemmata, mitunter wird jedoch auch von Lemmas geredet. 26 Ein Korollar ist eine mathematische Aussage, die den Charakter einer Folgerung hat. Die entsprechende Aussage wird also als Konsequenz einer anderen Behauptung, meist eines Satzes, formuliert. Das Wort Korollar ist lateinischen Ursprungs, corollarium bedeutet Zugabe, Geschenk. 1.8 Beweistechniken 26 Zunächst werden wir lernen, wie man eine Implikation A ⇒ B beweisen kann: Dieses Wissen benötigen wir zum einen, um das Ersetzungsprinzip anwenden zu können: Hier muss ja zunächst die Äquivalenz der gegenseitig auszutauschenden Aussagen nachgewiesen worden sein (wir erinnern uns, dass die Äquivalenz p ⇔ q logisch gleichwertig ist zu der Konjunktion aus den beiden Implikationen p ⇒ q und q ⇒ p). Zum anderen ist dieses Wissen für die Anwendung der Abtrennungsregel, in der ja gleich zwei Implikationen enthalten sind, relevant. Im Anschluss daran werden wir uns überlegen, wie man Existenzaussagen (der Form ∃ x ∈ V(x) : A(x)) bzw. Allaussagen (der Form ∀ x ∈ V(x) : A(x)) aus einem Axiomensystem ableiten kann. 1.8.1 Zum Beweisen von Implikationen Will man nachweisen, dass eine Implikation A ⇒ B eine wahre Aussage ist, so muss man zeigen, dass (a) A falsch ist oder (b) - falls A wahr ist -, auch B wahr ist. Der Fall (a) ist an dieser Stelle inhaltlich uninteressant (weil hier nichts zu zeigen ist - die Implikation ist dann ja immer wahr); wir wollen im Folgenden also davon ausgehen, dass die Prämisse wahr ist; dann muss noch gezeigt werden, dass damit auch B gültig ist. Hierfür gibt es im Wesentlichen drei verschiedene Methoden, nämlich die des 1. direkten Beweises, 2. indirekten Beweises, 3. Widerspruchsbeweises. Die Methoden unter 2. und 3. sind eng miteinander verwandt und werden mitunter gar nicht richtig unterschieden. Sie werden jedoch erkennen, dass es durchaus einen nennenswerten, vielleicht kleinen, aber feinen Unterschied gibt! Nun zu den Methoden im Einzelnen: 1. Direkter Beweis Beim direkten Beweis von A ⇒ B schlussfolgert man aus aus der Gültigkeit von A die Gültigkeit einer Aussage Z1 , daraus die Gültigkeit einer Aussage Z2 , daraus die Gültigkeit einer Aussage Z3 usw., bis man schließlich aus der Gültigkeit einer Aussage Zn auf die Gültigkeit von B schließen kann - hierbei ist n eine nichtnegative ganze Zahl, die die Anzahl an Zwischenschritten angibt, die benötigt werden, um B aus A zu folgern. Im Fall n = 0 schließt man ohne Umwege aus A auf B: Wir demonstrieren das einmal an einem Beispiel: Beispiel 1.8 Behauptung: Wenn m eine reelle, von 0 verschiedene Zahl ist, ist die Gleichung mx + 3 = 5 in der Unbekannten x lösbar. 1.8 Beweistechniken 27 Setzen wir A := m 6= 0, B := ∃ x ∈ R : mx + 3 = 5, so ist die Behauptung gleichbedeutend mit der Implikation A ⇒ B, die nun bewiesen werden soll: Beweis: Sei Z1 := ∃ x ∈ R : mx = 2. Elementare Rechenregeln liefern die Richtigkeit von A ⇒ Z1 ; in Z1 kann man mit der Voraussetzung nämlich x = m2 wählen. Die Richtigkeit der Implikation Z1 ⇒ B wird durch eine Addition von 3 auf beiden Seiten der Gleichung mx = 2 begründet. Insgesamt haben wir damit also (A ⇒ Z1 ) ∧ (Z1 ⇒ B) (1.12) bewiesen. Kürzer schreibt man (1.12) übrigens als A ⇒ Z1 ⇒ B. Die Transitivität der Implikation liefert dann die gewünschte Aussage. In der Praxis wird man den Beweis, nachdem man etwas Übung hat, so kleinschrittig nicht aufschreiben - hier würde man sich etwa auf Folgendes beschränken: Beweis: m 6= 0 ⇒ ∃ x ∈ R : mx = 2 (nämlich x = 2 ) m ⇒ ∃ x ∈ R : mx + 3 = 5. Es kann durchaus passieren, dass das Schließen von B aus A nicht so schnell geht wie im vorangegangenen Beispiel, wo die Anzahl n der Zwischenschritte nur 1 betrug. Aber unabhängig von der Anzahl der durchzuführenden Zwischenschritte ist allen direkten Beweisen von A ⇒ B gemein, dass man die Gültigkeit von A annimmt und hieraus durch eine Kette von logischen Schlüssen (und unter Verwendung bereits bewiesener oder bekannter Tatsachen) bei der Behauptung B ankommt. Übrigens muss man bei diesem Vorgehen die Voraussetzung A nicht unbedingt im ersten Beweisschritt schon verwenden. 2. Indirekter Beweis Beim indirekten Beweis der Aussage p ⇒ q macht man Gebrauch von der Äquivalenz (1.8): (p ⇒ q) ≡ (¬q ⇒ ¬p). Statt p ⇒ q nachzuweisen, zeigt man die Gültigkeit der logisch gleichwertigen Kontraposition ¬q ⇒ ¬p: Man nimmt also ¬q an und schließt hieraus durch eine Kette logischer Argumente auf ¬p. 1.8 Beweistechniken R 28 Der indirekte Beweis einer Aussage ist also der direkte Beweis ihrer Kontraposition. Auch dies wollen wir einmal an einem Beispiel demonstrieren; hierbei handelt es sich um die Umkehrung der Behauptung in Beispiel 1.8: Beispiel 1.9 Behauptung: Sei m eine reelle Zahl. Wenn die Gleichung mx + 3 = 5 in der Unbekannten x lösbar ist, ist m 6= 0. Verwenden wir die Abkürzungen A und B aus dem vorangegangenen Beispiel, so ist jetzt die Implikation B ⇒ A zu zeigen. Wir wollen das indirekt beweisen, also betrachten wir die Kontraposition ¬A ⇒ ¬B = Ist m = 0, so ist die Gleichung mx + 3 = 5 in der Unbekannten x nicht lösbar.“ ” Formal ist übrigens (mit der Regel (1.11) für die Negation des Existenzquantors) ¬A = m = 0, ¬B = ∀ x ∈ R : mx + 3 6= 5. Die Kontraposition ¬A ⇒ ¬B beweisen wir nun direkt: Beweis: Sei m = 0. Dann ist mx + 3 = 0x + 3 = 3. Damit ist die Gleichung mx + 3 = 5 äquivalent zu der Gleichung 3 = 5. Da diese Aussage falsch ist, ist auch die Gleichheit mx+3 = 5 falsch, und zwar für jeden möglichen Wert von x. Das entspricht ¬B. Die Gleichung ist also nicht lösbar. Bemerkung 1.1 Die Kombination der Behauptungen in Beispiel 1.8 und 1.9 liefert die Äquivalenz der Lösbarkeit der Gleichung mx + 3 = 5 in der Unbekannten x und der Ungleichung m 6= 0. Denn mit A ⇒ B und B ⇒ A gilt auch A ⇔ B. Darauf werden wir gleich noch zurückgreifen. 3. Widerspruchsbeweis Wie bereits angedeutet, stellt der Widerspruchsbeweis eine Variante des indirekten Beweises dar: Und zwar hat man hier zusätzlich zu den Aussagen A und B noch eine Aussage Φ, von der man sicher weiß, dass sie stimmt27 . Damit ist die Implikation Φ ⇒ (A ⇒ B) (1.15) dann und nur dann wahr, wenn die Konklusion A ⇒ B wahr ist. Es reicht also, die Richtigkeit der Implikation (1.15) nachzuweisen. Und dies tut man indirekt, d.h. man beweist (1.7) ¬(A ⇒ B) ⇒ ¬Φ ≡ A ∧ ¬B ⇒ ¬Φ. (1.16) Da man zeigt, dass aus der Annahme, dass die Prämisse A die Aussage B nicht nach sich zieht, eine falsche Aussage (nämlich ¬Φ) folgt, nennt man dieses Beweisverfahren Beweis 27 Diese wahre Aussage Φ ist in aller Regel nicht zu Beginn der Überlegungen zum Beweis bekannt - auf sie stößt man während der Beweisführung eher zufällig. 1.8 Beweistechniken 29 durch Widerspruch bzw. Widerspruchsbeweis. Denn die Konklusion ¬Φ steht natürlich im Widerspruch zu der wahren Aussage Φ - Sie erinnern sich an die Kontradiktion Φ ∧ ¬Φ vom ausgeschlossenen Widerspruch?! Bevor wir Beispiele betrachten, seien zwei wichtige Vorteile dieser Methode genannt. (1.) Obwohl man A ⇒ B zeigen will und eigentlich ja nur eine Voraussetzung, nämlich A, zur Verfügung hat, kann man während des Beweises die zweite Aussage ¬B verwenden. (2.) Im Vorhinein muss man nicht wissen, wie Φ zu definieren ist. Diese große Unbekann” te“, die das Verfahren im Moment vielleicht noch etwas undurchsichtig erscheinen lässt, offenbart ihre Natur für gewöhnlich ganz von alleine. R Unter Anfängerinnen und Anfängern wird zwischen indirektem Beweis und Widerspruchsbeweis oft nicht ganz sorgfältig unterschieden. Während sie beim indirekten Beweis von ¬B ausgehen, um ¬A nachzuweisen, gehen sie beim Widerspruchsbeweis von ¬B ∧ A aus, um eine falsche Aussage herbeizuführen. Sollte diese falsche Aussage darin bestehen, dass sie ¬A schlussfolgern (was ja nicht sein darf, weil sie von A ausgegangen waren), war der Beweis nur dann wirklich ein Widerspruchsbeweis, wenn Sie die Aussage A bei der Beweisführung wirklich verwendet haben! Wenn Sie einfach nur aus ¬B auf ¬A schließen konnten, war der Beweis indirekt! Beispiel 1.10 Zunächst beweisen wir einmal die Behauptung in Beispiel 1.9 durch Widerspruch. Um mit den Bezeichnungen möglichst nah an der gerade gegebenen Beschreibung bleiben zu können, treffen wir neue Zuweisungen: Sei A∗ := ∃ x ∈ R : mx + 3 = 5, B ∗ := m 6= 0. Dann ist A∗ ⇒ B ∗ zu beweisen. Um das durch Widerspruch zu tun, gehen wir von A∗ ∧ ¬B ∗ aus und schlussfolgern hieraus eine falsche Aussage: Beweis: Angenommen, es existiert ein x ∈ R, sagen wir x′ , mit mx′ + 3 = 5 (das ist A∗ ) und es gilt m = 0 (das ist B ∗ ). Dann gilt mx′ + 3 = 0x′ + 3 = 5, also 3 = 5. Hier ist also ¬Φ die Aussage 3 = 5 und damit Φ die Aussage 3 6= 5, die ohne jeden Zweifel wahr ist. Auf Φ sind wir tatsächlich durch die Beweisführung gestoßen“, im Vorhinein war ” uns die Bedeutung der Ungleichung für den Beweis nicht bewusst. N Wie Sie im letzten Beispiel sehen konnten, wird das Ende eines Widerspruchsbeweises mitunter durch einen Pfeil () statt durch das Quadrat () oder die Abkürzung q.e.d. (siehe Fußnote auf Seite 4) abgeschlossen. Nun wollen wir noch ein weiteres Beispiel betrachten: 1.8 Beweistechniken 30 Beispiel 1.11 Behauptung: Sei m eine reelle Zahl. Wenn die Gleichung mx + 3 = 5 in der Unbekannten x lösbar ist, ist die Lösung eindeutig 28 bestimmt. Mit A∗ wie im vorangegangenen Beispiel und C := die Lösung der Gleichung mx + 3 = 5 ist eindeutig“ ” haben wir die Implikation A∗ ⇒ C nachzuweisen. Im Prinzip müssen wir also von A∗ ∧ ¬C ausgehen und daraus eine falsche Aussage ableiten. Da A∗ jedoch äquivalent ist zu B ∗ (siehe Bemerkung 1.1), können wir genauso gut von B ∗ ∧ ¬C ausgehen und daraus den Widerspruch ableiten. Das soll im Folgenden getan werden: Beweis: Angenommen, die Gleichung mx + 3 = 5 ist lösbar, also m 6= 0, und es existieren (mindestens) zwei verschiedene Lösungen x1 , x2 , also x1 6= x2 , für die Gleichung; dann gilt mx1 + 3 = 5, mx2 + 3 = 5. (Diese Voraussetzungen entsprechen A∗ ∧ ¬B.) Hieraus folgt nun mx1 + 3 = mx2 + 3, was nach Subtraktion von 3 auf beiden Seiten der Gleichung zu mx1 = mx2 führt. Eine weitere Subtraktion von mx2 auf beiden Seiten der Gleichung und die Anwendung des Distributivgesetzes liefert dann die Identität m(x1 − x2 ) = 0. (1.17) Nach Voraussetzung A∗ , die äquivalent ist zu B ∗ , gilt m 6= 0. Also können wir in (1.17) durch m teilen. Das liefert x1 − x2 = 0 ⇔ x1 = x2 . Die Identität x1 = x2 steht aber im Widerspruch zu der Voraussetzung, dass es zwei verschiedene Lösungen zu der Gleichung gibt. Damit muss unsere Voraussetzung ¬(A∗ ⇒ C) ≡ (A∗ ∧ ¬C) falsch gewesen sein - und die Implikation A∗ ⇒ C also korrekt! In diesem Fall hat man also aus der Aussage A∗ ∧ ¬C auf C, und damit insbesondere auf ¬Φ := ¬C ∧ C geschlossen. Damit gilt hier Φ = C ∨ ¬C, was, unabhängig von der speziellen Bedeutung von C, wahr ist. Der Vollständigkeit halber sei auch noch ein indirekter Beweis für die letzte Behauptung, also A∗ ⇒ C angegeben: Beweis: Angenommen, es gibt zwei verschiedene Lösungen x1 6= x2 ∈ R (das ist ¬C). Dann folgt aus mx1 + 3 = 5 = mx2 + 3 die Gleichheit m(x1 − x2 ) = 0, die - wegen x1 − x2 6= 0 - die Gleichung m = 0 nach sich zieht 29 . Doch m = 0 ist ¬B ∗ und damit äquivalent zu ¬A∗ . 28 Neben Existenzbeweisen spielen Eindeutigkeitsbeweise eine ganz wichtige Rolle in der mathematischen Theorie. Oft sind Existenz- und Eindeutigkeitsaussagen sogar innerhalb eines Satzes kombiniert, z. Bsp. immer dann, wenn die Existenz einer eindeutig bestimmten Lösung behauptet wird. 29 Wäre x1 − x2 = 0, so dürfte durch diese Differenz nicht geteilt werden. 1.8 Beweistechniken 1.8.2 31 Zum Beweisen von Existenz- und Allaussagen Für den Beweis einer Existenzaussage der Form ∃ x ∈ V(x) : A(x) ist ein entsprechendes Element x ∈ V(x) mit der gewünschten Eigenschaft A(x) anzugeben: Mit unserer oben eingeführten Schreibweise ⊢ für die Ableitbarkeit aus dem Axiomensystem lässt sich die Beweisregel wie folgt darstellen: Wenn A ⊢ a ∈ V(x) , dann A ⊢ ∃ x ∈ V(x) : A(x). und A ⊢ A(a) Beispiel 1.12 Behauptung: ∃ z ∈ Z : z 3 − z 2 + z = −39. 30 Beweis: Wir wissen (bzw. werden lernen), dass a := −3 eine ganze Zahl ist. Für dieses a ist A(a) := z 3 − z 2 + z = −39 wahr. Gibt es übrigens noch andere Möglichkeiten für die Wahl von a? N Ein ähnliches Schema wie für Existenzaussagen lässt sich auch für Allaussagen der Form ∀ x ∈ V(x) : A(x) aufstellen: Wenn A ⊢ x ∈ V(x) ⇒ A(x) (mit einem Beweis, der von x gar nicht abhängt bzw. für alle x gleichermaßen gilt), dann A ⊢ ∀ x ∈ V(x) : A(x). Hierzu betrachten wir ein Beispiel: Beispiel 1.13 Behauptung: Wenn n eine gerade natürliche Zahl ist, so ist n2 auch eine gerade natürliche Zahl. Formaler würde die Behauptung so formuliert werden: ∀ n ∈ N : n gerade ⇒ n2 gerade. (1.20) Wenn wir davon ausgehen, dass n eine Variable mit Variabilitätsbereich N ist, ist A(n) := n ” ist eine gerade natürliche Zahl“ wahr für alle n ∈ 2N und falsch sonst. Setzt man B(n) := n2 ist eine gerade natürliche Zahl“, muss man zeigen, dass für alle n ∈ N die Implikation ” A(n) ⇒ B(n) gilt: Sofern n ungerade ist, ist dies trivial 31 ; daher gehen wir jetzt davon aus, dass n eine beliebige, aber fest gewählte, gerade Zahl ist: 30 Mit Z bezeichnen wir die Menge der ganzen Zahlen, es ist also Z := {. . . , −3, −2, −1, 0, 1, 2, 3, . . .}. lat. trivialis = jedermann zugänglich, altbekannt; als trivial bezeichnen Mathematiker eine Schlussfolgerung, die als sehr leicht zu erfassen angesehen wird. Die Einschätzung darüber, was trivial ist und was nicht, ist aber natürlich sehr subjektiv. Gerade Anfängerinnen und Anfänger sollten mit dieser Begrifflichkeit außerordentlich vorsichtig umgehen und im Zweifel lieber einen Beweisschritt zu viel als zu wenig ausführen. In diesem Zusammenhang möchte ich Ihnen das lesenswerte Buch Das ist o. B. d. A. trivial! von Albrecht Beutelspacher, [Beu09], empfehlen. 31 1.8 Beweistechniken 32 Definieren wir Z1 (n) := ∃ k ∈ N : n = 2k, so ist A(n) ⇒ Z1 (n) per Definition des Begriffs gerade Zahl richtig. Mit Z2 (n) := ∃ k ∈ N : n2 = 4k 2 gilt Z1 (n) ⇒ Z2 (n) aufgrund des Potenzgesetzes (a · b)x = ax · bx , das im Falle positiver Zahlen a, b für alle reellen Exponenten x (insbesondere also für x = 2) gültig ist. Mit Z3 (n) := ∃ k ∈ N : n2 = 2 · (2k 2 ) liefern die Zerlegung von 4 in 2 · 2 und das Assoziativgesetz der Multiplikation die Schlussfolgerung Z2 (n) ⇒ Z3 (n). Da mit k ∈ N auch 2k 2 ∈ N gilt (dies steht im Zusammenhang mit der sogenannten Abgeschlossenheit von N bzgl. der Multiplikation, wir werden darüber noch im Detail sprechen), folgt hieraus mit Z4 (n) := ∃ l ∈ N : n2 = 2l sofort die Implikation Z3 (n) ⇒ Z4 (n). Die Definition des Begriffs gerade Zahl liefert dann, wie oben, die Richtigkeit von Z4 (n) ⇒ B(n). Zusammengefasst und in Kurzschreibweise dargestellt haben wir also folgendes bewiesen: A(n) ⇒ Z1 (n) ⇒ Z2 (n) ⇒ Z3 (n) ⇒ Z4 (n) ⇒ B(n). (1.21) Aufgrund der Transitivität der Implikation folgt aus (1.21) die Richtigkeit von A(n) ⇒ B(n). (1.22) Da wir bei der Begründung von (1.22) nirgends die konkrete Form von n verwendet haben, sondern den Beweis für ein beliebiges gerades n durchgeführt haben, können wir hieraus die Allaussage ∀ n ∈ 2N := {2n : n ∈ N} : n gerade ⇒ n2 gerade (1.23) folgern; wie oben bereits erörtert, ist ∀ n ∈ 2N − 1 := {2n − 1 : n ∈ N} : n gerade ⇒ n2 gerade (1.24) auch wahr (die Prämisse ist ja immer falsch!). Die Zusammensetzung von (1.23) und (1.24) liefert dann die Behauptung (1.20). N Sofern es um Allaussagen der Form ∀ n ∈ N : A(n) geht und kein für alle natürlichen Zahlen n gleichermaßen gültiger Beweis für A(n) zu führen ist, kann das Beweisprinzip der vollständigen Induktion, auf das wir im Zusammenhang mit der Definition der Menge der natürlichen Zahlen noch sehr genau eingehen werden, von großer Bedeutung sein. R Sehr wichtig ist an dieser Stelle folgende Bemerkung: Will man eine Allaussage widerlegen - also ihre Negation verifizieren -, so muss man gemäß (1.10) nur ein Gegenbeispiel angeben! Betrachten wir zur Verdeutlichung mal die Aussage R := ∀ x ∈ Z : x2 > 0. 1.8 Beweistechniken 33 Um zu beweisen, dass R falsch ist, beweisen wir, dass ¬R wahr ist; dabei ist ¬R = ∃ x ∈ Z : x2 ≤ 0. Und diese Behauptung wird tatsächlich durch das Element x = 0 ∈ Z erfüllt. Diese Bemerkung ist so wichtig, weil einzig und allein Existenzaussagen durch Angabe eines Beispiels bewiesen werden können! Vielleicht erscheint Ihnen diese kurze Charakterisierung mathematischer Beweismethoden sehr abstrakt. Zugegebenermaßen mutet sie mir jetzt beim Schreiben auch etwas kompliziert an aber ich wollte Ihnen einmal möglichst genau erklärt haben, was es heißt, eine mathematische Behauptung zu beweisen. Für die Praxis wird Ihnen viel Übung deutlich mehr nützen als die hiesigen Ausführungen. Und von daher werden Sie in den Hausaufgaben noch viel Gelegenheit bekommen, das Beweisen zu trainieren! Kapitel 2 Mengen Nun ist es an der Zeit, den schon mehrfach genannten Begriff der Menge genauer unter die Lupe zu nehmen. 2.1 Begriffsklärung Eine genaue Definition des Mengenbegriffs können und wollen wir an dieser Stelle nicht vornehmen - der Aufwand für einen derartigen Versuch stünde in keinem Verhältnis zu dem Nutzen, den wir daraus ziehen könnten. Wir halten es hier eher wie mit den Aussagen: Wir wollen mit Mengen umgehen können, ohne uns ganz genau festzulegen, was eine Menge eigentlich ist. Für unser Verständnis ist die folgende, auf den großen deutschen Mathematiker Georg Cantor 1 zurückgehende Festlegung völlig ausreichend: R Eine Menge ist eine Zusammenfassung von wohlbestimmten und wohlunterschiedenen Objekten unseres Denkens oder unserer Anschauung zu einem Ganzen. 2 Statt von Objekten spricht man heute von Elementen einer Menge. In Cantors Festlegung bedeutet • wohlbestimmt, dass es eindeutig feststellbar ist, ob ein Objekt/Element x zu einer Menge M gehört (in Zeichen x ∈ M, in Worten x ist Element von M“) oder nicht (in ” Zeichen x ∈ / M, in Worten x ist nicht Element von M“), ” • wohlunterschieden, dass jedes Objekt/Element maximal einmal in einer Menge vorkommt. Schauen wir uns erstmal ein paar Beispiele an: 1 Georg Ferdinand Ludwig Philipp Cantor, ∗ 1845 in Sankt Petersburg, † 1918 in Halle an der Saale, gilt als der Begründer der Mengenlehre. 2 Diese Festlegung ist keine Definition im eigentlichen mathematischen Sinne, da der neue Begriff Menge nicht auf schon vorher definierte und damit bekannte Begriffe zurückgeführt wird. So ist beispielsweise nicht präzise geklärt, was Objekte unseres Denkens oder unserer Anschauung überhaupt sind. 34 2.1 Begriffsklärung 35 Beispiel 2.1 A Die Menge aller Studienanfängerinnen und Studienanfänger an der Uni Hamburg im Wintersemester 2011/12, B die Menge aller geraden Zahlen, C die Menge aller Studierenden, die heute mit dem Fahrrad zum Geomatikum gekommen sind, D die Menge aller Buchstaben, aus denen das Wort MATHEMATIK gebildet wird, E die Menge N der natürlichen Zahlen. N Die mathematische Angabe einer Menge kann auf verschiedene Weisen erfolgen: Besonders geeignet ist die Darstellung mittels einer Aussageform: Dazu sei A(x) eine Aussageform mit einer freien Variablen x mit Variabilitätsbereich V(x). Dann schreibt sich die Menge M aller Elemente x, für die die Aussage A(x) wahr ist, als M = {x ∈ V(x) : A(x)}. (2.1) Man sagt, M ist die Menge aller x mit (der Eigenschaft) A(x). In diesem Fall gilt also R A(x) ⇔ x ∈ M, ¬A(x) ⇔ x ∈ / M. (2.2) Beachten Sie, dass - anders als bisher - A(x) in der Mengendefinition (2.1) nicht nur als Aussage (x ist ja hinter dem Doppelpunkt fest, also ist A(x) eine Aussage), sondern als wahre Aussage interpretiert wird; anstelle der vielleicht unmissverständlicheren, aber länglicheren Formulierung {x ∈ V(x) : A(x) ist wahr} beschreibt man die Menge nur wie in (2.1) angegeben. Diese Interpretation werden wir im Folgenden der Übersichtlichkeit halber auch in anderen Situationen übernehmen. Haben wir also bisher immer gesagt/geschrieben die Aussage A ist wahr, so formulieren wir anstelle dessen künftig nur noch A gilt oder noch kürzer A. Wenn Sie schriftlich ausdrücken wollen, dass die Summe aus 5 und 3 die Zahl 8 ergibt, so schreiben Sie ja auch nur die Gleichung 5 + 3 = 8 auf und nicht den Satz 5+3=8 ist eine wahre Aussage. Mit anderen Worten: Von allen Aussagen nehmen wir zukünftig - sofern nicht ausdrücklich etwas anderes gesagt wird an, dass sie wahr sind! Beispiel 2.2 A R+ := {x ∈ R : x > 0} (das ist die Menge aller positiven reellen Zahlen); hier ist V(x) = R und A(x) = x > 0. B 2N := {x ∈ N : ∃ k ∈ N : x = 2k} (das ist die Menge der geraden natürlichen Zahlen); hier ist V(x) = N und A(x) = ∃ k ∈ N : x = 2k. C M := {x ∈ Z : 3 teilt x − 1} (das ist die Menge aller ganzen Zahlen, die beim Teilen durch 3 den Rest 1 lassen); hier ist V(x) = Z und A(x) = 3 teilt x − 1“. ” N 2.1 Begriffsklärung R 36 Statt {x ∈ N : ∃ k ∈ N : x = 2k} schreibt man häufig kürzer {2k : k ∈ N}. Analog könnte man z. Bsp die Menge aller ganzen Zahlen, die beim Teilen durch 4 den Rest 3 lassen, durch {z ∈ Z : ∃k ∈ Z : z = 4k + 3} oder durch {4k + 3 : k ∈ Z} =: 4Z + 3 beschreiben. Alternativ kann man die Elemente einer Menge aufzählen; auch in diesem Fall schreibt man die einzelnen Elemente (durch Kommata voneinander getrennt) zwischen die sogenannten Mengenklammern { und }. Beispiel 2.3 A M := {1, 3, 5, 7, 9} ist die Menge aller ungeraden Zahlen zwischen 0 und 10. B {M, A, T, H, E, I, K} ist die Menge aus Beispiel 2.1 D . C N := {1, 2, 3, 4, 5, . . .} ist die Menge der natürlichen Zahlen. N Enthält eine Menge nur endlich viele Elemente - man spricht dann von einer endlichen Menge -, ist diese Form der Darstellung unkritisch. Das letzte Beispiel zeigt aber, dass man mitunter auch Mengen mit unendlich vielen Elementen, sogenannte unendliche Mengen, auf diese Art und Weise beschreiben will. In solch einem Fall kann die Aufzählung natürlich nicht vollständig sein - daher ist es dann besonders wichtig, dass klar ist, wie die Fortsetzungspunkte . . . zu interpretieren sind! Anhand des Beispiels {1, 4, 71, 714, 6541, 59024, . . .} sehen Sie, dass es unerlässlich sein kann, zusätzliche Informationen über die Definition einer Menge zu liefern, wenn man nur einige wenige Elemente explizit auflisten kann. 3 R R Auf die Reihenfolge kommt es bei der Auflistung der Elemente in einer Menge nicht an! So beschreibt beispielsweise {1, 2, 3, 4, 5} genau die gleiche Menge wie {5, 3, 1, 4, 2} (siehe dazu auch Definition 2.1 zur Gleichheit zweier Mengen). Die Elemente in einer Menge sind wohlunterschieden, d.h., dass jedes Element in einer Menge nur einmal vorkommt: {1, 1, 2} stimmt demnach mit {1, 2} überein! Dies erklärt auch, warum in Beispiel 2.3 B der Buchstabe M in der Menge nur einmal auftaucht, obwohl er in dem Wort MATHEMATIK zweimal vorkommt. Die folgende Definition erläutert eine Begrifflichkeit, mit der Mengen in Relation4 zueinander gesetzt werden können, die Inklusion oder Teilmengenbeziehung: Definition 2.1 Seien M, N beliebige Mengen. Dann gilt (a) M ⊆ N : ⇔ ∀ x : x ∈ M ⇒ x ∈ N; in Worten: M enthalten in N oder M ist Teilmenge von N. (b) M = N : ⇔ M ⊆ N ∧ N ⊆ M; in Worten: M ist gleich N. 3 Um zu sehen, welche Menge im angegeben Beispiel gemeint ist, bilden Sie mal für n = 1, 2, 3, . . . die Ausdrücke 32n − 5n; im Gegensatz zu der angegebenen Darstellung wäre die Beschreibung {x ∈ N : ∃ n ∈ N : x = 32n − 5n} = {32n − 5n : n ∈ N} eindeutig gewesen. 4 Das ist nicht nur umgangssprachlich zu verstehen, wir werden den Begriff der Relation im folgenden Kapitel mathematisch definieren und sehr genau studieren. 2.1 Begriffsklärung 37 (c) M ⊂ N : ⇔ M ⊆ N ∧ ¬(M = N); in Worten: M echt enthalten in N oder M ist eine echte Teilmenge von N. Bemerkung 2.1 Beachten Sie, dass aus der Definition der Mengengleichheit unter (b) und der Äquivalenz (p ⇒ q) ∧ (q ⇒ p) ≡ p ⇔ q folgt, dass für zwei beliebige Mengen M und N gilt: M = N ⇔ ∀ x : x ∈ M ⇔ x ∈ N. Zwei Mengen M und N sind also gleich, wenn sie genau die gleichen Elemente enthalten, d.h., dass jedes Element, das in M vorkommt, auch in N enthalten sein muss, und jedes Element, das zu N gehört, auch in M enthalten ist. Sind zwei Mengen M und N nicht gleich, so schreibt man M 6= N anstelle von ¬(M = N). Anwendung eines De Morganschen Gesetzes auf die Definition der Mengengleichheit liefert, dass in diesem Falle entweder M keine Teilmenge von N, in Zeichen M * N, oder N keine Teilmenge von M, also N * M, ist. Ersteres bedeutet nach den Regeln für die Negation einer Allaussage, dass es mindestens ein x gibt, so dass x ∈ M, aber nicht x ∈ N gilt. Zweiteres würde entsprechend die Existenz eines x mit x ∈ N ∧ x ∈ /M bedeuten. Beispiel 2.4 A Die Menge aller weiblichen Erdenbürgerinnen ist eine Teilmenge der Menge aller Erdenbürgerinnen und Erdenbürger. B Ist M := 2N := {2n : n ∈ N} = {2, 4, 6, 8, 10, . . .} die Menge aller geraden natürlichen Zahlen, so gilt M ⊆ N und M ⊂ N. C Es gilt N ⊂ N0 := N ∪ {0} = {0, 1, 2, 3, 4, . . .} ⊂ Z ⊂ Q ⊂ R ⊂ C. 5 D Es gilt {z ∈ Z : z 2 = 1} = {1, −1}. Überlegen Sie sich, wieso das so ist! R R R 5 N Vielfach wird in der Literatur anstelle des Symbols ⊆ das Symbol ⊂ und anstelle des Symbols ⊂ das Symbol ( verwendet (z. Bsp. auch in [Fri07]). In Analogie zu der Bedeutung der ≤ - bzw. < -Zeichen, bei denen nur im ersten Fall auch eine Gleichheit vorliegen kann, verwende ich jedoch ausschließlich die in Definition 2.1 angegebene Notation. In Analogie zu den Symbolen ⊆ und ⊂ verwendet man die Symbole ⊇ und ⊃. Hierbei ist A ⊇ B gleichbedeutend mit B ⊆ A und A ⊃ B gleichbedeutend mit B ⊂ A. Man nennt A dann eine (echte) Obermenge von B. Aufgrund der Definition ist jede Menge Teilmenge von sich selbst. Darauf kommen wir im nächsten Abschnitt noch einmal zurück. Die Menge R der reellen Zahlen setzt sich zusammen aus der Menge Q der sogenannten rationalen Zahlen und der Menge der irrationalen Zahlen. Eine Zahl x ist rational, wenn sie sich als Bruch darstellen 4 lässt, d.h., dass zwei ganze Zahlen m und n mit n 6= 0 existieren, so dass x = m n ist. Z. Bsp. sind 0.8 = 5 und 1 0.3 = 3 rationale √ Zahlen. Eine irrationale Zahl kann nicht als Bruch dargestellt werden; Beispiele für irrationale Zahlen sind 2, π und e. Auf den Unterschied zwischen rationalen und irrationalen Zahlen werden wir noch ausführlich zu sprechen kommen. Die Menge C der sogenannten komplexen Zahlen ist Ihnen vielleicht aus der Schule gar noch nicht vertraut. Auch ihr werden wir uns später noch im Detail widmen. 2.1 Begriffsklärung R 38 Die Elementbeziehung ∈ und die Inklusion ⊆ muss man sehr genau voneinander unterscheiden! So gilt z. Bsp. 1 ∈ N und {1} ⊆ N, {1} ∈ N hingegen ist falsch! Als nächstes wird eine ganz besondere Menge vorgestellt, die sogenannte leere Menge: Sei dazu M die Menge aller Studierenden, die an dem Modul Grundlagen der Mathematik teilnehmen und deren Körpergröße mindestens 2, 50 m beträgt. Mit Sicherheit ist diese Menge leer 6 , d.h. es gibt kein Element in M. Dafür schreibt man7 M = {} oder M = ∅. Etwas gewöhnungsbedürftig, aber mit den Erkenntnissen aus Kapitel 1 im Einklang ist die Tatsache, dass die leere Menge Teilmenge jeder anderen Menge ist: Bemerkung 2.2 Sei M eine beliebige Menge. Dann gilt ∅ ⊆ M. Beweis: Gemäß Definition 2.1 gilt ∅ ⊆ M :⇔ ∀ x : x ∈ ∅ ⇒ x ∈ M. Da x ∈ ∅ für alle x falsch ist, ist die Implikation x ∈ ∅ ⇒ x ∈ M für alle x richtig. R Insbesondere gilt also ∅ ⊆ ∅. Unabhängig von dieser vielleicht zunächst etwas kurios erscheinenden Eigenschaft der leeren Menge werden wir ihre Existenz noch sehr zu schätzen lernen! In Definition 2.1 haben Sie gesehen, dass die (aussagenlogische) Implikation zur (mengentheoretischen) Teilmengenbeziehung korrespondiert. Auch für die Negation gibt es mengentheoretisch eine Entsprechung, die sogenannte Komplementbildung. Dazu schauen wir uns die Gleichungen (2.1) und (2.2) nochmal an: Für die Menge M := {x ∈ V(x) : A(x)} konnten wir festhalten, dass A(x) ⇔ x ∈ M und ¬A(x) ⇔ x ∈ / M ist. Doch wozu gehört x, wenn es, wie im zweiten Fall, nicht zu M gehört? Nach Voraussetzung sollte x ein Element des Variabilitätsbereichs V(x) sein, also gehört x zu V(x), aber nicht zu M; diese Menge nennt man das Komplement von M, es wird mit M c bezeichnet. Die Aussageform ¬A(x) korrespondiert also wie folgt zum Komplement von M: ¬A(x) ⇔ x ∈ / M ⇔ x ∈ M c bzw. M c = {x ∈ V(x) : ¬A(x)}. (2.3) Nun haben wir gelernt, dass man eine Menge M nicht nur über Aussageformen definieren kann - in den übrigen Fällen stellt sich die Frage nach der Zugehörigkeit der Elemente, die nicht zu M gehören, jetzt erneut. Dem Variabilitätsbereich entspricht im allgemeinen Fall eine sogenannte Grundmenge, mitunter wird diese auch Ausgangsmenge genannt. Damit liest sich die Definition des Komplements dann wie folgt: Definition 2.2 Ist G eine beliebige, nicht leere Menge (im Folgenden auch oft Grundmenge genannt) und M ⊆ G, so ist das Komplement von M (bzgl. G), in Zeichen M cG oder kürzer 8 M c , definiert als die Menge M c := {x ∈ G : x ∈ / M}. 6 zumindest im Jahr 2011 noch. . . Die beiden Darstellungen werden in der Literatur zu etwa gleichen Anteilen genutzt. Wir werden auch beide verwenden. 8 In aller Regel wird klar sein, bzgl. welcher Grundmenge die Komplementbildung vorzunehmen ist. Daher wird man in den allermeisten Fällen den Index G am Komplement−c weglassen. 7 2.2 Potenzmenge 39 Benutzt man für die Menge M die vielleicht etwas unübersichtliche, aber formal korrekte Schreibweise M = {x ∈ G : x ∈ M}, so sticht die Komplementarität von M und M c besonders schön ins Auge: M = {x ∈ G : x ∈ M}, M c = {x ∈ G : x ∈ / M}. Beispiel 2.5 Sei A := {2, 4, 6, 8, 10, . . .} die Menge aller geraden natürlichen Zahlen. Dann ist AcN = {1, 3, 5, 7, 9, 11, . . .} die Menge aller ungeraden natürlichen Zahlen. Dagegen ist AcZ = {. . . , −3, −2, −1, 0, 1, 3, 5, 7, 9, 11, . . .} die Menge, die alle negativen ganzen Zahlen, die 0 und alle ungeraden natürlichen Zahlen enthält. N 2.2 Potenzmenge Bislang könnte der Eindruck entstanden sein, dass man von jedem mathematischen Objekt sagen kann, ob es eine Menge oder ein Element einer Menge ist. Dies ist aber falsch! Einund dasselbe Objekt kann also durchaus einmal als Menge und ein anderes Mal als Element einer Menge auftreten - oder anders gesagt: Eine Menge kann ein Element (einer anderen Menge) und ein Element einer Menge kann selber eine (andere) Menge sein. Die sogenannte Potenzmenge einer Menge liefert ein gutes Beispiel für eine derartige Situation. Definition 2.3 Ist M eine beliebige Menge, so ist die Potenzmenge P(M) von M definiert als die Menge aller Teilmengen von M; es ist also P(M) := {A : A ⊆ M}. Beispiel 2.6 A Sei M = {x}. Dann ist P(M) = {∅, {x}}. B Es gilt P(∅) = {∅}. C Ist M = {0, 1}, so ist P(M) = {∅, {0}, {1}, M}. Weiter ist in diesem Fall P(P(M)) ={∅, {∅}, {{0}}, {{1}}, {M}, {∅, {0}}, {∅, {1}}, {∅, M}, {{0}, {1}}, {{0}, M}, {{1}, M}, {∅, {0}, {1}}, {∅, {0}, M}, {∅, {1}, M}, {{0}, {1}, M}, P(M)}. N Der Umgang mit der Potenzmenge ist für Anfängerinnen und Anfänger manchmal nicht ganz leicht; ganz sauber muss in diesem Kontext zwischen Teilmengen und Elementen unterschieden werden, kann doch - je nach Situation - eine Menge sowohl das eine als auch das andere sein. Aber ganz besonders für die elementare Wahrscheinlichkeitstheorie ist ein sicherer Umgang mit diesem Konstrukt unerlässlich! 2.3 Mengen-Algebra 2.3 40 Mengen-Algebra Durch Definition 2.1 haben die aussagenlogischen Konstrukte Implikation und Äquivalenz eine mengentheoretische Entsprechung, die Inklusion und die Mengengleichheit, bekommen. Der aussagenlogischen Negation konnten wir als duales Konzept die Komplementbildung gegenüberstellen. Bleibt nun nur noch die Frage, auf welche Art und Weise die aussagenlogischen Junktionen Konjunktion und Disjunktion in der Theorie der Mengen Ausdruck finden. Diese Frage soll im vorliegenden Abschnitt beantwortet werden. Wir werden feststellen, dass die im Zusammenhang mit der Logik für Konjunktion und Disjunktion bewiesenen Gesetzmäßigkeiten Kommutativität, Assoziativität und Distributivität, deren Gültigkeit für die Addition und Multiplikation reeller Zahlen uns aus der Schulzeit so vertraut ist, auch für die entsprechenden Operationen auf Mengen gelten und diesen Aspekt der Mengenlehre daher als Mengen-Algebra bezeichnen. Definition 2.4 Seien M, N beliebige Mengen. Dann heißt (a) M ∩ N := {x : x ∈ M ∧ x ∈ N} der (Durch-)Schnitt von M und N, (b) M ∪ N := {x : x ∈ M ∨ x ∈ N} die Vereinigung von M und N. Abb. 2.1 Venn-Diagramm zum (Durch-)Schnitt. Besonders schön lassen sich diese beiden Begrifflichkeiten in sogenannten VennDiagrammen9 veranschaulichen. In Abbildung 2.1 ist der Durchschnitt zweier Mengen M und N dargestellt. Hierbei stellt der mit M gekennzeichnete Kreis die Menge M dar, der mit N gekennzeichnete die Menge N. Die eingefärbte Fläche, die sowohl zur Menge M als auch zur Menge N gehört, stellt den (Durch-)Schnitt der Mengen M und N, also M ∩ N dar 10 . 9 John Venn,∗ 4. August 1834 in Drypool, † 4. April 1923 in Cambridge, war ein englischer Mathematiker, der sich vornehmlich mit Logik und Wahrscheinlichkeitstheorie beschäftigte. Der Vorteil, den VennDiagrammen gegenüber anderen geläufigen Mengendiagrammen haben, ist der, dass sie alle möglichen Relationen der vertretenen Mengen darstellen. Daher sind sie in gewissem Sinne als Beweismittel geeignet. 10 Mitunter wird M ∩ N auch als Schnittmenge von M und N bezeichnet. 2.3 Mengen-Algebra 41 Abb. 2.2 Venn-Diagramm zur Vereinigung. In Abbildung 2.2 ist analog die Vereinigung zweier Mengen M und N dargestellt (als eingefärbte Fläche). Beispiel 2.7 Sei M := {1, 3, 5, 7, 9, . . . , 17, 19} die Menge aller ungeraden natürlichen Zahlen zwischen 0 und 20, N := 3Z := {3z : z ∈ Z} = {. . . , −9, −6, −3, 0, 3, 6, 9, . . .} die Menge aller durch 3 teilbaren ganzen Zahlen und P := {2, 3, 5, 7} die Menge aller Primzahlen zwischen 1 und 10. Dann gilt M ∩ N = {3, 9, 15}, M ∩ P = {3, 5, 7}, N ∩ P = {3}, M ∪ N = {. . . , −9, −6, −3, 0, 1, 3, 5, 6, 7, 9, 11, 12, 13, 15, 17, 18, 19, 21, 24, . . .}, M ∪ P = {1, 2, 3, 5, 7, 9, 11, . . . , 19}, N ∪ P = {. . . , −9, −6, −3, 0, 2, 3, 5, 6, 7, 9, 12, 15, 18, . . .}. N Der folgende Satz enthält erste wichtige Aussagen über die Schnitt- und Vereinigungsbildung. Bevor wir ihn formulieren, sei jedoch noch eine wichtige Tatsache festgehalten, auf die wir innerhalb der nachfolgenden Beweise gelegentlich zurückgreifen müssen. Bemerkung 2.3 Es sei x eine Variable mit Variabilitätsbereich V(x) und es seien A(x) und A′ (x) zwei Aussageformen, die für alle x ∈ V(x) äquivalent sind, d.h., es gilt ∀ x ∈ V(x) : A(x) ⇔ A′ (x). Ist dann M := {x ∈ V(x) : A(x)} und M ′ = {x ∈ V(x) : A′ (x)}, so gilt M = M ′ . Beweis: Nach Definition von M und M ′ und aus der Äquivalenz von A(x) und A′ (x) folgt für alle x ∈ V(x) x ∈ M ⇔ A(x) ⇔ A′ (x) ⇔ x ∈ M ′ , 2.3 Mengen-Algebra 42 also insbesondere ∀ x ∈ V(x) : x ∈ M ⇔ x ∈ M ′ . Gemäß Bemerkung 2.1 folgt hieraus die Behauptung. Satz 2.1 Es seien M, N und P beliebige Mengen. Dann gilt (a1) M ∩ N = N ∩ M (Kommutativität des (Durch-)Schnitts) (a2) M ∪ N = N ∪ M (Kommutativität der Vereinigung) (b1) (M ∩ N) ∩ P = M ∩ (N ∩ P ) (Assoziativität des (Durch-)Schnitts) (b2) (M ∪ N) ∪ P = M ∪ (N ∪ P ) (Assoziativität der Vereinigung) Beweis: (a1) Wegen der Kommutativität der Konjunktion (siehe (K∧) auf Seite 16) ist (x ∈ M ∧ x ∈ N) ⇔ (x ∈ N ∧ x ∈ M). Daraus folgt aber mit Bemerkung 2.3 sofort M ∩ N = {x : x ∈ M ∧ x ∈ N} = {x : x ∈ N ∧ x ∈ M} = N ∩ M. (a2) Der Beweis verläuft analog zu dem in (a1). Schreiben Sie ihn selber auf! (b1) Gemäß (A∧) auf Seite 16 ist die Konjunktion assoziativ, d.h., es gilt (p∧q)∧r ≡ p∧(q∧r). Die Tatsache, dass die Klammersetzung hier also nicht von Bedeutung ist, rechtfertigt die oben bereits verwendete, einfachere Schreibweise p ∧ q ∧ r. Nun definiert man für alle x die Aussageformen M(x) := x ∈ M, N(x) := x ∈ N und P (x) := x ∈ P . Dann folgt die Assoziativität der Schnittbildung wieder mit Bemerkung 2.3 aus der Definition von ∩ und der Assoziativität der Konjunktion: Aus der für alle x geltenden Äquivalenz (M(x) ∧ N(x)) ∧ P (x) ⇔ M(x) ∧ (N(x) ∧ P (x)) folgt nämlich (M ∩ N) ∩ P = {x : x ∈ (M ∩ N) ∧ x ∈ P } = {x : x ∈ {x : x ∈ M ∧ x ∈ N} ∧ x ∈ P } = {x : (x ∈ M ∧ x ∈ N) ∧ x ∈ P } = {x : M(x) ∧ N(x) ∧ P (x)} = {x : M(x) ∧ N(x) ∧ P (x) } = {x : x ∈ M ∧ (x ∈ N ∧ x ∈ P )} = {x : x ∈ M ∧ x ∈ {x : x ∈ N ∧ x ∈ P }} = {x : x ∈ M ∧ x ∈ (N ∩ P )} = M ∩ (N ∩ P ). In Anbetracht der Irrelevanz der Klammern schreibt man anstelle von (M ∩ N) ∩ P = M ∩ (N ∩ P ) kürzer auch M ∩ N ∩ P . (b2) Analog wie (b1). 2.3 Mengen-Algebra 43 Abb. 2.3 Venn-Diagramm zum Schnitt dreier Mengen. Es sei angemerkt, dass Venn-Diagramme auch für drei (und mehr) Mengen angefertigt werden können. So zeigt Abbildung 2.3 beispielhaft den Durchschnitt M ∩ N ∩ P der drei Mengen M, N und P . Nachdem wir nun das Kommutativ- und das Assoziativgesetz für die Konjunktion und die Disjunktion in die Sprache der Mengen übersetzt haben, soll dies auch für die Distributivgesetze nachgeholt werden: Satz 2.2 Es seien M, N und P Mengen. Dann gelten folgende Distributivgesetze: (a) M ∪ (N ∩ P ) = (M ∪ N) ∩ (M ∪ P ), (b) M ∩ (N ∪ P ) = (M ∩ N) ∪ (M ∩ P ). Beweis: Den Beweis erbringen Sie in den Übungen. Veranschaulichen Sie sich diese Gleichheiten jeweils durch ein Venn-Diagramm. R 11 Aus der Schule kennen Sie das Distributivgesetz in der Form a·(b+c) = a·b+a·c (hierbei sind a, b, c beliebige reelle Zahlen). Die Rollen von · und + dürfen hierbei jedoch nicht vertauscht werden: im Allgemeinen (kurz: i. A.) ist nämlich die Gleichheit a+(b·c) = (a+ b)·(a+c) nicht richtig 11 ! Dass das Distributivgesetz für ∩ und ∪ in beiden Varianten gilt, ist also durchaus etwas Besonderes - man sagt in diesem Zusammenhang, dass die Menge aller Teilmengen einer Menge, ausgestattet mit der Vereinigungs- und Schnittbildung, eine sogenannte Boolsche Algebra 12 bildet. Über vergleichbare Strukturen werden wir künftig noch sehr viel lernen. Die Formulierung im Allgemeinen“ zeigt an, dass es durchaus Zahlen a, b und c geben kann, für die ” a + (b · c) = (a + b) · (a + c) ist (fallen Ihnen welche ein?). Die Allaussage ∀ a, b, c : a + (b · c) = (a + b) · (a + c) ist aber falsch! Um dies zu belegen, reicht es, ein Beispiel für a, b und c anzugeben, welches die Gleichheit nicht erfüllt! 12 George Boole, ∗ 2. November 1815, † 8. Dezember 1864, war ein englischer Mathematiker, Logiker und Philosoph, der zunächst als Lehrer tätig war, aufgrund seiner wissenschaftlichen Erfolge aber bald zum Professor berufen wurde. 2.3 Mengen-Algebra 44 Es folgen weitere wichtige Gleichheiten für Schnitte bzw. Vereinigungen von Mengen: Satz 2.3 Es sei G 6= ∅ eine beliebige Grundmenge und M ⊆ G. Dann gilt (a1) M ∩ G = M, (a2) M ∪ G = G, (b1) M ∩ ∅ = ∅, (b2) M ∪ ∅ = M, (c1) M ∩ M c = ∅, (c2) M ∪ M c = G. Beweis: (a1) Zunächst überlegt man sich mittels einer Wahrheitstafel, dass die Implikation (p ⇒ q) ⇒ (p ∧ q) ⇔ p für beliebige Aussagenvariablen p und q eine Tautologie ist. Dann definiert man, ähnlich wie oben, für alle x ∈ G die Aussagen M(x) := x ∈ M und G(x) := x ∈ G. Nach Voraussetzung ist M ⊆ G, d.h. M(x) ⇒ G(x) für alle x wahr. Gemäß der oben genannten Tautologie ist dann aber auch (M(x) ∧ G(x)) ⇔ M(x) richtig. Damit folgt wieder aus Bemerkung 2.3 M ∩ G = {x : x ∈ M ∧ x ∈ G} = {x : M(x) ∧ G(x)} = {x : M(x)} = {x : x ∈ M} = M. (a2) Zunächst überlegt man sich wieder mittels einer Wahrheitstafel, dass die Implikation (p ⇒ q) ⇒ (p ∨ q) ⇔ q eine Tautologie ist. Mit M(x) und G(x) wie in (a1) gilt dann, da M(x) ⇒ G(x) nach Voraussetzung, gemäß der zuletzt genannten Tautologie die Äquivalenz (M(x) ∨ G(x)) ⇔ G(x). Diese impliziert M ∪ G = {x : x ∈ M ∨ x ∈ G} = {x : M(x) ∨ G(x)} = {x : G(x)} = {x : x ∈ G} = G. (b1) Da x ∈ ∅ falsch ist für alle x ∈ G, ist auch x ∈ M ∧ x ∈ ∅ falsch für alle x ∈ G. Daraus folgt M ∩ ∅ = {x : x ∈ M ∧ x ∈ ∅} = {} = ∅. (b2) Da x ∈ ∅ falsch ist für alle x ∈ G, ist x ∈ M ∨ x ∈ ∅ wahr genau dann, wenn x ∈ M gilt. Daraus folgt M ∪ ∅ = {x : x ∈ M ∨ x ∈ ∅} = {x : x ∈ M} = M. (c1) Nach Voraussetzung ist M ⊆ G, d.h. es gilt x ∈ M ⇒ x ∈ G. Da die Formel p ∧ ¬p eine Kontradiktion ist (vgl. S. 16), folgt mit M(x) wie oben ¬M(x) = x ∈ / M und daraus die c Gleichheit M ∩ M = {x : x ∈ M ∧ x ∈ {x ∈ G : x ∈ / M}} = {x ∈ G : x ∈ M ∧ x ∈ / M} = ∅. (c2) Wieder gilt x ∈ M ⇒ x ∈ G nach Voraussetzung. Da die Formel p ∨ ¬p eine Tautologie ist (siehe dazu die Bemerkung auf Seite 16), folgt mit M(x) wie in (c1) die Gleichheit M ∪ M c = {x : x ∈ M ∨ x ∈ {x ∈ G : x ∈ / M}} = {x ∈ G : x ∈ M ∨ x ∈ / M} = {x ∈ G} = G. 2.3 Mengen-Algebra R 45 Die Identität M ∩ M c = ∅ lässt sich als mengentheoretische Formulierung des Prinzips vom ausgeschlossenen Widerspruch auffassen. Entsprechend ist M ∪M c = G als mengentheoretische Formulierung des Prinzips vom ausgeschlossenen Dritten zu interpretieren. Nun wollen wir weitere Mengenbeziehungen ableiten. Dazu übersetzen wir weitere der im Kapitel 1 aufgestellten Tautologien in die Mengensprache: Satz 2.4 Es sei G 6= ∅ eine Grundmenge und es seien M, N, P ⊆ G. Dann gilt (a) (M c )c = M (b1) (M ∩ N)c = M c ∪ N c (Regel von de Morgan) (b2) (M ∪ N)c = M c ∩ N c (Regel von de Morgan) (c) M ⊆ N ⇔ N c ⊆ M c (d) M * N ⇔ M ∩ N c 6= ∅ Beweis: (a) Diese Gleichheit folgt unmittelbar aus der Tautologie zur Doppelnegation (DN) auf Seite 16: Damit gilt nämlich mit M(x) := x ∈ M, also M = {x ∈ G : M(x)} und M c = {x ∈ G : ¬M(x)}, und Bemerkung 2.3 die Gleichheit (M c )c = {x ∈ G : ¬(¬M(x))} = {x ∈ G : M(x)} = M. (b1) Diese Gleichheit entspricht der Tautologie (1.4): Setzt man für alle x ∈ G wieder M(x) := x ∈ M und N(x) := x ∈ N, so folgt M ∩ N = {x ∈ G : M(x) ∧ N(x)} und (M ∩ N)c = {x ∈ G : ¬(M(x)) ∧ N(x))} = {x ∈ G : ¬M(x) ∨ ¬N(x)} = {x ∈ G : x ∈ / M ∨x ∈ / c c N} = M ∪ N . (b2) Der Beweis verläuft analog zu (b1) mittels der Tautologie (1.5). (c) Seien M(x) und N(x) wie in (b1) definiert. Dann gilt mit (1.8) die folgende Kette von Äquivalenzen: M ⊆ N :⇔ ∀ x : M(x) ⇒ N(x) ⇔ ∀ x : ¬N(x) ⇒ ¬M(x) ⇔ N c ⊆ M c . (d) Mit M(x) und N(x) wie oben gilt aufgrund von (1.7): M * N ⇔ ¬ ∀ x : M(x) ⇒ N(x) ⇔ ∃ x : ¬(M(x) ⇒ N(x)) (∗) R ⇔ ∃ x : M(x) ∧ ¬N(x) ⇔ {x : x ∈ M ∧ x ∈ / N} = 6 ∅ ⇔ M ∩ N c 6= ∅. Die Äquivalenz M ⊆ N ⇔ N c ⊆ M c ist, wie wir im Beweis gesehen haben, die mengentheoretische Formulierung der Kontraposition. 2.3 Mengen-Algebra 46 Im Zusammenhang mit der Prädikatenlogik habe ich Ihnen in Abschnitt 1.7 den Existenz- und den Allquantor vorgestellt. Eine mathematisch saubere Definition für diese beiden Begrifflichkeiten habe ich Ihnen da aber noch nicht geliefert! Die Ausführungen beschränkten sich, da wir auf den Mengenbegriff noch nicht zurückgreifen konnten, auf Erläuterungen zum Sprachgebrauch und zur Verwendung. Im Beweisschritt (∗) des letzten Beweises (Aussage (d)) haben wir eine Äquivalenz verwendet, die aufgrund der folgenden, nun möglichen und mathematisch sauberen Definition des Existenzquantors (und des Allquantors) richtig ist: Definition 2.5 Sei x eine Variable mit Variabilitätsbereich G = V(x) und A(x) eine Aussageform. Dann schreibt man (a) ∃ x ∈ G : A(x) :⇔ {x ∈ G : A(x)} = 6 ∅ und (b) ∀ x ∈ G : A(x) :⇔ {x ∈ G : A(x)} = G. Unter Verwendung der in diesem Abschnitt hergeleiteten Resultate können wir mit dieser Definition die beiden Aussagen in Satz 1.2 beweisen: Beweis (von Satz 1.2): Zunächst beweisen wir (1.10), also ¬(∀ x ∈ V(x) : A(x)) ⇔ ∃ x ∈ V(x) : ¬A(x). Gemäß Definition 2.5 ist diese Aussage nach Setzen von G := V(x) äquivalent zu ¬({x ∈ G : A(x)} = G) ⇔ {x ∈ G : ¬A(x)} = 6 ∅. (2.5) Setzen wir M := {x ∈ G : A(x)}, so ist (2.5) äquivalent zu ¬(M = G) ⇔ M c 6= ∅, (2.6) was wiederum gleichbedeutend ist mit M = G ⇔ M c = ∅. (2.7) (2.7) soll nun bewiesen werden. Im ersten Schritt zeigen wir M = G ⇒ M c = ∅, im zweiten M c = ∅ ⇒ M = G. Sei also zunächst M = G. Per Definition des Komplements ist dann M c ⊆ M und daher M c = M c ∩ M. Letzteres ist aber nach Satz 2.3, Teilaussage (c1), gleich der leeren Menge. Für den Beweis der anderen Richtung sei M c = ∅. Dann ist, wieder mit Satz 2.3 (Teilaussagen (b2) und (c2)) M = M ∪ ∅ = M ∪ M c = G. Damit ist (2.7) bewiesen. Da dies äquivalent ist zu (1.10), ist damit der Beweis dieser Aussage erbracht. Nun beweisen wir (1.11), also (wieder mit G = V(x)) ¬(∃ x ∈ G : A(x)) ⇔ ∀ x ∈ G : ¬A(x). Mit der Tautologie zur doppelten Verneinung und der bereits bewiesenen Äquivalenz ist ¬(∃ x ∈ G : A(x)) ⇔ ¬(∃ x ∈ G : ¬(¬A(x))) ⇔ ¬(¬(∀ x ∈ G : ¬A(x))) ⇔ ∀ x ∈ G : ¬A(x). Das war zu beweisen. 2.4 Differenzen von Mengen 47 Im nächsten Satz wollen wir die Inklusion charakterisieren: Satz 2.5 Seien M und N beliebige Mengen. Dann gilt M ⊆ N ⇔ M ∩ N = M ⇔ M ∪ N = N. Beweis: Den Beweis erbringen Sie in den Übungen. Diesen Abschnitt abschließend sei noch eine wichtige Definition angegeben: Definition 2.6 Zwei Mengen M und N heißen disjunkt (oder unvereinbar), falls sie kein Element gemeinsam haben, d.h., dass M ∩ N = ∅. Beispiel 2.8 Ist G eine beliebige Grundmenge, so sind für jedes M ⊆ G die Mengen M und M c disjunkt. Dies folgt unmittelbar aus Satz 2.3 (Teilaussage (c1)). N 2.4 Differenzen von Mengen In diesem Abschnitt beschäftigen wir uns mit der Differenzbildung von Mengen; diese kann asymmetrisch oder symmetrisch erfolgen: Definition 2.7 Seien M, N beliebige Mengen in einer Grundmenge G. Dann heißt (a) M \ N := M ∩ N c die Differenz von M und N, (b) M △ N := (M \ N) ∪ (N \ M) die symmetrische Differenz von M und N. Machen Sie sich klar, dass M \ N = M ∩ N c die Menge derjenigen Elemente ist, die zu M, aber nicht zu N gehören. Dabei muss N keine Teilmenge von M sein! In Abbildung 2.4 ist die Differenzbildung grafisch dargestellt. Hier ist besonders gut zu erkennen, dass die Differenzbildung mit \ asymmetrisch ist - im Allgemeinen ist nämlich M \ N 6= N \ M. Anders verhält sich das, wie der Name schon sagt, bei der symmetrischen Differenzbildung. Die symmetrische Differenz zweier Mengen M und N enthält nämlich genau diejenigen Elemente, die in genau einer der beiden Mengen, also in M, aber nicht in N, oder in N, dann aber nicht in M, enthalten sind. Anhand eines Venn-Diagramms lässt sich die Symmetrie sehr schön erkennen! In den Übungen werden Sie formal korrekt beweisen, dass die Gleichheit M △N = N △M (2.8) tatsächlich für jede Wahl von M und N richtig ist: Bemerkung 2.4 Seien M, N beliebige Mengen. Dann gilt M △ N = (M ∪ N) \ (M ∩ N). Beweis: Auch dieser Beweis ist in den Übungen zu erbringen. 2.5 Das kartesisches Produkt R R 48 Abb. 2.4 Venn-Diagramm zur Differenz. Die symmetrische Differenzbildung entspricht der zweistelligen aussagenlogischen Junktion entweder - oder (auch: ausschließendes oder 13 ), die genau dann wahr ist, wenn genau eine der beiden Aussagen wahr ist. Mittels der Differenzbildung lässt sich das Komplement M c einer Menge M in einer Grundmenge G beschreiben als M c = G \ M. Beispiel 2.9 Mit den Mengen M, N, P aus Beispiel 2.7 gilt M \ N = {1, 5, 7, 11, 13, 17, 19}, P \ N = {2, 5, 7}, N \ P = {. . . , −9, −6, −3, 0, 6, 9, 12 . . .}, P △ N = {. . . , −9, −6, −3, 0, 2, 5, 6, 7, 9, 12, 15, 18, . . .}, M △ P = {1, 2, 9, 11, 13, 15, 17, 19}. 2.5 N Das kartesisches Produkt Innerhalb der vorangegangenen beiden Abschnitte haben wir Mengenoperationen eingeführt, die - angewendet auf ein oder zwei Teilmengen einer Grundmenge G - wieder eine Teilmenge dieser Grundmenge lieferten. Man sagt, dass diese Operationen auf P(G) abgeschlossen waren. Außerdem entsprach, mehr oder weniger direkt, jeder dieser Operationen eine uns bereits bekannte aussagenlogische Verknüpfung. Die Verknüpfungsmethode“, die ich Ihnen ” im Folgenden vorstellen will, ist von grundsätzlich anderer Natur. Definition 2.8 Seien M, N beliebige Mengen. 13 Diese Junktion haben wir in Kapitel 1 nicht behandelt. 2.5 Das kartesisches Produkt 49 (a) Dann heißt M × N := {(x, y) : x ∈ M ∧ y ∈ N} das (kartesische) Produkt von M und N. (b) Ein Element (x, y) von M × N nennt man ein geordnetes Paar oder ein (2-)Tupel. Der Eintrag x heißt erste Komponente, der Eintrag y zweite Komponente des Tupels. Definition 2.9 Seien M und N Mengen. Zwei geordnete Tupel (x1 , y1), (x2 , y2) ∈ M × N heißen gleich, wenn ihre Einträge komponentenweise übereinstimmen; formal schreibt sich das wie folgt: (x1 , y1) = (x2 , y2 ) :⇔ x1 = x2 ∧ y1 = y2 . Bemerkung 2.5 Anders als in einer Menge ist in einem Tupel die Reihenfolge der Einträge also von Bedeutung! So ist beispielsweise (2, 3) 6= (3, 2), während {2, 3} = {3, 2} gilt. Insbesondere ist das Tupel (x, y) nicht mit der Menge {x, y} zu verwechseln! Ein realitätsnahes Beispiel für das Auftreten eines kartesischen Produkts ist das Schachspiel: Hier wird die Position p einer Spielfigur auf dem Spielbrett angegeben durch ein 2-Tupel p = (p1 , p2 ), wobei p1 ∈ {a, b, c, d, e, f, g, h} und p2 ∈ {1, 2, 3, 4, 5, 6, 7, 8}. Die Position p ist also ein Element des kartesischen Produkts {a, b, c, d, e, f, g, h} × {1, 2, 3, 4, 5, 6, 7, 8}. Ein anderes Beispiel, in dem das kartesische Produkt zweier Mengen maßgeblich ist, ist das Spiel Schiffe versenken. Hier wird, ähnlich wie beim Schachspiel, die Position eines vermeintlichen Schiffsstandorts durch ein Element des kartesischen Produktes {a, b, . . . , j}×{1, 2, . . . , 10} beschrieben. Abb. 2.5 Spielbrett Schiffe Versenken (Quelle: http: // images. brettspielerei. de/ zeeslag/ screenshot. jpg ). 2.6 Bedeutende Teilmengen der reellen Zahlen: Intervalle 50 Nun wollen wir ein mathematisches Beispiel betrachten: Beispiel 2.10 Mit den Mengen M, N, P aus Beispiel 2.7 gilt M × P = {(1, 2), (1, 3), (1, 5), (1, 7), (3, 2), (3, 3), (3, 5), (3, 7), . . ., (19, 2), (19, 3), (19, 5), (19, 7)}, P × N = {. . . , (2, −6), (3, −6), (5, −6), (7, −6), (2, −3), (3, −3), (5, −3), (7, −3), (2, 0), (3, 0), (5, 0), (7, 0), (2, 3), (3, 3), (5, 3), (7, 3), . . .}. N Das kartesische Produkt lässt sich auch für mehr als zwei Mengen definieren. Will man dies jedoch formal sauber machen, ist es notwendig, sich mit rekursiven Definitionen auszukennen. Daher verschieben wir dies auf einen späteren Zeitpunkt. 2.6 Bedeutende Teilmengen der reellen Zahlen: Intervalle In diesem Abschnitt ist es von Bedeutung, dass Sie die Symbole ≤, <, ≥ und > der Ordnung auf den reellen Zahlen kennen. Wir gehen auf die Eigenschaft von R, geordnet zu sein, später noch im Detail ein - für den Moment reichen Ihre Schulkenntnisse aus. Definition 2.10 Für zwei reelle Zahlen a, b ist (i) [a, b] := {x ∈ R : a ≤ x ≤ b} das abgeschlossene Intervall von a bis b, (ii) [a, b[ := {x ∈ R : a ≤ x < b} das nach rechts halboffene Intervall von a bis b, (iii) ]a, b] := {x ∈ R : a < x ≤ b} das nach links halboffene Intervall von a bis b, (iv) ]a, b[ := {x ∈ R : a < x < b} das offene Intervall von a bis b.14 Außerdem ist für jedes a ∈ R (v) [a, ∞[ := {x ∈ R : a ≤ x} das halboffene Intervall von a bis ∞,15 (vi) ] − ∞, a] := {x ∈ R : x ≤ a} das halboffene Intervall von −∞ bis a, (vii) ]a, ∞[ := {x ∈ R : a < x} das offene Intervall von a bis ∞, (viii) ] − ∞, a[ := {x ∈ R : x < a} das offene Intervall von −∞ bis a. Schließlich definiert man ] − ∞, ∞[ := R. 14 In der Literatur wird anstelle der Schreibweise ]a, b[ häufig die Schreibweise (a, b) verwendet. Da wir letztere aber schon für die 2-Tupel eingeführt haben, wollen wir für Intervalle ausschließlich die eckigen Klammern benutzen. 15 Das Symbol ∞ wird unendlich genannt. Es stellt keine reelle Zahl dar! 2.6 Bedeutende Teilmengen der reellen Zahlen: Intervalle 51 a b a b a b a b Abb. 2.6 Visualisierung der Intervalle von a bis b. a a a a Abb. 2.7 Visualisierung der unbeschränkten Intervalle. Überzeugen Sie sich zunächst von der Tatsache, dass die vier erstgenannten, beschränkten 16 Intervalle jeweils die leere Menge sind, falls a > b gilt. Außerdem sind das offene und die halboffenen Intervalle leer, falls a = b gilt. In diesem Fall ist [a, b] = [a, a] = {a} einelementig. Vor diesem Hintergrund sind die Definitionen besonders für a < b interessant. Im Folgenden wollen wir daher annehmen, dass a, die sogenannte linke Intervallgrenze, kleiner ist als die rechte, also b. Die Intervalle, bei denen eine Grenze ∞ oder −∞ ist, nennt man unbeschränkt. Schauen wir uns nun die Definition der verschiedenen Intervalle noch einmal genauer an: Ein abgeschlossenes Intervall enthält beide Intervallgrenzen, ein halboffenes genau eine und ein offenes Intervall enthält keine der beiden Intervallgrenzen. Am Zahlenstrahl veranschaulichen wir die vier beschränkten Intervalle von a bis b wie in Abbildung 2.6: Eine zum Intervall gehörende Intervallgrenze wird durch einen ausgefüllten Kreis gekennzeichnet, eine nicht zum Intervall gehörende Intervallgrenze wird durch einen nicht ausgefüllten Kreis markiert. In Abbildung 2.6 sind die Intervalle entsprechend ihrer Reihenfolge in Definition 2.10 visualisiert. Die unbeschränkten Intervalle sind - wieder gemäß ihrer Reihenfolge in Definition 2.10 - analog in Abbildung 2.7 dargestellt. Für die Intervalle ] 0, ∞ [ und [ 0, ∞ [ gibt es eigene Symbole: 16 Die Begriffe beschränkt und unbeschränkt sind mathematisch definiert - die formale Bedeutung deckt sich an dieser Stelle aber sehr gut mit unserem anschaulichen Verständnis - siehe dazu auch die Abbildungen 2.6 und 2.7. 2.6 Bedeutende Teilmengen der reellen Zahlen: Intervalle 52 y 3 2 1 1 2 3 x Abb. 2.8 Visualisierung von I × J. • ] 0, ∞ [ =: R+ ; das ist die Menge der positiven (reellen) Zahlen, • [ 0, ∞ [ =: R+ 0 ; das ist die Menge der nichtnegativen (reellen) Zahlen. Da Intervalle Mengen sind, können wir sie schneiden, vereinigen, voneinander abziehen, kartesisch multiplizieren etc. Beispiel 2.11 Für I := [0, 2] und J :=]1, 3] erhält man die Gleichheiten I ∩ J = ]1, 2], I ∪ J = [0, 3], I \ J = [0, 1], J \ I = ]2, 3], I △ J = [0, 1] ∪ ]2, 3], I × J = {(x, y) : x ∈ [0, 2], y ∈]1, 3]}. Das kartesische Produkt von I und J ist in Abbildung 2.8 als eingefärbtes Rechteck dargestellt. Hierbei deutet die gestrichelte Linie an, dass die auf ihr liegenden Punkte nicht zur Menge I × J dazugehören; im Gegensatz dazu bilden die auf den drei durchgezogenen Randlinien liegenden Punkte eine Teilmenge von I × J. In den Übungen werden Aufgaben behandelt werden, in denen Lösungsmengen von Gleichungen oder Ungleichungen zu bestimmen sind. Fasst man die Gleichung bzw. Ungleichung als Aussageform auf, so kommt dies einer expliziten Bestimmung der durch diese Aussageform beschriebenen Menge gleich. Diese Aufgaben trainieren nicht nur den Umgang mit Mengen, sondern dienen auch dazu, Grundfertigkeiten im Rechnen mit reellen Zahlen, insbesondere mit Beträgen, Gleichungen und Ungleichungen wieder aufzufrischen. Diesen Abschnitt abschließend sei dazu ein Beispiel gegeben. Beispiel 2.12 A Es ist {x ∈ R : x > 3} = ] 3, ∞ [. B Es ist {x ∈ R : (x − 3)2 − 4 < 0} = ]1, 5[. 2.6 Bedeutende Teilmengen der reellen Zahlen: Intervalle 53 Beweis: Es ist (x − 3)2 − 4 < 0 ⇔(x − 3)2 < 4 √ ⇔|x − 3| < 4 = 2 ⇔(x > 3 ∧ x − 3 < 2) ∨ (x ≤ 3 ∧ −(x − 3) < 2) ⇔(x > 3 ∧ x < 5) ∨ (x ≤ 3 ∧ 3 − x < 2) ⇔x ∈ ]3, 5] ∨ (x ≤ 3 ∧ 1 < x) ⇔x ∈ ]3, 5] ∨ x ∈ ]1, 3] ⇔x ∈ ]1, 5[. Bemerkung 2.3 liefert damit die Behauptung. Anschaulich ist diese Identität sehr schön zu beschreiben, indem man die Graphen der beiden Funktionen 17 x 7→ (x − 3)2 − 4 und x 7→ 0, die durch die Ausdrücke links und rechts vom Ungleichheitszeichen bestimmt sind, in ein Koordinatensystem zeichnet und den Bereich identifiziert, in dem der Graph der zuerst genannten Funktion unterhalb des Graphen der Nullfunktion liegt: Abb. 2.9 Visualisierung der Lösungsmenge der Ungleichung (x − 3)2 − 4 < 0. C Es ist {x ∈ R : x x−1 < 3} = ] − ∞, 1 [ ∪ 3 2 ,∞ . Fertigen Sie die entsprechende Graphik selber an! 17 Im nächsten Kapitel werde ich Ihnen eine formal saubere Definition des Begriffs Funktion liefern. Für den Moment greifen Sie bitte auf Ihr Schulwissen zurück. Kapitel 3 Relationen In naher Zukunft wollen wir einen Begriff studieren, den Sie aus der Schule alle kennen: den der Funktion - oder allgemeiner: Abbildung. Vorbereitend hierfür widmen wir uns in diesem Kapitel dem Begriff der Relation; denn jede Funktion ist auch eine Relation (aber nicht umgekehrt). Damit ist der Begriff der Relation ein Oberbegriff des Funktionsbegriffs (Ihnen aus der Schule aber eventuell nicht bekannt). Eine weitere wichtige Anwendung des Relationsbegriffs werden wir bei der schrittweisen Erweiterung der Menge N der natürlichen Zahlen über die Mengen Z und Q zur Menge R der reellen Zahlen kennen lernen. Und schließlich sei noch angemerkt, dass auch die Anordnung dieser Ihnen so gut bekannten Zahlen entlang eines Zahlenstrahls mit dem Relationsbegriff zusammenhängt. 3.1 Begriffsklärung Sind M und N zwei beliebige (vorzugsweise nicht leere) Mengen, so versteht man unter einer Relation von M nach N eine Beziehung zwischen gewissen Elementen aus M zu gewissen Elementen aus N. So können, wenn M = N die Menge aller Gäste auf einer Festveranstaltung bezeichnet, einige dieser Gäste zueinander verwandt sein oder, sofern M = N die Menge aller Studierenden eines Studiengangs ist, verschiedene Studierende dieser Menge bei der gleichen Lehrperson ihren Mathematikunterricht gehabt haben. Analog könnten verschiedene Dreiecke dadurch zueinander in Beziehung gesetzt sein, dass sie kongruent (also deckungsgleich) sind oder ganze Zahlen als zueinander in Beziehung stehend definiert werden, wenn sie beim Teilen durch 3 denselben Rest lassen. Um derartige Beziehungen zwischen den Elementen zweier Mengen M und N zu formalisieren, greifen wir auf das Konzept des kartesischen Produkts M × N dieser Mengen zurück und beschreiben die interessierende Relation R als die Teilmenge aller Paare (x, y) ∈ M × N, für die eine die entsprechende Beziehung beschreibende Aussageform R(x, y) in den beiden Variablen x und y wahr ist: R := {(x, y) ∈ M × N : R(x, y)} ⊆ M × N. (3.1) An ausgewählten Beispielen soll diese Idee nun erstmal verdeutlicht werden; dazu sei vorab noch gesagt, dass 54 3.1 Begriffsklärung 55 • das kartesische Produkt einer Menge M mit sich selbst häufig auch mit M 2 bezeichnet wird; es ist also M 2 := M × M, • eine Relation von einer Menge M nach sich selbst auch Relation auf M genannt wird. Beispiel 3.1 A Betrachtet man eine Schachpartie, so kann man zu jedem Zeitpunkt t des Spiels eine Relation R = R(t) ⊆ M × N von M := {A, B, C, D, E, F, G, H} nach N := {1, 2, 3, 4, 5, 6, 7, 8} definieren wie folgt: Für x ∈ M und y ∈ N stehe x in Relation zu y genau dann, wenn zum Zeitpunkt t auf der Position (x, y) eine Spielfigur steht. Die entsprechende Aussageform liest sich dann wie folgt (hierbei seien x ∈ M, y ∈ N beliebig): R(x, y) := zum Zeitpunkt t steht auf der Position (x, y) eine Spielfigur“. ” Abb. 3.1 Momentaufnahme einer Schachpartie (Quelle: http: // www. christianlueth. de/ schach/ img/ Bilder1. 2/ Pos9. jpg ). Zum Zeitpunkt der Spielsituation in Abbildung 3.1 hat man dann R = {(x, y) ∈ M × N : R(x, y)} = = {(B, 5), (C, 7), (D, 2), (E, 5), (F, 5), (F, 4), (G, 5), (G, 7), (H, 2)}. B Ist S die Menge aller Studierenden in einer Lehrveranstaltung und T die Menge aller 366 möglichen Tage eines Jahres, so können wir durch die folgende Aussageform, die für alle s ∈ S und für alle t ∈ T definiert sei, eine Relation von S nach T festlegen: U(s, t) := die/der Studierende s hat am Tag t Geburtstag“. ” 3.1 Begriffsklärung 56 Die entsprechende Relation (3.1) umfasst dann alle Paare (s, t), bei denen t der Geburtstag der/des Studierenden s ist. Übrigens ist es dann sehr wahrscheinlich, dass es (mindestens) einen Tag t∗ ∈ T gibt, so dass U(s1 , t∗ ) und U(s2 , t∗ ) für zwei verschiedene Elemente s1 und s2 ∈ S richtig ist 1 . Das heißt, dass es mit großer Wahrscheinlichkeit einen Tag im Jahr gibt, an dem zwei verschiedene Studierende Geburtstag haben. Außerdem ist es (bei weniger als 366 Studierenden) sicher, dass (mindestens) ein Tag t′ ∈ T existiert, so dass U(s, t′ ) für alle s ∈ S falsch ist. C Auf einer Menge G von Gästen einer Party sei eine Relation A über folgende Aussageform definiert: Für g1 , g2 ∈ G sei A(g1 , g2 ) := g1 und g2 sind zusammen zur Party gekommen“. ” (3.4) Wir wollen uns hierbei darauf verständigen, dass die Aussage g und g sind zusammen ” zur Party gekommen“ für alle g ∈ G richtig ist, d.h. dass jeder Gast mit sich selbst in Relation steht; insbesondere gilt damit für jedes g ∈ G, dass (g, g) Element von A ist. Für jeden Gast g ∈ G ist es nun prinzipiell möglich, dass er nur zu sich selbst in Relation steht (dann ist er alleine zur Party gekommen); es ist aber auch denkbar, dass er zu zwei (oder noch mehr) Elementen aus G in Relation steht: Dies ist genau dann der Fall, wenn g zu zweit (bzw. in einer noch größeren Gruppe) zur Party gekommen ist. Abb. 3.2 Graphische Darstellung der Relation A zur Aussageform (3.4). 1 Tatsächlich liegt diese Wahrscheinlichkeit bei etwa 150 Studierenden - mit einem gewöhnlichen Taschenrechner berechnet - bei 100%. Wir werden uns hiervon im Modul Grundbildung Stochastik überzeugen. 3.1 Begriffsklärung 57 Zur weiteren Illustration nehmen wir mal an, dass G = {Ben, Jan, Jil, Mia, Max, Ole, Tim, Tom, Uwe, Zoé} die Menge der Gäste ist. Außerdem nehmen wir an, dass Ben, Jil und Mia zusammen gekommen sind, Jan alleine kam, Max und Tim zusammen kamen und die verbleibenden vier Gäste auch zusammen zur Party erschienen sind. Die Relation A wird dann durch die in Abbildung 3.2 dargestellte Teilmenge von G2 = G×G dargestellt. D Eine Relation auf R, deren Veranschaulichung Sie aus der Schule unter dem Namen Normalparabel mit Sicherheit gut kennen, ist die folgende (siehe Abbildung 3.3 (links)): K1 := {(x, y) ∈ R2 : y = x2 } 9 3 8 2 7 6 1 5 4 −1 3 1 2 3 4 5 6 7 8 9 −1 2 −2 1 −3 −2 −1 0 1 2 3 −3 Abb. 3.3 Graphische Darstellung der Relationen K1 (links) und K2 (rechts). Vielleicht erinnern Sie sich, dass die Normalparabel als Graph der Funktion, die jedes reelle x auf x2 abbildet, Einzug in den Unterricht nahm; oben wurde ja bereits angedeutet, dass es Relationen gibt, die auch Funktionen sind; hier haben wir ein Beispiel für eine solche spezielle Beziehung. Im Gegensatz dazu ist √ √ K2 := {(x, y) ∈ R2 : x = y 2 } = {(x, y) ∈ R2 : y = − x ∨ y = x}, was anschaulich einer um 32 π gedrehten 2 Version der Relation K1 entspricht (siehe Abbildung 3.3) keine Funktion, aber durchaus eine Relation! Wieso das so ist, werden wir in Kürze genauer studieren! E Ein anderes wichtiges Beispiel für eine Relation kennen Sie auch schon aus Ihrer Schulzeit: Definieren wir für alle a, b ∈ N die Aussageform U(a, b) := a ≤ b, 2 Der mathematisch positive Umlaufsinn oder kürzer mathematische Umlaufsinn ist gegenläufig zur Bewegungsrichtung der Zeiger auf einer Uhr. Von einer (Kreis-)Bewegung, die im Uhrzeigersinn verläuft, sagt man daher auch, dass sie gegen den mathematischen Drehsinn bzw. im mathematisch negativen Umlaufsinn erfolgt. 3.1 Begriffsklärung 58 ... ... ... ... ... ... ... ... ... ... b 5 a 5 Abb. 3.4 Die Kleiner-Gleich-Relation. so ist beispielsweise U(1, 4) wahr, U(5, 4) hingegen nicht. Die Menge U aller Paare (a, b) natürlicher Zahlen, für die U(a, b) wahr ist, also U = {(a, b) ∈ N × N : a ≤ b}, ist in Abbildung 3.4 illustriert. Hier handelt es sich um die sogenannte ≤ −Relation; statt U(a, b) schreibt man üblicherweise a ≤ b. Überlegen Sie sich mal, wie man die Graphik anpassen müsste, wenn man in der Aussageform U(a, b) das ≤-Zeichen durch ein <-Zeichen (oder ein ≥-, >- bzw. =-Zeichen) ersetzen würde! N Zwischen zwei Mengen M und N kann es sehr viele Relationen geben; tatsächlich kann man ja eine beliebige Teilmenge R ⊆ M ×N des kartesischen Produkts zwischen M und N auswählen und dazu via der für alle x ∈ M und y ∈ N zu definierenden Aussageform R(x, y) := (x, y) ∈ R eine Beziehung zwischen den Elementen in M und N definieren. Umgekehrt lässt sich durch (3.1) jeder durch eine Aussageform R(x, y) mit Variablen x ∈ M und y ∈ N definierten Beziehung zwischen Elementen in M und N eine Teilmenge R des kartesischen Produkts M × N zuordnen. In Anbetracht dieser Dualität treffen wir formal folgende Definition: Definition 3.1 Seien M, N beliebige Mengen und R ⊆ M × N. Dann nennt man R eine Relation von M nach N. Eine Teilmenge R ⊆ M 2 = M × M bezeichnet man auch als Relation auf M. Bevor wir ein letztes, wichtiges Beispiel diskutieren, müssen wir zwei Begrifflichkeiten aus der elementaren Zahlentheorie 3 zur Verfügung stellen: 3 Die Zahlentheorie ist eine Teildisziplin der Mathematik, die sich in einem sehr verallgemeinerten Sinne mit den Eigenschaften von Zahlen beschäftigt. In der elementaren oder arithmetischen Zahlentheorie sind Begriffe wie ganze Zahl, Teilbarkeit, Primzahl und Kongruenz fundamental, wichtige Ergebnisse, von denen Sie vielleicht schon mal gehört haben, sind der Fundamentalsatz der Arithmetik, der Euklidische Algorithmus und der Kleine Satz von Fermat. Wir kommen darauf noch zu sprechen. 3.1 Begriffsklärung 59 Definition 3.2 Seien n, m ∈ Z. Dann sagt man, dass n ein Teiler von m ist oder dass n die Zahl m teilt oder dass m ein Vielfaches von n ist und schreibt n | m :⇔ ∃ k ∈ Z : m = kn. Gilt nicht n | m, so schreibt man dafür n ∤ m. Es gilt also 4 | 8, 3 | (−15) und ∀ z ∈ Z : z | 0. Außerdem gilt 2 ∤ 5 und ∀ z ∈ Z \ {0} : 0 ∤ z. Der Teilbarkeitsbegriff legt zunächst mal die Definition der folgenden Relation nahe: T := {(n, m) ∈ Z2 : n|m}. (3.7) In der Vorlesung werden wir uns überlegen, wie diese Menge graphisch aussieht. Für das weitere Vorgehen ist nun eine Variation des Existenzquantors von Bedeutung: Definition 3.3 Sei x eine Variable mit Variabilitätsbereich G = V(x) und A(x) eine Aussageform. Dann schreibt man ∃1 x ∈ G : A(x) :⇔ {x ∈ G : A(x)} enthält genau ein Element. Hiermit können wir einen ersten wichtigen Satz zur eindeutigen Lösbarkeit einer Gleichung formulieren: Satz 3.1 (Division mit Rest) ∀ m ∈ Z, n ∈ N : ∃1 q ∈ Z, r ∈ {0, 1, . . . , n−1} : m = qn+r. 4 Bevor wir diesen Satz beweisen, seien einige Bezeichnungen eingeführt und ein Beispiel gegeben. Definition 3.4 Ist m ∈ Z und n ∈ N und m = qn + r mit q ∈ Z und r ∈ {0, . . . , n − 1}, so nennt man q den (Ganzzahl-)Quotienten (von m durch n) und r den Rest (der Division von m durch n). Den Rest r = m − qn ∈ {0, . . . , n − 1} bezeichnet man auch mit m mod n, gesprochen m modulo n. Beispiel 3.2 A Wegen 17 = 2 · 6 + 5 und 5 ∈ {0, . . . , 5} ist 2 der Ganzzahl-Quotient von 17 durch 6 und 5 = 17 mod 6 der Rest dieser Division. Die Darstellung 17 = 1 · 6 + 11 ist zwar auch richtig, wegen 11 ∈ / {0, . . . , 5} liegt hier jedoch keine Division mit Rest im Sinne von Satz 3.1 vor. Ebenso verhält es sich wegen −1 ∈ / {0, . . . , 5} mit der Darstellung 17 = 3 · 6 + (−1). Übrigens ist 5 = 17 mod 6 = 11 mod 6 = 5 mod 6 = −1 mod 6 = . . . .... - genauer können wir das wie folgt formulieren: Für alle x ∈ 6Z + 5 := {6z + 5 : z ∈ Z} = {y ∈ Z : ∃z ∈ Z : y = 6z + 5} ist x mod 6 = 5. Auf diesen Typ von Mengen werden wir in Kürze noch sehr ausführlich zu sprechen kommen! B In dem speziellen Fall, dass n ein Teiler von m ist, bleibt beim Teilen von m durch n kein Rest übrig: ∀ m ∈ Z, n ∈ N : n|m ⇒ m mod n = 0. N 4 Ganz genau genommen hätten wir anstelle der angegebenen Formulierung auch ∀ m ∈ Z : ∀ n ∈ N : ∃1 q ∈ Z : ∃1 r ∈ {0, 1, . . . , n − 1} : m = qn + r schreiben können. 3.1 Begriffsklärung 60 Beweis (von Satz 3.1): Gemäß Definition 3.3 des eindeutigen Existenzquantors müssen wir zeigen, dass die Menge L = L(m, n) := {(q, r) ∈ Z × {0, . . . , n − 1} : m = qn + r} für alle m ∈ Z, n ∈ N einelementig ist. In einem ersten Schritt zeigen wir, dass sie nicht leer ist; das entspricht dem Nachweis der Existenz der besagten Zahlen q und r. Seien nun also m ∈ Z und n ∈ N beliebig. Definiert man q als die größte ganze Zahl, die kleiner oder gleich m ist, so gilt q ≤ m < q + 1. Daraus folgt nach Multiplikation mit n die n n Ungleichungskette nq ≤ m < qn + n, die gleichbedeutend ist mit 0 ≤ m − qn < n. Setzt man jetzt r := m − qn, so folgt m = qn + r und r ∈ {0, . . . , n − 1}, wie gefordert. Um das gerade beschriebene Element der Menge L formal angeben zu können, greifen wir für einen Augenblick etwas voraus und definieren das sogenannte Maximum einer Menge: Definition 3.5 Ist M ⊆ R, so definiert man k := max M :⇔ k ∈ M ∧ ∀ m ∈ M : k ≥ m und nennt k das Maximum von M. Es ist relativ einfach, sich zu überlegen, dass das Maximum einer Menge, sofern es überhaupt existiert, eindeutig bestimmt ist. In den Übungen werden Sie sich davon überzeugen. Kommen wir zurück zu unserem Existenzbeweis: Da q als die größte ganze Zahl, die kleiner ist, definiert wurde, ist q = max{z ∈ Z : z ≤ m }. Damit haben wir nachgewiesen, oder gleich m n n m dass das Paar (max{z ∈ Z : z ≤ n }, m − max{z ∈ Z : z ≤ m } · n) in L liegt und damit n insbesondere L nicht leer ist. Nun wollen wir zeigen, dass L außer dem gerade genannten geordneten Paar kein weiteres Element enthält - das entspricht der Eindeutigkeit der im Satz genannten Zahlen q und r. Zu diesem Zweck nehmen wir an, dass auch (q ′ , r ′ ) ∈ L sei, d.h., dass es eine zweite Darstellung ′ m = q ′ n + r ′ für Elemente q ′ ∈ Z und r ′ ∈ {0, . . . , n − 1} gibt. Dann folgt m = q ′ + rn mit n ′ 0 ≤ rn < 1. Demnach muss auch q ′ = max{z ∈ Z : z ≤ m } gelten, also q ′ = q. Diese Identität n impliziert die Gleichheit r ′ = m − q ′ n = m − qn = r; das Tupel (q ′ , r ′ ) stimmt also mit dem Tupel aus dem Existenzbeweis überein. Damit ist die Eindeutigkeit nachgewiesen. Nun folgt ein letztes, sehr bedeutendes Beispiel: Beispiel 3.3 Für alle n ∈ N sei Tn :={(a, b) ∈ Z × Z : a und b haben beim Teilen durch n denselben Rest} ={(a, b) ∈ Z × Z : a mod n = b mod n}. Dann gilt wegen 2 = 0 · 3 + 2 und 5 = 1 · 3 + 2 die Beziehung (2, 5) ∈ T3 . Wegen 2 = 0 · 3 + 2 und 6 = 2 · 3 + 0 gilt (2, 6) ∈ / T3 , es ist aber (2, 6) ∈ T4 . In Abbildung 3.5 ist die Relation T3 ausschnittsweise skizziert. 3.2 Eigenschaften von Relationen 61 Abb. 3.5 Skizze der Relation T3 . Statt (a, b) ∈ Tn ⇔ a mod n = b mod n schreibt man übrigens eher a ≡ b mod n und sagt a ist kongruent b modulo n. Den Grund für diese einer Gleichheit ähnelnde Schreibweise werden wir nach der Lektüre der beiden folgenden Abschnitte besser verstehen. Auf die Relationen Tn werden wir noch des Öfteren zu sprechen kommen! N 3.2 Eigenschaften von Relationen Schon für eine Menge M mit relativ wenigen Elementen lassen sich sehr viele Relationen auf ihr definieren5 . Von daher konzentriert man sich auf Relationen, die spezielle Eigenschaften erfüllen. Wir behandeln hier sechs besonders wichtige: Definition 3.6 Sei M eine Menge und R eine Relation auf M. Man nennt R (a) reflexiv :⇔ ∀ x ∈ M : (x, x) ∈ R, (b) symmetrisch :⇔ ∀ x, y ∈ M : (x, y) ∈ R ⇒ (y, x) ∈ R, (c) transitiv :⇔ ∀ x, y, z ∈ M : (x, y) ∈ R ∧ (y, z) ∈ R ⇒ (x, z) ∈ R, (d) antireflexiv 6 :⇔ ∀ x ∈ M : (x, x) ∈ / R, (e) antisymmetrisch :⇔ ∀ x, y ∈ M mit x 6= y : (x, y) ∈ R ⇒ (y, x) ∈ / R. 5 Im Rahmen der Kombinatorik - das ist ein Teilgebiet der Mathematik, das sich mit dem Zählen bzw. m2 2 X 2 m Abzählen beschäftigt - werden wir sehen, dass diese Anzahl gegeben ist durch den Ausdruck = 2(m ) , k k=0 sofern M genau m Elemente hat. 6 Mitunter sagt man auch irreflexiv statt antireflexiv. 3.2 Eigenschaften von Relationen R R 62 (f) total :⇔ ∀ x, y ∈ M mit x 6= y : (x, y) ∈ R ∨ (y, x) ∈ R. R Die sechs gerade eingeführten Eigenschaften sind nur für Relationen auf einer Menge M definiert, nicht für Relationen zwischen zwei verschiedenen Mengen! Die Eigenschaft antireflexiv darf nicht mit der Negation von reflexiv verwechselt werden. Während eine Relation R antireflexiv ist, wenn die Aussage (x, x) ∈ R für alle x ∈ R falsch ist, ist R nicht reflexiv, wenn es mindestens ein x ∈ M gibt, so dass (x, x) ∈ R falsch ist. Analog sind auch die Begriffe symmetrisch und antisymmetrisch nicht komplementär zueinander. Eine Relation R 6= ∅ kann nicht gleichzeitig reflexiv und antireflexiv sein. Vielleicht stellen Sie sich jetzt die Frage, ob eine Relation gleichzeitig symmetrisch und antisymmetrisch sein kann. Dazu betrachten wir folgendes Beispiel: Beispiel 3.4 Sei M eine beliebige Menge und idM := {(x, y) ∈ M × M : x = y} = {(x, x) : x ∈ M} die sogenannte Gleichheitsrelation. Dann ist idM symmetrisch und antisymmetrisch, reflexiv und transitiv. Antireflexivität liegt nicht vor, sofern M mindestens ein Element enthält; Totalität liegt nicht vor, sofern M mindestens zwei Elemente enthält. Insbesondere erfüllt id∅ = ∅ alle sechs Eigenschaften. N Umgekehrt kann man sich überlegen, dass jede Relation auf M, die reflexiv, symmetrisch und antisymmetrisch ist, die Gleichheitsrelation idM auf M sein muss. Führen Sie diesen Beweis zu Übungszwecken selber aus! Nun wollen wir unsere Relationen aus Beispiel 3.1 (Seite 55) auf die genannten Eigenschaften hin untersuchen: ad A & B Die Beispiele A und B sind nicht weiter zu betrachten, da es sich hier nicht um Relationen auf einer Menge, sondern um Relationen von einer Menge nach einer anderen Menge handelt. ad C Die Relation A ist per Definition reflexiv und symmetrisch. Außerdem ist sie transitiv. Sie ist aber weder antireflexiv noch antisymmetrisch, auch total ist sie nicht. ad D Die Relation K1 ist – nicht reflexiv (beispielsweise gilt (2, 2) ∈ / K1 ), – nicht symmetrisch (aus (3, 9) ∈ K1 folgt nicht (9, 3) ∈ K1 ) – nicht transitiv (beispielsweise gilt (2, 4) ∈ K1 und (4, 16) ∈ K1 , aber nicht (2, 16) ∈ K1 ), – nicht antireflexiv (denn (1, 1) ∈ K1 ), 3.2 Eigenschaften von Relationen 63 – antisymmetrisch (ist nämlich (x, y) ∈ K1 und x 6= y, so folgt y = x2 ∧ y ∈ / {0, 1}; √ √ / {0, 1}; dies impliziert x 6= y 2, insbesondere folgt daraus (x = y ∨ x = − y) ∧ y ∈ √ da y = y 2 nur für y ∈ {0, 1} gilt; dies bedeutet (y, x) ∈ / K1 per Definition) – nicht total (beispielsweise gilt (2, 3) ∈ / K1 und (3, 2) ∈ / K1 ). Die Relation K2 ist ebenfalls – nicht reflexiv (beispielsweise gilt (2, 2) ∈ / K2 ), – nicht symmetrisch (aus (9, 3) ∈ K2 folgt nicht (3, 9) ∈ K2 ) – nicht transitiv (beispielsweise gilt (16, 4) ∈ K2 und (4, 2) ∈ K2 , aber nicht (16, 2) ∈ K2 ), – nicht antireflexiv (denn (1, 1) ∈ K2 ), √ – antisymmetrisch (ist nämlich (x, y) ∈ K2 und x 6= y, so folgt (y = x ∨ y = √ − x) ∧ y ∈ / {0, 1}; insbesondere folgt daraus x = y 2 ∧ y ∈ / {0, 1}; dies impliziert √ √ wie oben x 6= − y ∧ x 6= y, woraus (y, x) ∈ / K2 direkt folgt. – nicht total (beispielsweise gilt (2, 3) ∈ / K2 und (3, 2) ∈ / K2 ). ad E Offensichtlich ist U reflexiv (a ≤ a für alle a ∈ N), transitiv (ist a ≤ b und b ≤ c für natürliche Zahlen a, b, c, so folgt auch a ≤ c) und antisymmetrisch (ist a ≤ b und a 6= b für natürliche Zahlen a und b, so folgt b a ⇔ b > a). Symmetrisch ist U nicht, antireflexiv auch nicht. Die Relation U ist jedoch total, denn für je zwei natürliche Zahlen a und b mit a 6= b gilt immer entweder a ≤ b oder b ≤ a. Was Beispiel 3.3 betrifft, lässt sich folgendes festhalten: Für alle n ∈ N ist die Relation Tn • reflexiv (a hat beim Teilen durch n denselben Rest wie a), • symmetrisch (hat a beim Teilen durch n denselben Rest wie b, so hat auch b beim Teilen durch n denselben Rest wie a), • transitiv ((a, b) ∈ Tn und (b, c) ∈ Tn bedeutet, dass es Zahlen qa , qb , qc ∈ Z und r ∈ {0, . . . , n − 1} gibt, so dass a = qa n + r, b = qb n + r und c = qc n + r; insbesondere haben also auch a und c beim Teilen durch n denselben Rest r, d.h. es gilt (a, c) ∈ Tn ), • weder antisymmetrisch noch antireflexiv. Was die letztgenannte Eigenschaft der Totalität betrifft, müssen wir eine Fallunterscheidung machen. 1. Fall: Ist n = 1, so ist Tn = T1 total: Beim Teilen durch 1 lassen nämlich alle ganzen Zahlen den Rest 0, d.h. alle ganzen Zahlen stehen in Relation zu allen anderen ganzen Zahlen: Es ist also T1 = Z × Z. Man sagt auch: T1 ist die Allrelation auf Z. Damit gilt insbesondere für je zwei verschiedene ganze Zahlen a und b, dass (a, b) ∈ T1 ∨ (b, a) ∈ T1 erfüllt ist. 2. Fall: Für n ≥ 2 ist die Situation anders: Die Relationen Tn sind dann nicht mehr total, denn die natürlichen Zahlen n und n − 1 haben dann beim Teilen durch n sicher nicht den gleichen Rest: n hat Rest 0, n − 1 hat Rest n − 1 6= 0. Also liegt weder das Tupel (n, n − 1) noch das Tupel (n − 1, n) in Tn . 3.3 Äquivalenzrelationen und Äquivalenzklassen 64 Außer den sechs genannten gibt es noch eine ganze Reihe weiterer Eigenschaften für Relationen. Einige dieser Eigenschaften sind kombinierbar, andere nicht. Im Folgenden werden wir uns einigen ganz speziellen Kombinationen der oben genannten Eigenschaften widmen, den Äquivalenzrelationen, den Halbordnungsrelationen und den Ordnungsrelationen. 3.3 Äquivalenzrelationen und Äquivalenzklassen Definition 3.7 Eine Relation R auf einer Menge M heißt Äquivalenzrelation, wenn sie reflexiv, symmetrisch und transitiv ist. In diesem Fall nennt man Elemente x und y, für die (x, y) ∈ R gilt, äquivalent zueinander. Ist R eine Äquivalenzrelation auf einer Menge M, so schreibt man anstelle von (x, y) ∈ R häufig x ∼R y oder noch kürzer x ∼ y. Wir werden uns dieser Gewohnheit anschließen. Von den Relationen in Beispiel 3.1 ist nur die Gästerelation in C eine Äquivalenzrelation. Außerdem ist, wie wir uns oben überlegt haben, für alle n ∈ N die Relation Tn eine Äquivalenzrelation. Und schließlich ist die Gleichheitsrelation idM aus Beispiel 3.4 ebenfalls eine Äquivalenzrelation. In gewissem Sinne kann jede Äquivalenzrelation als eine Verallgemeinerung der Gleichheitsrelation verstanden werden. Während letztere zwei Elemente in Relation zueinander setzt, die genau gleich - also insbesondere nicht unterscheidbar - sind, setzen Äquivalenzrelationen Elemente in Beziehung zueinander, die in einer bestimmten Hinsicht oder aus einer bestimmten Perspektive nicht zu unterscheiden sind. Die auf diese Art verwandten“ Elemente fasst man ” in einer sogenannten Äquivalenzklasse zusammen: Definition 3.8 Ist R eine Äquivalenzrelation auf einer Menge M, so wird für jedes x ∈ M die Menge [x] := {y ∈ M : (x, y) ∈ R} = {y ∈ M : x ∼R y} aller zu x äquivalenten Elemente als Äquivalenzklasse von x bezeichnet. Im Folgenden wollen wir die in unseren Beispielen aufgetretenen Äquivalenzklassen beschreiben: Der Einfachheit halber beginnen wir mit der Gleichheitsrelation: Fortsetzung von Beispiel 3.4 (auf Seite 62): Ist M eine beliebige Menge und idM = {(x, x) : x ∈ M} die Gleichheitsrelation, so ist [x] := {y ∈ M : (x, y) ∈ idM } = {x}. Die Äquivalenzklasse von x ist also für alle x ∈ M einelementig. Im Fall der Gästerelation A auf G in Beispiel 3.1 C gestaltet sich die Situation etwas anders: Zur übersichtlicheren Darstellung gehen wir wieder von dem in Abbildung 3.2 beschriebenen Spezialfall aus. Dann ist [Ben] = [Jil] = [Mia] = {Ben, Jil, Mia}, [Jan] = {Jan}, [Max] = [Tim] = {Max, Tim}, 3.3 Äquivalenzrelationen und Äquivalenzklassen 65 [Ole] = [Tom] = [Uwe] = [Zoé] = {Ole, Tom, Uwe, Zoé}. Nun betrachten wir die Rrelation Tn (wobei n ∈ N beliebig ist) aus Beispiel 3.3: Für jedes a ∈ Z ist hier [a] = {b ∈ Z : b hat beim Teilen durch n denselben Rest wie a} = {nk + a : k ∈ Z}. Speziell ist also für n = 3 und jedes a ∈ Z [a] = {3k + a : k ∈ Z} =: 3Z + a und damit insbesondere [0] = {. . . , −6, −3, 0, 3, 6, 9, 12, 15, . . .} = 3Z + 0, [1] = {. . . , −5, −2, 1, 4, 7, 10, 13, . . .} = 3Z + 1 und [2] = {. . . , −4, −1, 2, 5, 8, 11, 14, . . .} = 3Z + 2. Die Äquivalenzklasse [3] stimmt mit der Äquivalenzklasse [0] überein, wie man wie folgt leicht einsieht: [3] = {3k + 3 : k ∈ Z} = {3(k + 1) : k ∈ Z} = {3l : l ∈ Z} = 3Z = 3Z + 0 = [0]. Übrigens gilt auch [−3] = {3k + (−3) : k ∈ Z} = {3(k − 1) : k ∈ Z} = {3m : m ∈ Z} = 3Z = 3Z + 0 = [0] und allgemeiner für alle z ∈ Z die Identität [3z] = [0]. Ganz analog überlegt man sich, dass 3Z + 1 = [1] = [4] = [−2] = [7] = [−5] = . . . und 3Z + 2 = [2] = [5] = [−1] = [8] = [−4] = . . .. Allgemeiner gilt für alle b ∈ [a] wegen der Transitivität der Relation Tn die Gleichheit [b] = [a]: Um dies einzusehen, müssen wir zwei Mengeninklusionen nachweisen; zunächst zeigen wir [b] ⊆ [a]: Ist b ∈ [a], so gilt 7 b ∼ a nach Definition von [a]. Ist nun c ∈ [b], also c ∼ b, so folgt aus der Transitivität auch c ∼ a, was c ∈ [a] bedeutet. Da c beliebig gewählt war, folgt [b] ⊆ [a]. Die umgekehrte Inklusion [a] ⊆ [b] zeigt man völlig analog. Die Tatsache, dass die Äquivalenzklassen zweier zueinander äquivalenter Elemente übereinstimmen, gilt im Übrigen für jede Äquivalenzrelation - wir haben hier ja keinerlei Besonderheiten von Tn verwendet: Satz 3.2 Ist R eine Äquivalenzrelation auf einer Menge M, so folgt aus (a, b) ∈ R die Identität [b] = [a]. Nun studieren wir die Äquivalenzklassen bezüglich der Relation T2 : Wir erhalten 7 Wir schreiben hier, wie oben angekündigt, abkürzend b ∼ a anstelle von (b, a) ∈ Tn . 3.3 Äquivalenzrelationen und Äquivalenzklassen 66 [0] = {. . . , −6, −4, −2, 2, 4, 6, . . .} = 2Z und [1] = {. . . , −5, −3, −1, 1, 3, 5, 7, . . .} = 2Z + 1, also eine Unterteilung der Menge der ganzen Zahlen in die Äquivalenzklasse [0] der Menge der geraden Zahlen und die Äquivalenzklasse [1] der Menge der ungeraden Zahlen. Beachten Sie, dass auch im Fall n = 3 die Vereinigung der drei paarweise disjunkten Äquivalenzklassen [0], [1] und [2] die Ausgangsmenge Z bildet. Wir kommen darauf gleich zurück! Für n = 1 hat man, da jede Zahl beim Teilen durch 1 den Rest 0 hat, [0] = Z, also nur eine Äquivalenzklasse. Alle bezüglich einer Äquivalenzrelation in einer Äquivalenzklasse liegenden Elemente haben in einer durch die Relation wohldefinierten Art und Weise etwas gemein. Man kann sie sozusagen vom Standpunkt der Relation aus nicht mehr unterscheiden. Besonders deutlich wird das vielleicht an dem folgenden, zugegebenermaßen informellen, aber einleuchtenden Beispiel: Sei Ω die Menge aller in Hamburg lebenden Menschen; wir definieren, dass zwei Menschen in Relation zueinander stehen, wenn sie denselben Nachnamen haben. Die Äquivalenzklasse von mir besteht dann aus allen in Hamburg lebenden Personen, die Koch mit Nachnamen heißen. Und Ihre Äquivalenzklasse umfasst alle in Hamburg lebenden Personen, die Ihren Nachnamen tragen. Äquivalenzklassen zu häufigen Nachnamen umfassen also viele Elemente, die zu seltenen Nachnamen enthalten nur wenige Elemente. Wenn man nun den Nachnamen einer Hamburger Person als Unterscheidungsmerkmal heranzieht, sind die Elemente einer Äquivalenzklasse nicht unterscheidbar (wenngleich diese Elemente in jeder anderen Hinsicht höchstwahrscheinlich sehr wohl verschieden voneinander sind). Zum Vergleich: Die Elemente der Äquivalenzklasse [3] = {. . . , 6−, −3, 0, 3, 6, 9, 12, . . .} bezüglich der Relation T3 sind natürlich auch alle verschieden (sonst wären sie ja gar nicht alle aufgelistet - eine Menge enthält ja jedes Element nur einmal), wenn man aber die ganzen Zahlen nur im Hinblick darauf unterscheidet, welchen Rest sie beim Teilen durch 3 haben, sind 3 und 6 nicht länger verschieden. Die Menge aller Äquivalenzklassen wird in der sogenannten Quotientenmenge zusammengefasst: Definition 3.9 Sei M eine Menge und R eine Äquivalenzrelation auf M. Die Menge M/R := {[x] : x ∈ M} aller Äquivalenzklassen bezüglich R heißt Quotientenmenge von M bezüglich R. Beachten Sie, dass in einer Menge jedes Element nur einmal vorkommt. Stimmen also [x] und [y] für zwei verschiedene Elemente x und y in M überein, so taucht [x](= [y]) in der Quotientenmenge M/R natürlich nur einmal auf! Zum besseren Verständnis dieses recht abstrakten Begriffes wollen wir die Quotientenmenge für die oben genannten Beispiele ermitteln: 3.3 Äquivalenzrelationen und Äquivalenzklassen 67 Fortsetzung von Beispiel 3.4 (auf Seite 64): Für die Gleichheitsrelation idM = {(x, x) : x ∈ M} auf M gilt wegen [x] = {x} für alle x ∈ M die Gleichheit M/idM = {[x] : x ∈ M} = {{x} : x ∈ M}. Im Fall der Gästerelation in Beispiel 3.1 C gehen wir wie auf Seite 64 von der konkreten Namensliste aus: Dann ist G/A = {[Ben], [Jan], [Max], [Ole]} = {{Ben, Jil, Mia}, {Jan}, {Max, Tim}, {Ole, Tom, Uwe, Zoé}}. Hätte man G/A auch anders beschreiben können? Beachten Sie den Unterschied zwischen G und G/A: Während G = {Ben, Jil, Mia, Jan, Max, Tim, Ole, Tom, Uwe, Zoé} die Menge aller Gäste der Party ist, ist G/A die Menge aller Gruppen, in denen die Gäste zur Party erschienen sind. Natürlich enthalten diese Gruppen die Namen aller Gäste, aber die Elemente in G/A sind eben nicht die einzelnen Namen, sondern die Gruppen. G/A ist also im Unterschied zu G eine Menge von Teilmengen von G! Schließlich betrachten wir wieder die Relation Tn aus Beispiel 3.3: Ist n = 3, so erhält man Z3 := Z/T3 = {[0], [1], [2]} = {3Z, 3Z + 1, 3Z + 2}. Für allgemeines n ∈ N gilt Zn := Z/Tn = {[0], [1], . . . , [n − 1]} = {nZ, nZ + 1, . . . , nZ + (n − 1)}. Insbesondere ist Z1 := Z/T1 = {[0]} = {Z}. Die Quotientenmenge Z1 darf nicht mit der Menge Z verwechselt werden: Während die Menge Z alle ganzen Zahlen (und damit unendlich viele Elemente) enthält, ist Z1 einelementig: In dieser Menge ist nämlich als einziges Element die Menge der ganzen Zahlen (und damit keine einzige einzelne ganze Zahl) enthalten. Schauen wir uns nun, wie oben angekündigt, das Verhältnis von G und G/A in Beispiel 3.1 C mal etwas näher an: Zu jedem Element g ∈ G gibt es eine Äquivalenzklasse [g] ∈ G/A, die g enthält. Umgekehrt bildet jede Äquivalenzklasse eine Teilmenge von G. Wenn wir also die Vereinigung aller Äquivalenzklassen bilden, liefert dies genau die Ausgangsmenge G: {Ben, Jil, Mia} ∪ {Jan}, {Max, Tim} ∪ {Ole, Tom, Uwe, Zoé} = = {Ben, Jil, Mia, Jan, Max, Tim, Ole, Tom, Uwe, Zoé} = G. (3.13) 3.3 Äquivalenzrelationen und Äquivalenzklassen 68 Die linke Seite in (3.13) können wir (beispielsweise) auch schreiben als 8 [Ben] ∪ [Jan] ∪ [Max] ∪ [Ole]. (3.14) Für diese Vereinigung von Äquivalenzklassen in (3.14) werden wir im Folgenden kürzer [ [g] [g]∈G/A notieren 9 . Mit dieser Vereinbarung entspricht dann (3.13) folgender Identität: [ [g] = G. (3.15) [g]∈G/A In Worten: Die Vereinigung aller Äquivalenzklassen der Relation A in G stimmt mit der Ausgangsmenge G überein. Dieser Sachverhalt liegt auch in den beiden anderen Situationen vor: Um das zu verdeutlichen, sei zunächst noch eine Schreibweise eingeführt, die die oben getroffene Vereinbarung zur Notation von Vereinigungen über Äquivalenzklassen verallgemeinert: Ist eine beliebige Menge I (auch Indexmenge genannt) gegeben und zu jedem i ∈ I eine [ Menge Ai , so notiert man die Vereinigung all dieser (ggf. unendlich vielen) Mengen Ai als Ai . Formal bedeutet das i∈I [ i∈I Ai := {x : ∃ i ∈ I : x ∈ Ai }. Im Beispiel der Gleichheitsrelation erhält man damit wegen M/idM = {{x} : x ∈ M} und [x] = {x} die Identität [ [ [ [x] = {x} = {x} = M. (3.16) [x]∈M/idM {x}∈M/idM x∈M Für die Relationen Tn liest sich das entsprechend so: [ [ [k] = [k] = [0] ∪ . . . ∪ [n − 1] = nZ ∪ . . . ∪ nZ + (n − 1) = Z. [k]∈Zn (3.17) k∈{0,...,n−1} Die Identitäten (3.15) bis (3.17) zeigen an, dass in allen bisher betrachteten Fällen folgende Gleichheit gilt: [ M= [x], (3.18) [x]∈M/R S dabei ist [x]∈M/R [x] = {y ∈ M : ∃ [x] ∈ M/R : y ∈ [x]} gerade die Menge aller Elemente aus M, zu denen es eine Äquivalenzklasse gibt, der sie angehören. 8 Wir erinnern uns daran, dass die Vereinigungsbildung von Mengen assoziativ ist: Eine Vereinigung von vier Mengen können wir also bilden, indem wir beispielsweise erst die beiden ersten Mengen vereinigen, dieses Ergebnis dann mit der dritten Menge vereinigen und die so erhaltene Menge schließlich mit der vierten Menge vereinigen. 9 Beachten Sie, dass - weil eine Menge jedes Element nur einmal enthält und Äquivalenzklassen zueinander S S äquivalenter Elemente übereinstimmen - folgende Gleichheit gilt: [g]∈G/A [g] = g∈G [g]. 3.3 Äquivalenzrelationen und Äquivalenzklassen 69 Die Vereinigung aller Äquivalenzklassen der Relation R auf M liefert also jeweils gerade die Ausgangsmenge M. Außerdem sind die Äquivalenzklassen in M/idM , G/A und Z/Tn jeweils paarweise disjunkt, d.h. dass der Schnitt je zweier verschiedener Äquivalenzklassen leer ist - oder anders gesagt: zwei verschiedene Äquivalenzklassen nie ein Element gemeinsam haben. Diese Situation liegt auch im Allgemeinen vor! Im folgenden Satz wird dies formuliert: Satz 3.3 Ist R eine Äquivalenzrelation auf M und M/R die Quotientenmenge von M bezüglich R, so gilt: (a) [x], [y] ∈ M/R ⇒ [x] = [y] ∨ [x] ∩ [y] = ∅, [ (b) M = [x]. [x]∈M/R Beweis: (a) Seien [x], [y] ∈ M/R zwei Äquivalenzklassen. Gilt dann [x] ∩ [y] = ∅, so sind wir fertig. Andernfalls existiert ein Element z ∈ M, für welches z ∈ [x] und z ∈ [y] richtig ist. Das heißt, es gilt z ∼ x und z ∼ y. Aus der Transitivität von R folgt dann auch x ∼ y, was x ∈ [y] und damit wegen Satz 3.2 die Gleichheit [x] = [y] nach sich zieht. S (b) Es sind zwei Inklusionen zu verifizieren. Zuerst zeigen wir M ⊆ [x]∈M/R [x]: Dazu sei x ∈ M. Aus der Reflexivität von M folgt x ∈ [x] und da M/R alle Äquivalenzklassen S von M bezüglich R enthält, gilt auch [x] ∈ M/R. Daraus folgt x ∈ [x]∈M/R [x], was die S Inklusion M ⊆ [x]∈M/R [x] beweist. S S Nun zeigen wir die Umkehrung [x]∈M/R [x] ⊆ M. Dazu sei y ∈ [x]∈M/R [x]. Dann existiert ein [x] ∈ M/R, so dass y ∈ [x], nämlich [x] = [y]. Da [y] ⊆ M ist, folgt daraus auch y ∈ M. Da y beliebig gewählt war, folgt hieraus die Behauptung. Definition 3.10 Sei M eine beliebige Menge, T eine nichtleere Indexmenge und {Kt : t ∈ T } eine Familie von nichtleeren Teilmengen von M, so dass (a) Ki ∩ Kj = ∅, falls i, j ∈ T und i 6= j, S (b) Kt = M. t∈T Dann nennt man {Kt : t ∈ T } eine Partition von M. Satz 3.3 sagt also aus, dass die Äquivalenzklassen einer Äquivalenzrelation auf M eine Partition der Menge M liefern (man beachte, dass jede Äquivalenzklasse mindestens ein Element enthält). Man kann zeigen, dass umgekehrt zu jeder Partition {Kt : t ∈ T } von M eine Äquivalenzrelation R auf M existiert, deren Äquivalenzklassen genau mit den Mengen Kt , t ∈ T , übereinstimmen. Im Rahmen der Übungen werden Sie den Beweis selber durchführen. Definition 3.11 Ist R eine Äquivalenzrelation auf M und M/R die Quotientenmenge von M bezüglich R, so nennt man jede Menge, in der aus jeder Äquivalenzklasse in M/R genau ein Element enthalten ist, ein vollständiges Repräsentantensystem von M. 3.4 Halbordnungs- und Ordnungsrelationen 70 Festigen wir das Verständnis dieses Begriffes wieder anhand unserer Beispiele: • M ist das einzig mögliche Repräsentantensystem der Gleichheitsrelation auf M. • {Ben, Jan, Max, Ole} ist ein Repräsentantensystem für A auf G, {Mia, Jan, Tim, Zoé} wäre aber auch eins. • {0, 1, 2}, {−3, −2, −1} und {5, 18, 331} sind drei mögliche Repräsentantensysteme für T3 . Entsprechend sind z. Bsp. {0, 1} und {687, 34} Repräsentantensysteme für T2 ; für jedes m ∈ N ist {m} ein Repräsentantensystem für T1 . Allgemein ist {0, 1, . . . , n − 2, n − 1} ein Repräsentantensystem für Tn (n ∈ N). Im Zusammenhang mit strukturmathematischen Begriffen wie Gruppe, Ring und Körper, die der Teildisziplin Algebra zuzuordnen sind, werden wir auf die Quotientenmengen und Repräsentantensysteme noch einmal zurückkommen. 3.4 Halbordnungs- und Ordnungsrelationen In diesem Abschnitt behandeln wir zwei weitere, sehr wichtige Relationstypen, Halbordnungsund Ordnungsrelationen. Derartige Relationen erlauben es, die Elemente einer Menge anzu” ordnen“, also hinsichtlich einer bestimmten Eigenschaft (wie z. Bsp. Größe) zu sortieren. Insbesondere sind Ordnungsrelationen als Verallgemeinerungen der Ihnen bereits aus der Grundschulzeit bekannten Kleiner-Gleich-Beziehung zu betrachten; letztere ermöglicht es, die Menge der reellen Zahlen durch einen Zahlenstrahl“ zu veranschaulichen. ” Definition 3.12 Eine Relation R auf einer Menge M heißt Halbordnungsrelation, wenn sie reflexiv, antisymmetrisch und transitiv ist. Von den in den Abschnitten 3.1 und 3.2 behandelten Beispielen erfüllen nach den Untersuchungen in Abschnitt 3.2 nur • die Kleiner-Gleich-Relation in Beispiel 3.1 E (siehe Seite 63) und • die auch im letzten Abschnitt als Äquivalenzrelation diskutierte Gleichheitsrelation alle Eigenschaften einer Halbordnungsrelation; die der Kleiner-Gleich-Relation analoge GrößerGleich-Relation {(a, b) ∈ N × N : a ≥ b} ist ebenfalls eine Halbordnungsrelation, aber weder die Kleiner-Relation {(a, b) ∈ N × N : a < b} noch die Größer-Relation {(a, b) ∈ N × N : a > b} sind Halbordnungsrelationen - sie sind jeweils nicht reflexiv. Machen Sie sich klar, dass die Halbordnungseigenschaften der Kleiner-Gleich- und der GrößerGleich-Relation auf N erhalten bleiben, wenn man diese Relationen auf R ausdehnt - mit 3.4 Halbordnungs- und Ordnungsrelationen 71 Abb. 3.6 Skizze der Kleiner-Gleich-Relation auf R. anderen Worten: {(a, b) ∈ R2 : a ≤ b} und {(a, b) ∈ R2 : a ≥ b} sind ebenfalls reflexiv, antisymmetrisch und transitiv! Anders verhält sich dies im Fall der oben bereits eingeführten Teilbarkeitsrelation: Ist, wie in (3.7), TZ := T = {(n, m) ∈ Z2 : n | m} die Teilbarkeitsrelation auf Z, so ist TZ reflexiv (es gilt ja ∀ n ∈ Z : n = 1 · n) und transitiv (das wird in den Übungen nachgewiesen), aber nicht antisymmetrisch: Es gilt nämlich 5 6= −5 und sowohl 5 | −5 ⇔ (5, −5) ∈ TZ als auch −5 | 5 ⇔ (−5, 5) ∈ TZ . Schränkt man die Relation T jedoch auf N ein, TN := {(n, m) ∈ N2 : n | m}, so ist auch Antisymmetrie erfüllt: Mit n, m ∈ N ist (n, m) ∈ TN ⇔ n | m nämlich gleichbedeutend zu der Existenz einer natürlichen (also positiven Zahl) k, für die m = kn gilt. Insbesondere bedeutet dies, dass n ≤ m ist. Da bei der Überprüfung von Antisymmetrie n 6= m vorausgesetzt werden muss, können wir sogar von m > n ausgehen. Damit gilt aber erst recht km > n für alle natürlichen k und also ¬(∃ k ∈ N : n = km), das bedeutet m ∤ n ⇔ (m, n) ∈ / TN . Da Reflexivität und Transitivität bei der Einschränkung von T auf N erhalten bleiben, ist TN eine Halbordnungsrelation, TZ hingegen nicht. Dieses Beispiel soll Ihnen klar machen, dass die Eigenschaften einer Relation von der Menge, auf der sie definiert ist, ganz entscheidend abhängen! Generell gilt, dass beim Einschränken einer auf M bestehenden Halbordnungsrelation auf eine Teilmenge N ⊆ M alle Halbordnungseigenschaften erhalten bleiben (klar?!), während beim Ausdehnen einer derartigen Relation auf eine echte Obermenge L ⊃ M einzelne Halbordnungseigenschaften verloren“ gehen können: ” 3.4 Halbordnungs- und Ordnungsrelationen 72 Bemerkung 3.1 Ist M 6= ∅ und R eine Halbordnungsrelation auf M, so ist für jedes N ⊆ M mit N 6= ∅ auch RN := {(x, y) ∈ R : x, y ∈ N} (3.20) eine Halbordnungsrelation auf N; man nennt RN die durch R auf N induzierte Halbordnungsrelation. Beispiel 3.5 Die durch die bereits mehrfach erwähnte Kleiner-Gleich-Relation induzierte Halbordnungsrelation auf der Menge {1, 2, 5} ist gegeben durch {(1, 1), (1, 2), (1, 5), (2, 2), (2, 5), (5, 5)}. Soweit haben wir gesehen, dass sowohl die Teilbarkeitsrelation auf N als auch die KleinerGleich-Relation auf R (und damit auch auf N) Halbordnungsrelationen sind. In einem wichtigen Punkt unterscheiden sich diese beiden Relationen aber: Die Kleiner-Gleich-Relation ist total (siehe Seite 63), die Teilbarkeitsrelation hingegen nicht: Wählt man beispielsweise m = 3 und n = 7, so gilt weder m | n noch n | m. Bezüglich der Teilbarkeitseigenschaft sind also nur bestimmte Elemente aus N vergleichbar bzw. zueinander ins Verhältnis zu setzen. Ähnlich verhält sich das in der folgenden Situation: Beispiel 3.6 Sei G eine beliebige nichtleere Menge und P(G) die Potenzmenge von G. Dann ist die Teilmengenrelation τ , definiert gemäß τ := {(A, B) ∈ P(G) × P(G) : A ⊆ B}, (3.21) eine Halbordnungsrelation auf P(G), im Allgemeinen10 aber nicht total. Der Beweis dieser Aussage ist Gegenstand der Übungen. N Halbordnungsrelationen, bei denen beliebige Elemente der Ausgangsmenge verglichen werden können, nennt man Ordnungsrelationen: Definition 3.13 Eine Halbordnungsrelation R auf einer Menge M heißt Ordnungsrelation, wenn sie total ist. Als Beispiele für Ordnungsrelationen sind damit die Kleiner-Gleich- und die Größer-GleichRelation auf R zu nennen. Definition 3.14 Ist M eine Menge und R eine Ordnungsrelation auf M, so bezeichnet man das Paar (M, R) als eine Ordnungsstruktur; weiter sagt man, dass die Menge M durch R geordnet ist. Die Menge R der reellen Zahlen ist also sowohl durch die Kleiner-Gleich-Relation als auch durch die Größer-Gleich-Relation geordnet. 10 Enthält G höchstens ein Element, so ist diese Halbordnungsrelation sogar total. 3.4 Halbordnungs- und Ordnungsrelationen 73 Abb. 3.7 Hasse-Diagramm der Teilmengenrelation auf der Menge {0, 1, 2}. Als nächstes sei eine Möglichkeit zur graphischen Darstellung von Halbordnungsrelationen auf endlichen Mengen vorgestellt, das sogenannte Hasse-Diagramm 11 : Der Übersichtlichkeit zuliebe beschränkt man sich hierbei auf die Darstellung derjenigen Beziehungen, die nicht der Reflexivität bzw. Transitivität der Relation zuzuschreiben sind. Vor diesem Hintergrund sind die Begriffe unmittelbarer Vorgänger bzw. Nachfolger relevant: Definition 3.15 Sei M 6= ∅ eine Menge und R eine Halbordnungsrelation auf M. Ein Element x ∈ M heißt unmittelbarer Vorgänger von y ∈ M, falls x 6= y, (x, y) ∈ R und falls kein z ∈ M \ {x, y} existiert, so dass (x, z) ∈ R ∧ (z, y) ∈ R. In diesem Fall nennt man y auch unmittelbaren Nachfolger von x. Das Hasse-Diagramm einer Halbordnungsrelation R auf M enthält alle Elemente der Menge M und gerichtete Pfeile zwischen all solchen Paaren von Elementen, bei denen das Zielelement unmittelbarer Nachfolger des Startelements ist. Beispiel 3.7 Definiert man die Teilmengenrelation (3.21) auf der Menge P({0, 1, 2}) aller 8 Teilmengen der Menge {0, 1, 2}, so sieht das Hasse-Diagramm hierzu aus wie in Abbildung 3.7: Der Pfeil von {0} nach {0, 1} drückt aus, dass {0, 1} unmittelbarer Nachfolger von {0} ist. Es ist nämlich {0} ⊂ {0, 1} und für alle A ∈ P({0, 1, 2}) \ {{0}, {0, 1}} die Konjunktion {0} ⊆ A∧A ⊆ {0, 1} falsch. Ebenso ist aber auch {0, 2} unmittelbarer Nachfolger von {0}. Einen Pfeil zwischen {0} und {0, 1, 2} gibt es trotz der Gültigkeit von {0} ⊂ {0, 1, 2} nicht: im Hasse-Diagramm werden nur Elementpaare verbunden, bei denen das eine Element unmittelbarer Vorgänger bzw. Nachfolger des anderen Elements ist. N Beispiel 3.8 Die von der Kleiner-Gleich-Relation auf der ebenfalls aus 8 Elementen bestehenden Menge {1, 2, 3, 4, 5, 6, 7, 8} induzierte Relation K := {(1, 1), (1, 2), . . . , (1, 8), (2, 2), (2, 3), . . . , (2, 8), (3, 3), . . . , (3, 8), . . . , (7, 7), (7, 8), (8, 8)} 11 Helmut Hasse, ∗ 25. August 1898 in Kassel, † 26. Dezember 1979 in Ahrensburg bei Hamburg, war ein deutscher Mathematiker, der sich insbesondere mit Algebra und Zahlentheorie beschäftigte. 3.4 Halbordnungs- und Ordnungsrelationen 74 Abb. 3.8 Hasse-Diagramm der Kleiner-Gleich-Relation auf der Menge {1, . . . , 8}. ist eine Ordnungsrelation (siehe Bemerkung 3.1). Das Hasse-Diagramm hierzu befindet sich in Abbildung 3.8: Deutlich zu erkennen ist, dass im Fall der totalen Kleiner-Gleich-Relation jedes Element nur genau einen unmittelbaren Nachfolger hat, während im Fall der nicht totalen Teilmengenbeziehung in Beispiel 3.7 einzelne Elemente mehrere unmittelbare Nachfolger haben. Überlegen Sie mal, ob und ggf. wie sich dieser Zusammenhang allgemein formulieren und beweisen lässt. N Studiert man Halbordnungs- und Ordnungsrelationen, drängt sich die Frage nach der Existenz von größten oder kleinsten Elementen in der betrachteten Menge auf. Wir werden gleich sehen, dass wir mit diesen Begriffen im Fall von Halbordnungsrelationen sehr viel vorsichtiger umgehen müssen als im Fall von Ordnungsrelationen. Definition 3.16 Sei M 6= ∅, R eine Halbordnungsrelation auf M und ∅ = 6 N ⊆ M. Ein Element s ∈ N heißt (a) maximales Element in N :⇔ ∀ t ∈ N : (s, t) ∈ R ⇒ t = s, R (b) minimales Element in N :⇔ ∀ t ∈ N : (t, s) ∈ R ⇒ t = s. Beachten Sie, dass die Maximalitätsbedingung eines Elements s äquivalent ist zu folgenden Bedingungen: ∀ t ∈ N : (s, t) ∈ R ⇒ t = s ⇔ ∀ t ∈ N : (s, t) ∈ R ⇔ t = s ⇔ ∀ t ∈ N : t 6= s ⇒ (s, t) ∈ / R. Die letztgenannte Bedingung ist besonders plausibel: Gilt für ein Element t ∈ N, dass es nicht gleich dem maximalen Element ist, so steht s nicht in Relation zu diesem Element t. Da in Relation zu stehen bedeutet, dass s kleiner oder höchstens gleich“ t ist, muss ” 3.4 Halbordnungs- und Ordnungsrelationen R 75 s also größer“ als t sein - und genau das erwartet man ja auch von einem maximalen ” Element. Falls die Halbordnungsrelation total ist, folgt aus t 6= s ∧ (s, t) ∈ / R, dass (t, s) ∈ R - auch das verwundert nicht: Wenn s maximales Element ist, sollte ja jedes andere Element t der Menge kleiner“ als s sein, das bedeutet aber gerade (t, s) ∈ R. ” Analog kann man sich überlegen, dass die Minimalitätsbedingung eines Elements s äquivalent ist zu ∀ t ∈ N : (t, s) ∈ R ⇒ t = s ⇔ ∀ t ∈ N : (t, s) ∈ R ⇔ t = s ⇔ ∀ t ∈ N : t 6= s ⇒ (t, s) ∈ / R. Nun werden weitere ordnungstheoretische Begriffe definiert: Definition 3.17 Sei M 6= ∅, R eine Halbordnungsrelation auf M und ∅ = 6 N ⊆ M. Ein Element x ∈ M heißt (a) obere Schranke von N (in M) :⇔ ∀ s ∈ N : (s, x) ∈ R, (b) untere Schranke von N (in M) :⇔ ∀ s ∈ N : (x, s) ∈ R. Beachten Sie, dass eine obere bzw. untere Schranke von N ⊆ M selbst ein Element von N sein kann! Definition 3.18 Unter den Bedingungen von Definition 3.17 heißt ein Element (a) y ∈ ON := {x ∈ M : x ist obere Schranke von M} Supremum von N (in M), in Zeichen: y = sup N :⇔ ∀ z ∈ ON : (y, z) ∈ R; gilt y = sup N ∈ N, so nennt man y auch das Maximum von N, in Zeichen: y = max N, 12 (b) y ∈ UN := {x ∈ M : x ist untere Schranke von M} R Infimum von N (in M), in Zeichen: y = inf N :⇔ ∀ z ∈ UN : (z, y) ∈ R; gilt y = inf N ∈ N, so nennt man y auch das Minimum von N, in Zeichen: y = min N. Anschaulich gesprochen ist also das Supremum einer Menge deren kleinste obere Schranke und das Infimum einer Menge deren größte untere Schranke. Beispiel 3.9 A Die Menge Z ⊆ R hat bezüglich der ≤-Relation weder maximale noch minimale Elemente, keine oberen und unteren Schranken und damit auch weder ein Supremum noch ein Infimum. Jede endliche Teilmenge (d.h., dass die Teilmenge nur endlich viele Elemente hat), hat aber sowohl maximale als auch minimale Elemente, ein Supremum, was gleichzeitig Maximum ist, und ein Infimum, was gleichzeitig Minimum ist. 13 12 Beachten Sie, dass diese Definition des Maximums für eine Teilmenge der reellen Zahlen, ausgestattet mit der gewöhnlichen Kleiner-Gleich-Relation ≤, mit der in Abschnitt 3.1 gegebenen Definition 3.5 übereinstimmt! 13 Dieser Ihnen evtl. ganz selbstverständlich erscheinenden Tatsache werden wir uns im Zusammenhang mit dem Aufbau der Zahlbereiche noch genauer widmen. 3.4 Halbordnungs- und Ordnungsrelationen 76 B Seien a, b ∈ R mit a < b. Ordnen wir das geschlossene Intervall [a, b] durch die KleinerGleich-Ordnungsrelation, so ist a minimales und b maximales Element. Alle Elemente aus ] − ∞, a] sind untere Schranken des Intervalls, alle Elemente aus [b, ∞[ entsprechend obere Schranken. Für das Infimum erhält man so inf[a, b] = a, und da a ∈ [a, b], gilt auch min[a, b] = a. Analog berechnet man sup[a, b] = max[a, b] = b. Ersetzt man das abgeschlossene Intervall durch das offene Intervall ]a, b[, so gibt es weder ein minimales noch ein maximales Element in dieser Menge. Die Menge der unteren Schranken bildet jedoch wie eben das Intervall ] − ∞, a], so dass inf ]a, b[ = a. Wegen a ∈ / ]a, b[ existiert min ]a, b[ jedoch nicht. Analog ist sup ]a, b[ = b und max ]a, b[ nicht existent. C Betrachten wir nun noch einmal die Teilmengenrelation auf der Menge M := P({0, 1, 2}) wie in Beispiel 3.7, so ist offensichtlich {0, 1, 2} maximales Element, obere Schranke, Supremum und Maximum von M. Analog ist ∅ minimales Element, untere Schranke, Infimum und Minimum von M. Beschränken wir die Relation ⊆ jedoch auf die Teilmenge N := {{0, 1}, {0, 2}, {1, 2}} (diese entspricht der zweiten Zeile von oben im entsprechenden Hasse-Diagramm in Abbildung 3.7), so ist jedes Element s ∈ N maximal und minimal, denn ∀ t ∈ N : s ⊆ t ⇒ t = s und ∀ t ∈ N : t ⊆ s ⇒ t = s. (Beachten Sie, dass die auf N eingeschränkte Teilmengenrelation {(s, t) ∈ N 2 : s ⊆ t} gerade durch {({0, 1}, {0, 1}), ({0, 2}, {0, 2}), ({1, 2}, {1, 2})} gegeben ist.) Die obere Schranke dieser Menge in M, und damit auch das Supremum sup N, ist jedoch eindeutig bestimmt: Es ist sup N = {0, 1, 2}. Da {0, 1, 2} ∈ / N, hat N kein Maximum. Die einzige untere Schranke ist die leere Menge, damit gilt auch inf N = ∅. Da ∅ ∈ / N, besitzt N kein Minimum. R N Eine Halbordnungsrelation kann also mehrere maximale bzw. minimale Elemente besitzen! Supremum und Infimum und damit - sofern existent - auch Maximum und Minimum, sind jedoch jeweils eindeutig bestimmt. (Für einen Spezialfall haben Sie diese Aussage auf einem Übungsblatt bewiesen! Den allgemeinen Beweis sollten Sie jedoch auch noch einmal führen.) Wir schließen dieses Kapitel mit einer Definition, die den Begriff der Ordnungsrelation noch einmal ins Spiel bringt: Definition 3.19 Sei M eine Menge und R eine Halbordnungsrelation auf M. Eine Teilmenge K ⊆ M heißt Kette bzgl. R, falls die auf K induzierte Halbordnungsrelation RK total, also eine Ordnungsrelation, ist. Die Kette K heißt maximal in M, falls es keine Kette bzgl. R in M gibt, die eine echte Obermenge von K ist. Beispiel 3.10 Sei wieder M = P({0, 1, 2}) mit der Teilmengenrelation ausgestattet. Dann ist K := {{1}, {1, 2}} eine Kette bzgl. ⊆, da für alle k, l ∈ K mit k 6= l entweder k ⊆ l oder l ⊆ k gilt; Die Einschränkung ⊆K ist also eine Ordnungsrelation. Die Kette K ist jedoch nicht maximal, denn K ′ := {∅, {1}, {1, 2}, {0, 1, 2}} ist ebenfalls eine Kette mit K ⊂ K ′ . Die Kette K ′ ist sogar maximal - sie entspricht sozusagen einem vollständigen Strang im zugehörigen Hasse-Diagramm. N 3.4 Halbordnungs- und Ordnungsrelationen 77 Was die Existenz von maximalen Ketten in einer durch eine Halbordnungsrelation geordneten Menge betrifft, muss ein Axiom formuliert werden, das sogenannte Maximalkettenprinzip von Hausdorff 14 : Dieses kann also mit den Mitteln der Mengenlehre nicht bewiesen werden, es wird den mathematischen Wahrheiten“ ob seiner Plausibilität als grundlegende Aussage ” hinzugefügt. Maximalkettenprinzip von Hausdorff In jeder durch eine Halbordnungsrelation R geordneten Menge gibt es zu jeder Kette K bzgl. R eine K umfassende Kette K ′ bzgl. R, die maximal ist. 14 Felix Hausdorff, ∗ 8. November 1868 in Breslau, † 26. Januar 1942 in Bonn, war ein deutscher Mathematiker, der die allgemeine Topologie maßgeblich mitbegründete und wichtige Beiträge zu verschiedenen anderen Disziplinen der modernen Mathematik lieferte. Kapitel 4 Abbildungen und Funktionen In diesem Kapitel wollen wir den Begriff der Abbildung bzw. Funktion behandeln1 . Dieser Begriff ist fundamental und Ihnen während Ihrer bisherigen Ausbildung mit Sicherheit schon vielfach begegnet. Dem Bildungsplan Mathematik für die Grundschule 2 , herausgegeben von der Behörde für Schule und Berufsbildung der Freien und Hansestadt Hamburg im Jahr 2011, ist zu entnehmen, dass die Idee des funktionalen Zusammenhangs bereits in den ersten Jahrgangsstufen behandelt werden soll, und zwar im Kontext von Zuordnungen und Veränderung. Ganz sicher kennen Sie den Funktionsbegriff auch im Zusammenhang mit den Kurvendiskussionen in der Analysis. Aber auch in der Linearen Algebra, der Stochastik, der Modellierung, der Geometrie und in allen weiteren Disziplinen der Mathematik sind Funktionen bzw. Abbildungen unverzichtbar! Wir werden definieren, wann eine Abbildung injektiv, surjektiv und bijektiv ist und mittels des dann zur Verfügung stehenden Begriffs der Bijektivität der Frage auf den Grund gehen, ob Z nun mehr Elemente hat als N oder nicht. Außerdem werden wir eine überraschende Eigenschaft von R kennen lernen, die den Zahlenstrahl von den Mengen N, Z und Q grundsätzlich unterscheidet. 4.1 Begriffsklärung Definition 4.1 Seien A und B beliebige nicht leere Mengen. Eine Relation R ⊆ A × B heißt Abbildung von A nach B oder Funktion von A nach B :⇔ ∀ a ∈ A : ∃1 b ∈ B : (a, b) ∈ R. R Abbildungen werden im Allgemeinen eher mit f, g oder h als mit R bezeichnet. Definition 4.1 macht aber besonders deutlich, dass jede Abbildung eine Relation ist (in Kapitel 3 hatten wir Relationen ja oft mit R bezeichnet); man hätte also genauso gut schreiben können: Für Mengen A, B 6= ∅ ist f ⊆ A × B eine Abbildung von A nach B oder eine Funktion von A nach B :⇔ ∀ a ∈ A : ∃1 b ∈ B : (a, b) ∈ f . Charakteristisch für eine Abbildung ist also zum einen, dass zu jedem Element a ∈ A ein Element b ∈ B in Relation steht (bei einer Relation R ⊆ A × B ist es ja durchaus möglich, 1 Wir werden die beiden Begriffe im Prinzip synonym verwenden, jedoch mit einer Tendenz, als Funktionen solche Abbildungen zu bezeichnen, deren Bild in R oder C liegt. 2 Quelle: http://www.hamburg.de/contentblob/2481796/data/mathematik-gs.pdf 78 4.1 Begriffsklärung 79 dass ein a ∈ A existiert, so dass ∀ b ∈ B : (a, b) ∈ / R gilt). Zum anderen ist für eine Abbildung f charakteristisch, dass zu jedem Element a ∈ A genau ein Element b aus B in Relation steht; es darf also nicht zwei verschiedene Elemente b und c ∈ B geben, so dass (a, b) ∈ f und (a, c) ∈ f gilt. Salopp gesagt kann man das so ausdrücken: Zu jedem a gehört genau ein b“. ” Daher macht es Sinn, sich eine Abbildung als eine Zuordnung f : A → B von der Menge A in die Menge B vorzustellen, die jedem Element a ∈ A genau ein Element b ∈ B zuordnet; dieses b wird für gewöhnlich f (a) genannt; es ist also f (a) = b ⇔ (a, b) ∈ f . Die Art und Weise dieser Zuordnung wird nach Möglichkeit durch die sogenannte Zuordnungsvorschrift a 7→ f (a) := b festgelegt, z. Bsp. ist a 7→ a2 diejenige Zuordnungsvorschrift, die jedem Element a dessen Quadrat a2 zuordnet. Vor diesem Hintergrund wird für Abbildungen im Allgemeinen anstelle von f ⊆ A × B und (a, b) ∈ f die folgende Schreibweise benutzt: f :A→ B (4.1) a 7→ f (a) := b. Zunächst einmal wollen wir jetzt die Relationen aus Kapitel 3 auf die Abbildungseigenschaft hin untersuchen: Relation Abbildung oder nicht? Schachpartie (Bsp. 3.1 A ) I. A. liegt hier keine Abbildung vor: Wenn jedoch alle Spalten A bis H durch genau eine Spielfigur besetzt sind, ist die Abbildungseigenschaft erfüllt. Studierendengeburtstage (Bsp. 3.1 B ) Da jede(r) Studierende an genau einem Tag Geburtstag hat, liegt hier eine Abbildung vor: Diese können wir schreiben als U :S →T s 7→ U(s) = Geburtstag von s Gästerelation (Bsp. 3.1 C ) Hier handelt es sich nur um eine Abbildung, wenn alle Gäste alleine kommen. Dann ist A:G→G g 7→ A(g) = g die sogenannte Identität auf G, auch wieder idG genannt (s.u.). 4.1 Begriffsklärung 80 Normalparabel“ K1 ” (Bsp. 3.1 D , 1. Teil) Dieses Beispiel ist eine sogar sehr bekannte Funktion; mit der neuen Schreibweise liest sie sich so: K1 : R → R x 7→ K1 (x) = x2 Gedrehte Normalparabel“ ” (Bsp. 3.1 D , 2. Teil) K2 Diese Relation ist keine Funktion, denn zu je einem x√ Wert aus R+ gibt es hier zwei verschiedene Paare (x, x) √ und (x, − x) in K2 . Sollten Sie diese Relation jemals unter dem Namen Wurzelfunktion kennen gelernt haben, so vergessen Sie diese Bezeichnung bitte möglichst schnell wieder! Kleiner-Gleich-Relation (bzw. Größer-Gleich, Kleiner- oder Größer-Relation) (vgl. Bsp. 3.1 E ) In allen Fällen handelt es sich nicht um Funktionen: Es gibt jeweils Zahlen a, b1 , b2 ∈ N (bzw. R), so dass b1 6= b2 , aber sowohl (a, b1 ) als auch (a, b2 ) in der Relation liegen! Teilbarkeitsrelation T (vgl. (3.7)) Da ∀ n ∈ Z : n|0 ∧ n|n gilt, ist T keine Funktion. Modulorelation Tn (Bsp. 3.3) Da ∀ a ∈ Z : (a, a) ∈ Tn ∧ (a, a + n) ∈ Tn gilt, ist Tn für kein n ∈ N eine Funktion. Gleichheitsrelation idM (Bsp. 3.4) Da ∀ x ∈ M : ∃1 y ∈ M : (x, y) ∈ idM (nämlich y = x), ist idM für jede Menge M eine Abbildung: Man nennt sie (s.o.) die Identität auf M. Tabelle 4.1: Relation oder sogar Abbildung? Einige weitere Beispiele seien Ihnen noch gegeben: Beispiel 4.1 A g:R→R x 7→ g(x) := 2x + 1 Ein Ausschnitt der Funktion g ist in Abbildung 4.1 zu sehen. Derartige Visualisierungen werden oft als Funktionsgraphen oder Graphen bezeichnet. B h : Z → N0 z 7→ h(z) := |z| Der entsprechende Graph findet sich in Abbildung 4.2. 4.1 Begriffsklärung 81 Abb. 4.1 Funktion x 7→ 2x + 1. Abb. 4.2 Funktion z 7→ |z|. C + t : R+ 0 → R0 y 7→ t(y) := √ y Der entsprechende Graph findet sich in Abbildung 3 4.3. Beachten Sie, dass diese Funktion dem oberen Ast“ der Relation K2 entspricht. ” D A1 , A2 seien Mengen. Für alle i ∈ {1, 2} sei fi : A1 × A2 → Ai (a1 , a2 ) 7→ ai die sogenannte i-te Koordinatenabbildung (auch i-te Komponentenabbildung). Ein Graph dieser Abbildung müsste dreidimensional sein (s.u.). √ Es sei daran erinnert, dass man unter der (Quadrat)-Wurzel y einer nichtnegativen reellen Zahl y die nichtnegative Lösung der Gleichung x2 = y versteht. Demnach ist 3 die Wurzel von 9, −3 ist keine Wurzel von 9. Wir kommen darauf später zurück. 3 4.1 Begriffsklärung 82 Abb. 4.3 Funktion y 7→ √ y. E {0, 1}2 → {0, 1, 2} (x1 , x2 ) 7→ x1 + x2 F Schließlich sei Ihnen ein Beispiel für eine stückweise definierte Funktion gegeben, die sogenannte Dirichletsche 4 Sprungfunktion: ϕ : R → {0, 1} 1 : x∈Q x 7→ 0 : x∈R\Q N Beachten Sie, dass durch die Definition nicht ausgeschlossen wird, dass zwei verschiedenen Elementen a und a′ ∈ A ein- und dasselbe Element b ∈ B zugeordnet wird! Wir kommen auf diesen Punkt im nächsten Abschnitt zurück. Wir wir bereits mehrfach gesehen haben, kann es insbesondere dann, wenn A und B geordnete Mengen sind, Sinn machen, eine Relation von A nach B als Teilmenge des kartesischen Produktes graphisch darzustellen (als Familie von Punkten oder als durchgezogene Linie). Graphisch bedeutet die Abbildungseigenschaft dann, dass zu jedem Wert a der Abszisse (das ist die horizontale Achse, an der für gewöhnlich der erste Eintrag eines Zwei-Tupels abgelesen wird) ein und nur ein5 Wert f (a) := b der Ordinate (das ist die vertikale Achse, an der entsprechend der zweite Eintrag eines Zwei-Tupels abgelesen wird) gehört“; auf der zur Or” dinate parallelen Geraden durch a darf sich also nur genau ein Punkt der Graphik befinden! Schaut man sich nun die Graphik der gedrehten Normalparabel K2 aus Bsp. 3.1 D auf Seite 55 noch einmal an, wird auch graphisch klar, warum es sich hierbei nicht um eine Funktion handelt. 4 Peter Gustav Lejeune Dirichlet, ∗ 13. Februar 1805, † 5. Mai 1859, war ein bedeutender deutscher Mathematiker, der die Verknüpfung der ehemals strikt voneinander getrennten Disziplinen Zahlentheorie und Analysis in die Wege leitete. 5 Dies ist eine andere mögliche Ausdrucksweise für genau ein. 4.1 Begriffsklärung 83 Wie Sie an Beispiel 4.1 E sehen, muss eine Abbildung keine Bezeichnung, also keinen Namen, haben. Derartiges tritt zwar in der Praxis selten auf, es macht aber deutlich, dass eine Abbildung durch nur drei Dinge festgelegt ist: (i) die Menge, der die Elemente entstammen, denen etwas zugeordnet wird, (ii) die Menge, der die Elemente entstammen, die zugeordnet werden, (iii) eine Zuordnungsvorschrift. Die Mengen unter (i) und (ii) haben eigene Bezeichnungen; diese und andere wichtige Begriffe im Kontext von Funktionen sollen nun definiert werden. Definition 4.2 Sei f :A→ B a 7→ f (a) := b eine Abbildung. Dann heißt (a) A der Definitionsbereich (oder die Startmenge) (von f ), (b) B der Bildbereich (auch: Wertebereich oder Zielmenge) (von f ), (c) b das Bild von a (unter f ), (d) a das Urbild von b (unter f ), (e) für jede Menge C ⊆ A die Menge f (C) := {f (a) : a ∈ C} ⊆ B das Bild von C (unter f ), (f) für jede Menge D ⊆ B die Menge f −1 (D) := {a ∈ A : f (a) ∈ D} ⊆ A das Urbild von D (unter f ), (g) die Menge f (A) = {f (a) : a ∈ A} das Bild von f . In Definition 4.2 stoßen wir mehrfach auf den Wortbestandteil Bild. Der sprachliche Zusammenhang zum Begriff Abbildung ist nicht zu übersehen. Statt f ordnet a den Wert b zu“ ” sagt man entsprechend auch f bildet a auf (den Wert) b ab“. Anstelle der Bezeichnung Zu” ordnungsvorschrift kann man in diesem Sinne auch die Bezeichnung Abbildungsvorschrift verwenden. R Achten Sie ganz sorgfältig darauf, dass Sie f (x) nicht mit f verwechseln! Die Funktion heißt f , f (x) ist nur“ ein Funktionswert, also bei uns in den meisten Fällen eine Zahl! ” In dem Ausdruck f (x) nennt man x auch das Argument von f . Anhand zweier Beispiele wollen wir die neuen Begriffe einüben: 4.1 Begriffsklärung 84 Beispiel 4.2 A Zunächst betrachten wir die oben bereits mehrfach erwähnte Funktion K1 : R → R x 7→ K1 (x) = x2 . (4.2) Hier ist R sowohl Definitionsbereich als auch Bild- bzw. Wertebereich der Funktion + K1 ; wegen K1 (R) = {K1 (x) : x ∈ R} = {x2 : x ∈ R} = R+ 0 ist R0 das Bild von K1 , außerdem ist 4 das Bild von 2 (K1 (2) = 4), 0 das Urbild von 0 (K1 (0) = 0), −3 ein Urbild von 9 (K1 (−3) = 9), 3 ein anderes Urbild von 9 (K1 (3) = 9), {−3, 3} das Urbild von {9} (K1−1 ({9}) = {3, −3}), {1, 4} das Bild von {1, 2} (K1 ({1, 2}) = {1, 4}), {0, 1, −1} das Urbild von {0, 1} (K1−1 ({0, 1}) = {−1, 0, 1}) und ∅ das Urbild von {−2} (K1−1 ({−2}) = ∅). An diesem Beispiel kann man erkennen, dass das Bild einer Funktion mit ihrem Bildbereich nicht übereinstimmen muss! Auf diesen Aspekt kommen wir im folgenden Abschnitt ganz ausführlich zu sprechen. R Während das Bild eines Elements aus dem Definitionsbereich per Definition einer Abbildung eindeutig bestimmt ist, kann ein Element aus dem Bildbereich mehrere Urbilder haben! Abb. 4.4 Funktion f1 : {0, 1, 2}2 → {0, 1, 2} mit f1 (a1 , a2 ) = a1 . B Jetzt sei A = {0, 1, 2} und f1 die in Beispiel 4.1 D definierte Koordinatenabbildung f1 : {0, 1, 2}2 → {0, 1, 2} (a1 , a2 ) 7→ a1 . (4.3) 4.1 Begriffsklärung 85 Dann ist {0, 1, 2}2 = {(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)} der Definitionsbereich der Abbildung f1 , {0, 1, 2} deren Bildbereich bzw. Wertebereich, 2 das Bild von (2, 1) (f1 (2, 1) = 2), (0, 0) ein Urbild von 0 (f1 (0, 0) = 0), (0, 1) ein anderes Urbild von 0 (f1 (0, 1) = 0), {1, 2} das Bild von {(1, 1), (2, 0)} (f1 ({(1, 1), (2, 0)}) = {1, 2}), {(1, 0), (1, 1), (1, 2)} das Urbild von {1} (f1−1 ({1}) = {(1, 0), (1, 1), (1, 2)}) und ∅ das Urbild von ∅ (f1−1 (∅) = ∅). Das Bild der Abbildung, also f1 ({0, 1, 2}2), ist die Menge {0, 1, 2}. Eine Visualisierung der Abbildung f1 findet sich in Abbildung 4.4. Anhand dieses Beispiels wird besonders deutlich, wie sorgfältig man zwischen Mengen und deren Elementen unterscheiden muss! R Da die Elemente (a1 , a2 ) des Definitionsbereichs von f1 geordnete Zwei-Tupel sind, muss man - wie eben geschehen - genau genommen zwei öffnende und zwei schließen de Klammern setzen, wenn man das Bild f (a1 , a2 ) eines Elements (a1 , a2 ) notieren will. Oft belässt man es aber aus Gründen der Übersichtlichkeit und der Bequem lichkeit bei einem Klammernpaar, schreibt also f1 (a1 , a2 ) anstelle von f1 (a1 , a2 ) . N Ohne Beweis sei nun ein Satz angegeben, der insbesondere von technischem Interesse ist: Satz 4.1 Sei f : A → B eine Abbildung und seien A1 , A2 ⊆ A, B1 , B2 ⊆ B. Dann gilt (a) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ), (b) f (A1 ∩ A2 ) ⊆ f (A1 ) ∩ f (A2 ), (c) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ), (d) f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ). (Der Beweis ist relativ einfach und Bestandteil der Übungen.) Im folgenden Satz werden das Urbild des Bildes einer Menge bzw. das Bild des Urbildes einer Menge zur Ausgangsmenge in Beziehung gesetzt: Satz 4.2 Sei f : A → B eine Abbildung und C ⊆ A und D ⊆ B. Dann gilt (a) f f −1 (D) ⊆ D, (b) f −1 f (C) ⊇ C. Beweis: Wir beweisen zunächst (a): Nach Definition ist f −1 (D) = {a ∈ A : f (a) ∈ D}. Also ist f f −1 (D) = {f (x) : x ∈ f −1 (D)} = {f (x) : x ∈ {a ∈ A : f (a) ∈ D}} ⊆ D. Folglich ist jedes Element aus f f −1 (D) auch in D enthalten. Nun beweisen wir (b): Es ist f −1 f (C) = {x ∈ A : f (x) ∈ f (C)}. Ist nun c ∈ C beliebig, aber fest, so folgt f (c) ∈ f (C) und aus der Darstellung für f −1 f (C) folgt daraus unmittelbar c ∈ f −1 f (C) . Dies impliziert die Behauptung. Abbildungen können auf verschiedenen Weisen in Relation zueinander gesetzt werden; für uns ist besonders wichtig zu wissen, wann man zwei Funktionen als gleich bezeichnet: 4.1 Begriffsklärung 86 Definition 4.3 Seien A1 , A2 , B1 , B2 Mengen und f : A1 → B1 und g : A2 → B2 Abbildungen. Dann sagt man, dass f gleich g ist und schreibt f = g :⇔ A1 = A2 ∧ B1 = B2 ∧ ∀ a ∈ A1 = A2 : f (a) = g(a). Gilt ¬(f = g), sagt man, dass f ungleich g ist und schreibt f 6= g. Ist der Bildbereich zweier Abbildungen f und g von A nach B geordnet, so kann man diese Ordnungsstruktur in gewisser Weise auf die Abbildungen übertragen: Für unsere Zwecke wird es ausreichen, dies für reellwertige 6 Funktionen zu tun: Definition 4.4 Seien A1 , A2 beliebige Mengen, B1 , B2 Teilmengen von R und f : A1 → B1 und g : A2 → B2 Funktionen. Dann sagt man, dass (a) f kleiner-gleich g ist und schreibt f ≤ g :⇔ A1 = A2 ∧ B1 = B2 ∧ ∀ a ∈ A1 = A2 : f (a) ≤ g(a), (b) f kleiner g ist und schreibt f < g :⇔ A1 = A2 ∧ B1 = B2 ∧ ∀ a ∈ A1 = A2 : f (a) < g(a), (c) f größer-gleich g ist und schreibt f ≥ g :⇔ g ≤ f, (d) f größer g ist und schreibt R f > g :⇔ g < f. Beachten Sie, dass - anders als in der geordneten Menge R, in der für zwei Elemente a, b die Äquivalenz a < b ⇔ a ≤ b ∧ a 6= b richtig ist - auf der Menge aller Funktion von A nach B die beiden Aussagen f <g (4.4) und f ≤ g ∧ f 6= g (4.5) nicht äquivalent sind. Bedingung (4.5) bedeutet, dass die Konjunktion ∀ a ∈ A : f (a) ≤ g(a) ∧ ∃ a ∈ A : f (a) 6= g(a) gültig ist; damit existiert also mindestens ein a ∈ A, so dass f (a) < g(a), in allen anderen Argumenten können f und g übereinstimmen. Die strikte Ungleichung von f und g in (4.4) bedeutet mehr: Hier muss f (a) < g(a) für alle a ∈ A gelten. Insbesondere ist damit (4.5) notwendig für (4.4), aber nicht hinreichend. Umgekehrt ist (4.4) hinreichend für (4.5), aber nicht notwendig. 6 Eine Funktion nennt man reellwertig, wenn ihr Bild eine Teilmenge der reellen Zahlen ist. 4.1 Begriffsklärung 87 Beispiel 4.3 A Sei f :R→R x : x 6= 0 x 7→ 1 : x=0 Dann gilt idR ≤ f ∧ idR 6= f , jedoch nicht idR < f . B Mit idR : R → R x 7→ x und |·|:R→R x 7→ |x| gilt idR ≤ | · | und | · | ≥ idR . N Bemerkung 4.1 Es seien A, B ⊆ R und es sei FA,B := {f : A → B} die Menge aller Funktionen von A nach B. Dann wird durch ≤ (bzw. ≥) wie in Def. 4.4 eine Halbordnungsrelation, aber keine Ordnungsrelation auf FA,B definiert. Beweis: Den Beweis erbringen Sie in den Übungen. Mitunter ist es sinnvoll, eine Abbildung nur auf einer Teilmenge ihres Definitionsbereiches zu betrachten. Zu diesem Zweck definiert man die sogenannte Einschränkung einer Abbildung: Definition 4.5 Ist f : A → B eine Abbildung und M ⊆ A, so nennt man die Abbildung f |M : M → B a 7→ f |M (a) := f (a) die Einschränkung von f auf M. Beispiel 4.4 A Mit f wie in Beispiel 4.3 A gilt für M = R \ {0} die Gleichheit f |M = idM . B Ist 1Q : Q → {1} die konstante Funktion, die jede rationale Zahl auf 1 abbildet, so stimmt die Einschränkung der Dirichletschen Sprungfunktion ϕ aus Beispiel 4.1 F auf Q gemäß Definition 4.3 mit 1Q überein, d.h. es ist ϕ|Q = 1Q : Für alle x ∈ Q ist nämlich ϕ|Q (x) = ϕ(x) = 1 = 1Q (x). N 4.2 Eigenschaften von Abbildungen 4.2 88 Eigenschaften von Abbildungen Wie wir am Beispiel der Funktion K1 : R → R mit K1 (x) = x2 gesehen haben, müssen für eine Abbildung f : A → B der Bildbereich (Wertebereich) B und das Bild f (A) nicht übereinstimmen. Per Definition ist aber klar, dass die Inklusion f (A) ⊆ B gelten muss; damit sind die Fälle f (A) ⊂ B und f (A) = B zu unterscheiden. Im ersten Fall gibt es Elemente b im Bildbereich, die keinem Element aus a zugeordnet werden. Der zweite Fall dagegen bringt es mit sich, dass jedes Element im Bildbereich mindestens einem a ∈ A zugeordnet wird, denn f (A) = {f (a) : a ∈ A} ist gerade die Menge aller möglichen Bilder von f . Dieser Fall ist von besonderem Interesse, die entsprechenden Abbildungen werden als surjektiv bezeichnet7 . Definition 4.6 Eine Abbildung f : A → B heißt surjektiv :⇔ ∀ b ∈ B : ∃ a ∈ A : f (a) = b. Wie bereits angesprochen, sichert die Definition einer Abbildung f : A → B ab, dass jedem a ∈ A ein b ∈ B zugeordnet wird, es ist aber nicht ausgeschlossen, dass mehreren verschiedenen Elementen aus a dasselbe Bild b zugeordnet wird. Abbildungen, bei denen zwei verschiedene Elemente a und a′ aus A immer auch verschiedene Bilder f (a) und f (a′ ) haben, sind also etwas Besonderes, man nennt sie injektiv. Definition 4.7 Eine Abbildung f : A → B heißt R injektiv :⇔ ∀a, a′ ∈ A : a 6= a′ ⇒ f (a) 6= f (a′ ). Alternativ wird gelegentlich folgende Definition verwendet: Eine Abbildung f : A → B heißt injektiv :⇔ ∀a, a′ ∈ A : f (a) = f (a′ ) ⇒ a = a′ . Die Gleichwertigkeit beider Definitionen folgt aus der Tatsache, dass jede Implikation logisch gleichwertig ist zu ihrer Kontraposition! Kurz und anschaulich kann man sich die beiden vorangegangenen Definitionen wie folgt merken: Eine Abbildung f : A → B ist surjektiv, wenn jedes Element aus B Bild mindestens eines Elements aus A ist und injektiv, wenn jedes Element aus B Bild höchstens eines Elements aus A ist. Ist eine Abbildung surjektiv und injektiv, d.h. also, dass jedes Element aus B Bild genau eines Elements aus A ist, so nennt man sie bijektiv. Formal liest sich das wie folgt: Definition 4.8 Eine Abbildung f : A → B heißt bijektiv :⇔ ∀ b ∈ B : ∃1 a ∈ A : f (a) = b. Bemerkung 4.2 Bijektive Abbildungen werden auch Bijektionen genannt. 7 Das Wort surjektiv setzt sich zusammen aus dem französischen Wort sur für auf“ und dem lateinischen ” Wort iactare, was werfen“ bedeutet. ” 4.2 Eigenschaften von Abbildungen 89 Bemerkung 4.3 Weil die Begriffe injektiv und surjektiv so fundamental wichtig sind, wollen wir an dieser Stelle nochmal explizit aufschreiben, was es bedeutet, wenn eine Abbildung nicht surjektiv bzw. nicht injektiv ist. Gemäß den bekannten Regeln zur Verneinung logischer Aussagen gilt: Eine Abbildung f : A → B ist (a) nicht surjektiv :⇔ ∃ b ∈ B : ∀ a ∈ A : f (a) 6= b. (b) nicht injektiv :⇔ ∃ a, a′ ∈ A : a 6= a′ ∧ f (a) = f (a′ ). Jetzt wollen wir die bisherigen Beispiele auf die drei genannten Eigenschaften hin untersuchen: A Zunächst betrachten wir die Funktion K1 : R → R mit K1 (x) = x2 . • Surjektivität: Gemäß Bemerkung 4.3 ist K1 nicht surjektiv, denn −1 ∈ R und ∀ x ∈ R : K1 (x) 6= −1. • Injektivität: Ebenfalls gemäß Bemerkung 4.3 ist K1 auch nicht injektiv, denn es gilt −1, 1 ∈ R, 1 6= −1 und K1 (−1) = K1 (1) = 1. • Bijektivität: Da die Funktion weder injektiv noch surjektiv ist, ist sie auch nicht bijektiv. B Die Identität idM : M → M mit x 7→ idM (x) = x ist • surjektiv, weil zu jedem b ∈ M ein a ∈ M existiert, so dass idM (a) = b, nämlich a = b; • injektiv, weil für je zwei verschiedene Elemente a, a′ aus dem Definitionsbereich auch die Bilder idM (a) = a und idM (a′ ) = a′ verschieden sind; • bijektiv, weil sie injektiv und surjektiv ist. C Auch die Funktion g : R → R mit g(x) = 2x + 1 ist bijektiv, wie man wie folgt sieht: • Surjektivität: Sei b ∈ R beliebig, aber fest. Es ist zu zeigen, dass ein Urbild zu b existiert, d.h., dass es ein a ∈ R gibt, so dass g(a) = b ⇔ 2a + 1 = b. (4.6) Um dieses a zu finden“, lösen wir die Gleichung (4.6) einfach nach a auf: ” b−1 2a + 1 = b ⇔ 2a = b − 1 ⇔ a = . 2 Also ist g b−1 = b und die Surjektivität damit bewiesen. 2 • Injektivität: Wir können diese Eigenschaft auf zwei verschiedene Arten nachweisen: 1. Möglichkeit: Wir zeigen, dass für zwei Elemente a, a′ ∈ R aus a 6= a′ die Ungleichung g(a) 6= g(a′ ) folgt: a 6= a′ ⇒ 2a 6= 2a′ ⇒ g(a) = 2a + 1 6= 2a′ + 1 = g(a′ ). 4.2 Eigenschaften von Abbildungen 90 2. Möglichkeit: Wir verwenden die Äquivalenz zwischen einer Aussage und ihrer Kontraposition und zeigen, dass für zwei Elemente a, a′ ∈ R aus g(a) = g(a′ ) die Gleichung a = a′ folgt: g(a) = g(a′ ) ⇒ 2a + 1 = 2a′ + 1 ⇒ 2a = 2a′ ⇒ a = a′ . D Als nächstes betrachten wir die Funktion h : Z → N0 mit h(z) = |z|. • Surjektivität: Die Funktion ist surjektiv, weil zu jedem b ∈ N0 ein a ∈ Z existiert, so dass h(a) = |a| = b, nämlich a = b. • Injektivität: Die Funktion ist nicht injektiv, weil z. Bsp. h(−1) = h(1) = 1. • Bijektivität: Die Funktion ist nicht bijektiv, weil sie nicht injektiv ist. + E Die Wurzelfunktion t : R+ 0 → R0 mit y 7→ √ y ist bijektiv: √ + • Surjektivität: Sei b ∈ R+ a= 0 beliebig, aber fest. Gesucht ist ein a ∈ R0 , so dass t(a) = + 8 b. Wie oben lösen wir diese Gleichung jetzt einfach nach a auf. Da a, b ∈ R0 , gilt √ a = b ⇔ a = b2 . √ Wählt man also b2 für a, so gilt t(a) = t(b2 ) = b2 = b, wie gewünscht. √ √ ′ • Injektivität: Seien a, a′ ∈ R+ a 6= a′ , da Wurzelziehen 0 und a 6= a . Dann gilt auch auf R+ 0 eine Äquivalenzumformung ist. F Im Allgemeinen ist die Koordinatenabbildung f1 surjektiv, aber nicht injektiv, da f1 (a1 , a2 ) = a1 für alle a2 ∈ A2 . Insbesondere ist die Abbildung also im Allgemeinen auch nicht bijektiv. Das Gleiche gilt für f2 . G Die Abbildung {0, 1}2 → {0, 1, 2}, unter der ein Tupel (x1 , x2 ) auf die Summe x1 + x2 von dessen Einträgen abgebildet wird, ist • surjektiv, weil (0, 0) 7→ 0, (0, 1) 7→ 1 und (1, 1) 7→ 2; jedes Element aus {0, 1, 2} ist also tatsächlich ein Bild; • nicht injektiv, weil (0, 1) 6= (1, 0), aber (0, 1) 7→ 1 und (1, 0) 7→ 1; • damit auch nicht bijektiv. H Zum Abschluss betrachten wir die Dirichletsche Sprungfunktion. Diese ist • surjektiv, weil z. Bsp. ϕ(3) = 1 und ϕ(π) = 0, √ Zur Erinnerung sei noch einmal gesagt, dass für eine beliebige reelle Zahl z gilt: z 2 = |z|. Damit gilt √ √ √ für zwei reelle Zahlen√ x und y folgende Äquivalenz: y = x2 ⇔ y = |x| ⇔ y = x ∨ − y = x. Ist z ∈ R+ 0 nichtnegativ, so gilt z 2 = z; entsprechend gilt für zwei nichtnegative reelle Zahlen x, y ∈ R+ die Äquivalenz 0 √ y = x2 ⇔ y = x. 8 4.2 Eigenschaften von Abbildungen 91 • nicht injektiv, weil z. Bsp. ϕ(0) = ϕ(1) = 0, • damit auch nicht bijektiv. Bemerkung 4.4 Für eine Funktion f : A → B mit A, B ⊆ R bedeutet Surjektivität, dass jede Parallele zur Abszisse durch einen Wert b ∈ B auf der Ordinate den Graph der Funktion in mindestens einem Punkt schneidet, Injektivität, dass jede Parallele zur Abszisse durch einen Wert b ∈ B auf der Ordinate den Graph der Funktion in höchstens einem Punkt schneidet, Bijektivität, dass jede Parallele zur Abszisse durch einen Wert b ∈ B auf der Ordinate den Graph der Funktion in genau einem Punkt schneidet. So ist die Funktion f1 in Abbildung 4.5 surjektiv, aber nicht injektiv; die Funktion f2 hingegen ist injektiv, aber nicht surjektiv. Abb. 4.5 Graphische Untersuchung von Funktionen auf Injektivität und Surjektivität. Die drei genannten Begriffe kann man sich auch noch auf etwas andere Art und Weise verständlich machen: Dazu sei f : A → B eine beliebige Funktion. Betrachtet man nun die Gleichung f (a) = b, (4.7) so bedeutet - die Surjektivität von f , dass (4.7) für jedes b ∈ B mindestens eine Lösung a ∈ A besitzt, - die Injektivität von f , dass (4.7) für jedes b ∈ B höchstens eine Lösung a ∈ A besitzt, - die Bijektivität von f , dass (4.7) für jedes b ∈ B genau eine Lösung a ∈ A besitzt. 4.2 Eigenschaften von Abbildungen 92 Im letzten Fall kann man die Zuordnung a 7→ b also umkehren“, d.h., dass man jedem b ∈ B ” denjenigen Wert a zuordnen kann, der die Gleichung (4.7) erfüllt. Da die Menge f −1 ({b}) einelementig ist, kann man diese Umkehrung wie folgt definieren: Definition 4.9 Sei f : A → B eine bijektive Abbildung. Die Abbildung fˆ : B → A, die für ˆ jedes b ∈ B die Eigenschaft {f(b)} = f −1 ({b}) hat, heißt die zu f inverse Abbildung oder die Inverse von f oder die Umkehrabbildung von f. Oft wird anstelle von fˆ auch f −1 geschrieben 9 : f −1 : B → A b 7→ f −1 (b) := a ⇔ f (a) = b. Beispiel 4.5 • Wir betrachten zunächst wieder die Funktion g : R → R mit g(x) = 2x + 1, von der wir uns gerade (Beispiel C ) überlegt haben, dass sie bijektiv ist. Die Umkehrfunktion g −1 ist wegen b−1 −1 g ({b}) = {a ∈ R : g(a) = b} = {a ∈ R : 2a + 1 = b} = 2 gegeben durch g −1 : R → R b 7→ g −1 (b) := b−1 . 2 In Abbildung 4.6 (links) sind die Funktionen g und g −1 skizziert. • Die Umkehrfunktion id−1 M der Identität idM : M → M mit id(x) = x ist wegen id−1 M ({x}) = {y ∈ M : idM (y) = x} = {y ∈ M : y = x} = {x} gegeben durch id−1 M : M → M x 7→ id−1 M (x) := x. −1 Insbesondere stimmen damit idM und id−1 M überein: idM = idM . √ + y ist wegen • Die Umkehrfunktion der Wurzelfunktion t : R+ 0 → R0 mit t(y) = √ 2 2 t−1 ({x}) = {z ∈ R+ z = x} = {z ∈ R+ 0 : t(z) = 0 : z = x } = {x } 9 Bei dem Symbol f −1 ist besondere Wachsamkeit geboten - benutzen wir es doch für zwei verschiedene Dinge: Zum einen bezeichnen wir mit f −1 (D) ⊆ A das Urbild einer Menge D ⊆ B, ungeachtet dessen, ob f : A → B dabei bijektiv ist oder nicht (siehe Definition 4.2(f))! Zum anderen bezeichnen wir mit f −1 die Inverse einer bijektiven Abbildung f . Besondere Vorsicht ist also insbesondere dann geboten, wenn D = {y} eine einelementige Menge ist, denn dann kann man für bijektives f das Element f −1 (y) ∈ A und für beliebiges f die Menge f −1 ({y}) ⊆ A bilden. Im bijektiven Fall ist die Beziehung zwischen Element und Menge allerdings einfach: Es gilt {f −1 (y)} = f −1 ({y}). 4.2 Eigenschaften von Abbildungen 93 Abb. 4.6 Ausschnitte der Funktionen g und g −1 (links) bzw. t und t−1 (rechts). gegeben durch + t−1 : R+ 0 → R0 x 7→ t−1 (x) := x2 . N Die Umkehrung f −1 einer Funktion f : A → B ist diejenige Funktion, die die durch die Anwendung von f auf a ∈ A ausgelöste Veränderung rückgängig macht. Im Beispiel der Wurzelfunktion t sieht man sehr schön, dass das Ziehen der (zweiten) Wurzel (d.i. die Anwendung von t) durch das Quadrieren (Anwendung von t−1 ) rückgängig gemacht wird. Zeichnet man eine bijektive Funktion f : A → B mit A, B ⊆ R und ihre Inverse als Teilmengen des kartesischen Produkts A × B ein, so erkennt man, was die Lage dieser beiden Mengen zueinander betrifft, eine interessante Eigenschaft. In Abbildung 4.6 können wir uns das anhand der beiden Funktionen g und t anschauen: Es fällt auf, dass die Inverse in beiden Fällen die Spiegelung der ursprünglichen Funktion an der Winkelhalbierenden (welche mit der Funktion idR übereinstimmt) ist. Diese Symmetrie liegt auch im Allgemeinen vor: Per Definition der Inversen f −1 gehört nämlich, falls (a, b) Element einer Funktion f ist 10 , das Paar (b, a) zu f −1 . Diesen Punkt erhält man aus (a, b) gerade durch Spiegelung an der Winkelhalbierenden, wie Abbildung 4.7 verdeutlicht. Es ist nicht schwierig - aber wichtig! - sich zu überlegen, dass die Inverse f −1 : B → A einer bijektiven Funktion f : A → B wieder invertierbar ist und deren Umkehrung (f −1)−1 mit f übereinstimmt. Per Definition ist nämlich (f −1 )−1 diejenige Funktion von A nach B, unter der jedes a ∈ A auf dasjenige eindeutig bestimmte Element c abgebildet wird, welches die 10 An dieser Stelle erinnern wir uns nochmal daran, dass eine Funktion f : A → B eine Teilmenge des kartesischen Produkts A × B ist. 4.2 Eigenschaften von Abbildungen 94 a=f^(−1)(b) b=f(a) b a Abb. 4.7 Zur Symmetrie einer Funktion und ihrer Inversen. Gleichung f −1 (c) = a löst. Das ist aber gerade das Element f (a). Also gilt für alle a ∈ A die Gleichheit (f −1 )−1 (a) = f (a), was die Behauptung gemäß Definition 4.3 nach sich zieht. Internetlinks Auf den folgenden Internetseiten finden Sie verschiedene Graphiken und eine Fülle von Beispielen für die Begriffe surjektiv, injektiv und bijektiv. Sie sind vielleicht für den ein oder anderen von Ihnen hilfreich. Aus Zeitgründen kann ich in der Vorlesung auf diese Darstellungen im Detail nicht eingehen. • Zum Begriff surjektiv: http://de.wikipedia.org/wiki/Surjektiv, • Zum Begriff injektiv: http://de.wikipedia.org/wiki/Injektivität, • Zum Begriff bijektiv: http://de.wikipedia.org/wiki/Bijektivität. Zum Abschluss dieses Abschnitts möchte ich Ihnen noch eine weitere wichtige Eigenschaft von Funktionen nahe bringen, die sich graphisch leicht ermitteln lässt. Hierbei müssen wir uns wieder auf Funktionen einschränken, deren Definitions- und Bildbereich total geordnet ist; der Einfachheit halber gehen wir erneut davon aus, dass es sich hierbei um Teilmengen der reellen Zahlen handelt. Definition 4.10 Seien A, B ⊆ R und sei f : A → B eine Funktion. Man nennt f (a) monoton steigend11 :⇔ ∀ a1 , a2 ∈ A : a1 ≤ a2 ⇒ f (a1 ) ≤ f (a2 ), (b) monoton fallend12 :⇔ ∀ a1 , a2 ∈ A : a1 ≤ a2 ⇒ f (a1 ) ≥ f (a2 ), (c) streng monoton steigend :⇔ ∀ a1 , a2 ∈ A : a1 < a2 ⇒ f (a1 ) < f (a2 ), 11 12 Statt steigend sagt man auch wachsend. Statt fallend sagt man auch abnehmend. 4.2 Eigenschaften von Abbildungen 95 (d) streng monoton fallend :⇔ ∀ a1 , a2 ∈ A : a1 < a2 ⇒ f (a1 ) > f (a2 ). Bemerkung 4.5 Ist eine Funktion f : A → B mit A, B ⊆ R streng monoton steigend, so ist sie auch monoton steigend; ist sie streng monoton fallend, so ist sie auch monoton fallend. Beispiel 4.6 A Die Funktion g mit g(x) = 2x − 1 ist streng monoton steigend, da für alle x1 , x2 ∈ R mit x1 < x2 gilt, dass g(x1 ) = 2x1 − 1 < 2x2 − 1 = g(x2 ) ist. In Abbildung 4.6 (links) ist entsprechend zu erkennen, dass die Funktionswerte mit steigendem x (also nach rechts hin) immer größer werden. Völlig analog zeigt und sieht man, dass auch die Funktion abbildet, streng monoton wachsend ist. Insbesondere sind g und g −1 g −1, die x auf x−1 2 damit auch monoton steigend. B In den Übungen werden Sie zeigen, dass die Funktion fm,b : R → R mit x 7→ fm,b (x) := mx + b (hierbei sind m, b ∈ R) genau dann • monoton steigend ist, wenn m ≥ 0 gilt, • streng monoton steigend ist, wenn m > 0 gilt, • monoton fallend ist, wenn m ≤ 0 gilt, • streng monoton fallend ist, wenn m < 0 gilt. Insbesondere ist für jedes b ∈ R die konstante Funktion f0,b , die jedes x auf b abbildet, gleichzeitig monoton steigend und monoton fallend. C Die Wurzelfunktion t ist streng monoton steigend, da für alle x1 , x2 ∈ R+ 0 mit x1 < x2 √ √ gilt, dass t(x1 ) = x1 < x2 = t(x2 ) ist. Auch hier kann man die Gesetzmäßigkeit, dass für größere Argumente größere Funktionswerte geliefert werden, im Bild erkennen (Abbildung 4.6 (rechts)). Beachten Sie, dass auch die Umkehrfunktion t−1 , die x ∈ R+ 0 auf x2 abbildet, streng monoton steigend ist. D Eine konstante Funktion, d.h. eine Funktion f : A → B mit A, B ⊆ R, für die eine Konstante c ∈ B existiert, so dass ∀ a ∈ A : f (a) = c gilt, ist gleichzeitig monoton wachsend und monoton fallend. N Von Bedeutung ist nun folgender Satz: Satz 4.3 Ist A ⊆ R und f : A → R streng monoton steigend oder streng monoton fallend, so ist f injektiv. Beweis: Œ können wir annehmen, dass f streng monoton steigend ist.13 Seien nun a, a′ ∈ A und sei a 6= a′ . Wir können wieder Œ annehmen, dass a < a′ . Gemäß der Annahme, dass f streng monoton steigend ist, ist f (a) < f (a′ ), also insbesondere f (a) 6= f (a′ ). 13 Die Ligatur Œ steht für den Ausdruck Ohne Einschränkung der Allgemeinheit; mitunter wird stattdessen auch o. B. d. A. notiert, was soviel heißt wie ohne Beschränkung der Allgemeinheit. Diese in mathematischen Beweisen gelegentlich vorkommende Formulierung wird verwendet, um anzuzeigen, dass eine Einschränkung (z. Bsp. über den Variabilitätsbereich einer Variablen) nur vorgenommen wird, um die Beweisarbeit zu vereinfachen (in den meisten Fällen geht es hierbei sogar um die Reduktion von Schreibarbeit). Die Formulierung darf aber nur verwendet werden, wenn die Gültigkeit der sich anschließenden Aussagen auf sehr einfache Weise (z. Bsp. auf analoge Weise) auf den allgemeinen Fall ausgedehnt werden kann. 4.2 Eigenschaften von Abbildungen 96 f(x) 2 −2 2 4 x −2 −4 Abb. 4.8 Eine injektive Funktion muss nicht monoton sein. Das folgende Beispiel einer stückweise definierten Funktion zeigt, dass man die Aussage in Satz 4.3 nicht umkehren kann. Beispiel 4.7 Sei f :R→R x 7→ f (x) := −x : x < 0 x − 1 : x ∈ [0, 1] −x : x > 1 Eine graphische Darstellung der Funktion sehen Sie in Abbildung 4.8. Es ist zu erkennen, dass f weder streng monoton wachsend noch streng monoton fallend ist. Dennoch ist die Funktion invertierbar. Die Inverse ist gegeben durch f −1 : R → R x 7→ f −1 (x) := −x : x < −1 x + 1 : x ∈ [−1, 0] (4.8) −x : x > 0, wie man fallweise nachrechnen kann: Ist beispielsweise x > 1, so muss (wegen f (x) = −x) f −1 (−x) = x gelten, hierbei ist −x < −1. Daher definiert man f −1 auf der Menge {x ∈ R : x < −1} gemäß der ersten Zeile in (4.8). Ist dagegen x ∈ [0, 1], so muss (wegen f (x) = x − 1) f −1 (x − 1) = x gelten. Wegen x ∈ [0, 1] ⇔ x − 1 ∈ [−1, 0] definiert man f −1 auf [−1, 0] durch x 7→ x + 1 (zweite Zeile in (4.8)). Ist schließlich x < 0, so muss (wieder wegen f (x) = −x) f −1 (−x) = x gelten, diesmal ist jedoch −x > 0. Also wird f −1 auf R+ gemäß der dritten Zeile in (4.8) definiert. Ergänzen Sie die Funktion f −1 in Abbildung 4.8 und beobachten Sie die Symmetrie der beiden Funktionen f und f −1 . N 4.3 Komposition von Abbildungen 4.3 97 Komposition von Abbildungen Unter bestimmten Voraussetzungen ist es möglich, auf ein Argument a mehrere Funktionen nacheinander anzuwenden. Sind beispielsweise f und g Funktionen, für die a im Definitionsbe reich von f und f (a) im Definitionsbereich von g liegt, so kann man g f (a) bilden. Da dies für alle a, die die entsprechenden Nebenbedingungen erfüllen, möglich ist, werden wir diese Hintereinanderausführung von f und g als eigenständige Funktion, die sogenannte Komposition definieren. Definition 4.11 Seien A, B, C und D beliebige nicht leere Mengen mit f (A) ⊆ C und f : A → B und g : C → D Funktionen. Dann nennt man die durch g◦f :A → D a 7→ (g ◦ f )(a) := g f (a) definierte Funktion die Komposition14 von g und f . Abbildung 4.9 soll verdeutlichen, was bei der Komposition von Abbildungen geschieht. Besonders ist darauf zu achten, dass die Komposition g ◦ f von Abbildungen von rechts nach links zu lesen ist: Das heißt, dass zuerst die rechts stehende Funktion (hier f ) auf das Argument, sagen wir a, angewendet wird und erst im Anschluss hieran die links stehende Funktion g auf das Bild f (a) angewendet wird. f(A) C A f f(a) D a g g(f(a)) g f Abb. 4.9 Zur Komposition von Abbildungen. 14 Mitunter wird g ◦ f auch als Verkettung, Hintereinanderausführung oder Verknüpfung bezeichnet. 4.3 Komposition von Abbildungen 98 Beispiel 4.8 A Sei σ:R→ R x 7→ σ(x) := 2x und τ : [0, 2] → [0, 4] z 7→ τ (z) := z 2 . Dann können wir die Komposition σ ◦ τ bilden, da der Bildbereich τ ([0, 2]) = [0, 4] von τ im Definitionsbereich R von σ enthalten ist. Man erhält σ ◦ τ : [0, 2] → R x 7→ σ τ (x) = 2x2 . Die umgekehrte Komposition τ ◦ σ können wir nicht bilden, denn das Bild σ(R) = R ist keine Teilmenge des Definitionsbereichs von τ . Indem wir die Funktion σ jedoch einschränken (vgl. Def. 4.5), können wir zumindest die Komposition von τ mit dieser Einschränkung bilden. Wichtig ist dabei, darauf zu achten, dass das Bild der Einschränkung eine Teilmenge vom Definitionsbereich von τ , also von [0, 2], ist. Beispielsweise gelingt dies, indem man σ auf [0, 1] ⊂ R einschränkt: σ|[0,1] : [0, 1] → [0, 2] x 7→ σ|[0,1] (x) := 2x. Damit erhält man für die Komposition von τ und σ|[0,1] τ ◦ σ|[0,1] : [0, 1] → [0, 4] x 7→ τ σ|[0,1] (x) = (2x)2 = 4x2 6= 2x2 = σ|[0,1] ◦ τ (x). An diesem Beispiel ist zu erkennen, dass sich - ungeachtet der Definitions- und Bildbereiche - insbesondere auch die Abbildungsvorschrift bei Vertauschung der Reihenfolge in der Komposition verändern kann! B Sei g :R×R→R×R (x, y) 7→ g(x, y) := (x + y, x − y) und - wie oben - für alle i ∈ {1, 2} fi : R × R → R (s1 , s2 ) 7→ fi (s1 , s2 ) := si 4.3 Komposition von Abbildungen 99 die i-te Koordinatenabbildung. Wegen g(R×R) ⊆ R2 ist die Bildung der Kompositionen f1 ◦ g und f2 ◦ g möglich(genauer gilt sogar g(R × R) = R2 , d.h., dass die Abbildung g surjektiv ist; überzeugen Sie sich hiervon durch eine sorgfältige Rechnung): Es ist f1 ◦ g : R × R → R (x, y) 7→ x + y und f2 ◦ g : R × R → R (x, y) 7→ x − y. Die Graphen der Kompositionen f1 ◦ g und f2 ◦ g sehen Sie in Abbildung 4.10: Abb. 4.10 Die Graphen der Funktionen f1 ◦ g (links) und f2 ◦ g (rechts). Den Quellcode zur Erzeugung der Graphik von f2 ◦ g in Abbildung 4.10 (rechts) mit der Symbolic Math Toolbox in MATLAB ist habe ich den am Einsatz eines Computeralgebrasystems interessierten Studierenden in Abbildung 4.11 beispielhaft einmal angegeben. Abb. 4.11 Quellcode zur Erzeugung der Graphik f2 ◦ g. Die umgekehrten Kompositionen g ◦ f1 und g ◦ f2 lassen sich jeweils nicht bilden. 4.3 Komposition von Abbildungen 100 C Sei A eine beliebige nichtleere Menge und f : A → A eine Abbildung. Dann sind auch die Kompositionen f ◦ idA und idA ◦ f Abbildungen von A nach A und es gilt f ◦ idA = f, R (4.9) idA ◦ f = f. Es gilt nämlich f ◦ idA (x) = f idA (x) = f (x) und idA ◦ f (x) = idA f (x) = f (x) für alle x ∈ A. Die Komposition einer beliebigen Funktion mit der Identität ähnelt also, was die Auswirkungen betrifft, der Multiplikation einer beliebigen reellen Zahl mit 1 oder der Addition von 0 zu einer solchen Zahl. Im Kontext des Begriffs vom sogenannten neutralen Element kommen wir an späterer Stelle auf diese Analogie zurück. N Bei der Verknüpfung zweier Funktionen kommt es also auf die Reihenfolge an! Neben den Definitions- und Bildbereichen sind in aller Regel auch die Abbildungsvorschriften von g◦f und f ◦g verschieden! Die Komposition von Funktionen ist also nicht kommutativ. Eine andere grundlegende Eigenschaft von Verknüpfungen, die wir bereits aus der Logik und aus der Mengenlehre, aber auch von der Addition bzw. Multiplikation reeller Zahlen kennen, ist aber erfüllt, wie der folgende Satz zeigt: Satz 4.4 Sind f : A → B ′ , g : B → C ′ und h : C → D Funktionen, für die f (A) ⊆ B und g(B) ⊆ C erfüllt ist, so gilt h ◦ (g ◦ f ) = (h ◦ g) ◦ f. Die Komposition von Funktionen ist also assoziativ. Beweis: Es ist zu zeigen, dass für alle a ∈ A die Identität h ◦ (g ◦ f ) (a) = (h ◦ g) ◦ f (a) gilt. Sei also a ∈ A beliebig, aber fest. Dann ist h ◦ (g ◦ f ) (a) = h (g ◦ f )(a) = h g f (a) = (h ◦ g) f (a) = (h ◦ g) ◦ f (a). Zum Abschluss dieses Abschnitts seien noch wichtige Aussagen zur Äquivalenz von Bijektivität und Umkehrbarkeit einer Funktion formuliert: Satz 4.5 Ist f : A → B bijektiv und f −1 : B → A deren Inverse, so gilt f −1 ◦ f = idA und f ◦ f −1 = idB . Beweis: Ist f : A → B bijektiv, so gilt, da f −1 (b) die eindeutig bestimmte Lösung der Gleichung f (a) = b in der Unbekannten a ist, für alle a ∈ A (f −1 ◦ f )(a) = f −1 f (a) = f −1 (b) = a = idA (a). Gemäß Definition 4.3 gilt also f −1 ◦ f = idA . Umgekehrt ist für alle b ∈ B (f ◦ f −1 )(b) = f f −1 (b) = f (a) = b = idB (b), was f ◦ f −1 = idB nach sich zieht. 4.3 Komposition von Abbildungen 101 Abb. 4.12 Zur Komposition zueinander inverser Abbildungen. Abbildung 4.12 illustriert den in Satz 4.5 dargestellten Zusammenhang. Beispiel 4.9 + Aus dem vorangegangenen Abschnitt wissen wir, dass die Wurzelfunktion t : R+ 0 → R0 , √ + −1 2 y 7→ t(y) := y bijektiv ist mit Umkehrabbildung t−1 : R+ 0 → R0 mit x 7→ t (x) = x . Tatsächlich gilt für alle x ∈ R+ 0 √ t ◦ t−1 (x) = t t−1 (x) = t(x2 ) = x2 = x = idR+0 (x) und √ √ t−1 ◦ t(x) = t−1 t(x) = t−1 ( x) = ( x)2 = x = idR+0 (x), also ist t ◦ t−1 = t−1 ◦ t = idR+0 . N Allgemeiner kann sogar gezeigt werden, dass die Komposition beliebiger (nicht notwendig zueinander inverser) bijektiver Abbildungen wieder bijektiv ist. Satz 4.6 Seien f : A → B ′ und g : B → C Abbildungen mit f (A) ⊆ B bijektiv. Dann ist auch g ◦ f : A → C bijektiv. Beweis: Den Beweis werden Sie in den Übungen durchführen. Die folgende Umkehrung zu Satz 4.5 ist für die Praxis von höchster Relevanz: Sie ermöglicht es, die Bijektivität einer Funktion, also Injektivität und Surjektivität, durch Angabe einer Umkehrfunktion nachzuweisen: Satz 4.7 Ist f : A → B eine Abbildung, zu der es eine Abbildung g : B → A gibt, die die Identitäten f ◦ g = idB und g ◦ f = idA erfüllt, so ist f bijektiv und es gilt f −1 = g. 4.4 Mächtigkeit von Mengen 102 Beweis: Wir müssen nachweisen, dass f injektiv und surjektiv ist, wenn es eine Funktion g mit den beschriebenen Eigenschaften gibt. Beginnen wir mit der Injektivität: Seien dazu x, y ∈ A und f (x) = f (y). Weil g : B → A eine Abbildung ist, folgt daraus g f (x) = g f (y) . Die linke Seite dieser Gleichung stimmt jedoch nach Voraussetzung mit g ◦ f (x) = idA (x) = x überein, die rechte mit g ◦ f (y) = idA (y) = y. Also folgt aus der Voraussetzung die Gleichheit x = y, was die Injektivität beweist. Kommen wir nun zum Nachweis der Surjektivität: Sei dazu b ∈ B beliebig. Wählt man a := g(b) ∈ A, so folgt mit der Voraussetzung f (a) = f g(b) = f ◦ g(b) = idB (b) = b. Damit gibt es zu jedem b ∈ B ein Urbild in A. Insgesamt ist nun bewiesen, dass f bijektiv ist, also existiert die Inverse f −1 . Bleibt zu zeigen, dass f −1 = g; dies belegen die folgenden Äquivalenzumformungen der Voraussetzung: g ◦ f = idA (4.9) ⇔ (g ◦ f ) ◦ f −1 = idA ◦ f −1 Satz 4.4 ⇔ g ◦ (f ◦ f −1 ) = idA ◦ f −1 ⇔ g ◦ (f ◦ f −1 ) = f −1 Satz 4.5 ⇔ g ◦ idB = f −1 (4.9) ⇔ g = f −1 . 4.4 Mächtigkeit von Mengen Wie viele Elemente hat N? Und hat die Menge N aller natürlichen Zahlen doppelt so viele Elemente wie die Menge 2N aller geraden natürlichen Zahlen? Und wie stehen Z, Q und R, was jeweils die Anzahl ihrer Elemente betrifft, zu N im Verhältnis? Solchen und ähnlichen Fragen werden wir im letzten Abschnitt des Kapitels über Abbildungen nachgehen. Vielleicht wundert es Sie, dass diese Fragen über die Anzahlen von Elementen ausgesuchter Mengen im Zusammenhang mit Abbildungen beantwortet werden sollen, aber tatsächlich ist es der Begriff der Bijektivität, der hier den Schlüssel zu den Antworten liefert. Zunächst müssen wir präzisieren, was man unter einer endlichen Menge und deren Mächtigkeit (bzw. Kardinalität) versteht: Definition 4.12 (a) Eine Menge A heißt endlich, wenn es ein n ∈ N0 gibt, so dass A genau n Elemente hat. (b) Unter der Mächtigkeit oder Kardinalität einer endlichen Menge A versteht man die Anzahl ihrer Elemente. Man schreibt dafür 15 |A|. Beispiel 4.10 A |{}| = |∅| = 0 15 Gelegentlich wird die Mächtigkeit einer Menge A auch mit #A bezeichnet. 4.4 Mächtigkeit von Mengen 103 B |{0}| = 1 C |{2, 2, 2}| = 1 D |{z 2 : z ∈ {−2, 5, 8}}| = 3 E |{x ∈ Z : |x| ≤ 3}| = 7. N Nun können wir einen ersten einfachen Satz über die Existenz surjektiver, injektiver und bijektiver Abbildungen zwischen endlichen Mengen formulieren und beweisen: Satz 4.8 Seien m, n ∈ N und A, B Mengen mit |A| = m und |B| = n. Dann gibt es (a) eine surjektive Funktion f : A → B ⇔ m ≥ n, (b) eine injektive Funktion f : A → B ⇔ m ≤ n, (c) eine bijektive Funktion f : A → B ⇔ m = n. Beweis: In allen drei Fällen sind jeweils zwei Richtungen nachzuweisen; zum einen, dass die (Un-)Gleichung über m und n notwendig ist für die Existenz der entsprechenden Abbildung, zum anderen, dass diese (Un-)Gleichung auch hinreichend ist. Œ gehen wir davon aus, dass A = {a1 , . . . , am } und B = {b1 , . . . , bn } ist. (a) Zunächst nehmen wir an, dass eine surjektive Abbildung f : A → B existiert. Dann ist B = f (A) = {f (a1 ), . . . , f (am )} eine Menge mit n Elementen. Da f (A) aber höchstens m Elemente enthält, muss m ≥ n gelten. Ist umgekehrt m ≥ n, so kann man eine surjektive Abbildung f auf A definieren wie folgt: f (a1 ) := b1 , f (a2 ) := b2 , . . . , f (an ) := bn , f (an+1 ) := . . . := f (am ) := b1 . (b) Nehmen wir an, dass eine injektive Abbildung f : A → B existiert. Dann ist f (A) = {f (a1 ), . . . , f (am )} ⊆ B m-elementig, was m ≤ n impliziert. Ist umgekehrt m ≤ n, so kann man eine injektive Abbildung f von A nach B definieren wie folgt: f (a1 ) := b1 , f (a2 ) := b2 , . . . , f (am ) := bm . (c) Die Behauptung folgt unmittelbar aus den Aussagen in (a) und (b). Bemerkung 4.6 Beachten Sie, dass die Aussage (c) des vorangegangenen Satzes auch wie folgt formuliert werden kann: Zwei endliche, nicht leere Mengen A und B sind von gleicher Mächtigkeit genau dann, wenn es eine Bijektion zwischen ihnen gibt. Wir kommen hierauf in Kürze zurück! Korollar 4.9 Ist A eine endliche, nicht leere Menge, so ist eine Funktion f : A → A injektiv genau dann, wenn sie surjektiv ist. 4.4 Mächtigkeit von Mengen 104 Beweis: Angenommen, |A| = n (dabei sei n ∈ N beliebig). Ist f : A → A injektiv, so werden je zwei verschiedene Elemente aus A auf je zwei verschiedene (möglicherweise andere) Elemente in A abgebildet. Daher muss jedes der n Elemente in A auch ein Bild, f also surjektiv, sein. Ist f nach Voraussetzung surjektiv, so ist jedes der n Elemente in A ein Bild. Da aber nur n Elemente als Urbilder zur Verfügung stehen, müssen je zwei verschiedenen dieser Urbilder auch verschiedene Bilder zugeordnet werden, was die Injektivität der Funktion liefert. Korollar 4.9 sagt also aus, dass eine Selbstabbildung16 auf einer endlichen Menge entweder bijektiv oder weder surjektiv noch injektiv ist. Für Selbstabbildungen auf nicht endlichen Mengen ist diese Aussage nicht richtig, wie folgende Beispiele zeigen: Die Funktion f :N→N n 7→ 2n ist sicher injektiv, aber nicht surjektiv. Dagegen ist die Funktion f :N → n 7→ N n 2 n+1 2 : n ∈ 2N : n ∈ 2N − 1, die 1 und 2 auf 1, 3 und 4 auf 2 etc. abbildet, surjektiv, aber nicht injektiv. Die Aussage (c) in Satz 4.8 ist ausschlaggebend für die folgende Definition. Definition 4.13 Zwei beliebige Mengen A und B heißen gleichmächtig, falls es eine Bijektion f : A → B gibt. Man schreibt dann |A| = |B|. R Beachten Sie, dass die Richtung A → B der Bijektion in Definition 4.13 irrelevant ist: Ist f : A → B eine Bijektion, so ist natürlich auch f −1 : B → A eine Bijektion (siehe Seite 93) und B ist gleichmächtig zu A. Halten Sie mal für einen kurzen Moment inne und machen Sie sich bewusst, in was für einer Situation wir uns derzeit befinden: Wir haben bislang nicht geklärt, was beispielsweise |N| oder |Z|, also die Mächtigkeit von N bzw. Z ist, denn weder N noch Z ist endlich (Definition 4.12 gilt nur für endliche Mengen). Ungeachtet dessen haben wir aber gesagt, dass |N| = |Z| ist, falls es eine Bijektion zwischen N und Z gibt. Hiervon wollen wir uns im Folgenden überzeugen: Satz 4.10 Es gilt |N| = |Z|. Beweis: Wir müssen eine Bijektion von N nach Z (oder von Z nach N) angeben. Wir werden ersteres tun: Sei f : N → Z definiert gemäß f (1) := 0, f (2) := 1, f (3) := −1, f (4) := 2, f (5) := −2, f (6) := 3, f (7) := −3 . . . 16 Jede Funktion f : A → A wird Selbstabbildung (auf A) genannt. 4.4 Mächtigkeit von Mengen 105 Abb. 4.13 Zur Gleichmächtigkeit von N und Z. Allgemein können wir das so schreiben: f :N→Z m : ∃ m ∈ N : n = 2m n 7→ −m + 1 : ∃ m ∈ N : n = 2m − 1 Dann ist f tatsächlich bijektiv (klar?!) - und damit sind N und Z gleichmächtig (obwohl wir nicht wissen, wie mächtig sie sind.) Anschaulich gesprochen bedeutet das in Verallgemeinerung von Aussage (c) in Satz 4.8, dass N und Z gleich viele Elemente haben - obwohl das unserer Intuition natürlich total widerspricht! Wir würden vermutlich eher denken, dass Z doch mindestens doppelt so viele Elemente hat wie N - zu jeder natürlichen Zahl gibt es die entsprechende negative Variante - und dann ist da auch noch die 0 ...; andererseits hat N schon unendlich viele Elemente und zwei mal unendlich ist sicher wieder unendlich... Übrigens sind auch N und N0 gleichmächtig, obwohl man meinen könnte(!), dass N0 ein Element mehr hat als N. Die Ausführungen sollen deutlich machen, wie schwierig die Frage nach der Anzahl von Elementen für nicht endliche Mengen zu beantworten ist. Das liegt eben am Wesen des Unendlichen und wird uns noch des Öfteren zumindest staunen lassen. Auf der Grundlage von Definition 4.12 und 4.13 definiert man nun den Begriff der unendlichen Menge zunächst einmal wie folgt: Definition 4.14 Eine Menge A heißt unendlich, wenn es kein n ∈ N0 gibt, so dass |A| = |{0, 1, . . . , n − 1}| = n gilt. Damit ist eine Menge unendlich genau dann, wenn sie nicht endlich ist. Überraschenderweise ist aber der Begriff der unendlichen Menge genauso facettenreich wie der der endlichen Menge. Eine erste Spezifikation ist in der folgenden Definition enthalten: Definition 4.15 Eine unendliche Menge A heißt abzählbar unendlich oder von der Kardinalität17 ℵ0 oder von der Mächtigkeit ℵ0 , wenn |N| = |A| gilt. Man schreibt dann auch |A| = ℵ0 . 17 ℵ, gesprochen aleph“ , ist der erste Buchstabe im hebräischen Alphabet. ” 4.4 Mächtigkeit von Mengen 106 Eine unendliche Menge, die nicht abzählbar unendlich ist, heißt überarbzählbar unendlich. Ist eine Menge A abzählbar unendlich, so kann man ihre Elemente abzählen“, also durchnum” merieren: Ist nämlich f : N → A die nach Definition existierende Bijektion zwischen N und A, so gilt {f (1), f (2), f (3), f (4), . . .} = A. Man kann also f (1) als das erste Element in A, f (2) als das zweite, f (3) als das dritte und allgemein f (n) als das n-te Element in A betrachten. Da f insbesondere surjektiv ist, werden wir bei diesem Abzählen kein Element von A vergessen“. ” Wie wir uns bereits überlegt haben, gilt |N| = |N0 | = |Z| = ℵ0 : Z ist also abzählbar unendlich. Spannend ist nun, ob auch |Q| = ℵ0 und |R| = ℵ0 gilt. Ersteres ist richtig, Zweiteres falsch. Bevor wir hierauf näher eingehen, sollen jedoch einige Anmerkungen zum Konzept der Kardinalzahlen gemacht werden. Zunächst sollte herausgestellt werden, dass es der überaus bedeutende deutsche Mathematiker Georg Cantor, geb. am 3. März 1845 in Sankt Petersburg, gest. am 6. Januar 1918 in Halle (Saale) war, der im letzten Viertel des 19. Jahrhunderts die Mengenlehre begründete (Bildquelle: www.mathematik.uni-halle.de, 21. November 2008). Er klassifizierte Mengen nach ihrer Kardinalzahl (auch Mächtigkeit genannt). Mit seiner Beobachtung, dass es viele verschiedene unendliche ” Mächtigkeiten“ gibt, hat er damals die gesamte mathematische Welt in Aufregung versetzt. Die im Folgenden ausgeführten Überlegungen gehen auf Cantor zurück: Definiert man, dass zwei Mengen A und B in Relation ρ zueinander stehen, falls |A| = |B| ist, Abb. 4.14 Georg Cantor so hat diese Relation alle Eigenschaften einer Äquivalenzrelation 18 : Zunächst einmal gilt für jede Menge A die Gleichheit |A| = |A|, da die Identität idA eine Bijektion ist; ρ ist also reflexiv. Weiter ist die Relation, wie im Anschluss an Definition 4.13 schon erläutert wurde, symmetrisch. Für den Nachweis der Transitivität nehmen wir an, dass A, B und C Mengen sind, für die |A| = |B| und |B| = |C| gilt: f : A → B 18 An dieser Stelle muss angemerkt werden, dass diese Äquivalenzrelation formal nicht auf der Menge aller Mengen definiert werden kann, denn die Menge aller Mengen ist ein in sich widersprüchliches Konstrukt! Um das einzusehen, gehen wir für einen Moment davon aus, dass es sie gäbe und dass sie Γ heiße; nun sei M := {γ ∈ Γ : γ ∈ / γ} ⊆ Γ die Menge aller Mengen, die sich nicht selbst als Element enthalten. Weil M als Teilmenge von Γ selbst wieder eine Menge ist, folgt M ∈ M oder M ∈ / M. Der erste Fall impliziert laut Definition von M jedoch auch M ∈ / M, der zweite analog M ∈ M. Insgesamt hat man damit die falsche Aussage M ∈ M ⇔ M ∈ / M nachgewiesen. Also kann M (und damit auch Γ) keine richtige“ Menge sein. ” Der hier beschriebene logische Widerspruch wurde zu Beginn des 20. Jahrhunderts von dem britischen Philosophen und Mathematiker Bertrand Russell (∗ 18. Mai 1872, † 2. Februar 1970) gefunden und veröffentlicht. Er stellte (gemeinsam mit einigen älteren Antinomien der Mengenlehre) den Anstoß für die Entwicklung der axiomatischen Mengenlehre dar. Unter dem Link http://www.mathe-online.at/mathint/mengen/i.html#MengeallerMengen finden Sie hierzu weitere Informationen. 4.4 Mächtigkeit von Mengen 107 und g : B → C seien die zugehörigen Bijektionen. Gemäß Satz 4.6 ist dann auch die Abbildung g ◦ f : A → C bijektiv, woraus |A| = |C| folgt. Damit können wir also für jede Menge A deren Äquivalenzklasse [A] := {B : |A| = |B|} bilden. (Nach dem oben Gesagten gilt N0 ∈ [N] und Z ∈ [N].) Die so entstehenden Äquivalenzklassen nennt man Kardinalzahlen. Die Kardinalzahl (also die Äquivalenzklasse) einer endlichen Menge mit n Elementen wird mit der natürlichen Zahl n identifiziert: [{1, 2, . . . , n}] ∼ = n, hierbei ist n ∈ N beliebig (vgl. dazu Definition 4.12). Die Kardinalzahlen unendlicher Mengen dagegen werden mit dem hebräischen Buchstaben ℵ und einem Index i ∈ N0 bezeichnet. Weil N in gewissem Sinne die kleinste unendliche Menge ist (das wollen wir hier nicht zeigen), setzt man [N] =: ℵ0 . Liegt eine Menge A in der Äquivalenzklasse (also Kardinalzahl) ℵi , so sagt man, dass A die Mächtigkeit oder Kardinalität ℵi hat und schreibt dafür - in Verallgemeinerung der Definition 4.12 - |A| = ℵi . Übrigens ist unter Annahme der sogenannten Kontinuumshypothese 19 die auf ℵ0 folgende Kardinalzahl [R] =: ℵ1 . Das bedeutet insbesondere, dass R mächtiger ist als N und keine Bijektion zwischen N und R existiert. In Kürze werden wir uns auch hiervon überzeugen. Zunächst wollen wir aber jetzt beweisen, dass Q abzählbar unendlich ist. Satz 4.11 Die Menge Q := { pq : p, q ∈ Z, q 6= 0} der rationalen Zahlen ist abzählbar unendlich. Beweis (Cantors erstes Diagonalargument): Wir müssen zeigen, dass es eine Bijektion f : N → Q gibt. Dazu zeigen wir zunächst, dass es eine Bijektion f ′ : N → Q+ gibt, wobei Q+ := {x ∈ Q : x > 0} die Menge der positiven rationalen Zahlen bezeichnet. Zu diesem Zweck ordnen wir die positiven rationalen Zahlen in einem ganz bestimmten Schema (siehe Abbildung 4.15) an und laufen“ sie entlang des durch die Pfeile eindeutig beschriebenen ” Weges, beginnend in 11 , alle ab“. Hierbei ist zu beachten, dass alle im Schema mehrfach ” vorkommenden rationalen Zahlen wie 1 = 22 = 33 = . . . nur einmal als Bild zuzulassen sind! (Daher sind alle Zahlen ab ihrem zweiten Auftreten grau statt schwarz dargestellt, die Pfeile führen entsprechend an ihnen vorbei.) Auf diese Art und Weise erhält man eine bijektive Abbildung f ′ : N → Q+ wie folgt: 1 f ′ (1) := 1, f ′ (2) := , f ′(3) := 2, f ′ (4) := 3, 2 1 2 1 ′ f (5) := (nach Überspringen von = 1 = f (1)), f ′(6) := , . . . 3 2 4 19 Man kann zeigen, dass die Menge der Kardinalzahlen total geordnet ist, d.h. dass für [N] und [R] die Ungleichung [N] ≤ [R] oder [R] ≤ [N] gilt (wobei [A] ≤ [B] bedeutet, dass es eine Bijektion f von A auf eine Teilmenge von B gibt). Es ist offensichtlich, dass [N] ≤ [R] gelten muss, jedoch fraglich, ob [N] = [R] oder [N] < [R] gilt (hierbei bedeutet [A] < [B], dass es eine Bijektion f von A auf eine Teilmenge von B gibt, aber keine Bijektion von A nach B existiert; man nennt A dann weniger mächtig als B und B mächtiger als A). Die Kontinuumshypothese, die 1878 von Georg Cantor aufgestellt wurde und weder bewiesen noch widerlegt werden kann, besagt, dass es keine Menge gibt, die mächtiger ist als N, aber weniger mächtig als R: Anders ausgedrückt: ∄ A : [N] < [A] < [R]. Damit sind [N] und [R] aufeinanderfolgende Kardinalzahlen. 4.4 Mächtigkeit von Mengen 108 Abb. 4.15 Zur Abzählbarkeit von Q+ . Aus dieser Abzählung von Q+ kann man folgende Bijektion f : N → Q gewinnen: f (1) := 0, f (2) := f ′ (1), f (3) := −f ′ (1), f (4) := f ′ (2), f (5) := −f ′ (2), f (6) := f ′ (3), f (7) := −f ′ (3), . . . allgemein: f (1) := 0, f (2n) := f ′ (n), f (2n + 1) := −f ′ (n) ∀ n ∈ N. Damit ist die Abzählbarkeit von Q bewiesen: Es gilt |Q| = |Z| = |N| = ℵ0 . Wie oben bereits angedeutet, ist die Menge R der reellen Zahlen nicht abzählbar unendlich, d.h., dass es keine Bijektion zwischen N und R gibt. Auch hiervon wollen wir uns nun überzeugen. Satz 4.12 Die Menge R ist überabzählbar unendlich. Beweis (Cantors zweites Diagonalargument, 1877): Wir wollen zunächst folgende Implikation verifizieren: ∀ A ⊆ [0, 1] = {x ∈ R : 0 ≤ x ≤ 1} : A = [0, 1] ⇒ A ist überabzählbar unendlich. Hierzu führen wir einen indirekten Beweis durch, d.h. wir nehmen zunächst an, dass A ⊆ [0, 1] nicht überabzählbar unendlich, also endlich oder abzählbar unendlich ist, und schließen daraus, dass A ⊂ [0, 1], also A 6= [0, 1], gilt. Gemäß Annahme existiert also eine Abbildung f : N → A, so dass f zumindest surjektiv ist (ist A abzählbar unendlich, so kann man f sogar bijektiv wählen): Damit gilt 4.4 Mächtigkeit von Mengen 109 {f (1), f (2), f (3), f (4), . . .} = A ⊆ [0, 1]. Jede Zahl f (n) hat, das wissen wir bereits aus der Schule, eine unendliche Dezimalbruchentwicklung, nennen wir sie 0.xn1 xn2 xn3 xn4 . . . . Für jedes i ∈ N und jedes n ∈ N gilt also xni ∈ {0, . . . , 9}. (Es ist durchaus möglich, dass ab einem bestimmten Index i0 alle Ziffern gleich oder sogar 0 sind, dies ist z. Bsp. bei der Zahl 1 = 0.5 = 0.50 der Fall.) Diese Dezimalbruchentwicklungen schreiben wir jetzt alle unterein2 ander: f (1) = 0.x11 x12 x13 x14 x15 . . . f (2) = 0.x21 x22 x23 x24 x25 . . . f (3) = 0.x31 x32 x33 x34 x35 . . . f (4) = 0.x41 x42 x43 x44 x45 . . . f (5) = 0.x51 x52 x53 x54 x55 . . . (4.13) ...... f (n) = xn1 xn2 xn3 xn4 xn5 . . . ...... (Diese Auflistung ist endlich, sofern A endlich ist.) Nun definieren wir eine reelle Zahl y = 0.y1 y2 y3 y4 . . . ∈ [0, 1], die sogenannte Diagonalzahl, wie folgt: Sei 2 : xn = 1 n yn = 1 : xnn 6= 1 (4.14) Weil dann yn 6= xnn für alle n ∈ N, ist y 6= f (n) für alle n ∈ N. Das bedeutet, dass y ein Element in [0, 1] ist, welches in der Liste (4.13) nicht vorkommt! Damit ist f (N) = A 6= [0, 1]. Also ist [0, 1] nicht abzählbar unendlich. Da [0, 1] ⊂ R eine Teilmenge von R ist, kann damit auch R nicht abzählbar unendlich sein. Cantor hat die Beweisidee zu Satz 4.12 auf Potenzmengen verallgemeinert und gezeigt, dass die Potenzmenge P(A) einer Menge A mächtiger ist als die Menge A selber. Für den Spezialfall A = N liest sich das dann wie folgt: Satz 4.13 Die Potenzmenge P(N) der natürlichen Zahlen ist überabzählbar unendlich. Beweis: Wir nehmen wieder an, dass es eine Bijektion f : N → P(N) gibt. Wir setzen f (n) =: An und betrachten die Menge A := {m ∈ N : m ∈ / Am } ⊆ N. Nach Voraussetzung ist f surjektiv, also gibt es einen Index k ∈ N, so dass Ak = f (k) = A. Für den Index k ∈ N gilt entweder k ∈ Ak oder k ∈ / Ak . Im ersten Fall (k ∈ Ak ) können wir k∈ / A schlussfolgern, was der Identität Ak = A widerspricht. Im zweiten Fall (k ∈ / Ak ) können wir die Inklusion k ∈ A ableiten, die der Identität A = Ak aber ebenso widerspricht. In jedem Fall führt unsere Annahme der Abzählbarkeit von P(N) zu einem Widerspruch. Damit ist die Annahme falsch und der Satz bewiesen. 4.4 Mächtigkeit von Mengen 110 In dem Buch [AA05] Mengen-Zahlen-Zahlbereiche von Kristina und Jürgen Appell ist ein weiteres interessantes Beispiel angegeben. In Abschnitt 2.4 wird dort gezeigt, dass die Menge Abb(R, R) := {f : R → R : f Funktion} mächtiger ist als R, d.h. es gilt |Abb(R, R)| > |R| = ℵ1 . Kapitel 5 Die natürlichen Zahlen In Abschnitt 1.8 hatten wir uns mit dem Aufbau einer mathematischen Theorie beschäftigt. Eine solche geht insbesondere jeweils von einem Axiom oder einem System mehrerer Axiome aus: Auch die Theorie der Zahlen ist durch das Vorhandensein eines Axiomensystems, von dem aus alle weiteren (nicht in den Axiomen formulierten) Aussagen über Zahlen abgeleitet werden, charakterisiert. Im Rahmen dieses Kapitels wollen wir dieses Axiomensystem, welches die natürlichen Zahlen beschreibt, kennen lernen; ausgehend hiervon werden wir im Anschluss daran die Definition der Addition, der Multiplikation und der Anordnung natürlicher Zahlen studieren. In diesem Zusammenhang werden wir beispielsweise auch beweisen, dass 3+5 = 5+3 ist. Vielleicht erscheint Ihnen diese Gleichheit so selbstverständlich, dass Sie sich fragen, warum man etwas derartig Offensichtliches beweisen sollte; ich hoffe, Sie davon überzeugen zu können, dass diese Gleichheit nicht trivial ist, wenn man sich der Frage stellt, was die natürlichen Zahlen eigentlich ganz genau sind - und was unter der hier erwähnten Addition + formal präzise zu verstehen ist. Im Übrigen wird Ihnen im Zusammenhang mit der Definition der natürlichen Zahlen klar werden, wieso das Ihnen vielleicht aus der Schule schon bekannte Beweisprinzip der vollständigen Induktion so funktioniert, wie es funktioniert. 5.1 Definition der natürlichen Zahlen Bisher haben wir sowohl die Existenz als auch die algebraischen Eigenschaften der Menge R der reellen Zahlen - und damit wegen der Teilmengeneigenschaft auch die der Mengen Q, Z und N - als bekannt vorausgesetzt. In diesem Abschnitt wollen wir dieser Voraussetzung auf den Grund gehen, indem wir zunächst das von dem italienischen Mathematiker Giuseppe Peano (∗ 27.8.1858, † 20.4.1932) formulierte Axiomensystem für die natürlichen Zahlen unter die Lupe nehmen1 . Peanos Axiomensystem der natürlichen Zahlen korrespondiert in 1 Neben dem von Peano angegebenen Axiomensystem gibt es noch andere Möglichkeiten, die Menge N der natürlichen Zahlen einzuführen, beispielsweise die mengentheoretische Methode, N als die Menge endlicher Kardinalzahlen zu definieren; diese Methode macht eine axiomatische Begründung des Rechnens mit natürlichen Zahlen aber schwierig. 111 5.1 Definition der natürlichen Zahlen 112 ausgezeichneter Weise zu dem uns allen wohl bekannten Zählvorgang - geht es doch davon aus, dass beispielsweise 52 diejenige (natürliche) Zahl ist, die nach der Zahl 51 kommt“. ” Ich möchte Ihnen die zur Charakterisierung von N notwendigen fünf Peanoschen Axiome nicht einfach angeben, sondern Schritt für Schritt mit Ihnen erarbeiten, welche Eigenschaften den uns allen so vertrauten Zählvorgang auszeichnen; folgende Frage ist also für uns zentral: Was ist Zählen? Zunächst einmal benötigt man eine Menge - wir nennen sie M, innerhalb der gezählt werden soll. Nun beginnt man die Zählung mit einem ausgezeichneten Element, einem sogenannten Startelement; es wird im Folgenden 1 (gesprochen eins“) genannt2 . Die Existenz eines ” solchen Startelements in M forderte Peano in seinem ersten Axiom (P1): (P1) 1 ∈ M. Abb. 5.1 Visualisierung des Zählprozesses“. ” Nachdem das Startelement benannt wurde, benennt man ein anderes, eindeutig bestimmtes Element der Menge, den sogenannten Nachfolger 3 des Elements 1. Hierauf benennt man ein weiteres eindeutig bestimmtes Element der Menge, nämlich den Nachfolger des Nachfolgers von 1. Diesen Vorgang wiederholt man nun wieder und wieder. Peano drückte diesen Aspekt des Zählvorgangs - also die Eigenschaft, dass jedes Element m ∈ M einen Nachfolger ν(m) in M hat - in seinem zweiten Axiom wie folgt aus: (P2) ∃ Abbildung ν : M → M. Die Abbildung ν heißt Nachfolgerabbildung und für alle m ∈ M heißt ν(m) der Nachfolger von m (betrachten Sie hierzu Abbildung 5.1). Die Tatsache, dass es zu jedem m ∈ M nur einen Nachfolger gibt, wird dadurch abgesichert, dass ν eine Abbildung ist. 2 3 Jede andere Bezeichnung wäre ganz genauso möglich! Beachten Sie, dass wir Symbole wie 2, 3, . . . zunächst nicht verwenden wollen! 5.1 Definition der natürlichen Zahlen 113 Abb. 5.2 Zur Motivation von Axiom (P3). Wäre der Zählvorgang durch diese beiden Axiome vollständig beschrieben, so wäre es möglich, dass er gemäß den Skizzen in Abbildung 5.2 vonstattenginge, d.h., dass das ausgezeichnete Element 1 selbst ein Nachfolger wäre. Für den uns so vertrauten Zählvorgang muss das ausgeschlossen werden. Peano formulierte daher ein Axiom (P3) wie folgt: (P3) m ∈ M ⇒ ν(m) 6= 1. Dieses Axiom korrespondiert zu der anfangs bereits genannten Eigenschaft des Zählprozesses, in 1 zu beginnen (durch (P1) und (P2) wurde dies nicht geliefert): Gemäß (P3) ist nämlich 1 kein Nachfolger, also muss es ein Startwert“ sein (dass es außer 1 keinen anderen Startwert ” gibt, wird durch ein weiteres Axiom abgesichert werden). Nun ist gemäß (P1) bis (P3) noch nicht ausgeschlossen, dass zwei verschiedene natürliche Zahlen ein- und denselben Nachfolger haben. In Abbildung 5.3 (links) ist das beispielsweise für 1 und ν(ν(ν(1))) der Fall. Abb. 5.3 Zur Motivation von Axiom (P4). Im rechten Bild haben m (wessen Nachfolger auch immer das ist) und ν ν(1) denselben 5.1 Definition der natürlichen Zahlen 114 Nachfolger. Um Derartiges auszuschließen, formulierte Peano ein weiteres Axiom: (P4) ν ist injektiv. Nun sieht die Charakterisierung des uns bereits aus der frühen Kindheit bekannten Zählprozesses vielleicht vollständig aus. Tatsächlich haben wir aber einen sehr (!) wichtigen Aspekt noch nicht berücksichtigt. Dazu betrachte man Abbildung 5.4. Hier wird angedeutet, wie ein Prozess aussehen könnte, der bei 1 beginnt (also (P1) erfüllt), dann jeweils zu einem (vorher noch nicht genannten) Nachfolger in M springt (also (P2) bis (P4) erfüllt) und dabei eine Teilmenge von M nie erreicht“ (die Nachfolgerabbildung auf dieser Teilmenge ist durch ” gestrichelte Pfeile angedeutet). Unserem Verständnis nach darf etwas Derartiges nicht möglich sein; gehen wir doch davon aus, dass wir beim Zählen, wenn wir es nur lange genug machen, jede beliebige natürliche Zahl erreichen! Es darf also keine Teilmenge der von 1 verschiedenen natürlichen Zahlen geben, deren Elemente keine Nachfolger sind - anders ausgedrückt soll folgendes gelten: Satz 5.1 ν(M) = M \ {1}. Diese Eigenschaft des Zählprozesses wird durch das sogenannte Induktionsaxiom sichergestellt: Abb. 5.4 Zur Motivation des Induktionsaxioms (P5). (P5) A ⊆ M ∧ 1 ∈ A ∧ ν(A) ⊆ A ⇒ A = M. Beachten Sie, dass sich (P5) äquivalent formulieren lässt wie folgt: (P5) A ⊆ M ∧ 1 ∈ A ∧ (∀ m : m ∈ A ⇒ ν(m) ∈ A) ⇒ A = M. Tatsächlich lässt sich die Richtigkeit von Satz 5.1 mittels (P1) bis (P5) nämlich wie folgt beweisen: 5.1 Definition der natürlichen Zahlen 115 Beweis (Satz 5.1): Es ist klar, dass ν(M) ⊆ M \ {1} (wg. (P2) und (P3)). Bleibt also zu zeigen, dass ν(M) ⊇ M \ {1}, was gleichbedeutend damit ist, dass zu jedem m ∈ M \ {1} ein n = n(m) ∈ M existiert, so dass ν(n) = m gilt (dies bedeutet, dass jedes m aus M \ {1} ein Nachfolger sein muss). Sei nun A := {1} ∪ {m ∈ M : ∃ n ∈ M : ν(n) = m} die Vereinigung der das Startelement enthaltenden Menge und der Menge aller Nachfolger. Dann gilt A ⊆ M und 1 ∈ A nach Definition. Weiter gilt mit m ∈ A auch m ∈ M, dies impliziert ν(m) ∈ A, da ν(m) der Nachfolger der natürlichen Zahl m ist. Also gilt ν(A) ⊆ A. Gemäß (P5) ist damit A = M und somit jedes Element in A \ {1} = M \ {1} ein Nachfolger. Korollar 5.2 Die Abbildung νb : M → M \ {1}, definiert über m 7→ νb (m) := ν(m), ist bijektiv 4 . Beweis: Die Behauptung folgt unmittelbar aus Axiom (P4) und Satz 5.1. Der Übersichtlichkeit halber wollen wir die Definition der natürlichen Zahlen durch die PeanoAxiome jetzt noch einmal zusammenfassen: Definition 5.1 Es sei M eine Menge und 1 ein Objekt. M heißt Menge der natürlichen Zahlen, falls (P1) 1 ∈ M; (P2) ∃ Abbildung ν : M → M, so dass (P3) m ∈ M ⇒ ν(m) 6= 1, (P4) ν ist injektiv, (P5) A ⊆ M ∧ 1 ∈ A ∧ ν(A) ⊆ A ⇒ A = M. Die natürliche Zahl ν(m) heißt Nachfolger von m. Gemäß Korollar 5.2 existiert die Umkehrabbildung νb −1 : M\{1} → M von νb : M → M\{1}. Für alle m ∈ N nennt man νb−1 (m) den Vorgänger von m. Üblicherweise wird die Menge der natürlichen Zahlen mit dem Symbol N gekennzeichnet! Wir wollen das im Folgenden auch (wieder) tun. Gemäß Definition 5.1 sind die natürlichen Zahlen alleine über die Reihenfolge ihrer Elemente definiert worden5 . Diese Methode ermöglicht es, Aussagen über einzelne Zahlen zu machen, obwohl diese in der Definition der Menge gar nicht explizit erwähnt werden; darauf kommen wir im nächsten Abschnitt zu sprechen. Beachten Sie unbedingt, dass die Ihnen geläufigen Zahlzeichen 2, 3, 4 . . . nach dem jetzigen Stand der Dinge noch nicht zur Verfügung stehen! 4 Die hier betrachtete Abbildung νb unterscheidet sich von ν nur in ihrem Bildbereich. Aber im Gegensatz zu νb ist ν nicht surjektiv. 5 Die Frage danach, ob die natürlichen Zahlen durch Definition 5.1 eindeutig charakterisiert sind, werden wir an späterer Stelle beantworten. 5.2 Vollständige Induktion: Teil I 5.2 116 Vollständige Induktion: Teil I Die Anwendung des Induktionsaxioms (P5) liefert eine Beweismethode, mittels derer sich zeigen lässt, dass eine Allaussage über dem Variabilitätsbereich N richtig ist - die sogenannte vollständige Induktion. Um dieses Verfahren zu erklären, nehmen wir an, dass A(n) eine Aussageform in einer Variablen n mit Variabilitätsbereich N ist und A := {n ∈ N : A(n)} die Menge aller natürlichen Zahlen ist, für die A(n) wahr ist (vgl. dazu (2.1)). Dann gilt (vgl. (2.2)) n ∈ A ⇔ A(n). Für Teilmengen von N, die derart definiert sind, kann das Induktionsaxiom (P5) mit Definition 2.5(b) wie folgt umformuliert werden: (P5’) A(1) ∧ ∀ n ∈ N : A(n) ⇒ A ν(n) ⇒ ∀ n ∈ N : A(n). Das bedeutet folgendes: Ist eine Aussageform A(n), die für jede natürliche Zahl n definiert ist, für den Startwert n = 1 richtig (d.h. A(1)) und folgt aus der Gültigkeit dieser Aussage für eine beliebige natürliche Zahl n (d.h. A(n) für ein beliebiges n ∈ N) auch die Gültigkeit dieser Aussage für den Nachfolger ν(n) - d.h. A ν(n) -, so ist die Aussage für alle natürlichen Zahlen richtig! Das folgende Schema soll das Beweisprinzip der vollständigen Induktion verdeutlichen: Behauptung: ∀ n ∈ N : A(n). Beweis durch vollständige Induktion: Induktionsanfang (IA): A(1). Induktionsvoraussetzung (IV): Es gelte A(n) für ein beliebiges (aber festes) n ∈ N. Induktionsschluss (IS): Für das feste n aus der IV gilt mit A(n) auch A ν(n) . Hat man alle drei Schritte des Schemas abgearbeitet 6 , so folgt mit (P5’) die Behauptung: Aus dem Induktionsanfang folgt nämlich unter Benutzung des Induktionsschlusses, dass mit A(1) auch A ν(1) gilt, hieraus dann wieder unter Benutzung des Induktionsschlusses, dass auch A ν ν(1) gilt usw. Wir wollen dieses überaus elegante Beweisverfahren jetzt an einem ersten Beispiel studieren 7 : Satz 5.3 Für alle n ∈ N gilt n 6= ν(n). 6 Der Nachweis von A(1) (IA) und der Nachweis der Implikation im Induktionsschluss (IS) sind in aller Rergel mit mehr oder weniger Aufwand verbunden. Die Induktionsvoraussetzung (IV) dagegen muss nur formuliert werden - hier ist kein mathematisches Argument vonnöten! 7 Vielleicht kennen Sie das Prinzip der vollständigen Induktion aus der Schule in einer etwas anderen Form. Vermutlich wurde dort statt ν(n) der Ausdruck n + 1 verwendet; das dürfen wir aber hier noch nicht: Die Addition auf N ist noch nicht definiert. 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 117 Beweis: Sei - für alle n ∈ N - A(n) := n 6= ν(n) die Aussage, dass n nicht mit seinem Nachfolger übereinstimmt. Hiermit arbeiten wir jetzt das Schema ab: IA: Gemäß (P3) ist A(1) wahr. IV: Es gelte A(n) für ein beliebiges n ∈ N. IS: Nach IV ist n 6= ν(n). Wegen (P4) gilt dann auch ν(n) 6= ν ν(n) , was gleichbedeutend ist mit A(ν(n)). Also stimmt keine natürliche Zahl mit ihrem Nachfolger überein. Sie können erkennen, wie effizient das Beweisprinzip der vollständigen Induktion ist. In nur vier Zeilen haben wir die Richtigkeit einer Aussageform für unendlich viele Fälle nachgewiesen! Wir werden dieses Beweisverfahren in Zukunft noch sehr oft anwenden. 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung Ziel dieses Abschnitts ist die Definition der Addition auf der Menge der natürlichen Zahlen. Bevor wir anfangen zu überlegen, inwiefern hier wirklich (mathematische) Arbeit vonnöten ist, wollen wir uns ein paar Gedanken darüber machen, was Addition eigentlich ist? Aus der Schule wissen wir, dass die Addition (auf N) eine Rechenart ist, bei der man zwei natürlichen Zahlen, sagen wir für den Moment mal8 3 und 7, eine dritte natürliche Zahl zuordnet, hier 10. Allgemeiner wird je zwei natürlichen Zahlen n und m eine dritte natürliche Zahl, die man mit n + m bezeichnet und Summe von n und m nennt, zugeordnet. Diesen Vorgang können wir als Wirkung einer Abbildung (siehe Kapitel 4) darstellen: + :N×N → N (n, m) 7→ +(n, m) =: n + m. Dies ist ein Beispiel für eine binäre9 Verknüpfung, die allgemein wie folgt definiert ist: Definition 5.2 Es sei A 6= ∅ und f :A×A → (a, b) A 7→ f (a, b) eine Abbildung. Dann nennt man f eine (binäre) Verknüpfung (oder Operation) auf A. Das Paar (A, f ) nennt man eine algebraische Struktur mit einer binären Verknüpfung. Jetzt wollen wir uns überlegen, wie auf der Grundlage von Abschnitt 5.1 die Addition auf N definiert werden kann, damit sie unserer Überzeugung davon, dass man, wenn man in einer Hosentasche 3 Bonbons und in der anderen 2 hat, insgesamt 5 Bonbons hat, gerecht wird. 8 Vergessen Sie nicht, dass wir 3, 7 und 10 im Rahmen dieses Kapitels noch nicht definiert haben! Das Beispiel dient nur der Motivation! 9 lat. bini = je zwei, paarweise 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 118 Problematisch ist dabei sicherlich, dass wir aus der Menge N bisher nur ein einziges Element mit Namen“ kennen, nämlich die 1 (insbesondere kennen wir die Objekte 2 und 3 (noch) ” nicht). Die anderen Elemente sind dadurch charakterisiert, dass sie jeweils eindeutig bestimmte Nachfolger eines eindeutig bestimmten Vorgängers sind. Dies ist also das einzige, womit wir bei der Definition einer Addition arbeiten können! Nehmen wir also einmal an, dass n ein beliebiges Element in N ist. Zunächst soll definiert werden, was n + 1 ist. Es scheint plausibel, folgendes festzulegen: n + 1 := ν(n). (5.1) Um die Summe von n und dem Nachfolger von 1 zu bilden, definiert man analog n + ν(1) := ν(n + 1). (5.2) Beachten Sie, dass die rechte Seite definiert ist, weil n + 1 in (5.1) ja als natürliche Zahl erklärt wurde. Damit gibt es den Nachfolger ν(n + 1) gemäß (P2), dieser ist wieder eine natürliche Zahl. Analog könnte man nun fortfahren: n + ν ν(1) := ν n + ν(1) = ν ν(n + 1) , (5.3) n + ν ν ν(1) := ν n + ν ν(1) = ν ν ν(n + 1) , (5.4) . . . := . . . (5.5) Es ist zu erkennen, dass die Definition einer Summe immer auf die im vorherigen Schritt vorgenommene Definition zurückgreift: Auf der rechten Seite wird immer der Nachfolger derjenigen natürlichen Zahl, die in der vorangegangenen Zeile definiert wurde, gebildet. Fraglich ist, ob auf diese Art und Weise tatsächlich für beliebige Elemente n und m deren Summe n + m erklärt werden kann? In (5.1) bis (5.4) sind schließlich gerade mal vier Summen erklärt worden, bei denen der erste Summand n ist. Die zu beantwortende Frage ist also die, ob eine Interpretation der Punkte in (5.5) in dem Sinne, dass das anfänglich beschriebene Verfahren zur Definition der Summe unendlich oft wiederholt werden kann (also n+ν(m) := ν(n+m) für alle m ∈ N), tatsächlich für jedes m ∈ N eine eindeutig bestimmte natürliche Zahl liefert, die dann als Summe von n und ν(m) zu betrachten ist. Positiv beantworten ließe sich diese Frage, falls sich - für jedes n ∈ N - die Existenz einer eindeutig bestimmten Funktion ϕn : N → N nachweisen ließe, die den beiden Bedingungen bzw. ϕn (1) = ν(n), ϕn ν(m) = ν ϕn (m) ∀ m ∈ N, (5.6) ϕn (1) = ν(n), ϕn ◦ ν = ν ◦ ϕn genügte. Damit könnte man nämlich für alle m ∈ N die Definition n+m := ϕn (m) vornehmen, woraus wie gewünscht n + 1 = ϕn (1) = ν(n), 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 119 n + ν(1) = ϕn ν(1) = ν ϕn (1) = ν(n + 1), n + ν ν(1) = ϕn ν ν(1) = ν ϕn ν(1) = ν ν(n + 1) und allgemeiner für alle m ∈ N die Gleichungskette n + ν(m) = ϕn ν(m) = ν ϕn (m) = ν(n + m) folgen würde. Bleibt also zu zeigen, dass diese Funktion ϕn für alle n ∈ N existiert. Die entsprechende Existenzaussage ist ein Spezialfall des Dedekindschen10 Rekursionssatzes, der im Jahre 1888 formuliert wurde und in seiner allgemeinen Form die Existenz rekursiv11 definierter Folgen absichert. Satz 5.4 (Spezialfall des Dedekindschen Rekursionssatzes) Für jedes n ∈ N existiert genau eine Funktion ϕn : N → N mit den Eigenschaften (5.6), also ϕn (1) = ν(n), ϕn ν(m) = ν ϕn (m) ∀ m ∈ N. Für den Beweis erinnern wir uns daran, dass die Aussage in Satz 5.4 äquivalent ist zu folgender Formulierung: Für jedes n ∈ N existiert genau eine Funktion ϕn ⊆ N×N mit den Eigenschaften 1, ν(n) ∈ ϕn , ν(m), ν ϕn (m) ∈ ϕn ∀ m ∈ N. Beweis: Wir müssen die Existenz und die Eindeutigkeit dieser Funktion nachweisen: Beginnen wir mit der Existenz: Sei H := H ⊆ N × N : 1, ν(n) ∈ H ∧ (m, p) ∈ H ⇒ ν(m), ν(p) ∈ H . Wir nennen die Elemente aus H zulässige Mengen. Jede zulässige Menge ist eine Relation auf N. Die Menge H ist nicht leer, weil N × N eine zulässige Menge ist. Zwei weitere Beispiele für Elemente in H sehen Sie in Abbildung 5.512 . 10 Julius Wilhelm Richard Dedekind, ∗ 6. Oktober 1831 in Braunschweig, † 12. Februar 1916 in Braunschweig, war ein deutscher Mathematiker, der sich insbesondere im Zusammenhang mit dem Aufbau der Zahlbereiche einen großen Namen gemacht hat. Von ihm stammt unter anderem folgendes Zitat: Die Zahlen sind freie Schöpfungen des menschlichen Geistes, sie dienen als Mittel, um die Verschiedenheit der Dinge leichter und schärfer aufzufassen. Durch den rein logischen Aufbau der Zahlenwissenschaft und durch das in ihr gewonnene stetige Zahlenreich sind wir erst in den Stand gesetzt, unsere Vorstellungen von Raum und Zeit genau zu untersuchen, indem wir dieselben auf dieses in unserem Geiste geschaffene Zahlenreich beziehen (aus: Richard Dedekind: Was sind und was sollen Zahlen, 1888). 11 lat. recurrere = zurücklaufen 12 Es ist zu beachten, dass die in der Abbildung angedeutete Anordnung der natürlichen Zahlen bislang nicht definiert wurde! Wenngleich sie in dem uns bekannten Sinne definiert werden kann und werden wird, muss die Abbildung vor diesem Hintergrund als Vorgriff verstanden werden. 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 120 Abb. 5.5 Zwei Beispiele für zulässige Mengen. Entscheidend ist anschaulich, dass mit einem Paar (m, p) ∈ H auch alle diejenigen Elemente aus N × N zu H gehören, die rechts oberhalb“ von (m, p) auf der Geraden mit Steigung ” ” 1“ durch den Punkt (m, p) liegen. Da der Punkt (1, ν(n)) per Definition zu jeder zulässigen Menge gehören muss, ist die Menge aller Punkte aus N×N, die auf der entsprechenden Gerade durch eben diesen Punkt verläuft, Teilmenge jeder zulässigen Menge. Nun sei \ G := H. H∈H G ist also die Menge aller Elemente in N × N, die zu jeder zulässigen Menge gehören. Es ist einfach, sich zu überlegen, dass G ∈ H, d.h., dass G selbst eine zulässige Menge ist (Übung!). In diesem Sinne kann man sagen, dass G die kleinste zulässige Menge darstellt. Beachten Sie, dass die Menge aller Punkte aus N × N, die auf der oben erwähnten Gerade durch den Punkt (1, ν(n)) liegen, zu G gehört. Dass dies die einzigen Elemente in G sind, wird im Folgenden bewiesen werden. Letzteres bedeutet insbesondere, dass G nicht nur eine Relation, sondern sogar eine Funktion ist - und zwar genau die, deren Existenz wir gerade beweisen wollen; soviel zur Idee des Beweises. Hilfssatz 5.5 G ist eine Funktion. Beweis (des Hilfssatzes): Um zu verifizieren, dass G eine Funktion ist, müssen wir zeigen, dass zu jedem m ∈ N genau ein p = p(m) ∈ N existiert, so dass (m, p) ∈ G. Dies machen wir per vollständiger Induktion: IA: Zunächst mal ist 1, ν(n) ∈ G, d.h., dass ein p ∈ N existiert, so dass (1, p) ∈ G, nämlich p = ν(n). Um einzusehen, dass dies das einzige Element mit dieser Eigenschaft ist, nehmen wir an, es gäbe noch ein weiteres Element, sagen wir p′ ∈ N, so dass p 6= p′ und (1, p′) ∈ G. Dann aber wäre G \ {(1, p′ )} immer noch eine zulässige Menge, was der Minimalität von G widerspricht. Damit ist der Induktionsanfang erbracht. IV: Nun nehmen wir an, dass zu einem beliebigen m ∈ N genau ein p = p(m) ∈ N existiert, so dass (m, p) ∈ G. 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 121 Abb. 5.6 Zur Illustration des IS. IS: Wir müssen zeigen, dass aus der IV folgt, dass auch zu ν(m) genau ein Element q = q ν(m) ∈ N existiert, so dass ν(m), q ∈ G. Dass mindestens ein solches Element existiert, folgt aus der Definition von G und der IV. Demnach ist nämlich mit (m, p) ∈ G auch (ν(m), ν(p)) ∈ G. Um einzusehen, dass ν(p) das einzige Element mit dieser Eigenschaft ist, nehmen wir wieder an, dass ein Element q ′ ∈ N existiert, so dass q 6= q ′ und ν(m), q ′ ∈ G. Nach IV ist dann auch die Menge G \ { ν(m), q ′ } noch zulässig, was wieder der Minimalität von G widerspricht (hierzu siehe auch Abbildung 5.6). Also ist auch q eindeutig bestimmt. Das schließt den Induktionsbeweis ab. Nun definieren wir ϕn := G und schreiben anstelle von ϕn ⊆ N × N und (m, p) ∈ ϕn , wie in Abschnitt 4.1 erläutert, ϕn : N → N m 7→ ϕn (m) = p. Per Definition von G = ϕn gilt, wie gefordert13 , (vgl. (5.6)). ϕn (1) = ν(n), ϕn ν(m) = ν ϕn (m) ∀ m ∈ N Nun beweisen wir die Eindeutigkeit der Abbildung ϕn . Dazu nehmen wir an, es gäbe eine (evtl. andere) Abbildung ψ : N → N mit den Eigenschaften ψ(1) = ν(n), Beachten Sie hierzu, dass per Definition gilt: m, ϕn (m) ∈ ϕn ⇒ ν(m), ν ϕn (m) ∈ ϕn . Der zweite Eintrag des letzten Paars wird mit ϕn ν(m) bezeichnet. 13 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 122 ψ ν(m) = ν ψ(m) ∀ m ∈ N. Per vollständiger Induktion über die Argumente von ϕn bzw. ψ zeigen wir, dass dann ϕn = ψ ist: IA: Nach Voraussetzung gilt ψ(1) = ν(n) = ϕn (1). IV: Wir nehmen an, es sei ψ(m) = ϕn (m) für ein m ∈ N. IS: Es gilt IV ψ ν(m) = ν ψ(m) = ν ϕn (m) = ϕn ν(m) . Das zeigt ψ(m) = ϕn (m) für alle m ∈ N, also ψ = ϕn . Die vorangegangenen Überlegungen rechtfertigen, da n ∈ N beliebig war, die bereits auf Seite 118 angesprochene Definition der Addition auf N wie folgt: Definition 5.3 Auf der Menge N definieren wir die Verknüpfung +:N×N→ N (n, m) 7→ n + m := ϕn (m). Hierbei ist ϕn die Funktion aus dem Rekursionssatz 5.4. Wir nennen + die Addition auf N und n + m die Summe von n und m. Ferner heißt n der erste Summand und m der zweite Summand in der Summe n + m. R Beachten Sie, dass Definition 5.3 folgende Identitäten impliziert: ∀ n ∈ N : n + 1 = ν(n) R ∀ n, m ∈ N : n + ν(m) = ν(n + m). (5.8) (5.9) Wegen Satz 5.1 ist jedes m ∈ N \ {1} ein Nachfolger, kann also geschrieben werden als ν(m′ ) für ein m′ ∈ N. Damit ist auf die hier angegebene Art und Weise tatsächlich jedem Paar (n, m) ∈ N × N ein Element n + m aus N zugeordnet. Wir wollen nun die wichtigsten Eigenschaften der Addition auf N herleiten. Satz 5.6 Für alle n ∈ N gilt und für alle n, m ∈ N gilt 1 + n = ν(n) (5.10) ν(n) + m = ν(n + m). (5.11) Beweis: Zunächst beweisen wir (5.10): Dazu sei für alle n ∈ N die Aussageform A(n) := 1 + n = ν(n) definiert. Per vollständiger Induktion zeigen wir, dass A(n) für alle n ∈ N richtig ist: IA: Es gilt A(1), da 1 + 1 = ν(1) wegen (5.8). IV: Wir nehmen an, dass A(n) für ein beliebiges n ∈ N richtig ist, d.h. es gilt 1 + n = ν(n). 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 123 IS: Mit (5.9) gilt (nach Setzen von n := 1 und m := n) IV 1 + ν(n) = ν(1 + n) = ν ν(n) , was die Gültigkeit von A ν(n) belegt. Nun beweisen wir (5.11): Dazu sei n ∈ N beliebig, aber fest und für alle m ∈ N sei Bn (m) := ν(n) + m = ν(n + m). Wir zeigen wieder über vollständige Induktion, dass Bn (m) für alle m ∈ N wahr ist. IA: Es gilt Bn (1), da ν(n) + 1 = ν ν(n) = ν(n + 1) nach (5.8). IV: Sei Bn (m) richtig für ein beliebiges m ∈ N, d.h. es gilt ν(n) + m = ν(n + m). IS: Gemäß (5.9) folgt dann IV ν(n) + ν(m) = ν ν(n) + m = ν ν(n + m) = ν n + ν(m) , was gleichbedeutend ist mit der Gültigkeit von Bn ν(m) . Korollar 5.7 Für alle n ∈ N gilt und für alle n, m ∈ N gilt 1+n=n+1 (5.12) ν(n) + m = n + ν(m). (5.13) Unter Berücksichtigung von m + 1 = ν(m), n + ν(m) = ν(n + m) (für alle n, m ∈ N) und (5.13) gelten außerdem folgende Gleichheiten: (5.8) (5.13) (5.9) (5.8) (n + 1) + m = ν(n) + m = n + ν(m) = ν(n + m) = (n + m) + 1, (5.8) (5.14) n + (m + 1) = n + ν(m) = (n + m) + 1. (5.14) (5.15) Bevor wir mit der Untersuchung der Eigenschaften der Addition auf N fortfahren, seien einige allgemeine Definitionen gegeben, die zur Definition 5.2 einer Verknüpfung in Beziehung stehen. Definition 5.4 (A, ∗) sei eine algebraische Struktur (d.h, dass ∗ : A × A → A, (a, b) 7→ a ∗ b eine Verknüpfung ist). Die Verknüpfung ∗ heißt assoziativ14 (auf A), falls für alle a, b, c ∈ A gilt: a ∗ (b ∗ c) = (a ∗ b) ∗ c. Mitunter nennt man auch die ganze Struktur (A, ∗) assoziativ. Beispiel 5.1 A Es sei A eine beliebige Menge und P(A) deren Potenzmenge. Dann ist die Schnittbildung ∩ : P(A) × P(A) → (M, N) P(A) 7→ ∩(M, N) := M ∩ N eine Verknüpfung auf P(A). Gemäß Satz 2.1 (b1) ist sie assoziativ; also ist (P(A), ∩) eine assoziative algebraische Struktur. Analog ist (P(A), ∪) als assoziative algebraische Struktur zu verstehen (vgl. dazu Satz 2.1 (b2)). 14 lat. associare = verbinden, verknüpfen 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 124 B Es sei A eine beliebige nicht leere Menge und es sei F := {f : A → A : f bijektiv}. Gemäß Satz 4.4 und Satz 4.6 ist die Menge F bezüglich der Komposition, also (F , ◦), eine assoziative algebraische Struktur. N Definition 5.5 (A, ∗) sei eine algebraische Struktur. Die Verknüpfung ∗ heißt kommutativ15 (auf A), falls für alle a, b ∈ A gilt: a ∗ b = b ∗ a. Mitunter nennt man auch die ganze Struktur (A, ∗) kommutativ. Die algebraische Struktur (P(A), ∩) aus Beispiel 5.1 A ist gemäß Satz 2.1(a1) kommutativ. Analog ist (P(A), ∪) kommutativ (vgl. dazu Satz 2.1(a2)). Dagegen ist (F , ◦) aus Beispiel 5.1 B nicht kommutativ! Definition 5.6 (A, ∗) sei eine algebraische Struktur. Die Verknüpfung ∗ heißt regulär, wenn für alle a, b, c ∈ A gilt: a ∗ b = a ∗ c ⇒ b = c, b ∗ a = c ∗ a ⇒ b = c. (5.16) (5.17) Mitunter nennt man auch die ganze Struktur (A, ∗) regulär. In einer regulären Struktur kann man also aus einer Gleichung gemeinsame Faktoren kürzen“, ” sofern sie beide als erste Faktoren (wie in (5.16)) oder als zweite Faktoren (wie in (5.17)) auftreten. Man nennt (5.16) auch die linksseitige Kürzungsregel und (5.17) die rechtsseitige Kürzungsregel. Die algebraische Struktur (P(A), ∩) aus Beispiel 5.1 A ist im Allgemeinen nicht regulär: Wählt man beispielsweise A := N und M := 2N, N := {1}, P := {3}, so ist M ∩ N = ∅ = M ∩ P , aber N 6= P . Die Untersuchung von (P(A), ∪) auf Regularität ist Bestandteil der Übungen. Die algebraische Struktur (F , ◦) aus Beispiel 5.1 B ist regulär, wie man sich wie folgt überlegt: Sind f, g, h ∈ F und gilt f ◦ g = f ◦ h, so folgt f −1 ◦ (f ◦ g) = f −1 ◦ (f ◦ h) ⇔ (f −1 ◦ f ) ◦ g = (f −1 ◦ f ) ◦ h ⇔ idA ◦ g = idA ◦ h ⇔ g = h. Dies entspricht der Gültigkeit der linksseitigen Kürzungsregel. Von der Richtigkeit der rechtsseitigen Kürzungsregel überzeugt man sich analog. Definition 5.7 Eine algebraische Struktur (A, ∗) heißt Halbgruppe, wenn sie assoziativ ist. Nun wollen wir folgenden wichtigen Satz beweisen: 15 lat. commutare = vertauschen 5.3 Die Addition auf N als Spezialfall einer binären Verknüpfung 125 Satz 5.8 Die algebraische Struktur (N, +) ist eine kommutative, reguläre Halbgruppe. Beweis: Wir müssen zeigen, dass die in Definition 5.3 angegebene Verknüpfung + kommutativ, assoziativ und regulär ist. Zunächst zeigen wir Kommutativität: Für alle m ∈ N sei A(m) := ∀ n ∈ N : m + n = n + m. Wir müssen also nachweisen, dass A(m) für alle m ∈ N richtig ist. Das machen wir per vollständiger Induktion: IA: In Korollar 5.7 haben wir bereits nachgewiesen, dass 1 + n = n + 1 für alle n ∈ N. Also ist A(1) wahr. IV: Wir nehmen an, dass A(m) für ein beliebiges m ∈ N gültig ist, d.h. es gilt m + n = n + m für alle n ∈ N. (5.11) IV (5.9) IS: Es ist ν(m) + n = ν(m + n) = ν(n + m) = n + ν(m). Nun weisen wir Assoziativität nach: Für alle m ∈ N sei B(m) := ∀ k, l ∈ N : (k + l) + m = k + (l + m). Es ist also zu zeigen, dass B(m) für alle m ∈ N richtig ist: IA: Die Aussage B(1) entspricht der schon bewiesenen Aussage (5.15), ist also wahr. IV: Die Aussage B(m) sei für ein beliebiges m ∈ N gültig, d.h. es gilt (k + l) + m = k + (l + m) für alle k, l ∈ N. IS: Wir wollen die Gültigkeit von B(ν(m)) nachweisen, d.h. dass (k +l)+ν(m) = k +(l+ν(m)) IV (5.9) (5.9) (5.9) gilt für alle k, l ∈ N. Nun ist (k+l)+ν(m) = ν (k+l)+m = ν k+(l+m) = k+ν(l+m) = k + l + ν(m) . Schließlich zeigen wir Regularität: Für alle m ∈ N sei C(m) := ∀ k, l ∈ N : k + m = l + m ⇒ k = l. Zu zeigen ist, dass C(m) für alle m ∈ N richtig ist: IA: Die Gültigkeit der Aussage C(1), d.h., dass k + 1 = ν(k) = ν(l) = l + 1 die Gleichheit k = l impliziert, folgt aus der Injektivität von ν. IV: Die Aussage C(m) sei für ein beliebiges m ∈ N gültig. IS: Es sei k +ν(m) = l +ν(m). Das ist gleichbedeutend mit der Gleichheit ν(k +m) = ν(l +m). Hieraus folgt k + m = l + m mittels Injektivität von ν. Gemäß IV folgt hieraus aber k = l, was zu beweisen war. Die Gleichung (5.17) folgt direkt aus der Kommutativität. Zum Abschluss dieses Abschnitts sollen die Ihnen so wohl vertrauten, bisher aber nicht benötigten Zahlzeichen definiert werden: Definition 5.8 Ist ν die Nachfolgerabbildung auf N, so definiert man (im Dezimalsystem mit europäischen Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8, 9) 2 := ν(1), 3 := ν(2), 4 := ν(3), 5 := ν(4), 6 := ν(5), 7 := ν(6), 8 := ν(7), 9 := ν(8), 10 := ν(9), 11 := ν(10) etc. R Es ist wichtig anzumerken, dass man anstelle von 2 := ν(1), 3 := ν(2), . . . auch I:= 1, II:= ν(I), III:= ν(II), IV:= ν(III) etc. oder etwas beliebiges anderes hätte definieren können. Wichtig ist nur, dass die natürlichen Zahlen durch die Zahlzeichen eindeutig bestimmt sind. Auf die Möglichkeit, Zahlen anders als in dem uns geläufigen Dezimaloder auch Zehnersystem mit den Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8 und 9 darzustellen, kommen wir an späterer Stelle zurück! 5.4 Die Ordnung der natürlichen Zahlen 126 Damit ist dann beispielsweise (5.9) (5.8) (5.9) Def. 5.8 Def. 5.8 5 + 3 = 5 + ν(2) = ν(5 + 2) = ν 5 + ν(1) = ν ν(5 + 1) = Def. 5.8 Def. 5.8 Def. 5.8 Satz 5.8 ν ν ν(5) = ν ν 6 = ν(7) = 8 = 3 + 5. 5.4 Die Ordnung der natürlichen Zahlen Mittels der Addition wollen wir nun die Ordnung auf den natürlichen Zahlen definieren. Zu diesem Zweck muss natürlich geklärt werden, was darunter genau zu verstehen ist. In diesem Zusammenhang werden wir zunächst an Kapitel 3 anknüpfen. Definition 5.9 Eine Relation R auf einer Menge M heißt strenge (oder srikte) Halbordnungsrelation, wenn sie antireflexiv, antisymmetrisch und transitiv ist. R R Beachten Sie, dass eine strenge Halbordnungsrelation keine Halbordnungsrelation ist (letztere ist reflexiv)! Das Adjektiv streng deutet also hier nicht auf eine Eigenschaft hin, die zusätzlich zu den Eigenschaften einer Halbordnungsrelation vorliegt; vielmehr wird dadurch ausgedrückt, dass eine der Eigenschaften einer Halbordnungsrelation ins Gegenteil verkehrt wird. Überzeugen Sie sich davon, dass eine Relation R auf einer Menge M genau dann eine strenge Halbordnungsrelation ist, wenn (i) ∀ x ∈ M : (x, x) ∈ / R, (ii) ∀ x, y ∈ M : (x, y) ∈ R ⇒ (y, x) ∈ / R, (iii) ∀ x, y, z ∈ M : (x, y) ∈ R ∧ (y, z) ∈ R ⇒ (x, z) ∈ R. Beispiel 5.2 Ist Ω eine beliebige Menge und ⊂:= {(A, B) ∈ P(Ω)2 : A ⊂ B} die Relation der echten Inklusion, so ist ⊂ eine strenge Halbordnungsrelation auf P(Ω). Im Allgemeinen ist sie jedoch nicht total: Ist beispielsweise Ω := {1, 2, 3}, A := {1, 2} und B := {2, 3}, so gilt weder A ⊂ B noch B ⊂ A. N Definition 5.10 (a) Eine strenge Halbordnungsrelation R auf einer Menge M heißt strenge Ordnungsrelation, wenn sie total ist. (b) Eine Menge M heißt streng geordnet, wenn es eine strenge Ordnungsrelation R auf M gibt. Die Relation R bezeichnet man dann als eine strenge Ordnung auf M. Das Paar (M, R) bezeichnet man als strenge Ordnungsstruktur. Nach dem eben Gesagten ist also ⊂ i.A. keine strenge Ordnung auf P(Ω). Satz 5.9 Es sei M eine Menge und R eine Relation auf M; letztere ist eine strenge Ordnung auf M genau dann, wenn 5.4 Die Ordnung der natürlichen Zahlen 127 (a) R transitiv ist und (b) für je zwei Elemente x, y ∈ M genau eine der drei Aussagen (x, y) ∈ R, x = y oder (y, x) ∈ R richtig ist 16 . Beweis: Zunächst beweisen wir die Notwendigkeit der Bedingungen (a) und (b): Nach Voraussetzung ist R eine strenge Ordnung auf M, also eine totale, strenge Halbordnungsrelation. Insbesondere ist R damit transitiv, was (a) beweist. Seien nun x, y ∈ M beliebig. Jetzt müssen wir eine Fallunterscheidung vornehmen: 1. Fall: x = y. Dann gilt (x, y) ∈ / R und (y, x) ∈ / R aufgrund der Antireflexivität von R. In diesem Fall ist also genau eine der drei Aussagen in (b) richtig. 2. Fall: x 6= y. Gilt (x, y) ∈ R, so folgt aus der Antisymmetrie (y, x) ∈ / R. Ist umgekehrt (y, x) ∈ R, so folgt mit dem gleichen Argument (x, y) ∈ / R. Andere Fälle können nicht auftreten, da R total ist. Auch in diesem Fall ist also genau eine der drei Aussagen in (b) richtig. Insgesamt ist (b) damit bewiesen. Jetzt zeigen wir die Hinlänglichkeit von (a) und (b) für eine strenge Ordnung: Seien also (a) und (b) erfüllt. Es ist zu zeigen, dass R total, antireflexiv, antisymmetrisch und transitiv ist: Letzteres wird direkt durch (a) geliefert. Die Antireflexivität folgt aus der Tatsache, dass für x, y mit x = y wegen (b) weder (x, y) ∈ R noch (y, x) ∈ R gilt, also ist (x, x) ∈ / R für alle x ∈ M. Die Eigenschaften total und antisymmetrisch folgen unmittelbar aus (b). Nun definieren wir eine Relation < auf N wie folgt: Definition 5.11 Sei < := {(n, m) ∈ N2 : ∃ n′ ∈ N : n+n′ = m}. Gilt (n, m) ∈ <, so schreiben wir n < m und sagen n ist kleiner als m“. ” Satz 5.10 Die Relation < ist eine strenge Ordnung auf N. Beweis: Wir müssen zeigen, dass < antireflexiv, antisymmetrisch, transitiv und total ist. Zunächst zeigen wir die Antireflexivität, und zwar durch einen Widerspruchsbeweis: Wir nehmen also an, < sei nicht antireflexiv. Dann gibt es ein n ∈ N und dazu ein n′ ∈ N, so dass n + n′ = n (d.h., dass n < n). Da ν eine Abbildung ist, folgt daraus mit der Assoziativität von + die Gleichung n + n′ + 1 = ν(n + n′ ) = ν(n) = n + 1, welche n′ + 1 = ν(n′ ) = 1 impliziert (wegen der Regularität von +). Das widerspricht Axiom (P3). Nun beweisen wir die Antisymmetrie (wieder durch einen Widerspruchsbeweis): Wir nehmen an, es gäbe n, m ∈ N, so dass n < m und m < n gilt. Dann gibt es n′ , m′ ∈ N, so dass n + n′ = m und m + m′ = n. Zusammensetzen beider Gleichungen (und Berücksichtigung der Assoziativität von +) ergibt n + n′ + m′ = n, was wegen n′ + m′ ∈ N die Aussage n < n liefert. Dies widerspricht der Antireflexivität. Die Transitivität folgt aus der Implikation n + n′ = m ∧ m + m′ = p ⇒ n + n′ + m′ = p, 16 Die Aussage in (b) nennt man das Trichotomiegesetz. 5.4 Die Ordnung der natürlichen Zahlen 128 die für alle natürlichen Zahlen n, n′ , m, m′ und p gilt. Bis hier haben wir bewiesen, dass < eine strenge Halbordnungsrelation ist. Der Beweis der Tatsache, dass < überdies total ist, erfordert einen Hilfssatz, der aber auch unabhängig von diesem Zweck interessant ist, insbesondere, weil Ihnen dessen Beweis vielleicht total überflüssig vorkommt! Hilfssatz 5.11 Für alle n ∈ N \ {1} gilt 1 < n. Beweis (des Hilfssatzes): Wir führen den Beweis per vollständiger Induktion. Da die zu beweisende Aussage nur für alle natürlichen Zahlen außer 1 formuliert wird, definieren wir die Menge A := {1} ∪ {n ∈ N \ {1} : 1 < n} und für alle n ∈ N die Aussage A(n) := n ∈ A. IA: A(1) ist wahr nach Definition von A. IV: Die Aussage A(n) sei wahr für ein beliebiges n ∈ N, d.h. es gilt n = 1 oder 1 < n. IS: Ist n = 1, so folgt daraus 1 + 1 = n + 1 und damit 1 < n + 1. Ist dagegen 1 < n, so folgt wegen n < n + 1 die Ungleichung 1 < n + 1 aus der Transitivität von <. Dass < total ist, werden wir nun wieder per vollständiger Induktion zeigen. Dazu sei für alle m ∈ N die Aussage B(m) := ∀ n ∈ N : m < n ∨ m = n ∨ n < m definiert. IA (m = 1): Die Aussage B(1) = ∀ n ∈ N : 1 < n ∨ 1 = n ∨ n < 1 ist wahr, weil für alle n ∈ N \ {1} gemäß Hilfssatz 5.11 die erste der drei möglichen Aussagen, und damit die ganze Disjunktion, stimmt. Für das so einzig verbleibende Element n = 1 ist natürlich die zweite der drei möglichen Aussagen (und damit die ganze Disjunktion) richtig. IV: Für ein m ∈ N sei die Aussage B(m) = ∀ n ∈ N : m < n ∨ m = n ∨ n < m wahr. IS: Wir müssen zeigen, dass für alle n ∈ N die Aussage m + 1 < n ∨ m + 1 = n ∨ n < m + 1 gilt (hierbei ist m der entsprechende Wert aus der IV). Nach Induktionsvoraussetzung liegt genau einer der drei Fälle m < n, m = n oder n < m vor. Danach soll jetzt unterschieden werden 17 : 1. Fall: m < n. Dann gibt es ein m′ ∈ N, so dass m + m′ = n. Ist m′ = 1, so folgt direkt m + 1 = n. Ist m′ 6= 1, so gilt 1 < m′ (nach Hilfssatz 5.11), also existiert ein m′′ ∈ N, so dass 1 + m′′ = m′ . Insgesamt erhält man so m + m′ = m + 1 + m′′ = n, woraus m + 1 < n folgt. 2. Fall: m = n. Dann gilt auch m + 1 = n + 1, was n < m + 1 nach sich zieht. 3. Fall: n < m. Dann gilt n + n′ = m für ein n′ ∈ N. Daraus folgt n + n′ + 1 = m + 1, was wegen n′ + 1 ∈ N die Ungleichung n < m + 1 liefert. In allen Fällen ist eine der drei Teilaussagen in B(m + 1) richtig; da andere Fälle nach Induktionsvoraussetzung nicht möglich sind, ist der Induktionsbeweis damit vollständig erbracht. Also ist für alle m, n ∈ N die Disjunktion m < n ∨ m = n ∨ n < m richtig. Hieraus folgt unmittelbar, dass < total ist. Korollar 5.12 (Trichotomiegesetz für (N, <)) Für je zwei natürliche Zahlen m und n gilt genau eine der drei Aussagen m < n oder m = n oder n < m. 17 Beachten Sie, dass in diesem Fall auf die Induktionsvoraussetzung nicht explizit in einem Rechenschritt zurückgegriffen wird; vielmehr dient sie hier dazu, den Rahmen abzustecken, innerhalb dessen im Induktionsschluss argumentiert werden muss. 5.4 Die Ordnung der natürlichen Zahlen Beweis: Die Aussage des Korollars folgt unmittelbar aus Satz 5.9 und Satz 5.10. 129 Bevor wir weitere Eigenschaften der strengen Ordnungsrelation < feststellen, muss ein neuer Begriff vorgestellt werden, der im Kontext von Verknüpfungen auf geordneten Mengen wichtig ist: Definition 5.12 Es sei (A, ∗) eine algebraische Struktur und R eine Relation auf A. Man nennt R verträglich mit ∗ genau dann, wenn für alle a1 , a2 , b1 , b2 ∈ A gilt: (a1 , b1 ) ∈ R ∧ (a2 , b2 ) ∈ R ⇒ (a1 ∗ a2 , b1 ∗ b2 ) ∈ R. Satz 5.13 Die Relation < ist verträglich mit der Addition auf N. Beweis: Wir müssen zeigen, dass mit ni , mi ∈ N, i = 1, 2, und n1 < m1 , n2 < m2 auch n1 + n2 < m1 + m2 gilt. Nach Voraussetzung existieren für i = 1, 2 Elemente pi ∈ N, so dass ni + pi = mi für i = 1, 2. Daraus folgt Ass. (n1 + p1 ) + (n2 + p2 ) = (n1 + p1 ) + n2 + p2 Ass. = n1 + (p1 + n2 ) + p2 Komm. = n1 + (n2 + p1 ) + p2 (5.18) Ass. = (n1 + n2 ) + p1 + p2 Ass. = (n1 + n2 ) + (p1 + p2 ) = m1 + m2 , was n1 + n2 < m1 + m2 nach sich zieht. Der Nachweis der Gleichheit (n1 + p1) + (n2 + p2 ) = (n1 + n2 ) + (p1 + p2 ), den wir gerade durch viele kleine“ Umformungen erbracht haben, erscheint Ihnen vielleicht sehr umständlich - oder ” sogar überflüssig: In der Schule hätte Sie diese Identität sicher ohne jegliche Zwischenschritte aufgestellt. Allerdings hätten Sie dabei - vermutlich unbewusst - auf das Assoziativgesetz für mehr als drei Summanden zurückgegriffen - und letzteres haben wir bislang nicht bewiesen; also dürfen wir es auch noch nicht benutzen! Damit uns ein Umstand wie in (5.18) möglichst bald erspart bleiben kann, muss ein entsprechender Satz bewiesen werden; allerdings benötigen wir dazu eine Modifikation des Verfahrens der vollständigen Induktion. In Abschnitt 5.8 widmen wir uns den Details. Der Vollständigkeit halber sei folgender, einfach zu beweisender Satz formuliert, der in gewisser Hinsicht eine Verschärfung von Satz 5.13 darstellt. Satz 5.14 Für alle n, m, p ∈ N gilt n < m ⇔ n + p < m + p. Beweis: Für den Beweis der Notwendigkeit der rechten Ungleichung für die linke sei n′ ∈ N diejenige natürliche Zahl, für die n + n′ = m. Addition von p auf beiden Seiten liefert n + n′ + p = m + p, was die rechte Ungleichung liefert. Aus der Regularität der Addition auf N folgt umgekehrt aus der Gleichung n + n∗ + p = m + p, die unter der Voraussetzung n + p < m + p für ein n∗ ∈ N gelten muss, die Ungleichung n + n∗ = m, welche n < m liefert. 5.4 Die Ordnung der natürlichen Zahlen 130 Im abschließenden Teil dieses Abschnitts widmen wir uns der bereits in Kapitel 3 thematisierten Kleiner-Gleich-Relation auf den natürlichen Zahlen. Im Gegensatz zu der Behandlung dort wollen wir jedoch hier keinerlei Schulwissen verwenden, sondern jenes durch die bis jetzt in Kapitel 5 bereitgestellten Werkzeuge“ erst rechtfertigen; dazu vereinbaren wir zunächst ” folgende Notation: Definition 5.13 Für je zwei natürliche Zahlen n, m schreibt man (a) n > m :⇔ m < n und sagt dazu n ist größer als m“, ” (b) n ≤ m :⇔ n < m ∨ n = m und sagt dazu n ist kleiner gleich m“, ” (c) n ≥ m :⇔ m ≤ n und sagt dazu n ist größer gleich m“. ” Satz 5.15 Die Relation U := {(n, m) ∈ N2 : n ≤ m} ist eine Ordnungsrelation auf N. Beweis: Die Reflexivität folgt unmittelbar aus Definition 5.13(b). Die Antisymmetrie folgt direkt aus der Antisymmetrie für < (welche im Beweis zu Satz 5.10 nachgewiesen wurde). Zum Nachweis der Transitivität sei n ≤ m und m ≤ p für natürliche Zahlen n, m und p. Nach Voraussetzung gilt dann n < m ∧ m < p (I) oder n < m ∧ m = p (II) oder n = m ∧ m < p (III) oder n = m ∧ m = p (IV). Im Fall (I) folgt die nachzuweisende Ungleichung n ≤ p aus der Transitivität von <, in den Fällen (II) und (III) gilt sie wegen n < p, im Fall (IV) wegen n = p. Die Tatsache, dass ≤ total ist, folgt direkt aus der Totalität von <. Von folgendem Satz macht man oft Gebrauch, wenn man die Gleichheit zweier natürlicher Zahlen zeigen will 18 . Satz 5.16 Es seien m, n ∈ N. Dann gilt: m ≤ n ∧ n ≤ m ⇔ m = n. Den Beweis führen Sie zur Übung bitte selbstständig durch. Auch von den Aussagen im folgenden Satz macht man häufig Gebrauch: Satz 5.17 Es seien m, n, p ∈ N. Dann gilt: (a) m ≤ n ∧ n < p ⇒ m < p, (b) m < n ∧ n ≤ p ⇒ m < p. Beweis: Wir beweisen nur (a), da (b) völlig analog nachzuweisen ist: Seien also m, n, p ∈ N und sei m ≤ n ∧ n < p. Dann gilt entweder m < n ∧ n < p, woraus m < p aus der Transitivität von < folgt, oder m = n ∧ n < p, woraus m < p einfach durch Einsetzen von m für n folgt. 18 Der entsprechende Satz gilt auch in R; will man also die Gleichheit zweier reeller Ausdrücke nachweisen, kann man auch auf diese Implikation zurückgreifen. 5.5 Eindeutigkeit der natürlichen Zahlen 131 In Analogie zu Satz 5.13 formulieren wir noch zwei nützliche Aussagen, von denen die erste bedeutet, dass auch die Kleiner-Gleich-Relation auf N verträglich mit der Addition auf N ist: Korollar 5.18 Für alle m, n, p, q ∈ N gilt (a) m ≤ n ∧ p ≤ q ⇒ m + p ≤ n + q, (b) m ≤ n ⇔ m + p ≤ n + p. Beweis: (a) Ist m < n und p < q, so folgt die Aussage aus Satz 5.13. Ist m < n und p = q oder m = n und p < q, so folgt die Aussage aus Satz 5.14. Gilt schließlich m = n und p = q, so folgt m + p = n + q, weil die Addition eine Abbildung ist. (b) Es ist nur noch zu zeigen, dass aus m + p ≤ n + p die Ungleichung m ≤ n folgt. Wäre jedoch m > n, so folgte m + p > n + p nach Satz 5.14. 5.5 Eindeutigkeit der natürlichen Zahlen In diesem Abschnitt soll der in Abschnitt 5.3 bereits für eine spezielle Situation formulierte Dedekindsche Rekursionssatz allgemein formuliert und bewiesen werden (vgl. Satz 5.4). Diese allgemeine Form des Satzes ist von fundamentaler Bedeutung: Zum einen sichert sie ab, dass die Definition (über N) rekursiv definierter Objekte eindeutig ist, zum anderen ermöglicht sie einen Beweis der Aussage, dass die Menge der natürlichen Zahlen durch die Peano-Axiome in gewissem Sinne eindeutig bestimmt ist. Um die Tragweite der ersten Aussage zu verstehen, sei an die vorbereitenden Überlegungen zur Definition der Addition auf den natürlichen Zahlen erinnert. Dort wurde dargestellt, dass eine Definition der Summe von zwei natürlichen Zahlen (von denen die erste n sei) in der Form n + 1 := ν(n), n + ν(1) := ν(n + 1), n + ν ν(1) := ν ν(n + 1) , . . . := . . . n + ν(m) := ν(n + m) m > ν(1) , . . . := . . . (5.19) [Addition] nicht unproblematisch ist, weil die Interpretation der rekursiven Gleichung (5.19) womöglich nicht für alle m ∈ N \ {1} eindeutige Werte liefert. Ebenso verhält es sich natürlich mit naheliegenden Deklarationen wie n · 1 := n, n · ν(1) := n · 1 + n, n · ν ν(1) := n · ν(1) + n, 5.5 Eindeutigkeit der natürlichen Zahlen 132 . . . := . . . n · ν(m) := n · m + n m > ν(1) , . . . := . . . , (5.20) [Multiplikation] die man bei der Einführung einer Multiplikation auf N vornehmen wollen könnte, (hierbei würde die bereits eingeführte Addition auf N verwendet) oder a1 := a, aν(1) := a · a1 , aν(ν(1)) := a · aν(1) , . . . := . . . ν(m) a := a · am . . . := . . . , m > ν(1) , (5.21) [Potenz] die man zur Definition von Potenzen der Form am , wobei m eine natürliche Zahl und a beispielsweise eine reelle Zahl ist, vorschlagen könnte (hierbei würde von einer Multiplikation auf N Gebrauch gemacht). Analog wirft die Idee, für jedes m ∈ N das m-fache kartesische Produkt einer Menge mit sich selbst rekursiv gemäß A1 := A, Aν(m) := A × Am ∀ m ∈ N (5.22) definieren zu wollen zu wollen, die Frage nach der Eindeutigkeit dieser Definition auf. Dedekind war der erste, der dieses Problem erkannte - und löste. Der von ihm zur Klärung dieser Frage bewiesene Rekursionssatz löst all die hier angesprochenen Probleme auf einmal! Um die Formulierung des Satzes besser zu verstehen, wollen wir zunächst die Gemeinsamkeiten der vier eben angesprochenen Beispiele herausarbeiten: Auf der linken Seite aller vorkommenden Gleichheitszeichen steht jeweils ein Ausdruck, der künftig (nach Beweis des Dedekindschen Rekursionssatzes) als Funktionswert ϕ(m) einer natürlichen Zahl m verstanden werden soll. In der ersten Zeile jedes Beispiels wird ϕ(1) festgelegt, in (5.19) bis (5.22) jeweils, wie sich ϕ ν(m) (aus ϕ(m)) berechnet. Bezeichnet man den Bildbereich der Abbildung ϕ als Ω, so ist Ω im Fall der Addition und der Multiplikation N, im Fall der Potenz - sofern a reell ist - R und im letzten Beispiel eine (geeignete) Menge von Mengen. Der Funktionswert ϕ(1) ist jeweils ein beliebiges Element aus der Menge Ω, nennen wir es mal ω; im Fall der Addition ist also ω = ν(n), im zweiten Beispiel ω = n, im dritten ω = a und im letzten ω = A. In die Berechnung des Funktionswertes ϕ(ν(m)) geht in allen Fällen der Funktionswert ϕ(m) ein: Im Fall der Addition wird dessen Nachfolger gebildet, im Fall der Multiplikation wird hierzu n addiert, im Fall der Potenz wird er mit a multipliziert und im letzten Beispiel wird das kartesische Produkt aus A und ϕ(m) = Am gebildet. Wir können also ϕ ν(m) jeweils als Funktionswert f (ϕ(m)) einer Funktion f : Ω → Ω verstehen: Gemäß dem eben Gesagten ist f im Fall der Addition definiert durch f (m) := ν(m) (m ∈ N) und im Fall der Multiplikation durch f (m) := m + n (m ∈ N); für die Definition der Potenz ist f : R → R mit f (x) := a · x zu setzen, und im Fall des kartesischen Produktes betrachte man die Zuordnungsvorschrift f (B) := A × B auf einem geeigneten Definitionsbereich. 5.5 Eindeutigkeit der natürlichen Zahlen 133 Die in den vier Beispielen angegebenen Gleichungssysteme sind also alle Spezialfälle der folgenden Situation: ϕ(1) := ω, ϕ ν(m) := f ϕ(m) ∀ m ∈ N. (5.23) Es ist die Existenz der hier vorkommenden Funktion ϕ, die nachgewiesen werden muss, damit die bei gegebenem f : Ω → Ω und gegebenem Startwert“ ω ∈ Ω rekursiv vorgenommene ” Definition (5.23) eindeutig ist. Genau dies hat Dedekind im Rekursionssatz getan: Satz 5.19 (Dedekindscher Rekursionssatz, 1888) Sei Ω eine beliebige, nicht leere Menge, ω ∈ Ω fest und f : Ω → Ω eine Abbildung. Dann gibt es genau eine Abbildung ϕ : N → Ω, so dass ϕ(1) = ω und ϕ ν(m) = f ϕ(m) für alle m ∈ N (kurz: ϕ ◦ ν = f ◦ ϕ); hierbei ist ν : N → N die Nachfolgerabbildung aus den Peano-Axiomen. Beweis: Der Beweis ist eine Verallgemeinerung des Beweises zu Satz 5.4. Beginnen wir wieder mit der Existenz: Sei dieses Mal H := H ⊆ N × Ω : (1, ω) ∈ H ∧ (m, p) ∈ H ⇒ ν(m), f (p) ∈ H }. T Die Menge H ist nicht leer, weil N × Ω ∈ H. Wie im Beweis zu Satz 5.4 sei G := H∈H H die Menge aller Elemente in N × Ω, die zu jedem Element in H gehören. Offensichtlich gilt G ∈ H, d.h. es ist (1, ω) ∈ G und mit (m, p) ∈ G gilt auch (ν(m), f (p)) ∈ G. Um sich davon zu überzeugen, dass G die gesuchte Abbildung ϕ ist, muss man zeigen, dass zu jedem m ∈ N genau ein p = p(m) ∈ Ω existiert, so dass (m, p) ∈ G. Dies geschieht wieder durch vollständige Induktion: IA: Es ist klar, dass (1, ω) ∈ G. Dass es außer ω kein anderes Element in Ω gibt, das zu 1 in Relation G steht, erklärt sich dadurch, dass mit (1, ω ′) ∈ G für ein Element ω ′ 6= ω auch G \ {(1, ω ′)} zulässig wäre, was der Minimalität von G widerspräche. IV: Zu einem beliebigen m ∈ N gebe es genau ein p = p(m) ∈ Ω, so dass (m, p) ∈ G. IS: Wir müssen zeigen, dass aus der IV folgt, dass auch zu ν(m) genau ein Element q = q ν(m) ∈ Ω existiert, so dass ν(m), q ∈ G. Dass mindestens ein solches Element existiert, folgt aus der Definition von G und der IV. Demnach ist nämlich mit (m, p) ∈ G auch (ν(m), f (p)) ∈ G. Um einzusehen, dass f (p) das einzige Element mit dieser Eigenschaft ist, nehme man an, dass ein Element q ′ ∈ Ω existiert, so dass q ′ 6= f (p) und ν(m), q ′ ∈ G. Nach IV wäre dann die Menge G \ { ν(m), q ′ } zulässig, was ihrer Minimalität widerspräche. Nun definiert man ϕ := G und schreibt anstelle von ϕ ⊆ N × Ω und (m, p) ∈ ϕ, wie in Abschnitt 4.1 erläutert, ϕ:N→ Ω m 7→ ϕ(m) = p. Per Definition von G = ϕ gilt dann wegen (1, ω) ∈ ϕ und (m, p) ∈ H ⇒ ν(m), f (p) ∈ ϕ, wie gefordert, ϕ(1) = ω, 5.5 Eindeutigkeit der natürlichen Zahlen 134 ϕ ν(m) = f ϕ(m) ∀ m ∈ N. Um die Eindeutigkeit der Abbildung ϕ nachzuweisen, nehmen wir an, es gäbe eine (ggf. andere) Abbildung ψ : N → Ω mit den Eigenschaften ψ(1) = ω, ψ ν(m) = f ψ(m) ∀ m ∈ N. Per vollständiger Induktion über die Argumente von ϕ bzw. ψ zeigt man, dass ϕ = ψ: IA: Nach Voraussetzung gilt ψ(1) = ω = ϕ(1). IV: Sei ψ(m) = ϕ(m) für ein m ∈ N. IS: Es gilt IV ψ ν(m) = f ψ(m) = f ϕ(m) = ϕ ν(m) . Also gilt ψ(m) = ϕ(m) für alle m ∈ N, was zu zeigen war. Im zweiten Teil dieses Abschnitts wollen wir Satz 5.19 benutzen, um zu zeigen, dass die Menge N der natürlichen Zahlen durch die Peano-Axiome eindeutig bestimmt ist. Dabei bedeutet eindeutig nicht, dass die uns schon aus der frühen Kindheit bekannte unendliche Zahlwortreihe 1, 2, 3, 4, 5, 6, . . . das einzige Modell dieser Menge N ist; vielmehr bedeutet eindeutig, dass jedes andere Modell die gleiche Struktur hat. Um zu verdeutlichen, was das bedeutet, sei N = {|, ||, |||, ||||, |||||, . . .}; betrachtet man | als ausgezeichnetes Element 1 und ν ′ mit ν ′ () := | für alle ∈ N als Nachfolgerabbildung, so erfüllt N hiermit die Peano-Axiome. Damit kann die Menge N = {|, ||, |||, ||||, |||||, . . .} als Menge der natürlichen Zahlen verstanden werden. Es ist klar, dass sich die Elemente von N = {1, 2, 3, 4, 5 . . .} und N = {|, ||, |||, ||||, |||||, . . .} nur durch ihre Namen“ unterscheiden. Identifiziert man 1 mit |, 2 mit ||, 3 mit ||| etc. durch eine ” Abbildung ϕ : N → N (d.h. man setzt ϕ(1) := |, ϕ(2) := ||, ϕ(3) := |||, etc.), so ist ϕ bijektiv und erfüllt die Gleichheiten ϕ(1) = | und ν ′ ϕ(n) = ϕ ν(n) für alle n ∈ N (kurz: ν ′ ◦ ϕ = ϕ ◦ ν). Die zuletzt genannte Gleichheit ist der Grund, warum man ϕ strukturerhaltend nennt. Betrachten Sie zur Illustration dieser Begrifflichkeit auch Abbildung 5.7: Hier wird verdeutlicht, dass der Nachfolger ν ′ ϕ(n) einer natürlichen Zahl ϕ(n) im zweiten Modell N mit dem Bild ϕ ν(n) des Nachfolgers ν(n) von n im ersten Modell übereinstimmt; mit anderen Worten: Die Reihenfolge von Nachfolgerabbildung und Modellwechsel kann vertauscht werden; das bedeutet, dass der Modellwechsel ϕ die Nachfolgerbildung im Prinzip nicht beeinflusst und da die Nachfolgerabbildung die grundlegende Struktur auf N darstellt, nennt man ϕ strukturerhaltend. Die vorangegangenen Überlegungen sind für alle möglichen Modelle der natürlichen Zahlen richtig, wie der folgende Satz zeigt: Satz 5.20 Sei N′ eine Menge mit einem ausgezeichneten Element 1′ und einer Nachfolgerabbildung ν ′ , die den fünf Peano-Axiomen genügt. Dann gibt es eine bijektive Abbildung 5.5 Eindeutigkeit der natürlichen Zahlen 135 Abb. 5.7 Zur Eindeutigkeit der natürlichen Zahlen. ϕ : N → N′ mit ϕ(1) = 1′ und ν ′ ◦ ϕ = ϕ ◦ ν. Man nennt ϕ einen Isomorphismus19 zwischen N und N′ und bezeichnet N und N′ als isomorph zueinander. Beweis: Wir wenden den Rekursionssatz 5.19 auf Ω = N′ , ω = 1′ und f = ν ′ an. Danach gibt es genau eine Abbildung ϕ : N → N′ mit ϕ(1) = 1′ und ϕ ◦ ν = ν ′ ◦ ϕ. (5.24) Indem man die Rollen von N und N′ vertauscht, erhält man eine eindeutig bestimmte Abbildung ψ : N′ → N mit ψ(1′ ) = 1 und ψ ◦ ν ′ = ν ◦ ψ. (5.25) Zum Beweis der Bijektivität von ϕ zeigen wir, dass ϕ und ψ invers zueinander sind, d.h., dass ψ ◦ϕ = idN und ϕ◦ψ = idN′ . Zum Nachweis der ersten Gleichheit setze jetzt Ω = N, ω = 1 und f = ν. Gemäß Satz 5.19 existiert genau eine (!) Abbildung, nennen wir sie jetzt mal α, von N nach N, die 1 auf 1 abbildet und der Gleichung α ◦ ν = ν ◦ α genügt. Wegen idN (1) = 1 und idN ◦ ν(n) = ν(n) = ν ◦ idN (n) gilt α = idN . Aber auch von ψ ◦ ϕ werden diese Eigenschaften 19 Isomorphismen werden uns noch oft begegnen: Isomorphismen sind (grob gesagt) bijektive Homomorphismen (griech. homos = gleich; morphe = Form), wobei letzteres strukturerhaltende Abbildungen sind. Welche Struktur unter einer derartigen Abbildung genau erhalten bleibt, hängt vom Einzelfall ab. Beispielsweise kann es sich um eine Halbgruppenstruktur handeln. Man nennt zwei algebraische Strukturen isomorph, wenn es einen Isomorphismus zwischen ihnen gibt. Isomorphe Strukturen (M, ∗) und (M ′ , ∗′ ) repräsentieren in gewisser Weise ein- und dasselbe Objekt, und zwar dann, wenn man von der Darstellung der Elemente in M bzw. M ′ und den Namen der Verknüpfungen ∗ und ∗′ Abstand nimmt. 5.6 Multiplikation auf N 136 erfüllt: Zum einen ist ψ ◦ ϕ(1) = ψ ϕ(1) = ψ(1′ ) = 1, zum anderen gilt wegen (5.24) und (5.25) (ψ ◦ ϕ) ◦ ν(n) = ψ ◦ ϕ ◦ ν(n) = ψ ◦ ν ′ ◦ ϕ(n) = ν ◦ ψ ◦ ϕ(n) = ν ◦ (ψ ◦ ϕ)(n). Daraus folgt auch ψ ◦ ϕ = α. Insgesamt gilt also ψ ◦ ϕ = idN . Völlig analog zeigt man die Identität ϕ ◦ ψ = idN′ . 5.6 Multiplikation auf N In diesem Abschnitt beschäftigen wir uns mit der Definition der Multiplikation auf der Menge der natürlichen Zahlen und dem Studium ihrer wichtigsten Eigenschaften. Statt ν(m) werden wir im Folgenden meistens m + 1 schreiben. Definition 5.14 Auf der Menge N definieren wir die Verknüpfung 20 ·:N×N →N wie folgt: n · 1 := n ∀ n ∈ N, n · (m + 1) := (n · m) + n ∀ n, m ∈ N. (5.27) (5.28) Wir nennen · die Multiplikation auf N und n · m das Produkt von n und m. Ferner heißt n der erste Faktor und m der zweite Faktor von n · m. R R R R 20 Beachten Sie, dass gemäß des Dedekindschen Rekursionssatzes 5.19 das über (5.27) und (5.28) eindeutig definierte Produkt n · m zunächst nur für eine feste (!) natürliche Zahl n und jedes beliebige m ∈ N gegeben ist (hierzu wähle Ω = N und für jedes ω = n ∈ N die Funktion fn : N → Ω mit fn (m) := m + n). Da der Rekursionssatz aber für jedes n richtig ist, ist die Multiplikation tatsächlich für je zwei beliebige natürliche Zahlen n und m erklärt. Da jede von 1 verschiedene natürliche Zahl ein Nachfolger ist, ist durch (5.27) und (5.28) tatsächlich jedem Paar (n, m) natürlicher Zahlen ein Funktionswert n · m zugeordnet. Anstelle von n · m werden wir oft nm schreiben. Für die Zukunft treffen wir folgende Vereinbarung: Treten in einem Term Summen und Produkte auf, so sind stets zuerst die Produkte zu berechnen und diese im Anschluss daran aufzuaddieren. Sie kennen diese Regel vermutlich unter dem Namen Punkt- vor ” Strichrechnung“ aus der Schule. Dies ermöglicht uns, Klammern wegzulassen. So werden wir zukünftig anstelle von (n · m) + n nur noch n · m + n oder nm + n schreiben. Vergleichen Sie hierzu die Ausführungen zur Multiplikation auf Seite 132. 5.6 Multiplikation auf N R 137 Die Definition von n · m ist Ihnen in der Schule wahrscheinlich in der Form n · m := |n + n + {z. . . + n} m-mal präsentiert worden. Formal ist eine derartige Definition nicht präzise; nichtsdestotrotz folgt diese Gleichheit mit der in Abschnitt 5.8 nachzuweisenden Assoziativität für mehr als drei Summanden aus (5.27) und (5.28) durch vollständige Induktion. Satz 5.21 Es gilt ∀ n ∈ N : 1 · n = n, ∀ n, m ∈ N : (n + 1) · m = n · m + m. (5.29) (5.30) Beweis: Für den Beweis von (5.29) sei A := {n ∈ N : 1 · n = n}.21 IA: Nach (5.27) gilt 1 ∈ A. IV: Sei 1 · n = n für ein n ∈ N. (5.28) IV IS: 1 · (n + 1) = 1 · n + 1 = n + 1. Also ist auch n + 1 ∈ A. Nach dem Induktionsaxiom (P5) gilt damit A = N, was zu zeigen war. Für den Beweis von (5.30) sei A := {m ∈ N : ∀ n ∈ N : (n + 1)m = nm + m}. IA: Da (n + 1) · 1 = n + 1 = n · 1 + 1 jeweils nach (5.27), gilt 1 ∈ A. IV: Sei (n + 1)m = nm + m für alle n ∈ N und ein m ∈ N. IS: Es ist für alle n ∈ N (5.28) (n + 1)(m + 1) = IV (n + 1)m + (n + 1) = (nm + m) + (n + 1) Ass. Add. = (nm + m) + n + 1 Ass. Add. = nm + (m + n) + 1 Komm. Add. = nm + (n + m) + 1 Ass. Add. = (nm + n) + m) + 1 Ass. Add. = (5.31) (nm + n) + (m + 1) (5.28) = n(m + 1) + (m + 1). Also ist auch m + 1 ∈ A, was den Induktionsbeweis abschließt. Korollar 5.22 Für alle n ∈ N gilt 1 · n = n · 1 = n. Damit ist die 1 (bzgl. der Multiplikation) ein besonderes Element in N: Multipliziert man eine natürliche Zahl mit 1, so wird der Wert dieser Zahl nicht verändert. Bezüglich der Addition hatten wir ein derartiges Element in N nicht ausfindig machen können. Aufgrund der hier genannten Eigenschaft nennt man die natürliche Zahl 1 das neutrale Element bezüglich der Multiplikation. Auch in anderen algebraischen Strukturen kann es ein Element mit vergleichbaren Eigenschaften geben: 21 Dass wir diesen Beweis unter Verwendung von (P5) statt von (P5’) durchführen, dient nur Wiederholungszwecken. 5.6 Multiplikation auf N 138 Definition 5.15 Es sei (A, ∗) eine algebraische Struktur. Ein Element e ∈ A heißt neutrales Element (bezüglich der Verknüpfung ∗), falls für alle a ∈ A gilt: a ∗ e = e ∗ a = a. Gemäß Korollar 5.22 ist also 1 ein neutrales Element in (N, ·). In der algebraischen Struktur (F , ◦) aus Beispiel 5.1 B (siehe Seite 123) ist idA wegen idA ◦ f = f ◦ idA = f neutrales Element; und in (P(M), ∩), wobei M eine nichtleere Menge sei, ist M neutral. Der nächste Satz besagt, dass es außer diesen Elementen jeweils kein anderes neutrales Element geben kann. Satz 5.23 Eine algebraische Struktur (A, ∗) besitzt höchstens ein neutrales Element. Beweis: Angenommen, e1 und e2 seien neutrale Elemente in (A, ∗). Dann gilt e1 ∗a = a∗e1 = a für alle a ∈ A, insbesondere also für a = e2 : e1 ∗ e2 = e2 ∗ e1 = e2 . Da e2 aber auch neutral ist nach Voraussetzung, folgt mit dem gleichen Argument e1 ∗ e2 = e2 ∗ e1 = e1 . Da e1 ∗ e2 eindeutig bestimmt ist (∗ ist ja eine Abbildung), muss e1 = e2 sein. Satz 5.24 Die algebraische Struktur (N, ·) ist kommutativ. Beweis: Den Beweis führen Sie zu Übungszwecken bitte selbstständig aus (Hinweis: Satz 5.21). Satz 5.25 Die algebraische Struktur (N, ·) ist eine Halbgruppe. Beweis: Wir müssen die Assoziativität der Multiplikation nachweisen. Dazu sei für alle k ∈ N die Aussage B(k) := ∀ m, n ∈ N : (m · n) · k = m · (n · k) definiert. Wir zeigen wieder per vollständiger Induktion, dass B(k) für alle k ∈ N gilt. (5.27) (5.27) IA: Es ist (m · n) · 1 = m · n = m · (n · 1), also ist B(1) richtig. IV: Sei nun B(k) für ein k ∈ N richtig. IS: Es ist (5.28) IV (m · n) · (k + 1) = (m · n) · k + m · n = m · (n · k) + m · n (5.27) (5.32) = m · (n · k) + n = m · n · (k + 1) , was zu beweisen war. Bevor wir die Regularität von (N, ·) nachweisen, zeigen wir, dass neben der Addition auch die Multiplikation auf N mit der strengen Ordnung < verträglich ist. Satz 5.26 Die Relation < ist verträglich mit der Multiplikation auf N. Beweis: Wir müssen zeigen, dass für k, l, m, n ∈ N mit k < l und m < n die Ungleichung km < ln gilt. Nach Voraussetzung existieren p1 , p2 ∈ N, so dass k + p1 = l und m + p2 = n. Damit ist (5.32) ln = (k + p1 )(m + p2 ) = (k + p1 )m + (k + p1 )p2 = km + p1 m + kp2 + p1 p2 = km + q mit q := p1 m + kp2 + p1 p2 ∈ N. Also gilt km < ln. 5.6 Multiplikation auf N 139 Ähnlich, wie Satz 5.14 eine Verschärfung von Satz 5.13 darstellt, kann die folgende Aussage als Verschärfung von Satz 5.26 betrachtet werden: Satz 5.27 Für alle k, m, n ∈ N gilt: m < n ⇔ km < kn. Beweis: Sei zunächst m < n. Dann existiert ein l ∈ N, so dass m + l = n. Dies impliziert k(m + l) = km + kl = kn und da kl ∈ N, ist km < kn. Sei nun km < kn. Angenommen, es gilt nicht m < n. Dann ist nach dem Trichotomiegesetz m = n oder m > n. Im ersten Fall folgt aus der Eindeutigkeit der Multiplikation die Gleichheit km = kn, die der Ungleichung km < kn aber widerspricht. Im Fall m > n folgt (wie zu Beginn des Beweises) km > kn, was der angenommenen Ungleichung ebenso widerspricht. Also muss m < n gelten. Satz 5.27 impliziert unmittelbar das folgende Korollar: Korollar 5.28 Für alle k, m, n ∈ N gilt: m ≤ n ⇔ km ≤ kn. Nun kommen wir zum Beweis der Regularität für die Multiplikation: Satz 5.29 Die Halbgruppe (N, ·) ist regulär. Beweis: Aufgrund der Kommutativität von N bezüglich der Multiplikation reicht es, die Gültigkeit der linksseitigen Kürzungsregel (5.16) nachzuweisen: ∀ k, m, n ∈ N : km = kn ⇒ m = n. Diese Implikation beweisen wir indirekt, wir nehmen also an, dass ¬(m = n) ⇔ m < n ∨ m > n (nach dem Trichotomiegesetz) gilt. Die Ungleichung m < n impliziert km < kn, die andere impliziert km > kn (jeweils mit Satz 5.27). Wegen ¬(km = kn) ⇔ km < kn∨km > kn ist der Beweis damit erbracht. Die folgende Aussage erscheint Ihnen vermutlich völlig trivial, muss aber im Rahmen einer axiomatischen Behandlung der natürlichen Zahlen bewiesen werden: Satz 5.30 Für natürliche Zahlen m und n gilt: mn = 1 ⇔ m = 1 ∧ n = 1. Den Beweis ist Bestandteil der Übungen. Auf N haben wir nun zwei binäre Verknüpfungen definiert, die Addition + und die Multiplikation ·. Diese Situation beschreiben wir als Tripel (N, +, ·). Auch dieses Tripel wird als algebraische Struktur bezeichnet - und zwar als algebraische Struktur mit zwei (binären) Verknüpfungen. Das Zusammenspiel der beiden Verknüpfungen + und · auf N genügt den sogenannten Distributivgesetzen22 ; diese können als Verträglichkeitsbedingungen interpretiert werden: Satz 5.31 In der algebraischen Struktur (N, +, ·) gelten für alle k, m, n ∈ N folgende Distributivgesetze k · (m + n) = k · m + k · n, (k + m) · n = k · n + m · n. 22 lat. distribuere = verteilen (5.32) (5.33) 5.6 Multiplikation auf N 140 Beweis: Wegen der Kommutativität von (N, ·) folgt (5.33) aus (5.32); es reicht also, (5.32) nachzuweisen. Dazu sei für alle k ∈ N die Aussage A(k) := ∀ m, n ∈ N : k ·(m+n) = k ·m+k ·n definiert. Wir zeigen per vollständiger Induktion, dass A(k) für alle k ∈ N gilt. (5.29) (5.29) IA: Wegen 1 · (m + n) = m + n = 1 · m + 1 · n ist A(1) richtig. IV: Sei nun A(k) für ein k ∈ N richtig. IS: Es ist (5.30) IV (k + 1) · (m + n) = k · (m + n) + (m + n) = (k · m + k · n) + (m + n) = Ass. + Ass. + = k · m + k · n + (m + n) = k · m + (k · n + m) + n = Ass. + Komm. + = k · m + (m + k · n) + n = k · m + m + (k · n + n) = Ass. + (5.30) = k · m + m + ((k + 1) · n) = (k · m + m) + (k + 1) · n = (5.34) (5.30) = (k + 1) · m + (k + 1) · n, was zu beweisen war. Zum Abschluss dieses Abschnitts kommen wir noch einmal kurz auf den vorangegangenen Abschnitt zurück, in dem wir rekursiv definierte Funktionen diskutiert haben. Denn auch die sogenannte Fakultätsfunktion, die Sie aus der Schule sicher kennen, ist rekursiv definiert - und zwar mit Hilfe der Multiplikation auf N, was erklärt, warum wir sie erst jetzt präzise erörtern können. Um die Fakultätsfunktion zu begründen, muss man den Dedekindschen Rekursionssatz in einer allgemeineren als der bisher vorgestellten Variante verwenden 23 ; und zwar muss die Funktion f zusätzlich vom Zeitpunkt“ , zu dem sie aufgerufen wird, abhängen ” dürfen: Satz 5.32 (Dedekindscher Rekursionssatz (allgemeine Form), 1888) Sei Ω eine beliebige, nicht leere Menge, ω ∈ Ω fest und f : N × Ω → Ω eine Abbildung. Dann gibt es genau eine Abbildung ϕ : N → Ω, so dass ϕ(1) = ω und ϕ ν(m) = f m, ϕ(m) für alle m ∈ N; hierbei ist ν : N → N wieder die Nachfolgerabbildung aus den Peano-Axiomen. Beweis: Der Beweis dieser Form des Satzes verläuft ganz genauso wie in Abschnitt 5.3: Man muss lediglich die Definition zulässiger Mengen entsprechend modifizieren: H := H ⊆ N × Ω : (1, ω) ∈ H ∧ (m, p) ∈ H ⇒ ν(m), f (m, p) ∈ H }. Es sei Ihnen überlassen, die Argumente im Einzelnen zu wiederholen. Um nun die Fakultätsfunktion zu definieren, betrachte man die Situation Ω = N, ω = 1 und f : N × N → N mit (n, p) 7→ (n + 1)p. Gemäß Satz 5.32 gibt es dann genau eine Funktion f ak : N 7→ N, für die f ak(1) = 1 und f ak(n + 1) = f n, f ak(n) = (n + 1) · f ak(n). Definition 5.16 Die gemäß den eben angestellten Überlegungen existierende Abbildung f ak : 23 N→N Bei allen bisher rekursiv definierten Funktionen, für deren Wohldefiniertheit die Aussage des Dedekindschen Rekursionssatzes 5.19 ausreichte, spricht man auch von primitiver Rekursion. 5.7 Potenzen natürlicher Zahlen 141 1 7→ f ak(1) := 1, n + 1 7→ f ak(n + 1) := (n + 1) · f ak(n) heißt Fakultätsfunktion (auf N). Statt f ak(n) schreibt man meistens n!. Damit gilt 1! = 1 und (n + 1)! = (n + 1) · n! für alle n ∈ N. Insbesondere ist also 1! = 1, 2! = 2, 3! = 6, 4! = 24, 5! = 120, etc. 5.7 Potenzen natürlicher Zahlen Auf der Grundlage der Multiplikation natürlicher Zahlen wollen wir im vorliegenden Abschnitt die Potenzen natürlicher Zahlen einführen: Genau wie das Multiplizieren ist das Potenzieren eine abkürzende Schreibweise für eine wiederholte mathematische Rechenoperation. Während beim Multiplizieren wiederholt ein Summand addiert wird, wird beim Potenzieren wiederholt ein Faktor multipliziert. Entsprechend liest sich die Definition wie folgt (vgl. Seite 132): Definition 5.17 Auf der Menge N sei die Verknüpfung ˆ, für die wir anstelle von ˆ(n, m) kürzer nm notieren, wie folgt definiert: ˆ: N×N →N n1 := n ∀ n ∈ N, m+1 n m := n · n ∀ n, m ∈ N. (5.35) (5.36) Den Ausdruck nm lesen wir als n hoch m“ und bezeichnen ihn als die m-te Potenz von n. ” Ferner heißt n die Basis und m der Exponent von nm . R Die Definition von nm kennen Sie aus der Schule womöglich in der Form nm = n · . . . · n} . | · n {z m-mal Dies ist aus den in den Abschnitten 5.3 und 5.5 genannten Gründen formal nicht sauber, folgt aber aus (5.35) und (5.36) mit der im nächsten Abschnitt nachzuweisenden verallgemeinerten“ Assoziativität der Multiplikation durch vollständige Induktion. ” Für das Rechnen mit Potenzen gelten folgende wichtige Rechenregeln: Satz 5.33 (Potenzgesetze auf N) Für alle k, m, n ∈ N gilt: (a) k m · k n = k m+n , (b) (k m )n = k m·n , (c) (k · m)n = k n · mn . 5.7 Potenzen natürlicher Zahlen 142 Beweis: Wir beweisen erst (a): Für alle n ∈ N sei A(n) := ∀ k, m ∈ N : k m · k n = k m+n . (5.35) (5.36) IA: Wegen k m · k 1 = k m · k = k m+1 ist A(1) wahr. IV: Angenommen, es gilt A(n) für ein beliebiges n ∈ N. IS: Es ist (5.36) (5.36) IV k m · k n+1 = k m · (k n · k) = (k m · k n ) · k = k m+n · k = k (m+n)+1 = k m+(n+1) . Den Beweis von (b) führen Sie bitte selbstständig durch. Die Aussage in (c) kann man wieder durch vollständige Induktion beweisen. Dazu sei für alle n ∈ N die Aussageform B(n) := ∀ k, m ∈ N : (km)n = k n mn definiert. Wir beweisen, dass B(n) für alle n ∈ N gilt: (5.35) (5.35) IA: Wegen (km)1 = km = k 1 m1 ist B(1) wahr. IV: Angenommen, es gilt B(n) für ein beliebiges n ∈ N. IS: Es ist (5.36) IV (km)n+1 = (km)n · (km) = k n mn · (km) Ass., Komm. Mult. = (5.36) k n · k · mn · m = k n+1 · mn+1 . Beachten Sie, dass die algebraische Struktur (N, ˆ) weder assoziativ noch kommutativ ist: So 4 ist beispielsweise (23 )4 = 84 = 4096 6= 2 417 851 639 229 258 349 412 352 = 281 = 2(3 ) (wie heißt diese große Zahl?) und 23 = 8 6= 9 = 32 . Außerdem ist das Potenzieren nicht regulär: Es ist nämlich 1n = 1m für alle n, m ∈ N (klar?!); insbesondere kann man also aus dieser Gleichheit nicht n = m folgern. n Die i.A. bestehende Ungleichheit der Ausdrücke (nn )n und n(n ) macht eine Fortsetzung des nun zweimal durchgeführten Verfahrens, durch Rückgriff auf die zuletzt definierte Verknüpfung eine neue Rechenoperation auf N zu etablieren, sinnlos: Die Definition der Multiplikation auf N war unter Rückgriff auf die Addition so formuliert worden, dass das Produkt n·m=n | +n+ {z. . . + n} m-mal die m-fache Summe von n ist. Analog waren die Potenzen unter Rückgriff auf die Multiplikation so definiert worden, dass die Potenz nm = n · . . . · n} | · n {z m-mal das m-fache Produkt von n mit sich selbt ist. Eine Definition der Form n n... n | {z } m-mal macht wegen der nicht gültigen Assoziativität für das Potenzieren keinen Sinn! Im Folgenden wollen wir uns dem verallgemeinerten Assoziativgesetzes, welches die Wohldefiniertheit von Multiplikation und Potenzen im gerade angegebenen Sinne sichert, widmen: 5.8 Vollständige Induktion: Teil II 5.8 143 Vollständige Induktion: Teil II In (5.18), (5.31) und (5.34) sind wir auf Summen gestoßen, in denen vier Summanden vorkamen. Da bis dahin jedoch nur Summen mit zwei Summanden (per Definition) bzw. drei Summanden (über das Assoziativgesetz) definiert waren, mussten in relativ vielen (wenn auch einfachen) Umformungen Klammern versetzt werden, um zu der gewünschten Summendarstellung zu kommen. Viel einfacher wäre die Argumentation gewesen, wenn man gewusst hätte, dass man Klammern in einer Summe auch dann weglassen kann, wenn mehr als drei Summanden vorliegen - sprich: wenn auch Summen mit endlich, aber beliebig vielen Summanden definiert wären; das ist aber nicht trivial und soll im Folgenden mittels der Ordnung auf N wasserdicht“ gemacht werden. ” Satz 5.34 In einer assoziativen algebraischen Struktur (A, ∗) ist die Verknüpfung von n ∈ N beliebigen Elementen a1 , . . . , an ∈ A (in der angegebenen Reihenfolge) unabhängig von der Klammerung. Das Ergebnis nennen wir a1 ∗ a2 ∗ . . . ∗ an . Um diese Aussage zu beweisen, müssen wir eine Variation des Beweisverfahrens der vollständigen Induktion verstehen. Dazu nehmen wir an, dass für jedes n ∈ N eine Aussageform A(n) gegeben ist und die Allaussage ∀ n ∈ N : A(n) bewiesen werden soll. Die Umformulierung (P5’) A(1) ∧ ∀ n ∈ N : A(n) ⇒ A(n + 1) ⇒ ∀ n ∈ N : A(n) von (P5) haben wir als Grundlage für das Schema der vollständigen Induktion verwendet (vgl. Seite 116). Nun wollen wir uns überlegen, dass auch die Implikation (P5*) A(1) ∧ ∀ n ∈ N : ∀ m ≤ n : A(m) ⇒ A(n + 1) ⇒ ∀ n ∈ N : A(n), die sich von (P5’) nur an einer Stelle unterscheidet, richtig ist. Zu diesem Zweck sei S := A(1) ∧ ∀ n ∈ N : ∀ m ≤ n : A(m) ⇒ A(n + 1) . Für das modifizierte Induktionsverfahren (P5*) ist zu zeigen, dass die Implikation S ⇒ ∀ n ∈ N : A(n) richtig ist. Und dies sieht man am besten durch einen Widerspruchsbeweis: Angenommen, es gilt S und ¬(∀ n ∈ N : A(n)) ⇔ ∃ m1 ∈ N : ¬A(m1 ). Dann muss, da ∀ m < m1 : A(m) ⇒ A(m1 ) als Teilaussage von S nach Voraussetzung richtig ist, ein m2 < m1 existieren, so dass auch ¬A(m2 ) gilt. Mit dem gleichen Argument erhält man weiter ein m3 < m2 , so dass ¬A(m3 ). So fortfahrend, erhält man für ein k ≤ m1 Zahlen m1 > m2 > m3 > . . . > mk = 1, so dass ¬A(mi ) für alle i = 1, . . . , k. Doch ¬A(mk ) = ¬A(1) widerspricht der Voraussetzung A(1), die als Teilaussage von S gilt. Also ist die Implikation (P5*) richtig und man erhält Schema 5.8 der modifizierten vollständigen Induktion. Bevor wir uns nun dem Beweis von Satz 5.34 widmen können, muss noch kurz ein weiterer Aspekt angesprochen werden, der im Zusammenhang mit Allaussagen für (gewisse) Teilmengen der natürlichen Zahlen wichtig ist. Nehmen wir einmal an, es sei m ∈ N \ {1} und eine Allaussage der Form ∀ n ∈ N mit n ≥ m : A(n) 5.8 Vollständige Induktion: Teil II 144 Behauptung: ∀ n ∈ N : A(n). Beweis durch modifizierte vollständige Induktion: Induktionsanfang (IA): A(1). Induktionsvoraussetzung (IV): Für ein beliebiges n ∈ N gelte ∀ m ≤ n : A(m). Induktionsschluss (IS): Für das feste n aus der IV gilt mit ∀ m ≤ n : A(m) auch A(n + 1). Abb. 5.8 Schema zur modifizierten vollständigen Induktion. zu beweisen. Dann lässt sich die klassische vollständige Induktion als Beweismethode eventuell nicht heranziehen, nämlich dann nicht, wenn A(i) für ein i < m nicht richtig ist. Zur besseren Darstellung des folgenden Beispiels führen wir zunächst den Begriff der Folge ein: Definition 5.18 Es sei M eine beliebige, nicht leere Menge. Eine Folge (in M) ist eine Abbildung a : N → M.24 Für den Funktionswert a(n) schreibt man an , man bezeichnet ihn als n-tes Folgeglied. Folgen notiert man auch in der Form (an )n∈N := (a1 , a2 , a3 , . . .). R Beachten Sie, dass es bei einer Folge (a1 , a2 , a3 , . . .) im Gegensatz zu einer Menge {a1 , a2 , a3 , . . .} sehr wohl auf die Reihenfolge ankommt, in der die Elemente der Folge, also die Folgeglieder, aufgelistet sind. So ist die Folge (n)n∈N = (1, 2, 3, 4, 5, . . .) der natürlichen Zahlen verschieden von der Folge (2, 1, 3, 4, 5, 6, . . .), bei der die Positionen der ersten beiden natürlichen Zahlen vertauscht wurden. Beispiel 5.3 Es soll untersucht werden, wie die Folge (2n + 1)n∈N = (2 · 1 + 1, 2 · 2 + 1, 2 · 3 + 1, . . .) = (3, 5, 7, 9, 11, . . .) der ungeraden Zahlen ≥ 3 gegenüber der Folge (n2 )n∈N = (12 , 22 , 32 , 42 , 52 , . . .) = (1, 4, 9, 16, 25, . . .) der Quadratzahlen anwächst. Mit anderen Worten: Es soll überprüft werden, ob es ein m ∈ N gibt, so dass eine der Aussagen ∀ n ≥ m : n2 ≤ 2n+1 oder ∀ n ≥ m : n2 ≥ 2n + 1 richtig ist. Der Übersichtlichkeit halber fertigen wir eine Tabelle an, in der wir die ersten Zahlenwerte gegenüberstellen: n 1 2 3 4 5 6 7 8 n2 1 4 9 16 25 36 49 64 81 100 121 2n + 1 3 5 7 9 19 11 13 15 17 9 10 21 11 23 Die Tabelle deutet an, dass die Aussage n2 ≥ 2n + 1 ab n = 3 richtig zu sein scheint. Sicher ist die entsprechende Aussage aber für n = 2 falsch. Den klassischen Induktionsbeweis können 24 Auch Abbildungen a : N0 → M werden als Folgen (in M ) bezeichnet. Für den Moment beschränken wir uns jedoch auf den Definitionsbereich N, weil wir im Rahmen dieses Kapitels die Zahl 0 noch gar nicht definiert haben. 5.8 Vollständige Induktion: Teil II 145 wir also nicht durchführen. Eine Änderung des Induktionsanfangs schafft in einer derartigen Situation aber schon die nötige Abhilfe. Wollen wir nämlich die Behauptung ∀ n ≥ 3 : n2 ≥ 2n + 1 beweisen, wählen wir einfach n = 3 als Induktionsanfang: IA (n = 3): Wegen n2 = 32 = 9 ≥ 7 = 2 · 3 + 1 = 2n + 1 ist die zu beweisende Aussage für n = 3 richtig. IV: Sei die Behauptung für ein n ≥ 3 richtig. IV IS: Es ist (n + 1)2 = n2 + 2n + 1 ≥ (2n + 1) + (2n + 1) = . . . = 4n + 2 ≥ 2n + 2n + 2 ≥ 2n + 2 + 1 = 2(n + 1) + 1, was den Induktionsbeweis abschließt: Aus IV und IS folgt nämlich mit der Gültigkeit der Aussage für n = 3 auch die Gültigkeit für n = 4, daraus dann wieder mit IV und IS die Gültigkeit für n = 5 etc. N Diese Überlegungen sind für die allgemeine Situation wieder im gewohnten Schema zusammengefasst (Abb. 5.9). Stellen Sie sicher, wirklich verstanden zu haben, warum die Abarbeitung aller drei Schritte des Schemas die Behauptung beweist! Behauptung: ∀ n ∈ N mit n ≥ m : A(n) (hierbei sei m ∈ N \ {1}). Beweis durch vollständige Induktion mit Induktionsanfang m: Induktionsanfang (IA): A(m). Induktionsvoraussetzung (IV): Es gelte A(n) für ein beliebiges n ∈ N mit n ≥ m. Induktionsschluss (IS): Für das feste n aus der IV gilt mit A(n) auch A(n + 1). Abb. 5.9 Schema zur vollständigen Induktion mit Induktionsanfang > 1. Nun haben wir die nötige Vorarbeit geleistet, um den Beweis von Satz 5.34 zu erbringen. Tatsächlich handelt es sich dabei um eine Variante der vollständigen Induktion, die aus einer Kombination der beiden im Rahmen dieses Abschnitts erwähnten Modifikationen besteht. Beweis (von Satz 5.34): Für alle n ∈ N mit n ≥ 3 sei A(n) die Aussage, dass (a1 ∗ . . . ∗ ar ) ∗ (ar+1 ∗ . . . ∗ an ) = (a1 ∗ . . . ∗ as ) ∗ (as+1 ∗ . . . ∗ an ) ∀ 1 ≤ r < s < n. Wir beweisen per modifizierter vollständiger Induktion mit Induktionsanfang n = 3, dass A(n) für alle n ∈ N mit n ≥ 3 gilt: IA (n = 3): A(3) ist richtig, da die Aussage in diesem Fall der Definition von Assoziativität entspricht. IV: Wir nehmen an, dass die Behauptung für alle k ∈ {3, . . . , n} richtig ist, wobei n ∈ N\{1, 2} beliebig sei. Das bedeutet insbesondere, dass sich alle Blöcke (ai1 ∗ . . . ∗ aik ) der Länge k mit il = il−1 + 1 für alle l = 2, . . . , k beliebig in zwei Teilblöcke (ai1 ∗ . . . ∗ aim ) und (aim+1 ∗ . . . ∗ aik ) 5.9 Subtraktion und Division natürlicher Zahlen 146 (mit m < k) aufteilen lassen, die jeweils wieder in zwei Teilblöcke aufgespalten werden können etc. Anders gesagt: Für Blöcke, in denen höchstens n ≥ 3 Elemente verknüpft sind, ist die Klammerung der Elemente irrelevant. IS: Es seien r, s ∈ N mit 1 ≤ r < s < n + 1. Wir wollen beweisen, dass (a1 ∗ . . . ∗ ar ) ∗ (ar+1 ∗ . . . ∗ an+1 ) = (a1 ∗ . . . ∗ as ) ∗ (as+1 ∗ . . . ∗ an+1 ). Nach IV sind die Terme (ar+1 ∗ . . . ∗ an+1 ) und (a1 ∗ . . . ∗ as ) eindeutig erklärt, da ihre Länge höchstens n ist; sie können also beliebig in Teilblöcke aufgespalten werden. Damit ist (a1 ∗ . . . ∗ ar )∗(ar+1 ∗ . . . ∗ an+1 ) = (a1 ∗ . . . ∗ ar )∗ (ar+1 ∗ . . . ∗ as )∗(as+1 ∗ . . . ∗ an+1 ) = (a1 ∗ . . . ∗ ar )∗(ar+1 ∗ . . . ∗ as ) ∗(as+1 ∗ . . . ∗ an+1 ) = (a1 ∗ . . . ∗ as )∗(as+1 ∗ . . . ∗ an+1 ). Damit ist das Ergebnis jeder Verknüpfung von n Elementen, die man unter Berücksichtigung ihrer Reihenfolge beliebig klammert, unabhängig von dieser Klammerung. Zur Verdeutlichung der im vorangegangenen Beweis verwendeten Argumentation sei ein Bei spiel gegeben: Will man zeigen, dass (a1 ∗a2 )∗(a3 ∗a4 ) ∗(a5 ∗a6 ) = (a1 ∗a2 ∗a3 )∗ (a4 ∗a5 )∗a6 , so argumentiert man unter Verwendung des (induktiv bewiesenen) Wissens darüber, dass jeder Ausdruck beliebig in zwei Teilausdrücke geklammert werden darf, wie folgt: (a1 ∗ a2 ) ∗ (a3 ∗ a4 ) ∗ (a5 ∗ a6 ) = (a1 ∗ a2 ∗ a3 ) ∗ a4 ∗ (a5 ∗ a6 ) = (a1 ∗ a2 ∗ a3 ) ∗ a4 ∗ a5 ∗ a6 = (a1 ∗ a2 ∗ a3 ) ∗ (a4 ∗ a5 ) ∗ a6 = (a1 ∗ a2 ∗ a3 ) ∗ (a4 ∗ a5 ) ∗ a6 . Das Ergebnis nennt man kürzer a1 ∗ a2 ∗ a3 ∗ a4 ∗ a5 ∗ a6 . Abschließend sei noch einmal betont, dass Satz 5.34 insbesondere impliziert, dass Summen bzw. Produkte mit endlich, aber beliebig vielen natürlichen Summanden bzw. Faktoren wohldefiniert sind. 5.9 Subtraktion und Division natürlicher Zahlen Definition 5.19 Es seien U, V, B nicht leere Mengen und ∗ : U × V → B eine Abbildung, für die wir für alle u ∈ U und v ∈ V anstelle von ∗(u, v) wieder u ∗ v schreiben. (a) Sind a ∈ U und b ∈ B gegeben, so nennt man r ∈ V eine Lösung der Gleichung a∗x=b (5.37) (in der Unbekannten x), falls a ∗ r = b. Man sagt auch: r löst die Gleichung a ∗ x = b. Gilt ∀ r ∈ V : a ∗ r 6= b, so nennt man die Gleichung (5.37) unlösbar. (b) Sind a ∈ V und b ∈ B gegeben, so nennt man s ∈ U eine Lösung der Gleichung y∗a=b (5.38) in der Unbekannten y), falls s ∗ a = b. Hier sagt man auch: s löst die Gleichung y ∗ a = b. Gilt ∀ s ∈ U : s ∗ a 6= b, so nennt man die Gleichung (5.38) unlösbar. 5.9 Subtraktion und Division natürlicher Zahlen 147 Beispiel 5.4 A Sei Ω = {1, 2, 3} und als Verknüpfung auf P(Ω) die Schnittbildung ∩ gegeben. Dann wird für A = {1, 3} und B = {3} die Gleichung A ∩ X = B ⇔ {1, 3} ∩ X = {3} in der Unbekannten X durch die Mengen {3} und {2, 3} ∈ P(Ω) gelöst. Andere Lösungen gibt es nicht. Die Gleichung {1, 3} ∩ X = {2} ist unlösbar. B Sei wieder Ω = {1, 2, 3} und als Verknüpfung auf P(Ω) nun die symmetrische Differenz betrachtet. Die Gleichung {1, 3} △ X = {1, 2} wird nur durch die Menge X = {2, 3} gelöst. N Über die Anzahl der Lösungen zu einer gegebenen Gleichung a ∗ x = b bzw. y ∗ a = b lassen sich keine allgemeinen Aussagen machen: Je nach Situation kann es vorkommen, dass es keine Lösung, genau eine Lösung, endlich viele oder sogar unendlich viele Lösungen gibt. Der folgende Satz beantwortet die Frage nach der Anzahl von Lösungen in einer speziellen Situation: Satz 5.35 Es sei (A, ∗) eine reguläre algebraische Struktur und es seien a, b ∈ A beliebig, aber fest. Dann gilt: (a) Sind r1 , r2 ∈ A Lösungen der Gleichung a ∗ x = b, so gilt r1 = r2 .25 (b) Sind s1 , s2 ∈ A Lösungen der Gleichung y ∗ a = b, so gilt s1 = s2 . Beweis: Wir beweisen hier nur Aussage (a), da sich (b) völlig analog verifizieren lässt: Nach Voraussetzung gilt a ∗ r1 = b = a ∗ r2 . Insbesondere gilt also a ∗ r1 = a ∗ r2 . Da (A, ∗) regulär ist, und a, r1 , r2 ∈ A gilt, kann die linksseitige Kürzungsregel (5.16) angewendet werden. Diese liefert r1 = r2 . Korollar 5.36 Sind n, m ∈ N und gilt n < m, so existiert genau eine natürliche Lösung der Gleichung n + x = m (in der Unbekannten x). Beweis: Die Existenz einer natürlichen Zahl p mit n + p = m folgt direkt aus der Definition der Kleiner-Relation. Die Eindeutigkeit folgt gemäß Satz 5.35 aus der Regularität der Addition (vgl. Satz 5.8). Bemerkung 5.1 Sind n, m natürliche Zahlen mit n ≥ m, so hat die Gleichung n + x = m keine natürliche Lösung. 25 Diese Aussage kann man auch wie folgt ausdrücken: Die Lösung der Gleichung a ∗ x = b ist in A eindeutig bestimmt. 5.9 Subtraktion und Division natürlicher Zahlen 148 Beweis: Wir beweisen die Behauptung indirekt: Hat die Gleichung n + x = m eine natürliche Lösung, so folgt daraus n < m; nach dem Trichotomiegesetz für natürliche Zahlen (Korollar 5.12) ist dies äquivalent zu ¬(n ≥ m). Die vorangegangenen Überlegungen geben Anlass zu folgender Definition: Definition 5.20 Seien n, m ∈ N mit n < m. Die gemäß Korollar 5.36 eindeutig bestimmte natürliche Lösung der Gleichung n + x = m heißt Differenz von m und n; man bezeichnet sie mit m − n. Die Zuordnungsvorschrift, die einem Zahlenpaar (m, n) ∈ N × N, welches die Ungleichung n < m erfüllt, die Differenz m − n zuordnet, nennt man Subtraktion. In dem Term m − n bezeichnet man m als den Minuenden26 und n als den Subtrahenden27 . R R Beachten Sie, dass die Subtraktion keine (!) Verknüpfung auf N ist: Nicht zu jedem Paar (m, n) ∈ N × N ist die Differenz m − n erklärt. Die Subtraktion auf N ist weder assoziativ noch kommutativ: So ist beispielsweise (4 − 2) − 1 = 2 − 1 = 1, aber 4 − (2 − 1) = 4 − 1 = 3. Außerdem ist 4 − 2 = 2, aber 2 − 4 nicht definiert. Insbesondere macht so der ungeklammerte Ausdruck 4 − 2 − 1 keinen Sinn, wenn nicht ausdrücklich festgelegt ist, in welcher Richtung er zu lesen ist. Standardgemäß wird man sich auf die Leserichtung von links nach rechts festlegen. Nach einigen einführenden Überlegungen zum Begriff der Lösung einer Gleichung haben wir uns bisher in diesem Abschnitt auf die spezielle Gleichung n + x = m in der Unbekannten x konzentriert, wobei n und m hier beliebige natürliche Zahlen sein sollten. Ganz analog können wir uns, da neben der Addition auch die Multiplikation als Verknüpfung auf N zur Verfügung steht, mit der Lösbarkeit der Gleichung n·x=m in der Unbekannten x beschäftigen. Es ist offensichtlich, dass auch diese Gleichung nicht für alle Paare (n, m) ∈ N2 in N lösbar ist: Beispielsweise lässt sich für die Gleichung 2 · x = 3 keine Lösung finden. Die Frage danach, ob die angegebene Gleichung eine Lösung hat, hängt eng mit dem Begriff der Teilbarkeit zusammen, den wir in Kapitel 3 im Zusammenhang mit der Teilbarkeitsrelation bereits definiert hatten (ohne jedoch dabei eine Idee von dem axiomatischen Aufbau der Zahlbereiche gehabt zu haben). Während wir Definition 3.2 zum damaligen Zeitpunkt eher angegeben haben, um eine einheitliche Notation für einen bereits aus der Schule bekannten Begriff einzuführen, wäre eine entsprechende Definition an dieser Stelle des Aufbaus der Zahlbereiche neu“. Da Definition 3.2 ja korrekt ist, soll sie hier nicht wiederholt werden, ” ich möchte aber kurz darlegen, wie sich die Definition des Teilbarkeitsbegriffes gelesen hätte, wenn sie an dieser Stelle tatsächlich erstmalig getroffen worden wäre: Definition 3.2’ Sind n, m ∈ N, so sagen wir, dass die Zahl n die Zahl m teilt (oder dass n ein Teiler von m ist oder dass m ein Vielfaches von n ist), wenn ein k ∈ N existiert, so dass n · k = m. Man schreibt dann n | m. In Ergänzung zu den Überlegungen aus Kapitel 3 seien hier einige wichtige Aussagen zur Teilbarkeitseigenschaft formuliert und (jetzt axiomatisch fundiert) bewiesen: 26 27 lat. minuere = verringern, vermindern lat. subtrahere = abziehen, wegziehen 5.9 Subtraktion und Division natürlicher Zahlen 149 Satz 5.37 (a) ∀ n ∈ N : 1 | n, (b) ∀ n ∈ N : n | n (Reflexivität), (c) ∀ n, m ∈ N : n | m ∧ m | n ⇒ n = m (Antisymmetrie), (d) ∀ n, m, p ∈ N : n | m ∧ m | p ⇒ n | p (Transitivität), (e) ∀ n1 , n2 , m1 , m2 ∈ N : n1 | m1 ∧ n2 | m2 ⇒ n1 · n2 | m1 · m2 , (f) ∀ k, l, n, m, p ∈ N : n | m ∧ n | p ⇒ n | km + lp. (g) ∀ n, m, p ∈ N : n | m ∧ n | m + p ⇒ n | p. Beweis: (a) Wegen 1 · n = n für alle n ∈ N ist die Aussage richtig. (b) Wegen n · 1 = n für alle n ∈ N ist die Aussage wahr. (c) Nach Voraussetzung gilt nk = m und ml = n für natürliche Zahlen k und l. Einsetzen der zweiten Gleichung in die erste liefert (ml)k = m(lk) = m. Aus der Regularität der Multiplikation folgt die Gleichheit lk = 1, was l = k = 1 impliziert (klar?!). (d) Nach Voraussetzung existieren natürliche Zahlen k und l, so dass nk = m und ml = p. Damit ist insbesondere (nk)l = n(kl) = p, was die Behauptung beweist, da kl ∈ N. (e) Nach Voraussetzung existieren natürliche Zahlen k1 , k2 , so dass ni ki = mi für i = 1, 2. Insbesondere folgt daraus mit der Kommutativität und Assoziativität der Multiplikation auf N die Gleichung n1 n2 k1 k2 = m1 m2 , welche wegen k1 k2 ∈ N die Behauptung liefert. (f) Nach Voraussetzung existieren wieder natürliche Zahlen u und v, so dass nu = m und nv = p. Daraus folgen für alle k, l ∈ N die Gleichheiten knu = km und lnv = lp. Addition liefert knu + lnv = n(ku + lv) = km + lp, woraus die Behauptung mit ku + lv ∈ N unmittelbar folgt. (g) Nach Voraussetzung existieren k, l ∈ N, so dass kn = m und ln = m + p. Wegen m < m + p und Satz 5.27 ist k < l, sagen wir k + a = l für ein a ∈ N. Dann gilt also ln = (k + a)n = kn + an = m + p = kn + p. Hieraus folgt mit der Regularität der Addition die Gleichung an = p, welche die Behauptung n | p beweist. Als Sonderfälle der Regeln (e) und (f) sind folgende Aussagen bedeutsam: Korollar 5.38 (a) ∀ n, m, p ∈ N : n | m ⇒ n | pm, (b) ∀ n, m, p ∈ N : n | m ∧ n | p ⇒ n | m + p. 5.10 Operationen mit beliebig vielen Mengen 150 Die Aussage des folgenden Satzes folgt unmittelbar aus der Definition der Teilbarkeit und Satz 5.37. (Im Übrigen ist sie nicht wirklich neu: Vgl. dazu Seite 71.) Satz 5.39 Definiert man TN := {(n, m) ∈ N × N : n | m}, so ist TN eine Ordnungsrelation auf N, die aber nicht total ist. Aus der Regularität der Multiplikation auf N folgt eine für die Definition des Begriffs der Division wichtige Tatsache: Bemerkung 5.2 Sind n, m ∈ N mit n | m, so ist die natürliche Zahl k, die die Gleichung nk = m erfüllt, eindeutig bestimmt. Definition 5.21 Seien n, m ∈ N mit n | m. Die gemäß Bemerkung 5.2 eindeutig bestimmte natürliche Lösung der Gleichung nk = m heißt Quotient von m und n. Man bezeichnet ihn mit m : n. Die Zuordnungsvorschrift, die einem Zahlenpaar (m, n) ∈ N × N, für welches n | m gilt, den Quotienten m : n zuordnet, nennt man Division. In dem Term m : n bezeichnet man m als den Dividend28 und n als den Divisor29 . R R Beachten Sie, dass auch die Division (wie die Subtraktion) keine (!) Verknüpfung auf N ist: Nicht zu jedem Paar (m, n) ∈ N × N ist der Quotient m : n definiert. Im Rahmen sich anschließender Erweiterungen der Menge N der natürlichen Zahlen zu den ganzen Zahlen Z bzw. den rationalen Zahlen Q werden wir diese Probleme beheben. Wie die Subtraktion ist auch die Division auf N weder assoziativ noch kommutativ: So ist beispielsweise (8 : 2) : 2 = 4 : 2 = 2, aber 8 : (2 : 2) = 8 : 1 = 8. Außerdem ist 8 : 2 = 4, aber 2 : 8 nicht definiert. 5.10 Operationen mit beliebig vielen Mengen Satz 5.34 bringt es mit sich, dass wir künftig für verschiedene Konkretisierungen der Verknüpfung ∗ Ausdrücke der Form a1 ∗ . . . ∗ an , wobei n ∈ N beliebig ist, als wohldefiniert betrachten können 30 : • Mit Satz 2.1 (b1) und (b2) ist für jede Familie M1 , . . . , Mn von Mengen auch der Schnitt bzw. die Vereinigung über diese n Mengen definiert: M1 ∩ M2 ∩ . . . ∩ Mn bzw. M1 ∪ M2 ∪ . . . ∪ Mn . 28 lat. dividendus (numerus) = die zu teilende (Zahl), dividere = teilen lat. divisor = (Ab)teiler 30 Ersetzt man in Satz 5.34 die Gleichheit durch Gleichwertigkeit - also Äquivalenz -, so sind damit für beliebig viele Aussagen A1 , . . . , An (n ∈ N) wegen der Assoziativität der Konjunktion und der Disjunktion (siehe (A∧) und (A∨) auf Seite 16) auch Ausdrücke der Form 29 A1 ∧ A2 ∧ . . . ∧ An und. A1 ∨ A2 ∨ . . . ∨ An wohldefinierte Aussagen. 5.10 Operationen mit beliebig vielen Mengen 151 Man überlegt sich leicht, dass folgende Identitäten gelten: M1 ∩ M2 ∩ . . . ∩ Mn =: M1 ∪ M2 ∪ . . . ∪ Mn =: n \ i=1 n [ i=1 Mi = {x : ∀ i ∈ {1, . . . , n} : x ∈ Mi }, (5.39) Mi = {x : ∃ i ∈ {1, . . . , n} : x ∈ Mi }. (5.40) • In den Übungen hatten wir uns einmal davon überzeugt, dass auch die symmetrische Differenzbildung △ von Mengen assoziativ ist. Damit ist auch M1 △M2 △ . . . △Mn eine wohldefinierte Menge. Allerdings ist es hier nicht so einfach, eine Formel wie (5.39) bzw. (5.40) aufzustellen. • Mit Satz 4.4 ist für beliebige Funktionen fi : Ai → Bi , i = 1, . . . , n, falls nur fi (Ai ) ⊆ Ai−1 für alle i ∈ {2, . . . , n}, die mehrfache Hintereinanderausführung f1 ◦ f2 ◦ . . . ◦ fn : An → B1 (5.41) wohldefiniert. • Wegen der Sätze 5.8 und 5.25 ist für alle natürlichen Zahlen m1 , . . . , mn sowohl die Summe m1 + m2 + . . . + mn als auch das Produkt m1 · m2 · . . . · mn unabhängig von der Reihenfolge der Auswertung. Es sei nochmal darauf hingewiesen, dass der Ausdruck mn m... m1 2 hingegen nicht wohldefiniert ist: Potenzbildung ist nicht assoziativ! Was Operationen mit Mengen betrifft, greift Satz 5.34 für Schnitt-, Vereinigungs- und symmmetrische Differenzbildung, nicht jedoch für die Bildung des kartesischen Produkts (siehe Definition 2.8), da dies keine Verknüpfung darstellt: Das kartesische Produkt zweier Mengen M und N, die Teilmengen einer Ausgangsmenge G sind, besteht ja aus bestimmten 2-Tupeln mit Komponenten aus dieser Grundmenge und ist damit insbesondere keine Teilmenge mehr von G. Hier muss also anders vorgegangen werden. Wollte man formal exakt vorgehen31 , müssten wir hier sehr viel Aufwand betreiben; der steht aber, was unsere Ziele betrifft, in keinem Verhältnis zu dem Nutzen, den wir daraus ziehen könnten32 . Daher begnügen wir uns mit folgender Verallgemeinerung der Definition 2.8: 31 An dieser Stelle muss bemerkt werden, dass ich selbst in Definition 5.22 des kartesischen Produkts für zwei Mengen schon etwas geschummelt habe: Ich habe nämlich die Definition eines Tupels nicht auf bis dahin bekannte Begriffe wie Menge, Element etc. zurückgeführt. 32 Es sei jedoch angemerkt, dass wir für den Spezialfall der Definition des n-fachen (n ∈ N) kartesischen Produktes einer Menge A mit sich selbst in Abschnitt 5.5 formal sehr saubere Vorarbeiten geleistet haben. 5.10 Operationen mit beliebig vielen Mengen 152 Definition 5.22 Sei n ∈ N und seien M1 , M2 , . . . , Mn beliebige Mengen. (a) Dann heißt M1 × M2 × . . . × Mn := {(x1 , x2 , . . . , xn ) : x1 ∈ M1 ∧ x2 ∈ M2 ∧ . . . ∧ xn ∈ Mn } (5.42) das (kartesische) Produkt von M1 , M2 , . . . , Mn . (b) Ein Element (x1 , x2 , . . . , xn ) von M1 × M2 × . . . × Mn nennt man ein (n-)Tupel. Der Eintrag xi heißt i-te Komponente des Tupels, i = 1, . . . , n. Mitunter notiert man die rechte Seite in (5.42) kürzer auch auf eine der folgenden Weisen: • {(x1 , x2 , . . . , xn ) : x1 ∈ M1 , x2 ∈ M2 , . . . , xn ∈ Mn } • {(x1 , x2 , . . . , xn ) : ∀ i ∈ {1, . . . , n} : xi ∈ Mi } (5.43) • {(x1 , x2 , . . . , xn ) : xi ∈ Mi ∀ i = 1, . . . , n} (5.44) Für den Spezialfall, dass die Mengen M1 , . . . , Mn alle gleich sind, d.h., dass M1 = M2 = . . . = Mn =: M für eine Menge M gilt, verwendet man für M1 ×M2 ×. . . ×Mn = M × . . . × M} | × M {z die Notation M n . In Anlehnung an (5.43) und (5.44) schreibt man auch n-mal M n ={(x1 , x2 , . . . , xn ) : ∀ i ∈ {1, . . . , n} : xi ∈ M} ={(x1 , x2 , . . . , xn ) : xi ∈ M ∀ i = 1, . . . , n}. Die gerade eingeführten n-Tupel sind eine neue Sorte von mathematischen Objekten. Unter welchen Umständen man zwei solcher Objekte als gleich betrachtet, soll im Folgenden analog zu den Ausführungen in 2.9 definiert werden: Definition 5.23 Es sei n ∈ N und M1 , . . . , Mn eine Familie von Mengen. Zwei n-Tupel (x1 , . . . , xn ), (y1 , . . . , yn ) ∈ M1 ×M2 ×. . .×Mn heißen gleich, falls xi = yi für alle i = 1, . . . , n. Die Reihenfolge der Einträge ist also - wie bei den 2-Tupeln auch schon - von Bedeutung: So ist (1, 2, 3) 6= (1, 3, 2). Beispiel 5.5 1. {1, 2} × {3, 4} × {5, 6} = {(1, 3, 5), (1, 3, 6), (1, 4, 5), (1, 4, 6) (2, 3, 5), (2, 3, 6), (2, 4, 5), (2, 4, 6)} 2. {0, 1}3 = {0, 1} × {0, 1} × {0, 1} = {(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)} 3. R2 = R × R = {(x, y) : x ∈ R, y ∈ R} = {(x, y) : x, y ∈ R} (Anschauungsebene) 4. R3 = R × R × R = {(x1 , x2 , x3 ) : xi ∈ R ∀ i = 1, 2, 3} (Anschauungsraum) 5. Z1 = {(z) : z ∈ Z} = Z. 33 33 N Dass hier {(z) : z ∈ Z} mit Z = {z : z ∈ Z} identifiziert wird, ist formal (zunächst) nicht ganz einwandfrei. Es ist jedoch offensichtlich, wie eine Bijektion zwischen diesen beiden Mengen aussehen kann: Man bildet einfach das 1-Tupel (z) auf dessen Eintrag z ab; eine derartige Bijektion kann die Identifikation zwischen zwei verschiedenen Objekten rechtfertigen, wenn dabei ggf. vorhandene Strukturen nicht verletzt werden. Im Zusammenhang mit dem Isomorphiebegriff werden wir auf derartige Fragen zurückkommen. 5.10 Operationen mit beliebig vielen Mengen 153 Zum Abschluss dieses Kapitels sei noch eine Aussage zur Abhängigkeit der Mächtigkeit eines kartesischen Produktes von den Mächtigkeiten der dieses Produkt bildenden Mengen getätigt: Satz 5.40 Sei n ∈ N und M1 , . . . , Mn eine Familie von Mengen mit |Mi | = mi ∈ N für alle i = 1, . . . , n. Dann gilt |M1 × M2 × . . . × Mn | = m1 · m2 · . . . · mn . Beweis: Übungen. Literaturverzeichnis [AA05] Appell, K. ; Appell, J.: Mengen – Zahlen – Zahlbereiche. Eine elementare Einführung in die Mathematik. 1. Aufl. Spektrum, 2005 [Beu09] Beutelsbacher, A.: Das ist o.B.d.A. trivial! 9. Aufl. Vieweg+Teubner, Wiesbaden, 2009 [Fri07] Fritzsche, K.: Mathematik für Einsteiger - Vor- und Brückenkurs zum Studienbeginn. 4. Aufl. Spektrum Akademischer Verlag, 2007 [MM11] Meinel, C. ; Mundhenk, M.: Mathematische Grundlagen der Informatik – Mathematisches Denken und Beweisen – Eine Einführung. 5. Aufl. Vieweg/Teubner, 2011 [Pos11] Postel, H.: Aufgabensammlung zur Übung und Wiederholung – Mathematik. Schroedel, 2011 154