Grundlagen der Computernutzung Mathematik WiSe 2007/08 J. Baumeister1 9. Februar 2010 1 Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgültig korrigiert sind. Hinweise auf Fehler und Verbesserungsvorschläge an [email protected] Inhaltsverzeichnis Vorwort i Literatur ii 1 Aussagen und Mengen 1.1 Aussagen und ihre Verknüpfungen 1.2 Mengen . . . . . . . . . . . . . . . 1.3 Alphabete . . . . . . . . . . . . . . 1.4 Relationen . . . . . . . . . . . . . . 1.5 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 5 9 11 13 2 Graphen 2.1 Definition und Diagramme . . 2.2 Wege, Kreise, Zusammenhang 2.3 Planare Graphen . . . . . . . 2.4 Bäume . . . . . . . . . . . . . 2.5 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 19 22 24 25 . . . . . . . . . . . . . . . 3 Algorithmen und Programme 3.1 Algorithmen . . . . . . . . . . . . . . . 3.2 Programme und Programmiersprachen 3.3 Ordnung und Listen . . . . . . . . . . 3.4 Sortieren . . . . . . . . . . . . . . . . . 3.5 Computerzahlen . . . . . . . . . . . . 3.6 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 28 30 31 33 36 4 Abbildungen 4.1 Definitionen . . 4.2 Permutationen 4.3 Metriken . . . . 4.4 Isomorphismen 4.5 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 39 45 49 50 5 Zählen 5.1 Natürliche Zahlen . 5.2 Induktion . . . . . 5.3 Abzählen . . . . . 5.4 Rekursion . . . . . 5.5 Primzahlen . . . . 5.6 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 52 55 58 60 62 64 . . . . . 1 6 Elementare Arithmetik 6.1 Ganze Zahlen . . . . . . . 6.2 Teilbarkeit . . . . . . . . . 6.3 Euklidischer Algorithmus 6.4 Modulare Arithmetik . . . 6.5 Pseudozufallszahlen . . . 6.6 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Polynome und ihre Nullstellen 7.1 Polynome . . . . . . . . . . . . . . . . . 7.2 Nullstellen von Polynomen formelmäßig 7.3 Determinanten und Eigenwerte . . . . . 7.4 Fundamentalsatz der Algebra . . . . . . 7.5 Übungen . . . . . . . . . . . . . . . . . . 8 Zufall 8.1 Laplace–Häufigkeiten . . . . . . 8.2 Kombinatorische Überlegungen 8.3 Bedingte Wahrscheinlichkeiten 8.4 Das Ziegenproblem . . . . . . . 8.5 Markov–Ketten . . . . . . . . . 8.6 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 65 67 69 74 75 80 . . . . . 81 81 85 88 90 93 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 94 99 102 104 106 110 9 Modellierung 9.1 Wissenschaft . . . . . . . . . . . 9.2 Modelle . . . . . . . . . . . . . . 9.3 Mathematische Modellierung . . 9.4 Simulation . . . . . . . . . . . . . 9.5 Zur Mendelschen Vererbungslehre 9.6 Das Fallgesetz von Galilei . . . . 9.7 Gutgestelltheit – Wellposedness . 9.8 Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 111 112 113 114 115 117 119 120 2 Vorwort Die Lehrveranstaltung Grundlagen der Computernutzung“ ist ein Teil des Moduls Rechnerun” ” terstützung in der Mathematik“ im 1. Studienjahres des Bachelorstudiengangs Mathematik“, ” der im Wintersemester 2006/07 an der Johann Wolfgang Goethe-Universität neu aufgenommen wurde. Es ist die zweite Auflage einer Lehrveranstaltung dieses Titels, dieser Art und Form. Inhalt und Umsetzung sind daher noch mehr oder minder im Experimentierstadium. Die Lehrveranstaltung beinhaltet in einem mathematischen Teil Grundlagen für die Analyse, algorithmische Aufbereitung und Simulation einfacher Sachverhalte der Analysis, Linearen Algebra und damit in Verbindung stehender Anwendungen. Mit der Vorlesung sollen mehrere Ziele verfolgt werden: (1) Erlernen algorithmischen Handelns (2) Kennenlernen von einfachen Algorithmen im Kontext der Analysis und der Linearen Algebra (3) Zuhilfenahme des Computer-Algebra-Systems Maple (4) Einbeziehung des Mathematik-tauglichen“ Textverarbeitungssystems LATEX ” (5) Erste Schritte bei der Anwendung von Mathematik als Modellierungsinstrument Aus den Zielen sollte klar werden, dass es sich bei der Vorlesung weder um einen Programmierkurs noch um einen die Vorlesungen Analysis, Lineare Algebra“ begleitenden Rezeptkurs ” handelt. Es werden wesentliche Inhalte der Analysis und Linearen Algebra algorithmisch aufbereitet und Konzepte vorbereitet, die in Vorlesungen zur Numerischen und Diskreten Mathematik und über schnelle Algorithmen im Zentrum stehen. Wie oben angedeutet, ist algorithmisches Handeln und Modellierung ein Teil der Betrachtungen. Algorithmen sind sequentielle Handlungsanweisungen“ zur Lösung eines (in mathemati” scher Sprache formulierten) Problems. Die Abarbeitung der Handlungsanweisungen erfolgt meist mit dem Computer unter Nutzung von Programmiersprachen und Programmpaketen; hier nutzen wir ausschließlich Maple. Wir werden keine Theorie von Algorithmen formulieren sondern die wesentlichen Aspekte algorithmisches Handeln ausschließlich an Beispielen erläutern. Modelle sind mathematische Abstraktionen einer Fragestellung/eines Phänomens mit dem Ziel, mathematische Methoden zur Analyse und Algorithmen zur Lösung anwenden zu können. Wir skizzieren dies an Hand einfacher Beispiele; Literatur zu diesem Aspekt [13, 8, 14, 17, 12]. Dieses Skriptum erfasst den mathematischen Teil der Lehrveranstaltung, die Skripten zu Maple und LATEX finden sie hier: www.math.uni-frankfurt.de/∼mkreth/gnr www.math.uni-frankfurt.de/∼pbauer/gnr Frankfurt, im Oktober 2007 Johann Baumeister i Literaturverzeichnis [1] Aigner, M., Ziegler, G.M., Proofs from THE BOOK Springer, New York, 1998 [2] Argyris, J., Faust, G., Haase, M. Die Erforschung des Chaos Vieweg–Verlag, 1993 [3] Aulbach, B. Gewöhnliche Differentialgleichungen Spektrum, 1997 [4] Bamberg, P., Sternberg, S. A Course in Mathematics for Students of Physics Cambridge University Press, 1990 [5] Braun, M., Meise, R. Analysis mit Maple Vieweg, 1995 [6] Braun, M. Differential Equations and Applications Springer, 1996 [7] Ebbinghaus, H.D., u.a. Zahlen Springer, New York, 1988 [8] Ebenhöh, W. Einführung in die mathematische Modellierung [9] Forster, O., Analysis 1 Vieweg, Braunschweig, 1976 [10] Forster, O., Analysis 2 Vieweg, Braunschweig, 1976 [11] Forster, O., Algorithmische Zahlentheorie Vieweg, Braunschweig, 1979 [12] Fulford, G., Forrester, P., Jones, A., Modelling with Differential and Difference Equations Cambridge University Press, Cambridge 1997 [13] Grüne, L. Modellierung mit Differentialgleichungen http://www.math.uni-bayreuth.de/departments/math/∼lgruene/ [14] Ortlieb, C.P. Exakte Naturwissenschaft und Modellbegriff Hamburger Beiträge zur Modellierung und Simulation, Universität Hamburg, 2000 [15] Russio, L. Die vergessene Revolution Springer, 2003 [16] Scheid, H., Einführung in die Zahlentheorie Klett Verlag, Stuttgart, 1972 [17] Sonar, T., Angewandte Mathematik, Modellbildung und Informatik Vieweg, Braunschweig 2001 [18] Walter, W. Gewöhnliche Differentialgleichungen Springer, 1972 [19] Werner, W., Mathematik lernen mit Maple 1 dpunkt–Verlag, 1996 [20] Werner, W., Mathematik lernen mit Maple 2 dpunkt–Verlag, 1998 ii Kapitel 1 Aussagen und Mengen Für die Formulierung von Aussagen von mathematischem Gehalt benötigen wir Verabredungen, Sprechweisen, Symbole und eine griffige Notation. Dabei wollen wir aber nicht in die Tiefen der mathematischen Grundlagen (Mengenlehre, Logik) eintauchen, sondern geben uns mit einem naiven“ Standpunkt zufrieden. Er führt zu keinerlei Konflikten, solange wir uns mit konkret ” definierten Objekten beschäftigen. 1.1 Aussagen und ihre Verknüpfungen Argumentationen in der Mathematik beruhen darauf, dass ein Zusammenhang zwischen Aussagen hergestellt wird, dass Aussagen verknüpft werden. Was eine Aussage sein soll, halten wir in einer Definition fest, die umgangssprachlich formuliert ist. Definition 1.1.1 Eine Aussage ist eine sprachliche Feststellung, die entweder wahr oder falsch ist. Falsch bzw. wahr charakterisiert man dabei durch einen Wahrheitswert: (w) steht für wahr, (f ) steht für falsch. In der obigen Definition“ spiegelt sich das aristotelische1 Prinzip des tertium non datur ” wieder: eine Aussage ist entweder wahr oder falsch, eine dritte Möglichkeit gibt es nicht. Beispiele: 1. 2. 3. 4. 5. 6. 2 ist eine gerade Zahl 1004 ist durch 3 teilbar Brasilien ist ein Entwicklungsland Die Straße X ist nass Das Dreieck ABC ist gleichschenklig 2999999991 − 1 ist eine Primzahl Die erste Aussage ist wahr, die zweite Aussage ist falsch, wenn wir eine Definition von Teilbarkeit unterstellen; der Wahrheitsgehalt der dritten Aussage hängt von einer Definition eines Entwicklungslandes ab; die vierte Aussage kann auf ihren Wahrheitsgehalt mit physikalischen“ Mitteln ” geprüft werden; ob die fünfte Aussage wahr ist, ist offen, solange keine exakte Definition und Beschreibung des konkreten Dreiecks vorliegt; der Wahrheitsgehalt der letzten Aussage ist offen: 2999999991 − 1 ist eine Primzahl oder sie ist keine, die Instanz“, die dies (schnell) entscheiden ” kann, ist wohl noch zu finden. Als erstes Aussagenkonstrukt betrachten wir die Verneinung/Negation einer Aussage. Konkret: Ist P eine Aussage, so bezeichnen wir mit ¬P die Negation der Aussage P ; es ist 1 Aristoteles von Stagira (384-322 v. Chr.) 1 KAPITEL 1. AUSSAGEN UND MENGEN 1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN also P wahr genau dann, wenn ¬P falsch ist. Man bezeichnet die Negation als einstellige Verknüpfung“, benötigen wir doch dabei nur eine Aussage. Logische Verknüpfungen, bei denen ” zwei Aussagen beteiligt sind, nennen wir zweistellige oder binäre Aussageverknüpfungen. Die Aussageverknüpfungen werden – in streng mathematischen Sinne – in der boolschen2 Algebra zusammengefasst. In der folgenden Tabelle fügen wir logische Operatoren, wie sie in Maple nutzbar sind, ein. Durch logische VerOperation Sprechweise Symbol Maple knüpfung zweier Aussagen P,Q ensteht eiNegation nicht . . . ¬ &not ne dritte Aussage R, Konjunktion . . . und . . . ∧ &and eine sogenannte verbundene Aussage. Alternative . . . oder . . . ∨ &or Um den WahrheitsgeImplikation wenn . . ., dann . . . =⇒ &implies halt dieser verbundenen Aussage geht es . . . genau dann, wenn . . . ⇐⇒ &iff Äquivalenz dann. Bestimmt wird die Aussage R dadurch, welcher Wahrheitswert ihr für die verschiedenen Belegungen mit (w) und (f) der Aussagen P und Q zukommt. Die folgende Wahrheitstafel zeigt, wie die oben angeführten Aussageverknüpfungen definiert sind: P Q P ∧ Q P ∨ Q P =⇒ Q P ⇐⇒ Q (w) (w) (w) (w) (w) (w) P ¬P (w) (f) (f) (w) (f) (f) (w) (f) (f) (w) (f) (w) (w) (f) (f) (w) (f) (f) (f) (f) (w) (w) Man beachte insbesondere die Wahrheitstafel zu P =⇒ Q: Ist P falsch, so ist die Implikation P =⇒ Q wahr, unabhängig vom Wahrheitsgehalt von Q. Die Wahrheitstafel der Negation ist angefügt. Maple - Illustration 1.1 Maple kennt den Datentyp boolsche Variable und hat die einfachen logischen Operationen &and, &or, &not ständig verfügbar. Eine Aussage ist eine Tautologie, wenn sie unabhängig vom Wahrheitswert der zu Grunde liegenden Literale“ immer ” wahr wird. > with(logic): > x:=3: evalb(5*xˆ3-200>0); false > tautology((&and(a,b) &or (&not a) &or (&not b)); true Mit den nun eingeführten Verknüpfungen stehen uns schon eine große Anzahl von Aussagenkonstrukten zur Verfügung. Halten wir einige logische Gesetze fest: 2 George Boole, 1815-1864, Mathematiker Stand: 9. Februar 2010 2 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN Regel 1.1.2 Seien P, Q Aussagen. (P =⇒ Q) ¬(P ∧ Q) ¬(P ∨ Q) (P =⇒ Q) ⇐⇒ (¬Q =⇒ ¬P ) ⇐⇒ ¬P ∧ ¬Q ⇐⇒ (1.1) ¬P ∨ ¬Q ⇐⇒ (1.2) (1.3) (¬P ∨ Q) (1.4) Von der Richtigkeit dieser Aussagen überzeugen wir uns, indem wir die Wahrheitstafeln erstellen. Etwa zu (1.1): P =⇒ Q ¬ Q ¬ P ¬ Q =⇒ ¬ P (P =⇒ Q) ⇐⇒ (¬ Q =⇒ ¬ P) P Q (w) (w) (w) (f) (f) (w) (w) (w) (f) (f) (w) (f) (f) (w) (f) (w) (w) (f) (w) (w) (w) (f) (f) (w) (w) (w) (w) (w) Die Wahrheitstafel zu P =⇒ Q ist identisch mit der Wahrheitstafel zu ¬ P ∨ Q, wie man leicht verifiziert. Die Aussage ¬ P ∨ Q vermeidet also das der Umgangssprache nahestehende “folgt“ in P =⇒ Q. Regel 1.1.3 Seien P,Q,R Aussagen. P ∧ Q P ∨ Q ⇐⇒ Q ∧ P ⇐⇒ (1.5) Q ∨ P (1.6) (P ∧ Q) ∧ R ⇐⇒ P ∧ (Q ∧ R) (1.7) P ∧ (P ∨ Q) ⇐⇒ P (1.9) P (1.10) (P ∧ Q) ∨ (P ∧ R) (1.11) (P ∨ Q) ∨ R P ∨ (P ∧ Q) P ∧ (Q ∨ R) P ∨ (Q ∧ R) ⇐⇒ P ∨ (Q ∨ R) ⇐⇒ ⇐⇒ ⇐⇒ (1.8) (P ∨ Q) ∧ (P ∨ R) (1.12) Die Gültigkeit von (1.5) , . . . , (1.12) belegt man wieder mit Hilfe von Wahrheitstafeln. Etwa zu (1.11) in nicht vollständiger Aufzählung: P Q R Q ∨ R P ∧ (Q ∨ R) P ∧ Q P ∧ R (P ∧ Q) ∨ (P ∧ R) (w) (w) (f) (w) (w) (w) (f) (w) (w) (f) (w) (w) (w) (f) (w) (w) (f) (w) (w) (w) (f) (f) (f) (f) (f) (f) (f) (f) (f) (f) (f) (f) Sprechweisen: (1.5), (1.6) (1.7), (1.8) (1.9), (1.10) (1.11), (1.12) Stand: 9. Februar 2010 Kommutativgesetze Assoziativgesetze Verschmelzungsgesetze Distributivgesetze 3 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN In Definitionen weisen wir mathematischen Objekten manchmal Eigenschaften mit einem definierenden Äquivalenzzeichen “ : ⇐⇒ ,“ zu, etwa: Objekt O hat Eigenschaft E : ⇐⇒ Eine Aussage A über das Objekt O , die äquivalent mit dem Eintreten der Eigenschaft E ist, ist wahr (gilt). Ein Satz, Lemma, eine Folgerung, . . . ist die Ausformulierung einer mathematischer Aussage, die wahr ist. Meist stellt sich diese Ausformulierung so dar, dass aus einer Voraussetzung V eine Behauptung B gefolgert werden soll; V, B sind selbst mathematische Aussagen. Ein Beweis eines Satzes mit Voraussetzung V und Behauptung B ist also eine Kette von Implikationen, ausgehend von der Aussage V bis zur Aussage B: V =⇒ . . . =⇒ B Die Regel (1.1) sagt uns, dass wir den Beweis auch führen können, indem wir die Gültigkeit von V =⇒ B dadurch zeigen, dass wir ¬B =⇒ ¬V nachweisen; Beweis durch Kontraposition). Der Widerspruchsbeweis basiert auf der Regel (1.4) zusammen mit (1.3). Er stellt sich so dar: V ∧ ¬B =⇒ . . . =⇒ Q Hierbei ist mit Q dann eine Aussage erreicht, die nicht wahr ist. Der Beweis durch Fallunterscheidung kann angewendet werden, wenn sich die Voraussetzung V als V1 oder V2 formulieren läßt. Dann reicht es die Fälle V1 =⇒ B und V2 =⇒ B zu zeigen, wie eine Wahrheitstafel sofort zeigt. Dem Nachweis von Euklid3 , dass spruchbeweises zugrunde: √ 2 nicht rational ist, liegt die Beweistechnik des Wider- V : a ist eine Zahl mit a2 = 2 B: a ist eine Zahl, die nicht rational ist √ Aus der Annahme V ∧ ¬B, also der Annahme, dass 2 eine rationale Zahl ist, leiten wir durch logisches Schließen (gültige Aussageverknüpfungen) eine Aussage ab, die nicht wahr ist. Also kann die Annahme V ∧ ¬B nicht wahr sein; V =⇒ B ist also wahr. Wir kommen auf diesen Beweis zurück, wenn wir etwas mehr über rationale und irrationale Zahlen Bescheid wissen. Bemerkung 1.1.4 Beweise führt man, u. a. dazu, (-) sich selbst zu überzeugen, dass man richtig überlegt hat; (-) andere Mathematiker zu überzeugen, dass die Aussage eines Satzes, Lemmas, . . . zutrifft; (-) den inneren Aufbau eines mathematischen Gebäudes zu erläutern. Einen Beweis zu finden, erfordert oft ein großes Maß an Intuition und Vorstellungsvermögens. 3 Euklid, 365(?) – 300(?), Mathematiker“ ” Stand: 9. Februar 2010 4 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.2 1.2. MENGEN Mengen Den Begriff der Menge wollen und können wir hier ebenso wie die obige Aussagenlogik“ nicht ” im strengen Sinne der mathematischen Grundlagen einführen. Er dient uns nur als Hilfsmittel für eine möglichst kurze Notation von konkreten Mengen. Von G. Cantor,4 dem Begründer der Mengenlehre, haben wir folgende Definition: Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer Anschauung oder unseres Denkens – welche Elemente der Menge genannt werden – zu einem Ganzen. Diese Begriffsbildung hat die Mathematik tief beeinflusst. Eine Menge besteht also aus Elementen, kennt man alle Elemente der Menge, so kennt man die Menge. Beispiele, die wir noch genauer studieren werden, sind: N := Menge der natürlichen Zahlen Z := Menge der ganzen Zahlen Q := Menge der rationalen Zahlen R := Menge der reellen Zahlen . Mit den natürlichen Zahlen 1, 2, 3, . . . sind wir schon (aus der Schule) wohlvertraut. Später gehen wir etwas struktureller darauf ein. Man kann eine Menge dadurch bezeichnen, dass man ihre Elemente zwischen zwei geschweifte Klammern (Mengenklammern) schreibt. Die Zuordnung eines Elements zu einer Menge erfolgt mit dem Zeichen “ ∈ “. Gehört ein Objekt x nicht zu einer Menge M, so schreiben wir x ∈ / M. Es hat sich als zweckmäßig erwiesen, den Mengenbegriff so aufzufassen, dass eine Menge aus gar keinem Element bestehen kann. Dies ist dann die leere Menge, das Zeichen dafür ist ∅ . Beispielsweise ist die Menge der rationalen Zahlen, deren Quadrat gleich 2 ist, leer. Dies wissen √ wir aus der Anmerkung über die Irrationalität von 2 . Das Hinschreiben der Elemente einer Menge kann auf zweierlei Weisen geschehen. Hat die Menge nur ganz wenige Elemente, so kann man sie einfach alle hinschreiben, durch Kommata getrennt, auf die Reihenfolge kommt es dabei nicht an und eine Mehrfachnennung ist nicht von Bedeutung, etwa: {1, 2, 3} = {2, 3, 1} = {3, 3, 1, 2} . Abgekürzt verfährt man oft auch so: Elemente, die man nicht nennt aber gut kennt, werden durch Punkte angedeutet, etwa: {1, 2, 3, 4, 5, 6, 7, 8} = {1, 2, . . . , 8} = {1, . . . , 8} . Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Umfangsdefinition. Die zweite Möglichkeit besteht darin, Objekte einer Menge als Elemente dadurch zuzuordnen, dass man ihnen eine charakterisierende Eigenschaft zuweist. Ist E eine Eigenschaft, die jedes Objekt x einer Menge M hat oder nicht hat, so bezeichne {x ∈ M |x hat die Eigenschaft E} die Menge aller Elemente von M , die die Eigenschaft E haben; etwa KO := {x ∈ Obst|x Kernobst} UNO := {x ∈ Länder|x Mitglied der UNO} 4 Georg Cantor, 1845-1918, Mathematiker Stand: 9. Februar 2010 5 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.2. MENGEN Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Inhaltsdefinition. Wichtig beim Hinschreiben von Mengen ist, dass stets nachgeprüft werden kann, ob ein spezielles Objekt einer in Frage stehenden Menge angehört oder nicht; in der Definition von Cantor ist dies festgehalten. Dies korrespondiert mit dem ausgeschlossenen Dritten bei Aussagen. Bei J.A. Poulos5 lesen wir: ... Ähnlich ist es mit der Notation der Mengenlehre. Sie ist so einfach, dass sie schon an der Grundschule gelehrt werden kann. Was manchmal seitenlang in einem Vorwort zu einem Lehrbuch steht, passt schon in ganz wenige Sätze: Mit p ∈ F wird ausgedrückt, dass p ein Element der Menge F ist, und mit F ⊂ G, dass jedes Element von F ebenso ein Element von G ist. Haben wir zwei Mengen A und B, dann ist A ∩ B die Menge, die jene Elemente enthält, die sowohl zu A als auch zur Menge B gehören; mit A ∪ B ist die Menge gemeint, die jene Elemente enthält, die zur Menge A, B oder zu beiden gehören; und A′ ist die Menge jener Elemente, die nicht zu A gehören. Eine Menge, die keine Elemente enthält, ist eine leere Menge und wird mit ∅, manchmal auch mit {} angegeben, geschweifte Klammern ohne Inhalt. Ende des Mini-Kurses. Was uns von den Begriffen aus dem obigen Minikurs noch nicht begegnet ist, bringen wir noch in eine anständige“ Form: ” Definition 1.2.1 Seien A, B Mengen und sei z irgendein Objekt. (a) A ⊂ B : ⇐⇒ (x ∈ A =⇒ x ∈ B) Damit ist die Teilmengeneigenschaft/Inklusion ⊂ definiert. (b) A = B : ⇐⇒ (A ⊂ B und B ⊂ A) (c) z ∈ A ∩ B : ⇐⇒ (z ∈ A und z ∈ B) . Damit ist der Durchschnitt A ∩ B definiert: A ∩ B := {x|x ∈ A und x ∈ B} (d) z ∈ A ∪ B : ⇐⇒ (z ∈ A oder z ∈ B) . Damit ist die Vereinigung A ∪ B definiert: A ∪ B := {x|x ∈ A oder x ∈ B} Das Symbol “ := “ haben wir als definierendes Gleichsetzen von Mengen eingeführt. Es korrespondiert mit dem Symbol “: ⇐⇒ “. Definition 1.2.2 Sei A eine Menge. Die Potenzmenge von A ist die Menge der Teilmengen von A einschließlich der leeren Menge: P OT (A) := {B|B ⊂ A} . Beispiel 1.2.3 Sei A := {p, q, r}. Wie sieht die Potenzmenge P OT (A) aus? Wir haben P OT (A) = {∅, {p}, {q}, {r}, {p, q}, {q, r}{p, r}, {p, q, r}} Wir stellen fest, dass die Menge A drei und die Menge P OT (A) 8 = 23 Elemente enthält. Dies hat dazugeführt, dass man P OT (A) auch als 2A schreibt, und die Bezeichung Potenzmenge“ ” leitet sich daraus ab. 5 Poulos, J.A.: Von Algebra bis Zufall, Campus, Frankfurt, 1992 Stand: 9. Februar 2010 6 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.2. MENGEN Maple - Illustration 1.2 > M:= {2,3,rot,Hahn,rot} ; A:={Hut,Hahn,†}; Maple kennt den Datentyp Menge. Eine Menge ist eine in geschweifte Klammern eingeschlossene Folge von Ausdrücken, Objekten; Mehrfachnennungen werden unterdrückt. Die gängigen Operationen mit endlichen Mengen sind durchführbar. Aufzählende Definition, Element von, Durchschnitt und Vereinigung von Mengen sind handhabbar. M:= {2,3,rot,Hahn} A:={Hut,Hahn,†} > member(rot,M); true > M intersect A; {Hahn} Mitunter wollen wir eine Bezeichnung für diejenigen Elemente haben, die eine gewisse Eigenschaft nicht haben. Dies ist Inhalt von Definition 1.2.4 Seien A, B Teilmengen von U . (a) A\B := {x ∈ A|x ∈ / B} heißt das relative Komplement von B in A . (b) ∁A := U \A heißt das Komplement von A (in U ). (In der Definition (b) steht U für die (universelle) Grundmenge, auf die wir uns bei der Komplementbildung beziehen.) Ein bequemes Hilfsmittel beim Nachdenken über Mengen sind die Venn–Diagramme, bei denen in der Zeichenblattebene Gebiete zur Darstellung von Mengen benutzt werden: Durch Kurven umschlossene Gebiete stellen Mengen A, B, . . . dar. Solche Darstellungen sind gut geeignet, formale Argumente für einen zu beweisenden Sachverhalt zu finden. A B (a) Teilmenge A B (b) Vereinigung A B (c) Durchschnitt Abbildung 1.1: Venn–Diagramme Die Nützlichkeit der leeren Menge ∅ wird deutlich bei der Definition des Durchschnitts. Hier ist ja der Fall, dass A ∩ B kein Element enthält, sicherlich nicht auszuschließen, wie uns ein geeignetes Venn–Diagramm sofort lehrt. Zwei Mengen, deren Durchschnitt leer ist, heissen disjunkt. Stand: 9. Februar 2010 7 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.2. MENGEN Regel 1.2.5 Seien A, B, C Mengen. A ⊂ B, B ⊂ C A ∪ (B ∪ C) =⇒ = A∩B = A∪B = A ∩ (B ∪ C) = A ∪ (B ∩ C) (A ∪ B) ∪ C = A ∩ (B ∩ C) A⊂C (1.14) (A ∩ B) ∩ C (1.15) B∩A (1.17) B∪A (1.16) (A ∩ B) ∪ (A ∩ C) (1.18) (A ∪ B) ∩ (A ∪ C) = (1.13) (1.19) Beweis von (1.18): Wir haben zu zeigen: A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C), (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) . Sei x ∈ A ∩ (B ∪ C). Dann gilt: x ∈ A, x ∈ B ∪ C . Daraus folgt: x ∈ A ∩ B oder x ∈ A ∩ C, je nachdem, ob x ∈ B und/oder x ∈ C. Daraus schließen wir: x ∈ (A ∩ B) ∪ (A ∩ C). Für den Beweis der anderen Inklusion lese man die eben vorgeführten Beweisschritte rückwärts. Sprechweisen: (1.13) (1.14), (1.15) (1.16), (1.17) (1.18), (1.19) Transitivität Assoziativgesetze Kommutativgesetze Distributivgesetze. Definition 1.2.6 Seien A, B Mengen. (a) Sind a ∈ A, b ∈ B, so heißt (a, b) das damit gebildete geordnete Paar (bezogen auf die Reihenfolge “zuerst A, dann B“). (b) Zwei Paare (a, b), (a′ , b′ ) mit a, a′ ∈ A, b, b′ ∈ B, heißen gleich genau dann, wenn a = a′ , b = b′ gilt. (c) Die Menge A × B := {(a, b)|a ∈ A, b ∈ B} heißt das kartesische Produkt der Faktoren A, B . Mit geordneten Paaren notieren wir etwa die kartesischen Koordinaten (Vielfache der Einheitsstrecke) eines Punktes in der Ebene: wir kommen darauf zurück.6 Beispiel 1.2.7 Z2 := {(x, y)|x, y ∈ Z} ist die Menge aller Punkte der Ebene mit ganzzahligen Koordinaten. Solche Punkte heißen auch Gitterpunkte“ der Ebene. Analog ist Z n die Menge ” aller Gitterpunkte des Rn . Regel 1.2.8 Seien A, B, C Mengen: A × (B ∪ C) = (A × B) ∪ (A × C) . A × (B ∩ C) = (A × B) ∩ (A × C) . (1.20) (1.21) 6 Da René Descartes, 1596-1650, sehr erfolgreich die Koordinatisierung algebraischer Probleme betrieben hat, ist die Bezeichnung kartesisch“ wohl angebracht. ” Stand: 9. Februar 2010 8 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.3. ALPHABETE Diese Regeln bestätigt man ganz leicht. Nehmen wir uns die Regel (1.20) vor und beweisen eine der Inklusionen, die es zu beweisen gilt: A × (B ∪ C) ⊂ (A × B) ∪ (A × C) . Sei x ∈ A × (B ∪ C) . Dann gibt es a ∈ A, d ∈ B ∪ C mit x = (a, d) . Nach Definition von B ∪ C bedeutet dies x = (a, d) mit a ∈ A, d ∈ B, oder x = (a, d) mit a ∈ A, d ∈ C . Also x ∈ A × B oder x ∈ A × C . Es ist klar, dass wir das kartesische Produkt auf mehr als zwei Faktoren“ ausdehnen können. ” Etwa korrespondiert ein (gültiger) Lottoschein mit den Elementen der Menge {x = (x1 , x2 , x3 , x4 , x5 , x6 ) ∈ Z × · · · × Z|x1 , . . . , x6 sind paarweise verschieden}; dabei ist Z = {1, 2, 3, . . . , 49}. Ein Element (x1 , . . . , x6 ) der Menge nennt man ein 6-Tupel. Das mehrfache kartesische Produkt einer Menge A erhält eine Kurzschreibweise, nämlich An := A · · × A} := {x = (x1 , . . . , xn )| alle xi ∈ A} . | × ·{z n−mal Ein Element x = (x1 , . . . , xn ) der Menge An nennt man ein n-Tupel. Eine Menge kann endlich viele Elemente haben oder unendlich viele. Hier begnügen wir uns mit einer Definition der Endlichkeit“, die aus unserer Erfahrung heraus sehr wohl geeignet ist; ” später, wenn wir uns mit Abbildungen beschäftigt haben, bessern wir nach: Eine Menge heißt endlich, wenn jedem Element der Menge der Reihe nach die Zahlen 1, 2, . . . , N zugeordnet werden kann, wobei mit N dann allen Elementen eine Zahl zugeordnet ist. Eine Menge heißt unendlich, wenn sie nicht endlich ist. Eine endliche Menge {x1 , . . . , xn } hat somit n Elemente, wenn alle xi paaarweise verschieden sind. Die Anzahl der Elemente einer Menge M bezeichnen wir so: #M . 1.3 Alphabete Alphabete sind ein zentraler Begriff der theoretischen Informatik im Zusammenhang mit Grammatiken und Verschlüsselungsverfahren. Definition 1.3.1 Sei A eine nichtleere Menge. A∗ bezeichne die Menge der endlichen Tupel von Elementen von A, also x ∈ A∗ genau dann, wenn x = () oder x ∈ An für ein n ∈ N, . Die Elemente von A∗ werden A–Wörter – in der Informatik A–Strings – genannt, das Symbol () bezeichnet das so genannte leere Wort (leeres Tupel). (Wörter sind Bausteine von Sprachen.) Die Menge A wird in diesem Zusammenhang ein Alphabet genannt; die Elemente von A sind der Zeichenvorrat für die Wörter. Einem Element w ∈ A∗ mit w ∈ An wird die Länge n zugesprochen; wir nennen es ein n–Wort; das leere Wort () hat die Länge 0. Im Spezialfall A = {0, 1} spricht man bei A∗ von binären Worten. In der obigen Definition haben wir Wörter als Tupel definiert. Im Kontext von Alphabeten und deren Wörter läßt man in der Tupel-Schreibweise begrenzende runde Klammern und trennende Kommata weg: x = x1 x2 . . . xn ist ein Wort der Länge n . Damit ist die Bezeichnung String“ in der Informatik auch erklärt. ” Stand: 9. Februar 2010 9 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN Beispiel 1.3.2 BAUM 1234 01001 − − •− : : : : 1.3. ALPHABETE Deutsches Alphabet {A,B,C, . . . , X,Y,Z,Ä,Ü,Ö} Dezimalziffern-Alphabet {0,1,2,3,4,5,6,7,8,9} Binäres Alphabet {0, 1} Morsealphabet {−, •, ⊔} (− − •− steht für “q“) Bemerkung 1.3.3 Sei X = {x1 , . . . , xn } eine Menge mit n Elementen. Jeder Teilmenge A von X, d.h. jedem Element der Potenzmenge von X, entspricht eindeutig ein n−Wort aus dem Alphabet {0, 1} : 1 , falls xi ∈ A A ←→ b1 b2 . . . bn , wobei bi = 0 , falls xi 6∈ A Also ist die Anzahl der Elemente von P OT (X) gleich der Anzahl der möglichen binären n−Worte. Diese können wir so abzählen: Es gibt wn n−Wörter und wn+1 (n + 1)−Wörter. Wir sortieren“ die (n + 1)−Wörter nach dem ” 1. Buchstaben: genau wn Wörter beginnen mit 0, genau wn Wörter beginnen mit 1. Daher gilt: wn+1 = 2 · wn , w1 = 2 . Daraus folgt die Formel wn = 2n , n ∈ N, . (Wir haben hier eine Art Induktionsbeweis“ aufgeschrieben; dazu später.) ” Bemerkung 1.3.4 Es gilt heute als gesicherte Tatsache, dass die Erbanlagen von Pflanzen und Tieren durch die DNS (Desoxyribonukleinsäure) in den Chromosomen übertragen werden. Man konnte zeigen, dass die DNS aus einer langen Kette besteht, die aus 4 Bausteinen, die durch die Buchstaben A,T,G,C dargestellt werden, aufgebaut ist. Hier ist ein Ausschnitt: ATGGCAAGTTACA. . . Vererbung besteht daher aus langen Nachrichten, die in Worten (Strängen) aus einem Vierbuchstabenalphabet geschrieben werden können; das Ergebnis einer Genom–Analyse ist also so hinschreibbar. Die Übertragung von Nachrichten geschieht mittels durch Hardware realisierter mechanischer oder elektronischer Impulse. Telefon, Morseapparat, Telegraph, Funkgerät sind Instrumente der Nachrichtenübermittlung. Die Strecke (physikalische Verbindung), auf der die Übermittlung vor sich geht, bezeichnet man als Kanal. Zur Übertragung werden die Nachrichten in besonderer Weise vorbereitet. Eine erste Vorbereitung ist die sogenannte Quellencodierung, bei der eine Nachricht (einer natürlichen Sprache), die ein Sender an einen Empfänger übermitteln will, in einem vorgegebenen System, Code genannt, dargestellt wird. Quellencodierung bedeutet in der Regel, einer Nachricht x einer Gesamtheit X von Nachrichten ein Wort w, geschrieben in einem Alphabet A zuzuordnen. Ein eventuell so codiertes Wort des Senders geht nun über den Kanal an den Empfänger. Hier ergeben sich zwei wesentliche Probleme. Zum einen kann der Kanal Störungen ausgesetzt sein (atmosphärische Störungen bei Satelliten, . . . ), zum anderen können beabsichtigte Eingriffe (Lauschen, Stören, gezieltes Abändern, . . . ) von Unbefugten vorgenommen werden. Der erste Aspekt erfordert eine Technik, die Fehler erkennt und korrigiert, der zweite Stand: 9. Februar 2010 10 ASCII–Zeichen Codewort ⊔ (Zwischenraum) 00100000 0 00110000 1 00110001 2 00110010 ! 00100001 A 01000001 c J.Baumeister B 01000010 C 01000011 KAPITEL 1. AUSSAGEN UND MENGEN 1.4. RELATIONEN Aspekt eine Technik, die die Nachrichten für Unbefugte unlesbar macht. Die Methode für Abhilfe ist bei beiden Aspekten die gleiche: die Nachricht im Quellencode wird vor der Sendung über den Kanal einer Sicherheitsmaßnahme unterzogen; sie wird nochmals codiert. Diesen zweiten Schritt fasst man unter dem Stichwort Kanalcodierung zusammen. Auf der Empfängerseite hat man dann entsprechend zwei Decodierungsmaßnahmen zu treffen, die Kanaldecodierung und die Quellendecodierung. Beispiel 1.3.5 Beispiele für in der Praxis verwendete Codes sind: • ASCII–Code (American Standard Code for Information Interchange) Damit wird ein Alphabet, das aus Buchstaben, Ziffern und Sonderzeichen besteht, über dem Alphabet {0, 1} mit Wortlänge 8 codiert. Ein Ausschnitt ist in Abbildung 1.2 zu sehen. • Lochstreifencode Damit wird ein Alphabet aus Buchstaben und Sonderzeichen über dem Alphabet {0, 1} mit Wortlänge 5 dargestellt, physikalisch realisiert als Fünferkombination von gestanzten Löchern und ungestanzten Leerstellen im Lochstreifen. • Zeichensatzcode etwa bei LATE X. Damit wird ein Alphabet aus Buchstaben, Ziffern und Sonderzeichen über dem Alphabet der Ziffern {0, 1, . . . , 7} (oktal) mit Wortlänge 3 dargestellt. Ein Beispiel: 046 steht für & im Zeichensatz cmr10. Dabei ist cmr10 selbst wieder ein Codewort, dessen Bauart sich so erklärt: “cm“ steht für “Computer Modern“, “r“ steht für die Schriftart “Roman“, “10“ steht für die Entwurfsgröße. • ISBN (International Standard Book Number) Beispiel: 3 – 127 – 01901 – 7 (Die Zahl 3 steht für den deutschsprachigen Raum, 127 steht für den Verlag, 01901 steht für die Nummer des Buches in der internen Zählung des Verlages, 7 ist eine Prüfziffer, die so zustande kommt: 1 · 3 + 2 · 1 + 3 · 2 + 4 · 7 + 5 · 0 + 6 · 1 + 7 · 9 + 8 · 0 + 9 · 1 hat Rest 7 bei Teilung durch 11 Eine Prüfziffer 10 wird als X (römische 10) geschrieben.) • E A N (European Article Number/Strichcode) Beispiel: | ||| | || || | 1.4 Relationen Das Gleichheitszeichen “ = “ verwenden wir in einer Menge unter der stillschweigenden Annahme der folgenden Regeln: x = x ; (x = y =⇒ y = x) ; (x = y, y = z =⇒ x = z) . Dies nehmen wir zum Anlass für Definition 1.4.1 Sei X eine Menge. Eine Teilmenge R ⊂ X × X heißt Äquivalenzrelation auf X, falls (i) (x, x) ∈ R für alle x ∈ X (Reflexivität) (ii) (x, y) ∈ R =⇒ (y, x) ∈ R (Symmetrie) Stand: 9. Februar 2010 11 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.4. RELATIONEN (iii) (x, y), (y, z) ∈ R =⇒ (x, z) ∈ R (Transitivität) gilt. R Liegt mit R auf X eine Äquivalenzrelation vor, so schreiben wir für (x, y) ∈ R x ∼ y oder kurz x ∼ y , wenn R uns aus dem Zusammenhang klar ist. Die Bedeutung einer Äquivalenzrelation R auf X liegt darin, dass man damit die Menge X in Teilmengen (Klassen, Bündel) einteilen kann, eine Einteilung, die eventuell gröber ist, als die Aufteilung in einelementige Mengen, und die bezüglich eines Merkmales“ doch noch ” aussagekräftig ist. Die Einteilung geschieht durch R [x] := {y ∈ X|y ∼ x} , x ∈ X , und X/ R := {[x] | x ∈ X} . Die Objekte [x] heißen Äquivalenzklassen, x heißt Repräsentant der Klasse [x] . Man beR achte, dass jedes y ∈ X mit y ∼ x als Repräsentant für [x] Verwendung finden kann. Beispiel 1.4.2 Blutgruppen werden grob eingeteilt in A, AB, B, 0. Sei K eine Gruppe von Kindern. Wir erklären darauf eine Relation durch x ∼ y : ⇐⇒ x, y haben dieselbe Blutgruppe In der Tat liegt eine Äquivalenzrelation vor. Dadurch wird die Gruppe der Kinder in 4 Klassen eingeteilt. Beispiel 1.4.3 Man überlege sich, in welcher Weise, die Geraden in der Ebene durch eine Äquivalenzrelation in Klassen eingeteilt werden können. Lemma 1.4.4 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann sind mit x, y ∈ X folgende Bedingungen äquivalent: R (a) y ∼ x . (b) y ∈ [x] . (c) [y] ∩ [x] 6= ∅ . (d) [y] = [x] . (e) x ∈ [y] . (f ) x ∼ y. R Beweis: Wollten wir alle Äquivalenzen einzeln zeigen, müssten wir 10 Implikationen beweisen. Dies können wir wesentlich abkürzen durch einen Ringschluss: es genügt zu zeigen: (a) =⇒ (b) =⇒ (c) =⇒ (d) =⇒ (e) =⇒ (f ) =⇒ (a) . Dies tun wir nun. Beachte dabei, dass wegen der Reflexivität stets z ∈ [z] . (a) =⇒ (b) Dies folgt aus der Definition der Klasse [x] . (b) =⇒ (c) Klar, y ∈ [y] ∩ [x] . (c) =⇒ (d) Stand: 9. Februar 2010 12 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.5. ÜBUNGEN Sei z ∈ [y] ∩ [x] , d.h. z ∼ x, z ∼ y . Wir zeigen [z] = [x] = [y] . Es genügt dazu [z] = [y] zu zeigen, der Beweis der anderen Aussage verläuft völlig analog. Sei u ∈ [z] . Dann gilt u ∼ z, z ∼ y und daher mit der Transitivität u ∈ [y] . Sei v ∈ [y] . Dann gilt v ∼ y, z ∼ y und daher mit der Symmetrie und Transitivität u ∈ [z] . (d) =⇒ (e) Klar, denn x ∈ [x] . (e) =⇒ (f ) Dies folgt aus der Definition der Klasse [y] . (f ) =⇒ (a) Symmetrie von ∼ . R Das folgende Lemma zeigt, dass X durch “ ∼“ in disjunkte Klassen zerlegt wird. Lemma 1.4.5 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann gilt: (a) Für jedes x ∈ X gibt es [y] ∈ X/ R mit x ∈ [y] . (c) Zwei Äquivalenzklassen besitzen genau dann nichtleeren Durchschnitt, wenn sie gleich sind. Beweis: Zu (a). Klar: x ∈ [x] für alle x ∈ X wegen der Reflexivität von “∼“. Zu (b). Siehe Lemma 1.4.4. 1.5 1.) Übungen Verneine folgende Aussagen: (a) Wenn es regnet, ist die Straße nass. (b) Es gibt kein Tier, das genau ein Ohr und genau zwei Augen hat. (c) Alle Quadrate von ganzen Zahlen sind gerade. Was läßt sich über den Wahrheitsgehalt der Aussagen in (a), (b), (c) sagen? 2.) A, B, C, D sind vier Tatverdächtige. Genau einer unter ihnen ist der Täter. Beim Verhör machen sie folgende Aussagen: A: B ist der Täter B: D ist der Täter C,D: Ich bin nicht der Täter Wer ist der Täter, wenn (a) genau einer lügt, (b) genau einer die Wahrheit sagt ? 3.) Seien P, Q Aussagen. Stelle die Wahrheitstafel zu (a) ¬(P ∨ Q) ⇐⇒ ¬P ∧ ¬Q (b) P ∧ (P ∨ Q) ⇐⇒ P auf. 4.) (a) Fülle die folgende Wahrheitstabelle aus: P (w) (w) (f) (f) Stand: 9. Februar 2010 Q (w) (f) (w) (f) ¬P ¬Q (¬ P ∨ Q) 13 ¬ (¬ P ∨ Q) P ∧ ¬Q c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.5. ÜBUNGEN Was schließt man aus den beiden letzten Spalten? (b) Fülle die folgende Wahrheitstabelle aus: P (w) (w) (f) (f) Q (w) (f) (w) (f) P =⇒ Q (P =⇒ Q) ∨ P Was schließt man aus der letzten Spalte? 5.) Seien A, B Mengen. Zeige: (a) Zeige: P OT (A ∩ B) = P OT (A) ∩ P OT (B) (b) Zeige: P OT (A) ∪ P OT (B) ⊂ P OT (A ∪ B) (c) Ist sogar P OT (A ∪ B) = P OT (A) ∪ P OT (B) richtig ? 6.) Seien A, B Mengen. Welche Beziehung besteht zwischen A und B, falls A ∩ B = A oder A ∪ B = B gilt? 7.) Seien G, M Mengen und sei I ⊂ G × M . Zu A ⊂ G setze Aˆ:= {m ∈ M |(a, m) ∈ I für alle a ∈ A} . Zeige: (a) Bˆ⊂ Aˆ falls A ⊂ B . (b) A ⊂ Aˆˆ, Aˆ= Aˆˆˆ. (In der Literatur heisst ein solches Tripel (G, M, I) auch Kontext mit Gegenstandsmenge G, Merkmalen M und Inzidenz I .) 8.) Beweise für Mengen A, B, C : A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) . 9.) Die symmetrische Differenz von Mengen A und B ist definiert durch A △ B := {x ∈ A|x ∈ / B} ∪ {x ∈ B|x ∈ / A} Beweise für Mengen A, B, C : A △ (B △ C) = (A △ B) △ C. 10.) Seien A, B Mengen und definiere ((a, b)) := {{a}, {a, b}} , a ∈ A, b ∈ B . Zeige für a, p ∈ A, b, q ∈ B: ((a, b)) = ((p, q)) ⇐⇒ a = p, b = q . (Damit haben wir geordnete Paare neu definiert.) 11.) Zeige für Mengen A, B die Äquivalenz der folgenden beiden Aussagen: (a) A=B. (b) A ∪ B = A ∩ B . 12.) MAPLE: Was schliesst man aus der folgenden Sequenz? > with(logic) : > bequal((p &nand q) &nand r, p &nand (q &nand r)); false Stand: 9. Februar 2010 14 c J.Baumeister KAPITEL 1. AUSSAGEN UND MENGEN 1.5. ÜBUNGEN 13.) MAPLE: Gegeben seien die Mengen A := {a, b, c} und B := {c, d} . Berechne die Potenzmenge von A und teste, ob B eine Teilmenge von A ist. Hinweis: Berechne die Potenzmenge in einer Schleife. 14.) MAPLE: Zeige: (a) p &or q genau dann, wenn &nand (&nand(p, p), &nand(q, q)) . (b) &not p genau dann, wenn &nand(p, p) . 15.) MAPLE: Ermittle die Arbeitsfunktion des boolschen Operators &xor durch Erstellen einer Wahrheitstafel. Stand: 9. Februar 2010 15 c J.Baumeister Kapitel 2 Graphen Graphen bilden eine fundamentale Datenstruktur in der Diskreten Mathematik. Entstehung und Entwicklung der Graphentheorie waren weitgehend durch das Bemühen, eine Lösung des 4–Farbenproblems anzugeben, gekennzeichnet; siehe unten. Die Informatik ist heutzutage Motor der Entwicklung und erfolgreicher Abnehmer von Resultaten der diskreten Mathematik und insbesondere der Graphentheorie. Hier entwerfen wir eine kleine Skizze interessanter Fragestellungen.1 2.1 Definition und Diagramme Die einfachste Struktur auf endlichen Mengen wird von einer zweistelligen Relation erzeugt: Zwei Elemente einer Menge stehen in einer vorgegebenen Beziehung oder nicht. Mit dem Begriff des Graphen erfassen wir gerade diese Situation, wie wir noch sehen werden. Beginnen wir mit einem bestens bekannten Gra” phen“. Er hat 5 Ecken (◦) und 8 Kanten (—) und ist im Rythmus von Dies ist das Haus vom Ni–ko–laus in einem Zug auf das Papier zu zaubern, ohne zweimal eine Kante nachziehen zu müssen. Damit sind schon wesentliche Begriffe der Graphentheorie angesprochen. Definition 2.1.1 Ein Graph G = G(E, K) besteht aus einem Paar (E, K), wobei E eine nichtlee- Abbildung 2.1: Das Haus vom Nikolaus re Menge von Ecken und K eine Menge von Kanten ist und einer Vorschrift, die jeder Kante k ∈ K genau zwei (verschiedene oder gleiche) Ecken a, b ∈ E zuordnet, die wir Endecken von k nennen; ist a = b, so nennen wir k eine Schlinge bei a. Im Allgemeinen haben wir endliche Graphen im Blick, also Graphen, deren Eckenmenge eine endliche Menge ist. (Im englischen Sprachgebrauch spricht man bei Kanten von vertices oder nodes und bei Kanten von edges; daher G = G(V, E).) 1 Im Internet findet man ein ziemlich umfangreiches Skriptum unter: www2.informatik.hu-berlin.de/alcox/lehre/skripte/ga/ 16 KAPITEL 2. GRAPHEN 2.1. DEFINITION UND DIAGRAMME Ist G = G(E, K) ein Graph, so sagen wir, dass k ∈ K die Ecken a und b verbindet, wenn a, b Endecken von k sind; oft schreiben wir dafür k = {a, b} oder kurz k = ab . Ecken, die durch eine Kante verbunden sind, nennen wir benachbart. Eine Ecke, die zu keiner Kante Endecke ist, nennen wir isoliert. Sind zwei Ecken durch Kanten k1 , k2 , . . . , kn , n ≥ 2, verbunden, so heißen die Kanten k1 , . . . , kn Mehrfachkanten. Wir betrachten im Folgenden ausschließlich einfache Graphen, also solche, die weder Schlingen noch Mehrfachkanten besitzten. Abbildung 2.2: Vollständige Graphen Einen Graph veranschaulicht man sich am besten durch ein Diagramm, indem man die Ecken als Punkte der (Zeichen–)Ebene zeichnet und die Kanten als Kurven zwischen den Endpunkten zeichnet; hier wird die zweistellige Relation, die abstraktes Kernstück eines Graphen ist, deutlich. Dadurch ist auch die Bezeichnung Graph“ erklärt: das Ecken–Kanten–System erinnert an die ” graphische Darstellung von Funktionen. Beispiel 2.1.2 Hat man bei einem Graphen G(E, K) als Eckenmenge E = {1, . . . , n}, so kann man offenbar insgesamt 12 n(n−1) verschiedene Kanten einzeichnen. Da man nun zu jeder Kante 1 die Auswahl treffen kann, ob sie im Graphen vorkommen soll ja oder nein, gibt es 2 2 n(n−1) verschiedene Graphen. Die Anzahl der Ecken eines Graphen G = G(E, K) wird üblicherweise als Ordnung von G bezeichnet, die Anzahl seiner Kanten als Größe. Einen Graph nennt man dann dicht, wenn das Verhältnis d von Größe zu Ordnung groß ist; bei einer Veranschaulichung in der Ebene kann man Dichte“ sehen. ” Beispiel 2.1.3 Betrachte ein Beispiel einer endlichen Geometrie“: ” P := {A, B, C} , G := {{A, B}, {A, C}, {B, C}} (a) (b) Abbildung 2.3: Bipartite Graphen P steht für die Punkte, G steht für die Menge der Geraden. Dies ist ein Graph G(P, G). Endecken etwa der Kante k := {A, B} sind A und B. Einige einfache Graphen sind so wichtig, dass sie eigene Namen tragen. Z.B. heißen die einfachen Graphen Gn := G(E, K) mit Eckenanzahl n und einer Kante zwischen jedem Paar von Ecken vollständige Graphen. In Abbildung 2.2 sind Diagramme dazu für n ≤ 5 enthalten. Weitere Graphen spezieller Struktur sind die bipartiten Graphen G = G(E, K), bei denen es eine Zerlegung der Eckenmenge E gibt derart, dass E = U ∪ V , U ∩ V = ∅, Stand: 9. Februar 2010 17 c J.Baumeister KAPITEL 2. GRAPHEN 2.1. DEFINITION UND DIAGRAMME und jede Kante hat eine Ecke in U und eine Ecke in V . Ist jede Ecke aus U mit einer Ecke aus V verbunden, so sprechen wir von einem vollständigen bipartiten Graphen; wir bezeichnen sie mit Gm,n , wobei hier die Zerlegung so möglich ist, dass U m und V n Ecken hat. Der vollständige bipartite Graph G3,3 ist in Abbildung 2.3 (a) skizziert. Abbildung 2.3 (b) gibt einen unvollständigen bipartiten Graphen wieder. Beispiel 2.1.4 Geplant ist ein Tennisturnier mit fünf Teilnehmern a, b, c, d, e . Die Turnierbedingungen seien: (1) Es steht nur ein Tennisplatz zur Verfügung. (2) Jeder Teilnehmer spielt gegen jeden anderen Teilnehmer genau einmal. (3) Kein Teilnehmer spielt in zwei aufeinanderfolgenden Spielen. a ab ce e b cd bc ae ad c be d (a) Der zugehörige Graph de bd ac (b) Ein erlaubter Spielplan Abbildung 2.4: Graph für ein Tennisturnier In der Abbildung 2.4 (a) stellt jede der zehn Verbindungslinien eines der Spiele dar. In der Abbildung 2.4 (b) ist auch ein Spielplan aufgezeichnet: Die zehn Punkte repräsentieren die Spiele, und zwei Punkte sind genau dann verbunden, wenn sie keinen gemeinsamen Spieler haben; die zugehörige Abbildung ist also ein Graph mit 10 Ecken und 15 Kanten. Der fett eingezeichnete Weg“ liefert eine Lösung für die obigen Bedingungen (1), (2), (3). ” Das Diagramm haben wir nicht willkürlich gestaltet, sondern eine ästhetisch ansprechende und einprägsame Form dafür gewählt. Der Graph in Abbildung 2.4 (b) ist der berühmte Petersengraph. Seine Bedeutung liegt in der Liste von Eigenschaften, die er besitzt oder nicht besitzt. Definition 2.1.5 Sei G(E, K) ein Graph. Eine Ecke e hat Grad d = d(e), wenn die Anzahl der Kanten, die e als Endecke haben, d ist. Eine Ecke e mit d(e) = 1 heißt Blatt. Lemma 2.1.6 (Handschlaglemma) Sei G = G(E, K) ein Graph mit k Kanten. Dann gilt: X 2k = d(v) . v∈E Beweis: Wir zählen die Paare (v, k), v ∈ E, k ∈ K, ab, für die v Endecke von k ist. Da jede Kante genau 2 Endecken hat, ist die Anzahl einerseits 2k, andererseits trägt jede Ecke v ∈ E mit d(v) zu dieser Anzahl bei. Die Wortwahl für das obige Lemma kommt von der Interpretation, dass man sich K als die Paare von Personen (E) vorstellen kann, die sich per Handschlag begrüßen. Z.B. lesen wir Stand: 9. Februar 2010 18 c J.Baumeister KAPITEL 2. GRAPHEN 2.2. WEGE, KREISE, ZUSAMMENHANG daraus ab, dass die Anzahl der Personen, die auf einer Party eine ungerade Anzahl von Gästen mit Handschlag begrüßt haben, gerade ist. Graphentheorie hat vielfältige Anwendungen; etwa (-) Reise- oder Transportplanung (-) Datenstrukturen in der Informatik (-) Computernetzwerke (-) Strukturformeln in der Chemie (-) Anwendungen in der Mathematik 2.2 Wege, Kreise, Zusammenhang Mit den nun folgenden Begriffen Kantenzug, Weg, Kreis“ können wir etwas über die Feinstruk” tur von Graphen herausfinden. Definition 2.2.1 Sei G(E, K) ein Graph. (a) Sind v0 , v1 , . . . , vl ∈ E, so dass vi mit vi+1 für jedes i = 0, . . . , l − 1 verbunden ist, so nennen wir W := [v0 , . . . , vl ] einen Kantenzug von v0 nach vl der Länge l . (b) Ein Kantenzug W = [v0 , . . . , vl ] heißt Weg, falls alle zugehörigen Kanten vi vi+1 paarweise verschieden sind. (c) Ein Weg W = [v0 , . . . , vl ] heißt Kreis, falls v0 = vl gilt. Ohne Beweis führen wir an, dass aus jedem Kantenzug von v0 nach vl ein Weg von v0 nach vl gemacht werden kann durch Weglassung von Kanten (Beachte die Absprache, dass wir nur endliche Graphen betrachten). Beispiel 2.2.2 Betrachte den vollständigen Graphen G4 ; siehe Abbildung 2.2: er hat 4 Ecken und 6 Kanten; die Dichte ist also 32 . Er enthält Kreise der Länge 3 und 4. Intuitiv sollte man erwarten, dass ein dichter Graph lange“ Kreise enthalten sollte. Dazu gibt es auch eine präzise ” Aussage, nämlich den Satz von Dirac (1952), der diese Erwartung bestätigt: gilt für die Dichte d ≥ 2, so gibt es einen Kreis der Länge größer als d . Definition 2.2.3 Ein Graph G(E, K) heißt zusammenhängend, wenn je zwei Ecken durch einen Kantenzug verbindbar sind. Offenbar ist Verbindbarkeit“ eine Äquivalenzrelation auf der Eckenmenge eines Graphen. Die ” Äquivalenzklassen bezüglich dieser Relation heißen Zusammenhangskomponenten des Graphen. Bemerkung 2.2.4 Wir betrachten stets ungerichtete Graphen, d.h. solche, deren Kanten beim Durchlaufen keine Richtung auszeichnen. Ungerichtete Graphen sind solche, deren Kanten mit einem Pfeil“ dargestellt werden; sie können nur in Pfeilrichtung durchlaufen werden. ” Gewichtete Graphen sind Graphen, bei denen Kanten ein Gewicht tragen, das die Kosten“ ” angibt, wenn die Kante durchlaufen wird. Stand: 9. Februar 2010 19 c J.Baumeister KAPITEL 2. GRAPHEN 2.2. WEGE, KREISE, ZUSAMMENHANG Definition 2.2.5 Sei G(E, K) ein Graph. (a) Ein Weg W = [v0 , . . . , vl ] heißt ein Eulerweg, wenn der Weg jede Kante des Graphen genau einmal enthält. (b) Ein Eulerweg heißt ein Eulerkreis, wenn er ein Kreis ist. (c) Der Graph heißt Eulergraph, falls er einen Eulerkreis enthält. D D a a d e A b e A C C c c B g d g b f f B (a) Skizze der Landkarte (b) Der zugehörige Graph Abbildung 2.5: Das Königsberger Brückenproblem Der Begriff Eulerkreis“ stammt von dem vermutlich ältesten graphentheoretisch erfassten ” Problem, nämlich dem Königsberger Brückenproblem, das seine Lösung durch L. Euler2 im Jahre 1736 fand. Die Abbildung 2.5 zeigt 4 Landstücke A, B, C, D und 7 Verbindungsbrücken a, b, . . . , g. Frage: Ist es möglich, von der Insel A aus einen Spaziergang zu machen, bei dem man alle Brücken genau einmal passiert und schließlich nach A zurückkehrt? Übersetzen wir dies in die Graphensprache, so resultiert der Graph aus Abbildung 2.5 (b). Euler hat die Frage nach einer zulässigen Tour im Königsberger Brückenproblem negativ beantworten können, indem er zeigte, dass kein Eulerkreis existiert. Dafür gibt es eine sehr einfache Argumentation. Sie geht so: In jeder Ecke kann man die Anzahl der Kanten zählen, die dort enden; diese Anzahl ist der Grad der Ecke. Soll es einen Eulerkreis geben, dann muss jede Ecke offenbar geraden Grad haben. Beim Königsberger Brückenproblem gibt es aber Ecken ungeraden Grades. Korollar 2.2.6 Ist G ein Eulergraph, dann hat jede Ecke geraden Grad. Beweis: Dies ist die Argumentation von Euler. Gilt auch die Umkehrung in Korollar 2.2.6? Ja, sie gilt, wenn mann nur zusammenhängende Graphen betrachtet! Dies ist das Resulat von Hierholzer (1873). Damit ist auch klar, dass Eulergraphen schnell ( in linearer Zeit“) anhand der geraden Eckengrade erkannt werden können. ” Aber wie konstruiert man einen Eulerweg? Darüber gibt auch das Resultat von Hierholzer Auskunft. Die sehr befriedigende Zusatznachricht ist, dass dies auch sehr schnell ( in linearer Zeit“) ” bewerkstelligt werden kann. 2 Euler, Leonhard (1707 — 1783) Stand: 9. Februar 2010 20 c J.Baumeister KAPITEL 2. GRAPHEN 2.2. WEGE, KREISE, ZUSAMMENHANG Definition 2.2.7 Sei G(E, K) ein Graph. (a) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonweg, wenn der Weg W jede Ecke des Graphen genau einmal enthält. (b) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonkreis, wenn W ′ := [v0 , . . . , vl−1 ] ein Hamiltonweg ist und v0 = vl gilt. Das Problem der Hamiltonkreise ist ungleich tiefliegender als das der Eulerkreise, für Anwendungen aber sehr viel interessanter: es gibt keine Charakterisierungen für Hamiltonkreise, für Eulerkreise schon.3 (a) Dodekaeder (b) Tetraeder (c) Würfel Abbildung 2.6: Hamiltonkreise Bekanntlich gibt es fünf reguläre Körper/platonische Körper: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder. Dies zu zeigen, ist die Theorie der Graphen ein entscheidendes Hilfsmittel, ebenso dafür, das bekannte Färbungsproblem, das wir unten noch kennenlernen werden, zu lösen. Hamilton fragte nach einem Hamiltonkreis im Graphen, der dem Kantenweg auf dem Dodekaeder entspricht. Die Abbildung 2.6 (a) gibt die Antwort. In Abbildung 2.6 (b), (c) finden wir Hamiltonkreise zu anderen regulären Körpern. Dabei verwenden wir die sogenannten Schlegel–Diagramme für die platonischen Körper: Projektionen der Körper auf eine Zeichenebene von einem Punkt über dem Körper. Euler behandelte schon das Problem des Rösselsprungs auf einem n × n–Schachbrett. Gefordert ist, dass der Springer von einem Feld beginnend mit kontinuierlichen Zügen alle Felder genau einmal berührt (und dann eventuell wieder zu seinem Ausgangspunkt zurückkehrt). Nehmen wir ein (quadratisches) Schachbrett mit n2 Feldern und verbinden wir zwei Ecken, wenn sie durch einen Springerzug verbunden sind; es resultiert ein Graph. Dann ist die Frage nach einem Hamiltonweg bzw. Hamiltonkreis klar.4 In Abbildung 2.7 ist ein Hamiltonweg für den Rösselsprung auf einem 9 × 9–Schachbrett aufgeführt. 5 2 7 80 77 74 11 16 13 8 79 4 1 10 81 14 75 18 3 6 9 78 73 76 17 12 15 32 29 34 69 66 63 24 19 22 35 68 31 72 27 70 21 64 25 30 33 28 67 62 65 26 23 20 39 36 41 56 71 58 47 52 49 42 55 38 61 44 53 50 59 46 37 40 43 54 57 60 45 48 51 Abbildung 2.7: Rösselsprung 3 Spezielle Aufgaben, die sich mit der Problematik Hamiltonweg/Hamiltonkreis beschäftigen, sind viel älter als die Graphentheorie. 4 Das Studium der Hamiltonwege und Hamiltonkreise wurde 1856, etwa gleichzeitig, von Kirkmann und Hamilton angeregt. Stand: 9. Februar 2010 21 c J.Baumeister KAPITEL 2. GRAPHEN 2.3. PLANARE GRAPHEN Wie oben schon angemerkt, Hamiltongraphen lassen sich nicht so einfach charakterisieren wie Eulergraphen. Da die Ordnung n eines Graphen stets die Länge eines Hamiltonkreises angibt, kann man einen Hamiltonkreis dadurch finden, dass man alle n-elementigen Teilmengen der Kantenmenge daraufhin überprüft, ob sie einen Hamiltonkreis darstellen. Dies ist bei dichten Graphen ein sehr aufwändiges Verfahren. Es ist aber kein sehr viel schnelleres Verfahren bekannt, ja es sieht so aus, als gebe es kein sehr viel schnelleres Verfahren; siehe nächstes Kapitel. Die Suche nach notwendigen und hinreichenden Bedingungen für die Existenz eines Hamiltonweges hat ein umfangreiches Gebäude von neuen Begriffen und Fragestellungen hervorgebracht. 2.3 Planare Graphen Wir haben schon darauf hingewiesen, dass wir üblicherweise einen Graphen G(E, K) durch ein Punkt–Linien–System in der Ebene veranschaulichen. Gibt es eine Darstellung, in der die Kanten von G sich nur an Ecken treffen aber niemals dazwischen, so sagen wir, der Graph G ist plättbar und nennen den so darstellbaren Graphen einen ebenen Graphen (enbettbar in die Ebene). Isolierte Ecken spielen dabei keine Rolle, sie können ja irgendwohin platziert werden, allerdings darf keine Kante über eine isolierte Ecke laufen. In Abbildung 2.8 sind einige ebene Graphen dargestellt. Dort sieht man auch, wie der Graph zum Haus vom Nikolaus plättbar ist. Ist G(E, K) ein ebener Graph, so zerlegen die Kanten die Ebene in endlich viele (topologisch) zusammenhängende Gebiete, von denen genau eines, das äußere“ Gebiet, nicht beschränkt ist. ” Zusammenhängend bedeutet hier (etwas oberflächlich): Wir können zwischen je zwei Punkten des Gebietes mit Bleistift (ohne abzusetzen) eine Linie ziehen, die das betreffende Gebiet nicht verläßt. Der Grund dafür ist der berühmte Jordansche Kurvensatz: Eine geschlossene Jordankurve γ zerlegt die Ebene in zwei topologisch zusammenhängende Gebiete, von denen genau eines nicht beschränkt ist. Dies heißt: Zwei Punkte der Ebene können genau dann durch eine Jordan–Kurve verbunden werden, die γ nicht trifft, wenn sie entweder beide im Inneren oder beide im Äußeren von γ liegen. So einleuchtend dieser Satz auch ist, sein Beweis ist alles andere als leicht. 6 1 3 4 2 5 (a) (b) (c) Abbildung 2.8: Beispiele für ebene Graphen Wir wollen nun erläutern, wie das Färbungsproblem für Landkarten mit den Resultaten der Graphentheorie zusammenhängt. Wir können also unterstellen, dass bei einem ebenen Graphen die Linien (die für die Kanten stehen) die Ebene in endlich viele topologisch zusammenhängende Gebiete zerlegen. Diese Gebiete wollen wir Länder nennen. Stand: 9. Februar 2010 22 c J.Baumeister KAPITEL 2. GRAPHEN 2.3. PLANARE GRAPHEN Haben wir umgekehrt eine reale Landkarte“ L gegeben, so können wir L sofort einen ebenen ” Graphen G(E, K) zuordnen: Die Ecken E sind die Schnittpunkte verschiedener Grenzen und die Kanten sind die zwischen Schnittpunkten verlaufenden Grenzlinien; eine Insel wird als Punkt und seine Grenze als Schlinge dargestellt. Wir halten ausdrücklich fest: Länder grenzen entlang einer Grenzlinie aneinander, nicht nur in einem Punkt, und die Länder sind zusammenhängend, d.h. je zwei Punkte eines landes sind durch einen Streckenzug verbindbar, der das Land nicht verlässt. Definition 2.3.1 Eine Landkarte L(E, K, L) ist ein ebener Graph G = G(E, K) zusammen mit den zu G gehörenden Ländern L . Länder, die eine gemeinsame Grenze haben, nennen wir benachbart. Definition 2.3.2 Eine Färbung einer Landkarte L(E, K, L) ist eine Färbung der Länder mit endlich vielen verschiedenen Farben, und zwar so, dass Länder, die eine gemeinsame Grenzkante besitzen, stets verschiedene Farben erhalten. Mit diesen Begriffen können wir nun den 4–Farben–Satz formulieren: Für jede Landkarte reichen 4 Farben für eine Färbung aus. Der 4–Farben–Satz hat eine interessante Geschichte, die Beweisversuche dazu haben viel zur Entwicklung der Graphentheorie beigetragen. Schon 1878 legte A. Kempe einen Beweisversuch für den 4–Farben Satz vor. Obwohl Kempes Beweis einen Fehler enthielt – er wurde 1890 von Heawood entdeckt –, so vereinigte er doch nahezu alle Ideen, die zur endgültigen Lösung 100 Jahre später geführt haben. Der 5–Farbensatz von Heawood aus dem Jahre 1898 sagt, dass stets 5 Farben ausreichen. Ein korrekter Beweis für den 4–Farbensatz wurde 1976 von Appel und Haken vorgelegt. Allerdings wurde der Beweis von der mathematischen Welt mit gemischten Gefühlen aufgenommen, denn der Beweis wurde geführt unter massivem Einsatz von Computern. Es gibt nun einen Beweis, der zwar immer noch nicht ohne Computer auskommt, der diesen aber schon reduziert einsetzt. Nach der Skizzierung des 4–Farbensatzes liegt es auf der Hand, was Färbungen von Graphen sein sollen: benachbarte Ecken sollen unterschiedliche Farben erhalten. Wir werden diese Frage im Kapitel über Abbildungen wieder aufgreifen. Hier nur ein Beispiel, das einen Anwendungshintergrund der Problematik aufzeigt. Beispiel 2.3.3 In einem Zoo soll der Aquariumsbereich umgebaut werden und dazu Notbecken aufgestellt werden. Dabei ist zu berücksichtigen, dass gewisse Fischarten sich nicht vertragen und daher nicht in ein gemeinsames Becken eingebracht werden dürfen. Es ist das Ziel, mit möglichst wenig Notbecken auszukommen. Seien 1, . . . , N die unterschiedlichen Fischarten; sie dienen als Ecken eines Graphen. Zwei Fischarten sind durch eine Kante verbunden, wenn sie sich nicht vertragen. Es entsteht ein Graph. Jeder Fischart soll nun eine Farbe – sie steht für ein Becken – so zugeordnet werden, dass Knoten, die mit einer Kante verbunden sind, eine unterschiedliche Farbe erhalten. Kommen wir zu planaren Graphen zurück. Jedem planaren Graphen können Fächen zugeordnet werden; eines davon ist die Außenfläche. Stand: 9. Februar 2010 23 c J.Baumeister KAPITEL 2. GRAPHEN 2.4. BÄUME Satz 2.3.4 (Eulerscher Polyedersatz) Sei G = G(E, K) ein planarer zusammenhängender Graph mit n = #E, m = #K und f Flächen. Dann gilt: n+f −m = 2 (2.1) Beweis: Den Beweis können wir hier noch nicht führen. Er bedient sich im Allgemeinen der vollständigen Induktion und der speziellen Graphen Bäume“; siehe unten. Für m = 0 können wir die Rich” tigkeit aber erkennen. Hier muß nämlich n = f = 1 sein (Zusammenhang!). 2.4 Bäume Eine weitere einfache, aber wichtige Graphenklasse ist die der Bäume. Bäume sind beispielsweise als Datenstrukturen in der Informatik und bei der Betrachtung von elektrischen Netzwerken von großer Bedeutung.5 Definition 2.4.1 Ein Graph heißt Baum, wenn er zusammenhängend ist und keine Kreise enthält. Ein Baum heis̈t Binärbaum, wenn der Grad einer jeden Ecke höchstens zwei ist. In Abbildung 2.9 sind im wesentlichen alle“ Bäume mit höchstens 6 Ecken aufgeführt. ” (a) Alle Bäume mit höchstens 5 Ecken (b) Alle Bäume mit 6 Ecken Abbildung 2.9: Alle Bäume mit höchstens 6 Ecken Ein Ereignisbaum ist ein Hilfsmittel, das es uns erlaubt, alle möglichen Ergebnisse einer Folge von Experimenten abzuzählen, wenn bekannt ist, dass jeweils nur endlich viele Ergebnisse möglich sind. Wir erläutern dies an folgendem Beispiel. Beispiel 2.4.2 Mark und Erich bestreiten eine Tennisauseinandersetzung: Wer zuerst zwei Sätze hintereinander oder insgesamt drei Sätze gewonnen hat, gewinnt die Auseinandersetzung. Alle möglichen Ergebnisse des Wettkampfes entsprechen den Worten MM,MEMM,MEMEM,MEMEE,MEE,EMM,EMEMM,EMEME,EMEE,EE . Der Weg von der Wurzel des Baumes bis zum Endpunkt gibt an, wer jeweils den Wettkampf gewonnen hat. Bäume lassen sich ziemlich einfach charakterisieren. Wir geben drei äquivalente Charakterisierungen ohne vollständigen Beweis an. 5 Historisch gesehen, stammt das Interesse aus der Chemie im Zusammenhang mit der Darstellung von Kohlenwasserstoffverbindungen. Stand: 9. Februar 2010 24 c J.Baumeister KAPITEL 2. GRAPHEN 2.5. ÜBUNGEN Fisch 1 2 3 4 5 6 7 8 9 10 11 12 Satz 2.4.3 Sei G ein Graph mit n Ecken. Es sind äquivalent: (a) G ist ein Baum. (b) Je zwei Ecken des Graphen sind durch genau einen Weg verbunden. (c) G ist zusammenhängend, aber für jede Kante k von G ist der Graph G′ := G(E, K\{k}) nicht zusammenhängend. (d) G ist zusammenhängend und besitzt genau n − 1 Kanten. (e) G besitzt keinen Kreis und besitzt genau n − 1 Kanten. Unverträglich mit 3,6,7 1,3,6,7 6,8,9,10 1,2,6 11,12 3,7 1,2,3,4 3,6,7,9,10,11 3,6,7 1,3,6,7 1,3,6,7 5,6,8 Abbildung 2.10: Fischbeckenproblem Beweis: Wir beweisen nicht alle Implikationen. a) =⇒ b). Da ein Baum zusammenhängend ist, gibt es stets einen Weg, der zwei beliebige Ecken verbindet. Annahme, es gibt mindestens zwei Wege, die ein gegebenes Paar e, e′ von Ecken verbindet. Wenn beide Wege keine Kante gemeinsam haben, bilden sie einen Kreis: wir laufen den einen Weg von e nach e′ und laufen nun den zweiten Weg von e′ nach e . Enthalten die beiden Wege eine gemeinsame Kante, dann finden wir wieder einen Kreis, denn die beiden Wege treffen sich nun in einer Ecke e′′ , die beide Wege gemeinsam haben. In jedem Falle haben wir, dass der Graph einen Kreis enthält. Widerspruch! b) =⇒ c). Es ist klar, dass G zusammenhängend ist. Sei k = uv eine Kante mit Endecken u, v . Dann ist [u, v] der einzige Weg, der u, v verbindet; in G′ := G(E, K\{k}) können also u, v nicht durch einen Weg verbunden sein. Also kann G′ nicht zusammenhängend sein. c) =⇒ d). Auf Graphen kennen wir die Äquivalenzklassen der Zusammenhangskomponenten; siehe oben. Der zusammenhängende Graph G hat eine Zusammenhangskomponente. Nimmt man eine Kante {k} weg, entsteht ein Graph G′ := G(E, K\{k}), der zwei Zusammenhangskomponenten hat. Nach Wegnahme aller Kanten hat der entstandene Graph n keine Kante ist mehr und daher n Zusammenhangskomponenten. Also muss es n − 1 Kanten im Graphen geben. 2.5 Übungen 2.) Sei G = G(E, K) ein Graph. Der Komplementgraph G von G hat als Eckenmenge E und als Kantenmenge alle möglichen Kanten zwischen den Ecken, mit Ausnahme der Kanten in G . Finde den Komplementgraph zum Haus vom Nikolaus“. ” Jeder Graph mit mindestens zwei Ecken desselben Grades. 3.) Mindestens einer der Graphen G, G ist zusammenhängend. 4.) Sei G ein Graph mit n Ecken. Zeige: Gilt d(e) ≥ zusammenhängend. 5.) Zeige: Ein Kreis in einem Graphen ist bipartit genau dann, wenn alle Ecken gerade sind. 1.) Stand: 9. Februar 2010 25 1 2 (n − 1) für alle Ecken, dann ist G c J.Baumeister KAPITEL 2. GRAPHEN 2.5. ÜBUNGEN 6.) Zeige: Jeder endliche Baum hat mindestens zwei Blätter. 7.) Beweise in Satz 2.4.3 die Implikation a) =⇒ b) . 8.) Ist der vollständige bipartite Graph Gn,n+1 ein Hamiltongraph? 9.) Ist der Petersengraph ein Hamiltongraph? 10.) Gibt es einen interessanten“ Graphen, der zugleich eulersch und hamiltonsch ist? ” 11.) Versuche den arithmetischen Ausdruck (in Maple-Schreibweise) ((a+b) * (c-d-7))/(23 * e) als Binärbaum darzustellen. Wieviele Blätter hat eine solche Darstellung. 12.) Sei G = G(E, K) ein Graph. Zeige, dass die Anzahl der Ecken von ungeradem Grad stets gerade ist. Hinweis: Handschlaglemma und Aufspaltung“ des Graphen in Ecken mit geradem Grad ” und Ecken mit ungeradem Grad. 13.) Betrachte die Graphen a b c d e b a e h g f c (a) d (b) (a) Bestimme einen Eulerkreis im Graphen (a). (b) Gibt es einen Eulerkreis im Graphen (a), wenn man die Kante, die f mit e verbindet, wegnimmt? (c) Bestimme einen Hamiltonkreis im Graphen (b). 14.) Betrachte das Fischbeckenproblem aus Beispiel 2.3.3 für N = 12 Fische. Die Unverträglichkeiten gibt die Tabelle 2.10 wieder. Zeichne mit Maple einen Graphen, der das Problem beschreibt und finde eine Lösung. Stand: 9. Februar 2010 26 c J.Baumeister Kapitel 3 Algorithmen und Programme Für die Formulierung von Lösungsverfahren, die auf einem Computer realisiert werden sollen, bedient man sich des Algorithmus“. Hier skizzieren wir, worauf es bei Algorithmen ankommt, ” und geben erste Beispiele. Für die Analyse von Algorithmen ist der Begriff Abbildung“ hilfreich. ” Die zuletzt betrachtete Struktur Graphen“ ist beim Studium von Algorithmen von Bedeutung. ” 3.1 Algorithmen Ein Computer ist ein Werkzeug zur Verarbeitung und Speicherung von Information. Um ihn zu nutzen, ist er mit Verarbeitungsvorschriften zu füttern“. Wir formulieren solche Vorschriften ” in der Regel unter dem Stichwort Algorithmus. Ein Algorithmus1 für eine vorgegebene bestimmte Art von Aufgaben ist eine endliche Abfolge von wohldefinierten, ausführbaren Vorschriften, die bei Abarbeitung, ausgehend von einem Eingangszustand (Input) nach einer endlichen Anzahl von Verarbeitungsschritten einen Ausgangszustand (Output) bestimmen, der als Lösung der durch den Eingangszustand charakterisierten Aufgabe angesehen werden kann. Algorithmen sind unabhängig von einer konkreten Programmiersprache und einem konkreten Computertyp, auf denen sie ausgeführt werden. Beispiel 3.1.1 Betrachte folgende Liste von Anweisungen: EIN: Natürliche Zahl n . step 1 k := 1, a := n . step 2 Ist a ( = 1, dann gehe zu AUS. 3a + 1 falls a ungerade step 3 a := a/2 falls a gerade step 4 k := k + 1, gehe zu step 2. AUS: Mit k die Länge der erzeugten Zahlenfolge. Die Rechenschritte erklären sich selbst: ausgehend von n wird eine Folge von natürlichen Zahlen erzeugt, eine so genannte Collatz/Uhlam/Warring-Folge. Ist dies ein Algorithmus? NEIN, denn es ist nicht sichergestellt, dass die Abfrage ” Ist a = 1, dann gehe zu AUS“ 1 Die Bezeichnung leitet sich aus dem Namen Al–Khwarizmi (Al–Khwarizmi,780? — 850?), einem der bedeutensten Mathematiker des anfangenden Mittelalters, ab. 27 KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.2. PROGRAMME UND PROGRAMMIERSPRACHEN irgendwann zur Beendigung führt. ABER: Bisher hat man keine natürliche Zahl gefunden, bei der die obige Liste von Anweisungen nicht endet. Unterschiedliche Algorithmen können entworfen werden zur Lösung ein und derselben Aufgabe. Leistungsunterschiede lassen sich herausarbeiten, wenn man ihren Aufbau und ihre Wirkungsweise analysiert. Fragestellungen dafür sind: • Entwurf von Algorithmen: Wie soll ein Algorithmus zur Lösung einer bestimmten Aufgabe aussehen? • Berechenbarkeit: Gibt es Aufgaben, für die kein Algorithmus existiert? • Komplexität: Wie läßt sich der Aufwand, der betrieben werden muss, um eine Problemklasse von Aufgaben zu lösen, bestimmen/abschätzen? • Korrektheit: Wie läßt sich nachweisen, ob ein vorliegender Algorithmus die Aufgabe korrekt löst? • Robustheit/Zuverlässigkeit: Wie groß ist die Problemklasse von Aufgaben, die der Algorithmus löst? • Genauigkeit: Was ist die Qualität der Lösung, wenn numerisches Rechnen nötig ist? Hauptziel der Analyse ist die Effizienzuntersuchung und die Entwicklung effizienterer Algorithmen. Diese Analyse sollte aber rechnerunabhängig durchgeführt werden. Dazu benötigt man ein geeignetes Rechnermodell. Solche Modelle stehen zur Verfügung! Wir wollen hier nicht darauf eingehen, unsere Analyseuntersuchungen stützen wir auf die Ermittlung des Rechenaufwands, ausgedrückt durch die Anzahl von elementaren Operationen. Hierbei kann man drei Ansätze unterscheiden: – Worst-case-Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit vom Input. – Mittlere Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit vom Input bei gewissen Annahmen über das Auftreten des Inputs in der Problemklasse. – Untere Komplexität: Hierunter versteht man die Ermittlung unterer Schranken für den zu betreibenden Aufwand. Diese Ansätze können rechnerunabhängig und a-priori erfolgen, d.h. ohne den Algorithmus zu testen. Unter einer a-posteriori–Analyse versteht man das Testen des Algorithmus an Aufgaben mit (hinreichend) großem Input. 3.2 Programme und Programmiersprachen Die konkrete Ausführung eines Algorithmus nennt man einen Prozess. Die Einheit, die den Prozess ausführt, ist ein Prozessor. Beim Kuchenbacken ist der Algorithmus das Rezept, der Prozess die Abarbeitung des Rezepts, der Prozessor der Koch. Hier denken wir natürlich an den Prozessor Computer“. Um eine Analyse des Ablaufs eines Algorithmus auf diesem Pro” zessor vornehmen zu können, ist ein geeignetes Modell für den Computer (Maschinenmodell) Stand: 9. Februar 2010 28 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.2. PROGRAMME UND PROGRAMMIERSPRACHEN bereitzuhalten. Die Informatik studiert u.a. die Turing-Maschine und die Random-AccessMaschine (RAM), welche in gewissem Sinne sogar äquivalent sind. Die Analyse von Algorithmen auf einem abstrakten Niveau ist eine Disziplin der Informatik und/oder mathematischen Informatik. Die Hardware-Komponenten eines Computers sind • Zentraleinheit (CPU) • Speicher (Memory) • Ein- Ausgabegeräte (Input, Output Devices) Die Merkmale, die einen Computer bezüglich Hardware kennzeichnen sind Geschwindigkeit, Speichergröße, Zuverlässigkeit, Kosten, Vernetzbarkeit. Die Ausführung eines Algorithmus auf einem Prozessor setzt voraus, dass der Computer den Algorithmus interpretieren können muss, d.h. er muss • verstehen, was jeder Abarbeitungsschritt bedeutet, • die jeweilige Operation ausüben können. Dies leisten die Programmiersprachen. Die Algorithmen werden damit in Programmen aufgeschrieben; die einzelnen Schritte heißen nun (Programm–)Anweisung, Befehl. Bei einfachen Programmiersprachen (Maschinensprachen) kann jede Anweisung direkt vom Computer interpretiert werden. Da nur elementare Operationen damit erfaßt werden, muß man sehr lange Programme schreiben. Zur Vereinfachung der Programmierung wurden höhere Programmiersprachen entwickelt. Programme in solchen Programmiersprachen können nicht direkt durch den Computer interpretiert werden, sie werden durch Übersetzungsprogramme in die Maschinensprache überführt. Der Übergang von Maschinensprachen zu höheren Programmiersprachen ist fließend. Es gibt eine ganze Hierarchie von Programmiersprachen: • Basic, Fortran • Algol • Pascal, C, C++, Java Auf Computern kann man Programme auf Vorrat“ für bestimmte Aufgaben ablegen. Diese ” Sammlung von Programmen nennt man Software. Man unterscheidet • Anwendungssoftware (Textverarbeitungssoftware, Statistiksoftware, . . . ) • Systemsoftware (Betriebssystem, Editor, Compiler, . . . ) Besonderen Stellenwert nehmen Software-Pakete ein wie Maple, Mathematica, Derive, Matlab, Cinderella, die alle eine spezielle Ausrichtung haben: symbolisches Rechnen die ersten drei, numerisches Rechnen Matlab und geometrisches Rechnen das letzte. Stand: 9. Februar 2010 29 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.3 3.3. ORDNUNG UND LISTEN Ordnung und Listen Bei den natürlichen Zahlen 1,2,3,. . . – und nicht nur dort – verwenden wir das Ungleichungszeichen “≤“. Es hat die Eigenschaften (x, y, z ∈ N) x ≤ x; x ≤ y und y ≤ x =⇒ y = x ; x ≤ y und y ≤ z =⇒ x ≤ z ; x ≤ y oder y ≤ x . Wir nehmen dies zum Anlaß für Definition 3.3.1 Sei X eine Menge. Eine Teilmenge O ⊂ X × X heißt Halbordnung von X, falls gilt: (i) Für alle x ∈ X gilt (x, x) ∈ O. (ii) (x, y) ∈ O , (y, x) ∈ O =⇒ y = x . (iii) (x, y), (y, z) ∈ O =⇒ (x, z) ∈ O . Ist zusätzlich noch (iv) Für alle x, y ∈ X gilt (x, y) ∈ O oder (y, x) ∈ O erfüllt, dann heißt O eine Ordnung von X. O Meist schreibt man bei Vorliegen einer Halbordnung O statt (x, y) ∈ O auch x ≤ y oder kurz x ≤ y , wenn der Zusammenhang klar ist. Beispiel 3.3.2 Ist X eine Menge, dann ist in P OT (X) eine Halbordnung O definiert durch (A, B) ∈ O : ⇐⇒ A ≤ B : ⇐⇒ A ⊂ B . Beachte, dass nur in trivialen Fällen eine Ordnung vorliegt. Beispiel 3.3.3 Sei A ein (endliches) Alphabet und seien An die Wörter der Länge n über dem Alphabet A . Sei in A eine Ordnung ≤ gegeben. Wir setzen für a = a1 . . . an , b = b1 . . . bn ∈ An : a ≤ b : ⇐⇒ a = b oder ak ≤ bk für das kleinste k mit ak 6= bk . lex Dann ist ≤ eine Halbordnung in An . Man nennt sie die lexikographische Halbordnung. Als lex Anwendung ordne man 0002, 0008, 0013, 0029, 0132, 1324 als Worte über dem in natürlicher Weise angeordneten Alphabet A := {0, 1, 2, . . . , 9} . Eine Liste besteht aus einer Sammlung von wohlbestimmten und wohlunterscheidbaren Objekten und ihrer Anordnung nach einem Prinzip; die leere Liste ist zugelassen. Stand: 9. Februar 2010 30 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.4. SORTIEREN Die Anordnung kann nach dem chronologischen Prinzip, nach einem alphabetischen Prinzip oder allgemein mit einer Ordnung erfolgen. Kennt man alle Objekte der Liste, so kennt man die Liste; Hat die Liste nur ganz wenige Elemente, so kann man sie einfach alle innerhalb einer eckigen Klammer – damit machen wir den Unterschied zu Mengen klar – hinschreiben, durch Kommata getrennt, auf die Reihenfolge kommt es hierbei offenbar an. Maple - Illustration 3.1 Maple kennt den Datentyp Liste. Eine Liste ist eine in eckige Klammern eingeschlossene Folge von Ausdrücken, Objekten. Die Zahl der Einträge in einer Liste erhält man mit dem Befehl nops. Das k-te Element einer Liste kann man sich durch Anhängen des Index k an den Listennamen besorgen. 3.4 > L1:= [2,3,rot,Hahn,rot] ; L1:= [2,3,rot,Hahn,rot] > nops(L1); 5 > L1[4]; Hahn Sortieren Sei M eine endliche Menge mit n Elementen und versehen mit einer Ordnung ≤ . Sortieren heißt, die Elemente von M so anzuordnen, daß sie bzgl. der Ordnung ≤ eine aufsteigende Elementfolge bilden. Sortierverfahren werden benötigt etwa bei: Einordnen von Schlüsseln im Werkzeugkasten, Ordnen der erhaltenen Karten beim Skatspiel, Sortieren von Dateien der Größe nach. Gesichtspunkte für die Leistungsfähigkeit eines Sortierverfahrens sind: Schnelligkeit. Wieviele Rechenoperationen (Vergleiche, Umstellen in einer Liste) in Abhängigkeit von n sind nötig? Dieser Aufwand wird Laufzeitkomplexität des Verfahrens genannt. Speicherplatz. Im allgemeinen kann man sich die Elemente der Menge abgelegt in Fächern vorstellen. Beim Sortieren kann es sinnvoll sein, Zusatzfächer zu benutzen. Der Bedarf an Fächern in Abhängigkeit von n ist die Speicherplatzkomplexität des Verfahrens. Sei nun eine Menge M = {a1 , . . . , an } vorgegeben. Wir denken uns die Elemente a1 , . . . , an jeweils einzeln in einer Liste (Feld von Fächern) abgelegt. Wir sortieren diese Liste, indem wir die Objekte in den Fächern irgendwie solange austauschen, bis sie angeordnet in den Fächern liegen. Sortieren durch Auswählen (Selection–sort). Hier geht man folgendermaßen vor: • Finde das kleinste Element und tausche es gegen das an der ersten Stelle befindliche Element (1. Schleife). • Fahre in dieser Weise jeweils auf dem Rest des Feldes, das noch nicht sortiert ist fort (i–te Schleife). Man stellt leicht fest, dass in der i–ten Schleife n − i Vergleiche und eventuell ein Austausch anfallen: Wegen n−1 X i=1 (n − i) = Stand: 9. Februar 2010 n−1 X j=1 1 1 j = ((1 + · · · + n − 1) + (n − 1 + · · · + 1)) = n(n − 1) 2 2 31 (3.1) c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.4. SORTIEREN gilt für die Komplexität: Es fallen etwa n2 /2 Vergleiche und etwa n Austausche an. Auf den Aufwand“ −n/2 bei den Vergleichen und −1 beim Austauschen kann man für große n verzich” ten; etwa“ bedeutet diese Vernachlässigung, wir schreiben dafür meist ∼. Hierzu ein Beispiel, ” wobei hier die Elemente die Buchstaben des Alphabets in ihrer alphabetischen Ordnung sind. Anwendung von Selection–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (a). EXAMPLE AXEMPLE AEXMPLE AEEMPLX AEELPMX AEELMPX EXAMPLE EXAMPLE AEXMPLE AEMXPLE AEMPXLE AELMPXE AEELMPX EXAMPLE EAXMPLE AEXMPLE AEMXPLE AEMPXLE AEMPLXE AEMLPXE AELMPXE AELMPEX AELMEPX AELEMPX AEELMPX EXAMPLE EEAMPLX EEALPMX EEALMPX EEAL EEA AEE A E E AEELMPX (a) Selection–sort (b) Insert–sort (c) Bubble–sort (d) Quick–sort M L L L PX M P X M P X M P X Sortieren durch Einfügen (Insert–sort). Betrachte die Listenelemente der Reihe nach und füge jedes an seinem richtigen Platz zwischen den bereits betrachteten ein, wobei diese sortiert bleiben. Das gerade bestimmte Element wird eingefügt, indem die größeren Elemente um eine Position nach rechts geschoben werden und das betrachtete Element auf dem frei gewordenen Platz eingefügt wird. Anwendung von Insert–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (b). Man stellt fest, dass für die Laufzeitkomplexität gilt: ∼ n2 /2 Vergleiche , ∼ n2 /4 Austausche . Sortieren durch Austausch (Bubble–sort). Durchlaufe immer wieder das Feld und vertausche jedesmal, wenn es notwendig ist, benachbarte Elemente; wenn beim Durchlauf kein Austausch mehr nötig ist, ist das Feld sortiert. Anwendung von Bubble–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (c). Man stellt fest, dass für die Laufzeitkomplexität gilt: ∼ n2 /2 Vergleiche , ∼ n2 /2 Austausche . Sortieren nach Quick–sort. Dies ist der wohl am meisten angewendete Sortieralgorithmus. Seine Idee geht auf C.A.R. Hoare (1960) zurück. Es ist ein Vorgehen, das vom Typ Teile und Herrsche (divide et impera, divide and conquer) ist und auf einem Zerlegen des Feldes in zwei Teile und anschließendem Sortieren der Teile unabhängig voneinander beruht. Auf die Teile kann nun diese Idee wieder angewendet werden: Das Verfahren ist rekursiv, d.h. es ruft sich selbst (auf kleinerer Stufe) wieder auf. Wir kommmen im nächsten Kapitel auf das Prinzip Rekursivität“ zurück. ” Eine entscheidende Bedeutung kommt der Zerlegung eines Feldes zu. Es soll (zweckmäßigerweise) so erfolgen, dass gilt: Wird das Feld mit Hilfe des Elements ar zerlegt, so soll dies bedeuten: (1) ar befindet sich an seinem endgültigen Platz; (2) für alle j < r gilt aj ≤ ar ; (3) für alle j > r gilt aj ≥ ar . Bei jedem rekursiven Schritt wird eine solche Zerlegung benötigt. Wie findet man eine solche Zerlegung? Hier ist die Realisierung: Stand: 9. Februar 2010 32 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.5. COMPUTERZAHLEN • Wähle irgendein ar . • Durchsuche das Feld von links, bis ein Element gefunden ist, das nicht kleiner als ar ist, und durchsuche das Feld von rechts, bis ein Element gefunden ist, das nicht größer als ar ist. Tausche die so gefundenen Elemente. • Wiederhole den obigen Suchprozess solange, bis sich die Suche von links und rechts bei einem Element trifft. Nun ist das Element ar mit dem Element zu tauschen, bei dem sich die Suche von links und rechts getroffen hat. Ist das Feld nun zerlegt (Start), das Startfeld ist also nun a1 , . . . , ar , . . . , an , wird das Sortierverfahren auf die Teile a1 , . . . , ar−1 und ar+1 , . . . , an angewendet; als trennende Elemente können nun etwa die Elemente ar−1 und an verwendet werden. Anwendung von Quick–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (d) (M ist beim Start das trennende Element). Das Beste, was bei Quick–sort passieren könnte, ist, dass durch jede Zerlegung das Feld genau halbiert wird. Dann würde die Anzahl Cn der von Quick–sort benötigten Vergleiche der rekurrenten Beziehung vom Typ Teile und Herrsche“ genügen (n gerade!): Cn = 2C n2 + n . ” Dabei ist 2C n2 der Aufwand für das Sortieren der zwei halbierten Felder und n der Aufwand für die Zerlegung. Man kann zeigen, dass Cn = n log2 n gilt; wir kommen im Zusammenhang mit der (vollständigen) Induktion darauf zurück. Für den allgemeinen Fall zeigt eine etwas aufwendigere Analyse Cn = 2n ln n . log2 n ist der Logarithmus zur Basis 2, d.h. log2 ist die Umkehrfunktion der Funktion a 7−→ 2a . ln n ist der natürliche Logarithmus, d.h. ln ist die Umkehrfunktion der Funktion a 7−→ ea mit der Eulerschen Zahl e . Es gilt: 2n ln n ∼ 1.38n log2 n . Eine wichtige Begriffsbildung ist die Laufzeitkomplexität im Mittel eines Verfahrens. Damit ist hier gemeint, wieviele Rechenschritte ein Sortierverfahren benötigt, wenn es auf ein zufällig“ vorsortiertes Feld angewendet wird. Diese Begriffsbildung können wir erst diskutieren, ” wenn wir wissen, was zufällig“ heißen soll, und wie ein zufällig“ vorsortiertes Feld hergestellt ” ” werden kann. Hier spielen Zufallszahlengeneratoren eine Rolle, wie wir sie in Abschnitt ?? besprechen werden. 3.5 Computerzahlen In einer Grundvorlesung über Analysis beweist man folgenden Satz: Satz 3.5.1 Sei g eine Zahl in N mit g ≥ 2 . Für jedes x ∈ R, x 6= 0, gibt es genau eine Darstellung der Gestalt ∞ X n x = σg x−k g−k (3.2) k=1 mit σ ∈ {+, −}, n ∈ Z und x−k ∈ {0, 1, . . . , g−1}, wenn man von den Zahlen x−k noch zusätzlich fordert, dass x−1 6= 0 und dass zu jedem n ∈ N ein Index k ≥ n existiert mit x−k 6= g − 1 . Wichtige Spezialfälle von Satz (3.5.1) sind g = 10 (Dezimalsystem), g = 2 (Dualsystem), g = 8 (Oktalsystem) und g = 16 (Hexadezimalsystem). Beim Hexadezimalsystem benötigen wir zusätzlich Ziffern“, da man etwa 12 nicht als Ziffer verwenden will. Man wählt ” 0, 1, . . . , 9, A, B, C, D, E, F . In (3.2) ist also die Zahl x durch eine Reihe dargestellt, wobei der ganze Anteil“ (gn ) abge” spaltet wurde, die Forderung x−1 6= 0“ macht diese Abspaltung eindeutig. g heißt Basis der ” Darstellung, welche im Allgemeinen eine gerade Zahl ist. σ steht für das Vorzeichen der Zahl. Stand: 9. Februar 2010 33 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.5. COMPUTERZAHLEN Die Forderung x−k 6= g − 1“ für fast alle k schließt aus, dass eine Nichteindeutigkeit, wie wir ” sie vom Dezimalsystem in Form von 0.99999 · · · = 1.00000 . . . kennen, zugelassen ist. Die positionelle Schreibweise sieht so aus: (x)g := σ0.a−1 a−2 · · · gn . (3.3) Der Punkt zwischen 0 und a−1 wird Dezimalpunkt genannt, wenn g = 10, Binärpunkt, wenn g = 2. Eine Zahl x kann eine endliche Anzahl von Ziffern haben bezüglich einer Basis und eine unendliche Anzahl von Ziffern in einer anderen Basis. Zum Beispiel gilt für x = 1/3: (x)10 = +0.3 , (x)3 = +0.1 . Für x := 103 3/4 haben wir (x)10 = +[103.75] , (x)2 = +[1100111.11] , (x)16 = +[67.C] . Um jede Ziffer in der Darstellung (3.3) im Dualsystem darstellen zu können, benötigen wir einen Code. Für das Oktalsystem (g = 8) kann man etwa nutzen: Ziffer 0 1 2 3 4 5 6 7 Codewort 000 001 010 011 100 101 110 111 Für die Zahlen, die wir oben beschrieben haben, benötigen wir im Allgemeinen unendlich viele Speicherplätze. Daher müssen wir die Darstellung (3.3) einschränken. Dies geschieht dadurch, dass die Reihe bei einem t ∈ N, der Mantissenlänge, abgebrochen wird und der Exponent n eingeschränkt wird. So gelangen wir zur Darstellung (x)g = σ0.x−1 . . . x−t ge wobei t ∈ N die Anzahl der erlaubten signifikanten Ziffern x−i ∈ {0, 1, . . . , g − 1} ist; e ∈ Z wird Exponent genannt, welcher in einem Bereich emin , emax variieren kann. Damit gelangen wir zur Menge der Computerzahlen/Fließkommazahlen x−1 , . . . x−t ∈ {0, 1, . . . , g − 1}, x−1 6= 0, e F := F(g, t, emin , emax ) := σ 0.x−1 . . . x−t g | ∪{0} . e ∈ Z, emin ≤ e ≤ emax , σ ∈ {+, −} Es ist einfach, diese Zahlen zu zählen: #F(g, t, emin , emax ) = 2(g − 1)gt−1 (emax − emin + 1) In F(g, t, emin , emax ) sind größte und kleinste Zahl gegeben durch xmin := +[10 . . . 0] gemin −t = gemin −1 , xmax := +[δ . . . δ] gemax −t = gemax (1−g−t ) wobei δ = g−1 . Offenbar gilt für alle Computerzahlen x 6= 0 g−emin −1 ≤ |x| ≤ gemax . Gilt |x| < g−emin −1 , so wird im Allgemeinen x durch Null ersetzt. Zahlen x mit |x| > gemax können nicht verarbeitet werden. Treten diese Fälle auf, so spricht man von Exponentenüberlauf. In jedem Intervall [ge−1 , ge ], emin ≤ e ≤ emax , finden wir µ = gt − gt−1 + 1 gleichförmig verteilte Zahlen: F ∩ [ge−1 , ge ] = {ge−1 , ge−1 + ge−t , . . . , ge−1 + µge−t } . (3.4) Beachte, dass der Zuwachs ge−t anwächst, wenn e von emin auf emax anwächst. Stand: 9. Februar 2010 34 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.5. COMPUTERZAHLEN Lemma 3.5.2 Betrachte das System F(g, t, emin , emax ) . Sei x eine reelle Zahl mit xmin ≤ |x| ≤ xmax . Dann gilt: |z − x| 1 min ≤ g−t+1 . (3.5) z∈F |x| 2 Beweis: Ohne Einschränkungen können wir annehmen: x ist positiv. Wir können annehmen, dass mit einem e mit emin ≤ e ≤ emax gilt: x ∈ [ge−1 , ge ] . Aus (3.4) erhalten wir, dass eine Zahl z ∈ [ge−1 , ge ] mit |z − x| ≤ 21 ge−t existiert. Wegen ge−1 ≤ x ist die Behauptung bewiesen. Die Zahl eps := 12 g−t+1 heißt Maschinengenauigkeit. Beachte, sie hängt nur von der Mantissenlänge t ab. Auf einem Computer sind üblicherweise zwei Formate von Fließkommazahlen verfügbar: einfache und doppelte Genauigkeit. Im IEEE-Standard mit einfacher Geneauigkeit haben wir eps = 2−23 ≈ 10−7 . Wegen des nötigen Übergangs von einer reellen Zahl x zu einer Computerzahl, muß x im Allgemeinen durch eine Approximation ersetzt werden. Dieser Prozeß wird als Runden bezeichnet. Sei F das obige System der Computerzahlen. Es werden zwei Wege beschritten, eine gegebene reelle Zahl x durch eine Computerzahl f l(x) zu ersetzen: Runden und Abschneiden. Betrachte die positive reelle Zahl x dargestellt durch x = σ0.x−1 . . . d−t d−t−1 . . . ge . Abschneiden: ch(x) := σ0.x−1 . . . d−t ge . Rundung: ( σ0.x−1 . . . (1 + d−t ) ge rd(x) := σ0.x−1 . . . d−t ge , falls dt+1 ≥ g/2 . , sonst Der Fehler, der ensteht, wenn man x durch f l(x) ersetzt, wird Rundungsfehler genannt. Definition 3.5.3 Sei x eine reelle Zahl, x 6= 0 . Der absolute Fehler von x ist gegeben durch |x − f l(x)| und der relative Fehler durch |x − f l(x)|/|x| . Korollar 3.5.4 Sei das System F(g, t, emin , emax ) gegeben und sei x eine reelle Zahl mit xmax ≤ |x| ≤ xmin . Dann folgt für den relativen Rundungsfehler: |ch(x) − x| |rd(x) − x| ≤ eps , ≤ 2eps . |x| |x| (3.6) Die Grundoperationen der Arithmetik sind +, −, ·, / . Wie sind diese Operationen realisiert in einem Fließkommasystem F := F(g, t, emin , emax )? Sei eine der Operationen +, −, ·, / . Wir bezeichnen die entsprechende Operation, realisiert in F mit ∗ . Wir nehmen an, dass sie so realisiert sei: x∗ y := f l(xy) für x, y ∈ F mit xmin ≤ |x∗ y| ≤ xmax . (3.7) Klar, im Fall = / haben wir anzunehmen, dass y 6= 0 . Stand: 9. Februar 2010 35 c J.Baumeister KAPITEL 3. ALGORITHMEN UND PROGRAMME 3.6. ÜBUNGEN Als Konsequenz haben wir: x∗ y = (xy)(1 + τ ) mit |τ | ≤ κ eps . Hier ist κ eine Konstante, die nicht von x, y abhängt. Probleme der Computer-Arithmetik sind: Überlauf Siehe oben. Unterlauf Siehe oben. Auslöschung Addition etwa gleich großer Zahlen mit entgegengesetztem Vorzeichen führt zu einer starken Verringerung der Tahl der gültigen Ziffern. Rechenregeln Selbst in Fällen, wo weder Überlauf noch Unterlauf eintritt, gelten die Rechenregeln der reellen Zahlen nicht mehr. 3.6 1.) Übungen S Sei A ein (endliches) Alphabet, sei A∗ := {()} ∪ n∈N An die Menge der Wörter (beliebiger Länge) über dem Alphabet A . Für zwei Worte u = (u1 , . . . , uk ) ∈ Ak , v = (v1 , . . . , vl ) ∈ Al setzen wir: uv := (u1 , . . . , uk , v1 , . . . , vl ) ∈ Ak+l . Wir definieren für u, v ∈ A∗ : u ≤ v : ⇐⇒ Es gibt z ∈ A∗ mit uz = v . (a) Zeige: ≤ ist eine Halbordnung in A∗ . (b) Ist ≤ stets eine Ordnung in A∗ ? (c) Gibt es in A∗ ein Wort w, so dass gilt: w ≤ u für alle u ∈ A∗ . 2.) Maple Eine Armstrong-Zahl ist eine n-stellige natürliche Zahl, deren Wert gleich der Summe der n-ten Potenzen ihrer Ziffern ist. Ermitteln Sie mit Maple eine Liste aller dreistelligen Armstrong-Zahlen. 3.) Maple: Eine Permutation der Zahlen 1, 2, . . . , n ist eine Umstellung dieser Zahlen. (a) Ermittle die Anzahl der Permutationen von 1, 2, . . . , 8 . (b) Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung mit dieser Permutation in falscher Reihenfolge stehen. Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl. Stand: 9. Februar 2010 36 c J.Baumeister Kapitel 4 Abbildungen Hier stellen wir zum Einen das Handwerkszeug beim Umgang mit Abbildungen dar, zum Anderen skizzieren wir zwei konkrete Abbildungsklassen, die für Anwendungen interessant sind. Dabei begegnen wir auch dem Gruppenbegriff. Abschließend wollen wir mit dem Begriff des Isomorphismus andeuten, was eine Struktur ausmacht. Am Ende dieses Kapitels haben wir dann die wesentlichen Objekte kennengelernt, mit denen weitere Begriffe definiert und Theorien entwickelt werden. 4.1 Definitionen Mit Abbildungen drücken wir den mathematischen Sachverhalt aus, dass es zwischen zwei Objekten eine klar definierte Abbhängigkeit gibt. Wiederum behandeln wir den Begriff auf der Ebene einer naiven Auffassung, auf der Ebene einer fundierten Mengenlehre lässt sich der Begriff der Abbildung ebenso wie der Umgang mit Mengen auf eine sicherere Basis stellen. Definition 4.1.1 Seien A, B, C, D Mengen. (a) Eine Abbildung f von A nach B ist eine Vorschrift, durch die jedem a ∈ A genau ein Bild f (a) ∈ B zugeordnet wird; A heißt Definitionsbereich, B heißt Wertebereich von f. Wir schreiben f : A −→ B . (b) Zwei Abbildungen f : A −→ B, g : C −→ D heißen gleich, wenn gilt: A = C, B = D, f (x) = g(x) für alle x ∈ A . Wir werden später auch von Funktionen sprechen. In unserem Verständnis ist eine Funktion ein Spezialfall einer Abbildung: wir sprechen dann von einer Funktion, wenn wir eine Abbildung zwischen Zahlbereichen haben, d.h. wenn Definitions– und Wertebereich der Abbildung Mengen von Zahlen sind.1 Beispiel 4.1.2 Sei A eine Menge. Dann nennt man die Abbildung idA : A ∋ x 7−→ x ∈ A die Identität auf A. (Manchmal lassen wir den Index A weg und schreiben einfach id, wenn klar ist, um welches A es sich handelt.) 1 Der Abbildungsbegriff, wie wir ihn hier eingeführt haben, konnte erst nach G. Cantor in Mode“ kommen, ” da nun Mengen handhabare Objekte waren. 37 KAPITEL 4. ABBILDUNGEN 4.1. DEFINITIONEN Beispiel 4.1.3 Seien A, B Mengen. Dann heißt die Abbildung π1 : A × B ∋ (a, b) 7−→ a ∈ A die Projektion auf den ersten Faktor.2 Es sollte klar sein, dass entsprechend auch die Projektionen auf beliebige Faktoren in einem kartesischen Produkt erklärt sind. Beispiel 4.1.4 Sei A eine Menge. Jede Abbildung N ∋ n 7−→ xn ∈ A nennt man eine Folge mit Folgengliedern aus A . Meist schreiben wir dafür kurz (xn )n∈N . Jede Abbildung {1, . . . , m} × {1, . . . , n} ∋ (i, j) 7−→ aij ∈ A nennen wir eine Matrix mit m Zeilen und n Spalten mit Einträgen aus A . Meist schreiben wir dafür kurz (aij )1≤i≤n,1≤j≤m . Wenn wir A := {0, 1, . . . , 255} wählen, können wir eine solche Matrix als Pixelbild mit m · n Pixeln und 28 = 256 Grauwertstufen interpretieren. Definition 4.1.5 Sei f : A −→ B eine Abbildung. Die Menge graph(f ) := {(a, b) ∈ A × B|a ∈ A, b = f (a)} heißt der Graph von f . Definition 4.1.6 Sei f : X −→ Y eine Abbildung und seien A ⊂ X, B ⊂ Y . Dann heißt die Menge f (A) := {f (x)|x ∈ A} die Bildmenge von A oder das Bild von A, und die Menge −1 f (B) := {x ∈ X|f (x) ∈ B} heißt die Urbildmenge von B oder einfach das Urbild von B. Beispiel 4.1.7 Sei f : N ∋ n 7−→ 2n + 1 ∈ N . Dann ist das Bild von f die Menge aller ungeraden natürlichen Zahlen mit Ausnahme von 1 . Regel 4.1.8 Sei f : X −→ Y, A1 , A2 ⊂ X, B1 , B2 ⊂ Y . A1 ⊂ A2 f (A1 ∪ A2 ) f (A1 ∩ A2 ) −1 B1 ⊂ B 2 f (B1 ∪ B2 ) =⇒ f (A1 ) ⊂ f (A2 ) f (A1 ) ∪ f (A2 ) = ⊂ =⇒ (4.2) f (A1 ) ∩ f (A2 ) (4.3) f (B1 ) ⊂ f (B2 ) (4.4) f (B1 ) ∪ f (B2 ) (4.5) −1 −1 = (4.1) −1 −1 2 Die Wortwahl wird verständlich, wenn wir uns A × A als Koordinatensystem realisiert denken. Dann wird von einem Punkt durch Beleuchtung parallel zur zweiten Koordinatenachse auf der ersten Achse der projezierte Punkt sichtbar. Stand: 9. Februar 2010 38 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Beweisen wir etwa (4.5). Da eine Gleichheit von Mengen behauptet wird, sind zwei Inklusionen zu verifizieren. −1 −1 −1 Zu f (B1 ∪ B2 ) ⊂ f (B1 ) ∪ f (B2 ) . −1 −1 Sei x ∈ f (B1 ∪ B2 ) . Also gilt f (x) ∈ B1 ∪ B2 . Ist f (x) ∈ B1 , dann ist x ∈ f (B1 ) ⊂ −1 −1 −1 −1 −1 f (B1 ) ∪ f (B2 ) . Ist f (x) ∈ B2 , dann ist x ∈ f (B2 ) ⊂ f (B1 ) ∪ f (B2 ) . −1 −1 −1 Zu f (B1 ) ∪ f (B2 ) ⊂ f (B1 ∪ B2 ) . −1 −1 −1 −1 Sei x ∈ f (B1 ) ∪ f (B2 ) . Ist x ∈ f (B1 ), dann ist f (x) ∈ B1 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) . −1 −1 Ist x ∈ f (B2 ), dann ist f (x) ∈ B2 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) . Definition 4.1.9 Seien f : X −→ Y , g : Y −→ Z Abbildungen. Die Hintereinanderausführung oder Komposition g ◦ f der Abbildungen f, g ist erklärt durch g ◦ f : X ∋ x 7−→ g(f (x)) ∈ Z . Regel 4.1.10 Seien f : X −→ Y, g : Y −→ Z, h : Z −→ W Abbildungen. idY ◦ f = f ◦ idX (4.6) h ◦ (g ◦ f ) = (h ◦ g) ◦ f (4.7) Die Identität in (4.7) nennt man das Assoziativgesetz. Man beachte, dass für die Hintereinanderausführung von Abbildungen ein Kommutativgesetz ( f ◦ g = g ◦ f ) im allgemeinen nicht gilt. 4.2 Permutationen Definition 4.2.1 Sei f : X −→ Y eine Abbildung. (i) f injektiv genau dann, wenn für alle x, x′ ∈ X x 6= x′ =⇒ f (x) 6= f (x′ ) gilt. (ii) f surjektiv genau dann, wenn für alle y ∈ Y ein x ∈ X existiert mit y = f (x) . (iii) f bijektiv : ⇐⇒ f injektiv und surjektiv Wir charakterisieren die Eigenschaften von Abbildungen aus Definition 4.2.1 in einer Weise, die uns dann weiterbringt. Satz 4.2.2 Sei f : X −→ Y eine Abbildung und sei B := f (X). Dann gilt: (a) f ist injektiv genau dann, wenn g : B −→ X existiert mit g ◦ f = idX . (b) f ist surjektiv genau dann, wenn g : Y −→ X existiert mit f ◦ g = idY . (c) f ist bijektiv genau dann, wenn g : Y −→ X existiert mit g ◦ f = idX , f ◦ g = idY . Stand: 9. Februar 2010 39 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Beweis: Zunächst eine Vorüberlegung. −1 −1 Sei y ∈ B . Dann ist f ({y}) 6= ∅ ; wähle xy ∈ f ({y}) . Damit definieren wir ĝ : B ∋ y 7−→ ĝ(y) := xy ∈ X . −1 Zu (a). Sei f injektiv. Wir setzen g := ĝ . Da f injektiv ist, gilt f ({y}) = xy für jedes y ∈ B . Sei x ∈ X, y := f (x) . Dann ist also x = xy und wir haben (g ◦ f )(x) = g(f (x)) = ĝ(f (xy )) = xy = x = idX (x) für alle x ∈ X . Sei nun g : B −→ X mit g ◦ f = idX . Seien x, x′ ∈ X mit f (x) = f (x′ ). Dann ist x = idX (x) = g(f (x)) = g(f (x′ )) = idX (x′ ) = x′ , was wir zeigen wollten. Zu (b). Sei f surjektiv. Wir setzen g := ĝ und beachten B = Y . Dann ist (f ◦ g)(y) = f (ĝ(y)) = f (xy ) = y = idY (y) . Die Umkehrung ist trivial. Zu (c). Gibt es g mit den notierten Eigenschaften, dann ist nach (a) und (b) die Bijektivität von f klar. Sei nun f bijektiv. Dann ist B = Y und es gibt nach (a) und (b) Abbildungen ga : Y −→ X und gb : Y −→ X mit ga ◦ f = idX , f ◦ gb = idY . Wir zeigen ga = gb und sind dann fertig. Unter Verwendung der eben angeführten Identitäten folgt: ga = ga ◦ idY = ga ◦ (f ◦ gb ) = (ga ◦ f ) ◦ gb = idX ◦ gb = gb . Im Beweis der Vorüberlegung des Beweises zu Satz 4.2.2 haben wir das so genannte starke Auswahlaxiom benutzt.3 Definition 4.2.3 Sei f : X −→ Y bijektiv. Die nach Satz 4.2.2 (c) eindeutig bestimmte Abbildung4 g mit g ◦ f = f ◦ g = id heißt die (zu f ) inverse Abbildung. Wir schreiben dafür f −1 . −1 Die Notation f und f −1 passt folgendermaßen zusammen: Ist f : X −→ Y eine bijektive −1 Abbildung, B ⊂ Y, dann ist f −1 (B) = f (B) . Beispiel 4.2.4 Sei f : R\{0} ∋ x 7−→ x1 ∈ R\{0} . Dann ist sicherlich f −1 = f . Ein weiteres Beispiel dieser Art ist f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 . Auch hier gilt f −1 = f . Lemma 4.2.5 Seien f : X −→ Y , g : Y −→ Z bijektiv. Dann ist auch g ◦ f : X −→ Z bijektiv und es gilt (g ◦ f )−1 = f −1 ◦ g−1 . 3 Es besagt, dass man zu einer Familie Xα , α ∈ A, von Mengen eine Auswahlfunktion c : A −→ ∪α∈A Xα mit c(α) ∈ Xα für alle α ∈ A existiert. Dahinter versteckt sich ein Problem, das in den Grundlagen der Mathematik auf der Basis einer fundierten Mengenlehre seinen Platz hat; hier halten wir an diesem Axiom wie an einem Glaubenssatz fest. 4 In der Literatur spricht man bei bijektiven Abbildungen oft auch von umkehrbar eineindeutigen Abbildungen. In Satz 4.2.2 zusammen mit Definition 4.2.1 liegt die Berechtigung für eine solche Sprechweise. Stand: 9. Februar 2010 40 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Beweis: Dies verifiziert man ohne Mühe. Sei M eine nichtleere Menge. Wir setzen Abb (M ) := {f : M −→ M } . In dieser Menge der Selbstabbildungen von M ist eine Multiplikation“ erklärt durch die Kom” position von Abbildungen: f • g := f ◦ g , f, g ∈ Abb (M ) . (G := {f ∈ Abb (M )|f bijektiv } , • := ◦) wird damit zu einer Gruppe. Die Definition dieser mathematischen Objekte folgt nun.5 Definition 4.2.6 Eine Menge G zusammen mit einer Verknüpfung • : G × G ∋ (a, b) 7−→ a • b ∈ G heißt eine Gruppe genau dann, wenn gilt: a) Es gibt ein Element e ∈ G mit a • e = e • a = a für alle a ∈ G . b) Zu jedem a ∈ G gibt es ein Element ā ∈ G mit c) Für alle a, b, c ∈ G gilt a • ā = ā • a = e . a • (b • c) = (a • b) • c . Ist zusätzlich noch d) Für alle a, b ∈ G gilt a • b = b • a. erfüllt, so heißt die Gruppe kommutativ. Sei G eine Gruppe. Die Bedingung a) besagt, dass es ein bezüglich der Verknüpfung “•“ neutrales Element e in G gibt. Ist e′ ein weiteres neutrales Element in G, so lesen wir aus e′ = e′ • e = e ab, dass das neutrale Element in einer Gruppe eindeutig bestimmt ist; dabei haben wir a) zweimal verwendet. Das in der Bedingung b) eingeführte Element ā heißt das zu a inverse Element. Es ist ebenfalls eindeutig bestimmt, denn aus a • ā = ā • a = e , a • ā′ = ā′ • a = e , folgt ā′ = ā′ • e = ā′ • (a • ā) = (ā′ • a) • ā = e • ā = ā . Die Bedingung c), die wir eben verwendet haben, nennt man das Assoziativgesetz. Es besagt, dass Klammern bei der Reihenfolge der Verknüpfungen beliebig gesetzt werden dürfen und deshalb, soweit sie nicht für die Lesbarkeit benötigt werden, weggelassen werden dürfen. 5 Die Gruppen sind von überrragender Bedeutung. Ihre Nutzung hinterließ eine Erfolgsspur in der Mathematik. Von H. Poincaré ist die Aussage überliefert, Gruppen seien die ganze Mathematik“. ” Stand: 9. Februar 2010 41 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Wegen der Eindeutigkeit des inversen Elements (siehe oben) können wir nun ein inverses Element in der Bezeichnung auszeichnen. Bezeichnung: Wir schreiben für das inverse Element ā von a im abstrakten Rahmen meist a−1 , in speziellen Fällen weichen wir davon ab. ◦ id τ1 τ2 τ3 τ4 τ5 id id τ1 τ2 τ3 τ4 τ5 τ1 τ1 id τ3 τ2 τ5 τ4 τ2 τ2 τ4 id τ5 τ1 τ3 τ3 τ3 τ5 τ1 τ4 id τ2 Wir führen nun eine Reihe von Beispielen an und zeigen damit, dass der Gruppenbegriff τ4 τ4 τ2 τ5 id τ3 τ1 in der Tat geeignet ist, viele Objekte unter eiτ5 τ5 τ3 τ4 τ1 τ2 id nem gemeinsamen Gesichtspunkt zu betrachten. Dabei schreiben wir dann Verknüpfung, Abbildung 4.1: Die Permutationsgruppe S3 Einselement, Inverses immer mit dem Symbol, das wir in der speziellen Situation bereits kennen. Auf die Verifikation der Assoziativität bzw. Kommutativität verzichten wir meist, da hier in der Regel kein Problem vorliegt. Beispiel 4.2.7 (G := Z, • := +) ist eine kommutative Gruppe mit neutralem Element 0 und Inversem −z für z ∈ Z . Wenn die Verknüpfung eine Addition ist wie etwa in Beispiel 4.2.7, nennt man das Inverse eines Elements meist das Negative. Ist die Verknüpfung • in einer Gruppe einer Addition verwandt“, so nennt man sie, wenn sie kommutativ ist, auch abelsch.6 ” Beispiel 4.2.8 (G := Q, • := +) , (G := R, • := +) sind abelsche Gruppen. Das neutrale Element ist jeweils 0, das Inverse (Negative) eines Elementes r ist −r. Beispiel 4.2.9 (G := R∗ := R\{0}, • := ·) ist eine kommutative Gruppe mit neutralem Element 1 und Inversem a−1 für a ∈ R∗ . Die Rechenregeln einer Gruppe sind uns hier wohlvertraut, ebenso die Potenzregeln. Man beachte, dass wir das Nullelement aus R entfernen mussten, da dieses Element kein Inverses bezüglich der Multiplikation besitzt. Nun haben wir die Gruppenstrukturen in den Zahlen erkannt. Wir finden sie auch beim Rechnen mit Restklassen, wie wir im Kapitel 6 sehen werden. Kehren wir zurück zu G := {f ∈ Abb (M )|f bijektiv } , • := ◦ . (G, •) ist damit eine (im allgemeinen nicht kommutative) Gruppe; wir bezeichnen sie mit S(M ) . Das Assoziativgesetz ist klar, das neutrale Element ist die Identität idM , das inverse Element eines Elements f ∈ G ist f −1 . Beachte auch, dass mit f, g ∈ G auch f ◦ g ∈ G , f −1 ∈ G gilt. Definition 4.2.10 Ist M eine nichtleere Menge, so nennen wir die Gruppe S(M ) die symmetrische Gruppe von M. Ist M = {1, . . . , m}, dann nennen wir S(M ) Permutationsgruppe und jedes Element in S(M ) eine Permutation. In diesem Spezialfall schreiben wir kurz Sm . 6 Der Begriff abelsch“ ist vom Namen des norwegischen Mathematikers N.H. Abel abgeleitet. Neben Arbeiten ” zur Konvergenz von Reihen beschäftigte er sich mit der Lösbarkeit von Gleichungen fünften Grades und bewies die Unmöglichkeit der Lösung einer allgemeinen Gleichung fünften Grades mit Hilfe von Radikalen (Wurzelausdrücken); siehe dazu Abschnitt 11.7. Seine Ideen hierzu sind eng mit denen des französischen Mathematikers E. Galois, dessen Theorie in der Algebra eine überragende Rolle spielt, verwandt. Mit ihm teilt er auch das Schicksal, sehr jung zu sterben, Abel starb an Schwindsucht, Galois in einem Duell. Stand: 9. Februar 2010 42 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Die Wortwahl Permutationsgruppe wird verständlich, wenn wir beobachten, dass bei der Menge M = {1, . . . , m} einer Abbildung f in Sm die Umstellung der Elemente in M gemäß 1 2 ... m f (1) f (2) . . . f (m) entspricht. Die Wortwahl symmetrische Gruppe rührt daher, daß die Funktionen der Variablen x1 , . . . , xm , die bei allen Permutationen der Variablen invariant bleiben, die symmetrischen Funktionen sind; siehe Abschnitt 7.2. Beispiel 4.2.11 Wir betrachten S3 . Die sechs Elemente der Gruppe sind dann in obiger Schreibweise 123 123 123 123 123 123 τ0 = τ1 = τ2 = τ3 = τ4 = τ5 = . 123 132 213 231 312 321 Klar, τ0 ist die Identität. Die Gruppentafel ist in Abbildung 4.1 dargestellt. Beispielsweise bedeutet τ4 in Spalte 3, Zeile 4 τ1 ◦ τ2 = τ4 und τ2 in Spalte 7, Zeile 5 τ5 ◦ τ3 = τ2 . Bemerkung 4.2.12 Einer endlichen Gruppe, d.h. einer Gruppe mit endlich vielen Elementen, kann man durch Blick auf ihre Gruppentafel sofort ansehen, ob sie kommutativ ist. Sie ist nämlich kommutativ genau dann, wenn ihre Gruppentafel symmetrisch zur Hauptdiagonalen ist. S3 ist also nicht kommutativ. Daraus folgt, dass Sm , m ≥ 3, nicht kommutativ ist (Beweis!). Sei nun stets Sm für m ≥ 2 betrachtet, S1 ist ja trivial! Definition 4.2.13 Sei σ ∈ Sm . Wir setzen a(σ) := #{(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} , ǫ(σ) := (−1)a(σ) und nennen σ gerade, falls ǫ(σ) = 1 gilt, anderenfalls ungerade. ǫ(σ) heißt Signum/Signatur von σ und a(σ) die Fehlstandszahl von σ . Beispiel 4.2.14 Sei σ= 1 2 3 4 5 3 5 1 4 2 . Dann gilt a(σ) = 6, denn wir zählen A := {(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} folgendermaßen ab. i = 1 : (1, 3), (1, 5) ∈ A ; i = 2 : (2, 3), (2, 4), (2, 5) ∈ A ; i = 3 : Fehlanzeige; i = 4 : (4, 5) ∈ A . Also ist σ eine gerade Permutation. Lemma 4.2.15 Für jedes σ ∈ Sm gilt ǫ(σ) = Y 1≤i<j≤m Beweis: Sei n := a(σ) . Es gilt: Y (σ(j) − σ(i)) = 1≤i<j≤m Y 1≤i<j≤m,σ(i)<σ(j) = Y 1≤i<j≤m,σ(i)<σ(j) n = (−1) Y 1≤i<j≤m Stand: 9. Februar 2010 σ(j) − σ(i) j−i (σ(j) − σ(i)) · Y 1≤i<j≤m,σ(i)>σ(j) Y n (σ(j) − σ(i)) · (−1) n |σ(j) − σ(i)| = (−1) 43 (σ(j) − σ(i)) 1≤i<j≤m,σ(i)>σ(j) Y |σ(j) − σ(i)| (j − i) 1≤i<j≤m c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.2. PERMUTATIONEN Bei der letzten Gleichung haben wir die Beobachtung verwendet, dass die beiden Produkte bis auf die Reihenfolge die gleichen Faktoren enthalten, was aus der Bijektivität von σ folgt. Ein τ ∈ Sm heißt Nachbarvertauschung, wenn ∃i ∈ {1, . . . , m} mit τ (i) = i + 1 , τ (i + 1) = i ; τ (j) = j , j 6= i, i + 1, gilt. Ein τ = τkl ∈ Sm , k 6= l , heißt Transposition, wenn gilt: τ (k) = l , τ (l) = k ; τ (j) = j , j 6= k, l , gilt. Nachbarvertauschungen sind also spezielle Transpositionen. Man überzeugt sich leicht, dass für eine Transposition τ ∈ Sm gilt: τ −1 = τ . Lemma 4.2.16 Sei σ ∈ Sm und sei τ ∈ Sm eine Nachbarvertauschung. Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) . Beweis: ǫ(τ ◦ σ) = = Y 1≤i<j≤m Y 1≤i<j≤m = ǫ(σ) τ (σ(j)) − τ (σ(i)) j−i τ (σ(j)) − τ (σ(i)) · σ(j) − σ(i) Y 1≤i<j≤m Y 1≤i<j≤m σ(j) − σ(i) j−i τ (σ(j)) − τ (σ(i)) = −ǫ(σ) . σ(j) − σ(i) Bei der letzten Gleichheit haben wir verwendet, dass im Produkt Y τ (σ(j)) − τ (σ(i)) 1≤i<j≤m σ(j) − σ(i) auf Grund der Tatsache, dass τ eine Transposition ist, alle Faktoren den Wert 1 haben mit einer Ausnahme; dieser Faktor hat den Wert −1. Korollar 4.2.17 Sei σ ∈ Sm und sei τ ∈ Sm eine Transposition. Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) . Beweis: Sei etwa τ = τkl . Setze σ ′ := τ ◦ σ . Betrachte nun Σ′ : σ ′ (1), . . . , σ ′ (m) Σ : σ(1), . . . , σ(m) Hier unterscheiden sich die beiden Anordnungen nur dadurch, dass k und l die Plätze getauscht haben. Sei s die Anzahl der Zahlen, die in Σ zwischen k und l vorkommen. Dann erhält man Σ′ aus Σ durch 2s + 1 sukzessive Vertauschung benachbarter Elemente. Nach Lemma 4.2.16 gilt dann ǫ(σ ′ ) = (−1)2s+1 ǫ(σ) = −ǫ(σ) . Satz 4.2.18 Jedes σ ∈ Sm läßt sich als Hintereinanderausführung von höchstens m Transpositionen schreiben, d.h. zu jedem σ ∈ Sm gibt es s ≤ m Transpositionen τ1 , . . . , τs mit σ = τ1 ◦ · · · ◦ τs . Beweis: Sei σ ∈ Sm . Für σ = id gilt σ = τ21 ◦ τ12 . Sei σ 6= id . Dann gibt es ein kleinstes i1 mit σ(i1 ) = j1 6= i1 . Setze σ1 := σ ◦ τi1 j1 . Es ist σ1 (i) = i für 1 ≤ i ≤ i1 . Falls σ1 = id gilt, sind wir fertig. Anderenfalls gibt es ein i2 > i1 mit σ1 (i2 ) = j2 6= i2 . Setze σ2 := σ1 ◦ τi2 j2 . Dann gilt σ2 (i) = i für 1 ≤ i ≤ i2 . So fortfahrend erreichen wir ein σs , s ≤ m, mit σs = id . Dann ist σ = τis js ◦ · · · ◦ τi1 j1 . Stand: 9. Februar 2010 44 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.3. METRIKEN Korollar 4.2.19 Ist σ ∈ Sm Hintereinanderausführung von r Transpositionen, dann gilt ǫ(σ) = (−1)r . Beweis: Folgt aus Satz 4.2.18 durch mehrmaliges Anwenden von ǫ(τ ◦σ) = −ǫ(σ) (siehe Folgerung 4.2.17) für jede beteiligte Transposition τ. Wir haben gesehen, dass unabhängig von der Art der Darstellung einer Permutation als Produkt von Transpositionen die Anzahl der dabei benötigten Transpositionen bei geraden Permutationen stets gerade und bei ungeraden Permutationen stets ungerade ist. Korollar 4.2.20 Sei m ≥ 2 . Dann gilt: (a) ǫ(σ ◦ σ ′ ) = ǫ(σ)ǫ(σ ′ ) , σ, σ ′ ∈ Sm . (b) ǫ(σ −1 ) = ǫ(σ) , σ ∈ Sm . (c) #Sm = m! , #Am = m!/2 . Beweis: (a) folgt aus Satz 4.2.18 und Folgerung 4.2.19, ebenso (b), da für jede Transposition τ gilt: τ −1 = τ . Die Aussage #Sm = m! in (d) ist klar, da es sich bei Sm um die Menge der Permutationen handelt, die Ausage #Am = m!/2 folgt aus der Tatsache, dass für jede Nachbarvertauschung τ durch Sm ∋ σ 7−→ τ ◦ σ ∈ Sm eine bijektive Abbildung definiert ist, bei der die geraden Permutationen auf ungerade und die ungeraden Permutationen auf gerade Permutationen abgebildet werden. (c) folgt aus der Tatsache, dass für σ ∈ Sm , τ ∈ Am stets ǫ(σ ◦ τ ◦ σ −1 ) = ǫ(σ)ǫ(τ )ǫ(σ −1 ) = 1 gilt. Definition 4.2.21 Die Menge Am := {σ ∈ Sm |ǫ(σ) = 1} heißt alternierende Gruppe. 4.3 Metriken Wir bringen nun das Objekt metrische Räume“ ins Spiel. Damit wollen wir modellieren, dass ” man in einer Menge mehr oder minder gut interpretierbare Abstände zwischen zwei Elementen dieser Menge erklären kann. Die Nützlichkeit dieses Vorgehens wird sich bald erweisen. Definition 4.3.1 Sei X eine nichtleere Menge. Eine Abbildung d : X × X Metrik, wenn folgende drei Bedingungen erfüllt sind: −→ X heißt a) d(x, y) = 0 genau dann, wenn x = y gilt; (Definitheit) b) d(x, y) = d(y, x) für alle x, y ∈ X ; (Symmetrie) c) d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X . (Dreiecksungleichung) Die Zahl d(x, y) heißt Abstand von x, y . Eine Menge X zusammen mit einer Metrik d wird als metrischer Raum (X, d) bezeichnet. Entsprechend der Bezeichnungsweise, dass d(x, y) für den Abstand von x, y steht, sollte man erwarten, dass d(x, y) stets nichtnegativ ist. Dies ist aber schon in der Definition 4.3.1 enthalten, wie folgende Zeile zeigt: 0 = d(x, x) ≤ d(x, y) + d(y, x) = 2d(x, y) d.h. d(x, y) ≥ 0 . Stand: 9. Februar 2010 45 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.3. METRIKEN Beispiel 4.3.2 Jede nichtleere Teilmenge A von R ist zusammen mit dem (euklidischen) Abstand d(x, y) := |x − y| ein metrischer Raum. Die definierenden Eigenschaften sind ohne Mühe nachzuweisen. Beispiel 4.3.3 Jede nichtleere Teilmenge A von R2 ist zusammen mit der euklidischen Metrik p d(x, y) := (x1 − y1 )2 + (x2 − y2 )2 , x = (x1 , x2 ), y = (y1 , y2 ) ein metrischer Raum. Der Nachweis der Dreiecksungleichung macht etwas Mühe, wir verweisen auf die Analysis. Beispiel 4.3.4 Sei S1 := {(x, y) ∈ R2 |x2 + y 2 = 1} der Rand des Einheitskreises. Wir können zwei verschiedene Metriken wählen: a) Die Metrik, die sich als Teilmenge von R2 gemäß Beispiel 4.3.3 ergibt. b) Die Metrik, die man erhält, wenn man den Abstand als Länge des kürzeren Kreisbogens, der zwei Punkte aus S1 verbindet, erklärt. Beispiel 4.3.5 Sei X eine nichtleere Menge. Dann wird durch ( 1 , falls x 6= y ∈R d : X × X ∋ (x, y) 7−→ 0 , falls x = y eine Metrik definiert. Nachrechnen! Interpretiert man den Abstand d(x, y) als Kosten für eine Straßenbahnfahrt in dem Haltestellennetz X, so bedeutet die Wahl der Metrik gerade, daß für jede Fahrt der Einheitspreis 1 ezu entrichten ist. Beispiel 4.3.6 Sei A ein Alphabet und seien An die Wörter der Länge n . Ein Abstand zwischen zwei Wörtern x = x1 . . . xn , y = x1 . . . yn ist definiert durch d(x, y) := #{i ∈ {1, . . . , n}|xi 6= yi } . Diese Metrik heißt Hamming–Abstand . Der Abstandsbegriff, der durch eine Metrik eingeführt wird, macht es möglich, die wesentlichen Begriffe der Analysis im Zusammenhang mit Folgen sofort auf metrische Räume zu übertragen. Dies soll nun geschehen. Dabei ist der Begriff der Folge zentral: eine Folge in X ist eine Abbildung N ∋ n 7−→ xn ∈ X ; wir schreiben dafür (xn )n∈N . Definition 4.3.7 Sei (X, d) ein metrischer Raum und sei (xn )n∈N eine Folge in X . a) Die Folge (xn )n∈N heißt Cauchyfolge genau dann, wenn gilt: ∀ ǫ > 0 ∃N ∈ N ∀m, n ≥ N (d(xn , xm ) < ǫ) . a) Die Folge (xn )n∈N heißt konvergent genau dann, wenn es x ∈ X gibt mit ∀ ǫ > 0 ∃N ∈ N ∀n ≥ N (d(xn , x) < ǫ) ; x heißt dann Grenzwert oder Limes der Folge und wir schreiben x = lim xn . n Stand: 9. Februar 2010 46 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.3. METRIKEN Beispiel 4.3.8 Sei die Metrik in R der übliche Abstand. Sei L ∈ R mit |L| < 1 . Dann gilt bekanntlich limn Ln = 0 , d.h. (Ln )n∈N ist eine Nullfolge. Die Dreiecksungleichung und die Definitheitseigenschaft einer Metrik haben sofort die Eindeutigkeit eines Grenzwertes zur Folge. Ebenso schnell sieht man ein, dass eine konvergente Folge stets eine Cauchyfolge ist. Man liest dies aus d(xn , xm ) ≤ d(xn , x) + d(x, xm ) ab, wenn (xn )n∈N gegen x konvergiert. Die Umkehrung davon gilt nicht immer, wie uns das Beispiel Q zusammen mit der Abstandsfunktion in R als Metrik zeigt. Dies ist der Anlass für die folgende Definition. Definition 4.3.9 Sei (X, d) ein metrischer Raum. a) Eine Teilmenge A von X heißt abgeschlossen genau dann, wenn für jede konvergente Folge (xn )n∈N mit xn ∈ A für alle n ∈ N stets lim xn ∈ A gilt. n b) (X, d) heißt vollständig genau dann, wenn jede Cauchyfolge in X konvergiert. Ist (X, d) ein metrischer Raum, dann ist X nach Definition abgeschlossen. Also gibt es zu A ⊂ X sicher eine kleinste Menge (bezüglich der Inklusion) A mit A ⊂ A und A abgeschlossen. Eine solche Menge A heißt der Abschluss von A; beispielsweise ist [a, b] der Abschluss von [a, b) im metrischen Raum R1 , versehen mit dem euklidischen Abstand. Klar, der metrische Raum (X, d) aus Beispiel 4.3.3 ist vollständig genau dann, wenn die Menge X eine abgeschlossene Teilmenge in R ist. In einem metrischen Raum (X, d) haben wir die Kugeln Br (x) := {y ∈ X|d(x, y) < r} , B r (x) := {y ∈ X|d(x, y) ≤ r} (r ≥ 0) um x ∈ X und die Umgebungen Uǫ (A) := {y ∈ X|d(x, y) < ǫ für ein x ∈ A} einer Teilmenge A von X zur Verfügung. Die Bezeichnung B r (x) ist passend gewählt, denn es gilt ja, dass der Abschluss Br (x) gerade B r (x) ist. Damit haben wir nun die Begriffe bereit, die wir benötigen, um Iterationen in einem metrischen Raum zu betrachten. Iterationen werden benutzt, um Folgen zu konstruieren, die einen erwünschten Grenzwert besitzen. Meist interessiert man sich für Punkte, die sich unter einer Abbildung nicht verändern, also für so genannte Fixpunkte. Definition 4.3.10 Sei (X, d) ein metrischer Raum und sei T : X −→ X eine Abbildung. Ein Punkt x ∈ X heißt ein Fixpunkt von T, wenn T (x) = x gilt. Beispiel 4.3.11 De Abbildung f : N ∋ x 7−→ 2x + 1 ∈ N hat keine Fixpunkte. Die Abbildung f : R\{0} ∋ x 7−→ x1 ∈ R\{0} hat die Fixpunkte 1, −1 . Die Fixpunktmenge von f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 ist die Diagonale“ {(x, x)|x ∈ Z} . ” Hier kommt der Satz, der über die Existenz von Fixpunkten und ihrer Berechnung Aufschluss gibt. Stand: 9. Februar 2010 47 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.3. METRIKEN Satz 4.3.12 (Banachscher Fixpunktsatz) Sei (X, d) ein vollständiger metrischer Raum und sei T : X −→ X eine Kontraktion, d.h. ∃ L ∈ [0, 1) ∀ x, y ∈ X (d(T (x), T (y)) ≤ Ld(x, y)) . (4.8) Dann gilt: a) T besitzt einen eindeutig bestimmten Fixpunkt x . b) Für alle x ∈ X konvergiert die Folge (xn )n∈N , definiert durch xn+1 := T (xn ) , x0 := x , gegen x und es gilt: d(xm+1 , x) ≤ Lm d(T (x), x) , m ∈ N . 1−L Beweis: Sei x ∈ X . Man beweist mit Hilfe der Voraussetzung (4.8) für n, m, n > m ≥ 1, sofort folgende Aussagen: d(T (xn+1 ), T (xn )) ≤ d(T (xn ), T (xn−1 )) ≤ · · · ≤ Ln d(T (x), x) ; n−1 n−1 X X Li d(T (x), x) d(T (xi+1 ), T (xi )) ≤ d(T (xn ), T (xm )) ≤ (4.9) i=m i=m ≤ Lm d(T (x), x) n−1−m X j=0 Lj ≤ Lm 1 d(T (x), x) . 1−L (4.10) Aus (4.10) folgt nun die Tatsache, dass in (xn )n∈N eine Cauchyfolge vorliegt, da limm Lm = 0 gilt; siehe Beispiel 4.3.8. Nach Voraussetzung zur Vollständigkeit gibt es x ∈ X mit x = limn∈N xn . Daraus folgt mit der Kontraktionseigenschaft und der Konvergenz der Folge (xn )n∈N gegen x sofort T (x) = x , denn d(T (x), x) ≤ d(T (x), xn+1 ) + d(xn+1 , x) = d(T (x), T (xn )) + d(xn+1 , x) ≤ Ld(x, xn ) + d(xn+1 , x) . Grenzübergang n → ∞ in (4.10) ergibt die Aussage in b) . Damit ist die Existenz eines Fixpunktes x und die Abschätzung in b) gezeigt. Bleibt die Eindeutigkeit zu zeigen. Sei x̂ ∈ X ein weiterer Fixpunkt. Dann folgt aus der Ungleichung d(x, x̂) = d(T (x), T (x̂)) ≤ Ld(x, x̂) mit der Tatsache 0 ≤ L < 1 sofort x = x̂ . Der Banachsche Fixpunktsatz ist ein zentrales Resultat, das vielfältige Anwendungen hat: Existenz von Lösungen nichtlinearer Gleichungen, Konvergenz von Iterationsverfahren, Existenz von Lösungen bei Differentialgleichungen, . . . . Beispiel 4.3.13 Man bestimme die Nullstellen von f (x) := −x+ cos x . Dies ist gleichbedeutend mit der Berechnung der Fixpunkte von g(x) := cos(x). Hier kommt eine Schlussweise, wie sie in der Analysis vorbereitet wird. Wegen f (0) = 1 > √ 1 π ′ 0, f ( 4 ) = 4 (−π + 2 2) < 0, besitzt f eine Nullstelle in (0, π 4 ). Wegen f (x) = 1 + sin(x) ≥ 0 π ′ für alle x ∈ R folgt, dass Nullstellen nur in (0, 4 ) liegen können. Da f (x) > 0, x ∈ (0, π 4 ), folgt, π dass die einzige Nullstelle von f in (0, 4 ) liegt. Stand: 9. Februar 2010 48 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.4. ISOMORPHISMEN ∗ Also besitzt g genau einen Fixpunkt x∗ in (0, π 4 ). Näherungswerte für x bestimmen wir mit der Fixpunktiteration xn+1 := cos xn . Wählt man als Startwert (siehe oben) x0 := π 4 , so ergibt sich die Zahlenfolge x0 = 0, 785398 . . . , x1 = 0, 707106 . . . , x2 = 0, 760244 . . . , . . . , x25 = 0, 73908 Von x25 stimmen die angegebenen 5 Ziffern nach dem Komma mit den entsprechenden Dezimalstellen der Lösung überein. Wir haben oben 0 < x1 ≤ x2 ≤ x0 beobachtet. Da g monoton fallend ist (g′ (x) ≤ 0 für alle x), schließt man ohne Mühe auf 0 < x2k−1 ≤ x2k+1 ≤ x∗ ≤ x2k+2 ≤ x2k , k ∈ N0 . Wir wissen daher in jedem Stadium der Rechnung |x2k+2 − x∗ | ≤ |x2k+2 − x2k+1 | , wobei die Schranke |x2k+2 − x2k+1 | bei der Rechnung zur Verfügung steht. Damit können wir während der Rechnung entscheiden, wann wir mit der erreichten Näherung auf Grund der erreichten Genauigkeit zufrieden sind. 4.4 Isomorphismen Nun wollen wir einen wichtigen Gesichtspunkt bei der Betrachtung mathematischer Objekte einführen: wann sind Objekte als gleich anzusehen, auch wenn sie in unterschiedlichem Kleide“ ” daherkommen. Dabei stoßen wir auf den Begriff der Strukturgleichheit“, der durch Isomorphis” men beschrieben wird. Wir geben 4 Beispiele. Definition 4.4.1 Zwei Graphen G = G(E, K), G′ = G(E ′ , K ′ ) heißen isomorph, in Zeichen G∼ = G′ , falls es eine bijektive Abbildung ϕ : E −→ E ′ gibt, so dass gilt: k = {u, v} ist eine Kante in G genau dann, wenn k′ := {ϕ(u), ϕ(v)} eine Kante in G′ ist. Beispielsweise sind alle vollständigen Graphen mit n Ecken isomorph. Daher ist es gerechtfertigt, für solche Graphen eine(!) Bezeichnung zu vergeben: Gn . Zu entscheiden, ob Graphen isomorph sind, ist so einfach nicht. Hilfreich dabei sind Invarianten“ bei Anwendung eines Isomorphismus: ” Ecken werden auf Ecken vom selben Grad abgebildet, . . . . Offensichtlich wird durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine ” Äquivalenzrelation erzeugt. Definition 4.4.2 Zwei Gruppen (G, •), (G′ , •′ ) heißen isomorph, in Zeichen G ∼ = G′ , falls es eine bijektive Abbildung ϕ : G −→ G′ gibt mit ϕ(x) •′ ϕ(y) = ϕ(x • y) für alle x, y ∈ G . Der Isomorphismus ϕ, wie er in Definition 4.4.2 gefordert ist, ist ein bijektiver Gruppenhomomorphismus. Man kann für einen solchen Isomorphismus ϕ zeigen, dass auch ϕ−1 ein Isomorphismus ist; siehe dazu unten unter Vektorraumisomorphismen. Offensichtlich wird daher durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine Äquivalenzrelation ” erzeugt. Beispiel 4.4.3 Sei ω3 die dritte Einheitswurzel, d.h. ω3 = cos(2π/3) + i sin(2π/3) . Stand: 9. Februar 2010 49 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.5. ÜBUNGEN Betrachte nun die folgenden Gruppentafeln: + 0 1 2 0 0 1 2 1 1 2 0 · 1 ω3 ω32 2 2 0 1 1 ω3 ω32 1 ω3 ω32 . ω3 ω32 1 ω32 1 ω3 Die erste Tafel steht für das additive Rechnen in Restklassen bezüglich des Restes drei (siehe Kapitel 6), die zweite für das multiplikative Rechnen mit speziellen komplexen Zahlen. Beide Tafeln definieren eine Gruppe. Wie man sieht, sind sie isomorph. Definition 4.4.4 Zwei Vektorräume (V, +, ·), (V ′ , +′ , ·′ ) über dem selben Skalarkörper K heißen isomorph, in Zeichen V ∼ = V ′ , falls es eine bijektive Abbildung ϕ : V −→ V ′ gibt mit ′ ϕ(x + y) = ϕ(x) + ϕ(y), ϕ(α · x) = α ·′ ϕ(x) für alle x, y ∈ V, α ∈ K . Der Isomorphismus ϕ, wie er in Definition 4.4.4 gefordert ist, ist eine lineare Abbildung, da er offenbar die Linearkombinationen in Linearkombinationen überführt. (Eine Linearkombination ist etwa αx+βy mit α, β ∈ K.) Eine solche Abbildung wird linear genannt. Die Überraschung ist, dass auch die per definitionem existierende Umkehrabbildung ϕ−1 diese Eigenschaft hat; man liest dies aus ϕ−1 (α ·′ v ′ +′ β ·′ w′ ) = ϕ−1 (α ·′ ϕ(ϕ−1 (v ′ )) +′ β ·′ ϕ(ϕ−1 (w′ ))) = ϕ−1 (ϕ(α · ϕ−1 (v ′ )) +′ ϕ(β · ϕ−1 (w′ ))) = ϕ−1 (ϕ(α · ϕ−1 (v ′ ) + β · (ϕ−1 (w′ ))) = α · ϕ−1 (v ′ ) + β · ϕ−1 (w′ ) , v ′ , w′ ∈ V ′ , α, β ∈ K , ab. Beide Abbildungen ϕ, ϕ−1 sind also linear. Offensichtlich wird daher durch die Relation V ∼ V ′ genau dann, wenn V, V ′ isomorph sind“ eine Äquivalenzrelation erzeugt. Genaueres ” erfährt man in der Linearen Algebra. Definition 4.4.5 Zwei metrische Räume (X, d), (X ′ , d′ ) heißen isomorph, in Zeichen X ∼ = X ′, ′ ′ falls es eine bijektive Abbildung ϕ : X −→ X gibt mit d (ϕ(x), ϕ(y)) = d(x, y) für alle x, y ∈ X . Die Abbildung ϕ, wie sie in Definition 4.4.5 gefordert ist, ist eine Isometrie, da sie offenbar die Abstände gleich lässt. Beachte, dass auch ϕ−1 eine Isometrie ist. Offensichtlich wird daher durch die Relation X ∼ X ′ genau dann, wenn X, X ′ isomorph sind“ eine Äquivalenzrelation ” erzeugt. 4.5 Übungen 1.) Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung mit dieser Permutation in falscher Reihenfolge stehen. Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl. 2.) Zeige: Die Isomorphie von Graphen ist eine Äquivalenzrelation auf der Menge der Graphen. 3.) Finde zwei Beispiele von selbstkomplementären Graphen. Dabei heißt ein Graph selbstkomplementär, wenn G zu seinem Komplementärgraphen G isomorph ist. Stand: 9. Februar 2010 50 c J.Baumeister KAPITEL 4. ABBILDUNGEN 4.) 4.5. ÜBUNGEN Zeige, dass durch V4 := 1234 1234 1234 1234 , , , 1234 4321 2143 3412 in S4 eine Gruppe gebildet wird; die Verknüpfung sei die in S4 . Ist V4 eine Teilmenge von A4 ? 5.) Zeige, dass R2 ∋ (u, v) 7−→ u + iv ∈ C ein Gruppenisomorphismus ist (jeweils bezüglich der Addition). Gibt es weitere Isomorphismen? 6.) Unter der Ordnung einer Permutation σ versteht man die kleinste natürliche Zahl n, so dass σ n = id . Bestimme die Ordnung von 1234 1234 , . 2143 2341 Stand: 9. Februar 2010 51 c J.Baumeister Kapitel 5 Zählen Wir verschaffen uns die Hilfsmittel, um die Kunst des Zählens“ zu skizzieren. Es sind dies ” die natürlichen Zahlen und Operationen auf ihnen. Im nächsten Kapitel ewächst daraus das Rechnen in den ganzen Zahlen. 5.1 Natürliche Zahlen Die erste mathematische Erfindung“ dürfte wohl das Zählen von Gegenständen gewesen sein: je” dem Gegenstand einer Familie von Gegenständen wird der Reihe nach ein Strich auf einem Auf” zeichnungsbrett“ zugeordnet, einer bestimmten Anzahl von Strichen wird ein Zahlwert (Eins, Zwei,. . . ) bzw. eine Zahl (1,2,. . . ) zugeordnet. Diese Zahlen stehen für die Kardinalzahlen im Gegensatz zu den sogenannten Ordinalzahlen Erster (erster Strich), Zweiter (zweiter Strich), . . . . Die Zahlen 1, 2, 3, . . . bezeichnen wir als natürliche Zahlen. Als Fundament für die Mathematik sind die natürlichen Zahlen ausreichend, alle“ anderen konkreten Objekte der Mathematik ” lassen sich dann mit Definition durch Abstraktion erfinden. Also kommt es darauf an, die natürlichen Zahlen als existierende Menge N sicher zu definieren und zu akzeptieren. Von L. Kronecker1 ist überliefert: Die natürlichen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk. Was sind aber nun die strukturellen Eigenschaften der natürlichen Zahlen, auf die es ankommt? Wir gehen zurück zur Tätigkeit des Zählens. Stets beginnen wir mit einem ersten Gegenstand, wir ordnen ihm die Nummer 1 zu. Haben wir nun eine Reihe von Gegenständen gezählt und ist n die Anzahl dieser gezählten Gegenstände, dann entscheiden wir, ob noch ein weiterer Gegenstand zu zählen ist; wenn ja, ordnen wir ihm die Nummer n′ zu. n′ ist also Nachfolgezahl von n : zur Strichliste haben wir einen Strich hinzugefügt. Diese Beobachtung führt uns zur Definition der natürlichen Zahlen, wie G. Peano2 sie gegeben hat: Definition 5.1.1 (Axiome von Peano) Es gibt eine Menge N und ein Element 1 ∈ N mit folgenden Eigenschaften: (P1) Zu jedem n ∈ N gibt es ein n′ ∈ N , genannt Nachfolger von n . (P2) 1 ist kein Nachfolger, d.h. 1 6= n′ für alle n ∈ N . (P3) Ist n′ = m′ , so ist n = m . (P4) Ist M eine Teilmenge von N mit 1 ∈ M und gilt (n ∈ M =⇒ n′ ∈ M ), dann gilt M = N. 1 2 Leopold Kronecker, 1823 - 1891 Giuseppe Peano, 1858 - 1932 52 KAPITEL 5. ZÄHLEN 5.1. NATÜRLICHE ZAHLEN Diese Menge N heißt Menge der natürlichen Zahlen. Ist m = n′ (im Sinne der Definition 5.1.1), so heißt n Vorgänger von m. (P2) besagt, dass das Element 1 keinen Vorgänger hat. Man beachte, dass wir die Definition der natürlichen Zahlen mit Existenz verknüpft haben und nicht das Zählen zur Definition herangezogen haben. In den natürlichen Zahlen N sollten wir, wenn die axiomatische Einführung wohlgelungen ist, die Addition, die Multiplikation und das Vergleichen wiederentdecken können. Dazu einige Vorbereitungen. Lemma 5.1.2 Es gilt N = {1} ∪ {n′ |n ∈ N} . Beweis: Sei M := {1} ∪ {n′ |n ∈ N}. Es gilt M ⊂ N, 1 ∈ M , und ist n ∈ M, so ist n′ ∈ M . Also ist nach (P4) M = N. Das Axiom (P4) lässt sich bestens verwenden, neue Objekte zu definieren. Man nennt das resultierende Prinzip induktive Definition. Wir führen dies am Beispiel der Definition des kartesischen Produktes vor. Sei A eine Menge. Wir gehen so vor: A1 := A , Ak := A × An falls k = n′ ∈ N . Offenbar ist nun nach Lemma 5.1.2 An definiert für jedes n ∈ N . Ist x ∈ An , n ∈ N, so gibt es x1 , . . . , xn ∈ A mit x = (x1 , . . . , xn ). Dies ist die Schreibweise als n-Tupel der Elemente in An . Dabei haben wir die Schreibweise schon naheliegend verkürzt; wir haben ja früher nur zweistellige Paarklammern (·, ·) definiert. Wir haben diese Definition schon vorweggenommen bei der Definition von Wörtern über einem Alphabet. Wir wollen nun die arithmetischen Operationen Addition, Subtraktion, Multiplikation, Vergleich in den natürlichen Zahlen entdecken. Bei der Einführung bedienen wir uns wieder der induktiven Definition. Addition: ( n′ n + m := (n + k)′ , falls m = 1 , n, m ∈ N . , falls m = k′ Beachte, dass nun wirklich die Definition für alle m, m ∈ N gelungen ist, denn nach Lemma 5.1.2 ist ja für m ∈ N entweder m = 1 oder m = k′ für ein k ∈ N . Nun ist es an der Zeit, zur üblichen Notation 1, 2, 3, . . . zurückzukehren. Dies geschieht durch 1, 2 := 1′ = 1 + 1, 3 := 2′ = 2 + 1, . . . . n′ schreiben wir also nun immer als n + 1 . Wir haben nun also eine (binäre) Verknüpfung “+“, die die Eigenschaften der Addition haben sollte. Die folgenden Rechenregeln belegen, dass die uns geläufigen Eigenschaften der Addition in der Tat vorliegen. Regel 5.1.3 Seien m, n, k ∈ N . Es gilt: Stand: 9. Februar 2010 (m + n) + k = m + (n + k) ; (5.1) m + n = n + m; (5.2) m + n = m + k =⇒ n = k . (5.3) 53 c J.Baumeister KAPITEL 5. ZÄHLEN 5.1. NATÜRLICHE ZAHLEN Wir beweisen exemplarisch (5.1). Sei M := {k ∈ N|(m + n) + k = m + (n + k) für alle m, n ∈ N}. Mit der Definition der Addition gilt (m + n) + 1 = (m + n)′ = m + n′ = m + (n + 1) . Also ist 1 ∈ M . Sei k ∈ M. Dann ist mit der Definition der Addition (m + n) + k′ = ((m + n) + k)′ = (m + (n + k))′ = m + (n + k)′ = m + (n + k′ ), . Also ist auch k′ ∈ M . Nach (P4) gilt nun M = N . Gilt m = k′ , so ist k Vorgänger von m. Also schreiben wir dann k = m − 1 . Damit haben wir die Subtraktion mit 1 zur Verfügung. Wir wissen ja, dass allgemein in N keine Subtraktion möglich ist. Wir sollten nun auch die Multiplikation in den natürlichen Zahlen definieren können. Dies gelingt mit Hilfe der Addition so: m · 1 := m ; m · (n + 1) := m · n + m , n ∈ N . Damit ist die Verknüpfung m · n für m, n ∈ N, die wir Multiplikation nennen, wohldefiniert. Den Multiplikationspunkt · lassen wir mitunter weg, die Schreibweise m × n für m · n vermeiden wir vollständig. Die Potenzschreibweise im Bereich der natürlichen Zahlen können wir nun auch einführen. Wir setzen für alle a ∈ N a1 := a , an+1 := a · an . Es gilt dann an+m = an · am , (an )m = an·m für alle a, n, m ∈ N . Die Rechenarten “+, ·“ vertragen sich dann mit der neuen Schreibweise; etwa: 1 + 7 = 8, 15 · 3 = 45, 33 = 11 · 3 = (7 + 4) · 3 = 7 · 3 + 4 · 3 = 21 + 12 = 33, . . . . Dies ist Inhalt der folgenden Regel, die das Distributivgesetz festhält; der Beweis erfolgt auf dem üblichen Weg über (P4). Regel 5.1.4 Seien m, n, k ∈ N . Es gilt: m(n + k) = mn + mk . (5.4) (5.5) Auch die Kleiner–Beziehung finden wir in N wieder. Dabei lassen wir uns von der Anschauung leiten, dass einer kürzeren Strichliste einige Striche hinzuzufügen sind, um sie einer gegebenen längeren Strichliste gleichzumachen. Definition 5.1.5 Seien m, n ∈ N. (a) m < n : ⇐⇒ ∃ x ∈ N (m + x = n) ; (b) m ≤ n : ⇐⇒ m < n oder m = n ; (c) m > n : ⇐⇒ n < m ; Stand: 9. Februar 2010 54 c J.Baumeister KAPITEL 5. ZÄHLEN 5.2. INDUKTION (d) m ≥ n : ⇐⇒ n ≤ m . Klar, ist n ∈ N und n 6= 1, dann ist n > 1 , denn dann ist n ein Nachfolger nach Lemma 5.1.2, also etwa n = k′ = k + 1 mit k ∈ N , und daher n > 1 . Ohne Beweis führen wir an: Regel 5.1.6 5.2 k ≤ m, m < n =⇒ k < n. (5.6) m<n =⇒ (5.7) k<m =⇒ m + k < n + k für alle k ∈ N . k + 1 ≤ m. (5.8) Induktion Nun wollen wir das Axiom (P4) einsetzen als Beweismethode. Dieses Prinzip der Induktion stellt sich so dar: Sei A(n) für jedes n ∈ N eine Aussage. Diese Aussage gilt für alle n ∈ N, falls Induktionsbeginn: A(1) ist wahr. Induktionsschluss: Ist A(n) wahr, dann ist auch A(n + 1) wahr. verifiziert werden kann. Klar, man hat ja nur die Menge M := {n ∈ N|A(n) ist wahr} einzuführen und darauf (P4) anzuwenden. Häufig wird Sei A(n) wahr“ als Zwischenschritt Induktionsverankerung oder Induktions” annahme formuliert; wir verzichten darauf. Damit wird ja nur die Voraussetzung im Induktionsschluss extra herausgestellt. Beispiel 5.2.1 Über C.F. Gauss3 wird berichtet, dass er die Beschäftigungstherapie seines Lehrers “Addiert mal die ersten 20 Zahlen“ durch folgenden Trick zunichte gemacht hat: Er addiert die erste und die letzte Zahl: Ergebnis 21; er addiert die zweite und die vorletzte Zahl: Ergebnis 21; er . . . . Also kann man das verlangte Resultat durch 1 + 2 + · · · + 20 = 10 · 21 = 210 erhalten. Man beachte, dass die Lösungsmethode von Gauß auch tiefere“ Einsichten mitliefert: ” Wann ist das Ergebnis gerade, warum ist die letzte Ziffer im Ergebnis oben eine Null. Löst man sich von den konkreten Zahlen, ist also zu beweisen: 2 n X i = n(n + 1) i=1 Der Beweis mittels vollständiger Induktion sieht so aus: Induktionsbeginn: Die Formel ist offenbar richtig für n = 1. Induktionsschluss: Die Formel sei richtig für n. Wir zeigen damit die Richtigkeit der Formel für n + 1 so: n n+1 X X i + 2(n + 1) = n(n + 1) + 2(n + 1) = (n + 1)(n + 2) . i=2 2 i=1 i=1 3 Gauss, Carl Friedrich (1777 — 1855) Stand: 9. Februar 2010 55 c J.Baumeister KAPITEL 5. ZÄHLEN 5.2. INDUKTION Beispiel 5.2.2 Den Pythagoreern war bekannt, dass die Quadratzahlen die Summe ungerader Zahlen sind, d. h. dass n X (2i + 1) = (n + 1)2 , n ∈ N , 1+ i=1 gilt. Sie hatten dafür einen geometrischen Beweis“; lese ihn aus der Figurensequenz in Abbil” dung 5.1 ab! Der Beweis mittels vollständiger Induktion sieht (in abgekürzter Notation) so aus: n = 1 : Klar. n+1 : 1+ n+1 X (2i + 1) = 1 + n X (2i + 1) + (2(n + 1) + 1) = n2 + 4n + 4 = (n + 2)2 i=1 i=1 Die Aufspaltung 1 + n P (2i + 1) ist der Tatsache geschuldet, dass wir hier noch keine Null (als i=1 Summationsindex) zur Verfügung haben. Beispiel 5.2.3 Beweise, dass für jede natürliche Zahl n (n + 3)2 > 3(n + 3) + n gilt. Wir betrachten dazu die Aussage A(n) : (n + 3)2 > 3(n + 3) + n und beweisen die Gültigkeit der Aussage für jedes n ∈ N nach dem Induktionsprinzip. Induktionsbeginn: A(1) ist wahr, da (1 + 3)2 = 42 = 16 > 12 + 1 = 3(1 + 3) + 1 ist. Induktionsschluss: Sei A(n) wahr. ((n + 1) + 3)2 = ((n + 3) + 1)2 = (n + 3)2 + 2(n + 3) + 1 > 3(n + 3) + n + 2(n + 3) + 1 > 3(n + 3) + n + 1 + 3 = 3(n + 4) + n + 1 Also folgt aus der Gültigkeit der Aussage A(n) die Gültigkeit der Aussage A(n + 1). Die Aussage A(n) ist nach dem Induktionsprinzip nun für alle n ∈ N bewiesen. Die Ungleichung (n + 3)2 > 3(n + 3) + n , n ∈ N, kann aber auch ohne den Rückgriff auf das Induktionsprinzip bewiesen werden, da n2 + 2n ≥ 1 ist. Stelle die Verbindung her! Beispiel 5.2.4 Bei einem Tennisturnier ist die Teilnehmerzahl üblicherweise eine Zweierpotenz 2n (n = 7 bei einem Grand-Slam-Turnier). Die Anzahl der Spiele bei einem K.O.-System beträgt 2n − 1. Dies lässt sich mit Induktion zeigen: n = 1: Bei zwei Teilnehmern gibt es offenbar 1 = 21 − 1 Spiele. n + 1: Die 2n+1 Teilnehmer lassen sich in zwei Gruppen zu je 2n Teilnehmern einteilen. Nach Induktionsvoraussetzung gibt es in jeder Gruppe 2n − 1 Paarungen, also insgesamt 2(2n − 1) Paarungen. Die Sieger der beiden Gruppen treffen dann in einer letzten Paarung aufeinander, so dass es 2(2n − 1) + 1 = 2n+1 − 1 Paarungen gibt. Man kann die Lösung mit einem anderen Argument schneller finden. Wegen des K.O.Systems verliert bis auf den Gewinner jeder Teilnehmer genau einmal. Jedes Spiel hat genau Stand: 9. Februar 2010 56 c J.Baumeister KAPITEL 5. ZÄHLEN 5.2. INDUKTION einen Verlierer. Also gibt es ein Spiel weniger als die Teilnehmerzahl. Dieser Alternativbeweis lässt sich auf Teilnehmerfelder beliebiger Größe anwenden (z.B. wenn es Freilose gibt). Also gibt es bei m Teilnehmern m − 1 Spiele. Diese Gegenüberstellung der beiden Beweise zeigt, dass Induktion nicht immer die kürzeste Beweismethode ist. Nun verwenden wir die vollständige Induktion zur Aufklärung der inneren ” Struktur“ der natürlichen Zahlen. Satz 5.2.5 Für m, n ∈ N gilt genau eine der folgenden Aussagen: • • ◦ • • • • ◦ ◦ ◦ ◦ • • • • ◦ ◦ ◦ • ◦ ◦ ◦ • ◦ ◦ ◦ • • • • Abbildung 5.1: Quadratzahlen m < n , m = n , m > n. Beweis: Sei n ∈ N . Zu m ∈ N setzen wir Mm := {x ∈ N|n + x = m}. Wir untersuchen die beiden Fälle Mm 6= ∅ und Mm = ∅ . Ist Mm 6= ∅, dann gibt es x ∈ N mit n + x = m , also n < m . Wir beweisen mit vollständiger Induktion (bezüglich m) die folgende Behauptung: Ist Mm = ∅, dann trifft genau eine der folgenden Aussagen zu: n > m, n = m . m = 1 : Ist n = m, dann sind wir fertig. Ist n 6= m = 1, dann ist sicher n > 1 = m . m + 1 : Sei also Mm+1 = ∅. Dann ist auch Mm := {y ∈ N|n + y = m} = ∅, da sonst für y ∈ Mm sofort x := y + 1 ∈ Mm+1 folgt. Also gilt nach Induktionsvoraussetzung genau eine der Aussagen n > m, n = m . n = m ist nicht möglich, da sonst 1 ∈ Mm+1 wäre. Also wissen wir nun n > m, und es gibt daher z ∈ N mit m + z = n. Ist z = 1, dann ist m + 1 = n, ist z > 1, dann ist 1 + u = z mit einem u ∈ N und wir haben (m + 1) + u = m + (1 + u) = n, d. h. n > m + 1 . Damit ist nun gezeigt, dass eine der Aussagen m<n, m=n, m>n jedenfalls eintritt. Bleibt die Unverträglichkeit von zweien der Aussagen zu zeigen, etwa von m = n und m > n . Wenn m = n und m > n gilt, dann gibt es x ∈ N mit m + x = m. Mit vollständiger Induktion folgt sofort, dass diese Gleichheit für kein m ∈ N gelten kann. Satz 5.2.6 (Wohlordnungssatz) Jede nichtleere Teilmenge M von N enthält ein kleinstes Element (bezüglich ≤). Beweis: Sei m ∈ M . Wähle in 1, . . . , m das kleinste Element m∗ aus M (bezüglich ≤ ) aus. Diese Auswahl ist möglich, da nach Satz 5.2.5 die Elemente 1, . . . , m bezüglich ihrer Größe nach verglichen werden können. Da die natürlichen Zahlen n ≥ m nicht als kleinste Elemente von M in Frage kommen, ist m∗ das kleinste Element von M . Bei der Komplexitätsanalyse – und nicht nur dort – ist eine Notation hilfreich, die einen Vergleich von Funktionen so zulässt, dass ihr Verhalten für große natürliche Zahlen zum Vorschein kommt. Stand: 9. Februar 2010 57 c J.Baumeister KAPITEL 5. ZÄHLEN 5.3. ABZÄHLEN Definition 5.2.7 Sei f : N −→ N . Dann bezeichnet O(g) := {f : N −→ N|es gibt c > 0, N ∈ N mit f (n) ≤ cg(n) für alle n ≥ N } . Gehört eine Funktion f : N −→ N zu O(g), so schreibt man f ∈ O(g) oder f = O(g) und wir sprechen f ist groß-O von g .“ ” Die Tatsache, dass in der Definition von O(g) nur das Verhalten für große natürliche Zahlen eine Rolle spielt, drückt man oft so aus: f ist groß-O von g für n −→ ∞ . Beispiel 5.2.8 n3 = O(n3 ) für n → ∞ . Pn 2 i=1 i = O(n ) für n → ∞ . Wenn wir sagen, dass ein Algorithmus einen Aufwand von O(g(n)) hat, dann meinen wir damit Folgendes: Wenn der Algorithmus auf unterschiedlichen Computern mit den gleichen Datensätzen läuft, und diese die Größe n haben, dann werden die resultierenden Laufzeiten immer kleiner sein als eine Konstante mal g(n) . 5.3 Abzählen Kombinatorik bedeutet Kunst des Zählens“. Sie beschäftigt sich mit Möglichkeiten, die Anzahl ” der Elemente bei endlichen Mengen zu bestimmen. Die Elemente des kleinen Einmaleins der ” Kombinatorik“ stellen wir in Kapitel 8 vor. Die Resultate sind interessant und hilfreich etwa beim Einstieg in die Wahrscheinlichkeitstheorie und bei Anwendungen in der Informatik. Hier erläutern wir nur, wie wir die Elemente einer Menge zählen wollen. Als Prototyp“ einer Menge mit n Elementen steht uns Nn := {1, . . . , n} zur Verfügung. ” Damit wollen wir erklären, wann eine beliebige Menge n Elemente besitzt. Wenn wir zählen/abzählen, ordnen wir den Elementen einer Menge von Objekten sukzessive eine natürliche Zahl, beginnend bei 1, zu. Wesentlich beim Zählen ist, dass wir zwei verschiedenen Objekten nicht dieselbe Zahl zuordnen. Dies führt uns dazu, das Zählen mit einer Abbildung, der Zuordnung, mit Werten in N zu beschreiben, die zusätzlich die eben formulierte Forderung respektiert. Als Vorbereitung für das Abzählen von Mengen beweisen wir Satz 5.3.1 Sei A eine Menge, seien m, n ∈ N, und seien φ : A −→ Nn , ψ : A −→ Nm bijektiv. Dann gilt n = m . Beweis: Wir beweisen mit vollständiger Induktion die Aussage Zu n ∈ N gibt es für 1 ≤ m < n keine injektive Abbildung g : Nn −→ Nm . n = 1 : Klar, da Nn = {1}, Nm = ∅ für m < n . n + 1 : Annahme: Es gibt eine injektive Abbildung g : Nn+1 −→ Nm , 1 ≤ m < n + 1 . Da g injektiv ist und Nn+1 mindestens die Elemente 1,2 enthält, ist 1 < m . Sei k := g(n + 1) . Offenbar gibt es eine Bijektion f : Nm −→ Nm mit f (i) = i für i 6= k, m und f (k) = m, f (m) = k . Nun ist (f ◦ g)|Nn : Nn −→ Nm−1 injektiv, wobei also 1 ≤ m − 1 < n gilt. Dies ist im Widerspruch zur Induktionsannahme. Nachdem nun die obige Aussage bewiesen ist, ist die Behauptung des Satzes schnell gezeigt. Annahme: Es gibt bijektive Abbildungen φ : A −→ Nn , ψ : A −→ Nm , n 6= m . O.E. sei etwa n > m . Da ψ ◦ φ−1 : Nn −→ Nm bijektiv ist nach Lemma 4.2.5, haben wir einen Widerspruch zur obigen Aussage. Stand: 9. Februar 2010 58 c J.Baumeister KAPITEL 5. ZÄHLEN 5.3. ABZÄHLEN Definition 5.3.2 Sei M eine Menge, M 6= ∅ . (a) M heißt endlich, wenn es ein N ∈ N und eine bijektive Abbildung ϕ : M −→ {1, . . . , N } gibt; wir setzen dann #M := N . (Da nach Satz 5.3.1 die Zahl N eindeutig bestimmt ist, ist die Schreibweise #M := N wohldefiniert.) (b) M heißt abzählbar unendlich, wenn es eine bijektive Abbildung ϕ : M −→ N gibt. Wir schreiben dann #M = ∞ . (c) M heißt abzählbar, wenn M endlich oder abzählbar unendlich ist. Die obige Definition sagt also, dass wir die Elemente einer (endlichen) Menge M gezählt haben, wenn wir eine Bijektion φ : M −→ {1, . . . , N } gefunden haben; das Zählergebnis ist #M := N . Endliche Mengen haben wir schon viele kennengelernt. Als ganz einfache Beispiele für b1 b2 ··· bn abzählbare unendliche Mengen führen wir an: a (a , b ) (a , b ) · · · (a 1 1 1 1 2 1 , bn ) A := {10n |n ∈ N} , N × N . Mit der Definitia2 (a2 , b1 ) (a2 , b2 ) · · · (a2 , bn ) on 5.3.2 (a),(b) verträglich ist, dass wir Nn die .. .. .. .. . . . . Elementanzahl n zuordnen und dass N abzählam (am , b1 ) (am , b2 ) · · · (am , bn ) bar unendlich ist; die Identität ist ja jeweils die passende Bijektion. Klar, der leeren Menge ordnen wir die Elementanzahl 0 zu, d. h. Abbildung 5.2: Abzählschema #∅ := 0 , und bezeichnen sie ebenfalls als endliche Menge.4 Man beachte, dass es Mengen gibt, die nicht abzählbar sind. Ein wichtiges Beispiel ist M := R . Das Cantorsche Diagonalisierungsverfahren, das üblicherweise im Rahmen der Analysis im Zusammenhang mit der Dezimalbruchentwicklung vorgestellt wird, belegt dies; wir kommen darauf zurück. Sind A, B endliche Mengen, dann gilt für das kartesische Produkt die Formel #(A × B) = #A · #B (5.9) Dies liest man etwa am Rechteckschema in Abbildung 5.2 ab (#A = m, #B = n). Wir können die Situation des kartesischen Produkts in drei Veranschaulichungen festhalten; siehe Abbildung 5.3 für m = 3 und n = 4 . Die Baumdarstellung“ hat den Vorteil, dass man sie ” mühelos auf mehr als zwei Faktoren ausdehnen kann; man hat ja nur in die Tiefe weiterzubauen. Wir halten der besseren Zitierbarkeit wegen die elementaren Zählprinzipien nochmal kompakt fest: Gleichheitsregel Existiert eine Bijektion zwischen zwei Mengen M und N , so gilt #M = #N . Summenregel Sei M = ∪ki=1 Mi eine disjunkte Vereinigung endlicher Mengen. Dann gilt: P #M = ki=1 #Mi . 4 Die Definition 5.3.2 ist nicht die von G. Cantor 1895 erstmals gegebene Definition der Unendlichkeit einer Menge: eine Menge ist unendlich, wenn zwischen ihr und einer ihrer echten Teilmengen eine umkehrbar eindeutige Zuordnung möglich ist. Stand: 9. Februar 2010 59 c J.Baumeister KAPITEL 5. ZÄHLEN 5.4. REKURSION x a y c b u c z b a x (a) Abbildungsmodell b c a y u (b) Gittermodell z x y u z x y u z x y u z (c) Baumdarstellung Abbildung 5.3: Veranschaulichung des kartesischen Produkts Produktregel Sei M = M1 × · · · × Mk ein kartesisches Produkt. Dann gilt #M = Alle Regeln ergeben sich aus den obigen Ableitungen in offensichtlicher Weise. k Q #Mi . i=1 Ein einfaches, aber sehr anwendungsreiches Prinzip, in einer Anzahl von Objekten die Existenz eines Objekts mit einem bestimmten Merkmal behaupten zu können, ist das Schubfachprinzip 5 Verteilt man n Objekte auf r < n Schubfächer, so existiert ein Fach, das mindestens zwei Objekte enthält. Dieses Prinzip ist völlig klar, nichts ist zu beweisen. Es ist daher überraschend, dass dieses Prinzip zu nichttrivialen Ergebnissen führt, wie wir noch sehen werden. Zunächst eine Verallgemeinerung: Schubfachprinzip/allgemein Verteilt man n = r·k+1 Objekte auf r Schubfächer, so existiert ein Fach, das mindestens k + 1 Objekte enthält. Formulieren wir das allgemeine Schubfachprinzip mengentheoretisch: Schubfachprinzip für Mengen Ist eine Menge M mit Elementanzahl n = r · k + 1 in r disjunkte Teilmengen zerlegt, so gibt es eine Teilmenge, die mindestens k + 1 Elemente besitzt. 5.4 Rekursion Ein Objekt wird als rekursiv bezeichnet, wenn es sich selbst als Teil enthält oder mit Hilfe von sich selbst definiert ist. Rekursion kommt nicht nur in der Mathematik vor, sondern auch im täglichen Leben (ein Bild im Spiegel im Spiegel . . . ). Rekursion kommt speziell in mathematischen Definitionen vor. Ein Beispiel haben wir schon kennengelernt: in der Definition der natürlichen Zahlen kommt die zur Definition anstehende Menge N selbst vor. Ein anderes Beispiel ist die Fakultät einer natürlichen Zahl. Ihre rekursive Definition sieht so aus: ( 1 falls n = 1 n! := n · (n − 1)! falls n 6= 1 Es ist nicht überraschend, dass Rekursion sehr oft im Zusammenhang mit Objekten greift, die mit natürlichen Zahlen im Zusammenhang stehen, da ja die natürlichen Zahlen selbst rekursiv ” definiert sind“. 5 Es wird im Englischen “pigeonhole principle“, also Taubenschlagprinzip genannt. Stand: 9. Februar 2010 60 c J.Baumeister KAPITEL 5. ZÄHLEN 5.4. REKURSION Das Wesentliche an der Rekursion ist die Möglichkeit, eine unendliche Menge von Objekten durch eine endliche Aussage zu definieren oder eine unendliche Anzahl von Berechnungsschritten durch ein endliches Programm zu beschreiben. Allerdings ist Vorsicht geboten, denn rekursive Anweisungen bergen die Gefahr nicht abbrechender Ausführung; der Terminierung ist also besonderes Augenmerk zu schenken. Hier führen wir zwei Beispiele an, die keine Hintergrundtheorie benötigen. Später kommen wir zu einem weiteren Beispiel, nämlich zur rekursiven Behandlung des Problems des größten gemeinsamen Teilers. Die Türme von Hanoi Wir betrachten drei Pfeiler i, j, k, auf die runde Scheiben mit unterschiedlichem Durchmesser aufgesteckt werden können. Das Problem lautet: Es sind n Scheiben, die auf dem Pfeiler i mit nach oben abnehmendem Durchmesser aufgesteckt sind unter Zuhilfenahme des Pfeilers k durch sukzessive Bewegung jeweils einer Scheibe auf den Pfeiler j umzuschichten. Dabei ist darauf zu achten, dass niemals eine Scheibe mit größerem Durchmesser auf einer mit einem kleinerem Durchmesser zu liegen kommt. Man kann dieses Problem folgendermaßen lösen: Man schichtet die obersten n − 1 Scheiben vom Pfeiler i auf den Pfeiler k unter Zuhilfenahme von Pfeiler j den Regeln entsprechend; dann bringt man die auf dem Pfeiler i verbliebene einzige (anfangs unterste) Scheibe auf den Pfeiler j . Nun ist der Pfeiler i frei und man kann die n − 1 Scheiben vom Pfeiler k auf den Pfeiler j mit Hilfe des Pfeilers i umschichten. Es ist klar das rekursive Vorgehen zu erkennen: zur Lösung des Problems der Größe n bedienen wir uns der Lösung der Größe n − 1 . Wir benötigen die Bewegungsarten bewege(m,von,über,nach), bringe(von,nach) . Hierbei bedeutet bewege(l,a,b,c), dass die l obersten Scheiben vom Pfeiler a nach Pfeiler c den Regeln entsprechend unter Nutzung von b als Hilfspfeiler umzuschichten sind. Mit bringe(a,b) wird die oberste Scheibe vom Pfeiler a auf den Pfeiler b gelegt. Die rekursive Lösung für bewege(n,i,j,k) lautet damit: Solange n > 0 bewege(n-1,i,j,k), bringe(i,j), bewege(n-1,k,j,i). Beim Lösen der Aufgabe für n Scheiben, wird Z(n) := 2n − 1 mal eine Scheibe umgelegt Dies zeigt man induktiv. Der Induktionsbeginn ist trivial, der Induktionsschluss sieht so aus: Z(n) = 1 + 2Z(n − 1) = 1 + 2(2n−1 − 1) = 2n − 1 Der Aufwand ist enorm: für n = 64 müssen 264 − 1 ∼ 1021 Scheiben umgelegt werden. Allerdings sind wir ja nicht sicher, ob es nicht einen schnelleren Algorithmus gibt. Dies ist aber nicht der Fall! (Man kann genauer hinsehen: Die kleinste Scheibe S1 wird bei jedem zweiten Zug bewegt, die größte Scheibe Sn wird nur einmal bewegt, die Scheibe Sm wird genau 2n−m mal bewegt.) Stand: 9. Februar 2010 61 c J.Baumeister KAPITEL 5. ZÄHLEN 5.5. PRIMZAHLEN Die Ackermann-Funktion Als Beispiel für eine rekursive Funktionsdefinition komplexerer Art betrachten wir das Beispiel der so genannten Ackermann-Funktion A(m, n) . Die Definition lautet: falls m = 0 n + 1 A(m, n) := A(m − 1, 1) falls m 6= 0, n = 0 , m, n ∈ N0 . A(m − 1, A(m, n − 1)) falls m 6= 0, n 6= 0 Die Ackermann-Funktion wächst sehr stark: 2 A(0, n) > n , A(1, n) > n + 1 , A(2, n) > 2n , A(3, n) > 2n , A(4, 3) > 22 , A(5, 4) > 1010000 Der Aufwand, um A(m, n) auszurechnen, wächst auch entsprechend. Beispielsweise erfordert die Berechnung von A(1, 3) bereits folgende Rechenschritte: A(1, 3) = A(0, A(1, 2)) = A(0, A(0, A(1, 1))) = A(0, A(0, A(0, A(1, 0)))) = A(0, A(0, A(0, A(0, 1)))) = A(0, A(0, A(0, 2))) = A(0, A(0, 3)) = A(0, 4) = 5 Es ist nicht sehr einfach einzusehen, dass die Rekursion terminiert; es ist so! Satz 5.4.1 Für alle m, n ∈ N terminiert der Aufruf A(m, n) nach endlich vielen Schritten. Beweis: Der Beweis erfolgt durch zwei ineinander geschachtelte Induktionen über m (äußere Induktion) und, bei festem m, über n (innere Induktion). Induktionsanfang: m = 0 Es folgt unabhängig von n nur ein Aufruf. Induktionsvoraussetzung: Die Behauptung sei richtig für alle k mit 0 ≤ k ≤ m, und für alle n ∈ N. Induktionsschluss: m + 1 Induktion über n n = 0: Hier wird für A(m + 1, 0) der Wert A(m, 1) zurückgegeben. Hierfür terminiert der Aufruf nach Induktionsvoraussetzung der äußeren Induktion. Induktionsvoraussetzung: Der Aufruf A(m + 1, l) terminiert für (festes) m und alle l ≤ n. Induktionsschluss: n + 1 Der Aufruf von A(m + 1, n) erzeugt den Aufruf von A(m, A(m + 1, n − 1)). Nach innerer Induktionsvoraussetzung terminiert der Aufruf A(m + 1, n − 1) und liefert eine Zahl k. Dies erzeugt den Aufruf A(m, k), der nach äußerer Induktionsvoraussetzung terminiert. 5.5 Primzahlen Die Bausteine der natürlichen Zahlen sind die Primzahlen. Dies wollen wir nun belegen. Definition 5.5.1 Eine Zahl p ∈ N, p 6= 1, heißt Primzahl, falls aus p = kl mit k, l ∈ N folgt: k = 1 oder l = 1 . (Später nennen wir k, l Teiler.) Über die Existenz unendlich vieler Primzahlen war sich schon Euklid im Klaren. Die größte Zahl, von der man zur Zeit L. Eulers wusste, dass sie eine Primzahl ist, war 231 − 1, eine Zahl mit 10 Stellen. Zur Vorbereitung Euklids Beweises von der Existenz unendlich vieler Primzahlen geben wir an: Stand: 9. Februar 2010 62 c J.Baumeister KAPITEL 5. ZÄHLEN 5.5. PRIMZAHLEN Lemma 5.5.2 Sei n ∈ N, n ≥ 2. Sei T := {m ∈ N|m ≥ 2, n = km mit k ∈ N} . Dann besitzt T ein (bezüglich ≤) kleinstes Element p und p ist eine Primzahl. Beweis: Sicherlich ist n ∈ T . Klar, nach dem Wohlordnungssatz 5.2.6 besitzt T ein kleinstes Element p ∈ N, p ≥ 2; also p ≤ m für alle m ∈ T und n = kp mit k ∈ N . Annahme: p ist keine Primzahl. Dann gibt es l, j ∈ N, 2 ≤ l < p, mit p = lj . Dann gilt n = pk = l(jk), also l ∈ T, was im Widerspruch zur Minimalität von p in T ist. Satz 5.5.3 (Unendlichkeit der Primzahlen/Euklid) Es gibt unendlich viele Primzahlen. Beweis: Annahme: Es gibt nur endlich viele Primzahlen. Seien p1 , . . . , pr diese Primzahlen. Setze N := p1 · · · pr + 1. Dann ist N ∈ N und N ≥ 2. Da N > pi für jedes i = 1, . . . , r ist, ist N keine Primzahl. Also gibt es nach Lemma 5.5.2 eine Primzahl p ∈ N mit N = kp, k ∈ N . Also kommt p unter p1 , . . . , pr vor; o.E. p = p1 . Dann folgt: 1 = p(k − p2 . . . pr ) . Daraus liest man nun p = ab, was ein Widerspruch ist. Die einzige gerade Primzahl ist 2. Alle anderen Primzahlen sind ungerade. Daraus folgt sofort, dass diese Primzahlen von der Form 4m + 1 bzw. 4m + 3 mit m ∈ N sind. Also haben wir drei Schubladen“ von Primzahlen: ” P2 = {2} , P1 = {p|p Primzahl , p = 4m + 1} , P3 = {p|p Primzahl , p = 4m + 3} . Nun bleibt die Frage, ob P1 und P3 unendlich viele Zahlen enthält. Dies ist so! Bemerkung 5.5.4 J. Bertrand stellte die Vermutung auf, dass zwischen n und 2n stets eine Primzahl liegt; er selbst verifizierte die Vermutung für n < 3000000 . Ein erster Beweis für die vermutete Tatsache wurde 1850 von P. Tschebyscheff vorgelegt. Wir geben hier nicht den Beweis erbracht werden kann, sondern verifiwieder, der durch eine sorgfältige Abschätzung von 2n n zieren die Vermutung nur für n < 4000 (Landau’s Trick): Hier ist eine Folge von Primzahlen, von denen jeweils die Verdopplung größer als die folgende Zahl ist: 2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001 Beispiel 5.5.5 Lange Zeit glaubte man, dass die so genannten Fermatsche Zahlen n Fn := 22 + 1, n ∈ N , stets Primzahlen sind. Für n = 0, 1, 2, 3, 4 trifft dies zu: F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537 . Im Jahre 1733 widerlegte L. Euler mit dem Beispiel F5 = 4294967297 = 641 · 6700417 die Vermutung. Bisher hat man keine weitere Zahl Fn als Primzahl erkannt, im Gegenteil, die Vermutung ist nun, dass keine Fermatzahl Fn , n ≥ 5, eine Primzahl ist. Die kleinste Fermatzahl, von der man derzeit noch nicht weiß, ob sie eine Primzahl ist oder nicht, ist die Zahl F24 . Beispielsweise ist F18 = 13631489 · k , wobei k eine Zahl mit 78906 Stellen ist. Stand: 9. Februar 2010 63 c J.Baumeister KAPITEL 5. ZÄHLEN 5.6. ÜBUNGEN Wie kann man bei gegebener Zahl n entscheiden, ob es sich um eine Primzahl handelt oder nicht? Liegt eine große Zahl vor, so ist die Aufgabe schwierig. Die Probiermethode, n sukzessive auf Teiler zu untersuchen, kann man sehr schnell als sehr zeitraubend“ erkennen. Aktualität ” erhielt die Frage bei der Suche nach Primzahltests in der Kryptologie. In der Kryptologie beschäftigt man sich mit der Verschlüsselung von Nachrichten zum Zwecke der Geheimhaltung und mit der Entschlüsselung zum Zwecke der Aufdeckung von Nachrichten. 5.6 1.) Übungen Sei g : N ∋ n 7−→ n(n2 + 11) ∈ N . Zeige: (a) g ist injektiv, aber nicht surjektiv. (b) 6 ist ein Teiler von 3n2 + 3n + 12 für alle n ∈ N . (c) 6 ist ein Teiler von g(n) für alle n ∈ N . 2.) Ein deutsches Autokennzeichen besteht aus einer Kombination von ≤ 3 Buchstaben für den Landkreis oder die Stadt, ≤ 2 weiteren Buchstaben und bis zu einer vierstelligen Zahl. Bestimme die Anzahl der möglichen Kennzeichen (wenn man von einer Assoziation mit dem Namen des Landkreises absieht). 3.) Die Fibonacci-Zahlen Fn sind definiert durch F0 := F1 := 1 , F n + 1 := Fn + Fn−1 , n ≥ 1 . (a) Schreibe ein rekursives Berechnungsschema und mache das rekursive Rechenschema durch einen binären Baum klar. (b) Welche überflüssige Rechenschritte lassen sich finden ? 4.) Die Collatz/Kakutani/Klam/Ulam-Folge ist ausgehend vom Startwert c0 ∈ N folgendermaßen definiert: ( 1 cn falls n gerade , cn+1 := 2 3cn + 1 sonst wobei die Berechnung abgebrochen wird, wenn cn = 1 eintritt. Es ist bisher nicht gezeigt, dass die Berechnung für jedes c0 abbricht. Finde eine rekursive Funktion C : N −→ N , die die Länge der Collatz/Kakutani/Klam/UlamFolge in Abhängigkeit von c0 berechnet. 5.) Finde einen Algorithmus, der die n-te Fibonacci-Zahl rekursiv berechnet. Stand: 9. Februar 2010 64 c J.Baumeister Kapitel 6 Elementare Arithmetik Arithmetik ist das Teilgebiet der Mathematik, welches auch als Synonym zum Begriff Zahlentheorie verstanden werden kann. Elementare Arithmetik bezeichnet allgemein das Rechnen mit natürlichen Zahlen und ganzen Zahlen und die Untersuchung der Konsequenzen, die sich daraus ergeben, dass die Division in den ganzen Zahlen nur eingeschränkt möglich ist. 6.1 Ganze Zahlen In Abschnitt 5.1 haben wir die natürlichen Zahlen geschaffen“. Skizzieren wollen wir nun den ” Konstruktionsweg von den natürlichen Zahlen zu den ganzen Zahlen. Wir sehen dabei die Nützlichkeit des Begriffs der Äquivalenzrelation“ ein. Auf N × N läßt sich nämlich eine Äquivalenzrelation durch R := {((m, n), (k, l)) ∈ N2 × N2 |m + l = n + k} , d.h. (m, n) ∼ (k, l) : ⇐⇒ m + l = n + k , einführen. Man bestätigt leicht, dass in der Tat eine Äquivalenzrelation vorliegt. Etwa folgt die Symmetrie allein schon aus der Kommutativität der Addition in den natürlichen Zahlen; siehe Rechenregel 5.2. Die Zuordnung eines Paares (m, n) zu einer Klasse [(k, l)] geschieht unter dem Gesichtspunkt, dass die Differenz m − n gleich der Differenz k − l ist und dies liefert den Zusammenhang zur Menge der ganzen Zahlen Z, wenn wir sie schon als bekannt voraussetzten. Also sollte etwa [(n, n)] für 0 , [(n + 1, n)] für 1 , [(n, n + 1)] für − 1 , [(n + n, n)] für n , [(n, n + n)] für − n , stehen. Der Weg, ausgehend von der Kenntnis der natürlichen Zahlen, die ganzen Zahlen zu konstruieren, ist also vorgezeichnet: Man führe Z als Menge der Äquivalenzklassen (N × N)/ R ein. Vervollständigt wird dieser Schritt durch die Beobachtung, daß durch [(m, n)] ⊕ [(k, l)] := [(m + k, n + l)] eine Addition und durch [(m, n)] ⊙ [(k, l)] := [(m · k + n · l, m · l + n · k)] 65 KAPITEL 6. ELEMENTARE ARITHMETIK 6.1. GANZE ZAHLEN eine Multiplikation eingeführt wird. Die Anordnung der ganzen Zahlen spiegelt sich in [(m, n)] ⊳ [(k, l)] : ⇐⇒ m + l < n + k bzw. [(m, n)] [(k, l)] : ⇐⇒ m + l ≤ n + k wieder. Hierbei ist ja “ < , ≤ “ schon von den natürlichen Zahlen her bekannt. Beachte bei diesen Definitionen stets, dass [(m, n)] für m−n stehen sollte. Ergänzend sei nun noch die Subtraktion [(m, n)] ⊖ [(k, l)] := [(m, n)] ⊕ [(l, k)] . eingeführt. Bemerkung 6.1.1 Wenn man mit Äquivalenzklassen neue Objekte unter Verwendung von Repräsentanten für die Klassen definiert, hat man sich zu vergewissern, dass die Definition vom Repräsentanten für die Klasse unabhängig ist. Dies ist oben bei der Definition der Addition, Multiplikation und Kleiner–Beziehung der Fall. Bei der Addition etwa bedeutet dies, nachzuweisen, dass [(m, n)] ⊕ [(k, l)] = [(m′ , n′ )] ⊕ [(k′ , l′ )] ist, falls [(m, n)] = [(m′ , n′ )] , [(k, l)] = [(k′ , l′ )] gilt. Dies sieht man mit Hilfe der Identitäten m + n′ = m′ + n , k + l′ = k′ + l sofort ein. Entsprechend unserer Hinführung finden wir die natürlichen Zahlen wieder als Teilmenge e := {[(n + n, n)]|n ∈ N} . Auch diese Menge erfüllt nun die Peano–Axiome: N e; • 1̃ := [(n + 1, n)] ∈ N • n] + 1 := [(n + n + 1, n)] Nachfolger von n e; • 1̃ ist kein Nachfolger, denn aus 1̃ = [(n+n+1, n)] folgt sofort die widersprüchliche Aussage 1 = n + 1; f ⊂ N, e so dass 1̃ ∈ M f und (ñ ∈ M f =⇒ n] f), dann ist offenbar M f=N e. • Ist M +1∈M e , n ∈ N und die Null 0̃ := [(n, n)] . Zusätzlich haben wir die negativen Zahlen [(n, n + n)] ∈ N Die aufwendige Schreibweise wollen wir nun aber wieder vermeiden. Wir tun dies, indem wir, statt die Existenz der natürlichen Zahlen axiomatisch zu fordern, die ganzen Zahlen axiomatisch einführen. Es gibt Mengen N, Z , ein Element 0 ∈ Z, Abbildungen Z × Z ∋ (a, b) 7−→ a + b ∈ Z, Z × Z ∋ (a, b) 7−→ a · b ∈ Z, und eine Vergleichsoperation ≤ mit folgenden Eigenschaften: 1. (a + b) + c = a + (b + c) für alle a, b, c ∈ Z . 2. a + 0 = 0 + a für alle a ∈ Z . 3. Zu a ∈ Z gibt es genau ein (−a) ∈ Z mit (a + (−a)) = 0 = ((−a) + a) . 4. a + b = b + a für alle a, b ∈ Z . 5. (a · b) · c = a · (b · c) für alle a, b, c ∈ Z . 6. a · b = b · a für alle a, b ∈ Z . 7. a · (b + c) = a · b + a · c für alle a, b, c ∈ Z . 8. N ⊂ Z , 1 6= 0 , Z = N ∪ {0} ∪ −N . 9. 1 · a = a , 0 · a = 0 für alle a ∈ Z . 10. a ≤ b ⇐⇒ b + (−a) ∈ N ∪ {0} . Stand: 9. Februar 2010 66 (Addition) (Multiplikation) (Assoziativgesetz) (0 ist neutrales Element) ((−a) ist Negatives von a) (Kommutativgesetz) (Assoziativgesetz) (Kommutativgesetz) (Distributivgesetz) (1 ist neutrales Element) c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.2. TEILBARKEIT Man beachte aber, dass nur die Existenz der natürlichen Zahlen eine wesentliche Forderung ist. Wir tun dies durch Anführung von Eigenschaften, die das übliche Rechnen in den ganzen Zahlen möglich machen. (Wir legen dabei nicht Wert auf ein minimales Gerüst von Axiomen.) Dies deckt sich mit obiger Konstruktion. Zur Abkürzung führen wir noch die Subtraktion durch Z × Z ∋ (a, b) 7−→ a − b := a + (−b) ∈ Z ein, schreiben meist kurz ab für a · b und vereinbaren die Schreibweise a < b für a ≤ b, a 6= b . Damit können wir nun in Z und N genauso rechnen, wie wir es gewohnt sind. 6.2 Teilbarkeit Definition 6.2.1 Seien a, b ∈ Z. Wir sagen, dass a die Zahl b teilt, wenn es k ∈ Z gibt mit b = ka. Wir schreiben dafür a|b . Ist b nicht durch a teilbar, so schreiben wir a 6 | b. Srechweisen: Für a|b: a teilt b, b ist Teiler von a, a ist durch b teilbar. Für a 6 | b: a teilt b nicht, b ist kein Teiler von a, a ist nicht durch b teilbar. Korollar 6.2.2 Seien a, b, c, d ∈ Z. Dann gilt: (1) a|a; a|b und b|a =⇒ a = ±b; a|b und b|c =⇒ a|c. (2) d|a und d|b =⇒ d|(ax + by) für alle x, y ∈ Z. (3) a|b und a|(b + c) =⇒ a|c. Beweis: Zu 1. a|a, da a = 1 · a. Es gibt k, l ∈ Z mit b = ka, a = lb. Ist b = 0, dann ist a = 0 und nichts ist mehr zu zeigen. Sei nun b 6= 0; o.E. b > 0. Dann folgt aus b = klb offenbar kl ∈ N, kl = 1 und damit k = ±1, l = ±1. Wir haben b = ka, c = lb mit k, l ∈ Z. Daraus folgt c = lb = lka, also a|c. Zu 2. Wir haben a = kd, b = ld. Seien x, y ∈ Z. Dann gilt ax + by = kdx + ldy = (kx + ly)d; also d|(ax + by) . Zu 3. Wir haben b = ka, b + c = la mit k, l ∈ Z. Daraus folgt c = la − b = la − ka = (l − k)a, also a|c. Bei Teilbarkeitsfragen in Z können wir uns in der Regel immer auf positive Teiler, d.h. auf Teiler in N, zurückziehen, da von den zwei Zahlen a, −a stets eine in N liegt, falls a 6= 0; der Fall a = 0 ist uninteressant, da dann auch b = 0 . In diesem Abschnitt kommen wir ausschließlich mit den Eigenschaften der ganzen Zahlen aus, wie sie sich aus der axiomatischen Einführung der natürlichen Zahlen mittels der Peano– Axiome ergaben; insbesondere haben wir die Rechenarten“ +, −, ·, ≤, < uneingeschränkt zur ” Stand: 9. Februar 2010 67 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.2. TEILBARKEIT Verfügung. Nicht zur Verfügung steht die Division ÷, eine Tatsache, die die Reichhaltigkeit der Resultate bzgl. Teilbarkeit beschert. Fragt man nach gemeinsamen Teilern zweier ganzer Zahlen a, b, so interessiert insbesondere der größte dieser gemeinsamen Teiler. Dabei können wir uns dann auf positive Teiler beschränken, denn 1 ist stets ein gemeinsamer Teiler von a und b. Definition 6.2.3 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl d ∈ N heißt größter gemeinsamer Teiler von a, b genau dann, wenn (1) d|a , d|b (2) Ist d′ ∈ N ein Teiler von a und b, so teilt d′ auch d gilt. Wir schreiben d = ggT (a, b) = a ⊓ b . Der größte gemeinsame Teiler d gemäß Definition 6.2.3 ist eindeutig bestimmt dank der Tatsache, dass wir d ∈ N gefordert haben. Es sollte klar sein, wie nun der größte gemeinsame Teiler von endlich vielen ganzen Zahlen erklärt ist. Beispiel: 6 ⊓ 10 = 2, 6 ⊓ 10 ⊓ 30 = 2, 6 ⊓ 10 ⊓ 15 = (6 ⊓ 10) ⊓ 15 = 6 ⊓ (10 ⊓ 15) = 1 . Definition 6.2.4 Seien a, b ∈ Z. Gilt a ⊓ b = 1 , so nennen wir a, b teilerfremd. Lemma 6.2.5 Seien a, b ∈ Z nicht beide Null. Dann gilt a ⊓ b = (−a) ⊓ b = (−a) ⊓ (−b) = a ⊓ (−b) . Beweis: Wir beweisen etwa die erste Gleichheit. Diese folgt aber aus der einfachen Beobachtung, dass d ein Teiler von a und b genau dann ist, wenn d ein Teiler von −a und b ist. Wir suchen den größten gemeinsamen Teiler von Zahlen a, b ∈ Z . Beachte, dass es wegen Lemma 6.2.5 ausreicht, den größten gemeinsamen Teiler für Zahlen in N zu berechnen. Satz 6.2.6 (Division mit Rest) Für alle a ∈ Z, b ∈ N gibt es eindeutig bestimmte Zahlen q, r ∈ Z mit a = bq + r und 0 ≤ r < b. Beweis: Wir beweisen zunächst die Existenz von q, r für a ≥ 0 durch vollständige Induktion: a = 0 : Setze q := r := 0 . a + 1 : Ist a + 1 < b, so gilt a + 1 = 0b + (a + 1) und wir sind fertig. Ist a + 1 ≥ b, so folgt aus der Induktionsvoraussetzung a + 1 − b = qb + r mit q ∈ Z, 0 ≤ r < b. Also a + 1 = (q + 1)b + r. Die Existenz folgt für a < 0 aus der Anwendung der eben bewiesenen Aussage auf −a gemäß −a = q ′ b + r ′ , 0 ≤ r ′ < b durch a= Stand: 9. Februar 2010 (−q ′ − 1)b + (b − r ′ ) , falls r ′ 6= 0 (−q ′ )b , falls r ′ = 0 68 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.3. EUKLIDISCHER ALGORITHMUS Um die Eindeutigkeit zu beweisen, nehmen wir ein zweites Zahlenpaar q ′ , r ′ mit a = q′b + r′, 0 ≤ r′ < b , wobei o. E. r ≥ r ′ sei. Dann ist 0 ≤ r − r ′ < b, r − r ′ = (q − q ′ )b, q − q ′ ≥ 0, und dies ist nur mit q ′ = q, r = r ′ verträglich. Lemma 6.2.7 Sei a ∈ Z und b ∈ N. Dann folgt aus der Darstellung a = qb + r , q ∈ Z, die Aussage a ⊓ b = b ⊓ r. Beweis: Ist d ein Teiler von a, b, dann ist d ein Teiler von b und r und umgekehrt (siehe Folgerung 6.2.2). 6.3 Euklidischer Algorithmus Algorithm 1 Der euklidische Algorithmus EIN a, b ∈ Z ; o.E. a ≥ b > 0 . Schritt 0 a′ := a, b′ := b . Schritt 1 (a′ , b′ ) := (b′ , r), wobei a′ = qb′ + r mit 0 ≤ r < b′ ist. Schritt 2 Ist r = 0, gehe zu AUS. Ist r 6= 0, setze a′ := b′ , b′ := r, gehe zu Schritt 1. AUS d := b′ = a ⊓ b . Die Aussage, dass d der größte gemeinsame Teiler von a, b ist, falls die Situation r = 0 erreicht wird, folgt aus dem Lemma 6.2.7. Bleibt noch zu klären, dass die Situation r = 0 in endlich vielen Schritten wirklich erreicht wird. Dies folgt aber aus der Tatsache, dass für zwei aufeinanderfolgende Durchläufe von Schritt 1 (a′ , b′ ) , (a′′ , b′′ ) sicherlich 0 ≤ b′′ < b′ , b′ , b′′ ∈ N0 gilt. Also muss schließlich das Verfahren bei r = 0 abbrechen. Der euklidische Algorithmus gilt als ein recht schneller Algorithmus: um den größten gemeinsamen Teiler d von a, b auszurechnen, ist etwa soviel Aufwand wie für die Multiplikation von a und b nötig. Er findet vielfältig Anwendung in der mathematischen Informatik. Wir geben dem Euklidischen Algorithmus, wohlwissend, dass der Schritt 1 nur endlich oft durchlaufen wird, eine explizite Fassung: Euklidischer Algorithmus Kettenbruchentwicklung a b r0 r1 r1 r2 r0 := a , r1 := b, r0 = q1 r1 + r2 , 0 < r2 < r1 , r1 = q2 r2 + r3 , 0 < r3 < r2 , .. . .. . rk−1 = qk rk + rk+1 , 0 < rk+1 < rk , rk = qk+1 rk+1 , Stand: 9. Februar 2010 .. . rk−2 rk−1 rk rk+1 69 = r0 r1 = q1 + rr12 = q2 + rr3 2 .. . = qk + r rk k−1 = qk+1 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.3. EUKLIDISCHER ALGORITHMUS In dieser Darstellung ist rk+1 = rk−1 ⊓ rk = · · · = r0 ⊓ r1 = a ⊓ b nach Lemma 6.2.7. Beachte: Bei der Spalte Kettenbruchentwicklung“ haben wir Brüche vorweggenommen. Für ” ein Verständnis der Kettenbruchentwicklung reicht ein elementares Wissen über rationale Zahlen aus. Beispiel 6.3.1 a = 104629 , b = 432000 . 104629 = 0 · 432000 + 104629 432000 = 4 · 104629 + 13484 104629 = 7 · 13484 + 10241 13484 = 1 · 10241 + 3243 10241 = 3 · 3243 + 512 3243 = 6 · 512 + 171 512 = 2 · 171 + 170 171 = 1 · 170 + 1 170 = 170 · 1 Also gilt: 104629 ⊓ 432000 = 1 . Aus der obigen Darstellung des euklidischen Algorithmus lesen wir r0 r2 1 1 1 a = ... (6.1) = = q1 + = q1 + r1 = q1 + = q + 1 r 1 b r1 r1 q2 + r32 q2 + r2 r4 q3 + r3 r ab; wir wissen dabei, dass stets 0 < k+1 rk < 1 gilt und dass das Schema nach k Schritten abbricht, denn in formaler Interpretation haben wir rk+2 = 0 . Die berechneten Größen q1 , . . . , qk+1 schreiben als a [q1 , . . . , qk+1 ] oder = [q1 , . . . , qk+1 ] b auf und bezeichnen dies als Kettenbruch. Der Kettenbruch kann mitunter auch sehr lang“ ” sein. In vielen Fällen ist man schon mit einer Näherung [q1 , . . . , ql ] , 1 ≤ l < k + 1 , zufrieden, d.h. mit der Näherung, die entsteht, wenn man rl rl+1 =0 setzt. Beispiel 6.3.2 Die Zahlen a = 71755875 b = 61735500 kommen in Berechnungen des Astronomen Aristarchus von Samos vor. Für a verwendet er die b 43 . Sie ergibt sich, wenn man den Kettenbruch geeignet abbricht: Näherung 37 a 1 . ∼1+ b 6 + 61 Stand: 9. Februar 2010 70 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.3. EUKLIDISCHER ALGORITHMUS Beispiel 6.3.3 Die Umlaufzeit der Erde um die Sonne beträgt ziemlich genau 365 + 104629 Tage . 432000 Aus der Kettenbruchentwicklung 432000 = [0, 4, 7, 1, 3, 6, 2, 1, 170] 104629 ergeben sich Ansätze für Kalender: [0] = 0 [0, 4] = Keine Schaltjahre (Anpassung von Zeit zur Zeit durch Hinzufügen eines Tages) 1 4 [0, 4, 7, 3, 6] = Alle vier Jahre ein Schalttag 194 801 In 800 Jahren läßt man sechs Schaltjahre ausfallen (und zwar in den Jahren, deren Jahreszahlen durch 400 teilbar ist.) Beachte: Da a1 ⊓ a2 ⊓ · · · ⊓ an = a1 ⊓ (a2 ⊓ · · · ⊓ an ) gilt, ist klar, dass wir nun auch ein Verfahren haben, das den größten gemeinsamen Teiler von a1 , . . . , an bereitstellt: Man hat es nur mehrmals anzuwenden. Eine wichtige Konsequenz aus dem Euklidischen Algorithmus ist Satz 6.3.4 (Lemma von Bezout) Seien a, b ∈ Z. Dann gibt es Zahlen s, t ∈ Z mit a ⊓ b = sa + tb . Beweis: O.E. a ≥ b > 0 . Die Aussage folgt dadurch, dass wir den euklidischen Algorithmus in der expliziten Fassung rückwärts lesen. Wir strukturieren dies, indem wir nachrechnen, dass für 0 ≤ i ≤ k + 1 gilt ri = si a + ti b , mit si , ti ∈ Z. (6.2) Dies ergibt sich so: Für i = 0 setze s0 := 1, t0 := 0 und für i = 1 setzte s1 := 0, t1 := 1 . Nun setzen wir si+1 := si−1 − qi si , ti+1 := ti−1 − qi ti , 1 ≤ i ≤ k. (6.3) Dann gilt offenbar die obige Aussage. Beispiel 6.3.5 Wir betrachten wieder Beispiel 6.3.1. Für das Tupel (ri , qi , si , ti ) haben wir dann nach (6.2) und (6.3) die folgende Sequenz (× bedeutet uninteressant oder nicht definiert): (36667, ×, 1, 0), (12247, 2, 0, 1), (12173, 1, 1, −2), (74, 164, −1, 3), (37, ×, 165, −494). Also haben wir 37 = 36667 ⊓ 12247 = 165 · 36667 − 494 · 12247 Korollar 6.3.6 Seien a, m ∈ Z, die nicht beide Null sind, mit a ⊓ m = 1 . Dann gibt es b ∈ Z mit m|(ab − 1) . Stand: 9. Februar 2010 71 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.3. EUKLIDISCHER ALGORITHMUS Beweis: Wir wissen aus dem Lemma von Bezout 1 = ax + my mit x, y ∈ Z . Setze b := x . Dann ist ab − 1 = −my = m(−y) . Die obige Folgerung können wir so lesen, dass bei Teilerfremdheit von a und m zu a eine Zahl b existiert, die die Gleichung a·b=1 bis auf ein Vielfaches von m löst. Bemerkung 6.3.7 Ein Polynom vom Grade n mit ganzzahligen Koeffizienten ist ein Term“ ” der folgenden Form: p(x) := an xn + an−1 xn−1 + · · · + a1 x + a0 ; dabei sind a0 , . . . , an−1 ∈ Z die Koeffizienten des Polynoms und n der Grad, wenn n 6= 0 . Dieses Polynom kann einerseits selbständiges Objekt im Ring Z[X] aller dieser Terme von beliebigem Grad oder als Abbildung von Z nach Z betrachtet werden. Wir nehmen zunächst den ersten Standpunkt ein. Ring“ meint, dass man solche Terme (koeffizientenweise) addieren und mit ” ganzen Zahlen multiplizieren kann. Umgekehrt, kann man nun versuchen, zwei Terme dieser Art zu dividieren“; man wird zur Division mit Rest bei Polynomen geführt. Auf unserer ” ganzzahligen Basis können wir diese nicht vorstellen, denn dazu brauchen wir die rationalen Zahlen; wir kommen im nächsten Kapitel darauf zurück. Kommen wir nochmals auf Primzahlen zurück. Dies sind natürliche Zahlen p 6= 1, die nur die Teiler 1 und p haben. Wir wissen schon, dass es unendlich viele Primzahlen gibt. Maple - Illustration 6.1 Maple kennt die ganzen Zahlen und die rationalen Zahlen, wobei die Anzahl der Stellen von Zähler und Nenner jeweils auf 524279 beschränkt ist. Mit diesen Zahlen rechnet Maple exakt. Der Befehl ifactor zerlegt eine ganze Zahl in ihre Primfaktoren. Hier haben wir mit ‘‘“ das letz” te Ergebnis aufgerufen. Mit isprime überprüft man Zahlen auf die Eigenschaft, Primzahl zu sein. 4 > 2(2 ) ; 65536 > ifactor(‘‘); (2)16 > seq(k2 -k-41, k= 34..41); 1163,1231,1301,1373,1447,1523,1601,1681 > seq(isprime(k2-k-41), k= 35..41); true,true,true,true,true,true,true,false Ein Primzahltest leitet sich aus der Äquivalenz n Primzahl ⇐⇒ n|((n − 1)! + 1) ab. Diese Äquivalenz wird als Satz von Wilson bezeichnet.1 1 Schon G.W. Leibniz hat diesen Satz vermutet, der erste vollständige Beweis stammt von J.L. Lagrange2 , etwa 100 Jahre später hat ihn J. Wilson nachentdeckt. Man sieht schnell, dass, was den Rechenaufwand betrifft, nicht viel gewonnen ist, denn (n − 1)! auszurechnen, ist eine aufwendige Angelegenheit. Stand: 9. Februar 2010 72 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.3. EUKLIDISCHER ALGORITHMUS Die Probiermethode – man probiere alle Primzahlen p ≤ n als mögliche Teiler durch – kann dahin verbessert werden, dass man nur solche p mit p2 ≤ n durchzuprobieren hat, da bei einer Zerlegung n = pq, p, q Primzahlen, für einen der beiden Faktoren sicherlich gilt, dass er dem Quadrate nach nicht grö”ser als n ist. Aber hier hat man das Problem, dass man von allen Zahlen z mit z 2 ≤ n wissen sollte, ob sie Primzahlen sind. Da aber jede Primzahl p von der Form p = 6k±1, k ∈ N, ist (Beweis!) können wir dieses Problem umgehen, indem wir mit solchen 6k ± 1 testen. Man hat dann aber immer noch mit einer Anzahl von Zahlen zu testen, die etwa bei einer 100–stelligen Zahl einen nicht zu bewältigender Aufwand darstellt. Korollar 6.3.8 (Lemma von Euklid) Teilt eine Primzahl ein Produkt a1 · · · ar natürlicher Zahlen, so teilt p wenigstens einen der Faktoren a1 , . . . , ar . Beweis: O. E. sei r = 2. Also haben wir a1 a2 = kp mit k ∈ N . Teilt p die Zahl a1 nicht, dann ist p ⊓ a1 = 1, da p eine Primzahl ist, und es gibt nach Satz 6.3.4 s, t ∈ Z mit 1 = sp + ta1 . Daraus folgt a2 = spa2 + ta1 a2 = p(sa2 + tk). Also teilt p die Zahl a2 . Bevor wir den Hauptsatz der elementaren Zahlentheorie, die Primfaktorzerlegung, beweisen, formulieren noch eine Schreibweise/Vereinbarung: Das Produkt von Zahlen a1 , . . . , an+1 definieren wir induktiv 0 Y ai := 1 (leeres Produkt) , 1 Y ai := a1 (einfaches Produkt) , i=1 i=1 i=1 n+1 Y ai := an+1 · n Y ai . i=1 Satz 6.3.9 (Primfaktorzerlegung) Jede natürliche Zahl n ≥ 2 läßt sich bis auf die Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellen. Beweis: Die Existenz einer Darstellung für n ∈ N beweisen wir induktiv: Für n = 2 ist dies nach der obigen Vereinbarung über das einfache Produkt klar. n + 1 : Ist n + 1 eine Primzahl, dann ist nach Vereinbarung über das einfache Produkt nichts mehr zu zeigen. Anderenfalls gilt n + 1 = pm mit 1 < p, m < n + 1. O.E. können wir nun annehmen nach Lemma 5.5.2, dass m einen Teiler p besitzt, der eine Primzahl ist; also n + 1 = pm mit 1 < p, m < n + 1 . Nach Induktionsvoraussetzung gilt m = p2 · · · pr , p2 , . . . , pr Primzahlen. Dann liegt in n + 1 = pp2 · · · pr eine Zerlegung von n + 1 in Primfaktoren vor. Zur Eindeutigkeit: Sei n = p1 · · · pr = q1 · · · qs mit Primzahlen p1 , . . . , pr , q1 , . . . , qs . Durch Induktion über n zeigen wird, dass r = s und nach Umnumerierung p1 = q1 , . . . , pr = qr gilt. p1 teilt das Produkt q1 · · · qs und damit einen der Faktoren q1 , . . . , qs . Also etwa nach Umnumerierung p1 |q1 . Da q1 Primzahl ist, ist p1 = q1 . Also (Kürzungsregel) p2 · · · pr = q2 · · · qs =: m . Da m < n gilt, sagt die Induktionsannahme r = s, p2 = q2 , . . . , pr = qs nach eventueller Umnumerierung und wir sind fertig. Die Herstellung der Primfaktorzerlegung einer (großen) Zahl ist kein leichtes Unterfangen. Die Schwierigkeit wird dadurch beleuchtet, dass nahezu gleiche Zahlen eine sehr verschiedene Primfaktorzerlegung besitzen können: 370273 = 43 · 79 · 109 , 370277 = 17 · 23 · 947 , 370279 = 7 · 13 · 13 · 313 . Definition 6.3.10 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl k ∈ N heißt kleinstes gemeinsames Vielfaches von a, b genau dann, wenn gilt: (1) a|k , b|k . Stand: 9. Februar 2010 73 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.4. MODULARE ARITHMETIK (2) Sind a, b Teiler von k′ ∈ N, so ist k ein Teiler von k′ . Wir schreiben k = kgV (a, b) = a ⊔ b . Bemerkung 6.3.11 Das kleinste gemeinsame Vielfache von Zahlen a, b ∈ N ist die kleinste Zahl m ∈ N, für die a|m , b|m gilt. Kennt man die Primfaktorzerlegung von a und b, so kann man es sehr einfach ablesen(, wie übrigens auch den größten gemeinsamen Teiler). 6.4 Modulare Arithmetik Die modulare Arithmetik beschreibt das Rechnen im Ring Zm , wobei m ∈ N, m ≥ 2, der gewählte Modul ist. Der Ring Zm kommt als Menge der Äquivalenzklassen/Restklassen bezüglich der Äquivalenzrelation Division mit Rest“ bezüglich des Moduls m zustande: ” Zm := {[0], [1], . . . , [m − 1]} wobei [i] := {n ∈ N|n = qm + i für ein q ∈ Z} . Beachte, dass etwa die Klasse [1] auch als die Klasse [m + 1] beschrieben werden kann; wir haben in der Definition von Zm ein naheliegendes Representantensystem gewählt. Klar, für m = 2 erhalten wir gerade die Einteilung der natürlichen Zahlen in die Klassen gerade Zahlen und ungerade Zahlen. Für diese Klassen hat man in natürlicher Weise eine Addition und eine Multiplikation: gerade + gerade = gerade , ungerade + gerade = ungerade gerade · gerade = gerade , ungerade · gerade = gerade Diese Beobachtung schreiben wir nun fort auf Zm : Addition: [i] + [j] := [i + j] , i, j ∈ {0, 1, . . . , m − 1} ; Multiplikation: [i] · [j] := [ij] , i, j ∈ {0, 1, . . . , m − 1} . Damit dies wohldefiniert ist, muss noch gezeigt werden: aus [i] = [j], [i′ ] = [j ′ ] folgt [i+j] = [i′ +j ′ ] und [ij] = [i′ j ′ ] . Wir beweisen dies am Beispiel der Multiplikation. [i] = [j], [i′ ] = [j ′ ] bedeutet i′ = pm + i, j ′ = qm + j für p, q ∈ Z . Daraus folgt i′ j ′ = (pm + i)(qm + j) = (iqm + jpm + pqm)m + ij also [ij] = [i′ j ′ ] . [0] ist das neutrale Element für die Addition, [1] ist das neutrale Element für die Multiplikation: [i] + [0] := [i] , [i] · [1] = [i] , i, j ∈ {0, 1, . . . , m − 1} . Weiterhin ist leicht zu sehen, dass [m − i] das Inverse von [i] bezüglich der Addition ist. Nun fassen wir zusammen: Zm ist bezüglich der Addition eine kommutative Gruppe. Dieses Ergebnis gilt unabhängig von m. Für die Multiplikation ist die Situation nicht so einfach, denn es gibt die Situation, dass Nullteiler auftreten; etwa [2] · [2] = [2 · 2] = [0] in Zm für m = 4 . Also kann hier [2] kein Inverses bezüglich der Multiplikation haben. Ist nun m eine Primzahl, dann ist, wie wir wissen, die Klasse [1] ein neutrales Element und aus dem Lemma von Bezout 6.3.4 folgern wir, dass es zu jeder Zahl k = 1, . . . , m − 1 ein l ∈ N gibt mit m teilt kl − 1; d.h. [k] · [l] = [1] . Somit hat man für jedes Element in Zm \{[0]} ein Inverses. Nun fassen wir zusammen: Zm \{[0]} ist bezüglich der Multiplikation eine kommutative Gruppe, falls m eine Stand: 9. Februar 2010 74 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.5. PSEUDOZUFALLSZAHLEN + [0] [1] [2] [3] [4] [0] [0] [1] [2] [3] [4] · [1] [2] [3] [4] [1] [1] [2] [3] [4] [0] [1] [1] [2] [3] [4] [2] [2] [3] [4] [0] [1] [2] [2] [4] [1] [3] [3] [3] [4] [0] [1] [2] [3] [3] [1] [4] [2] [4] [4] [0] [1] [2] [3] [4] [4] [3] [2] [1] (b) (a) Abbildung 6.1: Gruppentafeln zu Z5 + 0 1 a b · 0 1 a b 0 0 1 a b 0 0 0 0 0 1 1 0 b a 1 0 1 a b a a b 0 1 a 0 a b b b a 1 0 b 0 b (a) 1 1 a (b) Abbildung 6.2: Gruppentafeln zu einem Körper mit 4 Elementen Primzahl ist. Die Gruppentafeln – so bezeichnen wir eine vollständige Auflistung der Verknüpfungen der Gruppenelemente – zu m = 5 sehen wie in 6.1 aufgeführt aus. Man beachte, dass sowohl in der Gruppentafel zur Addition als auch in der Gruppentafel zur Multiplikation in jeder Zeile und Spalte jede Klasse genau einmal vertreten ist. Beachte ferner, dass die Potenzen des Elements [2] alle Elemente von Z∗5 := Z5 \{[0]} durchlaufen: [2]0 = [1] , [2]1 = [2] , [2]2 = [4] , [2]3 = [3] , [2]4 = [1] . Man nennt eine Gruppe, die ein solches zyklisches Element besitzt, eine zyklische Gruppe. Bemerkung 6.4.1 Für beliebiges m ∈ N, m ≥ 2, ist (Zm , +, ·) ein Ring mit Einselement. Ist p ∈ N eine Primzahl, so ist (Zm , +, ·) sogar ein Körper, ein endlicher, denn Zp hat ja (nur) p Elemente. Damit kennen wir zu jeder Primzahl p einen Körper mit p Elementen. Wie sieht es aber mit den Lücken m = 4, m = 6, m = 8, . . . aus? Es gibt das diese Frage abschließende Resultat, dass es einen Körper mit m Elementen genau dann gibt, wenn m eine Primzahlpotenz ist. In 6.2 findet man einen Körper mit 4 Elementen in abstrakter, d.h. nicht in einer schon durch bekannte Objekte beschriebene Form. Wo werden endliche Körper benötigt? Allgemein in der Diskreten Mathematik, der Mathematischen Informatik und speziell in der Verschlüsselung von Daten. 6.5 Pseudozufallszahlen Um die umständliche Verwendung von Tabellen zu vermeiden, werden Folgen von Zufallszahlen verwendet, die im Allgemeinen durch Iterationen hergestellt werden; wir sprechen von Pseudozufallszahlen. Darunter versteht man mathematisch wohldefinierte Zahlenfolgen, die als Folgen Stand: 9. Februar 2010 75 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.5. PSEUDOZUFALLSZAHLEN von Zufallszahlen angesehen werden sollen. Diese Zufallszahlen haben den Vorteil, dass sie reproduzierbar sind, und haben den Nachteil, dass sie deterministischen Charakter besitzen. Alles, was wir hier zur Sprechweise Zufallszahl“ sagen können, ist, dass jedenfalls kein Muster, keine ” Struktur in der Folge erkennbar sein soll. Die Wahrscheinlichkeitstheorie und Statistik stellt Hilfsmittel bereit, solche Folgen auf ihre Zufälligkeit zu testen. Zunächst einige allgemeine Bemerkungen. Sei M eine endliche Menge. Pseudozufallszahlen, deren Konstruktionsmethode wir hier besprechen wollen, ergeben sich als Iterierte einer Funktion f : M −→ M in folgender Weise: xn+1 := f (xn ) , n ∈ N0 . (6.4) Der Startwert x0 heißt Samen der Pseudozufallsfolge (xn )n∈N die Folge selbst heißt auch Orbit und die Funktion f heißt der Generator. Die Folge ist durch die Wahl von f und x0 vollständig bestimmt; es handelt sich also um keine echte Zufallsfolge. Durch geschickte Wahl von f – gewünscht wird eine gute Durchmischung von M – kann man jedoch erreichen, dass sich die Folge für viele Anwendungen wie eine Zufallsfolge verhält. Da die Menge M endlich ist, können nicht alle Folgenglieder xn verschieden sein. Es gibt also Indizes k, l mit xk = xl ; o. E. k > l . Seien k, l die ersten Indizes, für die dies eintritt. Sei damit r := k − l . Da xk = xl gilt, folgt xn+r = xn für alle n ≥ l . Also wird der Orbit (xn )n∈N periodisch mit Periode r ; wir haben einen Zyklus der Länge r . Verlangt man, dass jedes Element der Menge M die Chance hat im Orbit aufzutauchen, muss der Zyklus ganz M umfassen. Daraus folgt, dass die Abbildung f surjektiv sein muss. Da M endlich ist, hat f also sogar bijektiv zu sein. Wir werden unten sehen, dass die Bijektivität keineswegs dafür schon ausreicht, ein guter Generator zu sein. Die Pseudozufallszahlengeneratoren, die wir hier besprechen wollen, sind ausschließlich affine Generatoren; also M := Zm ; f : Zm ∋ [x] 7−→ ([ax] + [b]) ∈ Zm , (6.5) mit einem Modul m . Hier sind a.b ∈ Z . Wir bezeichnen (6.5) auch als Kongruenz–Generator, denn Rechnen in Kongruenzen ist nichts anderes als das Rechnen in Restklassen. Wir führen die zugehörige Schreibweise ein. Mit u, v ∈ Z schreiben wir: u=v mod m : ⇐⇒ [u] = [v] ⇐⇒ m|(u − v) . Damit lautet die Rechenvorschrift für den Kongruenz–Generator M := {0, . . . , m − 1} ; f : M ∋ x 7−→ ax + b mod m ∈ M . (6.6) Bemerkung 6.5.1 Durch die Generatoren in (6.5) werden Zufallszahlen in M := {0, 1, . . . , m− 1} erzeugt. Aus einer Zufallszahl y ∈ {0, . . . , m − 1} ergibt sich eine Zufallszahl z in [0, 1] ganz y einfach so: z := m . Damit die Abbildung f aus (6.5) bijektiv wird, muss a ein invertierbares Element in Zm sein, d.h. a muss zu m teilerfremd sein. Für die Klärung der Frage, unter welchen Bedingungen dieser Typ von Generatoren einen Zyklus maximaler Länge erzeugt, schauen wir uns Beispiele an. Stand: 9. Februar 2010 76 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.5. PSEUDOZUFALLSZAHLEN Beispiel 6.5.2 Betrachte die spezielle Wahl m = 10, a = b = 7 . Hier ist der erzeugte Zyklus 7, 6, 9, 0, 7, 6, 9, 0, . . . ziemlich kurz, obwohl natürlich a = 7 ein invertierbares Element in Z10 ist. Beispiel 6.5.3 Betrachte die spezielle Wahl m = 231 , a = 65539, b = 0 . Dies ist der Zufallsgenerator RANDU, wie er von IBM in den Computern in den 60er Jahren verwendet wurde. Die maximal erreichbare Zykluslänge r ist hier nicht ganz maximal, aber mit r = 229 nahezu maximal. Wir kommen später auf die Güte dieses Generators noch zu sprechen. Lemma 6.5.4 Für a ∈ Z und k ∈ N0 setzen wir Sk (a) := 0 , falls k = 0 , Sk (a) := 1 + a + · · · + ak−1 , falls k ≥ 1 . (6.7) Damit gilt (in Z) : Srk (a) := Sr (ak )Sk (a) , r ∈ N . (6.8) Beweis: Dies rechnet man mittels vollständiger Induktion so nach: r = 1 : Srk (a) = Sk (a) = S1 (ak )Sk (a), da S1 (ak ) = 1 ist. r+1: S(r+1)k (a) = Srk+k (a) = Srk (a) + ark + · · · + ark+k−1 = Sr (ak )Sk (a) + ark Sk (a) = Sk (a)(Sr (ak ) + ark ) = Sk (a)Sr+1 (ak ) . Lemma 6.5.5 Sei p eine Primzahl und a eine ganze Zahl mit a = 1 mod p bzw. a = 1 mod 4, falls p = 2 . Dann gilt für alle n, k ∈ N : n n (a) Sp (ap ) = 0 mod p , Sp (ap ) 6= 0 mod p2 . (b) (c) Spn (a) = 0 mod pn , Spn (a) 6= 0 mod pn+1 . Sk (a) = 0 mod pn ⇐⇒ pn |k . Beweis: Zu a). Wir führen den Beweis nur für p > 2 . Wir haben auf Grund der Voraussetzung a = 1 + jp mit j ∈ Z . Mit der Binomialformel erhält man at − 1 = tjp + cp2 mit einer Konstante c . daher p−1 X n 1 (akp − 1) = pn jp p(p − 1) + c̃p2 , Sp (a ) − p = 2 pn k=0 mit einer weiteren Konstanten c̃ . Daraus liest man die Behauptung ab. Zu b). Wir beweisen die Behauptung durch Induktion nach n . n = 1 . Der Fall p = 2 ist trivial. Sei also p ungerade. Nach Voraussetzung ist a = 1 + jp mit einer ganzen Zahl j , also ak = 1 + kjp mod p2 , k ∈ N . Dann ist Sp (a) − p = Stand: 9. Februar 2010 p−1 p−1 X X p(p − 1) = 0 mod p2 . (ak − 1) = kjp = jp 2 k=0 k=0 77 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.5. PSEUDOZUFALLSZAHLEN Damit ist der Induktionsbeginn schon klar. n + 1 . Der Induktionsschluss ergibt sich aus der Formel n Spn+1 (a) = Sp (ap )Spn (a) , die sich aus (6.8) ergibt, und a). Zu c). Sei pm die höchste Potenz von p mit pm |k, also k = pm l mit p 6 | l . Nach (6.8) ist m Sk (a) = Sl (ap )Spm (a) . m m Es gilt Sl (ap ) = l mod p , Sl (ap ) 6= 0 mod p ; dies verifiziert man wie oben. Daraus schließt man pn |Sk (a) ⇐⇒ pn |Spm (a) , und mit Lemma 6.5.5 pn |Sk (a) ⇐⇒ n ≤ m d.h. pn |Sk (a) ⇐⇒ pn |k ; beachte dabei a). Bevor wir das Hauptergebnis über lineare Kongruenz–Pseudozufallsgeneratoren beweisen, noch ein wichtiges Resultat für das Rechnen in Kongruenzen, das man oft zur Vereinfachung von Argumentationen verwenden kann. Satz 6.5.6 (Chinesischer Restsatz) Ist m = pk11 · · · · · pkr r die Primfaktorzerlegung von m, so ist Zm isomorph zu Zpk1 × · · · × Zpkr r , d.h. es gibt eine bijektive Abbildung g : Zm −→ 1 Zpk1 × · · · × Zpkr r , für die gilt: 1 g([u] + [v]) = g([u]) + g([v]) , g([u] · [v]) = g([u]) · g([v]) , u, v ∈ Z . (6.9) Dabei wird sowohl Addition als auch Multiplikation in Zpk1 ×· · ·×Zpkr r komponentenweise erklärt. 1 Beweis: Offenbar haben Zm und Zpk1 × · · · × Zpkr r gleich viele Elemente. Also genügt es zeigen, dass g 1 injektiv ist. Dazu reicht nun zu zeigen, dass aus g([u]) = ([0], . . . , [0]) folgt: [u] = [0] . Aus g([u]) = ([0], . . . , [0]) folgt pki i |u, i = 1, . . . , r . Dann folgt aber m = pk11 · · · pkr r |u . Also [u] = [0] . Satz 6.5.7 Mit m, a, b ∈ Z, m ≥ 2 betrachte die Abbildung f : {0, . . . , m − 1} ∋ x 7−→ ax + b mod m ∈ {0, . . . , m − 1} . (6.10) Für beliebiges x0 ∈ {0, . . . , m − 1} sei die Folge (xn )n∈N definiert durch xn+1 := f (xn ) , n ∈ N 0 . Genau dann ist diese Folge periodisch mit der maximalen Periodenlänge m, wenn folgende Bedingungen erfüllt sind: a) p|(a − 1) für alle Primteiler p von m ; b) 4|(a − 1) falls 4|m ; c) b und m sind teilerfremd. Stand: 9. Februar 2010 78 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.5. PSEUDOZUFALLSZAHLEN Beweis: Ist m = pk11 ·· · · ·pkr r die Primfaktorzerlegung von m, so hat man nach dem chinesischen Restsatz, dass Zm isomorph zu Zpk1 × · · · × Zpkr r vermöge der Abbildung g in Satz 6.5.6mit den Eigen1 schaften aus (6.9) ist. Es ist daher leicht einzusehen, dass es genügt, den Satz für den Fall zu beweisen, dass m eine Primzahlpotenz pk ist. Vorüberlegung: Es gilt xi+1 − xi = f (xi ) − f (xi−1 ) = a(xi − xi−1 ) , i = 1, 2, . . . , und daher xn − x0 = n−1 X i=0 ai (x1 − x0 ) = Sn (a)(x1 − x0 ) , xn − x0 = Sn (a)(x1 − x0 ) mod m , n ∈ N . (6.11) Wir zeigen nun die Notwendigkeit der Bedingungen. Es sei also vorausgesetzt, dass f einen Zyklus der maximalen Länge m erzeugt. Beachte: m = pk . Falls p nicht a − 1 teilt, sind m, a − 1 teilerfremd und die Gleichung (a − 1)x = b ist in Zm lösbar, d.h. f besitzt einen Fixpunkt. Dann kann aber kein Zyklus der Länge m existieren. a) ist damit gezeigt. Es teile 4 die Zahl m, also m = 2k mit k ≥ 2 . Nach a) wissen wir schon, dass 2|(a − 1) gilt; a ist also ungerade. Es muß also noch gezeigt werden, dass der Fall a = 3 mod 4 nicht auftreten kann. Wäre dies doch der Fall, so würde S2 (a) = 1 + a = 0 mod 4 sein und daher mit S2i (a) = Si (a2 )S2 (a) (siehe Lemma 6.5.5) schließlich S2i (a) = 0 mod 4 für alle i gelten. Mit (6.11) folgt daraus x2i = x0 mod 4 und x2i+1 = x1 mod 4 für alle i ; es könnte also keinen Zyklus maximaler Länge m geben. b) ist damit gezeigt. In einem Zyklus der Länge m muß insbesondere das Element 0 vorkommen; wir dürfen daher o. E. x0 = 0 und daher x1 = b voraussetzen. Dann sagt (6.11), dass xn = Sn (a)b gilt. Ist b nicht invertierbar mod m, kann das Element 1 niemals im Zyklus auftreten. Damit ist auch c) klar. Wir zeigen nun die Hinlänglichkeit der angeführten Bedingungen. Beachte m = pk . Ist m = 2, dann ist b = 1 wegen c) und ein Zyklus der Länge 2 existiert. Im Fall p = 2 dürfen wir also 4|m annehmen und die Voraussetzungen von Lemma 6.5.5 sind erfüllt. Es genügt zu zeigen, dass für x0 = 0 ein Zyklus der Länge m erzeugt wird. Aus x0 = 0 folgt mit (6.11), dass xn = Sn (a)b mod m gilt. Da b invertierbar mod m ist, ist dann xn = x0 = 0 gleichbedeutend mit Sn (a) = 0 mod m . Aus Lemma 6.5.5 c) folgt m|n und damit die Behauptung. Satz 6.5.7 nen nt uns die Bedingungen für einen affinen Kongruenz–Generator, damit er der Minimalforderung, einen Zyklus maximaler Länge zu erzeugen, genügt. Jedoch garantieren diese Bedingungen noch lange keinen guten Zufallsgenerator, wie nachfolgendes Beispiel zeigt. Beispiel 6.5.8 Betrachte für einen beliebigen Modul m den Generator f (x) := x + 1 mod m . Kein Zweifel, die Zykluslänge ist maximal, nämlich m, aber die erzeugte Folge 0, 1, 2, . . . , m − 1, 0, 1 . . . kann sicherlich nicht den Anspruch einer Zufallsfolge erheben. In der Praxis wird häufig ein Modul der Form m = 2k verwendet (und dazu in der Regel der √ √ Multiplikator a im Bereich m < a < m − m). In diesem Fall bedeuten die Bedingungen des Satzes 6.5.7 einfach a = 1 mod 4 und b ungerade . (6.12) Im Beispiel 6.5.3 sind diese Bedingungen offenbar verletzt (a = 216 + 3 und b = 0) und Konsequenz ist ein verkürzter maximaler Zyklus. Beispiel 6.5.9 In der Programmiersprache C++ gibt es einen Generator namens drand48: Modul = 248 , a = 25214903917 , b = 11 . Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfült sind. Stand: 9. Februar 2010 79 c J.Baumeister KAPITEL 6. ELEMENTARE ARITHMETIK 6.6. ÜBUNGEN Beispiel 6.5.10 Von D. Knuth wurde der Generator Modul = 216 , a = 137 , b = 187 vorgeschlagen. Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind. Beispiel 6.5.11 Ein weiterer Generator: Modul = 216 , a = 193 , b = 73 . Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind. Wie soll man nun gute und weniger gute Generatoren auseinanderhalten? Es liegt nahe, Paare, Trippel,. . . von Zufallszahlen zu betrachten und deren geometrische Verteilung zu untersuchen. Wir skalieren“ dazu die Zufallszahlen mit Modul m gemäß ” X i := xi ∈ [0, 1] , i ∈ N0 . m Vergleichen wir die geometrische Verteilung der Paare (X i+1 , X i ) in [0, 1] × [0, 1] für die Generatoren aus Beispiel 6.5.10 und Beispiel 6.5.11. Man kann Geraden entdecken, worauf alle Zufallszahlen liegen, 21 im ersten Fall, 8 im zweiten Fall; die Streifen dazwischen sind frei von den erzeugten Zufallspaaren. Der maximale Abstand von solchen Streifen ist bei beiden Gene1 bei Beispiel 6.5.10, √132 bei Beispiel 6.5.11. ratoren dementsprechend ziemlich verschieden: √274 Dies bedeutet, dass der Generator 6.5.10 größeres Vertrauen genießen sollte. Betrachtet man für den Generator 6.5.3 Tripel (X i+2 , X i+1 , X i ) in [0, 1] × [0, 1] × [0, 1], so stellt 1 haben. man fest, dass diese Tripel auf genau 15 Ebenen liegen, die jeweils einen Abstand √118 Neben der mangelnden Maximalität der Zykluslänge ein weiterer Nachteil dieses Generators. 6.6 1.) Übungen Betrachte die Zahlen H := {3j + 1|j ∈ N} . Bestimme in dieser Menge nichtzerlegbare Elemente. Bestimme in dieser Menge eine Art Primfaktorzerlegung von 100. Ist diese eindeutig bestimmt? Stand: 9. Februar 2010 80 c J.Baumeister Kapitel 7 Polynome und ihre Nullstellen In diesem Kapitel greifen wir die algebraischen Konzepte auf, die u.a. im Zusammenhang mit dem Gruppenbegriff stehen. Zentral sind Polynome über Körpern. Die Frage nach den Nullstellen von Polynomen wird diskutiert, insbesondere auch der zusammenhang mit klassischen Fragestellungen. 7.1 Polynome Zur Erinnerung: Definition 7.1.1 Eine Menge K mit zwei Verknüpfungen + : K × K ∋ (a, b) 7−→ a + b ∈ K , (Addition) · : K × K ∋ (a, b) 7−→ a · b ∈ K (Multiplikation) heißt ein Körper, wenn gilt: a) (K, +) ist eine abelsche Gruppe mit neutralem Element 0. b) (K∗ := K\{0}, ·) ist eine abelsche Gruppe mit neutralem Element 1 . c) Für alle a, b, c ∈ K gilt: a · (b + c) = a · b + a · c . Eine Eigenschaft, die in der Definition verborgen ist, ist die Nullteilerfreiheit. Sie besagt, dass aus a · b = 0 in einem Körper (den Multiplikationspunkt unterdrücken wir meist) stets a = 0 oder b = 0 folgt. Wir kennen aus der Analysis die Körper Q (rationale Zahlen), R (reelle Zahlen) und C (komplexe Zahlen). Sie enthalten unendlich viele Elemente, insbesondere ist 1| + ·{z · · + 1} 6= 0 für alle m ∈ N . (7.1) 1| + ·{z · · + 1} = 0 . (7.2) m−mal Dies ist im Gegensatz zur Situation in endlichen Körpern. Wir kennen die Körper Zp , wobei p eine Primzahl ist. Ohne Beweis sei hier zunächst angemerkt, dass es endliche Körper zu jedem q ∈ N mit q = pn , n ∈ N, gibt, wobei p eine Primzahl ist. Diese Körper bezeichnen wir (der Literatur entsprechend) Fq . In endlichen Körpern kann die Eigenschaft (7.1) nicht zutreffen. Also gibt es ein kleinstes n ∈ N mit m−mal 81 KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.1. POLYNOME Dieses m heißt die Charakteristik char(Fq ) des Körpers Fq . Zur Ergänzung setzen wir char(K) = 0 für unendliche Körper K . Es ist nicht allzu schwer einzusehen, dass char(Fq ) = p, falls q = pn gilt. Sei K ein Körper. Betrachte p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn = n X ak xk , (7.3) k=0 Ein Ausdruck dieser Art heisst ein Polynom mit Koeffizienten a0 , . . . , an in K . Ist an 6= 0 und n ≥ 1, so sagen wir, dass das Polynom den Grad n hat, anderenfalls den Grad 0 . Wir fassen die Polynome zusammen in K[x]: K[x] := {p|p Polynom} . (7.4) Eine Teilmenge davon bilden die Polynome vom Grad höchstens n: Kn [x] := {p|p Polynom vom Grad ≤ n} . (7.5) Ohne genauer darauf einzugehen halten wir fest: Beide Zusammenfassungen stellen Vektorräume über dem Skalarkörper dar. Addition und skalare Multiplikation werden definiert, indem wir auf dem Koeffizientenvektor (a0 , . . . , an ) operieren: ap(a0 ,...,an ) + bp(b0 ,...,bn ) := p(aa0 +bb0 ,...,aan +bbn ) . Eine Basis des Vektorraums Kn [x] ist gegeben durch die Monome 1, x, . . . , xn , falls char(K) = 0 . Beispiel 7.1.2 Sei K := Z2 . Dann ist das Polynom p : x 7−→ x2 +x offenbar die Nullabbildung, denn es gilt p(0) = p(1) = 0 . Offenbar ist das Polynom nicht das Nullpolynom, denn es hat ja den Grad 1. Dies macht deutlich, dass wir zwischen Polynomen und Polynomfunktion unterscheiden müssen. Bemerkung 7.1.3 Polynome mit Koeffizienten in Z sind auch interessant. Wir kommen im Zusammenhang mit algebraischen Zahlen darauf zurück; siehe Bemerkung 7.2.4. Mit den obigen Feststellungen ist die algebraische Bedeutung der Polynome bei weitem noch nicht erschöpft, im Gegegenteil, sie spielen in der Körpertheorie eine große Rolle; wir deuten dies an. Definition 7.1.4 Ein Polynom p ∈ Fq [x] vom Grade n ∈ N heißt irreduzibel (über Fq ), falls eine Zerlegung p = f g in Polynome f, g ∈ Fq [x] mit Grad ≤ n − 1 nicht möglich ist. Die Zerlegung von Polynomen führt zur Teilbarkeit von Polynomen. Definition 7.1.5 Sei K ein Körper und seien p, g ∈ K[x] . Wir sagen, dass g das Polynom p teilt, wenn es f ∈ K[x] gibt mit p = f g . Wir schreiben dafür g|p . Ist p nicht durch g teilbar, so schreiben wir g 6 | p . Teilbarkeit führt wieder zu einer Äquivalenzrelation in der Menge der Polynome über einem Körper. Noch wichtiger, auch Division mit Rest ist möglich. Damit ist auch die Rechenart“ ” mod erklärt. Ohne Beweis geben wir an: Satz 7.1.6 Sei p ∈ Fq [x] ein irreduzibles Polynom vom Grad m ∈ N . Führt man in (Fq )m−1 [x] die Additon und Multiplikation modulo p durch, dann ist (Fq )m−1 [x] ein Körper mit q m Elementen. Stand: 9. Februar 2010 82 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.1. POLYNOME + 0 1 x 1+x · 0 1 x x+1 0 0 1 x x+1 0 0 0 0 0 1 1 0 x+1 x 1 0 1 x x+1 x x x+1 0 1 x 0 x x+1 1 x+1 x+1 x 1 0 x+1 0 x+1 1 x (a) (b) Abbildung 7.1: Gruppentafeln zu (Fq )n−1 [x] Beispiel 7.1.7 Sei K := F2 . Betrachte das Polynom p(x) := x2 + x + 1 . Diese Polynom ist irreduzibel, denn eine Zerlegung in Linearfaktoren“ ist nicht möglich, wie man durch einfache ” Rechnung bestätigt. Also bilden die Polynome 0, 1, x, x + 1 (beachte x2 = −x − 1 = x + 1 über F2 ) einen Körper mit 4 Elementen. Wir haben ihn in Abbildung 6.2 schon kennengelernt, allerdings können wir die dortigen Objekte a, b nun mit x, x + 1 identifizieren; siehe Abbildung 7.1. Sei p ∈ K[x] . Dieses Polynom kann auch als Abbildung interpretieren: K ∋ x 7−→ p(x) ∈ K[x] . Die Auswertung von p in einem Punkt z ∈ K kann durch Auswertung der Monome und Aufsummierung der Terme erfolgen. Man muss folgenden Aufwand betreiben: n Additionen und 1 + 2 + · · · + n = 21 n(n + 1) Multiplikationen. Ein effizientere Methode basiert auf der Beobachtung, dass jedes Polynom p mit p(x) = a0 + a1 x + · · · + an xn als p(x) = a0 + x(a1 + x(a2 + · · · + x(an−1 + an x) · · · )). (7.6) geschrieben werden kann. Diese Schreibweise eines Polynoms führt zur Horner–Methode zur Auswertung von Polynomen. Wir lesen ab, dass die Auswertung von p in z dieser Weise mit Hilfe von n Additionen und n Multiplikationen erfolgen kann.1 Die Horner Methode kann realisiert werden in folgendem Fragment eines Algorithmus: Horner–Methode: bn−1 := an ; for j = n − 2, n − 3, . . . , 0 bj := aj+1 + zbj+1 ; p(z) = a0 + zb0 1 Die Horner–Methode kann als optimal angesehen werden, was den Aufwand zur Auswertung eines Polynoms für allgemeine Körper und allgemeine Polynome betrifft. Dieses Result kann als Geburtsstunde der Komplexitätstheorie für Algorithmen angesehen werden. Stand: 9. Februar 2010 83 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.1. POLYNOME Lemma 7.1.8 Sei p(x) = a0 + a1 x + · · · + an−1 xn−1 + an xn ein Polynom mit Koeffizienten in C vom Grad n und sei p ausgewertet in z Mit Hilfe des obigen Fragments. Sei q(y) := b0 + b1 y + · · · + bn−1 y n−1 das Polynom mit den Koeffizienten b0 , b1 , . . . , bn−1 , die man dabei erhält. Dann haben wir p(x) = q(x)(x − z) + p(z) , p′ (z) = q(z) . (7.7) Beweis: Die zweite Behauptung p′ (z) = q(z) ist eine Konsequenz der ersten Aussage p(x) = q(x)(x − z) + p(z) . Wir wissen aus dem obigen Fragment aj = bj−1 − zbj , j = 1, 2, . . . , n − 1, und a0 = p(z) − zb0 . Deshalb p(x) = n−1 X j=0 = n X j=0 bj xj (x − z) + p(z) = bj−1 xj − z = an xn + n−1 X n−1 X n−1 X j=0 bj xj+1 − z n−1 X bj xj + p(z) j=0 bj xj + p(z) = bn−1 xn + n−1 X j=1 j=0 aj xj + a0 = n X (bj−1 − zbj )xj − zb0 + p(z) aj xj = p(x) j=0 j=1 Maple - Illustration 7.1 Die Koeffizienten a0 , . . . , an des Polynoms werden im Vektor a gespeichert. Der Wert p(z) ist pval zugewiesen. ≫ ≫ ≫ ≫ ≫ n=length(a); pval= a(n); for i=n-1:-1:1 pval= z*pval + a(i); end Hier ist eine VektorImplementierung im Fall, dass das Polynom in mehreren Punkten ausgewertet werden soll. Die Auswertungspunkte z1 , . . . , zm werden im Vektor zz gespeichert, die Ergebniss werden pVal zugewiesen. ≫ ≫ ≫ ≫ ≫ n=length(a); pVal = a(n) * ones(size(zz)); for k=n-1:-1:1 pVal= zz.*pVal + a(k); end Polynome sind in der Angewandten Mathematik als Bausteine für Approximationen von Funktionen von großem Wert und großer Attraktivität, da sie sehr einfach gespeichert (Koeffizienten) und ausgewertet (Horner-Verfahren) werden können. Sie sind involviert bei der Interpolation von Funktionen, bei Splines, Bezier-Kurven und Finiten Elementen. Die zentrale Stütze dabei ist der Approximationssatz von Weierstrass, der besagt, dass jede stetige Funktion auf einem beschränktem und abgeschlossenen Intervall I ⊂ R durch Polynome mit vorgegebener Genauigkeit approximiert werden kann. Stand: 9. Februar 2010 84 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.2 7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG Nullstellen von Polynomen formelmäßig Wir betrachten nun das Problem der Auflösbarkeit von polynomialen Gleichungen mit Koeffizienten in einem Körper K ∈ {Q, R, C}. Aus den Lösungsformeln kann man dann ablesen, wann diese Auflösbarkeit in Q bzw. R bzw. C gelingt. In diesem Sinne sprechen wir von Lösungen. Eine Gleichung der Form x−c=0 (7.8) heißt eine lineare Gleichung. Der einzige Lösung ist x = c . Gegeben sei die quadratische Gleichung ax2 + bx + c = 0 (7.9) b , denn für y ergibt sich die für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 2a Gleichung b2 − 4ac , (7.10) y2 = 4a2 deren Lösungskandidaten auf der Hand liegen: 1p 2 b − 4ac . y=± 2a Die Lösungskandidaten von (7.9) werden damit mit b 1p 2 x=− ± b − 4ac (7.11) 2a 2a beschrieben. Aus der Gleichung (7.11) liest man auch die Methode der quadratischen Ergänzung ab: b b2 b2 c b (x + )2 = x2 + x + 2 = − + 2 . 2a a 4a a 4a Über Q liegt also Lösbarkeit vor, wenn a, b, c rational sind und b2 − 4ac ein Quadrat einer rationalen Zahl ist. Über R liegt Lösbarkeit vor, wenn a, b, c reell sind und b2 − 4ac ≥ 0 ist. Die Lösbarkeit über C liegt universell vor. Insbesondere hat die Gleichung x2 + 1 = 0 die Lösungen (Wurzeln) x = ±i. Bemerkung 7.2.1 Aus der Formel (7.11) lesen wir ab, dass das Produkt der Lösungen der quadratischen Gleichung (7.9) für a = 1 gleich dem Koeffizienten c ist. Diese Tatsache bezeichnet man als Vietaschen Wurzelsatz. Betrachte die kubische Gleichung ax3 + bx2 + cx + d = 0 (7.12) b , denn für y ergibt sich die für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 3a Gleichung y 3 = py + q, wobei p, q gewisse rationale Ausdrücke in a, b, c, d sind. Diese Gleichung ist immer noch nicht einfach, aber folgende Substitution y = u + v 2 hilft weiter, denn es entsteht 3uv(u + v) + u3 + v 3 = p(u + v) + q. 2 Die Idee mit den Hilfsgrößen u, v hatte wohl Scipione del Ferro, der er vorzeitig verstarb, ausgearbeitet hat sie dann Tartaglia. Er teilte die Lösung einer kubischen Gleichung Cardano in Form eines Sonetts mit. Die wesentliche Zeile lautete: Trovan dui altri“ (Finde zwei andere Größen). Diese Idee läßt sich geometrisch aus einer Zerlegung ” eines Einheitswürfels ableiten. Stand: 9. Februar 2010 85 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG Wir spalten auf in 3uv = p , u3 + v 3 = q, p setzen v := 3u , und lösen u3 + ( p 3 p ) = q , d.h. (u3 )2 − qu3 + ( )3 = 0 . 3u 3 Dies ist eine quadratische Gleichung in u3 und wir haben mit (7.11) r q p q 3 u = ± ( )2 − ( )3 . 2 2 3 Die Symmetrie der Formeln in u und v hat zur Folge, dass sich für v nichts wesentlich Neues ergibt. Wir erhalten r r q p 3 3 q p q 2 q 3 u = + ( ) − ( ) , v = − ( )2 − ( )3 , 2 2 3 2 2 3 und daher x= s 3 q + 2 r q p ( )2 − ( )3 + 2 3 s 3 q ( − 2 r q p b ( )2 − ( )3 − . 2 3 3a (7.13) b gefunFür die ursprüngliche Gleichung (7.12) haben wir so einen Lösungskandidaten x = y − 3a den. Durch Division mit Rest reduzieren wir dann die Gleichung 3. Grades auf eine Gleichung 2. Grades und behandeln diese nach dem schon vorgestellten Verfahren für Gleichungen 2. Grades weiter. Beispiel 7.2.2 Betrachte die Gleichung x3 − 7x − 6 = 0 . Sie hat die Lösungen x1 = −1, x2 = −2, x3 = 3 (in Q) . Die obige Vorgehensweise liefert in C die Lösung s s r r 100 100 3 3 ∗ + 3−i . x = 3+i 27 27 Man stellt fest, dass es sich dabei um die Lösung x3 handelt. Betrachte die Gleichung x3 + 3x − 4 = 0 . Sie hat die Lösung x1 = 1 (in Q) . Die obige Vorgehensweise liefert in C die Lösung q q √ √ 3 3 ∗ x = 2 + i 5+ 2 − i 5. Man stellt fest, dass es sich dabei um die Lösung x1 handelt. Hier sind drei Probleme, die schon im Altertum formuliert wurden und die alle mit polynomialen Gleichungen zu tun haben. 1. Dreiteilung des Winkels (Teilung eines Winkels in drei gleiche Teile.) 2. Verdoppelung des Würfels (Konstruktion der Seite eines Würfels, dessen Volumen zweimal so groß ist wie das gegebene Dreieck.) Es wird das Delische Problem genannt. Stand: 9. Februar 2010 86 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG 3. Quadratur des Kreises (Konstruktion eines Quadrates mit einer Fläche, die der Fläche eines gegebenen Kreises gleich ist.) Die Herausforderung bei der Beschäftigung mit den Problemen besteht darin, dass als Han” dicap“ verlangt wird, dass die Lösungen der Probleme mit Zirkel und Lineal konstruierbar sein sollen. Ob dies möglich ist, kann nun mit der algebraischen Theorie der Körpererweiterung beantwortet werden. Bezogen auf die Probleme bedeutet dies, dass gewisse den Problemen zugeordneten Polynome Nullstellen in Körpern besitzen, die aus Q problembezogen in durchsichtiger Weise abgeleitet werden. Die Quadratur des Kreises kann nicht gelingen, da man nun weiß, dass die Zahl π transzendet ist, also keine Nullstelle eines Polynoms mit rationalen Koeffizienten sein kann. Das Delische Problem besitzt keine Lösung mit Zirkel und Lineal, denn die Gleichung x3 −2 = 0, die das Problem beschreibt, hat in C die drei Lösungen √ 3 2, √ 3 2(cos( 2π 4π 2π √ 4π 3 ) + i sin ), 2(cos( ) + i sin( )) . 3 3 3 3 Das Problem der Winkeldreiteilung mit Zirkel und Lineal besitzt im allgemeinen keine Lösung. Wir können etwa speziell fragen, ob der Winkel 31 π gedrittel werden kann. Dazu haben wir dann zu zeigen, dass die Gleichung 4x3 − 3x − 12 = 0 keine Lösung in Q besitzt, denn für x := cos θ gilt ja die allgemeine Identität 4x3 − 3x = cos θ . Bemerkung 7.2.3 Wir können aus dem Zwischenwertsatz, den wir aus der Analysis kennen, ablesen, dass jede kubische Gleichung mit Koeffizienten in R eine Lösung in R besitzt. Man hat dabei nur zu beachten, dass für ein kubisches Polynom p limx→∞ p(x) = ∞, limx→−∞ p(x) = −∞ oder limx→∞ p(x) = −∞, limx→−∞ p(x) = ∞ gilt. Betrachte die quartische Gleichung ax4 + bx3 + cx2 + dx + e = 0 (7.14) b vereinfacht zu für a 6= 0. Diese Gleichung wird durch die Substitution y = x + 4a y 4 + py 2 + qy + r = 0, wobei p, q, r gewisse rationale Ausdrücke in a, b, c, d, e sind. Wir schreiben sie um zu (y 2 + p)2 = py 2 − qy + p2 − r – dieser Reduktionsschritt geht wohl auf R. Descartes zurück – und erweitern (y 2 + p + u)2 = (py 2 − qy + p2 − r) + 2u(y 2 + p) + u2 mit beliebigem u ∈ K. Wähle nun u so, dass py 2 − qy + p2 − r + 2u(y 2 + p) + u2 = Ay 2 + By + C ein Quadrat wird; hierbei ist A := p + 2u, B := −q, C := p2 − r + 2up + u2 . Dies gelingt dann, wenn B 2 − 4AC = 0 gilt. Dies ist eine kubische Gleichung für u, die nach dem obigen Verfahren behandelt werden kann. Nach Wahl von u ziehen wir nun die Wurzel und lösen die resultierende quadratische Stand: 9. Februar 2010 87 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.3. DETERMINANTEN UND EIGENWERTE b ergibt Lösungen für die Gleichung Gleichung für y. Einsetzen in die Substitution x = y − 4a (7.14). Eine gemeinsame Beobachtung bei den obigen Vorgehensweisen ist, dass die Lösungen, wenn sie denn existieren – dies ist eine Frage nach dem gewählten Körper – Ausdrücke in den Koeffizienten der Gleichungen sind, die nur die Operationen +, −, ·, ÷, √ m mit m ≤ 2 (quadratische Gleichung) bzw. m ≤ 3 (kubische Gleichung) bzw. m ≤ 4 (quartische Gleichung) verwenden. Allgemein sagt man, daß eine polynominale Gleichung an xn + an−1 xn−1 + · · · + a1 x + a0 = 0 lösbar durch Radikale ist, wenn eine Lösung als rationaler Ausdruck in den Koeffizienten a0 , . . . , an existiert, in der nur die Operationen +, −, ·, ÷, √ m , m ≤ n, verwendet werden.3 Bemerkung 7.2.4 Irrationalität einer Zahl z kann auch so definiert werden: Es gibt kein lineares Polynom mit ganzzahligen Koeffizienten, dessen Nullstelle z ist. Als Verallgemeinerung haben wir die folgende Definition: Eine Zahl z ∈ R heisst algebraisch, wenn es ein Polynom mit ganzzahligen (gleichbedeutend mit rationalen) Koeffizienten gibt, dessen Nullstelle z ist; anderenfalls heis̈t sie transzendet. Es ist nun ganz einfach einzusehen, dass die Menge der algebraischen Zahlen abzählbar ist. Dazu führen wir als Höhe eines Polynoms p(x) := a0 + · · · + an xn die Zahl Np := n − 1 + |a0 | + · · · + |an | ein. Zu jeder natürlichen Zahl N ∈ N gibt es nur endlich viele Polynome p mit Höhen Np ≤ N . Jedes dieser Polynome hat höchstens endlich viele Nullstellen. Damit ist die Aussage klar. Transzendente Zahlen können als besonders irrational“ angesehen werden. Die bekanntesten ” transzendenten Zahlen sind e, π. Der Beweis, dass π irrational ist, ist etwa in [1] enthalten.4 7.3 Determinanten und Eigenwerte Die Bestimmung von Nullstellen eines Polynoms mit Koeffizienten in einem Körper ist von großer Relevanz bei der Untersuchung von Endomorphismen endlichdimensionaler Vektorräume. Stellt man einen solchen Endomorphismus durch eine Matrix A ∈ Kn,n dar, dann hat man die Abbildung A : Kn ∋ x 7−→ Ax ∈ Kn . 3 Nach der Lösung der kubischen und quartischen (Ferrari) Gleichungen durch Radikale — Cardano hat die Ergebnisse gesammelt — , ließen viele erfolglose Versuche, die quintische Gleichung (m = 5) durch Radikale zu lösen, die Vermutung keimen, dass dies prinzipiell unmöglich sein könnte. Viète (1591) bestärkte dies durch die Entdeckung, daß die Frage der Lösbarkeit der quintischen Gleichung durch Radikale äquivalent zur Winkeldreiteilung ist. Der Beweis, dass die Vermutung zutrifft, gelang Abel (1826) und Galois (1831) im Rahmen einer grandiosen Theorie über Körpererweiterungen (Galoistheorie). 4 Der Transzendentbeweis zu e wurde 1873 von C. Hermite, der zu π 1882 von F. Lindemann erbracht. Stand: 9. Februar 2010 88 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.3. DETERMINANTEN UND EIGENWERTE Die Frage, ob diese Abbildung bijektiv ist, d.h., ob das Gleichungssystem Ax = y (7.15) eindeutig lösbar ist, kann mit der Determinante der Matrix A entschieden werden. Verschwindet det(A) nicht, dann liegt in (7.15) eindeutige Lösbarkeit vor. Ein lineares Gleichungssystem der Form (7.15) tritt in vielfältige Anwendungen auf: Ressourcen-Bilanz in der Ökonomie, Diskretisierung bei linearen Differenzialgleichungen, . . . . Definition 7.3.1 Sei A ∈ Kn,n , A = (aij )i=1 (1 )n , j =1 (1 )n . Wir definieren (siehe Abschnitt 8.2) det(A) := X σ∈Sn ε(σ)a1 σ(1) · · · an σ(n) . Die Determinante det(A) ∈ K einer Matrix A ∈ Kn,n ist somit eine Multilinearform auf den Spalten der Matrix A . Das Studium von Endomorphismen hat unter anderem auch das Ziel, Normalformen von solchen Morphismen zu finden, die dann, weil sie einfache Struktur haben, leichter zu analysieren sind. Wir formulieren dies für die darstellenden Matrizen. Hier kommen dann die Normalformen dadurch zustande, dass man im Vektorraum Kn geeignete Basen wählt. Eine allgemeine Normalform ist die Jordansche Normalform. Hier nutzt man die Basis, die durch die (verallgemeinerten) Eigenvektoren erzeugt wird. Weitere Normalformen sind die Schurzerlegung, die die Singulärwertzerlegung, die QR-Zerlegung und die LU-Zerlegung. Definition 7.3.2 Sei A ∈ Kn,n . Ein Skalar λ ∈ K ist ein Eigenwert von A, falls es einen nicht verschwindenden Vektor x ∈ Kn gibt mit Ax = λx . (7.16) x heißt dann Eigenvektor zum Eigenwert λ . Die Existenz von Eigenwerten ist verknüpft mit der polynomialen Gleichung det(A − λE) = 0 (7.17) wobei E ∈ Kn,n die Einheitsmatrix ist. Dass durch K ∋ x 7−→ det(A − λE) ∈ K ein Polynom definiert wird, sieht man mit Definition 7.3.1 leicht ein; dieses Polynom heißt charakteristisches Polynom von A . Was ist gewonnen, wenn Eigenwerte und Eigenvektoren existieren/bestimmt sind? Bilden die Eigenvektoren eine Basis in Kn , dann hat man eine Basis gefunden, die zu einer Normalform führt. Man kann dies daran erkennen, dass eine Matrix auf einem Eigenvektor sehr einfach operiert: Ax = λx , d.h. Ax ist eine Streckung“ von x . ” Die Jordansche Normalform setzt dies in verallgemeinerten Form um. Eine Verallgemeinerung ist nötig, da nicht immer gesichert ist, dass eine Basis von Kn , bestehend aus lauter Eigenvektoren, existiert. Stand: 9. Februar 2010 89 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.4. FUNDAMENTALSATZ DER ALGEBRA Achtung: Die Eigenwerte einer Matrix berechnet man in der Regel nicht als Nullstellen des charakteristischen Polynoms. Es gibt (numerische) Methoden, die effizienter sind. Für viele Anwendungen sind qualitative Aussagen (einfache, nur reelle Eigenwerte, nur positive, nur negative Eigenwerte) und quantitative Aussagen (wie klein, wie groß, wie sensitiv gegenüber änderungen gegenüber Variationen der Einträge in der Matrix) von großer Bedeutung. Hier ist ein Resultat, das sowohl qualitative und quantitative Schlüsse erlaubt. Satz 7.3.3 (Gerschgorin–Kreise) Sei A = (aij )1≤i,j≤n ∈ Cn,n . Ist λ ∈ C ein Eigenwert von A, dann gibt es ein i ∈ {1, . . . , n} mit |λ − aii | ≤ ri := n X j=1,j6=i |aij | . Beweis: Die Eigenwertgleichung lautet mit dem Eigenvektor z zum Eigenwert λ Az = λz , d.h. (λ − aii )zi = n X j=1,j6=i aij zi , 1 ≤ i ≤ n . Sei i derjenige Index, für den |zi | = max |zk | 1≤k≤n gilt. Mit diesem Index i gilt dann die behauptete Abschätzung. Wir setzen zu einer Matrix A = (aij )1≤i,j≤n ∈ Cn,n σ(A) := {λ ∈ C|λ Eigenwert von A} und nennen σ(A) das Spektrum von A . Damit können wir das obige Resultat auch so formulieren: σ(A) ⊂ ∪ni=1 B ri (aii ) , P mit ri := nj=1,j6=i |aij | , i = 1, . . . , n . Damit erklärt sich die Bezeichung Kreise“. ” Die Existenz von Eigenwerten hat nun mit dem zugrundliegenden Körper zu tun. Dies diskutieren wir im folgenden Abschnitt. 7.4 Fundamentalsatz der Algebra Betrachte das Polynom n−1 p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 x n + an x = n X ak xk . (7.18) k=0 Wenn wir alle Nullstellen kennen, dann können wir das Polynom hinschreiben als Produkt der Linearfaktoren: k X m1 mk p(x) = an (x − z1 ) · · · (x − zk ) , ml = n l=1 wobei zi bzw. mi die i-te Nullstelle von p bzw. ihre Mehrfachheit bezeichnet. Stand: 9. Februar 2010 90 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.4. FUNDAMENTALSATZ DER ALGEBRA Die Aussage, dass jedes nicht konstante Polynom mit Koeffizienten in C eine Nullstelle besitzt, wird der Fundamentalsatz der Algebra genannt. Alle bekannten Beweise dieses Satzes5 benützen offen oder versteckt auch das Konzept Stetigkeit“ aus der Analysis. Wir geben einen ” Beweis, der nur wenige über die Analysis der reellen Zahlen hinausgehende Fakten verwendet. Lemma 7.4.1 Ist p ein nichtkonstantes Polynom mit Koeffizienten in C und ist |p(z0 )| = 6 0, dann gibt es zu jedem r > 0 ein z1 ∈ Br (z0 ) mit |p(z1 )| < |p(z0 )|. Beweis: Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 , z ∈ C , und r > 0. Nach einer Multiplikation mit einem Skalar können wir annehmen: p(z0 ) = 1 . Dann haben wir mit w ∈ C p(z0 + w) = 1 + As ws + · · · + An wn , wobei As , . . . , An ∈ C, As 6= 0, und 1 ≤ s gilt. Diese Aussage folgt sofort durch Betrachtung der Differenz p(z0 + w) − p(z0 ) und Aufsammlung der Potenzen von w . Da p nicht konstant ist, ist nach Wahl von s sicher As 6= 0 . Wir wollen nun w ∈ C so wählen, dass z0 + w ∈ Br (z0 ) und |p(z0 + w)| < |p(z0 )| gilt. Mit einem solchen w setzen wir dann z1 := z0 + w und wir sind fertig. π − φ0 und setzen w damit als w := ρeiφ Sei As = rs eiφs mit rs = |As | > 0 . Wir wählen φ := s an; es bleibt noch ρ geeignet zu wählen. Wir haben nun p(z0 + w) = 1 − r s ρs + ρs+1 g(ρ) mit einem Polynom g . Da die Funktionen h : ρ 7−→ ρg(ρ) stetig in 0 mit h(0) = 0 ist, gibt es √ δ ∈ (0, r) mit |ρg(ρ)| < 21 rs für |ρ| ≤ δ . Setze α := min(δ, r, s rs ) . Für jedes ρ mit 0 ≤ ρ ≤ α ist nun 1 |p(z0 + w)| ≤ |1 − rs ρs + ρs ρg(ρ)| ≤ 1 − rs ρs + rs ρs < 1 = |p(z0 )| . 2 Bemerkung 7.4.2 Das obige Lemma 7.4.16 ist im Reellen falsch, wie man sofort an dem Polynom p(x) := x2 + 1 sieht. Dass sie im Komplexen gilt, hängt wesentlich an der Tatsache, dass die Abbildung K ∋ z 7−→ z s ∈ K für K = C stets surjektiv ist, dass dies für K = R aber bei geradem s sicher nicht zutrifft. Satz 7.4.3 Sei p ein nicht konstantes Polynom mit Koeffizienten in C . Dann gibt es ein z0 ∈ C mit p(z0 ) = 0. Beweis: Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 . Wähle R > 0 so, dass f : C\BR ∋ z 7−→ |p(z)| ∈ R monoton wachsend mit |z| ist, d.h. R ≤ |z| ≤ |z1 | =⇒ f (z) ≤ f (z1 ) . Dies ist möglich, da der Term z 7−→ |an z n | den Term z −→ |an−1 z n−1 + · · · + a1 z + a0 | für |z| genügend groß überwiegt. Da die Abbildung q : C ∋ z 7−→ |p(z)| ∈ R 5 6 C.F. Gauß publizierte 1799 den ersten strengen Beweis, später gab er einige weitere Beweise dafür. Dieses Lemma geht auf J.B. d’Alembert (1717 — 1783) zurück. Stand: 9. Februar 2010 91 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.4. FUNDAMENTALSATZ DER ALGEBRA stetig ist — dies bedeutet: lim zn = z̄ =⇒ lim q(zn ) = q(z̄) für alle z̄ ∈ BR — gibt es z0 ∈ BR n n mit q(z0 ) = min q(z) . z∈B R Ist q(z0 ) = |p(z0 )| = 0, d.h. p(z0 ) = 0, sind wir fertig. Zur Aussage q(z0 ) = |p(z0 )| = 6 0 erhalten wir mit Lemma 7.4.1 einen Widerspruch wie folgt: Es gibt z1 ∈ C mit |p(z1 )| < |p(z0 )|. Ist dieses z1 in BR , so haben wir einen Widerspruch zur Wahl von z0 , ist dieses z1 nicht in BR , so haben wir einen Widerspruch zur Monotonie von q in C\BR ; beachte hierzu, dass es ein z2 ∈ B R \BR gibt mit |p(z2 )| ≥ |p(z0 )| . Korollar 7.4.4 Jedes Polynom n–ten Grades p, p(z) = a0 + · · · + an z n , z ∈ C, n ≥ 1, mit Koeffizienten in C besitzt in C genau n Nullstellen und das Polynom zerfällt in Linearfaktoren, d.h. p(z) = an (z − z1 ) · · · · · (z − zn ) , z ∈ C . (7.19) Beweis: Nach Satz 7.4.3 besitzt p eine Nullstelle z1 . Mit Division mit Rest spalten wir den Linearfaktor z 7−→ z − z1 ab – siehe nachfolgendes Lemma 7.4.5 – und erhalten ein Polynom (n − 1)–ten Grades. So fortfahrend erhalten wir das Ergebnis. Lemma 7.4.5 (Division mit Rest) Sei K ein Körper und seien f, g ∈ K[x] mit g 6= θ . Dann existieren q, r ∈ K[x] mit f = qg + r und grad(r) < grad(g) . Beweis: Wir beweisen die Behauptung durch Induktion nach grad(f ) . Dabei sei zunächst grad(f ) < grad(g) . Dann setze q := θ und r := f . Wir können also grad(f ) ≥ grad(g) annehmen. Sei f (x) = a0 + · · · + an xn und g(x) = b0 + · · · + bn xm , wobei n = grad(f ) und m = grad(f ) n−m g(x) . Dann ist h ∈ K[x] und grad(h) < grad(f ) . Nach sei. Setze h(x) := f (x) − an b−1 m x Induktionsvoraussetzung ist h = q1 g + r1 mit grad(r1 ) < grad(g) . Nun ist n−m f (x) = (an b−1 + q1 (x))g(x) + r1 (x) . m x Beispiel 7.4.6 Von Gauss stammt das umfassende Resultat über die Lösbarkeit der Kreisteilungsgleichung xn − 1 = xn−1 + · · · + x + 1 . x−1 Etwa leitet er ab, dass eine Wurzel x1 = cos( 2π 17 ) folgende Darstellung r q q q √ √ √ √ 1√ 1 1 1 x1 = − + 17 + 34 − 2 17 + 17 + 3 17 − 34 − 2 17 − 2 34 + 2 17 16 16 16 8 hat. Damit ist das regelmäßige 17–Eck durch Zirkel und Lineal konstruieren, da ja Quadratwurzeln durch Zirkel und Lineal konstruierbar sind. Ohne Beweis sei noch angemerkt, daß die Konstruktion eines regelmäßigen n−Ecks mit Zirkel und Lineal genau dann möglich ist, wenn die Primfaktorzerlegung von n die Form n = 2m p1 · · · pr k hat, wobei p1 , . . . , pr paarweise verschiedene Primzahlen der Form 22 +1 (Fermatsche Zahlen) sind. Für k = 0, 1, 2, 3, 4 erhält man die Primzahlen 3, 5, 17, 257, 65537.7 7 Diese Erkenntnis verdanken wir C. F. Gauß, der eine erste Entdeckung zu diesem Thema bereits einen Monat vor seinem 18. Geburtstag machte. Stand: 9. Februar 2010 92 c J.Baumeister KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN 7.5 1.) 7.5. ÜBUNGEN Übungen Sei K := F2 . Zeige, dass das Polynom p(x) := x4 + x + 1 über F2 irreduzibel ist. Stand: 9. Februar 2010 93 c J.Baumeister Kapitel 8 Zufall Stochastik beschäftigt sich mit der mathematischen Beschreibung und Analyse zufälliger Vorgänge. Die beiden Hauptgebiete der Stochastik sind Wahrscheinlichkeitstheorie und Statistik. In diesem einführenden Kapitel über den Zufall stellen wir elementare Fragestellungen vor und erläutern sie an Hand von interessanten Problemstellungen. Das Modellierungsinstrument – Modellierung besprechen wir im nächsten Kapitel – Markov–Ketten wird skizziert. 8.1 Laplace–Häufigkeiten Wie reden wir über den Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche Defini” tionsschnipsel“: Zufall ist das Eintreten unvorhergesehener und unbeabsichtigter Ereignisse. Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein). Jemandem fällt etwas (unverdientermaßen) zu. Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip läßt nicht Determiniertes nicht zu. Ein Ausweg ist, dass wir die Umstände (Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig kennen können. Beispiele für das Wirken von Zufall“: ” • Ergebnis beim Münzwurf • Eintreten von Augenzahlen beim Würfeln • Radioaktiver Zerfall • Männlicher oder weiblicher Nachwuchs Die Folge von Zahlen, die wir etwa beim Würfeln (mit einem fairen Würfel) erhalten nennen wir Zufallszahlen; siehe 6. Es drängt sich sofort die Problematik des Tests auf Zufälligkeit auf. Ist 1, 2, 2, 6, 5, 6, 6, 6, 3, 6, 6 Teil einer Folge von Würfelergebnissen? Klar, dass dies sein kann, aber als Basis für eine Simulation des Zufalls ist sie ungeeignet. Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments zu quantifizieren: Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet werden, die uns gestattet, die Unsicherheit über den Ausgang anzugeben: 1 sollte für Sicherheit, 0 für vollständige Unsicherheit 94 KAPITEL 8. ZUFALL 8.1. LAPLACE–HÄUFIGKEITEN stehen. Wir tun dies nun in einer einfachen Situation, nämlich in einer Situation, in der alle Elementarereignisse, was die Unsicherheit über ihr Eintreten betrifft, gleichberechtigt sind. Dazu führen wir die Begriffe Laplace–Experiment und Laplace–Wahrscheinlichkeit ein. Der Begriff der Laplace–Wahrscheinlichkeit hat den Vorteil, dass ihm die Vorstellung eines konstruktiven Vorgehens zugrunde liegt, nämlich die Vorstellung von der rein zufälligen Wahl“. Wir stellen uns ” hierunter vor, dass es gelingt, aus einer endlichen Menge von Elementarereignissen Ω ein Element so auszuwählen, dass jedes Element diesselbe Chance hat, ausgewählt zu werden. Einen Mechanismus, der eine solche Zufallswahl bewerkstelligt, nennen wir einen Laplace–Mechanismus. Ein beliebtes Bild von einem Laplace–Mechanismus ist das Urnenmodell (ein Gefäß, in dem Gegenstände versteckt“ werden, die man dann herausholen kann) eine weitere Vorstellung von ” einem Laplace–Mechanismus ist der Würfelwurf. Definition 8.1.1 Sei Ω eine endliche Menge. Für jede Teilmenge A von Ω ist die Laplace– Wahrscheinlichkeit definiert durch P (A) := #A . #Ω Man nennt P (A) die Wahrscheinlichkeit, dass ein (rein zufällig ausgewähltes) Element ω ∈ Ω in A liegt. Die Abbildung P : P OT (Ω) ∋ A 7−→ P (A) ∈ R heißt (auch) Laplace–Wahrscheinlichkeit. Das Tripel (Ω, P OT (Ω), P ) nennen wir (in Anlehnung an den allgemeinen Fall in der Wahrscheinlichkeitstheorie) einen (Laplace-)Wahrscheinlichkeitsraum Bemerkung 8.1.2 Die Konzepte einer Wahrscheinlichkeitstheorie mit einem unendlichen Ereignisraum Ω wurden abschließend ausformuliert von Kolmogorov1 . Sie passen zu unserem Herangehen für einen endlichen Ereignisraum. Im folgenden lassen wir das Vorwort Laplace“ meist ” weg. Beispiel 8.1.3 Den Münzwurf betrachten wir als Laplace–Mechanismus. Hier ist 1 . 2 Beim Würfelexperiment, betrachtet als Laplace–Mechanismus, haben wir Ω = {K, Z} ; P ({K}) = P ({Z}) = Ω = {1, . . . , 6} ; P ({i}) = 1 , 1 ≤ i ≤ 6. 6 Für das zusammengesetzte“ Ereignis A := {1, 2, 3} errechnen wir P (A) = 21 . ” Beim Würfeln mit zwei Würfeln, betrachtet als Laplace–Experiment, haben wir: Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; P ((i, j)) = 1 , 1 ≤ i, j ≤ 6 . 36 Daraus errechnet sich: 6 = 36 15 P (A) = = 36 Für das zusammengesetzte Ereignis P (A) = 1 für A := {(i, j) ∈ Ω|i + j ≥ 10}, 6 5 für A := {(i, j) ∈ Ω|i > j}. 12 A := {(i, j) ∈ N × N|i = 1 oder (i ≥ 4 und j = 1) oder (i ≥ 4 und j ≥ 4)} ist die Laplace–Wahrscheinlichkeit schon etwas mühsam auszurechnen. Sie ist 1 13 36 . A.N. Kolmogorov, 1903-1987 Stand: 9. Februar 2010 95 c J.Baumeister KAPITEL 8. ZUFALL 8.1. LAPLACE–HÄUFIGKEITEN Es ist nun offensichtlich, dass bei der Berechnung von Laplace–Wahrscheinlichkeiten das Einmaleins der Kombinatorik äußerst hilfreich ist; dazu kommen wir in Abschnitt 8.2. Bemerkung 8.1.4 Beachte, dass ein Laplace–Experiment ein Modell für eine konkrete reale Situation ist. Unsere Definition der Laplace–Wahrscheinlichkeit ist innerhalb dieses Modells gegeben und nicht für die reale Situation. Der Übergang von der Wirklichkeit zum Modell ist in den hier exemplarisch betrachteten Fällen meist naheliegend, in allgemeineren Situationen ( Wie ” wahrscheinlich ist ein Supergau in einem russischen Kernkraftwerk“/ Wie wahrscheinlich ist ” es, dass auf einem Stern der Milchstraße Leben existiert“) ist dieser sicher sehr viel schwieriger zu vollziehen. In der Bemerkung 8.1.4 haben wir den Begriff Modell erwähnt. Nehmen wir hier die Gelegenheit wahr, den Begriff schon mal zu beleuchten, genauer gehen wir darauf in Kapitel 9 ein. . . . Deshalb vertrete ich die Auffassung, die man als schlicht oder naiv bezeichnet hat, daß eine physikalische Theorie nur ein mathematisches Modell ist, mit dessen Hilfe wir die Ergebnisse unserer Beobachtungen beschreiben. Eine Theorie ist eine gute Theorie, wenn sie ein elegantes Modell ist, wenn sie eine umfassende Klasse von Beobachtungen beschreibt und wenn sie die Ergebnisse weiterer Beobachtungen vorhersagt. Darüber hinaus hat es keinen Sinn zu fragen, ob sie mit der Wirklichkeit übereinstimmt, weil wir nicht wissen, welche Wirklichkeit gemeint ist. . . . Es hat keinen Zweck, sich auf die Wirklichkeit zu berufen, weil wir kein modellunabhängiges Konzept der Wirklichkeit besitzen.2 Legen wir uns nun einige einfache Aussagen zurecht. Korollar 8.1.5 Sei Ω eine endliche Menge. Wir haben zur Laplace–Wahrscheinlichkeit P : P OT (Ω) ∋ A 7−→ #A ∈R #Ω die folgenden Aussagen: (a) P (A) ∈ [0, 1] ∩ Q für alle A ⊂ Ω. (b) P ({x}) = 1 für alle x ∈ Ω. #Ω (c) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) für alle A, B ∈ P OT (Ω). (d) P (Ω\A) = 1 − P (A) für alle A ⊂ Ω. (e) P (∅) = 0. Beweis: (a) und (b) sind trivial. Die Aussage (c) ist einfach einzusehen. Damit sind nun auch (d) und (e) klar. In einer Urne liegen drei schwarze Kugeln und eine weisse Kugel. Auf gut Glück werden zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer, zwei schwarze Kugeln oder eine weisse und eine schwarze Kugel herauszunehmen? Man ist auf Grund der Tatsache, dass dreimal soviele schwarze wie weisse Kugeln in der Urne liegen zu vermuten, dass die erste Möglichkeit wahrscheinlicher ist. Dem ist aber nicht so, denn es gibt drei Möglichkeiten, zwei 2 Aus: St. W. Hawkin, Einsteins Traum, Rowohlt, 1993 Stand: 9. Februar 2010 96 c J.Baumeister KAPITEL 8. ZUFALL 8.1. LAPLACE–HÄUFIGKEITEN schwarze Kugeln herauszunehmen und drei Möglichkeiten eine schwarze und eine weisse Kugel herauszunehmen. Es läßt sich das auch rechnerisch begründen: Wahrscheinlichkeit für das Ziehen zweier schwarzer Kugeln = 34 · 23 = 12 ; Wahrscheinlichkeit für das Ziehen einer weissen und einer schwarzer Kugel = 14 · 1 + 34 · 13 = 21 . Betrachten wir ein Würfelexperiment und nennen wir es das Augensummenparadoxon. G.W. Leibniz hat sich bei der Analyse dieses Experimentes einen kleinen Schnitzer erlaubt: Es sei ihm unbegreiflich, wie ihm erfahrene Würfelspieler versicherten, warum bei zwei Würfeln die ” Augensumme 9 wahrscheinlicher sei als die Augensumme 10, aber bei drei Würfeln die Augensumme 10 wahrscheinlicher als die Augensumme 9. Denn schließlich könne die Summe 9 wie die Summe 10 in beiden Fällen auf gleich viele Arten anfallen, also müßten die Augensummen in beiden Fällen gleich wahrscheinlich sein.“. Wir betrachten das Würfeln mit zwei Würfeln als Laplace–Experiment. Wir unterstellen damit, dass die Würfel unterscheidbar sind und es einen ersten und einen zweiten Würfel gibt. Wir haben Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6}, und interessieren uns also für die Laplace–Wahrscheinlichkeiten der Ereignisse A9 := {(i, j) ∈ Ω|i + j = 9} , A10 := {(i, j) ∈ Ω|i + j = 10} . Wir haben dazu A9 , A10 abzuzählen. Es gilt A9 = {(3, 6), (6, 3), (4, 5), (5, 4)} , A10 = {(4, 6), (6, 4), (5, 5)} . und daher 1 3 1 4 = , P (A10 ) = = 36 9 36 12 Bei drei Würfeln zeigt eine einfache Aufzählung (bei entsprechender Bezeichnung) P (A9 ) = P (A9 ) = 19 24 , P (A10 ) = . 216 216 Leibniz hat übersehen, dass die Reihenfolge der Summanden hier wichtig ist. Modelliert man das Experiment mit zwei ununterscheidbaren Würfeln, dann hat man statt 36 Möglichkeiten nur noch 21 mögliche Ausgänge, aber kein Laplace–Experiment mehr, da etwa die Ausgänge 1–1 und 1–2 verschiedene Wahrscheinlichkeiten haben. Der Fehler, der hier Leibniz unterlaufen ist, ist Basis für einen Jahrmarkttrick, der nach J. Bertrand Bertrandsches Schachtelparadoxon genannt wird: Drei nicht unterscheidbare Schachteln enthalten zwei Goldmünzen (1. Schachtel), zwei Silbermünzen (2. Schachtel) und eine je eine Gold- und eine Silbermünze (3. Schachtel). Jetzt entnimmt man einer Schachtel eine Münze. Der Veranstalter des Spiels bietet nun eine Wette an: Die zweite Münze in der Schachtel ist aus demselben Metall! Man ist versucht, zu vermuten, dass die Wette fair ist, da man geneigt ist, zu vermuten, dass die Beschaffenheit der zweiten Münze gleichwahrscheinlich ist. Dies ist nicht der Fall. Analysieren wir die Situation, dass G(old) gezogen wurde. Wir vermuten richtig, dass nicht aus der Schachtel mit den zwei Silbermünzen gezogen wurde und schließen daraus irrig, dass mit Wahrscheinlichkeit 21 beide Münzen in der Schachtel, aus der gezogen wurde, aus Gold sind. In Wahrheit sind mit einer Wahrscheinlichkeit von 32 beide Münzen aus Gold, weil in zwei von 3 Fällen die beiden Stand: 9. Februar 2010 97 c J.Baumeister KAPITEL 8. ZUFALL 8.1. LAPLACE–HÄUFIGKEITEN Münzen in der Schachtel aus Gold sind; später kommen wir darauf zurück.. Betrachten wir nun das Geburtstags–Pardoxon. Für eine Gruppe von n Personen ist die Wahrscheinlichkeit“ zu ermitteln, dass mindestens ein Paar unter diesen Personen existiert, das ” am gleichen Jahrestag Geburtstag hat. Wir nehmen an: • Das Jahr wird mit 365 Tagen angesetzt, wir sehen also vom Auftreten von Schaltjahren ab. • Geburtstage sind über die Jahrestage gleichverteilt. Damit liegt ein Laplace–Experiment vor und jede Person hat mit einem bestimmten Jahrestag Geburtstag. Wir setzen 1 365 Wahrscheinlichkeit an Ω := {(ω1 , . . . , ωn ) ∈ Nn |1 ≤ ωi ≤ 365, 1 ≤ i ≤ n}. Das zu betrachtende Ereignis ist A := {(ω1 , . . . , ωn ) ∈ Ω|ωi = ωj für mindestens ein Paar (i, j), i 6= j} und die gesuchte Wahrscheinlichkeit ist Pn∗ := #A 365n Betrachten wir zunächst einige Spezialfälle. n ≥ 365 n=2 Pn∗ = 1 . Die erste Person hat freie Auswahl, für die zweite Person ist die Wahrscheinlichkeit, am gleichen Tag wie die erste Person Geburtstag zu ha1 . Also ben, 365 1 Pn∗ = 365 n=3 Die erste Person hat freie Auswahl, die zweite Person hat einen ver364 schiedenen Geburtstag mit Wahrscheinlichkeit 365 , die dritte Person wiederum einen von den beiden Tagen verschiedenen Geburtstag mit Wahrscheinlichkeit 363 365 . Also gilt Pn∗ = 1 − 365 364 363 · · ≈ 0, 009 365 365 365 Am Beispiel n = 3 sehen wir zweierlei. Erstens wird das günstige Vorgehen deutlich: Statt Pn∗ haben wir zunächst die Wahrscheinlichkeit ausgerechnet, dass das Ereignis nicht eintritt. Zweitens sehen wir einen multiplikativen Ansatz für zusammengesetzte Ereignisse. Wir kommen darauf zurück. Allgemein erhalten wir 365! Pn∗ = 1 − (365 − n)!365n und damit die ergebnisse aus Tabelle Stand: 9. Februar 2010 98 c J.Baumeister KAPITEL 8. ZUFALL 8.2. KOMBINATORISCHE ÜBERLEGUNGEN Wir sehen also, dass bei einer Gruppengrößen von 23 Personen die Wahrn 20 22 23 30 40 50 scheinlichkeit, dass darunter ein Paar Pn∗ 0,411 0,476 0,507 0,706 0,891 0,970 mit gleichem Geburtstag ist, bereits größer als 21 ist. Abbildung 8.1: Zum Geburtstagsproblem Die Annahme über das Schaltjahr beeinflußt die obigen Ergebnisse nur unwesentlich, etwa bleibt es bei der Aussage bezüglich der Gruppengröße n = 23. Die Annahme über die Gleichverteilung der Geburtstage ist auch kein Einwand zur Qualität der obigen Ergebnisse, denn die Wahrscheinlichkeiten werden eher größer; man mache sich dies etwa daran klar, dass alle Personen an einem bestimmten Tag Geburtstag haben. Die Überraschung mit dem Ergebnis ist: ein Ereignis, dessen Eintreten für uns als Individuum höchst unwahrscheinlich ist, ist für eine Gruppe bei weitem nicht mehr unwahrscheinlich. Der Grund ist der, dass wir nicht auf einen bestimmten Geburtstagszwilling“ warten, sondern auf ” irgendeinen. 8.2 Kombinatorische Überlegungen Sei M eine Menge mit n Elementen. Wir wollen für den Sachverhalt Wähle Elemente von M unter den Gesichtspunkten Anzahl und/oder Reihenfolge“ ” aus die damit verbundenen Anzahlprobleme – auf wieviele Arten ist dies möglich? – studieren. Definition 8.2.1 Eine r–Permutation (ohne Wiederholung) der Elemente einer n–elementigen Menge M ist eine injektive Abbildung von {1, . . . , r} nach M. Ist r = n, so sprechen wir kurz von einer Permutation. Sei M = {x1 , . . . , xn } mit #M = n. Aus der Definition 8.2.1 folgt sofort, dass r ≤ #M sein muss, wenn es r−Permutationen geben soll, weil das Bild von {1, . . . , r} unter einer injektiven Abbildung sicher r Elemente besitzt. Ist σ eine r–Permutation, so entspricht dieser Abbildung σ das geordnete Tupel (xσ(1) , . . . , xσ(r) ) . Umgekehrt, hat man eine Menge B := {xi1 , . . . , xir } mit #B = r, so gehört dazu die r– Permutation σ : {1, . . . , r} ∋ j 7−→ xij ∈ M . Damit ist wohl klar, dass die Definition 8.2.1 unserer Anschauung von der Auswahl von r Elementen unter Berücksichtigung der Reihenfolge entspricht. Satz 8.2.2 Sei M eine Menge mit n Elementen. Die Anzahl P (n, r) der r–Permutationen ist P (n, r) = n(n − 1) · · · (n − r + 1) = n! , 0 ≤ r ≤ n. (n − r)! Beweis: Sei M := {x1 , . . . , xn } . Wie können wir eine r–Permutation σ hinschreiben? Für das Bild σ(1) stehen n Elemente zur Verfügung. Sind die Bilder σ(1), . . . , σ(r − 1) festgelegt, so stehen für σ(r) wegen der geforderten Injektivität nur die Elemente in M \{xσ(1) , . . . , xσ(r−1) } zur Verfügung, also n − (r − 1) Elemente. Dies bedeutet nun: P (n, 1) = n ; P (n, r) = P (n, r − 1) · (n − r + 1) . Daraus folgt durch sukzessives Ausmultiplizieren oder induktiv P (n, r) = n(n − 1) · · · (n − r + 1) . Stand: 9. Februar 2010 99 c J.Baumeister KAPITEL 8. ZUFALL 8.2. KOMBINATORISCHE ÜBERLEGUNGEN Das schnelle Anwachsen der Ziffernstellen bei den Fakultäten3 ist Grund für die große Komplexität für Aufgaben, bei denen etwa eine große Anzahl von Objekten nach einem bestimmten Merkmal in eine Ordnung gebracht werden sollen; siehe Abschnitt 3.3. Im Spezialfall M = {1, . . . , n} kennen wir schon folgende Bezeichnung: Sn := {σ : M −→ M |σ Permutation} Eine Permutation σ ∈ Sn können wir dann schlicht durch die Abfolge (σ(1) . . . σ(n)) hinschreiben. Etwa bedeutet σ = (231) ∈ S3 , dass σ(1) = 2, σ(2) = 3, σ(3) = 1 gilt. Beispiel 8.2.3 Man bestimme die Anzahl m der vierziffrigen Zahlen, deren Ziffern alle verschieden sind; 0 darf als erste Ziffer nicht vorkommen. Für die erste Ziffer gibt es 9 Möglichkeiten: 1, 2, . . . , 9 . Für die Besetzung der verbleibenden drei Ziffern gibt es dann jeweils noch P (9, 3) Möglichkeiten. Also m = 9 · P (9, 3) = 4536 . Für das eben diskutierte Objekt Permutation“ gibt es die Interpretation durch ein Urnenex” periment: In einer Urne befinden sich n Objekte, nämlich die n Elemente von M . Man nimmt der Reihe nach jeweils ein Element aus der Urne, ohne es wieder zurückzulegen. Dann bilden r gezogene Elemente in der Reihenfolge, in der sie gezogen wurden, eine r−Permutation der Menge M . Eine duale Interpretation als Schachtelexperiment ist: Jedem Element von M entspricht eine Schachtel; wir haben also n Schachteln. Es werden nun der Reihenfolge nach r Objekte auf die n Schachteln verteilt und zwar so, dass eine Schachtel höchstens ein Objekt enthält. Definition 8.2.4 Eine r−Permutation mit Wiederholung einer Menge M ist eine Abbildung τ : {1, . . . , r} −→ M. Die Anzahl W (n, r) der r−Permutationen mit Wiederholungen ist W (n, r) = nr . Der Beweis dafür ist leicht zu erbringen. Die Interpretation der r−Permutationen mit Wiederholung als Urnenexperiment ist folgende: Man nimmt der Reihe nach — die Reihenfolge spielt daher eine Rolle – jeweils ein Element aus der Urne, insgesamt r Elemente, legt sie aber jeweils nach dem Ziehen wieder in die Urne zurück. Die duale Interpretation als Schachtelexperiment ist die Verteilung von r Objekten auf n Schachteln, wobei jede Schachtel beliebig viele Elemente aufnehmen kann. Bisher haben wir Auswahlen betrachtet, so dass die Reihenfolge der Elemente von Relevanz war und verschiedene Reihenfolgen verschieden zu zählen waren. Wenn wir nun keine Rücksicht auf die Anordnung nehmen, kommen wir zum Begriff der Kombination (der Elemente). Definition 8.2.5 Eine r–Kombination von M ist die Auswahl einer Teilmenge von M, bestehend aus r Elementen. 3 G.W. Leibniz liebte es, zahlenmäßige Zusammenhänge in Form von Tabellen und Tafeln darzustellen. Beispielsweise fügte er seiner Arbeit Dissertatio de Arte Combinatoria“aus dem Jahre 1666, in der mit seinem Titel ” auch die Bezeichnung Kombinatorik vorprägte, eine Tabelle der Fakultäten 1! bis 24! = 620448401733239439360000 an. Stand: 9. Februar 2010 100 c J.Baumeister KAPITEL 8. ZUFALL 8.2. KOMBINATORISCHE ÜBERLEGUNGEN Die Anzahl C(n, r) der r–Kombinationen einer Menge M mit n Elementen ist C(n, r) = n! . r!(n − r)! Die Interpretation als Urnenexperiment kann man etwa so sehen: Man ziehe r Elemente ohne Zurücklegen und vergesse die Reihenfolge der gezogenen Elemente. Die Interpretation als Schachtelexperiment ist so: Man verteile r Objekte auf n Schachteln, so dass in jeder Schachtel höchstens ein Objekt liegt. Einordnungen heißen äquivalent (oder werden nicht unterschieden), wenn sie durch eine Permutation der Objekte ineinander übergeführt werden können. Wir nennen n n! (n, r ∈ N, r ≤ n) := r!(n − r)! r Binominalkoeffizienten. n r kann interpretiert werden als die Anzahl der binären Wörter mit r Einsen und n − r Nullen. Aus dieser Interpretation oder aus der Definition folgt sofort n n n n n n = =1, = =n, = (8.1) 0 n 1 n−1 r n−r Sortiert man die Teilmengen der n–elementigen Menge M nach der Anzahl ihrer Elemente, so liefert die Summenregel n n n + + ··· + = 2n , (8.2) 0 1 n 1 1 1 1 1 1 3 4 5 1 2 1 3 6 10 1 4 10 1 5 1 da links und rechts der Identität die Anzahl ... ... ... aller Teilmengen von M steht. Sortieren wir die nr Wörter der Länge n mit r Einsen und n − r Nullen nach der 1. Ziffer: Abbildung 8.2: Pascalsches Dreieck n−1 Mit 1 beginnen r−1 Wörter der Länge n, mit 0 beginnen n−1 n−Wörter. Also r n n−1 n−1 = + . (8.3) r r−1 r n n Zusammen mit der Randbedingung“ = = 1, stellt man dies im Pascalschen Dreieck 4 0 n ” dar. Die Bezeichnung von nr als Binomialkoeffizient hängt zusammen mit dem folgenden Satz. Satz 8.2.6 (Binomialformel) Für a, b ∈ R und n ∈ N gilt: n (a + b) = n X n j=0 j aj bn−j . Beweis: Die Multiplikation der n Faktoren (a + b), . . . , (a + b) kann so erfolgen, dass man für jedes j, 0 ≤ j ≤ n, aus j Klammern a und aus n − j Klammern b auswählt; dies kann auf n j Arten n j n−j geschehen. Daher ist der Koeffizient von a b im ausgerechneten Produkt j . Der Beweis mittels vollständiger Induktion sieht so aus: n = 1 : Klar. 4 Diese Anordnung der Binomialkoeffizienten findet sich wohl erstmals bei B. Pascal. Stand: 9. Februar 2010 101 c J.Baumeister KAPITEL 8. ZUFALL n+1 : 8.3. BEDINGTE WAHRSCHEINLICHKEITEN (a + b)n+1 = (a + b)(a + b)n = (a + b) = n X n j=0 = = = = j n X n j=0 aj+1 bn−j + n X n j=0 j j aj bn−j aj bn−j+1 n X n j n−j+1 n k n−(k−1) ab a b + j k−1 j=0 k=1 n n n+1 X n n n n+1 k n+1−k b + + a b + a 0 k−1 k n k=1 n n + 1 n+1 X n + 1 k n+1−k n + 1 n+1 b + a b + a 0 k n+1 k=1 n+1 X n + 1 ak bn+1−k k n+1 X k=0 Beispiel 8.2.7 Beim Bridge–Spiel erhält ein Spieler 13 Karten aus einem Spiel aus 52 Karten. 12 Kartenzusammenstellungen möglich. Die Chance“ eine ≈ 10 Für einen Spieler sind also 52 13 ” ganz bestimmte Hand“ zu erhalten, ist für einen Spieler also etwa 1 : 1012 . ” Beispiel 8.2.8 Beim Lotto wird bei einer Ziehung aus der Menge {1, . . . , 49} eine 6–elementige Teilmenge ausgewählt. Daher ist die Anzahl der möglichen Ziehungen 49 = 13983816 . 6 8.3 Bedingte Wahrscheinlichkeiten Häufig steht, bevor der Ausgang eines Zufalls–Experiments bekannt ist, schon die Information zur Verfügung, dass der Ausgang zu einer bestimmten (möglicherweise eingeforderten) Teilmenge des Ereignisraumes gehört. Was läßt sich dann über Wahrscheinlichkeiten sagen? Diese Fragestellung wollen wir nun untersuchen. Zur Motivation des folgenden greifen wir auf den Begriff der relativen Häufigkeiten zurück. Sei V ein Zufallsexperiment mit zugehörigem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ). Seien A, B Ereignisse in (Ω, P ). Der Versuch V werde nun n–mal (unabhängig) wiederholt. Die relativen Häufigkeiten von A unter der Bedingung B sind dann definiert durch hn (A|B) := n#{ Es tritt A ∩ B ein } hn (A ∩ B) #{ Es tritt A ∩ B ein } = = , n ∈ N. #{ Es tritt B ein } n#{ Es tritt B ein } hn (B) Dabei haben wir hn (B) > 0, n ∈ N, unterstellt. Analog zu dieser Formel kommen wir nun zu einer entsprechenden Begriffsbildung im Wahrscheinlichkeitsraum (Ω, P ) . Definition 8.3.1 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A, B ⊂ Ω mit P (B) > 0. Dann heißt P (A ∩ B) P (A|B) := P (B) die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B. Stand: 9. Februar 2010 102 c J.Baumeister KAPITEL 8. ZUFALL 8.3. BEDINGTE WAHRSCHEINLICHKEITEN Korollar 8.3.2 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Sei B ⊂ Ω mit P (B) > 0. Dann ist (Ω, P OT (Ω), PB ) mit PB (A) := P (A|B) , A ⊂ Ω, ein endlicher Wahrscheinlichkeitsraum. Beweis: Verifiziert man unmittelbar. Satz 8.3.3 (Satz von der totalen Wahrscheinlichkeit) Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien B1 , . . . , Bk ⊂ Ω mit Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k . Dann ist P (A) = k X i=1 P (Bi )P (A|Bi ) , A ⊂ Ω . (8.4) Beweis: Ergibt sich aus der Additivität von P und der Tatsache, dass A disjunkte Vereinigung von A ∩ B1 , . . . , A ∩ Bk ist. Satz 8.3.4 (Satz von Bayes ) Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien B1 , . . . , Bk ⊂ Ω mit Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k . Ist P (A) > 0, so gilt für j = 1, . . . , k : k X P (Bi )P (A|Bi ))−1 P (Bj |A) = P (Bj )P (A|Bj )( (8.5) i=1 Beweis: Folgt aus Satz 8.3.3 zusammen mit P (Bj ∩ A) = P (Bj )P (A|Bj ), 1 ≤ j ≤ k . In beiden Fällen ist man mit der Forderung nicht verschwindender Wahrscheinlichkeiten (P (Bi ) > 0, 1 ≤ i ≤ n) konfrontiert. In der Formel in (a) kann man dies aber überspielen, da das Nennerproblem nun in der Definition bedingter Wahrscheinlichkeit angelegt ist. Aus der bedingten Wahrscheinlichkeit leitet sich der Begriff der Unabhängigkeit ab, der für die Bewertung von Beobachtungen von Zufallsexperimenten von überragender Bedeutung ist. Wir lassen uns dabei davon leiten, dass in einem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) zwei Ereignisse A, B (nach Wahrscheinlichkeit) als unabhängig voneinander zu betrachten sind, wenn P (A) mit der bedingten Wahrscheinlichkeit P (A|B) übereinstimmt. Dass P (A|B) nur für P (B) > 0 erklärt ist, hat dabei keinen Einfluss mehr. Definition 8.3.5 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Zwei Ereignisse A, B ⊂ Ω heißen unabhängig, wenn P (A ∩ B) = P (A)P (B) gilt. Unabhängigkeit ist ein in A, B symmetrischer Begriff. Sind A, B ⊂ Ω unabhängig, dann sind es auch A, Ω\B und Ω\A, B und Ω\A, Ω\B. Die Verallgemeinerung der Unabhängigkeit auf mehr als zwei Ereignisse liegt auf der Hand. Stand: 9. Februar 2010 103 c J.Baumeister KAPITEL 8. ZUFALL 8.4. DAS ZIEGENPROBLEM Definition 8.3.6 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A1 , . . . , Ak Ereignisse. Diese Ereignisse heißen unabhängig, wenn für jede Wahl 1 ≤ i1 < · · · < il ≤ k gilt: P (Ai1 ∩ · · · ∩ Ail ) = P (Ail ) · · · P (Ail ). Beispiel 8.3.7 Betrachte im Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) mit Ω = {ω1 , ω2 , ω3 , ω4 }, P ({ωi }) = 1 , i = 1, . . . , 4, 4 die Ereignisse A = {ω1 , ω2 }, B = {ω2 , ω3 }, C = {ω1 , ω3 }. Wir haben P (A ∩ B) = P (A)P (B) , P (A ∩ C) = P (A)P (C) , P (B ∩ C) = P (B)P (C), aber 1 P (A ∩ B ∩ C) = 0, P (A) · P (B) · P (C) = . 8 Dieses Beispiel beleuchtet die Definition 8.3.6. 8.4 Das Ziegenproblem Betrachten wir nun das sogenannte Ziegenproblem.5 In einer Spielshow wird ein Kandidat vom Moderator vor drei geschlossene Türen geführt. Hinter diesen Türen sind ein Auto (Preis) und jeweils eine Ziege (Niete) versteckt. Der Kandidat darf nun eine Tür bestimmen, die geöffnet werden soll. Um die Spannung zu erhöhen, öffnet der Moderator aber vor der Öffnung dieser Tür — zufällig, aber mit der Vorgabe, dass dahinter kein Auto ist — eine andere Tür; hinter dieser Tür ist eine Ziege. Nun erlaubt der Moderator dem Kandidaten seine ursprügliche Wahl zu überdenken und gegebenenfalls seine Entscheidung zu ändern. Wie soll er sich entscheiden? Gibt es aus stochastischer Sicht berechtigte Gründe, die Tür zu wechseln? Ja, er soll wechseln! Dies wollen wir mit bedingten Wahrscheinlichkeiten erklären. Bevor wir dies tun, spielen wir die Situation mit 100 Türen, einem Auto und 99 Ziegen durch; sie vermeidet die 1 haben wir die Tür mit dem Auto 1 : 1 : 1 Situation bei drei Türen. Mit Wahrscheinlichkeit 100 99 gewählt und mit Wahrscheinlichkeit 100 ist das Auto hinter den verbleibenden Türen. Jetzt öffnet der Moderator 98 der verbleibenden Türen, hinter jeder eine Ziege. Natürlich würde jeder 99 wechseln, denn mit Wahrscheinlichkeit 100 ist das Auto hinter der noch verschlossenen Tür. Bevor wir ein mathematisches Modell betrachten, noch eine andere Argumentation, die den Wechsel stützen kann. Der Standhafte gewinnt das Auto genau dann, wenn sich dieses hinter der ursprünglich gewählten Tür befindet; die Wahrscheinlichkeit dafür ist 13 . Ein Wechselnder gewinnt das Auto genau dann, wenn er zuerst auf eine der beiden Ziegentüren zeigt – die Wahrscheinlichkeit dafür ist 32 –. denn nach dem Öffnen der anderen Ziegentür durch den Moderator führt die Wechselstrategie in diesem Fall automatisch zur Autotür. Hier geben wir nun eine Erklärung für den Ratschlag Wechseln“ unter Nutzung elementarer ” Wahrscheinlichkeiten. 5 G.v. Randow: Das Ziegenproblem, Reinbek, 1992, und I. Stewart: Mathematische Unterhaltungen, Spektrum 11/91, 12 – 16 . Dieses Problem hat beträchtlichen Wirbel verursacht, da selbst “gestandene“ Mathematiker falsche Schlüsse zogen. Das Problem ist auch als Monty-Hall-Dilemma“ bekannt (nach dem Moderator der US” amerikanischen Spielshow Let’s make a deal. Stand: 9. Februar 2010 104 c J.Baumeister KAPITEL 8. ZUFALL 8.4. DAS ZIEGENPROBLEM Wir nehmen an, dass das Auto hinter Tür 1 steht. Wir können dies tun ohne Beschränkung der Allgemeinheit: es ist ja nur ein Nummerierungsproblem. Der Kandidat hat drei Möglichkeiten der Wahl, die er zufällig trifft, denn er hat ja keine zusätzliche Information. Der Moderator trifft seine Wahl der Tür ebenfalls zufällig, sofern ihm auf Grund seiner Informationslage eine Wahl bleibt. Dies führt zu folgender Tabelle für die Wahrscheinlichkeit der 4 möglichen Ereignisse vor der Wechselmöglichkeit: Wahl des Kandidaten Tür 1 Tür 1 Tür 2 Tür 3 Wahl des Moderators Tür 2 Tür 3 Tür 3 Tür 2 p (Wahrscheinlichkeit) 1 1 1 6 = 3 · 2 1 1 1 6 = 3 · 2 1 1 3 = 3 ·1 1 1 3 = 3 ·1 Die folgende Tabelle listet nun die Gewinn/Verlust–Wahrscheinlichkeiten auf: Wahl/Kandidat Tür 1 Ohne Wechsel Wahl/Moderator Wahl/Kandidat Tür 2 Tür 1 Gewinn JA Tür 1 Tür 3 Tür 1 JA Tür 2 Tür 3 Tür 2 NEIN Tür 3 Tür 2 Tür 3 NEIN Wahl/Kandidat Tür 1 Mit Wechsel Wahl/Moderator Wahl/Kandidat Tür 2 Tür 3 Gewinn NEIN Tür 1 Tür 3 Tür 2 NEIN Tür 2 Tür 3 Tür 1 JA Tür 3 Tür 2 Tür 1 JA p 1 6 1 6 1 3 1 3 p 1 6 1 6 1 3 1 3 Es ist nun klar, dass der Wechsel zu einer Gewinnwahrscheinlichkeit von 2/3 führt, während kein Wechsel nur eine Gewinnwahrscheinlichkeit von 1/3 realisiert. Nun zu einer Darstellung des Dreitüren–Problems, die mit bedingten Wahrscheinlichkeiten arbeitet. O.E. öffne der Kandidat die erste Tür. Sei Ω := {(azz, 2), (azz, 3), (zaz, 3), (zza, 2)}. Hierbei steht etwa (azz, 2) für: Auto hinter der 1. Tür, Ziegen hinter Tür 2 und Tür 3; 2 bezeichnet die Türwahl des Moderators. Setze A1 := {(azz, 2), (azz, 3)}, A2 := {(zaz, 3)}, A3 := {(zza, 2)}. Wir haben als Wahrscheinlichkeiten P (A1 ) = P (A2 ) = P (A3 ) = und ferner P ({(azz, 2)}) = Stand: 9. Februar 2010 1 , 3 1 1 , P ({(azz, 3)}) = . 6 6 105 c J.Baumeister KAPITEL 8. ZUFALL 8.5. MARKOV–KETTEN Wir analysieren etwa den Fall, dass der Moderator Tür 3 öffnet. Setze B := {(azz, 3), (zaz, 3)}. Wir haben dann P (B) = 21 und P (A1 ∩ B) = 16 , P (A2 ∩ B) = 31 , P (A3 ∩ B) = 0. Also P (B|A1 ) = 1 2 , P (B|A2 ) = 1, P (B|A3 ) = 0. Damit erhalten wir: P (A1 |B) = 1 P (A1 )P (B|A1 ) = , P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) 3 P (A2 |B) = P (A2 )P (B|A2 ) 2 = P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 ) 3 Nun liegt der Beleg für den Ratschlag Wechsel“ vor ! ” 8.5 Markov–Ketten Gegeben sei ein System, welches unterschiedliche Zustände annehmen kann. Zu sukzessiven diskreten Zeitpunkten ändert das System auf zufällige Weise seinen Zustand. Der zeitliche Ablauf der Systemzustände ist dann eine Folge von Zuständen. Will man Aussagen über alle möglichen Zustandfolgen herleiten, so muß man Annahmen über die Wahrscheinlichkeiten von Zustandsänderungen machen.6 Definition 8.5.1 Eine Markov–Kette ist ein (stochastischer) Prozess, der die zeitliche Entwicklung eines Systems unter den folgenden Bedingungen beschreibt: (1) Endlichkeit: das System nimmt nur eine endliche Anzahl n von Zuständen an; (2) diskrete Zeit: das System ändert seinen Zustand nur in diskreten Zeitabständen; (3) Gedächtnislosigkeit: die Wahrscheinlichkeit pij des Übergangs vom i-ten zum j-ten Zustand innerhalb eines Zeitschrittes ist unabhängig davon, im wie vielten Schritt das System gerade betrachtet wird. Die Übergangsmatrix eines Markovprozesses mit k Zuständen ist die k × k-Matrix P, deren Einträge gerade die Übergangswahrscheinlichkeiten pij sind. Bemerkung 8.5.2 Wir vermeiden hier den Begriff der Zufallsvariablen, der in der Wahrscheinlichkeitstheorie von überrragender Bedeutung ist. Dies ist möglich, weil wir einen sehr naiven Wahrscheinlichkeitsbegriff zugrundelegen und nur sehr einfache Zufallsexperimente“ be” trachten. Die Einträge in einer Übergangsmatrix P einer Markov–Kette können nicht beliebige Zahlen sein: falls sich der Prozess zum Zeitpunkt n im Zustand xi befindet, muß er sich mit Wahrscheinlichkeit 1 zum Zeitpunkt n + 1 in irgendeinem Zustand befinden. Diese Wahrscheinlichkeit ist gleich pi1 + · · · + pik und wir erhalten die Bedingung 0 ≤ pij ≤ 1, i, j = 1, . . . , k , k X pij = 1 für alle i = 1, . . . , k . j=1 Eine Matrix P, die diese Eigenschaft hat, nennen wir zeilenstochastisch. 6 A.A. Markov, 1856-1922 Stand: 9. Februar 2010 106 c J.Baumeister KAPITEL 8. ZUFALL 8.5. MARKOV–KETTEN Eine Markovsche Kette stellt man graphisch häufig dadurch dar, dass man die verschiedenen Zustände als Punkte in der Ebene markiert und dann jeweils vom i-ten zum j-ten Punkt einen mit der Übergangswahrscheinlichkeit pji beschrifteten Pfeil einzeichnet. Das so entstehende Schaubild heißt Graph der betrachteten Markovschen Kette; beachte Schleifen sind zuzulassen. Beispiel 8.5.3 Betrachte die Matrix P := (pij )1≤i,j≤3 q p 0 := q 0 p q p 0 Der Eintrag p23 = p etwa bedeutet, dass der Zustand 2 mit Wahrscheinlichkeit p in den Zustand 3 übergeht. Damit hier eine Übergangsmatrix vorliegt, benötigen wir q + p = 1 . Beispiel 8.5.4 Das Wetter in einer bestimmten Gegend werde jeweils durch einen der zwei Zustände R (regnerisch) und T (trocken) charakterisiert; der Übergang von einem Tag auf den nächsten sei durch folgende Tabelle bestimmt, aus dem dann die Übergangsmatrix P abgeleitet wird: ! R T 0.662 0.338 R 0.662 0.338 P := 0.250 0.750 T 0.250 0.750 Beispiel 8.5.5 Wir betrachten die Irrfahrt eines Betrunkenen. Ein Betrunkener will aus einem Gasthaus heimkehren. Das Gasthaus liegt an einer geraden Straße, an einem Ende befindet sich ein See, am anderen das Wohnhaus des Betrunkenen. Der Betrunkene erinnert sich nicht an die richtige Richtung. Er macht einen Schritt nach links oder rechts mit gleicher Wahrscheinlichkeit 1/2, dann hält er inne. Ohne sich zu erinnern, woher beim letzten Schritt gekommen war, irrt er in dieser Weise weiter: einen Schritt dem See zu, einen Schritt dem Wohnhaus zu, immer mit Wahrscheinlichkeit 1/2. Erreicht er den See, fällt er hinein, erreicht er das Wohnhaus, bleibt er dort (und schläft den Rausch aus). Frage: mit welcher Wahrscheinlichkeit ertrinkt der Betrunkene und mit welcher Wahrscheinlichkeit erreicht er sein Haus? Wir machen hier nicht weiter, sondern verweisen auf die Literatur. Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P := (pij )1≤i,j≤k . Mit (n) (n) einem Vektor π (n) = (π1 , . . . , πk ) ∈ R wollen wir die Wahrscheinlichkeit beschreiben, dass (n) sich die Markovkette zum Zeitpunkt n mit Wahrscheinlichkeit πi im Zustand i befindet. Wir fordern also für jedes u := π (n) : 0 ≤ uj ≤ 1, j = 1, . . . , k , k X uj = 1 . (8.6) j=1 Es ist einfach nachzurechnen, dass mit u := π (n) auch u := π (n+1) die Bedingung (8.6) erfüllt. Nun gilt: π (n+1) = π (n) P π (n) P n (P n )ij Stand: 9. Februar 2010 = π (0) P (8.7) n n−r (8.8) r = P P Xk = (P n−r )il (P r )lj l=1 107 (8.9) (8.10) c J.Baumeister KAPITEL 8. ZUFALL 8.5. MARKOV–KETTEN Hierbei sind P l die Potenzen der Matrix P . Die Gleichungen (8.7),(8.8),(8.9) heißen ChapmanKolmogorov-Gleichungen. Die Interpretation von (8.9),(8.10) ist die, dass die Wahrscheinlichkeit, in n Schritten vom Zustand i in den Zustand j zu gelangen, gleich der Summe der Wahrscheinlichkeiten, zunächst von i in r Schritten zu einem Zwischenzustand l und von dort in den restlichen n − r Schritten nach j zu gelangen, wobei die Summe über alle möglichen Zwischenzustände l auszuführen ist. Definition 8.5.6 Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P := (pij )1≤i,j≤k . Seien i, j zwei Zustände der Markovkette. Wir sagen i führt zu j, falls die Wahr(n) scheinlichkeit, von i nach j zu gelangen, strikt positiv ist, d.h. wenn es n ∈ N gibt mit Pij > 0 . Führt i zu j und j zu i, dann sagen wir, dass i, j miteinander kommunizieren. In der Darstellung der Markovkette durch einen Graphen bedeutet i führt zu j“ nichts anderes, ” als dass es einen Weg entlang der Pfeile von i nach j gibt. Die Relation kommunizieren miteinander“ ist zwar keine Äquivalenzrelation – die Reflexi” vität ist nicht notwendigerweise gegeben – trotzdem wird die Markovkette in disjunkte Klassen eingeteilt, wenn wir das Problem mit Reflexivität dadurch beheben, dass wir jedem Zustand, der mit keinem anderen kommunizieren, eine eigene Klasse zuordnen. Lemma 8.5.7 Jeder Zustand gehört genau einer Klasse an. Beweis: Offenbar gehört jeder Zustand einer Klasse an. Sei i ein Zustand, der den Klassen K1 und K2 angehört. Seien u ∈ K1 und v ∈ K2 , dann gilt wegen der Transitivität der Relation kommuni” zieren miteinander“, dass u mit v kommuniziert. Also kommunizieren alle Zustände von K1 mit allen von K2 , und folglich muß K1 gleich K2 sein. Definition 8.5.8 Eine Markovkette mit Übergangsmatrix heißt M-regulär, falls es ein N ∈ N, so dass P N nur strikt positive Einträge enthält. Offenbar zieht Regularität“ nach sich, dass alle Zustände miteinander kommunizieren; also gibt ” es nur eine Klasse. Diese Eigenschaft nennt man Ergodizität. Hinreichend für die Eigenschaft Ergodizität“ sind Irreduzibilität“ und Aperiodizität“; wir verweisen auf die Literatur. ” ” ” Satz 8.5.9 Sei P die Übergangsmatrix einer M-regulären Markovkette mit k Zuständen. Dann gilt:7 (a) Der Grenzwert W := limn P n existiert. (b) Die Matrix W ist zeilenstochastisch und alle Zeilenvektoren von W sind gleich. (c) Die Matrix W hat einen Eigenwert 1 und für den zugehörigen Eigenvektor π = (π1 , . . . , πk ) gilt πi > 0, i = 1, . . . , k , π1 + · · · + πk = 1 ; π ist der Zeilenvektor von W . (d) Für jeden Vektor π 0 , der (8.6) erfüllt, gilt limn π (0) P (n) = π . Beweis: Die Minima und Maxima in den Spalten von P n spielen die Hauptrolle: m(j, n) := min(P n )ij , M (j, n) := max(P n )ij . i 7 i Konvergenz bei einer Folge von Matrizen ist definiert über die Konvergenz aller Einträge. Stand: 9. Februar 2010 108 c J.Baumeister KAPITEL 8. ZUFALL 8.5. MARKOV–KETTEN Sei j ∈ {1, . . . , k} . Wir zeigen, dass die Folge (m(j, n))n∈N monoton nicht fallend ist. Dies liest man ab aus m(j, n + 1) = min(P n+1 i ≥ min i )ij = min i k X k X Pil (P n )lj l=1 Pil (min(P n )lj ) = m(j, n) min i l l=1 k X Pil = m(j, n) . l=1 Analog beweist man, dass die Folge (M (j, n))n∈N monoton nicht wachsend ist. Also ist auch die Folge (M (j, n) − m(j, n))n∈N monoton nicht wachsend und daher auch konvergent. Setze µ(j, n) := limn (M (j, n) − m(j, n)) . Es gilt offenbar µ(j, n) ≥ 0 . Wir wollen limn µ(j, n) = 0 zeigen. Wegen der Monotonie der Folge reicht es zu zeigen, dass eine Teilfolge von (µ(j, n))n∈N gegen Null konvergiert. Nach Voraussetzung über die M-Regularität können wir N ∈ N so wählen, dass P N nur strikt positive Einträge hat. Setze d := mini,j (P N )ij ) ; es gilt d ∈ (0, 1] . Sei n ∈ N . Dann gilt (P n+N )ij = = = k X l=1 k X l=1 k X l=1 (P N )il (P n )lj N n n ((P )il − d(P )jl )(P )lj + d k X (P n )jl (P n )lj l=1 ((P N )il − d(P n )jl )(P n )lj + d(P 2n )jj ≥ m(j, n) k X ((P N )il − d(P n )jl ) + d(P 2n )jj l=1 = m(j, n)(1 − d) + d(P 2n )jj . Durch Minimumbildung erhalten wir m(j, n + N ) ≥ m(j, n)(1 − d) + d(P 2n )jj . Analog leitet man her: M (j, n + N ) ≤ M (j, n)(1 − d) + d(P 2n )jj . Folglich haben wir µ(j, n + N ) ≤ (1 − d)µ(j, n) . Betrachte nun für ein n ∈ N die Teilfolge (µ(j, n + lN ))l∈N . Wir haben µ(j, n + lN ) = µ(j, n + (l − 1)N + N ) ≤ (1 − d)µ(j, n + (l − 1)N ) und nach Iteration µ(j, n + lN ) ≤ µ(j, n)(1 − d)l . Da 1 − d < 1 gilt, folgt die Konvergenz von (µ(j, n + lN ))l∈N gegen Null. Nun kommen wir zum Beweis der Aussagen in der Formulierung des Satzes. Aus der Existenz von limn m(j, n) = limn M (j, n) , j = 1, . . . , k , folgt die Existenz von wij := limn (P n )ij = limn m(j, n) für alle i, j = 1 . . . , k , und die Unabhängigkeit von wij von i für alle j = 1, . . . , k . Setze W := (wij )1≤i,j≤k . W hat nun gleiche Zeilenvektoren; sei π = (π1 , . . . , πk ) Stand: 9. Februar 2010 109 c J.Baumeister KAPITEL 8. ZUFALL 8.6. ÜBUNGEN der Zeilenvektor von W . Da (m(j, n))n∈N monoton P Pk nicht fallend und m(j, N ) positiv ist, ist jedes ist πi positiv. Aus k n l=1 (P )ij = 1 folgt l=1 πl = 1 . Aus k k X X πj = lim(P n+1 )ij = lim( (P n )il plj ) = πl plj = (πP )j , j = 1, . . . , k , n n l=1 l=1 folgt die Eigenwertgleichung. Zu (d). Offenbar konvergiert (π (0) P n )n∈N gegen π (0) W . Da u := π (0) die Bedingung (8.6) erfüllt und alle Zeilen von W gleich sind, ist π (0) W = π . Damit sind alle Aussagen gezeigt. Die Gleichung πP = π (8.11) ist nun der Ansatz zur Analyse einer regulären Markovkette: bestimme den Eigenvektor zum größten Eigenwert von P . Dann ist das Langzeitverhalten ablesbar. Der Vektor π heißt Gleichgewichtsverteilung. Beispiel 8.5.10 Wir betrachten das Beispiel 8.5.4 mit der Übergangsmatrix ! 0.662 0.338 P := 0.250 0.750 Wir erhalten in numerischer Rechnung ! 0.432 0.568 P5 = , P 10 = 0.420 0.580 0.425 0.575 0.425 0.575 ! , P 20 = 0.425 0.575 0.425 0.575 ! . Der Eigenvektor zum Eigenvektor 1 ist α = (0.425, 0.575) . Auf lange Sicht ist also das Wetter in der Gegend unabhängig von einer beliebigen Startverteilung π (0) : es ist in 42.5% der Tage regnerisch und in 57.5% der Tage trocken. 8.6 Übungen 1.) Stand: 9. Februar 2010 110 c J.Baumeister Kapitel 9 Modellierung Modellierung ist der Versuch, eine Wirklichkeit durch ein Modell der Wirklichkeit zu ersetzen. Mathematische Modellierung bedeutet, Modelle in der Sprache der Mathematik zu formulieren und Theorien zu ihrer Analyse zu entwickeln/anzuwenden. Modellierung ist eng mit Simulation verknüpft und damit auch mit dem Einsatz von Computern. 9.1 Wissenschaft Bevor wir über Modelle reden können, die ja mathematische Modelle sein sollen, ist über die Wissenschaft Mathematik zu reden. Sie soll ja hier mit seinen Entwicklungen, Resultaten, Ordnungsinstrumenten, . . . herangezogen werden. Was ist Wissenschaft, was ist eine Wissenschaft, was ist die Wissenschaft Mathematik? Darum geht es hier, aber etwas weniger umfassend. Wir fragen nach dem Gemeinsamen einer wissenschaftlichen Theorie.1 Es ist offenbar, dass eine Darlegung dazu hier nur sehr laienhaft angelegt sein kann. Aber die folgenden Thesen scheinen doch richtungsweisend zu sein für eine spätere Einordnung des Vorgangs der Modellierung. • Die Aussagen einer wissenschaftlichen Theorie beziehen sich nicht auf konkrete Objekte sondern auf bestimmte theoretische Begriffe • Eine wissenschaftliche Theorie hat eine streng deduktive Struktur. • Anwendungen einer wissenschaftlichen Theorie auf die wirkliche Welt basieren auf Korrespondenzregeln zwischen theoretischen Gebilden und konkreten Objekten. Anders als die internen Aussagen der Theorie2 enthalten die Korrespondenzregeln keine absolute Garantie für ihre Gültigkeit. Die grundlegende Methode, um ihre Gültigkeit – und damit die Anwendbarkeit der Theorie – zu überprüfen, ist die experimentelle Methode. Der Bereich, in dem die Korrespondenzregeln gültig sind, ist in jedem Falle begrenzt. Der ungeheuere Nutzen exakter Wissenschaften – dies ist die Gesamtheit aller wissenschaftlichen Theorien – besteht darin, dass sie Modelle der Wirklichkeit liefern. Diese Modelle ermöglichen die Darstellung und Vorhersage natürlicher Phänomene, indem man sie mittels Korrespondenzregeln auf die theoretische Ebene überträgt, die so erhaltenen Übungsaufgaben“ löst und die ” Lösungen auf die wirkliche Welt zurücküberträgt. 1 Die folgenden Ausführungen sind geleitet von den Gedanken und Ausführungen in L. Russio, Die vergessene Revolution, Springer, 2003, das sehr interessant und mit überraschenden Einsichten das hellenistische Zeitalter des antiken Wissens darstellt. 2 L. Russio schreibt davon, dass eine Theorie nur dann wissenschaftlich genannt werden kann, wenn man Übungsaufgaben zu ihr erstellen kann. 111 KAPITEL 9. MODELLIERUNG 9.2. MODELLE In jeder reinen Naturlehre ist nur so viel an eigentlicher Wissenschaft enthalten, als Mathematik in ihr angewandt werden kann. I. Kant 9.2 Modelle Wenn wir nun von Modellen für etwas sprechen wollen, haben wir zu klären, was dieses etwas sein soll: ein reales Problem?, ein Phänomen?, ein räselhaftes Verhalten?, . . . . Wir wollen uns dabei des Begriffs des Systems bedienen und unter einem System einen wohlumschriebenen Teilbereich der Wirklichkeit verstehen. Zugegeben, nicht viel ist gewonnen mit dieser Definition“, in kon” kreten Situation wird sie uns aber schon helfen können. Beispiele für solche Wirklichkeitsbereiche könnten sein: Mechanische Systeme, chemische Reaktoren, Biotope, Lebensgemeinschaft gewisser Spezies, Körperorgane, Handelsbetriebe, Volkswirtschaften, Klimasysteme Die Beschreibung von Systemen umfasst die Angabe der Objekte (Bestandteile), die zum System gehören, legt die Beziehungen unter den Objekten offen, erklärt mögliche Interaktionen unter den Bestandteilen und gibt die Umstände an, unter denen die Beschreibungen gültig sein sollten. Die Wechselwirkung eines Systems mit der Systemumgebung erfolgt über so genannte Eingangsund Ausgangsgrößen. In grober Einteilung sprechen wir von zeitunabhängigen (stationären) Systemen und zeitabhängigen (dynamischen) Systemen. Manchmal ist Zeit“ auch eine fiktive Zeit. Unter einem ” Experiment an einem System versteht man den Prozess, durch Aufschalten“ spezieller Ein” gangsgrößen aus gemessenen Ausgangsgrößen Aussagen über das System zu gewinnen. Ein Modell ist ein Abbild eines Systems, einer Wirklichkeit in einem anderen Kontext. Der Physiker Hertz3 scheint erstmals das Wort Modell“ in einem Sinne verwendet zu haben, der ” unserem Verständnis entspricht. Wir werden uns auf mathematische Modelle beschränken, d.h. auf solche, die im Kontext der Mathematik betrachtet werden; siehe unten. Es ist nicht zwingend, nur mathematische Modelle zu betrachten, z. B. kann man für die Lebensgemeinschaft gewisser ” Spezies“ auch ein sozialwissenschaftliches Modell aufstellen; möglicherweise landet man aber bei der Modellierung dieses Models wieder bei einem mathematischen. Die Modellbildung, der Modellierungsprozess umfasst (1) die Identifikation der Bestandteile (des zu modellierenden Systems), (2) die Aufdeckung von Zusammenhängen im Beziehungen im System, (3) die Annahmen, unter denen das Modell schließlich betrachtet werden soll, (4) die Festlegung der Modellierungsebene. Mit Modellierungsebene meinen wir hier: sozialwissenschaftlich, physikalisch, mathematisch, . . . . Typische methodische Elemente der Modellbildung sind • Vereinfachung, Idealisierung, • Festlegung des Wesentlichen, Weglassung von Unwesentlichem, Abstraktion, • schrittweises Vorgehen von einfach zu komplex, 3 Heinrich Hertz, 1857-1894, Physiker Stand: 9. Februar 2010 112 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.3. MATHEMATISCHE MODELLIERUNG • Versuch und Irrtum. Im Allgemeinen wird man Modellsequenzen betrachten, beginnend mit einfachen Grundmodellen, fortschreitend unter Einbeziehung der Ergebnisse der vorangegangenen Modellanalyse. Simulation ist das Nachbilden eines Systems (mit seinen dynamischen Prozessen) in einem experimentierfähigen Modell, um zu Erkenntnissen zu gelangen, die auf die Wirklichkeit übertragbar sind; siehe Abschnitt 9.4. Die Schwierigkeit bei der konzeptuellen Modellbildung liegt darin, das Beobachtete zu vereinfachen und zu abstrahieren ohne die wesentlichen Aspekte auszulassen oder zu verfälschen. Dabei spielt die Fragestellung, die das Ziel für die Analyse vorgibt, eine wesentliche Rolle. Neben diesen konzeptuellen Modellen, die unser Anliegen sind, werden in den Naturwissenschaften auch deskriptive Modelle benötigt. Sie sind in höchstem Maße nützlich für die Aufbereitung von großen Datenmengen/Meßdaten. Dem Anspruch, den Simulationsmodelle mitunter erheben, ein wirklichkeitstreues Abbild einer komplexen Realität wiederzugeben, können diese Modelle im Allgemeinen nicht gerecht werden: die hohe Komplexität eines Simulationsmodells, die ja gerade den engen Realitätsbezug herstellen sollte, führt oft dazu, dass sie undurchschaubar werden in ihrer Aussagekraft. Modellen liegen Gedankenexperimente zugrunde unter Idealbedingungen, allenfalls geeignet, wirkliche Experimente nach ihnen zu entwerfen. Wo das, wie meist in den Sozialwissenschaften, nicht möglich ist, kann die Lösung“, die Wirklichkeit ein” fach mit den Modellen zu identifizieren, nur Verwirrung stiften, vor allem dann, wenn man nicht akzeptieren will, dass Modelle nicht als richtig oder falsch, sondern als mehr oder weniger passend anzusehen sind. Die Rolle kann in Problemfeldern, in denen es keine Laborversuche gibt, nicht dieselbe sein wie etwa in der Physik. 9.3 Ingenieurwisschensachaften I n f o r m a t i k Naturwissenschaften Mathematik Theorie Experiment Berechnung Ö k o n o m i e Life sciences Abbildung 9.1: Mathematik und Modellierung Mathematische Modellierung Mathematische Modellierung/Modellbildung meint – siehe Abschnitt 9.1 – die Korrespondenzregeln zwischen den konkreten Objekten und den theoretischen mathematischen Gebilden herzustellen. Von Galileo Galilei stammt die Metapher vom Buch der Natur, das in der Sprache der ” Mathematik“ geschrieben sei. Sie beschreibt den Zugang zur Natur, den die Naturwissenschaften seit Galilei gewählt haben. Mathematische Modellierung ist demnach der Versuch, das Nachdenken über eine Fragestellung in mathematische Termini zu übersetzen und sich der (Stringenz der) Mathematik für die Behandlung von Problemen außerhalb der Mathematik zu bedienen. A. Alexandrov schreibt:4 Die Mathematik ist ein mächtiges und universelles Instrument der Erkenntnis und der Lösung von Aufgaben überall dort, wo sich genügend klar definierte Strukturen abzeichnen. 4 A. Alexandrov, Mathematik und Dialektik, Ideen des exakten Wissens, 4 (1971), 251-257. Stand: 9. Februar 2010 113 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.4. SIMULATION Dies ist sicher der Fall in den klassischen Anwendungsgebieten Physik und Ingenieurwissenschaften. Der Erfolg der mathematischen Modellierung bei der Behandlung physikalischer und technischer Systeme hat diesen Zugang auch in die Lebenswissenschaften, Wirtschaftswissenschaften und und Sozialwissenschaften hineingetragen. Mathematische Modelle dienen dem Verständnis grundlegender Mechanismen, sind jedoch meist stark vereinfachend und lassen dann nur allgemeine, qualitative Aussagen zu. Die Theoriebildung aus mathematischen Modellen heraus ist dementsprechend auch stark auf grundlegende Aussagen über das modellierte System eingeschränkt. Der springende Punkt der Brauchbarkeit eines mathematischen Modells für den angepeilten Zweck ist die Güte des Modells: eine Beobachtung des Systems liefert qualitative und quantitative Daten, die Güte des mathematischen Modells wird an Hand des Grades der Übereinstimmung der Vorhersagen“ des Modells mit den ” Daten bewertet. Mathematische Modellierung realer Phänomene kann mit unterschiedlichen Werkzeugen der Mathematik erfolgen. Phänomene, die sich so modellieren lassen, finden sich u.a. in den Anwendungsgebieten • Informatik • Wirtschaftswissenschaften, Finanzmathematik • Biologie, Biophysik • Mechanik, (Mathematische) Physik In der Informatik werden diskrete Strukturen durch Graphen, Gitter, Automaten, . . . abgebildet; in den Wirtschaftswissenschaften werden Entscheidungs– und Optimierungsprobleme umgesetzt in mathematische Aufgaben; in der Biologie werden Wachstumsmodellle betrachtet; In der Biophysik werden (dynamische) Mdelle zum Beispiel für die Aktivität des Gehirns erarbeitet; in der Mechanik werden Konsequenzen aus den Bewegungsgesetzen für starre Körper gezogen; Modelle der mathematischen Physik beschreiben kontinuierliche Systeme mittels partieller Differentialgleichungen; in der Finanzmathematik ist ein zentrales Problem die Bewertung von Optionen, modelliert in erster Näherung“ durch die Black-Scholes-Differentialgleichung. In jedem Falle ” stehen Modellannahmen am Anfang: sie dienen zum Einen, ein Modell auf der jeweiligen mathematischen Basis herleiten zu können und zum anderen dieses Modell so einfach zu gestalten, dass eine stringente mathematische Untersuchung“ möglich wird. ” 9.4 Simulation Was ist Simulation? Hier ist der Versuch einer Definition: Unter Simulation versteht man in der Wissenschaft die Nachbildung eines realen Objektes oder Vorganges als Modell und die Nutzung dieses Modells an Stelle des Objekts. Ein Beispiel dafür ist der maßstabsgetreue Nachbau eines Autos für ein Experiment im Windkanal. Seit dem Siegeszug des Rechners als technisches Werkzeug werden solche Modelle jedoch in der Regel nicht mehr physikalisch, sondern virtuell in Form von Computerprogrammen realisiert und benutzt. Das bekannteste Beispiel einer Simulation durch einen Computer ist wohl die Wettervorhersage, welches das Ergebnis aufwändiger Rechnungen auf leistungsfähigen Supercomputern ist. Aus der Sicht, die wir einnehmen wollen, beginnt die Geschichte wohl in den vierziger Jahren Stand: 9. Februar 2010 114 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE des letzten Jahrhunderts. Im Vordergrund standen Simulationen von Flugkörpern, radioaktiven Stoffen, elektrischen Schalkreisen und schlies̈lich von Satelliten. In den Universitäten sind sogar Fachgebiete wie Modellierung, Simulation“ entstanden. Heutzutage kann Jedermannn ” Simulationsreisen machen, die PC’s sind leistungsstark genug, allerdings ist der Grat zwischen wissenschaftlicher Simulation und Beispielsanwendungen schmall. Simulation ist im Allgemeinen eine interdisziplinäre Tätigkeit, ein interdisziplinäres Fach. Es ist angesiedelt im Überlappungsbereich von Informatik, Mathematik und den Anwendungsgebieten, wie beispielsweise der Physik, der Medizin und Biologie. Stichworte zu Gründen für den Einsatz von Simulation können sein: Kosten, Gefahrenpotential, Beobachtbarkeit, Beinflussbarkeit, Störungsfreiheit. Anwendungen der Simulation sind vielfältig. Bereiche sind: Wissenschaft Hier wird Simulation eingesetzt, um Theorien zu entwickeln und zu verfeinern. Dies geschieht durch einen Vergleich zwischen Simulationsergebnissen und theoretischen Prognosen. Technik Für den Ingenieur ist die Simulation ein Entwurfs- und Optimierungswerkzeug. Mit ihrer Hilfe kann er seine Ideen für ein Produkt oder System testen, lange bevor der erste Prototyp gebaut wird. Gesellschaft Für die Gesellschaft liegt der Nutzen der Simulation in den Prognosen von Ereignissen und Erklärungen von realem Geschehen. Beispiele sind Märkte, Wahlverhalten, .... Unterhaltung Simulationen haben Einzug gehalten bei den Unterhaltungsmedien in der Entwicklung von Filmen, . . . . Anwendungen in der Medizin profitieren davon. Simulation bedarf im Allgemeinen der Entwicklung von (schnellen) Algorithmen, um die Zwecke der Simulation zu erreichen. Hier ist heutzutage der Ansatz für Forschung und Weiterentwicklung. Man unterscheidet deterministische und stochastische Ansätze für Algorithmen. Beispiele sind: Deterministisch Lineare Optimierung/Simplexverfahren, Differenzengleichungen, Differentialgleichungen, Gröbnerbasen,. . . . Stochastisch Approximationsalgorithmen, Monte-Carlo-Methoden, Markovketten, stochastische Differentialgleichungen, . . . . 9.5 Zur Mendelschen Vererbungslehre Eine der ersten systematischen Arbeiten zur Vererbungslehre wurde im 19. Jahrhundert von Gregor Mendel5 geleistet. Unter anderem untersuchte Mendel die Vererbung einer Eigenschaft von Erbsen, nämlich ob die Erbsen eine glatte oder runzelige Oberfläche besitzen. Wie bei allen Pflanzen besitzt dabei jedes Individuum zwei Eltern. Durch Kreuzung von Erbsen mit glatter Oberfläche und runzeliger Oberfläche erhält jede Erbse in der Tochtergeneration das Genmaterial je eines Elternteils mit glatter und je eines Elternteils mit runzeliger Oberfläche. Überraschenderweise gab es bei den Nachkommen der Erbsen in der ersten Tochtergeneration nur noch glatte Erbsen. Noch überraschender waren die Ergebnisse bei der nachfolgenden Tochtergeneration, bei der nun beide Elternteile aus der ersten 5 Gregor Mendel, 1822 - 1884, Augustinermönch Stand: 9. Februar 2010 115 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE Tochtergeneration stammten. Hier kamen sowohl glatte als auch wieder runzelige Erbsen zum Vorschein. Interessanterweise waren jedoch die glatten Erbsen im Übergewicht, und zwar im Verhältnis 3 zu 1. Mendel suchte nach einer Erklärung und fand sie. Bei diploiden“ Organismen, z. B. bei Menschen, Pflanzen,. . . , sind entlang der Chromo” somen Gene wie in einer Kette nebeneinander aufgereiht. Ein Gen kann in zwei oder mehr Zustandsformen auftreten, die man Allele nennt. Am Genort der Erbsen, der für die Oberfläche verantwortlich ist, gibt es zwei allele Gene, bezeichnet mit G (glatte Oberfläche) und g (runzelige Oberfläche). Damit gibt es drei verschiedene Genotypen: GG, Gg, gg (Gg und gG können wir identifizieren). Hier ist die Mendelsche Vererbung: Elterngeneration: Erste Tochtergeneration: Zweite Tochtergeneration: GG, gg Gg, Gg GG, Gg, gG, gg Hier geht man also davon aus, dass in der Elterngeneration die Genotypen GG und gg vorliegen. Wieso kommt es zu den Genotypen in der ersten und zweiten Tochtergeneration und was soll nun Gg eigentlich sein? Wir wissen nur, dass GG glatt und gg runzelig bedeutet. Ein Organismus, der bezüglich einer Ausprägung dieselbe Erbinformation trägt, wird als reinerbig oder homozygot bezeichnet.6 Wir haben nun mit Gg eine mischerbige oder heterozygote Erbinformation vorliegen. Soll daher die Ausprägung ein wenig runzelig“ vorliegen oder soll eine ” der beiden Allele zufällig die Ausprägung bestimmen? Bei anderen Pflanzen gibt es durchaus die Beobachtung, dass Nachfahren eine gemischte Ausprägung“ haben: rote Blume + weisse ” Blume = rosa Blume als Nachfahre. Dies ist aber hier, wie die Experimente gezeigt haben, nicht der Fall: alle Erbsen der ersten Tochtergeneration werden als glatt beobachtet. Die Interpretation dieses Sachverhalts ist, dass beide Allele gegeneinander konkurrieren und in Abhängigkeit der Gene sich immer eines der beiden als dominant behauptet. Dies legt es nahe, der Unterscheidung Genotyp (Zusammensetzung der Erbinformation) die Unterscheidung Phänotyp (sichtbare Ausprägung) zur Seite zu stellen. Damit erklärt sich die Ausprägung der ersten Tochtergeneration dadurch, dass Gg, gG und GG denselben Phänotyp besitzen. Wie kann man nun die Erscheinung in der zweiten Tochtergeneration erklären? Nimmt man an, dass Eltern des Genotyps Gg eines seiner Gene mit gleich großer Wahrscheinlichkeit an seine Kinder weitergibt, dann gibt es für die Erbsen der zweiten Tochtergeneration vier Möglichlichkeiten, wie sie in der obigen Tabelle aufgelistet ist. Davon sind drei der vier Kombinationen, die im Genotyp möglich sind, im Phänotyp gleich, nämlich glatt; nur der Genotyp gg liefert eine runzelige Erbse. Dabei ist offenbar angenommen, dass eine nachfolgende Generation durch zufällige Paarung gebildet wird, ohne Rücksicht auf den Genotyp der Eltern. Beispiel 9.5.1 In der Mendelschen Vererbung haben wir die Genotypen D: GG, H: Gg, R: gg . Wir gehen nun so vor: Wir nehmen irgendein Individuum, kreuzen es mit einem Individuum des gewählten Typs, wählen zufällig einen Abkömmling aus, kreuzen diesen wieder mit einem Individuum des gewählten Typs, und so weiter. Beobachtet man die Genotypen der so erzeugten Abkömmlinge durch die Generationen, so erhält man eine Markovkette. Dazu gehören die Übergangsmatrizen 1 1 0 0 0 1 12 0 2 4 0 PD := 0 21 1 , PH := 12 21 12 , PR := 1 21 0 . 0 0 0 0 21 1 0 41 12 Studiere nun das Langzeitverhalten der Generationen im Kontext von Satz 8.5.9. 6 Die Annahme, dass eine Situation vorliegt, in der die Elterngeneration reinerbig ist, läst sich durchaus rechtfertigen. Stand: 9. Februar 2010 116 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.6 9.6. DAS FALLGESETZ VON GALILEI Das Fallgesetz von Galilei Das Gesetz des freien Falls steht am Beginn der neuzeitlichen Physik. Es besagt, dass (1) alle Körper gleich schnell fallen, (2) bei einem freien Fall aus der Ruhelage die zurückgelegten Wege sich verhalten wie die Quadrate der Zeiten. Um die Entdeckung dieses Gesetzes rankt sich die Legende, Galilei7 hätte es gefunden im Experiment, Körper vom schiefen Turm in Pisa fallen zu lassen. Es handelt sich wirklich nur um eine Legende.8 Hätte er dieses Experiment wirklich durchgeführt und wäre er von den Beobachtungen ausgegangen, so wäre er nie auf das Fallgesetz gekommen, denn der störende Einfluss des Luftwiderstands hätte sich bemerkbar gemacht. Wie läßt sich nun etwa das erste Fallgesetz beweisen“? Zwei gleiche Kugeln müssen aus Sym” metriegründen gleich schnell fallen. An der gemeinsamen Fallgeschwindigkeit wird sich nichts ändern, wenn man die beiden Kugeln durch einen festen, masselosen“ Stab miteinander ver” bindet. Dabei handelt es sich dann aber um einen Körper der doppelten Masse, der mit der gleichen Geschwindigkeit fällt. Durch Anwendung dieser Überlegung auf drei, vier, . . . Kugeln ergibt sich die Unabhängigkeit der Fallgeschwindigkeit von der Masse des Körpers. Welche Annahme liegt der Überlegung zugrunde? Es ist die Annahme: Auf die Gestalt des Körpers kommt es nicht an. Man könnte diese Annahme als willkürlich bezeichen, sie ist aber hilfreich, eine wunderbare mathematische Theorie für die Mechanik starrer Körper zu entwickeln. Wie verhält es sich nun beim zweiten Teil des Fallgesetzes? Es ergibt sich bei Galilei als mathematischer Satz über die gleichförmig beschleunigte Bewegung, nachdem er eine Definition von gleichförmiger und gleichförmig beschleunigter Bewegung gegeben hat. Die Empirie kommt nur insofern ins Spiel, als festgestellt wird, dass ein schwerer Körper (nach unten) fällt, und dass nachträglich in einem Versuch mit einer schiefen Ebene das Gesetz verifiziert“ wird. ” Wir wollen die Definitionen nicht wiederholen, wollen aber ein Zwischenergebnis“ angeben. Galilei ” schreibt: Die Zeit, in welcher irgendeine Strecke von einem Körper von der Ruhelage aus mittelst einer gleichförmigen beschleunigten Bewegung zurückgelegt wird, ist gleich der Zeit, in welcher dieselbe Strecke von demselben Abbildung 9.2: Erstes Fallgesetz Körper zurückgelegt würde mittelst einer gleichförmigen Bewegung, deren Geschwindigkeit gleich wäre dem halben Betrage des höchsten und letzten Geschwindigkeitswertes bei jener ersten beschleunigten Bewegung. 7 8 Galileo Galilei, 1564-1642, it. Wissenschaftler Die Episode wird erst 60 Jahre nach der Entdeckung des Gesetzes erstmals beschrieben. Stand: 9. Februar 2010 117 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.6. DAS FALLGESETZ VON GALILEI Hier werden zwei verschiedene Bewegungen einander gegenübergestellt: eine gleichförmig beschleunigte, bei der im Zeitintervall [0, t1 ] die Geschwindigkeit gleichmäßig von 0 auf einen maximalen Wert v1 zunimmt, und eine gleichförmige mit der konstanten Geschwindigkeit 21 v1 . Offenbar sind die Flächen unter den beiden verschiedenen Geschwindigkeitsprofilen gleich; siehe Abbildung ??. Aus der Integralrechnung wissen wir, dass der Weg s, der im Interval [0, t1 ] bei gegebener Geschwindigkeit v durchlaufen wird als Z t1 v(t)dt s= 0 gegeben ist. Dies ist das Zwischenergebnis von Galilei. Galilei hat das Argument der Integralrechnung durch ein geometrisches Argument ersetzt. Betrachte nun eine gleichförmig beschleunigte Bewegung, die zum Zeitpunkt t1 bzw. t2 die Geschwindigkeit v1 bzw. v2 besitzen. Dann gilt also für die durchlaufenen Wege 1 1 s1 = v1 t1 und s2 = v2 t2 2 2 und auf Grund der Annahme der Gleichförmigkeit der Bewegung t1 v1 = . v2 t2 Daraus folgt s1 t2 = 21 , s2 t2 also das zweite Fallgesetz. Wir sehen in den obigen Darlegungen schon die Begriffe der Newtonschen Mechanik und im Schlepptau die Anfänge der Infinitesmal– und Integralrechnung aufscheinen. In der modernen Sprache der Infinitesmal– und Integralrechnung ist die Annahme der gleichförmigen Beschleunigung gleichbedeutend mit der Aussage, dass die Ableitung der Geschwindigkeitsfunktion konstant ist:9 v̇(t) = a für alle t . Daraus ergibt sich zunächst ẋ(t) = v(t) = v0 + a(t − t0 ) für alle t , wobei t0 , v0 der Anfangszeitpunkt bzw. die Anfangsgeschwindigkeit sind. Daraus leitet sich dann mit t0 = 0, v0 = das Fallgesetz 1 x(t) = at2 für alle t ≥ 0 2 ab. Hier wird deutlich, welchen Stellenwert die Entwicklung der Infinitesmal– und Integralrechnung, genauer der Theorie der gewöhnlichen Differentialgleichungen, bei der Begründung der klassischen Mechanik einnehmen musste. In einem Brief von Galilei wird Mathematische Modellierung versus Erfahrung mit der Wirklichkeit treffend beschrieben: 9 Die Schreibweise ẋ, ẍ ist die bei den Physikern gebräuchliche, wenn es um Zeitableitungen in der Mechanik geht. Stand: 9. Februar 2010 118 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.7. GUTGESTELLTHEIT – WELLPOSEDNESS Zeigt die Erfahrung nunmehr, dass solche Eigenschaften, wie wir sie abgeleitet haben, im freien Fall der Naturkörper ihr Bestätigung finden, so können wir ohne Gefahr des Irrtums behaupten, dass die konkrete Fallbewegung mit derjenigen, die wir definiert und vorausgesetzt haben, identisch ist; ist dies nicht der Fall, so verlieren doch unsere Beweise, da sie einzig und allein für unsere Voraussetzung gelten wollten, nichts von ihrer Kraft und Schlüssigkeit. Newton10 betrachtet den Fall der beschleunigten Bewegung unter der Annahme, dass ein Widerstand im Verhältnis seiner Geschwindigkeit“ geleistet ” wird. Dies bedeutet unter der zusätzlichen Annahme eines linearen Ansatzes, dass nun die Differentialgleichung v̇ = b − cv mit positiven Konstanten b, c zu untersuchen ist. Wir kennen alle Lösungen davon. Hier sind sie: v(t) = b b + (v0 − ) exp(−ct) für alle t, c c wobei v0 die Geschwindigkeit zur Zeit t0 = 0 ist. Wir leiten die Formel aus der Beobachtung d ct (e v) = ect b dt ab. Wir stellen also fest, dass dieses Modell für t → ∞ eine gleichförmige Geschwindigkeit prognostiziert. Diese letzte Aussage ist eine Aussage vom Typ qualitative Aussage, während eine Aussage zu der Geschwindigkeit, mit der sich der Grenzwert limt→∞ = cb einstellt, nämlich exponentiell schnell, eine quantitative Aussage ist. 9.7 Gutgestelltheit – Wellposedness Mathematischen Modelle (für eine physikalische Fragestellung) haben meist die Form einer Gleichung/Differentialgleichung, die gewisse Parameter enthält, und in die weitere Größen einzubringen sind. Siehe etwa das Fallgesetz aus dem letzten Abschnitt: die Differentialgleichung ist v̇ = b und im Gefolge sind einzubringen t0 , v0 . Eine beliebte Beschreibung eines solchen Modells ist der Problembeschreibung in der Systemtheorie abgeschaut: es enthält eine Systemgleichung und die Größen Input, System-Parameter, Output. Die Analyse eines solchen Modells kann dann in drei Typen von Problemen eingeteilt werden: (A) Das direkte Problem: Gegeben sind Input und System-Parameter, bestimme den Output, der in Übereinstimmung damit ist. (B) Das Rekonstructionsproblem: Gegeben sind Output und System-Parameter, bestimme den Input, der in Übereinstimmung damit ist. 10 Isaac Newton, 1642-1727, engl. Wissenschaftler Stand: 9. Februar 2010 119 c J.Baumeister KAPITEL 9. MODELLIERUNG 9.8. ÜBUNGEN (C) Das Identifikationsproblem: Gegeben sind Input und Output, finde die System-Parameter, die in Übereinstimmung damit sind. Wir nennen ein Problem vom Typ (A) ein direktes Problem, da aus bekannten Ursachen eine Wirkung zu bestimmen ist. Damit in Übereinstimmung ist dann, Probleme vom Typ (B) und (C) inverse Probleme zu nennen: es sind ja aus Wirkungen Ursachen zu bestimmen. Wir kommen auf die Begriffe bei konkreten Modellen wieder zurück. Bei einem mathematischen Modell läuft es meist darauf hinaus, eine Gleichung zu lösen. Damit sollte eine umfassende Untersuchung eines solchen mathematischen Modells folgende Fragen klären: (1) Festlegung der Daten des Problems und ihrer quantitativen Beschreibung, (2) Existenz und einer Lösung, (3) Eindeutigkeit einer Lösung, (4) Stabilität, d.h. die stetige“ Abhängigkeit der Lösung von den Daten, ” (5) Berechnung einer Lösung. Die Festlegung der Daten des Problem ist eigentlich Teil der Modellbildung, die quantitative Beschreibung ist verbunden damit, in welchem mathematischen Kontext eine Lösung anstreben läßt. Die Frage der Existenz und Eindeutigkeit ist von Bedeutung, wenn es darum geht, Modellannahmen zu hinterfragen. Nichteindeutigkeit etwa könnte ein Indiz sein, dass die Modellbeschreibung nicht ausreichend viele Annahmen formuliert, um sicherzustellen, dass nur eine mathematische Lösung“ existiert. In der Frage der Stabilität soll geklärt werden, wie sich Va” riationen in den Parametern und den Modellannahmen auf die Lösung auswirken. Die Forderung (5) ist selbsterklärend. Als beispielhaft kann man sich immer eine lineare Gleichung vorstellen: hier sind die obigen Fragen im Rahmen der linearen Algebra vollständig diskutierbar. Dieses Konzept der Modellbewertung“ wurde von Hadamard 1902 im Zusammenhang mit ” dem Studium von Randwertpoblemen der mathematischen Physik eingeführt. Hadamard bezeichnet ein mathematisches Problem schlechtgestellt/ill-posed, wenn es hinsichtlich der Forderungen (1),(2),(3) nicht überall eine positive Antwort gegeben werden kann, im entgegegesetzten Fall als gutgestellt/well-posed.11 Es ist in der Natur der Problemstellung, dass inverse Probleme im Allgemeinen schlechtgestellt sind (Irreversibilität, Kausalität, . . . ). 9.8 Übungen 1.) 11 Hadamard glaubte – viele Mathematiker tun dies heute noch – dass schlechtgestellt Probleme nicht sachgemäß gestellt sind und daher als künstlich zu bezeichnen sind. Stand: 9. Februar 2010 120 c J.Baumeister