Mathematik ist überall Vorlesung im Rahmen der Mathematisch-Naturwissenschaftlichen Grundlegung im Sommersemester 2015 von Dr. Markus Schulz Inhaltsverzeichnis 1 Grundlagen 1.1 Mengen und Zahlbereiche . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Mathematische Beweisverfahren . . . . . . . . . . . . . . . . . . . . . 1 1 3 6 2 Der 2.1 2.2 2.3 2.4 goldene Schnitt Definition und Eigenschaften . . . . . . . Konstruktionen des goldenen Schnitts . . Fibonacci-Zahlen und goldener Schnitt . Auftreten des goldenen Schnittes und der . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fibonacci-Zahlen . . . . . . . . . . . . . . . . . . . . 8 . 8 . 11 . 14 . 19 3 Die 3.1 3.2 3.3 3.4 Mathematik in der Musik Tonerzeugung . . . . . . . . . . . Tonabstände und Stimmungen . . Fourier-Analyse . . . . . . . . . . Mathematik als Kompositionshilfe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 28 32 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 45 47 51 Mathematik der Finanzmärkte Ein einführendes Beispiel . . . . . . Einperioden-Modelle . . . . . . . . Binomialmodelle . . . . . . . . . . Das Black-Scholes-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 58 60 65 67 4 Graphentheorie 4.1 Grundlagen . . . . . . 4.2 Eulersche Graphen . . 4.3 Hamiltonsche Graphen 4.4 Kürzeste Wege . . . . 5 Die 5.1 5.2 5.3 5.4 . . . . . . . . . . . . . . . . . . . . . . . . ii 1 1 Grundlagen Ein berühmtes Zitat von Galileo Galilei besagt sinngemäß, dass das Buch der Natur in der Sprache der Mathematik geschrieben ist. Um die Vorgänge in der Natur und die hier geschilderten Anwendungen zu verstehen, müssen wir uns also mit der Sprache der Mathematik vertraut machen. Natürlich wird – zumindest in deutschen Sprachraum – auch in der Mathematik die deutsche Sprache verwendet. Mathematische Texte weisen jedoch eine spezielle Struktur auf und verwenden besondere Formulierungen und Symbole. Dies ließ schon Johann Wolfgang von Goethe sagen „Die Mathematiker sind eine Art Franzosen: redet man zu ihnen, so übersetzen sie es in ihre Sprache, und dann ist es alsobald ganz etwas anderes.“ Bevor wir uns also mit der Mathematik und ihren Anwendungen beschäftigen können, müssen wir zunächst ein wenig Vokabular lernen. Als Basis unserer Betrachtungen führen wir im ersten Abschnitt dieses Kapitels verschiedene Mengen ein. Neu eingeführte Begriffe werden dabei fett gedruckt. 1.1 Mengen und Zahlbereiche Definition 1.1. Unter einer Menge verstehen wir die Zusammenfassung von wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens zu einem Ganzen. Ein in einer Menge enthaltenes Objekt heißt auch ein Element der Menge. Ist x ein Element einer Menge M , so schreiben wir x ∈ M , ist x keine Element der Menge M , so drücken wir dies durch x ∈ / M aus. Besitzt eine Menge keine Elemente, so nennen wir sie die leere Menge und schreiben ∅ oder {}. Eine Menge A ist Teilmenge einer anderen Menge B, geschrieben A ⊂ B, genau dann, wenn jedes Element x von A auch ein Element von B ist. Zwei Mengen können wir auf verschiedene Weisen verknüpfen. Definition 1.2. Der Durchschnitt zweier Mengen A und B, geschrieben als A∩B, besteht aus allen Elementen, die sowohl zu A als auch zu B gehören. Man drückt dies mathematisch so aus: A ∩ B = {x : x ∈ A und x ∈ B}. Die Vereinigung A ∪ B zweier Mengen A und B besteht aus allen Elementen, die zu A oder zu B (oder zu beiden) gehören, also A ∪ B = {x : x ∈ A oder x ∈ B}. Die Differenz A\B zweier Mengen A und B bezeichnet die Menge aller Elemente von A, die nicht gleichzeitig zu B gehören. Es gilt also A\B = {x : x ∈ A und x ∈ / B}. Im nächsten Abschnitt werden wir die mathematischen Symbole für die Verknüpfungen „und“ und „oder“ kennenlernen. Besondere Mengen, die mit eigenen Symbolen bezeichnet sind, sind die verschiedenen Zahlbereiche. Höchstwahrscheinlich sind Sie schon als Kind mit den natürlichen 2 1 GRUNDLAGEN Zahlen in Kontakt gekommen. Diese Menge wird immer dann benutzt, wenn Dinge zu zählen sind. Wir bezeichnen die natürlichen Zahlen mit N = {1, 2, 3, 4, . . .}. Oft nimmt man auch die 0 dazu. Die so entstehende Menge bezeichnen wir mit N0 . Wir können zwei natürliche Zahlen addieren und multiplizieren, ohne aus der Menge „herauszufallen“. So gilt z.B. 3 + 4 = 7 ∈ N und 3 · 4 = 12 ∈ N. Doch schon die Subtraktion zweier natürlicher Zahlen führt manchmal zu Problemen. Beispielsweise gilt 9 − 5 = 4 ∈ N, aber 5 − 9 ∈ / N. Um beliebig subtrahieren zu können, benötigen wir die ganzen Zahlen Z = {. . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . .}. Die eben problematische Aufgabe ist nun lösbar: 5 − 9 = −4 ∈ Z. Wenn zusätzlich auch die Division möglich sein soll, reichen die ganzen Zahlen nicht mehr aus. Dazu müssen wir unseren Zahlbereich auf die rationalen Zahlen np o Q= : p ∈ Z und q ∈ Z\{0} q erweitern. Die Zahl 0 ist als Nenner nicht zulässig. Neben der Bruchdarstellung ist auch die Dezimalschreibweise gebräuchlich, also z.B. 54 = 1, 25 oder 13 = 0, 33333 . . .. Jedoch kommt man selbst mit dieser relativ umfangreichen Menge nicht immer aus. 2 Beispielsweise gibt es keine rationale √ Zahl a mit a = 2. Dennoch gibt es eine (nicht endende) Dezimaldarstellung a = 2 = 1, 4142135 . . .. Alle Zahlen der Zahlengerade zusammengenommen ergeben die reellen Zahlen R. Gegenüber den rationalen Zahlen sind alle nichtendenden und nicht-periodischen Dezimalzahlen hinzugekommen, beispielsweise ist auch π = 3, 14159 . . . eine reelle Zahl. Anzumerken ist, dass je zwei reelle Zahlen nach ihrer Größe sortiert werden können, d.h. für zwei reelle Zahlen a und b gilt a ≤ b oder a ≥ b (oder beides, dann ist a = b). Manchmal beschränken wir uns auch auf folgende Teilmengen der rellen Zahlen: [a, b] ={x ∈ R : a ≤ x ≤ b} [a, b) ={x ∈ R : a ≤ x < b} (−∞, b] ={x ∈ R : x ≤ b} [a, ∞) ={x ∈ R : a ≤ x} (a, b] ={x ∈ R : a < x ≤ b} (a, b) ={x ∈ R : a < x < b} (−∞, b) ={x ∈ R : x < b} (a, ∞) ={x ∈ R : a < x}. Alle derartigen Mengen werden unter dem Oberbegriff „Intervalle“ zusammengefasst. Die reellen Zahlen sind in der Praxis häufig völlig ausreichend, gelegentlich, z.B. wenn man die Gleichung x2 = −2 lösen will, benötigt man die komplexen Zahlen C = {a + ib : a, b ∈ R}. Der Buchstabe i wird auch imaginäre Einheit genannt und ist definiert durch √ i = −1 bzw. i2 = −1. Für eine komplexe Zahl mit der Darstellung a + ib bezeichnet man a als Realteil und b als Imaginärteil. Jede reelle Zahl x kann man durch a = x und b = 0 auch als komplexe Zahl auffassen. Insgesamt gelten also die Beziehungen N ⊂ N0 ⊂ Z ⊂ Q ⊂ R ⊂ C. 1.2 Aussagenlogik 1.2 3 Aussagenlogik Wie in der Sprache bringt es auch in der Mathematik wenig, die einzelnen Wörter zu kennen, ohne zu wissen, wie man sie zu Aussagen zusammenfügt. Deshalb wollen wir nun definieren, was wir unter einer mathematischen Aussage verstehen. Danach werden wir verschiedene Möglichkeiten betrachten, Aussagen logisch zu verknüpfen. Einige der entwickelten Regeln werden im nächsten Abschnitt die Grundlage für verschiedene Beweismethoden bilden. Definition 1.3. Aussagen sind sprachliche Gebilde, von denen objektiv feststeht, dass sie entweder wahr oder falsch sind, die also von zwei möglichen Wahrheitswerten genau einen annehmen. „Objektiv festehender Wahrheitswert“ bedeutet, dass eine Aussage entweder wahr oder falsch ist, unabhängig von der Person, die diese Aussage macht, unabhängig von Ort und Zeitpunkt, an dem bzw. zu dem die Aussage gemacht wird und unabhängig von einer Person, die diese Aussage beurteilt. Beispielsweise ist der gemäß historischer Anekdote überlieferte Satz „Alle Kreter lügen“ keine Aussage, denn spricht ein Kreter diesen Satz aus, so würde er demzufolge die Wahrheit sagen, also nicht lügen, was dem Satz widerspricht. Auch der berühmte Ausspruch des Babiers von Sevilla „Ich rasiere alle Männer meiner Heimatstadt, die sich nicht selbst rasieren.“ gehört in diese Kategorie, denn wer rasiert den Barbier? Lassen Sie uns noch einige weitere Beispiele behandeln: Beispiel 1.1. 1. Dem Satz „Heute ist ein wunderschöner Herbsttag.“ ist kein objektiver Wahrheitsgehalt zuzuordnen, es ist also keine Aussage im mathematischen Sinn. 2. Der Satz „Die Bauarbeiten am Kölner Dom begannen im Jahr 1248.“ ist dagegen eine wahre Aussage. 3. Die Frage „Gefällt es Ihnen an der Universität zu Köln?“ ist wiederum keine Aussage, da man ihr keinen Wahrheitswert zuordnen kann. 4. Der Satz „Der Kölner Hauptbahnhof liegt auf der rechten Rheinseite.“ ist eine falsche Aussage. 5. Der Satz „Karl der Große hatte 24 Kinder.“ ist eine Aussage, obwohl es hier kaum möglich sein dürfte, den Wahrheitswert festzustellen. Es genügt, dass ein eindeutiger Wahrheitswert existiert. Jede Aussage kann auch verneint werden. Formal definieren wir Definition 1.4. Unter der Negation einer Aussage A verstehen wir die verneinte Aussage ¬A, die zu A den gegensätzlichen Wahrheitswert hat: Ist A wahr, so ist ¬A falsch, und ist A falsch, so ist ¬A wahr. Beispiel 1.2. Die Negation der Aussage aus 2. des vorangegangenen Beispiels lautet „Die Bauarbeiten am Kölner Dom begannen nicht im Jahr 1248.“ Da „nicht rechts“ gleichbedeutend mit „links“ ist, kann man die Negation von 4. auch formulieren als „Der Kölner Hauptbahnhof liegt auf der linken Rheinseite.“ 4 1 GRUNDLAGEN Zwei Aussagen lassen sich außerdem auf verschiedene Weisen verknüpfen. Bei zwei Aussagen wird eine solche Verknüpfung beispielsweise dadurch definiert, dass man für alle vier möglichen Kombinationen von Wahrheitswerten der Verknüpfung einen Wahrheitswert zuordnet. Dies kann durch Angabe einer sog. Wahrheitstafel geschehen. Definition 1.5. Die Konjunktion ∧ zweier Aussagen A und B ist definiert durch A w w f f B w f w f A∧B w f f f Die Aussage A ∧ B ist also nur wahr, wenn sowohl A als auch B wahr sind. Die Verknüpfung entspricht dem sprachlichen ’und’. Definition 1.6. Die Disjunktion ∨ zweier Aussagen A und B ist definiert durch A w w f f B w f w f A∨B w w w f Die Aussage A ∨ B ist also wahr, wenn mindestens eine der beiden Aussagen A oder B wahr ist. Die Verknüpfung entspricht dem sprachlichen ’oder’ im nichtausschließlichen Sinn. Definition 1.7. Dem sprachlichen ’Wenn ..., dann ...’ entspricht die Implikation ⇒, deren Wahrheitstafel wie folgt definiert ist: A B w w w f f w f f A⇒B w f w w Definition 1.8. Die Äquivalenz ⇔ zweier Aussagen A und B ist definiert durch A B w w w f f w f f A⇔B w f f w Sprachlich drücken wir eine Äquivalenz häufig durch ’genau dann, wenn’ aus. Die Aussage A ⇔ B ist also genau dann wahr, wenn die Aussagen A und B die gleichen Wahrheitswerte besitzen. 1.2 Aussagenlogik 5 Gerade in der Mathematik kommen häufig Aussagen vor, die von einem Platzhalter x abhängen. Auch Zusammenfassungen solcher Aussagen der Form „Für alle x ∈ M gilt...“ oder „Es existiert ein x ∈ M , so dass gilt ...“ sind allgegenwärtig. Zur Abkürzung definieren wir Definition 1.9. Es sei M eine Menge und A(x) eine Aussage, die von einer Variable x ∈ M abhänge. (a) Ist A(x) für alle x ∈ M eine wahre Aussage, dann sagt man „Für alle x ∈ M gilt A(x)“ oder „Für jedes x ∈ M gilt A(x)“ und schreibt kurz ∀x ∈ M : A(x). (b) Ist A(x) für mindestens ein x ∈ M eine wahre Aussage, dann sagt man „Für ein x ∈ M gilt A(x)“ oder „Es gibt ein x ∈ M mit A(x)“ und schreibt kurz ∃x ∈ M : A(x). (c) Ist A(x) für genau ein x ∈ M eine wahre Aussage, dann sagt man „Für genau ein x ∈ M gilt A(x)“ oder „Es gibt genau ein x ∈ M mit A(x)“ und schreibt ∃!x ∈ M : A(x). (d) Ist A(x) für kein x ∈ M eine wahre Aussage, dann sagt man „Für kein x ∈ M gilt A(x)“ oder „Es gibt kein x ∈ M mit A(x)“ und schreibt @x ∈ M : A(x). Die hier eingeführen Symbole heißen Quantoren. Es können auch mehrere Quantoren miteinander verschachtelt werden. Als Faustregel kann man sich merken, dass bei der Negation aus einem ∀ ein ∃ wird und umgekehrt. Beispiel 1.3. Ist (xn )n∈N eine reelle Zahlenfolge, dann wird durch die Aussage ∀ε > 0∃n0 ∈ N∀n ≥ n0 : |xn | < ε definiert, dass die Folge gegen Null konvergiert. Formulieren würde man die Aussage z.B. als „Für jedes ε > 0 gibt es einen Index n0 ∈ N, so dass alle weiteren Folgenglieder betraglich kleiner als ε sind.“ Die Negation der Aussage ist ∃ε > 0∀n0 ∈ N∃n ≥ n0 : |xn | ≥ ε. Anwendung findet die mathematische Aussagenlogik v.a. zur Begründung mathematischer Beweisprinzipien und in der Mengenlehre. Die Logik ist also eine wesentliche Grundlage der Mathematik – man spricht ja auch immer von der Mathematik als logische Wissenschaft. Darüber hinaus ist die Logik aber auch Grundlage der Computerwissenschaft und künstlichen Intelligenzforschung. Es gibt ganze Programmiersprachen, die auf Fragmnenten der Logik beruhen, z.B. PROLOG (Programming in Logic). Weitere Stichworte sind Logikprogrammierung, maschinelles deduktives Beweisen, regelbasierte Expertensysteme und nichtmonotone Logik. Außerdem wird die Logik in der Philosophie angewandt, um Argumente und Folgerungen zu formalisieren und Argumente auf ihre Gültigkeit zu untersuchen. 6 1.3 1 GRUNDLAGEN Mathematische Beweisverfahren Mathematische Beweismethoden basieren auf aussagenlogischen Gesetzen. Im Folgenden werden wir nun diejenigen Gesetze kennenlernen, die vielen Beweisen zugrunde liegen und somit häufig angewandte Beweismethoden darstellen. Das erste grundlegende Prinzip erlaubt es uns, den Beweis einer Äquivalenz A ⇔ B durch den Nachweis der Folgerungen A ⇒ B und B ⇒ A zu führen. Formal gilt Proposition 1.1. Für zwei mathematische Aussagen A und B gilt (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A)). Beweis. Die Behauptung beweisen wir mittels folgender Wahrheitstafel: A w w f f B w f w f A⇔B w f f w A⇒B w f w w B⇒A w w f w (A ⇒ B) ∧ (B ⇒ A) w f f w Ebenfalls sehr wichtig ist der Beweis durch Kontraposition. Statt eine Folgerung A ⇒ B direkt zu beweisen, beweist man, dass aus ¬B die Aussage ¬A folgt. Proposition 1.2. Für zwei mathematische Aussagen A und B gilt (A ⇒ B) ⇔ (¬B ⇒ ¬A). A w Beweis. w f f B w f w f A⇒B w f w w ¬B f w f w ¬A ¬B ⇒ ¬A f w f f w w w w Oft werden Aussagen auch durch die Herleitung von einer anderen bereits verifizierten Aussage bewiesen. Proposition 1.3. Für zwei mathematische Aussagen A und B gilt (A ∧ (A ⇒ B)) ⇒ B. A w Beweis. w f f B w f w f A⇒B w f w w A ∧ (A ⇒ B) A ∧ (A ⇒ B) ⇒ B w w f w f w f w Manchmal ist es nicht so einfach, eine Aussage direkt zu beweisen. Häufig hilft es in solchen Fällen, einen indirekten Beweis (oder auch Widerspruchsbeweis genannt) zu führen. Wollen wir beispielsweise A beweisen, dann können wir dies tun, indem wir die Annahme, dass A falsch ist bzw. ¬A wahr ist, zum Widerspruch (B ∧ ¬B) führen. 1.3 Mathematische Beweisverfahren 7 Proposition 1.4. Für eine mathematische Aussage A gilt (¬A ⇒ (B ∧ ¬B)) ⇔ A, wobei B eine weitere mathematische Aussage bezeichnet. Beweis. Die Aussage B ∧ ¬B ist immer falsch. Wir erhalten also die Wahrheitstafel A w f ¬A f w B ∧ ¬B f f ¬A ⇒ (B ∧ ¬B) w f Eine besondere Stellung nimmt das Beweisverfahren der vollständigen Induktion ein. Mit ihm ist es möglich, Aussagen der Form „Für alle n ∈ N gilt ...“ zu beweisen. Das Beweisprinzip basiert auf gewissen sog. Axiomen, also mathematischen Aussagen, die die Grundlage der Mathematik bilden und als wahr angenommen werden. Proposition 1.5. Für n ∈ N sei A(n) eine Aussage. Es gelte (1) A(1) ist wahr. (2) Für alle n ∈ N gilt: Ist A(n) wahr, so ist auch A(n + 1) wahr. Dann gilt A(n) für alle n ∈ N. Beweis. Der Proposition 1.4 folgend nehmen wir an, dass A(n) nicht für alle n ∈ N wahr ist. Dann gibt es darunter eine kleinste natürliche Zahl n1 , die wegen (1) größer als 1 sein muss. Daher gilt A(n) für alle n = 1, . . . , n1 − 1. Da A(n1 − 1) also wahr ist, ist nach (2) auch A(n1 ) wahr, was der Definition von n1 widerspricht. Unsere Annahme war also falsch und demzufolge die Behauptung richtig. Das Beweisprinzip funktioniert auch, wenn A(n) für alle n ≥ k, k ∈ N0 , wahr sein soll. Es erinnert an Proposition 1.3. Ausgehend von der wahren Aussage A(1) wird mittels (2) darauf geschlossen, dass auch A(2) wahr ist. Wendet man (2) nun hierauf an, so folgt, dass auch A(3) wahr ist usw. Ein Beweis mittels vollständiger Induktion besteht immer aus zwei Teilen: dem Induktionsanfang (1) und dem Induktionsschritt (2). Wir wollen uns das Beweisprinzip an einem Beispiel anschauen: Beispiel 1.4. Für n ∈ N beweisen wir die Summenformel 1 + 2 + 3 + ··· + n = n X k=1 k= n(n + 1) . 2 P Für n = 1 steht auf der linken Seite 1k=1 k = 1, auf der rechten Seite 1·2 = 1. Also 2 Pn n(n+1) ist A(1) richtig. Sei nun A(n) richtig, also gelte k=1 k = 2 . Zu zeigen ist, dass P (n+1)(n+2) auch A(n + 1) richtig ist, nämlich n+1 . Es gilt k=1 k = 2 n+1 X k=1 k= n X k=1 I.V. k +(n+1) = n(n + 1) n(n + 1) + 2(n + 1) (n + 2)(n + 1) +n+1 = = . 2 2 2 Damit ist A(n + 1) hergeleitet und somit die Aussage bewiesen. 8 2 2 DER GOLDENE SCHNITT Der goldene Schnitt Im Gegensatz zur symmetrischen Teilung einer Strecke gibt es unzählige Möglichkeiten, eine gegebene Strecke asymmetrisch zu teilen. Unter diesen hat der goldene Schnitt eine besondere Bedeutung. Die auch als Proportio divina bzw. göttliche Proportion bezeichnete Aufteilung übt schon seit Jahrtausenden eine besondere Faszination auf die Menschen aus, auch weil sie als harmonisch empfunden wird. Wie wir später sehen werden, hat der goldene Schnitt zahlreiche Anwendungen in Architektur und Kunst und kommt auch in der Natur vor. In einem engen Zusammenhang zum goldenen Schnitt stehen die sog. Fibonacci-Zahlen, die ebenfalls in der Natur beobachtet werden können und schon bei den alten Griechen und den Indern bekannt waren. 2.1 Definition und Eigenschaften Schon im zweiten Buch der Reihe Elemente formulierte Euklid (365 - 300 v. Chr.) folgende Aufgabe: Eine gegebene Strecke ist so zu teilen, dass das Rechteck aus der ganzen Strecke und dem einen Abschnitt dem Quadrat über dem anderen Abschnitt gleich ist. Die Elemente sind das älteste mathematische Werk, in dem der goldene Schnitt behandelt wird. Wir wollen ihn jedoch ein wenig anders definieren: Definition 2.1. Sei AB eine Strecke. Ein Punkt S von AB teilt AB im goldenen Schnitt, falls sich die größere Teilstrecke zur kleineren so verhält wie die Gesamtstrecke zum größeren Teil. Es gibt offensichtlich zwei mögliche Punkte, die AB im goldenen Schnitt teilen, je nachdem, ob die größere Strecke bei A oder B liegt. Wenn nichts anderes gesagt wird, wollen wir den Punkt S so wählen, dass er „näher bei“ B liegt. Bezeichne |AS| die Länge der Strecke AS. Dann können wir die Definition wie folgt umformulieren: Der Punkt S teilt AB im goldenen Schnitt, falls gilt |AS| |AB| = . |SB| |AS| Wir bezeichnen die Länge der größeren Strecke mit M und die Länge der kleineren mit m. Hat nun AB die Länge a, so ist dies gleichbedeutend zu a M = M m bzw. am = M 2 . Letzteres entspricht der Formulierung von Euklid. Den Wert des Quotienten man genau angeben: M m kann Satz 2.1. Ein Punkt S teilt die Strecke AB genau dann im goldenen Schnitt, wenn √ M 1+ 5 = ≈ 1, 6180339. m 2 2.1 Definition und Eigenschaften 9 Beweis. Nach Definition teilt S die Strecke AB genau dann im goldenen Schnitt, wenn |AB| M = . M m Wegen |AB| = M + m ist dies äquivalent zu M + m M 2 = m m M M 2 ⇔ +1= m m M 2 M − 1 = 0. − ⇔ m m √ Das Polynom x2 −x−1 besitzt die Nullstellen x1/2 = 1±2 5 (z.B. durch die p-q-Formel √ 1+ 5 M M ermittelt). Da M und m und somit auch m positiv sind, folgt m = 2 . Die im Satz gefundene Konstante bezeichnen wir ab jetzt mit φ. Der Ausdruck „goldener Schnitt“ kann in dreifacher Weise gebraucht werden: • als Bezeichnung für den Vorgang der Teilung („S teilt AB im goldenen Schnitt“), • als Bezeichnung für den Teilungspunkt S oder • als Bezeichnung für die Zahl φ. Die folgende Proposition gibt einige nützliche Eigenschaften des goldenen Schnittes an. Proposition 2.2. (a) Es gilt φ2 = φ + 1. Umgekehrt gilt: Ist x eine positive, reelle Zahl mit x2 = x + √ 1, so ist x = φ. 1 (b) φ = φ − 1 = 5−1 2 √ (c) φ + φ1 = 5. Beweis. zu (a): Teil (a) ergibt sich direkt aus dem Beweis von Satz 2.1. zu (b): Multipliziert man die Gleichung in (a) mit φ1 , so erhalten wir φ=1+ und damit 1 φ √ √ 1 1+ 5 5−1 =φ−1= −1= . φ 2 2 zu (c): Mit (b) rechnet man √ √ 1 1+ 5 5−1 √ φ+ = + = 5. φ 2 2 Bemerkung 2.1. Aus Proposition 2.2 folgt u.a., dass sich beliebige positive und negative Potenzen von φ als lineare Ausdrücke in φ, d.h. in der Form aφ + b mit ganzzahligen a und b, schreiben lassen. 10 2 DER GOLDENE SCHNITT Beispiel 2.1. Mit Hilfe von Proposition 2.2 rechnet man nach: 1 1 φ3 +φ−2 = φ·φ2 + · = φ(φ+1)+(φ−1)2 = 2φ2 −φ+1 = 2(φ+1)−φ+1 = φ+3. φ φ Wir fassen alle wichtigen Eigenschaften des goldenen Schnittes in dem folgenden Satz zusammen: Satz 2.3. Eine Strecke AB habe die Länge a, und S sei ein Punkt dieser Strecke. Wenn wir mit M die Länge der längeren Teilstrecke und mit m die Länge der kürzeren Teilstrecke bezeichnen, dann sind folgende Aussagen äquivalent: (1) S teilt AB im goldenen Schnitt (2) (3) M m =φ M 2 = m M m (4) a M =φ (5) a m =φ+1 +1 Beweis. Die Äquivalenz von (1) und (2) ist Aussage des Satzes 2.1. Die Äquivalenz von (2) und (3) folgt direkt aus Teil (a) der Proposition 2.2. (1) ⇔ (4): Nach Definition des goldenen Schnittes ist (1) genau dann wahr, wenn am = M 2 gilt. Wegen a = M + m folgt daraus am = M 2 ⇔ a(a − M ) = M 2 ⇔ a2 = M 2 + aM a 2 a = + 1. ⇔ M M Nach Proposition 2.2 ist dies gleichbedeutend zu Ma = φ. (1) ⇔ (5): Wegen M = a − m erhalten wir ⇔ ⇔ ⇔ ⇔ M 2 = am (a − m)2 = am a − m 2 a a−m = = +1 m m m a−m =φ m a a−m = +1=φ+1 m m Aus Proposition 2.2 kann man noch zwei weitere Darstellung der Zahl φ herleiten. Nach Teil (b) der Proposition gilt die Gleichung φ = 1+ φ1 . Durch dieselbe Gleichung können wir das φ im Nenner ersetzen, so dass φ = 1+ 1+1 1 . Setzen wir dies unendlich φ oft fort, so erhalten wir für φ den (unendlichen) Kettenbruch φ=1+ 1 1+ . 1 1+ 1 1 1+ 1+... 2.2 Konstruktionen des goldenen Schnitts 11 Bemerkenswert ist, dass dieser Kettenbruch √ nur aus Einsen besteht. Aus Teil (a) der Proposition 2.2 folgt außerdem φ = 1 + φ. Ersetzt man das φ unter der phier √ Wurzel wieder durch dieselbe Gleichung, so erhält man φ = 1 + 1 + φ. Iterativ ergibt sich also für φ die Darstellung s r q √ φ = 1 + 1 + 1 + 1 + . . .. In Erweiterung des goldenen Schnittes nennen wir ein Rechteck golden, falls sich die Längen seiner Seiten wie φ : 1 verhalten. 2.2 Konstruktionen des goldenen Schnitts Unter Verwendung der Konstante φ aus dem vorangegangenen Abschnitt kann man zu einer vorgegebenen Strecke den goldenen Schnitt berechnen und mit einem hinreichend genauen Lineal (zumindest annähernd) abmessen. Im Falle des goldenen Schnittes sind aber auch Konstruktionen mit Zirkel und Lineal möglich, von denen ich hier einige vorstellen möchte. Dabei unterscheidet man eine innere und eine äußere Teilung. Bei der inneren Teilung wird ein Punkt einer vorgegebenen Strecke konstruiert, der die Strecke im goldenen Schnitt teilt. Im Gegensatz dazu wird bei der äußeren Teilung ein Punkt auf der Verlängerung der ursprünglichen Strecke konstruiert, der die vorhandene Strecke zum (größeren) Teil des goldenen Schnittes macht. Ein klassisches Verfahren der inneren Teilung, das auf Heron von Alexandria (1. Jh. n. Chr.) zurückgeht und wegen seiner Einfachheit sehr beliebt ist, funktioniert folgendermaßen: 1. Man errichte auf der gegebenen Strecke AB im Punkt B eine Senkrechte der halben Länge von AB mit dem Endpunkt C. 2. Der Kreis um C mit Radius |CB| schneidet die Verbindung AC in einem Punkt D. 3. Der Kreis um A mit dem Radius |AD| teilt die Strecke AB im Verhältnis des goldenen Schnittes. Die Konstruktionen im ersten Schritt (Fällen des Lots und Abtragen der halben Länge einer Strecke) erläutere ich hier nicht näher. Die folgende Grafik verdeutlich das Verfahren: C D A S B 12 2 DER GOLDENE SCHNITT Begründung. Sei a die Länge der Strecke AB. Nach dem Satz des Pythagoras gilt √ a 2 5a2 5 2 2 2 2 |AC| = a + |BC| = a + ⇒ |AC| = a. = 2 4 2 Aufgrund der Konstruktion des Punktes D gilt |CD| = |BC| = a2 . Mit Proposition 2.2 folgt dann √ √ 5 a 5−1 a |AS| = |AD| = |AC| − |CD| = a − =a = . 2 2 2 φ Für das Verhältnis der Seitenlängen erhalten wir also |AB| a = a = φ. |AS| φ Nach Satz 2.3 ist dies gleichbedeutend dazu, dass S die Strecke AB im goldenen Schnitt teilt. Die folgende Konstruktion stammt von Euklid und ist somit älter als die soeben vorgestellte. Wir beginnen wieder mit einer gegebenen Strecke AB, die nach dem goldenen Schnitt zu teilen ist. 1. Errichte auf der gegeben Strecke AB im Punkt A eine Senkrechte der halben Länge von AB mit dem Endpunkt C. 2. Schlage um C einen Kreis mit Radius |CB| und finde den Punkt D als Schnittpunkt dieses Kreises mit der Verlängerung der Strecke CA über A hinaus. 3. Schlage um A einen Kreis mit Radius |AD| und finde den Punkt S als Schnittpunkt mit der Strecke AB. Im Punkt S wird die Strecke AB im goldenen Schnitt geteilt. C A B D Begründung. Nach Konstruktion in Schritt 3 und aufgrund der Lage der Punkte A, C und D gilt |AS| = |AD| = |CD| − |AC|. 2.2 Konstruktionen des goldenen Schnitts 13 Aufgrund der Konstruktion in Schritt 2 ist |CD| = |CB|. Mit Schritt 1 folgt |AS| = |CB| − |AB| . 2 Mit Hilfe des Satzes von Pythagoras ergibt sich 5 |AB|2 = |AB|2 . |CB| = |AB| + |AC| = |AB| + 4 4 2 2 2 2 Mit Proposition 2.2 erhalten wir insgesamt √5 − 1 |AB| |AS| = |AB| = , 2 φ also |AB| |AS| = φ. Als Beispiel für eine äußere Teilung einer gegebenen Strecke AS betrachten wir das folgende erst 1982 vom amerikanischen Künstler George Odom entdeckte Konstruktionsverfahren: 1. Konstruiere ein gleichseitiges Dreieck mit Eckpunkten X, Y und Z. Die Seitenlänge des Dreiecks sei 2a. 2. Konstruiere den Umkreis, also den Kreis, der durch alle Ecken des Dreiecks verläuft. 3. Halbiere zwei Seiten des Dreiecks in den Punkten A und S. 4. Die Verlängerung der Strecke AS schneidet den Kreis in den Punkten B (Verlängerung über S hinaus) und C (Verlängerung über A hinaus). S teilt die Strecke AB im Verhältnis des goldenen Schnittes. Ist die Strecke AS gegeben, so beginnt man mit der Konstruktion des gleichseitigen Dreiecks mit Grundseite AS, verlängert die anderen Seiten auf die doppelte Länge, konstruiert den Umkreis des entstehenden großen gleichseitigen Dreiecks und kann dann auch hier den Schnittpunkt B der Verlängerung von AS mit dem Umkreis bestimmen. Z A C X S B Y 14 2 DER GOLDENE SCHNITT Begründung. Nach Konstruktion ist |Y S| = |SZ| = a. Aus den Strahlensätzen ergibt sich dann |AS| = a. Mit b sei die Länge der Strecke SB bezeichnet. Aus Symmetriegründen ist dann auch |AC| = b. Die Strecken Y Z und BC bilden zwei Sehnen, die sich in S schneiden. Nach dem Sehnensatz gilt a2 = |SY | · |SZ| = |SB| · |SC| = b(a + b). Division durch b2 liefert die Gleichung a 2 b = a + 1. b Nach Proposition 2.2 bzw. Satz 2.3 ist dies äquivalent zu S die Strecke AB also im goldenen Schnitt. a b = φ, nach Satz 2.3 teilt Bemerkung 2.2. Es gibt eine weitere Begründung, die ohne den Sehnensatz auskommt. Dazu zeichnet man die Höhe auf der Grundseite XY ein. Den Schnittpunkt mit AS bezeichne man mit P . Auch der Mittelpunkt M des Umkreises liegt auf dieser Strecke. Nach den Strahlensätzen ist |P S| = 12 a. Als Höhe des gleichseitigen √ √ Dreiecks XY Z ermittelt man 3 a. Der Umkreisradius beträgt r = 23 3 a. Wendet man den Satz des Pythagoras auf das rechtwinklige Dreieck M P B an, so erhält man √ 2 2 √ 1 3 2 2 √ 2 2 2 2 a+b + 3a − a = 3a . |P B| + |P M | = |M B| ⇔ 2 3 2 3 Umformen liefert die Gleichung b2 + ab − a2 = 0. Die einzige positive Lösung dieser Gleichung ist b = − a2 + a 2 = √5−1 = φ teilt S die Strecke AB im goldenen Schnitt. b 2.3 √ 5 2 √ a = 5−1 2 a. Wegen Fibonacci-Zahlen und goldener Schnitt Diesen Abschnitt möchte ich mit einem einführenden Beispiel beginnen. Wir betrachten die Vermehrung von Kaninchenpaaren unter idealisierten Bedingungen. Man macht folgende Annahmen: • Jedes Kaninchenpaar wird im Alter von zwei Monaten fortpflanzungsfähig. • Jedes fortpflanzungsfähige Kaninchenpaar bringt jeden Monat ein neues Paar zur Welt. • Alle Kaninchen leben ewig. Im ersten Monat beginnen wir mit einem neugeborenen Kaninchenpaar. Dieses ist noch nicht fortpflanzungsfähig, so dass auch im zweiten Monat nur dieses eine Kaninchenpaar lebt. Jetzt ist das Paar jedoch fortpflanzungsfähig und bringt ein neues Kaninchenpaar zur Welt. Im dritten Monat sind also insgesamt zwei Kaninchenpaare vorhanden. Das neugeborene Kaninchenpaar kann sich im dritten Monat noch nicht fortpflanzen, das ursprüngliche Paar bringt aber erneut ein Kaninchenpaar zur Welt, so dass im vierten Monat insgesamt drei Kaninchenpaare existieren. Das folgende Diagramm veranschaulicht die Vermehrung der Kaninchenpaare. Dabei steht „x“ für ein nicht fortpflanzungsfähiges Paar und „o“ für ein gebärfähiges Paar. 2.3 Fibonacci-Zahlen und goldener Schnitt 15 x o o x o x o o x o x o x o x o o o x o Bezeichne fn die Anzahl der Kaninchenpaare im n-ten Monat. Treiben wir unser Gedankenexperiment weiter, so erhalten wir die Folge f1 = 1, f2 = 1, f3 = 2, f4 = 3, f5 = 5, f6 = 8, f7 = 13, . . . Doch wie geht es dann weiter? Eine Antwort gibt Proposition 2.4. Für alle n ∈ N gilt fn+2 = fn + fn+1 . Beweis. Wir betrachten die Situation im (n + 1)-ten Monat. Zu diesem Zeitpunkt gibt es nach Definition genau fn+1 Kaninchenpaare. Von diesen sind genau fn Paare gebärfähig, nämlich diejenigen, die schon im n-ten Monat gelebt haben. Im (n + 2)ten Monat bringen also genau fn der fn+1 Paare ein junges Paar zur Welt, d.h. es gilt fn+2 = Anzahl der Kaninchenpaare im (n + 1)-ten Monat +Anzahl der Paare, die im (n + 2)-ten Monat geboren werden = fn+1 + fn . Zu Ehren von Leonardo von Pisa (ca. 1170-ca. 1240), der auch Leonardo Fibonacci (kurz für „filius bonacci“ – Sohn des Bonacci) genannt wurde und die Folge 1227 anhand der obigen Aufgabe in seinem Buch Liber Abaci beschrieb, definiert man Definition 2.2. Die Zahlenfolge (fn )n∈N mit f1 = 1, f2 = 1 und fn+2 = fn+1 + fn , für alle n ∈ N, heißt Fibonacci-Folge. Die Folge war jedoch schon in der Antike um 100 v. Chr. bekannt, im asiatischen Raum sogar noch früher. Das einführende Beispiel ist zugegebenermaßen unrealistisch: Kein Kaninchen lebt ewig und bringt immer ein Kaninchenpaar zur Welt. Auch gibt es natürliche Wachstumshemmnisse (Futtermangel, Raubtiere), die den Bestand der Kaninchen nicht beliebig anwachsen lassen. Realistischer ist da schon das folgende Beispiel aus der Natur. 16 2 DER GOLDENE SCHNITT Beispiel 2.2. Eine Drohne (männliche Biene) schlüpft aus einem unbefruchteten Ei einer Bienenkönigin, während aus den befruchteten Eiern die weiblichen Arbeiterbienen und Königinnen schlüpfen. Eine Drohne hat also nur ein Elter, während Königinnen zwei Eltern haben. Anhand des folgenden Diagramms wird klar, dass in der n-ten Vorfahrengeneration genau fn Vorfahren existieren, und zwar fn−1 weibliche und fn−2 männliche. D K K D K K K D K D D K D K D K K K K K D D D K D K D K K K K K D Es gibt jedoch weitere Folgen, die die Rekursionseigenschaft der Fibonacci-Folge besitzen. Definition 2.3. Eine Folge (an )n∈N reeller Zahlen heißt eine Lucas-Folge, falls für alle n ∈ N gilt an+2 = an+1 + an . Die Lucas-Folge mit den beiden Anfangswerten a1 = 1 und a2 = 1 ist gerade die Fibonacci-Folge. Beispiel 2.3. Bezeichnet man die Potenzen φn der Zahl φ mit un , so gilt nach Proposition 2.2 für alle n ∈ N un+2 = φn+2 = φn · φ2 = φn (φ + 1) = φn+1 + φn = un+1 + un . Die Folge (un )n∈N ist also ebenfalls eine Lucas-Folge. Gleiches gilt für die Folge n (vn )n∈N mit vn = − φ1 , denn nach Proposition 2.2 gilt vn+2 1 n+2 1 n 1 2 1 n 1 = − = − · − = − · 2 φ φ φ φ φ 1 n 1 1 n 1 n+1 = − · 1− = − + − = vn + vn+1 . φ φ φ φ Zwischen der Fibonacci-Folge und einer beliebigen Lucas-Folge besteht folgender Zusammenhang: Proposition 2.5. Für jede Lucas-Folge (an )n∈N und für jede natürliche Zahl k ≥ 2 gilt ak+1 = fk · a2 + fk−1 · a1 . 2.3 Fibonacci-Zahlen und goldener Schnitt 17 Beweis. Die Aussage beweisen wir mittels Induktion nach k. Für k = 2 gilt nach Definition 2.3 und Definition 2.2 a2+1 = a3 = a2 + a1 = 1 · a2 + 1 · a1 = f2 a2 + f1 a1 und a3+1 = a4 = a3 + a2 = a2 + a1 + a2 = 2 · a2 + 1 · a1 = f3 a2 + f2 a1 . Wir nehmen nun an, dass die Formel für k − 1 und k (k ≥ 3) bereits bewiesen sei. Dann folgt ak+1+1 = ak+2 = ak+1 + ak = fk a2 + fk−1 a1 + fk−1 a2 + fk−2 a1 = (fk + fk−1 )a2 + (fk−1 + fk−2 )a1 = fk+1 a2 + fk a1 . Die Formel gilt also auch für k + 1. Mit Hilfe der bisherigen Ergebnisse können wir die berühmte Binet-Formel herleiten, die eine explizite Darstellung der Fibonacci-Zahlen mit Hilfe des goldenen Schnittes erlaubt. Sie ist nach dem französischen Mathematiker Jaques Philippe Marie Binet (1786-1856) benannt, der die Formel 1843 fand. In manchen Quellen wird die Formel korrekterweise auch Moivre-Binet-Formel genannt, da sie bereits im Jahr 1718 durch den französischen Mathematiker Abraham de Moivre (1667-1754) entdeckt wurde. Satz 2.6 (Binet-Formel). Für alle natürlichen Zahlen n gilt n √ √ φn − − φ1 1 h 1 + 5 n 1 − 5 n i √ . − fn = =√ 2 2 5 5 Beweis. Wegen φ − − φ1 φ + φ1 √ = √ = 1 = f1 5 5 ist die Binet-Formel auch für n = 1 richtig. Wendet man Proposition 2.5 auf die beiden Lucas-Folgen (un )n∈N und (vn )n∈N aus Beispiel 2.3 an, so erhält man für n ≥ 2 die Gleichungen φn = fn · φ + fn−1 und 1 n fn = fn−1 − . − φ φ Dies sieht man auf folgende Weise ein: Für n = 2 entspricht die erste Gleichung dem Teil (a) von Proposition 2.2. Für n ≥ 3 erhalten wir mit Proposition 2.5 und Proposition 2.2 φn = un = fn−1 u2 + fn−2 u1 = fn−1 φ2 + fn−2 φ = fn−1 (φ + 1) + fn−2 φ = (fn−1 + fn−2 )φ + fn−1 = fn φ + fn−1 . Nach Proposition 2.2 gilt 1 φ−1 1 f2 = = 1 − = f1 − . 2 φ φ φ φ 18 2 DER GOLDENE SCHNITT Die zweite der Gleichungen ist also für n = 2 richtig. Mit Proposition 2.5 und Proposition 2.2 ergibt sich zudem für n ≥ 3 1 n fn−1 fn−2 − = vn = fn−1 v2 + fn−2 v1 = 2 − φ φ φ 1 1 fn 1 − fn−2 = fn−1 − (fn−1 + fn−2 ) = fn−1 − . = fn−1 1 − φ φ φ φ Durch Subtraktion der beiden Gleichungen folgt für n ≥ 2 mittels (c) aus Proposition 2.2 1 n √ 1 fn n = fn φ + = fn · 5. φ − − = fn · φ + φ φ φ Bemerkung 2.3. Erstaunlicherweise heben sich für alle n ∈ N die irrationalen Terme gegenseitig auf, so dass die Formel stets ganzzahlige Werte liefert. Nun betrachten wir die „Fibonacci-Quotienten“ fn+1 . Die ersten Werte der Folge fn fn+1 lauten fn n∈N 1; 1, 5; 1, 666 . . . ; 1, 6; 1, 625; . . . Wir erkennen, dass sich die Quotienten der Zahl φ annähern. Tatsächlich gilt: Satz 2.7. Die Folge fn+1 konvergiert gegen φ. fn n∈N für n ≥ 1. Beweis. Setze xn = fn+1 fn 1 1. Schritt: Es gilt xn = 1 + xn−1 für n ≥ 2, denn 1+ 1 xn−1 =1+ fn−1 fn + fn−1 fn+1 = = = xn . fn fn fn 2. Schritt: Für n ≥ 2 gilt |φ − xn | = |φ − xn−1 | , φ · xn−1 denn mit dem ersten Schritt und (b) aus Proposition 2.2 folgt 1 1 xn−1 − φ = . φ − xn = 1 + − 1 + φ xn−1 φ · xn−1 3. Schritt: Für n ≥ 2 gilt |φ − xn | ≤ |φ − x2 | . φn−2 Wegen xn+1 ≥ 1 folgt aus dem zweiten Schritt nämlich |φ − xn | ≤ |φ − xn−1 | , φ woraus sich iterativ die behauptete Ungleichung ergibt. 2| Da φ > 1, wird |φ−x für wachsendes n beliebig klein. Nach der Ungleichung aus φn−2 dem dritten Schritt konvergiert dann aber (xn )n∈N gegen φ. 2.4 Auftreten des goldenen Schnittes und der Fibonacci-Zahlen 2.4 19 Auftreten des goldenen Schnittes und der Fibonacci-Zahlen Im Fruchtstand der Sonnenblume sind die Kerne in spiralförmigen Linien angeordnet. Jeder Kern gehört zu genau einer linksdrehenden und zu genau einer rechtsdrehenden Spirallinie. Abbildung 1: Spiralenförmige Anordnung der Kerne in der Sonnenblume. Quelle: http://members.chello.at Die Anzahlen der linksdrehenden Spirallinien sind keine beliebigen Zahlen, sondern Fibonacci-Zahlen. Auch als Anzahl der rechtsdrehenden Spirallinien erhalten wir eine Fibonacci-Zahl, allerdings nicht die gleiche, sondern eine benachbarte. Das gleiche Prinzip findet man auch bei Gänseblümchen, bei Tannenzapfen, bei Pinienzapfen, beim Kohl und bei der Ananas. Dies hängt damit zusammen, dass das Keimzentrum den jeweils nächsten Samen immer um einen Winkel von etwa 137,5◦ bzw. 222,5◦ (wenn man in der anderen Richtung misst) versetzt entstehen lässt. Es gilt 360 ≈ 1, 618 und 222, 5 222, 5 ≈ 1, 618, 137, 5 Beide Winkel teilen den Vollwinkel also im Verhältnis des goldenen Schnittes, man spricht deshalb auch vom goldenen Winkel. Dieses Verhältnis kann nach Satz 2.7 gut durch das Verhältnis zweier benachbarter Fibonacci-Zahlen approximiert werden. Pflanzen bevorzugen den goldenen Winkel, weil mit ihm auf kleiner Fläche viele Samen untergebracht werden können. Wir treffen erneut auf die Fibonacci-Zahlen bzw. den goldenen Schnitt, wenn wir die Blattstellungen verschiedener Pflanzen – in der Biologie Phyllotaxis genannt – betrachten. Bei Ulme und Linde sind die Blätter abwechselnd auf der einen oder der anderen Seite angeordnet, man spricht hier auch von 21 -Phyllotaxis. Bei Buche und Haselnuss bilden benachbarte Blätter einen Winkel von 31 eines Vollkreises. Biologisch ausgedrückt liegt hier 13 -Phyllotaxis vor. Weitere Werte sind: • Aprikose, Apfelbaum, Eiche: 25 -Phyllotaxis • Pappel, Birnbaum: 83 -Phyllotaxis • Weide, Mandelbaum: 5 -Phyllotaxis 13 Wir erkennen, dass es sich stets um Quotienten von Fibonacci-Zahlen handelt. Wenn wir bedenken, dass eine Drehung um 83 eines Vollwinkels im Uhrzeigersinn einer Drehung um 58 eines Vollwinkels gegen den Uhrzeigersinn entspricht, so handelt es 20 2 DER GOLDENE SCHNITT sich sogar um Quotienten benachbarter Fibonacci-Zahlen, die nach Satz 2.7 eine gute Näherung an den goldenen Schnitt darstellen. Der goldene Schnitt ist auch bei den Proportionen des Körpers von Bienen zu finden. Abbildung 2: Der goldene Schnitt bei der Biene. Quelle: www.michael-holzapfel.de Neben dem natürlichen Auftreten des goldenen Schnittes wurde dieses besondere Teilungsverhältnis aufgrund seiner harmonischen Wirkung auch oft in der Architektur angewendet. Vielfach ist jedoch umstritten, ob dies bewusst geschehen ist, da eindeutige Hinweise darauf mitunter fehlen. So ist auch nicht sicher, ob die alten Ägypter den goldenen Schnitt beim Bau der Pyramiden verwendet haben. Hingegen sprechen viele Anzeichen dafür, dass der goldene Schnitt in der griechischen Architektur eine große Rolle gespielt hat, und zwar schon 150 Jahre vor der schriftlichen, systematischen Behandlung durch Euklid. Als Beispiel sei hier der Parthenon genannt, den Perikles zwischen 447 und 432 v. Chr. bauen ließ. Abbildung 3: Der goldene Schnitt am Parthenon. Quelle: www.golden-section.eu Gemäß Bild 3 stehen der Oberbau, der vom Giebel bis zu den Säulen reicht, und der Unterbau, der die Säulen und Stufen umfasst, überraschend exakt im Verhältnis des goldenen Schnittes. Zudem passt die Vorderfront fast exakt in ein goldenes Rechteck (vgl. Bild 4). Auch an Kapitellen und Gebälk verschiedener klassischer Bauten in Athen findet sich der goldene Schnitt. Abbildung 4: Der Parthenon im goldenen Rechteck. Quelle: www.golden-section.eu 2.4 Auftreten des goldenen Schnittes und der Fibonacci-Zahlen 21 Seine Blütezeit erlebte der goldene Schnitt in der Renaissance. Als Beispiel für seine Verwendung in dieser Epoche wird häufig das Alte Rathaus in Leipzig angeführt, das in den Jahren 1556/57 im Auftrag des regierenden Bürgermeisters Hieronymus Lotter umgebaut wurde. Abbildung 5: Altes Rathaus Leipzig, Quelle: wikipedia Der Turm des Rathauses teilt das Gebäude (in etwa) im Verhältnis des goldenen Schnittes. Auch an vielen Gemälden, Reliefs und Plastiken wurde der goldene Schnitt nachgewiesen bzw. nachgemessen. Seine Funktion ist einerseits, zur harmonischen Aufteilung des gesamten Kunstwerkes beizutragen; zum anderen dient er dazu, wichtige Details besonders zu betonen. Wie bei den architektonischen Beispielen ist hier jedoch ebenfalls häufig umstritten, ob der goldene Schnitt bewusst angewendet wurde, da keine Aufzeichnungen dazu existieren. Albrecht Dürer (1471-1528), der nicht nur Maler sondern auch Mathematiker war, hat den goldenen Schnitt höchstwahrscheinlich als Gestaltungsgrundlage einiger Bilder verwendet. Als Beispiel betrachten wir das „Selbstbildnis mit Pelzrock“ von 1500. Abbildung 6: Albrecht Dürer: Selbstbildnis im Pelzrock, 1500 Quelle: wikipedia 22 2 DER GOLDENE SCHNITT Auffällig ist, dass der Kopf mit den wallenden Haaren ein gleichseitiges Dreieck bildet. Die Basis dieses Dreiecks, die mit der Spitze des weißen Hemdes zusammentrifft, teilt die Höhe des Gesamtbildes im goldenen Schnitt. Ebenso teilen die senkrechten, das Gesicht begrenzenden Linien die Breite des Bildes annähernd im goldenen Schnitt. In der Sixtinischen Madonna (1514) von Raffaelo Santi (genannt Raffael) (14831520) lässt sich der goldene Schnitt ebenfalls mehrfach nachweisen. Abbildung 7: Raffael: Sixtinische Madonna, 1514 Quelle: www.michael-holzapfel.de Auch in der Fotografie wird häufig die Aufteilung des Bildes im Verhältnis des goldenen Schnittes empfohlen, um einen harmonischen Gesamteindruck zu erzeugen. In der Musik gibt es zwei Möglichkeiten, wie der goldene Schnitt zur Gestaltung herangezogen werden kann. Zum einen können Tonintervalle gemäß dem goldenen Schnitt gewählt werden. Zum anderen können musikalische Werke aus mehreren Teilen bestehen, deren Längen zueinander im Verhältnis des goldenen Schnittes stehen. Es gibt Untersuchungen, nach denen z.B. Béla Bartók (1881-1945) seine Kompositionen gemäß dem goldenen Schnitt gestaltet haben könnte, dies ist allerdings umstritten. Als Beispiel wird häufig die Sonate für zwei Klaviere und Schlagzeug angeführt. Auffällig ist, dass die gesamte Sonate genau 6432 Achtelnoten umfasst und der zweite Satz nach 3975 Achtelnoten beginnt – dies entspricht ziemlich genau dem goldenen Schnitt. In neueren Werken werden jedoch bewusst Fibonacci-Zahlen zur Proportionierung benutzt, etwa im Klavierstück IX von Karlheinz Stockhausen oder in der Spektralmusik von Gérard Grisey. Auch im Musikinstrumentenbau selbst findet der goldene Schnitt gelegentlich Verwendung. Insbesondere beim Geigenbau soll er für einen besonders schönen Klang der Instrumente sorgen. Es wird sogar behauptet, dass der berühmte Geigenbauer Stradivari den goldenen Schnitt verwendete, diese Behauptung basiert jedoch nur auf nachträglichen Analysen. 23 3 Die Mathematik in der Musik Mathematik und Musik erscheinen auf den ersten Blick sehr verschieden. Dennoch gibt es zahlreiche Aspekte der Musik, in denen Mathematik eine Rolle spielt. Dies fängt schon damit an, dass Klänge nichts anderes als Schallwellen sind, zu deren Beschreibung die Mathematik herangezogen werden muss. Auch die Abstände zwischen verschiedenen Tönen sind nicht beliebig gewählt, sondern beruhen auf mathematischen Überlegungen. Bei der Festlegung dieser sog. Tonintervalle tritt ein Problem zutage, das historisch durch verschiedene Stimmungen gelöst wurde. Mit diesem Hintergrundwissen wollen wir dann untersuchen, wie man Klänge verschiedener Instrumente mit Hilfe der Mathematik synthetisieren kann. Und auch beim Komponieren selbst kann Mathematik eingesetzt werden. 3.1 Tonerzeugung Bei allen Musikinstrumenten entstehen Töne durch einen Schwingungsvorgang: Bei einer Geige schwingt die Saite, wenn sie gezupft oder gestrichen wird. In einem Klavier oder Flügel entstehen die Töne ebenfalls durch das Schwingen der Saiten, die jedoch diesmal von Hämmerchen angeschlagen werden. Auch in Orgelpfeifen oder Flöten entstehen Töne durch die Schwingung der darin befindlichen Luftsäule. Sogar der Mensch selbst kann beim Singen (mehr oder weniger wohlklingende) Töne produzieren, wenn er seine/ihre Stimmbänder in geeignete Schwingungen versetzt. In diesem Abschnitt wollen wir kurz auf die mathematischen und physikalischen Hintergründe von Schwingungen eingehen. Dabei wird eine Funktion vorkommen, die von zwei Variablen abhängt. Für derartige Funktionen müssen wir einen neuen Ableitungsbegriff einführen. Wir wollen damit beginnen, festzulegen, was wir unter einer Funktion verstehen. Definition 3.1. Eine Funktion ist eine Beziehung zwischen zwei Mengen D und W , die jedem Element x aus dem Definitionsbereich D genau einen Wert f (x) aus dem Wertebereich W zuordnet. Neben der aus der Schule bekannten Notation ist in der Mathematik auch die Notation f : D → W, x 7→ f (x) gebräuchlich. Weiterhin benötigen wir den Begriff der Konvergenz. Dabei kann man sich eine reelle Folge (xn )n∈N als unendlich lange Liste (x1 , x2 , x3 , . . .) von reellen Zahlen vorstellen. Definition 3.2. Eine reelle Folge (xn )n∈N heißt konvergent gegen x ∈ R, wenn gilt ∀ε > 0∃n0 ∈ N∀n ≥ n0 : |xn − x| < ε. In diesem Fall schreiben wir limn→∞ xn = x. Anschaulich heißt das, dass es zu jedem ε > 0 einen Index n0 ∈ N gibt, ab dem alle Folgenglieder xn von x um weniger als ε entfernt sind. Die Folgenglieder nähern sich also beliebig nah dem Wert x an. Diese Definition ist uns bereits in Beispiel 1.3 begegnet. Ohne Beweis bemerken wir: 24 3 DIE MATHEMATIK IN DER MUSIK Bemerkung 3.1. Sind (xn )n∈N und (yn )n∈N konvergente Zahlenfolgen mit limn→∞ xn = x und limn→∞ yn = y, dann gilt auch xn x lim (xn + yn ) = x + y ; lim (xn · yn ) = x · y ; lim = , falls y 6= 0. n→∞ n→∞ n→∞ yn y Es gibt Funktionen, bei denen eine kleine Änderung im Definitionsbereich nur zu einer geringfügigen Änderung des Funktionswerts führt. Formal definiert man Definition 3.3. Sei D ⊂ R. Eine Funktion f : D → R heißt stetig im Punkt a ∈ D, wenn ∀ε > 0∃δ > 0∀x ∈ D : (|x − a| < δ ⇒ |f (x) − f (a)| < ε). Eine Funktion f : D → R heißt stetig, wenn sie in jedem Punkt a ∈ D stetig ist. Da wir uns hier ausschließlich im Reellen befinden, genügt es, sich statt der Definition das folgende Kriterium zu merken: Satz 3.1. Eine Funktion f : D → R ist in a ∈ D genau dann stetig, wenn für jede Folge (xn )n∈N in D, die gegen a konvergiert, die Folge (f (xn ))n∈N der Funktionswerte gegen f (a) konvergiert. Nun zur Differenzierbarkeit. Anschaulich ist durch zwei Punkte (x0 , f (x0 )) und (x, f (x)) des Graphen der Funktion f eine Gerade festgelegt, die durch diese Punk(x0 ) . Diesen Quotienten bezeichnet man te geht. Die Steigung der Geraden ist f (x)−f x−x0 auch als Differenzenquotient. Verschieben wir nun x immer näher an x0 , so wird aus der Sekante im Grenzfall eine Tangente an den Punkt (x0 , f (x0 )), sofern diese existiert. Das bekannteste Beispiel einer in 0 nicht differenzierbaren Funktion ist die Betragsfunktion | · |. Die Steigung der entstehenden Tangente wollen wir als Ableitung der Funktion im Punkt x0 definieren. Definition 3.4. Sei [a, b] ⊂ R. Eine Funktion f : [a, b] → R heißt in x0 ∈ (a, b) differenzierbar, wenn es eine reelle Zahl A gibt, so dass lim x→x0 f (x) − f (x0 ) = A. x − x0 df Der Wert A heißt dann Ableitung von f in x0 und wird mit f 0 (x0 ) oder dx (x0 ) bezeichnet. Die Funktion f heißt differenzierbar, wenn sie in allen Punkten x0 differenzierbar ist. Die Funktion f heißt stetig differenzierbar (in x0 ), wenn sie (in x0 ) differenzierbar und f 0 (in x0 ) stetig ist. Die Funktion f heißt zweimal differenzierbar (in x0 ), wenn f und ihre Ableitung f 0 (in x0 ) differenzierbar sind. Man kann zeigen, dass jede in einem Punkt x0 differenzierbare Funktion auch stetig in x0 ist. Der folgende Satz fasst einige Rechenregeln für Ableitungen zusammen. Satz 3.2. Seien f, g : (a, b) → R in einem Punkt x0 differenzierbare Funktionen und α, β ∈ R. Dann sind auch die Funktionen αf + βg, f · g und, falls g(x0 ) 6= 0, die Funktion fg differenzierbar in x0 . Für die Ableitungen gilt (αf + βg)0 (x0 ) = αf 0 (x0 ) + βg 0 (x0 ) , (f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ) sowie f 0 g (x0 ) = f 0 (x0 ) · g(x0 ) − f (x0 )g 0 (x0 ) . g 2 (x0 ) 3.1 Tonerzeugung 25 Einen Beweis finden Sie in Analysisbüchern. Darin schreibt man zunächst die jeweiligen Differenzenquotienten auf, zerlegt sie in eine Summe von Termen und untersucht die einzelnen Summanden auf Konvergenz. Mit Bemerkung 3.1 folgt dann die Konvergenz des Differenzenquotienten und somit die Differenzierbarkeit. Ferner gilt die Kettenregel: Satz 3.3 (Kettenregel). Ist f : (a, b) → R differenzierbar in (a, b), J = f ((a, b)) = {y ∈ R : ∃x ∈ (a, b) : y = f (x)} und ist g : J → R differenzierbar in J, so ist die Hintereinanderausführung g ◦ f : (a, b) → R, x 7→ g(f (x)) differenzierbar in (a, b) und es gilt die Kettenregel (g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x). Beispiel 3.1. Eine konstante Funktion, d.h. eine Funktion mit f (x) = c für alle x ∈ R und ein c ∈ R, ist differenzierbar mit Ableitung f 0 (x) = 0. Man kann elementar nachrechnen, dass die Funktion f (x) = x differenzierbar ist mit Ableitung f 0 (x) = 1. Durch Induktion nach n folgt daraus mit Satz 3.2, dass auch f (x) = xn für n ∈ N auf R differenzierbar ist P mit f 0 (x) = nxn−1 . Ebenfalls nach Satz 3.2 ist dann auch jedes PolynomP f (x) = nk=0 ak xk = an xn + · · · + a1 x + a0 differenzierbar mit Ableitung f 0 (x) = nk=1 ak kxk−1 = an nxn−1 + · · · + a1 . Ohne Beweis stellen wir weitere Ableitungen verschiedener Funktionen zusammen: exp0 (x) = exp(x) , sin0 (x) = cos(x) , cos0 (x) = − sin(x) , ln0 (x) = 1 . x Sei nun eine Funktion f gegeben, die von zwei Variablen x und y abhänge. Für festes y = y0 können wir f (x, y0 ) als Funktion von x auffassen, für festes x = x0 die Funktion f (x0 , y) als Funktion von y. Beide Funktionen können wir nun gemäß Definition 3.4 auf Differenzierbarkeit untersuchen. Dies führt uns zur nächsten Definition. Definition 3.5. Eine Funktion f : [a, b] × [c, d] → R heißt an einer Stelle (x0 , y0 ) ∈ (a, b) × (c, d) partiell nach x (bzw. y) differenzierbar, wenn bei festgehaltenem y = y0 (bzw. x = x0 ) die Funktion x 7→ f (x, y0 ) (bzw. y 7→ f (x0 , y)) in x0 (bzw. y0 ) differenzierbar ist, wenn also f (x0 + h, y0 ) − f (x0 , y0 ) h bzw. f (x0 , y0 + h) − f (x0 , y0 ) h für h → 0 gegen eine reelle Zahl konvergiert. Der Grenzwert heißt partielle Ableitung nach x in (x0 , y0 ) (bzw. nach y in (x0 , y0 )) und wird mit ∂f ∂f (x0 , y0 ) bzw. (x0 , y0 ) ∂x ∂y bezeichnet. Die Funktion f heißt partiell nach x (bzw. nach y) differenzierbar, wenn sie in allen Punkten (x0 , y0 ) ∈ (a, b) × (c, d) partiell nach x (bzw. y) differenzierbar ist. Das Zeichen „∂“ ersetzt in der partiellen Ableitung das „d“ der klassischen Ableitung und wird „del“ gesprochen. 26 3 DIE MATHEMATIK IN DER MUSIK Beispiel 3.2. Bei den folgenden Berechnungen wird das Beispiel 3.1 herangezogen. a) Wir betrachten die Funktion f (x, y) = 6x2 +5xy −7y 2 +3x+2y −13. Als partielle Ableitungen berechnen wir ∂f (x, y) = 12x + 5y + 3 und ∂x ∂f (x, y) = 5x − 14y + 2. ∂y b) Die Funktion f (x, y) = ln(xy 2 ) ist partiell nach x und y differenzierbar mit partiellen Ableitungen ∂f 1 1 (x, y) = 2 · y 2 = ∂x xy x und ∂f 1 2 (x, y) = 2 · 2xy = . ∂y xy y Hierbei wird u.a. die Kettenregel aus Satz 3.3 verwendet. Wir betrachten nun eine vollkommen elastische und biegsame Saite mit konstanter linearer Massendichte ρ0 (Masse pro Längeneinheit), die an beiden Enden zwischen den Punkte 0 und L fixiert ist. Die konstante Spannung der Saite sei mit S bezeichnet. Wir lenken nun die Saite vertikal aus ihrer Ruhelage aus und wollen die vertikale Auslenkung u = u(t, x) in Abhängigkeit von Zeit und Ort bestimmen. Dabei nehmen wir an, dass die Auslenkung „klein“ ist, so dass horizontale Bewegungen vernachlässigt werden können. Auch gehen wir davon aus, dass sich die Saite wieder vollständig in ihre Ruhelage zurückbewegen kann, also keine plastischen Veränderungen auftreten. Wir betrachten nun ein kleines Stück [x, x + ∆x] der Saite. Unsere Herleitung beruht auf dem Newtonschen Gesetz Kraft = Masse · Beschleunigung. Die Beschleunigung in vertikaler Richtung ist die zweite Ableitung des vertikalen Weges (also der Auslenkung u) nach der Zeit t, d.h. ∂2 u(t, x) = utt (t, x). ∂t2 Also ist (ρ0 ∆x)utt (t, x) die Kraft, die auf das Stück der Saite mit Länge ∆x wirkt. Um eine Differentialgleichung für die Auslenkung u(t, x) zu erhalten, werden wir einen Zusammenhang zwischen der Kraft und der Spannung S herleiten. Seien S(x) und S(x+∆x) die tangentialen Spannungskomponenten an den Punkten x, x+∆x ∈ [0, L]. Sei weiter α der Winkel zwischen der tangentialen Komponente S(x) in x und der Horizontalen und β der entsprechende Winkel in x + ∆x. Daraus ergeben sich die horizontalen Spannungskomponenten, die aufgrund der Annahme den konstanten Wert S haben, also Beschleunigung = S(x + ∆x) cos β = S(x) cos α = S. (∗) Die vertikalen Spannungskomponenten können ebenso leicht ermittelt werden, und die Differenz der beiden stimmt mit der Kraft überein, die wir mit Hilfe des Newtonschen Gesetzes bestimmt haben: S(x + ∆x) sin β − S(x) sin α = (ρ0 ∆x)utt (t, x). (∗∗) ∂ ∂ u(t, x) = ux (t, x) bzw. tan β = ∂x u(t, x+∆x) = Andererseits erhalten wir tan α = ∂x ux (t, x + ∆x). Dividieren wir Gleichung (∗∗) durch S, so folgt mit Gleichung (∗) ρ0 ∆x utt (t, x) = tan β − tan α = ux (t, x + ∆x) − ux (t, x). S Division durch ρ0 ∆x S und Grenzübergang ∆x → 0 liefert den Satz 3.1 Tonerzeugung 27 Satz 3.4. Die Auslenkung einer an beiden Enden fixierten Saite der Länge L mit konstanter linearer Massendichte ρ0 und konstanter Spannung S erfüllt die Wellengleichung utt − c2 uxx = 0 mit Wellengeschwindigkeit c2 = S , ρ0 c > 0. Diese Gleichung geht auf Jean-Baptiste le Rond d’Alembert im Jahre 1746 zurück. Nachdem wir die Wellengleichung hergeleitet haben, wollen wir nun Lösungen dieser Gleichung suchen, die die aus der Fixierung der Saite resultierenden Randbedingungen u(t, 0) = u(t, L) = 0 erfüllen. Hilfreich ist dabei der Ansatz u(t, x) = v(t) · w(x) mit zweimal stetig differenzierbaren Funktionen v und w. Diese erfüllen die Wellengleichung genau dann, wenn v 00 (t)w(x) − c2 v(t)w00 (x) = 0, also w00 (x) v 00 (t) = c2 bis auf Nullstellen der Nenner. v(t) w(x) Die letzte Gleichung kann aber, da die linke Seite nur von t und die rechte Seite nur von x abhängt, nur bestehen, wenn mit einer gewissen Konstante λ gilt v 00 (t) = −c2 λ und v(t) w00 (x) = −λ. w(x) Mit anderen Worten genügen v und w den Gleichungen v 00 (t) + c2 λv(t) = 0 bzw. w00 (x) + λw(x) = 0. (#) Umgekehrt löst u(t, x) = v(t) · w(x) die Wellengleichung, wenn v und w die Gleichungen (#) erfüllen. Durch den Produktansatz u(t, x) = v(t) · w(x) können wir also die Wellengleichung in zwei Gleichungen mit jeweils einer Variable auflösen. Ein derartiger Ansatz wird daher auch Separationsansatz genannt. Da v(t) nicht für alle t Null ist (sonst hätten wir den uninteressanten Fall einer ruhenden Seite), muss w(0) = w(L) = 0 sein. Durch mathematische Überlegungen folgt, dass λ positiv sein muss. Als Lösung der zweiten Gleichung in (#) findet man √ √ w(x) = C1 cos( λx) + C2 sin( λx) , mit beliebigen Konstanten C1 , C2 . Wegen w(0) = 0√muss gelten C1 = 0. Damit auch w(L) = 0 ist, muss gelten √ λ L = nπ bzw. λ = nπ . Entsprechend erhalten wir für v L cnπ cnπ v(t) = C̃1 cos t + C̃2 sin t , mit beliebigen Konstanten C̃1 , C̃2 . L L Zusammenfassend ergibt sich Proposition 3.5. Die Funktionen nπ cnπ cnπ un (t, x) = sin x · An cos t + Bn sin t , n = 1, 2, . . . L L L mit Konstanten An , Bn sind Lösungen der Wellengleichung. 28 3 DIE MATHEMATIK IN DER MUSIK Besondere Bedeutung hat die sog. Grundschwingung, die sich für n = 1 ergibt. Die anderen Lösungen für n = 2, 3, . . . nennt man auch Oberschwingungen. Bemerkung 3.2. Äquivalent ist die Darstellung nπ cnπ un (t, x) = sin x · Cn sin t + ϕn L L mit Phasenverschiebungen ϕn . Ausgenutzt wird hierbei das Additionstheorem sin(α + β) = sin α cos β + cos α sin β. x die Einhüllende der stehenden Welle an, In beiden Fällen gibt der Term sin nπ L der zweite von t abhängige Term beschreibt jeweils die eigentliche Schwingung. Die cn Schwingungen erfolgen mit den Frequenzen fn = 2L und besitzen die Wellenlängen 2L c λ n = fn = n . Leider sind dies jedoch noch nicht alle möglichen Lösungen der Wellengleichung mit u(t, 0) = u(t, L) = 0. Vielmehr kann man mit mathematischen Mitteln zeigen Satz 3.6. Alle Lösungen der Wellengleichung sind von der Form u(t, x) = f (x − ct) + g(x + ct) mit geeigneten zweimal stetig differenzierbaren Funktionen f und g. Der Summand f (x − ct) beschreibt dabei eine nach rechts laufende Welle, der Summand g(x+ct) dagegen eine nach links laufende Welle. Die allgemeine Lösung ergibt sich durch Überlagerung dieser beiden Wellen. Ein weiteres Additionstheorem macht man sich beim Stimmen z.B. einer Geigensaite zunutze. Beim Stimmen wird die Spannung der Saite verändert, was sich auf die Wellengeschwindigkeit c und somit auch auf die Frequenzen fn auswirkt. Wir vergleichen nun die von zwei gleichartigen aber geringfügig verstimmten Saiten gleicher Länge erzeugten Töne. Der Einfachheit halber gehen wir davon aus, dass beide Saiten Schallwellen der Form A sin(2πνt) mit leicht verschiedenen Frequenzen ν1 bzw. ν2 erzeugen. Die Frequenz ν1 sei ohne Einschränkung die größere der beiden Frequenzen. Werden beide Saiten mit gleicher Lautstärke gleichzeitig gespielt, so überlagern sich die entstehenden Schallwellen gemäß A sin(2πf1 t) + A sin(2πf2 t) = 2A sin(π(f1 + f2 )t) · cos(π(f1 − f2 )t). 2 , dessen Lautstärke (Amplitude) mit Es entsteht also ein Ton der Frequenz f1 +f 2 f1 −f2 Frequenz 2 an- und abschwillt. Ein solches Phänomen bezeichnet der Physiker 2 als Schwebung, die Frequenz f1 −f wird daher auch Schwebungsfrequenz genannt. 2 Der Musiker stimmt die Saite nun so lange, bis kein An- und Abschwellen mehr wahrnehmbar ist, bis also annähernd ν1 = ν2 gilt. 3.2 Tonabstände und Stimmungen c Im letzten Abschnitt haben wir bereits die Grundschwingung mit Frequenz f1 = 2L und Wellenlänge 2L einer Geigensaite der Länge L kennengelernt. Halbiert man die Saitenlänge, z.B. durch Einfügen eines Steges, so entsteht ein Ton mit Grundfrequenz 3.2 Tonabstände und Stimmungen 29 c L und Wellenlänge 21 L. Die größere Frequenz steht also zur kleineren im Verhältnis 2:1, die Wellenlängen entsprechend im umgekehrten Verhältnis. Den Abstand – musikalisch auch Intervall genannt – der beiden Töne bezeichnet man als Oktave. Im Zusammenklang werden beide Töne vom Menschen als angenehm empfunden. Durch Verschieben des Stegs kann man untersuchen, für welche Teilungsverhältnisse weitere wohlklingende Tonpaare entstehen. Derartige Experimente wurden bereits von Pythagoras von Samos (ca. 580 v. Chr.-ca. 500 v. Chr.) und seinen Anhängern an einem aus einer Saite bestehenden Instrument namens Monochord durchgeführt. Eine Oktave ergibt sich dort, indem man die Saite im Verhältnis 1:2 teilt und beide Seiten zupft. Ebenfalls gut klingende Intervalle erklingen, wenn man die Saite in den Verhältnissen 2:3 und 3:4 teilt. Die zugehörigen Intervalle heißen Quinte (Seitenverhältnis 2:3) und Quarte (Seitenverhältnis 3:4). Zusammen mit dem Grundton und der Oktave bildeten diese Intervalle den sog. Tetrachord. Platon erklärt das arith= 3 : 2 als Quinte und das harmonische metische Mittel aus dem Oktavsprung 1+2 2 Mittel 2·2·1 = 4 : 4 als Quarte. Quinte und Quarte zusammen ergeben wieder eine 1+2 Oktave, denn (3 : 2) · (4 : 3) = 2 : 1. Durch weiteres Probieren erhält man Intervall Seitenverhältnis Oktave 1:2 Frequenzverhältnis 2:1 Quinte Quarte große Terz kleine Terz Sekunde 2:3 3:4 4:5 5:6 8:9 3:2 4:3 5:4 6:5 9:8 Die Sekunde fällt dabei ein wenig aus dem Rahmen, aber wir können das Verhältnis leicht nachrechnen. Die Sekunde ist der Unterschied zwischen einer Quarte und einer Quinte. Ausgehend von der Quarte müssen wir also ein noch unbekanntes Verhältnis x bilden, um eine Quinte zu erhalten, d.h. 2 2 4 8 3 ·x= ⇒ x= · = . 4 3 3 3 9 Die Pythagoräer machten bei ihren Experimenten zudem folgende Beobachtung: Je komplizierter das Zahlenverhältnis, desto dissonanter wurden die Zweiklänge empfunden. Es war der Pythagoräer Philolaos, der sich genauer mit den Intervallen befasste und eine erstaunliche Entdeckung machte. Er berechnete zuerst das Verhältnis für eine kleine Sekunde, also einen Halbton, als Unterschied h zwischen zwei aufeinanderfolgenden großen Sekunden und der Quarte: 3 3 9 9 243 8 8 · ·h= ⇒ h= · · = . 9 9 4 4 8 8 256 Auf dem Klavier sind nun zwei kleine Sekunden stets eine große Sekunde, zwei Halbtöne ergeben dort also einen Ganzton. Stimmt das auch mathematisch? Zwei Halbtöne hintereinander ergeben das Verhältnis 243 · 243 ≈ 0, 901016235, ein Ganzton 256 256 hat aber das Verhältnis 89 = 0, 8̄. Rechnerisch sind also zwei Halbtöne etwas höher als ein Ganzton. Zu Ehren von Philolaos wird dieser Unterschied auch Pythagoräisches Komma genannt. Es ist das kleine Intervall x zwischen zwei Halbtönen und dem Ganzton, also 243 243 8 8 256 256 524288 · ·x= ⇒ x= · · = . 256 256 9 9 243 243 531441 30 3 DIE MATHEMATIK IN DER MUSIK Euklid hat diese Formel noch ein wenig umgestellt: 1 7 2 12 524288 219 x= = 12 ⇒ ·x= . 531441 3 2 3 Das gleiche Pythagoräische Komma begegnet uns also auch, wenn wir 7 Oktaven mit 12 Quinten vergleichen. Verallgemeinern wir nun das Verfahren, indem wir m Quinten nach oben und n Oktaven nach unten gehen und danach fragen, für welche m und n wir ungefähr zum Ausgangston zurückkommen. Formal suchen wir Näherungslösungen der Gleichung 2 m 2n = 1. 3 Dies ist äquivalent zu 2m+n = 3m . Es ist klar, dass dies nie exakt gelten kann. Durch Logarithmieren erhalten wir (m + n) · log 2 = m · log 3 ⇔ log 3 m+n = ≈ 1, 585. m log 2 Durch eine Kettenbruchentwicklung, die ich hier aber nicht ausführen möchte, ergeben sich für den Bruch die folgenden Näherungswerte: 1 für n = 0 und m = 1 2 für n = 1 und m = 1 3 für n = 1 und m = 2 2 8 für n = 3 und m = 5 5 19 für n = 7 und m = 12 12 65 für n = 24 und m = 41. 41 Die fünfte Zeile ist uns oben schon begegnet und entspricht den 12 Tönen einer Oktave. In der vierten Zeile bestünde mit m = 5 Tönen in einer Oktave zu wenig Auswahl, m = 41 Töne in einer Oktave wären dagegen ziemlich unhandlich. Ein ähnliches Phänomen wie das des Pythagoräischen Kommas tritt auf, wenn man die große Terz (Verhältnis 4:5) mit zwei Ganztonschritten (jeweils Verhältnis 8:9) vergleicht. Auch hier stimmen die entstehenden Intervalle nicht genau miteinander überein. Als Abweichung x berechnet man 8 8 4 4 9 2 81 · ·x= ⇒ x= · = . 9 9 5 5 8 80 Diesen Fehler nennt man das syntonische Komma. Das syntonische Komma tritt ebenfalls auf, wenn man vier Quinten aufwärts und zwei Oktaven abwärts geht und das sich ergebende Intervall mit einer großen Terz vergleicht. Als Unterschied x zwischen diesen beiden Intervallen erhält man nämlich 2 4 4 4 3 4 1 2 81 · 22 · x = ⇒ x= · · = . 3 5 5 2 2 80 Diese Diskrepanzen auszugleichen, führte über die Jahrhunderte zu verschiedenen Stimmungen. 3.2 Tonabstände und Stimmungen 31 Pythagoräische Stimmung Beginnend bei einem Referenzton – hier hat man sich im Laufe der Zeit auf das a mit Frequenz 440 Hz (Schwingungen pro Sekunde) geeinigt – stimmen wir zunächst alle Oktaven rein, d.h. gemäß dem Verhältnis 2:1. Dann stimmt man ausgehend von a alle Quinten im Verhältnis 3:2. Kommen wir aus dem gegebenen Tonumfang hinaus, müssen wir einen Oktave nach unten springen. Nach 12 sauberen Quinten gelangen wir ungefähr wieder zu einem a, hier macht sich allerdings das Pythagoräische Komma bemerkbar, so dass wir das a nicht genau treffen. Diese Diskrepanz nimmt man aber in Kauf. Aufgrund der Dissonanz wird die letzte der 12 Quinten auch Wolfsquinte genannt. Pythagoras zu Ehren nennt man diese Stimmung Pythagoräische Stimmung. Die Stimmung war im Mittelalter gebräuchlich. Man konnte mit ihr zwar einige Tonarten gut spielen, wenn man die schwarzen Tasten möglichst vermieden hat. Das war bei der einfachen Melodik des Mittelalters kein großes Problem. Wenn man aber in eine andere Tonart übergehen wollte, gab es Misstöne. Mitteltönige Stimmung Ab 1450 wurden Terzen in der Musik wichtiger als Quinten, so dass man bestrebt war das syntonische Komma zu beseitigen. Basierend auf den obigen Rechnungen bestand die Grundidee darin, jede Quinte um 14 syntonisches Komma zu vermindern, so dass tatsächlich nach vier Quinten aufwärts und zwei Oktaven abwärts eine reine Terz entsteht. Wie bei der Pythagoräischen Stimmung stimmen jedoch 12 Quinten nicht mit 7 Oktaven überein. Auch nach Aufrechnen mit dem pythagoräischen Komma bleibt immer noch eine Wolfsquinte, die 18 Ton zu weit ist. Diese Stimmung klingt nahe der Ausgangstonart gut, ist aber weit weg davon praktisch nicht mehr spielbar. In der Musikpraxis führte das zur Konstruktion von Orgeln, Cembalos und Klavieren mit zwei verschiedenen Tasten für Zwischentöne wie Des oder Cis. Als Nebeneffekt der Stimmung wiesen verschiedene Tonarten nun verschiedene Charakteristika auf. Irreguläre, wohltemperierte Stimmungen Bekannteste Stimmung dieser Kategorie ist die nach dem Organisten Andreas Werckmeister (1645-1706) benannte Stimmung Werckmeister III. Bei ihr wird das pythagoräische Komma gleichmäßig auf die vier Quinten C-G, G-D, D-A und H-Fis aufgeteilt. Alle anderen Quinten sind rein (d.h. im Frequenzverhältnis 3:2). Aufgrund der unterschiedlich großen Quinten weisen in ihr verschiedene Tonarten ebenfalls verschiedene Toncharakteristika auf. Sie stellt durch die Aufteilung des pythagoräischen Kommas einen ersten Schritt in Richtung gleichschwebender Stimmung dar. Welche Stimmung J. S. Bach verwendete, ist zwar nicht bekannt, Werckmeister III ist aber eine Kandidatin. Weitere bekannte irreguläre Stimmungen stammen z.B. von Kirnberger. Gleichschwebende Stimmung Als weitere Möglichkeit eines Ausgleichs wurde im 18. Jahrhundert die gleichschwebende Stimmung entwickelt. Um das pythagoräische Komma, das nach 12 Quintschritten im Vergleich zur Oktave auftritt, zu beseitigen, wird es einfach gleichmäßig 32 3 DIE MATHEMATIK IN DER MUSIK auf alle 12 Quinten aufgeteilt, die Oktave also in 12 gleiche Halbtonschritte mit Ver√ hältnis 1 : 12 2 unterteilt. In dieser Stimmung ist also abgesehen von der Oktave kein Intervall wirklich rein. Die Abweichungen sind aber so gering, dass sie für das menschliche Ohr immer noch akzeptabel sind. Alle Tonarten sind nun gleichberechtigt spielbar, die bisher existierende Charakteristik der einzelnen Tonarten sind dadurch allerdings nicht mehr vorhanden. Das war auch der Hauptgrund, warum sich diese Stimmung erst im 19. Jahrhundert mit der romantischen Musik durchsetzte. 3.3 Fourier-Analyse In Proposition 3.5 hatten wir gesehen, dass wir für die Wellengleichung durch den Separationsansatz u(t, x) = v(t) · w(x) die Lösungen cnπ cnπ nπ x · An cos t + Bn sin t , n = 1, 2, . . . un (t, x) = sin L L L mit Konstanten An , Bn erhalten. Aufgrund der Rechenregeln für Ableitungen lösen auch Summen dieser Funktionen die Wellengleichung. Derartige Überlagerungen von Schwingungen verschiedener Frequenzen sind auch die Ursache für die Entstehung der verschiedenen Klangfarben von Instrumenten. Umgekehrt lassen sich aber auch allgemeinere periodische Funktionen mit Hilfe der Fouriertransformation in (möglicherweise unendlich viele) Sinus- und Kosinusanteile zerlegen. Um alle HörerInnen auf einen Stand zu bringen, gebe ich zunächst einen Überblick über wichtige Aspekte der Integration. Für eine auf einem Intervall [a, b] definierRb te Funktion f bezeichnet das Integral a f (x) dx die Fläche unter dem Graphen von f zwischen a und b. Diese Fläche kann approximiert werden, indem man das Intervall [a, b] in kleine Teile zerlegt, Recktecke über diese Teile bildet, die gerade über oder unter dem Graphen liegen, und deren Fläche berechnet. Durch Verfeinern der Zerlegung näheren sich – zumindest bei integrierbaren Funktionen – die Werte dieser Ober- und Untersummen R b einander an, im Falle der Existenz bezeichnet man den Grenzwert als Integral a f (x) dx. Formal ist eine Zerlegung ein (r + 1)-Tupel Z = (x0 , x1 , . . . , xr ) mit a = x0 < x1 < · · · < xr−1 < xr = b. Weiter bezeichne mk den kleinsten Wert der Funktion f auf [xk−1 , xk ] und Mk den größten Wert der Funktion f auf [xk−1 , xk ]. Definition 3.6. Sei Z eine Zerlegung des Intervalls [a, b] und f eine auf [a, b] definierte Funktion. Dann heißt r X mk (f (xk ) − f (xk−1 ) SZ = k=1 die Untersumme von f bzgl. der Zerlegung Z und SZ = r X Mk (f (xk ) − f (xk−1 ) k=1 die Obersumme von f bzgl. der Zerlegung Z. Eine beschränkte Funktion f : [a, b] → R heißt (Riemann-)integrierbar, wenn Unter- und Obersumme bei Verfeinerung der Zerlegung gegen Reinen gemeinsamen b Grenzwert konvergieren. Diesen Grenzwert bezeichnet man als a f (x) dx. 3.3 Fourier-Analyse 33 Dabei nennen wir eine Zerlegung Z 0 eine Verfeinerung einer Zerlegung Z, wenn die Zerlegungspunkte xk von Z auch in Z 0 vorkommen. Bemerkung 3.3. Man kann zeigen, dass stetige Funktionen integrierbar sind. Rb Rc Bemerkung 3.4. Jedes Integral a f (x) dx lässt sich in Teilintegrale a f (x) dx + Rb f (x) dx mit beliebigem c ∈ [a, b] zerlegen. c Für Berechnungen ist das Approximieren durch Unter- und Obersumme zu aufwendig. Stattdessen nutzt man den Hauptsatz der Differential- und Integralrechnung, der einen Zusammenhang zwischen Differenzieren und Integrieren herstellt. Darin kommt der Begriff der Stammfunktion vor, der zunächst erläutert werden muss. Definition 3.7. Es sei f : [a, b] → R eine Funktion. Eine Funktion F : [a, b] → R heißt Stammfunktion von f , wenn F differenzierbar ist und F 0 = f . Satz 3.7 (Hauptsatz der Differential- und Integralrechnung). Ist f : [a, b] → R eine stetige Funktion, so gilt: (1) Die Funktion Z x F : [a, b] → R, x 7→ f (t) dt a ist eine Stammfunktion von f . (2) Wenn G eine Stammfunktion von f ist, so gilt b Z a b f (t) dt = Ga = G(b) − G(a). Auf einen Beweis verzichten wir hier, obwohl er nicht sehr kompliziert ist. Im Wesentlichen sagt der Hauptsatz aus, dass die Integration in gewisser Weise die Umkehrung der Differentiation ist. Im Folgenden stelle ich ohne Beweis noch zwei wichtige Integrationsregeln zusammen. Proposition 3.8 (partielle Integration). Sind f : [a, b] → R und g : [a, b] → R stetig und sind F, G Stammfunktionen zu f, g, so gilt: Z a b b f (x)G(x) dx = F · Ga − Z b F (x)g(x) dx. a Proposition 3.9 (Substitutionsregel). Sei f : [a, b] → R stetig und g : [a0 , b0 ] → R stetig differenzierbar mit g(x) ∈ [a, b] für alle x ∈ [a0 , b0 ]. Dann gilt: Z g(b0 ) Z b0 f (y) dy = g(a0 ) f (g(x))g 0 (x) dx. a0 Nun verfügen wir über das für eine Fourier-Analyse nötige Handwerkszeug. Formal definieren wir Definition 3.8. Eine Funktion f : R → R heißt T -periodisch, wenn gilt f (t + T ) = f (t) für alle t ∈ R. 34 3 DIE MATHEMATIK IN DER MUSIK Definition 3.9. Sei f : R → R eine T -periodische, über [0, T ] integrierbare Funktion. Dann heißen die Zahlen Z 2 T ak = f (x) cos(kωx) dx für k ≥ 0 T 0 Z 2 T f (x) sin(kωx) dx für k ≥ 1 bk = T 0 mit ω = 2π T die Fourier-Koeffizienten von f und die Reihe ∞ a0 X + ak cos(kωt) + bk sin(kωt) 2 k=1 Fourierreihe von f . Bemerkung 3.5. Bei der Berechnung der Fourier-Koeffizienten kann das Intervall [0, T ] durch ein anderes Intervall der Länge T ersetzt werden, ohne dass sich der Wert der Integrale ändert. Für 2π-periodische Funktionen ist somit neben der Integration über [0, 2π] auch eine Integration über [−π, π] möglich. Allerdings ist immer darauf zu achten, dass die Funktionsvorschrift richtig eingesetzt wird. Wir schauen uns das Ganze zunächst anhand eines Beispiels an. Beispiel 3.3. Wir betrachten die Funktion f , die auf dem Intervall [−π, π] durch f (t) = t2 gegeben und außerhalb des Intervalls 2π-periodisch fortgesetzt (durch „Aneinanderkleben“ des Parabelteils) sei. Mit Hilfe der Formeln aus Definition 3.9 berechnen wir die Fourier-Koeffizienten. Aufgrund von Bemerkung 3.5 gilt Z 1 x3 π 2 1 π 2 x dx = a0 = = π2 π −π π 3 −π 3 und für k = 1, 2, . . . 2 Z Z π π 1 π 2 2 part. Int. 1 x ak = x cos(kx) dx = sin(kx)−π − x sin(kx) dx π −π π k k −π Z π Z π π 2 2 −x 1 part. Int. = − x sin(kx) dx = − cos(kx)−π + cos(kx) dx kπ −π kπ k k −π π 2 2π 2 4 = (−1)k − 3 sin(kx)−π = 2 (−1)k . kπ k k π k Auf die gleiche Weise kann man auch bk berechnen und erhält bk = 0 für alle k. Schneller ginge es, wenn man sich bewusst macht, dass in bk eine ungerade Funktion, d.h. eine Funktion mit f (−x) = −f (x), über ein um 0 symmetrisches Intervall integriert wird. Dies ergibt jedoch 0. Insgesamt ist die Fourierreihe von f also gegeben durch ∞ π2 X 4 + (−1)k cos(kx). 2 3 k k=1 Wie soeben gesehen, lässt sich der Rechenaufwand verringern, falls die betrachtete Funktion gewisse Symmetrieeigenschaften besitzt. Proposition 3.10. Sei f eine T -periodische über [0, T ] integrierbare Funktion. 3.3 Fourier-Analyse 35 (1) Falls f (−x) = f (x), so ist bk = 0 für alle k ∈ N. Eine Funktion f mit f (−x) = f (x) heißt gerade Funktion. (2) Falls f (−x) = −f (x), so ist ak = 0 für alle k ∈ N ∪ {0}. Eine Funktion f mit f (−x) = −f (x) heißt ungerade Funktion. Beweis. Man überlegt sich leicht, dass cos eine gerade und sin eine ungerade Funktion ist. Beim Multiplizieren zweier gerader bzw. ungerader Funktionen g und h können vier Fälle auftreten: Sind g und h gerade Funktionen, so ist auch das Produkt g · h eine gerade Funktion. Ist eine der beiden Funktionen g und h gerade und die andere ungerade, so ist das Produkt g · h eine ungerade Funktion. Sind g und h ungerade Funktionen, so ist das Produkt g · h wegen g(−x) · h(−x) = (−g(x)) · (−h(x)) = g(x) · h(x) eine gerade Funktion. Für eine ungerade Funktion g gilt T Z T 2 Z g(x) dx = g(x) dx + 0 g(x) dx T -periodisch T 2 Z = Z g(x) dx + 0 Z T 2 = T 2 0 Subst. T Z Z g(x) dx + 0 T 2 g(−t) dt g ungerade = 0 g(x) dx − T2 0. 0 zu (1): Ist f eine gerade Funktion, so ist f · sin ungerade. Folglich gilt 2 bk = T Z T f (x) sin(kωx) dx = 0 für alle k ∈ N. 0 zu (2): Ist f eine ungerade Funktion, so ist f · cos ebenfalls ungerade. Folglich gilt 2 ak = T Z T f (x) cos(nωx) dx = 0 für alle k ∈ N ∪ {0}. 0 Unter welchen Voraussetzungen die Funktion f tatsächlich durch ihre Fourierreihe dargestellt wird, sagt uns der nächste Satz. Der Beweis dieses Satzes würde jedoch den Rahmen der Vorlesung sprengen, so dass wir darauf verzichten wollen. Satz 3.11. Sei f : R → R eine T -periodische, stetige und stückweise stetig differenzierbare Funktion. Dann konvergiert die Fourierreihe ∞ a0 X + (ak cos(kωx) + bk sin(kωx)) 2 k=1 von f (vgl. Definition 3.9) gleichmäßig gegen f . Bemerkung 3.6. Einige Begriffe des Satzes bedürfen der Erklärung: 1. Eine Funktion f heißt stückweise stetig (differenzierbar), wenn sie abgesehen von endlich vielen Ausnahmestellen x1 < x2 < · · · < xm stetig (differenzierbar) ist und in den Ausnahmestellen die rechts- und linksseitigen Grenzwerte existieren. 36 3 DIE MATHEMATIK IN DER MUSIK P 2. Man sagt, dass eine Reihe ∞ k=1 ck konvergiert, wenn die Folge ihrer PartialPN summen k=1 ck konvergiert. 3. Eine Folge (fn ) von Funktionen konvergiert gleichmäßig gegen eine Funktion f , wenn ∀ε > 0∃n0 ∈ N∀n ≥ n0 ∀x ∈ R : |fn (x) − f (x)| < ε, wenn also das n0 , ab dem die Differenz zwischen fn (x) und f (x) betraglich kleiner als das vorgegebene ε ist, unabhängig vom speziellen Wert x gewählt werden kann. Als Anwendung der Fourier-Analyse überlegen wir uns, wie man eine bestimmte Klangfarbe synthetisieren kann. Durch ein Oszilloskop lässt sich ein Klang sichtbar machen. Sinus- und Kosinusschwingungen können durch ein technisches Bauteil namens Oszillator synthetisiert werden, allgemeine Klänge sind hingegen technisch nicht direkt synthetisierbar. Um einen Klang dennoch synthetisieren zu können, zerlegt man daher die gesehene (periodische) Schwingung mittels Fourier-Analyse in ihre Sinus- und Kosinusanteile. Durch Überlagerung der ersten durch die Fourierreihe bestimmten Sinus- und Kosinusschwingungen ergibt sich schon eine relativ gute Näherung an den zu synthetisierenden Klang. Durch Hinzunahme weiterer Schwingungen wird die Näherung immer feiner. Entsteht ein Klang wie hier beschrieben durch Überlagerung von harmonischen Schwingungen (d.h. Sinus- und Kosinusschwingungen), so spricht man auch von additiver Klangsynthese. 3.4 Mathematik als Kompositionshilfe Auf die Verwendung des goldenen Schnitts bei der Komposition sind wir bereits im Abschnitt 2.4 kurz eingegangen. Aber auch in der Motivbearbeitung selbst gibt es Parallelen zur Mathematik. Ein Motiv ist eine kurze Tonfolge, die von den Komponisten häufig nach bestimmten Regeln abgewandelt wird. Diese Transformationen können in einem Tonhöhe-Zeit-Diagramm auch geometrisch gedeutet werden. Häufig verwendete musikalische Methoden sind die Transposition (Ändern der Tonart), der Krebs (Rückwärtsspielen), die Umkehrung (Spiegelung der Noten an einer Notenlinie oder einem Zwischenraum) und die Krebsumkehr (Spiegelung rückwärts gespielt). Geometrisch entspricht die Transposition einer Verschiebung des Motivs in Richtung der Tonhöhen-Achse, der Krebs einer Spiegelung an einer senkrechten Achse, die Umkehr einer Spiegelung an einer waagerechten Achse und die Krebsumkehr einer Doppelspiegelung, die auch als Punktspiegelung aufgefasst werden kann. Daneben kann ein Stück auch durch Wiederholen eines Motivs verlängert werden. Dies lässt sich als Verschiebung in Zeit-Richtung deuten. Ferner stehen dem Komponisten die Techniken der Verkleinerung oder Vergrößerung zur Verfügung. Hierbei werden die Notenwerte eines Motivs um einen gewissen Faktor geändert. Geometrisch entspricht dies einer Stauchung bzw. Dehnung in Zeit-Richtung. Die zuvor beschriebenen Techniken wurden besonders professionell von J. S. Bach angewendet. Darüber hinaus hat Bach anscheinend die Zahl 14, die sich durch Addition der zu den Buchstaben B, A, C und H gehörenden Zahlen 2, 1, 3 und 8 ergibt, besonders geschätzt. Zumindest wird es wohl eher kein Zufall sein, dass sein Werk „Die Kunst der Fuge“ aus 14 Sätzen besteht, er 14 Rätsel-Kanons komponiert hat und auf seinem Trinkpokal 14 Punkte eingraviert sind. 3.4 Mathematik als Kompositionshilfe 37 Durch Anwenden der hier eingeführten Techniken entstehen in den entsprechenden Werken teilweise auch Symmetrien, die manchmal nur schwer oder gar nicht zu hören und im Notenbild nicht immer zu entdecken sind. Mit einer graphischen Analyse lassen sich die Symmetrien jedoch aufdecken. Eine weitere interessante Parallele zur Mathematik ergibt sich, wenn wir die Operationen Transposition, Krebs und Umkehrung noch einmal genauer betrachten. Eine Transposition um n Halbtöne bezeichnen wir mit Tn . Die Operation T5 verschiebt also z.B. ein Motiv um eine Quarte nach oben. Wir können auch negative Zahlen zulassen und Tn dann als Verschiebung des Motivs nach unten interpretieren. Für n = 0 würde das Motiv um 0 Halbtöne verschoben, das Motiv bleibt also unverändert. Bei Verschiebung um eine Oktave ändert sich zwar die Tonhöhe, die Töne selbst bleiben aber unverändert (das C wird beispielsweise zum c, das c zum c’ usw.). Daher unterteilen wir die Transpositionen in verschiedene Klassen, indem wir Verschiebungen um Oktaven zusammenfassen und dafür jeweils einen Vertreter benennen. Beispielsweise bilden T1 , T13 , T25 , . . . aber auch T−11 , T−23 , . . . eine Klasse, für die wir T1 als Vertreter der Klasse wählen. Uns interessieren also im Wesentlichen die Reste bei Division durch 12. Für Transpositionen gilt (im Sinne dieser Klasseneinteilung) Tm Tn = Tm+n ∀m, n ∈ {0, 1, . . . , 11}. (T ) Zwei hintereinander ausgeführte Transpositionen liefern also das gleiche Ergebnis wie eine einzige Transposition, die das Motiv um die Summe der Anzahlen der Halbtöne verschiebt. Die Operation Krebs bezeichnen wir mit K. Offensichtlich gilt KK = T0 , d.h. durch Rückwärtsspielen eines Krebsmotivs ergibt sich wieder das ursprüngliche Motiv. Es leuchtet außerdem ein, dass für alle n gilt KTn = Tn K. (KT ) Der Mathematiker sagt, die beiden Operationen kommutieren. Durch Ausnutzen dieser Eigenschaft können wir beliebige T-K-Kombinationen immer in der Form Tn K schreiben. Beispiel 3.4. Die Operation KT5 KT2 KT8 lässt sich aufgrund der Regeln auch schreiben als KT5 KT2 KT8 Kommutativität = T5 T2 T8 KKK = T5 T2 T8 T0 K = T3 K. Im letzten Schritt wird u.a. benutzt, dass T15 in der gleichen Klasse wie T3 liegt. Aufgrund dieser Eigenschaft gibt es nur 24 verschiedene T-K-Kombinationen. Streng genommen gibt es viele mögliche Umkehrungen, abhängig von der Notenlinie oder dem Notenzwischenraum, an dem man das Motiv spiegelt. Eine beliebige Umkehrung ist aber immer auch darstellbar durch eine Spiegelung am hohen C – die wir im Folgenden U nennen wollen – gefolgt von einer geeigneten Transposition. Im Einzelnen werden durch U folgende Änderungen vorgenommen: C ↔ C , C ] ↔ H , D ↔ B , D] ↔ A , E ↔ A[ , F ↔ G , F ] ↔ G[ (= F ] ) 38 3 DIE MATHEMATIK IN DER MUSIK Die Spiegelung an einer festen waagerechten Achse ist zu sich selbst invers, d.h. es gilt U U = T0 . Die Krebsumkehr entsteht nun durch Hintereinanderausführung der Umkehrung und des Krebses. Hierbei ist die Reihenfolge irrelevant, d.h. es gilt U K = KU. (KU ) Anders verhält es sich bei einer Hintereinanderausführung von Umkehrung und Transposition. Hier gilt i.a. U Tn 6= Tn U . Stattdessen kann man sich überlegen, dass U Tn = T12−n U. (U T ) Daraus folgt, dass U nur mit T6 und T0 kommutiert. Aufgrund dieser Regeln lässt sich jede beliebige Kombination von Transpositionen Tn mit n ∈ {0, 1, . . . , 11}, K und U in einer der Formen Tn , Tn U , Tn K oder Tn U K schreiben. Insgesamt ergeben sich dadurch 48 verschiedene Operationen, die wir zu einer Menge zusammenfassen können. Definition 3.10. Sei G eine nichtleere Menge und ∗ : G×G → G, (a, b) 7→ a∗b eine Verknüpfung. Das Paar (G, ∗) oder kurz G heißt Gruppe, wenn folgende Axiome erfüllt sind: (G1) Für alle a, b, c ∈ G gilt a ∗ (b ∗ c) = (a ∗ b) ∗ c (Assoziativgesetz). (G2) Es gibt ein e ∈ G mit e ∗ a = a ∗ e = a für alle a ∈ G. Das Element e heißt neutrales Element. (G3) Zu jedem a ∈ G gibt es ein inverses Element a−1 ∈ G mit a ∗ a−1 = a−1 ∗ a = e. Für die soeben diskutierten Operationen ergibt sich basierend auf Definition 3.10 folgende Aussage: Satz 3.12. Alle Operationen der Form Tn , Tn U , Tn K und Tn U K mit n ∈ {0, 1, . . . , 11} zusammen mit der Hintereinanderausführung als Verknüpfung bilden eine Gruppe. Beweis. Die Assoziativität ist klar. Als neutrales Element dient T0 . Zudem gilt für alle n ∈ {0, 1, . . . , 11}: (T ) Tn T12−n = T12 = T0 (U T ) also ist T12−n zu Tn invers; (T ) Tn U Tn U = Tn T12−n U U = T0 (KT ) also ist Tn U zu sich selbst invers; (T ) Tn KT12−n K = Tn T12−n KK = T0 (KT ) (U T ) also ist T12−n K invers zu Tn K; (T ) Tn U KTn U K = Tn U Tn KU K = Tn T12−n U U KK = T0 , also ist Tn U K zu sich selbst invers. 3.4 Mathematik als Kompositionshilfe 39 Für Teilmengen von Gruppen definiert man Definition 3.11. Es sei (G, ∗) eine Gruppe und U eine Teilmenge von G. Man nennt U eine Untergruppe von G, wenn U mit der gegebenen Verknüpfung selbst wieder eine Gruppe ist, d.h. wenn gilt: (a) Für alle a, b ∈ U ist a ∗ b ∈ U , d.h. die Menge U ist abgeschlossen bzgl. der Verknüpfung ∗. (b) (U, ∗) ist eine Gruppe. Zum Nachprüfen eignet sich auch das folgende Kriterium. Lemma 3.13. Sei (G, ∗) eine Gruppe. Eine nichtleere Teilmenge U von G ist genau dann eine Untergruppe von G, wenn für alle a, b ∈ U gilt a ∗ b−1 ∈ U . Beweis. „⇒“: Sei U eine Untergruppe von G und bezeichne u0 das neutrale Element in U . Dann folgt −1 −1 u0 = e ∗ u0 = (u−1 0 ∗ u0 ) ∗ u0 = u0 ∗ (u0 ∗ u0 ) = u0 ∗ u0 = e. Das Inverse von a ∈ U ist also in beiden Gruppen dasselbe. Mit b ∈ U liegt nach Voraussetzung auch b−1 in U und mit einem weiteren Element a ∈ U auch a ∗ b−1 . „⇐“: Sei umgekehrt U eine nichtleere Teilmenge, für die die angegebene Bedingung gelte. Aus b ∈ U folgt e = b ∗ b−1 ∈ U und somit b−1 = e ∗ b−1 ∈ U . Für ein weiteres Element a ∈ U gilt also a ∗ b = a ∗ (b−1 )−1 ∈ U . Bedingung (a) der Definition 3.11 ist also erfüllt. Für a, b ∈ U ist also durch (a, b) 7→ a ∗ b eine Verknüpfung auf U gegeben, die als Einschränkung der Verknüpfung auf G ebenfalls assoziativ ist. Nach Definition 3.11 ist U also eine Untergruppe von G. Durch Nachrechnen folgt nun Proposition 3.14. Die Mengen {T0 , T1 U, K, T1 U K} und {T0 , T3 U K, T9 U, T6 K} zusammen mit der Hintereinanderausführung sind Untergruppen der Gruppe aller Operationen. Ebenso ist {T0 , T3 U K, T9 U, T6 K, T6 , K, T9 U K, T3 U } eine Untergruppe. Auch der Zufall, der in der Stochastik genauer untersucht wird, findet gelegentlich Anwendung bei der Komposition. Zur Zeit Mozarts waren Würfelmusiken zur Unterhaltung von Gesellschaften sehr beliebt. Es handelt sich dabei um Systeme vorkomponierter Takte, aus denen durch Würfeln mit Hilfe von Tabellen Kompositionen zusammengestellt wurden. Überliefert sind z.B. die Werke • W. A. Mozart: „Anleitung zum Componieren von Walzern vermittels zweier Würfel ...“, erstmals 1793 (nach Mozarts Tod) erschienen • J. Ph. Kirnberger: „Der allzeit fertige Polonaisen- und Menuettenkomponist“ (1767) Wer Lust bekommen hat, es einmal selbst zu versuchen, kann sich z.B. im Haus der Musik in Wien durch Würfeln seinen eigenen kleinen Walzer komponieren. In der neueren Musik wird der Zufall hingegen noch in anderer Weise eingesetzt. So besteht die Partitur des Werks „Klavierstück XI“ von K. H. Stockhausen aus 18 Taktgruppen, die alle miteinander verknüpfbar sind. Bei der Aufführung geht der Musiker folgendermaßen vor: 40 3 DIE MATHEMATIK IN DER MUSIK • Er schaut absichtslos auf den Papierbogen und beginnt mit irgendeiner zuerst gesehenen Taktgruppe. Diese spielt er mit beliebiger Geschwindigkeit (die klein gedruckten Noten ausgenommen), Grundlautstärke und Anschlagsform. • Ist die erste Gruppe zu Ende, so liest er die folgenden Spielbezeichnungen für Geschwindigkeit, Grundlautstärke und Anschlagsform ab, schaut absichtslos weiter zu irgendeiner anderen Taktgruppe und spielt diese den drei Bezeichnungen gemäß. „Absichtslos“ ist hier im Sinne von zufällig zu verstehen. Um weitere komplexere Anwendungsmöglichkeiten des Zufalls in der Musik zu diskutieren, beschränken wir uns ab jetzt auf den Parameter „Tonhöhe“. Eine Möglichkeit der Komposition besteht nun darin, aus einem gegebenen Vorrat an verschiedenen Tonhöhen sukzessive zufällig Tonhöhen auszuwählen und diese zu einem Musikstück zusammenzusetzen. Die gegebenen Tonhöhen können dabei beliebig gewählt sein oder einem bereits existierenden Werk entnommen sein. Ein derartiges Auswählen von Tonhöhen entspricht in der Stochastik den sog. Urnenmodellen. Möchte man ein Musikstück im Stil eines bestimmten Komponisten kreieren, so hilft die Mathematik auch hierbei. Statistische Analysen verschiedener Werke eines Komponisten wie z.B. Bach zeigen, dass einige Tonintervalle – gemessen in Halbtonschritten – häufiger benutzt werden als andere. Oft trifft man sogar verschiedene Motive – also bestimmte Abfolgen von Intervallen – an, die ebenfalls bei einer Komposition a la Bach verwendet werden sollten. Zur Untersuchung notiert man sich für ein zu untersuchendes Stück zunächst die Abfolge der Intervalle. Anschließend zerlegt man die Intervallfolge in aufeinanderfolgende sich überlappende Ereignisse. Es fällt auf, dass einige Abfolgen häufiger vorkommen als andere. Anhand dieser Daten kann man nun Schätzwerte für die Wahrscheinlichkeiten verschiedener Abfolgen bestimmen. Gibt man noch eine Wahrscheinlichkeitsverteilung der Anfangstöne (Sammlung der Wahrscheinlichkeiten aller möglichen Anfangstöne mit der Nebenbedingung, dass ihre Summe 1 ergibt) an, so hat man mathematisch betrachtet eine Markovkette der Ordnung 1 definiert. Ausgehend von einem mit entsprechender Wahrscheinlichkeit gewählten Anfangston kann man sich z.B. durch Bilden von Zufallszahlen für verschiedene Übergänge entscheiden und auf diese Weise ein komplettes Musikstück zusammensetzen. Analoge Verfahren können auch auf Sequenzen der Längen 3, 4 usw. angewendet werden. In diesen Fällen arbeitet man mit Markovketten der Ordnungen 2, 3 usw. 41 4 Graphentheorie Viele Alltagsprobleme lassen sich mittels Graphen modellieren. Dazu gehört beispielsweise auch das allseits bekannte Problem, das „Haus des Nikolaus“ zu zeichnen, ohne den Stift dabei abzusetzen und eine Linie doppelt zu zeichnen. Ihren historischen Ursprung hat die Graphentheorie in dem später genauer betrachteten Königsberger Brückenproblem, das der schweizer Mathematiker Leonhard Euler (1707-1783) im Jahr 1736 durch die Entwicklung dieser neuen Theorie löste. Angewendet wird die Graphentheorie v.a. in der Logistik, aber auch Materialströme und Arbeitsabläufe in Großbetrieben können mit graphentheoretischen Methoden behandelt werden. 4.1 Grundlagen Als Motivation betrachten wir das Haus des Nikolaus. Es hat die Gestalt: Will man nun das Haus zeichnen, ohne den Stift abzusetzen und eine Linie doppelt zu zeichnen, so muss man links oder rechts unten anfangen, da nur dort drei Linien zusammentreffen. In allen anderen Schnittpunkten treffen zwei oder vier Linien aufeinander – zu diesen Punkten kann man also (ein- oder zweimal) mit dem Stift hinkommen und wieder weggehen, anders als bei den beiden unteren Eckpunkten. Die Zeichnung funktioniert also nur, wenn man in dem einen unteren Eckpunkt startet, in dem anderen endet und zusätzlich noch durch beide einmal hindurchgeht. Mit dem Haus des Nikolaus haben wir im Prinzip den ersten Graph kennengelernt. Allgemein verstehen wir unter einem Graphen ein Gebilde, das aus Ecken und Kanten besteht. Als Graph würde das Haus des Nikolaus folgende Gestalt haben: Der mittlere Punkt ist keine Ecke, sondern nur ein Kreuzungspunkt, an dem kein Richtungswechsel stattfindet. Formal definiert man Definition 4.1. Ein Graph G ist ein geordnetes Paar (V, E); dabei ist V eine Menge und E ist eine Menge zweielementiger Teilmengen von V . Die Elemente der Menge V heißen Ecken oder Knoten des Graphen G und die Elemente von E heißen Kanten von G. 42 4 GRAPHENTHEORIE Die Menge aller zweielementigen Teilmengen von V bezeichnet man auch mit V2 . Die Kanten müssen nicht gerade gezeichnet werden, auch krummlinige Verläufe sind möglich. Ebenso muss nicht jede Ecke mit jeder anderen Ecke verbunden sein (vgl. den höchsten Punkt im Haus vom Nikolaus). Es kann sogar isolierte Ecken geben, die mit keiner weiteren Ecke verbunden sind. Andererseits kann es zwischen zwei Ecken auch mehrere Kanten geben, sie heißen parallele Kanten bzw. Mehrfachkanten. Es darf sogar eine Ecke mit sich selbst verbunden sein, die entsprechende Kante nennt man Schlinge. Zur Abgrenzung wird ein Graph ohne Schlingen und Mehrfachkanten auch als einfacher Graph bezeichnet. Um Mehrfachkanten und Schlingen zu erlauben, muss die Definition geeignet modifiziert werden, da durch sie zunächst nur jeweils eine Kante zwischen zwei Ecken zugelassen ist. Bemerkung 4.1. Damit auch Mehrfachkanten zulässig sind, kann man die Definition wie folgt modifizieren: 1. Die Kanten können statt als Mengen als Funktionen aufgefasst werden, die jedem Paar (u, v) von Ecken eine nicht negative ganze Zahl m(u, v), die Vielfachheit der Kante {u, v} zuordnet. m(u, v) = 0 bedeutet dann, dass zwischen u und v keine Kante vorhanden ist, im Falle m(u, v) = 1 sind u und v durch eine Kante verbunden und für m(u, v) > 1 gibt es mehrere Kanten zwischen u und v. Man würde also den Graphen G als (V, m) mit m : V2 → {0, 1, 2, . . .} definieren. 2. Die elegantere Variante ist, für E eine endliche Menge zu wählen, die von der Eckenmenge V disjunkt ist. Für jede Kante e ∈ E bestimmt man das Paar der Endecken von e. Dies fasst man als Abbildung ε : E → V2 auf und definiert den Graphen durch (V, E, ε). Entsprechend der gewählten Definition kann man auch Schlingen erlauben. In Definition 4.1 kann dies durch Kanten derForm {v} erreicht werden, in 2. durch Erweiterung des Bildbereiches von ε auf V2 ∪ V . Um auch Wege modellieren zu können, die nur in einer Richtung durchlaufen werden dürfen (wie z.B. Einbahnstraßen im Straßennetz) definiert man Definition 4.2. Ein gerichteter Graph G ist ein geordnetes Paar (V, E); hierbei ist V die Menge aller Ecken, die Menge E besteht aus geordneten Paaren von Ecken, also E ⊂ {(u, v) : u, v ∈ V } = V × V . Für eine Kante e = (u, v) bezeichnen wir u als Anfangsknoten und v als Endknoten der Kante e. Die Richtungen in einem gerichteten Graphen werden durch Pfeile dargestellt. Definition 4.3. Ein Graph (bzw. ein gerichteter Graph) G = (V, E) heißt voll V ständig, wenn E = 2 (bzw. E = (V × V )\{(v, v) : v ∈ V }). Ein Graph wird also als vollständig bezeichnet, wenn jede Ecke mit jeder anderen Ecke verbunden ist. Beispiel 4.1. Die Abbildungen zeigen vollständige Graphen mit |V | = 2, |V | = 3, |V | = 4 und |V | = 5. 4.1 Grundlagen 43 Definition 4.4. Ein Graph G0 = (V 0 , E 0 ) heißt Teilgraph eines weiteren Graphen G = (V, E), wenn V 0 ⊂ V und E 0 ⊂ E. Ein Teilgraph G0 = (V 0 , E 0 ) eines Graphen 0 G = (V, E) heißt Untergraph, wenn E 0 = V2 ∩ E. 0 Die Bedingung E 0 = V2 ∩ E besagt, dass eine Kante aus E, die zwei Ecken aus V 0 verbindet, bereits in E 0 liegen muss. Es kann vorkommen, dass in zwei Graphen, die unterschiedlich aussehen, ähnliche Ecken auf die gleiche Art durch Kanten verbunden sind und somit beide Graphen die gleichen Eigenschaften besitzen. Definition 4.5. Zwei Graphen G = (V, E) und G0 = (V 0 , E 0 ) heißen isomorph, wenn es eine bijektive Abbildung f : V → V 0 gibt, so dass {x, y} ∈ E genau dann, wenn {f (x), f (y)} ∈ E 0 für alle x, y ∈ V , x = 6 y gilt. Eine solche Abbildung f heißt ein Isomorphismus der Graphen G und G0 . Wenn G und G0 isomorph sind, schreiben wir G ∼ = G0 . Beispiel 4.2. Die beiden Graphen sind isomorph. Hingegen sind die Graphen nicht isomorph. Die Anzahlen der Ecken und Kanten sind zwar identisch, jedoch sind im linken Graphen keine zwei Ecken, in denen drei Kanten zusammentreffen, benachbart, im rechten allerdings schon. Die Struktur hat sich also geändert. Definition 4.6. Ein Kantenzug (der Länge n) in einem Graphen G = (V, E) ist eine nicht leere Folge (v0 , e0 , v1 , e1 , . . . , en−1 , vn ) von abwechselnd Ecken und Kanten aus G mit ei = {vi , vi+1 } für alle i < n. Ist v0 = vn , so heißt der Kantenzug geschlossen. Sind die Ecken vi eines Kantenzuges paarweise verschieden, so bezeichnet man den Kantenzug auch als Weg. Sind die Ecken v0 , v1 , . . . , vn−1 paarweise verschieden und gilt vn = v0 , so spricht man von einem Kreis. Als Weg kann man z.B. die Route eines Reisenden auffassen: Er startet seine Reise an einem Ort, reist zum nächsten Ort usw. Auf seiner Reise wird er keinen Ort zweimal besuchen wollen, da er ja neue Eindrücke sammeln will. Kehrt der Reisende am Schluss wieder an den Startpunkt zurück, durchläuft er einen Kreis. 44 4 GRAPHENTHEORIE Bemerkung 4.2. Jeder Weg der Länge n ist isomorph zum Graph Pn = (Vn , En ) mit Vn = {0, 1, . . . , n} und En = {{i, i + 1} : i = 0, 1, . . . , n − 1}. Ein Kreis der Länge n ist hingegen isomorph zum Graph Cn = (Vn0 , En0 ) mit Vn0 = {0, 1, . . . , n} und En0 = {{i − 1, i} : i = 1, . . . , n} ∪ {{0, n}}. Definition 4.7. Ein nicht leerer Graph G = (V, E) heißt zusammenhängend, wenn er für je zwei seiner Ecken u, v ∈ V einen Weg von S u nach v enthält. Existieren paarweise disjunkte Mengen Vi , i = 1, . . . , k, mit V = ki=1 Vi , so dass zwei Ecken u und v genau dann durch einen Kantenzug verbunden sind, wenn sie in derselben Menge Vj liegen, so heißen die Mengen Vi Zusammenhangskomponenten von G. Dass die Anzahl der Kanten, die in einer Ecke zusammenlaufen, von Bedeutung ist, haben wir bereits beim Haus vom Nikolaus gesehen. Man definiert Definition 4.8. Sei G ein Graph und v eine Ecke von G. Die Anzahl der Kanten von G, die die Ecke v enthalten, heißt Grad von v in G und wird mit dG (v) abgekürzt. Einen interessanten Zusammenhang zwischen den Graden und der Anzahl der Kanten |E| liefert die folgende Proposition. Proposition 4.1 (Handshake-Lemma). Für jeden Graphen G = (V, E) gilt X dG (v) = 2|E|. v∈V Beweis. dG (v) gibt an, wie viele Kanten es gibt, die v als Eckpunkt enthalten. Jede Kante hat jedoch zwei Ecken, durch Aufsummieren aller Grade werden also alle Kanten doppelt gezählt. Daraus können wir direkt folgern: Korollar 4.2. In jedem Graphen ist die Anzahl der Ecken mit ungeradem Grad eine gerade Zahl. Beweis. Jeder Knoten v ∈ V hat entweder geraden oder ungeraden Grad. Wir können also V auteilen auf die Mengen V1 = {v ∈ V : dG (v) ist ungerade} und V2 = {v ∈ V : dG (v) ist gerade}. Dann ist V1 ∪ V2 = V und V1 ∩ V2 = ∅. Aus dem Handshake-Lemma 4.1 folgt X v∈V1 dG (v) = 2|E| − X dG (v). v∈V2 Da die Summe gerader Zahlen wieder gerade ist, steht auf der rechten Seite eine gerade Zahl. Auf der linken Seite werden jedoch ungerade Zahlen summiert. Damit also auch auf der linken Seite eine gerade herauskommt, muss die Anzahl der Elemente von V1 gerade sein. 4.2 Eulersche Graphen 4.2 45 Eulersche Graphen In diesem Abschnitt werden wir uns das eingangs erwähnte Königsberger Brückenproblem, das Leonhard Euler 1736 löste, genauer ansehen. Königsberg, das heutige Kaliningrad, liegt am Fluss Pregel, der in den Alten und Neuen Pregel geteilt in die Stadt hineinfließt. Um die Insel Kneiphof vereinigen sich die beiden Arme, bevor der Pregel schließlich westlich von Königsberg in die Ostsee mündet. Folgende Zeichnung, die Euler damals anfertigte, verdeutlicht die Situation. Ebenfalls eingezeichnet sind die sieben Brücken, die die verschiedenen Teile Königsbergs verbanden. Abbildung 8: Königsberg und die sieben Brücken über den Pregel Das Königsberger Brückenproblem besteht nun darin, einen Weg durch Königsberg zu finden, der jede Brücke genau einmal überquert und wieder am Startpunkt endet. Um das Problem zu abstrahieren, fasste Euler die einzelnen Teile der Stadt zu Punkten A, B, C und D zusammen. Dies ist ebenfalls in der Zeichnung zu erkennen. Dann ersetzte er die Brücken durch Verbindungslinien zwischen den Punkten und ließ alle weiteren Details weg. Das Ergebnis war ein zu C A D B isomorpher Graph. Definition 4.9. Ein geschlossener Kantenzug (v0 , e1 , v1 , . . . , em−1 , vm−1 , em , v0 ), der jede Kante genau einmal durchläuft, heißt geschlossene Euler-Tour in G. Ein Graph G, der eine geschlossene Euler-Tour enthält, heißt eulersch. Lemma 4.3. Sei G ein Graph mit dG (v) ≥ 2 für alle v ∈ V . Dann enthält G einen Kreis. Beweis. Im Falle einer Schlinge oder von Mehrfachkanten gilt die Behauptung. Sei also G ein Graph ohne Schlingen und Mehrfachkanten. Wir konstruieren dann einen geschlossenen Weg wie folgt: Wähle v0 ∈ V beliebig. In der Ecke v0 laufen mindestens zwei Kanten zusammen, wähle eine davon und nenne sie e1 . Der andere 46 4 GRAPHENTHEORIE Endpunkt der Kante heiße v1 . Neben der bereits durchlaufenen Kante besitzt v1 nach Voraussetzung noch mindestens eine weitere Kante, wähle daraus eine Kante e2 mit Endpunkt v2 . Allgemein wähle man für i ∈ N in vi eine Kante ei+1 mit ei+1 6= {vi−1 , vi }. Der Endpunkt heiße vi+1 . Auf diese Weise entsteht ein Weg, der wegen |V | < ∞ irgendwann einen Knoten zum zweiten Mal erreicht, so dass sich ein Kreis ergibt. Satz 4.4. Ein zusammenhängender Graph G = (V, E) ist genau dann eulersch, wenn alle Ecken geraden Grad haben. Beweis. ⇒: Da eine geschlossene Euler-Tour aus allen Ecken, in die sie hineinführt, auch wieder herausführen muss, sind alle Eckengrade gerade. ⇐: Diese Richtung ist komplizierter. Die Existenz eine geschlossenen Euler-Tour zeigen wir mittels Induktion über die Anzahl k der Kanten. Für k = 1 ist unter den gegebenen Bedingungen nur eine Schlinge möglich, die Behauptung trifft also in diesem Fall zu. Nehmen wir an, das Resultat gelte für alle Graphen mit weniger als k Kanten. Sei G ein zusammenhängender Graph mit k Kanten, so dass der Grad jeder Ecke gerade ist. Da der Graph zusammenhängend ist, ist der Grad jeder Ecke mindestens 2. Nach Lemma 4.3 enthält G einen Kreis C. Wenn wir die Kanten in C aus G entfernen, erhalten wir einen Teilgraphen G0 mit weniger als k Kanten, und alle Ecken dieses Graphen haben einen geraden Grad. Der Graph G0 muss jedoch nicht zusammenhängend sein. Seien also H1 , . . . , Hi die Zusammenhangskomponenten von G0 . Nach der Induktionsannahme enthält jedes Hj eine geschlossene Euler-Tour Wj . Darüber hinaus haben Hj und C eine Ecke vj gemeinsam. Wir können annehmen, dass Wj mit vj anfängt und endet. Nun konstruieren wir eine geschlossene Euler-Tour in G auf folgende Weise: Wir laufen C entlang, bis wir zu einer Ecke vj gelangen. Von hier aus folgen wir der geschlossenen Euler-Tour Wj bis zur Rückkehr nach vj und setzen dann unseren Weg entlang C fort. Da im Graph des Königsberger Brückenproblems alle Ecken ungeraden Grad besitzen, kann es somit keine geschlossene Euler-Tour geben. Folglich existiert kein Rundgang, der über alle Brücken jeweils nur einmal führt und am Startpunkt endet. Auch der Graph des Hauses vom Nikolaus ist nach Satz 4.4 nicht eulersch. Verzichtet man auf die Forderung, dass der gesuchte Kantenzug wieder im Startpunkt enden soll, und bezeichnet den Kantenzug, der jede Kante genau einmal durchläuft, als offene Euler-Tour, so folgt aus Satz 4.4 Korollar 4.5. Ein zusammenhängender Graph G = (V, E) enthält genau dann eine offene Euler-Tour, wenn er genau zwei Knoten ungeraden Grades besitzt. Beweis. Wenn G eine offene Euler-Tour enthält, dann sind der Start- und Endknoten dieses Kantenzuges von ungeradem Grad. Seien umgekehrt u und v die beiden Knoten ungeraden Grades. Wir betrachten den aus G durch Hinzufügen einer Kante zwischen u und v hervorgehenden Graphen G0 . Da nun alle Knoten von G0 geraden Grad besitzen, enthält G0 nach Satz 4.4 eine geschlossene Euler-Tour. Durch Entfernen der soeben hinzugefügten Kante zwischen u und v erhalten wir einen Kantenzug zwischen u und v, der jede Kante genau einmal durchläuft, also eine offene Euler-Tour. Nach Korollar 4.5 enthält das Haus vom Nikolaus also zumindest eine offene EulerTour. In Beispiel 4.4 finden Sie weitere Beispiele eulerscher Graphen. 4.3 Hamiltonsche Graphen 4.3 47 Hamiltonsche Graphen Wir stehen vor einem neuen Problem, wenn wir folgende Situation betrachten. Eine Gruppe Jugendlicher möchte mit einem Euro-Ticket mit der Bahn kreuz und quer durch Europa fahren. Für die Planungen stehe den Jugendlichen der dargestellte Netzplan zur Verfügung. Hamburg Amsterdam Köln Berlin Hannover Brüssel Frankfurt Nürnberg Dresden Prag Paris Stuttgart München Wien Die Fahrt soll in Köln beginnen, durch alle im Netzplan aufgeführten Städte führen und wieder in Köln enden. Dabei soll jede Stadt genau einmal besucht werden. Anders als bei einer Euler-Tour müssen nun aber nicht alle Strecken abgefahren werden. Gibt es einen derartigen Weg überhaupt? Zur Beantwortung der Frage definieren wir zunächst Definition 4.10. Ein geschlossener Kantenzug (v0 , e1 , v1 , . . . , em−1 , vm−1 , em , v0 ), der jede Ecke genau einmal enthält, heißt hamiltonscher Kreis. Ein Graph, der einen hamiltonscher Kreis enthält, heißt hamiltonscher Graph. Benannt sind die hamiltonschen Kreise nach dem irischen Physiker und Mathematiker William Rowan Hamilton (1805-1865), der 1857 ein Spiel erfand, bei dem man die Flächen eines Ikosaeders so ablaufen musste, dass jede Fläche genau einmal besucht wird. Beispiel 4.3. Wir betrachten die beiden Graphen Der linke Graph ist hamiltonsch, der rechte hingegen nicht. Bevor wir uns mit den Eigenschaften hamiltonscher Graphen näher befassen, vergleichen wir sie zunächst mit eulerschen Graphen. Die Definitionen sind recht ähnlich: Bei den eulerschen Graphen sollte jede Kante genau einmal durchlaufen werden, bei hamiltonschen Graphen ist ein geschlossener Kantenzug gesucht, der jede Ecke genau einmal besucht. Trotz dieser Ähnlichkeit handelt es sich bei hamiltonsch und eulersch um zwei verschiedene Eigenschaften. Dies verdeutlicht das folgende Beispiel: 48 4 GRAPHENTHEORIE Beispiel 4.4. Wir betrachten die folgenden Graphen: Der erste Graph ist hamiltonsch und eulersch. Der zweite ist zwar hamiltonsch, aber nicht eulersch. Beim dritten Graphen ist es genau umgekehrt: Er ist eulersch, aber nicht hamiltonsch. Der vierte Graph ist weder hamiltonsch noch eulersch. Für hamiltonsche Kreise ist bis jetzt keine so handliche notwendige und hinreichende Bedingung bekannt wie für Euler-Touren. Wir können uns aber zumindest einige hinreichende Kriterien ansehen. Proposition 4.6. Für alle natürlichen Zahlen n ≥ 3 besitzt der vollständige Graph {1,...,n} Kn = ({1, . . . , n}, ) einen hamiltonschen Kreis. 2 Beweis. Der Kantenzug (1, {1, 2}, 2, {2, 3}, 3, . . . , n − 1, {n − 1, n}, n, {n, 1}, 1) ist ein hamiltonscher Kreis in Kn . Bemerkung 4.3. Die Anzahl hamiltonscher Kreise in einem vollständigen Graph mit n = |V | Ecken (n ≥ 3) beträgt (n−1)! = (n−1)(n−2)···2·1 . Ein beliebiger Graph kann 2 2 (n−1)! also höchstens 2 hamiltonsche Kreise besitzen. Als Vorbereitung auf einige hinreichende Bedingungen betrachten wir das folgende Lemma. Lemma 4.7. Seien u und v zwei nicht benachbarte Knoten eines Graphen G = (V, E) mit dG (u) + dG (v) ≥ |V |. Dann ist G genau dann hamiltonsch, wenn G0 = (V, E ∪ {u, v}) hamiltonsch ist. Beweis. Wenn G hamiltonsch ist, dann natürlich auch G0 . Sei also G0 hamiltonsch mit einem Hamiltonkreis C und |V | = n. Falls C die Kante {u, v} nicht benutzt, so ist C offensichtlich auch ein Hamiltonkreis in G. Sei andernfalls C = (u = v1 , {v1 , v2 }, v2 , . . . , vn−1 , {vn−1 , vn }, vn = v, {v, u}, u). Es genügt nun, einen Index i ∈ {2, . . . , n − 2} zu finden, so dass eR := {u, vi+1 } ∈ E und eL := {vi , v} ∈ E, denn wenn man die Kanten {u, v} und {vi , vi+1 } aus C entfernt und die Kanten eR und eL hinzufügt, erhält man einen Hamiltonkreis in G. v1 = u vn = v v1 = u vn = v vn−1 v2 vn−1 v2 vn−2 v3 vn−2 v3 vi+2 vi−1 vi+2 vi−1 vi vi+1 vi vi+1 4.3 Hamiltonsche Graphen 49 Eine solche „Überkreuzung“ wird aber durch die Bedingung dG (u) + dG (v) ≥ |V | garantiert: Wir setzen R = {i ∈ {2, . . . , n − 2} : {u, vi+1 } ∈ E} und L = {i ∈ {2, . . . , n − 2} : {vi , v} ∈ E}. Wegen L ∪ R ⊂ {2, . . . , n − 2} gilt |L ∪ R| ≤ n − 3. Der Knoten u ist Randknoten der Kante {u, v1 } und der Kanten {u, vj+1 } mit j ∈ R, also gilt |R| = dG (u) − 1. Der Knoten v ist Randknoten der Kante {vn−1 , v} und der Kanten {vj , v} mit j ∈ L, also gilt |L| = dG (v) − 1. Daher folgt |R| + |L| = dG (u) − 1 + dG (v) − 1 ≥ |V | − 2 > n − 3 ≥ |L ∪ R|. Also muss R ∩ L 6= ∅ sein, da sonst Gleichheit gelten würde. Es gibt also einen Index j ∈ {2, . . . , n − 2}, so dass {u, vj+1 }, {vj , v} ∈ E. Mit Hilfe dieses Lemmas lässt sich eine hinreichende Bedingung für die Existenz eines hamiltonschen Kreises in einem gegebenen Graphen herleiten. Satz 4.8 (Ore 1960). Ein einfacher Graph G = (V, E), in dem für je zwei nicht benachbarte Knoten u und v die Ungleichung dG (u) + dG (v) ≥ |V | erfüllt ist, besitzt einen hamiltonschen Kreis. Beweis. Durch sukzessives Ergänzen von Kanten zwischen nicht benachbarten Knoten gelangen wir zu einem vollständigen Graphen G. Dieser ist isomorph zu Kn V mit V = {1, . . . , n} und E = 2 . Nach Proposition 4.6 ist Kn und somit auch G hamiltonsch. Wegen Lemma 4.7 (mehrfach angewendet) muss also auch G einen hamiltonschen Kreis enthalten. Die nächste hinreichende Bedingung formulieren wir als Folgerung des Satzes von Ore, historisch gesehen ist die Aussage jedoch älter als besagter Satz. Korollar 4.9 (Dirac 1952). Ein einfacher Graph G = (V, E) mit dG (u) ≥ alle Knoten u ∈ V besitzt einen hamiltonschen Kreis. |V | 2 für Beweis. Aufgrund der gegebenen Voraussetzungen erfüllt jedes Paar u und v nichtbenachbarter Knoten die Ungleichung dG (u)+dG (v) ≥ |V |. Damit folgt die Behauptung aus dem Satz von Ore (Satz 4.8). Eine notwendige Eigenschaft hamiltonscher Graphen gibt der nächste Satz an. Satz 4.10. Kann der Zusammenhang eines Graphen G durch die Entnahme eines einzigen Knotens und sämtlicher in diesem Knoten endender Kanten zerstört werden, dann besitzt G keinen hamiltonschen Kreis. Beweis. Sei G ein zusammenhängender Graph und bezeichne v einen Knoten mit der Eigenschaft, dass der Graph G0 , der durch Löschen des Knotens v und aller darin endenden Kanten entsteht, nicht zusammenhängend ist, also wenigstens aus den beiden nicht leeren Zusammenhangskomponenten G1 und G2 besteht. Jeder Kreis, der durch sämtliche Knoten von G führt und nicht im Knoten v beginnt, 50 4 GRAPHENTHEORIE muss v mindestens zweimal durchlaufen: Von seinem Ausgangspunkt in der Zusammenhangskomponente G1 bzw. G2 ausgehend, muss der Kreis mindestens einmal zu den Knoten der Komponente G2 bzw. G1 wechseln und von dort in die Komponente G1 bzw. G2 zurückkehren, um tatsächlich alle Knoten von G zu durchlaufen. Dabei wird der Knoten v mindestens zweimal berührt. Hat der Kreis seinen Ausgangspunkt im Knoten v, dann muss er der selben Argumentation folgend mindestens dreimal besucht werden. In beiden Fälle kann es also keinen hamiltonschen Kreis geben. Ein hamiltonscher Graph muss also nach Entfernen einer Ecke und aller Kanten, die darin enden, zusammenhängend bleiben. Die Aussage lässt sich verallgemeinern zu Satz 4.11. Entfernt man in einem hamiltonschen Graphen k Ecken und mit ihnen alle darin endenden Kanten, so zerfällt der Graph in höchstens k Teilgraphen. Diese beiden Aussagen können häufig genutzt werden, um nachzuweisen, dass ein gegebener Graph nicht hamiltonsch ist. Beispiel 4.5. Mit Satz 4.10 können wir begründen, warum der zweite in Beispiel 4.3 gezeigte Graph nicht hamiltonsch sein kann. Entfernt man nämlich die mittlere Ecke samt aller zugehöriger Kanten (in der Zeichnung grau), so zerfällt der Graph in zwei Zusammenhangskomponenten. Der Graph A B ist ebenfalls nicht hamiltonsch, denn wenn man die Ecken A und B samt der zugehörigen Kanten entfernt, zerfällt der Graph in drei Zusammenhangskomponenten. Ein hamiltonscher Graph würde jedoch nach Satz 4.11 nur in maximal zwei Zusammenhangskomponenten zerfallen. Die Sätze von Ore (Satz 4.8) und Dirac (Korollar 4.9) helfen leider nicht dabei, zu entscheiden, ob der eingangs betrachtete Graph des Eisenbahnnetzes hamiltonsch ist. Da z.B. dG (Amsterdam) = 2 < 7 = |V2 | , sind die Voraussetzungen von Korollar 4.9 nicht erfüllt. Ebenso gilt dG (Amsterdam) + dG (Dresden) = 4 < 14 = |V |, so dass auch Satz 4.8 nicht angewendet werden kann. Der Graph ist dennoch hamiltonsch. Ein hamiltonscher Kreis ist in der folgenden Grafik angegeben. 4.4 Kürzeste Wege 51 Hamburg Amsterdam Köln Berlin Hannover Brüssel Frankfurt Nürnberg Dresden Prag Paris Stuttgart München Wien Ein klassisches Anwendungsbeispiel, das dem hier betrachteten Eisenbahnnetz-Problem ähnelt, ist das Problem des Handlungsreisenden (engl.: Traveling Salesman Problem). Ein Vertreter möchte seine Kunden besuchen und dazu seine Reise so organisieren, dass er jede Stadt nur einmal besuchen muss. Stellt man sich die zu besuchenden Städte als Knoten eines Graphen vor und verbindet zwei Knoten, wenn es eine direkte Verbindung zwischen den beiden Städten gibt, so ist eine derartige Rundreise genau dann möglich, wenn der Graph hamiltonsch ist. (Realistischer wird das Problem, wenn man die Kanten des Graphen noch mit Kosten versieht und nach einem hamiltonschen Kreis sucht, der die Gesamtkosten minimiert.) 4.4 Kürzeste Wege Häufig möchte man nicht unbedingt alle Kanten bzw. alle Ecken eines Graphen besuchen, sondern fragt nach dem kürzesten Weg zwischen zwei Ecken u und v. Dieses Problem tritt beispielsweise bei der Routenplanung von einem Ort A zu einem anderen Ort B in einem gegebenen Straßennetz auf. Definition 4.11. Es sei G = (V, E) ein Graph und c : E → R eine Abbildung. Dann wird G auch als bewerteter Graph mit Bewertungsfunktion (bzw. Gewichtsfunktion) c bezeichnet. Für eine Kante e ∈ E nennen wir c(e) die Bewertung (bzw. das Gewicht bzw. die Länge) der Kante e. Ist K = (v0 , e1 , v1 , e2 , v2 , . . . , en , vn ) ein Kantenzug in G, so heißt n X c(K) = c(ei ) i=1 das Gewicht (bzw. die Länge) von K. In grafischen Darstellungen schreibt man die Gewichte an die zugehörigen Kanten. Definition 4.12. Sei G = (V, E) ein bewerteter Graph mit Gewichtsfunktion c. Ein Weg P zwischen zwei Knoten s und t von G heißt kürzester Weg, wenn sein Gewicht c(P ) verglichen mit dem Gewicht jedes anderen Weges zwischen s und t minimal ist. Die Bewertungsfunktion ist relativ abstrakt und lässt daher eine Vielzahl von Interpretationen zu. Beispielsweise können die Kanten mit Preisen, Entfernungen, Zeiten o.ä. bewertet sein. 52 4 GRAPHENTHEORIE Beispiel 4.6. Als Studierende der Universität zu Köln sind Sie höchstwahrscheinlich vertraut mit dem Liniennetz der Kölner Straßen-, U- und S-Bahnlinien. Abbildung 9: Liniennetz der Kölner Straßen-, U- und S-Bahnen, www.kvb-koeln.de Um von einer Station zu einer anderen zu gelangen, werden Sie Ihren Fahrtweg sicherlich optimal wählen wollen. Doch was soll optimiert werden: Zeit, Strecke, Anzahl der Stationen, Umsteigen? Wollte man z.B. die kürzeste Fahrtzeit zwischen zwei Stationen ermitteln, so kann man die Kanten mit der jeweiligen Fahrzeit zwischen den zugehörigen Ecken bewerten und den Weg mit der kleinsten Gesamtfahrzeit suchen. Soll stattdessen die zurückgelegte Strecke minimiert werden, so würde man die Kanten mit der Entfernung zwischen den beiden zugehörigen Ecken versehen. Konkret wollen wir z.B. das Problem betrachten, von der Haltestelle „Universität“ der Linie 9 zur Fachhochschule zu gelangen und dabei möglichst wenige Stationen passieren zu müssen. Die Kanten können wir jeweils mit 1 bewerten. Abbildung 10: Ausschnitt des Liniennetzplanes 4.4 Kürzeste Wege 53 Der direkte Weg wäre, mit der Linie 9 ohne Umsteigen bis zur Haltestelle „Deutz Fachhochschule“ zu fahren. Auf diesem Weg durchfahren wir insgesamt (ohne die Starthaltestelle) 8 Stationen. Dies ist jedoch nicht der kürzeste Weg (im Sinne passierter Haltestellen), denn wenn wir stattdessen an der Dasselstraße/Bf. Süd in die RE-Linien 5, 12, 22 oder die RB-Linien 24, 48 oder die MRB 26 umsteigen, von dort bis zum Bahnhof Deutz fahren und anschließend wieder mit der Linie 1 oder 9 eine Station bis „Deutz Fachhochschule“ fahren, passieren wir lediglich 6 Stationen (von denen eine oder bei der RE 5 oder RE 12 sogar zwei ohne Halt durchfahren werden). Der direkte Weg muss somit nicht immer der kürzeste sein. Doch wie findet man nun einen kürzesten Weg, ohne alle Möglichkeiten auszuprobieren? Sind viele Ecken vorhanden, empfiehlt es sich, das Problem zunächst zu vereinfachen. So können Haltestellen, in denen kein Richtungswechsel möglich ist, eliminiert (in unserem Beispiel etwa die Haltestelle „Mauritiuskirche“) und die jeweiligen Kantenbewertungen angepasst werden. Definition 4.13. Der Abstand dist(u, v) zweier Ecken u und v eines bewerteten Graphen G ist definiert als dist(u, v) = min{c(P ) : P ist Weg von u nach v}. Ferner sei dist(u, u) = 0. Existiert kein Weg von u nach v, so setzt man dist(u, v) = ∞. Bemerkung 4.4. a) Die Definition ist eindeutig, denn auf jeden Fall gibt es nur endlich viele Wege zwischen zwei Ecken, und somit existiert auch das Minimum. Es kann jedoch vorkommen, dass es mehrere verschiedene kürzeste Wege zwischen zwei Ecken gibt. b) Ordnet man jeder Kante eines unbewerteten Graphen die Bewertung 1 zu, so kann man Definition 4.13 auf unbewertete Graphen erweitern. Für zwei Ecken u 6= v, die durch Wege verbunden sind, gibt der Abstand dann die minimale Anzahl von Kanten an, die nötig sind, um von u nach v zu gelangen. Bei negativen Kantenbewertungen kann es vorkommen, dass zwischen zwei Ecken u und v Kantenzüge existieren, deren Länge echt kleiner ist als die Länge des kürzesten Weges von u nach v. Das Phänomen tritt beispielsweise auf, wenn es einen geschlossenen Kantenzug mit negativer Länge gibt. Dieser kann dann beliebig oft durchlaufen werden, wobei die Gesamtlänge jedes Mal sinkt. Negative Kantenbewertungen kommen z.B. in Anwendungen vor, in denen die Bewertungen Gewinne und Verluste darstellen. Um dieses Problem zu vermeiden, werden wir uns auf den Fall nichtnegativer Bewertungen beschränken. In hier betrachteten ungerichteten Graphen ist dies äquivalent dazu, dass es keinen geschlossenen Kantenzug mit negativer Länge gibt. Es gilt Lemma 4.12. Sei G ein bewerteter Graph mit nichtnegativer Bewertungsfunktion c. Sind u und v Ecken von G und W ein kürzester Weg von u nach v, dann gilt für jeden Kantenzug Z von u nach v c(W ) ≤ c(Z); d.h. es gibt einen kürzesten Kantenzug von u nach v, der zu einem Weg zusammengezogen werden kann. 54 4 GRAPHENTHEORIE Beweis. Sei Z ein Kantenzug von u nach v. Wir nehmen an, dass Z kein Weg ist. Dann gibt es eine Ecke w, die in Z mehrfach vorkommt. Bezeichne Z den geschlossenen Kantenzug aus Z vom erstmaligen bis zum zweitmaligen Besuch in w. Nach Voraussetzung ist c(Z) ≥ 0. Entfernt man Z aus Z, so entsteht ein Kantenzug Z1 von u nach v mit c(Z1 ) ≤ c(Z). Auf diese Weise zeigt man, dass es zu jedem Kantenzug Z von u nach v einen einfachen Weg Z 0 von u nach v gibt, so dass c(Z 0 ) ≤ c(Z). Nach Definition von W gilt c(W ) ≤ c(Z 0 ) ≤ c(Z). Die Längen der Kantenzüge sind also nach unten beschränkt. Folglich gibt es einen Kantenzug minimaler Länge, der zu einem Weg zusammengezogen werden kann. Ebenfalls interessant ist die Feststellung, dass Teilstrecken eines kürzesten Weges ebenfalls kürzeste Wege zwischen den entsprechenden Endpunkten sind. Wir formulieren Proposition 4.13. Seien u und v Ecken eines bewerteten Graphen G mit nichtnegativer Bewertungsfunktion, W ein kürzester Weg von u nach v und w eine Ecke von G auf dem Weg W . Dann gilt: dist(u, v) = dist(u, w) + dist(w, v). Insbesondere ist der Teilweg Wuw von u nach w ein kürzester Weg von u nach w. Ferner ist der Teilweg Wwv ein kürzester Weg von w nach v. Beweis. Für w = u und w = v ist die Gleichung trivialerweise erfüllt. Sei also w 6= u und w 6= v. Für den Teilweg Wuw von u nach w und den Teilweg Wwv von w nach v gilt c(Wuw ) ≥ dist(u, w), c(Wwv ) ≥ dist(w, v) und c(Wuw ) + c(Wwv ) = c(W ). Angenommen, es gelte c(Wuw ) > dist(u, w). In dem Fall existiert ein kürzester Weg 0 0 0 Wuw von u nach w mit c(Wuw ) = dist(u, w) < c(Wuw ). Die Wege Wuw und Wwv 0 bilden zusammen einen Kantenzug von u nach v mit der Länge c(Wuw ) + c(Wwv ). Folglich gilt 0 c(Wuw ) + c(Wwv ) < c(Wuw ) + c(Wwv ) = c(W ). Dies widerspricht jedoch der Aussage von Lemma 4.12. Daher ist c(Wuw ) = dist(u, w) und somit Wuw ein kürzester Weg von u nach w. Analog zeigt man c(Wwv ) = dist(w, v). Folglich gilt dist(u, v) = c(W ) = c(Wuw ) + c(Wwv ) = dist(u, w) + dist(w, v). Bei der Suche nach kürzesten Wegen in Graphen unterscheidet man drei verschiedene Probleme: (1) Kürzeste Wege zwischen zwei Ecken (2) Kürzeste Wege zwischen einer Ecke und allen anderen Ecken (3) Kürzeste Wege zwischen allen Paaren von Ecken Besonders interessiert sind wir an einer Lösung von Problem (1). Da ein Verfahren zur Lösung von Problem (2) jedoch auch eine Lösung von Problem (1) liefert und keine besseren Verfahren für Problem (1) bekannt sind als die für (2) optimalen, betrachten wir ein Konstruktionsverfahren für Problem (2). Der vorgestellte sog. 4.4 Kürzeste Wege 55 Algorithmus (eine Handlungsvorschrift zur Lösung eines Problems, die aus mehreren Einzelschritten besteht und in einem Computerprogramm implementiert werden kann) stammt von dem niederländischen Informatiker Edsger Wybe Dijkstra (19302002). Gegeben sei ein bewerteter (gerichteter oder ungerichteter) Graph G = (V, E) mit Bewertungsfunktion c ≥ 0. Zusätzlich sei ein Knoten u ∈ V ausgezeichnet. Mit Hilfe des Dijkstra-Algorithmus wollen wir nun den kürzesten Weg von u zu allen anderen Knoten bestimmen. Dabei wird eine Menge M von Knoten, für deren Elemente v ∈ M wir bereits einen kürzesten Weg von u nach v gefunden haben, schrittweise vergrößert. Der Algorithmus basiert dabei auf Proposition 4.13. Für einen gerichteten Graphen ist der Algorithmus wie folgt definiert: 1. Setze `(u) = 0, M = ∅ und `(v) = ∞ für alle v ∈ V \{u}. 2. Wähle w ∈ V \M mit `(w) = min{`(v) : v ∈ V \M }. 3. Falls `(w) = ∞, dann STOP. Sonst ersetze M durch M ∪ {w}. 4. Für alle v ∈ V \M mit (w, v) ∈ E und `(v) > `(w) + c((w, v)) setze `(v) = `(w) + c((w, v)) sowie Vor(v) = w. 5. Ist V 6= M , so gehe zu Schritt 2. In Schritt 4 bezeichnet Vor(v) = w den Knoten, von dem aus wir zu v gelangt sind. Durch Zusammensetzen erhalten wir kürzeste Wege zu allen Knoten v 6= u. Bemerkung 4.5. 1. Wenn nur ein kürzester Weg von u zu einem bestimmten Knoten v ∈ V gesucht ist, so kann der Algorithmus mit der Aufnahme von v in die Menge M abgebrochen werden. 2. Genau dann, wenn ein Knoten ŵ ∈ V nicht vom Knoten u aus erreichbar ist, endet der Algorithmus mit `(ŵ) = ∞. 3. Der Algorithmus lässt sich auf ungerichtete Graphen übertragen, indem man in Schritt 4 (w, v) durch {w, v} ersetzt. Wir wollen uns das Verfahren anhand eines Beispieles klar machen. Beispiel 4.7. Gegeben sei der folgende gerichtete Graph: 80 a d 40 e 10 50 20 b 50 20 50 c 56 4 GRAPHENTHEORIE Der Startknoten sei a. Gesucht sei ein kürzester Weg nach c. Im ersten Schritt setzen wir nun `(a) = 0, M = ∅ und `(b) = `(c) = `(d) = `(e) = ∞. Der minimale `-Wert im zweiten Schritt ist also `(a) = 0. Wir setzen im dritten Schritt also M = {a}. Im vierten Schritt schauen wir uns dann alle Knoten an, die wir von a aus erreichen können, das sind b und d. Wegen ∞ = `(b) > `(a) + c((a, b)) und analog für d, setzen wir in Schritt 4 `(b) = `(a) + c((a, b) = 0 + 10 = 10 und `(d) = `(a) + c((a, d)) = 0 + 80 = 80 sowie Vor(b) = Vor(d) = a. Die Situation nach dieser ersten Iteration stellt sich wie folgt dar: Knoten ` Vorgänger a b c 0 10 ∞ a d e 80 ∞ a Da wir c noch nicht erreicht haben, müssen wir erneut bei Schritt 2 beginnen. In Schritt 2 wird nun b ausgewählt, da `(b) = 10 im Vergleich zu den anderen Werten – diesmal ohne `(a) – minimal ist. Wir ersetzen also in Schritt 3 M durch {a, b}. Von b aus erreichen wir c und e, wir setzen `(c) = `(b) + c((b, c)) = 10 + 50 = 60 und `(e) = `(b) + c((b, e)) = 10 + 20 = 30 sowie Vor(c) = Vor(e) = b. Nun haben wir Knoten ` Vorgänger a b c d e 0 10 60 80 30 a b a b Da wir auch jetzt noch nicht c in die Menge M aufgenommen haben, müssen wir das Verfahren erneut durchführen. Wegen `(e) < `(c) < `(d) wird in Schritt 2 nun e ausgewählt. Wir setzen somit M = {a, b, e}. Von e aus gelangen wir zu c oder d. Wegen `(c) = 60 > 30+20 = `(e)+c((e, c)) und `(d) = 80 > 30+40 = `(e)+c((e, d)) setzen wir zudem `(c) = `(e) + c((e, c)) = 50 und `(d) = `(e) + c((e, d)) = 70. Die Werte Vor(c) und Vor(d) überschreiben wir mit Vor(c) = Vor(d) = e. Nach dieser Iteration gilt also Knoten ` Vorgänger a b c d e 0 10 50 70 30 a e e b Da c immer noch nicht in M enthalten ist, starten wir erneut bei Schritt 2. Wegen `(c) = 50 < 70`(d) wird nun endlich c ausgewählt und M = {a, b, c, e} gebildet. An dieser Stelle können wir abbrechen, da M nun den gesuchten Zielknoten c enthält. Aneinandersetzen der gefundenen kürzesten (Teil-)Wege liefert den kürzesten Weg (a, (a, b), b, (b, e), e, (e, c), c) und somit dist(a, c) = 50. 80 a d 40 e 10 50 20 b 50 20 50 c 4.4 Kürzeste Wege 57 Im Beispiel haben wir gesehen, dass der Algorithmus funktioniert. Dies wollen wir aber noch formal beweisen. Satz 4.14. Sei G = (V, E) ein gerichteter bewerteter Graph mit nichtnegativer Bewertungsfunktion c und sei u ∈ V . Dann gelten zu jedem Zeitpunkt des Algorithmus: (a) Für jedes v ∈ V \{u} mit `(v) < ∞ gilt Vor(v) ∈ M und `(Vor(v)) + c((Vor(v), v)) = `(v), und die Folge v, Vor(v), Vor(Vor(v)), . . . enthält u. (b) Für jedes v ∈ M gilt `(v) = dist(u, v). Der Algorithmus arbeitet also korrekt. Beweis. Nach Beendigung von Schritt 1 des Algorithmus sind beide Aussagen des Satzes trivialerweise erfüllt. In Schritt 4 wird nur dann `(w) auf `(v) + c((v, w)) reduziert und Vor(w) = v gesetzt, wenn v ∈ M und w 6∈ M . Induktiv zeigt sich, dass die Folge v, Vor(v), Vor(Vor(v)), . . . den Knoten u enthält, aber keinen Knoten außerhalb M , insbesondere auch nicht den Knoten w. Aussage (a) bleibt also in Schritt 4 erhalten. Die Aussage (b) ist trivial für v = u. Wir führen nun eine Induktion über die Anzahl der Elemente von M durch. Da `(w) die Länge eines Weges von u nach w angibt, gilt stets `(w) ≥ dist(u, w). Angenommen, der Knoten w ∈ V \{u} wird in Schritt 3 zu M hinzugefügt, und es gäbe einen kürzesten Weg P von u nach w mit Länge kleiner als `(w), es gelte also dist(u, w) < `(w). Sei y der erste auf P liegende und zu (V \M ) ∪ {w} gehörende Knoten und x der Vorgänger von y auf P . Nach Proposition 4.13 ist der Teilweg von P , der von u nach y führt, ebenfalls ein kürzester Weg von u nach y. Da x ∈ M , folgt mit Schritt 4, der Nichtnegativität der Kantengewichte und der Induktionsvoraussetzung: `(y) ≤ `(x) + c((x, y)) = dist(u, x) + c((x, y)) = dist(u, y) ≤ dist(u, w) < `(w), im Widerspruch zur Wahl von w in Schritt 2. Dass die Nichtnegativität der Kantengewichte eine notwendige Voraussetzung für den Dijkstra-Algorithmus ist, verdeutlicht das folgende Beispiel. Beispiel 4.8. Wir betrachten den gerichteten Graphen 1 u 2 w -2 v Gesucht sei ein kürzester Weg von u nach w. Im ersten Schritt setzt der DijkstraAlgorithmus `(u) = 0, `(v) = `(w) = ∞ und M = ∅. Zunächst wird also u gewählt und zu M hinzugefügt. Im folgenden Schritt werden `(v) = `(u)+c((u, v)) = 0+2 = 2 und `(w) = `(u) + c((u, w)) = 0 + 1 = 1 gesetzt. Im nächsten Duchlauf wählt der Algorithmus wegen `(w) < `(v) den Knoten w und fügt ihn zu M hinzu. An dieser Stelle würden wir nun abbrechen. Der Algorithmus liefert uns also den Weg (u, (u, w), w) der Länge 1. Der Weg über (u, (u, v), v, (v, w), w) besitzt jedoch Länge 0 und ist somit kürzer. Im vorliegenden Fall arbeitet der Algorithmus also nicht korrekt. 58 5 5 DIE MATHEMATIK DER FINANZMÄRKTE Die Mathematik der Finanzmärkte Diese Kapitel fällt ein wenig aus dem Rahmen, aber wie heißt es so schön: Geld regiert die Welt. Aufgrund der Wichtigkeit des Finanzsektors wollen wir an dieser Stelle die Mathematik dahinter ein wenig beleuchten. Der Einfachheit halber konzentrieren wir uns dabei auf ein diskretes Modell, dass einen Handel nur zu bestimmten Zeitpunkten zulässt. 5.1 Ein einführendes Beispiel Wir nehmen an, dass wir es mit einem Markt zu tun haben, in dem es nur erlaubt ist, heute oder in einem Monat zu handeln. In diesem Markt gibt es eine Aktie, die heute für 100 Euro gehandelt wird. In einem Monat wird der Preis entweder auf 130 Euro steigen oder auf 70 Euro sinken. Der Markt (d.h. ein typischer Händler) glaubt, dass die Aktie mit Wahrscheinlichkeit 23 im Wert steigen und mit Wahrscheinlichkeit 1 im Wert fallen wird. Der Einfachheit halber werde Bargeld nicht verzinst (oder 3 der Preis wird gemäß der heutigen Kaufkraft umgerechnet, der Finanzmathematiker nennt das „diskontiert“). Ein Händler benötigt in einem Monat zehn Aktien. Er hat Angst, dass der Preis steigen könnte, und kauft sich daher eine Option auf zehn Aktien zum heutigen Preis. Eine Option ist das Recht, aber nicht die Verpflichtung, eine Aktie zum vereinbarten Preis zu kaufen. Wenn der Preis steigt, dann wird der Händler die Option einlösen und sich zehn Aktien zum Preis von je 100 Euro kaufen. Falls der Preis sinkt, wird der Händler die Option verfallen lassen und sich im Markt zehn Aktien zu je 70 Euro kaufen. Eine solche Option ist natürlich nicht kostenlos. Bis 1972 wurde der Preis wie folgt festgesetzt: Der Händler mach mit Wahrscheinlichkeit 32 (die Aktie steigt) einen Gewinn von 300 Euro, mit Wahrscheinlichkeit 13 macht er keinen Gewinn. Der Preis sollte daher 1 2 · 300 + · 0 = 200 3 3 betragen. Der Verkäufer der Option kauft schon heute fünf Aktien, so dass er, falls der Preis steigt, später nur noch fünf Aktien dazukaufen muss. Daraus ergibt sich folgende Bilanz: + - Optionspreis +200 +200 Optionsgewinn -300 +0 Aktienkauf Aktienverkauf -500 +650 -500 +350 Gewinn +50 +50 Der Verkäufer macht also einen sicheren Gewinn von 50 Euro. Da ein anderer Anbieter auch gerne einen sicheren Gewinn machen möchte, kann man erwarten, dass man die Option billiger erwerben könnte. Da ein funktionierender Markt einen sicheren Gewinn nicht erlauben würde, kann der Preis nicht mehr als 150 Euro betragen. Eine Möglichkeit, einen Gewinn zu erzielen, ohne ein Risiko einzugehen, heißt Arbitrage. Wir sehen uns als nächstes mögliche Strategien an. Nehmen wir an, der Verkäufer kauft θ Aktien. Falls θ negativ ist, bedeutet dies, dass der Verkäufer einen ForwardVertrag abschließt, d.h. in einem Monat −θ Aktien ausliefert, die die Gegenpartei 5.1 Ein einführendes Beispiel 59 heute schon bezahlt. Falls die Aktie steigt, ist der Gewinn dieses Vorgehens (ohne den Optionspreis) −300 − 100θ + 130θ = 30θ − 300. Falls der Preis sinkt, ist der Gewinn 0 − 100θ + 70θ = −30θ. Der minimale Gewinn ist daher min{30θ − 300, −30θ}. Dieser minimale Gewinn ist maximal für θ = 5, das heißt −150. Somit kann der Optionspreis nicht höher als 150 Euro liegen. Der Käufer der Option kann auch in Aktien investieren. Ohne Optionspreis wird der Gewinn 300 − 100θ + 130θ = 300 + 30θ, falls der Preis steigt, und 0 − 100θ + 70θ = −30θ, falls der Preis sinkt. Der minimale Verlust wird maximal, falls θ = −5, das heißt der Gewinn ist 150 Euro. Daher kann die Option nicht billiger als 150 Euro gehandelt werden. Wir haben dadurch den Preis der Option bestimmt. Wie Sie sehen, spielt die Wahrscheinlichkeit, dass der Preis steigt, keine Rolle. Wir haben auf diesem Weg nicht nur den Preis der Option bestimmt, sondern gleichzeitig auch eine Handelsstrategie gefunden, die den Wert der Option erzeugt. Eine derartige Handelsstrategie nennt man Hedging Strategie. Nehmen wir nun an, die Wahrscheinlichkeit, dass die Aktie steigt, sei p. Nach der alten Methode müsste der Preis der Option dann 300p betragen. Dies stimmt mit unserem Preis überein, falls p = 21 . In diesem Fall ist der erwartete Kurs der Aktie in einem Monat 1 1 · 130 + · 70 = 100. 2 2 1 Im Fall p = 2 würde die Aktie in einem Monat im Mittel den heutigen Wert haben, d.h. der Aktienpreis ist ein faires Spiel. Die Mathematiker nennen so ein faires Spiel ein Martingal. Ändern wir nun den Aktienpreis so ab, dass neben 130 und 70 auch der Wert 100 in einem Monat möglich ist. Wir versuchen erneut, eine Hedging Strategie zu finden. Der Gewinn (für den Verkäufer) in den drei möglichen Fällen wird 30θ − 300, 0, −30θ. Das Minimum wird wieder maximal für θ = 5, der Wert der Option darf also nicht höher als 150 Euro liegen. Der Preis darf auch nicht 150 Euro betragen, da der Verkäufer im Fall eines gleichbleibenden Preises einen Gewinn von 150 Euro macht und andernfalls nichts verliert. Der Gewinn für den Käufer wird 30θ + 300, 0, −30θ. 60 5 DIE MATHEMATIK DER FINANZMÄRKTE Dieser Preis wird minimal, falls θ ∈ [−10, 0]. Der Preis sollte also mindestens 0 Euro betragen. Der Preis kann aber natürlich nicht 0 Euro betragen, da sonst eine Arbitragemöglichkeit besteht. Unser Argument liefert uns somit keinen eindeutigen Preis mehr. Falls der Preis nicht 150 Euro beträgt, gibt es auch keine Hedging Strategie für den Verkäufer mehr. Falls der Preis höher als Null liegt, gibt es keine Hedging Strategie mehr für den Halter der Option. Wir hatten im Fall zweier möglicher Preise bemerkt, dass der Preis mit der ’alten Methode’ berechnet werden kann, sofern der Aktienpreis ein faires Spiel ist. Wir nehmen an, der Aktienpreis steige mit Wahrscheinlichkeit p, falle mit Wahrscheinlichkeit q und bleibe mit Wahrscheinlichkeit 1 − p − q unverändert. Dann ist der Preis in einem Monat im Mittel 130 · p + 100 · (1 − p − q) + 70 · q = 100 + 30p − 30q. Dies ist im Mittel der heutige Preis, falls p = q. Damit alle drei Preise möglich sind, müssen wir p ∈ 0, 21 wählen. Die ’alte’ Methode liefert dann den Optionspreis 300 · p + 0 · (1 − p) = 300p. Somit erhalten wir das Intervall (0, 150) als mögliche Preise. Dies ist das gleiche Intervall, das wir auch mit dem „keine Arbitrage“-Argument erhalten haben. 5.2 Einperioden-Modelle Wir betrachten nun n Aktiva, die zur Zeit 0 die Preise q1 , q2 , . . . , qn besitzen. Diese Werte fassen wir in einem Vektor q = (qi ) zusammen. Zur Zeit 1 gebe es s Szenarien. Die Werte der Aktiva fassen wir in der Matrix D = (Dij ) zusammen. Dabei bezeichne Dij den Preis des i-ten Aktivs im j-ten Szenario. Ein Agent kann sich nun ein Portfolio, also eine Sammlung verschiedener Aktiva, zusammenstellen. Formal definiert man Definition 5.1. Ein Portfolio ist ein Vektor θ = (θ1 , . . . , θn ) ∈ Rn , dessen i-te Komponente θi die Stückzahl des i-ten Aktivs angibt. Der Preis des Portfolios ist gegeben durch n X θi qi = θq. i=1 Der Wert des Portfolios im Szenario j ist dann n X θi Dij = (θD)j . i=1 Die einzelnen Werte der Szenarien fassen wir zum Vektor θD zusammen. 5.2 Einperioden-Modelle 61 Bemerkung 5.1. Bei der Definition der Stückzahlen θi werden sowohl nichtganzzahlige als auch negative Werte zugelassen. Während die Zulassung nichtganzzahliger Werte vorwiegend technische Gründe hat, haben negative Werte eine ökonomische Bedeutung. Enthält ein Portfolio etwa eine negative Anzahl θi an Aktien des Typs i, so bedeutet dies, dass |θi | Aktien des Typs i von einer Finanzinstitution geliehen und diese anschließend am Markt verkauft wurden. Damit bestehen beim Verleiher der Aktien Schulden der Höhe θi qi . Beispiel 5.1. Wir betrachten zwei Aktiva. Der erste Aktiv sei eine festverzinsliche Kapitalanlage, der zweite eine Aktie. Zur Zeit 0 habe die festverzinsliche Anlage den Wert q1 = 1 und die Aktie den Wert q2 = 10. Als Portfolio wählen wir θ = (−10, 1). Die Schulden von 10 Stück der festverzinslichen Anlage entspricht eine Kreditaufnahme von 10 Euro. Daneben besitzen wir eine Aktie. Zur Zeit 0 hat unser Portfolio also den Wert θq = (−10) · 1 + 1 · 10 = 0. Zum Zeitpunkt 1 habe die festverzinsliche Anlage den Wert 1,02, was einer Verzinsung von 2% entspricht. Wir nehmen an, dass der Wert der Aktie zur Zeit 1 entweder auf 12 Euro steigen oder auf 9 Euro fallen kann. Die Matrix D hat dann die Form 1, 02 1, 02 D= . 12 9 Steigt die Aktie (Szenario 1), hat das Portfolio den Wert θ1 D11 + θ2 D21 = (−10) · 1, 02 + 1 · 12 = 1, 8. Fällt die Aktie jedoch (Szenario 2), so hat das Portfolio nur den Wert θ1 D12 + θ2 D22 = (−10) · 1, 02 + 1 · 9 = −1, 2. Wichtige von den Finanzprodukten abgeleitete Instrumente, die auch Derivate genannt werden, sind u.a. die im einführenden Beispiel erwähnten Optionen und Forward-Kontrakte. Definition 5.2. Eine Call-Option beinhaltet das Recht, ein bestimmtes Wertpapier zu einem in der Zukunft liegenden Zeitpunkt, dem Fälligkeitszeitpunkt, zu einem heute schon festgesetzten Preis K, dem Basispreis, zu kaufen. Sollte zum Fälligkeitszeitpunkt der Wert der Aktie unterhalb des festgesetzten Preises K liegen, so ist es nicht sinnvoll, die Option auszuüben. Ist hingegen der Wert der Aktie zum Fälligkeitszeitpunkt größer als der festgesetzte Preis, so wird man die Option ausüben, da sich durch sofortigen Weiterverkauf der Aktie zum höheren Marktpreis einen Gewinn erzielen lässt. Bezeichnen wir den Wert der Aktie zum Fälligkeitszeitpunkt mit S, so lautet der Wert der Option bei Fälligkeit somit (S − K)+ = max{S − K, 0}. Betrachten wir auch hier s mögliche Szenarien und bezeichnen den Wert der Aktie in Szenario j mit Sj , so bilden die Werte cj = (Sj − K)+ einen Vektor c, der auch als Auszahlungsprofil bezeichnet wird. 62 5 DIE MATHEMATIK DER FINANZMÄRKTE Definition 5.3. Eine Put-Option beinhaltet das Recht, ein bestimmtes Wertpapier zu einem in der Zukunft liegenden Zeitpunkt, dem Fälligkeitszeitpunkt, zu einem heute schon festgesetzten Preis K, dem Basispreis, zu verkaufen. Analog zur Call-Option lautet der Wert der Put-Option bei Fälligkeit (K − S)+ = max{K − S, 0}, wenn wir den Wert der Aktie zum Fälligkeitszeitpunkt wieder mit S bezeichnen. Das Auszahlungsprofil einer Put-Option besitzt also die Komponenten cj = (K − Sj )+ . Definition 5.4. Ein Forward-Kontrakt ist eine zum Zeitpunkt 0 eingegangene Verpflichtung, ein bestimmtes Wertpapier zu einem in der Zukunft liegenden Zeitpunkt, dem Fälligkeitszeitpunkt, zu einem heute, bei t = 0 festgesetzten Preis F , dem Forward-Preis, zu kaufen. Dabei wird der Forward-Preis so bestimmt, dass das Eingehen der Kauf- bzw. Verkaufsverpflichtung zum Zeitpunkt 0 kostenlos ist. Anders als bei den Call- oder Put-Optionen ist der Käufer eines Forward-Kontraktes zum Kauf verpflichtet, und zwar auch dann, wenn er das betreffende Wertpapier an der Börse billiger erwerben könnte. Der Wert des Forward-Kontrakts bei Fälligkeit ist also einfach S − F. Die Komponenten des Auszahlungsprofils c sind also gegeben durch cj = Sj − F. Der im einführenden Beispiel angedeutete Ansatz zur Bewertung von Derivaten mit Auszahlungsprofil c besteht nun darin, ein Portfolio θ zu finden, das die Gleichung θD = c löst, und den Preis c0 zum Zeitpunkt 0 als c0 = θq zu definieren. Dabei kann es u.U. passieren, dass es ein derartiges Portfolio nicht gibt oder dass das Portfolio nicht eindeutig bestimmt ist. Existiert zu jedem Vektor c ∈ Rn eine Lösung θ der Gleichung θD = c, so heißt das Modell vollständig. Wichtig ist zudem die Erkenntnis, dass in einem sinnvollen Markt gilt „Kein Gewinn ohne Risiko“. Die mathematische Charakterisierung dieses Prinzips wird in der folgenden Definition gegeben. Definition 5.5. Eine Handelsstrategie θ heißt Arbitrage, falls θq < 0 und θD ≥ 0 (alle Koordinaten nichtnegativ); oder falls θq = 0 und θD > 0 (alle Koordinaten nichtnegativ und mindestens eine positiv). Ein Modell, in dem es keine Arbitrage gibt, heißt arbitragefrei. Im ersten Fall wird direkt zu Beginn ein Gewinn realisiert (θq < 0), und auch später (θD ≥ 0) bestehen keine Zahlungsverpflichtungen, es ist eventuell sogar ein Gewinn möglich. Im zweiten Fall kostet das Portfolio anfangs nichts (θq = 0), und auch zum Zeitpunkt 1 bestehen keine Zahlungsverpflichtungen, es besteht sogar die Chance auf einen positiven Gewinn (θD > 0). Äquivalent zu Definition 5.5 kann eine Arbitragegelegenheit auch als ein Portfolio θ ∈ Rn definiert werden, für das gilt (−θq, θD) > 0. (alle Koordinaten nichtnegativ, mindestens eine positiv) 5.2 Einperioden-Modelle 63 Eine Arbitrage sollte in einem Markt nicht existieren. Alle möglichen θ durchzuprobieren, kann sehr aufwendig sein. Wir werden jedoch ein äquivalentes Kriterium für die Arbitragefreiheit beweisen. Die eine Richtung ist Gegenstand des folgenden Satzes. Satz 5.1. Es gibt keine Arbitrage, wenn ein Vektor ψ = (ψ1 , . . . , ψs )> mit positiven Koordinaten existiert, so dass q = Dψ. Beweis. Aus Dψ = q folgt s X θq = θDψ = (θD)j ψj . j=1 Ist θD > 0, d.h. alle Koordinaten (θD)j , j = 1, . . . , s, sind nichtnegativ und eine davon, sagen wir (θD)j0 positiv, so folgt θq > 0 mittels der Positivität der Komponenten ψj . Ist dagegen θD ≥ 0, d.h. alle Komponenten (θD)j sind nichtnegativ, so erhalten wir entsprechend θq ≥ 0. Es kann also keine Arbitrage existieren. Die Rückrichtung ist schwieriger zu beweisen und erfordert einen technischen Hilfssatz, den ich ohne Beweis angeben möchte. Satz 5.2 (Trennungssatz). Sei K eine kompakte und konvexe Teilmenge des Rn und sei V ein Untervektorraum des Rn . Wenn V und K disjunkt sind, so gibt es ein x0 ∈ Rn mit folgenden Eigenschaften: 1. x> 0 x > 0 für alle x ∈ K. 2. x> 0 x = 0 für alle x ∈ V . Daher ist der Unterraum V in einer Hyperebene enthalten, die K nicht schneidet. Satz 5.3. Wenn es keine Arbitrage gibt, dann existiert ein Vektor ψ = (ψ1 , . . . , ψs )> mit positiven Koordinaten, so dass q = Dψ. Beweis. Aufgrund der Arbitragefreiheit gibt es kein θ ∈ Rn mit L(θ) = (−θq, θD) > 0. Die Abbildung L : Rn → Rs+1 ist linear, so dass die Menge L(Rn ) = {L(h) : h ∈ Rn } ein Untervektorraum des Rs+1 ist, der den positiven Quadranten {x ∈ Rs+1 : x > 0} nicht schneidet. Insbesondere schneidet L(Rn ) nicht die kompakte und konvexe Menge M = {x ∈ Rs+1 : x > 0, x0 + · · · + xs = 1}. Also folgt aus Satz 5.2 die Existenz eines φ ∈ Rs+1 mit φ> x = 0 für alle x ∈ L(Rn ) und φ> x > 0 für alle x ∈ M . Wählen wir für x die Einheitsvektoren ej , j = 0, . . . , s, so folgt, dass φ ausschließlich positive Koordinaten besitzt. > s Wir schreiben nun φ = (φ0 , φ> 1 ) mit φ ∈ R und φ1 ∈ R . Damit erhalten wir > 0 = φ> L(h) = (φ0 , φ> 1 )(−θq, θD) = −φ0 (θq) + θDφ1 , also θq = θD φφ01 . Mit ψ = φφ01 gilt ψ ∈ Rs mit ψj > 0 für alle j = 1, . . . , s und θq = θDψ für alle θ ∈ Rn . Daraus folgt q = Dψ. 64 5 DIE MATHEMATIK DER FINANZMÄRKTE Beispiel 5.2. Wir betrachten den Markt mit 1 1, 02 1, 02 q= und D = 10 12 9 aus Beispiel 5.1. Das Gleichungssystem 1, 02 1, 02 ψ1 1 = 12 9 ψ2 10 besitzt die eindeutig bestimmte Lösung 0, 392 ψ= . 0, 588 Nach Satz 5.1 ist der Markt also arbitragefrei. In einem arbitragefreien Markt lässt sich eine einfache und vom Portfolio unabhängige Formel für den Preis eines Aktivs mit Auszahlungsprofil c herleiten. Proposition 5.4. In einem arbitragefreienP Markt ist der Preis c0 eines Finanzprodukts mit Auszahlungsprofil c durch cψ = sj=1 cj ψj gegeben, wobei ψ den Vektor aus den Sätzen 5.1 und 5.3 bezeichnet. Beweis. In einem arbitragefreien Markt gibt es nach Satz 5.3 einen Vektor ψ = (ψ1 , . . . , ψs )> mit positiven Koordinaten, so dass q = Dψ. Mit c = θD gilt dann c0 = θq = θDψ = s X (θD)j ψj = j=1 s X cj ψj = cψ. j=1 Beispiel 5.3. Wir betrachten wieder den Markt aus Beispiel 5.1. Nach Beispiel 5.2 ist der Markt arbitragefrei, da 0, 392 ψ= 0, 588 die Gleichung Dψ = q löst. In diesem Markt betrachten wir eine Call-Option auf die Aktie mit Basispreis 11. Das Auszahlungsprofil dieser Option lautet 1 + c = (S − K) = . 0 Zu bestimmen ist der Preis c0 der Option. Nach dem bisherigen Verfahren berechnen wir zunächst ein replizierendes Portfolio θ als Lösung des Gleichungssystems θD = c. Als Lösung erhalten wir θ = (−2, 941; 0, 3333). Als Preis c0 der Option ergibt sich somit c0 = θq = θ1 + 10θ2 = −2, 941 + 3, 333 = 0, 392. Proposition 5.4 liefert das gleiche Resultat c0 = cψ = 0, 392. Für eine Put-Option mit Basispreis 10,5 lautet das zugehörige Auszahlungsprofil 0 + c = (K − S) = . 1, 5 Mit Hilfe von Proposition 5.4 berechnen wir den Preis c0 = cψ = 1, 5 · 0, 588 = 0, 882. 5.3 Binomialmodelle 5.3 65 Binomialmodelle Wir betrachten zunächst ein Einperioden-Modell mit einem risikolosen Aktiv, dessen Wert zum Zeitpunkt t = 0 durch B0 gegeben sei, und eine Aktie, deren Startwert mit S0 bezeichnet werde. Der risikolose Aktiv werde mit r% verzinst, d.h. zur Zeit t = 1 (also nach der Periode) hat der risikolose Aktiv den Wert B1 = (1 + r)B0 . Weiter wird angenommen, dass sich der Wert der Aktie mit Wahrscheinlichkeit p zu uS0 und mit Wahrscheinlichkeit 1 − p zu dS0 mit u > d > 0 ändert. Ein solches Modell heißt (Einperioden-)Bimomialmodell. Wir wollen das Modell auf Arbitragefreiheit untersuchen. Nach Satz 5.1 und Satz 5.3 ist das Modell genau dann arbitragefrei, wenn das Gleichungssystem Dψ = q eine Lösung mit positiven Komponenten besitzt. Im speziellen Fall hat das Gleichungssystem die Form (1 + r)B0 (1 + r)B0 ψ1 B0 = . uS0 dS0 ψ2 S0 Nach Division der ersten Gleichung durch B0 und der zweiten Gleichung durch S0 ist das Gleichungssystem äquivalent zu 1+r 1+r ψ1 1 = . u d ψ2 1 Daraus folgt 1 = (1 + r)(ψ1 + ψ2 ) 1 = uψ1 + dψ2 . Dieses Gleichungssystem besitzt die Lösung ψ mit Komponenten ψ1 = 1 (1 + r) − d 1+r u−d und 1 u − (1 + r) . 1+r u−d Die Komponenten des Vektors ψ hängen somit nicht von den Anfangskursen B0 und S0 ab. Die Komponenten sind genau dann positiv und das Modell somit arbitragefrei, wenn d < 1 + r < u. ψ2 = Mit q = (1+r)−d u−d und 1 − q = u−(1+r) u−d lässt sich ψ schreiben als 1 ψ= 1+r q . 1−q Dieses Modell lässt sich auf mehrere Perioden erweitern. Der Wert des risikolosen Aktivs ändert sich ausgehend vom B0 zum Startzeitpunkt t = 0 gemäß Bt+1 = (1 + r)Bt . Der Wert der Aktie startet zum Zeitpunkt t = 0 bei S0 . Besitzt die Aktie zum Zeitpunkt t den Wert St , so ändert sich der Wert beim Übergang zum Zeitpunkt t + 1 auf uSt oder auf dSt . Den Pfad nach uSt gewichten wir mit dem Faktor q, den Pfad nach dSt mit dem Faktor q 0 = 1 − q. Auch hier gelte d < u. Jeder Zustand zu einem Zeitpunkt t spaltet sich also in zwei Zustände zum Zeitpunkt t + 1 66 5 DIE MATHEMATIK DER FINANZMÄRKTE auf. Grafisch verzweigen sich die Zustände wie in einem Baum, weshalb man auch von einem Binomialbaum-Modell spricht. Nach n Perioden beinhaltet das Modell 2n mögliche Pfade. In unserem Modell ist es unerheblich, ob sich der Wert der Aktie erst auf uS0 und dann auf dS1 = duS0 ändert oder erst auf dS0 und dann auf uS1 = udS0 . Obwohl es sich also formal um verschiedene Pfade handelt, stimmen die Werte schließlich überein. Nach n Perioden kann die Aktie also nur n+1 verschiedene Werte haben, nämlich Snj = un−j dj S0 , für j = 0, . . . , n. Zu dem Wert Snj gelangt man durch n − j Aufwärts- und durch j 1 n−j (1− Abwärtsbewegungen. Jeder Pfad, der zu diesem Ergebnis führt, ist mit (1+r) nq n q)j gewichtet. Insgesamt existieren j derartige Pfade. Unter Berücksichtigung der Gewichte ergibt sich als Preis für ein Finanzprodukt mit Auszahlungsprofil f (Sn ) = (f (Sn0 ), . . . , f (Snn ))> der Wert n X 1 n n−j c0 = q (1 − q)j f (un−j dj S0 ). n (1 + r) j=0 j Für eine Call-Option mit f (x) = (x − K)+ folgt n X 1 n n−j c0 = q (1 − q)j (un−j dj S0 − K)+ n (1 + r) j=0 j j0 X n n−j 1 = q (1 − q)j (un−j dj S0 − K) n (1 + r) j=0 j j0 j0 n−j j X X K n n−j n n−j d j u − = S0 q (1 − q)j , q (1 − q) n n (1 + r) (1 + r) j j j=0 j=0 wobei j0 die größte natürliche Zahl ≤ n mit der Eigenschaft f (Snj ) = un−j dj S0 −K > qu , so lässt sich dies schreiben als 0 sei. Setzen wir q 0 = 1+r j0 j0 X X n K n n−j 0 n−j 0 j c0 = S0 (q ) (1 − q ) − q (1 − q)j . n j (1 + r) j j=0 j=0 Mit der Verteilungsfunktion Bn,p (k) = k X n j=0 j pj (1 − p)n−j ergibt sich schließlich c0 = S0 Bn,1−q0 (j0 ) − K Bn,1−q (j0 ). (1 + r)n Für eine Put-Option erhalten wir auf ähnliche Weise c0 = K Bn,q (k0 ) − S0 Bn,q0 (k0 ). (1 + r)n Für einen Forward errechnen wir den Preis c0 = S0 − F . (1 + r)n 5.4 Das Black-Scholes-Modell 5.4 67 Das Black-Scholes-Modell Der Börsenkurs einer Aktie fluktuiert sehr stark. Betrachten wir das Binomialmodell aus dem letzten Abschnitt, so geschieht dies auch, wenn wir sehr viele Handelszeitpunkte in einer Sekunde zulassen. In einer Sekunde sehen wir dann so etwas wie den durchschnittlichen Anstieg der Aktie in der Sekunde. Aufgrund des zentralen Grenzwertsatzes der Stochastik ist der Anstieg einer Aktie annähernd normalverteilt. Dies hat Bachelier 1900 dazu veranlasst, die Zuwächse unabhängig und normalverteilt zu modellieren. Etwa 1905 hat Albert Einstein diesen Prozess auch in der Physik eingeführt. Zu Ehren des Botanikers Robert Brown, der 1828 die zufällige Bewegung von Pollen in Wasser beobachtete, wurde der Prozess Brownsche Bewegung genannt. Bezeichne Wt den Wert der Brownschen Bewegung zur Zeit t. Man definiert diese so, dass W0 = 0 und für s < t der Zuwachs Wt − Ws normalverteilt mit Mittelwert 0 und Varianz t − s ist, unabhängig von den vergangenen Werten Wu , u < s. Erst einige Jahre nach der Einführung von Brownschen Bewegungen gelang es Norbert Wiener 1923, die Existenz der Brownschen Bewegung im wahrscheinlichkeitstheoretischen Sinn nachzuweisen. Die Brownsche Bewegung nutzend modellierte Bachelier den Preis einer Aktie durch St = S0 + µt + σWt . Der Faktor µ wird auch Trend und der Faktor σ Volatilität genannt. Die Brownsche Bewegung hat zwei Nachteile: Sie wird mit positiver Wahrscheinlichkeit negativ, und Preisänderungen St − Ss hängen nicht von der Größe von Ss ab. In Wirklichkeit aber beobachtet man stärkere Änderungen, wenn der Preis hoch ist, als wenn er tief ist. Daher sollten die relativen Preisänderungen ähnlich sein und nicht die absoluten. Paul Samuelson hat aus diesem Grund Log-Preise betrachtet, ln St = ln S0 + µt + σWt . Dieses Modell wurde auch von Fisher Black, Myron Scholes und Robert Merton betrachtet. Der Wert einer Aktie wird in ihm durch St = S0 eµt+σWt und der Wert einer risikolosen Anlage durch Bt = B0 ert modelliert. Die grundlegende Idee war, keine-Arbitrage-Argumente zur Berechnung des Werts einer Option anzuwenden. Nehmen wir also an, wir besitzen eine Option, deren Wert zur Zeit t sich durch eine Formel f (St , t) ausdrücken lässt. Die Funktion f (x, t) sei partiell nach x und t differenzierbar gemäß Definition 3.5. In einem kleinen Zeitintervall ∆t ändert sich der Wert der Aktie um ∆x = St+∆t − St . Der Wert der Option ändert sich dann um ∆f (St , t) ≈ ∂f ∂f (St , t)∆x + (St , t)∆t. ∂x ∂t Wenn wir also ∂f (St , t) in die Aktie investieren und den Betrag ∂f (St , t) in den ∂x ∂t risikolosen Aktiv, so ändert sich der Wert unseres Portfolios genau so, wie sich der Wert der Option ändert. Die Strategie funktioniert jedoch nur, wenn ∂f ∂f (St , t)St + (St , t)Bt = f (St , t), ∂x ∂t also wenn der Wert des gewählten Portfolios mit dem Wert der Option übereinstimmt. Wir nehmen an, dies sei nicht der Fall. Ist f (St , t) > ∂f ∂f (St , t)St + (St , t)Bt , ∂x ∂t 68 5 DIE MATHEMATIK DER FINANZMÄRKTE so kauft man, so lange die Bedingung erfüllt ist, das Absicherungsportfolio und verkauft eine Option. Dann bleibt etwas Geld übrig, das man dann in den risikolosen Aktiv investieren kann. Im Moment, wo das Gleichheitszeichen auftritt, verkauft man das Portfolio und kauft sich eine Option. Mit der Option kann man die verkaufte Option abdecken. Aber man hat zusätzlich immer noch den Überschuss, den man am Anfang erwirtschaftet hatte. Also hat man einen risikolosen Gewinn erzielt. Das kann jedoch aufgrund der Arbitragefreiheit nicht sein. Ist ∂f ∂f (St , t)St + (St , t)Bt , f (St , t) < ∂x ∂t so kauft man eine Option und macht Leerverkäufe der Aktiven. Auf diese Weise erzielt man wieder einen risikolosen Gewinn. Folglich muss der Wert der Option gleich dem Wert des Portfolios sein. Mit Hilfe der stochastischen Analysis kann man den Preis der Option berechnen. Der gleiche Preis ergibt sich auch als Grenzwert der Formel im Binomialbaummodell. Satz 5.5 (Black-Scholes-Formel). Die Preisformeln für (europäische) Call- und PutOptionen im Binomialbaummodell konvergieren für n → ∞ gegen die Black-ScholesFormeln C = S0 Φ(d+ ) − e−rc T KΦ(d− ) P = e−rc T KΦ(−d− ) − S0 Φ(−d+ ), wobei rc = ln(1 + r), d± = und ln S0 K + rc ± √ σ T σ2 2 T Z z 1 2 e−y /2 dy Φ(z) = √ 2π −∞ die sog. Verteilungsfunktion der Standardnormalverteilung ist. LITERATUR 69 Literatur [AW05] Adelmeyer, M., Warmuth, E., 2005. Finanzmathematik für Einsteiger: Von Anleihen über Aktien bis Optionen, Vieweg Verlag, 2. Auflage. [AB08] Aigner, M., Behrends, E., 2008. Alles Mathematik: Von Pythagoras zum CD-Player, Verlag Vieweg+Teubner [BGZ08] Behrends, E., Gritzmann, P., Ziegler, G. M. (Hrsg.), 2008. Pi und Co.: Kaleidoskop der Mathematik, Springer-Verlag. [Ben08] Benson, D., 2008. Music: A Mathematical Offering, Cambridge University Press. [BP95] Beutelspacher, A., Petri, B., 1995. Der goldene Schnitt, Spektrum-Verlag, 2. Auflage. [BZ11] Beutelspacher, A., Zschiegner, M.-A., 2011. Diskrete Mathematik für Einsteiger: mit Anwendungen in Technik und Informatik, Verlag Vieweg+Teubner, 4. Auflage. [Dau09] Daume, P. 2009. Finanzmathematik im Unterricht: Aktien und Optionen: Mathematische und didaktische Grundlagen mit Unterrichtmaterialien, Verlag Vieweg+Teubner. [Gla14] Glaeser, G., 2014. Der mathematische Werkzeugkasten: Anwendungen in Natur und Technik, Springer Verlag, 4. Auflage. [GB05] Gritzmann, P., Brandenberg, R., 2005. Das Geheimnis des kürzesten Weges: Ein mathematisches Abenteuer, Springer, 3. Auflage. [Her14] Herrmann, N., 2014. Mathematik und Gott und die Welt, Springer Spektrum. [Kre11] Kremer, J., 2011. Portfoliotheorie, Risikomanagement und die Bewertung von Derivaten, Springer, 2. Auflage. [MM11] Meinel, Ch., Mundhenk, M., 2011. Mathematische Grundlagen der Informatik: Mathematisches Denken und Beweisen. Eine Einführung, SpringerVerlag. [Nit09] Nitzsche, M., 2009. Graphen für Einsteiger: Rund um das Haus vom Nikolaus, Vieweg + Teubner, 3. Auflage. [Rei11] Reimer, M., 2011. Der Klang als Formel: Ein mathematisch-musikalischer Streifzug, Oldenbourg Verlag, 2. Auflage. [Sch12] Schüffler, K., 2012. Pythagoras, der Quintenwolf und das Komma, Vieweg+Teubner Verlag. [War06] Warlich, L., 2006. Grundlagen der Mathematik für Studium und Lehramt, AULA-Verlag GmbH. [Zie13] Ziegler, G. M., 2013. Mathematik – Das ist doch keine Kunst, Knaus-Verlag.