math.did. 25 (2002), Bd.2 3 Viertausend Jahre Mittelwertbildung Eine fundamentale Idee der Mathematik und didaktische Implikationen von Horst Hischer (Saarbrücken) Zusammenfassung: Die Idee der Mittelwertbildung durchzieht die gesamte Mathematik in großer begrifflicher Weite und Vielfalt von ihren ersten Anfängen bei den Babyloniern vor rund 4000 Jahren über die Pythagoreer bis in die heutige Zeit wie ein roter Faden. Sie erweist sich im deskriptiven Sinn als eine fundamentale Idee der Mathematik, die sich auch im normativen Sinn zur vertikalen Gestaltung des Mathematikunterrichts eignet. Summary: The notion of averaging in its numerous variations has been a central theme in all areas of mathematics from its very beginnings in Babylon 4000 years ago to Pythagoreans and the present time. A basic idea in the descriptive sense, it has also proved, in the normative sense, to be useful in teaching mathematics. Es gibt aber drei mittlere Proportionalen in der Musik: erstens die arithmetische, zweitens die geometrische, drittens die reziproke, die man die harmonische nennt. Archytas von Tarent, 428 – 365 v. Chr. 1 1 Vorbemerkung Der Geschichtsschreiber Jamblichus von Chalkis (ca. 250 – 330 n. Chr.) berichtet, dass Pythagoras von seinem Aufenthalt in Mesopotamien (bzw. „Babylonien“, dem Gebiet etwa des heutigen Irak) die Kenntnis der drei „stetigen Proportionen“ und der „musikalischen Proportion“, die man auch die „vollkommene Proportion“ nennt, mitgebracht habe, welche schon ca. 2000 v. Chr. von den Babyloniern für ihre Quadratwurzelapproximationen benutzt worden seien. [Becker 1954, 79] zitiert hierzu Jamblichus aus dessen Kommentar zur „Arithmetik des Nikomachos“: 1 Aus einem Fragment des Archytas von Tarent, zitiert nach [Becker 1954, 78]. 4 H. Hischer Man sagt, daß die vollkommene Proportion den Babyloniern gehöre und durch Pythagoras zuerst zu den Hellenen gelangt sei. Man findet auch, daß viele Pythagoreer von ihr Gebrauch machten, wie Aristaios aus Kroton, der Lokrer Timaios, Philolaos, Archytas von Tarent und andere mehr [...]. Mit dieser „musikalischen“ (bzw. „vollkommenen“) Proportion hängen die drei „klassischen“ und wohl bekanntesten Mittelwerte zusammen: arithmetisches, geometrisches und harmonisches Mittel. Wir müssen dies alles im Zusammenhang mit der Proportionenlehre der griechischen Antike und ihren Vorläufern sehen: 2 Proportionen hat schon die vorgriechische Mathematik betrachtet, z. B. an ähnlichen Dreiecken. Für den Begriff des Verhältnisses hatten nicht nur die Ägypter und Babylonier in dem speziellen Fall der Steigung oder Neigung (Sqt, Ša-gal) besondere Bezeichnungen; sondern die Babylonier wenigstens besaßen schon für den Begriff des Verhältnisses im allgemeinen einen Terminus. Den Pythagoreern waren spätestens im 5. Jahrh. drei Arten von mittleren Proportionalen und natürlich auch die entsprechenden Proportionen bekannt [...] Becker geht anschließend ausführlicher auf das schon eingangs partiell zitierte Fragment des Archytas von Tarent ein und schreibt ergänzend dazu: 3 Die Geschichte dieser Arten von mittleren Proportionalen reicht vermutlich bis in die vorgriechische Zeit zurück. Die babylonische bzw. altindische Methode zur Approximation von Quadratwurzeln [...] benutzt wesentlich die drei Mittel. Und Moritz Cantor schreibt im selben Zusammenhang: 4 J a m b l i c h u s führt die Kenntnis der drei stetigen Proportionen, der arithmetischen, geometrischen und harmonischen, auf Pythagoras und seine Schule zurück und lässt die m u s i k a l i s c h e P r o p o r t i o n , welche aus zwei Zahlen, deren arithmetischem und harmonischem Mittel sich bilde (a : a 2+b = a2ab : b , z. B. 6 : 9 = 8 : 12 ), durch Pythago+b ras aus Babylon, wo sie erfunden worden sei, zu den Hellenen bringen. Es fällt nicht schwer das Auftreten der harmonischen Proportion auch von ägyptischen Anfängen aus zu erklären. [...] Allerdings ist andererseits nicht zu vergessen, dass im alten Aegypten eine Proportionenlehre noch nicht nachgewiesen hat werden können [...]. Wir erinnern ferner daran, dass Jamblichus sich genauer mit Chaldäischem beschäftigte [...] und sind trotz der späten Zeit, in welche seine schriftstellerische Thätigkeit fällt, sehr geneigt diesen seinen Worten so weit Glauben zu schenken, als sie gräkobabylonische Beziehungen betreffen. Was haben wir uns unter diesen „Proportionen“ und „mittleren Proportionalen“ vorzustellen? Wir werden uns mit diesen Inhalten in der gebotenen Kürze befassen. 2 [Becker 1954, 78]; Hervorhebungen nicht im Original. 3 [Becker 1954, 78] mit Bezug auf Platon, Timaois 36 a und Epinomis 991 a b. 4 [Cantor 1894, 155]; Hervorhebungen nicht im Original. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 2 5 Mittelwerte in der Antike und bei den Babyloniern 2.1 Proportionen und Proportionalen bei den Pythagoreern Die nach Pythagoras von Samos (ca. 569 – ca. 475) benannte Schule der „Pythagoreer“ hatte ihre Blütezeit um 500 v. Chr. („ältere Pythagoreer“) und bestand bis in den Anfang des 4. Jahrhunderts v. Chr. („jüngere Pythagoreer“), zuletzt in Unteritalien. Der Zahlbegriff der Pythagoreer, wie er sich z. B. in der arithmetica universalis des Archytas von Tarent (428 – 365 v. Chr.) zeigt, beschränkt sich (in unserer heutigen Sprechweise) (bekanntlich?) 5 auf die von Eins verschiedenen natürlichen Zahlen, die von ihnen als das Wesen aller Dinge angesehen wurden: „Alles ist Zahl“ – die grundlegende Überzeugung der Pythagoreer, wir würden heute auch sagen: ihr Paradigma – bedeutet also, dass alles (?) mit Hilfe von (solchen) „Zahlen“ beschreibbar ist. Damit ist gemeint, dass sich z. B. „Größenverhältnisse“ stets durch „Zahlenverhältnisse“ (im Sinne des o. g. Zahlbegriffs) ausdrücken lassen. Das sei aus heutiger Sicht skizziert: Größen sind z. B. Längen, Flächeninhalte, Volumina, und solche Größen lassen sich vergleichen, sofern sie „von gleichem Typ“, also „gleichartige“ Größen sind (wenn z. B. nur Längen betrachtet werden). Sind a und b gleichartige Größen, so kann (in heutiger Notation) entschieden werden, ob a < b , a = b oder a > b gilt (Trichotomie). Ferner kann a + b und ggf. auch a − b (falls b < a ) gebildet werden. Da Größenverhältnisse durch „Zahlenverhältnisse“ („Zahl“ s. o.) angegeben werden, müssen wir beachten, dass die Pythagoreer in unserer Sichtweise nur „positive“ Größen kannten. Ist nun m eine Zahl (s. o.), und ist a eine Größe, so bedeute für uns m ⋅ a oder kurz ma die aus m Summanden bestehende Summe a + a + … + a (heute würden wir dies induktiv definieren). Sodann könnten wir im Sinne der Pythagoreer „Maß“ und „gemeinsames Maß“ erklären, wenn wir a, b und e als gleichartige Größen voraussetzen (wobei wir mögliche Probleme hier nicht vertiefen): • e wird genau dann ein Maß für a genannt, wenn eine „Zahl“ existiert, so dass a = me gilt. (Man sagt dann auch: „a wird von e gemessen.“) • e wird genau dann ein gemeinsames Maß von a und b genannt, wenn a und b beide von e gemessen werden (wenn es also „Zahlen“ m und n gibt mit a = me und b = ne ). 5 Ich ernte bei Gesprächspartnern oft Erstaunen darüber, dass in der Antike die Eins noch nicht als Zahl aufgefasst worden sei. Doch: Sie ist eben nur die „Einheit“ und keine „Vielheit“, und mit ihr „zählte“ man nicht, denn „Zählen“ beginnt erst mit der Vielheit! 6 H. Hischer Größenverhältnisse und Zahlenverhältnisse werden wir in unhistorischer Weise mit einem Bruchstrich schreiben, der natürlich (noch) nicht die Bedeutung eines Divisionszeichens hat. Sodann könnten wir in heutiger Notation darlegen, was für die Pythagoreer „Größenverhältnis“ und „Zahlenverhältnis“ bedeuteten: • Es seien a und b gleichartige Größen mit einem gemeinsamen Maß e , und ferner seien m und n Zahlen. Dann gilt: a m = :⇔ a = me ∧ b = ne b n Wir beachten, dass hier lediglich eine „Verhältnisgleichheit“ definiert wird, während die „Verhältnisse“ selbst nicht explizit definiert sind. Diese (für uns nützliche) Bruchschreibweise könnten wir jedoch vermeiden, indem wir nur schreiben: a m bedeutet: a und b stehen im selben Verhältnis zueinander wie m und n. = b n Und was dann „im selben Verhältnis zueinander“ bedeuten würde, wird gerade in obiger Definition festgelegt, nämlich: a = me ∧ b = ne . Nun fehlt noch eine Festsetzung darüber, wann zwei Größenverhältnisse gleich sein sollen. Dies ergibt sich in naheliegender Weise wie folgt: • Es seien a, b, c und d gleichartige Größen. Dann gilt: a c a m c m . = ∧ = = :⇔ Es gibt Zahlen m, n mit b d b n d n Wir beachten erneut, dass zwar auch hier die uns vertraute Bruchschreibweise verwendet wird, dass jedoch gar kein Bruchbegriff benötigt wird und ein solcher in diesem Stadium auch gar nicht definiert ist. Wir haben also wiederum nur die Gleichheit zweier abstrakter Verhältnisse definiert (s. o.)! Zugleich erkennen wir in dieser symbolischen Darstellung die Grundüberzeugung der Pythagoreer wieder, nämlich: Alles ist Zahl! Und das bedeutet: Alle Größenverhältnisse lassen sich durch Zahlenverhältnisse ausdrücken! Vom heutigen Standpunkt kannten damit die älteren Pythagoreer (bis zum Zeitpunkt der Entdeckung der Inkommensurabilität – vermutlich durch Hippasos von Metapont, ca. 450 v. Chr.) 6 nur positive rationale Zahlen (in der Form von Zahlenverhältnissen und Größenverhältnissen), was sie in ihrer Proportionenlehre ausbauten – wenngleich solche Verhältnisse für sie keine Zahlen waren, sondern eben nur Zahlenverhältnisse (s. o.). 6 Vgl. [Hischer & Scheid 1982, 5 ff] und [Hischer 2000, 98 ff]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 7 „Proportionen“ sind nun (in unserem Verständnis) i. d. R. Gleichungen zwischen Größenverhältnissen, also etwa wie schon oben ab = dc . Unklar bleibt noch die Bezeichnung „Proportionale“, die uns bereits im Eingangszitat als „mittlere“ Proportionale begegnete. Wir setzen dieses Eingangszitat des Archytas von Tarent fort: 7 [...] Die arithmetische, wenn die drei Zahlterme in der Proportion folgende Differenz aufweisen: um wieviel der erste den zweiten übertrifft, um soviel übertrifft der zweite den dritten. Und bei dieser Proportion trifft es sich, daß das Verhältnis der größeren Zahlterme kleiner, das der kleineren größer ist. Zunächst erkennen wir, wie die Pythagoreer ihre „Proportionen“ (also die Verhältnisgleichungen) kommuniziert haben: nämlich in verbaler Beschreibung (denn unsere heutige Symbolik hat ihre Ursprünge im Wesentlichen erst am Beginn der Neuzeit, insbes. 1591 durch Vieta, einem Formalisten). Und inhaltlich geht es hier um eine spezielle mittlere Proportionale in der Musik, nämlich die „arithmetische“, die wir auch „arithmetisches Mittel“ nennen. (Auf den Zusammenhang mit der Musik gehen wir später ein.) „Mittlere Proportionalen“ sind also Mittelwerte! 2.2 Die drei klassischen Mittelwerte als „mittlere Proportionale“ Beim arithmetischen Mittel spricht Archytas von „drei Zahltermen in der Proportion“ – nennen wir sie der Reihe nach a , b und c (zugleich in abnehmender Größe geordnet). Der erste Zahlterm übertrifft nun den zweiten um a − b und der zweite den dritten um b − c , und somit lautet die „Proportion“ in heutiger Notation a −b = b −c , (1) bei der also b die erwähnte „mittlere Proportionale“ ist. Wir errechnen hieraus a +c (2) b= 2 und nehmen (verwundert?) zur Kenntnis, dass Archytas obige einfache „Differenzengleichung“ als Proportion bezeichnet. 8 Er fährt dann fort: 9 [...] Die geometrische, wenn der erste Term sich zum zweiten wie der zweite zum dritten verhält. Die größeren Terme haben das gleiche Verhältnis wie die kleineren. Hier wird also als weitere mittlere Proportionale in der Musik das geometrische Mittel durch die Proportion a b (3) = b c beschrieben, woraus wir b = ac erhalten. 7 8 9 Aus einem Fragment des Archytas von Tarent, zitiert bei [Becker 1954, 78]. Die Untersuchung der von Archytas erwähnten Ungleichung sei den Lesern überlassen. [Becker 1954, 78] 8 H. Hischer Und schließlich geht Archytas auf das harmonische Mittel als die dritte mittlere Proportionale in der Musik wie folgt ein: 10 [...] Die reziproke Proportion (die man die harmonische nennt), wenn sich die Terme so verhalten: um den wievielten Teil der eigenen Größe der erste Term den zweiten übertrifft, um diesen Teil des dritten übertrifft der Mittelterm den dritten. Bei dieser Proportion ist das Verhältnis der größeren Terme größer, das der kleineren kleiner. Wie ist das mit Hilfe unserer heutigen Symbolsprache verständlich zu machen? a übertrifft b um a − b , und dann ist offenbar (a − b) a der in obigem Zitat erwähnte „Teil der eigenen Größe“; entsprechend ergibt sich für zweiten o. g. „Teil“ (b − c) c , und beide Teile sind nach Archytas’ Beschreibung gleich: a −b b −c = a c 2ac . Hieraus errechnen wir b= a +c Moritz Cantor beschreibt dieselbe Quelle von Archytas wie folgt: 11 Ein bei Porphyrius erhaltenes Bruchstück des Pythagoräers A r c h y t a s spricht nicht nur von dem a r i t h m e t i s c h e n , dem g e o m e t r i s c h e n und dem h a r m o n i s c h e n M i t t e l , er definirt sie gradezu, und zwar die beiden ersten in der heute noch gebräuchlichen Weise. Bei dem harmonischen Verhältnisse, fährt er fort, übertrifft das erste Glied das zweite um den gleichen Theil seiner selbst, wie dieses mittlere Glied das dritte um den Theil des dritten. In Buchstaben geschrieben heisst das: b ist harmonisches Mittel zwischen a und c , wenn a = b + na und zugleich b = c + nc . Wirklich folgt aus diesen beiden Gleichungen ab −−cc = ac und daraus c1 − b1 = b1 − a1 . Diese verbale Beschreibung von Archytas’ Definition des harmonischen Mittels stimmt zwar inhaltlich mit der von Becker überein, die symbolische Umdeutung ist jedoch anders als unsere oben vorgenommene, weil sie wegen der Verwendung des Terms b + na etc. nicht der pythagoreischen Denkweise in Proportionen entspricht, obwohl sie inhaltlich korrekt ist. Sie ist jedoch im Sinne heutiger Denkweise ein naheliegender Interpretationsansatz. Ebenso ist die bei Cantor dann angegebene Gleichung c1 − b1 = b1 − a1 „unhistorisch“. Diese „Reziprokengleichung“ ähnelt a − b = b − c , also derjenigen für das arithmetische Mittel, und sie legt die bei Becker und Cantor verwendete Bezeichnung „reziproke ...“ nahe (vgl. obige Zitate), wenngleich die Namensgebung „harmonisches Mittel“ damit noch unmotiviert bleibt. Hierauf gehen wir später noch ein. 10 [Becker 1954, 78]; die sich anschließende Deutung ist spekulativ. 11 [Cantor 1894, 155] Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 9 2.3 Die drei „stetigen Proportionen“ und die „musikalische Proportion“ Wir sind mehrfach darauf gestoßen, dass bereits die Babylonier die von Archytas beschriebenen Proportionen, also die drei sog. stetigen Proportionen (und damit: arithmetisches, geometrisches und harmonisches Mittel) und die sog. musikalische Proportion gekannt haben müssen, bevor Pythagoras auf seinen Reisen nach Mesopotamien von diesen Kenntnis erlangt hat. 12 Sowohl die archäologischen Befunde als auch die mathematikhistorischen Deutungen legen die Ansicht nahe, dass die Babylonier vor etwa 4000 Jahren mit Hilfe dieser Proportionen ihre Quadratwurzelapproximationen durchgeführt haben, die man auf Keilschrifttafeln entdeckt hat. 13 Wir wollen die entscheidenden Zusammenhänge aus heutiger Sicht darstellen und denken uns zwei gleichartige (positive!) Größen x und y mit x < y gegeben, zu denen wir eine zwischen diesen beiden Größen liegende dritte Größe als deren „Mittelwert“ kennzeichnen wollen. Bezeichnen wir die von Archytas beschriebenen Mittelwerte aus dem Abschnitt 2.2 sinnfällig 14 mit A(x , y ) (arithmetisches Mittel), mit G (x , y ) (geometrisches Mittel) und mit H (x , y ) (harmonisches Mittel), so gilt: 2xy x +y , G (x , y ) = xy , H (x , y ) = (4) A(x , y ) = 2 x +y Und hierbei springt sofort ins Auge: A(x , y ) ⋅ H (x , y ) = xy = (G (x , y )) 2 Diese Gleichung können wir äquivalent umformen zu: x H (x , y ) „musikalische Proportion“: = A(x , y ) y (5) (6) Diese „musikalische Proportion“ lässt sich wie folgt physikalisch realisieren: Man stelle nebeneinander vier auf den gleichen Grundton gestimmte Monochorde M1, M2, M3 und M4 mit jeweils derselben Saitenlänge x auf. Greift man nun bei M1 die Länge y := x 2 ab, bei M2 die Länge A(x, y ) und bei M3 die Länge H (x , y ) , und schlägt man die vier Saitenabgriffe (M4 bleibt in voller Länge!) in der Reihenfolge M1 – M2 – M3 – M4 an (als Arpeggio), so erklingt eine „Kadenz“ — die Tonfolgen M1 – M2 und M3 – M4 bilden dasselbe Intervall, nämlich eine Quinte! 12 Vgl. das Eingangszitat und Abschnitt 1 (dort insbesondere die Fußnoten 2 und 4). 13 Vgl. etwa [Neugebauer 1969, 33 ff]. Mehr dazu im nächsten Abschnitt. 14 So z. B. bei [Hischer & Scheid 1985, 4]. 10 H. Hischer Wegen xy = (G (x , y ))2 liefert also die musikalische Proportion, die ja äquivalent ist zu (5), einen Zusammenhang zwischen den drei klassischen Mittelwerten – sie war für die Pythagoreer daher eine vollkommene (oder: „goldene“ 15) Proportion! Für uns ist es heute ein Leichtes, durch Verknüpfung der Terme aus (4) den Zusammenhang (5) abzuleiten und durch Umformung hieraus (6) zu erhalten. Um so bewundernswerter muss es uns heute erscheinen, dass die „Alten“ die musikalische Proportion (6) ohne die uns zur Verfügung stehenden Termumformungstechniken entdeckt haben. Vermutlich haben die Babylonier diese Entdeckung „nur“ anhand von Beispielen gemacht, was allerdings beeindruckend genug wäre! — Und was hat die musikalische Proportion mit der Approximation von Quadratwurzeln zu tun? 2.4 Der babylonische Algorithmus Zunächst sehen wir bei dem Mathematikhistoriker Otto Neugebauer nach, einem profunden Kenner der vorgriechischen Mathematik. So beschreibt er u. a. eine in Berlin befindliche Keilschrifttafel, in der die Berechnung der Länge der Diagonalen eines rechteckigen Tores von etwa 4 m Höhe und 1 m Breite erläutert wird. Er bezeichnet die Höhe mit h und die Breite mit w, übersetzt die verbalen Berechnungen in heute übliche Formeln und schreibt dann weiter: 16 Irgendeine Erklärung dieser Formeln gibt der Text natürlich nicht, mir scheint aber, daß man sie in folgendem Verfahren finden kann. Auf Grund des Pythagoreischen Lehrsatzes, dessen Kenntnis aus verschiedenen Stellen der mathematischen Keilschrift-Texte einwandfrei für die babylonische Mathematik gesichert ist, folgt, daß d zu berechnen ist durch d = h 2 + w 2 = 0 ; 28, 20 . 17 Nehmen wir nun an, es sei irgendein Näherungswert α1 einer irrationalen Quadratwurzel a bekannt (etwa die Wurzel aus der nächstliegenden Quadratzahl [...]). Dann ist offenbar die Zahl β1 = αa1 wieder eine Approximation von a , und zwar so, daß β1 kleiner als a ist, wenn α1 größer als a war und umgekehrt. Aus den beiden Näherungswerten α1 und β1 erhält man also einen neuen und außerdem günstigeren Näherungswert dadurch, daß man das arithmetische Mittel 15 [Boyer 1968, 61] 16 [Neugebauer 1969, 35]; Hervorhebungen nicht im Original. 17 0; 28, 20 ist die übliche sexagesimale Darstellung für 28 60 + 20 60 2 . Ferner ist zu betonen, dass der Satz des Pythagoras also nicht von Pythagoras stammt, sondern dass er den Babyloniern schon rund 1500 Jahre vorher bekannt war! Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... α2 = 11 α1 + β1 2 aus den beiden ersten Näherungen bildet. Zu diesem α 2 gehört wieder ein auf der anderen Seite von a liegender günstigerer Näherungswert a . α2 Setzt man in β2 den Wert von α 2 ein, so ergibt sich, daß β2 nichts anderes ist als das sog. „harmonische“ Mittel 2α1β1 β2 = α1 + β1 zwischen den ersten Näherungen α 1 und β1 . Dieses Verfahren läßt sich natürlich fortführen und liefert sehr bald sehr gute Approximationen von a . Es ist aus dem klassischen Altertum bekannt, und ich glaube, daß es auch den obigen Rechnungen zugrunde liegt. β2 = Neugebauer geht dann anschließend auf die hier nicht ausgeführten babylonischen Rechnungen ein und macht plausibel, dass diese wohl mit Hilfe der oben beschriebenen Schritte durchgeführt worden seien. Das sich hieraus ergebende Verfahren ist bekannt, und es hat z. T. seinen Niederschlag im Mathematikunterricht gefunden, oder es wird gleich das hierauf beruhende sog. Heron-Verfahren verwendet. Der Mathematikhistoriker Oskar Becker geht in anderer Weise auf das babylonische Verfahren ein und beleuchtet dabei einen sehr wichtigen Aspekt, indem er – eher nebenbei – die Bedeutung des geometrischen Mittels anspricht: 18 Die Geschichte dieser Arten von mittleren Proportionalen reicht vermutlich bis in die vorgriechische Zeit zurück. Die babylonische bzw. altindische Methode zur Approximation von Quadratwurzeln [...] benutzt wesentlich die drei Mittel. Hat man zwei Zahlen a, b , so ist ihr geometrisches Mittel ab , also b , falls a = 1 . Ihr arithmetisches Mittel 21 (a + b) ist größer, ihr harmonisches Mittel 2ab : (a + b) ist kleiner als ab . Das harmonische Mittel wird offenbar erhalten, wenn man das Quadrat des geometrischen Mittels, also ab , durch das arithmetische Mittel 12 (a + b) dividiert. Das ist aber gerade das Verfahren bei der Quadratwurzelnäherung. Es ist nämlich das geometrische Mittel zwischen a, b und das zwischen ihrem harmonischen und arithmetischen Mittel dieselbe Zahl, und so kann man durch fortgesetzte Wiederholung des Prozesses der Einschiebung der beiden anderen Mittel das geometrische Mittel, speziell die Quadratwurzel, unbegrenzt approximieren. Diese Einschiebung ergibt die „musikalische“ oder „vollkommene“ Proportion: 18 [Becker 1954, 78 f]; Hervorhebungen nicht im Original. 12 H. Hischer a: 2ab a +b = a +b 2 : b , z. B. 1 : 4 3 = 3 2 : 2 [a = 1, b = 2] Wir können daher den „babylonischen Algorithmus“ auch anders und einleuchtend darstellen, indem wir auf die bereits eingeführten Beziehungen (und eine weitere!) zurückgreifen: 19 Wesentlich für diesen Algorithmus ist einerseits die schon bekannte musikalische Proportion in der Umformung (5), also A(x , y ) ⋅ H (x , y ) = xy = (G (x , y )) 2 . Und darüber hinaus ist die sog. babylonische Ungleichungskette x ≤ y ⇒ x ≤ H (x , y ) ≤ G (x , y ) ≤ A(x , y ) ≤ y (7) bedeutsam, bei der das Gleichheitszeichen genau für x = y gilt. Implizit macht auch Neugebauer in seiner Darstellung hiervon Gebrauch, und wir sehen, dass die Babylonier im Prinzip hiervon Gebrauch gemacht haben müssen, wenn auch vielleicht nicht bewusst. Wie können wir diese Ungleichungskette verifizieren? Sie besteht u. a. aus den Ungleichungen H (x, y) ≤ G(x, y) und G(x, y) ≤ A(x, y) , die sich jeweils äquivalent in (x − y )2 ≥ 0 umformen lassen. Und sie enthält die Ungleichungen x ≤ H (x , y ) und A(x , y ) ≤ y , die jeweils äquivalent sind zu x ≤ y , womit alles bewiesen ist. Darüber hinaus gibt es eine in Abb. 1 dargestellte sehr schöne Visualisierung dieser Ungleichungskette, die auf Pappus von Alexandria (ca. 250 – ca. 350 n. Chr.) zurückgeht: 20 Die Gültigkeit der in Abb. 1 abzulesenden Behauptungen folgt mit dem Höhensatz und mit dem Kathetensatz des Euklid unter Beachtung von (5). Abb. 1: Visualisierung von arithmetischem, geometrischem und harmonischem Mittel nach Pappus von Alexandria (3. Jh. n. Chr.) Ferner ist die Gültigkeit von H (x , y ) < G (x , y ) < A(x , y ) < y für x < y unmittelbar aus der Zeichnung ablesbar. 19 Vgl. [Hischer & Scheid 1982, 11 f], [Hischer & Scheid 1995, 19 f] und [Hischer 1998]. 20 Gemäß [Boyer 1968, 205] im 3. Buch der „Sammlung“ von Pappus (dort im 2. Teil); erwähnt auch bei [Hischer & Scheid 1982, 4] und [Hischer & Scheid 1995, 13]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 13 Und wie erkennen wir die Gültigkeit von x < H (x , y ) ? Wir denken uns einen Kreis um den Halbkreismittelpunkt mit dem Radius A(x , y ) − x ! 21 Nunmehr betrachten wir (7) in der strengeren Form (7*) x < y ⇒ x < H (x , y ) < G (x , y ) < A(x , y ) < y und erhalten daraus den babylonischen Algorithmus wie folgt, indem wir alles nun gleich aus heutiger Sicht für positive reelle Zahlen x , y interpretieren: Es sei ein a ∈ R + gegeben und ein Approximationswert für a gesucht. Ferner sei eine beliebige multiplikative Zerlegung von a gemäß a = xy (und damit also G (x, y ) = a ) mit x, y ∈ R + und x < a < y gegeben. Eine solche multiplikative Zerlegung lässt sich stets finden: Ist nämlich a > 1 , so kann man offenbar z. B. x := 1 und y := a wählen, und für den Fall a < 1 wähle man x := a und y := 1 . Es folgt dann • wegen (5): A(x , y ) ⋅ H (x , y ) = (G (x , y )) 2 • wegen (7*): x < H (x , y ) < G (x , y ) < A(x , y ) < y = a Das bedeutet: Aus einer bereits vorliegenden „Einschachtelung“ x < a < y erhalten wir eine neue, bessere mit Hilfe des harmonischen und des arithmetischen Mittels gemäß H (x , y ) < a < A(x , y ) , während das geometrische Mittel G (x , y ) „stabil“ und unverändert bleibt, nämlich G (x , y ) = a . Und diesen Prozess können wir offensichtlich iterativ ad infinitum fortsetzen. Und in der Tat erhalten wir auf diese Weise eine Intervallschachtelung, denn aus (7*) ergibt sich wegen −H (x , y ) < −x mit A(x , y ) = x +2 y für alle x, y ∈ R + : 0 < A(x , y ) − H (x , y ) < A(x , y ) − x = 1 2 (y − x ) (8) Notieren wir diesen Prozess in Folgenschreibweise für zwei rekursiv definierte Folgen x n und y n mit den Startwerten x 0 := x und y 0 := y gemäß x n +1 := H (x n , y n ) und y n +1 := A(x n , y n ) , so erhalten wir mittels vollständiger Induktion aus (8): y −x y n −x n < 0 n 0 für alle n ∈ N 2 (9) (10) 21 [Boyer 1968, 205] weist darauf hin, dass Pappus im 3. Buch seiner „Sammlung“ nur den Beweis des in Abb. 1 dargestellten Sachverhalts für sich in Anspruch nimmt, nicht aber eine solche Darstellung selber, die er auf einen unbekannten Geometer zurückführt. Und ferner beschreibt Pappus gemäß Boyer in seinem o. a. Buch auch „die“ Theorie der Mittelwerte: “In Book III Pappus describes also the theory of means [...]” 14 H. Hischer Der babylonische Algorithmus konvergiert somit! Wesentlich hierfür sind sowohl die babylonische Ungleichungskette (7*) als auch die musikalische Proportion (6) in der Gestalt von (5). Das geometrische Mittel wird hierbei zwar nicht wirklich benötigt, wohl aber zeigt es uns für jedes n das zu approximierende Zentrum der Intervallschachtelung an. In Abb. 2 wird diese Situation visualisiert. Abb. 2: Visualisierung der Intervallschachtelung beim babylonischen Algorithmus Zugleich liefert uns das geometrische Mittel in bekannter Weise Startwerte für den Approximationsalgorithmus: Ist etwa a für ein a ∈ R + mit a > 1 zu approximieren, so wähle man, wie schon erwähnt, x 0 := 1 und y 0 := a . Wegen G (x , yn ) = a ist dann x n yn = a , und mit (9) erhalten wir: a (11) yn +1 = 12 (yn + yn ) Der in dieser Form entschachtelte babylonische Algorithmus wird auch nach Heron von Alexandria (ca. 10 – ca. 75 n. Chr.) benannt, teilweise auch nach Newton. 22 2.5 Die babylonische Approximation von 2 Aus der archäologischen und mathematikhistorischen Forschung wissen wir, dass die Babylonier bereits vor rund 4000 Jahren Approximationen von 2 vorgenommen haben, u. a. im Rahmen der Berechnung ihrer astronomischen Tabellen. So zeigen uns Keilschrifttafeln aus der Zeit um etwa 2000 v. Chr., dass die Babylonier folgende Approximationen von 2 (≈ 1,4142135 ) kannten: 23 24 51 10 25 1+ ≈ 1,416 und 1 + + 2 + 3 ≈ 1,4142129 60 60 60 60 22 [Boyer 1968, 31] 23 In dezimaler Transliteration der sexagesimalen Darstellung! Vielfältig in der Literatur und im Internet referiert; beispielsweise die erste bei [Neugebauer 1969, 37] und die zweite bei [Resnikoff & Wells 1983; 65]. Bezüglich der Keilschrift finden sich Hintergrundinformationen auch bei [Hischer 2002, 324 – 327]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 15 Wie waren damals solch hervorragende Approximationen möglich? Zunächst sind einige Bemerkungen zum Fund und zur Entdeckung der zweiten o. g. Näherung angebracht: Abbildung 3 zeigt die ungefähr 3600 bis 3800 Jahre alte berühmte Keilschrifttafel “Yale YBC 7289” aus Babylonien (im Gebiet des heutigen Irak). 24 Sie besteht aus getrocknetem Ton, ist etwa handtellergroß und wurde erst im Jahre 1912 (neben vielen anderen Tontafeln!) gefunden. Sie befindet sich nun in einer Sammlung der Universität von Yale (USA) in Abb. 3: Keilschrifttafel Yale YBC 7289 – der “Yale Babylonian Collection” Darstellung der Approximation von 2 (YBC) mit der Nummer 7289. Vor etwa 70 Jahren ist es dem Mathematikhistoriker Otto Neugebauer und dem Archäologen Abraham J. Sachs gelungen, die sog. „Keilschrift“ auf vielen solcher Tontafeln zu entschlüsseln: Dazu haben sie diese (teilweise beschädigten) sexagesimalen Schriftzeichen transkribiert und anschließend transliteriert. Abb. 4 und Abb. 5 zeigen dies für Yale YBC 7289. 24 An einer Quadratseite weist Yale Abb. 4: Transkription YBC 7289 eine Längenangabe auf, von Yale YBC 7289 nämlich 30, und an einer Abb. 5: Transliteration Diagonalen zwei Längenangaben, und zwar in von Yale YBC 7289 sexagesimaler 24 51 10 25 35 Entwicklung: und 42 + + 1+ + + 60 602 60 602 60 3 24 Alle Abbildungen entnommen aus [Resnikoff & Wells 1983, 65]. 16 H. Hischer Hier ist zu beachten, dass die babylonischen sexagesimalen Darstellungen kein „Sexagesimalkomma“ enthielten. So kann beispielsweise „42, 25, 35“ sowohl 35 25 35 als auch 42 25 42 + + 2 + 2 + 3 oder ... 60 60 60 60 60 bedeuten, was jeweils aus dem Kontext zu erschließen ist. In diesem Fall zeigt sich, dass die erstgenannte Deutung richtig ist, wofür man dann zwecks Eindeutigkeit die sexagesimale Kodierung „42; 25, 35“ verwendet: Für den o. g. linken Ausdruck ergibt sich als Näherungswert 42,4263888 bzw. für den rechten 0,707106481, entsprechend ergäbe sich für die Deutung der „30“ an der Quadratseite entweder 30 bzw. 0,5. Es fällt auf, dass 0,707106481 ≈ 12 2 ist. Wenn es sich bei den Zahlen um Längenangaben handeln sollte, dann kämen wir weiter, denn die Diagonalenlänge ist ja das 2 -fache der Kantenlänge. Und das passt auch, wenn die Kantenlänge als 30 und nicht als 0,5 gedeutet wird, denn 42,4263888 ist ungefähr das 2 -fache von 30. Und nun haben wir es: An der Diagonalen in Abb. 3 steht offenbar oberhalb der Umrechnungsfaktor zwischen Kantenlänge und Diagonalenlänge, und dann ist darunter noch ein konkretes Beispiel, bezogen auf die Kantenlänge 30, angegeben! Aber wie konnten die Babylonier vor rund 4000 Jahren zu so ausgezeichneten Näherungswerten gelangen? Die babylonische Ungleichungskette (7*), die zu (9) führt, weist uns einen möglichen Weg zur nachträglichen Deutung: Beginnen wir mit x 0 := 1 und y 0 := 2 , so folgt: 4 20 3 30 , =1+ y1 = A(1, 2) = = 1 + 2 60 3 60 17 25 24 y2 = A(x 1, y1 ) = =1+ , x 2 = H (x 1, y1 ) = 12 60 17 816 577 x 3 = H (x 2, y2 ) = ≈ 1,4142114 , y 3 = A(x 2, y2 ) = ≈ 1,4142156 577 408 Bereits im zweiten Durchlauf des Algorithmus liefert uns das arithmetische Mittel den ersten babylonischen Näherungswert. Die Werte im dritten Durchlauf schachteln den zweiten babylonischen Wert lediglich ein. Wir führen daher auch noch den vierten Durchlauf durch: 941664 665857 x 4 = H (x 3 , y 3 ) = ≈ 1,1412135 , y 4 = A(x 3, y 3 ) = ≈ 1,4142135 665857 470832 Nunmehr stimmen diese beiden Werte in der angegeben Stellenzahl bereits exakt mit 2 überein, und dieser Wert ist kleiner als der zweite babylonische Wert! x 1 = H (1, 2) = Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 17 Wir schließen daraus, dass die Babylonier diesen vierten Schritt vermutlich nicht mehr vollzogen haben. Daher gehen wir nur bis zum dritten Schritt und entwickeln die beiden dort angegebenen Brüche in Sexagesimalbruchreihen: 816 24 51 9 40 14 x3 = =1+ + 2 + 3 + 4 + 5 +… 577 60 60 60 60 60 y3 = 577 24 51 10 35 17 =1+ + 2 + 3 + 4 + 5 +… 408 60 60 60 60 60 Diese Entwicklungen können nicht abbrechen, denn 408 enthält den Primfaktor 17, und 577 ist Primzahl. Rundet man diese beiden Werten nach unseren Rundungsregeln jeweils nach dem vierten Summanden, so würden wir erhalten: 24 51 10 24 51 11 816 577 ≈ 1+ + 2 + 3 , y3 = ≈ 1+ + 2 + 3 60 60 60 60 577 408 60 60 Es liegt also die Vermutung nahe, dass die Babylonier ihren Algorithmus zweimal voll durchlaufen haben und im dritten Schritt nur noch das arithmetische Mittel von x2 und y2 berechnet haben, nämlich x3 , und dass sie dann x3 im Rahmen ihrer Möglichkeiten nach der „dritten Nachkommastelle“ gerundet haben. x3 = Allerdings wäre theoretisch auch folgender Weg möglich, wenngleich er eher unwahrscheinlich ist, weil sich ein deutlich höherer Rechenaufwand ergäbe: Für das arithmetische Mittel von x3 und y3 erhalten wir: 665857 665857 24 51 10 7 1 ( x + y ) = = = 1 + + + + + ... 2 3 3 470832 22 ⋅ 3 ⋅ 17 ⋅ 577 60 602 60 3 60 4 Alternativ und einfacher könnten wir auch nur das arithmetische Mittel der obigen beiden „Reste“ von x3 und y3 bilden und erhielten dafür die Abschätzung 75 135 68 1 8 1 1⎛ 1 + ... ≈ 4 = 3 + 4 ≈ 3 + 4 ⎞⎟ + ... = 2⎜ 3 4 60 ⎠ 2 ⋅ 60 60 60 60 60 ⎝ 60 Sinnvolle Rundung nach dem vierten Summanden ergibt dann in beiden Fällen den überlieferten zweiten babylonischen Wert. 2.6 Mesotaeten Die pythagoreischen Gleichungen (1) bzw. (2), also a − b = b − c bzw. a b = b c , die das arithmetische bzw. das geometrische Mittel charakterisieren, sind aus unserer Sicht formal sehr ähnlich: (1) besagt, dass die geordneten Paare (a;b) und (b; c) differenzgleich sind, und (2) besagt, dass diese Paare quotientgleich sind. Und in beiden Fällen wird eine Mitte zwischen zwei Größen a und b charakterisiert: 18 H. Hischer a − b = b − c wurde als arithmetisches Problem zur Bestimmung von b aufgefasst, also als ein Problem zur Suche einer Zahl, die gleichabständig zwischen zwei gegebenen Zahlen liegt – anders formuliert: Die Summe von zwei Zahlen ist durch die Summe zweier gleicher Zahlen zu ersetzen. a b = b c hingegen war die Beschreibung eines als geometrisch aufgefassten Problems, bei der es um eine Proportion im Sinne des Wortes geht, also um ein Verhältnis von Größen, das wir z. B. für den Fall von Streckenlängen aus unserer Sicht wie folgt formulieren können: Das Produkt von zwei Längen (aufzufassen als Flächeninhalt eines Rechtecks) ist durch das Produkt zweier gleicher Längen (aufzufassen als Flächeninhalt eines Quadrats) zu ersetzen. Hierzu muss man wissen, dass die Pythagoreer sog. „Flächenzahlen“ und „Körperzahlen“ kannten und benutzten. Moritz Cantor schreibt hierzu: 25 Im platonischen Timäus findet sich eine Stelle, welche etwa folgendermassen heisst: Um mit zwei Flächen eine geometrische Proportion zu bilden, deren äussere Glieder sie sein sollen, genüge es eine dritte Fläche als geometrisches Mittel anzusetzen; sollen aber zwei Körper die äusseren Glieder einer geometrischen Proportion sein, so müsse man zwei von einander verschiedene innere Glieder annehmen, weil ein geometrisches Mittel nicht vorhanden sei. Im zweiten Fall geht es also um die Bestimmung von zwei mittleren Proportionalen. Cantor schreibt dann weiter: Flächen und Körper können hier nur als Zahlen und zwar als Produkte von zwei beziehungsweise von drei Faktoren angesehen werden. Das heisst man wusste damals, dass im Allgemeinen das Maass einer Fläche, eines Körpers gefunden werde, indem man zwei, drei Abmessungen miteinander vervielfältigte. Die Erklärung von Flächen- und Körperzahlen als solcher Produkte ist ausgesprochen bei Euklid, sie ist ausgesprochen bei Theon von Smyrna. [...] Diese Betrachtungen vertiefen wir hier nicht weiter, sie sollten nur dem Verständnis der Bezeichnungen „arithmetisches Mittel“ und „geometrisches Mittel“ dienen. Die Bezeichnung „harmonisches Mittel“ war nicht die ursprüngliche; für ihre Herkunft gibt es zwei naheliegende Erklärungen: Einerseits liefert das harmonische Mittel innerhalb der musikalischen Proportion eine Verknüpfung zwischen dem arithmetischen und dem geometrischen Mittel, so dass die musikalische Harmonie für die Namensgebung Pate gestanden haben mag. Andererseits ist ein davon verschiedener möglicher Namensursprung dokumentiert, wie wir z. B. bei Moritz Cantor lesen können, wobei dieser sich neben der bereits oben zitierten Stelle im Timaios von Platon auch auf Nikomachus bezieht: 26 25 [Cantor 1894, 153] 26 [Cantor 1894, 154]; Nikomachus von Gerasa (das heutige Jarasch in Jordanien), lebte ca. 60 – 120 n. Chr., er war Mathematiker und Philosoph und zählt zu den Pythagoreern. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 19 Wir sind nicht auf die Timäusstelle allein angewiesen, um die A n a l o g i e n u n d M e s o t ä t e n , das sind die griechischen Namen für Verhältnisse und dabei auftretende Mittel, für die Pythagoräer in Anspruch zu nehmen. Ein bei Nikomachus aufbewahrtes Bruchstück des P h i l o l a u s 27 lässt den W ü r f e l d i e g e o m e t r i s c h e H a r m o n i e genannt werden, weil seine sämmtlichen Abmessungen völlig gleich unter einander und somit in vollständigem Einklange seien. Dem entsprechend habe man den Namen h a r m o n i s c h e s V e r h ä l t n i s s wegen der Aehnlichkeit mit der geometrischen Harmonie eingeführt. Inder That spiegle sich dieses Verhältniss in jedem Würfel mit seinen 12 Kanten, 8 Ecken und 6 Flächen ab. Wir haben kaum nothwendig diese Stelle noch zu erläutern und zu bemerken, dass 6, 8, 12 in stetigem harmonischen Verhältnisse ste1 . hen, weil 16 − 18 = 18 − 12 Diesen Sachverhalt können wir auch mittels (4) durch H (6, 12) = 8 beschreiben. Wir wenden uns nun den in obigem Zitat erwähnten „Analogien“ und „Mesotäten“ zu und werden erfahren, dass die Pythagoreer den bisher vorgestellten „drei klassischen Mittelwerten“ weitere hinzu gefügt haben. Moritz Cantor würdigt in diesem Zusammenhang besonders Eudoxos von Knidos (408 – 355 v. Chr.): 28 E u d o x u s lebte um 408 – 355. Man weiss, dass er in K n i d o s geboren ist, dass er Schüler des Archytas, in seinem 23. Lebensjahre auch während zwei Monaten Schüler Platons in Athen war. [...] Um 375 stiftete Eudoxus selbst eine Schule in Kyzikus, dem heutigen Panorma am Marmarameere, kam er mit zahlreichen Schülern nach Athen, wo er wieder mit Platon enge verkehrte. Dann aber kehrte er nach Knidos zurück und starb dort im Alter von 53 Jahren. Astronom, Geometer, Arzt, Gesetzgeber nennt ihn Diogenes Laertius, dem die wesentlichten biographischen Angaben über Eudoxus entstammen. Wir haben es hier nur mit dem Geometer zu thun [...]. Und Cantor schreibt weiter in dem uns interessierenden Zusammenhang: 29 E u d o x u s fügte zu den drei P r o p o r t i o n e n drei weitere hinzu. 30 Wir haben [...] die Analogien und Mesotäten für die Pythagoräer in Anspruch genommen, wir haben gesehen, dass der Ursprung einer bestimmten Proportion nach Babylon verlegt wird, von wo Pythagoras sie mitgebracht habe, woraus für uns mindestens das folgt, dass man zur Zeit des Jamblichus wie in Griechenland, so in den Euphratländern 31 jener sogenannten musikalischen Proportion Beachtung schenkte. 27 Philolaos von Kroton (ca. 450 v.Chr.), Philosoph, Zeitgenosse von Sokrates, er wird zu 28 29 30 31 den jüngeren Pythagoreern gerechnet. [Cantor 1894, 225] [Cantor 1894, 226]; Hervorhebung nicht im Original. Das bedeutet, dass Eudoxos die drei klassischen Mittelwerte um drei weitere ergänzt hat. Cantor nennt diese drei neuen Mittelwerte nicht explizit, wir werden aber später rekonstruieren, um welche es sich hier vermutlich handelt. Gemeint ist Mesopotamien, also das „Zwischenstromland“ zwischen Euphrat und Tigris. 20 H. Hischer Cantor setzt die Ausführungen fort: 32 Wir wollen hier über den Unterschied von Analogie und Mesotät einiges einschalten. Die Erklärungen der griechischen Schriftsteller gehen freilich einigermassen auseinander, aber fasst man die verschiedenen Stellen alle zusammen, so kommt man zu folgender Auffassung. Ursprünglich hiess die geometrische Proportion ¢nalogia , 33 die Proportion im Allgemeinen, nämlich die arithmetische, die harmonische und sämmtliche noch dazu kommenden hiessen mesÒthtej. 34 Der spätere Sprachgebrauch dagegen verwischte diesen Unterschied und liess zuletzt unter Mesotät nur irgend etwas verstehen, was zwischen gegebenen Auessersten lag. Lesen wir diesen Text sorgfältig und inhaltlich interpretierend, so war also die Bezeichnung „Analogie“ zunächst nur für diejenige Proportion reserviert, die das geometrische Mittel definiert, also für (2), während „Mesotaet“ eine Proportion meinte, die in Verallgemeinerung der drei klassischen Mittelwerte irgendeinen Mittelwert beschreibt. Keinesfalls dürfen wir „Mesotaet“ jedoch – wie der Text auf den ersten Blick nahelegt – als Bezeichnung für irgendeine Proportion verstehen, sondern es muss „ein Wert zwischen zwei Äußersten“ beschrieben werden, also ein Mittelwert! Diese Deutung wird durch einen Blick auf die sprachlichen Wurzeln gestützt: 35 Das griechische mšsoj („mesos“) findet sich im lateinischen „medius“ wieder und bedeutet „der mittlere“. Und das griechische Substantiv für „Mitte“ ist mesÒthj („mesotaes“) mit dem Plural mesÒthtej („mesotaetes“). Auch ist zu beachten, dass es nicht „Mesothet“ heißt, so dass keine Zusammenstellung aus dem griechischen mšsoj („mesos“, der mittlere) und qšsij („Thesis“, die Stellung) vorliegen kann. Ferner dürften wir streng genommen, Cantor folgend, „Mesotaet“ nicht als „Mittelwert“ verstehen, sondern als eine Proportion, die einen Mittelwert definiert. Allerdings wird eine solche rigide Deutung in der Literatur nicht durchgehalten, so dass oft „Mesotaet“ sowohl Proportion als auch Mittelwert ist. Wir folgen weiter den Ausführungen Cantors und stoßen auf folgenden bemerkenswerten Aspekt: 36 Diese Darstellung schliesst zugleich in sich, dass es ursprünglich nur drei solcher Proportionen gab, für welche wir die von Architas gegebenen Definitionen kennen gelernt haben. Es war die arithmetische, die geometrische, die entgegengesetzte Proportion, welche diesen ihren Namen, upenantia, mit dem durch Archytas und Hippasos, wie wir von Jamblichus erfahren, eingeführten Namen der harmonischen vertauschte. 32 Cantor a. a. O.; Hervorhebung nicht im Original. 33 ¢nalogia, latinisiert „analogia“ (Betonung auf dem ersten „a“ und auf dem „i“). 34 mesÒthtej, latinisiert „mesotaetes“ (Betonung auf dem „o“). 35 Für diesen Hinweis danke ich StD Bruno Schmitz, Studienseminar Braunschweig. 36 Cantor a. a. O.; Hervorhebungen nicht im Original. „upenantia“ wird noch erläutert. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 21 Hier erfahren wir nun, dass die harmonische Proportion (und damit: das harmonische Mittel) ihren Namen erst später durch Archytas von Tarent und Hippasos (den mutmaßlichen Entdecker der Inkommensurabilität) erhalten habe, und dass diese als dritte Proportion neben der arithmetischen und der geometrischen zunächst als „entgegengesetzte Proportion“ aufgefasst worden sei, upenantia („hypenantia“) genannt. Schmitz schreibt mir hierzu: 37 upenantioj entspricht genau dem lateinischen Begriff „subcontrarius“; upo 38 entspricht dem lateinischen „sub“ und enantioj 39 dem lateinischen „contrarius“. Das bedeutet dann im Deutschen tatsächlich „untergegensätzlich“. Das Wort bedeutet im Griechischen einfach „gegensätzlich“ und kommt bei Hesiod, bei Platon und Aristoteles und bei einigen anderen Autoren vor. Damit wird klar, weshalb in der Literatur vielfach (ohne weitere Erläuterung) darauf hingewiesen wird, dass das harmonische Mittel ursprünglich „subkonträres Mittel“ geheißen habe: 40 Nicht etwa, weil diese Bezeichnung eine Spezifikation von „konträres Mittel“ sei oder eine Abgrenzung meine (eine solche Bezeichnung ist mir auch nicht bekannt), sondern weil das lateinische „subkonträr“ bzw. das griechische „hypenantios“ hier einfach im Sinne von „gegensätzlich“ verwendet wurde, was dann zu der von Cantor im Zitat nach Fußnote 36 verwendeten Bezeichnung „entgegengesetzte Proportion“ passt. Doch warum heißt diese Proportion (und damit das Mittel) eigentlich „entgegengesetzt“? Moritz Cantor bezeichnet in seiner Übersetzung des Fragments von Archytas (vgl. das Eingangszitat, Fußnote 1) das entsprechende Mittel als „reziprokes“. Man ist vielleicht geneigt, diese Bezeichnung auf die heute gebräuchliche kennzeichnende Proportion für das harmonische Mittel zurückzuführen, nämlich 1 1 1 1 − = − , c b b a weil hier in Analogie zu (1) die Differenzgleichheit der Reziproken beschrieben wird. Jedoch muss diese Deutung verworfen werden, weil „Kehrwerte“ von Größen in der pythagoreischen Proportionenlehre nicht vorkamen. Wohl aber liegt eine andere Deutung nahe, zumal, wenn man davon ausgeht, dass zunächst nur drei Mittelwerte und die entsprechenden Proportionen bekannt waren: In der babylonischen Ungleichungskette (7*) liegt nämlich das harmonische Mittel bezüglich des arithmetischen Mittels „auf der anderen Seite“ des geometrischen Mittels, ist also „entgegengesetzt“: H (x , y ) < G (x , y ) < A(x , y ) . Das scheint plausibel zu sein. 37 Herzlichen Dank an StD Bruno Schmitz, Studienseminar Braunschweig! 38 Anmerkung: gelesen „hypo“. 39 Anmerkung: gelesen „enantios“. 40 Z. B. [Boyer 1968, 77]. 22 H. Hischer Zurück zu Moritz Cantor, dessen letztgenannte Ausführungen wie folgt fortgesetzt werden: 41 Als selbstverständlich ist dabei zu bemerken, dass nur Proportionen, die aus drei Zahlen gebildet wurden, in Betracht kamen und mit jenen Namen belegt wurden, also nur s t e t i g e P r o p o r t i o n e n sind Mesotäten. 42 Zu den drei alten Mesotäten kamen drei neue. 43 Das Mathematikerverzeichnis 44 sagt uns, E u d o x u s habe dieselben erfunden. Jamblichus berichtet, A r c h y t a s und H i p p a s o s hätten sie eingeführt, Eudoxus und seine Schüler nur die Namen verändert. Endlich traten noch vier Mesotäten hinzu und brachten die Gesamtzahl auf zehn, welche Nikomachus im II. S. n. Chr. gekannt hat. Durch die Einführung der vier letzten machten sich, wieder Jamblichus zufolge, T e m n o n i d e s und E u p h r a n o r verdient, Persönlichkeiten, die wir nur aus diesem einzigen Citate kennen. Wir halten fest, dass die drei ursprünglichen Mesotäten durch die Pythagoreer Archytas und Hippasos um drei weitere ergänzt wurden, und dass schließlich noch vier hinzu kamen, die dem Geschichtsschreiber Nikomachus im 2. Jh. n. Chr. bekannt waren, wobei nicht gesichert ist, wem wir diese vier weiteren zu verdanken haben. Im 4. Jh. v. Chr. lebte ein bekannter griechischer Bildhauer und Maler namens Euphranor. Sollte dieser gemeint sein, so würden diese zehn Mediäten bereits den Pythagoreern bekannt gewesen sein, wie dies andere Historiker behaupten. So schreibt beispielsweise Carl B. Boyer u. a.: 45 It is reported that Pythagoras learned in Mesopotamia of three means – the arithmetic, the geometric, and the subcontrary (later called the harmonic) – and of the “golden proportion” relating two of these: the first of two numbers is to their arithmetic mean as their harmonic mean is to the second of the two numbers. This relationship ist the essence of the Babylonian square-root algorithm, hence the report is at least plausible. At some stage, however, the Pythagoreans generalized this work by adding seven new means to make ten in all. [...] It es difficult to assign a date to the Pythagorean study of means […]. Wir schließen uns dieser aktuelleren Geschichtsschreibung an und ordnen alle zehn von Moritz Cantor erwähnten Mesotaeten den Pythagoreern zu, indem wir sie pythagoreische Mittelwerte nennen. 46 41 [Cantor 1894, 226]; Hervorhebungen durch Unterstreichung nicht im Original. 42 Indirekt wird hier definiert, was eine stetige Proportion ist: nämlich eine solche Gleichung zwischen zwei Größenverhältnissen, bei der nur drei Größen auftreten. 43 Wir werden noch rekonstruieren, welche hier gemeint sind, vgl. auch Fußnote 30. 44 Cantor bezieht sich hier auf das berühmte „Mathematikerverzeichnis“ des Proclus Dia- dochus (411 – 485). 45 Vgl. etwa [Boyer 1968, 61]; Hervorhebungen nicht im Original. 46 Bei dieser Vereinbarung nutzen wir die Doppeldeutigkeit von „Mesotaet“ sowohl als Proportion als auch als Mittelwert aus (vgl. die Bemerkung auf S. 18 unten). Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 23 2.7 Pythagoreische Mittelwerte — Versuch einer Rekonstruktion Wir knüpfen zunächst an die Fußnoten 32 und 41 (Zitate von Moritz Cantor) an: Der spätere Sprachgebrauch [...] liess zuletzt unter Mesotät nur irgend etwas verstehen, was zwischen gegebenen Auessersten lag. [...] Als selbstverständlich ist dabei zu bemerken, dass nur Proportionen, die aus drei Zahlen gebildet wurden, in Betracht kamen und mit jenen Namen belegt wurden, also nur s t e t i g e P r o p o r t i o n e n sind Mesotäten. [...] 47 Ganz in diesem Sinne hatten wir bereits an früherer Stelle vereinbart: 48 Wir wollen die entscheidenden Zusammenhänge aus heutiger Sicht darstellen und denken uns zwei gleichartige (positive!) Größen x und y mit x < y gegeben, zu denen wir eine zwischen diesen beiden Größen liegende dritte Größe als deren „Mittelwert“ kennzeichnen wollen. Um nun den pythagoreischen Weg der Untersuchung von Mittelwerten in heutiger Notation nachvollziehen zu können, geben wir also zwei positive reelle Zahlen x und y mit x < y vor mit dem Ziel, eine zwischen diesen beiden Zahlen liegende dritte positive reelle Zahl m als deren „Mittelwert“ zu beschreiben. Wir visualisieren diese Situation Abb. 6: m als „Mittelwert“ durch einen Abschnitt auf dem Zahlenstrahl (vgl. zwischen x und y Abb. 6). Sodann ergeben sich für die definierenden Proportionen (1), (2) und (3) der drei klassischen Mittelwerte der Reihe nach folgende „Übersetzungen“: y −m = m −x (1*) y m = m x (2*) y −m m −x = y x (3*) Die Mathematikhistoriker Moritz Cantor und Carl. B. Boyer geben nun in diesem Sinn die schon auf S. 20 erwähnten zehn pythagoreischen Proportionen an (ohne jedoch die Quellen dazu zu nennen), wobei sich ihre Darstellungen unterscheiden. 47 Hier sehen wir erneut, dass Moritz Cantor „Mesotaet“ sowohl als Bezeichnung für einen Mittelwert als auch für die diesen Mittelwert definierende Proportion verwendet. Da wir künftig nur noch von „Mittelwerten“ und „Proportionen“ sprechen werden, ist diese Doppeldeutigkeit für uns irrelevant. 48 Vgl. Absatz 2 auf S. 7. 24 H. Hischer In der folgenden Übersicht findet sich ein Vergleich dieser Darstellungen der definierenden Proportionen der pythagoreischen Mittelwerte sowohl durch [Cantor 1894, 227] als auch durch [Boyer 1968, 61]. Während Cantor die Variablen γ, β, α (anstelle von x , m, y bei uns) verwendet, wählt Boyer a, b, c (jeweils in dieser Reihenfolge!). Die Reihenfolge der jeweils zehn Proportionen wurde gegenüber den Quellen nicht geändert. Wir verwenden einheitlich x , m, y . (1C) (2C) (3C) (4C) (5C) (6C) (7C) (8C) (9C) (10C) Pythagoreische Mittelwertfunktion in den Darstellungen nach Moritz Cantor (1894) bzw. Carl B. Boyer (1968) m −x x = y −m = m −x (1B) y −m x m −x x y m = = (2B) y −m m m x m −x x y y −m = = (3B) y −m y x m −x y m −x m −x y = = (4B) x y −m y −m x m m −x m −x m = = (5B) x y −m y −m x y m −x m −x y = = (6B) m y −m y −m m y y −x y −x y = = (7B) x m −x m −x x y y −x y −x y = = (8B) x y −m y −m x m y −x y −x m = = (9B) x m −x m −x x m y −x y −x m = = (10B) x y −m y −m x Sieht man von einer Vertauschung der linken und rechten Seite der Gleichungen bei Cantor und Boyer ab, so sind die Proportionen (4C) und (4B) bis (10C) und (10B) jeweils identisch, und die ersten drei Paare von Proportionen erweisen sich immerhin jeweils als äquivalent. Aber warum wählen die beiden Historiker für die Proportionen der klassischen Mittelwerte so unterschiedliche Darstellungen? Haben sie das selber geändert, oder beziehen sie sich auf unterschiedliche Quellen? Da wir das ohne Bezug auf andere Quellen nicht entscheiden können, versuchen wir es wenigstens mit einer nachträglichen Deutung! Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 25 Zunächst fällt auf, dass zwar sowohl (1*) und (1C) als auch (2*) und (2C) jeweils identisch sind, dass jedoch schon bei Cantor in seiner eigenen Darstellung (3*) und (3C) von grundlegend anderer Gestalt (jedoch für uns äquivalent) sind. Es gehört jedoch zum Wissen der pythagoreischen Proportionenlehre, dass mit a : b = c : d auch a : c = b : d gilt. Und so ist es naheliegend, dass man durch spielerische Betrachtung von (1*) zu (1C) gelangt, indem das man Verhältnis von Differenzen mit dem Verhältnis von Größen vergleicht. Hat man jedoch erst mal diesen Schritt durchgespielt und berücksichtigt man die philosophisch-spielerische Einstellung der Pythagoreer zur Mathematik 49 (also einer Einstellung, die nicht primär auf „Nützlichkeit“ und auf „Anwendung“ gerichtet ist, sondern spielerisch auf „Welterkenntnis“!), so liegt es geradezu auf der Hand, die Struktur der Proportion (3C) zu variieren und jeweils das Verhältnis von zwei Größen mit dem Verhältnis von der Differenz von drei Größen zu vergleichen. Das führt dann einerseits zur nachträglichen Umformulierung von (1C) bzw. (2C) in (1B) bzw. (2B), wobei (1B) artifiziell wirkt, aber nun in das „System“ passt, wenn man noch (3C) durch Kehrwertbildung in (3B) umformuliert. Betrachtet man nunmehr (1B) bis (3B) in ihrer gleichartigen Struktur, bei der auf den rechten Seiten der Zähler gleich bleibt und der Nenner von (1B) nach (1C) wächst, so ist es bei spielerisch-systematischer Betrachtung nacheliegend, zu fragen, wie man die rechte Seite noch weiter variieren kann, und man gelangt sehr schnell zu (4B) bis (6B), zugleich feststellend, dass dies alle Möglichkeiten sind (sofern man die linke Seite unverändert lässt). Darauf werden wir noch eingehen! Somit wird plausibel, dass (4B) bis (6B) wohl die ersten drei weiteren Mesotäten gewesen sind, die Eudoxos gemäß Cantor erfunden hat. 50 Nun mag irgendwann der Drang eingesetzt haben, nach einer weiteren Variationsmöglichkeit der Mesotäten zu suchen, die jedoch nur in einer Variation der linken Seiten (in der Spalte von Boyer) zu finden ist und dann zur Entdeckung (oder „Erfindung“?) der restlichen vier Proportionen (7B) bis (10B) geführt haben mag, wie sie gemäß Cantor auf Temnonides und Euphranor zurückzuführen sind. 51 Wir halten also fest, dass die Pythagoreer in ihrer systematischen Untersuchung von Mesotäten insgesamt auf zehn Mittelwerte gestoßen sind, die sämtlich verschieden sind, weil wir wissen, dass diese zehn definierenden Proportionen nicht äquivalent sind. Doch welchen Sinn hat das alles über das Spielerische hinaus? 49 „Mathematik als Spiel des Geistes“, vgl. [Hischer 2002]. 50 Vgl. hierzu die Fußnoten 30 und 43. 51 Vgl. hierzu das Zitat nach Fußnote 41. 26 H. Hischer Moritz Cantor vermag solchen Untersuchungen nichts abzugewinnen, denn er stellt hierzu fest: 52 Andererseits erscheint es uns Neueren gar verwunderlich, dass die Griechen alle diese Fälle unterschieden, mit deren sieben letzten im Grossen und Ganzen nichts geleistet ist, dass sie in der Erfindung derselben etwas hinlänglich Bedeutendes erkennen, um die Namen derer aufzubewahren, von welchen jene Leistung herrührt. Aber anschließend kommt er aus anderer Perspektive dennoch zu einer positiven Würdigung, wenngleich er die Bedeutung „weiterer Mittelwerte“ nicht anspricht (evtl. gar nicht erkennt?): 53 Wir werden in die griechische Stufenleiter der Werthschätzung uns hineinfinden können, wenn wir zweierlei erwägen. Erstens, dass eine grosse Zahlengewandtheit dazu gehörte sämmtliche zehn Verhältnisse ganzzahlig zu erfüllen, zweitens, dass die aus vier voneinander verschiedenen gebildete geometrische Proportion mit den aus ihr abzuleitenden für die Griechen bis zu einem gewissen Grade die Gleichungen und deren Umformung ersetzte. Die Folgerung von α : β = γ : δ auf (α + β) : β = (γ + δ) : δ z. B. spielte bei den Griechen fortdauernd die allerbedeutsamste Rolle. Stetige Proportionen hatten zur Kenntniss der arithmetischen, der geometrischen Reihen, jene wieder zur Kenntnis der vieleckigen Zahlen geführt. 54 Was Wunder, dass man weiter experimentierte, dass man immer neue Verbindungen gleicher Verhältnisse zwischen Zahlen aufsuchte, welche selbst aus drei gegebenen Zahlen additiv oder subtraktiv zusammengesetzt waren? Solche neue Proportionen konnten zu neuen wichtigen Entdeckungen Gelegenheit geben, und thaten sie es nicht, so boten sie nur ein Beispiel, wie es deren in der Geschichte aller Wissenschaften gibt, dass Untersuchungen mit hochgespannten Hoffnungen und Erwartungen begonnen sich allmälig als unfruchtbar erwiesen. Mit der o. g. „ Zahlengewandtheit“ bezieht sich Cantor auf die Belegung der zehn Gleichungen mit ganzzahligen Lösungen und gibt hierfür jeweils ein Beispiel an. Diese werden nachfolgend in einer Wertetabelle mit zwei Eingängen (für x und y) dargestellt, so dass der jeweilige „Mittelwert“ m als Funktionswert m := M (x , y ) einer zweistelligen „Mittelwertfunktion“ M erscheint. Diese zehn Mittelwertfunktionen bezeichnen wir in Anlehnung an S. 22 mit M 1, … , M 10 : i 1 2 3 4 5 6 7 8 9 10 x y Mi(x, y) 1 3 2 1 4 2 3 6 4 3 6 5 2 5 4 1 6 4 6 9 8 6 9 7 4 7 6 3 8 5 52 [Cantor 1894, 227] 53 [Cantor 1894, 227 f] 54 Mit „Reihe“ meint Cantor „Folge“; „vieleckige Zahlen“ sind „Polygonalzahlen“ als spe- zielle „figurierte Zahlen“, siehe [Hischer & Scheid 1985] und [Hischer & Scheid 1992]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 27 Wir betrachten erneut die zehn Proportionen in der Formulierung gemäß Boyer und fragen: Worin besteht das Typische dieser definierenden Gleichungen? Wir finden: Links steht jeweils das Verhältnis von Streckenlängendifferenzen und rechts das Verhältnis von Streckenlängen. Als Streckenlängen kommen hier nur x , m und y in Frage, und als Streckenlängendifferenzen m − x , y − x und y − m . Damit lassen sich folgende Verhältnisse bilden (ohne Berücksichtigung der Kehrwerte): m −x m −x y −x x x m links: , , rechts: , , y −x y −m y −m m y y Kombiniert man nun jede linke Seite mit jeder rechten Seite, so ergibt das insgesamt neun Gleichungen. Hinzu kommen neun weitere, indem man auf einer Seite den Kehrwert eines Bruchs wählt. Somit haben wir bereits achtzehn Gleichungen. Weiterhin kann man jeweils links und rechts noch ein Verhältnis aus gleichem Zähler und Nenner bilden (das in unserer Sichtweise den Wert 1 hat, aber solch einen Wert „1“ kannten ja die Pythagoreer nicht!): So können wir rechts z. B. wie bei (1B) das Verhältnis xx wählen (die anderen beiden bringen nichts Neues). Kombinieren wir diese rechte Seite, die also für unsere „1“ steht, mit den linken Seiten, so erhalten wir drei weitere Gleichungen. Würden wir das analog auch auf der linken Seite machen, also dort ein Verhältnis mit gleichem Zähler und Nenner bilden, so würde das sinnlos sein, weil das gemeinsam mit den rechten Seiten nur für den Fall x = m = y erfüllbar wäre. Insgesamt lassen sich also formal und rein kombinatorisch 21 Gleichungen („Proportionen“) obigen Typs aufstellen, von denen sich aber einige wegen der Voraussetzung x ≤ m ≤ y als sinnlos erweisen. Einige liefern keine neuen Lösungen, und andere liefern „Lösungen“, die identisch x oder identisch y sind und denen damit die Bedeutung eines „Mittelwerts“ wohl kaum zugesprochen werden kann. So bleiben zum Schluss fast nur die zehn pythagoreischen Proportionen übrig – „fast nur“ deshalb, weil sich nämlich eine weitere elfte Gleichung ergibt, welche merkwürdigerweise von den Pythagoreern nicht überliefert wird, obwohl sie einen elften „Mittelwert“ liefert, der ebenfalls über Proportionen erklärt ist, nämlich y y −x . = y −m m Wir fassen zusammen: Im Sinne der pythagoreischen Betrachtungsweise lassen sich insgesamt elf nicht äquivalente Proportionen bilden, über die jeweils ein „Mittelwert“ von zwei positiven reellen Zahlen erklärt ist. Damit sind zugleich elf verschiedene „Mittelwertfunktionen“ Mi ( i ∈ {1, 2, … , 11} ) mit Mi : R 2+ → R + erklärt. 28 H. Hischer Diese elf definierenden Gleichungen lassen sich unter der Voraussetzung m ∈ R + jeweils eindeutig nach m auflösen, wobei jeweils m = M i (x , y ) ist. Die folgende Tabelle liefert eine Übersicht über diese elf Mittelwertfunktionen. Zugleich werden hier die auf S. 24 bereits angegebenen ganzzahligen Lösungen nach Cantor erneut dargestellt, ergänzt um ein ganzzahliges Beispiel auch für die neue elfte Mittelwertfunktion. m −x x = 1. y −m x m= x +y 2 2. m −x x = y −m m m = xy 3. m −x x = y −m y m= 2xy x +y =: M 1 (x , y ) = A(x , y ) =: M 2 (x , y ) = G (x , y ) =: M 3 (x , y ) = H (x , y ) A(1, 3) = 2 G (1, 4) = 2 H (3, 6) = 4 m −x y = 4. y −m x x 2 + y2 m= x +y =: M 4 (x , y ) m −x m = 5. y −m x y −x y − x ⎞2 ⎛ 2 m= + ⎜ ⎟ +x 2 ⎝ 2 ⎠ =: M 5 (x , y ) M 5 (2, 5) = 4 y −x y − x ⎞2 ⎛ 2 m=− + ⎜ ⎟ +y 2 ⎝ 2 ⎠ =: M 6 (x , y ) M 6 (1, 6) = 4 (y − x )2 m =y− y =: M 7 (x , y ) M 7 (6, 9) = 8 =: M 8 (x , y ) M 8 (6, 9) = 7 =: M 9 (x , y ) M 9 (4, 7) = 6 6. 7. 8. 9. 10. 11. m −x y = y −m m y −x m −x y −x y −m y −x m −x y −x y −m y −x y −m y x y = x m = x m = x y = m = (y − x )2 m =x+ y x m = + 12 4xy − 3x 2 2 =: K (x , y ) K (3, 6) = 5 m = max{y − x , x } =: M 10 (x , y ) M 10 (3, 8) = 5 y2 m = 2y − x =: M 11(x , y ) M 11 (3, 6) = 4 Die Mittelwertfunktion M 4 wurde hier mit K abgekürzt, was zu begründen ist: Zunächst liegt aufgrund der Termstruktur die Bezeichnung „quadratisches Mittel“ nahe, jedoch ist diese Bezeichnung bereits vergeben, und es gilt bekanntlich: Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 29 x 2 + y2 Q(x , y ) := 2 Für M 4 findet man hingegen die Bezeichnung „kontraharmonisches Mittel“. 55 Wie kann es zu dieser Bezeichnung gekommen sein? Bei der Betrachtung der definierenden Proportionen für das harmonische Mittel und das kontraharmonische Mittel fällt auf, dass diese sich nur durch die rechten Seiten unterscheiden, und zwar ist die eine der Kehrwert der anderen. Dies ist ein plausible Erklärung für die Namensgebung, wobei mir eine historische Quelle hierfür nicht bekannt ist. Auch ist hierfür die Bezeichnung „antiharmonisches Mittel“ in Gebrauch. 56 Ich verwende hier die literaturmäßig belegte Bezeichnung „kontraharmonisches Mittel“, zumal sie den Vorteil einer sinnfälligen Abkürzung für die entsprechende Mittelwertfunktion durch K bietet. Das veranlasst uns sofort, nach weiteren „Kontramittelwerten“ zu suchen: So ist das „kontraarithmetische Mittel“ offensichtlich das arithmetische Mittel selbst. Bezeichnen wir die „Kontramittelwertfunktion“ zur pythagoreischen Mittelwertfunktion M vorübergehend mit M , so hätten wir H = K , K = H und A = A . Für das „kontrageometrische Mittel“ erkennen wir G = M 5 , und zugehörig sehen wir M 5 = G . Merkwürdigerweise ist aber auch M 6 = G , obwohl M 5 ≠ M 6 ! / Wir verfolgen diesen spielerischen Ausflug hier nicht weiter und sehen, dass uns die Untersuchung von Mittelwertfunktionen manche Überraschung bietet! 57 Spätestens jetzt nach diesem algebraischen Exkurs fällt uns vielleicht auf, dass die ersten vier Mittelwertfunktionen sich von den restlichen sieben durch eine angenehme und wesentliche Eigenschaft unterscheiden: Es sind symmetrische Funktionen, d. h., für sie gilt: 58 M (x , y ) = M (y, x ) für alle x, y Möglicherweise haben deshalb die spielerisch gewonnenen restlichen sieben Mittelwertfunktionen keine Beachtung in der Literatur gefunden!? 55 Z. B. [Naas & Schmid 1962, 178]. 56 Für diesen Hinweis danke ich meinem Kollegen Ernst Albrecht von der Universität des Saarlandes. 57 Vgl. [Hischer & Lambert 2003]. 58 Der Untersuchung von symmetrischen Mittelwertfunktionen, die dann auch „kommutati- ve Mittelwertfunktionen“ genannt werden, und von nicht-kommutativen Mittelwertfunktionen widmet sich die Abhandlung [Hischer & Lambert 2003]. 30 H. Hischer Abb. 7 zeigt eine 2D-Darstellung sowohl dieser vier symmetrischen pythagoreischen Mittelwertfunktionen als auch der Quadratmittelwertfunktion Q , und zwar in einer Reduktion auf x M (x , 1) mit x ∈] 0; 1] . 59 Abb. 7: symmetrische pythagoreische Mittelwerte und quadratisches Mittel Diese Darstellung gibt Veranlassung zur Entdeckung einer Erweiterung der babylonischen Ungleichungskette (7): x ≤ y ⇒ x ≤ H (x , y ) ≤ G (x , y ) ≤ A(x , y ) ≤ Q(x , y ) ≤ K (x , y ) ≤ y (12) Beweis: A(x , y ) ≤ Q(x , y ) und Q(x , y ) ≤ K (x , y ) sind jeweils äquivalent zu (x − y )2 ≥ 0 , und es ist K (x , y ) ≤ y ⇔ x ≤ y . Es sei noch darauf hingewiesen, dass A , die Mittelwertfunktion für das arithmetische Mittel, hier eine „Trennung“ zwischen den beiden konvexen Funktionen K und Q einerseits und den beiden konkaven Funktionen G und H andererseits bewirkt. 59 So dargestellte Mittelwertfunktionen werden nach einem Hinweis meines Kollegen Ernst Albrecht von der Universität des Saarlandes z. T. auch „Mittelfunktionen“ genannt. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 3 31 Mittelwerte in der Neuzeit — ein Überblick 3.1 Nicolas Chuquet, Medianten, Farey-Brüche und Ford-Kreise Der französische Arzt Nicolas Chuquet wurde 1445 in Paris geboren, wo er Medizin studierte, und er wechselte etwa 1480 nach Lyon, wo er 1488 starb. Damit lebte er zwar im ausgehenden Mittelalter, wir können ihn jedoch besser dem Beginn der Neuzeit hinzurechnen (1492 war die Entdeckung Amerikas). In Lyon kam er durch seine Interessen und Aktivitäten zu mathematischen Ehren, was auch darin dokumentiert ist, dass er in den dortigen Steuertabellen von 1485 und 1487 als „Nicolas Chuquet, algoriste“ (also als „Algorithmiker“) aufgeführt wurde. 60 Moritz Cantor schreibt hierzu: 61 Nicolas Chuquet aus Paris hatte Medizin studiert und in dieser Wissenschaft das Baccalaureat erworben. Vielleicht fand diese Erwerbung in Lyon statt, wo eine berühmte Aerzteschule blühte. Jedenfalls begann und vollendete Chuquet in Lyon im Jahre 1484 ein Werk, welches er Le Triparty en la sciences des nombres benannte. Es ist zwar ausser in unserem Jahrhunderte (1880) niemals gedruckt worden, fand aber jedenfalls handschriftliche Verbreitung und wurde im XVI. Jahrhunderte von einem [...] Schriftsteller so umfassend benutzt, dass das Wort „abschreiben“ nicht selten besser zutrifft als sogar „ausschreiben“. Lyon war so recht der Platz, an welchem die Entstehung eines umfassenden Rechenwerkes von der Art dessen, mit welchem wir es zu thun haben, geplant und vorbereitet werden konnte. Diesem Werk Chuquets, seiner „dreiteiligen Abhandlung der Zahlen“, wollen wir uns hier akzentuierend zuwenden, und zwar nur einem besonderen Aspekt des ersten Teils. Dieser widmet sich dem Rechnen mit rationalen Zahlen, der zweite Teil dem Rechnen mit irrationalen Zahlen und der dritte der Lehre von den Gleichungen. Und bei den rationalen Zahlen betrachtet er in der Tat auch Brüche und nega~ tive Zahlen, wobei er anstelle unserer Symbole + bzw. – die Zeichen ~ p bzw. m verwendet: 62 Die Regeldetri, rigle de troys, 63 wird gelehrt und auf die verschiedensten Aufgaben angewandt, auch auf solche, die mittels einfachen und doppelten falschen Ansatzes, rigle de une position und rigle de deux positions, gelehrt werden, die selbst eine Regeldetri voraussetzen. Bei solchen Aufgaben ist von negativen Zahlen [...] vielfach die Rede, und die Regeln, welche beim Rechnen mit denselben obwalten, werden genau auseinander~. gesetzt. [...] Die Zeichen der beiden Zahlenarten sind ~ p und m 60 http://www-history.mcs.st-and.ac.uk/history/Mathematicians/Chuquet.html, 22.09.2002 61 [Cantor 1892, 318] 62 [Cantor 1892, 322]; Hervorhebung nicht im Original. 63 Dreisatz, Schlussrechung; vgl. z. B. [Vollrath 1978]. 32 H. Hischer Cantor kommt nun zu dem uns hier interessierenden Aspekt: 64 Den Abschluss des I. Theiles bildet die von Chuquet als sein Eigenthum in Anspruch genommene R e g e l d e r m i t t l e r e n Z a h l e n , la rigle des nombres moyens. Sie a a a +a besteht aus der Behauptung, der Zahlenwerth b1 +b 2 liege immer zwischen b1 und b2 . 1 2 1 2 Die Richtigkeit der Behauptung zu beweisen fällt allerdings dem Erfinder nicht ein. Wenngleich Chuquet diesen Beweis schuldig bleibt, füllt Cantor sogleich diese Lücke, indem er darauf hinweist, dass sich dieser Beweis „am einfachsten“ ergeben würde, wenn man die Differenzen a1 a 1 + a 2 a1b2 − a 2b1 a + a 2 a 2 a1b2 − a 2b1 − = − = und 1 b1 b1 + b2 b1 + b2 b2 b1 (b1 + b2 ) b2 (b1 + b2 ) unter der (einzigen!) Voraussetzung betrachtete, dass b1 und b2 gleiches Vorzeichen hätten. Und in der Tat rechnen wir schnell nach, dass dann obige Differenzen ebenfalls dasselbe Vorzeichen haben würden, womit der Beweis erbracht ist, wie man sich klar machen möge. Wir können aber auch einen eleganten visuellen Beweis erbringen, zumindest für den Fall positiver Zähler und Nenner. In Abb. a +c Abb. 8: Visualisierung des Chuquet-Mittels b +d 8 wird dies dargestellt! 65 Wir entnehmen also Abb. 8 folgenden Satz als Spezialfall der Regel der mittleren Zahlen von Chuquet: a c a a +c c Für alle a, b, c, d ∈ R + gilt: < < ⇒ < b d b b +d d a +c a c Der Bruch heißt daher auch Chuquet-Mittel der Brüche und . 66 b +d b d a c Interpretiert man die Brüche b und d in Abb. 8 als Steigungen der Hypotenusen der dort erkennbaren rechtwinkligen Dreiecke, so erscheint das Chuquet-Mittel als mittlere Steigung der Hypotenuse des „Summendreiecks“ und also als „Mittelwert“. 64 [Cantor 1892, 322] 65 Vgl. auch [Hischer 1998, 7]. 66 [Herget 1985]; vgl. auch [Hischer 1998]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 33 Es ist zu beachten, dass die beim Chuquet-Mittel verwendeten „Brüche“ nicht in der (mathematisch üblichen) Rolle von Äquivalenzklassen auftreten, sondern nur als deren Repräsentanten (was aber wiederum typisch ist für den „Alltagsumgang“ mit Brüchen und zugleich zu vielen Verständnisproblemen führt). Das bedeutet nun, dass das Chuquet-Mittel nicht repräsentantenunabhängig ist, was man gern zu Beginn von Algebravorlesungen im Zusammenhang mit der Wohldefiniertheit von Verknüpfungen nachweist und was wir sofort an einem Beispiel sehen: • Es ist zwar 4 10 = 2 5 , hingegen ist 4 +1 10 +10 ≠ 2 +1 5 + 10 ! 67 Anmerkung: Wir müssen an dieser Stelle zur Kenntnis nehmen, dass das Symbol ab , das wir oft „Bruch“ nennen, zwar in der Mathematik „sauber“ als Äquivalenzklasse von Zahlenpaaren durch ab := {(x , y ) ∈ Z × Z * | ay = bx } definiert werden kann, jedoch im „Rest der Welt“ sowohl Äquivalenzklasse als auch Zahlenpaar und damit faktisch doppeldeutig ist (und bei genauem Hinsehen sogar teilweise in der Mathematik, wobei diese Doppeldeutigkeit dann situativ richtig zu interpretieren ist). Aber warum befasst sich nun Chuquet mit solch merkwürdigen Mittelwerten von Brüchen, genauer: mit Mittelwerten von Repräsentanten (von Brüchen)? Hierzu liefert Moritz Cantor eine interessante Erläuterung: 68 Die Anwendung dieses Mittelwerthsatzes 69 wird so gemacht, dass man zur Lösung einer Aufgabe versuchsweise zwei Werthe der unbekannten Grösse ansetzt, deren eine zu viel, die andere zu wenig hervorbringt, und dass man dann fortwährend neue Versuchswerthe aus den mittleren Zahlen sich bildet. Ganzzahlige Versuchswerthe werden der Regel untergeordnet, indem man sie als Brüche mit dem Nenner 1 betrachtet. Es ist anmerkenswert, dass Cantor im letzten Satz einen wichtigen Aspekt der Bruchdidaktik betont, nämlich die Auffassung ganzer Zahlen als Bruch mit dem Nenner Eins. Cantor fährt dann fort: Es soll z. B. die Gleichung x 2 + x = 39 13 gelöst werden, und man findet x 1 = 81 klein und x 2 = 6 1 zu gross. Der erste Mittelwerth heisst Versuch zu klein. Der zweite Mittelwerth ist 11+ 6 2 +1 = 5+6 1+1 17 3 . = 11 2 5 1 zu und zeigt sich beim Er erweist sich zu klein. 67 Vgl. hierzu [Hischer 1998] und [Hischer 2003]. 68 [Cantor 1892, 323]; Hervorhebungen nicht im Original. 69 Wir registrieren aufmerksam, dass Cantor die Regel der mittleren Zahlen von Chuquet als „Mittelwertsatz“ bezeichnet! 34 H. Hischer Der dritte Mittelwerth werth 23 + 6 4 +1 Mittelwerth 17 + 6 3 +1 = 23 4 besitzt die gleiche Eigenschaft. Der vierte Mittel- 23 = 29 5 giebt erst ein zu Grosses, und somit ist jetzt zwischen 4 23 + 29 52 dem Versuche zu unterwerfen. Er erweist sich als 4+9 = 9 und 29 5 der richtig, und die Aufgabe ist gelöst. Hier wird also anhand eines Beispiels ein Algorithmus beschrieben, wodurch verständlich wird, weshalb Chuquet „Algorithmiker“ genannt wurde (s. S. 31 oben). Cantor fährt fort: 70 Man erkennt sofort, dass nach dieser Methode jede Gleichung näherungsweise aufgelöst werden kann, wenn man die Mühe der jedesmal neu anzustellenden Versuchsrechnung nicht scheut. Man erkennt ebenso, dass die Wahl irgend einer anderen Versuchsgrösse z. B. des arithmetischen Mittels zwischen einem zu Grossen und einem zu Kleinen genau die gleich Berechtigung hätte. Aber man kann nicht leugnen, dass für den Chuquet’schen Mittelwerth als Vorzug sein verhältnismässig langsam anwachsender Nenner geltend gemacht werden kann. Dieser Algorithmus dient also der Einschachtelung einer gesuchten Gleichungslösung mit Hilfe des Chuquet-Mittels, und implizit behauptet Cantor, dass dies mit irgendeinem anderen Mittelwert (er spricht von „Versuchsgröße“) möglich wäre, z. B. mit dem arithmetischem Mittel, wobei das Chuquet-Mittel diesem gegenüber den „Vorzug verhältnismäßig langsam anwachsender Nenner“ habe. Wir stellen dieses für obiges Beispiel exemplarisch vergleichend in zwei Tabellen dar. Dabei ist x 2 + x =: f (x ) , und C (x , y ) bezeichnet das Chuquetmittel von x und y , wobei diese Argumente in einer eindeutigen Repräsentantendarstellung gegeben sein müssen, und A(x , y ) ist wie bisher das arithmetische Mittel von x und y : n 1 2 3 4 5 xn yn C (x n , yn ) f (C (x n , yn )) 5 1 11 2 17 3 23 4 23 4 6 1 6 1 6 1 6 1 29 5 11 2 17 3 23 4 29 5 52 9 143 4 340 9 621 16 986 25 3172 81 n < 39 13 81 1 < 39 13 81 2 < 39 13 81 3 > 39 13 81 4 = 39 13 81 5 xn yn 5 1 11 2 23 4 23 4 23 4 6 1 6 1 6 1 47 8 93 16 A(x n , y n ) f (A(x n , y n )) 11 2 23 4 47 8 93 16 185 32 143 13 4 < 39 81 621 13 16 < 39 81 2585 13 64 > 39 81 10137 13 256 > 39 81 40145 13 1024 > 39 81 13 Es ist 40145 1024 ≈ 39,20 4 und 39 81 ≈ 39,16 0 . Mit dem arithmetischen Mittel kann das Verfahren hier nicht „aufgehen“. Dennoch ergeben sich viele interessante Fragen! 70 Cantor a. a. O.; Hervorhebungen nicht im Original. Und hier verwendet Cantor – histo- risch vermutlich erstmalig, weil das Buch von Chuquet erst 1890 im Druck erschien – die Bezeichnung „Chuquet-Mittel“! Die in der Literatur z. T. auch vorkommende Benennung des Mittels nach Ampère (1775 in Lyon geboren, 1836 in Marseille gestorben) ist dadurch vielleicht zu erklären, aber historisch gewiss nicht gerechtfertigt! Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 35 Wir kehren nun zur bereits erwähnten Nicht-Wohldefiniertheit des Chuquetmittels zurück: Können wir dennoch das Chuquetmittel von zwei positiven reellen Zahlen y x , y bilden? Dazu benötigen wir eine Bruchdarstellung, etwa x1 und 1 wie im gerade betrachteten Beispiel, und wir würden dann C ( x1 , y1 ) = x +2 y erhalten, also das arithmetische Mittel von x und y . Wenn wir diese Brüche (genauer: ihre Repräsentanten!) wieder als Steigungen von Hypotenusen in rechtwinkligen Dreiecken interpretieren, liefert Abb. 9 eine Veranschaulichung dieses Sachverhalts, und das Chuquetmittel erscheint wiederum als mittlere Steigung und damit als „Mittelwert“ von x und y . Abb. 9: Chuquetmittel von x und y ? Abb. 10: Chuquetmittel von x und y ? Wenn wir nun das zweite Steigungsdreieck mit einem positiven Streckfaktor s zentrisch verzerren, so können wir als „mittlere Steigung“ m offenbar jeden Wert zwischen x und y erhalten, wobei s zwischen 0 und ∞ variiert (Abb. 10), d. h., wir können jeden „Mittelwert“ m zwischen x und y mit einem geeigneten s wie folgt darstellen: m = x1++sy s Das gibt dann mit Blick auf die Untersuchungen im Abschnitt 2 zu folgender Vermutung Anlass: Ist M eine beliebige „Mittelwertfunktion“ gemäß M: R 2+ → R + , so gibt es dazu stets eine „Streckfaktorfunktion“ S gemäß S: R 2+ → R + mit x + S (x , y )y . (13) M (x , y ) = 1 + S (x , y ) Ist umgekehrt eine solche Funktion S beliebig vorgegeben, so ist mittels (13) wohl (?) eine Mittelwertfunktion erklärt. Die Untersuchung dieser Vermutung setzt allerdings voraus, dass der Begriff „Mittelwert“ axiomatisch sinnvoll erklärt ist, d. h.: es ist zu klären, was man unter einem numerischen „Mittelwert“ verstehen will! 71 71 Dieser Gedankengang wird in [Hischer & Lambert 2003] verfolgt. 36 H. Hischer Schreiben wir (13) kurz als m = x +sy 1+s , so können wir diese Gleichung nach m −x (14) s= y −m auflösen. Und hier kommen wir nun über Chuquet zurück zu den Pythagoreern, denn auf der rechten Seite von (14) steht gerade das Größenverhältnis, das in den definierenden Proportionen der ersten sechs pythagoreischen Mittelwerte vorkam! Somit haben wir also über die bisherigen historischen Betrachtungen nicht nur die Vermutung gewonnen, dass das Chuquetmittel dazu geeignet ist, um beliebige numerische Mittelwerte darzustellen und um damit zu einer Theorie numerischer Mittelwerte zu gelangen, sondern wir sehen zugleich, dass der Grundstein hierzu bereits vor rund 2500 Jahren bei den Pythagoreern gelegt worden ist, die dabei wiederum „nur“ variierend und verallgemeinernd auf die rund 4000 Jahre alten drei „klassischen“ babylonischen Mittelwerte zurückgegriffen haben. 72 Es sind noch Nachträge angebracht: Kenner der Zahlentheorie werden gemerkt haben, dass das Chuquetmittel von zwei Brüchen aus von Null verschiedenen natürlichen Zahlen dort als Mediante bekannt ist. (Diese Tatsache beweist umso mehr, dass auch die Mathematiker den Begriff „Bruch“ situativ interpretieren – entweder als Äquivalenzklasse oder als Repräsentant dieser Klasse, denn sonst wäre die Mediantenbildung wegen der Vieldeutigkeit gar nicht möglich!) Und zwar spielen die Medianten (und damit das Chuquetmittel, was dasselbe ist!) bei den sog. Farey-Folgen eine wichtige Rolle: Der Geologe John Farey (1766 – 1826), beschrieb diese nach ihm benannten „Folgen“ 1816 in seinem Artikel “On a curious property of vulgar fractions” in der Zeitschrift “Philosophical Magazine“: Für ein n ∈ N * heißt F n eine Farey-Folge der Ordnung n , die definiert ist durch: a a F n := ⎧⎨ | a, b ∈ N * ∧ 0 ≤ ≤ 1 ∧ b ≤ n ⎫⎬ b ⎩b ⎭ 0 1 1 1 2 1 3 2 3 4 1 F 5 = ⎧⎨ , , , , , , , , , , ⎫⎬ . Es ist dann z. B. ⎩1 5 4 3 5 2 5 3 4 5 1⎭ Hierbei wurden nur die vollständig gekürzten Brüche notiert. 72 Diese Feststellungen sind Anlass für die axiomatischen Untersuchungen in [Hischer & Lambert 2003]. Ferner wird in [Hischer 2003] u. a. das Chuquetmittel didaktisch untersucht. 2004 wird der Autor in der Zeitschrift Der Mathematikunterricht ein Themenheft herausgeben, das sich „Mittelwerten und Mitten“ in ihrer vielfältigen historischen, theoretischen und unterrichtspraktischen Bedeutung widmen wird. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 37 Diese Farey-Folge (und darüber hinaus: alle Farey-Folgen!) hat folgende interessante Eigenschaft, wenn man ihre Glieder der Größe nach geordnet betrachtet: • Jedes Glied (bis auf das erste und das letzte) ist die Mediante (bzw. das Chuquetmittel) der beiden Nachbarn! Dabei wird man dann allerdings die Ergebnisse kürzen (sofern möglich). Andererseits kann man mit Hilfe der Mediante solche Farey-Folgen iterativ konstruieren: 0 1 (1) Iterationsbeginn mit 00 und 10 , d. h.: F 1 = ⎧⎨ , ⎫⎬ ⎩1 1⎭ (2) Iterationsschritt von F n zu F n +1 : Es werden alle Medianten zwischen „Nachbarn“ in F n hinzugefügt, die der Bedingung genügen, dass der neue Nenner kleiner oder gleich n ist. Wir demonstrieren dies anhand der iterativen Konstruktion von F 5 aus F 1 : 1 Die „neuen“ Glieder sind jeF1 0 1 1 weils schattiert hervorgehoben. 1 1 Würden wir obige ZusatzbedinF2 0 1 2 1 gung „dass [...] der neue Nen1 1 1 2 F3 0 ner kleiner oder gleich n ist“ 1 3 3 2 1 1 1 weglassen, so würde F4 nicht 1 1 2 3 F4 0 1 4 3 3 4 2 1 auftreten, und es ergäbe sich F 5 0 1 1 1 2 1 3 2 3 4 1 eine andere Folge von Farey1 5 4 3 5 5 3 4 5 2 1 Folgen (welche?) Auf [Ford 1938] geht eine sehr schöne Visualisierung der Farey-Folgen durch eine endliche Folge von Kreisen zurück, genannt „Ford-Kreise“. Und a zwar wird jedem (gekürzten) Element b – also aufgefasst als geordnetes Zahlenpaar (a;b) – einer Farey-Folge F n ein Kreis wie folgt zugeordnet: Radius: 1 2b 2 , Mittelpunkt: (, ) a b 1 2b 2 Abb. 11 zeigt die Fordkreise zu F 5 . Es gibt auch Visualisierungen durch „Ford-Kugeln“ in einer Ebene! Wie könnten diese aussehen? Abb. 11: Ford-Kreise zur Farey-Folge der Ordnung 5 – „Kreis“ als „Mitte“ zwischen zwei Kreisen! 38 H. Hischer 3.2 James Gregory und der Kreis als harmonisch-geometrisches Mittel Erste systematische Approximationen der Kreiszahl π verdanken wir bekanntlich Archimedes (287 bis 212 v. Chr.), wenngleich uns durch den Papyrus Rhind, den der Schreiber Ahmes verfasst hat, ägyptische Näherungswerte bekannt sind, die ca. 4000 bis 5000 Jahre alt sind. 73 Archimedes verwendete bekanntlich bereits Intervallschachtelungen, indem er – in heutiger Sichtweise – rekursiv definierte Folgen ein- und umbeschriebener regulärer n-Ecke betrachtet, wobei sein Rekursionsschritt in der Verdoppelung der Eckenanzahl besteht. Das Verfahren ist bekannt, numerisch aufwendig, und Archimedes vermeidet bereits – wie ebenfalls bekannt ist – durch geschickte Termumformung das Auftreten einer „Nullkatastrophe“. 74 Dieses Verfahren von Archimedes zur Approximation von π wird üblicherweise im Mathematikunterricht verwendet – falls man sich überhaupt die Mühe macht, ein historisches Verfahren zu benutzen. Im Sinne „historischer Verankerung“ 75 sollte man aber vor allem auf den bedeutsamen neuzeitlichen Algorithmus des Schotten James Gregory (1638 bis 1675) eingehen, den dieser 1667 in seinem Buch „Vera circuli et hyperbolae quadratura“ über Quadraturverfahren veröffentlichte und der bisher im Mathematikunterricht kaum eine Rolle spielt. So lesen wir hierzu bei Moritz Cantor: 76 Von ganz anderer Seite fasste ein englischer Schriftsteller, J a m e s G r e g o r y [...] , die Aufgabe der Quadratur in seiner 1667 gedruckten Vera circuli et hyperbolae quadratura. Gregory zeigt in einer für Kreis, Ellipse und Hyperbel gemeinschaftlichen Beweisführung, dass, sofern Vielecke, deren Seitenzahl fortwährend zunimmt, der Curve einbeschrieben und umschrieben werden, die Vielecke höherer Seitenzahl einen immer weniger von einander verschiedenen Flächeninhalt besitzen. Er zeigt ferner, dass, wenn A das erste Sehnenvieleck, B das erste Tangentenvieleck, C , D das zweite Sehnenbeziehungsweise Tangentenvieleck ist, alsdann C = A2AB + B , D = AB , d. h., ersteres das harmonische, letzteres das geometrische Mittel zwischen den den Ausgangspunkt bildenden Vielecken sein muss. Ebenso entstehen natürlich weitere Sehnen- und Tangentenvielecke E, F aus C, D u. s. w. Es bildet sich, wie Gregory schon in seiner Vorrede sagt, eine Series polygonorum convergens, cujus terminatio est circulus, und dieses Wort der C o n v e r g e n s kehrt im Verlauf der Schrift immer und immer wieder und ist von da an der Wissenschaft erhalten geblieben. Der Kreis ist also die Grenze, welcher beide Vielecksreihen zustreben, und zwar unter Anwendung eines Namens unserer Neuzeit als harmonisch-geometrisches Mittel. Der Grenzwert [...] wird erst nach unendlicher Gliederzahl der Reihe angetroffen. [...] Für die damalige Zeit war diese Auffassung allerdings so überraschend neu, dass Huygens sie nicht verstand [...] 73 Vgl. [Boyer 1968] und [Hischer & Scheid 1995, 20]. 74 Vgl. [Hischer & Scheid 1995]. 75 Vgl. [Hischer 1998]. 76 [Cantor 1892, 655 f]; Hervorhebung durch Unterstreichung nicht im Original. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 39 Gregory betrachtet also wie Archimedes regelmäßige n-Ecke (und zwar nicht nur an Kreisen, sondern sogar verallgemeinert an Kegelschnitten!), die er – wie dieser – durch systematische Eckenanzahlverdoppelung verfeinert. Er betrachtet allerdings, wie wir bei Cantor nachlesen, nicht die Umfänge der ein- und umbeschriebenen n-Ecke, sondern deren Flächeninhalte. Wir wollen Cantors Ausführungen verstehen und bezeichnen den Flächeninhalt des einbeschriebenen n-Ecks mit En und den des umbeschriebenen mit U n . Dazu setzen wir einen Kreis mit dem Radius 1 voraus und starten das Verfahren mit einem Quadrat, also mit n = 4 . Sofort erhalten wir E 4 = 2 und U 4 = 4 . Mittels elementargeometrischer Betrachtungen sehen wir E 8 = 2 2 und U 4 = 8( 2 − 1) , woraus wir E 8 = G (E 4 ,U 4 ) ablesen, hingegen ist leider U 8 ≠ H (E 4 ,U 4 ) . Nach Cantors Ausführungen hingegen müsste E 8 = H (E 4 ,U 4 ) und U 8 = G (E 4 ,U 4 ) gelten. Hier ist ihm offenbar durch den Druck ein Dreher unterlaufen (was uns allen passieren kann). Wir finden aber durch beharrliches Nachrechnen heraus, dass U 8 = H (E 8 ,U 4 ) gilt – man beachte die Indizes! Dies gibt Anlass zu der Vermutung, dass Cantor wohl verallgemeinert E 2n = G (E n ,U n ) und U 2n = H (E 2n ,U n ) meinte! Wir werden diesen Weg hier nicht weiter verfolgen, zumal ganz ähnliche Betrachtungen für die Umfänge der n-Ecke gelten, wobei die dazu erforderlichen rechnerischen Betrachtungen sich als sehr einfach erweisen werden. Daher bezeichnen wir im Folgenden mit E n den Umfang des einbeschriebenen n-Ecks und mit U n den des umbeschriebenen. Sodann ergeben sich die folgenden Gregory-Rekursionen für die Umfänge ein- und umbeschriebener n-Ecke: 77 U 2n = H (En ,U n ) und E 2n = G (En ,U 2n ) (15) Auch durch diese beiden Rekursionen wird die von Cantor verwendete Bezeichnung harmonisch-geometrisches Mittel motiviert. ) Es muss nachdrücklich darauf hingewiesen werden, dass in der zweiten Rekursion U 2n und nicht U n steht! Diese beiden auf diese Weise rekursiv verschachtelt definierten Folgen liefern einen äußerst eleganten Algorithmus zur Approximation von π, der in informatischer, folgenfreier Notation in Abb. 12 dargestellt ist. Er ist strukturell einfacher als der babylonische Algorithmus, konvergiert allerdings nicht so schnell wie dieser, ist andererseits ablaufäquivalent mit dem archimedischen Algorithmus und 77 Vgl. [Hischer & Scheid 1995]. Für die Flächeninhalte ergeben sich jedoch gemäß Cantor andere Rekursionen (s. o.): E 2n = G (E n ,U n ) und U 2n = H (E 2n ,U n ) . Beweis? 40 H. Hischer zugleich numerisch weitaus einfacher zu handhaben als dieser. Wie beim babylonischen Algorithmus ergibt sich auch hier die Konvergenz des Verfahrens und damit das Vorliegen einer Intervallschachtelung für 2π aus der babylonischen Ungleichungskette (7). Diese beiden Gregory-Rekursionen lassen sich elementargeometrisch mit Hilfe von Ähnlichkeitsbetrachtungen erschließen, sind also recht früh im Mathematikunterricht des Sekundarbereichs I behandelbar. Hiermit können die Begriffe „Folge“, „AlAbb. 12: Gregory-Algorithmus gorithmus“, „Iteration“ und „Approximation“ vorbezur Approximation von π reitet werden, und all dies kann in der Oberstufe weiter vertieft werden. Ein einfacher Weg zur Entdeckung dieser Gregory-Rekursionen ergibt sich aus Abb. 13. Der Schritt der Eckenanzahlverdoppelung ist hier für n = 4 dargestellt, aber Abb. 14 auf der nächsten Seite verdeutlicht, dass die folgende Argumentation dennoch uneingeschränkt gilt: Mit en bzw. e2n seien die Seitenlänge des einbeschriebenen n-Ecks bzw. 2nEcks bezeichnet, entsprechend mit 21 un bzw. 12 u 2n die halbe Seitenlänge des umbeschriebenen n-Ecks bzw. 2n-Ecks. Sodann lassen sich aufgrund von ÄhnAbb. 13: Herleitung des Gregory-Algorithmus lichkeitsbeziehungen (jeweils zwei Dreiecke sind ähnlich!) folgende Gleichungen aus der Zeichnung ablesen (vgl. hierzu die linke und die mittlere Darstellung in Abb. 14!): u2n en = (16) 1 1 1 u u − u n n 2 2 2n 2 e en = 1 2n e2n 2 u 2n (17) Da es unser Interesse sein muss, die Größen des 2n-Ecks auf die des n-Ecks zurückzuführen, da in (16) nur u2n vorkommt, und da in (17) e2n und u2n vorkommen, ergibt sich als Strategie, (16) nach u2n aufzulösen und (17) nach e2n . Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 41 Abb. 14: die linke Darstellung zeigt zwei ähnliche Dreiecke, gebildet aus Strecken im eingeschriebenen n-Eck und im umbeschriebenen n-Eck und 2n-Eck; die mittlere Darstellung zeigt zwei ähnliche Dreiecke, gebildet aus Strecken im eingeschriebenen n-Eck und 2n-Eck und im umbeschriebenen 2n-Eck; die rechte Darstellung visualisiert die Unabhängigkeit der Argumentation von der Eckenanzahl n. Sodann erhalten wir durch Äquivalenzumformung: e ⋅u u 2n = n n , e2n 2 = 21 en ⋅ u 2n en + u n Unter Berücksichtigung von U n = n ⋅ un und E n = n ⋅ en ergeben sich hieraus die Gregory-Rekursionen aus (15)! Per Konstruktion gilt En < U n für alle n , und wegen der babylonischen Ungleichungskette (7*) folgt zunächst E n < H (E n ,U n ) = U 2n < A(E n ,U n ) < U n Aus U 2n < U n folgt mit (7*) weiterhin E n < G (E n ,U 2n ) = E 2n < U 2n < U n , und damit erhalten wir aus beiden Ungleichungsketten E +Un E n < E 2n < U 2n < n < Un , 2 U − En was schließlich zu 0 < U 2n − E 2n < n 2 Abb. 15: Approximation führt, womit wir insgesamt wissen, dass hier eine Intervall- von 2π mit dem Algorithmus von Gregory schachtelung vorliegt und also der Gregory-Algorithmus konvergiert. Die Tabelle in Abb. 15 zeigt die Abarbeitung des Algorithmus beim Start mit einem Viereck, also mit den Startwerten E 4 = 4 2 und U 4 = 8 . Bezeichnen wir den gemeinsamen Grenzwert beider Folgen mit den Anfangswerten x, y mit HGM(x , y ) (in Anlehnung an „Harmonisch-Geometrisches Mittel), so ist HGM eine Mittelwertfunktion, und es gilt speziell HGM(4 2,8) = 2π . 42 H. Hischer 3.3 Gauß und das arithmetisch-geometrische Mittel (AGM) Die Gregory-Rekursionen (15) sind eine raffinierte Verschachtelung zwischen harmonischem und geometrischem Mittel. Carl Friedrich Gauß (1777 – 1855) untersuchte 1791, also im Alter von vierzehn Jahren, eine andere berühmt gewordene Verschachtelung zweier Folgen, die ebenfalls auf zwei klassischen Mittelwerten beruht: Ihr gemeinsamer Grenzwert ist das sog. arithmetisch-geometrische Mittel (AGM), das 1976 zu großer Berühmtheit gelangt ist. Die Bezeichnung AGM stammt von Gauß, aber bereits Joseph Louis Lagrange hatte vor Gauß dieses Mittel untersucht. Die zugrunde liegenden Folgen seien in ihrem Aufbau kurz beschrieben: Es seien x , y ∈ R + beliebig gewählt mit x ≤ y . Damit werden zwei Folgen rekursiv verschachtelt wie folgt konstruiert (für alle n ∈ N ): x 0 := x , x n +1 := G (x n , yn ) und y 0 := y , yn +1 := A(x n , yn ) Wegen der babylonischen Ungleichungskette (7) gilt: x n ≤ x n +1 ≤ yn +1 ≤ yn für alle n ∈ N (18) (19) Damit sind diese beiden monotonen Folgen beschränkt und also auch konvergent. Weiterhin ergibt sich analog zu (8) aus (19) und (4): y + xn y − xn (20) yn +1 − x n +1 ≤ yn − x n = n − xn = n 2 2 Mit vollständiger Induktion folgt analog zu (10): y −x (21) yn − x n ≤ 0 n 0 für alle n ∈ N 2 Damit haben wir neben dem babylonischen Algorithmus und dem Gregory-Algorithmus einen dritten Algorithmus gefunden, dessen Konvergenz auf der babylonischen Ungleichungskette (7) beruht. Den gemeinsamen Grenzwert der beiden Folgen ( =: AGM(x , y ) ), kann man zwar im Mathematikunterricht gut approximieren, wegen des exakten Grenzwerts (ein elliptisches Integral) muss man die Interessierten jedoch auf ein Mathematikstudium verweisen! AGM ist eine Mittelwertfunktion, d. h., es ist x ≤ AGM(x , y ) ≤ y , und es ist AGM(x , y ) = AGM(x n , y n ) . 1 ist die Gauß-Konstante oder Lemniskatenkonstante. AGM(1, 2 ) Es ist erwähnenswert, dass auf dem AGM einer der derzeit schnellsten Algorithmen zur Approximation von π beruht, der 1976 unabhängig von Richard P. Brent und Eugene Salamin entdeckt wurde. Gauß wird nicht geahnt haben, welche Folgen seine Entdeckung gut 200 Jahre später haben würde. Man recherchiere hierzu z. B. im Internet! Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 43 3.5 Ein Blick (Einblick) in die heutige Vielfalt von Mittelwerten Wenngleich zwar die drei klassischen babylonischen Mittelwerte von besonderer Bekanntheit sind, so stehen wir heute in der Mathematik vor einer kaum mehr überschaubaren Fülle von verschiedenen Mittelwerten. 78 Dabei sind es nicht nur numerische Mittelwerte, wie wir sie in dieser historisch orientierten Darstellung betrachtet haben, sondern es gibt auch nicht-numerische Mittelwerte, z. B. in der Stochastik, wenn es um qualitative Merkmale geht, oder in der Geometrie. Diese Vielfalt in der hier vorliegenden Abhandlung darzustellen überschreitet völlig die Möglichkeiten eines Fachzeitschriftenartikels, und so beschließe ich an dieser Stelle den mathematikhistorischen Streifzug und werfe exemplarisch einen Blick in ein (älteres) mathematisches Lexikon, und zwar in [Naas & Schmid 1962]. Dort finden wir u. a. folgende Bezeichnungen im Zusammenhang mit „Mittelwert“: 79 Mittelebene — Mittelenveloppe einer Fläche — Mittelfläche — Mittelpunkt paralleler Vektoren — Mittelpunkt einer Potenzreihe — Mittelpunktseikörper — Mittelpunktsgleichung — Mittelpunktskegelschnitt — Mittelpuntksquadrik — Mittelpunktswinkel (Zentriwinkel) — Mittelsenkrechte — Mittelstück — Mitteltransversale (Seitenhalbierende) — Mitteltypus (Normaltypus einer meromorphen Funktion) — Mittelungsverfahren — Mittelwerte — Mittelwerteigenschaft der Lösungen partieller Differentialgleichungen — Mittelwert einer fastperiodischen Funktion — Mittelwert einer Funktion — Mittelwertmethoden zur näherungsweisen Berechnung bestimmter Integrale — Mittelwerte n-ter Ordnung einer Funktion — Mittelwert reeller Funktionen auf einer topologischen Gruppe — Mittelwertsätze der Differentialrechnung — Mittelwertsatz der harmonischen Funktionen — Mittelwertsätze der Integralrechnung — Mittelwertsätze der Potentialtheorie — Mittelwerte unitärer Operatoren — Mittelwertvergleich, verteilungsfreier — Mittelwert von Verteilungen (Erwartungswert) — Mittendreieck eines Dreiecks — Mittenevolute einer Fläche — Mittenfläche eines Strahlensystems (Mittelpunkt) — Mittenvieleck — Mittlere Ableitung — Mittlere Affinkrümmungslinien — Mittlere Anomalie — Mittlere Bewegung einer fastperiodischen Funktion — Mittlere Breite — Mittlerer Fehler (Ausgleichsrechnung) — Mittlere Fehlerellipse — Mittleres Fehlerquadrat — Mittlere freie Weglänge — Mittlere geodätische Krümmung eines Kurvennetzes — Mittlere Krümmung einer Fläche — Mittlere Krümmung eines Kurvenbogens — Mittlerer Krümmungsvektor — Mittlere Proportionale — Mittlere quadratische Abweichung (Standardabweichung) — Mittleres Riemannsches Krümmungsmaß — Mittlere Stetigkeit eines Kernes (Eigenwert einer linearen Integralgleichung) ... 78 In [Hischer & Lambert 2003] wird gezeigt, dass es beliebig viele Mittelwertfunktionen gibt, die sämtlich vernünftigen axiomatischen Ansprüchen an das genügen, was „Mittelwerte“ ausmacht! In [Bullen et al., 1988] wird auf 342 (!) Seiten eine Vielzahl konkreter Mittelwerte untersucht, und nur innerhalb des 44 Seiten umfassenden letzten Kapitels (“Further Means, Axiomatics and other Topics”) wird im 12. Abschnitt (“Axiomatization of Means”) auf nur 3 ½ Seiten auf die Axiomatisierung eingegangen. 79 In der Literatur finden sich weitere vielfältige Beispiele zu Bezeichnungen und Begrif- fen im Zusammenhang mit „Mitte(lwert)“, z. B. im 2003 erschienenen Lexikon der Mathematik (Heidelberg: Spektrum Akademischer Verlag). 44 4 H. Hischer Mittelwertbildung als „fundamentale Idee“ der Mathematik ... daß die basalen Ideen, die den Kern aller Naturwissenschaft und Mathematik bilden, und die grundlegenden Themen, die dem Leben und der Dichtung ihre Form verleihen, ebenso einfach wie durchschlagend sind. Jerome S. Bruner, 1970 80 Bekanntlich bewirkte Bruner mit seinem Buch (insbesondere in der Didaktik der Mathematik) eine bis heute nachhaltige Diskussion über die Bedeutung der sog. fundamentalen Ideen für die Planung und Gestaltung von Unterricht, wobei in der fachlichen Diskussion auch andere Bezeichnungen wie etwa zentrale Ideen oder universelle Ideen mit je eigenen Akzentuierungen anzutreffen sind. Das Problem des mit dieser Bezeichnung verbundenen Begriffs besteht in seiner immanent angelegten verführerischen Aufforderung zu einer voraussetzungsfreien, subjektiven, spontanen und intuitiven Deutung. Und folglich bietet die fachliche Literatur auch eine Fülle je spezifischer Interpretationen dieses Begriffs. Das Verdienst eines fundierten Überblicks über die in der mathematikdidaktischen Fachliteratur anzutreffende Reichhaltigkeit der Auslegungen dieses vagen Begriffs gebührt Schweiger mit seiner „geisteswissenschaftlichen Studie“ über fundamentale Ideen. 81 Insbesondere stellt Schweiger in einer bemerkenswerten Akzentuierung wesentliche gemeinsame Aspekte der unterschiedlichen Auffassungen über fundamentale Ideen heraus, die zu Kriterien über fundamentale Ideen führen (können). Hieran anknüpfend habe ich 1998 betont, dass man diese unterschiedlichen Kriterien in deskriptive und normative unterscheiden müsse, also in solche, die ihrer Auffindung dienen und solche, die mit ihnen verknüpfte pädagogische Erwartungen zum Ausdruck bringen. Zugleich habe ich das damit verbundene Konzept über fundamentale Ideen exemplarisch erstmals an der Mittelwertbildung konkretisiert, wobei mir wichtig ist, dass nicht die „Mittelwerte“ selbst eine fundamentale Idee sind, sondern ihre Bildung, also eine Handlung! Hier schließe ich mich ausdrücklich Schweiger an: 82 Eine fundamentale Idee ist ein Bündel von Handlungen, Strategien und Techniken [...] 80 Jerome Seymor Bruner in seinem Buch „Der Prozeß der Erziehung“, 1970. 81 [Schweiger 1992]; aus der umfangreichen Literatur über fundamentale Ideen sind u. a. noch die Analyse und der Standpunkt von [Heymann 1996] und das Themenheft [Klika 2003] zu nennen. 82 [Schweiger 1992, 207]; Hervorhebung nicht im Original. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 45 Auch im wissenschaftlichen persönlichen Diskurs mit meinen Kollegen 83 hat sich dieser Aspekt der Handlung (wozu im Sinne Schweigers dann auch Strategien und Techniken gehören) als wesentlich für fundamentale Ideen (sowohl im deskriptiven als auch im normativen Sinne) bestätigt. Demgemäß kann man nicht von „Zahl“ oder „Algorithmus“ als fundamentalen Ideen sprechen, sondern es geht um das Zählen und das Algorithmieren (sofern man denn meint, dass dieses fundamentale Ideen seien). • „Fundamentale Ideen“ und „grundlegende Begriffe“ sind also zu unterscheiden! Im Folgenden soll am Beispiel der Mittelwertbildung erneut und in Kürze aufgezeigt werden, was nach meinem Verständnis unter deskriptiven bzw. normativen Kriterien bei fundamentalen Ideen zu verstehen ist. 84 Diese Kriterien belege ich mit plakativen Benennungen: deskriptiv: Historizität, Archetypizität, Wesentlichkeit, Vagheit Durchgängigkeit, Transparenz normativ: 4.1 Deskriptive Kriterien und Mittelwertbildung — oder: Wie kann man fundamentale Ideen ausfindig machen? Historizität — Die Idee der „Mittelwertbildung“ ist in der historischen Entwicklung der Mathematik als Wissenschaft aufzeigbar. In den Kapiteln 2 und 3 dieser Abhandlung wurde dieser Aspekt, vor allem bezüglich der Anfänge in der Antike, ausführlich dargestellt. Archetypizität — Die Idee der „Mittelwertbildung“ ist auch außerhalb der Mathematik auffindbar – gewissermaßen als ein Archetyp des Denkens. Dieser Aspekt ist kennzeichnend für viele Alltagsprobleme, so etwa für das Auftreten des Simpson-Paradoxons im Zusammenhang mit Statistiken und Durchschnittswerten, wobei „grundlegende Vorstellungen“ intersubjektiver Art hierfür (mit) verantwortlich sind. 85 Ein einfaches Beispiel möge dies verdeutlichen: 86 Abb. 16 kann man als WegZeit-Diagramm lesen, etwa für die Bewegung zweier Autofahrer: Nach rechts wird die Zeit abgetragen und nach oben der zurückgelegte Weg. Die Steigungen der Dreiecksseiten wären dann als die Geschwindigkeiten der Autofahrer zu interpretieren. 83 Dank an Hans Schupp und Anselm Lambert! 84 Vgl. hierzu auch [Hischer 1998] und [Hischer 2003]. 85 Beispiele dazu etwa in [Hischer 1998] und [Hischer 2003], ferner auch [Jahnke 1993]. 86 Bereits in [Hischer 1998] skizziert. Vgl. hierzu auch Abb. 8! 46 H. Hischer Abb. 16: Das „Simpson-Paradoxon“ in der Verkleidung als Paradoxon der Durchschnittsgeschwindigkeiten Es kann damit folgende Situation eintreten: Einer der beiden Autofahrer (dunkelgrau) fährt der Reihe nach mit den konstanten Geschwindigkeiten von z. B. 30 km/h und 100 km/h, der andere dagegen (hellgrau) mit jeweils größeren Geschwindigkeiten, etwa 70 km/h und 120 km/h, dennoch hat der dunkelgraue („langsamere“) eine größere Durchschnittsgeschwindigkeit v 1 als der hellgraue, „überall schnellere“. Plakativ gilt also: Man kann global verlieren, obwohl man überall lokal gewinnt! 87 Erläutert man diese Situation ohne solch eine Veranschaulichung Nicht-Mathematikern, so wird sie als paradox empfunden. 88 Die Mittelwertbildung ist also insofern archetypisch, als man nicht Mathematik studiert haben muss, um die Paradoxie in diesem Beispiel (und entsprechenden anderen) zu spüren — offenbar reichen hierzu „grundlegende“ Vorstellungen intersubjektiver Art aus. Die Mathematik ist jedoch hilfreich bei der Auflösung dieses Widerspruchs. Wesentlichkeit: Die Mittelwertbildung gibt (zumindest partiell) Aufschluss über das Wesen der Mathematik. Denn bei einer Analyse dessen, was „Mittelwerte“ sind, treten u. a. folgende wesentliche Aspekte mathematischen Tuns auf: Vermuten, Formalisieren, Beweisen, Widerlegen, Argumentieren, Verallgemeinern, Veranschaulichen, Systematisieren, Axiomatisieren und Theoriebildung. 89 Vagheit: Der Begriff eines numerischen Mittelwerts oder Mittels ist äußerst vielfältig und keinesfalls eindeutig. So kann bereits das Chuquet-Mittel zwischen zwei Brüchen als vieldeutiger „Mittelwert“ interpretiert werden, und jeder numerische „Mittelwert“ kann als ChuquetMittel aufgefasst werden, so dass sich beliebig viele numerische „Mittelwerte“ (als zweistellige Funktionen) erklären lassen, die sinnvollen axiomatischen Ansprüchen an Mittelwertbildung genügen. 90 87 In Abwandlung von [Meyer 1994]: „Man kann lokal gewinnen, aber global verlieren.“ 88 Und selbst diese Veranschaulichung wird dann die Paradoxie nicht sofort beseitigen! 89 Wir haben dieses bereits an vielen Stellen in Kap. 2 & 3 erfahren, und besonders deutlich wird dieser Aspekt in der axiomatischen Untersuchung in [Hischer & Lambert 2003]. 90 Vgl. [Hischer & Lambert 2003]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 47 Darüber hinaus gibt es auch „nicht-numerische Mittel“, etwa in der Geometrie (Mittelpunkt, Seitenhalbierende, Winkelhalbierende, ...), 91 ferner etwa in der Stochastik, wenn es um qualitative Merkmale geht.) 92 Auch Schweiger hebt diesen Aspekt der Vagheit in seiner Analyse mit Recht besonders hervor: 93 Vergleicht man die in den vorangegangenen Abschnitten vorgestellten Kataloge, so zeigen sich überraschende Ähnlichkeiten, aber die Disparatheiten überweigen. Fischer schreibt dazu „Neben die Schwierigkeit der Umsetzung fundamentaler Ideen in der Unterrichtspraxis tritt das Problem, diese überhaupt herauszufinden“ [...] Dies dürfte mit der, fundamentalen Ideen zugeschriebenen Vagheit zusammenhängen. Es sei nochmals Jung 1978 zitiert: „Die Idee einer Sache ist etwas vage, braucht keine Detaillierung, macht sie erst sinnvoll.“ [...] Was Jung im Hinblick auf den lernzielorientierten Unterricht konstatiert, nämlich das Bestehen einer Unschärferelation „Je präziser, desto bedeutungsloser“ [...] scheint auch hier zuzutreffen. 4.2 Normative Kriterien und Mittelwertbildung — oder: Fundamentale Ideen der Mathematik als curriculare Strukturierungshilfe? Während die deskriptiven Kriterien dem Ziel dienen, fundamentale Ideen ausfindig machen zu können, bringen normative Kriterien Erwartungen an den Unterrichtsprozess zum Ausdruck. Für die Mittelwertbildung würde dies bedeuten: Durchgängigkeit: Die Mittelwertbildung gilt als eine tragfähige Idee, um curriculare Entwürfe des Mathematikunterrichts durchgängig gliedern zu helfen – von der Primarstufe bis hin zum Abitur (und darüber hinaus). 94 In Verbindung mit dem deskriptiven Kriterium der Historizität führt dies zur Einbeziehung kulturhistorischer Aspekte der Genese von Begriffen, Problemen und Ideen in den Unterricht, 95 was eine „historische Verankerung“ ermöglichen soll: Es geht dann um 96 die Verwendung historischer Beispiele im Unterricht, die sich als tragfähige Bausteine einer Unterrichtseinheit erweisen. Dabei sollten sie gemäß Toeplitz vom „Staub der Zeit“ befreit und in heutiger Formulierung dargestellt werden. „Geschichte der Mathematik“ erscheint in diesem Sinne als didaktischer Aspekt – zugleich wird ein Beitrag zur Kulturgeschichte geliefert. 91 Vgl. z. B. [Führer 1985] 92 Das Themenheft [Winter 1985] bietet eine reichhaltige Übersicht bezüglich unterschied- licher Mittelwerte. 93 [Schweiger 1992, 207] 94 Ausgewählte Unterrichtsbeispiele finden sich in [Hischer 2003], sie sind z. T. auch be- reits in [Hischer 1984] und [Hischer 1998] angedeutet. Auch Kap. 2 bietet Anregungen. 95 Vgl. hierzu auch die Ausführungen über „Begriffsbildung“ in [Hischer & Lambert 2002]. 96 [Hischer 1998, 12] 48 H. Hischer Transparenz: Die Mittelwertbildung als Idee soll bei der Planung, Durchführung und Auswertung von Mathematikunterricht helfen, diesen für alle Beteiligten inhaltlich zu strukturieren und transparent zu machen. Dieses Kriterium bedeutet, dass die — gemäß den deskriptiven Kriterien bereits lokalisierten — fundamentalen Ideen im Unterricht auch explizit bewusst gemacht werden müssen, um damit — auch für die Schülerinnen und Schüler! — im Unterricht als „roter Faden“ im Sinne des Kriteriums der Durchgängigkeit zu erscheinen. 4.3 Zusammenfassung und Ausblick für weitere Entwicklungsarbeit Während die vier normativen Kriterien dazu dienen können, durch theoretische Analyse und rationalen Diskurs einen Katalog fundamentaler Ideen zusammenzustellen, sind die normativen Kriterien durch empirische Evaluation bezüglich derart gefundener fundamentaler Ideen zu überprüfen, zumindest ist aber eine Sammlung subjektiver Unterrichtserfahrungen erforderlich. Heymann 97 gibt in seiner grundlegenden konstruktiven Analyse sechs fundamentale Ideen an, die er „zentrale Ideen“ nennt, nämlich die Idee der Zahl, des Messens, des funktionalen Zusammenhangs, des räumlichen Strukturierens, des Algorithmus und des mathematischen Modellierens. Auch wenn sie in dieser Formulierung nicht alle als „Handlung“ erscheinen, erfüllen sie ersichtlich die deskriptiven Kriterien für fundamentale Ideen. Zugleich fällt auf, dass die in dieser Abhandlung präsentierte Idee der Mittelwertbildung nicht in den Heymannschen Rahmen hineinpasst: denn sie ist trotz der ihr anhaftenden Vagheit viel konkreter als die Heymannschen Ideen. Andererseits erscheint sie gerade wegen ihrer Konkretheit viel unterrichtsnäher als die eher zu allgemeinen Heymannschen Ideen, die wiederum wegen ihrer Allgemeinheit und damit geringen Anzahl geeignet sind, in knapper Form grundsätzliche inhaltliche Aspekte des Mathematikunterrichts zu benennen. Das führt zu der These, dass es fundamentale Ideen auf zumindest zwei verschiedenen Ebenen mit unterschiedlichem Konkretisierungsgrad gibt, die Mittelwertbildung also eine Idee auf solch einer zweiten, „konkreteren“ Ebene ist. 98 Dies könnte dann (in Abwandlung von Heymann) folgendermaßen aussehen: Ebene 1: Zählen, Messen, räumliches Strukturieren, Algorithmieren, ... Ebene 2: Mittelwertbildung, Linearisierung, Optimierung, Symmetrisierung, ... 97 [Heymann 1996, 174] 98 Vgl. [Hischer 1997] und [Hischer 1998]. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 49 Die Listen in diesen Ebenen sind prinzipiell offen zu denken, und zwischen den Ideen dieser beiden Ebenen wird noch eine vernetzende Zuordnung zu treffen sein. Im Unterricht selber könnte es dann um das Wecken von Grundvorstellungen zu solchen Begriffen, Verfahren und Argumentationsmustern gehen, die mit diesen Ideen zusammenhängen. 99 Das zieht im Prinzip zwei weitere zu vernetzende Ebenen nach sich, die hier ebenfalls nur angedeutet seien und als Anregung für didaktische Forschungs- und Entwicklungsarbeit dienen mögen: Ebene 3: Grundvorstellungen (zu Begriffen, Verfahren und Argumentationsmustern) Begriffe: Term, Zahl, Variable, Funktion, ... , Mittelwert, ... , Symmetrie, ... Verfahren: Lösen von Gleichungen, Approximieren, Iterieren, ... Argumentationsmuster: Schlussregeln, Gegenbeispiele suchen, Fallunterscheiden, ... Ebene 4: Themen (zum Wecken solcher Grundvorstellungen) Extremalprobleme, Sortieren, ... Approximationsverfahren für Quadratwurzeln, ... Wachstum, Konvergenz und Divergenz, ... Durchschnittlicher Verbrauch ..., Mitten von Figuren und Körpern , ... ... Einerseits bilden damit fundamentale Ideen der ersten beiden Ebenen eine curriculare Strukturierungshilfe für die Planung und Durchführung von Mathematikunterricht, indem sie eher indirekt über die Auswahl von Themen im Sinne von Ebene 4 wirksam werden, ohne also (zunächst) selbst explizit im Vordergrund stehen zu müssen. Andererseits können die Bildungsziele eines solchermaßen strukturiertren Mathematikunterrichts nur dann erreicht werden, wenn die fundamentalen Ideen im Sinne des Kriteriums der Transparenz auch selbst Gegenstand des Unterrichts werden – zumindest in einer späteren Phase der Reflexion. Schließlich macht das Kriterium der Historizität deutlich, dass es sowohl notwendig als auch nützlich ist, kulturhistorische Aspekte der Genese von Begriffen, Problemen und Ideen in den Unterricht einfließen zu lassen, diesen damit auch zugleich im Sinne der Durchgängigkeit vertikal zu strukturieren und damit eine „historische Verankerung“ zu organisieren, die zugleich eine „Verankerung“ von Begriffen im Sinne von Ausubel ist. 100 Danksagung Das Erstellung dieser Abhandlung ist mir seit langem ein wichtiges Anliegen. Ich danke Dr. Anselm Lambert, Wissenschaftlicher Assistent an meinem Lehrstuhl, für viele kritisch-konstruktive Gespräche und die Durchsicht dieser Abhandlung, die deren Entstehung begleitet haben. 99 Vgl. [vom Hofe 1995] zum Konzept der Grundvorstellungen. 100 Vgl. [Hischer 1998]. 50 5 H. Hischer Literatur Becker, Oskar [1954]: Grundlagen der Mathematik in geschichtlicher Entwicklung. Freiburg / München: Verlag Karl Alber. Boyer, Carl B. [1968]: A History of Mathematics. New York: John Wiley & Sons, 1968. Bullen, P. S. & Mirtinović, D. S. & Vasić, P. M. (Hrsg.) [1988]: Means and Their Inequalities. Dordrecht, Holland: D. Reidel Publishing Company, 1988 Cantor, Moritz [1892]: Geschichte der Mathematik. Zweiter Band. Leibzig: Teubner. 1. Auflage. Cantor, Moritz [1894]: Vorlesungen über Geschichte der Mathematik. Erster Band, Leipzig: Teubner. 2. Auflage. (1. Auflage 1880) Ford, L. R. [1938]: Fractions. In: American Mathematical Monthly, 45(1938), 586 – 601. Führer, Lutz [1985]: Welche Vierecke haben einen „Mittelpunkt“? In: mathematik lehren, 1985, Heft 8, 38 – 43. Herget, Wilfried [1985]: Zoo der Mittelwerte. In: mathematik lehren, 1985, Heft 8, 50 – 51. Heymann, Hans Werner: Allgemeinbildung und Mathematik. Studien zur Schulpädagogik, Band 13, Reihe Pädagogik. Weinheim / Basel: Beltz, 1996. Hischer, Horst [1994]: Mittelwerte, Algorithmen und Folgen – ein Beispiel beziehungshaltigen Unterrichts durch „historische Verankerung“. In: Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht 1994 (Tagungsband). Hildesheim: Franzbecker, 1994, 147 – 150. Hischer, Horst [1997]: „Fundamentale Ideen“ und „Historische Verankerung“ — dargestellt am Beispiel der Mittelwertbildung. Kurzfassung in Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht. Hildesheim: Franzbecker, 1987, 223 – 226. Hischer, Horst [1998]: „Fundamentale Ideen“ und „Historische Verankerung“ — dargestellt am Beispiel der Mittelwertbildung. Langfassung in: mathematica didactica 12(1998)1, 3 – 21. Hischer, Horst [2000]: Klassische Probleme der Antike — Beispiele zur „Historischen Verankerung“. In: Blankenagel, Jürgen & Spiegel, Wolfgang (Hrsg.): Mathematikdidaktik aus Begeisterung für die Mathematik — Festschrift für Harald Scheid. Stuttgart / Düsseldorf / Leipzig: Klett, 2000, 97 – 118. Hischer, Horst [2003]: Mittelwertbildung — eine der ältesten mathematischen Ideen. In: mathematik lehren, 2003, Heft 119, 40 – 46. Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ... 51 Hischer, Horst & Lambert, Anselm [2002]: Begriffsbildung und Computeralgebra. In: Hischer, Horst: Mathematikunterricht und Neue Medien — Hintergründe und Begründungen in fachdidaktischer und fachübergreifender Sicht. Hildesheim: Franzbecker, 2002, 138 – 166. Hischer, Horst & Lambert, Anselm [2003]: Was ist ein numerischer Mittelwert? — Zur axiomatischen Präzisierung einer fundamentalen Idee. Erscheint in: mathematica didactica 17(2003)1, 3 – 42. Hischer, Horst & Scheid, Harald [1982]: Materialien zum Analysisunterricht. Freiburg: Herder. Hischer, Horst & Scheid, Harald [1995]: Grundbegriffe der Analysis — Genese und Beispiele aus didaktischer Sicht. Heidelberg / Berlin / Oxford: Spektrum Akademischer Verlag. Hofe, Rudolf vom [1995]: Grundvorstellungen mathematischer Inhalte. Heidelberg / Berlin / Oxford: Spektrum Akademischer Verlag. Jahnke, Thomas [1993]: Das Simpsonsche Paradoxon verstehen — ein Beitrag des Mathematikunterrichts zur Allgemeinbildung. In: Journal für Mathematikdidaktik 14(1993)3/4, 221 – 242. Klika, Manfred (Hrsg.) [2003]: Zentrale Ideen. Themenheft Nr. 119 in mathematik lehren, 2003. Meyer, Jörg [1994]: Über einige Paradoxa aus der Stochastik. In: Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht 1994. Hildesheim: Franzbecker, 239 – 242. Naas, Josef & Schmid, Hermann Ludwig [1962]: Mathematisches Wörterbuch mit Einbeziehung der Theoretischen Physik. Berlin / Leipzig: Akademie Verlag, B. G. Teubner. Neugebauer, Otto [1969]: Vorlesungen über Geschichte der antiken mathematischen Wissenschaften. Erster Band: Vorgriechische Mathematik. Berlin / Heidelberg: Springer. Resnikoff, Howard L. & Wells, R. O., jr. [1983]: Mathematik im Wandel der Kulturen. Braunschweig/Wiesbaden: Vieweg. Schweiger, Fritz [1992]: Fundamentale Ideen — Eine geisteswissenschaftliche Studie zur Mathematikdidaktik. In: Journal für Mathematikdidaktik 13(1992)2/3, 199 – 214. Vollrath, Hans-Joachim [1978]: Schülerversuche zum Funktionsbegriff. In: Der Mathematikunterricht, 24(1978)4, 90 – 101. Winter, Heinrich (Hrsg.) [1985]: Themenheft „Mittelwerte“. mathematik lehren, 1985, Heft 8. Anschrift des Verfassers Prof. Dr. Horst Hischer Email: [email protected], Web: http://hischer.de/horst/ Universität des Saarlandes, Lehrstuhl für Mathematik und ihre Didaktik, Postfach 15 11 50, 66041 Saarbrücken