Viertausend Jahre Mittelwertbildung

Werbung
math.did. 25 (2002), Bd.2
3
Viertausend Jahre Mittelwertbildung
Eine fundamentale Idee der Mathematik
und didaktische Implikationen
von
Horst Hischer (Saarbrücken)
Zusammenfassung: Die Idee der Mittelwertbildung durchzieht die gesamte Mathematik in
großer begrifflicher Weite und Vielfalt von ihren ersten Anfängen bei den Babyloniern vor
rund 4000 Jahren über die Pythagoreer bis in die heutige Zeit wie ein roter Faden. Sie erweist sich im deskriptiven Sinn als eine fundamentale Idee der Mathematik, die sich auch im
normativen Sinn zur vertikalen Gestaltung des Mathematikunterrichts eignet.
Summary: The notion of averaging in its numerous variations has been a central theme in
all areas of mathematics from its very beginnings in Babylon 4000 years ago to Pythagoreans and the present time. A basic idea in the descriptive sense, it has also proved, in the
normative sense, to be useful in teaching mathematics.
Es gibt aber drei mittlere Proportionalen in der Musik:
erstens die arithmetische, zweitens die geometrische,
drittens die reziproke, die man die harmonische nennt.
Archytas von Tarent, 428 – 365 v. Chr. 1
1
Vorbemerkung
Der Geschichtsschreiber Jamblichus von Chalkis (ca. 250 – 330 n. Chr.) berichtet,
dass Pythagoras von seinem Aufenthalt in Mesopotamien (bzw. „Babylonien“,
dem Gebiet etwa des heutigen Irak) die Kenntnis der drei „stetigen Proportionen“
und der „musikalischen Proportion“, die man auch die „vollkommene Proportion“
nennt, mitgebracht habe, welche schon ca. 2000 v. Chr. von den Babyloniern für
ihre Quadratwurzelapproximationen benutzt worden seien. [Becker 1954, 79] zitiert hierzu Jamblichus aus dessen Kommentar zur „Arithmetik des Nikomachos“:
1
Aus einem Fragment des Archytas von Tarent, zitiert nach [Becker 1954, 78].
4
H. Hischer
Man sagt, daß die vollkommene Proportion den Babyloniern gehöre und durch Pythagoras zuerst zu den Hellenen gelangt sei. Man findet auch, daß viele Pythagoreer von ihr
Gebrauch machten, wie Aristaios aus Kroton, der Lokrer Timaios, Philolaos, Archytas
von Tarent und andere mehr [...].
Mit dieser „musikalischen“ (bzw. „vollkommenen“) Proportion hängen die drei
„klassischen“ und wohl bekanntesten Mittelwerte zusammen: arithmetisches, geometrisches und harmonisches Mittel. Wir müssen dies alles im Zusammenhang mit
der Proportionenlehre der griechischen Antike und ihren Vorläufern sehen: 2
Proportionen hat schon die vorgriechische Mathematik betrachtet, z. B. an ähnlichen
Dreiecken. Für den Begriff des Verhältnisses hatten nicht nur die Ägypter und Babylonier in dem speziellen Fall der Steigung oder Neigung (Sqt, Ša-gal) besondere Bezeichnungen; sondern die Babylonier wenigstens besaßen schon für den Begriff des Verhältnisses im allgemeinen einen Terminus.
Den Pythagoreern waren spätestens im 5. Jahrh. drei Arten von mittleren Proportionalen
und natürlich auch die entsprechenden Proportionen bekannt [...]
Becker geht anschließend ausführlicher auf das schon eingangs partiell zitierte
Fragment des Archytas von Tarent ein und schreibt ergänzend dazu: 3
Die Geschichte dieser Arten von mittleren Proportionalen reicht vermutlich bis in die
vorgriechische Zeit zurück. Die babylonische bzw. altindische Methode zur Approximation von Quadratwurzeln [...] benutzt wesentlich die drei Mittel.
Und Moritz Cantor schreibt im selben Zusammenhang: 4
J a m b l i c h u s führt die Kenntnis der drei stetigen Proportionen, der arithmetischen,
geometrischen und harmonischen, auf Pythagoras und seine Schule zurück und lässt die
m u s i k a l i s c h e P r o p o r t i o n , welche aus zwei Zahlen, deren arithmetischem und
harmonischem Mittel sich bilde (a : a 2+b = a2ab
: b , z. B. 6 : 9 = 8 : 12 ), durch Pythago+b
ras aus Babylon, wo sie erfunden worden sei, zu den Hellenen bringen.
Es fällt nicht schwer das Auftreten der harmonischen Proportion auch von ägyptischen
Anfängen aus zu erklären. [...] Allerdings ist andererseits nicht zu vergessen, dass im alten Aegypten eine Proportionenlehre noch nicht nachgewiesen hat werden können [...].
Wir erinnern ferner daran, dass Jamblichus sich genauer mit Chaldäischem beschäftigte
[...] und sind trotz der späten Zeit, in welche seine schriftstellerische Thätigkeit fällt,
sehr geneigt diesen seinen Worten so weit Glauben zu schenken, als sie gräkobabylonische Beziehungen betreffen.
Was haben wir uns unter diesen „Proportionen“ und „mittleren Proportionalen“
vorzustellen? Wir werden uns mit diesen Inhalten in der gebotenen Kürze befassen.
2
[Becker 1954, 78]; Hervorhebungen nicht im Original.
3
[Becker 1954, 78] mit Bezug auf Platon, Timaois 36 a und Epinomis 991 a b.
4
[Cantor 1894, 155]; Hervorhebungen nicht im Original.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
2
5
Mittelwerte in der Antike und bei den Babyloniern
2.1 Proportionen und Proportionalen bei den Pythagoreern
Die nach Pythagoras von Samos (ca. 569 – ca. 475) benannte Schule der „Pythagoreer“ hatte ihre Blütezeit um 500 v. Chr. („ältere Pythagoreer“) und bestand bis in
den Anfang des 4. Jahrhunderts v. Chr. („jüngere Pythagoreer“), zuletzt in Unteritalien. Der Zahlbegriff der Pythagoreer, wie er sich z. B. in der arithmetica universalis des Archytas von Tarent (428 – 365 v. Chr.) zeigt, beschränkt sich (in
unserer heutigen Sprechweise) (bekanntlich?) 5 auf die von Eins verschiedenen
natürlichen Zahlen, die von ihnen als das Wesen aller Dinge angesehen wurden:
„Alles ist Zahl“ – die grundlegende Überzeugung der Pythagoreer, wir würden
heute auch sagen: ihr Paradigma – bedeutet also, dass alles (?) mit Hilfe von (solchen) „Zahlen“ beschreibbar ist. Damit ist gemeint, dass sich z. B. „Größenverhältnisse“ stets durch „Zahlenverhältnisse“ (im Sinne des o. g. Zahlbegriffs) ausdrücken lassen. Das sei aus heutiger Sicht skizziert:
Größen sind z. B. Längen, Flächeninhalte, Volumina, und solche Größen lassen
sich vergleichen, sofern sie „von gleichem Typ“, also „gleichartige“ Größen sind
(wenn z. B. nur Längen betrachtet werden). Sind a und b gleichartige Größen, so
kann (in heutiger Notation) entschieden werden, ob a < b , a = b oder a > b gilt
(Trichotomie). Ferner kann a + b und ggf. auch a − b (falls b < a ) gebildet werden. Da Größenverhältnisse durch „Zahlenverhältnisse“ („Zahl“ s. o.) angegeben
werden, müssen wir beachten, dass die Pythagoreer in unserer Sichtweise nur „positive“ Größen kannten.
Ist nun m eine Zahl (s. o.), und ist a eine Größe, so bedeute für uns m ⋅ a oder
kurz ma die aus m Summanden bestehende Summe a + a + … + a (heute würden wir dies induktiv definieren). Sodann könnten wir im Sinne der Pythagoreer
„Maß“ und „gemeinsames Maß“ erklären, wenn wir a, b und e als gleichartige
Größen voraussetzen (wobei wir mögliche Probleme hier nicht vertiefen):
• e wird genau dann ein Maß für a genannt, wenn eine „Zahl“ existiert, so dass
a = me gilt. (Man sagt dann auch: „a wird von e gemessen.“)
• e wird genau dann ein gemeinsames Maß von a und b genannt, wenn a
und b beide von e gemessen werden (wenn es also „Zahlen“ m und n gibt
mit a = me und b = ne ).
5
Ich ernte bei Gesprächspartnern oft Erstaunen darüber, dass in der Antike die Eins noch
nicht als Zahl aufgefasst worden sei. Doch: Sie ist eben nur die „Einheit“ und keine
„Vielheit“, und mit ihr „zählte“ man nicht, denn „Zählen“ beginnt erst mit der Vielheit!
6
H. Hischer
Größenverhältnisse und Zahlenverhältnisse werden wir in unhistorischer Weise mit
einem Bruchstrich schreiben, der natürlich (noch) nicht die Bedeutung eines Divisionszeichens hat. Sodann könnten wir in heutiger Notation darlegen, was für die
Pythagoreer „Größenverhältnis“ und „Zahlenverhältnis“ bedeuteten:
• Es seien a und b gleichartige Größen mit einem gemeinsamen Maß e , und
ferner seien m und n Zahlen. Dann gilt:
a m
=
:⇔ a = me ∧ b = ne
b
n
Wir beachten, dass hier lediglich eine „Verhältnisgleichheit“ definiert wird, während die „Verhältnisse“ selbst nicht explizit definiert sind. Diese (für uns nützliche)
Bruchschreibweise könnten wir jedoch vermeiden, indem wir nur schreiben:
a m
bedeutet: a und b stehen im selben Verhältnis zueinander wie m und n.
=
b
n
Und was dann „im selben Verhältnis zueinander“ bedeuten würde, wird gerade in
obiger Definition festgelegt, nämlich: a = me ∧ b = ne .
Nun fehlt noch eine Festsetzung darüber, wann zwei Größenverhältnisse gleich
sein sollen. Dies ergibt sich in naheliegender Weise wie folgt:
• Es seien a, b, c und d gleichartige Größen. Dann gilt:
a c
a m
c
m
.
=
∧
=
=
:⇔ Es gibt Zahlen m, n mit
b d
b
n
d
n
Wir beachten erneut, dass zwar auch hier die uns vertraute Bruchschreibweise verwendet wird, dass jedoch gar kein Bruchbegriff benötigt wird und ein solcher in
diesem Stadium auch gar nicht definiert ist. Wir haben also wiederum nur die
Gleichheit zweier abstrakter Verhältnisse definiert (s. o.)!
Zugleich erkennen wir in dieser symbolischen Darstellung die Grundüberzeugung
der Pythagoreer wieder, nämlich: Alles ist Zahl! Und das bedeutet: Alle Größenverhältnisse lassen sich durch Zahlenverhältnisse ausdrücken!
Vom heutigen Standpunkt kannten damit die älteren Pythagoreer (bis zum Zeitpunkt der Entdeckung der Inkommensurabilität – vermutlich durch Hippasos von
Metapont, ca. 450 v. Chr.) 6 nur positive rationale Zahlen (in der Form von Zahlenverhältnissen und Größenverhältnissen), was sie in ihrer Proportionenlehre
ausbauten – wenngleich solche Verhältnisse für sie keine Zahlen waren, sondern
eben nur Zahlenverhältnisse (s. o.).
6
Vgl. [Hischer & Scheid 1982, 5 ff] und [Hischer 2000, 98 ff].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
7
„Proportionen“ sind nun (in unserem Verständnis) i. d. R. Gleichungen zwischen
Größenverhältnissen, also etwa wie schon oben ab = dc .
Unklar bleibt noch die Bezeichnung „Proportionale“, die uns bereits im Eingangszitat als „mittlere“ Proportionale begegnete. Wir setzen dieses Eingangszitat des
Archytas von Tarent fort: 7
[...] Die arithmetische, wenn die drei Zahlterme in der Proportion folgende Differenz
aufweisen: um wieviel der erste den zweiten übertrifft, um soviel übertrifft der zweite
den dritten. Und bei dieser Proportion trifft es sich, daß das Verhältnis der größeren
Zahlterme kleiner, das der kleineren größer ist.
Zunächst erkennen wir, wie die Pythagoreer ihre „Proportionen“ (also die Verhältnisgleichungen) kommuniziert haben: nämlich in verbaler Beschreibung (denn unsere heutige Symbolik hat ihre Ursprünge im Wesentlichen erst am Beginn der
Neuzeit, insbes. 1591 durch Vieta, einem Formalisten). Und inhaltlich geht es hier
um eine spezielle mittlere Proportionale in der Musik, nämlich die „arithmetische“, die wir auch „arithmetisches Mittel“ nennen. (Auf den Zusammenhang mit
der Musik gehen wir später ein.) „Mittlere Proportionalen“ sind also Mittelwerte!
2.2 Die drei klassischen Mittelwerte als „mittlere Proportionale“
Beim arithmetischen Mittel spricht Archytas von „drei Zahltermen in der Proportion“ – nennen wir sie der Reihe nach a , b und c (zugleich in abnehmender
Größe geordnet). Der erste Zahlterm übertrifft nun den zweiten um a − b und der
zweite den dritten um b − c , und somit lautet die „Proportion“ in heutiger Notation
a −b = b −c ,
(1)
bei der also b die erwähnte „mittlere Proportionale“ ist. Wir errechnen hieraus
a +c
(2)
b=
2
und nehmen (verwundert?) zur Kenntnis, dass Archytas obige einfache „Differenzengleichung“ als Proportion bezeichnet. 8 Er fährt dann fort: 9
[...] Die geometrische, wenn der erste Term sich zum zweiten wie der zweite zum dritten
verhält. Die größeren Terme haben das gleiche Verhältnis wie die kleineren.
Hier wird also als weitere mittlere Proportionale in der Musik das geometrische
Mittel durch die Proportion
a b
(3)
=
b c
beschrieben, woraus wir b = ac erhalten.
7
8
9
Aus einem Fragment des Archytas von Tarent, zitiert bei [Becker 1954, 78].
Die Untersuchung der von Archytas erwähnten Ungleichung sei den Lesern überlassen.
[Becker 1954, 78]
8
H. Hischer
Und schließlich geht Archytas auf das harmonische Mittel als die dritte mittlere
Proportionale in der Musik wie folgt ein: 10
[...] Die reziproke Proportion (die man die harmonische nennt), wenn sich die Terme so
verhalten: um den wievielten Teil der eigenen Größe der erste Term den zweiten übertrifft, um diesen Teil des dritten übertrifft der Mittelterm den dritten. Bei dieser Proportion ist das Verhältnis der größeren Terme größer, das der kleineren kleiner.
Wie ist das mit Hilfe unserer heutigen Symbolsprache verständlich zu machen? a
übertrifft b um a − b , und dann ist offenbar (a − b) a der in obigem Zitat erwähnte „Teil der eigenen Größe“; entsprechend ergibt sich für zweiten o. g. „Teil“
(b − c) c , und beide Teile sind nach Archytas’ Beschreibung gleich:
a −b b −c
=
a
c
2ac
.
Hieraus errechnen wir
b=
a +c
Moritz Cantor beschreibt dieselbe Quelle von Archytas wie folgt: 11
Ein bei Porphyrius erhaltenes Bruchstück des Pythagoräers A r c h y t a s spricht nicht
nur von dem a r i t h m e t i s c h e n , dem g e o m e t r i s c h e n und dem h a r m o n i s c h e n
M i t t e l , er definirt sie gradezu, und zwar die beiden ersten in der heute noch gebräuchlichen Weise. Bei dem harmonischen Verhältnisse, fährt er fort, übertrifft das erste Glied
das zweite um den gleichen Theil seiner selbst, wie dieses mittlere Glied das dritte um
den Theil des dritten. In Buchstaben geschrieben heisst das: b ist harmonisches Mittel
zwischen a und c , wenn a = b + na und zugleich b = c + nc .
Wirklich folgt aus diesen beiden Gleichungen ab −−cc = ac und daraus c1 − b1 = b1 − a1 .
Diese verbale Beschreibung von Archytas’ Definition des harmonischen Mittels
stimmt zwar inhaltlich mit der von Becker überein, die symbolische Umdeutung ist
jedoch anders als unsere oben vorgenommene, weil sie wegen der Verwendung des
Terms b + na etc. nicht der pythagoreischen Denkweise in Proportionen entspricht,
obwohl sie inhaltlich korrekt ist. Sie ist jedoch im Sinne heutiger Denkweise ein
naheliegender Interpretationsansatz. Ebenso ist die bei Cantor dann angegebene
Gleichung c1 − b1 = b1 − a1 „unhistorisch“.
Diese „Reziprokengleichung“ ähnelt a − b = b − c , also derjenigen für das arithmetische Mittel, und sie legt die bei Becker und Cantor verwendete Bezeichnung
„reziproke ...“ nahe (vgl. obige Zitate), wenngleich die Namensgebung „harmonisches Mittel“ damit noch unmotiviert bleibt. Hierauf gehen wir später noch ein.
10 [Becker 1954, 78]; die sich anschließende Deutung ist spekulativ.
11 [Cantor 1894, 155]
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
9
2.3 Die drei „stetigen Proportionen“ und die „musikalische Proportion“
Wir sind mehrfach darauf gestoßen, dass bereits die Babylonier die von Archytas
beschriebenen Proportionen, also die drei sog. stetigen Proportionen (und damit:
arithmetisches, geometrisches und harmonisches Mittel) und die sog. musikalische
Proportion gekannt haben müssen, bevor Pythagoras auf seinen Reisen nach Mesopotamien von diesen Kenntnis erlangt hat. 12 Sowohl die archäologischen Befunde als auch die mathematikhistorischen Deutungen legen die Ansicht nahe, dass
die Babylonier vor etwa 4000 Jahren mit Hilfe dieser Proportionen ihre Quadratwurzelapproximationen durchgeführt haben, die man auf Keilschrifttafeln entdeckt
hat. 13
Wir wollen die entscheidenden Zusammenhänge aus heutiger Sicht darstellen und
denken uns zwei gleichartige (positive!) Größen x und y mit x < y gegeben, zu
denen wir eine zwischen diesen beiden Größen liegende dritte Größe als deren „Mittelwert“ kennzeichnen wollen. Bezeichnen wir die von Archytas beschriebenen
Mittelwerte aus dem Abschnitt 2.2 sinnfällig 14 mit A(x , y ) (arithmetisches Mittel),
mit G (x , y ) (geometrisches Mittel) und mit H (x , y ) (harmonisches Mittel), so gilt:
2xy
x +y
, G (x , y ) = xy , H (x , y ) =
(4)
A(x , y ) =
2
x +y
Und hierbei springt sofort ins Auge:
A(x , y ) ⋅ H (x , y ) = xy = (G (x , y )) 2
Diese Gleichung können wir äquivalent umformen zu:
x
H (x , y )
„musikalische Proportion“:
=
A(x , y )
y
(5)
(6)
Diese „musikalische Proportion“ lässt sich wie folgt physikalisch realisieren: Man
stelle nebeneinander vier auf den gleichen Grundton gestimmte Monochorde M1,
M2, M3 und M4 mit jeweils derselben Saitenlänge x auf. Greift man nun bei M1
die Länge y := x 2 ab, bei M2 die Länge A(x, y ) und bei M3 die Länge H (x , y ) ,
und schlägt man die vier Saitenabgriffe (M4 bleibt in voller Länge!) in der Reihenfolge M1 – M2 – M3 – M4 an (als Arpeggio), so erklingt eine „Kadenz“ — die
Tonfolgen M1 – M2 und M3 – M4 bilden dasselbe Intervall, nämlich eine Quinte!
12 Vgl. das Eingangszitat und Abschnitt 1 (dort insbesondere die Fußnoten 2 und 4).
13 Vgl. etwa [Neugebauer 1969, 33 ff]. Mehr dazu im nächsten Abschnitt.
14 So z. B. bei [Hischer & Scheid 1985, 4].
10
H. Hischer
Wegen xy = (G (x , y ))2 liefert also die musikalische Proportion, die ja äquivalent
ist zu (5), einen Zusammenhang zwischen den drei klassischen Mittelwerten – sie
war für die Pythagoreer daher eine vollkommene (oder: „goldene“ 15) Proportion!
Für uns ist es heute ein Leichtes, durch Verknüpfung der Terme aus (4) den Zusammenhang (5) abzuleiten und durch Umformung hieraus (6) zu erhalten. Um so
bewundernswerter muss es uns heute erscheinen, dass die „Alten“ die musikalische
Proportion (6) ohne die uns zur Verfügung stehenden Termumformungstechniken
entdeckt haben. Vermutlich haben die Babylonier diese Entdeckung „nur“ anhand
von Beispielen gemacht, was allerdings beeindruckend genug wäre! — Und was
hat die musikalische Proportion mit der Approximation von Quadratwurzeln zu
tun?
2.4 Der babylonische Algorithmus
Zunächst sehen wir bei dem Mathematikhistoriker Otto Neugebauer nach, einem
profunden Kenner der vorgriechischen Mathematik. So beschreibt er u. a. eine in
Berlin befindliche Keilschrifttafel, in der die Berechnung der Länge der Diagonalen eines rechteckigen Tores von etwa 4 m Höhe und 1 m Breite erläutert wird. Er
bezeichnet die Höhe mit h und die Breite mit w, übersetzt die verbalen Berechnungen in heute übliche Formeln und schreibt dann weiter: 16
Irgendeine Erklärung dieser Formeln gibt der Text natürlich nicht, mir scheint aber, daß
man sie in folgendem Verfahren finden kann. Auf Grund des Pythagoreischen Lehrsatzes, dessen Kenntnis aus verschiedenen Stellen der mathematischen Keilschrift-Texte
einwandfrei für die babylonische Mathematik gesichert ist, folgt, daß d zu berechnen
ist durch
d = h 2 + w 2 = 0 ; 28, 20 . 17
Nehmen wir nun an, es sei irgendein Näherungswert α1 einer irrationalen Quadratwurzel a bekannt (etwa die Wurzel aus der nächstliegenden Quadratzahl [...]). Dann ist
offenbar die Zahl β1 = αa1 wieder eine Approximation von a , und zwar so, daß β1
kleiner als a ist, wenn α1 größer als a war und umgekehrt. Aus den beiden Näherungswerten α1 und β1 erhält man also einen neuen und außerdem günstigeren Näherungswert dadurch, daß man das arithmetische Mittel
15 [Boyer 1968, 61]
16 [Neugebauer 1969, 35]; Hervorhebungen nicht im Original.
17 0; 28, 20 ist die übliche sexagesimale Darstellung für 28
60
+
20
60 2
.
Ferner ist zu betonen, dass der Satz des Pythagoras also nicht von Pythagoras stammt,
sondern dass er den Babyloniern schon rund 1500 Jahre vorher bekannt war!
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
α2 =
11
α1 + β1
2
aus den beiden ersten Näherungen bildet. Zu diesem α 2 gehört wieder ein auf der anderen Seite von
a liegender günstigerer Näherungswert
a .
α2
Setzt man in β2 den Wert von α 2 ein, so ergibt sich, daß β2 nichts anderes ist als das
sog. „harmonische“ Mittel
2α1β1
β2 =
α1 + β1
zwischen den ersten Näherungen α 1 und β1 .
Dieses Verfahren läßt sich natürlich fortführen und liefert sehr bald sehr gute Approximationen von a . Es ist aus dem klassischen Altertum bekannt, und ich glaube, daß es
auch den obigen Rechnungen zugrunde liegt.
β2 =
Neugebauer geht dann anschließend auf die hier nicht ausgeführten babylonischen
Rechnungen ein und macht plausibel, dass diese wohl mit Hilfe der oben beschriebenen Schritte durchgeführt worden seien. Das sich hieraus ergebende Verfahren
ist bekannt, und es hat z. T. seinen Niederschlag im Mathematikunterricht gefunden, oder es wird gleich das hierauf beruhende sog. Heron-Verfahren verwendet.
Der Mathematikhistoriker Oskar Becker geht in anderer Weise auf das babylonische Verfahren ein und beleuchtet dabei einen sehr wichtigen Aspekt, indem er –
eher nebenbei – die Bedeutung des geometrischen Mittels anspricht: 18
Die Geschichte dieser Arten von mittleren Proportionalen reicht vermutlich bis in die
vorgriechische Zeit zurück. Die babylonische bzw. altindische Methode zur Approximation von Quadratwurzeln [...] benutzt wesentlich die drei Mittel.
Hat man zwei Zahlen a, b , so ist ihr geometrisches Mittel ab , also b , falls a = 1 .
Ihr arithmetisches Mittel 21 (a + b) ist größer, ihr harmonisches Mittel 2ab : (a + b) ist
kleiner als ab . Das harmonische Mittel wird offenbar erhalten, wenn man das Quadrat
des geometrischen Mittels, also ab , durch das arithmetische Mittel 12 (a + b) dividiert.
Das ist aber gerade das Verfahren bei der Quadratwurzelnäherung. Es ist nämlich das
geometrische Mittel zwischen a, b und das zwischen ihrem harmonischen und arithmetischen Mittel dieselbe Zahl, und so kann man durch fortgesetzte Wiederholung des Prozesses der Einschiebung der beiden anderen Mittel das geometrische Mittel, speziell die
Quadratwurzel, unbegrenzt approximieren.
Diese Einschiebung ergibt die „musikalische“ oder „vollkommene“ Proportion:
18 [Becker 1954, 78 f]; Hervorhebungen nicht im Original.
12
H. Hischer
a:
2ab
a +b
=
a +b
2
: b , z. B. 1 :
4
3
=
3
2
: 2 [a = 1, b = 2]
Wir können daher den „babylonischen Algorithmus“ auch anders und einleuchtend
darstellen, indem wir auf die bereits eingeführten Beziehungen (und eine weitere!)
zurückgreifen: 19
Wesentlich für diesen Algorithmus ist einerseits die schon bekannte musikalische
Proportion in der Umformung (5), also
A(x , y ) ⋅ H (x , y ) = xy = (G (x , y )) 2 .
Und darüber hinaus ist die sog. babylonische Ungleichungskette
x ≤ y ⇒ x ≤ H (x , y ) ≤ G (x , y ) ≤ A(x , y ) ≤ y
(7)
bedeutsam, bei der das Gleichheitszeichen genau für x = y gilt.
Implizit macht auch Neugebauer in seiner Darstellung hiervon Gebrauch, und wir
sehen, dass die Babylonier im Prinzip hiervon Gebrauch gemacht haben müssen,
wenn auch vielleicht nicht bewusst.
Wie können wir diese Ungleichungskette verifizieren? Sie besteht u. a. aus den
Ungleichungen H (x, y) ≤ G(x, y) und G(x, y) ≤ A(x, y) , die sich jeweils äquivalent
in (x − y )2 ≥ 0 umformen lassen. Und sie enthält die Ungleichungen x ≤ H (x , y )
und A(x , y ) ≤ y , die jeweils äquivalent sind
zu x ≤ y , womit alles bewiesen ist.
Darüber hinaus gibt es eine in
Abb. 1 dargestellte sehr schöne
Visualisierung dieser Ungleichungskette, die auf Pappus
von Alexandria (ca. 250 – ca.
350 n. Chr.) zurückgeht: 20
Die Gültigkeit der in Abb. 1
abzulesenden Behauptungen
folgt mit dem Höhensatz
und mit dem Kathetensatz
des Euklid unter Beachtung
von (5).
Abb. 1: Visualisierung von arithmetischem, geometrischem und
harmonischem Mittel nach Pappus von Alexandria (3. Jh. n. Chr.)
Ferner ist die Gültigkeit von H (x , y ) < G (x , y ) < A(x , y ) < y für x < y unmittelbar
aus der Zeichnung ablesbar.
19 Vgl. [Hischer & Scheid 1982, 11 f], [Hischer & Scheid 1995, 19 f] und [Hischer 1998].
20 Gemäß [Boyer 1968, 205] im 3. Buch der „Sammlung“ von Pappus (dort im 2. Teil);
erwähnt auch bei [Hischer & Scheid 1982, 4] und [Hischer & Scheid 1995, 13].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
13
Und wie erkennen wir die Gültigkeit von x < H (x , y ) ? Wir denken uns einen
Kreis um den Halbkreismittelpunkt mit dem Radius A(x , y ) − x ! 21
Nunmehr betrachten wir (7) in der strengeren Form
(7*)
x < y ⇒ x < H (x , y ) < G (x , y ) < A(x , y ) < y
und erhalten daraus den babylonischen Algorithmus wie folgt, indem wir alles nun
gleich aus heutiger Sicht für positive reelle Zahlen x , y interpretieren:
Es sei ein a ∈ R + gegeben und ein Approximationswert für a gesucht. Ferner
sei eine beliebige multiplikative Zerlegung von a gemäß a = xy (und damit also
G (x, y ) = a ) mit x, y ∈ R + und x < a < y gegeben. Eine solche multiplikative
Zerlegung lässt sich stets finden: Ist nämlich a > 1 , so kann man offenbar z. B.
x := 1 und y := a wählen, und für den Fall a < 1 wähle man x := a und y := 1 .
Es folgt dann
• wegen (5):
A(x , y ) ⋅ H (x , y ) = (G (x , y )) 2
• wegen (7*):
x < H (x , y ) < G (x , y ) < A(x , y ) < y
= a
Das bedeutet: Aus einer bereits vorliegenden „Einschachtelung“ x < a < y erhalten wir eine neue, bessere mit Hilfe des harmonischen und des arithmetischen
Mittels gemäß H (x , y ) < a < A(x , y ) , während das geometrische Mittel G (x , y )
„stabil“ und unverändert bleibt, nämlich G (x , y ) = a . Und diesen Prozess können wir offensichtlich iterativ ad infinitum fortsetzen.
Und in der Tat erhalten wir auf diese Weise eine Intervallschachtelung, denn aus
(7*) ergibt sich wegen −H (x , y ) < −x mit A(x , y ) = x +2 y für alle x, y ∈ R + :
0 < A(x , y ) − H (x , y ) < A(x , y ) − x =
1
2
(y − x )
(8)
Notieren wir diesen Prozess in Folgenschreibweise für zwei rekursiv definierte
Folgen x n und y n mit den Startwerten x 0 := x und y 0 := y gemäß
x n +1 := H (x n , y n ) und y n +1 := A(x n , y n ) ,
so erhalten wir mittels vollständiger Induktion aus (8):
y −x
y n −x n < 0 n 0 für alle n ∈ N
2
(9)
(10)
21 [Boyer 1968, 205] weist darauf hin, dass Pappus im 3. Buch seiner „Sammlung“ nur den
Beweis des in Abb. 1 dargestellten Sachverhalts für sich in Anspruch nimmt, nicht aber
eine solche Darstellung selber, die er auf einen unbekannten Geometer zurückführt. Und
ferner beschreibt Pappus gemäß Boyer in seinem o. a. Buch auch „die“ Theorie der
Mittelwerte: “In Book III Pappus describes also the theory of means [...]”
14
H. Hischer
Der babylonische Algorithmus konvergiert somit! Wesentlich hierfür sind sowohl
die babylonische Ungleichungskette (7*) als auch die musikalische Proportion
(6) in der Gestalt von (5). Das geometrische Mittel wird hierbei zwar nicht wirklich
benötigt, wohl aber zeigt es uns für jedes n das zu approximierende Zentrum der
Intervallschachtelung an. In Abb. 2 wird diese Situation visualisiert.
Abb. 2: Visualisierung der Intervallschachtelung beim babylonischen Algorithmus
Zugleich liefert uns das geometrische Mittel in bekannter Weise Startwerte für den
Approximationsalgorithmus: Ist etwa a für ein a ∈ R + mit a > 1 zu approximieren, so wähle man, wie schon erwähnt, x 0 := 1 und y 0 := a .
Wegen G (x , yn ) = a ist dann x n yn = a , und mit (9) erhalten wir:
a
(11)
yn +1 = 12 (yn +
yn )
Der in dieser Form entschachtelte babylonische Algorithmus wird auch nach Heron
von Alexandria (ca. 10 – ca. 75 n. Chr.) benannt, teilweise auch nach Newton. 22
2.5 Die babylonische Approximation von
2
Aus der archäologischen und mathematikhistorischen Forschung wissen wir, dass
die Babylonier bereits vor rund 4000 Jahren Approximationen von 2 vorgenommen haben, u. a. im Rahmen der Berechnung ihrer astronomischen Tabellen. So
zeigen uns Keilschrifttafeln aus der Zeit um etwa 2000 v. Chr., dass die Babylonier folgende Approximationen von 2 (≈ 1,4142135 ) kannten: 23
24
51
10
25
1+
≈ 1,416 und 1 +
+ 2 + 3 ≈ 1,4142129
60
60 60
60
22 [Boyer 1968, 31]
23 In dezimaler Transliteration der sexagesimalen Darstellung! Vielfältig in der Literatur
und im Internet referiert; beispielsweise die erste bei [Neugebauer 1969, 37] und die
zweite bei [Resnikoff & Wells 1983; 65]. Bezüglich der Keilschrift finden sich Hintergrundinformationen auch bei [Hischer 2002, 324 – 327].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
15
Wie waren damals solch hervorragende Approximationen möglich? Zunächst sind
einige Bemerkungen zum Fund und
zur Entdeckung der zweiten o. g.
Näherung angebracht:
Abbildung 3 zeigt die ungefähr 3600 bis 3800 Jahre
alte berühmte Keilschrifttafel “Yale YBC 7289”
aus Babylonien (im Gebiet
des heutigen Irak). 24 Sie
besteht aus getrocknetem
Ton, ist etwa handtellergroß und wurde erst im Jahre 1912 (neben vielen anderen
Tontafeln!) gefunden. Sie befindet sich nun in einer Sammlung
der Universität von Yale (USA) in
Abb. 3: Keilschrifttafel Yale YBC 7289 –
der “Yale Babylonian Collection”
Darstellung der Approximation von 2
(YBC) mit der Nummer 7289.
Vor etwa 70 Jahren ist es dem Mathematikhistoriker Otto
Neugebauer und dem Archäologen Abraham J. Sachs
gelungen, die sog. „Keilschrift“ auf vielen solcher
Tontafeln zu entschlüsseln: Dazu
haben sie
diese (teilweise beschädigten)
sexagesimalen Schriftzeichen transkribiert und anschließend transliteriert.
Abb. 4 und Abb. 5 zeigen
dies für Yale YBC 7289. 24
An einer Quadratseite weist Yale
Abb. 4: Transkription YBC 7289 eine Längenangabe auf,
von Yale YBC 7289
nämlich 30, und an einer
Abb. 5: Transliteration
Diagonalen zwei Längenangaben, und zwar in
von Yale YBC 7289
sexagesimaler
24
51
10
25
35
Entwicklung:
und 42 +
+
1+
+
+
60 602
60 602 60 3
24 Alle Abbildungen entnommen aus [Resnikoff & Wells 1983, 65].
16
H. Hischer
Hier ist zu beachten, dass die babylonischen sexagesimalen Darstellungen kein
„Sexagesimalkomma“ enthielten. So kann beispielsweise „42, 25, 35“ sowohl
35
25 35 als auch 42 25
42 +
+ 2
+ 2 + 3 oder ...
60 60
60 60
60
bedeuten, was jeweils aus dem Kontext zu erschließen ist.
In diesem Fall zeigt sich, dass die erstgenannte Deutung richtig ist, wofür man
dann zwecks Eindeutigkeit die sexagesimale Kodierung „42; 25, 35“ verwendet:
Für den o. g. linken Ausdruck ergibt sich als Näherungswert 42,4263888 bzw. für
den rechten 0,707106481, entsprechend ergäbe sich für die Deutung der „30“ an
der Quadratseite entweder 30 bzw. 0,5. Es fällt auf, dass 0,707106481 ≈ 12 2 ist.
Wenn es sich bei den Zahlen um Längenangaben handeln sollte, dann kämen wir
weiter, denn die Diagonalenlänge ist ja das 2 -fache der Kantenlänge. Und das
passt auch, wenn die Kantenlänge als 30 und nicht als 0,5 gedeutet wird, denn
42,4263888 ist ungefähr das 2 -fache von 30. Und nun haben wir es:
An der Diagonalen in Abb. 3 steht offenbar oberhalb der Umrechnungsfaktor zwischen Kantenlänge und Diagonalenlänge, und dann ist darunter noch ein konkretes
Beispiel, bezogen auf die Kantenlänge 30, angegeben!
Aber wie konnten die Babylonier vor rund 4000 Jahren zu so ausgezeichneten Näherungswerten gelangen? Die babylonische Ungleichungskette (7*), die zu (9)
führt, weist uns einen möglichen Weg zur nachträglichen Deutung:
Beginnen wir mit x 0 := 1 und y 0 := 2 , so folgt:
4
20
3
30
,
=1+
y1 = A(1, 2) = = 1 +
2
60
3
60
17
25
24
y2 = A(x 1, y1 ) =
=1+
,
x 2 = H (x 1, y1 ) =
12
60
17
816
577
x 3 = H (x 2, y2 ) =
≈ 1,4142114 ,
y 3 = A(x 2, y2 ) =
≈ 1,4142156
577
408
Bereits im zweiten Durchlauf des Algorithmus liefert uns das arithmetische Mittel
den ersten babylonischen Näherungswert. Die Werte im dritten Durchlauf schachteln den zweiten babylonischen Wert lediglich ein.
Wir führen daher auch noch den vierten Durchlauf durch:
941664
665857
x 4 = H (x 3 , y 3 ) =
≈ 1,1412135 , y 4 = A(x 3, y 3 ) =
≈ 1,4142135
665857
470832
Nunmehr stimmen diese beiden Werte in der angegeben Stellenzahl bereits exakt
mit 2 überein, und dieser Wert ist kleiner als der zweite babylonische Wert!
x 1 = H (1, 2) =
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
17
Wir schließen daraus, dass die Babylonier diesen vierten Schritt vermutlich nicht
mehr vollzogen haben. Daher gehen wir nur bis zum dritten Schritt und entwickeln
die beiden dort angegebenen Brüche in Sexagesimalbruchreihen:
816
24
51
9
40
14
x3 =
=1+
+ 2 + 3 + 4 + 5 +…
577
60 60
60
60
60
y3 =
577
24
51
10
35
17
=1+
+ 2 + 3 + 4 + 5 +…
408
60 60
60
60
60
Diese Entwicklungen können nicht abbrechen, denn 408 enthält den Primfaktor
17, und 577 ist Primzahl. Rundet man diese beiden Werten nach unseren Rundungsregeln jeweils nach dem vierten Summanden, so würden wir erhalten:
24
51
10
24
51
11
816
577
≈ 1+
+ 2 + 3 , y3 =
≈ 1+
+ 2 + 3
60 60
60 60
577
408
60
60
Es liegt also die Vermutung nahe, dass die Babylonier ihren Algorithmus zweimal
voll durchlaufen haben und im dritten Schritt nur noch das arithmetische Mittel
von x2 und y2 berechnet haben, nämlich x3 , und dass sie dann x3 im Rahmen
ihrer Möglichkeiten nach der „dritten Nachkommastelle“ gerundet haben.
x3 =
Allerdings wäre theoretisch auch folgender Weg möglich, wenngleich er eher unwahrscheinlich ist, weil sich ein deutlich höherer Rechenaufwand ergäbe: Für das
arithmetische Mittel von x3 und y3 erhalten wir:
665857
665857
24
51
10
7
1
(
x
+
y
)
=
=
=
1
+
+
+
+
+ ...
2
3
3
470832 22 ⋅ 3 ⋅ 17 ⋅ 577
60 602 60 3 60 4
Alternativ und einfacher könnten wir auch nur das arithmetische Mittel der obigen
beiden „Reste“ von x3 und y3 bilden und erhielten dafür die Abschätzung
75
135
68
1
8
1
1⎛ 1
+ ... ≈ 4 = 3 + 4 ≈ 3
+ 4 ⎞⎟ + ... =
2⎜
3
4
60 ⎠
2 ⋅ 60
60
60
60
60
⎝ 60
Sinnvolle Rundung nach dem vierten Summanden ergibt dann in beiden Fällen den
überlieferten zweiten babylonischen Wert.
2.6 Mesotaeten
Die pythagoreischen Gleichungen (1) bzw. (2), also a − b = b − c bzw. a b = b c ,
die das arithmetische bzw. das geometrische Mittel charakterisieren, sind aus unserer Sicht formal sehr ähnlich: (1) besagt, dass die geordneten Paare (a;b) und (b; c)
differenzgleich sind, und (2) besagt, dass diese Paare quotientgleich sind. Und in
beiden Fällen wird eine Mitte zwischen zwei Größen a und b charakterisiert:
18
H. Hischer
a − b = b − c wurde als arithmetisches Problem zur Bestimmung von b aufgefasst, also als ein Problem zur Suche einer Zahl, die gleichabständig zwischen zwei
gegebenen Zahlen liegt – anders formuliert: Die Summe von zwei Zahlen ist
durch die Summe zweier gleicher Zahlen zu ersetzen. a b = b c hingegen war die
Beschreibung eines als geometrisch aufgefassten Problems, bei der es um eine
Proportion im Sinne des Wortes geht, also um ein Verhältnis von Größen, das wir
z. B. für den Fall von Streckenlängen aus unserer Sicht wie folgt formulieren können: Das Produkt von zwei Längen (aufzufassen als Flächeninhalt eines Rechtecks)
ist durch das Produkt zweier gleicher Längen (aufzufassen als Flächeninhalt eines
Quadrats) zu ersetzen. Hierzu muss man wissen, dass die Pythagoreer sog. „Flächenzahlen“ und „Körperzahlen“ kannten und benutzten. Moritz Cantor schreibt
hierzu: 25
Im platonischen Timäus findet sich eine Stelle, welche etwa folgendermassen heisst:
Um mit zwei Flächen eine geometrische Proportion zu bilden, deren äussere Glieder sie
sein sollen, genüge es eine dritte Fläche als geometrisches Mittel anzusetzen; sollen aber
zwei Körper die äusseren Glieder einer geometrischen Proportion sein, so müsse man
zwei von einander verschiedene innere Glieder annehmen, weil ein geometrisches Mittel
nicht vorhanden sei.
Im zweiten Fall geht es also um die Bestimmung von zwei mittleren Proportionalen.
Cantor schreibt dann weiter:
Flächen und Körper können hier nur als Zahlen und zwar als Produkte von zwei beziehungsweise von drei Faktoren angesehen werden. Das heisst man wusste damals, dass
im Allgemeinen das Maass einer Fläche, eines Körpers gefunden werde, indem man
zwei, drei Abmessungen miteinander vervielfältigte. Die Erklärung von Flächen- und
Körperzahlen als solcher Produkte ist ausgesprochen bei Euklid, sie ist ausgesprochen
bei Theon von Smyrna. [...]
Diese Betrachtungen vertiefen wir hier nicht weiter, sie sollten nur dem Verständnis
der Bezeichnungen „arithmetisches Mittel“ und „geometrisches Mittel“ dienen.
Die Bezeichnung „harmonisches Mittel“ war nicht die ursprüngliche; für ihre Herkunft gibt es zwei naheliegende Erklärungen: Einerseits liefert das harmonische
Mittel innerhalb der musikalischen Proportion eine Verknüpfung zwischen dem
arithmetischen und dem geometrischen Mittel, so dass die musikalische Harmonie
für die Namensgebung Pate gestanden haben mag.
Andererseits ist ein davon verschiedener möglicher Namensursprung dokumentiert,
wie wir z. B. bei Moritz Cantor lesen können, wobei dieser sich neben der bereits
oben zitierten Stelle im Timaios von Platon auch auf Nikomachus bezieht: 26
25 [Cantor 1894, 153]
26 [Cantor 1894, 154]; Nikomachus von Gerasa (das heutige Jarasch in Jordanien), lebte
ca. 60 – 120 n. Chr., er war Mathematiker und Philosoph und zählt zu den Pythagoreern.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
19
Wir sind nicht auf die Timäusstelle allein angewiesen, um die A n a l o g i e n u n d
M e s o t ä t e n , das sind die griechischen Namen für Verhältnisse und dabei auftretende
Mittel, für die Pythagoräer in Anspruch zu nehmen. Ein bei Nikomachus aufbewahrtes
Bruchstück des P h i l o l a u s 27 lässt den W ü r f e l d i e g e o m e t r i s c h e H a r m o n i e
genannt werden, weil seine sämmtlichen Abmessungen völlig gleich unter einander und
somit in vollständigem Einklange seien. Dem entsprechend habe man den Namen
h a r m o n i s c h e s V e r h ä l t n i s s wegen der Aehnlichkeit mit der geometrischen Harmonie eingeführt. Inder That spiegle sich dieses Verhältniss in jedem Würfel mit seinen
12 Kanten, 8 Ecken und 6 Flächen ab. Wir haben kaum nothwendig diese Stelle noch zu
erläutern und zu bemerken, dass 6, 8, 12 in stetigem harmonischen Verhältnisse ste1
.
hen, weil 16 − 18 = 18 − 12
Diesen Sachverhalt können wir auch mittels (4) durch H (6, 12) = 8 beschreiben.
Wir wenden uns nun den in obigem Zitat erwähnten „Analogien“ und „Mesotäten“
zu und werden erfahren, dass die Pythagoreer den bisher vorgestellten „drei klassischen Mittelwerten“ weitere hinzu gefügt haben. Moritz Cantor würdigt in diesem
Zusammenhang besonders Eudoxos von Knidos (408 – 355 v. Chr.): 28
E u d o x u s lebte um 408 – 355. Man weiss, dass er in K n i d o s geboren ist, dass er
Schüler des Archytas, in seinem 23. Lebensjahre auch während zwei Monaten Schüler
Platons in Athen war. [...] Um 375 stiftete Eudoxus selbst eine Schule in Kyzikus, dem
heutigen Panorma am Marmarameere, kam er mit zahlreichen Schülern nach Athen, wo
er wieder mit Platon enge verkehrte. Dann aber kehrte er nach Knidos zurück und starb
dort im Alter von 53 Jahren. Astronom, Geometer, Arzt, Gesetzgeber nennt ihn Diogenes Laertius, dem die wesentlichten biographischen Angaben über Eudoxus entstammen. Wir haben es hier nur mit dem Geometer zu thun [...].
Und Cantor schreibt weiter in dem uns interessierenden Zusammenhang: 29
E u d o x u s fügte zu den drei P r o p o r t i o n e n drei weitere hinzu. 30 Wir haben [...]
die Analogien und Mesotäten für die Pythagoräer in Anspruch genommen, wir haben
gesehen, dass der Ursprung einer bestimmten Proportion nach Babylon verlegt wird, von
wo Pythagoras sie mitgebracht habe, woraus für uns mindestens das folgt, dass man zur
Zeit des Jamblichus wie in Griechenland, so in den Euphratländern 31 jener sogenannten
musikalischen Proportion Beachtung schenkte.
27 Philolaos von Kroton (ca. 450 v.Chr.), Philosoph, Zeitgenosse von Sokrates, er wird zu
28
29
30
31
den jüngeren Pythagoreern gerechnet.
[Cantor 1894, 225]
[Cantor 1894, 226]; Hervorhebung nicht im Original.
Das bedeutet, dass Eudoxos die drei klassischen Mittelwerte um drei weitere ergänzt hat. Cantor nennt diese drei neuen Mittelwerte nicht explizit, wir werden aber später rekonstruieren, um welche es sich hier vermutlich handelt.
Gemeint ist Mesopotamien, also das „Zwischenstromland“ zwischen Euphrat und Tigris.
20
H. Hischer
Cantor setzt die Ausführungen fort: 32
Wir wollen hier über den Unterschied von Analogie und Mesotät einiges einschalten.
Die Erklärungen der griechischen Schriftsteller gehen freilich einigermassen auseinander, aber fasst man die verschiedenen Stellen alle zusammen, so kommt man zu folgender Auffassung. Ursprünglich hiess die geometrische Proportion ¢nalogia , 33 die Proportion im Allgemeinen, nämlich die arithmetische, die harmonische und sämmtliche
noch dazu kommenden hiessen mesÒthtej. 34 Der spätere Sprachgebrauch dagegen
verwischte diesen Unterschied und liess zuletzt unter Mesotät nur irgend etwas verstehen, was zwischen gegebenen Auessersten lag.
Lesen wir diesen Text sorgfältig und inhaltlich interpretierend, so war also die Bezeichnung „Analogie“ zunächst nur für diejenige Proportion reserviert, die das geometrische Mittel definiert, also für (2), während „Mesotaet“ eine Proportion meinte, die in Verallgemeinerung der drei klassischen Mittelwerte irgendeinen Mittelwert beschreibt. Keinesfalls dürfen wir „Mesotaet“ jedoch – wie der Text auf den
ersten Blick nahelegt – als Bezeichnung für irgendeine Proportion verstehen, sondern es muss „ein Wert zwischen zwei Äußersten“ beschrieben werden, also ein
Mittelwert!
Diese Deutung wird durch einen Blick auf die sprachlichen Wurzeln gestützt: 35
Das griechische mšsoj („mesos“) findet sich im lateinischen „medius“ wieder und
bedeutet „der mittlere“. Und das griechische Substantiv für „Mitte“ ist mesÒthj
(„mesotaes“) mit dem Plural mesÒthtej („mesotaetes“). Auch ist zu beachten, dass
es nicht „Mesothet“ heißt, so dass keine Zusammenstellung aus dem griechischen
mšsoj („mesos“, der mittlere) und qšsij („Thesis“, die Stellung) vorliegen kann.
Ferner dürften wir streng genommen, Cantor folgend, „Mesotaet“ nicht als „Mittelwert“ verstehen, sondern als eine Proportion, die einen Mittelwert definiert. Allerdings wird eine solche rigide Deutung in der Literatur nicht durchgehalten, so
dass oft „Mesotaet“ sowohl Proportion als auch Mittelwert ist. Wir folgen weiter
den Ausführungen Cantors und stoßen auf folgenden bemerkenswerten Aspekt: 36
Diese Darstellung schliesst zugleich in sich, dass es ursprünglich nur drei solcher Proportionen gab, für welche wir die von Architas gegebenen Definitionen kennen gelernt
haben. Es war die arithmetische, die geometrische, die entgegengesetzte Proportion,
welche diesen ihren Namen, upenantia, mit dem durch Archytas und Hippasos, wie wir
von Jamblichus erfahren, eingeführten Namen der harmonischen vertauschte.
32 Cantor a. a. O.; Hervorhebung nicht im Original.
33 ¢nalogia, latinisiert „analogia“ (Betonung auf dem ersten „a“ und auf dem „i“).
34 mesÒthtej, latinisiert „mesotaetes“ (Betonung auf dem „o“).
35 Für diesen Hinweis danke ich StD Bruno Schmitz, Studienseminar Braunschweig.
36 Cantor a. a. O.; Hervorhebungen nicht im Original. „upenantia“ wird noch erläutert.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
21
Hier erfahren wir nun, dass die harmonische Proportion (und damit: das harmonische Mittel) ihren Namen erst später durch Archytas von Tarent und Hippasos (den
mutmaßlichen Entdecker der Inkommensurabilität) erhalten habe, und dass diese
als dritte Proportion neben der arithmetischen und der geometrischen zunächst als
„entgegengesetzte Proportion“ aufgefasst worden sei, upenantia („hypenantia“)
genannt. Schmitz schreibt mir hierzu: 37
upenantioj entspricht genau dem lateinischen Begriff „subcontrarius“; upo 38 entspricht dem lateinischen „sub“ und enantioj 39 dem lateinischen „contrarius“. Das bedeutet dann im Deutschen tatsächlich „untergegensätzlich“. Das Wort bedeutet im Griechischen einfach „gegensätzlich“ und kommt bei Hesiod, bei Platon und Aristoteles und
bei einigen anderen Autoren vor.
Damit wird klar, weshalb in der Literatur vielfach (ohne weitere Erläuterung) darauf hingewiesen wird, dass das harmonische Mittel ursprünglich „subkonträres
Mittel“ geheißen habe: 40 Nicht etwa, weil diese Bezeichnung eine Spezifikation
von „konträres Mittel“ sei oder eine Abgrenzung meine (eine solche Bezeichnung
ist mir auch nicht bekannt), sondern weil das lateinische „subkonträr“ bzw. das
griechische „hypenantios“ hier einfach im Sinne von „gegensätzlich“ verwendet
wurde, was dann zu der von Cantor im Zitat nach Fußnote 36 verwendeten Bezeichnung „entgegengesetzte Proportion“ passt.
Doch warum heißt diese Proportion (und damit das Mittel) eigentlich „entgegengesetzt“? Moritz Cantor bezeichnet in seiner Übersetzung des Fragments von Archytas (vgl. das Eingangszitat, Fußnote 1) das entsprechende Mittel als „reziprokes“. Man ist vielleicht geneigt, diese Bezeichnung auf die heute gebräuchliche
kennzeichnende Proportion für das harmonische Mittel zurückzuführen, nämlich
1 1 1 1
− = − ,
c b b a
weil hier in Analogie zu (1) die Differenzgleichheit der Reziproken beschrieben
wird. Jedoch muss diese Deutung verworfen werden, weil „Kehrwerte“ von Größen in der pythagoreischen Proportionenlehre nicht vorkamen. Wohl aber liegt eine
andere Deutung nahe, zumal, wenn man davon ausgeht, dass zunächst nur drei
Mittelwerte und die entsprechenden Proportionen bekannt waren: In der babylonischen Ungleichungskette (7*) liegt nämlich das harmonische Mittel bezüglich des
arithmetischen Mittels „auf der anderen Seite“ des geometrischen Mittels, ist also
„entgegengesetzt“: H (x , y ) < G (x , y ) < A(x , y ) . Das scheint plausibel zu sein.
37 Herzlichen Dank an StD Bruno Schmitz, Studienseminar Braunschweig!
38 Anmerkung: gelesen „hypo“.
39 Anmerkung: gelesen „enantios“.
40 Z. B. [Boyer 1968, 77].
22
H. Hischer
Zurück zu Moritz Cantor, dessen letztgenannte Ausführungen wie folgt fortgesetzt
werden: 41
Als selbstverständlich ist dabei zu bemerken, dass nur Proportionen, die aus drei Zahlen
gebildet wurden, in Betracht kamen und mit jenen Namen belegt wurden, also nur s t e t i g e P r o p o r t i o n e n sind Mesotäten. 42 Zu den drei alten Mesotäten kamen drei
neue. 43 Das Mathematikerverzeichnis 44 sagt uns, E u d o x u s habe dieselben erfunden. Jamblichus berichtet, A r c h y t a s und H i p p a s o s hätten sie eingeführt, Eudoxus und seine Schüler nur die Namen verändert. Endlich traten noch vier Mesotäten hinzu und brachten die Gesamtzahl auf zehn, welche Nikomachus im II. S. n. Chr. gekannt
hat. Durch die Einführung der vier letzten machten sich, wieder Jamblichus zufolge,
T e m n o n i d e s und E u p h r a n o r verdient, Persönlichkeiten, die wir nur aus diesem
einzigen Citate kennen.
Wir halten fest, dass die drei ursprünglichen Mesotäten durch die Pythagoreer
Archytas und Hippasos um drei weitere ergänzt wurden, und dass schließlich noch
vier hinzu kamen, die dem Geschichtsschreiber Nikomachus im 2. Jh. n. Chr. bekannt waren, wobei nicht gesichert ist, wem wir diese vier weiteren zu verdanken
haben. Im 4. Jh. v. Chr. lebte ein bekannter griechischer Bildhauer und Maler namens Euphranor. Sollte dieser gemeint sein, so würden diese zehn Mediäten bereits den Pythagoreern bekannt gewesen sein, wie dies andere Historiker behaupten. So schreibt beispielsweise Carl B. Boyer u. a.: 45
It is reported that Pythagoras learned in Mesopotamia of three means – the arithmetic,
the geometric, and the subcontrary (later called the harmonic) – and of the “golden
proportion” relating two of these: the first of two numbers is to their arithmetic mean as
their harmonic mean is to the second of the two numbers. This relationship ist the essence of the Babylonian square-root algorithm, hence the report is at least plausible. At
some stage, however, the Pythagoreans generalized this work by adding seven new
means to make ten in all. [...]
It es difficult to assign a date to the Pythagorean study of means […].
Wir schließen uns dieser aktuelleren Geschichtsschreibung an und ordnen alle zehn
von Moritz Cantor erwähnten Mesotaeten den Pythagoreern zu, indem wir sie
pythagoreische Mittelwerte nennen. 46
41 [Cantor 1894, 226]; Hervorhebungen durch Unterstreichung nicht im Original.
42 Indirekt wird hier definiert, was eine stetige Proportion ist: nämlich eine solche
Gleichung zwischen zwei Größenverhältnissen, bei der nur drei Größen auftreten.
43 Wir werden noch rekonstruieren, welche hier gemeint sind, vgl. auch Fußnote 30.
44 Cantor bezieht sich hier auf das berühmte „Mathematikerverzeichnis“ des Proclus Dia-
dochus (411 – 485).
45 Vgl. etwa [Boyer 1968, 61]; Hervorhebungen nicht im Original.
46 Bei dieser Vereinbarung nutzen wir die Doppeldeutigkeit von „Mesotaet“ sowohl
als Proportion als auch als Mittelwert aus (vgl. die Bemerkung auf S. 18 unten).
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
23
2.7 Pythagoreische Mittelwerte — Versuch einer Rekonstruktion
Wir knüpfen zunächst an die Fußnoten 32 und 41 (Zitate von Moritz Cantor) an:
Der spätere Sprachgebrauch [...] liess zuletzt unter Mesotät nur irgend etwas verstehen,
was zwischen gegebenen Auessersten lag. [...]
Als selbstverständlich ist dabei zu bemerken, dass nur Proportionen, die aus drei Zahlen
gebildet wurden, in Betracht kamen und mit jenen Namen belegt wurden, also nur
s t e t i g e P r o p o r t i o n e n sind Mesotäten. [...] 47
Ganz in diesem Sinne hatten wir bereits an früherer Stelle vereinbart: 48
Wir wollen die entscheidenden Zusammenhänge aus heutiger Sicht darstellen und denken uns zwei gleichartige (positive!) Größen x und y mit x < y gegeben, zu denen
wir eine zwischen diesen beiden Größen liegende dritte Größe als deren „Mittelwert“
kennzeichnen wollen.
Um nun den pythagoreischen Weg der Untersuchung von Mittelwerten in heutiger
Notation nachvollziehen zu können, geben wir also zwei positive reelle Zahlen x
und y mit x < y vor mit dem Ziel, eine zwischen diesen beiden Zahlen liegende
dritte positive reelle Zahl m als deren „Mittelwert“
zu beschreiben. Wir visualisieren diese Situation
Abb. 6: m als „Mittelwert“
durch einen Abschnitt auf dem Zahlenstrahl (vgl.
zwischen x und y
Abb. 6).
Sodann ergeben sich für die definierenden Proportionen (1), (2) und (3) der drei
klassischen Mittelwerte der Reihe nach folgende „Übersetzungen“:
y −m = m −x
(1*)
y
m
=
m
x
(2*)
y −m m −x
=
y
x
(3*)
Die Mathematikhistoriker Moritz Cantor und Carl. B. Boyer geben nun in diesem
Sinn die schon auf S. 20 erwähnten zehn pythagoreischen Proportionen an (ohne
jedoch die Quellen dazu zu nennen), wobei sich ihre Darstellungen unterscheiden.
47 Hier sehen wir erneut, dass Moritz Cantor „Mesotaet“ sowohl als Bezeichnung für einen
Mittelwert als auch für die diesen Mittelwert definierende Proportion verwendet. Da wir
künftig nur noch von „Mittelwerten“ und „Proportionen“ sprechen werden, ist diese
Doppeldeutigkeit für uns irrelevant.
48 Vgl. Absatz 2 auf S. 7.
24
H. Hischer
In der folgenden Übersicht findet sich ein Vergleich dieser Darstellungen der definierenden Proportionen der pythagoreischen Mittelwerte sowohl durch [Cantor
1894, 227] als auch durch [Boyer 1968, 61]. Während Cantor die Variablen γ, β, α
(anstelle von x , m, y bei uns) verwendet, wählt Boyer a, b, c (jeweils in dieser
Reihenfolge!). Die Reihenfolge der jeweils zehn Proportionen wurde gegenüber
den Quellen nicht geändert. Wir verwenden einheitlich x , m, y .
(1C)
(2C)
(3C)
(4C)
(5C)
(6C)
(7C)
(8C)
(9C)
(10C)
Pythagoreische Mittelwertfunktion in den Darstellungen nach
Moritz Cantor (1894)
bzw.
Carl B. Boyer (1968)
m −x x
=
y −m = m −x
(1B)
y −m x
m −x
x
y
m
=
=
(2B)
y −m m
m
x
m −x x
y y −m
=
=
(3B)
y −m y
x m −x
y m −x
m −x y
=
=
(4B)
x y −m
y −m x
m m −x
m −x m
=
=
(5B)
x
y −m
y −m
x
y
m −x
m −x
y
=
=
(6B)
m y −m
y −m m
y
y −x
y −x
y
=
=
(7B)
x m −x
m −x x
y
y −x
y −x
y
=
=
(8B)
x y −m
y −m x
m
y −x
y −x
m
=
=
(9B)
x
m −x
m −x
x
m
y −x
y −x
m
=
=
(10B)
x
y −m
y −m
x
Sieht man von einer Vertauschung der linken und rechten Seite der Gleichungen
bei Cantor und Boyer ab, so sind die Proportionen (4C) und (4B) bis (10C) und
(10B) jeweils identisch, und die ersten drei Paare von Proportionen erweisen sich
immerhin jeweils als äquivalent. Aber warum wählen die beiden Historiker für die
Proportionen der klassischen Mittelwerte so unterschiedliche Darstellungen? Haben sie das selber geändert, oder beziehen sie sich auf unterschiedliche Quellen?
Da wir das ohne Bezug auf andere Quellen nicht entscheiden können, versuchen
wir es wenigstens mit einer nachträglichen Deutung!
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
25
Zunächst fällt auf, dass zwar sowohl (1*) und (1C) als auch (2*) und (2C) jeweils
identisch sind, dass jedoch schon bei Cantor in seiner eigenen Darstellung (3*) und
(3C) von grundlegend anderer Gestalt (jedoch für uns äquivalent) sind. Es gehört
jedoch zum Wissen der pythagoreischen Proportionenlehre, dass mit a : b = c : d
auch a : c = b : d gilt. Und so ist es naheliegend, dass man durch spielerische Betrachtung von (1*) zu (1C) gelangt, indem das man Verhältnis von Differenzen mit
dem Verhältnis von Größen vergleicht.
Hat man jedoch erst mal diesen Schritt durchgespielt und berücksichtigt man die
philosophisch-spielerische Einstellung der Pythagoreer zur Mathematik 49 (also
einer Einstellung, die nicht primär auf „Nützlichkeit“ und auf „Anwendung“ gerichtet ist, sondern spielerisch auf „Welterkenntnis“!), so liegt es geradezu auf der
Hand, die Struktur der Proportion (3C) zu variieren und jeweils das Verhältnis von
zwei Größen mit dem Verhältnis von der Differenz von drei Größen zu vergleichen. Das führt dann einerseits zur nachträglichen Umformulierung von (1C) bzw.
(2C) in (1B) bzw. (2B), wobei (1B) artifiziell wirkt, aber nun in das „System“
passt, wenn man noch (3C) durch Kehrwertbildung in (3B) umformuliert.
Betrachtet man nunmehr (1B) bis (3B) in ihrer gleichartigen Struktur, bei der auf
den rechten Seiten der Zähler gleich bleibt und der Nenner von (1B) nach (1C)
wächst, so ist es bei spielerisch-systematischer Betrachtung nacheliegend, zu fragen, wie man die rechte Seite noch weiter variieren kann, und man gelangt sehr
schnell zu (4B) bis (6B), zugleich feststellend, dass dies alle Möglichkeiten sind
(sofern man die linke Seite unverändert lässt). Darauf werden wir noch eingehen!
Somit wird plausibel, dass (4B) bis (6B) wohl die ersten drei weiteren Mesotäten
gewesen sind, die Eudoxos gemäß Cantor erfunden hat. 50
Nun mag irgendwann der Drang eingesetzt haben, nach einer weiteren Variationsmöglichkeit der Mesotäten zu suchen, die jedoch nur in einer Variation der linken
Seiten (in der Spalte von Boyer) zu finden ist und dann zur Entdeckung (oder „Erfindung“?) der restlichen vier Proportionen (7B) bis (10B) geführt haben mag, wie
sie gemäß Cantor auf Temnonides und Euphranor zurückzuführen sind. 51
Wir halten also fest, dass die Pythagoreer in ihrer systematischen Untersuchung
von Mesotäten insgesamt auf zehn Mittelwerte gestoßen sind, die sämtlich verschieden sind, weil wir wissen, dass diese zehn definierenden Proportionen nicht
äquivalent sind. Doch welchen Sinn hat das alles über das Spielerische hinaus?
49 „Mathematik als Spiel des Geistes“, vgl. [Hischer 2002].
50 Vgl. hierzu die Fußnoten 30 und 43.
51 Vgl. hierzu das Zitat nach Fußnote 41.
26
H. Hischer
Moritz Cantor vermag solchen Untersuchungen nichts abzugewinnen, denn er stellt
hierzu fest: 52
Andererseits erscheint es uns Neueren gar verwunderlich, dass die Griechen alle diese
Fälle unterschieden, mit deren sieben letzten im Grossen und Ganzen nichts geleistet ist,
dass sie in der Erfindung derselben etwas hinlänglich Bedeutendes erkennen, um die
Namen derer aufzubewahren, von welchen jene Leistung herrührt.
Aber anschließend kommt er aus anderer Perspektive dennoch zu einer positiven
Würdigung, wenngleich er die Bedeutung „weiterer Mittelwerte“ nicht anspricht
(evtl. gar nicht erkennt?): 53
Wir werden in die griechische Stufenleiter der Werthschätzung uns hineinfinden können, wenn wir zweierlei erwägen. Erstens, dass eine grosse Zahlengewandtheit dazu gehörte sämmtliche zehn Verhältnisse ganzzahlig zu erfüllen, zweitens, dass die aus vier
voneinander verschiedenen gebildete geometrische Proportion mit den aus ihr abzuleitenden für die Griechen bis zu einem gewissen Grade die Gleichungen und deren Umformung ersetzte. Die Folgerung von
α : β = γ : δ auf (α + β) : β = (γ + δ) : δ
z. B. spielte bei den Griechen fortdauernd die allerbedeutsamste Rolle. Stetige Proportionen hatten zur Kenntniss der arithmetischen, der geometrischen Reihen, jene wieder
zur Kenntnis der vieleckigen Zahlen geführt. 54 Was Wunder, dass man weiter experimentierte, dass man immer neue Verbindungen gleicher Verhältnisse zwischen Zahlen
aufsuchte, welche selbst aus drei gegebenen Zahlen additiv oder subtraktiv zusammengesetzt waren? Solche neue Proportionen konnten zu neuen wichtigen Entdeckungen
Gelegenheit geben, und thaten sie es nicht, so boten sie nur ein Beispiel, wie es deren in
der Geschichte aller Wissenschaften gibt, dass Untersuchungen mit hochgespannten
Hoffnungen und Erwartungen begonnen sich allmälig als unfruchtbar erwiesen.
Mit der o. g. „ Zahlengewandtheit“ bezieht sich Cantor auf die Belegung der zehn
Gleichungen mit ganzzahligen Lösungen und gibt hierfür jeweils ein Beispiel an.
Diese werden nachfolgend in einer Wertetabelle mit zwei Eingängen (für x und y)
dargestellt, so dass der jeweilige „Mittelwert“ m als Funktionswert m := M (x , y )
einer zweistelligen „Mittelwertfunktion“ M erscheint. Diese zehn Mittelwertfunktionen bezeichnen wir in Anlehnung an S. 22 mit M 1, … , M 10 :
i
1
2
3
4
5
6
7
8
9
10
x
y
Mi(x, y)
1
3
2
1
4
2
3
6
4
3
6
5
2
5
4
1
6
4
6
9
8
6
9
7
4
7
6
3
8
5
52 [Cantor 1894, 227]
53 [Cantor 1894, 227 f]
54 Mit „Reihe“ meint Cantor „Folge“; „vieleckige Zahlen“ sind „Polygonalzahlen“ als spe-
zielle „figurierte Zahlen“, siehe [Hischer & Scheid 1985] und [Hischer & Scheid 1992].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
27
Wir betrachten erneut die zehn Proportionen in der Formulierung gemäß Boyer
und fragen: Worin besteht das Typische dieser definierenden Gleichungen? Wir
finden:
Links steht jeweils das Verhältnis von Streckenlängendifferenzen und rechts das
Verhältnis von Streckenlängen. Als Streckenlängen kommen hier nur x , m und y
in Frage, und als Streckenlängendifferenzen m − x , y − x und y − m . Damit lassen sich folgende Verhältnisse bilden (ohne Berücksichtigung der Kehrwerte):
m −x m −x y −x
x x m
links:
,
,
rechts:
, ,
y −x y −m y −m
m y y
Kombiniert man nun jede linke Seite mit jeder rechten Seite, so ergibt das insgesamt neun Gleichungen. Hinzu kommen neun weitere, indem man auf einer Seite
den Kehrwert eines Bruchs wählt. Somit haben wir bereits achtzehn Gleichungen.
Weiterhin kann man jeweils links und rechts noch ein Verhältnis aus gleichem
Zähler und Nenner bilden (das in unserer Sichtweise den Wert 1 hat, aber solch einen Wert „1“ kannten ja die Pythagoreer nicht!): So können wir rechts z. B. wie
bei (1B) das Verhältnis xx wählen (die anderen beiden bringen nichts Neues).
Kombinieren wir diese rechte Seite, die also für unsere „1“ steht, mit den linken
Seiten, so erhalten wir drei weitere Gleichungen. Würden wir das analog auch auf
der linken Seite machen, also dort ein Verhältnis mit gleichem Zähler und Nenner
bilden, so würde das sinnlos sein, weil das gemeinsam mit den rechten Seiten nur
für den Fall x = m = y erfüllbar wäre.
Insgesamt lassen sich also formal und rein kombinatorisch 21 Gleichungen („Proportionen“) obigen Typs aufstellen, von denen sich aber einige wegen der Voraussetzung x ≤ m ≤ y als sinnlos erweisen. Einige liefern keine neuen Lösungen,
und andere liefern „Lösungen“, die identisch x oder identisch y sind und denen
damit die Bedeutung eines „Mittelwerts“ wohl kaum zugesprochen werden kann.
So bleiben zum Schluss fast nur die zehn pythagoreischen Proportionen übrig –
„fast nur“ deshalb, weil sich nämlich eine weitere elfte Gleichung ergibt, welche
merkwürdigerweise von den Pythagoreern nicht überliefert wird, obwohl sie einen
elften „Mittelwert“ liefert, der ebenfalls über Proportionen erklärt ist, nämlich
y
y −x
.
=
y −m m
Wir fassen zusammen: Im Sinne der pythagoreischen Betrachtungsweise lassen
sich insgesamt elf nicht äquivalente Proportionen bilden, über die jeweils ein „Mittelwert“ von zwei positiven reellen Zahlen erklärt ist. Damit sind zugleich elf verschiedene „Mittelwertfunktionen“ Mi ( i ∈ {1, 2, … , 11} ) mit Mi : R 2+ → R +
erklärt.
28
H. Hischer
Diese elf definierenden Gleichungen lassen sich unter der Voraussetzung m ∈ R +
jeweils eindeutig nach m auflösen, wobei jeweils m = M i (x , y ) ist. Die folgende
Tabelle liefert eine Übersicht über diese elf Mittelwertfunktionen. Zugleich werden
hier die auf S. 24 bereits angegebenen ganzzahligen Lösungen nach Cantor erneut
dargestellt, ergänzt um ein ganzzahliges Beispiel auch für die neue elfte Mittelwertfunktion.
m −x x
=
1.
y −m x
m=
x +y
2
2.
m −x
x
=
y −m m
m = xy
3.
m −x x
=
y −m y
m=
2xy
x +y
=: M 1 (x , y )
= A(x , y )
=: M 2 (x , y )
= G (x , y )
=: M 3 (x , y )
= H (x , y )
A(1, 3) = 2
G (1, 4) = 2
H (3, 6) = 4
m −x y
=
4.
y −m x
x 2 + y2
m=
x +y
=: M 4 (x , y )
m −x m
=
5.
y −m
x
y −x
y − x ⎞2
⎛
2
m=
+ ⎜
⎟ +x
2
⎝ 2 ⎠
=: M 5 (x , y )
M 5 (2, 5) = 4
y −x
y − x ⎞2
⎛
2
m=−
+ ⎜
⎟ +y
2
⎝ 2 ⎠
=: M 6 (x , y )
M 6 (1, 6) = 4
(y − x )2
m =y−
y
=: M 7 (x , y )
M 7 (6, 9) = 8
=: M 8 (x , y )
M 8 (6, 9) = 7
=: M 9 (x , y )
M 9 (4, 7) = 6
6.
7.
8.
9.
10.
11.
m −x
y
=
y −m m
y −x
m −x
y −x
y −m
y −x
m −x
y −x
y −m
y −x
y −m
y
x
y
=
x
m
=
x
m
=
x
y
=
m
=
(y − x )2
m =x+
y
x
m = + 12 4xy − 3x 2
2
=: K (x , y )
K (3, 6) = 5
m = max{y − x , x }
=: M 10 (x , y ) M 10 (3, 8) = 5
y2
m =
2y − x
=: M 11(x , y ) M 11 (3, 6) = 4
Die Mittelwertfunktion M 4 wurde hier mit K abgekürzt, was zu begründen ist:
Zunächst liegt aufgrund der Termstruktur die Bezeichnung „quadratisches Mittel“
nahe, jedoch ist diese Bezeichnung bereits vergeben, und es gilt bekanntlich:
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
29
x 2 + y2
Q(x , y ) :=
2
Für M 4 findet man hingegen die Bezeichnung „kontraharmonisches Mittel“. 55
Wie kann es zu dieser Bezeichnung gekommen sein? Bei der Betrachtung der definierenden Proportionen für das harmonische Mittel und das kontraharmonische
Mittel fällt auf, dass diese sich nur durch die rechten Seiten unterscheiden, und
zwar ist die eine der Kehrwert der anderen. Dies ist ein plausible Erklärung für die
Namensgebung, wobei mir eine historische Quelle hierfür nicht bekannt ist. Auch
ist hierfür die Bezeichnung „antiharmonisches Mittel“ in Gebrauch. 56 Ich verwende hier die literaturmäßig belegte Bezeichnung „kontraharmonisches Mittel“,
zumal sie den Vorteil einer sinnfälligen Abkürzung für die entsprechende Mittelwertfunktion durch K bietet.
Das veranlasst uns sofort, nach weiteren „Kontramittelwerten“ zu suchen: So ist
das „kontraarithmetische Mittel“ offensichtlich das arithmetische Mittel selbst.
Bezeichnen wir die „Kontramittelwertfunktion“ zur pythagoreischen Mittelwertfunktion M vorübergehend mit M , so hätten wir H = K , K = H und A = A .
Für das „kontrageometrische Mittel“ erkennen wir G = M 5 , und zugehörig sehen
wir M 5 = G . Merkwürdigerweise ist aber auch M 6 = G , obwohl M 5 ≠ M 6 ! /
Wir verfolgen diesen spielerischen Ausflug hier nicht weiter und sehen, dass uns
die Untersuchung von Mittelwertfunktionen manche Überraschung bietet! 57
Spätestens jetzt nach diesem algebraischen Exkurs fällt uns vielleicht auf, dass die
ersten vier Mittelwertfunktionen sich von den restlichen sieben durch eine angenehme und wesentliche Eigenschaft unterscheiden: Es sind symmetrische Funktionen, d. h., für sie gilt: 58
M (x , y ) = M (y, x ) für alle x, y
Möglicherweise haben deshalb die spielerisch gewonnenen restlichen sieben Mittelwertfunktionen keine Beachtung in der Literatur gefunden!?
55 Z. B. [Naas & Schmid 1962, 178].
56 Für diesen Hinweis danke ich meinem Kollegen Ernst Albrecht von der Universität des
Saarlandes.
57 Vgl. [Hischer & Lambert 2003].
58 Der Untersuchung von symmetrischen Mittelwertfunktionen, die dann auch „kommutati-
ve Mittelwertfunktionen“ genannt werden, und von nicht-kommutativen Mittelwertfunktionen widmet sich die Abhandlung [Hischer & Lambert 2003].
30
H. Hischer
Abb. 7 zeigt eine 2D-Darstellung sowohl dieser vier symmetrischen pythagoreischen Mittelwertfunktionen als auch der Quadratmittelwertfunktion Q , und zwar
in einer Reduktion auf x
M (x , 1) mit x ∈] 0; 1] . 59
Abb. 7: symmetrische pythagoreische Mittelwerte und quadratisches Mittel
Diese Darstellung gibt Veranlassung zur Entdeckung einer Erweiterung der babylonischen Ungleichungskette (7):
x ≤ y ⇒ x ≤ H (x , y ) ≤ G (x , y ) ≤ A(x , y ) ≤ Q(x , y ) ≤ K (x , y ) ≤ y
(12)
Beweis:
A(x , y ) ≤ Q(x , y ) und Q(x , y ) ≤ K (x , y ) sind jeweils äquivalent zu (x − y )2 ≥ 0 ,
und es ist K (x , y ) ≤ y ⇔ x ≤ y .
‹
Es sei noch darauf hingewiesen, dass A , die Mittelwertfunktion für das arithmetische Mittel, hier eine „Trennung“ zwischen den beiden konvexen Funktionen K
und Q einerseits und den beiden konkaven Funktionen G und H andererseits
bewirkt.
59 So dargestellte Mittelwertfunktionen werden nach einem Hinweis meines Kollegen
Ernst Albrecht von der Universität des Saarlandes z. T. auch „Mittelfunktionen“ genannt.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
3
31
Mittelwerte in der Neuzeit — ein Überblick
3.1 Nicolas Chuquet, Medianten, Farey-Brüche und Ford-Kreise
Der französische Arzt Nicolas Chuquet wurde 1445 in Paris geboren, wo er Medizin studierte, und er wechselte etwa 1480 nach Lyon, wo er 1488 starb. Damit lebte
er zwar im ausgehenden Mittelalter, wir können ihn jedoch besser dem Beginn der
Neuzeit hinzurechnen (1492 war die Entdeckung Amerikas). In Lyon kam er durch
seine Interessen und Aktivitäten zu mathematischen Ehren, was auch darin dokumentiert ist, dass er in den dortigen Steuertabellen von 1485 und 1487 als „Nicolas
Chuquet, algoriste“ (also als „Algorithmiker“) aufgeführt wurde. 60
Moritz Cantor schreibt hierzu: 61
Nicolas Chuquet aus Paris hatte Medizin studiert und in dieser Wissenschaft das Baccalaureat erworben. Vielleicht fand diese Erwerbung in Lyon statt, wo eine berühmte
Aerzteschule blühte. Jedenfalls begann und vollendete Chuquet in Lyon im Jahre 1484
ein Werk, welches er Le Triparty en la sciences des nombres benannte. Es ist zwar ausser in unserem Jahrhunderte (1880) niemals gedruckt worden, fand aber jedenfalls handschriftliche Verbreitung und wurde im XVI. Jahrhunderte von einem [...] Schriftsteller
so umfassend benutzt, dass das Wort „abschreiben“ nicht selten besser zutrifft als sogar
„ausschreiben“. Lyon war so recht der Platz, an welchem die Entstehung eines umfassenden Rechenwerkes von der Art dessen, mit welchem wir es zu thun haben, geplant
und vorbereitet werden konnte.
Diesem Werk Chuquets, seiner „dreiteiligen Abhandlung der Zahlen“, wollen wir
uns hier akzentuierend zuwenden, und zwar nur einem besonderen Aspekt des ersten Teils. Dieser widmet sich dem Rechnen mit rationalen Zahlen, der zweite Teil
dem Rechnen mit irrationalen Zahlen und der dritte der Lehre von den Gleichungen. Und bei den rationalen Zahlen betrachtet er in der Tat auch Brüche und nega~
tive Zahlen, wobei er anstelle unserer Symbole + bzw. – die Zeichen ~
p bzw. m
verwendet: 62
Die Regeldetri, rigle de troys, 63 wird gelehrt und auf die verschiedensten Aufgaben angewandt, auch auf solche, die mittels einfachen und doppelten falschen Ansatzes, rigle
de une position und rigle de deux positions, gelehrt werden, die selbst eine Regeldetri
voraussetzen. Bei solchen Aufgaben ist von negativen Zahlen [...] vielfach die Rede, und
die Regeln, welche beim Rechnen mit denselben obwalten, werden genau auseinander~.
gesetzt. [...] Die Zeichen der beiden Zahlenarten sind ~
p und m
60 http://www-history.mcs.st-and.ac.uk/history/Mathematicians/Chuquet.html, 22.09.2002
61 [Cantor 1892, 318]
62 [Cantor 1892, 322]; Hervorhebung nicht im Original.
63 Dreisatz, Schlussrechung; vgl. z. B. [Vollrath 1978].
32
H. Hischer
Cantor kommt nun zu dem uns hier interessierenden Aspekt: 64
Den Abschluss des I. Theiles bildet die von Chuquet als sein Eigenthum in Anspruch
genommene R e g e l d e r m i t t l e r e n Z a h l e n , la rigle des nombres moyens. Sie
a
a
a +a
besteht aus der Behauptung, der Zahlenwerth b1 +b 2 liege immer zwischen b1 und b2 .
1
2
1
2
Die Richtigkeit der Behauptung zu beweisen fällt allerdings dem Erfinder nicht ein.
Wenngleich Chuquet diesen Beweis schuldig bleibt, füllt Cantor sogleich diese
Lücke, indem er darauf hinweist, dass sich dieser Beweis „am einfachsten“ ergeben würde, wenn man die Differenzen
a1 a 1 + a 2 a1b2 − a 2b1
a + a 2 a 2 a1b2 − a 2b1
−
=
−
=
und 1
b1 b1 + b2
b1 + b2 b2
b1 (b1 + b2 )
b2 (b1 + b2 )
unter der (einzigen!) Voraussetzung betrachtete, dass b1 und b2 gleiches Vorzeichen hätten. Und in der Tat rechnen wir schnell nach, dass dann
obige Differenzen ebenfalls dasselbe Vorzeichen haben würden,
womit der Beweis erbracht ist,
wie man sich klar machen möge.
Wir können aber auch einen eleganten visuellen Beweis erbringen, zumindest für den Fall positiver Zähler und Nenner. In Abb.
a +c
Abb. 8: Visualisierung des Chuquet-Mittels b +d
8 wird dies dargestellt! 65
Wir entnehmen also Abb. 8 folgenden Satz als Spezialfall der Regel der mittleren
Zahlen von Chuquet:
a c
a a +c c
Für alle a, b, c, d ∈ R + gilt:
<
<
⇒
<
b d
b b +d d
a +c
a
c
Der Bruch
heißt daher auch Chuquet-Mittel der Brüche
und . 66
b +d
b
d
a
c
Interpretiert man die Brüche b und d in Abb. 8 als Steigungen der Hypotenusen
der dort erkennbaren rechtwinkligen Dreiecke, so erscheint das Chuquet-Mittel als
mittlere Steigung der Hypotenuse des „Summendreiecks“ und also als „Mittelwert“.
64 [Cantor 1892, 322]
65 Vgl. auch [Hischer 1998, 7].
66 [Herget 1985]; vgl. auch [Hischer 1998].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
33
Es ist zu beachten, dass die beim Chuquet-Mittel verwendeten „Brüche“ nicht in
der (mathematisch üblichen) Rolle von Äquivalenzklassen auftreten, sondern nur
als deren Repräsentanten (was aber wiederum typisch ist für den „Alltagsumgang“
mit Brüchen und zugleich zu vielen Verständnisproblemen führt). Das bedeutet
nun, dass das Chuquet-Mittel nicht repräsentantenunabhängig ist, was man gern zu
Beginn von Algebravorlesungen im Zusammenhang mit der Wohldefiniertheit von
Verknüpfungen nachweist und was wir sofort an einem Beispiel sehen:
•
Es ist zwar
4
10
=
2
5
, hingegen ist
4 +1
10 +10
≠
2 +1
5 + 10
! 67
Anmerkung:
Wir müssen an dieser Stelle zur Kenntnis nehmen, dass das Symbol ab , das wir oft
„Bruch“ nennen, zwar in der Mathematik „sauber“ als Äquivalenzklasse von Zahlenpaaren durch ab := {(x , y ) ∈ Z × Z * | ay = bx } definiert werden kann, jedoch im
„Rest der Welt“ sowohl Äquivalenzklasse als auch Zahlenpaar und damit faktisch
doppeldeutig ist (und bei genauem Hinsehen sogar teilweise in der Mathematik,
wobei diese Doppeldeutigkeit dann situativ richtig zu interpretieren ist).
Aber warum befasst sich nun Chuquet mit solch merkwürdigen Mittelwerten von
Brüchen, genauer: mit Mittelwerten von Repräsentanten (von Brüchen)?
Hierzu liefert Moritz Cantor eine interessante Erläuterung: 68
Die Anwendung dieses Mittelwerthsatzes 69 wird so gemacht, dass man zur Lösung einer Aufgabe versuchsweise zwei Werthe der unbekannten Grösse ansetzt, deren eine zu
viel, die andere zu wenig hervorbringt, und dass man dann fortwährend neue Versuchswerthe aus den mittleren Zahlen sich bildet. Ganzzahlige Versuchswerthe werden der
Regel untergeordnet, indem man sie als Brüche mit dem Nenner 1 betrachtet.
Es ist anmerkenswert, dass Cantor im letzten Satz einen wichtigen Aspekt der
Bruchdidaktik betont, nämlich die Auffassung ganzer Zahlen als Bruch mit dem
Nenner Eins. Cantor fährt dann fort:
Es soll z. B. die Gleichung x 2 + x = 39 13
gelöst werden, und man findet x 1 =
81
klein und x 2 =
6
1
zu gross. Der erste Mittelwerth heisst
Versuch zu klein. Der zweite Mittelwerth ist
11+ 6
2 +1
=
5+6
1+1
17
3 .
=
11
2
5
1
zu
und zeigt sich beim
Er erweist sich zu klein.
67 Vgl. hierzu [Hischer 1998] und [Hischer 2003].
68 [Cantor 1892, 323]; Hervorhebungen nicht im Original.
69 Wir registrieren aufmerksam, dass Cantor die Regel der mittleren Zahlen von Chuquet
als „Mittelwertsatz“ bezeichnet!
34
H. Hischer
Der dritte Mittelwerth
werth
23 + 6
4 +1
Mittelwerth
17 + 6
3 +1
=
23
4
besitzt die gleiche Eigenschaft. Der vierte Mittel-
23
= 29
5 giebt erst ein zu Grosses, und somit ist jetzt zwischen 4
23 + 29
52
dem Versuche zu unterwerfen. Er erweist sich als
4+9 = 9
und
29
5
der
richtig, und
die Aufgabe ist gelöst.
Hier wird also anhand eines Beispiels ein Algorithmus beschrieben, wodurch verständlich wird, weshalb Chuquet „Algorithmiker“ genannt wurde (s. S. 31 oben).
Cantor fährt fort: 70
Man erkennt sofort, dass nach dieser Methode jede Gleichung näherungsweise aufgelöst
werden kann, wenn man die Mühe der jedesmal neu anzustellenden Versuchsrechnung
nicht scheut. Man erkennt ebenso, dass die Wahl irgend einer anderen Versuchsgrösse
z. B. des arithmetischen Mittels zwischen einem zu Grossen und einem zu Kleinen genau die gleich Berechtigung hätte. Aber man kann nicht leugnen, dass für den Chuquet’schen Mittelwerth als Vorzug sein verhältnismässig langsam anwachsender Nenner
geltend gemacht werden kann.
Dieser Algorithmus dient also der Einschachtelung einer gesuchten Gleichungslösung mit Hilfe des Chuquet-Mittels, und implizit behauptet Cantor, dass dies mit
irgendeinem anderen Mittelwert (er spricht von „Versuchsgröße“) möglich wäre,
z. B. mit dem arithmetischem Mittel, wobei das Chuquet-Mittel diesem gegenüber
den „Vorzug verhältnismäßig langsam anwachsender Nenner“ habe. Wir stellen
dieses für obiges Beispiel exemplarisch vergleichend in zwei Tabellen dar.
Dabei ist x 2 + x =: f (x ) , und C (x , y ) bezeichnet das Chuquetmittel von x und y ,
wobei diese Argumente in einer eindeutigen Repräsentantendarstellung gegeben
sein müssen, und A(x , y ) ist wie bisher das arithmetische Mittel von x und y :
n
1
2
3
4
5
xn
yn C (x n , yn ) f (C (x n , yn ))
5
1
11
2
17
3
23
4
23
4
6
1
6
1
6
1
6
1
29
5
11
2
17
3
23
4
29
5
52
9
143
4
340
9
621
16
986
25
3172
81
n
< 39 13
81
1
< 39 13
81
2
< 39 13
81
3
> 39 13
81
4
= 39 13
81
5
xn
yn
5
1
11
2
23
4
23
4
23
4
6
1
6
1
6
1
47
8
93
16
A(x n , y n ) f (A(x n , y n ))
11
2
23
4
47
8
93
16
185
32
143
13
4 < 39 81
621
13
16 < 39 81
2585
13
64 > 39 81
10137
13
256 > 39 81
40145
13
1024 > 39 81
13
Es ist 40145
1024 ≈ 39,20 4 und 39 81 ≈ 39,16 0 . Mit dem arithmetischen Mittel kann das
Verfahren hier nicht „aufgehen“. Dennoch ergeben sich viele interessante Fragen!
70 Cantor a. a. O.; Hervorhebungen nicht im Original. Und hier verwendet Cantor – histo-
risch vermutlich erstmalig, weil das Buch von Chuquet erst 1890 im Druck erschien –
die Bezeichnung „Chuquet-Mittel“! Die in der Literatur z. T. auch vorkommende Benennung des Mittels nach Ampère (1775 in Lyon geboren, 1836 in Marseille gestorben)
ist dadurch vielleicht zu erklären, aber historisch gewiss nicht gerechtfertigt!
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
35
Wir kehren nun zur bereits erwähnten Nicht-Wohldefiniertheit des Chuquetmittels
zurück: Können wir dennoch das Chuquetmittel von zwei positiven reellen Zahlen
y
x , y bilden? Dazu benötigen wir eine Bruchdarstellung, etwa x1 und 1 wie im
gerade betrachteten Beispiel, und wir würden dann C ( x1 , y1 ) = x +2 y erhalten, also
das arithmetische Mittel von x und y . Wenn wir diese Brüche (genauer: ihre
Repräsentanten!) wieder als Steigungen von Hypotenusen in rechtwinkligen Dreiecken interpretieren, liefert Abb. 9 eine Veranschaulichung dieses Sachverhalts,
und das Chuquetmittel erscheint wiederum als mittlere Steigung und damit als
„Mittelwert“ von x und y .
Abb. 9: Chuquetmittel von x und y ?
Abb. 10: Chuquetmittel von x und y ?
Wenn wir nun das zweite Steigungsdreieck mit einem positiven Streckfaktor s zentrisch verzerren, so können wir als „mittlere Steigung“ m offenbar jeden Wert zwischen x und y erhalten, wobei s zwischen 0 und ∞ variiert (Abb. 10), d. h.,
wir können jeden „Mittelwert“ m zwischen x und y mit einem geeigneten s
wie folgt darstellen: m = x1++sy
s
Das gibt dann mit Blick auf die Untersuchungen im Abschnitt 2 zu folgender Vermutung Anlass: Ist M eine beliebige „Mittelwertfunktion“ gemäß M: R 2+ → R + ,
so gibt es dazu stets eine „Streckfaktorfunktion“ S gemäß S: R 2+ → R + mit
x + S (x , y )y
.
(13)
M (x , y ) =
1 + S (x , y )
Ist umgekehrt eine solche Funktion S beliebig vorgegeben, so ist mittels (13) wohl
(?) eine Mittelwertfunktion erklärt. Die Untersuchung dieser Vermutung setzt allerdings voraus, dass der Begriff „Mittelwert“ axiomatisch sinnvoll erklärt ist, d. h.:
es ist zu klären, was man unter einem numerischen „Mittelwert“ verstehen will! 71
71 Dieser Gedankengang wird in [Hischer & Lambert 2003] verfolgt.
36
H. Hischer
Schreiben wir (13) kurz als m =
x +sy
1+s
, so können wir diese Gleichung nach
m −x
(14)
s=
y −m
auflösen. Und hier kommen wir nun über Chuquet zurück zu den Pythagoreern,
denn auf der rechten Seite von (14) steht gerade das Größenverhältnis, das in den
definierenden Proportionen der ersten sechs pythagoreischen Mittelwerte vorkam!
Somit haben wir also über die bisherigen historischen Betrachtungen nicht nur die
Vermutung gewonnen, dass das Chuquetmittel dazu geeignet ist, um beliebige numerische Mittelwerte darzustellen und um damit zu einer Theorie numerischer Mittelwerte zu gelangen, sondern wir sehen zugleich, dass der Grundstein hierzu bereits vor rund 2500 Jahren bei den Pythagoreern gelegt worden ist, die dabei wiederum „nur“ variierend und verallgemeinernd auf die rund 4000 Jahre alten drei
„klassischen“ babylonischen Mittelwerte zurückgegriffen haben. 72
Es sind noch Nachträge angebracht: Kenner der Zahlentheorie werden gemerkt haben, dass das Chuquetmittel von zwei Brüchen aus von Null verschiedenen natürlichen Zahlen dort als Mediante bekannt ist. (Diese Tatsache beweist umso mehr,
dass auch die Mathematiker den Begriff „Bruch“ situativ interpretieren – entweder als Äquivalenzklasse oder als Repräsentant dieser Klasse, denn sonst wäre die
Mediantenbildung wegen der Vieldeutigkeit gar nicht möglich!)
Und zwar spielen die Medianten (und damit das Chuquetmittel, was dasselbe ist!)
bei den sog. Farey-Folgen eine wichtige Rolle: Der Geologe John Farey (1766 –
1826), beschrieb diese nach ihm benannten „Folgen“ 1816 in seinem Artikel “On a
curious property of vulgar fractions” in der Zeitschrift “Philosophical Magazine“:
Für ein n ∈ N * heißt F n eine Farey-Folge der Ordnung n , die definiert ist durch:
a
a
F n := ⎧⎨ | a, b ∈ N * ∧ 0 ≤ ≤ 1 ∧ b ≤ n ⎫⎬
b
⎩b
⎭
0 1 1 1 2 1 3 2 3 4 1
F 5 = ⎧⎨ , , , , , , , , , , ⎫⎬ .
Es ist dann z. B.
⎩1 5 4 3 5 2 5 3 4 5 1⎭
Hierbei wurden nur die vollständig gekürzten Brüche notiert.
72 Diese Feststellungen sind Anlass für die axiomatischen Untersuchungen in [Hischer &
Lambert 2003]. Ferner wird in [Hischer 2003] u. a. das Chuquetmittel didaktisch untersucht.
2004 wird der Autor in der Zeitschrift Der Mathematikunterricht ein Themenheft herausgeben, das sich „Mittelwerten und Mitten“ in ihrer vielfältigen historischen, theoretischen und unterrichtspraktischen Bedeutung widmen wird.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
37
Diese Farey-Folge (und darüber hinaus: alle Farey-Folgen!) hat folgende interessante Eigenschaft, wenn man ihre Glieder der Größe nach geordnet betrachtet:
•
Jedes Glied (bis auf das erste und das letzte) ist die Mediante (bzw. das Chuquetmittel) der beiden Nachbarn!
Dabei wird man dann allerdings die Ergebnisse kürzen (sofern möglich). Andererseits kann man mit Hilfe der Mediante solche Farey-Folgen iterativ konstruieren:
0 1
(1) Iterationsbeginn mit 00 und 10 , d. h.: F 1 = ⎧⎨ , ⎫⎬
⎩1 1⎭
(2) Iterationsschritt von F n zu F n +1 : Es werden alle Medianten zwischen
„Nachbarn“ in F n hinzugefügt, die der Bedingung genügen, dass der neue
Nenner kleiner oder gleich n ist.
Wir demonstrieren dies anhand der iterativen Konstruktion von F 5 aus F 1 :
1 Die „neuen“ Glieder sind jeF1 0
1
1 weils schattiert hervorgehoben.
1
1 Würden wir obige ZusatzbedinF2 0
1
2
1
gung „dass [...] der neue Nen1
1
1
2
F3 0
ner kleiner oder gleich n ist“
1
3
3
2
1
1
1 weglassen, so würde F4 nicht
1
1
2
3
F4 0
1
4
3
3
4
2
1 auftreten, und es ergäbe sich
F 5 0 1 1 1 2 1 3 2 3 4 1 eine andere Folge von Farey1
5
4
3
5
5
3
4
5
2
1 Folgen (welche?)
Auf [Ford 1938] geht eine sehr schöne
Visualisierung der Farey-Folgen durch
eine endliche Folge von Kreisen zurück, genannt „Ford-Kreise“. Und
a
zwar wird jedem (gekürzten) Element
b – also aufgefasst als geordnetes
Zahlenpaar (a;b) – einer Farey-Folge
F n ein Kreis wie folgt zugeordnet:
Radius:
1
2b 2
, Mittelpunkt:
(, )
a
b
1
2b 2
Abb. 11 zeigt die Fordkreise zu F 5 .
Es gibt auch Visualisierungen
durch „Ford-Kugeln“ in einer
Ebene!
Wie könnten diese
aussehen?
Abb. 11: Ford-Kreise zur Farey-Folge der Ordnung 5 – „Kreis“ als „Mitte“ zwischen zwei Kreisen!
38
H. Hischer
3.2 James Gregory und der Kreis als harmonisch-geometrisches Mittel
Erste systematische Approximationen der Kreiszahl π verdanken wir bekanntlich
Archimedes (287 bis 212 v. Chr.), wenngleich uns durch den Papyrus Rhind, den
der Schreiber Ahmes verfasst hat, ägyptische Näherungswerte bekannt sind, die ca.
4000 bis 5000 Jahre alt sind. 73 Archimedes verwendete bekanntlich bereits Intervallschachtelungen, indem er – in heutiger Sichtweise – rekursiv definierte Folgen ein- und umbeschriebener regulärer n-Ecke betrachtet, wobei sein Rekursionsschritt in der Verdoppelung der Eckenanzahl besteht. Das Verfahren ist bekannt,
numerisch aufwendig, und Archimedes vermeidet bereits – wie ebenfalls bekannt
ist – durch geschickte Termumformung das Auftreten einer „Nullkatastrophe“. 74
Dieses Verfahren von Archimedes zur Approximation von π wird üblicherweise
im Mathematikunterricht verwendet – falls man sich überhaupt die Mühe macht,
ein historisches Verfahren zu benutzen. Im Sinne „historischer Verankerung“ 75
sollte man aber vor allem auf den bedeutsamen neuzeitlichen Algorithmus des
Schotten James Gregory (1638 bis 1675) eingehen, den dieser 1667 in seinem
Buch „Vera circuli et hyperbolae quadratura“ über Quadraturverfahren veröffentlichte und der bisher im Mathematikunterricht kaum eine Rolle spielt. So lesen wir
hierzu bei Moritz Cantor: 76
Von ganz anderer Seite fasste ein englischer Schriftsteller, J a m e s G r e g o r y [...] ,
die Aufgabe der Quadratur in seiner 1667 gedruckten Vera circuli et hyperbolae quadratura. Gregory zeigt in einer für Kreis, Ellipse und Hyperbel gemeinschaftlichen Beweisführung, dass, sofern Vielecke, deren Seitenzahl fortwährend zunimmt, der Curve
einbeschrieben und umschrieben werden, die Vielecke höherer Seitenzahl einen immer
weniger von einander verschiedenen Flächeninhalt besitzen. Er zeigt ferner, dass, wenn
A das erste Sehnenvieleck, B das erste Tangentenvieleck, C , D das zweite Sehnenbeziehungsweise Tangentenvieleck ist, alsdann C = A2AB
+ B , D = AB , d. h., ersteres das
harmonische, letzteres das geometrische Mittel zwischen den den Ausgangspunkt bildenden Vielecken sein muss. Ebenso entstehen natürlich weitere Sehnen- und Tangentenvielecke E, F aus C, D u. s. w. Es bildet sich, wie Gregory schon in seiner Vorrede
sagt, eine Series polygonorum convergens, cujus terminatio est circulus, und dieses
Wort der C o n v e r g e n s kehrt im Verlauf der Schrift immer und immer wieder und ist
von da an der Wissenschaft erhalten geblieben. Der Kreis ist also die Grenze, welcher
beide Vielecksreihen zustreben, und zwar unter Anwendung eines Namens unserer Neuzeit als harmonisch-geometrisches Mittel. Der Grenzwert [...] wird erst nach unendlicher
Gliederzahl der Reihe angetroffen. [...] Für die damalige Zeit war diese Auffassung allerdings so überraschend neu, dass Huygens sie nicht verstand [...]
73 Vgl. [Boyer 1968] und [Hischer & Scheid 1995, 20].
74 Vgl. [Hischer & Scheid 1995].
75 Vgl. [Hischer 1998].
76 [Cantor 1892, 655 f]; Hervorhebung durch Unterstreichung nicht im Original.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
39
Gregory betrachtet also wie Archimedes regelmäßige n-Ecke (und zwar nicht nur
an Kreisen, sondern sogar verallgemeinert an Kegelschnitten!), die er – wie dieser
– durch systematische Eckenanzahlverdoppelung verfeinert. Er betrachtet allerdings, wie wir bei Cantor nachlesen, nicht die Umfänge der ein- und umbeschriebenen n-Ecke, sondern deren Flächeninhalte.
Wir wollen Cantors Ausführungen verstehen und bezeichnen den Flächeninhalt des
einbeschriebenen n-Ecks mit En und den des umbeschriebenen mit U n . Dazu setzen wir einen Kreis mit dem Radius 1 voraus und starten das Verfahren mit einem
Quadrat, also mit n = 4 . Sofort erhalten wir E 4 = 2 und U 4 = 4 . Mittels elementargeometrischer Betrachtungen sehen wir E 8 = 2 2 und U 4 = 8( 2 − 1) ,
woraus wir E 8 = G (E 4 ,U 4 ) ablesen, hingegen ist leider U 8 ≠ H (E 4 ,U 4 ) . Nach
Cantors Ausführungen hingegen müsste E 8 = H (E 4 ,U 4 ) und U 8 = G (E 4 ,U 4 )
gelten. Hier ist ihm offenbar durch den Druck ein Dreher unterlaufen (was uns allen passieren kann). Wir finden aber durch beharrliches Nachrechnen heraus, dass
U 8 = H (E 8 ,U 4 ) gilt – man beachte die Indizes! Dies gibt Anlass zu der Vermutung, dass Cantor wohl verallgemeinert E 2n = G (E n ,U n ) und U 2n = H (E 2n ,U n )
meinte!
Wir werden diesen Weg hier nicht weiter verfolgen, zumal ganz ähnliche Betrachtungen für die Umfänge der n-Ecke gelten, wobei die dazu erforderlichen rechnerischen Betrachtungen sich als sehr einfach erweisen werden.
Daher bezeichnen wir im Folgenden mit E n den Umfang des einbeschriebenen
n-Ecks und mit U n den des umbeschriebenen. Sodann ergeben sich die folgenden
Gregory-Rekursionen für die Umfänge ein- und umbeschriebener n-Ecke: 77
U 2n = H (En ,U n ) und E 2n = G (En ,U 2n )
(15)
Auch durch diese beiden Rekursionen wird die von Cantor verwendete Bezeichnung harmonisch-geometrisches Mittel motiviert.
) Es muss nachdrücklich darauf hingewiesen werden, dass in der zweiten Rekursion U 2n und nicht U n steht!
Diese beiden auf diese Weise rekursiv verschachtelt definierten Folgen liefern einen äußerst eleganten Algorithmus zur Approximation von π, der in informatischer, folgenfreier Notation in Abb. 12 dargestellt ist. Er ist strukturell einfacher
als der babylonische Algorithmus, konvergiert allerdings nicht so schnell wie dieser, ist andererseits ablaufäquivalent mit dem archimedischen Algorithmus und
77 Vgl. [Hischer & Scheid 1995]. Für die Flächeninhalte ergeben sich jedoch gemäß
Cantor andere Rekursionen (s. o.): E 2n = G (E n ,U n ) und U 2n = H (E 2n ,U n ) . Beweis?
40
H. Hischer
zugleich numerisch weitaus einfacher zu handhaben
als dieser. Wie beim babylonischen Algorithmus ergibt sich auch hier die Konvergenz des Verfahrens
und damit das Vorliegen einer Intervallschachtelung
für 2π aus der babylonischen Ungleichungskette (7).
Diese beiden Gregory-Rekursionen lassen sich elementargeometrisch mit Hilfe von Ähnlichkeitsbetrachtungen erschließen, sind also recht früh im Mathematikunterricht des Sekundarbereichs I behandelbar. Hiermit können die Begriffe „Folge“, „AlAbb. 12: Gregory-Algorithmus
gorithmus“, „Iteration“ und „Approximation“ vorbezur Approximation von π
reitet werden, und all dies kann in der Oberstufe weiter vertieft werden.
Ein einfacher Weg zur Entdeckung dieser Gregory-Rekursionen ergibt sich aus
Abb. 13. Der Schritt der Eckenanzahlverdoppelung ist hier für n = 4 dargestellt, aber Abb. 14 auf der nächsten Seite verdeutlicht, dass die folgende Argumentation dennoch uneingeschränkt gilt:
Mit en bzw. e2n seien die Seitenlänge
des einbeschriebenen n-Ecks bzw. 2nEcks bezeichnet, entsprechend mit 21 un
bzw. 12 u 2n die halbe Seitenlänge des umbeschriebenen n-Ecks bzw. 2n-Ecks.
Sodann lassen sich aufgrund von ÄhnAbb. 13: Herleitung des Gregory-Algorithmus
lichkeitsbeziehungen (jeweils zwei Dreiecke sind ähnlich!) folgende Gleichungen aus der Zeichnung ablesen (vgl. hierzu
die linke und die mittlere Darstellung in Abb. 14!):
u2n
en
=
(16)
1
1
1
u
u
−
u
n
n
2
2 2n
2
e
en
= 1 2n
e2n
2 u 2n
(17)
Da es unser Interesse sein muss, die Größen des 2n-Ecks auf die des n-Ecks zurückzuführen, da in (16) nur u2n vorkommt, und da in (17) e2n und u2n vorkommen, ergibt sich als Strategie, (16) nach u2n aufzulösen und (17) nach e2n .
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
41
Abb. 14: die linke Darstellung zeigt zwei ähnliche Dreiecke, gebildet aus Strecken im eingeschriebenen
n-Eck und im umbeschriebenen n-Eck und 2n-Eck; die mittlere Darstellung zeigt zwei ähnliche Dreiecke, gebildet aus Strecken im eingeschriebenen n-Eck und 2n-Eck und im umbeschriebenen 2n-Eck;
die rechte Darstellung visualisiert die Unabhängigkeit der Argumentation von der Eckenanzahl n.
Sodann erhalten wir durch Äquivalenzumformung:
e ⋅u
u 2n = n n , e2n 2 = 21 en ⋅ u 2n
en + u n
Unter Berücksichtigung von U n = n ⋅ un und E n = n ⋅ en ergeben sich hieraus die
Gregory-Rekursionen aus (15)!
Per Konstruktion gilt En < U n für alle n , und wegen der
babylonischen Ungleichungskette (7*) folgt zunächst
E n < H (E n ,U n ) = U 2n < A(E n ,U n ) < U n
Aus U 2n < U n folgt mit (7*) weiterhin
E n < G (E n ,U 2n ) = E 2n < U 2n < U n ,
und damit erhalten wir aus beiden Ungleichungsketten
E +Un
E n < E 2n < U 2n < n
< Un ,
2
U − En
was schließlich zu 0 < U 2n − E 2n < n
2
Abb. 15: Approximation
führt, womit wir insgesamt wissen, dass hier eine Intervall- von 2π mit dem Algorithmus von Gregory
schachtelung vorliegt und also der Gregory-Algorithmus
konvergiert. Die Tabelle in Abb. 15 zeigt die Abarbeitung des Algorithmus beim
Start mit einem Viereck, also mit den Startwerten E 4 = 4 2 und U 4 = 8 .
Bezeichnen wir den gemeinsamen Grenzwert beider Folgen mit den Anfangswerten x, y mit HGM(x , y ) (in Anlehnung an „Harmonisch-Geometrisches Mittel),
so ist HGM eine Mittelwertfunktion, und es gilt speziell HGM(4 2,8) = 2π .
42
H. Hischer
3.3 Gauß und das arithmetisch-geometrische Mittel (AGM)
Die Gregory-Rekursionen (15) sind eine raffinierte Verschachtelung zwischen harmonischem und geometrischem Mittel. Carl Friedrich Gauß (1777 – 1855) untersuchte 1791, also im Alter von vierzehn Jahren, eine andere berühmt gewordene
Verschachtelung zweier Folgen, die ebenfalls auf zwei klassischen Mittelwerten
beruht: Ihr gemeinsamer Grenzwert ist das sog. arithmetisch-geometrische Mittel
(AGM), das 1976 zu großer Berühmtheit gelangt ist. Die Bezeichnung AGM
stammt von Gauß, aber bereits Joseph Louis Lagrange hatte vor Gauß dieses Mittel
untersucht.
Die zugrunde liegenden Folgen seien in ihrem Aufbau kurz beschrieben:
Es seien x , y ∈ R + beliebig gewählt mit x ≤ y . Damit werden zwei Folgen rekursiv verschachtelt wie folgt konstruiert (für alle n ∈ N ):
x 0 := x , x n +1 := G (x n , yn ) und y 0 := y , yn +1 := A(x n , yn )
Wegen der babylonischen Ungleichungskette (7) gilt:
x n ≤ x n +1 ≤ yn +1 ≤ yn für alle n ∈ N
(18)
(19)
Damit sind diese beiden monotonen Folgen beschränkt und also auch konvergent.
Weiterhin ergibt sich analog zu (8) aus (19) und (4):
y + xn
y − xn
(20)
yn +1 − x n +1 ≤ yn − x n = n
− xn = n
2
2
Mit vollständiger Induktion folgt analog zu (10):
y −x
(21)
yn − x n ≤ 0 n 0 für alle n ∈ N
2
Damit haben wir neben dem babylonischen Algorithmus und dem Gregory-Algorithmus einen dritten Algorithmus gefunden, dessen Konvergenz auf der babylonischen Ungleichungskette (7) beruht. Den gemeinsamen Grenzwert der beiden Folgen ( =: AGM(x , y ) ), kann man zwar im Mathematikunterricht gut approximieren,
wegen des exakten Grenzwerts (ein elliptisches Integral) muss man die Interessierten jedoch auf ein Mathematikstudium verweisen! AGM ist eine Mittelwertfunktion, d. h., es ist x ≤ AGM(x , y ) ≤ y , und es ist AGM(x , y ) = AGM(x n , y n ) .
1
ist die Gauß-Konstante oder Lemniskatenkonstante.
AGM(1, 2 )
Es ist erwähnenswert, dass auf dem AGM einer der derzeit schnellsten Algorithmen zur Approximation von π beruht, der 1976 unabhängig von Richard P. Brent
und Eugene Salamin entdeckt wurde. Gauß wird nicht geahnt haben, welche Folgen seine Entdeckung gut 200 Jahre später haben würde. Man recherchiere hierzu
z. B. im Internet!
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
43
3.5 Ein Blick (Einblick) in die heutige Vielfalt von Mittelwerten
Wenngleich zwar die drei klassischen babylonischen Mittelwerte von besonderer
Bekanntheit sind, so stehen wir heute in der Mathematik vor einer kaum mehr
überschaubaren Fülle von verschiedenen Mittelwerten. 78 Dabei sind es nicht nur
numerische Mittelwerte, wie wir sie in dieser historisch orientierten Darstellung
betrachtet haben, sondern es gibt auch nicht-numerische Mittelwerte, z. B. in der
Stochastik, wenn es um qualitative Merkmale geht, oder in der Geometrie.
Diese Vielfalt in der hier vorliegenden Abhandlung darzustellen überschreitet völlig
die Möglichkeiten eines Fachzeitschriftenartikels, und so beschließe ich an dieser
Stelle den mathematikhistorischen Streifzug und werfe exemplarisch einen Blick in
ein (älteres) mathematisches Lexikon, und zwar in [Naas & Schmid 1962]. Dort
finden wir u. a. folgende Bezeichnungen im Zusammenhang mit „Mittelwert“: 79
Mittelebene — Mittelenveloppe einer Fläche — Mittelfläche — Mittelpunkt paralleler Vektoren —
Mittelpunkt einer Potenzreihe — Mittelpunktseikörper — Mittelpunktsgleichung — Mittelpunktskegelschnitt — Mittelpuntksquadrik — Mittelpunktswinkel (Zentriwinkel) — Mittelsenkrechte —
Mittelstück — Mitteltransversale (Seitenhalbierende) — Mitteltypus (Normaltypus einer meromorphen Funktion) — Mittelungsverfahren — Mittelwerte — Mittelwerteigenschaft der Lösungen
partieller Differentialgleichungen — Mittelwert einer fastperiodischen Funktion — Mittelwert einer
Funktion — Mittelwertmethoden zur näherungsweisen Berechnung bestimmter Integrale — Mittelwerte n-ter Ordnung einer Funktion — Mittelwert reeller Funktionen auf einer topologischen Gruppe
— Mittelwertsätze der Differentialrechnung — Mittelwertsatz der harmonischen Funktionen —
Mittelwertsätze der Integralrechnung — Mittelwertsätze der Potentialtheorie — Mittelwerte unitärer
Operatoren — Mittelwertvergleich, verteilungsfreier — Mittelwert von Verteilungen (Erwartungswert) — Mittendreieck eines Dreiecks — Mittenevolute einer Fläche — Mittenfläche eines Strahlensystems (Mittelpunkt) — Mittenvieleck — Mittlere Ableitung — Mittlere Affinkrümmungslinien —
Mittlere Anomalie — Mittlere Bewegung einer fastperiodischen Funktion — Mittlere Breite — Mittlerer Fehler (Ausgleichsrechnung) — Mittlere Fehlerellipse — Mittleres Fehlerquadrat — Mittlere
freie Weglänge — Mittlere geodätische Krümmung eines Kurvennetzes — Mittlere Krümmung einer
Fläche — Mittlere Krümmung eines Kurvenbogens — Mittlerer Krümmungsvektor — Mittlere Proportionale — Mittlere quadratische Abweichung (Standardabweichung) — Mittleres Riemannsches
Krümmungsmaß — Mittlere Stetigkeit eines Kernes (Eigenwert einer linearen Integralgleichung) ...
78 In [Hischer & Lambert 2003] wird gezeigt, dass es beliebig viele Mittelwertfunktionen
gibt, die sämtlich vernünftigen axiomatischen Ansprüchen an das genügen, was „Mittelwerte“ ausmacht! In [Bullen et al., 1988] wird auf 342 (!) Seiten eine Vielzahl konkreter Mittelwerte untersucht, und nur innerhalb des 44 Seiten umfassenden letzten Kapitels (“Further Means, Axiomatics and other Topics”) wird im 12. Abschnitt (“Axiomatization of Means”) auf nur 3 ½ Seiten auf die Axiomatisierung eingegangen.
79 In der Literatur finden sich weitere vielfältige Beispiele zu Bezeichnungen und Begrif-
fen im Zusammenhang mit „Mitte(lwert)“, z. B. im 2003 erschienenen Lexikon der Mathematik (Heidelberg: Spektrum Akademischer Verlag).
44
4
H. Hischer
Mittelwertbildung als „fundamentale Idee“ der Mathematik
... daß die basalen Ideen, die den Kern aller Naturwissenschaft
und Mathematik bilden, und die grundlegenden Themen,
die dem Leben und der Dichtung ihre Form verleihen,
ebenso einfach wie durchschlagend sind.
Jerome S. Bruner, 1970 80
Bekanntlich bewirkte Bruner mit seinem Buch (insbesondere in der Didaktik der
Mathematik) eine bis heute nachhaltige Diskussion über die Bedeutung der sog.
fundamentalen Ideen für die Planung und Gestaltung von Unterricht, wobei in der
fachlichen Diskussion auch andere Bezeichnungen wie etwa zentrale Ideen oder
universelle Ideen mit je eigenen Akzentuierungen anzutreffen sind. Das Problem
des mit dieser Bezeichnung verbundenen Begriffs besteht in seiner immanent angelegten verführerischen Aufforderung zu einer voraussetzungsfreien, subjektiven,
spontanen und intuitiven Deutung. Und folglich bietet die fachliche Literatur auch
eine Fülle je spezifischer Interpretationen dieses Begriffs.
Das Verdienst eines fundierten Überblicks über die in der mathematikdidaktischen
Fachliteratur anzutreffende Reichhaltigkeit der Auslegungen dieses vagen Begriffs
gebührt Schweiger mit seiner „geisteswissenschaftlichen Studie“ über fundamentale
Ideen. 81 Insbesondere stellt Schweiger in einer bemerkenswerten Akzentuierung
wesentliche gemeinsame Aspekte der unterschiedlichen Auffassungen über fundamentale Ideen heraus, die zu Kriterien über fundamentale Ideen führen (können).
Hieran anknüpfend habe ich 1998 betont, dass man diese unterschiedlichen Kriterien in deskriptive und normative unterscheiden müsse, also in solche, die ihrer
Auffindung dienen und solche, die mit ihnen verknüpfte pädagogische Erwartungen zum Ausdruck bringen.
Zugleich habe ich das damit verbundene Konzept über fundamentale Ideen exemplarisch erstmals an der Mittelwertbildung konkretisiert, wobei mir wichtig ist,
dass nicht die „Mittelwerte“ selbst eine fundamentale Idee sind, sondern ihre
Bildung, also eine Handlung! Hier schließe ich mich ausdrücklich Schweiger an: 82
Eine fundamentale Idee ist ein Bündel von Handlungen, Strategien und Techniken [...]
80 Jerome Seymor Bruner in seinem Buch „Der Prozeß der Erziehung“, 1970.
81 [Schweiger 1992]; aus der umfangreichen Literatur über fundamentale Ideen sind u. a.
noch die Analyse und der Standpunkt von [Heymann 1996] und das Themenheft [Klika
2003] zu nennen.
82 [Schweiger 1992, 207]; Hervorhebung nicht im Original.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
45
Auch im wissenschaftlichen persönlichen Diskurs mit meinen Kollegen 83 hat sich
dieser Aspekt der Handlung (wozu im Sinne Schweigers dann auch Strategien und
Techniken gehören) als wesentlich für fundamentale Ideen (sowohl im deskriptiven
als auch im normativen Sinne) bestätigt. Demgemäß kann man nicht von „Zahl“
oder „Algorithmus“ als fundamentalen Ideen sprechen, sondern es geht um das
Zählen und das Algorithmieren (sofern man denn meint, dass dieses fundamentale
Ideen seien).
• „Fundamentale Ideen“ und „grundlegende Begriffe“ sind also zu unterscheiden!
Im Folgenden soll am Beispiel der Mittelwertbildung erneut und in Kürze aufgezeigt werden, was nach meinem Verständnis unter deskriptiven bzw. normativen
Kriterien bei fundamentalen Ideen zu verstehen ist. 84 Diese Kriterien belege ich
mit plakativen Benennungen:
deskriptiv: Historizität, Archetypizität, Wesentlichkeit, Vagheit
Durchgängigkeit, Transparenz
normativ:
4.1 Deskriptive Kriterien und Mittelwertbildung — oder:
Wie kann man fundamentale Ideen ausfindig machen?
Historizität — Die Idee der „Mittelwertbildung“ ist in der historischen Entwicklung der Mathematik als Wissenschaft aufzeigbar.
In den Kapiteln 2 und 3 dieser Abhandlung wurde dieser Aspekt, vor allem bezüglich der Anfänge in der Antike, ausführlich dargestellt.
Archetypizität — Die Idee der „Mittelwertbildung“ ist auch außerhalb der Mathematik auffindbar – gewissermaßen als ein Archetyp des Denkens.
Dieser Aspekt ist kennzeichnend für viele Alltagsprobleme, so etwa für das Auftreten des Simpson-Paradoxons im Zusammenhang mit Statistiken und Durchschnittswerten, wobei „grundlegende Vorstellungen“ intersubjektiver Art hierfür (mit) verantwortlich sind. 85
Ein einfaches Beispiel möge dies verdeutlichen: 86 Abb. 16 kann man als WegZeit-Diagramm lesen, etwa für die Bewegung zweier Autofahrer: Nach rechts wird
die Zeit abgetragen und nach oben der zurückgelegte Weg. Die Steigungen der Dreiecksseiten wären dann als die Geschwindigkeiten der Autofahrer zu interpretieren.
83 Dank an Hans Schupp und Anselm Lambert!
84 Vgl. hierzu auch [Hischer 1998] und [Hischer 2003].
85 Beispiele dazu etwa in [Hischer 1998] und [Hischer 2003], ferner auch [Jahnke 1993].
86 Bereits in [Hischer 1998] skizziert. Vgl. hierzu auch Abb. 8!
46
H. Hischer
Abb. 16: Das „Simpson-Paradoxon“ in der Verkleidung
als Paradoxon der Durchschnittsgeschwindigkeiten
Es kann damit folgende Situation
eintreten: Einer der beiden Autofahrer (dunkelgrau) fährt der Reihe nach
mit den konstanten Geschwindigkeiten von z. B. 30 km/h und 100
km/h, der andere dagegen (hellgrau)
mit jeweils größeren Geschwindigkeiten, etwa 70 km/h und 120 km/h,
dennoch hat der dunkelgraue („langsamere“) eine größere Durchschnittsgeschwindigkeit v 1 als der hellgraue,
„überall schnellere“.
Plakativ gilt also: Man kann global verlieren, obwohl man überall lokal gewinnt! 87
Erläutert man diese Situation ohne solch eine Veranschaulichung Nicht-Mathematikern, so wird sie als paradox empfunden. 88 Die Mittelwertbildung ist also insofern archetypisch, als man nicht Mathematik studiert haben muss, um die Paradoxie in diesem Beispiel (und entsprechenden anderen) zu spüren — offenbar reichen hierzu „grundlegende“ Vorstellungen intersubjektiver Art aus. Die Mathematik ist jedoch hilfreich bei der Auflösung dieses Widerspruchs.
Wesentlichkeit: Die Mittelwertbildung gibt (zumindest partiell) Aufschluss über
das Wesen der Mathematik.
Denn bei einer Analyse dessen, was „Mittelwerte“ sind, treten u. a. folgende wesentliche Aspekte mathematischen Tuns auf: Vermuten, Formalisieren, Beweisen,
Widerlegen, Argumentieren, Verallgemeinern, Veranschaulichen, Systematisieren,
Axiomatisieren und Theoriebildung. 89
Vagheit: Der Begriff eines numerischen Mittelwerts oder Mittels ist äußerst vielfältig und keinesfalls eindeutig.
So kann bereits das Chuquet-Mittel zwischen zwei Brüchen als vieldeutiger „Mittelwert“ interpretiert werden, und jeder numerische „Mittelwert“ kann als ChuquetMittel aufgefasst werden, so dass sich beliebig viele numerische „Mittelwerte“ (als
zweistellige Funktionen) erklären lassen, die sinnvollen axiomatischen Ansprüchen
an Mittelwertbildung genügen. 90
87 In Abwandlung von [Meyer 1994]: „Man kann lokal gewinnen, aber global verlieren.“
88 Und selbst diese Veranschaulichung wird dann die Paradoxie nicht sofort beseitigen!
89 Wir haben dieses bereits an vielen Stellen in Kap. 2 & 3 erfahren, und besonders deutlich
wird dieser Aspekt in der axiomatischen Untersuchung in [Hischer & Lambert 2003].
90 Vgl. [Hischer & Lambert 2003].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
47
Darüber hinaus gibt es auch „nicht-numerische Mittel“, etwa in der Geometrie
(Mittelpunkt, Seitenhalbierende, Winkelhalbierende, ...), 91 ferner etwa in der Stochastik, wenn es um qualitative Merkmale geht.) 92
Auch Schweiger hebt diesen Aspekt der Vagheit in seiner Analyse mit Recht besonders hervor: 93
Vergleicht man die in den vorangegangenen Abschnitten vorgestellten Kataloge, so zeigen sich überraschende Ähnlichkeiten, aber die Disparatheiten überweigen. Fischer
schreibt dazu „Neben die Schwierigkeit der Umsetzung fundamentaler Ideen in der Unterrichtspraxis tritt das Problem, diese überhaupt herauszufinden“ [...] Dies dürfte mit
der, fundamentalen Ideen zugeschriebenen Vagheit zusammenhängen. Es sei nochmals
Jung 1978 zitiert: „Die Idee einer Sache ist etwas vage, braucht keine Detaillierung,
macht sie erst sinnvoll.“ [...] Was Jung im Hinblick auf den lernzielorientierten Unterricht konstatiert, nämlich das Bestehen einer Unschärferelation „Je präziser, desto bedeutungsloser“ [...] scheint auch hier zuzutreffen.
4.2 Normative Kriterien und Mittelwertbildung — oder:
Fundamentale Ideen der Mathematik als curriculare Strukturierungshilfe?
Während die deskriptiven Kriterien dem Ziel dienen, fundamentale Ideen ausfindig
machen zu können, bringen normative Kriterien Erwartungen an den Unterrichtsprozess zum Ausdruck. Für die Mittelwertbildung würde dies bedeuten:
Durchgängigkeit: Die Mittelwertbildung gilt als eine tragfähige Idee, um curriculare Entwürfe des Mathematikunterrichts durchgängig gliedern zu helfen – von
der Primarstufe bis hin zum Abitur (und darüber hinaus). 94 In Verbindung mit
dem deskriptiven Kriterium der Historizität führt dies zur Einbeziehung kulturhistorischer Aspekte der Genese von Begriffen, Problemen und Ideen in den Unterricht, 95 was eine „historische Verankerung“ ermöglichen soll: Es geht dann um 96
die Verwendung historischer Beispiele im Unterricht, die sich als tragfähige Bausteine
einer Unterrichtseinheit erweisen. Dabei sollten sie gemäß Toeplitz vom „Staub der
Zeit“ befreit und in heutiger Formulierung dargestellt werden. „Geschichte der Mathematik“ erscheint in diesem Sinne als didaktischer Aspekt – zugleich wird ein Beitrag
zur Kulturgeschichte geliefert.
91 Vgl. z. B. [Führer 1985]
92 Das Themenheft [Winter 1985] bietet eine reichhaltige Übersicht bezüglich unterschied-
licher Mittelwerte.
93 [Schweiger 1992, 207]
94 Ausgewählte Unterrichtsbeispiele finden sich in [Hischer 2003], sie sind z. T. auch be-
reits in [Hischer 1984] und [Hischer 1998] angedeutet. Auch Kap. 2 bietet Anregungen.
95 Vgl. hierzu auch die Ausführungen über „Begriffsbildung“ in [Hischer & Lambert 2002].
96 [Hischer 1998, 12]
48
H. Hischer
Transparenz: Die Mittelwertbildung als Idee soll bei der Planung, Durchführung
und Auswertung von Mathematikunterricht helfen, diesen für alle Beteiligten inhaltlich zu strukturieren und transparent zu machen.
Dieses Kriterium bedeutet, dass die — gemäß den deskriptiven Kriterien bereits
lokalisierten — fundamentalen Ideen im Unterricht auch explizit bewusst gemacht
werden müssen, um damit — auch für die Schülerinnen und Schüler! — im Unterricht als „roter Faden“ im Sinne des Kriteriums der Durchgängigkeit zu erscheinen.
4.3 Zusammenfassung und Ausblick für weitere Entwicklungsarbeit
Während die vier normativen Kriterien dazu dienen können, durch theoretische
Analyse und rationalen Diskurs einen Katalog fundamentaler Ideen zusammenzustellen, sind die normativen Kriterien durch empirische Evaluation bezüglich derart
gefundener fundamentaler Ideen zu überprüfen, zumindest ist aber eine Sammlung
subjektiver Unterrichtserfahrungen erforderlich.
Heymann 97 gibt in seiner grundlegenden konstruktiven Analyse sechs fundamentale Ideen an, die er „zentrale Ideen“ nennt, nämlich die Idee der Zahl, des Messens, des funktionalen Zusammenhangs, des räumlichen Strukturierens, des Algorithmus und des mathematischen Modellierens. Auch wenn sie in dieser Formulierung nicht alle als „Handlung“ erscheinen, erfüllen sie ersichtlich die deskriptiven
Kriterien für fundamentale Ideen. Zugleich fällt auf, dass die in dieser Abhandlung
präsentierte Idee der Mittelwertbildung nicht in den Heymannschen Rahmen hineinpasst: denn sie ist trotz der ihr anhaftenden Vagheit viel konkreter als die Heymannschen Ideen. Andererseits erscheint sie gerade wegen ihrer Konkretheit viel
unterrichtsnäher als die eher zu allgemeinen Heymannschen Ideen, die wiederum
wegen ihrer Allgemeinheit und damit geringen Anzahl geeignet sind, in knapper
Form grundsätzliche inhaltliche Aspekte des Mathematikunterrichts zu benennen.
Das führt zu der These, dass es fundamentale Ideen auf zumindest zwei verschiedenen Ebenen mit unterschiedlichem Konkretisierungsgrad gibt, die Mittelwertbildung also eine Idee auf solch einer zweiten, „konkreteren“ Ebene ist. 98 Dies
könnte dann (in Abwandlung von Heymann) folgendermaßen aussehen:
Ebene 1: Zählen, Messen, räumliches Strukturieren, Algorithmieren, ...
Ebene 2: Mittelwertbildung, Linearisierung, Optimierung, Symmetrisierung, ...
97 [Heymann 1996, 174]
98 Vgl. [Hischer 1997] und [Hischer 1998].
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
49
Die Listen in diesen Ebenen sind prinzipiell offen zu denken, und zwischen den
Ideen dieser beiden Ebenen wird noch eine vernetzende Zuordnung zu treffen sein.
Im Unterricht selber könnte es dann um das Wecken von Grundvorstellungen zu solchen Begriffen, Verfahren und Argumentationsmustern gehen, die mit diesen Ideen
zusammenhängen. 99 Das zieht im Prinzip zwei weitere zu vernetzende Ebenen
nach sich, die hier ebenfalls nur angedeutet seien und als Anregung für didaktische
Forschungs- und Entwicklungsarbeit dienen mögen:
Ebene 3: Grundvorstellungen (zu Begriffen, Verfahren und Argumentationsmustern)
Begriffe: Term, Zahl, Variable, Funktion, ... , Mittelwert, ... , Symmetrie, ...
Verfahren: Lösen von Gleichungen, Approximieren, Iterieren, ...
Argumentationsmuster: Schlussregeln, Gegenbeispiele suchen, Fallunterscheiden, ...
Ebene 4: Themen (zum Wecken solcher Grundvorstellungen)
Extremalprobleme, Sortieren, ...
Approximationsverfahren für Quadratwurzeln, ...
Wachstum, Konvergenz und Divergenz, ...
Durchschnittlicher Verbrauch ..., Mitten von Figuren und Körpern , ...
...
Einerseits bilden damit fundamentale Ideen der ersten beiden Ebenen eine curriculare Strukturierungshilfe für die Planung und Durchführung von Mathematikunterricht, indem sie eher indirekt über die Auswahl von Themen im Sinne von Ebene 4
wirksam werden, ohne also (zunächst) selbst explizit im Vordergrund stehen zu
müssen. Andererseits können die Bildungsziele eines solchermaßen strukturiertren
Mathematikunterrichts nur dann erreicht werden, wenn die fundamentalen Ideen
im Sinne des Kriteriums der Transparenz auch selbst Gegenstand des Unterrichts
werden – zumindest in einer späteren Phase der Reflexion.
Schließlich macht das Kriterium der Historizität deutlich, dass es sowohl notwendig als auch nützlich ist, kulturhistorische Aspekte der Genese von Begriffen,
Problemen und Ideen in den Unterricht einfließen zu lassen, diesen damit auch
zugleich im Sinne der Durchgängigkeit vertikal zu strukturieren und damit eine
„historische Verankerung“ zu organisieren, die zugleich eine „Verankerung“ von
Begriffen im Sinne von Ausubel ist. 100
Danksagung
Das Erstellung dieser Abhandlung ist mir seit langem ein wichtiges Anliegen. Ich
danke Dr. Anselm Lambert, Wissenschaftlicher Assistent an meinem Lehrstuhl, für
viele kritisch-konstruktive Gespräche und die Durchsicht dieser Abhandlung, die
deren Entstehung begleitet haben.
99 Vgl. [vom Hofe 1995] zum Konzept der Grundvorstellungen.
100 Vgl. [Hischer 1998].
50
5
H. Hischer
Literatur
Becker, Oskar [1954]: Grundlagen der Mathematik in geschichtlicher Entwicklung. Freiburg
/ München: Verlag Karl Alber.
Boyer, Carl B. [1968]: A History of Mathematics. New York: John Wiley & Sons, 1968.
Bullen, P. S. & Mirtinović, D. S. & Vasić, P. M. (Hrsg.) [1988]: Means and Their Inequalities. Dordrecht, Holland: D. Reidel Publishing Company, 1988
Cantor, Moritz [1892]: Geschichte der Mathematik. Zweiter Band. Leibzig: Teubner. 1.
Auflage.
Cantor, Moritz [1894]: Vorlesungen über Geschichte der Mathematik. Erster Band, Leipzig:
Teubner. 2. Auflage. (1. Auflage 1880)
Ford, L. R. [1938]: Fractions. In: American Mathematical Monthly, 45(1938), 586 – 601.
Führer, Lutz [1985]: Welche Vierecke haben einen „Mittelpunkt“? In: mathematik lehren,
1985, Heft 8, 38 – 43.
Herget, Wilfried [1985]: Zoo der Mittelwerte. In: mathematik lehren, 1985, Heft 8, 50 – 51.
Heymann, Hans Werner: Allgemeinbildung und Mathematik. Studien zur Schulpädagogik,
Band 13, Reihe Pädagogik. Weinheim / Basel: Beltz, 1996.
Hischer, Horst [1994]: Mittelwerte, Algorithmen und Folgen – ein Beispiel beziehungshaltigen Unterrichts durch „historische Verankerung“. In: Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht 1994 (Tagungsband). Hildesheim: Franzbecker, 1994,
147 – 150.
Hischer, Horst [1997]: „Fundamentale Ideen“ und „Historische Verankerung“ — dargestellt am Beispiel der Mittelwertbildung. Kurzfassung in Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht. Hildesheim: Franzbecker, 1987, 223 – 226.
Hischer, Horst [1998]: „Fundamentale Ideen“ und „Historische Verankerung“ — dargestellt am Beispiel der Mittelwertbildung. Langfassung in: mathematica didactica
12(1998)1, 3 – 21.
Hischer, Horst [2000]: Klassische Probleme der Antike — Beispiele zur „Historischen
Verankerung“. In: Blankenagel, Jürgen & Spiegel, Wolfgang (Hrsg.): Mathematikdidaktik aus Begeisterung für die Mathematik — Festschrift für Harald Scheid.
Stuttgart / Düsseldorf / Leipzig: Klett, 2000, 97 – 118.
Hischer, Horst [2003]: Mittelwertbildung — eine der ältesten mathematischen Ideen.
In: mathematik lehren, 2003, Heft 119, 40 – 46.
Viertausend Jahre Mittelwertbildung — eine fundamentale Idee ...
51
Hischer, Horst & Lambert, Anselm [2002]: Begriffsbildung und Computeralgebra. In:
Hischer, Horst: Mathematikunterricht und Neue Medien — Hintergründe und
Begründungen in fachdidaktischer und fachübergreifender Sicht. Hildesheim: Franzbecker, 2002, 138 – 166.
Hischer, Horst & Lambert, Anselm [2003]: Was ist ein numerischer Mittelwert? — Zur
axiomatischen Präzisierung einer fundamentalen Idee. Erscheint in: mathematica
didactica 17(2003)1, 3 – 42.
Hischer, Horst & Scheid, Harald [1982]: Materialien zum Analysisunterricht. Freiburg:
Herder.
Hischer, Horst & Scheid, Harald [1995]: Grundbegriffe der Analysis — Genese und Beispiele aus didaktischer Sicht. Heidelberg / Berlin / Oxford: Spektrum Akademischer
Verlag.
Hofe, Rudolf vom [1995]: Grundvorstellungen mathematischer Inhalte. Heidelberg / Berlin /
Oxford: Spektrum Akademischer Verlag.
Jahnke, Thomas [1993]: Das Simpsonsche Paradoxon verstehen — ein Beitrag des Mathematikunterrichts zur Allgemeinbildung. In: Journal für Mathematikdidaktik
14(1993)3/4, 221 – 242.
Klika, Manfred (Hrsg.) [2003]: Zentrale Ideen. Themenheft Nr. 119 in mathematik lehren,
2003.
Meyer, Jörg [1994]: Über einige Paradoxa aus der Stochastik. In: Müller, K. P. (Hrsg.): Beiträge zum Mathematikunterricht 1994. Hildesheim: Franzbecker, 239 – 242.
Naas, Josef & Schmid, Hermann Ludwig [1962]: Mathematisches Wörterbuch mit Einbeziehung der Theoretischen Physik. Berlin / Leipzig: Akademie Verlag, B. G. Teubner.
Neugebauer, Otto [1969]: Vorlesungen über Geschichte der antiken mathematischen Wissenschaften. Erster Band: Vorgriechische Mathematik. Berlin / Heidelberg: Springer.
Resnikoff, Howard L. & Wells, R. O., jr. [1983]: Mathematik im Wandel der Kulturen.
Braunschweig/Wiesbaden: Vieweg.
Schweiger, Fritz [1992]: Fundamentale Ideen — Eine geisteswissenschaftliche Studie zur
Mathematikdidaktik. In: Journal für Mathematikdidaktik 13(1992)2/3, 199 – 214.
Vollrath, Hans-Joachim [1978]: Schülerversuche zum Funktionsbegriff. In: Der Mathematikunterricht, 24(1978)4, 90 – 101.
Winter, Heinrich (Hrsg.) [1985]: Themenheft „Mittelwerte“. mathematik lehren, 1985, Heft 8.
Anschrift des Verfassers
Prof. Dr. Horst Hischer
Email: [email protected], Web: http://hischer.de/horst/
Universität des Saarlandes, Lehrstuhl für Mathematik und ihre Didaktik,
Postfach 15 11 50, 66041 Saarbrücken
Herunterladen