- 3 - DAS STIRLING'SCHE AUFZEICHNUNGSBLATT* FOR EXPERIMENTE ZUR WAHRSCHEINLICHKEIT G. ~ILES tlbersetzt von Bernd Wollring Ein neuer Weg aum Aufaeichnen relativer Häufigkeiten bei einfachen Experimenten Experimente zur Wahrscheinlichkeit innerhalb des Unterrichtes werden von den meisten Mathematiklehrern nach Möglichkeit gemieden. Sie sind, so meint man, mit Organisations- und Kontrollproblemen verbunden, die alle Vorteile überwiegen. Das Lernziel ist meist die Fähigkeit, Prüfungsfragen zur Wahrscheinlichkeit zu beantworten, und praktisches Arbeiten wird aus Zeitmangel als unwesentlicher Luxus angesehen. Aus meiner Erfahrung heraus bin ich der Ansicht, daß Schüler und Studenten ohne einen angemessenen Hintergrund an praktischer Erfahrung nicht in der Lage sind, ein Verständnis der Wahrscheinlichkeit zu entwickeln. Genau das führte mich dazu, die dreißig Experimente mit Würfelbechern zu entwickeln, die für DIME-Projekte von OLIVER und BOYD veröffentlicht wurden. Ich wollte Arbeitsmaterial schaffen, mit dem Schüler in Partnerarbeit beide etwa 100 Zufallsexperimente durchführen und jedes Ergebnis auf einem nur punktgroßen Platz notieren können. Dabei dachte ich in erster Linie an Schüler zu Beginn der secondary school (entspricht etwa den Klassen 6 und 7 ; Anm. d. tl.l, daher tritt der Begriff "Wahrscheinlichkeit" nur im Titel auf. Diejenigen, bei denen die Wahrscheinlichkeit "noch nicht dran" ist, können die Versuche als Ratespiele nehmen. Die Tatsache, daß einige in der Klasse meinen, sie könnten "rein zufällige" Ergebnisse vorhersagen, führt, so hoffe ich, zur Diskussion und zur Entwicklung des grundlegenden Begriffs der Wahrscheinlichkeit. Es zeigte sich, daß das Material auch für Studenten und Lehrer wertvoll ist; denn sie fanden bei ihrer * Originaltitel in 'TEACHING STATISTICS'(1979) Heft 3, Band 1 'The Stirling Recording Sheet for Experiments in Probability' - 5 - 4 Arbeit damit oft ein neues Verständnis der Wahrscheinlichkeit. START Ein wichtiger Teil dieser Entwicklungsarbeit war die Herstellung eines Aufzeichnungsblattes, das sowohl leicht zu handhaben als auch effektiv zum Gewinnen von Einsicht und Verstehen ist. Das Ergebnis zeigen die Bilder, und der Zweck dieses Artikels ist es, einige Vorteile zu beschreiben, die sein Gebrauch mit sich bringt. 1. GeDl'auch des Aufzeiahnungsb lattes Um die Folge aus "Gewinn" und "Verlust" aufzuzeichnen, wird vom Startpunkt aus eine durchgehende Linie gezeichnet, am besten mit einem Filzstift. Sie folgt stets einer der dünn gedruckten Linien auf dem Blatt und verläuft stets von oben nach unten. In jedem Kreuzungspunkt kann man eine von zwei möglichen Linien wählen, die Wahl hängt vom Versuchsergebnis ab: "Gewinn" - nach rechts gehen, "Verlust" - nach links gehen. Bild 1 zeigt eine Folge, die mit GGVVG beginnt. Das Originalformat des Blattes ist A5. Haben die Schüler erst gelernt, das Blatt zu benutzen, so geschieht das Aufzeichnen der Ergebnisse einfach und schnell. Normalerweise arbeiten sie zu zweit, der eine spielt (würfelt oder annliches), der andere zeichnet auf. Selbst wenn das Tempo beim Würfeln und Nennen des Ergebnisses gelegentlich 25 bis 30 Versuche pro Minute erreicht, kann der Aufzeichner mühelos mithalten. 2. Automatisahes MitzähZen Die Anzahl der Versuche wird auf dem Aufzeichnungsblatt automatisch mitgezählt. Hat der Schüler den unteren Rand erreicht, so hat er 50 Versuche aufgezeichnet. Darüber hinaus kann er sofort die Zahl der "Gewinne" unter diesen 50 Versuchen ablesen, von o unten links bis 50 unten rechts. Die in Bild 1 aufgezeichneten 50 Versuche enthalten 28 "Gewinne". Mit einer zweiten Linie auf o 10 dann insgesamt 100 Versuche. 0% 10% 20% 30% 40% 40 30 20 demselben Blatt (möglichst in einer anderen Farbe) erfaßt man 50% 60% 70% 80% 50 90% 100% GEWINNE Bild 1 - 7 - - 6 des versuchs aufzuschreiben, wieviele Gewinne er erwartet. Das J. GewinnanteiZ in Prozent Zusätzlich kann der Schüler den Anteil der "Gewinne" in Prozent nicht erst nach 50 Versuchen angeben, sondern bereits an jedem Punkt vorher. Er benutzt dazu die senkrechten Linien. In Bild 1 liegt zum Beispiel der mit X bezeichnete Punkt auf der 6ü%-Linie. 4. ReZative Häufigkeit führt zu einer höheren emotionalen Beteiligung am Versuch, denn er wünscht ja nun, daß das Ergebnis nahe bei seiner Vorhersage liegt. Bei Arbeitstagungen mit Lehrern erläutere ich diesen Punkt mit einem speziellen Versuch. Dazu dienen zwei Paar Kugeln in einem Zylinder. Ein Versuch besteht darin, den Zylinder zu- nächst zu schütteln und dann aufrecht auf den Tisch zu stellen. Die Kugeln liegen dann auf dem Zylinderboden entweder in einem Kreuzmuster (Bild 2a) oder paarweise nebeneinander (Bild 2b). Des weiteren benötigt man zum Bestimmen relativer Häufigkeiten keine Divisionen. Durch die Geometrie des Bildes kann man das umständliche Ausrechnen umgehen. Denn dies ist dem Schüler bei der Entwicklung seines Wahrscheinlichkeitsbegriffes, die wir uns ja wünschen, meist ein Hindernis. 5. Siehtbare Trends Ein weiteres wichtiges Ergebnis dieser Aufzeichnungsmethode besteht darin, daß der Trend der Ergebnisse während der Ver- Bild 2a Bild 2b Bild 2c suchsdurchführung sichtbar wird. Ferner sieht man bei jeder Man erliegt leicht der Versuchung, diese Ausgänge als gleich- Serie von 50 Versuchen, wie beim Fortführen der Linie nach wahrscheinlich anzunehmen, und in der Tat vermuten die meisten unten ihre Schwankung nach links oder rechts offensichtlich Schüler, Studenten und Mathematiklehrer vorher, daß sie in 50% abnimmt. der Fälle "gewinnen" werden, das heißt, die Figur aus Bild 2b erreichen. Leider ist aber die theoretische Wahrscheinlichkeit 6. Gibt es Schnittpunkte? Wenn eine zweite Linie zur Aufzeichnung der nächsten 50 Versuche gezeichnet wird, kann sowohl bei Erwachsenen als auch bei Kindern eine überraschend hohe emotionale Beteiligung entstehen: Wird die zweite Linie die erste schneiden? Diese Wirkung hatte ich nicht vorhergesehen, aber ohne Zweifel hilft ein solches persönliches Interesse beim Entwickeln eines intuitiven Gefühls für die Grundideen der Wahrscheinlichkeit. 7. Gesahätzte Vorhersage dafür 2/3, wie man mit Bild 2c feststellt. Wenn eine schwarze Kugel in der Lage A liegenbleibt, dann geben zwei von den Lagen, die die andere schwarze Kugel einnehmen kann, einen Gewinn. Beim Durchführen des Versuchs erwarten und wünschen jedoch die meisten Leute, daß die Linie nahe der 50%-Marke auf der Seitenmitte herauskommt. Zeigt sie aber die Neigung, nach rechts auszuwandern, so kann das zu deutlicher Verwirrung führen, besonders wenn dann die zweite Linie die Neigung der ersten bestätigt. Man hat mir vorgeworfen, gezinktes Material zu verwenden, und auf einer Arbeitstagung in Australien hörte ich, wie ein Lehrer sich bei seinem Partner beklagte, "er habe jedes Ver- Ganz absichtlich nötigt das Aufzeichnungsblatt, auf dem der trauen in die Gesetze der Wahrscheinlichkeit verloren". Natür- Schüler seine Versuchsergebnisse notiert, ihn dazu, vor Beginn lich gab es auch andere Lehrer, die diese Diskrepanz offen- - 9 - - 8 sichtlich ohne Verwirrung akzeptieren, was zu der wichtigen Frage führt : Wann sollte man beginnen, seine Vorhersage (Schätzung) zu überdenken ? folgendem Ergebnis führt: 50 • 49 1· 8. KonstI'Uktion des Auf3eiclmungsb Zattes 2 27 26 24 25 Betrachten wir nun Zusammenhänge zwischen der Konstruktion des Nun kann jeder sorgfältige und unternehmungslustige Schüler mit Aufzeichnungsblattes und anderen mathematischen Objekten auf einem Taschenrechner und hinreichend Zeit und Interesse heraus- verschiedenen Ebenen. Als erstes sollte man bemerken, daß jede finden, daß die Antwort rund 126·000·000·000·000 ist. Auf diese Zeile der Kreuzungspunkte die Breite des Blattes in gleiche Art kann die Beziehung verschiedener mathematischer Aspekte zu Stücke teilt. So liegt zum Beispiel der Punkt X in Bild 1 auf einem gewöhnlichen Aufzeichnungsblatt, das Schüler beim Experi- dem Punkt 3/5 der Horizontalen und daher auf der 60%-Vertikalen. mentieren verwenden, und zu Fragen wie: "Wieviele Wege bis X?" Dreht man das Bild um 90 Grad nach links, diese Mathematik für Studenten jeden Alters mit Sicherheit zu- _~fzeichnungszwecke Form y(x) = k/x (was wohl für einige von Vorteil ist), so haben die Kurven die und y(x) =h gänglicher und bedeutungsreicher machen. - k/x • 11. WatzrsaheinZichkeit bei p = 1/2 9. Pasaa Z ' saMs Dzoeieak In dem speziellen Fall, da "Gewinn" und "Verlust" gleichwahrKehren wir zu dem Punkt X in Bild 1 zurück, so sehen wir, daß scheinlich sind, folgt, daß alle Wege, sagen wir bis auf die er eine Situation mit fünf Versuchen beschreibt, von denen Höhe von X, gleichwahrscheinlich sind. Wir halten fest, daß drei "Gewinne" sind. Wir können fragen, auf wieviele Arten die- die Gesamtzahl aller Möglichkeiten (Wege) für die ersten fünf ----~ ----~ -- .- ---_.~ se Position zu erreichen ist. Das läßt sich zum Beispiel durch Versuche gleich der Summe der Zahlen in der fünften Zeile des 5 oder 32. Die Wahrscheinlich- Betrachten verschiedener Versuchsergebnisse ermitteln: GVGVG, Pascal'schen Dreiecks ist, also 2 VVGGG, VGGGV und so weiter. Oder wir betrachten die Zahl aller keit für einen bestimmten Weg bis X ist also .10 zu 32, oder verschiedenen Wege vom Startpunkt bis zum Punkt X. In jedem 0.3125. Betrachten wir nun alle Wege bis hinunter zur untersten 50 Zeile des Blattes, so erhalten. wir die Gesamtzahl von 2 , Fall erhalten wir 10 als Antwort. Wenn wir die entsprechenden Zahlen für die anderen Punkte auf derselben Höhe bestimmen, so näherungsweise 1·126·000·000·000·000, und es folgt fast sofort, erhalten wir die Binomialkoeffizienten 1; 5; 10; 10; 5; 1, die daß man bei einem Versuch mit p bei der Entwicklung von (x+y)5 auftreten. gezeichneten Zick-Zack-Linien auf der untersten Linie im Bereich 10. BinamiaZkoeffi3ienten Wahrscheinlichkeit, ins Zentrum zu treffen, ist etwa O,t. = 0,5 etwa die Hälfte der auf- von 23 bis 27 "Gewinne" (einschließiich) erwarten sollte. Die Ganz natürliches Weiterdenken in dieser Richtung führt zu Fragen wie der folgenden: "Wieviele Wege gibt es vom Start bis zur Mitte der untersten Zeile?" Das Pascal'sche Dreieck Zeile für Zeile b!s untE!n hin zu entwickeln, wäre äußerst mühsam, -hi~r ist jedoch die Gelegenheit vorbereitet, für die Binomialkoeffizienten die Formel zu nennen oder zu entwickeln, die zu 12. Vert;r>auensbel'eiche Im wesentlichen liefert die Diskussion oben eine einfache Einführung in das schwierige Gebiet der vertrauensbereiche (Konfidenzbereiche). Für Unterrichtszwecke mag es angemessen sein, 90%-Vertrauensbereiche zu wählen. Diese kann man auf dem Auf- - 11 - 10 - zeichnungsblatt darstellen (siehe Bild 3), und zwar nicht nur als Bereich auf der untersten Linie, sondern mit zwei Kurven, zwi- START schen denen man auf jeder Höhe 90% der Zick-Zack-Linien erwarGEWINN VERLUST tet. Aus der Form dieser Kurven wird klar, daß man das Versuchsergebnis um so näher bei dem theoretischen Wert der Wahrscheinlichkeit erwarten kann, je mehr Versuche man durchführt. 13. VerteiZung der MitteZwerte Der Probability Kit (Experimentierkasten zur Wahrscheinlichkeit, Anm. d. U.) dient dazu, daß gleichzeitig mehrere Schüler in Paaren an verschiedenen Versuchen arbeiten können. Dadurch hat man auch Vorteile beim Experimentieren mit der ganzen Klasse. Zunächst kann man, wie oben, nach Vertrauensbereichen fragen. Als zweites kann man den Mittelwert für die Klasse bestimmen. Bei einer Arbeitstagung, bei der ich den Versuch aus Punkt 7 benutzte, wurde behauptet, die mittlere Anzahl der "Gewinne" bei 50 Versuchen sei 33,33. Daraufhin konnte ich fragen, welche "Genauigkeit" von diesem Mittelwert zu erwarten sei, wenn man die Zahl der Teilnehmer bedenkt. Wenn eine Tagungsgruppe 40 Teilnehmer hat, und jeder zweimal 50 Versuche aufzeichnet, in welchem Bereich sollte man dann den Gruppen-Mittelwert erwarten? 14. Zehn Gewinne naaheinander Ein einfacher und wichtiger Gesichtspunkt dieser Aufzeichnungsmethode, der bislang nicht diskutiert wurde, betrifft die Reihenfolge, in der die Ergebnisse auftreten. Ein Vorteil hierbei ist, daß man die Klasse zum Beispiel fragen kann, ob jemand zehn aufeinanderfolgende "Gewinne" aufgezeichnet hat. Das ist sehr leicht festzustellen, wogegen übliche Aufzeichnungsmethoden diese Information nicht so leicht hergeben. Man kann auch fragen "Wie oft sind zehn aufeinanderfolgende "Gewinne" bei einer Klasse dieser Größe zu erwarten ?" Hier ist wieder eine Gelegenheit, wei- o 0% 10% 20% terführende Probleme zur Wahrscheinlichkeit zu diskutieren. 20 10 30% 40% 30 50% 60% 50 40 70% 80% 90% 100% GEWINNE Bild 3 - 12 - 15. Unabhängige Ereignisse Noch ein Vorteil trat auf der oben genannten Arbeitstagung unerwartet zutage. Ein enttäuschter Student beklagte sich, der Grund dafür, daß er zu viele "Gewinne" erhielte, läge darin, daß der Zylinder zu eng sei, und die Kugeln nicht leicht genug aneinander vorbeikämen. "Das bedeutet" , sagte er, "daß auf einen "Gewinn" eher ein "Gewinn" folgt." Und deshalb erhielte er zu viele "Gewinne". Die naheliegende Entgegnung war die Frage, ob er auch herausgefunden hätte, daß auf einen "Verlust" eher ein "Verlust" folgt. Ein Blick auf sein Blatt zeigte ihm, daß das nicht der Fall war, und er sah ein, daß er diese Behauptung nicht aufrecht erhalten konnte. Dieser Artikel basiert auf Material aus dem Abschlußbericht eines Forschungsprojektes, das vom Schottischen Erziehungsministerium (Scottish Education DepartmentJ getragen wurde: School Mathematics Under Examination: Same factors affecting the learning of mathematics Quelle 1. Probability Kit No. 1, Oliver & Boyd, ISBN 0 05 003050,~ 7.50 - 13 - BEMERKUNGEN ZUM STIRLING'SCHEN AUFZEICHNUNGSBLATT FÜR EXPERIMENTE ZUR WAHRSCHEINLICHKEIT NACH G. GILES B. WOLLRING Die folgenden Bemerkungen beziehen sich auf das von G. Gi~es vor- gestellte Arbeitsblatt zum schnellen Aufzeichnen relativer Häufigkeiten bei Bernoulli-Experimenten. Das "Aufzeichnungsblatt", wie wir es im folgenden nennen wollen, ist meiner Meinung nach ein derart schönes und praktisches Hilfsmittel, daß mir einige Bemerkungen zur Ergänzung des Textes von G. GiZes (siehe Gi ~es) lohnend erscheinen. Die Bilder 1 und 2 können als Kopiervorlag: des Aufzeichnungsblattes genommen werden, wobei Bild 2 gegenüber Bild 1 zusätzlich die 90 %-Vertrauensintervalle für p bei k = n/2 enthält. Gegenüber dem Original von GiZes wurden einige Ablesehilfen hinzugefügt. Ferner ist unter der Skala für den Gewinnanteil ein "Magazin" eingezeichnet, in dem die Ergebnisse mehrerer Versuchsserien wie in einem Histogramm gesammelt werden können. Wir kommen weiter unten darauf zurück. Ist das Magazin nicht erforderlich, so kann es beim Kopieren abgedeckt werden. Offenbar beabsichtigt Gi~es, das Aufzeichnungsblatt den Schülern zunächst nur mit einer Gebrauchsanweisung in die Hand zu geben und baut darauf, daß sie die Konstruktion im Laufe der prakti- * Siehe Beilage zu diesem Heft - 14 - - 15 - sehen Arbeit immer besser durchschauen. Hier scheint es mir, (n; k) fragt. Allerdings erscheint mir wohl einige Lehrerhilfe speziell angesichts der deutschen Curricula, sinnvoll, die nötig, bis die Schüler einsehen, daß Schüler auf die Analogie des Aufzeichnungsblattes zum Baumdia~ hinzuweisen. Daß das Aufzeichnungsblatt ein verzerrtes n· (n - (1) 1)· 1 • 2 . • (n - k - 1) k n! k! (n - k)! Baumdiagramm ist, kann der Schüler an einem kurzen Abschnitt die Zahl der Wege vorn Start bis zum Punkt (n; k) ist. Meiner An- beider Strukturen feststellen, indem er sie Punkt für Punkt und Weg für Weg vergleicht. Dazu genügen zwei Abschnitte bis n = sicht nach kann diese Formel durch Aktivitäten am Aufzeichnungs- 5, blatt allein nicht gefunden werden. Wohl findet der Schüler, wenn die er zum Vergleich auch selbst zeichnen sollte (siehe Bild 3). er mit (~) die Zahl der Wege vorn Start bis (n; k) 'bezeichnet, die Formeln 2 I Randformeln: (2) :1 /' o /' ,. /' , 2 3 4 Schrittformel: (~) + (k ~ /' 5 Gew. t o t t t 2 3 4 t 5 Gew. Aber damit ist die Struktur der Formel 1) (1) (n + 1) k + 1 noch nicht gefunden. Mit einem Beweis durch Induktion über n kann sie wohl bestätigt Bild 3 Wahrscheinlichkeitsbaum in Dreieck-Darstellung und in Giles-Darstellung werden, aber dazu muß ihre Struktur bereits bekannt sein. Da die Formel (1) jedoch bei der weiteren Diskussion des AufzeichDas Identifizieren analoger Punkte und Wege sollte in beiden nungsblattes vonnöten ist, soll sie mit einer einfachen kombinate- Richtungen geübt werden. Bei kombinatorischen Uberlegungen, wie rischen (Jbel.'Zegung erarbeitet werden, bei der das Aufzeichnungsblatt sie weiter unten folgen, ist der Rückgriff auf die Dreieck-Darzur veranschaulichung herangezogen wird, und Wege darin mit Losstellung oft hilfreich. GiZes folgen einer Ziehung in Zusammenhang gebracht werden. weist darauf hin, daß durch den verständigen Gebrauch des Wir nehmen an, daß n! als Anzahl der Permutationen von n Objekten Aufzeichnungsblattes die Erarbeitung des Pascal'schen Dreiecks bereits vorbereitet wird. Auf die Binomialkoeffizienten (~) s~ößt bekannt ist. Nun ziehen wir n Lose aus einer Urne, davon k Gewinne, und numerieren die Lose beim Ziehen durch. Der gezogenen Los- man, wenn man nach der Zahl der Wege vom Start bis zum Punkt folge entspricht dann ein Weg im Aufzeichnungsblatt (siehe Bild 4). - - 16 - p (3) Start (n; k) 17 - Zahl der Wege mit Ziel (n; k) Zahl der Wege mit n Schritten nl (n - k)! kl 1 K 2 Das ist die Wahrscheinlichkeit, einen bestimmten Punkt (n; k) "auf der Höhe n" zu erreichen, denn alle wege der Länge n sind Ziel (7;3) Bild 4: Losfolge mit zugehörigem Weg bei p = 1/2 ja gleichwahrscheinlich. Es wäre schön, auch zu dieser Wahrscheinlichkeit einen experimentellen Zugang mit Hilfe des Aufzeichnungsblattes zu haben. Insgesamt erzeugen n! Losfolgen Wege mit dem Ziel (n; k); denn jedes Los kann an jeder Stelle auftreten, ohne daß das Wegziel sich ändert. Aber mehrere Losfolgen erzeugen denselben Weg (siehe Bild 5). Dazu dient das Magazin unter der Gewinnskala, in dem die Schüler die Ergebnisse mehrerer Versuchs serien sammeln, die sie entweder durch Wiederholen oder Zusammenfassen der Ergebnisse aus der ganzen Klasse finden. Die Notierung von 30 Versuchsserien zeigt Bild 6. 20% 0% Bild 5 60% 40% I 80% I 100% I I' Losfolgen mit demselben weg Vertauscht man die k Gewinnlose untereinander und ebenso die n - k Verlustlose untereinander, so ändert sich der erzeugte Weg nicht. Und das geht auf k! (n - k)! Arten. Also ist (~) ge- mäß (1) die Zahl der Wege mit Ziel (n; k). Bild 6 Notieren der Ergebnisse von 30 versuchs serien Damit kann auch die folgende Diskussion der Vertrauensbereiche GiZes benutzt nun offensichtlich die Formel (1), um die Wahr- scheinlichkeit p (n; k) von k Gewinnen unter n Versuchen zu bestimmen: durch ein Experiment vorbereitet werden. Mit der "Magazin"-Technik erhält man auch bei p = 1/2 qualitativ brauchbare Ergebnisse. - - 18 - 19 - ' L"ange des Vertrauensbereiches ein VielfaTypisch ist, da ß d ~e Die 90 %-Vertrauensbereiche für die Anzahl k der Gewinne unter n = Versuchen bei p 1/2 kann man zwar, wie Gites bemerkt, "auf dem Aufzeichnungsblatt angeben", aber die Konstruktion der von Gites gezeichneten Kurven ist nicht wie die übrige Zeichnung auf An- ches von 1 l(rll ist, was nicht nur bei p 1/2 gilt. Die Graphen ~ 8 in das Aufzeichnungs- der Funktionen n + P2 (n) sind für n blatt eingetragen, sie stimmen mit den Kurven im Original von Giles überein. Die Annahme der Normalverteilung von A enthält ei- hieb zu verstehen, jedenfalls nicht für Schüler. ne Näherung, so daß man bei direkten Berechnungen geringfügig andere Ergebnisse erhält. Als Hintergrundinformation für den Lehrer möchte ich daher zunächst erklären, wie ich sie rekonstruiert habe, und anschlieBei der Arbeit mit Schülern bieten sich meines Erachtens zwei ßend Möglichkeiten nennen, sie mit Schülern zu diskutieren. Wege zur Erläuterung und Bestätigung dieser Kurven an. Betrachten wir den Anteil kin der Gewinne bei n Versuchen als Der erste besteht darin, daß Vertrauensintervall für ein gegebebinomialverteilte Zufallsgröße A, so hat sie den Mittelwert ~ =p und die Standardabweichung a =p nes n, etwa n (1 - p}/n . Für hinrei- chend hohe Werte von n ist sie nach dem lokalen Grenzwertsatz annähernd normal verteilt. Einer Tabelle zur Normalverteilung = 30, exemplarisch zu bestimmen, wobei Formel (3) benutzt wird. Es wird jedoch aus Zeitgründen kaum möglich sein, diese Berechnung für mehrere, insbesondere für große n durch zuführen. entnehmen wir nun, daß für einen beobachteten Wert kin von A folgende Gleichung gilt: Gesucht sind also k (4 ) p (~- 1,645 a6 ~~~ + 1,645 a) 1 und k , so daß gilt: 2 90 % (6) P 130; k } + P 130; k + 11 + ••• + p f30; k ) <: 90 % 1 2 1 Das bedeutet hier: wobei (k 1; k) 2 e •;n Intervall mit Mittelpunkt 15 sein soll. Dazu (5) bestimmen wir k Speziell bei p intervall = P1; P2 0,5 erhalten wir für kin das 90 %-Vertrauens(7) mit Mittelpunkt 0,5 und den Grenzen 0,5 - 1,645 (6) 0,5 + 1,645 1 2~ 1 2fi11 1 so, daß gilt: 3D! 30! 30! < 5 % ' 2 30 0!(30 - O)! + 1!(30 - 1)! + ... + k !(30 - k )! 1 1 Damit vermeiden wir die großen Zahlen "in der Mitte" und nutzen die Symmetrie aus. Wir erhalten 5 % • 2 30 = ~3 687 091 - - 20 - und für die Binomialkoeffizienten nutzen. (30) 0 Dazu läßt man mehrere Schüler, sagen wir 25, mit analogem Gerät (30) 1 (8) 21 - gleichzeitig Versuchs serien durchführen und die Ergebnisse je- 30 weils nach n (30) 2 (30) 29 1 ""2 435 (30) 3 (30) 28 2 "3 4 060 = 10; 20; ... ; 50 Versuchen austauschen. Dabei trägt jeder Schüler sämtliche Zwischenergebnisse in sein Magazin ein. Man sieht dann, daß die Verteilung der 25 Ergebnisse sich bei wachsender Länge n der Versuchs serien "zusammenzieht", wie es Bild 7 als Beispiel zeigt. 32 906 445 Gewinnanteil 0% 60 812 890 Also erhalten wir k (9) 1 = 10 und k 0,3333 40% 60% 80% 100% ~I----+----4----~----+I----4---~I~--_+----~I----~--~1 20 und damit 2 und 20% 0,6666 P2 als Grenzen des 90 %-Vertrauensintervalls für p. Man benötigt Bild 7a : Ergebnisse von 25 Versuchsserien der Länge 10 Gewinnanteil etwa 10 Minuten für diese Rechnung, wenn man einen Taschenrechner benutzt. Die Zeichnung bestätigt das Ergebnis. Zum Vergleich nennen wir die entsprechenden Ergebnisse, die man mit Formel (6) 0% 20% 40% 60% 80% 100% ~I~--+---~I~--~----+I----4---~I-----+----~I----~--~1 gewinnt: (10) 0,3499 Sie führen ebenfalls auf k und P2 1 = 10 0,6501 und k 2 = 20. Diese Methode hat den Nachteil, daß man nicht unmittelbar erkennt, wie die Länge Bild 7b : Ergebnisse von 25 Versuchs serien der Länge 50 des Vertrauensintervalls von der Zahl n der Versuche abhängt. Die 90 %-Vertrauensintervalle sind nun jeweils durch Abzählen Daher sei hier vorgeschlagen, das Magazin unter der Gewinnskala zu bestimmen. zur experimentellen Bestimmung des Vertrauens intervalls zu be- - Z2 - - 23 - Eine ",eitere Höglichkei t, wie Jer Begriff des Envartungswertes auch eingeführt "erden kann* von Alan II'.Sykes (übersetzt von W.D .Heller) A Der Envartungswert wird in fast allen Statistikbüchern in der gleichen Vorgehensweise eingeführt. Hat man zunächst den Stichprobenmi ttelwert über die beobachteten Häufigkei ten definiert, wird man in natürlicher Weise den Envartungsliiert einer diskreten Zufallsvariablen X, die die Werte Xl ,x , ••• mit den WahrZ scheinlichkeiten Pl'PZ"" annimmt, als (1) definieren. Stetige Zufallsvariablen X, deren Verteilung durch eine Dichtefunktion fX(x) gegeben sind, benötigen eine "eigene" Definition von E(X), die lautet: E(X) = fxfx(x)dx. ( 2) :\atürlich liegt es nahe,Formel (2) als stetige Version von (1) zu erklären. 1;: folgenden soll eine Einführung des Envartungswertbegriffs betrachtet werden, die in der gängigen obigen Art sowohl den diskreten Fall (1) als auch den kontinuierlichen Fall (2) zusammenfaßt (aber nicht ersetzt!). Diese Herleitung ist einfach, weil sehr gut zu veranschaulichen, darüber hinaus aber a\1:- diskrete und stetige :ufallsvariablenarnvendbar. Die neue Methode Die :ufallsvariable X habe die rerteilungsfunktion FX1xl = p(\$x) In Abbilcitcg 1 wird die Verteilungs funktion einer stetigen :ufalls\Oariablen X graphisch dilloges te 11 t. c Abb. 1: x Verteilungsfunktion FX(X) einer stetigen Zufallsvariablen X Ein Punkt (c,o) werde auf der x-Achse beliebig gewählt; es sei dann A die Fläche zwischen x=c, FX(X) und der x-Achse, die Fläche B wird von x=c, FX(X) und y=1 begrenzt. Unter der Voraussetzung, daß die beiden Flächen A und B endlich sind, existiert E(X) und es gilt: E(X) = c + B-A. (3) Festzustellen ist: (i) (ii) (iii) die Definition von E(X) ist von c unabhängig. E(X) ist genau dann gleich c, wenn A = Bist. Ist X eine positivwertige Zufallsvariable, dann ist E(X) gleich der Fläche zwischen FX(x) und y=1. Die Möglichkeit, den Envartungswert nach (3) zu definieren, wird in den meisten Statistikbüchern nicht genutzt, während im Buch von FeIler ([1]) zumindest die Eigenschaft (iii) von (3) angegeben wird. Im folgenden sollen einige Aspekte der Definition des Envartungswerts durch (3) kurz angesprochen werden. ° * ':'riginaltitel in 'TEACHnC; STo-HISTICS' (1981) Heft 5, Band 5 ',\n Al terna ti ve Approach to the ~Iean' Äquivalenz der Formeln (1) und (3) Eine Zufallsvariable X nehme die Werte x 1 ,x ,x3 ,x 4 mit den Wahrscheinlichkeiten Z P1,PZ,P3 und P4 (Pl+P Z+P3+P4=1) an. Die Verteilungs funktion FX(X) ist eine Treppenfunktion, die an den Stellen Xi die Sprunghöhen Pi besitzt. Wendet man (3) wie oben gezeigt an, so folgt: A = Pl (c-x l ) + PZ(c-x Z) B = P3(x 3-c) + P4(x 4-c) - 25 - - 24 Nach einigen kleinen Umformungen ergibt sich c+B-A=Plxl+P2x2+P3x3+P4x4' was der Definition (1) entspricht. FX(x) 1 Wertebereich von X 2 4 6 Summierte Wahrscheinlichkeiten (Stufe 1) 0.1 0.3 0.6 0.3 Summierte Wahrscheinlichkeiten (Stufe 2) 0.1 0.4 1.0 0.3 I --+____: P3 und E(X) ergibt sich zu E(X) 8 +2(0.3-1.0) 10 8 6.6. P2 Gruppierte Werte, wobei die Klassenbreite konstant ist c x Beispiel für eine diskrete Zufallsvariable, deren Werte gleiche Abstände haben X sei eine diskrete Zufallsvariable, deren Verteilung durch die beiden ersten Zeilen von Tabelle 1 gegeben sei. Wird nun für c ein Wert des Wertebereichs von X gewählt - z.B. c=6 - so muß als nächstes die Wahrscheinlichkeitsmasse, die oberhalb und unterhalb von c liegt, aufsummiert werden (Zeile 3 in Tabelle 1). Wiederholt man diesen Vorgang, so ergibt sich Zeile 4 der Tabelle 1. In beiden Fällen werden die Wahrscheinlichkeiten, die zu dem gewählten c-Wert gehören, nicht berücksichtigt. Die in Tabelle 1 eingekreisten Werte werden nun mit 2 multipliziert um A und B zu erhalten. Somit ist E(X) = 6+2'(0.7-0.4) = 6.6. Durch Tabelle 2 ist eine Häufigkeitsverteilung gegeben, deren Stichprobenwerte in 5 Klassen gleicher Breite zusammengefaßt werden. Die die Klassen repräsentierenden Werte (die Klassenmitten) sowie die relativen Häufigkeiten stimmen mit den Werten von Tabelle 1 überein. Der Stichprobenmittelwert der Daten wird analog dem Vorgehen in Tabelle 1 bestimmt, die Vorgehensweise sei aber abweichend von Tabelle 1 nun in Tabelle 2 für absolute Häufigkeiten dargestellt. Tabelle 2 1 bis 3 3 bis 5 5 bis 7 7 bis 9 9 bis 11 2 4 6 8 10 absolute Häufigkeit 10 20 30 10 30 10 summierte absolute Häufigk. (Stufe 1) 10 30 40 30 0.3 summierte absolute Häufigk. (Stufe 2) 10 ~ [ZQ] 30 Klassen [ ) Kl ass enmi tte Tabelle 1 Wertebereich von X P(X=x ) i 2 4 0.1 0.2 6 8 0.3 0.1 I Summierte Wahrscheinlichkeiten (Stufe 1) Summierte Wahrscheinlichkeiten (Stufe 2) 0.1 0.1 0.3 ~ I I - II 0.4 10.71 I 0.3 2 I Stichprobenmittelwert = 6 + 100(70-40) 0.3 Wird für c anstelle von 6 der Wert 8 gewählt, ändern sich die Zeilen 3 und 4 von Tabelle 1 folgendermaßen: 6.6. - 26 - Da die Urdaten nicht vorliegen, kann die Berechnung des Stichproberunittelwertes nur unter gewissen Annahmen durchgeführt werden. Die Berechnungen in Tabelle 2 setzen voraus, daß die Wahrscheinlichkei tsslD11llle von jeder Klasse auf die Klassenmitte konzentriert ist - die Stichprobenverteilungsfunktion (oder auch empirische Verteilungsfunktion) also eine Treppenfunktion ist (Abb. 3). Realistischer wäre es anzunehmen, daß die Werte innerhalb einer Klasse gleichverteilt sind, so daß sich als Stichprobenverteilungsfunktion der in Abb. 3 darges tell te Polygonzug ergibt. Die Anwendung unserer neuen Definition (3) auf beide Verteilungsfunktionen ergibt das gleiche Resultat (die relevanten Flächen A und B sind anhand von Abbildung 3 zu berechnen, wobei die Berechnung der Flächen A und B leichter sein wird als die der entsprechenden Flächen des Polygonzuges) . Abbildung 3 relative Häufigkeit absolute Häufigkeit 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 100 90 80 70 60 für 1 für 5 7 9 1 "4 < x < :\ ± auf. \irrunt man Der Graph \'on Fy (:\) l;eist eine Unstetigkeitsstelle bei :\ ; 1 " desl\egen c=4 und l;endet (:01 an, so läßt sich über die Dreiecksflächen ,.l. und E mit den Flächeninhalten \'on 1/3: und 0 64 [IX) :u :3/6-1 EIX) berechnen. Die :.tarkoffsche Ungleichung Die Tschebyscheffsche Ungleichung, ein Korollar der 'larkoffschen Ungleichung, kann für den Beweis des schwachen Gesetzes der großen Zahlen verwendet werden. Obwohl dieses Gebiet der Wahrscheinlichkeitsrechnung sicherlich nicht allzu tief inl Stochastik-Schulunterricht behandelt werden dürfte bzw. könnte, soll kur: auf eine Anwendung von Fonnel (3) zur Begründung der ~larkoffschen Ungleichung eingegangen werden. Für eine positivwertige :ufallsvariable X, die den En,artungswert E(X) besitzt, 30 lautet die Markoffsche Ungleichung: 20 10 3 für 40 50 G.1 1 -::;.x+~ 11 Berechnung von E(X) für eine "gemischte Zufallsvariable" Die Fonneln (1) und (2) können nur auf Zufallsvariablen angewendet werden, die entweder diskret oder stetig sind. Nicht angewendet werden können sie für Zufallsvariablen, die weder diskret noch stetig sind und die also weder eine Treppenfunktion noch eine stetige Funktion als Verteilungsfunktion besitzen. Die in Formel (3) benötigten Flächen A und B hingegen können irruner berechnet werden. Sei etwa folgende \'erteilungsfunktion FX(x) der Zufallsvariablen X gegeben: P(X>).) <E(X), - - V).>0.1 ). Diese Ungleichung ergibt sich in natürlicher Weise aus Formel (3): E(X) ist die durch FX(X)' Y = 1 und x = 0 begrenzte Fläche,). • P(X>).) ist hingegen die Fläche eines Rechtecks, das in der E(X) charakterisierenden Fläche enthalten ist. Zusarrunenfassung Es ist nicht schwierig die Grenzen der in dieser Arhei t betrachteten Defini tionsmöglichkei t von E (X) aufzuweisen - E (X) einer Poissom'erteilung über (3) zu hestirrunen wäre ein "tödliches" Unterfangen. Des weiteren benötigt man zur BerechDie "tarkoffsche Ungleichung gilt noch für einen allgemeineren Fall: P! ) ~ E(X;r) . be l'leb'1ge _u - f a 11 svarla . bl e und ). ,r>o Sln . d. , r ' wob' el.X elne ..U:: Spe:ialfafl erhält man dann für r< und Y=X-E (Xl die Tschebyscheffsche X ~'. Ungleichung. - 28 - nung von E (X 2) nach (3) die Verteilungsfunktion von X2 . Nichts desto weniger kann die Formel (3) und mit ihr ihre Anwendungen als elementar, anschaulich und als ein erfolgreicher Schritt bei der Zusammenfassung der Formeln (1) und (2) für den diskreten bzw. stetigen Fall eingestuft werden. Sind dies nicht genug gute Gründe, um (3) in elementaren Stochastikbüchern zu en.ähnen? Literatur [1] FeIler, W. (1950): Introduction to Probability and its Applications (vol.2), S. 148, Wiley. - Z9 Bestißlmmg von Regressionsgeraden ohne Differentialreclmung* von C. W.Puritz (übersetzt von M.Nuske) Die Anpassung einer Modellgeraden y = a+bx an einen Datensatz (x 1'Yl) ,(xZ'YZ)' ... ,(xn'Yn) erfordert die Festlegung der beiden Zahlen a und b. Die Herleitung entsprechender Formeln nach der Methode der Kleinsten Quadrate basiert auf partiellen Ableitungen. Um diese Differentialtechnik zu vermeiden, verwenden einige Lehrbücher eine algebraische Methode, die mir immer ziemlich kompliziert erschien und einen entsprechend abstoßenden Effekt auf den Durchschnittsschüler der Oberstufe hatte. Ich habe deshalb stets partielle Differentiation verwendet (ohne die zugehörige spezielle Notation) und hatte keine Schwierigkeiten damit. Der algebraische Ansatz hat jedoch seine Vorzüge. Insbesondere garantiert er ein globales Minimum anstelle eines lediglich lokalen Extremums, welches mit Hilfe der Differentialrechnung bestimmt wird. In diesem Jahr habe ich eine einfachere algebraische Methode entdeckt und angewendet, die mir für Schüler meiner Statistikkurse der Oberstufe mit ihren sehr unterschiedlichen Begabungen und Fähigkeiten hinreichend einfach und klar erschien. Wir begannen mit der Durchrechnung eines numerischen Beispiels und verwendeten dabei die Differentialrechnung. Auf diese Weise lernen die Schüler beide Wege kennen. Im allgemeinen bin ich wie folgt vorgegangen: Die Gleichung Y , = a + bx (1) soll für Schätzungen von Y bei vorgegebenem x-Wert verwendet werden. Wenn man sie auf die x-Daten anwendet, erzeugt sie Schätzwerte Y = a+bx i , i = 1, ... ,n, i die im all~emeinen von den vorliegenden y-Daten, Yl' ... 'Yn ' abweichen. Sei e i = Yi - Yi der Schätzfehler für den i-ten Datenpunkt (xi'Yi). Wir suchen nun diej:nige Größe, für die die Summe der quadrierten Abweichungen der geschätzten y-Werte von den beobachteten y-Werten minimal wird. Die Größe Z e = (e~+ei+ ... +e~)/n, der mittlere quadratische Schätzfehler also, soll also durch Wahl geeigneter Werte für a und b minimiert werden. * Originaltitel in 'TEACHING STATISTICS' (198J) Heft 3, Band 3 'Deriving Regression Lines without Calculus' - .- .s ucr bekannten :o~'n FOl111el sich für Jie (cnpirisc}lCi \"arian: eint::::=. --, e ~',3.tEr1s~.-::L"S er- 31 - Das absolute Minimum dieses Ausdrucks ist 0 und wird genau dann angenommen, wenn gilt y : a + rarlei + e bx (6) Z "erden sehen, daß a unJ h so ge,,'jhlt ,,'erJen können, ,hf.' jeJer der beiJen _,l,.isdrucke auf der rechten Seite \'on I ~I sein absolutes '!inimIIDl annimmt. i',:r :::mächst ist Das heißt e nimmt seinen minimalen Wert an, wenn b gemäß (5) gewählt wird - das gibt uns die Steigung der Regressionsgeraden - und wenn a die Bedinglmg (6) erfüllt - daraus ersehen wir, daß die Regressionsgerade durch das Datenzentrum (x,y) verläuft. Die Bedingungen (5) und (6) ergeben also die Lösung des Problems. da die Addition der Konstanten a den llert der rarian: nicht \'erjnJert. (7) ',ei ter ergibt sich Var(y-bx) ---0 __ " [y-bxJ" - [y-bxJ') _ 77 _") __ Dabei ist r : Sxy/s xy s der Korrelationskoeffizient der Datenpaare (Xl' ,y .). l Hieraus ergibt sich unmittelbar, daß r Z stets kleiner oder gleich 1 ist und den Wert 1 genau dann annimmt, wenn e Z gleich 0 ist, das heißt, wenn die Datenpunkte alle exakt auf einer Geraden liegen. 7_ ') y"" 2bxy+b"x - -y- +2bxy-b -x" ~ .., _7 _ __ ~_: b - (x" -x")- 2b (xy-xy) +y" -y,., .., b-~- -x I - "bs + s"y - xy ( 3) "obei sZ, sZ und s die Varianz der x-Daten, die Varianz der y-Daten beziex y xy * hungsweise die Kovarianz der (x,y)-Datenpaare bedeuten. Kir vervollständigen nun das Quadrat mittels der sogen. quadratischen Ergänzcmg (oder könnten auch die Analysis ohne partielle Differentiation anwenden, falls gewünscht): 2 22 22 2 2 Offenbar nirmnt dieser Ausdruck sein absolutes ,linimum dann an, ',enn gilt (5) ;\lm betrachten wir der! zweiten ,\usdruck in (2): " , ~- = [y-(a+bx) J- : [~-(a+bi) Var(a+bx) : bZvar(x) = (s2xy-xx /s4)sZ : (s /s)2 xy-x Aus (7) ergibt sich also: Var(y) - Var(y) oder ( 4) + [sxSy - sAyJ/S X Var(y) Var(e) Var(e) : sZ[bZ-Zbs /s2 + s2 /5 4 J + Sy2 _ s2 /s2 x xyx AYX xyx sx[b-sAy/sXJ Darüberhinaus können wir zeigen, daß r2s~ die Varianz der geschätzten y-Werte, Yl'YZ""'Yn' ist: Var(y) = Var(;) + Var(e) Das heißt die Gesamtvarianz der y-Daten ist die Summe aus der erklärten Varianz (die durch die Beziehung zwischen y und x zustande kommt) und der nichterklärten Varianz (die durch die AbweiChungen der Datenpunkte von der Geraden entsteht). Und in dieser Summe ist das Verhältnis von erklärter zu nichterklärter Varianz " gerade r~. " j- .. :he Definition der l\O\"arian: einer flatenpaannenge lautet: Dieser letzte Teil (nach (7)) war für die Schüler schwierig, erforderte aber nicht viel Zeit und erzeugte Vielleicht das auf dieser Stufe bestmögliche Verständnis dafür, wie der Korrelationskoeffizient tatsächlich den Grad mißt, in welchem einern empirischen Datensatz eine theoretische Modellgerade angepaßt werden kann. - 33 - 32 - Eine Auswertung der Wirnbledon Tennisfinale der ersten 100 Jahre * von J.S.Croucher (übersetzt von G.KC\nig) Das Tennisturnier in Wirnbledon wurde 1877 zum erstenmal mit den Herreneinzel durchgeführt. 1879 kamen die Herrendoppel da:u und 1884 als weitere Ergänzung die Dameneinzel. In diesem Bei trag sollen mitHilfe elementarer '·lethoden der Wä.!.i.-scheinlichkeitsl-eclmung die erwartete und tatsächliche Satzanzahl einzelner Wirnbledonspiele unter der Annahme gleicller Spielstärke der Teilnehmer mi teinander verglichen werden. Es wird auch der sogenannte "Rücken-an-derWand"-Effekt untersucht, der den zurückliegenden Spieler begünstigt. Einführung Die Auswertung von Daten aus Bereichen, die den Schülern vertraut sind, ist, wie für den Unterricllt im allgemeinen, so auch für den Statistikunterricht förderlich. Sportergebnisse eignen sich besonders gut für Untersuchungen der den Daten zugrundeliegenden Muster. Reichhaltiges Material liefern z.B. Fußball- oder Handballergebnisse und Tabellen. Hier werden die Ergebnisse der Dameneinzel und Herreneinzel während der ersten 100 Jahre der Wimbledonturniere analysiert. In den ersten 100 Jahren der Tennisturniere in Wimbledon fanden 89 Endspiele im Herreneinzel und 83 Endspiele im Dameneinzel statt. Die Herreneinzel gehen über 3 Gewinnsätze in maximal 5 Sätzen, die Dameneinzel über 2 Gewinnsätze in ~,imal 3 Sätzen. Genauer: Bei dem Herreneinzel ist der Wettkampf zu Ende, wenn der erste Spieler 3 Sätze gewonnen hat. Wir wollen im folgenden die beiden Annahmen prüfen: 1. die Finalisten sind gleich stark und 2. bei dem im Rückstand liegenden Spieler erwachte ein besonderer Kampfgeist. ~fi t Hilfe elementarer Voraussetzungen aus der Wahrscheinlichkeitsrechnung wurden diese Fragen vor kurzem in den USA anhand von Baseballergebnissen untersucht (Simon, 1971); dort konnte auch ein sogenannter "Rücken-an-der-Wand"-Effekt beobachtet werden. Herrenfinale 44 der Finale im Herreneinzel wurden direkt in den ersten :; Sätzen gewonnen, 21 in 4 Sätzen und 24 in 5 Sätzen. Wir berechnen zuerst die Wahrscheinlichkeit von Wettkämpfen mit 3, 4 oder 5 Sätzen für gleich starke Spieler (die einzelnen Sätze sollen dabei als unabhängig gelten und die IVahrscheinlichkeit jedes Spielers, einen Satz zu gewinnen, beträgt nach der Annahme 0,5). *Originaltitel in 'TEACHING STATISTICS' (1981) Heft 3, Band :; 'An Analysis of the First 100 Years of Wimbledon Tennis Finals' Die beiden Spieler seien mit A und B bezeichnet. Ein Spiel ist in genau 3 Sätzen beendet, wenn die Ereignisse AAA oder BBB eintreten. Mit den obigen Annahmen ist die Wahrsclleinlichkeit jedes dieser beiden Ereignisse: 0,5 . 0,5 . 0,5 = 0,125 und daher die Wahrscheinlichkeit, daß ein Match in genau 3 Sätzen entschieden ist, 0,25. Ein Wettkampf (Matcll) besteht aus genau 4 Sätzen, wenn eines der folgenden Ereignisse eintritt: AABA, ABAA, BAAA, BBAB, BABB, ABBB. Die Wahrscheinlichkeit jedes dieser Ereignisse beträgt (0,5)4 = 0,0625, so daß die Wahrscheinlicllkeit für ein Spiel mit 4 Sätzen 0,375 beträgt. Analog kann die Wahrscheinlichkeit, daß ein Tennisspiel über die maximale Anzahl von 5 Sätzen läuft, zu 0,375 berechnet werden. Es gibt nämlich 12 Ausgänge mit jeder Wahrscheinlichkeit 0,03125. Diese sind: AASBB, ABABB, ABBAB, BAABB, BABAB, BBAAB B gewinnt BBAAA, BABAA, BAABA, ABBAA, ABABA, AASBA A gewinnt Die "erwartete" Anzahl von Spielen, die in einer vogegebenen Zahl von Sätzen beendet sind, läßt sich durch Multiplikation der oben bestimmten Wahrscheinlichkeiten mit der Gesamtzahl von Spielen berechnen. In der folgenden Tabelle 1 sind diese berechneten Werte (erw.) den tatsächlich beobacllteten (beob.) gegenübergestellt; dabei werden die Spiele vor dem 2. Weltkrieg und diejenigen danach getrennt verglichen. Tabelle Männerfinale 1877-1976 Anzahl der Sätze 3 4 5 Summen Wahrscheinlicllkeit p 0,250 0,375 0,375 1877-1939 beob. erw. 1946-1976 beob. erw. Gesamtzahl beob. erw. 28 12 18 14,500 21,750 21,750 16 44 21 24 22,250 33,375 33,375 58 58,000 31 31,000 89 89,0CXl 9 6 7,750 11,625 11,625 - 35 - - 34 - Aus dieser Tabelle scheint zu folgern, daß die Spieler meist nicht gleiche Spielstärke besitzen, da mehr Spiele als erwartet in 3 Sätzen endeten. Der Prozentsatz solcher Siege betrug vor dem Krieg 48,3 % und nach dem Krieg 51,6 %. In 76,4 % der Finalkämpfe gewann der Gewinner des 1. Satzes das gesamte Match in 3, 4 oder 5 Sätzen. Unter der Hypothese gleicher Spielstärke gilt dafür theoretisch: 5 P CA gewinnt Spiel I A gewinnt 1. Satz) I j=3 P CA gewinnt in j Sätzen i A gewinnt 1. Satz) 0,250 + 0,250 0,6875 + 0,1875 Diese Unterschiede legen die Vermutung eines "Rücken-an-der-Wand"-Effektes dar, mit Hilfe dessen diejenigen Spieler, die den 1. Satz verloren, sich erholten und nach 5 Sätzen gegenüber ihren Gegnern im Vorteil waren. Eine weitere Aufgliederung zeigt, daß dies vor dem Krieg in 13 von 18 Fällen (72,2 %) und nach dem Krieg in 3 von 6 (50 %) Fällen geschah. Dieser eben beschriebene Effekt war also nur vor dem Kriege zu finden. Es ist noch hinzuzufügen, daß Spieler, die mit 2:1 führten, den 4. Satz in 23 Fällen (51,1 %) gewannen, was mit dem theoretischen Ergebnis P CA gewinnt 4. Satz IA führt 2:1) = 0,5 gut übereinstimmt. Diese errechnete theoretische Wahrscheinlichkeit ist verträglich mit den Vorkriegsdaten, aber es scheint, daß nach dem Krieg die Gewinner des 1. Satzes eher einen Hinweis auf den späteren Gewinner des Wettkampfes geben könnten. Sieht man von den insgesamt 44 Dreisatzsiegen ab, dann liefern die übrigen 45 Spiele einige interessante Beobachtungen. In diesen Spielen waren die nach dem 3. Satz mit 2:1 führenden Spieler in 34 von 45 Fällen (76 %) auch die Gesamtsieger. Diese Beobachtungen stimmen auch mit der theor·tischen Wahrscheinlichkeit: Damenfinale Da bei den Dameneinzel zu einem gewonnenen ~Iatch 2 Gewinnsätze in maximal 3 Sätzen gehören, lassen sich hier schlecht schlüssige Ergebnisse bezüglich des "Rücken-an-der-Wand"-Effektes ableiten. Die entsprechende Tabelle 2 für die Dameneinzel: Tabelle 2 Damenfinale 1884-1976 P (A gewinnt Spiel I A führt 2: 1) = 0,75 .A.nzahl der Sätze Wahrscheinlichkeit p 1884-1939 beoh. en,. 1946-1976 beob. env. Gesamtzahl beob. erw. 38 14 26 26 24 15,5 15,5 62 21 41,5 41,5 52 52 31 31,0 83 83,0 für gleich starke Spieler überein. 2 3 Die Gewinner der 21 Viersatzspiele haben in'14 Fällen (6,7 %) den 1. Satz gewonnen, was ebenfalls mit der theoretischen Wahrscheinlichkeit 0,50 0,50 Summen j P (A gewinnt 1. Satz I A gewinnt in 4 Sätzen) = 0,667 übereinstimmt. Unerwartete Ereignisse ergaben sich jedoch bei den 24 Fünfsatzspielen, in denen der Matchgewinner den 1. Satz lediglich in 8 Fällen gewinnen konnte. Das theoretische Ergebnis für dieses Ereignis ist P (A gewinnt 1. 5atz I A gewinnt das Spiel in 5 Sätzen)= ~:g:g~g~ 0,5. Für gleich starke Spielerinnen ist die Wahrscheinlichkeit, daß das Spiel über 2 oder 3 Sätze geht, gleich groß. Da jedoch 62 der 83 Spiele (74,4 %) in den ersten beiden Sät:en gewonnen wurde, scheint die .A.nnahme gleicher Spielstärke bei den Damen nicht zutreffend :u sein. Gestüt:t wird diese Aussage durch die Tatsache, daß in ~6 Spielen (91,6 ',) die Ge\ünnerin des 1. Satzes auch den ~. Sat: ge\,ann, \\"0 hingegen die :ugehörige \\ahrscheinlichkei t nur r 1.-\ gewinnt beträgt. ~Iatch .-\ ge\dnnt 1. Satz) = 0,-5 - 36 Schlußbemerkungen Die Interpretation des Auftretens ungewöhnlicher Ereignisse ist im allgemeinen mit großen Schwierigkeiten verbunden, und man sollte in solchen Fällen vorsichtig mit seinen Schlußfolgerungen sein. Trotzdem ist eine Analyse dieser Ereignisse aus der Tennisgeschichte interessant, wenn auch ir, :ukunft ähnliche Serien nicht unbedingt zu erwarten sind. Analoge Untersuchungen können zu den Ergebnissen der Doppel durchgeführt werden. Die notwendigen Daten können bei Tingay (1977) gefunden werden. Literatur Simon, W. (1971), Back-to-the-wall effect, Science, 174, 774-5. Tingay, L. (1977), 100 years of Wimbledon, Guinness Superlatives Ltd., Middlesex, England. - 3~ Eine Abwandlung der Münzwurf-Experimente ~ P. J. Butt übersetzt von Karl Röttel Man werfe N-mal eine Münze und notiere die Abfolge von "Zahl" und "Wappen". Dann zeichne man eine graphische Darstellung, indem man bei "Zahl" eine Einheit nach oben und bei "Wappen" eine Einheit nach unten bei der Nummer des jeweiligen Wurfes abträgt. So erhält man für N = 10 bei der Folge WZZZWWWZWW das folgende Schaubild: o1-:--7""--:~-------~"'---""'~----- Nummer des Wurf es -1 -1. Folgende Untersuchungen könnte man mit dem Wissensstand von Schülern durchführen: (1) Die Position am Ende des Spieles. In unserem Graphen ist sie bei -2. Welches ist der Modalund welches ist der Mittelwert der Endpositionen? Welche Wahrscheinlichkeitsverteilung ergibt sich? (2) Die. Häufigkeit dafür, daß der Graph oberhalb der NummernAchse ist. Bei unserem Graphen ist sie 3. Welches ist der Modal- und welches ist der Mittelwert der Häufigkeiten? Welche Wahrscheinlichkeitsverteilung gehört zu dieser Zufallsgröße? (3) Die Häufigkeit, wie oft die Nummern-Achse geschnitten wird. Unser Graph schneidet diese Achse zweimal. Welches ist der Modal- und welches ist der Mittelwert dieser Häufigkeiten? Kann man Aussagen über die WahrSCheinliChkeitsverteilung machen? 't) Original artikel in "Teaching Statistics" (1981) Heft 3, Bd.3: A Variation on Coin Tossing Experiments. - 38 - Bemerkungen: Zenn Münzwürfe dürften eine vernünftige Anzahl darstellen, denn dies erlaubt den Schülern, in einer einzigen Unterrichtsstunde einige Folgen zu gewinnen und graphisch darzllstellen. Bevor man die Ergebnisse der ganzen Klasse zusammenstellt, sollte man die Schüler vorhersagen lassen. Die Vorhersagen für (1) sind gewöhnlich richtig und werden bestätigt, während die Ergebnisse zu (2) und (3) Verwirrung stiften können. Mit guten und älteren Schülern dürften sich interessante Diskussionen zum sogenannten "Gesetz der Mittelwerte" ergeben, wenn man den Modalund Mittelwert bei (2) miteinander vergleicht und für (3) den Hodalwert und dessen Häufigkeit betrachtet. Der zentrale Grenzwertsatz kann eindrucksvoll veranschaulicht werden, wenn man (2) verwendet, denn die u-förmige Verteilung wechselt in eine glockenförmige Verteilung, beinahe eine Umkehrung der Gestalt. Ergebnisse: Für N = 10 sind 2 10 verschiedene Folgen möglich. = 10 (1) Eine Binomialverteilung mit n und p = 1/2 tritt nur bei geradzahligen Positionen auf. (2) Häufigkeit oberhalb der Achse o 1 2 4 3 5 6 7 8 9 10 60 70 70 126 Anzahl dafür 252 126 70 Für den Fall N 5 entsteht eine geringfügige Abweichung 70 60 60 60 der Gestalt. (3) Häufigkeit des Schneidens Anzahl dafür o 1 2 3 4 504 336 144 36 4 - 39 - AUF GAB E HEINZ ALTHOFF, Bielefeld:Beispiel einer Abituraufgabe im Leistungskurs Fritzchen behauptet: Von allen über den Jahnplatz in Bielefeld fahrenden PKWs beträgt der Anteil p der Volkswagen genau 25 %. Wir wollen diese Hypothese H o mit einer Stichprobe vom Umfang n testen; wir bezeichnen die Anzahl der darin befindlichen VWs mit X. a) Bei n=100 wollen wir nach einer der nachfolgenden Entscheidungsregeln vorgehen: (1) Ho wird nicht verworfen . . 2~X~30 (2) Ho wird nicht verworfen .. 17~X~33 Zeichnen Sie für beide Entscheidungsregeln den Graphen der Gütefunktion ins gleiche Koordinatensystem. b) Geben Sie für beide Entscheidungsregeln P(Fehler 1. Art) sowie P(Fehler 2. Art) für p=0,2 bzw. p=0,3 an. Wie wirkt sich die Wahl der Entscheidungsregel auf die Wahrscheinlichkeiten für Fehler 1. Art bzw. 2. Art bei diesem Beispiel aus? c) Bestimmen Sie bei n=200 und bei n=1000 jeweils die günstigste Entscheidungsregel auf dem Signifikanzniveau 5 %. d) Wie hat sich gegenüber Entscheidungsregel (2) bei n=100 (vgl. Aufgabe b) P(Fehler 2. Art) Tur p=0,2 bzw. p=0,3 geändert? Verallgemeinern Sie das Ergebnis. Voraussetzungen: Mit Stochastik wurde zu Beginn der Jahrgangsstufe 13 begonnen. Das Testen von Hypothesen wurde für binomialverteilte Zufallsgrößen am Ende des 1. Halbjahres behandelt, die Laplaceschen Näherungsformeln folgten im 2. Halbjahr. Für die Bearbeitung von dieser und zwei weiteren etwa gleichwertigen Aufgaben (eine aus der Analysis, die andere aus der Wahrscheinlichkeitsrechnung) hatten die Schüler 5 Zeitstunden zur Verfügung. Sie konnten die "Tabellen zur Stochastik" von Barth/Bergold/Haller sowie einen Taschenrechner benutzen. Lösungsvorschlag: a) Hinweis: Die Funktionswerte a-1 b P(X<auX>b) = L b(100;p;i)+(1 - L b(100;p;i)) = B(100;p;a-1) + (1-B(100;p;b)) i=O i=O können für verschiedene Werte von p mit Hilfe der Tabelle 6 (Binomialverteilung) kumulativ) ermittelt werden. II II - 40- Ii - 41 - Zahl b €~ gesucht, für die noch P(X>b)~0,025 ist (bzw. die größte Zahl a €~ mit P(X<a)~0,025). Mit Hilfe der integralen Laplaceschen Näherungsformel ergibt sich: n=200: P(X>b)~0,025 _ P(X~b).::0,975 .. 0(b-200.0,25+0,5 ) > 0,975 V200.0,25·O,75 - ;: .1;: ._._ . . b-49,5 > 1;96 (nach Tabelle 8 für die Standardnormal~ verteilung) ·:1· '_''1'''' ·1 .::. I . ' i !---,.: - b.:: 61,5 Entsprechend erhält man P(X<a)~0,025 _ ..... a~38,5 (Diese Ergebnisse kann man auch mit Tabelle 6 ermitteln, wenn man nicht die Näherungsformel benutzen will.) Die günstigste Entscheidungsregel lautet für n=200: Ho nicht verwerfen .. 3~X~62 o 0,1 0$ o,S" 1 P b) Entscheidungsregel (1): P(Fehler 1. Art) = Pp=0,25(X<20UX>30) = B(100;0,25;19)+(l-B(100;0,25;30)) "" 0,203 Pp=0,2(Fehler 2. Art) = Pp=0,2(2~X~30) "" 0,534 Pp=0,3(Fehler 2. Art) = Pp=0,3(2~X~30) "" 0,540 Entscheidungsregel (2) entsprechend: P(Fehler 1. Art) "" 0,049 Pp=0,2(Fehler 2. Art) "" 0,B07 Pp=0,3(Fehler 2. Art) "" 0,77B Bei Entscheidungsregel (2) ist ein Fehler 1. Art unwahrscheinlicher als bei Entscheidungsregel (1), dafür aber ein Fehler 2. Art in einer größeren Umgebung von p=0,25 wesentlich wahrscheinlicher. c) Geht man davon aus, daß der Graph der Gütefunktion praktisch achsensymmetrisch zur Geraden mit p=O,25 ist (jedenfalls für große Werte von n), so ist die n=1000: P(X>b) < 0,025 .. ~(b-1000'0,25+o,5) .:: 0,975 --v'lOOO.O,25·0,75 - b .:: 276,3 P(X<a) ~ 0,025 . . . , . . . a ~ 223,7 Die günstigste Entscheidungsregel lautet für n=1000: Ho nicht verwerfen .. 223<X<277 -d) n=200: P -0 2(Fehler 2. Art) = B(200;0,2;62)-B(200;0,2;37) "" 0,665 - p-, Pp=0,3(F~hler 2. Art) = B(200;0,3;62)-B(200;0,3;37) "" 0,653 n=1000: P -0 2(Fehler 2. Art) "" p- , ~(277-1000.0,2+o,5) ~ v'1000.0,2.Q,8 _ ~(223-200-0,5) ~ vmr "" ~(6,13) - ,J(1,78) "" 0,038 P -0 3(Fehler 2. Art) "" ~(277-300+0,5) _ ,J(?23-300-0,5) p- , v'2ID vmr "" ~(-1,55) - ,J(-5,35) = (1- ,J(1,55)) - (1- ,J(5,35)) "" 0,061 Für p=0,2 und p=0.3 (allgemeiner: in der Nähe von p=0,25) verringert sich bei Beibehaltung des 5 % - Signifikanzniveaus die Wahrscheinlichkeit für einen Fehler 2. Art mit wachsendem n. Das bedeutet: Je mehr PKWs man auf dem Jahnplatz überprüft, umso wahrscheinlicher ist es, daß man Fritzchens Behauptung zu Recht verwirft, wenn er sich geirrt hat. Weicht p um mehr als etwa 5 %von 25 % ab, so irrt man sich bei einer Stichprobe vom Umfang 1000 nur noch relativ selten. - 43 - - 42 - VERTEILUNG DER GESCHLECHTER von I~ , FAMILIEN HEINZ KLAUS STRICK t«. r-- --- Um 1880 gab es in Sachsen 10690 Familien mit 12Kindern. Von den insgesamt 128.280 Kindern waren 66299 Jungen (51,68~) und 61981 ~1ädchen (48,32%). Die folgende Tabelle enthält die theoretische 2000 .-- -- und die empirische Geschlechterverteilung dieser Familien. f-- Anzahl der Jungen Anzahl der Mädchen Wahrscheinlichkei t 0 12 0,00016 1 11 0,0021 Verteilung empirische Verteilung 1,7 6 22,2 29 theoretische -- r-- 2 10 0,0122 130,7 160 3 9 0,0436 466,1 521 4 8 0,1049 1121,7 1198 5 7 0,1796 1919,6 1821 6 6 0,2241 2395,2 2360 7 5 0,2054 2195,e 2033 8 4 0,1373 1467,S 1398 9 3 0,0653 697,7 799 10 2 0,0209 223,9 298 11 1 0,0041 43,5 60 ° 0,00036 3,9 7 12 scheinlichkeit für eine q=O,4~32 (Wahr- ~ädchengeburt), X: Anzahl der Jungen in einer Familie mit 12 Kincarn, P(X=k) = (~2) pk q 12-k Uahrscheinlichkei t fLir k Jungen in einer Familie mit 12 Kindern und /"k 10690·P(X.k) -f-r-f--- -- I-- 0 ..--F 4 Z. 3 It s , "1 a , ~ AO 44 ~ ,,2. Wie man aus der letzten Spalte und der Abbildung entnimmt, ist die Hierbei wurde mit dem Binomial-Ansatz gerechnet: p=0,5168 (Wahrscheinlichkeit einer JungenQeburt), - AOOO Abweichung der theoretischen Verteilung von der der Erhebung z.T. 2 beträchtlich: Eine Untersuchung mit Hilfe des X -Anpassungstest zeigt, da~ die Abweichung signifikant auf sehr hohem Niveau ist (~;mp .. 99 ; p(X2~32,91) = 0,999). Der Genetiker STERN bietet für die Verformung der empirischen Ver- Erwartungswert der Anzahl der Familien mit teilung (außen zu hoch, innen zu flach) eine Erklärung an: Man könne k Jungen und 12-k fliicche"'. sich die Verteilung entstanden denken als'Summe'von 2 (oder mehr) - 4S - - 44 2 7- P1 P2 0,53 0,5036 68,4 Binomialverteilungen. In der Bevölkerung gebe es 2 (oder meh~ 0,54 0,4936 68,2 gleich große Gruppen von Familien mit 12 Kindern. 0,55 C,4836 44,6 Gruppe sei z.B. die Wahrscheinlichkeit für eine Jungengeburt 0,56 0,4736 25,7 P1 = 0,6168, in der anderen P2 = 0,4168 ; dann liegt im Mittel In der einen 0,57 0,4636 20,3 eine Wahrscheinlichkeit von p = ~,5168 fUr eine Jungengeburt 0,58 0,4536 36,6 vor. 0,575 0,4586 25,2 0,565 0,4686 2C,8 0,4656 19,9 In der Tat stellt man an Beispielen fest, daG die so konstruierte 0,568 Überlagerung zweier Binomialverteilungen c.egenüber der Verteilung 1 der zugehörigen 'mittleren' Erfolgswahrscheinlichkeit p = ~(P1+P2) Der le-Wert der besten Anpassung liegt knapp unterhalb des eine §hnlich geartete VerforIT,ung aufweist wie die des obigen kritischen Werts zum 95%-Niveau ( Beispiels. Man betrachte etwa das P1 = 0,4 ; p~ = 0,6 8e~spiel ; p = ~ p("X.2~ Eine Untersuchung der Anpassung zu einer mit ( 0,4 + [,O ) 0,':; une n 21,03)=0,95 ) ! 'mittleren' Verteilung von 3 Binomialverteilungen zeigt, da8 der kleinste zugehörige 12: 'X?-wert ebenfalls noch zwischen 19 und 20 liegt. -12 ( ~(X1=k)+P(X2=k) ) k P(X =!: ) 1 P(X,=k) ° 0,0022 O,LOCC 0,G011 [,L.G[2 1 0,0174 0,0003 G,[UGS 0,0[;29 2 0,0639 C, oe 25 C,0332 0,0161 Aufgrund der gegebenen Daten ist keine 8ewertung des 5TERN- P(X=k) schen Modells möglich. Es wäre nützlich, wenn weitere empi- 1---------- 3 0,1419 G,0125 0,0772 G,[537 4 0,2126 0,0420 0,1274 0,1208 5 0,2270 0,10G9 0,1 ii4[' 0,.1934 6 0,1766 0,1766 0,1766 0,2256 7 0,1009 0,2270 C,154C 0,1934 8 0,0420 O,212f, 0,1274 9 0,0125 0,1419 C,[.772 10 C,0025 O,l63 c LJ, [I] 3 2 11 0,UO('3 0,0174 C,LLE9 I 0,0029 I 12 ,, C,GGUJ 0,0[22 0, L'[ 11 0,0['[2 rische Daten über die Geschlechterverteilung vorlägen. Literatur: STERN: Grundlagen der Humangenetik, Gustav-Fischer-Verlag, Stuttgart, 1968 STRICK: C,12U8 Einführung in die Beurteilende Statistik, SChroedel-Verlag, Hannover, 19BO (,0537 ! (;,0161 ? WELCHER LESER KANN WEITERHELFEN I! , Ergänzune zu: Verteilung der Geschlechter in Familien ') Mit Hilfe eines Computers wurden nun solche Paare (P1 daß die Anpassung der theoretischen Verteilun9 2~ ' P2) gesucht, die empirische Geschlechterverteilung des Eincanosbeispiels besser wird. Die Anpassung wurde mit Hilfe der GröGs nachfolgende~Erg~nzlJno). Werten von X X r 8p,essen (vgl. die l Einir:e ~aarE (p, , P2~ mit den zugeh6rigen sind in der folc8ilden Ta<:211e abgedruckt: Zur Benutzunr; des 'X.~_Anpassungstests Hat man einen n-stufigen Zufallsversuch vorliegen, bei dem auf Stufe r verscr,iedene Ausge.nge mö"lich sind, die mit den festen Wahr- . scheinlieh k elten P1' Stufen ••• jeder P 2' ••• , P r auftreten, }'1=n'P1-mal mit Ausgang rJr.1 dann kann man nach n , P2=n·P2-mal mit Ausgang Nr.2 , /'r= n ·Pr- ma 1 mit Auso_ang Nr.r rechnen. - 46 - "l:-,aic _r"'gen von di8sen Erwartun~swerten (u. kann man mit :~ilfe -k \2 -'F2---2-"- J42 der Gröl3s + ••• _Enn bE! einem konkreten Zufalls versuch k -mal Ausgang Nr.1, 1 ~-mal ~usgang ~r.r auftritt • .. ier;t ~~':r einen Zufallsversuch eine Hypotr18se über die zL!~runc!cliG­ snden c 1 ' ~ncassung Pr vor, dann deuten kleine \.]ierte von 'X,~ aur eine gute ••• , und große Werte auf eine schlechte Anpassunc des ~odells :er Hycothese) hin. ~s mag ~berraschend erscheinen, da' es unter bestimmten Voraussetzungen 2 X gibt, ":'r nahezu beliebige P1' ••• 'Pr,n gemeinsame kritische Werte für cie nur von r abhängen, dh. daß man für diese ~erte von P1, ••• ,Pr und 2 trotzdem dieselbe Tabelle von X verwenden kann ! ~ Liegen in unserem Beispiel dem 10690-stufigen Zufallsversuch für die 13 m~clichen Ausgänge (0 Jungen, ••• ,12 Jungen) tatsächlich die Wahrscheinlichkeiten 0,00016; 0,OC21; ••• ; 0,CCC36 zugrunde (vgl. erste Tabelle), dann erhält man mit der Wahrscheinlichkeit [,95 eine Realisierung mit einem :X?-wert, der kleiner oder gleich 21,[3 ist. Lediglich mit der Wahrscheinlichkeit 0,05 erh5lt man einen grjßeren Wert für Je. (In 99,9% der Stichproben treten X?-Werte kleineric:leich 32,91 auf und nur in 0,1% der Stichproben treten zufällig crößere ~?-Werte auf.) (Im vorliegenden Beispiel wurd~ der Wert für p (=C,5168) aus der Stichprobe geschätzt - dadurch reduziert sich die Anzahl der Frei- heitsgrade auf f=11. Die zugehörigen kritischen Werte von zum 95~b-l'\liveau: -x3 19,68 ; zum 9g,gi~-r-~iveau: 31,26.) Literaturhinweis: sn110:: Der Chiquadrat-Anpassuncstest 101 r'athematil,- und im Biologieunterricht der Sekundarstufe 11, ~1NU 1981, Heft 3 (5. 13;-147) sind: - 47 - BIBLIOGRAPHISCHE RUNDSCHAU In diesem Heft bringen wir eine Auswahlbibliographie der bis Mai 1982 erschienenen Zeitschriftenaufsätze zum Thema Stochastik. Die Beiträge sinf. alphRbetisch nach den Autoren angeordnet. Kurze Inhaltsbeschrei<"lOgen sollen den! Leser ein ·Urteil ermöglichen, ob die von uns ausgewGhlten Titel für seine Zwecke relevant sind. ATHEn, H.: ';leitere Lotto-Probleme fUr den S II-Kursunterricht. In: nrBxis der Mathematik v. 24(3) s. ?2-83 (März 1982). - Unter dem Titel Ratewahrsch~inlichkeit und die Auszahlungsquoten wird im 1. Abschnitt thanretisch das Quotenproblem gelöst. Im 2. Ab"chrdtt werden praktische Anwendungen behandelt,z.B. die Frage nach den Zahlenkombinationen, nie eine~ Sryieler im Gewinnfalle die höchsten Quoten einbrin,en. Vnn. Erfahrungswerten ausgehend, daß das Ankreuzverhalten der Tip~er wahrscheinlich viel weniger konstant ist, alF allc~~ein a~genornmer wird, werden Versuche der empirischen Ermittlunf der AnkreuzhäufigKeiten unternommen. BAUf.1ANN, R.: Stocha~tik Mi ttels Computer. In: Lehrmittel aktuell v. 8( 2) q (1032). - Sir.lUla ti on des "Bornoulli schen Versuchsschemas" • s. ;:'.AUMA~IK, R.: Stochastik-Grundkurs mit Computer. In: Lehrmi ttel aktuell v. (1) S. 12 ff. (19il?). -Kursziel ist die Entwicklun! von Verfahren und eine Theorie für ratioT!ale Entscheidungen bei Unge'1ißhei t (mi t COMputerunterstützung) • DING~S, 8 H.: Deskrintive Statistik für die Mittelstufe (Vorschlag eines In: Der Mathematiku~60~"ich· v. 28(1) S. 5-27 (1982). Ent.wurf eines Gesamt~lans für die deskriptive StRtistik in der Mittelstufe. Inhelt: Anordnung einer Zahlenpopulation, Mitt~lwerte, Verteilunzr~unktion sowie graphische Bestimmung von Mittelwerten, der "richtige" L""',":,ar"metpr, Konzf'ntration von Datenmengen, Darstellungsf"r",en, ",t;ickFf'i~e lineare Funlrtionen und Quantile. Streuungsparameter, 7,pr r~et~~~Rtik der rni -ttleren rJl!~dratischen A'b .."eichung. Die Ausfüh~lln~p~ l"pn~e~ ~irh an lQhre~; sie sind aus B~mUhungen um Lehrerfortbi~dunr he~~~~ ~nt~t~ndp~. Die vorgestellten Projekte sind nicht alF ~et~odipch~ H~1f~~ kn~=iniert, ~ondern ~ie sollten vielmehr Unter;ir:!:t5-f"p.lr~p.!, :=!b<:'"tp(':-:~-::.~ "e~chr- stochastische Ar~'Jrne~tation erfordern, ~!~O nirtt ~urch eine rn3ttp-qti~c~e Formel erledi~t wprden kBnnen. Gosa~tplans). - 48 _ EN~EL, A.: Statistik auf der Schule: Ideen und Beispiele aus neuerer Ze~t. In: Der Mathematikunterricht v. 28(1) S. 57-85 (1982). - Dieser Beitrag enthält Beispiele zur Sammlung, Beschreibung und Deutung von Daten. Es sind durchweg neuere Beispiele mit echten Daten. Ihre Behandlung erfordert nur geringe Kenntnisse, wenn ein Rechner zur Verfügung steht. Sie zeigen, daß die Statistik wichtige Probleme behandelt und damit auch interessante Fragen. Inhalt: Beispiele zur Datenanalyse, Planung von Experi menten. GNANADESIKAN, J.R.; KETTERING, P.A.; SIEGEL, A.F.: Themen aus der Datenana~yse: Begriffe, Methoden, Beispiele und Pädagogik. In: Der Mathemat~kunterricht v. 28(1) s. 28-56 (1982). - D~e ~eschreibende Statistik hat sich durch eine Grunpe von Stat~st~kern der Bell-Laboratorien, USA, in den letzten Jahren gewaltig an Umfang und Tiefe ausgedehnt. Für diese Fortentwicklung der be~chreibenden Statistik wurde der Name Explorle.tory Data Analys~s (EDA) geprägt. EDA ist graphische und numerische Detektivarbeit: das Aufspüren von Fingerzeigen in Daten, um wichtige Zusammenhänge und Strukturen zu erkennen. Die wichtigsten Begriffe von EDA werden in diesem Beitrag durch 3 Themen illustriert: graphische Methoden zur anschaulichen Darstellung von Daten, robuste.M~thoden. zur Zusammenfassung von Daten unter Absicherung gegen e~n~ge wen~ge ausgefallene Beobachtungen und Klumpungsmethoden zur Zerlegung einer Menge von Daten in natürliche Gruppen. Eine kommentierte Liste von Literaturhinweisen soll helfen weitere Einzelheiten zu verfolgen. ' KICK, Th. H.: Das Problem der unechten Münzen. In: MNU v. 35(1) 23-26 (Jan. 1982). - Es werden einige Verfahren vorgestellt und deren Optimierung besprochen, die teilweise überdies eine praktische Anwendung gefunden haben. s. LEHMANN, E.: Markow-Ketten in der Sekundarstufe I. In: MNU v. 34(8) S. 460 ff. (Dez. 1981). - Es wird über Inhalte einer Unterrichtseinheit von etwa 10 Stunden berichtet, die in Klasse 10 erprobt wurde. Der Beitrag ist bewußt weitgehend ohne Verwendung wahrscheinlichkeitstheoretischer Begriffe formuliert, um verschiedene Einsatzmöglichkeiten im Bereich der Sekundarstufe I auch ohne Kenntnisse aus der Wahrscheinlichkeitsrechnung aUfzuzeigen. Man kann jedoch jederzeit zur Sprache der Wahrscheinlichkeitsrechnung übergehen. - 49 MOLDENHAUER, J.; SILL, H.-D.: Zur methodischen Gestaltung des Unterrichts in der AG(R) "Elementare Statistik" (Teil 4). In: Mathematik in der Schule v. 20(1) S. 301-304 (1982). - Im Teil 4 werden zur Behandlung der Streuungsmaße und zum Thema Untersuchung zweier Merkmale auf Korrelation inhaltliche und ~ethodische Hinweise für die Gestaltung des Unterrichts gegeben. PEHL, K.: Signifikanztest bei zusammengesetzten Alternativen. In: Lernzielorientierter Unterricht Heft 1/1982 S. 23-38. - Fachdidaktischer Beitr~g zur Fortbildung für Lehrer, der sich auch Problemen des Kurs- bzw. Schulalltags widmen will. Dabei wird auf Erfahrun~en aus einem Volkshochschulkurs schließende Statistik sowie einem ~rientierenden allgemeinen Einführungskurs Statistik an der Frankfurter Volkshochschule zurückgegriffen. RIEHL, G.: Elementare Behandlung genetischer Probleme im StochastikUnterricht mit Hilfe von Graphen. In: Didaktik der Mathematik v. 10(1) s. 25 ff. (1982). - Es wird das Gesetz von Hardy-Weinberg auf einfache Weise hergelei tet. STRICK, H.K.: Parameterfreie Verfahren im Stochastik-Unterricht. In: HNU v. 35 (3) S. 138 ff. (1982). - Viele statistische Fragestellungen lassen sich wegm der Gültigkeit des zentralen Grenzw~rtsatzes mit Hilfe der Normalverteilung behandeln. Hat man es jedoch mit Stichproben zu tun, über deren zugehörige Verteilung keine Informationen vorliegen und bei denen wegen des geringen Stichprobenumfangs keine Approximation durch eine NQrmalverteilung möglich ist, so bieten sich für das Problem des Vergleichs zweier Stichproben die sogenannten nichtparametrischen oder parameterfreien Verfahren an, die in diesem Beitrag näher beschrieben werden. Lehrbücher der Wahrscheinlichkeitsrechnung und Statistik für die S 11. Im Analysenteil des ZDM 2/82 wurden sämtliche Stochastikschulbücher der Sekundarstufe 11 rezensiert. Entgegen der üblichen Praxis im ZDM gibt es diesmal keine Einzelrezension der Unterrichtswerke,sondern es ging um die vergleichende Rezension von Schulbüchern unter bestimmten Aspekten. Diese Aspekte sind: 1. l'ahrsch"inlichkei t und Entwicklungsperspektive. 2. Anwendungsorientiertheit der Stochastik - die Rolle der MOLDENHAUER, J.; SILL, H.-D.: Zur methodischen Gestaltung des Unterrichts in der AG(R) "Elementare Statistik" (Teil 3). In: Mathematik in der Schule v. 20(1) s. 62-70 (1982). Teil 1 ist erschienen in Math. Schule, Berlin 19 (1981) 10, s. 745763, Teil 2 in Math. Schule, Berlin 19 (1981) 12, S. 930-941. Im Teil 3 werden zur Anfertigung und Beurteilung graphischer Darstellung und zur Behandlung der Mittelwerte inhaltliche und methodische Hinweise für die Gestaltung des Unterrichts geg~ben. Verwendunr~situationen. 3. 4. r::; ( Stochastik - Si~ulation - Tätigkeit. und Mptawissen. Di:f~re~~ie~l1!2E' i~ der gymnasialen Sekundarctufe II. St.ocha.s'i\, ·.md Beruf: Berufsvorberei tung - Berufsausbildunp; Studienvorbpreitung. WahrschRi~lichkeit - so kna~!=, Am S,,::luß der ~Ar~t--fassenden 40-sejti~er Au~wp.,...tunc d~r A;.~Jyc(\'1 '"lira cer Vp~sucl, ei n 0"" '711_ "orliecen~en ~~z~n~ionen g~~ebpr. Hier soll aus einer vergleichenden Pe]"'spp.k.:ti~rp h€'ran-; \"e"!'"r~~, kurz Hauptproblem~, ;:-rundlegennc. Defi7i"!:~ P0h.''; v~r.r."u("ht weitn~fUhrende und die DidB~tik der Tenrlen~en Stochasti~ fUr den Stnchaetikunte~rirht r.> rrcE'l ich .. aufzuz~iS0n. Biblir>graphische Angaben zu <).a. Ane.le's<'n: Lehrl-ikher iler 'w2hrschei~lichkeitsrechn~n~ und Stetistik fUr die S 11. In: Zertralblatt fUr D~daktik der Mathematik t r . 14(2) S. F3-1C5 (A~riJ 19P?). Zus.~",,,,png:estellt 'lon Gerherd Könü" Karlsruhp. - 51 - R E ZEN S ION HERBERT KUTTING: 'Didaktik der Wahrscheinlichkeitsrechnung', ISBN 3-451-18583-0, Verlag Herder Freiburg im Breisgau 1981 Im 1. Kapitel werden "Gründe für die Behandlung der Wahrscheinlichkeitsrechnung im Schulunterricht" vorgestellt. Eine Vielzahl von Beispielen, in denen - umgangssprachlich verwendet - Begriffe aus der Wahrscheinlichkeitsrechnung und Statistik aUftauchen, liefert einen Teil der Begründung. Ergänzt durch eine stattliche Anzahl nmathematischer Begründungen" für die Behandlung im Unterricht wird die Frage nach dem "Warum Wahrscheinlichkeitsrechnung" sicher ausreichend beantwortet, obwohl sie vielleicht für den interessierten Leser eigentlich keine mehr ist. Im 2. Kapitel werden "Verschiedene Konzeptionen zur Einführung des Wahrscheinlichkeitsbegriffs" vorgestellt. Es werden zwei grundsätzlich verschiedene Ansätze aufgezeigt: der nicht-axiomatische - in drei verscniederien Ausprägungen, nämlich Zugang über klassische Wahrscheinlichkeit, über relative Häufigkeit und über geometrische Wahrscheinlichkeit - und der axiomatische Ansatz. Das 3. Kapitel "Empirische Untersuchungen zur Entwicklung des Zufalls- und Wahrscheinlichkeitsbegriffs" bietet einen guten Uberblick über Untersuchungen zu o.a. Thema. Damit gekoppelt sind auch zahlreiche Hinweise zum Einsatz bzw. zum Beginn einer Behandlung des Themas in der Schule. Speziell für den an dieser Frage interessierten Leser bietet das Literaturverzeichnis im Anhang viel nFortsetzungslektüre" an. Im 4. Kapitel nSpezielle Fragen und Probleme - für den Schulunterricht formuliert und gelöst" wird es dann, wie in der Uberschrift angekündigt, konkret unterrichtspraktisch. In 25 Beispielen verschiedenen Schwierigkeitsgrades werden Probleme aus der Wahrscheinlichkeitsrechnung vorgestellt und gelöst. Die Probleme sind sehr geschickt ausgewählt, so daß nahezu alle besonderen Tücken und Schwierigkeiten der Wahrscheinlichkeitsrechnung sozusagen en passant angesprochen werden. - 53 - 52 - Das 5. Kapitel "Die Wahrscheinlichkeitsrechnung im Schulunterricht" ist wohl als das zentrale Kapitel des Buches anzusehen, was sich schon in seinem Umfang ausdrückt. Es ist fast so lang (wahrscheinlichkeitstheoretische Fragestellungen ergeben sich dann aus entsprechenden statistischen Problemen), weitgehend unberÜCksichtigt. Ausgehend von den Uberlegungen zum Stoffplan werden dann unter wie die vier vorangehenden Abschnitte. :vier Gesichtspunkten "Anregllngen für die unterrichtliche Arbeit" Nach einer kurzen Einführung und einem ebenfalls knappen histori- gegeben. Und zwar sind dies schen Abriß über die Wahrscheinlichkeitsrechnung in der Schule Bereiche "Zufallsexperimente - Ergebnismengen - Ereignisse - folgen ausführliche "Uberlegungen zu einem Stoffplan in der Wahrscheinlichkeiten", "Die Entfaltung kombinatorischen Primarstufe und Sekundarstufe I" etwa gleichgewichtig die drei Denkens" und "Rechnen mit Wahrscheinlichkeiten". Etwas knapper wird das Thema "Simulation und Monte-Carlo-Methode" Der Autor spricht sich eindeutig für eine Behandlung bzw. für ein Sammeln erster Erfahrungen zur Stochastik in der Grundschule aus, wie es auch bereits in vielen Lehrplänen vorgesehen ist. Allerdings geht es nicht um eine systematische Behandlung; hierzu ein Zitat: "Es handelt sich um situationsbezogene Aktivitäten (Spiele), die sich im wesentlichen auf die folgenden ProblemfeIder beziehen: behandelt. Diese Anschnitte sind mit Sicherheit für den nach praktischer Anregung suchenden Leser (Lehrer) die ergiebigsten des Buches. Zusätzlich zu den auch hier wieder zahlreichen praktischen Beispielen werden Schulbücher zitiert und viele unterrichtspraktisch wertvolle Informationen und Hinweise gegeben. Auch mögliche Unterrichtssequenzen werden aufgezeigt und teilweise ausgeführt. - qualitative Erörterung von Zufallsphänomenen, - Lösung kombinatorischer Probleme, besonders im Zusammenhang mit der Behandlung der MUltiplikation (kartesisches Produkt), 1. Das Buch besticht durch seine zahlreichen ausführlich dar- - die Berechnung der Anzahlen der möglichen und günstigen Ergebnisse einfacher Zufallsversuche und das Ve~gleichen Zusammenfassung gestellten Beispiele mit Lösungen und den ausgezeichneten von Anhang, der einen sehr guten Uberblick über die Literatur Eintrittschancen(Wahrscheinlichkeiten) zufälliger Ereignisse, zum Thema - angefangen bei Zeitschriftenartikeln bis hin ohne explizit die Bruchrechnung zu verwenden, zu Schulbüchern - bietet. - das Erstellen von Baumdiagrammen, Strichlisten und Tabellen. Die Sprache ergibt sich aus den Problemen, die Lösungen können 2. Die Trennung in eine "Didaktik der Wahrscheinlichkeitsrechnung" und eine "Didaktik der Statistik" erscheint vor dem Hinter- experimentell vorbereitet und gefunden und in der ikonischen grund der schulischen und mathematischen Realität wenig Repräsentationsebene dargestellt werden". motiviert, bisweilen führt sie gar zu künstlichen Einschränkungen und Trennungsversuchen. Der vorn Autor für die Sek. I angegebene Stoffkanon bewegt sich im Rahmen dessen, was in neueren Lehrplänen (z.B. NRW und Niedersachsen) vorgesehen ist und trägt eindeutig gymnasialen Zuschnitt. Speziell hieran wird deutlich, wie schwierig es ist, Wahrscheinlichkeitsrechnung und Statistik für die Schule aus- 3. Der mit der Wahrscheinlichkeitsrechnung und ihrer Anwendung im Schulunterricht bereits weitgehend vertraute Leser wird in diesem Buch nicht sehr viel Neues finden, während es andererseits als Einstieg in dieses Thema gut geeignet ist. einanderzudividieren. Bei der vorn Autor gewählten Thementrennung bleibt leider die aktuelle Diskussion, ob speziell in der Hauptschule eigentlich nur Statistik zu behandeln sei Jürgen Grimm VERLUST GEWINN START 4 • 5 10 15 20 s:: .....(1) 1-1 (1) Ul Ul ..c:u 25 :::l1 Ul 1-1 (1) :> 1-1 30 (1) '0 (1) 8' 35 ~ 40 45 50 o 10 20 30 40 50 Gewinnanteil 0% 20% 40% 60% 80% 100% 1-1 (1) '0 .j..I ..... (1) ~ t:J'I ..... Ij..j ::s :rtl := Bild 2 Aufzeichnungsblatt mit 90%-V~rtrauensintervall für p s::(1) ..... 1-1 (1) Ul Ul .a u::s Ul 1-4 (1) :> o 0 dP I\J -> 0 0 dP fi ;J::I s:: Hl N CD ",. I\J 0 0 dP 1-'() ::r CJ) ::s s:: ::s 8 ;J::I :::0 8 IQ rn 0' ...... PI rt 0"1 W 0 0 dP rt 1~ Gl CD ~ Z 1-'- CX> 0 dP ::s ::s PI ::s ",. 0 rt CD 1-'- I-' -> 0 0 dP Häufigkeit der Versuchsserien U1 0 I U1 0 I ",. ",. w W U1 0 U1 0 I I I\J U1 I\J -> -> 0 U1 0 Länge der Versuchs serien U1