DAS STIRLING`SCHE AUFZEICHNUNGSBLATT* FOR

Werbung
- 3 -
DAS STIRLING'SCHE AUFZEICHNUNGSBLATT*
FOR EXPERIMENTE ZUR WAHRSCHEINLICHKEIT
G.
~ILES
tlbersetzt von Bernd Wollring
Ein neuer Weg aum Aufaeichnen relativer Häufigkeiten bei einfachen Experimenten
Experimente zur Wahrscheinlichkeit innerhalb des Unterrichtes
werden von den meisten Mathematiklehrern nach Möglichkeit gemieden. Sie sind, so meint man, mit Organisations- und Kontrollproblemen verbunden, die alle Vorteile überwiegen. Das Lernziel ist
meist die Fähigkeit, Prüfungsfragen zur Wahrscheinlichkeit zu
beantworten, und praktisches Arbeiten wird aus Zeitmangel als unwesentlicher Luxus angesehen.
Aus meiner Erfahrung heraus bin ich der Ansicht, daß Schüler
und Studenten ohne einen angemessenen Hintergrund an praktischer
Erfahrung nicht in der Lage sind, ein Verständnis der Wahrscheinlichkeit zu entwickeln. Genau das führte mich dazu, die
dreißig Experimente mit Würfelbechern zu entwickeln, die für
DIME-Projekte von OLIVER und BOYD veröffentlicht wurden.
Ich wollte Arbeitsmaterial schaffen, mit dem Schüler in Partnerarbeit beide etwa 100 Zufallsexperimente durchführen und
jedes Ergebnis auf einem nur punktgroßen Platz notieren können.
Dabei dachte ich in erster Linie an Schüler zu Beginn der
secondary school (entspricht etwa den Klassen 6 und 7 ; Anm.
d. tl.l, daher tritt der Begriff "Wahrscheinlichkeit" nur im Titel auf. Diejenigen, bei denen die Wahrscheinlichkeit "noch
nicht dran" ist, können die Versuche als Ratespiele nehmen.
Die Tatsache, daß einige in der Klasse meinen, sie könnten "rein
zufällige" Ergebnisse vorhersagen, führt, so hoffe ich, zur Diskussion und zur Entwicklung des grundlegenden Begriffs der
Wahrscheinlichkeit. Es zeigte sich, daß das Material auch für
Studenten und Lehrer wertvoll ist; denn sie fanden bei ihrer
* Originaltitel in 'TEACHING STATISTICS'(1979) Heft 3, Band 1
'The Stirling Recording Sheet for Experiments in Probability'
- 5 - 4 Arbeit damit oft ein neues Verständnis der Wahrscheinlichkeit.
START
Ein wichtiger Teil dieser Entwicklungsarbeit war die Herstellung eines Aufzeichnungsblattes, das sowohl leicht zu handhaben als auch effektiv zum Gewinnen von Einsicht und Verstehen
ist. Das Ergebnis zeigen die Bilder, und der Zweck dieses
Artikels ist es, einige Vorteile zu beschreiben, die sein
Gebrauch mit sich bringt.
1. GeDl'auch des Aufzeiahnungsb lattes
Um die Folge aus "Gewinn" und "Verlust" aufzuzeichnen, wird
vom Startpunkt aus eine durchgehende Linie gezeichnet, am
besten mit einem Filzstift. Sie folgt stets einer der dünn
gedruckten Linien auf dem Blatt und verläuft stets von oben
nach unten. In jedem Kreuzungspunkt kann man eine von zwei möglichen Linien wählen, die Wahl hängt vom Versuchsergebnis ab:
"Gewinn" - nach rechts gehen, "Verlust" - nach links gehen.
Bild 1 zeigt eine Folge, die mit GGVVG beginnt. Das Originalformat des Blattes ist A5.
Haben die Schüler erst gelernt, das Blatt zu benutzen, so geschieht das Aufzeichnen der Ergebnisse einfach und schnell.
Normalerweise arbeiten sie zu zweit, der eine spielt (würfelt
oder annliches), der andere zeichnet auf. Selbst wenn das
Tempo beim Würfeln und Nennen des Ergebnisses gelegentlich 25
bis 30 Versuche pro Minute erreicht, kann der Aufzeichner mühelos mithalten.
2. Automatisahes MitzähZen
Die Anzahl der Versuche wird auf dem Aufzeichnungsblatt automatisch mitgezählt. Hat der Schüler den unteren Rand erreicht, so
hat er 50 Versuche aufgezeichnet. Darüber hinaus kann er sofort
die Zahl der "Gewinne" unter diesen 50 Versuchen ablesen, von
o
unten links bis 50 unten rechts. Die in Bild 1 aufgezeichneten
50 Versuche enthalten 28 "Gewinne". Mit einer zweiten Linie auf
o
10
dann insgesamt 100 Versuche.
0%
10%
20%
30%
40%
40
30
20
demselben Blatt (möglichst in einer anderen Farbe) erfaßt man
50%
60%
70%
80%
50
90%
100%
GEWINNE
Bild 1
-
7 -
- 6 des versuchs aufzuschreiben, wieviele Gewinne er erwartet. Das
J. GewinnanteiZ in Prozent
Zusätzlich kann der Schüler den Anteil der "Gewinne" in Prozent nicht erst nach 50 Versuchen angeben, sondern bereits an
jedem Punkt vorher. Er benutzt dazu die senkrechten Linien.
In Bild 1 liegt zum Beispiel der mit X bezeichnete Punkt auf
der 6ü%-Linie.
4. ReZative Häufigkeit
führt zu einer höheren emotionalen Beteiligung am Versuch, denn
er wünscht ja nun, daß das Ergebnis nahe bei seiner Vorhersage
liegt. Bei Arbeitstagungen mit Lehrern erläutere ich diesen
Punkt mit einem speziellen Versuch. Dazu dienen zwei Paar Kugeln
in einem Zylinder. Ein Versuch besteht darin, den Zylinder zu-
nächst zu schütteln und dann aufrecht auf den Tisch zu stellen.
Die Kugeln liegen dann auf dem Zylinderboden entweder in einem
Kreuzmuster (Bild 2a) oder paarweise nebeneinander (Bild 2b).
Des weiteren benötigt man zum Bestimmen relativer Häufigkeiten
keine Divisionen. Durch die Geometrie des Bildes kann man das
umständliche Ausrechnen umgehen. Denn dies ist dem Schüler bei
der Entwicklung seines Wahrscheinlichkeitsbegriffes, die wir
uns ja wünschen, meist ein Hindernis.
5. Siehtbare Trends
Ein weiteres wichtiges Ergebnis dieser Aufzeichnungsmethode
besteht darin, daß der Trend der Ergebnisse während der Ver-
Bild 2a
Bild 2b
Bild 2c
suchsdurchführung sichtbar wird. Ferner sieht man bei jeder
Man erliegt leicht der Versuchung, diese Ausgänge als gleich-
Serie von 50 Versuchen, wie beim Fortführen der Linie nach
wahrscheinlich anzunehmen, und in der Tat vermuten die meisten
unten ihre Schwankung nach links oder rechts offensichtlich
Schüler, Studenten und Mathematiklehrer vorher, daß sie in 50%
abnimmt.
der Fälle "gewinnen" werden, das heißt, die Figur aus Bild 2b
erreichen. Leider ist aber die theoretische Wahrscheinlichkeit
6. Gibt
es
Schnittpunkte?
Wenn eine zweite Linie zur Aufzeichnung der nächsten 50 Versuche gezeichnet wird, kann sowohl bei Erwachsenen als auch bei
Kindern eine überraschend hohe emotionale Beteiligung entstehen:
Wird die zweite Linie die erste schneiden? Diese Wirkung hatte
ich nicht vorhergesehen, aber ohne Zweifel hilft ein solches
persönliches Interesse beim Entwickeln eines intuitiven Gefühls
für die Grundideen der Wahrscheinlichkeit.
7. Gesahätzte Vorhersage
dafür 2/3, wie man mit Bild 2c feststellt. Wenn eine schwarze
Kugel in der Lage A liegenbleibt, dann geben zwei von den Lagen,
die die andere schwarze Kugel einnehmen kann, einen Gewinn.
Beim Durchführen des Versuchs erwarten und wünschen jedoch die
meisten Leute, daß die Linie nahe der 50%-Marke auf der Seitenmitte herauskommt. Zeigt sie aber die Neigung, nach rechts auszuwandern, so kann das zu deutlicher Verwirrung führen, besonders wenn dann die zweite Linie die Neigung der ersten bestätigt. Man hat mir vorgeworfen, gezinktes Material zu verwenden,
und auf einer Arbeitstagung in Australien hörte ich, wie ein
Lehrer sich bei seinem Partner beklagte, "er habe jedes Ver-
Ganz absichtlich nötigt das Aufzeichnungsblatt, auf dem der
trauen in die Gesetze der Wahrscheinlichkeit verloren". Natür-
Schüler seine Versuchsergebnisse notiert, ihn dazu, vor Beginn
lich gab es auch andere Lehrer, die diese Diskrepanz offen-
- 9 -
- 8 sichtlich ohne Verwirrung akzeptieren, was zu der wichtigen Frage führt : Wann sollte man beginnen, seine Vorhersage (Schätzung)
zu überdenken ?
folgendem Ergebnis führt:
50 • 49
1·
8. KonstI'Uktion des Auf3eiclmungsb Zattes
2
27
26
24
25
Betrachten wir nun Zusammenhänge zwischen der Konstruktion des
Nun kann jeder sorgfältige und unternehmungslustige Schüler mit
Aufzeichnungsblattes und anderen mathematischen Objekten auf
einem Taschenrechner und hinreichend Zeit und Interesse heraus-
verschiedenen Ebenen. Als erstes sollte man bemerken, daß jede
finden, daß die Antwort rund 126·000·000·000·000 ist. Auf diese
Zeile der Kreuzungspunkte die Breite des Blattes in gleiche
Art kann die Beziehung verschiedener mathematischer Aspekte zu
Stücke teilt. So liegt zum Beispiel der Punkt X in Bild 1 auf
einem gewöhnlichen Aufzeichnungsblatt, das Schüler beim Experi-
dem Punkt 3/5 der Horizontalen und daher auf der 60%-Vertikalen.
mentieren verwenden, und zu Fragen wie: "Wieviele Wege bis X?"
Dreht man das Bild um 90 Grad nach links,
diese Mathematik für Studenten jeden Alters mit Sicherheit zu-
_~fzeichnungszwecke
Form
y(x)
= k/x
(was wohl für einige
von Vorteil ist), so haben die Kurven die
und
y(x)
=h
gänglicher und bedeutungsreicher machen.
- k/x •
11. WatzrsaheinZichkeit bei p = 1/2
9. Pasaa Z ' saMs Dzoeieak
In dem speziellen Fall, da "Gewinn" und "Verlust" gleichwahrKehren wir zu dem Punkt X in Bild 1 zurück, so sehen wir, daß
scheinlich sind, folgt, daß alle Wege, sagen wir bis auf die
er eine Situation mit fünf Versuchen beschreibt, von denen
Höhe von X, gleichwahrscheinlich sind. Wir halten fest, daß
drei "Gewinne" sind. Wir können fragen, auf wieviele Arten die-
die Gesamtzahl aller Möglichkeiten (Wege) für die ersten fünf
----~
----~
--
.-
---_.~
se Position zu erreichen ist. Das läßt sich zum Beispiel durch
Versuche gleich der Summe der Zahlen in der fünften Zeile des
5
oder 32. Die Wahrscheinlich-
Betrachten verschiedener Versuchsergebnisse ermitteln: GVGVG,
Pascal'schen Dreiecks ist, also 2
VVGGG, VGGGV und so weiter. Oder wir betrachten die Zahl aller
keit für einen bestimmten Weg bis X ist also .10 zu 32, oder
verschiedenen Wege vom Startpunkt bis zum Punkt X. In jedem
0.3125. Betrachten wir nun alle Wege bis hinunter zur untersten
50
Zeile des Blattes, so erhalten. wir die Gesamtzahl von 2
,
Fall erhalten wir 10 als Antwort. Wenn wir die entsprechenden
Zahlen für die anderen Punkte auf derselben Höhe bestimmen, so
näherungsweise 1·126·000·000·000·000, und es folgt fast sofort,
erhalten wir die Binomialkoeffizienten 1; 5; 10; 10; 5; 1, die
daß man bei einem Versuch mit p
bei der Entwicklung von (x+y)5 auftreten.
gezeichneten Zick-Zack-Linien auf der untersten Linie im Bereich
10. BinamiaZkoeffi3ienten
Wahrscheinlichkeit, ins Zentrum zu treffen, ist etwa O,t.
=
0,5 etwa die Hälfte der auf-
von 23 bis 27 "Gewinne" (einschließiich) erwarten sollte. Die
Ganz natürliches Weiterdenken in dieser Richtung führt zu
Fragen wie der folgenden: "Wieviele Wege gibt es vom Start bis
zur Mitte der untersten Zeile?" Das Pascal'sche Dreieck Zeile
für Zeile b!s untE!n hin zu entwickeln, wäre äußerst mühsam,
-hi~r ist jedoch die Gelegenheit vorbereitet, für die Binomialkoeffizienten die Formel zu nennen oder zu entwickeln, die zu
12. Vert;r>auensbel'eiche
Im wesentlichen liefert die Diskussion oben eine einfache Einführung in das schwierige Gebiet der vertrauensbereiche (Konfidenzbereiche). Für Unterrichtszwecke mag es angemessen sein,
90%-Vertrauensbereiche zu wählen. Diese kann man auf dem Auf-
-
11 -
10 -
zeichnungsblatt darstellen (siehe Bild 3), und zwar nicht nur als
Bereich auf der untersten Linie, sondern mit zwei Kurven, zwi-
START
schen denen man auf jeder Höhe 90% der Zick-Zack-Linien erwarGEWINN
VERLUST
tet. Aus der Form dieser Kurven wird klar, daß man das Versuchsergebnis um so näher bei dem theoretischen Wert der Wahrscheinlichkeit erwarten kann, je mehr Versuche man durchführt.
13. VerteiZung der MitteZwerte
Der Probability Kit (Experimentierkasten zur Wahrscheinlichkeit,
Anm. d. U.) dient dazu, daß gleichzeitig mehrere Schüler in
Paaren an verschiedenen Versuchen arbeiten können. Dadurch hat
man auch Vorteile beim Experimentieren mit der ganzen Klasse.
Zunächst kann man, wie oben, nach Vertrauensbereichen fragen.
Als zweites kann man den Mittelwert für die Klasse bestimmen.
Bei einer Arbeitstagung, bei der ich den Versuch aus Punkt 7
benutzte, wurde behauptet, die mittlere Anzahl der "Gewinne" bei
50 Versuchen sei 33,33. Daraufhin konnte ich fragen, welche
"Genauigkeit" von diesem Mittelwert zu erwarten sei, wenn man
die Zahl der Teilnehmer bedenkt. Wenn eine Tagungsgruppe 40 Teilnehmer hat, und jeder zweimal 50 Versuche aufzeichnet, in welchem Bereich sollte man dann den Gruppen-Mittelwert erwarten?
14. Zehn Gewinne naaheinander
Ein einfacher und wichtiger Gesichtspunkt dieser Aufzeichnungsmethode, der bislang nicht diskutiert wurde, betrifft die Reihenfolge, in der die Ergebnisse auftreten. Ein Vorteil hierbei ist,
daß man die Klasse zum Beispiel fragen kann, ob jemand zehn aufeinanderfolgende "Gewinne" aufgezeichnet hat. Das ist sehr
leicht festzustellen, wogegen übliche Aufzeichnungsmethoden
diese Information nicht so leicht hergeben. Man kann auch fragen
"Wie oft sind zehn aufeinanderfolgende "Gewinne" bei einer Klasse
dieser Größe zu erwarten ?" Hier ist wieder eine Gelegenheit, wei-
o
0%
10%
20%
terführende Probleme zur Wahrscheinlichkeit zu diskutieren.
20
10
30%
40%
30
50%
60%
50
40
70%
80%
90%
100%
GEWINNE
Bild 3
-
12 -
15. Unabhängige Ereignisse
Noch ein Vorteil trat auf der oben genannten Arbeitstagung unerwartet zutage. Ein enttäuschter Student beklagte sich, der
Grund dafür, daß er zu viele "Gewinne" erhielte, läge darin,
daß der Zylinder zu eng sei, und die Kugeln nicht leicht genug
aneinander vorbeikämen. "Das bedeutet" , sagte er, "daß auf einen
"Gewinn" eher ein "Gewinn" folgt." Und deshalb erhielte er zu viele
"Gewinne". Die naheliegende Entgegnung war die Frage, ob er auch
herausgefunden hätte, daß auf einen "Verlust" eher ein "Verlust"
folgt. Ein Blick auf sein Blatt zeigte ihm, daß das nicht der
Fall war, und er sah ein, daß er diese Behauptung nicht aufrecht
erhalten konnte.
Dieser Artikel basiert auf Material aus dem Abschlußbericht eines Forschungsprojektes, das vom Schottischen Erziehungsministerium (Scottish Education
DepartmentJ getragen wurde: School Mathematics Under Examination:
Same factors affecting the learning of mathematics
Quelle
1. Probability Kit No. 1, Oliver & Boyd, ISBN 0 05
003050,~
7.50
-
13 -
BEMERKUNGEN ZUM STIRLING'SCHEN AUFZEICHNUNGSBLATT
FÜR EXPERIMENTE ZUR WAHRSCHEINLICHKEIT NACH G. GILES
B. WOLLRING
Die folgenden Bemerkungen beziehen sich auf das von G.
Gi~es
vor-
gestellte Arbeitsblatt zum schnellen Aufzeichnen relativer Häufigkeiten bei Bernoulli-Experimenten. Das "Aufzeichnungsblatt",
wie wir es im folgenden nennen wollen, ist meiner Meinung nach
ein derart schönes und praktisches Hilfsmittel, daß mir einige
Bemerkungen zur Ergänzung des Textes von
G. GiZes (siehe Gi ~es)
lohnend erscheinen.
Die Bilder 1 und 2 können als Kopiervorlag: des Aufzeichnungsblattes genommen werden, wobei Bild 2 gegenüber Bild 1 zusätzlich die 90 %-Vertrauensintervalle für p bei k
= n/2
enthält.
Gegenüber dem Original von GiZes wurden einige Ablesehilfen hinzugefügt. Ferner ist unter der Skala für den Gewinnanteil ein
"Magazin" eingezeichnet, in dem die Ergebnisse mehrerer Versuchsserien wie in einem Histogramm gesammelt werden können. Wir kommen weiter unten darauf zurück. Ist das Magazin nicht erforderlich, so kann es beim Kopieren abgedeckt werden.
Offenbar beabsichtigt
Gi~es,
das Aufzeichnungsblatt den Schülern
zunächst nur mit einer Gebrauchsanweisung in die Hand zu geben
und baut darauf, daß sie die Konstruktion im Laufe der prakti-
*
Siehe Beilage zu diesem Heft
-
14 -
-
15 -
sehen Arbeit immer besser durchschauen. Hier scheint es mir,
(n; k) fragt. Allerdings erscheint mir wohl einige Lehrerhilfe
speziell angesichts der deutschen Curricula, sinnvoll, die
nötig, bis die Schüler einsehen, daß
Schüler auf die Analogie des Aufzeichnungsblattes zum Baumdia~
hinzuweisen. Daß das Aufzeichnungsblatt ein verzerrtes
n· (n -
(1)
1)·
1 • 2 .
• (n -
k -
1)
k
n!
k! (n - k)!
Baumdiagramm ist, kann der Schüler an einem kurzen Abschnitt
die Zahl der Wege vorn Start bis zum Punkt (n; k) ist. Meiner An-
beider Strukturen feststellen, indem er sie Punkt für Punkt und
Weg für Weg vergleicht. Dazu genügen zwei Abschnitte bis n
=
sicht nach kann diese Formel durch Aktivitäten am Aufzeichnungs-
5,
blatt allein nicht gefunden werden. Wohl findet der Schüler, wenn
die er zum Vergleich auch selbst zeichnen sollte (siehe Bild 3).
er mit (~) die Zahl der Wege vorn Start bis (n; k) 'bezeichnet, die
Formeln
2
I
Randformeln:
(2)
:1
/'
o
/'
,.
/'
,
2
3
4
Schrittformel: (~) + (k ~
/'
5
Gew.
t
o
t
t
t
2
3
4
t
5 Gew.
Aber damit ist die Struktur der Formel
1)
(1)
(n + 1)
k + 1
noch nicht gefunden.
Mit einem Beweis durch Induktion über n kann sie wohl bestätigt
Bild 3
Wahrscheinlichkeitsbaum in Dreieck-Darstellung und in
Giles-Darstellung
werden, aber dazu muß ihre Struktur bereits bekannt sein.
Da die Formel (1) jedoch bei der weiteren Diskussion des AufzeichDas Identifizieren analoger Punkte und Wege sollte in beiden
nungsblattes vonnöten ist, soll sie mit einer einfachen
kombinate-
Richtungen geübt werden. Bei kombinatorischen Uberlegungen, wie
rischen (Jbel.'Zegung
erarbeitet werden, bei der das Aufzeichnungsblatt
sie weiter unten folgen, ist der Rückgriff auf die Dreieck-Darzur veranschaulichung herangezogen wird, und Wege darin mit Losstellung oft hilfreich.
GiZes
folgen einer Ziehung in Zusammenhang gebracht werden.
weist darauf hin, daß durch den verständigen Gebrauch des
Wir nehmen an, daß n! als Anzahl der Permutationen von n Objekten
Aufzeichnungsblattes die Erarbeitung des Pascal'schen Dreiecks
bereits vorbereitet wird. Auf die Binomialkoeffizienten (~) s~ößt
bekannt ist. Nun ziehen wir n Lose aus einer Urne, davon k Gewinne, und numerieren die Lose beim Ziehen durch. Der gezogenen Los-
man, wenn man nach der Zahl der Wege vom Start bis zum Punkt
folge entspricht dann ein Weg im Aufzeichnungsblatt (siehe Bild 4).
-
-
16 -
p
(3)
Start
(n;
k)
17 -
Zahl der Wege mit Ziel (n; k)
Zahl der Wege mit n Schritten
nl
(n - k)!
kl
1
K
2
Das ist die Wahrscheinlichkeit, einen bestimmten Punkt (n; k)
"auf der Höhe n" zu erreichen, denn alle wege der Länge n sind
Ziel (7;3)
Bild 4: Losfolge mit zugehörigem Weg
bei p
=
1/2 ja gleichwahrscheinlich.
Es wäre schön, auch zu dieser Wahrscheinlichkeit einen experimentellen Zugang mit Hilfe des Aufzeichnungsblattes zu haben.
Insgesamt erzeugen n! Losfolgen Wege mit dem Ziel (n; k); denn
jedes Los kann an jeder Stelle auftreten, ohne daß das Wegziel
sich ändert. Aber mehrere Losfolgen erzeugen denselben Weg
(siehe Bild 5).
Dazu dient das Magazin unter der Gewinnskala, in dem die Schüler
die Ergebnisse mehrerer Versuchs serien sammeln, die sie entweder
durch Wiederholen oder Zusammenfassen der Ergebnisse aus der ganzen Klasse finden. Die Notierung von 30 Versuchsserien zeigt
Bild 6.
20%
0%
Bild 5
60%
40%
I
80%
I
100%
I
I'
Losfolgen mit demselben weg
Vertauscht man die k Gewinnlose untereinander und ebenso die
n - k Verlustlose untereinander, so ändert sich der erzeugte
Weg nicht. Und das geht auf k!
(n - k)! Arten. Also ist (~) ge-
mäß (1) die Zahl der Wege mit Ziel (n; k).
Bild 6
Notieren der Ergebnisse von 30 versuchs serien
Damit kann auch die folgende Diskussion der Vertrauensbereiche
GiZes
benutzt nun offensichtlich die Formel (1), um die Wahr-
scheinlichkeit p (n; k) von k Gewinnen unter n Versuchen zu bestimmen:
durch ein Experiment vorbereitet werden. Mit der "Magazin"-Technik erhält man auch bei p
=
1/2 qualitativ brauchbare Ergebnisse.
-
-
18 -
19 -
' L"ange des Vertrauensbereiches ein VielfaTypisch ist, da ß d ~e
Die 90 %-Vertrauensbereiche für die Anzahl k der Gewinne unter n
=
Versuchen bei p
1/2 kann man zwar, wie Gites bemerkt, "auf dem
Aufzeichnungsblatt angeben", aber die Konstruktion der von Gites
gezeichneten Kurven ist nicht wie die übrige Zeichnung auf An-
ches von 1 l(rll ist, was nicht nur bei p
1/2 gilt. Die Graphen
~
8 in das Aufzeichnungs-
der Funktionen n
+
P2
(n) sind für n
blatt eingetragen, sie stimmen mit den Kurven im Original von
Giles überein. Die Annahme der Normalverteilung von A enthält ei-
hieb zu verstehen, jedenfalls nicht für Schüler.
ne Näherung, so daß man bei direkten Berechnungen geringfügig
andere Ergebnisse erhält.
Als Hintergrundinformation für den Lehrer möchte ich daher zunächst erklären, wie ich sie rekonstruiert habe, und anschlieBei der Arbeit mit Schülern bieten sich meines Erachtens zwei
ßend Möglichkeiten nennen, sie mit Schülern zu diskutieren.
Wege zur Erläuterung und Bestätigung dieser Kurven an.
Betrachten wir den Anteil kin der Gewinne bei n Versuchen als
Der erste besteht darin, daß Vertrauensintervall für ein gegebebinomialverteilte Zufallsgröße A, so hat sie den Mittelwert
~
=p
und die Standardabweichung a
=p
nes n, etwa n
(1 - p}/n . Für hinrei-
chend hohe Werte von n ist sie nach dem lokalen Grenzwertsatz
annähernd normal verteilt. Einer Tabelle zur Normalverteilung
=
30, exemplarisch zu bestimmen, wobei Formel
(3)
benutzt wird. Es wird jedoch aus Zeitgründen kaum möglich sein,
diese Berechnung für mehrere, insbesondere für große n durch zuführen.
entnehmen wir nun, daß für einen beobachteten Wert kin von A
folgende Gleichung gilt:
Gesucht sind also k
(4 )
p
(~-
1,645 a6
~~~
+ 1,645 a)
1
und k , so daß gilt:
2
90 %
(6)
P 130; k } + P 130; k + 11 + ••• + p f30; k ) <: 90 %
1
2
1
Das bedeutet hier:
wobei (k 1; k)
2 e •;n Intervall mit Mittelpunkt 15 sein soll. Dazu
(5)
bestimmen wir k
Speziell bei p
intervall
=
P1; P2
0,5 erhalten wir für kin das 90 %-Vertrauens(7)
mit Mittelpunkt 0,5 und den Grenzen
0,5 -
1,645
(6)
0,5 + 1,645
1
2~
1
2fi11
1
so, daß gilt:
3D!
30!
30!
< 5 % ' 2 30
0!(30 - O)! + 1!(30 - 1)! + ... + k !(30 - k )!
1
1
Damit vermeiden wir die großen Zahlen "in der Mitte" und nutzen
die Symmetrie aus. Wir erhalten 5 % • 2
30
= ~3
687 091
-
- 20 -
und für die Binomialkoeffizienten
nutzen.
(30)
0
Dazu läßt man mehrere Schüler, sagen wir 25, mit analogem Gerät
(30)
1
(8)
21 -
gleichzeitig Versuchs serien durchführen und die Ergebnisse je-
30
weils nach n
(30)
2
(30) 29
1
""2
435
(30)
3
(30) 28
2
"3
4 060
=
10; 20; ... ; 50 Versuchen austauschen. Dabei trägt
jeder Schüler sämtliche Zwischenergebnisse in sein Magazin ein.
Man sieht dann, daß die Verteilung der 25 Ergebnisse sich bei
wachsender Länge n der Versuchs serien "zusammenzieht", wie es
Bild 7 als Beispiel zeigt.
32 906 445
Gewinnanteil
0%
60 812 890
Also erhalten wir k
(9)
1
= 10 und k
0,3333
40%
60%
80%
100%
~I----+----4----~----+I----4---~I~--_+----~I----~--~1
20 und damit
2
und
20%
0,6666
P2
als Grenzen des 90 %-Vertrauensintervalls für p. Man benötigt
Bild 7a : Ergebnisse von 25 Versuchsserien der Länge 10
Gewinnanteil
etwa 10 Minuten für diese Rechnung, wenn man einen Taschenrechner benutzt. Die Zeichnung bestätigt das Ergebnis. Zum Vergleich
nennen wir die entsprechenden Ergebnisse, die man mit Formel (6)
0%
20%
40%
60%
80%
100%
~I~--+---~I~--~----+I----4---~I-----+----~I----~--~1
gewinnt:
(10)
0,3499
Sie führen ebenfalls auf k
und P2
1
= 10
0,6501
und k
2
= 20.
Diese Methode hat
den Nachteil, daß man nicht unmittelbar erkennt, wie die Länge
Bild 7b : Ergebnisse von 25 Versuchs serien der Länge 50
des Vertrauensintervalls von der Zahl n der Versuche abhängt.
Die 90 %-Vertrauensintervalle sind nun jeweils durch Abzählen
Daher sei hier vorgeschlagen, das Magazin unter der Gewinnskala
zu bestimmen.
zur experimentellen Bestimmung des Vertrauens intervalls zu be-
-
Z2 -
- 23 -
Eine ",eitere Höglichkei t, wie Jer Begriff des Envartungswertes auch eingeführt
"erden kann*
von Alan II'.Sykes
(übersetzt von W.D .Heller)
A
Der Envartungswert wird in fast allen Statistikbüchern in der gleichen Vorgehensweise eingeführt. Hat man zunächst den Stichprobenmi ttelwert über die beobachteten Häufigkei ten definiert, wird man in natürlicher Weise den Envartungsliiert einer diskreten Zufallsvariablen X, die die Werte Xl ,x , ••• mit den WahrZ
scheinlichkeiten Pl'PZ"" annimmt, als
(1)
definieren.
Stetige Zufallsvariablen X, deren Verteilung durch eine Dichtefunktion fX(x)
gegeben sind, benötigen eine "eigene" Definition von E(X), die lautet:
E(X) = fxfx(x)dx.
( 2)
:\atürlich liegt es nahe,Formel (2) als stetige Version von (1) zu erklären.
1;: folgenden soll eine Einführung des Envartungswertbegriffs betrachtet werden, die in der gängigen obigen Art sowohl den diskreten Fall (1) als auch
den kontinuierlichen Fall (2) zusammenfaßt (aber nicht ersetzt!). Diese Herleitung ist einfach, weil sehr gut zu veranschaulichen, darüber hinaus aber
a\1:- diskrete und stetige :ufallsvariablenarnvendbar.
Die neue Methode
Die :ufallsvariable X habe die rerteilungsfunktion FX1xl = p(\$x) In Abbilcitcg 1 wird die Verteilungs funktion einer stetigen :ufalls\Oariablen X graphisch
dilloges te 11 t.
c
Abb. 1:
x
Verteilungsfunktion FX(X) einer stetigen Zufallsvariablen X
Ein Punkt (c,o) werde auf der x-Achse beliebig gewählt; es sei dann A die
Fläche zwischen x=c, FX(X) und der x-Achse, die Fläche B wird von x=c,
FX(X) und y=1 begrenzt. Unter der Voraussetzung, daß die beiden Flächen A
und B endlich sind, existiert E(X) und es gilt:
E(X)
=
c + B-A.
(3)
Festzustellen ist:
(i)
(ii)
(iii)
die Definition von E(X) ist von c unabhängig.
E(X) ist genau dann gleich c, wenn A = Bist.
Ist X eine positivwertige Zufallsvariable, dann
ist E(X) gleich der Fläche zwischen FX(x) und y=1.
Die Möglichkeit, den Envartungswert nach (3) zu definieren, wird in den meisten
Statistikbüchern nicht genutzt, während im Buch von FeIler ([1]) zumindest die
Eigenschaft (iii) von (3) angegeben wird. Im folgenden sollen einige Aspekte
der Definition des Envartungswerts durch (3) kurz angesprochen werden.
°
* ':'riginaltitel in 'TEACHnC; STo-HISTICS' (1981) Heft 5, Band 5
',\n Al terna ti ve Approach to the
~Iean'
Äquivalenz der Formeln (1) und (3)
Eine Zufallsvariable X nehme die Werte x 1 ,x ,x3 ,x 4 mit den Wahrscheinlichkeiten
Z
P1,PZ,P3 und P4 (Pl+P Z+P3+P4=1) an. Die Verteilungs funktion FX(X) ist eine
Treppenfunktion, die an den Stellen Xi die Sprunghöhen Pi besitzt. Wendet man
(3) wie oben gezeigt an, so folgt:
A = Pl (c-x l ) + PZ(c-x Z)
B = P3(x 3-c) + P4(x 4-c)
- 25
-
- 24
Nach einigen kleinen Umformungen ergibt sich c+B-A=Plxl+P2x2+P3x3+P4x4' was
der Definition (1) entspricht.
FX(x)
1
Wertebereich von X
2
4
6
Summierte Wahrscheinlichkeiten (Stufe 1)
0.1
0.3
0.6
0.3
Summierte Wahrscheinlichkeiten (Stufe 2)
0.1
0.4
1.0
0.3
I
--+____: P3
und E(X) ergibt sich zu E(X)
8 +2(0.3-1.0)
10
8
6.6.
P2
Gruppierte Werte, wobei die Klassenbreite konstant ist
c
x
Beispiel für eine diskrete Zufallsvariable, deren Werte gleiche Abstände haben
X sei eine diskrete Zufallsvariable, deren Verteilung durch die beiden ersten
Zeilen von Tabelle 1 gegeben sei. Wird nun für c ein Wert des Wertebereichs von
X gewählt - z.B. c=6 - so muß als nächstes die Wahrscheinlichkeitsmasse, die
oberhalb und unterhalb von c liegt, aufsummiert werden (Zeile 3 in Tabelle 1).
Wiederholt man diesen Vorgang, so ergibt sich Zeile 4 der Tabelle 1. In beiden
Fällen werden die Wahrscheinlichkeiten, die zu dem gewählten c-Wert gehören,
nicht berücksichtigt. Die in Tabelle 1 eingekreisten Werte werden nun mit 2
multipliziert um A und B zu erhalten. Somit ist E(X) = 6+2'(0.7-0.4) = 6.6.
Durch Tabelle 2 ist eine Häufigkeitsverteilung gegeben, deren Stichprobenwerte
in 5 Klassen gleicher Breite zusammengefaßt werden. Die die Klassen repräsentierenden Werte (die Klassenmitten) sowie die relativen Häufigkeiten stimmen
mit den Werten von Tabelle 1 überein. Der Stichprobenmittelwert der Daten wird
analog dem Vorgehen in Tabelle 1 bestimmt, die Vorgehensweise sei aber abweichend von Tabelle 1 nun in Tabelle 2 für absolute Häufigkeiten dargestellt.
Tabelle 2
1 bis 3
3 bis 5
5 bis 7
7 bis 9
9 bis 11
2
4
6
8
10
absolute Häufigkeit
10
20
30
10
30
10
summierte absolute
Häufigk. (Stufe 1)
10
30
40
30
0.3
summierte absolute
Häufigk. (Stufe 2)
10
~
[ZQ]
30
Klassen
[
)
Kl ass enmi tte
Tabelle 1
Wertebereich von X
P(X=x )
i
2
4
0.1
0.2
6
8
0.3
0.1
I
Summierte Wahrscheinlichkeiten (Stufe 1)
Summierte Wahrscheinlichkeiten (Stufe 2)
0.1
0.1
0.3
~
I
I
-
II 0.4
10.71
I
0.3
2
I
Stichprobenmittelwert = 6 + 100(70-40)
0.3
Wird für c anstelle von 6 der Wert 8 gewählt, ändern sich die Zeilen 3 und 4
von Tabelle 1 folgendermaßen:
6.6.
- 26
-
Da die Urdaten nicht vorliegen, kann die Berechnung des Stichproberunittelwertes nur unter gewissen Annahmen durchgeführt werden. Die Berechnungen in
Tabelle 2 setzen voraus, daß die Wahrscheinlichkei tsslD11llle von jeder Klasse auf
die Klassenmitte konzentriert ist - die Stichprobenverteilungsfunktion (oder
auch empirische Verteilungsfunktion) also eine Treppenfunktion ist (Abb. 3).
Realistischer wäre es anzunehmen, daß die Werte innerhalb einer Klasse gleichverteilt sind, so daß sich als Stichprobenverteilungsfunktion der in Abb. 3
darges tell te Polygonzug ergibt. Die Anwendung unserer neuen Definition (3) auf
beide Verteilungsfunktionen ergibt das gleiche Resultat (die relevanten Flächen
A und B sind anhand von Abbildung 3 zu berechnen, wobei die Berechnung der
Flächen A und B leichter sein wird als die der entsprechenden Flächen des
Polygonzuges) .
Abbildung 3
relative
Häufigkeit
absolute
Häufigkeit
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
100
90
80
70
60
für
1
für
5
7
9
1
"4
<
x
<
:\
±
auf. \irrunt man
Der Graph \'on Fy (:\) l;eist eine Unstetigkeitsstelle bei :\ ;
1
"
desl\egen c=4 und l;endet (:01 an, so läßt sich über die Dreiecksflächen ,.l. und
E mit den Flächeninhalten \'on 1/3: und 0 64 [IX) :u
:3/6-1
EIX)
berechnen.
Die :.tarkoffsche Ungleichung
Die Tschebyscheffsche Ungleichung, ein Korollar der 'larkoffschen Ungleichung,
kann für den Beweis des schwachen Gesetzes der großen Zahlen verwendet werden.
Obwohl dieses Gebiet der Wahrscheinlichkeitsrechnung sicherlich nicht allzu
tief inl Stochastik-Schulunterricht behandelt werden dürfte bzw. könnte, soll
kur: auf eine Anwendung von Fonnel (3) zur Begründung der ~larkoffschen Ungleichung eingegangen werden.
Für eine positivwertige :ufallsvariable X, die den En,artungswert E(X) besitzt,
30
lautet die Markoffsche Ungleichung:
20
10
3
für
40
50
G.1
1
-::;.x+~
11
Berechnung von E(X) für eine "gemischte Zufallsvariable"
Die Fonneln (1) und (2) können nur auf Zufallsvariablen angewendet werden, die
entweder diskret oder stetig sind. Nicht angewendet werden können sie für Zufallsvariablen, die weder diskret noch stetig sind und die also weder eine
Treppenfunktion noch eine stetige Funktion als Verteilungsfunktion besitzen.
Die in Formel (3) benötigten Flächen A und B hingegen können irruner berechnet
werden. Sei etwa folgende \'erteilungsfunktion FX(x) der Zufallsvariablen X gegeben:
P(X>).) <E(X),
-
-
V).>0.1
).
Diese Ungleichung ergibt sich in natürlicher Weise aus Formel (3): E(X) ist
die durch FX(X)' Y = 1 und x = 0 begrenzte Fläche,). • P(X>).) ist hingegen die
Fläche eines Rechtecks, das in der E(X) charakterisierenden Fläche enthalten ist.
Zusarrunenfassung
Es ist nicht schwierig die Grenzen der in dieser Arhei t betrachteten Defini tionsmöglichkei t von E (X) aufzuweisen - E (X) einer Poissom'erteilung über (3) zu hestirrunen wäre ein "tödliches" Unterfangen. Des weiteren benötigt man zur BerechDie "tarkoffsche Ungleichung gilt noch für einen allgemeineren Fall:
P!
) ~ E(X;r)
.
be l'leb'1ge _u
- f a 11 svarla
. bl e und ). ,r>o Sln
. d.
, r ' wob'
el.X elne
..U:: Spe:ialfafl erhält man dann für r< und Y=X-E (Xl die Tschebyscheffsche
X ~'.
Ungleichung.
- 28
-
nung von E (X 2) nach (3) die Verteilungsfunktion von X2 . Nichts desto weniger
kann die Formel (3) und mit ihr ihre Anwendungen als elementar, anschaulich
und als ein erfolgreicher Schritt bei der Zusammenfassung der Formeln (1) und
(2) für den diskreten bzw. stetigen Fall eingestuft werden. Sind dies nicht
genug gute Gründe, um (3) in elementaren Stochastikbüchern zu en.ähnen?
Literatur
[1]
FeIler, W. (1950): Introduction to Probability and its Applications
(vol.2), S. 148, Wiley.
- Z9
Bestißlmmg von Regressionsgeraden ohne Differentialreclmung*
von C. W.Puritz
(übersetzt von M.Nuske)
Die Anpassung einer Modellgeraden y = a+bx an einen Datensatz (x 1'Yl) ,(xZ'YZ)'
... ,(xn'Yn) erfordert die Festlegung der beiden Zahlen a und b. Die Herleitung
entsprechender Formeln nach der Methode der Kleinsten Quadrate basiert auf
partiellen Ableitungen. Um diese Differentialtechnik zu vermeiden, verwenden
einige Lehrbücher eine algebraische Methode, die mir immer ziemlich kompliziert erschien und einen entsprechend abstoßenden Effekt auf den Durchschnittsschüler der Oberstufe hatte. Ich habe deshalb stets partielle Differentiation
verwendet (ohne die zugehörige spezielle Notation) und hatte keine Schwierigkeiten damit. Der algebraische Ansatz hat jedoch seine Vorzüge. Insbesondere
garantiert er ein globales Minimum anstelle eines lediglich lokalen Extremums,
welches mit Hilfe der Differentialrechnung bestimmt wird.
In diesem Jahr habe ich eine einfachere algebraische Methode entdeckt und angewendet, die mir für Schüler meiner Statistikkurse der Oberstufe mit ihren
sehr unterschiedlichen Begabungen und Fähigkeiten hinreichend einfach und klar
erschien. Wir begannen mit der Durchrechnung eines numerischen Beispiels und
verwendeten dabei die Differentialrechnung. Auf diese Weise lernen die Schüler
beide Wege kennen. Im allgemeinen bin ich wie folgt vorgegangen:
Die Gleichung
Y
,
=
a + bx
(1)
soll für Schätzungen von Y bei vorgegebenem x-Wert verwendet werden. Wenn man
sie auf die x-Daten anwendet, erzeugt sie Schätzwerte Y = a+bx i , i = 1, ... ,n,
i
die im all~emeinen von den vorliegenden y-Daten, Yl' ... 'Yn ' abweichen. Sei
e i = Yi - Yi der Schätzfehler für den i-ten Datenpunkt (xi'Yi). Wir suchen nun
diej:nige Größe, für die die Summe der quadrierten Abweichungen der geschätzten y-Werte von den beobachteten y-Werten minimal wird. Die Größe
Z
e = (e~+ei+ ... +e~)/n, der mittlere quadratische Schätzfehler also, soll also
durch Wahl geeigneter Werte für a und b minimiert werden.
* Originaltitel in 'TEACHING STATISTICS' (198J) Heft 3, Band 3
'Deriving Regression Lines without Calculus'
-
.- .s ucr bekannten
:o~'n
FOl111el
sich
für Jie (cnpirisc}lCi \"arian: eint::::=.
--,
e
~',3.tEr1s~.-::L"S
er-
31 -
Das absolute Minimum dieses Ausdrucks ist 0 und wird genau dann angenommen,
wenn gilt
y : a +
rarlei + e
bx
(6)
Z
"erden sehen, daß a unJ h so ge,,'jhlt ,,'erJen können, ,hf.' jeJer der beiJen
_,l,.isdrucke auf der rechten Seite \'on I ~I sein absolutes '!inimIIDl annimmt.
i',:r
:::mächst ist
Das heißt e nimmt seinen minimalen Wert an, wenn b gemäß (5) gewählt wird
- das gibt uns die Steigung der Regressionsgeraden - und wenn a die Bedinglmg
(6) erfüllt - daraus ersehen wir, daß die Regressionsgerade durch das Datenzentrum (x,y) verläuft. Die Bedingungen (5) und (6) ergeben also die Lösung des Problems.
da die Addition der Konstanten a den llert der rarian: nicht \'erjnJert.
(7)
',ei ter ergibt sich
Var(y-bx)
---0
__ "
[y-bxJ" - [y-bxJ')
_
77 _")
__
Dabei ist r : Sxy/s xy
s der Korrelationskoeffizient der Datenpaare (Xl' ,y .).
l
Hieraus ergibt sich unmittelbar, daß r Z stets kleiner oder gleich 1 ist und
den Wert 1 genau dann annimmt, wenn e Z gleich 0 ist, das heißt, wenn die
Datenpunkte alle exakt auf einer Geraden liegen.
7_ ')
y"" 2bxy+b"x - -y- +2bxy-b -x"
~
..,
_7
_
__
~_:
b - (x" -x")- 2b (xy-xy) +y" -y,.,
..,
b-~-
-x
I
- "bs
+ s"y
- xy
( 3)
"obei sZ, sZ und s
die Varianz der x-Daten, die Varianz der y-Daten beziex y
xy
*
hungsweise die Kovarianz der (x,y)-Datenpaare bedeuten.
Kir vervollständigen nun das Quadrat mittels der sogen. quadratischen Ergänzcmg
(oder könnten auch die Analysis ohne partielle Differentiation anwenden, falls gewünscht):
2
22
22
2
2
Offenbar nirmnt dieser Ausdruck sein absolutes ,linimum dann an, ',enn gilt
(5)
;\lm
betrachten wir der! zweiten ,\usdruck in (2):
"
,
~- = [y-(a+bx) J- : [~-(a+bi)
Var(a+bx) : bZvar(x)
= (s2xy-xx
/s4)sZ : (s /s)2
xy-x
Aus (7) ergibt sich also:
Var(y) - Var(y)
oder
( 4)
+ [sxSy - sAyJ/S X
Var(y)
Var(e)
Var(e) : sZ[bZ-Zbs /s2 + s2 /5 4 J + Sy2 _ s2 /s2
x
xyx
AYX
xyx
sx[b-sAy/sXJ
Darüberhinaus können wir zeigen, daß r2s~ die Varianz der geschätzten y-Werte,
Yl'YZ""'Yn' ist:
Var(y)
=
Var(;) + Var(e)
Das heißt die Gesamtvarianz der y-Daten ist die Summe aus der erklärten Varianz
(die durch die Beziehung zwischen y und x zustande kommt) und der nichterklärten
Varianz (die durch die AbweiChungen der Datenpunkte von der Geraden entsteht).
Und in dieser Summe ist das Verhältnis von erklärter zu nichterklärter Varianz
"
gerade r~.
"
j-
.. :he Definition der l\O\"arian: einer flatenpaannenge lautet:
Dieser letzte Teil (nach (7)) war für die Schüler schwierig, erforderte aber
nicht viel Zeit und erzeugte Vielleicht das auf dieser Stufe bestmögliche Verständnis dafür, wie der Korrelationskoeffizient tatsächlich den Grad mißt, in
welchem einern empirischen Datensatz eine theoretische Modellgerade angepaßt
werden kann.
-
33 -
32 -
Eine Auswertung der Wirnbledon Tennisfinale der ersten 100 Jahre *
von J.S.Croucher (übersetzt von G.KC\nig)
Das Tennisturnier in Wirnbledon wurde 1877 zum erstenmal mit den Herreneinzel
durchgeführt. 1879 kamen die Herrendoppel da:u und 1884 als weitere Ergänzung
die Dameneinzel. In diesem Bei trag sollen mitHilfe elementarer '·lethoden der
Wä.!.i.-scheinlichkeitsl-eclmung die erwartete und tatsächliche Satzanzahl einzelner Wirnbledonspiele unter der Annahme gleicller Spielstärke der Teilnehmer
mi teinander verglichen werden. Es wird auch der sogenannte "Rücken-an-derWand"-Effekt untersucht, der den zurückliegenden Spieler begünstigt.
Einführung
Die Auswertung von Daten aus Bereichen, die den Schülern vertraut sind, ist,
wie für den Unterricllt im allgemeinen, so auch für den Statistikunterricht
förderlich. Sportergebnisse eignen sich besonders gut für Untersuchungen der
den Daten zugrundeliegenden Muster. Reichhaltiges Material liefern z.B. Fußball- oder Handballergebnisse und Tabellen. Hier werden die Ergebnisse der
Dameneinzel und Herreneinzel während der ersten 100 Jahre der Wimbledonturniere analysiert.
In den ersten 100 Jahren der Tennisturniere in Wimbledon fanden 89 Endspiele
im Herreneinzel und 83 Endspiele im Dameneinzel statt. Die Herreneinzel gehen
über 3 Gewinnsätze in maximal 5 Sätzen, die Dameneinzel über 2 Gewinnsätze in
~,imal 3 Sätzen. Genauer: Bei dem Herreneinzel ist der Wettkampf zu Ende, wenn
der erste Spieler 3 Sätze gewonnen hat.
Wir wollen im folgenden die beiden Annahmen prüfen: 1. die Finalisten sind
gleich stark und 2. bei dem im Rückstand liegenden Spieler erwachte ein besonderer Kampfgeist. ~fi t Hilfe elementarer Voraussetzungen aus der Wahrscheinlichkeitsrechnung wurden diese Fragen vor kurzem in den USA anhand von Baseballergebnissen untersucht (Simon, 1971); dort konnte auch ein sogenannter
"Rücken-an-der-Wand"-Effekt beobachtet werden.
Herrenfinale
44 der Finale im Herreneinzel wurden direkt in den ersten :; Sätzen gewonnen,
21 in 4 Sätzen und 24 in 5 Sätzen. Wir berechnen zuerst die Wahrscheinlichkeit
von Wettkämpfen mit 3, 4 oder 5 Sätzen für gleich starke Spieler (die einzelnen Sätze sollen dabei als unabhängig gelten und die IVahrscheinlichkeit jedes
Spielers, einen Satz zu gewinnen, beträgt nach der Annahme 0,5).
*Originaltitel in 'TEACHING STATISTICS' (1981) Heft 3, Band :;
'An Analysis of the First 100 Years of Wimbledon Tennis Finals'
Die beiden Spieler seien mit A und B bezeichnet. Ein Spiel ist in genau
3 Sätzen beendet, wenn die Ereignisse AAA oder BBB eintreten. Mit den
obigen Annahmen ist die Wahrsclleinlichkeit jedes dieser beiden Ereignisse: 0,5 . 0,5 . 0,5 = 0,125 und daher die Wahrscheinlichkeit, daß
ein Match in genau 3 Sätzen entschieden ist, 0,25.
Ein Wettkampf (Matcll) besteht aus genau 4 Sätzen, wenn eines der folgenden
Ereignisse eintritt: AABA, ABAA, BAAA, BBAB, BABB, ABBB. Die Wahrscheinlichkeit jedes dieser Ereignisse beträgt (0,5)4 = 0,0625, so daß die Wahrscheinlicllkeit für ein Spiel mit 4 Sätzen 0,375 beträgt.
Analog kann die Wahrscheinlichkeit, daß ein Tennisspiel über die maximale
Anzahl von 5 Sätzen läuft, zu 0,375 berechnet werden. Es gibt nämlich 12
Ausgänge mit jeder Wahrscheinlichkeit 0,03125. Diese sind:
AASBB, ABABB, ABBAB,
BAABB, BABAB, BBAAB
B gewinnt
BBAAA, BABAA, BAABA,
ABBAA, ABABA, AASBA
A gewinnt
Die "erwartete" Anzahl von Spielen, die in einer vogegebenen Zahl von Sätzen
beendet sind, läßt sich durch Multiplikation der oben bestimmten Wahrscheinlichkeiten mit der Gesamtzahl von Spielen berechnen. In der folgenden Tabelle
1 sind diese berechneten Werte (erw.) den tatsächlich beobacllteten (beob.)
gegenübergestellt; dabei werden die Spiele vor dem 2. Weltkrieg und diejenigen danach getrennt verglichen.
Tabelle
Männerfinale 1877-1976
Anzahl der
Sätze
3
4
5
Summen
Wahrscheinlicllkeit p
0,250
0,375
0,375
1877-1939
beob. erw.
1946-1976
beob. erw.
Gesamtzahl
beob. erw.
28
12
18
14,500
21,750
21,750
16
44
21
24
22,250
33,375
33,375
58
58,000
31
31,000 89
89,0CXl
9
6
7,750
11,625
11,625
- 35 -
- 34 -
Aus dieser Tabelle scheint zu folgern, daß die Spieler meist nicht gleiche
Spielstärke besitzen, da mehr Spiele als erwartet in 3 Sätzen endeten. Der
Prozentsatz solcher Siege betrug vor dem Krieg 48,3 % und nach dem Krieg
51,6 %.
In 76,4 % der Finalkämpfe gewann der Gewinner des 1. Satzes das gesamte
Match in 3, 4 oder 5 Sätzen. Unter der Hypothese gleicher Spielstärke gilt
dafür theoretisch:
5
P CA gewinnt Spiel I A gewinnt 1. Satz)
I
j=3
P CA gewinnt in j Sätzen i
A gewinnt 1. Satz)
0,250 + 0,250
0,6875
+
0,1875
Diese Unterschiede legen die Vermutung eines "Rücken-an-der-Wand"-Effektes
dar, mit Hilfe dessen diejenigen Spieler, die den 1. Satz verloren, sich erholten und nach 5 Sätzen gegenüber ihren Gegnern im Vorteil waren. Eine
weitere Aufgliederung zeigt, daß dies vor dem Krieg in 13 von 18 Fällen
(72,2 %) und nach dem Krieg in 3 von 6 (50 %) Fällen geschah. Dieser eben
beschriebene Effekt war also nur vor dem Kriege zu finden.
Es ist noch hinzuzufügen, daß Spieler, die mit 2:1 führten, den 4. Satz in
23 Fällen (51,1 %) gewannen, was mit dem theoretischen Ergebnis
P CA gewinnt 4. Satz IA führt 2:1) = 0,5
gut übereinstimmt.
Diese errechnete theoretische Wahrscheinlichkeit ist verträglich mit den Vorkriegsdaten, aber es scheint, daß nach dem Krieg die Gewinner des 1. Satzes
eher einen Hinweis auf den späteren Gewinner des Wettkampfes geben könnten.
Sieht man von den insgesamt 44 Dreisatzsiegen ab, dann liefern die übrigen
45 Spiele einige interessante Beobachtungen. In diesen Spielen waren die
nach dem 3. Satz mit 2:1 führenden Spieler in 34 von 45 Fällen (76 %) auch
die Gesamtsieger. Diese Beobachtungen stimmen auch mit der theor·tischen
Wahrscheinlichkeit:
Damenfinale
Da bei den Dameneinzel zu einem gewonnenen ~Iatch 2 Gewinnsätze in maximal
3 Sätzen gehören, lassen sich hier schlecht schlüssige Ergebnisse bezüglich
des "Rücken-an-der-Wand"-Effektes ableiten. Die entsprechende Tabelle 2 für
die Dameneinzel:
Tabelle 2
Damenfinale 1884-1976
P (A gewinnt Spiel I A führt 2: 1) = 0,75
.A.nzahl der
Sätze
Wahrscheinlichkeit p
1884-1939
beoh. en,.
1946-1976
beob. env.
Gesamtzahl
beob. erw.
38
14
26
26
24
15,5
15,5
62
21
41,5
41,5
52
52
31
31,0
83
83,0
für gleich starke Spieler überein.
2
3
Die Gewinner der 21 Viersatzspiele haben in'14 Fällen (6,7 %) den 1. Satz
gewonnen, was ebenfalls mit der theoretischen Wahrscheinlichkeit
0,50
0,50
Summen
j
P (A gewinnt 1. Satz I A gewinnt in 4 Sätzen) = 0,667
übereinstimmt.
Unerwartete Ereignisse ergaben sich jedoch bei den 24 Fünfsatzspielen, in
denen der Matchgewinner den 1. Satz lediglich in 8 Fällen gewinnen konnte.
Das theoretische Ergebnis für dieses Ereignis ist
P (A gewinnt 1. 5atz I A gewinnt das Spiel in 5 Sätzen)= ~:g:g~g~
0,5.
Für gleich starke Spielerinnen ist die Wahrscheinlichkeit, daß das Spiel über
2 oder 3 Sätze geht, gleich groß. Da jedoch 62 der 83 Spiele (74,4 %) in den
ersten beiden Sät:en gewonnen wurde, scheint die .A.nnahme gleicher Spielstärke
bei den Damen nicht zutreffend :u sein. Gestüt:t wird diese Aussage durch die
Tatsache, daß in ~6 Spielen (91,6 ',) die Ge\ünnerin des 1. Satzes auch den
~. Sat: ge\,ann, \\"0 hingegen die :ugehörige \\ahrscheinlichkei t nur
r
1.-\
gewinnt
beträgt.
~Iatch
.-\ ge\dnnt 1. Satz) = 0,-5
- 36
Schlußbemerkungen
Die Interpretation des Auftretens ungewöhnlicher Ereignisse ist im allgemeinen mit großen Schwierigkeiten verbunden, und man sollte in solchen
Fällen vorsichtig mit seinen Schlußfolgerungen sein. Trotzdem ist eine
Analyse dieser Ereignisse aus der Tennisgeschichte interessant, wenn auch
ir, :ukunft ähnliche Serien nicht unbedingt zu erwarten sind.
Analoge Untersuchungen können zu den Ergebnissen der Doppel durchgeführt
werden. Die notwendigen Daten können bei Tingay (1977) gefunden werden.
Literatur
Simon, W. (1971), Back-to-the-wall effect, Science, 174, 774-5.
Tingay, L. (1977), 100 years of Wimbledon, Guinness Superlatives Ltd.,
Middlesex, England.
- 3~
Eine Abwandlung der Münzwurf-Experimente
~
P. J. Butt
übersetzt von Karl Röttel
Man werfe N-mal eine Münze und notiere die Abfolge von "Zahl"
und "Wappen". Dann zeichne man eine graphische Darstellung, indem man bei "Zahl" eine Einheit nach oben und bei "Wappen" eine
Einheit nach unten bei der Nummer des jeweiligen Wurfes abträgt.
So erhält man für N
=
10 bei der Folge WZZZWWWZWW das folgende
Schaubild:
o1-:--7""--:~-------~"'---""'~-----
Nummer des Wurf es
-1
-1.
Folgende Untersuchungen könnte man mit dem Wissensstand von
Schülern durchführen:
(1) Die Position am Ende des Spieles.
In unserem Graphen ist sie bei -2. Welches ist der Modalund welches ist der Mittelwert der Endpositionen? Welche
Wahrscheinlichkeitsverteilung ergibt sich?
(2) Die. Häufigkeit dafür, daß der Graph oberhalb der NummernAchse ist.
Bei unserem Graphen ist sie 3. Welches ist der Modal- und
welches ist der Mittelwert der Häufigkeiten? Welche Wahrscheinlichkeitsverteilung gehört zu dieser Zufallsgröße?
(3) Die Häufigkeit, wie oft die Nummern-Achse geschnitten wird.
Unser Graph schneidet diese Achse zweimal. Welches ist der
Modal- und welches ist der Mittelwert dieser Häufigkeiten?
Kann man Aussagen über die WahrSCheinliChkeitsverteilung
machen?
't)
Original artikel in "Teaching Statistics" (1981) Heft 3, Bd.3:
A Variation on Coin Tossing Experiments.
- 38 -
Bemerkungen:
Zenn Münzwürfe dürften eine vernünftige Anzahl darstellen, denn
dies erlaubt den Schülern, in einer einzigen Unterrichtsstunde
einige Folgen zu gewinnen und graphisch darzllstellen.
Bevor man die Ergebnisse der ganzen Klasse zusammenstellt, sollte man die Schüler vorhersagen lassen. Die Vorhersagen für (1)
sind gewöhnlich richtig und werden bestätigt, während die Ergebnisse zu (2) und (3) Verwirrung stiften können. Mit guten und
älteren Schülern dürften sich interessante Diskussionen zum sogenannten "Gesetz der Mittelwerte" ergeben, wenn man den Modalund Mittelwert bei (2) miteinander vergleicht und für (3) den
Hodalwert und dessen Häufigkeit betrachtet.
Der zentrale Grenzwertsatz kann eindrucksvoll veranschaulicht
werden, wenn man (2) verwendet, denn die u-förmige Verteilung
wechselt in eine glockenförmige Verteilung, beinahe eine Umkehrung der Gestalt.
Ergebnisse:
Für N
=
10 sind 2
10
verschiedene Folgen möglich.
= 10
(1) Eine Binomialverteilung mit n
und p
= 1/2
tritt nur
bei geradzahligen Positionen auf.
(2) Häufigkeit oberhalb der Achse
o
1
2
4
3
5
6
7
8
9
10
60
70
70
126
Anzahl dafür
252 126 70
Für den Fall N
5 entsteht eine geringfügige Abweichung
70 60
60 60
der Gestalt.
(3) Häufigkeit des Schneidens
Anzahl dafür
o
1
2
3
4
504
336
144
36
4
- 39 -
AUF GAB E
HEINZ ALTHOFF, Bielefeld:Beispiel einer Abituraufgabe im Leistungskurs
Fritzchen behauptet: Von allen über den Jahnplatz in Bielefeld fahrenden PKWs
beträgt der Anteil p der Volkswagen genau 25 %. Wir wollen diese Hypothese H
o
mit einer Stichprobe vom Umfang n testen; wir bezeichnen die Anzahl der darin
befindlichen VWs mit X.
a) Bei
n=100 wollen wir nach einer der nachfolgenden Entscheidungsregeln vorgehen:
(1) Ho wird nicht verworfen . . 2~X~30
(2) Ho wird nicht verworfen .. 17~X~33
Zeichnen Sie für beide Entscheidungsregeln den Graphen der Gütefunktion ins
gleiche Koordinatensystem.
b) Geben Sie für beide Entscheidungsregeln P(Fehler 1. Art) sowie P(Fehler
2. Art) für p=0,2 bzw. p=0,3 an. Wie wirkt sich die Wahl der Entscheidungsregel auf die Wahrscheinlichkeiten für Fehler 1. Art bzw. 2. Art bei diesem
Beispiel aus?
c) Bestimmen Sie bei n=200 und bei n=1000 jeweils die günstigste Entscheidungsregel auf dem Signifikanzniveau 5 %.
d)
Wie hat sich gegenüber Entscheidungsregel (2) bei n=100 (vgl. Aufgabe b)
P(Fehler 2. Art) Tur p=0,2 bzw. p=0,3 geändert? Verallgemeinern Sie das
Ergebnis.
Voraussetzungen:
Mit Stochastik wurde zu Beginn der Jahrgangsstufe 13 begonnen. Das Testen von
Hypothesen wurde für binomialverteilte Zufallsgrößen am Ende des 1. Halbjahres
behandelt, die Laplaceschen Näherungsformeln folgten im 2. Halbjahr.
Für die Bearbeitung von dieser und zwei weiteren etwa gleichwertigen Aufgaben
(eine aus der Analysis, die andere aus der Wahrscheinlichkeitsrechnung) hatten
die Schüler 5 Zeitstunden zur Verfügung. Sie konnten die "Tabellen zur Stochastik"
von Barth/Bergold/Haller sowie einen Taschenrechner benutzen.
Lösungsvorschlag:
a) Hinweis:
Die Funktionswerte
a-1
b
P(X<auX>b) = L b(100;p;i)+(1 - L b(100;p;i)) = B(100;p;a-1) + (1-B(100;p;b))
i=O
i=O
können für verschiedene Werte von p mit Hilfe der Tabelle 6 (Binomialverteilung)
kumulativ) ermittelt werden.
II
II
- 40-
Ii
- 41
-
Zahl b €~ gesucht, für die noch P(X>b)~0,025 ist (bzw. die größte Zahl a €~
mit P(X<a)~0,025). Mit Hilfe der integralen Laplaceschen Näherungsformel ergibt
sich:
n=200: P(X>b)~0,025 _ P(X~b).::0,975
.. 0(b-200.0,25+0,5 ) > 0,975
V200.0,25·O,75 -
;:
.1;: ._._
. . b-49,5 > 1;96 (nach Tabelle 8 für die Standardnormal~ verteilung)
·:1·
'_''1''''
·1
.::. I . ' i
!---,.:
-
b.:: 61,5
Entsprechend erhält man
P(X<a)~0,025 _
.....
a~38,5
(Diese Ergebnisse kann man auch mit Tabelle 6 ermitteln, wenn man nicht die
Näherungsformel benutzen will.)
Die günstigste Entscheidungsregel lautet für n=200:
Ho nicht verwerfen .. 3~X~62
o
0,1
0$
o,S"
1
P
b) Entscheidungsregel (1):
P(Fehler 1. Art) = Pp=0,25(X<20UX>30)
= B(100;0,25;19)+(l-B(100;0,25;30))
"" 0,203
Pp=0,2(Fehler 2. Art) = Pp=0,2(2~X~30) "" 0,534
Pp=0,3(Fehler 2. Art) = Pp=0,3(2~X~30) "" 0,540
Entscheidungsregel (2) entsprechend:
P(Fehler 1. Art) "" 0,049
Pp=0,2(Fehler 2. Art) "" 0,B07
Pp=0,3(Fehler 2. Art) "" 0,77B
Bei Entscheidungsregel (2) ist ein Fehler 1. Art unwahrscheinlicher als bei Entscheidungsregel (1), dafür aber ein Fehler 2. Art in einer größeren Umgebung
von p=0,25 wesentlich wahrscheinlicher.
c) Geht man davon aus, daß der Graph der Gütefunktion praktisch achsensymmetrisch
zur Geraden mit p=O,25 ist (jedenfalls für große Werte von n), so ist die
n=1000: P(X>b) < 0,025 .. ~(b-1000'0,25+o,5) .:: 0,975
--v'lOOO.O,25·0,75
-
b .:: 276,3
P(X<a) ~ 0,025 . . . , . . . a ~ 223,7
Die günstigste Entscheidungsregel lautet für n=1000:
Ho nicht verwerfen .. 223<X<277
-d) n=200:
P -0 2(Fehler 2. Art) = B(200;0,2;62)-B(200;0,2;37) "" 0,665
- p-,
Pp=0,3(F~hler 2. Art) = B(200;0,3;62)-B(200;0,3;37) "" 0,653
n=1000: P -0 2(Fehler 2. Art) ""
p- ,
~(277-1000.0,2+o,5)
~
v'1000.0,2.Q,8
_
~(223-200-0,5)
~
vmr
"" ~(6,13) - ,J(1,78)
"" 0,038
P -0 3(Fehler 2. Art) "" ~(277-300+0,5) _ ,J(?23-300-0,5)
p- ,
v'2ID
vmr
"" ~(-1,55) - ,J(-5,35)
= (1- ,J(1,55)) - (1- ,J(5,35))
"" 0,061
Für p=0,2 und p=0.3 (allgemeiner: in der Nähe von p=0,25) verringert sich bei Beibehaltung des 5 % - Signifikanzniveaus die Wahrscheinlichkeit für einen Fehler 2. Art
mit wachsendem n. Das bedeutet: Je mehr PKWs man auf dem Jahnplatz überprüft, umso
wahrscheinlicher ist es, daß man Fritzchens Behauptung zu Recht verwirft, wenn er sich
geirrt hat. Weicht p um mehr als etwa 5 %von 25 % ab, so irrt man sich bei einer
Stichprobe vom Umfang 1000 nur noch relativ selten.
- 43 -
- 42 -
VERTEILUNG DER GESCHLECHTER
von
I~
,
FAMILIEN
HEINZ KLAUS STRICK
t«.
r--
---
Um 1880 gab es in Sachsen 10690 Familien mit 12Kindern. Von den
insgesamt 128.280 Kindern waren 66299 Jungen (51,68~) und 61981
~1ädchen (48,32%). Die folgende Tabelle enthält die theoretische
2000
.--
--
und die empirische Geschlechterverteilung dieser Familien.
f--
Anzahl der
Jungen
Anzahl der
Mädchen
Wahrscheinlichkei t
0
12
0,00016
1
11
0,0021
Verteilung
empirische
Verteilung
1,7
6
22,2
29
theoretische
--
r--
2
10
0,0122
130,7
160
3
9
0,0436
466,1
521
4
8
0,1049
1121,7
1198
5
7
0,1796
1919,6
1821
6
6
0,2241
2395,2
2360
7
5
0,2054
2195,e
2033
8
4
0,1373
1467,S
1398
9
3
0,0653
697,7
799
10
2
0,0209
223,9
298
11
1
0,0041
43,5
60
°
0,00036
3,9
7
12
scheinlichkeit für eine
q=O,4~32 (Wahr-
~ädchengeburt),
X: Anzahl der Jungen in einer Familie mit 12 Kincarn,
P(X=k) =
(~2) pk q 12-k
Uahrscheinlichkei t fLir k Jungen in einer
Familie mit 12 Kindern
und
/"k
10690·P(X.k)
-f-r-f---
--
I--
0
..--F
4
Z.
3
It
s
,
"1
a
,
~
AO
44
~
,,2.
Wie man aus der letzten Spalte und der Abbildung entnimmt, ist die
Hierbei wurde mit dem Binomial-Ansatz gerechnet:
p=0,5168 (Wahrscheinlichkeit einer JungenQeburt),
-
AOOO
Abweichung der theoretischen Verteilung von der der Erhebung z.T.
2
beträchtlich: Eine Untersuchung mit Hilfe des X -Anpassungstest
zeigt,
da~
die Abweichung signifikant auf sehr hohem Niveau ist
(~;mp .. 99 ; p(X2~32,91) = 0,999).
Der Genetiker STERN bietet für die Verformung der empirischen Ver-
Erwartungswert der Anzahl der Familien mit
teilung (außen zu hoch, innen zu flach) eine Erklärung an: Man könne
k Jungen und 12-k fliicche"'.
sich die Verteilung entstanden denken als'Summe'von 2 (oder mehr)
- 4S
-
-
44 2
7-
P1
P2
0,53
0,5036
68,4
Binomialverteilungen. In der Bevölkerung gebe es 2 (oder meh~
0,54
0,4936
68,2
gleich große Gruppen von Familien mit 12 Kindern.
0,55
C,4836
44,6
Gruppe sei z.B. die Wahrscheinlichkeit für eine Jungengeburt
0,56
0,4736
25,7
P1 = 0,6168, in der anderen P2 = 0,4168 ; dann liegt im Mittel
In der einen
0,57
0,4636
20,3
eine Wahrscheinlichkeit von p = ~,5168 fUr eine Jungengeburt
0,58
0,4536
36,6
vor.
0,575
0,4586
25,2
0,565
0,4686
2C,8
0,4656
19,9
In der Tat stellt man an Beispielen fest,
daG die so konstruierte
0,568
Überlagerung zweier Binomialverteilungen c.egenüber der Verteilung
1
der zugehörigen 'mittleren' Erfolgswahrscheinlichkeit p = ~(P1+P2)
Der le-Wert der besten Anpassung liegt knapp unterhalb des
eine §hnlich geartete VerforIT,ung aufweist wie die des obigen
kritischen Werts zum 95%-Niveau (
Beispiels.
Man betrachte etwa das
P1 = 0,4 ;
p~
= 0,6
8e~spiel
; p =
~
p("X.2~
Eine Untersuchung der Anpassung zu einer
mit
( 0,4 + [,O )
0,':;
une
n
21,03)=0,95 )
!
'mittleren' Verteilung
von 3 Binomialverteilungen zeigt, da8 der kleinste zugehörige
12:
'X?-wert ebenfalls noch zwischen 19 und 20 liegt.
-12
( ~(X1=k)+P(X2=k)
)
k
P(X =!: )
1
P(X,=k)
°
0,0022
O,LOCC
0,G011
[,L.G[2
1
0,0174
0,0003
G,[UGS
0,0[;29
2
0,0639
C, oe 25
C,0332
0,0161
Aufgrund der gegebenen Daten ist keine 8ewertung des 5TERN-
P(X=k)
schen Modells möglich. Es wäre nützlich, wenn weitere empi-
1----------
3
0,1419
G,0125
0,0772
G,[537
4
0,2126
0,0420
0,1274
0,1208
5
0,2270
0,10G9
0,1 ii4['
0,.1934
6
0,1766
0,1766
0,1766
0,2256
7
0,1009
0,2270
C,154C
0,1934
8
0,0420
O,212f,
0,1274
9
0,0125
0,1419
C,[.772
10
C,0025
O,l63 c
LJ, [I] 3 2
11
0,UO('3
0,0174
C,LLE9
I 0,0029
I 12
,,
C,GGUJ
0,0[22
0, L'[ 11
0,0['[2
rische Daten über die Geschlechterverteilung vorlägen.
Literatur:
STERN:
Grundlagen der Humangenetik, Gustav-Fischer-Verlag,
Stuttgart, 1968
STRICK:
C,12U8
Einführung in die Beurteilende Statistik,
SChroedel-Verlag, Hannover, 19BO
(,0537
! (;,0161
?
WELCHER LESER KANN WEITERHELFEN
I!
,
Ergänzune zu: Verteilung der Geschlechter in Familien
')
Mit Hilfe eines Computers wurden nun solche Paare (P1
daß die Anpassung der theoretischen Verteilun9
2~
'
P2) gesucht,
die empirische
Geschlechterverteilung des Eincanosbeispiels besser wird.
Die Anpassung wurde mit Hilfe der GröGs
nachfolgende~Erg~nzlJno).
Werten von
X
X
r 8p,essen (vgl. die
l
Einir:e ~aarE (p, , P2~ mit den zugeh6rigen
sind in der folc8ilden Ta<:211e abgedruckt:
Zur Benutzunr; des 'X.~_Anpassungstests
Hat man einen n-stufigen Zufallsversuch vorliegen, bei dem auf
Stufe r
verscr,iedene Ausge.nge mö"lich sind, die mit den festen Wahr-
.
scheinlieh k elten P1'
Stufen
•••
jeder
P
2'
•••
,
P
r
auftreten,
}'1=n'P1-mal mit Ausgang rJr.1
dann kann man nach n
, P2=n·P2-mal mit Ausgang Nr.2
, /'r= n ·Pr- ma 1 mit Auso_ang Nr.r rechnen.
- 46 -
"l:-,aic
_r"'gen von
di8sen Erwartun~swerten
(u.
kann man mit :~ilfe
-k
\2
-'F2---2-"-
J42
der Gröl3s
+ •••
_Enn bE! einem konkreten Zufalls versuch k -mal Ausgang Nr.1,
1
~-mal ~usgang ~r.r auftritt •
.. ier;t ~~':r einen Zufallsversuch eine Hypotr18se über die zL!~runc!cliG­
snden c 1 '
~ncassung
Pr vor, dann deuten kleine \.]ierte von 'X,~ aur eine gute
••• ,
und große Werte auf eine schlechte Anpassunc des
~odells
:er Hycothese) hin.
~s
mag
~berraschend
erscheinen, da' es unter bestimmten Voraussetzungen
2
X gibt,
":'r nahezu beliebige P1' ••• 'Pr,n gemeinsame kritische Werte für
cie nur von r abhängen, dh. daß man für diese ~erte von P1, ••• ,Pr und
2
trotzdem dieselbe Tabelle von X verwenden kann !
~
Liegen in unserem Beispiel dem 10690-stufigen Zufallsversuch für die
13 m~clichen Ausgänge (0 Jungen, ••• ,12 Jungen) tatsächlich die Wahrscheinlichkeiten 0,00016; 0,OC21;
••• ; 0,CCC36 zugrunde (vgl. erste
Tabelle), dann erhält man mit der Wahrscheinlichkeit [,95 eine Realisierung mit einem :X?-wert, der kleiner oder gleich 21,[3 ist. Lediglich mit der Wahrscheinlichkeit 0,05 erh5lt man einen grjßeren Wert
für
Je.
(In 99,9% der Stichproben treten X?-Werte kleineric:leich
32,91 auf und nur in 0,1% der Stichproben treten zufällig crößere
~?-Werte
auf.)
(Im vorliegenden Beispiel wurd~ der Wert für p (=C,5168) aus der
Stichprobe geschätzt -
dadurch reduziert sich die Anzahl der Frei-
heitsgrade auf f=11. Die zugehörigen kritischen Werte von
zum 95~b-l'\liveau:
-x3
19,68 ; zum 9g,gi~-r-~iveau: 31,26.)
Literaturhinweis:
sn110::
Der Chiquadrat-Anpassuncstest 101 r'athematil,- und im
Biologieunterricht der Sekundarstufe 11,
~1NU
1981, Heft 3
(5. 13;-147)
sind:
- 47 -
BIBLIOGRAPHISCHE RUNDSCHAU
In diesem Heft bringen wir eine Auswahlbibliographie der bis Mai
1982
erschienenen Zeitschriftenaufsätze zum Thema Stochastik. Die Beiträge
sinf. alphRbetisch nach den Autoren angeordnet. Kurze Inhaltsbeschrei<"lOgen sollen den! Leser ein ·Urteil ermöglichen, ob die von uns ausgewGhlten Titel für seine Zwecke relevant sind.
ATHEn, H.: ';leitere Lotto-Probleme fUr den S II-Kursunterricht. In:
nrBxis der Mathematik v. 24(3) s. ?2-83 (März 1982).
- Unter dem Titel Ratewahrsch~inlichkeit und die Auszahlungsquoten
wird im 1. Abschnitt thanretisch das Quotenproblem gelöst. Im 2. Ab"chrdtt werden praktische Anwendungen behandelt,z.B. die Frage nach
den Zahlenkombinationen, nie eine~ Sryieler im Gewinnfalle die
höchsten Quoten einbrin,en. Vnn. Erfahrungswerten ausgehend, daß das
Ankreuzverhalten der Tip~er wahrscheinlich viel weniger konstant ist,
alF allc~~ein a~genornmer wird, werden Versuche der empirischen Ermittlunf der AnkreuzhäufigKeiten unternommen.
BAUf.1ANN, R.: Stocha~tik Mi ttels Computer. In: Lehrmittel aktuell v. 8( 2)
q (1032).
- Sir.lUla ti on des "Bornoulli schen Versuchsschemas" •
s.
;:'.AUMA~IK,
R.: Stochastik-Grundkurs mit Computer. In: Lehrmi ttel aktuell v.
(1) S. 12 ff. (19il?).
-Kursziel ist die Entwicklun! von Verfahren und eine Theorie für
ratioT!ale Entscheidungen bei Unge'1ißhei t (mi t COMputerunterstützung) •
DING~S,
8
H.: Deskrintive Statistik für die Mittelstufe (Vorschlag eines
In: Der Mathematiku~60~"ich· v. 28(1) S. 5-27 (1982).
Ent.wurf eines Gesamt~lans für die deskriptive StRtistik in der Mittelstufe. Inhelt: Anordnung einer Zahlenpopulation, Mitt~lwerte, Verteilunzr~unktion sowie graphische Bestimmung von Mittelwerten, der
"richtige" L""',":,ar"metpr, Konzf'ntration von Datenmengen, Darstellungsf"r",en, ",t;ickFf'i~e lineare Funlrtionen und Quantile. Streuungsparameter,
7,pr r~et~~~Rtik der rni -ttleren rJl!~dratischen A'b .."eichung. Die Ausfüh~lln~p~ l"pn~e~ ~irh an lQhre~; sie sind aus B~mUhungen um Lehrerfortbi~dunr he~~~~ ~nt~t~ndp~. Die vorgestellten Projekte sind nicht alF
~et~odipch~ H~1f~~ kn~=iniert, ~ondern ~ie sollten vielmehr Unter;ir:!:t5-f"p.lr~p.!, :=!b<:'"tp(':-:~-::.~ "e~chr- stochastische Ar~'Jrne~tation erfordern,
~!~O nirtt ~urch eine rn3ttp-qti~c~e Formel erledi~t wprden kBnnen.
Gosa~tplans).
- 48 _
EN~EL, A.: Statistik auf der Schule: Ideen und Beispiele aus neuerer
Ze~t. In: Der Mathematikunterricht v. 28(1) S. 57-85 (1982).
- Dieser Beitrag enthält Beispiele zur Sammlung, Beschreibung und
Deutung von Daten. Es sind durchweg neuere Beispiele mit echten
Daten. Ihre Behandlung erfordert nur geringe Kenntnisse, wenn ein
Rechner zur Verfügung steht. Sie zeigen, daß die Statistik
wichtige Probleme behandelt und damit auch interessante Fragen.
Inhalt: Beispiele zur Datenanalyse, Planung von Experi menten.
GNANADESIKAN, J.R.; KETTERING, P.A.; SIEGEL, A.F.: Themen aus der
Datenana~yse: Begriffe, Methoden, Beispiele und Pädagogik. In: Der
Mathemat~kunterricht v. 28(1) s. 28-56 (1982).
- D~e ~eschreibende Statistik hat sich durch eine Grunpe von Stat~st~kern der Bell-Laboratorien, USA, in den letzten Jahren gewaltig an Umfang und Tiefe ausgedehnt. Für diese Fortentwicklung
der be~chreibenden Statistik wurde der Name Explorle.tory Data
Analys~s (EDA) geprägt. EDA ist graphische und numerische Detektivarbeit: das Aufspüren von Fingerzeigen in Daten, um wichtige
Zusammenhänge und Strukturen zu erkennen. Die wichtigsten Begriffe
von EDA werden in diesem Beitrag durch 3 Themen illustriert:
graphische Methoden zur anschaulichen Darstellung von Daten,
robuste.M~thoden. zur Zusammenfassung von Daten unter Absicherung
gegen e~n~ge wen~ge ausgefallene Beobachtungen und Klumpungsmethoden zur Zerlegung einer Menge von Daten in natürliche Gruppen.
Eine kommentierte Liste von Literaturhinweisen soll helfen weitere
Einzelheiten zu verfolgen.
'
KICK, Th. H.: Das Problem der unechten Münzen. In: MNU v. 35(1)
23-26 (Jan. 1982).
- Es werden einige Verfahren vorgestellt und deren Optimierung besprochen, die teilweise überdies eine praktische Anwendung gefunden haben.
s.
LEHMANN, E.: Markow-Ketten in der Sekundarstufe I. In: MNU v. 34(8)
S. 460 ff. (Dez. 1981).
- Es wird über Inhalte einer Unterrichtseinheit von etwa 10 Stunden
berichtet, die in Klasse 10 erprobt wurde. Der Beitrag ist bewußt
weitgehend ohne Verwendung wahrscheinlichkeitstheoretischer Begriffe formuliert, um verschiedene Einsatzmöglichkeiten im Bereich
der Sekundarstufe I auch ohne Kenntnisse aus der Wahrscheinlichkeitsrechnung aUfzuzeigen. Man kann jedoch jederzeit zur Sprache
der Wahrscheinlichkeitsrechnung übergehen.
- 49
MOLDENHAUER, J.; SILL, H.-D.: Zur methodischen Gestaltung des Unterrichts in der AG(R) "Elementare Statistik" (Teil 4). In: Mathematik in
der Schule v. 20(1) S. 301-304 (1982).
- Im Teil 4 werden zur Behandlung der Streuungsmaße und zum Thema
Untersuchung zweier Merkmale auf Korrelation inhaltliche und
~ethodische Hinweise für die Gestaltung des Unterrichts gegeben.
PEHL, K.: Signifikanztest bei zusammengesetzten Alternativen. In:
Lernzielorientierter Unterricht Heft 1/1982 S. 23-38.
- Fachdidaktischer Beitr~g zur Fortbildung für Lehrer, der sich
auch Problemen des Kurs- bzw. Schulalltags widmen will. Dabei wird
auf Erfahrun~en aus einem Volkshochschulkurs schließende Statistik
sowie einem ~rientierenden allgemeinen Einführungskurs Statistik
an der Frankfurter Volkshochschule zurückgegriffen.
RIEHL, G.: Elementare Behandlung genetischer Probleme im StochastikUnterricht mit Hilfe von Graphen. In: Didaktik der Mathematik v. 10(1)
s. 25 ff. (1982).
- Es wird das Gesetz von Hardy-Weinberg auf einfache Weise hergelei tet.
STRICK, H.K.: Parameterfreie Verfahren im Stochastik-Unterricht. In:
HNU v. 35 (3) S. 138 ff. (1982).
- Viele statistische Fragestellungen lassen sich wegm der Gültigkeit
des zentralen Grenzw~rtsatzes mit Hilfe der Normalverteilung behandeln. Hat man es jedoch mit Stichproben zu tun, über deren zugehörige Verteilung keine Informationen vorliegen und bei denen
wegen des geringen Stichprobenumfangs keine Approximation durch
eine NQrmalverteilung möglich ist, so bieten sich für das Problem
des Vergleichs zweier Stichproben die sogenannten nichtparametrischen
oder parameterfreien Verfahren an, die in diesem Beitrag näher
beschrieben werden.
Lehrbücher der Wahrscheinlichkeitsrechnung und Statistik für die S 11.
Im Analysenteil des ZDM 2/82 wurden sämtliche Stochastikschulbücher
der Sekundarstufe 11 rezensiert. Entgegen der üblichen Praxis im ZDM
gibt es diesmal keine Einzelrezension der Unterrichtswerke,sondern
es ging um die vergleichende Rezension von Schulbüchern unter bestimmten Aspekten. Diese Aspekte sind:
1. l'ahrsch"inlichkei t und Entwicklungsperspektive.
2. Anwendungsorientiertheit der Stochastik - die Rolle der
MOLDENHAUER, J.; SILL, H.-D.: Zur methodischen Gestaltung des Unterrichts in der AG(R) "Elementare Statistik" (Teil 3). In: Mathematik in
der Schule v. 20(1) s. 62-70 (1982).
Teil 1 ist erschienen in Math. Schule, Berlin 19 (1981) 10, s. 745763, Teil 2 in Math. Schule, Berlin 19 (1981) 12, S. 930-941. Im
Teil 3 werden zur Anfertigung und Beurteilung graphischer Darstellung und zur Behandlung der Mittelwerte inhaltliche und methodische
Hinweise für die Gestaltung des Unterrichts geg~ben.
Verwendunr~situationen.
3.
4.
r::;
(
Stochastik -
Si~ulation
- Tätigkeit.
und Mptawissen.
Di:f~re~~ie~l1!2E' i~ der gymnasialen Sekundarctufe II.
St.ocha.s'i\, ·.md Beruf: Berufsvorberei tung - Berufsausbildunp; Studienvorbpreitung.
WahrschRi~lichkeit
- so kna~!=,
Am S,,::luß der
~Ar~t--fassenden
40-sejti~er
Au~wp.,...tunc
d~r
A;.~Jyc(\'1
'"lira cer Vp~sucl, ei n 0"" '711_
"orliecen~en
~~z~n~ionen
g~~ebpr.
Hier soll aus einer vergleichenden Pe]"'spp.k.:ti~rp h€'ran-;
\"e"!'"r~~, kurz Hauptproblem~, ;:-rundlegennc. Defi7i"!:~ P0h.'';
v~r.r."u("ht
weitn~fUhrende
und die
DidB~tik
der
Tenrlen~en
Stochasti~
fUr den
Stnchaetikunte~rirht
r.>
rrcE'l ich ..
aufzuz~iS0n.
Biblir>graphische Angaben zu <).a. Ane.le's<'n: Lehrl-ikher iler 'w2hrschei~lichkeitsrechn~n~ und Stetistik fUr die S 11. In: Zertralblatt
fUr D~daktik der Mathematik t r . 14(2) S. F3-1C5 (A~riJ 19P?).
Zus.~",,,,png:estellt
'lon Gerherd Könü"
Karlsruhp.
- 51 -
R E ZEN S ION
HERBERT KUTTING:
'Didaktik der Wahrscheinlichkeitsrechnung',
ISBN 3-451-18583-0, Verlag Herder Freiburg im Breisgau 1981
Im 1. Kapitel werden "Gründe für die Behandlung der Wahrscheinlichkeitsrechnung im Schulunterricht" vorgestellt. Eine Vielzahl
von Beispielen, in denen - umgangssprachlich verwendet - Begriffe
aus der Wahrscheinlichkeitsrechnung und Statistik aUftauchen,
liefert einen Teil der Begründung. Ergänzt durch eine stattliche
Anzahl nmathematischer Begründungen" für die Behandlung im Unterricht wird die Frage nach dem "Warum Wahrscheinlichkeitsrechnung"
sicher ausreichend beantwortet, obwohl sie vielleicht für den
interessierten Leser eigentlich keine mehr ist.
Im 2. Kapitel werden "Verschiedene Konzeptionen zur Einführung
des Wahrscheinlichkeitsbegriffs" vorgestellt. Es werden zwei
grundsätzlich verschiedene Ansätze aufgezeigt: der nicht-axiomatische - in drei verscniederien Ausprägungen, nämlich Zugang über
klassische Wahrscheinlichkeit, über relative Häufigkeit und
über geometrische Wahrscheinlichkeit - und der axiomatische
Ansatz.
Das 3. Kapitel "Empirische Untersuchungen zur Entwicklung des
Zufalls- und Wahrscheinlichkeitsbegriffs" bietet einen guten
Uberblick über Untersuchungen zu o.a. Thema. Damit gekoppelt
sind auch zahlreiche Hinweise zum Einsatz bzw. zum Beginn
einer Behandlung des Themas in der Schule. Speziell für den an
dieser Frage interessierten Leser bietet das Literaturverzeichnis
im Anhang viel nFortsetzungslektüre" an.
Im 4. Kapitel nSpezielle Fragen und Probleme - für den Schulunterricht formuliert und gelöst" wird es dann, wie in der Uberschrift
angekündigt, konkret unterrichtspraktisch. In 25 Beispielen verschiedenen Schwierigkeitsgrades werden Probleme aus der Wahrscheinlichkeitsrechnung vorgestellt und gelöst. Die Probleme
sind sehr geschickt ausgewählt, so daß nahezu alle besonderen
Tücken und Schwierigkeiten der Wahrscheinlichkeitsrechnung
sozusagen en passant angesprochen werden.
- 53 - 52
-
Das 5. Kapitel "Die Wahrscheinlichkeitsrechnung im Schulunterricht" ist wohl als das zentrale Kapitel des Buches anzusehen,
was sich schon in seinem Umfang ausdrückt. Es ist fast so lang
(wahrscheinlichkeitstheoretische Fragestellungen ergeben sich
dann aus entsprechenden statistischen Problemen), weitgehend
unberÜCksichtigt.
Ausgehend von den Uberlegungen zum Stoffplan werden dann unter
wie die vier vorangehenden Abschnitte.
:vier Gesichtspunkten "Anregllngen für die unterrichtliche Arbeit"
Nach einer kurzen Einführung und einem ebenfalls knappen histori-
gegeben. Und zwar sind dies
schen Abriß über die Wahrscheinlichkeitsrechnung in der Schule
Bereiche "Zufallsexperimente - Ergebnismengen - Ereignisse -
folgen ausführliche "Uberlegungen zu einem Stoffplan in der
Wahrscheinlichkeiten", "Die Entfaltung kombinatorischen
Primarstufe und Sekundarstufe I"
etwa gleichgewichtig die drei
Denkens" und "Rechnen mit Wahrscheinlichkeiten". Etwas
knapper wird das Thema "Simulation und Monte-Carlo-Methode"
Der Autor spricht sich eindeutig für eine Behandlung bzw. für
ein Sammeln erster Erfahrungen zur Stochastik in der Grundschule
aus, wie es auch bereits in vielen Lehrplänen vorgesehen ist.
Allerdings geht es nicht um eine systematische Behandlung; hierzu
ein Zitat: "Es handelt sich um situationsbezogene Aktivitäten
(Spiele), die sich im wesentlichen auf die folgenden ProblemfeIder beziehen:
behandelt. Diese Anschnitte sind mit Sicherheit für den nach
praktischer Anregung suchenden Leser (Lehrer) die ergiebigsten
des Buches. Zusätzlich zu den auch hier wieder zahlreichen praktischen Beispielen werden Schulbücher zitiert und viele unterrichtspraktisch wertvolle Informationen und Hinweise gegeben.
Auch mögliche Unterrichtssequenzen werden aufgezeigt und teilweise ausgeführt.
- qualitative Erörterung von Zufallsphänomenen,
- Lösung kombinatorischer Probleme, besonders im Zusammenhang mit
der Behandlung der MUltiplikation (kartesisches Produkt),
1. Das Buch besticht durch seine zahlreichen ausführlich dar-
- die Berechnung der Anzahlen der möglichen und günstigen
Ergebnisse einfacher Zufallsversuche und das
Ve~gleichen
Zusammenfassung
gestellten Beispiele mit Lösungen und den ausgezeichneten
von
Anhang, der einen sehr guten Uberblick über die Literatur
Eintrittschancen(Wahrscheinlichkeiten) zufälliger Ereignisse,
zum Thema - angefangen bei Zeitschriftenartikeln bis hin
ohne explizit die Bruchrechnung zu verwenden,
zu Schulbüchern - bietet.
- das Erstellen von Baumdiagrammen, Strichlisten und Tabellen.
Die Sprache ergibt sich aus den Problemen, die Lösungen können
2. Die Trennung in eine "Didaktik der Wahrscheinlichkeitsrechnung"
und eine "Didaktik der Statistik" erscheint vor dem Hinter-
experimentell vorbereitet und gefunden und in der ikonischen
grund der schulischen und mathematischen Realität wenig
Repräsentationsebene dargestellt werden".
motiviert, bisweilen führt sie gar zu künstlichen Einschränkungen und Trennungsversuchen.
Der vorn Autor für die Sek. I angegebene Stoffkanon bewegt sich
im Rahmen dessen, was in neueren Lehrplänen (z.B. NRW und
Niedersachsen) vorgesehen ist und trägt eindeutig gymnasialen
Zuschnitt. Speziell hieran wird deutlich, wie schwierig es ist,
Wahrscheinlichkeitsrechnung und Statistik für die Schule aus-
3. Der mit der Wahrscheinlichkeitsrechnung und ihrer Anwendung
im Schulunterricht bereits weitgehend vertraute Leser wird
in diesem Buch nicht sehr viel Neues finden, während es
andererseits als Einstieg in dieses Thema gut geeignet ist.
einanderzudividieren. Bei der vorn Autor gewählten Thementrennung bleibt leider die aktuelle Diskussion, ob speziell
in der Hauptschule eigentlich nur Statistik zu behandeln sei
Jürgen Grimm
VERLUST
GEWINN
START
4
•
5
10
15
20
s::
.....(1)
1-1
(1)
Ul
Ul
..c:u
25
:::l1
Ul
1-1
(1)
:>
1-1
30
(1)
'0
(1)
8'
35 ~
40
45
50
o
10
20
30
40
50
Gewinnanteil
0%
20%
40%
60%
80%
100%
1-1
(1)
'0
.j..I
.....
(1)
~
t:J'I
.....
Ij..j
::s
:rtl
:=
Bild 2
Aufzeichnungsblatt mit
90%-V~rtrauensintervall
für p
s::(1)
.....
1-1
(1)
Ul
Ul
.a
u::s
Ul
1-4
(1)
:>
o
0
dP
I\J
->
0
0
dP
fi
;J::I
s::
Hl
N
CD
",.
I\J
0
0
dP
1-'()
::r
CJ)
::s
s::
::s
8
;J::I
:::0
8
IQ
rn
0'
......
PI
rt
0"1
W
0
0
dP
rt
1~
Gl
CD
~
Z
1-'-
CX>
0
dP
::s
::s
PI
::s
",.
0
rt
CD
1-'-
I-'
->
0
0
dP
Häufigkeit der
Versuchsserien
U1
0
I
U1
0
I
",.
",.
w
W
U1
0
U1
0
I
I
I\J
U1
I\J
->
->
0
U1
0
Länge der Versuchs serien
U1
Zugehörige Unterlagen
Herunterladen