Galton

Werbung
1
Statistik
1. Wahrscheinlichkeitstheorie.................................................................... 2
1.1. Bernoulli-Experimente......................................................................... 2
1.2. Binomial-Verteilung ............................................................................. 2
1.3. Absolute- und Relative- Häufigkeiten................................................ 5
1.4. Mittelwert (Erwartungswert) ............................................................... 7
1.5. Normalverteilung (Gaußverteilung) ................................................... 9
1.6. Poisson-Verteilung ............................................................................11
1.7. Chi-Quadrat-Test ( χ² - Test ) ..........................................................13
2. Experimente ............................................................................................16
2.1 Galton-Brett .........................................................................................16
2.2. Radioaktiver Zerfall ...........................................................................21
2.3. Ehrenfest'sches Spiel: "Gleichgewicht" ..........................................22
2.4. Unkontrollierter Schwankungsvorgang ...........................................26
2.5. Unkontrollierter Schwankungsvorgang mit Wechselwirkung .......28
2.6. Alles oder Nichts................................................................................29
2.7. Computersimulation des Chemischen Gleichgewichts .................30
3. Anhang.....................................................................................................32
2
1. WAHRSCHEINLICHKEITSTHEORIE
1.1. Bernoulli-Experimente
Zufallsexperimente mit nur 2 verschieden möglichen Ausgängen (Ergebnissen) führen zur
Binomial-Verteilungen.
Bei einem solchen Experiment tritt ein Ereignis A (Erfolg) mit der Wahrscheinlichkeit p und
das zu A komplementäre Ereignis B (Misserfolg) mit der Wahrscheinlichkeit q = 1 – p
ein. Dies gilt auch für jede Wiederholung des Experimentes d. h. das Ereignis A tritt bei
jeder Durchführung des Experimentes mit der gleichen und somit konstanten
Wahrscheinlichkeit p ein.
Man bezeichnet ein Experiment dieser Art, bei der nur 2 verschiedene sich gegenseitig
ausschließende Ereignisse mit konstanter Wahrscheinlichkeit eintreten können, als BernoulliExperimente.
§ Beispiel
Beim Wurf einer homogenen Münze sind nur die beiden sich gegenseitig ausschließende
Ergebnisse
A : Zahl und B : Kopf
möglich. Sie treten bei jedem Wurf mit der Wahrscheinlichkeit
p = ½ und q = ½
auf.
1.2. Binomial-Verteilung
Bei einem Mehrstufigen-Experiment, dass aus einer N-fachen Ausführung eines BernoulliExperiments mit den 2 möglichen Ereignisse A und B besteht, setzen wir voraus, dass das
Ereignis A in jeden der N Teilexperimente mit der gleichen Wahrscheinlichkeit
p(A) = const. = p
eintritt und die Ergebnisse der einzelnen Stufen voneinander unabhängig sind.
Betrachten wir z.B. den Wurf eines Satzes von N Münzen, was einem N-stufigenBernoulli-Experiment entspricht. Beim Wurf jeder einzelnen Münze sind nur 2 Ergebnisse
möglich, daher werden beim Werfen eines Satzes von N Münzen
2 ⋅ 2 ⋅ 2L2 = 2 N
Ergebnisse möglich sein von denen eines tatsächlich auftritt.
Die Wahrscheinlichkeit, dass eine beliebige Münze Zahl zeigt ist p, die Wahrscheinlichkeit,
dass sie Kopf zeigt ist q = 1 − p. Da alle Münzen unabhängig von einander sind können
wir die Wahrscheinlichkeit für das Auftreten einer bestimmten Verteilung (Konfiguration) bei
der n Münzen Zahl und n′ Kopf zeigen, durch den folgenden Ausdruck angeben:
3
w (n ) = p ⋅ p ⋅ q ⋅ p ⋅ q ⋅ p ⋅ q ⋅ p ⋅ q ⋅ q ⋅ q ⋅ p L
= ( p ⋅ p ⋅ ⋅ ⋅ p ) ⋅ (q ⋅ q L q ) = p n q N − n
14243 1424
3
(1)
n′ Faktoren
n Faktoren
wobei n′ = N − n ist.
Ein Zustand bei der n Münzen Zahl zeigen, kann jedoch normalerweise auf viele Arten
realisiert werden. Die alternativen Möglichkeiten für ein Beispiel mit 3 Münzen, von denen
2 Zahl zeigen, auf ein Feld mit 3 Stellen ist in folgender Tabelle aufgeführt.
(1)
Z1
Z2
Z1
Z2
K
K
(2)
Z2
Z1
K
K
Z1
Z2
(3)
K
K
Z2
Z1
Z2
Z1
n
n′
2
1
Tab. 1. In dieser Tabelle sind alle möglichen Anordnungen von N = 3 verschiedenen Münzen, von
denen n = 2 Zahl zeigen, aufgeführt. Die 2 Münzen, die Zahl zeigen, sind durch Z1 bzw. Z2
dargestellt. Die Wahrscheinlichkeit für jede Anordnung ist p²q. Wenn aber die Münzen identisch sind,
so sind Eintragungen, die sich nur durch die Indizes unterscheiden, äquivalent, d.h. die Tabelle enthält
also n! = 2! mal zu viel Eintragungen.
Bezeichnen wir die erste Münze die Zahl zeigt mit Z1 und die zweite mit Z2, so kann Z1
an N = 3 verschiedene Stellen des Feldes stehen. Bei jeder möglichen Platzierung von Z1
kann Z2 dann an jeden der N − 1 = 2 übrigen Stellen stehen. Die mögliche Anzahl von
eindeutigen Eintragungen erhalten wir wenn wir die Anzahl der möglichen Platzierungen von
Z1 und Z2 miteinander multiplizieren (siehe Abb. 1).
Die möglichen Anordnungen für n Münzen ist daher
N ( N − 1)( N − 2) L ( N − n + 1) =
=
N ( N − 1) ( N − 2) L ( N − n + 1) ( N − n) L 1
( N − n) L 1
N!
( N − n) !
Für 3 Münzen bei denen 2 Zahl zeigen ist folglich die Anzahl der Platzierungen gleich
3⋅2=6
oder mit der Formel
N!
3!
=
=6
( N − n) ! (3 − 2 )!
4
Abb. 1. Die möglichen Anordnungen von 3 Münzen von denen 2 Zahl und eine Kopf zeigen. Die
weißen Kreise symbolisieren die Münzen, die Zahl zeigen, und die grauen Kreise, die Münze, die Kopf
zeigt. Die erste Münze kann auf den 3 verschiedenen Stellen des Feldes verteilt werden (s. 1. Spalte).
Die zweite Münze kann auf den übrigen 2 Plätzen verteilt werden (s. 2. Spalte). Die letzte Münze die
Kopf zeigt kann auf einem Platz, der auf dem Feld übrig bleibt platziert werden (s. 3. Spalte). Somit ist
hier die Anzahl der verschiedenen Anordnungen gleich 3.2.1 = 6 . Man kann aber leicht erkennen,
wenn die Münzen 1 und 2 identisch sind, dass sich die Anzahl der verschiedenen Konfigurationen
von 6 auf 3 reduzieren.
Da alle Münzen identisch sind (nicht unterscheidbar) so ergibt jede Vertauschung von Z1
und Z2 keine neue Anordnung somit reduziert sich die Anzahl der Konfigurationen von 6
auf 3.
Da die Anzahl der möglichen Permutationen gleich n ! ist, ergibt sich für die Anzahl
möglicher Konfigurationen bei der n Münzen Zahl zeigen :
C (n ) =
N 
N!
=  
( N − n )! n !  n 
(2)
Die gesuchte Wahrscheinlichkeit P(n) , dass n Münzen Zahl zeigen erhalten wir in dem
wir die Wahrscheinlichkeiten w(n) bei der n Münzen Zahl zeigen summieren, d.h. , indem
wir C(n) mit w(n) multiplizieren (Gl.(1) und Gl.(2)). Wir erhalten somit:
P( n) =
N!
p n qN − n
( N − n) ! n!
(3)
Diese Wahrscheinlichkeitsverteilung wird Binomial-Verteilung genannt.
Wir können diese Gleichung auch als eine Funktion von n und n′ schreiben:
P( n , n ′) =
N ! n n′
p q
n ′! n !
(4)
Alle möglichen Anordnungen von 3 nicht unterscheidbaren Münzen und deren
Wahrscheinlichkeiten, die durch eine Binomial-Verteilung beschrieben werden, sind in der
folgenden Tabelle aufgeführt.
5
M(1)
Z
Z
Z
K
Z
K
K
K
M(2)
Z
Z
K
Z
K
Z
K
K
M(3)
Z
K
Z
Z
K
K
Z
K
n
3
n′
0
C(n)
1
P(n)
1/8
2
1
3
3/8
1
2
3
3/8
0
3
1
1/8
Tab. 2. Alle möglichen Verteilungen von 3 identischen symmetrischen Münzen. Münzen, die Zahl
zeigen sind mit Z, und die Kopf zeigen sind mit K bezeichnet. Die Anzahl der Ergebnisse mit Zahl ist
unter n und die mit Kopf ist unter n′ angegeben. Die Anzahl der möglichen Konfigurationen steht
unter C(n) . Die letzte Spalte gibt die Wahrscheinlichkeiten für das Auftreten jeder Konfiguration an.
1.3. Absolute- und Relative- Häufigkeiten
Wiederholt man ein Zufallsexperiment N mal (N Versuche) und tritt dabei das Ergebnis
x i genau M ( x i ) mal ein, so gilt definitionsgemäß:
Absolute Häufigkeit : M ( x i ) oder M x i
f ( xi ) =
Relative Häufigkeit :
M ( xi )
N
Die Summe aller absoluten Häufigkeiten ist gleich der Gesamtzahl der Versuche:
r
∑ M (x ) = N
i
,
i
wobei ( i→ r ) die Anzahl der verschiedenen Häufigkeitsklassen angibt.
Die Summe aller relativen Häufigkeiten ist gleich 1:
r
r
∑ f (x ) = ∑
M (x i )
i
=
N
i
i
N
=1
N
Mit zunehmender Anzahl N der Versuche werden sich die f ( xi ) Werte stabilisieren und
der theoretischen Wahrscheinlichkeit des Experimentes P ( xi ) annähern:
lim f ( xi ) = lim
N →∞
N→∞
M ( xi )
= P ( xi )
N
(5)
es gilt weiter :
r
∑P(x ) = 1
i
i
(6)
6
Bemerkung
Ein Zufallsexperiment kann aus einer Stufe oder mehreren Stufen N bestehen. Dagegen
bezeichnen wir hier mit N die Gesamtzahl der Versuche solcher Zufallsexperimente.
§ Beispiel
Bei 100 Würfen von 4 identischen und symmetrischen Münzen (4-stufiges Experiment) in
einem Versuch gab es folgende Ergebnisse:
M(n): M(0) = 8 ,
M(1) = 22 ,
M(2) =42 ,
M(3) = 18 ,
M(4) = 10
Mit M n = M (n) bezeichnen wir die Anzahl der Versuche mit dem Ergebnis n .
Beim Wurf von 4 Münzen erwarten wir nach der Theorie, folgende Wahrscheinlichkeiten
(theoretischen relativen Häufigkeiten):
P(n) : P(0) = 1/16 ,
P(1) = 4/16 ,
P(2) = 6/16 ,
P(3) = 4/16 ,
P(4) = 1/16
P(n)
6 /16
4 /16
1/16
0
0
1
2
3
4
Abb. 2 Binomialverteilung für N = 4
n
Münzen, wenn p = q = 1/2
Wahrscheinlichkeit P(n) , dass n Münzen Kopf zeigen, abgelesen werden.
ist. Aus der Abbildung kann die
Mit N = 100 als die Gesamtzahl der Versuche, können wir schreiben:
M0 + M1 + M 2 + M 3 + M 4 = N
8 + 22 + 42 + 18 + 10 = 100
.
Dividiert man beide Seiten dieser Gleichung durch N so erhält man:
M 0 M1
M2
M3 M 4
8
22
42
18
10
+
+
+
+
=
+
+
+
+
=1
N
N
N
N
N 100 100 100 100 100
wobei
liegen.
f ( n) =
Mn
N
die relativen Häufigkeiten
sind, deren Werte zwischen 0 und 1
Mit zunehmender Anzahl der Versuche (N → ∞) werden sich die Werte
stabilisieren und der theoretischen Wahrscheinlichkeit P(n) annähern.
für f (n)
7
1.4. Mittelwert (Erwartungswert)
Der Mittelwert für N Messungen mit den Messwerten
x1 , x2 , K , xN
ist
x =
x1 + x2 + K + x N
N
=
N
xi
∑N
i =1
Man kann den Mittelwert der Zufallsvariablen
ausrechnen
r
x =
∑x
i
M (x i )
i
∑ M (x )
r
=
1
N
N
∑x
(7)
i
i =1
x auch mit den relativen Häufigkeiten
M (x i )
r
∑x
=
i
i
i
(8)
N
i
Definition des Mittelwertes
Der Mittelwert der Zufallsvariable x mit der Wahrscheinlichkeit P(x) ist:
x =
∑ x P (x )
r
i
(9)
i
i
§ Beispiel
Durchschnittsnote einer Klasse mit 10 Studenten: Anhand folgender Tabellen bestimmen wir
den Mittelwert der Noten (Durchschnittsnote).
i
Note
x
1
1,3
2
2
3
3,3
4
2,7
5
3,3
6
1,3
7
4
8
4
9
2,7
10 3,3
x =
N =10
∑
i =1
oder
xi
N
=
i
oder
⇔
1 N =10
1
x i = ⋅ 27,9 = 2,79
∑
10 i = 1
10
1
2
3
4
5
Note x
1,3
2
2,7
3,3
4
Anzahl
von
Studenten M
2
1
2
3
2
8
r =5
∑ x ⋅M
i =1
r =5
x =
i
r=5
xi
∑ M xi
∑x
i =1
=
i
⋅ Mxi
r =5
∑
=
N
i =1
xi
M xi
N
i =1
= (1,3 ⋅
1
2
3
2
1
2
+ 2 ⋅ + 2,7 ⋅ + 3 ⋅ + 4 ⋅ ) =
⋅ 27,9 = 2,79
10
10
10
10
10
10
Definition der Varianz σ²
Die Varianz σ² ist der Erwartungswert der Zufallsvariable ( x −x )² , durch die die mittlere
quadratische Abweichung vom Mittelwert x beschreiben wird
σ =
2
∑ (x
2
r
i
) ⋅ P(x ) =
−x
i
x2 − x 2
(10)
i
Häufig wird die Standardabweichung σ als Streumaß verwendet. Sie beschreibt die mittlere
Abweichung der Zufallsvariable x vom Mittelwert x und hat die gleiche Dimension und
Einheit wie den Mittelwert.
Varianz der Stichprobe
Sind die Anzahl der Versuche N klein, so ist die Varianz gegeben durch:
N
σ
=
2
∑ (x
i
2
i
−x
)
(11)
N − 1
Für große N geht diese Formel in die o.g. Formel über
Beweis:
Da
M0 + M1 + K + M r = N
ist, gilt :
N
σ =
2
∑ (x
i
N
2
i
−x
)
≈
N − 1
∑ (x
i
2
i
−x
N
)
∑ M ⋅( x
2
r
=
i
i
−x
)
i
r
∑M
i
i
=
∑ (x
r
i
i − x ) ⋅
Mi
2
=
r
∑M
∑ (x
r
i
i
2
i − x ) ⋅ P (M i )
123
oder P (x i )
i
in der 1. Zeile wurde für große N die 1 im Nenner vernachlässigt.
9
1.5. Normalverteilung (Gaußverteilung)
Bei großen N (mit n = 0, 1, 2, … , N ) scheint die Berechnung der Formel für die BinomialVerteilung recht schwierig zu werden. Für den Fall, wenn p = q = 1/2 ist, können
gewisse Nährungsmethoden benutzt werden mit denen P(n) sich stark vereinfacht und durch
die Gauß-Verteilung beschrieben werden kann
P (n ) =
 [ n − n ]2 

exp  −
2 σ 2 
2π σ 2

1
(12)
wobei σ² = Npq die Varianz und n = Np der Mittelwert sind.
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Abb.3 Diese Grafik zeigt die Binomial-Verteilung für N = 30 und p = q = ½. Die Wahrscheinlichkeit
P(n) ist bei dem Mittelwert N/2 (n = 15) am höchsten.
0.14
0.04
0.12
0.03
0.08
PHnL
PH nL
0.1
0.06
0.02
0.04
0.01
0.02
0
0
0
5
10
15
n
20
25
30
0
50
100
150
n
200
250
300
Abb. 4 Gaußverteilungen für N = 30 bzw. N = 300. Man kann sehen, dass das Maximum beider
Kurven beim Mittelwert N/2 liegt. Für größere N wird das Maximum immer schärfer.
10
Mittelwert und Varianz einer Binomial-Verteilung und Gauß-Verteilung
Den Ausdruck für die Normal-Verteilung können wir zur Berechnung verschiedener
Mittelwerte heranziehen. Statt Summen ausrechnen zu müssen können wir das entsprechende
Integral auswerten. Da P(n) sich vom ganzzahligen Wert von n zum nächsten kaum ändert,
kann die Summe durch ein Integral ersetzt werden.
n=
∑ n ⋅ P(n ) ≈ ∫ n ⋅ P(n ) dn
n
+∞
=
∫
n⋅
−∞
 [ n − Np ]2 
1
 dn
exp  −

2
Npq
2π Npq


Zur Vereinfachung wurde der Integrationsbereich von −∞ bis + ∞ definiert. Das können
wir mit sehr guter Näherung tun, weil P(n) bei ausreichend großem ( n – Np ) ohnehin
vernachlässigbar gering wird.
Mit der Substitution y = n – Np und 1/(2Npq) = α folgt
1
2π Npq
n =
+∞
∫ ( y + Np ) ⋅ e
2
−∞

1

2π Npq 
=
(−α y ) dy
+∞
∫
y ⋅e
−α y 2

−α y 2
e
dy

∫
−∞

+∞
dy + Np
−∞


+∞

1
1 −α y 2
π 
e
+ Np

 −
2π Npq  2α
α 
−∞
144244
3


0
=
Das erste Integral ist aus Symmetriegründen gleich Null und das zweite Integral hat den Wert
√(π/α). Mit der Rücksubstitution erhalten wir dann
n =
1
Np 2π Npq
2π Npq
n = Np
Für die Varianz ergibt sich analog
σ2 =
∑ (n − n ) ⋅ P(n ) ≈ ∫ (n − n )
2
2
⋅ P (n ) dn
n
+∞
=
∫ (n − n )
2
−∞
= Npq
⋅
 [ n − Np ]2 
1
 dn
exp  −

2
Npq
2π Npq


11
1.6. Poisson-Verteilung
In vielen Anwendungen treten Ergebnisse von Bernoulli-Experimente sehr selten, d.h. mit
nur geringer Wahrscheinlichkeit auf . Ein Beispiel für ein solches Ergebnis liefert der
radioaktive Zerfall eines chemischen Elements, bei der die einzelnen Atomkerne mit einer
kleinen Wahrscheinlichkeit zerfallen d.h. die Anzahl der pro Sekunde zerfallenden
Atomkerne ist sehr gering im vergleich zur großen Anzahl der insgesamt vorhandenen Kerne.
Diese Ergebnisse die also relativ selten auftreten genügen der Poisson-Verteilung :
P (n ) =
λn − λ
e
n!
(n =
0, 1, 2 , K
)
(14)
λ gleich dem Mittelwert der Variable n ist.
wobei
Die Poisson-Verteilung lässt sich aus der Näherung für die Binomial-Verteilung, wenn die
Wahrscheinlichkeit der Erfolgsereignisse p sehr klein (p → 0) und die Anzahl der
Experimente sehr groß (N → ∞) sind, herleiten. Dabei wird vorausgesetzt, dass der Mittelwert
λ = N.p konstant bleibt (s. Anhang).
λ ist gleich dem Mittelwert der Variable n (λ = n )
Beweis
Nach der Definition des Mittelwertes gilt
n=
r
∑ n ⋅ P(n ) =
n=0
r
∑ n⋅
n=0
λn − λ
e
n!
Wenn wir die Summe auf den Bereich ∞ ausdehnen, ist der Fehler sehr klein, da P(n) für
große Werte von n vernachlässigbar klein wird
n =
∞
∑ n⋅
n=0
∞
λ n −λ
λn
e
= e −λ ∑ n ⋅
n!
n!
n=0
∞
∑ λn ⋅
= 0 + e −λ
n =1
= e
−λ
∞
∑
n =1
( j = n − 1)
=
n −1
n
= e −λ
n!
λ ⋅λ
= λ ⋅e − λ
(n − 1)!
λ ⋅e − λ
∞
∑
j=0
∞
1
∑ λ ⋅ (n − 1)!
n
n =1
λn − 1
(n − 1)!
∞
∑
n =1
λj
= λ ⋅e − λ ⋅ e
j!
λ
=λ
In der vorletzten Zeile wurde erst der Summenindex n
durch j + 1 ersetzt, und so stellt
die letzte Summe die Reihenentwicklung der Exponentialfunktion dar. Der Beweis kann auch
mit der Maximum-Likelihood-Methode durchgeführt werden (s. Anhang).
12
§ Beispiel
Beim radioaktiven Zerfall ist die Zufallsvariable n
(n = Anzahl der Atomkerne die in einem bestimmten Zeitintervall zerfallen)
Poisson-verteilt mit dem Parameter λ . Dieser gibt dabei an, wie viel Atomkerne
durchschnittlich pro Sekunde zerfallen.
Bei einem speziellen Präparat zerfallen im Mittel pro Minute 3 Kerne.
Wie groß ist die Wahrscheinlichkeit dafür, mit einem Zählgerät mehr als 3 Zerfälle pro
Minute zu registrieren ?
Im Mittel zerfallen pro Minute 3 Atomkerne. Somit ist
λ = 3 und die
Wahrscheinlichkeitsfunktion der Poisson-verteilten Zufallsvariablen n lautet daher:
3n −3
e
(n = 0, 1, 2, K )
n!
Die Wahrscheinlichkeit für das Ereignis n > 3 ist:
 30 − 3
32 − 3 33 − 3 
31 − 3
e 
e +
e +
e +
P (n > 3) = 1 − 
3
!
2
!
1
!
0
!


P (n ) =
= 1 − [1 + 3 + 4,5 + 4,5 ]e − 3
P(n)
0.2
0.15
0.1
0.05
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
n
Abb. 5. Die Poissonverteilung P(n) als Funktion von n für den Mittelwert λ = 3.
13
1.7. Chi-Quadrat-Test ( χ² - Test )
Der Experimentator hat die Vermutung, dass die ermittelten Häufigkeiten bestimmter
Ereignisse in einem Experiment einer bestimmten Verteilung (z.B. Gaußverteilung,
Binomialverteilung, Poissonverteilung , …) gehorchen. Der χ² - Test dient zur Überprüfung
dieser Hypothese.
Seien
M nth = N ⋅ P (n )
mit N als die Gesamtzahl der Versuche die nach der angenommenen Verteilung P(n)
erwarteten Häufigkeiten, und
Mn
die experimentell aufgetretenen Häufigkeiten. Dann stellt die Größe χ² ein Maß für die
Abweichung zwischen den experimentellen und den erwarteten Häufigkeiten dar:
χ =
2
0
r
∑
n
(M
− M nth )
M nth
2
n
(15)
wobei ( n → r ) die Anzahl der verschiedenen Häufigkeiten angibt.
Planung und Durchführung des Chi-Quadrat-Tests
1. Man stellt die Hypothese auf, dass die experimentellen Ergebnisse einer gewissen
Verteilung P(n) gehorchen, die durch die Physik des Experiments nahegelegt wird.
2. Die aufgrund der Hypothese erwarteten Häufigkeiten (theoretischen Häufigkeiten)
M nth = N ⋅ P (n ) werden berechnet.
3. Aus den theoretisch berechneten Häufigkeiten
M nth und den experimentell
ermittelten Häufigkeiten M n wird χ 02 berechnet.
4. Man legt eine kleine Signifikanz-Zahl α fest (in der Praxis meist α= 0,01 oder α =
0,05) und bestimmt dann eine kritische Grenze c ,so haben die Werte von χ² , die
unterhalb dieser kritischen Grenze liegen, die Wahrscheinlichkeit 1 − α . Somit gilt :
P(χ² ≤ c) = 1 − α
Die kritische Grenze c teilt dabei das Intervall χ² ≥ 0 in einen nicht-kritischen
und einen kritischen bereich und lässt sich mit Hilfe der Tabelle der Chi-QuadratVerteilung leicht bestimmen.
5. Man ermittelt die Zahl der Freiheitsgrade f = t – s – 1 , wobei t die Anzahl der
verschiedenen Häufigkeitsklassen und s die Zahl der unbekannten Parameter in der
Verteilungsfunktion P(n) angibt. Die Zahl der Freiheitsgrade wird noch um eines
verringert, weil die einschränkende Bedingung
r
∑M
n
=N
n
besteht.
14
6. Man vergleicht den sich aus den experimentellen Daten ergebenden χ 02 -Wert mit
dem Wert χα2 = c , den man für den gewählten Wert von α und den sich
ergebenden Wert für die Freiheitsgrade f von der Tabelle im Anhang entnimmt.
7. Schlussfolgerung: Liegt der berechnete Test- oder Prüfwert
χ 02 unterhalb der
kritischen Grenze c ,d.h. gilt χ 02 ≤ χ α2 = c , so wird die Hypothese angenommen,
ansonsten zugunsten einer anderen Hypothese abgelehnt. Die gewählte
Signifikantzahl
α
ist dabei die Irrtumswahrscheinlichkeit,
d.h. die
Wahrscheinlichkeit dafür, eine an sich richtige Hypothese abzulehnen.
Anmerkung
Sind ein oder mehrere Parameter in der Verteilungsfunktion unbekannt, so muss zunächst der
Näherungswert dieser Parameter bestimmt werden (z. B. mit Hilfe der Maximum-LikelihoodMethode s. Anhang).
f(χ²)
cc
Abb. 6 Verlauf der normierten Dichtefunktion einer Chi-Qudrat-Verteilung. Die Fläche unter der
Funktion f(χ²) ist gleich 1. Rechts von c liegt der kritische Bereich. Die Fläche unter der Kurve ist
von 0 bis c gleich 1 − α und von c bis ∞ gleich α. (Quelle: Prof. Uchii’s Page Kyoto University 2001)
15
§ Beispiel
Ein Experimentator erhielt bei N = 1200 Würfen mit einem homogenen Würfel folgende
Ergebnisse (Häufigkeitsverteilung der 6 möglichen Augenzahlen):
Augenzahl n
Absolute Häufigkeit M
1
190
2
180
3
205
4
210
5
195
6
220
Mit dem Chi-Quadrat-Test soll nun überprüft werden, ob die Hypothese, dass alle
möglichen Augenzahlen gleichwahrscheinlicht sind, angenommen werden kann.
1.
6
Nach unsere Annahme sind alle Augenzahlen gleich. Somit ist:
P(n) = 1/6 (für n = 1, 2, … ,6)
2. Die Theoretischen Häufigkeiten sind:
1
M nth = N ⋅ P (n ) = 1200 ⋅ = 200 (für n = 1, 2, … ,6)
6
3. Aus den theoretisch berechneten Häufigkeiten und den experimentell ermittelten
Häufigkeiten aus der Tabelle wird χ 02 berechnet.
χ =
2
0
r =6
∑
n =1
=
(M
− M nth )
M nth
2
n
100 400 25 100 25 400
+
+
+
+
+
= 5,25
200 200 200 200 200 200
4. Als Signifikanz-Zahl α (Irrtumswahrscheinlichkeit) wählen wir α = 0,05 .
5.
Die Verteilungsfunktion P(n) = 1/6 enthält keine Parameter. Folglich ist die Zahl
der Freiheitsgrade gleich:
f =t–s–1= 6–0–1 =5
6. Aus der Tabelle im Anhang erhält man mit f = 5 und α = 0,05 für die kritische
Grenze:
c = χα2 = 11,07
(
) (
)
χ 02 = 5,25 ≤ χα2 = 11,07 ist, so ist das experimentelle Ergebnis unter
7. Da
Berücksichtigung der gewählten Signifikanz-Zahl mit der gewählten Hypothese
verträglich.
16
2. Experimente
2.1 Galton-Brett
Das Galtonbrett besteht aus einer regelmäßigen Anordnung von Hindernissen (Stufen), an
denen eine Kugel jeweils nach rechts oder links abprallen kann. Nach dem Passieren der
Hindernisse werden die Kugeln in Behältern aufgefangen.
Das Brett ist so konstruiert, dass die Ablenkungen, die die Kugel von den einzelnen
Hindernissen nach rechts oder links erfährt, nicht davon beeinflusst werden, ob sie an dem
vorhergehenden Hindernis nach rechts oder links abgelenkt worden ist.
Bei jedem Aufprall einer Kugel an einem Hindernis gibt es 2 Ergebnisse:
Ablenkung nach rechts ( X = r )
Ablenkung nach links ( X = l )
Ist das Brett symmetrisch aufgestellt so gilt:
Wahrscheinlichkeit für Ablenkung nach rechts p = ½
Wahrscheinlichkeit für Ablenkung nach links q = ½
Ist das Brett unsymmetrisch aufgestellt so ist p ≠ ½ und natürlich weiterhin q = 1 – p.
Abb. 7. Die Abbildung zeigt ein Galton-Brett mit 4 Stufen und 5 Behältern. (Quelle: Wikipedia.org)
Anhand eines Beispiels diskutieren wir das Problem, wie eine Kugel in einem symmetrischen
Brett mit 4 wagerechten Reihen von Hindernissen in einen bestimmten Behälter fällt.
§
Es gibt nur ″eine″ Möglichkeit (einen Weg), dass eine Kugel in den ersten Behälter
(Nr. 0) fällt. Die Kugel muss auf jeder Stufe nach links ablenkt werden:
(l, l, l, l)
§
Es gibt 4 verschiedene Wege für die Kugel um in den zweiten Behälter (Nr. 1)
zu gelangen. Die Kugel muss einmal nach rechts und 3 mal nach links abprallen:
(r, l, l, l) , (l, r, l, l) , (l, l, r, l) , (l, l, l, r)
17
§
Es gibt 6 verschiedene Möglichkeiten um in den dritten Behälter (Nr. 2)
zu gelangen. Die Kugel muss 2 mal nach rechts und 2 mal nach links
abgelenkt werden:
(r, r, l, l) , (l, r, r, l) , (l, l, r, r) , (l, r, l, r) , (r, l, r, l) , (r, l, l, r)
§
Es gibt 4 Wege um in den vierten Behälter (Nr. 3) zu gelangen.
§
Es gibt nur ″einen″ Weg um in den fünften Behälter (Nr. 4) zu gelangen.
Insgesamt sind es also 16 verschiedene Wege, die alle gleich wahrscheinlich sind.
An jeder Stufe ist die Wahrscheinlichkeit nach rechts oder nach links abgelenkt zu werden
gleich ½ . Somit ist die Wahrscheinlichkeit für Ablenkungen an 4 Stufen gegeben durch:
1 1 1 1 1
⋅ ⋅ ⋅ =
2 2 2 2 16
Folglich sind die Wahrscheinlichkeiten, dass eine Kugel in den verschiedenen Behältern
landet gegeben durch:
BehälterNummer
Anzahl der Wege um Die Wahrscheinlichkeit,
in einen Behälter zu dass eine Kugel in den
gelangen
Behälter fällt
0
1
1
4
2
6
3
4
4
1
1
16
1
4⋅
16
1
6⋅
16
1
4⋅
16
1
1⋅
16
1⋅
1
16
4
=
16
6
=
16
4
=
16
1
=
16
=
Lässt man nun 1000 gleich Kugeln von oben durch das Brett fallen so kann man theoretisch
folgende Anzahl von Kugeln in jedem Behälter erwarten:
Behälter
Behälter
Behälter
Behälter
Behälter
0:
1:
2:
3:
4:
1000 ⋅ 1/16 = 62,5 (d.h. 62 bis 63 Kugeln)
1000 ⋅ 4/16 = 250
1000 ⋅ 6/16 = 375
1000 ⋅ 4/16 = 250
1000 ⋅ 1/16 = 62,5
Jeder Aufprall einer Kugel auf ein Hindernis ist ein Bernoulli-Versuch, da das Brett aus
mehreren Stufen (Hindernisreihen) besteht, handelt es sich um einen mehrstufigen BernoulliVersuch. Aus dem Beispiel des Galton-Brett mit 4 Stufen kann man leicht erkennen, dass die
Wahrscheinlichkeiten für das Gelangen einer Kugel in einen bestimmten Behälter durch eine
Binomialverteilung beschrieben werden kann.
Eine analoge Überlegung für ein Brett mit N Stufen ergibt:
18
N!
 1
P (k ) =
 
(N − k )! k !  2 
N
k = (0 , 1, 2 , K , N )
wobei N die Zahl der Stufen und die Zufallsvariable k die Behälter-Nummer angibt.
Abb. 8. Bei nur einem Hindernis A ist die Wahrscheinlichkeit 1/2 für links und für rechts, oder, anders formuliert,
im Mittel fällt die Hälfte aller Kugeln nach rechts und die Hälfte nach links. Damit trifft jeweils die Hälfte der Kugeln
auf B und die andere Hälfte auf C, wo sie sich wieder mit gleichen Wahrscheinlichkeiten 1/2 nach links und rechts
aufteilen. Damit fällt aber nur noch (1/2)⋅(1/2) = 1/4 der Kugeln an B nach links, 1/4 an C nach rechts, und jeweils
1/4 von links und von rechts in den Zwischenraum zwischen B und C. Hier addieren sie die Wahrscheinlichkeiten
also, und 1/4 + 1/4 = 2/4.
Anhand der Abbildung kann man weiter verfolgen, wie der Strom der Kugeln sich an jeder Hindernisreihe aufteilt.
4
Im Beispiel haben alle diese Wahrscheinlichkeiten den Nenner 16, da es 4 Reihen von Hindernissen sind (16=2 ).
Die Zähler ergeben sich durch Addieren der Zähler in der Reihe darüber, was der Vereinigung der Kugelströme in
den Zwischenräumen entspricht. (Quelle: Wikipedia.org)
Verallgemeinerung
Bei einem mehrstufigen Zufallsexperiment ist die Wahrscheinlichkeit eines Ergebnisses
gleich dem Produkt der einzelnen Wahrscheinlichkeiten entlang des zugehörigen Pfades.
Somit ist z.B. die Wahrscheinlichkeit, dass eine Kugel in einem 4 stufigen Brett in den
Behälter Nr. 0 (k = 0) fällt gleich q4 (s. Abb.) .Die Wahrscheinlichkeiten für die Ablenkung
nach rechts bezeichnen wir mit p und für links mit q = 1 – p. Hat nun das Brett N Stufen,
so ist die Wahrscheinlichkeit, dass eine Kugel entlang eines Pfades (Weges) in einen
beliebigen Behälter k fällt gleich:
p k qN − k .
Denn um in den k-ten Behälter zu gelangen muss die Kugel bei einem N-stufigen Experiment
k mal nach rechts und N – k mal nach links abgelenkt werden.
Es gibt nun mehrere Möglichkeiten in den Behältern, die nicht am linken oder rechten Rand
stehen, zu gelangen. Aus der folgenden Abbildung kann man sehen, dass es z.B. 4
verschiedene Wege (Pfade) gibt, um in den Behälter Nr. 1 (k = 1) zu fallen (oder siehe das
Beispiel oben).
19
Es ist zu erkennen, dass die Anzahl der Wege zu den Behältern, durch die BinomialKoeffizienten
N!
(N − k )! k !
k = (0 , 1, 2 , K, N )
beschreiben werden kann. Um die Wahrscheinlichkeit, dass eine Kugel in einen bestimmten
Behälter fällt, zu berechnen, müssen die Wahrscheinlichkeiten entlang der verschiedenen
Wege addiert werden. Dies ergibt:
P( k ) = p k q N −k
N!
(N − k )! k !
k = (0 , 1 , 2 , K, N )
Wenn das Brett unsymmetrisch steht dann sind p und q nicht mehr gleich ½ .
q
0
1
p
2
3
4
Abb. 9. Ein Galton-Brett mit 4 Stufen, (die Hindernisse sind durch graue Kreise und die Behälter sind
durch Quadrate dargestellt). Es gibt 4 verschiedene Wege um den Behälter k = 1 zu erreichen, d.h.
die Kugel muss 1 mal nach rechts und 3 mal nach links abprallen. Die Wahrscheinlichkeit an jeder
Stufe ist für links q und für rechts p . Folglich sind die einzelnen Wahrscheinlichkeiten entlang den
verschiedenen Pfaden zum Behälter k = 1 gegeben durch: (q⋅q⋅q⋅p , q⋅q⋅p⋅q , q⋅p⋅q⋅q , p⋅q⋅q⋅q) =
(p⋅q³, p⋅q³, p⋅q³, p⋅q³). Um die Wahrscheinlichkeit für das gelangen in den Behälter k = 1 zu
berechnen, müssen diese 4 Wahrscheinlichkeiten mit einander addiert werden. Dies ergibt: P(k = 1)
= 4 p⋅q³.
20
Experiment mit dem Galton-Brett
Aufgabe
Es ist durch Experimente festzustellen, ob ein gegebenes N-stufiges Galtonsches Brett
Ergebnisse liefert, die mit einer Binomialverteilung beschrieben werden können (Test einer
Hypothese). Dazu lässt man z.B. N = 1000 Kugeln (10 Experimente mit je 100 Kugeln)
durch das Galton- Brett laufen, notiert die Zahlen
{ m0 ; m1 ; m2 ; K ; mk ; K ; mN }
der Kugeln in den einzelnen Behältern. Bei 10 Experimenten erhält man 10 Sätze von
Zahlen { m0 ; m1 ; m2 ; K ; mN }. Man summiert die einzelnen mk -Werte und erhält
schließlich einen Satz
{ M 0 ; M 1 ; M 2 ; K ; M k ; K ; M N }.
Auswertung
Es liegen nun Daten vor (Stichprobenergebnisse), die analysiert werden sollen, ob sie mit
einem N-stufigen Bernouli-Versuch verträglich sind oder nicht (d.h., ob sie mit einer
Binomialverteilung beschrieben werden können oder nicht).
Die Aufgabe wird mit dem sogenannten "χ²-Güte der Anpassung" Test gelöst.
(Hinweis: M kth = N ⋅ P (k ) , wobei N die Gesamtzahl der Kugeln ist.)
Simulation eines Galtonschen Brettes
Aufgabe
Es ist ein Programm zu schreiben, mit dessen Hilfe sich Experimente auf
dem Galton-Brett simulieren lassen. Es sind Simulationen durchzuführen. Die
Ergebnisse sind in der im vorhergehenden Abschnitt geschilderten Weise auszuwerten.
Simulationen folgender Experimente sind auszuführen:
a) Kugeln laufen über ein Galton-Brett mit 8 Hindernisreihen. Es wird angenommen,
dass das Brett "fair" ist, d.h. dass an jedem Hindernis die Kugeln mit gleicher
Wahrscheinlichkeit nach rechts ( p = 0,5) oder nach links ( q = 0,5) abgelenkt wird.
Es finden 100 Durchläufe statt. Das heißt, in der Simulation laufen 256 Kugeln 100mal durch das Galton-Brett.
b) Kugeln laufen über ein Galton-Brett mit 8 Hindernisreihen. Es wird angenommen,
dass das Brett nicht "fair" ist. An jedem Hinderniss wird die Kugel mit der
Wahrscheinlichkeit p = 0,45 nach rechts und mit der Wahrscheinlichkeit q = 0,55
nach links abgelenkt. Es finden 100 Durchläufe statt. Das heißt, in der Simulation
laufen 265 Kugeln 100 mal durch das Galton-Brett.
Das Programm ist in einem Flussdiagramm darzustellen. Ein "Listing" des "Source-File" ist
dem Assistenten vorzulegen.
21
Auswertung der Simulation:
§
Die Simulation liefert die Verteilung der 100 . 256 Kugeln auf die 9 Behälter. Die
Ergebnisse der Simulationen (a) und (b) sind jeweils in einem Histogramm
darzustellen. In das Histogramm ist auch die auf der Grundlage der
Binomialverteilung erwartete Verteilung der Kugeln einzuzeichnen.
§
Für beide Simulationen ist ein χ²-Test mit α = 0,05 durchzuführen.
Mit Hilfe des χ²-Tests ist zu zeigen, dass das Ergebnis von Simulation (a) nicht
verträglich ist mit der Hypothese einer Binomialverteilung mit p = 0,45 (q = 0,55).
Mit Hilfe des χ²-Tests ist zu zeigen, dass das Ergebnis von Simulation (b) nicht
verträglich ist mit der Hypothese einer Binomialverteilung mit p = q = 0,5.
§
Für jeden der 100 Durchläufe der Simulation (a) oder (b) ist der Mittelwert
k = <k>
sowie die Varianz
σ² = < ( k − < k >)² >,
§
Die 100 Mittelwerte sind in einem Histogramm darzustellen, ebenso die 100
Varianzen. Welcher Verteilung gehorchen die Mittelwerte, bzw. die Varianzen?
2.2. Radioaktiver Zerfall
Aufgabe
In einer radioaktiven Substanz sind in 200 aufeinander folgenden Zeitintervallen der Länge
t die Zahl der Zerfälle n pro Zeitintervall zu messen.
Es ist festzustellen, ob die experimentellen Ergebnisse durch eine Poisson-Verteilung
beschrieben werden können. Dazu ist der χ²-Test zu verwenden.
Auswertung
Zu ermitteln ist die Zahl M n der Experimente mit n Zerfällen im Zeitintervall t
Die zu testende Verteilungsfunktion:
λn −λ
P (n ) =
e
n!
enthält einen Parameter λ dessen Wert nicht genau bekannt ist. Der Wert dieses Parameters
zu ermitteln. Anschließend ist ein χ²-Test durchzuführen.
22
2.3. Ehrenfest'sches Spiel: "Gleichgewicht"
Die im folgenden beschriebenen Kugelspiele, die von M. Eigen und R. Winkler in ihrem
Buch "Das Spiel" diskutiert werden, haben das Ziel, Einblick in einige statistische Prozesse zu
geben, die in der Physikalischen Chemie eine Rolle spielen.
Für dieses Spiel stehen zur Verfügung:
§
ein quadratisches Spielfeld mit 6 x 6 Feldern (N = 36) (Die Seiten der Spielfläche
sind mit Zahlen versehen, um die Koordinaten der einzelnen Felder festzulegen.)
§
36 grüne und 36 gelbe Kugeln
§
ein Würfelpaar (bzw. ein Taschenrechner) zur Erzeugung von Zufallszahlen, um die
Felder der quadratischen Fläche zu erwürfeln
Ehrenfest'sches Spiel
k : Differenz zwischen der Zahl n der grünen Kugeln auf dem Brett
und der Halbbesetzung der Felder mit grünen Kugeln
(k = n – N/2)
N : Zahl der Felder auf dem Brett
Spielregeln
Zu Spielbeginn (d.h., aller erste Gruppe) werden die 36 Felder mit grünen Kugeln besetzt.
Dann wird gewürfelt. Die Kugel, die sich auf dem erwürfelten Feld befindet, wird
herausgenommen und durch eine Kugel der anderen Farbe aus dem Reservoir ersetzt. Nach
jedem Wurf wird der aktuelle Spielstand notiert, indem die Differenz k zwischen der Zahl n
der grünen Kugeln auf dem Brett und der Halbbesetzung der Felder mit Kugeln (k = n –
N/2) ermittelt wird.
Der Spielverlauf wird graphisch dargestellt, indem die Zahl k als Funktion der Zahl der
Würfe w aufgetragen wird. Nach 50 Würfen wird das Spiel willkürlich unterbrochen. Die
zu diesem Zeitpunkt vorhandene Verteilung von grünen und gelben Kugeln ist die
Ausgangssituation für das nächste Spiel. (Jede Praktikantengruppe spielt ein Spiel mit 50
Würfen.)
23
Statistische Analyse des Gleichgewichtszustandes
Bezeichnen wir die Anzahl der grünen Kugeln mit n und die gelben mit n′, da das Brett N
Felder besitzt, gilt immer :
n + n′ = N
Die Wahrscheinlichkeit, dass ein beliebiges Feld auf dem Brett mit einer grünen Kugel
besetzt ist bezeichnen wir mit p und das es mit einer gelben Kugel besetzt ist mit q. Da mit
diesen 2 Farben alle Möglichkeiten erschöpft sind besagt die Normierungsbedingung , dass
p + q = 1
Die Wahrscheinlichkeit für das Auftreten einer bestimmten Verteilung auf dem Brett, dass n
Kugeln grün und n′ Kugeln gelb sind, ist gegeben durch:
(1p42
⋅ p ⋅ ⋅ ⋅ p ) ⋅ (q ⋅ q L q )
43 1424
3
n Faktoren
= pn q n
′
n′ Faktoren
Ein Zustand , bei dem das Brett mit n grünen Kugeln und n′ gelben besetzt ist, kann jedoch
normalerweise auf vielen Arten realisiert werden.
Die Alternativmöglichkeiten für ein Beispiel mit insgesamt 4 Feldern sind in der folgenden
Abbildung aufgeführt.
Abb. 10 Die Verteilung von 4 Kugeln auf 4 Plätze. Die grünen Kugeln sind durch graue Kreise und
die gelben durch weiße Kreise dargestellt. Die Anzahl der Konfigurationen C(n) mit 2 grünen Kugeln
(n = 2) ist am höchsten (C(2) = 6).
24
Mit 2 idealen nicht-identischen Würfeln , die nur zwei Seiten haben (z.B. zwei
ungleicheMünzen) kann man 4 verschiedene Zahlen-Kombinationen, nämlich (1,1) , (1,2)
, (2,1) , und (2, 2) erzeugen, die alle mit der gleichen Wahrscheinlichkeit vorkommen. Somit
ist die Chance jedes Feld zu treffen gleich. Folglich wird die Verteilung der Kugeln auf dem
Brett eine Binomialverteilung sein. Eine ähnliche Überlegung für ein Brett mit 36 Feldern
und 2 idealen nicht-identischen Würfeln mit jeweils 6 Seiten führt zum gleichen Resultat.
Also ist die gesuchte Wahrscheinlichkeit gegeben durch:
P( n) =
N!
p n qN − n
( N − n) ! n!
wobei die Variable n die Zahl der grünen Kugeln und N die Gesamtzahl der Felder angibt.
Da die Wahrscheinlichkeit grün oder gelb zu bekommen gleich ist gilt :
p=q=½
Somit ergibt sich
P( n ) =
N!
( N − n )! n !
 1
 
 2
N
In diesem Versuch interessieren wir uns für die Differenz zwischen der Zahl der grünen
Kugeln n und der Halbbesetzung der Felder N/2
k = n − N/2
Somit ist
N!
 1
P( k ) =
 
N
  N
  2
+ k ! 
− k !

2
  2

N
Es ist leicht zu erkennen, dass das Maximum P(k), d.h., die Wahrscheinlichste Situation bei
k = 0 liegt.
Aufgabe
1. Die
36
Felder des Spielbrettes werden entsprechend dem Spielstand des
vorhergehenden Spiels (der vorhergehenden Praktikantengruppe) mit grünen und
gelben Kugeln besetzt. (Ausnahme: aller erste Gruppe, siehe vorne unter Spielregeln")
2. Das Spiel wird durch 50 Würfe weitergeführt. Nach jedem Wurf ist die Differenz k
zwischen der Zahl n der grünen Kugeln auf dem Brett und der Halbbesetzung N/2
der Felder zu ermitteln und graphisch darzustellen.
(k = n − N/2)
25
3. Während eines Spiels mit 50 Würfen ist festzustellen, wie oft k die Werte
0 ; ±1 ; ±2 ; … ; ±18 annimmt.
4. Nach 50 Würfen ist die Besetzung jedes einzelnen der 36 Felder mit grünen und
gelben Kugeln festzustellen und zu notieren (Ausgangszustand für die nächste
Gruppe).
5. Die Ergebnisse der Aufgaben 3 und 4 sind in Listen einzutragen, die beim
betreuenden Assistenten ausliegen.
Auswertung
Für die Auswertung ist die Gesamtheit (!) der in der Liste aufgeführten Spielergebnisse
im stationären Zustand zu verwenden. Zu berechnen sind:
1. der Mittelwert k = < k > und die Varianz σ² = < ( k − < k >)² >,
2. die Wahrscheinlichkeiten P(k) für das Auftreten von k-Werten
0 ; ±1 ; ±2 ; … ; ±18 ,
3. die relativen Häufigkeiten der k-Werte 0 ; ±1 ; ±2 ; … ; ±18 an Hand der
gesamten vorliegenden Spielergebnisse (relative Häufigkeit: Zahl der Würfe mit dem
Ergebnis k dividiert durch Gesamtzahl der Würfe N ). Die relativen Häufigkeiten
sind als Funktion von k graphisch darzustellen. Außerdem einzuzeichnen ist die
auf Grund einer Gaußverteilung zu erwartende Verteilung der k-Werte um < k >.
4. Mit Hilfe des χ²-Tests ist zu überprüfen, ob die experimentell gefundenen
Häufigkeiten der k-Werte mit einer Binomialverteilung beschrieben werden können.
Bemerkung
Das Ehrenfest'sche Spiel ist geeignet, Schwankungen um einen chemischen
Gleichgewichtszustand zu simulieren (siehe dazu "Computersimulation des Chemischen
Gleichgewichts").
rot + blau F 2 grün
ng
(r + b F 2g) mit
2
n r nb
= 2
Um zu zeigen, dass Schwankungen um einen Gleichgewichtszustand sich unabhängig von der
Zahl der Teilchensorten, die an dem chemischen Gleichgewicht beteiligt sind, verhalten, kann
das Spiel mit vier Farben durchgeführt werden. Für diese Spielvariante wird noch ein dritter
Würfel benötigt: Tetraeder-Farbwürfel (blau, gelb, grün, rot). Dieser Würfel bestimmt, durch
welche Farbe die jeweils erwürfelte Kugel ersetzt werden soll.
26
2.4. Unkontrollierter Schwankungsvorgang
Das Ehrenfest'sche Spiel zeigt, dass Schwankungen um einen Gleichgewichtszustand
selbstregulierenden Charakter haben. Die Rückeinstellung des Gleichgewichts wird um so
wahrscheinlicher, je weiter sich das System vom Gleichgewicht entfernt.
Das Spiel, das jetzt geschildert werden soll, simuliert einen völlig nicht-determinierten
Schwankungsprozess. Es stellt ein Spiel ohne Selbstregulierung dar. Darin unterscheidet es
sich vom Ehrenfest'schen Spiel.
Für dieses Spiel stehen zur Verfügung:
§
eine quadratische Fläche von N = 16 Feldern (4 x 4)
§
1 ("idealer") Würfel
§
16 grüne und 16 gelbe Kugeln
Spielregel
Zu Beginn des Spiels (aller erste Praktikantengruppe) wird die eine Hälfte der Spielfläche
beliebig mit 8 grünen Kugeln besetzt; die andere Spielhälfte mit 8 gelben Kugeln. Dann
wird gewürfelt. Wird eine gerade Zahl erwürfelt, so wird eine beliebige grüne Kugel durch
eine gelbe Kugel aus dem Vorrat ersetzt. Wird eine ungerade Zahl erwürfelt, so wird eine
beliebige gelbe Kugel durch eine grüne Kugel ersetzt. Nach insgesamt 50 Würfen wird das
Spiel willkürlich unterbrochen. Die zu diesem Zeitpunkt vorhandene Zahl von grünen und
gelben Kugeln ist die Ausgangssituation für weitere Spiele.
Sind auf dem Spielbrett irgendwann nur noch Kugeln einer Farbe übrig geblieben, und man
soll beim nächsten Wurf noch eine Kugel derselben Farbe dazu tun, so ist in dieser Phase des
Spiels auf ein Brett mit 16 Kugeln der anderen Farbe zu "springen" und dort weiterzuspielen.
Das heißt, das Spiel wird "zyklisch" gespielt und somit sind die Konfigurationen: ″alle gelb"
und ″alle grün" als äquivalent zu betrachten.
Aufgabe
1. Die 16 Felder sind in beliebiger Weise mit grünen und gelben Kugeln zu besetzen.
Die Zahl der grünen bzw. gelben Kugeln ist vom Assistenten zu erfahren, der den
Versuch betreut.
2. Es sind 50 Würfe auszuführen.
3. Nach jedem Wurf wird das Verhältnis γ der Zahl n der grünen Kugeln zur Zahl n′
gelben Kugeln auf dem Brett ermittelt .
γ = n/n′
27
4. Nach jedem der 50 Würfe ist festzustellen, wie oft die Verhältnisse
γ = 1/15, 2/14, 3/13, ´ , 15/1, 16/0 (= 0/16)
aufgetreten sind.
5. Nach dem 50.Wurf ist die Zahl der grünen und gelben Kugeln gesondert zu notieren.
Das nächste Spiel beginnt mit diesen Zahlen von grünen und gelben Kugeln.
Das Ergebnis der Aufgaben 4 und 5 ist in eine Liste einzutragen, die beim Assistenten
ausliegt.
Auswertung
Für die Auswertung ist die Gesamtheit (!) der in der Liste aufgeführten Spielergebnisse
zu verwenden.
Berechnen Sie an Hand der Spielergebnisse die Wahrscheinlichkeit für das Auftreten der
verschiedenen Verhältnisse γ , vergleichen Sie das Ergebnis mit dem der Theorie. Die
Theorie fordert, dass jede Abweichung von der Gleichverteilung (n = N/2, N: Zahl der Felder)
gleich wahrscheinlich ist.
28
2.5. Unkontrollierter Schwankungsvorgang mit Wechselwirkung
Für dieses Spiel stehen zur Verfügung:
§
eine quadratische Fläche von N = 16 Feldern (4 x 4)
§
1 ("idealer") Würfel
§
16 grüne und 16 gelbe Kugeln
Spielregel
Die eine Hälfte der Spielfläche wird mit 8 grünen Kugeln besetzt und die andere Spielhälfte
mit 8 gelben Kugeln. Dann wird gewürfelt. Wird eine gerade Zahl erwürfelt, so wird eine
beliebige grüne Kugel durch eine gelbe Kugel aus dem Vorrat ersetzt. Wird eine ungerade
Zahl erwürfelt, so wird eine beliebige gelbe Kugel durch eine grüne Kugel ersetzt. Es wird
eine Zusatzregel eingeführt, die eine Wechselwirkung zwischen benachbarten, gleichfarbigen
Kugeln simuliert: gelbe Kugeln (grüne Kugeln) die vollständig von grünen Kugeln (gelben
Kugeln) umgeben sind, werden durch grüne Kugeln (gelbe Kugeln) ersetzt. Unter "Nachbarn"
sind nur die vier nächsten orthogonalen "Nachbarn" zu verstehen.
Nach jedem Wurf wird die Lage der Kugeln auf dem Feld unter dem Gesichtspunkt der
Zusatzregel untersucht. Die Praktikanten sollen sich selbst eine weitere sinnvolle Zusatzregel
für die "Nachbarn" der Kugeln am Rand des Spielfelds ausdenken. Das Spiel ist zu Ende,
wenn eine Kugelsorte ausgestorben ist, denn jede neue ins Spiel kommende Kugel dieser
Sorte ist dann automatisch von Kugeln der anderen Seite umgeben.
Diese Spielvariante soll zeigen, wie aus kooperativen Wechselwirkungen zusammenhängende Phasen entstehen können.
Aufgabe
1. Das Spiel ist bis zum Ende durchzuführen.
2. Die Zahl der Würfe, die für die Beendigung des Spiels benötigt werden, ist in eine
Tabelle einzutragen, die beim Assistenten ausliegt. Außerdem ist die Farbe der Kugeln
zu notieren, die am Spielende die Felder besetzen.
3. Die Zusatzregel für die Kugeln am Rand des Spielfelds ist im eigenen Protokoll zu
vermerken und zu begründen.
29
2.6. Alles oder Nichts
§
Für dieses Spiel stehen zur Verfügung:
eine quadratische Fläche von N = 36 Feldern (6 x 6) mit Koordinatenbezifferung
§
ein geeignetes ("ideales") Würfelpaar
§
36 grüne und 36 gelbe Kugeln
Spielregel
Zu Spielbeginn werden die 36 Felder regellos mit 18 grünen und 18 gelben Kugeln
besetzt. Dann wird gewürfelt. Die Kugel, die erwürfelt wird, wird verdoppelt. Erwürfelt ma n
zum Beispiel eine grüne Kugel, so entfernt man eine beliebige gelbe Kugel und ersetzt diese
durch eine grüne Kugel aus dem Reservoir. Es wird so lange gespielt, bis alle Felder
entweder durch grüne oder gelbe Kugeln besetzt sind.
In diesem Spiel ist die Gleichverteilung trotz gleicher Auf- und Abbauchancen beider
Kugelfarben instabil. Fluktuationen verstärken sich und führen immer zu einer Alles oder
Nichts-Entscheidung für das Vorhandensein der einen oder der anderen Kugelfarbe.
Aufgabe
1. Es sind so viele Würfe auszuführen, bis alle Felder durch grüne oder gelbe Kugeln
besetzt sind.
2. Nach jedem Wurf ist die Differenz k zwischen der Zahl
3. n der grünen Kugeln auf dem Brett und der Halbbesetzung Felder N/2 (N: Zahl der
Felder) zu notieren.
4. Der Spielverlauf ist in ein Diagramm einzutragen.
5. Die Zahl der Würfe bis Spielende und die Farbe der Kugeln, mit denen bei Spielende
alle Felder besetzt sind, ist in eine Liste einzutragen, die beim Assistenten ausliegt.
Auswertung
Für die Auswertung ist die Gesamtheit (!) der in der Liste aufgeführten Spielergebnisse
zu verwenden.
1. Berechnen Sie die Wahrscheinlichkeit für die Verwirklichung des jeweiligen
Endergebnisses hinsichtlich der Kugelfarbe.
2. Berechnen sie den Mittelwert und die Varianz der Wurfzahl bei Spielende.
30
2.7. Computersimulation des Chemischen Gleichgewichts
(J.F. Cullen, J. Chem. Educ. 66, 1023 (1989))
Man denke sich nr rote Kugeln, nb blaue Kugeln und ngr grüne Kugeln (zusammen N
Kugeln) in einer Reihe angeordnet und ihre Ortskoordinaten von 1 bis N durchnummeriert.
Ein Computer ist so programmiert, dass er Paare von Zufallszahlen zwischen 1 und
N erzeugt. Diese Zahlenpaare werden dazu verwendet, zwei Kugeln aus der Reihe der
Kugeln zu lokalisieren. Die Farben der "erwürfelten" Kugeln werden ermittelt. Dabei werden
folgende Regeln beachtet:
§
Ist die eine Kugel rot gefärbt und die andere Kugel blau, werden beide Kugeln
durch je eine Kugel mit grüner Farbe ersetzt.
§
Sind beide Kugeln grün gefärbt, wird die eine Kugel durch eine rot gefärbte und die
andere durch eine blaue ersetzt.
§
Bei allen anderen Farbkombinationen wird kein Kugelaustausch vorgenommen.
Dieses Spiel stellt eine Simulation der Reaktion: blau + rot = 2 grün dar.
Gleichgewichtszustand
Beginnt man das Spiel beispielsweise mit nur grün gefärbten Kugeln
(z.B. N = ngr =1000000), so erreicht die Simulation nach einer gewissen Anlaufphase einen
Gleichgewichtszustand, der zu analysieren ist:
Nach jedem Schritt im Gleichgewichtszustand (oder nach mehreren Schritten) wird das
folgende Verhältnis gebildet:
n gr
2
nr nb
= K
ngr Zahl der grünen Kugeln
nb
nr
Zahl der blauen Kugeln
Zahl der roten Kugeln
Es ergibt sich eine Folge von Werten der "Gleichgewichtskonstanten" K, die zu analysieren
ist.
Aufgaben: Reaktion im Gleichgewichtszustand
1. Berechnung des Mittelwertes von K ; Berechnung der relativen Häufigkeit der
auftretenden (K ± δK)-Werte ; Graphische Darstellung: (K ± δK) versus K ;
Einzeichnen einer Gauß-Verteilung in die graphische Darstellung ; χ²-Test für GaußVerteilung.
2. Man stelle Versuche mit verschiedenen Kugel-Gesamtmengen
(z.B. N = 100; N = 1000; N = 10000; N = 100000)
und gleichen Kugelzahlverhältnissen an. Die Unterschiede in der Verteilung der
K - Werte ist zu diskutieren.
31
3. Ausgehend von verschiedenen Nicht-Gleichgewichtszuständen
(z.B. nr0 = 200000; nb0 = 300000; n 0gr = 500000; N = 1000000)
sind die Zahlen der roten, blauen und grünen Kugeln im Gleichgewicht zu
ermitteln, außerdem der Wert der Gleichgewichtskonstanten.
Bei diesen Simulationen kann auch das "Lösungsmittel" dadurch berücksichtigt
werden, dass weiße Kugeln (abgekürzt w) eingeführt werden, die an der
"chemischen Reaktion" nicht teilnehmen
(z.B. nr0 = 200000; nb0 = 100000; n 0gr = 400000; n 0w = 300000; N = 100000).
4. Eine Verschiebung des Wertes der "Gleichgewichtskonstanten" kann dadurch
simuliert werden, dass man die Spielregel modifiziert:
Wird eine Kugel mit roter Farbe und eine mit blauer Farbe ausgewählt, dann wird
eine Zufallszahl im Bereich 1 bis 10 erzeugt. Hat die Zufallszahl den Wert 1,
so werden die beiden Kugeln durch zwei grüne ersetzt. Hat die Zufallszahl einen
Wert verschieden von 1, so wird die Substitution nicht durchgeführt. Eine
derartige Simulation ist durchzuführen. Die Gleichgewichtskonstante ist zu ermitteln.
Durch diese neue Regel, die Spielregel 1 modifiziert, wird die Reaktion r + b T 2gr
erschwert (Erhöhung der Aktivierungsenergie). Es ist zu erwarten, dass der Mittelwert
der "Gleichgewichtskonstanten" um den Faktor 1/10 kleiner als bei einer Simulation
ohne diese Zusatzregel ist. In entsprechender Weise kann der Wert der
"Gleichgewichtskonstanten" auch erhöht werden: Die Reaktion r + b P 2gr wird
erschwert, indem die geschilderte Zusatzregel auf Spielregel 2 angewandt wird. Es ist
eine solche Simulation durchzuführen.
32
3. Anhang
α
f
0.99
0.95
0.90
0.50
0.10
0.05
0.01
0.001
1
0.00
0.00
0.02
0.45
2.71
3.84
6.63
10.83
2
0.02
0.10
0.21
1.39
4.61
5.99
9.21
13.82
3
0.11
0.35
0.58
2.37
6.25
7.81
11.34
16.27
4
0.30
0.71
1.06
3.36
7.78
9.49
13.28
18.47
5
0.55
1.15
1.61
4.35
9.24
11.07
15.09
20.52
6
0.87
1.64
2.20
5.35
10.64
12.59
16.81
22.46
7
1.24
2.17
2.83
6.35
12.02
14.07
18.48
24.32
8
1.65
2.73
3.49
7.34
13.36
15.51
20.09
26.12
9
2.09
3.33
4.17
8.34
14.68
16.92
21.67
27.88
10
2.56
3.94
4.87
9.34
15.99
18.31
23.21
29.59
11
3.05
4.57
5.58
10.34 17.28
19.68
24.72
31.26
12
3.57
5.23
6.30
11.34 18.55
21.03
26.22
32.91
13
4.11
5.89
7.04
12.34 19.81
22.36
27.69
34.53
14
4.66
6.57
7.79
13.34 21.06
23.68
29.14
36.12
15
5.23
7.26
8.55
14.34 22.31
25.00
30.58
37.70
16
5.81
7.96
9.31
15.34 23.54
26.30
32.00
39.25
17
6.41
8.67
10.09 16.34 24.77
27.59
33.41
40.79
18
7.01
9.39
10.86 17.34 25.99
28.87
34.81
42.31
19
7.63
10.12 11.65 18.34 27.20
30.14
36.19
43.82
20
8.26
10.85 12.44 19.34 28.41
31.41
37.57
45.31
21
8.90
11.59 13.24 20.34 29.62
32.67
38.93
46.80
22
9.54
12.34 14.04 21.34 30.81
33.92
40.29
48.27
23
10.20 13.09 14.85 22.34 32.01
35.17
41.64
49.73
24
10.86 13.85 15.66 23.34 33.20
36.42
42.98
51.18
25
11.52 14.61 16.47 24.34 34.38
37.65
44.31
52.62
26
12.20 15.38 17.29 25.34 35.56
38.89
45.64
54.05
27
12.88 16.15 18.11 26.34 36.74
40.11
46.96
55.48
28
13.56 16.93 18.94 27.34 37.92
41.34
48.28
56.89
29
14.26 17.71 19.77 28.34 39.09
42.56
49.59
58.30
30
14.95 18.49 20.60 29.34 40.26
43.77
50.89
59.70
40
22.16 26.51 29.05 39.34 51.81
55.76
63.69
73.40
50
29.71 34.76 37.69 49.33 63.17
67.50
76.15
86.66
60
37.48 43.19 46.46 59.33 74.40
79.08
88.38
99.61
70
45.44 51.74 55.33 69.33 85.53
90.53
100.43 112.32
80
53.54 60.39 64.28 79.33 96.58
101.88 112.33 124.84
90
61.75 69.13 73.29 89.33 107.57 113.15 124.12 137.21
100 70.06 77.93 82.36 99.33 118.50 124.34 135.81 149.45
Tab. 1 Die Tabelle enthält die χ² für verschiedene α Werte in Abhängigkeit vom Freiheitsgrad f
(Quelle: gunma university jp)
33
Kombinatorik
Sind N Stellen und N verschiedene (nicht-identische) Münzen vorhanden, so können wir
die erste Münze auf N verschiedene Stellen platzieren, die 2. Münze auf den N – 1 übrigen
Stellen platzieren usw. Daher gibt es für die Anordnung dieser Münzen
N ( N − 1)( N − 2) L 1 = N !
Möglichkeiten.
Beispiel
man kann 3 verschiedene Buchstaben A, B, C auf 3 ! = 6 verschiedene Arten anordnen.
ABC
ACB
BAC
CAB
BCA
CBA
.
Sind von den N Münzen jedoch n Münzen identisch, so fallen alle jene Anordnungen
zusammen, die durch Vertauschung der gleichen Münzen untereinander hervorgehen. Diese
Vertauschungen sind auf n ! verschiedene Arten möglich.
Für N Münzen von denen n identisch sind, reduziert sich also die Anzahl der möglichen
Anordnungen auf :
C( n) =
N!
n!
Befinden sich unter den N Münzen jeweils n1 , n2 , K , nk gleiche Münzen , wobei
n1 + n2 + K + nk = N
ist, so ergibt sich die folgende Anzahl von verschiedenen Anordnungen :
C( n) =
N!
n1!⋅ n2! L nk !
Sind nun N Stellen, und n nicht-identische Münzen mit n < N vorhanden, so können wir
die erste Münze auf N verschiedene Stellen, die 2. Münze auf den N – 1 übrigen Stellen,
und die n-te Münze auf den N – n + 1 zuletzt übrigen Stellen platzieren. Somit ist die
Anzahl verschiedener Anordnungen
C (n ) = N ( N − 1)( N − 2) L ( N − n + 1) =
=
N ( N − 1) ( N − 2 ) L ( N − n + 1) ( N − n ) L 1
( N − n) L 1
N!
N!
=
( N − n ) ! m!
wobei m = N – n die Anzahl der unbesetzten Stellen ist. Bei jeder Anordnung bleiben
immer m Stellen des Feldes unbesetzt.
34
Sind nun die n Münzen identisch so ergibt sich
C (n ) =
N!
N!
=
( N − n )! n! m ! n!
Besetzen wir nun die m freien Stellen mit m identische Münzen, die aber verschieden von
den n Münzen sind, so wird durch die obige Formel die mögliche Anzahl verschiedener
Anordnungen angegeben.
Z1
Z1
. .
Z1
Z1
Z2
Z1
Z2
Z1
.
Z2
Z1
Z2
Z3
Z1
Z2
Z1
Z2
Z3
Z3
Z1
Z2
Z3
K4
Z1
Z2
Z3
K4
K5
Z1
Z2
Z3
Z1
Z2
K4
Z3
K4
Z1
Z2
Z3
K5
K4
Z1
Z2
K5
Z3
K4
Z1
Z2
K4
Z3
Z1
Z2
K4
Z3
K5
Z1
Z2
K4
Z1
Z2
Z3
K4
Z3
Z1
Z2
K4
K5
Z3
Z1
Z2
K5
K4
Z3
............................
K5
K4
Z3
Z2
Z1
In dieser Tabelle sind einige Anordnungen für 5 verschiedene Münzen Z1 Z2 Z3 K4 K5 auf ein Feld
mit 5 Stellen eingetragen. Die erste Münze Z1 kann man auf 5 verschiedene Stellen platzieren (siehe
1. Zeile der Tabelle). Wenn einer der Plätze durch die erste Münze besetzt ist kann die zweite Münze
Z2 auf die 4 übrigen Stellen platziert werden (siehe 2. Zeile der Tabelle) usw.
Daher gibt es 5 . 4 . 3 . 2 .1 = 5 ! = 120 verschiede Anordnungsmöglichkeiten. In der letzten Zeile
der Tabelle geben die 6 Felder auf der linken Seite die 6 verschiedene Anordnungsmöglichkeiten
wenn Z1 bzw. Z2 auf dem ersten und zweiten Platz des Feldes stehen. Sind jedoch die Münzen Z1
Z2 und Z3 identisch so reduziert sich die Anzahl der verschiedenen Anordnungen auf (5 !) /( 3 !) = 20 .
Sind nun K4 und K5 auch miteinander identisch, so ist die Anzahl der verschiedenen Anordnungen
(5 ! )/ (3 ! . 2 !) = 10. Für 5 Münzen, die alle identisch sind aber 3 davon Zahl und 2 Kopf zeigen gilt die
gleiche Überlegung d.h. in diesem Fall gibt es auch 10 verschiedene Annordnungen.
35
Poisson-Näherung
Wenn die Wahrscheinlichkeit p sehr klein wird:
p << 1 ,
und N so groß ist, dass:
n << N ,
gilt, und
N⋅p = λ
einen Wert mittlerer Größe hat
Verteilungsfunktion
P( n ) =
können wir folgende Nährungen für die Binomial-
N!
p n qN − n
( N − n )! n !
machen. Da
N!
= (N − n + 1) L (N − 2 )( N − 1) N
( N − n) !
ist, ergibt sich für n << N folgende Beziehung:
N!
≈ Nn
( N − n) !
(∗)
Als nächstes untersuchen wir den dritten Faktor in der Funktion den wir hier mit
bezeichnen:
y
y = q N − n = (1 − p )
N −n
Logarithmieren ergibt:
ln y = (N − n ) ⋅ ln ( 1 − p )
Da p << 1 ist, ergibt eine Taylor-Reihenentwicklung um die Stelle p = 0 folgendes
Ergebnis:
ln( 1 − p ) = ln ( 1 − 0 ) +
= 0 −
≈
−p
(p )
−
−1
1
−1
2
⋅( p − 0 ) + ⋅
⋅( p − 0 ) + K
2
(1 − p ) 0
2 (1 − p ) 0
1
⋅( p
2
)2 +
K
36
Wegen p << 1 haben wir alle höheren Potenzen von p vernachlässigt. Da n << N
können wir N − n ≈ N setzen. Somit ergibt sich für y folgender Näherungsausdruck:
ln y ≈ − N ⋅ p
y ≈ e −N p
(∗ ∗)
Setzen wir die Näherungsausdrücke * und ** in die Binomialverteilungsfunktion ein, so
ergibt sich :
P( n) =
N n n − N p (Np )n − N p
λn − N p
p ⋅e
=
⋅e
=
⋅e
n!
n!
n!
Dies ist die Poisson-Verteilungsfunktion.
Maximum-Likelihood-Methode
Mit diesem Verfahren werden Schätzfunktionen für die unbekannten Parameter einer
Wahrscheinlichkeitsverteilung ermittelt.
Sei X eine Zufallsvariable, deren Verteilungsfunktion f (x) einen unbekannten Parameter µ
{ x1 ; x2 ; K ; xS } die unabhängigen Stichprobenwerte. Da in allen
enthält, und
Experimenten der Stichprobe derselbe Prozess unterliegt, besteht die Likelihood-Funktion für
die Gesamtheit der Stichproben (Verbundwahrscheinlichkeit) aus dem Produkt der
Wahrscheinlichkeiten für die einzelnen { xi } -Werte :
L( µ ) = f (x1 ) ⋅ f ( x2 ) L f (x S )
Der unbekannte Parameter µ wird nun so bestimmt, dass die Wahrscheinlichkeit einen
Maximalwert annimmt. Aus der notwendigen Bedingung für ein relatives Maximum:
∂ L(µ )
= 0
∂µ
erhält man somit den Parameter µ .
37
Bestimmung des unbekannten Parameter λ in der Poisson-Verteilung
Bei einer Poisson-Verteilung ist die Wahrscheinlichkeitsfunktion mit dem unbekannten
Parameter λ und den bekannten Zufallsvariablen n gegeben durch:
P (n ) =
λn − λ
e
n!
(n =
0, 1, 2 , K
)
Die Likelihood-Funktion besteht aus dem Produkt der einzelnen Wahrscheinlichkeiten eines
Experiments, das S mal wiederholt wurde.
L (λ ) = P (n1 ) ⋅ P (n2 ) L P (nS ) =
=
S
∏
i= 1
λ i −λ
e
ni !
n
S
∏ P(n )
i
i =1
(n =
0 , 1 , 2 , K , r ) ; ( i = 1, 2 , K , S )
Bemerkung: Es ist
S = M 0 + M1 + K + M n + K + M r
wobei S die Gesamtzahl der Versuche, und M die Häufigkeitsklassen für verschiedene n Werte angibt.
Logarithmieren der Likelihood -Funktion ergibt:
i=1
n
n
 λ n 1 − λ λ n 2 −λ
λ i −λ
λ S −λ

= ln
e
e ⋅
e
L
e
 n!
ni !
n2 !
nS !
 1
[ −λ
+ n1 ln λ − ln n1 ! ] + [ − λ + n2 ln λ − ln n2 ! ]
S
ln L (λ ) = ln ∏
=




+ K + [ − λ + n S ln λ − ln nS ! ]
= − S λ + ln λ
S
∑ ni −
i =1
S
∑ ln n !
i =1
i
Die Bedingung für das gesuchte Maximum führt auf die Gleichung :
∂ ln L (λ )
= 0
∂λ
−S +
1
λ
S
∑n
i =1
i
=
0
S
λ
=
∑n
i
i =1
S
Der Parameter λ erweist sich dabei als der Mittelwert von n .
38
Bestimmung des unbekannten Parameter p in der Binomial-Verteilung
Bei einer Binomial-Verteilung ist die Wahrscheinlichkeitsfunktion mit dem unbekannten
Parameter p und den bekannten Zufallsvariablen n gegeben durch:
N!
p n qN − n
( N − n) ! n!
P( n) =
(n =
0 , 1, 2 , K , N
)
Die Likelihood-Funktion besteht aus dem Produkt der einzelnen Wahrscheinlichkeiten des
Experiments, das S mal wiederholt wurde.
L (λ ) = P (n1 )⋅ P (n2 ) L P (nS ) =
S
∏ P(n )
i
i =1
=
n
S
∏  N  p
i=1

n

qN −n
(n =
0 , 1, 2 , K , N ) ; ( i = 1 , 2 , K , S )
wobei S die Gesamtzahl der Versuche im Experiment angibt und
N
N!
=   ist.
( N − n )! n !  n 
S
  N  n N −n
 N  n N −n
 N  n N −n
 N  n N −n
ln L (λ ) = ln ∏   p i q i = ln    p 1 q 1 ⋅   p 2 q 2 L   p S q S
 n1
n
i=1  i 
n2 
nS 
 
 N 
 N 
n
N −n 
n
N −n 
=  ln   + ln p 1 + ln q 1  +  ln   + ln p 2 + ln q 2 
n
n
  1 
   2 

 N
n
N −n 
+ K +  ln   + ln p S + ln q S 
  nS 

S
S
N 
ni
N −n


ln
+
ln
p
+
ln q i
∑
∑
∑
n 
i =1
i =1
i =1
 i
S
S
S
N 
= ∑ ln   + ∑ n i ln p + ∑ (N − n i )ln q
i =1
i =1
i =1
ni 
S
S
S
N 
= ∑ ln   + ln p ∑ n i + ln (1 − p ) ∑ (N − n i )
i =1
i =1
i =1
ni 
S
=
im letzen Schritt ist q durch 1 – p ersetzt worden.
Die Bedingung für das gesuchte Maximum führt auf die Gleichung :
∂ ln L (λ )
= 0
∂λ
0 +
1
p
S
∑n
i =1
i
−
S
1
(N − n i ) =
∑
(1 − p ) i = 1
0




39
S
1
p
(1 − p )
p
1
p
∑ ni
=
i =1
S
∑n
i =1
S
∑ ni −
i =1
=
i
1
(1 − p )
∑ (N − n )
S
S
∑
i
i =1
N
S
∑n
−
i =1
S
∑ ni
=
i =1
S⋅ N
i
S
∑n
−
i =1
i =1
i
Somit ergibt sich für den unbekannte Parameter p :
r=N
S
p
=
1
⋅
N
∑ ni
i =1
S
1
424
3
=
1
⋅
N
∑M
n =1
Uni. Köln ,
⋅n
S
142
4 43
4
n
A. Shirani ,
n
=
n
N
n
Nov. 2004
Literatur
Berkeley Physics Course: Statistical Physics, F. Reif,
Ausgabe : Statistische Physik, F. Reif, Vieweg 1977)
McGraw-Hill
1965 (Deutsche
Mathematik für Ingenieure und Naturwissenschaftler Band 3, L. Papula, Vieweg 1994
Das Spiel, M. Eigen R Winkler, Piper & Co. 1975
http://www.bun.kyoto-u.ac.jp/~suchii/chi-square.html
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/txxp.html
http://de.wikipedia.org/wiki/Galtonbrett
Herunterladen