Stochastik - cfg

Werbung
Wahrscheinlichkeitsrechnung und Statistik (Stochastik)
D1
Kann man (wenigstens prinzipiell) einen Versuch beliebig oft in der gleichen Weise wiederholen
und gibt es f€r den Ausgang des Versuchs wenigstens zwei (prinzipiell) m•gliche F‚lle, so heiƒt
ein solcher Versuch Zufallsversuch oder Zufallsexperiment. Die m•glichen Versuchsergebnisse
k•nnen, als Menge zusammengefasst, angegeben bzw. festgelegt werden.
D2
Die Menge S aller m•glichen Versuchsergebnisse eines Zufallsversuchs heiƒen auch Ergebnisraum oder Stichprobenraum.
D3
Ein Zufallsversuch werde n mal durchgef€hrt, a sei ein m•gliches Versuchsergebnis. Dann bezeichnet man
a) die Anzahl der Versuchsdurchf€hrungen mit dem Versuchsergebnis a als absolute HÄufigkeit
Hn(a) des Ergebnisses a;
b) den Quotienten
D4
H n (a)
als relative HÄufigkeit hn(a) des Ergebnisses a.
n
(a) Ein Zufallsversuch heiƒt Laplace-Experiment, wenn f€r alle m•glichen Versuchsergebnisse
die Wahrscheinlichkeit gleich groƒ ist.
(b) Eine M€nze heiƒt Laplace-MÄnze (kurz: L-M€nze), wenn die beiden m•glichen Versuchsergebnisse die Wahrscheinlichkeit 1 2 haben.
(c) Ein W€rfel heiƒt Laplace-WÄrfel (kurz: L-W€rfel), wenn jedes der sechs m•glichen Versuchsergebnisse die Wahrscheinlichkeit 1 6 hat.
D5
R1
(a) Jede Teilmenge E des Stichprobenraums S heiƒt Ereignis.
(b) Hat E nur ein Element, so heiƒt E Elementarereignis.
Sprechweise in der
Mengenlehre
Grundmenge
Formale
Schreibweise
S
Sprechweise in der
Wahrscheinlichkeitsrechnung
sicheres Ereignis
leere Menge

unm•gliches Ereignis
Komplementmenge von E
E
Gegenereignis von E („nicht E“)
Schnittmenge von E und F
EF
UND-Ereignis von E und F („E und F“)
Vereinigungsmenge von E und F
EF
ODER-Ereignis von E und F („E oder F“)
E ist Teilmenge von F
EF
E zieht F nach sich
E und F haben kein gemeinsames
Element
EF=
E und F sind unvereinbar
Regeln zur Berechnung von P(E)
(1) F€r E = {a1, a2, …, an,} gilt die Summenregel: P(E) = P({a1}) + P({a2}) + … + P({an})
(2) P(S) = 1
(3) P(E) = 1 – P( E )
(4) P()= 0
(5) Bei einem Laplace-Experiment gilt P( E ) 
| E | Anz. der fÇr E gÇnstigen Ergebnisse

|S|
Anz. aller mÅgl. Ergebnisse
-1-
D6
(Axiomatischer Wahrscheinlichkeitsbegriff nach Kolmogorow, 1933)
Eine Funktion P, die jedem Ereignis E (E  S; S endlich) genau eine reelle Zahl P(E) („Wahrscheinlichkeit von E“) zuordnet, heiƒt Wahrscheinlichkeitsverteilung Äber S, wenn folgendes
gilt:
(K1) F€r alle A  S gilt P(A)  0
(K2) P(S) = 1
(K3) F€r alle A, B  S mit A  B =  gilt P(A  B) = P(A) + P(B)
R2
(1) – (5) vgl. S. - 1 Dar€ber hinaus gilt
(6) A  B  P(A) ≤ P(B)
(7) 0 ≤ P(A) ≤ 1
(8) P(A  B) = P(A) + P(B) – P(A  B)
D7
B
B
B
A
A
A
S
S
S
Denkt man sich n Versuche, die man nacheinander oder auch gleichzeitig durchf€hren kann, zu einem Versuch zusammengefasst, so nennt man diesen einen zusammengesetzten Versuch (oder
auch n-stufigen Versuch).
Den Ergebnis- bzw. Stichprobenraum veranschaulicht man in Baumdiagrammen.
Grundlegendes ZÅhlprinzip
Besteht ein zusammengesetzter Zufallsversuch aus n Stufen und betr‚gt die Anzahl der m•glichen
Versuchsergebnisse auf den einzelnen Stufen z1, z2, …, zn, so hat der zusammengesetzte Zufallsversuch insgesamt z1  z2  …  zn, m•gliche Versuchsergebnisse.
D8
Wird bei einem mehrstufigen Versuch die Wahrscheinlichkeitsverteilung f€r einen Teilversuch
nicht beeinflusst durch die Versuchsausg‚nge der vorangehenden Teilversuche, so heiƒt dieser
Teilversuch unabhÅngig von den vorangehenden Teilversuchen. Anderenfalls heiƒt er abhÅngig.
Insbesondere gilt fÇr n = 2 mit den Ereignissen A und B:
(1) Dann heiƒt die Wahrscheinlichkeit f€r B unter der Bedingung, dass A bereits eingetreten ist,
die durch A bedingte Wahrscheinlichkeit von B. Man schreibt PA(B).
(2) Das Ereignis B ist vom Ereignis A unabhÅngig, falls im Baumdiagramm (s. u.)
P(B) = P(AB) + P( A B) = PA(B) gilt.
(3) Die Ereignisse sind unabhÅngig, wenn die H‚ufigkeiten in den Spalten oder Zeilen der Vierfeldertafel (s. u.) im gleichen festen Zahlenverh‚ltnis stehen.
R3
Pfadregel
Die Wahrscheinlichkeit f€r ein Elementarereignis bei einem mehrstufigen Versuch erh‚lt man,
wenn man die Wahrscheinlichkeiten l‚ngs des zugeh•rigen Pfades im Baumdiagramm miteinander
multipliziert.
D9
A und B seien Ereignisse mit P(B) > 0. Dann heiƒt PB ( A) 
P( A  B)
die durch B bedingte WahrP( B)
scheinlichkeit f€r A und ist im umgekehrten Baumdiagramm direkt ersichtlich.
-2-
A
A
gesamt
B
P( A  B)
B
P ( A  B)
gesamt
P ( A  B)
P ( A  B)
P (A)
P (B)
P (B)
1
P(A)
P (A)
PA (B)
B P(A  B)
PA (B)
B P(A  B)
PA (B)
B P(A  B)
PA (B)
B P(A  B)
A
P(A)
B
A
Venn-Diagramm (Vierfeldertafel)
Baumdiagramm
umgekehrtes Baumdiagramm: analog mit
vertauschten Merkmalen (!)
Satz von Bayes (Berechnung der umgekehrten bedingten Wahrscheinlichkeit, vgl. D 9)
F€r die Ereignisse A und B sei 0<P(A)<1 und P(B)>0.
Dann gilt PB ( A) 
P( A)  PA ( B )
P( A)  PA ( B )  P ( A)  PA ( B )
D 10 Eine Funktion X, die jedem m•glichen Versuchsausgang a eines Zufallsversuchs eine Zahl X(a)
zuordnet, heiƒt ZufallsgrÇÉe.
Die Funktionswerte werden h‚ufig mit x1, x2, …, xk bezeichnet. Man sagt dann auch: die Zufallsgr•ƒe X kann die Werte x1, x2, …, xk annehmen.
Die Wahrscheinlichkeiten der durch diese Zahlen beschriebenen Ereignisse werden mit pi bezeichnet; es ist pi=P(X=xi)=P({aS|X(a)=xi}).
Besonders einfach zu untersuchen sind nun n-stufige Zufallsexperimente, bei denen alle Teilversuche unabh‚ngig sind und nur zwei Ergebnisse („Treffer“ – „Niete“; „T“ – „N“; „1“ – „0“) mit gleich bleibender
Wahrscheinlichkeitsverteilung auftreten. Solche Versuche k•nnen immer durch eine n-fache Urnenziehung mit ZurÇcklegen (aus einer Urne!) simuliert werden.
D 11 Besteht ein zusammengesetztes Zufallsexperiment aus n gleichwertigen Teilexperimenten mit dieser Wahrscheinlichkeitsverteilung (in jedem Teilexperiment), so
nennt man es ein n-stufiges Bernoulli-Experiment oder auch eine Bernoulli-Kette
der LÅnge n.
R4
a
1
0
P({a})
p
1-p
F€r Bernoulli-Ketten der L‚nge n, nIN, und der Trefferwahrscheinlichkeit p gilt:
n
P ( X  k )     p k  (1  p) n k .
k 
Hierbei ist die Zufallsgr•ƒe X die Trefferanzahl k mit k ≤ n.
D 12 Diese Zufallsgr•ƒe X heiƒt binomialverteilte ZufallsgrÇÉe. Die entsprechende Wahrscheinlichkeitsverteilung heiƒt Binomialverteilung Bn;p mit den Parametern n und p.
Statt P(X=k) schreibt man auch oft Bn;p(k).
D 13 X sei eine Zufallsgr•ƒe, die die Werte x1, x2, …, xk mit den Wahrscheinlichkeiten p1, p2, …, pk annehmen kann.
Dann heiƒt E(X)= x1p1+x2p2+ … +xkpk Erwartungswert von X,
V(X)=(x1-)‰p1+(x2-)‰p2+ … +(xk-)‰pk=E((X-)‰) Varianz von X
und (X)=√V(X) Standardabweichung von X.
R5
Ist X binomialverteilt mit den Parametern n und p, so gilt:
(1)   n  p
(2)   n  p  (1  p)
-3-
Hypothesentests fÄr binomialverteilte ZufallsgrÇÉen
Signifikanztests:
Zweiseitiges Testen:
Linksseitiges Testen:
Rechtsseitiges Testen:
1.
2.
3.
Hypothese H0: p=p0,
Hypothese H0: p≥p0,
Hypothese H0: p≤p0,
Alternative H1: p≠p0
Alternative H1: p<p0
Alternative H1: p>p0
Strategie
Festlegung von Stichprobenumfang n und Signifikanzniveau.
Bestimmung des zugeh•rigen Annahmebereichs   r   ;   r    , bzw.   r   ; n , oder 0;   r   
Formulierung der Entscheidungsregel:
Die Hypothese wird beibehalten, wenn das Stichprobenergebnis im Annahmebereich liegt, ansonsten ist sie zu verwerfen.
M•gliche Fehler:
Hypothese abgelehnt
wird…
beibehalten
Zustand der Wirklichkeit
Hypothese ist wahr
Hypothese ist falsch
Richtige Entscheidung
Fehler 1. Art ()
Richtige Entscheidung
Fehler 2. Art ()
Mit den Annahmebereichbereichen
A = [a;b]
ist
Pn; p(a≤X≤b)=Fn;p(b)Fn;p(a-1),
A = [0;a]
ist
Pn; p(0≤X≤a)=Fn;p(a),
A = [b;n]
ist
Pn; p(b≤X≤n)=1Fn;p(b1)
das Risiko (der Fehler) 2. Art.
!berichtigt!
SchÅtzen von Parametern fÄr binomialverteilte ZufallsgrÇÉen
Bei einen hinreichend groƒen Stichprobenumfang n gilt f€r das 95%-Vertrauensintervall I

h(1  h)
h(1  h) 
I  h  1,96
; h  1,96

n
n


Das 95%-Vertrauensintervall I f€r die Wahrscheinlichkeit zur relativen H‚ufigkeit h  X hat
n
h•chstens die LÄnge d, wenn f€r den Stichprobenumfang n 
1,96
d2
2
gilt.
NÅherungsformel von DE MOIVRELAPLACE
F€r eine binomialverteilte Zufallsgr•ƒe X mit   n  p und   n  p  (1  p) gilt f€r groƒe n:
 k  0,5   
 k  0,5   
P k1  X  k 2    2
   1
.






1
„Groƒe n“ bedeutet: n  2
4 p  (1  p) 2
Mit der LaplaceBedingung   3 kann man auf die Summanden 0,5 im Z‚hler verzichten!
Die (Normal)Verteilungsfunktion Φ ist auf S. l der Formelsammlung tabelliert.
-4-
Herunterladen