Zufallsvariablen

Werbung
Zufallsvariablen
Diskret
Binomial
Hypergeometrisch
Poisson
Stetig
Normal
Lognormal
Exponential
Verteilung der Stichprobenkennzahlen
Zufallsvariable
Erinnerung: Merkmal, Merkmalsausprägung
Deskriptive Statistik: Beschreibt Häufigkeit
der Ausprägungen eines speziellen Experiments
Weitergehende Annahme: Ausprägungen
werden mit einer gewissen Wahrscheinlichkeit
angenommen (Modell!)
Wahrscheinlichkeitsraum
Zufalls
Beobachtete Daten:
variable
Spezielle Realisierung
Diskrete Zufallsvariable
Zum Modellieren von diskreten Merkmalen
Ereignisraum Ω mit abzählbar vielen Ereignissen ω
Zufallsvariable:
ω → X (ω )
Bei diskreter ZV kann man Ω mit der Menge aller
Ausprägungen xi der Zufallsvariable identifizieren.
Beispiel: Augenzahl eines Würfels
Ω = {1,2,3,4,5,6},
X ( xi ) = xi
Also zum Beispiel X(3) = 3
Wahrscheinlichkeitsfunktion:
xi → P( X = xi )
Jedem Wert der Zufallsvariable (entspricht der
Merkmalsausprägung) wird seine Wahrscheinlichkeit
zugeordnet.
Damit ist im diskreten Fall die Zufallsvariable
vollständig charakterisiert.
Beispiel Würfel:
pi = P( X = xi ) = 1 / 6
Die ZV ist gleichverteilt!
Verteilungsfunktion:
F ( x) := P( X ≤ x)
Es gilt:
lim F ( x) = 0
x → −∞
lim F ( x) = 1
x →∞
F monoton steigend
Im diskreten Fall ist F eine Treppenfunktion
F ( x) :=
∑p
i: x i ≤ x
i
Vergleiche mit der kumulativen relativen Häufigkeit!
Verteilungsfunktion des Würfelbeispiels:
Beispiel Würfel:
F ( x ) = x  0 < x < 7
1
0.8
0.6
F
0.4
0.2
0
0
1
2
3
4
x
5
6
7
Erwartungswert einer ZV:
Zufallsvariable X mit Werten x1,x2,…,xr
E ( X ) := x1 p1 + x2 p2 + + xr pr
Beispiel Würfel:
1+ 2 + 3 + 4 + 5 + 6
µ := E ( X ) =
= 3.5
6
Beachte, dass auch gilt:
P ( X ≤ 3.5) = P ( X ≥ 3.5) = 0.5
Der Mittelwert ist hier gleich dem MEDIAN der ZV
Varianz einer ZV:
Zufallsvariable X mit Werten x1,x2,…,xr und E(X) = µ
Var( X ) := ( x1 − µ ) 2 p1 + + ( xr − µ ) 2 pr
Beispiel Würfel:
2
2
2
2
2
2
+
+
+
+
+
2
.
5
1
.
5
0
.
5
0
.
5
1
.
5
2
.
5
= 2.916
σ 2 := Var ( X ) =
6
Alternative Berechnungsformel für Varianz:
r
Var( X ) = ∑ xi p i − [E( X ) ]
i =1
2
2
Eigenschaften von Erwartungswert und
Varianz einer ZV:
Seien X und Y eine ZV und α eine reelle Zahl
Dann gilt:
E(αX ) = α E( X )
E( X + Y ) = E( X ) + E(Y )
Var(αX ) = α 2 Var( X )
Var( X + α ) = Var( X )
Unabhängige ZV:
Zwei Zufallsvariablen X und Y heißen unabhängig, falls
für beliebige Mengen A und B ihres Wertebereiches:
P( X ∈ A und Y ∈ B ) = P( X ∈ A) P(Y ∈ B)
Für unabhängige ZV gilt (und zwar NUR für
unabhängige):
Var( X + Y ) = Var( X ) + Var(Y )
Bsp 4-8 an der Tafel
Bernoulli Experiment:
Beispiele:
Bsp 4-8
Prozent
Experiment mit nur zwei
möglichen Ergebnissen
100
80
60
•Münzwurf (Kopf oder Zahl)
•Medizin (krank oder gesund)
Codiere Ergebnisse mit X=0
und X=1
40
20
0
X=0
Ergebnis 0 hat Wahrscheinlichkeit p
Ergebnis 1 hat Wahrscheinlichkeit q = 1-p
X=1
Binomialverteilung:
Führe n unabhängige Bernoulli Experimente durch
Bezeichne mit X die Anzahl wie oft Ereignis 0 eintritt,
dann ist X binomialverteilt:
Man schreibt:
X~B(n;p)
gibt die Anzahl der Kombinationen mit k Ergebnissen 0
Beachte: Für Bsp. 4-8,c gilt
Z~B(2;0.2)
Bsp. 15: Schadhafte Disketten
Disketten funktionstüchtig mit p = 0.8
Packungen der Größe 10
X … Anzahl der guten Disketten pro Packung
Wahrscheinlichkeitsfunktion:
Etwa für k=2:
Binomialverteilung: Beispiel 15 (S. 95)
Internet Tip: Statistics Tools for Internet and Classroom
Instruction – Tools – Binomial Histogram
Eigenschaften der Binomialverteilung
Sei X~B(n;p), dann gilt:
Mittelwert: µ = n p
Varianz:
σ2 = n p q
Anwendung: Ziehen mit zurücklegen
M von N Objekten erfüllen eine gewisse Eigenschaft E
Ziehe n mal mit zurücklegen, wir groß ist die
Wahrscheinlichkeit k Objekte mit Eigenschaft E zu ziehen?
Antwort: X~B(n;M/N)
(Bsp. 4-10 an der Tafel)
Hypergeometrische Verteilung:
Bsp 4-13 an der Tafel – Ziehen ohne Zurücklegen
Hypergeometrische Verteilung mit Parametern N,M und n
Mittelwert:
Varianz:
Bsp. 4-15: Qualitätskontrolle
30 Disketten, davon 10 schadhaft
Wähle Stichprobe der Größe 6
a) Mit welcher Wahrscheinlichkeit sind weniger als
2 Disketten der Stichprobe schadhaft?
P(X < 2) = P(X = 0) + P(X = 1)
Hypergeom. Verteilung mit N=30, M=10, n=6
Bsp. 4-15: Qualitätskontrolle
b) Wie groß sind Erwartungswert und Varianz der
entnommenen defekten Disketten?
Mittelwert:
Varianz:
Poissonverteilung:
Diskrete Zufallsvariable mit unendlich vielen Werten:
Mittelwert: µ = λ
Varianz:
σ2 = λ
Typische Anwendung: Verteilung seltener Ereignisse
• Kunden an einem Schalter pro Zeiteinheit
• Schadensfälle pro Zeiteinheit (Versicherung)
• Pro Zeiteinheit zerfallende Atome (Radioaktivität)
Beispiel 4-16: Bankschalter
Im Mittel 3 Kunden pro Minute und Zahl der
eintreffenden Kunden X sei Poisson-verteilt, d.h.
und µ = λ = 3.
Gegenwahrscheinlichkeit:
Poissonverteilung als Approximation
für die Binomialverteilung:
Eine binomialverteilte Zufallsvariable X~B(n;p) ist für
großes n und kleines k näherungsweise Poissonverteilt
mit Parameter λ = n k
Wahrscheinlichkeiten der Poissonverteilung sind für
große n leichter (schneller) zu berechnen als für die
Binomialverteilung
Faustregel: n>10 und p<0.05 Approximation OK
Bsp 4-17 Buch S. 102
X~B(250;0.04) n p = 10
Verwende Poisson-Approximation mit λ = 10
Wahrscheinlichkeits
funktion
14
Verteilungsfunktion
120
12
100
10
80
8
60
6
40
4
20
2
POISSON
BINOM
0
,0
K
2
4
6
8
10
12
14
16
18
20
22
24
POICUM
BINCUM
0
,0
K
2
4
6
8
10
12
14
16
18
20
22
24
Zusammenfassung: Wahrscheinlichkeitsfunktionen von diskreten Verteilungen
Gleichverteilung:
Binomialverteilung:
Hypergeometrische Verteilung:
Poisson Verteilung:
Problem der Wartezeit:
Bei dem Problem von Beispiel 4-16 kann man die Frage
stellen, wie lange es dauert, bis jeweils der nächste
Kunde zum Bankschalter kommt (typische Fragestellung
bei Warteschlangenmodellen, Lebensdauer von
Verschleißteilen, etc.
Die Wartezeit zwischen zwei poissonverteilten
Ereignissen ist Exponentialverteilt!
Dies ist eine stetige Zufallsvariable für die metrische
Variable Zeit.
Stetige Verteilungen
Verteilungsfunktion der Exponentialverteilung
Exponentialverteilung (lambda = 1)
1.5
F(x)
1
0.5
0
-0.5
-2
-1
0
1
2
x
3
4
5
6
Stetige Verteilungen
Beachte dass bei stetigen Zufallsvariablen nun die reelle
Variable x die Rolle übernimmt, die bisher k hatte.
Rechenbeispiele (Parameter λ = 1):
Stetige Verteilungen: Dichte
Für stetige Verteilungen gilt immer
Das Konzept der Wahrscheinlichkeitsfunktion (wie im
diskreten Fall) ist hier daher nicht zielführend!
Anstelle dessen verwendet man die Dichtefunktion der
Zufallsvariable, die als Ableitung der
Verteilungsfunktion definiert ist:
Stetige Verteilungen: Dichte
Mit Hilfe der Dichtefunktion werden für stetige
Zufallsvariablen Wahrscheinlichkeiten, Erwartungswert
und Varianz mittels Integration berechnet.
(Mehr darüber nächstes mal)
Für die Exponentialverteilung ergibt sich besonders
einfach:
Mittelwert: µ = 1/λ
Varianz:
σ2 = 1/ λ2
Warteschlangenproblem
Für jedes Zeitintervall [s, s+t] seien eintretende Ereignisse
poissonverteilt mit Parameter λt.
Dann ist die Zeit T die zwischen zwei Ereignissen vergeht
exponentialverteilt mit Parameter λ.
Buch S.116, Bsp 4-26:
Im Mittel fallen 3 Maschinen pro Stunde aus
es fallen 0.05 Maschinen pro Minute aus
λ = 0.05
Τ exponentialverteilt mit λ = 0.05,
E(T) = 1/0.05=20, Var(T) = 202 = 400
Herunterladen