Document

Werbung
Prof. Dr. Roland Füss
Statistik II
SS 2008
1. Zufallsvariable und Verteilungsfunktion
1.1 Die Wahrscheinlichkeits- und Verteilungsfunktion
• Notation:
X : Zufallsvariable, x i : eine bestimmte Ausprägung von X
• Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable:
Eine Funktion f (xi ) , die jeder Ausprägung x i der (abzählbar unendlichen) Zufallsvariable X eine Wahrscheinlichkeit P( X = xi ) zuordnet heißt Wahrscheinlichkeitsfunktion.
• Eigenschaften: 0 ≤ f (xi ) ≤ 1 und ∑ f (x
n
)=1
i =1
1
Prof. Dr. Roland Füss
Statistik II
SS 2008
Z.B. Würfel:
• Verteilungsfunktion einer diskreten Zufallsvariablen:
Die Wahrscheinlichkeitsfunktion F ( x ) , welche die Wahrscheinlichkeit angibt, dass die Zufallsvariable X einen Wert kleiner oder
2
Prof. Dr. Roland Füss
xi
gleich
annimmt,
Statistik II
P( X ≤ xi ) ,
SS 2008
heißt
Verteilungsfunktion:
xi
F ( x ) = ∑ f ( xi )
i =1
• Eigenschaften:
(1) F ( x ) ist monoton steigend:
wenn x2 > x1 ist auch immer F ( x 2 ) > F ( x1 )
(2) F ( x ) ist rechtsseitig stetig
F ( x ) = 0 und lim F ( x ) = 1
(3) xlim
→ −∞
x → +∞
3
Prof. Dr. Roland Füss
Statistik II
SS 2008
Z.B. Würfel:
zu (2) rechtsseitig stetig: z.B. man nähert sich der 2 von rechts:
lim+ = F (2 ) =
x→ 2
2
6
4
Prof. Dr. Roland Füss
Statistik II
SS 2008
man nähert sich der 2 von links:
lim− = F (1) =
x→ 2
1
6
• Wahrscheinlichkeitsintervall einer diskreten Zufallsvariable:
P ( x1 < X ≤ x2 ) = P( X ≤ x2 ) − P ( X ≤ x1 ) = F ( x2 ) − F ( x1 )
5
Prof. Dr. Roland Füss
Statistik II
SS 2008
1.2 Stetige Zufallsvariable
• Dichtefunktion einer stetigen Zufallsvariable:
für den Fall einer überabzählbar unendlichen Zufallsvariable gilt für
die Dichtefunktion:
+∞
(1)
∫ f ( x ) dx = 1
−∞
und
(2) f ( x ) ≥ 0
• Die Dichtefunktion kann nur in einem unendlichen Intervall [− ∞;+∞]
oder endlichen Intervall [xu ; x o ] positive Werte annehmen (d.h. die
Punktwahrscheinlichkeit ist 0), z.B.:
⎧0,5 , 3 < x < 5
f (x ) = ⎨
⎩0 , sonst
6
Statistik II
Prof. Dr. Roland Füss
SS 2008
• Verteilungsfunktion einer stetigen Zufallsvariable:
Die Verteilungsfunktion stellt die Fläche unter der Dichtefunktion
bis zur Stelle x dar: F (x ) =
x
∫ f (u )du
−∞
• Eigenschaften:
(1) für x < xu :
(2) für
F (x ) = 0
xu ≤ x < x o :
(3) für x ≥ xo :
F (x ) =
x
∫ f (u )du
xu
F (x ) = 1
7
Prof. Dr. Roland Füss
Statistik II
SS 2008
Die Dichtefunktion ist die erste Ableitung der Verteilungsfunktion,
d.h.
dF ( x )
= f (x )
dx
• Wahrscheinlichkeitsintervall einer stetigen Zufallsvariable:
b
P (a < x < b ) = ∫ f ( x )dx = F (b ) − F (a )
a
8
Prof. Dr. Roland Füss
Statistik II
SS 2008
1.3 Erwartungswerte von Zufallsvariablen
• Erwartungswert:
Der Erwartungswert der Zufallsvariable X, E ( x ) oder auch µ , ist
wie folgt definiert:
n
im diskreten Fall:
im stetigen Fall:
E ( x ) = ∑ xi ⋅ f ( xi )
i =1
E (x ) =
+∞
∫ x ⋅ f (x )dx
−∞
9
Statistik II
Prof. Dr. Roland Füss
SS 2008
1.4 Varianzen von Zufallsvariablen
• Varianz und Standardabweichung:
2
Die Varianz der Zufallsvariable X , Var (x ) oder auch σ , ist wie
folgt definiert:
n
im diskreten Fall:
n
σ = ∑ ( xi − E ( X )) ⋅ f (xi ) = ∑ xi2 f (xi ) − E ( X )2
2
i =1
2
i =1
Oft lässt sich die Varianz mit der zweiten Version dieser Gleichung
einfacher berechnen.
10
Statistik II
Prof. Dr. Roland Füss
σ =
2
im stetigen Fall:
SS 2008
+∞
2
(
(
)
)
x
−
E
X
⋅ f ( x )dx
∫
−∞
Auch für diese Gleichung ist folgende Umformung oft nützlich:
σ2 =
+∞
2
∫ x ⋅ f (x )dx − E ( X )
2
−∞
• Die Standardabweichung ist in beiden Fällen:
σ = Var ( X ) = σ 2
11
Statistik II
Prof. Dr. Roland Füss
SS 2008
1.5 Momenterzeugende Funktionen
• Moment um Null:
Das n-te Moment um Null einer Zufallsvariable ist definiert als:
( ) = ∑ x f (x )
n
diskreter Fall:
E X
n
n
i
i =1
i
+∞
stetiger Fall:
( ) = ∫ x f (x )dx
E X
n
n
−∞
2
• Beachte den Unterschied: E (x ) und E ( x ) beim Berechnen der
2
Varianz:
12
Statistik II
Prof. Dr. Roland Füss
+∞
( ) ∫x
E x2 =
2
−∞
SS 2008
⋅ f ( x )dx im Vergleich zu E ( x )
2
⎛ +∞
⎞
⎜
= ⎜ ∫ x ⋅ f ( x )dx ⎟⎟
⎝ −∞
⎠
2
Der erste Term ist also das zweite Moment um Null, während der
zweite Term das erste Moment um Null (= Erwartungswert) zum
Quadrat ist.
• Zentrales Moment n-ter Ordnung:
(
)
n
diskreter Fall: E ( X − E ( X )) = ∑ (xi − E ( X )) ⋅ f (xi )
n
n
i =1
13
Statistik II
Prof. Dr. Roland Füss
(
) ∫ (x − E ( X ))
stetiger Fall: E ( X − E ( X )) =
n
SS 2008
+∞
n
⋅ f ( x )dx
−∞
Die Varianz ist also das zentrale Moment zweiter Ordnung.
1.6 Standardisieren
X mit Erwartungswert µ und Standardab-
Eine Zufallsvariable
weichung
σ
lässt sich zur standardisierten Zufallsvariable Z
transformieren: Z =
X −µ
σ
14
Prof. Dr. Roland Füss
Statistik II
SS 2008
Eigenschaften:
1
µ µ
⎛ X −µ⎞ 1
(
)
(
)
E (Z ) = E ⎜
=
E
X
−
E
=
− = 0 und
µ
⎟
σ σ
σ
⎝ σ ⎠ σ
σ2
⎛X −µ⎞ 1
Var (Z ) = Var ⎜
⎟ = 2 Var ( X ) = 2 = 1
σ
σ
⎠ σ
⎝
Eine Standardisierte Zufallsvariable hat also einen Erwartungswert
von 0 und eine Varianz von 1.
15
Prof. Dr. Roland Füss
Statistik II
SS 2008
1.7 Tschebyscheffsche Ungleichung
Mit der Ungleichung von Tschebyscheff kann die Wahrscheinlichkeit
geschätzt werden, dass eine Zufallsvariable in einem symmetrisch
um den Erwartungswert gelegenen Intervall liegt. Je nach Verteilung
wird die Wahrscheinlichkeit sehr ungenau. Vorteil ist aber, dass die
Verteilung nicht bekannt sein muss:
P (µ − c ⋅ σ < X < µ + c ⋅ σ ) oder auch P( X − µ < c ⋅ σ )
16
Prof. Dr. Roland Füss
Statistik II
SS 2008
Die Wahrscheinlichkeit, dass sich X um wenigstens cσ von µ
1
(
)
P
X
−
≥
c
⋅
≤
µ
σ
unterscheidet, lässt sich abschätzen als:
c2
.
Die Wahrscheinlichkeit, dass sich X um höchstens cσ von µ
1
(
)
P
X
−
<
c
⋅
>
1
−
µ
σ
unterscheidet, lässt sich abschätzen als:
c2
.
17
Statistik II
Prof. Dr. Roland Füss
SS 2008
1.8 Schiefe und Wölbung
Die Schiefe einer Verteilung zeigt an, wie stark die Verteilung nach
rechts (negative Schiefe) oder nach links (positive Schiefe) geneigt
ist. Die Wölbung zeigt an, wie hoch die Wahrscheinlichkeiten um den
Mittelwert und die extremen Enden der Verteilung liegen.
• Schiefe:
(
E ( X − E ( X ))
3
σ3
)
,
d.h. die Schiefe ist das zentrale Moment dritter Ordnung bezogen
auf die Standardabweichung in der dritten Potenz.
18
Statistik II
Prof. Dr. Roland Füss
• Kurtosis:
(
E ( X − E ( X ))
4
σ4
SS 2008
)
,
d.h. die Kurtosis ist das zentrale Moment vierter Ordnung bezogen
auf die Standardabweichung in der vierten Potenz.
Eine Kurtosis >3 wird auch als Excess Kurtosis bezeichnet.
19
Prof. Dr. Roland Füss
Statistik II
SS 2008
1.9 Median, Quantile und Modus
• Median:
Der Median oder Zentralwert xMed einer Zufallsvariablen X ist
diejenige Zahl, für welche die Wahrscheinlichkeit, dass X grösser
oder kleiner als xMed ist, gleich groß ist: P( X ≤ xMed ) = F ( xMed ) = 0,5
−1
(0,5)
x
=
F
oder: Med
Da sich der Median für viele diskrete Zufallsvariablen nicht eindeutig bestimmen lässt schreibt man auch:
20
Prof. Dr. Roland Füss
und
Statistik II
SS 2008
P( X ≤ xMed ) ≥ 0,5 ⎫
⎬
P(( X ≥ xMed ) ≥ 0,5⎭
• Quantil:
Eine Zahl x[q] mit 0 < q < 1 heisst q-Quantil wenn gleichzeitig gilt:
und
P( X ≤ x[q ]) ≥ q
⎫
⎬
P(( X ≥ x[q ]) ≥ 1 − q ⎭
Der Median ist also das 0,5- oder 50%-Quantil und das q-Quantil
eine Verallgemeinerung.
21
Prof. Dr. Roland Füss
Statistik II
SS 2008
• Modus:
der Modus einer Verteilung ist diejenige Zahl xM , die im diskreten
Fall die höchste Eintrittswahrscheinlichkeit oder im stetigen Fall die
höchste Wahrscheinlichkeitsdichte aufweist:
f ( xM ) > f ( x ) für alle x ≠ xM
22
Herunterladen