Statistik - Ingo Manfraß

Statistik (Informations- &
Prozesstechnologien)
Dies’ ist kein Selbstlernskript, sondern lediglich als Hilfe
für die Vorlesung gedacht. Es enthält u.a. etliche Lückentexte.
Studiengang: BBA/BAIM/BST an der FOM
Münster
Zudem ist es nur für die Vorlesung ’Statistik’ gedacht, die
ich halte.
Alle Angaben sind (wie immer) ohne Gewähr. D.h. Fehler sind
menschlich und bitte ich somit zu entschuldigen...
Ingo Manfraß (TEAM Dr. Kowalski)
Ingo Manfraß
19. März 2016
Kapitel I
§1
Deskriptive Statistik
Grundlagen
Konvention“ für indizierte lateinische Buchstaben
”
• Verteilung (Vtlg.)
• Parameter
Kleinbuchstaben
h3,fi
Großbuchstaben
H3,Fk
einzelne Werte
alle bis zum Index aufsummierten Werte
• Stichprobe (Stp.)
• Grundgesamtheit (GG)
2
1
Quicky Zähle die Daten aus und vervollständige die Tabelle:
Noten
§1.1 Begrifflichkeiten
x∗i
Strichliste
absolute
relative
kumulierte
Häufigkeit
Häufigkeit
rel. Häufigkeit
hi
fi
Fi
1
Beispiel In einem Kurs fallen 25 Mathe-Noten an:
2
3,3,5,2,4,2,3,3,4,2,3,3,2,4,3,4,1,1,5,4,3,1,2,4,3
3
4
5
6
Σ
3
4
Absolute Häufigkeiten [Quelle: Matsam]
Aus der letzten Spalte kann man die folgenden Dinge ablesen:
. . . Durchfallquote
. . . sind besser als 4
. . . sind schlechter als 3
5
6
Definition Gegeben seien n Beobachtungswerte (Zahlen)
x1, . . . , xn.
Dann heißt das Tupel (Vektor)
x = (x1, . . . ,xn)
eine Stichprobe vom Umfang n. Die einzelnen Zahlen xi
nennt man Stichprobenwerte.
Die in der Stichprobe vorkommenden unterschiedlichen
Werte x∗k ; d.h.
x∗ = (x∗1, . . . ,x∗s )
heißen Merkmalwerte.
Die Anzahl des Auftretens von x∗k in x; d.h.
h(x∗k ) = hk
Bemerkung Es gilt dabei
hk = n
s
X
fk = 1
bzw.
k=1
und
Abk.
0 ≤ fk ≤ 1
heißt absolute Häufigkeit von x∗k in x; die Quotienten
h
fk = k
n
heißen relative Häufigkeiten.
s
X
k=1
für alle k
7
8
Das Summenzeichen
Relative Häufigkeiten [Quelle: Matsam]
Für eine aufsummierte Folge von Zahlen, die einem Schema folgen, führt man die sogenannte Summenschreibweise
ein:
Statt
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ··· + n
schreibt man kurz mit
ak = k
die Summe in der Form:
n
X
ak
k=1
9
10
Rechenregeln:
Vervielfachung einer Summe
b
X
Beispiel
5
X
k=a
λ · xk = λ ·
b
X
xk
k=a
mit λ ∈ R
k=
k=3
12
11
Aufteilung einer Summe
Addition zweier Summen
b
X
k=a
xk +
b
X
k=a
yk =
b
X
b
X
xk + yk
k=a
k=a
13
xk =
c
X
k=a
xk +
b
X
xk
mit a < c < b
k=c+1
14
Quicky Berechne soweit wie möglich:
a)
12
P
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten fk .
Dann heißt die Summe der relativen Häufigkeiten derjenigen Merkmalwerte x∗i , die kleiner oder gleich x∗k sind,
also
k
k=10
b)
5
P
3
k=−5
c)
100
P
(3k + 2)
(Nutze:
k=1
d)
100
P
k=1
100
P
X
x∗i ≤x∗k
k = 5050)
die relative Summenhäufigkeit bzw. kumulierte relative
Häufigkeit von x∗k in x.
k=1
2k −
99
P
fi = Fk
2k
k=0
16
15
Tabelle zur Körpergröße von Kindern [Quelle: Matsam]
Definition (empirische Verteilungsfunktion)
Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ =
(x∗1, . . . ,x∗s ) und relativen Summenhäufigkeiten Fi.
Dann heißt die Funktion
F : R → [0; 1]
mit
F (x) =



0
Fi



1
mit x < x∗1
mit x∗i ≤ x < x∗i+1
mit x ≥ x∗s
empirische Verteilungsfunktion der Stichprobe x
17
Diagramm zur rel. und kom. Häufigkeit [Quelle: Matsam]
18
§1.2 Lageparameter
Fallbeispiel 1 Ein Kiosk-Betreiber ist mit sechs Filialen im
Markt und plant die Eröffnung eines siebten Standortes.
Dazu soll ein neuer Mitarbeiter angeworben werden. Die
sechs vorhandenen Mitarbeiter verdienen an den unterschiedlich frequentierten Standorten die folgenden Bruttogehälter:
x = (950,1200,1370,1580,1650,1800)
x̄ =
x̃ =
19
20
Fallbeispiel 1 Der mittlere Verdienst x̄ beträgt also 1425.
Dem Betreiber der Trinkhallen erscheint dieser Durchschnittsverdienst bei der Anwerbung eines neuen Mitarbeiters nicht besonders attraktiv zu sein. Er befürchtet,
bei diesen Verdienstmöglichkeiten keinen Mitarbeiter gewinnen zu können. Er kommt daraufhin zu dem Schluß,
seinen eigenen Verdienst von brutto 6000 mitzuberücksichtigen. Schließlich gehört er ja auch zum Stab der
Mitarbeiter, wenn auch in exponierter Position. Er legt
also zur Berechnung des Durchschnittsverdienstes die
erweiterte Stichprobe:
xneu = (950,1200,1370,1580,1650,1800,6000)
zugrunde.
x̄neu =
x̃neu =
21
22
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißt die reelle Zahl
x̄ =
n
1 X
xi
n i=1
=
s
1 X
hk · x∗k
n k=1
=
s
X
k=1
Definition Sei x = (x1, . . . ,xn) eine Stichprobe und xg =
(x(1),x(2), . . . ,x(n)) die der Größe nach angeordnete Stichprobe, also
x(1) ≤ x(2) ≤ · · · ≤ x(n)
Dann heißt die reelle Zahl



x n+1


2
x̃ =


1


 2 x( n ) + x( n +1)
2
2
fk · x∗k
mit n ungerade
mit n gerade
der empirische Median oder Zentralwert von x.
arithmetischer bzw. empirischer Mittelwert.
23
24
Quicky An einer Sägemaschine wurden in sechs Messungen folgende Verschnitte in Zentimetern festgestellt:
3,3,14,3,2,3
Definition Sei x = (x1, . . . ,xn) eine Stichprobe, dann heißt
jeder Merkmalwert x∗i , der am häufigsten in x vorkommt,
Modus bzw. Modalwert xD .
Wieviel durchschnittlichen Verschnitt muss der Betreiber seinen Kunden nennen?
• Arithmetisches Mittel:
• Median:
• Modus:
26
25
Quicky Von 10 Mitarbeitern eines Unternehmens beziehen
neun ein Jahreseinkommen von je 40.000 EURO, einer
(nämlich der Geschäftsführer) ein Jahreseinkommen von
400.000 EURO, so lässt sich das Durchschnittseinkommen wie folgt bestimmen:
Quicky Ermittle die Graphen der zugehörigen empirischen
Verteilungsfunktion F und ermittle jeweils auf zweifache
Art den zugehörigen Median (aus der Tabelle und der
Verteilungsfunktion).
b)
a)
• Arithmetisches Mittel:
• Median:
x∗k
Fk
x∗k
Fk
2
0.15
1
0.12
3
0.50
2
0.32
4
0.60
3
0.68
5
1.00
4
0.92
5
1.00
• Modus:
27
28
Mögliche Kandidaten für ein Streuungsmaß:
§1.3 Streuungsmaße
Streungsmaße sind Maße für die Repräsentanz des Mittelwertes x̄.
Beispiel Berechne Mittelwert und Median für die beiden
Stichproben x und y mit
① Arithmetisches Mittel der Abstände
n
1 X
(xi−x̄) =
n i=1
x = (3,3,3,4,4,4,5,6)
und
y = (−26, − 10,0,4,10,20,30)
29
30
② Arithmetisches Mittel der absoluten Abstände bzw. mittlere absolute Abweichung
n
1 X
|xi − x̄|
n i=1
③ Arithmetisches Mittel der Abstandsquadrate bzw. empirische Varianz
Quicky Berechne jeweils die Varianz für x und y aus obigem Beispiel.
Für x:
Für y:
n
1 X
(xi − x̄)2
n i=1
32
31
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißen
s2
n (x) =
=
n
1 X
(xi − x̄)2
n i=1
s
X
k=1
bzw.
s2
n−1 (x) =
n
n
1 X
1 X
(xi − x̄)2 =
(x2 − 2xix̄ + x̄2)
n i=1
n i=1 i
=
s
1 X
hk (x∗k − x̄)2
n k=1
=
s2
n (x) =
=
fk (x∗k − x̄)2
=
n
1 X
(xi − x̄)2
n − 1 i=1
die empirische Varianz und die zugehörige positive Wurzel
q
s = + s2
empirische Standardabweichung von x.
33
=
=


n
n
n
X
X
1 X
x2 −
2xix̄ +
x̄2
n i=1 i
i=1
i=1


n
n
n
X
X
1 X
x2 − 2x̄
xi + x̄2
1
n i=1 i
i=1
i=1


n
1 X
x2 − 2nx̄2 + nx̄2
n i=1 i


n
1 X
x2 − nx̄2
n i=1 i
n
1 X
x2 − x̄2
n i=1 i
34
Quicky Berechne die Varianzen für x und y aus obigem
Beispiel mittels einer geeigneten Tabelle:
a)
2
Warum gibt es zwei Varianzversionen s2
n und sn−1 ?
b)
xi
x2
i
yi
yi2
3
3
3
s2
n−1 ist zu verwenden, wenn man
damit die Grundgesamtheitsvarianz
σ 2 schätzen will.
4
4
4
5
6
35
36
Ein weiteres Streuungsmaß ist die Spannweite:
Synchronisationsformel
s2
n−1 (x) =
Definition Die Spannweite r(x) einer Stichprobe x =
(x1, . . . ,xn) ist die positive Differenz des größten und
kleinsten Merkmalwertes von x.
n
s2 (x)
n−1 n
n
n
i=1
i=1
r(x) = max{xi} − min{xi}
37
38
§1.4 Mehrdimensionale Stichproben
Mit mehrdimensional ist hier zweidimensional gemeint.
Beispiel Körpergröße xi und Körpergewicht yi
xi
170
165
173
180
161
168
171
176
169
179
yi
75
60
64
79
62
76
71
72
65
85
40
39
Beispiel Drehzahl xi und Leistung yi
xi
800
1500
2500
3500
4200
4700
5000
5500
yi
12
20
31
40
52
60
65
70
41
Definition Gegeben seien n Paare (x1,y1), . . . ,(xn,yn) von
Zahlenwerten, die an n Individuen bzgl. zweier Merkmale
ermittelt werden.
Dann heißt
(x,y) = (x1,y1), . . . ,(xn,yn)
42
Daraus folgt:
bzw.
hik = n
s X
r
X
fik = 1
i=1 k=1
eine zweidimensionale Stichprobe vom Umfang n.
Falls die beiden Merkmale x,y die unterschiedlichen Werte
x∗1, . . . ,x∗s
s X
r
X
y1∗ , . . . ,yr∗
i=1 k=1
haben, so können in der Stichprobe die s · r Merkmalpaare (x∗i ,yk∗ ) vorkommen.
Die absolute Häufigkeit des Merkmalpaares (x∗i ,yk∗) bezeichnet man mit hik , die relative Häufigkeiten mit fik :=
0 ≤ fik ≤ 1
für alle i,k
hik
n
44
43
Veranschaulichung zweidimensionaler Häufigkeitsverteilungen mittels Kontingenztafeln:
(hik )
Zweidimensionale Verteilungen [Quelle: Matsam]
y1∗
y2∗
...
yk∗
...
yr∗
h11
h12
...
h1k
...
h1r
...
h21
...
h22
...
...
...
h2k
...
...
...
h2r
...
x∗i
...
hi1
...
hi2
...
...
...
hik
...
...
...
hir
...
x∗s
hs1
hs2
...
hsk
...
hsr
x∗1
x∗2
45
46
§1.5 Korrelation
Einführung eines neuen Parameters als Maß für den Zusammenhang der Merkmale x und y.
Beispiel
Die Randhäufigkeiten“ h·k , hi· nennt man Randverteilun”
gen der zweidimensionalen Stichprobe (x,y).
annähernd linear
steigend
diffus
48
47
Generalvoraussetzung
2
s2
x := sn−1
Erinnerung
Empirische Kovarianz:
x = (x1, . . . ,xn)
sxy =
Varianz:
s2
x =
n
n
1 X
1 X
(xi − x̄)2 =
(xi − x̄)(xi − x̄)
n − 1 i=1
n − 1 i=1
(x,y) = (x1,y1), . . . ,(xn,yn)
n
1 X
(xi − x̄)(yi − ȳ)
n − 1 i=1
50
49
Überträgt man diese Normierung, so erhält man:
Definition
Normierung der Varianz zur Standardabweichung:
Sei (x,y) =
(x1,y1), . . . ,(xn,yn)
mensionale Stichprobe; dann heißt
q
s2
x
sx = + s2
x =
sx
sxy
r(x,y) =
=v
u
sx · sy
u
t
n
P
i=1
n
P
eine zweidi-
(xi − x̄)(yi − ȳ)
(xi − x̄)2
i=1
!
n
P
i=1
(yi − ȳ)2
!
der empirische Korrelationskoeffizient von (x,y)“.
”
51
52
Also:
Arbeitstaugliche Version:
r(x,y) = v
u
u
t
r(x,y) = v
u
?
n
P
i=1
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
u
t
!
n
P
i=1
n
P
i=1
xiyi − nx̄ȳ
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
!
Arbeitstabelle:
mit
?=
n
X
i=1
xiyi − nx̄ȳ
53
54
Hauptsatz (Eigenschaften von r(x,y))
Für den empirischen Korrelationskoeffizienten
r einer zweidimensionalen Stichprobe (x,y) = (x1,y1), . . . ,(xn,yn)
gilt:
a) −1 ≤ r ≤ 1
c) Liegen alle Punkte (xi,yi) auf einer Geraden a + bx, so
gilt:
b) Aus |r| = 1 folgt die lineare Beziehung
yi = a + bxi
r=
für i = 1,2, . . . ,n
mit

 1
−1
für b > 0
für b < 0
Im Fall b = 0 ist wegen sy = 0 der Korrelationkoeffizient
nicht definiert.
s
a = ȳ − rx̄ · sxy
s
b = r · sxy
Die Punkte (xi,yi) liegen also auf einer Geraden, die für
r = −1 fallend und für r = 1 steigend ist.
55
56
57
58
Bemerkung Für den Korrelationkoeffizienten r gilt:
0 < |r| < 0.2
sehr geringe Korrelation
0.2 < |r| < 0.5
geringe Korrelation
0.5 < |r| < 0.7
mittlere Korrelation
0.7 < |r| < 0.9
hohe Korrelation
0.9 < |r| < 1
sehr hohe Korrelation
c) Arbeitstabelle
Fallbeispiel 3 Berechne den Korrelationskoeffizienten zum
Drehzahl-Beispiel. Gehe dabei wie folgt vor:
a) Arbeitstabelle aufstellen
b) Empirischen Korrelationskoeffizienten r bestimmen
xi
yi
800
12
1500
20
2500
31
3500
40
4200
52
4700
60
5000
65
5500
70
60
59
d)
xiyi − nx̄ȳ
r(x,y) = q P
P
( x2
−
nx̄2)( yi2 − nȳ 2)
i
P
§1.6 Regression
=
Interpolation und Extrapolation von Daten.
=
61
62
Konstruktion: Methode der kleinsten Quadrate nach C.F.
Gauß
(KQ-Schätzer)
Gesucht: ŷ = a + bx
Optimalgerade
64
63
f (a,b) :=
n
X
i=1
di =
n X
i=1
yi − (a + bxi)
2
→ minimieren
Herleitung mit der Mittelwertpunktbedingung.
(x̄,ȳ) liegt auf der gesuchten Geraden, d.h.
ȳ = a + bx̄
⇔
a = ȳ − bx̄
Ersetzt man nun in f a durch ȳ − bx̄, so reduziert sich f
zu einer eindimensionalen reellwertigen Funktion.
f ist also eine reellwertige Funktion vom Typ
f : R2 → R
66
65
Dieses liefert als Lösung:
n
P
(yi − ȳ)(xi − x̄)
sxy
b = i=1 P
= 2
n
sx
(xi − x̄)2
Definition Die oben konstruierte Optimalgerade
ŷ = a + bx
i=1
und heißt empirischer“ Regressionskoeffizient.
”
Er ist die Steigung der gesuchten Optimalgerade. Mit der
Mittelwertpunktbedingung (a = ȳ − bx̄) ist ŷ = a + bx dann
bestimmt.
heißt empirische Regressionsgerade oder empirisches Regressionspolynom ersten Grades.
68
67
Fallbeispiel 3 Berechne die Regeressionsgerade zum DrehzahlBeispiel
Polynom
2. Grades
69
Polynom
höheren Grades
70
Fallbeispiel 4
a) Das Regressionspolynom 2. Grades ist
ŷ = 11.952,77 − 13,8012x + 0,003974x2
Ein Regressionspolynom höheren Grades ist etwa
ŷ = a + bx + cx2
Die zugehörigen Koeffizienten a, b und c erhält man durch
lösen des linearen Gleichungssystems, das sich aus den zugehörigen drei partiellen Ableitungen ergibt. Diese heißen
Normalengleichungen“.
”
b) Berechnung der Trendwerte ŷ
72
71
c) Schätzung der Bevölkerung im Jahr 1945
d) Schätzung der Bevölkerung im Jahr 1960
Fazit: Bei nichtlinearen Regressionsfunktionen sollte man
auf Extrapolationen verzichten.
e) Schätzung der Bevölkerung im Jahr 1840
73
Kapitel II
§2
74
Induktive Statistik
Zufallsvariable Funktion der Stichprobenwerte; d.h. der
Wert ist noch nicht zugewiesen.
Grundlagen der ind. Statistik
Wahrscheinlichkeitsfunktion Ordnet jedem Ereignis eine
Wahrscheinlichkeit zu.
§2.1 Zufallsvariablen
Dichtefunktion Ordnet jedem Ereignis einen Wert zu.
Konvention“ für lateinische Buchstaben
”
Kleinbuchstaben
x,y,z
Großbuchstaben
X,Y,Z
realisierte Stichprobenwerte
Verteilungsfunktion Kumulierte Wahrscheinlichkeitsfunktion
Zufallsvariable
76
75
deskriptiv
x = (x1,x2, . . . ,xn)
−→
induktiv
−→
X = (X1,X2, . . . ,Xn)
Stichprobe mit Merkmalswerten xi
fi = f (xi)
Zufallsvektor mit Zufallsvariablen Xi
−→
relative Häufigkeit
Fi =
P
j≤i
fj
−→
relative Summenhäufigkeit
x̄
s2
n−1 (x)
F =
P
f
Verteilungsfunktion
−→
Empirischer Mittelwert
Empirische Varianz
f
Wahrscheinlichkeitsfunktion
Bemerkung Eine Zufallsfvariable X heißt diskret, wenn
X höchstens abzählbar“ viele verschiedene Werte an”
nehmen kann, andernfalls stetig.
E(X)
Stochastischer Erwartungswert
−→
Var(X)
Stochastische Varianz
77
78
Definition Ein Maß für die Sicherheit des Eintretens eines
Ereignisses ist die Wahrscheinlichkeit.
Die Wahrscheinlichkeit, mit der eine diskrete Zufallsvariable X die spezielle Ausprägung (bzw. Realisation,
Funktionswert) x annimmt, wird mit
Bemerkung Der Wahrscheinlichkeitsbegriff nach Laplace.
Sei A ein Ereignis, dann gilt
W (A) =
Anzahl der Günstigen
Anzahl aller Möglichkeiten
W (X = x)
bezeichnet.
80
79
Beispiel Schüler aus dem Notenbeispiel
Beispiel Einmaliger Würfelwurf
X=
X=
Wahrscheinlichkeit, dass ein zufällig getroffener Schüler
aus dem Notenbeispiel die Note 3 hat:
Wahrscheinlichkeit, dass eine 4 gewürfelt wird:
82
81
Beispiel Zweimaliger Münzwurf
Beispiel Dreimaliger Münzwurf
X=
X=
Wahrscheinlichkeit, dass einmal Wappen fällt:
Wahrscheinlichkeit, dass zweimal Wappen fällt:
83
84
Beispiel Beim dreimaligen Münzwurf gilt wieder:
Definition Die Funktion f , die jeder Ausprägung x einer
diskreten Zufallsvariablen X die Wahrscheinlichkeit ihres
Auftretens zuordnet, heißt Wahrscheinlichkeitsfunktion
f der diskreten Zufallsvariablen X (induktives Pendant
zu den relativen Häufigkeiten). D.h.
W (X = 0) =
W (X = 1) =
W (X = 2) =
f (x) = W (X = x)
W (X = 3) =
85
86
Quicky Zufallsexperiment: Ein Schüler aus dem Notenbeispiel wird zufällig auf dem Schulflur getroffen.
Zufallsvariable: X = Note des Schülers
Definition Sei ein Zufallsexperiment mit Ω gegeben und
sei X eine diskrete Zufallsvariable. Dann heißt die Funktion F , die jeder Ausprägung x von X die Wahrscheinlichkeit zuordnet, dass X höchstens den Wert x annimmt, also
F (x) := W (X ≤ x)
Verteilungsfunktion der diskreten Zufallsvariablen X.
87
f (x) = W (X = x)
F (x) = W (X ≤ x)
0
f (0) =
F (0) =
1
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
f (x) = W (X = x)
F (x) = W (X ≤ x)
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
4
f (4) =
F (4) =
5
f (5) =
F (5) =
6
f (6) =
F (6) =
P
88
Schwierig: Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f und Verteilungsfunktion F im stetigen Fall.
Quicky Zufallsexperiment: dreimaliger Münzwurf
Zufallsvariable: X = Anzahl der Wappen
x
x
1
deskriptiv
...
−→
−→
induktiv
...
P
89
90
Vergleiche dreimaliger Münzwurf:
Gegenüberstellung
diskret
stetig
diskret
W (a ≤ X ≤ b) =
W (a ≤ X ≤ b) =
stetig
92
91
Gegenüberstellung
diskret
W (X = a) =
Gegenüberstellung
stetig
W (X = a) =
diskret
stetig
Konsequenzen:
Fazit:
93
94
Gegenüberstellung
diskret
stetig
W (X ≤ a) =
Übertrag aus der Deskriptiven Statistik:
W (X ≤ a) =
Empirischer Mittelwert
x̄ =
=
Fazit: diskret
=
Fazit: stetig
n
1 X
xi
n i=1
s
1 X
hix∗i
n i=1
s
X
fix∗i
i=1
95
Stochastischer Erwartungswert
96
Empirische Varianz
• diskret
E(X) =
X
x
f (x) · x
s2
n (x) =
=
• stetig
E(X) =
Z∞
−∞
=
f (x) · x dx
n
1 X
(xi − x̄)2
n i=1
s
1 X
hi(x∗i − x̄)2
n i=1
s
X
i=1
fi(x∗i − x̄)2
97
98
Vereinbarung: (Statistischer Sprachgebrauch)
Unter dem Begriff statistische Verteilung“ versteht man
”
4 Komponenten:
Stochastische Varianz
• diskret
Var(X) =
X
x
f (x) x − E(X)
① Wahrscheinlichkeitsfunktion f
2
② Verteilungsfunktion F
• stetig
E(X) =
Z∞
−∞
f (x) x − E(X)
2
③ Stochastischer Erwartungswert E(X)
dx
④ Stochastische Varianz Var(X)
99
100
Wie viele Möglichkeiten gibt es beim Lotto (6 aus 49) sechs
Kugeln zu ziehen?
§2.2 Diskrete Verteilungen
Zum besseren Verständnis der bekannteren diskreten Verteilungen benötigt man einige Kenntnisse aus der Kombinatorik.
101
102
Binomialkoeffizient


 N 

=
n
Beispiel Wie Wahrscheinlich sind 6 Richtige im Lotto?
N!
(N − n)! · n!
=
=
=
103
104
Die hypergeometrische Verteilung
Variablen:
: Grundgesamtheitsumfang
N
Voraussetzungen:
n
M
N
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
x
• Merkmal ist diskret
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
M
• Merkmal ist dichotom
x
n
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe
• Ziehen ohne Zurücklegen (ZoZ)
106
105
Verteilung:
① Wahrscheinlichkeitsfunktion
f (x) = fH (x/N ; n; M ) =
③ Erwartungswert
 

 M   N −M 

·


x

E(X) =
n−x
x

 N 


n
Var(X) =
X
x
x
X
f (x) · x = n · θ
④ Varianz
② Verteilungsfunktion
F (x) = FH (x/N ; n; M ) =
X
f (x) x − E(X)
2
= nθ(1 − θ)
N −n
N −1
fH (ν)
ν=1
107
Beispiel Gesucht ist die Wahrscheinlichkeit im Lotto (6
aus 49) 3 bzw. 4 Richtige zu tippen.
108
Fallbeispiel 6 Glühbirnenbeispiel, 3. Evolutionsstufe
In einer Schachtel befinden sich 60 Glühbirnen. 20 davon
sind defekt. Ohne Zurücklegen werden nacheinander 10
Stück gezogen.
X = Anzahl brauchbarer Glühbirnen
Berechne die Wahrscheinlichkeiten:
a) Genau 7 brauchbare zu ziehen.
b) Mindestens 1 brauchbare zu ziehen.
109
110
Die Binomialverteilung
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit bestehen 5% der Tagesproduktion einer Maschine statt aus Rechtshänder-Hämmern, aus Hämmer für
Linkshänder. 20 Einheiten werden jeweils in einen Karton verpackt. Wie Wahrscheinlich ist es, dass bei einer Tagesproduktion von 1.000 Hämmern, ausschließlich
Hämmer für Rechtshänder im Karton sind?
Voraussetzungen:
• Merkmal ist dichotom
• Merkmal ist diskret
• Ziehen mit Zurücklegen (ZmZ)
111
112
Verteilung:
Variablen:
N
n
M
M
N
x
x
n
① Wahrscheinlichkeitsfunktion
: Grundgesamtheitsumfang
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe


 n  x
n−x
 θ (1 − θ)
f (x) = fB (x/n; θ) = 
x
② Verteilungsfunktion
F (x) = FB (x/n; θ) =
x
X
fB (ν)
ν=1
113
114
③ Erwartungswert
E(X) =
X
x
f (x) · x = n · θ
Beispiel Die Wahrscheinlichkeit beträgt 1,86%, dass man
beim einmaligen Lottospiel mindestens 3 Richtige hat,
und somit gewonnen hat. Wenn man 52 Wochen lang
Lotto spielt, wie wahrscheinlich ist es dann, mindestens
1-Mal in diesem Jahr im Lotto zu gewinnen?
④ Varianz
Var(X) =
X
x
f (x) x − E(X)
2
= nθ(1 − θ)
116
115
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit besteht bei der Produktion von Hämmern bei jedem Hammer eine 5%-Wahrscheinlichkeit, dass er fehlerhaft produziert wird. Die Hämmer werden stets zu 20
in einem Karton verpackt. Wie Wahrscheinlich ist es,
dass keine fehlerhaften Hämmer in einem zufällig ausgewähltem Karton sind?
117
§2.3 Stetige Verteilungen
Die Gaußsche Normalverteilung ist die wichtigste stetige
Verteilung.
118
10 DM-Schein [Quelle: Wikipedia]
Gaußsche Normalverteilung
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 x−µ 2
1
f (x) = fn(x/µ,σ 2) = √
· e− 2 ( σ )
σ 2π
② Verteilungsfunktion
F (x) = Fn(x/µ,σ 2) =
Z x
−∞ σ
1 ν−µ 2
1
√
· e− 2 ( σ ) dν
2π
120
119
1. Problem: Obige Funktionswerte (Fn) sind schwierig zu
berechnen; also benötigt man Tabellen für die Funktionswerte.
③ Erwartungswert
E(X) = µ
④ Varianz
2. Problem: Man benötigt für jedes Paar (µ,σ 2) eine eigene Tabelle!
Var(X) = σ 2
122
121
Idee der
Standardisierung“
”
Normalverteilung mit verschiedenen Parametern [Quelle:
123
Überträgt man die Idee der Standardisierung“ auf eine
”
normalverteilte Zufallsvariable X mit
Matsam]
124
Standardnormalverteilung
E(X) = µ und Var(X) = σ 2,
so ergibt sich:
Z :=
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 2
1
f (z) = fn(z) = √
· e− 2 z
2π
X −µ
σ
Z ist normalverteilt mit
② Verteilungsfunktion
E(Z) = 0 und Var(Z) = 1
F (z) = Fn(z) =
Man sagt dann auch kurz:
Z z
−∞
1 2
1
√
· e− 2 ν dν
2π
Z ist (0,1)-normalverteilt bzw. standardnormalverteilt“.
”
125
126
③ Erwartungswert
Konvention“ für Zufallsvariablen
”
E(Z) = 0
X,Y
④ Varianz
Z
Var(Z) = 1
Realität
Tabellen-/ Rechenwerte“
”
127
Vergleich von Normal- und Standardnormalverteilung
128
Tabellengebrauch:
[Quelle: Matsam]
z
FN (−z)
FN (−z) =
FN (z)
FN (z) =
129
Quicky Lies die folgenden Werte soweit möglich aus der
Tabelle zur Standardnormalverteilung ab.
D(z)
D(z) =
130
Standardnormalverteilung mit ausgewählten Flächenanteilen
[Quelle: Matsam]
a) W (Z ≤ 1,06)
b) W (Z ≤ −1,03)
c) W (Z ≥ 1,13)
d) In einem Unternehmen sei das Gehalt normalverteilt mit
µ = 30.000 EURO und σ = 5.000 EURO.
Berechne die Wahrscheinlichkeit, dass das Gehalt eines
Mitarbeiters maximal 25.000 EURO beträgt.
132
131
Beispiel Materialiensammlung, 7. Übung, Aufgabe 1
Die Brenndauer einer bestimmten Sorte Glühlampen ist
normalverteilt mit dem Mittelwert µ = 1.200 Stunden
bei einer Standardabweichung von σ = 100 Stunden.
a) Man berechne die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne weniger als 1.000 Stunden brennt.
Aufgabe 1 Baby“ Das Gewicht von neugeborenen Kin”
dern sei normalverteilt mit µ = 3.200 g und σ = 800 g.
a) Wie groß ist die Wahrscheinlichkeit, dass ein Neugeborenes
i) mehr als 3.000 g,
ii) höchstens 2.500 g,
iii) zwischen 4 kg und 5 kg wiegt?
b) Wie groß ist die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne eine Brenndauer von mehr
als 1.100 Stunden besitzt?
b) Wie schwer muss ein Neugeborenes sein, damit es zu
den 20 % leichtesten gehört?
c) Mit welcher Wahrscheinlichkeit liegt die Brenndauer einer zufällig ausgewählten Glühbirne zwischen 1.000 und
1.500 Stunden?
c) Wie schwer muss ein Neugeborenes sein, damit es zu
den 15 % schwersten gehört?
133
134
Aufgabe 2 Größe“ Für die Körpergröße von 18 − 20”
jährigen Männern ergibt sich ein Mittelwert von 1,80 m
bei einer Standardabweichung von 7,4 cm. Die Körpergröße kann als normalverteilt angesehen werden.
a) Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Mann dieser Altersgruppe
i) größer als 1,85 m,
ii) zwischen 1,70 m und 1,80 m groß?
b) Wie groß darf ein Mann maximal sein, damit er noch
zu den 5 % der kleinsten Männer gehört?
c) Benenne das 5 %-Quantil.
Aufgabe 3 Waschmaschine“ Waschmaschinen sollen für
”
einen Waschgang durchschnittlich 65 l Wasser verbrauchen. Ein Hersteller will erreichen, dass bei mindestens
95 % seiner Maschinen der Wasserverbrauch unter 75 l
sinkt. Welche Standardabweichung darf die Maschine
haben, wenn man voraussetzt, dass der Wasserverbrauch
normalverteilt ist?
d) In welchem symmetrischen Bereich um den Mittelwert
liegen die Größen von 50 % aller Männer dieser Altersgruppe?
136
135
Beispiel Materialiensammlung, 7. Übung, Aufgabe 2
Firma X-AG hat festgestellt, dass die Lebensdauer ihrer Maschinen vom Typ A normalverteilt ist mit einem
arithmetischen Mittel von 120.000 km. 3% der Motoren
dieser Art fallen jedoch bereits bei einer Leistung bis zu
70.000 km aus.
§3
Einfache Schätzverfahren
§3.1 Stichprobenverteilungen
a) Wie groß ist der Produktionsanteil, der eine Lebensdauer von 150.000 km und mehr hat? (σ = 26.596)
Wahrscheinlichkeitstheoretische Schätzung von Stichprobenparametern
b) Man zeige, dass die Standardabweichung der Lebensdauer (gemessen in 1.000 km) der Typ A Maschinen
26,596 beträgt.
138
137
Die zuletzt praktizierten Schlußweisen“:
”
W (xu ≤ X ≤ xo) =?
139
140
Betrachte X̄, so ergeben sich 2 Fragen:
1) Ist X̄ eine Zufallsvariable?
2) Wie ist X̄ verteilt?
141
142
[Quelle: Matsam]
§3.2 Zentraler Grenzwertsatz
Satz (Zentraler Grenzwertsatz - Teil 1)
Die Verteilung des arithmetischen Mittels X̄ von unabhängigen (z.B. Ziehen mit Zurücklegen), identisch verteilten
Zufallsvariablen X1, X2, . . . , Xn strebt mit wachsendem
Stichprobenumfang n
(Faustregel: n > 30)
gegen eine Normalverteilung mit dem Erwartungswert
Satz (Zentraler Grenzwertsatz - Teil 2)
Sind die Xi nicht unabhängig (z.B. Ziehen ohne Zurücklegen), so wird bei hinreichend großer Grundgesamtheit
gegenüber dem Stichprobenumfang und großem Stichprobenumfang n
(Faustregel: N > 2n und n > 30)
ebenfalls eine Normalverteilung angenommen und zwar
mit dem Erwartungswert
E(X̄) = µ
E(X̄) = µ
und der Varianz
und der Varianz
Var(X̄) =
σ2
n
Var(X̄) =
σ2 N − n
·
n N −1
144
143
Fallbeispiel 8a) LKW-Reifen
Bei der Untersuchung von 300 LKW-Reifen eines Fuhrunternehmens ergab sich eine durchschnittliche Profiltiefe von µ = 15,30 mm bei einer Standardabweichung
von σ = 4,10 mm. Aus dieser Grungesamtheit werden
36 Reifen (ohne Zurücklegen) entnommen.
Bezeichnung
2
• Var(X̄) = σX̄
Abk.
−n
• Der Faktor N
N −1 heißt
Korrekturfaktor für endliche Gesamtheiten“
”
n < 0,05 vernachlässigt werden.
Dieser Faktor kann bei N
(d.h. ZmZ = ZoZ)
i) Mit welcher Wahrscheinlichkeit 1 − α liegt die durchschnittliche Profiltiefe x̄ der Stichprobe zwischen 14,50
mm und 16,50 mm?
Hilfe: Formelsammlung, Anhang B
ii) Interpretiere diese Schlußweise aus der Sicht des Geprüften (Fuhrunternehmer)!
146
145
Fallbeispiel 9 Schraubenzieher, schwarze Version
Ein Werkzeughersteller gibt an, dass eine bestimmte
Sorte Schraubenzieher mit einer Breite von im Mittel
µ = 5 mm eine Standardabweichung von σ = 1,5 mm
hat.
a) Man berechne die Wahrscheinlichkeit, dass die durchschnittliche Breite x̄ bei einer Lieferung von n = 900
Schraubenziehern zwischen 4,902 und 5,098 liegt.
b) Interpretiere die Aufgabenstellung aus der Sicht beider
Vertragspartner: Lieferant und Abnehmer!
Macht es Sinn, Qualitätszertifizierungen mit Durchschnittswerten durchzuführen? Aus der Sicht des Abnehmers in Form von Qualitätskontrollen, aus der Sicht
des Lieferanten in Form von Qualitätsgarantien?
Aufgabe 4 Grubenstempel Ein Sägewerk liefert Grubenstempel als geschlossene Partie von 1.200 Stück, deren
Länge normalverteilt ist mit einem Erwartungswert von
60 cm und einer Varianz von 36 cm2.
Welchen Anteil der Stichproben wird einen Mittelwert
zwischen 59 cm und 61 cm liefern, wenn
a) der Stichprobenumfang 36 beträgt?
b) der Stichprobenumfang 100 beträgt?
147
Aufgabe 5 Raumhöhe Die Raumhöhe der Häuser eines
Bauunternehmens ist eine normalverteilte Zufallsvariable mit Erwartungswert 2,60 m und Varianz 0,09 m2.
Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Raumhöhe bei 100 zufällig und unabhängig
ausgewählten Gebäuden größer als 2,65 m ist?
148
Aufgabe 6 Mehltüten Eine Mehltüten-Abfüllanlage ist so
eingestellt, dass das Füllgewicht X der 1 kg-Tüten normalverteilt mit einer Standardabweichung σ = 20 g ist.
Es wird eine Stichprobe von 40 Tüten untersucht.
Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe das durchschnittliche Füllgewicht X̄
a) mindestens 995 g beträgt,
b) zwischen 994 g und 1010 g liegt?
149
150