Statistik - Ingo Manfraß

Werbung
Statistik (Informations- &
Prozesstechnologien)
Studiengang: BBA/BAIM/BST an der FOM
Münster
Ingo Manfraß (TEAM Dr. Kowalski)
19. März 2016
Dies’ ist kein Selbstlernskript, sondern lediglich als Hilfe
für die Vorlesung gedacht. Es enthält u.a. etliche Lückentexte.
Zudem ist es nur für die Vorlesung ’Statistik’ gedacht, die
ich halte.
Alle Angaben sind (wie immer) ohne Gewähr. D.h. Fehler sind
menschlich und bitte ich somit zu entschuldigen...
Ingo Manfraß
Kapitel I
§1
Deskriptive Statistik
Grundlagen
• Verteilung (Vtlg.)
• Parameter
• Stichprobe (Stp.)
• Grundgesamtheit (GG)
1
Konvention“ für indizierte lateinische Buchstaben
”
Kleinbuchstaben
h3,fi
Großbuchstaben
H3,Fk
einzelne Werte
alle bis zum Index aufsummierten Werte
2
§1.1 Begrifflichkeiten
Beispiel In einem Kurs fallen 25 Mathe-Noten an:
3,3,5,2,4,2,3,3,4,2,3,3,2,4,3,4,1,1,5,4,3,1,2,4,3
3
Quicky Zähle die Daten aus und vervollständige die Tabelle:
Noten
x∗i
Strichliste
absolute
relative
kumulierte
Häufigkeit
Häufigkeit
rel. Häufigkeit
hi
fi
Fi
1
2
3
4
5
6
Σ
4
Aus der letzten Spalte kann man die folgenden Dinge ablesen:
. . . Durchfallquote
. . . sind besser als 4
. . . sind schlechter als 3
5
Absolute Häufigkeiten [Quelle: Matsam]
6
Definition Gegeben seien n Beobachtungswerte (Zahlen)
x1, . . . , xn.
Dann heißt das Tupel (Vektor)
x = (x1, . . . ,xn)
eine Stichprobe vom Umfang n. Die einzelnen Zahlen xi
nennt man Stichprobenwerte.
Die in der Stichprobe vorkommenden unterschiedlichen
Werte x∗k ; d.h.
x∗ = (x∗1, . . . ,x∗s )
heißen Merkmalwerte.
Die Anzahl des Auftretens von x∗k in x; d.h.
h(x∗k ) = hk
Abk.
heißt absolute Häufigkeit von x∗k in x; die Quotienten
h
fk = k
n
heißen relative Häufigkeiten.
7
Bemerkung Es gilt dabei
s
X
hk = n
s
X
fk = 1
k=1
bzw.
k=1
und
0 ≤ fk ≤ 1
für alle k
8
Relative Häufigkeiten [Quelle: Matsam]
9
Das Summenzeichen
Für eine aufsummierte Folge von Zahlen, die einem Schema folgen, führt man die sogenannte Summenschreibweise
ein:
Statt
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ··· + n
schreibt man kurz mit
ak = k
die Summe in der Form:
n
X
ak
k=1
10
Beispiel
5
X
k=
k=3
11
Rechenregeln:
Vervielfachung einer Summe
b
X
k=a
λ · xk = λ ·
b
X
k=a
xk
mit λ ∈ R
12
Addition zweier Summen
b
X
xk +
k=a
b
X
yk =
k=a
b
X
xk + y k
k=a
13
Aufteilung einer Summe
b
X
k=a
xk =
c
X
k=a
xk +
b
X
xk
mit a < c < b
k=c+1
14
Quicky Berechne soweit wie möglich:
a)
12
P
k
k=10
b)
5
P
3
k=−5
c)
100
P
(3k + 2)
(Nutze:
k=1
d)
100
P
k=1
100
P
k = 5050)
k=1
2k −
99
P
2k
k=0
15
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten fk .
Dann heißt die Summe der relativen Häufigkeiten derjenigen Merkmalwerte x∗i , die kleiner oder gleich x∗k sind,
also
X
x∗i ≤x∗k
fi = Fk
die relative Summenhäufigkeit bzw. kumulierte relative
Häufigkeit von x∗k in x.
16
Definition (empirische Verteilungsfunktion)
Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ =
(x∗1, . . . ,x∗s ) und relativen Summenhäufigkeiten Fi.
Dann heißt die Funktion
F : R → [0; 1]
mit
F (x) =



0
Fi



1
mit x < x∗1
mit x∗i ≤ x < x∗i+1
mit x ≥ x∗s
empirische Verteilungsfunktion der Stichprobe x
17
Tabelle zur Körpergröße von Kindern [Quelle: Matsam]
18
Diagramm zur rel. und kom. Häufigkeit [Quelle: Matsam]
19
§1.2 Lageparameter
Fallbeispiel 1 Ein Kiosk-Betreiber ist mit sechs Filialen im
Markt und plant die Eröffnung eines siebten Standortes.
Dazu soll ein neuer Mitarbeiter angeworben werden. Die
sechs vorhandenen Mitarbeiter verdienen an den unterschiedlich frequentierten Standorten die folgenden Bruttogehälter:
x = (950,1200,1370,1580,1650,1800)
x̄ =
x̃ =
20
Fallbeispiel 1 Der mittlere Verdienst x̄ beträgt also 1425.
Dem Betreiber der Trinkhallen erscheint dieser Durchschnittsverdienst bei der Anwerbung eines neuen Mitarbeiters nicht besonders attraktiv zu sein. Er befürchtet,
bei diesen Verdienstmöglichkeiten keinen Mitarbeiter gewinnen zu können. Er kommt daraufhin zu dem Schluß,
seinen eigenen Verdienst von brutto 6000 mitzuberücksichtigen. Schließlich gehört er ja auch zum Stab der
Mitarbeiter, wenn auch in exponierter Position. Er legt
also zur Berechnung des Durchschnittsverdienstes die
erweiterte Stichprobe:
xneu = (950,1200,1370,1580,1650,1800,6000)
zugrunde.
x̄neu =
x̃neu =
21
22
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißt die reelle Zahl
n
1 X
xi
x̄ =
n i=1
s
1 X
hk · x∗k
=
n k=1
=
s
X
k=1
fk · x∗k
arithmetischer bzw. empirischer Mittelwert.
23
Definition Sei x = (x1, . . . ,xn) eine Stichprobe und xg =
(x(1),x(2), . . . ,x(n)) die der Größe nach angeordnete Stichprobe, also
x(1) ≤ x(2) ≤ · · · ≤ x(n)
Dann heißt die reelle Zahl



x


 n+1
2
x̃ =


1


 2 x( n ) + x( n +1)
2
2
mit n ungerade
mit n gerade
der empirische Median oder Zentralwert von x.
24
Definition Sei x = (x1, . . . ,xn) eine Stichprobe, dann heißt
jeder Merkmalwert x∗i , der am häufigsten in x vorkommt,
Modus bzw. Modalwert xD .
25
Quicky An einer Sägemaschine wurden in sechs Messungen folgende Verschnitte in Zentimetern festgestellt:
3,3,14,3,2,3
Wieviel durchschnittlichen Verschnitt muss der Betreiber seinen Kunden nennen?
• Arithmetisches Mittel:
• Median:
• Modus:
26
Quicky Von 10 Mitarbeitern eines Unternehmens beziehen
neun ein Jahreseinkommen von je 40.000 EURO, einer
(nämlich der Geschäftsführer) ein Jahreseinkommen von
400.000 EURO, so lässt sich das Durchschnittseinkommen wie folgt bestimmen:
• Arithmetisches Mittel:
• Median:
• Modus:
27
Quicky Ermittle die Graphen der zugehörigen empirischen
Verteilungsfunktion F und ermittle jeweils auf zweifache
Art den zugehörigen Median (aus der Tabelle und der
Verteilungsfunktion).
b)
a)
x∗k
Fk
x∗k
Fk
2
0.15
1
0.12
3
0.50
2
0.32
4
0.60
3
0.68
5
1.00
4
0.92
5
1.00
28
§1.3 Streuungsmaße
Streungsmaße sind Maße für die Repräsentanz des Mittelwertes x̄.
Beispiel Berechne Mittelwert und Median für die beiden
Stichproben x und y mit
x = (3,3,3,4,4,4,5,6)
und
y = (−26, − 10,0,4,10,20,30)
29
Mögliche Kandidaten für ein Streuungsmaß:
① Arithmetisches Mittel der Abstände
n
1 X
(xi−x̄) =
n i=1
30
② Arithmetisches Mittel der absoluten Abstände bzw. mittlere absolute Abweichung
n
1 X
|xi − x̄|
n i=1
③ Arithmetisches Mittel der Abstandsquadrate bzw. empirische Varianz
n
1 X
(xi − x̄)2
n i=1
31
Quicky Berechne jeweils die Varianz für x und y aus obigem Beispiel.
Für x:
Für y:
32
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißen
n
1 X
2
sn(x) =
(xi − x̄)2
n i=1
s
1 X
=
hk (x∗k − x̄)2
n k=1
s
X
=
k=1
bzw.
s2
n−1 (x) =
fk (x∗k − x̄)2
n
1 X
(xi − x̄)2
n − 1 i=1
die empirische Varianz und die zugehörige positive Wurzel
q
s = + s2
empirische Standardabweichung von x.
s2
n (x) =
33
n
n
1 X
1 X
2
(xi − x̄)2 =
(x2
i − 2xi x̄ + x̄ )
n i=1
n i=1
=

n
X
n
X
n
X

1
x2
2xix̄ +
x̄2
i −
n i=1
i=1
i=1


n
n
n
X
X
1 X
2
2
1
x − 2x̄
xi + x̄
=
n i=1 i
i=1
i=1
=


n
X
1
x2 − 2nx̄2 + nx̄2
n i=1 i


n
1 X
2
=
x2
i − nx̄
n i=1
=
n
1 X
2
x2
i − x̄
n i=1
34
Quicky Berechne die Varianzen für x und y aus obigem
Beispiel mittels einer geeigneten Tabelle:
a)
b)
xi
x2
i
yi
yi2
3
3
3
4
4
4
5
6
35
2
Warum gibt es zwei Varianzversionen s2
n und sn−1 ?
s2
n−1 ist zu verwenden, wenn man
damit die Grundgesamtheitsvarianz
σ 2 schätzen will.
36
Synchronisationsformel
s2
n−1 (x) =
n
s2
(x)
n−1 n
37
Ein weiteres Streuungsmaß ist die Spannweite:
Definition Die Spannweite r(x) einer Stichprobe x =
(x1, . . . ,xn) ist die positive Differenz des größten und
kleinsten Merkmalwertes von x.
n
n
i=1
i=1
r(x) = max{xi} − min{xi}
38
§1.4 Mehrdimensionale Stichproben
Mit mehrdimensional ist hier zweidimensional gemeint.
Beispiel Körpergröße xi und Körpergewicht yi
xi
170
165
173
180
161
168
171
176
169
179
yi
75
60
64
79
62
76
71
72
65
85
39
40
Beispiel Drehzahl xi und Leistung yi
xi
800
1500
2500
3500
4200
4700
5000
5500
yi
12
20
31
40
52
60
65
70
41
42
Definition Gegeben seien n Paare (x1,y1), . . . ,(xn,yn) von
Zahlenwerten, die an n Individuen bzgl. zweier Merkmale
ermittelt werden.
Dann heißt
(x,y) = (x1,y1), . . . ,(xn,yn)
eine zweidimensionale Stichprobe vom Umfang n.
Falls die beiden Merkmale x,y die unterschiedlichen Werte
x∗1, . . . ,x∗s
bzw.
y1∗ , . . . ,yr∗
haben, so können in der Stichprobe die s · r Merkmalpaare (x∗i ,yk∗) vorkommen.
Die absolute Häufigkeit des Merkmalpaares (x∗i ,yk∗) bezeichnet man mit hik , die relative Häufigkeiten mit fik :=
hik
n
43
Daraus folgt:
s X
r
X
hik = n
s X
r
X
fik = 1
i=1 k=1
i=1 k=1
0 ≤ fik ≤ 1
für alle i,k
44
Zweidimensionale Verteilungen [Quelle: Matsam]
45
Veranschaulichung zweidimensionaler Häufigkeitsverteilungen mittels Kontingenztafeln:
(hik )
y1∗
y2∗
...
yk∗
...
yr∗
x∗1
h11
h12
...
h1k
...
h1r
x∗2
...
h21
...
h22
...
...
...
h2k
...
...
...
h2r
...
x∗i
...
hi1
...
hi2
...
...
...
hik
...
...
...
hir
...
x∗s
hs1
hs2
...
hsk
...
hsr
46
Die Randhäufigkeiten“ h·k , hi· nennt man Randverteilun”
gen der zweidimensionalen Stichprobe (x,y).
47
§1.5 Korrelation
Einführung eines neuen Parameters als Maß für den Zusammenhang der Merkmale x und y.
Beispiel
diffus
annähernd linear
steigend
48
Generalvoraussetzung
2
s2
x := sn−1
Erinnerung
x = (x1, . . . ,xn)
Varianz:
s2
x =
n
n
1 X
1 X
(xi − x̄)2 =
(xi − x̄)(xi − x̄)
n − 1 i=1
n − 1 i=1
(x,y) = (x1,y1), . . . ,(xn,yn)
49
Empirische Kovarianz:
sxy =
n
1 X
(xi − x̄)(yi − ȳ)
n − 1 i=1
50
Normierung der Varianz zur Standardabweichung:
sx = +
s2
2
sx = x
sx
q
51
Überträgt man diese Normierung, so erhält man:
Definition
Sei (x,y) =
(x1,y1), . . . ,(xn,yn)
mensionale Stichprobe; dann heißt
sxy
=v
r(x,y) =
u
sx · sy
u
t
n
P
i=1
n
P
i=1
eine zweidi-
(xi − x̄)(yi − ȳ)
(xi − x̄)2
!
n
P
i=1
(yi − ȳ)2
!
der empirische Korrelationskoeffizient von (x,y)“.
”
52
Arbeitstaugliche Version:
r(x,y) = v
u
u
t
?
n
P
i=1
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
!
mit
?=
n
X
i=1
xiyi − nx̄ȳ
53
Also:
r(x,y) = v
u
u
t
n
P
i=1
n
P
i=1
xiyi − nx̄ȳ
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
!
Arbeitstabelle:
54
Hauptsatz (Eigenschaften von r(x,y))
Für den empirischen Korrelationskoeffizienten
r einer zweidimensionalen Stichprobe (x,y) = (x1,y1), . . . ,(xn,yn)
gilt:
a) −1 ≤ r ≤ 1
b) Aus |r| = 1 folgt die lineare Beziehung
yi = a + bxi
für i = 1,2, . . . ,n
mit
s
a = ȳ − rx̄ · sxy
s
b = r · sxy
Die Punkte (xi,yi) liegen also auf einer Geraden, die für
r = −1 fallend und für r = 1 steigend ist.
55
c) Liegen alle Punkte (xi,yi) auf einer Geraden a + bx, so
gilt:

 1
r=
−1
für b > 0
für b < 0
Im Fall b = 0 ist wegen sy = 0 der Korrelationkoeffizient
nicht definiert.
56
Bemerkung Für den Korrelationkoeffizienten r gilt:
0 < |r| < 0.2
sehr geringe Korrelation
0.2 < |r| < 0.5
geringe Korrelation
0.5 < |r| < 0.7
mittlere Korrelation
0.7 < |r| < 0.9
hohe Korrelation
0.9 < |r| < 1
sehr hohe Korrelation
57
58
Fallbeispiel 3 Berechne den Korrelationskoeffizienten zum
Drehzahl-Beispiel. Gehe dabei wie folgt vor:
a) Arbeitstabelle aufstellen
b) Empirischen Korrelationskoeffizienten r bestimmen
59
c) Arbeitstabelle
xi
yi
800
12
1500
20
2500
31
3500
40
4200
52
4700
60
5000
65
5500
70
60
d)
xiyi − nx̄ȳ
r(x,y) = q P
2 )(P y 2 − nȳ 2 )
( x2
−
nx̄
i
i
P
=
=
61
§1.6 Regression
Interpolation und Extrapolation von Daten.
62
Gesucht: ŷ = a + bx
Optimalgerade
63
Konstruktion: Methode der kleinsten Quadrate nach C.F.
Gauß
(KQ-Schätzer)
64
f (a,b) :=
n
X
i=1
di =
n X
i=1
yi − (a + bxi)
2
→ minimieren
f ist also eine reellwertige Funktion vom Typ
f : R2 → R
65
Herleitung mit der Mittelwertpunktbedingung.
(x̄,ȳ) liegt auf der gesuchten Geraden, d.h.
ȳ = a + bx̄
⇔
a = ȳ − bx̄
Ersetzt man nun in f a durch ȳ − bx̄, so reduziert sich f
zu einer eindimensionalen reellwertigen Funktion.
66
Dieses liefert als Lösung:
b=
n
P
i=1
(yi − ȳ)(xi − x̄)
n
P
i=1
(xi − x̄)2
=
sxy
s2
x
und heißt empirischer“ Regressionskoeffizient.
”
Er ist die Steigung der gesuchten Optimalgerade. Mit der
Mittelwertpunktbedingung (a = ȳ − bx̄) ist ŷ = a + bx dann
bestimmt.
67
Definition Die oben konstruierte Optimalgerade
ŷ = a + bx
heißt empirische Regressionsgerade oder empirisches Regressionspolynom ersten Grades.
68
Fallbeispiel 3 Berechne die Regeressionsgerade zum DrehzahlBeispiel
69
Polynom
2. Grades
Polynom
höheren Grades
70
Ein Regressionspolynom höheren Grades ist etwa
ŷ = a + bx + cx2
Die zugehörigen Koeffizienten a, b und c erhält man durch
lösen des linearen Gleichungssystems, das sich aus den zugehörigen drei partiellen Ableitungen ergibt. Diese heißen
Normalengleichungen“.
”
71
Fallbeispiel 4
a) Das Regressionspolynom 2. Grades ist
ŷ = 11.952,77 − 13,8012x + 0,003974x2
b) Berechnung der Trendwerte ŷ
72
c) Schätzung der Bevölkerung im Jahr 1945
d) Schätzung der Bevölkerung im Jahr 1960
e) Schätzung der Bevölkerung im Jahr 1840
73
Fazit: Bei nichtlinearen Regressionsfunktionen sollte man
auf Extrapolationen verzichten.
74
Kapitel II
§2
Induktive Statistik
Grundlagen der ind. Statistik
§2.1 Zufallsvariablen
Konvention“ für lateinische Buchstaben
”
Kleinbuchstaben
x,y,z
Großbuchstaben
X,Y,Z
realisierte Stichprobenwerte
Zufallsvariable
75
Zufallsvariable Funktion der Stichprobenwerte; d.h. der
Wert ist noch nicht zugewiesen.
Wahrscheinlichkeitsfunktion Ordnet jedem Ereignis eine
Wahrscheinlichkeit zu.
Dichtefunktion Ordnet jedem Ereignis einen Wert zu.
Verteilungsfunktion Kumulierte Wahrscheinlichkeitsfunktion
76
deskriptiv
x = (x1,x2, . . . ,xn)
−→
induktiv
−→
X = (X1,X2, . . . ,Xn)
Stichprobe mit Merkmalswerten xi
fi = f (xi)
Zufallsvektor mit Zufallsvariablen Xi
−→
relative Häufigkeit
Fi =
P
j≤i
Wahrscheinlichkeitsfunktion
fj
−→
relative Summenhäufigkeit
x̄
Empirische Varianz
F =
P
f
Verteilungsfunktion
−→
Empirischer Mittelwert
s2
n−1 (x)
f
E(X)
Stochastischer Erwartungswert
−→
Var(X)
Stochastische Varianz
77
Bemerkung Eine Zufallsfvariable X heißt diskret, wenn
X höchstens abzählbar“ viele verschiedene Werte an”
nehmen kann, andernfalls stetig.
78
Definition Ein Maß für die Sicherheit des Eintretens eines
Ereignisses ist die Wahrscheinlichkeit.
Die Wahrscheinlichkeit, mit der eine diskrete Zufallsvariable X die spezielle Ausprägung (bzw. Realisation,
Funktionswert) x annimmt, wird mit
W (X = x)
bezeichnet.
79
Bemerkung Der Wahrscheinlichkeitsbegriff nach Laplace.
Sei A ein Ereignis, dann gilt
W (A) =
Anzahl der Günstigen
Anzahl aller Möglichkeiten
80
Beispiel Einmaliger Würfelwurf
X=
Wahrscheinlichkeit, dass eine 4 gewürfelt wird:
81
Beispiel Schüler aus dem Notenbeispiel
X=
Wahrscheinlichkeit, dass ein zufällig getroffener Schüler
aus dem Notenbeispiel die Note 3 hat:
82
Beispiel Zweimaliger Münzwurf
X=
Wahrscheinlichkeit, dass einmal Wappen fällt:
83
Beispiel Dreimaliger Münzwurf
X=
Wahrscheinlichkeit, dass zweimal Wappen fällt:
84
Definition Die Funktion f , die jeder Ausprägung x einer
diskreten Zufallsvariablen X die Wahrscheinlichkeit ihres
Auftretens zuordnet, heißt Wahrscheinlichkeitsfunktion
f der diskreten Zufallsvariablen X (induktives Pendant
zu den relativen Häufigkeiten). D.h.
f (x) = W (X = x)
85
Beispiel Beim dreimaligen Münzwurf gilt wieder:
W (X = 0) =
W (X = 1) =
W (X = 2) =
W (X = 3) =
86
Definition Sei ein Zufallsexperiment mit Ω gegeben und
sei X eine diskrete Zufallsvariable. Dann heißt die Funktion F , die jeder Ausprägung x von X die Wahrscheinlichkeit zuordnet, dass X höchstens den Wert x annimmt, also
F (x) := W (X ≤ x)
Verteilungsfunktion der diskreten Zufallsvariablen X.
87
Quicky Zufallsexperiment: Ein Schüler aus dem Notenbeispiel wird zufällig auf dem Schulflur getroffen.
Zufallsvariable: X = Note des Schülers
x
f (x) = W (X = x)
F (x) = W (X ≤ x)
1
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
4
f (4) =
F (4) =
5
f (5) =
F (5) =
6
f (6) =
F (6) =
P
88
Quicky Zufallsexperiment: dreimaliger Münzwurf
Zufallsvariable: X = Anzahl der Wappen
x
f (x) = W (X = x)
F (x) = W (X ≤ x)
0
f (0) =
F (0) =
1
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
P
89
Schwierig: Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f und Verteilungsfunktion F im stetigen Fall.
deskriptiv
...
−→
−→
induktiv
...
90
Vergleiche dreimaliger Münzwurf:
diskret
stetig
91
Gegenüberstellung
diskret
W (a ≤ X ≤ b) =
stetig
W (a ≤ X ≤ b) =
92
Gegenüberstellung
diskret
W (X = a) =
stetig
W (X = a) =
Fazit:
93
Gegenüberstellung
diskret
stetig
Konsequenzen:
94
Gegenüberstellung
diskret
stetig
W (X ≤ a) =
W (X ≤ a) =
Fazit: diskret
Fazit: stetig
95
Übertrag aus der Deskriptiven Statistik:
Empirischer Mittelwert
n
1 X
xi
x̄ =
n i=1
s
1 X
hix∗i
=
n i=1
=
s
X
fix∗i
i=1
96
Stochastischer Erwartungswert
• diskret
E(X) =
X
x
• stetig
E(X) =
Z∞
−∞
f (x) · x
f (x) · x dx
97
Empirische Varianz
n
1 X
2
(xi − x̄)2
sn(x) =
n i=1
s
1 X
=
hi(x∗i − x̄)2
n i=1
s
X
fi(x∗i − x̄)2
=
i=1
98
Stochastische Varianz
• diskret
Var(X) =
X
x
• stetig
E(X) =
Z∞
−∞
f (x) x − E(X)
f (x) x − E(X)
2
2
dx
99
Vereinbarung: (Statistischer Sprachgebrauch)
Unter dem Begriff statistische Verteilung“ versteht man
”
4 Komponenten:
① Wahrscheinlichkeitsfunktion f
② Verteilungsfunktion F
③ Stochastischer Erwartungswert E(X)
④ Stochastische Varianz Var(X)
100
§2.2 Diskrete Verteilungen
Zum besseren Verständnis der bekannteren diskreten Verteilungen benötigt man einige Kenntnisse aus der Kombinatorik.
101
Wie viele Möglichkeiten gibt es beim Lotto (6 aus 49) sechs
Kugeln zu ziehen?
102
Binomialkoeffizient


 N 
=

n
N!
(N − n)! · n!
=
=
=
103
Beispiel Wie Wahrscheinlich sind 6 Richtige im Lotto?
104
Die hypergeometrische Verteilung
Voraussetzungen:
• Merkmal ist dichotom
• Merkmal ist diskret
• Ziehen ohne Zurücklegen (ZoZ)
105
Variablen:
N
n
M
M
N
x
x
n
: Grundgesamtheitsumfang
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe
106
Verteilung:
① Wahrscheinlichkeitsfunktion

f (x) = fH (x/N ; n; M ) =
 

 M   N −M 
·


x

n−x

 N 


n
② Verteilungsfunktion
F (x) = FH (x/N ; n; M ) =
x
X
fH (ν)
ν=1
107
③ Erwartungswert
E(X) =
X
x
f (x) · x = n · θ
④ Varianz
Var(X) =
X
x
f (x) x − E(X)
2
= nθ(1 − θ)
N −n
N −1
108
Beispiel Gesucht ist die Wahrscheinlichkeit im Lotto (6
aus 49) 3 bzw. 4 Richtige zu tippen.
109
Fallbeispiel 6 Glühbirnenbeispiel, 3. Evolutionsstufe
In einer Schachtel befinden sich 60 Glühbirnen. 20 davon
sind defekt. Ohne Zurücklegen werden nacheinander 10
Stück gezogen.
X = Anzahl brauchbarer Glühbirnen
Berechne die Wahrscheinlichkeiten:
a) Genau 7 brauchbare zu ziehen.
b) Mindestens 1 brauchbare zu ziehen.
110
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit bestehen 5% der Tagesproduktion einer Maschine statt aus Rechtshänder-Hämmern, aus Hämmer für
Linkshänder. 20 Einheiten werden jeweils in einen Karton verpackt. Wie Wahrscheinlich ist es, dass bei einer Tagesproduktion von 1.000 Hämmern, ausschließlich
Hämmer für Rechtshänder im Karton sind?
111
Die Binomialverteilung
Voraussetzungen:
• Merkmal ist dichotom
• Merkmal ist diskret
• Ziehen mit Zurücklegen (ZmZ)
112
Variablen:
N
n
M
M
N
x
x
n
: Grundgesamtheitsumfang
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe
113
Verteilung:
① Wahrscheinlichkeitsfunktion


 n  x
n−x
 θ (1 − θ)
f (x) = fB (x/n; θ) = 
x
② Verteilungsfunktion
F (x) = FB (x/n; θ) =
x
X
fB (ν)
ν=1
114
③ Erwartungswert
E(X) =
X
x
f (x) · x = n · θ
④ Varianz
Var(X) =
X
x
f (x) x − E(X)
2
= nθ(1 − θ)
115
Beispiel Die Wahrscheinlichkeit beträgt 1,86%, dass man
beim einmaligen Lottospiel mindestens 3 Richtige hat,
und somit gewonnen hat. Wenn man 52 Wochen lang
Lotto spielt, wie wahrscheinlich ist es dann, mindestens
1-Mal in diesem Jahr im Lotto zu gewinnen?
116
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit besteht bei der Produktion von Hämmern bei jedem Hammer eine 5%-Wahrscheinlichkeit, dass er fehlerhaft produziert wird. Die Hämmer werden stets zu 20
in einem Karton verpackt. Wie Wahrscheinlich ist es,
dass keine fehlerhaften Hämmer in einem zufällig ausgewähltem Karton sind?
117
§2.3 Stetige Verteilungen
Die Gaußsche Normalverteilung ist die wichtigste stetige
Verteilung.
118
10 DM-Schein [Quelle: Wikipedia]
119
Gaußsche Normalverteilung
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 x−µ 2
1
f (x) = fn(x/µ,σ 2) = √
· e− 2 ( σ )
σ 2π
② Verteilungsfunktion
F (x) = Fn(x/µ,σ 2) =
Z x
1 ν−µ 2
1
√
· e− 2 ( σ ) dν
−∞ σ 2π
120
③ Erwartungswert
E(X) = µ
④ Varianz
Var(X) = σ 2
121
1. Problem: Obige Funktionswerte (Fn) sind schwierig zu
berechnen; also benötigt man Tabellen für die Funktionswerte.
2. Problem: Man benötigt für jedes Paar (µ,σ 2) eine eigene Tabelle!
122
Idee der
Standardisierung“
”
123
Normalverteilung mit verschiedenen Parametern [Quelle:
Matsam]
124
Überträgt man die Idee der Standardisierung“ auf eine
”
normalverteilte Zufallsvariable X mit
E(X) = µ und Var(X) = σ 2,
so ergibt sich:
Z :=
X −µ
σ
Z ist normalverteilt mit
E(Z) = 0 und Var(Z) = 1
Man sagt dann auch kurz:
Z ist (0,1)-normalverteilt bzw. standardnormalverteilt“.
”
125
Standardnormalverteilung
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 2
1
f (z) = fn(z) = √
· e− 2 z
2π
② Verteilungsfunktion
F (z) = Fn(z) =
Z z
1 2
1
√
· e− 2 ν dν
−∞ 2π
126
③ Erwartungswert
E(Z) = 0
④ Varianz
Var(Z) = 1
127
Konvention“ für Zufallsvariablen
”
X,Y
Z
Realität
Tabellen-/ Rechenwerte“
”
128
Vergleich von Normal- und Standardnormalverteilung
[Quelle: Matsam]
129
Tabellengebrauch:
z
FN (−z)
FN (−z) =
FN (z)
FN (z) =
D(z)
D(z) =
130
Quicky Lies die folgenden Werte soweit möglich aus der
Tabelle zur Standardnormalverteilung ab.
a) W (Z ≤ 1,06)
b) W (Z ≤ −1,03)
c) W (Z ≥ 1,13)
d) In einem Unternehmen sei das Gehalt normalverteilt mit
µ = 30.000 EURO und σ = 5.000 EURO.
Berechne die Wahrscheinlichkeit, dass das Gehalt eines
Mitarbeiters maximal 25.000 EURO beträgt.
131
Standardnormalverteilung mit ausgewählten Flächenanteilen
[Quelle: Matsam]
132
Beispiel Materialiensammlung, 7. Übung, Aufgabe 1
Die Brenndauer einer bestimmten Sorte Glühlampen ist
normalverteilt mit dem Mittelwert µ = 1.200 Stunden
bei einer Standardabweichung von σ = 100 Stunden.
a) Man berechne die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne weniger als 1.000 Stunden brennt.
b) Wie groß ist die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne eine Brenndauer von mehr
als 1.100 Stunden besitzt?
c) Mit welcher Wahrscheinlichkeit liegt die Brenndauer einer zufällig ausgewählten Glühbirne zwischen 1.000 und
1.500 Stunden?
133
Aufgabe 1 Baby“ Das Gewicht von neugeborenen Kin”
dern sei normalverteilt mit µ = 3.200 g und σ = 800 g.
a) Wie groß ist die Wahrscheinlichkeit, dass ein Neugeborenes
i) mehr als 3.000 g,
ii) höchstens 2.500 g,
iii) zwischen 4 kg und 5 kg wiegt?
b) Wie schwer muss ein Neugeborenes sein, damit es zu
den 20 % leichtesten gehört?
c) Wie schwer muss ein Neugeborenes sein, damit es zu
den 15 % schwersten gehört?
134
Aufgabe 2 Größe“ Für die Körpergröße von 18 − 20”
jährigen Männern ergibt sich ein Mittelwert von 1,80 m
bei einer Standardabweichung von 7,4 cm. Die Körpergröße kann als normalverteilt angesehen werden.
a) Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Mann dieser Altersgruppe
i) größer als 1,85 m,
ii) zwischen 1,70 m und 1,80 m groß?
b) Wie groß darf ein Mann maximal sein, damit er noch
zu den 5 % der kleinsten Männer gehört?
c) Benenne das 5 %-Quantil.
d) In welchem symmetrischen Bereich um den Mittelwert
liegen die Größen von 50 % aller Männer dieser Altersgruppe?
135
Aufgabe 3 Waschmaschine“ Waschmaschinen sollen für
”
einen Waschgang durchschnittlich 65 l Wasser verbrauchen. Ein Hersteller will erreichen, dass bei mindestens
95 % seiner Maschinen der Wasserverbrauch unter 75 l
sinkt. Welche Standardabweichung darf die Maschine
haben, wenn man voraussetzt, dass der Wasserverbrauch
normalverteilt ist?
136
Beispiel Materialiensammlung, 7. Übung, Aufgabe 2
Firma X-AG hat festgestellt, dass die Lebensdauer ihrer Maschinen vom Typ A normalverteilt ist mit einem
arithmetischen Mittel von 120.000 km. 3% der Motoren
dieser Art fallen jedoch bereits bei einer Leistung bis zu
70.000 km aus.
a) Wie groß ist der Produktionsanteil, der eine Lebensdauer von 150.000 km und mehr hat? (σ = 26.596)
b) Man zeige, dass die Standardabweichung der Lebensdauer (gemessen in 1.000 km) der Typ A Maschinen
26,596 beträgt.
137
§3
Einfache Schätzverfahren
§3.1 Stichprobenverteilungen
Wahrscheinlichkeitstheoretische Schätzung von Stichprobenparametern
138
Die zuletzt praktizierten Schlußweisen“:
”
139
W (xu ≤ X ≤ xo) =?
140
Betrachte X̄, so ergeben sich 2 Fragen:
1) Ist X̄ eine Zufallsvariable?
2) Wie ist X̄ verteilt?
141
142
[Quelle: Matsam]
§3.2 Zentraler Grenzwertsatz
Satz (Zentraler Grenzwertsatz - Teil 1)
Die Verteilung des arithmetischen Mittels X̄ von unabhängigen (z.B. Ziehen mit Zurücklegen), identisch verteilten
Zufallsvariablen X1, X2, . . . , Xn strebt mit wachsendem
Stichprobenumfang n
(Faustregel: n > 30)
gegen eine Normalverteilung mit dem Erwartungswert
E(X̄) = µ
und der Varianz
σ2
Var(X̄) =
n
143
Satz (Zentraler Grenzwertsatz - Teil 2)
Sind die Xi nicht unabhängig (z.B. Ziehen ohne Zurücklegen), so wird bei hinreichend großer Grundgesamtheit
gegenüber dem Stichprobenumfang und großem Stichprobenumfang n
(Faustregel: N > 2n und n > 30)
ebenfalls eine Normalverteilung angenommen und zwar
mit dem Erwartungswert
E(X̄) = µ
und der Varianz
σ2 N − n
Var(X̄) =
·
n N −1
144
Bezeichnung
2
• Var(X̄) = σX̄
Abk.
−n
• Der Faktor N
N −1 heißt
Korrekturfaktor für endliche Gesamtheiten“
”
n < 0,05 vernachlässigt werden.
Dieser Faktor kann bei N
(d.h. ZmZ = ZoZ)
145
Fallbeispiel 8a) LKW-Reifen
Bei der Untersuchung von 300 LKW-Reifen eines Fuhrunternehmens ergab sich eine durchschnittliche Profiltiefe von µ = 15,30 mm bei einer Standardabweichung
von σ = 4,10 mm. Aus dieser Grungesamtheit werden
36 Reifen (ohne Zurücklegen) entnommen.
i) Mit welcher Wahrscheinlichkeit 1 − α liegt die durchschnittliche Profiltiefe x̄ der Stichprobe zwischen 14,50
mm und 16,50 mm?
Hilfe: Formelsammlung, Anhang B
ii) Interpretiere diese Schlußweise aus der Sicht des Geprüften (Fuhrunternehmer)!
146
Fallbeispiel 9 Schraubenzieher, schwarze Version
Ein Werkzeughersteller gibt an, dass eine bestimmte
Sorte Schraubenzieher mit einer Breite von im Mittel
µ = 5 mm eine Standardabweichung von σ = 1,5 mm
hat.
a) Man berechne die Wahrscheinlichkeit, dass die durchschnittliche Breite x̄ bei einer Lieferung von n = 900
Schraubenziehern zwischen 4,902 und 5,098 liegt.
b) Interpretiere die Aufgabenstellung aus der Sicht beider
Vertragspartner: Lieferant und Abnehmer!
Macht es Sinn, Qualitätszertifizierungen mit Durchschnittswerten durchzuführen? Aus der Sicht des Abnehmers in Form von Qualitätskontrollen, aus der Sicht
des Lieferanten in Form von Qualitätsgarantien?
147
Aufgabe 4 Grubenstempel Ein Sägewerk liefert Grubenstempel als geschlossene Partie von 1.200 Stück, deren
Länge normalverteilt ist mit einem Erwartungswert von
60 cm und einer Varianz von 36 cm2.
Welchen Anteil der Stichproben wird einen Mittelwert
zwischen 59 cm und 61 cm liefern, wenn
a) der Stichprobenumfang 36 beträgt?
b) der Stichprobenumfang 100 beträgt?
148
Aufgabe 5 Raumhöhe Die Raumhöhe der Häuser eines
Bauunternehmens ist eine normalverteilte Zufallsvariable mit Erwartungswert 2,60 m und Varianz 0,09 m2.
Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Raumhöhe bei 100 zufällig und unabhängig
ausgewählten Gebäuden größer als 2,65 m ist?
149
Aufgabe 6 Mehltüten Eine Mehltüten-Abfüllanlage ist so
eingestellt, dass das Füllgewicht X der 1 kg-Tüten normalverteilt mit einer Standardabweichung σ = 20 g ist.
Es wird eine Stichprobe von 40 Tüten untersucht.
Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe das durchschnittliche Füllgewicht X̄
a) mindestens 995 g beträgt,
b) zwischen 994 g und 1010 g liegt?
150
Herunterladen