1 Grundlagen - Ingo Manfraß

Werbung
Statistik (Informations- &
Prozesstechnologien)
Dies’ ist kein Selbstlernskript, sondern lediglich als Hilfe
für die Vorlesung gedacht. Es enthält u.a. etliche Lückentexte.
Studiengang: BBA/BAIM/BST an der FOM
Münster
Zudem ist es nur für die Vorlesung ’Statistik’ gedacht, die
ich halte.
Alle Angaben sind (wie immer) ohne Gewähr. D.h. Fehler sind
menschlich und bitte ich somit zu entschuldigen...
Ingo Manfraß (TEAM Dr. Kowalski)
Ingo Manfraß
19. März 2016
Kapitel I
§1
Deskriptive Statistik
Grundlagen
Konvention“ für indizierte lateinische Buchstaben
”
• Verteilung (Vtlg.)
• Parameter
Kleinbuchstaben
h3,fi
Großbuchstaben
H3,Fk
einzelne Werte
alle bis zum Index aufsummierten Werte
• Stichprobe (Stp.)
• Grundgesamtheit (GG)
1
2
Quicky Zähle die Daten aus und vervollständige die Tabelle:
Noten
§1.1 Begrifflichkeiten
x∗i
Strichliste
absolute
relative
kumulierte
Häufigkeit
Häufigkeit
rel. Häufigkeit
hi
fi
Fi
1
Beispiel In einem Kurs fallen 25 Mathe-Noten an:
2
3,3,5,2,4,2,3,3,4,2,3,3,2,4,3,4,1,1,5,4,3,1,2,4,3
3
4
5
6
Σ
3
4
Absolute Häufigkeiten [Quelle: Matsam]
Aus der letzten Spalte kann man die folgenden Dinge ablesen:
. . . Durchfallquote
. . . sind besser als 4
. . . sind schlechter als 3
5
6
Definition Gegeben seien n Beobachtungswerte (Zahlen)
x1, . . . , xn.
Dann heißt das Tupel (Vektor)
x = (x1, . . . ,xn)
eine Stichprobe vom Umfang n. Die einzelnen Zahlen xi
nennt man Stichprobenwerte.
Die in der Stichprobe vorkommenden unterschiedlichen
Werte x∗k ; d.h.
x∗ = (x∗1, . . . ,x∗s )
heißen Merkmalwerte.
Die Anzahl des Auftretens von x∗k in x; d.h.
Bemerkung Es gilt dabei
hk = n
s
X
fk = 1
k=1
bzw.
k=1
und
h(x∗k ) = hk
Abk.
0 ≤ fk ≤ 1
heißt absolute Häufigkeit von x∗k in x; die Quotienten
h
fk = k
n
heißen relative Häufigkeiten.
s
X
für alle k
8
7
Das Summenzeichen
Relative Häufigkeiten [Quelle: Matsam]
Für eine aufsummierte Folge von Zahlen, die einem Schema folgen, führt man die sogenannte Summenschreibweise
ein:
Statt
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ··· + n
schreibt man kurz mit
ak = k
die Summe in der Form:
n
X
ak
k=1
9
10
Rechenregeln:
Vervielfachung einer Summe
b
X
Beispiel
5
X
k=a
λ · xk = λ ·
b
X
xk
k=a
mit λ ∈ R
k=
k=3
12
11
Aufteilung einer Summe
Addition zweier Summen
b
X
k=a
xk +
b
X
k=a
yk =
b
X
b
X
xk + y k
k=a
k=a
13
xk =
c
X
k=a
xk +
b
X
xk
mit a < c < b
k=c+1
14
Quicky Berechne soweit wie möglich:
a)
12
P
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten fk .
Dann heißt die Summe der relativen Häufigkeiten derjenigen Merkmalwerte x∗i , die kleiner oder gleich x∗k sind,
also
k
k=10
b)
5
P
3
k=−5
c)
100
P
(3k + 2)
(Nutze:
k=1
d)
100
P
k=1
100
P
X
x∗i ≤x∗k
k = 5050)
die relative Summenhäufigkeit bzw. kumulierte relative
Häufigkeit von x∗k in x.
k=1
2k −
99
P
fi = Fk
2k
k=0
15
16
Tabelle zur Körpergröße von Kindern [Quelle: Matsam]
Definition (empirische Verteilungsfunktion)
Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ =
(x∗1, . . . ,x∗s ) und relativen Summenhäufigkeiten Fi.
Dann heißt die Funktion
F : R → [0; 1]
mit
F (x) =



0
Fi



1
mit x < x∗1
mit x∗i ≤ x < x∗i+1
mit x ≥ x∗s
empirische Verteilungsfunktion der Stichprobe x
17
18
Diagramm zur rel. und kom. Häufigkeit [Quelle: Matsam]
§1.2 Lageparameter
Fallbeispiel 1 Ein Kiosk-Betreiber ist mit sechs Filialen im
Markt und plant die Eröffnung eines siebten Standortes.
Dazu soll ein neuer Mitarbeiter angeworben werden. Die
sechs vorhandenen Mitarbeiter verdienen an den unterschiedlich frequentierten Standorten die folgenden Bruttogehälter:
x = (950,1200,1370,1580,1650,1800)
x̄ =
x̃ =
19
20
Fallbeispiel 1 Der mittlere Verdienst x̄ beträgt also 1425.
Dem Betreiber der Trinkhallen erscheint dieser Durchschnittsverdienst bei der Anwerbung eines neuen Mitarbeiters nicht besonders attraktiv zu sein. Er befürchtet,
bei diesen Verdienstmöglichkeiten keinen Mitarbeiter gewinnen zu können. Er kommt daraufhin zu dem Schluß,
seinen eigenen Verdienst von brutto 6000 mitzuberücksichtigen. Schließlich gehört er ja auch zum Stab der
Mitarbeiter, wenn auch in exponierter Position. Er legt
also zur Berechnung des Durchschnittsverdienstes die
erweiterte Stichprobe:
xneu = (950,1200,1370,1580,1650,1800,6000)
zugrunde.
x̄neu =
x̃neu =
21
22
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißt die reelle Zahl
x̄ =
n
1 X
xi
n i=1
x(1) ≤ x(2) ≤ · · · ≤ x(n)
Dann heißt die reelle Zahl
s
1 X
hk · x∗k
=
n k=1
=
s
X
k=1
Definition Sei x = (x1, . . . ,xn) eine Stichprobe und xg =
(x(1),x(2), . . . ,x(n)) die der Größe nach angeordnete Stichprobe, also



x


 n+1
2
x̃ =


1


 2 x( n ) + x( n +1)
2
2
fk · x∗k
mit n ungerade
mit n gerade
der empirische Median oder Zentralwert von x.
arithmetischer bzw. empirischer Mittelwert.
23
24
Quicky An einer Sägemaschine wurden in sechs Messungen folgende Verschnitte in Zentimetern festgestellt:
3,3,14,3,2,3
Definition Sei x = (x1, . . . ,xn) eine Stichprobe, dann heißt
jeder Merkmalwert x∗i , der am häufigsten in x vorkommt,
Modus bzw. Modalwert xD .
Wieviel durchschnittlichen Verschnitt muss der Betreiber seinen Kunden nennen?
• Arithmetisches Mittel:
• Median:
• Modus:
25
26
Quicky Von 10 Mitarbeitern eines Unternehmens beziehen
neun ein Jahreseinkommen von je 40.000 EURO, einer
(nämlich der Geschäftsführer) ein Jahreseinkommen von
400.000 EURO, so lässt sich das Durchschnittseinkommen wie folgt bestimmen:
Quicky Ermittle die Graphen der zugehörigen empirischen
Verteilungsfunktion F und ermittle jeweils auf zweifache
Art den zugehörigen Median (aus der Tabelle und der
Verteilungsfunktion).
a)
• Arithmetisches Mittel:
• Median:
b)
x∗k
Fk
x∗k
Fk
2
0.15
1
0.12
3
0.50
2
0.32
4
0.60
3
0.68
5
1.00
4
0.92
5
1.00
• Modus:
27
28
Mögliche Kandidaten für ein Streuungsmaß:
§1.3 Streuungsmaße
Streungsmaße sind Maße für die Repräsentanz des Mittelwertes x̄.
Beispiel Berechne Mittelwert und Median für die beiden
Stichproben x und y mit
① Arithmetisches Mittel der Abstände
n
1 X
(xi−x̄) =
n i=1
x = (3,3,3,4,4,4,5,6)
und
y = (−26, − 10,0,4,10,20,30)
29
30
② Arithmetisches Mittel der absoluten Abstände bzw. mittlere absolute Abweichung
n
1 X
|xi − x̄|
n i=1
③ Arithmetisches Mittel der Abstandsquadrate bzw. empirische Varianz
Quicky Berechne jeweils die Varianz für x und y aus obigem Beispiel.
Für x:
Für y:
n
1 X
(xi − x̄)2
n i=1
32
31
Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung
x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk .
Dann heißen
s2
n (x) =
n
1 X
(xi − x̄)2
n i=1
=
s
1 X
hk (x∗k − x̄)2
n k=1
=
s
X
k=1
bzw.
s2
n−1 (x) =
n
n
1 X
1 X
(xi − x̄)2 =
(x2 − 2xix̄ + x̄2)
n i=1
n i=1 i


n
n
n
X
X
1 X
x̄2
2xix̄ +
x2
= 
i −
n i=1
i=1
i=1


n
n
n
X
X
1 X
2
1
= 
x
+
x̄
x2
−
2x̄
i
n i=1 i
i=1
i=1
fk (x∗k − x̄)2


n
1 X
= 
x2 − 2nx̄2 + nx̄2
n i=1 i
n
1 X
(xi − x̄)2
n − 1 i=1
die empirische Varianz und die zugehörige positive Wurzel
q
s = + s2
empirische Standardabweichung von x.
s2
n (x) =
33


n
1 X
x2 − nx̄2
= 
n i=1 i
=
n
1 X
x2 − x̄2
n i=1 i
34
Quicky Berechne die Varianzen für x und y aus obigem
Beispiel mittels einer geeigneten Tabelle:
a)
2
Warum gibt es zwei Varianzversionen s2
n und sn−1 ?
b)
xi
x2
i
yi
yi2
3
3
3
s2
n−1 ist zu verwenden, wenn man
damit die Grundgesamtheitsvarianz
σ 2 schätzen will.
4
4
4
5
6
35
36
Ein weiteres Streuungsmaß ist die Spannweite:
Synchronisationsformel
Definition Die Spannweite r(x) einer Stichprobe x =
(x1, . . . ,xn) ist die positive Differenz des größten und
kleinsten Merkmalwertes von x.
n
s2 (x)
s2
n−1 (x) =
n−1 n
n
n
i=1
i=1
r(x) = max{xi} − min{xi}
37
38
§1.4 Mehrdimensionale Stichproben
Mit mehrdimensional ist hier zweidimensional gemeint.
Beispiel Körpergröße xi und Körpergewicht yi
xi
170
165
173
180
161
168
171
176
169
179
yi
75
60
64
79
62
76
71
72
65
85
39
40
Beispiel Drehzahl xi und Leistung yi
xi
800
1500
2500
3500
4200
4700
5000
5500
yi
12
20
31
40
52
60
65
70
41
42
Definition Gegeben seien n Paare (x1,y1), . . . ,(xn,yn) von
Zahlenwerten, die an n Individuen bzgl. zweier Merkmale
ermittelt werden.
Dann heißt
(x,y) = (x1,y1), . . . ,(xn,yn)
Daraus folgt:
bzw.
hik = n
r
s X
X
fik = 1
i=1 k=1
eine zweidimensionale Stichprobe vom Umfang n.
Falls die beiden Merkmale x,y die unterschiedlichen Werte
x∗1, . . . ,x∗s
r
s X
X
y1∗ , . . . ,yr∗
i=1 k=1
haben, so können in der Stichprobe die s · r Merkmalpaare (x∗i ,yk∗) vorkommen.
Die absolute Häufigkeit des Merkmalpaares (x∗i ,yk∗) bezeichnet man mit hik , die relative Häufigkeiten mit fik :=
0 ≤ fik ≤ 1
für alle i,k
hik
n
44
43
Veranschaulichung zweidimensionaler Häufigkeitsverteilungen mittels Kontingenztafeln:
(hik )
Zweidimensionale Verteilungen [Quelle: Matsam]
45
y1∗
y2∗
...
yk∗
...
yr∗
x∗1
h11
h12
...
h1k
...
h1r
x∗2
...
h21
...
h22
...
...
...
h2k
...
...
...
h2r
...
x∗i
...
hi1
...
hi2
...
...
...
hik
...
...
...
hir
...
x∗s
hs1
hs2
...
hsk
...
hsr
46
§1.5 Korrelation
Einführung eines neuen Parameters als Maß für den Zusammenhang der Merkmale x und y.
Beispiel
Die Randhäufigkeiten“ h·k , hi· nennt man Randverteilun”
gen der zweidimensionalen Stichprobe (x,y).
annähernd linear
steigend
diffus
47
48
Generalvoraussetzung
2
s2
x := sn−1
Erinnerung
Empirische Kovarianz:
x = (x1, . . . ,xn)
sxy =
Varianz:
s2
x =
n
n
1 X
1 X
(xi − x̄)2 =
(xi − x̄)(xi − x̄)
n − 1 i=1
n − 1 i=1
(x,y) = (x1,y1), . . . ,(xn,yn)
n
1 X
(xi − x̄)(yi − ȳ)
n − 1 i=1
49
50
Überträgt man diese Normierung, so erhält man:
Definition
Normierung der Varianz zur Standardabweichung:
q
sx = + s2
x =
Sei (x,y) =
(x1,y1), . . . ,(xn,yn)
mensionale Stichprobe; dann heißt
s2
x
sxy
r(x,y) =
=v
u
sx · sy
u
sx
t
n
P
i=1
n
P
i=1
eine zweidi-
(xi − x̄)(yi − ȳ)
(xi − x̄)2
!
n
P
i=1
(yi − ȳ)2
!
der empirische Korrelationskoeffizient von (x,y)“.
”
51
52
Also:
Arbeitstaugliche Version:
r(x,y) = v
u
u
t
r(x,y) = v
u
?
n
P
i=1
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
u
t
!
n
P
i=1
n
P
i=1
xiyi − nx̄ȳ
2
x2
i − nx̄
!
n
P
i=1
yi2 − nȳ 2
!
Arbeitstabelle:
mit
?=
n
X
i=1
xiyi − nx̄ȳ
53
54
Hauptsatz (Eigenschaften von r(x,y))
Für den empirischen Korrelationskoeffizienten
r einer zweidimensionalen Stichprobe (x,y) = (x1,y1), . . . ,(xn,yn)
gilt:
a) −1 ≤ r ≤ 1
c) Liegen alle Punkte (xi,yi) auf einer Geraden a + bx, so
gilt:
b) Aus |r| = 1 folgt die lineare Beziehung
yi = a + bxi

 1
r=
−1
für i = 1,2, . . . ,n
mit
für b > 0
für b < 0
Im Fall b = 0 ist wegen sy = 0 der Korrelationkoeffizient
nicht definiert.
s
a = ȳ − rx̄ · sxy
s
b = r · sxy
Die Punkte (xi,yi) liegen also auf einer Geraden, die für
r = −1 fallend und für r = 1 steigend ist.
55
56
57
58
Bemerkung Für den Korrelationkoeffizienten r gilt:
0 < |r| < 0.2
sehr geringe Korrelation
0.2 < |r| < 0.5
geringe Korrelation
0.5 < |r| < 0.7
mittlere Korrelation
0.7 < |r| < 0.9
hohe Korrelation
0.9 < |r| < 1
sehr hohe Korrelation
c) Arbeitstabelle
Fallbeispiel 3 Berechne den Korrelationskoeffizienten zum
Drehzahl-Beispiel. Gehe dabei wie folgt vor:
a) Arbeitstabelle aufstellen
b) Empirischen Korrelationskoeffizienten r bestimmen
xi
yi
800
12
1500
20
2500
31
3500
40
4200
52
4700
60
5000
65
5500
70
59
60
d)
xiyi − nx̄ȳ
r(x,y) = q P
P
2
( xi − nx̄2)( yi2 − nȳ 2)
P
§1.6 Regression
=
Interpolation und Extrapolation von Daten.
=
61
62
Konstruktion: Methode der kleinsten Quadrate nach C.F.
Gauß
(KQ-Schätzer)
Gesucht: ŷ = a + bx
Optimalgerade
63
f (a,b) :=
n
X
i=1
di =
n X
i=1
yi − (a + bxi)
2
→ minimieren
64
Herleitung mit der Mittelwertpunktbedingung.
(x̄,ȳ) liegt auf der gesuchten Geraden, d.h.
ȳ = a + bx̄
⇔
a = ȳ − bx̄
Ersetzt man nun in f a durch ȳ − bx̄, so reduziert sich f
zu einer eindimensionalen reellwertigen Funktion.
f ist also eine reellwertige Funktion vom Typ
f : R2 → R
65
66
Dieses liefert als Lösung:
n
P
(yi − ȳ)(xi − x̄)
sxy
b = i=1 P
= 2
n
sx
(xi − x̄)2
Definition Die oben konstruierte Optimalgerade
ŷ = a + bx
i=1
und heißt empirischer“ Regressionskoeffizient.
”
Er ist die Steigung der gesuchten Optimalgerade. Mit der
Mittelwertpunktbedingung (a = ȳ − bx̄) ist ŷ = a + bx dann
bestimmt.
heißt empirische Regressionsgerade oder empirisches Regressionspolynom ersten Grades.
68
67
Fallbeispiel 3 Berechne die Regeressionsgerade zum DrehzahlBeispiel
Polynom
2. Grades
69
Polynom
höheren Grades
70
Fallbeispiel 4
a) Das Regressionspolynom 2. Grades ist
ŷ = 11.952,77 − 13,8012x + 0,003974x2
Ein Regressionspolynom höheren Grades ist etwa
ŷ = a + bx + cx2
Die zugehörigen Koeffizienten a, b und c erhält man durch
lösen des linearen Gleichungssystems, das sich aus den zugehörigen drei partiellen Ableitungen ergibt. Diese heißen
Normalengleichungen“.
”
71
b) Berechnung der Trendwerte ŷ
72
c) Schätzung der Bevölkerung im Jahr 1945
d) Schätzung der Bevölkerung im Jahr 1960
Fazit: Bei nichtlinearen Regressionsfunktionen sollte man
auf Extrapolationen verzichten.
e) Schätzung der Bevölkerung im Jahr 1840
73
74
Kapitel II
§2
Induktive Statistik
Zufallsvariable Funktion der Stichprobenwerte; d.h. der
Wert ist noch nicht zugewiesen.
Grundlagen der ind. Statistik
Wahrscheinlichkeitsfunktion Ordnet jedem Ereignis eine
Wahrscheinlichkeit zu.
§2.1 Zufallsvariablen
Dichtefunktion Ordnet jedem Ereignis einen Wert zu.
Konvention“ für lateinische Buchstaben
”
Kleinbuchstaben
x,y,z
Großbuchstaben
X,Y,Z
realisierte Stichprobenwerte
Verteilungsfunktion Kumulierte Wahrscheinlichkeitsfunktion
Zufallsvariable
76
75
deskriptiv
x = (x1,x2, . . . ,xn)
−→
induktiv
−→
X = (X1,X2, . . . ,Xn)
Stichprobe mit Merkmalswerten xi
fi = f (xi)
Zufallsvektor mit Zufallsvariablen Xi
−→
relative Häufigkeit
Fi =
P
j≤i
Wahrscheinlichkeitsfunktion
fj
−→
relative Summenhäufigkeit
x̄
Empirische Varianz
F =
P
f
Verteilungsfunktion
−→
Empirischer Mittelwert
s2
n−1 (x)
f
Bemerkung Eine Zufallsfvariable X heißt diskret, wenn
X höchstens abzählbar“ viele verschiedene Werte an”
nehmen kann, andernfalls stetig.
E(X)
Stochastischer Erwartungswert
−→
Var(X)
Stochastische Varianz
77
78
Definition Ein Maß für die Sicherheit des Eintretens eines
Ereignisses ist die Wahrscheinlichkeit.
Die Wahrscheinlichkeit, mit der eine diskrete Zufallsvariable X die spezielle Ausprägung (bzw. Realisation,
Funktionswert) x annimmt, wird mit
Bemerkung Der Wahrscheinlichkeitsbegriff nach Laplace.
Sei A ein Ereignis, dann gilt
W (A) =
Anzahl der Günstigen
Anzahl aller Möglichkeiten
W (X = x)
bezeichnet.
79
80
Beispiel Schüler aus dem Notenbeispiel
Beispiel Einmaliger Würfelwurf
X=
X=
Wahrscheinlichkeit, dass ein zufällig getroffener Schüler
aus dem Notenbeispiel die Note 3 hat:
Wahrscheinlichkeit, dass eine 4 gewürfelt wird:
81
82
Beispiel Zweimaliger Münzwurf
Beispiel Dreimaliger Münzwurf
X=
X=
Wahrscheinlichkeit, dass einmal Wappen fällt:
Wahrscheinlichkeit, dass zweimal Wappen fällt:
83
84
Beispiel Beim dreimaligen Münzwurf gilt wieder:
Definition Die Funktion f , die jeder Ausprägung x einer
diskreten Zufallsvariablen X die Wahrscheinlichkeit ihres
Auftretens zuordnet, heißt Wahrscheinlichkeitsfunktion
f der diskreten Zufallsvariablen X (induktives Pendant
zu den relativen Häufigkeiten). D.h.
W (X = 0) =
W (X = 1) =
W (X = 2) =
f (x) = W (X = x)
W (X = 3) =
85
86
Quicky Zufallsexperiment: Ein Schüler aus dem Notenbeispiel wird zufällig auf dem Schulflur getroffen.
Zufallsvariable: X = Note des Schülers
Definition Sei ein Zufallsexperiment mit Ω gegeben und
sei X eine diskrete Zufallsvariable. Dann heißt die Funktion F , die jeder Ausprägung x von X die Wahrscheinlichkeit zuordnet, dass X höchstens den Wert x annimmt, also
F (x) := W (X ≤ x)
Verteilungsfunktion der diskreten Zufallsvariablen X.
87
f (x) = W (X = x)
F (x) = W (X ≤ x)
0
f (0) =
F (0) =
1
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
f (x) = W (X = x)
F (x) = W (X ≤ x)
1
f (1) =
F (1) =
2
f (2) =
F (2) =
3
f (3) =
F (3) =
4
f (4) =
F (4) =
5
f (5) =
F (5) =
6
f (6) =
F (6) =
P
88
Schwierig: Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f und Verteilungsfunktion F im stetigen Fall.
Quicky Zufallsexperiment: dreimaliger Münzwurf
Zufallsvariable: X = Anzahl der Wappen
x
x
deskriptiv
...
−→
−→
induktiv
...
P
89
90
Vergleiche dreimaliger Münzwurf:
Gegenüberstellung
diskret
stetig
diskret
W (a ≤ X ≤ b) =
W (a ≤ X ≤ b) =
stetig
92
91
Gegenüberstellung
diskret
W (X = a) =
Gegenüberstellung
stetig
W (X = a) =
diskret
stetig
Konsequenzen:
Fazit:
93
94
Gegenüberstellung
diskret
stetig
W (X ≤ a) =
Übertrag aus der Deskriptiven Statistik:
W (X ≤ a) =
Empirischer Mittelwert
x̄ =
=
Fazit: diskret
=
Fazit: stetig
n
1 X
xi
n i=1
s
1 X
hix∗i
n i=1
s
X
fix∗i
i=1
95
Stochastischer Erwartungswert
96
Empirische Varianz
• diskret
E(X) =
X
x
f (x) · x
s2
n (x) =
=
• stetig
E(X) =
Z∞
−∞
=
f (x) · x dx
n
1 X
(xi − x̄)2
n i=1
s
1 X
hi(x∗i − x̄)2
n i=1
s
X
i=1
97
fi(x∗i − x̄)2
98
Vereinbarung: (Statistischer Sprachgebrauch)
Unter dem Begriff statistische Verteilung“ versteht man
”
4 Komponenten:
Stochastische Varianz
• diskret
Var(X) =
X
x
f (x) x − E(X)
① Wahrscheinlichkeitsfunktion f
2
② Verteilungsfunktion F
• stetig
E(X) =
Z∞
−∞
f (x) x − E(X)
2
③ Stochastischer Erwartungswert E(X)
dx
④ Stochastische Varianz Var(X)
99
100
Wie viele Möglichkeiten gibt es beim Lotto (6 aus 49) sechs
Kugeln zu ziehen?
§2.2 Diskrete Verteilungen
Zum besseren Verständnis der bekannteren diskreten Verteilungen benötigt man einige Kenntnisse aus der Kombinatorik.
101
102
Binomialkoeffizient


 N 

n
=
Beispiel Wie Wahrscheinlich sind 6 Richtige im Lotto?
N!
(N − n)! · n!
=
=
=
103
104
Die hypergeometrische Verteilung
Variablen:
N
Voraussetzungen:
n
M
• Merkmal ist dichotom
M
N
x
• Merkmal ist diskret
x
n
: Grundgesamtheitsumfang
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe
• Ziehen ohne Zurücklegen (ZoZ)
105
106
Verteilung:
① Wahrscheinlichkeitsfunktion
f (x) = fH (x/N ; n; M ) =
③ Erwartungswert

 
 M   N −M 

·


n−x
x

E(X) =
x

 N 

n
Var(X) =
X
x
x
X
f (x) · x = n · θ
④ Varianz

② Verteilungsfunktion
F (x) = FH (x/N ; n; M ) =
X
f (x) x − E(X)
2
= nθ(1 − θ)
N −n
N −1
fH (ν)
ν=1
107
Beispiel Gesucht ist die Wahrscheinlichkeit im Lotto (6
aus 49) 3 bzw. 4 Richtige zu tippen.
108
Fallbeispiel 6 Glühbirnenbeispiel, 3. Evolutionsstufe
In einer Schachtel befinden sich 60 Glühbirnen. 20 davon
sind defekt. Ohne Zurücklegen werden nacheinander 10
Stück gezogen.
X = Anzahl brauchbarer Glühbirnen
Berechne die Wahrscheinlichkeiten:
a) Genau 7 brauchbare zu ziehen.
b) Mindestens 1 brauchbare zu ziehen.
109
110
Die Binomialverteilung
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit bestehen 5% der Tagesproduktion einer Maschine statt aus Rechtshänder-Hämmern, aus Hämmer für
Linkshänder. 20 Einheiten werden jeweils in einen Karton verpackt. Wie Wahrscheinlich ist es, dass bei einer Tagesproduktion von 1.000 Hämmern, ausschließlich
Hämmer für Rechtshänder im Karton sind?
Voraussetzungen:
• Merkmal ist dichotom
• Merkmal ist diskret
• Ziehen mit Zurücklegen (ZmZ)
111
112
Verteilung:
Variablen:
N
n
M
M
N
x
x
n
① Wahrscheinlichkeitsfunktion
: Grundgesamtheitsumfang
: Stichprobenumfang
: Anzahl der Merkmalsträger in der Grundgesamtheit
= θ : Anteil der Merkmalsträger in der Grundgesamtheit
: Anzahl der Merkmalsträger in der Stichprobe
= p : Anteil der Merkmalsträger in der Stichprobe

 n  x
f (x) = fB (x/n; θ) =   θ (1 − θ)n−x

x
② Verteilungsfunktion
F (x) = FB (x/n; θ) =
x
X
fB (ν)
ν=1
113
114
③ Erwartungswert
E(X) =
X
x
f (x) · x = n · θ
Beispiel Die Wahrscheinlichkeit beträgt 1,86%, dass man
beim einmaligen Lottospiel mindestens 3 Richtige hat,
und somit gewonnen hat. Wenn man 52 Wochen lang
Lotto spielt, wie wahrscheinlich ist es dann, mindestens
1-Mal in diesem Jahr im Lotto zu gewinnen?
④ Varianz
Var(X) =
X
x
f (x) x − E(X)
2
= nθ(1 − θ)
116
115
Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit besteht bei der Produktion von Hämmern bei jedem Hammer eine 5%-Wahrscheinlichkeit, dass er fehlerhaft produziert wird. Die Hämmer werden stets zu 20
in einem Karton verpackt. Wie Wahrscheinlich ist es,
dass keine fehlerhaften Hämmer in einem zufällig ausgewähltem Karton sind?
117
§2.3 Stetige Verteilungen
Die Gaußsche Normalverteilung ist die wichtigste stetige
Verteilung.
118
10 DM-Schein [Quelle: Wikipedia]
Gaußsche Normalverteilung
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 x−µ 2
1
f (x) = fn(x/µ,σ 2) = √
· e− 2 ( σ )
σ 2π
② Verteilungsfunktion
F (x) = Fn(x/µ,σ 2) =
119
Z x
1 ν−µ 2
1
√
· e− 2 ( σ ) dν
−∞ σ 2π
120
1. Problem: Obige Funktionswerte (Fn) sind schwierig zu
berechnen; also benötigt man Tabellen für die Funktionswerte.
③ Erwartungswert
E(X) = µ
④ Varianz
2. Problem: Man benötigt für jedes Paar (µ,σ 2) eine eigene Tabelle!
Var(X) = σ 2
121
122
Idee der
Standardisierung“
”
Normalverteilung mit verschiedenen Parametern [Quelle:
123
Überträgt man die Idee der Standardisierung“ auf eine
”
normalverteilte Zufallsvariable X mit
Matsam]
124
Standardnormalverteilung
E(X) = µ und Var(X) = σ 2,
so ergibt sich:
① Wahrscheinlichkeitsfunktion bzw. -dichte
1 2
1
f (z) = fn(z) = √
· e− 2 z
2π
X −µ
Z :=
σ
Z ist normalverteilt mit
② Verteilungsfunktion
E(Z) = 0 und Var(Z) = 1
F (z) = Fn(z) =
Man sagt dann auch kurz:
Z z
1 2
1
√
· e− 2 ν dν
−∞ 2π
Z ist (0,1)-normalverteilt bzw. standardnormalverteilt“.
”
125
126
③ Erwartungswert
Konvention“ für Zufallsvariablen
”
E(Z) = 0
X,Y
④ Varianz
Z
Var(Z) = 1
Realität
Tabellen-/ Rechenwerte“
”
128
127
Vergleich von Normal- und Standardnormalverteilung
Tabellengebrauch:
[Quelle: Matsam]
z
FN (−z)
FN (−z) =
129
FN (z)
FN (z) =
D(z)
D(z) =
130
Quicky Lies die folgenden Werte soweit möglich aus der
Tabelle zur Standardnormalverteilung ab.
Standardnormalverteilung mit ausgewählten Flächenanteilen
[Quelle: Matsam]
a) W (Z ≤ 1,06)
b) W (Z ≤ −1,03)
c) W (Z ≥ 1,13)
d) In einem Unternehmen sei das Gehalt normalverteilt mit
µ = 30.000 EURO und σ = 5.000 EURO.
Berechne die Wahrscheinlichkeit, dass das Gehalt eines
Mitarbeiters maximal 25.000 EURO beträgt.
131
Beispiel Materialiensammlung, 7. Übung, Aufgabe 1
Die Brenndauer einer bestimmten Sorte Glühlampen ist
normalverteilt mit dem Mittelwert µ = 1.200 Stunden
bei einer Standardabweichung von σ = 100 Stunden.
a) Man berechne die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne weniger als 1.000 Stunden brennt.
132
Aufgabe 1 Baby“ Das Gewicht von neugeborenen Kin”
dern sei normalverteilt mit µ = 3.200 g und σ = 800 g.
a) Wie groß ist die Wahrscheinlichkeit, dass ein Neugeborenes
i) mehr als 3.000 g,
ii) höchstens 2.500 g,
iii) zwischen 4 kg und 5 kg wiegt?
b) Wie groß ist die Wahrscheinlichkeit dafür, dass eine
zufällig ausgewählte Glühbirne eine Brenndauer von mehr
als 1.100 Stunden besitzt?
b) Wie schwer muss ein Neugeborenes sein, damit es zu
den 20 % leichtesten gehört?
c) Mit welcher Wahrscheinlichkeit liegt die Brenndauer einer zufällig ausgewählten Glühbirne zwischen 1.000 und
1.500 Stunden?
c) Wie schwer muss ein Neugeborenes sein, damit es zu
den 15 % schwersten gehört?
133
134
Aufgabe 2 Größe“ Für die Körpergröße von 18 − 20”
jährigen Männern ergibt sich ein Mittelwert von 1,80 m
bei einer Standardabweichung von 7,4 cm. Die Körpergröße kann als normalverteilt angesehen werden.
a) Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Mann dieser Altersgruppe
i) größer als 1,85 m,
ii) zwischen 1,70 m und 1,80 m groß?
b) Wie groß darf ein Mann maximal sein, damit er noch
zu den 5 % der kleinsten Männer gehört?
c) Benenne das 5 %-Quantil.
Aufgabe 3 Waschmaschine“ Waschmaschinen sollen für
”
einen Waschgang durchschnittlich 65 l Wasser verbrauchen. Ein Hersteller will erreichen, dass bei mindestens
95 % seiner Maschinen der Wasserverbrauch unter 75 l
sinkt. Welche Standardabweichung darf die Maschine
haben, wenn man voraussetzt, dass der Wasserverbrauch
normalverteilt ist?
d) In welchem symmetrischen Bereich um den Mittelwert
liegen die Größen von 50 % aller Männer dieser Altersgruppe?
135
Beispiel Materialiensammlung, 7. Übung, Aufgabe 2
Firma X-AG hat festgestellt, dass die Lebensdauer ihrer Maschinen vom Typ A normalverteilt ist mit einem
arithmetischen Mittel von 120.000 km. 3% der Motoren
dieser Art fallen jedoch bereits bei einer Leistung bis zu
70.000 km aus.
136
§3
Einfache Schätzverfahren
§3.1 Stichprobenverteilungen
a) Wie groß ist der Produktionsanteil, der eine Lebensdauer von 150.000 km und mehr hat? (σ = 26.596)
Wahrscheinlichkeitstheoretische Schätzung von Stichprobenparametern
b) Man zeige, dass die Standardabweichung der Lebensdauer (gemessen in 1.000 km) der Typ A Maschinen
26,596 beträgt.
137
138
Die zuletzt praktizierten Schlußweisen“:
”
W (xu ≤ X ≤ xo) =?
139
140
141
142
Betrachte X̄, so ergeben sich 2 Fragen:
1) Ist X̄ eine Zufallsvariable?
2) Wie ist X̄ verteilt?
[Quelle: Matsam]
§3.2 Zentraler Grenzwertsatz
Satz (Zentraler Grenzwertsatz - Teil 1)
Die Verteilung des arithmetischen Mittels X̄ von unabhängigen (z.B. Ziehen mit Zurücklegen), identisch verteilten
Zufallsvariablen X1, X2, . . . , Xn strebt mit wachsendem
Stichprobenumfang n
(Faustregel: n > 30)
gegen eine Normalverteilung mit dem Erwartungswert
Satz (Zentraler Grenzwertsatz - Teil 2)
Sind die Xi nicht unabhängig (z.B. Ziehen ohne Zurücklegen), so wird bei hinreichend großer Grundgesamtheit
gegenüber dem Stichprobenumfang und großem Stichprobenumfang n
(Faustregel: N > 2n und n > 30)
ebenfalls eine Normalverteilung angenommen und zwar
mit dem Erwartungswert
E(X̄) = µ
E(X̄) = µ
und der Varianz
und der Varianz
Var(X̄) =
σ2
n
Var(X̄) =
143
σ2 N − n
·
n N −1
144
Fallbeispiel 8a) LKW-Reifen
Bei der Untersuchung von 300 LKW-Reifen eines Fuhrunternehmens ergab sich eine durchschnittliche Profiltiefe von µ = 15,30 mm bei einer Standardabweichung
von σ = 4,10 mm. Aus dieser Grungesamtheit werden
36 Reifen (ohne Zurücklegen) entnommen.
Bezeichnung
2
• Var(X̄) = σX̄
Abk.
−n
• Der Faktor N
N −1 heißt
Korrekturfaktor für endliche Gesamtheiten“
”
i) Mit welcher Wahrscheinlichkeit 1 − α liegt die durchschnittliche Profiltiefe x̄ der Stichprobe zwischen 14,50
mm und 16,50 mm?
Hilfe: Formelsammlung, Anhang B
n < 0,05 vernachlässigt werden.
Dieser Faktor kann bei N
(d.h. ZmZ = ZoZ)
145
ii) Interpretiere diese Schlußweise aus der Sicht des Geprüften (Fuhrunternehmer)!
146
Fallbeispiel 9 Schraubenzieher, schwarze Version
Ein Werkzeughersteller gibt an, dass eine bestimmte
Sorte Schraubenzieher mit einer Breite von im Mittel
µ = 5 mm eine Standardabweichung von σ = 1,5 mm
hat.
a) Man berechne die Wahrscheinlichkeit, dass die durchschnittliche Breite x̄ bei einer Lieferung von n = 900
Schraubenziehern zwischen 4,902 und 5,098 liegt.
b) Interpretiere die Aufgabenstellung aus der Sicht beider
Vertragspartner: Lieferant und Abnehmer!
Macht es Sinn, Qualitätszertifizierungen mit Durchschnittswerten durchzuführen? Aus der Sicht des Abnehmers in Form von Qualitätskontrollen, aus der Sicht
des Lieferanten in Form von Qualitätsgarantien?
Aufgabe 4 Grubenstempel Ein Sägewerk liefert Grubenstempel als geschlossene Partie von 1.200 Stück, deren
Länge normalverteilt ist mit einem Erwartungswert von
60 cm und einer Varianz von 36 cm2.
Welchen Anteil der Stichproben wird einen Mittelwert
zwischen 59 cm und 61 cm liefern, wenn
a) der Stichprobenumfang 36 beträgt?
b) der Stichprobenumfang 100 beträgt?
147
Aufgabe 5 Raumhöhe Die Raumhöhe der Häuser eines
Bauunternehmens ist eine normalverteilte Zufallsvariable mit Erwartungswert 2,60 m und Varianz 0,09 m2.
Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Raumhöhe bei 100 zufällig und unabhängig
ausgewählten Gebäuden größer als 2,65 m ist?
148
Aufgabe 6 Mehltüten Eine Mehltüten-Abfüllanlage ist so
eingestellt, dass das Füllgewicht X der 1 kg-Tüten normalverteilt mit einer Standardabweichung σ = 20 g ist.
Es wird eine Stichprobe von 40 Tüten untersucht.
Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe das durchschnittliche Füllgewicht X̄
a) mindestens 995 g beträgt,
b) zwischen 994 g und 1010 g liegt?
149
150
Herunterladen