Statistik II für Betriebswirte

Werbung
Statistik II für Betriebswirte
Privat-Doz. Dr. H. Haase
Inst. f. Math. u. Inf.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
28.04.2017
Vorlesung 3
28.04.2017
1 / 61
Übersicht
1
Erwartungstreue, Wirksamkeit und Konsistenz
2
Das Maximum-Likelihood-Prinzip
3
Bayessche Schätztheorie
4
Intervallschätzungen
Kondenzintervalle für den Parameter p einer Binomialverteilung
Kondenzintervalle für die Parameter einer Normalverteilung
5
Wiederholung zu Statistik I
Lage- und Streumaÿe
Boxplots
Konzentrationsmaÿe
Korrelation und lineare Regression
Zeitreihenmodellierung
Auswertung einer xls-Datei
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
2 / 61
Erwartungstreue Punktschätzungen
Eine Schätzung
Parameter
Sγ = ϕ (X1 , . . . , Xn ; γ) heiÿt erwartungstreu für den
γ ∈ Γ,
wenn
E Sγ = γ
ist.
( X1 , . . . , Xn )
Umfang
n.
ist dabei eine feste mathematische Stichprobe vom
Eine Folge von Schätzungen
Sγ,n n∈N
wird
erwartungstreu für γ ∈ Γ genannt, wenn
lim
n→∞
asymptotisch
E Sγ,n = γ
gilt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
3 / 61
Beispiel für eine erwartungstreue Punktschätzung
Beispiel:
Stichprobenmittel
Es ist
1
n
X = ∑ Xk .
n k=
1
Dann ergibt sich wegen der Linearität des Erwartungswertes
E X
=
1
n
E (Xk ) ,
n k∑
=
1
wobei
E (X ) = µ
der Erwartungswert der Grundgesamtheit
X
ist.
Da die
X , . . . , Xn
über die gleiche Verteilung wie X verfügen, muÿ im besonderen auch
E (Xk ) = µ gelten,
1
somit ist
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
E X
=
1
n
Vorlesung 3
· n · µ = µ.
28.04.2017
4 / 61
Beispiel für eine nicht erwartungstreue Punktschätzung I
Beispiel:
mittlere quadratische Abweichung als kein erwartungstreuer
Schätzer für die Varianz.
Diese Abweichung ist
S
2
=
1
n
Xk − X
n k∑
=
2
.
1
Vereinfachung der Summe:
n
∑ Xk − X
k=
2
=
=
n
∑ Xk − 2X ∑ Xk + nX
2
k=
n
1
∑ Xk − 2nX
k=
n
2
k=
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
n
2
2
+ nX
2
1
=
∑ Xk − nX
k=
2
2
.
1
Vorlesung 3
28.04.2017
5 / 61
Beispiel für eine nicht erwartungstreue Punktschätzung II
Für
X
2
erhalten wir
2
X =
n
1
Xk
n2 k∑
=1
n
1
= 2
n
!2
2
∑ Xk2 + n2 ∑ Xi Xj .
i <j
k =1
Nunmehr ist
E (S2 ) =
1
n
1
n
2
E Xk2 − E X
n k∑
=1
1
n
2
E Xk2 − 2 ∑ E Xk2 − 2 ∑ E (Xi Xj )
n k∑
n k =1
n i <j
=1
2
n−1 n
= 2 ∑ E Xk2 − 2 ∑ E (Xi Xj )
n k =1
n i <j
=
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
6 / 61
Beispiel für eine nicht erwartungstreue Punktschätzung III
E (Xi Xj ) = E (Xi )E (Xj ) = (E (X ))2 für i , j = 1, . . . , j
i 6= j sowie E Xk2 = E (X 2 ) für alle k = 1, . . . , n erhalten wir
und wegen
und
n−1
2
n (n − 1 )
(E (X ))2
· n · E (X 2 ) − 2 ·
2
n
n
2
i n−1
n−1 h
2
2
=
· V (X ).
E (X ) − (E (X )) =
n
n
E (S2 ) =
Folglich ist
S2
σ 2 = V (X ).
nicht erwartungstreu hinsichtlich des Parameters
Aber
lim
n→∞
S2,n
n−1
· V (X )
n→∞ n
n−1
= σ 2.
= V (X ) · lim
n→∞ n
E (S2,n ) =
lim
ist somit zumindestens asymptotisch erwartungstreu.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
7 / 61
Ergänzungen IV
Anstelle der Bezeichnung von erwartungstreu sagt man auch:
unverzerrt,
unverfälscht
oder unbiased.
Insbesondere bezeichnet man die Funktion
b (γ) = Eγ (ϕ (X1 , . . . , Xn )) − γ
als
Bias des Schätzers ϕ (X1 , . . . , Xn ) für γ .
Erwartungstreue Schätzungen sind durch
b (ϕ (X1 , . . . , Xn ; γ)) = 0
für alle
γ
charakterisiert.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
8 / 61
Güte eines Schätzers
Kriterium zur Beurteilung der
Güte eines Schätzers oder Vergleich
zweier Schätzer ist der mittlere quadratische Fehler:
Ist
S = ϕ (X
1
, . . . , Xn )
ein Schätzer für einen Parameter
γ ∈ Γ,
so ist der
mittlere quadratische Fehler
MSEγ (S ) = Eγ [S − γ]
2
Eγ [S − γ] =
Eγ [S − E (S )] − 2 (S − E (S )) (E (S ) − γ) + [E (S ) − γ]
Wegen
2
2
2
= Eγ [S − E (S )]2 + Eγ [E (S ) − γ]2
und da
E [(S − E (S )) (E (S ) − γ)] = (E (S ) − γ) (E (S ) − E (S )) = 0 ist,
MSEγ (S ) = Vγ (S ) + [b (γ)]
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 3
.
28.04.2017
9 / 61
Wirksamkeit einer Schätzung
S1
wirksamer als S2
wird
als genannt, wenn
MSEγ (S1 ) ≤ MSEγ (S2 )
gilt.
Für erwartungstreue Schätzer
S
1
MSEγ (S
1
)
und
und
S2
für
γ:
S , wenn Vγ (S ) ≤ Vγ (S
MSEγ (S ) entfällt.
ist wirksamer als
von
S1
2
1
2
)
gilt, denn der Biasanteil
2
Die Bezeichnung wirksam ist damit plausibel, denn
S
1
streut dann
weniger stark.
Eine erwartungstreue Schätzung
S
heiÿt
wirksamste Schätzung für γ ,
MSEγ (S ) = Vγ (S ) minimal ist.
Frage: Wie klein kann im Fall erwartungstreuer Schätzungen Vγ (S )
wenn
werden ? (Antwort Kehrwert der Fischer-Information)
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
10 / 61
Die Fischer-Information
1. Fall: X
eine diskrete Grundgesamtheit
(Wahrscheinlichkeitsgewichte
pk ):
I (γ) = n · ∑
2. Fall:
Grundgesamtheit
I (γ) = n ·
X
d ln pk
dγ
2
pk
stetig verteilt:
Z∞ −∞
In beiden Fällen:
∂ ln f (t , γ) 2
· f (t , γ) dt
∂γ
Informationsungleichung von Rao-Cramer:
Vγ (S ) ≥
1
I (γ)
Also, kleiner als der Kehrwert der Fisher-Information kann die Varianz
nicht werden!!!!
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
11 / 61
Beispiel für eine wirksamste Schätzung
Stichprobenmittel,
γ =p
einer dichotomen Grundgesamtheit
X=
Es ist
1
n
X
Xk
n k∑
=1
p0 (γ) = 1 − γ und p1 (γ) = γ . Dann folgt für die Ableitungen
1
d ln p1 (γ) 1
d ln p0 (γ)
=
und
=
dγ
γ −1
dγ
γ
Fischer-Information
#
γ
n
.I (γ) = n
2 + γ 2 = γ (1 − γ)
(1 − γ)
"
1−γ
Andererseits ist
V X =
V X = 1/I (γ), also ist X
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
n
V (Xk ) =
n2 k∑
=1
γ (1 − γ)
n
eine wirksamste Schätzung.
Vorlesung 3
28.04.2017
12 / 61
Konsistente Punktschätzungen
Denition:
Sn ) eine Folge von Schätzungen für den Parameter γ .
Sei(
Wenn für jede Toleranzgrenze
lim
n→∞
so heiÿt die Schätzerfolge
Beispiel:
Folge
Erwartungswert
ε >0
und alle
γ
gilt:
Pγ (|Sn − γ| ≥ ε) = 0,
konsistent.
X n n∈N µ von X .
Folge konsistenter Schätzer für den
Begründung:
E X n = n ∑nk= E (Xk ) = µ .
V X n = σn2 mit V (X ) = σ σ2
Tschebysche -Ungleichung: Pγ X n − µ ≥ ε ≤
nε 2
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 3
→0
für
n→∞
28.04.2017
13 / 61
Das Maximum-Likelihood-Prinzip I
Minimalforderungen an Parameterschätzer:
Asymptotische Erwartungstreue
Konsistenz
Gibt es ein systematisches Verfahren zur Gewinnung eines solchen
Schätzers?
Sei
X.
(X1 , . . . , Xn )
eine mathematische Stichprobe der Grundgesamtheit
X
Zunächst folgende Annahme:
Für
(x1 , . . . , xn )
habe eine diskrete Verteilung
eine konkrete Stichprobe (Verteilung von
einem Parameter
γ ∈Γ
X
hänge von
ab) bilde:
n
L (γ) = ∏ Pγ (Xk = xk )
k=
1
Deutung von L (γ):
Wahrscheinlichkeit, daÿ die mathematische Stichprobe
konkrete Stichprobe
(x1 , . . . , xn )
realisiert, wenn
γ
(X1 , . . . , Xn )
die
der richtige
Parameter ist.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
14 / 61
Das Maximum-Likelihood-Prinzip II
Maximum-Likelihood-Prinzip: Wähle γML in Abhängigkeit von
(x1 , . . . , xn ) so, daÿ L an der Stelle γML ein Maximum annimmt. Dann
ist, wenn man (x1 , . . . , xn ) durch (X1 , . . . , Xn ) ersetzt,
γML = γML ((X1 , . . . , Xn ))
ML-Schätzung oder der ML-Schätzer für γ .
Ist die Grundgesamtheit X stetig mit der Dichtefunktion f (x , γ)
die
verteilt, so taucht
γ
als Parameter in der Dichtefunktion auf.
Man deniert die L-Funktion dann durch
n
L (γ) = ∏ f (xk , γ).
k=
1
unmittelbare Deutung als Wahrscheinlichkeit jetzt nicht möglich.
in beiden Fälle L-Funktionen von mehreren Parametern
γ1 , γ2 , . . . , γm
möglich
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
15 / 61
Das Maximum-Likelihood-Prinzip III
Eigenschaften von ML-Schätzer:
γ ((X , . . . , Xn )) ist asymptotisch erwartungstreu,
(γ ((X , . . . , Xn )))n∈N ist konsistent,
ML
ML
1
1
Zusätzlich:
γML ((X1 , . . . , Xn ))
γML ((X1 , . . . , Xn ))
MSEγ (γ
ML
für
ist asymptotisch normalverteilt und
ist asymptotisch am wirksamsten, d.h.
((X1 , . . . , Xn ))) − inf MSEγ (S (X1 , . . . , Xn )) → 0
S
n → ∞.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
16 / 61
Das Maximum-Likelihood-Prinzip IV
Beispiel:
ML-Schätzer für den Erwartungswert
µ
und die Streuung
einer mit diesen Parametern normalverteilten Grundgesamtheit
Dann ist für konkrete Stichprobe
f (x , µ, σ ) =
( x1 , · · · , xn )
1
√
σ
2π
·e
−
vom Umfang
n:
X.
σ
(x −µ)2
2σ 2 .
Dann lautet die L-Funktion
L (µ, σ ) = n
σ
1
√
n e −[∑
n
k
2π
Zur Bestimmung der Extremwertstellen
=1 (
x
k
−µ )2 ]/2σ 2 .
(µML , σML )
gehen wir zur
logarithmischen L-Funktion über, d.h.
L (µ, σ ) = −n ln σ − n ln
√
2π
−
1
2
"
n
∑ (xk − µ)
k=
#
2
· σ −2 .
1
beide Funktionen mit gleichen Extremwertstellen (Monotonie!!!)
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
17 / 61
Das Maximum-Likelihood-Prinzip V
Um diese zu bestimmen, bilden wir die partiellen Ableitungen nach
und
σ.
Für
µ
µ
erhalten wir aus
n
∂L
= ∑ (xk − µ) = 0
∂µ
k =1
zunächst
µML =
1
n
xk .
n k∑
=1
Analog erhält man aus
"
#
n
∂L
n
2
= − + ∑ (xk − µ) · σ −3 = 0
∂σ
σ
k =1
den ML-Wert
s
σML =
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
∑nk =1 (xk − µ)
.
n
Vorlesung 3
28.04.2017
18 / 61
Das Maximum-Likelihood-Prinzip und das Taxiproblem I
Stadt mit
N
Taxis, die mit 1 beginnend fortlaufend durchnummeriert
sind.
Mit Hilfe der beobachteten Nummern
Stichprobe zusammengefaÿt sind, soll
Annahme:
x
1
x , . . . , xn , die zu einer konkreten
N geschätzt werden.
1
≤ x2 ≤ . . . ≤ xn
Wahrscheinlichkeit für eine solche Stichprobe
1
N ,
n
Begründung:
alle Stichproben sind gleichberechtigt.
Wert wird wegen
xn ≤ N
Also ist
für
S
ML
der ML-Schätzer für
xn = N
am gröÿten.
= max {X1 , . . . , Xn }
N.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
19 / 61
Das Maximum-Likelihood-Prinzip und das Taxiproblem II
Schätzer mit systematischem Fehler: Die Lücke nach oben bleibt
unberücksichtigt.
Schätzung aus bekannten Lücken (wie?)
SML die untere Lückenlänge hinzu, d.h.
S2 = SML + min {X1 , . . . , Xn } − 1
Besser: Man fügt zu SML das Mittel aller Lücken hinzu, d.h.
Man fügt zu
X1 − 1 + X2 − X1 − 1 + . . . + Xn − Xn−1 − 1
n
Xn − n
= SML +
n
S3 = SML +
und wegen der angenommenen Ordnung der
S3 =
X1 , . . . , Xn
n+1
· max {X1 , . . . , Xn } − 1.
n
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
20 / 61
Bayessche Schätztheorie I
Diese Schätztheorie geht davon aus, daÿ die zu schätzenden
Parameter zufällig sind.
Dazu ist eine Anfangsverteilung für jeden zu schätzenden Parameter
gegeben.
Wie muÿ diese Anfangsverteilung geändert werden, wenn eine konkrete
Stichprobe
(x1 , . . . , xn )
vorliegt, so daÿ die Endverteilung für den Parameter
γ
am besten
mit der Stichprobe übereinstimmt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
21 / 61
Bayessche Schätztheorie II
Angenommen
γ
ist diskret und
P (γ = γm ) = qm
beschreibt die Anfangsverteilung von
γ.
Wir bilden die aus dem letzten Abschnitt bekannte L-Funktion
L (γm ) = Pγ (X1 = x1 , . . . , Xn = xn ).
m
L (γm ) ist die Wahrscheinlichkeit, dass nach Ziehen des Wertes γm
für den Parameter γ die Stichprobe (x1 , . . . , xn ) realisiert wird.
Die gesuchte Endverteilung des Parameters
γ
ist dann nach dem
Bayesschen Satz:
P (γ = γm |X1 = x1 , . . . , Xn = xn ) =
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
qm L (γm )
∑k qk L (γk )
28.04.2017
22 / 61
Bayessche Schätztheorie III
Hier gibt es zwei Möglichkeiten jetzt zu einem Bayes-Schätzer zu
kommen: Man bestimmt
γBayes
als ein
γm
mit
γBayes · L (γBayes ) = max qm L (γm ) .
m
Mit anderen Worten der Bayes-Schätzer ist der
γ -Wert,
wahrscheinlichste Ursache für das Ziehen der Stichprobe
der die
(x1 , . . . , xn )
ist.
Diese Vorgehensweise ist nur im Fall einer diskreten Verteilung für
γ
möglich.
oder man bestimmt
γBayes
als Erwartungswert bezüglich der
Endverteilung, d.h. im diskreten Fall:
γBayes =
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
∑m γm qm L (γm )
.
∑k qk L (γk )
Vorlesung 3
28.04.2017
23 / 61
Bayessche Schätztheorie IV
Wir berechnen aus der Dichte
h der Anfangsverteilung in Analogie
zum Bayesschen Satz mit Hilfe der L-Funktion
L (γ) = Pγ (X1 = x1 , . . . , Xn = xn )
die Dichte der Endverteilung, die von der Stichprobe abhängt, zu
h (γ) L (γ)
.
f (γ|X1 , . . . , Xn ) = R +∞
−∞ h(t )L(t )dt
Dann ist der zugehörige Bayes-Schätzer der Erwartungswert von
γ
bezüglich der Endverteilung bei stetiger Verteilung
sh(s )L(s )ds
.
−∞ h(t )L(t )dt
R +∞
γBayes = R−∞
+∞
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
24 / 61
Bayessche Schätztheorie V
Beispiel:
Ist
γ
die unbekannte Fehlerquote einer Warengruppe:
diese ist
anfänglich als zwischen 0 und 1 gleichmäÿig verteilt angenommen.
In einer Stichprobe vom Umfang
n werden nun m < n Teile
beanstandet.
Es ist
h(γ) = 1 für 0 ≤ γ ≤ 1 und sonst h(γ) = 0.
Für die L-Funktion bekommen wir
n m
L (γ) =
γ (1 − γ)n−m
m
Dann ist
R 1 n m +1
s
(1 − s )n−m ds
γBayes = 0R 1 mn n−m
m
=
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
dt
0 m t (1 − t )
R 1 m+1
n
−m
(1 − s )
ds
0s
R1
n
−m
m
dt
0 t (1 − t )
Vorlesung 3
28.04.2017
25 / 61
Bayessche Schätztheorie V
Fortsetzung des Beispiels:
Unter Benutzung der Hilfsformel
Z 1
0
u a (1 − u )b du =
a !b !
(a + b + 1)!
folgt (nach einigen Kürzungen):
γBayes =
Wegen
m = x1 + . . . + xn
m+1
.
n+2
erhalten wir die Darstellung
SBayes (X1 , . . . , Xn ) =
als Schätzer für
(∑nk =1 Xk ) + 1
n+2
γ.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
26 / 61
Intervallschätzungen I
γ
sei ein unbekannter Parameter einer Grundgesamtheit
Weiterhin sei
( X1 , . . . , Xn )
X.
eine mathematische Stichprobe vom
n
und Su (X1 , . . . , Xn ), So (X1 , . . . , Xn ) zwei Statistiken.
Umfang
Das zufällige abgeschlossene Intervall
[Su (X1 , . . . , Xn ) , So (X1 , . . . , Xn )]
heiÿt ein
Kondenzintervall zum Sicherheitsniveau β ∈ [0, 1], wenn
P (γ ∈ [Su (X1 , . . . , Xn ) , So (X1 , . . . , Xn )]) ≥ β
gilt.
Im Gegensatz zu den Punktschätzungen ergibt sich jetzt ein Bereich ,
wo der Parameter mit einer bestimmten Sicherheit liegen könnte.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
27 / 61
Intervallschätzungen II
Ein Ansatz zur Bestimmung eines Kondenzintervalls:
Sn = X
1
+ . . . + Xn
ist
Sp
n − E (Sn )
V (Sn )
näherungsweise standardisiert normalverteilt.
E (X ) = µ und V (X ) = σ
folglich E (Sn ) = n µ und V (Sn ) = nσ
2
2
Sp
n − E (Sn ) = X n − µ · √n.
σ
V (Sn )
Mit
Φ
für die Verteilungsfunktion der standardisierten Normalverteilung
und reellem
c >0
P
−c ≤
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Xn −µ
σ
·
√
Vorlesung 3
n≤c
≈ 2Φ (c ) − 1.
28.04.2017
28 / 61
Intervallschätzungen III
Bezeichnen wir mit
Φ
die Verteilungsfunktion der standardisierten
c >0
Xn −µ √
P −c ≤
· n ≤ c ≈ 2Φ (c ) − 1.
σ
Normalverteilung, so gilt für alle reellen
Hängt die Verteilung von
X
µ = µ (γ)
Funktionen von
und
σ = σ (γ)
nur von einem Parameter
γ
ab, so sind
γ.
Man muÿ dann also nur die Ungleichungskette
−c ≤
nach
γ
X n − µ (γ) √
· n≤c
σ (γ)
aufzulösen.
Die Lösungsmenge ist das gesuchte Kondenzintervall.
Es ist natürlich auch möglich, daÿ einer der beiden Parameter
σ
µ
oder
entweder gegeben oder anderweitig geschätzt werden muÿ, um ein
Kondenzintervall bestimmen zu können.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
29 / 61
Kondenzintervall für eine unbekannte Wahrscheinlichkeit p
I
unbekannte Wahrscheinlichkeit
Die Grundgesamtheit
(X1 , . . . , Xn )
Dann ist µ = p
Man bestimmt
X
σ 2 = p (1 − p ).
jetzt c > 0 aus
und
2Φ (
bzw.
mit 0
p.
ist dichotom (ja/nein), math. Stichprobe
c) − 1 = 1 − α
Φ (c ) =
< α < 1,
z.B.
α
2
.
α = 0.05
Einsetzen in die Ungleichungskette für
p
Xn −p √
· n≤c
−c ≤ p
p (1 − p )
gilt mit einer Mindestwahrscheinlichkeit von 1 − α
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
30 / 61
Kondenzintervall für eine unbekannte Wahrscheinlichkeit p
II
Lösungsmenge - Intervall
Grenzen hängen von
n, c
und
quadratische Gleichung in
p
Xn
ab
lösen
X −p √
p n
· n=c
p (1 − p )
Lösungen - Grenzen des Kondenzintervalls.
Wir erhalten aus
2
n X n − p = c 2 p (1 − p )
durch Ausmultiplizieren
2
nX n − 2npX n + np 2 = c 2 p − c 2 p 2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
31 / 61
Kondenzintervall für eine unbekannte Wahrscheinlichkeit p
III
Ordnen nach den Potenzen der Unbekannten
n + c 2 p2 −
2
p
2
2
nX n + c p + nX n = 0.
Dann ist
Su,o (X1 , . . . , Xn ) =
n im Vergleich zu c
1
n + c2
"
nX n +
c2
2
±c
r
nX n
1−
Xn +
c2
4
#
.
eine sehr groÿe Zahl, also
c2
c2
≈ 0, n + c 2 ≈ n und
≈0
2
2 (n + c )
n
vereinfachte Statistiken für die Grenzen
s
Su,o = X n ± c
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
Xn
1−
n
Xn
.
28.04.2017
32 / 61
Kondenzintervall für eine unbekannte Wahrscheinlichkeit p
IV
Länge des Kondenzintervalls
s
lKondenz = 2c ·
Frage:
Xn
1−
n
Xn
.
Wieviele Wahlberechtigte müssen von INFAS mindestens
befragt werden, damit mit 95%-tiger Sicherheit die Vorhersage in
einem 2%-tigen Kondenzintervall liegt ?
Der Lösungsansatz lautet oenbar
s
c·
2
Wegen
Φ (1, 96) ≈ 0, 975
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
ist
Xn
1−
n
Xn
≤ 0, 02.
c = 1, 96.
Vorlesung 3
28.04.2017
33 / 61
Kondenzintervall für eine unbekannte Wahrscheinlichkeit p
V
Xn
0
unbekannt: Zwischenabschätzung notwendig
≤ Xn ≤ 1
(Ungleichung vom geometrischen und arithmetischen
Mittel):
Xn
Wahl von
n
c
n
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Xn ≤
√ ≤ 0, 02
Also
1−
bzw.
1
4
.
1, 96
0, 02
2
≤n
n ≥ 9608
Vorlesung 3
28.04.2017
34 / 61
Kondenzschätzung für den Mittelwert bei Streung bekannt
I
X
normalverteilte Grundgesamtheit,
Grundgesamtheit,
σ0
( X1 , . . . , Xn )
Punktschätzung
X=
ist
math.
gegeben
X
n∑ i
N (µ, σ02 /n)-verteilt
folglich ist
n
1
i =1
X −µ√
n
σ0
standardisiert normalverteilt.
Ist
z1−α/2
das 1 − α/2-Quantil der Standarnormalverteilung, so gilt
X − µ √ P n ≤ z1−α/2 = 1 − α
σ0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
35 / 61
Kondenzschätzung für den Mittelwert bei Streung bekannt
II
Auösen der Ungleichung nach
µ
X − µ √ n ≤ z1−α/2
σ0
ergibt als Kondenzintervall
σ
σ
X − z1−α/2 · √0 , X + z1−α/2 · √0
n
Bei Anwendung
X
durch
x
n
ersetzen !!!
Länge des Kondenzintervalls
L = 2z1−α/2 · √0
n
Vorgabe der Genauigkeit durch L, dann:
2
2z1−α/2 σ0
n≥
L
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
σ
Vorlesung 3
28.04.2017
36 / 61
Beispiel
Eine Eierstiege mit 64 Eiern hat ein Durchschnittsgewicht pro Ei von
62g mit einer Streuung von 2g.
Dann ist das 95%-Kondenzintervall
62 − 1.96 ·
2
8
, 62 + 1.96 ·
2
8
= [61. 51, 62. 49] .
Die Intervalllänge beträgt
L = 62. 49 − 61. 51 = 0.98.
Für die Genauigkeit
2
L = 0.5 wären bereits
z1−α/2 σ0
L
2
=
2 · 1.96 · 2
0.5
2
= 245. 86
246 Eier erforderlich
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
37 / 61
Kondenzschätzung für den Mittelwert bei unbekannter
Streuung I
σ
muÿ geschätzt werden
Stichprobenvarianz als geeigneter Schätzer
SX2 =
X
und
SX2
1
n
X −X
n−1 ∑ i
2
i =1
unabhängig
Ansatz für Kondenzschätzung
X −µ√
n
SX
ist
t -verteilt mit n − 1- Freiheitsgraden, also
X − µ √ P n ≤ tn−1,1−α/2 = 1 − α
SX
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
38 / 61
Kondenzschätzung für den Mittelwert bei unbekannter
Streuung II
bzw.
S
S
P X − tn−1,1−α/2 · √X , X + tn−1,1−α/2 · √X = 1 − α
n
n
d.h.
S
S
X − tn−1,1−α/2 · √X , X + tn−1,1−α/2 · √X
n
n
ist das gesuchte Kondenzintervall
Anwendung: für
X
und
SX
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
konkrete
Vorlesung 3
x
und
sx
einsetzen
28.04.2017
39 / 61
Beispielrechnung mit R
Verwendung der lm-Funktion:
x <- c(1, 2, 3)
m <- lm(x ~ 1)
confint(m)
##
2.5 % 97.5 %
## (Intercept) -0.4841 4.484
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
40 / 61
Kondenzschätzung für die Varianz bei unbekanntem
Mittelwert I
Punktschätzung
SX2 =
für
1
χ 2 -verteilt
n
σ 2 i∑
=1
n
X −X
n−1 ∑ i
2
i =1
σ2
Ansatzpunkt:
ist
1
Xi − X
2
=
(n − 1) SX2
σ2
n − 1 Freiheitsgraden.
c1 und c2 mit
(n − 1) SX2
α
P
<
c
1 =
2
mit
Bestimmung von
2
σ
und
P
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
(n − 1) SX2
> c2
σ2
Vorlesung 3
=
α
2
,
28.04.2017
41 / 61
Kondenzschätzung für die Varianz bei unbekanntem
Mittelwert II
also
Auösen nach
(n − 1) SX2
P c1 ≤
≤ c2
σ2
σ2
mit
"
c1 = cn−1,α/2
und
= 1 − α.
c2 = cn−1,1−α/2
2
2
∑ni=1 (xi − x ) ∑ni=1 (xi − x )
,
cn−1,1−α/2
cn−1,α/2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
#
28.04.2017
42 / 61
Berechnung mit R
Nachbauen mit R-Funktionen:
z <- sd(x) * sd(x) * (length(x) - 1)
left <- z/qchisq(0.975, length(x) - 1)
right <- z/qchisq(0.025, length(x) - 1)
c(left, right)
## [1]
0.2711 39.4979
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
43 / 61
Lage- und Streumaÿe
Modalwert (häugster Wert)
Quantile
e
xα =
xi +1
x +x +1
i
2
Mittelwert
xn =
Quartilsabstand
i < nα < i + 1
i = nα
i
x1 + . . . + xn
n
IQR = ex0.75 − ex0.25
empirische Streuung
s
s=
n
1
(x − x )2
n∑ i n
i =1
Standardabweichung
s
sd =
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
n
(xi − x n )2
n − 1 i∑
=1
Vorlesung 3
28.04.2017
44 / 61
Momentenformeln
x1 , . . . , xn
gegeben
MW oder 1. Moment
xn =
2. Moment
x1 + . . . + xn
n
2
2
x + . . . + xn
x 2n = 1
n
empirische Streuung
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
s 2 = x 2n − (x n )2
Vorlesung 3
28.04.2017
45 / 61
Charakterisierung von Mittelwert und Median
x1 , . . . , xn
gegeben
Mittelwert als Minimumsstelle von
n
f (x ) = ∑ (xi − x )
2
i=
1
Median als Minimumsstelle von
n
g (x ) = ∑ |xi − x |
i=
1
Problem der Eindeutigkeit beim Median
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
46 / 61
Boxplots
Zuerst:
x ,x
x ∗ ∈ A mit x ∗ > ex /
Bestimmung von Median und Quartile von
Bestimmung der Ausreiÿer
x
x
∗
<e
x1/4 − 2 IQR
= min ({x1 , x2 , . . . , xn } \ A)
3
min
1
3
bzw.
x
max
, . . . , xn
3
IQR
+
4
2
2
oder und
= max ({x1 , x2 , . . . , xn } \ A)
Zeichne:
den Kasten zwischen
fette Linie bei
e
x1/2
Antennen bei
x
e
x1/4
und
e
x3/4
beliebiger Breite
parallel zu den beiden Breitseiten
min
und
x
max
Ausreiÿer mittels kleiner Kreise markieren
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
47 / 61
Konzentrationsmaÿe
x1 ≤ x2 ≤ . . . ≤ xn
(!!!)
(uk , vk ) k = 0, 1, . . . , n,
un = vn = 1
Berechnung von Punkten
u0 = 0 ,v0 = 0 sowie
wobei
und
k
∑ x
vk = in=1 i
∑i =1 xi
k
uk =
n
für
k = 1, . . . , n.
Auswertung mittels
Lorenz-Kurve
Gini-Koezient
1
G = 1 − (v0 + 2v1 + . . . + 2vn−1 + vn )
n
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
48 / 61
Korrelation und lineare Regression
X mit den Ausprägungen x1 , . . . , xn
y1 , . . . , yn
bzw.
Y
mit den Ausprägungen
Korrelation nach Pearson:
xy − x · y
q
rPearson = q
x 2 − (x )2 · y 2 − (y )2
Rangkorrelationskoezient nach Spearman
Datenreihen ihre Rangzahlen zuordnen
Paar
(xi , yi )
habe das Rangpaar
(Ri , Si ),
Berechnung
rSpearman = 1 −
Rangdierenz
di = Ri − Si
n d2
i
n (n2 − 1)
6 · ∑i =1
Gleichung der linearen Regression
yb = y +
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
xy − x · y
(x − x )
x 2 − (x )2
Vorlesung 3
28.04.2017
49 / 61
Zeitreihenmodelierung
Komponentenmodell
Bearbeitung mit Filtern: gleitende Durchschnitte
Saisonkomponente
Verfahren der Saisonbereinigung
Entfernen des Saisoneinusses mit Filtern von Vielfachem der
Saisonlänge (konstante Saisongur angenommen)
Dierenz zur ursprünglichen Reihe: verrauschte Saisonreihe
Schätzung der Saisonwerte (Mittlung über gleiche Zeitpunkte)
Zentrieren (Erhalt der Saisongur)
Subtraktion von Ausgangsreihe
Ergebnis saisonbereinigte Zeitreihe
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
50 / 61
Datenanalyse mit R
Zur Verfügung stehende Merkmale in auto.xls:
1
Haushaltsgrösse
2
Kinder
3
Jahreseinkommen
4
Preis
5
Gebraucht
6
PS
7
Grösse
8
Typ
9
Verbrauch
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
51 / 61
Analyse mit R I
library(xlsReadWrite)
##
##
##
##
##
##
##
##
##
xlsReadWrite version 1.5.4 (826aa0)
Copyright (C) 2010 Hans-Peter Suter, Treetron, Switzerland.
This package can be freely distributed and used for any
purpose. It comes with ABSOLUTELY NO GUARANTEE at all.
xlsReadWrite has been written in Pascal and contains binary
code from a proprietary library. Our own code is free (GPL-2).
Updates, issue tracker and more info at http://www.swissr.org.
ad <- read.xls("Autos.xls", sheet = "Daten")
names(ad)
## [1] "Haushaltsgrösse" "Kinder"
## [5] "Gebraucht"
"PS"
## [9] "Verbrauch"
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
"Jahreseinkommen" "Preis"
"Grösse"
"Typ"
28.04.2017
52 / 61
Analyse mit R II
Kinder
## Error: Objekt 'Kinder' nicht gefunden
geht nur so (die ersten 10 Werte):
ad$Kinder[1:10]
##
[1] 1 0 6 0 0 0 0 2 1 0
oder man setzt gleich
attach ein:
attach(ad)
PS[1:10]
##
[1] 180
79 103
32 31 100 101
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
66 230 277
Vorlesung 3
28.04.2017
53 / 61
Analyse mit R III
Nur die ersten 5 Variablen mit
head anzeigen:
head(ad[, 1:5])
##
##
##
##
##
##
##
1
2
3
4
5
6
Haushaltsgrösse Kinder Jahreseinkommen Preis Gebraucht
3
1
58680 25038
neu
3
0
41552 5274 gebraucht
8
6
66832 5269 gebraucht
1
0
24186 706 gebraucht
1
0
26630 7942
neu
1
0
29501 17782
neu
summary(Typ)
##
##
##
##
Campingmobil Kleintransporter
4
6
Sportwagen
10
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
Kombi
18
Limousine
34
28.04.2017
54 / 61
Analyse mit R IV
bei nominalen Variablen wie
Typ wird nur die Verteilungstabelle angezeigt.
Ansonsten
summary(Jahreseinkommen)
##
##
Min. 1st Qu.
19400 33900
Median
46700
Mean 3rd Qu.
Max.
46300
54100 101000
Man könnte aber auch gleich ad auf einen Schlag mit summary auswerten.
Wenn man weiÿ, daÿ man nur die Verteilungstabelle haben will, so erreicht
man dies mit:
table(Typ)
## Typ
##
Campingmobil Kleintransporter
##
4
6
##
Sportwagen
##
10
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
Kombi
18
Limousine
34
28.04.2017
55 / 61
Analyse mit R IV
Einzelne Statistiken wie Mittelwert, Standardabweichung oder Korrelation:
mean(Jahreseinkommen)
## [1] 46295
sd(Jahreseinkommen)
## [1] 16716
cor(PS, Jahreseinkommen)
## [1] 0.313
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
56 / 61
Analyse mit R V
Einen Boxplot zeichnet man mit:
100
boxplot(Jahreseinkommen/1000, ylab = "in Tsd Euro")
●
60
40
20
in Tsd Euro
80
●
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
57 / 61
Analyse mit R VI
und nur die Daten, die zum Zeichnen benutzt werden:
b <- boxplot(Jahreseinkommen/1000, plot = FALSE)
names(b)
## [1] "stats" "n"
"conf"
"out"
"group" "names"
also
b$stats
##
##
##
##
##
##
[1,]
[2,]
[3,]
[4,]
[5,]
[,1]
19.40
33.85
46.66
54.09
80.11
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
58 / 61
Analyse mit R VII
und die Ausreiÿer:
b$out
## [1]
92.65 101.07
●
●
2e+04
4e+04
6e+04
8e+04
1e+05
boxplot(Jahreseinkommen ~ Gebraucht)
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
gebraucht
Vorlesung 3
neu
28.04.2017
59 / 61
Analyse mit R VIII
model <- lm(PS ~ Jahreseinkommen)
names(model)
##
##
##
[1] "coefficients" "residuals"
[5] "fitted.values" "assign"
[9] "xlevels"
"call"
"effects"
"qr"
"terms"
"rank"
"df.residual"
"model"
model$coefficients
##
##
(Intercept) Jahreseinkommen
4.431e+01
9.807e-04
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 3
28.04.2017
60 / 61
Analyse mit R IX
plot(Jahreseinkommen, PS)
abline(coef(model), col = "blue")
●
250
●
●
150
100
50
PS
200
●
●
●
●
●
2e+04
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
●
●
●●
●
●
●
●
●● ●
● ●●
●●
●● ●
●●● ● ●
● ●●
●●
●
●
●
● ●
● ●●● ● ●
●●
●
●
●
● ●
●
●
●● ●●
●
●
●●
●
4e+04
6e+04
●●
●
●
8e+04
1e+05
Jahreseinkommen
Vorlesung 3
28.04.2017
61 / 61
Herunterladen