Vorlesung 12

Werbung
Statistik und Wahrscheinlichkeitsrechnung
Statistik und
Wahrscheinlichkeitsrechnung
Dr. Jochen Köhler
09.05.2008
1
Statistik und Wahrscheinlichkeitsrechnung
Inhalt der heutigen Vorlesung
ƒ
Zusammenfassung der vorherigen Vorlesung
ƒ
Übersicht über Schätzung und Modellbildung
ƒ
Modellevaluation durch Statistische Tests
‐
Der χ2 –Test für die Güte der Anpassung ‐
Der Kolmogorov‐Smirnov Test für die Güte der Anpassung ‐
Modellvergleiche 09.05.2008
2
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der vorherigen Vorlesung
ƒ
Wir betrachteten die Möglichkeit, die Parameter einer Verteilung basierend auf Beobachtungen/Daten abschätzen zu können. Was haben wir gelernt?
Dass die Parameter einer Verteilung geschätzt werden können mit Hilfe von z.B. der:
– Methode der Momente MoM
– Methode der maximalen Likelihood MLM 09.05.2008
3
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der vorangehenden Vorlesung
ƒ
Methode der Momente (MoM) – Punktschätzung
Das Prinzip der MoM ist: Wir schätzen die Parameter, indem wir die analytisch berechneten Momente mit den Stichprobenmomenten gleichsetzen. 1 n
m1 = ∑ xˆi
n i=1
1 n 2
m2 = ∑ xˆi
n i=1
∞
λ1 = ∫ x ⋅ f X (x μ,σ )dx
−∞
∞
λ2 = ∫ x2 ⋅ f X (x μ,σ )dx
−∞
Dies führt zu k Gleichungen, welche gelöst werden müssen um k
Parameter abzuschätzen. 09.05.2008
4
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der vorangehenden Vorlesung
ƒ
Methode der maximalen Likelihood (MLM) – Schätzung der Parameter und ihrer Verteilung Das Prinzip der MLM ist: Die Parameter werden geschätzt, indem die Likelihood das die Parameter die Beobachtungen/Daten repräsentieren maximiert wird. n
L(θ xˆ ) = ∏ f X ( xˆi θ)
i =1
n
l (θ x) = ∑ log( f X ( xˆi θ))
i =1
m in ( − l ( θ xˆ ))
θ
09.05.2008
μΘ = (θ1∗ ,θ 2∗ ,..,θ n∗ )T
CΘΘ = H−1
Hij =
∂ 2 − l(θ xˆ )
∂θi ∂θ j
θ=θ∗
5
Statistik und Wahrscheinlichkeitsrechnung
Schätzung und Modellentwicklung ‐ Übersicht
ƒ
Unterschiedliche Typen an Information werden genutzt, wenn Ingenieurmodelle entwickelt werden. –
–
Subjektive Information Frequentistische Information
subjektiv
‐ physikalisches Verständnis
‐ Erfahrung
‐ Beurteilungsvermögen
frequentistisch
‐ Daten
Stichprobenstatistiken
‐ Konfidenzintervalle
‐ Statistische Signifikanz
09.05.2008
Wahrscheinlichkeitspapier
Verteilungsfamilie
probabilistisches
Modell
Verteilungsparameter
Methode der Momente
Methode der maximalen Wahrscheinlichkeit
6
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Nehmen wir an, dass wir eine bestimmte Verteilungsfunktion gewählt haben, um die Unsicherheit eines unsicheren Ereignisses zu modellieren. Verteilungsfamilie
fx(x)
Daten physikalische Gesetze
Druckfestigkeit Beton
Daten
Verteilungsparameter
μ, σ
x
Nun wollen wir die Wahl unserer Verteilung prüfen –
Durch statistische Tests.
09.05.2008
7
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Zwei unterschiedliche Fälle werden betrachtet: Verifizierung von
1: Diskreten Verteilungsfunktionen
px(x)
CHI‐Quadrat (χ2) Test
x
2: Kontinuierlichen Verteilungsfunktionen
fx(x)
Kolmogorov Smirnov Test
x
09.05.2008
8
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Die Idee dahinter ist, dass die Differenzen εj zwischen der erwarteten und der beobachteten Datenverteilung klein sein sollte, wenn die gewählte Verteilungsfamilie die Stichprobe gut beschreiben kann. 10
9
εj
Beobachtungen
8
εi
7
6
Histogramm aus Beobachtungen
5
Histogramm gemäss den erwarteten Beobachtungen
entsprechend der gewählten
Verteilung und deren Parameter
4
3
2
1
0
0‐25
25‐30 30‐35
35‐ ∞
Druckfestigkeit Beton (MPa)
09.05.2008
9
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Wie wir bereits wissen, ist eine diskrete kumulative Wahrscheinlichkeitsverteilungsfunktion wie folgt gegeben: i −1
P(xi ) = ∑ p(x j )
j =1
Wahrscheinlichkeitsdichtefunktion
09.05.2008
Kumulative Wahrscheinlichkeitsverteilungsfunktion
10
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Sei n die Anzahl Beobachtungen einer diskreten Zufallsvariable X. Die X = xi
Anzahl an Beobachtungen von d.h. N
i ist eine binomial verteilte Zufallsvariable mit folgendem Erwartungswert und Varianz:
E[ Ni ] = np(xi ) = N p,i
Erwartete Anzahl Beobachtungen
eines gewissen Wertes
Var [ Ni ] = np(xi )(1− p(xi )) = N p,i (1− p(xi ))
09.05.2008
11
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Sei n die Anzahl Beobachtungen einer diskreten Zufallsvariable X. Die X = xi
Anzahl an Beobachtungen von d.h. N
i ist eine binomial verteilte Zufallsvariable mit folgendem Erwartungswert und Varianz:
E[ Ni ] = np(xi ) = N p,i
Erwartete Anzahl Beobachtungen
eines gewissen Wertes
Var [ Ni ] = np(xi )(1− p(xi )) = N p,i (1− p(xi ))
ƒ
Wenn das postulierte Modell korrekt und n gross genug ist, dann ist gemäss dem zentralen Grenzwertsatz die Differenz εi standard
normalverteilt.
No,i − N p,i Beobachtete Anzahl Beobachtungen
eines gewissen Wertes
εi =
N p,i (1 − p(xi ))
09.05.2008
12
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ Werden die quadrierten Differenzen von beobachteten und erwarteten Anzahl Beobachtungen summiert, dann erhalten wir: k
(No,i − N p,i )2
i =1
i =1
N p,i (1 − p( xi ))
ε 2 = ∑εi2 = ∑
ε2
ε1
CHI‐Quadrat verteilt mit k‐1 Freiheitsgraden
ε3
10
Anzahl an Beobachtungen
k
9
8
k
( N o ,i − N p ,i ) 2
i =1
N p ,i
εm = ∑
2
ε4
7
6
Histogramm
aus Beobachtungen
5
4
3
Histogramm der
erwarteten
Beobachtungen
2
1
0
0
1
2
3
Anzahl Unfälle pro Monat
09.05.2008
13
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Es wird nun auf einem Signifikanzniveau α getestet, ob die Summe aller beobachteten quadrierten Differenzen plausibel ist, d.h. Es wird die Nullhypothese H0 aufgestellt, dass die gewählte Verteilungsfunktion die beobachtete Stichprobe repräsentiert. Die Vorgehensregel lautet dann
P(ε m2 ≥ Δ) = α
Die Alternativhypothese H1 ist weit weniger informativ, weil mit ihr ausser der gewählten Verteilung alle anderen Verteilungen akzeptiert werden.
2
χ
v = k −1 − j
der Verteilung mit Freiheitsgraden.
α
Δ ist der Fraktilwert
09.05.2008
14
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Wir betrachten folgendes Beispiel: Als Verteilungsfunktion für 20 Beobachtungen der Betondruckfestigkeit nehmen wir die Normalverteilung an. Der Mittelwert beträgt 33 Mpa
Und die Standardabweichung 5 Mpa
Wobei die Parameter nicht aus den vorhandenen Beobachtungen geschätzt werden. Die Normalverteilung ist eine kontinuierliche Verteilung. Aber sie kann ganz einfach diskretisiert werden!
09.05.2008
15
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wahrscheinlichkeitsdichte
Gewählte Verteilungsfunktion
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
50
60
Druckfestigkeit Beton (MPa)
09.05.2008
16
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wahrscheinlichkeitsdichte
Gewählte Verteilungsfunktion
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
50
60
Druckfestigkeit Beton (MPa)
Intervall 0‐25: − ∞ − 33 ⎤
⎡ 25− 33
20 ⎢Φ(
) − Φ(
)⎥ = 20⋅ 0.055= 1.10
5
5
⎣
⎦
Totale Anzahl an Versuchen
09.05.2008
17
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Erwartetes Histogramm
0.09
0.08
0.07
Anzahl Beobachtungen
Wahrscheinlichkeitsdichte
Gewählte Verteilungsfunktion
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
Druckfestigkeit Beton (MPa)
Intervall 0‐25: 50
60
9
8
7
6
5
4
3
2
1
0
0‐25
25‐30
30‐35
35‐∞
Druckfestigkeit Beton (MPa) − ∞ − 33 ⎤
⎡ 25− 33
20 ⎢Φ(
) − Φ(
)⎥ = 20⋅ 0.055= 1.10
5
5
⎣
⎦
Totale Anzahl an Versuchen
09.05.2008
18
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung Die beobachteten und erwarteten Histogramme können nun verglichen werden. ƒ
Anzahl an Beobachtungen
10
9
8
7
6
Histogramm
aus
Beobachtungen
5
4
3
Histogramm der
erwarteten
Beobachtungen
2
1
0
0‐25
25‐30 30‐35
35‐ ∞
Druckfestigkeit Beton (MPa)
09.05.2008
19
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung Die beobachteten und erwarteten Histogramme können nun verglichen werden. ƒ
10
10
9
9
8
7
6
Histogramm
aus
Beobachtungen
5
4
3
Histogramm der
erwarteten
Beobachtungen
2
1
0
0‐25
25‐30 30‐35
35‐ ∞
Druckfestigkeit Beton (MPa)
09.05.2008
Anzahl an Beobachtungen
Anzahl an Beobachtungen
‐ Aufgrund der kleinen Anzahl an Stichproben im unteren Bereich werden die zwei unteren Intervalle zusammengeführt. 8
7
6
5
4
3
2
1
0
0‐30
30‐35
35‐ ∞
Druckfestigkeit Beton (MPa)
20
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung –
Berechnungen zum genannten Beispiel
Intervall xj
(MPa)
0‐ 30
30 ‐35
35‐ ∞
Anzahl
Beobach‐
tungen
No,j
5
9
6
Erwartete
Wahrschein‐
lichkeiten
0.296671
0.381169
0.344578
Erwartete
Anzahl Beo‐
bachtungen
Np,j,
5.933415
7.65443
6.412155
Summe
Stich‐
proben‐
statistik
0.14684
0.236537
0.026492
0.40987
k
( N o, j − N p , j ) 2
j =1
N p, j
ε m2 = ∑
Auf einem Signifikanzniveau von 5% erhalten wir für die CHI‐Quadrat‐Verteilung
Mit N=3‐1=2 Freiheitsgraden aus der Tabelle: = 5.99.
Δ
Da 0.40987 kleiner ist als 5.99, kann die Nullhypothese H0 nicht verworfen werden.
09.05.2008
21
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Wird eines, oder mehrere (m) Parameter der gewählten Verteilung aus den gleichen Daten bestimmt wurde, welche auch für den Test verwendet wurden, dann muss die Anzahl der Freiheitsgrade entsprechend reduziert werden: v = k −1− j
–
09.05.2008
Unter der Annahme, dass die Varianz aus den Daten bestimmt wurde, aber nicht der
Mittelwert, erhalten wir n= 3-1-1=1 Freiheitsgrad.
22
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der CHI‐Quadrat Test der Güte der Anpassung ƒ
Wenn wir eine Normalverteilung annehmen mit folgenden Parametern:
μ=
33.00
σ=
4.05
erhalten wir folgendes Ergebnis:
Intervall xj
(MPa)
0 ‐ 30
30 ‐ 35
35 ‐ ∞
Anzahl
Beobach‐
Tungen No,j
5
9
6
Erwartete
Erwartete
Wahrschein‐ Anzahl Beo‐
lichkeiten p(xj) bachtungen
Np,j=
, 20p(xj)
0.274253
5.485061
0.381169
7.623373
0.344578
6.891566
Summe
Stich‐
proben‐
statistik
0.042896
0.248591
0.115342
0.406829 Auf einem Signifikanzniveau von 5% erhalten wir für die CHI‐Quadrat‐Verteilung
Δ
mit N=3‐1‐1=1 Freiheitsgraden aus der Tabelle: = 3.84.
Da 0.406829 kleiner ist als 3.84, kann die Nullhypothese H0 nicht verworfen werden.
09.05.2008
23
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov‐Smirnov Test der Güte der Anpassung ƒ
Die Idee hinter dem Kolmogorov‐Smirnov Test ist folgende:
Wenn die kumulative Wahrscheinlichkeitsverteilungsfunktion der gewählten Verteilung für die Beobachtungen in Betracht kommt, dann sollte die maximale Differenz zwischen der beobachteten und der erwarteten kumulativen ε max
Wahrscheinlichkeitsverteilungsfunktion klein sein.
ε max < Δ n ,α
09.05.2008
24
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov‐Smirnov Test der Güte der Anpassung ƒ
Die kumulative Wahrscheinlichkeitsverteilungsfunktion der Beobachtungen kann berechnet werden als: i
Fo ( xi ) =
n
Folgende Stichprobenstatistik wird benutzt:
ε max
09.05.2008
⎡i
⎤
⎡
⎤
= max ⎣ Fo ( xi ) − Fp ( xi ) ⎦ = max ⎢ − Fp ( xi ) ⎥
⎣n
⎦
25
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov‐Smirnov Test der Güte der Anpassung ƒ
Die Kolmogorov‐Smirnov Stichprobenstatistik wird folgendermassen ermittelt:
Φ-1(Fx(x))
Fx(x)
2
0.98
1.5
0.84
1
0.5
0.50
0
-0.5
0.15
-1
-1.5
0.02
-2
20
25
30
35
40
45
x
09.05.2008
26
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov‐Smirnov Test der Güte der Anpassung ƒ
Die Kolmogorov‐Smirnov Statistik ist tabelliert:
ƒ
Für n = 20 und α = 5% erhalten wir 0.2941, im Vergleich zur beobachteten Statistik von 0.1061 – die Nullhypothese H0 kann nicht verworfen werden auf einem Signifikanzniveau von 5%. 09.05.2008
27
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich
ƒ
Modellverifizierung durch statistische Tests kann genutzt werden, um die Plausibilität eines bestimmten Modells in Bezug auf ein bestimmtes Datenset zu quantifizieren. Zwei Fälle müssen in Betracht gezogen werden: 1.
2.
Es kann gezeigt werden, dass die Hypothese akzeptiert werden kann.
Es kann gezeigt werden, dass die Hypothese verworfen werden muss.
Welche Information ist in diesen beiden Fällen enthalten?
09.05.2008
28
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich ƒ
Wenn ein Signifikanztest zeigt, dass eine Hypothese akzeptiert werden kann: Wir müssen uns daran erinnern, dass auch andere Modelle (Verteilungen) in Frage kommen… tatsächlich ist es oft der Fall, dass mehrere Modelle den Signifikanztest „bestehen“!
ƒ
Wenn ein Signifikanztest zeigt, dass eine Hypothese verworfen werden muss: Dies heisst nicht unbedingt, dass das gewählte Modell schlecht ist – es könnte bedeuten, dass der Beweis einfach nicht stark genug ist, um die entsprechende Signifikanz zu zeigen – zu wenig Daten! 09.05.2008
29
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich ƒ
Wenn zwei Modellhypothesen akzeptiert werden können, d.h. beide Modelle plausibel sind, dann können wir die Güte der Anpassung der zwei Modelle testen entweder durch: ƒ
Die Stichprobenstatistik direkt vergleichen – kann nicht beweiskräftig sein, u.a. aufgrund unterschiedlicher Freiheitsgrade
ƒ
Die Likelihood vergleichen !!!
09.05.2008
30
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich ƒ
Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen: Modell 1: N(33;5)
Parameter nicht aus den gleichen Daten geschätzt
n=3‐1=2
CHI‐Quadrat Stichprobenstatistik = 0.40987
Stichprobenwahrscheinlichkeit = 0.8151
Modell 2: N(33;4.05)
Parameter aus den gleichen Daten geschätzt
n=3‐1‐1=2
CHI‐Quadrat Stichprobenstatistik = 0.40683
Stichprobenwahrscheinlichkeit = 0.5236
09.05.2008
31
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Zusammenfassung
ƒ
Die Wahl eines geeigneten probabilistischen Modells kann durch Signifikanztests an der Modellhypothese unterstützt werden. ƒ
Der CHI‐Quadrat Test wurde für diskrete Verteilungen entwickelt.
ƒ
Der Kolmogorov‐Smirnov Test wurde für kontinuierliche Verteilungen entwickelt. ƒ
Die Güte der Anpassung verschiedener Modellalternativen kann durch den Vergleich verschiedenen Likelihoods geprüft werden. 09.05.2008
32
Herunterladen