N - Extras Springer

Werbung
Statistik und Wahrscheinlichkeitsrechnung
Statistik und
Statistik
und
Wahrscheinlichkeitsrechnung
Prof. Dr. Michael Havbro Faber
28.04.2009
1
Statistik und Wahrscheinlichkeitsrechnung
Inhalt der heutigen Vorlesung

Zusammenfassung der letzten Vorlesung

Übersicht über Schätzung und Modellbildung

Modellevaluation durch statistische Tests
‐ Der 2 –Test für die Güte der Anpassung
‐ Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung
‐ Modellvergleich
28.04.2009
2
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der letzten Vorlesung

Wir betrachteten die Möglichkeit, die Parameter einer g
g /
Verteilung basierend auf Beobachtungen/Daten abschätzen zu können. Was haben wir gelernt?
Die Parameter einer Verteilung können z. B. anhand folgender Die
Parameter einer Verteilung können z B anhand folgender
Methoden geschätzt werden:
– Methode der Momente (MoM)
– Maximum‐Likelihood‐Methode
Maximum Likelihood Methode (MLM) (MLM)
28.04.2009
3
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der letzten Vorlesung

Methode der Momente (MoM) – Punktschätzung
Das Prinzip der MoM
Das
Prinzip der MoM ist: Wir schätzen die Parameter, indem ist: Wir schätzen die Parameter indem
wir die analytisch berechneten Momente mit den p
g
Stichprobenmomenten gleichsetzen. 1 n
m1   xˆi
n i1
m2 
n
1
xˆi2

n i1

1   x  f X (x , )dx


2   x2  f X (x , )dx

Dies führt zu Gleichungen, welche gelöst werden müssen, Dies
führt zu k Gleichungen welche gelöst werden müssen
um k Parameter abzuschätzen. 28.04.2009
4
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung der letzten Vorlesung

Maximum‐Likelihood‐Methode (MLM) – Schätzung der Parameter und ihrer Verteilung Die Parameter werden geschätzt, indem die Likelihood, dass die Parameter die Beobachtungen/Daten repräsentieren, g /
p
,
maximiert wird. n
L(θ xˆ )   f X ( xˆi θ)
i 1
n
l (θ xˆ ) =
å
log( f X ( xˆi θ))
μ  (1 , 2 ,.., n )T
C  H1
i=1
m in (  l ( θ xˆ ))
θ
28.04.2009
Hij ==
¶2l(θ xˆ )
¶θi¶θ j
θ=θ*
5
Statistik und Wahrscheinlichkeitsrechnung
Übersicht Schätzung und Modellbildung

Unterschiedliche Typen an Information werden genutzt, um Unterschiedliche
Typen an Information werden genutzt um
Ingenieurmodelle zu entwickeln. – Subjektive Information Subjektive Information
– Frequentistische Information
Subjektiv
‐ Physikalisches Verständnis ‐ Erfahrung
‐ Urteil
Frequentistisch
‐ Daten
Wahrscheinlichkeitspapier
Verteilungs‐
familie
Probabilistisches
Modell
Verteilungs‐
parameter
Stichprobenstatistiken
‐ Konfidenzintervalle
‐ Statistische Signifikanz
28.04.2009
Methode der Momente
Maximum‐Likelihood‐Methode
6
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.3

Die Werte dreier Stichproben wurden auf das Wahrscheinlichkeitspapier einer Gumbel‐Verteilung aufgetragen (siehe Grafik)
aufgetragen (siehe Grafik). 
Welche Stichprobe(n) kann man als Realisation(en) einer G b lV
Gumbel‐Verteilung betrachten? il
b
h ?
-ln(-ln(ii/(n+1))))
Stichprobe 1
28.04.2009
Stichprobe 2
Stichprobe 3
xi
7
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.3 ‐ Lösung
-ln(-ln(ii/(n+1))))
Stichprobe 1
xi
28.04.2009
8
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Nehmen wir an, dass wir eine bestimmte Verteilungsfunktion Nehmen
wir an dass wir eine bestimmte Verteilungsfunktion
gewählt haben, um die Unsicherheit eines unsicheren Ereignisses zu modellieren. Verteilungsfamilie
f X ( x)
Daten Daten
physikalische Gesetze
Druckfestigkeit Beton
Daten
θ
x
Verteilungsparameter
Nun wird die Wahl der Verteilung geprüft – durch statistische Tests.
28.04.2009
9
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Z i t
Zwei unterschiedliche Fälle werden betrachtet: hi dli h Fäll
d b t ht t
px(x)
Verifizierung von
Verifizierung von
1 Diskreten Verteilungsfunktionen
χ 2‐Test
2 Kontinuierlichen
Kontinuierlichen Verteilungsfunktionen
Verteilungsfunktionen
Kolmogorov‐Smirnov‐Test
x
fx(x)
x
28.04.2009
10
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung Der
2

Die Idee dahinter ist, dass die Differenzen j zwischen der erwarteten und der beobachteten Datenverteilung klein sein sollten, wenn die gewählte Verteilungsfamilie die Stichprobe gut beschreiben kann. 10
j
Beob
bachtungeen
9
8
i
7
beobachtete
Häufigkeiten
6
5
postulierte
Häufigkeiten
4
3
2
1
0
0‐25
28.04.2009
25‐30 30‐35
35‐ 
Druckfestigkeit Beton (MPa)
11
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung Der
2

Wie wir bereits wissen, ist eine diskrete kumulative Wahrscheinlichkeitsverteilungsfunktion wie folgt gegeben: P(xi ) 
Wahrscheinlichkeitsdichtefunktion
i1
 p(x )
j 1
j
Kumulative Wahrscheinlichkeitsverteilungsfunktion
PX (x)
pX (x)
B
A
1
x
28.04.2009
x
12
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung Der
2

Es sei die Anzahl Beobachtungen einer diskreten Zufallsvariable .
n
X j Die X j  xj
Anzahl an Beobachtungen von ist , eine binomial
verteilte Nj
Zufallsvariable:
E  X j   np( x j )  N p, j
Postulierte Häufigkeiten
Var  X j   np( x j )(1  p( x j ))  N p, j (1  p( x j ))
28.04.2009
13
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung Der
2

Es sei die Anzahl Beobachtungen einer diskreten Zufallsvariable .
n
X j Die X j  xj
Anzahl an Beobachtungen von ist , eine binomial
verteilte Nj
Zufallsvariable:
E  X j   np( x j )  N p, j
Postulierte Häufigkeiten
Var  X j   np( x j )(1  p( x j ))  N p, j (1  p( x j ))

Wenn das postulierte Modell korrekt und n gross genug ist, dann ist gemäss dem zentralen Grenzwertsatz die Differenz ε j standard‐
gemäss dem zentralen Grenzwertsatz die Differenz standard
normalverteilt.
Beobachtete Häufigkeiten
j 
28.04.2009
No, j  N p, j
N p, j (1  p( x j ))
14
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
 Werden die quadrierten Differenzen der beobachteten und erwarteten q
Häufigkeiten summiert, dann erhalten wir: k
    
2
j 1
2
j
j 1
3
(No, j  N p, j )2
N p, j (1  p(x j ))
2
1
χ 2 verteilt mit k‐1 Freiheitsgraden
10
Anzahl an Beobachtun
ngen
k
9
8
k
( N o ,i  N p ,i ) 2
i 1
N p ,i
m  
2
7
4
beobachtete
Häufigkeiten
6
5
4
postulierte
Häufigkeiten
3
2
1
0
0
1
2
3
Anzahl Unfälle pro Monat
28.04.2009
15
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2

Es wird nun auf einem Signifikanzniveau s
d u au e e S g
a
eau  getestet,
getestet, ob die Summe aller ob d e Su
ea e
beobachteten quadrierten Differenzen plausibel ist. Dafür wird die Nullhypothese H0 aufgestellt, die besagt, dass die gewählte Verteilungsfunktion die beobachtete Stichprobe repräsentiert
Verteilungsfunktion die beobachtete Stichprobe repräsentiert. Die Vorgehensregel lautet dann:
P( m2  )  
Die Alternativhypothese H
l
h
h
f
l
h
d
1 ist weit weniger informativ, weil mit ihr ausser der postulierten Verteilung alle anderen Verteilungen akzeptiert werden.

der Verteilung mit Freiheitsgraden.

 ist der Fraktilwert
v  k 1
2
28.04.2009
16
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2

Wir betrachten folgendes Beispiel: g
p
Als Verteilungsfunktion für 20 Beobachtungen der Betondruckfestigkeit nehmen wir die Normalverteilung an. Der Mittelwert beträgt Die Standardabweichung
Die Standardabweichung 33 MPa.
5 MPa
5 MPa.
Die Parameter werden nicht aus den vorhandenen Beobachtungen geschätzt. Die Normalverteilung ist eine kontinuierliche Verteilung. l
l
k
l h
l
Sie kann jedoch ganz einfach diskretisiert werden.
28.04.2009
17
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wah
hrscheinlichkeittsdichte
Gewählte Verteilungsfunktion
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
50
60
Druckfestigkeit Beton (MPa)
28.04.2009
18
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wah
hrscheinlichkeittsdichte
Gewählte Verteilungsfunktion
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
50
60
Druckfestigkeit Beton (MPa)
Intervall 0‐25:    33 
 25  33
20 (
)  (
)  20 0.055  1.10
5
5


Totale Anzahl an Versuchen
28.04.2009
19
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Erwartetes Histogramm
Erwartetes Histogramm
0.09
0.08
0.07
An
nzahl Beobachttungen
Wah
hrscheinlichkeittsdichte
Gewählte Verteilungsfunktion
0.06
0.05
0.04
0.03
0.02
0.01
0
0
10
20
30
40
Druckfestigkeit Beton (MPa)
Intervall 0‐25: 50
60
9
8
7
6
5
4
3
2
1
0
0‐25
25‐30
30‐35
35‐∞
Druckfestigkeit Beton (MPa)    33 
 25  33
20 (
)  (
)  20 0.055  1.10
5
5


Totale Anzahl an Versuchen
28.04.2009
20
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
Die beobachteten und erwarteten Histogramme
g
können nun verglichen werden. 
Anzahl an Beobachtun
ngen
10
9
8
7
6
beobachtete
Häufigkeiten
5
4
3
postulierte
Häufigkeiten
2
1
0
0‐25
25‐30 30‐35
35‐ 
Druckfestigkeit Beton (MPa)
28.04.2009
21
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
Die beobachteten und erwarteten Histogramme
g
können nun verglichen werden. 
10
10
9
9
8
7
6
beobachtete
Häufigkeiten
5
4
3
postulierte
Häufigkeiten
2
1
Anzahl an Beobachtun
ngen
Anzahl an Beobachtun
ngen
Aufgrund der kleinen Anzahl an Stichproben werden die zwei unteren Intervalle zusammengeführt
zusammengeführt. 8
7
6
5
4
3
2
1
0
0
0‐25
25‐30 30‐35
35‐ 
Druckfestigkeit Beton (MPa)
28.04.2009
0‐30
30‐35
35‐ 
Druckfestigkeit Beton (MPa)
22
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2
beobachtete Häufigkeiten N o , j
vorausgesagte Wahrscheinlichkeiten p ( x j )
( N o, j  N p , j ) 2
j 1
N p, j
 m2  
Berechnungen zum genannten Beispiel
Intervall x j
[MPa]
k
postulierte Häufigkeiten N p , j
Stichproben‐
Statistik
0 30
0‐30
5
0 2967
0.2967
5 9334
5.9334
0 1468
0.1468
30‐35
9
0.3812
7.6544
0.2365
35‐ 
35
6
0.3446
6.4122
0.0265
Summe:
0.40987
χ2
Auf einem Signifikanzniveau von 5% erhalten wir für die ‐Verteilung Mit N=3‐1=2 Freiheitsgraden aus der Tabelle: = 5.99.

Da 0.40987 kleiner ist als 5.99, kann die Nullhypothese H0 nicht verworfen werden.
28.04.2009
23
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2

Wird einer oder mehrere Parameter der gewählten Verteilung aus dem g
g
gleichen Datensatz bestimmt, welcher auch für den Test verwendet wurde, dann muss die Anzahl der Freiheitsgrade entsprechend reduziert werden: v  k 1  j
Unter der Annahme, dass
,
die Varianz aus den Daten bestimmt wurde, aber
,
nicht der Mittelwert, erhalten wir n= 3-1-1=1 Freiheitsgrade.
28.04.2009
24
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2

Wenn wir eine Normalverteilung annehmen mit den Parametern
 = 33.00 und 33 00 d  = 4.05, erhalten wir folgendes Ergebnis:
4 05 h lt
i f l d E b i
Intervall x j
[MPa]
beobachtete Häufigkeiten N o, j
vorausgesagte Wahrscheinlichkeiten p( x j )
postulierte Häufigkeiten N p , j
Stichproben‐
Statistik
0‐30
5
0.2743
5.4851
0.0429
30‐35
9
0.3812
7.6234
0.2486
35‐
6
0.3446
6.8916
0.1153
Summe:
0.4068
28.04.2009
25
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
χ Test für die Güte der Anpassung
Der ‐Test für die Güte der Anpassung
Der
2

Wenn wir eine Normalverteilung annehmen mit den Parametern
 = 33.00 und 33 00 d  = 4.05, erhalten wir folgendes Ergebnis:
4 05 h lt
i f l d E b i
Intervall x j
[MPa]
beobachtete Häufigkeiten N o, j
vorausgesagte Wahrscheinlichkeiten p( x j )
postulierte Häufigkeiten N p , j
Stichproben‐
Statistik
0‐30
5
0.2743
5.4851
0.0429
30‐35
9
0.3812
7.6234
0.2486
35‐
6
0.3446
6.8916
0.1153
Summe:
0.40683
2
χ
Auf einem Signifikanzniveau von 5% erhalten wir für die ‐Verteilung mit N=3‐1‐1=1 Freiheitsgraden aus der Tabelle: = 3.84.
N
h
d
d
b ll 
Da 0.406829 kleiner ist als 3.84, kann die Nullhypothese H0 nicht verworfen werden.
28.04.2009
26
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.2

Welche Methode zur Schätzung der Verteilungsparameter ist g
gp
in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Methode der Momente
Methode der Momente
Maximum‐Likelihood‐Methode
keine der beiden genannten Methoden
28.04.2009
27
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.2 – Lösung 
Welche Methode zur Schätzung der Verteilungsparameter ist g
gp
in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Maximum‐Likelihood‐Methode
28.04.2009
28
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov Smirnov Test für die Güte der Anpassung
Der Kolmogorov‐Smirnov‐Test
für die Güte der Anpassung

Die Idee hinter dem Kolmogorov‐Smirnov‐Test ist folgende:
Wenn die kumulative Wahrscheinlichkeitsverteilungsfunktion der gewählten V t il
Verteilung für die Beobachtungen in Betracht kommt, dann sollte die maximale fü di B b ht
i B t ht k
t d
llt di
i l
Differenz zwischen der beobachteten und der postulierten kumulativen Wahrscheinlichkeitsverteilungsfunktion klein sein.
 max
 max   n ,
28.04.2009
29
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov Smirnov Test für die Güte der Anpassung
Der Kolmogorov‐Smirnov‐Test
für die Güte der Anpassung

Die kumulative Wahrscheinlichkeitsverteilungsfunktion der Beobachtungen kann berechnet werden als:
kann berechnet werden als: Fo ( xˆio ) =
i
n
Folgende Stichprobenstatistik wird benutzt:
i

 max  max  Fo  xˆ   Fp  xˆ    max   Fp  xˆio  
n
i 1
28.04.2009

o
i
o
i
n

i 1
n

30
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov Smirnov Test für die Güte der Anpassung
Der Kolmogorov‐Smirnov‐Test
für die Güte der Anpassung

Die Kolmogorov‐Smirnov‐Stichprobenstatistik wird folgendermassen ermittelt:
i
-1(Fx(x))
Fx(x)
( )
0.98
2
1.5
0.84
1
0.5
0.50
0
-0.5
0.15
-1
-1.5
0.02
-2
20
25
30
35
x
28.04.2009
40
45
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
xi
24.4
27.6
27 8
27.8
27.9
28.5
30.1
30.3
31 7
31.7
32.2
32.8
33.3
33.5
34 1
34.1
34.6
35.8
35.9
36.8
37 1
37.1
39.2
39.7
Fxo(xi)
0.05
0.1
0 15
0.15
0.2
0.25
0.3
0.35
04
0.4
0.45
0.5
0.55
0.6
0 65
0.65
0.7
0.75
0.8
0.85
09
0.9
0.95
1
Fxp(xi)
0.042716
0.140071
0 14917
0.14917
0.153864
0.18406
0.280957
0.294598
0 397432
0.397432
0.436441
0.484047
0.523922
0.539828
0 587064
0.587064
0.625516
0.71226
0.719043
0.776373
0 793892
0.793892
0.892512
0.909877
i
0.007284
0.040071
0 00083
0.00083
0.046136
0.06594
0.019043
0.055402
0 002568
0.002568
0.013559
0.015953
0.026078
0.060172
0 062936
0.062936
0.074484
0.03774
0.080957
0.073627
0 106108
0.106108
0.057488
0.090123
31
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Der Kolmogorov Smirnov Test für die Güte der Anpassung
Der Kolmogorov‐Smirnov‐Test
für die Güte der Anpassung

Die Kolmogorov‐Smirnov‐Statistik ist tabelliert:
n


1
5
10
15
20
25
30
40
50
60
70
80
0.01
0.05
0.1
02
0.2
0.9950
0.9750
0.9500
0 9000
0.9000
0.6686
0.5633
0.5095
0 4470
0.4470
0.4889
0.4093
0.3687
0 3226
0.3226
0.4042
0.3376
0.3040
0 2659
0.2659
0.3524
0.2941
0.2647
0 2315
0.2315
0.3166
0.2640
0.2377
0 2079
0.2079
0.2899
0.2417
0.2176
0 1903
0.1903
0.2521
0.2101
0.1891
0 1654
0.1654
0.2260
0.1884
0.1696
0 1484
0.1484
0.2067
0.1723
0.1551
0 1357
0.1357
0.1917
0.1598
0.1438
0 1258
0.1258
0.1795
0.1496
0.1347
0 1179
0.1179
Für n
Für
n = 20 und = 20 und  = 5% erhalten wir 0.2941, im Vergleich zur beobachteten = 5% erhalten wir 0 2941 im Vergleich zur beobachteten
Statistik von 0.1061 – die Nullhypothese H0 kann nicht verworfen werden auf einem Signifikanzniveau von 5%. 28.04.2009
32
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.3

Welcher Schritt ist für die Berechnung der Fisher‐
g
Informationsmatrix wesentlich? erste partielle Ableitung der logarithmierten i ll Abl i
d l
ih i
Likelihood‐Funktion
erste partielle Ableitung der logarithmierten Verteilungsfunktion
logarithmierten Verteilungsfunktion
zweite partielle Ableitung der p
g
logarithmierten Likelihood‐Funktion
28.04.2009
33
Statistik und Wahrscheinlichkeitsrechnung
Kleine Denkaufgabe 11.3 – Lösung 
Welcher Schritt ist für die Berechnung der Fisher‐
g
Informationsmatrix notwendig? zweite partielle Ableitung der p
g
logarithmierten Likelihood‐Funktion
28.04.2009
34
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich

Modellverifizierung durch statistische Tests kann genutzt werden, um die g
g
,
Plausibilität eines bestimmten Modells in Bezug auf einen bestimmten Datensatz zu quantifizieren. Zwei Fälle müssen in Betracht gezogen werden: 1.
2.
EEs kann gezeigt werden, dass die Hypothese akzeptiert werden kann.
k
i
d
d di H
h
k
i
d k
Es kann gezeigt werden, dass die Hypothese verworfen werden muss.
Welche Information ist in diesen beiden Fällen enthalten?
28.04.2009
35
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich

Wenn ein Signifikanztest zeigt, dass eine Hypothese akzeptiert werden kann: g
g,
yp
p
Wir müssen uns daran erinnern, dass auch andere Modelle (Verteilungen) in Frage kommen tatsächlich ist es oft der Fall dass mehrere Modelle den Signifikanztest
kommen… tatsächlich ist es oft der Fall, dass mehrere Modelle den Signifikanztest „bestehen“!

W
Wenn ein Signifikanztest zeigt, dass eine Hypothese verworfen werden muss: i Si ifik
i d
i H
h
f
d
Dies heisst nicht unbedingt, dass das gewählte Modell schlecht ist – es könnte bedeuten, dass der Beweis einfach nicht stark genug ist, um die entsprechende Signifikanz zu zeigen – zu wenig Daten! 28.04.2009
36
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich
d ll
l h

Wenn zwei Modellhypothesen akzeptiert werden können, d.h. beide Wenn
zwei Modellhypothesen akzeptiert werden können d h beide
Modelle plausibel sind, dann können wir die Güte der Anpassung der zwei Modelle testen: 1.
Direkter Vergleich der Stichprobenstatistik – kann nicht beweiskräftig sein, u.a. aufgrund unterschiedlicher Freiheitsgrade.
,
g
g
2.
Vergleich der Stichproben‐Likelihood.
28.04.2009
37
Statistik und Wahrscheinlichkeitsrechnung
Modellevaluation durch Statistische Tests
Modellvergleich d ll
l h

Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen:
Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen: Modell 1: N(33;5)
M d ll 2 N(33 4 05)
Modell 2: N(33;4.05)
28.04.2009
Parameter nicht aus den gleichen Daten geschätzt
n 23 1 2
n=3‐1=2
χ ‐Stichprobenstatistik = 0.40987
Stichprobenwahrscheinlichkeit = 0.8151
Parameter aus den gleichen Daten geschätzt
n=3
n=3‐1‐1=1
1 1=1
2
χ ‐Stichprobenstatistik = 0.40683
Stichprobenwahrscheinlichkeit = 0.5236
38
Statistik und Wahrscheinlichkeitsrechnung
Zusammenfassung

Die Wahl eines geeigneten probabilistischen Modells kann durch Signifikanztests unterstützt werden. 
χ 2‐Test
Der Der
Test wurde für diskrete Verteilungen entwickelt.
wurde für diskrete Verteilungen entwickelt.

Der Kolmogorov‐Smirnov Test wurde für kontinuierliche Verteilungen entwickelt
entwickelt. 
Die Güte der Anpassung verschiedener Modellalternativen kann durch den Vergleich verschiedenen Stichproben‐Likelihoods geprüft werden. 28.04.2009
39
Statistik und Wahrscheinlichkeitsrechnung
Vielen Dank für die Aufmerksamkeit
Vielen Dank für die Aufmerksamkeit.
28.04.2009
40
Herunterladen