Statistik und Wahrscheinlichkeitsrechnung Statistik und Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 28.04.2009 1 Statistik und Wahrscheinlichkeitsrechnung Inhalt der heutigen Vorlesung Zusammenfassung der letzten Vorlesung Übersicht über Schätzung und Modellbildung Modellevaluation durch statistische Tests ‐ Der 2 –Test für die Güte der Anpassung ‐ Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung ‐ Modellvergleich 28.04.2009 2 Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der letzten Vorlesung Wir betrachteten die Möglichkeit, die Parameter einer g g / Verteilung basierend auf Beobachtungen/Daten abschätzen zu können. Was haben wir gelernt? Die Parameter einer Verteilung können z. B. anhand folgender Die Parameter einer Verteilung können z B anhand folgender Methoden geschätzt werden: – Methode der Momente (MoM) – Maximum‐Likelihood‐Methode Maximum Likelihood Methode (MLM) (MLM) 28.04.2009 3 Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der letzten Vorlesung Methode der Momente (MoM) – Punktschätzung Das Prinzip der MoM Das Prinzip der MoM ist: Wir schätzen die Parameter, indem ist: Wir schätzen die Parameter indem wir die analytisch berechneten Momente mit den p g Stichprobenmomenten gleichsetzen. 1 n m1 xˆi n i1 m2 n 1 xˆi2 n i1 1 x f X (x , )dx 2 x2 f X (x , )dx Dies führt zu Gleichungen, welche gelöst werden müssen, Dies führt zu k Gleichungen welche gelöst werden müssen um k Parameter abzuschätzen. 28.04.2009 4 Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung der letzten Vorlesung Maximum‐Likelihood‐Methode (MLM) – Schätzung der Parameter und ihrer Verteilung Die Parameter werden geschätzt, indem die Likelihood, dass die Parameter die Beobachtungen/Daten repräsentieren, g / p , maximiert wird. n L(θ xˆ ) f X ( xˆi θ) i 1 n l (θ xˆ ) = å log( f X ( xˆi θ)) μ (1 , 2 ,.., n )T C H1 i=1 m in ( l ( θ xˆ )) θ 28.04.2009 Hij == ¶2l(θ xˆ ) ¶θi¶θ j θ=θ* 5 Statistik und Wahrscheinlichkeitsrechnung Übersicht Schätzung und Modellbildung Unterschiedliche Typen an Information werden genutzt, um Unterschiedliche Typen an Information werden genutzt um Ingenieurmodelle zu entwickeln. – Subjektive Information Subjektive Information – Frequentistische Information Subjektiv ‐ Physikalisches Verständnis ‐ Erfahrung ‐ Urteil Frequentistisch ‐ Daten Wahrscheinlichkeitspapier Verteilungs‐ familie Probabilistisches Modell Verteilungs‐ parameter Stichprobenstatistiken ‐ Konfidenzintervalle ‐ Statistische Signifikanz 28.04.2009 Methode der Momente Maximum‐Likelihood‐Methode 6 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.3 Die Werte dreier Stichproben wurden auf das Wahrscheinlichkeitspapier einer Gumbel‐Verteilung aufgetragen (siehe Grafik) aufgetragen (siehe Grafik). Welche Stichprobe(n) kann man als Realisation(en) einer G b lV Gumbel‐Verteilung betrachten? il b h ? -ln(-ln(ii/(n+1)))) Stichprobe 1 28.04.2009 Stichprobe 2 Stichprobe 3 xi 7 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.3 ‐ Lösung -ln(-ln(ii/(n+1)))) Stichprobe 1 xi 28.04.2009 8 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Nehmen wir an, dass wir eine bestimmte Verteilungsfunktion Nehmen wir an dass wir eine bestimmte Verteilungsfunktion gewählt haben, um die Unsicherheit eines unsicheren Ereignisses zu modellieren. Verteilungsfamilie f X ( x) Daten Daten physikalische Gesetze Druckfestigkeit Beton Daten θ x Verteilungsparameter Nun wird die Wahl der Verteilung geprüft – durch statistische Tests. 28.04.2009 9 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Z i t Zwei unterschiedliche Fälle werden betrachtet: hi dli h Fäll d b t ht t px(x) Verifizierung von Verifizierung von 1 Diskreten Verteilungsfunktionen χ 2‐Test 2 Kontinuierlichen Kontinuierlichen Verteilungsfunktionen Verteilungsfunktionen Kolmogorov‐Smirnov‐Test x fx(x) x 28.04.2009 10 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die Idee dahinter ist, dass die Differenzen j zwischen der erwarteten und der beobachteten Datenverteilung klein sein sollten, wenn die gewählte Verteilungsfamilie die Stichprobe gut beschreiben kann. 10 j Beob bachtungeen 9 8 i 7 beobachtete Häufigkeiten 6 5 postulierte Häufigkeiten 4 3 2 1 0 0‐25 28.04.2009 25‐30 30‐35 35‐ Druckfestigkeit Beton (MPa) 11 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Wie wir bereits wissen, ist eine diskrete kumulative Wahrscheinlichkeitsverteilungsfunktion wie folgt gegeben: P(xi ) Wahrscheinlichkeitsdichtefunktion i1 p(x ) j 1 j Kumulative Wahrscheinlichkeitsverteilungsfunktion PX (x) pX (x) B A 1 x 28.04.2009 x 12 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Es sei die Anzahl Beobachtungen einer diskreten Zufallsvariable . n X j Die X j xj Anzahl an Beobachtungen von ist , eine binomial verteilte Nj Zufallsvariable: E X j np( x j ) N p, j Postulierte Häufigkeiten Var X j np( x j )(1 p( x j )) N p, j (1 p( x j )) 28.04.2009 13 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Es sei die Anzahl Beobachtungen einer diskreten Zufallsvariable . n X j Die X j xj Anzahl an Beobachtungen von ist , eine binomial verteilte Nj Zufallsvariable: E X j np( x j ) N p, j Postulierte Häufigkeiten Var X j np( x j )(1 p( x j )) N p, j (1 p( x j )) Wenn das postulierte Modell korrekt und n gross genug ist, dann ist gemäss dem zentralen Grenzwertsatz die Differenz ε j standard‐ gemäss dem zentralen Grenzwertsatz die Differenz standard normalverteilt. Beobachtete Häufigkeiten j 28.04.2009 No, j N p, j N p, j (1 p( x j )) 14 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Werden die quadrierten Differenzen der beobachteten und erwarteten q Häufigkeiten summiert, dann erhalten wir: k 2 j 1 2 j j 1 3 (No, j N p, j )2 N p, j (1 p(x j )) 2 1 χ 2 verteilt mit k‐1 Freiheitsgraden 10 Anzahl an Beobachtun ngen k 9 8 k ( N o ,i N p ,i ) 2 i 1 N p ,i m 2 7 4 beobachtete Häufigkeiten 6 5 4 postulierte Häufigkeiten 3 2 1 0 0 1 2 3 Anzahl Unfälle pro Monat 28.04.2009 15 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Es wird nun auf einem Signifikanzniveau s d u au e e S g a eau getestet, getestet, ob die Summe aller ob d e Su ea e beobachteten quadrierten Differenzen plausibel ist. Dafür wird die Nullhypothese H0 aufgestellt, die besagt, dass die gewählte Verteilungsfunktion die beobachtete Stichprobe repräsentiert Verteilungsfunktion die beobachtete Stichprobe repräsentiert. Die Vorgehensregel lautet dann: P( m2 ) Die Alternativhypothese H l h h f l h d 1 ist weit weniger informativ, weil mit ihr ausser der postulierten Verteilung alle anderen Verteilungen akzeptiert werden. der Verteilung mit Freiheitsgraden. ist der Fraktilwert v k 1 2 28.04.2009 16 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Wir betrachten folgendes Beispiel: g p Als Verteilungsfunktion für 20 Beobachtungen der Betondruckfestigkeit nehmen wir die Normalverteilung an. Der Mittelwert beträgt Die Standardabweichung Die Standardabweichung 33 MPa. 5 MPa 5 MPa. Die Parameter werden nicht aus den vorhandenen Beobachtungen geschätzt. Die Normalverteilung ist eine kontinuierliche Verteilung. l l k l h l Sie kann jedoch ganz einfach diskretisiert werden. 28.04.2009 17 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wah hrscheinlichkeittsdichte Gewählte Verteilungsfunktion 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0 10 20 30 40 50 60 Druckfestigkeit Beton (MPa) 28.04.2009 18 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Wah hrscheinlichkeittsdichte Gewählte Verteilungsfunktion 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 0 10 20 30 40 50 60 Druckfestigkeit Beton (MPa) Intervall 0‐25: 33 25 33 20 ( ) ( ) 20 0.055 1.10 5 5 Totale Anzahl an Versuchen 28.04.2009 19 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die Dichtefunktion der gewählten Verteilungsfunktion wird diskretisiert: Erwartetes Histogramm Erwartetes Histogramm 0.09 0.08 0.07 An nzahl Beobachttungen Wah hrscheinlichkeittsdichte Gewählte Verteilungsfunktion 0.06 0.05 0.04 0.03 0.02 0.01 0 0 10 20 30 40 Druckfestigkeit Beton (MPa) Intervall 0‐25: 50 60 9 8 7 6 5 4 3 2 1 0 0‐25 25‐30 30‐35 35‐∞ Druckfestigkeit Beton (MPa) 33 25 33 20 ( ) ( ) 20 0.055 1.10 5 5 Totale Anzahl an Versuchen 28.04.2009 20 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die beobachteten und erwarteten Histogramme g können nun verglichen werden. Anzahl an Beobachtun ngen 10 9 8 7 6 beobachtete Häufigkeiten 5 4 3 postulierte Häufigkeiten 2 1 0 0‐25 25‐30 30‐35 35‐ Druckfestigkeit Beton (MPa) 28.04.2009 21 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Die beobachteten und erwarteten Histogramme g können nun verglichen werden. 10 10 9 9 8 7 6 beobachtete Häufigkeiten 5 4 3 postulierte Häufigkeiten 2 1 Anzahl an Beobachtun ngen Anzahl an Beobachtun ngen Aufgrund der kleinen Anzahl an Stichproben werden die zwei unteren Intervalle zusammengeführt zusammengeführt. 8 7 6 5 4 3 2 1 0 0 0‐25 25‐30 30‐35 35‐ Druckfestigkeit Beton (MPa) 28.04.2009 0‐30 30‐35 35‐ Druckfestigkeit Beton (MPa) 22 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 beobachtete Häufigkeiten N o , j vorausgesagte Wahrscheinlichkeiten p ( x j ) ( N o, j N p , j ) 2 j 1 N p, j m2 Berechnungen zum genannten Beispiel Intervall x j [MPa] k postulierte Häufigkeiten N p , j Stichproben‐ Statistik 0 30 0‐30 5 0 2967 0.2967 5 9334 5.9334 0 1468 0.1468 30‐35 9 0.3812 7.6544 0.2365 35‐ 35 6 0.3446 6.4122 0.0265 Summe: 0.40987 χ2 Auf einem Signifikanzniveau von 5% erhalten wir für die ‐Verteilung Mit N=3‐1=2 Freiheitsgraden aus der Tabelle: = 5.99. Da 0.40987 kleiner ist als 5.99, kann die Nullhypothese H0 nicht verworfen werden. 28.04.2009 23 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Wird einer oder mehrere Parameter der gewählten Verteilung aus dem g g gleichen Datensatz bestimmt, welcher auch für den Test verwendet wurde, dann muss die Anzahl der Freiheitsgrade entsprechend reduziert werden: v k 1 j Unter der Annahme, dass , die Varianz aus den Daten bestimmt wurde, aber , nicht der Mittelwert, erhalten wir n= 3-1-1=1 Freiheitsgrade. 28.04.2009 24 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Wenn wir eine Normalverteilung annehmen mit den Parametern = 33.00 und 33 00 d = 4.05, erhalten wir folgendes Ergebnis: 4 05 h lt i f l d E b i Intervall x j [MPa] beobachtete Häufigkeiten N o, j vorausgesagte Wahrscheinlichkeiten p( x j ) postulierte Häufigkeiten N p , j Stichproben‐ Statistik 0‐30 5 0.2743 5.4851 0.0429 30‐35 9 0.3812 7.6234 0.2486 35‐ 6 0.3446 6.8916 0.1153 Summe: 0.4068 28.04.2009 25 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests χ Test für die Güte der Anpassung Der ‐Test für die Güte der Anpassung Der 2 Wenn wir eine Normalverteilung annehmen mit den Parametern = 33.00 und 33 00 d = 4.05, erhalten wir folgendes Ergebnis: 4 05 h lt i f l d E b i Intervall x j [MPa] beobachtete Häufigkeiten N o, j vorausgesagte Wahrscheinlichkeiten p( x j ) postulierte Häufigkeiten N p , j Stichproben‐ Statistik 0‐30 5 0.2743 5.4851 0.0429 30‐35 9 0.3812 7.6234 0.2486 35‐ 6 0.3446 6.8916 0.1153 Summe: 0.40683 2 χ Auf einem Signifikanzniveau von 5% erhalten wir für die ‐Verteilung mit N=3‐1‐1=1 Freiheitsgraden aus der Tabelle: = 3.84. N h d d b ll Da 0.406829 kleiner ist als 3.84, kann die Nullhypothese H0 nicht verworfen werden. 28.04.2009 26 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.2 Welche Methode zur Schätzung der Verteilungsparameter ist g gp in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Methode der Momente Methode der Momente Maximum‐Likelihood‐Methode keine der beiden genannten Methoden 28.04.2009 27 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.2 – Lösung Welche Methode zur Schätzung der Verteilungsparameter ist g gp in der Lage, die statistischen Unsicherheiten zu berücksichtigen? Maximum‐Likelihood‐Methode 28.04.2009 28 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Der Kolmogorov Smirnov Test für die Güte der Anpassung Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung Die Idee hinter dem Kolmogorov‐Smirnov‐Test ist folgende: Wenn die kumulative Wahrscheinlichkeitsverteilungsfunktion der gewählten V t il Verteilung für die Beobachtungen in Betracht kommt, dann sollte die maximale fü di B b ht i B t ht k t d llt di i l Differenz zwischen der beobachteten und der postulierten kumulativen Wahrscheinlichkeitsverteilungsfunktion klein sein. max max n , 28.04.2009 29 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Der Kolmogorov Smirnov Test für die Güte der Anpassung Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung Die kumulative Wahrscheinlichkeitsverteilungsfunktion der Beobachtungen kann berechnet werden als: kann berechnet werden als: Fo ( xˆio ) = i n Folgende Stichprobenstatistik wird benutzt: i max max Fo xˆ Fp xˆ max Fp xˆio n i 1 28.04.2009 o i o i n i 1 n 30 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Der Kolmogorov Smirnov Test für die Güte der Anpassung Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung Die Kolmogorov‐Smirnov‐Stichprobenstatistik wird folgendermassen ermittelt: i -1(Fx(x)) Fx(x) ( ) 0.98 2 1.5 0.84 1 0.5 0.50 0 -0.5 0.15 -1 -1.5 0.02 -2 20 25 30 35 x 28.04.2009 40 45 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 xi 24.4 27.6 27 8 27.8 27.9 28.5 30.1 30.3 31 7 31.7 32.2 32.8 33.3 33.5 34 1 34.1 34.6 35.8 35.9 36.8 37 1 37.1 39.2 39.7 Fxo(xi) 0.05 0.1 0 15 0.15 0.2 0.25 0.3 0.35 04 0.4 0.45 0.5 0.55 0.6 0 65 0.65 0.7 0.75 0.8 0.85 09 0.9 0.95 1 Fxp(xi) 0.042716 0.140071 0 14917 0.14917 0.153864 0.18406 0.280957 0.294598 0 397432 0.397432 0.436441 0.484047 0.523922 0.539828 0 587064 0.587064 0.625516 0.71226 0.719043 0.776373 0 793892 0.793892 0.892512 0.909877 i 0.007284 0.040071 0 00083 0.00083 0.046136 0.06594 0.019043 0.055402 0 002568 0.002568 0.013559 0.015953 0.026078 0.060172 0 062936 0.062936 0.074484 0.03774 0.080957 0.073627 0 106108 0.106108 0.057488 0.090123 31 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Der Kolmogorov Smirnov Test für die Güte der Anpassung Der Kolmogorov‐Smirnov‐Test für die Güte der Anpassung Die Kolmogorov‐Smirnov‐Statistik ist tabelliert: n 1 5 10 15 20 25 30 40 50 60 70 80 0.01 0.05 0.1 02 0.2 0.9950 0.9750 0.9500 0 9000 0.9000 0.6686 0.5633 0.5095 0 4470 0.4470 0.4889 0.4093 0.3687 0 3226 0.3226 0.4042 0.3376 0.3040 0 2659 0.2659 0.3524 0.2941 0.2647 0 2315 0.2315 0.3166 0.2640 0.2377 0 2079 0.2079 0.2899 0.2417 0.2176 0 1903 0.1903 0.2521 0.2101 0.1891 0 1654 0.1654 0.2260 0.1884 0.1696 0 1484 0.1484 0.2067 0.1723 0.1551 0 1357 0.1357 0.1917 0.1598 0.1438 0 1258 0.1258 0.1795 0.1496 0.1347 0 1179 0.1179 Für n Für n = 20 und = 20 und = 5% erhalten wir 0.2941, im Vergleich zur beobachteten = 5% erhalten wir 0 2941 im Vergleich zur beobachteten Statistik von 0.1061 – die Nullhypothese H0 kann nicht verworfen werden auf einem Signifikanzniveau von 5%. 28.04.2009 32 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.3 Welcher Schritt ist für die Berechnung der Fisher‐ g Informationsmatrix wesentlich? erste partielle Ableitung der logarithmierten i ll Abl i d l ih i Likelihood‐Funktion erste partielle Ableitung der logarithmierten Verteilungsfunktion logarithmierten Verteilungsfunktion zweite partielle Ableitung der p g logarithmierten Likelihood‐Funktion 28.04.2009 33 Statistik und Wahrscheinlichkeitsrechnung Kleine Denkaufgabe 11.3 – Lösung Welcher Schritt ist für die Berechnung der Fisher‐ g Informationsmatrix notwendig? zweite partielle Ableitung der p g logarithmierten Likelihood‐Funktion 28.04.2009 34 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Modellvergleich Modellverifizierung durch statistische Tests kann genutzt werden, um die g g , Plausibilität eines bestimmten Modells in Bezug auf einen bestimmten Datensatz zu quantifizieren. Zwei Fälle müssen in Betracht gezogen werden: 1. 2. EEs kann gezeigt werden, dass die Hypothese akzeptiert werden kann. k i d d di H h k i d k Es kann gezeigt werden, dass die Hypothese verworfen werden muss. Welche Information ist in diesen beiden Fällen enthalten? 28.04.2009 35 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Modellvergleich Wenn ein Signifikanztest zeigt, dass eine Hypothese akzeptiert werden kann: g g, yp p Wir müssen uns daran erinnern, dass auch andere Modelle (Verteilungen) in Frage kommen tatsächlich ist es oft der Fall dass mehrere Modelle den Signifikanztest kommen… tatsächlich ist es oft der Fall, dass mehrere Modelle den Signifikanztest „bestehen“! W Wenn ein Signifikanztest zeigt, dass eine Hypothese verworfen werden muss: i Si ifik i d i H h f d Dies heisst nicht unbedingt, dass das gewählte Modell schlecht ist – es könnte bedeuten, dass der Beweis einfach nicht stark genug ist, um die entsprechende Signifikanz zu zeigen – zu wenig Daten! 28.04.2009 36 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Modellvergleich d ll l h Wenn zwei Modellhypothesen akzeptiert werden können, d.h. beide Wenn zwei Modellhypothesen akzeptiert werden können d h beide Modelle plausibel sind, dann können wir die Güte der Anpassung der zwei Modelle testen: 1. Direkter Vergleich der Stichprobenstatistik – kann nicht beweiskräftig sein, u.a. aufgrund unterschiedlicher Freiheitsgrade. , g g 2. Vergleich der Stichproben‐Likelihood. 28.04.2009 37 Statistik und Wahrscheinlichkeitsrechnung Modellevaluation durch Statistische Tests Modellvergleich d ll l h Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen: Betrachten wir ein Beispiel mit zwei unterschiedlichen Modellen: Modell 1: N(33;5) M d ll 2 N(33 4 05) Modell 2: N(33;4.05) 28.04.2009 Parameter nicht aus den gleichen Daten geschätzt n 23 1 2 n=3‐1=2 χ ‐Stichprobenstatistik = 0.40987 Stichprobenwahrscheinlichkeit = 0.8151 Parameter aus den gleichen Daten geschätzt n=3 n=3‐1‐1=1 1 1=1 2 χ ‐Stichprobenstatistik = 0.40683 Stichprobenwahrscheinlichkeit = 0.5236 38 Statistik und Wahrscheinlichkeitsrechnung Zusammenfassung Die Wahl eines geeigneten probabilistischen Modells kann durch Signifikanztests unterstützt werden. χ 2‐Test Der Der Test wurde für diskrete Verteilungen entwickelt. wurde für diskrete Verteilungen entwickelt. Der Kolmogorov‐Smirnov Test wurde für kontinuierliche Verteilungen entwickelt entwickelt. Die Güte der Anpassung verschiedener Modellalternativen kann durch den Vergleich verschiedenen Stichproben‐Likelihoods geprüft werden. 28.04.2009 39 Statistik und Wahrscheinlichkeitsrechnung Vielen Dank für die Aufmerksamkeit Vielen Dank für die Aufmerksamkeit. 28.04.2009 40