STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005 1 Theorie • Schätzen – Punktschätzer – Intervallschätzer – Eigenschaften • Testen – – – – Einführung Hypothesen Fehlentscheidungen Spezielle Tests 2 Schätzverfahren • Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) • Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) • Unterscheidung: – Punktschätzer (einziger Schätzwert) – Intervallschätzer (Konfidenzintervall) 3 Schätzverfahren • Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. – Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μ durch das arithm. Mittel der Stichprobe x • Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein. 4 Schätzverfahren • Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). • Irrtumswahrscheinlichkeit ≤ α • Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall) 5 Schätzverfahren • Ges: Konfidenzintervall für das arithm. 2 Mittel: ZV X~N(μ,σ ) • Symmetrische Wahrscheinlichkeitsintervall X-μ W(z α n z α ) 1- α 1 σ 2 2 • Symmetrie: z(α /2) = –z(1-α/2) daher: z = –z(1-α/2) und –z = z(α /2) und W(μ zσ X X μ zσ X ) 1 α 6 Schätzverfahren • In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. • Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. – Varianz σ² der Grundgesamtheit bekannt – Varianz σ² der Grundgesamtheit unbekannt 7 Schätzverfahren • Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: x zσ X μ x zσ X Konkreter Stichprobenmittelwert x 8 Schätzverfahren • Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: • Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. • Zufallsvariable: X μ T S n T ist t- verteilt mit v=n-1 Freiheitsgraden 9 Verteilungen • Es gilt: – Ist T der Quotient einer Standardnormalverteilung und der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden. • Zufallsvariable: T= X0 1 n 2 Xi n i=1 T ist t- verteilt mit v=n Freiheitsgraden T~tn • t-Verteilung ist symmetrisch 10 Verteilungen • t- Verteilung mit v Freiheitsgraden: – Erwartungswert (für n>1): E(T) = 0 – Varianz (für n>2): Var(T) = n / (n-2) • Für n→∞ geht die t-Verteilung in die N(0,1) über. • Approximation durch N(0,1)-Vt für n ≥ 30 11 Schätzverfahren • Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz: X-μ W(t α t α ) 1- α ;n-1 1- ;n-1 S 2 2 n • Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt. 12 Schätzverfahren • Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz: x tσ̂ X μ x tσ̂ X Konkreter Stichprobenmittelwert x Konkrete Stichprobenvarianz σ̂X 13 Schätzverfahren • Konfidenzintervall für den Anteilswert: • Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP² • Standardisierte ZV: P-θ Z= σP 14 Schätzverfahren • Wahrscheinlichkeitsintervall: P-θ W(z α z α ) 1- α 2 P 1 2 • Konfidenzintervall: p-zσP θ p+zσP • Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer. 15 Schätzverfahren • Konfidenzintervall für die Varianz • ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden • Wahrscheinlichkeitsintervall: 2 (n-1)S 2 2 W(χ α χ α ) 1- α ;n-1 1- ;n-1 σ P 2 2 • Konfidenzintervall: (n-1)S (n-1)S ; 2 χ2 χ α 1- α2 ;n-1 ;n-1 2 2 2 16 Stichprobenumfang • Bisher: – Geg: Stichprobenumfang n, Sicherheitsgrad 1-α – Ges: Konfidenzintervall • Jetzt: – Geg: Konfidenzintervall, Sicherheitsgrad 1-α – Ges: Stichprobenumfang • Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung • Breite des Konfidenzintervalls: 2Δμ 17 Stichprobenumfang • Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen? zσ n 2 (μ) 2 2 18 Eigenschaften von Schätzern Eigenschaften von Schätzfunktionen: • Erwartungstreue • Effizienz • Konsistenz • Suffizienz 19 Eigenschaften von Schätzern • Erwartungstreue • Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt. • Bedingung: E( Θ̂) Θ • Es gilt: E( X) μ E(S ) σ 2 2 20 Eigenschaften von Schätzern • Effizienz: • Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist. • Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind: E( Θ̂) Θ Var( Θ̂) Var( Θ̂ ) Θ̂* beliebige erwartungs treue Schätzfunk tion * 21 Eigenschaften von Schätzern • Konsistenz: • Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt. 22 Eigenschaften von Schätzern • Suffizienz: • Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft. 23 Schätzverfahren • Methode der Kleinsten Quadrat • Maximum Likelihood • Momentenmethode 24 Konfidenzintervall • Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt. 25 Konfidenzintervall • Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall X zσ X ; X zσ X 26 Konfidenzintervall Konfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes) 0,45 Konfidenzintervall 0,4 0,35 Dichte der N(0,1) 0,3 0,25 0,2 1-α = 0,95 0,15 0,1 0,05 α/2 = 0,025 0 -3 -2,5 α/2 = 0,025 -2 x-z(α/2)σ -1,5 -1 -0,5 0 0,5 Stichprobenmittelwert 1 1,5 2 x+z(1-α/2)σ 2,5 27 3 Konfidenzintervall • Bsp. Körpergröße: – – – – Mittelwert =173,42 Standardabweichung = 9,54 N = 73 2-seitiges KI zum Niveau α=0,05 Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96 KI [171,19 ≤ µ ≤ 175,65] KI [171,23 ≤ µ ≤ 175,61] t-Vt N(0,1)-Vt 28 Statistische Tests • Fragen: – Besteht ein Zusammenhang zw. dem Geschlecht und dem Rauchverhalten? – Ist der Ausschussanteil kleiner als 5%? – Ist die mittlere Länge eines Werkstücks, das von zwei verschiedenen Maschinen hergestellt wird, gleich? – Soll ein neues Medikament zugelassen werden? – Stammen Daten aus einer N-Vt Grundgesamtheit? –… 29 Statistische Tests • Deskriptive Analyse der Daten – – – – – Lage- und Streuungsmassen Kontingenztafeln Korrelationsmaße Verteilungsdiagramme … • Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen. 30 Statistische Tests Einführung: • Testen von Hypothesen (Annahmen, Behauptungen) • Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen. • Statistische Testverfahren basieren auf Stichprobentheorie 31 Statistische Tests Einführung: • Ziel: Richtigkeit von Aussagen über die Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines zufälligen Vorgangs. • Daher: Entscheidungen nicht immer richtig • Aber: Beim Vorliegen einiger der möglichen Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt. 32 Statistische Tests: Hypothesen Hypothesen: • Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit • 2 Arten von Hypothesen: – Parameterhypothesen, Überprüfung durch Parametertests – Verteilungshypothesen, Überprüfung durch Verteilungstests 33 Statistische Tests: Hypothesen Formulierung von Hypothesen: • Nullhypothese H0 (Ausgangshypothese) • Alternativhypothese H1 (Gegenhypothese) 34 Statistische Tests: Hypothesen Bsp. • Anteile: – H0: Ausschussanteil = 10% – H1: Ausschussanteil > 10% • Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm – H1: Mittlere Länge eines Werkstücks 5cm • Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich – H1: Gruppe 1 und Gruppe 2 sind ungleich 35 Statistische Tests • Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn • Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht. • Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen? 36 Statistische Tests Mögliche Fehlentscheidungen: • Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt • Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt. 37 Statistische Tests • Fehlentscheidungen Trifft zu Entscheidung H0 H1 H0 Richtige Fehler 2. Art Entscheidung (β -Fehler) H1 Fehler 1. Art Richtige (α-Fehler) Entscheidung 38 Statistische Tests Problem bei Fehlentscheidungen: • Falsche Entscheidung • Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist. 39 Statistische Tests • Signifikanzniveau eines Tests α: – Die Wahrscheinlichkeit eine Fehler 1. Art zu machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird. 40 Statistische Tests • Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt). • Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt). 41 Statistische Tests Fehler 1. Art und Fehler 2. Art N(0,1) N(3,1) 0,45 0,4 0,35 0,3 f(x) 0,25 0,2 0,15 0,1 Fehler 2. Art Fehler 1. Art 0,05 0 -3 -2,5 -2 -1,5 -1 -0,5 0 µ0=0 0,5 1 1,5 x 2 2,5 3 µ1=3 3,5 4 4,5 5 5,5 42 6 Statistische Tests • D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert. • Bei Entscheidung für H1: – H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit Wahrscheinlichkeit ≤ α. • Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt. 43 Statistische Tests • Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man glaubt aber dass es wirkt – Fehler 2. Art: das Medikament wirkt, man glaubt aber dass es unwirksam ist. Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist. 44 Statistische Tests • Arten von Hypothesen: • Einseitige Hypothesen – H0: θ ≤ θ0 gegen H1: θ > θ0 – H0: θ ≥ θ0 gegen H1: θ < θ0 • Zweiseitige Hypothesen – H0: θ = θ0 gegen H1: θ ≠ θ0 • Verteilungshypothesen: – H0: bestimmten Vt. gegen H1: nicht diese Vt. 45 Statistische Tests • Arten von Testproblemen: – Einseitige Testprobleme • Tests für einseitige Hypothesen – Zweiseitige Testprobleme • Tests für zweiseitige Hypothesen – Anpassungstests • Test für Verteilungshypothesen 46 Statistische Tests • Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist. • Test zum Niveau α: – g(θ) ≤ α für alle θ H0 – g(θ) ≥ α für alle θ H1 – Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art. – Funktion 1-g(θ) heißt Operationscharakteristik (OC) 47 Statistische Tests Gütefunktion (einseitiger Test) 1,00 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 g(µ) 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 499 499,5 500 500,5 µ0=500 µ 501 501,5 502 48 Statistische Tests Operationscharaktersitik OC Kurve (einseitiger Test) 1,00 0,95 0,90 0,85 0,80 0,75 Fehler 2.Art = 1-g(µ) 0,70 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 499,5 500 µ0=500 500,5 501 µ 501,5 502 49 Statistische Tests • Trennschärfe eines Tests: – Steilheit der OC Kurve 1-g(θ) – Es gilt: Je größer die Stichprobe umso besser die Trennschärfe. 50 Statistische Tests Operationscharaktersitik OC Kurve (einseitiger Test), unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000) 1,00 0,95 0,90 0,85 0,80 0,75 Fehler 2.Art = 1-g(µ) 0,70 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 499,5 500 µ0=500 500,5 501 µ 501,5 502 51 Statistische Tests • Vorgehensweise bei statistischen Tests (I): – Formulierung von H0 und H1 und Festlegen des Signifikanzniveaus – Festlegung einer geeigneten Prüfgröße und Bestimmung der Testverteilung unter H0. – Bestimmung des kritischen Bereichs – Berechnung der Prüfgröße (=Teststatistik) – Entscheidung und Interpretation 52 Statistische Tests • Vorgehensweise bei statistischen Tests (II): – Formulierung von H0 und H1 und Festlegen des Signifikanzniveaus – Festlegung einer geeigneten Prüfgröße und Bestimmung der Testverteilung unter H0. – Berechnung der Prüfgröße (=Teststatistik) – Bestimmung des p-Wertes der Teststatistik – Entscheidung und Interpretation 53 Statistische Tests • p-Wert – Anstatt den kritischen Bereich bzw. die kritischen Werte zu bestimmen, Berechnung des „p-Wertes“. – p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte. – Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α. – Entscheidung: Lehne H0 ab, wenn p-Wert < α 54 Statistische Tests • Einseitige Tests (I) – H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des kritischen Bereichs bzw. des kritischen Werts (c) – T > c, lehne H0 ab – T ≤ c, lehne H0 nicht ab 55 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 H0 nicht ablehnen 0,4 Kritischer Bereich H0 ablehnen Dichte der Testverteilung 0,35 0,3 0,25 0,2 1-α = 0,95 0,15 0,1 0,05 α = 0,05 0 -3 -2,5 -2 -1,5 -1 -0,5 0 Prüfgröße 0,5 1 1,5 2 2,5 3 Kritischer Wert: c 56 Statistische Tests • Einseitige Tests (II) – H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des p-Wertes – p < α, lehne H0 ab – p ≥ α, lehne H0 nicht ab 57 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 H0 nicht ablehnen 0,4 Kritischer Bereich H0 ablehnen Dichte der Testverteilung 0,35 0,3 0,25 0,2 Prüfgröße=1,64 p-Wert=0,05 1-α = 0,95 0,15 0,1 0,05 α = 0,05 0 -3 -2,5 -2 -1,5 -1 -0,5 0 Prüfgröße 0,5 1 1,5 2 Kritischer Wert: c 2,5 58 3 Statistische Tests • Einseitige Tests (I) – H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des kritischen Bereichs bzw. des kritischen Werts (c) – T < c, lehne H0 ab – T ≥ c, lehne H0 nicht ab 59 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 Kritischer Bereich H0 ablehnen 0,4 H0 nicht ablehnen Dichte der Testverteilung 0,35 0,3 0,25 0,2 1-α = 0,95 0,15 0,1 0,05 α = 0,05 0 -3 -2,5 -2 -1,5 Kritischer Wert: c -1 -0,5 0 0,5 1 1,5 2 2,5 3 Prüfgröße 60 Statistische Tests • Einseitige Tests (II) – H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des p-Wertes – p < α, lehne H0 ab – p ≥ α, lehne H0 nicht ab 61 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 Kritischer Bereich H0 ablehnen 0,4 H0 nicht ablehnen Dichte der Testverteilung 0,35 0,3 0,25 0,2 Prüfgröße=-1,64 p-Wert=0,05 0,15 1-α = 0,95 0,1 0,05 α = 0,05 0 -3 -2,5 -2 -1,5 Kritischer Wert: c -1 -0,5 0 Prüfgröße 0,5 1 1,5 2 2,5 62 3 Statistische Tests • Zweiseitige Tests (I) – H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des kritischen Bereichs bzw. der kritischen Werte (cu und co) – T < cu oder T > co, lehne H0 ab – cu ≤ T ≤ co, lehne H0 nicht ab 63 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 0,4 0,35 Dichte der Testverteilung H0 nicht ablehnen Kritischer Bereich H0 ablehnen Kritischer Bereich H0 ablehnen 0,3 0,25 0,2 1-α = 0,95 0,15 0,1 0,05 α/2 = 0,025 0 -3 -2,5 α/2 = 0,025 -2 -1,5 Kritischer Wert: c u -1 -0,5 0 Prüfgröße 0,5 1 1,5 2 Kritischer Wert: c 2,5 o 64 3 Statistische Tests • Zweiseitige Tests (II) – H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05 – Teststatistik (T) und deren Verteilung unter H0 bestimmen. – Bestimmung des p-Wertes – p < α, lehne H0 ab – p ≥ α, lehne H0 nicht ab 65 Statistische Tests Testverteilung = Stichprobenverteilung der Prüfgröße 0,45 0,4 0,35 Dichte der Testverteilung H0 nicht ablehnen Kritischer Bereich H0 ablehnen Kritischer Bereich H0 ablehnen 0,3 0,25 0,2 0,15 1-α = 0,95 0,1 Prüfgröße= -1,96, +1,96 p-Wert=0,05 0,05 α/2 = 0,025 0 -3 -2,5 α/2 = 0,025 -2 -1,5 Kritischer Wert: c u -1 -0,5 0 Prüfgröße 0,5 1 1,5 2 Kritischer Wert: c 2,5 o 66 3 Statistische Tests • Kritischer Wert: Wert auf der Achse • p-Wert: Fläche unter der Dichte • Entscheidung: – Lehne H0 ab, wenn Prüfgröße im kritischen Bereich – Lehen H0 ab, wenn p-Wert der Prüfgröße < α 67 χ² Unabhängigkeitstest Chi-Quadrat (χ²) Unabhängigkeitstest • Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind. • Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig? 68 χ² Unabhängigkeitstest Chi-Quadrat (χ²) Unabhängigkeitstest • H0: die beiden Merkmale sind voneinander unabhängig. • H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig • Festlegen des Signifikanzniveaus α. 69 χ² Unabhängigkeitstest • Kontingenztafel: – Absolute Häufigkeiten der Merkmalsausprägungen A\B b1 ... bs ∑ a1 h11 … h1s h1. : : : : ar hr1 … hrs hr. ∑ h.1 ... h.s h.. = n 70 χ² Unabhängigkeitstest • Bsp. 4-Felder Tafel: – Absolute Häufigkeiten der Merkmalsausprägungen weiblich männlich Raucher 9 5 14 Nichtraucher 32 27 59 41 32 73 71 χ² Unabhängigkeitstest Prüfgröße und Testverteilung: • Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho). • Wenn H0 gilt, welche Werte würde man erwarten? • Berechung der unter H0 erwarteten absoluten Häufigkeiten. 72 χ² Unabhängigkeitstest • Unter H0 erwartete absoluten Häufigkeiten • Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten • Dann: unter H0 erwartete absoluten Häufigkeiten he = h io h oj n 73 χ² Unabhängigkeitstest • Bsp. Geschlecht - Rauchverhalten h = e o h Geschlecht w m he Geschlecht w m h io h oj n Raucher j 9 5 14 n 32 27 59 41 32 73 n 33,1 25,9 59 41 32 73 Raucher j 7,9 6,1 14 74 χ² Unabhängigkeitstest • Teststatistik χ²: – Abweichung der beobachteten Häufigkeiten von den erwartete Häufigkeiten r s χ = 2 i=1 j=1 h o ij h e 2 ij h ije 75 χ² Unabhängigkeitstest Verteilung der Teststatistik χ²: • χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden 76 χ² Unabhängigkeitstest Kritischer Bereich: • Signifikanzniveau α • Kritischer Wert: α-Quantil der χ²(r-1)·(s-1) Verteilung • Lehne H0 ab, wenn gilt: Wert der Teststatistik > kritischer Wert 77 χ² Unabhängigkeitstest Bsp. Geschlecht – Rauchverhalten: Teststatistik χ² 2 2 χ = 2 i=1 j=1 h o ij h h e ij e 2 ij 0,5 • Verteilung der Teststatistik: χ²1 Chi-Quadrat Verteilung mit einem Freiheitsgrad 78 χ² Unabhängigkeitstest Bsp. Geschlecht – Rauchverhalten: • Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84 • Entscheidung: (I) Teststatistik = 0,5 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab. (II) p-Wert = 0,496 > 0,05. Also: Lehne H0 nicht ab. • Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig. 79 χ² Homogenitätstest Chi-Quadrat (χ²) Homogenitätstest • Betrachte zwei Gruppen bzw. Stichproben. • Teste, ob die Stichproben aus der gleichen Grundgesamtheit stammen. 80 χ² Homogenitätstest Chi-Quadrat (χ²) Homogenitätstest • H0: die beiden Stichproben stammen aus der gleichen Grundgesamtheit. • H1: die beiden Stichproben stammen nicht aus der gleichen Grundgesamtheit. • Festlegen des Signifikanzniveaus α. 81 χ² Homogenitätstest Bsp. Geschlecht – Rauchverhalten • H0: Das Rauchverhalten der beiden Gruppen stimmt überein. • H1: Das Rauchverhalten der beiden Gruppen stimmt nicht überein. 82 χ² Homogenitätstest Prüfgröße und Testverteilung: • Prinzip: Vergleiche die Werte, die man unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho). • Wenn H0 gilt, welche Werte würde man erwarten? • Berechung der unter H0 erwarteten absoluten Häufigkeiten. 83 χ² Homogenitätstest • Unter H0 erwartete absoluten Häufigkeiten he = h io h oj n 84 χ² Homogenitätstest • Teststatistik χ²: – Abweichung beobachteten Häufigkeiten und erwartete Häufigkeiten r s χ = 2 i=1 j=1 h o ij h e 2 ij h ije • Verteilung der Teststatistik χ²: χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden 85 χ² Homogenitätstest Bsp. Geschlecht – Rauchverhalten: • Teststatistik χ² = 0,5 • Verteilung der Teststatistik: χ²1 • Entscheidung: – (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab. • Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen. 86 χ² Tests χ² Unabhängigkeits- und Homogenitätstests: • Teststatistik und Testverteilung sind gleich • Nullhypothese und Interpretation sind verschieden. – Test auf Unabhängigkeit (die Merkmale sind unabhängig voneinander) – Test auf Homogenität (die Stichproben stammen aus der gleichen Grundgesamtheit). 87 χ² Tests χ² Unabhängigkeits- und Homogenitätstests: • Für die Approximation durch die χ²-Vt. sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein. • Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen (siehe Hartung S. 414ff) 88 Anpassungstests Test einer Verteilungshypothese – Nichtparametrische Testverfahren • Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung. • „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird. 89 Anpassungstests χ² Anpassungstest: • H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung. • Vorgehensweise: – Bestimme die unter H0 zu erwartenden Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho. – Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0. 90 Anpassungstests χ² Anpassungstest: • Teststatistik: o e 2 (h h 2 i i ) χ e h i 1 i k k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen) • Testverteilung: χ²v verteilt mit v=n-1 • Es gilt wieder: he sollten 5 sein. 91 Anpassungstests χ² Anpassungstest: • Entscheidung: – Bestimmung des kritischen Bereichs, χ² > kritischer Wert, lehne H0 ab – Bestimmung des p-Wertes, p-Wert < α lehne H0 ab 92 Anpassungstest • Bsp. χ² Anpassungstest: – H0: Augenfarbe ist gleichverteilt – H1: Augenfarbe ist nicht gleichverteilt – α = 0,05 Merkmal 1 2 3 o h 35 22 15 72 e h 24 24 24 72 • Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2 Verteilung) => H0 ablehnen • p-Wert: 0,014 < 0,05 => H0 ablehnen 93 Anpassungstests Kolmogorov-Smirnov- Anpassungstest: • Test zur Beurteilung der Güte der Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung. • H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung. • Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion. 94 Anpassungstests Kolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D): – größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion. • Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen). • Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab. 95