STATISIK

Werbung
STATISIK
LV Nr.: 1852
WS 2005/06
20. Dezember 2005
1
Theorie
• Schätzen
– Punktschätzer
– Intervallschätzer
– Eigenschaften
• Testen
–
–
–
–
Einführung
Hypothesen
Fehlentscheidungen
Spezielle Tests
2
Schätzverfahren
• Schluss von der Grundgesamtheit auf eine
Stichprobe: Inklusionsschluss (direkter
Schluss)
• Schluss von einer Stichprobe auf Parameter
einer Grundgesamtheit:
Repräsentationsschluss (indirekter Schluss)
• Unterscheidung:
– Punktschätzer (einziger Schätzwert)
– Intervallschätzer (Konfidenzintervall)
3
Schätzverfahren
• Punktschätzer: Für den zu schätzenden Parameter
wird nur ein einziger Schätzwert angegeben.
– Bsp. Schätze das unbekannte arithm. Mittel einer
Grundgesamtheit μ durch das arithm. Mittel der
Stichprobe x
• Vorsicht: Die in einer Stichprobe realisierten
Merkmalsausprägungen sind zufallsabhängig,
Punktschätzer stimmen daher nur in den seltensten
Fällen mit dem wahren Parameter überein.
4
Schätzverfahren
• Intervallschätzer: Ausgehend von einer
Stichprobe wird ein Intervall bestimmt, in
dem der zu schätzende Parameter der
Grundgesamtheit mit einer bestimmten
vorgegebenen Wahrscheinlichkeit liegt
(Konfidenzintervall).
• Irrtumswahrscheinlichkeit ≤ α
• Konfidenzintervall zum Niveau 1-α
(Vertrauensbereich od. Vertrauensintervall)
5
Schätzverfahren
• Ges: Konfidenzintervall für das arithm.
2
Mittel: ZV X~N(μ,σ )
• Symmetrische Wahrscheinlichkeitsintervall
X-μ
W(z α  n
 z α )  1- α
1
σ
2
2
• Symmetrie: z(α /2) = –z(1-α/2)
daher: z = –z(1-α/2) und –z = z(α /2) und
W(μ  zσ X  X  μ  zσ X )  1  α
6
Schätzverfahren
• In diesem Wahrscheinlichkeitsintervall liegt
das arithm. Mittel mit der
Wahrscheinlichkeit 1- α.
• Gesucht ist ist aber nicht das Ws-Intervall
der ZV, sondern das Konfidenzintervall für
das unbekannte arithm. Mittel µ der
Grundgesamtheit.
– Varianz σ² der Grundgesamtheit bekannt
– Varianz σ² der Grundgesamtheit unbekannt
7
Schätzverfahren
• Konfidenzintervall für µ bei bekannter
Varianz σ² der Grundgesamtheit:
x  zσ X  μ  x  zσ X 
Konkreter Stichprobenmittelwert
x
8
Schätzverfahren
• Konfidenzintervall für µ bei unbekannter
Varianz σ² der Grundgesamtheit:
• Statt der unbekannte Varianz σ² wird die
Stichprobenvarianz S² verwendet.
• Zufallsvariable:
X μ
T
S
n
T ist t- verteilt mit v=n-1 Freiheitsgraden
9
Verteilungen
• Es gilt:
– Ist T der Quotient einer Standardnormalverteilung und
der Quadratwurzel des Mittelwerts von n quadrierten
unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T
einer t-Verteilung mit v=n Freiheitsgraden.
• Zufallsvariable:
T=
X0
1 n 2
Xi

n i=1
T ist t- verteilt mit v=n Freiheitsgraden T~tn
• t-Verteilung ist symmetrisch
10
Verteilungen
• t- Verteilung mit v Freiheitsgraden:
– Erwartungswert (für n>1):
E(T) = 0
– Varianz (für n>2):
Var(T) = n / (n-2)
• Für n→∞ geht die t-Verteilung in die N(0,1)
über.
• Approximation durch N(0,1)-Vt für n ≥ 30
11
Schätzverfahren
• Wahrscheinlichkeitsintervall für das arithm.
Mittel bei unbekannter Varianz:
X-μ
W(t α 
 t α )  1- α
;n-1
1- ;n-1
S
2
2
n
• Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte
sind, bei denen die Verteilungsfunktion der
t- Verteilung mit n-1 Freiheitsgraden die
Werte 1-α/2 bzw. α/2 besitzt.
12
Schätzverfahren
• Konfidenzintervall für das arithm. Mittel
bei unbekannter Varianz:
x  tσ̂ X  μ  x  tσ̂ X 
Konkreter Stichprobenmittelwert x
Konkrete Stichprobenvarianz σ̂X
13
Schätzverfahren
• Konfidenzintervall für den Anteilswert:
• Ann. genügend großer Stichprobenumfang,
d.h. Approximation durch N-Vt möglich,
E(P) = θ und Var(P) = σP²
• Standardisierte ZV:
P-θ
Z=
σP
14
Schätzverfahren
• Wahrscheinlichkeitsintervall:
P-θ
W(z α 
 z α )  1- α
2
P
1
2
• Konfidenzintervall:
p-zσP  θ  p+zσP 
• Ist σP unbekannt, verwendet man stattdessen
die Stichprobenvarianz des Anteilswertes
als Schätzer.
15
Schätzverfahren
• Konfidenzintervall für die Varianz
• ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1
Freiheitsgraden
• Wahrscheinlichkeitsintervall:
2
(n-1)S
2
2
W(χ α 
 χ α )  1- α
;n-1
1- ;n-1
σ
P
2
2
• Konfidenzintervall: 

 (n-1)S (n-1)S 
; 2
 χ2

χ
α
 1- α2 ;n-1
;n-1 
2

2
2
16
Stichprobenumfang
• Bisher:
– Geg: Stichprobenumfang n, Sicherheitsgrad 1-α
– Ges: Konfidenzintervall
• Jetzt:
– Geg: Konfidenzintervall, Sicherheitsgrad 1-α
– Ges: Stichprobenumfang
• Absoluter Fehler Δμ = zσX ist ein Maß für
die Genauigkeit der Schätzung
• Breite des Konfidenzintervalls: 2Δμ
17
Stichprobenumfang
• Frage: Welchen Stichprobenumfang
benötigt man, um einen Parameter (arithm.
Mittel) bei vorgegebener Genauigkeit und
vorgegebenem Sicherheitsgrad zu schätzen?
zσ
n
2
(μ)
2
2
18
Eigenschaften von Schätzern
Eigenschaften von Schätzfunktionen:
• Erwartungstreue
• Effizienz
• Konsistenz
• Suffizienz
19
Eigenschaften von Schätzern
• Erwartungstreue
• Eine Schätzfunktion heißt erwartungstreu
(unverzerrt, unbiased), wenn ihr
Erwartungswert mit dem wahren Parameter
übereinstimmt.
• Bedingung: E( Θ̂)  Θ
• Es gilt:
E( X)  μ
E(S )  σ
2
2
20
Eigenschaften von Schätzern
• Effizienz:
• Von 2 erwartungstreuen Schätzfunktionen
gilt jene als effizienter (wirksamer), die die
kleinere Varianz aufweist.
• Eine Schätzfunktion heißt effizient, wenn
folgende Bedingungen erfüllt sind:
E( Θ̂)  Θ
Var( Θ̂)  Var( Θ̂ )
Θ̂* beliebige erwartungs treue Schätzfunk tion
*
21
Eigenschaften von Schätzern
• Konsistenz:
• Eine Schätzfunktion heißt konsistent, wenn
der Schätzwert bei laufender Vergrößerung
des Stichprobenumfangs (n→∞ oder n→N)
mit dem zu schätzenden Parameter
zusammenfällt.
22
Eigenschaften von Schätzern
• Suffizienz:
• Eine Schätzfunktion heißt suffizient
(erschöpfend), wenn sie sämtliche
Informationen über den zu schätzenden
Parameter, welche die Stichprobe enthält
ausschöpft.
23
Schätzverfahren
• Methode der Kleinsten Quadrat
• Maximum Likelihood
• Momentenmethode
24
Konfidenzintervall
• Ausgehend von dem Ergebnis einer
Stichprobe wird ein Intervall angegeben, in
dem der zu schätzende Parameter der
Grundgesamtheit mit einer bestimmten
vorgegebenen Wahrscheinlichkeit (1-α)
liegt.
25
Konfidenzintervall
• Bsp. Arithmetisches Mittel (ist bei N-Vt.
Grundgesamtheit bzw. bei genügend
großem Stichprobenumfang N-Vt.). Der
wahre Parameter µ liegt mit der
Wahrscheinlichkeit (1-α) im Intervall
X  zσ
X
; X  zσ X 
26
Konfidenzintervall
Konfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)
0,45
Konfidenzintervall
0,4
0,35
Dichte der N(0,1)
0,3
0,25
0,2
1-α = 0,95
0,15
0,1
0,05
α/2 = 0,025
0
-3
-2,5
α/2 = 0,025
-2
x-z(α/2)σ
-1,5
-1
-0,5
0
0,5
Stichprobenmittelwert
1
1,5
2
x+z(1-α/2)σ
2,5
27
3
Konfidenzintervall
• Bsp. Körpergröße:
–
–
–
–
Mittelwert =173,42
Standardabweichung = 9,54
N = 73
2-seitiges KI zum Niveau α=0,05
Wahrscheinlichkeit, dass der wahre Parameter
im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99
Quantil der N(0,1)-Vt: z=±1,96
KI [171,19 ≤ µ ≤ 175,65]
KI [171,23 ≤ µ ≤ 175,61]
t-Vt
N(0,1)-Vt
28
Statistische Tests
• Fragen:
– Besteht ein Zusammenhang zw. dem
Geschlecht und dem Rauchverhalten?
– Ist der Ausschussanteil kleiner als 5%?
– Ist die mittlere Länge eines Werkstücks, das
von zwei verschiedenen Maschinen hergestellt
wird, gleich?
– Soll ein neues Medikament zugelassen werden?
– Stammen Daten aus einer N-Vt
Grundgesamtheit?
–…
29
Statistische Tests
• Deskriptive Analyse der Daten
–
–
–
–
–
Lage- und Streuungsmassen
Kontingenztafeln
Korrelationsmaße
Verteilungsdiagramme
…
• Statistischer Test, um eine theoretisch
abgesicherte Entscheidung zu treffen.
30
Statistische Tests
Einführung:
• Testen von Hypothesen (Annahmen,
Behauptungen)
• Statistischer Test: Verfahren, mit dessen
Hilfe sich bestimmte Hypothesen auf ihre
Richtigkeit hin überprüfen lassen.
• Statistische Testverfahren basieren auf
Stichprobentheorie
31
Statistische Tests
Einführung:
• Ziel: Richtigkeit von Aussagen über die Verteilung
einer Zufallsvariablen überprüfen.
• Entscheidungsgrundlage: Ergebnis eines
zufälligen Vorgangs.
• Daher: Entscheidungen nicht immer richtig
• Aber: Beim Vorliegen einiger der möglichen
Verteilungen ist die Wahrscheinlichkeit falsch zu
entscheiden beschränkt.
32
Statistische Tests: Hypothesen
Hypothesen:
• Annahmen, Behauptungen, Aussagen über
unbekannte Grundgesamtheit
• 2 Arten von Hypothesen:
– Parameterhypothesen, Überprüfung durch
Parametertests
– Verteilungshypothesen, Überprüfung durch
Verteilungstests
33
Statistische Tests: Hypothesen
Formulierung von Hypothesen:
• Nullhypothese H0 (Ausgangshypothese)
• Alternativhypothese H1 (Gegenhypothese)
34
Statistische Tests: Hypothesen
Bsp.
• Anteile:
– H0: Ausschussanteil = 10%
– H1: Ausschussanteil > 10%
• Mittelwerte:
– H0: Mittlere Länge eines Werkstücks = 5cm
– H1: Mittlere Länge eines Werkstücks  5cm
• Gruppenvergleich:
– H0: Gruppe 1 und Gruppe 2 sind gleich
– H1: Gruppe 1 und Gruppe 2 sind ungleich
35
Statistische Tests
• Entscheidung für H0 oder H1 basiert auf
einer Stichprobe x1,…,xn
• Wahrscheinlichkeitsaussage ob H0 zutrifft
oder nicht.
• Frage: H0 ablehnen (verwerfen) oder H0
nicht ablehnen?
36
Statistische Tests
Mögliche Fehlentscheidungen:
• Fehler 1. Art (α-Fehler): obwohl H0 korrekt
ist wird H0 abgelehnt
• Fehler 2. Art (β-Fehler): obwohl H0 falsch
ist wird H0 nicht abgelehnt.
37
Statistische Tests
• Fehlentscheidungen
Trifft zu
Entscheidung
H0
H1
H0
Richtige
Fehler 2. Art
Entscheidung (β -Fehler)
H1
Fehler 1. Art
Richtige
(α-Fehler) Entscheidung
38
Statistische Tests
Problem bei Fehlentscheidungen:
• Falsche Entscheidung
• Man weiß nicht, ob man in einer konkreten
Situation einen Fehler macht, sondern nur
welcher Art dieser ist.
39
Statistische Tests
• Signifikanzniveau eines Tests α:
– Die Wahrscheinlichkeit eine Fehler 1. Art zu
machen ist höchstens α, daher „Test zum
Niveau α“ - egal mit welcher
Wahrscheinlichkeit ein Fehler 2. Art begangen
wird.
40
Statistische Tests
• Trifft H0 zu und entscheidet man sich für
H1, dann ist die Wahrscheinlichkeit dabei
einen Fehler zu machen ≤ α (α bekannt,
wird festgelegt).
• Trifft H1 zu und entscheidet man sich für
H0, dann ist die Wahrscheinlichkeit dabei
eine Fehler zu machen = β (β unbekannt).
41
Statistische Tests
Fehler 1. Art und Fehler 2. Art
N(0,1)
N(3,1)
0,45
0,4
0,35
0,3
f(x)
0,25
0,2
0,15
0,1
Fehler
2. Art Fehler
1. Art
0,05
0
-3
-2,5
-2
-1,5
-1
-0,5
0
µ0=0
0,5
1
1,5
x
2
2,5
3
µ1=3
3,5
4
4,5
5
5,5
42
6
Statistische Tests
• D.h. durch Festlegen des α-Niveaus ist nur
die Entscheidung für H1 abgesichert.
• Bei Entscheidung für H1:
– H1 ist richtig,
– H1 ist falsch, ich mache einen Fehler mit
Wahrscheinlichkeit ≤ α.
• Daher: Formuliere H0 so, dass sie abgelehnt
werden soll. bzw. in H0 soll diejenige
Annahme festgelegt werden, der die größere
Bedeutung zukommt.
43
Statistische Tests
• Bsp. Medikamententest
H0: Medikament ist nicht wirksam gegen
H1: Medikament wirkt.
– Fehler 1. Art: das Medikament wirkt nicht, man
glaubt aber dass es wirkt
– Fehler 2. Art: das Medikament wirkt, man
glaubt aber dass es unwirksam ist.
Wähle α=0,01 (sehr klein), da Risiko ein
nichtwirksames Medikament als wirksam
einzustufen sehr groß ist.
44
Statistische Tests
• Arten von Hypothesen:
• Einseitige Hypothesen
– H0: θ ≤ θ0 gegen H1: θ > θ0
– H0: θ ≥ θ0 gegen H1: θ < θ0
• Zweiseitige Hypothesen
– H0: θ = θ0 gegen H1: θ ≠ θ0
• Verteilungshypothesen:
– H0: bestimmten Vt. gegen H1: nicht diese Vt.
45
Statistische Tests
• Arten von Testproblemen:
– Einseitige Testprobleme
• Tests für einseitige Hypothesen
– Zweiseitige Testprobleme
• Tests für zweiseitige Hypothesen
– Anpassungstests
• Test für Verteilungshypothesen
46
Statistische Tests
• Gütefunktion oder Macht g(θ):
Wahrscheinlichkeit sich für H1 zu
entscheiden, falls θ der wahre Parameter ist.
• Test zum Niveau α:
– g(θ) ≤ α für alle θ  H0
– g(θ) ≥ α für alle θ  H1
– Ist θ  H1, ist 1-g(θ) Wahrscheinlichkeit für den
Fehler 2. Art.
– Funktion 1-g(θ) heißt Operationscharakteristik
(OC)
47
Statistische Tests
Gütefunktion (einseitiger Test)
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
g(µ)
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
499
499,5
500
500,5
µ0=500
µ
501
501,5
502
48
Statistische Tests
Operationscharaktersitik OC Kurve (einseitiger Test)
1,00
0,95
0,90
0,85
0,80
0,75
Fehler 2.Art = 1-g(µ)
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
499,5
500
µ0=500
500,5
501
µ
501,5
502
49
Statistische Tests
• Trennschärfe eines Tests:
– Steilheit der OC Kurve 1-g(θ)
– Es gilt: Je größer die Stichprobe umso besser
die Trennschärfe.
50
Statistische Tests
Operationscharaktersitik OC Kurve (einseitiger Test),
unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)
1,00
0,95
0,90
0,85
0,80
0,75
Fehler 2.Art = 1-g(µ)
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
499,5
500
µ0=500
500,5
501
µ
501,5
502
51
Statistische Tests
• Vorgehensweise bei statistischen Tests (I):
– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus
– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.
– Bestimmung des kritischen Bereichs
– Berechnung der Prüfgröße (=Teststatistik)
– Entscheidung und Interpretation
52
Statistische Tests
• Vorgehensweise bei statistischen Tests (II):
– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus
– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.
– Berechnung der Prüfgröße (=Teststatistik)
– Bestimmung des p-Wertes der Teststatistik
– Entscheidung und Interpretation
53
Statistische Tests
• p-Wert
– Anstatt den kritischen Bereich bzw. die
kritischen Werte zu bestimmen, Berechnung
des „p-Wertes“.
– p-Wert (p-value): Niveau, bei dem der Test
gerade noch abgelehnt hätte.
– Vergleich des p-Wertes mit dem vorher
festgesetzten Niveau α.
– Entscheidung: Lehne H0 ab, wenn p-Wert < α
54
Statistische Tests
• Einseitige Tests (I)
– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T > c, lehne H0 ab
– T ≤ c, lehne H0 nicht ab
55
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
H0 nicht ablehnen
0,4
Kritischer Bereich
H0 ablehnen
Dichte der Testverteilung
0,35
0,3
0,25
0,2
1-α = 0,95
0,15
0,1
0,05
α = 0,05
0
-3
-2,5
-2
-1,5
-1
-0,5
0
Prüfgröße
0,5
1
1,5
2
2,5
3
Kritischer Wert: c
56
Statistische Tests
• Einseitige Tests (II)
– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
57
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
H0 nicht ablehnen
0,4
Kritischer Bereich
H0 ablehnen
Dichte der Testverteilung
0,35
0,3
0,25
0,2
Prüfgröße=1,64
p-Wert=0,05
1-α = 0,95
0,15
0,1
0,05
α = 0,05
0
-3
-2,5
-2
-1,5
-1
-0,5
0
Prüfgröße
0,5
1
1,5
2
Kritischer Wert: c
2,5
58
3
Statistische Tests
• Einseitige Tests (I)
– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T < c, lehne H0 ab
– T ≥ c, lehne H0 nicht ab
59
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
Kritischer Bereich
H0 ablehnen
0,4
H0 nicht ablehnen
Dichte der Testverteilung
0,35
0,3
0,25
0,2
1-α = 0,95
0,15
0,1
0,05
α = 0,05
0
-3
-2,5
-2
-1,5
Kritischer Wert: c
-1
-0,5
0
0,5
1
1,5
2
2,5
3
Prüfgröße
60
Statistische Tests
• Einseitige Tests (II)
– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
61
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
Kritischer Bereich
H0 ablehnen
0,4
H0 nicht ablehnen
Dichte der Testverteilung
0,35
0,3
0,25
0,2
Prüfgröße=-1,64
p-Wert=0,05
0,15
1-α = 0,95
0,1
0,05
α = 0,05
0
-3
-2,5
-2
-1,5
Kritischer Wert: c
-1
-0,5
0
Prüfgröße
0,5
1
1,5
2
2,5
62
3
Statistische Tests
• Zweiseitige Tests (I)
– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des kritischen Bereichs bzw. der
kritischen Werte (cu und co)
– T < cu oder T > co, lehne H0 ab
– cu ≤ T ≤ co, lehne H0 nicht ab
63
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
0,4
0,35
Dichte der Testverteilung
H0 nicht ablehnen
Kritischer
Bereich
H0 ablehnen
Kritischer
Bereich
H0 ablehnen
0,3
0,25
0,2
1-α = 0,95
0,15
0,1
0,05
α/2 = 0,025
0
-3
-2,5
α/2 = 0,025
-2
-1,5
Kritischer Wert: c
u
-1
-0,5
0
Prüfgröße
0,5
1
1,5
2
Kritischer Wert: c
2,5
o
64
3
Statistische Tests
• Zweiseitige Tests (II)
– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.
– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
65
Statistische Tests
Testverteilung = Stichprobenverteilung der Prüfgröße
0,45
0,4
0,35
Dichte der Testverteilung
H0 nicht ablehnen
Kritischer
Bereich
H0 ablehnen
Kritischer
Bereich
H0 ablehnen
0,3
0,25
0,2
0,15
1-α = 0,95
0,1
Prüfgröße= -1,96, +1,96
p-Wert=0,05
0,05
α/2 = 0,025
0
-3
-2,5
α/2 = 0,025
-2
-1,5
Kritischer Wert: c
u
-1
-0,5
0
Prüfgröße
0,5
1
1,5
2
Kritischer Wert: c
2,5
o
66
3
Statistische Tests
• Kritischer Wert: Wert auf der Achse
• p-Wert: Fläche unter der Dichte
• Entscheidung:
– Lehne H0 ab, wenn Prüfgröße im kritischen
Bereich
– Lehen H0 ab, wenn p-Wert der Prüfgröße < α
67
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• Teste ob 2 nominalskalierte Merkmale
voneinander unabhängig sind.
• Bsp. Sind Geschlecht und Rauchverhalten
voneinander unabhängig?
68
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• H0: die beiden Merkmale sind voneinander
unabhängig.
• H1: die beiden Merkmale sind nicht
voneinander unabhängig, d.h. sie sind
voneinander abhängig
• Festlegen des Signifikanzniveaus α.
69
χ² Unabhängigkeitstest
• Kontingenztafel:
– Absolute Häufigkeiten der
Merkmalsausprägungen
A\B
b1
...
bs
∑
a1
h11
…
h1s
h1.
:
:
:
:
ar
hr1
…
hrs
hr.
∑
h.1
...
h.s
h.. = n
70
χ² Unabhängigkeitstest
• Bsp. 4-Felder Tafel:
– Absolute Häufigkeiten der
Merkmalsausprägungen
weiblich
männlich
Raucher
9
5
14
Nichtraucher
32
27
59
41
32
73
71
χ² Unabhängigkeitstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter
Unabhängigkeit der Merkmale erwarten
würde (he), mit den tatsächlich beobachteten
Werten (ho).
• Wenn H0 gilt, welche Werte würde man
erwarten?
• Berechung der unter H0 erwarteten
absoluten Häufigkeiten.
72
χ² Unabhängigkeitstest
• Unter H0 erwartete absoluten Häufigkeiten
• Interpretation der relativen Häufigkeiten als
Wahrscheinlichkeiten
• Dann: unter H0 erwartete absoluten
Häufigkeiten
he =
h io h oj
n
73
χ² Unabhängigkeitstest
• Bsp. Geschlecht - Rauchverhalten h =
e
o
h
Geschlecht
w
m
he
Geschlecht
w
m
h io h oj
n
Raucher
j
9
5
14
n
32
27
59
41
32
73
n
33,1
25,9
59
41
32
73
Raucher
j
7,9
6,1
14
74
χ² Unabhängigkeitstest
• Teststatistik χ²:
– Abweichung der beobachteten Häufigkeiten
von den erwartete Häufigkeiten
r
s
χ = 
2
i=1 j=1
h
o
ij
h

e 2
ij
h ije
75
χ² Unabhängigkeitstest
Verteilung der Teststatistik χ²:
• χ²-Verteilung mit v = (r-1)·(s-1)
Freiheitsgraden
76
χ² Unabhängigkeitstest
Kritischer Bereich:
• Signifikanzniveau α
• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1)
Verteilung
• Lehne H0 ab, wenn gilt:
Wert der Teststatistik > kritischer Wert
77
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten:
Teststatistik χ²
2
2
χ = 
2
i=1 j=1
h
o
ij
h
h
e
ij

e 2
ij
 0,5
• Verteilung der Teststatistik: χ²1
Chi-Quadrat Verteilung mit einem
Freiheitsgrad
78
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten:
• Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84
• Entscheidung:
(I) Teststatistik = 0,5 < 3,84 = kritischer Wert.
Also: Lehne H0 nicht ab.
(II) p-Wert = 0,496 > 0,05.
Also: Lehne H0 nicht ab.
• Interpretation: Geschlecht und Rauchverhalten
sind voneinander unabhängig.
79
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• Betrachte zwei Gruppen bzw. Stichproben.
• Teste, ob die Stichproben aus der gleichen
Grundgesamtheit stammen.
80
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• H0: die beiden Stichproben stammen aus der
gleichen Grundgesamtheit.
• H1: die beiden Stichproben stammen nicht
aus der gleichen Grundgesamtheit.
• Festlegen des Signifikanzniveaus α.
81
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten
• H0: Das Rauchverhalten der beiden
Gruppen stimmt überein.
• H1: Das Rauchverhalten der beiden
Gruppen stimmt nicht überein.
82
χ² Homogenitätstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter
H0 (gleiche Grundgesamtheit) erwarten
würde (he), mit den tatsächlich beobachteten
Werten (ho).
• Wenn H0 gilt, welche Werte würde man
erwarten?
• Berechung der unter H0 erwarteten
absoluten Häufigkeiten.
83
χ² Homogenitätstest
• Unter H0 erwartete absoluten Häufigkeiten
he =
h io h oj
n
84
χ² Homogenitätstest
• Teststatistik χ²:
– Abweichung beobachteten Häufigkeiten und
erwartete Häufigkeiten
r
s
χ = 
2
i=1 j=1
h
o
ij
h

e 2
ij
h ije
• Verteilung der Teststatistik χ²:
χ²-Verteilung mit v = (r-1)·(s-1)
Freiheitsgraden
85
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten:
• Teststatistik χ² = 0,5
• Verteilung der Teststatistik: χ²1
• Entscheidung:
– (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab.
– (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab.
• Interpretation: die beiden Gruppen (Männer,
Frauen) stammen aus der gleichen
Grundgesamtheit, sie sind homogen.
86
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Teststatistik und Testverteilung sind gleich
• Nullhypothese und Interpretation sind
verschieden.
– Test auf Unabhängigkeit (die Merkmale sind
unabhängig voneinander)
– Test auf Homogenität (die Stichproben
stammen aus der gleichen Grundgesamtheit).
87
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Für die Approximation durch die χ²-Vt.
sollten die erwarteten Häufigkeiten jeder
Zelle  5 sein und keine der Zellen sollte
unbesetzt sein.
• Sind die Voraussetzungen verletzt, kann
man einen exakten Test durchführen
(siehe Hartung S. 414ff)
88
Anpassungstests
Test einer Verteilungshypothese –
Nichtparametrische Testverfahren
• Betrachtet Unterschied zw. Stichproben-Vt.
und theoretischer Verteilung.
• „Anpassungstest“ weil die Güte der
Anpassung einer theoretischen Vt. an eine
empirische Vt. überprüft wird.
89
Anpassungstests
χ² Anpassungstest:
• H0: die Grundgesamtheit gehorcht einer
bestimmten Verteilung.
• Vorgehensweise:
– Bestimme die unter H0 zu erwartenden
Häufigkeiten he und vergleiche sie mit den
beobachteten Häufigkeiten ho.
– Abweichung groß – Entscheidung gegen H0,
Abweichung klein – Entscheidung für H0.
90
Anpassungstests
χ² Anpassungstest:
• Teststatistik:
o
e 2
(h

h
2
i
i )
χ 
e
h
i 1
i
k
k ... Anzahl der Merkmalsausprägungen
(diskrete Merkmale) bzw. Anzahl der
Klassen (stetigen Merkmalen)
• Testverteilung: χ²v verteilt mit v=n-1
• Es gilt wieder: he sollten  5 sein.
91
Anpassungstests
χ² Anpassungstest:
• Entscheidung:
– Bestimmung des kritischen Bereichs,
χ² > kritischer Wert, lehne H0 ab
– Bestimmung des p-Wertes,
p-Wert < α lehne H0 ab
92
Anpassungstest
• Bsp. χ² Anpassungstest:
– H0: Augenfarbe ist gleichverteilt
– H1: Augenfarbe ist nicht gleichverteilt
– α = 0,05
Merkmal
1
2
3
o
h
35
22
15
72
e
h
24
24
24
72
• Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2
Verteilung) => H0 ablehnen
• p-Wert: 0,014 < 0,05 => H0 ablehnen
93
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest:
• Test zur Beurteilung der Güte der
Anpassung einer erwarteten theoretischen
Verteilung an eine beobachtete empirische
Verteilung.
• H0: die Grundgesamtheit gehorcht einer
bestimmten Verteilung.
• Prinzip: Abweichung empirische- von der
theoretische Verteilungsfunktion.
94
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest:
• Prüfgröße (D):
– größte beobachtete absolute Abweichung der
theoretischen von der empirischen
Verteilungsfunktion.
• Testverteilung:
– „Kolmogorov-Smirnov- Verteilung“, hängt nur
vom Stichproben-umfang n ab (1-α Quantile in
Tabelle nachschlagen).
• Entscheidung:
– D > kritischer Wert (aus Tabelle), lehne H0 ab.
95
Herunterladen