Intellectual Tool Essentielle Konzepte der Statistik

Werbung
Schweizerische Studienstiftung: Intellectual Tool
Essentielle Konzepte der Statistik
Prof. Dr. Bernhard Schipp
Balsthal, März 2016
Prof. Dr. Bernhard Schipp
IT-Stat – 1
Übersicht
1. Basiswissen Statistik
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
2. Epidemiologie
Anhang: Wichtige
Verteilungen
3. Statistische Inferenz
Anhang: Wichtige Verteilungen
Prof. Dr. Bernhard Schipp
IT-Stat – 2
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
1. Basiswissen Statistik
IT-Stat – 3
Grundlagen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Struktur einer Beobachtungsstudie
-
❖ Korrelation
❖ Rangkorrelation
֒→ Stichprobenziehung: Mehrere Verfahren möglich.
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
-
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
Grundgesamtheit: Menge aller
Individuen/Untersuchungsobjekte.
erzeugt Stichprobe, im Idealfall repräsentativ.
֒→ Informationsaggregation von Merkmalen/Variablen
-
Überblick anhand deskriptiver Statistiken bzw.
graphischer/numerischer explorativer Datenanalyse.
-
Basis zur inferentiellen Statistik, welche Rückschlüsse auf die
Grundgesamtheit zulässt.
IT-Stat – 4
Grundlagen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Struktur eines geplanten statistischen Experiments:
-
❖ Korrelation
❖ Rangkorrelation
Festlegung der Grundgesamtheit (Population), worauf bezieht
sich die Studie?
֒→ Stichprobenziehung, Sicherstellung der Repräsentativität
durch Auswahlverfahren.
֒→ Randomisierte Gruppenzuweisung (verschiedene
Möglichkeiten)
֒→ Verblindung (reduziert systematische Fehler)
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
-
generiert i.d.R. homogene Behandlungsgruppen
(Kontrollgruppe, Gruppe A, Gruppe B,...). von Interesse: Effekte
der Gruppen (Faktoren) auf die interessierenden Zielgrößen.
֒→ Datenmaterial
Prof. Dr. Bernhard Schipp
erlaubt Überblick anhand deskriptiver Statistiken und
graphischer/numerischer explorativer Datenanalyse.
dient als Basis der inferentiellen Statistik
kann helfen, Kausalitäten zwischen Faktoren und
Response-Variablen zu erarbeiten.
IT-Stat – 5
Grundlagen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Variablen und Datentypen
-
❖ Korrelation
Variablen := [A, X].
Realisationen := [a1 , ...an , x1 , ...xn ].
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
֒→
֒→
Diskret: Zähldaten wie Anzahl der Arztbesuche, Nachkommen
Stetig: Körpergröße, Zeitdauer, Konzentrationsfähigkeit
֒→
Qualitativ (Kategorial), nicht-numerische Ausprägungen, immer
diskret.
Quantitativ, numerische Ausprägungen, diskret oder stetig
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
֒→
Prof. Dr. Bernhard Schipp
֒→ Nominal: z.B. Geschlecht, Blutgruppe können nicht
angeordnet werden.
֒→ Ordinal: Rangordnungen, können angeordnet werden,
Differenzenbildung macht aber i.d.R. keinen Sinn, z.B.
Schulnoten
֒→ Intervall: Differenzenbildung macht Sinn, Verhältnisbildung
nicht, z.B. Zeit, Temperatur
֒→ Verhältnis: Intervalldaten mit absolutem Nullpunkt, z.B.
IT-Stat – 6
Preise
Grundlagen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• Von Interesse: Verteilung der Daten: mögl. Ausprägungen und
deren proportionales Auftreten:
֒→
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
֒→
Stichprobenverteilung (empirische Verteilung) → bekannt.
Populationsverteilung → unbekannt, muss oft durch eine
Annahme festgelegt werden oder wird aus den Daten geschätzt.
• Darstellungsmethoden: Tabellen, Grafiken
IT-Stat – 7
Univariate Analyse
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Relative Häufigkeitsverteilung (Histogramm) der Daten (blau) nach
Klassifizierung in Gruppen.
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
Total area under curve = 100 %
Area (!) proportional to per−
centage of values in (a, b]
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
18.8%
14.4%
11.9%
9.4%
5%
20
Prof. Dr. Bernhard Schipp
25
30
7.5%
3.8%
35
40
45
50
9.4%
5.6%
55
60
65
70
a
b
Measurement scale of variable X
75
14.4%
80
85
90
95
IT-Stat – 8
Histogramm
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Histogramme reagieren sensibel auf die (subjektive gewählte)
Anzahl, Position und Breite der Klassen.
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
33.1%
28.1%
19.4%
13.1%
21.2%
20%
16.9%
13.1%
12.5%
8.1%
5%
1.2%
20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
7.5%
0.6%
20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
Measurement scales of variable X
Prof. Dr. Bernhard Schipp
IT-Stat – 9
Deskriptive Kenngrößen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Lageparameter der Stichprobe x1 , ..., xn
-
❖ Korrelation
n
1X
x̄ :=
xi
n i=1
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Arithmetischer Mittelwert
-
Median
x̃ :=
-
Prof. Dr. Bernhard Schipp

 x̃ := x(0.5(n+1))

falls n ungerade
x̃ := 0.5(x(0.5n) + x(0.5n+1) )
Modus: Häufigster Wert
IT-Stat – 10
Deskriptive Kenngrößen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• Graphische Illustration:
n = 15
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
Mode
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
x
• Schranken geordneter Daten:
α-Quantile
Perzentile
Quartile
insbesondere:
x
Measurement scale of data
teilt die Daten in
”
”
beliebige Anteile
Hunderstel
Viertel
Q0.25
Q0.75
Unteres Quartil
Oberes Quartil
• Median = 0.5-Quantil usw.
Prof. Dr. Bernhard Schipp
IT-Stat – 11
Kenngrößen der Grundgesamtheit
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
• Lageparameter der Grundgesamtheit:
-
Erwartungswert E(X) = µ
Median θ mit FX (x ≤ θ) = 0.5
Modus (Maximalstelle der Dichtefunktion der Grundgesamtheit)
• Graphische Illustration
Anhang: Wichtige
Verteilungen
Upper 50 % of total area
Lower 10 % of total area
0.1−quantile
= 10th percentile
= 1st decile
Prof. Dr. Bernhard Schipp
Mode θ
µ
Measurement scale of X
IT-Stat – 12
Deskriptive Kenngrößen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
• Ein gern gemachter Fehler:
• Gegeben: x̄ der Stichprobe x1 , ..., xn und ȳ der Stichprobe
y1 , ..., ym .
֒→ Wie lautet der Mittelwert der gemeinsamen Stichprobe
x1 , ..., xn , y1 , ..., yn ?
֒→ Ist es der Mittelwert z̄∗ der Mittelwerte x̄ und ȳ? I.A. nicht, da
!
n
m
X
X
1
nx̄ + mȳ
z̄ :=
xi +
yi =
n + m i=1
n+m
i=1
֒→ Es gilt nur z̄ = 0.5(x̄ + ȳ) =: z̄∗ falls m = n.
• Beispiel: n = 2, m = 10
xi
yi
Prof. Dr. Bernhard Schipp
2.5
1.1
3
1.2 0.9 1.0 1.1 0.8
1.2 0.9 1.0 0.9
x̄ = 2.75
ȳ = 1.01
z̄∗ = 1.88
z̄ = 1.3
IT-Stat – 13
Deskriptive Kenngrößen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• Ein weiterer gern gemachter Fehler:
• Beobachtung des konsekutiven Wachstums
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
Populationsgröße
Start:
110
Wachstumsrate Wachstumsfaktor
per
Periode per Periode
(%)
nach Periode 1: 132
r1 = +20 %
f1 = 1 +
nach Periode 2: 165
r2 = +25 %
f2 = 1 +
nach Periode 3: 110
r3 = −33 13 %
f3 = 1 +
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
r1
100
r2
100
r3
100
=
=
=
6
5
5
4
2
3
֒→
Wie lautet die durchschnittliche Wachstumsrate per Periode?
֒→
3−1 (r1 + r2 + r3 ) = 3.89% pro Periode ist offensichtlich grober
Unfug.
IT-Stat – 14
Deskriptive Kenngrößen
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
• Lösung: Nutze den geometrischen Mittelwert der
Wachstumsfaktoren, um die durchschnittliche Wachstumsrate zu
erhalten.
i)
Berechne das geometrische Mittel der Wachstumsfaktoren:
p
(geom)
¯
f
= n f1 · . . . · fn
ii)
Der „richtige” Durchschnitt der Wachstumsrate ist sodann:
(geom)
∗
− 1 · 100 %
r = f¯
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
• Beispiel (Fortsetzung): f¯(geom) =
Prof. Dr. Bernhard Schipp
q
3
6
5
·
5
4
·
2
3
= 1 ⇒ r∗ = 0 %
IT-Stat – 15
Deskriptive Kenngrößen: Streuung
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Empirische Variationsmaße:
i)
Standardabweichung
v
u
n
u 1 X
s :=t
(xi − x̄)2
n−1 i=1
ii)
Spannweite (geordnete Stichprobe x(1) < ... < x(n) )
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
R := x(n) − x(1)
iii) Interquartilsabstand (geordnete Stichprobe x(1) < ... < x(n) )
IQR := Q0.75 − Q0.25
wobei Qα das α-Quantil mit α ∈ [0, 1] ist.
Prof. Dr. Bernhard Schipp
IT-Stat – 16
Deskriptive Kenngrößen: Streuung
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• Graphische illustration:
x7 − x
n = 20
❖ Rangkorrelation
x2 − x
x
x7
x2
❖ Bayes-Theorem
❖ Kontingenztafeln
x(1)
2. Epidemiologie
Min.
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
x(5)
x(10)
x(15)
x
1. Quartile
~ 25 %
x(11)
~ 25 %
x(20)
3. Quartile
~ 25 %
Max.
~ 25 %
Inter−quartile range (IQR)
Sample range
IT-Stat – 17
Streuungsmaße in der Grundgesamtheit
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
• Variationsmaße der Population:
i)
Standardabweichung/Varianz: σ =?
(unbekannt), σ 2 = V ar(X)
ii) Spannweite: Existiert nur, falls die Populationswerte eine obere
und untere Grenze aufweisen.
iii) Interquartilsabstand:
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
IQRP := θ0.75 − θ0.25
wobei FX (x ≤ θα ) = α und α ∈ [0, 1].
25 %
25 %
Q1
Prof. Dr. Bernhard Schipp
25 %
θ
25 %
Q3
IT-Stat – 18
Variationskoeffizient
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
Variationskoeffizient (Streuung relativ zu arithm. Mittelwert)
- ist definiert durch
❖ Bivariate Analyes
❖ Korrelation
vc =
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
Interpretation (Faustregel):
3. Statistische Inferenz
●
Anhang: Wichtige
Verteilungen
●
●
●
Prof. Dr. Bernhard Schipp
s
· 100(%)
x̄
(0 < vc ≤ 20): arithm. Mittel präzise
(20 < vc ≤ 40): arithm. Mittel moderat präzise
(40 < vc ≤ 60): arithm. Mittel eher ungenau
(60 < vc): arithm. Mittel extrem ungenau
IT-Stat – 19
Box-Plot
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Boxplots für Stichprobendaten:
i)
Nutze die „5 Kenngrößen”
❖ Korrelation
Minimum, Q0,25 , Median, Q0,75 , Maximum
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
ii)
Ausreißeridentifikation:
xi > Q0,75 + 1.5 · IQR oder xi < Q0,25 + 1.5 · IQR
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
iii) Boxplotkonstruktion:
n = 20
|
x(1)
Min.
Prof. Dr. Bernhard Schipp
x(5)
1. Quartile
x
Median
x(15)
3. Quartile
x(20)
Max.
IT-Stat – 20
Box-Plot
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Boxplots und Verteilungen:
Uniform
❖ Bivariate Analyes
Bell−shaped
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
|
n.
Mi
|
Q
1.
u.
|
|
d.
Me
Q
3.
u.
|
|
Ma
x.
Q
1.
u.
|
|
d.
Me
u.
Q
3.
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Right skewed
|
|
|
.
u
d.
n.
Mi 1. Q Me
Prof. Dr. Bernhard Schipp
|
3.
Q
u.
Left skewed
|
1.
Q
u.
|
|
d.
Me
3.
Q
u.
|
x.
Ma
IT-Stat – 21
Box-Plot
❖ Univariate Analyse
❖ Bivariate Analyes
Für jede der Gruppen A,
B
Variable X by group
❖ Korrelation
7
❖ Grundlagen
*
*
6
1. Basiswissen Statistik
*
❖ Rangkorrelation
❖ Bayes-Theorem
5
❖ Kontingenztafeln
- Boxplots, gelb und mittig.
3
Anhang: Wichtige
Verteilungen
X
- x̄ + s, rot und links.
Empfehlung: Überlagere Dot-Chart
und Boxplot
0
1
- Rohdaten im Dot-Chart-Format.
2
3. Statistische Inferenz
4
2. Epidemiologie
A
group
B
• Warnung: x̄ ± s verbirgt wichtige Informationen insb. bei kleinen
Datenmengen oder schiefer Verteilung.
Prof. Dr. Bernhard Schipp
IT-Stat – 22
Bad Graphs
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Es gibt viele ungeeignete Darstellungen: Illustration
❖ Bivariate Analyes
Dynamite plot: x ± s
❖ Rangkorrelation
Dot chart of raw data
30
30
❖ Korrelation
20
2. Epidemiologie
25
❖ Kontingenztafeln
20
25
❖ Bayes-Theorem
X
15
0
5
10
X
0
5
10
Anhang: Wichtige
Verteilungen
15
3. Statistische Inferenz
A
B
C
D
A
B
group
C
D
• Offensichtlich gilt x̄A = x̄B und sA = sB , ebenso für die Gruppen C
und D.
֒→ Der Dot-Chart rechts zeigt die tatsächliche Verteilungssituation.
Siehe auch: web links zu „Bad graph contest“.
Prof. Dr. Bernhard Schipp
IT-Stat – 23
Univariate Analyse
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
• Die Stichprobenverteilung approximiert für großes n die unbekannte
Verteilung der Grundgesamtheit.
• Je größer die Stichprobe desto besser ist die Approximation
(Ausnahmen exisitieren auch hier).
❖ Kontingenztafeln
Simulated sampling with increasing n: convergence of
histograms & descriptive statistics with µ = 1.3 and σ = 1
2. Epidemiologie
3. Statistische Inferenz
n = 25: x = 1.233, s = 0.757
Anhang: Wichtige
Verteilungen
0
1
2
3
4
n = 100: x = 1.239, s = 0.91
5
0
n = 400: x = 1.372, s = 1.314
0
Prof. Dr. Bernhard Schipp
1
2
3
4
1
2
3
4
5
n = 1600: x = 1.315, s = 1.082
5
0
1
2
3
4
5
IT-Stat – 24
Bivariate Analyse
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Verteilung der Paare (x1 , y1 ), ..., (x1 , y1 ): Der Scatterplot
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
= Beschreibung
der
Streuung der Punkte
(xi , yi ) im 2D-Raum.
Hier noch mit den jeweiligen 1D-Boxplots
erweitert.
100
❖ Kontingenztafeln
VerPaare
Waiting time [min]
70
80
90
❖ Bayes-Theorem
= gemeinsame
teilung der
(xi , yi ).
60
❖ Rangkorrelation
50
❖ Korrelation
110
❖ Bivariate Analyes
1
2
3
4
Previous duration [min]
5
Empfehlung: Überlagere
Dot-Chart und Boxplot
Prof. Dr. Bernhard Schipp
IT-Stat – 25
Bivariate Grafiken
110
1. Basiswissen Statistik
❖ Grundlagen
100
❖ Univariate Analyse
❖ Bivariate Analyes
Ones
80
1 3 5 7 9
80
60
50
Anhang: Wichtige
Verteilungen
Waiting time [min]
3. Statistische Inferenz
70
2. Epidemiologie
60
❖ Kontingenztafeln
Waiting time [min]
❖ Rangkorrelation
❖ Bayes-Theorem
100
90
❖ Korrelation
1
2
3
4
Previous duration [min]
5
40
1
2
3
4
5
Previous duration [min]
• Links: „Sunflowerplot” um doppelt belegete Punkte zu visulisieren.
Rechts: Mehrfachbelegung durch hexagonale Zellenstruktur
visualisiert.
Prof. Dr. Bernhard Schipp
IT-Stat – 26
Bivariate Grafiken
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Eigenschaften von Interesse:
i)
Die Gestalt bivariater Verteilung kann analog zu den univariaten
Verteilungen klassifiziert werden, zeigt aber i.A. komplexeres
Verhalten bezüglich der Modalitäten und Asymmetrien.
ii)
Der Interessenfocus liegt generisch auf einfachen
Eigenschaften der Punktewolke:
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
-
Lage
Gerichtete Streuung
Statistische Abhängigkeit (Kovarianz, Korrelation)
Funktionsartige Strukturen (Im Sinne von Trends z.B.
Regression von y auf x).
IT-Stat – 27
Bivariate Grafiken
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
3
3
2
2
1
1
0
0
❖ Bayes-Theorem
y
❖ Rangkorrelation
y
❖ Korrelation
−1
−1
❖ Kontingenztafeln
−2
−2
2. Epidemiologie
−3
−3
3. Statistische Inferenz
−3
−2
−1
0
2
−3
3
−2
−1
3
3
2
2
1
1
0
0
−1
−1
−2
−2
−3
−3
−3
−2
−1
0
x
0
1
2
3
1
2
3
x
y
y
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
1
x
1
2
3
−3
−2
−1
0
x
IT-Stat – 28
Bivariate Analyse: Korrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
• Korrelation: Beschreibt eine Beziehung zwischen zwei oder
mehreren Merkmalen, Ereignissen oder Zuständen, die nicht
notwendigerweise ein Kausalzusammenhang darstellen muss.
• Für metrische Daten exisitieren unterschiedliche Typisierungen.
8
2. Epidemiologie
3
3. Statistische Inferenz
2
Anhang: Wichtige
Verteilungen
6
y
y
1
0
4
−1
2
−2
−3
−3
−2
−1
0
x
1
2
3
Abbildung 1: Linear
Prof. Dr. Bernhard Schipp
0.0
0.5
1.0
1.5
2.0
2.5
x
Abbildung 2: Monoton
IT-Stat – 29
Bivariate Analyse: Korrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Oder eher pathologische Beispiele
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
1.0
1.0
1.0
0.5
0.5
0.5
0.0
0.0
0.0
−0.5
−0.5
−0.5
−1.0
−1.0
−1.0
❖ Bayes-Theorem
❖ Kontingenztafeln
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
y
2. Epidemiologie
−1.0
−0.5
0.0
0.5
1.0
−1.0
−0.5
0.0
0.5
1.0
−1.0
−0.5
0.0
0.5
1.0
x
Prof. Dr. Bernhard Schipp
IT-Stat – 30
Bivariate Analyse: Korrelation
- Beispiel:
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
n = 30 Länder
x Täglicher Fettverzehr
y Tod durch Prostatakrebs
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
- Ziel:
Ein Maß der (linearen)
Abhängigkeit zwischen
den Größen x und y.
Prof. Dr. Bernhard Schipp
8
❖ Korrelation
6
❖ Bivariate Analyes
No. of deaths per 100000
❖ Univariate Analyse
10 12 14 16 18
Deaths due to prostate cancer vs. fat intake
4
❖ Grundlagen
2
1. Basiswissen Statistik
30
40
50
60
70
80
90
110
130
150
Average fat intake (in grams/day)
• Lösung: Korrelationskoeffizient nach Karl Pearson:
Pn
i=1 (xi − x̄)(yi − ȳ)
pPn
rP = pPn
2
2
i=1 (xi − x̄) ·
i=1 (yi − ȳ)
IT-Stat – 31
Bivariate Analyse: Korrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
• −1 ≤ rP ≤ +1
(Skaleninvariant, Einheitenfrei)
• Je mehr sich |rP | der 1 nähert desto eher liegen die Punkte (xi , yi )
auf einer „imaginären” Geraden.
֒→
rP = 1 alle Punkte liegen auf einer steigenden Geraden.
rP = −1 alle Punkte liegen auf einer fallenden Geraden.
Funktional deterministische Beziehung zwischen y und x.
Praktisch unmöglich für reale Datensituationen.
• rP sagt nichts über die Steigung der „imaginären” Geraden aus.
֒→
Dies ist die grundsätzliche Fragestellung innerhalb der
Regressionsanalyse.
• rP = 0 zeigt nur die Abwesenheit einer linearen statistischen
Beziehung zwischen den Größen y und x auf.
Prof. Dr. Bernhard Schipp
IT-Stat – 32
Bivariate Analyse: Korrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Einstufungen (Faustregel!)
|rP |
0 < |rP |
0.5 < |rP |
0.8 < |rP |
|rP |
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
=
≤
≤
<
=
0
0.5
0.8
1
1
:
:
:
:
:

keine



schwache 

mittlere
(Pearson) Korrelation


starke



perfekte
• Beispiele: Korrelationen mit unterschiedlicher Größenausprägungen
r P = 0.923
r P = 0.875
r P = −0.643
r P = 0.114
6
6
6
6
5
5
5
5
4
4
4
4
3
3
3
3
2
2
2
2
1
1
1
1
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
• Beachten Sie: Die Steigung der ersten Geraden ist kleiner als die
der Zweiten, obwohl die Korrelation im ersten Plot deutlich größer
ist.
Prof. Dr. Bernhard Schipp
IT-Stat – 33
Bivariate Analyse: Korrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• rP = 0 schließt keine nicht-linearen Beziehungen aus:
❖ Bivariate Analyes
r P = 0.01
❖ Korrelation
❖ Rangkorrelation
r P = 0.037
❖ Bayes-Theorem
❖ Kontingenztafeln
5
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
r P = −0.09
1.0
1.0
0.5
0.5
0.0
0.0
−0.5
−0.5
4
−1.0
−1.0
−1.0
3
−0.5
0.0
0.5
1.0
−1.0
−0.5
0.0
0.5
1.0
r P = −0.103
1.0
2
0.5
0.0
1
−0.5
0
−1.0
0
1
2
3
Abbildung 3: Standard
Prof. Dr. Bernhard Schipp
−1.0
−0.5
0.0
0.5
1.0
Abbildung 4: Pathologisch
֒→ Merke: Erstellen Sie, falls möglich, einen Scatterplot, um
nicht-lineare Beziehungen zwischen den Größen y und x zu
entdecken.
IT-Stat – 34
Bivariate Analyse: Rangkorrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
• Problem: Messung der Stärke einer monotonen Beziehung
zwischen metrisch bivariaten Daten (Monotonie ist eine schwächere
Eigenschaft als Linearität).
• Grafische Illustration:
Monotone association with ...
2. Epidemiologie
... increasing trend
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
... non−decreasing trend
... decreasing trend
25
1.0
8
0.8
20
0.6
15
0.4
10
0.2
5
6
4
2
0.0
0
0.0
Prof. Dr. Bernhard Schipp
0.5
1.0
1.5
−2
−1
0
1
2
0.0
0.5
1.0
1.5
IT-Stat – 35
Bivariate Analyse: Rangkorrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
• Lösung:
֒→
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
֒→
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
֒→
֒→
Nicht die eigentlichen Datenpaare (xi , yi ) werden genutzt,
sondern die damit assoziierten Rangpaare (R(xi ), R(yi )).
die Ränge werden separat für xi und yi ermittelt: Das kleinste xi
bekommt R(xi ) = 1 zugewiesen, das zweitkleinste xi bekommt
R(xi ) = 2 zugewiesen etc. Das gleiche Verfahren erfolgt für yi .
Im Fall gleicher Werte innerhalb der xi Datenreihe (bzw. in yi ),
also bei sog. „ties”, wird dann ein mittlerer Rang vergeben.
Rangkorrelation nach Spearman:
n X
n+1
n+1
R(xi ) −
R(yi ) −
2
2
i=1
v
rS = v
u n u n 2
2
X
uX
u
n+1
n+1
t
R(xi ) −
R(yi ) −
· t
2
2
i=1
i=1
Prof. Dr. Bernhard Schipp
IT-Stat – 36
Bivariate Analyse: Rangkorrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
• Eigenschaften von rS
֒→
֒→
Je näher |rS | an 1 liegt, desto eher folgen (xi , yi ) einem
monotonen Trend.
֒→
rS = 1 ⇔ Perfekte positive Rangkorrelation.
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
֒→
֒→
֒→
Prof. Dr. Bernhard Schipp
−1 ≤ rS ≤ +1
rS = −1 ⇔ Perfekte negative Rangkorrelation.
rS = 0 ⇔ Keine monotone Beziehung
Der Rangkorrelationkoeffizient sagt nichts (bis auf das
Vorzeichen) über die Steigung des monotonen Trends aus.
IT-Stat – 37
Bivariate Analyse: Rangkorrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• Einstufungen (Faustregel!): Siehe rP
• Die vorherigen Beispiele nun mit rS
r S = 0.929
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
r S = 0.856
r S = −0.896
25
1.0
8
2. Epidemiologie
0.8
20
3. Statistische Inferenz
0.6
15
Anhang: Wichtige
Verteilungen
0.4
10
0.2
5
6
4
2
0.0
0
0.0
0.5
1.0
1.5
−2
−1
0
1
2
0.0
0.5
1.0
1.5
• rS = 0 schließt eine nicht-monotone Beziehung nicht aus; machen
Sie sich das anhand der pathologischen Beispiel klar.
Prof. Dr. Bernhard Schipp
IT-Stat – 38
Bivariate Analyse: Rangkorrelation
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
• rS reagiert robust gegenüber sog. Ausreißern.
• Beispiel:
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
16 Datenpunkte, rP = rS = 0
2. Epidemiologie
5
3. Statistische Inferenz
4
Anhang: Wichtige
Verteilungen
3
2
1
17. Datenpunkt hinzugefügt
point
rP
rS
Prof. Dr. Bernhard Schipp
(5, 5)
0.2273
0.1753
(10, 10)
0.7258
0.1753
0
0
(20, 20)
0.9351
0.1753
1
2
3
(50, 50)
0.9908
0.1753
4
5
(100, 100)
0.9978
0.1753
IT-Stat – 39
Bedingte Wahrscheinlichkeit und
Bayes-Theorem
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
Gesucht: Wahrscheinlichkeit eines Ereignisses unter der Bedingung,
dass ein anderes bereits eingetreten ist.
Formal:
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
P (A|B) =
P (A und B)
, P (B) > 0
P (B)
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Eigenschaften:
P (A und B) = P (A)P (B) falls A und B (stochastisch) unabhängig
sind
P (A und B) = P (A) + P (B) − P (A oder B)
P (A und B) = P (A|B)P (B)
Prof. Dr. Bernhard Schipp
IT-Stat – 40
Bedingte Wahrscheinlichkeit und
Bayes-Theorem
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Seien A und B Ereignisse, mit den Gegenereignissen Ā und B̄, dann
gilt
P (B) = P (B und A) + P (B und Ā)
was gleichbedeutend ist mit
P (B) = P (B|A)P (A) + P (B|Ā)P (Ā)
Damit erhält man den Satz von Bayes:
P (A|B) =
Prof. Dr. Bernhard Schipp
P (A und B)
P (B|A)P (A)
=
P (B)
P (B|A)P (A) + P (B|Ā)P (Ā)
IT-Stat – 41
Kontingenztafel; Beispiel
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
Beispiel: Ebola (Ebola-Disease); Sensitivität, Spezifität des
Ebola-Tests und die Prävalenz von Ebola in einer Population seien
bereits bekannt.
P (T und K)
• Sensitivität: P (T |K) =
= 0.94
P (K)
P (T̄ und K̄)
• Spezifität: P (T̄ |K̄) =
= 0.93
P (K̄)
• Prävalenz (gegeben): P (Ebola) = 0.000002
P (T |K)P (K)
• Bayes: P (K|T ) =
P (T |K)P (K) + P (T |K̄)P (K̄)
• d.h. P (K|T ) = 0.000027!!!
und damit ist der Test ungeeignet.
IT-Stat – 42
Kontingenztafel; Beispiel
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Die Prävalenz ändert sich i.d.R. bei Verdachtsfällen (Stichprobe):
• Vierfeldertafel (two-way table): Verdachtsfälle von Ebola
K
K̄
T
126
7
133
T̄
8
97
105
134
104
238
• P(Ebola bei Verdachtsfällen) =
134
= 0.56
238
• d.h. P (K|T ) = 0.95!!!
und damit ist der Test in Verdachtsfällen zur Absicherung durchaus
geeignet.
Prof. Dr. Bernhard Schipp
IT-Stat – 43
Validität diagnostischer Verfahren
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
- Um zu beurteilen, wie gut ein Labortest für die Diagnose der
Krankheit ist, wird bei jedem Patienten dessen tatsächlicher
Gesundheitszustand mit dem Ergebnis des Tests verglichen. Dabei
können vier mögliche Fälle auftreten:
• Richtig positiv : Der Patient ist krank und der Test hat dies
richtig angezeigt.
• Falsch negativ : Der Patient ist krank, aber der Test hat ihn
fälschlicherweise als gesund eingestuft.
• Falsch positiv : Der Patient ist gesund, aber der Test hat ihn
fälschlicherweise als krank eingestuft.
• Richtig negativ : Der Patient ist gesund und der Test hat dies
richtig angezeigt.
Im ersten und letzten Fall war die Diagnose also richtig, in den anderen
beiden Fällen liegt ein Fehler vor.
Prof. Dr. Bernhard Schipp
IT-Stat – 44
Kontingenztafeln
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
I.d.R. müssen die Wahrscheinlichkeiten durch eine Datenerhebung
geschätzt werden. Beispiel: absolute Häufigkeiten
Personen
Test positiv
Test negativ
Summe
krank
98
1
99
gesund
40
1960
2000
Summe
138
1961
2099
Schätzung durch die relative Häufigkeiten:
Personen
Test positiv
Test negativ
Summe
krank
98/2099=0.047
1/2099=0.0005
99/2099=0.047
gesund
40/2099=0.019
1960/2099=0.934
2000/2099=0.953
Summe
138/2099=0.066
1961/2099=0.934
1
Daraus kann z.B. ermittelt werden:
P(krank|Test positiv)=
P(krank und Test positiv)/P(Test positiv)=0.047/0.066=0.71
alternativ: P(krank|Test positiv)=
Anzahl(krank und Test positiv)/Anzahl(Test positiv)=98/138=0.71
Prof. Dr. Bernhard Schipp
IT-Stat – 45
Kontingenztafelanalyse
1. Basiswissen Statistik
❖ Grundlagen
❖ Univariate Analyse
• Bezeichnungen: T = Test positiv, K = Patient krank
T̄ = Test negativ, K̄ = Patient nicht krank
❖ Bivariate Analyes
❖ Korrelation
❖ Rangkorrelation
❖ Bayes-Theorem
❖ Kontingenztafeln
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
Kontingenztafel:
Personen
Test positiv (rp + fp )
Test negativ (fn + rn )
krank (rp + fn )
richtig positiv (rp )
falsch negativ (fn )
gesund (fp + rn )
falsch positiv (fp )
richtig negativ (rn )
֒→ Sensitivität: Wie gut erkennt der Test Personen, die tatsächlich
krank sind? P (T |K), geschätzt durch rp /(rp + fn )
֒→ Spezifität: Wie gut erkennt der Test Personen, die tatsächlich
gesund sind? P (T̄ |K̄), geschätzt durch rn /(rn + fp )
֒→ Positiver prädiktiver Wert: P (K|T ), geschätzt durch rp /(rp + fp )
֒→ Negativer prädiktiver wert: P (K̄|T̄ ), geschätzt durch rn /(rn + fn )
IT-Stat – 46
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
2. Epidemiologie
Prof. Dr. Bernhard Schipp
IT-Stat – 47
Relatives Risiko (RR)
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Eine andere Form der Kontingenztafel ermöglicht eine Untersuchung
des Zusammenhangs zwischen einem Ereignis (z.B. krank/Nicht krank)
mit einer Exposition (z.B. Raucher/Nichtraucher)
•
Das relative Risiko beschreibt dann die Erkrankungswahrscheinlichkeit
einer exponierten Gruppe relativ zur Erkrankungswahrscheinlichkeit einer
nicht exponierten Gruppe.
•
RR = (Inzidenz der Exponierten) / (Inzidenz der Nichtexponierten)
•
Die Inzidenz einer Erkrankung ist die Anzahl neuer Krankheitsfälle, die in
einem bestimmten Zeitraum auftreten, bezogen auf die Bevölkerung mit
gleichem Erkrankungsrisiko.
Exposition
Ja
Nein
Ereignis
Ja Nein
a
b
c
d
a+b
c+d
a/(a + b)
• Relatives Risiko:
c/(c + d)
Prof. Dr. Bernhard Schipp
IT-Stat – 48
Relatives Risiko (RR)
1. Basiswissen Statistik
Beispiel:
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Raucher
Ja
Nein
Lungenkrebs
Ja
Nein
90
9910
40
19960
10000
20000
• Risiko der Raucher: 90 von 10000 oder 0.009%
• Risiko der Nichtraucher: 40 von 20000 oder 0.002%
• Verhältnis des Risikos der Raucher zu dem der Nichtraucher ist das
relative Risiko
• Relatives Risiko: [90/10.000]/[40/20000] = 4.5
• Interpretation: Raucher haben das 4.5-fache Risiko eines
Nichtrauchers, Lungenkrebs zu bekommen.
Prof. Dr. Bernhard Schipp
IT-Stat – 49
RR: Einsatz und Interpretation
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Einsatz
• Das relative Risiko ist nur in prospektiven Studien (Kohortenstudien)
eine zulässige Größe.
• In retrospektiven Case-Control-Studien ist es nicht zulässig, das
relative Risiko zu berechnen.
Interpretation
• RR = 1 Das Risiko der Exponierten ist gleich groß wie das Risiko
der Nichtexponierten
• RR > 1 Das Risiko der Exponierten ist größer als das Risiko der
Nichtexponierten (Exposition = Risikofaktor)
• RR < 1 Das Risiko der Exponierten ist kleiner als das Risiko der
Nichtexponierten (Exposition = Protektiver Faktor)
Prof. Dr. Bernhard Schipp
IT-Stat – 50
Chancenverhältnis: Odds Ratio (OR)
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Prof. Dr. Bernhard Schipp
• Das OR beschreibt die Quote des Expositionsfaktors unter den
Erkrankten relativ zur Quote unter den Gesunden
• OR = (Expositionsquote der Erkrankten) / (Expositionsquote der
Gesunden)
• Die Expositionsquote ist das Verhältnis der Anzahl Exponierter zur
Anzahl Nichtexponierter (unter den Erkrankten bzw. unter den
Gesunden).
a/c
• Odds Ratio:
b/d
IT-Stat – 51
Odds Ratio: Beispiel
1. Basiswissen Statistik
Beispiel:
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
Raucher
Ja
Nein
Lungenkrebs
Ja
Nein
Fall(Case) Kontrolle)
60
50
40
150
• Die Raucherquote unter den Lungenkrebspatienten beträgt 60 : 40
oder 3 : 2.
• Die Raucherquote unter den Gesunden beträgt 50 : 150 oder 1 : 3.
• Das Odds Ratio ist das Verhältnis der Raucherquote der Erkrankten
zur Raucherquote der Gesunden.
• Numerisch: Odds Ratio = (60/40)/(50/150) = 4.5
• Interpretation: Die Chance, unter Lungenkrebspatienten einen
Raucher anzutreffen, ist 4.5mal so hoch wie unter den Gesunden.
Prof. Dr. Bernhard Schipp
IT-Stat – 52
Zusammenhang: Relatives Risiko (RR) und
Odds Ratio (OR)
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
• Das Odds Ratio kann sowohl in prospektiven Kohortenstudien wie
auch in retrospektiven Case-Control-Studien berechnet werden.
• Das Odds Ratio dient häufig als Schätzung für das relative Risiko.
• Das Odds Ratio ist nicht dasselbe wie das relative Risiko.
֒→ Achtung: In Fall-Kontroll-Studien kann das relative Risiko gar nicht
berechnet werden, da die Erkrankungshäufigkeit (Anzahl der Fälle)
vom Untersucher vorgegeben ist.
Wann ist OR ein guter Schätzer für RR?
• Wenn die Fälle und Kontrollen im Hinblick auf die
Expositionsanamnese repräsentativ sind für alle Menschen mit bzw.
ohne diese Erkrankung in der Population.
• Wenn die untersuchte Krankheit selten auftritt.
Prof. Dr. Bernhard Schipp
IT-Stat – 53
RR vs. OR: Beispiel
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Exposition
Anhang: Wichtige
Verteilungen
Ja
Nein
Erkrankung
Ja
Nein
200 9800
100 9900
10000
10000
200/10000
=2
• Relatives Risiko:
100/10000
200/100
= 2.02
• Odds Ratio:
9800/9900
Warum?
Das RR:
a
a+b
c
c+d
ist annähernd gleich dem OR:
a
b
c
d
... falls a sehr viel kleiner als b und c sehr viel kleiner als d ist.
Prof. Dr. Bernhard Schipp
IT-Stat – 54
RR vs. OR
1. Basiswissen Statistik
2. Epidemiologie
❖ Grundbegriffe
3. Statistische Inferenz
Bei häufigen Krankheiten ist das Odds Ratio kein guter Schätzer für das
relative Risiko.
Beispiel:
Anhang: Wichtige
Verteilungen
Exponiert
Ja
Nein
Erkrankung
Ja
Nein
50
50
25
75
100
100
• Relatives Risiko: [50/100]/[25/100] = 2
• Odds Ratio: [50/25]/[50/75] = 3
PS: Die Erläuterungen zu RR und OR sind angelehnt an ein
Schnellrepetitorium von E. Kvas, Hermesoft, Biostatistik und Data
Management, [email protected]
Prof. Dr. Bernhard Schipp
IT-Stat – 55
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
3. Statistische Inferenz
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 56
Zufallsvariablen
1. Basiswissen Statistik
2. Epidemiologie
• Definition:
Eine Zufallsvariable (ZV) ist eine Größe deren Ausprägung
durch den Zufall bestimmt wird.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Interpretation: Verallgemeinert den generischen
Variablenbegriff zu jedweder Art von Variable
Notation: Üblicherweise in Großbuchstaben X, Y ...
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
• Beispiele: ZV’s als Output mathematischer Funktionen deren Input
zufälliger Natur ist.
i)
ii)
log(C) wobei C Glukosekonzentration im Blut.
BM I := M/H 2 für Größe und Gewicht einer zufällig
ausgewählten Person.
iii) Mittelwert und Standardabweichung von n zufällig
ausgewählten Personen.
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 57
Verteilungsfunktion
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
• Definititon:
Die Wahrscheinlichkeitsverteilung FX (x) einer ZV X weist
den Ausprägungen respektive den Ausprägungsintervallen
besagter ZV eine Zahl zwischen 0 und 1 zu.
֒→ Diskrete ZV: Nimmt nur abzählbar viele Zustände/Ausprägungen
an. Das heißt, die Output-Menge ist durch N, Z oder jede endliche
Menge gegeben. Einzelne Werte können mit einer
Wahrscheinlichkeit belegt werden
֒→ Stetige ZV: Nimmt überabzählbar viele Zustände/Ausprägungen
an. Das heißt, die Output-Menge ist durch R, C gegeben. Nur
Intervalle können mit einer Wahrscheinlichkeit belegt werden.
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
Area = Probability that X
attains a value in (a, b]
Graph of density function
❖ KQ-Residuen
❖ Modellgüte
Total area under curve = 1
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
a
b
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 58
Normalverteilung
1. Basiswissen Statistik
2. Epidemiologie
• Viele -aber nicht alle- realen Zufallsphänomene weisen eine
Dichtefunktion mit der Gestalt einer Gauss’schen Dichte auf.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
kσ − rule
+
+
+
− (x − µ)2
1
ϕµ, σ(x) =
exp

2
2σ
σ 2π


≈ 68.3 %
≈ 95.4 %
≈ 99.7 %
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
µ − 3σ
µ − 2σ
µ−σ
µ
µ+σ
µ + 2σ
µ + 3σ
• Notation X ∼ N (µ, σ 2 )
• N (µ, σ 2 ) ist eindeutig durch die Parameter bestimmt.
• N (0, 1) heißt Standardnormalverteilung.
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 59
Normalverteilung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
• Anmerkung: Die Normalverteilung spielt innerhalb der statistischen
Theorie eine große Rolle, da diese Verteilung oft per Annahme
vorausgesetzt wird und sich zudem die Qualität vieler statistischer
Verfahren auf diese Annahme stützt.
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
• Explorative Werkzeuge um Normalität aufzuzeigen:
i)
ii)
Histogramm: sollte annähernd Glockengestalt aufweisen.
Boxplot: sollte nahezu symmetrisch sein und nur wenige
Ausreißer aufweisen.
iii) Normal QQ-Plot: sollte nahezu linearen Verlauf haben.
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 60
Normalverteilung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
• Realdaten-Beispiel: Anorexia nervosa
Therapieeffekt ist durch Gewichtsveränderung (in Pfund) bei
weiblichen Patienten gegeben, wobei
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
Gewichtsänderung = Gewicht post-therapeutisch−Gewicht prä-therapeutisch
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
Daten
n Min.
17 -5.3
1. Q.
3.9
Raw data
Mean
7.3
Histogram
3. Q.
11.4
Boxplot
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Modellgüte
❖ Standardfehler
St. dev.
7.2
Normal q−q plot
−2
❖ Regression
❖ KQ-Residuen
Max.
21.5
Theoretical quantiles
−1
0
1
2
❖ Unabhängigkeitstest
Med.
9.0
−5
0
5
10 15 20
−10
0 5
15
25
−5
0
5
10 15 20
−5
0 5 10 15 20
Sample quantiles
Weight change [pounds]
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 61
QQ-plot
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
• Falls x(1) ≤ x(2) ≤ · · · ≤ x(n) geordnete Beobachtungen von
unabhängig normal-verteilten ZV’s darstellen, dann gibt es eine
approximativ lineare Beziehung zwischen dem empirischen i/n
Quantil x(i) und dem theoretischen (i − 0.5)/n Quantil einer
standard-normal-verteilten ZV.
֒→ Ein Plot, der empirische gegen theoretische Quantile abträgt, sollte
eine Punktewolke zeigen, die nahezu einen linearen Verlauf hat,
falls die Beobachtungen aus einer N (µ, σ 2 )-verteilten
Grundgesamtheit stammen.
❖ Unabhängigkeitstest
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
Details: Scatter plot bezüglich
i − 0.5
x(i) , Φ−1
n
wobei Φ−1 die Inverse der Verteilungsfunktion der Standardnormalverteilung darstellt.
Normal q−q plot
Theoretical quantiles
−1
0
1
❖ Parametrische Tests
❖ Nichtparametrische
Tests
4.4
4.6
4.8 5.0 5.2
Sample quantiles
5.4
IT-Stat – 62
1. Basiswissen Statistik
2. Epidemiologie
1.0
Andere Verteilungen
3. Statistische Inferenz
❖ Verteilungen
0.8
❖ Zufallsvariablen
❖ QQ-Plot
Normal(0, 1)
Cauchy(0, 1) (heavier tails)
Uniform (−1,1) (lighter tails)
Exponential(1) (skewed right)
Lognormal(1, 1) (skewed right)
❖ Parameterschätzung
❖ Konfidenzintervalle
0.6
❖ Zentraler Grenzwertsatz
❖ Hypothesentests
❖ Stichprobenumfang
❖ Wahl des Testverfahrens
0.4
❖ Teststärke
❖ Anpassungstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
0.2
❖ Unabhängigkeitstest
❖ Varianzanalyse
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
0.0
❖ Multiple Vergleiche
−4
−2
0
2
4
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 63
Parameterschätzung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
• Szenario: Eine zufällig gezogene Stichprobe aus einer
N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor.
• Ziel: Schätze µ und behandle σ 2 wie einen Störparameter.
• Bekannt: X̄ ist ein guter Punktschätzer, da
n→∞
X̄ −−−−→ µ,
n→∞
V ar(X̄) −−−−→ 0
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
• Wie gut X̄ das macht, zeigt das folgende Beispiel einer simulierten
Stichprobenverteilung für X̄ für größer werdendes n.
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 64
Parameterschätzung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
Sample number
❖ Zentraler Grenzwertsatz
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
n=1
x
n=5
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
µ
µ
n = 20
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
µ
Measurement scale
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 65
Zentraler Grenzwertsatz
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
- X1 , X2 , . . . , Xn ... n unabhängige identisch verteilte ZV mit
Erwartungswert µ und Varianz σ 2
- wenn n gegen unendlich wächst (n → ∞), konvergiert die
Verteilung des Stichprobenmittels X̄ gegen eine Normalverteilung
mit Erwartungswert µ und Varianz σ 2 /n.
2
σ
X̄n→∞ ∼ N µ,
n
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
- Folgerung:
√
n(X̄ − µ)
X̄ − µ
√ =
∼ N (0, 1)
Z=
σ
σ/ n
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
- Wird σ durch s geschätzt ändert sich die Grenzverteilung etwas
√
X̄ − µ
n(X̄ − µ)
√ =
t=
∼ tn−1
s
s/ n
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 66
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
• Man sieht, dass in den meisten Fällen X̄ 6= µ gilt. Selbst wenn
X̄ = µ wäre, würde man es nicht wissen, da µ unbekannt ist.
• Frage: Wie groß ist |X̄ − µ|
• Ziel: Entwickle einen Intervallschätzer, der den wahren Parameter
der Population mit einer vorspezifizierten Wahrscheinlichkeit 1 − α
beinhaltet.
• Lösung: Konfidenzintervall (KI) mit Irrtumswahrscheinlichkeit α,
wobei α üblicherweise mit 0.1, 0.05, 0.01 angesetzt wird.
• Anmerkung: Die Breite des KI’s zeigt den Schätzfehler auf.
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 67
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
• Szenario: Eine zufällig gezogene Stichprobe aus einer
N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor.
• Exaktes KI für den Parameter µ
σ̂
σ̂
KIµ(1−α) := X − tn−1,1−α/2 · √ ; X + tn−1,1−α/2 · √
n
n
wobei
v
u
u
σ
b=t
n
1 X
(Xi − X)2
n − 1 i=1
und tk,γ das γ-Quantil der t-Verteilung mit k := n − 1
Freiheitsgraden ist.
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 68
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
(1−α)
• Eigenschaften von KIµ
i) Zentriert und symmetrisch um X̄
ii) Breite = 2 · tn−1,1−α/2 · √σ̂n hängt ab von 1 − α, σ̂ and n:



1 − α, desto größer 

Je größer σ̂,
desto größer ist die Breite.




n,
desto kleiner
iii) Das theoretische KI ist zufällig, da X̄, σ̂ ZV’s sind. Das
numerische KI ist deterministisch, da x̄, s Realisationen der ZV’s
X̄, σ̂ sind.
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 69
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
• Beispiel (Anorexia nervosa):
Punktschätzungen:
n
17
x
7.3
s
7.2
Ziel: 90 % KI bezüglich µ (erwartete Gewichtsänderung), wobei
·
tn−1,1−α/2 = t16,0.95 = 1.746
Es ergibt sich:
s
x − tn−1,1−α/2 · √ ; x + . . .
n
7.2
·
=
7.3 − 1.746 · √ ; 7.3 + . . . = [4.2; 10.4]
17
• Rundungsregel für KI’s: Untere/Obere KI-Grenze wird immer
ab/aufgerundet.
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 70
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
• Warnung: Eine Interpretation der Art
„Das wahre µ ist mit einer Wahrscheinlichkeit von 90% zwischen
4.2 and 10.4”
ist nicht zulässig, da das numerische KI eine Realisation des
Konfidenzintervallschätzers ist.
• Entweder enthält das konkrete KI den wahren Parameter der
Population oder nicht, d.h. die Wahrscheinlichkeit ist entweder 1
oder 0, aber nicht 90%.
• Korrekt wäre:
(1 − α) · 100 % aller KI’s bezüglich aller Stichproben überdecken
den wahren Parameter der Grundgesamtheit.
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 71
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
• Trefferrate des KI’s für 2 × 200 simulierten N (µ, σ 2 )-Verteilungen
3. Statistische Inferenz
Sample size (each): n = 5
❖ Zufallsvariablen
❖ Verteilungen
5
❖ QQ-Plot
4
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
Theoretical level: 0.95
Empirical level (= hit rate): 0.945
3
µ2
❖ Hypothesentests
1
❖ Stichprobenumfang
0
❖ Teststärke
❖ Wahl des Testverfahrens
0
❖ Anpassungstest
5
❖ Parametrische Tests
❖ Nichtparametrische
Tests
4
❖ Multiple Vergleiche
❖ Regression
40
60
Sample size (each): n = 50
❖ Unabhängigkeitstest
❖ Varianzanalyse
20
µ
80
100
120
Theoretical level: 0.95
140
160
180
200
Empirical level (= hit rate): 0.95
3
2
1
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
0
0
20
40
60
80
100
120
140
160
180
200
Sample number
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 72
Konfidenzintervalle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
• Szenario: Eine zufällig gezogene Stichprobe aus einer
N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor.
• Exaktes KI für den Parameter σ 2
#
"
2
2
(n − 1)σ̂
(n − 1)σ̂
(1−α)
;
:=
KIσ2
χ2n−1;1−α/2 χ2n−1;α/2
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
wobei χ2k;γ das γ-Quantil der χ2 -Verteilung mit k Freiheitsgraden
darstellt.
• Interessante Anwendung:
(1−α)
Die obere Grenze von KIσ2
(Pilotstudie) kann als σ ∗ für eine
Stichprobenumfangsabschätzung genutzt werden.
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 73
Hypothesentests, Allgemeines
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
• Eher informell:
1a
Eine Vermutung wird abgelehnt, um auf das Gegenteil zu schließen.
1b
Sammle sinnvolle aber zufallsbehaftete Informationen.
1c Sinnvolles Auswerten der Informationen, um ggfs. Evidenz für die
Gegenvermutung zu erhalten.
1d
• Eher formell:
2a
Teste sich gegenseitig ausschließende Hypothesen H0 vs. H1 .
2b
Adäquate Entwicklung eines Experimentes oder sorgfältige
durchgeführte Beobachtungsstudie mit gut definierten ZV’s.
2c
Verwende eine Teststatistik T (X1 , X2 , ...), deren zufälliges Verhalten
unter H0 bekannt ist und sich von dem unter H1 unterscheidet.
2d
Entscheide, ob die Ausprägung von T (X1 , X2 , ...) groß genug ist und
damit Abweichungen des unter H0 hypothesierten Wertes nicht mehr
als zufällig zu erachten sind.
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
Entscheide, ob genug Evidenz vorliegt, um die Vermutung abzulehnen.
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 74
Hypothesentests, Allgemeines
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
• Versuch einer Analogie: Strafrechtlicher Prozess
Es gilt die Unschuldsvermutung.
Der Staatsanwalt versucht, die Schuld des Angeklagten zu
beweisen.
Indizien (Evidenz) werden gesammelt.
Das Gericht entscheidet mit Hilfe der gesammelten Indizien, ob
der Angeklagte schuldig ist oder nicht.
• Fundamentales Prinzip: Nicht genug Indizien führen zum
Freispruch. „In dubio pro reo” entspricht hier also der Nullhypothese.
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 75
Hypothesentests, Fehlertypen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
Test decision
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
• Zu ∗:
-
Lehne H0 ab, obwohl die Hypothese wahr ist (Falscher Alarm).
-
Wahrscheinlichkeit eines Typ I Fehlers entspricht genau α.
-
Die Irrtumswahrscheinlichkeit ist unter Kontrolle des Anwenders.
• Zu ∗∗:
-
Lehne H0 nicht ab, obwohl die Nullhypothese nicht wahr ist.
-
Wahrscheinlichkeit eins Typ II Fehlers wird mit β notiert. Bei
1 − β spricht man auch von der Stärke eines statistischen
Signifikanztests.
-
β ist meistens nicht unter Kontrolle des Anwenders und
gewöhnlich unbekannt.
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
Reject H0
Do not reject H0
Unknown truth
H0 is true
H0 is false
√
Type I error ∗)
√
Type II error ∗∗)
IT-Stat – 76
Hypothesentests, Fehlertypen
1. Basiswissen Statistik
2. Epidemiologie
• Illustration des Fehlers 2. Art (rot) und des Fehlers 1. Art (blau)
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
Der Fehler 2. Art hängt von µ ab. Je dichter das wahre µ bei dem
unter der Nullhypothese angenommen Wert liegt, desto größer ist
dieser Fehler. Da µ bei Annahme der Alternativhypothese nicht
bekannt ist, kann die Wahrscheinlichkeit für den Fehler zweiter Art
nicht berechnet werden.
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 77
Hypothesentests: Interpretation
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
• Nehmen Sie an, dass α hinreichend klein ist:
֒→
Schließen sie auf die Richtigkeit von H1 , wenn H0 abgelehnt
werden kann. Die Entscheidung ist verlässlich, da die
Irrtumswahrscheinlichkeit klein ist. Das Testergebnis ist
statistisch signifikant.
֒→
Falls H0 nicht abgelehnt werden kann, schließen Sie daraus,
dass nicht genug Evidenz vorliegt, welche H1 unterstützt. Diese
Entscheidung ist nicht zuverlässig, da der assoziierte Fehler
unbekannt und womöglich groß ist.
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
• Zusammenfassung:
Ein statistischer Signifikanztest ist i.d.R. ein Werkzeug, um eine
Nullhypothese zu verwerfen, aber nicht um diese zu bestätigen.
Die Aussage, die bestätigt werden soll, sollte in der
Alternativhypothese enthalten sein. Merke auch: ein
statistischer Signifikanztest ist kein formaler Beweis.
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 78
Hypothesentests, Durchführung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
• Wählen Sie zwei sich ausschließende Arbeitshypothesen und
spezifizieren Sie α.
• Erheben Sie Daten und prüfen Sie, ob annähernd normalverteilte
Daten vorliegen (EDA;Chi-Quadrat-Test).
• Wählen Sie dann auf Basis der Verteilung einen parametrischen
oder nichtparametrischen Test. Dieser ist in Form einer Teststatistik
gegeben, welche eine bekannte Verteilung unter H0 hat und dazu
tendiert, (absolut) große Werte anzunehmen, falls H1 wahr ist.
• Berechnen Sie den konkreten Wert der Teststatistik und vergleichen
sie ihn mit dem kritischen Wert der Verteilung der Teststatistik.
• Alternativ: geben Sie den zugehörigen p-Wert an (p-Wert: minimale
Irrtumswahrscheinlichkeit, bei der H0 gerade noch abgelehnt
werden kann).
• Lehnen Sie H0 ab, falls der p-Wert kleiner als α ist.
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 79
Stichprobenumfang
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
• Zur Erinnerung:
σ̂
X − tn−1,1−α/2 · √ ; X + . . .
n
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
• Frage: Wie viele Beobachtungen sind notwendig, um eine
vorspezifizierte Breite ∆ einzuhalten.
❖ Stichprobenumfang
❖ Teststärke
σ̂
2tn−1,1−α/2 · √ ≤ ∆,
n
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
umgestellt
2
σ̂
n ≥ 2tn−1,1−α/2 ·
∆
• Probleme:
-
Nur implizite Lösung bezüglich n.
σ̂ ist zufällig und daher im Vorfeld unbekannt.
Selbst wenn für σ̂ ein „gutes” Surrogat existiert und n
determiniert werden kann, würde nur der Erwartungswert des
immer noch zufälligen KI’s kleiner ∆ sein.
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 80
Stichprobenumfang, Beispiel
1. Basiswissen Statistik
2. Epidemiologie
֒→ Lege α und 1 − β (Power) fest. Standard: α = 5% und (1 − β) = 80%
3. Statistische Inferenz
❖ Zufallsvariablen
n≥
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
2
s 2
n ≥ 2 tn−1,1−α/2 + tn−1,1−β/2 ·
∆
❖ Stichprobenumfang
❖ Parametrische Tests
❖ Nichtparametrische
Tests
σ̂
2 tn−1,1−α/2 + tn−1,1−β/2 ·
∆
֒→ Praxis: ersetze σ̂ durch die Schätzung s, d.h.
❖ Hypothesentests
❖ Unabhängigkeitstest
●
Beispiel:
֒→ Wie viele Wassermelonen sind notwendig, um ein KI bezüglich des
erwarteten Gewichts zu erhalten, das 1 − α = 0.9 und 1 − β = 0.8
für ∆ ≤ 0.3kg aufweist?
n > 295
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 81
Stichprobenumfang, Zusammenfassung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
• Folgende Größen werden zur Fallzahlschätzung benötigt:
-
primäre Variable
Null- und Alternativhypothese
Testverfahren
minimal zu erreichender relevanter Unterschied
Abschätzung der Standardabweichung für die primäre Variable
Fehler 1. Art
Power
• Der nachzuweisende Unterschied basiert auf einer fachlichen
Einschätzung des minimalen klinisch relevanten Effektes oder des
erwarteten Effektes einer neuen Behandlung.
• Die Fallzahl ist umso höher, je kleiner der Fehler 1. Art, je höher die
Power, je kleiner der nachzuweisende Unterschied und je größer die
Standardabweichung.
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 82
Teststärke
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
• Zur Erinnerung: Für jeden statistischen Test H0 vs. H1 gilt:
-
α Wahrscheinlichkeit eines Typ I Fehlers.
β Wahrscheinlichkeit eines Typ II Fehlers.
• Ziel: Die Wahrscheinlichkeit bezüglich jeder Fehlentscheidung so
gering wie möglich halten.
• Definition: Die Teststärke (Power) ist durch 1 − β gegeben, also
durch die Wahrscheinlichkeit H0 abzulehnen, wenn H1 tatsächlich
wahr ist.
• Fakten:
-
Der Typ I Fehler ist unter Kontrolle.
Der Typ II Fehler ist nicht unter Kontrolle.
Hohe Teststärke ⇔ Kleine Wahrscheinlichkeit eines Typ II
Fehlers.
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 83
Teststärke
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
• Für ein festgesetztes α und einem typischerweise unbekanntem σ
beantwortet die Powerfunktion im Prinzip drei Fragen:
i)
Sei n und das wahre ∆ 6= 0 vorgelegt: Wie groß ist die Power
1 − β, um dieses wahre ∆ aufzudecken?
ii) Sei eine Teststärke von 1 − β und das wahre ∆ 6= 0 vorgelegt:
wie groß muss n sein, um das wahre ∆ mit einer
Wahrscheinlichkeit von 1 − β aufzudecken?
iii) Sei n und das wahre 1 − β vorgelegt: Welches ist das kleinste
∆, das mit einer Wahrscheinlichkeit von 1 − β aufgedeckt
werden kann.
• Anmerkung: Auch hier wird eine Grobschätzung von σ benötigt.
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 84
Teststärke, Beispiel
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
• Beispiel: Gewicht von Wassermelonen
Hypothese: µ0 = 5.3kg
Die Nullhypothese kann bei einem arithmetischen Mittel von 5.1
zum Niveau 0.05 nicht abgelehnt werden (p = 0.2598). Wie hoch ist
die Power für diesen Ein-Stichproben-t-Test?
-
Geforderter Mittelwert |∆| := |µ0 | ≥ 0.2.
Stichprobe: n = 20, α = 0.05 und σ ∗ = 0.77
֒→ Power für vorgelegtes n = 20 und |∆| = 0.2 (mit σ = 0.77 and
α = 5 %) ist 0.197.
֒→ Stichprobengröße für vorgelegtes 1 − β = 80 % und |∆| = 0.2 (with
σ = 0.77 and α = 5 %) ist 119.
֒→ Kleinstes ∆ für vorgelegtes 1 − β = 80 % and n = 20 (with σ = 0.77
and α = 5 %) ist 0.51.
• Berechnungen erfolgen etwa mit G∗Power oder via R mit Hilfe des
Befehls power.t.test(· · · ).
IT-Stat – 85
Tests der Lageparameter
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
• 1 Stichprobe (mind. ordinales Messniveau):
NV
Einstichproben
t-test
nicht NV
Wilcoxons
Vorzeichen
rang-test
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
• mehrere Stichproben (mind. ordinales Messniveau):
Anzahl der Stichproben
❖ Wahl des Testverfahrens
❖ Anpassungstest
2
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
NV
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
nicht NV
unabh.
Zweistichprobent-Test
Wilcoxons
Rangsummentest
p>2
abh.
Einstichprobent-Test
Wilcoxons
Vorzeichenrang-test
unabh.
ANOVA
KruskalWallis
test
abh.
ANOVA
mit Messwiederholungen
Friedmantest
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 86
Allgemein
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 87
Chi-Quadrat-Anpassungstest
1. Basiswissen Statistik
2. Epidemiologie
Fragestellung: Ist die Annahme eines bestimmten Verteilungsmodells
gerechtfertigt oder nicht?
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
Vorgehensweise:
- Vergleich von beobachteten und erwarteten Häufigkeiten:
Oi ... beobachtete Anzahl bei Ausprägung i
Ei ... erwartete Anzahl aus der Verteilungsannahme
- Modifikation der Differenz Oi − Ei in eine χ2 -verteilte Variable:
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
χ2 =
X (Oi − Ei )2
i
Ei
- der χ2 -Wert ist stets positiv
- große Werte von χ2 offenbaren nicht vernachlässigbare
Abweichungen von der unterstellten Verteilung
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 88
Unabhängigkeitstest
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Fragestellung: Sind 2 kategorielle Variablen mit je 2 Ausprägungen als
unabhängig anzusehen?
Beispiel (Vierfeldertafel): Unterscheidet sich in einer Firma die
Arbeitszufriedenheit von Frauen und Männern?
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
Beobachtete Häufigkeiten:
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
Frauen
Männer
Zufrieden
102 (a)
89 (c)
Nicht zufrieden
234 (b)
170 (d)
Randhäufigkeiten:
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
Frauen
Männer
Gesamt
Zufrieden
102
89
191
Nicht zufrieden
234
170
404
Gesamt
336
259
595
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 89
Unabhängigkeitstest
1. Basiswissen Statistik
Erwartete Häufigkeiten:
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
Frauen
Männer
Zufrieden
(191*336)/595=108
(191*259)/595=83
Nicht zufrieden
(404*336)/595=228
(404*259)/595=176
Berechnung der Teststatistik:
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
χ2 = [(102 − 108)2 /108] + [(89 − 83)2 /83] + [(234 − 228)2 /228] + [(170 −
176)2 /176] = 1.12
❖ Unabhängigkeitstest
Vereinfachte Formel:
❖ Parametrische Tests
❖ Nichtparametrische
Tests
χ2 =
N (|ab−cd|)
(a+b)(c+d)(a+c)(c+d) ,
bzw. mit Stetigkeitskorrektur nach Yates (bei
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
kleinen Stichprobenumfängen)
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
2
χ =
N (|ab−cd|− N
2 )
(a+b)(c+d)(a+c)(c+d) .
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 90
Einstichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
Beispiel:
Behauptung: (Nullhypothese)
Wassermelonen wiegen im Schnitt 5.5 kg
d.h. H0 : µ0 = 5.5
Mögliche Alternativen:
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
A : H1 :
B : H1 :
C : H1 :
µ 6= 5.5
µ < 5.5
µ > 5.5
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 91
Einstichproben-t-Test
1. Basiswissen Statistik
Beispiel:
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
H0 : µ = 5.5 = µ0
H1 : µ 6= 5.5
Irrtumswahrscheinlichkeit: α = 0.05
- Vorgehensweise: ZV X: “Gewicht“ , n = 20
- Annahme:
X ∼ N (µ0 ; σ 2 )
Rechtfertigt die Information in der Stichprobe diese Aussage der
Nullhypothese über µ?
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 92
Einstichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
• Lösung:
Nach dem Zentralen Grenzwertsatz (ZGWS) ist:
3. Statistische Inferenz
❖ Zufallsvariablen
σ2
X̄ ∼ N (5.5; )
n
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
Schätze die unbekannte Varianz σ 2 durch s2 . Im Beispiel: s2 = 0.6
Es gilt:
❖ Teststärke
T =
❖ Wahl des Testverfahrens
❖ Anpassungstest
√
n
X̄ − µ0
s
ist t(n−1) -verteilt.
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
• Intuitv:
-
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
-
lehne H0 ab, falls X̄ (Mittelwert der Stichprobe)
„zu weit“ von µ0 = 5.5 entfernt ist.
→ oder was identisch
√ ist:
0
lehne H0 ab, falls n X̄−µ
„zu groß“
s
IT-Stat – 93
Einstichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
• Hier:
Teststatistik T =
√
5.1 − 5.5
= |−2.32|
0.77
= t(19,0.025) = 2.093
20
• kritischer Wert: t(n−1,α/2)
d.h. |T | „zu groß“.
• p-Wert: p = 0.0314
• KI bezüglich des Erwartungswertes: [4.73; 5.46].
⇒ lehne H0 ab: D.h. es kann nicht davon ausgegangen werden, dass
das Durchschnittsgewicht der Wassermelonen gleich 5.5 kg ist.
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 94
Einstichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
• Achtung: Je weniger Daten, desto unsicherer die Entscheidung.
-
Beispiel:
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
n = 10 , X̄ = 5.1 , s2 = 0.6
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
T = |−1.64| < t(9,0.025) = 2.26
d.h. lehne H0 nicht ab.
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 95
Zweistichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
• Effekt einer toxischen Substanz auf den Erwartungswert des
Nierengewichts von Ratten.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
• Zwei Zufallsstichproben von n1 = 13 (Placebo-Gruppe) und n2 = 18
(Verum-Gruppe).
• Annahme: Das individuelle Nierengewicht ist in beiden Gruppen
i = 1, 2 unabhängig N (µi , σ 2 )-verteilt.
• Hypothesen informal: H0 : Verum hat keinen Effekt vs. H1 : Verum
hat einen Effekt.
• Hypothesen formal: H0 : µ1 = µ2 vs H1 : µ1 6= µ2 .
• Irrtumswahrscheinlichkeit α = 0.05.
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 96
Zweistichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
Mögliches Szenario
für
Normaldichten
unter H1 .
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
µ1
❖ Stichprobenumfang
µ2
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
• Für zwei unabhängige, normalverteilte Stichproben mit gleicher
Varianz (Homoskedastie) eignet sich der zweiseitige
Zwei-Stichproben-t-Test
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
T := s
1
1
+
n1
n2
X −Y
(n1 −
1)σ̂12
+ (n2 −
n1 + n2 − 2
1)σ̂22
∼ t(n1 + n2 − 2)
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 97
Zweistichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
• Datentabelle
ID
R01
R02
R03
R04
R05
R06
R07
R08
R09
R10
R11
R12
R13
R14
R15
R16
Group
Verum
Placebo
Verum
Verum
Placebo
Verum
Placebo
Verum
Placebo
Verum
Verum
Verum
Placebo
Placebo
Placebo
Placebo
Weight
2.15
1.56
1.96
2.49
2.30
1.83
2.01
2.12
1.71
1.89
2.03
2.43
1.69
1.92
1.69
1.76
ID
R17
R18
R19
R20
R21
R22
R23
R24
R25
R26
R27
R28
R29
R30
R31
Group
Verum
Placebo
Verum
Placebo
Placebo
Verum
Verum
Verum
Placebo
Verum
Verum
Verum
Verum
Placebo
Verum
Weight
2.10
1.88
1.88
1.93
1.96
2.19
2.37
2.38
1.97
2.00
2.25
2.00
2.05
1.63
2.15
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 98
1. Basiswissen Statistik
Boxplots and raw data
Normal q−q plot: Placebo
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
Placebo
Verum
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
Sample Quantiles
2.1
2.3
❖ Zentraler Grenzwertsatz
• EDA:
Placebo
Verum
Min.
1.560
Min.
1.830
Normal q−q plot: Verum
1.9
❖ Parameterschätzung
1.6
❖ QQ-Plot
Sample Quantiles
1.8
2.0
2.2
❖ Verteilungen
1.6
❖ Zufallsvariablen
Weight [g]
1.8 2.0 2.2
3. Statistische Inferenz
2.4
2. Epidemiologie
2.5
Zweistichproben-t-Test
−1.5
−0.5
0.5
1.5
Theoretical Quantiles
1st Qu.
1.690
1st Qu.
2.000
Median
1.880
Median
2.110
−2
Mean
1.847
Mean
2.126
−1
0
1
Theoretical Quantiles
3rd Qu.
1.960
3rd Qu.
2.235
2
Max.
2.300
Max.
2.490
• σ̂1 = 0.1995990 (Placebo) und σ̂2 = 0.1953018 (Verum)
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 99
Zweistichproben-t-Test
1. Basiswissen Statistik
2. Epidemiologie
• EDA zeigt, dass die Annahmen bezüglich des zweiseitigen
Zwei-Stichproben-t-Test erfüllt sind.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
• Teststatistik:
T := s
1
1
+
n1
n2
X −Y
(n1 − 1)σ̂12 + (n2 − 1)σ̂22
n1 + n2 − 2
= −3.8919
• Freiheitsgrade: n1 + n2 − 2 = 29.
• p-value: p = 0.0005362.
• KI bezüglich der Differenz der Erwartungswerte: [−0.43; −0.13].
• Testentscheidung: Lehne H0 ab, da p < α, respektive weil 0 nicht im
KI bezüglich der Differenz der Erwartungswerte enthalten ist.
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 100
Welch-Satterthwaite-Test
1. Basiswissen Statistik
2. Epidemiologie
• Annahme: Population ist normalverteilt aber heteroskedastisch
(verschiedene Streuung)
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
σ1 ≠ σ2
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
µ1
µ2
• Falls µ1 − µ2 von Interesse, können Sie den modifizierten
Welch-Test nutzen.
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 101
Welch-Satterthwaite-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
• Irrtumswahrscheinlichkeit α = 0.05.
• Teststatistik
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
t := q
X1 − X2
s21
n1
❖ Anpassungstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
n2
• Freiheitsgrade (Welch-Satterthwaite-Gleichung):
❖ Wahl des Testverfahrens
❖ Unabhängigkeitstest
+
= −3.8777
s22
df := ν :=
s21
n1
s41
n21 ·(n1 −1)
+
+
s22
n2
2
s42
n22 ·(n2 −1)
= 25.669
• p-value: p = 0.0006538.
• KI bezüglich θ: [−0.43; −0.13].
• Testentscheidung: Lehne H0 ab, da p < α, respektive 0 nicht im KI
bezüglich θ enthalten ist.
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 102
Wilcoxons Tests
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
• Vorteil:
-
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
-
Annäherend „normalverteilte“ Daten werden nicht
vorausgesetzt.
Tests sind sehr einfach durchzuführen
Auch „Rangmerkmale“ wie z.B. Schulnoten können „getestet“
werden.
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 103
Die Idee des Wilcoxon-Vorzeichenrangtests
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
- Dieser Test wird angewendet, falls es sich um paarige (abhängige)
Messreihen handelt oder eine Hypothese über den Median einer
Stichprobe überprüft werden soll
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
Beispiel:
eine Variable wird an einer Person zu verschiedenen Zeitpunkten
gemessen (z.B. vor und nach medikamentöser Behandlung)
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 104
Beispiel:
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
Für den Test werden 10 Personen nach ihrem Urteil über die
Verträglichkeit zweier Behandlungen A und B mit Hilfe einer
Bewertungsskala von 1 (sehr gut) bis 5 (sehr schlecht) gefragt.
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
Person Nr.
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
1
2
3
4
5
6
7
8
9
10
Produkt
A
B
5
3
1
2
3
2
3
3
4
2
1
3
2
3
4
2
5
1
4
1
Differenz
2
−1
1
0
2
−2
−1
2
4
3
Rang (unabhängig
vom Vorzeichen)
5.5
(−)2
2
−
5.5
(−)5.5
(−)2
5.5
9
8
Summe der plus - Ränge: 35.5 und Summe der minus - Ränge: 9.5
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 105
Testentscheidung
1. Basiswissen Statistik
●
je besser die Beurteilung von Produkt B:
2. Epidemiologie
✦
✦
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
●
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
●
●
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
●
desto größer die Summe der plus - Ränge
desto kleiner die minus - Summe der Ränge
Verwerfung der Nullhypothese: Median der Differenzen von A und B
= Null, wenn die kleinere der beiden Summen zu klein ist.
der kritische Wert (Tabelle oder Software) ist c = 6 bei α = 5%
die Summe der minus - Ränge (9.5) unterschreitet den kritischen
Wert von 6 nicht,
d.h. Produkt B wird nicht signifikant besser bewertet als Produkt A
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 106
Wilcoxon Rangsummentest
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
• Annahme: Population ist nicht normalverteilt, Verteilung
unterscheidet sich nur um einen „shift” und ist stetig für jede
Gruppe.
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
θ
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
• Für Hypothesen bzgl. θ kann ein nichtparametrischer Lagetest, z.B.
der Wilcoxon Rangsummentest (Mann-Whitney’s U-Test) benutzt
werden.
IT-Stat – 107
Wilcoxon Rangsummentest
1. Basiswissen Statistik
Vergleich zweier unabh. Stichproben
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
- benötigt keine Normalverteilungsannahme, setzt aber stetig
verteilte Daten voraus
- verwendet nur die Ränge der Beobachtungen der gemeinsamen
Stichprobe:
- die kleinste Beobachtung erhält Rang 1; die größte Beobachtung
erhält Rang n1 + n2
- Testidee basiert auf der Annahme: falls (hypothetisch) alle Daten
der ersten Stichprobe kleinere Werte als die der zweiten Stichprobe
habem, ist (logischwerweise) die Summe der Ränge in der ersten
Stichprobe kleiner als die Summe der Ränge in der zweiten
Stichprobe
- Teststatistik:
X
W =
Ränge der ersten Stichprobe
- Nullhypothese: H0 : M edian1 = M edian2
- Alternativhypothese: H0 : M edian1 6= M edian2
IT-Stat – 108
Wilcoxon Rangsummentest
1. Basiswissen Statistik
2. Epidemiologie
• Effekt einer toxischen Substanz auf den Erwartungswert des
Nierengewichts von weiblichen Laborratten.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
• Zwei Zufallsstichproben von n1 = 13 (Placebo-Gruppe) und n2 = 18
(Verum-Gruppe).
• Annahme: Das Nierengewicht ist unabhängig in und über die
Gruppen hinweg stetig verteilt. Beide Gruppen weisen die gleiche
Verteilung auf, die sich lediglich um einen shift-Parameter
unterscheidet.
• Hypothesen informal: H0 : Verum hat keinen Effekt vs.
H1 : Verum hat einen Effekt.
• Hypothesen formal: H0 : M edian1 = M edian2 vs
H0 : M edian1 6= M edian2 .
• Irrtumswahrscheinlichkeit α = 0.05.
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 109
Wilcoxon Rangsummentest
1. Basiswissen Statistik
2. Epidemiologie
• Hilfsmittel: Ränge, d.h.
Rang 1
Rang n
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
kleinste Beobachtung
größte Beobachtung
Falls 2 oder mehr Beob. identisch sind wählt man mittlere Ränge.
• Wie entscheidet man?
Intuitiv:
-
Je höher die Ränge in der „Verum“ Stichprobe, desto mehr
spricht dies gegen H0 .
• Test: Zweiseitiger Wilcoxon Rangsummentest
❖ Varianzanalyse
❖ Multiple Vergleiche
≡
≡
Wn1 ,n2 :=
n1
X
i=1
R(Xi )
approx
∼
N
n1 (n2 + n1 + 1) n2 n1 (n2 + n1 + 1)
;
2
12
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 110
Wilcoxon Rangsummentest
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
• Datentabelle
ID
R01
R02
R03
R04
R05
R06
R07
R08
R09
R10
R11
R12
R13
R14
R15
R16
Group
Verum
Placebo
Verum
Verum
Placebo
Verum
Placebo
Verum
Placebo
Verum
Verum
Verum
Placebo
Placebo
Placebo
Placebo
Weight
2.15
1.56
1.96
2.49
2.30
1.83
2.01
2.12
1.71
1.89
2.03
2.43
1.69
1.92
1.69
1.76
Rank
23.5
1
13.5
31
27
7
18
22
5
10
19
30
3.5
11
3.5
6
ID
R17
R18
R19
R20
R21
R22
R23
R24
R25
R26
R27
R28
R29
R30
R31
Group
Verum
Placebo
Verum
Placebo
Placebo
Verum
Verum
Verum
Placebo
Verum
Verum
Verum
Verum
Placebo
Verum
Weight
2.10
1.88
1.88
1.93
1.96
2.19
2.37
2.38
1.97
2.00
2.25
2.00
2.05
1.63
2.15
Rank
21
8.5
8.5
12
13.5
25
28
29
15
16.5
26
16.5
20
2
23.5
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 111
Wilcoxon Rangsummentest
1. Basiswissen Statistik
2. Epidemiologie
• Teststatistik: Summiere die Ränge der Verum-Gruppe
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
Wn1 ,n2 :=
n1
X
R(Xi ) = 370
i=1
• p-value: p = 0.001098.
• KI bezüglich θ: [−0.44; −0.13].
• Testentscheidung: Lehne H0 ab, da p < α, respektive 0 nicht im KI
bezüglich θ enthalten ist.
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 112
Varianzanalyse, ANOVA
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Varianzanalyse (Vergleich von mehr als zwei Stichproben)
Parametrische Lösungen:
Die Idee des F-Tests
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
- p Stichproben mit möglicherweise unterschiedlichen
Stichprobenumfängen n1 , ..., np
- die i-te Stichprobe folgt einer N (µi , σ 2 )-Verteilung:
unbekannter Erwartungswert µi
Varianz σ 2 > 0
- diese Parameter sollten in allen Stichproben annähernd gleich sein
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 113
F-Test
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
- Test der Nullhypothese:
H0 : µ1 = ... = µp
gegen
H1 : mindestens zwei Erwartungswerte sind verschieden
- Verwerfung von H0 , falls
die Differenz zwischen den Stichprobenmitteln hinreichend groß ist
die Streuung in den p Stichproben nicht zu groß ist
- Grundkomponente des Tests:
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
M ST =
p
X
i=1
ni (ȳi. − ȳ.. )2 /(p − 1)
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
ȳi. ... Stichprobenmittel der i-ten Stichprobe
ȳ.. ... Mittelwert aller Beobachtungen
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 114
F-Test
1. Basiswissen Statistik
- zweite Komponente:
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
M SE =
p X
ni
X
i=1 j=1
(yij − ȳi )2 /(N − p)
yij ... Beobachtungen
ȳi ... Mittelwert der jeweiligen Stichprobe
- Ablehnung von H0 , falls
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
M ST
> Fp−1,N −p;1−α
M SE
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 115
Nichtparametrische Anova
1. Basiswissen Statistik
Nichtparametrische Lösung:
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Der Kruskal-Wallis-Test
- nichtparametrisches Gegenstück zur einfachen ANOVA
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
Idee des Tests:
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
- Verwerfung von H0 , falls sich die aus der Gesamtstichprobe
berechneten Ränge der i-ten Stichprobe zu sehr unterscheiden
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
KW =
1
C
p
X
12
1 2
τi. − 3(N + 1)
N (N + 1) i=1 ni
!
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 116
Kruskal-Wallis Test
1. Basiswissen Statistik
wobei
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
g
X
1
C =1− 2
t3l − tl
N (N − 1)
l=1
eine Korrekturgröße ist
g ... Anzahl unterschiedlicher Werte mit Häufigkeiten τi und tl
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
- Falls H0 in diesem Test verworfen wird, gibt es signifikante
Unterschiede zwischen den Stichproben.
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 117
Erweiterungen der einfachen Varianzanalyse:
Zweifachklassifikation
1. Basiswissen Statistik
2. Epidemiologie
Einfachklassifikation: Gibt es Unterschiede zwischen den µi in I
Populationen?
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
yij = µ + αi + uij wobei uij ∼ N (0, σ 2 ), αi = µi − µ0 und
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
I
X
αi = 0.
i=1
Zweifachklassifikation: Ergänzung des Modells um weitere (qualitative)
Faktoren βj und Wechselwirkungen (αβ)ij
❖ Wahl des Testverfahrens
yijk = µ + αi + βj + (αβ)ij + uijk .
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
mit
I
X
i=1
αi = 0,
J
X
j=1
βj = 0 und
I
X
i=1
(αβ)ij =
J
X
(αβ)ij = 0
j=1
und i ∈ {1, 2, · · · , I}, j ∈ {1, 2, · · · , J}, k ∈ {1, 2, · · · , K}.
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 118
ANCOVA und repeated measurements
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Bei der Kovarianzanalyse wird in ein varianzanalytisches Modell
zusätzlich ein quantitativer Faktor xij einbezogen:
yij = µ0 + αi + γj xij + uij .
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
xij besteht oftmals aus dem Baseline-Werten von y.
Falls eine Datenerhebung (an gleichen Untersuchungseinheiten) zu T
Zeitpunkten erfolgt bietet sich ein rep. measurements Modell an:
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
yijt = µ + αi + θt + (γθ)it + πj(i) + uijt .
Die zeitlichen Abhängigkeiten werden über eine Kovarianzmatrix
modelliert, die z.B. eine autorgressive Struktur 1. Ordnung haben kann,
d.h. z.B. für T = 4:

 2
2
3
σ1 σ1 σ2 ρ σ1 σ2 ρ σ1 σ2 ρ
2 
2

σ
σ
ρ
σ
σ
ρ
σ
1
2
1
2
2
.
Cov(yj ) = 
2

σ1 σ2 ρ 
σ3
σ42
IT-Stat – 119
Multiplizität
1. Basiswissen Statistik
2. Epidemiologie
• Problematik:
Werden mehrere Hypothesentests auf derselben Datenbasis
durchgeführt, steigt die Wahrscheinlichkeit dafür, mindestens eine
dieser Hypothesen fälschlicherweise abzulehnen, weit über die für den
Fehler 1. Art festgesetzte Grenze.
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
• Beispiel:
Angenommen, es werden 5 Mittelwerte durch paarweise t-Tests zum
5%-Niveau miteinander verglichen. Dann beträgt die Anzahl der
Vergleiche 5(5 − 1)/2 = 10. Unter der Voraussetzung, dass die
Vergleiche unabhängig sind, lässt sich eine Obergrenze für die
gesamte Fehlerrate des Experimentes ableiten:
1 − (1 − 0.05)10 = 0.40
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
• Konsequenz:
a)
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
b)
Der kritische Wert, der für die Signifikanz überschritten muss, muss
erhöht werden (multiple Vergleiche).
Die Fehlerrate für die paarweisen Vergleiche muss gesenkt werden, um
die Fehlerrate des gesamten Experimentes unter 5% zu halten (p-Wert
IT-Stat – 120
Adjustierung).
Multiple Vergleiche
1. Basiswissen Statistik
Simultane (multiple) Vergleiche mehrerer Erwartungswerte
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
- Aufdeckung von Unterschieden in den Erwartungswerten bei mehr
als zwei Stichproben
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
Scheffé- und Tukey-Test
- Berechnung der Differenzen der Mittelwerte
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
Ȳi. − Ȳj.
für jedes Paar (i, j), i < j
- der Unterschied ist signifikant, falls er eine Grenzdifferenz übersteigt
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 121
Multiple Vergleiche
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
Scheffé-Test
- setzt normalverteilte Daten voraus
- kann auch auf Stichproben unterschiedlichen Umfangs angewendet
werden
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
- Grenzdifferenz:
s
F SDα =
(p − 1) · M SE ·
1
1
+
ni
nj
· Fp−1,N −p;1−α
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 122
Multiple Vergleiche
1. Basiswissen Statistik
Tukey-Test
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
- anwendbar auf:
normalverteilte Daten
Stichproben mit gleicher Länge
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
- Grenzdifferenz:
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
HSDα =
r
M SE
· qp,N −p;1−α
n
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
α ... Signifikanzniveau
qp,N −p ... Studentisierte Spannweite
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 123
Multiple Vergleiche
1. Basiswissen Statistik
Fisher’s Least Significant Difference-Test (LSD)
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
- falls der F -Test in der ANOVA H0 verwirft, Berechnung der
Differenz:
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
t−1
N −p,1−α/2
s
M SE
1
1
+
ni
nj
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
MSE-Wert der entsprechenden ANOVA-Tabelle
- Entscheidung auf signifikante Unterschiede für jedes Paar, falls
s
1
1
+
M SE
|Ȳi . − Ȳj .| > t−1
N −p,1−α/2
ni
nj
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 124
Multiple Vergleiche
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
Dunnett-Test
- Idee: Vergleich verschiedener Faktoren (Einflußgrößen) mit einem
Standardfaktor µ1
- Test der (p − 1) Differenzen µp − µ1 ,
µp−1 − µ1 , · · · , µ2 − µ1 auf Signifikanz
Vorgehensweise:
1.
-
alle Stichproben haben den gleichen Umfang n:
Vergleich der Mittelwerte |µ̂i − µ̂1 | mit DSDp−1,α
r
2
DSDp−1,α = s ·
· |d|p−1,ν;1−α
n
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
|d|p−1,ν;1−α aus entsprechenden Tabellen
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 125
Multiple Vergleiche
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
2.
-
Standardbehandlung vom Umfang m > n:
korr
Berechnung der neuen Grenzdifferenz DSDp−1,α
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
korr = s ·
DSDp−1,α
r
1
1
+ · |d|p−1,ν;1−α
m n
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
h
wp−1,ν;1−α n i
· 1+
1−
100
m
wp−1,ν;1−α ... Korrekturgröße; ν = N − p
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 126
p-Wert Adjustierung
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
Bonferroni-Holm-Prozedur
- Berechnung der p-Werte für alle möglichen paarweisen Vergleiche
(Zwei-Stichproben-t-Tests oder Wilcoxon-Rangsummen-Test)
- Ordnung der p-Werte in aufsteigender Folge
- Entscheidung auf signifikante Unterschiede, falls der kleinste p-Wert
α etc.
,
der
zweitkleinste
kleiner
als
kleiner ist als α
c
c−1
(c ...Anzahl der paarweisen Tests)
- dieser Test übersteigt das globale Signifikanzniveau α nicht
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 127
Bivariate Analyse: Regression
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
• Situation: Metrische bivariate Datenstruktur mit nahezu linearem
Zusammenhang (rp > 0.5 und rP signifikant von Null verschieden).
• Frage: Wie groß sind Steigung und Achsenabschnitt einer
(optimalen) Geraden im Modell yt = β1 + β2 xt + ut ?
• Antwort: Geschätzte KQ-Regressionsfunktion ŷt = β̂1 + β̂2 xt
❖ Hypothesentests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
β̂2 : Geschätzte
erwartete
Steigung. Erklärt den
durchschnittlichen
Zuwachs in y, falls x um
eine Einheit steigt.
10 12 14 16 18
❖ Parametrische Tests
❖ Nichtparametrische
Tests
y(x) = −1.1 + 0.11 * x
8
❖ Unabhängigkeitstest
Regression line:
6
❖ Anpassungstest
Deaths due to prostate cancer vs. fat intake
r P = 0.885
4
❖ Wahl des Testverfahrens
β̂1 : Geschätzter erwarteter
Achsenabschnitt. Erklärt
die
durchschnittliche
Ausprägung von y falls
x = 0.
2
❖ Teststärke
No. of Deaths per 100000
❖ Stichprobenumfang
30
40
50
60
70
80
90
110
130
150
Average fat intake (in grams/day)
IT-Stat – 128
KQ-Schätzer
1. Basiswissen Statistik
2. Epidemiologie
• Lösung des Kleinste-Quadrate-Minimierungsproblems führt zu
folgenden Schätzfunktionen:
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
β̂1 (yt , xt , T ) =: β̂1
❖ QQ-Plot
= ȳ − β̂2 x̄
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
β̂2 (yt , xt , T ) =: β̂2
=
T
X
t=1
(yt − ȳ)(xt − x̄)
T
X
t=1
(xt − x̄)2
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 129
KQ-Residuen
1. Basiswissen Statistik
2. Epidemiologie
• Es ist nun möglich, den (unbekannten) Fehler ut durch ût
(Residuum) folgendermaßen zu schätzen:
3. Statistische Inferenz
❖ Zufallsvariablen
ût = yt − β̂1 − β̂2 xt
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
•
Die Varianz des Fehlers ut ist generell unbekannt, kann aber
geschätzt werden durch:
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
T
X
1
c
û2t
σu2 =
T − 2 t=1
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 130
Streuungszerlegung und Bestimmtheitsmaß
1. Basiswissen Statistik
2. Epidemiologie
• Man kann zeigen, dass im einfachen linearen Modell mit
Absolutglied die sog. Streuungszerlegung gilt:
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
T
X
t=1
|
(yt − ȳ)2 =
{z
≡T SS
}
T
X
t=1
|
(ŷt − ȳ)2 +
T
X
≡ESS
≡RSS
{z
}
û2t
t=1
| {z }
• Über die Streuungszerlegung gelangt man zum Bestimmtheitsmaß:
RSS
ESS
=1−
R =
T SS
T SS
2
• Eigenschaften von R2 im linearen Regressionsmodell mit
Absolutglied:
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
R2 ∈ [0; 1] und
2
R2 = ryx
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 131
t-Tests; Standardfehler
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
• Die Fehlervarianz σu2 ist i.d.R. unbekannt: verwende daher zum
Testen die geschätzten Standardfehler se(β̂i ):
v
u
T
u
X
u σ
v
x2t
u
u cu2
c2
u
u
σ
t=1
u
u
u
se(β̂1 ) = u T
, se(β̂2 ) = u T
uX
u X
2
t
tT
(xt − x̄)
(xt − x̄)2
t=1
t=1
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 132
t-Tests für β1 und β2
1. Basiswissen Statistik
1. Festlegung der Irrtumswahrscheinlichkeit α und der Hypothesen:
2. Epidemiologie
i)
ii)
iii)
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
H0 : βi = βi∗
H0 : βi ≤ βi∗
H0 : βi ≥ βi∗
❖ Stichprobenumfang
⇒
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
H1 : βi 6= βi∗ (zweiseitiger Test)
H1 : βi > βi∗ (einseitiger Test)
H1 : βi < βi∗ (einseitiger Test)
3. Berechnung der Teststatistik:
❖ Hypothesentests
❖ Anpassungstest
vs.
vs.
vs.
tβi
β̂i − βi∗
:=
∼ t(T −2)
se(β̂i )
4. Ermittlung des kritischen Wertes tT −2,1− α2 .
5. Testentscheidung: sollte |tβi | > tT −2,1− α2 , kann die Nullhypothese
abgelehnt werden, d.h. βi ist signifikant von βi∗ verschieden.
6. Alternativ: Lehne H0 ab, falls der p-Wert < 0.05
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
●
Anmerkung: Die Standardwerte von βi∗ sind Null. Besonders wichtig
ist der Test von H0 : β2 = β2∗ = 0
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 133
Modellvarianten
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
• Modellvarianten: Logarithmische Modelle:
= β 1 + β 2 x t + ut
(log-lin-Modell)
yt
= β1 + β2 ln xt + ut
(lin-log-Modell)
ln yt
= β1 + β2 ln xt + ut
(log-log-Modell)
ln yt
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 134
Erweiterungen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
❖ QQ-Plot
• Power-Modell:
yt = β1 + β2 xpt + ut
wobei p bekannt sei.
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
֒→ Je nach Definition von p, ergeben sich die folgenden Spezialfälle
des Power-Modells:
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
yt
= β1 + β2 x2t + ut
yt
= β1 + β2
yt
√
= β 1 + β 2 x t + ut
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
1
+ ut
xt
(x-Quadrat-Modell)
(Reziprokes Modell)
(Wurzelmodell)
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 135
Box-Cox-Modelle
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
• Box-Cox-Transformation:
(p)
yt
❖ Verteilungen
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
(p)
yt
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
(q)
xt
(q)
= β1 + β2 xt
 yp −1
 tp ,
:=

ln yt ,
 xp −1
 tq ,
:=

ln xt ,
+ ut
falls p 6= 0,
falls p = 0.
falls q 6= 0,
falls q = 0.
֒→ Die Exponenten p, q können aus den Daten geschätzt werden und
ermöglichen damit eine Auswahl zwischen linearen und
nichtlinearen Modellen.
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
IT-Stat – 136
Logistische Regression
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
❖ Zufallsvariablen
❖ Verteilungen
Das Logit-Modell
• Sei yt ∈ {0, 1} und xt beliebig. Dann kann der Zusammenhang
zwischen yt und xt dargestellt werden über
❖ QQ-Plot
❖ Parameterschätzung
❖ Zentraler Grenzwertsatz
❖ Konfidenzintervalle
❖ Hypothesentests
❖ Stichprobenumfang
❖ Teststärke
❖ Wahl des Testverfahrens
❖ Anpassungstest
❖ Unabhängigkeitstest
❖ Parametrische Tests
❖ Nichtparametrische
Tests
❖ Varianzanalyse
❖ Multiple Vergleiche
❖ Regression
❖ KQ-Residuen
❖ Modellgüte
❖ Standardfehler
❖ t-Tests
❖ Modellvarianten
❖ Box-Cox-Modelle
❖ Logistische Regression
Anhang:
Wichtige
Prof. Dr.
Bernhard Schipp
Verteilungen
F (yt ) =
1
1
=
1 + exp(−β1 − β2 x)
1 + e−β1 −β2 x
• Bei F (yt ) handelt es sich um die Verteilungsfunktion der
logistischen Verteilung, die eine stärkere Streuung als die
Normalverteilung besitzt.
• Sei β1 + β2 xt abgekürzt durch zt . Dann erhält man für F (yt ) mit
1
ein lineares Modell der Form:
pt =
1 + exp(−zt )
pt
Lt = ln
= β1 + β2 xt
1 − pt
p
• Die Größe Lt = 1 −t p wird auch Logit genannt.
t
IT-Stat – 137
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
Anhang: Wichtige Verteilungen
Prof. Dr. Bernhard Schipp
IT-Stat – 138
Diskrete Verteilungen
1. Basiswissen Statistik
Diskrete Verteilungen
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Binomialverteilung
• Poisson-Verteilung
• Negative Binomialverteilung
Prof. Dr. Bernhard Schipp
IT-Stat – 139
Diskrete Verteilungen
1. Basiswissen Statistik
Binomialverteilung
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Wurde erstmals 1713 von Jakob Bernoulli in Ars Conjectandi
veröffentlicht.
• Ergebnis von n voneinander unabhänigigen wiederholten
Experimenten mit nur zwei möglichen Ausgängen.
• Entspricht einer „Urnenziehung mit Zurücklegen”.
• Anwendungen: geheilt/nicht geheilt; UAW´s ja/nein
Prof. Dr. Bernhard Schipp
IT-Stat – 140
Diskrete Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Wahrscheinlichkeitsfunktion :
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
P (X = x) = fX (x|p; n) =
❖ Stetige Verteilungen
mit
n
x
n
x
n!
=
x!(n − x)!
px (1 − p)n−x =: B(p; n)
und
x ∈ {1; 2; ...; n}
• Der Parameter p gibt die jeweilige Erfolgswahrscheinlichkeit an.
Prof. Dr. Bernhard Schipp
IT-Stat – 141
Diskrete Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
Sollte sich die Anzahl der Versuche auf n = 1 reduzieren,
spricht man von einer
Bernoulliverteilung:
❖ Stetige Verteilungen
P (X = x) = fX (x|p) = px (1 − p)1−x =: B(p)
• Verteilungsfunktion einer B(p; n)-Verteilten Zufallsvariablen :
P (X ≤ x) = FX (x|p) =
Prof. Dr. Bernhard Schipp
x X
n
k=0
k
pk (1 − p)n−k
IT-Stat – 142
Diskrete Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Erwartungswert und Varianz einer B(p; n)-Verteilten
Zufallsvariablen X:
E(X) = np
und
V ar(X) = np(1 − p)
• Diese Verteilung besitzt die sog. Reproduktionseigenschaft. Es gilt:
d
B(p; n1 ) + B(p; n2 ) → B(p; n1 + n2 )
iid
• Approximation für np(1 − p) > 9: X ∼ N (np; np[1 − p])
iid
• Approximation für n ≥ 50, p ≤ 0, 1 und np ≤ 10: X ∼ P s(np)
Prof. Dr. Bernhard Schipp
IT-Stat – 143
Diskrete Verteilungen
1. Basiswissen Statistik
Poisson-Verteilung
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Wurde von Poisson 1837 veröffentlicht. Die eigentliche Herleitung
aus einer Sequenz von binomialverteilten ZV’s wurde bereits von
Moivre 1711 in „De Mensura Sortis” gegeben.
iid
Es gilt für X ∼ B(p; n) und w ⊂ IN0 :
limn→∞;np→λ
X
w
BX (p; n) =
X e−λ λx
w
x!
=: P s(λ) = FX (x|λ) = P (X ≤ x)
• Wichtig: n wird „groß” und np bleibt endlich und hinreichend klein”!
• Daraus folgt: Anwendungen liegen bei der Erfassung von seltenen
( λ klein) Ereignissen in großen Grundgesamtheiten (n groß).
Prof. Dr. Bernhard Schipp
IT-Stat – 144
Diskrete Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
• Erste bekannte Anwendung (1898) „Tod durch
Hufschlag bei der preußischen Armee” und „Selbstmord von
Kindern unter zehn Jahren”.
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Erwartungswert und Varianz einer P s(λ)-Verteilten
Zufallsvariablen X:
E(X) = λ
und
V ar(X) = λ
• Diese Verteilung besitzt die sog. Reproduktionseigenschaft. Es gilt:
d
P s(λ1 ) + P s(λ2 ) → P s(λ1 + λ2 )
iid
• Approximation für λ ≥ 10: X ∼ N (λ; λ)
Prof. Dr. Bernhard Schipp
IT-Stat – 145
Diskrete Verteilungen
1. Basiswissen Statistik
Negative-Binomialverteilung
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Ergebnis von k voneinander unabhänigigen wiederholten
Experimenten mit geometrischer Verteilung. Die Wahrscheinlichkeitsfunkion ist gegeben durch:
k+x−1
px (1 − p)k
fX (x|p; k) = P (X = x) =
k−1
x ∈ IN0
η, k > 0
• Fragestellung:
Wie hoch ist die Wahrscheinlichkeit nach k − 1 Erfolgen im k − 1 + x-ten
Versuch den k-ten Erfolg zu erzielen (x = 1, 2, ...)?
Prof. Dr. Bernhard Schipp
IT-Stat – 146
Diskrete Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
3. Statistische Inferenz
• Erwartungswert und Varianz einer nB(p, k)-Verteilten
Zufallsvariablen X:
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
E(X) =
kp
1−p
V ar(X) =
kp
kp
= E(X)
>
2
(1 − p)
1−p
Wird für Zähldatenmodelle verwendet
in denen die zu erwartende Varianz grösser als der Erwartungswert ist .
Prof. Dr. Bernhard Schipp
IT-Stat – 147
Stetige Verteilungen
1. Basiswissen Statistik
Stetige Verteilungen
2. Epidemiologie
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Gleich-,Normal- und Lognormalverteilung
• Gamma-/χ2 - und Exponentialverteilung
• ,t-, F-, Weibull- und Extremwertverteilung
Prof. Dr. Bernhard Schipp
IT-Stat – 148
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Gleichverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Auch häufig unter dem Namen Rechteckverteilung zu finden.
• Dichtefunktion der gleichverteilten ZV X:
fX (x|a, b) =
Prof. Dr. Bernhard Schipp
1
b−a
0
f ür
sonst
a≤x≤b
IT-Stat – 149
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Erwartungswert und Varianz einer gleichverteilten ZV X:
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
b+a
E(X) =
2
und
(b − a)2
V ar(X) =
12
• Für b = 1 und a = 0 ist diese Verteilung ein Spezialfall der
allgemeineren Betaverteilung:
fX (x|a, b) = Z
0
Prof. Dr. Bernhard Schipp
1
1
xa−1 (1 − x)b−1 dx
xa−1 (1 − x)b−1
0≤x≤1
IT-Stat – 150
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Normalverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Faltet man die Gleichverteilung „oft genug” so erhält man im
Limit die von C.F. Gauß hergeleitete Normalverteilung. Die Dichte
hat folgende Darstellung:
2
(x − µ)
1
2
+
exp −
;
x
∈
I
R;
µ×σ
∈
I
R×I
R
fX (x|µ, σ 2 ) = √
2σ 2
2πσ
• Erwartungswert und Varianz einer normalverteilten ZV X:
E(X) = µ
Prof. Dr. Bernhard Schipp
und
V ar(X) = σ 2
IT-Stat – 151
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Lognormalverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
Dichtefunktion:
2
1
(lnx
−
µ
)
1
∗
+
2
+
exp −
;
x
∈
I
R
;
µ
×σ
∈
I
R×I
R
fX (x|µ∗ , σ∗2 ) = √
∗
∗
2σ∗2
2πσ∗ x
• Erwartungswert und Varianz einer lognormalverteilten ZV X:
E(lnX) = µ∗
Prof. Dr. Bernhard Schipp
und
V ar(lnX) = σ∗2
IT-Stat – 152
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Gammaverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Für die Modellierung von Warteschlangen in stetiger Zeit wird
häufig auf die Gammaverteilung oder auf deren Spezialfälle unter
bestimmten Parameterkonstellationen zurückgegriffen.
• Die Dichte ist durch folgenden Ausdruck gegeben:
λr r−1
x exp{−λx}
fX (x|λ, r) =
Γ(r)
• Wobei Γ(r) =
Z
∞
x ∈ IR+ ;
λ×r ∈ IR+ ×IR+
xr−1 exp{−x}dx die Gammafunktion
0
mit Funktionsargument r ist.
Prof. Dr. Bernhard Schipp
IT-Stat – 153
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Erwartungswert und Varianz einer gammaverteilten ZV X:
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
r
E(X) =
λ
und
r
V ar(X) = 2
λ
❖ Stetige Verteilungen
• χ2 -Verteilung
• Für die Paramaterkonstellation fX (x|0.5; 0.5k) ergibt sich die
χ2 -Verteilung:
0.5k/2 k/2−1
x
exp{−0.5x}
fX (x|k) =
Γ(k/2)
x ∈ IR+ ;
k ∈ IR+
• Die Dichte einer χ2 -Verteilung ergibt sich auch aus der
Summe von quadrierten N (0; 1)-verteilten Zufallsvariablen.
Prof. Dr. Bernhard Schipp
IT-Stat – 154
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Exponentialverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Für die Paramaterkonstellation fX (x|λ; 1) ergibt sich die
Exponentialverteilung:
fX (x|λ) = λexp{−λx}
x ∈ IR+ ;
λ ∈ IR+
• Erwartungswert und Varianz einer exponentialverteilten ZV X
verhalten sich analog zur Gammaverteilung mit r = 1, bzw.
für eine χ2 -verteilte ZV X mit r = 0.5k und λ = 1.
Prof. Dr. Bernhard Schipp
IT-Stat – 155
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• t-Verteilung (Student)
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
iid
iid
• Sei X ∼ N (0; 1) und Y ∼ χ2 (k) voneinander unabhängige
Zufallsvariablen, so folgt die unten angeführte Funktion einer
zentralen t-Verteilung mit k Freiheitsgraden.
X
W =p
∼ tk
Y /k
• Die Dichtefunktion ist gegeben durch:
fW (w|k) =
Γ[(k + 1)/2] 1
1
dw
·√ ·
2
(k+1)/2
Γ(k/2)
kπ (1 + w /k)
w ∈ IR;
k ∈ IR
• Erwartungswert und Varianz einer t-verteilten ZV W :
E(W ) = 0
Prof. Dr. Bernhard Schipp
f ür
k>1
und
V ar(W ) =
k
k−2
f ür
k>2
IT-Stat – 156
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• F-verteilung (Fisher)
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
iid
iid
• Seien X ∼ χ2 (m) und Y ∼ χ2 (n) voneinander unabhängige
Zufallsvariablen, so folgt die nachstehende Funktion einer
zentralen F -Verteilung mit m; n Freiheitsgraden.
X/m
∼ F(m;n)
R=
Y /n
• Die Dichtefunktion ist gegeben durch:
r (m−2)/2)
Γ[(m + n)/2] m m/2
·
fR (r|m; n) =
Γ[m/2]Γ[n/2] n
[1 + (m/n)r](m+n)/2
m × n ∈ IN × IN
und
r ∈ IR+
• Erwartungswert und Varianz einer F -verteilten ZV R:
Prof. Dr. Bernhard Schipp
n
E(W ) =
n−2
f ür
n>2
und
2n2 (m + n − 2)
V ar(W ) =
m(n − 2)2 (n − 4)
IT-Stat – 157
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Weibullverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Ein weiteres Instrument zur Verweildaueranalyse ist die
Weibullverteilung. Die Dichte hat folgende Gestalt:
fX (x|a; b; c) =
c
b
x−a
b
c−1
a × b × c ∈ IR × IR+ × IR+
c x−a
exp −
b
und
x≥a
• Erwartungswert und Varianz einer weibullverteilten ZV X:
1
E(X) = a + bΓ 1 +
c
2
1
V ar(X) = b2 Γ 1 +
− Γ2 1 +
c
c
Prof. Dr. Bernhard Schipp
IT-Stat – 158
Stetige Verteilungen
1. Basiswissen Statistik
2. Epidemiologie
• Extremwertverteilung
3. Statistische Inferenz
Anhang: Wichtige
Verteilungen
❖ Diskrete Verteilungen
❖ Stetige Verteilungen
• Die Dichte hat folgende Gestalt:
x−α
;
fX (x) = exp −exp −
β
α × β ∈ IR × IR+
• Erwartungswert und Varianz einer extremwertverteilten ZV X:
E(X) = a + bγ
und
π2β 2
V ar(X) =
6
• Wobei γ ≈ 0.577216 die Euler-Konstante darstellt.
Dieses Skript basiert anteilig auf einem englischsprachigen Kompendium. Wir danken
Herrn Dr. Gerrit Eichner, Universität Giessen, für die freundliche Unterstützung.
Prof. Dr. Bernhard Schipp
IT-Stat – 159
Herunterladen