Schweizerische Studienstiftung: Intellectual Tool Essentielle Konzepte der Statistik Prof. Dr. Bernhard Schipp Balsthal, März 2016 Prof. Dr. Bernhard Schipp IT-Stat – 1 Übersicht 1. Basiswissen Statistik 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz 2. Epidemiologie Anhang: Wichtige Verteilungen 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp IT-Stat – 2 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp 1. Basiswissen Statistik IT-Stat – 3 Grundlagen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Struktur einer Beobachtungsstudie - ❖ Korrelation ❖ Rangkorrelation ֒→ Stichprobenziehung: Mehrere Verfahren möglich. ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie - 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp Grundgesamtheit: Menge aller Individuen/Untersuchungsobjekte. erzeugt Stichprobe, im Idealfall repräsentativ. ֒→ Informationsaggregation von Merkmalen/Variablen - Überblick anhand deskriptiver Statistiken bzw. graphischer/numerischer explorativer Datenanalyse. - Basis zur inferentiellen Statistik, welche Rückschlüsse auf die Grundgesamtheit zulässt. IT-Stat – 4 Grundlagen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Struktur eines geplanten statistischen Experiments: - ❖ Korrelation ❖ Rangkorrelation Festlegung der Grundgesamtheit (Population), worauf bezieht sich die Studie? ֒→ Stichprobenziehung, Sicherstellung der Repräsentativität durch Auswahlverfahren. ֒→ Randomisierte Gruppenzuweisung (verschiedene Möglichkeiten) ֒→ Verblindung (reduziert systematische Fehler) ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen - generiert i.d.R. homogene Behandlungsgruppen (Kontrollgruppe, Gruppe A, Gruppe B,...). von Interesse: Effekte der Gruppen (Faktoren) auf die interessierenden Zielgrößen. ֒→ Datenmaterial Prof. Dr. Bernhard Schipp erlaubt Überblick anhand deskriptiver Statistiken und graphischer/numerischer explorativer Datenanalyse. dient als Basis der inferentiellen Statistik kann helfen, Kausalitäten zwischen Faktoren und Response-Variablen zu erarbeiten. IT-Stat – 5 Grundlagen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Variablen und Datentypen - ❖ Korrelation Variablen := [A, X]. Realisationen := [a1 , ...an , x1 , ...xn ]. ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie ֒→ ֒→ Diskret: Zähldaten wie Anzahl der Arztbesuche, Nachkommen Stetig: Körpergröße, Zeitdauer, Konzentrationsfähigkeit ֒→ Qualitativ (Kategorial), nicht-numerische Ausprägungen, immer diskret. Quantitativ, numerische Ausprägungen, diskret oder stetig 3. Statistische Inferenz Anhang: Wichtige Verteilungen ֒→ Prof. Dr. Bernhard Schipp ֒→ Nominal: z.B. Geschlecht, Blutgruppe können nicht angeordnet werden. ֒→ Ordinal: Rangordnungen, können angeordnet werden, Differenzenbildung macht aber i.d.R. keinen Sinn, z.B. Schulnoten ֒→ Intervall: Differenzenbildung macht Sinn, Verhältnisbildung nicht, z.B. Zeit, Temperatur ֒→ Verhältnis: Intervalldaten mit absolutem Nullpunkt, z.B. IT-Stat – 6 Preise Grundlagen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • Von Interesse: Verteilung der Daten: mögl. Ausprägungen und deren proportionales Auftreten: ֒→ ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp ֒→ Stichprobenverteilung (empirische Verteilung) → bekannt. Populationsverteilung → unbekannt, muss oft durch eine Annahme festgelegt werden oder wird aus den Daten geschätzt. • Darstellungsmethoden: Tabellen, Grafiken IT-Stat – 7 Univariate Analyse 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Relative Häufigkeitsverteilung (Histogramm) der Daten (blau) nach Klassifizierung in Gruppen. ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation Total area under curve = 100 % Area (!) proportional to per− centage of values in (a, b] ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen 18.8% 14.4% 11.9% 9.4% 5% 20 Prof. Dr. Bernhard Schipp 25 30 7.5% 3.8% 35 40 45 50 9.4% 5.6% 55 60 65 70 a b Measurement scale of variable X 75 14.4% 80 85 90 95 IT-Stat – 8 Histogramm 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Histogramme reagieren sensibel auf die (subjektive gewählte) Anzahl, Position und Breite der Klassen. ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen 33.1% 28.1% 19.4% 13.1% 21.2% 20% 16.9% 13.1% 12.5% 8.1% 5% 1.2% 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 7.5% 0.6% 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 Measurement scales of variable X Prof. Dr. Bernhard Schipp IT-Stat – 9 Deskriptive Kenngrößen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Lageparameter der Stichprobe x1 , ..., xn - ❖ Korrelation n 1X x̄ := xi n i=1 ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Arithmetischer Mittelwert - Median x̃ := - Prof. Dr. Bernhard Schipp x̃ := x(0.5(n+1)) falls n ungerade x̃ := 0.5(x(0.5n) + x(0.5n+1) ) Modus: Häufigster Wert IT-Stat – 10 Deskriptive Kenngrößen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • Graphische Illustration: n = 15 ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln Mode 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen x • Schranken geordneter Daten: α-Quantile Perzentile Quartile insbesondere: x Measurement scale of data teilt die Daten in ” ” beliebige Anteile Hunderstel Viertel Q0.25 Q0.75 Unteres Quartil Oberes Quartil • Median = 0.5-Quantil usw. Prof. Dr. Bernhard Schipp IT-Stat – 11 Kenngrößen der Grundgesamtheit 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz • Lageparameter der Grundgesamtheit: - Erwartungswert E(X) = µ Median θ mit FX (x ≤ θ) = 0.5 Modus (Maximalstelle der Dichtefunktion der Grundgesamtheit) • Graphische Illustration Anhang: Wichtige Verteilungen Upper 50 % of total area Lower 10 % of total area 0.1−quantile = 10th percentile = 1st decile Prof. Dr. Bernhard Schipp Mode θ µ Measurement scale of X IT-Stat – 12 Deskriptive Kenngrößen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen • Ein gern gemachter Fehler: • Gegeben: x̄ der Stichprobe x1 , ..., xn und ȳ der Stichprobe y1 , ..., ym . ֒→ Wie lautet der Mittelwert der gemeinsamen Stichprobe x1 , ..., xn , y1 , ..., yn ? ֒→ Ist es der Mittelwert z̄∗ der Mittelwerte x̄ und ȳ? I.A. nicht, da ! n m X X 1 nx̄ + mȳ z̄ := xi + yi = n + m i=1 n+m i=1 ֒→ Es gilt nur z̄ = 0.5(x̄ + ȳ) =: z̄∗ falls m = n. • Beispiel: n = 2, m = 10 xi yi Prof. Dr. Bernhard Schipp 2.5 1.1 3 1.2 0.9 1.0 1.1 0.8 1.2 0.9 1.0 0.9 x̄ = 2.75 ȳ = 1.01 z̄∗ = 1.88 z̄ = 1.3 IT-Stat – 13 Deskriptive Kenngrößen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • Ein weiterer gern gemachter Fehler: • Beobachtung des konsekutiven Wachstums ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln Populationsgröße Start: 110 Wachstumsrate Wachstumsfaktor per Periode per Periode (%) nach Periode 1: 132 r1 = +20 % f1 = 1 + nach Periode 2: 165 r2 = +25 % f2 = 1 + nach Periode 3: 110 r3 = −33 13 % f3 = 1 + 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp r1 100 r2 100 r3 100 = = = 6 5 5 4 2 3 ֒→ Wie lautet die durchschnittliche Wachstumsrate per Periode? ֒→ 3−1 (r1 + r2 + r3 ) = 3.89% pro Periode ist offensichtlich grober Unfug. IT-Stat – 14 Deskriptive Kenngrößen 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem • Lösung: Nutze den geometrischen Mittelwert der Wachstumsfaktoren, um die durchschnittliche Wachstumsrate zu erhalten. i) Berechne das geometrische Mittel der Wachstumsfaktoren: p (geom) ¯ f = n f1 · . . . · fn ii) Der „richtige” Durchschnitt der Wachstumsrate ist sodann: (geom) ∗ − 1 · 100 % r = f¯ ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen • Beispiel (Fortsetzung): f¯(geom) = Prof. Dr. Bernhard Schipp q 3 6 5 · 5 4 · 2 3 = 1 ⇒ r∗ = 0 % IT-Stat – 15 Deskriptive Kenngrößen: Streuung 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Empirische Variationsmaße: i) Standardabweichung v u n u 1 X s :=t (xi − x̄)2 n−1 i=1 ii) Spannweite (geordnete Stichprobe x(1) < ... < x(n) ) ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen R := x(n) − x(1) iii) Interquartilsabstand (geordnete Stichprobe x(1) < ... < x(n) ) IQR := Q0.75 − Q0.25 wobei Qα das α-Quantil mit α ∈ [0, 1] ist. Prof. Dr. Bernhard Schipp IT-Stat – 16 Deskriptive Kenngrößen: Streuung 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • Graphische illustration: x7 − x n = 20 ❖ Rangkorrelation x2 − x x x7 x2 ❖ Bayes-Theorem ❖ Kontingenztafeln x(1) 2. Epidemiologie Min. 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp x(5) x(10) x(15) x 1. Quartile ~ 25 % x(11) ~ 25 % x(20) 3. Quartile ~ 25 % Max. ~ 25 % Inter−quartile range (IQR) Sample range IT-Stat – 17 Streuungsmaße in der Grundgesamtheit 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie • Variationsmaße der Population: i) Standardabweichung/Varianz: σ =? (unbekannt), σ 2 = V ar(X) ii) Spannweite: Existiert nur, falls die Populationswerte eine obere und untere Grenze aufweisen. iii) Interquartilsabstand: 3. Statistische Inferenz Anhang: Wichtige Verteilungen IQRP := θ0.75 − θ0.25 wobei FX (x ≤ θα ) = α und α ∈ [0, 1]. 25 % 25 % Q1 Prof. Dr. Bernhard Schipp 25 % θ 25 % Q3 IT-Stat – 18 Variationskoeffizient 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse Variationskoeffizient (Streuung relativ zu arithm. Mittelwert) - ist definiert durch ❖ Bivariate Analyes ❖ Korrelation vc = ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie Interpretation (Faustregel): 3. Statistische Inferenz ● Anhang: Wichtige Verteilungen ● ● ● Prof. Dr. Bernhard Schipp s · 100(%) x̄ (0 < vc ≤ 20): arithm. Mittel präzise (20 < vc ≤ 40): arithm. Mittel moderat präzise (40 < vc ≤ 60): arithm. Mittel eher ungenau (60 < vc): arithm. Mittel extrem ungenau IT-Stat – 19 Box-Plot 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Boxplots für Stichprobendaten: i) Nutze die „5 Kenngrößen” ❖ Korrelation Minimum, Q0,25 , Median, Q0,75 , Maximum ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln ii) Ausreißeridentifikation: xi > Q0,75 + 1.5 · IQR oder xi < Q0,25 + 1.5 · IQR 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen iii) Boxplotkonstruktion: n = 20 | x(1) Min. Prof. Dr. Bernhard Schipp x(5) 1. Quartile x Median x(15) 3. Quartile x(20) Max. IT-Stat – 20 Box-Plot 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Boxplots und Verteilungen: Uniform ❖ Bivariate Analyes Bell−shaped ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie | n. Mi | Q 1. u. | | d. Me Q 3. u. | | Ma x. Q 1. u. | | d. Me u. Q 3. 3. Statistische Inferenz Anhang: Wichtige Verteilungen Right skewed | | | . u d. n. Mi 1. Q Me Prof. Dr. Bernhard Schipp | 3. Q u. Left skewed | 1. Q u. | | d. Me 3. Q u. | x. Ma IT-Stat – 21 Box-Plot ❖ Univariate Analyse ❖ Bivariate Analyes Für jede der Gruppen A, B Variable X by group ❖ Korrelation 7 ❖ Grundlagen * * 6 1. Basiswissen Statistik * ❖ Rangkorrelation ❖ Bayes-Theorem 5 ❖ Kontingenztafeln - Boxplots, gelb und mittig. 3 Anhang: Wichtige Verteilungen X - x̄ + s, rot und links. Empfehlung: Überlagere Dot-Chart und Boxplot 0 1 - Rohdaten im Dot-Chart-Format. 2 3. Statistische Inferenz 4 2. Epidemiologie A group B • Warnung: x̄ ± s verbirgt wichtige Informationen insb. bei kleinen Datenmengen oder schiefer Verteilung. Prof. Dr. Bernhard Schipp IT-Stat – 22 Bad Graphs 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Es gibt viele ungeeignete Darstellungen: Illustration ❖ Bivariate Analyes Dynamite plot: x ± s ❖ Rangkorrelation Dot chart of raw data 30 30 ❖ Korrelation 20 2. Epidemiologie 25 ❖ Kontingenztafeln 20 25 ❖ Bayes-Theorem X 15 0 5 10 X 0 5 10 Anhang: Wichtige Verteilungen 15 3. Statistische Inferenz A B C D A B group C D • Offensichtlich gilt x̄A = x̄B und sA = sB , ebenso für die Gruppen C und D. ֒→ Der Dot-Chart rechts zeigt die tatsächliche Verteilungssituation. Siehe auch: web links zu „Bad graph contest“. Prof. Dr. Bernhard Schipp IT-Stat – 23 Univariate Analyse 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem • Die Stichprobenverteilung approximiert für großes n die unbekannte Verteilung der Grundgesamtheit. • Je größer die Stichprobe desto besser ist die Approximation (Ausnahmen exisitieren auch hier). ❖ Kontingenztafeln Simulated sampling with increasing n: convergence of histograms & descriptive statistics with µ = 1.3 and σ = 1 2. Epidemiologie 3. Statistische Inferenz n = 25: x = 1.233, s = 0.757 Anhang: Wichtige Verteilungen 0 1 2 3 4 n = 100: x = 1.239, s = 0.91 5 0 n = 400: x = 1.372, s = 1.314 0 Prof. Dr. Bernhard Schipp 1 2 3 4 1 2 3 4 5 n = 1600: x = 1.315, s = 1.082 5 0 1 2 3 4 5 IT-Stat – 24 Bivariate Analyse 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Verteilung der Paare (x1 , y1 ), ..., (x1 , y1 ): Der Scatterplot 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen = Beschreibung der Streuung der Punkte (xi , yi ) im 2D-Raum. Hier noch mit den jeweiligen 1D-Boxplots erweitert. 100 ❖ Kontingenztafeln VerPaare Waiting time [min] 70 80 90 ❖ Bayes-Theorem = gemeinsame teilung der (xi , yi ). 60 ❖ Rangkorrelation 50 ❖ Korrelation 110 ❖ Bivariate Analyes 1 2 3 4 Previous duration [min] 5 Empfehlung: Überlagere Dot-Chart und Boxplot Prof. Dr. Bernhard Schipp IT-Stat – 25 Bivariate Grafiken 110 1. Basiswissen Statistik ❖ Grundlagen 100 ❖ Univariate Analyse ❖ Bivariate Analyes Ones 80 1 3 5 7 9 80 60 50 Anhang: Wichtige Verteilungen Waiting time [min] 3. Statistische Inferenz 70 2. Epidemiologie 60 ❖ Kontingenztafeln Waiting time [min] ❖ Rangkorrelation ❖ Bayes-Theorem 100 90 ❖ Korrelation 1 2 3 4 Previous duration [min] 5 40 1 2 3 4 5 Previous duration [min] • Links: „Sunflowerplot” um doppelt belegete Punkte zu visulisieren. Rechts: Mehrfachbelegung durch hexagonale Zellenstruktur visualisiert. Prof. Dr. Bernhard Schipp IT-Stat – 26 Bivariate Grafiken 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Eigenschaften von Interesse: i) Die Gestalt bivariater Verteilung kann analog zu den univariaten Verteilungen klassifiziert werden, zeigt aber i.A. komplexeres Verhalten bezüglich der Modalitäten und Asymmetrien. ii) Der Interessenfocus liegt generisch auf einfachen Eigenschaften der Punktewolke: ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp - Lage Gerichtete Streuung Statistische Abhängigkeit (Kovarianz, Korrelation) Funktionsartige Strukturen (Im Sinne von Trends z.B. Regression von y auf x). IT-Stat – 27 Bivariate Grafiken 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes 3 3 2 2 1 1 0 0 ❖ Bayes-Theorem y ❖ Rangkorrelation y ❖ Korrelation −1 −1 ❖ Kontingenztafeln −2 −2 2. Epidemiologie −3 −3 3. Statistische Inferenz −3 −2 −1 0 2 −3 3 −2 −1 3 3 2 2 1 1 0 0 −1 −1 −2 −2 −3 −3 −3 −2 −1 0 x 0 1 2 3 1 2 3 x y y Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp 1 x 1 2 3 −3 −2 −1 0 x IT-Stat – 28 Bivariate Analyse: Korrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln • Korrelation: Beschreibt eine Beziehung zwischen zwei oder mehreren Merkmalen, Ereignissen oder Zuständen, die nicht notwendigerweise ein Kausalzusammenhang darstellen muss. • Für metrische Daten exisitieren unterschiedliche Typisierungen. 8 2. Epidemiologie 3 3. Statistische Inferenz 2 Anhang: Wichtige Verteilungen 6 y y 1 0 4 −1 2 −2 −3 −3 −2 −1 0 x 1 2 3 Abbildung 1: Linear Prof. Dr. Bernhard Schipp 0.0 0.5 1.0 1.5 2.0 2.5 x Abbildung 2: Monoton IT-Stat – 29 Bivariate Analyse: Korrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Oder eher pathologische Beispiele ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation 1.0 1.0 1.0 0.5 0.5 0.5 0.0 0.0 0.0 −0.5 −0.5 −0.5 −1.0 −1.0 −1.0 ❖ Bayes-Theorem ❖ Kontingenztafeln 3. Statistische Inferenz Anhang: Wichtige Verteilungen y 2. Epidemiologie −1.0 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 x Prof. Dr. Bernhard Schipp IT-Stat – 30 Bivariate Analyse: Korrelation - Beispiel: ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie n = 30 Länder x Täglicher Fettverzehr y Tod durch Prostatakrebs 3. Statistische Inferenz Anhang: Wichtige Verteilungen - Ziel: Ein Maß der (linearen) Abhängigkeit zwischen den Größen x und y. Prof. Dr. Bernhard Schipp 8 ❖ Korrelation 6 ❖ Bivariate Analyes No. of deaths per 100000 ❖ Univariate Analyse 10 12 14 16 18 Deaths due to prostate cancer vs. fat intake 4 ❖ Grundlagen 2 1. Basiswissen Statistik 30 40 50 60 70 80 90 110 130 150 Average fat intake (in grams/day) • Lösung: Korrelationskoeffizient nach Karl Pearson: Pn i=1 (xi − x̄)(yi − ȳ) pPn rP = pPn 2 2 i=1 (xi − x̄) · i=1 (yi − ȳ) IT-Stat – 31 Bivariate Analyse: Korrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen • −1 ≤ rP ≤ +1 (Skaleninvariant, Einheitenfrei) • Je mehr sich |rP | der 1 nähert desto eher liegen die Punkte (xi , yi ) auf einer „imaginären” Geraden. ֒→ rP = 1 alle Punkte liegen auf einer steigenden Geraden. rP = −1 alle Punkte liegen auf einer fallenden Geraden. Funktional deterministische Beziehung zwischen y und x. Praktisch unmöglich für reale Datensituationen. • rP sagt nichts über die Steigung der „imaginären” Geraden aus. ֒→ Dies ist die grundsätzliche Fragestellung innerhalb der Regressionsanalyse. • rP = 0 zeigt nur die Abwesenheit einer linearen statistischen Beziehung zwischen den Größen y und x auf. Prof. Dr. Bernhard Schipp IT-Stat – 32 Bivariate Analyse: Korrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Einstufungen (Faustregel!) |rP | 0 < |rP | 0.5 < |rP | 0.8 < |rP | |rP | ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen = ≤ ≤ < = 0 0.5 0.8 1 1 : : : : : keine schwache mittlere (Pearson) Korrelation starke perfekte • Beispiele: Korrelationen mit unterschiedlicher Größenausprägungen r P = 0.923 r P = 0.875 r P = −0.643 r P = 0.114 6 6 6 6 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 1 1 1 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 • Beachten Sie: Die Steigung der ersten Geraden ist kleiner als die der Zweiten, obwohl die Korrelation im ersten Plot deutlich größer ist. Prof. Dr. Bernhard Schipp IT-Stat – 33 Bivariate Analyse: Korrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • rP = 0 schließt keine nicht-linearen Beziehungen aus: ❖ Bivariate Analyes r P = 0.01 ❖ Korrelation ❖ Rangkorrelation r P = 0.037 ❖ Bayes-Theorem ❖ Kontingenztafeln 5 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen r P = −0.09 1.0 1.0 0.5 0.5 0.0 0.0 −0.5 −0.5 4 −1.0 −1.0 −1.0 3 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 r P = −0.103 1.0 2 0.5 0.0 1 −0.5 0 −1.0 0 1 2 3 Abbildung 3: Standard Prof. Dr. Bernhard Schipp −1.0 −0.5 0.0 0.5 1.0 Abbildung 4: Pathologisch ֒→ Merke: Erstellen Sie, falls möglich, einen Scatterplot, um nicht-lineare Beziehungen zwischen den Größen y und x zu entdecken. IT-Stat – 34 Bivariate Analyse: Rangkorrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln • Problem: Messung der Stärke einer monotonen Beziehung zwischen metrisch bivariaten Daten (Monotonie ist eine schwächere Eigenschaft als Linearität). • Grafische Illustration: Monotone association with ... 2. Epidemiologie ... increasing trend 3. Statistische Inferenz Anhang: Wichtige Verteilungen ... non−decreasing trend ... decreasing trend 25 1.0 8 0.8 20 0.6 15 0.4 10 0.2 5 6 4 2 0.0 0 0.0 Prof. Dr. Bernhard Schipp 0.5 1.0 1.5 −2 −1 0 1 2 0.0 0.5 1.0 1.5 IT-Stat – 35 Bivariate Analyse: Rangkorrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes • Lösung: ֒→ ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ֒→ ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ֒→ ֒→ Nicht die eigentlichen Datenpaare (xi , yi ) werden genutzt, sondern die damit assoziierten Rangpaare (R(xi ), R(yi )). die Ränge werden separat für xi und yi ermittelt: Das kleinste xi bekommt R(xi ) = 1 zugewiesen, das zweitkleinste xi bekommt R(xi ) = 2 zugewiesen etc. Das gleiche Verfahren erfolgt für yi . Im Fall gleicher Werte innerhalb der xi Datenreihe (bzw. in yi ), also bei sog. „ties”, wird dann ein mittlerer Rang vergeben. Rangkorrelation nach Spearman: n X n+1 n+1 R(xi ) − R(yi ) − 2 2 i=1 v rS = v u n u n 2 2 X uX u n+1 n+1 t R(xi ) − R(yi ) − · t 2 2 i=1 i=1 Prof. Dr. Bernhard Schipp IT-Stat – 36 Bivariate Analyse: Rangkorrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation • Eigenschaften von rS ֒→ ֒→ Je näher |rS | an 1 liegt, desto eher folgen (xi , yi ) einem monotonen Trend. ֒→ rS = 1 ⇔ Perfekte positive Rangkorrelation. ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ֒→ ֒→ ֒→ Prof. Dr. Bernhard Schipp −1 ≤ rS ≤ +1 rS = −1 ⇔ Perfekte negative Rangkorrelation. rS = 0 ⇔ Keine monotone Beziehung Der Rangkorrelationkoeffizient sagt nichts (bis auf das Vorzeichen) über die Steigung des monotonen Trends aus. IT-Stat – 37 Bivariate Analyse: Rangkorrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • Einstufungen (Faustregel!): Siehe rP • Die vorherigen Beispiele nun mit rS r S = 0.929 ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln r S = 0.856 r S = −0.896 25 1.0 8 2. Epidemiologie 0.8 20 3. Statistische Inferenz 0.6 15 Anhang: Wichtige Verteilungen 0.4 10 0.2 5 6 4 2 0.0 0 0.0 0.5 1.0 1.5 −2 −1 0 1 2 0.0 0.5 1.0 1.5 • rS = 0 schließt eine nicht-monotone Beziehung nicht aus; machen Sie sich das anhand der pathologischen Beispiel klar. Prof. Dr. Bernhard Schipp IT-Stat – 38 Bivariate Analyse: Rangkorrelation 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation • rS reagiert robust gegenüber sog. Ausreißern. • Beispiel: ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 16 Datenpunkte, rP = rS = 0 2. Epidemiologie 5 3. Statistische Inferenz 4 Anhang: Wichtige Verteilungen 3 2 1 17. Datenpunkt hinzugefügt point rP rS Prof. Dr. Bernhard Schipp (5, 5) 0.2273 0.1753 (10, 10) 0.7258 0.1753 0 0 (20, 20) 0.9351 0.1753 1 2 3 (50, 50) 0.9908 0.1753 4 5 (100, 100) 0.9978 0.1753 IT-Stat – 39 Bedingte Wahrscheinlichkeit und Bayes-Theorem 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation Gesucht: Wahrscheinlichkeit eines Ereignisses unter der Bedingung, dass ein anderes bereits eingetreten ist. Formal: ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie P (A|B) = P (A und B) , P (B) > 0 P (B) 3. Statistische Inferenz Anhang: Wichtige Verteilungen Eigenschaften: P (A und B) = P (A)P (B) falls A und B (stochastisch) unabhängig sind P (A und B) = P (A) + P (B) − P (A oder B) P (A und B) = P (A|B)P (B) Prof. Dr. Bernhard Schipp IT-Stat – 40 Bedingte Wahrscheinlichkeit und Bayes-Theorem 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Seien A und B Ereignisse, mit den Gegenereignissen Ā und B̄, dann gilt P (B) = P (B und A) + P (B und Ā) was gleichbedeutend ist mit P (B) = P (B|A)P (A) + P (B|Ā)P (Ā) Damit erhält man den Satz von Bayes: P (A|B) = Prof. Dr. Bernhard Schipp P (A und B) P (B|A)P (A) = P (B) P (B|A)P (A) + P (B|Ā)P (Ā) IT-Stat – 41 Kontingenztafel; Beispiel 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp Beispiel: Ebola (Ebola-Disease); Sensitivität, Spezifität des Ebola-Tests und die Prävalenz von Ebola in einer Population seien bereits bekannt. P (T und K) • Sensitivität: P (T |K) = = 0.94 P (K) P (T̄ und K̄) • Spezifität: P (T̄ |K̄) = = 0.93 P (K̄) • Prävalenz (gegeben): P (Ebola) = 0.000002 P (T |K)P (K) • Bayes: P (K|T ) = P (T |K)P (K) + P (T |K̄)P (K̄) • d.h. P (K|T ) = 0.000027!!! und damit ist der Test ungeeignet. IT-Stat – 42 Kontingenztafel; Beispiel 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Die Prävalenz ändert sich i.d.R. bei Verdachtsfällen (Stichprobe): • Vierfeldertafel (two-way table): Verdachtsfälle von Ebola K K̄ T 126 7 133 T̄ 8 97 105 134 104 238 • P(Ebola bei Verdachtsfällen) = 134 = 0.56 238 • d.h. P (K|T ) = 0.95!!! und damit ist der Test in Verdachtsfällen zur Absicherung durchaus geeignet. Prof. Dr. Bernhard Schipp IT-Stat – 43 Validität diagnostischer Verfahren 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen - Um zu beurteilen, wie gut ein Labortest für die Diagnose der Krankheit ist, wird bei jedem Patienten dessen tatsächlicher Gesundheitszustand mit dem Ergebnis des Tests verglichen. Dabei können vier mögliche Fälle auftreten: • Richtig positiv : Der Patient ist krank und der Test hat dies richtig angezeigt. • Falsch negativ : Der Patient ist krank, aber der Test hat ihn fälschlicherweise als gesund eingestuft. • Falsch positiv : Der Patient ist gesund, aber der Test hat ihn fälschlicherweise als krank eingestuft. • Richtig negativ : Der Patient ist gesund und der Test hat dies richtig angezeigt. Im ersten und letzten Fall war die Diagnose also richtig, in den anderen beiden Fällen liegt ein Fehler vor. Prof. Dr. Bernhard Schipp IT-Stat – 44 Kontingenztafeln 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen I.d.R. müssen die Wahrscheinlichkeiten durch eine Datenerhebung geschätzt werden. Beispiel: absolute Häufigkeiten Personen Test positiv Test negativ Summe krank 98 1 99 gesund 40 1960 2000 Summe 138 1961 2099 Schätzung durch die relative Häufigkeiten: Personen Test positiv Test negativ Summe krank 98/2099=0.047 1/2099=0.0005 99/2099=0.047 gesund 40/2099=0.019 1960/2099=0.934 2000/2099=0.953 Summe 138/2099=0.066 1961/2099=0.934 1 Daraus kann z.B. ermittelt werden: P(krank|Test positiv)= P(krank und Test positiv)/P(Test positiv)=0.047/0.066=0.71 alternativ: P(krank|Test positiv)= Anzahl(krank und Test positiv)/Anzahl(Test positiv)=98/138=0.71 Prof. Dr. Bernhard Schipp IT-Stat – 45 Kontingenztafelanalyse 1. Basiswissen Statistik ❖ Grundlagen ❖ Univariate Analyse • Bezeichnungen: T = Test positiv, K = Patient krank T̄ = Test negativ, K̄ = Patient nicht krank ❖ Bivariate Analyes ❖ Korrelation ❖ Rangkorrelation ❖ Bayes-Theorem ❖ Kontingenztafeln 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp Kontingenztafel: Personen Test positiv (rp + fp ) Test negativ (fn + rn ) krank (rp + fn ) richtig positiv (rp ) falsch negativ (fn ) gesund (fp + rn ) falsch positiv (fp ) richtig negativ (rn ) ֒→ Sensitivität: Wie gut erkennt der Test Personen, die tatsächlich krank sind? P (T |K), geschätzt durch rp /(rp + fn ) ֒→ Spezifität: Wie gut erkennt der Test Personen, die tatsächlich gesund sind? P (T̄ |K̄), geschätzt durch rn /(rn + fp ) ֒→ Positiver prädiktiver Wert: P (K|T ), geschätzt durch rp /(rp + fp ) ֒→ Negativer prädiktiver wert: P (K̄|T̄ ), geschätzt durch rn /(rn + fn ) IT-Stat – 46 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen 2. Epidemiologie Prof. Dr. Bernhard Schipp IT-Stat – 47 Relatives Risiko (RR) 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen Eine andere Form der Kontingenztafel ermöglicht eine Untersuchung des Zusammenhangs zwischen einem Ereignis (z.B. krank/Nicht krank) mit einer Exposition (z.B. Raucher/Nichtraucher) • Das relative Risiko beschreibt dann die Erkrankungswahrscheinlichkeit einer exponierten Gruppe relativ zur Erkrankungswahrscheinlichkeit einer nicht exponierten Gruppe. • RR = (Inzidenz der Exponierten) / (Inzidenz der Nichtexponierten) • Die Inzidenz einer Erkrankung ist die Anzahl neuer Krankheitsfälle, die in einem bestimmten Zeitraum auftreten, bezogen auf die Bevölkerung mit gleichem Erkrankungsrisiko. Exposition Ja Nein Ereignis Ja Nein a b c d a+b c+d a/(a + b) • Relatives Risiko: c/(c + d) Prof. Dr. Bernhard Schipp IT-Stat – 48 Relatives Risiko (RR) 1. Basiswissen Statistik Beispiel: 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen Raucher Ja Nein Lungenkrebs Ja Nein 90 9910 40 19960 10000 20000 • Risiko der Raucher: 90 von 10000 oder 0.009% • Risiko der Nichtraucher: 40 von 20000 oder 0.002% • Verhältnis des Risikos der Raucher zu dem der Nichtraucher ist das relative Risiko • Relatives Risiko: [90/10.000]/[40/20000] = 4.5 • Interpretation: Raucher haben das 4.5-fache Risiko eines Nichtrauchers, Lungenkrebs zu bekommen. Prof. Dr. Bernhard Schipp IT-Stat – 49 RR: Einsatz und Interpretation 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen Einsatz • Das relative Risiko ist nur in prospektiven Studien (Kohortenstudien) eine zulässige Größe. • In retrospektiven Case-Control-Studien ist es nicht zulässig, das relative Risiko zu berechnen. Interpretation • RR = 1 Das Risiko der Exponierten ist gleich groß wie das Risiko der Nichtexponierten • RR > 1 Das Risiko der Exponierten ist größer als das Risiko der Nichtexponierten (Exposition = Risikofaktor) • RR < 1 Das Risiko der Exponierten ist kleiner als das Risiko der Nichtexponierten (Exposition = Protektiver Faktor) Prof. Dr. Bernhard Schipp IT-Stat – 50 Chancenverhältnis: Odds Ratio (OR) 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp • Das OR beschreibt die Quote des Expositionsfaktors unter den Erkrankten relativ zur Quote unter den Gesunden • OR = (Expositionsquote der Erkrankten) / (Expositionsquote der Gesunden) • Die Expositionsquote ist das Verhältnis der Anzahl Exponierter zur Anzahl Nichtexponierter (unter den Erkrankten bzw. unter den Gesunden). a/c • Odds Ratio: b/d IT-Stat – 51 Odds Ratio: Beispiel 1. Basiswissen Statistik Beispiel: 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen Raucher Ja Nein Lungenkrebs Ja Nein Fall(Case) Kontrolle) 60 50 40 150 • Die Raucherquote unter den Lungenkrebspatienten beträgt 60 : 40 oder 3 : 2. • Die Raucherquote unter den Gesunden beträgt 50 : 150 oder 1 : 3. • Das Odds Ratio ist das Verhältnis der Raucherquote der Erkrankten zur Raucherquote der Gesunden. • Numerisch: Odds Ratio = (60/40)/(50/150) = 4.5 • Interpretation: Die Chance, unter Lungenkrebspatienten einen Raucher anzutreffen, ist 4.5mal so hoch wie unter den Gesunden. Prof. Dr. Bernhard Schipp IT-Stat – 52 Zusammenhang: Relatives Risiko (RR) und Odds Ratio (OR) 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Anhang: Wichtige Verteilungen • Das Odds Ratio kann sowohl in prospektiven Kohortenstudien wie auch in retrospektiven Case-Control-Studien berechnet werden. • Das Odds Ratio dient häufig als Schätzung für das relative Risiko. • Das Odds Ratio ist nicht dasselbe wie das relative Risiko. ֒→ Achtung: In Fall-Kontroll-Studien kann das relative Risiko gar nicht berechnet werden, da die Erkrankungshäufigkeit (Anzahl der Fälle) vom Untersucher vorgegeben ist. Wann ist OR ein guter Schätzer für RR? • Wenn die Fälle und Kontrollen im Hinblick auf die Expositionsanamnese repräsentativ sind für alle Menschen mit bzw. ohne diese Erkrankung in der Population. • Wenn die untersuchte Krankheit selten auftritt. Prof. Dr. Bernhard Schipp IT-Stat – 53 RR vs. OR: Beispiel 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Exposition Anhang: Wichtige Verteilungen Ja Nein Erkrankung Ja Nein 200 9800 100 9900 10000 10000 200/10000 =2 • Relatives Risiko: 100/10000 200/100 = 2.02 • Odds Ratio: 9800/9900 Warum? Das RR: a a+b c c+d ist annähernd gleich dem OR: a b c d ... falls a sehr viel kleiner als b und c sehr viel kleiner als d ist. Prof. Dr. Bernhard Schipp IT-Stat – 54 RR vs. OR 1. Basiswissen Statistik 2. Epidemiologie ❖ Grundbegriffe 3. Statistische Inferenz Bei häufigen Krankheiten ist das Odds Ratio kein guter Schätzer für das relative Risiko. Beispiel: Anhang: Wichtige Verteilungen Exponiert Ja Nein Erkrankung Ja Nein 50 50 25 75 100 100 • Relatives Risiko: [50/100]/[25/100] = 2 • Odds Ratio: [50/25]/[50/75] = 3 PS: Die Erläuterungen zu RR und OR sind angelehnt an ein Schnellrepetitorium von E. Kvas, Hermesoft, Biostatistik und Data Management, [email protected] Prof. Dr. Bernhard Schipp IT-Stat – 55 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang 3. Statistische Inferenz ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 56 Zufallsvariablen 1. Basiswissen Statistik 2. Epidemiologie • Definition: Eine Zufallsvariable (ZV) ist eine Größe deren Ausprägung durch den Zufall bestimmt wird. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Interpretation: Verallgemeinert den generischen Variablenbegriff zu jedweder Art von Variable Notation: Üblicherweise in Großbuchstaben X, Y ... ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte • Beispiele: ZV’s als Output mathematischer Funktionen deren Input zufälliger Natur ist. i) ii) log(C) wobei C Glukosekonzentration im Blut. BM I := M/H 2 für Größe und Gewicht einer zufällig ausgewählten Person. iii) Mittelwert und Standardabweichung von n zufällig ausgewählten Personen. ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 57 Verteilungsfunktion 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests • Definititon: Die Wahrscheinlichkeitsverteilung FX (x) einer ZV X weist den Ausprägungen respektive den Ausprägungsintervallen besagter ZV eine Zahl zwischen 0 und 1 zu. ֒→ Diskrete ZV: Nimmt nur abzählbar viele Zustände/Ausprägungen an. Das heißt, die Output-Menge ist durch N, Z oder jede endliche Menge gegeben. Einzelne Werte können mit einer Wahrscheinlichkeit belegt werden ֒→ Stetige ZV: Nimmt überabzählbar viele Zustände/Ausprägungen an. Das heißt, die Output-Menge ist durch R, C gegeben. Nur Intervalle können mit einer Wahrscheinlichkeit belegt werden. ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression Area = Probability that X attains a value in (a, b] Graph of density function ❖ KQ-Residuen ❖ Modellgüte Total area under curve = 1 ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle a b ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 58 Normalverteilung 1. Basiswissen Statistik 2. Epidemiologie • Viele -aber nicht alle- realen Zufallsphänomene weisen eine Dichtefunktion mit der Gestalt einer Gauss’schen Dichte auf. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung kσ − rule + + + − (x − µ)2 1 ϕµ, σ(x) = exp 2 2σ σ 2π ≈ 68.3 % ≈ 95.4 % ≈ 99.7 % ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests µ − 3σ µ − 2σ µ−σ µ µ+σ µ + 2σ µ + 3σ • Notation X ∼ N (µ, σ 2 ) • N (µ, σ 2 ) ist eindeutig durch die Parameter bestimmt. • N (0, 1) heißt Standardnormalverteilung. ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 59 Normalverteilung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen • Anmerkung: Die Normalverteilung spielt innerhalb der statistischen Theorie eine große Rolle, da diese Verteilung oft per Annahme vorausgesetzt wird und sich zudem die Qualität vieler statistischer Verfahren auf diese Annahme stützt. ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest • Explorative Werkzeuge um Normalität aufzuzeigen: i) ii) Histogramm: sollte annähernd Glockengestalt aufweisen. Boxplot: sollte nahezu symmetrisch sein und nur wenige Ausreißer aufweisen. iii) Normal QQ-Plot: sollte nahezu linearen Verlauf haben. ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 60 Normalverteilung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen • Realdaten-Beispiel: Anorexia nervosa Therapieeffekt ist durch Gewichtsveränderung (in Pfund) bei weiblichen Patienten gegeben, wobei ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung Gewichtsänderung = Gewicht post-therapeutisch−Gewicht prä-therapeutisch ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest Daten n Min. 17 -5.3 1. Q. 3.9 Raw data Mean 7.3 Histogram 3. Q. 11.4 Boxplot ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Modellgüte ❖ Standardfehler St. dev. 7.2 Normal q−q plot −2 ❖ Regression ❖ KQ-Residuen Max. 21.5 Theoretical quantiles −1 0 1 2 ❖ Unabhängigkeitstest Med. 9.0 −5 0 5 10 15 20 −10 0 5 15 25 −5 0 5 10 15 20 −5 0 5 10 15 20 Sample quantiles Weight change [pounds] ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 61 QQ-plot 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest • Falls x(1) ≤ x(2) ≤ · · · ≤ x(n) geordnete Beobachtungen von unabhängig normal-verteilten ZV’s darstellen, dann gibt es eine approximativ lineare Beziehung zwischen dem empirischen i/n Quantil x(i) und dem theoretischen (i − 0.5)/n Quantil einer standard-normal-verteilten ZV. ֒→ Ein Plot, der empirische gegen theoretische Quantile abträgt, sollte eine Punktewolke zeigen, die nahezu einen linearen Verlauf hat, falls die Beobachtungen aus einer N (µ, σ 2 )-verteilten Grundgesamtheit stammen. ❖ Unabhängigkeitstest ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen Details: Scatter plot bezüglich i − 0.5 x(i) , Φ−1 n wobei Φ−1 die Inverse der Verteilungsfunktion der Standardnormalverteilung darstellt. Normal q−q plot Theoretical quantiles −1 0 1 ❖ Parametrische Tests ❖ Nichtparametrische Tests 4.4 4.6 4.8 5.0 5.2 Sample quantiles 5.4 IT-Stat – 62 1. Basiswissen Statistik 2. Epidemiologie 1.0 Andere Verteilungen 3. Statistische Inferenz ❖ Verteilungen 0.8 ❖ Zufallsvariablen ❖ QQ-Plot Normal(0, 1) Cauchy(0, 1) (heavier tails) Uniform (−1,1) (lighter tails) Exponential(1) (skewed right) Lognormal(1, 1) (skewed right) ❖ Parameterschätzung ❖ Konfidenzintervalle 0.6 ❖ Zentraler Grenzwertsatz ❖ Hypothesentests ❖ Stichprobenumfang ❖ Wahl des Testverfahrens 0.4 ❖ Teststärke ❖ Anpassungstest ❖ Parametrische Tests ❖ Nichtparametrische Tests 0.2 ❖ Unabhängigkeitstest ❖ Varianzanalyse ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler 0.0 ❖ Multiple Vergleiche −4 −2 0 2 4 ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 63 Parameterschätzung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang • Szenario: Eine zufällig gezogene Stichprobe aus einer N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor. • Ziel: Schätze µ und behandle σ 2 wie einen Störparameter. • Bekannt: X̄ ist ein guter Punktschätzer, da n→∞ X̄ −−−−→ µ, n→∞ V ar(X̄) −−−−→ 0 ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest • Wie gut X̄ das macht, zeigt das folgende Beispiel einer simulierten Stichprobenverteilung für X̄ für größer werdendes n. ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 64 Parameterschätzung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen Sample number ❖ Zentraler Grenzwertsatz 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 n=1 x n=5 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x µ µ n = 20 x x x x x x x x x x x x x x x x x x x x µ Measurement scale ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 65 Zentraler Grenzwertsatz 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke - X1 , X2 , . . . , Xn ... n unabhängige identisch verteilte ZV mit Erwartungswert µ und Varianz σ 2 - wenn n gegen unendlich wächst (n → ∞), konvergiert die Verteilung des Stichprobenmittels X̄ gegen eine Normalverteilung mit Erwartungswert µ und Varianz σ 2 /n. 2 σ X̄n→∞ ∼ N µ, n ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse - Folgerung: √ n(X̄ − µ) X̄ − µ √ = ∼ N (0, 1) Z= σ σ/ n ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle - Wird σ durch s geschätzt ändert sich die Grenzverteilung etwas √ X̄ − µ n(X̄ − µ) √ = t= ∼ tn−1 s s/ n ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 66 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests • Man sieht, dass in den meisten Fällen X̄ 6= µ gilt. Selbst wenn X̄ = µ wäre, würde man es nicht wissen, da µ unbekannt ist. • Frage: Wie groß ist |X̄ − µ| • Ziel: Entwickle einen Intervallschätzer, der den wahren Parameter der Population mit einer vorspezifizierten Wahrscheinlichkeit 1 − α beinhaltet. • Lösung: Konfidenzintervall (KI) mit Irrtumswahrscheinlichkeit α, wobei α üblicherweise mit 0.1, 0.05, 0.01 angesetzt wird. • Anmerkung: Die Breite des KI’s zeigt den Schätzfehler auf. ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 67 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen • Szenario: Eine zufällig gezogene Stichprobe aus einer N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor. • Exaktes KI für den Parameter µ σ̂ σ̂ KIµ(1−α) := X − tn−1,1−α/2 · √ ; X + tn−1,1−α/2 · √ n n wobei v u u σ b=t n 1 X (Xi − X)2 n − 1 i=1 und tk,γ das γ-Quantil der t-Verteilung mit k := n − 1 Freiheitsgraden ist. ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 68 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse (1−α) • Eigenschaften von KIµ i) Zentriert und symmetrisch um X̄ ii) Breite = 2 · tn−1,1−α/2 · √σ̂n hängt ab von 1 − α, σ̂ and n: 1 − α, desto größer Je größer σ̂, desto größer ist die Breite. n, desto kleiner iii) Das theoretische KI ist zufällig, da X̄, σ̂ ZV’s sind. Das numerische KI ist deterministisch, da x̄, s Realisationen der ZV’s X̄, σ̂ sind. ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 69 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen • Beispiel (Anorexia nervosa): Punktschätzungen: n 17 x 7.3 s 7.2 Ziel: 90 % KI bezüglich µ (erwartete Gewichtsänderung), wobei · tn−1,1−α/2 = t16,0.95 = 1.746 Es ergibt sich: s x − tn−1,1−α/2 · √ ; x + . . . n 7.2 · = 7.3 − 1.746 · √ ; 7.3 + . . . = [4.2; 10.4] 17 • Rundungsregel für KI’s: Untere/Obere KI-Grenze wird immer ab/aufgerundet. ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 70 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche • Warnung: Eine Interpretation der Art „Das wahre µ ist mit einer Wahrscheinlichkeit von 90% zwischen 4.2 and 10.4” ist nicht zulässig, da das numerische KI eine Realisation des Konfidenzintervallschätzers ist. • Entweder enthält das konkrete KI den wahren Parameter der Population oder nicht, d.h. die Wahrscheinlichkeit ist entweder 1 oder 0, aber nicht 90%. • Korrekt wäre: (1 − α) · 100 % aller KI’s bezüglich aller Stichproben überdecken den wahren Parameter der Grundgesamtheit. ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 71 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie • Trefferrate des KI’s für 2 × 200 simulierten N (µ, σ 2 )-Verteilungen 3. Statistische Inferenz Sample size (each): n = 5 ❖ Zufallsvariablen ❖ Verteilungen 5 ❖ QQ-Plot 4 ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle Theoretical level: 0.95 Empirical level (= hit rate): 0.945 3 µ2 ❖ Hypothesentests 1 ❖ Stichprobenumfang 0 ❖ Teststärke ❖ Wahl des Testverfahrens 0 ❖ Anpassungstest 5 ❖ Parametrische Tests ❖ Nichtparametrische Tests 4 ❖ Multiple Vergleiche ❖ Regression 40 60 Sample size (each): n = 50 ❖ Unabhängigkeitstest ❖ Varianzanalyse 20 µ 80 100 120 Theoretical level: 0.95 140 160 180 200 Empirical level (= hit rate): 0.95 3 2 1 ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests 0 0 20 40 60 80 100 120 140 160 180 200 Sample number ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 72 Konfidenzintervalle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle • Szenario: Eine zufällig gezogene Stichprobe aus einer N (µ, σ 2 )-Verteilung mit unbekanntem µ und σ 2 liegt vor. • Exaktes KI für den Parameter σ 2 # " 2 2 (n − 1)σ̂ (n − 1)σ̂ (1−α) ; := KIσ2 χ2n−1;1−α/2 χ2n−1;α/2 ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche wobei χ2k;γ das γ-Quantil der χ2 -Verteilung mit k Freiheitsgraden darstellt. • Interessante Anwendung: (1−α) Die obere Grenze von KIσ2 (Pilotstudie) kann als σ ∗ für eine Stichprobenumfangsabschätzung genutzt werden. ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 73 Hypothesentests, Allgemeines 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse • Eher informell: 1a Eine Vermutung wird abgelehnt, um auf das Gegenteil zu schließen. 1b Sammle sinnvolle aber zufallsbehaftete Informationen. 1c Sinnvolles Auswerten der Informationen, um ggfs. Evidenz für die Gegenvermutung zu erhalten. 1d • Eher formell: 2a Teste sich gegenseitig ausschließende Hypothesen H0 vs. H1 . 2b Adäquate Entwicklung eines Experimentes oder sorgfältige durchgeführte Beobachtungsstudie mit gut definierten ZV’s. 2c Verwende eine Teststatistik T (X1 , X2 , ...), deren zufälliges Verhalten unter H0 bekannt ist und sich von dem unter H1 unterscheidet. 2d Entscheide, ob die Ausprägung von T (X1 , X2 , ...) groß genug ist und damit Abweichungen des unter H0 hypothesierten Wertes nicht mehr als zufällig zu erachten sind. ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests Entscheide, ob genug Evidenz vorliegt, um die Vermutung abzulehnen. ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 74 Hypothesentests, Allgemeines 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest • Versuch einer Analogie: Strafrechtlicher Prozess Es gilt die Unschuldsvermutung. Der Staatsanwalt versucht, die Schuld des Angeklagten zu beweisen. Indizien (Evidenz) werden gesammelt. Das Gericht entscheidet mit Hilfe der gesammelten Indizien, ob der Angeklagte schuldig ist oder nicht. • Fundamentales Prinzip: Nicht genug Indizien führen zum Freispruch. „In dubio pro reo” entspricht hier also der Nullhypothese. ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 75 Hypothesentests, Fehlertypen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen Test decision ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression • Zu ∗: - Lehne H0 ab, obwohl die Hypothese wahr ist (Falscher Alarm). - Wahrscheinlichkeit eines Typ I Fehlers entspricht genau α. - Die Irrtumswahrscheinlichkeit ist unter Kontrolle des Anwenders. • Zu ∗∗: - Lehne H0 nicht ab, obwohl die Nullhypothese nicht wahr ist. - Wahrscheinlichkeit eins Typ II Fehlers wird mit β notiert. Bei 1 − β spricht man auch von der Stärke eines statistischen Signifikanztests. - β ist meistens nicht unter Kontrolle des Anwenders und gewöhnlich unbekannt. ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen Reject H0 Do not reject H0 Unknown truth H0 is true H0 is false √ Type I error ∗) √ Type II error ∗∗) IT-Stat – 76 Hypothesentests, Fehlertypen 1. Basiswissen Statistik 2. Epidemiologie • Illustration des Fehlers 2. Art (rot) und des Fehlers 1. Art (blau) 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle Der Fehler 2. Art hängt von µ ab. Je dichter das wahre µ bei dem unter der Nullhypothese angenommen Wert liegt, desto größer ist dieser Fehler. Da µ bei Annahme der Alternativhypothese nicht bekannt ist, kann die Wahrscheinlichkeit für den Fehler zweiter Art nicht berechnet werden. ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 77 Hypothesentests: Interpretation 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz • Nehmen Sie an, dass α hinreichend klein ist: ֒→ Schließen sie auf die Richtigkeit von H1 , wenn H0 abgelehnt werden kann. Die Entscheidung ist verlässlich, da die Irrtumswahrscheinlichkeit klein ist. Das Testergebnis ist statistisch signifikant. ֒→ Falls H0 nicht abgelehnt werden kann, schließen Sie daraus, dass nicht genug Evidenz vorliegt, welche H1 unterstützt. Diese Entscheidung ist nicht zuverlässig, da der assoziierte Fehler unbekannt und womöglich groß ist. ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests • Zusammenfassung: Ein statistischer Signifikanztest ist i.d.R. ein Werkzeug, um eine Nullhypothese zu verwerfen, aber nicht um diese zu bestätigen. Die Aussage, die bestätigt werden soll, sollte in der Alternativhypothese enthalten sein. Merke auch: ein statistischer Signifikanztest ist kein formaler Beweis. ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 78 Hypothesentests, Durchführung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests • Wählen Sie zwei sich ausschließende Arbeitshypothesen und spezifizieren Sie α. • Erheben Sie Daten und prüfen Sie, ob annähernd normalverteilte Daten vorliegen (EDA;Chi-Quadrat-Test). • Wählen Sie dann auf Basis der Verteilung einen parametrischen oder nichtparametrischen Test. Dieser ist in Form einer Teststatistik gegeben, welche eine bekannte Verteilung unter H0 hat und dazu tendiert, (absolut) große Werte anzunehmen, falls H1 wahr ist. • Berechnen Sie den konkreten Wert der Teststatistik und vergleichen sie ihn mit dem kritischen Wert der Verteilung der Teststatistik. • Alternativ: geben Sie den zugehörigen p-Wert an (p-Wert: minimale Irrtumswahrscheinlichkeit, bei der H0 gerade noch abgelehnt werden kann). • Lehnen Sie H0 ab, falls der p-Wert kleiner als α ist. ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 79 Stichprobenumfang 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot • Zur Erinnerung: σ̂ X − tn−1,1−α/2 · √ ; X + . . . n ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests • Frage: Wie viele Beobachtungen sind notwendig, um eine vorspezifizierte Breite ∆ einzuhalten. ❖ Stichprobenumfang ❖ Teststärke σ̂ 2tn−1,1−α/2 · √ ≤ ∆, n ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle umgestellt 2 σ̂ n ≥ 2tn−1,1−α/2 · ∆ • Probleme: - Nur implizite Lösung bezüglich n. σ̂ ist zufällig und daher im Vorfeld unbekannt. Selbst wenn für σ̂ ein „gutes” Surrogat existiert und n determiniert werden kann, würde nur der Erwartungswert des immer noch zufälligen KI’s kleiner ∆ sein. ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 80 Stichprobenumfang, Beispiel 1. Basiswissen Statistik 2. Epidemiologie ֒→ Lege α und 1 − β (Power) fest. Standard: α = 5% und (1 − β) = 80% 3. Statistische Inferenz ❖ Zufallsvariablen n≥ ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte 2 s 2 n ≥ 2 tn−1,1−α/2 + tn−1,1−β/2 · ∆ ❖ Stichprobenumfang ❖ Parametrische Tests ❖ Nichtparametrische Tests σ̂ 2 tn−1,1−α/2 + tn−1,1−β/2 · ∆ ֒→ Praxis: ersetze σ̂ durch die Schätzung s, d.h. ❖ Hypothesentests ❖ Unabhängigkeitstest ● Beispiel: ֒→ Wie viele Wassermelonen sind notwendig, um ein KI bezüglich des erwarteten Gewichts zu erhalten, das 1 − α = 0.9 und 1 − β = 0.8 für ∆ ≤ 0.3kg aufweist? n > 295 ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 81 Stichprobenumfang, Zusammenfassung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte • Folgende Größen werden zur Fallzahlschätzung benötigt: - primäre Variable Null- und Alternativhypothese Testverfahren minimal zu erreichender relevanter Unterschied Abschätzung der Standardabweichung für die primäre Variable Fehler 1. Art Power • Der nachzuweisende Unterschied basiert auf einer fachlichen Einschätzung des minimalen klinisch relevanten Effektes oder des erwarteten Effektes einer neuen Behandlung. • Die Fallzahl ist umso höher, je kleiner der Fehler 1. Art, je höher die Power, je kleiner der nachzuweisende Unterschied und je größer die Standardabweichung. ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 82 Teststärke 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler • Zur Erinnerung: Für jeden statistischen Test H0 vs. H1 gilt: - α Wahrscheinlichkeit eines Typ I Fehlers. β Wahrscheinlichkeit eines Typ II Fehlers. • Ziel: Die Wahrscheinlichkeit bezüglich jeder Fehlentscheidung so gering wie möglich halten. • Definition: Die Teststärke (Power) ist durch 1 − β gegeben, also durch die Wahrscheinlichkeit H0 abzulehnen, wenn H1 tatsächlich wahr ist. • Fakten: - Der Typ I Fehler ist unter Kontrolle. Der Typ II Fehler ist nicht unter Kontrolle. Hohe Teststärke ⇔ Kleine Wahrscheinlichkeit eines Typ II Fehlers. ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 83 Teststärke 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse • Für ein festgesetztes α und einem typischerweise unbekanntem σ beantwortet die Powerfunktion im Prinzip drei Fragen: i) Sei n und das wahre ∆ 6= 0 vorgelegt: Wie groß ist die Power 1 − β, um dieses wahre ∆ aufzudecken? ii) Sei eine Teststärke von 1 − β und das wahre ∆ 6= 0 vorgelegt: wie groß muss n sein, um das wahre ∆ mit einer Wahrscheinlichkeit von 1 − β aufzudecken? iii) Sei n und das wahre 1 − β vorgelegt: Welches ist das kleinste ∆, das mit einer Wahrscheinlichkeit von 1 − β aufgedeckt werden kann. • Anmerkung: Auch hier wird eine Grobschätzung von σ benötigt. ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 84 Teststärke, Beispiel 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen • Beispiel: Gewicht von Wassermelonen Hypothese: µ0 = 5.3kg Die Nullhypothese kann bei einem arithmetischen Mittel von 5.1 zum Niveau 0.05 nicht abgelehnt werden (p = 0.2598). Wie hoch ist die Power für diesen Ein-Stichproben-t-Test? - Geforderter Mittelwert |∆| := |µ0 | ≥ 0.2. Stichprobe: n = 20, α = 0.05 und σ ∗ = 0.77 ֒→ Power für vorgelegtes n = 20 und |∆| = 0.2 (mit σ = 0.77 and α = 5 %) ist 0.197. ֒→ Stichprobengröße für vorgelegtes 1 − β = 80 % und |∆| = 0.2 (with σ = 0.77 and α = 5 %) ist 119. ֒→ Kleinstes ∆ für vorgelegtes 1 − β = 80 % and n = 20 (with σ = 0.77 and α = 5 %) ist 0.51. • Berechnungen erfolgen etwa mit G∗Power oder via R mit Hilfe des Befehls power.t.test(· · · ). IT-Stat – 85 Tests der Lageparameter 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz • 1 Stichprobe (mind. ordinales Messniveau): NV Einstichproben t-test nicht NV Wilcoxons Vorzeichen rang-test ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke • mehrere Stichproben (mind. ordinales Messniveau): Anzahl der Stichproben ❖ Wahl des Testverfahrens ❖ Anpassungstest 2 ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche NV ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten nicht NV unabh. Zweistichprobent-Test Wilcoxons Rangsummentest p>2 abh. Einstichprobent-Test Wilcoxons Vorzeichenrang-test unabh. ANOVA KruskalWallis test abh. ANOVA mit Messwiederholungen Friedmantest ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 86 Allgemein 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 87 Chi-Quadrat-Anpassungstest 1. Basiswissen Statistik 2. Epidemiologie Fragestellung: Ist die Annahme eines bestimmten Verteilungsmodells gerechtfertigt oder nicht? 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke Vorgehensweise: - Vergleich von beobachteten und erwarteten Häufigkeiten: Oi ... beobachtete Anzahl bei Ausprägung i Ei ... erwartete Anzahl aus der Verteilungsannahme - Modifikation der Differenz Oi − Ei in eine χ2 -verteilte Variable: ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte χ2 = X (Oi − Ei )2 i Ei - der χ2 -Wert ist stets positiv - große Werte von χ2 offenbaren nicht vernachlässigbare Abweichungen von der unterstellten Verteilung ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 88 Unabhängigkeitstest 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Fragestellung: Sind 2 kategorielle Variablen mit je 2 Ausprägungen als unabhängig anzusehen? Beispiel (Vierfeldertafel): Unterscheidet sich in einer Firma die Arbeitszufriedenheit von Frauen und Männern? ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle Beobachtete Häufigkeiten: ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse Frauen Männer Zufrieden 102 (a) 89 (c) Nicht zufrieden 234 (b) 170 (d) Randhäufigkeiten: ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle Frauen Männer Gesamt Zufrieden 102 89 191 Nicht zufrieden 234 170 404 Gesamt 336 259 595 ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 89 Unabhängigkeitstest 1. Basiswissen Statistik Erwartete Häufigkeiten: 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz Frauen Männer Zufrieden (191*336)/595=108 (191*259)/595=83 Nicht zufrieden (404*336)/595=228 (404*259)/595=176 Berechnung der Teststatistik: ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest χ2 = [(102 − 108)2 /108] + [(89 − 83)2 /83] + [(234 − 228)2 /228] + [(170 − 176)2 /176] = 1.12 ❖ Unabhängigkeitstest Vereinfachte Formel: ❖ Parametrische Tests ❖ Nichtparametrische Tests χ2 = N (|ab−cd|) (a+b)(c+d)(a+c)(c+d) , bzw. mit Stetigkeitskorrektur nach Yates (bei ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression kleinen Stichprobenumfängen) ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler 2 χ = N (|ab−cd|− N 2 ) (a+b)(c+d)(a+c)(c+d) . ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 90 Einstichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz Beispiel: Behauptung: (Nullhypothese) Wassermelonen wiegen im Schnitt 5.5 kg d.h. H0 : µ0 = 5.5 Mögliche Alternativen: ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest A : H1 : B : H1 : C : H1 : µ 6= 5.5 µ < 5.5 µ > 5.5 ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 91 Einstichproben-t-Test 1. Basiswissen Statistik Beispiel: 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests H0 : µ = 5.5 = µ0 H1 : µ 6= 5.5 Irrtumswahrscheinlichkeit: α = 0.05 - Vorgehensweise: ZV X: “Gewicht“ , n = 20 - Annahme: X ∼ N (µ0 ; σ 2 ) Rechtfertigt die Information in der Stichprobe diese Aussage der Nullhypothese über µ? ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 92 Einstichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie • Lösung: Nach dem Zentralen Grenzwertsatz (ZGWS) ist: 3. Statistische Inferenz ❖ Zufallsvariablen σ2 X̄ ∼ N (5.5; ) n ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang Schätze die unbekannte Varianz σ 2 durch s2 . Im Beispiel: s2 = 0.6 Es gilt: ❖ Teststärke T = ❖ Wahl des Testverfahrens ❖ Anpassungstest √ n X̄ − µ0 s ist t(n−1) -verteilt. ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche • Intuitv: - ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen - lehne H0 ab, falls X̄ (Mittelwert der Stichprobe) „zu weit“ von µ0 = 5.5 entfernt ist. → oder was identisch √ ist: 0 lehne H0 ab, falls n X̄−µ „zu groß“ s IT-Stat – 93 Einstichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten • Hier: Teststatistik T = √ 5.1 − 5.5 = |−2.32| 0.77 = t(19,0.025) = 2.093 20 • kritischer Wert: t(n−1,α/2) d.h. |T | „zu groß“. • p-Wert: p = 0.0314 • KI bezüglich des Erwartungswertes: [4.73; 5.46]. ⇒ lehne H0 ab: D.h. es kann nicht davon ausgegangen werden, dass das Durchschnittsgewicht der Wassermelonen gleich 5.5 kg ist. ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 94 Einstichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz • Achtung: Je weniger Daten, desto unsicherer die Entscheidung. - Beispiel: ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot n = 10 , X̄ = 5.1 , s2 = 0.6 ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang T = |−1.64| < t(9,0.025) = 2.26 d.h. lehne H0 nicht ab. ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 95 Zweistichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie • Effekt einer toxischen Substanz auf den Erwartungswert des Nierengewichts von Ratten. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse • Zwei Zufallsstichproben von n1 = 13 (Placebo-Gruppe) und n2 = 18 (Verum-Gruppe). • Annahme: Das individuelle Nierengewicht ist in beiden Gruppen i = 1, 2 unabhängig N (µi , σ 2 )-verteilt. • Hypothesen informal: H0 : Verum hat keinen Effekt vs. H1 : Verum hat einen Effekt. • Hypothesen formal: H0 : µ1 = µ2 vs H1 : µ1 6= µ2 . • Irrtumswahrscheinlichkeit α = 0.05. ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 96 Zweistichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen Mögliches Szenario für Normaldichten unter H1 . ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests µ1 ❖ Stichprobenumfang µ2 ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests • Für zwei unabhängige, normalverteilte Stichproben mit gleicher Varianz (Homoskedastie) eignet sich der zweiseitige Zwei-Stichproben-t-Test ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten T := s 1 1 + n1 n2 X −Y (n1 − 1)σ̂12 + (n2 − n1 + n2 − 2 1)σ̂22 ∼ t(n1 + n2 − 2) ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 97 Zweistichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle • Datentabelle ID R01 R02 R03 R04 R05 R06 R07 R08 R09 R10 R11 R12 R13 R14 R15 R16 Group Verum Placebo Verum Verum Placebo Verum Placebo Verum Placebo Verum Verum Verum Placebo Placebo Placebo Placebo Weight 2.15 1.56 1.96 2.49 2.30 1.83 2.01 2.12 1.71 1.89 2.03 2.43 1.69 1.92 1.69 1.76 ID R17 R18 R19 R20 R21 R22 R23 R24 R25 R26 R27 R28 R29 R30 R31 Group Verum Placebo Verum Placebo Placebo Verum Verum Verum Placebo Verum Verum Verum Verum Placebo Verum Weight 2.10 1.88 1.88 1.93 1.96 2.19 2.37 2.38 1.97 2.00 2.25 2.00 2.05 1.63 2.15 ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 98 1. Basiswissen Statistik Boxplots and raw data Normal q−q plot: Placebo ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke Placebo Verum ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests Sample Quantiles 2.1 2.3 ❖ Zentraler Grenzwertsatz • EDA: Placebo Verum Min. 1.560 Min. 1.830 Normal q−q plot: Verum 1.9 ❖ Parameterschätzung 1.6 ❖ QQ-Plot Sample Quantiles 1.8 2.0 2.2 ❖ Verteilungen 1.6 ❖ Zufallsvariablen Weight [g] 1.8 2.0 2.2 3. Statistische Inferenz 2.4 2. Epidemiologie 2.5 Zweistichproben-t-Test −1.5 −0.5 0.5 1.5 Theoretical Quantiles 1st Qu. 1.690 1st Qu. 2.000 Median 1.880 Median 2.110 −2 Mean 1.847 Mean 2.126 −1 0 1 Theoretical Quantiles 3rd Qu. 1.960 3rd Qu. 2.235 2 Max. 2.300 Max. 2.490 • σ̂1 = 0.1995990 (Placebo) und σ̂2 = 0.1953018 (Verum) ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 99 Zweistichproben-t-Test 1. Basiswissen Statistik 2. Epidemiologie • EDA zeigt, dass die Annahmen bezüglich des zweiseitigen Zwei-Stichproben-t-Test erfüllt sind. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte • Teststatistik: T := s 1 1 + n1 n2 X −Y (n1 − 1)σ̂12 + (n2 − 1)σ̂22 n1 + n2 − 2 = −3.8919 • Freiheitsgrade: n1 + n2 − 2 = 29. • p-value: p = 0.0005362. • KI bezüglich der Differenz der Erwartungswerte: [−0.43; −0.13]. • Testentscheidung: Lehne H0 ab, da p < α, respektive weil 0 nicht im KI bezüglich der Differenz der Erwartungswerte enthalten ist. ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 100 Welch-Satterthwaite-Test 1. Basiswissen Statistik 2. Epidemiologie • Annahme: Population ist normalverteilt aber heteroskedastisch (verschiedene Streuung) 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz σ1 ≠ σ2 ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests µ1 µ2 • Falls µ1 − µ2 von Interesse, können Sie den modifizierten Welch-Test nutzen. ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 101 Welch-Satterthwaite-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen • Irrtumswahrscheinlichkeit α = 0.05. • Teststatistik ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke t := q X1 − X2 s21 n1 ❖ Anpassungstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle n2 • Freiheitsgrade (Welch-Satterthwaite-Gleichung): ❖ Wahl des Testverfahrens ❖ Unabhängigkeitstest + = −3.8777 s22 df := ν := s21 n1 s41 n21 ·(n1 −1) + + s22 n2 2 s42 n22 ·(n2 −1) = 25.669 • p-value: p = 0.0006538. • KI bezüglich θ: [−0.43; −0.13]. • Testentscheidung: Lehne H0 ab, da p < α, respektive 0 nicht im KI bezüglich θ enthalten ist. ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 102 Wilcoxons Tests 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz • Vorteil: - ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle - Annäherend „normalverteilte“ Daten werden nicht vorausgesetzt. Tests sind sehr einfach durchzuführen Auch „Rangmerkmale“ wie z.B. Schulnoten können „getestet“ werden. ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 103 Die Idee des Wilcoxon-Vorzeichenrangtests 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz - Dieser Test wird angewendet, falls es sich um paarige (abhängige) Messreihen handelt oder eine Hypothese über den Median einer Stichprobe überprüft werden soll ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest Beispiel: eine Variable wird an einer Person zu verschiedenen Zeitpunkten gemessen (z.B. vor und nach medikamentöser Behandlung) ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 104 Beispiel: 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen Für den Test werden 10 Personen nach ihrem Urteil über die Verträglichkeit zweier Behandlungen A und B mit Hilfe einer Bewertungsskala von 1 (sehr gut) bis 5 (sehr schlecht) gefragt. ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung Person Nr. ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten 1 2 3 4 5 6 7 8 9 10 Produkt A B 5 3 1 2 3 2 3 3 4 2 1 3 2 3 4 2 5 1 4 1 Differenz 2 −1 1 0 2 −2 −1 2 4 3 Rang (unabhängig vom Vorzeichen) 5.5 (−)2 2 − 5.5 (−)5.5 (−)2 5.5 9 8 Summe der plus - Ränge: 35.5 und Summe der minus - Ränge: 9.5 ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 105 Testentscheidung 1. Basiswissen Statistik ● je besser die Beurteilung von Produkt B: 2. Epidemiologie ✦ ✦ 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ● ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ● ● ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ● desto größer die Summe der plus - Ränge desto kleiner die minus - Summe der Ränge Verwerfung der Nullhypothese: Median der Differenzen von A und B = Null, wenn die kleinere der beiden Summen zu klein ist. der kritische Wert (Tabelle oder Software) ist c = 6 bei α = 5% die Summe der minus - Ränge (9.5) unterschreitet den kritischen Wert von 6 nicht, d.h. Produkt B wird nicht signifikant besser bewertet als Produkt A ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 106 Wilcoxon Rangsummentest 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen • Annahme: Population ist nicht normalverteilt, Verteilung unterscheidet sich nur um einen „shift” und ist stetig für jede Gruppe. ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens θ ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen • Für Hypothesen bzgl. θ kann ein nichtparametrischer Lagetest, z.B. der Wilcoxon Rangsummentest (Mann-Whitney’s U-Test) benutzt werden. IT-Stat – 107 Wilcoxon Rangsummentest 1. Basiswissen Statistik Vergleich zweier unabh. Stichproben 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen - benötigt keine Normalverteilungsannahme, setzt aber stetig verteilte Daten voraus - verwendet nur die Ränge der Beobachtungen der gemeinsamen Stichprobe: - die kleinste Beobachtung erhält Rang 1; die größte Beobachtung erhält Rang n1 + n2 - Testidee basiert auf der Annahme: falls (hypothetisch) alle Daten der ersten Stichprobe kleinere Werte als die der zweiten Stichprobe habem, ist (logischwerweise) die Summe der Ränge in der ersten Stichprobe kleiner als die Summe der Ränge in der zweiten Stichprobe - Teststatistik: X W = Ränge der ersten Stichprobe - Nullhypothese: H0 : M edian1 = M edian2 - Alternativhypothese: H0 : M edian1 6= M edian2 IT-Stat – 108 Wilcoxon Rangsummentest 1. Basiswissen Statistik 2. Epidemiologie • Effekt einer toxischen Substanz auf den Erwartungswert des Nierengewichts von weiblichen Laborratten. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler • Zwei Zufallsstichproben von n1 = 13 (Placebo-Gruppe) und n2 = 18 (Verum-Gruppe). • Annahme: Das Nierengewicht ist unabhängig in und über die Gruppen hinweg stetig verteilt. Beide Gruppen weisen die gleiche Verteilung auf, die sich lediglich um einen shift-Parameter unterscheidet. • Hypothesen informal: H0 : Verum hat keinen Effekt vs. H1 : Verum hat einen Effekt. • Hypothesen formal: H0 : M edian1 = M edian2 vs H0 : M edian1 6= M edian2 . • Irrtumswahrscheinlichkeit α = 0.05. ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 109 Wilcoxon Rangsummentest 1. Basiswissen Statistik 2. Epidemiologie • Hilfsmittel: Ränge, d.h. Rang 1 Rang n 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Regression ❖ KQ-Residuen ❖ Modellgüte kleinste Beobachtung größte Beobachtung Falls 2 oder mehr Beob. identisch sind wählt man mittlere Ränge. • Wie entscheidet man? Intuitiv: - Je höher die Ränge in der „Verum“ Stichprobe, desto mehr spricht dies gegen H0 . • Test: Zweiseitiger Wilcoxon Rangsummentest ❖ Varianzanalyse ❖ Multiple Vergleiche ≡ ≡ Wn1 ,n2 := n1 X i=1 R(Xi ) approx ∼ N n1 (n2 + n1 + 1) n2 n1 (n2 + n1 + 1) ; 2 12 ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 110 Wilcoxon Rangsummentest 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle • Datentabelle ID R01 R02 R03 R04 R05 R06 R07 R08 R09 R10 R11 R12 R13 R14 R15 R16 Group Verum Placebo Verum Verum Placebo Verum Placebo Verum Placebo Verum Verum Verum Placebo Placebo Placebo Placebo Weight 2.15 1.56 1.96 2.49 2.30 1.83 2.01 2.12 1.71 1.89 2.03 2.43 1.69 1.92 1.69 1.76 Rank 23.5 1 13.5 31 27 7 18 22 5 10 19 30 3.5 11 3.5 6 ID R17 R18 R19 R20 R21 R22 R23 R24 R25 R26 R27 R28 R29 R30 R31 Group Verum Placebo Verum Placebo Placebo Verum Verum Verum Placebo Verum Verum Verum Verum Placebo Verum Weight 2.10 1.88 1.88 1.93 1.96 2.19 2.37 2.38 1.97 2.00 2.25 2.00 2.05 1.63 2.15 Rank 21 8.5 8.5 12 13.5 25 28 29 15 16.5 26 16.5 20 2 23.5 ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 111 Wilcoxon Rangsummentest 1. Basiswissen Statistik 2. Epidemiologie • Teststatistik: Summiere die Ränge der Verum-Gruppe 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest Wn1 ,n2 := n1 X R(Xi ) = 370 i=1 • p-value: p = 0.001098. • KI bezüglich θ: [−0.44; −0.13]. • Testentscheidung: Lehne H0 ab, da p < α, respektive 0 nicht im KI bezüglich θ enthalten ist. ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 112 Varianzanalyse, ANOVA 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Varianzanalyse (Vergleich von mehr als zwei Stichproben) Parametrische Lösungen: Die Idee des F-Tests ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest - p Stichproben mit möglicherweise unterschiedlichen Stichprobenumfängen n1 , ..., np - die i-te Stichprobe folgt einer N (µi , σ 2 )-Verteilung: unbekannter Erwartungswert µi Varianz σ 2 > 0 - diese Parameter sollten in allen Stichproben annähernd gleich sein ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 113 F-Test 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens - Test der Nullhypothese: H0 : µ1 = ... = µp gegen H1 : mindestens zwei Erwartungswerte sind verschieden - Verwerfung von H0 , falls die Differenz zwischen den Stichprobenmitteln hinreichend groß ist die Streuung in den p Stichproben nicht zu groß ist - Grundkomponente des Tests: ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse M ST = p X i=1 ni (ȳi. − ȳ.. )2 /(p − 1) ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ȳi. ... Stichprobenmittel der i-ten Stichprobe ȳ.. ... Mittelwert aller Beobachtungen ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 114 F-Test 1. Basiswissen Statistik - zweite Komponente: 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens M SE = p X ni X i=1 j=1 (yij − ȳi )2 /(N − p) yij ... Beobachtungen ȳi ... Mittelwert der jeweiligen Stichprobe - Ablehnung von H0 , falls ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests M ST > Fp−1,N −p;1−α M SE ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 115 Nichtparametrische Anova 1. Basiswissen Statistik Nichtparametrische Lösung: 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Der Kruskal-Wallis-Test - nichtparametrisches Gegenstück zur einfachen ANOVA ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz Idee des Tests: ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens - Verwerfung von H0 , falls sich die aus der Gesamtstichprobe berechneten Ränge der i-ten Stichprobe zu sehr unterscheiden ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression KW = 1 C p X 12 1 2 τi. − 3(N + 1) N (N + 1) i=1 ni ! ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 116 Kruskal-Wallis Test 1. Basiswissen Statistik wobei 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang g X 1 C =1− 2 t3l − tl N (N − 1) l=1 eine Korrekturgröße ist g ... Anzahl unterschiedlicher Werte mit Häufigkeiten τi und tl ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests - Falls H0 in diesem Test verworfen wird, gibt es signifikante Unterschiede zwischen den Stichproben. ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 117 Erweiterungen der einfachen Varianzanalyse: Zweifachklassifikation 1. Basiswissen Statistik 2. Epidemiologie Einfachklassifikation: Gibt es Unterschiede zwischen den µi in I Populationen? 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen yij = µ + αi + uij wobei uij ∼ N (0, σ 2 ), αi = µi − µ0 und ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke I X αi = 0. i=1 Zweifachklassifikation: Ergänzung des Modells um weitere (qualitative) Faktoren βj und Wechselwirkungen (αβ)ij ❖ Wahl des Testverfahrens yijk = µ + αi + βj + (αβ)ij + uijk . ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten mit I X i=1 αi = 0, J X j=1 βj = 0 und I X i=1 (αβ)ij = J X (αβ)ij = 0 j=1 und i ∈ {1, 2, · · · , I}, j ∈ {1, 2, · · · , J}, k ∈ {1, 2, · · · , K}. ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 118 ANCOVA und repeated measurements 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Bei der Kovarianzanalyse wird in ein varianzanalytisches Modell zusätzlich ein quantitativer Faktor xij einbezogen: yij = µ0 + αi + γj xij + uij . ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang xij besteht oftmals aus dem Baseline-Werten von y. Falls eine Datenerhebung (an gleichen Untersuchungseinheiten) zu T Zeitpunkten erfolgt bietet sich ein rep. measurements Modell an: ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen yijt = µ + αi + θt + (γθ)it + πj(i) + uijt . Die zeitlichen Abhängigkeiten werden über eine Kovarianzmatrix modelliert, die z.B. eine autorgressive Struktur 1. Ordnung haben kann, d.h. z.B. für T = 4: 2 2 3 σ1 σ1 σ2 ρ σ1 σ2 ρ σ1 σ2 ρ 2 2 σ σ ρ σ σ ρ σ 1 2 1 2 2 . Cov(yj ) = 2 σ1 σ2 ρ σ3 σ42 IT-Stat – 119 Multiplizität 1. Basiswissen Statistik 2. Epidemiologie • Problematik: Werden mehrere Hypothesentests auf derselben Datenbasis durchgeführt, steigt die Wahrscheinlichkeit dafür, mindestens eine dieser Hypothesen fälschlicherweise abzulehnen, weit über die für den Fehler 1. Art festgesetzte Grenze. 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang • Beispiel: Angenommen, es werden 5 Mittelwerte durch paarweise t-Tests zum 5%-Niveau miteinander verglichen. Dann beträgt die Anzahl der Vergleiche 5(5 − 1)/2 = 10. Unter der Voraussetzung, dass die Vergleiche unabhängig sind, lässt sich eine Obergrenze für die gesamte Fehlerrate des Experimentes ableiten: 1 − (1 − 0.05)10 = 0.40 ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler • Konsequenz: a) ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen b) Der kritische Wert, der für die Signifikanz überschritten muss, muss erhöht werden (multiple Vergleiche). Die Fehlerrate für die paarweisen Vergleiche muss gesenkt werden, um die Fehlerrate des gesamten Experimentes unter 5% zu halten (p-Wert IT-Stat – 120 Adjustierung). Multiple Vergleiche 1. Basiswissen Statistik Simultane (multiple) Vergleiche mehrerer Erwartungswerte 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen - Aufdeckung von Unterschieden in den Erwartungswerten bei mehr als zwei Stichproben ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang Scheffé- und Tukey-Test - Berechnung der Differenzen der Mittelwerte ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche Ȳi. − Ȳj. für jedes Paar (i, j), i < j - der Unterschied ist signifikant, falls er eine Grenzdifferenz übersteigt ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 121 Multiple Vergleiche 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot Scheffé-Test - setzt normalverteilte Daten voraus - kann auch auf Stichproben unterschiedlichen Umfangs angewendet werden ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest - Grenzdifferenz: s F SDα = (p − 1) · M SE · 1 1 + ni nj · Fp−1,N −p;1−α ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 122 Multiple Vergleiche 1. Basiswissen Statistik Tukey-Test 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot - anwendbar auf: normalverteilte Daten Stichproben mit gleicher Länge ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests - Grenzdifferenz: ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest HSDα = r M SE · qp,N −p;1−α n ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche α ... Signifikanzniveau qp,N −p ... Studentisierte Spannweite ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 123 Multiple Vergleiche 1. Basiswissen Statistik Fisher’s Least Significant Difference-Test (LSD) 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen - falls der F -Test in der ANOVA H0 verwirft, Berechnung der Differenz: ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke t−1 N −p,1−α/2 s M SE 1 1 + ni nj ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler MSE-Wert der entsprechenden ANOVA-Tabelle - Entscheidung auf signifikante Unterschiede für jedes Paar, falls s 1 1 + M SE |Ȳi . − Ȳj .| > t−1 N −p,1−α/2 ni nj ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 124 Multiple Vergleiche 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse Dunnett-Test - Idee: Vergleich verschiedener Faktoren (Einflußgrößen) mit einem Standardfaktor µ1 - Test der (p − 1) Differenzen µp − µ1 , µp−1 − µ1 , · · · , µ2 − µ1 auf Signifikanz Vorgehensweise: 1. - alle Stichproben haben den gleichen Umfang n: Vergleich der Mittelwerte |µ̂i − µ̂1 | mit DSDp−1,α r 2 DSDp−1,α = s · · |d|p−1,ν;1−α n ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte |d|p−1,ν;1−α aus entsprechenden Tabellen ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 125 Multiple Vergleiche 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz 2. - Standardbehandlung vom Umfang m > n: korr Berechnung der neuen Grenzdifferenz DSDp−1,α ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz korr = s · DSDp−1,α r 1 1 + · |d|p−1,ν;1−α m n ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests h wp−1,ν;1−α n i · 1+ 1− 100 m wp−1,ν;1−α ... Korrekturgröße; ν = N − p ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 126 p-Wert Adjustierung 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke Bonferroni-Holm-Prozedur - Berechnung der p-Werte für alle möglichen paarweisen Vergleiche (Zwei-Stichproben-t-Tests oder Wilcoxon-Rangsummen-Test) - Ordnung der p-Werte in aufsteigender Folge - Entscheidung auf signifikante Unterschiede, falls der kleinste p-Wert α etc. , der zweitkleinste kleiner als kleiner ist als α c c−1 (c ...Anzahl der paarweisen Tests) - dieser Test übersteigt das globale Signifikanzniveau α nicht ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 127 Bivariate Analyse: Regression 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle • Situation: Metrische bivariate Datenstruktur mit nahezu linearem Zusammenhang (rp > 0.5 und rP signifikant von Null verschieden). • Frage: Wie groß sind Steigung und Achsenabschnitt einer (optimalen) Geraden im Modell yt = β1 + β2 xt + ut ? • Antwort: Geschätzte KQ-Regressionsfunktion ŷt = β̂1 + β̂2 xt ❖ Hypothesentests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen β̂2 : Geschätzte erwartete Steigung. Erklärt den durchschnittlichen Zuwachs in y, falls x um eine Einheit steigt. 10 12 14 16 18 ❖ Parametrische Tests ❖ Nichtparametrische Tests y(x) = −1.1 + 0.11 * x 8 ❖ Unabhängigkeitstest Regression line: 6 ❖ Anpassungstest Deaths due to prostate cancer vs. fat intake r P = 0.885 4 ❖ Wahl des Testverfahrens β̂1 : Geschätzter erwarteter Achsenabschnitt. Erklärt die durchschnittliche Ausprägung von y falls x = 0. 2 ❖ Teststärke No. of Deaths per 100000 ❖ Stichprobenumfang 30 40 50 60 70 80 90 110 130 150 Average fat intake (in grams/day) IT-Stat – 128 KQ-Schätzer 1. Basiswissen Statistik 2. Epidemiologie • Lösung des Kleinste-Quadrate-Minimierungsproblems führt zu folgenden Schätzfunktionen: 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen β̂1 (yt , xt , T ) =: β̂1 ❖ QQ-Plot = ȳ − β̂2 x̄ ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests β̂2 (yt , xt , T ) =: β̂2 = T X t=1 (yt − ȳ)(xt − x̄) T X t=1 (xt − x̄)2 ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 129 KQ-Residuen 1. Basiswissen Statistik 2. Epidemiologie • Es ist nun möglich, den (unbekannten) Fehler ut durch ût (Residuum) folgendermaßen zu schätzen: 3. Statistische Inferenz ❖ Zufallsvariablen ût = yt − β̂1 − β̂2 xt ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang • Die Varianz des Fehlers ut ist generell unbekannt, kann aber geschätzt werden durch: ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests T X 1 c û2t σu2 = T − 2 t=1 ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 130 Streuungszerlegung und Bestimmtheitsmaß 1. Basiswissen Statistik 2. Epidemiologie • Man kann zeigen, dass im einfachen linearen Modell mit Absolutglied die sog. Streuungszerlegung gilt: 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen T X t=1 | (yt − ȳ)2 = {z ≡T SS } T X t=1 | (ŷt − ȳ)2 + T X ≡ESS ≡RSS {z } û2t t=1 | {z } • Über die Streuungszerlegung gelangt man zum Bestimmtheitsmaß: RSS ESS =1− R = T SS T SS 2 • Eigenschaften von R2 im linearen Regressionsmodell mit Absolutglied: ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten R2 ∈ [0; 1] und 2 R2 = ryx ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 131 t-Tests; Standardfehler 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest • Die Fehlervarianz σu2 ist i.d.R. unbekannt: verwende daher zum Testen die geschätzten Standardfehler se(β̂i ): v u T u X u σ v x2t u u cu2 c2 u u σ t=1 u u u se(β̂1 ) = u T , se(β̂2 ) = u T uX u X 2 t tT (xt − x̄) (xt − x̄)2 t=1 t=1 ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 132 t-Tests für β1 und β2 1. Basiswissen Statistik 1. Festlegung der Irrtumswahrscheinlichkeit α und der Hypothesen: 2. Epidemiologie i) ii) iii) 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle H0 : βi = βi∗ H0 : βi ≤ βi∗ H0 : βi ≥ βi∗ ❖ Stichprobenumfang ⇒ ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche H1 : βi 6= βi∗ (zweiseitiger Test) H1 : βi > βi∗ (einseitiger Test) H1 : βi < βi∗ (einseitiger Test) 3. Berechnung der Teststatistik: ❖ Hypothesentests ❖ Anpassungstest vs. vs. vs. tβi β̂i − βi∗ := ∼ t(T −2) se(β̂i ) 4. Ermittlung des kritischen Wertes tT −2,1− α2 . 5. Testentscheidung: sollte |tβi | > tT −2,1− α2 , kann die Nullhypothese abgelehnt werden, d.h. βi ist signifikant von βi∗ verschieden. 6. Alternativ: Lehne H0 ab, falls der p-Wert < 0.05 ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ● Anmerkung: Die Standardwerte von βi∗ sind Null. Besonders wichtig ist der Test von H0 : β2 = β2∗ = 0 ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 133 Modellvarianten 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen • Modellvarianten: Logarithmische Modelle: = β 1 + β 2 x t + ut (log-lin-Modell) yt = β1 + β2 ln xt + ut (lin-log-Modell) ln yt = β1 + β2 ln xt + ut (log-log-Modell) ln yt ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 134 Erweiterungen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen ❖ QQ-Plot • Power-Modell: yt = β1 + β2 xpt + ut wobei p bekannt sei. ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ֒→ Je nach Definition von p, ergeben sich die folgenden Spezialfälle des Power-Modells: ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens yt = β1 + β2 x2t + ut yt = β1 + β2 yt √ = β 1 + β 2 x t + ut ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche 1 + ut xt (x-Quadrat-Modell) (Reziprokes Modell) (Wurzelmodell) ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 135 Box-Cox-Modelle 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen • Box-Cox-Transformation: (p) yt ❖ Verteilungen ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz (p) yt ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression (q) xt (q) = β1 + β2 xt yp −1 tp , := ln yt , xp −1 tq , := ln xt , + ut falls p 6= 0, falls p = 0. falls q 6= 0, falls q = 0. ֒→ Die Exponenten p, q können aus den Daten geschätzt werden und ermöglichen damit eine Auswahl zwischen linearen und nichtlinearen Modellen. ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen IT-Stat – 136 Logistische Regression 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz ❖ Zufallsvariablen ❖ Verteilungen Das Logit-Modell • Sei yt ∈ {0, 1} und xt beliebig. Dann kann der Zusammenhang zwischen yt und xt dargestellt werden über ❖ QQ-Plot ❖ Parameterschätzung ❖ Zentraler Grenzwertsatz ❖ Konfidenzintervalle ❖ Hypothesentests ❖ Stichprobenumfang ❖ Teststärke ❖ Wahl des Testverfahrens ❖ Anpassungstest ❖ Unabhängigkeitstest ❖ Parametrische Tests ❖ Nichtparametrische Tests ❖ Varianzanalyse ❖ Multiple Vergleiche ❖ Regression ❖ KQ-Residuen ❖ Modellgüte ❖ Standardfehler ❖ t-Tests ❖ Modellvarianten ❖ Box-Cox-Modelle ❖ Logistische Regression Anhang: Wichtige Prof. Dr. Bernhard Schipp Verteilungen F (yt ) = 1 1 = 1 + exp(−β1 − β2 x) 1 + e−β1 −β2 x • Bei F (yt ) handelt es sich um die Verteilungsfunktion der logistischen Verteilung, die eine stärkere Streuung als die Normalverteilung besitzt. • Sei β1 + β2 xt abgekürzt durch zt . Dann erhält man für F (yt ) mit 1 ein lineares Modell der Form: pt = 1 + exp(−zt ) pt Lt = ln = β1 + β2 xt 1 − pt p • Die Größe Lt = 1 −t p wird auch Logit genannt. t IT-Stat – 137 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen Anhang: Wichtige Verteilungen Prof. Dr. Bernhard Schipp IT-Stat – 138 Diskrete Verteilungen 1. Basiswissen Statistik Diskrete Verteilungen 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Binomialverteilung • Poisson-Verteilung • Negative Binomialverteilung Prof. Dr. Bernhard Schipp IT-Stat – 139 Diskrete Verteilungen 1. Basiswissen Statistik Binomialverteilung 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Wurde erstmals 1713 von Jakob Bernoulli in Ars Conjectandi veröffentlicht. • Ergebnis von n voneinander unabhänigigen wiederholten Experimenten mit nur zwei möglichen Ausgängen. • Entspricht einer „Urnenziehung mit Zurücklegen”. • Anwendungen: geheilt/nicht geheilt; UAW´s ja/nein Prof. Dr. Bernhard Schipp IT-Stat – 140 Diskrete Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Wahrscheinlichkeitsfunktion : 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen P (X = x) = fX (x|p; n) = ❖ Stetige Verteilungen mit n x n x n! = x!(n − x)! px (1 − p)n−x =: B(p; n) und x ∈ {1; 2; ...; n} • Der Parameter p gibt die jeweilige Erfolgswahrscheinlichkeit an. Prof. Dr. Bernhard Schipp IT-Stat – 141 Diskrete Verteilungen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen Sollte sich die Anzahl der Versuche auf n = 1 reduzieren, spricht man von einer Bernoulliverteilung: ❖ Stetige Verteilungen P (X = x) = fX (x|p) = px (1 − p)1−x =: B(p) • Verteilungsfunktion einer B(p; n)-Verteilten Zufallsvariablen : P (X ≤ x) = FX (x|p) = Prof. Dr. Bernhard Schipp x X n k=0 k pk (1 − p)n−k IT-Stat – 142 Diskrete Verteilungen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Erwartungswert und Varianz einer B(p; n)-Verteilten Zufallsvariablen X: E(X) = np und V ar(X) = np(1 − p) • Diese Verteilung besitzt die sog. Reproduktionseigenschaft. Es gilt: d B(p; n1 ) + B(p; n2 ) → B(p; n1 + n2 ) iid • Approximation für np(1 − p) > 9: X ∼ N (np; np[1 − p]) iid • Approximation für n ≥ 50, p ≤ 0, 1 und np ≤ 10: X ∼ P s(np) Prof. Dr. Bernhard Schipp IT-Stat – 143 Diskrete Verteilungen 1. Basiswissen Statistik Poisson-Verteilung 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Wurde von Poisson 1837 veröffentlicht. Die eigentliche Herleitung aus einer Sequenz von binomialverteilten ZV’s wurde bereits von Moivre 1711 in „De Mensura Sortis” gegeben. iid Es gilt für X ∼ B(p; n) und w ⊂ IN0 : limn→∞;np→λ X w BX (p; n) = X e−λ λx w x! =: P s(λ) = FX (x|λ) = P (X ≤ x) • Wichtig: n wird „groß” und np bleibt endlich und hinreichend klein”! • Daraus folgt: Anwendungen liegen bei der Erfassung von seltenen ( λ klein) Ereignissen in großen Grundgesamtheiten (n groß). Prof. Dr. Bernhard Schipp IT-Stat – 144 Diskrete Verteilungen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen • Erste bekannte Anwendung (1898) „Tod durch Hufschlag bei der preußischen Armee” und „Selbstmord von Kindern unter zehn Jahren”. ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Erwartungswert und Varianz einer P s(λ)-Verteilten Zufallsvariablen X: E(X) = λ und V ar(X) = λ • Diese Verteilung besitzt die sog. Reproduktionseigenschaft. Es gilt: d P s(λ1 ) + P s(λ2 ) → P s(λ1 + λ2 ) iid • Approximation für λ ≥ 10: X ∼ N (λ; λ) Prof. Dr. Bernhard Schipp IT-Stat – 145 Diskrete Verteilungen 1. Basiswissen Statistik Negative-Binomialverteilung 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Ergebnis von k voneinander unabhänigigen wiederholten Experimenten mit geometrischer Verteilung. Die Wahrscheinlichkeitsfunkion ist gegeben durch: k+x−1 px (1 − p)k fX (x|p; k) = P (X = x) = k−1 x ∈ IN0 η, k > 0 • Fragestellung: Wie hoch ist die Wahrscheinlichkeit nach k − 1 Erfolgen im k − 1 + x-ten Versuch den k-ten Erfolg zu erzielen (x = 1, 2, ...)? Prof. Dr. Bernhard Schipp IT-Stat – 146 Diskrete Verteilungen 1. Basiswissen Statistik 2. Epidemiologie 3. Statistische Inferenz • Erwartungswert und Varianz einer nB(p, k)-Verteilten Zufallsvariablen X: Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen E(X) = kp 1−p V ar(X) = kp kp = E(X) > 2 (1 − p) 1−p Wird für Zähldatenmodelle verwendet in denen die zu erwartende Varianz grösser als der Erwartungswert ist . Prof. Dr. Bernhard Schipp IT-Stat – 147 Stetige Verteilungen 1. Basiswissen Statistik Stetige Verteilungen 2. Epidemiologie 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Gleich-,Normal- und Lognormalverteilung • Gamma-/χ2 - und Exponentialverteilung • ,t-, F-, Weibull- und Extremwertverteilung Prof. Dr. Bernhard Schipp IT-Stat – 148 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Gleichverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Auch häufig unter dem Namen Rechteckverteilung zu finden. • Dichtefunktion der gleichverteilten ZV X: fX (x|a, b) = Prof. Dr. Bernhard Schipp 1 b−a 0 f ür sonst a≤x≤b IT-Stat – 149 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Erwartungswert und Varianz einer gleichverteilten ZV X: 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen b+a E(X) = 2 und (b − a)2 V ar(X) = 12 • Für b = 1 und a = 0 ist diese Verteilung ein Spezialfall der allgemeineren Betaverteilung: fX (x|a, b) = Z 0 Prof. Dr. Bernhard Schipp 1 1 xa−1 (1 − x)b−1 dx xa−1 (1 − x)b−1 0≤x≤1 IT-Stat – 150 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Normalverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Faltet man die Gleichverteilung „oft genug” so erhält man im Limit die von C.F. Gauß hergeleitete Normalverteilung. Die Dichte hat folgende Darstellung: 2 (x − µ) 1 2 + exp − ; x ∈ I R; µ×σ ∈ I R×I R fX (x|µ, σ 2 ) = √ 2σ 2 2πσ • Erwartungswert und Varianz einer normalverteilten ZV X: E(X) = µ Prof. Dr. Bernhard Schipp und V ar(X) = σ 2 IT-Stat – 151 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Lognormalverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen Dichtefunktion: 2 1 (lnx − µ ) 1 ∗ + 2 + exp − ; x ∈ I R ; µ ×σ ∈ I R×I R fX (x|µ∗ , σ∗2 ) = √ ∗ ∗ 2σ∗2 2πσ∗ x • Erwartungswert und Varianz einer lognormalverteilten ZV X: E(lnX) = µ∗ Prof. Dr. Bernhard Schipp und V ar(lnX) = σ∗2 IT-Stat – 152 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Gammaverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Für die Modellierung von Warteschlangen in stetiger Zeit wird häufig auf die Gammaverteilung oder auf deren Spezialfälle unter bestimmten Parameterkonstellationen zurückgegriffen. • Die Dichte ist durch folgenden Ausdruck gegeben: λr r−1 x exp{−λx} fX (x|λ, r) = Γ(r) • Wobei Γ(r) = Z ∞ x ∈ IR+ ; λ×r ∈ IR+ ×IR+ xr−1 exp{−x}dx die Gammafunktion 0 mit Funktionsargument r ist. Prof. Dr. Bernhard Schipp IT-Stat – 153 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Erwartungswert und Varianz einer gammaverteilten ZV X: 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen r E(X) = λ und r V ar(X) = 2 λ ❖ Stetige Verteilungen • χ2 -Verteilung • Für die Paramaterkonstellation fX (x|0.5; 0.5k) ergibt sich die χ2 -Verteilung: 0.5k/2 k/2−1 x exp{−0.5x} fX (x|k) = Γ(k/2) x ∈ IR+ ; k ∈ IR+ • Die Dichte einer χ2 -Verteilung ergibt sich auch aus der Summe von quadrierten N (0; 1)-verteilten Zufallsvariablen. Prof. Dr. Bernhard Schipp IT-Stat – 154 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Exponentialverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Für die Paramaterkonstellation fX (x|λ; 1) ergibt sich die Exponentialverteilung: fX (x|λ) = λexp{−λx} x ∈ IR+ ; λ ∈ IR+ • Erwartungswert und Varianz einer exponentialverteilten ZV X verhalten sich analog zur Gammaverteilung mit r = 1, bzw. für eine χ2 -verteilte ZV X mit r = 0.5k und λ = 1. Prof. Dr. Bernhard Schipp IT-Stat – 155 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • t-Verteilung (Student) 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen iid iid • Sei X ∼ N (0; 1) und Y ∼ χ2 (k) voneinander unabhängige Zufallsvariablen, so folgt die unten angeführte Funktion einer zentralen t-Verteilung mit k Freiheitsgraden. X W =p ∼ tk Y /k • Die Dichtefunktion ist gegeben durch: fW (w|k) = Γ[(k + 1)/2] 1 1 dw ·√ · 2 (k+1)/2 Γ(k/2) kπ (1 + w /k) w ∈ IR; k ∈ IR • Erwartungswert und Varianz einer t-verteilten ZV W : E(W ) = 0 Prof. Dr. Bernhard Schipp f ür k>1 und V ar(W ) = k k−2 f ür k>2 IT-Stat – 156 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • F-verteilung (Fisher) 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen iid iid • Seien X ∼ χ2 (m) und Y ∼ χ2 (n) voneinander unabhängige Zufallsvariablen, so folgt die nachstehende Funktion einer zentralen F -Verteilung mit m; n Freiheitsgraden. X/m ∼ F(m;n) R= Y /n • Die Dichtefunktion ist gegeben durch: r (m−2)/2) Γ[(m + n)/2] m m/2 · fR (r|m; n) = Γ[m/2]Γ[n/2] n [1 + (m/n)r](m+n)/2 m × n ∈ IN × IN und r ∈ IR+ • Erwartungswert und Varianz einer F -verteilten ZV R: Prof. Dr. Bernhard Schipp n E(W ) = n−2 f ür n>2 und 2n2 (m + n − 2) V ar(W ) = m(n − 2)2 (n − 4) IT-Stat – 157 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Weibullverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Ein weiteres Instrument zur Verweildaueranalyse ist die Weibullverteilung. Die Dichte hat folgende Gestalt: fX (x|a; b; c) = c b x−a b c−1 a × b × c ∈ IR × IR+ × IR+ c x−a exp − b und x≥a • Erwartungswert und Varianz einer weibullverteilten ZV X: 1 E(X) = a + bΓ 1 + c 2 1 V ar(X) = b2 Γ 1 + − Γ2 1 + c c Prof. Dr. Bernhard Schipp IT-Stat – 158 Stetige Verteilungen 1. Basiswissen Statistik 2. Epidemiologie • Extremwertverteilung 3. Statistische Inferenz Anhang: Wichtige Verteilungen ❖ Diskrete Verteilungen ❖ Stetige Verteilungen • Die Dichte hat folgende Gestalt: x−α ; fX (x) = exp −exp − β α × β ∈ IR × IR+ • Erwartungswert und Varianz einer extremwertverteilten ZV X: E(X) = a + bγ und π2β 2 V ar(X) = 6 • Wobei γ ≈ 0.577216 die Euler-Konstante darstellt. Dieses Skript basiert anteilig auf einem englischsprachigen Kompendium. Wir danken Herrn Dr. Gerrit Eichner, Universität Giessen, für die freundliche Unterstützung. Prof. Dr. Bernhard Schipp IT-Stat – 159