Aus dem Institut für Medizinische Informatik des Klinikums der Justus-Liebig-Universität, Giessen Einführung in die medizinische Statistik R.-H. Bödeker unter Mitarbeit von I. Frenz Skript zur Vorlesung Biomathematik Dichte/ühter H Dichte unter H-t P(Fehler 1. Art) = p 284 LHB 30 / p(Fehlf>r 9. Art» 316 32 11 850 693 Verlag der Ferber'schen Universitätsbuchhandlung INHALTSVERZEICHNIS 1 EINFÜHRUNG 9 1.1 Notwendigkeit der Statistik in der Medizin 1.2 Aufgaben der Statistik 9 10 2. DESKRIPTIVE STATISTIK 11 2.1 Merkmale und Skalen 11 2.2 Zusammenfassung der Daten 2.2.1 Häufigkeiten 2.2.1.1 Absolute Häufigkeiten 2.2.1.2 Relative Häufigkeiten 2.2.1.3 Gruppierte Daten 2.2.1.4 Kumulative relative Häufigkeiten 2.2.1.5 Graphische Darstellung und Charakterisierung der Häufigkeitsverteilungen 2.2.2 Lageparameter 2.2.2.1 Modus 2.2.2.2 Mediän 2.2.2.3 Arithmetischer Mittelwert 2.2.2.4 Geometrischer Mittelwert 2.2.2.5 Zusammenhang zwischen den Lageparametern 2.2.3 Streuungsparameter 2.2.3.1 Interquantilbereiche 2.2.3.2 Mittlere Abweichung 2.2.3.3 Varianz und Standardabweichung 2.2.3.4 Bedeutung von x und s2 14 14 14 15 15 17 2.2.3.5 Transformationen 17 19 19 20 21 21 22 23 23 24 25 26 26 2.3 Epidemiologische Maßzahlen 29 2.4 Begriffserläuterungen 31 2.5 Übungsaufgaben 36 3. WAHRSCHEINLICHKEITSRECHNUNG 39 3.1 Grundlegende Begriffe 3.1.2 Graphische Darstellung 40 41 3.2 Verknüpfung von Ereignissen 3.2.1 Summe mehrerer Ereignisse 3.2.2 Produkt von Ereignissen 43 43 44 3.3 Definition der Wahrscheinlichkeit 3.3.1 Relative Häufigkeit 3.3.2 Laplace'sche Definition 3.3.3 Axiome der Wahrscheinlichkeitsrechnung (Kolmogoroff) 45 45 46 47 3.4 Verallgemeinerung des Additionssatzes 47 -5- 3.5 Multiplikationssatz 3.5.1 Unabhängige Ereignisse 3.5.2 Multiplikationssatz 48 49 49 3.6 Begriffserläuterungen 50 3.7 Übungsaufgaben 52 4 BEDINGTE WAHRSCHEINLICHKEIT 57 4.1 Einführung 57 4.2 Definition der bedingten Wahrscheinlichkeit 57 4.3 Bayes-Theorem 59 4.4 Totale Wahrscheinlichkeit 61 4.4.1 Anwendung beim Bayes-Theorem 62 4.5 Beurteilung diagnostischer Tests 63 4.6 Relative or Receiver Operating Characteristics 65 4.7 Begriffserläuterungen 68 4.8 Übungsaufgaben 69 5 ZUFALLS VARIABLEN UND SPEZIELLE VERTEILUNGEN 71 5.1 Einführung 71 5.2 Erwärtungswert und Varianz der Zufallsvariablen 79 5.3 Summen und Funktionen von Zufallsvariablen und deren Erwartungswert 82 5.4 Poisson-Verteilung 91 5.5 Normalverteilung 93 5.5.1 Zusammenhang zwischen Binomialverteilung und Normalverteilung 95 5.6 Gesetz der großen Zahlen 96 5.7 Begriffserläuterungen 97 5.8 Übungsaufgaben 99 6 GRUNDGESAMTHEIT - STICHPROBE 6.1 Elementare Stichprobentheorie 6.1.1 Erklärung der Begriffe 6.1.2 Zufallsstichproben 6.1.3 Stichprobentheorie 6.1.4 Stichprobenverteilungen 6.1.4.1 Stichprobenverteilung der Mittelwerte 6.1.4.2 Stichprobenverteilung von Anteilen 6.1.4.3 Stichprobenverteilungen von Summen und Differenzen -6- 103 6.2 Schätzen von Parametern der Grundgesamtheit 6.2.1 Punktschätzung und Intervallschätzung 6.2.2 Eigenschaften einer Stichprobenfunktion 6.2.3 Konfidenzinteryall-Schätzungen von Parametern einer Grundgesamtheit 6.2.3.1 Konfidenzintervall-Schätzung für \i 6.2.3.2 Konfidenzintervall für Anteile 112 112 113 6.3 Begriffserläuterungen 114 6.4 Übungsaufgaben 116 7. INFERENZSTATISTIK 110 110 110 119 7.1 Einführung 119 7.2. Hypothesen 119 7.3 Vorgehensweise beim statistischen Test 122 7.4 Fehler 1. und 2. Art 123 7.5 Zusammenhang zwischen Fehler 1. Art und 2. Art 126 7.6 Begriffserläuterungen 130 7.7 Übungsaufgaben 131 8. TESTEN VON UNTERSCHIEDSHYPOTHESEN 133 8.1 Einteilung der Methoden 8.1.1 Parametrisch - nichtparametrisch 8.1.2 Univariat - multivanat 8.1.3 Unterschiedshypothese - Zusammenhangshypothese 133 133 133 134 8.2 Unterschiedshypothesen: parametrische Methoden 8.2.1 Einstichprobentest / Stichprobe aus einer normalverteilten Grundgesamtheit bei bekannter Varianz 8.2.2 Stichprobe aus einer normalverteilten Grundgesamtheit, deren Varianz unbekannt ist 8.2.3 Vergleich der Lageparameter zweier Grundgesamtheiten 8.2.3.1 Unabhängige Stichproben aus normalyerteilten Grundgesamtheiten mit bekannter Varianz . 8.2.3.2 Unabhängige Stichproben aus normalverteilten Grundgesamtheiten mit unbekannter Varianz 8.2.4 Paarige oder verbundene Stichproben 134 142 144 8.3 Unterschiedshypothesen: nichtparametrische Methoden 8.3.1 Einstichprobentest bzw. abhängige Stichproben: Vorzeichen-Test 8.3.2 Einstichprobentest: Vorzeichen-Rang-Test 8.3.3 Rang-Test für unabhängige Stichproben: Man-Whitney-Test 146 147 150 154 8.4 Begriffserläuterungen 158 8.5 Übungsaufgaben 159 -7- 134 137 139 140 9 TESTEN VON ZUSAMMENHANGSHYPOTHESEN 165 9.1 Die Analyse von Häufigkeiten 9.1.1 Chi-Quadrat- Verteilung . 9.1.2 Chi-Quadrat-Anpassungstest 9.1.3 Homogenitäts- und Zusammenhangshypothesen bei nominalskalierten Merkmalen 9.1.3.1 ?. 1.3.1 Homoeenitätshvpothesen Homogenitätshypothesen 5.1.3.2 Zusammenhangsnypothesen Zusammenhangsnypothes bei diskreten Merkmalen 9.1.3.2 165 165 166 9.2 Überprüfung von Zusammenhangshypothesen bei stetigen Merkmalen 9.2.1 Einfache lineare Regression 9.2.2 Überprüfung des Zusammenhangs 9.2.3 Regression 2. Art 176 177 179 186 9.3 Begriffserläuterungen 190 9.4 Übungsaufgaben 191 10 ÜBERLEBENSZEITEN 197 169 169 172 10.1 Überlebenskurven nach Kaplan-Meier 198 10.2 Klassierte Daten 202 10.3 Vergleich zweier Überlebenskurven: Mantel-Haenszel-Prozedur 204 10.4 Begriffserläuterungen 210 11 LÖSUNGEN ZU DEN ÜBUNGSAUFGABEN 211 11.1 Deskriptive Statistik 211 11.2' Wahrscheinlichkeitsrechnung 213 11.3 Bedingte Wahrscheinlichkeit 217 11.4 Zufallsvariablen und spezielle Verteilungen 220 11.5 Grundgesamtheit - Stichprobe 229 11.6 Inferenzstatistik 232 11.7 Testen von Unterschiedshypothesen 236 11.8 Testen von Zusanunenhangshypothesen 245 12. ANHANG 259 12.1 Standardnormalverteilung 259 12.2 t-Verteilung 266 2 12.3 x -Verteilung 273 12.4 Ergänzende bzw. weiterführende Literatur 279