Warum hat Statistik so eine große Bedeutung in der medizinischen und biologischen Forschung? Exakte Wissenschaften (z. B. Physik, Chemie) Ein Versuch hat ein sicher vorhersagbares Ergebnis deterministische Aussagen (Gesetzmäßigkeiten) PD Dr. Sven Reese, LMU München 1 empirische Wissenschaften (z. B. Biologie, Medizin) Ein Experiment hat kein sicher vorhersagbares Ergebnis Vorhersagen sind nur mit bestimmter Wahrscheinlichkeit möglich probalistische Aussagen Teilgebiete der Statistik: 1. Beschreibende Statistik 2. Wahrscheinlichkeitsrechnung 3. Schließende Statistik PD Dr. Sven Reese, LMU München 2 Beschreibende Statistik man erlangt vollständige Daten über das untersuchte Objekt Wahrscheinlichkeitsrechnung Untersucht werden Vorgänge, der Ausgang ungewiss ist. PD Dr. Sven Reese, LMU München 3 Schließende Statistik Aus einer Teilmenge an Daten (Stichprobe) wird auf die Eigenschaften des Gesamtobjektes geschlossen wissenschaftlich interessante Fragestellungen ⇒ 1.Explorative Untersuchungen 2.Populationsbeschreibende Untersuchungen 3.Methodenevaluation 4.Hypothesenprüfende Untersuchungen PD Dr. Sven Reese, LMU München 4 Populationsbeschreibende Untersuchung ⇒ Beschreibt Merkmale einer Population mit Hilfe der deskriptiven Statistik auch Grundlage jeder hypothesenprü hypothesenprüfenden Untersuchung Explorative Untersuchung ⇒ Grundlegende Untersuchung, die die Basis zu weiterführender hypothesenbasierender Forschung liefert kein optimaler Stichprobenumfang notwendig!! PD Dr. Sven Reese, LMU München 5 Methodenevaluation ⇒ Bestimmt die Genauigkeit einer quantitative Daten erfassenden Methode im Abgleich mit Referenzobjekten oder Referenzmethoden wissenschaftlich interessante Fragestellungen ⇒ Überführung in wissenschaftliche Hypothesen (Hypothese = gr. Vermutung) PD Dr. Sven Reese, LMU München 6 Hypothesenprüfende Untersuchungen ⇒ Unterschiedshypothesen Zusammenhangshypothesen Veränderungshypothesen Äquivalenzhypothesen Auf jeden Datensatz (Stichprobe) sollten zu Beginn die Methoden der deskriptiven Statistik angewendet werden PD Dr. Sven Reese, LMU München 7 Populationsbeschreibende Untersuchung • Totalerhebung • Stichprobe Methoden der Stichprobennahme • Zufallsstichprobe • Geschichtete Stichprobe • Klumpenstichprobe PD Dr. Sven Reese, LMU München 8 Problem der Definition der Grundgesamtheit • Sachliche Abgrenzung (gesund?) • Räumliche Abgrenzung (München, Bayern, Deutschland?) • Zeitliche Abgrenzung (Zeitpunkt, Zeitraum) Datenerhebung - Herkunft der Daten • Primärstatistik (prospektive Untersuchung) • Sekundärstatistik (retrospektive Untersuchung) PD Dr. Sven Reese, LMU München 9 Zu erfassende Daten • Untersuchungsvariable oder (Statistisches) Merkmal z. B. Alter, Geschlecht, Hämatokrit Auspräung der Daten • Merkmalswert oder Modalität z. B. Alter – 1 Jahr, 2,5 Jahre, 14 Jahre Geschlecht – männlich, weiblich Rasse – Teckel, DSH, Golden Retriever PD Dr. Sven Reese, LMU München 10 Art der Merkmalswerte • qualitativ – quantitativ • diskret – stetig • häufbar – nicht häufbar Meßskalen • Nominalskala • Ordinalskala • Intervallskala • Verhältnisskala PD Dr. Sven Reese, LMU München 11 Meßskalen • Nominalskala • Ordinalskala • Intervallskala steigendes Informationsniveau • Verhältnisskala Datenerhebung - Art der Erhebung • Beobachtung • Schätzung • Messung • Befragung PD Dr. Sven Reese, LMU München 12 Datenaufbereitung • Urliste • Kontrolle auf Plausibilität Datenanordnung in Urliste Variable 1 Variable 2 Variable 3 Merkmalsträger 1 Merkmalsträger 2 Merkmalsträger 3 Merkmalsträger 4 PD Dr. Sven Reese, LMU München 13 Datenanordnung in Urliste Rasse Alter Temperatur Körpermasse Hund 1 Hund 2 Hund 3 Hund 4 PD Dr. Sven Reese, LMU München 14 Prüfung auf Plausibilität • qualitative Daten: Häufigkeitstabellen • quantitative Daten: Minimum, Maximum grafische Häufigkeitsverteilung (Histogramm) • Prüfung auf fehlende Werte Umgang mit fehlenden Werten • unsystematisch fehlende Werte kein wesentlicher Einfluss auf statistische Auswertung • systematisch vorhersehbar z. B. über multiple Imputationsverfahren ausgleichbar PD Dr. Sven Reese, LMU München 15 Umgang mit fehlenden Werten • systematisch von Merkmalsausprägung abhängig z. B. über festgelegten Merkmalswert ausgleichbar Umgang mit Ausreißern und Extremwerten • Auftreten dieser Werte nie vertuschen! • Erklärung für Ausreißer suchen • Ausreißerunempfindliche Auswertmethoden verwenden • nur im begründeten Einzelfall Ausreißer aus Auswertung ausschließen PD Dr. Sven Reese, LMU München 16 Datenaufbereitung • Häufigkeitstabellen für qualitative Daten (nominalskalierte Werte) • Grafische Darstellung z. B. Säulendiagramm, Kreisdiagramm Häufigkeitstabelle • relative Häufigkeit PD Dr. Sven Reese, LMU München 17 Säulendiagramm Kreisdiagramm PD Dr. Sven Reese, LMU München 18 Häufigkeit stetiger Merkmale Auszählung von Häufigkeit sinnlos Problemlösung: Klassifizierung Klassifizierte Häufigkeit • Definition von Klassengrenzen von 0 bis unter 1 kg von 1 kg bis unter 2 kg etc. PD Dr. Sven Reese, LMU München 19 Klassifizierte Häufigkeit • Anzahl der Klassen - Wurzel aus n • DIN-Vorschrift Anzahl Merkmalsträger (n) - 100 Mindestzahl an Klassen 10 101 - 1000 13 1001-10000 16 10001 - 100000 20 Klassifizierte Häufigkeit • Breite der Klassen - wenn möglich alle Klassen identische Breite - Wert in Klassenmitte möglichst typisch - Bildung offener Randklassen bei Ausreißern PD Dr. Sven Reese, LMU München 20 Klassifizierte Häufigkeit Histodiagramm Darstellung von klassifizierten Häufigkeiten Flächen sind Klassenhäufigkeiten proportional PD Dr. Sven Reese, LMU München 21 Polygonzug Darstellung von klassifizierten Häufigkeiten Nutzung insbesondere zum Vergleich Summenpolygon Darstellung von kumulierten klassifizierten Häufigkeiten PD Dr. Sven Reese, LMU München 22 Art der Häufigkeitsverteilung • Symmetrische Verteilung • Asymmetrische Verteilung • eingipfelige Verteilung • mehrgipfelige Verteilung Kennwerte von Häufigkeitsverteilungen • Mittelwerte (zentrale Tendenz) • Streuungsmaße • (Konzentrationsmaße) PD Dr. Sven Reese, LMU München 23 Stichprobe - Gesamtpopulation • Die berechneten Kennwerte gelten für die Stichprobe und sind Schätzwerte für die Gesamtpopulation • Die Genauigkeit der Schätzung wird durch das 95 % Konfidenzintervall (Vertrauensintervall) angegeben. Mittelwerte • Modalwert • Median • Arithmetisches Mittel • Harmonisches Mittel • Geometrisches Mittel PD Dr. Sven Reese, LMU München 24 Modalwert Merkmalswert mit der größten Häufigkeit - unbeeinflusst von Ausreißern - geeignet insbesondere für nominalskalierte Werte Median (Zentralwert) Merkmalswert mit zentraler Position in Rangordnung aller Merkmalsträger Daten müssen mindestens ordinalskaliert sein Median 4,3 kg PD Dr. Sven Reese, LMU München 25 Median (Zentralwert) Median (Zentralwert) PD Dr. Sven Reese, LMU München 26 Arithmetrisches Mittel EKH 4,4 kg Siam 4,2 kg Perser 4,6 kg Main Coone 5,4 kg PD Dr. Sven Reese, LMU München 27 Streuungsmaße • Spannweite, Range (Minimum – Maximum) • Zentraler Quartilsabstand • Mittlere absolute Abweichung • Varianz und Standardabweichung • Variationskoeffizient • Schiefe und Wölbung PD Dr. Sven Reese, LMU München 28 Spannweite Spannweite PD Dr. Sven Reese, LMU München 29 Zentraler Quartilsabstand Zentraler Quartilsabstand PD Dr. Sven Reese, LMU München 30 Mittlere absolute Abweichung • Durchschnittliche Differenz aller Merkmalswerte zum Mittelwert • Mindestens intervallskalierte Werte • Selten genutzt aber sehr anschaulich • Gefahr einer verzerrten Beschreibung durch Ausreißer Varianz (σ²) und Standdardabweichung (σ) • Summe der quadrierten Differenzen zum Mittelwert dividiert durch n (=Varianz) [n-1 bei Stichproben] • Standdardabweichung = Quadradwurzel der Varianz • Nicht anschaulich aber wesentliche Berechnungsgrundlage in schließender Statistik PD Dr. Sven Reese, LMU München 31 Standdardabweichung (σ) • Normalverteilte Daten: µ ± 1σ entspricht ca. 2/3 aller Merkmalsträger µ ± 2σ entspricht ca. 95 % aller Merkmalsträger µ ± 3σ entspricht ca. 99 % aller Merkmalsträger • Eingipflige beliebige Verteilung: µ ± 1σ entspricht ca. 45 % aller Merkmalsträger Standdardabweichung (σ) PD Dr. Sven Reese, LMU München 32 Variationskoeffizient • Quotient aus Standardabweichung und Mittelwert • Gut geeignet zum Vergleich der Streuung verschiedener Variablen mit unterschiedlichen Einheiten Schiefe und Wölbung • Maße für die Schiefe einer Verteilung • Wird auch verwendet, um zu schätzen ob Normalverteilung vorliegt oder nicht. • Besser: Test von Kolmogroff-Smirnoff korrigiert nach Lillefors verwenden, um zu prüfen, ob eine signifikante Abweichung von einer Normalverteilung vorliegt PD Dr. Sven Reese, LMU München 33 Berechnung des optimalen Stichprobenumfangs • Explorative Untersuchung nicht sinnvoll, auch Einzellfalluntersuchung statthaft • Populationsbeschreibende Untersuchung Berechnung nach Festlegung der gewünschten Genauigkeit (Vertrauensintervall) der Verteilungskennwerte. Berechnung des optimalen Stichprobenumfangs • Populationsbeschreibende Untersuchung qualitative Daten: • 29 Merkmalsträger, wenn Varianten, die zu mindestens 10 % in Population auftreten mit 95%iger Sicherheit in der Stichprobe vorhanden sind PD Dr. Sven Reese, LMU München 34 Berechnung des optimalen Stichprobenumfangs • Populationsbeschreibende Untersuchung qualitative Daten: • Bestimmung von Populationsanteilen: Festlegung von gewünschter Genauigkeit (z. B. +/- 5 %) und Sicherheit (z. B. 95%) Stichprobenumfang aus Tabelle entnehmen Aus: Bortz/Döring Forschungsmethoden und Evaluation, Springer 2006 PD Dr. Sven Reese, LMU München 35 Berechnung des optimalen Stichprobenumfangs • Populationsbeschreibende Untersuchung quantitative Daten: • Mittelwertschätzung mit vorgegebener Genauigkeit: Streuung in Population muss ungefähr bekannt sein Berechnung des optimalen Stichprobenumfangs • Beispiel für Mittelwertschätzung Schätzung einer mittleren Körpermasse in einer Pferdepopulation mit einer Genauigkeit von +/- 5% und Sicherheit von 95 % geschätzte Streuung (σ) 35 kg Fehlergröße von 5 % entspricht Streungsanteil von ca. 1/7σ PD Dr. Sven Reese, LMU München 36 Berechnung des optimalen Stichprobenumfangs Berechnung des optimalen Stichprobenumfangs • Populationsbeschreibende Untersuchung 95 % Perzentile (Referenzdaten): • Nach internationaler Übereinkunft mindestens 120 Merkmalsträger PD Dr. Sven Reese, LMU München 37 Berechnung des optimalen Stichprobenumfangs • Populationsbeschreibende Untersuchung Tabelle für optimale Stichprobenumfänge bei verschiedenen Konfidenzintervallen mit Beispielberechnungen siehe in: • Bortz/Döring: Forschungsmethoden S. 420ff Springer-Verlag 2009 PD Dr. Sven Reese, LMU München 38 Berechnung des optimalen Stichprobenumfangs • Hypothesenvergleichende Untersuchung keine biologisch relevante Differenz (Effektgröße) definiert ⇒ Berechnung nicht möglich • Effektgröße und Varianz in den Stichproben bekannt ⇒ Berechnung für normalverteilte Stichproben sicher möglich Freeware: Gpower PD Dr. Sven Reese, LMU München 39 Hypothesenprüfende Untersuchungen 1. Zusammenhangshypothesen 2. Unterschiedshypothesen 3. Veränderungshypothesen 4. Nullhypothese soll bestätigt werden ⇒ Äquivalenztests/Homogenitätstest PD Dr. Sven Reese, LMU München 40 Zusammenhangshypothesen Zusammenhangshypothesen PD Dr. Sven Reese, LMU München 41 Unterschiedshypothesen Vergleich der Lagemaße („Mittelwerte“) von mehreren Stichproben A. Intervallskalierte, normalverteilte Variablen Anzahl der miteinander zu vergleichenden Stichproben Abhängigkeit 2 unabhängig t-Test nach Student 2 abhängig t-Test für abhängige Stichproben >2 unabhängig einfache Varianzanalyse = einfaktorielle ANOVA >2 abhängig einfache Varianzanalyse mit Meßwiederholung Testverfahren Unterschiedshypothesen B. Ordinalskalierte oder nicht-normalverteilte Variablen Anzahl der miteinander zu vergleichenden Stichproben Abhängigkeit 2 unabhängig 2 abhängig >2 unabhängig >2 abhängig PD Dr. Sven Reese, LMU München Testverfahren (Auswahl) U-Test nach Mann und Whitney Wilcoxon-Test H-Test nach Kruskal und Wallis Friedman-Test 42 Lehrbücher: Günther Bourier - Beschreibende Statistik 8. Auflage Gabler Wiesbaden 2010 - Wahrscheinlichkeitsrechnung und schließende Statistik 6. Auflage Gabler Wiesbaden 2009 Mathías Rudolf, Wiltrud Kuhlisch Biostatistik Pearson Studium München 2008 PD Dr. Sven Reese, LMU München 43 Lehrbücher: Martin Bland - An introduction to medical statistics Oxford University Press 3. Auflage 2000 Jürgen Bortz - Statistik für Human- und Sozialwissenschaftler Springer Verlag 6. Auflage 2005 Biowissenschaften befassen sich mit Untersuchungsobjekten (=Merkmalsträgern) bezüglich ausgesuchter Merkmale PD Dr. Sven Reese, LMU München 44 Ein Merkmal kann variabel ausgeprägt sein und wird in der Statistik als Variable bezeichnet Merkmalsausprägungen können durch regelgeleitete Zuweisung von Zahlen gemessen werden. PD Dr. Sven Reese, LMU München 45 abhängige Variablen unabhängige Variablen Veränderungen abhängiger Variablen sollen durch den Einfluss unabhängiger Variablen erklärt werden. PD Dr. Sven Reese, LMU München 46 Moderatorvariable = dritte Variable, die den Einfluss einer unabhängigen auf eine abhängige Variable verändert Mediatorvariable = Unabhängige Variable beeinflusst abhängige Variable über dritte Variable (Mediatorvariable) PD Dr. Sven Reese, LMU München 47 Störvariable = Einflussgrößen auf die abhängige Variable, die in einer Untersuchung nicht erfasst werden Quantitative Variablen - diskrete Merkmalsausprägung dichotom, polytom, künstlich diskret - stetige Merkmalsausprägung PD Dr. Sven Reese, LMU München 48 4 Kriterien einer wissenschaftlichen Hypothese 1.reale Sachverhalte, die empirisch untersuchbar sind 2. Allgemein gültige über den Einzelfall hinausgehende Behauptung 4 Kriterien einer wissenschaftlichen Hypothese 3.Konditionalsatz (wenn-dann oder je-desto) 4. Behauptung muss falsifizierbar sein (es müssen Ereignisse denkbar sein, die dem Konditionalsatz widersprechen) PD Dr. Sven Reese, LMU München 49 Wenn-Teil (Bedingung) und Dann-Teil (Folge, Konsequenz) einer Hypothese stellen Ausprägungen von Variablen dar. Wenn-Teil ⇒ unabhängige Variable Dann-Teil ⇒ abhängige Variable. PD Dr. Sven Reese, LMU München 50 ungerichtete Hypothesen gerichtete Hypothesen Effektgröße - Enge des postulierten Zusammenhangs - Größe des postulierten Unterschieds PD Dr. Sven Reese, LMU München 51 Gibt es eine Vermutung über die Kausalbeziehung, der in der Hypothese postulierten Variablenbeziehung??? Definition: wissenschaftliche Hypothese Eine wissenschaftliche Hypothese behauptet eine mehr oder weniger prä präzise Beziehung zwischen zwei oder mehr Variablen, die fü für eine bestimmte Population vergleichbarer Objekte oder Ergeignisse gelten soll. PD Dr. Sven Reese, LMU München 52 wissenschaftliche Hypothese ⇒ Überführung in statistische Hypothesen Statistische Hypothese Welche quantitativen Maße können die Variablenbeziehung am besten beschreiben? PD Dr. Sven Reese, LMU München 53 Statistische Hypothese Bezieht sich auf Gesamtpopulation, der Stichproben zugrunde liegt ⇒ Stichprobenkennwerte werden in griechischen Buchstaben angegeben Statistische Hypothese Definiert als Annahme über die Verteilung einer Zufallsvariablen oder eines Parameters dieser Verteilung ⇒ Bei statistischen Hypothesen handelt es sich um Wahrscheinlichkeitsaussagen PD Dr. Sven Reese, LMU München 54 Statistische Hypothesen sind Wahrscheinlichkeitsaussagen ⇒ Hypothese kann nicht durch Nachweis einzelner Gegenbeispiele widerlegt (falsifiziert) werden. Problem! Statistische Hypothesen sind Wahrscheinlichkeitsaussagen ⇒ Hypothese kann auch nicht durch Nachweis vieler Positivbeispiele bestätigt (verifiziert) werden. PD Dr. Sven Reese, LMU München 55 Lösung! (willkürlich) festgelegte Prüfkriterien erzeugen Falsifizierbarkeit ⇒ Wichtigstes Prüfkriterium ist die statistische Signifikanz (eingefü (eingeführt von Fischer 1925) Beachte! Statistisch nicht falsifizierte (=signifikante) Beziehung zwischen Variablen ≠ bestätigte Kausalbeziehung PD Dr. Sven Reese, LMU München 56 monokausale Hypothese Unabhängige Variable erklärt praktisch die gesamte Variabilität der abhängigen Variable ⇒ extrem seltene Konstellation Normalerweise hat man multikausale Konstellationen multikausale Verhältnisse ⇒ der Anspruch eines vollständigen Erklärungsmodells ist von vornherein zum Scheitern verurteilt PD Dr. Sven Reese, LMU München 57 Aussagekraft interne Validität (Eindeutigkeit) vs externe Validität (Generalisierbarkeit) Relativer Erklärungswert mehrerer unabhängiger Variablen ⇒ Therorie (theoria gr. Erforschung der Wahrheit) PD Dr. Sven Reese, LMU München 58 Theorie ⇒ soll Sachverhalte beschreiben, erklären und vorhersagen können Kein Anspruch auf absolute Wahrheit Theorie Kann durch Stichproben nicht sicher verifiziert werden Kann durch Falsifikation eingeschränkt oder gekippt werden PD Dr. Sven Reese, LMU München 59 Interpretation statistischer Hypothesenprüfungen Daten geben nur die Grundlage zur Entscheidung für oder gegen eine Hypothese – eine Fehlentscheidung kann nie ausgeschlossen werden Praktische Durchführung einer Untersuchung Ausgangspunkt ist idealerweise eine Theorie ⇒ Ableitung einer inhaltlichen Hypothese ⇒ Formulierung einer statistischen Hypothese PD Dr. Sven Reese, LMU München 60 Statistische Hypothesenprüfung Bildung eines Hypothesenpaares Alternativhypothese (H1) vs Nullhypothese (H0) Statistische Hypothesenprüfung Alternativhypothese postuliert einen bestimmten Effekt, den die Nullhypothese negiert PD Dr. Sven Reese, LMU München 61 Signifikanzniveau Konvention 5% oder 1% ⇒ Nur wenn die Irrtumswahrscheinlichkeit unter 5 % (1%) liegt ist die Annahme der Alternativhypothese akzeptabel Signifikanzniveau Irrtumswahrscheinlichkeit = α-Fehler-Wahrscheinlichkeit = Wahrscheinlichkeit, dass die Nullhypothese stimmt PD Dr. Sven Reese, LMU München 62 Problem! Mit steigendem Stichprobenumfang geht die Irtumswahrscheinlichkeit gegen Null ⇒ Nullhypothese hat keine Chance. Lösung! Festlegung eines biologisch relevanten (Mindest-) Unterschiedes = Effektgröße PD Dr. Sven Reese, LMU München 63 β-Fehler-Wahrscheinlichkeit = Wahrscheinlichkeit, dass die korrekte Alternativhypothese irrtümlich ausgeschlossen wird Problem! Mit sinkendem Stichprobenumfang geht die β-Fehler-Wahrscheinlichkeit gegen 100% ⇒ Alternativhypothese hat keine Chance. PD Dr. Sven Reese, LMU München 64 Lösung! Festlegung einer maximalen Höhe des β-Fehlers ⇒ Konvention β-Fehlers = 4 x α-Fehler ⇒ 20 % Teststärke oder Power Wahrscheinlichkeit, dass ein Signifikanztest zugunsten der Alternativhypothese entscheidet = 1 - β-Fehler PD Dr. Sven Reese, LMU München 65 Teststärke oder Power Einflussfaktoren: 1.Signifikanzniveau 2. Effektgröße 3. Stichprobenumfang Optimaler Stichprobenumfang Teststärke bei 80 % größeres n ⇒ irrelevante Unterschiede werden erkannt kleineres n ⇒ Gefahr der fehlerhaften Ablehnung der Alternativhypothese PD Dr. Sven Reese, LMU München 66 Problem! Repräsentativität einer Stichprobe ⇒ Zufallsauswahl gegeben? Umfang ausreichend? Erstellung einer Urliste Variable 1 Variable 2 Variable 3 Merkmalsträger 1 Merkmalsträger 2 Merkmalsträger 3 Merkmalsträger 4 PD Dr. Sven Reese, LMU München 67 Merkmalsträger Einzelnes Untersuchungsobjekt Träger der statistischen Information z. B. individueller Hund PD Dr. Sven Reese, LMU München 68