Statistische Grundbegriffe Fachschule für Technik Biomedizinische Arbeitsmethoden Übersicht Validität und Reliabilität Stichprobe und Grundgesamtheit Datenformen und Skalenarten Fehlerarten Beschreibende und Beurteilende Statistik Beobachtungseinheit, Merkmal, Ausprägung 2 Validität und Reliabilität Die Validität, Gültigkeit, Richtigkeit ist ein Maß dafür, ob die Daten das messen, was sie messen sollen. Die Validität beschreibt den systematischen oder methodischen Fehler. die Reliabilität, Genauigkeit, Präzision ist ein Maß dafür, ob sich bei wiederholter Messung unter gleichen Bedingungen auch das gleiche ergibt (Reproduzierbarkeit). Die Reliabilität beschreibt den zufälligen oder statistischen Fehler. 3 Validität und Reliabilität Hohe Validität Hohe Reliabilität Niedrige Validität Niedrige Reliabilität 4 Validität und Reliabilität Hohe Validität Geringe Reliabilität Niedrige Validität Hohe Reliabilität 5 Deskriptive Statistik (Beschreibende Statistik) Aufgabe: Empirisch gewonnene Daten zu ordnen, durch Maßzahlen (Lagemaße, Streuungsmaße, Formmaße, Zusammenhangsmaße) zu verdichten, sie graphisch oder tabellarisch darzustellen und damit vergleichbar zu machen. Man unterscheidet Univariate Statistik (jedes Merkmal wird für sich alleine betrachtet) Bi- bzw. Multivariate Statistik (zwei bzw. mehr Merkmale werden gleichzeitig betrachtet) 6 Induktive Statistik (Schließende, Beurteilende, Operative, Analytische Statistik) Aufgabe: Auf der Grundlage relativ kleiner Datenmengen (Stichproben) verallgemeinernde Entscheidungen (bezüglich der Grundgesamtheit) zu treffen und das Risiko von Fehlentscheidungen abzuschätzen Man unterscheidet die Aufgabengebiete: Das Schätzen von unbekannten Parametern Das Testen von statistischen Hypothesen 7 Datentypen (Datenformen) Daten Qualitative Daten Kategoriale Daten Quantitative Daten Metrische Daten Nominaldaten Ordinaldaten Diskrete Daten Stetige Daten Durch Vergleich gewonnen Durch Ordnen gewonnen Durch Zählung gewonnen Durch Messung gewonnen Fellfarbe Familienstand Blutgruppe Schädlingsbefall Schulnoten Windstärke Wurfstärke Legeleistung Zigarettenkonsum Körpertemperatur Blutdruck Alkoholkonsum 8 Skalentypen (Skalenformen) (Skala von ital. scala = Leiter, Treppe) Nominalskala (für Nominaldaten bzw. nominale Merkmale) Niedrigstes Skalenniveau Nur Beziehungen "gleich", "ungleich" möglich Nominale Merkmale mit nur zwei Ausprägungen (z. B. das Geschlecht, Rhesusfaktor) werden auch als binäre oder dichotome Merkmale bzw. als Alternativmerkmale bezeichnet Beispiele: Parteizugehörigkeit, Nationalität, Beruf, Konfession Geschlecht, Blutgruppe, Rhesusfaktor Familienstand, Schulbildung, Haarfarbe, behandelnder Arzt, 9 Skalentypen (Skalenformen) (Skala von ital. scala = Leiter, Treppe) Ordinalskala, Rangskala (für Ordinaldaten bzw. ordinale Merkmale) Wie Nominalskala, zusätzlich mit den Beziehungen "kleiner" "größer" Abstände sind nicht interpretierbar Beispiele: Schweregrad einer Krankheit, Therapieerfolg Schädlingsbefall von Nutzpflanzen Dienstränge beim Militär, Besoldungsgruppen Bundesligatabelle, Güteklasse bei Eiern 10 Skalentypen (Skalenformen) (Skala von ital. scala = Leiter, Treppe) Intervallskala (für quantitative bzw. metrische Daten) Wie Ordinalskala, zusätzlich können Abstände sinnvoll interpretiert werden Verhältnisse sind nicht interpretierbar, weil kein kein natürlicher Nullpunkt existiert Beispiele: Celsius-Temperaturskala Intelligenzquotient Kalenderzeit 11 Skalentypen (Skalenformen) (Skala von ital. scala = Leiter, Treppe) Proportionalskala, Verhältnisskala, Ratioskala (für quantitative bzw. metrische Daten) Wie Intervallskala, zusätzlich können Verhältnisse sinnvoll interpretiert werden Verhältnisse sind interpretierbar, weil ein natürlicher Nullpunkt existiert Beispiele: Kelvin-Temperaturskala Stimmenanteil bei Wahlen Lebensalter (in Jahren) Leukozytenanzahl pro µL Blut Blutdruck in mm Hg 12 Skalentransformation Zigarettenkonsum eines Patienten Ausprägungen Merkmalsart Skalentyp Konsumierte Tabakmenge in g pro Jahr Quantitativ-stetig ProportionalSkala Anzahl konsumierter Zigaretten pro Jahr Quantitativ-diskret ProportionalSkala Nichtraucher Qualitativ schwacher Raucher mäßiger Raucher – starker Raucher Nichtraucher-Raucher Qualitativ-binär Quelle: C. Weiß: Basiswissen Medizinische Statistik, S.24 Ordinalskala Nominalskala 13 Beobachtungseinheiten (Merkmalsträger) Als Beobachtungseinheiten bezeichnet man Objekte, an denen bestimmte Merkmale erfasst werden Beispiele: Versuchstiere Pflanzen Patienten Probanden Kliniken, Arztpraxen Gewebeschnitte in Tierexperimenten in botanischen Studien in klinischen Studien in epidemiologischen Studien in gesundheitsökonomischen Auswertungen in histologischen Studien 14 Merkmale, Merkmalsträger, Merkmalsausprägung, … Merkmal Variable MerkmalsMerkmalsTräger Ausprägungen Beobachtungs- Wertebereich einheit Geschlecht Natürliche Pers. Fellfarbe Bio-Note Zweitstimmenanteil ♀,♂ MerkmalsWert Realisierung Daten ♂ Versuchstier Braun, Weiß z. B. Kaninchen Schwarz, … Natürliche Pers. 1, 2, …, 6 Weiß Partei 37,8 % 0..100 % 3 15 Grundgesamtheit Die Grundgesamtheit ist die Menge der Beobachtungseinheiten, über die aufgrund der Ergebnisse eines Versuchs Aussagen gemacht werden sollen. Beispiel (Bundestagswahl): Alle wahlberechtigten Bürger Deutschlands 16 Stichprobe Die Stichprobe ist die Menge aller Beobachtungseinheiten, die im Versuch tatsächlich beobachtet werden Beispiel (Bundestagswahl): 2000 zufällig ausgewählte wahlberechtigte Bürger Ist die Stichprobe gleich der Grundgesamtheit, spricht man von Vollerhebung (Volkszählung, Todesursachenstatistik) 17 Kriterien für eine Stichprobe Eine Stichprobe sollte ausreichend groß repräsentativ für die Grundgesamtheit zufällig ausgewählt sein und aus unabhängigen Elementen (Beobachtungseinheiten) bestehen 18 Warum Stichproben und nicht die Grundgesamtheit Ökonomie (Zeit- und Materialaufwand) Grundgesamtheit zu groß Irreparable Zerstörung der Beobachtungseinheiten Glühlampen (Brenndauer) Tabletten (Auflösungsverhalten) Ethische und gesetzliche Auflagen bei Tierversuchen 19 Datengewinnung Datengewinnung Erhebung Retrospektiv Experiment Prospektiv 20 Datengewinnung Retrospektive (zurückblickende) Erhebung: Beantwortung einer Fragestellung durch in der Vergangenheit (routinemäßig) erhobene Daten. Prospektive (vorausschauende) Erhebung: Daten werden erst nach Vorliegen der Fragestellung an einer zufälligen Stichprobe aus einer definierten Grundgesamtheit neu erhoben Experiment: Prospektive Erhebung, bei der die Ausprägungen mindestens einer Einflussgröße den Beobachtungseinheiten zufällig zugeteilt werden. Ergänzungen und Übungen: http://medweb.unimuenster.de/institute/imib/lehre/skripte/biomathe/bio/script1.html 21 Ziel- und Einflussgrößen Identifikationsgrößen Name, Geburtsdatum Patienten-Nr. Zielgröße(n) Entstehen eines Lungenkarzinoms Nicht zuteilbare Faktoren zuteilbare Faktoren Einflussgrößen Faktor(en) Rauchen Begleitmerkmal(e) Alter, Geschlecht Störgrößen Genetische Veranlagung Umweltbelastung Nicht verzerrend verzerrend 22 Biologische Variabilität Intraindividuelle Variabilität: unterschiedliche Werte eines Individuums in Abhängigkeit von der Tageszeit, Umwelteinflüssen, Gesundheitszustand Interindividuelle Variabilität: unterschiedliche Werte zwischen verschiedenen Individuen 23 Fehler bei der Datengewinnung Zufälliger, statistischer, persönlicher Fehler: Ursache: Biologische Variabilität nicht vermeidbar, aber minimierbar Maß für die Reliabilität (Genauigkeit) Systematischer, methodischer Fehler: vermeidbar, aber schwer zu erkennen Maß für die Validität (Richtigkeit) 24