Statistische Grundbegriffe - Paul-Ehrlich

Werbung
Statistische Grundbegriffe
Fachschule für Technik
Biomedizinische Arbeitsmethoden
Übersicht






Validität und Reliabilität
Stichprobe und Grundgesamtheit
Datenformen und Skalenarten
Fehlerarten
Beschreibende und Beurteilende
Statistik
Beobachtungseinheit, Merkmal,
Ausprägung
2
Validität und Reliabilität


Die Validität, Gültigkeit, Richtigkeit ist ein
Maß dafür, ob die Daten das messen, was sie
messen sollen.
Die Validität beschreibt den systematischen
oder methodischen Fehler.
die Reliabilität, Genauigkeit, Präzision ist
ein Maß dafür, ob sich bei wiederholter
Messung unter gleichen Bedingungen auch
das gleiche ergibt (Reproduzierbarkeit).
Die Reliabilität beschreibt den zufälligen oder
statistischen Fehler.
3
Validität und Reliabilität
Hohe Validität
Hohe Reliabilität
Niedrige Validität
Niedrige Reliabilität
4
Validität und Reliabilität
Hohe Validität
Geringe Reliabilität
Niedrige Validität
Hohe Reliabilität
5
Deskriptive Statistik
(Beschreibende Statistik)
Aufgabe:
Empirisch gewonnene Daten zu ordnen, durch
Maßzahlen (Lagemaße, Streuungsmaße, Formmaße,
Zusammenhangsmaße) zu verdichten, sie graphisch
oder tabellarisch darzustellen und damit vergleichbar
zu machen.
Man unterscheidet
 Univariate Statistik (jedes Merkmal wird für sich
alleine betrachtet)
 Bi- bzw. Multivariate Statistik (zwei bzw. mehr
Merkmale werden gleichzeitig betrachtet)
6
Induktive Statistik
(Schließende, Beurteilende, Operative, Analytische Statistik)
Aufgabe:
Auf der Grundlage relativ kleiner Datenmengen (Stichproben) verallgemeinernde
Entscheidungen (bezüglich der Grundgesamtheit) zu treffen und das Risiko von
Fehlentscheidungen abzuschätzen
Man unterscheidet die Aufgabengebiete:
 Das Schätzen von unbekannten Parametern
 Das Testen von statistischen Hypothesen
7
Datentypen (Datenformen)
Daten
Qualitative Daten
Kategoriale Daten
Quantitative Daten
Metrische Daten
Nominaldaten
Ordinaldaten
Diskrete
Daten
Stetige
Daten
Durch Vergleich
gewonnen
Durch Ordnen
gewonnen
Durch Zählung
gewonnen
Durch Messung
gewonnen
Fellfarbe
Familienstand
Blutgruppe
Schädlingsbefall
Schulnoten
Windstärke
Wurfstärke
Legeleistung
Zigarettenkonsum
Körpertemperatur
Blutdruck
Alkoholkonsum 8
Skalentypen (Skalenformen)
(Skala von ital. scala = Leiter, Treppe)
Nominalskala (für Nominaldaten bzw.
nominale Merkmale)





Niedrigstes Skalenniveau
Nur Beziehungen "gleich", "ungleich" möglich
Nominale Merkmale mit nur zwei Ausprägungen
(z. B. das Geschlecht, Rhesusfaktor) werden
auch als binäre oder dichotome Merkmale bzw.
als Alternativmerkmale bezeichnet
Beispiele:




Parteizugehörigkeit, Nationalität, Beruf, Konfession
Geschlecht, Blutgruppe, Rhesusfaktor
Familienstand, Schulbildung,
Haarfarbe, behandelnder Arzt,
9
Skalentypen (Skalenformen)
(Skala von ital. scala = Leiter, Treppe)

Ordinalskala, Rangskala (für Ordinaldaten bzw.
ordinale Merkmale)

Wie Nominalskala, zusätzlich mit den
Beziehungen "kleiner" "größer"

Abstände sind nicht interpretierbar

Beispiele:




Schweregrad einer Krankheit, Therapieerfolg
Schädlingsbefall von Nutzpflanzen
Dienstränge beim Militär, Besoldungsgruppen
Bundesligatabelle, Güteklasse bei Eiern
10
Skalentypen (Skalenformen)
(Skala von ital. scala = Leiter, Treppe)
Intervallskala (für quantitative bzw.
metrische Daten)




Wie Ordinalskala, zusätzlich können Abstände
sinnvoll interpretiert werden
Verhältnisse sind nicht interpretierbar, weil kein
kein natürlicher Nullpunkt existiert
Beispiele:



Celsius-Temperaturskala
Intelligenzquotient
Kalenderzeit
11
Skalentypen (Skalenformen)
(Skala von ital. scala = Leiter, Treppe)
Proportionalskala, Verhältnisskala, Ratioskala (für quantitative bzw. metrische
Daten)




Wie Intervallskala, zusätzlich können
Verhältnisse sinnvoll interpretiert werden
Verhältnisse sind interpretierbar, weil ein
natürlicher Nullpunkt existiert
Beispiele:





Kelvin-Temperaturskala
Stimmenanteil bei Wahlen
Lebensalter (in Jahren)
Leukozytenanzahl pro µL Blut
Blutdruck in mm Hg
12
Skalentransformation
Zigarettenkonsum eines Patienten
Ausprägungen
Merkmalsart
Skalentyp
Konsumierte Tabakmenge in g pro Jahr
Quantitativ-stetig
ProportionalSkala
Anzahl konsumierter
Zigaretten pro Jahr
Quantitativ-diskret
ProportionalSkala
Nichtraucher Qualitativ
schwacher Raucher mäßiger Raucher –
starker Raucher
Nichtraucher-Raucher Qualitativ-binär
Quelle: C. Weiß: Basiswissen Medizinische Statistik, S.24
Ordinalskala
Nominalskala
13
Beobachtungseinheiten
(Merkmalsträger)


Als Beobachtungseinheiten bezeichnet man
Objekte, an denen bestimmte Merkmale
erfasst werden
Beispiele:

Versuchstiere
Pflanzen
Patienten
Probanden
Kliniken, Arztpraxen

Gewebeschnitte




in Tierexperimenten
in botanischen Studien
in klinischen Studien
in epidemiologischen Studien
in gesundheitsökonomischen
Auswertungen
in histologischen Studien
14
Merkmale, Merkmalsträger,
Merkmalsausprägung, …
Merkmal
Variable
MerkmalsMerkmalsTräger
Ausprägungen
Beobachtungs- Wertebereich
einheit
Geschlecht Natürliche Pers.
Fellfarbe
Bio-Note
Zweitstimmenanteil
♀,♂
MerkmalsWert
Realisierung
Daten
♂
Versuchstier
Braun, Weiß
z. B. Kaninchen Schwarz, …
Natürliche Pers. 1, 2, …, 6
Weiß
Partei
37,8 %
0..100 %
3
15
Grundgesamtheit


Die Grundgesamtheit ist die Menge der
Beobachtungseinheiten, über die
aufgrund der Ergebnisse eines Versuchs
Aussagen gemacht werden sollen.
Beispiel (Bundestagswahl):
Alle wahlberechtigten Bürger
Deutschlands
16
Stichprobe



Die Stichprobe ist die Menge aller
Beobachtungseinheiten, die im Versuch
tatsächlich beobachtet werden
Beispiel (Bundestagswahl): 2000
zufällig ausgewählte wahlberechtigte
Bürger
Ist die Stichprobe gleich der Grundgesamtheit, spricht man von Vollerhebung
(Volkszählung, Todesursachenstatistik) 17
Kriterien für eine Stichprobe
Eine Stichprobe sollte
 ausreichend groß
 repräsentativ für die Grundgesamtheit
 zufällig ausgewählt sein und
 aus unabhängigen Elementen
(Beobachtungseinheiten) bestehen
18
Warum Stichproben und nicht
die Grundgesamtheit



Ökonomie (Zeit- und Materialaufwand)
Grundgesamtheit zu groß
Irreparable Zerstörung der
Beobachtungseinheiten



Glühlampen (Brenndauer)
Tabletten (Auflösungsverhalten)
Ethische und gesetzliche Auflagen bei
Tierversuchen
19
Datengewinnung
Datengewinnung
Erhebung
Retrospektiv
Experiment
Prospektiv
20
Datengewinnung



Retrospektive (zurückblickende) Erhebung:
Beantwortung einer Fragestellung durch in der
Vergangenheit (routinemäßig) erhobene Daten.
Prospektive (vorausschauende) Erhebung:
Daten werden erst nach Vorliegen der Fragestellung
an einer zufälligen Stichprobe aus einer definierten
Grundgesamtheit neu erhoben
Experiment:
Prospektive Erhebung, bei der die Ausprägungen
mindestens einer Einflussgröße den Beobachtungseinheiten zufällig zugeteilt werden.
Ergänzungen und Übungen: http://medweb.unimuenster.de/institute/imib/lehre/skripte/biomathe/bio/script1.html
21
Ziel- und Einflussgrößen
Identifikationsgrößen
Name, Geburtsdatum
Patienten-Nr.
Zielgröße(n)
Entstehen eines
Lungenkarzinoms
Nicht
zuteilbare
Faktoren
zuteilbare
Faktoren
Einflussgrößen
Faktor(en)
Rauchen
Begleitmerkmal(e)
Alter, Geschlecht
Störgrößen
Genetische Veranlagung
Umweltbelastung
Nicht
verzerrend
verzerrend
22
Biologische Variabilität


Intraindividuelle Variabilität:
unterschiedliche Werte eines Individuums in Abhängigkeit von der Tageszeit,
Umwelteinflüssen, Gesundheitszustand
Interindividuelle Variabilität:
unterschiedliche Werte zwischen verschiedenen Individuen
23
Fehler bei der Datengewinnung


Zufälliger, statistischer, persönlicher
Fehler:
Ursache: Biologische Variabilität
nicht vermeidbar, aber minimierbar
Maß für die Reliabilität (Genauigkeit)
Systematischer, methodischer Fehler:
vermeidbar, aber schwer zu erkennen
Maß für die Validität (Richtigkeit)
24
Herunterladen