X - Institut für Medizinische Biometrie und Statistik

Werbung
Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.)
[email protected]
Institut für Medizinische Biometrie und Statistik
Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein
Lüb k 06
Lübeck,
06.04.2010
04 2010
Merkmalsskalen, Rangliste
B h ib
i
V
t il
Beschreibung
einer
Verteilung
mit Tabelle, Diagramm
mit LageLage und Streuungsmaß,
Streuungsmaß Schiefe,
Schiefe Wölbung
Daten und Interpretation
Beschreibung eines Zusammenhanges
gemeinsame Verteilung
bedingte Verteilungen
Zusammenhangsmaße
Folie 2
metriscch k a t ee g o r i aa l
qualitativ (nominal): Ausprägung hat keine
zahlenmäßige
hl
äßi Ordnung
Od
dichotom: nur zwei Ausprägungen
Gewebetyp
Geschlecht
quantitativ: Ausprägung hat zahlen
quantitativ:
Ausprägung hat zahlen‐mäßige
mäßige Ordnung
ordinal: kann geordnet werden
Anfärbbarkeit
diskret: natürliche Zahlen
diskret: natürliche Zahlen
Anzahl Zellen
Anzahl Zellen
kontinuierlich: reelle Zahlen
Reaktionszeit
Folie 3
metriic c a t e g o rr i c a l
qqualitative ((nominal):) values have no natural order
dichotous: just two values
tissue type
sex
quantitative: values have an order
quantitative: values have an order
ordinal: can be ordered
dye
discrete: integer numbers
discrete: integer numbers
cell count
cell count
continuous: real numbers
reaction time
Folie 4
Geben Sie Beispiele für
dichotome,
nominale,,
ordinale,
diskrete und
kontinuierliche
M k l an!!
Merkmale
(4 Min.)
Folie 5
Skala Diagramm
dichotom
nominal
ordinal
keines (Anzahl u. Anteil angeben)
Mosaik nach Häufigkeit
Mosaik nach Häufigkeit
Mosaik geordnet
diskret
Stabdiagramm
Histogramm
kontinuierlich Verteilungsfunktion Boxplot
Folie 6
Scale Diagramm
dichotous
nominal
ordinal
none (give number and proportion)
mosaic ordered by frequency
mosaic ordered
discrete
bar chart
histogram
continuous
cumulative distribution function
boxplot Folie 7
7
Klinischer Gesamteindruck
von 92
schwer Depressiven
zu Beginn der Studie Multi-EKT
Clinincal
Global
Impression
5%
6 41%
5 39%
4 14%
Folie 8
(145 Studenten WS2003/2004)
Modalwert
0,5
60
50
0,4
40
03
0,3
30
0,2
20
0,1
10
0
Rela
ative Hä
äufigkeitt
Abso
olute Hä
äufigkeitt
70
0
0
1
2 3 4 5 6 7
Anzahl Geschwister
8
Folie 9
160
170
180
190
200
0.05
0.03
0.01
150
160
170
180
190
200
0.05
0.04
0 03
0.03
0.02
0.01
150
160
170
180
190
Density A
Axis
150
Density A
Axis
0.04
0.02
Density Axis
Die Fläche
jjedes Balkens ggibt an,
wie oft
eine Klasse
beobachtet wurde
0.08
0.06
200
Körpergröße [cm]
Folie 10
Die empirische Verteilungsfunktion
ggibt an, welcher Anteil der Beobachtungen
g kleiner
oder gleich dem Wert x ist
⎧ 0
⎪
ˆ
ˆ
F ( x) := P(] − ∞, x]) = ⎨i / n
⎪ 1
⎩
x < x(1)
x( i ) ≤ x < x( i +1) 1 < i ≤ n
x ≥ x( n )
Pˆ (]a, b )] = Fˆ (b) − Fˆ (a )
Folie 11
F(x)
Harms, S.19, Tab 2.2
Liegezeiten Kaiserschnitt
unteres Quartil
Median
oberes Quartil
Folie 12
S(x)=Anteil
S(x)
Anteil der Beobachtungen, die größer als x sind
=1-F(x)
S(x)
Harms, S.19, Tab 2.2
Liegezeiten Kaiserschnitt
Folie 13
30
Außenpunkt
p
25
Dauer ((T)
Whisker
20
äußerster Punkt innerhalb
Box
oberes Quartil
15
IQS
10
box ± 1.5⋅Interquartilsspanne
Median
unteres Quartil
Folie 14
Modalwert
pp-Quantile
Quantile
häufigster beobachteter Wert
x([np ])
falls np ∉ Ν
⎧
⎪
~
xp = ⎨1
(
)
x
+
x
falls
np
∈
Ν
(
[
np
]
)
(
[
np
]
)
⎪⎩ 2
Median ~
x0.5
~
oberes und untere Quartil ~
x0.25 und x0.75
~
Perzentile
P
til x p⋅100%
Folie 15
arithmetischer
1
x
=
Mittelwert
n
∑x
geometrischer
i h
n
x
=
g
Mittelwert
⎛1 n
⎞
xi = exp⎜ ∑ ln ( xi )⎟
∏
i =1
⎝ n i =1
⎠
n
i =1
i
n
Folie 16
Spannweite
(=
Variationsbreite,
( V
i ti b it range))
Differenz zwischen größtem und kleinstem Wert
x( n ) − x(1)
Q
il b
d IQR interquartile range
Quartilsabstand
~
x75% − ~
x25%
Differenz (oberes minus unteres Quartil)
n
(empirische) Varianz
2
Standardabweichung s
s
= Wurzel aus Varianz
– Variationskoeffizient
100% (Standardabweichung / arithmetisches Mittel))
=
∑ ( xi − x)
i =1
n −1
Folie 17
2
Skalenniveau
Lage- und
Lage
Streuungsmaße
Nominalskala
Diagnose
Häufigkeit
Modalwert
Verteilungsfunktion
Quartilsabstand
Median
arith. Mittelwert
Standardabweichung
Variationskoeffizient
+
+
Ordinalskala
Visus
+
+
+
+
+
Intervallskala
° Celsius
+
+
+
+
+
+
+
Verhältnisskala
Kelvin
+
+
+
+
+
+
+
+
Folie 18
((rechts-)) schief
Median (g
(geometrisches Mittel))
Interquartilsspanne oder Extrema
f(x)
x
symmetrisch
f(x)
x
f(x)
bimodal
arithmetisches Mittel (= Median)
Standardabweichung
Modalwerte
Histogramm
g
Folie 19
Schiefe
1 1 n
3
( xi − x )
3 ∑
n s i =1
positiv: „rechtsschief“
0: „symmetrisch
symmetrisch“
negativ: „linksschief“
Schiefe( X ) = Schiefe( a + bX )
Wölbung
Ä
Ähnlichkeit
der | xi − x | ,
1 1
4
ns
0 bei Normalverteilung
positiv: „spitz“, „leptokurtisch“
Wölbung(
g( X ) = Wölbung(
g( a + bX )
n
∑ (x − x)
i =1
i
Folie 20
4
−3
Herunterladen