Dr. Reinhard Vonthein, Dipl. Statistiker (Univ.) [email protected] Institut für Medizinische Biometrie und Statistik Universität zu Lübeck / Universitätsklinikums Schleswig-Holstein Lüb k 06 Lübeck, 06.04.2010 04 2010 Merkmalsskalen, Rangliste B h ib i V t il Beschreibung einer Verteilung mit Tabelle, Diagramm mit LageLage und Streuungsmaß, Streuungsmaß Schiefe, Schiefe Wölbung Daten und Interpretation Beschreibung eines Zusammenhanges gemeinsame Verteilung bedingte Verteilungen Zusammenhangsmaße Folie 2 metriscch k a t ee g o r i aa l qualitativ (nominal): Ausprägung hat keine zahlenmäßige hl äßi Ordnung Od dichotom: nur zwei Ausprägungen Gewebetyp Geschlecht quantitativ: Ausprägung hat zahlen quantitativ: Ausprägung hat zahlen‐mäßige mäßige Ordnung ordinal: kann geordnet werden Anfärbbarkeit diskret: natürliche Zahlen diskret: natürliche Zahlen Anzahl Zellen Anzahl Zellen kontinuierlich: reelle Zahlen Reaktionszeit Folie 3 metriic c a t e g o rr i c a l qqualitative ((nominal):) values have no natural order dichotous: just two values tissue type sex quantitative: values have an order quantitative: values have an order ordinal: can be ordered dye discrete: integer numbers discrete: integer numbers cell count cell count continuous: real numbers reaction time Folie 4 Geben Sie Beispiele für dichotome, nominale,, ordinale, diskrete und kontinuierliche M k l an!! Merkmale (4 Min.) Folie 5 Skala Diagramm dichotom nominal ordinal keines (Anzahl u. Anteil angeben) Mosaik nach Häufigkeit Mosaik nach Häufigkeit Mosaik geordnet diskret Stabdiagramm Histogramm kontinuierlich Verteilungsfunktion Boxplot Folie 6 Scale Diagramm dichotous nominal ordinal none (give number and proportion) mosaic ordered by frequency mosaic ordered discrete bar chart histogram continuous cumulative distribution function boxplot Folie 7 7 Klinischer Gesamteindruck von 92 schwer Depressiven zu Beginn der Studie Multi-EKT Clinincal Global Impression 5% 6 41% 5 39% 4 14% Folie 8 (145 Studenten WS2003/2004) Modalwert 0,5 60 50 0,4 40 03 0,3 30 0,2 20 0,1 10 0 Rela ative Hä äufigkeitt Abso olute Hä äufigkeitt 70 0 0 1 2 3 4 5 6 7 Anzahl Geschwister 8 Folie 9 160 170 180 190 200 0.05 0.03 0.01 150 160 170 180 190 200 0.05 0.04 0 03 0.03 0.02 0.01 150 160 170 180 190 Density A Axis 150 Density A Axis 0.04 0.02 Density Axis Die Fläche jjedes Balkens ggibt an, wie oft eine Klasse beobachtet wurde 0.08 0.06 200 Körpergröße [cm] Folie 10 Die empirische Verteilungsfunktion ggibt an, welcher Anteil der Beobachtungen g kleiner oder gleich dem Wert x ist ⎧ 0 ⎪ ˆ ˆ F ( x) := P(] − ∞, x]) = ⎨i / n ⎪ 1 ⎩ x < x(1) x( i ) ≤ x < x( i +1) 1 < i ≤ n x ≥ x( n ) Pˆ (]a, b )] = Fˆ (b) − Fˆ (a ) Folie 11 F(x) Harms, S.19, Tab 2.2 Liegezeiten Kaiserschnitt unteres Quartil Median oberes Quartil Folie 12 S(x)=Anteil S(x) Anteil der Beobachtungen, die größer als x sind =1-F(x) S(x) Harms, S.19, Tab 2.2 Liegezeiten Kaiserschnitt Folie 13 30 Außenpunkt p 25 Dauer ((T) Whisker 20 äußerster Punkt innerhalb Box oberes Quartil 15 IQS 10 box ± 1.5⋅Interquartilsspanne Median unteres Quartil Folie 14 Modalwert pp-Quantile Quantile häufigster beobachteter Wert x([np ]) falls np ∉ Ν ⎧ ⎪ ~ xp = ⎨1 ( ) x + x falls np ∈ Ν ( [ np ] ) ( [ np ] ) ⎪⎩ 2 Median ~ x0.5 ~ oberes und untere Quartil ~ x0.25 und x0.75 ~ Perzentile P til x p⋅100% Folie 15 arithmetischer 1 x = Mittelwert n ∑x geometrischer i h n x = g Mittelwert ⎛1 n ⎞ xi = exp⎜ ∑ ln ( xi )⎟ ∏ i =1 ⎝ n i =1 ⎠ n i =1 i n Folie 16 Spannweite (= Variationsbreite, ( V i ti b it range)) Differenz zwischen größtem und kleinstem Wert x( n ) − x(1) Q il b d IQR interquartile range Quartilsabstand ~ x75% − ~ x25% Differenz (oberes minus unteres Quartil) n (empirische) Varianz 2 Standardabweichung s s = Wurzel aus Varianz – Variationskoeffizient 100% (Standardabweichung / arithmetisches Mittel)) = ∑ ( xi − x) i =1 n −1 Folie 17 2 Skalenniveau Lage- und Lage Streuungsmaße Nominalskala Diagnose Häufigkeit Modalwert Verteilungsfunktion Quartilsabstand Median arith. Mittelwert Standardabweichung Variationskoeffizient + + Ordinalskala Visus + + + + + Intervallskala ° Celsius + + + + + + + Verhältnisskala Kelvin + + + + + + + + Folie 18 ((rechts-)) schief Median (g (geometrisches Mittel)) Interquartilsspanne oder Extrema f(x) x symmetrisch f(x) x f(x) bimodal arithmetisches Mittel (= Median) Standardabweichung Modalwerte Histogramm g Folie 19 Schiefe 1 1 n 3 ( xi − x ) 3 ∑ n s i =1 positiv: „rechtsschief“ 0: „symmetrisch symmetrisch“ negativ: „linksschief“ Schiefe( X ) = Schiefe( a + bX ) Wölbung Ä Ähnlichkeit der | xi − x | , 1 1 4 ns 0 bei Normalverteilung positiv: „spitz“, „leptokurtisch“ Wölbung( g( X ) = Wölbung( g( a + bX ) n ∑ (x − x) i =1 i Folie 20 4 −3