Daten Quantitativ Qualitativ Diskret Stetig Häufigkeitstabelle Klassierte Häufigkeitstabelle Stab-Diagramm Kreis-Diagramm Histogramm Histogramm der Klassendichten Polygon (Häufigkeitspolygon) Geglättetes Polygon (Dichte-Funktion) Verteilungsfunktion (Kumulatives Häufigkeitspolygon bzw. Summenkurve) Verteilungsfunktion (Treppenfunktion) fj f f j j 1 j Kj dj mj hj f j Fj f j aj hj fj Fj 1 ! Daten Lageparameter Spannweite: R Streuparameter Median: x Med Modus: x Mod Mittelwert : x (Arithmetisches Mittel) Varianz: s ² Standardabweichung: s _________ gegenüber Ausreißer • Empfindlich gegenüber __________ • Nur für _____________ Merkmale Mittelwert : x (Arithmetisches Mittel) x = x = x ≈ N 1 a j ⋅h j ⋅ N N s s 2 2 = ≈ s= Modus: x Mod Ordne die N Elemente der _______nach Das Elemente das am ___________ vorkommt N ist gerade Der _________ aus den ________ Elementen in der Mitte ist der Median j = 1 M m j ⋅hj ⋅ Das Element in der _________ ist der Median j =1 Varianz: s ² Standardabweichung: s s2 = Median: x Med N ist ungerade i =1 Gut geeignet für _______-skalierte Merkmale M 1 1 xi ⋅ N Quartilsabstand: Q N −1 1 N −1 (xi ⋅ N − 1 1 R = N 1 Spannweite: R −x ) h ⋅ j ( j ⋅ a − x )2 j = 1 M ⋅ hj ⋅ (mj – Q = – 2 i = 1 M Quartilsabstand: Q − x )2 xmin : Das kleinste Element der Datenreihe Q1 : Das 25%-Quantil xmax : Das größte Element der Datenreihe Ordne die N Elemente der _______ nach j = 1 Q3 : Das 75%-Quantil Die Mitte der ________ Datenhälfte ist Q1 s2 N Anzahl der Elemente in der Datenreihe a j : _________________ und m j :________________ M: Anzahl der _______________ oder der _______________ Die ______ der oberen Datenhälfte ist ____ Untere Hälfte Obere Hälfte 25% 25% xMin 25% 25% Q3 Q1 xMax Q2 Median 2 # $ & .224 .1995 Fraction Fraction .1955 x 0 -3.19068 3.16666 z 0 -29.644 -.540257 x x x 0 .397801 31.7841 z # $ "$% $ .1995 .224 0 -29.644 -.540257 x Fraction 25% Fraction .1955 0 -3.19068 3.16666 x x 0 .397801 z x 31.7841 z 25% " '( $ !$ bk aj h jk h bk hj aj f jk fj f 3 " '( $ Daten Nominalskaliert Kontingenztabelle Kardinalskaliert (Metrisch) Kontingenztabelle der bedingten Häufigkeiten Wertetabelle Stab-Diagramm der bedingten Häufigkeiten Stab-Diagramm Streu-Diagramm Kontingenztabellen können auch für alle anderen Datentypen verwendet werden, wenn man diese auf _________________ Daten ___________. '( Zusammenhangsanalyse zweier nominalskalierter Merkmalen X und Y in Kontingenztabellen Richtung des ____________ Zusammenhangs von X und Y $ Zusammenhangsanalyse zweier kardinalskalierter (metrischer) Merkmalen X und Y Unabhängigkeit von X und Y Wenn für alle Merkmal-AusprägungenPaare ( a j ; b k ) gilt: Stärke und Richtung des linearen Zusammenhangs von X und Y Der Korrelationskoeffizient: r hj k = e hj k jk = h j * ⋅ h *k r = N : ____________ Häufigkeiten hj : Randhäufigkeit der j-ten __________ h : Randhäufigkeit der k-ten __________ e j k : Erwartete Häufigkeiten für die Unabhängig von X und Y Je ______ die jeweiligen ejk- sich von den hjk-Werten unterscheiden, um so größer ist die ________________von X und Y Ist r 0 , so liegt __________________ Zusammenhang zwischen X und Y vor. s xy = 1 N −1 s xy sx ⋅ sy N ( xi − x )( y i − y ) ⋅ i=1 sxy : _____________ sx: Standardabweichung der x-Werte negativ Gleichsinniger linearer Zusammenhang sy: Standardabweichung der y-Werte positiv Gegensinniger linearer Zusammenhang Ist r nahe bei 1 oder – 1, dann liegen die Punkte fast auf _______________ 4