Grundbegri e

Werbung
Grundbegrie
Die beschreibende Statistik (deskriptive Statistik) ist eine systematische Zusammenstellung von Zahlen und Daten zur Beschreibung bestimmter Zustände,
Entwicklungen oder Phänomenen. Die beschreibende Statistik umfasst statistische Methoden, die sich auf die Erhebung, Aufbereitung, Auswertung und
Analyse von Daten beziehen. Die Aussagen beziehen sich nur auf die erhobene
Datenmenge. Es werden also keine Schlüsse auf die übergeordnete Gesamtheit
gezogen.
• Grundgesamtheit(Statistische
Gesamtheit) ist eine sachlich, räumlich
oder zeitlich abgegrenzte Menge von Elementen (Merkmalsträgern, Einheiten).
• Stichprobe(Teilgesamtheit) ist eine Teilmenge der Grundgesamtheit, die
genauer betrachtet wird. Die Anzahl n der Elemente einer Stichprobe heiÿt
Stichprobenumfang.
• Merkmalsträger(Statistisches Element/Einheit) ist das einzelne Element
der Grundgesamtheit oder Stichprobe. Der Merkmalsträger ist der Träger
der statistischen Information.
• Merkmal ist eine Eigenschaft des statistischen Elements oder Merkmalsträgers bezüglich der statistischen Untersuchung.
• Merkmalsausprägung(Merkmalswert/Beobachtungswert/Messwert) ist
der Wert, der bei der Beobachtung bei der einzelnen statistischen Einheit
bzw. dem Merkmalsträger festgestellt wurde.
• Erhebung
ist die Feststellung der Merkmalsausprägung von Merkmalen
bei den Merkmalsträgern.
• Skala: Vorschrift, nach der jedem Merkmalsträger einer Gesamtheit genau
eine Merkmalsausprägung zugeordnet werden kann.
1.
Nominalskala: die Merkmalsausprägungen Bezeichnungen, die ausschlieÿlich der Kennzeichnung dienen. Keine Reihenfolge bestimmbar.(z.B. Farbe, Kennzeichen, Geschlecht usw.)
2.
Ordinalskala:
die Merkmalsausprägung haben eine Rangfolge. Ab-
stände zwischen einelnen Merkmalsausprägungen ist nicht quantizierbar. (z.B. Noten, Rangplätze usw.)
3.
Metrische Skala: die Merkmalsausprägung ist eine reelle Zahl (Merkmalswert). Das Merkmal heiÿt diskret, falls die Ausprägungen isolierte Zahlenwerte sind. Das Merkmal heiÿt stetig, falls die Ausprägungen alle Zahlenwerte eines Intervalls annehmen können.
Intervallskala: metrische Skala ohne natürlichen Nullpunkt und
ohne natürliche Einheit. Intervalle können hier miteinander verglichen werden, d.h. aussagefähige Dierenzen der Ausprägungen
können gebildet werden (z.B. Temperatur).
Verhältnisskala:
metrische Skala mit natürlichem Nullpunkt
und keiner natürlichen Einheit. Aussagefähige Dierenzen und
auch Quotienten der Ausprägungen können gebildet werden (z.B.
Alter, Körpergröÿe, Füllmenge).
1
Absolutskala: metrische Skala mit einem natürlichen Nullpunkt
und einer natürlichen Einheit. (Z.B. Einwohnerzahl).
Nicht alle Variablen lassen sich eindeutig den obigen Kategorien zuordnen!
2
Eindimensionale (nicht klassierte) Datensätze
Urliste
Die
entsteht durch Aneinanderreihung der beobachteten Merkmals-
ausprägungen eines einzigen metrisch skalierten Merkmals bei einer Erhebung.
In der sortierten Urliste sind die Merkmalsausprägungen der Gröÿe nach geordnet.
0.1 Häugkeitsverteilung
Sei
X
das beobachtete Merkmal der Elemente (Merkmalsträger) einer Gesamt-
heit von
n
Elementen.
k
Bezeichne
die Anzahl der möglichen Merkmalsausprägungen (Merkmals-
wert) des Merkmals
X.
Die möglichen Merkmalsausprägungen sind
xi (i =
1, . . . , k ).
Eine wichtige statistische Tätigkeit besteht darin, die auf eine bestimmte
Merkmalsausprägung entfallende Anzahl von Elementen auszuzählen.
Die
absolute Häugkeit fi
der Merkmalsausprägung
der Elemente, welche die Merkmalsausprägung
xi
xi
ist die Anzahl
besitzen. Es gilt
Pk
f1 + · · · + fk = i=1 fi = n.
fi
Die relative Häugkeit von xi ist der Quotient gi =
n . Es
Pk
(i = 1, . . . , k ), und g1 + · · · + gk =
g
=
1
.
i=1 i
Die prozentuale relative Häugkeit von xi ist gi · 100%.
(i
= 1, . . . , k ),
0 ≤ fi ≤ n
und
gilt
0 ≤ gi ≤ 1
Die Darstellung der Merkmalsausprägung mit den dazugehörenden Häugkeiten in tabellarischer bzw. graphischer Form bezeichnet man als
verteilung:
i
1
2
xi
x1
x2
fi
f1
f2
gi
g1
g2
gi · 100%
g1 · 100%
g2 · 100%
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
k
Σ
xk
fk
n
gk
1
gk · 100%
100%
Häugkeits-
Die Häugkeitsverteilung läÿt sich auch graphisch darstellen:
1. Stabdiagramm: höhenproportinale Darstellung
2. Histogramm: ächenproportinale Darstellung
Diese Häugkeitsverteilung kann mit zusätzlichen Spalten ergänzt werden.
Die
kumulierte absolute Häugkeit Fi
ist die Anzahl jener Elemente
(Merkmalsträger) einer statistischen Gesamtheit, bei denen die Ausprägung des
Pi
Fi = f1 + · · · + fi = j=1 fj .
kumulierte relative Häugkeit Gi ist die Anzahl jener Elemente
Merkmals
Die
X
höchstens gleich
xi
ist, d.h.
(Merkmalsträger) einer statistischen Gesamtheit, bei denen die Ausprägung des
Merkmals
X
höchstens gleich
xi
ist, d.h.
3
Gi = g1 + · · · + gi =
Pi
j=1 gj .
i
1
2
xi
x1
x2
fi
f1
f2
gi
g1
g2
Fi
F1 = f1
F2 = f1 + f2
Gi
G1 = g1
G2 = g1 + g2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
k
Σ
xk
fk
n
gk
1
Fk = f1 + · · · + fk
Gk = g1 + · · · + gk
Mit Hilfe der kumulierten relativen Häugkeiten (relativen Summenhäugkeiten) läÿt sich die empirische Verteilungsfunktion

 0
Gi
F (x) =

1
für
für
für
x < x1
xi ≤ x < xi+1
xk ≤ x
F (x)
denieren:
(i = 1 . . . , k − 1)
Der Graph der empirischen Verteilungsfunktion ist eine Treppenfunktion.
0.2 Lageparameter (Mittelwerte)
Ein Lageparameter ist ein Mittelwert. Mittelwerte beschreiben die Gesamtheit
durch einen einzigen Wert, der eine charakteristische Gröÿe annimmt. Dieser
Wert soll die Lage der Gesamtheit möglichst gut repräsentieren.
Denition 0.1 (Modus)
Der Modus
Mo
(oder Modalwert) ist der häugste
Merkmalswert.
Voraussetzung: Es muÿ mindestens ein nominalskaliertes Merkmal vorliegen.
Eigenschaften des Modus:
•
Der Modus ist nicht immer bestimmt: haben mehrere Merkmalswerte die
gleiche gröÿte Häugkeit, so spricht man entweder über die Menge der
Modalwerte, oder man sagt, daÿ es keinen Modus gibt.
•
Bildung des Modus ist nicht immer sinnvoll, z.B. wenn keine herausragende Häugkeit zu beobachten ist.
Denition 0.2 (Median)
Der Median
Me
(oder Zentralwert) heiÿt der Merk-
malswert, dessen Merkmalsträger in der Rangordnung aller Merkmalsträger genau die mittlere Position einnimmt. Unterhalb und oberhalb des Medians liegen
jeweils die Hälfte aller Merkmalswerte. Ist die Anzahl
n
aller Merkmalswerte
eine
•
ungerade Zahl, so gleicht der Median dem
Rangordnung, d.h.
•
n+1
2 -ten Merkmalswert in der
Me = x n+1 ;
2
gerade Zahl, so gleicht der Median dem Mittelwert der
Merkmalswerte in der Rangordnung, d.h.
Voraussetzung:
Me =
1
2
n
n
2 -ten und
2 +1-ten
.
x n2 + x n2 +1
Wegen der benötigten Rangordnung müssen die Merk-
male mindestens ordinalskaliert sein.
4
Denition 0.3 (q-Quantil)
q -Quantil Qq (0 < q < 1) ist derjenige Merkq:
Qq liegt genau der Anteil q aller Fälle der Ver-
Das
malswert, der die ranggeordnete Menge aller Merkmalswerte im Verhältnis
(1 − q)
aufteilt, d.h. unterhalb
Qq
aus
der Rangordnung für
q=
teilung. Berechnet man
•
j
k , dann ist
Q j = xm + t · (xm+1 − xm ) = (1 − t)xm + txm+1 ,
k
m=
wo
•
j
k
· (n + 1)
t=
und
j
k
· (n + 1) =
j
k
· (n + 1) − m;
der Häugkeitsverteilung mit Hilfe der kumulierten relativen Häugkeiten
Gi ,
dann ist
Qq = xi ,
Spezielle
q -Quantile
Gi−1 ≤ q
falls
und
sind:
•
für
q=
1
4 ist
Q1 := Q 14
das untere Quartil,
•
für
q=
1
2 ist
Me = Q 12
der Median,
•
für
q=
3
4 ist
Q3 := Q 34
das obere Quartil,
•
für
q=
1
10 ist
1
D1 := Q 10
das 10%-Dezil,
•
für
q=
9
10 ist
9
D9 := Q 10
das 90%-Dezil.
Denition 0.4 (arithmetisches Mittel)
schnitt)
x̄
von
n
Gi ≥ q.
Werten
xi
zahl, d.h.
Pn
i=1
x̄ =
Voraussetzung:
Das arithmetische Mittel (Durch-
ist die Summe dieser Werte, geteilt durch ihre An-
Das Merkmal
xi
n
X
.
muss mindestens intervallskaliert sein,
damit der Durchschnitt einen Sinn ergibt.
Denition 0.5 (gewogenes arithmetisches Mittel)
tische Mittel
bzw.
gi
x̄
von
k
Werten
xi ,
Das gewogene arithme-
deren absolute bzw. relative Häugkeiten
fi
bezeichet, ist
Pk
x̄ = Pi=1
k
fi xi
i=1
fi
=
k
X
gi xi .
i=1
Eigenschaften des arithmetischen Mittels:
• xmin ≤ x̄ ≤ xmax ;
Pn
•
i=1 xi = nx̄.
•
A, B ∈ R und yi = Bxi + A die transformierten Werte, so gilt
Pn
Pn
Pn
Pn
B i=1 xi + nA
xi
i=1 yi
i=1 Bxi + A
ȳ =
=
=
= B i=1 +A = B x̄+A,
n
n
n
n
Sind
d.h. das arithmetische Mittel unterliegt der selben linearen Transformation, wie die Werten selbst.
5
0.3 Streuungsparameter
Denition 0.6 (Spannweite)
Der Maÿ
R = xmax − xmin
für die Entfernung zwischen kleinstem und gröÿtem beobachtetem Merkmalswert. Sie gibt Länge des Bereichs an, über den sich die Merkmalswerte verteilen.
Voraussetzung:
Berechnung von Dierenzen erfordert mindestens Inter-
vallskalierung.
Eigenschaften der Spannweite:
•
Erste Abschätzung für die Streuung.
•
Reagiert sehr empndlich auf Ausreiÿer.
Denition 0.7 (zentraler Quartilsabstand)
Der zentrale Quartilsabstand
IQR = Q3 − Q1
ist die Entfernung zwischen den beiden Merkmalswerten, die die zentral gelegenen 50% der Merkmalsträger eingrenzen.
Voraussetzung: Die Merkmale müssen mindestens intervallskaliert sein, da
zur Berechnung des Abstandes die Dierenz gebildet werden muss.
Eigenschaften der Spannweite:
•
Ausreiÿer unproblematisch, da untere und obere 25% der Häugkeitsverteilung abgeschnitten werden.
Denition 0.8 (mittlere absolute Abweichung)
Die mittlere absolute Ab-
δ (oder M AD) ist das arithmetische Mittel der Beträge der
di = xi − x̄ der Merkmalswerte xi vom Durchschnitt x̄, d.h.
weichung
chungen
P |d |
n
P f |d |
• M AD = δ = P f
• M AD = δ =
n
i=1
i
Abwei-
, von der Rangordnung berechnet;
k
i=1 i i
k
i=1 i
=
Pk
i=1 gi |di | von der Häugkeitsverteilung be-
rechnet.
Voraussetzung: Die Merkmale müssen mindestens intervallskaliert sein, da
zur Berechnung des Abstandes die Dierenz gebildet werden muss.
Bemerkung 0.1
A∈R
Die mittlere absolute Abweichung von einer festgelegten Zahl
läÿt sich durch die Formel
Pn
δA =
i=1
|xi − A|
n
denieren. Es gilt
δMe = min δA .
A∈R
Denition 0.9 (Varianz)
Quadrate der Abweichungen
schnitt
x̄,
σ 2 ist das arithmetische Mittel der
di = xi − x̄ der Merkmalswerte xi vom Durch-
Die Varianz
d.h.
6
P d
n
P
f d
• σ2 = P f
• σ2 =
n
i=1
2
i
, von der Rangordnung berechnet;
k
2
i=1 i i
k
i
i=1
=
Pk
2
i=1 gi di von der Häugkeitsverteilung berechnet.
Die Standardabweichung
σ
ist die nichtnegative Wurzel aus der Varianz.
Voraussetzung: Die Merkmale müssen mindestens intervallskaliert sein, da
zur Berechnung des Abstandes die Dierenz gebildet werden muss.
Eigenschaften der Varianz (bzw. Standardabweichung):
•
Die Varianz ist das am meisten benutzte Maÿ für ie Streuung.
•
Die Varianz (und die Standardabweichung) kann nicht inhaltlich interpretiert werden, denn die resultierenden quadrierten Dimensionen sind
inhaltlich nicht interpretierbar.
• M AD < σ .
•
Verschiebungssatz:
σ2
Pn
=
i=1 (xi
− x̄)2
n
2
x
i=1 i
− 2x̄
n
Pn
=
Pn
2
i=1 (xi
− 2x̄xi + x̄2 )
=
n
n
1X 2
i=1 xi
x − x̄2 ,
+ x̄2 =
n
n i=1 i
=
Pn
d.h. die Varianz läÿt sich aus der Quadratsumme der Merkmalswerte und
aus dem arithmetischen Mittel berechnen.
•
Ist
Y = B · X + A das linear transformierte Merkmal, so sind yi = Bxi + A
2
σY2 = B 2 σX
, denn:
dessen Merkmalswerte, und es ist
n
σY2
n
1X 2
1X
yi − ȳ 2 =
(Bxi + A)2 − (B x̄ + A)2
n i=1
n i=1
!
n
n
X
1 X 2 2
2
=
B xi + 2AB
xi + nA − B 2 x̄2 − 2AB x̄ − A2
n i=1
i=1
!
n
X
1
2
2
2
B
xi + 2ABnx̄ + nA − B 2 x̄2 − 2AB x̄ − A2
=
n
i=1
!
n
1X 2
2
2
2
= B
x − x̄
= B 2 σX
n i=1 i
=
Denition 0.10 (Variationskoezient)
Der Variationskoezient ist das Ver-
hältnis der Standardabweichung zum arithmetischen Mittel, d.h.
V =
σ
x̄ .
Eigenschaften des Variationskoezienten:
•
Eignet sich zum Vergleich der Streuungen zweier Verteilungen mit sehr
unterschiedlichen Mittelwerten.
•
Wegen Verwendung der Standardabweichung nicht interpretierbar.
7
0.4 Schiefe
Die Asymmetrie der Häugkeitsverteilung läÿt sich auch messen. Maÿe für die
Asymmetrie sind:
•
Pearson-Parameter:
A=
x̄−Mo
σ
≈
3(x̄−Me )
.
σ
• F -Parameter
aus den Quartilen:
aus den Dezilen:
wofür ist
F =
F =
(Q3 −Me )−(Me −Q1 )
(Q3 −Me )+(Me −Q1 ) ,
(D9 −Me )−(Me −D1 )
(D9 −Me )+(Me −D1 ) ,
|F | ≤ 1.
Die Häugkeitsverteilung ist
•
symmetrisch, falls
•
linkssteil bzw. rechtsschief, falls
A>0
•
und
Mo = Me = x̄.
und
A = F = 0.
Mo < Me < x̄.
Es sind in diesem Fall
Mo < Me < x̄.
Es sind in diesem Fall
F > 0.
rechtssteil bzw. linksschief, falls
A<0
Es ist in diesem Fall
F < 0.
0.5 Wölbung (Kurtosis)
Es ist nur sinnvoll, die Wölbung symmetrischer Verteilungen zu berechnen. Ein
Maÿ für die Wölbung ist
K=
Q3 − Q1
.
2(D9 − D1 )
(Dieses Wölbungsmaÿ reagiert sehr empndlich auf unsymmetrische Verteilungen.)
•
Ist
K < 0,
so ist die beobachtete Häugkeitsverteilung acher gewölbt als
eine Normalverteilung mit denselben Parametern.
•
Ist
K = 0,
so ist die beobachtete Häugkeitsverteilung identisch gewölbt
wie eine Normalverteilung mit denselben Parametern.
•
Ist
K > 0,
so ist die beobachtete Häugkeitsverteilung steiler gewölbt als
eine Normalverteilung mit denselben Parametern.
0.6 Beispiele
Beispiel 0.1
Die folgende Liste enthält die Krankenurlaubstage von 20 Mitar-
beiter eines kleinen Unternehmens im letzten Jahr:
10, 31, 17, 22, 7, 1, 9, 36, 5, 13, 26, 2, 8, 6, 0, 24, 30, 24, 11, 20.
Ermitteln wir die gelernten Lage- und Streuungsparameter!
8
Anhand der Tabelle
Zehnerzier
Einerzier
0
1
2
3
71952860
0731
26440
160
ordnet man die Urliste der Gröÿe nach.
Der Datensatz ist:
0, 1, 2, 5, 6, 7, 8, 9, 10, 11, 13, 17, 20, 22, 24, 24, 26, 30, 31, 36
Die Lageparameter sind:
•
Modus:
Mo = 24
•
Median:
n = 20
(mit absoluter Häugkeit 2).
ist gerade
Me =
•
unteres Quartil:
1
4
11 + 13
1
(x10 + x11 ) =
= 12
2
2
(20 + 1) = 5, 25; m = [5, 25] = 5; t = {5, 25} = 0, 25
Q1 = Q 41 = xm+1 + t · (xm+1 − xm ) = 6 + 0, 25(7 − 6) = 6, 25
•
oberes Quartil:
3
4
(20 + 1) = 15, 75; m = [15, 75] = 15; t = {15, 75} = 0, 75
Q3 = Q 34 = xm+1 + t · (xm+1 − xm ) = 24 + 0, 75(24 − 24) = 24
•
10%-Dezil:
1
10
(20 + 1) = 2, 1; m = [2, 1] = 2; t = {2, 1} = 0, 1
1 = xm+1 + t · (xm+1 − xm ) = 2 + 0, 1(2 − 1) = 2, 1
D1 = Q 10
•
90%-Dezil:
9
10
(20 + 1) = 18, 9; m = [18, 9] = 18; t = {18, 9} = 0, 9
9 = xm+1 + t · (xm+1 − xm ) = 31 + 0, 9(31 − 30) = 31, 9
D9 = Q 10
•
arithmetisches Mittel:
Pn
x̄ =
i=1
n
xi
= 15, 1
Die Streuungsparameter sind:
•
Spannweite:
R = 36 − 0 = 36
•
zentraler Quartilsabstand:
IQR = Q3 − Q1 = 24 − 6, 25 = 17, 75
9
•
mittlere absolute Abweichung:
xi 0 1 2 5 6 7 8 9 10 11 13 17 20 22
|xi − Me | 12 11 10 7 6 5 4 3 2 1 1 5 8 10
Pn
|xi − Me |
M AD = i=1
= 9, 2
n
•
Varianz und Standardabweichung:
σ 2 = 112, 39
•
und
σ = 10, 60
Variationskoezient:
V =
•
24 24 26 30
12 12 14 18
σ
10, 60
=
= 0, 7021
x̄
15, 1
Pearson-Parameter:
A=
• F -Parameter
aus den Quartilen:
(Q3 − Me ) − (Me − Q1 )
12 − 5, 75
=
= 0, 3913
(Q3 − Me ) + (Me − Q1 )
12 + 5, 25
F =
• F -Parameter
aus den Dezilen:
F =
Beispiel 0.2
x̄ − Mo
15, 1 − 24
=
= −0, 8396
σ
10, 60
(D9 − Me ) − (Me − D1 )
19, 9 − 9, 9
=
= 0, 3356
(D9 − Me ) + (Me − D1 )
19, 9 + 9, 9
Die Anzahl der Kinder in den Familien einer Ortschaft wurde in
der folgenden Tabelle zusammengefaÿt:
Anzahl der Kinder in der Familie
Anzahl der Familien
0
1
2
3
4
5
6
25
33
49
47
11
2
3
Fertigen wir die Häugkeitstabelle und ermitteln wir die gelernten Lage- und
Streuungsparameter!
Die Häugkeitstabelle ergänzt mit den Summenwertspalten und mit den Abweichungsspalten ist:
i
1
2
3
4
5
6
7
Σ
xi
fi
0
25
1
33
2
49
3
47
4
11
5
2
6
3
−− 170
gi
Fi
0, 1471 25
0, 1941 58
0, 2882 107
0, 2765 154
0, 0647 165
0, 0118 167
0, 0176 170
1
−−
Gi
xi fi
0, 1471
0
0, 3412 33
0, 6294 98
0, 9059 141
0, 9706 44
0, 9824 10
1
18
−−
344
10
xi gi
|xi − Me | |xi − x̄|
0
2
2
0, 1941
1
1
0, 5764
0
0
0, 8295
1
1
0, 2588
2
2
0, 0590
3
3
0, 1056
4
4
2, 0234
−−
−−
31 36
19 24
Die Lageparameter sind:
•
Modus:
Mo = 2,
•
denn Merkmalswert mit gröÿter absoluter Häugkeit49 )
Median:
Me = 2,
•
denn
G1 = 0, 1471 ≤ 0, 25
und
G2 = 0, 3412 ≥ 0, 25
denn
G3 = 0, 6294 ≤ 0, 75
und
G4 = 0, 9059 ≥ 0, 75
10%-Dezil:
1 = 0,
D1 = Q 10
•
denn
G0 = 0 ≤ 0, 10
und
G1 = 0, 1471 ≥ 0, 10
90%-Dezil:
9 = 3,
D9 = Q 10
•
G3 = 0, 6294 ≥ 0, 5
oberes Quartil:
Q3 = Q 43 = 3,
•
und
unteres Quartil:
Q1 = Q 41 = 1,
•
G2 = 0, 3412 ≤ 0, 5
denn
denn
G3 = 0, 6294 ≤ 0, 90
und
G4 = 0, 9059 ≥ 0, 90
arithmetisches Mittel:
x̄ =
n
X
xi gi = 2, 02 ≈ 2
i=1
Die Streuungsparameter sind:
•
Spannweite:
R=6−0=6
•
zentraler Quartilsabstand:
IQR = Q3 − Q1 = 3 − 1 = 2
•
mittlere absolute Abweichung:
n
M AD =
•
1X
|xi − Me |fi = 1
n i=1
Varianz und Standardabweichung:
n
σ2 =
1X
(xi − x̄)2 fi = 1, 71
n i=1
11
und
σ = 1, 31
•
Variationskoezient:
V =
•
Pearson-Parameter:
A=
• F -Parameter
2, 02 − 2
x̄ − Mo
=
= 0, 02 ≈ 0
σ
1, 31
aus den Quartilen:
F =
• F -Parameter
(Q3 − Me ) − (Me − Q1 )
=0
(Q3 − Me ) + (Me − Q1 )
aus den Dezilen:
F =
•
σ
≈ 0, 647
x̄
(D9 − Me ) − (Me − D1 )
=0
(D9 − Me ) + (Me − D1 )
Da diese Verteilung nahezu symmetrisch ist, ist es sinnvoll, die Wölbung
zu berechnen:
Q3 − Q1
1
=
2(D9 − D1 )
3
K=
0.7 Aufgaben
Aufgabe 0.1
Die folgende Liste enthält die Alter von 20 Autokäufer, die bei
einem Gebrauchtwagenhändler im letzten Monat einen Wagen gekauft haben.
38
28
27
47
35
45
19
20
21
32
26
36
34
34
54
50
35
34
20
29
(a) Ordnen Sie die Liste!
(b) Berechnen Sie Modus, Median, unteres Quartil, oberes Quartil, die 10%
und 90% Dezile und den Durchschnitt der Daten!
(c) Berechnen Sie die Spannweite, den zentralen Quartilsabstand (IQR), die
mittlere absolute Abweichung (MAD), die Varianz und Standardabweichung!
(d) Berechnen Sie den Pearson-Parameter und die
F -Parameter!
Interpretie-
ren Sie die berechneten Werte!
Aufgabe 0.2
In einem Fuÿballverein spielen Nachwuchsspieler vom Alter 10
bis 15. Die Folgende Tabelle zeigt, wie viele Schüler jeweils in den einzelnen
Altersgruppen spielen.
Alter
Anzahl der Nachwuchsspieler
10 11 12
24 30 27
13 14 15
23 20 20
(a) Fertigen Sie die Häugkeitsverteilung mit sämtlichen gelernten Spalten!
Stellen Sie die Daten an einem Säulendiagramm bzw. Kreisdiagramm graphisch dar! Stellen Sie die empirische Verteilungsfunktion dar!
12
(b) Berechnen Sie Modus, Median, unteres Quartil, oberes Quartil, die 10%
und 90% Dezile und den Durchschnitt der Daten! Interpretieren Sie die
berechneten Werte!
(c) Berechnen Sie die Spannweite, den zentralen Quartilsabstand (IQR), die
mittlere absolute Abweichung (MAD), die Varianz und Standardabweichung!
(d) Berechnen Sie den Pearson-Parameter und die
F -Parameter!
ren Sie die berechneten Werte!
(e) Wieviel Prozent der Nachwuchsspieler ist nicht älter als 14?
(f ) Wieviel Prozent der Nachwuchsspieler ist älter als 14?
(g) Welcher Anteil aller Nachwuchsspieler ist 14 Jahre alt?
13
Interpretie-
Herunterladen