4 Stichproben und Statistiken

Werbung
§4 Stichproben und Statistiken
Will man sich nicht nur auf die beschreibende Statistik - also die graphische Darstellung von statistischen Daten
und die Berechnung von gewissen Maßzahlen - beschränken, so muss zunächst der Begriff "Stichprobe" genauer
definiert werden, wobei vor allem die Zufälligkeit der Stichprobe in adäquater Weise in Betracht gezogen werden
muss.
Sobald aber eine Stichprobe als zufällig angesehen wird, werden davon abhängige statistische Maßzahlen
notgedrungen zu Zufallsvariablen - man spricht von Statistiken. Wir werden uns in diesem Kapitel mit einigen
wichtigen Statistiken im Detail befassen. Weitere wichtige Statistiken werden wir in den folgenden Kapiteln bei
Bedarf definieren und ihre Eigenschaften besprechen.
4.1 Die Zufälligkeit einer Stichprobe
Bisher sind wir stets davon ausgegangen, dass ein statistisches Datenmaterial in Form einer Datenmatrix vorliegt,
wobei wir uns über die Entstehung dieses Datenmaterials keine Gedanken gemacht haben. In vielen Fällen entsteht
ein derartiges Datenmaterial aber durch eine zufällige Auswahl von einzelnen Objekten, an denen gewisse Merkmale beobachtet werden. Beim Datenmaterial stahl wurden beispielsweise einzelne Stahlbleche der Produktion
zufällig entnommen und von diesen Blechen der Kohlenstoffgehalt und die Zugfestigkeit ermittelt.
Mit den folgenden Begriffsbildungen wird der Zufälligkeit einer Stichprobe Rechnung getragen.
4.1.1 Definition:
a) Eine Zufallsvariable X zusammen mit ihrer Verteilung X nennt man Grundgesamtheit.
b) Eine Liste x = 8x1 , x2 , …, xn < von jeweils n durch unabhängiges Experimentieren gewonnene Realisierungen der Zufallsvariablen X nennt man eine nach dem Verteilungsgesetz X ausgewählte konkrete Stichprobe
vom Umfang n. Man spricht in diesem Zusammenhang auch davon, dass man "aus einer X -verteilten Grundgesamtheit eine Stichprobe vom Umfang n zieht".
c) Wir fassen nun die Zahl xk - also die Realisierung der Zufallsvariablen X beim k-ten Versuch - als Realisie-
rung einer Zufallsvariablen Xk auf und nennen die Liste X = 8X1 , X2 , …, Xn < dieser vollständig unabhängigen und identisch X -verteilten Zufallsvariablen eine nach dem Verteilungsgesetz X ausgewählte mathematische Stichprobe vom Umfang n.
ô
Die Begriffe -wertige Grundgesamtheit (darunter versteht man eine -wertige Zufallsvariable zusammen mit ihrer
Verteilung), -wertige konkrete Stichprobe von Umfang n und -wertige mathematische Stichprobe vom Umfang n
werden analog definiert.
Sobald man eine Stichprobe als zufällig ansieht, wird jede davon abhängige Maßzahl automatisch zu einer
Zufallsvariablen (symbolisch drücken wir dies dadurch aus, dass aus den kleinen Buchstaben, mit denen wir
Maßzahlen bezeichnet haben, große Buchstaben werden). Wir definieren in diesem Zusammenhang:
4.1.2 Definition: Ist X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische
Stichprobe vom Umfang n und ist s : n Ø eine (stückweise stetige) Abbildung, so nennt man
S HnL = s@X D
eine Statistik. Geht aus dem Kontext der Stichprobenumfang n klar hervor, so verzichten wir der Einfachheit
halber auf den oberen Index, schreiben statt S HnL also einfach S.
Die Verteilung einer Statistik S und damit auch ihr Erwartungswert, ihre Streuung, ihre Varianz sowie die
Wahrscheinlichkeit von Ereignissen der Form 8S œ A< hängen von der Verteilung X der Zufallsvariablen X
04_Stichproben_und_Statistiken.nb
2
Wahrscheinlichkeit von Ereignissen der Form 8S A< hängen von der Verteilung X der Zufallsvariablen X
ab. Wir bringen diese Tatsache dadurch zum Ausdruck, indem wir in Zukunft die Schreibweise @S; X D,
@S; X D, @S; X D sowie @8S œ A<; X D verwenden.
Unter dem Wissensgebiet "Statistik" versteht man die "Lehre von den Statistiken". Das Wissensgebiet der Statistik
befasst sich also mit den wahrscheinlichkeitstheoretischen Eigenschaften der verschiedenen Statistiken zusammen
mit ihren äußerst zahlreichen Anwendungen.
4.2 Einige wichtige Statistiken
Im Rahmen dieses Lehrgangs werden wir vielen Statistiken begegnen. Abhängig von der jeweiligen Fragestellung
werden von diesen Statistiken der Erwartungswert, die Varianz, die Verteilung bzw die asymptotische Verteilung
(darunter versteht man die Verteilung dieser Statistik für den Fall, dass der Stichprobenumfang n gegen ¶ geht)
benötigt. Die Ermittlung dieser Größen kann mitunter sehr aufwändig (ja oft sogar unmöglich) sein und wird im
Rahmen von Sätzen (wobei wir oft auf Beweise verzichten müssen), Bemerkungen und Beispielen erfolgen, die
über den ganzen Lehrgang verstreut sind.
Um zu zeigen, wie mit Statistiken gearbeitet wird, werden wir in diesem Abschnitt exemplarisch einige besonders
wichtige Statistiken ausführlich behandeln.
à Mittelwert, Varianz und Standardabweichung
Im Rahmen der Statistik treten die Statistiken Mittelwert, Varianz und Standardabweichung besonders häufig auf.
Wir beginnen daher mit einer genauen Analyse dieser drei Statistiken:
4.2.1 Definition: Ist X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische
Stichprobe vom Umfang n, so nennt man die Statistiken
n
1 n
1
X=
VX =
SX = VX
⁄ Xi
⁄ HXi - X L2
n i=1
n - 1 i=1
den Mittelwert, die Varianz und die Standardabweichung von X (man vergleiche dazu die Maßzahlen x, v x
und s x aus Definition 3.1.1 bzw Definition 3.1.7 sowie die Begriffsbildung in Satz 23.4.2; die in diesem Satz
verwendete Beifügung "empirisch" lassen wir in Hinkunft der Einfachheit halber weg).
4.2.2 Satz: Ist die mathematische Stichprobe X = 8X1 , X2 , …, Xn < vom Umfang n nach dem Verteilungsgesetz X ausgewählt, so gilt
@X ; X D = @X D
1
@X ; X D = @X D
n
@V X , X D = @X D
1
n-3
@V X , X D = @HX - @X DL4 D @X D2
n
n Hn - 1L
ô
Beweis: a) Aus der Linearität des Erwartungswerts folgt unmittelbar
@X ; X D = @
1 n
1 n
⁄ X D=
⁄ @Xi D = @X D
n i=1 i
n i=1
b) Berücksichtigt man die Tatsache, dass für i ∫ k die beiden Zufallsvariablen Xi und Xk unabhängig sind und
damit @Xi Xk D = @Xi D @Xk D = @X D2 gilt, so erhält man durch einfaches Umformen
n
1
1 n
@V X , X D = @
⁄ HXi ⁄ X L2 D =
n - 1 i=1
n j=1 j
04_Stichproben_und_Statistiken.nb
=
3
n
n
1 n
1
1
2
2 n
⁄ @Xi 2 - Xi 2 ⁄ X X +
⁄ X 2 + 2 ⁄ X j Xk D =
n - 1 i=1
n
n j=1 i j n2 j=1 j
n j,k=1
j∫i
=
j∫k
1
Hn @X 2 D - 2 @X 2 D - 2 Hn - 1L @X D2 + @X 2 D + Hn - 1L @X D2 L = @X D
n-1
c) Offenbar gilt
@HX L2 ; X D = @H
n
n
1
1 n
1
n-1
@X D2
⁄ Xi L2 D = 2 @ ⁄ Xi 2 + ⁄ Xi X j D = @X 2 D +
n i=1
n
n
n
i=1
i, j=1
i∫ j
Zusammen mit a) erhält man damit
@X ; X D = @HX L2 ; X D - @X ; X D2 =
1
n-1
1
@X 2 D +
@X D2 - @X D2 = @X D
n
n
n
d) Der Beweis der letzten Aussage ist umfangreich, aber im Prinzip ähnlich den oben angeführten Beweisen.
Der folgende Satz ist für zahlreiche Tests von zentraler Bedeutung.
4.2.3 Satz: Ist die mathematische Stichprobe X = 8X1 , X2 , …, Xn < vom Umfang n nach dem Verteilungsgesetz X = @m, sD ausgewählt, so gilt speziell
a) der Mittelwert X und die Varianz V X von X sind unabhängig;
b) der Mittelwert X von X ist @m, sê
n D-verteilt;
c) die Statistik Hn - 1L V X ês2 ist hi@n - 1D-verteilt;
d) die Statistik T X = HX - mL
n ê S X ist @n - 1D verteilt.
ô
Beweis: Die Zufallsvariablen Z1 , Z2 , …, Zn mit Zi = HXi - mL ê s sind offenbar vollständig unabhängig und identisch @0, 1D-verteilt, erfüllen also die Voraussetzungen von Satz 23.3.8 und Satz 23.4.2. Damit gilt:
ä die beiden Zufallsvariablen Z und VZ sind unabhängig (Satz 23.3.8);
ä die Zufallsvariable Z ist @0, 1 ê
n D-verteilt (Faltungsformeln und Satz über die affine Transformation);
ä die Zufallsvariable Hn - 1L VZ ist hi[n - 1]-verteilt (Satz 23.3.8);
ä die Zufallsvariable TZ = Z
n êSZ ist @n - 1D verteilt (Satz 23.4.2).
Unsere Behauptungen ergeben sich aus diesen vier Eigenschaften unter Berücksichtigung der Tatsache, dass
zwischen den Zufallsvariablen Z, VZ , TZ und X , V X , T X offensichtlich die folgenden Beziehungen bestehen:
X =sZ +m
bzw
V X = s2 VZ
bzw
T X = TZ
à Ordnungsstatistiken
Auch die Ordnungsstatistiken und ihre Verwandten besitzen im Rahmen der Statistik eine besondere Bedeutung:
4.2.4 Definition: Ist X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische
Stichprobe vom Umfang n, so nennt man die Statistiken (man vergleiche dazu Definition 19.2.5)
04_Stichproben_und_Statistiken.nb
4
Stichprobe vom Umfang n, so nennt man die Statistiken (man vergleiche dazu Definition 19.2.5)
Xk* = Min@Max@Xi , Xi , …, Xi D ˝ i1 < i2 < … < ik œ 81, 2, …, n<D
1
2
k
*
XHn+1Lê2
falls n ungerade ist
è
X=
* + X*
HXnê2
Hn+2Lê2 L ê2 falls n gerade ist
R X = Xn* - X1*
è
die k-te Ordnungsstatistik, den Median bzw die Spannweite von X (man vergleiche dazu die Maßzahlen x*k , x
und r x aus Definition 3.1.3 bzw Definition 3.1.1 bzw Definition 3.1.7).
4.2.5 Satz: Ist die mathematische Stichprobe X = 8X1 , X2 , …, Xn < vom Umfang n nach einem stetigen
Verteilungsgesetz X mit der Verteilungsfunktion und der Verteilungsdichte ausgewählt, so gilt für die
Verteilungsdichte X * der k-ten Ordnungsstatistik
k
n
X * @xD = k K O @xD @xDk-1 H1 - @xDLn-k
k
k
und die gemeinsame Verteilungsdichte X * ,X * der i-ten und k-ten Ordnungsstatistik im Fall i < k
i
k
n!
X * ,X * @x, yD = i Hk - iL
@xD @yD @xDi-1 H@ yD - @xDLk-i-1 H1 - @yDLn-k
i ! Hk - iL ! Hn - kL !
i k
ô
Beweis: Die erste Aussage folgt unmittelbar aus Beispiel 19.2.6.
Im Fall i < k gilt für alle x < y
X * ,X * @x, yD =
i
k
1
@8Xi* œ @x, x + „ xD< › 8Xk* œ @y, y + „ yD<D =
„x„ y
Von den Zufallsvariablen X1 , X2 , …, Xn liegt je eine im Intervall
1
@ @x, x + „ xD bzw @y, y + „ yD, i - 1 sind kleiner als x, n - k sind
=
D=
„x„y
größer als y und die restlichen k - i - 1 liegen im Intervall @x, yD
= n @xD Hn - 1L @yD K
n-2
n-i-1
O @xDi-1 K
O H1 - @yDLn-k H@yD - @xDLk-i-1
i-1
n-k
4.2.6 Beispiel: Man entwickle eine Prozedur, mit der sich die Verteilungsdichte der k-ten Ordnungsstatistik
Xk* von X = 8X1 , X2 , …, Xn < für eine beliebige in Mathematica implementierte, stetige Verteilung X
zeichnen lässt.
ô
Lösung: Die einzugebenden Parameter sind der Stichprobenumfang n, der Parameter k, das Verteilungsgesetz dist,
der Bereich, in dem die Verteilungsdichte der k-ten Ordnungsstatistik gezeichnet werden soll, sowie optionale
Angaben betreffend den Stil der Zeichnung:
PlotOrdnungsStatistik@n_, k_, dist_, bereich_, options___D := Module@8x = bereichP1T<,
Plot@k Binomial@n, kD PDF@dist, xD CDF@dist, xDk-1 H1 - CDF@dist, xDLn-k , bereich, optionsDD
Beispielsweise gilt
04_Stichproben_und_Statistiken.nb
5
PlotOrdnungsStatistik@5, 2, ExponentialDistribution@2D, 8x, 0, 2<, PlotStyle Æ [email protected],
AspectRatio Æ 0.5D
3.0
2.5
2.0
1.5
1.0
0.5
0.5
1.0
1.5
2.0
sowie
PlotOrdnungsStatistik@5, 2, UniformDistribution@80, 1<D, 8x, 0, 1<, PlotStyle Æ [email protected],
AspectRatio Æ 0.5D
2.0
1.5
1.0
0.5
0.2
0.4
0.6
0.8
1.0
4.2.7 Beispiel: Für den Spezialfall X = @8a, b<D berechne man den Erwartungswert und die Varianz der kten Ordnungsstatistik Xk* von X = 8X1 , X2 , …, Xn <.
ô
Lösung: Für alle a § x § b gilt für die Verteilungsdichte @xD bzw die Verteilungsfunktion @xD der Gleichverteilung 8@a, b<D bekanntlich @xD = 1 êHb - aL bzw @xD = Hx - aL êHb - aL. Mit Hilfe von Mathematica lassen sich
damit der Erwartungswert @Xk* ; @8a, b<DD und die Varianz @Xk* ; @8a, b<DD der k-ten Ordnungsstatistik Xk*
leicht berechnen.
moment1 = k Binomial@n, kD Hb - aL-n Integrate@ x Hx - aLk-1 Hb - xLn-k , 8x, a, b<D;
moment2 = k Binomial@n, kD Hb - aL-n Integrate@ x2 Hx - aLk-1 Hb - xLn-k , 8x, a, b<D;
FullSimplify@moment1, 80 < k £ n, a < b<D
FullSimplify@moment2 -moment12 , 80 < k £ n, a < b<D
Clear@moment1, moment2D
a+
H−a + bL k
1+n
−
Ha − bL2 k H−1 + k − nL
H1 + nL2 H2 + nL
Es gilt somit
@Xk* ; @8a, b<DD = a +
k Hb - aL
n+1
und
@Xk* ; @8a, b<DD =
k Hb - aL2 Hn - k + 1L
Hn + 1L2 Hn + 2L
4.2.8 Satz: Ist die mathematische Stichprobe X = 8X1 , X2 , …, Xn < vom Umfang n nach einem stetigen
04_Stichproben_und_Statistiken.nb
6
Verteilungsgesetz X mit der Verteilungsfunktion und der Verteilungsdichte ausgewählt, so gilt für die
è
Verteilungsdichte è des Medians im Fall n = 2 m (im Fall n = 2 m + 1 stimmt der Median X mit der OrdX
*
überein, die Verteilungsdichte von è lässt sich in diesem Fall mit Satz 4.2.5 ermitteln)
nungsstatistik Xm+1
X
2 H2 mL !
x
m-1 H1 - @2 x - uDLm-1 „ u
è @xD =
Ÿ @uD @2 x - uD @uD
X
Hm - 1L ! Hm - 1L ! -¶
und für die Verteilungsdichte R
X
der Spannweite
¶
R @xD = n Hn - 1L Ÿ-¶ @uD @u + xD H@u + xD - @uDLn-2 „ u
X
ô
Beweis: Für alle x œ gilt unter Verwendung des Satzes von der totalen Wahrscheinlichkeit in differenzieller
Form unter Berücksichtigung von Bemerkung 18.2.3
1
* + X * L ê 2 œ @x, x + „ xD<D =
@8HXm
m+1
„x
è @xD =
X
=
1 x
*
*
*
Ÿ @8Xm + Xm+1 œ @2 x, 2 x + 2 „ xD< 8Xm = u<D X * @uD „ u =
„ x -¶
m
x
* =u< @2 x - uD X * @uD „ u = 2 Ÿ-¶ X * ,X * @u, 2 x - uD „ u =
8X
m
m m+1
m+1 m
x
= 2 Ÿ-¶ X *
=
x
2 H2 mL !
m-1 H1 - @2 x - uDLm-1 „ u
Ÿ @uD @2 x - uD @uD
Hm - 1L ! Hm - 1L ! -¶
Hinsichtlich der Verteilungsdichte der Spannweite R X der Stichprobe X vergleiche man Beispiel 19.2.7.
4.2.9 Beispiel: Man entwickle eine Prozedur, mit der sich die Verteilungsdichte der Spannweite R X von
X = 8X1 , X2 , …, Xn < für beliebige in Mathematica implementierte, stetige Verteilungen X zeichnen lässt.
ô
Lösung: Die einzugebenden Parameter sind der Stichprobenumfang n, das Verteilungsgesetz dist, der Bereich, in
dem die Verteilungsdichte der Spannweite gezeichnet werden soll, sowie optionale Angaben betreffend den Stil der
Zeichnung:
PlotSpannweite@n_, dist_, bereich_, options___D := Module@8x = bereich@@1DD, umin, umax<,
umin = DistributionDomain@distDP1, 1T;
umax = DistributionDomain@distDP1, 2T;
Plot@n Hn - 1L NIntegrate@PDF@dist, uD PDF@dist, u + xD HCDF@dist, u + xD - CDF@dist, uDLn-2 ,
8u, umin, umax<D, bereich, optionsDD
Beispielsweise gilt
PlotSpannweite@5, ExponentialDistribution@1D, 8x, 0, 5<, PlotStyle Æ [email protected], AspectRatio Æ 0.5,
ImageSize Æ 8150, 80<D
0.4
0.3
0.2
0.1
1
2
3
4
5
04_Stichproben_und_Statistiken.nb
7
sowie
PlotSpannweite@5, UniformDistribution@80, 1<D, 8x, 0, 1<, PlotStyle Æ [email protected], AspectRatio Æ 0.5,
ImageSize Æ 8150, 80<D
2.0
1.5
1.0
0.5
0.2
0.4
0.6
0.8
1.0
und
PlotSpannweite@5, NormalDistribution@0, 1D, 8x, 0, 5<, PlotStyle Æ [email protected], AspectRatio Æ 0.5,
ImageSize Æ 8150, 80<D
0.4
0.3
0.2
0.1
1
2
3
4
5
4.2.10 Beispiel: Für den Spezialfall X = @8a, b<D berechne man den Erwartungswert und die Varianz des
è
Medians X , der Spannweite R X und der Statistik HX1* + Xn* L ê 2 von X = 8X1 , X2 , …, Xn <.
ô
è
Lösung: a) Die Erwartungswerte @X ; @8a, b<DD, @R X ; @8a, b<DD und @HX1* + Xn* L ê2; @8a, b<DD ergeben sich
unmittelbar aus der in Beispiel 4.2.7 ermittelten Formel für den Erwartungswert der k-ten Ordnungsstatistik:
* ; @8a, b<DD = Ha + bL ê2
@Xm+1
für n = 2 m + 1
è
@X ; @8a, b<DD =
*
*
H@Xm ; @8a, b<DD + @Xm+1 ; @8a, b<DDL ê 2 = Ha + bL ê2 für n = 2 m
@R X ; @8a, b<DD = H@Xn* ; @8a, b< 8DD - @X1* ; @a, b<DDL ê2 =
n-1
Hb - aL
n+1
@HX1* + Xn* L ê 2; @8a, b<DD = H@Xn* ; @8a, b<DD + @X1* ; @8a, b<DDL ê2 =
1
Ha + bL
2
è
b) Zur Berechnung der Varianzen @X ; @8a, b<DD, @R X ; @8a, b<DD und @HX1* + Xn* L ê 2; @8a, b<DD verwenden
wir Satz 17.5.6, die in Beispiel 4.2.7 ermittelte Formel für die Varianz der k-ten Ordnungsstatistik sowie die Formel
@Xi* , Xk* ; @a, bDD =
i Hn - k + 1L
Hn + 1L2 Hn + 2L
Hb - aL2
für die Kovarianz @Xi* , Xk* ; @8a, b<DD der beiden Ordnungsstatistiken Xi* und Xk* mit i < k, welche sich unter
Verwendung von Satz 4.2.5 analog zu Beispiel 4.2.7 mit Hilfe von Mathematica leicht beweisen lässt:
04_Stichproben_und_Statistiken.nb
8
FullSimplify@i Hk - iL n ! ê Hi ! Hk - iL ! Hn - kL ! Hb - aLn L
Integrate@y Hb - yLn-k Integrate@x Hx - aLi-1 Hy - xLk-i-1 , 8x, a, y<D, 8y, a, b<,
Assumptions Æ 8a < x < y < b, 1 £ i < k £ n<D
- Ha + i Hb - aL ê Hn + 1LL Ha + k Hb - aL ê Hn + 1LLD
Ha − bL2 i H1 − k + nL
H1 + nL2 H2 + nL
Damit ergibt sich nach elementaren Umformungen
1
* ; @8a, b<DD =
@Xm+1
Hb - aL2
für n = 2 m + 1
è
4 Hn + 2L
@X ; @8a, b<DD =
n
* + X * L ê2; @8a, b<DD =
@HXm
Hb - aL2 für n = 2 m
m+1
4 Hn + 1L Hn + 2L
@R X ; @8a, b<DD = @Xn* - X1* ; @8a, b<DD =
@HX1* + Xn* L ê 2; @8a, b<DD =
2 Hn - 1L
Hn + 1L2 Hn + 2L
Hb - aL2
1
Hb - aL2
2 Hn + 1L Hn + 2L
à Rangstatistiken
Abschließend befassen wir uns noch mit den sogenannten Rangstatistiken:
4.2.11 Definition: Ist X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathemati-sche
Stichprobe vom Umfang n, so nennt man die Statistik Rg@X , Xi D, welche jedem w œ W die Zahl
Rg@X , Xi D@wD = rg@8X1 @wD, X2 @wD, …, Xn @wD<, Xi @wDD
zuordnet, den Rang von Xi (man vergleiche dazu die in Definition 3.1.3 eingeführte Maßzahl rg@x, elementD).
4.2.12 Satz: Ist das Verteilungsgesetz X stetig, so handelt es sich bei der gemeinsamen Verteilung der Ränge
Rg@X , X1 D, Rg@X , X2 D, …, Rg@X , Xn D um die Gleichverteilung auf der Menge aller Permutationen ohne
Wiederholung von n Dingen. Für alle i œ 81, 2, …, n< gilt damit
@Rg@X , Xi D; X D =
n+1
2
@Rg@X , Xi D; X D =
n2 - 1
12
ô
Beweis: Da das Verteilungsgesetz X stetig ist, sind die Zufallsvariablen X1 , X2 , …, Xn (fast) sicher voneinander
verschieden. Für (fast) jedes w œ W entsprechen ihre Ränge
Rg@X , X1 D@wD, Rg@X , X2 D@wD, …, Rg@X , Xn D@wD
damit einer Permutation ohne Wiederholung der Zahlen 1, 2, …, n, wobei jede dieser Permutationen offenbar mit
der gleichen Wahrscheinlichkeit auftreten kann. Für alle i œ 81, 2, …, n< ist die Zufallsvariable Rg@X , Xi D damit auf
der Menge 81, 2, …, n< gleichverteilt. Die oben angeführten Formeln für den Erwartungswert und die Varianz von
Rg@X , Xi D erhält man damit leicht unter Verwendung von Mathematica
04_Stichproben_und_Statistiken.nb
Mean@DiscreteUniformDistribution@81, n<DD
Variance@DiscreteUniformDistribution@81, n<DD
1+n
2
1
I−1 + n2 M
12
4.2.13 Bemerkung: Die gemeinsame Verteilung der Ränge Rg@X , X1 D, Rg@X , X2 D, …, Rg@X , Xn D und somit
auch die Verteilung jeder beliebigen Funktion dieser Ränge hängt vom stetigen Verteilungsgesetz X , nach
dem die mathematische Stichprobe X = 8X1 , X2 , …, Xn < ausgewählt wurde, nicht ab. Diese Tatsache nützt
man bei den sogenannten verteilungsfreien Verfahren.
9
Herunterladen