Mathcad - Masszahl.mcd

Werbung
Statistische Maßzahlen
1
Statistische Maßzahlen
Stochastik
Die Stochastik lässt sich unterteilen in induktive Statistik und deduktive Wahrscheinlichkeitsrechnung.
In der induktiven Statistik werden aus den durch Beobachtungen, Messungen, Prüfungen usw. gewonnenen
Daten, die bezifferbare Eigenschaften eines Kolektivs beschreiben, Maßzahlen erarbeitet, die Rückschlüsse auf
das untersuchte Kollektiv zulassen. In der Literatur wird der Begriff Kollektiv sowohl für Objekte und Vorgänge der
statistischen Untersuchung als auch für Ergebnisse der Untersuchung benutzt.
In der deduktiven Wahrscheinlichkeitsrechnung werden aus den ermittelten Parametern Erkenntnisse gewonnen,
die auf das zu Grunde liegende mathematische Modell schließen lassen.
Die Maßzahlen können sowohl aus den Rohdaten in der induktiven Berechnungsphase als auch aus den
mathematischen Modellen in der deduktiven Phase ermittelt und somit auch verglichen werden. Die Ergebnisse
sind von gleicher Qualität, wenn auch die Berechnungsformeln unterschiedlich sind.
Arithmetisches Mittelwert
xMit =
1 n
∑xi = µ
n i =1
xi statistischer Beobachtungswert, Zufallsvariable,
i Summationsvariable,
n Anzahl der Beobachtungswerte
m
xMit =
xi Klassenmitten, statistischer Beobachtungswert,
∑ xi Hi
i =1
m
=µ
∑ Hi
i =1
m Anzahl der Klassen,
i Summationsvariable
Hi Häufigkeit der Beobachtungswerte in den einzelnen Klassen,
n Anzahl der Beobachtungswerte,
m
n = ∑ xi Hi
i =1
Harmonisches Mittelwert
hMit =
n
n
1
i =1
i
∑x
xi statistischer Beobachtungswert, Zufallsvariable,
i Summationsvariable,
n Anzahl der Beobachtungswerte
m
hMit =
∑ Hi
i =1
m
1
∑x
i =1
Hi
xi Klassenmitten, statistischer Beobachtungswert,
Hi Häufigkeit der Beobachtungswerte in den einzelnen Klassen,
i
m Anzahl der Klassen,
m
n Anzahl der Beobachtungswerte,
Varianz
i Summationsvariable,
n = ∑ xi Hi
i =1
Neben dem Mittelwert (Lagemaß) ist auch die Streuung (Streumaß) der stochastischen Daten eine
aufschlussreiche Kenngröße, die eine Beurteilung der durch Wahrscheinlichkeit geprägten Gegebenheiten
ermöglicht. Für die Streuung ist der Abstand der Zufallsvariablen vom Mittelwert ausschlaggebend. Die Summe der
Abstände der Daten vom Mittelwert ist aber stets Null. Als Kennwert der Streuung nimmt man also nicht die
Summe der Abweichungen vom Mittelwert sonder die Summe der quadrierten Abweichungen. Um zu verhindern,
dass durch das Quadrieren große Abweichungen stärker gewichtet werden als kleine, wird die Summe der
quadrierten Abweichungen noch durch die Summe der Daten geteilt.
In der Literatur ist es üblich, die Varianz mit σ2 zu bezeichnen. Das Rechenprogramm MathCad lässt es aber
normalerweise nicht zu, dass der Name einer Variablen oder eines Parameters auf der linken Seite des
Gleichheitszeichens mit einem Rechenoperator verknüpft wird. Die Rechenoperationen werden üblicherweise nur
auf der rechten Seite des Gleichheitszeichens angegeben. Um das Bezeichnungsproblem zu lösen, wird in dieser
Abhandlung als Symbol für die Varianz der kleine griechische Buchstabe τ benutzt.
Zur Kennzeichnung und Unterscheidung von Variablen können nur tiefgestellte Literalindizes verwendet werden.
Auch die in MathCad anwendbare chemische Notation sowie die besondere Eingabe von Operatoren in Namen
ergibt kein praktikables Ergebnis.
19.5.2004
Masszahl.mcd
Statistische Maßzahlen
τ=
1 n
∑ ( xi − µ )2 = σ 2
n − 1 i =1
m
τ=
∑ Hi ( xi
− µ )2
=σ
i =1
m
∑ Hi − 1
2
xi statistischer Beobachtungswert, Zufallsvariable,
n Anzahl der Beobachtungswerte,
xMit arithmetischer Mittelwert,
i Summationsvariable
xi Klassenmitten, statistischer Beobachtungswert,
m Anzahl der Klassen,
2
Hi Häufigkeit der Beobachtungswerte in den einzelnen Klassen,
i =1
i Summationsvariable,
xMit arithmetischer Mittelwert
Standardabweichung oder Streuung
xi statistischer Beobachtungswert, Zufallsvariable,
1 n
∑ (xi − µ )2
n − 1 i =1
σ =
m
Hi ( xi
∑
i =1
σ =
n Anzahl der Beobachtungswerte,
xMit arithmetischer Mittelwert,
i Summationsvariable,
xi Klassenmitten, statistischer Beobachtungswert,
− µ )2
m Anzahl der Klassen,
m
Hi Häufigkeit der Beobachtungswerte in den einzelnen Klassen,
i =1
i Summationsvariable,
xMit arithmetischer Mittelwert
σ Standardabweichung,
xMit arithmetischer Mittelwert
∑ Hi − 1
Variationskoeffizient
v=
σ
µ
Zentralwert (Median)
Durch den Zentralwert werden die nach Größe oder Rang geordneten unbehandelten Rohdaten einer Urliste
bezüglich der Eigenschaften eines Kollektivs halbiert. Der Zentral- oder Medianwert hat weder mehr als die Hälfte
der ermittelten und rechnerisch nicht veränderten Rohdaten vor sich noch mehr als die Hälfte hinter sich.
Sind die Urdaten (Häufigkeit der Beobachtungen von bestimmten Eigenschaften des Kollektivs) in Klassen oder
Gruppen zusammengefasst, errechnet sich der Zentralwert in folgender Weise.
m
∑ Hi
i =1
xMed = xu +
2
−
Hi Häufigkeit der Beobachtungswerte in den einzelnen Klassen,
mMed −1
∑
i =1
Hi
HMed
⋅d
d Klassenbreite,
xu untere Grenze der Klasse des Zentralwertes,
mMed Klasse des Zentralwertes, x Klassenmitten,
i = 1 . . .m Summationsvariable,
Schiefe
γ =
γ =
1
σ3
1
σ
3
ε=
1
σ
4
1
σ4
HMed Häufigkeit der Median-Klasse
Maß für die Asymmetrie
σ Standardabweichung,
n
⋅ ∑ ( xi − µ )3
xi statistischer Beobachtungswert, Zufallsvariable,
µ Mittelwert
i =1
m
⋅ ∑ H i ( x i − µ )3
i =1
Exzess
ε=
m Anzahl der Klassen,
σ Standardabweichung,
xi statistischer Beobachtungswert, Zufallsvariable,
µ Mittelwert,
Hi Häufigkeit der Beobachtungswerte
Maß für Gratbildung
n
⋅ ∑ ( xi − µ ) − c
4
i =1
m
µ Mittelwert,
⋅ ∑ H i ( xi − µ ) − c
i =1
σ Standardabweichung,
4
σ Standardabweichung,
µ Mittelwert,
xi statistischer Beobachtungswert, Zufallsvariable,
c Konstante,
c=3
xi statistischer Beobachtungswert, Zufallsvariable,
c Konstante,
c=3
Hi Häufigkeit der Beobachtungswerte
19.5.2004
Masszahl.mcd
Statistische Maßzahlen
3
Maßzahlen von Verteilungen
Arithmetischer Mittelwert einer diskreten Verteilung
n
f(k i ) Wahrscheinlichkeitsdichte,
µ = ∑ k i f ( ki )
i =1
k i . . . k n Zufallsvariable,
i = 1 . . . n Summationsvariable, Beobachtungsbereich
Arithmetischer Mittelwert einer stetigen Verteilung
+∞
∫
µ=
x ⋅f (x )dx
f(x) Wahrscheinlichkeitsdichte,
x Zufallsvariable,
x =−∞
Zentralwert (Median) einer stetigen Verteilung
Der Zentralwert einer stetigen Verteilung ist der Wert der Zufallsvariablen, für den die kumulative
Wahrscheinlichkeitsverteilung gerade 50% beträgt.
Varianz einer diskreten Verteilung
kn
τ = ∑ (ki − µ )2 f (ki ) = σ 2
i =1
f(k i ) Wahrscheinlichkeitsdichte,
k i . . . k n Zufallsvariable,
i = 1 . . . n Summationsvariable, Beobachtungsbereich,
µ arithmetischer Mittelwert
Standardabweichung einer diskreten Verteilung
kn
∑ ( k i − µ ) 2 f (ki )
σ =
i =1
f(k i ) Wahrscheinlichkeitsdichte,
k i . . . k n Zufallsvariable,
i = 1 . . . n Summationsvariable, Beobachtungsbereich,
µ arithmetischer Mittelwert
Varianz einer stetigen Verteilung
+∞
∫
τ=
f(x) Wahrscheinlichkeitsdichte,
( x − µ )2f ( x )dx = σ 2
x Zufallsvariable,
µ arithmetischer Mittelwert
x =−∞
Standardabweichung einer stetigen Verteilung
+∞
∫ (x − µ ) f ( x ) dx
x =−∞
σ =
2
f(x) Wahrscheinlichkeitsdichte,
x Zufallsvariable,
µ arithmetischer Mittelwert
Schiefe einer stetigen Verteilung
γ =
1
σ3
xmax
⋅
∫
σ Standardabweichung
( x − µ )3 f( x) dx
x = xmin
x Zufallsvariable
µ Mittelwert
Exzess einer stetigen Verteilung
x
ε=
max
1
⋅
∫ ( x − µ )4 f( x) dx − c
σ 4 x = xmin
Maßzahlberechnungen
Die Berechnung der Maßzahlen dient insbesondere dazu, das mathematische Modell zu erkennen, nach dem der
zu untersuchende stochastische Prozess abläuft.
Stochastisches Experiment
Bei einem Zufallsexperiment sind die folgenden Daten (Klassenmitte und Häufigkeit) ermittelt worden. Es sollen der
Mittelwert, der Zentralwert, die Varianz und die Standardabweichung berechnet werden.
Rechenbeispiel
ORIGIN = 0
Variable und Parameter
m := 8
19.5.2004
Anzahl der Klassen,
d := 1
Klassenbreite,
x Klassenmitte (Zufallsvariable)
Masszahl.mcd
Statistische Maßzahlen
Klassengrenzen
Klassenmitte
 9 
 10 
 11 
 
 12 
 
xk := 13
 
 14 
 15 
 
 16 
 17 
 
4
Häufigkeit
 9.5 


 10.5 
 11.5 


12.5 

x :=
 13.5 


 14.5 
 15.5 


 16.5 
Gewicht der Klassen
1 
 
 12 
 20 
 
 30 
H :=
 40 
 
 50 
 20 
 
4 
Summe der
Häufigkeiten
 9.5 


 126 
 230 


375 

A=
 540 


 725 
 310 


 66 

→
A := ( x ⋅ H)
3
x ⋅ H = 2.381 × 10
Auswertung
Gesamtzahl der
Beobachtungen
(Ereignisse)
m −1
∑
Hi = 177
i = 0
Gewicht aller Klassen
untere Grenze
der Median-Klasse
Median-Klasse
mMed := 6
maximale Häufigkeit
xu := 14
m −1
Median-Häufigkeit
max ( H) = 50
∑
HMed := 50
3
Ai = 2.381 × 10
i = 0
Zentralwert
 m −1 

Hi 

 ( m Med −1) −1
i = 0  −
Hi
∑
∑
2
i = 0
xMed := xu +
∑
xi ⋅ Hi
τ :=
m −1
∑
⟨ 1⟩  13.71 
B
=

 13.71 
(
Hi ⋅ xi − µ
∑
σ :=
τ
m −1
ε :=
σ
4
σ = 1.503
10
15
⟨ 1⟩
x, B
20
∑
(
)3
(
)3 − c
Hi xi − µ
γ = −60.659
Rechtsseitige, negative Schiefe
[13] S.50
i = 0
c := 0
Exzess
1
5
Häufigkeitsverteilung mit Median-Klasse
Schiefe
σ
20
Hi
i = 0
Standardabweichung
⋅
40
⟨ 0⟩
B
m −1
τ = 2.258
3
Median-Klasse
H
µ = 13.455
γ :=
)2
i = 0
Hi
i = 0
1
⟨ 0⟩  0 
B
=

 50 
60
m −1
i = 0
xMed = 13.710
xMed 
 0

B :=
 HMed xMed 


Varianz
m −1
µ :=
⋅d
HMed
Arithmetischer Mittelwert
∑
Grenzen der
Median-Klasse
m −1
⋅
19.5.2004
∑
Hi ⋅ xi − µ
ε = −40.369
Unscharfer, negativer Exzess
i = 0
Masszahl.mcd
Statistische Maßzahlen
5
Würfelexperiment
ORIGIN = 0
Rechenbeispiel
1 
 
2 
3 
x :=  
4 
5 
 
6 
Variable und Parameter
n := 6
Anzahl der Beobachtungswerte,
x Zufallsvariable (Augenzahl)
Auswertung
Mittelwert
µ :=
1
n
n−1
⋅
∑
xi
0 µ 

n µ 
A := 
µ = 3.5
i = 0
6
Mittelwert
Standardabweichung
n−1
∑
σ :=
⟨ 0⟩
A
(xi − µ)2
4
⟨ 0⟩
x
i = 0
2
σ = 1.871
n−1
0
0
2
4
⟨ 1⟩
A ,x
6
Augenzahl und Mittelwert
Zusammenfassung zweier Stichproben bezüglich Varianz und Mittelwert
Rechenbeispiel
[11] S. 62
Parameter und Variable
Stichprobe A
Stichprobenumfang
nA := 100
Mittelwert
µ A := 20
Standardabweichung
σA := 2.1
nB := 200
Mittelwert
µ B := 25
Standardabweichung
σB := 3.4
Stichprobe B
Stichprobenumfang
Die beiden Stichproben werden zu einer Stichprobe C zusammengefasst mit einem Umfang von nC = nA + nB.
Auswertung
Für die Berechnung der Varianz und des Mittelwertes der zusammengefassten Stichprobe C ist es sinnvoll, von
folgenden Gleichungen auszugehen.
1 A
⋅ ∑ x Ai
n A i =1
µB =
1 B
⋅ ∑ xBi
nB i =1
nA
xAi
∑
i =1
nB
xBi
∑
i =1
τA =
 nA 2

1
⋅  ∑ x Ai
− nA ⋅ µA2 


n A − 1  i =1

τB =

1  nB 2
⋅  ∑ xBi − nB ⋅ µB2 

nB − 1  i =1

n
µA =
n
3
= nA ⋅ µ A = 2 × 10
3
= nB ⋅ µ B = 5 × 10
3
nA ⋅ µ A + nB ⋅ µ B = 7 × 10
19.5.2004
Masszahl.mcd
Statistische Maßzahlen
nA
2
xAi
∑
i =1
=
nB
(nA − 1) ⋅ (σA)2 + nA ⋅ (µA)2 = 4.044 × 104
2
xBi
∑
i =1
=
6
(nB − 1) ⋅ (σB)2 + nB ⋅ (µB)2 = 1.273 × 105
(nA − 1) ⋅ (σA)2 + nA ⋅ (µA)2 +  (nB − 1) ⋅ (σB)2 + nB ⋅ (µB)2 = 1.677 × 105
Mittelwert der zusammengefassten Stichproben
(nA ⋅ µA + nB ⋅ µB)
µ C :=
µ C = 23.333
nA + nB
70
3
= 23.333
Varianz der zusammengefassten Stichproben
τC :=
1
nA + nB − 1
(
)
⋅  nA − 1 ⋅ σA + nA ⋅ µ A +

2
2
( n − 1) ⋅ ( σ ) 2 + n ⋅ µ 2 − ( n + n ) ⋅ µ 2
B
B B 
A
B C 
 B
τC = 14.728
Standardabweichung
σC :=
τC
σC = 3.838
Zentraler Grenzwertsatz
Normierte und zentrierte Summen
[2] S.677
[8] S.186
[11] S.100
[13] S.70
n
∑ ( xi − µi )
Un =
i =1
Un =
n
∑τi
i =1
n
n
∑ ( xi − µi )
i =1
ORIGIN = 0
Alternativ-Formel für die Berechnung der Varianz
[8] S.36
In der Literatur ist es üblich, die Varianz mit σ 2 zu bezeichnen. Das Rechenprogramm MathCad lässt es
normalerweise nicht zu, dass der Name einer Variablen oder eines Parameters auf der linken Seite des
Gleichheitszeichens mit einem Rechenoperator verknüpft wird. Die Rechenoperationen werden üblicherweise nur
auf der rechten Seite des Gleichheitszeichens angegeben. Um das Bezeichnungsproblem zu lösen, wird in dieser
Abhandlung als Symbol für die Varianz der kleine griechische Buchstabe τ benutzt.
Zur Kennzeichnung und Unterscheidung von Variablen können nur tiefgestellte Literalindizes verwendet werden.
Auch die in MathCad anwendbare chemische Notation sowie die besondere Eingabe von Operatoren in Namen
ergibt kein praktikables Ergebnis.
Für die Berechnung der Varianz mit Hilfe von Einfachdaten wird im Folgenden eine weitere Formel abgeleitet.
Für die Verwendung der Formeln im Rechenprogramm MathCad muss die Einstellung des Startindexes
beachtet werden. Bei ORIGIN = 0 bekommt das erste Element des verwendeten Feldes den Index 0!

1  n
τ =
⋅  ∑ ( xi − µ )2 
n − 1  i =1

(
n
1
τ =
⋅ ∑ xi2 − 2 xi µ − µ 2
n − 1 i =1
Mittelwert
)
2
2
 
1  n 2 2  n 
1  n

τ =
⋅ ∑ xi − ⋅  ∑ xi  + ⋅  ∑ xi  
n − 1  i =1
n  i =1 
n  i =1  


19.5.2004
µ=
1 n
⋅ ∑ xi
n i =1
τ =
n Anzahl der Daten
xi Zufallsvariable
2
n 
1 n
 
1
1 n
⋅ ∑  xi2 − 2 xi ⋅ ⋅ ∑ xi +  ⋅ ∑ xi  
n − 1 i =1 
n i =1
 n i =1  

2
 
1  n 2 1  n

τ =
⋅ ∑ xi − ⋅  ∑ xi  
n − 1  i =1
n  i =1  


τ =

1  n 2
⋅  ∑ xi − n µ 2 
n − 1  i =1

Masszahl.mcd
Statistische Maßzahlen
7
Für die Berechnung der Varianz mit Hilfe von Mehrfachdaten (gruppierte Werte) ergibt sich durch die folgende
Ableitung ebenfalls eine weitere Formel.
m

1 m
τ =
⋅  ∑ Hi ⋅ ( xi − µ )2 
n − 1  i =1

Anzahl der Daten
n = ∑ Hi
µ=
Mittelwert
i =1
H Häufigkeit,
(
m
1
τ =
⋅ ∑ H i ⋅ xi2 − 2 xi µ + µ 2
n − 1 i =1
)
τ =
h relative Häufigkeit,
xi
1 m
⋅ ∑ xi ⋅ Hi
n i =1
Zufallsvariable, m
Klassenzahl
2
m

1 m
 
1
1 m
⋅ ∑ Hi ⋅  xi2 − 2 xi ⋅ ⋅ ∑ xi ⋅ Hi +  ⋅ ∑ xi ⋅ Hi  

n − 1 i =1
n i =1
 n i =1
 

2
2
m

1 m
 
1 m
2  m
2

τ =
⋅ ∑ Hi xi − ⋅  ∑ HI xi  + ∑ H i ⋅  ⋅ ∑ xi ⋅ Hi  
n − 1  i =1
n  i =1

i =1
 n i =1
 

2
2

 
1 m
2 m
1 m
2

τ =
⋅ ∑ Hi xi − ⋅  ∑ HI xi  + ⋅  ∑ Hi xi  
n − 1  i =1
n  i =1
 n  i =1
 

τ =

1 m
⋅  ∑ Hi xi2 − µ 2n 
n − 1  i =1

τ =
τ =
2
 
1 m
1 m
⋅  ∑ Hi x2i − ⋅  ∑ HI x i  
n − 1  i =1
n  i =1
 


n m
⋅  ∑ hi x 2i − µ 2 
n − 1  i =1

Tschebyscheffsche Ungleichung
Die Tschebyscheffsche Ungleichung liefert eine Aussage über die Wahrscheinlichkeit, dass die Zufallsvariable xi
einen Wert annimmt, der vom Mittelwert µ mindestens einen bestimmten, durch die Standardabweichung σ
ausdrückbaren Wert, von beispielsweise c = k σ aufweist.
Zur Ableitung der Tschebyscheffschen Ungleichung geht man von der Varianz τ aus. Die Tschebyscheffsche
Wahrscheinlichkeit QTsch gehört zu den Zufallvariablen, die außerhalb des Bereichs µ−c . . . µ+c liegen und steht
in Beziehung zur Anzahl nTsch der Variablen in diesem Gebiet, wenn man von einem diskreten Statistikproblem
ausgeht. Für die Tschebyscheffsche Ungleichung ergibt sich dann der folgende Ausdruck.
τ =

1 m
⋅  ∑ ( xi − µ )2 
n − 1  i =1

>>>
τ =
1
⋅c2
nTsch − 1
QTsch =
τ
c
2
QTsch =
τ
k σ
2
2
τ =σ 2
QTsch ≤
1
k2
Normalverteilung
Rechenbeispiel
Parameter und Variable
µ := 8
Mittelwert
x := −10 , −9 .. 20
[12] S.198
σ := 2
Streuung
[1] S.1076
[8] S.36 S.139,
Zufallsvariable, Zufallsgröße oder stochastische Variable
Auswertung
− ( x− µ )
2
2
fnorm ( x) :=
e
2⋅ σ
2π ⋅ σ
Mittelwert
⌠
µ := 
⌡
∞
−∞
19.5.2004
x ⋅ fnorm ( x) dx
µ=8
⌠

⌡
∞
fnorm ( x) dx = 1
A ( x) := x ⋅ fnorm ( x)
Rechengröße
−∞
Masszahl.mcd
Statistische Maßzahlen
8
0.2
fnorm ( x)
2
0.1
10
A( x)
0
10
1
20
10
0
x
Standardabweichung
2
σ :=
⌠

⌡
∞
Rechengröße A(x)
2
( x − µ ) ⋅ fnorm ( x) dx
σ=2
−∞
Varianz
τ = σ2
⌠
τ := 
⌡
ORIGIN = 0
∞
20
x
Wahrscheinlichkeitsdichte der Normalverteilung
B ( x) := ( x − µ ) ⋅ fnorm ( x)
10
2
( x − µ ) ⋅ fnorm ( x) dx
τ=4
⌠

⌡
B( x)
1 µ − σ 

0 µ − σ 
µ−σ=6
1 µ + σ 

0 µ + σ 
µ + σ = 10
C := 
D := 
−∞
1
Grenzen des Streubereichs
∞
B ( x) dx = 4
Das Integral entspricht der Varianz.
−∞
⟨ 0⟩
C
0.5
⟨ 0⟩
D
10
0
10
⟨ 1⟩ ⟨ 1⟩
x, C , D
Rechengröße B(x)
20
Grenzen des Streubereichs
Tschebyscheffsche Wahrscheinlichkeit
k := 0.1
⌠
Q := 
⌡
µ + kσ
⌠
Q := 
⌡
µ + kσ
⌠
Q := 
⌡
µ + kσ
fnorm ( x) dx
Q = 0.08
1 − Q = 0.92
QTsch :=
µ − kσ
k := 0.5
k
fnorm ( x) dx
Q = 0.383
1 − Q = 0.617
QTsch :=
µ − kσ
k := 1
µ − kσ
19.5.2004
1
1
k
fnorm ( x) dx
Q = 0.683
1 − Q = 0.317
QTsch :=
2
2
1
k
2
QTsch = 100
QTsch = 4
QTsch = 1
Masszahl.mcd
Statistische Maßzahlen
k := 1.5
⌠
Q := 
⌡
µ + kσ
⌠
Q := 
⌡
µ + kσ
⌠
Q := 
⌡
µ + kσ
⌠
Q := 
⌡
µ + kσ
fnorm ( x) dx
Q = 0.866
9
1 − Q = 0.134
µ − kσ
k := 2
k
fnorm ( x) dx
Q = 0.954
1 − Q = 0.046
k
fnorm ( x) dx
Q = 0.988
1 − Q = 0.012
k := 3
k
fnorm ( x) dx
Q = 0.997
−3
1 − Q = 2.7 × 10
µ − kσ
2
1
QTsch :=
µ − kσ
2
1
QTsch :=
µ − kσ
k := 2.5
1
QTsch :=
2
1
QTsch :=
k
2
QTsch = 0.444
QTsch = 0.25
QTsch = 0.16
QTsch = 0.111
Q ist die Wahrscheinlichkeit, dass die Zufallsvariable x im Bereich µ −k σ . . . µ + k σ liegt und 1−Q ist die
Wahrscheinlichkeit, dass die Zufallsvariable außerhalb liegt. Wie die Werte 1−Q (Normalverteilung) und QTsch
(Tschebyscheffsche Ungleichung) zeigen, liefert die Tschebyscheffsche Ungleichung nur grob angenäherte Werte.
Varianzberechnung
Rechenbeispiel
Variable und Parameter
H
absolute Häufigkeit der Ereignisse
(Matrix)
xi
Zufallsvariable
(Matrix)
m := 16
Anzahl der Klassen mit den gehäuften
Zufallsvariablen
Auswertung
n
Mittelwert
m −1
Anzahl der Stichproben
∑
m −1
n :=
∑
Hi
n = 74
ORIGIN = 0
µ :=
i = 0
µ = 8.743
m −1
∑
i = 0
xi Hi
Hi
i = 0
3 
 
3 
3 
 
4 
5 
 
5 
5 
 
5 
H :=
6 
 
7 
7 
 
7 
5 
 
4 
3 
 
2 
1 
 
2 
3 
 
4 
5 
 
6 
7 
 
8 
x :=
9 
 
 10 
 11 
 
 12 
 13 
 
 14 
 15 
 
 16 
Varianz
τ :=
 m −1

2
⋅
Hi ⋅ ( xi − µ ) 

 

Hi − 1   i = 0


1
 m −1


i = 0
∑
∑
τ = 16.111
ORIGIN = 0
Standardabweichung
σ :=
τ
19.5.2004
σ = 4.014
Masszahl.mcd
Statistische Maßzahlen
10
Häufigkeit
relative Häufigkeit
8
h :=
∑
6
0
0
0.041
1
0.041
2
0.041
3
0.054
4
0.068
5
0.068
6
0.068
h= 7
0.068
8
0.081
Hi
i = 0
H
4
2
H
m −1
m −1
∑
0
5
10
15
hi = 1
i = 0
20
x
absolute Häufigkeit
Varianz (Alternativ-Formel)
τ :=
m −1
⋅
1
∑
 m −1
 

Hi − 1  i =


i = 0

∑
[8] S.36
m −1
( )2 − µ2 ⋅ ∑
Hi ⋅ xi
0
m −1

2
2
τ :=
⋅
Hi ⋅ ( xi) − µ ⋅ n
( n − 1) 

i = 0

1
∑
i = 0
[9] S.19
ORIGIN = 0

Hi


Beide Formeln führen zu
demselben Ergebnis.
9
0.095
10
0.095
11
0.095
12
0.068
13
0.054
14
0.041
15
0.027
0.1
τ = 16.111
h
0.05
Standardabweichung
σ :=
τ
σ = 4.014
0
5
10
15
20
x
relative Häufigkeit
19.5.2004
Masszahl.mcd
Herunterladen