Experimentieren und Evaluieren

Werbung
Experimentieren und Evaluieren
Oliviero Chiodo
Hochschule für Technik Rapperswil
Frühlingssemster 2015
Inhaltsverzeichnis
1 Theorie
1.1 Statistische Grundbegrie . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Merkmalsträger und Grundgesamtheit . . . . . . . . . . . . .
1.1.2 Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Bedeutung der Messkalen . . . . . . . . . . . . . . . . . . . .
1.2 Häugkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Theoretische Verteilungen . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Binominal-Verteilung . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Poisonverteilung . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.3 Rechteckverteilung . . . . . . . . . . . . . . . . . . . . . . . .
1.4.4 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . .
1.4.5 Weibull-Verteilung . . . . . . . . . . . . . . . . . . . . . . . .
1.4.6 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.7 Simulation und Zufallsvariable . . . . . . . . . . . . . . . . .
1.5 Grundlagen der schliessenden Statistik . . . . . . . . . . . . . . . . .
1.5.1 Stichprobenerhebung . . . . . . . . . . . . . . . . . . . . . . .
1.6 Chi-Quadrat Verteilung . . . . . . . . . . . . . . . . . . . . . . . . .
1.7 Dichte der t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8 Kondenzintervalle für den Wert µ der Normalverteilung . . . . . . .
1.9 Schätzfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.9.1 Problembeschreibung . . . . . . . . . . . . . . . . . . . . . . .
1.9.2 Gütekriterien für Schätzunktionen . . . . . . . . . . . . . . .
1.9.3 Varianzen für die Schätzfunktion . . . . . . . . . . . . . . . .
1.9.4 Erstellen des Kondenzintervalls . . . . . . . . . . . . . . . .
1.9.5 Berechnung Stichrpobenumfangs grosser Grundgesamtheiten
1.9.6 Kondenzinterfall für die Varianz . . . . . . . . . . . . . . . .
1.10 Testverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.1 Fehler erster Art . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.2 Fehler zweiter Art . . . . . . . . . . . . . . . . . . . . . . . .
1.10.3 Fallunterscheidungen . . . . . . . . . . . . . . . . . . . . . . .
1.10.4 Parametertest . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.5 Anteilswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.6 Dierenztests . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.7 Verteilungstests . . . . . . . . . . . . . . . . . . . . . . . . . .
1.10.8 Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . .
1.11 Zusammenhang zwischen zwei Merkmalen . . . . . . . . . . . . . . .
1.11.1 Regressionsanalyse . . . . . . . . . . . . . . . . . . . . . . . .
1.11.2 Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
3
4
4
4
5
6
7
7
7
8
8
8
8
9
9
10
10
11
11
12
12
12
13
14
15
15
16
16
17
17
17
18
18
19
19
20
20
21
21
1.11.3 Bravais Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.11.4 Interpretation des Korrelationskoezienten von Bravais Pearson . . . . . .
1.11.5 Zeitreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Beispiele
2.1 Mittelwerte und Spannweite . . . . . . . .
2.2 Grundlagen der schliessenden Statistik . .
2.3 Schätzverfahren . . . . . . . . . . . . . . .
2.4 Testverfahren . . . . . . . . . . . . . . . .
2.4.1 Parametertest . . . . . . . . . . . .
2.5 Unabhängigkeitstest . . . . . . . . . . . .
2.6 Zusammenhang zwischen zwei Merkmalen
2.6.1 Regressionsanalyse . . . . . . . . .
2.6.2 Lineare Regression . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
22
23
24
24
25
26
27
27
27
28
28
29
1
Theorie
1.1 Statistische Grundbegrie
1.1.1
Merkmalsträger und Grundgesamtheit
• Merkmalsträger
Der Merkmalsträger ist der Gegenstand der statistischen Untersuchung, er ist der Träger der
interessierenden statistischen Information.
• Grundgesamtheit
Die Grundgesamtheit ist die Menger aller Merkmalsträger. Die übereinstimmende Abgrenzungsmerkmale besitzen. Abgrenzungsmerkmale sind räumlich, sachlich und zeitlich vorzunehmen.
• Merkmal
Die Eigenschaft des Merkmalsträger, die bei der statistischen Untersuchung von Interesse ist.
• Merkmalswert
Der Wert, der bei der Beobachtung, der Befragung, der Messung oder Zählvorgang festgestellt
wurde.
1.1.2
Skalen
Skalen
Die statistische Messskala, kurz Skala, ist dabei das Instrument, mit dem die Merkmalswerte ermittelt werden. SKala sind die möglichen Merkmalswerte nach einem bestimmten
Ordnungsprinzip als Skalenwerte abtragen.
• Nominalskala
Aus der Nominalskala sind die Skalenwerte Namen abgetragen die gleichberechtigt bzw.
gleichbedeutend nebeneinander angeordnet sind. Sie sind stets qualitiative Merkmale
Merkmal
Familienstand
Geschlecht
Rebsorte
Merkmalswert
verheiratet, ledig, geschieden, verwitwert
Feminin/Maskulin
Riesling, Silvaner
• Ordinalskala
Auf der Ordnialskala (Rangskala) sind als Skalenwerte Klassenbeziehungen abgetragen.
Die Skalenwerte stehen jetzt nicht mehr gleichberechtigt bzw. gleichwertig nebeneinander.
Sondern sind entsprechende ihrer Klasse in auf- oder absteigender Folge (Rangfolge, Rangordnung) auf der Skala angeordnet. Ordinalskalierte Merkmale sind stets intensitätsmässig
abgestufte Merkmale und umgekehrt
Merkmal
Schulnote
Qualitätstufe
Merkmalswert
Sehr gut, gut, befriedigend, ausreichend, mangelhaft
Standard, Business, First Class
• Metrische Skala
Auf er metrischen Skala (Kardinalskala) sind die Skalenwerte als reele Zahlen abgetragen,
entsprechende ihrem Zahlenwert in auf- oder absteigender Folge auf der Skala angeordnet. Sie
entspricht unserer Vorstellung von einem Experiment, wo als Ergebniss dem Merkmal eines
Merkmalsträger als Merkmalwert ein eine reele Zahl zugewiesen wird. Metrische Merkmale
sind stets quantitative Merkmale und umgekhert. Diese Skala wird abhängig vom Nullpunkt
in Intervallskala und Verhältnisskala unterschieden.
3
• Intervallskala
Auf der Intervallskala ist der Skalenwert Null ein mehr oder weniger willkürlich gewählter Nullpunkt. Das heisst, zwischen zwei Merkmalswerten kann der einfache Abstand
(Intervall) gemessen werden. Es kann jedoch nicht der verhältnissmässige (relative) Abstand
(Verhältniss, Quotient) gemessen werden.
Merkmal
Temperatur
Uhrzeit
Merkmalswert
−12, . . . , 0, . . . , 42
20:00, 0:00, 10:00
• Verhältnisskala
Auf der Verhältnisskala entspricht der Skalenwert Null dem natürlichen, absoluten Nullpunkt. Negative Werte sind damit nicht möglich. Das hat zur Folge, dass zwischen zwei
Merkmalswerten neben dem einfachen Abstand (Intervall) auch der verhältnismässige Abstand (Quotient, Verhältnis) gemessen werden kann. Das heisst ein Merkmalswert kann jetzt
als das Vielfache eines anderen Merkmalwertes ausgedrückt werden
Merkmal
Gewicht(kg)
Alter(Jahre)
1.1.3
Merkmalswert
0,...10,...20,...40
0, 1,..40,...89,...
Bedeutung der Messkalen
Bedeutung der Messskalen
Die Verhältnisskala besitzt das höchste Informationsniveau. Es lassen sich die Verschiedenartgkeit die einfachen und die verhältnissmässigen Abstände für Merkmalswerte feststellen.
1.2 Häugkeitsverteilung
Hinweis zur Notation: xum bedeutet, das (kleine) x aus der Klasse m, das u steht für die Untere
Grenze einer Klasse.
1.2.1
Mittelwerte
• Dichte: Die Dichte sagt aus, wie viel der Grundgesamtheit innerhalb der gewählten Klasse
sind
dj =
xoj
hj
− xuj
(1)
• Modus: Der Modus ist derjenige Merkmalswert, der am häugsten beobachtet wird
Mo = xum +
hm − hm−1
· (xom − xum )
(hm − hm−1 ) + (hm − hm+1 )
(2)
• Modus bei unterschiedlichen Klassengrössen
M = xum +
dm − dm−1
(dm − dm−1 ) + (dm − dm+1 )
(3)
• Quantile: Ein Quartil ist ein Merkmals wert durch den die Gesamtheit in zwei Teile zerlegt
Ansatt 12 n wird 34 n genommen:
Me = xum +
n
2
− Hm−1
· (xom − xum )
(Hm − Hm−1 )
(4)
Die Formel des Medians ist diesselbe Formel wie die fürs zweite Quantil(hier beschrieben)
4
• Arithmetisches Mittel: Das arithmetische Mittel ist der Wert, der sich bei gleichmässiger
Verteilung der Summe aller beobachteten Merkmalswerte auf alle Merkmalsträger ergibt.
Nicht klassizierte berechnung:
v
1X
xi · hi
n i=1
x =
v
X
x =
(5)
(6)
xi · fi
i=1
(7)
• Harmonisches Mittel: Das harmonische Mittel ist derjenige Wert, zu dem die in der Häug-
keitsverteilung vor ihm liegende Merkmals werte in der Summe gesehen relativ gleich weit
entfernt sind wie die nach ihm liegenden Merkmals werte
Pv
hi
M H = Pvi=1 hi
(8)
i=1 xi
• Geometrisches Mittel: Das geometrische Mittel ist die n-te Wurzel aus dem Produkt aller
beobachteten Merkmals werte.
v
s
u n
uY
endwert
n
M G = t xi = n
anfangswert
i=1
r
−→
3
57
= 1.125
40
(9)
• Binominalkoezient: Dieser wird verwendet, wenn man mögliche Kombinationen berechnen
möchte.
n
n!
18
18 · 17 · 16
=
⇒
(10)
=
k
k!(n − k)!
3
3!
Weitere Informationen gibt es im Unterabschnitt 2.1
1.2.2
Spannweite
• Spannweite: Die Spannweite R ist die Dierenz aus dem grössten und dem kleinsten beob-
achteten Merkmalswert.
R
=
grösster Merkmalswert − kleinster Merkmalswert
R
=
x[n] − x[1]
(11)
(12)
(13)
Klassizierte Häugkeitsverteilung
R = xov − xu1
(14)
• Zentralen Quartilsabstand: Der zentrale Quartislabstand ist die Entfernung zwischen den
beiden Merkmalswerten, welche die in der Rangordnung zentral gelegenen 50% der Merkmalsträger eingrenzen.
ZQA = Q3 − Q1
5
(15)
• Mittlere absolute Abweichung: Die mittlere absolute Abweichung ist die durchschnittliche
Entfernung aller beobachteten Merkmalswerte von arithmetischen Mitteln (alternativ: Median)
δ=
v
1 X
·
·|xi − x| · hi
n i=1
(16)
n: Anzahl Merkmalsträger
v : Anzahl der verschiedenen Merkmalswerte
hi : Absolute einfache Häugkeit der an Merkmalsträger mit dem Merkmalswert: xi
• Varianz und Standardabweichung: Die Varianz ist die SUmme der quadrierten Abweichungen
der Merkmalswerte vom arithmetischen Mittel, dividiert durch die Anzahl der Merkmalsträger. Die Standardabweichung ist die Quadratwurzel aus der Varianz
n
σ2 =
1X
(xi − x)2 hi
n i=1
(17)
• Variationskoezienten: Der Variationskoezient misst nicht die absolute, sondern die relative
Streuung. Das heisst, er setzt die Streuung in Relation zur Lage der Häugkeitsverteilung. Der
Variationskoezient ist der Quotient aus Standardabweichung und arithmetischem Mittel,
multipliziert mit 100
VK =
1.2.3
σ
· 100
x
(18)
Boxplot
Ein Boxplot stellt die Verteilung kardinalskalierter Daten dar, fasst verschiedene robuste Streuungsund Lagemasse in einer Darstellung zusammen. Es vermittelt schnell einen Eindruck, in welchem
Bereich die Daten liegen und wie sie sich über diesen Bereich verteilen.
Abbildung 1: Boxplot Beispiel
6
1.3 Zufallsvariable
Die Zufallsvariable lässt sich als Funktion darstellen, die bei jedem Ergebnis eines Zufallsexperiments einen Wert (Realisierung) zuordnet. Zur Beschreibung stochastischer Phänomene sind Grössen (Variablen) zu betrachten, deren Werte vom Zufall beeinusst werden. Beispiel eines Münzwurfs
X : {Wappen, Zahl} → R, X(ω) =
1
−1
, falls ω = Wappen
, falls ω = Zahl
(19)
Gegeben sei ein Wahrscheinlichkeitsaum (Ω, A, P ).
• Wahrscheinlichkeitsmass P ordnet jedem Ergebnis A ∈ A seine Wahrscheinlichkeit zu:
P : A → [0, 1]
(20)
• Eine Zufallsvariable X ordnet jedem Ergebniss ω ∈ Ω einen Zahlenwert zu:
X:Ω→R
(21)
Um die Wahrscheinlichkeit dafür zu berechnen, dass die Zufallsvariable X bestimmte Werte annimmt, benötigen wir eine Verbindung zum Wahrscheinlichkeitsmass P und dem System der Ereignisse.
Denition der Zufallsvariable
Eine Funktion X : Ω → R, die jedem Ereignis ω eines Ergenisraums Ω eine reele Zahl x
zuordnet, bildet eine Zufallsvariable, falls jedes Intervall I ∈ R.
Ist diese Teilmenge Ai des Ergebnisraums ω ein Element des Systems der Ereignisse
in einem Wahrscheinlichkeitsraum (ω, A, P ) so ist P (Ai ) die gesuchte Wahrscheinlichkeit
A = {ω ∈ Ω|X(ω) ∈ I} ∈ A
(22)
Das sich einstellende Ergebnis des Experiments hängt vom Zufall ab. Daher wird auch der ermittlete
Zahlenwert X(ω) vom Zufall abhängen. Gesucht ist die Wahrscheinlichkeit dafür, dass X(ω) in
einem bestimmten Intervall I ⊂ R liegt.
Zu bestimmen ist die Menge der Ergebnisse, für die X(ω) ∈ I gilt. Gesucht ist die Teilmenge
des Ergenisraums aus Gleichung 22. Für die Wahrscheinlichkeit des Ereignisses ω ∈ Ω|X(ω) ∈ I ,
schreiben wir abkürzend P (X ∈ I) und entsprechend P (a < X ≤ b)
1.4 Theoretische Verteilungen
1.4.1 Binominal-Verteilung
Anwendung ndet dies wenn sich beispielsweise ein Zufallsexperiment nur in zwei Ergebnissen
unterscheidt, das Experiment n-mal wiederholt wird (Zufallsstichprobe vom Umfang n). Gesucht
ist meist die Wahrscheinlichkeit, dass bei n-maliger Durchführung des Experimentes das Ereignis:
genau, mindistens oder höchstens x-mal Eintrit.
• Wahrscheinlichkeitsfunktion:
n x
f (x) = P (X = x) =
p (1 − p)n−x
x
(23)
E(X) = n · p
(24)
V ar(X) = n · p(1 − p)
(25)
• Erwartungswert:
• Varianz
7
1.4.2
Poisonverteilung
Diese Verteilung wird angewendet, wenn man sich dafür interessiert, wie hoch die Wahrscheinlichkeit ist, dass das Ergebnis E in einem Intervall genau oder höchstens x-mal eintritt, wenn bekannt
ist, dass in diesem Intervall das Ereignis im Mittel µ-mal auftritt. µ gibt eine Rate pro Zeitintervall
an.
• Wahrscheinlichkeitsfunktion:
f (x) = P (X = x) =
µx −µ
e
x!
(26)
x: Anzahl der Ereignisse z.B Ereignis x tritt 1, 2, . . . , n-mal bei der Rate Beobachtungsintervall µ ein.
• Erwartungswert/Varianz
E(X) = V ar(X) = µ
1.4.3
(27)
Rechteckverteilung
Die Rechteckverteilung eignet sich zur Beschreibung von Vorgängen, bei denen die Ergebnisse nur
Zahlen eines bestimmten Intervalls [a, b] sein können. Die Wahrscheinlichkeit, dass ein Ergebnis
in ein bestimmtes Teilintervall fällt, wird nur durch dessen Länge bestimmt. Alle Ergebnisse eine
bestimmten Intervalls [a, b] sind gleich wahrscheinlich und daher auch die Gleichverteilung im
Intervall [a, b].
Hierzu gibt es keine Formeln in dieser Vorlesung
1.4.4
Exponentialverteilung
Diese Verteilung wird angewendet, wenn man Beispielsweise die Zeitspanne zwischen zwei Anrufen
in einer Telefonzentrale, die Dauer eines Telefongesprächs, die Lebensdauer eines Geräts (wenn
Defekte durch äussere Einüsse und nicht durch den Verschliess verursacht werden) ermitteln will.
Exponentialverteilung mit Parameter λ > 0
f (t) =
F (x) =
1.4.5
, für t ≥ 0
, sonst
λe−λt
0
, für x ≥ 0
, für x < 0
1 − e−λx
0
(28)
(29)
Weibull-Verteilung
Diese Verteilung wird Angewendet um die Lebensdauer von Geräten oder Materialien mit Abnutzungserscheinungen zu beschreiben. α ist ein Skalierungsparameter, β ist ein Formparameter.
f (t) =
β
α · β · tβ−1 eαt
0
F (x) =
β
1 − e−αx
0
, für t ≥ 0
, sonst
, für x ≥ 0
, für x < 0
(30)
(31)
Interpretation des Formparameters β > 0
• β < 1: Ausfallrate nimmt mit der Zeit ab (Ausfälle nden frühzeitig statt)
• β = 1: Ausfallrate konstant (zufällige äussere Einüsse sind Ursache des Versagens)
• β > 1: Ausfallrate nimmt mit der Zeit zu (Alterungsprozesse)
Bemerkung: Der Parameterwert β = 1 führt auf die Exponentialverteilung welche somit einen
Spezialfall der Weibull-Verteilung darstellt.
8
1.4.6
Normalverteilung
Die Normalverteilung ist die wohl wichtigste stetige Verteilung und spielt neben andrem in der
schliessenden Statistik eine entscheidende Rolle. Der zentrale Grenzwertsatz besagt z.B: Dass sich
eine Zufallsvariable X , die sich als Summe der n Zufallsvariablen X1 , X2 , . . . , Xn ergibt, nähreungsweise normalverteilt ist, wenn die Anzahl der Zufalls-variablen hinreichend gross ist, die Zufallsvariablen X1 , X2 , . . . , Xn unabhängig sind oder nicht eine der Zufallsvariablen X1 , X2 , . . . , Xn stark
dominant ist (sehr salopp formuliert).
• Wahrscheinlichkeitsdichtverteilung
f (x) =
• Verteilungsfunktion:
1
−1
√ e 2
σ 2π
Zx
F (x) =
−∞
x−µ 2
σ
,σ > 0
1 t−µ 2
1
√ e− 2 ( σ ) dt , σ > 0
σ 2π
(32)
(33)
Dieses Integral lässt sich leider nicht lösen Das bedeutet, dass wir keine Stammfunktion
nden.
• Erwartungswert
E(X) = µ
(34)
V ar(X) = σ
(35)
• Varianz
Die Normalverteilung ist eine stetige symmetrische Verteilung. Das Maximum der Dichteverteilung
liegt bei xmax = µ. Die Wendepunkte liegen bei xw = µ±σ . Die Verteilungsfuntkon mit den Werten
µ = 0 und σ = 1 wird als Standart-Normalverteilung bezeichnet. N (0; 1) = F0 (x).
z=
x−µ
σ
(36)
Zwischen einer Verteilungsfunktion F (X) und einer Standartnormalverteilung gibt es die folgende
Beziehung.
x−µ
F (x) = F0
(37)
σ
Daher reicht es aus, nur die Standartnormalverteilung zu kennen,diese wird in Tabellen angegeben.
1.4.7
Simulation und Zufallsvariable
In einem dynamischen Simulationsexperiment:
• Werden Ereignisse (Events) zu zufälligen Zeiten erzeugt oder zerstört
• Unterliegen Bearbeitungszeiten stochastischen Schwankungen
• Sind Entscheidungen im Event-Flow zufällig
• schwankungen Mengenangaben von Gütern, Nachfragen, Ressourcen etc.
• Die Beschreibung dieser scheinbar zufälligen Prozesse erfolgt durch die Denition geeigneter
Zufallsvariablen
9
1.5 Grundlagen der schliessenden Statistik
Abbildung 2: Wahrscheinlichkeitstheorie
Abbildung 3: Schliessende Statistik
Wahrscheinlichkeitstheorie
Die Wahrscheinlichkeitstheorie untersucht Grössen die vom Zufall beeinusst werden. Die
Art des Zufallseinusses wird durch die spezielle Wahl der Verteilungsfunktion bestimmt.
Mittels rein mathematiscner Überlegungen lassen sich bezüglich solcher Grössen bestimmte
charakteristische Eigenschaften ableiten, welche schliesslich Rückschlüsse auf die Eigenschaften von Realisierungen solcher Grössen zulassen.
Die schliessende Statistik befasst sich mit Messreihen deren konkrete Ausprägung vom Zufall
beeinusst werden. Diese Messreihen können ebenfalls charakteristische Grössen etwa in Form
des arithmetischen Mittels und der Varianz zugeordnet werden. Hier stellt sich die Frage nach
der Gestalt des unbekannten Verteilungsgesetzes unter dem die vorliegende Realisierung zustande
kam. Eine Entscheidung über die Annahme oder Ablehnung einer angenommenen Verteilung kann
durch ein Vergleich der gemessenen charakteristischen Grössen der Realisierung und aus der Theorie
abgeleiteten charakteristischen Grössen des hypothetischen Verteilungsgesetzes getroen werden.
1.5.1
Stichprobenerhebung
• Einfache Zufallsstichprobe
• Geschichtete Stichprobe
• Klumpenstichprobe
• Systematische Stichprobe
• Mehrstuge Stichprobe
Um gut Stichproben zu erheben muss man folgende Punkte beachten
1. Im Rahmen der Datenerhebung
Isolierende Abstraktion
Hier sind die unterschiedlichen Eigenschaften der Stichprobenerhebung zu beachten. Das
passende Verfahren hängt stark von der Fragestellung und dem zu untersuchenden Objekt
10
bzw. System ab, die durch die Simulation beantwortet werden soll. Um signikante Aussagen
machen zu können, ist die Grösse der Stichprobe zu bestimmen.
Generalisierende Abstraktion
Es muss eine geeignete Verteilungsfunktion gefunden werden, um die Anzahl der möglichen
Experimente zu erhöhen und eine gewisse Variabilität zu ermöglichen.
2. Im Rahmen der Experimentauswertung
Festlegung der Verteilung der Eingangsdaten
Sind diese festgelegt folgen die Experimente. Sind die Verteilungen zufällig, so kann diese nur
durch die Festlegung eines Seeds bestimmt werden, sodass sich die Streuung um einen Mittelwert ergibt. Wurden die Eingangsdaten falsch bestimmt, wird in den folgenden Experimenten
ein systematischer Fehler gemacht, der zu falschen Rückschlüssen führt
Für die Experimentplanung und Auswertung ergeben sich folgende Fragen:
• Wie sieht die Stichprobenfunktion und ihre Wahrscheinlichkeitsverteilung aus?
• Wie kann ein Vertrauensintervall für den Mittelwert bzw. die Varianz einer Messreihe
ermittelt werden?
• Wie kann der Stichprobenumfang d.h. die Anzahl der Experimente, festgelegt werden?
• Welche etablierten Testverfahren gibt es?
Testverteilungen
Testverteilungen sind Verteilungen, die bei vielen statistischen Tests Verwendung nden.
Wichtige Testverteilungen sind
• Chi-Quadrat Verteilung (Unterabschnitt 1.6)
• t-Verteilung (auch Student t-Verteilung) wenn die Stichprobe < 30 ist (Unterab-
schnitt 1.7)
• Normalverteilung wenn die Stichprobe ≤ 30 ist (Unterunterabschnitt 1.4.6)
1.6 Chi-Quadrat Verteilung
Dies ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen. Ihr
einziger Parameter muss eine natürliche Zahl sein und wird Freiheitsgrad genannt. Sie ist eine der
Verteilungen, die aus der Normalverteilung abgeleitet werden könne. Ha man Zufalls-variablen, die
unabhängig und standardorientiert sind, so ist die Chi-Quadrat Verteilung mit Freiheitsgraden deniert als die Verteilung der Summe der quadrierten Zufalls-variablen. Solche Summen quadrierter
Zufalls-variablen treten bei der Schätzung der Varianz einer Stichprobe auf.
Dichte der χ2r -Verteilung mit r Freiheitsgraden:
(
f (t) =
1
r
2 2 Γ( r2 )
r
t
· t 2 −1 · e− 2
, für t > 0
, für t ≤ 0
0
Erwartungswert:
(38)
E(X) = r
(39)
V ar(X) = 2r
(40)
Varianz:
1.7 Dichte der t-Verteilung
Dichte der tr -Verteilung mit r Freiheitsgraden:
f (t) = √
1
t2 − 1 (r+1)
·
(1
+
) 2
,t ∈ R
r
r · B( 12 , 2r )
11
(41)
Erwartungswert:
E(X) = 0(für r > 1)
Varianz:
V ar(X) =
r
(für r > 2)
r−2
(42)
(43)
Diese Verteilungen hängen von einem bzw. mehreren Parametern ab und repräsentieren somit
jeweils eine ganze Klasse von Verteilungen. Sie lassen sich als Verteilungen von Zufallsvariablen
denieren, die man als Funktion von standartnormalverteilten Zufallsvariablen darstellen kann. Sie
lassen sich ebenfalls für hinreichend grosse Werte ihrer Parameter durch Normalverteilungen approximieren. Für den praktischen Gebrauch existieren Tabellen, deren Aufbau sich an der Anwendung
in der Schliessenden Statistik orientiert.
1.8 Kondenzintervalle für den Wert µ der Normalverteilung
Liegt eine konkrete Stichprobe {x1 , x2 , x3 , . . . , xn } vor, so gilt für das Stichprobenmittel:
n
E[X] = µ = x =
1X
xi
n i=1
(44)
Betrachtet man jeden einzelnen Wert der Stichprobe xi als zufälligen Wert der Zufallsvariablen Xi
so ist der Stichprobenmittelwert wieder eine Funktion, die Stichprobenfunktion:
n
X=
1X
Xi
n i=1
(45)
• Satz 1: Es sei X eine Zufallsvariable mit dem Erwartungswert µ und der Varianz σ 2 . Fasst
man den Stichprobenmittelwert als Funktion der n unabhängigen Zufalls-variablen Xi auf,
die alle gleiche Wahrscheinlichkeitsverteilung wie X unterliegen. Dann gilt
n
X=
1X
Xi
n i=1
Der Erwartungswert
(46)
n
X = µx =
1X
Xi = µ
n i=1
Die Varianz:
2
σX
=
σ2
n
(47)
(48)
Interpretation: Der Stichprobenmittelwert hat den gleichen Erwartungswert, wie die
Grundgesamtheit. Dieser Mittelwert ist selbst wieder eine Zufallsvariable oder Stichprobenfunktion und streut um den Mittelwert der Grundgesamtheit. Je grösser n ist, desto kleiner
die Streuung oder, um so besser die Näherung.
• Satz 2 Es gelten die Voraussetzungn von Satz 1. Ist X darüber hinaus normalverteilt, ist
auch der Stichprobenmittelwert Normal-verteilt. Ist X N (µ; σ)-verteilt, dann gilt:
σ
X ⇒ N (µ; √ )
n
(49)
wobei: σ die Standartabweichung, µ der Mittelwert und n die Anzahl Stichproben ist.
1.9 Schätzfunktion
1.9.1
Problembeschreibung
Bisher sind wir davon ausgegangen, dass die Parameter µ und σ und die Verteilungsfunktion f
bekannt sind.
Diese Annahme ist zulässig, wenn sehr viele Ergebnisse von Messungen oder Experimenten vorhanden sind. Experimente sind jedoch teuer, Zeit und Ressourcenintensiv. Es ist daher so, dass
12
man die Anzahl der Experimente zu minimieren versucht. Mit dieser Fragestellung beschäftigt sich
das DoE (Design of Experiments)
Letzlich müssen die Parameter oft geschätz werden. Damit man nicht blind raten muss, werden
Schätzverfahren, Schätzfunktion und Gütekriterien für die Schätzfunktion deniert.
• Schätzverfahren:
Haben die Aufgabe, den oder die unbekannten Parameter der Verteilung eines Merkmals
in der Grundgesamtheit anhand einer Stichprobe zu schätzen.
Die Schätzung kann durch die Angabe eines einzigen Wertes erfolgen (Punktschätzung)
oder durch Angabe eines Intervalls (Invervallschätzung).
• Schätzfunktion:
Ist ein mathematischen Instrument und ordnet einer konkreten Stichprobe einen Wert
zu. Sie stellt somit ein Bindeglied zwischen der Grundgesamtheit und der Stichprobe dar. Sie
bildet die Beziehung zwischen den Parametern der Schätzfunktion und den entsprechenden
Parametern in der Grundgesamtheit bekannt. Dabei ist die Verteilung der Schätzfunktion zumindest approximativ bekannt. So wird der Rückschluss von der Stichprobe auf die
Grundgesamtheit möglich. Es erlaubt auch die Angabe des Fehlerrisikos.
1.9.2
Gütekriterien für Schätzunktionen
Ein Gütekriterium ist die quadratische Abweichung von Schätzfunktionen Tb und Parameter T .
Abweichung vom Schätz- oder Basiswertes Tb vom Wert des Parameters der Grundgesamtheit T .
E[(Tb − T )2 ] = V ar(Tb) + [E[Tb] − T ]2
(50)
V ar[·] ist die Varianz der Schätzfunktion, [E[Tb] − T ]2 ist die quadrierte Abweichung von der
Schätzfunktion T und Parameter T der Grundgesamtheit. Ist E(Tb) − T = 0 ist es Erwartungstreu.
Konstruktion dieser Funktion:
n
X
(xi − µ
b)2
(51)
i=1
n
µ
b=
1X
xi = x
n i=1
(52)
Zuerst minimiert man die Summe des Schätzwertes Gleichung 51, danach dierenziert man nach
µ = 0 und erhät die Schätzfunktion zu Gleichung 52.
Das Ziel des Schätzverfahrens ist, von einer Stichprobe auf eine Grundgesamtheit zu schliessen und
den Fehler einer falschen Schätzung zu minimieren oder zu bestimmen.
Hierbei wird zwischen zwei Schätzverfahren:
• Punktschätzung
Für die Simulation untersuchen wir hier die Parameterschätzung für den Mittelwert µ,
die Varianz σ 2 und für unbekannte Wahrscheinlichkeiten p (auch Anteilswerte genannt).
• Intervallschätzung
Hier geht es um die Bestimmung von Vertrauensinvervallen für die oben aufgeführten
Parameter und das damit verbundene Risiko einer Fehleinschätzung oder Fehlinterpretation.
Die Angabe des Fehlers oder der Genauigkeit einer Schätzung wird auch als ihre Zuverlässigkeit bezeichnet.
• Mittelwert µ:
n
x=
• Varianz σ 2 :
1X
xi
n i=1
(53)
n
s2 =
1 X
(xi − x)2
n − 1 i=1
(54)
Die Varianz der Stichprobe ist abhängig von n und damit nicht Erwartungstreu. Daher wird
hier die Korrektur (n − 1) vorgenommen. Für grosse Stichproben spielt das aber keine Rolle.
13
• Anteilswert/Wahrscheinlichkeit p:
p=
k
n
(55)
Wobei k = gute Fälle sind, und n = Stichprobenumfang
Die Verteilungsformen für das Stichprobenmittel X :
Verteilung des Merkmals X
Varianz bekannt
Variant unbekannt
Bekannt und normalverteilt
X ist normalverteilt
X ist t-verteilt
Bekannt und nicht normalverteilt
Unbekannt
1.9.3
X ist approximativ normalverteilt
Varianzen für die Schätzfunktion
• Verteilungsformen für das Stichprobenmittel X
Stichprobe
Varianz σ 2 bekannt
Ohne Zurücklegen
n
N
Mit zurücklegen
≥ 0.05
n
N
< 0.05
Varianz σ 2 unbekannt
2
σX
≈
σ
n
2
σ
bX
≈
s2
n
2
=
σX
σ2 N − n
·
n N −1
2
=
σ
bX
s2 N − n
·
n
N
2
Hinweis: Das Sigma beinhaltet keinen Bruch: σX
6= σ X2
14
• Varianzen der Schätzfunktion X
1.9.4 Erstellen des Kondenzintervalls
1.
2.
3.
4.
Feststellung der Verteilungsform von X
Feststellung der Varianz von X ggf. schätzen mit s2
Ermittlung des Quantislwertes z oder t
Berechnung des maximalen Schätzfehlers. Der maximale Schätzfehler ist das Produkt
aus Quantilswert und Standartabweichung von X
5. Ermittlung der Kondenzgrenzen Die untere und obere Kondenzgrenze ergeben sich
durch Substraktion bzw. Addition des maximalen Schätzfehlers vom bzw. zum Stichprobenmittel X
• Die Varianzen der Schätzfunktion P ergeben sich aus
P =
k
=θ
n
(56)
Für nP (1 − P ) > 9 = appriximativ normalverteilt.
Stichprobe
Varianz bekannt
Mit Zurücklegen
σ P2 =
θ(1−θ)
n
σ
b P2 =
P (1−P )
n
n
N
< 0.05
σ P2 ≈
θ(1−θ)
n
σ
b P2 ≈
P (1−P )
n
n
N
≥ 0.05
2
σX
=
θ(1−θ)
n
·
N −n
N −1
Varianz unbekannt
σ
b=
P (1−P )
n
·
N −n
N
In allen Tabellen dieses Kapitels gilt: N ist die Grundmenge, n die Grösse der Stichprobe und
bzw. NN−n sind Korrekturfaktoren.
Erstellen eines kondenzienintervalls
N −n
N −1
1. Festellung der Verteilungsform von P , die Schätzfunktion ist approximativ normalverteilt
wenn nP (1 − P ) > 9
2. Festellung der Varianz von P
3. Ermittlung des Quantilwertes z
4. Berechnung des maximalen Schätzfehlers
Der maximale Schätzfehler ist das Produkt des Quantilwerts und Standardabweichung
von P
5. Ermittlung der Kondenzgrenzen
Die untere und die obere Kondenzgrenze ergeben sich durch Sustraktion bzw. Addition
des maximalen Schätzfehlers vom bzw. zum Stichprobenmittel P
1.9.5
Berechnung Stichrpobenumfangs grosser Grundgesamtheiten
Die Berechnung des notwendigen Stichprobenumfangs für die Intervallschätzung mit Zurücklegen
oder Grossergrundgesamtheit unterscheidet sich vom den vorherigen Beispielen. Bisher war die
Frage: Wie gross ist das Vertraunsintervall bei einer gegebenen Anzahl von Stichproben:
−W
σ
σ
µ − z√ ≤ x ≤ µ + z√
n
n
15
=1−α
(57)
Jetzt soll ein maximaler Fehler vorgegeben werden
σ
n
Fehler: µ ± e = µ ± z √
Wahrscheinlichkeit: 1 − α
σ
Vorgabe: e ≤ ±z √
n
(58)
(59)
(60)
Daraus folgt bei vorgegebener Wahrscheinlichkeit 1 − α zur Bestimmung des Z -Wertes der Standartnormalverteilung
Z 2 σ2
e2
n≥
(61)
Bei der Berechnung des notwendigen Stichprobenumfangs für die Intervallschätzung ohne Zurücklegen, muss man anders vorgehen. Mit dem bekannten Korrekturfaktor aus Gleichung 58, erhält
man
z2 N σ2
n≥ 2
(62)
2 2
e (N − 1) + z σ
1.9.6
Kondenzinterfall für die Varianz
Für die Schätzfunktion galt Gleichung 51 und Gleichung 52, sind die Xi normalverteilt gilt:
n
s2 =
σ2 X 2
Z
n − 1 i=1 i
n
X
(63)
Zi2 =
i=1
s2 (n − 1)
σ2
(64)
Zur berechnung eines asymmetrischen Kondenzintervall, beispielsweise durch die Chi-Quadrat
Verteilung, in Gleichung 38 angegeben. Das heisst die Zufallsvariable Y in der die zu schäzende
Varianz der Grundgesamtheit einiesst, ist Chi-Quadrat-verteilt mit r = n − 1 Freiheitsgraden.
(n − 1)s2
α
≤ y1− 2
W y ≤
σ2
(n − 1)s2
(n − 1)s2
2
W
≤σ ≤
y1− α2
y α2
α
2
(65)
(66)
Anmerkung zu diesen Funktionen:
• Anstatt r wird für den Freiheitsgrad oft auch k verwendet
• Die y -Werte (Quantilswerte für
bzw. 1 −
Chi-Quadrat Verteilung zu entnehmen
α
2
α
2
bei r Freiheitsgraden) sind der Tabelle der
1.10 Testverfahren
Denition Testverfahren
Im Testverfahren erhält man mit einer vorgegebenen Wahrscheinlichkeit von mindestens
1 − α auf Grund einer Stichprobe ein Intervall [a, b], das einen unbekannten Parameter v
enthält, so heisst dieses Intervall für v bei einem Vertrauensniveau von 1 − α
α wird in diesem Zusammenhang auch als Signikanzzahl bezeichnet und ist ein Mass für die
Irrtumswahrscheinlichkeit. Das heisst die Null-Hypothese abzulehnen, obwohl sie richtig ist. Damit
hat man auch eine Aussage über die Wahrscheinlichkeit eines Fehlers.
16
1.10.1 Fehler erster Art
Der Fehler ersten Art, bedeutet fehlerhaftes Ablehnen einer Hypothese. Liegt der ermittelte Wert
ausserhalb des Annahmebereichs, so wird die Hypothese verworfen. Die Wahrscheinlichkeit, dass
die Hyptohese fälschlicherweise verworfen wird, wird durch die Fläche unter der Verteilungsfunktion
ausserhalb des Annahmebereichs repräsentiert und lässt sich bestimmen als α.
Abbildung 4: Fehler ersten Art
1.10.2 Fehler zweiter Art
Der Fehler der zweiten Art, bedeutet eine fehlerhaftes Annehmen einer Hypothese. Beim Aufstellen
Abbildung 5: Fehler zweiter Art
einer Hypothese kann es passieren, dass diese nicht komplett der Wahrheit entspricht. Der Fehler
der Hypothese und der Wahrheit wird als Fehler β durch die Fläche von ∞ bis an das Ende der
Annahme angegeben.
1.10.3 Fallunterscheidungen
Man kann unter verschiedenen Fällen unterscheiden. Unter anderem:
• Der/die interessierenden Parameter der Grundgesamtheit sind z.B als Erfahrungswert be-
kannt. Durch Stichproben soll überprüft werden, ob diese Werte noch eingehalten werden.
• Hypothesen basieren auf Sollwerten und Normen. Diese Werte müssen also durch Vorgaben
eingehalten werden. es ist zu überprüfen, ob ein Standard eingehalten wird.
• Hypothesen aufgrund einer Theorie oder auch auf Grund von Ergebnissen aus Simulations-
läufen.
17
Ein statistischer Test ist eine Methoden, die eine Entscheidung ermöglichen soll. Deshalb braucht
man ein bestimmtes Verfahren, um Hypothesen zu testen.
1. Festlegen der Grundgesamtheit und Formulieren der Nullhypothese H0 und der Alternativhypothese H1 (im Allgemeinen die Verneinung der Nullhypothese)
2. Festlegen der Signikanzzahl α, gibt die Irrtumswahrscheinlichkeit an oder das Vertrauensintervall 1 − α
3. Bestimmen der Testgrösse und des Annahme und Ablehnungsbereichs. Testgrösse kann der
Stichprobenmittelwert sein
4. Berechnen des Wertes der Testgrösse mit den Daten der Stichprobe und Testentscheidung
Um Hypothesen zu beweisen, formuliert man oft eine Verneinung dieser Hypothese als Nullhypothese und versucht dann, diese durch einen statistischen Test zu wiederlegen. Dies ist Vergleichbar
mit dem Indirekten Beweis der Mathematik.
1.10.4 Parametertest
Der Paramtertest überprüft die Hypothese über Paramter einer Grundgesamtheit.
σ
σ
µ0 − z √ ≤ x ≤ µ0 + z √
n
n
(67)
Die Fragen die sich beim Paramtertest stellen sollten sind:
• Liegt eine systembedingte Störung vor?
• Ist der angegebene Mittelwert korrekt?
• Liegt das Ergebniss im Bereich der statistischen Schwankungsbreite (Tolleranz)?
Diese Fragen können über das Vertrauensintervall (Gleichung 67) beantwortet werden.
1.10.5 Anteilswerte
Diese können analog zu den Paramtertests angewendet werden:
1. Wähle die Signikanzzahl α und bestimme daraus die Werte für Z aus der Tabelle (1 − α)
2. Berechne die Annahmegrenzen
r
p0 (1 − p0 )
n
r
r
p0 (1 − p0 ) N − n
cu = p0 − z
n
N −1
r
p0 (1 − p0 )
c0 = p0 + z
n
r
r
p0 (1 − p0 ) N − n
c0 = p0 + z
n
N −1
cu = p0 − z
3. Man berechne den Anteil p =
oder
(68)
und
(69)
oder
(70)
(71)
k
n
4. Fällt p in den Annahmebereich: cu ≤ p ≤ c0 , wird die Hypothese angenommen, sonst abgelehnt.
18
1.10.6 Dierenztests
Manchmal will man mit Hilfe von Stichproben untersuchen, ob zwei Mittelwerte µ1 = µ2 sind, oder
signikant voneinander abweichen. Zum Beispiel ist das Ergebnis des einen (Simulations)Experiments
signikant unterschiedlich von dem anderen. Dabei werden zwischen zwei Stichproben unterschieden
• Abhängige Stichproben
Diese werden in der Regel angestrebt, wenn es sonst zu Überlagerungen kommt, die das
Ergebnis verzerren könnten.
• Unabhängige Stichproben
Diese liegen dann vor, wenn zum Beispiel für ein Herstellungsprozess zwei unterschiedliche Modellvarianten untersucht werden sollen, in denen der Durchsatz untersucht werden
soll.
Abhängige Stichproben erstellen:
1. Bilden der Nullhypothese
H0 : µ1 = µ2
(72)
2. Die Diernezen der Stichprobe müssen für alle i erfasst werden
di = xi − yi
(73)
3. Dann gilt die Nullhypothese H0 gleich, wenn der Mittelwert von di im Bereich von 1 − α liegt
4. Es wird die Signikanzzahl α gewählt
5. Mit Hilfe der Tabelle für Normalverteilung werden die Annahmegrenzen festgelegt
Unabhängige Stichproben erstellen:
1. Lege eine Signikanzzahl α fest
2. Mit Hilfe der Tabelle für Normalverteilung wird der Werte ∓Z festgelegt
3. Berechnung des Annahmebereichs 1
s
c = ∓z
σ12
σ2
+ 2
n1
n2
(74)
4. Berechnung der Mittelwerte der Stichproben µ1 und µ2
5. Man nehme die Nullhypothese aus Gleichung 72 an, wenn die Dierenz aus Gleichung 73 in
den Annahmebereich fällt
1.10.7 Verteilungstests
Bisher wurden Tests behandelt, die sich auf Parameter der Grundgesamtheit beziehen. Nun soll
mithilfe von Stichproben überprüft werden, ob Hypothesen über Wahrscheinlichkeitsverteilungen
überprüft werden können. Verbreitete Testverfahren in den Verteilungstests sind:2
• Chi-Quadrat Test (Unterabschnitt 1.6)
• Kolmogoro-Smirno Test
• Spezielle Tests, die für die Überprüfung bestimmter Verteilungen zugeschnitten sind
1 Nach
wie vor ist der Mittelwert gleich dem Mittelwert der Dierenz. Aber jetzt muss die Varianz für jede Probe
separat angenommen bzw. Geschätz werden.
2 Als einziger dieser Verfahren haben wir die Chi-Quadrat Verteilung behandelt
19
Die Idee des χ-Quadrat Test ist, es werden die Häugkeiten der empirische ermittelten Verteilun mit
der theoretischen Verteilung verglichen. Dazu werden wieder die Dierenzen der Häugkeitswerte
quadriert, normiert und aufaddiert.
y=
y=
m
2
X
(ni − npi )
i
m
X
i
npi
hei − hth
i
hth
i
2
(75)
(76)
Geht man davon aus, dass die einzelnen Messungen wieder Normalverteilt sind, dann ist die Summe
y Chi-Quadrat verteilt mit m − 1 Freiheitsgraden.
Um den Test zu erhalten, geht man folgendermassen vor:
1. H0 : Die empirische Häugkeit entspricht der theoretischen Häugkeit
2. Man wähle eine Signikanzzahl α und bestimme die Anzahl der Freiheitsgrade
Sind alle Parameter der Verteilungfunktion bekannt, haben wir m − 1 Freiheitsgrade
Wenn die Parameter der Verteilungsfunktion geschätzt werden müssen, kann die Anzahl
Freiheitsgrade für jeden geschätzen Parameter um eins reduziert werden.
3. Die Annahmegrenze Co wird aus der Tablle für die Chi-Quadrat Verteilung ermittelt. Die
Häugkeit sollte nicht kleiner als 5 und der Stichprobenumfang nicht grösser als 30 sein.
Sonst muss man mit der YATES Korrektur arbeiten
4. Man berechnet für die vorliegenden Sithcproben den Testwert mit Gleichung 75
5. Gilt Y > C0 , dann lehnt man die Hypothese H0 ab, ansonsten nimmt man sie an
1.10.8 Unabhängigkeitstest
Die Unabhängigkeitstests beinhaltet die Überprüfung von eventuellen Abhängigkeiten zwischen
bestimmten Zufallsvariablen. Man spricht auch von einem Chi-Quadrat Unabhängigkeitstest. Voraussetzungen dafür sind, dass die Häugkeit grösser als 5 ist und der Stichprobenumfang grösser
als 30. Dieser Test liefert eine Entscheidung ob eine Abhängigkeit besteht, jedoch keine Information oder Mass über die Stärke der Abhängigkeit (siehe Unterunterabschnitt 1.11.1). Sind diese
Voraussetzungen nicht erfüllt können Korrekturen vorgenommen werden, die sogenannte YATES
Korrektur. Da es jedoch auch hier keine festen Regeln gibt, und die Ergebnisse mit Vorsicht zu
bewerten sind, sollten aus praktischer Sicht die Voraussetzungen erfüllt werden.
1.11 Zusammenhang zwischen zwei Merkmalen
Dem Erkennen des Zusammenhangs zwischen zwei oder meBhr Merkmalen kommt der betrieblichen Praxis eine grosse Bedeutung zu. Bei der Untersuchung des Zusammenhangs zwischen zwei
Merkmalen X und Y sind folgende Fragen interessant:
• Besteht ein Zusammenhang zwischen X und Y? (siehe Unterabschnitt 1.6)
• Von welcher Form ist der Zusammenhang?
• Von welcher Stärke (Intensität) ist der Zusammenhang?
Abhängigkeit
Zwei Merkmale sind statistisch unabhängig, wenn der Wert des einen Merkmals nicht davon
abhängt, welcher Wert das andere Merkmal besitzt. Sonst sind sie abhängig.
20
Zu unterscheiden sind dabei:
• Formale Abhängigkeit:
Liegt eine zahlenmässig begründete Abhängigkeit zwischen den Merkmalen vor?
• Sachliche Abhängigket
Ist der Wert des einene Merkmals ursächlich für den Wert des anderen Merkmals? Die
Feststellung der Kausalität bzw. der Ursache-Wirkungsbeziehung kann die Zusammenarbeit
mit dem auf dem jeweiligen Sektor Fachkundigen erforderlich machen. Hier muss man sich
aber vor Ünsinns-Korrelationenïn acht nehmen. Ein Beispiel ndet sich in Abschnitt 2.6.1
Herausnden ob eine Tabelle unabhängig ist
hi,k =
hi hi,k
n
(77)
1.11.1 Regressionsanalyse
Die Regressionsanalyse beschreibt die Form bzw. Tendenz des Zusammenhangs durch eine mathematische Funktion. Durch sie werden die Wertkombinationen (x, y) der Merkmalsträger in ein
Koordinatensystem eingetragen, dann ergitb sich ein sogenanntes Streuungsdiagramm (Punktewolke). In der linearen Regressionsanalyse wird die Tendenz durch die Funktion bestimmt.
• Bei einseitiger Beeinussung (y wird nur durch den Parameter x bestimmt)
(78)
y = a1 + b1 · x
• Bei wechselseitiger oder unbekannter Abhängigkeit zusätzlich
3
x = a2 + b2 · y
(79)
Dabei müssen jedoch die Parameter a und b bekannt sein. Zur bestimmung dieser verwendet man
kleine Quadrate. Die Aufgabe besteht darin, Gleichung 80 zu minimieren. Dies erreicht man mit
partiellem Ableiten des Ausdrucks nach a und b, nullsetzen der beiden partiellen Ableitungen und
auösen der beiden Gleichungen nach a und b.
n
X
(yi − a − bxi )
2
(80)
i
Dies ergibt:
a1 =y + b1 x
Pn
xi yi − nxy
b1 = Pi=1 2
2
i=1 xi − nx
(81)
x = a2 + b2 y ⇐⇒ a2 = x + b2 y
Pn
xi yi − nxy
⇐⇒ b2 = Pi=1 2
2
i=1 yi − ny
(83)
(82)
Analog folgt für:
1.11.2 Korrelation
Die Korrelationsanalyse hat die Aufgabe:
• Die Stärke (Intensität) des Zusammenhangs festzustellen
• Wie ausgeprägt der Einuss des einen Merkmals auf das andere Merkmal ist
3 Achtung,
dies ist keine Umkehrfunktion von Gleichung 78
21
(84)
• Zur Bewertung dieses Einusses sind Kenngrössen zu entwickeln bzw. zu berechnen
Je nach Skalierungsgrad stehen verschiedene Verfahren zur Verfügung:
1. Sind beide Merkmale mindestens Intervallskaliert:
Korrelationskoezienz von Bravais Pearson
2. Ist ein Merkmal ordinalskaliert und das ander Merkmal mindestens ordinalskaliert:
Rangkorrelationskoezient von Spearman
3. Ist mindestens eines der beiden Merkmale Nominalskaliert:
Kontingenzkoezienten und Assoziationsmasse
4. Grundsätzlich können Skalierungsvoraussetzungen von den Merkmalen überfüllt sein, dies ist
jedoch nicht ratsam, da das mit einem Informationsverlust verbunden ist.
1.11.3 Bravais Pearson
1. Schritt: Kovarianz
Diese ist ein Mass für die Streuung der Merkmalsträger bzw. deren Merkmalswertkombinationen (xi , yi ) um den Mittelpunkt oder Durchschnitt (x, y). Die Kovarianz erfolgt analog zu
der, der Varianz Formel:
n
σXY =
1X
(xi − x)(yi − y)
n i=1
σXY =
1X
xi yi − xy
n i=1
(85)
n
(86)
2. Schritt: Normierung der Kovarianz
Es entsteht der Korrelazionskoezient (Normiert wird auf den Wertebereich [−1, 1]
r=
σXY
σX σY
(87)
oder etwas ausführlicher
Pn
(xi − x)(yi − y)
r = p Pn i=1
Pn
( i=1 (xi − x)2 )( i=1 (yi − y)2 )
Durch Umformung gilt
(88)
(89)
Dabei ist r positiv zu setzen, wenn beide Steigungsmasse positiv sind, oder negativ wenn
beide Steigungsmasse negativ sind. Dazu benötigen wir aber Gleichung 85 und Gleichung 86
r=
p
b1 b2
1.11.4 Interpretation des Korrelationskoezienten von Bravais Pearson
Der Korrelationskoezient r berechnet sich zu r.
r=
Pn
σXY
i=1 (xi − x) (yi − y)
= r
P
Pn
σXσY
2
n
2
(x
−
x)
(y
−
y)
i
i
i
i
Pn
xi yi − nxy
b1 = Pi=1
n
x2 − nx2
Pni=1 i
xi yi − nxy
b2 = Pi=1
n
2
2
i=1 yi − ny
(90)
(91)
(92)
• bei positivem r ist der lineare Zusammehang der Merkmale X und Y positiv, bzw gleichläug
• bei negativem r ist der lineare Zusammehnahng der Merkmale X und Y negaziv bzw. gegen-
läug
• Der Betrag von r kann die Werte 0 bis 1 annehmen. 1 bedeutet sehr startker linearer Zusam-
mehnang, 0 kein linearer Zusammehnang. Die beiden Regressionsgeraden stehen senkrecht
aufeinander
22
1.11.5 Zeitreihe
Zeitreihe
Eine Zeitreihe ist eine zeitlich geordnete Folge von Merkmalswerten.
• Kosten/Gewinnentwicklung
• Verbrauch von Ressourcen
• Auftrangseingang
• Bearbeitungs oder Durchlaufzeiten
Die Aufgabe der Zeitreihenanalyse besteht darin, eine Struktur und Gesetzmässigkeit einer
Zeitreihe zu erkennen. Sie ist ein Mittel zur Progrnose, oder erkennen eines Trends.
Der Trend beschreibt die langfristige Grundrichtung einer Zeitreihe. Um ihn streuen die Zeitreihenwerte im Zeitablauf unf für seine Entwicklung sind dauerhaft wirksame Einüsse verantwortlich.
Der Verlauf kann linear oder nichtlinear sein. Wenn er nichtlinear ist, kann er sich einer Exponential, Potenz oder Logistische Funktion annhähern. Die nichtlinearen Verläufe entziehen sich häug
aber der intiuitiven Vorstellung werden daher oft falsch bewertet. Die Zeitreihe hat aber einige Stolpersteine. Beispielsweise ist es nicht immer einfach periodische Schwankungen zu erkennen oder
besonderer Ereignisse zu identizieren. Lösen lasen sich diese Probleme durch sogenanntes Glätten des Verlaufs durch beispielsweise den gleitenden Durchschnitt oder die Methode der kleinsten
Quadrate (siehe Regression:Unterunterabschnitt 1.11.1).
23
2
Beispiele
2.1 Mittelwerte und Spannweite
Versicherungssumme
in Tsd
Anzahl Verträge
Median der Klasse
xi hi
Hj
Std. Abweichung
Varianz
4-10
10-20
20-30
30-40
40-80
80-120
20
160
80
40
88
12
7
15
25
35
50
100
140
2400
2000
1500
5280
1200
20
180
260
300
388
400
481
2568
484
158
2547.6
827.4
11568.05
41214.4
2928.20
624.1
73752.02
57049.23
• Durchschnittliche Versicherungssume(Gleichung 5):
x=
1X
1
xj hj =
· 12420 = 3105
n j
400
• Dichte (Gleichung 1)
d1 =
20
= 3.33, d2 = 16, d3 = 8, d4 = 4, d5 = 2.2, d6 = 0.3
10 − 4
• Modus
Aus den Dichten lässt sich herauslesen, dass Klasse 2 die höchste Dichte hat, diese ist also
die Modusklasse. Berechnung des Modus(Gleichung 3)
M0
=
M0
=
d2 − d1
· (xo2 − xu2 )
(d1 − d1 ) + (d2 − d3 )
16 − 3.33
· (20 − 10)
10 +
(16 − 3.33) + (16 − 8)
xu2 +
=
16130
• Median
Der Median ist der Wert der geordneten Mitte von 400 (Summe aller Verträge), also 200.
Diese Anzahl kommt in der 3. Klasse zu liegen. Damit ergibt sich der Median(Gleichung 4):
Me
=
Me
=
n
2
− H2 o
(x3 − xu3 )
h3
400 ÷ 2 − 180
(30 − 20)
20 +
80
xu3 +
=
22500
• Quantil
Die erste Quantilklasse it 400
4 = 100. Dies ist in Klasse 2. Analog zum Median berechnet sich
das erste Quantil(Gleichung 4).
Q1
=
Q1
=
n
− H1 o
xu2 + 4
(x2 − xU
2)
h2
400 ÷ 4 − 20
10
(20 − 10)
160
=
50000
Das zweite Quantil ist der Median und das dritte Quantil entspricht dem ersten Quantil plus
dem Median.
24
• Quantils und Dezilabstände
Quantilsabstände: Der Quantilsabstand bewegt sich 50% um den Median.
Q3 − Q1 =
40000 − 15000 =
ZQA
25000
Dezilabstände
1
10
− Hj−1
· (xoj − xuj )
hj
9
− 300
400 · 10
· (80 − 40)
D9 = 40 +
88
Der Dezilabstand ist D9 − D1 = 56020.
Dj
=
xuj +
n·
=
67270
2.2 Grundlagen der schliessenden Statistik
1. Es sei X die Zufallsvariable X = Augenzahl bei Würfeln, dann galt für einen Wurf: µ =
3.5, σ 2 = 2, 92. Wie sieht die Häugkeit (Wahrscheinlichkeit), Varianz, Mittelwerte bei einem,
zwei oder drei Würfen aus?
Die 5 tritt 4 mal auf, die 6 Tritt 10 mal auf.
1. Wurf
3.5
2.92
1.71
Mittelwert µ
Varianzσ 2
Std. Abweichung σ
2. Wurf
3.5
2.92
2
1.21
3. Wurf
3.5
= 1.46
2.92
3
0.98
= 0.97
2. Sie haben ein Situationsmodell einer Produktionseinrichtung erstellt, vom realen System wissen sie, dass diese Maschine im normalverteilten Mittel 10 Stück pro Sekunde produziert und
die Standardabweichung von 1 Stück pro Sekunde besitzt. Sie führen der Simulationsumgebung 25 Experimente (Replications) durch.
Mit welcher Wahrscheinlichkeit wird der mittlere Ausstoss zwischen 9.8 und 10.2 Stück
pro Sekunde liegen?
Mit welcher Wahrscheinlichkeit wird der Ausstoss über 10.2 liegen?
Wie verändert sich das Ergebniss, wenn sie statt dessen nur 5 bzw. 100 Experimente
machen?
1S
Mit µ = 10S
sec und σ = sec . Daraus folgt:
ZStichprobe =
X −µ
√σ
n
Gesucht ist nun:
P
(9.8 ≥ x ≥ 10.2)
9.8 − µ
P
√σ
n
=⇒
P
P
≥
x−µ
√σ
n
≥
10.2 − µ
!
√σ
n
9.8 − 10
x − 10
10.2 − 10
≥
≥
0.2
0.2
0.1
(Z1 ≥ Z ≥ Z2 ) = 1 − α
25
3. In welchem symmetrischen Intervall liegt der Mittelwert bei vorgegebener Wahrscheinlichkeit,
oft mit 1 − α bezeichnet. Hier sei 1 − α = 0.9.
Z ist nach Voraussetzung N(0,1) verteilt, dann folgt unmittelbar: P (−z ≤ z ≤ z) =
1 − α ⇒ 1 − α = F0 (z) − F0 (−z), wobei z die obere und untere Schranke bildet: Dies nden
n
σ ÷ n2
Z · σ ÷ n2
5
25
100
0.45
0.2
0.1
0.738
0.328
0.164
Intervall
[9.262;10.738]
[9.672;10.328]
[9.836;10.164]
wir wiederum mit der folgenden Formel heraus:
Z=
X −µ
√σ
n
Daraus folgt Gleichung 57.
2.3 Schätzverfahren
Beispiel In einer Wurstfabrik werden u.a. Leberwürste hergestellt. Aus langjährigen Messreihen
ist bekannt, dass das Füllgewicht der Leberwürste normalvertwilt ist. Das Soll-Mindestgewicht der
Würste beträgt 125g. Aus der Tagesproduktion von 600 Würsten wurder 26 Würste zufällig ohne
Zrücklegen entnommen und gewogen. Die Messergebnisse für das Füllgewicht (in Gramm) wurden
in eine Tabelle eingetragen.
128.4
123.1
123.3
127.1
123.8
126.6
123.2
125.8
123.5
121.9
123.2
123.7
126.9
125.3
124
125.9
125.5
123.4
122.8
124.9
123.1
122.1
127.1
124.9
124
125.7
Die Daten haben den Mittelwert: X = 124.5g und eine Varianz s = 1.72g.
Erstellen des 95% Kondenzintervall: µ = 26. Da s = σ 2 :
√
1.72
z= √
= 0.2572
26
Nun muss man den gesuchrten Wert in der Tabelle der Normalverteilung nachschlagen, in unserem
Fall 0.975 (weil es das Mittel von 95% ist, und die Verteilung Normalverteilt ist, können wir einfach
die hälfte von 5 dazuzählen). Dabei erhalten wir 1.96. Damit nun das Intervall festgelegt werden
kann, muss man erst z mit dem Wert der Tabelle multiplizieren, und dann das Intervall dazu bzw.
abziehen.
0.272 · 1.96 = 0.5041
W (123.9959 ≤ 124.5 ≤ 125.0041)
Ermittlung der Kondenz für das mit 125g nach unten begrenze Intervall für µ
Wir kennen aus Gleichung 57 dass: µ − z √σn > 125g. Da wir n = 26, σ 2 = 1.72, N = 124.5 bereits
kennen, können wir diese lediglich einsetzen.
124.5 − z
⇒
→
√
√1.72
26
z
z(97.5%)
> 125
> 1.9440
Den Wert für z(x) muss man in der Tabelle "rückwärts"nachschlagen, also den entsprechenden
Wert so genau wie möglich bestimmen und die Zahlen am linken und oberern Rand kombinieren.
26
Beispiel Einer Lieferung von 1000 Paketen Zucker ist mit einer 95% Kondenz bei einem Fehler
von e = 0.2g zu untersuchen, ob bei einer bekannten Standardabweichung von 1.2g der garantierte
Mittelwert eingehalten wird. Wie viele Proben sind aus der Lieferung mindestens zu entnehmen?
• Z aus Tabelle der Standardnormalverteilung: 1.96
• Aus Gleichung 62 folgt:
n ≥
n ≥
1.962 ·1000·1.22
0.22 ·(1000−1)+1.962 ·1.22
121.6
2.4 Testverfahren
2.4.1
Parametertest
Eine Autozeitschrift möchte wissen, ob der Benzinverbrauch eines bestimmten Autotyps µ =
1l
und mit σ = 100km
eingehalten wird. Dazu sollen 25 Autos untersucht werden.
Als Nullhypothese H0 geht man davon aus, dass die Angabe stimmt.
Bestimmen des Stichprobenmittels der 25 Testfahrzeuge:
• einmal
10.2l
100km
• einmal
10.4l
100km
10l
100km
Die Frage ist:
• liegt iene systembedingte Störung und der angegebene Mittelwert ist falsch oder
• liegt das Ergebnis im Bereich der statistischen Schwankungen (Toleranz)
• Die Frage kann über das Vertrauensintervall beantwortet werden (Gleichung 67)
Mit den gegebenen Werten füllen wir die Gleichung 67 aus: µ0 = 10, σ = 1, n = 25, 1 − α = 0.95
1
1
10 − 1.96 √ ≤ x ≤ 10 + 1.96 √
25
25
Unter der gegebenen Wahrscheinlichkeitsangabe würde die Nullhypothese mit dem Stichprobenmitel von 10.2 noch angenommen und der Unterschied als statistische Schwankung akzeptiert.
Hingegen wird das Stichprobenmittel von 10.4 als signikante Abweichung betrachten und somit
die Nullhypothese zurückgewiesen. Der mögliche Fehler liegt bei 2.5%.
2.5 Unabhängigkeitstest
Ein Unternehmen stellt ein Produkt in vier Zweigwerken her. Je nach erreichter Qualität wird
ein Produkt in eine von 3 Qualitätstufen eingeordnet. Es soll mittels einer Stichprobe von 500
Stück untersucht werde, ob zwischen der Qualität der Produkte und den Zweigwerken, in denen
sie hergestellt werden, ein Zusammenhang beziehungsweise Abhängigkeit besteht
Die Randhäugkeiten sind gelb markiert.
Zweigwerk
1
2
3
4
Summe
Qualitätsstufe
1
2
3
125 25 10
75 20 10
60 25 15
75 40 20
335 110 55
Summe
160
105
100
135
500
1 Schritt: Signikanzzahl 0.01 festgelegt.
Freiheitsgrade sind: 3 Qualitätsstufen 3 − 1 = 2 und 4 Zweigwerke 4 − 1 = 3. Multipliziert
ergibt das, dass es 6 Freiheitsgrade gibt.
27
2 Schritt: Der Testwert y berechnet sich auch hier als Summe der quadrierten Dierenzen zwischen
tatsächlicher und erwarteter Häugkeit jeweils dividiert durch die erwartete Häugkeit. Die
erwartete Häugkeit ermittelt man durch die Randverteilung:
hth
32
100
=
110
500
hth
32
=
110·100
500
hth
32
=
22
Die Zahlen werden durch die Randhäugkeiten in der Tabelle entnommen. 500 ist die Summe
aller Randhäugkeiten, 100 die Summe aus der Zeile 3, 110 die Summe aus der Spalte 2, daher
auch hth
32
3 Schritt: Daraus ergibt sich, mit Vorlage aus Gleichung 75:
y=
(125 − 107.2)2
(25 − 35.2)2
(20 − 14.85)2
+
+ ... +
= 20.72
107.2
35.2
14.85
Daraus ergibt sich eine Tabelle mit neuen Werten.
Zweigwerk
1
2
3
4
Summe
1
107.2
70.35
67
90.45
335
Qualitätsstufe
2
3
35.2 17.6
23.1 11.55
22
11
29.7 14.85
110 55
Summe
160
105
100
135
500
C0 aus der Tabelle ist 15.086 < 20.72. Die Hypothese wird abgelehnt, die Ergebnisse der Zweigwerke
sind nicht unabhängig.
2.6 Zusammenhang zwischen zwei Merkmalen
2.6.1
Regressionsanalyse
Zusammehang zwischen Merkmalen nw = 1500 weibliche und nm = 500 männliche Kunden
haben alle einen Artikel gekauf, der in verschiedenen Farben verfügbar ist: Wenn das Einkaufs-
Farbe
Häugkeit
Blau
1000
Grün
600
Rot
400
Summe
2000
verhalten unabhängig ist, so müssten die relativen Häugkeiten bezogen auf Männer und Frauen
gleich sein, oder mindestens sehr nahe beieinander liegen(siehe Gleichung 77).
Geschlecht
Weiblich
Männlich
Summe
Farbe
Blau
Grün
(1000 · 1500) ÷ 2000
(1000 · 150) ÷ 2000
(600 · 1500) ÷ 2000
(1000 · 150) ÷ 2000
1000
600
Rot
(400 · 1500) ÷ 2000
(1000 · 150) ÷ 2000
400
Summe
1500
500
2000
Wenn man nun die Resultate mit einer Tabelle aus, beispielsweise dem Vorjahr, vergleicht, und die
Werte über "Pi-mal-Daumen"passen, sind die Merkmale eher voneinander abhängig.
28
Minimiere die Summenformel
n
X
(yi − a − bxi )2
i
1. Partielles Ableiten des Ausdrucks nach a und nach b
2. Nullsetzen der beiden partiellen Ableitungen
3. Auösen der beiden Gleichungen nach a und b
a1
b1
2.6.2
= y + b1 · x
Pn
i=1 xi yi − n · x · y
Pn
=
2
2
i=1 xi − nx
Lineare Regression
Beispiel 12 Studenten gingen im letzten Semester neben dem Studium einer Erwerbstätigkeit
nach. In der nachstehenden Tabelle sind für die 12 Studenten A bis L der zeitliche Aufwand
(Std/Woche) für die Erwerbstätigkeit X und der zeitzliche Aufwand (Std./Woche) für das Studium
Y angegeben
Student
A
B
C
D
E
F
G
H
I
J
K
L
Erwerbstätigkeit
Studium
1
39
2
37
2
36
3
40
3
36
4
37
5
34
6
36
8
33
12
33
15
32
33
27
Ein Student, der für die Bestreitung seines Lebensunterhalts 6 Stunden pro Woche erwärbstätig
sein muss, will anhand der vorliegenden Daten ermitteln, wieviel Zeit er für sein Studium aufbringen
kann. Die Berechnung erfolgt mit Gleichung 81 und Gleichung 82.
Student
xi
yi
xi yi
x2i
yi2
A
B
C
D
E
F
G
H
I
J
K
L
Summe
1
2
2
3
3
4
5
6
8
12
15
23
84
39
37
36
40
36
37
34
36
33
33
32
27
420
39
74
72
120
108
148
170
216
264
396
480
621
2708
1
4
4
9
9
16
25
36
64
144
225
529
1066
1521
1369
1296
1600
1296
1369
1156
1296
1089
1089
1024
729
14834
Wir können nun mit den oben erwähnten Gleichungen die Werte berechnen.
b1
=
a1
=
=
=
=
=
420
2708−12· 84
12 · 12
2
1066−12·( 84
12 )
116
− 239
−0.49
420
116
12 − (− 239 ) ·
9177
239
38.43
29
84
12
Daraus folgt zu allgemeinen Berechnung
y = 38.43 − 0.49 · x mit y(6) = 35.5h
30
Herunterladen