Inhaltsverzeichnis

Inhaltsverzeichnis
1 Vorbemerkungen
1
2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften
2
3 Wahrscheinlichkeitsaxiome
4
4 Laplace-Experimente
6
5 Hilfsmittel aus der Kombinatorik
7
6 Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen
10
7 Zufallsvariable und Verteilungsfunktion
16
8 Diskrete Zufallsvariablen
18
9 Stetige Zufallsvariable
28
10 Funktionen von einer oder mehreren Zufallsvariablen
39
11 Grenzwertsätze
46
12 Parameterschätzungen und Schätzfunktionen
49
13 Konfidenzintervalle
51
14 Parametertest
57
15 Chi-Quadrat-Tests
63
16 Korrelation und Regression
65
14
Parametertest
Das Ziel von sogenannten Parametertests ist es, zu entscheiden, ob es Gründe gibt, eine Vermutung (Hypothese) über den Wert eines Parameters abzulehnen oder nicht.
14.1 Beispiel
Wir versuchen, Antworten auf Fragen der folgenden Art zu finden.
a) Ist der vorliegende Würfel fair?
b) Ein Lieferant behauptet, nur 3% seiner gelieferten Bauteile seien defekt. Stimmt das?
c) Ein Hersteller behauptet, sein neuentwickeltes Auto verbrauche genauso wenig Benzin, wie das des
Konkurrenten. Stimmt das?
Die Entscheidungen beruhen auf Auswertungen von Stichproben, mit denen man Vermutungen über den
Wert eines Parameters einer Wahrscheinlichkeitsverteilung testet. Da die Auswahl von Stichproben zufällig
geschieht, besteht natürlich die Gefahr eines Irrtums.
14.2 Definition
Unter der Nullhypothese H0 versteht man diejenige Hypothese, deren Wahrheitsgehalt geprüft werden soll.
Zu jeder Nullhypothese gibt es eine Alternativhypothese oder Gegenhypothese H1 . Man spricht auch vom
Testproblem H0 gegen H1 .
14.3 Beispiel (Fortsetzung von Beispiel 14.1)
a) H0 : p = 16 , H1 : p 6= 16 , wobei p die Wahrscheinlichkeit für das Würfeln einer 6 bezeichnet.
b) H0 : p = 0, 03, H1 : p > 0, 03, wobei p die Wahrscheinlichkeit dafür bezeichnet, ob ein Bauteil defekt ist.
c) H0 : µ1 = µ2 , H1 : µ1 > µ2 , wobei µi , i = 1, 2, den Erwartungswert für den zufälligen Benzinverbrauch
je 100 km für den PKW vom Hersteller i bezeichnet.
14.4 Bemerkung
a) Wie man an 2. und 3. sieht, muß die Gegenhypothese nicht die Negation der Hypothese sein. Der
Kunde ist auch zufrieden, wenn weniger als 3% der Bauteile defekt sind.
b) Man nimmt zunächst einmal an, daß H0 richtig ist. Nur bei gewichtigen Gründen wird H0 abgelehnt.
H0 hat das Heimspiel!
Man geht davon aus, daß
• der Würfel fair ist,
• der Lieferant vertragsgemäß arbeitet,
• beide Autos gleichen geringen Spritverbrauch haben.
Die Annahme von H0 bedeutet, daß die Stichprobe keinen Anlaß gibt, H0 abzulehnen.
Vorgehensweise: Aus einer Stichprobe X1 , X2 , . . . , Xn berechnet man eine neue Zufallsvariable T =
T (X1 , X2 , . . . , Xn ), die als Testfunktion bezeichnet wird. Die Entscheidung bei einem konkreten Problem
beruht wieder auf einer konreten Stichprobe x1 , x2 , . . . , xn und dem Wert der daraus berechneten sogenannten Testgröße T = T (x1 , x2 , . . . , xn ).
Mit WT bezeichnen wir den Wertebereich von T . WT wird in zwei disjunkte Teilmengen W0 und W1 aufgeteilt, d. h. WT = W0 ∪ W1 mit W0 ∩ W1 = ∅.
H0 wird angenommen, wenn die Testgröß T = T (x1 , x2 , . . . , xn ) ∈ W0 und abgelehnt, wenn T = T (x1 , x2 , . . . , xn ) ∈
57
W1 . Entsprechend heißen W0 und W1 Annahme- und Ablehnungsbereich.
Da die Entscheidung auf Stichproben beruht, kann die Annahme bzw. die Ablehnung von H0 fehlerhaft sein.
Man unterscheidet zwei verschiedene Fehlertypen. Je nach Wert von T wird H0 angenommen oder abgelehnt.
14.5 Definition
Ein Fehler 1. Art wird begangen, wenn H0 abgelehnt wird, obwohl H0 richtig ist.
Ein Fehler 2. Art wird begangen, wenn H0 angenommen wird, obwohl H0 falsch ist.
Mögliche Testentscheidungen sind also:
Annahme von H0
Ablehnung von H0
H0 richtig richtige Entscheidung Fehler 1. Art
H0 falsch
Fehler 2. Art
richtige Entscheidung
Die Wahrscheinlichkeit α eines Fehlers 1. Art ist somit gleich der bedingten Wahrscheinlichkeit dafür,
daß T ∈ W1 ist, unter der Bedingung, daß H0 richtig ist, d. h.
α = P (Fehler 1. Art) = P (T ∈ W1 |H0 )
Entsprechend ist die Wahrscheinlichkeit β eines Fehlers 2. Art gleich der bedingten Wahrscheinlichkeit dafür,
daß T ∈ W0 ist, unter der Bedingung, daß H0 falsch ist, d. h.
β = P (Fehler 2. Art) = P (T ∈ W0 |H1 )
14.6 Definition
Die Wahrscheinlichkeit α = P (Fehler 1. Art) heißt Signifikanzniveau oder Irrtumswahrscheinlichkeit, 1 − α
Sicherheitswahrscheinlichkeit und 1 − β = 1 − P (Fehler 2. Art) heißt Güte oder Trennschärfe des Tests.
Die Vorgehensweise ist nun so, daß man die Wahrscheinlichkeit α für den Fehler 1. Art vorgibt. β kann dann
nicht willkürlich gewählt werden, sondern hängt von α, dem Stichprobenumfang n und der Parameterkonstellation des Problems ab. Man versucht natürlich β möglichst klein zu halten.
Ein Parametertest besteht nun aus folgenden Schritten.
a) Aufstellen von H0 und H1 ,
b) Wahl der Testfunktion T und Festlegung des Annahme- bzw. Ablehnungsbereiches W0 bzw. W1 unter
Berücksichtigung von α,
c) Berechnung der Testgröße T (x1 , x2 , . . . , xn ) aus einer konkreten Stichprobe x1 , x2 , . . . , xn ,
d) Entscheidung über Annahme bzw. Ablehnung von H0 .
Wir behandeln nun im folgenden Tests für konkrete Parameter.
a) Test über Parameter der Normalverteilung
i) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei bekannter
Varianz
Zu prüfen ist die Hypotese H0 : µ = µ0 gegen H1 : µ 6= µ0 zum Signifikanzniveau α. Die Varianz
σ 2 sei bekannt.
Die zugehörige Testfunktion lautet:
X − µ0 √
T =
n
σ
P
n
mit X = n1 i=1 Xi . T genügt der Standardnormalverteilung.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )- Quantil der Standardnormalverteilung Φ
bezeichnet.
58
14.7 Bemerkung
i. u α2 heißt auch Zufallshöchstwert für die Testfunktion T oder kritischer Wert oder Testschranke.
ii. H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn µ0 außerhalb des Konfidenzintervalls mit Konfidenzniveau 1 − α für den Erwartungswert µ einer normalverteilten
Zufallsvariablen mit bekannter Varianz σ 2 liegt.
14.8 Beispiel
Die Flughöhen von 30 Leuchtraketen wurden gemessen. Das arithmetische Mittel der Meßwerte
betrage x = 47, 9m. Die zufällige Flughöhe X genügt einer N (µ, σ 2 )-Verteilung mit unbekanntem
µ und bekannter Standardabweichung σ = 6m. Die Herstellerangabe für den Sollwert beträgt
µ0 = 50m.
H0 : µ = 50m, H1 : µ 6= 50m
Wir verlangen eine Sicherheitswahrscheinlichkeit
√ von 1 − α = 95%.
Für die Testgröße berechnet man T = 47,9−50
30 ≈ −1, 917.
6
Weiter ist u α2 = u0,025 = q0,975 = 1, 96 d. h. |T | ≤ u α2 .
Somit gibt es keine gewichtigen Gründe, H0 abzulehnen.
Einseitiger Test über den Erwartungswert bei bekannter Varianz
Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ).
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn T < −uα (bzw. wenn T > uα ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw.
größer) als µ0 ist.
14.9 Beispiel (vgl. auch Beispiel 14.8)
Wir ärgern uns nur über zu niedrige Flughöhen, d. h.
H0 : µ = 50m, H1 : µ < 50m, 1 − α = 95%
Es gilt u0,05 = q0,95 = 1, 64. Wie oben ist T ≈ −1, 92 , d.h. T < −u0,05 .
H0 wird also abgelehnt.
ii) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei unbekannter Varianz (t-Test)
Zu prüfen ist die Hypothese H0 : µ = µ0 gegen H1 : µ 6= µ0 mit einer Sicherheitswahrscheinlichkeit
1 − α bei unbekannter Varianz.
Die zugehörige Testfunktion lautet:
Tn−1 =
X − µ0 √
· n
S
Pn
Pn
1
2
mit X = n1 i=1 Xi und S 2 = n−1
i=1 (Xi − X) .
Tn−1 genügt einer t-Verteilung mit n − 1 Freiheitsgraden.
Testentscheidung: Die Nullhypothese H0 wird mit einer Sicherheitswahrscheinlichkeit von 1−α
abgelehnt, wenn |Tn−1 | > tn−1, α2 ist, wobei tn−1, α2 = qn−1,1− α2 das (1 − α2 ) -Quantil der tVerteilung bezeichnet.
14.10 Beispiel
Die Herstellerangabe für die Kapazität C von Kondensatoren betrage 200µF . Wir setzen voraus,
daß die Kapazitäten einer Normalverteilung genügen.
Bei einer Stichprobe wurden folgende Werte gemessen:
208, 185, 219, 198, 208, 190, 179, 234, 181, 204, 200, 208, 192, 224, 212.
H0 : C = 200µF, H1 : C 6= 200µF, 1 − α = 95%
59
x = 202, 8, s ≈ 15, 86, s2 ≈ 251, 6
T14 =
202, 8 − 200 √
15 ≈ 0, 68
15, 86
t14;0,025 = 2, 14 , d.h. |T14 | ≤ t14;0,025 , d. h. es gibt keine gewichtigen Gründe, H0 abzulehnen.
Einseitiger Test über den Erwartungswert bei einer unbekannten Varianz.
Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ).
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Tn−1 <
−tn−1,α (bzw. wenn T > tn−1,α ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw.
größer ) als µ0 ist.
14.11 Beispiel (vgl. Beispiel 14.10)
Die Herstellerangabe sei nun mit C = 190µF angegeben. H0 : C = 190µF, H1 : C > 190µF,
1 − α = 95%
202, 8 − 190 √
15 ≈ 3, 13
15, 86
> t14;0,05 . Also wird H0 zugunsten von H1 abgelehnt.
T14 =
t14;0,05 = 1, 76 , d.h. T14
iii) Test auf Gleichheit der Erwartungswerte zweier unabhängiger normalverteilter Zufallsvariablen
X und Y seien unabhängige normalverteilte Zufallsvariablen mit unbekannten Erwartungswerten
2
µX und µY und gleichen, aber unbekannten Varianzen σX
= σY2 = σ 2 .
Zu prüfen ist H0 : µX = µY gegen H1 : µX 6= µY mit Sicherheitswahrscheinlichkeit 1 − α.
Die zugehörige Testfunktion lautet:
r
X −Y
nX nY
TnX +nY −2 =
,
Sd
nX + nY
PnX
PnX
2
wobei X = n1X i=1
X i , SX
= nX1−1 i=1
(Xi − X)2 , nX -Umfang der Stichprobe für X; Y , SY2 ,
nY entsprechend für Y und
Sd2 =
1
2
[(nX − 1)SX
+ (nY − 1)SY2 ]
nX + nY − 2
Für gleiche Stichprobenumfänge, d. h. nX = nY = n, vereinfacht sich Sd2 zu Sd2 =
und damit die Testfunktion zu
r
√
√
X −Y
X −Y
n2
p
T2(n−1) =
·
2
·
=p 2
· n.
2
2
2
2n
SX + SY
SX + SY
1
2
2 (SX
+ SY2 )
Testentscheidung:Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn |TnX +nY −2 | > tnX +nY −2, α2 , wobei tnX +nY −2, α2 das (1 − α2 )-Quantil der t-Verteilung mit
nX + nY − 2 Freiheitsgraden bezeichnet.
14.12 Beispiel
Der Benzinverbrauch der beiden Automarken Fiasko und Torso wird verglichen.
Tests ergaben folgende Werte:
l
l
Fiasko: 31 Tests, x = 7, 2
, sx = 0, 35
100km
100km
l
l
Torso:
31 Tests, y = 7, 4
, sy = 0, 38
100km
100km
60
Wir gehen von gleicher Varianz aus und prüfen H0 : µx = µy gegen H1 : µx 6= µy , 1 − α = 95%
√
7, 2 − 7, 4
T60 = p
31 ≈ −2, 16
0, 352 + 0, 382
t60;0,025 = q0,975 = 2, |T60 | > t60;0,025 , d. h. H0 wird abgelehnt, gleiche Benzinverbräuche werden
nicht akzeptiert.
Einseitiger Test:
Zu prüfen ist H0 : µX = µY gegen H1 : µX < µY (bzw. H1 : µX > µY ).
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn TnX +nY −2 <
−tnX +nY −2;α (bzw.TnX +nY −2 > tnX +nY −2;α ) ist.
14.13 Beispiel (vgl Beispiel 14.12)
H0 : µx = µy , H1 : µx < µy , 1 − α = 95%, T60 ≈ −2, 16.
t60;0,05 = q60;0,95 = 1, 671 ,d. h. T60 < −t60;0,05 . H0 wird somit abgelehnt, d. h. der Benzinverbrauch von Fiasko wird geringer als der von Torso angesehen.
iv) Test für die unbekannte Varianz einer normalverteilten Zufallsvariablen
X sei eine normalverteilte Zufallsvariable mit unbekannter Varianz σ 2 . Wir beschränken uns auf
einen einseitigen Test.
Zu prüfen ist H0 : σ 2 = σ02 gegen H1 : σ 2 > σ02 mit Sicherheitswahrscheinlichkeit 1 − α.
Die zugehörige Testfunktion lautet:
Zn−1 = (n − 1)
S2
σ02
Pn
1
2
2
mit S 2 = n−1
i=1 (Xi − X) , σ0 -vermuteter Wert der Varianz, n-Umfang der Stichprobe. Zn−1
2
genügt einer χ -Verteilung mit (n − 1) Freiheitsgraden.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Zn−1 > zn−1,α , wobei zn−1,α das (1 − α)-Quantil der χ2 -Verteilung mit (n − 1)
Freiheitsgraden ist.
14.14 Beispiel
In einer Firma werden Schrauben mit bestimmter Länge hergestellt. Aus langjähriger Erfahrung
weiß man: σ0 = 1, 2mm.
Neueste Messungen bei einer Stichprobe vom Umfang n = 25 ergaben s = 1, 5mm. Ist die Abweichung eine zufällige Schwankung oder ist sie signifikant?
H0 : σ 2 = σ02 , H1 : σ 2 > σ02 , Sicherheitswahrscheinlichkeit 99%, d.h. Signifikanzniveau α = 0, 01.
2
z24 = 24 · 1,5
1,22 = 37, 5, z24;0,99 = 42, 98
d. h. z24 ≤ z24;0,99 . Somit wird H0 angenommen, was bedeutet, daß die Abweichung von s2 vom
langjährigen Erfahrungswert als zufallsbedingt angesehen wird.
(Messung von s = 1, 7mm hätten dagegen zur Ablehnung geführt; Überprüfung der Maschinen
erforderlich, etc.)
b) Test über Erfolgswahrscheinlichkeiten
i) Test für unbekannte Erfolgswahrscheinlichkeit p (Parameter p einer Binomialverteilung)
Zu prüfen ist H0 : p = p0 gegen H1 : p 6= p0 mit Sicherheitswahrscheinlichkeit 1 − α.
Im folgenden setzen wir eine umfangreiche Stichprobe voraus.
Dann lautet die zugehörige Testfunktion:
n(P̂ − p0 )
T =p
np0 (1 − p0 )
61
mit P̂ = X
n , X die Anzahl der Erfolge bei n-maliger Durchführung eines Bernoulli-Experimentes.
T ist näherungsweise N (0, 1)-verteilt.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )-Quantil von Φ ist.
Einseitiger Test: Zu prüfen ist H0 : p = p0 gegen H1 : p < p0 (bzw. H1 : p > p0 ) mit Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T < −uα (bzw. T > uα ) ist.
14.15 Beispiel
Der Hersteller eines elektrischen Bauelementes behauptet, daß seine Produktion höchstens 4%
Ausschuß enthält. Der Abnehmer führt eine größere Stichprobe vom Umfang n = 300 durch.
Darunter sind k = 15 defekte Teile. Wir überprüfen die Herstellerangabe mit einer Sicherheitswahrscheinlichkeit von 99%.
H0 : p = 0, 04, H1 : p > 0, 04
15
− 0, 04)
300( 300
T =p
300 · 0, 04(1 − 0, 04)
≈ 0, 8839
u0,01 = q0,99 = 2, 33 , d.h. T ≤ u0,01 , also wird H0 angenommen und die Rechnung ohne Abzüge
bezahlt.
ii) Vergleich zweier Erfolgswahrscheinlichkeiten
X1 und X2 seien unabhängige binomialverteilte Zufallsvariablen mit Erfolgswahrscheinlichkeiten
p1 bzw. p2 . Zu prüfen ist H0 : p1 = p2 gegen H1 : p1 6= p2 , Sicherheitswahrscheinlichkeit 1 − α
Die zugehörige Testfunktion lautet:
P̂1 − P̂2
T =q
P̂ (1 − P̂ )
r
n1 n2
n1 + n2
X2
X1 +X2
1
mit n1 , n2 Stichprobenumfänge, P̂1 = X
n1 , P̂2 = n2 , P̂ = n1 +n2 . Dabei bezeichnet Xi jeweils die
Anzahl der Erfolge.
Bei großen Stichprobenumfängen n1 und n2 ist T näherungsweise N (0, 1)-verteilt.
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2
ist, wobei u α2 das (1 − α2 )-Quantil von Φ ist.
Einseitiger Test: H0 : p1 = p2 gegen H1 : p1 > p2 (bzw. H1 : p1 < p2 ), Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T > uα (bzw. T < −uα ) ist.
14.16 Beispiel (Geschwindigkeitsmessung)
Von 300 PKW in denen Männer am Steuer saßen, waren 60 zu schnell. Von 200 PKW in denen
Frauen am Steuer saßen, waren 8 zu schnell.
p̂1 =
60
= 0, 2
300
p̂2 =
8
= 0, 04
200
p̂ =
60 + 8
= 0, 136
300 + 200
H0 : p1 = p2 , H1 : p1 > p2 , 1 − α = 0, 99
T =p
0, 2 − 0, 04
0, 136(1 − 0, 136)
u0,01 = 2, 32, T > u0,01 , d. h. H0 wird abgelehnt.
62
r
300 · 200
= 5, 11
300 + 200
15
Chi-Quadrat-Tests
Bei Chi-Quadrat-Tests sind die Testfunktionen (näherungsweise) χ2 - verteilt. Anwendungen sind z. B.:
• Test, ob eine bestimmte Verteilungsfunktion vorliegt,
• Test, ob die unbekannte Verteilungsfunktion zu einer bestimmten Klasse von Verteilungsfunktionen
gehört,
• Test auf Unabhängigkeit zweier Zufallsvariablen,
• Test, ob mehrere Zufallsvariablen die gleiche Verteilung besitzen.
Sei F die unbekannte Verteilungsfunktion einer Zufallsvariablen X. Wir behandeln folgende Problemstellungen.
A H 0 : F = F0 ,
H1 : F =
6 F0 mit einer vorgegebenen hypothetischen Verteilungsfunktion F0 .
B H0 : F gehört zu einer Klasse von Verteilungsfunktionen, die durch m (unbekannte) Parameter Θ1 , Θ2 , ..., Θm
festgelegt ist,
H1 : F gehört nicht zu dieser Klasse.
Testdurchführung:
a) Einteilung der Wertemenge der Zufallsvariablen X in r ≥ 2 disjunkte Klassen A1 , A2 , . . . , Ar .
b) Aus einer Stichprobe vom Umfang n berechnet man für i = 1, 2, . . . , r die Klassenhäufigkeiten hi =
h(Ai ) = Anzahl der Stichprobenwerte in der Klasse Ai .
c) Bei Problem B ersetzt man die unbekannten Parameter Θ1 , Θ2 , . . . , Θm durch Schätzungen. Dadurch
erhält man eine hypothetische Verteilung F0 (wie bei Problem A).
d) Für i = 1, . . . , r berechnet man die hypothetischen Klassenwahrscheinlichkeiten pi = P (X ∈ Ai ) für
die Zufallsvariable X mit der Verteilungsfunktion F0 . Dabei muß npi ≥ 5 für mindestens 80% der
Klassen Ai und npi ≥ 1 für alle Klassen gelten. (Sonst in 1. andere Einleitung wählen, z. B. durch
Zusammenlegen von Klassen.)
e) Berechnung der Testgröße
χ2r−m−1 =
r
X
i=1
r
(hi − npi )2
npi
|
{z
}
=
1X 1 2
(h − 2npi hi + n2 p2i )
n i=1 pi i
relative quadratische
Abweichungen der
Häufigkeiten
=
r
r
r
X
X
1 X h2i
−2
hi +n
pi
n i=1 pi
i=1
i=1
| {z }
| {z }
=n
=1
r
=
1 X h2i
−n
n i=1 pi
f) Bestimmung des (1 − α)-Quantils χ2r−m−1;1−α der χ2 -Verteilung mit r − m − 1 Freiheitsgraden, wobei
r die Anzahl der Klassen und m die Anzahl der geschätzten Parameter ist.
g) Testentscheidung: Für χ2r−m−1 > χ2r−m−1;1−α wird H0 abgelehnt.
63
15.1 Bemerkung
Faustregel für die Anzahl der Klassen ist r ≈
√
n.
15.2 Beispiel (Test auf Binomialverteilung)
In einer Großhandlung werden Glühlampen in Viererpackungen verkauft.
H0 : Die Anzahl der defekten Glühlampen pro Packung ist binomialverteilt mit einer unbekannten Wahrscheinlichkeit p. Die Sicherheitswahrscheinlichkeit sei 1 − α = 0, 99. Der Parameter n = 4 ist hier bekannt.
Zufallsvariable X: Anzahl defekter Glühlampen pro Packung,
Wertemenge von X: W = {0, 1, 2, 3, 4}.
a) Klasseneinteilung
W =
4
[
Ai = {0} ∪ {1} ∪ {2} ∪ {3} ∪ {4}
i=0
b) Eine Stichprobe vom Umfang n = 500 ergab folgende Ergebnisse
Klasse Ai
beobachtete
Häufigkeit hi
A0
A1
A2
A3
A4
319
93
51
22
15
c) Schätzung des Parameters p:
p̂ =
Anzahl defekter Glühlampen
321
=
= 0, 1605
Gesamtzahl Glühlampen
2000
d) Damit hypothetische Verteilung:
pi = P (X = i) =
4
· 0, 1605i (1 − 0, 1605)4−i , i = 0, . . . , 4
i
Ergänzung der obigen Tabelle ergibt
Klasse Ai
beobachtete
Häufigkeit hi
erwartete
Häufigkeit 500 · pi
A0
A1
A2
A3
A4
319
93
51
22
15
248,34
189,92
54,46
6,94
0,33
Da 0, 33 < 1 ist, werden die Klassen A3 und A4 zusammengefaßt. Damit ergibt sich:
Klasse Ai
beobachtete
Häufigkeit hi
erwartete
Häufigkeit 500 · pi
A0
A1
A2
Ã3 = A3 ∪ A4
319
93
51
37
248,34
189,92
54,46
7,27
e) Berechnen der Testgröße
χ24−1−1 = ... = 191, 37
f) Quantil χ24−1−1;0,99 = 9, 21
g) Wegen 191, 36 > 9, 21 wird H0 abgelehnt.
64
16
Korrelation und Regression
Wir interessieren uns für folgende Fragestellungen.
Sind zwei Zufallsvariablen voneinander abhängig und kann man diese Abhängigkeit gegebenenfalls durch
eine geeignete Kenngröße quantifizieren? (Korrelationsrechnung)
Kann man eine funktionelle Abhängigkeit zwischen zwei Zufallsvariablen (näherungsweise) berechnen?(Regressionsrechn
16.1 Beispiel
Es sei X der zufällige Durchmesser einer Schweißstelle (leicht zu messen) und Y die zufällige Schubfestigkeit
einer Schweißstelle (wird bei Messungen zerstört).
Messungen ergaben folgende Werte
x[mm]
1,2
1,8
3,2
3,8
5,4
6,6
8,6
9,1
9,4
10,9
y[M P a] 2,48 5,45 8,27 11,03 13,654 17,58 21,37 24,13 27,03 27,3
Der Graph legt die Vermutung nahe, daß näherungsweise ein linearer Zusammenhang zwischen X und Y
besteht. Bei einem deterministischen Experiment (bei dem der Zufall keine Rolle spielt), würde das heißen:
y = ax + b.
Hier ist es etwas komplizierter: Wenn X den Wert x annimmt, nimmt Y im Mittel den Wert ax + b an,
die Einzelbeobachtungen schwanken dagegen um den Wert ax + b. Dies soll im folgenden genauer analysiert
werden.
16.2 Definition (Kovarianz)
Unter der Kovarianz zweier Zufallsvariablen X und Y versteht man
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] .
Für σX 6= 0 und σY 6= 0 ist der Korrelationskoeffizient von X und Y definiert durch
ρ(X, Y ) =
Cov(X, Y )
,
σX σ Y
wobei σX und σY die Standardabweichungen von X und Y bezeichnen.
16.3 Bemerkung
a) Unter Benutzung der Regel E(X + Y ) = E(X) + E(Y ) kann man zeigen:
Cov(X, Y ) = E(XY ) − E(X) · E(Y ) .
b) Mit 1. folgt
Cov(X, X) = E(X 2 ) − (E(X))2 = Var(X) .
c) X, Y unabhängig ⇒ Cov(X, Y ) = 0, da für unabhängige Zufallsvariablen E(XY ) = E(X) · E(Y ) gilt.
16.4 Satz
a) X, Y unabhängig ⇒ ρ(X, Y ) = 0
b) ρ(X, Y ) = 1 ⇔ Es existieren a, b mit Y = aX + b, a > 0
c) ρ(X, Y ) = −1 ⇔ Es existieren a, b mit Y = aX + b, a < 0
65
denn:
1. gilt nach 3. in Bemerkung 16.3 und der defn von ρ(X, Y ).
zu 2. und 3. ⇐
Sei Y = aX + b. Dann ist E(Y ) = aE(X) + b und V ar(Y ) = a2 V ar(X).
Somit
(
)
X − E(X) a(X − E(X))
ρ(X, Y ) = E p
· p
V ar(X)
a2 V ar(X)
(X − E(X))2
a
E
=
|a|
V ar(X)
a
1
=
·
· E(X − E(X))2
{z
}
|a| V ar(X) |
=V ar(X)
a
=
|a|
+1, falls a > 0
=
−1, falls a < 0
16.5 Bemerkung
1. in Satz 16.4 bedeutet, daß unabhängige Zufallsvariablen stets unkorreliert sind. Die Umkehrung gilt
nicht, wie das folgende Beispiel zeigt! Sind zwei Zufallsvariablen unkorreliert, so bedeutet dies nur, daß
keine lineare Abhängigkeit besteht.
16.6 Beispiel
Die Zufallsvariablen X und Y besitzen folgende gemeinsame Verteilung:
X\Y
−1
0
1
qj
−1
0
0
1
4
1
4
0
1
4
1
2
0
1
4
1
0
1
4
0
pi
1
4
1
2
1
4
1
4
Es gilt:
E(X) = 0 = E(Y ) ,
E(X · Y ) = 0
Also:
Cov(X, Y ) = ρ(X, Y ) = 0
Es gilt aber z. B.:
P (X = 1, Y = 0) =
P (X = 1) · P (Y = 0) =
1
4
1 1
1
· =
4 2
8
Somit sind X und Y zwar unkorreliert, aber nicht unabhängig. ρ(X, Y ) = 0 heißt nur, daß keine lineare
Abhängigkeit besteht. Die Abhängigkeit zwischen X und Y ist hier nichtlinear.
16.7 Definition (Schätzfunktion für ρ(X, Y ))
Sind (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) jeweils Paare von Zufallsvariablen, dann schätzt man Cov(X, Y ) durch
n
SX,Y =
1 X
(Xi − X)(Yi − Y ) .
n − 1 i=1
66
Schätzt man die jeweiligen Standardabweichungen durch
v
v
u
u
n
n
u 1 X
u 1 X
2
t
SX =
(Xi − X) und SY = t
(Yi − Y )2 ,
n − 1 i=1
n − 1 i=1
so ist
SX,Y
SX · SY
eine Schätzfunktion für den Korrelationskoeffizienten.
r=
16.8 Bemerkung
a) Für Beispiel 16.1 gilt: r = 0, 9924.
b) Für eine Berechnung von SX,Y , SX , SY in der in defn 16.7 angegebenen Form müßte man zunächst die
Mittelwerte X, Y berechnen. Eine Alternative für praktische Rechnungen ergibt sich aus den folgenden
Umformungen.
n
SX,Y
=
=
1 X
(Xi Yi − XYi − Y Xi + X Y )
n − 1 i=1

X

n
n
n
X
X

1 

Xi Yi − X
Yi −Y
Xi +nX Y 

n−1

 i=1
i=1
i=1
| {z }
| {z }
=nY
=
bzw.
SX
v
u
u
=t

n
X
1
n−1
Xi Yi − nX Y
=nX
!
i=1
n
1 X 2
2
(
X − nX ) ,
n − 1 i=1 i
v
u
u
SY = t
n
1 X 2
2
(
Y − nY )
n − 1 i=1 i
Wir beschäftigen uns im folgenden mit der sogenannten Methode der kleinsten Fehlerquadrate.
Es wird diejenige Gerade gesucht, die die durch die Stichprobe gegebene Punktwolke in einem festzulegenden Sinne bestmöglich approximiert. Man sucht diejenige Gerade, sogenannte Ausgleichsgerade, bei der
die Summe der zu den Stichprobenpunkten in y-Richtung quadrierten Abstände möglichst klein wird.
Auf der Grundlage einer konkreten Stichprobe {(x1 , y1 ), . . . , (xn , yn )} soll eine Geradengleichung ŷ =
a1 x + a0 angegeben werden, so daß (mit der Bezeichnung ŷi = ŷ(xi ))
n
X
(yi − ŷi )2 =
i=1
n
X
(yi − a1 xi − a0 )2
i=1
möglichst klein wird.
Wir suchen also das Minimum der Funktion
g(a0 , a1 ) =
n
X
(yi − a1 xi − a0 )2 .
i=1
Notwendige Bedingungen für ein Minimum sind:
∂g
(a0 , a1 )
∂a0
= −2
∂g
(a0 , a1 )
∂a1
= −2
n
X
(yi − a1 xi − a0 ) = 0
i=1
n
X
i=1
67
xi (yi − a1 xi − a0 ) = 0
In Matrix- Vektorschreibweise bedeutet dies
Pn
Pn
n
a0
yi
i=1 xi
i=1
P
P
P
=
n
n
n
2
a1
i=1 xi
i=1 xi
i=1 xi yi
Als Lösung des linearen Gleichungssystems erhält man mit Hilfe der Cramerschen Regel
=ny
=nx
a1
z }| { z }| {
n
n
X
X
Pn
n i=1 xi yi − (
xi )(
yi )
i=1
=
i=1
n
X
Pn
2
n i=1 xi − (
xi )2
i=1
| {z }
=(nx)2
=(n−1)sx,y
z
n
X
}|
{
xi yi − nxy
n i=1
· n
n X
x2i − nx2
=
i=1
|
{z
=(n−1)s2x
sx,y
s2x
sy
= r·
sx
}
=
a0
=
=
Pn
i=1
y
yi
Pn
Pn
2
i=1 xi
Pn
Pn
x2i − i=1 xi yi i=1 xi
n(n − 1)Sx2
|
{z
}
i=1
(Nenner wie oben)
Pn
− x i=1 xi yi +
(n − 1)s2x
=(n−1)s2x
nx2 y − nx2 y
=(n−1)sx,y
z
z
}|
{
}|
{
n
n
X
X
y(
x2i − nx2 ) −x (
xi yi − nxy)
=
i=1
i=1
(n − 1)s2x
sx,y
s2x
sy
= y−x·r·
sx
= y−x·
16.9 Beispiel
Für das Beispiel 16.1 erhält man
a0 = 0, 199 und a1 = 2, 6
d. h. ŷ = 0, 199 + 2, 6x als Ausgleichsgerade.
16.10 Bemerkung
Vermutet man allgemein eher eine polynomiale Abhängigkeit, so versucht man z. B. eine quadratische,
68
kubische Ausgleichsparabel, etc. zu finden. Man sucht also ein Minimum von
g(a0 , ..., am ) =
n
X
(yi − pm (xi ))2 ,
i=1
wobei
pm (x) =
m
X
ak xk
k=0
mit m ≤ n (in der Regel m << n).
Geht man wie oben vor (Nullsetzen der partiellen Ableitungen), so führt dies auf das lineare Gleichungssystem
(sogenanntes System der Normalgleichungen)
P
P 2
P m 

  P

n
xi . . .
xi
a0
yi
P
P x2i
P

  a1  
xi
xi
...


  P xi yi 

 ..
  ..
 
x2i yi 
 .
 .
=



  .

 ..
 .
  .

.
.
 .
 .

P m
P m P m+1
P 2m
x
y
i i
am
xi
xi
...
...
xi
Die Lösung liefert die gesuchten Koeffizienten a0 , a1 , ..., am .
16.11 Beispiel
Untersuchung des Zusammenhangs zwischen Bremsweg w(in m) und Geschwindigkeit v (in km/h) eines
bestimmten Autotyps.
i
1
2
3
4
5
Messungen: vi 40 70 100 130 150
wi 14 39 78 120 153
Ansatz: w = a2 v 2 + a1 v + a0
Nach Berechnung der erforderlichen Summen erhalten wir das System der Normalgleichungen:
 



5
490
55900
a0
404
 490
55900
6979000   a1  =  49640 
6464000
55900 697900 918430000
a2
Lösung:
a0 = −11, 23 a1 = 0, 437217 a2 = 0, 004399
d. h. die Ausgleichsparabel
ŵ = 0, 004399 · v 2 + 0, 437217 · v − 11, 23
16.12 Beispiel (Exponentielles Verhalten)
Folgende Daten seien beobachtet worden:
xi
1
2
3
4
yi 2,5 3,9 7,8 15,0
Man vermutet, daß näherungsweise ein Zusammenhang der Form
ŷ = a · 2bx
besteht. Logarithmiert man diesen Ansatz, so erhält man:
ln ŷ = ln (a · 2bx ) = ln a + b · x · ln 2 = a0 + a1 x
mit
a0 = ln a ,
a1 = b · ln 2 ,
69
d. h. wir vermuten einen linearen Zusammenhang zwischen x und ln ŷ = ẑ.
Zugehörige Tabelle:
1
2
3
4
xi
zi = ln yi 0,92 1,4 2,1 2,7
und erhalten die Ausgleichsgerade
ẑ = 0, 24 + 0, 61x .
Für ŷ bedeutet das mit a = ea0 = 1, 27 und b =
a1
ln 2
= 0, 88
ŷ = eẑ = 1, 27 · 20,88·x = 1, 27 · 1, 84x
16.13 Bemerkung
Durch entsprechende Ansätze kann man auch andere nichtlineare Ausgleichsprobleme analog zu 16.12 behandeln. Vergleiche zum Beispiel Tabelle 4 in Papula, Band 3, Seite 716.
70