Inhaltsverzeichnis

Werbung
Inhaltsverzeichnis
1 Vorbemerkungen
1
2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften
2
3 Wahrscheinlichkeitsaxiome
4
4 Laplace-Experimente
6
5 Hilfsmittel aus der Kombinatorik
7
6 Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen
10
7 Zufallsvariable und Verteilungsfunktion
16
8 Diskrete Zufallsvariablen
18
9 Stetige Zufallsvariable
28
10 Funktionen von einer oder mehreren Zufallsvariablen
39
11 Grenzwertsätze
46
12 Parameterschätzungen und Schätzfunktionen
49
13 Konfidenzintervalle
51
14 Parametertest
57
15 Chi-Quadrat-Tests
63
16 Korrelation und Regression
65
14
Parametertest
Das Ziel von sogenannten Parametertests ist es, zu entscheiden, ob es Gründe gibt, eine Vermutung (Hypothese) über den Wert eines Parameters abzulehnen oder nicht.
14.1 Beispiel
Wir versuchen, Antworten auf Fragen der folgenden Art zu finden.
a) Ist der vorliegende Würfel fair?
b) Ein Lieferant behauptet, nur 3% seiner gelieferten Bauteile seien defekt. Stimmt das?
c) Ein Hersteller behauptet, sein neuentwickeltes Auto verbrauche genauso wenig Benzin, wie das des
Konkurrenten. Stimmt das?
Die Entscheidungen beruhen auf Auswertungen von Stichproben, mit denen man Vermutungen über den
Wert eines Parameters einer Wahrscheinlichkeitsverteilung testet. Da die Auswahl von Stichproben zufällig
geschieht, besteht natürlich die Gefahr eines Irrtums.
14.2 Definition
Unter der Nullhypothese H0 versteht man diejenige Hypothese, deren Wahrheitsgehalt geprüft werden soll.
Zu jeder Nullhypothese gibt es eine Alternativhypothese oder Gegenhypothese H1 . Man spricht auch vom
Testproblem H0 gegen H1 .
14.3 Beispiel (Fortsetzung von Beispiel 14.1)
a) H0 : p = 16 , H1 : p 6= 16 , wobei p die Wahrscheinlichkeit für das Würfeln einer 6 bezeichnet.
b) H0 : p = 0, 03, H1 : p > 0, 03, wobei p die Wahrscheinlichkeit dafür bezeichnet, ob ein Bauteil defekt ist.
c) H0 : µ1 = µ2 , H1 : µ1 > µ2 , wobei µi , i = 1, 2, den Erwartungswert für den zufälligen Benzinverbrauch
je 100 km für den PKW vom Hersteller i bezeichnet.
14.4 Bemerkung
a) Wie man an 2. und 3. sieht, muß die Gegenhypothese nicht die Negation der Hypothese sein. Der
Kunde ist auch zufrieden, wenn weniger als 3% der Bauteile defekt sind.
b) Man nimmt zunächst einmal an, daß H0 richtig ist. Nur bei gewichtigen Gründen wird H0 abgelehnt.
H0 hat das Heimspiel!
Man geht davon aus, daß
• der Würfel fair ist,
• der Lieferant vertragsgemäß arbeitet,
• beide Autos gleichen geringen Spritverbrauch haben.
Die Annahme von H0 bedeutet, daß die Stichprobe keinen Anlaß gibt, H0 abzulehnen.
Vorgehensweise: Aus einer Stichprobe X1 , X2 , . . . , Xn berechnet man eine neue Zufallsvariable T =
T (X1 , X2 , . . . , Xn ), die als Testfunktion bezeichnet wird. Die Entscheidung bei einem konkreten Problem
beruht wieder auf einer konreten Stichprobe x1 , x2 , . . . , xn und dem Wert der daraus berechneten sogenannten Testgröße T = T (x1 , x2 , . . . , xn ).
Mit WT bezeichnen wir den Wertebereich von T . WT wird in zwei disjunkte Teilmengen W0 und W1 aufgeteilt, d. h. WT = W0 ∪ W1 mit W0 ∩ W1 = ∅.
H0 wird angenommen, wenn die Testgröß T = T (x1 , x2 , . . . , xn ) ∈ W0 und abgelehnt, wenn T = T (x1 , x2 , . . . , xn ) ∈
57
W1 . Entsprechend heißen W0 und W1 Annahme- und Ablehnungsbereich.
Da die Entscheidung auf Stichproben beruht, kann die Annahme bzw. die Ablehnung von H0 fehlerhaft sein.
Man unterscheidet zwei verschiedene Fehlertypen. Je nach Wert von T wird H0 angenommen oder abgelehnt.
14.5 Definition
Ein Fehler 1. Art wird begangen, wenn H0 abgelehnt wird, obwohl H0 richtig ist.
Ein Fehler 2. Art wird begangen, wenn H0 angenommen wird, obwohl H0 falsch ist.
Mögliche Testentscheidungen sind also:
Annahme von H0
Ablehnung von H0
H0 richtig richtige Entscheidung Fehler 1. Art
H0 falsch
Fehler 2. Art
richtige Entscheidung
Die Wahrscheinlichkeit α eines Fehlers 1. Art ist somit gleich der bedingten Wahrscheinlichkeit dafür,
daß T ∈ W1 ist, unter der Bedingung, daß H0 richtig ist, d. h.
α = P (Fehler 1. Art) = P (T ∈ W1 |H0 )
Entsprechend ist die Wahrscheinlichkeit β eines Fehlers 2. Art gleich der bedingten Wahrscheinlichkeit dafür,
daß T ∈ W0 ist, unter der Bedingung, daß H0 falsch ist, d. h.
β = P (Fehler 2. Art) = P (T ∈ W0 |H1 )
14.6 Definition
Die Wahrscheinlichkeit α = P (Fehler 1. Art) heißt Signifikanzniveau oder Irrtumswahrscheinlichkeit, 1 − α
Sicherheitswahrscheinlichkeit und 1 − β = 1 − P (Fehler 2. Art) heißt Güte oder Trennschärfe des Tests.
Die Vorgehensweise ist nun so, daß man die Wahrscheinlichkeit α für den Fehler 1. Art vorgibt. β kann dann
nicht willkürlich gewählt werden, sondern hängt von α, dem Stichprobenumfang n und der Parameterkonstellation des Problems ab. Man versucht natürlich β möglichst klein zu halten.
Ein Parametertest besteht nun aus folgenden Schritten.
a) Aufstellen von H0 und H1 ,
b) Wahl der Testfunktion T und Festlegung des Annahme- bzw. Ablehnungsbereiches W0 bzw. W1 unter
Berücksichtigung von α,
c) Berechnung der Testgröße T (x1 , x2 , . . . , xn ) aus einer konkreten Stichprobe x1 , x2 , . . . , xn ,
d) Entscheidung über Annahme bzw. Ablehnung von H0 .
Wir behandeln nun im folgenden Tests für konkrete Parameter.
a) Test über Parameter der Normalverteilung
i) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei bekannter
Varianz
Zu prüfen ist die Hypotese H0 : µ = µ0 gegen H1 : µ 6= µ0 zum Signifikanzniveau α. Die Varianz
σ 2 sei bekannt.
Die zugehörige Testfunktion lautet:
X − µ0 √
T =
n
σ
P
n
mit X = n1 i=1 Xi . T genügt der Standardnormalverteilung.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )- Quantil der Standardnormalverteilung Φ
bezeichnet.
58
14.7 Bemerkung
i. u α2 heißt auch Zufallshöchstwert für die Testfunktion T oder kritischer Wert oder Testschranke.
ii. H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn µ0 außerhalb des Konfidenzintervalls mit Konfidenzniveau 1 − α für den Erwartungswert µ einer normalverteilten
Zufallsvariablen mit bekannter Varianz σ 2 liegt.
14.8 Beispiel
Die Flughöhen von 30 Leuchtraketen wurden gemessen. Das arithmetische Mittel der Meßwerte
betrage x = 47, 9m. Die zufällige Flughöhe X genügt einer N (µ, σ 2 )-Verteilung mit unbekanntem
µ und bekannter Standardabweichung σ = 6m. Die Herstellerangabe für den Sollwert beträgt
µ0 = 50m.
H0 : µ = 50m, H1 : µ 6= 50m
Wir verlangen eine Sicherheitswahrscheinlichkeit
√ von 1 − α = 95%.
Für die Testgröße berechnet man T = 47,9−50
30 ≈ −1, 917.
6
Weiter ist u α2 = u0,025 = q0,975 = 1, 96 d. h. |T | ≤ u α2 .
Somit gibt es keine gewichtigen Gründe, H0 abzulehnen.
Einseitiger Test über den Erwartungswert bei bekannter Varianz
Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ).
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn T < −uα (bzw. wenn T > uα ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw.
größer) als µ0 ist.
14.9 Beispiel (vgl. auch Beispiel 14.8)
Wir ärgern uns nur über zu niedrige Flughöhen, d. h.
H0 : µ = 50m, H1 : µ < 50m, 1 − α = 95%
Es gilt u0,05 = q0,95 = 1, 64. Wie oben ist T ≈ −1, 92 , d.h. T < −u0,05 .
H0 wird also abgelehnt.
ii) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei unbekannter Varianz (t-Test)
Zu prüfen ist die Hypothese H0 : µ = µ0 gegen H1 : µ 6= µ0 mit einer Sicherheitswahrscheinlichkeit
1 − α bei unbekannter Varianz.
Die zugehörige Testfunktion lautet:
Tn−1 =
X − µ0 √
· n
S
Pn
Pn
1
2
mit X = n1 i=1 Xi und S 2 = n−1
i=1 (Xi − X) .
Tn−1 genügt einer t-Verteilung mit n − 1 Freiheitsgraden.
Testentscheidung: Die Nullhypothese H0 wird mit einer Sicherheitswahrscheinlichkeit von 1−α
abgelehnt, wenn |Tn−1 | > tn−1, α2 ist, wobei tn−1, α2 = qn−1,1− α2 das (1 − α2 ) -Quantil der tVerteilung bezeichnet.
14.10 Beispiel
Die Herstellerangabe für die Kapazität C von Kondensatoren betrage 200µF . Wir setzen voraus,
daß die Kapazitäten einer Normalverteilung genügen.
Bei einer Stichprobe wurden folgende Werte gemessen:
208, 185, 219, 198, 208, 190, 179, 234, 181, 204, 200, 208, 192, 224, 212.
H0 : C = 200µF, H1 : C 6= 200µF, 1 − α = 95%
59
x = 202, 8, s ≈ 15, 86, s2 ≈ 251, 6
T14 =
202, 8 − 200 √
15 ≈ 0, 68
15, 86
t14;0,025 = 2, 14 , d.h. |T14 | ≤ t14;0,025 , d. h. es gibt keine gewichtigen Gründe, H0 abzulehnen.
Einseitiger Test über den Erwartungswert bei einer unbekannten Varianz.
Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ).
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Tn−1 <
−tn−1,α (bzw. wenn T > tn−1,α ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw.
größer ) als µ0 ist.
14.11 Beispiel (vgl. Beispiel 14.10)
Die Herstellerangabe sei nun mit C = 190µF angegeben. H0 : C = 190µF, H1 : C > 190µF,
1 − α = 95%
202, 8 − 190 √
15 ≈ 3, 13
15, 86
> t14;0,05 . Also wird H0 zugunsten von H1 abgelehnt.
T14 =
t14;0,05 = 1, 76 , d.h. T14
iii) Test auf Gleichheit der Erwartungswerte zweier unabhängiger normalverteilter Zufallsvariablen
X und Y seien unabhängige normalverteilte Zufallsvariablen mit unbekannten Erwartungswerten
2
µX und µY und gleichen, aber unbekannten Varianzen σX
= σY2 = σ 2 .
Zu prüfen ist H0 : µX = µY gegen H1 : µX 6= µY mit Sicherheitswahrscheinlichkeit 1 − α.
Die zugehörige Testfunktion lautet:
r
X −Y
nX nY
TnX +nY −2 =
,
Sd
nX + nY
PnX
PnX
2
wobei X = n1X i=1
X i , SX
= nX1−1 i=1
(Xi − X)2 , nX -Umfang der Stichprobe für X; Y , SY2 ,
nY entsprechend für Y und
Sd2 =
1
2
[(nX − 1)SX
+ (nY − 1)SY2 ]
nX + nY − 2
Für gleiche Stichprobenumfänge, d. h. nX = nY = n, vereinfacht sich Sd2 zu Sd2 =
und damit die Testfunktion zu
r
√
√
X −Y
X −Y
n2
p
T2(n−1) =
·
2
·
=p 2
· n.
2
2
2
2n
SX + SY
SX + SY
1
2
2 (SX
+ SY2 )
Testentscheidung:Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt,
wenn |TnX +nY −2 | > tnX +nY −2, α2 , wobei tnX +nY −2, α2 das (1 − α2 )-Quantil der t-Verteilung mit
nX + nY − 2 Freiheitsgraden bezeichnet.
14.12 Beispiel
Der Benzinverbrauch der beiden Automarken Fiasko und Torso wird verglichen.
Tests ergaben folgende Werte:
l
l
Fiasko: 31 Tests, x = 7, 2
, sx = 0, 35
100km
100km
l
l
Torso:
31 Tests, y = 7, 4
, sy = 0, 38
100km
100km
60
Wir gehen von gleicher Varianz aus und prüfen H0 : µx = µy gegen H1 : µx 6= µy , 1 − α = 95%
√
7, 2 − 7, 4
T60 = p
31 ≈ −2, 16
0, 352 + 0, 382
t60;0,025 = q0,975 = 2, |T60 | > t60;0,025 , d. h. H0 wird abgelehnt, gleiche Benzinverbräuche werden
nicht akzeptiert.
Einseitiger Test:
Zu prüfen ist H0 : µX = µY gegen H1 : µX < µY (bzw. H1 : µX > µY ).
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn TnX +nY −2 <
−tnX +nY −2;α (bzw.TnX +nY −2 > tnX +nY −2;α ) ist.
14.13 Beispiel (vgl Beispiel 14.12)
H0 : µx = µy , H1 : µx < µy , 1 − α = 95%, T60 ≈ −2, 16.
t60;0,05 = q60;0,95 = 1, 671 ,d. h. T60 < −t60;0,05 . H0 wird somit abgelehnt, d. h. der Benzinverbrauch von Fiasko wird geringer als der von Torso angesehen.
iv) Test für die unbekannte Varianz einer normalverteilten Zufallsvariablen
X sei eine normalverteilte Zufallsvariable mit unbekannter Varianz σ 2 . Wir beschränken uns auf
einen einseitigen Test.
Zu prüfen ist H0 : σ 2 = σ02 gegen H1 : σ 2 > σ02 mit Sicherheitswahrscheinlichkeit 1 − α.
Die zugehörige Testfunktion lautet:
Zn−1 = (n − 1)
S2
σ02
Pn
1
2
2
mit S 2 = n−1
i=1 (Xi − X) , σ0 -vermuteter Wert der Varianz, n-Umfang der Stichprobe. Zn−1
2
genügt einer χ -Verteilung mit (n − 1) Freiheitsgraden.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Zn−1 > zn−1,α , wobei zn−1,α das (1 − α)-Quantil der χ2 -Verteilung mit (n − 1)
Freiheitsgraden ist.
14.14 Beispiel
In einer Firma werden Schrauben mit bestimmter Länge hergestellt. Aus langjähriger Erfahrung
weiß man: σ0 = 1, 2mm.
Neueste Messungen bei einer Stichprobe vom Umfang n = 25 ergaben s = 1, 5mm. Ist die Abweichung eine zufällige Schwankung oder ist sie signifikant?
H0 : σ 2 = σ02 , H1 : σ 2 > σ02 , Sicherheitswahrscheinlichkeit 99%, d.h. Signifikanzniveau α = 0, 01.
2
z24 = 24 · 1,5
1,22 = 37, 5, z24;0,99 = 42, 98
d. h. z24 ≤ z24;0,99 . Somit wird H0 angenommen, was bedeutet, daß die Abweichung von s2 vom
langjährigen Erfahrungswert als zufallsbedingt angesehen wird.
(Messung von s = 1, 7mm hätten dagegen zur Ablehnung geführt; Überprüfung der Maschinen
erforderlich, etc.)
b) Test über Erfolgswahrscheinlichkeiten
i) Test für unbekannte Erfolgswahrscheinlichkeit p (Parameter p einer Binomialverteilung)
Zu prüfen ist H0 : p = p0 gegen H1 : p 6= p0 mit Sicherheitswahrscheinlichkeit 1 − α.
Im folgenden setzen wir eine umfangreiche Stichprobe voraus.
Dann lautet die zugehörige Testfunktion:
n(P̂ − p0 )
T =p
np0 (1 − p0 )
61
mit P̂ = X
n , X die Anzahl der Erfolge bei n-maliger Durchführung eines Bernoulli-Experimentes.
T ist näherungsweise N (0, 1)-verteilt.
Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )-Quantil von Φ ist.
Einseitiger Test: Zu prüfen ist H0 : p = p0 gegen H1 : p < p0 (bzw. H1 : p > p0 ) mit Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T < −uα (bzw. T > uα ) ist.
14.15 Beispiel
Der Hersteller eines elektrischen Bauelementes behauptet, daß seine Produktion höchstens 4%
Ausschuß enthält. Der Abnehmer führt eine größere Stichprobe vom Umfang n = 300 durch.
Darunter sind k = 15 defekte Teile. Wir überprüfen die Herstellerangabe mit einer Sicherheitswahrscheinlichkeit von 99%.
H0 : p = 0, 04, H1 : p > 0, 04
15
− 0, 04)
300( 300
T =p
300 · 0, 04(1 − 0, 04)
≈ 0, 8839
u0,01 = q0,99 = 2, 33 , d.h. T ≤ u0,01 , also wird H0 angenommen und die Rechnung ohne Abzüge
bezahlt.
ii) Vergleich zweier Erfolgswahrscheinlichkeiten
X1 und X2 seien unabhängige binomialverteilte Zufallsvariablen mit Erfolgswahrscheinlichkeiten
p1 bzw. p2 . Zu prüfen ist H0 : p1 = p2 gegen H1 : p1 6= p2 , Sicherheitswahrscheinlichkeit 1 − α
Die zugehörige Testfunktion lautet:
P̂1 − P̂2
T =q
P̂ (1 − P̂ )
r
n1 n2
n1 + n2
X2
X1 +X2
1
mit n1 , n2 Stichprobenumfänge, P̂1 = X
n1 , P̂2 = n2 , P̂ = n1 +n2 . Dabei bezeichnet Xi jeweils die
Anzahl der Erfolge.
Bei großen Stichprobenumfängen n1 und n2 ist T näherungsweise N (0, 1)-verteilt.
Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2
ist, wobei u α2 das (1 − α2 )-Quantil von Φ ist.
Einseitiger Test: H0 : p1 = p2 gegen H1 : p1 > p2 (bzw. H1 : p1 < p2 ), Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T > uα (bzw. T < −uα ) ist.
14.16 Beispiel (Geschwindigkeitsmessung)
Von 300 PKW in denen Männer am Steuer saßen, waren 60 zu schnell. Von 200 PKW in denen
Frauen am Steuer saßen, waren 8 zu schnell.
p̂1 =
60
= 0, 2
300
p̂2 =
8
= 0, 04
200
p̂ =
60 + 8
= 0, 136
300 + 200
H0 : p1 = p2 , H1 : p1 > p2 , 1 − α = 0, 99
T =p
0, 2 − 0, 04
0, 136(1 − 0, 136)
u0,01 = 2, 32, T > u0,01 , d. h. H0 wird abgelehnt.
62
r
300 · 200
= 5, 11
300 + 200
15
Chi-Quadrat-Tests
Bei Chi-Quadrat-Tests sind die Testfunktionen (näherungsweise) χ2 - verteilt. Anwendungen sind z. B.:
• Test, ob eine bestimmte Verteilungsfunktion vorliegt,
• Test, ob die unbekannte Verteilungsfunktion zu einer bestimmten Klasse von Verteilungsfunktionen
gehört,
• Test auf Unabhängigkeit zweier Zufallsvariablen,
• Test, ob mehrere Zufallsvariablen die gleiche Verteilung besitzen.
Sei F die unbekannte Verteilungsfunktion einer Zufallsvariablen X. Wir behandeln folgende Problemstellungen.
A H 0 : F = F0 ,
H1 : F =
6 F0 mit einer vorgegebenen hypothetischen Verteilungsfunktion F0 .
B H0 : F gehört zu einer Klasse von Verteilungsfunktionen, die durch m (unbekannte) Parameter Θ1 , Θ2 , ..., Θm
festgelegt ist,
H1 : F gehört nicht zu dieser Klasse.
Testdurchführung:
a) Einteilung der Wertemenge der Zufallsvariablen X in r ≥ 2 disjunkte Klassen A1 , A2 , . . . , Ar .
b) Aus einer Stichprobe vom Umfang n berechnet man für i = 1, 2, . . . , r die Klassenhäufigkeiten hi =
h(Ai ) = Anzahl der Stichprobenwerte in der Klasse Ai .
c) Bei Problem B ersetzt man die unbekannten Parameter Θ1 , Θ2 , . . . , Θm durch Schätzungen. Dadurch
erhält man eine hypothetische Verteilung F0 (wie bei Problem A).
d) Für i = 1, . . . , r berechnet man die hypothetischen Klassenwahrscheinlichkeiten pi = P (X ∈ Ai ) für
die Zufallsvariable X mit der Verteilungsfunktion F0 . Dabei muß npi ≥ 5 für mindestens 80% der
Klassen Ai und npi ≥ 1 für alle Klassen gelten. (Sonst in 1. andere Einleitung wählen, z. B. durch
Zusammenlegen von Klassen.)
e) Berechnung der Testgröße
χ2r−m−1 =
r
X
i=1
r
(hi − npi )2
npi
|
{z
}
=
1X 1 2
(h − 2npi hi + n2 p2i )
n i=1 pi i
relative quadratische
Abweichungen der
Häufigkeiten
=
r
r
r
X
X
1 X h2i
−2
hi +n
pi
n i=1 pi
i=1
i=1
| {z }
| {z }
=n
=1
r
=
1 X h2i
−n
n i=1 pi
f) Bestimmung des (1 − α)-Quantils χ2r−m−1;1−α der χ2 -Verteilung mit r − m − 1 Freiheitsgraden, wobei
r die Anzahl der Klassen und m die Anzahl der geschätzten Parameter ist.
g) Testentscheidung: Für χ2r−m−1 > χ2r−m−1;1−α wird H0 abgelehnt.
63
15.1 Bemerkung
Faustregel für die Anzahl der Klassen ist r ≈
√
n.
15.2 Beispiel (Test auf Binomialverteilung)
In einer Großhandlung werden Glühlampen in Viererpackungen verkauft.
H0 : Die Anzahl der defekten Glühlampen pro Packung ist binomialverteilt mit einer unbekannten Wahrscheinlichkeit p. Die Sicherheitswahrscheinlichkeit sei 1 − α = 0, 99. Der Parameter n = 4 ist hier bekannt.
Zufallsvariable X: Anzahl defekter Glühlampen pro Packung,
Wertemenge von X: W = {0, 1, 2, 3, 4}.
a) Klasseneinteilung
W =
4
[
Ai = {0} ∪ {1} ∪ {2} ∪ {3} ∪ {4}
i=0
b) Eine Stichprobe vom Umfang n = 500 ergab folgende Ergebnisse
Klasse Ai
beobachtete
Häufigkeit hi
A0
A1
A2
A3
A4
319
93
51
22
15
c) Schätzung des Parameters p:
p̂ =
Anzahl defekter Glühlampen
321
=
= 0, 1605
Gesamtzahl Glühlampen
2000
d) Damit hypothetische Verteilung:
pi = P (X = i) =
4
· 0, 1605i (1 − 0, 1605)4−i , i = 0, . . . , 4
i
Ergänzung der obigen Tabelle ergibt
Klasse Ai
beobachtete
Häufigkeit hi
erwartete
Häufigkeit 500 · pi
A0
A1
A2
A3
A4
319
93
51
22
15
248,34
189,92
54,46
6,94
0,33
Da 0, 33 < 1 ist, werden die Klassen A3 und A4 zusammengefaßt. Damit ergibt sich:
Klasse Ai
beobachtete
Häufigkeit hi
erwartete
Häufigkeit 500 · pi
A0
A1
A2
Ã3 = A3 ∪ A4
319
93
51
37
248,34
189,92
54,46
7,27
e) Berechnen der Testgröße
χ24−1−1 = ... = 191, 37
f) Quantil χ24−1−1;0,99 = 9, 21
g) Wegen 191, 36 > 9, 21 wird H0 abgelehnt.
64
16
Korrelation und Regression
Wir interessieren uns für folgende Fragestellungen.
Sind zwei Zufallsvariablen voneinander abhängig und kann man diese Abhängigkeit gegebenenfalls durch
eine geeignete Kenngröße quantifizieren? (Korrelationsrechnung)
Kann man eine funktionelle Abhängigkeit zwischen zwei Zufallsvariablen (näherungsweise) berechnen?(Regressionsrechn
16.1 Beispiel
Es sei X der zufällige Durchmesser einer Schweißstelle (leicht zu messen) und Y die zufällige Schubfestigkeit
einer Schweißstelle (wird bei Messungen zerstört).
Messungen ergaben folgende Werte
x[mm]
1,2
1,8
3,2
3,8
5,4
6,6
8,6
9,1
9,4
10,9
y[M P a] 2,48 5,45 8,27 11,03 13,654 17,58 21,37 24,13 27,03 27,3
Der Graph legt die Vermutung nahe, daß näherungsweise ein linearer Zusammenhang zwischen X und Y
besteht. Bei einem deterministischen Experiment (bei dem der Zufall keine Rolle spielt), würde das heißen:
y = ax + b.
Hier ist es etwas komplizierter: Wenn X den Wert x annimmt, nimmt Y im Mittel den Wert ax + b an,
die Einzelbeobachtungen schwanken dagegen um den Wert ax + b. Dies soll im folgenden genauer analysiert
werden.
16.2 Definition (Kovarianz)
Unter der Kovarianz zweier Zufallsvariablen X und Y versteht man
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] .
Für σX 6= 0 und σY 6= 0 ist der Korrelationskoeffizient von X und Y definiert durch
ρ(X, Y ) =
Cov(X, Y )
,
σX σ Y
wobei σX und σY die Standardabweichungen von X und Y bezeichnen.
16.3 Bemerkung
a) Unter Benutzung der Regel E(X + Y ) = E(X) + E(Y ) kann man zeigen:
Cov(X, Y ) = E(XY ) − E(X) · E(Y ) .
b) Mit 1. folgt
Cov(X, X) = E(X 2 ) − (E(X))2 = Var(X) .
c) X, Y unabhängig ⇒ Cov(X, Y ) = 0, da für unabhängige Zufallsvariablen E(XY ) = E(X) · E(Y ) gilt.
16.4 Satz
a) X, Y unabhängig ⇒ ρ(X, Y ) = 0
b) ρ(X, Y ) = 1 ⇔ Es existieren a, b mit Y = aX + b, a > 0
c) ρ(X, Y ) = −1 ⇔ Es existieren a, b mit Y = aX + b, a < 0
65
denn:
1. gilt nach 3. in Bemerkung 16.3 und der defn von ρ(X, Y ).
zu 2. und 3. ⇐
Sei Y = aX + b. Dann ist E(Y ) = aE(X) + b und V ar(Y ) = a2 V ar(X).
Somit
(
)
X − E(X) a(X − E(X))
ρ(X, Y ) = E p
· p
V ar(X)
a2 V ar(X)
(X − E(X))2
a
E
=
|a|
V ar(X)
a
1
=
·
· E(X − E(X))2
{z
}
|a| V ar(X) |
=V ar(X)
a
=
|a|
+1, falls a > 0
=
−1, falls a < 0
16.5 Bemerkung
1. in Satz 16.4 bedeutet, daß unabhängige Zufallsvariablen stets unkorreliert sind. Die Umkehrung gilt
nicht, wie das folgende Beispiel zeigt! Sind zwei Zufallsvariablen unkorreliert, so bedeutet dies nur, daß
keine lineare Abhängigkeit besteht.
16.6 Beispiel
Die Zufallsvariablen X und Y besitzen folgende gemeinsame Verteilung:
X\Y
−1
0
1
qj
−1
0
0
1
4
1
4
0
1
4
1
2
0
1
4
1
0
1
4
0
pi
1
4
1
2
1
4
1
4
Es gilt:
E(X) = 0 = E(Y ) ,
E(X · Y ) = 0
Also:
Cov(X, Y ) = ρ(X, Y ) = 0
Es gilt aber z. B.:
P (X = 1, Y = 0) =
P (X = 1) · P (Y = 0) =
1
4
1 1
1
· =
4 2
8
Somit sind X und Y zwar unkorreliert, aber nicht unabhängig. ρ(X, Y ) = 0 heißt nur, daß keine lineare
Abhängigkeit besteht. Die Abhängigkeit zwischen X und Y ist hier nichtlinear.
16.7 Definition (Schätzfunktion für ρ(X, Y ))
Sind (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) jeweils Paare von Zufallsvariablen, dann schätzt man Cov(X, Y ) durch
n
SX,Y =
1 X
(Xi − X)(Yi − Y ) .
n − 1 i=1
66
Schätzt man die jeweiligen Standardabweichungen durch
v
v
u
u
n
n
u 1 X
u 1 X
2
t
SX =
(Xi − X) und SY = t
(Yi − Y )2 ,
n − 1 i=1
n − 1 i=1
so ist
SX,Y
SX · SY
eine Schätzfunktion für den Korrelationskoeffizienten.
r=
16.8 Bemerkung
a) Für Beispiel 16.1 gilt: r = 0, 9924.
b) Für eine Berechnung von SX,Y , SX , SY in der in defn 16.7 angegebenen Form müßte man zunächst die
Mittelwerte X, Y berechnen. Eine Alternative für praktische Rechnungen ergibt sich aus den folgenden
Umformungen.
n
SX,Y
=
=
1 X
(Xi Yi − XYi − Y Xi + X Y )
n − 1 i=1

X

n
n
n
X
X

1 

Xi Yi − X
Yi −Y
Xi +nX Y 

n−1

 i=1
i=1
i=1
| {z }
| {z }
=nY
=
bzw.
SX
v
u
u
=t

n
X
1
n−1
Xi Yi − nX Y
=nX
!
i=1
n
1 X 2
2
(
X − nX ) ,
n − 1 i=1 i
v
u
u
SY = t
n
1 X 2
2
(
Y − nY )
n − 1 i=1 i
Wir beschäftigen uns im folgenden mit der sogenannten Methode der kleinsten Fehlerquadrate.
Es wird diejenige Gerade gesucht, die die durch die Stichprobe gegebene Punktwolke in einem festzulegenden Sinne bestmöglich approximiert. Man sucht diejenige Gerade, sogenannte Ausgleichsgerade, bei der
die Summe der zu den Stichprobenpunkten in y-Richtung quadrierten Abstände möglichst klein wird.
Auf der Grundlage einer konkreten Stichprobe {(x1 , y1 ), . . . , (xn , yn )} soll eine Geradengleichung ŷ =
a1 x + a0 angegeben werden, so daß (mit der Bezeichnung ŷi = ŷ(xi ))
n
X
(yi − ŷi )2 =
i=1
n
X
(yi − a1 xi − a0 )2
i=1
möglichst klein wird.
Wir suchen also das Minimum der Funktion
g(a0 , a1 ) =
n
X
(yi − a1 xi − a0 )2 .
i=1
Notwendige Bedingungen für ein Minimum sind:
∂g
(a0 , a1 )
∂a0
= −2
∂g
(a0 , a1 )
∂a1
= −2
n
X
(yi − a1 xi − a0 ) = 0
i=1
n
X
i=1
67
xi (yi − a1 xi − a0 ) = 0
In Matrix- Vektorschreibweise bedeutet dies
Pn
Pn
n
a0
yi
i=1 xi
i=1
P
P
P
=
n
n
n
2
a1
i=1 xi
i=1 xi
i=1 xi yi
Als Lösung des linearen Gleichungssystems erhält man mit Hilfe der Cramerschen Regel
=ny
=nx
a1
z }| { z }| {
n
n
X
X
Pn
n i=1 xi yi − (
xi )(
yi )
i=1
=
i=1
n
X
Pn
2
n i=1 xi − (
xi )2
i=1
| {z }
=(nx)2
=(n−1)sx,y
z
n
X
}|
{
xi yi − nxy
n i=1
· n
n X
x2i − nx2
=
i=1
|
{z
=(n−1)s2x
sx,y
s2x
sy
= r·
sx
}
=
a0
=
=
Pn
i=1
y
yi
Pn
Pn
2
i=1 xi
Pn
Pn
x2i − i=1 xi yi i=1 xi
n(n − 1)Sx2
|
{z
}
i=1
(Nenner wie oben)
Pn
− x i=1 xi yi +
(n − 1)s2x
=(n−1)s2x
nx2 y − nx2 y
=(n−1)sx,y
z
z
}|
{
}|
{
n
n
X
X
y(
x2i − nx2 ) −x (
xi yi − nxy)
=
i=1
i=1
(n − 1)s2x
sx,y
s2x
sy
= y−x·r·
sx
= y−x·
16.9 Beispiel
Für das Beispiel 16.1 erhält man
a0 = 0, 199 und a1 = 2, 6
d. h. ŷ = 0, 199 + 2, 6x als Ausgleichsgerade.
16.10 Bemerkung
Vermutet man allgemein eher eine polynomiale Abhängigkeit, so versucht man z. B. eine quadratische,
68
kubische Ausgleichsparabel, etc. zu finden. Man sucht also ein Minimum von
g(a0 , ..., am ) =
n
X
(yi − pm (xi ))2 ,
i=1
wobei
pm (x) =
m
X
ak xk
k=0
mit m ≤ n (in der Regel m << n).
Geht man wie oben vor (Nullsetzen der partiellen Ableitungen), so führt dies auf das lineare Gleichungssystem
(sogenanntes System der Normalgleichungen)
P
P 2
P m 

  P

n
xi . . .
xi
a0
yi
P
P x2i
P

  a1  
xi
xi
...


  P xi yi 

 ..
  ..
 
x2i yi 
 .
 .
=



  .

 ..
 .
  .

.
.
 .
 .

P m
P m P m+1
P 2m
x
y
i i
am
xi
xi
...
...
xi
Die Lösung liefert die gesuchten Koeffizienten a0 , a1 , ..., am .
16.11 Beispiel
Untersuchung des Zusammenhangs zwischen Bremsweg w(in m) und Geschwindigkeit v (in km/h) eines
bestimmten Autotyps.
i
1
2
3
4
5
Messungen: vi 40 70 100 130 150
wi 14 39 78 120 153
Ansatz: w = a2 v 2 + a1 v + a0
Nach Berechnung der erforderlichen Summen erhalten wir das System der Normalgleichungen:
 



5
490
55900
a0
404
 490
55900
6979000   a1  =  49640 
6464000
55900 697900 918430000
a2
Lösung:
a0 = −11, 23 a1 = 0, 437217 a2 = 0, 004399
d. h. die Ausgleichsparabel
ŵ = 0, 004399 · v 2 + 0, 437217 · v − 11, 23
16.12 Beispiel (Exponentielles Verhalten)
Folgende Daten seien beobachtet worden:
xi
1
2
3
4
yi 2,5 3,9 7,8 15,0
Man vermutet, daß näherungsweise ein Zusammenhang der Form
ŷ = a · 2bx
besteht. Logarithmiert man diesen Ansatz, so erhält man:
ln ŷ = ln (a · 2bx ) = ln a + b · x · ln 2 = a0 + a1 x
mit
a0 = ln a ,
a1 = b · ln 2 ,
69
d. h. wir vermuten einen linearen Zusammenhang zwischen x und ln ŷ = ẑ.
Zugehörige Tabelle:
1
2
3
4
xi
zi = ln yi 0,92 1,4 2,1 2,7
und erhalten die Ausgleichsgerade
ẑ = 0, 24 + 0, 61x .
Für ŷ bedeutet das mit a = ea0 = 1, 27 und b =
a1
ln 2
= 0, 88
ŷ = eẑ = 1, 27 · 20,88·x = 1, 27 · 1, 84x
16.13 Bemerkung
Durch entsprechende Ansätze kann man auch andere nichtlineare Ausgleichsprobleme analog zu 16.12 behandeln. Vergleiche zum Beispiel Tabelle 4 in Papula, Band 3, Seite 716.
70
Herunterladen