Inhaltsverzeichnis 1 Vorbemerkungen 1 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2 3 Wahrscheinlichkeitsaxiome 4 4 Laplace-Experimente 6 5 Hilfsmittel aus der Kombinatorik 7 6 Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen 10 7 Zufallsvariable und Verteilungsfunktion 16 8 Diskrete Zufallsvariablen 18 9 Stetige Zufallsvariable 28 10 Funktionen von einer oder mehreren Zufallsvariablen 39 11 Grenzwertsätze 46 12 Parameterschätzungen und Schätzfunktionen 49 13 Konfidenzintervalle 51 14 Parametertest 57 15 Chi-Quadrat-Tests 63 16 Korrelation und Regression 65 14 Parametertest Das Ziel von sogenannten Parametertests ist es, zu entscheiden, ob es Gründe gibt, eine Vermutung (Hypothese) über den Wert eines Parameters abzulehnen oder nicht. 14.1 Beispiel Wir versuchen, Antworten auf Fragen der folgenden Art zu finden. a) Ist der vorliegende Würfel fair? b) Ein Lieferant behauptet, nur 3% seiner gelieferten Bauteile seien defekt. Stimmt das? c) Ein Hersteller behauptet, sein neuentwickeltes Auto verbrauche genauso wenig Benzin, wie das des Konkurrenten. Stimmt das? Die Entscheidungen beruhen auf Auswertungen von Stichproben, mit denen man Vermutungen über den Wert eines Parameters einer Wahrscheinlichkeitsverteilung testet. Da die Auswahl von Stichproben zufällig geschieht, besteht natürlich die Gefahr eines Irrtums. 14.2 Definition Unter der Nullhypothese H0 versteht man diejenige Hypothese, deren Wahrheitsgehalt geprüft werden soll. Zu jeder Nullhypothese gibt es eine Alternativhypothese oder Gegenhypothese H1 . Man spricht auch vom Testproblem H0 gegen H1 . 14.3 Beispiel (Fortsetzung von Beispiel 14.1) a) H0 : p = 16 , H1 : p 6= 16 , wobei p die Wahrscheinlichkeit für das Würfeln einer 6 bezeichnet. b) H0 : p = 0, 03, H1 : p > 0, 03, wobei p die Wahrscheinlichkeit dafür bezeichnet, ob ein Bauteil defekt ist. c) H0 : µ1 = µ2 , H1 : µ1 > µ2 , wobei µi , i = 1, 2, den Erwartungswert für den zufälligen Benzinverbrauch je 100 km für den PKW vom Hersteller i bezeichnet. 14.4 Bemerkung a) Wie man an 2. und 3. sieht, muß die Gegenhypothese nicht die Negation der Hypothese sein. Der Kunde ist auch zufrieden, wenn weniger als 3% der Bauteile defekt sind. b) Man nimmt zunächst einmal an, daß H0 richtig ist. Nur bei gewichtigen Gründen wird H0 abgelehnt. H0 hat das Heimspiel! Man geht davon aus, daß • der Würfel fair ist, • der Lieferant vertragsgemäß arbeitet, • beide Autos gleichen geringen Spritverbrauch haben. Die Annahme von H0 bedeutet, daß die Stichprobe keinen Anlaß gibt, H0 abzulehnen. Vorgehensweise: Aus einer Stichprobe X1 , X2 , . . . , Xn berechnet man eine neue Zufallsvariable T = T (X1 , X2 , . . . , Xn ), die als Testfunktion bezeichnet wird. Die Entscheidung bei einem konkreten Problem beruht wieder auf einer konreten Stichprobe x1 , x2 , . . . , xn und dem Wert der daraus berechneten sogenannten Testgröße T = T (x1 , x2 , . . . , xn ). Mit WT bezeichnen wir den Wertebereich von T . WT wird in zwei disjunkte Teilmengen W0 und W1 aufgeteilt, d. h. WT = W0 ∪ W1 mit W0 ∩ W1 = ∅. H0 wird angenommen, wenn die Testgröß T = T (x1 , x2 , . . . , xn ) ∈ W0 und abgelehnt, wenn T = T (x1 , x2 , . . . , xn ) ∈ 57 W1 . Entsprechend heißen W0 und W1 Annahme- und Ablehnungsbereich. Da die Entscheidung auf Stichproben beruht, kann die Annahme bzw. die Ablehnung von H0 fehlerhaft sein. Man unterscheidet zwei verschiedene Fehlertypen. Je nach Wert von T wird H0 angenommen oder abgelehnt. 14.5 Definition Ein Fehler 1. Art wird begangen, wenn H0 abgelehnt wird, obwohl H0 richtig ist. Ein Fehler 2. Art wird begangen, wenn H0 angenommen wird, obwohl H0 falsch ist. Mögliche Testentscheidungen sind also: Annahme von H0 Ablehnung von H0 H0 richtig richtige Entscheidung Fehler 1. Art H0 falsch Fehler 2. Art richtige Entscheidung Die Wahrscheinlichkeit α eines Fehlers 1. Art ist somit gleich der bedingten Wahrscheinlichkeit dafür, daß T ∈ W1 ist, unter der Bedingung, daß H0 richtig ist, d. h. α = P (Fehler 1. Art) = P (T ∈ W1 |H0 ) Entsprechend ist die Wahrscheinlichkeit β eines Fehlers 2. Art gleich der bedingten Wahrscheinlichkeit dafür, daß T ∈ W0 ist, unter der Bedingung, daß H0 falsch ist, d. h. β = P (Fehler 2. Art) = P (T ∈ W0 |H1 ) 14.6 Definition Die Wahrscheinlichkeit α = P (Fehler 1. Art) heißt Signifikanzniveau oder Irrtumswahrscheinlichkeit, 1 − α Sicherheitswahrscheinlichkeit und 1 − β = 1 − P (Fehler 2. Art) heißt Güte oder Trennschärfe des Tests. Die Vorgehensweise ist nun so, daß man die Wahrscheinlichkeit α für den Fehler 1. Art vorgibt. β kann dann nicht willkürlich gewählt werden, sondern hängt von α, dem Stichprobenumfang n und der Parameterkonstellation des Problems ab. Man versucht natürlich β möglichst klein zu halten. Ein Parametertest besteht nun aus folgenden Schritten. a) Aufstellen von H0 und H1 , b) Wahl der Testfunktion T und Festlegung des Annahme- bzw. Ablehnungsbereiches W0 bzw. W1 unter Berücksichtigung von α, c) Berechnung der Testgröße T (x1 , x2 , . . . , xn ) aus einer konkreten Stichprobe x1 , x2 , . . . , xn , d) Entscheidung über Annahme bzw. Ablehnung von H0 . Wir behandeln nun im folgenden Tests für konkrete Parameter. a) Test über Parameter der Normalverteilung i) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei bekannter Varianz Zu prüfen ist die Hypotese H0 : µ = µ0 gegen H1 : µ 6= µ0 zum Signifikanzniveau α. Die Varianz σ 2 sei bekannt. Die zugehörige Testfunktion lautet: X − µ0 √ T = n σ P n mit X = n1 i=1 Xi . T genügt der Standardnormalverteilung. Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )- Quantil der Standardnormalverteilung Φ bezeichnet. 58 14.7 Bemerkung i. u α2 heißt auch Zufallshöchstwert für die Testfunktion T oder kritischer Wert oder Testschranke. ii. H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn µ0 außerhalb des Konfidenzintervalls mit Konfidenzniveau 1 − α für den Erwartungswert µ einer normalverteilten Zufallsvariablen mit bekannter Varianz σ 2 liegt. 14.8 Beispiel Die Flughöhen von 30 Leuchtraketen wurden gemessen. Das arithmetische Mittel der Meßwerte betrage x = 47, 9m. Die zufällige Flughöhe X genügt einer N (µ, σ 2 )-Verteilung mit unbekanntem µ und bekannter Standardabweichung σ = 6m. Die Herstellerangabe für den Sollwert beträgt µ0 = 50m. H0 : µ = 50m, H1 : µ 6= 50m Wir verlangen eine Sicherheitswahrscheinlichkeit √ von 1 − α = 95%. Für die Testgröße berechnet man T = 47,9−50 30 ≈ −1, 917. 6 Weiter ist u α2 = u0,025 = q0,975 = 1, 96 d. h. |T | ≤ u α2 . Somit gibt es keine gewichtigen Gründe, H0 abzulehnen. Einseitiger Test über den Erwartungswert bei bekannter Varianz Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ). Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn T < −uα (bzw. wenn T > uα ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw. größer) als µ0 ist. 14.9 Beispiel (vgl. auch Beispiel 14.8) Wir ärgern uns nur über zu niedrige Flughöhen, d. h. H0 : µ = 50m, H1 : µ < 50m, 1 − α = 95% Es gilt u0,05 = q0,95 = 1, 64. Wie oben ist T ≈ −1, 92 , d.h. T < −u0,05 . H0 wird also abgelehnt. ii) Test über den Erwartungswert einer normalverteilten Zufallsvariablen bei unbekannter Varianz (t-Test) Zu prüfen ist die Hypothese H0 : µ = µ0 gegen H1 : µ 6= µ0 mit einer Sicherheitswahrscheinlichkeit 1 − α bei unbekannter Varianz. Die zugehörige Testfunktion lautet: Tn−1 = X − µ0 √ · n S Pn Pn 1 2 mit X = n1 i=1 Xi und S 2 = n−1 i=1 (Xi − X) . Tn−1 genügt einer t-Verteilung mit n − 1 Freiheitsgraden. Testentscheidung: Die Nullhypothese H0 wird mit einer Sicherheitswahrscheinlichkeit von 1−α abgelehnt, wenn |Tn−1 | > tn−1, α2 ist, wobei tn−1, α2 = qn−1,1− α2 das (1 − α2 ) -Quantil der tVerteilung bezeichnet. 14.10 Beispiel Die Herstellerangabe für die Kapazität C von Kondensatoren betrage 200µF . Wir setzen voraus, daß die Kapazitäten einer Normalverteilung genügen. Bei einer Stichprobe wurden folgende Werte gemessen: 208, 185, 219, 198, 208, 190, 179, 234, 181, 204, 200, 208, 192, 224, 212. H0 : C = 200µF, H1 : C 6= 200µF, 1 − α = 95% 59 x = 202, 8, s ≈ 15, 86, s2 ≈ 251, 6 T14 = 202, 8 − 200 √ 15 ≈ 0, 68 15, 86 t14;0,025 = 2, 14 , d.h. |T14 | ≤ t14;0,025 , d. h. es gibt keine gewichtigen Gründe, H0 abzulehnen. Einseitiger Test über den Erwartungswert bei einer unbekannten Varianz. Zu prüfen ist H0 : µ = µ0 gegen H1 : µ < µ0 (bzw. H1 : µ > µ0 ). Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Tn−1 < −tn−1,α (bzw. wenn T > tn−1,α ) ist. H0 wird also abgelehnt, wenn x signifikant kleiner (bzw. größer ) als µ0 ist. 14.11 Beispiel (vgl. Beispiel 14.10) Die Herstellerangabe sei nun mit C = 190µF angegeben. H0 : C = 190µF, H1 : C > 190µF, 1 − α = 95% 202, 8 − 190 √ 15 ≈ 3, 13 15, 86 > t14;0,05 . Also wird H0 zugunsten von H1 abgelehnt. T14 = t14;0,05 = 1, 76 , d.h. T14 iii) Test auf Gleichheit der Erwartungswerte zweier unabhängiger normalverteilter Zufallsvariablen X und Y seien unabhängige normalverteilte Zufallsvariablen mit unbekannten Erwartungswerten 2 µX und µY und gleichen, aber unbekannten Varianzen σX = σY2 = σ 2 . Zu prüfen ist H0 : µX = µY gegen H1 : µX 6= µY mit Sicherheitswahrscheinlichkeit 1 − α. Die zugehörige Testfunktion lautet: r X −Y nX nY TnX +nY −2 = , Sd nX + nY PnX PnX 2 wobei X = n1X i=1 X i , SX = nX1−1 i=1 (Xi − X)2 , nX -Umfang der Stichprobe für X; Y , SY2 , nY entsprechend für Y und Sd2 = 1 2 [(nX − 1)SX + (nY − 1)SY2 ] nX + nY − 2 Für gleiche Stichprobenumfänge, d. h. nX = nY = n, vereinfacht sich Sd2 zu Sd2 = und damit die Testfunktion zu r √ √ X −Y X −Y n2 p T2(n−1) = · 2 · =p 2 · n. 2 2 2 2n SX + SY SX + SY 1 2 2 (SX + SY2 ) Testentscheidung:Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn |TnX +nY −2 | > tnX +nY −2, α2 , wobei tnX +nY −2, α2 das (1 − α2 )-Quantil der t-Verteilung mit nX + nY − 2 Freiheitsgraden bezeichnet. 14.12 Beispiel Der Benzinverbrauch der beiden Automarken Fiasko und Torso wird verglichen. Tests ergaben folgende Werte: l l Fiasko: 31 Tests, x = 7, 2 , sx = 0, 35 100km 100km l l Torso: 31 Tests, y = 7, 4 , sy = 0, 38 100km 100km 60 Wir gehen von gleicher Varianz aus und prüfen H0 : µx = µy gegen H1 : µx 6= µy , 1 − α = 95% √ 7, 2 − 7, 4 T60 = p 31 ≈ −2, 16 0, 352 + 0, 382 t60;0,025 = q0,975 = 2, |T60 | > t60;0,025 , d. h. H0 wird abgelehnt, gleiche Benzinverbräuche werden nicht akzeptiert. Einseitiger Test: Zu prüfen ist H0 : µX = µY gegen H1 : µX < µY (bzw. H1 : µX > µY ). Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1−α abgelehnt, wenn TnX +nY −2 < −tnX +nY −2;α (bzw.TnX +nY −2 > tnX +nY −2;α ) ist. 14.13 Beispiel (vgl Beispiel 14.12) H0 : µx = µy , H1 : µx < µy , 1 − α = 95%, T60 ≈ −2, 16. t60;0,05 = q60;0,95 = 1, 671 ,d. h. T60 < −t60;0,05 . H0 wird somit abgelehnt, d. h. der Benzinverbrauch von Fiasko wird geringer als der von Torso angesehen. iv) Test für die unbekannte Varianz einer normalverteilten Zufallsvariablen X sei eine normalverteilte Zufallsvariable mit unbekannter Varianz σ 2 . Wir beschränken uns auf einen einseitigen Test. Zu prüfen ist H0 : σ 2 = σ02 gegen H1 : σ 2 > σ02 mit Sicherheitswahrscheinlichkeit 1 − α. Die zugehörige Testfunktion lautet: Zn−1 = (n − 1) S2 σ02 Pn 1 2 2 mit S 2 = n−1 i=1 (Xi − X) , σ0 -vermuteter Wert der Varianz, n-Umfang der Stichprobe. Zn−1 2 genügt einer χ -Verteilung mit (n − 1) Freiheitsgraden. Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn Zn−1 > zn−1,α , wobei zn−1,α das (1 − α)-Quantil der χ2 -Verteilung mit (n − 1) Freiheitsgraden ist. 14.14 Beispiel In einer Firma werden Schrauben mit bestimmter Länge hergestellt. Aus langjähriger Erfahrung weiß man: σ0 = 1, 2mm. Neueste Messungen bei einer Stichprobe vom Umfang n = 25 ergaben s = 1, 5mm. Ist die Abweichung eine zufällige Schwankung oder ist sie signifikant? H0 : σ 2 = σ02 , H1 : σ 2 > σ02 , Sicherheitswahrscheinlichkeit 99%, d.h. Signifikanzniveau α = 0, 01. 2 z24 = 24 · 1,5 1,22 = 37, 5, z24;0,99 = 42, 98 d. h. z24 ≤ z24;0,99 . Somit wird H0 angenommen, was bedeutet, daß die Abweichung von s2 vom langjährigen Erfahrungswert als zufallsbedingt angesehen wird. (Messung von s = 1, 7mm hätten dagegen zur Ablehnung geführt; Überprüfung der Maschinen erforderlich, etc.) b) Test über Erfolgswahrscheinlichkeiten i) Test für unbekannte Erfolgswahrscheinlichkeit p (Parameter p einer Binomialverteilung) Zu prüfen ist H0 : p = p0 gegen H1 : p 6= p0 mit Sicherheitswahrscheinlichkeit 1 − α. Im folgenden setzen wir eine umfangreiche Stichprobe voraus. Dann lautet die zugehörige Testfunktion: n(P̂ − p0 ) T =p np0 (1 − p0 ) 61 mit P̂ = X n , X die Anzahl der Erfolge bei n-maliger Durchführung eines Bernoulli-Experimentes. T ist näherungsweise N (0, 1)-verteilt. Testentscheidung: Die Nullhypothese H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2 ist, wobei u α2 = q1− α2 das (1 − α2 )-Quantil von Φ ist. Einseitiger Test: Zu prüfen ist H0 : p = p0 gegen H1 : p < p0 (bzw. H1 : p > p0 ) mit Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T < −uα (bzw. T > uα ) ist. 14.15 Beispiel Der Hersteller eines elektrischen Bauelementes behauptet, daß seine Produktion höchstens 4% Ausschuß enthält. Der Abnehmer führt eine größere Stichprobe vom Umfang n = 300 durch. Darunter sind k = 15 defekte Teile. Wir überprüfen die Herstellerangabe mit einer Sicherheitswahrscheinlichkeit von 99%. H0 : p = 0, 04, H1 : p > 0, 04 15 − 0, 04) 300( 300 T =p 300 · 0, 04(1 − 0, 04) ≈ 0, 8839 u0,01 = q0,99 = 2, 33 , d.h. T ≤ u0,01 , also wird H0 angenommen und die Rechnung ohne Abzüge bezahlt. ii) Vergleich zweier Erfolgswahrscheinlichkeiten X1 und X2 seien unabhängige binomialverteilte Zufallsvariablen mit Erfolgswahrscheinlichkeiten p1 bzw. p2 . Zu prüfen ist H0 : p1 = p2 gegen H1 : p1 6= p2 , Sicherheitswahrscheinlichkeit 1 − α Die zugehörige Testfunktion lautet: P̂1 − P̂2 T =q P̂ (1 − P̂ ) r n1 n2 n1 + n2 X2 X1 +X2 1 mit n1 , n2 Stichprobenumfänge, P̂1 = X n1 , P̂2 = n2 , P̂ = n1 +n2 . Dabei bezeichnet Xi jeweils die Anzahl der Erfolge. Bei großen Stichprobenumfängen n1 und n2 ist T näherungsweise N (0, 1)-verteilt. Testentscheidung: H0 wird mit Sicherheitswahrscheinlichkeit 1 − α abgelehnt, wenn |T | > u α2 ist, wobei u α2 das (1 − α2 )-Quantil von Φ ist. Einseitiger Test: H0 : p1 = p2 gegen H1 : p1 > p2 (bzw. H1 : p1 < p2 ), Sicherheitswahrscheinlichkeit 1 − α. H0 wird abgelehnt, wenn T > uα (bzw. T < −uα ) ist. 14.16 Beispiel (Geschwindigkeitsmessung) Von 300 PKW in denen Männer am Steuer saßen, waren 60 zu schnell. Von 200 PKW in denen Frauen am Steuer saßen, waren 8 zu schnell. p̂1 = 60 = 0, 2 300 p̂2 = 8 = 0, 04 200 p̂ = 60 + 8 = 0, 136 300 + 200 H0 : p1 = p2 , H1 : p1 > p2 , 1 − α = 0, 99 T =p 0, 2 − 0, 04 0, 136(1 − 0, 136) u0,01 = 2, 32, T > u0,01 , d. h. H0 wird abgelehnt. 62 r 300 · 200 = 5, 11 300 + 200 15 Chi-Quadrat-Tests Bei Chi-Quadrat-Tests sind die Testfunktionen (näherungsweise) χ2 - verteilt. Anwendungen sind z. B.: • Test, ob eine bestimmte Verteilungsfunktion vorliegt, • Test, ob die unbekannte Verteilungsfunktion zu einer bestimmten Klasse von Verteilungsfunktionen gehört, • Test auf Unabhängigkeit zweier Zufallsvariablen, • Test, ob mehrere Zufallsvariablen die gleiche Verteilung besitzen. Sei F die unbekannte Verteilungsfunktion einer Zufallsvariablen X. Wir behandeln folgende Problemstellungen. A H 0 : F = F0 , H1 : F = 6 F0 mit einer vorgegebenen hypothetischen Verteilungsfunktion F0 . B H0 : F gehört zu einer Klasse von Verteilungsfunktionen, die durch m (unbekannte) Parameter Θ1 , Θ2 , ..., Θm festgelegt ist, H1 : F gehört nicht zu dieser Klasse. Testdurchführung: a) Einteilung der Wertemenge der Zufallsvariablen X in r ≥ 2 disjunkte Klassen A1 , A2 , . . . , Ar . b) Aus einer Stichprobe vom Umfang n berechnet man für i = 1, 2, . . . , r die Klassenhäufigkeiten hi = h(Ai ) = Anzahl der Stichprobenwerte in der Klasse Ai . c) Bei Problem B ersetzt man die unbekannten Parameter Θ1 , Θ2 , . . . , Θm durch Schätzungen. Dadurch erhält man eine hypothetische Verteilung F0 (wie bei Problem A). d) Für i = 1, . . . , r berechnet man die hypothetischen Klassenwahrscheinlichkeiten pi = P (X ∈ Ai ) für die Zufallsvariable X mit der Verteilungsfunktion F0 . Dabei muß npi ≥ 5 für mindestens 80% der Klassen Ai und npi ≥ 1 für alle Klassen gelten. (Sonst in 1. andere Einleitung wählen, z. B. durch Zusammenlegen von Klassen.) e) Berechnung der Testgröße χ2r−m−1 = r X i=1 r (hi − npi )2 npi | {z } = 1X 1 2 (h − 2npi hi + n2 p2i ) n i=1 pi i relative quadratische Abweichungen der Häufigkeiten = r r r X X 1 X h2i −2 hi +n pi n i=1 pi i=1 i=1 | {z } | {z } =n =1 r = 1 X h2i −n n i=1 pi f) Bestimmung des (1 − α)-Quantils χ2r−m−1;1−α der χ2 -Verteilung mit r − m − 1 Freiheitsgraden, wobei r die Anzahl der Klassen und m die Anzahl der geschätzten Parameter ist. g) Testentscheidung: Für χ2r−m−1 > χ2r−m−1;1−α wird H0 abgelehnt. 63 15.1 Bemerkung Faustregel für die Anzahl der Klassen ist r ≈ √ n. 15.2 Beispiel (Test auf Binomialverteilung) In einer Großhandlung werden Glühlampen in Viererpackungen verkauft. H0 : Die Anzahl der defekten Glühlampen pro Packung ist binomialverteilt mit einer unbekannten Wahrscheinlichkeit p. Die Sicherheitswahrscheinlichkeit sei 1 − α = 0, 99. Der Parameter n = 4 ist hier bekannt. Zufallsvariable X: Anzahl defekter Glühlampen pro Packung, Wertemenge von X: W = {0, 1, 2, 3, 4}. a) Klasseneinteilung W = 4 [ Ai = {0} ∪ {1} ∪ {2} ∪ {3} ∪ {4} i=0 b) Eine Stichprobe vom Umfang n = 500 ergab folgende Ergebnisse Klasse Ai beobachtete Häufigkeit hi A0 A1 A2 A3 A4 319 93 51 22 15 c) Schätzung des Parameters p: p̂ = Anzahl defekter Glühlampen 321 = = 0, 1605 Gesamtzahl Glühlampen 2000 d) Damit hypothetische Verteilung: pi = P (X = i) = 4 · 0, 1605i (1 − 0, 1605)4−i , i = 0, . . . , 4 i Ergänzung der obigen Tabelle ergibt Klasse Ai beobachtete Häufigkeit hi erwartete Häufigkeit 500 · pi A0 A1 A2 A3 A4 319 93 51 22 15 248,34 189,92 54,46 6,94 0,33 Da 0, 33 < 1 ist, werden die Klassen A3 und A4 zusammengefaßt. Damit ergibt sich: Klasse Ai beobachtete Häufigkeit hi erwartete Häufigkeit 500 · pi A0 A1 A2 Ã3 = A3 ∪ A4 319 93 51 37 248,34 189,92 54,46 7,27 e) Berechnen der Testgröße χ24−1−1 = ... = 191, 37 f) Quantil χ24−1−1;0,99 = 9, 21 g) Wegen 191, 36 > 9, 21 wird H0 abgelehnt. 64 16 Korrelation und Regression Wir interessieren uns für folgende Fragestellungen. Sind zwei Zufallsvariablen voneinander abhängig und kann man diese Abhängigkeit gegebenenfalls durch eine geeignete Kenngröße quantifizieren? (Korrelationsrechnung) Kann man eine funktionelle Abhängigkeit zwischen zwei Zufallsvariablen (näherungsweise) berechnen?(Regressionsrechn 16.1 Beispiel Es sei X der zufällige Durchmesser einer Schweißstelle (leicht zu messen) und Y die zufällige Schubfestigkeit einer Schweißstelle (wird bei Messungen zerstört). Messungen ergaben folgende Werte x[mm] 1,2 1,8 3,2 3,8 5,4 6,6 8,6 9,1 9,4 10,9 y[M P a] 2,48 5,45 8,27 11,03 13,654 17,58 21,37 24,13 27,03 27,3 Der Graph legt die Vermutung nahe, daß näherungsweise ein linearer Zusammenhang zwischen X und Y besteht. Bei einem deterministischen Experiment (bei dem der Zufall keine Rolle spielt), würde das heißen: y = ax + b. Hier ist es etwas komplizierter: Wenn X den Wert x annimmt, nimmt Y im Mittel den Wert ax + b an, die Einzelbeobachtungen schwanken dagegen um den Wert ax + b. Dies soll im folgenden genauer analysiert werden. 16.2 Definition (Kovarianz) Unter der Kovarianz zweier Zufallsvariablen X und Y versteht man Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] . Für σX 6= 0 und σY 6= 0 ist der Korrelationskoeffizient von X und Y definiert durch ρ(X, Y ) = Cov(X, Y ) , σX σ Y wobei σX und σY die Standardabweichungen von X und Y bezeichnen. 16.3 Bemerkung a) Unter Benutzung der Regel E(X + Y ) = E(X) + E(Y ) kann man zeigen: Cov(X, Y ) = E(XY ) − E(X) · E(Y ) . b) Mit 1. folgt Cov(X, X) = E(X 2 ) − (E(X))2 = Var(X) . c) X, Y unabhängig ⇒ Cov(X, Y ) = 0, da für unabhängige Zufallsvariablen E(XY ) = E(X) · E(Y ) gilt. 16.4 Satz a) X, Y unabhängig ⇒ ρ(X, Y ) = 0 b) ρ(X, Y ) = 1 ⇔ Es existieren a, b mit Y = aX + b, a > 0 c) ρ(X, Y ) = −1 ⇔ Es existieren a, b mit Y = aX + b, a < 0 65 denn: 1. gilt nach 3. in Bemerkung 16.3 und der defn von ρ(X, Y ). zu 2. und 3. ⇐ Sei Y = aX + b. Dann ist E(Y ) = aE(X) + b und V ar(Y ) = a2 V ar(X). Somit ( ) X − E(X) a(X − E(X)) ρ(X, Y ) = E p · p V ar(X) a2 V ar(X) (X − E(X))2 a E = |a| V ar(X) a 1 = · · E(X − E(X))2 {z } |a| V ar(X) | =V ar(X) a = |a| +1, falls a > 0 = −1, falls a < 0 16.5 Bemerkung 1. in Satz 16.4 bedeutet, daß unabhängige Zufallsvariablen stets unkorreliert sind. Die Umkehrung gilt nicht, wie das folgende Beispiel zeigt! Sind zwei Zufallsvariablen unkorreliert, so bedeutet dies nur, daß keine lineare Abhängigkeit besteht. 16.6 Beispiel Die Zufallsvariablen X und Y besitzen folgende gemeinsame Verteilung: X\Y −1 0 1 qj −1 0 0 1 4 1 4 0 1 4 1 2 0 1 4 1 0 1 4 0 pi 1 4 1 2 1 4 1 4 Es gilt: E(X) = 0 = E(Y ) , E(X · Y ) = 0 Also: Cov(X, Y ) = ρ(X, Y ) = 0 Es gilt aber z. B.: P (X = 1, Y = 0) = P (X = 1) · P (Y = 0) = 1 4 1 1 1 · = 4 2 8 Somit sind X und Y zwar unkorreliert, aber nicht unabhängig. ρ(X, Y ) = 0 heißt nur, daß keine lineare Abhängigkeit besteht. Die Abhängigkeit zwischen X und Y ist hier nichtlinear. 16.7 Definition (Schätzfunktion für ρ(X, Y )) Sind (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) jeweils Paare von Zufallsvariablen, dann schätzt man Cov(X, Y ) durch n SX,Y = 1 X (Xi − X)(Yi − Y ) . n − 1 i=1 66 Schätzt man die jeweiligen Standardabweichungen durch v v u u n n u 1 X u 1 X 2 t SX = (Xi − X) und SY = t (Yi − Y )2 , n − 1 i=1 n − 1 i=1 so ist SX,Y SX · SY eine Schätzfunktion für den Korrelationskoeffizienten. r= 16.8 Bemerkung a) Für Beispiel 16.1 gilt: r = 0, 9924. b) Für eine Berechnung von SX,Y , SX , SY in der in defn 16.7 angegebenen Form müßte man zunächst die Mittelwerte X, Y berechnen. Eine Alternative für praktische Rechnungen ergibt sich aus den folgenden Umformungen. n SX,Y = = 1 X (Xi Yi − XYi − Y Xi + X Y ) n − 1 i=1 X n n n X X 1 Xi Yi − X Yi −Y Xi +nX Y n−1 i=1 i=1 i=1 | {z } | {z } =nY = bzw. SX v u u =t n X 1 n−1 Xi Yi − nX Y =nX ! i=1 n 1 X 2 2 ( X − nX ) , n − 1 i=1 i v u u SY = t n 1 X 2 2 ( Y − nY ) n − 1 i=1 i Wir beschäftigen uns im folgenden mit der sogenannten Methode der kleinsten Fehlerquadrate. Es wird diejenige Gerade gesucht, die die durch die Stichprobe gegebene Punktwolke in einem festzulegenden Sinne bestmöglich approximiert. Man sucht diejenige Gerade, sogenannte Ausgleichsgerade, bei der die Summe der zu den Stichprobenpunkten in y-Richtung quadrierten Abstände möglichst klein wird. Auf der Grundlage einer konkreten Stichprobe {(x1 , y1 ), . . . , (xn , yn )} soll eine Geradengleichung ŷ = a1 x + a0 angegeben werden, so daß (mit der Bezeichnung ŷi = ŷ(xi )) n X (yi − ŷi )2 = i=1 n X (yi − a1 xi − a0 )2 i=1 möglichst klein wird. Wir suchen also das Minimum der Funktion g(a0 , a1 ) = n X (yi − a1 xi − a0 )2 . i=1 Notwendige Bedingungen für ein Minimum sind: ∂g (a0 , a1 ) ∂a0 = −2 ∂g (a0 , a1 ) ∂a1 = −2 n X (yi − a1 xi − a0 ) = 0 i=1 n X i=1 67 xi (yi − a1 xi − a0 ) = 0 In Matrix- Vektorschreibweise bedeutet dies Pn Pn n a0 yi i=1 xi i=1 P P P = n n n 2 a1 i=1 xi i=1 xi i=1 xi yi Als Lösung des linearen Gleichungssystems erhält man mit Hilfe der Cramerschen Regel =ny =nx a1 z }| { z }| { n n X X Pn n i=1 xi yi − ( xi )( yi ) i=1 = i=1 n X Pn 2 n i=1 xi − ( xi )2 i=1 | {z } =(nx)2 =(n−1)sx,y z n X }| { xi yi − nxy n i=1 · n n X x2i − nx2 = i=1 | {z =(n−1)s2x sx,y s2x sy = r· sx } = a0 = = Pn i=1 y yi Pn Pn 2 i=1 xi Pn Pn x2i − i=1 xi yi i=1 xi n(n − 1)Sx2 | {z } i=1 (Nenner wie oben) Pn − x i=1 xi yi + (n − 1)s2x =(n−1)s2x nx2 y − nx2 y =(n−1)sx,y z z }| { }| { n n X X y( x2i − nx2 ) −x ( xi yi − nxy) = i=1 i=1 (n − 1)s2x sx,y s2x sy = y−x·r· sx = y−x· 16.9 Beispiel Für das Beispiel 16.1 erhält man a0 = 0, 199 und a1 = 2, 6 d. h. ŷ = 0, 199 + 2, 6x als Ausgleichsgerade. 16.10 Bemerkung Vermutet man allgemein eher eine polynomiale Abhängigkeit, so versucht man z. B. eine quadratische, 68 kubische Ausgleichsparabel, etc. zu finden. Man sucht also ein Minimum von g(a0 , ..., am ) = n X (yi − pm (xi ))2 , i=1 wobei pm (x) = m X ak xk k=0 mit m ≤ n (in der Regel m << n). Geht man wie oben vor (Nullsetzen der partiellen Ableitungen), so führt dies auf das lineare Gleichungssystem (sogenanntes System der Normalgleichungen) P P 2 P m P n xi . . . xi a0 yi P P x2i P a1 xi xi ... P xi yi .. .. x2i yi . . = . .. . . . . . . P m P m P m+1 P 2m x y i i am xi xi ... ... xi Die Lösung liefert die gesuchten Koeffizienten a0 , a1 , ..., am . 16.11 Beispiel Untersuchung des Zusammenhangs zwischen Bremsweg w(in m) und Geschwindigkeit v (in km/h) eines bestimmten Autotyps. i 1 2 3 4 5 Messungen: vi 40 70 100 130 150 wi 14 39 78 120 153 Ansatz: w = a2 v 2 + a1 v + a0 Nach Berechnung der erforderlichen Summen erhalten wir das System der Normalgleichungen: 5 490 55900 a0 404 490 55900 6979000 a1 = 49640 6464000 55900 697900 918430000 a2 Lösung: a0 = −11, 23 a1 = 0, 437217 a2 = 0, 004399 d. h. die Ausgleichsparabel ŵ = 0, 004399 · v 2 + 0, 437217 · v − 11, 23 16.12 Beispiel (Exponentielles Verhalten) Folgende Daten seien beobachtet worden: xi 1 2 3 4 yi 2,5 3,9 7,8 15,0 Man vermutet, daß näherungsweise ein Zusammenhang der Form ŷ = a · 2bx besteht. Logarithmiert man diesen Ansatz, so erhält man: ln ŷ = ln (a · 2bx ) = ln a + b · x · ln 2 = a0 + a1 x mit a0 = ln a , a1 = b · ln 2 , 69 d. h. wir vermuten einen linearen Zusammenhang zwischen x und ln ŷ = ẑ. Zugehörige Tabelle: 1 2 3 4 xi zi = ln yi 0,92 1,4 2,1 2,7 und erhalten die Ausgleichsgerade ẑ = 0, 24 + 0, 61x . Für ŷ bedeutet das mit a = ea0 = 1, 27 und b = a1 ln 2 = 0, 88 ŷ = eẑ = 1, 27 · 20,88·x = 1, 27 · 1, 84x 16.13 Bemerkung Durch entsprechende Ansätze kann man auch andere nichtlineare Ausgleichsprobleme analog zu 16.12 behandeln. Vergleiche zum Beispiel Tabelle 4 in Papula, Band 3, Seite 716. 70