Statistik (Informations- & Prozesstechnologien) Studiengang: BBA/BAIM/BST an der FOM Münster Ingo Manfraß (TEAM Dr. Kowalski) 19. März 2016 Dies’ ist kein Selbstlernskript, sondern lediglich als Hilfe für die Vorlesung gedacht. Es enthält u.a. etliche Lückentexte. Zudem ist es nur für die Vorlesung ’Statistik’ gedacht, die ich halte. Alle Angaben sind (wie immer) ohne Gewähr. D.h. Fehler sind menschlich und bitte ich somit zu entschuldigen... Ingo Manfraß Kapitel I §1 Deskriptive Statistik Grundlagen • Verteilung (Vtlg.) • Parameter • Stichprobe (Stp.) • Grundgesamtheit (GG) 1 Konvention“ für indizierte lateinische Buchstaben ” Kleinbuchstaben h3,fi Großbuchstaben H3,Fk einzelne Werte alle bis zum Index aufsummierten Werte 2 §1.1 Begrifflichkeiten Beispiel In einem Kurs fallen 25 Mathe-Noten an: 3,3,5,2,4,2,3,3,4,2,3,3,2,4,3,4,1,1,5,4,3,1,2,4,3 3 Quicky Zähle die Daten aus und vervollständige die Tabelle: Noten x∗i Strichliste absolute relative kumulierte Häufigkeit Häufigkeit rel. Häufigkeit hi fi Fi 1 2 3 4 5 6 Σ 4 Aus der letzten Spalte kann man die folgenden Dinge ablesen: . . . Durchfallquote . . . sind besser als 4 . . . sind schlechter als 3 5 Absolute Häufigkeiten [Quelle: Matsam] 6 Definition Gegeben seien n Beobachtungswerte (Zahlen) x1, . . . , xn. Dann heißt das Tupel (Vektor) x = (x1, . . . ,xn) eine Stichprobe vom Umfang n. Die einzelnen Zahlen xi nennt man Stichprobenwerte. Die in der Stichprobe vorkommenden unterschiedlichen Werte x∗k ; d.h. x∗ = (x∗1, . . . ,x∗s ) heißen Merkmalwerte. Die Anzahl des Auftretens von x∗k in x; d.h. h(x∗k ) = hk Abk. heißt absolute Häufigkeit von x∗k in x; die Quotienten h fk = k n heißen relative Häufigkeiten. 7 Bemerkung Es gilt dabei s X hk = n s X fk = 1 k=1 bzw. k=1 und 0 ≤ fk ≤ 1 für alle k 8 Relative Häufigkeiten [Quelle: Matsam] 9 Das Summenzeichen Für eine aufsummierte Folge von Zahlen, die einem Schema folgen, führt man die sogenannte Summenschreibweise ein: Statt 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ··· + n schreibt man kurz mit ak = k die Summe in der Form: n X ak k=1 10 Beispiel 5 X k= k=3 11 Rechenregeln: Vervielfachung einer Summe b X k=a λ · xk = λ · b X k=a xk mit λ ∈ R 12 Addition zweier Summen b X xk + k=a b X yk = k=a b X xk + y k k=a 13 Aufteilung einer Summe b X k=a xk = c X k=a xk + b X xk mit a < c < b k=c+1 14 Quicky Berechne soweit wie möglich: a) 12 P k k=10 b) 5 P 3 k=−5 c) 100 P (3k + 2) (Nutze: k=1 d) 100 P k=1 100 P k = 5050) k=1 2k − 99 P 2k k=0 15 Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten fk . Dann heißt die Summe der relativen Häufigkeiten derjenigen Merkmalwerte x∗i , die kleiner oder gleich x∗k sind, also X x∗i ≤x∗k fi = Fk die relative Summenhäufigkeit bzw. kumulierte relative Häufigkeit von x∗k in x. 16 Definition (empirische Verteilungsfunktion) Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und relativen Summenhäufigkeiten Fi. Dann heißt die Funktion F : R → [0; 1] mit F (x) = 0 Fi 1 mit x < x∗1 mit x∗i ≤ x < x∗i+1 mit x ≥ x∗s empirische Verteilungsfunktion der Stichprobe x 17 Tabelle zur Körpergröße von Kindern [Quelle: Matsam] 18 Diagramm zur rel. und kom. Häufigkeit [Quelle: Matsam] 19 §1.2 Lageparameter Fallbeispiel 1 Ein Kiosk-Betreiber ist mit sechs Filialen im Markt und plant die Eröffnung eines siebten Standortes. Dazu soll ein neuer Mitarbeiter angeworben werden. Die sechs vorhandenen Mitarbeiter verdienen an den unterschiedlich frequentierten Standorten die folgenden Bruttogehälter: x = (950,1200,1370,1580,1650,1800) x̄ = x̃ = 20 Fallbeispiel 1 Der mittlere Verdienst x̄ beträgt also 1425. Dem Betreiber der Trinkhallen erscheint dieser Durchschnittsverdienst bei der Anwerbung eines neuen Mitarbeiters nicht besonders attraktiv zu sein. Er befürchtet, bei diesen Verdienstmöglichkeiten keinen Mitarbeiter gewinnen zu können. Er kommt daraufhin zu dem Schluß, seinen eigenen Verdienst von brutto 6000 mitzuberücksichtigen. Schließlich gehört er ja auch zum Stab der Mitarbeiter, wenn auch in exponierter Position. Er legt also zur Berechnung des Durchschnittsverdienstes die erweiterte Stichprobe: xneu = (950,1200,1370,1580,1650,1800,6000) zugrunde. x̄neu = x̃neu = 21 22 Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk . Dann heißt die reelle Zahl n 1 X xi x̄ = n i=1 s 1 X hk · x∗k = n k=1 = s X k=1 fk · x∗k arithmetischer bzw. empirischer Mittelwert. 23 Definition Sei x = (x1, . . . ,xn) eine Stichprobe und xg = (x(1),x(2), . . . ,x(n)) die der Größe nach angeordnete Stichprobe, also x(1) ≤ x(2) ≤ · · · ≤ x(n) Dann heißt die reelle Zahl x n+1 2 x̃ = 1 2 x( n ) + x( n +1) 2 2 mit n ungerade mit n gerade der empirische Median oder Zentralwert von x. 24 Definition Sei x = (x1, . . . ,xn) eine Stichprobe, dann heißt jeder Merkmalwert x∗i , der am häufigsten in x vorkommt, Modus bzw. Modalwert xD . 25 Quicky An einer Sägemaschine wurden in sechs Messungen folgende Verschnitte in Zentimetern festgestellt: 3,3,14,3,2,3 Wieviel durchschnittlichen Verschnitt muss der Betreiber seinen Kunden nennen? • Arithmetisches Mittel: • Median: • Modus: 26 Quicky Von 10 Mitarbeitern eines Unternehmens beziehen neun ein Jahreseinkommen von je 40.000 EURO, einer (nämlich der Geschäftsführer) ein Jahreseinkommen von 400.000 EURO, so lässt sich das Durchschnittseinkommen wie folgt bestimmen: • Arithmetisches Mittel: • Median: • Modus: 27 Quicky Ermittle die Graphen der zugehörigen empirischen Verteilungsfunktion F und ermittle jeweils auf zweifache Art den zugehörigen Median (aus der Tabelle und der Verteilungsfunktion). b) a) x∗k Fk x∗k Fk 2 0.15 1 0.12 3 0.50 2 0.32 4 0.60 3 0.68 5 1.00 4 0.92 5 1.00 28 §1.3 Streuungsmaße Streungsmaße sind Maße für die Repräsentanz des Mittelwertes x̄. Beispiel Berechne Mittelwert und Median für die beiden Stichproben x und y mit x = (3,3,3,4,4,4,5,6) und y = (−26, − 10,0,4,10,20,30) 29 Mögliche Kandidaten für ein Streuungsmaß: ① Arithmetisches Mittel der Abstände n 1 X (xi−x̄) = n i=1 30 ② Arithmetisches Mittel der absoluten Abstände bzw. mittlere absolute Abweichung n 1 X |xi − x̄| n i=1 ③ Arithmetisches Mittel der Abstandsquadrate bzw. empirische Varianz n 1 X (xi − x̄)2 n i=1 31 Quicky Berechne jeweils die Varianz für x und y aus obigem Beispiel. Für x: Für y: 32 Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk . Dann heißen n 1 X 2 sn(x) = (xi − x̄)2 n i=1 s 1 X = hk (x∗k − x̄)2 n k=1 s X = k=1 bzw. s2 n−1 (x) = fk (x∗k − x̄)2 n 1 X (xi − x̄)2 n − 1 i=1 die empirische Varianz und die zugehörige positive Wurzel q s = + s2 empirische Standardabweichung von x. s2 n (x) = 33 n n 1 X 1 X 2 (xi − x̄)2 = (x2 i − 2xi x̄ + x̄ ) n i=1 n i=1 = n X n X n X 1 x2 2xix̄ + x̄2 i − n i=1 i=1 i=1 n n n X X 1 X 2 2 1 x − 2x̄ xi + x̄ = n i=1 i i=1 i=1 = n X 1 x2 − 2nx̄2 + nx̄2 n i=1 i n 1 X 2 = x2 i − nx̄ n i=1 = n 1 X 2 x2 i − x̄ n i=1 34 Quicky Berechne die Varianzen für x und y aus obigem Beispiel mittels einer geeigneten Tabelle: a) b) xi x2 i yi yi2 3 3 3 4 4 4 5 6 35 2 Warum gibt es zwei Varianzversionen s2 n und sn−1 ? s2 n−1 ist zu verwenden, wenn man damit die Grundgesamtheitsvarianz σ 2 schätzen will. 36 Synchronisationsformel s2 n−1 (x) = n s2 (x) n−1 n 37 Ein weiteres Streuungsmaß ist die Spannweite: Definition Die Spannweite r(x) einer Stichprobe x = (x1, . . . ,xn) ist die positive Differenz des größten und kleinsten Merkmalwertes von x. n n i=1 i=1 r(x) = max{xi} − min{xi} 38 §1.4 Mehrdimensionale Stichproben Mit mehrdimensional ist hier zweidimensional gemeint. Beispiel Körpergröße xi und Körpergewicht yi xi 170 165 173 180 161 168 171 176 169 179 yi 75 60 64 79 62 76 71 72 65 85 39 40 Beispiel Drehzahl xi und Leistung yi xi 800 1500 2500 3500 4200 4700 5000 5500 yi 12 20 31 40 52 60 65 70 41 42 Definition Gegeben seien n Paare (x1,y1), . . . ,(xn,yn) von Zahlenwerten, die an n Individuen bzgl. zweier Merkmale ermittelt werden. Dann heißt (x,y) = (x1,y1), . . . ,(xn,yn) eine zweidimensionale Stichprobe vom Umfang n. Falls die beiden Merkmale x,y die unterschiedlichen Werte x∗1, . . . ,x∗s bzw. y1∗ , . . . ,yr∗ haben, so können in der Stichprobe die s · r Merkmalpaare (x∗i ,yk∗) vorkommen. Die absolute Häufigkeit des Merkmalpaares (x∗i ,yk∗) bezeichnet man mit hik , die relative Häufigkeiten mit fik := hik n 43 Daraus folgt: s X r X hik = n s X r X fik = 1 i=1 k=1 i=1 k=1 0 ≤ fik ≤ 1 für alle i,k 44 Zweidimensionale Verteilungen [Quelle: Matsam] 45 Veranschaulichung zweidimensionaler Häufigkeitsverteilungen mittels Kontingenztafeln: (hik ) y1∗ y2∗ ... yk∗ ... yr∗ x∗1 h11 h12 ... h1k ... h1r x∗2 ... h21 ... h22 ... ... ... h2k ... ... ... h2r ... x∗i ... hi1 ... hi2 ... ... ... hik ... ... ... hir ... x∗s hs1 hs2 ... hsk ... hsr 46 Die Randhäufigkeiten“ h·k , hi· nennt man Randverteilun” gen der zweidimensionalen Stichprobe (x,y). 47 §1.5 Korrelation Einführung eines neuen Parameters als Maß für den Zusammenhang der Merkmale x und y. Beispiel diffus annähernd linear steigend 48 Generalvoraussetzung 2 s2 x := sn−1 Erinnerung x = (x1, . . . ,xn) Varianz: s2 x = n n 1 X 1 X (xi − x̄)2 = (xi − x̄)(xi − x̄) n − 1 i=1 n − 1 i=1 (x,y) = (x1,y1), . . . ,(xn,yn) 49 Empirische Kovarianz: sxy = n 1 X (xi − x̄)(yi − ȳ) n − 1 i=1 50 Normierung der Varianz zur Standardabweichung: sx = + s2 2 sx = x sx q 51 Überträgt man diese Normierung, so erhält man: Definition Sei (x,y) = (x1,y1), . . . ,(xn,yn) mensionale Stichprobe; dann heißt sxy =v r(x,y) = u sx · sy u t n P i=1 n P i=1 eine zweidi- (xi − x̄)(yi − ȳ) (xi − x̄)2 ! n P i=1 (yi − ȳ)2 ! der empirische Korrelationskoeffizient von (x,y)“. ” 52 Arbeitstaugliche Version: r(x,y) = v u u t ? n P i=1 2 x2 i − nx̄ ! n P i=1 yi2 − nȳ 2 ! mit ?= n X i=1 xiyi − nx̄ȳ 53 Also: r(x,y) = v u u t n P i=1 n P i=1 xiyi − nx̄ȳ 2 x2 i − nx̄ ! n P i=1 yi2 − nȳ 2 ! Arbeitstabelle: 54 Hauptsatz (Eigenschaften von r(x,y)) Für den empirischen Korrelationskoeffizienten r einer zweidimensionalen Stichprobe (x,y) = (x1,y1), . . . ,(xn,yn) gilt: a) −1 ≤ r ≤ 1 b) Aus |r| = 1 folgt die lineare Beziehung yi = a + bxi für i = 1,2, . . . ,n mit s a = ȳ − rx̄ · sxy s b = r · sxy Die Punkte (xi,yi) liegen also auf einer Geraden, die für r = −1 fallend und für r = 1 steigend ist. 55 c) Liegen alle Punkte (xi,yi) auf einer Geraden a + bx, so gilt: 1 r= −1 für b > 0 für b < 0 Im Fall b = 0 ist wegen sy = 0 der Korrelationkoeffizient nicht definiert. 56 Bemerkung Für den Korrelationkoeffizienten r gilt: 0 < |r| < 0.2 sehr geringe Korrelation 0.2 < |r| < 0.5 geringe Korrelation 0.5 < |r| < 0.7 mittlere Korrelation 0.7 < |r| < 0.9 hohe Korrelation 0.9 < |r| < 1 sehr hohe Korrelation 57 58 Fallbeispiel 3 Berechne den Korrelationskoeffizienten zum Drehzahl-Beispiel. Gehe dabei wie folgt vor: a) Arbeitstabelle aufstellen b) Empirischen Korrelationskoeffizienten r bestimmen 59 c) Arbeitstabelle xi yi 800 12 1500 20 2500 31 3500 40 4200 52 4700 60 5000 65 5500 70 60 d) xiyi − nx̄ȳ r(x,y) = q P 2 )(P y 2 − nȳ 2 ) ( x2 − nx̄ i i P = = 61 §1.6 Regression Interpolation und Extrapolation von Daten. 62 Gesucht: ŷ = a + bx Optimalgerade 63 Konstruktion: Methode der kleinsten Quadrate nach C.F. Gauß (KQ-Schätzer) 64 f (a,b) := n X i=1 di = n X i=1 yi − (a + bxi) 2 → minimieren f ist also eine reellwertige Funktion vom Typ f : R2 → R 65 Herleitung mit der Mittelwertpunktbedingung. (x̄,ȳ) liegt auf der gesuchten Geraden, d.h. ȳ = a + bx̄ ⇔ a = ȳ − bx̄ Ersetzt man nun in f a durch ȳ − bx̄, so reduziert sich f zu einer eindimensionalen reellwertigen Funktion. 66 Dieses liefert als Lösung: b= n P i=1 (yi − ȳ)(xi − x̄) n P i=1 (xi − x̄)2 = sxy s2 x und heißt empirischer“ Regressionskoeffizient. ” Er ist die Steigung der gesuchten Optimalgerade. Mit der Mittelwertpunktbedingung (a = ȳ − bx̄) ist ŷ = a + bx dann bestimmt. 67 Definition Die oben konstruierte Optimalgerade ŷ = a + bx heißt empirische Regressionsgerade oder empirisches Regressionspolynom ersten Grades. 68 Fallbeispiel 3 Berechne die Regeressionsgerade zum DrehzahlBeispiel 69 Polynom 2. Grades Polynom höheren Grades 70 Ein Regressionspolynom höheren Grades ist etwa ŷ = a + bx + cx2 Die zugehörigen Koeffizienten a, b und c erhält man durch lösen des linearen Gleichungssystems, das sich aus den zugehörigen drei partiellen Ableitungen ergibt. Diese heißen Normalengleichungen“. ” 71 Fallbeispiel 4 a) Das Regressionspolynom 2. Grades ist ŷ = 11.952,77 − 13,8012x + 0,003974x2 b) Berechnung der Trendwerte ŷ 72 c) Schätzung der Bevölkerung im Jahr 1945 d) Schätzung der Bevölkerung im Jahr 1960 e) Schätzung der Bevölkerung im Jahr 1840 73 Fazit: Bei nichtlinearen Regressionsfunktionen sollte man auf Extrapolationen verzichten. 74 Kapitel II §2 Induktive Statistik Grundlagen der ind. Statistik §2.1 Zufallsvariablen Konvention“ für lateinische Buchstaben ” Kleinbuchstaben x,y,z Großbuchstaben X,Y,Z realisierte Stichprobenwerte Zufallsvariable 75 Zufallsvariable Funktion der Stichprobenwerte; d.h. der Wert ist noch nicht zugewiesen. Wahrscheinlichkeitsfunktion Ordnet jedem Ereignis eine Wahrscheinlichkeit zu. Dichtefunktion Ordnet jedem Ereignis einen Wert zu. Verteilungsfunktion Kumulierte Wahrscheinlichkeitsfunktion 76 deskriptiv x = (x1,x2, . . . ,xn) −→ induktiv −→ X = (X1,X2, . . . ,Xn) Stichprobe mit Merkmalswerten xi fi = f (xi) Zufallsvektor mit Zufallsvariablen Xi −→ relative Häufigkeit Fi = P j≤i Wahrscheinlichkeitsfunktion fj −→ relative Summenhäufigkeit x̄ Empirische Varianz F = P f Verteilungsfunktion −→ Empirischer Mittelwert s2 n−1 (x) f E(X) Stochastischer Erwartungswert −→ Var(X) Stochastische Varianz 77 Bemerkung Eine Zufallsfvariable X heißt diskret, wenn X höchstens abzählbar“ viele verschiedene Werte an” nehmen kann, andernfalls stetig. 78 Definition Ein Maß für die Sicherheit des Eintretens eines Ereignisses ist die Wahrscheinlichkeit. Die Wahrscheinlichkeit, mit der eine diskrete Zufallsvariable X die spezielle Ausprägung (bzw. Realisation, Funktionswert) x annimmt, wird mit W (X = x) bezeichnet. 79 Bemerkung Der Wahrscheinlichkeitsbegriff nach Laplace. Sei A ein Ereignis, dann gilt W (A) = Anzahl der Günstigen Anzahl aller Möglichkeiten 80 Beispiel Einmaliger Würfelwurf X= Wahrscheinlichkeit, dass eine 4 gewürfelt wird: 81 Beispiel Schüler aus dem Notenbeispiel X= Wahrscheinlichkeit, dass ein zufällig getroffener Schüler aus dem Notenbeispiel die Note 3 hat: 82 Beispiel Zweimaliger Münzwurf X= Wahrscheinlichkeit, dass einmal Wappen fällt: 83 Beispiel Dreimaliger Münzwurf X= Wahrscheinlichkeit, dass zweimal Wappen fällt: 84 Definition Die Funktion f , die jeder Ausprägung x einer diskreten Zufallsvariablen X die Wahrscheinlichkeit ihres Auftretens zuordnet, heißt Wahrscheinlichkeitsfunktion f der diskreten Zufallsvariablen X (induktives Pendant zu den relativen Häufigkeiten). D.h. f (x) = W (X = x) 85 Beispiel Beim dreimaligen Münzwurf gilt wieder: W (X = 0) = W (X = 1) = W (X = 2) = W (X = 3) = 86 Definition Sei ein Zufallsexperiment mit Ω gegeben und sei X eine diskrete Zufallsvariable. Dann heißt die Funktion F , die jeder Ausprägung x von X die Wahrscheinlichkeit zuordnet, dass X höchstens den Wert x annimmt, also F (x) := W (X ≤ x) Verteilungsfunktion der diskreten Zufallsvariablen X. 87 Quicky Zufallsexperiment: Ein Schüler aus dem Notenbeispiel wird zufällig auf dem Schulflur getroffen. Zufallsvariable: X = Note des Schülers x f (x) = W (X = x) F (x) = W (X ≤ x) 1 f (1) = F (1) = 2 f (2) = F (2) = 3 f (3) = F (3) = 4 f (4) = F (4) = 5 f (5) = F (5) = 6 f (6) = F (6) = P 88 Quicky Zufallsexperiment: dreimaliger Münzwurf Zufallsvariable: X = Anzahl der Wappen x f (x) = W (X = x) F (x) = W (X ≤ x) 0 f (0) = F (0) = 1 f (1) = F (1) = 2 f (2) = F (2) = 3 f (3) = F (3) = P 89 Schwierig: Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f und Verteilungsfunktion F im stetigen Fall. deskriptiv ... −→ −→ induktiv ... 90 Vergleiche dreimaliger Münzwurf: diskret stetig 91 Gegenüberstellung diskret W (a ≤ X ≤ b) = stetig W (a ≤ X ≤ b) = 92 Gegenüberstellung diskret W (X = a) = stetig W (X = a) = Fazit: 93 Gegenüberstellung diskret stetig Konsequenzen: 94 Gegenüberstellung diskret stetig W (X ≤ a) = W (X ≤ a) = Fazit: diskret Fazit: stetig 95 Übertrag aus der Deskriptiven Statistik: Empirischer Mittelwert n 1 X xi x̄ = n i=1 s 1 X hix∗i = n i=1 = s X fix∗i i=1 96 Stochastischer Erwartungswert • diskret E(X) = X x • stetig E(X) = Z∞ −∞ f (x) · x f (x) · x dx 97 Empirische Varianz n 1 X 2 (xi − x̄)2 sn(x) = n i=1 s 1 X = hi(x∗i − x̄)2 n i=1 s X fi(x∗i − x̄)2 = i=1 98 Stochastische Varianz • diskret Var(X) = X x • stetig E(X) = Z∞ −∞ f (x) x − E(X) f (x) x − E(X) 2 2 dx 99 Vereinbarung: (Statistischer Sprachgebrauch) Unter dem Begriff statistische Verteilung“ versteht man ” 4 Komponenten: ① Wahrscheinlichkeitsfunktion f ② Verteilungsfunktion F ③ Stochastischer Erwartungswert E(X) ④ Stochastische Varianz Var(X) 100 §2.2 Diskrete Verteilungen Zum besseren Verständnis der bekannteren diskreten Verteilungen benötigt man einige Kenntnisse aus der Kombinatorik. 101 Wie viele Möglichkeiten gibt es beim Lotto (6 aus 49) sechs Kugeln zu ziehen? 102 Binomialkoeffizient N = n N! (N − n)! · n! = = = 103 Beispiel Wie Wahrscheinlich sind 6 Richtige im Lotto? 104 Die hypergeometrische Verteilung Voraussetzungen: • Merkmal ist dichotom • Merkmal ist diskret • Ziehen ohne Zurücklegen (ZoZ) 105 Variablen: N n M M N x x n : Grundgesamtheitsumfang : Stichprobenumfang : Anzahl der Merkmalsträger in der Grundgesamtheit = θ : Anteil der Merkmalsträger in der Grundgesamtheit : Anzahl der Merkmalsträger in der Stichprobe = p : Anteil der Merkmalsträger in der Stichprobe 106 Verteilung: ① Wahrscheinlichkeitsfunktion f (x) = fH (x/N ; n; M ) = M N −M · x n−x N n ② Verteilungsfunktion F (x) = FH (x/N ; n; M ) = x X fH (ν) ν=1 107 ③ Erwartungswert E(X) = X x f (x) · x = n · θ ④ Varianz Var(X) = X x f (x) x − E(X) 2 = nθ(1 − θ) N −n N −1 108 Beispiel Gesucht ist die Wahrscheinlichkeit im Lotto (6 aus 49) 3 bzw. 4 Richtige zu tippen. 109 Fallbeispiel 6 Glühbirnenbeispiel, 3. Evolutionsstufe In einer Schachtel befinden sich 60 Glühbirnen. 20 davon sind defekt. Ohne Zurücklegen werden nacheinander 10 Stück gezogen. X = Anzahl brauchbarer Glühbirnen Berechne die Wahrscheinlichkeiten: a) Genau 7 brauchbare zu ziehen. b) Mindestens 1 brauchbare zu ziehen. 110 Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit bestehen 5% der Tagesproduktion einer Maschine statt aus Rechtshänder-Hämmern, aus Hämmer für Linkshänder. 20 Einheiten werden jeweils in einen Karton verpackt. Wie Wahrscheinlich ist es, dass bei einer Tagesproduktion von 1.000 Hämmern, ausschließlich Hämmer für Rechtshänder im Karton sind? 111 Die Binomialverteilung Voraussetzungen: • Merkmal ist dichotom • Merkmal ist diskret • Ziehen mit Zurücklegen (ZmZ) 112 Variablen: N n M M N x x n : Grundgesamtheitsumfang : Stichprobenumfang : Anzahl der Merkmalsträger in der Grundgesamtheit = θ : Anteil der Merkmalsträger in der Grundgesamtheit : Anzahl der Merkmalsträger in der Stichprobe = p : Anteil der Merkmalsträger in der Stichprobe 113 Verteilung: ① Wahrscheinlichkeitsfunktion n x n−x θ (1 − θ) f (x) = fB (x/n; θ) = x ② Verteilungsfunktion F (x) = FB (x/n; θ) = x X fB (ν) ν=1 114 ③ Erwartungswert E(X) = X x f (x) · x = n · θ ④ Varianz Var(X) = X x f (x) x − E(X) 2 = nθ(1 − θ) 115 Beispiel Die Wahrscheinlichkeit beträgt 1,86%, dass man beim einmaligen Lottospiel mindestens 3 Richtige hat, und somit gewonnen hat. Wenn man 52 Wochen lang Lotto spielt, wie wahrscheinlich ist es dann, mindestens 1-Mal in diesem Jahr im Lotto zu gewinnen? 116 Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit besteht bei der Produktion von Hämmern bei jedem Hammer eine 5%-Wahrscheinlichkeit, dass er fehlerhaft produziert wird. Die Hämmer werden stets zu 20 in einem Karton verpackt. Wie Wahrscheinlich ist es, dass keine fehlerhaften Hämmer in einem zufällig ausgewähltem Karton sind? 117 §2.3 Stetige Verteilungen Die Gaußsche Normalverteilung ist die wichtigste stetige Verteilung. 118 10 DM-Schein [Quelle: Wikipedia] 119 Gaußsche Normalverteilung ① Wahrscheinlichkeitsfunktion bzw. -dichte 1 x−µ 2 1 f (x) = fn(x/µ,σ 2) = √ · e− 2 ( σ ) σ 2π ② Verteilungsfunktion F (x) = Fn(x/µ,σ 2) = Z x 1 ν−µ 2 1 √ · e− 2 ( σ ) dν −∞ σ 2π 120 ③ Erwartungswert E(X) = µ ④ Varianz Var(X) = σ 2 121 1. Problem: Obige Funktionswerte (Fn) sind schwierig zu berechnen; also benötigt man Tabellen für die Funktionswerte. 2. Problem: Man benötigt für jedes Paar (µ,σ 2) eine eigene Tabelle! 122 Idee der Standardisierung“ ” 123 Normalverteilung mit verschiedenen Parametern [Quelle: Matsam] 124 Überträgt man die Idee der Standardisierung“ auf eine ” normalverteilte Zufallsvariable X mit E(X) = µ und Var(X) = σ 2, so ergibt sich: Z := X −µ σ Z ist normalverteilt mit E(Z) = 0 und Var(Z) = 1 Man sagt dann auch kurz: Z ist (0,1)-normalverteilt bzw. standardnormalverteilt“. ” 125 Standardnormalverteilung ① Wahrscheinlichkeitsfunktion bzw. -dichte 1 2 1 f (z) = fn(z) = √ · e− 2 z 2π ② Verteilungsfunktion F (z) = Fn(z) = Z z 1 2 1 √ · e− 2 ν dν −∞ 2π 126 ③ Erwartungswert E(Z) = 0 ④ Varianz Var(Z) = 1 127 Konvention“ für Zufallsvariablen ” X,Y Z Realität Tabellen-/ Rechenwerte“ ” 128 Vergleich von Normal- und Standardnormalverteilung [Quelle: Matsam] 129 Tabellengebrauch: z FN (−z) FN (−z) = FN (z) FN (z) = D(z) D(z) = 130 Quicky Lies die folgenden Werte soweit möglich aus der Tabelle zur Standardnormalverteilung ab. a) W (Z ≤ 1,06) b) W (Z ≤ −1,03) c) W (Z ≥ 1,13) d) In einem Unternehmen sei das Gehalt normalverteilt mit µ = 30.000 EURO und σ = 5.000 EURO. Berechne die Wahrscheinlichkeit, dass das Gehalt eines Mitarbeiters maximal 25.000 EURO beträgt. 131 Standardnormalverteilung mit ausgewählten Flächenanteilen [Quelle: Matsam] 132 Beispiel Materialiensammlung, 7. Übung, Aufgabe 1 Die Brenndauer einer bestimmten Sorte Glühlampen ist normalverteilt mit dem Mittelwert µ = 1.200 Stunden bei einer Standardabweichung von σ = 100 Stunden. a) Man berechne die Wahrscheinlichkeit dafür, dass eine zufällig ausgewählte Glühbirne weniger als 1.000 Stunden brennt. b) Wie groß ist die Wahrscheinlichkeit dafür, dass eine zufällig ausgewählte Glühbirne eine Brenndauer von mehr als 1.100 Stunden besitzt? c) Mit welcher Wahrscheinlichkeit liegt die Brenndauer einer zufällig ausgewählten Glühbirne zwischen 1.000 und 1.500 Stunden? 133 Aufgabe 1 Baby“ Das Gewicht von neugeborenen Kin” dern sei normalverteilt mit µ = 3.200 g und σ = 800 g. a) Wie groß ist die Wahrscheinlichkeit, dass ein Neugeborenes i) mehr als 3.000 g, ii) höchstens 2.500 g, iii) zwischen 4 kg und 5 kg wiegt? b) Wie schwer muss ein Neugeborenes sein, damit es zu den 20 % leichtesten gehört? c) Wie schwer muss ein Neugeborenes sein, damit es zu den 15 % schwersten gehört? 134 Aufgabe 2 Größe“ Für die Körpergröße von 18 − 20” jährigen Männern ergibt sich ein Mittelwert von 1,80 m bei einer Standardabweichung von 7,4 cm. Die Körpergröße kann als normalverteilt angesehen werden. a) Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Mann dieser Altersgruppe i) größer als 1,85 m, ii) zwischen 1,70 m und 1,80 m groß? b) Wie groß darf ein Mann maximal sein, damit er noch zu den 5 % der kleinsten Männer gehört? c) Benenne das 5 %-Quantil. d) In welchem symmetrischen Bereich um den Mittelwert liegen die Größen von 50 % aller Männer dieser Altersgruppe? 135 Aufgabe 3 Waschmaschine“ Waschmaschinen sollen für ” einen Waschgang durchschnittlich 65 l Wasser verbrauchen. Ein Hersteller will erreichen, dass bei mindestens 95 % seiner Maschinen der Wasserverbrauch unter 75 l sinkt. Welche Standardabweichung darf die Maschine haben, wenn man voraussetzt, dass der Wasserverbrauch normalverteilt ist? 136 Beispiel Materialiensammlung, 7. Übung, Aufgabe 2 Firma X-AG hat festgestellt, dass die Lebensdauer ihrer Maschinen vom Typ A normalverteilt ist mit einem arithmetischen Mittel von 120.000 km. 3% der Motoren dieser Art fallen jedoch bereits bei einer Leistung bis zu 70.000 km aus. a) Wie groß ist der Produktionsanteil, der eine Lebensdauer von 150.000 km und mehr hat? (σ = 26.596) b) Man zeige, dass die Standardabweichung der Lebensdauer (gemessen in 1.000 km) der Typ A Maschinen 26,596 beträgt. 137 §3 Einfache Schätzverfahren §3.1 Stichprobenverteilungen Wahrscheinlichkeitstheoretische Schätzung von Stichprobenparametern 138 Die zuletzt praktizierten Schlußweisen“: ” 139 W (xu ≤ X ≤ xo) =? 140 Betrachte X̄, so ergeben sich 2 Fragen: 1) Ist X̄ eine Zufallsvariable? 2) Wie ist X̄ verteilt? 141 142 [Quelle: Matsam] §3.2 Zentraler Grenzwertsatz Satz (Zentraler Grenzwertsatz - Teil 1) Die Verteilung des arithmetischen Mittels X̄ von unabhängigen (z.B. Ziehen mit Zurücklegen), identisch verteilten Zufallsvariablen X1, X2, . . . , Xn strebt mit wachsendem Stichprobenumfang n (Faustregel: n > 30) gegen eine Normalverteilung mit dem Erwartungswert E(X̄) = µ und der Varianz σ2 Var(X̄) = n 143 Satz (Zentraler Grenzwertsatz - Teil 2) Sind die Xi nicht unabhängig (z.B. Ziehen ohne Zurücklegen), so wird bei hinreichend großer Grundgesamtheit gegenüber dem Stichprobenumfang und großem Stichprobenumfang n (Faustregel: N > 2n und n > 30) ebenfalls eine Normalverteilung angenommen und zwar mit dem Erwartungswert E(X̄) = µ und der Varianz σ2 N − n Var(X̄) = · n N −1 144 Bezeichnung 2 • Var(X̄) = σX̄ Abk. −n • Der Faktor N N −1 heißt Korrekturfaktor für endliche Gesamtheiten“ ” n < 0,05 vernachlässigt werden. Dieser Faktor kann bei N (d.h. ZmZ = ZoZ) 145 Fallbeispiel 8a) LKW-Reifen Bei der Untersuchung von 300 LKW-Reifen eines Fuhrunternehmens ergab sich eine durchschnittliche Profiltiefe von µ = 15,30 mm bei einer Standardabweichung von σ = 4,10 mm. Aus dieser Grungesamtheit werden 36 Reifen (ohne Zurücklegen) entnommen. i) Mit welcher Wahrscheinlichkeit 1 − α liegt die durchschnittliche Profiltiefe x̄ der Stichprobe zwischen 14,50 mm und 16,50 mm? Hilfe: Formelsammlung, Anhang B ii) Interpretiere diese Schlußweise aus der Sicht des Geprüften (Fuhrunternehmer)! 146 Fallbeispiel 9 Schraubenzieher, schwarze Version Ein Werkzeughersteller gibt an, dass eine bestimmte Sorte Schraubenzieher mit einer Breite von im Mittel µ = 5 mm eine Standardabweichung von σ = 1,5 mm hat. a) Man berechne die Wahrscheinlichkeit, dass die durchschnittliche Breite x̄ bei einer Lieferung von n = 900 Schraubenziehern zwischen 4,902 und 5,098 liegt. b) Interpretiere die Aufgabenstellung aus der Sicht beider Vertragspartner: Lieferant und Abnehmer! Macht es Sinn, Qualitätszertifizierungen mit Durchschnittswerten durchzuführen? Aus der Sicht des Abnehmers in Form von Qualitätskontrollen, aus der Sicht des Lieferanten in Form von Qualitätsgarantien? 147 Aufgabe 4 Grubenstempel Ein Sägewerk liefert Grubenstempel als geschlossene Partie von 1.200 Stück, deren Länge normalverteilt ist mit einem Erwartungswert von 60 cm und einer Varianz von 36 cm2. Welchen Anteil der Stichproben wird einen Mittelwert zwischen 59 cm und 61 cm liefern, wenn a) der Stichprobenumfang 36 beträgt? b) der Stichprobenumfang 100 beträgt? 148 Aufgabe 5 Raumhöhe Die Raumhöhe der Häuser eines Bauunternehmens ist eine normalverteilte Zufallsvariable mit Erwartungswert 2,60 m und Varianz 0,09 m2. Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Raumhöhe bei 100 zufällig und unabhängig ausgewählten Gebäuden größer als 2,65 m ist? 149 Aufgabe 6 Mehltüten Eine Mehltüten-Abfüllanlage ist so eingestellt, dass das Füllgewicht X der 1 kg-Tüten normalverteilt mit einer Standardabweichung σ = 20 g ist. Es wird eine Stichprobe von 40 Tüten untersucht. Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe das durchschnittliche Füllgewicht X̄ a) mindestens 995 g beträgt, b) zwischen 994 g und 1010 g liegt? 150