Statistik (Informations- & Prozesstechnologien) Dies’ ist kein Selbstlernskript, sondern lediglich als Hilfe für die Vorlesung gedacht. Es enthält u.a. etliche Lückentexte. Studiengang: BBA/BAIM/BST an der FOM Münster Zudem ist es nur für die Vorlesung ’Statistik’ gedacht, die ich halte. Alle Angaben sind (wie immer) ohne Gewähr. D.h. Fehler sind menschlich und bitte ich somit zu entschuldigen... Ingo Manfraß (TEAM Dr. Kowalski) Ingo Manfraß 19. März 2016 Kapitel I §1 Deskriptive Statistik Grundlagen Konvention“ für indizierte lateinische Buchstaben ” • Verteilung (Vtlg.) • Parameter Kleinbuchstaben h3,fi Großbuchstaben H3,Fk einzelne Werte alle bis zum Index aufsummierten Werte • Stichprobe (Stp.) • Grundgesamtheit (GG) 1 2 Quicky Zähle die Daten aus und vervollständige die Tabelle: Noten §1.1 Begrifflichkeiten x∗i Strichliste absolute relative kumulierte Häufigkeit Häufigkeit rel. Häufigkeit hi fi Fi 1 Beispiel In einem Kurs fallen 25 Mathe-Noten an: 2 3,3,5,2,4,2,3,3,4,2,3,3,2,4,3,4,1,1,5,4,3,1,2,4,3 3 4 5 6 Σ 3 4 Absolute Häufigkeiten [Quelle: Matsam] Aus der letzten Spalte kann man die folgenden Dinge ablesen: . . . Durchfallquote . . . sind besser als 4 . . . sind schlechter als 3 5 6 Definition Gegeben seien n Beobachtungswerte (Zahlen) x1, . . . , xn. Dann heißt das Tupel (Vektor) x = (x1, . . . ,xn) eine Stichprobe vom Umfang n. Die einzelnen Zahlen xi nennt man Stichprobenwerte. Die in der Stichprobe vorkommenden unterschiedlichen Werte x∗k ; d.h. x∗ = (x∗1, . . . ,x∗s ) heißen Merkmalwerte. Die Anzahl des Auftretens von x∗k in x; d.h. Bemerkung Es gilt dabei hk = n s X fk = 1 k=1 bzw. k=1 und h(x∗k ) = hk Abk. 0 ≤ fk ≤ 1 heißt absolute Häufigkeit von x∗k in x; die Quotienten h fk = k n heißen relative Häufigkeiten. s X für alle k 8 7 Das Summenzeichen Relative Häufigkeiten [Quelle: Matsam] Für eine aufsummierte Folge von Zahlen, die einem Schema folgen, führt man die sogenannte Summenschreibweise ein: Statt 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + ··· + n schreibt man kurz mit ak = k die Summe in der Form: n X ak k=1 9 10 Rechenregeln: Vervielfachung einer Summe b X Beispiel 5 X k=a λ · xk = λ · b X xk k=a mit λ ∈ R k= k=3 12 11 Aufteilung einer Summe Addition zweier Summen b X k=a xk + b X k=a yk = b X b X xk + y k k=a k=a 13 xk = c X k=a xk + b X xk mit a < c < b k=c+1 14 Quicky Berechne soweit wie möglich: a) 12 P Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten fk . Dann heißt die Summe der relativen Häufigkeiten derjenigen Merkmalwerte x∗i , die kleiner oder gleich x∗k sind, also k k=10 b) 5 P 3 k=−5 c) 100 P (3k + 2) (Nutze: k=1 d) 100 P k=1 100 P X x∗i ≤x∗k k = 5050) die relative Summenhäufigkeit bzw. kumulierte relative Häufigkeit von x∗k in x. k=1 2k − 99 P fi = Fk 2k k=0 15 16 Tabelle zur Körpergröße von Kindern [Quelle: Matsam] Definition (empirische Verteilungsfunktion) Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und relativen Summenhäufigkeiten Fi. Dann heißt die Funktion F : R → [0; 1] mit F (x) = 0 Fi 1 mit x < x∗1 mit x∗i ≤ x < x∗i+1 mit x ≥ x∗s empirische Verteilungsfunktion der Stichprobe x 17 18 Diagramm zur rel. und kom. Häufigkeit [Quelle: Matsam] §1.2 Lageparameter Fallbeispiel 1 Ein Kiosk-Betreiber ist mit sechs Filialen im Markt und plant die Eröffnung eines siebten Standortes. Dazu soll ein neuer Mitarbeiter angeworben werden. Die sechs vorhandenen Mitarbeiter verdienen an den unterschiedlich frequentierten Standorten die folgenden Bruttogehälter: x = (950,1200,1370,1580,1650,1800) x̄ = x̃ = 19 20 Fallbeispiel 1 Der mittlere Verdienst x̄ beträgt also 1425. Dem Betreiber der Trinkhallen erscheint dieser Durchschnittsverdienst bei der Anwerbung eines neuen Mitarbeiters nicht besonders attraktiv zu sein. Er befürchtet, bei diesen Verdienstmöglichkeiten keinen Mitarbeiter gewinnen zu können. Er kommt daraufhin zu dem Schluß, seinen eigenen Verdienst von brutto 6000 mitzuberücksichtigen. Schließlich gehört er ja auch zum Stab der Mitarbeiter, wenn auch in exponierter Position. Er legt also zur Berechnung des Durchschnittsverdienstes die erweiterte Stichprobe: xneu = (950,1200,1370,1580,1650,1800,6000) zugrunde. x̄neu = x̃neu = 21 22 Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk . Dann heißt die reelle Zahl x̄ = n 1 X xi n i=1 x(1) ≤ x(2) ≤ · · · ≤ x(n) Dann heißt die reelle Zahl s 1 X hk · x∗k = n k=1 = s X k=1 Definition Sei x = (x1, . . . ,xn) eine Stichprobe und xg = (x(1),x(2), . . . ,x(n)) die der Größe nach angeordnete Stichprobe, also x n+1 2 x̃ = 1 2 x( n ) + x( n +1) 2 2 fk · x∗k mit n ungerade mit n gerade der empirische Median oder Zentralwert von x. arithmetischer bzw. empirischer Mittelwert. 23 24 Quicky An einer Sägemaschine wurden in sechs Messungen folgende Verschnitte in Zentimetern festgestellt: 3,3,14,3,2,3 Definition Sei x = (x1, . . . ,xn) eine Stichprobe, dann heißt jeder Merkmalwert x∗i , der am häufigsten in x vorkommt, Modus bzw. Modalwert xD . Wieviel durchschnittlichen Verschnitt muss der Betreiber seinen Kunden nennen? • Arithmetisches Mittel: • Median: • Modus: 25 26 Quicky Von 10 Mitarbeitern eines Unternehmens beziehen neun ein Jahreseinkommen von je 40.000 EURO, einer (nämlich der Geschäftsführer) ein Jahreseinkommen von 400.000 EURO, so lässt sich das Durchschnittseinkommen wie folgt bestimmen: Quicky Ermittle die Graphen der zugehörigen empirischen Verteilungsfunktion F und ermittle jeweils auf zweifache Art den zugehörigen Median (aus der Tabelle und der Verteilungsfunktion). a) • Arithmetisches Mittel: • Median: b) x∗k Fk x∗k Fk 2 0.15 1 0.12 3 0.50 2 0.32 4 0.60 3 0.68 5 1.00 4 0.92 5 1.00 • Modus: 27 28 Mögliche Kandidaten für ein Streuungsmaß: §1.3 Streuungsmaße Streungsmaße sind Maße für die Repräsentanz des Mittelwertes x̄. Beispiel Berechne Mittelwert und Median für die beiden Stichproben x und y mit ① Arithmetisches Mittel der Abstände n 1 X (xi−x̄) = n i=1 x = (3,3,3,4,4,4,5,6) und y = (−26, − 10,0,4,10,20,30) 29 30 ② Arithmetisches Mittel der absoluten Abstände bzw. mittlere absolute Abweichung n 1 X |xi − x̄| n i=1 ③ Arithmetisches Mittel der Abstandsquadrate bzw. empirische Varianz Quicky Berechne jeweils die Varianz für x und y aus obigem Beispiel. Für x: Für y: n 1 X (xi − x̄)2 n i=1 32 31 Definition Sei x = (x1, . . . ,xn) eine Stichprobe mit Auszählung x∗ = (x∗1, . . . ,x∗s ) und Häufigkeiten hk und fk . Dann heißen s2 n (x) = n 1 X (xi − x̄)2 n i=1 = s 1 X hk (x∗k − x̄)2 n k=1 = s X k=1 bzw. s2 n−1 (x) = n n 1 X 1 X (xi − x̄)2 = (x2 − 2xix̄ + x̄2) n i=1 n i=1 i n n n X X 1 X x̄2 2xix̄ + x2 = i − n i=1 i=1 i=1 n n n X X 1 X 2 1 = x + x̄ x2 − 2x̄ i n i=1 i i=1 i=1 fk (x∗k − x̄)2 n 1 X = x2 − 2nx̄2 + nx̄2 n i=1 i n 1 X (xi − x̄)2 n − 1 i=1 die empirische Varianz und die zugehörige positive Wurzel q s = + s2 empirische Standardabweichung von x. s2 n (x) = 33 n 1 X x2 − nx̄2 = n i=1 i = n 1 X x2 − x̄2 n i=1 i 34 Quicky Berechne die Varianzen für x und y aus obigem Beispiel mittels einer geeigneten Tabelle: a) 2 Warum gibt es zwei Varianzversionen s2 n und sn−1 ? b) xi x2 i yi yi2 3 3 3 s2 n−1 ist zu verwenden, wenn man damit die Grundgesamtheitsvarianz σ 2 schätzen will. 4 4 4 5 6 35 36 Ein weiteres Streuungsmaß ist die Spannweite: Synchronisationsformel Definition Die Spannweite r(x) einer Stichprobe x = (x1, . . . ,xn) ist die positive Differenz des größten und kleinsten Merkmalwertes von x. n s2 (x) s2 n−1 (x) = n−1 n n n i=1 i=1 r(x) = max{xi} − min{xi} 37 38 §1.4 Mehrdimensionale Stichproben Mit mehrdimensional ist hier zweidimensional gemeint. Beispiel Körpergröße xi und Körpergewicht yi xi 170 165 173 180 161 168 171 176 169 179 yi 75 60 64 79 62 76 71 72 65 85 39 40 Beispiel Drehzahl xi und Leistung yi xi 800 1500 2500 3500 4200 4700 5000 5500 yi 12 20 31 40 52 60 65 70 41 42 Definition Gegeben seien n Paare (x1,y1), . . . ,(xn,yn) von Zahlenwerten, die an n Individuen bzgl. zweier Merkmale ermittelt werden. Dann heißt (x,y) = (x1,y1), . . . ,(xn,yn) Daraus folgt: bzw. hik = n r s X X fik = 1 i=1 k=1 eine zweidimensionale Stichprobe vom Umfang n. Falls die beiden Merkmale x,y die unterschiedlichen Werte x∗1, . . . ,x∗s r s X X y1∗ , . . . ,yr∗ i=1 k=1 haben, so können in der Stichprobe die s · r Merkmalpaare (x∗i ,yk∗) vorkommen. Die absolute Häufigkeit des Merkmalpaares (x∗i ,yk∗) bezeichnet man mit hik , die relative Häufigkeiten mit fik := 0 ≤ fik ≤ 1 für alle i,k hik n 44 43 Veranschaulichung zweidimensionaler Häufigkeitsverteilungen mittels Kontingenztafeln: (hik ) Zweidimensionale Verteilungen [Quelle: Matsam] 45 y1∗ y2∗ ... yk∗ ... yr∗ x∗1 h11 h12 ... h1k ... h1r x∗2 ... h21 ... h22 ... ... ... h2k ... ... ... h2r ... x∗i ... hi1 ... hi2 ... ... ... hik ... ... ... hir ... x∗s hs1 hs2 ... hsk ... hsr 46 §1.5 Korrelation Einführung eines neuen Parameters als Maß für den Zusammenhang der Merkmale x und y. Beispiel Die Randhäufigkeiten“ h·k , hi· nennt man Randverteilun” gen der zweidimensionalen Stichprobe (x,y). annähernd linear steigend diffus 47 48 Generalvoraussetzung 2 s2 x := sn−1 Erinnerung Empirische Kovarianz: x = (x1, . . . ,xn) sxy = Varianz: s2 x = n n 1 X 1 X (xi − x̄)2 = (xi − x̄)(xi − x̄) n − 1 i=1 n − 1 i=1 (x,y) = (x1,y1), . . . ,(xn,yn) n 1 X (xi − x̄)(yi − ȳ) n − 1 i=1 49 50 Überträgt man diese Normierung, so erhält man: Definition Normierung der Varianz zur Standardabweichung: q sx = + s2 x = Sei (x,y) = (x1,y1), . . . ,(xn,yn) mensionale Stichprobe; dann heißt s2 x sxy r(x,y) = =v u sx · sy u sx t n P i=1 n P i=1 eine zweidi- (xi − x̄)(yi − ȳ) (xi − x̄)2 ! n P i=1 (yi − ȳ)2 ! der empirische Korrelationskoeffizient von (x,y)“. ” 51 52 Also: Arbeitstaugliche Version: r(x,y) = v u u t r(x,y) = v u ? n P i=1 2 x2 i − nx̄ ! n P i=1 yi2 − nȳ 2 u t ! n P i=1 n P i=1 xiyi − nx̄ȳ 2 x2 i − nx̄ ! n P i=1 yi2 − nȳ 2 ! Arbeitstabelle: mit ?= n X i=1 xiyi − nx̄ȳ 53 54 Hauptsatz (Eigenschaften von r(x,y)) Für den empirischen Korrelationskoeffizienten r einer zweidimensionalen Stichprobe (x,y) = (x1,y1), . . . ,(xn,yn) gilt: a) −1 ≤ r ≤ 1 c) Liegen alle Punkte (xi,yi) auf einer Geraden a + bx, so gilt: b) Aus |r| = 1 folgt die lineare Beziehung yi = a + bxi 1 r= −1 für i = 1,2, . . . ,n mit für b > 0 für b < 0 Im Fall b = 0 ist wegen sy = 0 der Korrelationkoeffizient nicht definiert. s a = ȳ − rx̄ · sxy s b = r · sxy Die Punkte (xi,yi) liegen also auf einer Geraden, die für r = −1 fallend und für r = 1 steigend ist. 55 56 57 58 Bemerkung Für den Korrelationkoeffizienten r gilt: 0 < |r| < 0.2 sehr geringe Korrelation 0.2 < |r| < 0.5 geringe Korrelation 0.5 < |r| < 0.7 mittlere Korrelation 0.7 < |r| < 0.9 hohe Korrelation 0.9 < |r| < 1 sehr hohe Korrelation c) Arbeitstabelle Fallbeispiel 3 Berechne den Korrelationskoeffizienten zum Drehzahl-Beispiel. Gehe dabei wie folgt vor: a) Arbeitstabelle aufstellen b) Empirischen Korrelationskoeffizienten r bestimmen xi yi 800 12 1500 20 2500 31 3500 40 4200 52 4700 60 5000 65 5500 70 59 60 d) xiyi − nx̄ȳ r(x,y) = q P P 2 ( xi − nx̄2)( yi2 − nȳ 2) P §1.6 Regression = Interpolation und Extrapolation von Daten. = 61 62 Konstruktion: Methode der kleinsten Quadrate nach C.F. Gauß (KQ-Schätzer) Gesucht: ŷ = a + bx Optimalgerade 63 f (a,b) := n X i=1 di = n X i=1 yi − (a + bxi) 2 → minimieren 64 Herleitung mit der Mittelwertpunktbedingung. (x̄,ȳ) liegt auf der gesuchten Geraden, d.h. ȳ = a + bx̄ ⇔ a = ȳ − bx̄ Ersetzt man nun in f a durch ȳ − bx̄, so reduziert sich f zu einer eindimensionalen reellwertigen Funktion. f ist also eine reellwertige Funktion vom Typ f : R2 → R 65 66 Dieses liefert als Lösung: n P (yi − ȳ)(xi − x̄) sxy b = i=1 P = 2 n sx (xi − x̄)2 Definition Die oben konstruierte Optimalgerade ŷ = a + bx i=1 und heißt empirischer“ Regressionskoeffizient. ” Er ist die Steigung der gesuchten Optimalgerade. Mit der Mittelwertpunktbedingung (a = ȳ − bx̄) ist ŷ = a + bx dann bestimmt. heißt empirische Regressionsgerade oder empirisches Regressionspolynom ersten Grades. 68 67 Fallbeispiel 3 Berechne die Regeressionsgerade zum DrehzahlBeispiel Polynom 2. Grades 69 Polynom höheren Grades 70 Fallbeispiel 4 a) Das Regressionspolynom 2. Grades ist ŷ = 11.952,77 − 13,8012x + 0,003974x2 Ein Regressionspolynom höheren Grades ist etwa ŷ = a + bx + cx2 Die zugehörigen Koeffizienten a, b und c erhält man durch lösen des linearen Gleichungssystems, das sich aus den zugehörigen drei partiellen Ableitungen ergibt. Diese heißen Normalengleichungen“. ” 71 b) Berechnung der Trendwerte ŷ 72 c) Schätzung der Bevölkerung im Jahr 1945 d) Schätzung der Bevölkerung im Jahr 1960 Fazit: Bei nichtlinearen Regressionsfunktionen sollte man auf Extrapolationen verzichten. e) Schätzung der Bevölkerung im Jahr 1840 73 74 Kapitel II §2 Induktive Statistik Zufallsvariable Funktion der Stichprobenwerte; d.h. der Wert ist noch nicht zugewiesen. Grundlagen der ind. Statistik Wahrscheinlichkeitsfunktion Ordnet jedem Ereignis eine Wahrscheinlichkeit zu. §2.1 Zufallsvariablen Dichtefunktion Ordnet jedem Ereignis einen Wert zu. Konvention“ für lateinische Buchstaben ” Kleinbuchstaben x,y,z Großbuchstaben X,Y,Z realisierte Stichprobenwerte Verteilungsfunktion Kumulierte Wahrscheinlichkeitsfunktion Zufallsvariable 76 75 deskriptiv x = (x1,x2, . . . ,xn) −→ induktiv −→ X = (X1,X2, . . . ,Xn) Stichprobe mit Merkmalswerten xi fi = f (xi) Zufallsvektor mit Zufallsvariablen Xi −→ relative Häufigkeit Fi = P j≤i Wahrscheinlichkeitsfunktion fj −→ relative Summenhäufigkeit x̄ Empirische Varianz F = P f Verteilungsfunktion −→ Empirischer Mittelwert s2 n−1 (x) f Bemerkung Eine Zufallsfvariable X heißt diskret, wenn X höchstens abzählbar“ viele verschiedene Werte an” nehmen kann, andernfalls stetig. E(X) Stochastischer Erwartungswert −→ Var(X) Stochastische Varianz 77 78 Definition Ein Maß für die Sicherheit des Eintretens eines Ereignisses ist die Wahrscheinlichkeit. Die Wahrscheinlichkeit, mit der eine diskrete Zufallsvariable X die spezielle Ausprägung (bzw. Realisation, Funktionswert) x annimmt, wird mit Bemerkung Der Wahrscheinlichkeitsbegriff nach Laplace. Sei A ein Ereignis, dann gilt W (A) = Anzahl der Günstigen Anzahl aller Möglichkeiten W (X = x) bezeichnet. 79 80 Beispiel Schüler aus dem Notenbeispiel Beispiel Einmaliger Würfelwurf X= X= Wahrscheinlichkeit, dass ein zufällig getroffener Schüler aus dem Notenbeispiel die Note 3 hat: Wahrscheinlichkeit, dass eine 4 gewürfelt wird: 81 82 Beispiel Zweimaliger Münzwurf Beispiel Dreimaliger Münzwurf X= X= Wahrscheinlichkeit, dass einmal Wappen fällt: Wahrscheinlichkeit, dass zweimal Wappen fällt: 83 84 Beispiel Beim dreimaligen Münzwurf gilt wieder: Definition Die Funktion f , die jeder Ausprägung x einer diskreten Zufallsvariablen X die Wahrscheinlichkeit ihres Auftretens zuordnet, heißt Wahrscheinlichkeitsfunktion f der diskreten Zufallsvariablen X (induktives Pendant zu den relativen Häufigkeiten). D.h. W (X = 0) = W (X = 1) = W (X = 2) = f (x) = W (X = x) W (X = 3) = 85 86 Quicky Zufallsexperiment: Ein Schüler aus dem Notenbeispiel wird zufällig auf dem Schulflur getroffen. Zufallsvariable: X = Note des Schülers Definition Sei ein Zufallsexperiment mit Ω gegeben und sei X eine diskrete Zufallsvariable. Dann heißt die Funktion F , die jeder Ausprägung x von X die Wahrscheinlichkeit zuordnet, dass X höchstens den Wert x annimmt, also F (x) := W (X ≤ x) Verteilungsfunktion der diskreten Zufallsvariablen X. 87 f (x) = W (X = x) F (x) = W (X ≤ x) 0 f (0) = F (0) = 1 f (1) = F (1) = 2 f (2) = F (2) = 3 f (3) = F (3) = f (x) = W (X = x) F (x) = W (X ≤ x) 1 f (1) = F (1) = 2 f (2) = F (2) = 3 f (3) = F (3) = 4 f (4) = F (4) = 5 f (5) = F (5) = 6 f (6) = F (6) = P 88 Schwierig: Wahrscheinlichkeitsfunktion bzw. Dichtefunktion f und Verteilungsfunktion F im stetigen Fall. Quicky Zufallsexperiment: dreimaliger Münzwurf Zufallsvariable: X = Anzahl der Wappen x x deskriptiv ... −→ −→ induktiv ... P 89 90 Vergleiche dreimaliger Münzwurf: Gegenüberstellung diskret stetig diskret W (a ≤ X ≤ b) = W (a ≤ X ≤ b) = stetig 92 91 Gegenüberstellung diskret W (X = a) = Gegenüberstellung stetig W (X = a) = diskret stetig Konsequenzen: Fazit: 93 94 Gegenüberstellung diskret stetig W (X ≤ a) = Übertrag aus der Deskriptiven Statistik: W (X ≤ a) = Empirischer Mittelwert x̄ = = Fazit: diskret = Fazit: stetig n 1 X xi n i=1 s 1 X hix∗i n i=1 s X fix∗i i=1 95 Stochastischer Erwartungswert 96 Empirische Varianz • diskret E(X) = X x f (x) · x s2 n (x) = = • stetig E(X) = Z∞ −∞ = f (x) · x dx n 1 X (xi − x̄)2 n i=1 s 1 X hi(x∗i − x̄)2 n i=1 s X i=1 97 fi(x∗i − x̄)2 98 Vereinbarung: (Statistischer Sprachgebrauch) Unter dem Begriff statistische Verteilung“ versteht man ” 4 Komponenten: Stochastische Varianz • diskret Var(X) = X x f (x) x − E(X) ① Wahrscheinlichkeitsfunktion f 2 ② Verteilungsfunktion F • stetig E(X) = Z∞ −∞ f (x) x − E(X) 2 ③ Stochastischer Erwartungswert E(X) dx ④ Stochastische Varianz Var(X) 99 100 Wie viele Möglichkeiten gibt es beim Lotto (6 aus 49) sechs Kugeln zu ziehen? §2.2 Diskrete Verteilungen Zum besseren Verständnis der bekannteren diskreten Verteilungen benötigt man einige Kenntnisse aus der Kombinatorik. 101 102 Binomialkoeffizient N n = Beispiel Wie Wahrscheinlich sind 6 Richtige im Lotto? N! (N − n)! · n! = = = 103 104 Die hypergeometrische Verteilung Variablen: N Voraussetzungen: n M • Merkmal ist dichotom M N x • Merkmal ist diskret x n : Grundgesamtheitsumfang : Stichprobenumfang : Anzahl der Merkmalsträger in der Grundgesamtheit = θ : Anteil der Merkmalsträger in der Grundgesamtheit : Anzahl der Merkmalsträger in der Stichprobe = p : Anteil der Merkmalsträger in der Stichprobe • Ziehen ohne Zurücklegen (ZoZ) 105 106 Verteilung: ① Wahrscheinlichkeitsfunktion f (x) = fH (x/N ; n; M ) = ③ Erwartungswert M N −M · n−x x E(X) = x N n Var(X) = X x x X f (x) · x = n · θ ④ Varianz ② Verteilungsfunktion F (x) = FH (x/N ; n; M ) = X f (x) x − E(X) 2 = nθ(1 − θ) N −n N −1 fH (ν) ν=1 107 Beispiel Gesucht ist die Wahrscheinlichkeit im Lotto (6 aus 49) 3 bzw. 4 Richtige zu tippen. 108 Fallbeispiel 6 Glühbirnenbeispiel, 3. Evolutionsstufe In einer Schachtel befinden sich 60 Glühbirnen. 20 davon sind defekt. Ohne Zurücklegen werden nacheinander 10 Stück gezogen. X = Anzahl brauchbarer Glühbirnen Berechne die Wahrscheinlichkeiten: a) Genau 7 brauchbare zu ziehen. b) Mindestens 1 brauchbare zu ziehen. 109 110 Die Binomialverteilung Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit bestehen 5% der Tagesproduktion einer Maschine statt aus Rechtshänder-Hämmern, aus Hämmer für Linkshänder. 20 Einheiten werden jeweils in einen Karton verpackt. Wie Wahrscheinlich ist es, dass bei einer Tagesproduktion von 1.000 Hämmern, ausschließlich Hämmer für Rechtshänder im Karton sind? Voraussetzungen: • Merkmal ist dichotom • Merkmal ist diskret • Ziehen mit Zurücklegen (ZmZ) 111 112 Verteilung: Variablen: N n M M N x x n ① Wahrscheinlichkeitsfunktion : Grundgesamtheitsumfang : Stichprobenumfang : Anzahl der Merkmalsträger in der Grundgesamtheit = θ : Anteil der Merkmalsträger in der Grundgesamtheit : Anzahl der Merkmalsträger in der Stichprobe = p : Anteil der Merkmalsträger in der Stichprobe n x f (x) = fB (x/n; θ) = θ (1 − θ)n−x x ② Verteilungsfunktion F (x) = FB (x/n; θ) = x X fB (ν) ν=1 113 114 ③ Erwartungswert E(X) = X x f (x) · x = n · θ Beispiel Die Wahrscheinlichkeit beträgt 1,86%, dass man beim einmaligen Lottospiel mindestens 3 Richtige hat, und somit gewonnen hat. Wenn man 52 Wochen lang Lotto spielt, wie wahrscheinlich ist es dann, mindestens 1-Mal in diesem Jahr im Lotto zu gewinnen? ④ Varianz Var(X) = X x f (x) x − E(X) 2 = nθ(1 − θ) 116 115 Beispiel Aufgrund einer produktionstechnischen Unabwendbarkeit besteht bei der Produktion von Hämmern bei jedem Hammer eine 5%-Wahrscheinlichkeit, dass er fehlerhaft produziert wird. Die Hämmer werden stets zu 20 in einem Karton verpackt. Wie Wahrscheinlich ist es, dass keine fehlerhaften Hämmer in einem zufällig ausgewähltem Karton sind? 117 §2.3 Stetige Verteilungen Die Gaußsche Normalverteilung ist die wichtigste stetige Verteilung. 118 10 DM-Schein [Quelle: Wikipedia] Gaußsche Normalverteilung ① Wahrscheinlichkeitsfunktion bzw. -dichte 1 x−µ 2 1 f (x) = fn(x/µ,σ 2) = √ · e− 2 ( σ ) σ 2π ② Verteilungsfunktion F (x) = Fn(x/µ,σ 2) = 119 Z x 1 ν−µ 2 1 √ · e− 2 ( σ ) dν −∞ σ 2π 120 1. Problem: Obige Funktionswerte (Fn) sind schwierig zu berechnen; also benötigt man Tabellen für die Funktionswerte. ③ Erwartungswert E(X) = µ ④ Varianz 2. Problem: Man benötigt für jedes Paar (µ,σ 2) eine eigene Tabelle! Var(X) = σ 2 121 122 Idee der Standardisierung“ ” Normalverteilung mit verschiedenen Parametern [Quelle: 123 Überträgt man die Idee der Standardisierung“ auf eine ” normalverteilte Zufallsvariable X mit Matsam] 124 Standardnormalverteilung E(X) = µ und Var(X) = σ 2, so ergibt sich: ① Wahrscheinlichkeitsfunktion bzw. -dichte 1 2 1 f (z) = fn(z) = √ · e− 2 z 2π X −µ Z := σ Z ist normalverteilt mit ② Verteilungsfunktion E(Z) = 0 und Var(Z) = 1 F (z) = Fn(z) = Man sagt dann auch kurz: Z z 1 2 1 √ · e− 2 ν dν −∞ 2π Z ist (0,1)-normalverteilt bzw. standardnormalverteilt“. ” 125 126 ③ Erwartungswert Konvention“ für Zufallsvariablen ” E(Z) = 0 X,Y ④ Varianz Z Var(Z) = 1 Realität Tabellen-/ Rechenwerte“ ” 128 127 Vergleich von Normal- und Standardnormalverteilung Tabellengebrauch: [Quelle: Matsam] z FN (−z) FN (−z) = 129 FN (z) FN (z) = D(z) D(z) = 130 Quicky Lies die folgenden Werte soweit möglich aus der Tabelle zur Standardnormalverteilung ab. Standardnormalverteilung mit ausgewählten Flächenanteilen [Quelle: Matsam] a) W (Z ≤ 1,06) b) W (Z ≤ −1,03) c) W (Z ≥ 1,13) d) In einem Unternehmen sei das Gehalt normalverteilt mit µ = 30.000 EURO und σ = 5.000 EURO. Berechne die Wahrscheinlichkeit, dass das Gehalt eines Mitarbeiters maximal 25.000 EURO beträgt. 131 Beispiel Materialiensammlung, 7. Übung, Aufgabe 1 Die Brenndauer einer bestimmten Sorte Glühlampen ist normalverteilt mit dem Mittelwert µ = 1.200 Stunden bei einer Standardabweichung von σ = 100 Stunden. a) Man berechne die Wahrscheinlichkeit dafür, dass eine zufällig ausgewählte Glühbirne weniger als 1.000 Stunden brennt. 132 Aufgabe 1 Baby“ Das Gewicht von neugeborenen Kin” dern sei normalverteilt mit µ = 3.200 g und σ = 800 g. a) Wie groß ist die Wahrscheinlichkeit, dass ein Neugeborenes i) mehr als 3.000 g, ii) höchstens 2.500 g, iii) zwischen 4 kg und 5 kg wiegt? b) Wie groß ist die Wahrscheinlichkeit dafür, dass eine zufällig ausgewählte Glühbirne eine Brenndauer von mehr als 1.100 Stunden besitzt? b) Wie schwer muss ein Neugeborenes sein, damit es zu den 20 % leichtesten gehört? c) Mit welcher Wahrscheinlichkeit liegt die Brenndauer einer zufällig ausgewählten Glühbirne zwischen 1.000 und 1.500 Stunden? c) Wie schwer muss ein Neugeborenes sein, damit es zu den 15 % schwersten gehört? 133 134 Aufgabe 2 Größe“ Für die Körpergröße von 18 − 20” jährigen Männern ergibt sich ein Mittelwert von 1,80 m bei einer Standardabweichung von 7,4 cm. Die Körpergröße kann als normalverteilt angesehen werden. a) Mit welcher Wahrscheinlichkeit ist ein zufällig ausgewählter Mann dieser Altersgruppe i) größer als 1,85 m, ii) zwischen 1,70 m und 1,80 m groß? b) Wie groß darf ein Mann maximal sein, damit er noch zu den 5 % der kleinsten Männer gehört? c) Benenne das 5 %-Quantil. Aufgabe 3 Waschmaschine“ Waschmaschinen sollen für ” einen Waschgang durchschnittlich 65 l Wasser verbrauchen. Ein Hersteller will erreichen, dass bei mindestens 95 % seiner Maschinen der Wasserverbrauch unter 75 l sinkt. Welche Standardabweichung darf die Maschine haben, wenn man voraussetzt, dass der Wasserverbrauch normalverteilt ist? d) In welchem symmetrischen Bereich um den Mittelwert liegen die Größen von 50 % aller Männer dieser Altersgruppe? 135 Beispiel Materialiensammlung, 7. Übung, Aufgabe 2 Firma X-AG hat festgestellt, dass die Lebensdauer ihrer Maschinen vom Typ A normalverteilt ist mit einem arithmetischen Mittel von 120.000 km. 3% der Motoren dieser Art fallen jedoch bereits bei einer Leistung bis zu 70.000 km aus. 136 §3 Einfache Schätzverfahren §3.1 Stichprobenverteilungen a) Wie groß ist der Produktionsanteil, der eine Lebensdauer von 150.000 km und mehr hat? (σ = 26.596) Wahrscheinlichkeitstheoretische Schätzung von Stichprobenparametern b) Man zeige, dass die Standardabweichung der Lebensdauer (gemessen in 1.000 km) der Typ A Maschinen 26,596 beträgt. 137 138 Die zuletzt praktizierten Schlußweisen“: ” W (xu ≤ X ≤ xo) =? 139 140 141 142 Betrachte X̄, so ergeben sich 2 Fragen: 1) Ist X̄ eine Zufallsvariable? 2) Wie ist X̄ verteilt? [Quelle: Matsam] §3.2 Zentraler Grenzwertsatz Satz (Zentraler Grenzwertsatz - Teil 1) Die Verteilung des arithmetischen Mittels X̄ von unabhängigen (z.B. Ziehen mit Zurücklegen), identisch verteilten Zufallsvariablen X1, X2, . . . , Xn strebt mit wachsendem Stichprobenumfang n (Faustregel: n > 30) gegen eine Normalverteilung mit dem Erwartungswert Satz (Zentraler Grenzwertsatz - Teil 2) Sind die Xi nicht unabhängig (z.B. Ziehen ohne Zurücklegen), so wird bei hinreichend großer Grundgesamtheit gegenüber dem Stichprobenumfang und großem Stichprobenumfang n (Faustregel: N > 2n und n > 30) ebenfalls eine Normalverteilung angenommen und zwar mit dem Erwartungswert E(X̄) = µ E(X̄) = µ und der Varianz und der Varianz Var(X̄) = σ2 n Var(X̄) = 143 σ2 N − n · n N −1 144 Fallbeispiel 8a) LKW-Reifen Bei der Untersuchung von 300 LKW-Reifen eines Fuhrunternehmens ergab sich eine durchschnittliche Profiltiefe von µ = 15,30 mm bei einer Standardabweichung von σ = 4,10 mm. Aus dieser Grungesamtheit werden 36 Reifen (ohne Zurücklegen) entnommen. Bezeichnung 2 • Var(X̄) = σX̄ Abk. −n • Der Faktor N N −1 heißt Korrekturfaktor für endliche Gesamtheiten“ ” i) Mit welcher Wahrscheinlichkeit 1 − α liegt die durchschnittliche Profiltiefe x̄ der Stichprobe zwischen 14,50 mm und 16,50 mm? Hilfe: Formelsammlung, Anhang B n < 0,05 vernachlässigt werden. Dieser Faktor kann bei N (d.h. ZmZ = ZoZ) 145 ii) Interpretiere diese Schlußweise aus der Sicht des Geprüften (Fuhrunternehmer)! 146 Fallbeispiel 9 Schraubenzieher, schwarze Version Ein Werkzeughersteller gibt an, dass eine bestimmte Sorte Schraubenzieher mit einer Breite von im Mittel µ = 5 mm eine Standardabweichung von σ = 1,5 mm hat. a) Man berechne die Wahrscheinlichkeit, dass die durchschnittliche Breite x̄ bei einer Lieferung von n = 900 Schraubenziehern zwischen 4,902 und 5,098 liegt. b) Interpretiere die Aufgabenstellung aus der Sicht beider Vertragspartner: Lieferant und Abnehmer! Macht es Sinn, Qualitätszertifizierungen mit Durchschnittswerten durchzuführen? Aus der Sicht des Abnehmers in Form von Qualitätskontrollen, aus der Sicht des Lieferanten in Form von Qualitätsgarantien? Aufgabe 4 Grubenstempel Ein Sägewerk liefert Grubenstempel als geschlossene Partie von 1.200 Stück, deren Länge normalverteilt ist mit einem Erwartungswert von 60 cm und einer Varianz von 36 cm2. Welchen Anteil der Stichproben wird einen Mittelwert zwischen 59 cm und 61 cm liefern, wenn a) der Stichprobenumfang 36 beträgt? b) der Stichprobenumfang 100 beträgt? 147 Aufgabe 5 Raumhöhe Die Raumhöhe der Häuser eines Bauunternehmens ist eine normalverteilte Zufallsvariable mit Erwartungswert 2,60 m und Varianz 0,09 m2. Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Raumhöhe bei 100 zufällig und unabhängig ausgewählten Gebäuden größer als 2,65 m ist? 148 Aufgabe 6 Mehltüten Eine Mehltüten-Abfüllanlage ist so eingestellt, dass das Füllgewicht X der 1 kg-Tüten normalverteilt mit einer Standardabweichung σ = 20 g ist. Es wird eine Stichprobe von 40 Tüten untersucht. Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe das durchschnittliche Füllgewicht X̄ a) mindestens 995 g beträgt, b) zwischen 994 g und 1010 g liegt? 149 150