Prof. Dr. Günter Hellmig Aufgabenskript Induktive Statistik Inhalt: 1.Kombinatorik: Variation und Kombination, jeweils ohne Wiederholung 2.Rechnen mit Wahrscheinlichkeiten: Additions- und Multiplikationssätze 3.Rechnen mit Wahrscheinlichkeiten: Vierfeldertafel, bedingte Wahrscheinlichkeit 4.Allgemeine Verteilungen: Wahrscheinlichkeitsfunktion, Wahrscheinlichkeitssummenfunktion, Erwartungswert, Varianz 5.Binomialverteilung und Poissonverteilung: Berechnung von Wahrscheinlichkeiten 6.Normalverteilung: Berechnung von Wahrscheinlichkeiten, die zu einem bestimmten Intervall gehören 7.Normalverteilung: Berechnung von Ereignissen, die zu einer bestimmten Wahrscheinlichkeit gehören 8.Normalverteilung: Berechnung von Intervallen, die zu einer bestimmten Wahrscheinlichkeit gehören 9.Schätzverfahren: Berechnung des Zufallsstreubereichs für einen Mittelwert 10.Schätzverfahren: Berechnung des Vertrauensbereichs für einen Mittelwert 11.Schätzverfahren: Berechnung des Vertrauensbereichs für einen Anteilswert und dessen Umrechnung 12.Schätzverfahren: Berechnung des Vertrauensbereichs für einen Mittelwert und Verwendung der t-Verteilung *** Das vorliegende Aufgabenskript gehört zur Teil-Lehrveranstaltung „Induktive Statistik“ und ist gemäß dem Vorlesungsablauf thematisch geordnet. Das Skript resultiert aus Klausuraufgaben der letzten Jahre. Bei der Prüfungsvorbereitung wird empfohlen, die Aufgaben „blind“ zu bearbeiten, d.h. ohne ständigen Blick auf die Musterlösung. – Die Bearbeitungszeit für die Aufgaben ist im Durchschnitt mit 15 Minuten zu veranschlagen; im Einzelnen sind es - je nach Anzahl der Unterfragen und je nach Schwierigkeitsgrad – 10 bis 20 Minuten. Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 1. An einem Pferderennen nehmen 10 Pferde teil. – Wie hoch ist die Wahrscheinlichkeit (Prozent), dass man – wenn man keine Kenntnis über die Stärken der einzelnen Pferde hat – folgende Ergebnisse richtig voraussagt: a) b) c) d) Siegendes Pferd Die ersten drei Pferde in der Reihenfolge des Einlaufs Die ersten drei Pferde ohne Berücksichtigung der Reihenfolge Wie hoch wären die drei Wahrscheinlichkeiten zu a) bis c), wenn man Kenntnis hat, dass ein bestimmtes Pferd siegen wird (und von dieser Kenntnis bei der Voraussage Gebrauch macht)? e) Wie hoch wären die drei Wahrscheinlichkeiten zu a) bis c), wenn man Kenntnis hat, dass ein bestimmtes Pferd nicht siegen wird (und von dieser Kenntnis bei der Voraussage Gebrauch macht)? ____________________________________________________________________________ Lösung: a) b) c) Pr(A) = n(A) 1 = n(I) 10 n! 10! = = 8 ⋅ 9 ⋅ 10 (n − k)! (10 − 3)! 1 Pr(A) = = 0,00139 720 Vk (n) = n 10 10 ⋅ 9 ⋅ 8 Ck (n) = = = 1 ⋅ 2⋅3 k 3 1 Pr(A) = = 0,00833 120 d)(1) Pr(A) = (2) Vk (n) = Pr(A) = (3) Ck (n) = Pr(A) = e)(1) Pr(A) = (2) Vk (n) = Pr(A) = (3) Ck (n) = Pr(A) = n(A) = 1 n(I) n! 9! = = 8⋅9 (n − k)! (9 − 2)! 1 = 0,01389 72 n 9 9 ⋅8 = = 1⋅ 2 k 2 1 = 0,02778 36 n(A) 1 = n(I) 9 n! 9! = = 7⋅8⋅9 (n − k)! (9 − 3)! 1 = 0,00198 504 n 9 9 ⋅8⋅7 = = 1 ⋅ 2⋅3 k 3 1 = 0,01190 84 → 10 (Prozent) = 720 → 0,139 (Prozent) = 120 → 0,833 (Prozent) → 100 = (Prozent) 72 → 1,389 (Prozent) = 36 → 2,778 (Prozent) →11,111 (Prozent) = 504 → 0,198 (Prozent) = 84 → 1,190 (Prozent) Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 2. Die Wahrscheinlichkeit (bei einem älteren Ehepaar), dass der Mann noch in 20 Jahren lebt, sei 30 %, und dass die Frau noch in 20 Jahren lebt, sei 40 %. a) Wie groß ist die Wahrscheinlichkeit (Prozent), dass (1) beide noch in 20 Jahren leben, (2) mindestens eine Person noch in 20 Jahren lebt, (3) nur der Mann noch in 20 Jahren lebt, (4) beide in 20 Jahren nicht mehr leben? b) Welche Annahme liegt den Berechnungen zugrunde? (Annahme kurz benennen und erläutern!) ____________________________________________________________________________ Lösung: a)(1) p(A ∩ B) 0,3·0,4 = p(A) ⋅ p(B) = 0,12 → 12 (Prozent) (2) p(A ∪ B) 0,3+0,4-0,3·0,4 = p(A) + p(B) − p(A) ⋅ p(B) = 0,58 → 58 (Prozent) (3) p(A \ A ∩ B) 0,3-0,3·0,4 = p(A) − p(A) ⋅ p(B) = 0,18 → 18 (Prozent) (4) p(A ∩ B ) (1-0,3)·(1-0,4) = p(A) ⋅ p(B) = 0,42 → 42 (Prozent) b) Unabhängigkeit Die Überlebenswahrscheinlichkeit des einen Ehepartners ändert sich nicht, wenn der andere Ehepartner stirbt. Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 3. Zur Herstellung eines Artikels werden drei Maschinen X, Y und Z eingesetzt, die unabhängig voneinander arbeiten. Maschine X, die 60 Prozent der Gesamtproduktion herstellt, hat eine Ausschuss-Quote von 0,01; für Maschine Y lauten die entsprechenden Werte 30 Prozent und 0,04; für Maschine Z sind es 10 Prozent und 0,07. a) Erstellen Sie eine (vollständige) Mehrfeldertafel! b) Wie groß ist – bei Zufallsauswahl – die Wahrscheinlichkeit (Prozent), dass (1) ein mangelhaftes Stück von Maschine X stammt, (2) ein mangelfreies Stück von Maschine Y stammt, (3) ein von Maschine Y stammendes Stück mangelfrei ist, (4) ein von Maschine Z stammendes Stück mangelfrei ist? ____________________________________________________________________________ Lösung: a) B = mangelfrei (2) (3) (4) ∑ X 0,594 0,01 · 0,6 = 0,006 0,6 Y 0,288 0,04 · 0,3 = 0,012 0,3 Z 0,093 0,07 · 0,1 = 0,007 0,1 0,975 0,025 1,0 ∑ b)(1) B = mangelhaft p(X p(Y p(B p(B p(X ∩ B ) p(B ) 0,006 = = 0,24 0,025 B) = p(Y ∩ B) p(B) 0,288 = = 0,2954 0,975 → 24 % B) = p(B ∩ Y ) p(Y ) 0,288 = = 0,96 0,3 → 29,54 % Y) = p(B ∩ Z) p(Z) 0,093 = = 0,93 0,1 → 96 % Z) = → 93 % Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 4. Ein Handwerksbetrieb kalkuliert, dass die Arbeitszeit für einen bestimmten Auftrag zwischen 30 und 40 Stunden dauern wird, und zwar: 30 32 37 40 Stunden Stunden Stunden Stunden mit mit mit mit einer einer einer einer Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit von von von von 15 45 30 10 Prozent Prozent Prozent Prozent a) Erstellen Sie grafisch die Wahrscheinlichkeitsfunktion und die Wahrscheinlichkeitssummenfunktion! b) Berechnen Sie den Erwartungswert und die Varianz! ____________________________________________________________________________ Lösung: a) 1,00 Pj 0,90 0,80 0,70 pj 0,60 0,50 0,50 0,40 0,40 0,30 0,30 0,20 0,20 0,10 0,10 xj xj 30 32 37 40 30 32 b) j xj pj 1 2 3 4 30 32 37 40 - 0,15 0,45 0,30 0,10 - ∑ xj·pj 4,5 14,4 11,1 4,0 34,0 k µ = ∑ xj ⋅ pj xj - µ -4 -2 +3 +6 - = 34 j= 1 k σ2 = ∑ ( xj − µ ) j= 1 2 ⋅ pj = 10,5 2 2 ( xj − µ ) ( xj − µ ) 16 4 9 36 - 2,4 1,8 2,7 3,6 10,5 ⋅ pj 37 40 Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 5. Bei einem Glücksspiel („Roulette“) gibt es bekanntlich 37 Zahlen; eine Zahl wird vom Spieler gewählt; und eine Zahl wird – zufällig und unabhängig – als Gewinnzahl benannt. Der Spieler hat gewonnen, wenn seine gewählte Zahl mit der benannten Gewinnzahl übereinstimmt. - Ein Spieler unternimmt 37 Spielversuche, wobei er jeweils dieselbe Zahl wählt. Wie groß ist die Wahrscheinlichkeit (Prozent), dass er a) kein einziges Mal gewinnt (Berechnung auf zwei Arten!) b) genau einmal gewinnt (Berechnung auf zwei Arten!) c) mindestens einmal gewinnt (Berechnung auf zwei Arten!) ____________________________________________________________________________ Lösung: n a) B(x n , P ) = ⋅ P x ⋅ Q n − x x ( ) B 0 37, 371 = 1⋅1⋅ P(x µ ) = ( ) 36 37 37 = 0,3629 ) ( ) ⋅( ) 1 0 37 36 37 − 0 37 36,29 % 0 = 0,3679 ) B 1 37, 371 = 37 ⋅ 371 ⋅ ( ) 36 36 37 P(0 1) = 1 ⋅ e−1 0! → 36,79 % 37 B 1 37, 371 = ⋅ 1 ( → = 0,3729 → ) ( ) ⋅( ) 1 1 37 36 37 −1 37 37,29 % x 1 µ −µ ⋅e x! P(1 1) = 1 ⋅ e−1 1! → P(1 1) = 1 ⋅ e−1 1 = 0,3679 n c) 1 − B(x n , P ) = 1 − P x ⋅ Qn − x x ( → → n b) B(x n , P ) = ⋅ P x ⋅ Q n − x x P(x µ ) = ( x µ −µ ⋅e x! P(0 1) = 1 ⋅ e−1 1 ( 37 B 0 37, 371 = ⋅ 0 → ) 1 − B 0 37, 371 = 1 − 1⋅1⋅ ( ) 36 37 37 → 36,79 % → 37 1 − B 0 37, 371 = 1 − ⋅ 0 = 1 − 0,3629 x 1 − P(x µ ) = 1 − µ −µ ⋅e x! 1 − P(0 1) = 1 − 1 −1 ⋅e 1 = 1 − 0,3679 ( → ) 63,71 % → 1 − P(0 1) = 1 − → 63,21 % 0 1 −1 ⋅e 0! ( ) ⋅( ) 1 0 37 36 37 − 0 37 Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 6. Der Lagerabgang (Mengeneinheiten) in einem Firmenlager ist normalverteilt mit Erwartungswert = 15 und Standardabweichung = 2. Wie hoch ist die Wahrscheinlichkeit, dass der Lagerabgang a) weniger als 16 Mengeneinheiten beträgt (Antwortsatz!) b) mehr als 18 Mengeneinheiten beträgt (Antwortsatz!) ____________________________________________________________________________ Lösung: a) u = u= x −µ σ 16 − 15 = 0,5 2 Fe (0,5) = 0,6915 Wahrscheinlichkeit = 69,15 % b) u = u= x −µ σ 18 − 15 = 1,5 2 Fe (1,5) = 0,9332 Wahrscheinlichkeit = 6,68 % Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 7. Ein Bäckereibetrieb kauft für Vorratszwecke 170 Pakete Zucker (Sollgewicht = 500 Gramm, Standardabweichung = 10 Gramm, Normalverteilung). – Wie viele Pakete werden voraussichtlich a) zwischen 495 Gramm und 505 Gramm wiegen (Antwortsatz!) b) weniger als 515 Gramm wiegen (Antwortsatz!) c) genau 500 Gramm wiegen (Antwortsatz!) (Hinweis: Bestimmen Sie bei allen Teilfragen zunächst die Wahrscheinlichkeit, dass das jeweilige Gewichtsintervall bzw. Gewicht für ein Paket zutrifft.) ____________________________________________________________________________ Lösung: a) u = x −µ σ u = 505 − 500 = 0,5 10 Fz (0,5) = 0,3829 P = X → X = N ⋅ P N X = 170 ⋅ 0,3829 = 65,093 Anzahl der Pakete = 65 b) u = x −µ σ u = 515 − 500 = 1,5 10 Fe (1,5) = 0,9332 P = X → X = N ⋅ P N X = 170 ⋅ 0,9332 = 158,644 Anzahl der Pakete = 159 c) u = x − µ 500 − 500 = = 0 σ 10 Fz (0) = 0 P = X → X = N ⋅ P = 170 ⋅ 0 = 0 N Anzahl der Pakete = 0 Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 8. In einem Sägewerk werden rohe Holzbretter zugeschnitten. Die Länge der Bretter soll 90 cm betragen, die Standardabweichung beträgt 1,5 cm; es liegt näherungsweise Normalverteilung vor. a) In welchem Intervall wird die Länge eines zufällig ausgewählten Brettes bei einer Sicherheitswahrscheinlichkeit von 95 % liegen? (Antwortsatz!) b) Welche Obergrenze wird die Länge bei einer Irrtumswahrscheinlichkeit von 1 % haben? (Antwortsatz!) ____________________________________________________________________________ Lösung: a) u = x −µ σ Fz (u) = 0,95 → uz = ±1,96 x − 90 1,5 = 92 , 94 xo ± 1,96 = xu = 87,06 Intervall zwischen 87,06 und 92,94 cm b) u = x −µ σ Fe (u) = 0,99 → ue = +2,33 x − 90 1,5 xo = 93,495 + 2,33 = Obergrenze bei 93,495 cm Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 9. In einer repräsentativen Studie wurde festgestellt, dass Frauen im Durchschnitt eine Körpergröße von 175 Zentimetern haben bei einer Standardabweichung von 3 Zentimetern. Bei der Nachprüfung dieses Ergebnisses werden 70 Frauen untersucht. - In welchem Intervall liegt deren durchschnittliche Körpergröße, wenn eine Irrtumswahrscheinlichkeit a) von 4,55 % angenommen wird? (Antwortsatz!) b) von 0,27 % angenommen wird? (Antwortsatz!) ____________________________________________________________________________ Lösung: a) σ σ Pr µ − u ⋅ ≤ x ≤µ+u⋅ = 1 − α = Fz n n 3 3 Pr175 − 2 ⋅ ≤ x ≤ 175 + 2 ⋅ = 1 − 0,0455 70 70 Pr (175 − 0,72 ≤ x ≤ 175 + 0,72) = 0,9545 Pr (174,28 ≤ x ≤ 175,72) = 0,9545 Intervall zwischen 174,28 und 175,72 cm b) σ σ Pr µ − u ⋅ ≤ x ≤µ+u⋅ = 1 − α = Fz n n 3 3 Pr175 − 3 ⋅ ≤ x ≤ 175 + 3 ⋅ = 1 − 0,0027 70 70 Pr (175 − 1,08 ≤ x ≤ 175 + 1,08) = 0,9973 Pr (173,92 ≤ x ≤ 176,08) = 0,9973 Intervall zwischen 173,92 und 176,08 cm Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 10.Ein Marktforschungsinstitut befragt 500 zufällig ausgewählte Personen in Deutschland nach einem bestimmten Waschmittel; davon erklären 80 %, dass sie das betreffende Waschmittel kennen. – In welchem Intervall wird dann der entsprechende Prozentsatz in der Gesamtbevölkerung liegen, wenn eine Aussagewahrscheinlichkeit a) von 90 % angenommen wird (Antwortsatz!) b) von 98 % angenommen wird (Antwortsatz!) ____________________________________________________________________________ Lösung: a) Pr p − uz ⋅ p ⋅ q ≤ P ≤ p + uz ⋅ n Pr0,80 − 1,64 ⋅ p ⋅ q = 1 − α n 0,80 ⋅ 0,20 ≤ P ≤ 0,80 + 1,64 ⋅ 500 0,80 ⋅ 0,20 = 0,90 500 Pr(0,80 − 0,0293 ≤ P ≤ 0,80 + 0,0293) = 0,90 Pr(0,7707 ≤ P ≤ 0,8293) = 0,90 Zwischen 77,07 % und 82,93 % b) Pr p − uz ⋅ p ⋅ q ≤ P ≤ p + uz ⋅ n Pr0,80 − 2,33 ⋅ p ⋅ q = 1 − α n 0,80 ⋅ 0,20 ≤ P ≤ 0,80 + 2,33 ⋅ 500 Pr(0,80 − 0,0417 ≤ P ≤ 0,80 + 0,0417) = 0,98 Pr(0,7583 ≤ P ≤ 0,8417) = 0,98 Zwischen 75,83 % und 84,17 % 0,80 ⋅ 0,20 = 0,98 500 Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 11.Bei 200 Studierenden der Hochschule Bochum wurde eine Befragung durchgeführt. Dabei gaben 110 Studierende an, dass sie regelmäßig mit öffentlichen Verkehrsmitteln zur Fachhochschule kommen. a) Wie lautet der Anteilswert bei den Befragten? b) Berechnen Sie das Schätzintervall für den Anteilswert bei allen Studierenden, wenn eine Sicherheitswahrscheinlichkeit von 90 % angenommen wird! (Antwortsatz!) c) Wie lautet das entsprechende Schätzintervall für die Gesamtzahl der Studierenden, wenn die Hochschule Bochum 4500 Studierende hat? (Antwortsatz!) ____________________________________________________________________________ Lösung: a) x n 110 p = = 0,55 200 p = b) Pr p − uz ⋅ p ⋅ q ≤ P ≤ p + uz ⋅ n Pr0,55 − 1,64 ⋅ p ⋅ q = 1 − α n 0,55 ⋅ 0,45 ≤ P ≤ 0,55 + 1,64 ⋅ 200 0,55 ⋅ 0,45 = 0,90 200 Pr(0,55 − 0,0577 ≤ P ≤ 0,55 + 0,0577) = 0,90 Pr(0,4923 ≤ P ≤ 0,6077) = 0,90 Intervall zwischen 49,23 % und 60,77 % der Studierenden c) P = X N → X = P ⋅ N Xu = 0,4923 ⋅ 4500 = 2215 Xo = 0,6077 ⋅ 4500 = 2735 Intervall zwischen 2215 und 2735 Studierende Prof. Dr. Günter Hellmig – Aufgabenskript „INDUKTIVE STATISTIK“ ____________________________________________________________________________ 12.In einem Finanzamt wurden sämtliche Einkommensteuerbescheide und Steuerrückzahlungen einer Nachprüfung unterzogen. Die Steuerrückzahlungen waren normalverteilt; anhand einer Stichprobe wurde ein durchschnittlicher Rückzahlungsbetrag von 500 Euro bei einer Standardabweichung von 100 Euro ermittelt. – Innerhalb welcher Grenzen wird der durchschnittliche Rückzahlungsbetrag sämtlicher Einkommensteuerbescheide bei einer Sicherheitswahrscheinlichkeit von 99 % liegen, wenn die betreffende Stichprobe a) einen Umfang von 400 gehabt hat (Antwortsatz!) b) einen Umfang von 16 gehabt hat (Antwortsatz!) ____________________________________________________________________________ Lösung: s s a) Pr x − uz ⋅ ≤ µ ≤ x + uz ⋅ = 1 − α n n 100 100 Pr 500 − 2,58 ⋅ ≤ µ ≤ 500 + 2,58 ⋅ = 0,99 400 400 Pr(487,1 ≤ µ ≤ 512,9) = 0,99 Rückzahlungsbetrag zwischen 487,10 und 512,90 Euro s s b) Pr x − tzν ⋅ ≤ µ ≤ x + tzν ⋅ = 1 − α n n 100 100 Pr 500 − 2,95 ⋅ ≤ µ ≤ 500 + 2,95 ⋅ = 0,99 16 16 Pr(426,25 ≤ µ ≤ 573,75) = 0,99 Rückzahlungsbetrag zwischen 426,25 und 573,75 Euro