5 bk / altgayer Stochastik 14. Mai 2016 Teil 1: Deskriptive Statistik Was ist ein diskretes Merkmal? Ein diskretes Merkmal hat abzählbar viele Ausprägungen, meist also eine Anzahl. Was ist ein stetiges Merkmal? Ein stetiges Merkmal hat Ausprägungen, die ein reelles Intervall darstellen. Jeder Merkmalswert aus R ist möglich. Z.Bsp. Messwerte In der Praxis macht man oft durch Klassenbildung aus stetigen Merkmale wieder eine diskrete Verteilung. Was ist die absolute und relative Häufigkeit eines diskreten Merkmals? hi = Error! = Error! n ....... Anzahl aller Merkmalswerte hi ........... relative Häufigkeit des i-ten Merkmalswertes xi Hi ...... absolute Häufigkeit des i-ten Merkmalswertes xi m ...... Anzahl aller Merkmalswerte xi (oder Klassen) Welche Zentralmaße gibt es? 1. Arithmetisches Mittel AM = Error! = Error!xi hi Anwendbar bei linearen Modellen 2. Modus (Modalwert) MW = Wert mit der höchsten Häufigkeit 3. Median (Zentralwert) ZW = in einer geordneten Liste der in der Mitte stehende Merkmalswert n ungerade ZW ist der Error!. Wert in der geordneten Liste n gerade ZW ist das AM aus dem Error!. und Error!+ 1. Wert der geordneten Liste. Liegt eine Liste mit kumulierten Häufigkeiten vor, dann ist der ZW der erste Wert bei dem die kumulierte Häufigkeit von 0,5 überschritten wird. 4. Geometrisches Mittel m GM = = Hi i 1 m xiH i i 1 © mag. wolfgang streit m x h i i i 1 durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 1 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Anwendbar bei geometrischen oder exponentiellen Vorgängen. 5. Harmonisches Mittel m H HM = i 1 m Hi x i 1 i i 1 hi i 1 xi m Anwendbar bei hyperbolischen Modellen Beispiel 1: In der Firma Injustice mit 20 Angestellten gibt es folgende Einkommensverteilung: Jahreseinkommen in USD 0 – 20 k ab 20 bis 40 k ab 40 bis 60 k Anzahl d. Personen 8 6 5 200 k 1 Erstellen Sie eine Tabelle mit Klassenmittel, absolute Häufigkeit, relative Häufigkeit, kumulierter relativer Häufigkeit. Stellen Sie die sogenannte Lorenzkurve dar (kumulierter Anteil des Einkommens als Funktion der kum. Häufigkeit). Wie hoch ist der Gini-Koeffizient? Welchen Anteil des Firmeneinkommens verdienen die reichsten 50 % der Belegschaft? Berechnen Sie Modus, Median und arithmetisches Mittel und formulieren Sie eine populär verständliche Presseaussendung zu diesen Daten. Formulieren Sie diese so, dass der Eindruck einer Firma entsteht, die ihren Angestellten wenig (bzw. viel) bezahlt. Beispiel 2: Die Umsatzentwicklung eines Betriebes zeigt folgende Wachstumsraten: 5 Jahre lang + 25 %, 2 Jahre lang + 5 %, ein Jahr lang –10 %. Berechnen Sie die mittlere Wachstumsrate. Wie hoch war der Index am Ende dieser 8 Jahre, wenn er am Beginn 150 war. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 2 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 3: Ein PKW fährt 60 % einer Strecke mit 80 km/h, 10 % mit 20 km/h und den Rest mit 120 km/h. Wie hoch ist die mittlere Geschwindigkeit? Welche Streuungsmaße gibt es? 1. Spannweite Die Spannweite ist die Differenz zwischen größtem und kleinstem Merkmalswert 2. Interquartilspannweite Die Interquartilspannweite ist die Differenz zwischen Median der oberen Hälfte (3. Quartil) und dem Median der unteren Hälfte (1. Quartil). 3. Standardabweichung (Streuung) Die Standardabweichung ist die Wurzel aus dem arithmetischen Mittel der Quadrate der Abweichungen zum arithmetischem Mittelwert x x n i s i 1 2 Hi n H i i 1 Der Variationskoeffizient ist das Verhältnis Error! Beispiel 4: In der Firma Injustice mit 20 Angestellten gibt es folgende Einkommensverteilung: Jahreseinkommen in USD 0 – 20 k ab 20 bis 40 k ab 40 bis 60 k Anzahl d. Personen 8 6 5 200 k 1 Berechnen Sie Spannweite, Interquartilspannweite, Streuung und Variationskoeffizient. Teil 2: Kombinatorik Was ist eine Permutation? Eine Permutation ist eine bijektive Abbildung einer Menge auf sich selbst. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 3 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Anschaulich: Eine Permutation ist eine Anordnung (Reihenfolge wird beachtet) von n Elementen. Wie viele Permutationen von n Elementen gibt es? Pn = n! = 1 · 2 · 3 … · (n – 1) · n Was ist 0! ? 0! = 1 Was ist eine Permutation mit Wiederholung? Anschaulich: Eine Permutation mit Wiederholung ist eine Anordnung (Reihenfolge wird beachtet) von n Elementen, die mit der Häufigkeit pi vorkommen. Wie viele Permutationen mit Wiederholung von n Elementen gibt es? Pn,w = Error! Was ist eine Variation? Eine Variation ist eine Anordnung von n Elementen auf k Plätze, wobei k < n gilt. Es gibt Vn,k = Error! Was ist eine Variation mit Wiederholung? Eine Variation ist eine Anordnung von n Elementen auf k Plätze. Elemente können beliebig wiederholt werden. Es gibt Vw,n,k = nk Was ist eine Kombination? Eine Kombination ist eine Auswahl von k Elementen aus einer Menge mit n Elementen. Die Reihenfolge wird nicht beachtet. Es gibt: Cn,k = Error!= Error! © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 4 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist der Binomialkoeffizient und welche Eigenschaften hat er? Der Term (n;k) = Error! = Error! heißt Binomialkoeffizient. Er steht im Pascalschen Dreieck in der (n + 1). Zeile als (k + 1). Wert Symmetrie: Spezielle Werte: (n;k) (n;0) (n;1) = (n;n – k) = (n;n) = 1 = (n;n – 1) = n Beispiel 5: Wieviele Möglichkeiten gibt es einen Totoschein auszufüllen? Wie viele 12-er, 11-er und 10-er tippt man, wenn man alle Möglichkeiten ausfüllt? Beispiel 6: Wieviele Möglichkeiten gibt es beim Spiel 6 aus 45? Wie viele 6-er, 5-er, 4-er, 3-er und 5-er mit Zusatzzahl tippt man dann? Wie kann man Permutationen, Variationen, Kombinationen maschinell berechnen? Schreibweise: Excel: Derive: n! =fakultät(n) perm(n,n) Error! Error! =variationen(n;k) perm(n,k) =kombinationen(n;k) comb(n,k) Teil 3: Elementare Wahrscheinlichkeit Was ist Wahrscheinlichkeit? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 5 von 34 5 bk / altgayer Stochastik 14. Mai 2016 a) Definition nach Pascal: W = Error! b) Grenzwertdefinition: W ist der Grenzwert der relativen Häufigkeit bei n c) Axiomatische Definition nach Kolmogorow: einige Grundregeln der W.-rechnung werden als Axiome benutzt und damit ein abstraktes Kalkül der Wahrsch. aufgebaut. (unanschaulich aber als einzige Definition wirklich exakt und widerspruchsfrei) Ist S ein sicheres Ereignis und i eine geeignete Indexmenge und gilt: (1) P(S) = 1 (2) P A i P A i , i I (3) i I falls die Mengen Ai paarweise disjunkt sind 0 P( Ai ) 1 Beispiel 7: Wie lautet die Wahrscheinlichkeitsverteilung beim Würfeln mit 2 Würfeln. Der Merkmalswert soll die gewürfelte Augensumme sein. Was ist die Gewinnerwartung? Unter der Gewinnerwartung versteht man: Gewinnerwartung = = Error! = Gewinnquote * Gewinnwahrscheinlichkeit. Bei einem fairen Spiel ist die Gewinnerwartung 1. Beispiel 8: Wie hoch ist die Gewinnerwartung, wenn beim Würfeln mit 2 Würfeln eine Quote von 5 für 2 gleiche Augenzahlen ausgezahlt wird? Wie viel Geld hat der Spieler nach einer sehr hohen Anzahl von gleichen Spielen, wenn er 1.000.000 GE eingesetzt hat? Beispiel 9: Beim Roulette-Spiel gewinnt man beim Einsatz auf 6 Zahlen gleichzeitig das 6-fache seines Einsatzes. Es gibt 37 Zahlen im Kessel (0 bis 36). Wie hoch müsste die Quote sein, damit das Spiel fäir ist? Was ist der Additionssatz? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 6 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Der Additionssatz gibt die Wahrscheinlichkeit für die Verknüpfung von Ereignissen durch „oder“ an: Additionssatz („oder“): W(A B) = W(A) + W(B) – W(A B) Was ist die bedingte Wahrscheinlichkeit? Bedingte Wahrscheinlichkeit: W(A B) ist die Wahrscheinlichkeit, daß A eintritt, wenn B schon feststeht. Was ist der Multiplikationssatz? Multiplikationssatz („und“): W(A B) = W(A) · W(B A) Was ist der Satz von Bayes (A-posterio-Wahrscheinlichkeit) ? W( A B ) = Error! Beispiel 10: In einer Klasse von 30 Schülern sind 10 Burschen. 25 % der Mädchen und 30 % der Burschen sind Brillenträger. Erstellen Sie ein Baumdiagramm und das Mengendiagramm für diese Situation und ermitteln Sie: a) den Anteil der Gruppe „Mädchen oder Brillenträger“. b) den Anteil der Gruppe „Mädchen und Brillenträger“ c) den Anteil (die Wahrscheinlichkeit) der Brillenträger unter den Mädchen d) die Wahrscheinlichkeit, daß man bei zufälliger Auswahl ein Mädchen unter den Brillenträgern auswählt e) den Anteil der Brillenträger. Beispiel 11: © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 7 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Susi sucht ein Schriftstück. Sie vermutet es mit 80 %-iger Wahrscheinlichkeit in einem Schreibtisch mit 5 Schubladen. Sie untersucht 3 davon und findet den Brief nicht. Wie hoch ist die Wahrscheinlichkeit jetzt, dass sich der Brief im Schreibtisch befindet? Beispiel 12: Eine Werbeagentur soll eine Zielgruppe Z in 2 Medien A (Auflage 16.000) und B (Auflage 40.000) bewerben. Die Zielgruppe umfasst 50.000 Menschen. 40 % davon werden durch das Medium B erreicht, 16 % durch das Medium A. 6 % der Zielgruppe wird durch beide Medien erreicht. 9.000 Personen beachten insgesamt beide Medien. Erstellen Sie ein Mengendiagramm für diese Situation. Wie hoch ist die Nettowirkung auf die Zielgruppe? Wie hoch ist die Wahrscheinlichkeit, dass man eine Person aus der Gruppe A, B und Z zufällig auswählt, die beide Medien lesen oder der Zielgruppe angehört? Beispiel 13: In einem Wald gibt es Laub- und Nadelbäume. 30 % der Laubbäume und 80 % der Nadelbäume sind Hartholzgewächse. Der Anteil der Laubbäume unter den Weichholzgewächsen ist 84 %. Wie ist das Verhältnis Laub- zu Nadelbäume im Wald? Teil 4: Diskrete Verteilungen © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 8 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist eine diskrete Verteilung? Eine Funktion, die jeder Anzahl k (die Variable ist eine abzählbare Menge), mit der ein Ereignis in der Stichprobe vorkommt ihre Wahrscheinlichkeit zuordnet, heißt Dichte g(k) der Verteilung. Die Funktion, die jeder Anzahl k die Wahrscheinlichkeit, dass höchstens k Merkmalsträger in der Stichprobe vorkommen, zuordnet, heißt Verteilungsfunktion G(k). Dichte g(k): Wahrscheinlichkeit, dass in der Stichprobe genau k Merkmalträger vorkommen Verteilung G(k): Wahrscheinlichkeit, dass in der Stichprobe höchstens k Merkmalträger vorkommen. Wie ist der mathematische Zusammenhang zwischen Dichte und Verteilung? G(k) = ; k ; g(i) i=0 Wie kann man W(zwischen a und b) mit der Verteilung berechnen? W(zwischen a und b) = G(b) – G(a–1) Wie kann man W(mindestens a) berechnen? W(mindestens a) = 1 – G(a–1) © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 9 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist die Hypergeometrische Verteilung? Aus einer endlichen, kleinen (unter 200) Grundgesamtheit mit einem Anteil von Merkmalträgern wird eine Stichprobe gezogen (ohne Zurücklegen). Die Einzelwahrscheinlichkeit bei jeder Ziehung ändert sich merklich. Die Funktion H(k) heißt dann hypergeometrische Verteilung. Wie kann man die hypergeometrische Verteilung berechnen? Formel: h(k) = Error! h(k) Wahrscheinlichkeit, dass in der Stichprobe genau k Merkmalträger auftreten Parameter: N Umfang der Grundgesamtheit M Anzahl der Merkmalträger in der Grundgesamtheit n Umfang der Stichprobe Derive: Datei – Laden – Zusatzdatei – Probabil.mth hypergeometric_density (k,n,M,N) bzw. hypergeometric_distribution(k,n,M,N) Excel: =hypgeomvert(k;n;M;n) © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 10 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 14: Aus einem Kartenspiel mit 20 Karten, 4 davon sind Asse, werden jeweils 5 Karten ohne Zurücklegen gezogen. Wie sieht die Wahrscheinlichkeitsverteilung aus, wie hoch ist der Erwartungswert und wie sind die Quoten für ein Gewinnspiel bei „fairem Spiel“ anzusetzen? Wie hoch ist die Gewinnerwartung, wenn für die Ziehung von mindestens 2 Assen für eine Einsatz von EUR 100,-- 300,-- ausbezahlt werden? Wer gewinnt wieviel nach 1.000 solcher Spiele? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 11 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist die Binomialverteilung? Aus einer endlich großen Grundgesamtheit mit einem Anteil von Merkmalträgern wird eine Stichprobe gezogen. Die Einzelwahrscheinlichkeit bei jeder Ziehung ändert sich nicht. Die Funktion B(k) heißt dann Binomialverteilung. Wie kann man die Binomialverteilung berechnen? Formel: b(k) = (n;k) pk (1 – p)n–k b(k) Wahrscheinlichkeit, dass in der Stichprobe genau k Merkmalträger auftreten Parameter: p Einzelwahrscheinlichkeit n Umfang der Stichprobe Derive: Datei – Laden – Zusatzdatei – Probabil.mth binomial_density (k,n,p) bzw. binomial_distribution(k,n,p) Excel: =binomvert(k;n;p;0) =binomvert(k;n;p;1) Wie entsteht die Biniomialverteilung aus der Hypergeometrischen Verteilung? Wenn der Umfang der Grundgesamtheit genügend groß ist, kann man die HG durch die BV ersetzen. Mathematisch ist das der Grenzübergang: M mit p = lim; N→∞ Error! Wie groß sind Mittelwert (Erwartungswert) und Streuung der Binomialverteilung. Da die Häufigkeiten (=Wahrscheinlichkeiten) berechnet werden, kann man Mittelwert und Streuung aus den Parametern berechnen: = © mag. wolfgang streit µ=np n p (1 – p) durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 12 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 15: Bei einem Roulettespiel (Zahlen von 0 bis 36) setzt Otto Gambler immer auf 6 Zahlen (z.Bsp. 4 bis 9). Wie groß ist die Wahrscheinlichkeit, daß er bei 10 Spielen nie bzw. mindestens 3 mal gewinnt? Wie oft muß er spielen, damit er mit einer Wahrscheinlichkeit von 99 % mindestens 2 mal gewinnt? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 13 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist die Poissonverteilung? Aus einer endlich großen Grundgesamtheit mit einem nicht quantifizierbaren Anteil von Merkmalträgern wird eine undlich große Stichprobe gezogen. Die Einzelwahrscheinlichkeit bei jeder Ziehung ist praktisch Null. Der Erwartungswert µ der Verteilung ist aber angebbar. Die Funktion P(k) heißt dann Poissonverteilung. Wie kann man die Poissonverteilung berechnen? Formel: p(k) = Error! p(k) Wahrscheinlichkeit, dass in der Stichprobe genau k Merkmalträger auftreten Parameter: µ Erwartungswert der Verteilung Derive: Datei – Laden – Zusatzdatei – Probabil.mth poisson_density (k,µ) bzw. poisson_distribution(k,µ) Excel: =poisson(k;µ;0) =poisson(k;µ;1) Wie entsteht die Poissonverteilung aus der Binomialverteilung? Wenn der Umfang der Stichprobe genügend groß und der Anteil p möglichst klein ist, kann man die BV durch die PV ersetzen. Mathematisch ist das der Grenzübergang: n und p 0 mit np µ Wie groß sind Mittelwert (Erwartungswert) und Streuung der Binomialverteilung. Da die Häufigkeiten (=Wahrscheinlichkeiten) berechnet werden, kann man Mittelwert und Streuung aus den Parametern berechnen: Erwartungswert = µ =µ © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 14 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 16: a) Die Anzahl der Fehler in einer Schularbeit ist poissonverteilt mit dem Mittelwert 7. Der Notenschlüssel ist: Sehr gut bei weniger als 3 Fehler, Nicht genügend bei mehr als 12 Fehler. Befriedigend zwischen 7 und 9 Fehler (incl.). Wie hoch sind die Wahrscheinlichkeiten für Sehr gut, Befriedigend und Nicht genügend? b) Der Lehrer will nicht mehr als 5 % negative Beurteilungen geben. Auf welchen Wert muß er den Mittelwert der Fehler bringen, um das zu erreichen? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 15 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Teil 5: Stetige Verteilungen Was ist eine stetige Verteilung? Die Verteilungsfunktion F(x) einer stetigen Zufallsvariablen x aus dem Intervall [a / b] gibt die Wahrscheinlichkeit an, dass das Ereignis einen Wert zwischen a und x annimmt. Welche Bedingungen muss eine stetige Verteilung erfüllen? Die Verteilungsfunktion F(x) muss die sogenannten Normierungsbedingungen erfüllen: F(a) = 0 und F(b) = 1 Was geschieht, wenn das Definitionsintervall [a, ) ist? In diesem Fall muss die Verteilungsfunktion F(x) für x konvergieren, d.h. der Grenzwert lim; F(x) x→∞ muss existieren und gleich 1 sein. Was ist die Dichte einer stetigen Verteilung? Die Dichte f(x) ist die 1. Ableitung der Verteilungsfunktion. f(x) = Error! und daher F(x) = Error! mit der Anfangsbedingung F(a) = 0 oder F(x) = Error! Wie berechnet man Wahrscheinlichkeiten? Die Wahrscheinlichkeit, dass die Zufallsvariable Werte zwischen c und d annimmt ist: W(c x d) = F(d) – F(c) = Error! Die Wahrscheinlichkeit, dass die Zufallsvariable höchstens den Wert c annimmt ist: W(x c) = F(c) = Error! Die Wahrscheinlichkeit, dass die Zufallsvariable mindestens den Wert c annimmt ist: W(x c) = 1 – F(c) = Error! Wie hoch ist die Wahrscheinlichkeit, dass die Zufallsvariable genau den Wert c annimmt? Diese Fragestellung ist unzulässig. Welche Bedeutung haben die Werte der Dichte f(x)? Der Wert der Dichtefunktion ist ein Maß für die Größe der Wahrscheinlichkeit für eine kleine Umgebung von x. Ihr Maximum zeigt z.Bsp. den wahrscheinlichsten Wert an. Ihre Werte sind jedoch nicht als © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 16 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Wahrscheinlichkeiten für Punktereignisse interpretierbar! Wie ist die geometrische Interpretation von Wahrscheinlichkeit? Die Größe der Fläche unterhalb der Dichtefunktion zwischen den Werten c und d ist ein Maß für die Wahrscheinlichkeit, dass die Zufallsvariable einen Wert aus dem Intervall [c / d] annnimmt. Was meint man mit der Formulierung „wahrscheinlichster Wert“? Eigentlich ist damit ein Wert der Zufallsvariablen gemeint, dessen beliebig kleine Umgebung im Vergleich zu anderen Umgebungen eine maximale Eintrittswahrscheinlichkeit hat. Man kann diese Zufallsvariable als Maximum von f(x) berechnen. Notwendig dafür ist das Verschwinden der 1. Ableitung von f(x) an dieser Stelle. c ist wahrscheinlichster Wert Error!(c) = 0 oder Error!(c) = 0 Wie berechnet man Erwartungswert und Streuung einer stetigen Verteilung? µ = Error! = Error! © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 17 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 17: a) Die Dichtefunktion der Wartezeit auf eine Straßenbahn sei von folgender Form: f(x) = n · e- kx im Bereich [0 / ). x ist die Wartezeit in Minuten. k ist so zu ermitteln, daß die Wahrscheinlichkeit, weniger als 5 Minuten zu warten 60 % beträgt. b) Wie groß ist die Wahrscheinlichkeit, mehr als 15 Minuten zu warten? c) Der Verkehrsstadtrat möchte eine Maximalwartezeit garantieren. Welche Zeit kann er veröffentlichen, wenn nur 10 % aller Fälle diese Wartezeit übertreffen werden, dh. daß er mit 90 %-iger Sicherheit recht behält. d) Wie hoch ist der Erwartungswert der Verteilung? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 18 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Teil 6: Die Normalverteilung Was ist die Normalverteilung? Die Normalverteilung ist eine stetige Verteilung. Sie entsteht immer dann, wenn zufällige Abweichungen von einem „normalen“ Wert auftreten. Ihre Dichte hat die Gleichung: µ, (x) = Error! e Error! für x (– / + ) Dabei ist µ der Mittelwert und die Streuung der Verteilung. Welche Eigenschaften hat der Graph der Normalverteilungsdichte? Keine Nullstellen Strebt gegen 0 für x Symmetrisch zum Mittelwert Sieht aus wie eine Glocke, daher Gaußsche Glockenkurve Was ist die Standardisierung? Die Standardisierung ist eine Koordinatentransformation: 0,45 0,4 0,35 z = Error! dabei wird µ = 0 und = 1 und 0,1(z) = (z) = Error! e Error! 0,3 0,25 0,2 0,15 Wie berechnet man Wert der Normalverteilung? Die Dichtefunktion der Normalverteilung (Gaußsche Glockenkurve) ist analytisch nicht integrierbar. Die Werte der Verteilungsfunktion stehen nur in Tabellenform (standardisierte NVT - also µ = 0 und = 1) oder in Programmpaketen zur Verfügung: 0,1 0,05 0 -4 -3 -2 -1 0 1 2 3 EXCEL: (x) = Error!= NORMVERT(x; µ; ; 1) Derive: (x) = Error! = normal(x, µ, ) normal(x) ist die standardisierte Form © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 19 von 34 4 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 18: Die Brenndauer von Glühlampen ist normalverteilt mit dem Mittelwert µ = 580 30 %. Die Fehlerangabe basiert auf einem 3 - Intervall. Es werden 8.000 Stück geliefert. Wieviele Glühlampen werden eine Brenndauer von - weniger als 600 h - mehr als 500 h - zwischen 400 und 700 h Beispiel 19: Bei der Befüllung von Behältern ist der Sollwert 2.400 g 10 %. Alle Füllungen außerhalb dieser Grenzen gelten als Ausschuss. Es werden 100.000 Stk. erzeugt und ein Stück Ausschuss erzeugt Kosten von EUR 1,50. Wie hoch sind die Ausschusskosten, wenn die Abfüllmaschine - mit 7 % um den Mittelwert 2.400 g streut - mit 7 % um den Mittelwert 3.000 g streut. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 20 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Was ist ein Konfidenzintervall? h sei die beobachtete relative Häufigkeit eines Ereignisses E im Rahmen einer Versuchsserie und eine (große) Wahrscheinlichkeit. Die Menge aller p, deren - Schätzbereich S(p) den Wert h enthält, heißt Vertrauensintervall (Konfidenzintervall) für die Wahrscheinlichkeit von E mit der (statistischen) Sicherheit , kurz Vertrauensintervall für p Das heißt, es handelt sich um die Umkehrung folgender Aufgabe: Die Wahrscheinlichkeit p eines Merkmalwertes in der Grundgesamtheit ist bekannt. In einer Stichprobe tritt dann dieses Merkmal mit der Wahrscheinlichkeit zwischen den Grenzen h1 und h2 auf. Das Intervall [h1; h2 ] heißt - Schätzbereich. Wir suchen nun jene Werte von p, deren Schätzbereiche noch die bekannte Häufigkeit h enthalten. Wie wird das Konfidenzintervall berechnet? exakte Variante: man verwendet die standardisierte Normalverteilung und errechnet aus 2 (z) – 1 = γ zuerst z. man ersetzt µ = np und = n p (1 – p) und löst die Gleichung: z = Error!= Error! nach p. Die beiden Lösungen für p stellen die Grenzen des Vertrauensbereichs dar. Näherungsvariante: für genügend großes n gilt: 1p2 = h z · Error! wobei h der Anteil der Merkmalträger in der Stichprobe ist. Welche gebräuchliche Signifikanzniveaus gibt es? Aus dem Signifikanzniveau ist der z - Wert durch den Ansatz 2 (z) – 1 = berechenbar. In der Praxis üblich sind folgende z - Werte incl. der Sprachregelung: z=1 = 68 % z=2 = 95 % signifikant z=3 = 99,7 % hoch signifikant 3 - Unschärfen sind bei wissenschaftlichen Untersuchungen üblich. Welche Bedeutung haben die Grenzen des Konfidenzintervalls? Mit der Wahrscheinlichkeit γ liegt der wahre Anteil der Merkmalträger in der Grundgesamtheit zwischen den Grenzen des Konfidenzintervalls. Man kann also den wahren Anteil nur mit einer „statistischen Unschärfe“ bestimmen. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 21 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 20: Die Firma macht eine Stichprobenerhebung mit dem Umfang 200 und erhält einen Wert von 170 sehr zufriedenen Kunden! Wie groß ist das Konfidenzintervall auf dem Signifikanzniveau 3 - . Wie hoch ist die Irrtumswahrscheinlichkeit? Was ist eine Prüfplankurve? Aus einer Grundgesamt mit dem Merkmalsanteil p wird eine Stichprobe vom Umfang n gezogen. Die Stichprobe wird als angenommen bezeichnet, wenn die Anzahl der Merkmalträger in der Stichprobe kleiner als eine Annahmekennzahl c ist. Die Funktion: Annahmewahrscheinlichkeit(p) = W(X c) (p) heißt Prüfplankurve (oder Operationscharakteristik). Die Prüfplankurve ist also die Funktion, die dem wahren Merkmalträgeranteil die Annahmewahrscheinlichkeit zuordnet. Die Formel für die Prüfplankurve ist: Annahmewahrscheinlichkeit = W(X<c) = Error! Was ist das Produzentenrisiko? Das Produzentenrisiko ( - Fehler, Fehler erster Art) ist die Wahrscheinlichkeit, daß die Stichprobe (Lieferung) abgelehnt wird, obwohl p den Bedingungen entspricht. Was ist das Konsumentenrisiko? Das Konsumentenrisiko ( - Fehler, Fehler 2. Art) ist die Wahrscheinlichkeit, daß die Stichprobe angenommen wird, obwohl p den Bedingungen nicht entspricht. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 22 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 21: Die Firma vereinbart mit ihrem Konsumenten für die Annahme einer Lieferung eine Überprüfung durch eine Stichprobe vom Umfang 30 mit einer Annahmekennzahl 6. Zeichnen Sie eine Prüfplankurve für diese Situation. Wie hoch ist das Konsumentenrisiko bei einem wahren Ausschussanteil von 25 %? Wie hoch ist das Produzentenrisiko bei einem wahren Ausschussanteil von 15 %? © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 23 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Lösungen Beispiel 1: In der Firma Injustice mit 20 Angestellten gibt es folgende Einkommensverteilung: Jahreseinkommen in USD 0 – 20 k ab 20 bis 40 k ab 40 bis 60 k Anzahl d. Personen 8 6 5 200 k 1 Erstellen Sie eine Tabelle mit Klassenmittel, absolute Häufigkeit, relative Häufigkeit, kumulierter relativer Häufigkeit. Stellen Sie die sogenannte Lorenzkurve dar (kumulierter Anteil des Einkommens als Funktion der kum. Häufigkeit). Wie hoch ist der Gini – Koeffizient? Welchen Anteil des Firmeneinkommens verdienen die reichsten 50 % der Belegschaft? Berechnen Sie Modus, Median und arithmetisches Mittel und formulieren Sie eine populär verständliche Presseaussendung zu diesen Daten. Formulieren Sie diese so, dass der Eindruck einer Firma entsteht, die ihren Angestellten wenig (bzw. viel) bezahlt. Einkommen abs. Häufigk. rel. Häufigk. kum. Eink. rel.kum.Eink. kum. r.H. 10 30 50 200 8 6 5 1 0,40 0,30 0,25 0,05 80,00 260,00 510,00 710,00 0 0,11 0,37 0,72 1,00 0 0,40 0,70 0,95 1,00 Summen 20 1 Wenn Sie gut verdienen wollen: Injustice – Durchschnittseinkommen 35.500 USD, die Hälfte der Leute verdient mehr als 20.000 USD. Anteil am Einkommen kum. 2 * Fläche unter der Lorenzkurve = 2 B = 0,4 · 0,11 + 0,48 · 0,3 + 1,09 · 0,25 + 1,72 · 0,05 = 0,5465 Gini-Koeffizient = Error! = 1 – 2B = 0,4535 = 45 % Modus = 10 Lorenzkurve Median = 20 1,2 AM = Error! = 35,5 Anteil der reichsten 50 % = Error! = Error! = 0,80 1 Die reichste Hälfte der Angestellten verdient 80 % 0,8 der Lohnsumme!! (die reichsten 5 % sogar 28 %) Injustice – zahlt an den Großteil der Leute nur 0,6 10.000 USD jährlich! 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1 1,2 Anteil der Belegschaft kum . Beispiel 2: Die Umsatzentwicklung eines Betriebes zeigt folgende Wachstumsraten: 5 Jahre lang + 25 %, 2 Jahre lang + 5 %, ein Jahr lang –10 %. Berechnen Sie die mittlere Wachstumsrate. Wie hoch war der Index am Ende dieser 8 Jahre, wenn er am Beginn 150 war. GM = Error! = Error! = 1,149 also 14,9 % Index = 150 · 3,028 = 454,2 Beispiel 3: Ein PKW fährt 60 % einer Strecke mit 80 km/h, 10 % mit 20 km/h und den Rest mit 120 km/h. Wie hoch ist die mittlere Geschwindigkeit? –1 0 0 0 HM = 6;80 + 1;20 + 3;120 = 66,7 km/h Beispiel 4: In der Firma Injustice mit 20 Angestellten gibt es folgende Einkommensverteilung: Jahreseinkommen in USD 0 – 20 k ab 20 bis 40 k ab 40 bis 60 k © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit 200 k Seite 24 von 34 5 bk / altgayer Anzahl d. Personen Stochastik 8 14. Mai 2016 6 5 1 Berechnen Sie Spannweite, Interquartilspannweite, Streuung und Variationskoeffizient. Spannweite = 200 – 10 = 190 Interquartilspannweite = 50 – 10 = 40 Standardabweichung = = Error! = 40,9 Variationskoeffizient = Error! = 115 % (sehr hoch) Beispiel 5: Wieviele Möglichkeiten gibt es einen Totoschein auszufüllen? Wie viele 12-er, 11-er und 10-er tippt man, wenn man alle Möglichkeiten ausfüllt? Variation mit Wiederholung = 312 = 531.441 1 Zwölfer, beim Elfer darf ein Tipp falsch sein, dafür gibt es 12 Möglichkeiten, also 12 Elfer beim 10-er dürfen 2 Tips falsch sein, 10 richtig, also 2 f und 10 r in 12 Stellen anordnen: Permutation mit Wiederholung: Error!= 66. Beispiel 6: Wieviele Möglichkeiten gibt es beim Spiel 6 aus 45? Wie viele 6-er, 5-er, 4-er, 3-er und 5-er mit Zusatzzahl tippt man dann? Beim Lotto werden aus 45 Zahlen 6 ausgewählt, wobei die Reihenfolge nicht von Bedeutung ist: Es handelt sich also um eine Kombination: c(45;6) = (45;6) = 8.145.060. Für die „5-er mit Zusatzzahl“ folgende Überlegung: Um 5 richtige zu tippen, muß man 5 von 6 richtigen Zahlen erraten und für jede dieser Kombinationen auch eine aus den verbleibenden 39 falschen, also (6;5) (39;1) = 6 · 39 = 234 Zusätzlich ist noch die Zusatzzahl richtig zu tippen. Dafür gibt es noch 39 Möglichkeiten, nur eine davon ist richtig, also: Anzahl der „5-er mit ZZ“ = Error!= 6 Analog 11.115 Vierer und 182.780 Dreier Beispiel 7: Wie lautet die Wahrscheinlichkeitsverteilung beim Würfeln mit 2 Würfeln. Der Merkmalswert soll die gewürfelte Augensumme sein. W(2) = W(12) = Error! W(3) = W(11) = Error! W(4) = W(10) = Error! W(5) = W(9) = Error! W(6) = W(8) = Error! W(7) = Error! Beispiel 8: Wie hoch ist die Gewinnerwartung, wenn beim Würfeln mit 2 Würfeln eine Quote von 5 für 2 gleiche Augenzahlen ausgezahlt wird? Wie viel Geld hat der Spieler nach einer sehr hohen Anzahl von gleichen Spielen, wenn er 1.000.000 GE eingesetzt hat? GE = 5 · Error! = 0,83… Der Spieler hat nur noch um 830.000 GE, d.h. auf lange Sicht verliert er ca. 17 % (ein Sechstel) seines Einsatzes. Beispiel 9: Beim Roulette-Spiel gewinnt man beim Einsatz auf 6 Zahlen gleichzeitig das 6-fache seines Einsatzes. Es gibt 37 Zahlen im Kessel (0 bis 36). Wie hoch müsste die Quote sein, damit das Spiel fäir ist? GE = 1 = Q · Error! Q = Error!= 6,16… man müsste das 5,17-fache als Gewinn zusätzlich zum Einsatz bekommen. Beispiel 10: © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 25 von 34 5 bk / altgayer Stochastik 14. Mai 2016 In einer Klasse von 30 Schülern sind 10 Burschen. 25 % der Mädchen und 30 % der Burschen sind Brillenträger. Erstellen Sie ein Baumdiagramm und das Mengendiagramm für diese Situation und ermitteln Sie: f) den Anteil der Gruppe „Mädchen oder Brillenträger“. g) den Anteil der Gruppe „Mädchen und Brillenträger“ h) den Anteil (die Wahrscheinlichkeit) der Brillenträger unter den Mädchen i) die Wahrscheinlichkeit, daß man bei zufälliger Auswahl ein Mädchen unter den Brillenträgern auswählt j) den Anteil der Brillenträger. a) W(w B) = W(w) + W(B) – W(wB) = Error! = Error! oder aus dem Baumdiagramm: Regel: Die Astbeschriftungen sind die bedingten Wahrscheinlichkeiten. Die Endwahrscheinlichkeit ergibt sich aus der Summe der Produkte der durchlaufenen bedingten Wahrscheinlichkeiten. W(W B) = Error! = 0,766… = Error! b) W(w B) = Error! = 0,166… = Error! c) W(B w ) = 0,25 (lt. Angabe - dieser Wert wird in das Baumdiagramm eingezeichnet) d) Satz von Bayes: W(w B ) = Error!= = Error!= Error!= 0,625 e) W(B) = Error! = Error!= 26,7 % Beispiel 11: Susi sucht ein Schriftstück. Sie vermutet es mit 80 %-iger Wahrscheinlichkeit in einem Schreibtisch mit 5 Schubladen. Sie untersucht 3 davon und findet den Brief nicht. Wie hoch ist die Wahrscheinlichkeit jetzt, dass sich der Brief im Schreibtisch befindet? W(in S / nicht in 1,2, 3) = Error! 0,62 Die Wahrscheinlichkeit, dass sich der Brief noch im Schreibtisch findet, obwohl er in den Laden 1,2 und 3 nicht ist, beträgt nur mehr 62 % (um 18 Prozentpunkte gesunken) Beispiel 12: Eine Werbeagentur soll eine Zielgruppe Z in 2 Medien A (Auflage 16.000) und B (Auflage 40.000) bewerben. Die Zielgruppe umfasst 50.000 Menschen. 40 % davon werden durch das Medium B erreicht, 16 % durch das Medium A. 6 % der Zielgruppe wird durch beide Medien erreicht. 9.000 Personen beachten insgesamt beide Medien. Erstellen Sie ein Mengendiagramm für diese Situation. Wie hoch ist die Nettowirkung auf die Zielgruppe? Wie hoch ist die Wahrscheinlichkeit, dass man eine Person aus der Gruppe A, B und Z zufällig auswählt, die beide Medien lesen oder der Zielgruppe angehört? Nettowirkung = = Error! = 50 % oder = 16 % + 40 % – 6 % = 50 % W((A B) Z) = Error! = 0,78 © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 26 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 13: In einem Wald gibt es Laub- und Nadelbäume. 30 % der Laubbäume und 80 % der Nadelbäume sind Hartholzgewächse. Der Anteil der Laubbäume unter den Weichholzgewächsen ist 84 %. Wie ist das Verhältnis Laub- zu Nadelbäume im Wald? W(L / W) = Error! = 0,84 0,7x + 0,2 – 0,2x = 0,83…x – 0,3…x = – 0,2 x = 0,6 1 – x = 0,4 60 % Laub- und 40 % Nadelbäume. Verhältnis L : N = 1,5 50 % mehr Laub als Nadelbäume Beispiel 14: Aus einem Kartenspiel mit 20 Karten, 4 davon sind Asse, werden jeweils 5 Karten ohne Zurücklegen gezogen. Wie sieht die Wahrscheinlichkeitsverteilung aus, wie hoch ist der Erwartungswert und wie sind die Quoten für ein Gewinnspiel bei „fairem Spiel“ anzusetzen? Wie hoch ist die Gewinnerwartung, wenn für die Ziehung von mindestens 2 Assen für eine Einsatz von EUR 100,-- 300,-- ausbezahlt werden? Wer gewinnt wieviel nach 1.000 solcher Spiele? Parameter: N = 20 M = 4 n = 5 h(0) = Error! = 0,282 h(1) = Error! = 0,470 h(2) = Error! = 0,217 h(3) = Error! = 0,031 h(4) = Error! = 0,001 Die Wahrscheinlichkeitsverteilung sieht so aus: 0 Asse 28,2 % 1 As 47,0 % 2 Asse 21,7 % 3 Asse 3,1 % 4 Asse 0,1 % Der Erwartungswert ist 0·0,282 + 1·0,470 + 2·0,217 + 3·0,031 + 4·0,001 = 1 Unter der Gewinnerwartung versteht man: Gewinnerwartung = Error! = Gewinnquote * Gewinnwahrscheinlichkeit. Bei einem fairen Spiel ist die Gewinnerwartung 1. Faire Quoten wären daher: 0 Asse 1 2 3 4 As Asse Asse Asse 3,549 = 1;0 282 2,130 4,614 32,300 969,000 Die Wahrscheinlichkeit, mindestens 2 Asse zu ziehen ist h(2) + h(3) + h(4) = 0,249. Gewinnerwartung = 3 · 0,249 = 0,746 bei einem Spiel. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 27 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Bei 1.000 Spielen zu EUR 100,-- Einsatz ist der zu erwartende „Auszahlungsbetrag“ EUR 74.617,-- bei einem Einsatz von EUR 100.000,-Die Gewinnerwartung für ein Spiel: „Mindestens 2 Asse“ mit der Quote 3 ergibt für 1.000 Spiele die Gewinnerwartung – 25.383,--. Der Bankhalter gewinnt also EUR 25.383,-- Beispiel 15: Bei einem Roulettespiel (Zahlen von 0 bis 36) setzt Otto Gambler immer auf 6 Zahlen (z.Bsp. 4 bis 9). Wie groß ist die Wahrscheinlichkeit, daß er bei 10 Spielen nie bzw. mindestens 3 mal gewinnt? Wie oft muß er spielen, damit er mit einer Wahrscheinlichkeit von 99 % mindestens 2 mal gewinnt? Parameter: n = 10 p = Error! b(0) = (10;0) Error!Error!= 0,17= Error! Mindestens 3 mal gewinnen heißt: b(3) + b(5) + b(6) + … + b(10) = = 1 – b(0) – b(1) – b(2) = =1 – (10;0) Error!Error!– Error!Error!Error!– Error!Error!Error!= 1 – 0,17 – 0,33 – 0,287 = 0,212 EXCEL: BINOMVERT(k;n;p;Kumuliert) Wenn Kumuliert = 0 dann liefert die Funktion den Einzelwert b(k), wenn Kumuliert = 1 dann liefert die Funktion gleich den Wert der Verteilungsfunktion B(k) = b(0) + … + b(k). Also: W(3, …, 10) = 1 – B(2) =1 – BINOMVERT(2;10;6/37;1). Derive: Datei – Laden – Zusatzdatei – Probabil.mth W(mindestens 3 mal gewinnen) = W(k = 3, k = 4, k = 5, k = 6) = 1 – binomial_distribution(2,6,6/37) Die Wahrscheinlichkeit, daß Otto Gambler nie gewinnt ist 17 % (d.h. bei ca. jeder 6 Serie von 10 Spielen kann das vorkommen). Die Wahrscheinlichkeit, daß er mindestens 3 - mal gewinnt ist 21,2 %. Ansatz: 0,99 = W(2;3;…n) = 1 – b(0) – b(1) = 1 – B(1) 0,01 = b(0) + b(1) 0,01 = (n;0) Error!Error!+ Error!Error!Error! 0;01 = Error!+ n Error!Error! Dies ist eine transzendente Gleichung (Gemisch aus Polynom und Exponentialgleichung) und nur näherungsweise zu lösen (SOLVER bzw. ZIELWERTSUCHE in EXCEL) n = 38,63 in Derive einfacher: 1 – binomial_distribution(1,n,6/37) ........ Lösen nach n (nummerisch) Otto Gambler muß mindestens 39 Spiele spielen, damit er mit 99 %-iger Sicherheit mindestens 2 mal gewinnt! Beispiel 16: c) Die Anzahl der Fehler in einer Schularbeit ist poissonverteilt mit dem Mittelwert 7. Der Notenschlüssel ist: Sehr gut bei weniger als 3 Fehler, Nicht genügend bei mehr als 12 Fehler. Befriedigend zwischen 7 und 9 Fehler (incl.). Wie hoch sind die Wahrscheinlichkeiten für Sehr gut, Befriedigend und Nicht genügend? d) Der Lehrer will nicht mehr als 5 % negative Beurteilungen geben. Auf welchen Wert muß er den Mittelwert der Fehler bringen, um das zu erreichen? Sehr gut - weniger als 3 Fehler: W(0;1;2) = p(0) + p(1) + p(2) = Error!+ … = 0,001 + 0,006 + 0,022 = 0,030 Error! © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 28 von 34 5 bk / altgayer Stochastik 14. Mai 2016 oder: W(0;1;2) = POISSON(2;7;1) = 0,030 (EXCEL) oder: poisson_distribution(2,7) Befriedigend - 7 bis 9 Fehler: 1;2 W(7;8;9) = p(7) + p(8) + p(9) = P(9) – P(6) = 0,830 – 0,450 = 0,380 = 63 Nicht genügend - mehr als 12 Fehler: 1;37 W(13; 14; …) = 1 – P(12) = 1 – 0,973 = 0,027 = 03 Die Wahrscheinlichkeiten für die Beurteilungsstufen sind: Sehr gut 3,0 % Befriedigend 38,0 % Nicht genügend 2,7 % d.h. jede 34. Schularbeit ist ein Sehr gut, jede 2,6. Schularbeit ist ein Befriedigend, jede 37. Schularbeit ist ein Nicht genügend. b) Ermittlung von µ: Ansatz: W(13; 14; …) = 1 – P(12) < 0,05 0,95 < P(12) Nachsehen in der Tabelle bzw. in EXCEL liefert µ = 7,69 oder: 1 – poissondistribution(12,m) und Lösen nach m Der Fehlerdurchschnitt in der Klasse muß bei 7,7 liegen, damit nicht mehr als 5 % Nicht genügend auftreten. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 29 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 17: e) Die Dichtefunktion der Wartezeit auf eine Straßenbahn sei von folgender Form: f(x) = n · e- kx im Bereich [0 / ). x ist die Wartezeit in Minuten. k ist so zu ermitteln, daß die Wahrscheinlichkeit, weniger als 5 Minuten zu warten 60 % beträgt. f) Wie groß ist die Wahrscheinlichkeit, mehr als 15 Minuten zu warten? g) Der Verkehrsstadtrat möchte eine Maximalwartezeit garantieren. Welche Zeit kann er veröffentlichen, wenn nur 10 % aller Fälle diese Wartezeit übertreffen werden, dh. daß er mit 90 %-iger Sicherheit recht behält. h) Wie hoch ist der Erwartungswert der Verteilung? Die Verteilungsfunktion F(x) gibt die Wahrscheinlichkeit W(X x) an, d.h. die Wahrscheinlichkeit, daß der Merkmalswert kleiner oder höchstens gleich x ist. Der Zusammenhang zwischen Dichtefunktion f(x) und Verteilungsfunktion F(x) ist: F(x) = Error! wobei f(x) in den nicht explizit angegebenen Bereichen den Wert f(x) = 0 annimmt. Außerdem gelten die Normierungsbedingungen: F(– ) = 0 F() = 1 F(x) = Error! = – Error!e–kx + C Im Beispiel ist die Funktion f(x) = 0 im Bereich (– / 0) F(0) = 0 = – Error!+ C C = Error! aus F() = 1 1 = C (wegen e–kx 0) W(X 5) = 0;6 = F(5) = – Error!e–k5 + C Es ergibt sich also: C=1 C = Error! 0;6 = – Error!e–k5 + C 1;5 0;6 = – e – 5k + 1 ln 0;4 = – 5k k = 0;183 = 5 C k = n 1 · 0,183 = n = 0,183 F(x) = 1 – e – 0,183 x Die Wahrscheinlichfunktion für die Wartezeit lautet: F(x) = 1 – e – 0,183x für x [0; ) und F(x) = 0 sonst. Die Dichte dieser Funktion ist: f(x) = 0,183 · e – 0,183x = Error! b) Mehr als 15 Minuten warten: W(X > 15) = 1 – W(X 15) = 1 – F(15) = 1 – 1 + e – 0,183 · 15 = 0,064 Mit 6 % Wahrscheinlichkeit wartet man länger als 15 Minuten auf die Straßenbahn. c) 90 % aller Fälle: F(x) = 0,9 = 1 – e – 0,183 · x x = 12,6 Stadtrat: „Sie warten bestimmt nicht länger als 13 Minuten auf die Straßenbahn!“ Diese Aussage hält mit einer Sicherheit von 90 %. d) Mittelwert: Der Mittelwert oder Erwartungswert einer stetigen Verteilung ist EW = Error!,daher: Error! = k x Error! – Error! = – x e – kx – Error! Error! = 0 – ( – Error!) = Error!= 5;5 Im Durschschnitt wartet man 5,5 Minuten auf die Straßenbahn! © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 30 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 18: Die Brenndauer von Glühlampen ist normalverteilt mit dem Mittelwert µ = 580 30 %. Die Fehlerangabe basiert auf einem 3 - Intervall. Es werden 8.000 Stück geliefert. Wieviele Glühlampen werden eine Brenndauer von - weniger als 600 h - mehr als 500 h - zwischen 400 und 700 h µ = 580 und = 58 (10 % von 580) - weniger als 600: Excel: = NORMVERT(600;580;58;1) derive: normal(600,580,58) W(x 600) = 0,633 - mehr als 500: Excel: = 1 – NORMVERT(500;580;58;1) derive 1 – normal(500,580,58) W(x 500) = 0,916 - zwischen 400 und 700: Excel: = NORMVERT(700;580;58;1)–NORMVERT(400;580;58;1) Derive: normal(700;580;58) – normal(400;580;58) W(400 x 700) = 0,98 Die Wahrscheinlichfunktion für die Brenndauer sind: weniger als 600 h 63,3 % mehr als 500 h 91,6 % zwischen 400 und 700 h 98,0 % Beispiel 19: Bei der Befüllung von Behältern ist der Sollwert 2.400 g 10 %. Alle Füllungen außerhalb dieser Grenzen gelten als Ausschuss. Es werden 100.000 Stk. erzeugt und ein Stück Ausschuss erzeugt Kosten von EUR 1,50. Wie hoch sind die Ausschusskosten, wenn die Abfüllmaschine - mit 7 % um den Mittelwert 2.400 g streut - mit 7 % um den Mittelwert 3.000 g streut. Der erlaubte Bereich ist 2.400 g 10 % = 2.400 240 = [2.160 / 2.640 ] Die Maschine füllt mit µ = 2.400 g, also genau im Sollwert, streut jedoch mit 7 %, dh. = 168 Der Anteil der Nichtausschussware ist daher: W(2.160 X 2.640) = 0,844 Der Ausschussanteil beträgt daher 15,6 % und die Kosten 0,156 · 100.000 · 1,5 = 23.400,-Die Maschine erzeugt einen Ausschussanteil von 15,6 % und die Kosten dafür betragen EUR 23.400,-! Die Maschine füllt mit µ = 3.000 g, also weit über dem Sollwert und streut mit 7 %, dh. = 210 Der Anteil der Nichtausschussware ist : W(2.160 X 2.640) = 0,044 Der Ausschussanteil beträgt daher 95,6 % und die Kosten 0,956 · 100.000 · 1,5 = 143.400,-Die Maschine erzeugt einen Ausschussanteil von 95,6 % und die Kosten dafür betragen EUR 143.400,--! © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 31 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 20: Die Firma macht eine Stichprobenerhebung mit dem Umfang 200 und erhält einen Wert von 170 sehr zufriedenen Kunden! Wie groß ist das Konfidenzintervall auf dem Signifikanzniveau 3 - . Wie hoch ist die Irrtumswahrscheinlichkeit? Dies führt auf den Ansatz: 2 (z) – 1 = Im Beispiel ist z = 3 (lt. Angabe) daher 99,7 %. Eigentlich ist dann folgende Gleichung zu lösen: 3 = Error!= Error!= Error! 9 (200 p (1 – p)) = (170 – 200 p)2 1.800 p – 1.800 p2 = 28.900 – 68.000 p + 40.000 p2 41.800 p2 – 69.800 p + 28.900 = 0 liefert die Lösungen: p1 = 0,76 und p2 = 0,91 dh. der wahre Anteil liegt mit einer Irrtumswahrscheinlichkeit von 0,3 % im Intervall [76 % / 91 % ]. Schneller kommt man bei halbwegs großem n mit folgender Näherung zum Ziel: 1p2 = h z · Error!, wobei h der Anteil der Merkmalträger in der Stichprobe ist. Also: h = Error!= 0,85 und 1p2 = 0,85 3 · Error! = 0,85 3 · 0,025 = Error! Die Firma kann auf dem Signifikanzniveau von 99,7 %, (mit einer Irrtumswahrscheinlichkeit von 0,3 %) mit einem Anteil von mindestens 77 % und höchstens 93 % zufriedener Kunden rechnen. © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 32 von 34 5 bk / altgayer Stochastik 14. Mai 2016 Beispiel 21: Die Firma vereinbart mit ihrem Konsumenten für die Annahme einer Lieferung eine Überprüfung durch eine Stichprobe vom Umfang 30 mit einer Annahmekennzahl 6. Zeichnen Sie eine Prüfplankurve für diese Situation. Wie hoch ist das Konsumentenrisiko bei einem wahren Ausschussanteil von 25 %? Wie hoch ist das Produzentenrisiko bei einem wahren Ausschussanteil von 15 %? Im Beispiel ist c=6 n = 30 daher W (X < 6) = Error! Werte erhält man entweder durch einen programmierbaren Taschenrechner oder durch EXCEL: = NORMVERT(0;1;(6-30*A2)/(30*A2*(1-A2))^0,5;1) oder Derive: normal((6 – 30p)/ (30 p (1 – p))) Vernünftig sind p - Werte um den Wert Error!. Für diesen Wert hat die Operationscharakteristik immer den Wert 0,5. Das Konsumentenrisiko beträgt für p = 0,25: W (X < 6) = Error! = (– 0,63 ) = 0,264 Das Produzentenrisiko beträgt für p = 0,15: W (X < 6) = 1 – Error! = 1 – (0,766 ) = 1 – 0,78 = 0,22 Das Konsumentenrisiko beträgt bei einem wahren Ausschussanteil von 25 % 26,4 %, d.h. der Konsument wird mit einer Häufigkeit von 26,4 % Lieferungen akzeptieren, weil in der Stichprobe weniger als 6 von 30 (= 20 %) Ausschussstücke vorhanden sind, obwohl die Ausschusshäufigkeit in der Grundgesamtheit 25 % beträgt. Das Produzentenrisiko beträgt bei einem wahren Ausschussanteil von 15 % 22 %, d.h. der Produzent wird Lieferungen zurückbekommen, weil 22 % der Lieferungen mehr als 6 von 30 Ausschussstücke enthalten, obwohl der wahre Ausschussanteil nur 15 % beträgt (also besser als gefordert ist) © mag. wolfgang streit durchgerechnete Lösungen auf http://teacher.schule.at/wstreit Seite 33 von 34 5 bk / altgayer © mag. wolfgang streit Stochastik durchgerechnete Lösungen auf http://teacher.schule.at/wstreit 14. Mai 2016 Seite 34 von 34