Statistik I für Betriebswirte Vorlesung 2 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 1 Eigenschaften bedingter Wahrscheinlichkeiten I Im Allgemeinen gilt P(A|B) 6= P(B|A) ! I Bei fester Bedingung B kann man wie mit (unbedingten) Wahrscheinlichkeiten rechnen, z.B. P(A|B) = 1 − P(A|B) ; P(A1 ∪ A2 |B) = P(A1 |B) + P(A2 |B) , falls A1 ∩ A2 = ∅ . I Multiplikationsregeln I Es gilt P(A ∩ B) = P(A|B) · P(B) = P(B|A) · P(A) . I Sind A1 , . . . , An zufällige Ereignisse mit P(A1 ∩ . . . ∩ An−1 ) > 0 , dann gilt P(A1 ∩ A2 ∩ . . . ∩ An ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A1 ∩ A2 ) · . . . · P(An |A1 ∩ A2 ∩ . . . ∩ An−1 ) . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 2 Übungsbeispiel In einer Urne befinden sich 10 Kugeln (7 rote und 3 schwarze). Es werden 4 Kugeln rein zufällig ohne Zurücklegen entnommen. Wie groß ist die Wahrscheinlichkeit für das Ereignis A , dass alle 4 gezogene Kugeln rot sind ? Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 3 Formel der totalen Wahrscheinlichkeit I Berechnung der totalen (unbedingten) Wahrscheinlichkeit aus den bedingten Wahrscheinlichkeiten: als gewichtetes Mittel. I Sei B1 , . . . , Bn eine Zerlegung von Ω mit P(Bi ) 6= 0, i = 1, . . . , n ein vollständiges Ereignissystem, eine Fallunterscheidung, d.h. n [ Bi = Ω , Bi ∩ Bj = ∅ für i 6= j . i=1 Dann lautet die Formel der totalen Wahrscheinlichkeit: für ein beliebiges zufälliges Ereignis A ⊂ Ω gilt P(A) = n X P(A|Bi )P(Bi ) . i=1 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 4 Formel von Bayes I Unter den Bedingungen des Satzes der totalen Wahrscheinlichkeit gilt die Formel von Bayes P(Bi |A) = P(A ∩ Bi ) P(A|Bi )P(Bi ) P(A|Bi )P(Bi ) . = = n P P(A) P(A) P(A|Bj )P(Bj ) j=1 I I P(Bi ) heißen auch a-priori“-Wahrscheinlichkeiten. ” P(Bi |A) heißen auch a-posteriori“-Wahrscheinlichkeiten, ” sie liefern eine Korrektur der ursprünglichen Wahrscheinlichkeiten, wenn bekannt ist, dass das zufällige Ereignis A eingetreten ist. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 5 Übungsbeispiel Drei Zulieferer liefern eine Komponente zur Produktion eines Erzeugnisses im Anzahlverhältnis 5 : 3 : 2. Die Fehlerquote betrage bei Komponenten der 1. Zulieferfirma 7%, bei Komponenten der 2. Zulieferfirma 4% und bei Komponenten der 3. Zulieferfirma 2% . 1. Wie groß ist die Wahrscheinlichkeit dafür, dass eine aus der Gesamtliefermenge rein zufällig ausgewählte Komponente defekt ist ? 2. Es werde eine Komponente aus der Gesamtzuliefermenge rein zufällig ausgewählt und überprüft. Dabei stellt man fest, dass die Komponente defekt ist. Mit welcher Wahrscheinlichkeit wurde diese Komponente von der 1., 2., bzw. 3. Zulieferfirma geliefert ? Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 6 Beispiel Diagnoseverfahren I Diagnoseverfahren liefern im Allg. nicht 100%ig richtige Ergebnisse: • Ein Fehler wird nicht erkannt. • Ein Fehler wird fälschlicherweise angezeigt. I Resultierende Frage: Wie groß ist die Wahrscheinlichkeit, dass ein als fehlerhaft angezeigter Gegenstand tatsächlich fehlerhaft ist ? I Beispiel: A = {Gegenstand ist tatsächlich fehlerhaft}, P(A) = 0.001 . B = {Gegenstand wird als fehlerhaft angezeigt}. Wahrscheinlichkeit für eine Fehlererkennung: P(B|A) = 0.9 . Wahrscheinlichkeit für die Identifizierung eines einwandfreien Gegenstandes: P(B|A) = 0.99 . Gesucht: P(A|B) . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 7 Partielle“ totale Wahrscheinlichkeit, Simpson-Paradox ” I Partielle totale Wahrscheinlichkeit P(A|C ) bei Zerlegung B1 , . . . , Bn ; A, C sind Ereignisse, P(C ) > 0 : P(A|C ) = n X P(A|Bi ∩ C ) · P(Bi |C ) . i=1 I Simpson-Paradox: z.B. Zerlegung B, B , Ereignisse A, C1 , C2 . Es kann sein, dass gilt P(A|C1 ) < P(A|C2 ) aber P(A|C1 ∩ B) > P(A|C2 ∩ B) , I P(A|C1 ∩ B) > P(A|C2 ∩ B) . Das Phänomen basiert darauf, dass Einzelergebnisse unterschiedlich gewichtet in das Gesamtergebnis eingehen. Bei statistischen Auswertung kann es so passieren, dass die Bewertung von Teilgruppen anders ausfällt als die der zusammengefassten Daten. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 8 Beispiel für Simpson-Paradox I I I Betrachte folgende Ereignisse: A StudentIn bricht Studium ab, G1 StudentIn ist weiblich, G2 StudentIn ist männlich, F1 StudentIn studiert Fach 1, F2 StudentIn studiert Fach 2. Gegeben sind folgende bedingte Wahrscheinlichkeiten P(A|G1 ∩ F1 ) = 0.1 > P(A|G1 ∩ F2 ) = 0.05 , P(A|G2 ∩ F1 ) = 0.2 > P(A|G2 ∩ F2 ) = 0.15 , P(G1 |F1 ) = 0.9 ⇒ P(G2 |F1 ) = 0.1 , P(G1 |F2 ) = 0.2 ⇒ P(G2 |F2 ) = 0.8 . Daraus folgt (aus der Formel für partielle totale Wahrscheinlichkeit): P(A|F1 ) = P(A|G1 ∩ F1 ) · P(G1 |F1 ) + P(A|G2 ∩ F1 ) · P(G2 |F1 ) = 0.1 · 0.9 + 0.2 · 0.1 = 0.11 < P(A|F2 ) = P(A|G1 ∩ F2 ) · P(G1 |F2 ) + P(A|G2 ∩ F2 ) · P(G2 |F2 ) = 0.05 · 0.2 + 0.15 · 0.8 = 0.13 . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 9 1.4 Stochastische Unabhängigkeit I Es kann vorkommen (und tut es in wichtigen Situationen auch), dass das Eintreten des Ereignisses B nichts an der Wahrscheinlichkeit für das Eintreten des Ereignisses A ändert, d.h. es gilt P(A|B) = P(A) . I Definition: Zwei zufällige Ereignisse A und B zu einem Zufallsversuch heißen (stochastisch) unabhängig, wenn gilt P(A ∩ B) = P(A) · P(B) . I In diesem Fall gelten dann auch P(A|B) = P(A) bzw. P(B|A) = P(B) (falls P(B) > 0 bzw. P(A) > 0), d.h. die bedingten Wahrscheinlichkeiten sind gleich den unbedingten Wahrscheinlichkeiten der beiden Ereignisse. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 10 Unabhängigkeit von mehr als 2 Ereignissen I Zufällige Ereignisse A1 , . . . , An zu einem Zufallsversuch heißen paarweise unabhängig, falls alle Paare von ausgewählten Ereignissen unabhängig sind, d.h. P(Ai ∩ Aj ) = P(Ai ) · P(Aj ) für alle i 6= j . I Diese Ereignisse heißen in Gesamtheit oder total oder vollständig (stochastisch) unabhängig, falls eine entsprechende Formel für alle möglichen Auswahlen (nicht nur von Paaren) gilt, d.h. für alle 2 ≤ k ≤ n, 1 ≤ i1 < . . . < ik ≤ n gilt P(Ai1 ∩ . . . ∩ Aik ) = P(Ai1 ) · . . . · P(Aik ) . I Aus der totalen Unabhängigkeit der Ereignisse A1 , . . . , An folgt die paarweise Unabhängigkeit der Ereignisse, aber die Umkehrung gilt im Allgemeinen nicht. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 11 Beispiel, Eigenschaften unabhängiger Ereignisse I Beispiel: (Zweifacher Münzwurf mit symmetrischer Münze) A = {1. Wurf Zahl}, B = {2. Wurf Zahl} . I Satz: A und B seien unabhängige Ereignisse zu einem zufälligen Versuch. Dann sind auch die zufälligen Ereignisse A und das Komplement von B, also B , unabhängig. Ebenso sind in diesem Fall A und B sowie auch A und B jeweils unabhängige Ereignisse. I Summenformel für unabhängige Ereignisse A1 , . . . , An : P(A1 ∪ . . . ∪ An ) = 1 − (1 − P(A1 )) · . . . · (1 − P(An )) . I Die Unabhängigkeit von Ereignissen wird der Einfachheit halber häufig vorausgesetzt, oft auch dann, wenn sie sachlich schwer begründbar ist. Oft beziehen sich unabhängige Ereignisse auf Versuchswiederholungen etc., die sich (scheinbar) nicht gegenseitig beeinflussen. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 12 Anwendung in Zuverlässigkeitstheorie Betrachten die Serien- und Parallelschaltung von Bauteilen, Teilsystemen (z.B. in Produktionslinien) etc., die unabhängig voneinander ausfallen oder funktionstüchtig sind. I I 2 Bauteile T1 , T2 , Fi = {Bauteil Ti funktioniert}, P(Fi ) = pi , Fi stochastisch unabhängig (i = 1, 2) . Serien- oder Reihenschaltung funktioniert, wenn sowohl T1 als auch T2 funktionieren: P(F1 ∩ F2 ) = P(F1 )P(F2 ) = p1 p2 . I Parallelschaltung funktioniert, wenn T1 oder T2 oder beide Bauteile funktionieren (also mindestens eines der Bauteile funktioniert): P(F1 ∪ F2 ) = P(F1 ) + P(F2 ) − P(F1 ∩ F2 ) = p1 + p2 − p1 p2 . I Bei komplizierteren Schaltungen Zerlegung in einfachere Teilsysteme (reine Serien- und Parallelschaltungen). Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 13 1.5 Kombinatorische Formeln I I I Geg.: n Objekte, z.B. {1, 2, . . . , n} . ⇒ Die Anzahl aller möglichen Reihenfolgen beträgt n! = 1 · 2 · . . . · n ( n Fakultät“). ” Geg.: n Objekte, die in k unterschiedlichen Sorten vorliegen, bestehend jeweils aus ni , i = 1, . . . , k, nicht unterscheidbaren Objekten (2 ≤ k ≤ n und n1 + . . . + nk = n) . ⇒ Die Anzahl aller möglichen Reihenfolgen beträgt n n! ( Polynomialkoeffizient“). = n1 ! · n2 ! · . . . · nk ! ” n1 , n2 , . . . , nk Im Spezialfall k = 2, d.h. gegeben sind n Objekte, jedes gehört zu einer von zwei Sorten (z.B. Erfolg“, Misserfolg“), gilt ” ” n1 = m, n2 = n − m und die Anzahl aller möglichen Reihenfolgen beträgt n n! = ( Binomialkoeffizient“). m m!(n − m)! ” Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 14 Kombinatorische Formeln II I Nun seien n Objekte gegeben. Dann ist eine Frage, wie viele Möglichkeiten es gibt, um daraus k Objekte auszuwählen ? Die Antwort ist abhängig davon, I I ob sich in der Auswahl Objekte wiederholen dürfen (m.W.) oder nicht (o.W.) ob es auf die Reihenfolge der Auswahl (oder eine zusätzliche Anordnung) ankommt (m.R.) oder nicht (o.R.). o.R. I m.R. I o.W. n k n k! k Beispiel: Prof. Dr. Hans-Jörg Starkloff m.W. n+k −1 k nk Kombinationen“ ” Variationen“ ” n = 4, k = 2 . Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 15 Kombinatorische Formeln III – Lottomodell I Auswahl ohne Wiederholung und ohne Reihenfolge. N Anzahl der tippbaren Zahlen (N = 49) , M Anzahl der Gewinnzahlen (M = 6) , n Anzahl der Zahlen im Tipp (n = 6) , m Anzahl der Gewinnzahlen im Tipp (z.B. m = 4) . I Anzahl der möglichen Fälle = Anzahl aller möglichen Tipps = Anz. der Möglichkeiten, aus N Zahlen n auszuwählen (o.W.,o.R.) N = . n I Anz. der günstigen Fälle = Anz. der Möglichkeiten, aus den M Gewinnzahlen m auszuwählen (o.W.,o.R.) mal Anz. der Möglichkeiten, die restlichen n − m getippten Zahlen aus den N − M Nichtgewinnzahlen auszuwählen M N −M = · . m n−m Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 16 Kombinatorische Formeln IV – Lottomodell I Man erhält die Formel für die Wahrscheinlichkeiten N−M M · P ( m Richtige in einem Tipp“) = m N n−m . ” n I Dies ist auch ein wichtiges Modell für die Qualitätskontrolle, mit den Werten N Losgröße, M Anzahl der Ausschussstücke darunter, n Anzahl der zufällig gezogenen Kontrollstücke (Stichprobe), m Anzahl der Ausschussstücke in der Stichprobe, gilt N−M M m · n−m P ( m Ausschussstücke in der Stichprobe“) = . N ” n Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 2 Version: 7. April 2016 17