1 Wahrscheinlichkeitsrechnung und Statistik

Werbung
1 Wahrscheinlichkeitsrechnung und Statistik
1.1 Grundbegriffe
1.1.1 Der Begriff der absoluten/relativen Häufigkeit
Ist ein Ereignis A bei n Durchführungen eines Zufallsexperimentes H-mal eingetreten, so nennt man H seine absolute und Hn seine relative Häufigkeit h.
H
n
10 Würfe mit einem Würfel, 3 mal fällt die 6
absolute Häufigkeit: 3
relative Häufigkeit: 3/10 = 0,3
h(A) =
Bei einem Würfel beträgt die Wahrscheinlichkeit, dass die 6 bei einem Wurf fällt
oder auch 1 : 5.
1
6
1.1.2 Ereignis und Ergebnis
Ereignisse werden im Vorfeld eines Zufallsexperimentes definiert, z.B.:
E1 : Der Würfel zeigt eine gerade Zahl.
Zu diesem Ereignis gehören die Ergebnisse 2, 4 und 6:
E1 = {2;4;6}
Wir setzen im Folgenden voraus, dass der Würfel nicht gezinkt ist, d.h. dass die Ergebnisse 1, 2, ..., 6 alle gleich wahrscheinlich sind. Dann ist die Wahrschinlichkeit für
das Ereignis E1
3
1 ∧
= = 50%
6
2
Allgemeines Vorgehen bei Zufallsexperimenten, deren einzelne Ergebnisse gleich wahrscheinlich sind (sogenannte Laplace-Experimente“, wie z.B. Würfel, Münze usw.):
”
Anzahl der Ergebnisse, die zu E gehören
p(E) =
Anzahl aller möglichen Ergebnisse
p(E1 ) =
1.1.3 Der Begriff der Häufigkeit - Das Gesetz der großen Zahlen
Je öfter man ein Zufallsexperiment durchführt, desto geringer werden die Schwankungen in der relativen Häufigkeit. Die relativen Häufigkeiten nähern sich also mit
zunehmender Anzahl von Versuchsdurchführungen immer weiter einem Grenzwert
an. Diesen Grenzwert nennt man Wahrscheinlichkeit.
1
1.1.4 Mehrstufige Zufallsexperimente / Pfad,- Baumdiagramme
Führt man ein Zufallsexperiment mehrmals hintereinander oder mit mehreren identischen Geräten gleichzeitig durch, so spricht man von einem mehrstufigen Zufallsexperiment.
Werden n Zufallsexperimente nacheinander durchgeführt, so kann man dies als einmalige Durchführung eines n-stufigen Zufallsexperimentes auffassen, dessen Ergebnisse n-Tupel sind.
w
P(ww)= 3/4 x 3/4 = 9/16
r
P(wr)= 3/4 x 1/4 = 3/16
w
P(rw)= 1/4 x 3/4 = 3/16
r
P(rr)= 1/4 x 1/4 = 1/16
3/4
w
1/4
3/4
3/4
1/4
r
1/4
Für mehrstufige Zufallsexperimente gelten die Pfadregeln:
Pfadmultiplikationsregel:
Im Baumdiagramm ist die Wahrscheinlichkeit eines Pfades gleich dem Produkt der
Wahrscheinlichkeiten auf den Teilstrecken des Pfades.
Pfadadditionsregel:
Gehören mehrere Pfade zu einem Ereignis, so ist dessen Wahrscheinlichkeit die Summe der Pfade, die zu dem Ereigns gehören.
1.1.5 Das Gegenereignis
Alle Ergebnisse, die nicht zum Ereignis E gehören, bilden das Gegenereignis E (zu
dem Ereignis E gehören in einem Baumdiagramm also alle Pfade, die nicht zu E
gehören). Wenn die Wahrscheinlichkeit für E p(E) beträgt, dann berechnet sich die
Wahrscheinlichkeit des Gegenereignisses E zu:
p(E) = 1 − p(E)
2
1.2 Kombinatorik
1.2.1 Das Urnenmodell
Man unterscheidet zwischen Ziehen mit bzw. ohne Zurücklegen.
Eine Lottoziehung entspricht z. B. einer Urnenziehung ohne Zurücklegen, denn eine
Lottozahl tritt nicht mehrfach auf.
Ein Experiment mit einem Würfel entspräche z. B. einer Urnenziehung mit Zurücklegen, denn die einzelnen Ergebnisse, in diesem Fall die oben liegenden Augenzahlen,
dürfen sich wiederholen.
Es gibt 4 Typen von Abzählverfahren, die sich an zwei Kriterien orientieren:
1.) Handelt es sich um eine Ziehung mit oder ohne Zurücklegen?
2.) Kommt es bei der Ziehung auf die Reihenfolge an oder nicht?
Für jeden der 4 Typen gibt es eine Formel zur Berechnung der Anzahl der
Möglichkeiten.
Ziehung...
ohne
Beachtung
der Reihenfolge
mit
...ohne Zurücklegen
n
k
=
n!
k!(n−k)!
... mit Zurücklegen
n+k−1
k
Bsp.: Ziehen mit einem Griff
Beachtung
n!
(n−k)!
nk
der Reihenfolge
Bücher im Regal sortieren
Wort MEER aus einer Urne ziehen
Weitere Beispiele:
• Ziehung ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge: 3 von
20 Busgästen werden auf Schmuggelware untersucht. (Diesen Typ nennt man
auch Ziehen mit einem Griff“.)
”
• ohne Zurücklegen mit Berücksichtigung der Reihenfolge: 20 Bücher werden
zufällig in ein Regal gestellt.
• mit Zurücklegen ohne Berücksichtigung der Reihenfolge: Augensumme zweier
Würfel.
• mit Zurücklegen mit Berücksichtigung der Reihenfolge: Fußballtoto.
3
1.3 Rechnen mit Wahrscheinlichkeitsverteilungen
1.3.1 Bernoulli-Experimente
Unter einem Bernoulli-Experiment versteht man ein Zufallsexperiment mit zwei möglichen Ergebnissen bzw. Ereignissen (Stichwort: Treffer-Niete Experiment), wobei sich
die Treffer-Nieten Wahrscheinlichkeit von Ziehung zu Ziehung nicht verändert (Also
z.B. Ziehen mit Zurücklegen im Urnenmodell oder eine sehr große Grundgesamtheit).
Eine Zufallsvariable, die bei einem der Ergebnisse den Wert 1 (Treffer), beim anderen
den Wert 0 (Niete) annimmt, heißt Bernoulli-Variable.
Bei einem Bernoulli-Experiment mit n Schüssen und mit einer Trefferwahrscheinlichkeit von p beträgt die Wahrscheinlichkeit für k Treffer
n
p(X = k) =
· pk · (1 − p)n−k
k
p(X=k): ist die Wahrscheinlichkeit für k Treffer.
X: Zufallsvariable für die Anzahl der Treffer.
Ein Zufallsexperiment, das aus n unabhängigen Durchführungen desselben BernoulliExperimentes besteht, heißt Bernoulli-Kette der Länge n.
Viele Rechnungen führen dann auf die zugehörige Wahrscheinlichkeitsverteilung,
die man mit einem Diagramm darstellen kann. Die Verteilung, die sich bei einem
Bernoulli-Experiment ergibt, nennt man Binomialverteilung.
1.3.2 Die Binomialverteilung
...ist eine Wahrscheinlichkeitsverteilung, die sich bei einem Bernoulli-Experiment ergibt (Treffer/ Niete mit gleichbleibender Wahrscheinlichkeit).
Formel für k Treffer bei n Schüssen bei einer Trefferwahrscheinlichkeit von p:
n
Bn;p (k) = p(n; X = k) =
· pk · (1 − p)n−k
k
1.3.3 Kumulierte Binomialverteilung
kumuliert: aufaddiert, angesammelt.
Bei n Versuchen eines Bernoulli-Experimentes mit der Trefferwahrscheinlichkeit p
gilt die folgende Formel für die Wahrscheinlichkeit für k Treffer:
Fn;p (k) = p(n; X ≤ k) = Bn;p (X = 0)+Bn;p (X = 1)+Bn;p (X = 2)+. . .+Bn;p (X = k)
4
1.4 Beurteilende Statistik
1.4.1 Zweiseitiger Hypothesentest/ Signifikanztest
Schema eines zweiseitigen Signifikanztestes:
1.) Wie lauten die Nullhypothese und die Gegenhypothese?
2.) Wie groß sind der Stichprobenumfang n und die Irrtumswahrscheinlichkeit α?
3.) Welche Zufallsvariable X ist Prüfvariable und wie ist sie verteilt?
4.) Wie lautet der Ablehnungsbereich?
5.) Wie wird aufgrund der Stichprobe entschieden?
1.4.2 Einseitiger Signifikanztest
Allgemein sind 2 Fälle von Hypothesenpaaren denkbar:
1. Fall: p ≤ p0 ; p > p0
2. Fall: p ≥ p0 ; p < p0
Durch die Betrachtung des Extremfalles p = p0 wird die Prüfverteilung eindeutig
festgelegt:
1. Fall: H0 : p ≤ p0 ; H1 : p > p0
2. Fall: H0 : p ≥ p0 ; H1 : p < p0
Da man die Nullhypothese p ≤ p0 nur bei sehr großen Werten der Prüfvariable ablehnen wird, nennt man diesen Test einen rechtsseitigen Signifikanztest.
Ist p ≥ p0 die Nullhypothese, so wird man diese ablehnen, wenn die Prüfvariable
sehr kleine Werte annimmt. Deshalb heißt dieser Test linksseitiger Signifikanztest.
Beide Arten von Test zusammen heißen einseitige Tests.
Rechtsseitiger Test
Bsp: Der Hersteller eines Artikels garantiert, dass der Ausschussteil höchstens 4% beträgt.
Ein Abnehmer entnimmt einer Lieferung 100 Artikel und findet 9 Ausschussstücke. Kann
man hieraus mit einer Irrtumswahrscheinlichkeit von 5% schließen, dass der Ausschussanteil höher als 4% ist?
Behauptung des Herstellers: pdef ekt ≤ 0, 04
Zu untersuchende Trefferwahrscheinlichkeit: p = 0, 04
Stichprobenumfang: n = 100
Irrtumswahrscheinlichkeit α höchstens 5 %
F100;0,04 (X ≤ g) ≥ 0, 95 | g gehört zum Annahmebereich
5
F-Tabelle → g= 7
Antwort: Enthält die Probe bis zu 7 defekte Teile, vertraut man der Aussage des Herstellers und behält die Sendung, ab 8 defekten Teilen schickt man die Ladung zurück.
Linksseitiger Test
Bsp: Bei der letzten Wahl hat ein Kandidat 40% der abgegebenen Stimmen erhalten. Im zu
prüfen, ob er seinen Stimmenanteil zumindest gehalten hat, wird einige Zeit vor der nächsten
Wahl eine Umfrage durchgeführt. Von 100 Personen geben nur 34 an, dass sie diesen Kandidaten wählen werden. Kann man hieraus mit der Irrtumswahrscheinlichkeit 0,05 schließen,
dass der Stimmenanteil des Kandidaten gesunken ist?
Der Kandidat behauptet, bei ihm sei p ≥ 0, 4
n = 100 und α ≤ 5%
F100;0,04 (x ≤ g) ≤ 0, 05 | g gehört zum Ablehnungsbereich
F- Tabelle → g = 31.
Antwort: Wenn man behauptet, dass sich der Kandidat verschlechtert, wenn er höchstens 31 von 100 Stimmen in der Stichprobe erhalten hat, obwohl er den Anteil gehalten hat, geschieht dies in höchstens 5% aller Stichproben.
1.5 Der Alternativtest
1.5.1 Das Einstiegsverfahren - Möglichkeiten und Fehler
Der Hypothesentest als Prüfverfahren
Es werden beispielhaft die beiden alternativen Hypothesen p=0,8 und p=0,6 aufgestellt (stark vereinfachte Prüfsituation). Es wird nun ein Zufallsversuch durchgeführt,
der zeigen soll, welche der beiden Hypothesen richtig und welche falsch ist.
Entscheidungsregel
Bevor der Hypothesentest durchgeführt wird, muss eine Entscheidungsregel aufgestellt werden.
Bsp.: Es soll die Hypothese p=0,8 verworfen werden (und somit für die Richtigkeit von p=0,6
entschieden werden), falls eine beliebige Anzahl X höchstens 14 beträgt, also X ≤ 14.
Beiden Hypothesen können nun Annahme- und Verwerfungsbereich zugeordnet werden:
Hypothese p=0,8: Annahmebereich: X ≥ 15 und Verwerfungsbereich: X ≤ 14
Hypothese p=0,6: Annahmebereich: X ≤ 14 und Verwerfungsbereich: X ≥ 15
6
Der sogenannte kritische Wert trennt Annahme- und Verwerfungsbereich.
Fehler beim Testen von Hypothesen
Beim Testen von Hypothesen wird wie oben bereits erwähnt zwischen Annahmebereich und Verwerfungsbereich einer Hypothese unterschieden:
• Liegt das Ergebnis eines Zufallsversuches im Verwerfungsbereich, dann hält
man die Hypothese für falsch.
• Liegt es im Annahmebereich, dann hat man dazu keinen Anlass.
Es können beim Hypothesentest Fehler 1. und 2. Art unterlaufen (Achtung: folgende
Tabellenaufteilung entspricht der Mitschrift aus dem Unterricht. Sie unterscheidet
sich in der Form der Spalten- und Zeilenaufteilung der Tabelle von den kopierten
Zetteln.) :
Ergebnis
des Hypothesentests
Hypothese
angenommen
(X im Annahmebereich)
Hypothese
verworfen
Hypothese
wahr
Entscheidung
richtig
Hypothese
falsch
Fehler 2. Art
(p = β)
Fehler 1. Art
(p = α)
Entscheidung
richtig
Fehler 1. Art: Eine wahre Hypothese wird verworfen.
Fehler 2. Art: Eine falsche Hypothese wird nicht verworfen.
Bsp.: Der Medikamententest in der Einstiegsaufgabe (bei der: p=0,8 und p=0,6) wird mit
n=50 Patienten durchgeführt. Bestimme α und β bezüglich der Entscheidungsregel: Verwirf
p=0,6, falls X > 30.
Berechnung von α:
∧
F50;0,6 (X > 30) = 1 − F50;0,6 (X ≤ 30) = 1 − (1 − 0, 4465) = 0, 4465 = 44, 65%
Berechnung von β (p=0,8 und X ≤ 30):
∧
F50;0,8 (X ≤ 30) = 1 − 0, 9991 = 0, 0009 = 0, 09%
Eine Zusammenstellung von Kristina Gebhardt und Maximilian Klein
7
Herunterladen