Kapitel 10 Wahrscheinlichkeitsrechnung

Werbung
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
1
Deskriptive und Analytische Statistik
Statistik
Deskriptive Statistik
Analytische Statistik
Beschreibung von
Massenerscheinungen
Schließen von Stichproben
auf Gesamtmasse
(vorerst)
Statistik I für Geographen
2
Kleiner „Rückblick“ auf die
Deskriptive Statistik
•
Grundbegriffe: Variable, Untersuchungseinheit, Grundgesamtheit...
•
Skalenniveaus: Nominal-, Ordinal-, Rational- und Intervallskala
•
Statistische Untersuchungen: Stichprobenauswahl, Datenerhebung,
Dateneingabe, Datenaufbereitung ...
•
Häufigkeitsverteilungen und deren Darstellung: Balkendiagramme,
Kreisdiagramme, Polygone...
•
Maßzahlen zur Charakterisierung von Verteilungen: Lagemaße,
Streuungsmaße, Konzentrationsmaße
•
Es fehlt noch: Regression, Korrelation
-> nach Weihnachten
Statistik I für Geographen
3
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
4
Grundbegriffe der
Wahrscheinlichkeitsrechnung
•
Zufallsexperiment: Versuch mit vorher ungewissem Ausgang
Beispiel: Münzwurf
•
Elementarereignis: Ergebnis eines Zufallsexperiments
Beispiel: Kopf wurde geworfen
•
Ereignisraum R: Menge möglicher Elementarereignisse
Beispiel: {Kopf, Zahl}
•
Zufallsvariable X: Vorschrift, die jedem Elementarereignis eines
Zufallsexperiments eindeutig eine Zahl zuordnet
Beispiel:
Kopf -> 1
Zahl -> 2
Statistik I für Geographen
5
Grundbegriffe der
Wahrscheinlichkeitsrechnung
– Die Zufallsvariable X ist diskret, wenn
• der Ereignisraum aus endlich vielen Elementen besteht
Beispiel: Würfelwurf
• oder in jedem Intervall nur endlich viele Elemente liegen
Beispiel: zufällige ganze Zahl
– X ist stetig, wenn
• die Elementarereignisse alle Werte eines Intervalls
annehmen können
Beispiel: (Genaue) Weite, die mit einem Steinwurf erzielt
wurde
Statistik I für Geographen
6
Beispiele
ZufallsElementarexperiment ereignis
Zufallsvariable
Stetig
oder
diskret?
Münzwurf
„Kopf“
X: (Kopf, Zahl) -> {1,2}
diskret
Würfelwurf
„3 Augen“
X: (Augenzahl) -> {1..6}
diskret
Steinwurf
3,245.... Meter
(nicht gerundet!)
X: Entfernung ->
Statistik I für Geographen
ℜ
stetig
7
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
8
Laplacesche Wahrscheinlichkeit und
relative Häufigkeit
•
Laplace-Experiment:
Zufallsexperiment mit endlichem Ereignisraum, bei dem alle
Elementarereignisse gleichwahrscheinlich sind
Beispiele: Würfelwurf, Münzwurf... mit einem Laplace-Würfel / einer
Laplace-Münze
•
Laplace-Würfel, Laplace-Münze...
Würfel / Münze, bei dem / der alle Ergebnisse gleichwahrscheinlich sind (im
Realen nicht möglich)
•
Laplace-Wahrscheinlichkeit:
Die Wahrscheinlichkeit für das Eintreten eines Elementarereignisses a bei
einem Laplace-Experiment berechnet sich durch den Quotient
Anzahl der günstigen Fälle (X = a)
Anzahl der möglichen Fälle (X beliebig)
Dieser Quotient wird als Laplace-Wahrscheinlichkeit bezeichnet
Statistik I für Geographen
9
Laplacesche Wahrscheinlichkeit und
relative Häufigkeit
•
Ist ein Experiment ein Laplace-Experiment, so gilt für
Zufallsvariablen X also:
Wahrscheinlichkeit W(X = a) =
Anzahl der günstigen Fälle (X = a)
Anzahl der möglichen Fälle (X beliebig)
Beispiel: Zufallsexperiment Würfelwurf: W(X=6) =
1
6
Die Wahrscheinlichkeit kann also theoretisch bestimmt werden,
und zwar schon vor der Durchführung eines Experiments, wenn
Informationen über die Zufallsvariable vorliegen (etwa: der
Würfel ist ein Laplace-Würfel)
Statistik I für Geographen
10
Laplacesche Wahrscheinlichkeit und
relative Häufigkeit
•
Die relative Häufigkeit wird dagegen nach
Zufallsexperimenten aus den empirischen Ergebnissen
ermittelt:
Anzahl der Ereignisse mit (X = a)
relative Häufigkeit h(X=a) =
Anzahl der Zufallsexperimente
Beispiel:
•
Bei 10 Würfen wurden zwei 6-er geworfen
h(X=6) = 2/10 = 1/5
Je mehr Zufallsexperimente gemacht werden, desto mehr
nähert sich die relative Häufigkeit an die Wahrscheinlichkeit
an (Gesetz der großen Zahlen)
Statistik I für Geographen
11
Laplacesche Wahrscheinlichkeit und
relative Häufigkeit
Wird wann
bestimmt
Laplacesche
Vor
Wahrschein- Durchführung
lichkeit
der
Experimente
Relative
Häufigkeit
Nach
Durchführung
der
Experimente
Statistik I für Geographen
Wird wie
bestimmt
Wird durch welche
„Formel“ bestimmt
Wird
theoretisch
berechnet
Anzahl der günstigen Fälle (X = a)
Anzahl der möglichen Fälle (X beliebig)
Wird
praktisch
gemessen
Anzahl der Ereignisse mit (X = a)
Anzahl der Zufallsexperimente
12
Ereignisse
•
Wir kennen schon: Elementarereignis (Ergebnis eines
Zufallsexperiments)
•
Ereignis: Menge von Elementarereignissen
•
Beispiele:
– Ereignis Ag, beim Würfeln ein gerade Zahl zu erhalten ist die
Elementarereignis-Menge {2,4,6}
– Ereignis A6, eine 6 zu erhalten, ist die ElementarereignisMenge {6}
– Ereignis AZ, überhaupt eine Zahl zu erhalten, ist die
Elementarereignis-Menge {1,2,3,4,5,6}
Statistik I für Geographen
13
Mengentheoretische Definitionen
A und B seien zwei Mengen
A
B
•
A ∩ B heißt Durchschnitt der Mengen A und B
A
B
•
A
A
B
B heißt Vereinigung der Mengen A und B
A sei Teilmenge von R
•
R A
Ā heißt Komplementärmenge von A
R A
W(A) ist die Wahrscheinlichkeit, dass eine Elementarereignis aus der Menge A eintritt
W(A|B) ist die Wahrscheinlichkeit, dass A eintritt, wenn zuvor B eingetreten ist
W(A|B) heißt auch bedingte Wahrscheinlichkeit von A unter der Bedingung B
Statistik I für Geographen
14
Mengentheoretische Definitionen
•
Beispiel Würfelwurf: R = {1,2,3,4,5,6}
– Menge A: Gerade Augenzahlen
A= {2,4,6}
– Menge B: Augenzahlen >= 3
1
– B= {3,4,5,6}
– A ∩ B = {4,6}
– A B = {2,3,4,5,6}
– Ā = {1,3,5}
R
6
2
3
5
4
B
A
Statistik I für Geographen
15
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
16
Wahrscheinlichkeitsgesetze
(1)
Für ein beliebiges Ereignis A gilt: 0 ≤ W(A) ≤ 1
–
W(A) = 0 bedeutet, dass A nicht eintreten kann
–
W(A) = 1 bedeutet, dass A immer eintritt
(2)
Sei R die Gesamtmenge aller möglichen Ereignisse, dann gilt W(R) = 1
(3)
Seien A und B Ereignismengen mit A ∩ B = Ø, dann gilt W(A B) = W(A) + W(B)
(4)
Sei Ā Komplementmenge von A, dann gilt W(Ā) = 1-W(A)
(5)
Seien A und B Ereignismengen, dann gilt: W(A∩B) = W(A|B)* W(B) = W(B|A) * W(A)
(6)
Seien A und B stochastisch unabhängige Ereignismengen, dann gilt:
W(A∩B) = W(A) * W(B) denn nun gilt W(B|A) = W(B) und W(A|B) = W(A)
Statistik I für Geographen
17
Beispiel Roulette
•
•
•
Beim Roulette gibt es 37 Zahlen von 0 bis 36
Die 0 ist grün, die Hälfte der anderen Zahlen ist rot, der Rest schwarz.
Wir setzen Gleichwahrscheinlichkeit der Elementarereignisse voraus
•
Wie groß ist die Wahrscheinlichkeit, dass eine rote Zahl kommt?
Anzahl der günstigen Fälle 18
=
≈ 0,4865 = 48,65%
Anzahl der möglichen Fälle 37
•
Wie groß ist die Wahrscheinlichkeit, dass 10 rote Zahl hintereinander kommen?
W(1. Spiel rot ∩ 2. Spiel rot ∩ ...
∩ 10. Spiel rot ) =
da die einzelnen Spiele voneinander stochastisch unabhängig sind
= W(1. Spiel rot) * W(2. Spiel rot) * ... W(10. Spiel rot ) =
= 0,4865*0,4865*...*0,4865 = 0,486510 = 0,0007425 = 0,07%
Statistik I für Geographen
18
Beispiel Roulette
Wie groß ist die Wahrscheinlichkeit, dass eine rote Zahl kommt, wenn
vorher schon 100 rote Zahlen hintereinander kamen?
•
Das Ereignis „Hundert rote Zahlen kommen hintereinander“ ist zwar
sehr unwahrscheinlich, aber trotzdem unabhängig vom Ereignis „Als
nächstes kommt eine rote Zahl“
•
W(„Jetzt kommt eine rote Zahl“| “Es kamen hundert rote Zahlen“)
= W(„Als nächstes kommt eine rote Zahl“)
= 48, 65%
Statistik I für Geographen
19
Bertrands Schachtelparadoxon
(Joseph Bertrand, 1889)
?
?
?
In einer dieser 3 Kisten liegt der Hauptgewinn, der
Kandidat einer Spielshow soll sich eine aussuchen
?
?
?
Der Kandidat wählt die mittlere Kiste. Nun öffnet der
Quizmaster von den anderen beiden eine, die leer ist.
leer
?
?
Ist es für den Kandidaten günstiger, bei seiner Wahl zu bleiben,
oder sich für die verbleibende, dritte Kiste zu entscheiden?
Statistik I für Geographen
20
Bertrands Schachtelparadoxon
leer
?
?
Intuitiv würde man wohl vermuten, das beide Kisten die gleiche Gewinnchance haben
Wahl
Aktion
1
Bleibt
x
-
-
1/3
2
Bleibt
-
x
-
1/3
3
Bleibt
-
-
x
1/3
1
Wechel
-
x
x
2/3
2
Wechel
x
-
x
2/3
3
Wechel
x
x
-
2/3
Statistik I für Geographen
1 gewinnt 2 gewinnt 3 gewinnt
Chance
21
Beispiel
Wie groß ist die Wahrscheinlichkeit, dass hier im Raum 2 mindestens zwei am
gleichen Tag Geburtstage haben?
•
Gesucht:
W(„Von 25 Menschen haben zwei am gleichen Tag Geburtstag“)
•
Diese Frage lässt sich leicht beantworten, wenn wir die Wahrscheinlichkeit für das
Komplementärereignis ausrechnen
•
Komplementärereignis: W(„Alle 25 haben verschiedene Geburtstage“)
Anzahl der günstigen Fälle 365 * 364 * 363 * ... * 340
=
≈ 0,4018
Anzahl der möglichen Fälle 365 * 365 * 365 * ... * 365
•
W(„Von 25 Menschen haben zwei am gleichen Tag Geburtstag“)=
= 1- W(„Alle 25 haben verschiedene Geburtstage) ≈
≈ 1-0,4018 = 0,5982 = 59, 83% (!!!)
Statistik I für Geographen
22
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
23
Die Wahrscheinlichkeitsfunktion
Die Wahrscheinlichkeitsfunktion f(x) einer diskreten Zufallsvariablen
• ordnet jedem Ereignis xi seine Wahrscheinlichkeit W(X=xi) zu
• hat an allen anderen Stellen den Wert 0
f(x) = Wahrscheinlichkeit für X = x
Beispiel Würfelwurf
1/6
1
Statistik I für Geographen
2
3
4
5
6
X: Zahl
beim
Würfelwurf
24
Die Verteilungsfunktion
Die Verteilungsfunktion F(x) einer diskreten Zufallsvariablen ordnet jedem
Ereignis xi die Wahrscheinlichkeit W(X ≤ xi) zu
F(x) = Wahrscheinlichkeit für X ≤ x
Beispiel Würfelwurf
1
5/6
2/3
1/2
1/3
1/6
1
Statistik I für Geographen
2
3
4
5
6
X: Zahl
beim
Würfelwurf
25
Die Binomialverteilung
•
•
•
Bei einem Zufallsexperiment sei die Wahrscheinlichkeit, dass
ein bestimmtes Ereignis E eintritt, W(E) = p
Beispiel:
– Experiment Münzwurf
– Ereignis E: Kopf wird geworfen
– W(E) = p = 1/2
•
Frage: Wie groß ist die Wahrscheinlichkeit, dass E genau k mal
eintritt, wenn man das Experiment n mal durchführt?
Beispiel
– Wie groß ist die WS, dass beim 3-maligen Münzwurf genau
2 mal „Kopf“ geworfen wird?
•
Antwort wird durch die Wahrscheinlichkeitsfunktion
„Binomialverteilung gegeben
Statistik I für Geographen
26
Die Binomialverteilung
 n k
f (k ) =   • p • (1 − p ) n − k
k
 n
n!
(sprich : n über k)
mit   =
 k  k!(n − k )!
 n
  = 1
 0
n! = 1 • 2 • ... • n (sprich n Fakultät)
0! = 1
Statistik I für Geographen
27
Die Binomialverteilung
 n k
n−k


f (k ) =   • p • (1 − p)
k
•
Beispiel
– Wie groß ist die WS, dass beim 3-maligen Münzwurf
genau 2 mal „Kopf“ geworfen wird?
• n=3
• k=2
2
1
3
  1 1
3! 1 1 6 3
f (k ) =   •   •   =
• • =
=
 2   2   2  2!•1! 4 2 16 8
Statistik I für Geographen
28
Die Binomialverteilung: Wahrscheinlichkeitsund Verteilungsfunktion
•
Bespiel: X: Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf
1
0
3
1
2
 3  1   1 
3!
1 1
f (0) =   •   •   =
•1• =
8 8
 0   2   2  3!•0!
 3  1   1 
3! 1 1 6 3
f (1) =   •   •   =
• • =
=
 1   2   2  1!•2! 2 4 16 8
2
3/8
1
 3  1   1 
3! 1 1 6 3
f (2) =   •   •   =
• • =
=
 2   2   2  2!•1! 4 2 16 8
3
0
 3  1   1 
3! 1
1
f (3) =   •   •   =
• •1 =
8
 3   2   2  3!•0! 8
Verteilungsfunktion
Wahrscheinlichkeit für X ≤ x
Wahrscheinlichkeit für X = x
Wahrscheinlichkeitsfunktion
1
7/8
1/2
1/8
1/8
0
1
2
3
Anzahl der Ergebnisse „Kopf“
Statistik I für Geographen
0
1
2
3
Anzahl der Ergebnisse „Kopf“
29
Wahrscheinlichkeits- und Verteilungsfunktion
für stetige Zufallsvariablen
•
Für stetige Zufallsvariablen ist die Wahrscheinlichkeitsfunktion nicht
definiert, da W(X = x) nicht definiert ist.
Beispiel: Wir untersuchen die Entfernung der Wohnungen von
Studenten zur Uni. Wie groß ist die Wahrscheinlichkeit, dass eine
Wohnung genau 500m entfernt ist? Die Antwort lautet 0, denn bei
beliebig hoher Messgenauigkeit werden wir immer von genau 500m
abweichen
•
Die Verteilungsfunktion F(x) = W(X≤x) ist aber definiert
Beispiel: Wie groß ist die Wahrscheinlichkeit, dass ein Student näher
als 500m an der Uni wohnt.
•
Bei einer stetigen Zufallsvariablen X können wir also keine Wahrscheinlichkeit dafür angeben, dass X genau einen bestimmten Wert
annimmt, wohl aber dafür, dass X in einem bestimmten Intervall liegt.
Statistik I für Geographen
30
Verteilungsfunktion für stetige
Zufallsvariablen
•
Beispiel:
X= „Entfernungen der Wohnorte von Studenten zur Universität“
F(x) = W(X≤x)
1
Für eine
Verteilungsfunktion F
gilt immer:
F(∞) = 1
1/2
5
10
15
Die Hälfte aller Studenten wohnt nicht
weiter als 8 km von der Universität entfernt
Statistik I für Geographen
20
km
31
Wahrscheinlichkeitsdichtefunktion für
stetige Zufallsvariablen
•
Mathematisch lässt sich nachweisen: Es gibt eine Funktion f, so dass
man die Verteilungsfunktion F darstellen kann als
x
Das Integral gibt dabei die Fläche unter
F ( x) = f (t )dt
der Kurve f(t) von -∞ bis t=x an
∫
−∞
•
f(x) wird Wahrscheinlichkeitsdichte der Zufallsvariablen X genannt und
es gilt f(x) = F´(x)
F(x)
1
f(x)
1
20 km
5 km 10 km 15 km
Statistik I für Geographen
20 km
5 km 10 km 15 km
32
Wahrscheinlichkeitsdichtefunktion und
Verteilungsfunktion
x
F ( x) =
∫
f (t )dt
−∞
Das Integral gibt die Fläche unter
der Kurve f(t) von -∞ bis t=x an
∞
F (∞ ) =
∫ f (t )dt = W ( X ≤ ∞) = 1
−∞
F(x)
1
f(x)
1
20 km
5 km 10 km 15 km
20 km
5 km 10 km 15 km
“∞”
Statistik I für Geographen
33
Wahrscheinlichkeitsdichtefunktion und
Verteilungsfunktion
•
Beispiel: Wahrscheinlichkeit dafür, dass die Entfernung der
Wohnung eines Studenten zur Uni unter 5 Km liegt
F(x)
1
f(x)
1
W(X ≤ 5km) =
F(5km) = 1/2
1/2
20 km
5 km 10 km 15 km
•
20 km
5 km 10 km 15 km
Beispiel: Wahrscheinlichkeit dafür, dass die Entfernung der
Wohnung eines Studenten zur Uni zwischen 5 und 10 Km liegt
F(x)
1
f(x)
1
3/4
1/2
20 km
5 km 10 km 15 km
Statistik I für Geographen
W(5 ≤ X ≤ 10km) =
F(10km)–F(5km) =
3/4 -1/2 = 1/4
20 km
5 km 10 km 15 km
34
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
35
Parameter diskreter und stetiger
Zufallsvariablen
•
Für Häufigkeitsverteilungen hatten wir zwei wichtige Parameter
kennengelernt
– Das arithmetische Mittel µ bzw. x
– Die Varianz σ2 bzw s2
•
Für Zufallsvariablen existieren ähnliche Parameter
– Das arithmetische Mittel bezeichnet den Schwerpunkt einer
Häufigkeitsverteilung.
– Der Schwerpunkt der Verteilung einer Zufallsvariablen heißt
Erwartungswert (Mittelwert) und wird auch mit E(X) oder µ
bezeichnet
– Die Streuung der Verteilung einer Zufallsvariablen wird –
wie bei Häufigkeitsverteilungen –Varianz genannt und mit
Var(X) oder σ2 bezeichnet
Statistik I für Geographen
36
Parameter diskreter und stetiger
Zufallsvariablen
Der Erwartungswert für diskrete Zufallsvariablen
n
•
•
Formel: E(X) = ∑ xi f ( xi )
i =1
f(x)
Beispiel X = Ergebnis beim einmaligen Würfelwurf
6
1
1
1
6
6
6
i =1
1 + 2 + 3 + 4 + 5 + 6 21
=
= 3,5
6
6
1
6
1
6
1
6
E(X) = ∑ xi f ( xi ) = 1 • + 2 • + 3 • + 4 • + 5 • + 6 • =
1/6
1 2 3 4 5 6
•
Beispiel X = Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf
3
1
3
3
1
E(X) =∑ xi f ( xi ) = 0 • + 1 • + 2 • + 3 • =
8
8
8
8
i =1
0 + 3 + 6 + 3 12
=
= 1,5
8
6
Statistik I für Geographen
f(x)
3/8
1/8
0
1
2
3
37
Parameter diskreter und stetiger
Zufallsvariablen
Die Varianz für diskrete Zufallsvariablen
•
Formel: Var(X) =
n
∑ (x − µ )
i =1
•
i
2
f ( xi )
f(x)
Beispiel: X = Ergebnis beim einmaligen Würfelwurf
n
2
Var(X) = ∑ ( xi − µ ) f ( xi ) =
1/6
i =1
1
1
1
1
1
1
− 2,52 • − 1,52 • − 0,52 • + 0,52 • + 1,52 • + 1,52 • =
6
6
6
6
6
6
5,25 + 2,25 + 0,25 + 0,25 + 2,25 + 5,25
= 2,58
6
•
1 2 3 4 5 6
Beispiel: X = Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf
n
Var(X) =∑ ( xi − µ ) f ( xi ) =
2
i =1
1
3
3
1
− 1,52 • − 0,52 • + 0,52 • + 1,52 •
8
8
8
8
2,25 + 0,25 + 0,25 + 2,25
= 0,625
8
Statistik I für Geographen
f(x)
3/8
1/8
0
1
2
3
38
Parameter diskreter und stetiger
Zufallsvariablen
•
Für diskrete Zufallsvariablen gilt:
N
– Erwartungswert E(X) = ∑ xi f ( xi )
i =1
N
2
– Varianz Var(X) = ∑ ( xi − µ ) f ( xi )
i =1
•
Für stetige Zufallsvariablen gilt:
∞
– Mittelwert E(X) =
∫ xf ( x)dx
−∞
∞
2
– Varianz Var(X) = ∫ ( x − µ ) f ( x)dx
−∞
Statistik I für Geographen
39
Parameter stetiger Zufallsvariablen Beispiel
Wartezeit (in Minuten) eines uninformierten Fahrgasts auf die S-Bahn (20-min-Takt)
f(x)
WahrscheinlichkeitsdichteFunktion
1/20
F(x)
1
Fläche = 1!
5
10
15
20
∞
10
5
0
20
15
20
∞
1
Mittelwert E(X) = ∫ xf ( x)dx = ∫ x • 0dx + ∫ x dx + ∫ x • 0dx =
20
−∞
−∞
0
20
20
1
1 2 1
 1 2
2
x
=
20
−
0 =
400 = 10
 40 
40
40
40
0
Varianz Var(X) =
∞
∞
−∞
−∞
2
(
x
−
µ
)
f ( x)dx = ∫ (
∫
Statistik I für Geographen
1
1
− ) 2 f ( x)dx = 0 (Gleichverteilung!)
20 20
40
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
41
Theoretische Verteilungen
• Oft lassen sich empirische Verteilungen auf eine der
Folgenden Standardverteilungen zurückführen
– Gleichverteilung
• Beispiel: Uninformierter Fahrgast
• Bereits vorgestellt
– Exponentialverteilung
• Beispiel: Kapitalzuwachs bei Verzinsung
• Machen wir nicht
– Normalverteilung
• Beispiel: Zufällige Abweichungen von Messergebnissen
• Machen wir jetzt
Statistik I für Geographen
42
Theoretische Verteilungen
Die Normalverteilung
Die Normalverteilung
Johann Carl Friedrich Gauß
Statistik I für Geographen
43
Theoretische Verteilungen
Die Normalverteilung
Johann Carl Friedrich Gauß
– Leben
• Geboren 30.4.1777 in Braunschweig
• Gestorben 23.02.1855 in Göttingen
– Interessen
•
•
•
•
Mathematik
Physik
Astronomie
Geodäsie
– Leistungen
•
•
•
•
•
Beweis des Fundamentalsatzes in der Algebra
Entdeckung des Prinzips des kleinsten Zwanges in der Mechanik
Erfindung des Heliotropen, des Magnetometers und des Telegraphen
Gaußscher Algorithmus
....
Statistik I für Geographen
44
Theoretische Verteilungen
Die Normalverteilung
•
Wahrscheinlichkeitsdichtefunktion
1
f ( x) =
•e
σ 2π
1  x−µ  2
− 

2 σ 
σ: Standardabweichung
µ: Erwartungswert
П: 3,1416....
e: 2,7183...
f(x)
1
σ 2∏
σ
µ-2σ
σ
µ
µ-σ
Statistik I für Geographen
µ+2σ
µ+σ
45
Normalverteilung
•
Bedeutung der Normalverteilung (NVT)
– Die Normalverteilung ist eine theoretische Verteilung, für die
bekannt ist
• mit welcher Häufigkeit / Wahrscheinlichkeit bestimmte Variablenwerte
über- oder unterschritten werden
• In welchem Intervall die Variablenwerte mit welcher Wahrscheinlichkeit
liegen
– Viele reale Variablen sind annähernd normalverteilt
• Phänomene aus der Natur: Temperaturen, Niederschläge, Körpergrößen
• Einige soziale Variablen:
• Meßfehler sind oft annähernd normalverteilt
– Viele statistische Verfahren besieren auf der Annahme, dass die
untersuchten Größen normalverteilt sind
Statistik I für Geographen
46
Normalverteilung
•
Gestalt der Normalverteilung
– Die Normalverteilung hat eine Glockenform.
f(x)
1
σ 2∏
• symmetrisch
• unimodal
•
σ
– Höhe und Breite differieren je nach Mittelwert
und Standardabweichung
Man sagt: Eine Variable ist (µ,σ)-normalverteilt
µ-σ
µ+σ
Februar
-1,83
80
70
60
50
40
30
20
10
0
Februar
August
August
Temperatur in °C
Statistik I für Geographen
20
17
14
11
8
5
2
-1
-4
1,33
-7
-1
0
µ+2σ
µ
2,9
Monatsmitteltemperatur in München
Vorkommen 1781-1992
µ-2σ
σ
16,92
47
Die Standardnormalverteilung
• Je nach Ausprägung von σ
hat die NVT eine schmalere
oder breitere Form
• Der Gipfel der Verteilung
befindet sich bei x=µ
φ(x)
Die Normalverteilung
mit µ = 0 und σ = 1
heißt Standardnormalverteilung (SVT)
σ
1
2∏
≈ 0,4
σ=1
µ-2σ = -2
µ+2σ = 2
µ=0
µ-σ = -1
Statistik I für Geographen
σ=1
µ+σ = 1
48
Eigenschaften der
Standardnormalverteilung
•
Die Verteilungsfunktion einer standardnormalverteilten Zufallsvariablen
Z nennt man Φ(z)
φ(x)
σ
1
2∏
≈ 0,4
σ=1
µ-2σ = -2
σ=1
µ+2σ = 2
µ=0
µ-σ = -1
µ+σ = 1
Ф(x)
≈ 0,5
σ=1
-2
2
0
-1
Statistik I für Geographen
σ=1
1
49
Standardnormalverteilung
•
Standardisierung: Ist die Variable X normalverteilt, so ist
Z=
X −µ
µ = Erwartungswert von X
σ
σ = Standardabweichung von X
standardnormalverteilt
Beispiel:
80
70
60
50
40
30
20
10
0
Februar
X1 = MMTFEB ist (-1,8; 2,9)-normalverteilt
Z = (X1-(-1,8))/2,9 ist standardnormalverteilt
Temperatur in °C
Statistik I für Geographen
20
14
17
11
5
8
2
-1
-4
August
-7
-1
0
Vorkom m en 1781-1992
Monatsmitteltemperatur in München
X2 = MMTAUG ist (16,9; 1,9)-normalverteilt
Z = (X2-16,9))/1,9 ist standardnormalverteilt
50
Standardnormalverteilung
•
Was bringt die Standardisierung?
Ф(z)
≈ 0,5
σ=1
-2
2
0
-1
Statistik I für Geographen
σ=1
1
51
Standardnormalverteilung
Ф(x)
≈ 0,5
σ=1
-2
σ=1
2
0
φ(x)
σ
1
2∏
Der Wert der
Verteilungsfunktion Φ
entspricht der Fläche
unter der SNVT-Kurve
≈ 0,4
σ=1
µ-2σ = -2
µ+2σ = 2
µ=0
µ-σ = -1
Statistik I für Geographen
σ=1
µ+σ = 1
52
Die Standardnormalverteilung
80
70
60
50
40
30
20
10
0
(Tabelle:)
17
20
14
8
11
2
5
-1
-7
August
Temperatur in °C
•
•
X1 = MMTFEB ist (-1,8; 2,9)-normalverteilt
Z = (X1-(-1,8))/2,9 ist standardnormalverteilt
Februar
-4
-1
0
Vorkom m en 1781-1992
Monatsmitteltemperatur in München
X2 = MMTAUG ist (16,9; 1,9)-normalverteilt
Z = (X2-16,9))/1,9 ist standardnormalverteilt
Φ(0,70) = 0,7580
Bedeutung: Ist Z standardnormalverteilt, so liegen 75,8 % der z-Werte unter z0= 0,7
Unter welchem x0 liegen dann 75,8% der Werte von X1 = MMTFEB und X2 = MMTAUG ?
– Z1=(X1+1,8)/2,9 => X1 = Z1*2,9-1,8 => x0 = 0,7*2,9-1,8 = 0,23
Die Wahrscheinlichkeit für eine MMT unter 0,23°C im Februar beträgt etwa 75,8%
– Z2=(X2-16,9)/1,9 => X2 = Z2*1,9-16,9 => x0 = 0,7*1,9+16,9 ≈ 0,2
Die Wahrscheinlichkeit für eine MMT unter 18,23°C im August beträgt etwa 75,8%
Statistik I für Geographen
53
Standardnormalverteilung
Zusammenfassung
•
Warscheinlichkeiten können als
Flächen unter der
Normalverteilungskurve
aufgefasst werden
φ(x)
Z=
X −µ
σ
0
•
•
Durch die z-Transformation ist
jede Normalverteilung in eine
Standardnormalverteilung
überführbar
-1
Z=
1
X −µ
σ
Für die Standardnormalverteilung
liegen Flächenanteile tabelliert vor
Statistik I für Geographen
54
Kapitel 10
Wahrscheinlichkeitsrechnung
•
•
•
•
•
•
•
Grundbegriffe der Wahrscheinlichkeitsrechnung
Laplacesche Wahrscheinlichkeit und relative Häufigkeit
Wahrscheinlichkeitsgesetze
Wahrscheinlichkeitsfunktion und Verteilungsfunktion
Parameter von Zufallsvariablen
Theoretische Verteilungen
Über- und Unterschreitungswahrscheinlichkeiten
Statistik I für Geographen
55
Über- und
Unterschreitungswahrscheinlichkeiten
Klimastation:
- Jahrelange Erhebung der jährlichen Niederschlagsmengen
- Empirische Verteilung entspreche einer Normalverteilung
- Mittelwert µ = 400 mm, Standardabweichung σ = 100 mm
Frage:
In wieviel % der Jahre fällt weniger als 500 mm Niederschlag
f(x)
1
100mm 2 ∏
?
500 mm
Statistik I für Geographen
400 mm
56
Unterschreitungswahrscheinlichkeit
•
Standardisierung:
z0 = (x0-µ)/σ = (500mm-400mm)/100mm = 1
φ(z)
f(x)
?
500 mm
400 mm
•
•
?
0
1
Tabelle: Φ(1) = 0,8413
Fertig: In etwa 84% der Jahre fällt weniger als 500mm Niederschlag
Statistik I für Geographen
57
Unterschreitungswahrscheinlichkeit
Frage: In wieviel % der Jahre fällt weniger als 300 mm Niederschlag?
• Standardisierung:
z0 = (x0-µ)/σ = (300mm-400mm)/100mm = -1
φ(z)
f(x)
?
300 mm
400 mm
•
•
•
?
-1
0
Tabelle: Φ(-1) ist nicht aufgeführt, aber:
Φ(-1) = 1- Φ(1) =1-0,8413
Fertig: In etwa 16% der Jahre fällt weniger als 500mm Niederschlag
Statistik I für Geographen
58
Überschreitungswahrscheinlichkeit
Frage: In wieviel % der Jahre fällt mehr als 250 mm Niederschlag?
• Standardisierung: z0 = (x0-µ)/σ = (250mm-400mm)/100mm = -1,5
φ(z)
f(x)
?
?
250 mm
•
•
•
400 mm
-1,5
0
Tabelle: Vorsicht! Φ ist eine Verteilungsfunktion, daher sind nur
Unterschreitungswahrscheinlichkeiten aufgeführt!! Aber: Die
Standardnormalverteilung ist symmetrisch zur Y-Achse, daher gilt:
W(Z > z0) = 1-W (Z < -z0)
Tabelle: Φ(1,5) = 0,9332
Fertig: In etwa 93% der Jahre fällt mehr als 250mm Niederschlag
Statistik I für Geographen
59
Über- und Unterschreitungswahrscheinlichkeiten
Frage: In wieviel % der Jahre fällt zwischen 200 mm und 500mm Niederschlag
• Standardisierung:
z0 = (x0-µ)/σ = (200mm-400mm)/100mm = -2
z1 = (x1-µ)/σ = (500mm-400mm)/100mm = 1
φ(z)
f(x)
?
200 mm
500 mm
400 mm
•
•
•
?
-2
0
1
Tabelle: Φ(-2) = 1- Φ(2) =1-0,9772 = 0,0228; Φ(1) = 0,8413
Der Flächeninhalt unter der Kurve ergibt sich aus Φ(1) - Φ(-2) = 0,8185
Fertig: In etwa 82% der Jahre fällt 200-500mm Niederschlag
Statistik I für Geographen
60
Über- und Unterschreitungswahrscheinlichkeiten
Frage: Welche Niederschlagsmenge wird in 90% der Jahre nicht übertroffen?
φ(z)
f(x)
0,9
?
400 mm
•
•
•
•
0,9
0
?
Tabelle: Φ(z0) = 0,9 => z0 ≈ 1,28;
Fertig? Nein!
z0 = (x0 – 400mm)/100mm = 1,28 => x0 = z0*100mm + 400mm = 528mm
Fertig: In etwa 90% der Jahre werden 528mm Niederschlag nicht übertroffen
Statistik I für Geographen
61
Zusammenfassung (Prüfungsfragen)
Fragetyp 1: Es wird nach einer Wahrscheinlichkeit gefragt
1.
Unterschreitungs-WS („Mit welcher WS wird x0 unterschritten“)
– Transformiere x0 in z0
– Schaue in Tabelle [falls z nicht aufgeführt: Ф(-z0)=1-Ф(-z)]
2.
Überschreitungs-WS („Mit welcher WS wird x0 übertroffen“)
– Transformiere x0 in z0
– Beachte: Ф ist Verteilungsfunktion =>
nur Unterschreitungswahrscheinlichkeiten =>
nutze Symmetrie [Ф(-z0)=1-Ф(-z)]
– Schaue in Tabelle [falls z nicht aufgeführt: Ф(-z0)=1-Ф(-z)]
3.
Werteintervall (Mit welcher WS liegt X zwischen x0 und x1)
– Male auf jeden Fall Skizze
– Wende 1. und 2. an
Statistik I für Geographen
62
Zusammenfassung (Prüfungsfragen)
Fragetyp 2: Es wird nach Wert gefragt, die Wahrscheinlichkeit ist angegeben
1.
Unterschreitungs-WS („Welcher x0 – Wert wird in p% der Fälle unterschritten)
ƒ
Schlage den entsprechenden z0 – Wert nach
ƒ
„Retransformiere“: x0 = (z0*σ)+µ
2.
Überschreitungs-WS („Welcher x0 – Wert wird in p% der Fälle überschritten)
ƒ
Beachte: Ф ist Verteilungsfunktion =>
nur Unterschreitungswahrscheinlichkeiten =>
nutze Intelligenz: Wenn x0 in p% der Fälle überschritten wird, wird x0 in
(100-p)% der Fälle unterschritten
ƒ
Schlage den entsprechenden z0 – Wert nach
ƒ
„Retransformiere“: x0 = (z0*σ)+µ
Statistik I für Geographen
63
Kleiner Tipp zum Schluß
Eine Skizze ist oft Gold wert
f(x)
0,9
?
400 mm
Statistik I für Geographen
64
Herunterladen