1 Die Normalverteilung (Gauß-Verteilung) Letzte Änderung 14. Juni

Werbung
1
Die Normalverteilung (Gauß-Verteilung) Letzte Änderung 14. Juni 2000, 27 Seiten
1 Definition der Normalverteilung
Eine Zufallsvariable mit der Dichte
f: R→R
f(x) =
1
2πσ 2
e-
(x-µ)2
2σ2
heißt normalverteilt mit Parametern µ∈R, σ2∈R++.
Eine verbreitete Kurzschreibweise für diese Universalverteilung der Normalverteilung ist
N(µ,σ2) oder N(µ,σ 2) oder N(µ,σ).
Ob σ2 oder σ als zweites Argument verwandt wird, ist im Regelfall aus dem Zusammenhang klar. Die Verteilung für die (0,1) Variable, d.h. N(0,1), die StandardNormalverteilung wird wie folgt bezeichnet (die Abkürzung der Normalverteilung):
Φ(x) =
x
f(u) du
-∞
2 Die Gestalt der Verteilung und Dichte
Eine Kurvendiskussion von f bzw. Φ (ohne eine explizit vorgeführte Integration, die
in einer Vorlesung für Wirtschaftswissenschaftler ausgelassen werden darf) liefert das
bekannte Bild der Glockenkurve der Normalverteilung
Die Normalverteilung N(0,1)
2
Eine Kurvendiskussion von f(x) liefert sofort:
1. Symmetrie
f ist symmetrisch um den Extremwert µ, d.h. f'(µ)= 0.
2. Monotonie
f ist streng monoton steigend von -∞ bis µ, und streng monoton fallend
von µ bis +∞.
3. Konkavität/Konvexität
f hat zwei Wendepunkte in µ ± σ
4. Aus der Symmetrie von f um µ folgt die für Φ, d.h. 1 - Φ(µ - x) = Φ(µ + x)
Damit ist f, eine stetige Funktion, vollständig beschrieben. Üblicherweise bezeichnet
man sie als Glockenkurve der Normalverteilung.
Die numerischen Werte sind aus den Tafeln auf den Seiten 26-28 zu entnehmen.
Für die Verteilung gibt es keinen geschlossenen Ausdruck, d.h. es existiert keine
Stammfunktion F(x). Aber die entsprechenden Werte der Fläche unter obiger Kurve
können numerisch gefunden werden. Deswegen ist eine Tabelle der einzige Weg, F(x)
schnell verfügbar zu haben; sie wird üblicherweise mit Φ(x) bezeichnet.
Ohne Beweis sei darauf hingewiesen, daß
(1)
E(X) = µ
(2)
var(X) = σ2 .
M.a.W. die in der Spezifikation der Normaldichte auftretenden Parameter sind
Erwartungswert und Varianz.
3
3 Variationen
Die Vielfalt der Normalverteilung läßt sich schnell durch eine Folge von ParameterVariationen zeigen
1. Zur Vielfalt der Normalverteilungen: die Variation der Varianz
Die Dichten und Verteilungen zu N(0, 1), N(0, 1.69), N(0, 3.21)
Ein gutes Maß für die Lage der Verteilung wird durch die Antwort zu der Frage:
"Wie sehen die Dezile aus?" gegeben:
Die Dezile für N(0,1):
für N(0,1.69
für N(0,3.21)
-1.28155
-2.16582
-4.11378
-0.841621
-1.42234
-2.7016
-0.524401
-0.886237
-1.68333
-0.253347
-0.428157
-0.813244
0 = Median = Mittelwert
0.253347
0.428157
0.813244
0.524401
0.886237
1.68333
0.841621
1.42234
2.7016
1.28155
2.16582
4.11378
(Dezil k liefert die Wahrscheinlichkeit P[X ≤ dk ] = k.0.1, k=1, 2, …,9, 10)
4
2. Der Grenzfall einer nicht-zufälligen Größe: die Variation der Varianz → 0
Für eine monoton sinkende Varianz schrumpft die Zufallsgröße X zu einer
Konstanten, ein Grenzübergang, der später als Konsistenz bezeichnet wird (s.u.
Statistik II). Die bildliche Darstellung der Normalverteilung mit σ2 → 0, ist eine
Glockenkurve, die immer nadelförmiger um µ herum wird:
Die hier benutzten Varianzen, die das Phänomen bereits deutlich zeigen, sind
σ2 = 1.72, 1.32, 1.0, 0.72, 0.42
bei gemeinsamen Mittelwert µ = 0
5
3. Zur Vielfalt der Normalverteilungen: die Variation des Mittelwertes
Die Dichten und Verteilungen zu N(0, 1), N(-2, 1), N(2, 1)
Die Dezile für N(-2, 1):
-3.28155
-2.84162
-2.5244
-2.25335
-2.
Median
-1.74665
-1.4756
-1.15838
-0.718448
Die Dezile für N(2, 1):
0.718448
1.15838
1.4756
1.74665
2.
Median
2.25335
2.5244
2.84162
3.28155
6
4. Variation: Mischungen normal-verteilter Zufallsvariabler
(Siehe z.B. J. Fan, Test of Significance based on Wavelet Thresholding and Neyman's
Truncation, Journal of the American Statistical Association 1996, 682)
Seien X und Y zwei voneinander unabhängig normalverteilte Zufallsvariable, dann
sind (hier ohne Beweis) die folgenden Summen (Mischungen normal-verteilter
Zufallsgrößen) ebenfalls normalverteilt.
Sei Z:= a1.X + a 2.Y, X ~ N(µ1, σ 21), Y ~ N(µ2, σ 22)
dann ist Z ebenfalls normalverteilt, und zwar vom Typ:
2
Z ~ N( Σ a iµ i,
i=1
2
Σ a 2i σ2i )
i=1
für alle Mischungsverhältnisse, Mittelwerte und Varianzen.
Die folgenden Graphiken zeigen zwei Anwendungen:
Mischung 1
Mischung 2
Die durchgezogene Line bezeichnet die (0,1) Variable, die Standard-Normalverteilung.
7
5. Einige Aufschlag-Übungen zur Normalverteilung
Quantile jeder Art
Berücksichtigung der Symmetrie
Eindeutigkeit der Tafel zum Rückrechnen des Mittelwertes bzw. der Varianz
Einige Hauptfälle
1. Der Verteilungswert (Quantil) Die Bestimmung eines α%-Punktes
P[X ist höchstens c], c∈(- ∞, + ∞ )
(die übliche Verteilung)
c-µ
X ~N(µ, σ2): P(X ≤ c) = F(c) = Φ(
): X ~ N(0, 1)
σ
Illustration (Formulierung als Aufgabe)
Es sei µ = 150 und σ2 = 0.25.
a) Berechnen Sie F(µ). (F bezeichnet die Verteilungsfunktion von X.)
b) Berechnen und interpretieren Sie F(150.5).
µ-µ
) = Φ(0) = .5
σ
150.5 - 150.0
zu b) P(X ≤ 150.5) = F(150.5) = Φ(
) = Φ(1) = 0.8413
0.5
Illustration (Formulierung als Aufgabe)
Bestimmen Sie den 75%-Punkt einer normalverteilten Zufallsgröße X, für die gilt
X ~ N(4000, 1 000 000)
Zu dieser Fragestellung wird auch die Umkehrfunktion der Verteilung Φ-1 benutzt:
x 0.75 –4000
x 0.75 –4000
P(X ≤ x0.75 ) = 0.75 = Φ(
) = 0.75 ⇔
= 0.6745 ⇔ x0.75 = 4674.5
1000
1000
Φ-1 (0.75)
= 0.6745
2. Der Schwanz der Verteilung
P[X ist mindestens c], c∈(- ∞, + ∞ )
(der Schwanz der Verteilung)
c-µ
P(X > c) = 1 - F(c) = 1 - Φ(
)
σ
zu a) P(X ≤ µ ) = F(µ ) = Φ(
3. Die Punktwahrscheinlichkeit
P[X ist genau c] = 0, c∈(- ∞, + ∞ )
(eine Frage der Stetigkeit, Unsinn, P ≡ 0)
8
Illustration Aufgabe
Ein Sportfischerverein veranstaltet ein Wettangeln, bei dem derjenige gewinnt, dessen
erste zehn gefangenen Fische das höchste Gesamtgewicht erbringen.
Aus Erfahrung weiß man, daß das Gesamtgewicht von 10 in diesem See gefangenen
Fischen normalverteilt ist mit Erwartungswert µ = 4000 g.
a) Mit welcher Wahrscheinlichkeit ist das Gesamtgewicht der von einem Angler
gefangenen Fische größer als 6 kg, wenn die Varianz 1 000 000 g2 ist?
b) Mit welcher Wahrscheinlichkeit beträgt das Gesamtgewicht der von einem Angler
gefangenen Fische genau 4000 g?
c) Mit Wahrscheinlichkeit 0.7888 beträgt das Gesamtgewicht der zehn von einem
Angler gefangenen Fische zwischen 3 kg und 5 kg. Wie groß ist die Standardabweichung? (s.u. Fall 4)
Lösung: X ~ N(4000, 1 000 000), d.h. µ = 4000, σ2 = 1 000 000
6000 - 4000
) = 1 - Φ(2) = Φ(-2) = 0.0228
1000
b) P(X = 4000) ≡ 0 (eine für stetige Zufallsvariable unsinnige Frage)
a) P(X > 6000) = 1 - P(X ≤ 6000) = 1 - Φ(
4. Die Intervall-Wahrscheinlichkeit
P[ X liegt in einem Bereich (Intervall) (c<d | c,d∈(- ∞, + ∞ )) ]
d-µ
c-µ
P(c ≤ X ≤ d) = F(d) -F(c) = Φ(
) - Φ(
) (die Differenz zweier Verteilungswerte)
σ
σ
Fortsetzung der Illustration der Aufgabe
Wie groß ist die Wahrscheinlichkeit, daß das Gesamtgewicht der zehn von einem
Angler gefangenen Fische zwischen 3 kg und 5 kg beträgt und wenn die Varianz
σ2 = 10002 ist.
Lösungsvariante 1 (µ und σ2, beide Parameter, sind bekannt)
5000 - 4000
3000 - 4000
P(3000 ≤ X ≤ 5000) = Φ(
) - Φ(
)=Φ(1) - Φ(-1) = 0.8413 - 0.1587 = 0.6826
1000
1000
Für die Lösungsvariante 2, daß beide Parameter, µ und σ2, oder einer der beiden
Parameter µ oder σ2 nicht bekannt sind, siehe unten.
9
Illustration (σ-Intervalle)
Für die Intervallbestimmung gibt es für die Normalverteilung eine bedeutsame
Sonder-Anwendung: die σ-Intervalle
P(µ − σ ≤ X ≤ µ + σ)
P(µ − 2σ ≤ X ≤ µ + 2σ)
P(µ − 3σ ≤ X ≤ µ + 3σ) … usw.
µ+σ-µ
µ – σ -µ
) - Φ(
) = Φ(1) - Φ(-1) =
σ
σ
≈ 2/3 Regel (± eine Standardabweichung)
P(µ − σ ≤ X ≤ µ + σ) = F(µ + σ) - F(µ − σ) = Φ(
= 0.6826
µ + 2σ - µ
µ – 2σ - µ
) - Φ(
) = Φ(2) - Φ(-2) =
σ
σ
≈ 95% Regel (± zwei Standardabweichungen)
P(µ - 2σ ≤ X ≤ µ + 2σ) = F(µ +2σ) - F(µ −2σ) = Φ(
= 0.9772 - 0.0228 = 0.9554
µ + 3σ - µ
µ – 3σ - µ
) - Φ(
) = Φ(3) - Φ(-3)=
σ
σ
≈ 100% Regel (± drei Standardabweichungen)
P(µ − 3σ ≤ X ≤ µ + 3σ) = F(µ + 3σ) - F(µ − 3σ) = Φ(
= 0.9987 - 0.0013 = 0.9974
Die inhaltliche Bedeutung ist offensichtlich als Überschlag wichtig: Für
normalverteilte Zufallsgrößen liegen 2/3 bzw. 95% bzw. so gut wie 100% der
Beobachtungen innerhalb der 1- bzw. 2- bzw. 3-σ-Schranken. Entsprechend wichtig ist
die numerische Bestimmung von µ und σ.
10
5. Bestimmen der Lageparameter µ und/oder σ2
Vorgabe eines Tafelwertes und eines der Lageparameter und damit Bestimmen des
fehlenden Lageparameters
Die folgende Kurzschreibweise heißt “aus {…} folgt die rechte Seite vom →”.
c-µ
Fall 1:
{c, Φ(
), µ } → σ2
σ
c-µ
Fall 2:
{c, Φ(
), σ2 } → µ
σ
Vorgabe zweier Tafelwerte und damit Bestimmen beider Lageparameter
c-µ
d-µ
Fall 3:
{c, Φ(
), d, Φ(
) } → (µ, σ2)
σ
σ
Fortsetzung der Illustration der Aufgabe (Bestimmung von σ)
Mit Wahrscheinlichkeit 0.7888 beträgt das Gesamtgewicht der zehn von einem Angler
gefangenen Fische zwischen 3 kg und 5 kg. Wie groß ist die Standardabweichung?
5000 - 4000
3000 - 4000
P(3000 ≤ X ≤ 5000) = Φ(
) - Φ(
) = 0.7888
σ
σ
- 1000
1000
1000
= Φ(
) - Φ(
) = 2Φ(
) - 1 = 0.7888
σ
σ
σ
Zu dieser Fragestellung wird die Umkehrfunktion der Verteilung Φ-1 benutzt (s.u.):
0.7888 gehört in diesem symmetrischen Fall zu zwei Rest-Intervallen der Größe
0.2122/2
= 0.1056 (links in der Verteilung) und
= 0.8944 (rechts in der Verteilung), d.h. aber
Φ(c) = 0.1056 und Φ(d) = 0.8944 = 1 - Φ(c) werden gesucht. Es folgen aus der Tafel
1000
1000
c = -1.245 und d = 1.245, und damit = - 1.245, also σ =
σ
1.245
d.h.
5000 - 4000
3000 - 4000
P(3000 ≤ X ≤ 5000) = 0.7888 ⇔ Φ(
) - Φ(
) = 0.7888
σ
σ
1000
= Φ(d) - Φ(c) =Φ(d) - (1- Φ(d)) = 2Φ(d) - 1 = 2Φ(
) - 1 = 0.7888 ⇔
σ
1000
1000
Φ(
) = 0.5 . 1.7888 = 0.8944 ⇔
= 1.25 ⇒ σ = 800
σ
σ
Φ-1 (0.8944)
= 1.25
11
Fortsetzung der Illustration der Aufgabe (Bestimmung von µ)
Mit Wahrscheinlichkeit 0.7888 beträgt das Gesamtgewicht der zehn von einem Angler
gefangenen Fische zwischen 3 kg und 5 kg, wobei die Varianz 1 000 000 ist. Wie groß ist
der Mittelwert?
Zu dieser Fragestellung wird auch die Umkehrfunktion der Verteilung Φ-1 benutzt. Es
ist eine Anwendung, die ohne weiteres nicht gelingt:
5000 - µ
3000 - µ
P(3000 ≤ X ≤ 5000) = Φ(
) - Φ(
) = 0.7888
1000
1000
Hierfür kann nicht Symmetrie gelten, denn das hieße µ = 4000
5000 - µ
Φ(d) - (1- Φ(d)) = 2Φ(d) - 1 = 2Φ(
) - 1 = 0.7888
1000
5000 - µ
5000 - µ
Φ(
) = 0.5 . 1.7888 = 0.8944 ⇔
= 1.25 ⇒ µ = 3750, ein Widerspruch
1000
1000
Eine zweite Anwendung:
Nun sei µ unbekannt und σ2 = 1 000 000. Außerdem weiß man, daß
P(X > 5000) = 0.8413. Wie groß ist der Mittelwert?
P(X > 5000) = 1 - Φ(
5000 - µ
5000 - µ
5000 - µ
) = 0.8413 ⇔ Φ(
) = 0.1587 ⇔
= -1 ⇔ µ = 6000
1000
1000
1000
Φ-1 (0.1587)
=-1
12
Das Aufschlagen der Tafelwerte aus den Tabellen auf Seiten 25-27 geschieht nach
folgendem Muster, das für zwei Werte illustriert wird.
Das Aufschlagen aus der Φ Tabelle
“Φ(x) = 0.9901“
führt zu x = 2.303,
(Ablesen aus dem Inneren der Tabelle ← ↑ ) bzw. umgekehrt
“x = 2.303”
führt zu Φ(x) = 0.9901
(Ablesen vom Rand der Tabelle → ↓ ).
Φ(x)
…
0.03
…
↑↓
2.30
←→
.9901 = Φ(2.303)
…
Das Aufschlagen aus der Φ−1 Tabelle “x = 1.3787“, führt zu Φ(x) = 0.916,
(Ablesen aus dem Inneren der Tabelle ← ↑ ) bzw. umgekehrt
“Φ(x) = 0.916”
führt zu x = 1.3787
(Ablesen vom Rand der Tabelle → ↓ ).
Φ−1 (x)
…
0.0060
…
↑↓
0.9100
←→
0.916 = Φ−1 (1.3787)
…
13
6 Explizite Bestimmung von Quantilen für stetige parametrische Verteilungen
Das Aufschlagen eines beliebigen Quantils für die Normalverteilung geschieht aus der
Tafel. Es ist ein einfaches Verfahren, aber dennoch eine Hilfskonkonstruktion, wie der
Vergleich zum Bestimmen eines Quantils für andere stetige parametrische Verteilungen zeigt. In vielen anderen stetigen parametrischen Verteilungen kann nämlich das
zu einem Wert α zugehörige xα unmittelbar, ohne jede Tafel, durch Rechnung
explizit bestimmt werden.
Hierzu werden einige Beispiele vorgeführt. Die Parameter a und b sind geeignet
gewählte Konstanten, f und F Dichte und Verteilung und q das Quantil.
Verteilung
1.Gleichverteilung
2.ExponentialVerteilung
f(x) und F(x)
f(x) =
x = F-1 (α) = xα =q, 0≤α≤1
1
x–a
, F(x) =
, a≤x≤b
b –a
b –a
q = a + (b - a) . α, a ≤ b
q = - b . ln(1 - α)
x
1 x
f(x) = e– b , F(x) = 1 - e - b, 0≤x
b
q = b . (-ln(1 - α))1/a
3.WeibullVerteilung
f(x) =
4.Beta-Verteilung
f(x) = a . xa-1 , F(x) = xa , 0≤x≤1
q = α 1/a
5.Beta-Verteilung
f(x) = b(1-x)b-1, F(x) = 1 - (1-x)b, 0≤x≤1
q =1 - (1 - α)1/b
6.ParetoVerteilung
f(x) = aba x - (a+1), F(x) = 1 -
7.Cauchy
f(x) =
a
ba
xa-1
e–
x a
b ,
b
2
F(x) = 1 -
e–
x a
b ,
0≤x
b a
, b≤x
x
q=
b
(1 – α) 1/a
q = a + b tan(π(α - 0.5))
,
π (b2 + (x –a) )
1
x–a
1
F(x) = arctan(
)+ , -∞<x<∞
π
b
2
8.Logistische
Verteilung
f(x) =
e(a–x)/b
b(1+e (a–x)/b )2
, F(x) =
1
q = a - b ln(1/α - 1)
1 + e(a– x)/b
Die Bestimmung des α-Quantils geschieht aus der Umkehrfunktion der Verteilung
dann wie folgt:
α = F(x) ⇒ F-1 (α) = xα ;
x–a
Für die Gleichverteilung ergibt sich z.B. aus α =
das Quantil xα = a + (b-a) . α
b –a
Für den Median: α = 0.5 für die Exponentialverteilung folgt z.B.
x
x
x
α = 1 - e - b ⇔ e - b = 1 - α ⇔ ln(1 - α) = - ⇔ - b . ln(1 - α) = xα ⇔ - b . ln 0.5 = xα
b
14
Für gleichmäßig unterteilte Quantilswerte gibt es feste Namen, z.B. für
die Zweierteilung: der Median
1
i
α = , α = , k=2, i=1,2;
2
k
die Viererteilung: die Quartile
1 2 1 3 4
i
α= ,
= , , = 1, α = , k=4, i=1,2,3,4;
4 4 2 4 4
k
die Fünferteilung: die Quintile
1 2 3 4 5
i
α = , , , , = 1, α = , k=5, i=1,2,3,4,5;
5 5 5 5 5
k
die Zehnerteilung: die Dezile
i
α = 0.1, 0.2, …, 0.8, 0.9, 1.0, α = , k=10, i=1,2, …, 9,10;
k
die Hunderterteilung: die Prozente
i
α = 0.01, 0.02, …, 0.98, 0.99, 1.0, α = , k=100, i=1,2, …, 99,100; usw.
k
7. Einige numerische Beispiele zu Quantilen
Für die Normalverteilung, die Weibull-Verteilung und die Beta-Verteilung werden
einige numerische Aufschlagübungen für die Quantile vorgeführt:
15
1. Die Standard-Normalverteilung zum Vergleich:
Verteilung: normal; Parameter: {0, 1} x: {-3, 3};
Quantile:{0.01, 0.05, 0.5, 0.75, 0.95, 0.99}
Quantil
0.01
0.05
0.50
0.75
0.95
0.99
x-Wert
-2.32635
-1.64485
0.
0.67449
1.64485
2.32635
Einige Aufgaben, bzw. Beispiele illustrieren das Aufschlagen:
Beispiel (Normal-Quantile)
Betrachten Sie die Wahrscheinlichkeit P(X<2) einer N(0,1)-verteilten Zufallsvariablen.
Solch eine Wahrscheinlichkeit α ist in vielen Fragestellungen der schließenden
Statistik schon vorgegeben, und man sucht eine Zahl xα , so daß gerade P(X<x α ) = α.
Beispiel 1:
X sei N(1,4)-verteilt. Wie groß ist x0.5 , so daß also P(X<x0.5 ) = 0.5? Antwort: x0.5 = 1
Eine solche Zahl xα heißt allgemein α-Quantil. Für Spezialfälle gibt es noch andere
Bezeichnungen, z.B. für
α = 0.50 das Quantil x0.5
Median
α = 0.25 das Quantil x0.25
unteres Quartil
α = 0.75 das Quantil x0.75
oberes Quartil.
Lösung: s.o.
Beispiel 2: Berechnen Sie
a) das 0.975-Quantil
b) das 0.025-Quantil
einer N(1, 4)-verteilten Zufallsvariablen X.
Lösung: Quantil x-Wert
0.025
- 2.92
0.975
4.92
16
2. Exponential <-> Weibull-Zusammenhang:
1
Verteilung: exp; Parameter:
x: {0, 6}; Quantile: {0.25, 0.5, 0.75}
4
Quantil
0.25
0.5
0.75
x-Wert
1.15073
2.77259
5.54518
Verteilung: Weibull; Parameter: {1, 4} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
1.15073
2.77259
5.54518
17
3. Weibull-Quantil Darstellung 1
von der Verteilung rechts zur 'x-Achse' links unten
einige alternative Variationen
Verteilung: Weibull; Parameter: {2, 1} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
0.53636
0.832555
1.17741
Verteilung: Weibull; Parameter: {2, 2} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.50
0.75
x-Wert
1.07272
1.66511
2.35482
18
Verteilung: Weibull; Parameter: {2, 3} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
1.60908
2.49766
3.53223
Verteilung: Weibull; Parameter: {2, 4} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
2.14544
3.33022
4.70964
19
Verteilung: Weibull; Parameter: {2, 5} x: {0, 6}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
2.6818
4.16277
5.88705
1/a
Weibull-Quantil Darstellung 2: q = b (-Log[1 - x])
aus der inversen Funktion der Verteilung unten
zur 'x-Achse'(auf der Koordinate nach oben) a= 2; b= 5
20
4. Beta-Verteilungsfunktion F(x) = ax; 0
≤x≤1
Verteilung: Beta; Parameter: {0.5, 1} x: {0, 1}; Quantile: {0.25, 0.5,
Quantil
0.25
0.5
0.75
x-Wert
0.0625
0.25
0.5625.
Beta-Quantil Darstellung:2 q = x
1/a
(Beta-Quantil Darstellung:
q) = x
aus der inversen Funktion der Verteilung unten
zur 'x-Achse'(auf der Koordinate nach oben)
21
Aufgabe (Symmetrische Intervalle um den Mittelwert)
Von einer Zufallsvariablen X kennt man E(X) = var(X) = 100.
Berechnen Sie P(80 ≤ X ≤ 120), wenn
a)
X normalverteilt,
b)
X stetig gleichverteilt, bzw.
c)
X von unbekannter Verteilung ist
Hinweis 1: Für die Normalverteilung gilt E(X) = µ, var(X) = σ2.
Hinweis 2: Für die unbekannte Verteilung ist die Beantwortung mit den bisher verfügbaren Hilfmittel noch nicht möglich, sei hier jedoch schon als Frage vermerkt.
Aufgabe
X sei eine standardnormalverteilte Zufallsvariable N(0,1). Berechnen Sie, bzw.
schlagen Sie auf:
P(X < 0.2) P(- 1.5 ≤ X ≤ 1.5) P(|X| > 0.5)
P(|X| ≥ σ)
Lösung
P(X < 0.2) = 0.5793
P(|X| ≥ σ) = P(|X| ≥ 1) =
= 1 - 0.6826 = 0.3174
(vgl. auch S. 10)
P(|X| ≥ 2σ)
P(X = 7)
P(- 1.5 ≤ X ≤ 1.5) =
= 0.8664
P(|X| > 0.5) =
= 1 - 0.3830 = 0.6170
P(|X| ≥ 2σ) = P(|X| ≥ 2) =
= 1 - 0.9544 = 0.0456
!
P(X = 7) = 0
22
Aufgabe (kleinste und größte Intervalle)
Eine Zufallsvariable X sei nach N(2,4) verteilt. Bestimmen Sie
a) ein x∈R derart, daß gilt
b) das kürzeste Intervall [x1, x2] derart, daß gilt
P(x ≤ X)=0.75
P(x1≤ X ≤x2)=0.8.
c) ein möglichst großes (möglicherweise offenes) Intervall mit
P(x1≤ X ≤x2)=0.8.
Lösung
X-2 x-2
x-2
a) P(x ≤ X) = 0.75 ⇔ P(X ≤ x) = 0.25 ⇔ P(
≤
) = Φ(
) = 0.25
2
2
2
x–2
aus der Tafel (s.u.) folgt:
= - 0.675 ⇔ x = 0.65
2
b) Gesucht wird P(x1 ≤ X ≤ x2) = 0.8, Symmetrie und Stetigkeit verlangen links und
rechts vom gesuchten Intervall zwei gleichgroße Rest-Intervalle:
P(X < x1) = P(X > x2) = 0.1
x1 - 2
P(X < x1) = P(X ≤ x1) = 0.1 ⇒
= - 1.282 ⇒ x1 - 2 = - 2.564 ⇒ x1 = - 0.564
2
"Das Intervall ist symmetrisch zu µ=2", also x2 = 4.564 ∴ I = [-0.564, 4.564]
x2 - 2
X - 2 x2 - 2
c) Setze x1 = -∞ : P(X ≤ x2) = 0.8 ⇔ P(
≤
) = 0.8 ⇔ Φ(
) = 0.8
2
2
2
x -2
⇔ 2
= 0.842 ⇔ x2 - 2 = 1.684 ⇔ x2 = 3.684: ∴ I = (- ∞ , 3.684]
2
Eine Alternative ist, die rechte Intervallgrenze auf ‘+ ∞’ zu setzen.
Aufgabe (kleinste und größte Intervalle)
Sei X normalverteilt mit µ = 2 und σ2 = 9. Bestimmen Sie ein 90% Intervall
a) in beliebiger Lage,
b) von möglichst kleiner Länge,
c) von möglichst großer Länge.
Lösung
X~N(2, 9); zum Benutzen der Tafel der Standard-Normalverteilung X* ~ N(0,1) gilt
x–µ
x* =
⇔ x = σ · x* + µ
σ
Dabei wird die Symmetrie zum Mittelwert und die Lage des Maximums der Dichte
(des Modus) beachtet. Für a) und b) folgen
P(x0 ≤X ≤x1)= 0.9 ⇔ P(x0* ≤ X* ≤ x1*)= 0.9 ⇔
x0*= -1.645 und x1*= 1.645 ⇔ x1= -1.645 · 3 + 2 = -2.935, x2 = 1.645 · 3 + 2 = 6.935
Für a) und c) sei das Intervall (-∞, x] und damit
P(-∞ < X ≤ x)= 0.9 ⇔ F(x)= 0.9 ⇔ Φ(x*)= 0.9 ⇔ x*= 1.282 ⇔ x= 3 · 1.282 + 2 = 5.846
23
8. Die halb-normale Verteilung
Eine in der Wirtschaftstheorie erforderliche Modifikation ist die sog. halb-normale
Verteilung. Die zugehörige Dichte ist
f: (-∞,µ]→R
f(x) :=
2
2
e
-
(x-µ)
2σ
2
2
,x≤µ
2πσ
in der die Variable auf eine Halbachse beschränkt ist.
9. Die lognormale Verteilung
Eine verwandte Verteilung ist die lognormale Verteilung.
Eine Zufallsvariable X mit der Dichte
f: R→R
f(x) :=
1
2πσ
1
.e
2 x
.
-
(lnx-a)
2σ
2
2
2
, x>0, σ >0, a∈R
heißt lognormal-verteilt mit Parametern a und σ2.
Diese Dichte spielt ähnlich wie die Pareto-Verteilung in Größenverteilungen eine
Rolle.
10. Ein Bild der Normal-Verteilung
(nach W. J. Youden, The American Statistician, April-May, 1950, p. 11, bottom, bzw.
W. J. Youden, Topographical delight of a statistican, Multifunctioning graphical
elements, 143)
DIE
N O R M A LODER GAUSS VERTEILUNG IST EINES
DER HERVORRAGENDSTEN
ERGEBNISSE DER STATISTIK UND
DER MENSCHLICHEN ERKENNTNIS
ALLGEMEIN * SIE IST HEUTE EIN NAHEZU
UNENTBEHRLICHER BEGRIFF FUER DIE EMPIRISCHE FORSCHUNG IN DER NATUR- UND SOZIALWISSENSCHAFT, IN MEDIZIN, LANDWIRTSCHAFT UND
INGENIEURWISSENSCHAFTEN * FUER DIE ANALYSE VON DATEN UND
GRUNDWISSEN, DIE SICH AUS BEOBACHTUNG UND EXPERIMENT AUFBAUEN.
Typische Beispiele normalverteilter Größen sind: Größe und Gewicht von Früchten,
z.B. Maiskolben, Äpfel, Bananen; Größe und Gewicht von Mensch und Tier;
Meßfehler; Krankheitsdauern, Fluthöhen; ….
24
11. Weitere Aufgaben
Aufgabe 1
a) Beweisen Sie für die Dichtefunktion f der N(µ, σ2)-Verteilung:
1. f ist symmetrisch um µ, d.h. ∀x∈R: f(µ - x) = f(µ + x).
2. µ ist Maximalstelle von f.
3. f ist streng konvex für x∈(-∞, µ - σ) ∪ (µ + σ, ∞)
und streng konkav für x∈(µ - σ, µ + σ).
b) Berechnen Sie für eine N(µ, σ2)-verteilte Zufallsvariable X die Wahrscheinlichkeiten P(µ - kσ ≤ X ≤ µ + kσ) mit k = 1, 2, 3.
c) Berechnen Sie für eine Zufallsvariable X mit Erwartungswert E(X) und Varianz
var(X) untere Schranken für die Wahrscheinlichkeiten
P( E(X) - k . var(X) ≤ X ≤ E(X) + k . var(X) ) mit k = 1, 2, 3.
Aufgabe 2 (eine bedeutsame, aber auch anspruchsvollere Frage)
Die Stutzung einer Verteilung: Sei eine Zufallsvariable X beliebig über dem Intervall
[a1,b1] verteilt und sei A das Ereignis, daß X auf ein Teilintervall [a2,b2], a1≤a2, b2≤b1
eingeschränkt sei, z.B. für die Normalverteilung N (0, σ2) a1= -∞, b1= +∞ und a2= -σ, b 2=
+σ. Zeigen Sie , daß, falls F(x) eine Verteilung über [a1, b 1] ist, F(x|A) eine Verteilung
F(x) -F(a 2)
über [a2, b2] ist und F (x|A) =
.
F(b 2) - F( a2)
12. Die Standard-Normal-Tafeln
Hierzu siehe die drei folgenden Seiten bzw. die zu der Vorlesung zugehörige
Formelsammlung.
25
Tafel 1
Die Normalverteilung Φ(x)
+------+-------------------------------------------------------------+
| x
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09 |
+------+-------------------------------------------------------------+
| -3.00| .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010 |
| -2.90| .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014 |
| -2.80| .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019 |
| -2.70| .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026 |
| -2.60| .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036 |
| -2.50| .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048 |
| -2.40| .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064 |
| -2.30| .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084 |
| -2.20| .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110 |
| -2.10| .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143 |
| -2.00| .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 |
| -1.90| .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 |
| -1.80| .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294 |
| -1.70| .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367 |
| -1.60| .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455 |
| -1.50| .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559 |
| -1.40| .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681 |
| -1.30| .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823 |
| -1.20| .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985 |
| -1.10| .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170 |
| -1.00| .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379 |
| -.90| .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611 |
| -.80| .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .1867 |
| -.70| .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .2148 |
| -.60| .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 |
| -.50| .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776 |
| -.40| .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121 |
| -.30| .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483 |
| -.20| .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859 |
| -.10| .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247 |
|
.00| .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641 |
+------+-------------------------------------------------------------+
| x
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09 |
+------+-------------------------------------------------------------+
26
Die Normalverteilung Φ(x)
+------+-------------------------------------------------------------+
| x
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09 |
+------+-------------------------------------------------------------+
|
.00| .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359 |
|
.10| .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753 |
|
.20| .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141 |
|
.30| .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517 |
|
.40| .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879 |
|
.50| .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224 |
|
.60| .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549 |
|
.70| .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852 |
|
.80| .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133 |
|
.90| .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389 |
| 1.00| .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621 |
| 1.10| .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830 |
| 1.20| .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015 |
| 1.30| .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177 |
| 1.40| .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319 |
| 1.50| .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441 |
| 1.60| .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545 |
| 1.70| .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633 |
| 1.80| .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706 |
| 1.90| .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767 |
| 2.00| .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817 |
| 2.10| .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857 |
| 2.20| .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890 |
| 2.30| .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916 |
| 2.40| .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936 |
| 2.50| .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952 |
| 2.60| .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964 |
| 2.70| .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974 |
| 2.80| .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981 |
| 2.90| .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986 |
| 3.00| .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990 |
+------+-------------------------------------------------------------+
| x
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09 |
+------+-------------------------------------------------------------+
27
Tafel 2 Die Umkehrfunktion der Normalverteilung Φ(x): Φ−1 (x)
Φ(x)\ .0000 .0010 .0020 .0030 .0040 .0050 .0060 .0070 .0080 .0090
---------------------------------------------------------------------------.5000| .0000 .0025 .0050 .0075 .0100 .0125 .0150 .0175 .0201 .0226
.5100| .0251 .0276 .0301 .0326 .0351 .0376 .0401 .0426 .0451 .0476
.5200| .0502 .0527 .0552 .0577 .0602 .0627 .0652 .0677 .0702 .0728
.5300| .0753 .0778 .0803 .0828 .0853 .0878 .0904 .0929 .0954 .0979
.5400| .1004 .1030 .1055 .1080 .1105 .1130 .1156 .1181 .1206 .1231
.5500| .1257 .1282 .1307 .1332 .1358 .1383 .1408 .1434 .1459 .1484
.5600| .1510 .1535 .1560 .1586 .1611 .1637 .1662 .1687 .1713 .1738
.5700| .1764 .1789 .1815 .1840 .1866 .1891 .1917 .1942 .1968 .1993
.5800| .2019 .2045 .2070 .2096 .2121 .2147 .2173 .2198 .2224 .2250
.5900| .2275 .2301 .2327 .2353 .2378 .2404 .2430 .2456 .2482 .2508
.6000| .2533 .2559 .2585 .2611 .2637 .2663 .2689 .2715 .2741 .2767
.6100| .2793 .2819 .2845 .2871 .2898 .2924 .2950 .2976 .3002 .3029
.6200| .3055 .3081 .3107 .3134 .3160 .3186 .3213 .3239 .3266 .3292
.6300| .3319 .3345 .3372 .3398 .3425 .3451 .3478 .3505 .3531 .3558
.6400| .3585 .3611 .3638 .3665 .3692 .3719 .3745 .3772 .3799 .3826
.6500| .3853 .3880 .3907 .3934 .3961 .3989 .4016 .4043 .4070 .4097
.6600| .4125 .4152 .4179 .4207 .4234 .4261 .4289 .4316 .4344 .4372
.6700| .4399 .4427 .4454 .4482 .4510 .4538 .4565 .4593 .4621 .4649
.6800| .4677 .4705 .4733 .4761 .4789 .4817 .4845 .4874 .4902 .4930
.6900| .4959 .4987 .5015 .5044 .5072 .5101 .5129 .5158 .5187 .5215
.7000| .5244 .5273 .5302 .5330 .5359 .5388 .5417 .5446 .5476 .5505
.7100| .5534 .5563 .5592 .5622 .5651 .5681 .5710 .5740 .5769 .5799
.7200| .5828 .5858 .5888 .5918 .5948 .5978 .6008 .6038 .6068 .6098
.7300| .6128 .6158 .6189 .6219 .6250 .6280 .6311 .6341 .6372 .6403
.7400| .6433 .6464 .6495 .6526 .6557 .6588 .6620 .6651 .6682 .6713
.7500| .6745 .6776 .6808 .6840 .6871 .6903 .6935 .6967 .6999 .7031
.7600| .7063 .7095 .7128 .7160 .7192 .7225 .7257 .7290 .7323 .7356
.7700| .7388 .7421 .7454 .7488 .7521 .7554 .7588 .7621 .7655 .7688
.7800| .7722 .7756 .7790 .7824 .7858 .7892 .7926 .7961 .7995 .8030
.7900| .8064 .8099 .8134 .8169 .8204 .8239 .8274 .8310 .8345 .8381
.8000| .8416 .8452 .8488 .8524 .8560 .8596 .8633 .8669 .8705 .8742
.8100| .8779 .8816 .8853 .8890 .8927 .8965 .9002 .9040 .9078 .9116
.8200| .9154 .9192 .9230 .9269 .9307 .9346 .9385 .9424 .9463 .9502
.8300| .9542 .9581 .9621 .9661 .9701 .9741 .9782 .9822 .9863 .9904
.8400| .9945 .9986 1.0027 1.0069 1.0110 1.0152 1.0194 1.0237 1.0279 1.0322
.8500| 1.0364 1.0407 1.0450 1.0494 1.0537 1.0581 1.0625 1.0669 1.0714 1.0758
.8600| 1.0803 1.0848 1.0893 1.0939 1.0985 1.1031 1.1077 1.1123 1.1170 1.1217
.8700| 1.1264 1.1311 1.1359 1.1407 1.1455 1.1503 1.1552 1.1601 1.1650 1.1700
.8800| 1.1750 1.1800 1.1850 1.1901 1.1952 1.2004 1.2055 1.2107 1.2160 1.2212
.8900| 1.2265 1.2319 1.2372 1.2426 1.2481 1.2536 1.2591 1.2646 1.2702 1.2759
.9000| 1.2816 1.2873 1.2930 1.2988 1.3047 1.3106 1.3165 1.3225 1.3285 1.3346
.9100| 1.3408 1.3469 1.3532 1.3595 1.3658 1.3722 1.3787 1.3852 1.3917 1.3984
.9200| 1.4051 1.4118 1.4187 1.4255 1.4325 1.4395 1.4466 1.4538 1.4611 1.4684
.9300| 1.4758 1.4833 1.4909 1.4985 1.5063 1.5141 1.5220 1.5301 1.5382 1.5464
.9400| 1.5548 1.5632 1.5718 1.5805 1.5893 1.5982 1.6072 1.6164 1.6258 1.6352
.9500| 1.6449 1.6546 1.6646 1.6747 1.6849 1.6954 1.7060 1.7169 1.7279 1.7392
.9600| 1.7507 1.7624 1.7744 1.7866 1.7991 1.8119 1.8250 1.8384 1.8522 1.8663
.9700| 1.8808 1.8957 1.9110 1.9268 1.9431 1.9600 1.9774 1.9954 2.0141 2.0335
.9800| 2.0537 2.0749 2.0969 2.1201 2.1444 2.1701 2.1973 2.2262 2.2571 2.2904
.9900| 2.3263 2.3656 2.4089 2.4573 2.5121 2.5758 2.6521 2.7478 2.8782 3.0902
---------------------------------------------------------------------------Φ(x)/ .0000 .0010 .0020 .0030 .0040 .0050 .0060 .0070 .0080 .0090
Herunterladen