Wahrscheinlichkeitsverteilungen von Zufallsvariablen

Werbung
stoch_08.nb
1
Grundlagen der Stochastik
Das vorliegende Skript wurde im Original mit dem Programmsystem MATHEMATICA ® von WOLFRAM-Research [http://www.wolfram.com]
geschrieben und erstmals auf den Webseiten der Hochschule für Technik und Wirtschaft in Dresden (University of Applied Sciences)
[http://www.htw-dresden.de] veröffentlicht. Die Schrift trägt den Charakter eines Arbeitskonzepts, so dass ich für Hinweise und Anregungen
aller Art, einschließlich zu Rechtschreibung, Grammatik und Druckbild sehr dankbar bin.
Mit meinem Beitrag erhebe ich keinen Anspruch auf irgendeine Vollständigkeit bzw. Allgemeingültigkeit. Ich möchte einzig und allein an
exemplarischen Problemstellungen der Baumechanik logisch einfache mathematisch-physikalische Lösungsmethoden zur Diskussion stellen.
Mirko Slavik, Dresden
8 Wahrscheinlichkeitsverteilungen von Zufallsvariablen
8.1 Unter einer eindimensionalen Zufallsvariablen vekX = { x1 , x2 , ... , xi , ... , xn- 1 , xn } versteht man
eine funktionelle Zuordnung, die jedem Ereignis eines Ereignisraumes (vgl. Absatz 3.5) eine reelle Zahl
zuweist.
Anmerkung: Mit einem Großbuchstaben kennzeichne ich die Menge (den "Namen") einer Zufallsvariablen. Ein Kleinbuchstabe steht für ein Element (den "Wert") der jeweiligen Zufallsgrößenmenge. Ich bitte
den Leser, insbesondere die Gilde der Mathematiker, vor der ich mich tief verbeuge, um Verständnis,
falls die Groß- und Kleinschreibung nicht immer schlüssig bzw. richtig ist.
8.2 Einer solchen Zufallsvariablen wollen wir das Wahrscheinlichkeitsmaß P (X < x ) zuordnen können.
Das Ereignis E { X < x } selbst muss im Gegensatz zu den Daten einer Stichprobe nicht realisiert
worden sein. Die Wahrscheinlichkeitsrechnung stellt somit eine höhere Abstraktionsstufe als die Statistik
dar (vgl. Absatz 6.5).
8.3 Man unterscheidet diskrete und stetige Zufallsvariable. Typische Beispiele diskreter Zufallsgrößen
sind Zählungen von Kraftfahrzeugen oder Personen. Für stetige Größen stehen die Festigkeiten von
Werkstoffen oder die Eigenlasten tragender Konstruktionen.
8.4 Eine fundamentale Bedeutung kommt der Wahrscheinlichkeitsverteilung (Verteilungsfunktion) FX
zu (vgl. hierzu die absolute Häufigkeitssumme des Absatzes 7.11). Wenn eine solche Verteilung
analytisch vorliegt, kennt man alle stochastischen Kenngrößen der Zufallsvariablen. Da sie für jeden
Punkt der x-Achse definiert ist, schreiben wir:
FX (x) = P ( X < x ) .
8.5 Es bereitet gemäß der Häufigkeitsdefinition (6.1) bzw. der Siebformel (6.8 f) keine Schwierigkeit,
die Wahrscheinlichkeit des Auftretens von X im Intervall a < X b b mittels Verteilungsfunktion auszudrücken. Für diese Intervallwahrscheinlichkeit gilt:
P (a < X b b) = FX (b) - FX (a) .
Beweis über Additionssatz:
P( X b b ) = P( X c a ‹ (a < X b b) ) = P( X c a ) + P(a < X b b) - P( X c a › (a < X b b) )
P( X b b ) = P( X c a ) + P(a < X b b) - 0 fl
P(a < X b b) = P( X b b ) - P( X c a ) w.z.b.w. .
stoch_08.nb
2
8.6 Weitere Eigenschaften der Verteilungsfunktion sind:
FX (a) § FX (b) wenn a b b ,
Limit [ FX (a) , a Ø - ¶ ] = 0 , unmögliches Ereignis,
Limit [ FX (b) , b Ø +¶ ] = 1 , sicheres Ereignis,
P( X ª x ) ª 0 oder gleich der Sprunghöhe der Verteilungsfunktion, falls diese bei x unstetig ist (siehe
Absatz 8.14).
8.7 Wenn eine Zufallsvariable X als Ereignismenge die reelen Zahlen -¶ < x < +¶ besitzt, sprechen
wir von einer stetigen Verteilung, die in diesem Intervall differenzierbar ist. Die entsprechende Ableitung
∑x FX HxL = fX HxL = Limit [
D F X HxL
Dx
, Dx Ø 0]
wird als Wahrscheinlichkeitsdichte (Dichtefunktion)
wachsend ist, gilt fX HxL r 0.
bezeichnet. Da die Verteilungsfunktion monoton
8.8 Nach Absatz 8.5 und Absatz 8.6 folgt
P (a < X b b) = FX (b) - FX (a) = Ÿab fX HxL „ x ,
x
FX (x) = P ( X b x) = Ÿ-¶
fX HuL „ u,
+¶
Ÿ-¶ fX HxL „ x = 1 .
8.9 Für ein beliebiges X = x gilt dann (siehe auch Absatz 8.6)
P( X ª x ) ª 0 P Ÿxx fX HuL „ u .
8.10 Die Verteilungsfunktion entspricht formal der relativen Häufigkeitssumme einer diskreten Größe,
die Wahrscheinlichkeitsdichte der zugehörigen Verteilung der relativen Häufigkeiten (siehe Absatz
7.15), wenn letztere auf die Intervallbreite bezogen wird. Anhand der Normalverteilung wird diese
Identität im Beispiel des Absatzes 8.13 grafisch aufgezeigt.
Anmerkung zu "Wahrscheinlichkeitsdichte entspricht Verteilung der relativen Häufigkeiten":
Mit den Beziehungen (6.8), (8.7) und (8.8) gilt
P (a < X b b) = FX (b) - FX (a) P P (a < X b a + Dx) = FX (a+Dx) - FX (a) P Limit [
k Dx
n
,nض],
mit kDx als absolute Häufigkeit der Zufallsvariablen im Intervall Dx. Somit folgt schließlich
fX HxL = Limit [
D F X HxL
Dx
, Dx Ø 0] P Limit [
k Dx
n Dx
, n Ø ¶, Dx Ø 0 ] .
8.11 Die wohl bekannteste, aber auch wichtigste Verteilung stellt die Normalverteilung dar, die nach
Carl Friedrich GAUSS (1777 - 1855) auch als GAUSSverteilung bezeichnet wird. Mit dem Mittelwert
ewx und der Standardabweichung sx gelten für die Dichte und die Verteilungsfunktion:
stoch_08.nb
3
Normalverteilungsdichte :
fX HxL
−
x−ewx 2
N
sx
2
2π
sx
Normalverteilungsfunktion :
J
1
FX HxL
‡
1
2π
sx
x
−
J
u−ewx 2
N
sx
2
u
−∞
8.12 Wegen ihrer Form wird die Dichtefunktion auch als Glockenkurve bezeichnet. Sie hat ihr Maximum
bei x = ewx und beträgt an dieser Stelle fX (x = ewx) = Jsx
2 p N . Ihre beiden Wendepunkte liegen
-1
bei x = ewx ± sx mit den Dichtewerten fX (x = ewx ± sx) = Jsx
2 p ‰ N . Bezüglich ihrem Mittelwert ist
-1
sie symmetrisch. Für ewx = 0 und sx = 1 erhält man die standardisierten Formen:
Standardisierte Dichte :
fX HxL
1
−
x2
2
2π
Standardisierte Verteilung :
FX HxL
1
2π
‡
x
−
u2
2
u
−∞
8.13 Anhand eines Beispiels seien die charakteristischen Verläufe einer typischen normalverteilten
Zufallsgröße aufgezeigt (blaue Linien). Um einen Vergleich zu den analytischen Darstellungen führen zu
können, nutzen wir den Weg über die statistische Simulation einer normalverteilten Stichprobe, die
gemäß Absatz 7.15 (rote Punkte) aufbereitet wird. Im Anschluss werden die Wahrscheinlichkeiten
ausgewiesen, mit denen eine normalverteilte Zufallsvariable innerhalb der ±1sx-, ± 2sx- bzw. ± 3sxIntervalle auftritt. Anhand der standardisierten (normierten) Normalverteilung kann gezeigt werden,
dass diese Werte unabhängig von der Größe des Mittelwertes und der Streuung sind (vgl. hierzu [8,
Absatz 4.4.3]).
RandomNormal@μ_, σ_D := Random@NormalDistribution@μ, σDD
ewx = 1; sx = .5; n = 105 ; maxi = 100; k = 3.5;
NORMALVERTEILUNG - simuliert vs. stetig
1.0
Verteilungsfunktion
0.8
0.6
0.4
0.2
0.0
−0.5 0.0
0.5
1.0
1.5
Zufallsvariable
2.0
2.5
stoch_08.nb
4
NORMALVERTEILUNGSDICHTE - simuliert vs. stetig
0.8
Dichte
0.6
0.4
0.2
0.0
−0.5
0.0
0.5
1.0
1.5
2.0
2.5
Zufallsvariable
1sx − Grenze:
2sx − Grenze:
3sx − Grenze:
0.682689
0.9545
0.9973
8.14 Wir wollen uns jetzt den diskreten Verteilungen widmen. Um ein diskrete Verteilung handelt es
sich, wenn die Zufallsgröße X nur diskrete Werte xi annehmen kann, die die Einzelwahrscheinlichkeiten pX (xi ) (Kurzform pi ) besitzen. Mit (8.4) sowie (6.8b) bzw. (6.2b) folgt:
FX ( xk ) = P ( X b xk ) = P ( X = x1 ) + P ( X = x2 ) + ... + P ( X = xi ) + ...+ P ( X = xk ) = ⁄ i = 1 pi
k
mit x i = 1,2,...,k b xk . Für alle i gilt dann ⁄ i = 1 pi ª 1 .
maxi
8.15 Die Verteilungsfunktion FX (xk ) ist zwischen den Sprüngen bei xi konstant. Die Sprünge selbst
besitzen die Höhe pX (xi ). Das typische grafische Bild der Verteilungsfunktion bzw. der Wahrscheinlichkeitsdichte einer diskreten Verteilung soll anhand der technisch wichtigen POISSONverteilung aufgezeigt werden (siehe Absatz 8.18). Sie ist nach dem französischen Mathematiker Siméon Denis POISSON (1781 - 1840) benannt und beinhaltet als Ereignisraum die Menge der natürlichen Zahlen i = 0, 1,
2, ... , k-1 , k und den freien Parameter l r 0 :
P ( X = k ) = pi =
li
i!
‰-l .
8.16 Mittels der Deltafunktion, die nach dem britischen Physiker Paul DIRAC (1902 - 1984) auch als
DIRACfunktion bekannt ist, gelingt es, eine diskrete Dichtefunktion als quasistetige Funktion
darzustellen:
fX HxL P ⁄ i = 0 pi dHx - iL = ⁄ik= 0
k
li
i!
‰-l dHx - iL .
Anmerkung zur DIRACfunktion (siehe hierzu auch [14, Absatz 31.3 f.]:
Sie wurde 1926 von DIRAC eingeführt und gehört zu den verallgemeinerten Funktionen, auch Distributionen genannt [9]. Es gilt:
stoch_08.nb
Ÿ
5
f HxL dHa x - xi L „ x =
x2
x1
Î
Å f J iN
1
x
a
a
für xi innerhalb des Intervalls
D x 1 , x2 @
für xi außerhalb des Intervalls @ x1 , x2 D.
0
Für den Sonderfall a = 1 und f(x) = 1 folgt
x
Ÿ x 2 dHx - xi L „ x =
1
Î
1
für xi innerhalb des Intervalls D x1 , x2 @
für xi außerhalb des Intervalls @x1 , x2 D.
0
Um die DIRACfunktion grafisch darstellen zu können, müssen wir uns einer Exponentialfunktion
bedienen, wobei der freie, ganzzahlige Parameter n Ø ¶ strebt:
d(x - xi ) =
n
Å
p
‰-n Ix-xi M .
2
Wir zeigen Letzteres anhand eines Beispieles:
Print@"Test der beiden Intergralformen
:‡
+100
auf eins:"D
DiracDelta@x − 2.75D x,
−100
EvaluateB‡
+100
−100
n
−n Hx−2.75L2
π
Test der beiden Intergralformen
x ê. n −> 81, 10, 100, 1000, 5000<F>
auf eins:
81, 81., 1., 1., 1., 1.<<
n
PlotBEvaluateB
π
−n Hx−2.75L2
ê. n −> 82, 10, 100, 1000, 5000<F,
8x, 1.5, 3.5<, PlotRange → All, Frame → True,
Axes → True, GridLines → Automatic, LabelStyle → Black,
FrameLabel → 8Text@Style@" Definitionsbereich Hx−WerteL",
Black, FontFamily → "Arial", Bold, 8DD, None, None,
Text@Style@ " Wertebereich ", Black, FontFamily → "Arial", Bold, 8DD<,
PlotLabel → Text@Style@" DELTAfunktionen HBeispieleL", Black,
FontFamily → "Arial", Italic, Bold, 10DD, PlotStyle → 8Thick<F
stoch_08.nb
6
DELTAfunktionen HBeispieleL
40
Wertebereich
30
20
10
0
1.5
2.0
2.5
3.0
3.5
Definitionsbereich Hx-WerteL
8.17 Die Verteilungsfunktion der POISSONverteilung lautet somit
x
FX (x) = Ÿ-¶
K⁄ki=0
li
i!
‰-l dHu - i LO „ u .
8.18 Mittels eines kleinen, analog zu den stetigen Verteilungen entwickelten Algorithmus bereitet es nun
keine Schwierigkeit, für eine beliebige POISSONverteilung die Funktionsbilder einschließlich ihrer
Datenpaare aufzuzeigen. Die Parameter l und xmax P k werden frei gewählt:
λ = 8; k = 20;
POISSONverteilung HblauL und zugehörige Dichte HrotL
1.0
Häufigkeit
0.8
0.6
0.4
0.2
0.0
0
5
10
Zufallsgröße X
15
20
stoch_08.nb
7
Datenpaare
der
Dichte :
880., 0.000335463<, 81., 0.0026837<, 82., 0.0107348<, 83., 0.0286261<,
84., 0.0572523<, 85., 0.0916037<, 86., 0.122138<, 87., 0.139587<, 88., 0.139587<,
89., 0.124077<, 810., 0.0992615<, 811., 0.0721902<, 812., 0.0481268<,
813., 0.0296165<, 814., 0.0169237<, 815., 0.00902598<, 816., 0.00451299<,
817., 0.00212376<, 818., 0.000943893<, 819., 0.000397429<, 820., 0.000158971<<
Datenpaare
der
Verteilung :
880., 0.000335463<, 81., 0.00301916<, 82., 0.013754<, 83., 0.0423801<,
84., 0.0996324<, 85., 0.191236<, 86., 0.313374<, 87., 0.452961<, 88., 0.592547<,
89., 0.716624<, 810., 0.815886<, 811., 0.888076<, 812., 0.936203<,
813., 0.965819<, 814., 0.982743<, 815., 0.991769<, 816., 0.996282<,
817., 0.998406<, 818., 0.99935<, 819., 0.999747<, 820., 0.999827<<
8.19 In meinem Skript zur Zuverlässigkeit tragender Konstruktionen [8] spielen mehrdimensionale
Verteilungsdichten eine wichtige Rolle. Diesem Gegenstand nähert man sich am besten, indem der
Grenzwertansatz zur eindimensionalen stetigen Verteilungsdichte des Absatzes 8.10 zunächst auf den
zweidimensionalen Fall erweitert wird.
8.20 Eine von den zwei Zufallsvariablen X1 und X2 aufgespannte Ebene werde in ein gleichmäßiges
Raster von differenziellen Dx1 -Dx2 -Flächen zerlegt. Die Frage lautet nun, mit welcher relativen Häufigkeit k Dx1 ,Dx2 "verteilen" sich die einzelnen x1 -x2 -Paare der gesamten zweidimensionalen Stichprobe
auf diese Rasterflächen. Laut Absatz 8.10 gilt:
fX HxL = Limit [
D F X HxL
Dx
, Dx Ø 0] P Limit [
fX1 ,X2 Hx1 , x2 L = Limit [
D F X , X Ix1 ,x2 M
1 2
,
Dx1 Dx2
k Dx
n Dx
, n Ø ¶, Dx Ø 0]
ö
Dx1 Ø 0, Dx2 Ø 0] P Limit [
k Dx ,Dx
1
2
,
n Dx1 Dx2
n Ø ¶, Dx1 Ø 0, Dx2 Ø 0 ] .
8.21 In formaler Analogie zu den Absätzen 8.7 und 8.8 kann nun die Definition einer zweidimensionalen bzw. n-dimensionalen Verteilungsfunktion abgeleitet werden:
x
FX (x) = P (X b x) = Ÿ-¶
fX HuL „ u
x1 x2
ö FX1 ,X2 (x1 ,x2 ) = P ( X1 b x1 , X2 b x2 ) = Ÿ-¶
Ÿ-¶ fX Hu1 , u2 L „ u1 „ u2
x1 x2
x
ö FvekX (vekx) = P ( X1 b x1 , X2 b x2 , ... , Xn-1 b xn-1 , Xn b xn ) = Ÿ-¶
Ÿ-¶ ... Ÿ-¶n fX HvekuL „ veku .
8.22 Statt der Begriffe mehrdimensionale Verteilungsfunktion bzw. - dichte verwendet man in der Fachliteratur auch die Termini der Verbundverteilungsfunktion bzw. -dichte. Als ein Beispiel betrachten wir
gemäß [3] eine zweidimensionale Normalverteilungsdichte (vgl. hierzu auch [8, Absatz 4.3.13 ]), die wir
numerisch hinterlegen müssen, um sie grafisch darstellen zu können:
stoch_08.nb
8
korr11 = 0.5;
ewx1 = 10; ewx2 = 4; sx1 = 5; sx2 = 4; ob = ∞; un = −ob;
ISO =
1
2 I1 − korr112 M
2 π sx1 sx2
PrintB"Test
ob
‡
sx12
1
fx1x2 =
‡
Hx1 − ewx1L2
ob
auf
−
2 korr11
sx1 sx2
Hx1 − ewx1L Hx2 − ewx2L +
Hx2 − ewx2L2
;
sx22
−ISO ;
1 − korr112
positiv
fx1x2 x1 x2 êê NF
Eins
des
f X1 , X2 − Dichteintegrals :
",
blick = 8−1.0, −1.25, .75<;
Plot3DAfx1x2, 8x1, −5, 25<, 8x2, −10, 20<, PlotRange → All, AxesLabel → 9" X1 ", "
un
un
fX1 ,X2 "=, Mesh → False, ColorFunction → "CMYKColors",
X2 ", "
PlotPoints → 100, PlotLabel −> "Zweidimensionale Verteilungsdichte
", ViewPoint → blick, BoxRatios → 81, 1, 0.75<E
ContourPlot@fx1x2, 8x1, 0, 20<, 8x2, −10, 15<, PlotPoints → 100,
ContourShading → True, Contours → 150, ColorFunction → "CMYKColors",
Frame → True, Axes → True, GridLines → None, LabelStyle → Black,
FrameLabel → 8Text@Style@"X1 ", Black, FontFamily → "Arial", Bold, 8DD,
None, None, Text@Style@ "X2 ", Black, FontFamily → "Arial", Bold, 8DD<,
PlotLabel → Text@Style@"Zweidimensionale Verteilungsdichte",
Black, FontFamily → "Arial", Italic, Bold, 10DDD
Test
auf
positiv
Eins
des
f X , X − Dichteintegrals :
1
2
1.
stoch_08.nb
9
8.23 Bei den Eingansparametern im Absatz 8.22 repräsentiert der Wert korr11 den im Absatz 10.13
definierten Korrelationskoeffizienten der beiden Zufallsvariablen X1 und X2 . Die im ContourPlot ausgewiesenen Isolinien (ISO = konstant) sind Ellipsen, deren Zentrum durch die Erwartungswerte ewx1 und
ewx2 festgelegt wird. Der Korrelationskoeffizient beeinflusst die Neigung der Ellipsenhauptachsen
gegenüber den Koordinatenachsen der Zufallsvariablen. So sind im Falle unkorrelierter Zufallsgrößen
(korr11 = 0) die Hauptachsen parallel zu diesen. Mit dem Begriff der Korrelation steht die Frage nach der
stochastischen Unabhängigkeit zweier Zufallsgrößen in einem ursächlichen Zusammenhang (siehe
Absätze 10.14 f.).
8.24 Integrieren wir die Verbundverteilungsdichte entweder über den gesamten Bereich der Variablen
X1 oder den von X2 , erhalten wir die sogenannten Randverteilungen FX1 (x1 ) bzw. FX2 (x2 ) mit den
zugehörigen Randdichten fX1 Hx1 L bzw. fX2 Hx2 L. Es gilt:
x1
x2
FX1 (x1 ) = P(X1 b x1 ) = Ÿ-¶
fX1 Hu1 L „ u1 bzw. FX2 (x2 ) = P (X2 b x2 ) = Ÿ-¶
fX2 Hu2 L „ u2
+¶
fX1 , X2 Hx1 , x2 L „ x2
mit fX1 Hu1 L P fX1 Hx1 L = Ÿ-¶
bzw.
+¶
fX2 Hu2 L P fX2 Hx2 L = Ÿ-¶
fX1 , X2 Hx1 , x2 L „ x1 .
8.25 Um die Auswirkungen dieser Integration zu beleuchten, wählen wir für die obige normalverteilte
Verbundverteilungsdichte deren standardisierte Form (vgl. Absatz 8.12).
stoch_08.nb
10
ewx1 = 0; ewx2 = 0; sx1 = 1; sx2 = 1;
ISO =
Hx1 − ewx1L2
1
2 I1 − korr112 M
sx12
sx1 sx2
1
fx1x2 =
2 π sx1 sx2
:fx1
2 korr11
−
−ISO ;
1−
:fx1
Hx1 − ewx1L Hx2 − ewx2L +
‡
korr112
IfBReAkorr112 E < 1,
1
−
∞
−∞
fx1x2 x2, fx2 == ‡
x12
2
Hx2 − ewx2L2
;
sx22
∞
fx1x2 x1>
−∞
1 − korr112
2π ,
1 − korr112 π
2
IntegrateB
x12 −2 korr11 x1 x2+x22
2 J−1+korr112 N
IfBReAkorr112 E < 1,
1
fx2
1−
2
korr112
IntegrateB
, 8x2, −∞, ∞<, Assumptions → ReAkorr112 E ≥ 1FF,
−
x22
2
1 − korr112
2π ,
π
x12 −2 korr11 x1 x2+x22
2 J−1+korr112 N
, 8x1, −∞, ∞<, Assumptions → ReAkorr112 E ≥ 1FF>
8.26 Da die Bedingung Re [ korr11 2 ] < 1 nach Absatz 10.13 stets erfüllt ist, lautet das aufbereitete
Ergebnis für die beiden Randdichten
fX1 Hx1 L =
x 2
- 1
‰ 2
1
2p
bzw. fX2 Hx2 L =
1
x 2
- 2
‰ 2
.
2p
8.27 Gemäß Absatz 8.12 sind diese beiden Gleichungen mit den eindimensionalen standardisierten
Normalverteilungsdichten identisch, in denen entweder nur noch die Zufallsvariable X1 oder die
Variable X2 vorkommen. Wenn das Produkt dieser beiden Dichten, was im nächsten Absatz näher
erläutert wird, der gemeinsamen Verbundverteilungsdichte von X1 und X2 gleich ist, dann sind beide
Randdichten voneinander stochastisch unabhängig.
ClearAll@fx1x2D; ewx1 = 0; ewx2 = 0; sx1 = 1; sx2 = 1;
fx1 =
1
−
x12
2
; fx2 =
2π
ISO =
1
−
x22
2
;
2π
1
2 I1 − korr112 M
Hx1 − ewx1L2
sx12
−
:Produkt _Randdichten == fx1 ∗ fx2,
1
fx1x2 ==
2 π sx1 sx2
2 korr11
sx1 sx2
−ISO
1−
korr112
Hx1 − ewx1L Hx2 − ewx2L +
ê. korr11 → .0>
Hx2 − ewx2L2
sx22
;
stoch_08.nb
11
:Produkt _Randdichten
−
x12 x22
−
2
2
, fx1x2
2π
0.159155
−0.5 Jx12 +0. x1 x2+x22 N
>
8.28 Will man jedoch die Frage nach der stochastische Unabhängigkeit stellen, ohne den Umweg über
die standardisierte Form zu gehen, bedarf es einer sehr aufwendigen Integrationsanalyse. Wir wollen
uns deshalb auf den Sonderfall von zwei Zufallsvariablen beschränken, die wir apriori als unabhängig
ansehen. Der Korrelationskoeffizient ist für diese Größen stets Null (vgl. Absätze 10.15 bzw. 10.20).
Dann entspricht die Verbundwahrscheinlichkeitsdichte dem Produkt der beiden Randverteilungen (vgl.
auch Absatz 8.34), wobei Letztere (siehe Absatz 8.30) die eindimensionalen Normalverteilungsdichten
des Absatzes 8.11 repräsentieren:
fX1 , X2 Hx1 , x2 L = fX1 Hx1 L · fX2 Hx2 L .
8.29 Mit dem Korrelationskoeffizient korr11 = 0 in Gleichung (8.22) erhält man
ISO =
1
x1 − ewx1
2
sx1
fx1x2 =
:fx1
1
2 π sx1 sx2
x2 − ewx2
2
;
−
IntegrateB
:fx1 == ‡
∞
−∞
fx1x2 x2, fx2 == ‡
−
Hewx1−x1L2
2 sx12
∞
fx1x2 x1>
−∞
2π
,
1
sx22
Hewx1−x1L2 Hewx2−x2L2
−
2 sx12
2 sx22
IfBReAsx12 E > 0,
1
2 π sx1 sx2
−
−ISO ;
IfBReAsx22 E > 0,
2 π sx1 sx2
IntegrateB
+
sx2
1
fx2
2
, 8x2, −∞, ∞<, Assumptions → ReAsx22 E ≤ 0FF,
−
Hewx2−x2L2
2 sx22
2π
,
1
sx12
Hewx1−x1L2 Hewx2−x2L2
−
2 sx12
2 sx22
, 8x1, −∞, ∞<, Assumptions → ReAsx12 E ≤ 0FF>
8.30 Da stets Re [sx1 2 ] > 0 bzw. Re [sx2 2 ] > 0 sind, ist der Produktsatz des Absatzes 8.28 verifiziert (vgl. hierzu auch die versteckte Zelle beim Absatz 8.31):
fx1 =
1
2 π sx1
True
−
Hewx1−x1L2
2 sx12
; fx2 =
1
2 π sx2
−
Hewx2−x2L2
2 sx22
; Simplify@fx1x2
fx1 ∗ fx2D
stoch_08.nb
12
8.31 Das Produkt (8.28) dient als maßtheoretische Charakteristik der stochastischen Unabhängigkeit
von Zufallsgrößen. Die oben getroffenen Aussagen zum Korrelationskoeffizienten korr11 = 0 sind
anhand einer beliebigen Parameterstudie nachweisbar. Dieses Ergebnis besagt aber nur, dass die
beiden Randdichten stochastisch unabhängig sind, nicht aber die beiden Zufallsvariablen selbst, was in
der anschließenden versteckten Zelle heuristisch aufgezeigt wird. Die Begründung hierfür findet sich in
der Tatsache, dass die Randdichten der zweidimensionalen Normalverteilung unabhängig vom Korrelationskoeffizienten der Grundgesamtheit sind (vgl. Absatz 8.25).
Anmerkung: Zum Verständnis sowohl der beiden Inputzellen als auch der versteckten Zelle bedarf es
der Kenntnis des Abschnittes 10.
ewx1 = 2; ewx2 = 3; sx1 = 4; sx2 = 5; ob = ∞; un = −ob;
−
1
fx1 =
Hewx1−x1L2
2 sx12
; fx2 =
2 π sx1
−
1
Hewx2−x2L2
2 sx22
;
2 π sx2
PrintB"Test auf positiv Eins des Dichteintegrals :
PrintB"m 10 = ", m10 = ‡
ob
un
m01 = ‡
ob
un
‡
PrintB"zm
ob
un
", zm 02 = ", zm02 = ‡
=
",
ob
un
ob
un
‡
‡
ob
un
ob
un
ob
un
ob
‡
ob
fx1 fx2 x1 x2 êê NF
un
x1 fx1 fx2 x1 x2 êê N, ", m01 = ",
un
= ", zm11 = ‡
11
11
ob
x2 fx1 fx2 x1 x2 êê N, ", m 11 = ", m11 = ‡
", zm 20 = ", zm20 = ‡
", korr
‡
", ‡
‡
ob
ob
un
‡
ob
un
Hx1 − m10 L H x2 − m01 L fx1 fx2 x1 x2 êê N,
un
Hx1 − m10 L2 fx1 fx2 x1 x2 êê N,
H x2 − m01 L2 fx1 fx2 x1 x2 êê N,
un
zm11
x1 x2 fx1 fx2 x1 x2 êê NF
F
zm20 zm02
Test auf positiv Eins des Dichteintegrals :
1.
m 10 = 2., m01 = 3., m 11 = 6.
zm 11 = 0., zm 20 = 16., zm 02 = 25., korr 11 =
0.
à Versteckte Zelle zur Problematik des Produktsatzes (8.28).
stoch_08.nb
13
8.32 Die Grenzwertbildung im Absatz 8.20 lässt sich laut der Produktregel der Grenzwertsätze auch
anders schreiben:
fX1 ,X2 Hx1 , x2 L P Limit [
fX1 ,X2 Hx1 , x2 L P Limit [
P Limit [
P
k Dx , Dx
1
2
,
n Dx1 Dx2
n Ø ¶, Dx1 Ø 0, Dx2 Ø 0 ]
k Dx , Dx kDx
1
2
1
n Dx1 Dx2 kDx
1
k Dx , Dx
1
2
Dx2 kDx
1
Ø
, n Ø ¶, Dx1 Ø 0, Dx2 Ø 0 ]
, kDx1 Ø ¶, Dx2 Ø 0 ] Limit [
kDx
1
,
n Dx1
∞
fX2 ,X1 Hx2 \ x1 L
n Ø ¶, Dx1 Ø 0]
∞
fX1 Hx1 L
oder
fX1 ,X2 Hx1 , x2 L P Limit [
P Limit [
P
k Dx , Dx kDx
1
2
2
n Dx1 Dx2 kDx
2
k Dx , Dx
1
2
Dx1 kDx
2
, n Ø ¶, Dx1 Ø 0, Dx2 Ø 0 ]
, kDx2 Ø ¶, Dx1 Ø 0 ] Limit [
kDx
2
,
n Dx2
∞
fX1 ,X2 Hx1 \ x2 L
n Ø ¶, Dx2 Ø 0 ]
∞
fX2 Hx2 L
und schließlich zusammengefasst
fX1 ,X2 Hx1 , x2 L = fX2 ,X1 Hx2 \ x1 L · fX1 Hx1 L =
fX1 ,X2 Hx1 \ x2 L · fX2 Hx2 L .
8.33 Die Terme fX1 Hx1 L bzw. fX2 Hx2 L entsprechen den Randdichten (Absatz 8.24), weil sie, wie leicht
zu ersehen ist, unabhängig von X2 bzw. X1 sind. Hingegen wird bei den Termen fX2 ,X1 Hx2 \ x1 L bzw.
fX1 ,X2 Hx1 \ x2 L ein unmittelbarer Bezug auf X1 bzw. X2 hergestellt. Wir sprechen von bedingten Wahr-
scheinlichkeitsdichten, was wir unschwer als Analogon zu den bedingten Wahrscheinlichkeiten des
Absatzes 6.10 betrachten können. Für die Verbundverteilung gilt nach Absatz 8.21:
x 1 x2
FX1 ,X2 (x1 , x2 ) = Ÿ-¶
Ÿ-¶ fX1 ,X2 Hu1 , u2 L „ u1 „ u2 = P ( X1 b x1 › X2 b x2 ) P P(E1 › E2 ) .
Da
P(E1 › E2 ) = P(E1 ) · P(E2 \ E1 ) = P(E2 ) · P(E1 \ E2 )
folgt
FX1 ,X2 (x1 , x2 ) = FX1 (x1 ) · FX2 ,X1 (x2 \ x1 ) = FX2 (x2 ) · FX1 ,X2 (x1 \ x2 )
und mit
x1
FX1 ,X2 (x1 \ x2 ) = P ( X1 b x1 \ X2 = x2 ) = Ÿ-¶
fX1 ,X2 Hu1 \ x2 L „ u1
x2
FX2 ,X1 (x2 \ x1 ) = P ( X2 b x2 \ X1 = x1 ) = Ÿ-¶
fX2 ,X1 Hu2 \ x1 L „ u2
schließlich
x1 x2
FX1 ,X2 (x1 \ x2 ) = Ÿ-¶
Ÿ-¶ fX2 ,X1 Hu2 \ x1 L fX1 Hu1 L „ u1 „ u2 oder
bzw.
stoch_08.nb
14
x1 x2
FX1 ,X2 (x1 \ x2 ) = Ÿ-¶
Ÿ-¶ fX1 ,X2 Hu1 \ x2 L fX2 Hu2 L „ u1 „ u2 .
Anmerkung: Man vertausche auf keinen Fall P( X1 b x1 \ X2 = x2 ) bzw. P( X2 b x2 \ X1 = x1 )
mit P( X1 b x1 › X2 = x2 ) ª 0 bzw. P( X2 b x2 › X1 = x1 ) ª 0 !
8.34 In Anlehnung zum Absatz 6.11 gelten für stochastisch unabhängige Zufallsgrößen die unten
angeführten Beziehungen, womit der Produktsatz des Absatzes 8.28 seine Bestätigung findet:
fX2 ,X1 Hx2 \ x1 L ª fX2 Hx2 L
bzw.
fX1 ,X2 Hx1 \ x2 L ª fX1 Hx1 L
fX1 ,X2 Hx1 , x2 L ª fX2 Hx2 L · fX1 Hx1 L .
ï
8.35 Für das Beispiel der zweidimensionalen Verteilung vom Absatz 8.22 berechnen wir die beiden
bedingten Wahrscheinlichkeitsdichten und testen anhand einer Parameterstudie, ob die Integration über
den gesamten Wertebereich der jeweiligen Variablen Eins ergibt. Wir erkennen, dass auch die bedingten Verteilungsdichten normalverteilt sind.
ISO =
Hx1 − ewx1L2
1
2 I1 − korr112 M
2 π sx1 sx2
fx1 =
sx12
1
fx1x2 =
−
1
−
sx1 sx2
:fx2bx1
Hx1 − ewx1L Hx2 − ewx2L +
−ISO ;
1 − korr112
Hewx1−x1L2
2 sx12
1
; fx2 =
2 π sx1
:fx2bx1
2 korr11
−
Hewx2−x2L2
2 sx22
;
2 π sx2
fx1x2
SimplifyB
fx1
F, fx1bx2
fx1x2
SimplifyB
fx2
Hewx2 sx1−ewx1 korr11 sx2+korr11 sx2 x1−sx1 x2L2
2 J−1+korr112 N sx12 sx22
,
1−
korr112
2 π sx2
Hewx2 korr11 sx1−ewx1 sx2+sx2 x1−korr11 sx1 x2L2
2 J−1+korr112 N sx12 sx22
fx1bx2
1−
korr112
2 π sx1
>
F>
Hx2 − ewx2L2
sx22
;
stoch_08.nb
15
ewx1 = 2.09; ewx2 = −5.81; sx1 = 2.65; sx2 = 5.26; korr11 = −0.34; ob = ∞; un = −ob;
PrintB"Test auf positiv Eins:
",
Hewx2 korr11 sx1−ewx1 sx2+sx2 x1−korr11 sx1 x2L2
2 J−1+korr112 N sx12 sx22
IntegrateB
1−
PrintB"Test auf positiv Eins:
",
Hewx2 sx1−ewx1 korr11 sx2+korr11 sx2 x1−sx1 x2L2
2 J−1+korr112 N sx12 sx22
IntegrateB
1−
Test auf positiv Eins:
1.
Test auf positiv Eins:
1.
ê. 8x2 → −5<, 8x1, un, ob<FF
2 π sx1
korr112
korr112
ê. 8x1 → 5<, 8x2, un, ob<FF
2 π sx2
8.36 Die Verallgemeinerung von Absatz 8.32 für mehrere Zufallsvariable lautet in Analogie zu den
Aussagen der Absätze 6.10 bzw. 6.11
für abhängige Variable
fX1 , X2 ... Xn Hx1 , x2 ... xn L = fX1 ,X2 ... Xn Hx1 \ x2 , ... , xn L · fX2 ... Xn Hx2 \ x3 , ... , xn L ... fXn-1 ,Xn Hxn- 1 \ xn L · fxn Hxn L
und für paarweise unabhängige Größen
fX1 , X2 ... Xn Hx1 , x2 ... xn L = fX1 Hx1 L · fX2 Hx2 L ... fXn Hxn L .
Herunterladen