Zweidimensionale Verteilungen

Werbung
http://blogs.ethz.ch/ricklis
WAHRSCHEINLICHKEITSTHEORIE
UND STATISTIK
Zusammenfassung zur Vorlesung von
Prof. Dr. A.-S. Sznitman
Zu dieser Zusammenfassung gehören noch zwei Seiten Scans
aus den Übungsstunden zum Thema Statistik. Download unter
http://blogs.ethz.ch/ricklis/studienunterlagen
Die Platzeinteilung ist für eine Abschrift von Hand gemäss den
Prüfungsbedingungen der Klausur im FS15 ± geeignet.
(5 Blätter A4 handbeschrieben)
KOMBINATORIK
Anzahl Möglichkeiten, k Elemente aus einer n-elementigen
Menge zu ziehen:
geordnet
ungeordnet
mit Zurücklegen
๐‘›+๐‘˜−1
(
)
๐‘›๐‘˜
๐‘˜
๐‘›!
๐‘›
ohne Zurücklegen
( )
๐‘˜
(๐‘› − ๐‘˜)!
Permutation
Ohne Wiederholungen: ๐‘›!
Mit Wiederholungen:
๐‘›!
๐‘ค1 !⋅๐‘ค2 !⋅…
Identitäten des Binomialkoeffizienten
๐‘›
๐‘›−1
๐‘›−1
( )=(
)+(
)
๐‘˜
๐‘˜−1
๐‘˜
๐‘›
๐‘›
(๐‘) = (๐‘› − ๐‘)
๐‘›
๐‘›
๐‘›
∑ ( ) ⋅ ๐‘ฅ ๐‘˜ ⋅ ๐‘ฆ ๐‘›−๐‘˜ = (๐‘ฅ + ๐‘ฆ)๐‘›
๐‘˜
๐‘›
∑ ( ) = 2๐‘›
๐‘˜
๐‘˜=0
๐‘Ÿ
๐‘˜=0
๐‘›, ๐‘š ≥ ๐‘Ÿ
๐‘˜=0
๐‘›
๐‘›
∑ ๐‘˜ ( ) = ๐‘› ⋅ 2๐‘›−1
๐‘˜
๐‘˜=0
๐‘˜
๐‘š
๐‘›
๐‘š+๐‘›
∑ (๐‘˜ − ๐‘— ) ⋅ ( ๐‘— ) = (
)
๐‘˜
๐‘—=0
Geometrische Reihe: Summenformeln
๐‘˜
∑ ๐‘Ž๐‘› =
๐‘›=0
∞
∑ ๐‘Ž๐‘› =
๐‘›=0
∞
∑ ๐‘Ž๐‘› =
๐‘›=๐‘˜
GAUSS’SCHE NORMALVER TEILU NG ๐‘‹~๐’ฉ(๐œ‡, ๐œŽ)
Abkürzungen:
k: Anzahl Versuche bis zum ersten Erfolg in einer unendl. Folge
von unabhängigen 0-1-Experimenten mit Erfolgsparam. ๐‘.
P:
๐‘ƒ[๐‘‹ = ๐‘˜] = ๐‘๐œ† (๐‘˜) = ๐‘(1 − ๐‘)๐‘˜−1, ๐‘˜ ≥ 1
Dist: ๐น(๐‘˜) = ๐‘ƒ[๐‘‹ ≤ ๐‘˜] = ๐‘ ∑๐‘˜๐‘–=1(1 − ๐‘)๐‘–−1 = 1 − (1 − ๐‘)๐‘˜
๐‘‘
๐‘‘ 1
1
๐‘˜
E:
๐ธ[๐‘‹] = โ‹ฏ = −๐‘ (∑∞
( )=
๐‘˜=0(1 − ๐‘) ) = −๐‘
๐œ‡: Zentrierungsparameter, ๐œŽ: Breiteparameter
1 − ๐‘Ž๐‘˜+1
,
1−๐‘Ž
๐‘Ž≠1
1
,
1−๐‘Ž
|๐‘Ž| < 1
๐‘Ž๐‘˜
,
1−๐‘Ž
|๐‘Ž| < 1
P: W’keiten, Dist: Verteilungsfkt, Dens: Dichte
E: Erwartungswert, V: Varianz
DISKRETE VERTEILUNGE N
Normalisierungsbedingung: ∑๐‘ฅ∈๐ธ ๐‘(๐‘ฅ) = 1
BERNOU LLI -VERTEILUNG ๐‘‹~๐‘๐‘’(๐‘)
Die Bernoulliverteilung ist die Verteilung eines zufälligen 0-1Experiments mit Erfolgsparameter ๐‘ ∈ [0,1] und ๐‘‹: Ω → {0,1}.
P:
๐‘ƒ[๐‘‹ = 1] = ๐‘, ๐‘ƒ[๐‘‹ = 0] = 1 − ๐‘
0, ๐‘˜ < 0
Dist: ๐น(๐‘˜) = ๐‘ƒ[๐‘‹ ≤ ๐‘˜] = {1 − ๐‘, 0 ≤ ๐‘˜ < 1
1, 1 ≤ ๐‘˜
E:
๐ธ[๐‘‹] = ๐‘
V:
var[๐‘‹] = ๐‘(1 − ๐‘)
BINOMIALVERTEILUNG ๐‘‹~๐‘๐‘–๐‘›(๐‘›, ๐‘)
Die Verteilung der totalen Anzahl von Erfolgen von ๐‘›
unabhängigen 0-1-Experimenten heisst Binomialverteilung der
Länge ๐‘› mit Erfolgparameter ๐‘.
๐‘›
P:
๐‘ƒ[๐‘‹ = ๐‘˜] = ( ) ๐‘๐‘˜ (1 − ๐‘)๐‘›−๐‘˜ , 0 ≤ ๐‘˜ ≤ ๐‘›
๐‘˜
๐‘›
Dist: ๐น(๐‘˜) = ๐‘ƒ[๐‘‹ ≤ ๐‘˜] = ∑๐‘˜๐‘–=0 ( ) ๐‘๐‘– (1 − ๐‘)๐‘›−๐‘–
๐‘–
V:
๐‘›!
๐‘›
( )โ‰”
๐‘˜
๐‘˜! (๐‘› − ๐‘˜)!
๐‘›
๐‘š
๐‘›+๐‘š
) = ∑( )⋅(
)
๐‘˜
๐‘Ÿ−๐‘˜
๐‘Ÿ
GEOMETRISCHE VERTEIL UNG ๐‘‹~๐‘”๐‘’๐‘œ๐‘š(๐‘)
E:
Binomialkoeffizient
(
VERTEILUNGEN
๐ธ[๐‘‹] = ๐ธ[๐‘‹1 + โ‹ฏ + ๐‘‹๐‘› ] = ๐ธ[๐‘‹1 ] + โ‹ฏ + ๐ธ[๐‘‹๐‘› ]
= ๐‘›๐ธ[๐‘‹1 ] = ๐‘›๐‘
var[๐‘‹] = var[๐‘‹1 + โ‹ฏ + ๐‘‹๐‘› ] = โ‹ฏ
= ๐‘› var[๐‘‹1 ] = ๐‘›๐‘(1 − ๐‘)
Stabilität der Binomialverteilung:
Seien ๐‘‹~ bn(๐‘›1 , ๐‘) und ๐‘Œ~ bn(๐‘›2 , ๐‘) unabhängig, dann:
๐‘‹ + ๐‘Œ~ bn(๐‘›1 + ๐‘›2 , ๐‘)
V:
1
๐‘2
−
Verteilung der Anzahl Erfolge in einer grossen Anzahl (n)
unabhängigen 0-1-Experimenten, welche alle eine kleine
Erfolgswahrscheinlichkeit haben.
Approximation für Binomialverteilung für
๐‘› → ∞,
๐‘ → 0,
๐‘›๐‘ = ๐œ† ∈ (0, ∞)
๐‘˜
๐œ†
๐‘’ −๐œ†
๐‘˜!
1
๐‘‘๐‘
๐‘‘๐‘ ๐‘
HYPERGEOMETRISCHE VE RTEILUNG
W’keit dafür, dass bei ๐‘ gegebenen Elementen, von denen ๐‘€
die gewünschte Eigenschaft besitzen, beim Herausgreifen von ๐‘›
Probestücken genau ๐‘˜ Treffer erzielt werden, d.h. die W’keit
für ๐‘‹ = ๐‘˜ Erfolge in ๐‘› Versuchen.
(๐‘€)(๐‘−๐‘€)
๐‘˜ ๐‘›−๐‘˜
(๐‘
๐‘›)
P:
๐‘ƒ[๐‘‹ = ๐‘˜] =
Dist:
๐น(๐‘˜) = ๐‘ƒ[๐‘‹ ≤ ๐‘˜] = ∑๐‘˜๐‘–=0
E:
๐ธ[๐‘‹] = ๐‘›
V:
๐‘€
๐‘
var(๐‘‹) = ๐‘›
๐‘€
๐‘
(๐‘€)(๐‘−๐‘€)
๐‘–
๐‘›−๐‘–
(๐‘
๐‘›)
๐‘€ ๐‘−๐‘›
(1 − )
๐‘
๐‘−1
๐‘ƒ[๐‘‹ = ๐‘˜] =
Dist:
E:
V:
๐น(๐‘˜) = ๐‘ƒ[๐‘‹ ≤ ๐‘˜] = ๐‘’ −๐œ† ∑๐‘˜๐‘–=0
๐‘–!
๐ธ[๐‘‹] = ๐œ†
var(๐‘‹) = ๐œ†
, ๐‘˜≥0
Dist:
๐น(๐‘ฅ) =
1
√2๐œ‹๐œŽ
1
√2๐œ‹๐œŽ
exp (−
(๐‘ฅ−๐œ‡)2
2๐œŽ2
๐‘ฅ
∫−∞ exp (−
)
(๐‘ฅ−๐œ‡)2
2๐œŽ2
) ⋅ ๐‘‘๐‘ฅ
E:
๐ธ[๐‘‹] = ๐œ‡
V:
var[๐‘‹] = ๐œŽ 2
Wendepunkte der Dichte: ๐‘ฅ = ๐œ‡ ± ๐œŽ
Maximum:
๐‘“(๐‘ฅ๐‘š๐‘Ž๐‘ฅ = ๐œ‡) =
๐‘Œ~๐’ฉ,
var[๐‘Œ] = ∑ ๐›ผ๐‘–2 var[๐‘‹๐‘– ]
๐ธ[๐‘Œ] = ∑ ๐›ผ๐‘– ๐ธ[๐‘‹๐‘– ] ,
๐‘–
๐‘–
Theorem von de Moivre-Laplace:
๐‘›→∞ ๐‘
1
๐‘ฅ2
๐‘ƒ[๐‘Ž ≤ ๐‘ˆ ≤ ๐‘] ⇒ ∫
exp (− ) ⋅ ๐‘‘๐‘ฅ = Φ(๐‘) − Φ(๐‘Ž)
2
๐‘Ž √2๐œ‹๐œŽ
Wobei Φ(๐‘ฅ) die Verteilungsfunktion einer
Standardnormalverteilung ist. Siehe unten.
STANDARDNORMALVERTEI LU NG ๐‘‹~๐’ฉ(0,1)
Gauss’sche Normalverteilung mit ๐œ‡ = 0, ๐œŽ = 1.
๐œ‘(๐‘ฅ) = ๐‘“(๐‘ฅ) =
STETIGE VERTEILUNGEN
Dist:
Φ(๐‘ฅ) = ๐น(๐‘ฅ) =
GLEICHVERTEILUNG ๐‘‹~๐’ฐ(๐‘Ž, ๐‘)
Eigenschaften von ๐œ‘ und Φ:
๐œ‘(๐‘ฅ) = ๐œ‘(−๐‘ฅ),
auf dem Intervall [๐‘Ž, ๐‘], ๐‘Ž < ๐‘
1
, ๐‘ฅ ∈ [๐‘Ž, ๐‘]
Dens: ๐‘“(๐‘ฅ) = {๐‘−๐‘Ž
0, ๐‘ฅ ∉ [๐‘Ž, ๐‘]
Dist:
๐‘ฅ−๐‘Ž
๐น(๐‘ฅ) = {๐‘−๐‘Ž
0, ๐‘ฅ < ๐‘Ž
, ๐‘Ž≤๐‘ฅ≤๐‘
1
√2๐œ‹๐œŽ
Summe unabhängiger Normalverteilungen:
Seien alle ๐‘‹๐‘– ~๐’ฉ(๐œ‡๐‘– , ๐œŽ๐‘– ) unabhängig und ๐‘Œ = ∑๐‘– ๐›ผ๐‘– ๐‘‹๐‘– , dann:
Dens:
1
exp (−
๐‘ฅ2
)
2
๐‘ฅ
๐‘ฅ2
∫−∞ exp (− 2 ) ⋅
√2๐œ‹
√2๐œ‹
1
๐‘‘๐‘ฅ
Φ(−๐‘ฅ) = 1 − Φ(๐‘ฅ)
Gauss’sche Normalverteilung → Standardnormalverteilung:
Eine normalverteilte Zufallsvariable ๐‘‹ mit Parametern ๐œ‡ und ๐œŽ
lässt sich mit Variablentrafo in die Standnormalvert. überführen
๐‘ˆ=
๐‘‹−๐œ‡
,
๐œŽ
⇒
๐‘‹~๐’ฉ(๐œ‡, ๐œŽ),
๐ธ[๐‘ˆ] = 0,
๐‘ˆ~๐’ฉ(0,1)
var[๐‘ˆ] = 1
1, ๐‘ฅ > ๐‘
Lineare Funktion einer Standardnormalverteilung
๐‘‹~๐’ฉ(0,1), ๐‘Œ = ๐›ผ๐‘‹ + ๐›ฝ ⇒ ๐‘Œ~๐’ฉ(๐›ผ, ๐›ฝ)
๐‘Ž+๐‘
E:
๐ธ[๐‘‹] =
V:
var[๐‘‹] =
2
1
12
(๐‘ − ๐‘Ž)2
ZENTRALER GRENZWERTS ATZ
EXPONENTIALVERTEILUN G ๐‘‹~๐‘’๐‘ฅ๐‘(๐œ†)
P:
๐‘
๐‘
Gedächtnislosigkeit: ๐‘ƒ[๐‘‡ = ๐‘›0 + ๐‘›|๐‘‡ > ๐‘›0 ] = ๐‘ƒ[๐‘‡ = ๐‘›]∀๐‘›, ๐‘›0
Normalisierungsbedingung: ∑∞
(๐‘˜=0) ๐‘๐œ† (๐‘˜) = 1
POISSON- VERTEILUNG ๐‘‹~๐‘๐‘œ๐‘–๐‘ (๐œ†)
๐œ†๐‘–
Stabilität: ๐‘‹~ pois(๐œ†) , ๐‘Œ~ pois(๐œ‡), dann: ๐‘‹ + ๐‘Œ~ pois(๐œ† + ๐œ‡)
Stetiges Analogon zur geometrischen Verteilung.
−๐œ†๐‘ฅ
Dens: ๐‘“(๐‘ฅ) = {๐œ†๐‘’ , ๐‘ฅ ≥ 0
0,
๐‘ฅ<0
−๐œ†๐‘ฅ
Dist: ๐น(๐‘ฅ) = {1 − ๐‘’ , ๐‘ฅ ≥ 0
0,
๐‘ฅ<0
1
E:
๐ธ[๐‘‹] =
๐œ†
V:
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
var(๐‘‹) =
Dens: ๐‘“(๐‘ฅ) =
var[๐‘‹] =
1
๐œ†2
Seien ๐‘‹๐‘– ‚independent and identically distributed‘ (iid)
Zufallsvariablen und ๐‘† = ๐‘‹1 + โ‹ฏ + ๐‘‹๐‘› mit ๐ธ[๐‘†] = ๐‘› โˆ™ ๐ธ[๐‘‹๐‘– ]
und var[๐‘†] = ๐‘› โˆ™ var[๐‘‹๐‘– ], so gilt:
๐‘›→∞
๐‘† − ๐ธ[๐‘†]
๐‘ƒ[
≤ ๐‘ง] → ๐’ฉ(0,1)
√var[๐‘†]
Die Verteilung der Summe von unendlich vielen gleichen
Verteilungen nähert sich (nach Zentrierung und Skalierung) der
einer Standardardnormalverteilung.
Gedächtnislosigkeit: ๐‘ƒ[๐‘‹ ≥ ๐‘ก + ๐‘ |๐‘‹ ≥ ๐‘ ] = ๐‘ƒ[๐‘‹ ≥ ๐‘ก]
1/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
GRUNDLAGEN
GRUND RAUM & E REIGNIS SE
Grundraum: Die nichtleere Menge Ω, welche alle elementaren
Ereignisse enthält, heisst Grundraum. Der Grundraum enthält
alle möglichen Realisationen eines Experiments.
Elementarereignis: ๐œ” ∈ Ω heisst Elementarereignis und ist eine
Realisation eines Experiments.
Ereignis: ๐ด ⊆ Ω heisst Ereignis und ist eine Menge von
Elementarereignissen.
WAHRSCHEINLICHKEITSR ÄUME
Wahrscheinlichkeit eines Ereignisses:
Jedem Ereignis ๐ด wird die Wahrscheinlichkeit ๐‘ƒ[๐ด] ∈ [0,1]
zugeordnet. Dabei gilt ๐‘ƒ[Ω] = 1.
Ist ๐ด = โ‹ƒ๐‘˜๐‘–=1 ๐ด๐‘– und ๐ด๐‘– paarweise disjunkt, so gilt:
๐‘˜
๐‘ƒ[๐ด] = ∑ ๐‘ƒ[๐ด๐‘– ]
๐‘–=1
Wahrscheinlichkeitsraum:
Ein Wahrscheinlichkeitsraum ist ein Tripel (Ω, โ„ฑ, ๐‘ƒ), wobei Ω
der Grundraum, โ„ฑ ⊆ ๐’ซ(Ω) eine Kollektion von Ereignissen und
๐‘ƒ eine Abbildung ๐ด ∈ โ„ฑ โ†ฆ ๐‘ƒ[๐ด] ∈ [0,1] ist. Dazu setzen wir
voraus, dass โ„ฑ und ๐‘ƒ folgendes erfüllen:
โ„ฑ ist eine ๐ˆ-Algebra, d.h. es gilt:
๏‚ง Ω∈โ„ฑ
๏‚ง ๐ด ∈ โ„ฑ ⇒ ๐ด๐ถ ∈ โ„ฑ
๏‚ง Für jede Folge ๐ด๐‘› , ๐‘› ≥ 1 mit ๐ด๐‘› ∈ โ„ฑ gilt โ‹ƒ∞
๐‘›=1 ๐ด๐‘› ∈ โ„ฑ
๐‘ƒ ist eine Wahrscheinlichkeit, d.h. es gilt:
๏‚ง ๐‘ƒ[Ω] = 1
๏‚ง Für ๐ด๐‘› , ๐‘› ≥ 1 eine Folge von Ereignissen, welche paarweise
disjunkt sind (๐ด๐‘– ∩ ๐ด๐‘— = ∅ ∀๐‘– ≠ ๐‘—) gilt (๐œŽ-Additivität):
∞
๐‘ƒ[โ‹ƒ∞
๐‘›=1 ๐ด๐‘› ] = ∑๐‘›=1 ๐‘ƒ[๐ด๐‘› ]
Folgerungen aus der Definition:
๏‚ง ๐‘ƒ[∅] = 0
๏‚ง ๐‘ƒ[๐ด๐ถ ] = 1 − ๐‘ƒ[๐ด]
๏‚ง Wenn eine Folge von Ereignissen paarweise disjunkt ist,
können ihre Wahrscheinlichkeiten addiert werden.
๐ด1, … , ๐ด๐‘› ∈ โ„ฑ endl. Folge mit ๐ด๐‘– ∩ ๐ด๐‘— = ∅ (1 ≤ ๐‘– ≠ ๐‘— ≤ ๐‘›),
dann gilt: ๐‘ƒ[โ‹ƒ๐‘›๐‘–=1 ๐ด๐‘– ] = ∑๐‘›๐‘–=1 ๐‘ƒ[๐ด๐‘– ]
๏‚ง ๐ด ⊆ ๐ต โŸน ๐‘ƒ[๐ด] ≤ ๐‘ƒ[๐ต]
๏‚ง ๐ด ⊆ ๐ต โŸน ๐‘ƒ[๐ต โˆ– ๐ด] = ๐‘ƒ[๐ต] − ๐‘ƒ[๐ด]
๏‚ง Kettenregeln
๐‘ƒ[๐ด ∩ ๐ต] = ๐‘ƒ[๐ด|๐ต] โˆ™ ๐‘ƒ[๐ต] = ๐‘ƒ[๐ต|๐ด] โˆ™ ๐‘ƒ[๐ด]
๐‘ƒ[๐ด ∩ ๐ต ∩ ๐ถ] = ๐‘ƒ[๐ถ|๐ด ∩ ๐ต] โˆ™ ๐‘ƒ[๐ด ∩ ๐ต]
= ๐‘ƒ[๐ถ|๐ด ∩ ๐ต] โˆ™ ๐‘ƒ[๐ต|๐ด] โˆ™ ๐‘ƒ[๐ด]
๐‘ƒ[๐ด] = ๐‘ƒ[๐ด ∩ ๐ต] + ๐‘ƒ[๐ด ∩ ๐ต ๐ถ ]
http://blogs.ethz.ch/ricklis
Für ๐ด ∈ โ„ฑ und ๐‘“๐‘Œ stetig gilt analog:
ZUFALLSVARIABLEN, VE RTEILUNGEN, DICHTE
๐‘ƒ[๐ด] = ∫ ๐‘ƒ[๐ด|๐‘Œ = ๐‘ฆ] ⋅ ๐‘“๐‘Œ (๐‘ฆ) ⋅ ๐‘‘๐‘ฆ
๐ธ๐‘Œ
ZUFALLSVARIABLE
Formel von Bayes:
๐‘ƒ[๐ต ∩ ๐ด]
๐‘ƒ[๐ต|๐ด] =
๐‘ƒ[๐ด]
LAPLACE - MODELL
Laplace-Modell:
Ist der Grundraum Ω endlich, โ„ฑ = ๐’ซ[Ω] und haben alle
Elementarereignisse ๐œ” ∈ Ω dieselbe Wahrscheinlichkeit
๐‘(๐œ”) = ๐‘ƒ[{๐œ”}] = 1⁄|Ω|
so heisst der W‘keitsraum (Ω, โ„ฑ, ๐‘ƒ) Laplace-Modell.
Ist ๐ด ⊆ Ω (d.h. ๐ด ∈ โ„ฑ), so gilt:
๐‘ƒ[๐ด] =
|๐ด| # günstige
=
|Ω| # mögliche
Bayes
=
๐‘ƒ[๐ด|๐ต] ⋅ ๐‘ƒ[๐ต]
๐‘ƒ[๐ด]
allgemeiner:
Sei ๐ต1 , … , ๐ต๐‘› ∈ โ„ฑ eine Zerlegung von Ω mit ๐‘ƒ[๐ต๐‘– ] > 0 ∀๐‘– ∈
{1, … , ๐‘›} und ๐ด ∈ โ„ฑ ein Ereignis mit ๐‘ƒ[๐ด] > 0.
๐‘ƒ[๐ต๐‘– |๐ด] =
๐‘ƒ[๐ด|๐ต๐‘– ] โˆ™ ๐‘ƒ[๐ต๐‘– ]
๐‘ƒ[๐ด|๐ต๐‘– ] โˆ™ ๐‘ƒ[๐ต๐‘– ]
= ๐‘›
๐‘ƒ[๐ด]
∑๐‘—=1 ๐‘ƒ[๐ด|๐ต๐‘— ] โˆ™ ๐‘ƒ[๐ต๐‘— ]
๐‘ƒ[๐ต๐‘– ] heisst die a priori W’keit der Ursache ๐ต๐‘– .
๐‘ƒ[๐ต๐‘– |๐ด] heisst die a posteriori W’keit der Ursache ๐ต๐‘– (gegeb. ๐ด)
Bsp: Die dreiköpfigen Familien A&B rennen um die Wette
UNABHÄNGIGKEIT
Geg: ๐‘ƒ[๐ธ1 ] = ๐‘ƒ[eine Mutter gewinnt],
๐‘ƒ[๐ธ2 ] = ๐‘ƒ[Familie A gewinnt],
Unabhängigkeit zweier Ereignisse:
๐‘ƒ[๐ธ3 ] = ๐‘ƒ[ein Elternteil von B gewinnt]
Sei (Ω, โ„ฑ, ๐‘ƒ) ein W’keitsraum. Zwei Ereignisse ๐ด, ๐ต ∈ โ„ฑ (mit
]
Ges: ๐‘ƒ[๐ธ4 = ๐‘ƒ[ein Vater oder das Kind von A gewinnt] =?
möglicherweise Null W’keit) heissen genau dann unabhängig,
Ω = {(๐‘€, ๐ด), (๐‘‰, ๐ด), (๐พ, ๐ด), (๐‘€, ๐ต), (๐‘‰, ๐ต), (๐พ, ๐ต)}
wenn:
๐ธ4 = {(๐‘‰, ๐ด), (๐‘‰, ๐ต), (๐พ, ๐ด)} = โ‹ฏ
๐‘ƒ[๐ด ∩ ๐ต] = ๐‘ƒ[๐ด] โˆ™ ๐‘ƒ[๐ต] und [๐ด|๐ต] = ๐‘ƒ[๐ด]
= {(๐‘‰, ๐ต), (๐‘€, ๐ต)} โˆ– {(๐‘€, ๐ต)} ∪ {(๐‘€, ๐ด), (๐‘‰, ๐ด), (๐พ, ๐ด)} โˆ– {(๐‘€, ๐ด)}
๐‘ƒ[๐ธ4 ] = ๐‘ƒ[๐ธ3 โˆ– {(๐‘€, ๐ต)}] + ๐‘ƒ[๐ธ2 โˆ– {(๐‘€, ๐ด)}] = โ‹ฏ
Die zusätzliche Information von B ändert bei Unabhängigkeit
= ๐‘ƒ[๐ธ3 ] − ๐‘ƒ[{(๐‘€, ๐ต)}] + ๐‘ƒ[๐ธ2 ] − ๐‘ƒ[{(๐‘€, ๐ด)}]
also nichts an der Eintretenswahrscheinlichkeit von A.
= ๐‘ƒ[๐ธ3 ] + ๐‘ƒ[๐ธ2 ] − (๐‘ƒ[{(๐‘€, ๐ด)}] + ๐‘ƒ[{(๐‘€, ๐ต)}])
]
]
(๐‘€,
= ๐‘ƒ[๐ธ3 + ๐‘ƒ[๐ธ2 − ๐‘ƒ[{(๐‘€, ๐ด),
๐ต)}]
|๐ด|⋅|๐ต|
Im Laplace-Modell: ๐ด, ๐ต ⊆ Ω unabhängig ⇔ |A ∩ B| = |Ω|
= ๐‘ƒ[๐ธ3 ] + ๐‘ƒ[๐ธ2 ] − ๐‘ƒ[๐ธ1]
๐ถ
BEDINGTE WAHRSCHEINL ICHKEIT
Ist 0 < ๐‘ƒ[๐ด] < 1, so sind ๐ด und ๐ด nie unabhängig.
Bedingte Wahrscheinlichkeit:
Sei (Ω, โ„ฑ, ๐‘ƒ) ein W’keitsraum und ๐ด, ๐ต ∈ โ„ฑ Ereignisse mit
๐‘ƒ[๐ต] > 0, dann heisst:
Unabhängigkeit einer Kollektion von Ereignissen:
Sei ๐ด1 , … , ๐ด๐‘› eine Kollektion von Ereignissen (d.h. ๐ด๐‘– ∈ โ„ฑ ∀๐‘–)
Die Kollektion heisst unabh., falls
∀1 ≤ ๐‘–1 < ๐‘–2 < โ‹ฏ < ๐‘–๐‘˜ ≤ ๐‘› mit 2 ≤ ๐‘˜ ≤ ๐‘› gilt:
๐‘ƒ[๐ด๐‘–1 ∩ … ∩ ๐ด๐‘–๐‘˜ ] = ๐‘ƒ[๐ด๐‘–1 ] โˆ™ … โˆ™ ๐‘ƒ[๐ด๐‘–๐‘˜ ]
๐‘ƒ[๐ต|๐ด] =
๐‘ƒ[๐ต ∩ ๐ด]
๐‘ƒ[๐ด]
die bedingte Wahrscheinlichkeit von ๐ต gegeben ๐ด.
Im Laplace-Modell: ๐‘ƒ[๐ต|๐ด] =
günstige
mögliche
=
|๐ต∩๐ด|
|๐ด|
„Wenn wir wissen, dass A eintritt, so sind die möglichen Fälle
natürlich nur noch jene, bei denen A eintritt.“
Unabhängigkeit zweier Zufallsvariablen:
Sei (Ω, โ„ฑ, ๐‘ƒ) ein W’keitsraum. Seien ๐‘‹, ๐‘Œ zwei Zufallsvar. auf Ω.
๐‘‹ und ๐‘Œ heissen unabhängig, wenn ∀๐‘Ž, ๐‘ ∈ โ„ gilt:
๐‘ƒ[{๐‘‹ ≤ ๐‘Ž} ∩ {๐‘Œ ≤ ๐ต}] = ๐‘ƒ[๐‘‹ ≤ ๐‘Ž] โˆ™ ๐‘ƒ[๐‘Œ ≤ ๐‘]
Zufallsvariable:
Sei (Ω, โ„ฑ, ๐‘ƒ) ein W’keitsraum. Eine reelle Zufallsvariable X ist
eine Abb. ๐‘‹: Ω → โ„, so dass für ein ๐‘ฅ ∈ โ„ gilt:
{๐œ” ∈ Ω|๐‘‹(๐œ”) ≤ ๐‘ฅ} ∈ โ„ฑ
∈ โ„ฑ heisst: „muss ein beobachtbares Ereignis sein“
Notation: Man schreibt {๐‘‹ ≤ ๐‘ฅ} für {๐œ” ∈ Ω|๐‘‹(๐œ”) ≤ ๐‘ฅ}.
„{๐‘‹ ≤ ๐‘ฅ} ist die Menge aller Elementarereignisse ω, deren
Abbildung / Bewertung durch ๐‘‹(๐œ”) auf eine reelle Zahl
unterhalb einer gewissen Schwelle a liegen.“
Wenn X z.B. die Augenanzahl beim Würfeln wiedergibt, dann
ist ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ] = ๐‘ƒ[{๐œ” ∈ Ω|๐‘‹(๐œ”) ≤ ๐‘ฅ}] die W’keit, dass der
Würfel kleiner gleich a zeigt.
Diskrete Zufallsvariable:
Eine Zufallsvariable X heisst diskret, wenn die Menge
๐ธ = {๐‘ฅ ∈ โ„: {๐‘‹ = ๐‘ฅ} ≠ ∅} höchstens abzählbar unendlich ist.
„VERTEILUNG“ -BEGRIFFE
Verteilungsfunktion
Diskret
๐‘ƒ[๐‘‹ = ๐‘ฅ] = ๐‘ƒ๐‘‹ (๐‘ฅ)
= ๐‘๐‘ฅ
„Gewichtsfkt. /
W’keitsfkt.“
๐น๐‘‹ (๐‘ฅ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ]
2D-Verteilung
Siehe Tabellenbeispiel
Verteilung
๐‘›
๐‘›
๐‘ƒ [โ‹ƒ ๐ด๐‘– ] = ∑(−1)๐‘˜−1
๐‘–=1
๐‘˜=1
∑
๐‘ƒ[๐ด๐‘–1 ∩ … ∩ ๐ด๐‘–๐‘˜ ]
1≤๐‘–1 <โ‹ฏ<๐‘–๐‘˜ ≤๐‘›
Bsp mit 3 Ereignissen A,B und C:
๐‘ƒ[๐ด ∪ ๐ต ∪ ๐ถ] = ๐‘ƒ[๐ด] + ๐‘ƒ[๐ต] + ๐‘ƒ[๐ถ]
−๐‘ƒ[๐ด ∩ ๐ต] − ๐‘ƒ[๐ต ∩ ๐ถ] − ๐‘ƒ[๐ถ ∩ ๐ด]
+๐‘ƒ[๐ด ∩ ๐ต ∩ ๐ถ]
๏‚ง De-Morgan
๐ถ
๐ด ∩ ๐ต = (๐ด ∪ ๐ต ๐ถ )๐ถ ,
๐ด ∪ ๐ต = (๐ด๐ถ ∩ ๐ต ๐ถ )๐ถ
Folgerungen aus der Definition:
๏‚ง ๐‘ƒ[๐ด๐ถ |๐ต] = 1 − ๐‘ƒ[๐ด|๐ต]
๏‚ง ๐ด๐‘– ‘s paarweise disjunkt:
๐‘ƒ[(โ‹ƒ๐‘– ๐ด๐‘– )|๐ต] =
∑๐‘– ๐‘ƒ[๐ด๐‘– |๐ต]
๏‚ง ๐ด๐‘– ‘s unabhängig:
๐‘ƒ[(โ‹‚๐‘– ๐ด๐‘– )|๐ต] = ∏๐‘– ๐‘ƒ[๐ด๐‘– |๐ต]
Formel der totalen Wahrscheinlichkeit:
Sei ๐ต1 , … , ๐ต๐‘› ∈ โ„ฑ eine Zerlegung von Ω, d.h. Ω = ๐ต1 ∪ … ∪ ๐ต๐‘›
mit ๐‘ƒ[๐ต๐‘– ] > 0 ∀๐‘– ∈ {1, … , ๐‘›}. Dann gilt für ein Ereignis ๐ด ∈ โ„ฑ:
๐‘›
๐‘ƒ[๐ด] = ∑ ๐‘ƒ[๐ด|๐ต๐‘– ] ⋅ ๐‘ƒ[๐ต๐‘– ]
„Dichte am Ort
k“
๐‘ƒ[๐‘‹ ≤ ๐‘ฅ]
๐‘ƒ[๐‘‹ ≤ ๐‘ฅ ∩ ๐‘Œ
≤ ๐‘ฆ]
VERTEILUNG EINE R ZUF AL LSVARIABLEN
Verteilungsfunktion:
Sei ๐‘‹ eine Zufallsvariable auf (Ω, โ„ฑ, ๐‘ƒ). Die Verteilungsfunktion
von ๐‘‹ ist die Funktion ๐น๐‘‹ (๐‘ฅ): โ„ → [0,1] definiert durch:
๐น๐‘‹ (๐‘ฅ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ],
๐‘Ž∈โ„
Eigenschaften von Verteilungsfunktionen:
Für die Verteilungsfunktion ๐น๐‘‹ der Zufallsvariablen ๐‘‹ gilt:
๏‚ง ๐น๐‘‹ ist monoton wachsend auf โ„ mit Werten in [0,1]
๏‚ง lim ๐น๐‘‹ (๐‘Ž) = 0 und lim ๐น๐‘‹ (๐‘Ž) = 1
๐‘Ž→−∞
Inklusion/Exklusion
Stetig
๐‘Ž→+∞
Regeln:
๐‘ƒ[๐‘‹ ≤ ๐‘ฅ] = ๐น๐‘‹ (๐‘ฅ) = lim+ ๐น๐‘‹ (๐‘ฅ + โ„Ž)
โ„Ž→0
๐‘ƒ[๐‘‹ < ๐‘ฅ] = ๐น๐‘‹ (๐‘ฅ − ) = lim+ ๐น๐‘‹ (๐‘ฅ − โ„Ž)
โ„Ž→0
๐‘ƒ[๐‘‹ = ๐‘ฅ] = ๐น๐‘‹ (๐‘ฅ) − ๐น๐‘‹ (๐‘ฅ − )
๐‘ƒ[๐‘‹ > ๐‘ฅ] = 1 − ๐น๐‘‹ (๐‘ฅ)
๐‘ƒ[๐‘‹ ≥ ๐‘ฅ] = 1 − ๐น๐‘‹ (๐‘ฅ − )
๐‘ƒ[๐‘Ž ≤ ๐‘‹ ≤ ๐‘] = ๐‘ƒ[๐‘‹ ∈ [๐‘Ž, ๐‘]] = ๐น๐‘‹ (๐‘) − ๐น๐‘‹ (๐‘Ž− )
๐‘ƒ[๐‘Ž < ๐‘‹ ≤ ๐‘] = ๐น๐‘‹ (๐‘) − ๐น๐‘‹ (๐‘Ž)
๐‘ƒ[๐‘Ž ≤ ๐‘‹ < ๐‘] = ๐น๐‘‹ (๐‘− ) − ๐น๐‘‹ (๐‘Ž− )
๐‘ƒ[๐‘Ž < ๐‘‹ < ๐‘] = ๐น๐‘‹ (๐‘− ) − ๐น๐‘‹ (๐‘Ž)
๐‘–=1
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
2/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
Stetige Verteilung:
Eine stetige Verteilung ist dadurch charakterisiert, dass die
Verteilungsfunktion ๐น๐‘‹ (๐‘ฅ): โ„ → [0,1] überall stetig ist.
Es gilt dabei ๐‘ƒ[๐‘‹ = ๐‘ฅ] = 0 (Die Eintretensw’keit eines exakten
Werts ist gleich Null).
Existiert eine nicht-negative Funktion ๐‘“๐‘‹ (๐‘ฅ) auf โ„, so dass:
๐‘ฅ
๐น๐‘‹ (๐‘ฅ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ] = ∫ ๐‘“๐‘‹ (๐‘ฅ ′ ) ⋅ ๐‘‘๐‘ฅ ′ ,
ERWARTUNGSWERT
Sei ๐‘”: โ„ → โ„ eine Zufallsvariable (ZV) auf (Ω, โ„ฑ, ๐‘ƒ). Es sei ๐‘Œ =
๐‘”(๐‘‹). Ist ๐‘” genügend schön, so ist auch ๐‘Œ eine ZV.
Ist ๐‘” streng monoton steigend und stetig, so existiert ๐‘”−1 und
wir erhalten die Verteilungsfunktion von ๐‘Œ:
stetige Zufallsvariablen:
๐‘Ž∈โ„
๐น๐‘Œ (๐‘ฆ) = ๐‘ƒ[๐‘Œ ≤ ๐‘ฆ] = ๐‘ƒ[๐‘”(๐‘‹) ≤ ๐‘ฆ]
= ๐‘ƒ[๐‘‹ ≤ ๐‘”−1(๐‘ฆ)] = ๐น๐‘‹ (๐‘”−1(๐‘ฆ))
Also z.B. für ๐‘Œ = ๐‘‹๐‘› gilt:
๐‘‘
๐‘“๐‘‹ (๐‘ฅ) =
๐น (๐‘ฅ)
๐‘‘๐‘ฅ ๐‘‹
(∗)
Die Dichtefunktion ist durch die Ableitung der
Verteilungsfunktion gegeben. (Nützlich für Berechnungen)
∞
∫−∞ ๐‘“๐‘‹ (๐‘ฅ ′ )
⋅ ๐‘‘๐‘ฅ ′ = 1
๐น๐‘Œ (๐‘ฆ) = ๐‘ƒ[๐‘Œ ≤ ๐‘ฆ] = ๐‘ƒ[๐‘‹๐‘› ≤ ๐‘ฆ] = ๐‘ƒ[๐‘‹ ≤ ๐‘ฆ 1⁄๐‘› ]
(*) Grenzen anpassen!
Die Dichte(-funktion) lässt sich auf zwei Arten bestimmen:
๐œ•
1)
๐‘“๐‘Œ (๐‘ฆ) = ๐น๐‘Œ (๐‘ฆ)
๐‘“๐‘Œ (๐‘ฆ) = ๐‘“๐‘‹ (๐‘”
2)
Besitzt ๐‘‹ eine Dichtefunktion ๐‘“๐‘‹ (⇔ ๐น๐‘‹ stetig und stückw.
diff’bar), so gilt:
−1 (๐‘ฆ))
โˆ™
๐‘
Habe X die Dichte ๐‘“๐‘‹ (๐‘ฅ) = {(1+๐‘ฅ)4
0,
๐‘Ž
1
๐‘ฅ≤0
Diskrete Verteilung:
Die Verteilungsfunktion einer diskreten Zufallsvariablen ๐‘‹ lässt
sich mittels der W’keitsfunktion ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ] = ๐‘๐‘‹ (๐‘ฅ๐‘– ) ∀๐‘–
bestimmen:
๐น๐‘‹ (๐‘ฅ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ] = ∑ ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ] = ∑ ๐‘ƒ๐‘‹ (๐‘ฅ๐‘– ) = ∑ ๐‘๐‘ฅ๐‘–
Was ist die Dichte von ๐‘‹ −2 ?
1)
Wert von c bestimmen: Normalisierungsbedingung
⇒ ๐‘=3
2)
Berechne Verteilungsfunktion von X
๐‘ฅ
1
๐น๐‘‹ (๐‘ฅ) = ∫ ๐‘“(๐‘ฅ ′ ) ⋅ ๐‘‘๐‘ฅ ′ = (1 −
) ⋅ ๐Ÿ™{๐‘ฅ>0}
(1 + ๐‘ฅ)3
∞
3)
Berechne Verteilungsfunktion der Funktion von X,
1
hier also ๐‘‹ −2
๐‘ฅ๐‘– ≤๐‘ฅ
wobei die ๐‘ฅ๐‘– die möglichen diskreten Elementarereignisse sind.
๐น
๐‘‹
1
−
1
2
(∗)
(๐‘ฅ) = ๐‘ƒ [๐‘‹ −2 ≤ ๐‘ฅ] = 1 − ๐‘ƒ [๐‘‹ ≤
Dabei gelten folgende Eigenschaften:
๏‚ง ∑∞
๐‘–=1 ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ] = 1 (Normierung)
๏‚ง Für ๐‘Ž, ๐‘ ∈ โ„, ๐‘Ž ≤ ๐‘ gilt: ๐‘ƒ[{๐‘Ž < ๐‘‹ ≤ ๐‘}] = ๐น๐‘‹ (๐‘) − ๐น๐‘‹ (๐‘Ž)
= 1 − ๐น๐‘‹ (
4)
Mischformen:
Stetige und Diskrete Verteilungen sind nicht komplementär. Es
gibt auch Verteilungen, die Elemente beider Typen enthalten
und damit stückweise stetig sind.
(∗) ๐‘ƒ [
1
)=
๐‘ฅ2
1
(1 +
1
−2
Dichte von ๐‘‹ ist
๐‘‘
๐‘‘
๐น 1 (๐‘ฅ) =
๐‘‘๐‘ฅ ๐‘‹ −2
๐‘‘๐‘ฅ
1
3
(1 +
1
)
๐‘ฅ2
=
1 3
)
๐‘ฅ2
1
]
๐‘ฅ2
⋅ ๐Ÿ™{๐‘ฅ>0}
6
4
๐‘ฅ 3 (1 +
1
)
๐‘ฅ2
⋅ ๐Ÿ™{๐‘ฅ>0}
1
1
1
≤ ๐‘Ž] = ๐‘ƒ [ ≤ ๐‘Ž2 ] = ๐‘ƒ [๐‘‹ ≥ 2 ] = 1 − ๐‘ƒ [๐‘‹ ≤ 2 ]
๐‘‹
๐‘Ž
๐‘Ž
√๐‘ฅ
falls
1
1
1
1 1
๐ธ[๐‘Œ] = ๐ธ [ ] = ∑ ๐‘ƒ[๐‘‹ = ๐‘˜] = (1 + + โ‹ฏ + ) ⋅
๐‘‹
๐‘˜
2
6 6
๐‘˜=1
Für zwei unabhängige Zufallsvariablen ๐‘‹ und ๐‘Œ und zwei
Funktionen ๐‘“(๐‘‹) ung ๐‘”(๐‘Œ) gilt:
โˆ™ ๐‘“๐‘‹ (๐‘ฅ)๐‘‘๐‘ฅ < ∞
๐ธ[๐‘“(๐‘‹) โˆ™ ๐‘”(๐‘Œ)] = ๐ธ[๐‘“(๐‘‹)] โˆ™ ๐ธ[๐‘”(๐‘Œ)]
diskrete Zufallsvariablen:
๐œ‡ = ๐ธ[๐‘‹] = ∑ ๐‘ฅ๐‘– ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ] = ∑ ๐‘ฅ๐‘๐‘‹ (๐‘ฅ)
๐‘–
๐‘ฅ∈๐ธ๐‘‹
Achtung! Im Allgemeinen gilt
๐ธ[๐‘”(๐‘‹)] ≠ ๐‘”(๐ธ[๐‘‹])
„summiere über alle möglichen Werte, die X annehmen kann
und gewichte mit deren Auftretenswahrscheinlichkeiten“
VARIANZ, STANDARDABWEICHUNG
Satz des totalen Erwartungswerts:
Sei Ω = ๐ด1 ∪ ๐ด2 ∪ … ∪ ๐ด๐‘› mit ๐ด๐‘– ∩ ๐ด๐‘— = ∅∀๐‘– ≠ ๐‘— eine
Zerlegung des Grundraumes, sowie ๐‘‹ eine Zufallsvar. Dann:
๐‘›
๐ธ[๐‘‹] = ∑ ๐‘ƒ[๐ด๐‘˜ ] โˆ™ ๐ธ[๐‘‹|๐ด๐‘˜ ]
๐‘˜=1
Linearität des Erwartungswerts:
Sei ๐‘ = ๐‘Ž โˆ™ ๐‘‹ + ๐‘ ⋅ ๐‘Œ, so gilt:
๐ธ[๐‘] = ๐ธ[๐‘Ž โˆ™ ๐‘‹ + ๐‘ ⋅ ๐‘Œ] = ๐‘Ž โˆ™ ๐ธ[๐‘‹] + ๐‘ ⋅ ๐ธ[๐‘Œ]
ERWARTUNGSWERT EINER FUNKTION EINER
Z.V.
Sofern ๐‘“๐‘‹ quadratisch integrierbar ist, definiert man die
Varianz ๐œŽ 2 = var[๐‘‹] und Standardabweichung ๐œŽ = √var[๐‘‹]:
stetige Zufallsvariablen:
∞
๐œŽ 2 = var[๐‘‹] = ∫−∞(๐‘ฅ − ๐œ‡)2๐‘“๐‘‹ (๐‘ฅ) ⋅ ๐‘‘๐‘ฅ
= ๐ธ[(๐‘‹ − ๐ธ[๐‘‹])2] = ๐ธ[๐‘‹2 ] − ๐ธ[๐‘‹]2
diskrete Zufallsvariablen:
๐œŽ 2 = var[๐‘‹] = ∑๐‘– (๐‘ฅ๐‘– − ๐œ‡)2 ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ]
= ๐ธ[(๐‘‹ − ๐ธ[๐‘‹])2] = ๐ธ[๐‘‹2 ] − ๐ธ[๐‘‹]2
EIGENSCHAFTEN VARIANZ
Symmetrie der Varianz:
var[๐‘‹] = var[−๐‘‹]
Linearkombination von Z.V.
var(๐‘‹ + ๐‘Œ) = var(๐‘‹) + var(๐‘Œ) + 2 cov(๐‘‹, ๐‘Œ)
Sei ๐‘‹ eine ZV und ๐‘ = ๐‘”(๐‘‹). Der Erwartungswert ๐ธ[๐‘] ist
๏‚ง wenn ๐‘‹ eine stetige ZV:
∞
๐ธ[๐‘] = ๐ธ[๐‘”(๐‘‹)] = ∫ ๐‘”(๐‘ฅ) โˆ™ ๐‘“๐‘‹ (๐‘ฅ) ⋅ ๐‘‘๐‘ฅ
−∞
1
BSP MIN/MAX
1
๐‘‹
−∞
๐‘ฅ>0
1
= ๐‘ƒ[๐‘Ž < ๐‘‹ ≤ ๐‘] = ๐‘ƒ[๐‘Ž ≤ ๐‘‹ < ๐‘]
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
๐œ‡ = ๐ธ[๐‘‹] = ∫ ๐‘ฅ โˆ™ ๐‘“๐‘‹ (๐‘ฅ) ⋅ ๐‘‘๐‘ฅ
∞
∫−∞|๐‘ฅ|
Seien die Zufallsvariablen ๐‘‹ und ๐‘Œ unabhängig, so gilt:
๐ธ[๐‘‹ โˆ™ ๐‘Œ] = ๐ธ[๐‘‹] โˆ™ ๐ธ[๐‘Œ]
,
๐‘Œโ‰”
6
⇒
∞
EIGENSCHAFTEN ERWARTUNGSWERT
|๐‘” ′ (๐‘”−1 (๐‘ฆ))|
BSP DICHTE BESTIMMEN
๐‘
∫ ๐‘“๐‘‹ (๐‘ฅ)๐‘‘๐‘ฅ = ๐‘ƒ[๐‘Ž < ๐‘‹ < ๐‘] = ๐‘ƒ[๐‘Ž ≤ ๐‘‹ ≤ ๐‘]
๐‘ฅ๐‘– ≤๐‘ฅ
๐‘‹ ∈ {1,2,3,4,5,6},
๐œ•๐‘ฆ
Normierung.
๐‘ฅ๐‘– ≤๐‘ฅ
Bsp: X=Augenzahl beim Wurf eines Würfels
TRANSFORMATION EINER STETIGEN ZV
−∞
so heisst ๐‘“๐‘‹ die Dichtefunkt. von ๐‘‹. Es muss gelten:
http://blogs.ethz.ch/ricklis
๏‚ง wenn ๐‘‹ eine diskrete ZV:
๐ธ[๐‘] = ๐ธ[๐‘”(๐‘‹)] = ∑ ๐‘”(๐‘ฅ๐‘– ) โˆ™ ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ]
๐‘–
Geg.: ๐‘‹1 , ๐‘‹2 ZV, unabh. ๐‘Œ = min(๐‘‹1 , ๐‘‹2 ) , ๐‘ = max(๐‘‹1 , ๐‘‹2 )
Ges.: Verteilungsfunktion
Für den stetigen wie auch diskreten Erwartungswert muss
absolute Konvergenz des Integrals / der Summe gelten.
Vorgehen:
1)
Definiere ๐‘ฆ ∈ โ„ > 0 und ๐‘ง ∈ โ„ > 0
๐‘ƒ[๐‘Œ > ๐‘ฆ] = ๐‘ƒ[min(๐‘‹1 , ๐‘‹2 ) > ๐‘ฆ]
2)
= ๐‘ƒ[๐‘‹1 > ๐‘ฆ ∩ ๐‘‹2 > ๐‘ฆ] = โ‹ฏ
๐‘ƒ[๐‘ > ๐‘ง] = ๐‘ƒ[max(๐‘‹1 , ๐‘‹2 ) ≤ ๐‘ง]
3)
= ๐‘ƒ[๐‘‹1 ≤ ๐‘ง ∩ ๐‘‹2 ≤ ๐‘ง] = โ‹ฏ
„summiere alle mögl. Werte von X auf und gewichte den Wert
von g mit der Auftretenswahrscheinlichkeit von X an jenen
Stellen“
3/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
http://blogs.ethz.ch/ricklis
ZWEIDIMENSIONALE VER TEILUNGEN
Def: Verteilung von zwei Zufallsvariablen ๐‘‹ und ๐‘Œ
๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ, ๐‘Œ ≤ ๐‘ฆ]
Dabei gelten folgende Eigenschaften:
๏‚ง lim ๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = lim ๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = 0
๐‘ฅ→−∞
๏‚ง
BSP GEMEINSAME VERTE ILU NG (SERIE 6 )
UNABHÄNGIGKEIT
BESTE LINEARE PROGNO SE
Geg: ๐‘‹~ bin(๐‘›1 , ๐‘) , ๐‘Œ~ bin(๐‘›2 , ๐‘) , ๐‘‹, ๐‘Œ unabh.
Also z.B. „gestern ๐‘›1 -mal durchgeführt, heute ๐‘›2 -mal“
Seien ๐‘‹, ๐‘Œ zwei unabh. ZV und ๐‘”, โ„Ž zwei Funktionen, dann gilt:
๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ๐‘“๐‘‹ (๐‘ฅ) โˆ™ ๐‘“๐‘Œ (๐‘ฆ)
๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ๐น๐‘‹ (๐‘ฅ) โˆ™ ๐น๐‘Œ (๐‘ฆ)
๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ๐‘ƒ๐‘‹ (๐‘ฅ) โˆ™ ๐‘ƒ๐‘Œ (๐‘ฆ)
๐ธ[๐‘”(๐‘‹) โˆ™ โ„Ž(๐‘Œ)] = ๐ธ[๐‘”(๐‘‹)] โˆ™ ๐ธ[โ„Ž(๐‘Œ)]
Die beste lineare Prognose von ๐‘Œ durch ๐‘‹ im Sinn der
Minimierung des erwarteten Fehlers ๐ธ[(๐‘Œ − ๐‘)2 ] unter allen
linearen Transformationen ๐›ผ๐‘‹ + ๐›ฝ ist:
cov[๐‘‹, ๐‘Œ]
(๐‘‹ − ๐ธ[๐‘‹]) + ๐ธ[๐‘Œ]
๐‘Œ≈๐‘=
var[๐‘‹]
Abhängigkeit zeigen: konkreten Wert für x und y finden, bei
dem Ungleichheit bei einer der obigen Formeln gezeigt werden
kann.
Anmerkung: dies kommt aus der gewünschten Trafo und der
Definition des minimalen Prognosefehlers. Es ginge z.B. auch
als gewünschte Transformation ๐‘Œฬƒ โ‰” ๐‘Ž๐‘‹. Dann ist der minimale
2
Prognosefehler ๐ธ [(๐‘Œ − ๐‘Œฬƒ ) ] = ๐ธ[(๐‘Œ − ๐‘Ž๐‘‹)2 ].
๐‘ฆ→−∞
lim
๐‘ฅ→∞, ๐‘ฆ→∞
๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = 1
Ges: Verteilung von ๐‘ = ๐‘‹ + ๐‘Œ, also ๐‘ƒ[๐‘ = ๐‘›] =?
๐‘›1
๐‘ƒ[๐‘‹ + ๐‘Œ = ๐‘›] = ∑ ๐‘ƒ[๐‘‹ + ๐‘Œ = ๐‘›|๐‘‹ = ๐‘˜]๐‘ƒ[๐‘‹ = ๐‘˜]
STETIGE ZWEIDIMENSIO NALE V ERTEILUNG
Gemeinsame Dichte:
๐‘‹, ๐‘Œ Z.V.: Ω → โ„ auf (Ω, โ„ฑ, ๐‘ƒ) besitzen eine gemeinsame
stetige Verteilung, falls ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ≥ 0 auf โ„2 existiert, wobei
∞ ∞
∫−∞ ∫−∞ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ⋅ ๐‘‘๐‘ฅ ๐‘‘๐‘ฆ = 1 (Normierungsbedingung).
Falls dann gilt
๐‘ƒ[๐‘‹ ∈ [๐‘Ž1, ๐‘1 ] ∩ ๐‘Œ ∈ [๐‘Ž2 , ๐‘2 ]] = ๐‘ƒ[๐‘Ž1 ≤ ๐‘‹ ≤ ๐‘1 ∩ ๐‘Ž2 ≤ ๐‘Œ ≤ ๐‘2 ]
∞
∞
(∗)
= ∑ ๐‘ƒ[๐‘˜ + ๐‘Œ = ๐‘›]๐‘ƒ[๐‘‹ = ๐‘˜]
๐‘˜=0
๐‘›1
= ∑ ๐‘ƒ[๐‘Œ = ๐‘› − ๐‘˜]๐‘ƒ[๐‘‹ = ๐‘˜]
= ∫ ∫ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ⋅ ๐‘‘๐‘ฅ ๐‘‘๐‘ฆ
๐‘Ž2
๐‘Ž1
wobei −∞ ≤ ๐‘Ž1 ≤ ๐‘1 ≤ ∞ und −∞ ≤ ๐‘Ž2 ≤ ๐‘2 ≤ ∞,
๐‘˜=0
๐‘›1
๐‘ฆ
๐‘›2
๐‘›
) ๐‘๐‘›−๐‘˜ (1 − ๐‘)๐‘›2 −๐‘›+๐‘˜ ⋅ ( 1 ) ๐‘๐‘˜ (1 − ๐‘)๐‘›1 −๐‘˜
๐‘›−๐‘˜
๐‘˜
๐‘˜=0
๐‘›2
๐‘›
) ( 1 )) ⋅ ๐‘๐‘› (1 − ๐‘)(๐‘›1 +๐‘›2)−๐‘›
๐‘›−๐‘˜ ๐‘˜
⇒
Minimaler Vorhersagefehler:
Für ๐‘ = ๐›ผ๐‘‹ + ๐›ฝ gilt (?):
๐ธ[(๐‘Œ − ๐‘)2 ] = var[๐‘Œ] (1 − cor 2 [๐‘‹, ๐‘Œ])
∞
−∞ −∞
diskrete 2D-Verteilung:
๐‘ƒ[๐‘‹ + ๐‘Œ = ๐‘› ∩ ๐‘‹ = ๐‘˜]
๐‘ƒ[๐‘‹ = ๐‘˜]
๐‘ƒ[๐‘˜ + ๐‘Œ = ๐‘› ∩ ๐‘‹ = ๐‘˜]
=
๐‘ƒ[๐‘‹ = ๐‘˜]
๐‘ƒ[๐‘˜ + ๐‘Œ = ๐‘›] ⋅ ๐‘ƒ[๐‘‹ = ๐‘˜]
=
๐‘ƒ[๐‘‹ = ๐‘˜]
= ๐‘ƒ[๐‘˜ + ๐‘Œ = ๐‘›]
๐‘ƒ[๐‘‹ + ๐‘Œ = ๐‘›|๐‘‹ = ๐‘˜] =
(∗)
Randdichten der gemeinsamen Dichte:
∞
๐‘“๐‘‹ (๐‘ฅ) = ∫−∞ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ)๐‘‘๐‘ฆ
∞
๐‘“๐‘Œ (๐‘ฆ) = ∫−∞ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ)๐‘‘๐‘ฅ
{
DISKRETE ZWEIDIMENSI ONALE VERTEILUNG
W’keitsfunktion: (normiert!)
๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = {
Bsp Umgang mit einer Funktion einer 2D-Verteilung:
∞
−∞
∞
๐‘ = ๐‘‹ + ๐‘Œ~ bin(๐‘›1 + ๐‘›2 , ๐‘)
−∞ −∞
∞
∞
๐ธ[๐‘] = ๐ธ[๐‘”(๐‘‹, ๐‘Œ)] = ∫ ∫ ๐‘”(๐‘ฅ, ๐‘ฆ) ⋅ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ⋅ ๐‘‘๐‘ฅ ๐‘‘๐‘ฆ
๐‘ฅ
๐‘ƒ[๐‘‹ 2 + ๐‘’ ๐‘Œ ≤ ๐‘Ž] = ∫ ∫ ๐Ÿ™{๐‘ฅ 2 +๐‘’๐‘ฆ ≤๐‘Ž} ⋅ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ⋅ ๐‘‘๐‘ฅ ๐‘‘๐‘ฆ = โ‹ฏ
∞
๐ธ[๐œ†๐‘‹ + ๐œ‡๐‘Œ] = ๐œ† ∫ ๐‘“๐‘‹ (๐‘ฅ) ⋅ ๐‘‘๐‘ฅ + ๐œ‡ ∫ ๐‘“๐‘Œ (๐‘ฆ) ⋅ ๐‘‘๐‘ฆ
Funktionen von Z.V. mit gemeinsamer D ichte:
Sei ๐‘ = ๐‘”(๐‘‹, ๐‘Œ) eine ZV, so gilt für deren Erwartungswert:
stetige 2D-Verteilung:
๐‘› + ๐‘›2 ๐‘›
=( 1
) ๐‘ (1 − ๐‘)(๐‘›1 +๐‘›2)−๐‘›
๐‘›
๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ∫ ∫ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ ′ , ๐‘ฆ ′ ) ⋅ ๐‘‘๐‘ฅ ′ ๐‘‘๐‘ฆ ′
Randverteilungen:
๐น๐‘‹ (๐‘ฅ) = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ] = ๐‘ƒ[๐‘‹ ≤ ๐‘ฅ ∩ −∞ ≤ ๐‘Œ ≤ ∞]
๐‘ฅ
∞
= ∫−∞ ∫−∞ ๐‘“(๐‘ฅ′, ๐‘ฆ) ⋅ ๐‘‘๐‘ฆ ๐‘‘๐‘ฅ ′
Linearität des Erwartungswerts:
−∞
= (∑ (
dann heisst ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) gemeinsame Dichte von ๐‘‹ und ๐‘Œ.
Verteilungsfunktion:
๐‘“(๐‘Ž) โ‰” (๐‘Œ − ๐‘Ž๐‘‹)2 ist eine Parabel ⇒ ableiten und gleich Null
setzen, um das Minimum zu finden.
2D-ERWARTUNGSWERT
๐‘˜=0
๐‘›1
= ∑(
= ∫ ∫ ๐Ÿ™{๐‘Ž1 ≤๐‘ฅ≤๐‘1 } ⋅ ๐Ÿ™{๐‘Ž2 ≤๐‘Œ≤๐‘2 } ⋅ ๐‘“๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ⋅ ๐‘‘๐‘ฅ ๐‘‘๐‘ฆ
−∞ −∞
๐‘2 ๐‘1
๐‘˜=0
๐‘›1
๐‘–,๐‘—
(Summiere über alle möglichen Werte für X und Y)
KOVARIANZ
Die Kovarianz beschreibt den Grad der Abhängigkeit zw. 2 ZV.
cov(๐‘‹, ๐‘Œ) โ‰” ๐ธ[(๐‘‹ − ๐ธ[๐‘‹])(๐‘Œ − ๐ธ[๐‘Œ])]
= ๐œŽ๐‘‹,๐‘Œ = ๐ธ[๐‘‹ โˆ™ ๐‘Œ] − ๐ธ[๐‘‹] โˆ™ ๐ธ[๐‘Œ]
Eigenschaften der Kovarianz:
๏‚ง ๐‘‹, ๐‘Œ unabhängig โŸน cov(๐‘‹, ๐‘Œ) = 0
๏‚ง cov(๐‘‹, ๐‘Œ) = 0 โŸน ๐‘‹, ๐‘Œ unkorreliert (nicht zwingend unabh.)
๏‚ง cov(๐‘‹, ๐‘‹) = var(๐‘‹)
๏‚ง cov(๐‘Ž๐‘‹ + ๐‘, c๐‘Œ + ๐‘‘) = ๐‘Ž๐‘ cov(๐‘‹, ๐‘Œ)
๏‚ง cov(๐‘‹ + ๐‘Œ, ๐‘) = cov(๐‘‹, ๐‘) + cov(๐‘Œ, ๐‘)
๐‘๐‘ฅ,๐‘ฆ , ๐‘‹ = ๐‘ฅ, ๐‘Œ = ๐‘ฆ
0,
๐‘ ๐‘œ๐‘›๐‘ ๐‘ก
Verteilungsfunktion:
๐น๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = ∑ ∑ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ)
−∞ −∞
๐ธ[๐‘] = ๐ธ[๐‘”(๐‘‹, ๐‘Œ)] = ∑ ๐‘”(๐‘ฅ๐‘– , ๐‘ฆ๐‘— ) ⋅ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ๐‘– , ๐‘ฆ๐‘— )
๐‘ฅ≤๐‘‹ ๐‘ฆ≤๐‘Œ
W’keitsfunktionen der einzelnen ZV:
๐‘ƒ๐‘‹ (๐‘ฅ) = ∑ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) ,
๐‘ƒ๐‘Œ (๐‘ฆ) = ∑ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ)
๐‘ฆ
๐‘ฅ
KORRELATIONSFAKTOR
Randverteilungen:
๐น๐‘‹ (๐‘ฅ) = ∑ ๐‘ƒ๐‘‹ (๐‘ฅ) = ∑ ∑ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ)
๐‘ฅ≤๐‘‹
๐‘ฅ≤๐‘‹ ๐‘ฆ
cor(๐‘‹, ๐‘Œ) = ๐œŒ(๐‘‹, ๐‘Œ) =
๐œŽ๐‘‹,๐‘Œ
cov(๐‘‹, ๐‘Œ)
=
∈ [−1,1]
๐œŽ๐‘‹ โˆ™ ๐œŽ๐‘Œ √var(๐‘‹) โˆ™ var(๐‘Œ)
Bsp. 2D-Verteilung mit den W’keitsfkt. und Randverteilungen:
Y\X
0
1
2
1⁄
1⁄
1⁄
๐‘ƒ๐‘Œ (0) = 25⁄36
0
4
3
9
1
2
1⁄
9
1⁄
12
๐‘ƒ๐‘‹ (0) = 4⁄9
1⁄
9
0
0
0
๐‘ƒ๐‘Œ (1) = 8⁄36
๐‘ƒ๐‘Œ (2) = 3⁄36
๐‘ƒ๐‘‹ (1) = 4⁄9 ๐‘ƒ๐‘‹ (2) = 1⁄9 ∑ ๐‘ƒ๐‘‹,๐‘Œ (๐‘ฅ, ๐‘ฆ) = 1
๐‘ฅ,๐‘ฆ
๐‘ƒ๐‘‹,๐‘Œ (0,2) = 1⁄12
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
4/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
http://blogs.ethz.ch/ricklis
STATISTIK
BEISPIEL FÜR CHI -QUADRAT -TEST
๐œ’ 2 ANPASSUNGSTEST
Geg: n unabhängige Beobachtungen ๐‘ฅ1 , … , ๐‘ฅ๐‘›
Z.B. während n Tagen Anzahl Autos über Brücke gezählt
Frage: stammen die ๐‘ฅ1, … , ๐‘ฅ๐‘› von einer bestimmten
Zufallsvariable X?
Z.B. ๐‘‹~pois(4)
Beobachtungen fallen in m Klassen.
Z.B. 0 ≤ ๐‘‹ ≤ 10, 11 ≤ ๐‘‹ ≤ 20, ๐‘‹ > 20
Wir betrachten Geburtstage ๐‘ฅ1 , … , ๐‘ฅ2736 von NHL-Spielern.
Quartal
1
2
3
4
Anzahl
๐‘›1
๐‘›2
๐‘›3
๐‘›4
= 985
= 820
= 535
= 396
1
๐‘‡ ≈ ๐‘Œ3 ~๐œ’32.
4
Definiere Grössen:
๐‘๐‘– : Wahrscheinlichkeit dafür, dass Klasse ๐‘– eintritt:
๐‘1 = ๐‘ƒ[0 ≤ ๐‘‹ ≤ 10]
๐‘2 = ๐‘ƒ[11 ≤ ๐‘‹ ≤ 20]
๐‘3 = ๐‘ƒ[๐‘‹ > 20]
4
๐‘ก=∑
(๐‘›๐‘– − ๐‘›๐‘๐‘– )2
๐‘–=1
(๐‘๐‘– −๐‘›๐‘๐‘– )2
๐‘›๐‘๐‘–
, ungefähr ๐œ’ 2-verteilt
mit (๐‘š − 1) Freiheitsgraden.
2
Das heisst ๐‘ƒ[๐‘‡ ≤ ๐‘Ž] ≈ ๐‘ƒ[๐‘Œ๐‘š−1 ≤ ๐‘Ž] für ๐‘Œ๐‘š−1~๐œ’๐‘š−1
๐‘›๐‘– : Anzahl der ๐‘ฅ1 , … , ๐‘ฅ๐‘› , welche in die Klasse ๐‘– fallen
(≈ ๐‘› ⋅ ๐‘๐‘– , aber real gemessen)
Wähle nun ein ๐‘Ž ∈ โ„ mit ๐‘ƒ[๐‘Œ๐‘š−1 ≤ ๐‘Ž] = 99% respektive
๐‘ƒ[๐‘Œ๐‘š−1 > ๐‘Ž] = 0.01.
Berechne ๐‘ก โ‰”
(๐‘›๐‘– −๐‘›๐‘๐‘– )
∑๐‘š
๐‘–=1
๐‘›๐‘
๐‘–
Falls nun ๐‘ก > ๐‘Ž ⇒ ๐‘ฅ1 , … , ๐‘ฅ๐‘› stammen mit hoher
Wahrscheinlichkeit nicht von X
๐‘ก ≤ ๐‘Ž ⇒ ๐‘ฅ1 , … , ๐‘ฅ๐‘› könnten von X stammen
๐‘›๐‘๐‘–
=
(985 − 684)2
684
(820 − 684)2
a
Gerettete
70
30
100
160
70
230
Allgemeines Raster:
684
Die Hypothese, dass die Geburtstage gleichmässig verteilt sind,
muss verworfen werden.
๐‘€1
๐พ1
๐พ2
…
๐พ๐‘Ÿ
๐‘›11
๐‘›12
…
๐‘›1๐‘Ÿ
๐‘›1๐‘– = ∑๐‘Ÿ๐‘˜=1 ๐‘›1๐‘˜
โ‹ฎ
โ‹ฎ
โ‹ฎ
โ‹ฑ
โ‹ฎ
โ‹ฎ
๐‘€๐‘š
๐‘›๐‘š1
๐‘›๐‘š2
…
๐‘›๐‘š๐‘Ÿ
๐‘›๐‘š๐‘– = ∑๐‘Ÿ๐‘˜=1 ๐‘›๐‘š๐‘˜
๐‘›๐‘–1 = ∑๐‘š
๐‘—=1 ๐‘›๐‘—1 …
๐‘›๐‘–๐‘Ÿ = ∑๐‘š
๐‘—=1 ๐‘›๐‘—๐‘Ÿ
๐‘› = ∑๐‘–,๐‘— ๐‘›๐‘–๐‘—
BEISPIEL FÜR CHI -QUADRAT -TEST
Geg:
Dorf mit ๐‘› = 1000 Einwohner
Wir verteilen Äpfel an einem Stand an einem Tag.
Im Schnitt kommen 100 Personen pro Tag am Stand
vorbei.
⇒ Wir modellieren die Anzahl Besucher ๐‘†๐‘› ~Bin (๐‘›, ๐‘ =
1
10
)
Gesucht: k minimal mit 0.95 ≤ ๐‘ƒ[๐‘†๐‘› ≤ ๐‘˜]
๐‘†๐‘› − ๐‘›๐‘
๐‘˜ − ๐‘›๐‘
๐‘†๐‘› − ๐‘›๐‘
= ๐‘ƒ[
≤
]
~๐‘(0,1)
√๐‘›๐‘(1 − ๐‘) √๐‘›๐‘(1 − ๐‘)
√๐‘›๐‘(1 − ๐‘)
๐‘˜ − ๐‘›๐‘
๐‘˜ − 100
3.1.11
≈ Φ(
) = Φ(
)
√90
√๐‘›๐‘(1 − ๐‘)
0.95 ⇒ 1.65 ≤
t
+
(535 − 684)2 (396 − 684)2
+
+
684
684
= 313.2 โ‰ซ 7.815 = ๐‘Ž
k ist dann minimal mit 0.95 ≤ Φ (
1%
Opfer
90
40
130
Männer
Frauen
Frage: Wie viele Äpfel sollen bestellt werden, damit mit 95%
Wahrscheinlichkeit alle Besucher einen Apfel kriegen?
2
๐ป0
Wähle a mit ๐‘ƒ[๐‘Œ3 > ๐‘Ž] = 5%. Tabelle: ๐‘Ž = 7.815
๐‘๐‘– : Anzahl Beobachtungen von n Versuchen,
welche in Klasse i fallen
(dies ist eine Z.V.!)
๐ธ[๐‘๐‘– ] = ๐‘› ⋅ ๐‘๐‘–
⇒ ๐‘‡ โ‰” ∑๐‘š
๐‘–=1
Frage: sind zwei Merkmale โŸ
K&M unabhängig ?
Bsp: Spielt das Geschlecht beim Überleben eines
Schiffsunglücks eine Rolle?
Frage: sind die Geburtstage gleichmässig auf die Quartale
verteilt? Betrachte das 5%-Niveau.
๐‘š = 4 Klassen, ๐‘๐‘– = , ๐‘– = 1,2,3,4
๐œ’ 2 -UNABHÄNGIGKEITSTEST ZUM NIVEAU ๐›ผ
(=5%)
๐‘˜−100
√90
๐‘˜−100
√90
๐‘›๐‘—,⋅ ๐‘›⋅,๐‘˜
∗
Sei ๐‘›๐‘—๐‘˜
โ‰”
der Erwartungswert des Merkmals jk, falls es
๐‘›
wirklich unabhängig wäre.
๐‘Ÿ
Sei ๐‘ก โ‰” ∑๐‘š
๐‘—=1 ∑๐‘˜=1
Was ist die Wahrscheinlichkeit, dass 91 Äpfel gerade zu viel
sind?
90 − 100
10
⇒ ๐‘ƒ[๐‘†๐‘› ≤ 90] ≈ Φ (
) = Φ (−
)
√90
√90
10
= 1 −Φ(
) ≈ 1 − Φ(1.05)
โŸ
√90
0.8531
≈ 0.15
ฬณฬณฬณฬณฬณฬณ
2
∗
๐‘›๐‘—๐‘˜
die Abweichung vom erwarteten
Wert.
Wir verwerfen die Nullhypothese ๐ป0 , falls ๐‘ก > ๐‘Ž, wobei a so
gewählt ist, dass ๐‘ƒ[๐‘Œ ≤ ๐‘Ž] = 1 − ๐›ผ (z.B. 95%). Y ist ๐œ’ 2-verteilt
mit (๐‘š − 1)(๐‘Ÿ − 1) Freiheitsgraden.
Im Beispiel:
๐‘› ๐‘›
160⋅130
∗
๐‘›11
= 1⋅ ⋅1 =
= 90.4 ist die erwartete Anzahl
๐‘›
230
männlicher Opfer
๐‘› ๐‘›
160⋅100
∗
๐‘›12
= 1⋅ ⋅2 =
= 69.6: erwartete Anzahl geretteter
๐‘›
230
Männer
∗
∗
๐‘›21
= 39.6, ๐‘›22
= 30.4
) ⇒ Tabelle: Φ(1.65) =
⇔ ฬณฬณฬณฬณฬณฬณฬณฬณฬณฬณฬณ
๐‘˜ = 116
∗
(๐‘›๐‘—๐‘˜ −๐‘›๐‘—๐‘˜
)
๐‘ก=
∗ )2
(๐‘›11 − ๐‘›11
∗
๐‘›11
+
∗ )2
(๐‘›12 − ๐‘›12
∗
๐‘›12
+ โ‹ฏ = 0.016
Die Quadratur hat die Funktion, dass auch negative
Abweichungen sich positiv auf den Index t auswirken. Danach
wird mit dem theoretischen Erwartungswert skaliert.
Sei Y ๐œ’ 2-verteilt mit 1 = (2 − 1)(2 − 1) Freiheitsgraden.
Dann gilt ๐‘ƒ[๐‘Œ ≤ ๐‘Ž] = 1 − 0.05 = 0.95 ⇔ ๐‘Ž = 3.841
Weil ๐‘ก > ๐‘Ž ist, können wir ๐ป0 auf dem Niveau ๐›ผ = 5% nicht
verwerfen.
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
5/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
http://blogs.ethz.ch/ricklis
TESTEN VON HYPOTHESE N ZUM NIVEAU Α
SCHÄTZEN VON PARAMET ERN
Geg: Beobachtungen ๐‘ฅ1, … , ๐‘ฅ๐‘›
Annahme: Die Beobachtungen stammen von ๐‘‹๐‘– ~๐‘(๐œ‡, ๐œŽ = 6)
und sind unabhängig.
Wir glauben, dass
๐œ‡ = ๐œ‡1
(Alternative ๐ป1)
Die Gegenpartei glaubt, dass ๐œ‡ = ๐œ‡0 (Nullhypothese ๐ป0 ,
welche wir verwerfen wollen)
Setze nun ๐œ‡ = ๐œ‡0 .
Betrachte die Zufallsvariable ๐‘‡0 =
∑๐‘›
๐‘–=1 ๐‘‹๐‘–
∑๐‘›
๐‘–=1 ๐‘ฅ๐‘–
๐‘›
~๐‘ (๐œ‡0,
๐œŽ
√๐‘›
Ziel: Schätzung von ๐œƒ anhand von ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ mit Hilfe des
Maximum-Likelihood-Schätzers
)
Sei nun ๐‘ก =
der Durchschnitt der Messungen (quasi der
๐‘›
beobachtete Erwartungswert).
Wir verwerfen ๐ป0 , falls ๐‘ก < ๐‘Ž,
wobei ๐‘ƒ[๐‘‡0 ≤ ๐‘Ž] = Φ (
๐‘Ž−๐œ‡0
๐œŽ
√๐‘›
0.5
√4
๐‘˜
๐ฟ(๐œƒ, ๐‘ฅ1, … , ๐‘ฅ๐‘˜ ) = ∏ ๐‘ƒ[๐‘‹ = ๐‘ฅ๐‘– ]
Die Gemeinsame Dichte von (๐‘‹1 , … , ๐‘‹๐‘˜ ) an der Stelle
(๐‘ฅ1 , … , ๐‘ฅ๐‘˜ ) ist ๐‘“(๐œƒ; ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ ) = ∏๐‘˜๐‘–=1 ๐‘“๐œƒ (๐‘ฅ๐‘– )
=: ๐ฟ(๐œƒ, ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ )
(Likelihood-Funktion)
Beispiel für MLE im diskreten Fall:
Geg: Sei ๐‘‹~pois(๐œƒ), ๐œƒ > 0.
Seien ๐‘ฅ1, … , ๐‘ฅ๐‘˜ unabhängige Beobachtungen von X.
Def: Der Maximum-Likelihood-Schätzer ๐œƒฬ‚ ist jenes ๐œƒ, welches
die Likelihood-Funktion maximiert.
Bemerkung: ๐ฟ(๐œƒ, ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ ) maximal ⇔ ln(๐ฟ(๐œƒ, ๐‘ฅ1, … , ๐‘ฅ๐‘˜ ))
maximal
⇒ ๐œ‡0 = 3 Behauptung des Verkäufers,
๐œ‡1 = 2 meine Vermutung / Beobachtung
Die Likelihood-Funktion ist nun
Danach analog zum kontinuierlichen Fall.
๐‘ฅ1 , … , ๐‘ฅ๐‘˜ sind unabhängige Beobachtungen. Wir wollen ๐œƒ so
wählen, dass die Wahrscheinlichkeit maximal ist, den
beobachteten Ausgang des Experiments auch mit Hilfe der
Zufallsvariablen X zu erhalten.
Ein Verkäufer bietet Säcke mit Kartoffeln à 3kg (mit ๐œŽ = 0.5)
an. Wir kaufen 4 Säcke (=n) und stellen aber einen Durchschnitt
von lediglich 2kg (=t) fest.
Sei X eine diskrete Z.V., seien ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ unabhängige
Beobachtungen von X.
Idee: ๐‘ฅ1, … , ๐‘ฅ๐‘˜ stammen von ๐‘‹1 , … , ๐‘‹๐‘˜ unabhängig, wobei die
๐‘‹๐‘– die gleiche Verteilung wie X haben.
)=๐›ผ ⇔ ๐‘Ž=โ‹ฏ
BEISPIEL: VERKAUF VO N SÄCKEN MIT
KARTOFFELN
๐‘‡0~๐‘ (3,
Zufallsvariable X mit Dichte ๐‘“๐œƒ (๐‘ฅ) (= ๐œƒ๐‘’ −๐œƒ๐‘ฅ , ๐‘ฅ > 0)
๐‘ฅ1, … , ๐‘ฅ๐‘˜ unabhängige Beobachtungen von X
Geg:
DISKRETER FALL:
1
) = ๐‘ (3, )
4
๐‘–=1
Was ist der MLE von ๐œƒ?
1)
2)
ln(๐ฟ) = −๐œƒ๐‘˜ + ∑๐‘˜๐‘–=1
= −๐œƒ๐‘˜ +
๐œ•
∑๐‘˜๐‘–=1 ๐‘ฅ๐‘–
๐‘ฅ๐‘– !
๐œƒ
= ๐‘’ −๐œƒ๐‘˜ ∏๐‘˜๐‘–=1
๐œƒ ๐‘ฅ๐‘–
๐‘ฅ๐‘– !
๐‘ฅ๐‘–
ln ( )
โŸ ๐‘ฅ๐‘– !
ln(๐œƒ
โŸ
3)
๐œƒ ๐‘ฅ๐‘–
๐ฟ(๐œƒ, ๐‘ฅ1, … , ๐‘ฅ๐‘˜ ) = ∏๐‘˜๐‘–=1 ๐‘’ −๐œƒ
๐‘ฅ๐‘– )
−ln(๐‘ฅ๐‘– !)
๐‘ฅ๐‘– ln ๐œƒ
ln ๐œƒ −
1
∑๐‘˜๐‘–=1 ln(๐‘ฅ๐‘– !)
!
๐œ•๐œƒ
(ln(๐ฟ)) = −๐‘˜ + ⋅ ∑๐‘˜๐‘–=1 ๐‘ฅ๐‘– = 0
⇔
∑
๐‘ฅ
๐œƒฬ‚ = ๐‘–=1 ๐‘– ist der MLE von ๐œƒ.
๐œƒ
๐‘˜
๐‘˜
KONTINUIERLICHER FAL L:
Für ๐›ผ = 5% brauchen wir bei einer Tabelle, welche die Fläche
links des gesuchten Werts angibt, die Formel 1 − 0.05 = 0.95
und suchen einen Wert, der möglichst nahe daran liegt, in der
Tabelle. Der entsprechende Eintrag ist 1.65. Da wir an einer
Abweichung links des Nullpunkts interessiert sind, benützen wir
−1.65.
Beispiel:
2
−๐œƒ๐‘ฅ
, ๐‘ฅ > 0 ,๐œƒ > 0
Die Z.V. X habe die Dichte ๐‘“๐œƒ (๐‘ฅ) = { ๐œƒ ๐‘ฅ๐‘’
0,
๐‘ฅ≤0
Seien ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ unabhängige Beobachtungen von X. Was ist der
MLE für ๐œƒ?
๐‘Ž−3
−1.65 =
⇔ ๐‘Ž = 2.5875 kg
0.5
√4
1)
Aussage: „Die Wahrscheinlichkeit, bei einer Normalverteilung
mit Zentrum 3kg und Standardabweichung 0.5kg, bei einer
Stichprobe von 4 Stück einen Durchschnitt von unter 2.5875kg
zu erwischen, ist tiefer als 5%.“
L aufstellen
๐ฟ(๐œƒ, ๐‘ฅ1 , … , ๐‘ฅ๐‘˜ ) = ∏๐‘˜๐‘–=1 ๐‘“๐œƒ (๐‘ฅ๐‘– ) bestimmen
๐‘˜
= ๐œƒ 2๐‘˜ (∏๐‘˜๐‘–=1 ๐‘ฅ๐‘– ) ⋅ ๐‘’ −๐œƒ ∑๐‘–=1 ๐‘ฅ๐‘–
2)
logarithmieren
ln(๐ฟ(๐œƒ, ๐‘ฅ1, … , ๐‘ฅ๐‘˜ )) = โŸ
ln(๐œƒ 2๐‘˜ ) + ln(∏๐‘˜๐‘–=1 ๐‘ฅ๐‘– ) + ๐œƒ ∑๐‘˜๐‘–=1 ๐‘ฅ๐‘–
2๐‘˜⋅ln ๐œƒ
3)
95%
ableiten und gleich Null setzen
๐œ•
๐œ•๐œƒ
5%
−1.65
0
1.65
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
⇔
5%
t
a
(ln(๐ฟ)) =
2๐‘˜
๐œƒ
!
− ∑๐‘˜๐‘–=1 ๐‘ฅ๐‘– = 0
2๐‘˜
๐œƒฬ‚ = ∑๐‘˜
ist der ML-Schätzer von ๐œƒ
๐‘–=1 ๐‘ฅ๐‘–
๐œ‡0 = 3kg
6/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
http://blogs.ethz.ch/ricklis
MATHEMATISCHER ANHANG
Indikatorfunktion:
1, ๐‘ฅ > 0
๐Ÿ™{๐‘ฅ>0} = {
0 sonst
KOMPLEXE ZAHLEN
1
(๐‘ง + ๐‘ง ∗)
2
1
Im{๐‘ง} = (๐‘ง − ๐‘ง ∗ )
2๐‘–
Re{๐‘ง} =
EULER’SCHE IDENTITÄT EN
1 ๐‘–๐‘ฅ
(๐‘’ − ๐‘’ −๐‘–๐‘ฅ )
2๐‘–
1 ๐‘ฅ
sinh ๐‘ฅ = (๐‘’ − ๐‘’ −๐‘ฅ )
2
sin ๐‘ฅ =
1 ๐‘–๐‘ฅ
(๐‘’ + ๐‘’ −๐‘–๐‘ฅ )
2
1 ๐‘ฅ
cosh ๐‘ฅ = (๐‘’ + ๐‘’ −๐‘ฅ )
2
cos ๐‘ฅ =
TRIGONOMETRISCHE IDE NTITÄTEN
sin2 ๐‘ฅ + cos 2 ๐‘ฅ = cosh2 ๐‘ฅ − sinh2 ๐‘ฅ = 1
cosh ๐‘ฅ + sinh ๐‘ฅ = ๐‘’ ๐‘ฅ
sin(๐‘–๐‘ฅ) = ๐‘– sinh ๐‘ฅ ⇔ sinh(๐‘–๐‘ฅ) = ๐‘– sin ๐‘ฅ
cos(๐‘–๐‘ฅ) = cosh ๐‘ฅ ⇔ cosh(๐‘–๐‘ฅ) = cos ๐‘ฅ
sin ๐‘ฅ
tan ๐‘ฅ =
cos ๐‘ฅ
1
cot ๐‘ฅ =
tan ๐‘ฅ
sin(๐‘ฅ ± ๐‘ฆ) = sin ๐‘ฅ cos ๐‘ฆ ± cos ๐‘ฅ sin ๐‘ฆ
cos(๐‘ฅ ± ๐‘ฆ) = cos ๐‘ฅ cos ๐‘ฆ โˆ“ sin ๐‘ฅ sin ๐‘ฆ
2 sin ๐‘ฅ sin ๐‘ฆ = cos(๐‘ฅ − ๐‘ฆ) − cos(๐‘ฅ + ๐‘ฆ)
2 cos ๐‘ฅ cos ๐‘ฆ = cos(๐‘ฅ − ๐‘ฆ) + cos(๐‘ฅ + ๐‘ฆ)
2 sin ๐‘ฅ cos ๐‘ฆ = sin(๐‘ฅ − ๐‘ฆ) + sin(๐‘ฅ + ๐‘ฆ)
2 tan ๐‘ฅ
sin(2๐‘ฅ) = 2 sin ๐‘ฅ cos ๐‘ฅ =
2
1+tan ๐‘ฅ
cos(2๐‘ฅ) = cos 2 ๐‘ฅ − sin2 ๐‘ฅ = 1 − 2 sin2 ๐‘ฅ = 2 cos 2 ๐‘ฅ − 1
1
sin2 ๐‘ฅ = (1 − cos(2๐‘ฅ))
2
1
cos 2 ๐‘ฅ = (1 + cos(2๐‘ฅ))
2
sin(arccos ๐‘ฅ) = cos(arcsin ๐‘ฅ) = √1 − ๐‘ฅ 2
Für Copy-Paste:
๐Ÿ™
https://en.wikipedia.org/wiki/Blackboard_bold mit Firefox
Copy&Paste
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
7/8
Wahrscheinlichkeitstheorie und Statistik
Stefan Rickli
1 Bemerkungen (V3.1)
2 Ressourcen zu „Word und Formeleditor“
Disclaimer
Meine Formelsammlungen entstehen und wachsen meist über eine längere Zeit. Es besteht immer ein gewisses Risiko, dass sich
einige Fehler über zig Iterationen versteckt gehalten haben. Ich freue mich deshalb über jegliche (Fehler-) Verbesserungen,
Anmerkungen, Lob, Dank oder auch Kritik.
Meine Zusammenfassungen werden fortlaufend korrigiert und aktualisiert veröffentlicht.
Weiterverarbeitung:
Weil ich es nicht ausstehen kann, dass ständig das Rad neu erfunden werden muss, habe ich das Originaldokument mit veröffentlicht
mit der Einladung, sich hier für die eigene Formelsammlung zu bedienen. Ihr könnt diese Zusammenfassung also gerne
weiterverarbeiten und / oder auch in überarbeiteter Form veröffentlichen.
Haltet jedoch die Herkunft der kopierten/übernommenen Teile so gut wie möglich nachvollziehbar, falls ihr weiter veröffentlicht.
Obiges gilt auch für alle anderen Formelsammlungen von mir, welche diesen Bemerkungstext (noch) nicht enthalten.
Quellenangaben:
Aus Platz- und Zeitgründen (blame the 'Prüfungsstress') fehlen natürlich praktisch jegliche Quellenangaben (worüber ich auch schon
ab und zu fluchen musste). Ich versuche jedoch in diesem Abschnitt die Arbeiten zu referenzieren, von denen ich wissentlich kopiert
habe:
Wesentliche Bestandteile:
Grundform
Zusammenfassung ‘Wahrscheinlichkeitstheorie und Statistik’ von Lukas Cavigelli, Juli 2011
Ergänzungen
Zusammenfassung ‘Probability Theory and Statistics’ von Raphael Keusch, Juli 2013
Beispiele
Übungsserien FS15
Revisionsverlauf:
1.0
Sept 2015
1.1
11.07.2016
erste Veröffentlichung
Bemerkungsseite aktualisiert
Fehlerkorrektur: Text zu bedingter Wahrscheinlichkeit, Tabelle mit 2D-Verteilung
Dank an Evan für die Hinweise!
To Do:
๏‚ท
Zuletzt gespeichert: 04.08.2017 05:54, Version 37
http://blogs.ethz.ch/ricklis
Stefan Rickli
Stefan Rickli
Es gibt ein paar Ressourcen, welche mir sehr geholfen haben, den Formeleditor in Word zu meistern:
Microsoft Word formula editor: https://support.office.com/en-us/article/Linear-format-equations-and-MathAutoCorrect-in-Word-2e00618d-b1fd-49d8-8cb4-8d17f25754f8?ui=en-US&rs=en-US&ad=US
Unicode Nearly Plain-Text Encoding of Mathematics: http://www.unicode.org/notes/tn28/
o
das ist der Standard, an den sich der Editor (fast vollständig) hält. Ist sehr gut beschrieben und
dokumentiert. Ausnahme sind Umrahmungen, welche nicht die ganze Funktionalität erhalten haben.
Die Zeichenübersicht des Editors selber: wenn man mit der Maus über ein Zeichen fährt, zeigt es einem den TastaturShortcut an, den man eingeben kann
Nice to know:
Alt + Shift + 0
erstellt eine neue Formel
(durch einen Bug in Office 2016 muss dieser Shortcut neu manuell definiert werden, Stand Mai 2016)
der Leerschlag ist euer Freund! Er veranlasst den Formeleditor, die Syntax bis zum aktuellen Punkt zu überprüfen und
das Zeug fixfertig bis zu dem Punkt, wo ihr seid, darzustellen (ausser es gibt noch offene Klammern).
o
verhält sich der Editor mal komisch, liegt es zu 95% daran, dass etwas in der Syntax nicht stimmt. Hier hilft
ab und an mal, sich die Formel im linearen Modus anzuschauen, wo alles bis auf Sonderzeichen wieder
auseinander genommen wird. Das einzige, mit dem der Editor Mühe hat, sind grosse Eq-Arrays und
mehrzeiliges Zeug.
Wenn die Formel auf einer eigenen Zeile steht, veranlasst ein Leerschlag ausserhalb nach der Formel (also AUSSERHALB
des Formeleditorfelds) den Editor, die Formel im Inline-Modus darzustellen (Formel braucht weniger Platz)
o
siehe Tabellen in dieser ZF, dort habe ich das konsequent benutzt. Löscht mal das Leerzeichen nach einer
Formel, das ein Integral enthält ๏Š
benutzt die Backslash (\) Befehle! Wenn man sich die beiden Dokumente oben ausdruckt und zur Referenz hält, geht es
nicht lange, bis man alles mit der Tastatur machen kann und nie absetzen muss, um was mit der Maus zu machen
\ensp und \emsp können helfen, um grössere, gewollte Abstände zu realisieren
\\eqarray ordnet mit jedem & einmal links und dann wieder rechts an
bastelt euch eure eigenen Shortcuts
o
zum Beispiel
๏‚ง
\La für ⇐
๏‚ง
\Ra für ⇒
๏‚ง
\Lra für ⇔
๏‚ง
oder \to für ein →
๏‚ง
oder eine leere 4x4 Matrix als \4x4 mit (โ– (&&&@&&&@&&&@&&&)) und einem Leerschlag
am Ende (damit der Ausdruck gleich aufgebaut wird)
๏‚ง
etc
o
dazu einfach das entsprechende Zeichen in die Zwischenablage kopieren und im Formeleditor unter
„Formeloptionen“ (in den Tools als kleiner Pfeil unten rechts zu finden) und „Math. Autokorrektur“
einfügen und den entsprechenden Backslashbefehl definieren
o
manchmal ist es sinnvoll, noch eigene Funktionsnamen zu definieren, welche der Editor erkennen soll,
wenn man sie häufig benutzt. Z.B. Imag()
๏‚ง
ansonsten Leerschlag funktionsname\funcapply Leerschlag
die mathematische Autokorrektur ist manchmal auch ausserhalb des Formeleditors nützlich. Ich hab das in den
Optionen auch aktiviert
Wenn Word langsam wird wegen vielen anzuzeigenden Formeln, hilft
o
1. die Entwurfsansicht (anstatt Seitenlayout). Wenn man sich damit abfindet, dass dann ab und zu das
Layout (noch) nicht dargestellt oder updated wird (nicht beirren lassen), kann man gut die kritischen
Abschnitte bearbeiten. Achtung: Bilder werden NICHT angezeigt, sondern einfach mit einem Leerschlag
repräsentiert!
o
2. reinzoomen, bis weniger Formeln sichtbar sind.
8/8
Herunterladen