Diskrete Zufallsvariable: n Erwarungswert: E(X ) = µ = ∑ xi · P(X = xi ) i=1 Varianz: n n Var(X ) = σ 2 = ∑ (xi − µ )2 · P(X = xi ) = ∑ x2i · P(X = xi ) − µ 2 = E X 2 − µ 2 i=1 i=1 Verteilungen von diskreten Zufallsvariablen: Gleichverteilung: Eine Zufallsvariable X mit Werten x1 , x2 , . . . , xn heißt gleichverteilt, falls gilt: P(X = x1 ) = P(X = x2 ) = . . . = P(X = xn ) = 1 n Für eine gleichverteilte Zufallsvariable X gilt: 1 n E(X ) = ∑ xi , n i=1 1 n Var(X ) = ∑ x2i − n i=1 1 n ∑ xi n i=1 !2 Anwendung: Problemstellungen bei denen jeder Wert der Zufallsvariable mit der selben Wahrscheinlichkeit auftritt. Geometrische Verteilung: Eine Zufallsvariable X mit Werten k = 1, 2, 3, . . . teilt mit Parameter p, falls gilt: heißt geometrisch ver- P(X = k) = (1 − p)k−1 · p Dann gilt: E(X ) = 1 p und Var(X ) = 1− p p2 Anwendung: Ein Ereignis A tritt bei einem Versuch mit der Wahrscheinlichkeit p auf. Der Versuch wird solange wiederholt, bis das Ereignis A auftritt. Die Zufallsvariable X zählt die Anzahl der Versuche bis zum ersten mal das Ereignis A auftritt. 1 Hypergeometrische Verteilung: Eine Zufallsvariable X mit Werten k = 0, 1, 2, 3, . . . , n heißt hypergeometrisch verteilt mit Parametern N, M, n wobei M < N und n < N, falls gilt: P(X = k) = Es gilt dann: E(X ) = n · p M N−M k · n−k N n und Var(X ) = n · p · (1 − p) N −n N −1 p= mit M N Anwendung: Ziehen ohne Zurücklegen: In einer Urne befinden sich N Kugeln. M von diesen Kugeln sind schwarz. Es werden n Kugeln ohne zurücklegen gezogen. Die Zufallsvariable X zählt die Anzahl der schwarzen Kugeln. Binomialverteilung: Eine Zufallsvariable X mit Werten k = 0, 1, 2, 3, . . . , n heißt binomialverteilt mit Parametern n und p, falls gilt: n P(X = k) = · pk · (1 − p)n−k k Es gilt: E(X ) = n · p Var(X ) = n · p · (1 − p) und Wir schreiben auch X ∼ B(n, p) Anwendung: Bei einem Versuch tritt ein bestimmtes Ereignis A mit Wahrscheinlichkeit p auf. Der Versuch wird n mal durchgeführt. Die Zufallsvariable X zählt, wie oft das Ereignis A bei diesen n Versuchsdurchführungen auftritt. Poisson-Verteilung: Eine Zufallsvariable X mit Werten k = 0, 1, 2, 3, . . . heißt poissonverteilt mit Parameter λ ∈ R, wenn gilt: P(X = k) = λ k −λ ·e k! Es gilt weiters: E(X ) = λ und Var(X ) = λ Wir schreiben auch X ∼ P(λ ) Anwendung: Die Poissonverteilung kann als Approximation der Binomialverteilung für n > 10 und p < 0.05 verwendet werden. Die Wahrscheinlichkeiten solcher binomialverteilter Zufallsvariable können mit der Poissonverteilung berechnet werden, wobei gilt: λ = n · p 2 Stetige Zufallsvariable: Dichtefunktion f (x): f (x) ≥ 0 und Z∞ −∞ Varianz: Var(X ) = σ = 2 Z∞ −∞ Verteilungsfunktion F(x): f (x)dx = 1 −∞ E(X ) = µ = Erwarungswert: Z∞ x · f (x)dx (x − µ ) · f (x)dx = 2 F(t) = P(X ≤ t) = Zt Z∞ −∞ x2 · f (x)dx − µ 2 f (x)dx −∞ Verteilungen von stetigen Zufallsvariablen: Exponentialverteilung: Dichtefunktion f (x) = ( 0 λ e−λ x für x < 0 für x ≥ 0 Verteilungsfunktion: F(x) = ( 0 1 − e−λ x Erwartungswert: E(X ) = Varianz: Var(X ) = für x < 0 für x ≥ 0 1 λ 1 λ2 Anwendung 1: Lebensdauer von Geräten, radioaktiven Teilchen,. . . . Wenn die „Sterberate“ konstant ist, dann ist die Lebensdauer exponentialverteilt. Bemerkung: Konstante „Sterberate“ bedeutet, dass die Anzahl der Todesfälle pro Zeiteinheit immer derselbe Anteil von der gerade vorhandenen Anzahl ist. Z.B.: Pro Jahr gehen 15% der Geräte kaputt. Oder: Die Halbwertszeit beträgt 23 Jahre. Anwendung 2: Ist das Eintreten eines Ereignisses Poissonverteilt, dann ist die Zeit zwischen dem Eintreten von zwei aufeinanderfolgenden Ereignissen exponentialverteilt. 3 Normalverteilung N(µ , σ 2 ): f (x) = Dichtefunktion: Erwartungswert: (x−µ )2 1 √ e− 2σ 2 σ 2π E(X ) = µ Var(X ) = σ 2 Varianz: Wichtiger Spezialfall: Standardisierte Normalverteilung N(0, 1): x2 1 f (x) = √ e− 2 2π Dichtefunktion: Verteilungsfunktion: F(x) = Zx f (y)dy = Φ(x) . . . Tabelle −∞ Auf Grund der Symmetrie der Dichtefunktion gilt: Φ(−x) = 1 − Φ(x) Die Zahl xγ mit Φ(xγ ) = γ heißt γ −Quantil der Standardnormalverteilung. Wir schreiben: γ = QN (γ ) Standardisieren einer Zufallsvariable: Ist X ∼ N(µ , σ 2 ), dann ist Z := X −µ σ standardnormalverteilt. Also Z ∼ N(0, 1) Anwendung: - Viele kontinuierliche Größen sind normalverteilt - Approximation der Binomialverteilung: Richtwert: σ 2 = n · p · (1 − p) ≥ 9 - Approximation der hypergeometrischen Verteilung: Richtwert: M M N −n σ = n· 1− ≥9 N N N −1 2 4 und N ≥ 2n Konfidenzintervalle bei verschiedenen Bedingungen: Q(N) (α ) . . . α − Quantil der N(0, 1)-Verteilung (t) Qn (α ) . . . α − Quantil der tn -Verteilung x̄ . . . Mittelwert der Stichprobe mit Umfang n s2 = 1 n−1 n ∑ (xi − x̄)2 . . . geschätzte Varianz i=1 Konfidenzintervall für den Erwartungswert µ einer normalverteilten Zufallsvariable bei bekannter Varianz σ 2 : α σ α σ (N) (N) √ √ x̄ − Q 1− , x̄ + Q 1− 2 n 2 n Mindeststichprobenumfang nL für ein (1 − α )−Konfidenzintervall, dessen Länge ≤ L ist: 2 2 σ 4 Q(N) 1 − α2 nL ≥ 2 L Konfidenzintervall für den Erwartungswert µ einer normalverteilten Zufallsvariable bei geschätzter Varianz s2 : (z.B.: Vorher-nachher-Vergleich) α s α s (t) (t) √ , x̄ + Qn−1 1 − √ x̄ − Qn−1 1 − 2 n 2 n Konfidenzintervall für den Anteilswert p (z.B: Wahlprognose) # " r r p̂(1 − p̂) p̂(1 − p̂) α α p̂ − Q(N) 1 − , p̂ + Q(N) 1 − 2 n 2 n p̂ . . . relativer Anteil in der Stichprobe Mindeststichprobenumfang nL für ein (1 − α )−Konfidenzintervall, dessen Länge ≤ L ist: !2 Q(N) 1 − α2 nL ≥ L Konfidenzintervall für die Differenz zweier Erwartungswerte µ1 − µ2 zweier normalverteilter Zufallsvariable X1 und X2 bei bekannten Varianzen σ12 und σ22 : h i α α (x̄1 − x̄2 ) − Q(N) 1 − · σD , (x̄1 − x̄2 ) + Q(N) 1 − · σD 2 2 s σ12 σ22 mit σD = + n1 n2 5 Konfidenzintervall für die Differenz zweier Erwartungswerte µ1 − µ2 zweier normalverteilter Zufallsvariable X1 und X2 bei geschätzten Varianzen s21 und s22 . Annahme: σ12 = σ22 h α α i (t) (t) · sP , (x̄1 − x̄2 ) + Qk 1 − · sP (x̄1 − x̄2 ) − Qk 1 − 2 2 s r 1 1 (n1 − 1)s21 + (n2 − 1)s22 mit k = n1 + n2 − 2 und sP = + n1 n2 k Konfidenzintervall für die Differenz zweier Erwartungswerte µ1 − µ2 zweier normalverteilter Zufallsvariable X1 und X2 bei geschätzten Varianzen s21 und s22 . Annahme: σ12 6= σ22 h α α i (t) (t) · sD , (x̄1 − x̄2 ) + Qν 1 − · sD (x̄1 − x̄2 ) − Qν 1 − 2 2 s 4 s21 s22 s mit + ν = 2 2 D 2 2 und sD = s s n1 n2 1 2 n1 n2 n1 −1 + n2 −1 Konfidenzintervall für die Differenz zweier Anteilswerte (p1 − p2 ) h α α i ( p̂1 − p̂2 ) − Q(N) 1 − · sD , p̂1 − p̂2 ) + Q(N) 1 − · sD 2 2 s p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) mit sD = + n1 n2 6 Testen von Hypothesen: Zweiseitiger Test für eine Größe g: Nullhypothese: H0 : g = g0 , Alternativhypothese: H1 : g 6= g0 Dichtefunktion der Teststatistik T α 2 T ∈ Q α2 ; Q 1 − α2 . . . Die Nullhypothese wird beibehalten. α 2 Q α 2 Q 1− α2 Einseitiger Test für eine Größe g: Fall 1: Nullhypothese: H0 : g ≤ g0 , Alternativhypothese: H1 : g > g0 Dichtefunktion der Teststatistik T T < Q (1 − α ) . . . Die Nullhypothese wird beibehalten. α Q (1−α) Fall 2: Nullhypothese: H0 : g ≥ g0 , Alternativhypothese: H1 : g < g0 Dichtefunktion der Teststatistik T α Q (α) 7 T > Q (α ) . . . Die Nullhypothese wird beibehalten. Berechnung der Testsstatistik T für verschiedene Größen: n x̄ p̂ . . . Größe der Stichprobe . . . Mittelwert der Stichprobe . . . relativer Anteil aus der Stichprobe s2 = 1 n−1 n ∑ (xi − x̄)2 . . . empirische Varianz i=1 Test für den Erwartungswert µ einer normalverteilten ZV bei bekannter Varianz σ 2 : x̄ − µ0 √ n T ∼ N(0, 1) T= σ Test für den Erwartungswert einer normalverteilten ZV bei geschätzter Varianz s2 : x̄ − µ0 √ T= n T ∼ tn−1 . . . t-Verteilung mit (n − 1) Freiheitsgraden s Test für den Anteilswert p: (Voraussetzung: B(n, p) ≈ N(np, np(1 − p)) T=p p̂ − p0 √ n p0 (1 − p0 ) T ∼ N(0, 1) Test für die Differenz zweier Erwartungswerte µ1 − µ2 von normalverteilten Zufallsvariablen bei bekannten Varianzen σ12 und σ22 : x̄1 − x̄2 T=q 2 σ1 σ22 n1 + n2 z.B.: H0 : µ1 < µ2 T ∼ N(0, 1) entspricht H0 : T < 0 Test für die Differenz zweier Erwartungswerte µ1 − µ2 von normalverteilten Zufallsvariablen bei geschätzten Varianzen s21 und s22 : Annahme: σ12 = σ22 T= mit x̄1 − x̄2 sP T ∼ tk k = n1 + n2 − 2 sP = und r 1 1 + n1 n2 s (n1 − 1)s21 + (n2 − 1)s22 k Test für die Differenz zweier Erwartungswerte µ1 − µ2 von normalverteilten Zufallsvariablen bei geschätzten Varianzen s21 und s22 : Annahme: σ12 6= σ22 T= mit x̄1 − x̄2 sD ν= T ∼ tν s4D 2 2 s 1 n1 n1 −1 + 2 2 und s 2 n2 sD = s s21 s22 + n1 n2 n2 −1 Test für die Differenz p1 − p2 zweier Anteilswerte: T= mit p̂1 − p̂2 sD sD = T ∼ N(0, 1) p p̂(1 − p̂) r n1 + n2 n1 · n2 p̂ = mit 8 n1 p̂1 + n2 p̂2 n1 + n2 Verteilungsfunktion der Standardnormalverteilung: Φ(z) In der ersten Zeile der Tabelle steht die 2. Nachkommastelle des z-Wertes Es gilt: Dichtefunktion der N(0,1)-Verteilung Φ(z) Φ(−z) = 1 − Φ(z) 0 z z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 0.5 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594 0.84134 0.86433 0.88493 0.9032 0.91924 0.93319 0.9452 0.95543 0.96407 0.97128 0.97725 0.98214 0.9861 0.98928 0.9918 0.99379 0.99534 0.99653 0.99744 0.99813 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.99995 0.99997 0.50399 0.5438 0.58317 0.62172 0.6591 0.69497 0.72907 0.76115 0.79103 0.81859 0.84375 0.8665 0.88686 0.9049 0.92073 0.93448 0.9463 0.95637 0.96485 0.97193 0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819 0.99869 0.99906 0.99934 0.99953 0.99968 0.99978 0.99985 0.9999 0.99993 0.99995 0.99997 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121 0.84614 0.86864 0.88877 0.90658 0.9222 0.93574 0.94738 0.95728 0.96562 0.97257 0.97831 0.983 0.98679 0.98983 0.99224 0.99413 0.9956 0.99674 0.9976 0.99825 0.99874 0.9991 0.99936 0.99955 0.99969 0.99978 0.99985 0.9999 0.99993 0.99996 0.99997 0.51197 0.55172 0.59095 0.6293 0.6664 0.70194 0.73565 0.7673 0.79673 0.82381 0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.9732 0.97882 0.98341 0.98713 0.9901 0.99245 0.9943 0.99573 0.99683 0.99767 0.99831 0.99878 0.99913 0.99938 0.99957 0.9997 0.99979 0.99986 0.9999 0.99994 0.99996 0.99997 0.51595 0.55567 0.59483 0.63307 0.67003 0.7054 0.73891 0.77035 0.79955 0.82639 0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.9495 0.95907 0.96712 0.97381 0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836 0.99882 0.99916 0.9994 0.99958 0.99971 0.9998 0.99986 0.99991 0.99994 0.99996 0.99997 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894 0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441 0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841 0.99886 0.99918 0.99942 0.9996 0.99972 0.99981 0.99987 0.99991 0.99994 0.99996 0.99997 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147 0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.9608 0.96856 0.975 0.9803 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846 0.99889 0.99921 0.99944 0.99961 0.99973 0.99981 0.99987 0.99992 0.99994 0.99996 0.99998 0.5279 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398 0.85769 0.879 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558 0.98077 0.985 0.9884 0.99111 0.99324 0.99492 0.99621 0.9972 0.99795 0.99851 0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.99996 0.99998 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.7823 0.81057 0.83646 0.85993 0.881 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615 0.98124 0.98537 0.9887 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856 0.99896 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.99997 0.99998 0.53586 0.57535 0.61409 0.65173 0.68793 0.7224 0.7549 0.78524 0.81327 0.83891 0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.9767 0.98169 0.98574 0.98899 0.99158 0.99361 0.9952 0.99643 0.99736 0.99807 0.99861 0.999 0.99929 0.9995 0.99965 0.99976 0.99983 0.99989 0.99992 0.99995 0.99997 0.99998 9 Tabelle für die Student-Verteilungen: Dichtefunktion der tn -Verteilung In der Tabelle stehen die Quantile für die Wahrscheinlichkeiten p = 0.9, p = 0.95, . . . Es gilt: df 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 (t) p (t) Qn (1 − p) = −Qn (p) 0.90 3.078 1.886 1.638 1.533 1.476 1.44 1.415 1.397 1.383 1.372 1.363 1.356 1.35 1.345 1.341 1.337 1.333 1.33 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.31 1.309 1.309 1.308 1.307 1.306 1.306 1.305 1.304 1.304 1.303 0.95 6.314 2.92 2.353 2.132 2.015 1.943 1.895 1.86 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.74 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.696 1.694 1.692 1.691 1.69 1.688 1.687 1.686 1.685 1.684 p 0.975 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.16 2.145 2.131 2.12 2.11 2.101 2.093 2.086 2.08 2.074 2.069 2.064 2.06 2.056 2.052 2.048 2.045 2.042 2.04 2.037 2.035 2.032 2.03 2.028 2.026 2.024 2.023 2.021 0.99 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.65 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.5 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.453 2.449 2.445 2.441 2.438 2.434 2.431 2.429 2.426 2.423 0 0.995 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.25 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.75 2.744 2.738 2.733 2.728 2.724 2.719 2.715 2.712 2.708 2.704 df 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 60 65 70 75 80 85 90 95 100 150 200 250 300 350 400 450 500 550 600 650 700 800 900 1000 ∞ 10 0.90 1.303 1.302 1.302 1.301 1.301 1.3 1.3 1.299 1.299 1.299 1.298 1.298 1.298 1.297 1.297 1.296 1.295 1.294 1.293 1.292 1.292 1.291 1.291 1.29 1.287 1.286 1.285 1.284 1.284 1.284 1.283 1.283 1.283 1.283 1.283 1.283 1.283 1.282 1.282 1.282 0.95 1.683 1.682 1.681 1.68 1.679 1.679 1.678 1.677 1.677 1.676 1.675 1.675 1.674 1.674 1.673 1.671 1.669 1.667 1.665 1.664 1.663 1.662 1.661 1.66 1.655 1.653 1.651 1.65 1.649 1.649 1.648 1.648 1.648 1.647 1.647 1.647 1.647 1.647 1.646 1.646 p 0.975 2.02 2.018 2.017 2.015 2.014 2.013 2.012 2.011 2.01 2.009 2.008 2.007 2.006 2.005 2.004 2. 1.997 1.994 1.992 1.99 1.988 1.987 1.985 1.984 1.976 1.972 1.969 1.968 1.967 1.966 1.965 1.965 1.964 1.964 1.964 1.963 1.963 1.963 1.962 1.962 (t) Qn (p) 0.99 2.421 2.418 2.416 2.414 2.412 2.41 2.408 2.407 2.405 2.403 2.402 2.4 2.399 2.397 2.396 2.39 2.385 2.381 2.377 2.374 2.371 2.368 2.366 2.364 2.351 2.345 2.341 2.339 2.337 2.336 2.335 2.334 2.333 2.333 2.332 2.332 2.331 2.33 2.33 2.33 0.995 2.701 2.698 2.695 2.692 2.69 2.687 2.685 2.682 2.68 2.678 2.676 2.674 2.672 2.67 2.668 2.66 2.654 2.648 2.643 2.639 2.635 2.632 2.629 2.626 2.609 2.601 2.596 2.592 2.59 2.588 2.587 2.586 2.585 2.584 2.583 2.583 2.582 2.581 2.581 2.581