Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Wintersemester 2012/2013 Formelsammlung Statistik für Business Administration 1 1.1 Deskriptive Statistik Eindimensionale Häufigkeitsverteilungen Merkmal: X Datenmenge (Stichprobe) vom Umfang n ∈ N: x1 , x2 , ..., xn geordnete Stichprobe: x(1) , x(2) , ..., x(n) mit x(1) ≤ x(2) ≤ ... ≤ x(n) Ausprägungen von X (falls X nicht stetiges Merkmal): a1 , a2 , ..., am mit m ∈ N 1.1.1 Häufigkeiten Absolute Häufigkeit: H(ai ) für i = 1, ..., m Anzahl des Vorkommens der Ausprägung ai vom Merkmal X in der Stichprobe. Es gilt: 0 ≤ H(ai ) ≤ n für alle Ausprägungen ai H(a1 ) + H(a2 ) + ... + H(am ) = n . Relative Häufigkeit: h(ai ) = 1 n H(ai ) für i = 1, ..., m Anteil des Vorkommens der Ausprägung ai vom Merkmal X in der Stichprobe. Es gilt: 0 ≤ h(ai ) ≤ 1 für alle Ausprägungen ai h(a1 ) + h(a2 ) + ... + h(am ) = 1 . 1.1.2 Summenhäufigkeiten (kumulative Häufigkeiten) Voraussetzung: Die Ausprägungen vom Merkmal X lassen sich der Größe nach ordnen, d.h. a1 < a2 < ... < am . Absolute Summenhäufigkeit: S(ai ) = H(a1 ) + H(a2 ) + ... + H(ai ) i X X = H(ak ) = H(ak ) für i = 1, ..., m. ak ≤ai k=1 Anzahl des Vorkommens aller Ausprägungen vom Merkmal X in der Stichprobe, die kleiner oder gleich ai sind. Es gilt: 0 ≤ S(a1 ) ≤ S(a2 ) ≤ ... ≤ S(am ) = n. Relative Summenhäufigkeit: s(ai ) = n1 S(ai ) = h(a1 ) + h(a2 ) + ... + h(ai ) i X X = h(ak ) = h(ak ) für i = 1, ..., m. ak ≤ai k=1 Anteil des Vorkommens aller Ausprägungen vom Merkmal X in der Stichprobe, die kleiner oder gleich ai sind. Es gilt: 0 ≤ s(a1 ) ≤ s(a2 ) ≤ ... ≤ s(am ) = 1. 1 1.1.3 Empirische Verteilungsfunktion F : R −→ [0, 1] mit 0 x < a1 s(a ) a 1 1 ≤ x < a2 s(a2 ) a2 ≤ x < a3 X F (x) = h(ai ) = : : ai ≤x s(a m−1 ) am−1 ≤ x < am 1 am ≤ x Eigenschaften der empirischen Verteilungsfunktion: • Treppenfunktion • monoton wachsend • Sprungstellen (Unstetigkeitsstellen): Merkmalsausprägungen a1 , ..., am • Sprunghöhe an Sprungstelle ai : relative Häufigkeit h(ai ), i = 1, ..., m • rechtsseitig stetig 1.1.4 Mittelwerte 1. Modalwert: xD Ausprägung vom Merkmal X mit größter vorkommender Häufigkeit in der Stichprobe. (xD muß nicht eindeutig bestimmt sein.) 2. Median (Zentralwert): xZ Wert in der Mitte der geordneten Stichprobe, d.h. ( n ungerade x( n+1 ) 2 xZ = 1 x( n2 ) + x( n2 +1) n gerade 2 (xZ muß nicht mit einem Wert der Stichprobe übereinstimmen.) 3. arithmetisches Mittel: x n 1X 1 xi (x1 + x2 + ... + xn ) = x = n n i=1 m m X 1X = H(ai ) · ai = h(ai ) · ai n i=1 i=1 4. geometrisches Mittel: xG xG = √ n x1 · ... · xn = q n H(a1 ) a1 H(am ) · ... · am h(a1 ) = a1 h(am ) · ... · am , falls alle xi , ai > 0. Äquivalente Formel: lg xG = n1 (lg x1 + ... + lg xn ) 5. harmonisches Mittel: xH xH = Es gilt: 1 x1 n + ... + 1 xn = n H(a1 ) a1 + ... + xH ≤ xG ≤ x . 2 H(am ) am = 1 h(a1 ) a1 + ... + h(am ) am 1.1.5 Quantile α - Quantil für α ∈ (0, 1): xα Aufteilung der geordneten Stichprobe bezüglich α · 100%, d.h. mindestens α · 100% der Daten sind kleiner oder gleich xα und mindestens − α) · 100% derDaten sind größer oder gleich xα . ( (1 1 αn ganzzahling x(αn) + x(αn+1) 2 Berechnungsvorschrift für xα : xα = x([αn]+1) αn nicht ganzzahlig [αn] bedeutet ganzzahliger Anteil von αn, z.B. [5, 61] = 5. Es gilt: x0.5 = xZ . x0.25 , x0.5 , x0.75 heißen Quartile. x0.75 − x0.25 heißt Quartilsabstand. 1.1.6 Streuungsmaße 1. Spannweite: w = max{x1 , ..., xn } − min{x1 , ..., xn } = x(n) − x(1) 2. mittlere absolute Abweichung von einem Mittelwert: n 1X |xi − x| dx = mittlere absolute Abweichung vom arithmetischen Mittel n i=1 n 1X |xi − xZ | dxZ = mittlere absolute Abweichung vom Zentralwert n i=1 analoge Formeln mit absoluten oder relativen Häufigkeiten, z.B.: m m X 1X |ai − xZ | · H(ai ) = |ai − xZ | · h(ai ) dxZ = n i=1 i=1 3. Varianz und Standardabweichung: Varianz s2 – mittlere quadratische Abweichung vom arithmetischen Mittel: n m m 1 X 1 X n X 2 2 2 (xi − x) = (ai − x) · H(ai ) = (ai − x)2 · h(ai ) s = n − 1 i=1 n − 1 i=1 n − 1 i=1 s n √ 1 X Standardabweichung: s = s2 = (xi − x)2 n − 1 i=1 ! n X 1 2 2 andere Berechnungsvorschrift für s2 : s2 = x − n(x) n − 1 i=1 i 4. Variationskoeffizient: v = 1.1.7 s falls x 6= 0. x Klassierte Daten Klasseneinteilung der Daten (Stichprobenumfang n) in disjunkte Klassen K1 , ..., Km mit Klassenmitten x∗1 , ..., x∗m und absoluten bzw. relativen Klassenhäufigkeiten der i-ten Klasse H(Ki ), h(Ki ), i = 1, ..., m. m m X 1X ∗ xi · H(Ki ) = x∗i · h(Ki ) Dann gilt: x = n i=1 i=1 m m 1 X ∗ n X ∗ s = (xi − x)2 · H(Ki ) = (xi − x)2 · h(Ki ) n − 1 i=1 n − 1 i=1 2 Andere Formeln analog mit x∗i als Repräsentant für die i-te Klasse Ki , i = 1, ..., m. 3 1.2 Zweidimensionale Häufigkeitsverteilungen Merkmal X mit Ausprägungen a1 , ..., ap , p ∈ N Merkmal Y mit Ausprägungen b1 , ..., bq , q ∈ N Datenmenge (x1 , y1 ), ..., (xn , yn ), n ∈ N 1.2.1 Häufigkeiten, bedingte Häufigkeiten, Unabhängigkeit Häufigkeiten: Absolute Häufigkeit: H(ai , bj ) für i = 1, ..., p, j = 1, ..., q Anzahl des Vorkommens von (ai , bj ) in der Stichprobe. Relative Häufigkeit: h(ai , bj ) = n1 H(ai , bj ) für i = 1, ..., p, j = 1, ..., q Absolute Randhäufigkeit für X: H(ai ) = H(ai , b1 ) + ... + H(ai , bq ) für i = 1, ..., p Relative Randhäufigkeit für X: h(ai ) = n1 H(ai ) = h(ai , b1 ) + ... + h(ai , bq ) für i = 1, ..., p Absolute Randhäufigkeit für Y : H(bj ) = H(a1 , bj ) + ... + H(ap , bj ) für j = 1, ..., q Relative Randhäufigkeit für Y : h(bj ) = n1 H(bj ) = h(a1 , bj ) + ... + h(ap , bj ) für j = 1, ..., q Randverteilung von X: H(a1 ), ..., H(ap ) bzw. h(a1 ), ..., h(ap ) Randverteilung von Y : H(b1 ), ..., H(bq ) bzw. h(b1 ), ..., h(bq ) Darstellung: Kontingenztabelle X a1 a2 .. . ap Spaltensumme b1 ... bq Zeilensumme H(a1 , b1 ) H(a2 , b1 ) .. . H(ap , b1 ) H(b1 ) ... ... H(a1 , bq ) H(a2 , bq ) .. . H(ap , bq ) H(bq ) H(a1 ) H(a2 ) .. . H(ap ) n Y ... ... Bedingte Häufigkeiten: h(ai | bj ) = h(ai , bj ) H(ai , bj ) = H(bj ) h(bj ) i = 1, ..., p, j = 1, ..., q und H(bj ) 6= 0 Relative Häufigkeit für das Auftreten der Ausprägung ai unter der Bedingung, daß Y die Ausprägung bj annimmt. h(bj | ai ) = H(ai , bj ) h(ai , bj ) = H(ai ) h(ai ) i = 1, ..., p, j = 1, ..., q und H(ai ) 6= 0 Relative Häufigkeit für das Auftreten der Ausprägung bj unter der Bedingung, daß X die Ausprägung ai annimmt. Empirische Unabhängigkeit von zwei Merkmalen: Zwei Merkmale heißen empirisch unabhängig, wenn für alle i = 1, ..., p und j = 1, ..., q gilt: 1 H(ai , bj ) = H(ai ) · H(bj ) bzw. h(ai , bj ) = h(ai ) · h(bj ) . n 4 1.2.2 Zusammenhangsmaße 1. Kontingenzkoeffizient nach Pearson (für nominale Merkmale X und Y ): s χ2 C= mit χ2 + n 2 χ = q p X X (H(ai , bj ) − Ĥ(ai , bj ))2 Ĥ(ai , bj ) i=1 j=1 und Ĥ(ai , bj ) = n1 H(ai ) · H(bj ) . Es gilt: • X,Y empirisch unabhängig ⇐⇒ χ2 = 0 ⇐⇒ C = 0 . • Je stärker die Abhängigkeit von X und Y ist, desto größer ist C. s min(p, q) − 1 <1 • 0≤C≤ min(p, q) s C min(p, q) − 1 . • Korrigierter Kontingenzkoeffizient: Ckorr = mit Cmax = Cmax min(p, q) Für Ckorr gilt 0 ≤ Ckorr ≤ 1. 2. Korrelationskoeffizient nach Pearson (für metrische Merkmale X und Y ): Maßzahl für die Stärke des linearen Zusammenhangs von X und Y : rXY n P (xi − x)(yi − y) Cov(X, Y ) i=1 r rn = = n P P sX · sY (xi − x)2 · (yi − y)2 i=1 mit i=1 n 1 1 X (xi − x)(yi − y) = Cov(X, Y ) = n − 1 i=1 n−1 n X i=1 xi yi − nx y ! empirische Kovarianz der Merkmale X und Y und sX , sY – Standardabweichung von X bzw. Y Es gilt: • −1 ≤ rXY ≤ 1 • X,Y empirisch unabhängig =⇒ Cov(X, Y ) = 0 =⇒ rXY = 0 . • Umkehrung gilt nicht, d.h. rXY = 0 6=⇒ X, Y empirisch unabhängig. • rXY > 0: Je größer rXY , desto stärker ist der lineare Zusammenhang zwischen X, Y . Der lineare Zusammenhang hat positiven Anstieg, wachsende Werte für X bedeuten ebenfalls wachsende Werte für Y . (Analog für rXY < 0, dann hat der lineare Zusammenhang negativen Anstieg.) 3. Rangkorrelationskoeffizient nach Spearman (für ordinale Merkmale X und Y ): 6 rSP = 1 − n P i=1 (Ri − Ri′ )2 (n − 1)n(n + 1) mit Ri – Positionsnummer von xi in der geordneten Stichprobe x(1) ≤ ... ≤ x(n) und Ri′ – Positionsnummer von yi in der geordneten Stichprobe y(1) ≤ ... ≤ y(n) 5 Es gilt: • −1 ≤ rSP ≤ 1 • rSP > 0: Je größer rSP , desto stärker ist der Zusammenhang zwischen X, Y , wobei zu wachsenden Rangzahlen Ri von X auch wachsende Rangzahlen Ri′ von Y gehören. (Analog für rSP < 0, dann gehören zu wachsenden Rangzahlen Ri von X fallende Rangzahlen Ri′ von Y .) 1.2.3 Regressionsanalyse Hinweis: Das P - Zeichen steht in allen Formeln für a = b = n . i=1 1. Gerade (y-x – Regression): P n P ŷ = a + bx P P P P P y x2i − x (xi yi ) x2i · yi − xi · (xi yi ) P P = n x2i − ( xi )2 (n − 1)s2X P P P (xi yi ) − xi · yi Cov(X, Y ) P 2 P 2 = n xi − ( xi ) s2X x̂ = a′ + b′ y 2. Gerade (x-y – Regression): P P P 2 P P P x yi2 − y (xi yi ) yi · xi − yi · (xi yi ) ′ P P = a = n yi2 − ( yi )2 (n − 1)s2Y b ′ = n P P P (xi yi ) − xi · yi Cov(X, Y ) P 2 P 2 = n yi − ( yi ) s2Y Es gilt: Die linearen y-x – und x-y – Regressionsfunktionen schneiden sich im Punkt (x, y). Verwendete Formeln: 3. Parabel: a, b und P yi P xi yi P 2 xi yi P xi und y = n1 yi P P 1 1 s2X = n−1 (xi − x)2 und s2Y = n−1 (yi − y)2 P 1 Cov(X, Y ) = n−1 (xi − x)(yi − y) x= 1 n P ŷ = a + bx + cx2 c sind Lösung des linearen P = a·n + b · xi P P = a · xi + b · x2i P P = a · x2i + b · x3i 4. Potenzfunktion: ŷ = a · xb Gleichungssystems: P + c · x2i P + c · x3i P + c · x4i P P P P (log xi )2 · log yi − log xi · (log xi · log yi ) P P log a = n (log xi )2 − ( log xi )2 b = n P P P (log xi · log yi ) − log xi · log yi P P n (log xi )2 − ( log xi )2 6 5. Exponentialfunktion: P log a = n log b = x2i · P P ŷ = a · bx , b>0 P P log yi − xi · (xi · log yi ) P P n x2i − ( xi )2 P P (xi · log yi ) − xi · log yi P P n x2i − ( xi )2 k , b < 0 mit bekannter Sättigungsgrenze k 1 + ea+bx P 2 P P P xi · ln( yki − 1) − xi · (xi · ln( yki − 1)) P P a = n x2i − ( xi )2 6. Logistische Funktion: b = n P ŷ = P P (xi · ln( yki − 1)) − xi · ln( yki − 1) P P n x2i − ( xi )2 Bestimmtheitsmaß: n P B = i=1 n P i=1 (ŷi − y)2 (yi − mit ŷi = f (xi ) für die Regressionsfunktion f . y)2 Bei dieser Definition von B muß die Regressionsfunktion f von einem der oben genannten Funktionstypen sein (linear in den Regressionsparametern). Es gilt: • 0≤B≤1 • B beschreibt den Anteil der Varianz der Stichprobe, der durch die gewählte Regressionsfunktion erklärt wird. D.h. je größer B ist, umso besser ist der gewählte Funktionstyp geeignet zur Beschreibung des Zusammenhangs von X und Y . 2 • Bei linearer Regression gilt B = rXY . 1.3 Zeitreihen Metrisches Merkmal X, Beobachtungszeitpunkte t1 , ..., tn Stichprobe (t1 , x1 ), ..., (tn , xn ) Komponenten einer Zeitreihe: Trend T konjunkturelle Komponente K Saisonkomponente S Restkomponente R vereinfachte Modelle: additives Modell X =T +S multiplikatives Modell X =T ·S 7 1.3.1 Methoden der Trendermittlung 1. Regression Formeln siehe Regressionsanalyse bei zweidimensionalen Häufigkeitsverteilungen, z.B. Gerade: x̂ = a + bt P 2 P P P ti · xi − ti · (ti xi ) P P a = n t2i − ( ti )2 P P P n (ti xi ) − ti · xi P P b = n t2i − ( ti )2 Hinweise: Auf Transformation der Zeitpunkte achten! n P P . Das - Zeichen steht in allen Formeln für i=1 2. Glättung durch gleitende Durchschnitte Ordnung: Anzahl benachbarter Werte der Zeitreihe, aus denen das arithmetische Mittel gebildet wird. • ungerade Ordnung, d.h. j = 3, 5, 7, ...: 1 (x1 j 1 (x2 j + ... + xj ) + ... + xj+1 ) . . . 1 (xn−j+1 + ... + xn ) j Aus n Werten der Zeitreihe ergeben sich nach dem Glätten mit ungerader Ordnung j noch n − j + 1 Werte. • gerade Ordnung, d.h. j = 2, 4, 6, ...: 1 1 ( x j 2 1 1 1 ( x j 2 2 + x2 + ... + xj + 12 xj+1 ) + x3 + ... + xj+1 + 12 xj+2 ) . . . 1 1 ( x + xn−j+1 + ... + xn−1 + 12 xn ) j 2 n−j Aus n Werten der Zeitreihe ergeben sich nach dem Glätten mit gerader Ordnung j noch n − j Werte. 3. Exponentielles Glätten Exponentielles Glätten 1. Ordnung mit Startwert x̃1 und Glättungsfaktor α ∈ (0, 1): für t = 2, ..., n x̃t = αxt−1 + (1 − α)x̃t−1 Wahl des Startwertes x̃1 z.B. x̃1 = x1 . Auswirkung des Glättungsfaktors α: α dicht bei 1 =⇒ starke Brücksichtigung „ jüngerer“ Werte der Zeitreihe, α dicht bei 0 =⇒ starke Brücksichtigung „älterer“ Werte der Zeitreihe. Erstellung kurzfristiger Prognosen: x∗ = x̃n+1 = αxn + (1 − α)x̃n 8 1.3.2 Ermittlung der Saisonkomponente Ausgangspunkt: Gegeben: Bezeichnungen: Zeitreihe mit periodischen saisonalen Einflüssen Beobachtungswerte von X für P Perioden mit je k Unterzeiträumen z.B. P Jahre mit je 12 Monaten oder je 4 Quartalen xp,j – Beobachtungswert für den j-ten Unterzeitraum in der p-ten Periode, p = 1, ..., P , j = 1, ..., k x̂p,j – Trendwert für den j-ten Unterzeitraum in der p-ten Periode, p = 1, ..., P , j = 1, ..., k (ermittelt z.B. durch Regression) Saisonkomponente sp,j für den j-ten Unterzeitraum in der p-ten Periode, p = 1, ..., P , j = 1, ..., k: für additives Modell: sp,j = xp,j − x̂p,j , für multiplikatives Modell: sp,j = xp,j x̂p,j . mittlere Saisonkomponente sj für den j-ten Unterzeitraum, j = 1, ..., k: sj = 1 (s1,j P + ... + sP,j ) Prognosewert x∗P +1,j für den j-ten Unterzeitraum in Periode P + 1, j = 1, ..., k: für additives Modell: x∗P +1,j = x̂P +1,j + sj für multiplikatives Modell: x∗P +1,j = x̂P +1,j · sj 9 , . 1.4 Indexzahlen Hinweis: Das P - Zeichen steht in allen Formeln für n P . Dabei bezeichnet n die Anzahl der i=1 betrachteten Güter. Index nach Preisindex P ILA;t 0 ,t LASPEYRES PAASCHE IPPA;t0 ,t LOWE P ILO;t 0 ,t FISHER IFP;t0 ,t = P =P P =P Mengenindex (t) (0) p i qi (0) (0) p i qi P M ILA;t 0 ,t =P (t) (t) p i qi (0) (t) p i qi P =P IPMA;t0 ,t =P (t) p i qi (0) p i qi q P ILA;t · IPPA;t0 ,t 0 ,t M ILO;t 0 ,t IFM;t0 ,t = P q (t) (0) qi p i (0) (0) qi p i (t) (t) qi p i (0) (t) qi p i P =P (t) qi p i (0) qi p i M ILA;t · IPMA;t0 ,t 0 ,t Dabei bedeuten für i = 1, ..., n qi (0) : Menge des Gutes i in der Basisperiode t0 , (t) qi (0) pi (t) pi : Menge des Gutes i in der Berichtsperiode t, : Preis des Gutes i in der Basisperiode t0 , : Preis des Gutes i in der Berichtsperiode t. Hinweis zu den Größen qi und pi in den Formeln von LOWE, i = 1, ..., n: t 1 X (k) qi = q t + 1 k=0 i (arithmetisches Mittel der Werte der Perioden 0 bis t), t 1 X (k) p pi = t + 1 k=0 i (arithmetisches Mittel der Werte der Perioden 0 bis t). 10 2 Wahrscheinlichkeitsrechnung 2.1 Zufällige Ereignisse und Wahrscheinlichkeiten Zufallsexperiment: Experiment, dessen mögliche Versuchsausgänge bekannt sind, dessen konkretes Ergebnis aber nicht vorhersagbar ist. Grundraum Ω: Menge aller möglichen Versuchsausgänge eines Zufallsexperiments. Zufälliges Ereignis A: Teilmenge vom Grundraum, d.h. A ⊆ Ω. Das zufällige Ereignis A tritt ein bei Durchführung des Zufallsexperimentes, wenn der konkrete Versuchsausgang ω zu A gehört, d.h. ω ∈ A. Elementarereignis: {ω}, einelementige Teilmenge von Ω, {ω} ⊆ Ω, sicheres Ereignis: Ω, tritt immer ein bei Durchführung des Zufallsexperimentes, Ω ⊆ Ω, unmögliches Ereignis: ∅, tritt nie ein bei Durchführung des Zufallsexperimentes, ∅ ⊆ Ω. Zufällige Ereignisse sind Mengen! Übertragung von Operationen für Mengen auf zufällige Ereignisse: A⊆B A zieht B nach sich, d.h., wenn A eintritt, dann tritt auch B ein. C = A ∪ B Summe der Ereignisse A und B, d.h. C tritt genau dann ein, wenn mindestens eins der Ereignisse A, B eintritt. Analog für C = A1 ∪ ... ∪ An . D = A ∩ B Produkt der Ereignisse A und B, d.h. D tritt genau dann ein, wenn beide Ereignisse A, B eingetreten sind. Analog für D = A1 ∩ ... ∩ An . E = A \ B Differenz der Ereignisse, d.h. E tritt genau dann ein, wenn A eintritt und B nicht eintritt. Die Differenz ist nicht kommutativ, d.h. A \ B 6= B \ A. A = Ω \ A komplementäres Ereignis (Gegenereignis), d.h. A tritt genau dann ein, wenn A nicht eintritt. Es gilt: A ∪ A = Ω , A ∩ A = ∅ , (A) = A , A∪B =A∩B , A∩B =A∪B , A\B =A∩B , (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) , (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) . Zwei Ereignisse A und B heißen disjunkt (unvereinbar), wenn sie nicht gleichzeitig eintreten können, d.h. A ∩ B = ∅. Das Mengensystem F heißt Ereignisfeld zum Grundraum Ω, wenn gilt: 1. Ω ∈ F . 2. Wenn A ∈ F =⇒ A ∈ F . ∞ S Ai ∈ F) . 3. Wenn A, B ∈ F =⇒ A ∪ B ∈ F . (Wenn A1 , A2 , ... ∈ F =⇒ i=1 1. Klassische Definition der Wahrscheinlichkeit (Laplace): Voraussetzungen Laplace-Prinzip: • Endlicher Grundraum Ω = {ω1 , ..., ωn } bestehend aus n möglichen Versuchsausgängen und • alle Versuchsausgänge sind gleichberechtigt hinsichtlich der Chance ihres Eintretens bei Durchführung des Zufallsexperimentes. 11 Dann gilt für k ≤ n und A = {ωi1 , ..., ωik } ⊆ Ω P (A) = k Anzahl günstiger Fälle für das Eintreten von A = n Anzahl aller möglichen Fälle Damit gilt für die Elementarereignisse: P ({ω1 }) = ... = P ({ωn }) = 1 n . . Anwendung: Urnenmodell Aus einer Urne mit N Kugeln, wobei M der Kugeln weiß und N −M schwarz sind, werden n Kugeln ohne Zurücklegen gezogen, M ≤ N , n ≤ N . Es sei Ak das zufällige Ereignis, daß genau k weiße Kugeln gezogen werden, k ≤ n und k ≤ M . Dann gilt: P (Ak ) = M k N −M · n−k N n . 2. Statistische Definition der Wahrscheinlichkeit (von Mises): n m hn (A) = m n – Anzahl der Durchführungen eines Zufallsexperimentes, – Anzahl des Eintretens eines zufälligen Ereignisses A, m ≤ n, – relative Häufigkeit für das Eintreten von A. Statistische Wahrscheinlichkeit für A: P (A) = lim hn (A) n→∞ . 3. Axiomatische Definition der Wahrscheinlichkeit (Kolmogorov): Für einen Grundraum Ω mit Ereignisfeld F heißt die Funktion P : F −→ [0, 1], die jedem A ∈ F eine reelle Zahl P (A) zuordnet, Wahrscheinlichkeit (Wahrscheinlichkeitsmaß), wenn gilt: Axiom 1: Axiom 2: Axiom 3: Axiom 3a: 0 ≤ P (A) ≤ 1 für alle A ∈ F . P (Ω) = 1 . Für A, B ∈ F mit A ∩ B = ∅ gilt P (A ∪ B) = P (A) + P (B) (Additivität). Für A1 , A2 , ... ∈ F mit Ai ∩ Aj = ∅ für alle i 6= j gilt P (A1 ∪ A2 ∪ ...) = P (A1 ) + P (A2 ) + ... (σ-Additivität). Das Tripel [Ω, F, P ] heißt Wahrscheinlichkeitsraum. Aus den Axiomen werden weitere Eigenschaften von P abgeleitet: 1. P (∅) = 0 , 2. P (A) = 1 − P (A) für alle A ∈ F , 3. P (A) ≤ P (B) für A, B ∈ F mit A ⊆ B , 4. P (B \ A) = P (B) − P (A ∩ B) für alle A, B ∈ F und P (B \ A) = P (B) − P (A) für A, B ∈ F mit A ⊆ B , 5. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) für alle A, B ∈ F , 6. P (A) = P ({ωi1 }) + ... + P ({ωik }) für A ∈ F mit A = {ωi1 , ..., ωik } 12 Bedingte Wahrscheinlichkeit: Es sei [Ω, F, P ] ein Wahrscheinlichkeitsraum und A, B ∈ F seien zwei zufällige Ereignisse mit P (B) > 0. Dann ist die bedingte Wahrscheinlichkeit des Eintretens von A unter der Bedingung B gegeben durch P (A|B) = P (A ∩ B) P (B) . Multiplikationssatz: Für zwei Ereignisse A, B gilt: P (A ∩ B) = P (A|B) · P (B) = P (B|A) · P (A) . Für n Ereignisse A1 , ..., An gilt: P (A1 ∩ ... ∩ An ) = P (A1 ) · P (A2 |A1 ) · P (A3 |A1 ∩ A2 ) · ... · P (An |A1 ∩ ...An−1 ) . Unabhängigkeit von zufälligen Ereignissen: Zwei Ereignisse A, B heißen stochastisch unabhängig, wenn gilt P (A ∩ B) = P (A) · P (B) . Die Ereignisse A1 , ..., An heißen vollständig unabhängig, wenn für jede Teilmenge bestehend aus k Ereignissen Ai1 , ...Aik , 2 ≤ k ≤ n, i1 , ..., ik ∈ {1, ..., n} gilt . P (Ai1 ∩ ... ∩ Aik ) = P (Ai1 ) · ... · P (Aik ) Formel der totalen Wahrscheinlichkeit: Es sei A1 , ..., An ein vollständiges System zufälliger Ereignisse, d.h. A1 ∪ ... ∪ An = Ω, Ai ∩ Aj = ∅ für alle i, j ∈ {1, ..., n} mit i 6= j und P (Ai ) > 0 für alle i = 1, ..., n. Dann gilt für das Ereignis B ∈ F P (B) = P (B|A1 ) · P (A1 ) + ... + P (B|An ) · P (An ) . Formel von Bayes: Unter obigen Voraussetzungen gilt für B ∈ F mit P (B) > 0 und für i = 1, ..., n P (Ai |B) = 2.2 P (B|Ai ) · P (Ai ) P (B|Ai ) · P (Ai ) = Pn P (B) k=1 P (B|Ak ) · P (Ak ) . Zufallsgrößen und ihre Verteilungen Zufallsgröße: Eine Zufallsgröße X : Ω −→ R ist eine Funktion, die jedem Versuchsausgang ω ∈ Ω eine reelle Zahl X(ω) zuordnet. (Außerdem muß für alle t ∈ R gelten X −1 ((−∞, t]) ∈ F.) Verteilungsfunktion: Für eine Zufallsgröße X heißt die Funktion FX : R −→ [0, 1] mit FX (x) = P (X ≤ x) Verteilungsfunktion der Zufallsgröße X. 13 Die Verteilungsfunktion FX hat folgende Eigenschaften: • lim FX (x) = 0 , x→−∞ lim FX (x) = 1 . x→∞ • FX ist monoton wachsend. • FX ist rechtsseitig stetig. Umgekehrt ist jede Funktion mit diesen Eigenschaften Verteilungsfunktion einer Zufallsgröße. 2.2.1 Diskrete Zufallsgrößen Eine Zufallsgröße X heißt diskret, wenn X endlich viele Realisierungen x1 , ..., xn oder abzählbar unendlich viele Realisierungen x1 , x2 , ... hat. Verteilung von X: P (X = x1 ) = p1 , ... , P (X = xn ) = pn mit p1 + ... + pn = 1 bzw. P (X = x1 ) = p1 , P (X = x2 ) = p2 , .... mit p1 + p2 + ... = 1 Verteilungsfunktion von X: FX (x) = P (X ≤ x) = X pk k:xk ≤x Die Verteilungsfunktion einer diskreten Zufallsgröße ist eine Treppenfunktion mit Sprungstellen x1 , x2 , ... und Sprunghöhe pk an Sprungstelle xk für k = 1, ..., n bzw. k = 1, 2, ... Erwartungswert EX von X: EX = n X k=1 xk · P (X = xk ) = (EX existiert, wenn ∞ X k=1 n X k=1 xk · pk bzw. EX = ∞ X k=1 xk · P (X = xk ) = ∞ X k=1 xk · p k |xk | · pk < ∞.) Varianz (Streuung) Var(X) von X: Var(X) = E(X − EX)2 = n X k=1 (xk − EX)2 · P (X = xk ) = Andere Berechnungsvorschrift: Var(X) = n X k=1 n X (xk − EX)2 · pk k=1 x2k · pk − (EX)2 . Analoge Formeln, wenn X abzählbar unendlich viele Werte annehmen kann. p Standardabweichung: Var(X) 2.2.2 Stetige Zufallsgrößen Eine Zufallsgröße X heißt stetig, falls sich die Verteilungsfunktion FX schreiben läßt als: FX (x) = Zx fX (t)dt −∞ wobei fX eine reellwertige nichtnegative Funktion ist. Man nennt dann fX Dichte der Zufallsgröße X. 14 , Die Dichte fX hat folgende Eigenschaften: Z∞ fX (t)dt = 1 • −∞ • FX′ (x) = fX (x) für alle Stetigkeitsstellen x von FX . • Für x1 < x2 gilt: P (x1 < X ≤ x2 ) = P (X ≤ x2 ) − P (X ≤ x1 ) = FX (x2 ) − FX (x1 ) = Erwartungswert EX von X: EX = Z∞ Zx2 fX (t)dt x1 x · fX (x)dx −∞ Varianz Var(X) von X: Var(X) = Z∞ (x − EX)2 · fX (x)dx −∞ (Erwartungswert und Varianz existieren, falls Z∞ |x| · fX (x)dx < ∞.) −∞ Standardabweichung: p Var(X) Quantile xq von X: Für eine stetige Zufallsgröße X mit Verteilungsfunktion FX und Dichte fX und für q mit 0 < q < 1 heißt die reelle Zahl xq Quantil der Ordnung q (q-Quantil), wenn gilt: FX (xq ) = P (X ≤ xq ) = Zxq fX (t)dt = q . −∞ Für q = 0.5 heißt das 0.5-Quantil x0.5 Median von X. Eigenschaften von Erwartungswert und Varianz diskreter und stetiger Zufallsgrößen: Für zwei Zufallsgrößen X, Y und reelle Zahlen a, b ∈ R gilt: E(aX + b) = aEX + b , Var(aX + b) = a2 Var(X) , E(X + Y ) = EX + EY . Für zwei unabhängige Zufallsgrößen X, Y gilt außerdem: E(X · Y ) = EX · EY , Var(X + Y ) = Var(X) + Var(Y ) . 2.2.3 Spezielle diskrete Zufallsgrößen 1. Diskrete Gleichverteilung auf x1 , ..., xn P (X = x1 ) = ... = P (X = xn ) = Erwartungswert: Varianz: EX = n1 (x1 + ... + xn ) Var(X) = n1 (x21 + ... + x2n ) − 15 1 (x1 n2 1 n + ... + xn )2 2. Hypergeometrische Verteilung Parameter M, N, n ∈ N mit M ≤ N und n ≤ N N −M M · n−k k für k = 0, 1, ..., n P (X = k) = mit k ≤ M und k ≥ n + M − N N n Erwartungswert: Varianz: Schreibweise: EX = n · M N · (1 − Var(X) = n · M N X ∼ H(N ; M ; n) M ) N · (1 − n−1 ) N −1 Modell: Aus einer Urne mit N Kugeln, von denen M weiß und N −M schwarz sind, werden nach dem Laplace-Prinzip n Kugeln entnommen (ohne Zurücklegen). Die Zufallsgröße X, die die Anzahl entnommener weißer Kugeln zählt, ist hypergeometrisch verteilt. 3. Binomialverteilung Parameter n ∈ N und p ∈ [0, 1] P (X = k) = Erwartungswert: Varianz: Schreibweise: n k pk (1 − p)n−k für k = 0, 1, ..., n EX = n · p Var(X) = n · p · (1 − p) X ∼ B(n; p) Modell: Ein zufälliges Ereignis A tritt mit Wahrscheinlichkeit p bei Durchführung eines Zufallsexperiments ein. Dieses Experiment wird n mal unabhängig voneinander unter gleichen Bedingungen durchgeführt. Die Zufallsgröße X, die zählt, wie oft das Ereignis A eintritt, ist binomialverteilt. Dieses Modell entspricht dem Urnenmodell und Ziehen von Kugeln mit Zurücklegen. Zusammenhang Binomialverteilung - hypergeometrische Verteilung: −M und n ≤ N 10 kann man die Binomialverteilung mit p = Für n ≤ M 10 die hypergeometrische Verteilung verwenden. M N als Näherung für 4. Poisson-Verteilung Parameter λ > 0 P (X = k) = Erwartungswert: Varianz: Schreibweise: λk −λ ·e k! für k = 0, 1, ... EX = λ Var(X) = λ X ∼ Π(λ) Anwendung: Man betrachtet Ereignisse, die unabhängig voneinander eintreten, z.B Telefonanrufe in einer Zentrale, zerfallende Atomkerne einer radioaktiven Substanz, Verkehrsunfälle an einer Kreuzung. Im Mittel treten λ solcher Ereignisse in einem Zeitraum ein. Die Zufallsgröße X, die die Anzahl eintretender Ereignisse zählt, ist poisson-verteilt. Zusammenhang Binomialverteilung - Poissonverteilung: Für großes n und kleines p (Faustregel: n ≥ 100, n·p ≤ 9) kann man die Poisson-Verteilung mit Parameter λ = n · p als Näherung für die Binomialverteilung verwenden. 16 5. Geometrische Verteilung Parameter p ∈ (0, 1) P (X = k) = (1 − p)k−1 · p für k = 1, 2, ... 1 p Erwartungswert: EX = Varianz: Var(X) = 1−p p2 Modell: Ein zufälliges Ereignis A tritt mit Wahrscheinlichkeit p bei Durchführung eines Zufallsexperiments ein. Die Zufallsgröße X, die die Versuche bis zum ersten Eintreten von A zählt, ist geometrisch verteilt. 2.2.4 Spezielle stetige Zufallsgrößen 1. Stetige Gleichverteilung im Intervall [a, b] x < a oder b ≤ x 0 Dichte fX (x): fX (x) = 1 a≤x<b b−a 0 x<a x−a Verteilungsfunktion FX (x): FX (x) = a≤x<b a b− 1 b≤x a+b 2 Erwartungswert: EX = Varianz: Var(X) = (b−a)2 12 2. Normalverteilung Parameter µ ∈ R und σ > 0 Dichte fX (x): Erwartungswert: Varianz: Schreibweise: (x−µ)2 1 fX (x) = √ · e− 2σ2 σ 2π EX = µ Var(X) = σ 2 Standardabweichung: σ X ∼ N (µ, σ) oder X ∼ N (µ, σ 2 ) Die zugehörige Verteilungsfunktion FX (x) = Φµ,σ2 (x) kann nicht explizit angegeben werden. Wichtiger Spezialfall: µ = 0 und σ 2 = 1. N (0, 1) heißt Standardnormalverteilung. Die Verteilungsfunktion Φ0,1 der Standardnormalverteilung ist in tabellarischer Form gegeben (siehe Kapitel 4). x−µ Φµ,σ2 (x) = Φ0,1 . Es gilt folgender Zusammenhang: σ Für die Standardnormalverteilung gilt: Φ0,1 (−x) = 1 − Φ0,1 (x) für alle x ∈ R . 17 Berechnung von Wahrscheinlichkeiten für X ∼ N (µ, σ 2 ): • P (X ≤ x) = Φµ,σ2 (x) = Φ0,1 ( x−µ ) σ ) = Φ0,1 ( µ−x ) • P (X ≥ x) = 1 − P (X ≤ x) = 1 − Φµ,σ2 (x) = 1 − Φ0,1 ( x−µ σ σ • P (a ≤ X ≤ b) = P (X ≤ b) − P (X ≤ a) = = Φµ,σ2 (b) − Φµ,σ2 (a) = Φ0,1 ( b−µ ) − Φ0,1 ( a−µ ) σ σ Anwendung: Eine Zufallsgröße X, die z.B. zufällige Meß- und Beobachtungsfehler oder zufällige Größen-, Längen-, Gewichtsangaben oder zufällige Abweichungen von einem Sollwert beschreibt, ist normalverteilt. 3. Exponentialverteilung Parameter a > 0 fX (x) = Dichte fX (x): Verteilungsfunktion FX (x): Erwartungswert: Varianz: Schreibweise: 0 ae−ax x≤0 x>0 FX (x) = 0 1 − e−ax x≤0 x>0 EX = a1 Var(X) = a12 X ∼ exp(a) Anwendung: Eine Zufallsgröße X, die z.B. die Lebensdauer von Bauelementen oder die Bedienzeit von Kunden oder Reparaturzeiten oder Zerfallszeiten radioaktiver Substanzen beschreibt, ist exponentialverteilt. 18 3 Induktive Statistik 3.1 Parameterschätzungen Mathematische Stichprobe: (X1 , ...Xn ) unabhängig identisch verteilte Zufallsgrößen Konkrete Stichprobe: (x1 , ..., xn ) ∈ Rn Realisierungen der Zufallsgrößen Schätzfunktion: (oder Stichprobenfunktion) T (X1 , ..., Xn ) (T (X1 , ..., Xn ) ist eine neue Zufallsgröße mit Wert T (x1 , ..., xn ) bei konkreter Stichprobe (x1 , ..., xn ).) 3.1.1 Punktschätzungen Ziel: Schätzung eines unbekannten Parameters ϑ der Verteilung von X1 , ..., Xn durch eine geeignete Stichprobenfunktion T (X1 , ..., Xn ), die gewissen Gütekriterien (siehe Vorlesung, Literatur) genügt. Spezielle Punktschätzer: n • Schätzung für den Erwartungswert der X1 , ..., Xn : 1X X= Xi n i=1 n • Schätzung für die Varianz der X1 , ..., Xn : S2 = 1 X (Xi − X)2 n − 1 i=1 • Für Xi 0-1-verteilt, d.h. P (Xi = 1) = p und P (Xi = 0) = 1 − p für i = 1, ..., n n 1X Schätzung für die Wahrscheinlichkeit p von Xi : Xi P̂ = n i=1 Berechnung des konkreten Schätzwertes x, s2 , p̂ durch Einsetzen der Werte x1 , ..., xn der konkreten Stichprobe in die jeweilige Schätzfunktion X, S 2 , P̂ . 3.1.2 Intervallschätzungen Ziel: Bestimmen von Zufallsgrößen Gu (X1 , ..., Xn ) und Go (X1 , ..., Xn ), so daß für den unbekannten Parameter ϑ gilt: P (Gu (X1 , ..., Xn ) ≤ ϑ ≤ Go (X1 , ..., Xn )) = 1 − α , 0 < α < 1 . Dann heißt: [Gu ; Go ] – 1−α – α – zweiseitiges Konfidenzintervall Konfidenzniveau Irrtumswahrscheinlichkeit Mit einer Wahrscheinlichkeit von 1 − α überdeckt das Konfidenzintervall [Gu ; Go ] den unbekannten Parameter ϑ. 19 Einseitige Konfidenzintervalle: (−∞ ; Go ) mit P (ϑ ≤ Go (X1 , ..., Xn )) = 1 − α bzw. (Gu ; ∞) mit P (ϑ ≥ Gu (X1 , ..., Xn )) = 1 − α Spezielle zweiseitige Konfidenzintervalle: für Stichprobenumfang n und Konfidenzniveau 1 − α • Konfidenzintervall für den Erwartungswert µ einer Normalverteilung bei bekannter Varianz σ 2 : X −z 1− α 2 σ σ · √ ; X + z1− α2 · √ n n Dabei ist z1− α2 das (1 − α2 )-Quantil der Standardnormalverteilung (siehe Kapitel 4) und n P X = n1 Xi . i=1 • Konfidenzintervall für den Erwartungswert µ einer Normalverteilung bei unbekannter Varianz σ 2 : X − tn−1,1− α2 S S · √ ; X + tn−1,1− α2 · √ n n Dabei ist tn−1,1− α2 das (1 − α2 )-Quantil der t-Verteilung mit n − 1 Freiheitsgraden (siehe n n P P 1 Xi und S 2 = n−1 (Xi − X)2 . Kapitel 4) und X = n1 i=1 i=1 • Asymptotisches Konfidenzintervall für die Wahrscheinlichkeit p einer 0-1-Verteilung (d.h. P (X = 1) = p, P (X = 0) = 1 − p): P̂ − z1− α · 2 s P̂ (1 − P̂ ) ; P̂ + z1− α2 · n s P̂ (1 − P̂ ) n Voraussetzung: np̂(1 − p̂) > 9 Dabei ist z1− α2 das (1 − α2 )-Quantil der Standardnormalverteilung (siehe Kapitel 4) und n P P̂ = n1 Xi . i=1 3.2 3.2.1 Parametertests Schritte zur Durchführung eines Parametertests für einen unbekannten Parameter ϑ 1. Aufstellen der Nullhypothese H0 mit ϑ0 ∈ R Zweiseitiger Test: H0 : ϑ = ϑ0 Alternativhypothese H1 : ϑ 6= ϑ0 Einseitiger Test: H0 : ϑ ≤ ϑ0 bzw. H0 : ϑ ≥ ϑ0 Alternativhypothese H1 : ϑ > ϑ0 bzw. ϑ < ϑ0 20 2. Wählen des Signifikanzniveaus 1 − α (α ∈ (0, 1) – Irrtumswahrscheinlichkeit, Wahrscheinlichkeit für das Ablehnen der Nullhypothese H0 , obwohl H0 wahr ist) 3. Auswahl einer geeigneten Testgröße T (X1 , ..., Xn ) (Stichprobenfunktion) für den unbekannten Parameter ϑ, deren Verteilung unter H0 bekannt ist. 4. Bestimmen von cu , co (in Abhängigkeit von α) mit P (cu ≤ T ≤ co )H0 = 1 − α (zweiseitiger Test) und damit Festlegung vom kritischen Bereich K = (−∞, cu ) ∪ (co , ∞) Einseitiger Test: c mit P (T ≤ c)H0 = 1 − α bzw. P (T ≥ c)H0 = 1 − α und kritischer Bereich K = (c, ∞) bzw. K = (−∞, c) 5. Berechnung des Wertes der Testgröße T (x1 , ..., xn ) = t̂ ∈ R aus der konkreten Stichprobe. Testentscheidung: t̂ ∈ K =⇒ H0 wird abgelehnt. t̂ 6∈ K =⇒ gegen H0 ist auf Grund dieser Stichprobe nichts einzuwenden. Fehlerquellen: Fehler 1. Art - Nullhypothese H0 wird abgelehnt, obwohl sie wahr ist. Fehler 2. Art - Nullhypothese H0 wird nicht abgelehnt, obwohl sie falsch ist. 3.2.2 Spezielle Parametertests: • Test für den unbekannten Erwartungswert µ einer normalverteilten Zufallsgröße bei bekannter Varianz σ 2 (Gauß-Test) Nullhypothese Alternativhypothese Testgröße H0 : µ = µ0 H1 : µ 6= µ0 T = √ H0 : µ ≥ µ0 H 1 : µ < µ0 T = √ H0 : µ ≤ µ0 H 1 : µ > µ0 T = √ Kritischer Bereich n· X−µ0 σ K = (−∞; −z1− α2 ) ∪ (z1− α2 ; ∞) n· X−µ0 σ K = (−∞; −z1−α ) n· X−µ0 σ K = (z1−α ; ∞) 21 • Test für den unbekannten Erwartungswert µ einer normalverteilten Zufallsgröße bei unbekannter Varianz σ 2 (einfacher t-Test) Nullhypothese Alternativhypothese Testgröße H0 : µ = µ0 H1 : µ 6= µ0 T = √ H0 : µ ≥ µ0 H 1 : µ < µ0 T = √ H0 : µ ≤ µ0 H 1 : µ > µ0 T = √ Kritischer Bereich n· X−µ0 s K = (−∞; −tn−1,1− α2 ) ∪ (tn−1,1− α2 ; ∞) n· X−µ0 s K = (−∞; −tn−1,1−α ) n· X−µ0 s K = (tn−1,1−α ; ∞) • Test für die unbekannte Wahrscheinlichkeit p einer 0-1-Verteilung (Voraussetzung : np0 (1 − p0 ) > 9) Nullhypothese Alternativ- Testgröße hypothese Kritischer Bereich H0 : p = p0 H1 : p 6= p0 T = q n p0 (1−p0 ) · (P̂ − p0 ) K = (−∞; −z1− α2 ) ∪ (z1− α2 ; ∞) H0 : p ≥ p0 H1 : p < p0 T = q n p0 (1−p0 ) · (P̂ − p0 ) K = (−∞; −z1−α ) H0 : p ≤ p0 H1 : p > p0 T = q n p0 (1−p0 ) · (P̂ − p0 ) K = (z1−α ; ∞) 22 4 Tabellen 4.1 Verteilungsfunktion der Standardnormalverteilung 1 Φ0,1 (x) = P (X ≤ x) = √ 2π Zx t2 e− 2 dt −∞ Hinweise: Für x < 0 ist Φ0,1 (x) = 1 − Φ0,1 (−x) zu verwenden. Für x > 3, 9 ist Φ0,1 (x) = 1 zu setzen. x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,1 0,2 0,3 0,4 0,50000 0,53983 0,57926 0,61791 0,65542 0,50399 0,54380 0,58317 0,62172 0,65910 0,50798 0,54776 0,58706 0,62552 0,66276 0,51197 0,55172 0,59095 0,62930 0,66640 0,51595 0,55567 0,59483 0,63307 0,67003 0,51994 0,55962 0,59871 0,63683 0,67364 0,52392 0,56356 0,60257 0,64058 0,67724 0,52790 0,56749 0,60642 0,64431 0,68082 0,53188 0,57142 0,61026 0,64803 0,68439 0,53586 0,57535 0,61409 0,65173 0,68793 0,5 0,6 0,7 0,8 0,9 0,69146 0,72575 0,75804 0,78814 0,81594 0,69497 0,72907 0,76115 0,79103 0,81859 0,69847 0,73237 0,76424 0,79389 0,82121 0,70194 0,73565 0,76730 0,79673 0,82381 0,70540 0,73891 0,77035 0,79955 0,82639 0,70884 0,74215 0,77337 0,80234 0,82894 0,71226 0,74537 0,77637 0,80511 0,83147 0,71566 0,74857 0,77935 0,80785 0,83398 0,71904 0,75175 0,78230 0,81057 0,83646 0,72240 0,75490 0,78524 0,81327 0,83891 1,0 1,1 1,2 1,3 1,4 0,84134 0,86433 0,88493 0,90320 0,91924 0,84375 0,86650 0,88686 0,90490 0,92073 0,84614 0,86864 0,88877 0,90658 0,92220 0,84849 0,87076 0,89065 0,90824 0,92364 0,85083 0,87286 0,89251 0,90988 0,92507 0,85314 0,87493 0,89435 0,91149 0,92647 0,85543 0,87698 0,89617 0,91308 0,92785 0,85769 0,87900 0,89796 0,91466 0,92922 0,85993 0,88100 0,89973 0,91621 0,93056 0,86214 0,88298 0,90147 0,91774 0,93189 1,5 1,6 1,7 1,8 1,9 0,93319 0,94520 0,95543 0,96407 0,97128 0,93448 0,94630 0,95637 0,96485 0,97193 0,93574 0,94738 0,95728 0,96562 0,97257 0,93699 0,94845 0,95818 0,96638 0,97320 0,93822 0,94950 0,95907 0,96712 0,97381 0,93943 0,95053 0,95994 0,96784 0,97441 0,94062 0,95154 0,96080 0,96856 0,97500 0,94179 0,95254 0,96164 0,96926 0,97558 0,94295 0,95352 0,96246 0,96995 0,97615 0,94408 0,95449 0,96327 0,97062 0,97670 2,0 2,1 2,2 2,3 2,4 0,97725 0,98214 0,98610 0,98928 0,99180 0,97778 0,98257 0,98645 0,98956 0,99202 0,97831 0,98300 0,98679 0,98983 0,99224 0,97882 0,98341 0,98713 0,99010 0,99245 0,97932 0,98382 0,98745 0,99036 0,99266 0,97982 0,98422 0,98778 0,99061 0,99286 0,98030 0,98461 0,98809 0,99086 0,99305 0,98077 0,98500 0,98840 0,99111 0,99324 0,98124 0,98537 0,98870 0,99134 0,99343 0,98169 0,98574 0,98899 0,99158 0,99361 2,5 2,6 2,7 2,8 2,9 0,99379 0,99534 0,99653 0,99744 0,99813 0,99396 0,99547 0,99664 0,99752 0,99819 0,99413 0,99560 0,99674 0,99760 0,99825 0,99430 0,99573 0,99683 0,99767 0,99831 0,99446 0,99585 0,99693 0,99774 0,99836 0,99461 0,99598 0,99702 0,99781 0,99841 0,99477 0,99609 0,99711 0,99788 0,99846 0,99492 0,99621 0,99720 0,99795 0,99851 0,99506 0,99632 0,99728 0,99801 0,99856 0,99520 0,99643 0,99736 0,99807 0,99861 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0,99865 0,99903 0,99931 0,99952 0,99966 0,99977 0,99984 0,99989 0,99993 0,99995 23 4.2 Quantile zq der Standardnormalverteilung Hinweis: Für q < 0, 5 ist zq = −z1−q zu verwenden. q zq q zq q zq 0,5 0,55 0,6 0,65 0,7 0 0,125661 0,253347 0,385320 0,524401 0,91 0,92 0,93 0,94 0,95 1,340755 1,405072 1,475791 1,554774 1,644854 0,975 0,98 0,985 0,99 0,995 1,959964 2,053749 2,170090 2,326348 2,575829 0,75 0,8 0,85 0,9 0,674490 0,841621 1,036433 1,281552 0,955 0,96 0,965 0,97 1,695398 1,750686 1,811911 1,880794 0,999 0,9995 0,9999 3,090232 3,290527 3,719016 4.3 Quantile tn,q der t-Verteilung (n - Zahl der Freiheitsgrade) n q = 0, 9 q = 0, 95 q = 0, 975 q = 0, 99 q = 0, 995 q = 0, 999 q = 0, 9995 1 2 3 4 5 6 7 8 9 3,08 1,89 1,64 1,53 1,48 1,44 1,41 1,40 1,38 6,31 2,92 2,35 2,13 2,02 1,94 1,89 1,86 1,83 12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 31,82 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 318,31 22,33 10,21 7,17 5,89 5,21 4,79 4,50 4,30 636,62 31,60 12,92 8,61 6,87 5,96 5,41 5,04 4,78 10 11 12 13 14 15 16 17 18 19 1,37 1,36 1,36 1,35 1,35 1,34 1,34 1,33 1,33 1,33 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 2,23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,76 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 3,17 3,11 3,05 3,01 2,98 2,95 2,92 2,90 2,88 2,86 4,14 4,02 3,93 3,85 3,79 3,73 3,69 3,65 3,61 3,58 4,59 4,44 4,32 4,22 4,14 4,07 4,01 3,97 3,92 3,88 20 21 22 23 24 25 26 27 28 29 1,33 1,32 1,32 1,32 1,32 1,32 1,31 1,31 1,31 1,31 1,72 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,70 2,09 2,08 2,07 2,07 2,06 2,06 2,06 2,05 2,05 2,05 2,53 2,52 2,51 2,50 2,49 2,49 2,48 2,47 2,47 2,46 2,85 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 3,55 3,53 3,50 3,48 3,47 3,45 3,43 3,42 3,41 3,40 3,85 3,82 3,79 3,77 3,75 3,73 3,71 3,69 3,67 3,66 30 40 50 100 500 1000 10000 1,31 1,30 1,30 1,29 1,28 1,28 1,28 1,70 1,68 1,68 1,66 1,65 1,65 1,65 2,04 2,02 2,01 1,98 1,96 1,96 1,96 2,46 2,42 2,40 2,36 2,33 2,33 2,33 2,75 2,70 2,68 2,63 2,59 2,58 2,58 3,39 3,31 3,26 3,17 3,11 3,10 3,09 3,65 3,55 3,50 3,39 3,31 3,30 3,29 24