Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Kombinatorik Satz: Eine Anordnung von n Elementen heißt Permutation. Die Anzahl der Permutationen von n Satz: verschiedenen Elementen ist n! d.h.: Bei einer Gesamtheit von n verschiedenen Elementen gibt es n! Anordnungsmöglichkeiten in einer Reihe. Die Anzahl der Permutationen von n Elementen, von denen jeweils n1, …, nk Elemente ununterscheidbar sind, ist n! n1!⋅n 2 !⋅....n k ! Satz: Die Anzahl der Variationen von n Elementen zur k-ten Klasse mit Wiederholung bzw. Satz: Zurücklegen ist n d.h.: Einer Gesamtheit von n Elementen kann man nk geordnete Stichproben mit Wiederholung bzw. Zurücklegen vom Umfang k entnehmen. Es sei k ≤ n. Die Anzahl der Variationen von n Elementen zur k-ten Klasse ohne k Wiederholung bzw. Zurücklegen ist n! (n − k )! n! geordnete ( n − k )! d.h.: Einer Gesamtheit von n verschiedenen Elementen kann man Satz: Stichproben ohne Wiederholung bzw. Zurücklegen vom Umfang k entnehmen. Es sei k ≤ n. Die Anzahl der Kombinationen von n Elementen zur k-ten Klasse ohne Wiederholung bzw. ohne Zurücklegen ist (sprich: „n über k“). n n! Diese Formel heißt auch Binomialkoeffizient. = k k!(n − k )! n n! d.h.: Einer Gesamtheit von n verschiedenen Elementen kann man = k k!( n − k )! ungeordnete Stichproben ohne Wiederholung bzw. Zurücklegen vom Umfang k entnehmen. Wahrscheinlichkeitsrechnung Klassische Definition der Wahrscheinlichkeit: P( A) = Anzahl der für A günstigen Fälle Anzahl aller gleichmöglichen Fälle Additionssatz der Wahrscheinlichkeitsrechnung: Die Wahrscheinlichkeit der Vereinigung von mehreren Ereignissen, die einander gegenseitig ausschließen, d.h. die unabhängig sind, ist die Summe der Einzelwahrscheinlichkeiten. A∪B Menge alle Ereignisse, die zu A oder B gehören. Durchschnitt zweier Ereignisse: Die Wahrscheinlichkeit des Durchschnitts von mehreren Ereignissen, die sich gegenseitig ausschließen, d.h. die unabhängig sind, ist gleich dem Produkt der Einzelwahrscheinlichkeiten. A∩B Menge aller Ereignisse, die zu A und zu B gehören. P(A∩B)=P(A)*P(B) Additionssatz der Wahrscheinlichkeitsrechnung, wenn sich die Ereignisse nicht gegenseitig ausschließen, d.h. bei abhängigen Ereignissen: P(A∪B)=P(A)+ P(B) – P(A∩B), A∩B≠∅ (leere Menge) Die Elemente in der Schnittmenge dürfen nicht doppelt erfasst werden. P(„gerade“ oder „größer gleich 3“)= 1 2 1 5 + − = 2 3 3 6 Komplementärereignis: Ein zum Ereignis A komplementäres Ereignis P( A )=1-P(A) A tritt genau dann ein, wenn A nicht eintritt. Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Zufallsvariablen Analogie zwischen der Zufallsvariablen X und dem Merkmal/Variable X aus der deskriptiven Statistik : Zufallsvariable X Merkmal X Realisation x Merkmalsausprägung/Merkmalswert x Wahrscheinlichkeit Relative Häufigkeit Wahrscheinlichkeitsfunktion bei diskreten ZV bzw. Relative Häufigkeitsverteilung Dichtefunktion bei stetigen ZV Verteilungsfunktion Kumulierte relative Häufigkeitsverteilung Erwartungswert Arithmetisches Mittel Varianz Varianz Diskrete und stetige ZV Wahrscheinlichkeitsfunktion (GENAU-Aussagen): P(X=xi)=f(xi) und wenn es n verschiedene n Realisationen für die ZV gibt, gilt: ∑ f (x ) = 1 i i =1 Verteilungsfunktion (HÖCHSTENS-Aussagen) F(x)=P(X≤x) Es gilt: F(x)= ∑ f ( x ) = ∑ P( X = x ) i xi ≤ x i xi ≤ x Die Wahrscheinlichkeitsfunktion einer stetigen ZV heißt Dichtefunktion Eigenschaften der Dichtefunktion: ∞ f(x)≥0 und ∫ b f ( x )dx = 1 , P( a ≤ X ≤ b) = ∫ f ( x )dx , −∞ a Die Wahrscheinlichkeit, dass bei einer stetigen ZV ein ganz spezieller Wert angenommen wird, ist 0, P(X=x)=0. Eigenschaften der Verteilungsfunktion: Die Ableitung der Verteilungsfunktion ist die Dichtefunktion, F ' ( x ) = f ( x ) . Das Integral (Aufleitung) der Dichtefunktion ist die Verteilungsfunktion, x F ( x ) = P( X ≤ x ) = ∫ f (v)dv −∞ 0≤F(x)≤1 P( X ≤ a ) = F ( a ) und P( X ≤ b ) = F (b ) und P(a≤X≤b) Erwartungswert E(X) oder µ: =P(X≤b)- P(X≤a)=F(b)-F(a) n E ( X ) = µ = ∑ xi f ( xi ) für diskrete ZV. i =1 ∞ E( X ) = µ = ∫ x ⋅ f ( x )dx für stetige ZV. −∞ Varianz σ2 n Var ( X ) = σ 2 = ∑ [ xi − E ( X )]2 f ( xi ) für diskrete ZV i =1 ∞ Var ( X ) = σ 2 = ∫x 2 ⋅ f ( x )dx − [ E ( X )]2 für stetige ZV. −∞ Binomialverteilung Die Wahrscheinlichkeit, dass ein Ereignis bei einem einmaligen Versuch mit der Wahrscheinlichkeit p auftritt und bei n Versuchen k-mal auftritt ist: mit 1-p n P( X = k ) = f ( k ) = B( k | n; p ) = p k (1 − p ) n − k k p = Eintrittswahrscheinlichkeit des Ereignisses A = Eintrittswahrscheinlichkeit des Ereignisses A Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik n = Anzahl der durchgeführten Experimente. n n! = , k k ! ( n − k )! Die Verteilungsfunktion gibt die Wahrscheinlichkeit dafür an, dass bei n Versuchen höchstens k Ereignisse auftreten. P( X ≤ k ) = F ( k ) Die funktionale Form der Verteilungsfunktion wird hier nicht genauer angegeben, da sie im Weiteren für die Berechnungen nicht benötigt wird. Der Erwartungswert und Varianz einer binomialverteilten Zufallsvariable sind: E ( X ) = n ⋅ p Var ( X ) = n ⋅ p ⋅ (1 − p ) Hypergeometrische Verteilung ohne Zurücklegen. Eine vorgegebene Menge umfasst N Elemente. Davon besitzen M Element die Eigenschaft A; Von den N Elemente werden n ohne Zurücklegen entnommen, Die der hypergeometrische Verteilung kann durch die Binomialverteilung B(n;p) mit p= approximiert werden. Approximationsbedingungen n < 0,05 klein und N Auswahlsatz bzw. Entnahmesatz Anteile M zwischen 0,1 und 0,9, d.h. keine extremen Wahrscheinlichkeiten. N Poisson-Verteilung „Gesetz der kleinen Zahlen“ bzw. „Verteilung der seltenen Ereignisse“ Die Poisson-Verteilung kann durch die Binomialverteilung approximiert werden. Approximationsbedingungen: n ≥ 30 und p ≤ 0,1 oder p ≥ 0,9 Gleichverteilung Der Erwartungswert und die Varianz der Gleichverteilung sind: E( X ) = a+b 2 und Var ( X ) = (b − a ) 2 12 2 Normalverteilung N(µ;σ ) Die Dichtefunktion der Normalverteilung ist f N ( x | µ;σ ) = 1 σ ⋅ 2π e x−µ − σ 2 für − ∞ < x < ∞ mit µ dem Erwartungswert und σ die Standardabweichung der Normalverteilung. Der Erwartungswert und die Varianz der Normalverteilung ist E ( X ) = µ und Var ( X ) = σ 2 Die Verteilungsfunktion der Normalverteilung ist FN ( x0 | µ ;σ ) = 1 σ ⋅ 2π x0 ∫ −∞ e 1 x−µ − 2 σ 2 dx M N Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Wenn eine Zufallsvariable X normalverteilt mit Erwartungswert µ und Varianz σ2 ist, X~N(µ,σ2),dann ist die Zufallsvariable Z= X −µ σ ~ N(0,1) standardnormalverteilt Der Erwartungswert und die Varianz der Standardnormalverteilung ist: E ( Z ) = 0 und Var ( Z ) = 1 Wichtige Eigenschaften der Standardnormalverteilung: Zwischen den 1-σ σ-Grenzen liegt 68,27% der Fläche bzw. der Wahrscheinlichkeit. Zwischen den 2-σ σ-Grenzen liegt 95,45% der Fläche bzw. der Wahrscheinlichkeit. Zwischen den 3-σ σ-Grenzen liegt 99,73% der Fläche bzw. der Wahrscheinlichkeit. Symmetrie: FN(-z)=1-FN(z) Wahrscheinlichkeit im Intervall: P(-z≤Z≤z)=2⋅ FN(z)-1 Das z 0,975 -Quantil der Standardnormalverteilung ist 1,96. Das z 0,995 -Quantil der Standardnormalverteilung ist 2,575. Approximation der Binomialverteilung durch die Normalverteilung n ⋅ p ⋅ (1 − p ) ≥ 9 oder n ≥ 30 0,1 < p < 0,9 Zentraler Grenzwertsatz: Sind die Zufallsvariablen X1, X2, ..., Xn unabhängig und identisch verteilt mit E(Xi)=µ und Var(Xi)=σ2, dann ist 1 n σ2 X normalverteilt mit E ( X ) = µ und Var ( X ) = ∑ i n i =1 n Das gilt für n ≥ 30 . die ZV X = Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik Kleines Symbolverzeichnis für Parameter der Grundgesamtheit und der Stichprobe: Parameter in der Grundgesamtheit Mittelwert, Erwartungswert Stichprobenmittel ∞ µ= Parameter in der Stichprobe ∫ x ⋅ f ( x)dx x= −∞ 1 n ∑ xi n i=1 N µ = ∑ xi ⋅ f ( xi ) i =1 Varianz σ2 = 1 N N ∑(x − µ )2 i Stichprobenvarianz s2 = i =1 1 n ( xi − x ) 2 ∑ i =1 n −1 ∞ σ = ∫ [ x − µ ]2 f ( x )dx 2 −∞ Standardabweichung Stichprobenstandardabweichung σ = σ2 s = s2 s = Anzahl der Elemente Anteilswert Stichprobenumfang N p= Anteilswert M N 1 n ∑ ( xi − x ) 2 n − 1 i =1 n pˆ = m n s Standardfehler des Mittelwertes: s M = n Das Konfidenzintervall für den Erwartungswert µ der Grundgesamtheit errechnet sich bei kleinen Stichproben als : x −t t 1− α das 1 − 2 α 2 1− α ⋅ sM < µ < x + t 2 1− α ⋅ sM 2 -Quantil der Student-t-Verteilung mit n-1 Freiheitsgraden. Das Konfidenzintervall für den Erwartungswert µ der Grundgesamtheit errechnet sich bei großen Stichproben ab n>30 als : x−z 1− α 2 ⋅ sM < µ < x + z 1− α 2 ⋅ sM Prof. Dr. Waike Moos FB Wirtschaft Mit z 1− α das 1 − 2 Formelsammlung Induktive Statistik α 2 s -Quantil der Standardnormalverteilung, s M = der Standardfehler des Mittelwertes. n Falls die Varianz bzw. Standardabweichung σ der Grundgesamtheit bekannt sein sollte, errechnet sich das Konfidenzintervall für den Erwartungswert µ der als : x−z 1− Definition: σ ⋅ α n 2 <µ<x+z 1− σ ⋅ α n 2 Aus einer gegebenen Stichprobe wird ein Konfidenzintervall zum Konfidenzniveau 1-α derart gebildet, dass die Wahrscheinlichkeit, dass diese Konfidenzintervall den wahren, aber unbekannten Parameter µ der Grundgesamtheit überdeckt, (1-α)% beträgt, P( x − z ⋅ σ M ≤ µ ≤ x + z ⋅ σ M ) = 1 − α Das Konfidenzintervall für den Anteilswert ist pˆ − z 1− α ⋅ pˆ ⋅ (1 − pˆ ) 2 falls die Approximationsbedingung gilt: n −1 < p < pˆ + z 1− n ⋅ pˆ ⋅ (1 − pˆ ) > 9 . mit p der wahre Anteil in der Grundgesamtheit p̂ der errechnete Anteil in der Stichprobe z 1− α 2 das 1 − α 2 -Quantil der Standardnormalverteilung. Teststatistik Test auf Mittelwertunterschiede : Degrees of freeedom: DF = x1 − x2 t= s12 s22 + n1 n2 n1 + n 2 − 2 2 Teststatistik Test auf den Erwartungswert: t= x−µ σ n α 2 ⋅ pˆ ⋅ (1 − pˆ ) n −1 Prof. Dr. Waike Moos FB Wirtschaft Formelsammlung Induktive Statistik