Fachbereich Wirtschaft Volkswirtschaftslehre und Statistik : (0421) 5905-4691 Telefax: (0421) 5905-4862 email: [email protected] Internet: http://www.fbw.hs-bremen.de/pschmidt Prof. Dr. Peter Schmidt 5. Auflage 2002 Dies ist die fünfte, überarbeitete, Auflage der Formelsammlung. Trotz aller Bemühungen, den Druckfelerteuffel fernzuhalten, dürften einzelne Stellen Anlass zu konstruktiver Kritik bieten. Für diese bin ich dankbar. This is the first “bilingual” edition. Most of the statistical terms have been translated. The idea was to present the international terms and abbreviations, you may need them when studying abroad - or simply in reading literature in English Language. There may occur (translation-) errors. Please let me know any mistakes, missing topics, comments, … Thank you! Durch die Änderungen im Vergleich zu den vorherigen Auflagen haben sich die Nummerierungen der Formeln teilweise geändert. In der Vorlesung wird nur mit den aktuellen Nummern gearbeitet. Wenn bei Summen kein expliziter Laufindex angegeben ist, läuft die Summe von i=1 bis n. Diese Formelsammlung ist für Prüfungen zugelassen - allerdings nur in der Originalheftung. Es dürfen daher KEINE Erläuterungen, Kommentare, Beispiele usw. hinzugefügt werden. Zusätzliche Formeln (Umformungen) sind zulässig. Anregungen und Hinweise sind sehr willkommen Nachdruck und Vervielfältigung nur mit ausdrücklicher Genehmigung des Autors Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 1 Grundlagen – Fundamentals X, Y, ... Merkmal (Variable) mit einzelnen Beobachtungen (Ausprägungen) Variable with single observation N Anzahl der Elemente einer Population (Grundgesamtheit) Number of elements of a population n Anzahl der Elemente einer Stichprobe (Anzahl der Beobachtungen) Number of elements of a sample (number of observations) Merkmalsausprägungen Values X = ( x1, x2, ... xn ) xi mit i = 1,2, ...., n 2 Auswertung und Darstellung eindimensionaler Daten – Analysing and Displaying Onedimensional Data 2.1 Häufigkeiten – Frequencies Absolute Häufigkeiten von k verschiedenen Merkmalsausprägungen – Absolute Frequencies ni = h(xi) Anzahl der Werte mit der Merkmalsausprägung xi. Relative Häufigkeiten von k Merkmalsausprägungen (Klassen) – Relative Frequencies ni = fi [oder auch f(xi)] mit i = 1, ... k(Error! Use the Home tab to apply Überschrift 1 to the text that you wan n messen den Anteil der Merkmalsausprägung xi an allen Merkmalsausprägungen. k Daher ist f i 1 i 1 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-2) Prozentuale Häufigkeit (Prozentanteil) der Merkmalsausprägung xi – Percentage (proportion) ni 100 f i 100 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-3) n Klassierte Daten – Classes xi* Klassenmitte: (Untergrenze + Obergrenze) / 2 Häufigkeitsdichte (für Histogramm) – Frequency Density D h( xi* ) ni Häufigkeit also Klassenbre ite xi xi oder f ( xi* ) (Error! Use the Home tab to apply Überschrift 1 to the te xi Klassenbreite xi = Obergrenze xi - Obergrenze xi-1(Error! Use the Home tab to apply Überschrift 1 to the text that Summenhäufigkeiten "kumulierte" Häufigkeiten „bis zu“ einem vorgegebenen Wert xj Cumulative Frequency cumulated frequencies (counts) „up to“ a given value xj Absolute Summenhäufigkeit – cumulated absolute frequencies j j i 1 i 1 H ( x j ) h( xi ) ni (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear h Relative Summenhäufigkeit – cumulated relative frequencies j F(xj) = f ( xi ) f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear xi x j i 1 Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 1 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Konzentrationsmessung: Measuring Concentration (Ermittlung der Zwischenschritte sinnvollerweise in Prozent) mi xi ni (Error! Use the Home tab to apply Üb Merkmalssumme der einzelnen Merkmalsausprägungen: Merkmalssumme aller Merkmalsausprägungen: m mi (Error! Use the Home tab to apply Übe Relative Merkmalssumme: gi Kumulierte relative Merkmalssumme: G j g i (Error! Use the Home tab to apply Übe mi (Error! Use the Home tab to apply Übers m j i 1 Fli f i Gi 1 Einzelfläche unter der Lorenzkurve: fi gi (Error! Use the Home tab to ap 2 Fl Fli (Error! Use the Home tab to apply Üb Gesamtfläche unter der Lorenzkurve: LKM 1 Lorenz‘sches Konzentrationsmaß (LKM): Fl (Error! Use the Home tab to apply Übe 5000 2.2 Lagemaße (Mittelwerte) – Measures of Central Tendency (Averages) Arithmetisches Mittel: arithmetisches Mittel einer Grundgesamtheit Arithmetic Mean x arithmetisches Mittel einer Stichprobe Einfaches arithmetisches Mittel bei (diskreten) Einzelwerten x simple arithmetic Mean 1 n xi n i 1 (Population) (Sample) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-15) Gewichtetes arithmetisches Mittel (bei Häufigkeitsverteilungen) Weighted arithmetic Mean x k n 1 k x n x xi i (Error! Use i i n i 1 n i 1 the Home tab to apply Überschrift 1 to the text that you want to appear here.-16) Im Fall von Klassen Klassenmitte x*i verwenden. Zentralwert (Median) – Median 1) Zentralwert = ZW = 50%-Anteil (Percentil) = 2. Quartil 2) i) sortieren aller Ausprägungen x1, ..., xn nach Größe ii) Suchen der Position von ZW Ermittlung des Index m, für den xm in der Mitte aller Werte steht 3) ungerades n: ZW = xm mit m n 1 (Error! Use the Home tab to apply Überschrift 1 to the 2 ZW1 ZW2 (Error! Use the Home tab to apply Überschrift 1 to the text th 2 n n2 ZW1 = xm mit m und ZW2 = xu mit u (Error! Use the Home tab to 2 2 ZW gerades n: mit: Quantile (Percentile) – Quantiles (Percentiles) p-Quantil: x Qp = xi mit: F(xi) > p und F(xi-1) < p(Error! Use the Home tab to apply Überschrift 1 to the text that Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 2 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Häufigster Wert (Modus) – Mode xmod = xi mit max f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here i Schiefe – Skewness x = ZW symmetrische Verteilung x > ZW rechtsschiefe Verteilung(Error! Use the Home tab to apply Überschrift 1 to the text th x < ZW linksschiefe Verteilung Geometrisches Mittel – Geometric Mean GM n x1 x2 ... xn n n x i (Error! Use the Home tab to apply Überschrift 1 to the text that you want to app i 1 Endniveau (Error! Use the Home tab to apply Überschrift 1 to the text that you w Anfangsniveau oder alternativ: GM n 2.3 Streuungsmaße – Measures of Variability / Deviation Spannweite – Range: SW = xMax – xMin (Error! Use the Home tab to apply Überschrift 1 to the text that you wa Durchschnittliche (mittlere) absolute Abweichung 1 n xi x n i 1 n n DAA xi x i n i 1 DAA Anm.: Es kann auch ZW statt – Mean Absolute Deviation (MAD) (Einzelwerte)(Error! Use the Home tab to apply Überschrift 1 to the text that you want (Häufigkeitsauszählungen)(Error! Use the Home tab to apply Überschrift 1 to the text th x verwendet werden. Hilfsgröße: Varianz – Variance (auxiliary measure) Population – ² – Population Stichprobe – s² – Sample a) Einzelwerte 2 s2 1 n xi x (Error! Use the n 1 i 1 Home tab to apply Überschrift 1 to the text that you want to appear here.-28) 2 1 N n xi 2 (Error! Use the i 1 Home tab to apply Überschrift 1 to the text that you want to appear here.-29) b) Klassierte Werte / Häufigkeiten 1 k 2 x i ni N i 1 (Error! Use k 2 ni xi N i 1 k 1 2 x i x ni n 1 i 1 (Error! k ni 2 xi x n 1 i 1 2 s2 Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-30) the Home tab to apply Überschrift 1 to the text that you want to appear here.-31) Standardabweichung – Standard Deviation s s 2 2 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 3 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Variationskoeffizient – Coefficient of Variance s x VC VC (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-33) (Standardisierter) Z-Score – Z-Score xi x s z z xi (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-34) 3 Zusammenhänge zwischen mehrdimensionalen Daten – Relations between MultiDimensional Variables 3.1 Allgemeine Grundbegriffe – Basic Concepts Randverteilungen (Zeilen / Spalten) – Marginal Distributions (Columns / Rows) q Zeilensumme h(x j ) = h( x ; y j k ) Zeilenprozente f ( x j ; y k ) h( x j ; y k ) k =1 m Spaltensumme h(y k ) = h( x ; y j k ) Spaltenprozente f ( x j ; y k ) h(x j ) h( x j ; y k ) j=1 m q j=1 k =1 (100) (Error! Use the Home tab to h(y k ) (100) (Error! Use the Home tab to n = h( x j ) = h( y k ) ist die Anzahl der Beobachtungen(Error! Use the Home tab to apply Überschrift 1 to the 3.2 Zusammenhänge zwischen metrisch skalierten Merkmalen – Correlation of metrically scaled Variables Cov( X , Y ) Kovarianz – Covariance – Correlation Coefficient (Bravais-Pearson) Korrelationskoeffizient r Cov( X , Y ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-5) s X sY n r 1 n ( xi x )( yi y ) (Error! Use the Home tab to apply Überschrift 1 to n i 1 (x i 1 n (x i 1 i i x )( y i y ) x) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to app n 2 (y i 1 i y) 2 Lineare Regression – Linear Regression Regressionsfunktion: Beobachtungswerte: Residuen: yˆ a b x (Error! Use the Home tab to apply Überschrift 1 to the text that you want y a b x e (Error! Use the Home tab to apply Überschrift 1 to the text that you w e y yˆ (Error! Use the Home tab to apply Überschrift 1 to the text that you want to Lineare Einfachregression nach der Methode der Kleinsten Quadrate (KQ) : Ordinary Least Squares Regression (OLS): e Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 2 i Min ! Seite 4 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. x y x x y n x x n x y x y b n x x 2 i a i i i i i 2 2 i i i i (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear i 2 2 i i alternative Ermittlung der Koeffizienten a und b: a y bx n b (x i 1 i x )( yi y ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-1 n (x i 1 i x)2 Bestimmtheitsmaß / Gütemaß R² – Goodness of Fit / Coefficient of Determination R2 R 2 yˆ y R 2 s y2ˆ s y2 y 2 i 2 i y 1 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-12) s e2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-13) s y2 Bei linearer Einfachregression gilt: R² = r² (Error! Use the Home tab to apply Überschrift 1 to the text that you (Vorhergesagte) Schätzwerte – Estimated (predicted) Values ŷ Die geschätzten (vorhergesagten) Werte, d.h. die Werte auf der Regressionsgerade, können unmittelbar aus der Regressionsfunktion yˆ i a b xi (Error! Use the Home tab to apply Überschrift 1 to the text errechnet werden, indem die ermittelten Werte von a und b sowie jedes einzelne xi eingesetzt werden. Dies ist etwa zur Ermittlung des R², für Prognosen und Glättung von Zeitreihen erforderlich. 3.3 Rangkorrelationen für ordinal skalierte Merkmale (nach Spearman) – Rank Correlation for ordinal Variables (Spearman’s ) rs 1 6 d i2 n n2 1 [mit: di = xi - yi](Error! Use the Home tab to apply Überschrift 1 to the text that you want to 3.4 Kontingenzanalyse bei nominal skalierten Variablen – Contingency Measures (Association of nominal Variables) Der 2-Wert als Hilfsgröße (für den Unabhängigkeitstest siehe Kapitel 8.3.4) 1. Schritt: Ermittlung der erwarteten Häufigkeiten he in der Kontingenztabelle: he h( x j ) h ( y k ) n (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-17) Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 5 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 2. Schritt: Errechnen von 2 durch Summieren aller Felder: m q 2 h( x ; y j 1 k 1 j ) he ( x j ; y k ) 2 k he ( x j ; y k ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want Kontingenzkoeffizient – Coefficient of Contingency einfacher: C 2 2 n korrigierter: Ckorr C (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear he K* 2 K* (Error! Use the Home tab to apply Überschrift 1 to the text K * 1 2 n K * 1 mit: K* = Min(m;q) Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 6 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 4 Elemente der Zeitreihenanalyse – Time Series Analysis (TSA) 4.1 Komponenten einer Zeitreihe – Components of a Time Series Yt = TK + KK + SK + RK (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appe 4.2 Glättung durch Gleitende Durchschnitte – Smoothing with Moving Averages (MA) Gegeben sei eine Zeitreihe von T Werten yt (t=1, ..., T) a) Gleitende Durchschnitte ungerader Ordnung y kt 1 y k 1 y k 3 ... y t ... y k 3 y k 1 t t t k t 2 2 2 2 t 1 k k 1 2 i t y für t i k 1 2 k 1 k 1 , ... , T 2 2 (Error! Use the Home tab to apply Überschrift 1 to the tex b) Gleitende Durchschnitte gerader Ordnung k t 1 2 11 1 ykt y k y i y k k 2 t 2 i t k 1 2 t 2 2 für t k k 1, ... , T (Error! Use the Home tab to apply Überschrift 1 2 2 4.3 Glättung durch lineare Trendfunktion – Smoothing with a Linear Trend Function yˆ f (t ) yˆ a b t Allgemeine Trendfunktion: Lineare Trendfunktion: Es ergibt sich die Formel zur Ermittlung von a und b analog (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-10): t y t t y a n t t n t y t y b n t t 2 i i i 2 i i i i i 2 i i (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appea i 2 2 i i Hinweis: Durch Transformation des Zeitindex t, so dass z.B. mittels: t * i 0 wird t ti t (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear her * i vereinfacht sich (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-4) zu: Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 7 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. a* y t b* b t * i y i (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-6) *2 i Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 8 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 4.4 Ermittlung der (additiven) Saisonkomponente und Saisonbereinigung – Analysis of Seasonality 1. Schritt: Saisonale Abweichung aller Einzelwerte vom Trend ( y kt oder ŷt ) SK t yt y kt SK t yt yˆ t (bei GD) oder (bei KQ)(Error! (Error! Use the Home tab to apply Überschrift 1 to the text that you want Use the Home tab to apply Überschrift 1 to the text that you want to appear 2. Schritt: durchschnittliche saisonale Abweichung der Zeiteinheiten Saisonkomponente – Seasonal Component: SK j 1 Q* SK t Zeiteinheit j t (Error! Use the Home tab to apply Q* = Anzahl der Beobachtungen in der jeweiligen SKj (Tertiale, Quartale, Monate, ....) 3. Schritt: saisonbereinigte Reihe – seasonally adjusted series ~ yt yt SK j (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-9 es verbleibt die Irreguläre oder Rest-Komponente RK t y kt ~ yt RK t yˆ t ~ y t (Error! Use the Home tab to apply Überschrift 1 to the text tha bzw. 4.5 Prognosen – Forecasting Einfache Prognosen – Simple Forecasts Konstante Entwicklung y t*1 y t (Error! Use the Home tab to apply Überschrift 1 to the text that Additive Entwicklung yt*1 yt yt yt 1 (Error! Use the Home tab to apply Überschrift 1 to Multiplikative Entwicklung yt*1 yt yt (Error! Use the Home tab to apply Überschrift 1 to the tex yt 1 Prognosen auf Basis von Trendfunktionen – Forecasts based on Trend Analysis können auf Basis der Fortschreibung der vorhergesagten Werte yˆ t* f (t ) (vergleiche (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-15)) ermittelt werden, indem für t zukünftige Werte eingesetzt werden: yˆ t* a b t (Error! Use the Home tab to apply Überschrift 1 to the text Saisonale Einflüsse bei linearer Trendprognose – Forecasts considering Seasonality Für die Prognose wird die SK addiert (analog mit t* und a*): yˆ t* a b t SK j (Error! Use the Home tab to apply Überschrift 1 to Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 9 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 5 Maß- und Indexzahlen – Indices 5.1 Verhältniszahlen – Ratios ni f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the n Summe der Merkmalsausprägungen xi BZ x (Error! Use the Home tab to apply Anzahl der statistischen Einheiten n (5.1.1.) Gliederungszahl relative Häufigkeit Beziehungszahl: (5.1.2.) Messziffern oder Messzahlen: X = Reihe von Werten xt mit t = 0, ..., T. 0 = Basisperiode t = Berichtsperiode. M 0t Messzahl für die „Periode t zur Basis 0“ xt x0 (100) (Error! Use the Home tab to apply Überschrift 1 t Reihen von Messziffern – Series of Measures Verschiedene M 0t Werte für laufendes t (d.h. in Bezug zur Vorperiode): Zuwachsrate: Zt Wachstumsfaktor: Wt M 0t M 0t 1 M t 1 0 xt x t 1 x t 1 ( 100 [%]) (Error! Use the Home tab to app x t 1 xt 1 xt Zt 1 xt 1 Growth Rate (Error! Use the Home tab to apply Übe Durchschnittlicher Wachstumsfaktor zwischen zwei Zeitpunkten: W GM Wt n n xt x t 1 ( 100 [%]) [vgl. auch (Error! Use the Home tab to apply t 1 Überschrift 1 to the text that you want to appear here.-23)] (Error! Use the Home tab to apply Überschrift 1 to th Umbasierung und Verketten von Messziffern: (A = altes Basisjahr; N = neues Basisjahr) M Nt M At M AN ( 100 [%]) oder (wenn M AN nicht bekannt) M Nt M At M NA ( 100 [%]) (Error! Use the Home tab t 5.2 Preis- und Mengenindizes – Price and Quantity Indices pti Preis des Produktes (Faktors) i zum Zeitpunkt t qti Menge des Produktes (Faktors) i zum Zeitpunkt t Preisindex Laspeyres LP p p 1i q 0i 0i q 0i 100 Mengenindex (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-8) Paasche PP p p q 1i 1i q 100 (Error! Use the LM Formelsammlung Statistik, 5. Auflage 1i p0 i 0i p0 i 100 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-9) PM 0i 1i Home tab to apply Überschrift 1 to the text that you want to appear here.-10) q q q q 1i p1i 0i p1i 100 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-11) WS 2002 / 2003 Seite 10 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Wertindex: WI LP PM PP LM p p q 1i 1i 0i q0i 100(Error! Use the Home tab to apply Übe Aus diesen – jeweils zwei Perioden vergleichenden – Messzahlen werden in der Regel Indexreihen gebildet, mit denen wie im Abschnitt 5.1 beschrieben verfahren werden kann. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 11 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 6 Kombinatorik & Wahrscheinlichkeitsrechnung – Theory of Combination & Probabilities 6.1 Kombinatorik – Combination Theory Anzahl der Permutationen (Anordnungen) von n Elementen Fakultäten: n! = 1 2 3 ... n (wobei: 0! = 1) (Error! Use the Home tab to apply Überschrift 1 to the text that you want t Binomialkoeffizient: N N ( N 1) ( N 2)... ( N n 1) N! (Error! Use the Home tab to apply Überschrift 1 to the te n! n!( N n )! n Anzahl der Kombinationen n-ter Ordnung aus N Elementen: mit Zurücklegen Berücksichtigung Reihenfolge Nn (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-3) keine Berücksichtigung der Reihenfolge N n 1 (Error! Use n the Home tab to apply Überschrift 1 to the text that you want to appear here.-5) ohne Zurücklegen N! (Error! Use the ( N n)! Home tab to apply Überschrift 1 to the text that you want to appear here.-4) N (Error! Use the n Home tab to apply Überschrift 1 to the text that you want to appear here.-6) 6.2 Grundbegriffe und Definitionen der Wahrscheinlichkeitsrechnung – Basic Concepts and Definitions of Calculus of Probabilities e1, e2, e3, ...} A, B, C, ... A, B, C, ... Menge der Elementarereignisse – Events Ereignisse: alle Untermengen von E (Kombinationen der ei) Ereignisraum: Menge aller möglichen Ereignisse W(A) Wahrscheinlichkeit dafür, dass Ereignis A eintritt A komplementäres Ereignis zu A mit: W( A ) = 1 – W(A) W A B W A B Wahrscheinlichkeit, dass Ereignis A oder Ereignis B eintreten Wahrscheinlichkeit, dass Ereignis A und Ereignis B eintreten Definitionen von Wahrscheinlichkeiten – Definitions of Probabilities Klassische Definition nach Laplace (a-priori-Wahrscheinlichkeiten) W ( A) Anzahl der " günstigen" Ereignisse (Error! Use the Home tab to apply Überschrift 1 to the text th Anzahl der gleichmöglichen Ereignisse Empirische Wahrscheinlichkeiten (statistische Definition nach Mises) (a-posteriori-Wlk) W(A) = f (A) relative Häufigkeit (Anteil) des Ereignisses A (Error! Use the Home tab to apply Überschrift 1 to t Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 12 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. bei großen Stichproben (Grenzwert) als Anhalt für die realisierte Wahrscheinlichkeit Axiomatische Definition nach Kolmogoroff [] Axiom 1: Axiom 2: Axiom 3: W(A) 0 W() =1 (Error! Use the Home tab to apply Überschrift 1 to the text that W(A B) = W(A) + W(B) für W(A B) = 0 W ist nichtnegativ: W ist normiert: W ist additiv: 6.3 Rechnen mit Wahrscheinlichkeiten – Calculation with Probabilities Wahrscheinlichkeiten zusammengesetzter Ereignisse – Probabilities of Unions of Events Allgemeiner Additionssatz W(A B) = W(A) + W(B) – W(A B)(Error! Use the Home tab to apply Überschrift 1 to the text that you want W(ABC) = W(A) + W(B) + W(C) - W(AB) - W(AC) - W(BC) + W(ABC) (Error! Use the Home tab to ap Dieser vereinfacht sich für sich ausschließende Ereignisse (W(A B) = 0) zu: Spezieller Additionssatz W(A B) = W(A) + W(B)(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear he W(A B C) = W(A) + W(B) + W(C)(Error! Use the Home tab to apply Überschrift 1 to the text that you want t Bedingte Wahrscheinlichkeiten – Conditional Probabilities W ( B| A) W ( A B) mit W ( A) 0 lies: „W von B gegeben A“)(Error! Use the Home tab to apply Überschri W ( A) W ( A| B) W ( A B) mit W ( B) 0 lies: „W von A gegeben B“)(Error! Use the Home tab to apply Überschri W ( B) Allgemeiner Multiplikationssatz W(A B) = W(A) W(B|A) = W(B) W(A|B)(Error! Use the Home tab to apply Überschrift 1 to the text that you W(A B C) = W(A) W(B|A) W(C| A B)(Error! Use the Home tab to apply Überschrift 1 to the text that yo (Stochastische) Unabhängigkeit – stochastic Independence Es seien die Ereignisse A, B, C mit W(A) >0, W(B) > 0 und W(C) > 0, dann sind die Ereignisse A und B voneinander (stochastisch) unabhängig, wenn A unabhängig von B ist (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-18 a) und B unabhängig von A (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-18 b): W(B | A) = W(B | A ) = W( B ) und(Error! Use the Home tab to apply Überschrift 1 to the text that you want to a W(A | B) = W(A | B ) = W( A )(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear Analog sind die Ereignisse A, B und C voneinander (stochastisch) unabhängig, wenn gilt: W(A | B) = W(A | C) = W(A | B C) = W(A) und(Error! Use the Home tab to apply Überschrift 1 to the text tha W(B | A) = W(B | C) = W(B | A C) = W(B) und(Error! Use the Home tab to apply Überschrift 1 to the text tha W(C | A) = W(C | B) = W(C | A B) = W(C)(Error! Use the Home tab to apply Überschrift 1 to the text that you wa Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 13 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Spezieller Multiplikationssatz für stochastisch unabhängige Ereignisse vereinfacht sich der Multiplikationssatz wie folgt: W(A B) = W(A) W(B)(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear her W(A B C) = W(A) W(B) W(C)(Error! Use the Home tab to apply Überschrift 1 to the text that you want t 7 Theoretische Verteilungen – Theoretical Distributions 7.1 Zufallsvariablen – Random Variables X – Zufallsvariable (ZV) mit den Ausprägungen x1, x2, ... xn 7.1.1 Dichte- und Verteilungsfunktion – Density and Distribution Function (Cumulated Density function - cdf) Diskrete ZV – Discrete Random Variables Wahrscheinlichkeitsfunktion Wahrscheinlichkeit, dass die ZV X den Wert x annimmt f(x) = W(X = x)(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-1) Verteilungsfunktion Wahrscheinlichkeit, dass die ZV X höchstens den Wert x annimmt F(x) = W(X x) = f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appea xi x Stetige ZV – Continuous Random Variables Dichtefunktion (Wahrscheinlichkeitsdichte): Wahrscheinlichkeit, dass die ZV X einen Wert annimmt, der in einem infinitesimal kleinen Intervall um x liegt [für 0](Error! Use the Home tab to apply Überschrift 1 to the text that you want to f(x) = W(x- X x+ f ( x)dx 1 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to mit: f(x) 0 und b Intervall: W (a X b) f ( x) dx (Error! Use the Home tab to apply Überschrift 1 to the text that you want a Verteilungsfunktion Wahrscheinlichkeit, dass die ZVX höchstens den Wert x annimmt x F ( x) W ( X x) f (v) dv (Error! Use the Home tab to apply Überschrift 1 to the text that you want to app 7.1.2 Parameter von Verteilungen – Parameters of Distributions Erwartungswert E einer diskreten ZV – Expected Value of a Discrete Random Variable EX = = x i f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Erwartungswert E einer stetigen ZV – Expected Value of a Continuous Random Variable EX = = x f ( x) dx (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Varianz einer ZV (allgemeine Form) – Variance VX = 2 = E(X – EX)2 = EX2 – (EX)2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 14 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Varianz einer diskreten ZV VX = 2 = x EX f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to ap 2 i Varianz einer stetigen ZV VX = 2 = x EX 2 f ( x )dx (Error! Use the Home tab to apply Überschrift 1 to the text that you want to app 7.2 Einige spezielle Verteilungen – Specific Distributions 7.2.1 Diskrete Verteilungen – Discrete Distributions Binomialverteilung – Binomial Probability Distribution N Anzahl der Elemente in der Grundgesamtheit – Elements of the population n Anzahl der (unabhängigen) Experimente = Stichprobenumfang – sample size p Wahrscheinlichkeit des Erfolgs („günstigen“ Ausganges) eines Experiments, bei dem nur zwei Ereignisse möglich sind. x Anzahl der Erfolge („günstigen“ Ereignisse) in der Stichprobe n nx f ( x | n ; p ) W ( X x ) p x 1 p (Error! Use the Home tab to apply Überschrift 1 to the text that yo x EX = n p (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-13) VX = n p (1-p) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-14) Multinomialverteilung – Multinomial Probability Distribution f1,2,...k (x1, x2, ... xk) = W(X1 = x1, ... Xk = xk) k mit: xi n und i 1 k p i 1 i n! p1x1 p 2x 2 ... p kxk (Error! Use the Home tab to apply Übe x1! x 2 !... x k ! 1 EX = n pi (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-16) VX = n pi (1-pi) (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-17) Hypergeometrische Verteilung – Binomial Probability Distribution n Stichprobenumfang N Anzahl der Elemente in der Grundgesamtheit M Anzahl der Erfolge in der Grundgesamtheit => p M (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-18) N N p N (1 p) M N M f (x | n ; N ; p) = x n x = x n x (Error! Use the Home tab to apply Überschrift 1 to the text that N N n n EX = n p (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-20) VX = n p (1-p) N n (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear her N 1 Poissonverteilung – Poisson Probability Distribution f (x | ) = x x! e (mit: e = 2,7183... Euler’sche Zahl)(Error! Use the Home tab to apply Überschrift 1 to the tex Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 15 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. EX = VX = (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-23) Gleichverteilung – Uniform Distribution f (x) = 1 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-24) N EX = = x i f ( xi ) VX = 2 = x EX f ( xi ) (Error! Use the Home tab to apply Überschrift 1 to the 2 i 7.2.2 Stetige Verteilungen – Continuous Distributions Normal Distribution Normalverteilung 1 f ( x | , ) 2 1 x e 2 2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want x F ( x| , ) f (v| , ) dv (Error! Use the Home tab to apply Überschrift 1 to the text that you want to app EX = (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-28) VX = (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-29) Die übliche Schreibweise dafür, dass eine Zufallsvariable X einer Normalverteilung mit Mittelwert und Standardabweichung folgt, ist: X N () (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-30) Standardnormalverteilung – Standard Normal Distribution Wenn X normalverteilt ist mit N(), dann ist Z X standardnormalverteilt [Z N (0, 1)](Error! Use the Home tab to apply Überschrift 1 to the text mit: EX = 0(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-32) VX = 1 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-33) –Verteilung [„Chi-Quadrat“] – Distribution Seien Z1, Z2, ... Z unabhängige standardnormalverteilte Zufallsvariable, dann ist die Summe: Z12 Z 22 ... Z2 - verteilt mit:(Error! Use the Home tab to apply Überschrift 1 to the text that you want to E( Z12 Z 22 ... Z2 ) = (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear h V( Z12 Z 22 ... Z2 ) = 2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear t –Verteilung (Studentverteilung) – t–Distribution (Student’s Distribution) Ist Z eine standardnormalverteilte und Y eine mit Freiheitsgraden -verteilte Zufallsvariable und sind Z und Y unabhängig, dann ist die Zufallsvariable Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 16 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. T Z t – verteilt mit:(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear he Y für 2(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear ET = 0 VT = 2 für 3(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear 7.2.3 Zentraler Grenzwertsatz – Central Limit Theorem Seien X1, X2, ...., Xn als Stichproben aus einer Grundgesamtheit mit Mittelwert und Standardabweichung gleich verteilte Zufallsvariablen, dann ist der arithmetische Mittelwert dieser Verteilungen: X X 1 X 2 ... X n (Error! Use the Home tab to apply Überschrift 1 to the text th n als Stichprobenfunktion normalverteilt mit EX und (Error! Use the Home tab to apply Überschrift 1 to the text that you want t VX 2 n ,(Error! Use the Home tab to apply Überschrift 1 to the text that you want to a so dass sich die Stichprobenstandardabweichung ergibt: X n (Error! Use the Home tab to apply Überschrift 1 to the text that you want to ap 7.2.4 Approximationen von Verteilungen – Approximation of Distributions Bei Vorliegen der angegebenen Bedingungen können Verteilungen und ihre Parameter durch andere Verteilungen angenähert (approximiert) werden. Approximation der hypergeometrischen Verteilung durch die Binomialverteilung n 0,05 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-44) N Approximation der Binomialverteilung durch die Poissonverteilung n 100 ; p 0,05(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-45) Approximation der hypergeometrischen Verteilung durch die Poissonverteilung n 0,05 ; n 100 ; p 0,05(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appe N Approximation der Binomialverteilung durch die Normalverteilung n p (1-p) > 9 9 n (Error! Use the Home tab to apply Überschrift 1 to the text that you want p 1 p Approximation der hypergeometrischen Verteilung durch die Normalverteilung n p (1-p) > 9 und n 0,05(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appea N Approximation der Poissonverteilung durch die Normalverteilung > 9(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-49) Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 17 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Approximation der –Verteilung durch die Normalverteilung 100(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-50) Approximation der t –Verteilung durch die Standardnormalverteilung 30 50 bei normalverteilten Grundgesamtheiten(Error! Use the Home tab to apply Überschrift 1 to the text that y bei nicht normalverteilten Grundgesamtheiten(Error! Use the Home tab to apply Überschrift 1 to the text 8 Schluss von der Stichprobe auf die Grundgesamtheit – Statistical Inference 8.1 Schätztheorie: Stichprobenfunktionen – Estimation Theory Stichprobenmittel – Sample Mean X x Schätzfunktion „Stichprobenmittel“ (vgl. Abschnitt 7.2.3) (Error! Use the Home tab to apply Überschrift Stichprobenmittelwert (einer Stichprobe)(Error! Use the Home tab to apply Überschrift 1 to the text tha Mittelwert der Grundgesamtheit (Error! Use the Home tab to apply Überschrift 1 to the text that you wa 2 Varianz der Grundgesamtheit (Error! Use the Home tab to apply Überschrift 1 to the text that you want N n N 1 Endlichkeitskorrektur - nur wenn n 0,05 .(Error! Use the Home tab to apply Überschrift 1 to the text N EX = (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-6) VX X2 2 n [ggf. zu multiplizieren mit Endlichkeitskorrektur, vgl.(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-5)](Error! Use the Home tab to apply Überschrif Stichprobenanteil – Sample Proportion P p̂ p Schätzfunktion „Stichprobenanteil“ (Error! Use the Home tab to apply Überschrift 1 to the text that you wan Stichprobenanteil (einer Stichprobe)(Error! Use the Home tab to apply Überschrift 1 to the text that you wan Anteil der relevanten Elemente in der Grundgesamtheit = Anteil der Erfolge = „empirische Wahrscheinlichkeit“(Error! Use the Home tab to apply Überschrift 1 to th EP = p(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-11) p (1 p) VP P2 [ggf. zu multiplizieren mit Endlichkeitskorrektur, vgl. (Error! Use the Home n tab to apply Überschrift 1 to the text that you want to appear here.-5)](Error! Use the Home tab to apply Übersc 8.2 Konfidenzintervalle zur Parameterschätzung – Confidence Intervals gu / go Untere / obere Grenze des Vertrauensbereiches(Error! Use the Home tab to apply Überschrift 1 to the te 1- Sicherheitsgrad (Konfidenzniveau) (Error! Use the Home tab to apply Überschrift 1 to the text that you 8.2.1 Konfidenzintervall für den Mittelwert – Confidence Interval for the Mean ( = „wahrer“ Mittelwert der Population) gu x zc X (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-15) g o x zc X (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-16) Konfidenzintervall – Confidence Interval W ( x z c X x z c X ) 1 (Error! Use the Home tab to apply Überschrift 1 to the text t mit: zc kritischer Z-Wert – critical value Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 18 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. (Standardnormalverteilung Z N (0, 1)) für den vor gegebenen Sicherheitsgrad 1- Tabellierung der Standardnormalverteilung, Tafel 4 Achtung, für zc wird immer nur der positive Wert verwendet X die Standardabweichung des Stichprobenmittels – standard error of the mean (SEM) für diese ist eine Fallunterscheidung erforderlich Fallunterscheidung zur Ermittlung der Stichprobenstandardabweichung – Standard Error of the Mean (SEM) X 1. Fall: bekannt; Grundgesamtheit normalverteilt oder n 50 X X bei Stichproben mit Zurücklegen oder n 0,05 (Error! Use the Home tab to apply Überschrift 1 t N n n N n bei Stichproben ohne Zurücklegen und N 1 n 0,05 (Error! Use the Home tab to apply Überschrift 1 t N [Vergleiche zur Endlichkeitskorrektur (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-5)] 2. Fall: unbekannt; Verteilung der Grundgesamtheit unbekannt; n 50 und 3. Fall: unbekannt; Grundgesamtheit normalverteilt; n > 30 Verwendung der Stichprobenstandardabweichung s statt 2 s mit 1 n xi x (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear n 1 i 1 so dass für die Standardabweichung des Stichprobenmittels gilt: X s n X s n bei Stichproben mit Zurücklegen oder n 0,05 (Error! Use the Home tab to apply Überschrift 1 N N n N 1 bei Stichproben ohne Zurücklegen und n 0,05 (Error! Use the Home tab to apply Überschrift 1 N [Vergleiche zur Endlichkeitskorrektur (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-5)] 4. Fall: unbekannt; Grundgesamtheit normalverteilt; n 30 Verwendung der Stichprobenstandardabweichung s (nach (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-20)) statt Verwendung der Studentverteilung statt der Standardnormalverteilung, d.h. tc statt zc: tc der kritische (critical) t-Wert (Studentverteilung) für den vorgegebenen Sicherheitsgrad 1- Tabellierung der Studentverteilung, Tafel 6 mit = n – 1 Freiheitsgraden Ablesen von tc jeweils an der Stelle: zweiseitiger Test: F ( tc | ) = 1 – oder D ( tc | ) = 1 – einseitiger Test: F ( tc | ) = 1 – Überblick über Fälle für Stichprobenstandardabweichung X (Error! Use the Home tab to apply Überschrift 1 to th Standardabweichung der Grundgesamtheit Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 19 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. bekannt X Stichprobe mit Zurücklegen Stichprobe ohne Zurücklegen n 0,05 N n 0,05 N X X n unbekannt n X s n n N n N 1 X s n N n N 1 8.2.2 Konfidenzintervall für den Anteilswert – Confidence Interval for the Proportion 9 Bei einem ausreichend großen Stichprobenumfang: n (Error! Use the Home tab to apply Überschrift 1 t p(1 p ) ist der Stichprobenanteil p̂ annähernd normalverteilt. gu pˆ zc pˆ (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-25) g o pˆ z c pˆ (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-26) Konfidenzintervall – Confidence Interval W ( pˆ z c Pˆ p pˆ z c Pˆ ) 1 (Error! Use the Home tab to apply Überschrift 1 to the text tha Dabei ist (analog zum Vertrauensbereich für den Mittelwert): Pˆ pˆ 1 pˆ n Pˆ pˆ 1 pˆ n bei Stichproben mit Zurücklegen oder n 0,05 (Error! Use the Home tab to apply Übersc N N n N 1 bei Stichproben ohne Zurücklegen und n 0,05 (Error! Use the Home tab to apply Übersc N [Vergleiche zur Endlichkeitskorrektur (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-5)] 8.2.3 Notwendiger Stichprobenumfang – Sample Size maximaler absoluten Fehler Schätzung des Mittelwertes : Bei bekannter Standardabweichung : n zc2 2 bei Stichproben mit Zurücklegen(Error! Use the Home tab to apply Überschrift 1 to the t 2 zc2 N 2 n 2 ( N 1) zc2 2 bei Stichproben ohne Zurücklegen(Error! Use the Home tab to apply Überschrift 1 to the Wenn Standardabweichung nicht bekannt ist: Verwendung von s (nach (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-20)) statt und der Studentverteilung tc statt zc: n tc2 s 2 2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-32) Mindestens muss in diesem Fall jedoch n > 50 sein. Schätzung des Anteilswertes p: Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 20 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. z c2 pˆ (1 pˆ ) n bei Stichproben mit Zurücklegen(Error! Use the Home tab to apply Überschrift 1 to th 2 z c2 N pˆ (1 pˆ ) 2 ( N 1) z c2 pˆ (1 pˆ ) n bei Stichproben ohne Zurücklegen(Error! Use the Home tab to apply Überschrift 1 to Für p wird wieder der Stichprobenanteil p̂ oder p (1-p) = 0,25 (vgl. Error! Reference source not found.) Erratum: In der gedruckten Auflage findet sich auf der Seite 17 unten eine Fehlermeldung. Der betreffende Satz kann gestrichen werden. In den beiden Formeln (8-33) und (8-34) sind die Buchstaben p jeweils mit einem "Dach" (^) zu versehen. 8.3 Hypothesentests – Hypothesis Testing H0 H1 1- Nullhypothese (zu testende Ausgangshypothese) – null hypothesis Alternativhypothese Sicherheitsgrad (Konfidenzniveau - aber auch „Signifikanzniveau“ s.u.) – significance Signifikanzniveau (Irrtumswahrscheinlichkeit - Achtung, Bezeichnung von und 1- in der Literatur uneinheitlich) zc kritischer Wert (bzw. tc oder c2 ) aus Tabelle abzulesen zX Prüfgröße (bzw. t oder 2) zu errechnen critical value Schritte eines Hypothesentests 1. Aufstellen von H0 und H1 2. Festlegen des Signifikanzniveaus (hier i.d. Aufgabenstellung - in der Praxis selbst zu tun) 3. Bestimmen von X (Fallunterscheidung) 4. Aufstellen der Entscheidungsregeln über die Ablehnung von H0: Ermittlung der Testgröße durch Ablesen in der entsprechenden Tabelle kritischer Wert zc (bzw. tc oder c2 ) Variante A: Testentscheidung auf Basis absoluter Werte: kritischen Grenzen c (bzw. pc): 5. Ermittlung der kritischen Grenzen (Unter- und Obergrenze) für x bzw. p̂ cu 0 z c X bzw. pcu p0 z c pˆ (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-35) bzw. pcu p0 z c pˆ (Error! Use the Home tab to apply co 0 z c X Überschrift 1 to the text that you want to appear here.-36) 6. Entscheidungsregel: Ablehnung von H0, wenn: (analog für Testwerte t und 2) x > co bzw. pˆ p co bei rechts- oder zweiseitigem Test oder (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-37) x < cu bzw. pˆ p cu bei links- oder zweiseitigem Test (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-38) 7. Interpretation des Ergebnisses Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 21 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Variante B: (einfacher aber fehleranfälliger) „Z-Test“ Testentscheidung auf Basis der standardisierten Z-Werte (bzw. t x , z pˆ , 2 oder t – siehe Kapitel 8.4 bis 8.4.4) 5. Berechnung der Prüfgröße z X 6. Anwendung der Entscheidungsregel (analog für die anderen Prüfgrößen) wenn | z X | > | zc | Ablehnung von H0 (Error! Use the Home tab to apply Überschrift 1 to the text that y 7. Interpretation des Ergebnisses Bei Verwendung von Variante B muss die entsprechende Prüfgröße (je nach Fragestellung aus Kapitel 8.4 bis 8.4.4) ermittelt werden: 8.4 Parametrische Tests – Parametric Tests 8.4.1 Testen von Mittelwerten – Testing Means 0 vermuteter bzw. angegebener Wert, von dem mit dem statistischen Test untersucht werden soll, ob er – auf Basis der Daten – der wahre Mittelwert der Grundgesamtheit sein kann. Prüfgröße: zX x 0 X (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-40) Ablesen von zc jeweils an der Stelle: zweiseitiger Test – two-tailed test: dies entspricht: einseitiger Test – one-tailed test: (einseitiger Test, linksseitig kritischer Bereich kann auch abgelesen werden mittels: D ( zc ) FSN ( zc ) =1– = 1 – FSN ( zc ) = 1 – FSN (–zc) = Tabellierung der Standardnormalverteilung, Tafel 4. Für die Ermittlung von X ist die in Punkt „Konfidenzintervalle“ dargestellte Fallunterscheidung notwendig (vgl. Abschnitt 8.2.1). Dabei ergibt sich im 4. Fall ( unbekannt; Grundgesamtheit normalverteilt; n 30) die Prüfgröße: tx x 0 s (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-41) n 8.4.2 Testen von Anteilswerten – Testing Proportions p0 vermuteter bzw. angegebener Anteilswert, von dem mit dem statistischen Test unter- Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 22 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. sucht werden soll, ob er – auf Basis der Daten – der wahre Anteilswert der Grundgesamtheit sein kann. Für n 9 ergibt sich die (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appe p(1 p ) Prüfgröße: z pˆ pˆ p0 pˆ (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-42) Dabei ist wiederum die in Abschnitt 8.2.2 vorgenommene Fallunterscheidung für p̂ zu beachten. 8.4.3 Zweistichprobentests – Two Sample Tests Es liegen zwei unabhängige Stichproben X1, X2 vor. Die Frage ist, ob die beiden aus gleichen Grundgesamtheiten stammen können oder ob sich die Populationen signifikant unterscheiden. H0: Die Stichproben stammen aus der gleichen Grundgesamtheit. Mittelwertdifferenz zweier unabhängiger Stichproben („t-Test“) H0: 1 = 2 1 – 2 = 0(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear h Prüfgröße: t x1 x2 s12 s 22 n1 n2 (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear ist t-verteilt mit = n1 + n2 - 2 Freiheitsgraden Differenzen von Anteilswerten zweier unabhängiger Stichproben H0:p1 = p2 p1 – p2 = 0(Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear h Prüfgröße: z 8.4.4 pˆ 1 pˆ 2 n n2 P (1 P) 1 n1 n 2 mit : P pˆ 1 n1 pˆ 2 n 2 n1 n 2 (für n1 > 30 und n2 > 30)(Error! Use the Home tab Testen der Regressionskoeffizienten bei Mehrfachregression – Testing Coefficients of Multivariate Regressions Wird das Modell der linearen Einfachregression (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-7) um die Berücksichtigung mehrerer Einflussfaktoren erweitert, so sprechen wir von multipler Regression oder Mehrfachregression: yˆ b0 b1 x1 b2 x2 ... bk xk (Error! Use the Home tab to apply Überschrift 1 to the text that you want Es ergeben sich für die k einzelnen Schätzkoeffizienten bi (die gesuchten „wahren“ Werte) Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 23 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. jeweils Schätzwerte b̂i und Standardabweichungen sbi. Es ist zu testen, ob die einzelnen xi einen signifikanten Einfluss auf y haben. Ausgangshypothesen: kein signifikanter Einfluss: ( i = 1, …. k )(Error! Use the Home tab to apply Überschrift 1 to the text that you want to ap H0 : bi = 0 Daraus ergibt sich als Prüfgröße: ti bˆi (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-4 s bi die mit = n – k Freiheitsgraden studentverteilt ist. Tabellierung der Studentverteilung, Tafel 6 Der Test wird für jedes bi einzeln durchgeführt. 8.5 Nicht-Parametrische Tests – Non-Parametric Tests 8.5.1 Chi-Quadrat Unabhängigkeitstest – Chi-Square Test of Independence Test der Hypothese H0, dass zwei Zufallsvariable X und Y voneinander unabhängig sind. Anwendbar ab dem Mindestwert für erwartete Häufigkeiten: he(xj , yk) > 5 j, k (Error! Use the Home tab to app Ermittlung des 2-Wertes mit Hilfe der erwarteten Häufigkeiten he aus der Kontingenztabelle: Prüfgröße: 2 q m h( x ; y j ) he ( x j ; y k ) 2 k he ( x j ; y k ) j 1 k 1 (Error! Use the Home tab to apply Überschrift 1 to the text tha Ablesen des kritischen 2-Wertes c2 in der Tabelle mit = (m-1) (q-1) Freiheitsgraden – degrees of freedom (dof) (Error! Use the Home tab to apply Überschrift 1 to the 8.5.2 Chi-Quadrat Anpassungstest – Chi-Square Test for Distributions H0: Die Grundgesamtheit folgt einer bestimmten Verteilung. (für hei > 5 i - vgl. (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here.-50)) Ermittlung des 2-Wertes mit Hilfe der erwarteten Häufigkeiten he aus der Kontingenztabelle: Prüfgröße: 2 n i 1 h h e 2 i i hie (Error! Use the Home tab to apply Überschrift 1 to the text that you want to appe Ablesen des kritischen 2-Wertes c2 in der Tabelle mit = (n-1) Freiheitsgraden.(Error! Use the Home tab to appl Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 24 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. 9 Tabellenanhang Dieser Tabellenanhang wurde weitgehend entnommen aus: Puhani, Josef: „Kleine Formelsammlung zur Statistik“ 1994, BVB Bamberg. Vgl. die weiteren Quellenangaben (s.u.). Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 25 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 26 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 27 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Ablesen der Tabellen der Standardnormalverteilung: FSN(z) = 1 2 misst die Fläche links des positiven Wertes z: z FSN ( z ) f ( x) dx W (Z z ) , d.h. die Wahrscheinlichkeit, dass die standardisierte Zufallsvariable Z höchstens den Wert z annimmt. D(z) = 1- misst die Fläche des symmetrischen Sicherheitsbereiches: z D( z ) f ( x) dx W ( z Z z ) FSN ( z ) FSN ( z ) , z d.h. die Wahrscheinlichkeit, dass die standardisierte Zufallsvariable Z einen Wert zwischen –z und z annimmt. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 28 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 29 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 30 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 31 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Tafel 6 a Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 32 Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Error! Use the Home tab to apply Überschrift 1 to the text that you want to appear here. Tafel 6 b Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite 33 Inhaltsverzeichnis Inhalt der Formelsammlung – Formulary Table of Contents Teil I Deskriptive (beschreibende) Statistik Descriptive Statistics 1 Grundlagen – Fundamentals .............................................................................................. 1 2 Auswertung und Darstellung eindimensionaler Daten – Analysing and Displaying One-dimensional Data ................................................................... 1 2.1 Häufigkeiten – Frequencies .......................................................................................................... 1 2.2 Lagemaße (Mittelwerte) – Measures of Central Tendency (Averages)................................................ 2 2.3 Streuungsmaße – Measures of Variability / Deviation ................................................................... 3 3 Zusammenhänge zwischen mehrdimensionalen Daten – Relations between Multi-Dimensional Variables ..................................................................... 4 3.1 Allgemeine Grundbegriffe – Basic Concepts ............................................................................. 4 3.2 Zusammenhänge zwischen metrisch skalierten Merkmalen – Correlation of metrically scaled Variables ............................................................................................... 4 3.3 Rangkorrelationen für ordinal skalierte Merkmale (nach Spearman) – Rank Correlation for ordinal Variables (Spearman’s ) ......................................................................... 5 3.4 Kontingenzanalyse bei nominal skalierten Variablen – Contingency Measures (Association of nominal Variables) ............................................................................................................................ 5 4 Elemente der Zeitreihenanalyse – Time Series Analysis (TSA) ...................................... 6 4.1 Komponenten einer Zeitreihe – Components of a Time Series ....................................................... 6 4.2 Glättung durch Gleitende Durchschnitte – Smoothing with Moving Averages (MA) ........................... 6 4.3 Glättung durch lineare Trendfunktion – Smoothing with a Linear Trend Function .............................. 6 4.4 Ermittlung der (additiven) Saisonkomponente und Saisonbereinigung – Analysis of Seasonality ...................................................................................................................... 7 4.5 Prognosen – Forecasting .............................................................................................................. 7 5 Maß- und Indexzahlen – Index Numbers ......................................................................... 8 5.1 Verhältniszahlen – Ratios .......................................................................................................... 8 5.2 Preis- und Mengenindizes – Price and Quantity Indices ................................................................. 8 Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite i Inhaltsverzeichnis – Table of contents Teil II Induktive (schließende) Statistik Statistical Inference 6 Kombinatorik & Wahrscheinlichkeitsrechnung – Combination Theory & Probabilities ........................................................................................................................... 9 6.1 Kombinatorik – Combination Theory ............................................................................................. 9 6.2 Grundbegriffe und Definitionen der Wahrscheinlichkeitsrechnung – Basic Concepts and Definitions of Calculus of Probabilities ........................................................................ 9 6.3 Rechnen mit Wahrscheinlichkeiten – Calculation with Probabilities.............................................. 10 7 Theoretische Verteilungen – Theoretical Distributions ................................................... 11 7.1 Zufallsvariablen – Random Variables .......................................................................................... 11 7.1.1 Dichte- und Verteilungsfunktion – Density and Distribution Function (Cumulated Density function - cdf) .................................................... 11 7.1.2 Parameter von Verteilungen – Parameters of Distributions ........................................................... 11 7.2 Einige spezielle Verteilungen – Specific Distributions .................................................................. 12 7.2.1 7.2.2 7.2.3 7.2.4 Diskrete Verteilungen – Discrete Distributions .............................................................................. 12 Stetige Verteilungen – Continuous Distributions ............................................................................ 13 Zentraler Grenzwertsatz – Central Limit Theorem ......................................................................... 14 Approximationen von Verteilungen – Approximation of Distributions ........................................... 14 8 Schluss von der Stichprobe auf die Grundgesamtheit – Statistical Inference ............. 15 8.1 Schätztheorie: Stichprobenfunktionen – Estimation Theory ....................................................... 15 8.2 Konfidenzintervalle zur Parameterschätzung – Confidence Intervals .......................................... 15 8.2.1 Konfidenzintervall für den Mittelwert – Confidence Interval for the Mean..................................... 15 8.2.2 Konfidenzintervall für den Anteilswert – Confidence Interval for the Proportion ........................... 17 8.2.3 Notwendiger Stichprobenumfang – Sample Size........................................................................ 17 8.3 Hypothesentests – Hypothesis Testing ..................................................................................... 18 8.4 Parametrische Tests – Parametric Tests ..................................................................................... 19 8.4.1 8.4.2 8.4.3 8.4.4 Testen von Mittelwerten – Testing Means .................................................................................. 19 Testen von Anteilswerten – Testing Proportions .......................................................................... 19 Zweistichprobentests – Two Sample Tests .................................................................................. 20 Testen der Regressionskoeffizienten bei Mehrfachregression – Testing Coefficients of Multivariate Regressions ................................................................................. 20 8.5 Nicht-Parametrische Tests – Non-Parametric Tests .................................................................... 21 8.5.1 Chi-Quadrat Unabhängigkeitstest – Chi-Square Test of Independence ......................................... 21 8.5.2 Chi-Quadrat Anpassungstest – Chi-Square Test for Distributions ................................................... 21 9 Tabellenanhang ................................................................................................................. 22 Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite ii Inhaltsverzeichnis – Table of contents ******* HIERVOR EINMAL EDITIERT ***** Inhalt der Formelsammlung – Formulary Table of Contents 1 Grundlagen – Fundamentals .................................................................................................. 1 2 Auswertung und Darstellung eindimensionaler Daten – Analysing and Displaying One-dimensional Data .................................................................................................................. 1 2.1 Häufigkeiten – Frequencies .......................................................................................................... 1 2.2 Lagemaße (Mittelwerte) – Measures of Central Tendency (Averages)................................................ 2 2.3 Streuungsmaße – Measures of Variability / Deviation ................................................................... 3 3 Zusammenhänge zwischen mehrdimensionalen Daten – Relations between MultiDimensional Variables .................................................................................................................. 4 3.1 Allgemeine Grundbegriffe – Basic Concepts ............................................................................. 4 3.2 Zusammenhänge zwischen metrisch skalierten Merkmalen – Correlation of metrically scaled Variables ........................................................................................................................................ 4 3.3 Rangkorrelationen für ordinal skalierte Merkmale (nach Spearman) – Rank Correlation for ordinal Variables (Spearman’s ) .................................................................................................... 5 3.4 Kontingenzanalyse bei nominal skalierten Variablen – Contingency Measures (Association of nominal Variables) ............................................................................................................................ 5 4 Elemente der Zeitreihenanalyse – Time Series Analysis (TSA) .............................................. 6 4.1 Komponenten einer Zeitreihe – Components of a Time Series ....................................................... 6 4.2 Glättung durch Gleitende Durchschnitte – Smoothing with Moving Averages (MA) ........................... 6 4.3 Glättung durch lineare Trendfunktion – Smoothing with a Linear Trend Function .............................. 6 4.4 Ermittlung der (additiven) Saisonkomponente und Saisonbereinigung – Analysis of Seasonality ..................................................................................................................................... 7 4.5 Prognosen – Forecasting .............................................................................................................. 7 5 Maß- und Indexzahlen – Indices........................................................................................ 8 5.1 Verhältniszahlen – Ratios .......................................................................................................... 8 5.2 Preis- und Mengenindizes – Price and Quantity Indices ................................................................. 8 6 Kombinatorik & Wahrscheinlichkeitsrechnung – Theory of Combination & Probabilities ...... 9 6.1 Kombinatorik – Combination Theory ............................................................................................. 9 6.2 Grundbegriffe und Definitionen der Wahrscheinlichkeitsrechnung – Basic Concepts and Definitions of Calculus of Probabilities ................................................................................................... 9 6.3 Rechnen mit Wahrscheinlichkeiten – Calculation with Probabilities.............................................. 10 7 Theoretische Verteilungen – Theoretical Distributions .......................................................... 11 7.1 Zufallsvariablen – Random Variables .......................................................................................... 11 Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite iii Inhaltsverzeichnis – Table of contents 7.1.1 Dichte- und Verteilungsfunktion – Density and Distribution Function (Cumulated Density function - cdf) .................................................................................................................................. 11 7.1.2 Parameter von Verteilungen – Parameters of Distributions ........................................................... 11 7.2 Einige spezielle Verteilungen – Specific Distributions .................................................................. 12 7.2.1 7.2.2 7.2.3 7.2.4 Diskrete Verteilungen – Discrete Distributions .............................................................................. 12 Stetige Verteilungen – Continuous Distributions ............................................................................ 13 Zentraler Grenzwertsatz – Central Limit Theorem ......................................................................... 14 Approximationen von Verteilungen – Approximation of Distributions ........................................... 14 8 Schluss von der Stichprobe auf die Grundgesamtheit – Statistical Inference ............. 15 8.1 Schätztheorie: Stichprobenfunktionen – Estimation Theory ....................................................... 15 8.2 Konfidenzintervalle zur Parameterschätzung – Confidence Intervals .......................................... 15 8.2.1 Konfidenzintervall für den Mittelwert – Confidence Interval for the Mean..................................... 15 8.2.2 Konfidenzintervall für den Anteilswert – Confidence Interval for the Proportion ........................... 17 8.2.3 Notwendiger Stichprobenumfang – Sample Size........................................................................ 17 8.3 Hypothesentests – Hypothesis Testing ..................................................................... 18 8.4 Parametrische Tests – Parametric Tests ..................................................................................... 19 8.4.1 8.4.2 8.4.3 8.4.4 Testen von Mittelwerten – Testing Means .................................................................................. 19 Testen von Anteilswerten – Testing Proportions .......................................................................... 19 Zweistichprobentests – Two Sample Tests .................................................................................. 20 Testen der Regressionskoeffizienten bei Mehrfachregression – Testing Coefficients of Multivariate Regressions .................................................................................................................. 20 8.5 Nicht-Parametrische Tests – Non-Parametric Tests .................................................................... 21 8.5.1 Chi-Quadrat Unabhängigkeitstest – Chi-Square Test of Independence ......................................... 21 8.5.2 Chi-Quadrat Anpassungstest – Chi-Square Test for Distributions ................................................... 21 9 Tabellenanhang ................................................................................................................. 22 ******* HIERVOR EINMAL EDITIERT ***** Formelsammlung Statistik, 5. Auflage WS 2002 / 2003 Seite iv