Zusammenfassung PVK Statistik (Diese Zusammenfassung wurde von Carlos Mora erstellt. Die Richtigkeit der Formeln ist ohne Gewähr.) Verteilungen von diskreten Zufallsvariablen Binomialverteilung X = Anzahl „Erfolge/Treffer“ in n unabhängigen Versuchen (p = Erfolgswahrscheinlichkeit) Beschreibung Darstellung Werte, die X annehmen kann (diskret -> abzählbar) ( ) abzählbare, endliche Anzahl Ereignisse 0, 1, 2, 3, 4 …, n Wahrscheinlichkeitsfunktion f(x) ( ) Kumulative Verteilungsfunktion F(x) Poissonverteilung X = Anzahl „Erfolge“ pro Intervall (Zeit, Fläche usw.), ( ) ( ) ( ( ) abzählbare, unendliche Anzahl Ereignisse 0, 1, 2, 3, … ) ∑( ) ( Allgemeine Formeln Selber herausfinden, ohne Formel… z.B. bei Jasskarten: P[König]=P[X=4]= ( ) ( ) ) abzählbar …,-2, -1, 0, 1, 2, … ( ) ∑ ∑ Wichtig: ( ) ( ) Erwartungswert E(X) ( ) ( ) Varianz Var(X) ( ) Standardabweichung (X) Approximatives zweiseitiges 95% Vertrauensintervall ( √ √ ( ) ) Vertrauensintervall für die Erfolgswahr’keit p. Approx. einseitiges 95% Vertrauensintervall √ ] √ [ ( ( ) ) ( ) ) ( ) ( ( ) √ ( ) ∑ ( ) ( ) ( )) ∑( √ ( ) √ Vertrauensintervall für . ] für [ für ( ) ist ein Spezialfall der Binomialverteilung für n=1 (d.h. WICHTIG: Bernoulliverteilung ( )). Es wird nur ein einziger Versuch beschrieben, die Wahrscheinlichkeit für einen Erfolg ist gleich p und die Wahrscheinlichkeit für einen Misserfolg ist gleich 1-p. WICHTIG: APPROXIMATIONEN: Für n = gross ist es mühsam, ohne Computer die kumulative Wahrscheinlichkeit berechnen. Deshalb wird meistens mit anderen Verteilungen approximiert: ( 1. Normalapproximation (für n =gross, sehr häufig verwendet): [ ] ( ; ( ) ) z-Tabelle 2. Poissonapproximation (für n=gross und p=klein): PVK Statistik 2012 ); der Binomialverteilung zu ( ); 1 Carlos Mora Verteilungen von stetigen Zufallsvariablen (Teil 1) Allgemeine stetige Verteilung Exponentialverteilung X = meistens Zeitdauer für etwas, z.B. Wartezeiten auf Ausfälle, radioaktiver Zerfall Beschreibung Uniforme Verteilung Alle Werte sind gleich wahrscheinlich zwischen a und b. Darstellung ( ) Werte, die X annehmen kann Wahrscheinlichkeitsfunktion ( ) = DICHTE Kumulative Verteilungsfunktion ( ) ( ) ( ) ∫ Erwartungswert ( ) Median Varianz ( ) Standardabweichung (X) PVK Statistik 2012 ( ) } { } { } ( ) { ( ) ( ) ∫ } Median ( ) ( ) ( ) ( ) Median nach m auflösen nach m auflösen. ( ) ( ) , da ∫ { ( ) ( ) ( ) allg.: ( ) ( ) Median ( ) ∫ ) alle Werte zwischen a und b, allg.: ( ) WICHTIG: ( ) Alles von 0 bis undendlich, allg.: WICHTIG: ∫ und Je nach Verteilung, allg. ( ( )) ∫ ( ( ) √ ( ) ( ) ( ) ( ) 2 √ ( ) nach m auflösen ( ) ( ) ( ) ( √ ) ( ) Carlos Mora Verteilungen von stetigen Zufallsvariablen (Teil 2) Beschreibung Normalverteilung Am häufigsten für Messdaten verwendete Verteilung und geeignet, um andere diskrete und stetige Verteilungen anzunähern (für grosses n) -> Zentraler Grenzwertsatz, Normalapproximation. ( Darstellung Werte, die X annehmen kann Wahrscheinlichkeitsfunktion ( ) = DICHTE ) allg.: allg.: ( ) ( ) √ WICHTIG: F(x) kann nicht explizit dargestellt werden. Deshalb STANDARDISIEREN (Umformung in Standardnormalverteilung): ( ) [ Erwartungswert ( ) und ( ) ( ) Kumulative Verteilungsfunktion ( ) Standard-Normalverteilung Spezialfall der Normalverteilung. Nur für diese Normalverteilung sind die Werte berechnet und tabelliert (z-Tabelle). ] ( ) ( ) ( ) = W’keit aus Z-Tabelle z = Zahl mit 2 Nachkommastellen; dazugehörige kumulat. W’keit in z-Tabelle ablesen WICHTIG: Falls z.B. z = -2 ( ) ( ) (da Verteilung symmetrisch um 0) ( ) ( ) ( ) ( ) (Normalvert. sind symmetrisch) Median ( ) Varianz ( ) Standardabweichung (X) ( ) ( ) (Normalvert. sind symmetrisch) ( ) ( ) ( ) √ ( ) ( ) √ Geschätzte empirische Standardabweichung: √ ̂ Zweiseitiges 95 % Vertrauensintervall für Einseitiges 95% Vertrauensintervall PVK Statistik 2012 ̅) ∑( ̂ ̅ ] [ ̅ ̂ ̅ ̂ √ √ √ ] [ für für 3 Carlos Mora Vorgehen für Statistische Tests Diskrete (abzählbar) oder stetige (z.B. Messdaten) Zufallsvariable? diskret stetig Binomialverteilung? (Anzahl Treffer, n gegeben) JA Binomialtest Normalapproximation für n gross NEIN e Poissonverteilung? (Anzahl Treffer ohne def. n) Poissontest Ein-Stichproben-Analyse Vorzeichen-Test Wilcoxon-Test NEIN e JA Poissonapprox. für n gross und p klein 𝜎 bekannt z-Test PVK Statistik 2012 Normalverteilung? Normal-Q-Q plot Zwei-Stichproben-Analyse gepaart t-Test der Paardifferenz ungepaart Zwei-Stichproben t-Test mit gemeinsamer Varianz 𝑠𝑝𝑜𝑜𝑙 𝜎 unbekannt, nur geschätzt ( 𝜎̂ ) t-Test 4 Carlos Mora Binomialtest (Poissontest fast gleich, einfach anstatt p wird mit ( 1. Modell: ersetzt und wird mit der Poissonverteilung berechnet). ); Beobachtung x A) OHNE Normalapproximation 2. Hypothese 2. Hypothese (einseitig) 3. Testresultat: a. P-Wert = falls P-Wert < , 2. Hypothese (einseitig) berechnen verwerfen b. Verwerfungsbereich: cu so wählen, dass falls , verwerfen 3. Testresultat: a. P-Wert = berechnen falls P-Wert < , (zweiseitig) 3. Testresultat: a. P-Wert = falls P-Wert < , = berechnen verwerfen verwerfen b. Verwerfungsbereich: cu und co so wählen, dass b. Verwerfungsbereich: co so wählen, dass falls , verwerfen falls , verwerfen B) MIT Normalapproximation (für grosse n) z-Test 2. Hypothese 2. Hypothese 2. Hypothese (einseitig) (einseitig) ( ) 3. Approximation: ; ( ) 4. z-Test (für Normalapproximation) Berechne ( ) 3. Approximation: ; ( ) 4. z-Test (für Normalapproximation) Berechne ( Falls Wichtigste Werte von ), ( Falls ( ) für z-Test aus z-Tabelle: ( ) (zweiseitig) ), ( ; WICHTIG: Es ist auch möglich, den Verwerfungsbereich K wie bei A) zu berechnen mit (Falls zweiseitiger Test, mit PVK Statistik 2012 ( ) rechnen.) 5 ( ) 3. Approximation: ; ( ) 4. z-Test (für Normalapproximation) Berechne Falls | | ) ; ( ) ; ( ( ), ) ( ) abrunden auf ganze Zahl ( ) aufrunden auf ganze Zahl Carlos Mora Der z-Test für independent, identically distributed (i.i.d) und normalverteilte Messdaten bekannt (nicht geschätzt) ( 1. Modell: mit dem arithmetischen Mittel ̅ ) mit n i.i.d. Stichproben (Messungen) 2. Hypothese 2. Hypothese (einseitig) 2. Hypothese (einseitig) 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ( ) (-> Zentraler Grenzwertsatz) Berechne (zweiseitig) 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ( ) (-> Zentraler 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ( ) (-> Zentraler Grenzwertsatz) Berechne √ ( ̅ Grenzwertsatz) Berechne ) √ ( ̅ ) √ ( ̅ 4. Testentscheid (einfach): Falls ( ), 4. Testentscheid (einfach): Falls ( ), 4. Testentscheid (einfach): Falls | | ( ), 5. Verwerfungsbereich: ( ) falls , verwerfen 5. Verwerfungsbereich: ( ) falls , verwerfen 5. Verwerfungsbereich: Wichtigste Werte von PVK Statistik 2012 ( ) für z-Test aus z-Tabelle: ( ) ( ; 6 ) ] falls ; ( ) ; ( , ) ( )] [ verwerfen ( ) Carlos Mora ) [ Der t-Test für independent, identically distributed (i.i.d) und normalverteilte Messdaten nicht bekannt (nur geschätzt, d.h. ̂) ( 1. Modell: mit dem arithmetischen Mittel ̅ ) mit n unabhängigen Stichproben (Messungen) 2. Hypothese 2. Hypothese (einseitig) (einseitig) 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ̂ ( ) (-> Zentraler Grenzwertsatz) Berechne (zweiseitig) 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ̂ ( ) (-> Zentraler Grenzwertsatz) Berechne √ 4. Testentscheid: Falls 2. Hypothese ( ̅ ̂ , 5. Verwerfungsbereich: ] ] falls , verwerfen 3. Für die Teststatistik nehmen wir an, dass ̅̅̅̅ ( ̂ ) (-> Zentraler Grenzwertsatz) Berechne ) ( ̅ ̂ √ 4. Testentscheid: Falls , 5. Verwerfungsbereich: [ [ falls , verwerfen ) ( ̅ ̂ √ 4. Testentscheid: Falls | | ) , 5. Verwerfungsbereich: ] falls ] , [ [ verwerfen t-Werte können in der t-Tabelle nachgeschaut werden! WICHTIG: Bei einem t-Test ist der Verwerfungsbereich und die Macht kleiner als bei einem entsprechenden z-Test (Grund: Durch die Verwendung einer bloss geschätzten Standardabweichung erhöht sich die Unsicherheit!) PVK Statistik 2012 7 Carlos Mora Statistische Tests für nicht-normalverteilte i.i.d. Messdaten Der Vorzeichentest 1. Modell: mit n unabhängigen Stichproben (Messungen) ( ) ( ) Annahme: 50% der Daten liegen jeweils über- und unterhalb des Medians! Bemerkung: Für unser Wissensniveau nehmen wir der Einfachheit halber immer an, dass die „beliebige Verteilung“ symmetrisch ist (wie auch die ( ) Normalverteilung), das heisst: ( ) 2. Hypothese 2. Hypothese (einseitig) (einseitig) 3. Teststatistik: (zweiseitig) 3. Teststatistik: (Messungen grösser als V ist binomialverteilt!!! ( 4. Testresultat: a. P-Wert = falls P-Wert < , 2. Hypothese Treffer ) werden gezählt ) berechnen verwerfen b. Verwerfungsbereich: cu so wählen, dass falls , verwerfen 3. Teststatistik: (Messungen grösser als V ist binomialverteilt!!! ( 4. Testresultat: a. P-Wert = falls P-Wert < , Treffer ) werden gezählt ) berechnen verwerfen b. Verwerfungsbereich: co so wählen, dass falls , verwerfen (Messungen grösser als V ist binomialverteilt!!! ( 4. Testresultat: a. P-Wert = falls P-Wert < , Treffer ) werden gezählt ) berechnen verwerfen b. Verwerfungsbereich: cu und co so wählen, dass falls , verwerfen WICHTIG: Auch beim Vorzeichentest ist eine Normalapproximation möglich! Wilcoxon-Test „Der Wilcoxon-Test ist in den allermeisten Fällen vorzuziehen: er hat in vielen Situationen oftmals wesentlich grössere Macht als der t- und als der VorzeichenTest, und selbst in den ungünstigsten Fällen ist er nie viel schlechter.“ (Skript, S. 70, M.Kalisch 2011) Bemerkung: Dieser Test muss nicht von Hand berechnet werden können. Es wird nur der P-Wert angegeben. PVK Statistik 2012 8 Carlos Mora Zwei Stichproben t-Test für gepaarte Stichproben (t-Test der Paardifferenzen) 1. Zwei gepaarte Stichproben ( mit ̂ ) und Für den Test verwenden wir nur die Paardifferenz : Erwartungswert der Paardifferenzen ( mit ( mit ̂ ) ̂ ) geschätzte Varianz der Paardifferenzen ̅ arithmetischer Durchschnitt der Differenzen 2. Hypothese 2. Hypothese ( ( ) ) 3. Als Teststatistik nehmen wir ̂ ̅̅̅̅ ( ) (-> Zentraler Grenzwertsatz) Berechne √ 4. Testentscheid: Falls 2. Hypothese ( ( ( ̅ ̂ , 5. Verwerfungsbereich: ] ] falls , verwerfen ) ) ( ( 3. Als Teststatistik nehmen wir ̂ ̅̅̅̅ ( ) (-> Zentraler Grenzwertsatz) Berechne ) ( ̅ ̂ √ 4. Testentscheid: Falls , 5. Verwerfungsbereich: [ [ falls , verwerfen ) ) 3. Als Teststatistik nehmen wir ̂ ̅̅̅̅ ( ) (-> Zentraler Grenzwertsatz) Berechne ) ( ̅ ̂ √ 4. Testentscheid: Falls | | ) , 5. Verwerfungsbereich: ] falls ] , [ [ verwerfen t-Werte können in der t-Tabelle nachgeschaut werden! PVK Statistik 2012 9 Carlos Mora Zwei-Stichproben t-Test für ungepaarte Stichproben (gilt auch für unterschiedliche Varianzen!) 1. Zwei ungepaarte Stichproben mit ( ̂ ) und mit (Gruppengrösse muss nicht gleich sein, wie bei gepaarten Stichproben) ̅ und ̅ sind die Durchschnitte der Daten der jeweiligen Gruppen. √ 2. Hypothese 3. Berechne ( ̅ 2. Hypothese 3. Berechne ̅ ̂ ) )̂ ) 2. Hypothese ̅ √ 4. Testentscheid: Falls )̂ (( ( 3. Berechne ̅ √ , 5. Verwerfungsbereich: ] ] falls , verwerfen 4. Testentscheid: Falls 4. Testentscheid: Falls | | , 5. Verwerfungsbereich: [ [ falls , verwerfen WICHTIG: Zweiseitiges 95% Vertrauensintervall für die Gruppendifferenz ( ̅ ̅ √ , 5. Verwerfungsbereich: ] falls PVK Statistik 2012 ̅ ] , [ [ verwerfen von ungepaarten Stichproben: √ ̅ ) 10 Carlos Mora Fehler 1. Art Definition: Die Nullhypothese wird fälschlicherweise verworfen, obwohl sie zutrifft. Da man dies unbedingt vermeiden will, wurde die Wahrscheinlichkeit dafür willkürlich bei höchstens 5% festgelegt (manchmal auch 1%). Die W’keit für den Fehler 1. Art ist somit gleich gross wie das gewählte Signifikanzniveau . Fehler 2. Art Definition: Die Nullhypothese wird nicht verworfen, obwohl die Alternativhypothese zutrifft. Das heisst, eigentlich stimmt die Alternativhypothese, trotzdem zeigt uns das der Test nicht an, weil er z.B. zu ungenau ist (zu wenig Stichproben genommen etc.). Die Wahrscheinlichkeit für den Fehler 2. Art wird immer für ein bestimmtes als tatsächlich „wahr“ angenommenes verwendet man die entsprechenden Verteilungen ( ) bzw. ( ). Je nach Alternativhypothese wird der Fehler 2. Art unterschiedlich bestimmt: (oder ) berechnet. Dabei (oder ) berechnet. Bei den Macht Definition: Die Nullhypotheses wird verworfen, wenn die Alternativhypothese zutrifft. Dies ist der erwünschte Fall. Auch die Macht wird immer für ein bestimmtes als tatsächlich „wahr“ angenommenes exakten Wissenschaften ist es üblich, dass die W’keit für die Macht eines Tests mindestens 80% beträgt. PVK Statistik 2012 11 Carlos Mora