Zusammenfassung 1. Tag

Werbung
Zusammenfassung PVK Statistik
(Diese Zusammenfassung wurde von Carlos Mora erstellt. Die Richtigkeit der Formeln ist ohne Gewähr.)
Verteilungen von diskreten Zufallsvariablen
Binomialverteilung
X = Anzahl „Erfolge/Treffer“ in n unabhängigen
Versuchen (p = Erfolgswahrscheinlichkeit)
Beschreibung
Darstellung
Werte, die X annehmen
kann (diskret -> abzählbar)
(
)
abzählbare, endliche Anzahl Ereignisse
0, 1, 2, 3, 4 …, n


Wahrscheinlichkeitsfunktion
f(x)
( )
Kumulative
Verteilungsfunktion F(x)
Poissonverteilung
X = Anzahl „Erfolge“ pro Intervall (Zeit, Fläche usw.),
( )
( )
(
( )
abzählbare, unendliche Anzahl Ereignisse
0, 1, 2, 3, …


)
∑( )
(
Allgemeine Formeln


Selber herausfinden, ohne Formel…
z.B. bei Jasskarten: P[König]=P[X=4]=
( )
( )
)
abzählbar
…,-2, -1, 0, 1, 2, …
( )
∑
∑
Wichtig: ( )
( )
Erwartungswert E(X)
( )
( )
Varianz Var(X)
( )
Standardabweichung (X)
Approximatives zweiseitiges
95% Vertrauensintervall
(
√
√
( )
)
Vertrauensintervall für die Erfolgswahr’keit p.
Approx. einseitiges 95%
Vertrauensintervall
√
]
√
[
(
(
)
)
( )
)
( )
(
( )
√
( )
∑
( )
( )
( ))
∑(
√
( )
√
Vertrauensintervall für .
] für
[ für
( ) ist ein Spezialfall der Binomialverteilung für n=1 (d.h.
WICHTIG: Bernoulliverteilung
( )). Es wird nur ein einziger Versuch
beschrieben, die Wahrscheinlichkeit für einen Erfolg ist gleich p und die Wahrscheinlichkeit für einen Misserfolg ist gleich 1-p.
WICHTIG: APPROXIMATIONEN: Für n = gross ist es mühsam, ohne Computer die kumulative Wahrscheinlichkeit
berechnen. Deshalb wird meistens mit anderen Verteilungen approximiert:
(
1. Normalapproximation (für n =gross, sehr häufig verwendet):
[
]
(
;
(
)
)  z-Tabelle
2. Poissonapproximation (für n=gross und p=klein):
PVK Statistik 2012
);
der Binomialverteilung zu
( );
1
Carlos Mora
Verteilungen von stetigen Zufallsvariablen (Teil 1)
Allgemeine stetige Verteilung
Exponentialverteilung
X = meistens Zeitdauer für etwas, z.B. Wartezeiten
auf Ausfälle, radioaktiver Zerfall
Beschreibung
Uniforme Verteilung
Alle Werte sind gleich wahrscheinlich zwischen a
und b.
Darstellung
( )
Werte, die X annehmen
kann
Wahrscheinlichkeitsfunktion
( ) = DICHTE

Kumulative
Verteilungsfunktion ( )
( )
( )
∫
Erwartungswert ( )
Median
Varianz
( )
Standardabweichung (X)
PVK Statistik 2012
( )
}
{
}
{
}
( )
{
( )
( )
∫
}
Median
( )
( )

( )
( )
Median
nach m auflösen

nach m auflösen.
( )
( )
, da
∫

{
( )
( )
( )
allg.:
( )
( )
Median
( )
∫
)
alle Werte zwischen a und b,
allg.:
( )
WICHTIG:

( )


Alles von 0 bis undendlich,
allg.:
WICHTIG:


∫
und

Je nach Verteilung, allg.
(
( ))
∫ (
( )
√
( )
( )
( )
( )
2
√
( )
nach m auflösen
( )
( )
( )
(
√
)
( )
Carlos Mora
Verteilungen von stetigen Zufallsvariablen (Teil 2)
Beschreibung
Normalverteilung
Am häufigsten für Messdaten verwendete Verteilung
und geeignet, um andere diskrete und stetige
Verteilungen anzunähern (für grosses n) -> Zentraler
Grenzwertsatz, Normalapproximation.
(
Darstellung
Werte, die X annehmen
kann
Wahrscheinlichkeitsfunktion
( ) = DICHTE
)

allg.:
allg.:
(
)
( )
√
WICHTIG: F(x) kann nicht explizit dargestellt werden.

Deshalb STANDARDISIEREN (Umformung in
Standardnormalverteilung):
( )
[
Erwartungswert ( )
und
(
)

( )
Kumulative
Verteilungsfunktion ( )
Standard-Normalverteilung
Spezialfall der Normalverteilung. Nur für diese
Normalverteilung sind die Werte berechnet und
tabelliert (z-Tabelle).
]
(
)
( )
( ) = W’keit aus Z-Tabelle

z = Zahl mit 2 Nachkommastellen;
dazugehörige kumulat. W’keit in z-Tabelle
ablesen
WICHTIG: Falls
 z.B. z = -2
( )

( ) (da Verteilung
symmetrisch um 0)
( )
( )
( )
( ) (Normalvert. sind symmetrisch)
Median ( )
Varianz
( )
Standardabweichung (X)
( )
( ) (Normalvert. sind symmetrisch)
( )
( )
( )
√
( )
( )
√
Geschätzte empirische Standardabweichung:
√
̂
Zweiseitiges 95 %
Vertrauensintervall für
Einseitiges 95%
Vertrauensintervall
PVK Statistik 2012
̅)
∑(
̂
̅
]
[ ̅
̂
̅
̂
√
√
√
]
[
für
für
3
Carlos Mora
Vorgehen für Statistische Tests
Diskrete (abzählbar) oder stetige (z.B. Messdaten) Zufallsvariable?
diskret
stetig
Binomialverteilung? (Anzahl Treffer, n gegeben)
JA
Binomialtest
Normalapproximation für n
gross
NEIN
e
Poissonverteilung?
(Anzahl Treffer ohne
def. n) Poissontest
Ein-Stichproben-Analyse
Vorzeichen-Test
Wilcoxon-Test
NEIN
e
JA
Poissonapprox. für
n gross und p klein
𝜎 bekannt  z-Test
PVK Statistik 2012
Normalverteilung?  Normal-Q-Q plot
Zwei-Stichproben-Analyse
gepaart  t-Test
der Paardifferenz
ungepaart  Zwei-Stichproben t-Test
mit gemeinsamer Varianz 𝑠𝑝𝑜𝑜𝑙
𝜎 unbekannt, nur
geschätzt ( 𝜎̂ )
 t-Test
4
Carlos Mora
Binomialtest
(Poissontest fast gleich, einfach anstatt p wird mit
(
1. Modell:
ersetzt und
wird mit der Poissonverteilung berechnet).
); Beobachtung x
A) OHNE Normalapproximation
2. Hypothese
2. Hypothese
(einseitig)
3. Testresultat:
a. P-Wert =
 falls P-Wert < ,
2. Hypothese
(einseitig)
berechnen
verwerfen
b. Verwerfungsbereich:
 cu so wählen, dass
falls
,
verwerfen
3. Testresultat:
a. P-Wert =
berechnen
 falls P-Wert < ,
(zweiseitig)
3. Testresultat:
a. P-Wert =
 falls P-Wert < ,
=
berechnen
verwerfen
verwerfen
b. Verwerfungsbereich:
 cu und co so wählen, dass

b. Verwerfungsbereich:
 co so wählen, dass
falls
,
verwerfen

falls
,
verwerfen
B) MIT Normalapproximation (für grosse n) z-Test
2. Hypothese
2. Hypothese
2. Hypothese
(einseitig)
(einseitig)
(
)
3. Approximation:
;
(
)
4. z-Test (für Normalapproximation)
 Berechne
(
)
3. Approximation:
;
(
)
4. z-Test (für Normalapproximation)
 Berechne
(
 Falls
Wichtigste Werte von
),
(
 Falls
( ) für z-Test aus z-Tabelle:
(
)
(zweiseitig)
),
(
;
WICHTIG: Es ist auch möglich, den Verwerfungsbereich K wie bei A) zu berechnen mit
(Falls zweiseitiger Test, mit
PVK Statistik 2012
(
) rechnen.)
5
(
)
3. Approximation:
;
(
)
4. z-Test (für Normalapproximation)
 Berechne
 Falls | |
)
;
(
)
;
(
(
),
)
(
)
 abrunden auf ganze Zahl
(
)
 aufrunden auf ganze Zahl
Carlos Mora
Der z-Test für independent, identically distributed (i.i.d) und normalverteilte Messdaten

bekannt (nicht geschätzt)
(
1. Modell:
mit dem arithmetischen Mittel ̅
) mit n i.i.d. Stichproben (Messungen)
2. Hypothese
2. Hypothese
(einseitig)
2. Hypothese
(einseitig)
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
(zweiseitig)
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
(
) (-> Zentraler
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
√
( ̅
Grenzwertsatz)
 Berechne
)
√
( ̅
)
√
( ̅
4. Testentscheid (einfach):
 Falls
(
),
4. Testentscheid (einfach):
 Falls
(
),
4. Testentscheid (einfach):
 Falls | |
(
),
5. Verwerfungsbereich:
(
)
falls
,
verwerfen
5. Verwerfungsbereich:
(
)
falls
,
verwerfen
5. Verwerfungsbereich:
Wichtigste Werte von
PVK Statistik 2012
( ) für z-Test aus z-Tabelle:
(
)
(
;
6
)
]
falls
;
(
)
;
(
,
)
(
)] [
verwerfen
(
)
Carlos Mora
)
[
Der t-Test für independent, identically distributed (i.i.d) und normalverteilte Messdaten

nicht bekannt (nur geschätzt, d.h. ̂)
(
1. Modell:
mit dem arithmetischen Mittel ̅
) mit n unabhängigen Stichproben (Messungen)
2. Hypothese
2. Hypothese
(einseitig)
(einseitig)
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
̂
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
(zweiseitig)
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
̂
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
√
4. Testentscheid:
 Falls
2. Hypothese
( ̅
̂
,
5. Verwerfungsbereich:
]
]
falls
,
verwerfen
3. Für die Teststatistik nehmen wir an, dass
̅̅̅̅
(
̂
) (-> Zentraler
Grenzwertsatz)
 Berechne
)
( ̅
̂
√
4. Testentscheid:
 Falls
,
5. Verwerfungsbereich:
[
[
falls
,
verwerfen
)
( ̅
̂
√
4. Testentscheid:
 Falls | |
)
,
5. Verwerfungsbereich:
]
falls
]
,
[
[
verwerfen
 t-Werte können in der t-Tabelle nachgeschaut werden!
WICHTIG: Bei einem t-Test ist der Verwerfungsbereich und die Macht kleiner als bei einem entsprechenden z-Test (Grund: Durch die Verwendung einer bloss
geschätzten Standardabweichung erhöht sich die Unsicherheit!)
PVK Statistik 2012
7
Carlos Mora
Statistische Tests für nicht-normalverteilte i.i.d. Messdaten
Der Vorzeichentest
1. Modell:
mit n unabhängigen Stichproben (Messungen)
( )
(
)
Annahme:
 50% der Daten liegen jeweils über- und unterhalb des Medians!
Bemerkung: Für unser Wissensniveau nehmen wir der Einfachheit halber immer an, dass die „beliebige Verteilung“ symmetrisch ist (wie auch die
( )
Normalverteilung), das heisst: ( )
2. Hypothese
2. Hypothese
(einseitig)
(einseitig)
3. Teststatistik:
(zweiseitig)
3. Teststatistik:
(Messungen grösser als
 V ist binomialverteilt!!!
(
4. Testresultat:
a. P-Wert =
 falls P-Wert < ,
2. Hypothese
 Treffer
) werden gezählt
)
berechnen
verwerfen
b. Verwerfungsbereich:
 cu so wählen, dass
falls
,
verwerfen
3. Teststatistik:
(Messungen grösser als
 V ist binomialverteilt!!!
(
4. Testresultat:
a. P-Wert =
 falls P-Wert < ,
 Treffer
) werden gezählt
)
berechnen
verwerfen
b. Verwerfungsbereich:
 co so wählen, dass
falls
,
verwerfen
(Messungen grösser als
 V ist binomialverteilt!!!
(
4. Testresultat:
a. P-Wert =
 falls P-Wert < ,
 Treffer
) werden gezählt
)
berechnen
verwerfen
b. Verwerfungsbereich:
 cu und co so wählen, dass


falls
,
verwerfen
WICHTIG: Auch beim Vorzeichentest ist eine Normalapproximation möglich!
Wilcoxon-Test
„Der Wilcoxon-Test ist in den allermeisten Fällen vorzuziehen: er hat in vielen Situationen oftmals wesentlich grössere Macht als der t- und als der VorzeichenTest, und selbst in den ungünstigsten Fällen ist er nie viel schlechter.“ (Skript, S. 70, M.Kalisch 2011)
Bemerkung: Dieser Test muss nicht von Hand berechnet werden können. Es wird nur der P-Wert angegeben.
PVK Statistik 2012
8
Carlos Mora
Zwei Stichproben t-Test für gepaarte Stichproben (t-Test der Paardifferenzen)
1. Zwei gepaarte Stichproben
(
mit
̂ )
und
 Für den Test verwenden wir nur die Paardifferenz
: Erwartungswert der Paardifferenzen
(
mit
(
mit
̂ )
̂ )
geschätzte Varianz der Paardifferenzen
̅ arithmetischer Durchschnitt der Differenzen
2. Hypothese
2. Hypothese
(
(
)
)
3. Als Teststatistik nehmen wir
̂
̅̅̅̅
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
√
4. Testentscheid:
 Falls
2. Hypothese
(
(
( ̅
̂
,
5. Verwerfungsbereich:
]
]
falls
,
verwerfen
)
)
(
(
3. Als Teststatistik nehmen wir
̂
̅̅̅̅
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
)
( ̅
̂
√
4. Testentscheid:
 Falls
,
5. Verwerfungsbereich:
[
[
falls
,
verwerfen
)
)
3. Als Teststatistik nehmen wir
̂
̅̅̅̅
(
) (-> Zentraler
Grenzwertsatz)
 Berechne
)
( ̅
̂
√
4. Testentscheid:
 Falls | |
)
,
5. Verwerfungsbereich:
]
falls
]
,
[
[
verwerfen
 t-Werte können in der t-Tabelle nachgeschaut werden!
PVK Statistik 2012
9
Carlos Mora
Zwei-Stichproben t-Test für ungepaarte Stichproben (gilt auch für unterschiedliche Varianzen!)
1. Zwei ungepaarte Stichproben
mit
(
̂ )
und
mit

(Gruppengrösse muss nicht gleich sein, wie bei gepaarten Stichproben)
 ̅ und ̅ sind die Durchschnitte der Daten der jeweiligen Gruppen.
√
2. Hypothese
3. Berechne
(
̅
2. Hypothese
3. Berechne
̅
̂ )
)̂ )
2. Hypothese
̅
√
4. Testentscheid:
 Falls
)̂
((
(
3. Berechne
̅
√
,
5. Verwerfungsbereich:
]
]
falls
,
verwerfen
4. Testentscheid:
 Falls
4. Testentscheid:
 Falls | |
,
5. Verwerfungsbereich:
[
[
falls
,
verwerfen
WICHTIG: Zweiseitiges 95% Vertrauensintervall für die Gruppendifferenz
( ̅
̅
√
,
5. Verwerfungsbereich:
]
falls
PVK Statistik 2012
̅
]
,
[
[
verwerfen
von ungepaarten Stichproben:
√
̅ )
10
Carlos Mora
Fehler 1. Art
Definition: Die Nullhypothese wird fälschlicherweise verworfen, obwohl sie zutrifft.
Da man dies unbedingt vermeiden will, wurde die Wahrscheinlichkeit dafür willkürlich bei höchstens 5% festgelegt (manchmal auch 1%). Die W’keit für den
Fehler 1. Art ist somit gleich gross wie das gewählte Signifikanzniveau .
Fehler 2. Art
Definition: Die Nullhypothese wird nicht verworfen, obwohl die Alternativhypothese zutrifft.
Das heisst, eigentlich stimmt die Alternativhypothese, trotzdem zeigt uns das der Test nicht an, weil er z.B. zu ungenau ist (zu wenig Stichproben genommen
etc.).
Die Wahrscheinlichkeit für den Fehler 2. Art wird immer für ein bestimmtes als tatsächlich „wahr“ angenommenes
verwendet man die entsprechenden Verteilungen
(
) bzw.
(
).
Je nach Alternativhypothese wird der Fehler 2. Art unterschiedlich bestimmt:
(oder
) berechnet. Dabei
(oder
) berechnet. Bei den
Macht
Definition: Die Nullhypotheses wird verworfen, wenn die Alternativhypothese zutrifft.
Dies ist der erwünschte Fall. Auch die Macht wird immer für ein bestimmtes als tatsächlich „wahr“ angenommenes
exakten Wissenschaften ist es üblich, dass die W’keit für die Macht eines Tests mindestens 80% beträgt.
PVK Statistik 2012
11
Carlos Mora
Herunterladen