N - Structural Biology at University of Graz

Werbung
Mathematik für MolekularbiologInnen
Vorlesung IX
Ausgewählte Kapitel der Statistik
Übersicht
• Statistische Stichproben- und Schätztheorie
• Entscheidungstheorie (Signifikanztests)
• Theorie der kleinen Stichproben, t-Test (und der
Chi2-Test)
• Literatur: Murray R. Spiegel, Statistik, Mc-Graw Hill-Book; Schaum‘s Outline
Stichproben- und Schätztheorie
Eigenschaften großer und kleiner Stichproben
• Es werden sogenannte große Stichproben mit N ≥ 30 unterschieden von den
kleinen Stichproben.
• Große Stichproben, bzw Stichprobenverteilungen von hinreichend großem
Umfang (üblicherweise N ≥ 30) sind annähernd oder exakt normal(verteilt),
selbst wenn die Grundgesamtheit nicht normalverteilt ist.
• Normalerweise müssen für kleine Stichproben andere Annahmen gemacht
werden als für große, was zu einer eigenen Theorie der kleinen Stichproben (tVerteilung) geführt hat.
Stichproben- und Schätztheorie
Stichprobenverteilungen von Parametern
• Parameter der Grundgesamtheit wie μ oder σ finden ihre Entsprechung in
den Stichproben und werden dort als Stichprobenfunktionen S bezeichnet.
Wenn mehrere Stichproben gezogen werden, erhält man eine Verteilung der
Stichprobenfunktionen (da die Werte von Probe zu Probe verschieden sind)
• Die Verteilung beliebiger Funktionen, genannt Stichprobenverteilung, hat
ihrerseits einen Mittelwert μS und eine Standardabweichung σS.
Letztere wird auch als Standardfehler der jeweiligen Stichprobenfunktion,
so z.B. als Standardfehler des Mittelwerts ( X ) bezeichnet.
• Die Stichproben werden mit einem Umfang N aus einer Grundgesamtheit
gezogen, wieder wird bei der Berechnung zwischen Ziehen mit oder ohne
Zurücklegen unterschieden.
Stichproben- und Schätztheorie
Stichprobenverteilungen von Parametern
• Stichprobenverteilung der Mittelwerte
– Unter der Voraussetzung, dass NP > N für mehrere (alle möglichen) ohne Zurücklegen
erhaltenen Proben aus einer endlichen Grundgesamtheit, gilt für die Stichprobenverteilung:
X  
X 

N

NP  N
N P 1
– dagegen vereinfacht für unendliche Grundgesamtheiten bzw. Proben mit Zurücklegen:
X  
X 

N
Stichproben- und Schätztheorie
Konfidenzintervalle
• In der Praxis werden oft Stichprobenfunktionen S anhand einer einzigen
Stichprobe ermittelt. Die Frage ist, mit welcher Wahrscheinlichkeit der Wert
von S innerhalb eines bestimmten Abstandes vom theoretischen
Stichproben-Verteilungsmittel (wenn mehrere bzw. möglichst viele
Stichproben gemacht würden), und somit auch vom gesuchten Parameter
der Grundgesamtheit entfernt ist.
• Da man Gruppen von Stichproben des Umfangs N ≥ 30 bezüglich ihrer Funktionen S
als normalverteilt annehmen kann, macht man sich die Eigenschaften der
Normalverteilung (vgl VL 7, 8) zunutze:
– der Wert einer einzigen Stichprobe liegt mit
95,45%-iger Wahrscheinlichkeit
innerhalb von  S  2 S
–das unbekannte Verteilungsmittel μS liegt
mit 95,45%-iger Wahrscheinlichkeit innerhalb
von S  2 S
S
Standardfehler der Verteilung der Stichprobenfunktion
Stichproben- und Schätztheorie
Konfidenzintervalle
• Diese Wahrscheinlichkeit ist ein Ausmaß des Vertrauens
auf einen Wert S als möglichst exaktes Schätzmaß für
den Grundgesamtheits-Parameter.
Das Vertrauen wird als Konfidenz bezeichnet, sein
Ausmaß als Konfidenzniveau.
68,3%
95,45%
99,73%
• Ein bestimmtes Konfidenzniveau entspricht also einem
Konfidenzintervall, dessen Grenzen ein Vielfaches der
Standardabweichung sind. Der Faktor zK
für den zK ∙ σ einem gewünschten Niveau entspricht ist
für Normalverteilungen tabelliert und wird als
Sicherheitskoeffizient bezeichnet
• Tabelle der Konfidenzintervalle:
Konfidenzniveau (%)
zK
99,73
99,0
98,0
96,00
95,45
95,00
90,00
80,00
68,27
50,00
3,00
2,58
2,33
2,05
2,00
1,96
1,645
1,28
1,00
0,6745
Stichproben- und Schätztheorie
Konfidenzintervalle des Stichproben-Mittelwerts
• Für die Berechnung von Konfidenzintervallen bräuchte man den Standardfehler
der Stichprobenfunktion,  S , welcher von der Varianz der Grundgesamtheit
abhängt (Standardfehler des Mittelwerts,  X   ).
N
Konfidenzniveau (%)
zK
99,73
99,0
98,0
96,00
95,45
95,00
90,00
80,00
68,27
50,00
3,00
2,58
2,33
2,05
2,00
1,96
1,645
1,28
1,00
0,6745
Für den Mittelwert einer einzelnen Stichprobe mit 90%-Konfidenzintervall gilt:
  X
liegt innerhalb von
X  zk   X  X  1,645   X  X  1,645

N
• Man kennt jedoch die Grundgesamtheit nicht und kann auch auf keine
Stichprobenverteilung zurückgreifen um den Standardfehler zu bestimmen.
Deswegen setzt man als Approximation die Varianz der Stichprobe in die
jeweilige Formel ein. Für N≥30 führt das zu befriedigenden Lösungen, für N<30
muß die Theorie der kleinen Stichproben verwendet werden.
Entscheidungstheorie
Kontext der statistischen Entscheidungstheorie
• Die Stichprobentheorie leitet die Zusammenhänge zwischen den Parametern
einer Grundgesamtheit und den korrespondierenden Stichprobenfunktionen
her, basierend auf dem Vergleich der bekannten Grundgesamtheit mit den
Funktionsverteilungen möglichst vieler Stichproben.
• Die statistische Schätztheorie verwendet die Ergebnisse der Stichprobentheorie,
um Parameter unbekannter Grundgesamtheiten anhand einzelner Stichproben
mit einer bestimmten Konfidenz abschätzen zu können.
• Die statistische Entscheidungstheorie testet Hypothesen für Parameter der
Grundgesamtheit anhand der Abweichung entsprechender Funktionen von
einzelnen Stichproben. Sie macht Aussagen über die Signifikanz solcher
Abweichungen bei gegebenen Irrtumswahrscheinlichkeiten.
Entscheidungstheorie
Statistische Hypothesen
• Statistische Hypothese: Annahme oder Vermutung über die Eigenschaften der
interessierenden Grundgesamtheit, oder über Differenzen zwischen zwei oder
mehreren Grundgesamtheiten. Oft wird die Hypothese nur aufgestellt, um sie
widerlegen zu können (z.B. Wirksamkeit Medikament A = B)
• Die Grundannahme wird auch als Nullhypothese H0 bezeichnet; eine sich davon
unterscheidende Vermutung als alternative Hypothese H1.
Beispiel: statistische Hypothese: Behauptung, eine Münze sei „echt“
=> die Wahrscheinlichkeit für Kopf betrage p = 0,5 (H0: p= 0,5)
bzw. Der Erwartungswert E (X) = E (Kopf) = Σ pi ∙ Xi = 0,5 (Binomialverteilung mit N = 1).
Das entspricht dem Mittelwert μ = 0,5 für die unendliche Grundgesamtheit von Münzwürfen.
Eine Stichprobe mit N = 50 Münzwürfen, die 40 mal Kopf ergibt, hat einen Mittelwert von
X
10  0  40 1
 0,8
50
Man würde intuitiv dazu neigen, die Nullhypothese (die Münze sei echt, p=0,5) abzulehnen.
Entscheidungstheorie
Statistische Hypothesen
• Statistische Hypothesen werden durch Zufallsstichproben überprüft, diesen
Vorgang nennt man Hypothesentest oder Signifikanztest. Wenn sich das
Ergebnis der Stichprobe deutlich von der Annahme unterscheidet, wird die
Hypothese verworfen (bzw. durch eine alternative Hypothese ersetzt).
• Das irrtümliche Ablehnen von Hypothesen wird als Fehler 1. Art bezeichnet.
Wird dagegen eine abzulehnende Hypothese fälschlicherweise angenommen,
spricht man von einem Fehler 2. Art.
Die maximal zulässige Irrtumswahrscheinlichkeit wird als Signifikanzniveau α
(oder p-Values) bezeichnet. Die Nullhypothese wird verworfen (rejected), wenn
die p-Werte kleiner als 0,05, 0,01, oder 0,001 sind, was den Wahrscheinlichkeiten
von 5%, 1% oder 0,1% entspricht, einen Fehler 1.Art zu begehen.
z.B: α = 0,05, die maximal zulässige Wahrscheinlichkeit für irrtümliches Ablehnen
einer eigentlich richtigen Nullhypothese beträgt 5 %.
Entscheidungstheorie
Hypothesen- und Signifikanztests
• Was genau bedeutet „deutlich unterscheiden“? Unter der Annahme, dass
Stichprobenfunktionen normalverteilt sind, sollten die Werte der Funktionen S
für einzelne Stichproben mit einer Wahrscheinlichkeit von (z.B.) 95% innerhalb
von S  1.96   S liegen. Wird S
S   S  S  1,96 S   S
z


 1,96
standardisiert (Z-Transformation), so dass
S
S
dann sollte mit 95%-iger Wahrscheinlichkeit z innerhalb von ± 1,96 liegen.
kritischer
Bereich
p = 0,025
p = 0,95
kritischer
Bereich
p = 0,025
Liegt der Wert der Stichprobe außerhalb
des Intervalls, ist die Wahrscheinlichkeit,
dass ein solches Ereignis vorkommt nur 5 %
wenn die Hypothese richtig ist (und das ist
eher unwahrscheinlich).
– die kritischen Bereiche werden auch als Ablehnungsbereiche des Tests bezeichnet.
– p = 5% (für die kritischen Bereiche) wird Irrtumswahrscheinlichkeit α des Tests genannt.
– zK = ±1,96 sind die kritischen Werte für 5% Irrtumswahrscheinlichkeit (vgl. Konfidenz)
Entscheidungstheorie
Hypothesen- und Signifikanztests
• Welche Schlussfolgerungen ergeben sich für die Hypothese, wenn der zWert einer Stichprobe außerhalb von ± zK (1,96 in unserem Beispiel) liegt?
– man sagt, der z-Wert sei signifikant (dies bedeutet, er weicht signifikant
vom Wert der Hypothese H0 ab).
– die Nullhypothese wird folglich mit 5% Irrtumswahrscheinlichkeit
abgelehnt.
– es besteht jedoch eine 5%-ige Wahrscheinlichkeit, dass die
Stichprobenfunktion dem Parameter der Grundgesamtheit entspricht, dass
also die Hypothese hätte angenommen werden sollen (Fehler 1. Art).
Entscheidungstheorie
Signifikanztest für Mittelwerte
• Ist die Stichprobenfunktion S das arithmetische Mittel der Stichprobe,
dann gilt nach der Stichprobentheorie:
X  
und
X 

N
• Es ergibt sich für den z-Wert des Stichprobenmittels /Hypothesentest:
Z  Transformation :
z 
S  S
S
z 
X  X
X

N ( X  )

wobei anstelle σ der Grundgesamtheit der Wert s der einzelnen Stichprobe genommen werden kann
Entscheidungstheorie
Beispiel Münzwurf: Signifikanztest für Mittelwerte
Eine Münze wird 50 mal geworfen und ergibt 40 mal Kopf; Annahme bei einer echten
Münze: μ = 0,5 , Aufstellen der Nullhypothese: H0: p=0,5;
Eine Stichprobe mit N = 50 Münzwürfen, die 40 mal Kopf ergibt, hat einen Mittelwert von
10  0  40 1
 0,8
50
Man würde intuitiv dazu neigen, die Nullhypothese (die
Münze sei echt, p=0,5) abzulehnen.
Berechnung: Ist die Abweichung signifikant?
2
2
N
10

(
0

0
,
8
)

40

(
1

0
,
8
)
2
Die Stichprobe mit N = 50 Münzwürfen
(Xi  X )

s 
 0,4
i

1
und dem Mittelwert 0,8 hat eine
s 
49
N 1
Standardabweichung von 0,4
Damit ergibt sich als z-Wert bei gegebener z  N ( X   ) z  50 (0,8  0,5)  5,3
0,4

Nullhypothese (Annahme, dass μ = 0,5)
X 
Konfidenzniveau (%)
zK
99,73
99,0
98,0
96,00
95,45
95,00
90,00
80,00
68,27
50,00
3,00
2,58
2,33
2,05
2,00
1,96
1,645
1,28
1,00
0,6745
Dieser Wert ist deutlich größer als selbst der kritische Wert zK = 3,9 für α = 0,1 %.
Lehnen wir die Hypothese ab, dass μ = 0,5, ist das Risiko für einen Fehler 1. Art << 1‰
Entscheidungstheorie
Einseitige und zweiseitige Signifikanztests
• Wenn man lediglich darauf testet, ob die Stichprobenfunktion größer als zK ist
(z.B. beim Test, ob eine Methode besser ist als eine andere), dann muss man die
Wahrscheinlichkeit lediglich auf der rechten Seite des Stichprobenmittels
berechnen
• Es ergeben sich andere Beträge für den kritischen Wert zK
kritischer
Bereich
p = 0,025
p = 0,95
p = 0,95
kritischer
Bereich
p = 0,025
kritischer
Bereich
p = 0,05
α
zK einseitig
zK zweiseitig
0,10
–1,28  1,28
–1,645  1,645
0,05
–1,645  1,645
–1,96  1,96
0,01
–2,33  2.33
–2,58  2,58
0,005
–2,58  2,58
–2,81  2,81
0,002
–2,88  2,88
–3,08  3,08
Entscheidungstheorie
Beispiel I: Aufstellen einer Entscheidungsregel
• Aufgabe: Ein etabliertes PCR-Verfahren hat eine mittlere Effizienz von 84,5% mit
einer Standardabweichung von 12,0%. Eine Firma behauptet, durch ein verbessertes
Verfahren die Effizienz bei gleicher Standardabweichung signifikant zu.
a) Stellen Sie eine Entscheidungsregel für die negative Nullhypothese auf, wobei für
Stichproben des Umfangs N = 64 die Irrtumswahrscheinlichkeit 0,01 betragen soll.
• Lösung:
a) Die negative Nullhypothese H0 besagt, dass neue Verfahren sei nicht signifikant besser,
also gleich effizient, d.h   84.5%
Der Hypothesentest (= Entscheidungsregel) soll diese Hypothese verwerfen, wenn für
das Stichprobenmittel gilt:
N ( X  )
z 
 z K mit zK = 2,33 für α = 0,01 im einseitigen Test


12
Auflösen nach X ergibt: X   
 z K  84,5 
 2,33  88,0
N
64
Die Entscheidungsregel lautet:
1. Ein Mittelwert der Stichprobe bis 88,0% bestätigt die Nullhypothese. Dies bedeutet,
dass das neue Verfahren nicht signifikant besser ist.
2. Liegt der Stichproben-Mittelwert über 88,0%, ist die Hypothese zu verwerfen.
Das neue Verfahren ist signifikant besser
Entscheidungstheorie
Beispiel I: Aufstellen einer Entscheidungsregel
• Aufgabe: Ein etabliertes PCR-Verfahren hat eine mittlere Effizienz von 84,5% mit einer
Standardabweichung von 12,0%. Eine Firma behauptet, durch ein verbessertes Verfahren die
Effizienz bei gleicher Standardabweichung signifikant zu.
b) Die tatsächliche Effizienz des neuen PCR-Verfahrens beträgt 90,0% (s = 12,0%). Mit welcher
Wahrscheinlichkeit wird nach der in a) aufgestellten Regel das neue Verfahren abgelehnt?
b) Tatsächlich ist das neue PCR-Verfahren mit 90,0% Effizienz signifikant besser. Es ist nun
die Frage zu klären, welcher Anteil von Stichproben unter dem Ablehnungswert von
88,0% liegen würde. Zur Veranschaulichung ist eine Kurven-Überlagerung hilfreich.
Rechnerisch ergibt sich der z-Wert für
die Verteilung des neuen Verfahrens aus
der Abweichung zwischen dessen
Mittelwert (90,0) und dem kritischen
Wert des Hypothesentests:
z 
N ( X  )


α' = 9%
64 (88  90)
  1,33
12
zK = -1,33 entspricht α‘ = 0,09 (Entnahme aus Tabelle: z-1,33=0,09)
Mit 9% Wahrscheinlichkeit würde eine Stichprobe des neuen Verfahrens abgelehnt werden.
Entscheidungstheorie
Signifikanz der Differenz von Mittelwerten
• Von Bedeutung ist häufig die Fragestellung, ob sich zwei Ergebnisse oder Methoden
signifikant unterscheiden. Die Theorie geht hierbei von zwei Grundgesamtheiten
aus, für die separat Stichproben genommen werden.
• Die Stichprobentheorie liefert dann für S = X folgende Ergebnisse hinsichtlich
der Verteilungen der Differenzen zwischen zwei (Gruppen von) Stichproben:
 X  X   X   X  1  2
1
und
2
1
 X X 
1
2

2
2
X1

2
X2

 21
N1

 22
N2
• Lautet die Nullhypothese, zwei Grundgesamtheiten unterschieden sich nicht
signifikant bezüglich ihrer Mittelwerte, so behauptet man:
z 
1  2   X  X  0
1
und es ergibt sich:
2
z 
( X 1  X 2 )   X1  X 2
 X X
1
2

X  X
X
X1  X 2
( 12 N1 )  ( 22 N 2 )
Entscheidungstheorie
Beispiel II: Signifikanztest bezüglich eines Unterschieds
• Aufgabe:
Zwei Gruppen von Studierenden absolvieren eine Prüfung; Gruppe 1, N = 40, mit einer
mittleren Punktezahl von 74 und einer Standardabweichung von 8; Gruppe 2, N = 50,
mit einer mittleren Punktezahl von 78 und einer Standardabweichung von 7.
Besteht ein signifikanter Unterschied zwischen den Ergebnissen der beiden Gruppen?
(Der Signifikanztest soll 5% Irrtumswahrscheinlichkeit haben.)
• Lösung:
Die Nullhypothese lautet: H0: 1  2 d.h. es existiere kein signifikanter Unterschied.
Die Abweichung wäre demnach rein zufällig (und die beiden Gruppen repräsentieren
2 Stichproben der selben Grundgesamtheit).
Zur Überprüfung ermitteln wir den z-Wert für Mittelwert-Differenzen von Stichproben
z 
X1  X 2
(
2
1
N1 )  (
2
2

N2 )
74  78
8 / 40  7 / 50
2
2
  2,49
Bei α = 0,05 (zweiseitig) ist zK = –1,96 und +1,96. Für die 2 vorliegenden Stichproben liegt
z außerhalb dieses Intervalls, also im Ablehnungsbereich. Wir müssen die Nullhypothese
verwerfen und feststellen, dass Gruppe 2 signifikant besser abgeschnitten hat.
Theorie der kleinen Stichproben
Eigenschaften kleiner Stichproben
• Als kleine Stichproben bezeichnet man solche mit N < 30.
• Funktionen kleiner Stichproben sind für gewöhnlich nicht normalverteilt, und
die Abweichung von der Normalverteilung wird größer, je kleiner N ist.
• Die Ergebnisse der allgemeinen Stichprobentheorie treffen daher für kleine
Stichproben nicht oder nur unzureichend zu. Es besteht die Notwendigkeit einer
Theorie der kleinen Stichproben
• Diese modifizierte Theorie definiert (standardisierte) Stichprobenfunktionen,
deren Verteilungen im Falle N < 30 der Realität besser entsprechen. Da diese
Funktionen jedoch gleichzeitig für große N gültig sind, d.h. die Annäherung an
die Normalverteilung korrekt wiedergeben, sollte man die Theorie kleiner
Stichproben passenderer weise exakte Stichprobentheorie nennen.
Theorie der kleinen Stichproben
Der Begriff der Freiheitsgrade
• Funktionen bzw. Verteilungen innerhalb der Theorie kleiner Stichproben
berechnen sich über den Parameter ν, der die Anzahl der Freiheitsgrade der
Stichprobenfunktion spezifiziert.
• Ist N der Umfang einer Stichprobe, d.h. die Anzahl unabhängiger Beobachtungen,
und entspricht k der Anzahl von Parametern der Grundgesamtheit, die aus den
Stichproben-Beobachtungen geschätzt werden müssen, dann gilt:
v  N k
• Wird beispielsweise nur der Mittelwert der Grundgesamtheit anhand einer oder
mehrerer Stichproben geschätzt, dann ist k = 1, und für die Freiheitsgrade der
Stichprobe(n) gilt:
v  N 1
Theorie der kleinen Stichproben
Student‘s t-Verteilung
(nach W. Gossett)
• Das Verhältnis t zwischen der Differenz des Stichprobenmittelwerts und des
Populationsmittelwerts und dem Standardfehler des Mittelwerts nicht normal
verteilt ist, wenn die Populationsparameter unbekannt sind
• Berechnung des t-Wertes:
1 N
2


s 
X

X
 i
N i 1
N  1( X   )
N ( X  )
t 
bzw.
s
t 
mit
sˆ
sˆ  s  N ( N  1)
Hierbei ist die Verwendung der Stichproben-Standardabweichung s, im Ggs. zu den
Formeln für normalverteilte große Stichproben, keine Approximation, sondern exakt.
Die Formel impliziert nämlich bereits die korrigierte Standardabweichung ŝ für kleine
N (Formel STABW in Excel).
 X
N
sˆ 
1
N
 X
N
1
i
X

2
N ( N  1) 
i
X
1
( N  1)

2
Theorie der kleinen Stichproben
Student‘s t-Verteilung
(nach W. Gossett)
• Diese Verteilung ergibt sich für die Mittelwerte von Stichproben, wenn die
standardisierte Mittelwertfunktion definiert wird als:
 X
N
t 
N  1( X   )
s
t 
bzw.
N ( X  )
sˆ
mit
sˆ 
i  X

2
1
( N  1)
• Wird die Funktion t für jede mögliche Stichprobe berechnet, ergibt sich die
t- Verteilung, die gegeben ist durch
Y 
Y0
 t2 
1  
  
( 1) 2

Y0

t2 
1 

 N 1 
N 2
Hierbei ist Y0 eine Konstante, die für eine gegebene Verteilung von N abhängt
sodass die Fläche unter der Kurve, wie für Verteilungen gefordert, 1 beträgt.
Theorie der kleinen Stichproben
Student‘s t-Verteilung
• Die t-Verteilung ist glockenförmig, jedoch flacher als die Normalverteilung.
• Wie anhand der Verteilungs-Graphen ersichtlich, nähert sich die t-Verteilung für
steigende N bzw. ν der Normalverteilung an (bei ν ≥30 wird die t-Verteilung in
der Praxis meist durch die Normalverteilung geschätzt):
Normalverteilung
ν = 30
ν=3
Je kleiner N (bzw. die Freiheitsgrade ν) umso
flacher ist die Kurve, d.h. in kleinen
Stichproben treten Extremwerte häufiger auf.
ν = 100
ν = 10
http://campus.unimuenster.de/fileadmin/einrichtung/imib/lehre/skripte/biomathe
/bio/gif/kap7/t1.gif
ν=2
Theorie der kleinen Stichproben
Der t-Test für Hypothesen
• Signifikanztests unter Verwendung der t-Verteilung nennt man t-Tests.
• Hierbei wird die normierte Funktion t mit dem kritischen Wert für eine
gegebene Irrtumswahrscheinlichkeit α (entsprechend 1 – Konfidenz)
verglichen, um über die Ablehnung oder Annahme einer Hypothese zu
entscheiden
• Anwendung bei N<30 oder wenn die Standardabweichung der
zugrundeliegenden Normalverteilung nicht bekannt ist und durch die
Standardabweichung der Stichprobe ersetzt wird.
Theorie der kleinen Stichproben
Signifikanztests für Mittelwerte
• Im Falle t-verteilter kleiner Stichproben verwendet man die kritischen Werte tK
und erhält für die Konfidenzgrenzen des Mittelwerts einer Grundgesamtheit:
X  tK 
s
N 1
X  tK 
ŝ
bzw.
X  tK 
s
s
   X  tK 
N 1
N 1
N
• Die kritischen Werte hängen sowohl von der Konfidenz (α) als auch von der
Zahl der Freiheitsgrade (ν) ab.
• Die kritischen Werte sie sind als einseitige oder zweiseitige Werte tabelliert
(siehe Anhang)- richtige Auswahl trifft der/die ExperimentatorIn je nach
Fragestellung.
Theorie der kleinen Stichproben
Signifikanztests für Differenzen von Mittelwerten
• 2 Zufallsstichproben N1 und N2 aus normalverteilten Grundgesamtheiten mit
gleicher Standardabweichung σ werden gezogen, die MW und
Standardabweichungen X1 und X2 bzw mit s1 und s2 gegeben sind.
• Hypothese: beide Proben sind aus der gleichen Grundgesamtheit
H0: μ1= μ2 und σ1= σ2
• Berechnung:
t
X1  X 2
 1
1 

   
 N1 N 2 

N s
 N 2 s22
N1  N 2  2
2
1 1

• Die Verteilung von t ist die Student-Verteilung mit ν= N1+N2-2 Freiheitsgraden.
• Die kritischen Werte sie sind als einseitige oder zweiseitige Werte tabelliert
(siehe Anhang).
Beispiel: N=5;
1 Parameter bestimmen: ν=4
Quelle:
http://files.hanser.de/hanser/docs/20040
419_244191129-96_3-446-215948Anhang4.pdf
Die Tabelle der einseitigen
Abgrenzen kann leicht für
‚zweiseitige‘ Problemstellungen
verwendet werden.
z.B.: 99% Konfidenz (ν=4),
statistische Sicherheit (1-α)=0,99,
dh 1% liegt nicht im
Konfidenzintervall und kommt
jeweils zur Hälfte vom rechten und
linken Rand der symmetrischen
Kurve kommen. Dementsprechend
wird der t-Wert bei (1- 0,01/2)=(10,005)=0,995 abgelesen.
einseitig: t0,995(ν = 4) = 4,6
zweiseitig: t0,99 (ν = 4) = 4,6
Quelle:http://files.hanser.de/hanser/docs/20040419_244191129-96_3-446-21594-8Anhang4.pdf
Theorie der kleinen Stichproben
Beispiel I: Konfidenzintervall des Mittelwerts bei kleiner Stichprobe
• Aufgabe:
Die Reaktionszeit einer Person wurde auf 0,28, 0,30, 0,27, 0,33 und 0,31 s gemessen.
Schätzen Sie die tatsächliche Reaktionszeit mit 99% Konfidenz.
•Lösung:
1) Ermittlung des Stichprobenmittelwertes X und der Standardabweichung
N
X 
X
i 1
N
 X
N
i
 0,298
sˆ 
i
X
1
( N  1)

2
 0,0239
2) Da eine kleine Stichprobe (N = 5) vorliegt, muss man das Konfidenzintervall der
Schätzung über die t-Verteilung berechnen; Anzahl der Parameter =1 (Reaktionszeit)
Zahl der Freiheitsgrade ν=N-1=5-1=4
3) Wahl des Konfidenzintervalls: 99% Konfidenz,
statistische Sicherheit (1-α)=0,99; zweiseitige
Abgrenzung (größer oder kleiner);
0,0239
 0,298  0,049
N
5
Antwort: Die Reaktionszeit μ liegt mit 99% Konfidenz innerhalb von 0,298 ± 0,049
Sekunden
t0,99 (ν = 4) = 4,6
X  tK 
ŝ
 0,298  4,6 
Theorie der kleinen Stichproben
Beispiel II: t-Tests: Vergleich eines Mittelwertes mit einem theoretischen Wert
• Aufgabe:
Die mittlere Lebensdauer einer Spezies wurde bislang mit μ = 1120 d angenommen.
Eine Stichprobe von 8 Individuen ergab eine mittlere Lebensdauer 1070 d mit s = 125 d.
Überprüfen Sie bei einer Irrtumswahrscheinlichkeit von 0,05 die Hypothese, dass die
bisherige Annahme richtig war.
• Lösung:
1) Nullhypothese: H0: μ = 1120 d; H1: μ ist größer oder kleiner als 1120
2) Testen der Hypothese durch Berechnung des t-Wertes der Stichprobe (N=8),
t 
N  1( X   )

s
7 (1070  1120)
  1,06
125
3) Vergleich mit kritischen t-Werten: N=8, 1 Parameter wird untersucht, ν = 7
zweiseitige Tabelle: α = 0,05, 1- α = 0,95, t0,95(7)= ± 2,365
einseitige Tabelle: α/2 = 0,025; 1- α = 0,9575, t0,975(7)= ± 2,365
Antwort: Da t im Konfidenzintervall liegt und nicht im Ablehnungsbereich, können wir die
Hypothese mit einer 95%-igen Konfidenz (oder mit 5% Irrtumswahrscheinlichkeit)
annehmen.
Theorie der kleinen Stichproben
Einfacher t-test mit Excel:
• Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter
0,05 als signifikant angesehen (α=95%))
Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen
Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie?
Typ 1: gepaart (abhängig) z.B:
vor und nach einer Behandlung
Typ 2: ungepaart
(unabhängig) mit
angenommener gleicher
Varianz
Typ 3: ungepaart
(unabhängig) mit
angenommener
ungleicher Varianz
Meßwerte (Chemie, bzw. Molbio)
einseitig oder zweiseitig (one-tailed,
two-tailed)?
Theorie der kleinen Stichproben
Einfacher t-test mit Excel:
• Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter
0,05 als signifikant angesehen (α=95%))
Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen
Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie?
Typ 1: gepaart (abhängig) z.B:
vor und nach einer Behandlung
Typ 2: ungepaart
(unabhängig) mit
angenommener gleicher
Varianz
Typ 3: ungepaart
(unabhängig) mit
angenommener
ungleicher Varianz
Meßwerte (Chemie, bzw. Molbio)
einseitig oder zweiseitig (one-tailed,
two-tailed)?
Theorie der kleinen Stichproben
Einfacher t-test mit Excel:
• Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter
0,05 als signifikant angesehen (α=95%))
Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen
Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie?
Antwort: P=0,65; es besteht
kein signifikanter Unterschied
im Kaffeekonsum der beiden
Gruppen.
Beispiel Hypothesen- und Signifikanztests
Radner F P W et al. J. Biol. Chem. 2010;285:7300-7311
©2010 by American Society for Biochemistry and Molecular Biology
Dermis and epidermis of Cgi-58−/−
mice accumulate TG and exhibit
impaired TG hydrolase activity.
Dermis and epidermis of Cgi-58−/− mice
accumulate TG and exhibit impaired TG
hydrolase activity. A, skins of newborn wildtype, Cgi-58−/−, and Atgl−/− mice were
surgically removed. Epidermis was separated
from dermis and epidermal and dermal
lipids were extracted for determination of
TG content. B, TG hydrolase activities of
epidermal and dermal lysates from newborn
wild-type, Cgi-58−/−, and Atgl−/− mice were
determined using phospholipid-emulsified
triolein substrate, containing [9,103H]triolein as tracer. Release of radiolabeled
FA was determined by liquid scintillation
counting. Data are means ± S.D. (n = 6–8)
and representative for three independent
experiments. Statistical significance was
determined by the two-tailed Student's t
test (*, p < 0.05; ***, p < 0.001).
Herunterladen