Verschiedene Statistik-Programme - verschiedene Ergebnisse bei

Werbung
Verschiedene StatistikProgramme - verschiedene
Ergebnisse bei gleichen
Analysen, kann das sein?
Autor: Patrick Arnold
Gliederung
 1. Einleitung
 2. Der Wilcoxon Mann Whitney Test
 3. Beispiel für WMW Test
 4. Spezieller WMW-Test
 5. Ergebnisse des speziellen WMW-Test’s mit verschiedenen
Softwarepaketen
 6. Resümee
 7. Quellen
1.Einleitung
 Verschiedene
 Beispiel, an dem man
Statistik-Programme verschiedene
Ergebnisse bei
gleichen Analysen,
kann das sein ?
 Problem an Hand
eines Beispieles
erläutern
dieses Problem
beobachten kann ist
ein statistischer Test
 Wilcoxon-MannWhitney Test
 Diesr Test ist aber
noch nicht in der
Statistikvorlesung
behandelt worden
2. Der WMW Test
 Wird auch U-Test genannt
 nichtparametrisches statistisches
Prüfverfahren zum Vergleich zweier
unabhängiger Zufallsvariablen X und Y
 Ausgangsdaten bestehen aus zwei
voneinander unabhängigen Stichproben
 U-Test benötigt man nur die Rangplätze
2. Der WMW Test
 Beide Stichproben werden




zusammengelegt
und dann der Grösse nach geordnet
jeder Wert einen Rang zugeordnet
der kleinste Wert bekommt den Rang 1
Kommt ein Wert mehrfach vor, spricht man
von Ties oder auf deutsch von Bindungen
2. Der WMW Test
 dann erhalten die numerisch gleich
grossen Einzelwerte die mittlere Rangzahl
 Stichprobenumfang der ersten Stichprobe
<= der der zweiten
 der U-Test fest, ob die so genannte
Dominanzwahrscheinlichkeit: pd:=
P(X<=Y) gleich 0,5 ist oder nicht
2. Der WMW Test
 Man unterscheidet beim
U-Test noch zwischen der
einseitige und der
zweiseitige Fragestellung
 Bei zweiseitiger
Fragestellung :
Dominanzwahrscheinlich
keit pd ungleich 0,5
 Bei der einseitigen
Fragestellung :
wird Alternativhypothese
so gewählt das die
Dominanzwahrscheinlichkeit entweder größer oder
kleiner als 0,5 ist
2. Der WMW Test
 U-Test ist besonders geeignet,
Unterschiede in der zentralen Tendenz
aufzufinden
 brauchbare Alternative zum t-Test
 kann auch eingesetzt werden, wenn die
Daten nicht intervall- bzw.
verhältnisskaliert sind
2. Der WMW Test
Zusammenfassend: wir brauchen zwei
voneinander unabhängige Stichproben mit
ähnlicher bis gleicher Verteilungsform, die wir
miteinander vergleichen und deren Rangfolge
aufstellen!
3. Beispiel für WMW Test
4. Spezieller WMW-Test
 Test in verschiedenen  Der so genannten
Statistikprogrammen
durchführen
 Mit Spezialfall von so
einen WMW Test
ROTATROD Test
 Testet Verhalten von
Ratten
 Rotarod Apparatur
besteht aus einem
rotierenden Zylinder
 Besteht aus vier
möglichen Positionen
4. Spezieller WMW-Test
 Zylinder rotiert mit 12
 Jedoch maximal Zeit die
Umdrehungen pro Minute
 Ratten wurden einzeln
auf den Zylinder gesetzt
 Zeit, wie lange sich so
eine Ratte auf dem
Zylinder aufhält wird
gemessen
Ratten auf dem Zylinder
sitzen 300s
 Sitzt Ratte länger wie
300s, trotzdem nur 300 s
angerechnet
 2 Gruppen von jeweils 12
Ratten getestet
 Die gemessenen Werte
sind in der folgenden
Tabelle zu sehen
Time (sec)
300
300
300
300
300
300
300
300
300
300
300
300
Rank
15
15
15
15
15
15
15
15
15
15
15
15
Time (sec)
22
300
75
271
300
18
300
300
163
300
300
300
Rank
2
15
3
5
15
1
15
15
4
15
15
15
4. Spezieller WMW-Test
 Den Ratten aus Gruppe 1, der control
group, wurde Saline verabreicht und den
anderen Ratten aus der 2 Gruppe, der
treatment group, wurde ein Muskel
Präparat oral verabreicht.
5. Ergebnisse des speziellen WMW-Test’s
mit verschiedenen Softwarepaketen
 Die genauen, per Hand berechneten Werte sind:
ohne Korrektur: z= 1.732 p = 0.0833
mit Korrektur für Normalverteilung: z = 1.703
p = 0.0885
mit Korrektur für Bindungen: z = 2.439 p =
0.0147
mit Korrektur für Bindungen und
Normalverteilung:
z = 2.398 p = 0.0165
 Eingeben der gemessenen Werte in ein
Statistikprogramm und den U-Test durchführen
 falls er in der Software implementiert
 Statistiksoftware liefert ein Ergebnis
 Nimmt man sich nun ein anderes
Statistikprogramm und gibt dieselben Werte wie
eben ein, passiert es in der Regel, dass ein
leicht unterschiedliches Ergebnis heraus kommt
5. Ergebnisse des speziellen WMW-Test’s
mit verschiedenen Softwarepaketen
 SigmaStat :
Mediane der beiden
Stichproben werden
angegeben und p = 0.85
SigmaStat liefert noch
einen Satz indem steht
das es keine signifikante
Differenz in den beiden
Stichproben gibt
 SYSSTAT:
Rangsummen für jede
Stichprobe angegeben,
der kritische Wert U, hier
ist U = 42 und die
dementsprechende
Wahrscheinlichkeit p =
0.01473
In Anleitung findet man
nicht wie Programm
rechnet, ob mit oder ohne
Ties
5. Ergebnisse des speziellen WMW-Test’s
mit verschiedenen Softwarepaketen
 S-Plus:
am Anfang kann man auswählen wie der Test
berechnet werden soll, ob mit „continuity
correction“ oder „Use exact Ditibution“.
„continuity correction“ ausgewählt, zeigt es in der
Ausgabe z = 2.4389 und p = 0.0147 an,
Ergebnis ohne die Korrekturen
Mit Korrektur ist z = 2.3983 und p = 0.0165
5. Ergebnisse des speziellen WMW-Test’s
mit verschiedenen Softwarepaketen
 STATISTICA:
das Programm anzeigt sind wieder z und p mit z
= 1.732 und p =0.083274
ein „adjusted“ z wird angezeigt mit z = 2.4389
und p = 0.014737
wird noch ein „exact“ p ausgegeben mit p =
0.088734
5. Ergebnisse des speziellen WMW-Test’s
mit verschiedenen Softwarepaketen
 SPSS:
hier werden wieder verschiedene z und p Werte
ausgegeben
Ergebnisse sind wieder ähnlich wie bei allen
anderen Programmen
es stimmen ein paar Werte mit den exakten
überein
6. Resümee
 Test zeigt dass man sich doch nicht immer
100% auf die Ergebnisse verlassen kann
die ein solches Statistikprogramm ausgibt
 Oft Ergebnisse nicht falsch, sondern nicht
ausreichend beschrieben und es stehen
dann zum Beispiel 3 verschiedene Werte
für p oder z da und man weiss gar nicht
welches jetzt für einen das richtige ist
6. Resümee
 Wenn Zahlenwerte von einander abweichen,
liegt das an Rundungsfehlern oder daran das
sich jemand von den Programmierern gedacht
hat das er die Formeln die dieser Test benötigt
etwas „verbessern“ kann. Das Problem an der
Sache ist dann bloß, das nirgends beschrieben
wird mit welchen Formeln der Test berechnet
wird
 Quellcode ist nie frei zugänglich
7. Quellen
 Hartung: Statistik 13.Auflage
 Lothar Sachs: Angewandte Statistik
 Zeitungsartikel aus „The American
Statistican“ vom Februar 2000
 Internet (Homepage‘s andere
Universitäten)
Herunterladen