Zusatz - APF und interessante BSP

Werbung
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
Schätzen sie X als lineare Funktion bzw. aufgrund von Y Regression
Wie stark hängt X mit Y zusammen? Korrelation
Güte der Schätzung, Welcher Anteil der Varianz von X wird durch Y erklärt Bestimmtheitsmaß (Quadrat der Produkt-Moment-Korrelation)
Theoretische Fragen
1) Wahr oder Falsch? (Mit Begründung warum)
• Es ist komplett falsch eine Rangkorrelation zu rechnen wenn die Vorraussetzungen
für eine Produkt-Moment-Korrelation erfüllt sind?
Nein, jedoch werden bei der Rangkorrelation nicht alle Informationen verwendet
und daher wird sie weniger genau sein.
• Die Binomialverteilung ist immer symmetrisch.
Das stimmt nicht, die Binomialverteilung ist genau dann symmetrisch, wenn
p = q = ½ ist.
• Die Binomialverteilung ist immer normalverteilt.
Das stimmt nicht, die Binomialverteilung ist genau dann normalverteilt, wenn
p = q = ½ ist oder n gegen unendlich geht.
• Die Summe der Varianzen ist gleich der Varianz einer Summe.
Dies trifft nur bei (zwei) unkorrelierten Variablen zu, bei (zwei) korrelierten
Variablen gilt „Die Varianz einer Summer ist gleich der Summe der Varianzen
plus der zweifachen Kovarianz“
• Die Varianz ist immer größer als die Standardabweichung.
Das stimmt nicht, wenn die Varianz kleiner 1 ist, dann wird die
Standardabweichung größer als die Varianz.
• Die Standardabweichung ist negativ.
Die Standardabweichung kann nicht negativ sein, da sie definiert ist als positive
Quadratwurzel aus der Varianz (die ebenfalls nicht negativ sein kann, da es
sich um ein quadratisches Streuungsmaß handelt).
• Es liegt eine Datenreihe mit winterlichen Temperaturen vor. Die einzelnen
Messungen liegen überwiegend im Bereich der Minusgrade. Gemessen wurde in
°C. Die Streuung (Standardabweichung) für diese Dat en kann daher ebenfalls ein
Minusvorzeichen tragen.
Nein, da die Standardabweichung definiert ist als Wurzel aus der Varianz und
die Varianz selbst nur positiv sein kann, da die Varianz ein quadratisches
Streuungsmaß ist.
• Die Standardabweichung einer Variabel X betrage 5,28, die Standardabweichung
einer Variable Y Betrage 1,79. Für die Kovarianz von X und Y wird -9,54
angegeben. Ist dies möglich?
rxy =
cxy
s *s
=
− 9,54
= −1,0094
1,79 * 5,28
x
y
Nein, da
und sich die Korrelation nur
zwischen plus und minus Eins bewegen kann.
Daraus folgt auch, dass die Kovarianz höchstens so groß sein, wie das Produkt
der beiden Standardabweichungen.
2) Wann verwendet man den Quartilabstand als Alternative zur Standardabweichung und
warum?
Wenn kein Intervallskalenniveau der Daten angenommen werden kann oder keine
Normalverteilung vorliegt (also die Verteilung durch Ausreißer verzerrt ist), da in
diesem Fall die Daten nicht angemessen repräsentiert werden (der Quartilabstand ist
unbeeinflusst von Ausreißern!).
Seite 1 von 6
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
3) Wann verwendet man den Median als Alternative zum Mittelwert und warum?
Wenn die Intervalleigenschaft der Daten nicht gesichert ist, keine Normalverteilung
vorliegt (die Verteilung also aufgrund von Ausreißern schief ist) oder wenn offene
Messwertklassen vorliegen.
Da in diesem Fall die Daten nicht angemessen repräsentiert werden, da der
Mittelwert in Richtung der Schiefe der Verteilung (der Ausreißer) gezogen wird.
4) Kann der Median gleich dem Mittelwert werden? (Mit Begründung)
Ja, bei einer Normalverteilung da dann der mittlere Wert gleich dem
durchschnittlichen Wert ist. Dies wäre nur bei einer schiefen Verteilung nicht
gegeben.
5) Nennen Sie je einen typischen Anwendungsfall für:
a. Standardmesswerte: Zwei Verteilungen haben unterschiedliche Mittelwerte und
Standardabweichungen und man will sie vergleichen.
b. Regression: Man will eine Variable anhand einer anderen Variablen vorhersagen.
6) Kann man mittels der Regression eine nicht lineare Funktion schätzen?
Ja, jedoch ist diese Vorhersage dann nicht aussagekräftig für die Funktion.
7) Zeigen Sie, dass die Regressionsgerade durch den Schwerpunkt des Punkteschwarms
geht:
Der Schwerpunkt des Punkteschwarms ist S[MW(X)/MW(Y)], wenn man MW(X) in die
Regressionsgerade einsetzt, müsste MW(Y) rauskommen.
8) Wann ist der Regressionskoeffizient byx (‚von Y auf X“) gleich bxy („von X auf Y“)? (Mit
Begründung)
Wenn die Standardabweichung/Varianz bei beiden Variablen (X, Y) gleich 1 – dies ist
zum Beispiel bei standardisierten Variablen der Fall.
byx =
cxy
s
2
x
=
cxy
1
= c xy und bxy =
cxy
s
2
y
=
cxy
1
= cxy dann byx = bxy = cxy
Oder wenn die Kovarianz den Wert Null hat, dann wäre byx = bxy = 0.
9) Wann ist die Korrelation zwischen zwei Variablen gleich der Kovarianz?
Im Falle standardisierter Variablen, da Kovarianz, Regressionskoeffizient und
Korrelation gleich dem mittleren Messwerteprodukt.
10) Erläutern Sie die Schritte zur Berechnung der Residuen im Regressionsmodell
Y=byxX+ayx. Welche Informationen können aus den Residuen gewonnen werden?
Vorhersage der Y-Werte anhand der X-Werte (einsetzen in Y=byxX+a yx)
Y-Werte (tatsächliche Werte) – Vorhergesagte Y-Werte = Residuen
Umso größer die Residuen sind umso weiter sind die Punkte von der
Regressionsgerade entfernt. Umso kleiner die Residuen sind, desto näher sind sie
der Geraden. Die Vorhersage ist dann umso genauer umso kleiner die Residuen
sind.
11) Beschreiben Sie die Form der Verteilung der Residuen
Wenn kein systematischer Fehler auftritt, der die Verteilung verzerrt, besteht eine
Normalverteilung um 0. In diesem Fall (und nur in diesem) ist dann auch ein lineares
Regressionsmodell angebracht.
Seite 2 von 6
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
12) Wie kann man die partielle Korrelation rxy.z aus den Residuen der Regressionen von X
und Y auf Z errechnet werden? (mit Erklärung)
Berechnung der Produkt-Moment-Korrelation zwischen den Residuen
Die Residuen stellen die Differenz mit der tatsächlichen Werte mit den
vorhergesagten Werten dar also den Unterschied von X und Y aufgrund von Z. Wenn
man nun diese Unterschiede korreliert, macht man nichts anderes wie bei der
partiellen Korrelation, da man die Korrelation mit Z aus der Korrelation von X mit Y
„zieht“.
13) Ist es möglich dass das rxy.z größer ist als die rxy?
Ja und zwar dann, wenn z zum Beispiel einen negativen Einfluss auf x und y hat.
Wenn man dann diesen negativen Einfluss ausschaltet wird die partielle Korrelation
dann größer.
14) Wie sehen Streudiagramme aus, wenn zwei Variablen stark bzw. schwach positiv
korrelieren (Mit Begründung)
Umso näher die Punkte an der
Regressionsgerade sind, desto höher ist der
Zusammenhang und desto genauer ist die
Vorhersage (desto besser kann Y aufgrund von
X vorhergesagt werden).
15) Für drei Variablen (A, B, C) eines Datensatzes sei rAB.C vorzeichenident mit rAB sowie
betragsmäßig annähernd gleich. Welche Schlussfolgerung erlaubt dies?
Dass nur eine Scheinkorrelation zwischen A und B vorliegt also das lediglich die dritte
Variable einen statistischen Zusammenhang bewirkt.
16) In welchen Fällen wird man die Rangkorrelation anstelle der PMK vorziehen?
(Aufzählung und Begründung)
Wenn kein Intervallskalenniveau angenommen werden kann, da die Variable nicht
normalverteilt – also schief – ist, dann wird die Rangkorrelation verwendet. Da (im
Gegensatz zur Produkt-Moment-Korrelation) das geometrische Mittel in die
Rangkorrelation nicht eingeht und somit die Verteilung interpretierbar wird (da die
Korrelation nicht verzerrt wird).
17) Werden Zahlen, die mehr als einmal vorkommen, bei der Berechnung des Medians (bei
der Reihung der Zahlen nach Größe) mehrfach oder nur einmal angeschrieben?
Sie werden mehrfach angeschrieben, z.B. 2 3 3 4 5 5 6 7 9 Md=5
18) In welchen Fällen ist die Produkt-Moment-Korrelation zwischen zwei Variablen größer als
Spearman’s Rangkorrelation (über dieselben Variablen gerechnet), und in welchen
Fällen ist sie kleiner?
rxy > r`: Wenn man einen Punktschwarm hat, eine Regressionsgerade durch
legt und dann zwei Ausreißer einzeichnet, die weit weg vom Punktschwarm, aber
ganz in der Nähe der Geraden liegen.
rxy < r`: Wenn man einen Punktschwarm hat, eine Regressionsgerade durch
legt und zwei Ausreißer einzeichnet, die weit weg vom Punktschwarm und der
Regressionsgeraden liegen.
19) Was bedeutet es in Bezug auf das Erfülltsein der Verfahrensvoraussetzungen, wenn die
Produkt-Moment-Korrelation zwischen zwei Variablen annähernd gleich der
Rangkorrelation zwischen denselben Variablen ist?
Das es keine Ausreißer gibt.
Seite 3 von 6
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
20) Warum können extreme Werte bei einer Rangkorrelation das Ergebnis nicht verfälschen
Sie quantifiziert den Zusammenhang zwischen zwei rangskalierten Variablen. Es
werden Rangplätze korreliert und nicht die erhobenen Daten selber!
21) Wozu dient die Sheppard’sche Korrektur? Geben Sie eine intuitive Begründung für die
Korrektur an.
Der Effekt der Klassenzusammenfassung (Verfälschung) auf die Varianz geht immer
in eine Richtung. Dieser systematischer Fehler (Bias) wird durch die Sheppard’sche
Korrektur korrigiert. Die gewünschte Wirkung ist am Besten, wenn die Daten
normalverteilt sind. Abweichungen zur Normalverteilung gehen zu Lasten der
Korrekturwirkung.
22) Kann man aufgrund des Zutreffens der Multiplikationsregel der
Wahrscheinlichkeitsrechnung P(A^B) = P(A)P(B) für zwei Ereignisse A und B schließen,
dass die beiden Ereignisse unabhängig sind? (Mit Begründung)
Nein, dies gilt nur wenn P(A)≠0 und P(B)≠0 ist.
23) Bedeutet die Unabhängigkeit zweier Ereignisse auch, dass sie einander ausschließen?
Gilt dies auch umgekehrt? (Begründen Sie und bringen Sie ein Beispiel)
Nein, da die unabhängigen Ereignissen auch gemeinsam auftreten können (was bei
einander ausschließende nicht der Fall ist) z.B. Sonne und Mond können gemeinsam
auftreten (unabhängige Ereignisse), aber die Sonne kann nicht gleichzeitig scheinen
und nicht scheinen.
Weiters sind einander ausschließende Ereignisse nicht unabhängig, da gilt „Wenn A
nicht auftritt, dann tritt genau ¬ A ein.“ Z.B. die Sonne scheint genau dann nicht,
wenn sie nicht scheint. (Ereignis A (Sonne scheint nicht) ist abhängig von Eintreten
des Ereignis B (Sonne scheint)).
24) Beschreiben Sie die Parameter und die Form der Binomialverteilung
[Formel der Binomialverteilung]
Variablentyp: dichotom, diskret
p = ½: normalverteilt
p < ½: p geht gegen Null; linkssteil / rechtsschief
p > ½: p geht gegen Eins: rechtsschief / linkssteil
Je größer n desto mehr geht die Binomialverteilung in die Normalverteilung über (Bei
n gegen unendlich ist die Binomialverteilung nicht von der Normalverteilung zu
unterscheiden)
Umso größer n ist, desto mehr ist die Verteilung verschoben an der x-Achse, da auch
der Erwartungswert verschoben ist.
25) Eine Kollegin führt 5 voneinander unabhängige statistische Tests mit jeweils alpha=0.20
durch. Wie groß ist die Wahrscheinlichkeit, dass genau drei Tests signifikant ausfallen,
unter der Annahme, dass bei allen fünf Tests H0 wahr ist?
 5
P =  0,230,82
 3
26) Eine Elektrotherapie wird an 13 Rhemapatienten mit Gelenksbeschwerden erprobt. Die
Patienten stufen den Grad ihrer Bewegungseinschränkung vor und nach der Behandlung
ein. Kann man sagen, dass die Behandlung hilfreich ist? Hypothesentest!
Nur die Fälle anschauen, wo eine Veränderung stattfand (n verkleinern!)
Nullhypothese definieren: „Keine Therapiewirkung“ Erwartungswert = n * ½
Alternativhypothese definieren: „Die Therapie verbessert das Befinden“ p >
½ , da wir mehr Verbesserungen als Verschlechterungen erwarten.
Seite 4 von 6
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
Dann Berechnung der Binomialverteilung mit p = ½ - wenn das Ergebnis
größer als das Signifikanzniveau alpha, dann war die Therapie wirksam und
die Nullhypothese wird verworfen!
Interessante Beispiele
1) Über ein neues medizinisches Behandlungsverfahren ist bekannt, dass seine
Erfolgswahrscheinlichkeit p ist. Wird dieses Verfahren zweimal hintereinander
durchgeführt, führt es mit einer Wahrscheinlichkeit von 0,35 mindestens einmal nicht zum
Erfolg. Berechnen Sie p.
0,35 = P(k = 1) + P(k = 2) + ....P (k = n) = P(k ≥ 1) = 1 − P(k = 0)
n
 2
P(k = 0) = 0,65 =   p k q n − k =   p 0q 2 − 0 = 1 *1 * q 2
k 
0
⇒ q = 0,8062
Anmerkung: P(k=0) ist die Wahrscheinlichkeit dafür, dass das Verfahren kein mal
nicht zum Erfolg geführt hat bzw. einmal zum Erfolg geführt hat.
27) Zur Zuverlässigkeit von Gerüchten, „Tratsch“, u. dgl.: Eine Nachricht wird mit einer
Wahrscheinlichkeit von p=0,8 unverändert von einer Person zur nächsten
wiedergegeben. Wie wahrscheinlich ist es, dass die Nachricht die zwölfte (bzw. die
vierundzwanzigste) Person unverändert erreicht?
Die Weitergabe ist immer um eins weniger als die Anzahl der Personen (die letzte
Person gibt es die Information an niemanden weiter!)
Aufgrund dessen ist P(12.Person)=0,811 und P(24.Person)=0,823
28) Bei einer Infektionskrankheit verlaufen 30% der Fälle stumm (symptomlos). Zwei
Personen seien infiziert. Wie groß ist die Wahrscheinlichkeit für: zwei stumme Verläufe,
zwei nicht stumme Verläufe, genau einen stummen Verlauf, sowie für mindestens einen
stummen Verlauf?
 2
 2
P(k = 2) =  0,320,70 = 1 * 0,32 *1 = 0,09 P(k = 0) =  0,300,7 2 = 1 *1 * 0,7 2 = 0,49
 2
0
 2
P(k ≥ 1) = P(k = 1) + P(k = 2) = 0,72
P(k = 1) =  0,310,71 = 2 * 0,3 * 0,7 = 0,42
1 
29) Überprüfen Sie, ob die Ereignisse A und B im folgenden Vierfelderschema unabhängig
von einander sind.
Vierfelderkorrelation!
30) […] Unter anderem soll untersucht werden, ob ein Zusammenhang zwischen der
Wirksamkeit des Programms und der Anzahl der Förderstunden pro Monat besteht.
Angabe: Förderstunden pro Monat, Fehler vor Programm, Fehler nach Programm
Differenzbildung von Fehler vor Programm – Fehler nach Programm!
Interessante Beispiel aus meinen Mathematik-Buch
1) Bei der Tombola eines Schulfestes werden insgesamt 1000 Lose ausgegeben, 300
davon sind Gewinnlose.
a. Wie viele Lose muss man kaufen, um mit 90%iger Wahrscheinlichkeit mit mindestens
einem Gewinn rechnen zu können?
Seite 5 von 6
Haszonits Iris
Theoriefragen und interessante Beispiel
26.01.2005
300 

n
P (k ≥ 1) = 1 − P (k = 0) = 1 − 1 −
 = 1 − 0,7
1000


n
n
n
1 − 0,7 ≥ 0,9 ⇒ −0,7 ≥ −0,1 ⇒ 0,7 ≤ 0,1 ⇒ n log 0,7 ≤ log 0,1
log 0,1
n≥
≈ 6,45 Man muss min. 7 Lose kaufen.
log 0,7
n
b. Wie groß müsste der Anteil p der Gewinnlose sein, damit man beim Kauf von fünf
Losen mit 99%iger Wahrscheinlichkeit mit einem Gewinn rechnen kann?
P (k ≥ 1) = 1 − P (k = 0) = 1 − (1 − p )5
1 − (1 − p )5 ≥ 0,99 ⇒ (1 − p)5 ≤ 0,01 ⇒ p ≥ 1 − 5 0,01 ≈ 0,60
Der Anteil der Gewinnlose müsste min. 60% betragen.
2) In einer Großstadt sind erfahrungsgemäß 6% der U-Bahn-Fahrgäste Schwarzfahrer. Ein
Kontrolleur überprüft täglich etwa 300 Fahrgäste. Wie viele Schwarzfahrer wird er im
Mittel täglich treffen?
µ = n * p = 300 * 0,06 = 18
3) Die Glühbirnenproduktion eines bestimmten Unternehmens erhält erfahrungsgemäß 8%
„Montagsbirnen“, d.h. Glühbirnen mit deutlich kürzerer Lebensdauer. Ein Elektrogeschäft
bezieht 60% seiner Glühbirnen vom Hersteller A (8% Montagsbirnen) und 40% vom
Hersteller B (10% Montagsbirnen).
a. Wie groß ist die Wahrscheinlichkeit dafür, dass der Käufer einer zufällig
herausgegriffenen Birne eine Montagsbirne erwischt?
P( M ) = P( A ∩ M ) + P( B ∩ M ) = P( A) * P( M | A) + P( B) * P( M | B)
0,6 * 0,08 + 0,4 * 0,1 = 0,088 ≈ 8,8%
b. Mit welcher Wahrscheinlichkeit stammt eine Montagsbirne vom Hersteller B?
P( B | M ) =
P( B ∩ M ) P( B) * P( M | B) 0,4 * 0,1
=
=
≈ 0,4545 ≈ 45%
P(M )
P(M )
0,088
Seite 6 von 6
Herunterladen