Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 Schätzen sie X als lineare Funktion bzw. aufgrund von Y Regression Wie stark hängt X mit Y zusammen? Korrelation Güte der Schätzung, Welcher Anteil der Varianz von X wird durch Y erklärt Bestimmtheitsmaß (Quadrat der Produkt-Moment-Korrelation) Theoretische Fragen 1) Wahr oder Falsch? (Mit Begründung warum) • Es ist komplett falsch eine Rangkorrelation zu rechnen wenn die Vorraussetzungen für eine Produkt-Moment-Korrelation erfüllt sind? Nein, jedoch werden bei der Rangkorrelation nicht alle Informationen verwendet und daher wird sie weniger genau sein. • Die Binomialverteilung ist immer symmetrisch. Das stimmt nicht, die Binomialverteilung ist genau dann symmetrisch, wenn p = q = ½ ist. • Die Binomialverteilung ist immer normalverteilt. Das stimmt nicht, die Binomialverteilung ist genau dann normalverteilt, wenn p = q = ½ ist oder n gegen unendlich geht. • Die Summe der Varianzen ist gleich der Varianz einer Summe. Dies trifft nur bei (zwei) unkorrelierten Variablen zu, bei (zwei) korrelierten Variablen gilt „Die Varianz einer Summer ist gleich der Summe der Varianzen plus der zweifachen Kovarianz“ • Die Varianz ist immer größer als die Standardabweichung. Das stimmt nicht, wenn die Varianz kleiner 1 ist, dann wird die Standardabweichung größer als die Varianz. • Die Standardabweichung ist negativ. Die Standardabweichung kann nicht negativ sein, da sie definiert ist als positive Quadratwurzel aus der Varianz (die ebenfalls nicht negativ sein kann, da es sich um ein quadratisches Streuungsmaß handelt). • Es liegt eine Datenreihe mit winterlichen Temperaturen vor. Die einzelnen Messungen liegen überwiegend im Bereich der Minusgrade. Gemessen wurde in °C. Die Streuung (Standardabweichung) für diese Dat en kann daher ebenfalls ein Minusvorzeichen tragen. Nein, da die Standardabweichung definiert ist als Wurzel aus der Varianz und die Varianz selbst nur positiv sein kann, da die Varianz ein quadratisches Streuungsmaß ist. • Die Standardabweichung einer Variabel X betrage 5,28, die Standardabweichung einer Variable Y Betrage 1,79. Für die Kovarianz von X und Y wird -9,54 angegeben. Ist dies möglich? rxy = cxy s *s = − 9,54 = −1,0094 1,79 * 5,28 x y Nein, da und sich die Korrelation nur zwischen plus und minus Eins bewegen kann. Daraus folgt auch, dass die Kovarianz höchstens so groß sein, wie das Produkt der beiden Standardabweichungen. 2) Wann verwendet man den Quartilabstand als Alternative zur Standardabweichung und warum? Wenn kein Intervallskalenniveau der Daten angenommen werden kann oder keine Normalverteilung vorliegt (also die Verteilung durch Ausreißer verzerrt ist), da in diesem Fall die Daten nicht angemessen repräsentiert werden (der Quartilabstand ist unbeeinflusst von Ausreißern!). Seite 1 von 6 Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 3) Wann verwendet man den Median als Alternative zum Mittelwert und warum? Wenn die Intervalleigenschaft der Daten nicht gesichert ist, keine Normalverteilung vorliegt (die Verteilung also aufgrund von Ausreißern schief ist) oder wenn offene Messwertklassen vorliegen. Da in diesem Fall die Daten nicht angemessen repräsentiert werden, da der Mittelwert in Richtung der Schiefe der Verteilung (der Ausreißer) gezogen wird. 4) Kann der Median gleich dem Mittelwert werden? (Mit Begründung) Ja, bei einer Normalverteilung da dann der mittlere Wert gleich dem durchschnittlichen Wert ist. Dies wäre nur bei einer schiefen Verteilung nicht gegeben. 5) Nennen Sie je einen typischen Anwendungsfall für: a. Standardmesswerte: Zwei Verteilungen haben unterschiedliche Mittelwerte und Standardabweichungen und man will sie vergleichen. b. Regression: Man will eine Variable anhand einer anderen Variablen vorhersagen. 6) Kann man mittels der Regression eine nicht lineare Funktion schätzen? Ja, jedoch ist diese Vorhersage dann nicht aussagekräftig für die Funktion. 7) Zeigen Sie, dass die Regressionsgerade durch den Schwerpunkt des Punkteschwarms geht: Der Schwerpunkt des Punkteschwarms ist S[MW(X)/MW(Y)], wenn man MW(X) in die Regressionsgerade einsetzt, müsste MW(Y) rauskommen. 8) Wann ist der Regressionskoeffizient byx (‚von Y auf X“) gleich bxy („von X auf Y“)? (Mit Begründung) Wenn die Standardabweichung/Varianz bei beiden Variablen (X, Y) gleich 1 – dies ist zum Beispiel bei standardisierten Variablen der Fall. byx = cxy s 2 x = cxy 1 = c xy und bxy = cxy s 2 y = cxy 1 = cxy dann byx = bxy = cxy Oder wenn die Kovarianz den Wert Null hat, dann wäre byx = bxy = 0. 9) Wann ist die Korrelation zwischen zwei Variablen gleich der Kovarianz? Im Falle standardisierter Variablen, da Kovarianz, Regressionskoeffizient und Korrelation gleich dem mittleren Messwerteprodukt. 10) Erläutern Sie die Schritte zur Berechnung der Residuen im Regressionsmodell Y=byxX+ayx. Welche Informationen können aus den Residuen gewonnen werden? Vorhersage der Y-Werte anhand der X-Werte (einsetzen in Y=byxX+a yx) Y-Werte (tatsächliche Werte) – Vorhergesagte Y-Werte = Residuen Umso größer die Residuen sind umso weiter sind die Punkte von der Regressionsgerade entfernt. Umso kleiner die Residuen sind, desto näher sind sie der Geraden. Die Vorhersage ist dann umso genauer umso kleiner die Residuen sind. 11) Beschreiben Sie die Form der Verteilung der Residuen Wenn kein systematischer Fehler auftritt, der die Verteilung verzerrt, besteht eine Normalverteilung um 0. In diesem Fall (und nur in diesem) ist dann auch ein lineares Regressionsmodell angebracht. Seite 2 von 6 Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 12) Wie kann man die partielle Korrelation rxy.z aus den Residuen der Regressionen von X und Y auf Z errechnet werden? (mit Erklärung) Berechnung der Produkt-Moment-Korrelation zwischen den Residuen Die Residuen stellen die Differenz mit der tatsächlichen Werte mit den vorhergesagten Werten dar also den Unterschied von X und Y aufgrund von Z. Wenn man nun diese Unterschiede korreliert, macht man nichts anderes wie bei der partiellen Korrelation, da man die Korrelation mit Z aus der Korrelation von X mit Y „zieht“. 13) Ist es möglich dass das rxy.z größer ist als die rxy? Ja und zwar dann, wenn z zum Beispiel einen negativen Einfluss auf x und y hat. Wenn man dann diesen negativen Einfluss ausschaltet wird die partielle Korrelation dann größer. 14) Wie sehen Streudiagramme aus, wenn zwei Variablen stark bzw. schwach positiv korrelieren (Mit Begründung) Umso näher die Punkte an der Regressionsgerade sind, desto höher ist der Zusammenhang und desto genauer ist die Vorhersage (desto besser kann Y aufgrund von X vorhergesagt werden). 15) Für drei Variablen (A, B, C) eines Datensatzes sei rAB.C vorzeichenident mit rAB sowie betragsmäßig annähernd gleich. Welche Schlussfolgerung erlaubt dies? Dass nur eine Scheinkorrelation zwischen A und B vorliegt also das lediglich die dritte Variable einen statistischen Zusammenhang bewirkt. 16) In welchen Fällen wird man die Rangkorrelation anstelle der PMK vorziehen? (Aufzählung und Begründung) Wenn kein Intervallskalenniveau angenommen werden kann, da die Variable nicht normalverteilt – also schief – ist, dann wird die Rangkorrelation verwendet. Da (im Gegensatz zur Produkt-Moment-Korrelation) das geometrische Mittel in die Rangkorrelation nicht eingeht und somit die Verteilung interpretierbar wird (da die Korrelation nicht verzerrt wird). 17) Werden Zahlen, die mehr als einmal vorkommen, bei der Berechnung des Medians (bei der Reihung der Zahlen nach Größe) mehrfach oder nur einmal angeschrieben? Sie werden mehrfach angeschrieben, z.B. 2 3 3 4 5 5 6 7 9 Md=5 18) In welchen Fällen ist die Produkt-Moment-Korrelation zwischen zwei Variablen größer als Spearman’s Rangkorrelation (über dieselben Variablen gerechnet), und in welchen Fällen ist sie kleiner? rxy > r`: Wenn man einen Punktschwarm hat, eine Regressionsgerade durch legt und dann zwei Ausreißer einzeichnet, die weit weg vom Punktschwarm, aber ganz in der Nähe der Geraden liegen. rxy < r`: Wenn man einen Punktschwarm hat, eine Regressionsgerade durch legt und zwei Ausreißer einzeichnet, die weit weg vom Punktschwarm und der Regressionsgeraden liegen. 19) Was bedeutet es in Bezug auf das Erfülltsein der Verfahrensvoraussetzungen, wenn die Produkt-Moment-Korrelation zwischen zwei Variablen annähernd gleich der Rangkorrelation zwischen denselben Variablen ist? Das es keine Ausreißer gibt. Seite 3 von 6 Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 20) Warum können extreme Werte bei einer Rangkorrelation das Ergebnis nicht verfälschen Sie quantifiziert den Zusammenhang zwischen zwei rangskalierten Variablen. Es werden Rangplätze korreliert und nicht die erhobenen Daten selber! 21) Wozu dient die Sheppard’sche Korrektur? Geben Sie eine intuitive Begründung für die Korrektur an. Der Effekt der Klassenzusammenfassung (Verfälschung) auf die Varianz geht immer in eine Richtung. Dieser systematischer Fehler (Bias) wird durch die Sheppard’sche Korrektur korrigiert. Die gewünschte Wirkung ist am Besten, wenn die Daten normalverteilt sind. Abweichungen zur Normalverteilung gehen zu Lasten der Korrekturwirkung. 22) Kann man aufgrund des Zutreffens der Multiplikationsregel der Wahrscheinlichkeitsrechnung P(A^B) = P(A)P(B) für zwei Ereignisse A und B schließen, dass die beiden Ereignisse unabhängig sind? (Mit Begründung) Nein, dies gilt nur wenn P(A)≠0 und P(B)≠0 ist. 23) Bedeutet die Unabhängigkeit zweier Ereignisse auch, dass sie einander ausschließen? Gilt dies auch umgekehrt? (Begründen Sie und bringen Sie ein Beispiel) Nein, da die unabhängigen Ereignissen auch gemeinsam auftreten können (was bei einander ausschließende nicht der Fall ist) z.B. Sonne und Mond können gemeinsam auftreten (unabhängige Ereignisse), aber die Sonne kann nicht gleichzeitig scheinen und nicht scheinen. Weiters sind einander ausschließende Ereignisse nicht unabhängig, da gilt „Wenn A nicht auftritt, dann tritt genau ¬ A ein.“ Z.B. die Sonne scheint genau dann nicht, wenn sie nicht scheint. (Ereignis A (Sonne scheint nicht) ist abhängig von Eintreten des Ereignis B (Sonne scheint)). 24) Beschreiben Sie die Parameter und die Form der Binomialverteilung [Formel der Binomialverteilung] Variablentyp: dichotom, diskret p = ½: normalverteilt p < ½: p geht gegen Null; linkssteil / rechtsschief p > ½: p geht gegen Eins: rechtsschief / linkssteil Je größer n desto mehr geht die Binomialverteilung in die Normalverteilung über (Bei n gegen unendlich ist die Binomialverteilung nicht von der Normalverteilung zu unterscheiden) Umso größer n ist, desto mehr ist die Verteilung verschoben an der x-Achse, da auch der Erwartungswert verschoben ist. 25) Eine Kollegin führt 5 voneinander unabhängige statistische Tests mit jeweils alpha=0.20 durch. Wie groß ist die Wahrscheinlichkeit, dass genau drei Tests signifikant ausfallen, unter der Annahme, dass bei allen fünf Tests H0 wahr ist? 5 P = 0,230,82 3 26) Eine Elektrotherapie wird an 13 Rhemapatienten mit Gelenksbeschwerden erprobt. Die Patienten stufen den Grad ihrer Bewegungseinschränkung vor und nach der Behandlung ein. Kann man sagen, dass die Behandlung hilfreich ist? Hypothesentest! Nur die Fälle anschauen, wo eine Veränderung stattfand (n verkleinern!) Nullhypothese definieren: „Keine Therapiewirkung“ Erwartungswert = n * ½ Alternativhypothese definieren: „Die Therapie verbessert das Befinden“ p > ½ , da wir mehr Verbesserungen als Verschlechterungen erwarten. Seite 4 von 6 Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 Dann Berechnung der Binomialverteilung mit p = ½ - wenn das Ergebnis größer als das Signifikanzniveau alpha, dann war die Therapie wirksam und die Nullhypothese wird verworfen! Interessante Beispiele 1) Über ein neues medizinisches Behandlungsverfahren ist bekannt, dass seine Erfolgswahrscheinlichkeit p ist. Wird dieses Verfahren zweimal hintereinander durchgeführt, führt es mit einer Wahrscheinlichkeit von 0,35 mindestens einmal nicht zum Erfolg. Berechnen Sie p. 0,35 = P(k = 1) + P(k = 2) + ....P (k = n) = P(k ≥ 1) = 1 − P(k = 0) n 2 P(k = 0) = 0,65 = p k q n − k = p 0q 2 − 0 = 1 *1 * q 2 k 0 ⇒ q = 0,8062 Anmerkung: P(k=0) ist die Wahrscheinlichkeit dafür, dass das Verfahren kein mal nicht zum Erfolg geführt hat bzw. einmal zum Erfolg geführt hat. 27) Zur Zuverlässigkeit von Gerüchten, „Tratsch“, u. dgl.: Eine Nachricht wird mit einer Wahrscheinlichkeit von p=0,8 unverändert von einer Person zur nächsten wiedergegeben. Wie wahrscheinlich ist es, dass die Nachricht die zwölfte (bzw. die vierundzwanzigste) Person unverändert erreicht? Die Weitergabe ist immer um eins weniger als die Anzahl der Personen (die letzte Person gibt es die Information an niemanden weiter!) Aufgrund dessen ist P(12.Person)=0,811 und P(24.Person)=0,823 28) Bei einer Infektionskrankheit verlaufen 30% der Fälle stumm (symptomlos). Zwei Personen seien infiziert. Wie groß ist die Wahrscheinlichkeit für: zwei stumme Verläufe, zwei nicht stumme Verläufe, genau einen stummen Verlauf, sowie für mindestens einen stummen Verlauf? 2 2 P(k = 2) = 0,320,70 = 1 * 0,32 *1 = 0,09 P(k = 0) = 0,300,7 2 = 1 *1 * 0,7 2 = 0,49 2 0 2 P(k ≥ 1) = P(k = 1) + P(k = 2) = 0,72 P(k = 1) = 0,310,71 = 2 * 0,3 * 0,7 = 0,42 1 29) Überprüfen Sie, ob die Ereignisse A und B im folgenden Vierfelderschema unabhängig von einander sind. Vierfelderkorrelation! 30) […] Unter anderem soll untersucht werden, ob ein Zusammenhang zwischen der Wirksamkeit des Programms und der Anzahl der Förderstunden pro Monat besteht. Angabe: Förderstunden pro Monat, Fehler vor Programm, Fehler nach Programm Differenzbildung von Fehler vor Programm – Fehler nach Programm! Interessante Beispiel aus meinen Mathematik-Buch 1) Bei der Tombola eines Schulfestes werden insgesamt 1000 Lose ausgegeben, 300 davon sind Gewinnlose. a. Wie viele Lose muss man kaufen, um mit 90%iger Wahrscheinlichkeit mit mindestens einem Gewinn rechnen zu können? Seite 5 von 6 Haszonits Iris Theoriefragen und interessante Beispiel 26.01.2005 300 n P (k ≥ 1) = 1 − P (k = 0) = 1 − 1 − = 1 − 0,7 1000 n n n 1 − 0,7 ≥ 0,9 ⇒ −0,7 ≥ −0,1 ⇒ 0,7 ≤ 0,1 ⇒ n log 0,7 ≤ log 0,1 log 0,1 n≥ ≈ 6,45 Man muss min. 7 Lose kaufen. log 0,7 n b. Wie groß müsste der Anteil p der Gewinnlose sein, damit man beim Kauf von fünf Losen mit 99%iger Wahrscheinlichkeit mit einem Gewinn rechnen kann? P (k ≥ 1) = 1 − P (k = 0) = 1 − (1 − p )5 1 − (1 − p )5 ≥ 0,99 ⇒ (1 − p)5 ≤ 0,01 ⇒ p ≥ 1 − 5 0,01 ≈ 0,60 Der Anteil der Gewinnlose müsste min. 60% betragen. 2) In einer Großstadt sind erfahrungsgemäß 6% der U-Bahn-Fahrgäste Schwarzfahrer. Ein Kontrolleur überprüft täglich etwa 300 Fahrgäste. Wie viele Schwarzfahrer wird er im Mittel täglich treffen? µ = n * p = 300 * 0,06 = 18 3) Die Glühbirnenproduktion eines bestimmten Unternehmens erhält erfahrungsgemäß 8% „Montagsbirnen“, d.h. Glühbirnen mit deutlich kürzerer Lebensdauer. Ein Elektrogeschäft bezieht 60% seiner Glühbirnen vom Hersteller A (8% Montagsbirnen) und 40% vom Hersteller B (10% Montagsbirnen). a. Wie groß ist die Wahrscheinlichkeit dafür, dass der Käufer einer zufällig herausgegriffenen Birne eine Montagsbirne erwischt? P( M ) = P( A ∩ M ) + P( B ∩ M ) = P( A) * P( M | A) + P( B) * P( M | B) 0,6 * 0,08 + 0,4 * 0,1 = 0,088 ≈ 8,8% b. Mit welcher Wahrscheinlichkeit stammt eine Montagsbirne vom Hersteller B? P( B | M ) = P( B ∩ M ) P( B) * P( M | B) 0,4 * 0,1 = = ≈ 0,4545 ≈ 45% P(M ) P(M ) 0,088 Seite 6 von 6