Formelsammlung Formelsammlung Grundbegriffe der Wahrscheinlichkeitsrechnung Theoretische Wahrscheinlichkeit p(A) = Anzahl günstiger Ereignisse Anzahl möglicher Ereignisse Empirische Wahrscheinlichkeit p(A) = f(A) n (Relative Häufigkeit) f(A) = Häufigkeit des Ereignisses A n = Anzahl aller Ereignisse Deskriptive Statistik Skalenniveaus Nominalskala Rangskala (Ordinal-) Intervallskala Verhältnisskala =; = ; ; > ; < = ; ; > ; < ; + ; = ; ; > ; < ; + ; ; · ; / Prozentwert und Prozentrang Zulässige Transformationen: - jede, die Gleichheit und Unterschiedlichkeit erhält - positive streng monotone Transformationen - positive lineare Transformationen der Form y = a · x + b mit m > 0 - positive Ähnlichkeitstransformationen der Form y = m · x mit m > 0 Prozentwert %k = fk 100% n fk %k n Prozentrang PR = f kum (k) 100% n fkum(k) = Kumulierte Häufigkeit %kum(k) = Kumulierter Prozentwert Maße der zentralen Tendenz Modalwert (Modus) Median = Häufigkeit in der Kategorie k = Prozentwert in der Kategorie k = Anzahl Beobachtungen Wert, der am häufigsten besetzt ist Wert, der eine Verteilung halbiert Seite 1 Varianzanalyse n xi i n Arithmetisches Mittel x xi i 1 n p Gewogenes AM x nk xk = Anzahl der Vpn = Messwert = Index der Versuchspersonen x = Mittelwert der Mittelwerte p = Anzahl der Mittelwerte nk = Anzahl der Vpn in Gruppe k k 1 p nk k 1 Mittelwert nach einer linearen Transformation y = a · x + b y ax b Dispersionsmaße y = transformierter Mittelwert n xi i n (x i x) 2 Varianz (als Populationsschätzer) ˆ 2x Standardabweichung (als Populationsschätzer) ˆ x = ˆ 2x Varianz nach einer linearen Transformation y = a · x + b ˆ 2y a 2 ˆ 2x i 1 n 1 ̂ 2x = zu transformierende Varianz z-Standardisierung (z-Wert) zx = Anzahl der Vpn = Messwert = Messwertindex μ = Populationsmittelwert σ = Streuung xi Inferenzstatistik Standardfehler des Mittelwertes n ˆ x Seite 2 ˆ 2x n (x i x) 2 i 1 n (n 1) ̂ 2x = Varianz der Variable x xi = Wert der Person i auf Variable x x = Mittelwert der Variable x n = Stichprobenumfang Formelsammlung Regression und Korrelation Kovarianz n empirische Kovarianz cov(x , y) maximale Kovarianz x i x y i y i 1 n 1 cov max ˆ x ˆ y xi = Wert der Person i auf Variable x zi = Wert der Person i auf Variable y x = Mittelwert der Variable x y = Mittelwert der Variable y n = Stichprobenumfang Produkt-Moment-Korrelation rxy = cov(x, y) ˆ x ˆ y Partialkorrelation rxy z rxy ryz rxz 2 (1 ryz ) (1 rxz2 ) rxy = Korrelation nullter Ordnung der beiden interessierenden Merkmale rxy|z = Partialkorrelation der beiden interessierenden Merkmale rxz; ryz = Korrelation von x und y mit der Drittvariable z Fisher Z -Transformation Z 1 1 r ln 2 1 r r e 2Z 1 e 2Z 1 Punktbiseriale Korrelation rpb y1 y 0 n 0 n1 ˆ y N2 Z ln r e = Z-transformierte Korrelation = natürlicher Logarithmus = Korrelationskoeffizient ≈ 2,7183 (Eulersche Zahl) y x = intervallskalierte Variable = dichotome Variable (x = 0; x =1) = Mittelwert von y bei x = 0 y0 y 1 = Mittelwert von y bei x = 1 σ̂ y = Streuung der y-Variable n0 = Anzahl Beobachtungen bei x = 0 n1 = Anzahl Beobachtungen bei x = 1 N = n0 + n1 Rangkorrelation n rs 1 6 d i2 i 1 n ( n 2 1) di = Differenz der laufenden Nr. der Untersuchungseinheit i auf einem Rangplatz n = Anzahl der Rangplätze Seite 3 Varianzanalyse Lineare Regression Vorhersage von y durch x ŷ i = b yx x i + a yx Vorhersage von x durch y x̂ i = b xy y i + a xy Regressionsgewicht (Steigung der Gerade) bzw. Höhenlage: (Schnittpunkt mit y bei x = 0) b yx = cov(x, y) ˆ 2x b xy = cov(x, y) ˆ 2y ŷ i b a = vorhergesagte Werte = Regressionsgewicht = additive Konstante cov(x,y) = Kovarianz von x und y = Streuung der Variable x ̂ x = Streuung der Variable y ̂ y a yx y b yx x bzw. a xy x b xy y t-Test für Korrelationen t-Wert t df r N2 r n df 1 r2 = Korrelationskoeffizient = Anzahl der Versuchspersonen =N-2 Effektstärken rxy cov emp cov max cov(x, y) ˆ x ˆ y Konventionen nach Cohen (1988): kleiner Effekt: r = 0,1 mittlerer Effekt: r = 0,3 großer Effekt: r = 0,5 t-Test für unabhängige Stichproben t-Wert Empirischer t-Wert unter H0 Standardfehler der Mittelwertsdifferenz t df x x2 1 x1 x2 ˆ x1 x 2 ˆ 12 n1 ˆ 22 x1 = Mittelwert der 1. Gruppe x2 = Mittelwert der 2. Gruppe df = n1 + n2 2 ̂12 = geschätzte Populationsvarianz der 1. Gruppe = geschätzte Populationsvarianz der 2. Gruppe n2 ̂ 22 Seite 4 Formelsammlung Theoretische Effektstärkenmaße d 1 2 x 2 2 2 μ1, μ2 = Mittelwerte der Populationen, aus denen die Mittelwerte gezogen werden x = Streuung der Population innerhalb einer Bedingung 2 sys 2x 2 sy s 2 Gesamt 2 sy s 2 2 sy s x 2 1 2 2 2 1 2 ˆ 2x1 ˆ 2x 2 Konventionen nach Cohen (1988): kleiner Effekt: Ω2 = 0,01 mittlerer Effekt: Ω2 = 0,06 großer Effekt: Ω2 = 0,14 x 1 , x 2 = Mittelwerte der Gruppen ̂ x = geschätzte Populationsstreuung ̂ 2x = geschätzte Varianz der Gruppe 1 2 ̂ 2x 2 = geschätzte Varianz der Gruppe 2 ² 2 2 1 ² Empirische Effektstärkenmaße (Schätzungen für die Population) d x1 x 2 ˆ x f2 Konventionen nach Cohen (1988): kleiner Effekt: d = 0,2 mittlerer Effekt: d = 0,5 großer Effekt: d = 0,8 x1 x 2 t 2 1 N 1 t = empirischer t-Wert N = n1 + n2 2 ˆ2 f 1+ f 2 2 ˆ2 f 1 - 2 d 2f 2 Empirische Effektstärkenmaße (auf Stichprobenebene) f S2 2 QSsys QSx ² 1 ² t2 df QSsys QSGesamt f2 S 2 1 fS fS2 = Effekt auf Stichprobenebene η2 = Eta-Quadrat, Effekt auf Stichprobenebene Seite 5 Varianzanalyse Teststärkebestimmung (a posteriori) = Nonzentralitätsparameter 2 N ² = theoretischer Effekt 2 N 1 2 Stichprobenumfangsplanung (a priori) N ;1 2 ;1 2 1 2 = Nonzentralitätsparameter (ermittelt bei gegebenem und aus den TPF-Tabellen) N = Anzahl Versuchspersonen t-Test für abhängige Stichproben t-Wert N t df Empirischer t-Wert unter H0 xd ˆ x d xd di i 1 N N Standardfehler des Mittelwerts der Differenzen ˆ x d ˆ d ˆ d N df N xi1 xi2 di (d i x d ) 2 i 1 N 1 =N1 = Anzahl Versuchspersonen = Wert der Person i in Bed. 1 = Wert der Person i in Bed. 2 = xi1 xi2 (Differenzwert) Empirische Effektstärkenmaße dZ xd ˆ d f S2( abhängig ) 2p Teststärkebestimmung (auf Basis der Konventionen für unabhängige Stichproben) Seite 6 QSsy s QS x QSsys QSsys QSx xd = Mittelwert der Differenzen ̂d = Streuung der Differenzen t2 df fS2 = Effekt auf Stichprobenebene f S2 1 f S2 ηp2 = partielles Eta-Quadrat, Effekt auf Stichprobenebene 2 2 2 2unabhängig N N 1 r 1 r 1 2 r = Korrelation zwischen den Messwertreihen Formelsammlung Teststärkebestimmung (für empirische Effekte) = Nonzentralitätsparameter f S2( abhängig ) N Stichprobenumfangsplanung (anhand der Konventionen für unabhängige Stichproben) N Stichprobenumfangsplanung (bei vorhandener Effektgröße aus Literatur oder anderen Studien) N ;1 2unabhängig (1 r ) 2 r ;1 = Korrelation zwischen den Messwertreihen f2abhängig = aus der Literatur oder eigenen Studien abgeleitete anzunehmende Effektstärke 2 f abhängig Varianzanalyse ohne Messwiederholung Einfaktorielle Varianzanalyse (ohne Messwiederholung) Quadratsummen QS zwischen n A i G p i 1 QSinnerhalb x mi A i p n i 1 m 1 Freiheitsgrade p n 2 2 Ai = Anzahl Faktorstufen = Anzahl Vpn pro Faktorstufe = Mittelwert aus Faktorstufe i G = Gesamtmittelwert df zwischen p 1 df innerhalb p (n 1) Stichprobenkennwerte Empirischer F-Wert ˆ 2zwischen QS zwischen df zwischen 2 ˆ innerhalb QSinnerhalb df innerhalb Fdf Zähler ,df Nenner ˆ 2zwischen 2 ˆ innerhalb dfZähler = dfzwischen dfNenner = dfinnerhalb Seite 7 Varianzanalyse Zweifaktorielle Varianzanalyse (ohne Messwiederholung) Quadratsummen QS A n q A i G QS B n p B j G p p q n 2 i 1 q 2 j1 p q QS AxB n AB ij A i B j G i 1 j1 p q n QS Re s x mij AB ij i 1 j1 m 1 Freiheitsgrade Stichprobenkennwerte dfA = p 1 dfB = q 1 dfAB = (p 1) · (q 1) dfRes = p · q · (n 1) ˆ 2A QS A df A ˆ 2B QS B df B ˆ 2AxB QS AxB df AxB ˆ 2Re s QS Re s df Re s Empirische F-Werte Seite 8 2 Haupteffekt A FdfA ,dfRe s ˆ 2A ˆ 2Re s Haupteffekt B FdfB ,dfRe s ˆ 2B ˆ 2Re s Wechselwirkung AB FdfAxB ,dfRe s ˆ 2AxB ˆ 2Re s 2 Ai = Anzahl Faktorstufen Faktor A = Anzahl Faktorstufen Faktor B = Anzahl Vpn in der Zelle ABij = Mittelwert der Faktorstufe Ai Bi = Mittelwert der Faktorstufe Bj ABij = Zellmittelwert G = Gesamtmittelwert Formelsammlung Empirische Effektstärkenmaße f2 Umrechnung f 2 2 Umrechnung 2 f 2 Teststärkebestimmung (a posteriori) Definition und Umrechnung der Effektstärkenmaße dfZähler = Freiheitsgrade des Zählers des F-Bruchs dfNenner = Freiheitsgrade des Nenners des F-Bruchs N = p ·q · n = Stichprobengröße N f2 2 1 f 2 2 f2 1 2 2 N 2 sy 2 s 2p 2 sy s 2x 1 2 2 Stichprobenumfangsplanung (a priori) df Zähler Femp 1 2 sys 2x 2 1 2 = Nonzentralitätsparameter Konventionen nach Cohen (1988): kleiner Effekt: Ω2 = 0,01 mittlerer Effekt Ω2 = 0,06 großer Effekt Ω2 = 0,14 N = Nonzentralitätsparameter (ermittelt bei gegebenem , , und dfZähler aus TPF-Tabellen) Bei gleicher Vpn-Anzahl in Zellen (unabhängige Stichproben): N=p·n λ (dfZähler ;1β;α) Φ 2 Tukey HSD-Test HSD q krit ( ,r ,dfRe s ) einfaktorielle ANOVA zweifaktorielle ANOVA Haupteffekt A Haupteffekt B Wechselwirkung nHSD = n nHSD = q · n nHSD = p · n nHSD = n ˆ 2Re s n HSD HSD = kritische Differenz eines Paarvergleichs qkrit = krit. Wert aus der q-Tabelle = kumuliertes Signifikanzniveau für alle Paarvergleiche r = Anzahl der Mittelwerte nHSD = Anzahl der Vpn, aus denen die verglichenen Mittelwerte gebildet werden n = Anzahl der Vpn pro Zelle p = Stufenanzahl Faktor A q = Stufenanzahl Faktor B Seite 9 Varianzanalyse Varianzanalyse mit Messwiederholung Einfaktorielle Varianzanalyse p (mit Messwiederholung) - systematische Varianz ˆ 2A QSA df A n (A i G ) i 1 p 1 p - Residualvarianz ˆ 2AVpn QSAVpn df AVpn N [x im (A i Pm G )]2 Empirische Effektstärkenmaße (auf Stichprobenebene) 2p mit mit = Mittelwert der Person m G = Gesamtmittelwert = Anzahl Faktorstufen Faktor A = Anzahl Vpn in einer Faktorstufe p n dfA = p – 1 dfRes = (n – 1) · (p – 1) ηp²: partielles Eta-Quadrat, Effekt auf der Stichprobenebene F df A df AVpn fS2 1 fS2 p Φ 2unabhängig N 1 r Ω 2unabhängig Φ 2unabhängig 1 Ω 2unabhängig N Pm QSA QSAVpn λ df;α Stichprobenumfangsplanung auf Basis der Konventionen für unabhängige Stichproben Seite 10 ˆ 2A ˆ 2A ˆ 2Re s ˆ 2AVpn QSA QSA QSAVpn f S2(abhängig ) Teststärkeanalyse - a priori auf Basis der Konventionen für unabhängige Stichproben = Mittelwert der Faktorstufe Ai (p 1) (n 1) FA ( df A ,df Re s ) f S2( abhängig ) Ai i 1 m 1 F-Bruch 2p 2 df ;;1 2unabhängig 2unabhängig (1 r ) p 2unabhängig 1 2unabhängig p = Anzahl Stufen des Faktors A = mittlere Korrelation zwischen den Messzeitpunkten Konventionen für Effekt bei unabhängigen Stichproben: kleiner Effekt: Ω² = 0,01 mittlerer Effekt: Ω² = 0,06 großer Effekt: Ω² = 0,14 p = Anzahl Stufen des Faktors A = mittlere Korrelation zwischen r den Messzeitpunkten r Formelsammlung Post Hoc Tests HSD q krit ( ; p; df Nenner ) Zweifaktorielle Varianzanalyse (mit MW auf einem Faktor) - Faktor A ohne MW HSD = kritische Differenz eines Paarvergleichs qkrit = krit. Wert aus der q-Tabelle = kumuliertes Signifikanzniveau für alle Paarvergleiche p = Anzahl der Mittelwerte n = Anzahl der Vpn pro Zelle ˆ 2Re s n p ˆ 2A ( nicht mw ) QSA ( nicht mw ) df A ( nicht mw ) n q (A i G ) 2 i 1 p 1 q - Faktor B mit MW ˆ 2B( mw ) QSB( mw ) df B( mw ) q ˆ 2AB( mw ) - Wechselwirkung A x B QS AB( mw ) df AB( mw ) j1 q 1 p n [ABij (A i B j G)]2 j1 i 1 (p 1) (q 1) p ˆ 2Pr üf ( A ) - Prüfvarianz des Faktors A ˆ 2Vpn in S QSVpn in S df Vpn in S p - Prüfvarianz des Faktors B und der Wechselwirkung A×B F-Brüche - Faktor A ohne MW n p (Bj G)2 ˆ 2B Vp n QSB Vp n df B Vp n FA (dfA ;df Vpn in S ) q n q (APim A i ) 2 i 1 m 1 p (n 1) n [x ijm (ABij APim Ai )]2 i 1 j1 m 1 p (q 1) (n 1) ˆ 2A ( nicht mw ) ˆ 2Pr üf ( A ) ˆ 2B( mw ) - Faktor B mit MW FB( dfB ;dfBVpn ) - Wechselwirkung A×B FAB( dfAB ;dfBVpn ) ˆ 2Pr üf ( B) ˆ 2A ˆ 2Vpn in S ˆ 2B ˆ 2BVpn ˆ 2AB( mw ) ˆ 2Pr üf ( B) ˆ 2AB( mw ) ˆ 2BVpn dfA = p – 1 dfVpn in S = p · (n – 1) dfB = q – 1 dfB×Vpn = p · (q – 1) · (n – 1) dfA×B(mw) = (p – 1) · (q – 1) dfB×Vpn = p · (q – 1) · (n – 1) Seite 11 Varianzanalyse Empirische Effektstärkenmaße (auf Stichprobenebene) - Faktor A ohne MW - Faktor B mit MW 2p ( A ) 2p( B) QSA QSA QSVpn in QSB QSB QSBVpn QSAB QSAB QSBVpn - Wechselwirkung A×B 2p( AB) Berechnung aus F-Werten f S2( abhängig ) 2p S F df Effekt df Pr üf fS2 1 fS2 Teststärkeanalyse - Für Faktor A ohne MW A ( nicht mw );df ; - Für Faktor B mit MW und die Wechselwirkung A×B Stichprobenumfangsplanung - für Faktor A ohne MW - für Faktor B und WW siehe einfaktorielle VA mit MW B( mw );df ; AB( mw );df ; q 2unabhängig N 1 (q 1) r N p n A ( nicht mw ) q 2unabhängig N 1 r df ;;1 2unabhängig 1 (q 1) r q Zweifaktorielle Varianzanalyse (mit MW auf beiden Faktoren) F-Brüche - HE Faktor A mit p Stufen FA ( df A ,df Pr üf ( A ) ) - HE Faktor B mit q Stufen FB( df B ,df Pr üf ( B ) ) - WW A×B Seite 12 ˆ 2A ˆ 2Pr üf ( A ) ˆ 2B ˆ 2Pr üf ( B) FAxB( df AB ,df Pr üf ( AB ) ) ˆ 2AB ˆ 2Pr üf ( AB) ˆ 2A ˆ 2AVpn ˆ 2B ˆ 2BVpn ˆ 2AB ˆ 2ABVpn dfA = p – 1 dfA×Vpn = (p – 1) · (n – 1) dfB = q – 1 dfB×Vpn = (q – 1) · (n – 1) dfA×B = (p – 1) · (q – 1) dfA×B×Vpn = (p – 1) · (q – 1) · (n – 1) Formelsammlung Empirische Effektstärkenmaße (auf Stichprobenebene) - Faktor A ohne MW 2p( A) QSA QSA QSPr üf ( A) - Faktor B mit MW 2p( B) QSB QSB QSPr üf ( B) - Wechselwirkung A×B 2p( AB) - Berechnung aus F-Werten fS2(abhängig ) 2p Teststärkeanalyse - auf Basis der Konventionen für unabhängige Stichproben F df Effekt df Pr üf fS2 1 fS2 pq 2 unabhängig n 1 r 2unabhängig 2 unabhängig 1 2unabhängig df ; mit Stichprobenumfangsplanung - analog zur einfaktoriellen VA mit MW auf einem Faktor - getrennt vorzunehmen für Faktor A, Faktor B und WW QSAB QSAB QSPr üf ( AB) N mit df ;;1 2unabhängig 2unabhängig (1 r ) p 2unabhängig 1 2unabhängig Nichtparametrische Verfahren: U-Test U-Test N (N + 1) 2 Prüfung der Korrektheit der Rangzuweisung T1 + T2 = Rangplatzüberschreitungen von Gruppe 1 gegenüber Gruppe 2 U n1 n 2 n1 (n1 1) T1 2 Rangplatzunterschreitungen von Gruppe 1 gegenüber Gruppe 2 U n 1 n 2 n 2 (n 2 1) T2 2 Kontrolle U n1 n 2 U N = n1 + n2 T1 = Rangplatzsumme Gruppe 1 T2 = Rangplatzsumme Gruppe 2 Seite 13 Varianzanalyse Bei n1 oder n2 > 20 z U U U U Streuung bei unverbundenen Rängen korrigierte Streuung bei verbundenen Rängen Stichprobenumfangsplanung Berechnung über t-Test n1 n 2 2 n 1 n 2 (n 1 n 2 1) 12 U n1 n 2 N ( N 1) U corr N 3 N k t 3i t i 12 12 i 1 μU σU n1 n2 = erwarteter mittlerer U-Wert = Streuung der U-Werte = Anzahl Vpn in Gruppe 1 = Anzahl Vpn in Gruppe 2 N ti = n1 + n2 = Anzahl der Personen, die sich Rangplatz i teilen = Anzahl der verbundenen Ränge k 2 N ( t Test ) Nichtparametrische Verfahren: Chi²-Test Eindimensionaler chi²-Test k 2 i 1 (f bi - f ei ) 2 f ei Zweidimensionaler chi²-Test allgemein k l 2 i 1 j1 erwartete Häufigkeit f eij (f bij f eij ) 2 f eij Zeilensumm e i Spaltensum me j k fbi fei df = Anzahl Kategorien = beobachtete Häufigkeit in Kat. i = erwartete Häufigkeit in Kat. i =k1 k l fbij feij df = Anzahl Kategorien i = Anzahl Kategorien j = beobachtete Zellhäufigkeit = erwartete Zellhäufigkeit = (k 1) · (l 1) N Vierfelder-chi²-Test (zwei dichotome Merkmale) Seite 14 2 N (a d b c) 2 (a c) ( b d ) (a b ) (c d ) a b c d Formelsammlung Empirische Effektstärkenmaße ŵ 2 - Vierfelder Test auch 2 N N = Phi - Koeffizient (gleichbedeutend mit Korrelation zweier dichotomer Variablen) 2 ŵ N 2 2 Annahme einer Effektstärke a priori - eindimensional w2 - zweidimensional w 2 k i 1 k (p bi - p ei ) 2 p ei i i 1 j1 = Anzahl Beobachtungen (p bij - p eij ) 2 p eij k pbi pei = Anzahl der Kategorien = rel. Häufigkeit unter der H1 = rel. Häufigkeit unter der H0 k l pbij peij = Anzahl der Kategorien i = Anzahl der Kategorien j = rel. Häufigkeit unter der H1 = rel. Häufigkeit unter der H0 Konventionen kleiner Effekt: mittlerer Effekt großer Effekt: = 0,01 = 0,09 = 0,25 Teststärkebestimmung w2 N Stichprobenumfangsplanung w² w² w² N = Nonzentralitätsparameter w2 Seite 15