Mittelwerte, Zusammenhangsmaße

Werbung
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße,
Hypothesentests in Stata
Statistik II
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (1/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Wiederholung: Daten & Deskriptive
Statistik
Zusammenhangsmaße
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Inferenzstatistik
Konfidenzintervalle
Hypothesentests
Zusammenfassung
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (2/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Daten verwalten
I
Datenmatrix aus Fällen (Zeilen) und Variablen (Spalten)
I
Neue Variablen erzeugen mit generate
I
Vorhandene Variablen verändern mit replace
I
Bedingungen für Befehle formulieren mit if (z. B. if v26<8)
I
Beispiel: Geburtsjahr → Alter in Teilnehmerbefragung inkl.
Fehlerkorrektur
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (3/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Histogramm Alter
. tab geburtsjahr
geburtsjahr
1983
1984
1985
1986
1987
1988
1989
19888
Freq.
Percent
Cum.
2
1
6
5
22
21
4
1
3.23
1.61
9.68
8.06
35.48
33.87
6.45
1.61
3.23
4.84
14.52
22.58
58.06
91.94
98.39
100.00
Total
62
100.00
. replace geburtsjahr = 1988 if geburtsjahr == 19888
(1 real change made)
. tab geburtsjahr
geburtsjahr
Freq.
Percent
Cum.
1983
1984
1985
1986
1987
1988
1989
2
1
6
5
22
22
4
3.23
1.61
9.68
8.06
35.48
35.48
6.45
Total
62
100.00
3.23
4.84
14.52
22.58
58.06
93.55
100.00
. gen alter = 2009-geburtsjahr
(8 missing values generated)
. tab alter
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (4/30)
alter
Freq.
Percent
Cum.
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Verteilung wie beschreiben?
I
Mittelwerte
I
I
I
I
I
Modus
Median
(Perzentile)
Arithmetisches Mittel
Streuungsmaße
I
I
I
Spannweite (range)
Varianz
Standardabweichung
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (5/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Alter deskriptiv
.4
. summarize alter,detail
Density
.2
.3
alter
.1
1%
5%
10%
25%
Percentiles
20
20
21
21
22
0
50%
20
22
24
alter
I
I
22
24
24
26
Largest
24
25
26
26
Obs
Sum of Wgt.
62
62
Mean
Std. Dev.
21.96774
1.330201
Variance
Skewness
Kurtosis
1.769434
1.15472
4.260386
Verteilung rechtsschief/linkssteil: positive skewness
Kurtosis > 0: schmaler Gipfel (verglichen mit
Normalverteilung)
Modus?
.3
.4
I
26
75%
90%
95%
99%
Smallest
20
20
20
20
ity
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (6/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Histogramm Alter
. tab geburtsjahr
geburtsjahr
1983
1984
1985
1986
1987
1988
1989
19888
Freq.
Percent
Cum.
2
1
6
5
22
21
4
1
3.23
1.61
9.68
8.06
35.48
33.87
6.45
1.61
3.23
4.84
14.52
22.58
58.06
91.94
98.39
100.00
Total
62
100.00
. replace geburtsjahr = 1988 if geburtsjahr == 19888
(1 real change made)
. tab geburtsjahr
geburtsjahr
Freq.
Percent
Cum.
1983
1984
1985
1986
1987
1988
1989
2
1
6
5
22
22
4
3.23
1.61
9.68
8.06
35.48
35.48
6.45
Total
62
100.00
3.23
4.84
14.52
22.58
58.06
93.55
100.00
. gen alter = 2009-geburtsjahr
(8 missing values generated)
. tab alter
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (7/30)
Freq.
Percent
Cum.
alter
20
21
4
22
6.45
35.48
6.45
41.94
26
2
3.23
100.00
Wiederholung:
Daten22& Deskriptive
22
35.48 Statistik77.42
Zusammenhangsmaße
23
5
8.06
85.48
Inferenzstatistik
24
6
9.68
95.16
Zusammenfassung
25
1
1.61
96.77
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Was ist ein Zusammenhang?
62
100.00
I
Allgemein: gemeinsames Muster“ in der Verteilung zweier
”
Variablen (kausal?)
I
Skalenniveaus – Zusammenhangsmaße
I
Gerichtete vs. ungerichtete Zusammenhänge
0
.1
Density
.2
.3
.4
Total
. hist alter
20
22
24
26
alter
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (8/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Maße auf der Basis von χ2
I
Vergleich empirische Tabelle – Indifferenztabelle
I
Für jede Zelle Differenz zwischen beobachteten/erwarteten
Werten ermitteln
I
Abweichungen quadrieren
I
Quadrierte Abweichungen durch erwarte Werte teilen
Summe der Beiträge: χ2
I
I
I
I
I
Wert zwischen 0 und +∞
Abhängig von Fallzahl
Stärke des Zusammenhangs
Kategorienzahl
I
Cramer’s V, φ, C =
I
λ?
q
χ2
n×(R−1)
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (9/30)
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Zusammenhang Erst- und Zweitstimme?
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (10/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Ordinale Zusammenhänge
I
Zwei ordinale Variablen → Richtung
I
I
Mehr x, mehr y ; weniger x, weniger y → positiver
Zusammenhang
Mehr x, weniger y ; weniger x, mehr y → negativer
Zusammenhang
I
Wie mißt man das?
I
Vergleich von Paaren von Beobachtungen
Land B
niedriges Bildungsniveau
niedriges Wirtschaftswachstum
Land A
hohes Bildungsniveau
hohes Wirtschaftswachstum
+
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (11/30)
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Paarvergleich und Berechnung von γ
I
I
I
Konkordantes Paar A B: B hat mehr von x (z. B. Bildung)
und mehr von y (z. B. politisches Interesse) als A
Diskonkordantes Paar A B: B hat mehr von x (z. B.
Bildung) als A, aber weniger von y (z. B. politisches Interesse)
als A
γ: Verhältnis konkordante – diskonkordante Paare
I
I
I
I
I
Konkordante Paare überwiegen: positiver Zusammenhang
Diskonkordante Paare überwiegen: negativer Zusammenhang
Paare mit identischen Werten für eine oder beide Variablen:
ties“
”
Werden bei γ ignoriert
NC −ND
(konkordante Paare im
τb = √
(NC +ND +Tx )×(NC +ND +TY )
Nenner berücksichtigt)
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (12/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Wie konsistent sind wirtschaftsliberale Einstellungen?
I
I
I
Politik sollte sich aus Wirtschaft heraushalten“
”
Weitere Öffnung der Weltmärkte dient Wohl aller“
”
Problem: Codierungen
. gen politikraus= themen1diepolitiksolltesichausde
(3 missing values generated)
. gen globalisierunggut = themen1dieweitereffnungderweltmr
(3 missing values generated)
. tab themen1dieweitereffnungderweltmr
themen1 [Die weitere Oeffnung
der Weltmaerkte dient dem
Wohl aller.]
Freq.
Percent
1. Stimme eher nicht zu
2. Stimme eher zu
3. Stimme voll und ganz zu
4. Weder noch
5. Stimme ueberhaupt nicht zu
21
21
6
14
5
31.34
31.34
8.96
20.90
7.46
Total
67
. tab themen1diepolitiksolltesichausde
themen1 [Die Politik sollte
sich aus der Wirtschaft
heraushalten.]
Freq.
100.00
1. Stimme ueberhaupt nicht zu
2. Stimme eher zu
3. Stimme eher nicht zu
4. Weder noch
5. Stimme voll und ganz zu
Cum.
31.34
62.69
71.64
92.54
100.00
Percent
Cum.
34.33
22.39
26.87
14.93
1.49
34.33
56.72
83.58
98.51
100.00
23
15
18
10
1
Total
67
100.00
. recode globalisierunggut (1=2) (2=4) (3=5) (4=3) (5=1)
(globalisierunggut: 67 changes made)
. recode politikraus (1=1) (3=2) (4=3) (2=4) (5=5)
(politikraus: 43 changes made)
. tab politikraus globalisierunggut,gamma taub
politikrau
globalisierunggut
s
1
2
3
Statistik II
1
1
13
1
2
3
3
3
3
0
1
5
4
1
3
Wiederholung:
Daten
& Deskriptive
Statistik5
5
0
1
0
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
21
14
Total
5
gamma =
Kendall´s tau-b =
0.1297
0.0997
4
5
Total
Mittelwerte, Zusammenhangsmaße, Hypothesentests (13/30)
6
2
7
2
3
1
1
Zwei 5nominale Variablen
0
0
23
18
10
15
1
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei21intervallskalierte
Variablen
6
67
ASE = 0.131
ASE = 0.101
Warum?
I Zusammenhang in der richtigen Richtung
I
Nicht besonders stark
Konkordante
Paare
und ties
Vergleich eines
intervallskalierten
Merkmals
I
Über zwei oder mehr Gruppen (nominalskalierte Variable)
I
Sind weibliche Teilnehmer jünger (mangels Wehrpflicht)?
I
η2 =
I
SAQgesamt −SAQKategorien
SAQgesamt
. tabstat alter ,by(geschlecht) stat (mean n)
Summary for variables: alter
by categories of: geschlecht
geschlecht
mean
N
Nicht zutreffend
maennlich
weiblich
22
22.26316
21.45455
2
38
22
Total
21.96774
62
. anova alter geschlecht
Source
Number of obs =
62
Root MSE
= 1.2942
Partial SS
df
MS
R-squared
= 0.0844
Adj R-squared = 0.0534
F
Prob > F
Model
9.11251736
2
4.55625868
2.72
0.0741
geschlecht
9.11251736
2
4.55625868
2.72
0.0741
Residual
98.8229665
59
1.67496553
Total
107.935484
61
1.76943416
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (14/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Kovarianz und Korrelation?
I
Varianz: Abweichung einer Variablen von ihrem Mittelwert
I
Kovarianz: gemeinsame Abweichung zweier Variablen von
ihren Mittelwerten
Linearer Zusammenhang
I
I
I
Positiver Zusammenhang: überdurchschnittliche Werte von x,
überdurchschnittliche Werte von y und umgekehrt
Negativer Zusammenhang: überdurchschnittliche Werte von x,
unter durchschnittliche Werte von y und umgekehrt
I
Abweichungsprodukte → Kovarianz zwischen −∞ und +∞
I
Hängt ab von Stärke des Zusammenhangs und Skalierung
I
Teilen durch Produkt der Standardabweichung →
Korrelationskoeffizient r
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (15/30)
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Zusammenhang zwischen Bearbeitungsdauer und
politischem Wissen?
I
Besonders informierte Studierende besonders schnell?
I
Oder besonders langsam? → Zeitdauer + Wissenindex
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (16/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Bearbeitungdauer berechnen
.
.
keep if abgeschlossen =="Y"
(7 observations deleted)
.
. /*Zeitangaben aus Datensatz in internes Format bringen und formatieren*/
.
.
gen beginn = clock(datumgestartet , "DM20Yhm")
.
gen ende = clock(datumletzteaktivitt , "DM20Yhm")
.
format %tc beginn
.
format %tc ende
.
. /*Bearbeitungszeit (in Millisekunden) errechnen*/
.
.
gen dauer=ende-beginn
. /*Umrechnen in Minuten*/
.
gen minuten = dauer/60000
.
. list beginn ende dauer minuten in 1/10
beginn
ende
dauer
minuten
1.
2.
3.
4.
5.
27oct2009
27oct2009
27oct2009
27oct2009
28oct2009
22:48:00
22:52:22
23:07:40
23:44:48
00:00:06
27oct2009
27oct2009
27oct2009
28oct2009
28oct2009
22:58:56
23:01:07
23:14:13
00:02:17
00:13:12
655360
524288
393216
1048576
786432
10.92267
8.738133
6.5536
17.47627
13.1072
6.
7.
8.
9.
10.
28oct2009
28oct2009
28oct2009
28oct2009
28oct2009
00:52:31
08:20:21
08:33:28
08:44:23
08:53:07
28oct2009
28oct2009
28oct2009
28oct2009
28oct2009
01:10:00
08:37:50
08:50:56
08:59:40
09:08:25
1048576
1048576
1048576
917504
917504
17.47627
17.47627
17.47627
15.29173
15.29173
Mittelwerte, Zusammenhangsmaße, Hypothesentests (17/30)
.15
Statistik II
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
.1
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Density
Index für Wissen EU-Länder berechnen
.05
I
I
I
Richtige Antwort +1 Punkt
Falsche Antwort -1 Punkt
Unsicher“ oder keine Antwort (missing) 0 Punkt
”
0
. gen wissen=0
.
. /*Schleife
fuer Laender,10die EU-Mitglieder sind*/
5
15
.
/*1 =ja, 2= nein, 3= unsicher*/
minuten
.
.
foreach land of varlist eucountriesungarn eucountriesirland
> auen eucountriesmalta eucountrieszypern eucountriesschweden {
2.
replace wissen = wissen + 1 if `land´ == 1
3.
replace wissen = wissen - 1 if `land´ == 2
4.
}
(53 real changes made)
(4 real changes made)
(60 real changes made)
(2 real changes made)
(53 real changes made)
(6 real changes made)
(54 real changes made)
(7 real changes made)
(49 real changes made)
(9 real changes made)
(7 real changes made)
(53 real changes made)
20
25
eucountrieslit
.
. /*Schleife fuer Laender, die keine EU-Mitglieder sind*/
.
foreach land of varlist eucountriestrkei eucountriesnorwegen eucountrieskro
> atien eucountriesukraine eucountriesgeorgien {
2.
replace wissen = wissen + 1 if `land´ == 2
3.
replace wissen = wissen - 1 if `land´ == 1
4.
}
(0 real changes made)
(62 real changes made)
(10 real changes made)
(28 real changes made)
(24 real changes made)
Statistik II
Mittelwerte,
(31 real changes made)
(46 real changes made)
(11 real changes made)
Zusammenhangsmaße, Hypothesentests (18/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zwei nominale Variablen
Zwei ordinale Variablen
Nominal/intervallskalierte Variablen
Zwei intervallskalierte Variablen
Streudiagramm Wissen – Bearbeitungdauer
5
10
15
20
25
. graph twoway (lowess minuten wissen) (scatter
minuten wissen)
. corr wissen minuten →0.03
-5
0
5
10
wissen
lowess minuten wissen
minuten
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (19/30)
Konfidenzintervalle
Hypothesentests
Wie berechnet man Konfidenzintervalle?
I
Voraussetzung: Zufallsstichprobe (hier nicht wirklich erfüllt)
I
Wenn Zufallsstichprobe, wird sich Stichprobenwert (z. B.
Mittelwert) über unendlich viele Stichproben mit Umfang n in
regelmäßiger Weise verteilen → theoretische Verteilung,
Standardfehler
Konfidenzintervall:
I
I
I
I
I
I
Ausgangspunkt: eine tatsächliche vorhandene Stichprobe
α festlegen
Für z. B. 95% aller Stichproben schließt Intervall wahren
Mittelwert ein
Für alle Stichprobenkennwerte berechenbar (wenn
Standardfehler bekannt)
(Meistens) symmetrisch
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (20/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Konfidenzintervalle
Hypothesentests
.1
Density
.15
.2
.25
LRS Umfrage
0
.05
. summ lrsselbstselbst ,det
lrsselbst [se
0
2
4
lrsselbst [selbst]
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
6
8
1%
5%
10%
25%
50%
Percentiles
1
2
3
3
4.5
Largest
75%
6
8
90%
7
8
95%
8
8
99%
8
8
Mittelwerte, Zusammenhangsmaße, Hypothesentests
(21/30)
. ci lrsselbstselbst
Obs
Variable
Konfidenzintervalle
Hypothesentests
lrsselbsts~t
Logik des Hypothesentests
I
Nullhypothese vs. Alternativhypothese
I
Voraussetzung: Zufallsstichprobe (hier nicht wirklich erfüllt)
I
Wenn Zufallsstichprobe, wird sich Stichprobenwert (z. B.
Mittelwert) über unendlich viele Stichproben mit Umfang n in
regelmäßiger Weise verteilen → theoretische Verteilung,
Standardfehler
I
Vergleich Testergebnis mit theoretischer Verteilung (Modell
für Stichprobenziehung unter H0 )
I
Wie wahrscheinlich ist Testergebnis wenn H0 gilt bzw.
Testergebnis unwahrscheinlicher als α?
Statistik II
Smallest
1
1
2
2
Mittelwerte, Zusammenhangsmaße, Hypothesentests (22/30)
62
M
4.677
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Konfidenzintervalle
Hypothesentests
Hypothesentests aus Statistik I
1. χ2 -Test (zwei nominalskalierte Variablen)
2. z-Test (Vergleich Stichprobenmittelwert mit bekannter
Grundgesamtheit)
3. t-Test (Mittelwert zweier Gruppen in Grundgesamtheit
identisch?)
3.1 Für abhängige Stichproben (Wiederholungsmessung)
3.2 Für unabhängige Stichproben (unterschiedliche
Untersuchungsobjekte)
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (23/30)
Konfidenzintervalle
Hypothesentests
Logik χ2 -Test
I
I
I
Abweichungen zwischen empirischer Kreuztabelle und
Indifferenztabelle → empirischer χ2 -Wert
Wenn in GG Nullhypothese gilt: Abweichungen aufgrund von
Stichprobenfehlern → empirischer χ2 -Wert 6= 0
Über viele Stichproben hinweg entspricht Verteilung
empirischer χ2 -Werte theoretischer χ2 -Verteilung mit
(R − 1) × (C − 1) Freiheitsgraden
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (24/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Konfidenzintervalle
Hypothesentests
Wie hoch ist der kritische Wert?
α = 0.05, df = 25
I
0.0 0.1 0.2 0.3 0.4 0.5
Dichte
. displ invchi2(1,0.95)
3.8414588
. displ invchi2(25,0.95)
37.652484
0
10
20
30
40
Wert
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Mittelwerte, Zusammenhangsmaße, Hypothesentests (25/30)
Konfidenzintervalle
Hypothesentests
z-Test
I
Ist der Mittelwert von LRS tatsächlich < 6?
. ttest lrsselbstselbst =6
One-sample t test
Variable
Obs
Mean
lrssel~t
62
4.677419
Std. Err.
Std. Dev.
[95% Conf. Interval]
.221497
1.744069
4.234509
5.12033
mean = mean(lrsselbstselbst)
t = -5.9711
Ho: mean = 6
degrees of freedom =
61
Ha: mean < 6
Ha: mean != 6
Ha: mean > 6
Pr(T < t) = 0.0000
Pr(|T| > |t|) = 0.0000
Pr(T > t) = 1.0000
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (26/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Konfidenzintervalle
Hypothesentests
.1
Density
.15
.2
.25
LRS Umfrage
0
.05
. summ lrsselbstselbst ,det
lrsselbst [se
0
2
4
lrsselbst [selbst]
Statistik II
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
6
8
1%
5%
10%
25%
50%
Percentiles
1
2
3
3
4.5
Largest
75%
6
8
90%
7
8
95%
8
8
99%
8
8
Mittelwerte, Zusammenhangsmaße, Hypothesentests
(27/30)
. ci lrsselbstselbst
Obs
Variable
Konfidenzintervalle
Hypothesentests
lrsselbsts~t
t-Test
I
I
Unterscheiden sich Gruppen bzw. sind Gruppenmittelwerte
identisch?
Frauen weniger radikal (weniger links) als Männer?
. tab geschlecht
geschlecht
Freq.
Percent
Cum.
Nicht zutreffend
maennlich
weiblich
2
39
22
3.17
61.90
34.92
3.17
65.08
100.00
Total
63
100.00
. gen frau=.
(63 missing values generated)
. replace frau=0 if geschlecht ==2
(39 real changes made)
. replace frau=1 if geschlecht ==3
(22 real changes made)
. tab frau
frau
Freq.
Percent
Cum.
0
1
39
22
63.93
36.07
63.93
100.00
Total
61
100.00
. ttest lrsselbstselbst ,by(frau)
Two-sample t test with equal variances
Group
Obs
Mean
Std. Err.
Std. Dev.
Statistik II
0
1
38
22
4.894737
4.454545
.308231
.2995471
1.900064
1.405
Smallest
1
1
2
2
[95% Conf. Interval]
Mittelwerte, Zusammenhangsmaße, Hypothesentests (28/30)
4.270201
3.831603
5.519272
5.077488
62
M
4.677
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Literatur für nächste Woche (Regression)
I
Berk (2004, S. 13-17, 39-56) und
I
Fox (1997, S. 86-88, 101, 204-205, 212-213)
I
(beides im ReaderPlus)
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (29/30)
Wiederholung: Daten & Deskriptive Statistik
Zusammenhangsmaße
Inferenzstatistik
Zusammenfassung
Zusammenfassung
I
I
Fast alle Berechnungen aus Statistik I mit ein bis zwei
Befehlen umsetzbar
Wichtig:
I
I
Verstehen was man tut
Daten kontrollieren und ggf. umkodieren
Statistik II
Mittelwerte, Zusammenhangsmaße, Hypothesentests (30/30)
Herunterladen