Institut für Politikwissenschaft

Werbung
Institut für Politikw issenschaft ,
Universität Innsbruck
Wintersemester 2007/08
Ass.Prof. Dr.Christian Traweger
Universität Innsbruck
Institut für Politikwissenschaft
[email protected]
Semesterübersicht WS 2007/07
PS Statistik für PolitikwissenschafterInnen
Ass.Prof.Dr.Christian Traweger
PS – Donnerstagtermin:
Das Proseminar findet in Blockform im ZID Ausbildungsraum 2 statt.
VB
Do. 11.10. 9.00 – 10.00 Vorbesprechung,
1. Bl. Do. 18.10. 9.00 – 12.00 Gruppeneinteilung für Projekt / Fragebogen-Thema
Grundlagen der empirischen Sozialforschung
2. Bl. Do. 25.10. 9.00 – 12.00 Statistisches Testen – Hypothesen,
Testübersicht UnterschiedsZusammenhangsverfahren
Einführung in SPSS
Fragebogenfinalisierung / Stichprobenplanung
3. Bl. 12.11. – 16.11.2007
Erhebungswoche / Interviews
4. Bl. Do. 22.11. 9.00 – 12.00 Chiquadrattest für nominale Merkmale
Nichtparametrische Tests für ordinale Merkmale
(Mann-Whitney U-Test, Kruskal Wallis Test)
Einfaktorielle Varianzanalyse für metrische Daten
5. Bl. Do. 29.11. 9.00 – 12.00
9.00 – 10.30 Tutorium
10.30 – 12.00 Dateneingabe
6. Bl. Do. 10.1. 9.00 – 12.00
Präsentation der Ergebnisse und Diskussion (AR 5)
7. Bl. Do. 17.1. 9.00-10.00
Schlussklausur
( 2 Gruppen x á 45 Min, 2 ZID-Räume AR 4 + 5)
8. Bl. Do. 24.1. 9.00-10.00
Klausurbesprechung (bei Bedarf und nach
Voranmeldung im Büro von Prof.Traweger)
Gruppengröße für Projektarbeit max. 5 Personen.
Voraussetzungen für den Erwerb des PS-Zeugnisses:Projektarbeit (max. 20 Punkte)
Schlussklausur (max. 30 Punkte)
2
PS - Freitagtermin:
Das Proseminar findet in Blockform im ZID Ausbildungsraum 4 statt.
VB
Fr. 12.10. 9.00 – 10.00
1. Bl. Fr. 19.10. 9.00 – 12.00
Vorbesprechung,
Gruppeneinteilung für Projekt / Fragebogen-Thema
Grundlagen der empirischen Sozialforschung
2. Bl. Do. 8.11. 8.00 – 11.00 Statistisches Testen – Hypothesen,
Testübersicht UnterschiedsZusammenhangsverfahren
Einführung in SPSS
Fragebogenfinalisierung / Stichprobenplanung
3. Bl. 12.11. – 16.11.2007
Erhebungswoche / Interviews
4. Bl. Fr. 23.11. 9.00 – 12.00
Chiquadrattest für nominale Merkmale
Nichtparametrische Tests für ordinale Merkmale
(Mann-Whitney U-Test, Kruskal Wallis Test)
Einfaktorielle Varianzanalyse für metrische Daten
5. Bl. Fr. 30.11. 9.00 – 12.00
9.00 – 10.30 Tutorium
10.30 – 12.00 Dateneingabe
6. Bl. Fr. 10.1. 9.00 – 12.00
Präsentation der Ergebnisse und Diskussion
7. Bl. Fr. 18.1. 9.00-10.00
Schlussklausur
( 2 Gruppen x á 45 Min, 2 ZID-Räume AR 4+5)
8. Bl. Fr. 25.1. 9.00-10.00
Klausurbesprechung (bei Bedarf und nach
Voranmeldung im Büro von Prof.Traweger)
Gruppengröße für Projektarbeit max. 5 Personen.
Voraussetzungen für den Erwerb des PS-Zeugnisses:
Projektarbeit (max. 20 Punkte)
Schlussklausur (max. 30 Punkte)
3
Grundlagen der empirischen Sozialforschung
 Problemformulierung
 Bestimmung der Erhebungsmethode
 Fragebogenerstellung
 Stichprobenplanung/-größe
 Datenerhebung
 Prüfung auf Plausibilität bzw. Interviewerkontrolle
 Prüfung auf Repräsentativität
 Datenanalyse und Auswertung
 Ergebnisbericht
 Interpretation und Umsetzung der Ergebnisse
4
PROBLEMFORMULIERUNG:
Im ersten Stadium soll festgelegt werden, was recherchiert, analysiert bzw. erhoben
werden soll (Projekterfassung). Ziel dieser Phase ist es, ein klares und
verständliches Bild dessen zu erhalten, was letztendlich abgefragt werden soll. Was
sind die Ziele?
Parteipräferenzen, Politikerimages, Sachthemen, Bürgermeisterdirektwahl, …..
BESTIMMUNG DER ERHEBUNGSMETHODE:
Welche Erhebungsmethode im einzelnen gewählt wird, richtet sich natürlich nach
dem jeweiligen Untersuchungsanliegen und hier speziell danach, ob und wie der
Informationsbedarf am ergiebigsten, ökonomischsten und/ oder schnellsten durch
eine Erhebung gedeckt werden kann. Einen wesentlichen Einflußfaktor auf die
Bestimmung der Erhebungsmethode bildet das zur Verfügung stehende Budget.
Grundsätzlich unterscheidet man 3 Arten von Interviews:
- Persönliches Interview (Vorteile: Einfache Abwicklung, hohe Erfolgsquote, unbeschränkte Thematik, kontrollierte Befragungssituation;
Nachteile: große Feldorganisation, hohe Kosten, Interviewereinfluß)
- Schriftliches Interview (Vorteile: keine Feldorganisation, geringe Kosten, räumliche Entfernungen sind unerheblich, völlige Anonymität;
Nachteile: Rücklaufquote, ungeregelte Befragungssituation, längerer Durchführungszeitraum)
- Telephoninterview (Vorteile: geringe Feldorganisation, rasche Durchführbarkeit;
Nachteile: eingeschränkter Frageumfang und Thematik)
Der Trend geht immer mehr zu Telefoninterviews. (CATI=Computer Assisted
Telephone Interviews). Dabei werden die Interviews in Telefonlabors durchgeführt,
im Rahmen der Stichprobenplanung werden die anzurufenden Personen
ausgewählt, die Telefonverbindung wird entweder manuell oder direkt vom
Computer hergestellt und der Interviewer liest den Fragebogen vom Bildschirm ab
und kodiert die Ergebnisse sofort in den Computer. Der letzte technische Stand ist
5
CI (=Computerinterviewing, dabei führt ein Sprachcomputer das Interview durch)
und Befragungen über Internet (Repräsentativität ?)
FRAGEBOGENERSTELLUNG:
Es gibt:
- offene Fragestellungen: jede Antwort ist denkbar; Gruppenbildung für
Auswertung; Vorsicht: nicht zu viele, da keine statistischen Tests durchgeführt
werden können!!
z.B.: Nehmen wir an, Sie wären in Ihrer Gemeinde in der Politik tätig, welches
Problem bzw. welche Maßnahme würden Sie sofort angehen ?
…………………………
- geschlossene Fragestellungen:
- dichotome Fragen: zwei Antworten zur Auswahl
z.B: Fühlen Sie sich über das Gemeindegeschehen ausreichend informiert?
 Ja  Nein
- Multiple choice, Alternativfragen: drei oder mehr Alternativen stehen zur
Auswahl, entweder 1 oder mehrere Antwortmöglichkeiten
z.B: Aus welchen Printmedien beziehen Sie die Informationen über die Politik im
Land
Tirol? (Nennen Sie die zwei häufigsten Informationsquellen)
 Tiroler Tageszeitung
 Standard
 Kronenzeitung
 andere Tageszeitung
 Kurier
 Sonstige Wochenzeitungen
- Likert-Skala: eine Aussage, mit der die Befragten den Grad ihrer
Zustimmung bzw. Ablehnung angeben können.
z.B: In Österreich wird derzeit eine gute Politik gemacht.
Stimme ich
Stimme ich
UnentStimme
Stimme ich
überhaupt nicht zu
nicht zu
schieden
ich zu
voll zu





- Semantisches Differential: Bipolare Skala mit adjektivischen Gegensatzpaaren.
Der Befragte sucht sich eine Stelle aus, die tendenziell oder graduell seine Meinung
anzeigt. (!! Auswertung nicht eindeutig, Verwendung mehr in Psychologischen
Bereichen!!)
6
z.B: Die Politik ist: modern ------------- altmodisch
- Beurteilungsskala: vorgegebene Beurteilungswerte
z.B: Wie beurteilen Sie die Möglichkeit, dass man bereits ab 16 Jahre wählen
kann ?
 sehr gut  gut  mittelmäßig  schlecht  sehr schlecht
Finden sich im Fragebogen sogenannte "Antwortbatterien", das heißt, viele Fragen
mit den gleichen Antwortmöglichkeiten hintereinander (z.B. Einstellungs-,
Polaritätsprofile), dann kann beim Interviewten ein Drang und "Zwang" nach
Vollständigkeit beim Beantworten entstehen, der in der Folge leicht zu
willkürlichen Angaben führt.
Skalierungen:
Im Rahmen der Fragebogenerstellung sollte man sich bereits Gedanken über die
verschiedenen Skalierungen zu machen:
- nominal (z.B.: Haarfarbe, ja/nein-Fragen, Codierung spielt keine Rolle)
- ordinal (es liegt eine Ordnung vor, z.B.: Schulnoten, Beurteilungen,...)
- metrisch bzw. quantitativ (Intervallskala, Verhältnisskala, z.B.: Gewicht,
Alter, Einkommen - nicht gruppiert)
7
STICHPROBENPLANUNG:
Eine Stichprobe ist ein Teil der Grundgesamtheit (z.B.: Tiroler Bevölkerung).
Damit die Ergebnisse der Erhebung auf die Grundgesamtheit bezogen werden
können (repräsentativ sind), muß die Stichprobe, hinsichtlich verschiedener
Merkmale, ein genaues Abbild der Grundgesamtheit sein. (verkleinert aber
wirklichkeitsgetreu)
Wie wählt man nun einen bestimmten Teil der Grundgesamtheit aus ?
Man unterscheidet :
- Systematische Verfahren:
- Quotenverfahren
- systematische Auswahl
- Zufallsstichprobe:
- Einfache Zufallsstichprobe
- geschichtete Zufallsstichprobe
- Klumpenstichprobe
Quotenauswahl: Verteilung der Merkmalsausprägungen wird gezielt erreicht
z.B. Gesamtzahl der Interviews: 10
Stadtteil:
A
5
B
3
C
2
Geschlecht: männl.
6
Weibl.
4
Alter:
18- 30J
3
31- 50 J
4
über 50J
3
Beruf:
Arbeiter/Angest.
2
Jahreseinkommen: - 15.000
Beamter/VB
1
15.001- 30.000
Selbst.
1
über 30.000
Hausf/-m
2
Pension
2
Ausbildg
1
Sonstiges(K/AL) 1
3
5
2
8
systematische Auswahl: typische Auswahl
(!!ist kein methodisch gesichertes, den Repräsentationsschluß ermöglichendes
Verfahren!!)
Man greift nach freiem Ermessen solche Elemente aus der Grundgesamtheit heraus,
die als besonders charakteristisch und typisch erachtet werden und schließt von den
erzielten Ergebnissen entsprechend auf die Grundgesamtheit. (Welche Elemente
sind typisch?; in welchem Umfang kann verallgemeinert werden???)
Einfache Zufallsstichprobe:
(Urnenmodell) Die Elemente, die in das
Stichprobensample eingehen, werden unmittelbar aus der Grundgesamtheit
gezogen. Voraussetzung: Vollständigkeit der Grundgesamtheit, gleiche
Auswahlchance.
- Systematische Zufallsauswahl: Startpunkt t, s = N/ n
- Schlussziffernverfahren: aus durchnummerierten Datei werden jene Elemente
mit best. Schlußziffer genommen
- Buchstabenauswahl: Stichprobe = all jene Elemente, deren Nachname best.
Anfangsbuchstaben hat
Geschichtete
Zufallsstichprobe:
Grundgesamtheit wird in mehrere
Untergruppen (Schichten) aufgeteilt, aus denen dann jeweils die, in die
Gesamtstichprobe eingehenden Elemente, mittels eines reinen Zufallsverfahrens
ausgewählt werden.
z.B: nach Altersgruppen
Klumpenauswahl: Grundgesamtheit wird in Klumpen (Flächen) unterteilt und
dann wird rein zufällig eine bestimmte Zahl dieser Klumpen ausgewählt und mit
allen ihren Elementen in das Sample einbezogen. Nicht einzelne Elemente, sondern
ganze Gruppen bilden die Auswahleinheit – !! die Grundgesamtheit muß
vollständig vorliegen.
z.B: (Städteplanung) Planquadrate eines Stadtplans, oder Häuserblocks
( Die gezogenen Klumpen gehen entweder als Gesamtheit in die Stichprobe ein,
oder es werden aus ihnen wiederum Teilstichproben nach einfacher Zufallsauswahl
gezogen)
9
Als ein besonders verbreitetes Beispiel für ein mehrstufig geschichtetes
Auswahlverfahren wird der folgende Musterstichprobenplan (mit 3
Auswahlstufen), der von zahlreichen führenden Marktforschungsinstituten für
repräsentative Bevölkerungsumfragen entwickelt wurde, angeführt:
1) Auswahl von sample-points: Dabei erfolgt ein sogenanntes area sampling,
das heißt es werden im Rahmen einer Zufallsauswahl Gemeinden oder
Bezirke ausgewählt.
2) Auswahl von Haushalten in den gezogenen sample-points (Zufällige
Auswahl der Haushalte aus Adressenlisten oder Telefonbüchern)
3) Auswahl der Zielpersonen in den gezogenen Haushalten (z.B.: Auswahl der
Person fortlaufend nach dem Alter oder Vornamensalphabetisch)
Eine wesentliche Bedingung für die Durchführung einer Zufallsauswahl ist, daß das
„Personenmaterial“ vollständig katalogisiert sein muß:
„Jedes Element muß die gleiche Chance haben ausgewählt zu werden“.
(Beginn der Auswahl über eine Zufallszahl).
Die Größe der Stichprobe ist meist aus finanziellen Überlegungen determiniert. Ein
wesentlicher Indikator zur Bestimmung der Größe der Stichprobe ist jedoch der
Stichprobenfehler: Das heißt, wie exakt sind die Ergebnisse bzw. wie exakt sollen
die Ergebnisse sein ? (Nicht zu verwechseln mit der Repräsentativität !!!)
(Totalerhebung) Vollerhebung vs. Teilerhebung
Stichprobenfehler: da man noch keine Ergebnisse vorliegen hat, geht man von
einem Antwortverhalten 50:50 aus. („ungünstigster Fall“)
Stichprobenfehler e =
1,96 2  p  (1  p)
n
p = Anteile in %
z.B: Umfrage in Innsbruck; N=300 Wie groß ist Stichprobenfehler? +/-......%
10
Beträgt der Stichprobenumfang mehr als 5% der Grundgesamtheit, so wird die
Schwankungsbreite mit Hilfe der Endlichkeitskorrektur (EK) berechnet
StichprobenfehlerEK =
1,96 2  p  (1  p)  ( N  n)
n  ( N  1)
p = Anteile in %, N =
Grundgesamtheit
Stichprobenumfang:
Der Marktforscher weiß von den Umständen der jeweiligen Aufgabenstellung her
und in Abstimmung mit dem jeweiligen Auftraggeber.......
- wie genau das Stichprobenergebnis sein muß (Intervall)
- mit welcher Sicherheit diese Aussage getroffen werden soll (95% Sicherheit.)
n = 1,962
.
p  (1  p)
e2
n......Stichprobenumfang
p......Anteil der Befragten, die eine best.Antwort gaben
e......Stichprobenfehler, Schwankungsbreite
z.B. Umfrage Innsbruck: Wie groß muss Stichprobe sein, bei e = +/-5,6%
11
Die anschließende Tabelle gibt Aufschluß über den Stichprobenfehler bei
unterschiedlichen Stichprobenumfängen und Anteilen: (ohne Endlichkeitskorrektur,
nur für große Grundgesamtheiten)
p........Anteil (Soviele Prozent geben eine bestimmte Antwort)
n........Stichprobenumfang
Stichprobenfehler in %
Anteile in %
10 / 90 15 / 85 20 / 80 25 / 75 30 / 70 35 / 65 40 / 60 45 / 55 50/50
=0,1
=0,15
=0,2
=0,25
=0,3
=0,35
=0,4
=0,45
=0,5
n=
100
200
300
400
500
600
700
800
900
1000
1500
2000
2500
3000
5,88%
4,16%
3,39%
2,94%
2,63%
2,40%
2,22%
2,08%
1,96%
1,86%
1,52%
1,31%
1,18%
1,07%
7,00%
4,95%
4,04%
3,50%
3,13%
2,86%
2,65%
2,47%
2,33%
2,21%
1,81%
1,56%
1,40%
1,28%
Stichprobenfehler =
7,84%
5,54%
4,53%
3,92%
3,51%
3,20%
2,96%
2,77%
2,61%
2,48%
2,02%
1,75%
1,57%
1,43%
8,49%
6,00%
4,90%
4,24%
3,80%
3,46%
3,21%
3,00%
2,83%
2,68%
2,19%
1,90%
1,70%
1,55%
8,98%
6,35%
5,19%
4,49%
4,02%
3,67%
3,39%
3,18%
2,99%
2,84%
2,32%
2,01%
1,80%
1,64%
1,96 2  p  (1  p)
n
9,35%
6,61%
5,40%
4,67%
4,18%
3,82%
3,53%
3,31%
3,12%
2,96%
2,41%
2,09%
1,87%
1,71%
9,60%
6,79%
5,54%
4,80%
4,29%
3,92%
3,63%
3,39%
3,20%
3,04%
2,48%
2,15%
1,92%
1,75%
9,75%
6,89%
5,63%
4,88%
4,36%
3,98%
3,69%
3,45%
3,25%
3,08%
2,52%
2,18%
1,95%
1,78%
9,80%
6,93%
5,66%
4,90%
4,38%
4,00%
3,70%
3,46%
3,27%
3,10%
2,53%
2,19%
1,96%
1,79%
p = Anteile in %
Beispiel:
Bei einer Umfrage unter 500 Innsbruckern geben rund 25% an, daß sie ÖVP
wählen. Man kann nun behaupten, daß der tatsächliche Anteil jener Personen, die
ÖVP wählen, mit einer Wahrscheinlichkeit von 95%, zwischen 21,2% und 28,8%
liegt (=+- 3,8%).
Beträgt der Stichprobenumfang mehr als 5% der Grundgesamtheit, so wird die
Schwankungsbreite mit Hilfe der Endlichkeitskorrektur (EK) berechnet
StichprobenfehlerEK =
1,96 2  p  (1  p)  ( N  n)
n  ( N  1)
p = Anteile in %, N =
Grundgesamtheit
12
DATENERHEBUNG:
In dieser Phase werden nun die Interviews
- persönlich
- telefonisch
durch geschulte Interviewer
- oder postalisch durchgeführt.
Dieser Abschnitt wird auch als Feldarbeit bezeichnet.
Werden mehrer Auftraggeber in einer Umfrage mit verschiedenen Themen
zusammengefasst, so spricht man von ein OMNIBUSUMFRAGE.
PRÜFUNG AUF PLAUSIBILITÄT bzw. INTERVIEWERKONTROLLEN:
Dies ist sowohl eine visuelle wie auch computergestützte Kontrolle der erhobenen
Interviews. Dabei handelt es sich einerseits um einen Vergleich von eingebauten
Kontrollfragen (z.B.: Haushaltstyp, Haushaltsgröße, Familienstand, Kinder,...) bis
hin zur direkten Kontaktaufnahme der interviewten Person und Befragung zur
Interviewdurchführung und zum Verhalten des Interviewers.
In modernen Interviewcallcenters wird diese Überprüfung unter anderem auf die
entsprechende Telefonsoftware ausgeweitet, wo alle Interviews (=Gespräche)
hinsichtlich ihrer Dauer und Rufnummer genau aufgezeichnet werden.
(Nur zur internen Kontrolle, DATENSCHUTZ!!)
PRÜFUNG AUF REPRÄSENTATIVITÄT:
Ziel einer repräsentativen Umfrage ist es, ein möglichst exaktes Abbild der zu
befragenden Bevölkerung zu erhalten: (z.B.: bei politischen Umfragen  ein
Abbild der wahlberechtigten Bevölkerung). Anders ausgedrückt: die Untersuchung
soll Aufschlüsse über die Grundgesamtheit bringen und um dies zu erreichen muß
aus dem Ergebnis der Teilerhebung möglichst sicher und exakt auf die Verhältnisse
der Gesamtmasse geschlossen werden können. Die Grundgesamtheit soll sich also
in Bezug auf verschiedene Merkmale in der Stichprobe wiederfinden.
In der Regel wird die Repräsentativität in Bezug auf die Merkmale
Geschlecht, Alter und Bildung
überprüft.
13
DATENANALYSE UND AUSWERTUNG:
Bei der Datenanalyse ist auf das vorliegende Skalenniveau zu achten;
dementsprechend werden Modus, Median oder Mittelwert zur Interpretation
verwendet. Bei den durchzuführenden Testverfahren ist ebenfalls auf diese
Unterscheidung zu achten.
Welche Maßzahlen und Graphiken sinnvoll sind richtet sich nach dem Variablentyp
bzw. dem Skalenniveau:
Variablentyp
Nominal
Ordinal
Metrisch
Maßzahlen
Häufigkeitstabelle, Modus
Häufigkeitstabelle,
Modus, Median, Quantile
Min., Max., Median,
Mittelwert, Std.Dev., Std. Err.;
Graphische Darstellung
Balken-/Kreisdiagramm
Balkendiagramm
Kreisdiagramm
Boxplots
Histogramm,....
Hinsichtlich graphischer Aufbereitung von Daten sind dem Marktforscher nahezu keine Grenzen
gesetzt; obenstehende Tabelle erhebt keinen Anspruch auf Vollständigkeit sondern dient lediglich
als ein möglicher Leitfaden.
So wie an dieser Stelle im Rahmen der deskriptiven Statistik die einzelnen
Maßzahlen nach Variablentypen unterschieden werden, so müssen bei der
bivariaten statistischen Analyse (Sommersemester) auch die unterschiedlichen
Testverfahren berücksichtigt werden.
ERGEBNISBERICHT:
Der Ergebnisbericht sollte die Auswertung (tabellarisch, graphisch und verbal)
jeder einzelnen Frage beinhalten. In weiterer Folge sollen bei jeder Fragestellung zu
interessierende Hypothesen überprüft werden.
INTERPRETATION UND UMSETZUNG DER ERGEBNISSE:
In dieser Phase sollten mit dem Auftraggeber noch die Ergebnisse der Erhebung
analysiert werden und eventuell eine schriftliche Kurzfassung der wesentlichen
Ergebnisse erfolgen. Bei der Hilfe zur Umsetzung empfiehlt sich eine interdisziplinäre Zusammenarbeit mit entsprechenden Fachleuten.
14
Deskriptive Statistik:
Häufigkeitsverteilungen:
Beispiel: Beurteilung der derzeitigen politischen Situation in Österreich
(mit Schulnoten; n=24)
Note:
xi (absolute
hi (relative Häufigkeit)
Häufigkeit)
Hi (kumulierte
Häufigkeit)
1
2
8,3
8,3
2
4
16,7
25,0
3
9
37,5
62,5
4
6
25,0
87,5
5
3
12,5
100,0
Summe
24
100,0
Berechnung der relativen Häufigkeit:
Berechnung von h2 = (x2/N)*100 = 16,7 %
Berechnung der kumulierten Häufigkeiten:
Berechnung von %H3 = h1 + h2 + h3 = 8,3 + 16,7 + 37,5 = 62,5 %
Die Verteilungskurve ergibt sich aus:
Ausgangshistogramm
Kurvenpolygon in Histogramm eintragen
Glätten des Kurvenpolygons ergibt eine Dichtekurve
15
Statistische Maßzahlen:
Maßzahlen sind Kenngrößen einer Verteilung, mit denen sich deren
charakteristische Eigenschaften in komprimierter Form darstellen lassen.
A) Maßzahlen der Lage
Modus: xModus  hi max
Definition: Der Modus ist der häufigste Wert der absoluten (Mess)-werte
Arithmetisches Mittel :
x
1 N
*  xi
N i 1
Def: Der Mittelwert (Mean; arithm. Mittel) ist die Summe aller Messwerte, geteilt
durch ihre Anzahl.
Exkurs : arithmetisches Mittel bei vorgegebenen Klassenbreiten:
x
1 k
*  xi * xmi
N i 1
Bsp:
Klasse
1
2
3
4
x
IQ-Intervall
80 – 100
101 – 121
122 – 142
143 – 163
Klassenmitte xmi
90
111
132
153
xi
4
9
9
3
Σ= 25
xi xmi
360
999
1188
459
Σ= 3006
1 k
*  xi * xmi = 1/25 * 3006 = 120,24
N i 1
Median :
n ist ungerade: z  x( n 1) / 2
n ist gerade: z 
xn / 2  x( n / 2)1
2
Def: Der Median (auch als Zentralwert bezeichnet) ist derjenige Punkt der
Messwertskala, unterhalb und oberhalb dessen jeweils die Hälfte der Messwerte
liegen.
16
Quantile:
In der Praxis werden meist spezielle Quantile verwendet:
Quartile: Einteilung in vier Abschnitte zu je 25%
Dezile: Einteilung in 10 Abschnitte zu je 10%
Perzentile: Einteilung in 100 Abschnitte zu je 1%
Die besonders häufig verwendeten Quartile sind:
Q1 : 1.Quartil = x 0,25
Q2 : 2.Quartil = x 0,5 = z (Zentralwert) =Median
Q3 : 3.Quartil = x 0,75
Mit Hilfe der Werte min, Q1, z, Q3, max. lässt sich ein Box-Plot-Diagramm
zeichnen, das einen guten Einblick über die Verteilung der Daten gibt.
Schiefe und Wölbung:
Die Schiefe gibt Auskunft darüber inwiefern eine vorliegende metrische Verteilung
rechtsschief, symmetrisch oder linksschief ist.
gm= 0  symmetrisch
gm > 0  linkssteil (rechtsschief)
gm < 0  rechtssteil (linksschief)
Die Wölbung erklärt, ob eine Verteilung sehr steil oder eher flach ist.
γ = 0  Normalverteilung
γ > 0  spitze Verteilung
γ < 0  flache Verteilung
17
B) Maßzahlen der Streuung (nur sinnvoll bei metrischen Merkmalen)
Interquartilsabstand: Ist die Differenz zwischen oberem und unterem Quartil
IQR = x 0,75 – x 0,25
Empirische Varianz: s2 =
1 k
*  ( xi  x ) 2
N i 1
k

1
* ( xi  x ) 2
N  1 i 1
Varianz der Stichprobe: s2 =
Def: Varianz s2 von N- Messwerten xi ist definiert als die Summe der quadrierten
Differenzen (xi - x ) dividiert durch ihre Anzahl.
Standardabweichung: s = s 2
Def: Die Standardabweichung s ist definiert als Quadratwurzel aus der Varianz.
Normalverteilung: Messwertverteilung unter der Glockenkurve
x ±s
= ca. 68% der Meßwerte
x ±2s
= ca. 95% der Meßwerte
x ±3s
= ca. 99,7% der Meßwerte
Standardfehler des Mittelwertes:
sx =
s
N
Mit einer Wahrscheinlichkeit von 95% liegt der wahre Mittelwert in einem Intervall
von x ± 2 s x .
Variationskoeffizient: VK =
s  100
%
x
Def: Der Variationskoeffizient ist ein Maß, inwieweit die Verteilung homogen ist.
Bei einem Variationskoeffizient von über 50% ist die Verteilung so inhomogen,
dass man den Mittelwert als Maßzahl besser nicht verwendet.
18
Grafische Darstellungen von Verteilungen
 Boxplot (Kasten-Diagramm)
1600,00
ek
1400,00
1200,00
1000,00
Die Fünf-Punkte Zusammenfassung einer metrischen Verteilung
führt zur komprimierten Visualisierung einer Verteilung durch
den Box-Plot. Es lässt sich schnell ein Eindruck darüber
gewinnen, ob die Beobachtungen z.B. annähernd symmetrisch
sind, oder ob Ausreißer in dem Datensatz auftreten.
Der Box-Plot besteht aus:
- x0,25 = Anfang der Schachtel ("box")
- x0,75 = Ende der Schachtel
- Der Median wird durch einen Punkt oder eine Linie in der Box
markiert
- Zwei Linien "whiskers" außerhalb der Box gehen bis zu xmin
und xmax,
19
Der modifizierte Box-Plot berücksichtigt etwaige Ausreißer, die
unterhalb bzw. überhalb der bestimmter Grenzen liegen, quasi
außerhalb der Zäune (zu und zo) sich befinden.
Zur
Berechnung
Interquartilsabstand:
der
Zäune
benötigt
man
den
(dQ = x0,75 - x0,25 )
Die oberen und unteren Grenzen für Ausreißer errechnen sich
aus:
zu = x0,25 – 1,5* dQ
zo = x0,75 + 1,5* dQ
Auf diese Weise werden die sogenannten Ausreißer, außerhalb
der Zäune im Box-Plot markiert.
20
weitere grafische Darstellungsmöglichkeiten:
Ballbesuch Ballsaison 02/03
4,2
ja
nein
vielleicht
32,8
63,0
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
Ballbesuch Ballsaison 02/03
vielleicht
4,2%
ja
32,8%
nein
63,0%
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
Ballbesuch Ballsaison 02/03
vielleicht
4,2%
ja
32,8%
nein
63,0%
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
21
Ballbesuch Ballsaison 02/03
Vielleicht
4,2%
Ja
32,8%
Nein
63,0%
22
Statistisches Testen:
Mit Hilfe statistischer Tests überprüft u.a. ob zwischen Gruppen
wie z.B. Männer und Frauen im Antwortverhalten auf eine zu
untersuchende Fragestellung hin statistisch signifikante Unterschiede bestehen, oder ob zwischen zwei Variablen (Fragestellungen) Zusammenhänge existieren.
Folgende Tabelle zeigt eine Auswahl statistischer Tests zur
Überprüfung von Unterschieden zwischen Gruppen und zur
Überprüfung von Zusammenhängen zwischen Variablen bzw.
Fragestellungen:
Skalierung Unterschiedsverfahren
Zusammenhangsverfahren
Nominal
Chiquadrattest
Kontingenzkoeffizient
Ordinal
N=2 Stichproben: Mann Whitney UTest
Rangkorrelationskoeffizient
nach Spearman
n>2 Stichproben: Kruskal-Wallis Test
Metrisch
Varianzanalyse;
Voraussetzungen zur Durchführung:
Normalverteilung
Varianzhomogenität
Korrelationskoeffizient nach
Pearson
23
Hypothesenformulierung:
Im Rahmen der bivariaten Analyse stellt sich die Frage durch
welche demographischen Merkmale die Antworten besonders
beeinflußt werden. Unterscheiden sich z.B.: Männer und Frauen
im Hinblick auf ihren Wunschurlaub.
Dabei interessiert man sich nicht nur für die Unterschiede in
der Stichprobe, sondern man will prüfen, ob die in der
Stichprobe festgestellten Unterschiede auch für die
Grundgesamtheit Gültigkeit haben. Man kann also über die
Grundgesamtheit
nur
Vermutungen
anstellen.
Dieses
Vermutungen bezeichnet man als Hypothesen.
Es gibt zwei Arten von Hypothesen:
- Nullhypothese: H0
- Alternativhypothese: H1
Im Rahmen der Nullhypothese vermutet man, daß z.B. zwischen
Männern und Frauen kein (=Null) Meinungsunterschied besteht
und als Alternativhypothese nimmt man an, daß dieser
Unterschied gegeben ist. Die Ergebnisse der Stichprobe der
Befragten dienen dazu, sich für eine der beiden Hypothesen zu
entscheiden. Bei der Entscheidung für die Alternativhypothese
möchte man möglichst sicher sein; d.h. man möchte sich bei der
Entscheidung für die Alternativhypothese "möglichst wenig
irren". Diese Wahrscheinlichkeit, dass man sich irrt und die
24
Alternativhypothese gewählt hat, obwohl in der Realität
(bezogen auf die Grundgesamtheit) doch die Nullhypothese
zutrifft, bezeichnet man als Irrtumswahrscheinlichkeit. Diese
wird von den meisten Statistik-Software-Produkten exakt
berechnet.
Das gängigste Verfahren dazu sind die Signifikanztests.
Zur Überprüfung der Hyppothesen kann folgendes Schema
herangezogen werden:
In der Grundgesamtheit gilt
H0
H1
H0 richtig Entsch. Beta-Fehler
Entscheidung auf Grund
der Stichprobe zugunsten
der:
H1 Alpha-Fehler richtige Entsch.
Als Signifikanzniveau wird in der klassischen Statistik ein
=0.05 herangezogen, das heißt: beträgt das errechnete
Signifikanzniveau 0.05, dann wird die Nullhypothese
verworfen. Dieses Alpha bezeichnet man auch als
Irrtumswahrscheinlichkeit.
25
Unterschiedsverfahren:
Der Chiquadrattest:
Mit Hilfe der Chiquadrattests untersucht man, ob bei nominalen
Variablen Unterschiede zwischen Stichproben bestehen.
Der Chiquadratwert nach Pearson wird nach folgender Formel
berechnet:
n
2  
i 1
(O  E ) 2
E
O....... sind die beobachteten Häufigkeiten (=observed values)
E....... sind die erwarteten Häufigkeiten (=expected values), das
sind jene Häufigkeiten, die man sich bei völliger Unabhängigkeit zwischen den Stichproben erwartet hätte.
Die erwarteten Häufigkeiten werden nach folgender Formel
berechnet:
e
ij

ci*r j
N
c......Spaltensumme
r.......Zeilensumme
N......Gesamtstichprobe
26
Fragestellung:
Unterscheiden sich Männer von Frauen hinsichtlich Ihrer
Parteipräferenz ?
H0: Es gibt keine Unterschiede zwischen Männern und Frauen in der
Parteipräferenz
H1: Es gibt signifikante Unterschiede zwischen Männern und Frauen
hinsichtlich der Parteipräferenz.
SPSS-Output:
Geschlecht * Gemeinderatswahl Innsbruck Kreuztabelle
Geschlecht
männlich
weiblich
Gesamt
Liste für
Innsbruck
47
Freie Liste
5
(andere Liste /
Partei)
24
Gesamt
238
47
SPÖ
43
19,7%
19,7%
18,1%
21,8%
4,2%
4,2%
2,1%
10,1%
100,0%
% von GRW
Anzahl
% von Geschlecht
47,5%
52
42,7%
63
43,0%
57
47,7%
57
71,4%
4
55,6%
8
35,7%
9
42,9%
32
45,8%
282
18,4%
22,3%
20,2%
20,2%
1,4%
2,8%
3,2%
11,3%
100,0%
% von GRW
Anzahl
% von Geschlecht
52,5%
99
57,3%
110
57,0%
100
52,3%
109
28,6%
14
44,4%
18
64,3%
14
57,1%
56
54,2%
520
19,0%
21,2%
19,2%
21,0%
2,7%
3,5%
2,7%
10,8%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
Anzahl
% von Geschlecht
% von GRW
ÖVP
Gemeinderatswahl Innsbruck
Liste Soziales
Die Grünen
FPÖ
Innsbruck
52
10
10
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusam menhang
linear-m it-li near
Anzahl der gültigen Fälle
As ymptotisch
e Signi fikanz
(2-seiti g)
df
a
6,170
7
,520
6,242
7
,512
,001
1
,974
520
a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
mi nimale erwartete Häufigkeit ist 6,41.
Da das Singnifikanzniveau größer als 0,05 ist, wird die
Nullhypo-these nicht verworfen und man entscheidet sich für H0.
27
Eine Sonderform des Chiquadrattests ist die Auswertung von 2x2
Tabellen; hier wird die sogenannte Kontinuitätskorrektur
angewandt.
Fragestellung: Unterscheiden sich Männer von Frauen
hinsichtlich der allgemeinen Zufriedenheit mit der Politik in
Innsbruck?
H0: Es gibt keine Unterschiede zwischen Männern und Frauen in der
Beurteilung der Zufriedenheit mit der Stadtpolitik
H1: Es gibt signifikante Unterschiede zwischen Männern und Frauen
hinsichtlich der Beurteilung der Zufriedenheit mit der Stadtpolitik.
Allgemeine Zufriedenheit mit Politik in Innsbruck * Geschlecht Kreuztabelle
Allgemeine Zufriedenheit
mit Politik in Innsbruck
eher zufrieden
eher unzufrieden
Gesamt
Anzahl
% von Allgemeine
Zufriedenheit mit
Politik in Innsbruck
% von Ges chlecht
Anzahl
% von Allgemeine
Zufriedenheit mit
Politik in Innsbruck
% von Ges chlecht
Anzahl
% von Allgemeine
Zufriedenheit mit
Politik in Innsbruck
% von Ges chlecht
Geschlecht
männlich
weiblich
130
131
Gesamt
261
49,8%
50,2%
100,0%
54,9%
107
47,5%
145
50,9%
252
42,5%
57,5%
100,0%
45,1%
237
52,5%
276
49,1%
513
46,2%
53,8%
100,0%
100,0%
100,0%
100,0%
Chi-Quadrat-Tests
W ert
Chi-Quadrat nach
Pears on
a
Kontinuitätskorrek tur
Lik elihood-Quotient
Ex akt er Test nach Fis her
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
As ymptotisch
e S ignifikanz
(2-seit ig)
df
b
2,785
1
,095
2,497
2,788
1
1
,114
,095
Ex akt e
Signifikanz
(2-seit ig)
,111
2,780
1
Ex akt e
Signifikanz
(1-seit ig)
,057
,095
513
a. W ird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (, 0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 116,42.
Da das Singnifikanzniveau größer als 0,05 ist, wird die
Nullhypo-these nicht verworfen und man entscheidet sich für H0.
28
PARAMETERFREIE PRÜFVERFAHREN
Die folgenden beiden statistischen Testverfahren, der MannWhitney-U-Test und der Kruskal-Wallis Test dienen zum
Vergleich unabhängiger Stichproben, die entweder ordinal
skaliert oder nicht normalverteilt sind.
 Mann-Whitney U-Test:
Der U-Test von Mann und Whitney dient zum Vergleich zweier
unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable
bzw. solcher, die die Voraussetzung der Normalverteilung nicht
erfüllen. Das Prinzip dieses Tests ist die Ersetzung der
gegebenen erfassten Werte durch Rangplätze. Es handelt sich
dabei praktisch um eine ordinal skalierte Variable (wie z.B.
Beurteilung nach Schulnoten) oder um eine metrische Variable,
welche nicht normalverteilt ist; dabei werden sämtliche
auftretenden Werte durch Ränge ersetzt, die Abstände zueinander
werden dabei völlig vernachlässigt. Auf Ordinalskalenniveau
erhobene Daten lassen lediglich Rechenoperationen zu, in denen
Rangplätze (ordinale Informationen) verarbeitet werden.
Mittelwerte, Varianzen können nicht berechnet werden, weil das
Kriterium der Äquidistanz nicht gegeben ist. Stattdessen werden
Summen der Rangplätze berechnet, denen die Fälle in den
Substichproben zuzuordnen sind.
29
Die Vorgangsweise beim Mann-Whitney U-Test wird durch
folgendes Beispiel erörtert:
Untersucht wird die Fragestellung ob sich die Innsbrucker
Männer von Frauen hinsichtlich der Beurteilung einer möglichen
rot-grünen Koalition nach den Wahlen unterscheiden.
Die beiden zu überprüfenden Hypothesen sind:
H0: Zwischen Männern und Frauen besteht kein Unterschied
hinsichtlich der Beurteilung einer rot-grünen Koalition in
Innsbruck.
H1: Zwischen Männern und Frauen besteht ein signifikanter
Unterschied hinsichtlich ……….
.(Irrtumswahrscheinlichkeit max.5%)
Folgende Tabelle zeigt die zusammengefassten Ergebnisse:
Beurteilung Männlich Weiblich
ti
(ti3-ti)
Sehr gut
19
18
37
50616
Gut
78
99
177
5545056
Weniger gut
65
90
155
3723720
Schlecht
61
50
111
1367520
Gesamt
n1=223
n2=257 N=480 =10686912
Im ersten Schritt werden nun den einzelnen Werten, geordnet
nach männlich/weiblich und den Beurteilungen, Rangplätze
zugewiesen und so für die Gruppe der Männer und Frauen
Rangsummen berechnet: Es ergeben sich also insgesamt 480
Rangplätze, von der ersten Person männlich+sehr gut-Beurteilung bis zur letzten (480-sten) Person weiblich+schlechtBeurteilung.
30
Die Rangsummen werden nach Ermittlung der Rangziffern und
anschließender Gewichtung nach der jeweiligen Anzahl von
Frauen und Männern berechnet.
Beurteilung
Männlich
Weiblich
1=Sehr Gut
1+2+3+…
19 x 19=361
…+35+36=703/37=19
19 x 18=342
38+39+…
126 x 78=9828
215+216+…
292 x 65=18980
370+371+…
425 x 61=25925
…213+214=22302/177=126
126 x 99=12474
…368+369=45260/155=292
292 x 90=26280
…479+480=47175/111=425
425 x 50=21250
Rangsummen R
R1=55094
R2=60346
Mittlerer Rang
55094/223=247,06
60346/257=234,81
2=Gut
3=Weniger gut
4=Schlecht
Es gilt:
R1 + R2 = [N*(N+1)]/2
55094+60346 = (480*481)/2
In weiterer Folge wird die Testmaßzahl U bestimmt:
U1 = R1 – [n1*(n1+1)]/2
U1 = 55094-(223*224)/2 = 30118
U2 = R2 – [n2*(n2+1)]/2
U2 = 60346-(257*258)/2 = 27193
Die Prüfgröße U des U-Testes ist nun der kleinere der beiden UWerte: U = Minimum (U1, U2) = 27193
Laut Tabelle beträgt der kritische U-Wert:
U;n1;n2 = U0,05;223;257 = 18514
Da der errechnete U-Wert größer als U-tabelliert ist, wird H0
beibehalten; es folgt keine Interpretation von H1.
31
Zur Bestimmung der exakten Irrtumswahrscheinlichkeit muß
zuerst z bestimmt werden; dann kann die asymptotische
significance berechnet werden:
Zur Berechnung von z benutzt man folgende korrigierte Formel:
Warum korrigiert ? Da Messwerte auftreten, die wiederholt
vorkommen, wird in die Formel ein Korrektur-Term eingebaut:
U
z=
n1* n2
2
n1* n2
* (N 3  N 
12 * N * ( N  1)
m
 (t
3
i
 ti )
i 1
z = - 1,015
Exkurs:-------------------------------------------------------------------Tritt jeder Messwert nur einmal auf, so wird zur Berechnung
von z die folgende unkorrigierte Formel herangezogen:
n1* n2
2
n1* n2 * (n1  n2  1)
12
U
z=
------------------------------------------------------------------------------Berechnung der Irrtumswahrscheinlichkeit: sig
z
2
x
1
1
2

2
0,310
e d x  0.028307
z
sig = 0,310 = 31%
Da 0,310 > 0,05  H0 ; d.h. H0 wird angenommen !!
32
Schlussfolgerung:
Zwischen Männern und Frauen besteht kein signifikanter
Unterschied hinsichtlich der Beurteilung einer möglichen rotgrünen Koalition in Innsbruck
WÜRDE ein Unterschied bestehen, dann würde man die
mittleren Ränge interpretieren müssen:
Man betrachtet die mittleren Ränge:
Mittlerer Rang
Männer
Frauen
247,06
234,81
Der einzelne mittlere Rang sagt nichts aus und wird so auch nicht
interpretiert. Betrachtet man jedoch die Höhe des mittleren
Ranges, so kann festgestellt werden, dass der mittlere Rang bei
den Männern deutlich höher ist als jener, der Frauen.
Die ursprüngliche Codierung der Beurteilung war:
1 = sehr gut
2 = gut
3 = weniger gut
4 = schlecht
Ein höherer Wert sagt also aus, dass "schlechter beurteilt" wurde.
Bei H1 (ist in unserem Beispiel nicht der Fall !!!) hieße das,
dass Männer die rot-grüne Koalition etwas schlechter als Frauen
beurteilen.
33
Das Statistikpaket SPSS liefert folgenden Output:
Ausgangsfrage: Beurteilung der rot-grünen Koalition:
Koalition ROT-GRÜN in Innsbruck wäre ...
Gültig
Fehlend
Gesamt
sehr gut
gut
weniger gut
gar nicht gut
Gesamt
System
Häufigkeit
37
177
155
111
480
40
520
Prozent
7,1
34,0
29,8
21,3
92,3
7,7
100,0
Gültige
Prozente
7,7
36,9
32,3
23,1
100,0
Kumulierte
Prozente
7,7
44,6
76,9
100,0
Frage: Besteht in der Beurteilung ein Einfluß durch die Variable Geschlecht ?
Mann-Whitney-Test
Ränge
Koalition ROT-GRÜN
in Inns bruck wäre ...
Geschlecht
männlich
weiblich
Gesamt
N
223
257
480
Mittlerer Rang
247,06
234,81
Rangs umme
55094,00
60346,00
Statistik für Te sta
Mann-Whit ney -U
W ilcox on-W
Z
As ymptotis che
Signifik anz (2-s eitig)
Koalition
ROT-GRÜN
in Inns bruc k
wäre .. .
27193, 000
60346, 000
-1, 015
,310
a. Gruppenvariable: Geschlecht
Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische
Signifikanz und interpretiert, wenn H0 verworfen wird und man sich
für H1 entscheidet, die mittleren Ränge.
34
 Kruskal-Wallis H-Test:
Der H-Test von Kruskal und Wallis dient zum Vergleich mehr
als zweier (n>2) unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable bzw. solcher, die die Voraussetzung der
Normalverteilung nicht erfüllen. Das Prinzip dieses Tests ist die
Ersetzung der gegebenen erfassten Werte durch Rangplätze.
Es handelt sich dabei praktisch um eine ordinal skalierte Variable
(wie z.B. Beurteilung nach Schulnoten) oder um eine metrische
Variable, welche nicht normalverteilt ist; dabei werden sämtliche
auftretenden Werte durch Ränge ersetzt, die Abstände zueinander
werden dabei völlig vernachlässigt.
Auf Ordinalskalenniveau erhobene Daten lassen lediglich
Rechenoperationen zu, in denen Rangplätze (ordinale
Informationen) verarbeitet werden. Mittelwerte, Varianzen
können nicht berechnet werden, weil das Kriterium der
Äquidistanz nicht gegeben ist. Statt dessen werden Summen der
Rangplätze berechnet, denen die Fälle in den Substichproben
zuzuordnen sind.
35
Die Vorgangsweise beim Kruskal-Wallis H-Test ist bis hin zur
Berechnung der mittleren Ränge gleich jener beim M-W U-Test.
Untersucht wird die Fragestellung ob sich die 4 Altersgruppen
hinsichtlich der Beurteilung rot-grünen Koalition unterscheiden.
Die beiden zu überprüfenden Hypothesen sind:
H0: Zwischen den 4 Altersgruppen besteht kein Unterschied
hinsichtlich der Beurteilung rot-grünen Koalition
H1: Zwischen den 4 Altersgruppen besteht ein signifikanter
Unterschied hinsichtlich der Beurteilung der rot-grünen
Koalition
(Irrtumswahrscheinlichkeit max.5%)
Die Berechnung der Rangsummen und mittleren Ränge erfolgt
gleich wie beim Mann Whitney U-Test.
Die für den Kruskal-Wallis Test zu berechnende Prüfgröße H ist
chiquadrat-verteilt, mit
Df = k-1 Freiheitsgraden ,
wobei k= die Anzahl der Klassen/Gruppen (=4 Altersgruppen)
Im vorliegenden Beispiel errechnet sich durch:
DF = 4 – 1 = 3
Die angeführte Formel H bezieht sich auf die Berechnung in dem
Fall, dass jeder Messwert nur einmal auftritt;
H=
12
*
N * ( N  1)
Ti2
 3 * ( N  1)
i 1 n
i

k
Die vorliegende Problemstellung zeigt jedoch, dass bei den 4
Altersgruppen die gleichen Beurteilungen zum Teil häufiger als
36
nur einmal auftreten, daher verwendet man beim Kruskal Wallis
Test, ähnlich wie beim U-Test, eine korrigierte Formel:
H´ =
H

1
m
(t 3
i 1 i
3
 ti )
N N
H´err.= 36,276
Ein Blick auf die Chiquadrattabelle (siehe Fahrmeier) zeigt, dass
H´1-;DF = H´0,95;3 = 7,8147
Da der errechnete H-Wert größer dem H-Wert aus der Chiquadrattabelle ist, wird H0 verworfen; man entschließt sich für H1
und interpretiert die mittleren Ränge.
Über den H-Wert wird wie beim Chiquadrattest z errechnet und
daraus wiederum die exakte Irrtumswahrscheinlichkeit.
37
Das Statistikpaket SPSS liefert folgenden Output:
Kruskal-Wallis-Test
Rä nge
Koalition ROT-GRÜN
in Inns bruc k wäre . ..
Alter
bis 25 Jahre
26 bis 40 Jahre
41 bis 60 Jahre
über 60 Jahre
Gesamt
N
73
143
141
123
480
Mittlerer Rang
228,16
200,35
238,59
296,69
Statistik für Testa,b
Chi-Quadrat
df
As ymptotische Signifikanz
Koalition
ROT-GRÜN
in Inns bruck
wäre ...
36,276
3
,000
a. Kruskal-Wallis-Test
b. Gruppenvariable: Alter
Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische
Signifikanz und interpretiert, wenn H0 verworfen wird und man sich
für H1 entscheidet, die mittleren Ränge.
38
 Varianzanalyse:
Will man untersuchen inwiefern sich zwei oder mehrere
Gruppen einer nominalen oder ordinalen Variable in Bezug auf
ein metrisches Merkmal unterscheiden, so wendet man die
einfaktorielle Varianzanalyse an. Um den Einfluß mehrerer
nominaler bzw. ordinaler Variable auf eine metrische Variable
zu überprüfen, wird die mehrfaktorielle Varianzanalyse
durchgeführt.
Von Interesse ist also der Einfluß eines sogenannten Faktors auf
eine eigentlich metrische Zielgröße.
Es ist darauf hinzuweisen, dass bei Überprüfung zweier
Gruppen (z.B. Männer/Frauen) hinsichtlich eines metrischen
Merkmals (z.B. Zeit pro Tag zur Aufnahme politischen
Geschehens) häufig der t-Test Anwendung findet.
Bei mehr als 2 Gruppen (n>2) findet der F-Test seine
Anwendung, da der t-Test nur im Zweistichprobenfall zu
verwenden ist. Da der F-Test jedoch auch im Zweistichprobenfall
anwendbar ist, ist seine Verbreitung wesentlich häufiger.
Wichtige Voraussetzungen für die Durchführung der
Varianzanalyse sind: Normalverteilung (K-S Test)
Varianzhomogenität (Levene-Statistik)
NUR in Bezug auf die metrische Variable !!!
39
Die Normalverteilung, mit den Hypothesen
H0: Es liegt Normalverteilung vor
H1: Es liegt keine Normalverteilung vor,
wird in SPSS mit dem K-S Test überprüft und ergibt folgenden
Output:
Kolmogorov-Smi rnov-Anpassungste st
N
Parameter der a,b
Normalvert eilung
Ex tremste Differenzen
Mittelwert
St andardabweichung
Absolut
Positiv
Negativ
Kolmogorov-Smirnov-Z
As ymptotische Signifik anz (2-s eitig)
Zeit zur
Aufnahme
politisc her
Informatino
pro Tag
10
30,5000
8,95979
,178
,122
-,178
,562
,910
a. Die zu tes tende Verteilung ist eine Normalverteilung.
b. Aus den Daten berechnet.
Da sig=0,910 > 0,05 ist wird die H0 angenommen und man kann
behaupten, dass die Voraussetzung der Normalverteilung der
metrischen Variable vorliegt.
Die Voraussetzung der Varianzhomogenität wird im Rahmen der
Varianzanalyse (bei 2 Gruppen m/w könnte auch ein t-Test
angewendet werden) überprüft. Hier lauten die zu überprüfenden
Hypothesen:
H0: Es liegt Varianzhomogenität vor
H1: Es liegt keine Varianzhomogenität vor
40
Der entsprechende SPSS-Output ist:
Test der Homogenität der Varianzen
Zeit zur Aufnahme politis cher Informatino pro Tag
LeveneStatistik
,122
df1
df2
1
8
Signifikanz
,736
Da sig=0,736 > 0,05 ist wird die H0 angenommen und man kann
behaupten, dass die Voraussetzung der Varianzhomogenität
gegeben ist.
Liegen diese Voraussetzungen nicht vor, so wird in der Regel auf
Unterschiedsverfahren für ordinal skalierte Variable zurückgegriffen.
Die Varianzanalyse geht ihrem Prinzip nach von einer Zerlegung
der Varianzen aus. Diese Gesamtvarianz wird zerlegt in eine
Varianz innerhalb der Gruppen und eine Varianz zwischen den
Gruppen.
Welche Hypothesen werden überprüft:
H0 : 1 = 2 = ...... = n
H1 : 1 ≠ 2 ≠ ...... ≠ n
Da die Varianzanalyse ein Mittelwertvergleich ist, wird
untersucht, ob die Mittelwerte der einzelnen Gruppen in etwa
gleich, oder ob die Mittelwerte voneinander signifikant
verschieden sind.
41
Die zu berechnende F-Teststatistik(Ferrechnet)ergibt sich aus:
SQE  2
Ferr = SQR *  1 , wobei
SQR = Summe der Streuung innerhalb der Gruppen
SQR =  (n 1) * s ;
si2=Varianz innerhalb der einzelnen
I
2
i
i
i 1
Gruppen
T = Gesamtstreuung
T =  ( x  x)
N
2
i
i 1
SQE = Summe der Streuung zwischen den Gruppen
SQE =  (n *  ( x  x) ) ;
I
ni
2
i
i 1
i
j 1
d.h. rechentechnisch =
SQE
=T(Gesamtstreuung)–SQR(Streuung
Gruppen)
innerhalb
der
Zur Berechnung der Freiheitsgrade:
 1 = I – 1, wobei I ist gleich die Anzahl der Gruppen
 2 = N – I, wobei N gleich dem Stichprobenumfang
Eine andere Möglichkeit zur Berechnung der Teststatistik F ist
folgende:
W
T * 2
W
1
T
1
Fer =
r
,
wobei T = Gesamtstreuung und W die Streuung innerhalb der Gruppen ist.
42
Diese Vorgangsweise wird anhand folgendem Beispiel erörtert:
In nachstehender Tabelle sind die Daten einer Erhebung zur Zeit,
die der/die Befragte pro Tag zur Aufnahme politischer
Information angeführt:
Zeit in Minuten
1= männlich
40
Gruppenmittelwert
Berechnung
von
T
Berechnung
von SQE
36
(40-30,5)2
(36-30,5)2
(45-30,5)2
(36-30,5)2
(30-30,5)2
(36-30,5)2
(35-30,5)2
(36-30,5)2
(30-30,5)2
(36-30,5)2
(30-30,5)2
(25-30,5)2
(35-30,5)2
(25-30,5)2
(20-30,5)2
(25-30,5)2
(25-30,5)2
(25-30,5)2
(15-30,5)2
(25-30,5)2
Summe = 722,5
Summe=302,5
45
1
30
1
35
1
30
1
2=weiblich
30
25
35
2
20
2
25
2
15
2
Gesamtmittelwert
30,5
Aus den Daten ergeben sich folgende Varianzen:
s12 =42,5;
s22 =62,5;
SQR = 4 * 42,5 + 4 * 62,5 = 420
SQE = 5*(36-30,5)2+5*(25-30,5)2 = 302,4
 1 = I – 1 = 2 – 1 = 1;
 2 = N – I = 10 – 2 = 8
302,5 8
Ferr = 420 * 1 = 5,760
43
Das auf diese Weise errechnete F wird nun, wie bereits bei
anderen statistischen Tests aufgezeigt, mit dem tabellierten FWert verglichen: (Irrtumswahrscheinlichkeit 5%)
F tab 0,05; 1; 8 = 5,32
Da Ferr ≥ Ftab. wird die H0 verworfen und man kann mit großer
Wahrscheinlichkeit davon ausgehen, dass sich die Mittelwerte
der einzelnen Gruppen signifikant voneinander unterscheiden.
Zur Interpretation der signifikanten Ergebnisse werden die
Mittelwerte der einzelnen Gruppen (Gruppenmittelwerte – siehe
Tabelle) herangezogen.
Das Statistikpaket SPSS liefert folgenden Output:
ONEWAY deskriptive Statistiken
Zeit zur Aufnahme politis cher Informatino pro Tag
N
männlich
weiblich
Gesamt
5
5
10
Mittelwert
36,0000
25,0000
30,5000
Standardab
weichung
6,51920
7,90569
8,95979
Standardf
ehler
2,91548
3,53553
2,83333
95%-Konfidenzintervall für
den Mittelwert
Untergrenze Obergrenze
27,9053
44,0947
15,1838
34,8162
24,0906
36,9094
Minimum
30,00
15,00
15,00
Maximum
45,00
35,00
45,00
ONEW AY ANOVA
Zeit zur Aufnahme politischer Informatino pro Tag
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt
Quadrats
umme
302,500
420,000
722,500
df
1
8
9
Mittel der
Quadrate
302,500
52,500
F
5,762
Signifikanz
,043
Nach der Entscheidung für H0 oder H1 auf Basis der von der
Software errechneten exakten Signifikanz (größer oder kleiner
gleich 0,05), werden bei H1 die Mittelwerte interpretiert.
44
Zusammenhangsverfahren:
 Kontingenzkoeffizient: (0 bis 1)
Für nominale Merkmale wird als Zusammenhangsmaß der
Kontingenzkoeffizient (C) verwendet. Dieser Wert liegt
zwischen 0 und 1 und drückt die Stärke des Zusammenhangs aus.
Der Kontingenzkoeffizient misst nur die Stärke des
Zusammenhangs, eine Richtung der Wirkungsweise wird nicht
erfasst.
Als Basis zu Berechnung des Kontingenzkoeffizienten wird der
errechnete Chiquadratwert herangezogen:
C=
2
n2
Die beiden zu untersuchenden Hypothesen lauten:
H0 : Zwischen den beiden Variablen Bildung und
Parteipräferenz besteht kein wesentlicher Zusammenhang
H1 : Zwischen den beiden Variablen Bildung und Parteipräferenz besteht ein wesentlicher Zusammenhang
Grundlage zur Berechnung des Kontingenzkoeffizienten ist die
Berechnung des Chiquadratwertes; so ergibt sich für das
vorliegende Beispiel folgender Kontingenzkoeffizient:
45
C=
44,089
520  44,089
= 0,280
Wie auf Grund des durchgeführten Chiquadrattests ersichtlich
war (siehe untenstehenden Output) gibt es einen signifikanten
Unterschied zwischen Personen mit Pflichtschulabschluß bzw.
Lehre und Personen mit Matura bzw. höherem Schulabschluß in
Bezug auf ihre Parteipräferenz; der Zusammenhang zwischen
den beiden Variablen ist jedoch mit 0,280 als eher gering zu
bezeichnend, obwohl signifikant.
Das Statistikpaket SPSS liefert folgenden Output:
Ge me inde ratswa hl Innsbruck * Bildung Kre uztabe lle
Gemeinderatswahl
Innsbruck
Gesamt
Lis te für Innsbruck
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
ÖV P
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
SP Ö
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
Die Grünen
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
FP Ö
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
Lis te S oziales Inns bruc k Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
Freie Liste
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
(andere Lis te / Partei)
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
Anzahl
% von Gemeinderatswahl
Innsbruck
% von Bildung
Bildung
Pflicht sch.
Matura/Uni/
/Lehre/FS/ HS
FHS/A kad.
64
35
Gesamt
99
64,6%
35,4%
100,0%
19,7%
75
17,9%
35
19,0%
110
68,2%
31,8%
100,0%
23,1%
72
17,9%
28
21,2%
100
72,0%
28,0%
100,0%
22,2%
43
14,4%
66
19,2%
109
39,4%
60,6%
100,0%
13,2%
13
33,8%
1
21,0%
14
92,9%
7,1%
100,0%
4,0%
8
,5%
10
2,7%
18
44,4%
55,6%
100,0%
2,5%
13
5,1%
1
3,5%
14
92,9%
7,1%
100,0%
4,0%
37
,5%
19
2,7%
56
66,1%
33,9%
100,0%
11,4%
325
9,7%
195
10,8%
520
62,5%
37,5%
100,0%
100,0%
100,0%
100,0%
46
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
44,089
As ymptotisch
e Signifikanz
(2-seitig)
df
a
7
,000
46,105
7
,000
,090
1
,764
520
a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 5,25.
Symm etrische Maße
W ert
Nominal- bzgl.
Nominalmaß
Kontingenzkoeffiz ient
Anzahl der gültigen Fälle
Näherung
sweise
Signifikanz
,280
,000
520
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asy mpt otis che
St andardfehler verwendet.
Es kann festgestellt werden, daß zwischen der Variable Bildung
und der Variable Parteipräferenz ein signifikanter Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.000; daher
wird H0 verworfen!); der Kontingenzkoeffizient in der Höhe von
0,280 drückt die Stärke des Zusammenhangs aus.
47
 Rangkorrelationskoeffizient nach Spearman: (-1 bis +1)
Wenn man für ordinalskalierte Variable von den ursprünglichen
x- und y-Werten zu ihren Rängen übergeht, erhält man den
Korre-lationskoeffizienten nach Spearman. Dabei wird analog
zum Mann-Whitney U-Test den Werten der x Variable aber auch
den Werten der y Variable jeweils nach ihrer Ordnung ein
Rangplatz zugeordnet und man erhält nun für jede Beobachtung
sogenannte Messpaare.
Zu x1 ≤ ........ ≤xn, als bereits geordnete Werte gilt rg (xi)=i, und
zu y1 ≤ ........ ≤yn, als bereits geordnete Werte gilt rg (y i)=i;
Sowohl innerhalb der x-Werte wie auch der y-Werte können
identische Werte auftreten. Die Rangvergabe ist dann nicht
eindeutig, so werden wie bereits bei der Vorgehensweise beim
Mann-Whitney U-Test Durchschnittsränge berechnet.
Die Berechnung des Korrelationskoeffizienten nach Spearman
erfolgt über folgende allgemeine Formel:
d
rSP= 1 -  ;
6
2
i
(n 2  1) n
da jedoch häufig sogenannte Bindungen auftreten und daher eine
diesbezügliche Korrektur angewendet werden muß (nach
Bindungen korrigiert = corrected for ties), findet folgende
korrigierte Formel ihre Anwendung:
6 d
rSP corr. = 1 ;
2
i
(n 2  1)n  (T x´  T y´ )
wobei: di sind
Stichprobenumfang.
die
Rangdifferenzen
und
n
der
48
Tx´ = 12  (t
3
xi´
 t x´ )
i
; dadurch wird die Häufigkeit des Auftretens der
gleichen Bewertungen berücksichtigt.
Analog dazu wird Ty´ berechnet.
Gegeben sind zwei Variable:(Beurteilung: 1=sehr gut/2=gut/3=weniger gut)
x....Beurteilung der derzeitigen politischen Situation in Innsbruck
y....Beurteilung des Projekts Nordkettenbahn
Die beiden Hypothesen lauten:
H0: Zwischen der Beurteilung der politischen Situation und der
Beurteilung des Nordkettenbahnprojekts besteht kein Zusammenhang.
H1: Zwischen den beiden Variablen besteht ein Zusammenhang.
X
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
Berechnung der Rangziffern Rg(xi)
1+2+3+4+5+6+7+8+9+10=55/10=5,5
11+12+13+14+15=65/5=13
16+17+18+19+20+21+22+23+24+25=
= 205/10=20,5
Y
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
1
2
2
2
3
3
3
3
3
3
Rg (yi)
Rg (1) = 4
Rg(2) = 12,5
Rg(3) = 21,5
Berechnung der Rangdifferenzen (d)
5,5 – 4= 1,5
5,5 – 4= 1,5
5,5 – 4= 1,5
5,5 - 4 = 1,5
5,5 – 4= 1,5
5,5, - 4 = 1,5
5,5 - 12,5 = 7
5,5 - 12,5 = 7
5,5 - 12,5 = 7
5,5 - 12,5 = 7
13 – 12,5= 0,5
13 – 12,5= 0,5
13 – 12,5 = 0,5
13 – 21,5= 8,5
13 – 21,5 = 8,5
20,5 – 4 = 16,5
20,5 – 12,5= 8
20,5 – 12,5= 8
20,5 – 12,5= 8
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
Summe
d2
2,25
2,25
2,25
2,25
2,25
2,25
49
49
49
49
0,25
0,25
0,25
72,25
72,25
272,25
64
64
64
1
1
1
1
1
1
825
49
Tx´ = 12  (t
3
xi´
 t x´ )
i
=½*[(103-10)+(53-5)+(103-10)] = 1050
Ty´ = ½*[(73-7)+(103-10)+(83-8)] = 915
6 * 825
rSP corr. = 1 -
(25  1)25  (1050  915 )
2
=1-
4950
113635
= + 0,6369
Der Zusammenhang zwischen der Beurteilung der politischen
Situation und der Beurteilung des Nordkettenbahnprojekts ist ein
positiver Zusammenhang. Ob dieser Zusammenhang signifikant
ist oder nicht kann über die z-Transformation mit anschließender
Berechnung der Irrtumswahrscheinlichkeit (=Signifikanzniveau)
geklärt werden:
z=ż*
n3 ,
wobei ż als Korrelationsziffer bezeichnet wird und wie folgt zu
berechnen ist:
ż = ½*ln( 1  r ) = ½ * ln
1  0,6369
1  0,6369
daraus folgt:
z = ż * n  3 = 0,753*
25  3
1 r
= 0,753
= 3,532
Das Signifikanzniveau errechnet sich aus:
z
2
x
1
1
2

e
2
d x  0.001229270561
z
50
Da das Signifikanzniveau ≤0,05, nämlich exakt 0,00123 ist, kann
die H0 verworfen werden und man kann behaupten, dass der Zusammenhang zwischen der Beurteilung der allgemeinen
politischen Situation und der Beurteilung des Nordkettenbahnprojekts statistisch signifikant ist. Die Stärke des Zusammenhang
ist +0,637. Das heißt: je besser die politische Situation beurteilt
werden, desto besser wird auch das Nordkettenbahnprojekt
beurteilt.
Das Statistikpaket SPSS liefert folgenden Output:
Korre lationen
Spearman-Rho
Beurteilung der
derzeitigen politisc hen
Situation
Beurteilung des
Nordkettenbahnprojek ts
Beurteilung der
derzeitigen
Beurteilung des
politisc hen Situation Nordkettenbahnprojek ts
Korrelationskoeffiz ient
1,000
,637**
Sig. (2-seitig)
.
,001
N
25
25
Korrelationskoeffiz ient
,637**
1,000
Sig. (2-seitig)
,001
.
N
25
25
**. Die Korrelation ist auf dem 0,01 Niveau signifik ant (zweiseitig).
Es kann festgestellt werden, daß zwischen der Variable
Beurteilung der allgemeinen politischen Situation und der
Beurteilung
des
Nordkettenbahnprojekts
ein
signifikanter
Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.001;
daher wird H0 verworfen!); der Korrelationskoeffizient in der
Höhe von +0,637 drückt die Stärke des Zusammenhangs aus.
51
 Korrelationskoeffizient nach Pearson (-1 bis +1)
Der Bravais-Pearson´sche Korrelationskoeffizient ist prinzipiell
nur für metrische Variable geeignet; diese sollten zudem normalverteilt sein. Ist diese Voraussetzung nicht gegeben so ist der
Korrelationskoeffizient nach Spearman anzuwenden.
Zur Berechnung des Korrelationskoeffizienten nach Pearson
werden jeweils zwei metrische Variable einer Person erfasst und
als sogenannte Wertepaare dargestellt. Zu jedem x1 ,......., xn,
gibt es ein entsprechendes y1 ,.....,.yn;
Der Zusammenhang zwischen den beiden metrischen Variablen
kann, wie bereits beim Korrelationskoeffizient nach Spearman
poisitiv (~+1), negativ (~ -1) bzw. annähernd Null sein.
Im vorliegenden Beispiel wird der Zusammenhang bzw. die
Stärke des Zusammenhangs zwischen dem Einkommen (x) und
den Spenden für soziale Zwecke (y) berechnet.
Die beiden Hypothesen lauten:
H0: Zwischen dem Einkommen und den Spenden für soziale Zwecke
besteht kein Zusammenhang.
H1: Zwischen den beiden Variablen besteht ein Zusammenhang.
Die Berechnung des Korrelationskoeffizienten nach Pearson
erfolgt nach:
n
rP =
 [( x
i
 x ) * ( y i  y )]
i 1
n
 (x
i 1
n
i
 x) 2 *
(y
i
 y) 2
i 1
52
( xi  x ) 2
EINKOMMEN (x)
SPENDEN (y) [( xi  x ) * ( y i  y )]
1000,00
75,00
7540,00
67600,00
1050,00
80,00
5040,00
44100,00
1100,00
85,00
3040,00
25600,00
1200,00
90,00
840,00
3600,00
1250,00
100,00
40,00
100,00
1250,00
110,00
-60,00
100,00
1250,00
110,00
-60,00
100,00
1500,00
130,00
6240,00
57600,00
1400,00
120,00
2240,00
19600,00
1600,00
140,00
12240,00
115600,0
Mittelwert(x)=1260 Mittelwert(y)=104 Summe=37100 Su=334000
rP =
37100
334000 * 4290
( yi  y) 2
841,00
576,00
361,00
196,00
16,00
36,00
36,00
676,00
256,00
1296,00
Su=4290
= +0,98
Der Zusammenhang zwischen dem Einkommen und den
Ausgaben für Spenden ist stark positiv und beträgt +0,98. Das
heißt: je mehr jemand verdient, desto mehr ist er auch bereit für
Geschenke auszugeben.
Das Statistikpaket SPSS liefert folgenden Output:
Korrelationen
Einkommen
Spenden
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
Einkommen
1
Spenden
,980**
,000
10
10
,980**
1
,000
10
10
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig)
signifikant.
Es kann festgestellt werden, daß zwischen der Variable Einkommen und den
Spenden
für
soziale
Zwecke
ein
signifikanter
Zusammenhang
besteht
(Näherungsweise Signifikanz: sig=0.000; daher wird H 0 verworfen!); der
Korrelationskoeffizient in der Höhe von +0,98 drückt die Stärke des
Zusammenhangs aus.
53
EXKURS:
Beispiel einer Wählerstromanalyse Landtagswahl 2003
Im Rahmen der nachfolgenden Berechnungen beschäftigt man sich primär mit der
Frage, welche Partei verlor Wähler wohin bzw. welche Partei gewann von welcher
dazu und in welchem Umfang. Dies wird allgemein als Wählerstromanalyse
bezeichnet. Es werden also qualitativ die Wählerbewegungen zwischen den
einzelnen Parteien analysiert.
Grundsätzlich stehen dem Wahlforscher zur Berechnung von Wählerstrommodellen
zwei Analysemethoden unterschiedlichen Ansatzes zur Verfügung:
 Multiple Regressionsanalyse
 Wahltagsbefragungen/Exit Polls
Im Rahmen der Multiplen Regressionsanalyse werden die Wahlresultate der
vorhergehenden Wahl sowie der aktuellen Wahl auf Gemeindeebene als
Ausgangspunkt zur Berechnung herangezogen. Die Gruppe der Nichtwähler pro
Gemeinde wird defacto als eine eigene Partei angesehen und in der Analyse auch so
behandelt. Da im allgemeinen die Gesamtzahl aller Gemeinden als zu inhomogen
zu bezeichnen ist, werden in einem ersten Schritt einzelne Gemeindetypen oder
Größenklassen definiert. Es können auch Gemeindetypen je nach Stärke der
einzelnen Parteien konstruiert werden. Für all diese Typen werden jeweils multiple
Regressionsmodelle berechnet, deren Ergebnisse für das gesamte Bundesland
anschließend aufsummiert werden. Ein Problem, das sich bei der Anwendung der
multiplen Regression ergeben kann ist, dass – die Berechnung erfolgt indem die
Konstante im Modell unterdrückt wird – negative Regressionskoeffizienten oder
Koeffizienten größer als 1 aufscheinen können. Um diesem Problem so weit als
möglich zu entgegnen, werden wie bereits angeführt möglichst homogene
Gemeindentypen vordefiniert. Sollten trotzdem Koeffizienten größer 1 oder
negative Koeffizienten als Ergebnis berechnet werden, so kann man sich zumindest
ein wenig damit helfen, dass man die Konfidenzintervalle der einzelnen
Regressionskoeffizienten berücksichtigt. Trotz all der technisch-mathematischen
Möglichkeiten muß das Ergebnis ständig einer Plausibilitätskontrolle unterzogen
und wenn notwendig durch den Wahlforscher – basierend auf seinem politischen
54
Verstand und Sachwissen – korrigiert werden. Trotz der Berücksichtigung aller
Modelleinflußgrößen sind die Zahlen, welche die Wählerströme darstellen keine
exakten Werte sondern nur Schätzwerte, die in den Bereich „am
wahrscheinlichsten“ zu deuten sind.
Ausgangsbasis sind also die einzelnen absoluten Gemeindeergebnisse unter der
Rahmenbedingung das es letztendlich die Ergebnisse der Landtagswahl 1999 und
der Landtagswahl 2003 abzubilden gilt:
Tabelle: Wählerströme LTW99 zu LTW03, in Tausend
In Tausend
ÖVP03
SPÖ03
FPÖ03 Grüne03 Sonst03 Nichtw03 Ergebnis99
ÖVP99
125
6
3
1
0
31
166
SPÖ99
1
61
1
4
0
9
76
FPÖ99
8
5
18
1
0
36
68
Grüne99
1
1
0
25
0
1
28
Sonst99
5
0*)
1
4
1
1
12
Nichtw99
3
2
0
8
1
110
124
Ergebnis03
143
75
23
43
2
188
*) Ein Null-Fluß bedeutet nicht, dass tatsächlich niemand, wie hier von den
Sonstigen Parteien 1999 zur SPÖ 2003, gewandert ist, sondern eher, dass der
tatsächliche Wählerstrom äußerst gering, am wahrscheinlichsten weniger als 1000
gewesen ist.
Die interessantesten numerischen Ergebnisse dieser Wahl sind:
 Die zahlreichen Stimmerverluste der ÖVP und der FPÖ in das Lager der
Nichtwähler (auch wegen der enorm geringen Wahlbeteiligung)
 Der nicht unbeträchtliche Anteil jener, die von FPÖ zu ÖVP gewandert sind
(nahezu 10.000 Wähler)
 Die hohe Halterate der Grünen (ca.25.000 Grün-Wähler aus dem Jahre 1999
haben auch jetzt wieder Grün gewählt)
 Die nahezu gleich hohen Zugewinne der SPÖ von ÖVP und FPÖ
55
Um die einzelnen Parameter zur Analyse der jeweiligen Wählerwanderungen
berechnen zu können muß z.B. für die ÖVP in Tirol folgende Frage beantwortet:
 In welchem Ausmaß wird das Ergebnis für die ÖVP-LTW03 durch die
Stimmen für die ÖVP99, SPÖ99, FPÖ99, Grüne99, Sonstige99 und
Nichtwähler99 erklärt und wie lauten die einzelnen Regressionskoeffizienten
zur Berechnung der Wählerstimmen-verschiebungen.
Vereinfacht dargestellt basiert der Wählerstrom zur ÖVP bei der Landtagswahl
2003 auf folgenden multiplen Regressionsmodell:
Koeffi zientena,b
Ni cht s tandardisierte K oeffizienten
Model l
1
VP 99
SP Ö99
Grüne99
FP Ö99
Sonst99
NW 99
B
,765
9,123E -03
3,021E -02
,121
,421
2,698E -02
St andardfehler
,014
,030
,152
,041
,348
,029
95%-K onfi denz intervall für B
Untergrenz e
,719
-,132
-,037
,028
,276
-,041
Obergrenz e
,846
,021
,047
,190
1,145
,054
a. Abhängige Variabl e: V P03
b. Lineare Regres sion durch den Ursprung
Basierend
auf
obenstehendes
Regressionsmodel
werden
Wählerwanderungen durch folgende Regressionsgleichung erklärt:
nun
die
ÖVP03 = 0,76*VP99+0,01*SP99+0,12*FP99+0,03*Grüne99+0,42*Sonst99+0,027*NW99
Das sind 0,12*68000=ca.8.000 Stimmen von FP99 zu VP03
Das ergibt rund jene 125.000 Stimmen (siehe auch Tabelle xx), welche die ÖVPWähler der LTW99 auch bei der LTW03 der ÖVP gaben. Die Summer aller
Quotienten führt zu:
ÖVP03 = ca. 143.000 Stimmen für die ÖVP bei der Landtagswahl 2003
Werden nun die Regressionskoeffizienten jeweils mit den Stimmanteilen der
Parteien von der Landtagswahl 1999 multipliziert so erhält man für die ÖVP zuerst
die sogenannte Halterate, d.h. sie konnte aus dem Jahre 1999 124000 Wähler
halten, sowie die Zugewinne von den anderen Parteien von 1999.
56
Gleiches Verfahren wird anschließend für alle weiteren Parteien und die fiktive
„Nichtwählerpartei“ angewendet. Analog zur ÖVP03 werden über die
Regressionskoeffizienten und die Anteile aus dem Jahr 1999 die
Wählerwanderungen analysiert. Diese Vorgansweise führt zu den Wählerströmen,
den Verschiebungen von den Stimmen aus dem Jahr 1999 zur Landtagswahl 2003,
wie in obiger Tabelle dargestellt.
Prozentuell ergeben sich daher folgende Wählerwanderungen für die einzelnen
Parteien der Landtagswahl 1999:
Tabelle: Wählerwanderungen von der LTW99 zur LTW03, in Prozent
VP03
SP03
FP03
Grün03
Sonst03 NW03
Gesamt
ÖVP99
75
4
2
1
0
19
100%
SPÖ99
.
.
.
.
.
.
.
FPÖ99
.
.
.
.
.
.
.
Grüne99
.
.
.
.
.
.
.
Sonst99
.
.
.
.
.
.
.
NW99
.
.
.
.
.
.
Zur Interpretation: Von den Wählern, die bei der Landtagswahl 1999 die ÖVP
wählten, haben 75% auch bei der Landtagswahl 2003 die ÖVP gewählt, 4% die
SPÖ, 2% die FPÖ, 1% die Grünen und fast 20% sind in das Lager der Nichtwähler
abgewandert.
Analog dazu werden die prozentuellen Ergebnisse für die anderen Parteien
interpretiert.
57
Der zweite, wenngleich etwas eingeschränktere Ansatz basiert auf einer
Wahltagsbefragung bzw. Exit Poll. Im Rahmen dieser Erhebung werden die Wähler
am Wahltag beim Verlassen der Wahllokale, oder in etwas modifizierter Form
telephonisch – CATI gestützt – nach ihrem Abstimmungsverhalten von „heute“ und
jenem bei der letzten Landtagswahl befragt. Nicht erfasst werden bei dieser Form
der Wählerstromanalysen die derzeitigen Nichtwähler.
 Die ÖVP-Wähler der Landtagswahl 2003 in Tirol setzen sich wie folgt
zusammen:
o ÖVP-Wähler LTW99 87%
o SPÖ-Wähler LTW99
1%
o FPÖ-Wähler LTW99
6%
o Grün-Wähler LTW99
1%
o Sonstige-Wähler LTW99 3%
o Nichtwähler LTW99
2%
Das heißt, dass von den Wählern der ÖVP bei dieser Landtagswahl 2003 auch
87% bei der letzten Landtagswahl 1999 auch die ÖVP gewählt haben. Dies kann
auch als Indiz dafür gewertet werden, dass die ÖVP kaum „Neues“ mobilisiert und
nicht in der Lage ist anderen Parteien Wähler abzuwerben.
 Die SPÖ-Wähler der Landtagswahl 2003 in Tirol setzen sich wie folgt
zusammen:
o SPÖ-Wähler LTW99
81%
o ÖVP-Wähler LTW99
8%
o FPÖ-Wähler LTW99
7%
o Grün-Wähler LTW99
1%
o Sonstige-Wähler LTW99 0%
o Nichtwähler LTW99
3%
Analog für die restlichen Parteien.......
58
Herunterladen