In dieser Phase werden nun die Interviews

Werbung
Institut für Statistik, Universität Innsbruck
Sommersemester 2003
Ass.Prof. Dr.Christian Traweger
Universität Innsbruck
Institut für Statistik
[email protected]
Semesterübersicht SS 2003
Termine
Donnerstage
13.3.
20.3.
27.3.
3.4.
10.4.
8.5.
15.5.
22.5.
5.6.
26.6.
Inhalt der VL
Grundlagen der emp. Sozialforschung, Grundgesamtheit,
Stichprobe, Skalierungen, Fragebogen
Häufigkeitsverteilungen, Masszahlen der Lage und der Streuung
Prinzip des Testens, Hypothesen,
Chiquadratunabhängigkeitstest, Kontingenztabellen
Nichtparametrische Tests für ordinale Merkmale (Mann-Whitney
U-Test/ Kruskal Wallis Test)
Einfaktorielle Varianzanalyse, Einfache lineare Regression (R 2)
Zwischenklausur (2 Gruppen: 8.00: A-L / 8.50:M-Z)
Kontingenzkoeffizient, Korrelationskoeffizient nach Spearman
und Pearson
Grafische Darstellung von Verteilungen, Quantile, Boxplot, /
Gauß-Test
Wahrscheinlichkeitsrechnung, Konzentrationsmaße
Schlußklausur
Die Lehrinhalte sind dem Buch: Statistik – Der Weg zur Datenanalyse, Fahrmeir,
Künstler, et al. 3.Auflage zu entnehmen.
Für die nichtparametrischen Tests (Mann-Whitney und Kruskal Wallis Test) wird
eine entsprechende Kopiervorlage im Institut für Statistik aufgelegt.
2
Grundlagen der empirischen Sozialforschung
 Problemformulierung
 Bestimmung der Erhebungsmethode
 Fragebogenerstellung
 Stichprobenplanung/-größe
 Datenerhebung
 Prüfung auf Plausibilität bzw. Interviewerkontrolle
 Prüfung auf Repräsentativität
 Datenanalyse und Auswertung
 Ergebnisbericht
 Interpretation und Umsetzung der Ergebnisse
3
PROBLEMFORMULIERUNG:
Im ersten Stadium soll festgelegt werden, was recherchiert, analysiert bzw. erhoben
werden soll (Projekterfassung). Ziel dieser Phase ist es, ein klares und verständliches
Bild dessen zu erhalten, was letztendlich abgefragt werden soll. Was sind die Ziele ?
Ist das gewünschte Instrument (Befragung,...) dazu geeignet ?
BESTIMMUNG DER ERHEBUNGSMETHODE:
Welche Erhebungsmethode im einzelnen gewählt wird, richtet sich natürlich nach
dem jeweiligen Untersuchungsanliegen und hier speziell danach, ob und wie der
Informationsbedarf am ergiebigsten, ökonomischsten und/ oder schnellsten durch
eine Erhebung gedeckt werden kann. Einen wesentlichen Einflußfaktor auf die
Bestimmung der Erhebungsmethode bildet das zur Verfügung stehende Budget.
Grundsätzlich unterscheidet man 3 Arten von Interviews:
- Persönliches Interview (Vorteile: Einfache Abwicklung, hohe Erfolgsquote, unbeschränkte Thematik, kontrollierte Befragungssituation;
Nachteile: große Feldorganisation, hohe Kosten, Interviewereinfluß)
- Schriftliches Interview (Vorteile: keine Feldorganisation, geringe Kosten, räumliche Entfernungen sind unerheblich, völlige Anonymität;
Nachteile: Rücklaufquote, ungeregelte Befragungssituation, längerer Durchführungszeitraum)
- Telephoninterview (Vorteile: geringe Feldorganisation, rasche Durchführbarkeit;
Nachteile: eingeschränkter Frageumfang und Thematik)
Der Trend geht immer mehr zu Telefoninterviews. (CATI=Computer Assisted
Telephone Interviews). Dabei werden die Interviews in Telefonlabors durchgeführt,
im Rahmen der Stichprobenplanung werden die anzurufenden Personen ausgewählt,
die Telefonverbindung wird entweder manuell oder direkt vom Computer hergestellt
und der Interviewer liest den Fragebogen vom Bildschirm ab und kodiert die
Ergebnisse sofort in den Computer. Der letzte technische Stand ist CI
4
(=Computerinterviewing, dabei führt ein Sprachcomputer das Interview durch) und
Befragungen über Internet (Repräsentativität ?)
FRAGEBOGENERSTELLUNG:
Es gibt:
- offene Fragestellungen:
jede Antwort ist denkbar; Gruppenbildung für
Auswertung; Vorsicht: nicht zu viele, da keine statistischen Tests durchgeführt
werden können!!
- geschlossene Fragestellungen:
- dichotome Fragen: zwei Antworten zur Auswahl
z.B: Waren Sie heuer auf Sommerurlaub?  Ja  Nein
- Multiple choice, Alternativfragen: drei oder mehr Alternativen stehen zur
Auswahl, entweder 1 oder mehrere Antwortmöglichkeiten
z.B: Woher beziehen Sie die Infos´s zu ihrem Urlaub? (max.2 Antwortmöglk.)
 Reiseführer/ Katalog
 durch Reisebüroangestellte
 über Bekannte/ Freunde
 andere Infos
 über´s Internet/ TV
- Likert-Skala: eine Aussage, mit der die Befragten den Grad ihrer
Zustimmung bzw. Ablehnung angeben können.
z.B: Urlaubsbuchungen über das Reisebüro bieten im allgemeinen mehr Sicherheit.
Stimme ich
Stimme ich
UnentStimme
Stimme ich
überhaupt nicht zu
nicht zu
schieden
ich zu
voll zu





- Semantisches Differential: Bipolare Skala mit adjektivischen Gegensatzpaaren.
Der Befragte sucht sich eine Stelle aus, die tendenziell oder graduell seine
Meinung anzeigt. (!! Auswertung nicht eindeutig, Verwendung mehr in
Psychologischen Bereichen!!)
z.B: Das Hotel ist: modern ------------- altmodisch
- Beurteilungsskala: vorgegebene Beurteilungswerte
z.B: Wie beurteilen Sie die Möglichkeit, dass man Urlaube bereits im Internet
buchen kann?
 sehr gut  gut  mittelmäßig  schlecht  sehr schlecht
5
Finden sich im Fragebogen sogenannte "Antwortbatterien", das heißt, viele Fragen
mit den gleichen Antwortmöglichkeiten hintereinander (z.B. Einstellungs-,
Polaritätsprofile), dann kann beim Interviewten ein Drang und "Zwang" nach
Vollständigkeit beim Beantworten entstehen, der in der Folge leicht zu willkürlichen
Angaben führt.
Skalierungen:
Im Rahmen der Fragebogenerstellung sollte man sich bereits Gedanken über die
verschiedenen Skalierungen zu machen:
- nominal (z.B.: Haarfarbe, ja/nein-Fragen, Codierung spielt keine Rolle)
- ordinal (es liegt eine Ordnung vor, z.B.: Schulnoten, Beurteilungen,...)
- metrisch bzw. quantitativ (Intervallskala, Verhältnisskala, z.B.: Gewicht,
Alter, Einkommen - nicht gruppiert)
6
STICHPROBENPLANUNG:
Eine Stichprobe ist ein Teil der Grundgesamtheit (z.B.: Tiroler Bevölkerung). Damit
die Ergebnisse der Erhebung auf die Grundgesamtheit bezogen werden können
(repräsentativ sind), muß die Stichprobe, hinsichtlich verschiedener Merkmale, ein
genaues Abbild der Grundgesamtheit sein. (verkleinert aber wirklichkeitsgetreu)
Wie wählt man nun einen bestimmten Teil der Grundgesamtheit aus ?
Man unterscheidet :
- Systematische Verfahren:
- Quotenverfahren
- systematische Auswahl
- Zufallsstichprobe:
- Einfache Zufallsstichprobe
- geschichtete Zufallsstichprobe
- Klumpenstichprobe
Quotenauswahl: Verteilung der Merkmalsausprägungen wird gezielt erreicht
z.B. Gesamtzahl der Interviews: 10
Stadtteil:
A
5
B
3
C
2
Geschlecht: männl.
6
Weibl.
4
Alter:
18- 30J
3
31- 50 J
4
über 50J
3
Beruf:
Arbeiter/Angest.
2
Jahreseinkommen: - 15.000
Beamter/VB
1
15.001- 30.000
Selbst.
1
über 30.000
Hausf/-m
2
Pension
2
Ausbildg
1
Sonstiges(K/AL) 1
3
5
2
7
systematische Auswahl: typische Auswahl
(!!ist kein methodisch gesichertes, den Repräsentationsschluß ermöglichendes
Verfahren!!)
Man greift nach freiem Ermessen solche Elemente aus der Grundgesamtheit heraus,
die als besonders charakteristisch und typisch erachtet werden und schließt von den
erzielten Ergebnissen entsprechend auf die Grundgesamtheit. (Welche Elemente sind
typisch?; in welchem Umfang kann verallgemeinert werden???)
Einfache Zufallsstichprobe:
(Urnenmodell) Die Elemente, die in das
Stichprobensample eingehen, werden unmittelbar aus der Grundgesamtheit gezogen.
Voraussetzung: Vollständigkeit der Grundgesamtheit, gleiche Auswahlchance.
- Systematische Zufallsauswahl: Startpunkt t, s = N/ n
- Schlussziffernverfahren: aus durchnummerierten Datei werden jene Elemente
mit best. Schlußziffer genommen
- Buchstabenauswahl: Stichprobe = all jene Elemente, deren Nachname best.
Anfangsbuchstaben hat
Geschichtete
Zufallsstichprobe:
Grundgesamtheit wird in mehrere
Untergruppen (Schichten) aufgeteilt, aus denen dann jeweils die, in die
Gesamtstichprobe eingehenden Elemente, mittels eines reinen Zufallsverfahrens
ausgewählt werden.
z.B: nach Altersgruppen
Klumpenauswahl: Grundgesamtheit wird in Klumpen (Flächen) unterteilt und
dann wird rein zufällig eine bestimmte Zahl dieser Klumpen ausgewählt und mit
allen ihren Elementen in das Sample einbezogen. Nicht einzelne Elemente, sondern
ganze Gruppen bilden die Auswahleinheit – !! die Grundgesamtheit muß vollständig
vorliegen.
z.B: (Städteplanung) Planquadrate eines Stadtplans, oder Häuserblocks
( Die gezogenen Klumpen gehen entweder als Gesamtheit in die Stichprobe ein, oder
es werden aus ihnen wiederum Teilstichproben nach einfacher Zufallsauswahl
gezogen)
8
Als ein besonders verbreitetes Beispiel für ein mehrstufig geschichtetes
Auswahlverfahren wird der folgende Musterstichprobenplan (mit 3 Auswahlstufen),
der von zahlreichen
führenden Marktforschungsinstituten für repräsentative
Bevölkerungsumfragen entwickelt wurde, angeführt:
1) Auswahl von sample-points: Dabei erfolgt ein sogenanntes area sampling, das
heißt es werden im Rahmen einer Zufallsauswahl Gemeinden oder Bezirke
ausgewählt.
2) Auswahl von Haushalten in den gezogenen sample-points (Zufällige Auswahl
der Haushalte aus Adressenlisten oder Telefonbüchern)
3) Auswahl der Zielpersonen in den gezogenen Haushalten (z.B.: Auswahl der
Person fortlaufend nach dem Alter oder Vornamensalphabetisch)
Eine wesentliche Bedingung für die Durchführung einer Zufallsauswahl ist, daß das
„Personenmaterial“ vollständig katalogisiert sein muß:
„Jedes Element muß die gleiche Chance haben ausgewählt zu werden“.
(Beginn der Auswahl über eine Zufallszahl).
Die Größe der Stichprobe ist meist aus finanziellen Überlegungen determiniert. Ein
wesentlicher Indikator zur Bestimmung der Größe der Stichprobe ist jedoch der
Stichprobenfehler: Das heißt, wie exakt sind die Ergebnisse bzw. wie exakt sollen
die Ergebnisse sein ? (Nicht zu verwechseln mit der Repräsentativität !!!)
(Totalerhebung) Vollerhebung vs. Teilerhebung
Stichprobenfehler:
da man noch keine Ergebnisse vorliegen hat, geht man von
einem Antwortverhalten 50:50 aus. („ungünstigster Fall“)
Stichprobenfehler e =
1,96 2  p  (1  p)
n
p = Anteile in %
z.B: Umfrage in Innsbruck; N=300 Wie groß ist Stichprobenfehler? +/-......%
9
Stichprobenumfang:
Der Marktforscher weiß von den Umständen der jeweiligen Aufgabenstellung her
und in Abstimmung mit dem jeweiligen Auftraggeber.......
- wie genau das Stichprobenergebnis sein muß (Intervall)
- mit welcher Sicherheit diese Aussage getroffen werden soll (95% Sicherheit.)
n = 1,962
.
p  (1  p)
e2
n......Stichprobenumfang
p......Anteil der Befragten, die eine best.Antwort gaben
e......Stichprobenfehler, Schwankungsbreite
z.B. Umfrage Innsbruck: Wie groß muss Stichprobe sein, bei e = +/-5,6%
10
Die anschließende Tabelle gibt Aufschluß über den Stichprobenfehler bei
unterschiedlichen Stichprobenumfängen und Anteilen: (ohne Endlichkeitskorrektur,
nur für große Grundgesamtheiten)
p........Anteil (Soviele Prozent geben eine bestimmte Antwort)
n........Stichprobenumfang
STICHPROBENFEHLER
in %
Anteile
in %
10 / 90 15 / 85 20 / 80 25 / 75 30 / 70 35 / 65 40 / 60 45 / 55 50/50
=0,1
=0,15
=0,2
=0,25
=0,3
=0,35
=0,4
=0,45
=0,5
Stichprobe:
100 5,88% 7,00% 7,84% 8,49% 8,98% 9,35% 9,60% 9,75% 9,80%
200 4,16% 4,95% 5,54% 6,00% 6,35% 6,61% 6,79% 6,89% 6,93%
300 3,39% 4,04% 4,53% 4,90% 5,19% 5,40% 5,54% 5,63% 5,66%
400 2,94% 3,50% 3,92% 4,24% 4,49% 4,67% 4,80% 4,88% 4,90%
500 2,63% 3,13% 3,51% 3,80% 4,02% 4,18% 4,29% 4,36% 4,38%
600 2,40% 2,86% 3,20% 3,46% 3,67% 3,82% 3,92% 3,98% 4,00%
700 2,22% 2,65% 2,96% 3,21% 3,39% 3,53% 3,63% 3,69% 3,70%
800 2,08% 2,47% 2,77% 3,00% 3,18% 3,31% 3,39% 3,45% 3,46%
900 1,96% 2,33% 2,61% 2,83% 2,99% 3,12% 3,20% 3,25% 3,27%
1000 1,86% 2,21% 2,48% 2,68% 2,84% 2,96% 3,04% 3,08% 3,10%
1500 1,52% 1,81% 2,02% 2,19% 2,32% 2,41% 2,48% 2,52% 2,53%
2000 1,31% 1,56% 1,75% 1,90% 2,01% 2,09% 2,15% 2,18% 2,19%
2500 1,18% 1,40% 1,57% 1,70% 1,80% 1,87% 1,92% 1,95% 1,96%
3000 1,07% 1,28% 1,43% 1,55% 1,64% 1,71% 1,75% 1,78% 1,79%
Stichprobenfehler =
1,96 2  p  (1  p)
n
p = Anteile in %
Beispiel:
Bei einer Umfrage unter 500 Innsbruckern geben rund 30% an, daß sie ihren
Sommerurlaub "last minute" buchen. Man kann nun behaupten, daß der tatsächliche
Anteil jener Personen, die "last minute" ihren Sommerurlaub buchen, mit einer
Wahrscheinlichkeit von 95%, zwischen 26% und 34% liegt (=+- 4,02%).
11
DATENERHEBUNG:
In dieser Phase werden nun die Interviews
- persönlich
- telefonisch
durch geschulte Interviewer
- oder postalisch durchgeführt.
Dieser Abschnitt wird auch als Feldarbeit bezeichnet.
Werden mehrer Auftraggeber in einer Umfrage mit verschiedenen Themen
zusammengefasst, so spricht man von ein OMNIBUSUMFRAGE.
PRÜFUNG AUF PLAUSIBILITÄT bzw. INTERVIEWERKONTROLLEN:
Dies ist sowohl eine visuelle wie auch computergestützte Kontrolle der erhobenen
Interviews. Dabei handelt es sich einerseits um einen Vergleich von eingebauten
Kontrollfragen (z.B.: Haushaltstyp, Haushaltsgröße, Familienstand, Kinder,...) bis
hin zur direkten Kontaktaufnahme der interviewten Person und Befragung zur
Interviewdurchführung und zum Verhalten des Interviewers.
In modernen Interviewcallcenters wird diese Überprüfung unter anderem auf die
entsprechende Telefonsoftware ausgeweitet, wo alle Interviews (=Gespräche)
hinsichtlich ihrer Dauer und Rufnummer genau aufgezeichnet werden.
(Nur zur internen Kontrolle, DATENSCHUTZ!!)
PRÜFUNG AUF REPRÄSENTATIVITÄT:
Ziel einer repräsentativen Umfrage ist es, ein möglichst exaktes Abbild der zu
befragenden Bevölkerung zu erhalten: (z.B.: bei politischen Umfragen  ein Abbild
der wahlberechtigten Bevölkerung). Anders ausgedrückt: die Untersuchung soll
Aufschlüsse über die Grundgesamtheit bringen und um dies zu erreichen muß aus
dem Ergebnis der Teilerhebung möglichst sicher und exakt auf die Verhältnisse der
Gesamtmasse geschlossen werden können. Die Grundgesamtheit soll sich also in
Bezug auf verschiedene Merkmale in der Stichprobe wiederfinden.
In der Regel wird die Repräsentativität in Bezug auf die Merkmale
Geschlecht, Alter und Bildung
überprüft.
12
DATENANALYSE UND AUSWERTUNG:
Bei der Datenanalyse ist auf das vorliegende Skalenniveau zu achten;
dementsprechend werden Modus, Median oder Mittelwert zur Interpretation
verwendet. Bei den durchzuführenden Testverfahren ist ebenfalls auf diese
Unterscheidung zu achten.
Welche Maßzahlen und Graphiken sinnvoll sind richtet sich nach dem Variablentyp
bzw. dem Skalenniveau:
Variablentyp
Nominal
Ordinal
Metrisch
Maßzahlen
Häufigkeitstabelle, Modus
Häufigkeitstabelle,
Modus, Median, Quantile
Min., Max., Median,
Mittelwert, Std.Dev., Std. Err.;
Graphische Darstellung
Balken-/Kreisdiagramm
Balkendiagramm
Kreisdiagramm
Boxplots
Histogramm,....
Hinsichtlich graphischer Aufbereitung von Daten sind dem Marktforscher nahezu keine Grenzen
gesetzt; obenstehende Tabelle erhebt keinen Anspruch auf Vollständigkeit sondern dient lediglich
als ein möglicher Leitfaden.
So wie an dieser Stelle im Rahmen der deskriptiven Statistik die einzelnen
Maßzahlen nach Variablentypen unterschieden werden, so müssen bei der bivariaten
statistischen Analyse (Sommersemester) auch die unterschiedlichen Testverfahren
berücksichtigt werden.
ERGEBNISBERICHT:
Der Ergebnisbericht sollte die Auswertung (tabellarisch, graphisch und verbal) jeder
einzelnen Frage beinhalten. In weiterer Folge sollen bei jeder Fragestellung zu
interessierende Hypothesen überprüft werden.
INTERPRETATION UND UMSETZUNG DER ERGEBNISSE:
In dieser Phase sollten mit dem Auftraggeber noch die Ergebnisse der Erhebung
analysiert werden und eventuell eine schriftliche Kurzfassung der wesentlichen
Ergebnisse erfolgen. Bei der Hilfe zur Umsetzung empfiehlt sich eine interdisziplinäre Zusammenarbeit mit entsprechenden Fachleuten.
13
Deskriptive Statistik:
Häufigkeitsverteilungen:
Beispiel: Schulnoten bei 24 Schülern
Note:
xi (absolute
hi (relative Häufigkeit)
Häufigkeit)
Hi (kumulierte
Häufigkeit)
1
2
8,3
8,3
2
4
16,7
25,0
3
9
37,5
62,5
4
6
25,0
87,5
5
3
12,5
100,0
Summe
24
100,0
Berechnung der relativen Häufigkeit:
Berechnung von h2 = (x2/N)*100 = 16,7 %
Berechnung der kumulierten Häufigkeiten:
Berechnung von %H3 = h1 + h2 + h3 = 8,3 + 16,7 + 37,5 = 62,5 %
Die Verteilungskurve ergibt sich aus:
Ausgangshistogramm
Kurvenpolygon in Histogramm eintragen
Glätten des Kurvenpolygons
Dichtekurve
14
Statistische Maßzahlen:
Modus: xModus  hi max
Definition: Der Modus ist der häufigste Wert der absoluten (Mess)-werte
Arithmetisches Mittel :
x
1 N
*  xi
N i 1
Def: Der Mittelwert (Mean; arithm. Mittel) ist die Summe aller Messwerte, geteilt
durch ihre Anzahl.
Exkurs : arithmetisches Mittel bei vorgegebenen Klassenbreiten:
x
1 k
*  xi * xmi
N i 1
Bsp:
Klasse
1
2
3
4
x
IQ-Intervall
80 – 100
101 – 121
122 – 142
143 – 163
Klassenmitte xmi
90
111
132
153
xi
4
9
9
3
Σ= 25
xi xmi
360
999
1188
459
Σ= 3006
1 k
*  xi * xmi = 1/25 * 3006 = 120,24
N i 1
Geometrisches Mittel: xG = n x1 * ......xn
xi > 0 !!!!!
Def: Verwendung bei prozentualen Wachstums- und Abnahmeprozessen.
z.B. bei Firmenumsätzen der durchschnittliche Verlauf über Jahre:
Die Steigerung des Umsatzes von Jahr 1 zu Jahr 2 beträgt: 2%
Die Steigerung des Umsatzes von Jahr 2 zu Jahr 3 beträgt: 18%
WICHTIG: Man muß mit den Wachstumsfaktoren (1,02 bzw. 1,18) rechnen und
nicht mit den Wachstumsraten 2% bzw. 18%.
xG = 1,02 *1,18 = 1,097 ; d.h. 9,7% mittlere Umsatzsteigerung.
15
Harmonisches Mittel: xH =
n
1
1
 ..... 
xi
xn
z.B.: Ein Anleger kauft an zwei Tagen Wertpapiere für je 22.000,-€. Einmal zum
Kurs von 110,-€ und einmal zum Kurs von 100,-€. Zu welchem Durchschnittskurs
wurden die Wertpapiere gekauft.
xH =
44000
= 104,76 (= durchschnittlicher Kurs)
22000 22000

110
100
Median :
n ist ungerade: z  x( n 1) / 2
n ist gerade: z 
xn / 2  x( n / 2)1
2
Def: Der Median ist derjenige Punkt der Messwertskala, unterhalb und oberhalb
dessen jeweils die Hälfte der Messwerte liegen.
Quantile: In der Praxis werden meist spezielle Quantile verwendet:
Quartile: Einteilung in vier Abschnitte zu je 25%
Dezile: Einteilung in 10 Abschnitte zu je 10%
Perzentile: Einteilung in 100 Abschnitte zu je 1%
Die besonders häufig verwendeten Quartile sind:
Q1 : 1.Quartil = x 0,25
Q2 : 2.Quartil = x 0,5 = z (Zentralwert) =Median
Q3 : 3.Quartil = x 0,75
Mit Hilfe der Werte min, Q1, z, Q3, max. lässt sich ein Box-Plot-Diagramm
zeichnen, das einen guten Einblick über die Verteilung der Daten gibt.
16
Varianz: s2 =
1 k
*  ( xi  x ) 2
N i 1
Def: Varianz s2 von N- Messwerten xi ist definiert als die Summe der quadrierten
Differenzen (xi - x ) dividiert durch ihre Anzahl.
Standardabweichung: s = s 2
Def: Die Standardabweichung s ist definiert als Quadratwurzel aus der Varianzund
spiegelt die Streuung um den Mittelwert wieder.
Normalverteilung: Messwertverteilung unter der Glockenkurve
x ±s
= ca. 68% der Meßwerte
x ±2s
= ca. 95% der Meßwerte
x ±3s
= ca. 99,7% der Meßwerte
Standardfehler des Mittelwertes:
sx =
s
N
Mit einer Wahrscheinlichkeit von 95% liegt der wahre Mittelwert in einem Intervall
von x ± 2 s x .
Variationskoeffizient: VK =
s  100
%
x
Def: Der Variationskoeffizient ist ein Maß, inwieweit die Verteilung homogen ist.
Bei einem Variationskoeffizient von über 50% ist die Verteilung so inhomogen, dass
man den Mittelwert als Maßzahl besser nicht verwendet.
17
Statistisches Testen:
Mit Hilfe statistischer Tests überprüft u.a. ob zwischen Gruppen
wie z.B. Männer und Frauen im Antwortverhalten auf eine zu
untersuchende Fragestellung hin statistisch signifikante Unterschiede bestehen, oder ob zwischen zwei Variablen (Fragestellungen) Zusammenhänge existieren.
Folgende Tabelle zeigt eine Auswahl statistischer Tests zur
Überprüfung von Unterschieden zwischen Gruppen und zur
Überprüfung von Zusammenhängen zwischen Variablen bzw.
Fragestellungen:
Skalierung Unterschiedsverfahren
Zusammenhangsverfahren
Nominal
Chiquadrattest
Kontingenzkoeffizient
Ordinal
N=2 Stichproben: Mann Whitney U-Test
Rangkorrelationskoeffizient
nach Spearman
n>2 Stichproben: Kruskal-Wallis Test
Metrisch
Varianzanalyse;
Voraussetzungen zur Durchführung:
Normalverteilung
Varianzhomogenität
Korrelationskoeffizient
nach Pearson
18
Hypothesenformulierung:
Im Rahmen der bivariaten Analyse stellt sich die Frage durch
welche demographischen Merkmale die Antworten besonders
beeinflußt werden. Unterscheiden sich z.B.: Männer und Frauen
im Hinblick auf ihren Wunschurlaub.
Dabei interessiert man sich nicht nur für die Unterschiede in
der Stichprobe, sondern man will prüfen, ob die in der
Stichprobe festgestellten Unterschiede auch für die
Grundgesamtheit Gültigkeit haben. Man kann also über die
Grundgesamtheit
nur
Vermutungen
anstellen.
Dieses
Vermutungen bezeichnet man als Hypothesen.
Es gibt zwei Arten von Hypothesen:
- Nullhypothese: H0
- Alternativhypothese: H1
Im Rahmen der Nullhypothese vermutet man, daß z.B. zwischen
Männern und Frauen kein (=Null) Meinungsunterschied besteht
und als Alternativhypothese nimmt man an, daß dieser
Unterschied gegeben ist. Die Ergebnisse der Stichprobe der
Befragten dienen dazu, sich für eine der beiden Hypothesen zu
entscheiden. Bei der Entscheidung für die Alternativhypothese
möchte man möglichst sicher sein; d.h. man möchte sich bei der
Entscheidung für die Alternativhypothese "möglichst wenig
irren". Diese Wahrscheinlichkeit, dass man sich irrt und die
19
Alternativhypothese gewählt hat, obwohl in der Realität (bezogen
auf die Grundgesamtheit) doch die Nullhypothese zutrifft,
bezeichnet man als Irrtumswahrscheinlichkeit. Diese wird von den
meisten Statistik-Software-Produkten exakt berechnet.
Das gängigste Verfahren dazu sind die Signifikanztests.
Zur Überprüfung der Hyppothesen kann folgendes Schema
herangezogen werden:
In der Grundgesamtheit gilt
H0
H1
H0 richtig Entsch. Beta-Fehler
Entscheidung auf Grund
der Stichprobe zugunsten
der:
H1 Alpha-Fehler richtige Entsch.
Als Signifikanzniveau wird in der klassischen Statistik ein =0.05
herangezogen, das heißt: beträgt das errechnete Signifikanzniveau
0.05, dann wird die Nullhypothese verworfen. Dieses Alpha
bezeichnet man auch als Irrtumswahrscheinlichkeit.
20
Unterschiedsverfahren:
Der Chiquadrattest:
Mit Hilfe der Chiquadrattests untersucht man, ob bei nominalen
Variablen Unterschiede zwischen Stichproben bestehen.
Der Chiquadratwert nach Pearson wird nach folgender Formel
berechnet:
n
2  
i 1
(O  E ) 2
E
O....... sind die beobachteten Häufigkeiten (=observed values)
E....... sind die erwarteten Häufigkeiten (=expected values), das
sind jene Häufigkeiten, die man sich bei völliger Unabhängigkeit zwischen den Stichproben erwartet hätte.
Die erwarteten Häufigkeiten werden nach folgender Formel
berechnet:
eij 
ci*r j
N
c......Spaltensumme
r.......Zeilensumme
N......Gesamtstichprobe
21
Folgendes Beispiel zeigt die Anwendung eines Chiquadrattests:
Es wird untersucht ob es Unterschiede zwischen Männern und
Frauen in Bezug auf das Leseverhalten gibt.
Die entsprechenden Hypothesen lauten:
H0: Zwischen Männern und Frauen gibt es hinsichtlich des
Leseverhaltens keinen signifikanten (=null) Unterschied.
H1: Zwischen Männern und Frauen gibt es hinsichtlich des
Leseverhaltens einen signifikanten Unterschied.
Ausgangspunkte sind die Ergebnisse einer Erhebung bei 300
Personen, die in folgender Tabelle zusammengefasst sind:
1.Schritt: Beobachtete Häufigkeiten:
Krimi
Romane
Männer
65
25
Frauen
70
50
Gesamt: abs.
135
75
in %
45%
25%
SciFi
50
40
90
30%
2.Schritt: Erwartete Häufigkeiten:
Krimi
Romane
Männer
63
35
Frauen
72
40
SciFi
42
48
Gesamt
140
160
300
100%
2err. = ((65-63)2/63) + ((25-35)2/35) +......+((40-48)2/48) = 8,333
Die Größe der Tabelle wird durch den Ausdruck Freiheitsgrade
(=degress of freedom DF) beschrieben und ist definiert aus:
DF= (c-1) * (r-1) = (3-1)*(2-1) = 2............d.h.: 2 Freiheitsgrade
22
Bei der Chiquadratverteilung (siehe Tabelle in Fahrmeier) liegt
der Grenz (Schwell-)wert zur Ablehnung der Nullhypothese bei
einer Irrtumswahrscheinlichkeit von 5% (Tabelle 1- = 0,95) und
2 Freiheitsgraden bei:
2Tab.0,95;2 = 5,991
Ist der errechnete Chiquadratwert größer/gleich dem tabellierten,
so wird die Nullhypothese verworfen. Ist dieser Wert kleiner als
der Tabellierte so wird die Nullhypothese angenommen.
Die Chiquadratverteilung lässt sich durch die Normalverteilung
approximieren. Den dann gesuchten Grenzwert z erhält man durch:
z=
2

2
 2  DF  1
im vorliegenden Beispiel ist das:
z=
2  8,333  (2 * 2)  1
= 2,351
Für die Standardnormalverteilung lässt sich nun folgende Fläche
(=Signifikanz) durch Integrieren in den Grenzen z =  2,4 errechnen:
z
2
x
1
1
2

e
2
d x  0.016395
z
Die Irrtumswahrscheinlichkeit – das ist jene Fehlerwahrscheinlichkeit mit der H1 angenommen wird, obwohl H0 zutrifft beträgt also 0,016395 (=1,6%); sie ist daher kleiner als die 5%
Grenze, welche in der klassischen Statistik häufig Anwendung
findet.
23
Aufgrund dieses Ergebnisses:
Sig=0,016395  0,05 kann die Nullhypothese verworfen werden;
anders ausgedrückt: die Alternativhypothese wird angenommen.
 Zwischen Männern und Frauen bestehen im Leseverhalten
signifikante Unterschiede.
 Es erfolgt eine Interpretation der Kontingenz (Kreuz-)tabelle.
24
Weiteres Beispiel mit Softwarelösung:
Fragestellung: Gibt es zwischen Männern und Frauen signifikante
Unterschiede in Bezug auf ihren Wunschurlaub ?
Die beiden Hypothesen lauten:
 H0: Zwischen Männern und Frauen bestehen hinsichtlich des
Wunschurlaubs keine Unterschiede.
H0: M = F
 H1: Zwischen Männern und Frauen bestehen hinsichtlich des
Wunschurlaubs Unterschiede.
H1: M  F
25
Das Statistikpaket SPSS liefert folgenden Output:
Wunschurlaub * Geschlecht Kreuztabelle
Wunschurlaub
flugreis e
kreuzfahrt
ös terreichurlaub
Gesamt
Anzahl
% von Wunschurlaub
% von Geschlecht
Anzahl
% von Wunschurlaub
% von Geschlecht
Anzahl
% von Wunschurlaub
% von Geschlecht
Anzahl
% von Wunschurlaub
% von Geschlecht
Geschlecht
männlich
weiblich
23
3
88,5%
11,5%
63,9%
18,8%
8
10
44,4%
55,6%
22,2%
62,5%
5
3
62,5%
37,5%
13,9%
18,8%
36
16
69,2%
30,8%
100,0%
100,0%
Gesamt
26
100,0%
50,0%
18
100,0%
34,6%
8
100,0%
15,4%
52
100,0%
100,0%
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusam menhang
linear-m it-linear
Anzahl der gültigen Fälle
As ymptotisch
e Signifikanz
(2-seitig)
df
a
9,875
2
,007
10,281
2
,006
5,086
1
,024
52
a. 1 Zellen (16,7%) haben eine erwartete Häufigkeit kleiner 5.
Die minimale erwartete Häufigkeit ist 2,46.
Im vorliegenden Beispiel beträgt das =0.007 ; Die Irrtumswahrscheinlichkeit ist daher 0,7%
  0.05  H0
  0.05  H1
daraus folgt   H1
Zwischen Männern und Frauen bestehen signifikante
Unterschiede hinsichtlich ihres Urlaubswunsches.
26
Ein Sonderfall des Chiquadrattests ist:
- bei 2x2 Tabellen die Kontinuitätskorrektur (bzw. Yates
Korrektur)
Der Chiquadratwert mit der Kontinuitätskorrektur wird nach
folgender Formel berechnet:
n
[ O  E  0.5]2
i 1
E
 
2
Fragestellung: Gibt es einen Unterschied zwischen Männer und
Frauen dahingehend, ob Sie letztes Jahr Urlaub machten ?
Die beiden Hypothesen lauten:
 H0: Zwischen Männern und Frauen bestehen hinsichtlich des
Urlaubsverhaltens (ob Urlaub gemacht wird ? Ja/Nein)
keine Unterschiede.
H0: M = F
 H1: Zwischen Männern und Frauen bestehen hinsichtlich des
Urlaubsverhaltens Unterschiede.
H0: M  F
27
Somm erurlaub * Geschle cht Kreuztabelle
Sommerurlaub
Ja
Nein
Gesamt
Anzahl
% von Sommerurlaub
% von Ges chlecht
Anzahl
% von Sommerurlaub
% von Ges chlecht
Anzahl
% von Sommerurlaub
% von Ges chlecht
Geschlecht
männlich
weiblic h
23
13
63,9%
36,1%
63,9%
81,3%
13
3
81,3%
18,8%
36,1%
18,8%
36
16
69,2%
30,8%
100,0%
100,0%
Gesamt
36
100,0%
69,2%
16
100,0%
30,8%
52
100,0%
100,0%
Chi-Quadrat-Tests
W ert
Chi-Quadrat nach
Pearson
a
Kontinuität skorrekt ur
Lik elihood-Quotient
Ex akter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
As ymptotis ch
e S ignifikanz
(2-seit ig)
df
b
1,567
1
,211
,858
1,659
1
1
,354
,198
Ex akte
Signifik anz
(2-seit ig)
,331
1,537
1
Ex akte
Signifik anz
(1-seit ig)
,178
,215
52
a. W ird nur für eine 2x 2-Tabelle berec hnet
b. 1 Zellen (25,0% ) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 4,92.
Im vorliegenden Beispiel beträgt das =0.354, daraus folgt, daß
zwischen Männern und Frauen keine signifikanten Unterschiede
hinsichtlich des Urlaubsverhaltens bestehen.
28
PARAMETERFREIE PRÜFVERFAHREN
Die folgenden beiden statistischen Testverfahren, der MannWhitney-U-Test und der Kruskal-Wallis Test dienen zum
Vergleich unabhängiger Stichproben, die entweder ordinal
skaliert oder nicht normalverteilt sind.
 Mann-Whitney U-Test:
Der U-Test von Mann und Whitney dient zum Vergleich zweier
unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable
bzw. solcher, die die Voraussetzung der Normalverteilung nicht
erfüllen. Das Prinzip dieses Tests ist die Ersetzung der gegebenen
erfassten Werte durch Rangplätze. Es handelt sich dabei praktisch
um eine ordinal skalierte Variable (wie z.B. Beurteilung nach
Schulnoten) oder um eine metrische Variable, welche nicht
normalverteilt ist; dabei werden sämtliche auftretenden Werte
durch Ränge ersetzt, die Abstände zueinander werden dabei völlig
vernachlässigt. Auf Ordinalskalenniveau erhobene Daten lassen
lediglich Rechen- operationen zu, in denen Rangplätze (ordinale
Informationen) verarbeitet werden. Mittelwerte, Varianzen
können nicht berechnet werden, weil das Kriterium der
Äquidistanz nicht gegeben ist. Statt dessen werden Summen der
Rangplätze berechnet, denen die Fälle in den Substichproben
zuzuordnen sind.
29
Die Vorgangsweise beim Mann-Whitney U-Test wird durch
folgendes Beispiel erörtert:
Untersucht wird die Fragestellung ob sich Studenten (männlich)
von Studentinnen (weiblich) hinsichtlich der Beurteilung der
Nebenjobmöglichkeiten unterscheiden.
Die beiden zu überprüfenden Hypothesen sind:
H0: Zwischen Männern und Frauen besteht kein Unterschied
hinsichtlich der Beurteilung der Nebenjobmöglichkeiten.
H1: Zwischen Männern und Frauen besteht ein signifikanter
Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten.
(Irrtumswahrscheinlichkeit max.5%)
Folgende Tabelle zeigt die zusammengefassten Ergebnisse:
Beurteilung
Männlich
Weiblich
ti
(ti3-ti)
Gut
2
8
10
990
Mittel
3
2
5
120
Schlecht
7
3
10
990
Gesamt
n1=12
n2=13
N=25 =2100
Im ersten Schritt werden nun den einzelnen Werten, geordnet
nach männlich/weiblich und den Beurteilungen, Rangplätze
zugewiesen und so für die Gruppe der Männer und Frauen
Rangsummen berechnet: Es ergeben sich also insgesamt 25
Rangplätze, von der ersten Person männlich+gut-Beurteilung bis
zur letzten (25-sten) Person weiblich+schlecht-Beurteilung.
30
Die Rangsummen werden nach Ermittlung der Rangziffern und
anschließender Gewichtung nach der jeweiligen Anzahl von
Frauen und Männern berechnet.
Beurteilung
Männlich
Weiblich
1+2+
5,5 x 2=11
3+4+5+6+7+8+9+10=55/10=5,5
5,5 x 8=44
11+12+13+
13 x 3=39
16+17+18+19+20+21+22+
20,5 x 7=143,5
14+15=65/5=13
13 x 2=26
23+24+25=205/10=20,5
20,5 x 3=61,5
Rangsummen R
R1=193,5
R2=131,5
Mittlerer Rang
193,5/12=16,13
131,5/13=10,12
1=Gut
2=Mittel
3=Schlecht
Es gilt:
R1 + R2 = [N*(N+1)]/2
193,5 + 131,5 = 325
In weiterer Folge wird die Testmaßzahl U bestimmt:
U1 = R1 – [n1*(n1+1)]/2
U1 = 193,5 – 78 = 115,5
U2 = R2 – [n2*(n2+1)]/2
U2 = 131,5 – 91 = 40,5
Die Prüfgröße U des U-Testes ist nun der kleinere der beiden UWerte: U = Minimum (U1, U2) = 40,5
Laut Tabelle beträgt der kritische U-Wert:
U;n1;n2 = U0,05;12;13 = 41
Da der errechnete U-Wert kleiner als U-tabelliert ist, wird H0
verworfen; es folgt die Interpretation von H1.
31
Zur Bestimmung der exakten Irrtumswahrscheinlichkeit muß
zuerst z bestimmt werden; dann kann die asymptotische
significance berechnet werden:
Zur Berechnung von z benutzt man folgende korrigierte Formel:
Warum korrigiert ? Da Messwerte auftreten, die wiederholt
vorkommen, wird in die Formel ein Korrektur-Term eingebaut:
U
z=
n1* n2
2
n1* n2
* (N 3  N 
12 * N * ( N  1)
m
 (t
3
i
 ti )
i 1
z = - 2,193
Exkurs:---------------------------------------------------------------------Tritt jeder Messwert nur einmal auf, so wird zur Berechnung
von z die folgende unkorrigierte Formel herangezogen:
n1* n2
2
n1* n2 * (n1  n2  1)
12
U
z=
-------------------------------------------------------------------------------Berechnung der Irrtumswahrscheinlichkeit: sig
z
2
x
1
1
2

2
e d x  0.028307
z
sig = 0,028 = 2,8%
Da 0,0283  0,05  H1 ; d.h. H0 wird verworfen !!
32
Schlussfolgerung:
Zwischen Männern und Frauen besteht ein signifikanter
Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten.
Wo liegt nun der diesbezügliche Unterschied ?
Man betrachtet die mittleren Ränge:
Mittlerer Rang
Männer
Frauen
16,13
10,12
Der einzelne mittlere Rang sagt nichts aus und wird so auch nicht
interpretiert. Betrachtet man jedoch die Höhe des mittleren
Ranges, so kann festgestellt werden, dass der mittlere Rang bei
den Männern deutlich höher ist als jener, der Frauen.
Die ursprüngliche Codierung der Beurteilung war:
1 = gut
2 = mittel
3 = schlecht
Ein höherer Wert sagt also aus, dass "schlechter beurteilt" wurde.
Im vorliegenden Beispiel kann also festgehalten werden, dass
Männer (Studenten) die Nebenjobmöglichkeiten schlechter
beurteilen als Frauen (Studentinnen).
33
Das Statistikpaket SPSS liefert folgenden Output:
Mann-Whitney-Test
Ränge
Beurteilung
Nebenjobmögl.
Geschlecht
männlich
weiblich
Gesamt
N
12
13
25
Mittlerer Rang
16,13
10,12
Rangs umme
193,50
131,50
Statistik für Testb
Mann-Whitney-U
Wilcoxon-W
Z
As ymptotische
Signifikanz (2-seitig)
Exakte Signifikanz
[2*(1-s eitig Sig.)]
Beurteilung
Nebenjobm
ögl.
40,500
131,500
-2,193
,028
a
,040
a. Nicht für Bindungen korrigiert.
b. Gruppenvariable: Geschlecht
Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische
Signifikanz und interpretiert, wenn H0 verworfen wird und man sich
für H1 entscheidet, die mittleren Ränge.
34
 Kruskal-Wallis H-Test:
Der H-Test von Kruskal und Wallis dient zum Vergleich mehr als
zweier (n>2) unabhängiger Stichproben, hinsichtlich ordinalskalierter Variable bzw. solcher, die die Voraussetzung der
Normalverteilung nicht erfüllen. Das Prinzip dieses Tests ist die
Ersetzung der gegebenen erfassten Werte durch Rangplätze.
Es handelt sich dabei praktisch um eine ordinal skalierte Variable
(wie z.B. Beurteilung nach Schulnoten) oder um eine metrische
Variable, welche nicht normalverteilt ist; dabei werden sämtliche
auftretenden Werte durch Ränge ersetzt, die Abstände zueinander
werden dabei völlig vernachlässigt.
Auf Ordinalskalenniveau erhobene Daten lassen lediglich
Rechenoperationen zu, in denen Rangplätze (ordinale
Informationen) verarbeitet werden. Mittelwerte, Varianzen
können nicht berechnet werden, weil das Kriterium der
Äquidistanz nicht gegeben ist. Statt dessen werden Summen der
Rangplätze berechnet, denen die Fälle in den Substichproben
zuzuordnen sind.
35
Die Vorgangsweise beim Kruskal-Wallis H-Test ist bis hin zur
Berechnung der mittleren Ränge gleich jener beim M-W U-Test.
Untersucht wird die Fragestellung ob sich Studenten der 4
Studienrichtungen BWL/VWL/IWW/Wipäd hinsichtlich der
Beurteilung
der
Nebenjobmöglichkeiten
voneinander
unterscheiden.
Die beiden zu überprüfenden Hypothesen sind:
H0: Zwischen den Studenten der 4 Studienrichtungen besteht kein
Unterschied hinsichtlich der Beurteilung der Nebenjobmöglichkeiten.
H1: Zwischen den Studenten der 4 Studienrichtungen besteht ein
Signifikanter Unterschied hinsichtlich der Beurteilung der
Nebenjobmöglichkeiten.
(Irrtumswahrscheinlichkeit max.5%)
Die Berechnung der Rangsummen und mittleren Ränge erfolgt
gleich wie beim Mann Whitney U-Test.
Es ergibt sich folgende Tabelle:
BWL
VWL
IWW
Wipäd
ti
(ti3-ti)
Gut
6
2
0
2
10
990
Mittel
1
2
0
2
5
120
Schlecht
0
4
6
0
10
990
Gesamt ni
7
8
6
4
N=25
2100
Rangsummen Ti
46
119
123
37
-
-
Mittlerer Rang
6,57
14,88
20,55
9,25
-
-
36
Die für den Kruskal-Wallis Test zu berechnende Prüfgröße H ist
chiquadrat-verteilt, mit
Df = k-1 Freiheitsgraden ,
wobei k= die Anzahl der Klassen/Gruppen (=4 Studienrichtungen)
Im vorliegenden Beispiel errechnet sich durch:
DF = 4 – 1 = 3
Die angeführte Formel H bezieht sich auf die Berechnung in dem
Fall, dass jeder Messwert nur einmal auftritt;
H=
12
*
N * ( N  1)
Ti2
 3 * ( N  1)
i 1 n
i

k
Die vorliegende Problemstellung zeigt jedoch, dass bei den 4
Studienrichtungen die gleichen Beurteilungen zum Teil häufiger
als nur einmal auftreten, daher verwendet man beim Kruskal
Wallis Test, ähnlich wie beim U-Test, eine korrigierte Formel:
H´ =
H

1
m
(t 3
i 1 i
3
 ti )
N N
H´err.= 15,166
Ein Blick auf die Chiquadrattabelle (siehe Fahrmeier) zeigt, dass
H´1-;DF = H´0,95;3 = 7,8147
Da der errechnete H-Wert größer dem H-Wert aus der Chiquadrattabelle ist, wird H0 verworfen; man entschließt sich für H1
und interpretiert die mittleren Ränge.
Über den H-Wert wird wie beim Chiquadrattest z errechnet und
daraus wiederum die exakte Irrtumswahrscheinlichkeit.
37
Das Statistikpaket SPSS liefert folgenden Output:
Kruskal-Wallis-Test
Rä nge
Beurteilung
Nebenjobmögl.
St udienrichtungen
BW L
VW L
IW W
W ipäd
Gesamt
N
7
8
6
4
25
Mittlerer Rang
6,57
14,88
20,50
9,25
Statistik für Te sta,b
Beurteilung
Nebenjobmögl.
Chi-Quadrat
15,171
df
3
As ymptotis che Signifikanz
,002
a. Kruskal-W allis-Test
b. Gruppenvariable: St udienric htungen
Zur Festlegung ob H0 oder H1 betrachtet man die Asymptotische
Signifikanz und interpretiert, wenn H0 verworfen wird und man sich
für H1 entscheidet, die mittleren Ränge.
38
 Varianzanalyse:
Will man untersuchen inwiefern sich zwei oder mehrere
Gruppen einer nominalen oder ordinalen Variable in Bezug auf
ein metrisches Merkmal unterscheiden, so wendet man die
einfaktorielle Varianzanalyse an. Um den Einfluß mehrerer
nominaler bzw. ordinaler Variable auf eine metrische Variable
zu überprüfen, wird die mehrfaktorielle Varianzanalyse
durchgeführt.
Von Interesse ist also der Einfluß eines sogenannten Faktors auf
eine eigentlich metrische Zielgröße.
Es ist darauf hinzuweisen, dass bei Überprüfung zweier
Gruppen (z.B. Männer/Frauen) hinsichtlich eines metrischen
Merkmals (z.B. Ausgaben für Geschenke) häufig der t-Test
Anwendung findet.
Bei mehr als 2 Gruppen (n>2) findet der F-Test seine
Anwendung, da der t-Test nur im Zweistichprobenfall zu
verwenden ist. Da der F-Test jedoch auch im Zweistichprobenfall
anwendbar ist, ist seine Verbreitung wesentlich häufiger.
Wichtige Voraussetzungen für die Durchführung der
Varianzanalyse sind: Normalverteilung (K-S Test)
Varianzhomogenität (Levene-Statistik)
39
Liegen diese Voraussetzungen nicht vor, so wird in der Regel auf
Unterschiedsverfahren für ordinal skalierte Variable zurückgegriffen.
Die Varianzanalyse geht ihrem Prinzip nach von einer Zerlegung
der Varianzen aus. Diese Gesamtvarianz wird zerlegt in eine
Varianz innerhalb der Gruppen und eine Varianz zwischen den
Gruppen.
Welche Hypothesen werden überprüft:
H0 : 1 = 2 = ...... = n
H1 : 1 ≠ 2 ≠ ...... ≠ n
Da die Varianzanalyse ein Mittelwertvergleich ist, wird
untersucht, ob die Mittelwerte der einzelnen Gruppen in etwa
gleich, oder ob die Mittelwerte voneinander signifikant
verschieden sind.
40
Die zu berechnende F-Teststatistik(Ferrechnet)ergibt sich aus:
SQE  2
Ferr = SQR *  1 , wobei
SQR = Summe der Streuung innerhalb der Gruppen
SQR =  (n 1) * s ;
si2=Varianz innerhalb der einzelnen Gruppen
I
2
i
i
i 1
T = Gesamtstreuung
T =  ( x  x)
N
2
i
i 1
SQE = Summe der Streuung zwischen den Gruppen
SQE =  (n *  ( x  x) ) ;
I
ni
2
i
i 1
i
j 1
d.h. rechentechnisch =
SQE =T(Gesamtstreuung)–SQR(Streuung innerhalb der Gruppen)
Zur Berechnung der Freiheitsgrade:
 1 = I – 1, wobei I ist gleich die Anzahl der Gruppen
 2 = N – I, wobei N gleich dem Stichprobenumfang
41
Diese Vorgangsweise wird anhand folgendem Beispiel erörtert:
In nachstehender Tabelle sind die Daten einer Erhebung der
durchschnittlichen Ausgaben pro Urlaubstag in Euro für
Niederländer, Deutsche und Amerikaner angeführt:
Ausgaben
pro Tag
Gruppenmittelwert
Berechnung
von
T
Berechnung
von SQE
1 = Niederländer
75
80
(104-75)2
(80-104)2
1
80
(104-80)2
(80-104)2
1
85
(104-85)2
(80-104)2
2=Deutsche
90
(104-90)2
(100-104)2
2
100
(104-100)2
(100-104)2
2
110
(104-110)2
(100-104)2
3= Amerikaner
110
(104-110)2
(125-104)2
3
130
(104-130)2
(125-104)2
3
120
(104-120)2
(125-104)2
3
140
(104-140)2
(125-104)2
Gesamtmittelwert
104
Summe = 4290
Summe=3540
100
125
Aus den Daten ergeben sich folgende Varianzen:
s12 = 25;
s22 = 100;
s32 = 166,666
SQR = 2 * 25 + 2 * 100 + 3 * 166,666 = 750
SQE = 3*(80-104)2+3*(100-104)2+4*(125-104)2 = 3540
1 = I – 1 = 3 – 1 = 2
 2 = N – I = 10 – 3 = 7
42
Ferr =
3540 7
*
750 2
= 16,52
Das auf diese Weise errechnete F wird nun, wie bereits bei
anderen statistischen Tests aufgezeigt, mit dem tabellierten FWert verglichen: (Irrtumswahrscheinlichkeit 5%)
F tab 0,05; 2; 7 = 4,74
Da Ferr ≥ Ftab. wird die H0 verworfen und man kann mit großer
Wahrscheinlichkeit davon ausgehen, dass sich die Mittelwerte der
einzelnen Gruppen signifikant voneinander unterscheiden.
Zur Interpretation der signifikanten Ergebnisse werden die
Mittelwerte der einzelnen Gruppen (Gruppenmittelwerte – siehe
Tabelle) herangezogen.
Deskriptive Statistik
AUSG
N
Niederländer
Deutsche
Amerikaner
Gesamt
3
3
4
10
Mittelwert
80,0000
100,0000
125,0000
104,0000
Standardab
weichung
5,0000
10,0000
12,9099
21,8327
Standardf
ehler
2,8868
5,7735
6,4550
6,9041
95%-Konfidenzintervall für
den Mittelwert
Untergrenze Obergrenze
67,5793
92,4207
75,1586
124,8414
104,4574
145,5426
88,3818
119,6182
Minimum
75,00
90,00
110,00
75,00
Maximum
85,00
110,00
140,00
140,00
ANOVA
AUSG
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt
Quadrats
umme
3540,000
750,000
4290,000
df
2
7
9
Mittel der
Quadrate
1770,000
107,143
F
16,520
Signifik anz
,002
43
Nach der Entscheidung für H0 oder H1 auf Basis der von der
Software errechneten exakten Signifikanz (größer oder kleiner
gleich 0,05), werden bei H1 die Mittelwerte interpretiert.
44
 Regressionsanalyse
Durch die Regressionsanalyse soll der Zusammenhang zweier
oder mehrerer Variable mathematisch erfasst werden. Ziel der
Regressionsrechnung ist es dabei, Formeln zu finden, nach denen
man bei Kenntnis des Wertes der einen Variablen den zu
erwartenden Wert der anderen Variable bestimmen kann.
Ausgangspunkt ist also eine grafische Übersicht des Zusammenhangs zweier metrischer Variable. Dieser Zusammenhang wird
durch eine Regressionslinie am besten dargestellt.
An dieser Stelle wird ein Modell mit zwei Variablen ausführlich
behandelt; dieses bezeichnet man als lineare Einfachregression.
Der Zusammenhang von zwei Variablen wird durch die lineare
Funktion der Form:
ŷi = α + βxi , deren Graf eine Gerade ist, verdeutlicht.
Gesucht wird also ein objektives Verfahren zur Ermittlung der
ŷi = α + βxi mit der Steigung β und dem
Geradengleichung
Ordinatenabschnitt α. Dabei nennt man β auch den
Regressionskoeffizienten. Das Vorzeichen drückt die Art des
Zusammenhangs aus:
Positiv:
je mehr, desto mehr / je weniger, desto weniger
Negativ:
je mehr, desto weniger / je weniger, desto mehr
Null:
keine Richtung/Muster erkennbar.
45
Mit Hilfe folgender Formel kann β bestimmt werden:
n
β=
n
n
 (x * y )  n *  x *  y
1
i
i
i
i 1
i 1
n
n
x
i 1
2
i

i
i 1

1
*(
xi ) 2
n i 1
Der Ordinatenabschnitt bestimmt sich nach der Berechnung von β
zu:
α = y  *x
Folgendes Beispiel soll die Anwendung der Regressionsrechnung
besser verständlich machen:
Gegeben sind das monatliche Einkommen und die Ausgaben für
Geschenke pro Monat:
EK ( x)
1000,00
1050,00
1100,00
1200,00
1250,00
1250,00
1250,00
1500,00
1400,00
1600,00
AUSG (y)
75,00
80,00
85,00
90,00
100,00
110,00
110,00
130,00
120,00
140,00
y2
5625,00
6400,00
7225,00
8100,00
10000,00
12100,00
12100,00
16900,00
14400,00
19600,00
x2
1000000
1102500
1210000
1440000
1562500
1562500
1562500
2250000
1960000
2560000
xiyi
75000,00
84000,00
93500,00
108000,0
125000,0
137500,0
137500,0
195000,0
168000,0
224000,0
Mittelwert
1260
104
11245
1621000
134750
Summe
12600
1040
112450
16210000
1347500
ni
1
2
3
4
5
6
7
8
9
10
46
β=
1
*1040 *12600
10
1
16210000  *12600 2
10
1347500 
= 0,1110778
α = 104 – 0,1110778 * 1260 = -35,958
Daraus ergibt sich folgendes Regressionsmodell für unsere Daten:
ŷi = -35,958 + 0,1110778*xi
Die Regressionsgerade kann nach der angegebenen Methode
immer berechnet werden. Sinnvoll ist ihre Berechnung aber nur
dann, wenn der Zusammenhang zwischen den beiden betrachteten
Variablen tatsächlich linear ist. Dies ist entweder aus der
Erfahrung bekannt oder in der Regel aus dem optischen Eindruck
des Korrelationsdiagramms ersichtlich.
Die zu suchende Gerade erfüllt die Modellfunktion dann am
besten, wenn die Summe der Abstände der Punkte außerhalb der
Geraden zu dieser Geraden möglichst gering ist. Im
geometrischen Sinn kann man die Abstände als euklidisches
Differenzenquadrat auffassen. Es wird also eine Zielfunktion im
Sinne der Methode der kleinsten Quadrate formuliert, wo die
Quadratwerte minimal werden.
Die Differenzen der beobachteten Werte zu den geschätzten
Werten, werden als Residuen bezeichnet. Das sind jene Werte,
deren Betrag möglichst gering sein sollte;
ˆi  yi  yˆi
47
Auf Grund unseres Regressionsmodells ergeben sich für ein
Einkommen in der Höhe von 1250 Euro geschätzte Ausgaben für
Geschenke in der Höhe von 102,8892. Dieser Wert ergibt sich
aus:
ŷi = 0,1110778 *1250 +(-35,958) = 102,8892
Die Differenz dieses geschätzten Wertes zum tatsächlich
beobachteten Wert 100 beträgt –2,8892; dies ist das Residuum für
den beobachteten Wert von 100 Euro.
Für die gesamten beobachteten Werte der Variable Ausgaben
(AUSG) ergeben sich auf Grund unseres Regressionsmodells, d.h.
die Erklärung der Ausgaben über die beeinflussende Variable
Einkommen (EK) folgende Werte (Residuen):
EK (x)
1000,00
1050,00
1100,00
1200,00
1250,00
1250,00
1250,00
1500,00
1400,00
1600,00
AUSG (y)
75,00
80,00
85,00
90,00
100,00
110,00
110,00
130,00
120,00
140,00
ŷ
75,11976
80,67365
86,22754
97,33533
102,8892
102,8892
102,8892
130,6587
119,5509
141,7665
Residuen
-,11976
-,67365
-1,22754
-7,33533
-2,88922
7,11078
7,11078
-,65868
,44910
-1,76647
48
Das Statistikpaket SPSS liefert folgenden Output:
b
Model lzusam menfassung
Modell
1
R
R-Quadrat
,980a
,961
Korrigiertes
R-Quadrat
,956
St andardf
ehler des
Sc hätz ers
4,5964
a. Einfluß variablen : (Kons tant e), EK
b. Abhängige Variable: AUSG
Koeffi zientena
Modell
1
(Konst ante)
EK
St andardi
sierte
Koeffiz ien
ten
Nicht s tandardisierte
Koeffiz ient en
St andardf
B
ehler
-35,958
10,126
,111
,008
Beta
,980
T
-3, 551
13,966
Signifik anz
,007
,000
a. Abhängige Variable: AUSG

140,00
ausg = -35.96 + 0.11 * ek
R-Quadrat = 0.96

Punkte/Linien zeigen Mittelw erte
Lineare Regression

ausg
120,00

100,00



80,00

1000,00
1200,00
1400,00
1600,00
ek
49
Zusammenhangsverfahren:
 Kontingenzkoeffizient: (0 bis 1)
Für nominale Merkmale wird als Zusammenhangsmaß der
Kontingenzkoeffizient (C) verwendet. Dieser Wert liegt zwischen
0 und 1 und drückt die Stärke des Zusammenhangs aus. Der
Kontingenzkoeffizient misst nur die Stärke des Zusammenhangs,
eine Richtung der Wirkungsweise wird nicht erfasst.
Als Basis zu Berechnung des Kontingenzkoeffizienten wird der
errechnete Chiquadratwert herangezogen:
C=
2
n2
Die beiden zu untersuchenden Hypothesen lauten:
H0 : Zwischen den beiden Variablen Geschlecht und
Lesegewohnheiten besteht kein wesentlicher Zusammenhang
H1 : Zwischen den beiden Variablen Geschlecht und Lesegewohnheiten besteht ein wesentlicher Zusammenhang
Bezogen auf das Beispiel zur Berechnung des Chiquadratwertes
hinsichtlich der Lesegewohnheiten (Krimi/Romane/SciFi) und
dem Geschlecht ergibt sich folgender Kontingenzkoeffizient:
50
C=
8,333
300  8,333
= 0,1644
Wie auf Grund des durchgeführten Chiquadrattests ersichtlich war
gibt es einen signifikanten Unterschied zwischen Männer und
Frauen in Bezug auf ihre Lesegewohnheiten; der Zusammenhang
zwischen den beiden Variablen ist jedoch mit 0,1644 als eher
gering zu bezeichnend, obwohl signifikant.
Das Statistikpaket SPSS liefert folgenden Output:
Symmetrische Maße
Wert
Nominal- bzgl.
Nominalmaß
Kontingenzkoeffizient
Anzahl der gültigen Fälle
Näherungs weis e
Signifikanz
,164
,016
300
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Es kann festgestellt werden, daß zwischen der Variable
Geschlecht und der Variable Lesegwohnheiten ein signifikanter
Zusammen-hang besteht (Näherungsweise Signifikanz: sig=0.016;
daher wird H0 verworfen!); der Kontingenzkoeffizient in der Höhe
von 0,164 drückt die Stärke des Zusammenhangs aus.
51
 Rangkorrelationskoeffizient nach Spearman: (-1 bis +1)
Wenn man für ordinalskalierte Variable von den ursprünglichen xund y-Werten zu ihren Rängen übergeht, erhält man den Korrelationskoeffizienten nach Spearman. Dabei wird analog zum
Mann-Whitney U-Test den Werten der x Variable aber auch den
Werten der y Variable jeweils nach ihrer Ordnung ein Rangplatz
zugeordnet und man erhält nun für jede Beobachtung sogenannte
Messpaare.
Zu x1 ≤ ........ ≤xn, als bereits geordnete Werte gilt rg (xi)=i, und
zu y1 ≤ ........ ≤yn, als bereits geordnete Werte gilt rg (y i)=i;
Sowohl innerhalb der x-Werte wie auch der y-Werte können
identische Werte auftreten. Die Rangvergabe ist dann nicht
eindeutig, so werden wie bereits bei der Vorgehensweise beim
Mann-Whitney U-Test Durchschnittsränge berechnet.
Die Berechnung des Korrelationskoeffizienten nach Spearman
erfolgt über folgende allgemeine Formel:
6 d
rSP= 1 -  ;
2
i
(n 2  1)n
da jedoch häufig sogenannte Bindungen auftreten und daher eine
diesbezügliche Korrektur angewendet werden muß (nach
Bindungen korrigiert = corrected for ties), findet folgende
korrigierte Formel ihre Anwendung:
6 d
rSP corr. = 1 ;
2
i
(n 2  1)n  (T x´  T y´ )
wobei: di sind die Rangdifferenzen und n der Stichprobenumfang.
52
Tx´ = 12  (t
3
xi´
 t x´ )
i
; dadurch wird die Häufigkeit des Auftretens der
gleichen Bewertungen berücksichtigt.
Analog dazu wird Ty´ berechnet.
Gegeben sind zwei Variable:
x....Beurteilung der Nebenjobmöglichkeiten
y....Beurteilung der eigenen finanziellen Situation
Die beiden Hypothesen lauten:
H0: Zwischen der Beurteilung der Nebenjobmöglichkeiten und der
Beurteilung der eigenen finanz. Situation besteht kein Zusammenhang.
H1: Zwischen den beiden Variablen besteht ein Zusammenhang.
X
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
Berechnung der Rangziffern Rg(xi)
1+2+3+4+5+6+7+8+9+10=55/10=5,5
11+12+13+14+15=65/5=13
16+17+18+19+20+21+22+23+24+25=
= 205/10=20,5
Y
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
1
2
2
2
3
3
3
3
3
3
Rg (yi)
Rg (1) = 4
Rg(2) = 12,5
Rg(3) = 21,5
Berechnung der Rangdifferenzen (d)
5,5 – 4= 1,5
5,5 – 4= 1,5
5,5 – 4= 1,5
5,5 - 4 = 1,5
5,5 – 4= 1,5
5,5, - 4 = 1,5
5,5 - 12,5 = 7
5,5 - 12,5 = 7
5,5 - 12,5 = 7
5,5 - 12,5 = 7
13 – 12,5= 0,5
13 – 12,5= 0,5
13 – 12,5 = 0,5
13 – 21,5= 8,5
13 – 21,5 = 8,5
20,5 – 4 = 16,5
20,5 – 12,5= 8
20,5 – 12,5= 8
20,5 – 12,5= 8
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
20,5 – 21,5 = 1
Summe
d2
2,25
2,25
2,25
2,25
2,25
2,25
49
49
49
49
0,25
0,25
0,25
72,25
72,25
272,25
64
64
64
1
1
1
1
1
1
825
53
Tx´ = 12  (t
3
xi´
 t x´ )
i
=½*[(103-10)+(53-5)+(103-10)] = 1050
Ty´ = ½*[(73-7)+(103-10)+(83-8)] = 915
6 * 825
rSP corr. = 1 -
(25  1)25  (1050  915 )
2
=1-
4950
113635
= + 0,6369
Der Zusammenhang zwischen der Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der eigenen finanziellen
Situation ist ein positiver Zusammenhang. Ob dieser Zusammenhang signifikant ist oder nicht kann über die z-Transformation mit
anschließender Berechnung der Irrtumswahrscheinlichkeit
(=Signifikanzniveau) geklärt werden:
z=ż*
n 3 ,
wobei ż als Korrelationsziffer bezeichnet wird und wie folgt zu
berechnen ist:
ż = ½*ln( 1  r ) = ½ * ln
1  0,6369
1  0,6369
daraus folgt:
z = ż * n  3 = 0,753*
25  3
1 r
= 0,753
= 3,532
Das Signifikanzniveau errechnet sich aus:
z
2
x
1
1
2

e
2
d x  0.001229270561
z
54
Da das Signifikanzniveau ≤0,05, nämlich exakt 0,00123 ist, kann
die H0 verworfen werden und man kann behaupten, dass der Zusammenhang zwischen der Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der eigenen finanziellen Situation statistisch signifikant ist. Die Stärke des Zusammenhang ist +0,637.
Das heißt: je besser die Nebenjobmöglichkeiten beurteilt werden,
desto besser wird auch die persönliche finanzielle Situation
beurteilt.
Das Statistikpaket SPSS liefert folgenden Output:
Korrelationen
Spearman-Rho
Beurteilung der
Nebenjobmöglichkeiten
Beurteilung der eigenen
finaziellen Situation
Korrelationskoeffizient
Sig. (2-seitig)
N
Korrelationskoeffizient
Sig. (2-seitig)
N
Beurteilung
Beurteilung
der
der eigenen
Nebenjobmö
finaziellen
glichkeiten
Situation
1,000
,637**
,
,001
25
25
,637**
1,000
,001
,
25
25
**. Korrelation ist auf dem Niveau von 0,01 signifikant (2-s eitig).
Es kann festgestellt werden, daß zwischen der Variable
Beurteilung der Nebenjobmöglichkeiten und der Beurteilung der
eigenen finanziellen Situation ein signifikanter Zusammenhang
besteht (Näherungsweise Signifikanz: sig=0.001; daher wird H0
verworfen!); der Korrelationskoeffizient in der Höhe von +0,637
drückt die Stärke des Zusammenhangs aus.
55
 Korrelationskoeffizient nach Pearson (-1 bis +1)
Der Bravais-Pearson´sche Korrelationskoeffizient ist prinzipiell
nur für metrische Variable geeignet; diese sollten zudem normalverteilt sein. Ist diese Voraussetzung nicht gegeben so ist der
Korrelationskoeffizient nach Spearman anzuwenden.
Zur Berechnung des Korrelationskoeffizienten nach Pearson
werden jeweils zwei metrische Variable einer Person erfasst und
als sogenannte Wertepaare dargestellt. Zu jedem x1 ,......., xn, gibt
es ein entsprechendes y1 ,.....,.yn;
Der Zusammenhang zwischen den beiden metrischen Variablen
kann, wie bereits beim Korrelationskoeffizient nach Spearman
poisitiv (~+1), negativ (~ -1) bzw. annähernd Null sein.
Im vorliegenden Beispiel wird der Zusammenhang bzw. die
Stärke des Zusammenhangs zwischen dem Einkommen (x) und
den Ausgaben für Geschenke (y) berechnet.
Die beiden Hypothesen lauten:
H0: Zwischen dem Einkommen und den Ausgaben für Geschenke besteht
kein Zusammenhang.
H1: Zwischen den beiden Variablen besteht ein Zusammenhang.
Die Berechnung des Korrelationskoeffizienten nach Pearson
erfolgt nach:
n
rP =
 [( x
i
 x ) * ( y i  y )]
i 1
n
 (x
i 1
n
i
 x) 2 *
 (y
i
 y) 2
i 1
56
( xi  x ) 2
67600,00
44100,00
25600,00
3600,00
100,00
100,00
100,00
57600,00
19600,00
115600,0
Su=334000
[( xi  x ) * ( y i  y )]
EK (x)
AUSG (y)
1000,00
75,00
7540,00
1050,00
80,00
5040,00
1100,00
85,00
3040,00
1200,00
90,00
840,00
1250,00
100,00
40,00
1250,00
110,00
-60,00
1250,00
110,00
-60,00
1500,00
130,00
6240,00
1400,00
120,00
2240,00
1600,00
140,00
12240,00
Mittelwert(x)=1260 Mittelwert(y)=104 Summe=37100
rP =
37100
( yi  y) 2
841,00
576,00
361,00
196,00
16,00
36,00
36,00
676,00
256,00
1296,00
Su=4290
= +0,98
334000 * 4290
Der Zusammenhang zwischen dem Einkommen
und den
Ausgaben für Geschenke ist stark positiv und beträgt +0,98. Das
heißt: je mehr jemand verdient, desto mehr ist er auch bereit für
Geschenke auszugeben.
Das Statistikpaket SPSS liefert folgenden Output:
Korrelationen
EK
AUSG
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
Korrelation nach Pearson
Signifikanz (2-s eitig)
N
EK
1,000
,
10
,980**
,000
10
AUSG
,980**
,000
10
1,000
,
10
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig)
signifikant.
Es kann festgestellt werden, daß zwischen der Variable
Einkommen und den Ausgaben für Geschenke ein signifikanter
Zusammenhang besteht (Näherungsweise Signifikanz: sig=0.000;
daher wird H0 verworfen!); der Korrelationskoeffizient in der
Höhe von +0,98 drückt die Stärke des Zusammenhangs aus.
57
Ein-Stichproben-Tests
Beim Ein-Stichproben-Fall ist die Verteilung eines Untersuchungsmerkmals, z.B. Mietpreise pro m2, oder Längen bzw.
Durchmesser (im Bereich der Qualitätskontrolle) von Interesse.
Ausgehend von einer einfachen Stichprobe vom Umfang n sollen
nun bestimmte Eigenschaften dieses Merkmals mit Hilfe
statistischer Tests untersucht werden. Hypothesen über die
Eigenschaften des Untersuchungsmerkmals können die gesamte
Verteilung oder aber nur bestimmte Kennwerte der Verteilung,
wie z.B. Erwartungswert, Median oder Varianz betreffen.
Ziel ist es also, die Eigenschaften einer zufallsvariable X zu
untersuchen, unter der Voraussetzung, dass X1,.....Xn unabhängige
Wieder-holungen dieser Zufallsvariable sind.
Zwei bekannte Varianten für Ein-Stichproben-Tests sind der
Gauß-Test und der t-Test.
58
 Gauß-Test (Z-Test)
Beim Gauß-Test wird vorausgesetzt, dass die zugrundeliegende
Zufallsvariable X normalverteilt ist mit bekanntem Mittelwert und
Varianz bzw. Standardabweichung der Grundgesamtheit. In
diesem Fall soll geklärt werden, ob eine Stichprobe sich von
einem bekannten Mittelwert signifikant unterscheidet; dies unter
der Voraussetzung, dass die Standardabweichung bekannt ist.
Die entsprechenden Hypothesen lauten:
H0: μ = μ0, bzw. μ- μ0=0;
das heißt der Mittelwert der Grundgesamtheit μ weicht nicht vom
erwünschten Sollwert μ0 ab.
H1: μ ≠ μ0, bzw. μ- μ0≠0
Die Teststatistik lautet:
z=
x  0

* n
Ist Z ≥ 1,96 so wird H0 verworfen.
(Annahme: 5% Irrtumswahrscheinlichkeit)
59
Beispiel:
Gegeben sind ein Sollmittelwert oder Mittelwert einer
Grundgesamtheit, die Standardabweichung und ein Mittelwert der
im Rahmen einer Qualitätskontrolle erhoben wurde. Es stellt sich
nun die Frage ob der empirische Mittelwert vom Sollmittelwert
signifikant abweicht oder nicht.
H0: μ = μ0, d.h.: die Mittelwerte sind in etwa gleich
H1: μ ≠ μ0, d.h.: die Mittelwerte sind signifikant voneinander
verschieden.
μ0 = 25; σ= 6, n= 36 und x =23,2
z=
x  0

* n
=
23,2  25
* 36
6
= -1,80
Da z = -1,80<|1,96| wird die Nullhypothese angenommen, d.h. die
beiden Mittelwerte sind in etwa gleich. Der empirisch beobachtete
Mittelwert weicht nicht vom Sollwert ab.
60
 t-Test
Beim t-Test ist die Standardabweichung in der Grundgesamtheit
nicht bekannt, daher behilft man sich beim t-Test mit der
Stichprobenvarianz und bezeichnet S als die entsprechende
Standardabweichung.
T=
x  0
* n
s
Da T eine bekannte und tabellierte Verteilung, nämlich eine t-Verteilung mit n-1 Freiheitsgraden besitzt kann der entsprechende
Grenz- bzw. "Schwell"-wert einer entsprechenden Tabelle
entnommen werden. Analog zum Gauß-Test wird H0 abgelehnt,
wenn |T| > t1-α/2 (n-1).
Die beiden Hypothesen lauten ebenso in Analogie zum GaußTest:
H0: μ = μ0, bzw. μ- μ0=0;
das heißt der Mittelwert der Grundgesamtheit μ weicht nicht vom
erwünschten Sollwert μ0 ab.
H1: μ ≠ μ0, bzw. μ- μ0≠0
61
Beispiel:
Gegeben sind folgende 10 Beobachtungen einer Stichprobe über
die Einkommenssituation in einer Gemeinde.
Einkommen von 10 befragten Personen:
1000,00
1050,00
1100,00
1200,00
1250,00
1250,00
1250,00
1500,00
1400,00
1600,00
Laut amtlicher Statistik beträgt das durchschnittliche Einkommen
1.300,--€. Es soll nun festgestellt werden ob das durchschnittliche
Einkommen der 10 befragten Personen vom amtlichen Durchschnittseinkommen abweicht oder nicht.
Die Teststatistik T errechnet sich aus:
T=
x  0
* n
s
=
1260  1300
* 10
192 ,64
= -0,657
62
Der tabellierte "kritische" T-Wert beträgt bei n-1=9 Freiheitsgraden und 1-α/2 = 0,975 in der Tabelle T = 2,262.
Da |T| = 0,657 < als der tabellierte Wert T = 2,262 , kann H0
beibehalten werden. Es besteht also kein signifikanter Unterschied
zwischen dem beobachteten Durchschnitteinkommen und dem
amtlichen Durchschnittseinkommen.
Das Statistikpaket SPSS liefert folgenden Output:
Statistik bei e iner Stichprobe
N
EK
10
Mittelwert
1260,0000
St andardabweic hung
192,6424
St andardfehler des Mitt elwertes
60,9189
Test bei einer Sichprobe
Testwert = 1300
EK
T
-,657
df
9
Sig. (2-seitig)
,528
Mittlere
Differenz
-40,0000
95% Konfidenzintervall
der Differenz
Untere
Obere
-177,8081
97,8081
Da das Signifikanzniveau = 0,528 > als =0,05 (die vorgegebene
Irrtumswahrscheinlichkeit) ist, wird H0 beibehalten.
63
 Chiquadrat-Anpassungstest
Möchte man untersuchen, ob eine tatsächliche Verteilung einer
vorgegebenen Verteilung entspricht, d.h. ob die Daten dieser
Verteilung hinreichend angepasst sind, dann verwendet man einen
Anpassungs- bzw. Goodness-of-fit-Test.
Die Vorgangsweise ist folgende:
- Aufstellung der Nullhypothese: unsere erwartete Verteilung ist
eine .........Verteilung
- Bestimmung der beobachteten absoluten Häufigkeiten (o)
- Bestimmung der erwarteten absoluten Häufigkeiten (e)
- Berechnung der Prüfgröße
n
2  
i 1
(O  E ) 2
E
Diese Prüfgröße ist annähernd chiquadratverteilt mit m-1
Freiheitsgraden.
- Bestimmung des kritischen Wertes durch Nachschlagen in der
Tabelle der Chiquadratverteilung für m-1 Freiheitsgrade und
dem gewünschten α-Wert der Irrtumswahrscheinlichkeit.
Wie aus der obigen Vorgangsweise ersichtlich basiert der
Chiquadrat-Anpassungstest auf dem Vergleich der beobachteten
Häufigkeiten mit den theoretisch zu erwartenden Häufigkeiten.
Die zu erwartende Verteilung kann eine Gleichverteilung ( wie
z.B. beim "fairen"Würfel), aber auch jede vorgegebene Verteilung
sein (z.B. auch Verhältnisse,....).
64
Beispiel:
Zur Prüfung, ob ein Würfel "fair" bzw. unverzerrt ist, wird dieser
z.B. 60 mal geworfen; man erwartet sich dabei eine Gleichverteilung jeder einzelnen Augenzahl. Das Ergebnis des 60maligen Würfeln ist folgendes:
Augenzahl Beob.Häufigk. Erwart.Häufigk.
(o-e)
(o-e)2
( o  e) 2
e
1
8
10
-2
4
0,4
2
7
10
-3
9
0,9
3
14
10
4
16
1,6
4
11
10
1
1
0,1
5
8
10
-2
4
0,4
6
12
10
2
4
0,4
Σ=3,8
Der tabellierte Chiquadratwert für 6-1 (m-1) Freiheitsgrade und
eine Irrtumswahrscheinlichkeit von 5% beträgt 11,07.
Da 2err = 3,8 < 2tab =11,07 kann unsere Nullhypothese, es handelt sich
um einen idealen – "fairen" – Würfel, nicht verworfen werden. Mit 95%iger Sicherheit sind die Abweichungen rein zufällig.
65
Das Statistikpaket SPSS liefert folgenden Output:
Augenzahl
1,00
2,00
3,00
4,00
5,00
6,00
Gesamt
Beobachtetes N
8
7
14
11
8
12
60
Erwartete Anzahl
10,0
10,0
10,0
10,0
10,0
10,0
Residuum
-2,0
-3,0
4,0
1,0
-2,0
2,0
Statistik für Te st
Chi-Quadrata
df
As ymptotis che Signifikanz
Augenzahl
3,800
5
,579
a. Bei 0 Zellen (,0%) werden weniger
als 5 Häufigkeit en erwartet.
Da das Signifikanzniveau = 0,579 > als =0,05 (die vorgegebene
Irrtumswahrscheinlichkeit) ist, wird H0 beibehalten; d.h. der
Würfel liefert eine annähernde Gleichverteilung, ist als "fair".
66
Grafische Darstellungen von Verteilungen
 Boxplot
1600,00
ek
1400,00
1200,00
1000,00
Die Fünf-Punkte Zusammenfassung einer metrischen Verteilung
führt zur komprimierten Visualisierung einer Verteilung durch
den Box-Ploz. Es lässt sich schnell ein Eindruck darüber
gewinnen, ob die Beobachtungen z.B. annähernd symmetrisch
sind, oder ob Ausreißer in dem Datensatz auftreten.
Der Box-Plot besteht aus:
- x0,25 = Anfang der Schachtel ("box")
- x0,75 = Ende der Schachtel
- Der Median wird durch einen Punkt oder eine Linie in der Box
markiert
- Zwei Linien "whiskers" außerhalb der Box gehen bis zu xmin
und xmax,
67
Der modifizierte Box-Plot berücksichtigt etwaige Ausreißer, die
unterhalb bzw. überhalb der bestimmter Grenzen liegen, quasi
außerhalb der Zäune (zu und zo) sich befinden.
Zur Berechnung der Zäune benötigt man den Interquartilsabstand:
(dQ = x0,75 - x0,25 )
Die oberen und unteren Grenzen für Ausreißer errechnen sich aus:
zu = x0,25 – 1,5* dQ
zo = x0,75 + 1,5* dQ
Auf diese Weise werden die sogenannten Ausreißer, außerhalb der
Zäune im Box-Plot markiert.
68
weitere grafische Darstellungsmöglichkeiten:
Ballbesuch Ballsaison 02/03
4,2
ja
nein
vielleicht
32,8
63,0
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
Ballbesuch Ballsaison 02/03
vielleicht
4,2%
ja
32,8%
nein
63,0%
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
Ballbesuch Ballsaison 02/03
vielleicht
4,2%
ja
32,8%
nein
63,0%
IMAD-Jännermonitor, n=500 tirolweit, Schwankungsbreite: max +- 4,5%
69
Ballbesuch Ballsaison 02/03
Vielleicht
4,2%
Ja
32,8%
Nein
63,0%
70
WAHRSCHEINLICHKEITSRECHNUNG
Grundlagen
Nachfolgend sollen statistische Methoden zur Beurteilung von
Zähl- und Meßergebnissen erarbeitet werden. Dabei sind
sogenannte Zufallsvorgänge zu erfassen.
Diese sind dadurch gekennzeichnet, daß bei ihrer Durchführung
das Ergebnis nur in gewissen Grenzen voraussagbar ist. Zur
Erfassung dieser Zufallsvorgänge bedient man sich der
mathematischen Methoden der Wahrscheinlichkeitsrechnung.
Beispiele für Zufallsvorgänge: Wartezeit, Reparaturdauer,
Ausfall einer Maschine, Ausschußstücke in einer
Tagesproduktion, Werfen eines Würfels
Die Ergebnisse der Zufallsvorgänge werden Ereignisse genannt.
Ereignisse werden mit Großbuchstaben A,B,....bezeichnet.
Beispiel 1: Zufallsvorgang: Werfen eines Würfels
Ereignisse: A . . . Werfen einer 6
B . . . Werfen einer geraden Zahl
Beispiel 2: Zufallsvorgang: Überprüfung einer Tagesproduktion
Ereignisse: A . . . Das zehnte Stück wurde zufällig ausgewählt.
B . . . Ein zufällig gewähltes Stück ist defekt.
C . . . Von 100 überprüften Stücken sind weniger als
drei defekt.
Beispiel 3: Zufallsvorgang: Auswahl von Personen aus dem
Wählerverzeichnis
Ereignisse: A . . . Frau Eva Adam wurde zufällig ausgewählt
B . . . Eine weibliche Person wurde ausgewählt
71
Der empirische Wahrscheinlichkeitsbegriff:
Was ist die Wahrscheinlichkeit eines Ereignisses A ?
Ein Experiment soll das näher erklären:
Ein Würfel wird wiederholt geworfen. Es wird dabei notiert, wie
oft das Ereignis“Würfeln ener 6” aufgetreten ist. Weiters notieren
wir zunächst für 50 Würfe den Anteil der Sechser. Schrittweise
wird die Anzahl der Würfe erhöht und notiert und der Anteil der
Sechser in der gewürfelten Serie erfasst. Diesen Anteil erhalten
wir, wenn wir die Zahl der Sechser durch die Zahl der Würfe
dividieren. In der Wahrscheinlichkeitsrechnung bezeichnet man
diesen Anteil auch als relative Häufigkeit.
Anzahl der Würfe Anzahl der Sechser Anteil der Sechser
(relative Häufigkeit)
50
9
0,1800
100
20
0,2000
200
37
0,1850
500
88
0,1760
1.000
164
0,1640
10.000
1.643
0,1643
100.000
16.616
0,1662
Bei steigender Anzahl der Würfe nähert sich die relative
Häufigkeit immer mehr dem Wert 1/6. Es ist auch plausibel, daß
sich auch für jede andere Zahl zwischen 1 und 5 annähernd dieser
Wert ergeben hätte. Die Ursache liegt daran, daß durch die
physikalischen Eigenschaften eines unverfälschten Würfels, jede
Zahl dieselbe Chance hat, gewürfelt zu werden.
72
Wir einigen uns daher für das Ereignis A aus Beispiel 1 (A =
”Werfen einer 6”) die Wahrscheinlichkeit mit 1/6 festzusetzen.
Genau so werden wir für alle anderen möglichen Ergebnisse, die
beim Würfeln auftreten können die Wahrscheinlichkeit mit 1/6
festzulegen.
Es ist auch nicht schwer einzusehen, daß es vernünftig ist, für das
Ereignis B aus Beispiel 1 (“Würfeln einer geraden Zahl”), die
Wahrscheinlichkeit 1/2 zuzuordnen.
Wahrscheinlichkeitsräume mit Gleichverteilung:
In den angeführten Beispielen liegt eine Situation vor, die als
endlicher Wahrscheinlichkeitsraum mit Gleichverteilung
bezeichnet wird. Man geht dabei von folgenden Voraussetzungen
aus:
1. Bei einer Ausführung eines Zufallsvorganges kommen endlich
viele Ergebnisse vor.
2. Jedes Ergebnis hat die gleiche Chance einzutreten.
Die Menge aller möglichen Ergebnisse bezeichnen wir mit  .
Die Teilmengen von  bezeichnen wir als Ereignisse.
Die einzelnen möglichen Ergebnisse bezeichnen wir als
Elementarereignisse. Man bezeichnet sie üblicherweise mit
Kleinbuchstaben.  selbst wird als sicheres Ereignis bezeichnet.
Die leere Menge wird als unmögliches Ereignis bezeichnet.
Haben zwei Ereignisse A und B kein Element gemeinsam, ist also
ihr Durchschnitt leer, so sagt man, die Ereignisse seien
unvereinbar. Die Anzahl der Elemente in einer Teilmenge
bezeichnen wir mit A .
73
Die Wahrscheinlichkeit P(A) für ein Ereignis A   definieren wir
durch
P(A) =
Anzahl der Elemente von A A
=
Anzahl der Elemente von  
Manche Autoren schreiben auch W(A) an Stelle von P(A).
Oft findet man auch folgende Formulierung:
P(A) =
Anzahl der günstigen Fälle
Anzahl der möglichen Fälle
Als “günstig” werden jene Fälle bezeichnet, bei denen das
Ereignis eintritt. Dies muß nicht unbedingt ein günstiges Ereignis
sein. Zum Beispiel werden Sie wohl beim Beispiel 2 das Ereignis
B (“defekt”) nicht als günstig empfinden. Gemeint ist eben die
Anzahl der “für das Ereignis” günstigen Fälle. Diese Bezeichnung
erklärt sich aus der Tatsache, daß die Wahrscheinlichkeitsrechnung im vorigen Jahrhundert vor allem in Frankreich zur
Berechnung der Gewinnchancen bei Glücksspielen entwickelt
wurde.
Diese Begriffe sollen mit folgenden Bsp. verdeutlicht werden:
Zu Beispiel 1:  = {1, 2, 3, 4, 5, 6}
A = {6}
B = {2, 4, 6}
Zu Beispiel 2:
 =6
A =1
B =3
 = Menge aller produzierten Stücke
A = Das zehnte Stück
B = Die Menge der defekten Stücke
Zu Beispiel 3:
 = Menge aller Wahlberechtigten
A = Frau Eva Adam
B = Menge der wahlberechtigten Frauen
P(  ) = 6/6 = 1
P(A) = 1/6
P(B) = 3/6 = 1/2
 = 1.000
P(  ) = 1000/1000 = 1
A =1
P(A) = 1/1000
B = 20
P(B) = 20/1000 = 2/100
 = 8.000
P(  ) = 8000/8000 = 1
A =1
P(A) = 1/8000
B = 4.200
P(B) = 4200/8000 = 21/40
74
Die wichtigsten Gesetze für das Rechnen mit Wahrscheinlichkeiten:
Auf Grund der bisherigen Erfahrungen ist man in der Lage, die
wichtigsten Gesetze der Wahrscheinlichkeitsrechnung herzuleiten.
Man beachte, daß es ja nur darum geht, die Anzahl von Elementen
in bestimmten Mengen zu bestimmen (“günstige Ereignisse”) und
diese Zahl durch die Anzahl der Individuen in der
Grundgesamtheit zu dividieren.
Regel 1:
Das sichere Ereignis  hat die Wahrscheinlichkeit 1.
P(  ) = 1
Das unmögliche Ereignis

hat die Wahrscheinlichkeit 0.
P(  ) = 0
Regel 2 (Additionssatz für unvereinbare Ereignisse):
Sind zwei Ereignisse A und B unvereinbar, gilt also A  B   , so
ist die Wahrscheinlichkeit, daß zumindest eines der Ereignisse A
oder B eintritt gleich P(A) + P(B).
Falls A  B =
 , so gilt P(A  B) = P(A) + P(B)
Regel 3:
Die Wahrscheinlichkeit eines Ereignisses ist immer eine Zahl
zwischen 0 und 1.
0
 P(A)  1
75
Regel 4 (Additionssatz für beliebige Ereignisse):
Für zwei beliebige Ereignisse A und B ist die Wahrscheinlichkeit,
daß zumindest eines der Ereignisse A oder B eintritt gleich der
Summe der Wahrscheinlichkeiten P(A) + P(B) vermindert um die
Wahrscheinlichkeit des Durchschnittes P(A  B).
P(A  B) = P(A) + P(B)- P(A  B)
Von der Summe der Wahrscheinlichkeiten P(A) und P(B) ist die
Wahrscheinlichkeit des Ereignisses P(A  B) abzuziehen, weil
sonst jene Elemente die sowohl zu A als auch zu B gehören
doppelt gezählt würden.
In diesem Zusammenhang nennt man A  B auch das Ereignis “ A
oder B” und A  B auch das Ereignis “A und B”.
Regel 5 (Monotoniesatz):
Aus A 
B folgt P(A)  P(B).
Regel 6 (Berechnung der Gegenwahrscheinlichkeit):
Ist A ein Ereignis, so wollen wir mit A jene Menge bezeichnen,
welche aus allen Elementen besteht, welche zu  aber nicht zu A
gehören ( A ist also das mengentheoretische Komplement von A).
P( A ) bezeichnet man auch als Gegenwahrscheinlichkeit von P(A).
Es gilt :
P( A ) = 1- P(A)
sowie
P(A) = 1- P( A )
76
Diese Regel wird verwendet, wenn man zum Beispiel A
berechnen will, aber die Berechnung von A einfacher ist.
Ein Betreiber einer Würfelbude, mit der er auf Jahrmärkten
auftritt ist dabei, ein neues Spiel zu kreieren. Dabei interessiert ihn
folgende Fragestellung:
Es wird mit zwei Würfeln gleichzeitig gewürfelt. Wie groß ist die
Wahrscheinlichkeit, daß die Summe der gewürfelten Augenzahlen
kleiner als 11 ist ?
Es gibt 36 verschiedene Möglichkeiten, die alle gleich
wahrscheinlich sind. Wir stellen diese als Zahlenpaare (Augenzahl
1. Würfel, Augenzahl 2. Würfel) dar:
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)
(1,3)
(2,3)
(3,3)
(4,4)
(5,3)
(6,3)
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
Jedes dieser Elementarereignisse tritt mit Wahrscheinlichkeit 1/36
ein.
Ist A das Ereignis “Ziffernsumme kleiner als 11”, so ist A das
Ereignis “Ziffernsumme 11 oder 12”.
Es gilt also A = {(5,6), (6,5), (6,6)}. Daraus folgt P( A ) = 3/36 =
1/12 und daher gilt P(A) = 1- P( A ) = 1-1/12 = 11/12.
77
Bedingte Wahrscheinlichkeit:
Wie groß die Wahrscheinlichkeit ist, daß eine Frau ein
Einkommen von über 10.000 hat, wenn folgende Eckdaten
bekannt sind:
 = 4.000
A = 2.000

“Einwohner der Stadt”
A
“Einkommen über 10.000”
B
“Eine Person ist weiblich”
AB
“Frau mit Einkommen über 10.000”
B = 2.100
A  B = 900
Die Wahrscheinlichkeit, daß eine Frau in Einkommen von über
10.000 hat, bezeichnen wir mit P(A B ) und nennen dies die
Wahrscheinlichkeit von A unter der Bedingung B.
Daraus folgt
P(A B ) =
:
AB
B
(*)
Oft will man aber P(A B ) berechnen, wenn man die Anzahl A  B
und B nicht kennt, aber P(A  B ) und P(B) bekannt sind.
Dies ist durch einen einfachen Trick möglich. Man denke daran,
daß
P(A  B ) = A  B und P(B) = B gilt, so müssen wir nur den Bruch
in der Rechnung bei (*) erweitern und erhalten:
P(A B ) =
AB
B
=
AB 
B 
=
P(A  B)
.
P( B)
Setzt man die bekannten Eckdaten von oben ein, so erhält man
einerseits
900
P(A B ) = A B B = 2100
= 73
und andererseits
900 4000
P(A  B)
3
=
=
7
2100 4000
P( B)
.
78
Dieses Beispiel rechtfertigt die folgende Konvention:
Definition der bedingten Wahrscheinlichkeit:
Sind A und B Ereignisse und gilt P(B)  0, so definiert man die
Wahrscheinlichkeit von A unter der Bedingung B durch folgende
Formel:
P(A B ) =
P(A  B)
P( B)
Aus dieser Definition folgt unmittelbar eine Regel zur
Berechnung von P(A  B) :
Regel 7 (Multiplikationssatz für beliebige Ereignisse):
Für beliebige Ereignisse A und B gilt:
P(A  B) = P(A B )  P( B)
Ein Elektrohändler erhält eine Lieferung von 30 Fernsehgeräten,
von denen 4 defekt sind. Bei der ersten flüchtigen Überprüfung
wählt er zufällig zwei Geräte aus und testet sie. Wie groß ist die
Wahrscheinlichkeit, daß er dabei keines der defekten Geräte
auswählt?
Lösung: B ....... erstes Gerät nicht defekt
A ....... zweites Gerät nicht defekt
P(B) =
13
26
=
15
30
25
P(A B ) = 29
Wahrscheinlichkeit, daß keines der beiden Geräte defekt =
= P(A  B) = P(A B )  P( B) =
25 13

 0.75
29 15
79
Unabhängigkeit von Ereignissen:
Nehmen wir an, daß in einer Gemeinde genau 150 Mitglieder der
Bürgermeisterpartei beide Blätter (Kirchenblatt und
Gemeindeblatt) lesen. Dies sind genau 10% der Parteimitglieder.
Von der gesamten Bevölkerung (4000 Einwohner) lesen laut
Angabe ebenfalls 10% beide Blätter. Die Wahrscheinlichkeit, ob
jemand beide Zeitungen liest hängt also offensichtlich nicht von
der Parteizugehörigkeit ab.
A .......... Leser beider Zeitungen
B .......... Parteimitglied
Es gilt
P(A) = 1/10
P(B) = 1500/4000=3/8
P(A B ) = P(A).
In Zahlen gerechnet:
150
= 0.1
1500
400
P(A) =
= 0.1
4000
P(A B ) =
Dieses Beispiel motiviert folgende Konvention:
Definition der Unabhängigkeit von Ereignissen:
Zwei Ereignisse A und B heißen unabhängig, falls P(A B ) = P(A).
Ist B ein unmögliches Ereignis so sind alle Ereignisse davon unabhängig.
Unmittelbar aus dieser Definition folgt die nächste Regel:
Regel 7: (Multiplikationssatz für unabhängige Ereignisse):
Zwei Ereignisse A und B sind genau dann unabhängig, wenn
P(A  B) = P(A)  P (B)
gilt.
In obigem Beispiel ist die Wahrscheinlichkeit, daß jemand Leser
beider Zeitungen und Parteimitglied ist, gleich P(A  B) =
150/4000 = 3/80.
Andererseits gilt:
P(A)  P (B) = 101  83 = 803 = P(A  B)
80
Der allgemeine Wahrscheinlichkeitsbegriff:
Bisher ist man von einer Menge mit Gleichverteilung ausgegangen. In der Statistik entspricht dies einer Menge von Merkmalsträgern, zum Beispiel Personen oder produzierte Werkstücken. Die Gleichverteilung drückt aus, daß beim Ziehen einer
Stichprobe, jeder dieser Merkmalsträger dieselbe Chance hat,
gezogen zu werden. In der Praxis ist aber in erster Linie die
Verteilung Merkmalsausprägungen von Interesse. Dabei handelt
es sich in der Regel aber nicht um gleichverteilte Ausprägungen.
Beispiele:
Merkmalsträger : Einwohner einer Stadt
Merkmalsausprägung: Einkommen in Geldeinheiten
Merkmalsträger : Metallstäbe mit gewünschter Länge 1.000 mm
Merkmalsausprägung: tatsächliche Länge der Stäbe
Es ist hier in beiden Fällen offensichtlich, daß keine
Gleichverteilung auf der Menge der möglichen
Merkmalsausprägungen vorliegt.
Wir müssen den Begriff der Wahrscheinlichkeit daher auf diese
Situationen übertragen und unterscheiden:
81
- Diskrete endliche Wahrscheinlichkeitsräume:
Wir gehen wieder von einer endlichen Menge  aus. Diese Menge
wird zu einem Wahrscheinlichkeitsraum, indem man jeder
Teilmenge A von  (d.h. jedem Ereignis) eine Zahl P(A)
(Wahrscheinlichkeit des Ereignisses A) zuordnet.
Diese Zuordnung darf aber nicht beliebig erfolgen. Gewöhnlich
ergibt sie sich in natürlicher Weise aus der Problemstellung.
Wichtig ist aber, daß für die Wahrscheinlichkeiten alle
Rechenregeln aus 1.1 gelten. Die Mathematik zeigt, daß man sich
bei der Überprüfung dieser Tatsache auf die Regel 1, Regel 2 und
Regel 3 beschränken kann. Sind diese gültig, so folgen daraus die
anderen Regeln automatisch.
Wir definieren daher:
Ein endlicher, diskreter Wahrscheinlichkeitsraum ist eine
endliche Menge  , zusammen mit einer Abbildung, die
jeder Teilmenge A von  eine Zahl P(A) zuordnet, wobei
die folgenden Regeln gelten:
Regel 1: P(  ) = 1,
P(  ) = 0
Regel 2: Falls A  B =  , so gilt P(A  B) = P(A) + P(B)
Regel 3: 0  P(A)  1
82
In einer Untersuchung der Einkommensstruktur einer Großstadt
werden die Einkommen in vier Gruppen eingeteilt. Diese
Einteilung und der jeweilige Prozentsatz ist in folgender Tabelle
zusammengestellt:
Bezeichnung
Abkürzung
Bereich
geringfügig
niedrig
mittel
hoch
sehr hoch
g
n
m
h
s
0 bis 7.000
7.001 bis15.000
15.001 bis 30.000
30.001 bis 60.000
über 60.000
Prozentsatz der
Einwohner
15
20
40
15
10
Faßt man die Gruppen zu einer Menge  = {g, n, m, h, s}
zusammen, so sind darauf die Wahrscheinlichkeiten gegeben
durch
P(g) = 0.15 P(n) = 0.20 P(m) = 0.40 P(h) = 0.15 P(s) = 0.10
Bezeichnen wir zum Beispiel mit A das Ereignis “geringfügig oder niedrig”,
also A ={g, n}, so gilt P(A) = 0.35.
83
Die Binomialverteilung
(das wichtigste Beispiel für einen endlichen, diskreten
Wahrscheinlichkeitsraum):
Beispiel:
Es wird mit einem Würfel sechs mal gewürfelt. Wie groß ist die
Wahrscheinlichkeit, daß dabei die Zahl der gewürfelten Einser
zwei
b) drei
beträgt ?
a)
Lösung:
a) Zunächst überlegen wir, wie groß die Wahrscheinlichkeit ist, die
ersten beiden mal einen Einser und dann keinen mehr zu würfeln:
Antwort : P = (1/6) 2  ( 5/6) 4
Die Wahrscheinlichkeit, genau beim ersten und beim dritten
Versuch einen Einser zu würfeln ist
P = (1/6)  ( 5/6)  ( 1/6)  ( 5/6) 3 ,
also gilt auch in diesem Fall P = (1/6) 2  ( 5/6) 4 .
Wenn wir festlegen, bei welchen der 6 Versuche, die beiden
Einser kommen, ist also die Wahrscheinlichkeit durch P =
(1/6) 2  ( 5/6) 4 gegeben.
Wir bezeichnen mit
 6
  (“6
 2
über 2”) die Anzahl der Möglichkeiten,
die Versuche festzulegen, an denen die beiden Einser gewürfelt
werden. Es handelt sich dabei also um die Aufgabe, aus sechs
84
Plätzen zwei auszusuchen, wobei es nicht auf die Reihenfolge
beim Aussuchen ankommt. Zunächst gibt es 6 Möglichkeiten, den
ersten Platz auszusuchen. Zu jeder von diesen gibt es wieder 5
Möglichkeiten für den zweiten Platz. Es sind aber nun alle
Möglichkeiten doppelt gezählt worden, weil eine Vertauschung
unter den ausgesuchten Plätzen zu keinem neuen Resultat führt.
Tabelle ohne Berücksichtigung der Vertauschungen:
(1,2)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
(1,3)
(2,3)
(3,2)
(4,2)
(5,2)
(6,2)
(1,4)
(2,4)
(3,4)
(4,3)
(5,3)
(6,3)
(1,5)
(2,5)
(3,5)
(4,5)
(5,4)
(6,4)
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,5)
6  5 = 30 Möglichkeiten
Tabelle mit Berücksichtigung der Vertauschungen:
(1,2) (1,3) (1,4) (1,5) (1,6)
(2,3) (2,4) (2,5) (2,6)
(3,4) (3,5) (3,6)
(4,5) (4,6)
(5,6)
Also gilt
 6
 
 2
(6  5 )/2 = 15 Möglichkeiten
= 15.
Es folgt daraus:
P(2 Einser bei 6 Versuchen) =
= (1/6) 2  ( 5/6) 4
 6
  =
 2
(1/6) 2  ( 5/6) 4
15  0.2009
85
b) Stehen die 3 Versuche schon fest, bei denen der Einser
gewürfelt wird, so gilt P = (1/6) 3  ( 5/6) 3 .
Wir bezeichnen mit
 6
 
 3
(“6 über 3”) die Anzahl der Möglichkeiten,
die Versuche festzulegen, an denen die beiden Einser gewürfelt
werden. Es handelt sich dabei also um die Aufgabe, aus sechs
Plätzen drei auszusuchen, wobei es nicht auf die Reihenfolge
beim Aussuchen ankommt. Zunächst gibt es 6 Möglichkeiten, den
ersten Platz auszusuchen. Zu jeder von diesen gibt es wieder 5
Möglichkeiten für den zweiten Platz. Dann wiederum 4
Möglichkeiten für den dritten Platz. Es ist nun aber noch durch die
Anzahl der Vertauschungen (Permutationen) zu dividieren, die bei
den drei gewählten Plätzen möglich sind.
Es gibt genau 3 *2 *1 = 6 Fälle drei verschiedene Objekte
untereinander zu Vertauschen:
3 Möglichkeiten, für Platz von Objekt 1
2 Möglichkeiten, für Platz von Objekt 2
1 Möglichkeit, für Platz von Objekt 3
Beispiel: (1,3,6) (1,6,3) (3,1,6) (6,1,3) (3,6,1) (6,3,1)
Die Ziffern 1, 3, 6 bedeuten dabei die Versuche bei denen ein
Einser gewürfelt wird.
Es gilt also
 6
 =
 3
(6  5  4 )/(3  2  1) = 20
Daraus folgt :
P(3 Einser bei 6 Versuchen) =
 6
= (1/6) 3  ( 5/6) 3   3 = (1/6) 3  ( 5/6) 3  20  0.05358
Sie können sich vorstellen, daß diese Aufgabe mit wachsender
Anzahl der Würfe immer komplizierter wird.
86
Allgemeine Formulierung der Binomialverteilung:
Allgemein läßt sich die Aufgabe folgendermaßen formulieren:
Ein Zufallsexperiment wird n mal hintereinander durchgeführt,
wobei zwei Ausgänge e (Erfolg) und m (Mißerfolg) möglich sind.
Dabei ist P(e) = p die Wahrscheinlichkeit für das Ereignis e.
Man bestimme für jede der Zahlen k= 0, 1, 2,...,n die Wahrscheinlichkeit, daß genau k mal Erfolg eintritt. Man erhält
dadurch eine Verteilung auf der Menge {0,1,2,..n}. Diese
Verteilung wird als Binomialverteilung (mit Parametern n und p)
bezeichnet. Man schreibt für P(k) dann auch B(k;n,p) oder
B f (k;n,p)
Wie in obigem Beispiel sieht man folgende Formel für diese
Verteilung vor:
B(k;n,p) = p
k
 n
 ( 1-p) n  k   
 k
oder
B(k;n,p) = p
Es ist also
 n
 =
 k
k
 ( 1-p) n  k 
n  ( n  1)...( n  k  1)
k  ( k  1)...2  1
n  ( n  1)...( n  k  1)
k  ( k  1)...2  1
Für k=0 trifft man dabei die Konvention
 n
 =
 0
1.
Beispiel:
In einer Urne befinden sich 10 rote und 20 weiße Kugeln. Es werden 15 Kugeln
gezogen, eine gezogene Kugel wird dabei zurückgelegt und die Urne wird vor der
Ziehung der nächsten Kugel neu gemischt.
Wie groß ist die Wahrscheinlichkeit, daß genau 8 rote Kugeln gezogen werden ?
Wie groß ist die Wahrscheinlichkeit, daß genau 8 weiße Kugeln gezogen werden?
87
Hypergeometrische Verteilung
(Ziehen mit und ohne Zurücklegen):
Allgemeine Formulierung:
Es wird von einer Grundgesamtheit von N Elementen eine
Zufallsstichprobe vom Umfang n ohne Zurücklegen gezogen. Von
den N Elementen der Grundgesamtheit besitzen genau M ein
bestimmtes Merkmal. Die Wahrscheinlichkeit, daß dabei genau k
der gezogen Elemente diese Eigenschaft besitzen bezeichnen wir
mit H(k; N, n, M) beziehungsweise mit f H (k; N, n, M).
Es gilt dann
 M  N  M
  

k  n  k 
H(k; N, n, M) = f H (k; N, n, M) =
 N
 
n 
In unserem Beispiel ist
N = 30
M=4
n = 10
k =3
Anzahl aller Geräte
Anzahl der defekten Geräte
Anzahl der überprüften Geräte
Anzahl der überprüften defekten Geräte
Diese Verteilung wird als Hypergeometrische Verteilung mit den
Parametern N, n und M bezeichnet.
Wie schon erwähnt wird in den meisten Fällen diese Verteilung
durch die Binomialverteilung (oder später durch die Normalverteilung) ersetzt, falls das Verhältnis zwischen der Anzahl der
Elemente in der Grundgesamtheit N und dem Stichprobenumfang
n dies zuläßt.
Als Faustregel gilt hier, daß dies bei n/N < 0.05 vertretbar ist.
Falls
n/N > 0.05
wird meistens zunächst mit der
Binomialverteilung
gerechnet und das Ergebnis durch
88
Multiplikation mit geeigneten Faktoren multipliziert. Man spricht
dabei von einer Endlichkeitskorrektur.
89
Herunterladen