Beispiel

Werbung
Sitzung 1
ZEW - Expertenseminar:
„Einführung in die Ökonometrie“
WS 2007/2008
Alexander Spermann
Universität Freiburg
Sitzung 1
Agenda
1. Grundlagen: Varianz, Kovarianz;
Erwartungswert, Korrelationskoeffizient
2. Einfache Regressionsanalyse: Methode der Kleinsten Quadrate
3. Gauss-Markov-Bedingungen: unverzerrter, konsistenter und
effizienter Schätzer
4. Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, FTest, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2,
einseitiger und zweiseitiger Test
5. Multiple Regressionsanalyse
6. Dummy-Variablen
7. Problem fehlender Variablen
8. Multikollinearität
1
Alexander Spermann
WS 2007/2008
Sitzung 1
Grundgesamtheit und Stichprobe 1
Fragestellung:
Wie hoch ist das durchschnittliche
Nettoeinkommen eines Haushaltes einer Stadt?
1. Möglichkeit:Nettoeinkommen aller Haushalte dieser Stadt
(Grundgesamtheit) wird in die Berechnung
miteinbezogen.
 Durchschnitt wird ausgerechnet.
PROBLEM: eine Erhebung ist zu teuer.
2. Möglichkeit:
2
Stichprobe wird gezogen.
Alexander Spermann
WS 2007/2008
Sitzung 1
Grundgesamtheit und Stichprobe 2
Grundgesamtheit: Gesamte Menge numerischer Informationen einer
(population)
bestimmten Größe, die der Wissenschaftler beobachtet.
Beispiel:
Nettoeinkommen aller Haushalte.
Stichprobe:
(sample)
3
Beobachtete Teilmenge der Werte einer
Grundgesamtheit.
Beispiel:
Nettoeinkommen von z.B. 1% aller Haushalte
wird beobachtet. Diese Haushalte
werden zufällig gezogen.
Alexander Spermann
WS 2007/2008
Sitzung 1
Mittelwert (1)
Mittelwert
(= Durchschnittswert) :
der
(mean)
4
Summe der numerischen Werte der
Beobachtungen geteilt durch die Anzahl
Beobachtungen.
Alexander Spermann
WS 2007/2008
Sitzung 1
Mittelwert (2)
Notation:
N = Anzahl der Beobachtungen
x1, x2, x3,…,xn – Beobachtungen der
Grundgesamtheit
Beispiel:
Gegeben sind 7 Monatsgehälter von Geschäftsführern in
Euro:
x1  3450 x2  3070 x3  3290 x4  3600
x5  3410 x6  3380 x7  3250
3000€
5
3200€ 3400€
3600€
Alexander Spermann
WS 2007/2008
Sitzung 1
Mittelwert (3)
Durchschnittswert der Grundgesamtheit ist:
N
x1  x 2  ...  xN

N
x
i 1
N
i

Im Beispiel:
7

6
x
i 1
7
i

3450  3070  ...  3250
 3350
7
Alexander Spermann
WS 2007/2008
Sitzung 1
Mittelwert (4)
n – Anzahl der Beobachtungen
Notation:
x1, x2, …, xn – Beobachtungen der Stichprobe
Durchschnittswert der Stichprobe ist:
n
x1  x 2  ...  xn

n
Beispiel:
x
i 1
n
i
x
Prozentuale Gewinne einer Stichprobe von 8
Unternehmen gegenüber dem Vorjahr sahen wie folgt aus :
13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%
8
x
7
x
i 1
8
i

13,6  25,5  43,6  ( 19,8)  ( 13,8)  12,0  36,3  14,3
 13,96
8
Alexander Spermann
WS 2007/2008
Sitzung 1
Median 1
Median (median): mittlerer Wert einer geordneten Datenreihe
Beispiel: Gehälter der 7 Geschäftsführer sind
geordnet::
3 070€
3 250€
3 290€
3 380€
nach der Größe wie folgt
3 410€
Median = Wert in der „Mitte“ 
Median:
3 450€
3 600€
rechts und links davon
sind jeweils 3 Werte
N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten
Beobachtungen
N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach
geordneten Beobachtungen
8
Alexander Spermann
WS 2007/2008
Sitzung 1
Median 2
Berechnung des Median:
Fall 1:
N ungerade:
Im Beispiel:
x N 1
2
2
Fall 2:
N gerade:
Vierter
beobachteter
Wert
1
(x N  x N 2 )
2 2
2
Median
Im Beispiel:
3000€
x 7 1  x 4
3200€
3400€
3600€
Durchschnittswert
der Grundgesamtheit,
3350€ = µ
9
Alexander Spermann
WS 2007/2008
Sitzung 1
Median 3
Wann Median und wann Mittelwert?
Sollen die Ausreißer einer Stichprobe automatisch aus der
Mittelwertberechnung eliminiert werden, ist die
Anwendung
des Median eine gute Alternative.
Beispiel:
Ermittlung der durchschnittlichen Einkommens- bzw.
Vermögenssituation in einer Stadt.
 Einbeziehung der extrem Vermögenden würde das tatsächliche
Einkommensbild verzerren!
10
Alexander Spermann
WS 2007/2008
Sitzung 1
Streuungsmaße
Neues Beispiel:
2 750€
7 Geschäftsführer eines zweiten Unternehmens
haben folgende Monatsgehälter:
3 160€
3 170€
3 380€
3 490€
3 530€
3 970€
Mittelwert und Median des 1. Unternehmens =
Mittelwert und Median des 2. Unternehmens
Die Streuung ist jedoch unterschiedlich:
Unt. 1
2700€
3100€
3500€
3900€
Unt. 2
2700€
11
3100€
3500€
3900€
Alexander Spermann
WS 2007/2008
Sitzung 1
Varianz
Streuung: Abweichungen der Beobachtungen vom Durchschnittswert.
(dispersion)
x 1- μ, x2 – μ, …,xN- μ
Da manche der Werte kleiner bzw. größer als μ sind, ist
N
 (x
i 1
i
 )  0
Da das Vorzeichen der Abweichung unwichtig
ist und alle Werte gleich behandelt werden
 Betrachtung der quadrierten Werte
Varianz:
(variance)
Durchschnitt der quadrierten Abweichungen
der beobachteten Werte von ihrem Mittelwert.
Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen
nützlich.
12
Alexander Spermann
WS 2007/2008
Sitzung 1
Varianz der Grundgesamtheit
N
Formel für Varianz:  
2
  xi   
i 1
N
N
2

x ²
i
i 1
N
 µ²
Im Beispiel:
Unternehmen 2
Unternehmen 1
x i1
(xi1  1 )²
xi 2
xi2  2 ( 3.350)
(xi2  2 )²
3 450€
100
10 000
3 490€
140
196 00
3 070€
-280
78 400
2 750€
-600
360 000
3 290€
-60
3 600
3 160€
-190
36 100
3 600€
250
62 500
3 970€
620
384 400
3 410€
60
3 600
3 530€
180
32 400
3 380€
30
900
3 380€
30
900
3 250€
-100
10 000
3 170€
-180
Σ=0
Σ=169 000
1 ² 
13
xi1  1( 3.350)
169000
 24142,86
7
Σ=0
2 ² 
32 400
Σ=865 800
865800
 123685,71
7
Alexander Spermann
WS 2007/2008
Sitzung 1
Standardabweichung der
Grundgesamtheit
²  

Varianz  Standardab weichung
Mit der Standardabweichung (standard deviation) kann man
interpretieren, wie weit die beobachteten Werte vom Mittelwert
tatsächlich entfernt sind.
Beispiel:
 1   1 ²  24142,86  155,4€
 2   2 ²  123685,71  351,7€
14
Alexander Spermann
WS 2007/2008
Sitzung 1
Varianz der Stichprobe 1
Die Abweichungen der beobachteten Werte vom Mittelwert einer Stichprobe sind:
x1  x,x2  x,...,xn  x
und die quadrierten Werte entsprechend:
(x1  x)²,(x2  x)²,...,(xn  x)²
Die Varianz der Stichprobe ist dann:
x
n
sxx 
2
15
i 1
i
x
n 1

n
2

 x ²  nx²
i 1
i
n 1
 Da bei der Berechnung der Stichprobenvarianz
nicht der Mittelwert der Grundgesamtheit µ,
sondern der Mittelwert der Stichprobe x
als Schätzer (proxy) verwendet wird, dividiert man
als „Kompensation“ durch (n -1), anstatt durch n.
Alexander Spermann
WS 2007/2008
Sitzung 1
Varianz der Stichprobe 2
Beispiel:
Prozentuale Gewinne einer Stichprobe von 8
Unternehmen gegenüber dem Vorjahr sahen wie
folgt aus :
13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3%
n8
x  13,96%
Die Summe der Quadrate der beobachteten Werte ist:
8
 x ²  (13,6)²  (25,2)²  ...  (14,3)²  4984,83
i 1
i
Die Varianz der Stichprobe:
n
sxx ² 
16
 x ²  nx²
i 1
i
n 1

4984,83  (8)(13,9625)²
 489,3170
7
Alexander Spermann
WS 2007/2008
Sitzung 1
Standardabweichung der Stichprobe
Notation:
sxx ²  sxx
Standardabweichung der Stichprobe aus dem Beispiel ist:
sxx  sxx ²  489,3170  22,1
17
Alexander Spermann
WS 2007/2008
Sitzung 1
Zufallsexperiment 1
Zufallsexperiment:
(random experiment)
Vorgang, der zu einer von
mindestens 2 möglichen
Ausprägungen führt, wobei es
unbekannt ist, zu welcher.
Stichprobenraum S:
(sample space)
Menge aller möglichen
Ausprägungen.
Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine
muss auftreten.
18
Alexander Spermann
WS 2007/2008
Sitzung 1
Zufallsexperiment 2
Beispiele:
Ein Vorgang wird beobachtet:
• Werfen einer Münze
• Werfen eines Würfels
Mögliche Ausprägungen:
• entweder Kopf oder Zahl
• 1,2,3,4,5,6
Stichprobenraum:
• S=(Kopf, Zahl)
• S=(1,2,3,4,5,6)
19
Alexander Spermann
WS 2007/2008
Sitzung 1
Zufallsexperiment 3
Ereignis:
dem
(event)
Eine Teilmenge möglicher Ausprägungen mit
gleichen Merkmal.
Notation:
Großbuchstaben, z.B. A, B,...,Z
Beispiel:
Ereignis A/B: Eintreten einer ungeraden /geraden Zahl
beim Werfen eines Würfels.
Ergebnis eines Würfelwurfs z.B. 3
 Ereignis A eingetreten.
20
Alexander Spermann
WS 2007/2008
Sitzung 1
Wahrscheinlichkeit
Bezeichnung: P (probability)
Ein Zufallsexperiment soll stattfinden.
Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis
eintritt?
1. Wahrscheinlichkeit als relative Häufigkeit :
P liegt immer
zwischen 0 und 1:
0: ein Ereignis tritt auf
P 
keinen Fall ein
1: ein Ereignis tritt sicher ein
Beispiel:
21
Münze wird geworfen.
Ereignis A: Kopf, zu 50%
Ereignis B: Zahl, zu 50%

In beiden Fällen P=0,5
Alexander Spermann
WS 2007/2008
Sitzung 1
Subjektive Wahrscheinlichkeit
Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen
Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur?
2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit :
Bezeichnung: Psubj
Die subjektive Wahrscheinlichkeit beschreibt den rein
individuellen Glauben über die Chance, dass ein bestimmtes
Ereignis bei begrenzter Anzahl der Experiment eintritt.
Zudem hängt sie von den gegebenen Informationen sowie ihrer
persönlichen Interpretation ab. Gutes Bsp. sind
Investitionsentscheidungen bezüglich
entsprechender Gewinnerwartungen.
22
Alexander Spermann
WS 2007/2008
Sitzung 1
Zufallsvariable 1
Zufallsvariablen: Ausprägungen eines Zufallsexperimentes:
(random variable)
1. diskret: gutes / defektes Produkt (gut = 1,
defekt = 2)
2. stetig: Familieneinkommen
Wichtige Unterscheidung zwischen:
einer Zufallsvariable X und
dem Wert x, den sie annimmt.
23
Alexander Spermann
WS 2007/2008
Sitzung 1
Zufallsvariable 2
Beispiel 1:
Werfen eines Würfels
Zufallsvariable X = Augenzahl
Produktes
6 Ausprägungen
x = 1, x = 2, ..., x =6
Beispiel 2:
Produktion
Zufallsvariable X = Qualität des
2 Ausprägungen: x = 1, x = 2
wobei 1=gut, 2=defekt
Diskrete Zufallsvariable:
24
Nimmt nur eine abzählbare
Anzahl an Ausprägungen an.
Alexander Spermann
WS 2007/2008
Sitzung 1
Wahrscheinlichkeitsfunktion einer
diskreten Zufallsvariable
Wahrscheinlichkeitsfunktion: gibt die Wahrscheinlichkeit wieder, dass eine
=Dichtefunktion
diskrete Zufallsvariable X die Ausprägung x
(probability function)
annimmt:
Px ( x ) = P( X = x )
Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1:  PX (x)  1
x
Beispiel:
X = Augenzahl bei geworfenem Würfel
P(X  1)  P(X  2)  ...  P(X  6) 
PX (x)
Px (X)  P(X  x) 
1/6
1
6
1
für x  1,2,3,...,6
6
 Wahrscheinlichkeits-/
0
25
1
2
3
4
5
6
x
Dichtefunktion für das
Bsp. mit unabhängigen
Ereignissen
Alexander Spermann
WS 2007/2008
Sitzung 1
Kumulierte Wahrscheinlichkeitsfunktion
einer diskreten Zufallsvariablen 1
Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter
Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als:
FX (x0 )  P(X  x0 ) 
 P (x)
x  x0
X
Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels:
0 wenn x 0  1

j
FX (x 0 )   wenn j  x 0  j  1 (j  1,2,...,5)
6
1 wenn x 0  6
Grafik der kumulierten
Wahrscheinlichkeitsfunktion aus dem
Beispiel:
FX (x0 )
1
1/2
Für P(X3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5
0
26
1 2
3 4
5 6
x
Alexander Spermann
WS 2007/2008
Sitzung 1
Erwartungswert einer diskreten
Zufallsvariable 1
Beispiel: Korrektur einer Stichprobe von Büchern,
Zufallsvariable X =Tippfehler auf einer Seite
• 81% der Seiten hatten keinen Tippfehler  der Wert der Zufallsvariable x = 0
• 17% hatten einen Tippfehler  x = 1
• 2% hatten zwei Tippfehler  x = 2
Dies kann man schreiben als:
Px (0) = 0,81
Px (1) = 0,17
Px (2) = 0,02
Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte
mit ihren Wahrscheinlichkeiten gewichtet werden
 Erwartungswert (expected value)
27
Alexander Spermann
WS 2007/2008
Sitzung 1
Erwartungswert einer diskreten
Zufallsvariable 2
Durch das Berechnen des Erwartungswertes erhalten wir den mittleren
Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der
diskreten Zufallsvariable genannt.
Notation:
E(X)  X   xPX (x)
x
Beispiel:
E(X  Tippfehler)  0*0,81  1*0,17  2*0,02  0,21   X
 d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw.
auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist
28
Alexander Spermann
WS 2007/2008
Sitzung 1
Erwartungswert, Varianz und
Standardabweichung 1
Varianz:
x)²
Der Erwartungswert der quadrierten Streuung (X – μ
gewichtet mit der Wahrscheinlichkeit
X ²  E (X   X )²    (x   X )²PX (x)
x
Notation:
Standardabweichung:
Quadratwurzel der Varianz
Notation:
σx
29
Alexander Spermann
WS 2007/2008
Sitzung 1
Erwartungswert, Varianz und
Standardabweichung 2
Beispiel: Tippfehler
Um die Varianz zu finden, muss zuerst der Erwartungswert gefunden
werden:
E(X  Tippfehler)  0,21   X
Varianz:
X ²   (x  µX )²PX (x) 
x
(0  0,21)² * 0,81  (1  0,21)² * 0,17  (2  0,21)² * 0,02  0,2059
und die Standardabweichung entsprechend:
X  X ²  0,2059  0,45
30
Alexander Spermann
WS 2007/2008
Sitzung 1
Verteilungsfunktion einer stetigen
Zufallsvariable 1
Stetige Zufallsvariablen:
Werten
Nicht abzählbare Anzahl an
auf einem ‚Wertestrahl‘ (Kontinuum).
Beispiele: Zeit, Entfernung, Temperatur.
(continuous random variable)
Verteilungsfunktion einer stetigen Zufallsvariable:
Wahrscheinlichkeit, dass X den Wert x nicht übersteigt.
Notation:
FX (x)  P(X  x)
Verteilungsfunktion einer stetigen Zufallsvariable entspricht der
kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable.
31
Alexander Spermann
WS 2007/2008
Sitzung 1
Verteilungsfunktion einer stetigen
Zufallsvariable 2
Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden
die Unfälle im Tunnel beobachtet.
Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt
des
Unfalls.
Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke
gleich.
Verteilungsfunktion dieser
Grafik zum Beispiel:
1
0 für x  0

FX (x)   x für 0  x  1
1 für x  1

Fx(x)
Zufallsvariable ist:
0
1
x in km
32
Alexander Spermann
WS 2007/2008
Sitzung 1
Verteilungsfunktion einer stetigen
Zufallsvariable 3
Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den
die Zufallsvariable annimmt, zu berechnen.
 Es kann nur die Wahrscheinlichkeit berechnet werden, dass die
Zufallsvariable einen Wert zwischen den Werten a und b annimmt.
Diese Wahrscheinlichkeit ist: P (a < x < b) = Fx (b) – Fx (a)
Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt
ist, ist die Verteilungsfunktion in diesem Bereich:
F x(x) = x
Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem
Bereich liegt:
P (1/4< x < 3/4) = Fx (3/4) – Fx (1/4) = 3/4 – 1/4= 1/2
33
Alexander Spermann
WS 2007/2008
Sitzung 1
Dichtefunktion einer stetigen
Zufallsvariable 1
Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit
folgenden Eigenschaften:
fX (x) ≥ 0 für alle x - Werte
Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X,
wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich
unter der Kurve zwischen diesen zwei Werten.
fx(x)
Beispiel:
x
a
34
b
Alexander Spermann
WS 2007/2008
Sitzung 1
Dichtefunktion einer stetigen
Zufallsvariable 2
Eigenschaften der Dichtefunktion:
•
Die Fläche unter der Dichtefunktion entspricht dem Wert 1.
•
Die Fläche unter der Kurve der Dichtefunktion, fX (x) , links von dem
Wert x0 ist F x(x0) , wobei x0 irgendein Wert ist, den die Zufallsvariable
annehmen kann.
35
Alexander Spermann
WS 2007/2008
Sitzung 1
Dichte- und Verteilungsfunktion einer
stetigen Zufallsvariable 3 –
laut Beispiel
1 f x (x)
Gesamtfläche = 1
1
Fx(x)
3/4
3/4
F(b)=3/4
=0,5 (50%)
1/2
1/2
= 0,5
1/4
1/4
F(a)=1/4
0
0
0
a
¼*1km=250m
36
1
a
b
1
b
¾*1km=750m
Alexander Spermann
WS 2007/2008
Sitzung 1
Die Normalverteilung 1
fx(x)
Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt.
µ
fX (x) 
x
1
2²
Eine Zufallsvariable X ist normalverteilt
wenn ihre Dichtefunktion wie folgt
aussieht:
e( x µ)² / 2 ² für    x  
Und:
  µ   0  2  
e  2,71828...;   3,14159...
37
, wobei die Varianz immer positiv ist.
Alexander Spermann
WS 2007/2008
Sitzung 1
Die Normalverteilung 2
Eigenschaften:
•
Der Mittelwert der Zufallsvariable ist µ,
also:
•
E (X) = μ
Die Varianz der Zufallsvariable ist σ²
also:
Var(X)  E(X  µ)²   ²
•
mit Standardabweichung: = σ
•
wobei gilt: je kleiner σ² , desto „enger“ liegt die Verteilung um den wahren Wert
Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit dem
Zentrum im Mittelwert µ.
Notation:
38
X~ N (µ ,σ²)
Alexander Spermann
WS 2007/2008
Sitzung 1
Die Normalverteilung 3
0,3
f X (x)
Standardnormalverteilung
mit =1 und =0
0,4
2=2,25 und =3
0,2
Dichte f(x)
Dichte f(x)
0,25
=2,25 und =1
0,15
0,1
0,3
2=1,44 und =0
0,2
2=4 und =0
0,1
0,05
0
0
-5 -4 -3 -2 -1
39
f X (x)
0,5
0
1
2
3
4
5
6
7
-5
-4
-3
-2
-1
0
1
2
3
4
5
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Erwartungswert 1
Gezogene Zufallsstichproben der Grundgesamtheit sind:
X1,X2,X3,…,Xn
Der Stichprobenmittelwert ist dann:
X
1 n
 Xi
n i1
Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe
der Erwartungswerte ist:
n
E ( X i )  E ( X1 )  E ( X 2 )  ...  E ( X n )
i 1
Da jede Zufallsstichprobe Xi den Mittelwert μX hat, können wir schreiben:
n
E( Xi )  nµX
i 1
40
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Erwartungswert 2
Der Erwartungswert des Mittelwertes der Stichprobe ist dann:
E(X)  E(
nµ
1 n
1 n
X
)

E( Xi )  X  µX

i
n i1
n i1
n
Also entspricht der Erwartungswert des Mittelwertes der Stichprobe
dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der
Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der
Grundgesamtheit ist.
41
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Erwartungswert 3
Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt
(unbiased).
f (x )
n = 100
Dichtefunktionen der
Normalverteilung
für wahre
Stichprobenmittelwerte
vom Umfang n=25 und n=100
Beobachtungen, mit der
Standardabweichung=5.
n=25
100
42
x
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Erwartungswert 4
Beispiel:
Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8
Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vier
Beobachtungswerten aus einer Grundgesamtheit von sechs „Werten“: 2,4,6,6,7,8,
gezogen.
43
Stichprobe
Mittelwert
Stichprobe
Mittelwert
2,4,6,6
4,5
2,6,7,8
5,75
2,4,6,7
4,75
2,6,7,8
5,75
2,4,6,8
5
4,6,6,7
5,75
2,4,6,7
4,75
4,6,6,8
6
2,4,6,8
5
4,6,7,8
6,25
2,4,7,8
5,25
4,6,7,8
6,25
2,6,6,7
5,25
6,6,7,8
6,75
2,6,6,8
5,5
Der wahre Mittelwert
(sample mean) dieser
Grundgesamtheit ist der
Durchschnitt dieser
sechs Werte: μX =5,5
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Erwartungswert 5
Die Häufigkeitsverteilung der Wahrscheinlichkeiten von
Mittelwerten der Stichproben (sampling distribution of the sample
mean) ist:
1
2
PX ( 4,75) 
15
15
2
1
(5,25) 
PX (5,5) 
15
15
1
2
(6) 
PX (6,25) 
15
15
PX ( 4,5) 
PX
PX
PX (5) 
2
15
3
15
1
(6,75) 
15
PX (5,75) 
PX
Der Erwartungswert des Mittelwertes der Stichprobe entspricht
dem Mittelwert der Grundgesamtheit:
E(X)   xPX (x)  4,5 
44
1
2
1
 4,75 *
 ...  6,75 *
 5,5   x
15
15
15
Alexander Spermann
WS 2007/2008
Sitzung 1
Stichprobe und Grundgesamtheit:
Varianz 1
Es werden n Beobachtungen X1,X2,X3,…,Xn aus der Grundgesamtheit
zufällig
gezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind.
Die Varianz der Grundgesamtheit ist:  ²  E( X  µ )² 
X
Da aber μX
geschätzt.
X
unbekannt ist, wird es durch
Die Varianz der Stichprobe lautet:
X
(= Mittelwert der Stichprobe)
1 n
s XX ² 
 ( X i  X )²
n  1 i 1
E (s XX ²)   X ²
Mit Hilfe dieser Definition der SXX² kann gezeigt werden, dass
Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz
der
Grundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die
Varianz
erwartungstreu ist.
45
Alexander Spermann
WS 2007/2008
Sitzung 1
Kovarianz
Kovarianz einer Stichprobe:
sXY
1 n

(xi  x)(yi  y)

n  1 i1
 wegen der Approximation von µ durch x und ŷ
wird als „Kompensation“ durch (n-1), anstatt durch n dividiert,
d.h es wird ein Freiheitsgrad „aufgegeben“.
46
Alexander Spermann
WS 2007/2008
Sitzung 1
Kovarianz einer Stichprobe –
ein Beispiel
Quelle:Dougherty
Erläuterung: S : Anzahl der Jahre in Ausbildung
Y : Stundenlohn in Dollar (1992)
47
Alexander Spermann
WS 2007/2008
Sitzung 1
Kovarianz einer Stichprobe
– ein Beispiel
Illustration der Kovarianz:
Y
S
Quelle:Dougherty
sSY  15,294
2
Interpretation von SSY2 = 15,294 :
es liegt positiver Zusammenhang vor
y = 14,225 und
48
s = 13,250
Alexander Spermann
WS 2007/2008
Sitzung 1
Vergleich Kovarianz und
Korrelationskoeffizient – ein Beispiel
•
Nach Multiplikation
von Y mit 100,
SSY‘2 = 1529,4
d.h. trotz Änderung der
Dimension bleibt der
Zusammenhang unverändert
und wird lediglich in eine
andere Größenordnung (*100)
transformiert.
Quelle: Dougherty
49
Alexander Spermann
WS 2007/2008
Sitzung 1
Korrelationskoeffizient
Formel:
Beispiel:
rXY 
rSY ' 
sXY ²
sXX ²sYY ²
sSY ' ²
sSS ²sY ' Y ' ²

15,294
10,888  771080
 0,55
gegeben
Vorteil des Korrelationskoeffizienten gegenüber der Kovarianz:
dimensionslos
 1  rx , y  1
mit :
50
Alexander Spermann
WS 2007/2008
Sitzung 1
Literatur
Dougherty, Christopher; Introduction to Econometrics
Gujarati, Damodar; Basic Econometrics (4th Edition)
Wooldridge, Jeffrey; Introductory Econometrics
Datensätze und weitere Infos vom und zum Autor auch
unter:
http://wooldridge.swcollege.com
Chiang, Alpha C.; Fundamental Methods of Mathematical Economics
Simon, Carl and Lawrence Blume; Mathematics for Economists
51
Alexander Spermann
WS 2007/2008
Herunterladen