Sitzung 1 ZEW - Expertenseminar: „Einführung in die Ökonometrie“ WS 2007/2008 Alexander Spermann Universität Freiburg Sitzung 1 Agenda 1. Grundlagen: Varianz, Kovarianz; Erwartungswert, Korrelationskoeffizient 2. Einfache Regressionsanalyse: Methode der Kleinsten Quadrate 3. Gauss-Markov-Bedingungen: unverzerrter, konsistenter und effizienter Schätzer 4. Hypothesentests: Signifikanzniveau, Konfidenzintervall, t-Test, FTest, Bestimmtheitsmaß, Standardfehler, Fehler vom Typ 1 und 2, einseitiger und zweiseitiger Test 5. Multiple Regressionsanalyse 6. Dummy-Variablen 7. Problem fehlender Variablen 8. Multikollinearität 1 Alexander Spermann WS 2007/2008 Sitzung 1 Grundgesamtheit und Stichprobe 1 Fragestellung: Wie hoch ist das durchschnittliche Nettoeinkommen eines Haushaltes einer Stadt? 1. Möglichkeit:Nettoeinkommen aller Haushalte dieser Stadt (Grundgesamtheit) wird in die Berechnung miteinbezogen. Durchschnitt wird ausgerechnet. PROBLEM: eine Erhebung ist zu teuer. 2. Möglichkeit: 2 Stichprobe wird gezogen. Alexander Spermann WS 2007/2008 Sitzung 1 Grundgesamtheit und Stichprobe 2 Grundgesamtheit: Gesamte Menge numerischer Informationen einer (population) bestimmten Größe, die der Wissenschaftler beobachtet. Beispiel: Nettoeinkommen aller Haushalte. Stichprobe: (sample) 3 Beobachtete Teilmenge der Werte einer Grundgesamtheit. Beispiel: Nettoeinkommen von z.B. 1% aller Haushalte wird beobachtet. Diese Haushalte werden zufällig gezogen. Alexander Spermann WS 2007/2008 Sitzung 1 Mittelwert (1) Mittelwert (= Durchschnittswert) : der (mean) 4 Summe der numerischen Werte der Beobachtungen geteilt durch die Anzahl Beobachtungen. Alexander Spermann WS 2007/2008 Sitzung 1 Mittelwert (2) Notation: N = Anzahl der Beobachtungen x1, x2, x3,…,xn – Beobachtungen der Grundgesamtheit Beispiel: Gegeben sind 7 Monatsgehälter von Geschäftsführern in Euro: x1 3450 x2 3070 x3 3290 x4 3600 x5 3410 x6 3380 x7 3250 3000€ 5 3200€ 3400€ 3600€ Alexander Spermann WS 2007/2008 Sitzung 1 Mittelwert (3) Durchschnittswert der Grundgesamtheit ist: N x1 x 2 ... xN N x i 1 N i Im Beispiel: 7 6 x i 1 7 i 3450 3070 ... 3250 3350 7 Alexander Spermann WS 2007/2008 Sitzung 1 Mittelwert (4) n – Anzahl der Beobachtungen Notation: x1, x2, …, xn – Beobachtungen der Stichprobe Durchschnittswert der Stichprobe ist: n x1 x 2 ... xn n Beispiel: x i 1 n i x Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% 8 x 7 x i 1 8 i 13,6 25,5 43,6 ( 19,8) ( 13,8) 12,0 36,3 14,3 13,96 8 Alexander Spermann WS 2007/2008 Sitzung 1 Median 1 Median (median): mittlerer Wert einer geordneten Datenreihe Beispiel: Gehälter der 7 Geschäftsführer sind geordnet:: 3 070€ 3 250€ 3 290€ 3 380€ nach der Größe wie folgt 3 410€ Median = Wert in der „Mitte“ Median: 3 450€ 3 600€ rechts und links davon sind jeweils 3 Werte N ungerade: der mittlere Wert bei einer Reihe nach der Größe geordneten Beobachtungen N gerade: Durchschnitt der 2 mittleren Werte bei einer Reihe der Größe nach geordneten Beobachtungen 8 Alexander Spermann WS 2007/2008 Sitzung 1 Median 2 Berechnung des Median: Fall 1: N ungerade: Im Beispiel: x N 1 2 2 Fall 2: N gerade: Vierter beobachteter Wert 1 (x N x N 2 ) 2 2 2 Median Im Beispiel: 3000€ x 7 1 x 4 3200€ 3400€ 3600€ Durchschnittswert der Grundgesamtheit, 3350€ = µ 9 Alexander Spermann WS 2007/2008 Sitzung 1 Median 3 Wann Median und wann Mittelwert? Sollen die Ausreißer einer Stichprobe automatisch aus der Mittelwertberechnung eliminiert werden, ist die Anwendung des Median eine gute Alternative. Beispiel: Ermittlung der durchschnittlichen Einkommens- bzw. Vermögenssituation in einer Stadt. Einbeziehung der extrem Vermögenden würde das tatsächliche Einkommensbild verzerren! 10 Alexander Spermann WS 2007/2008 Sitzung 1 Streuungsmaße Neues Beispiel: 2 750€ 7 Geschäftsführer eines zweiten Unternehmens haben folgende Monatsgehälter: 3 160€ 3 170€ 3 380€ 3 490€ 3 530€ 3 970€ Mittelwert und Median des 1. Unternehmens = Mittelwert und Median des 2. Unternehmens Die Streuung ist jedoch unterschiedlich: Unt. 1 2700€ 3100€ 3500€ 3900€ Unt. 2 2700€ 11 3100€ 3500€ 3900€ Alexander Spermann WS 2007/2008 Sitzung 1 Varianz Streuung: Abweichungen der Beobachtungen vom Durchschnittswert. (dispersion) x 1- μ, x2 – μ, …,xN- μ Da manche der Werte kleiner bzw. größer als μ sind, ist N (x i 1 i ) 0 Da das Vorzeichen der Abweichung unwichtig ist und alle Werte gleich behandelt werden Betrachtung der quadrierten Werte Varianz: (variance) Durchschnitt der quadrierten Abweichungen der beobachteten Werte von ihrem Mittelwert. Varianz ist für den Vergleich zweier oder mehrerer Mengen der Beobachtungen nützlich. 12 Alexander Spermann WS 2007/2008 Sitzung 1 Varianz der Grundgesamtheit N Formel für Varianz: 2 xi i 1 N N 2 x ² i i 1 N µ² Im Beispiel: Unternehmen 2 Unternehmen 1 x i1 (xi1 1 )² xi 2 xi2 2 ( 3.350) (xi2 2 )² 3 450€ 100 10 000 3 490€ 140 196 00 3 070€ -280 78 400 2 750€ -600 360 000 3 290€ -60 3 600 3 160€ -190 36 100 3 600€ 250 62 500 3 970€ 620 384 400 3 410€ 60 3 600 3 530€ 180 32 400 3 380€ 30 900 3 380€ 30 900 3 250€ -100 10 000 3 170€ -180 Σ=0 Σ=169 000 1 ² 13 xi1 1( 3.350) 169000 24142,86 7 Σ=0 2 ² 32 400 Σ=865 800 865800 123685,71 7 Alexander Spermann WS 2007/2008 Sitzung 1 Standardabweichung der Grundgesamtheit ² Varianz Standardab weichung Mit der Standardabweichung (standard deviation) kann man interpretieren, wie weit die beobachteten Werte vom Mittelwert tatsächlich entfernt sind. Beispiel: 1 1 ² 24142,86 155,4€ 2 2 ² 123685,71 351,7€ 14 Alexander Spermann WS 2007/2008 Sitzung 1 Varianz der Stichprobe 1 Die Abweichungen der beobachteten Werte vom Mittelwert einer Stichprobe sind: x1 x,x2 x,...,xn x und die quadrierten Werte entsprechend: (x1 x)²,(x2 x)²,...,(xn x)² Die Varianz der Stichprobe ist dann: x n sxx 2 15 i 1 i x n 1 n 2 x ² nx² i 1 i n 1 Da bei der Berechnung der Stichprobenvarianz nicht der Mittelwert der Grundgesamtheit µ, sondern der Mittelwert der Stichprobe x als Schätzer (proxy) verwendet wird, dividiert man als „Kompensation“ durch (n -1), anstatt durch n. Alexander Spermann WS 2007/2008 Sitzung 1 Varianz der Stichprobe 2 Beispiel: Prozentuale Gewinne einer Stichprobe von 8 Unternehmen gegenüber dem Vorjahr sahen wie folgt aus : 13,6% 25,5% 43,6% -19,8% -13,8% 12,0% 36,3% 14,3% n8 x 13,96% Die Summe der Quadrate der beobachteten Werte ist: 8 x ² (13,6)² (25,2)² ... (14,3)² 4984,83 i 1 i Die Varianz der Stichprobe: n sxx ² 16 x ² nx² i 1 i n 1 4984,83 (8)(13,9625)² 489,3170 7 Alexander Spermann WS 2007/2008 Sitzung 1 Standardabweichung der Stichprobe Notation: sxx ² sxx Standardabweichung der Stichprobe aus dem Beispiel ist: sxx sxx ² 489,3170 22,1 17 Alexander Spermann WS 2007/2008 Sitzung 1 Zufallsexperiment 1 Zufallsexperiment: (random experiment) Vorgang, der zu einer von mindestens 2 möglichen Ausprägungen führt, wobei es unbekannt ist, zu welcher. Stichprobenraum S: (sample space) Menge aller möglichen Ausprägungen. Es können nicht gleichzeitig zwei Ausprägungen auftreten, aber eine muss auftreten. 18 Alexander Spermann WS 2007/2008 Sitzung 1 Zufallsexperiment 2 Beispiele: Ein Vorgang wird beobachtet: • Werfen einer Münze • Werfen eines Würfels Mögliche Ausprägungen: • entweder Kopf oder Zahl • 1,2,3,4,5,6 Stichprobenraum: • S=(Kopf, Zahl) • S=(1,2,3,4,5,6) 19 Alexander Spermann WS 2007/2008 Sitzung 1 Zufallsexperiment 3 Ereignis: dem (event) Eine Teilmenge möglicher Ausprägungen mit gleichen Merkmal. Notation: Großbuchstaben, z.B. A, B,...,Z Beispiel: Ereignis A/B: Eintreten einer ungeraden /geraden Zahl beim Werfen eines Würfels. Ergebnis eines Würfelwurfs z.B. 3 Ereignis A eingetreten. 20 Alexander Spermann WS 2007/2008 Sitzung 1 Wahrscheinlichkeit Bezeichnung: P (probability) Ein Zufallsexperiment soll stattfinden. Wie groß ist die Wahrscheinlichkeit P bzw. die Chance, dass ein Ereignis eintritt? 1. Wahrscheinlichkeit als relative Häufigkeit : P liegt immer zwischen 0 und 1: 0: ein Ereignis tritt auf P keinen Fall ein 1: ein Ereignis tritt sicher ein Beispiel: 21 Münze wird geworfen. Ereignis A: Kopf, zu 50% Ereignis B: Zahl, zu 50% In beiden Fällen P=0,5 Alexander Spermann WS 2007/2008 Sitzung 1 Subjektive Wahrscheinlichkeit Was tun, wenn ein Experiment gar nicht oder zumindest nicht unter gleichen Umweltbedingungen wiederholt werden kann – Bsp. Konjunktur? 2. Wahrscheinlichkeit als subjektive Wahrscheinlichkeit : Bezeichnung: Psubj Die subjektive Wahrscheinlichkeit beschreibt den rein individuellen Glauben über die Chance, dass ein bestimmtes Ereignis bei begrenzter Anzahl der Experiment eintritt. Zudem hängt sie von den gegebenen Informationen sowie ihrer persönlichen Interpretation ab. Gutes Bsp. sind Investitionsentscheidungen bezüglich entsprechender Gewinnerwartungen. 22 Alexander Spermann WS 2007/2008 Sitzung 1 Zufallsvariable 1 Zufallsvariablen: Ausprägungen eines Zufallsexperimentes: (random variable) 1. diskret: gutes / defektes Produkt (gut = 1, defekt = 2) 2. stetig: Familieneinkommen Wichtige Unterscheidung zwischen: einer Zufallsvariable X und dem Wert x, den sie annimmt. 23 Alexander Spermann WS 2007/2008 Sitzung 1 Zufallsvariable 2 Beispiel 1: Werfen eines Würfels Zufallsvariable X = Augenzahl Produktes 6 Ausprägungen x = 1, x = 2, ..., x =6 Beispiel 2: Produktion Zufallsvariable X = Qualität des 2 Ausprägungen: x = 1, x = 2 wobei 1=gut, 2=defekt Diskrete Zufallsvariable: 24 Nimmt nur eine abzählbare Anzahl an Ausprägungen an. Alexander Spermann WS 2007/2008 Sitzung 1 Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable Wahrscheinlichkeitsfunktion: gibt die Wahrscheinlichkeit wieder, dass eine =Dichtefunktion diskrete Zufallsvariable X die Ausprägung x (probability function) annimmt: Px ( x ) = P( X = x ) Die Wahrscheinlichkeiten aller Ausprägungen summieren sich auf 1: PX (x) 1 x Beispiel: X = Augenzahl bei geworfenem Würfel P(X 1) P(X 2) ... P(X 6) PX (x) Px (X) P(X x) 1/6 1 6 1 für x 1,2,3,...,6 6 Wahrscheinlichkeits-/ 0 25 1 2 3 4 5 6 x Dichtefunktion für das Bsp. mit unabhängigen Ereignissen Alexander Spermann WS 2007/2008 Sitzung 1 Kumulierte Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen 1 Beziehung zwischen Wahrscheinlichkeitsfunktion und kumulierter Wahrscheinlichkeitsfunktion (cumulative probability function) ist gegeben als: FX (x0 ) P(X x0 ) P (x) x x0 X Die kumulierte Wahrscheinlichkeitsfunktion des Würfelbeispiels: 0 wenn x 0 1 j FX (x 0 ) wenn j x 0 j 1 (j 1,2,...,5) 6 1 wenn x 0 6 Grafik der kumulierten Wahrscheinlichkeitsfunktion aus dem Beispiel: FX (x0 ) 1 1/2 Für P(X3) = Px(X=1)+Px(X=2)+Px(X=3)= 0,5 0 26 1 2 3 4 5 6 x Alexander Spermann WS 2007/2008 Sitzung 1 Erwartungswert einer diskreten Zufallsvariable 1 Beispiel: Korrektur einer Stichprobe von Büchern, Zufallsvariable X =Tippfehler auf einer Seite • 81% der Seiten hatten keinen Tippfehler der Wert der Zufallsvariable x = 0 • 17% hatten einen Tippfehler x = 1 • 2% hatten zwei Tippfehler x = 2 Dies kann man schreiben als: Px (0) = 0,81 Px (1) = 0,17 Px (2) = 0,02 Um einen repräsentativen Mittelwert zu bekommen, müssen die jeweiligen Werte mit ihren Wahrscheinlichkeiten gewichtet werden Erwartungswert (expected value) 27 Alexander Spermann WS 2007/2008 Sitzung 1 Erwartungswert einer diskreten Zufallsvariable 2 Durch das Berechnen des Erwartungswertes erhalten wir den mittleren Wert einer diskreten Zufallsvariable. E(X) wird dann der Mittelwert der diskreten Zufallsvariable genannt. Notation: E(X) X xPX (x) x Beispiel: E(X Tippfehler) 0*0,81 1*0,17 2*0,02 0,21 X d.h. dass im Mittel auf jeder Seite 0,21 Tippfehler bzw. auf etwa jeder 5. Seite ein Tippfehler zu erwarten ist 28 Alexander Spermann WS 2007/2008 Sitzung 1 Erwartungswert, Varianz und Standardabweichung 1 Varianz: x)² Der Erwartungswert der quadrierten Streuung (X – μ gewichtet mit der Wahrscheinlichkeit X ² E (X X )² (x X )²PX (x) x Notation: Standardabweichung: Quadratwurzel der Varianz Notation: σx 29 Alexander Spermann WS 2007/2008 Sitzung 1 Erwartungswert, Varianz und Standardabweichung 2 Beispiel: Tippfehler Um die Varianz zu finden, muss zuerst der Erwartungswert gefunden werden: E(X Tippfehler) 0,21 X Varianz: X ² (x µX )²PX (x) x (0 0,21)² * 0,81 (1 0,21)² * 0,17 (2 0,21)² * 0,02 0,2059 und die Standardabweichung entsprechend: X X ² 0,2059 0,45 30 Alexander Spermann WS 2007/2008 Sitzung 1 Verteilungsfunktion einer stetigen Zufallsvariable 1 Stetige Zufallsvariablen: Werten Nicht abzählbare Anzahl an auf einem ‚Wertestrahl‘ (Kontinuum). Beispiele: Zeit, Entfernung, Temperatur. (continuous random variable) Verteilungsfunktion einer stetigen Zufallsvariable: Wahrscheinlichkeit, dass X den Wert x nicht übersteigt. Notation: FX (x) P(X x) Verteilungsfunktion einer stetigen Zufallsvariable entspricht der kumulierten Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable. 31 Alexander Spermann WS 2007/2008 Sitzung 1 Verteilungsfunktion einer stetigen Zufallsvariable 2 Beispiel: Nehmen wir an, dass ein Tunnel genau 1 km lang ist. Es werden die Unfälle im Tunnel beobachtet. Zufallsvariable: X = Entfernung vom Eingang des Tunnels zum Zeitpunkt des Unfalls. Die Wahrscheinlichkeit, dass ein Unfall passiert, ist für jede Teilstrecke gleich. Verteilungsfunktion dieser Grafik zum Beispiel: 1 0 für x 0 FX (x) x für 0 x 1 1 für x 1 Fx(x) Zufallsvariable ist: 0 1 x in km 32 Alexander Spermann WS 2007/2008 Sitzung 1 Verteilungsfunktion einer stetigen Zufallsvariable 3 Es ist unmöglich, die Wahrscheinlichkeit für einen bestimmten Wert, den die Zufallsvariable annimmt, zu berechnen. Es kann nur die Wahrscheinlichkeit berechnet werden, dass die Zufallsvariable einen Wert zwischen den Werten a und b annimmt. Diese Wahrscheinlichkeit ist: P (a < x < b) = Fx (b) – Fx (a) Im Beispiel: Da die Zufallsvariable zwischen 0 und 1 einheitlich verteilt ist, ist die Verteilungsfunktion in diesem Bereich: F x(x) = x Für a=1/4 und b=3/4 ist die Wahrscheinlichkeit, dass ein Unfall in diesem Bereich liegt: P (1/4< x < 3/4) = Fx (3/4) – Fx (1/4) = 3/4 – 1/4= 1/2 33 Alexander Spermann WS 2007/2008 Sitzung 1 Dichtefunktion einer stetigen Zufallsvariable 1 Die Dichtefunktion für eine stetige Zufallsvariable X ist eine Funktion mit folgenden Eigenschaften: fX (x) ≥ 0 für alle x - Werte Grafik der Dichtefunktion: a und b sind Werte der Zufallsvariable X, wobei a<b. Die Wahrscheinlichkeit, dass x zwischen a und b liegt, ist der Bereich unter der Kurve zwischen diesen zwei Werten. fx(x) Beispiel: x a 34 b Alexander Spermann WS 2007/2008 Sitzung 1 Dichtefunktion einer stetigen Zufallsvariable 2 Eigenschaften der Dichtefunktion: • Die Fläche unter der Dichtefunktion entspricht dem Wert 1. • Die Fläche unter der Kurve der Dichtefunktion, fX (x) , links von dem Wert x0 ist F x(x0) , wobei x0 irgendein Wert ist, den die Zufallsvariable annehmen kann. 35 Alexander Spermann WS 2007/2008 Sitzung 1 Dichte- und Verteilungsfunktion einer stetigen Zufallsvariable 3 – laut Beispiel 1 f x (x) Gesamtfläche = 1 1 Fx(x) 3/4 3/4 F(b)=3/4 =0,5 (50%) 1/2 1/2 = 0,5 1/4 1/4 F(a)=1/4 0 0 0 a ¼*1km=250m 36 1 a b 1 b ¾*1km=750m Alexander Spermann WS 2007/2008 Sitzung 1 Die Normalverteilung 1 fx(x) Stetige Verteilung, die in der Statistik eine zentrale Rolle spielt. µ fX (x) x 1 2² Eine Zufallsvariable X ist normalverteilt wenn ihre Dichtefunktion wie folgt aussieht: e( x µ)² / 2 ² für x Und: µ 0 2 e 2,71828...; 3,14159... 37 , wobei die Varianz immer positiv ist. Alexander Spermann WS 2007/2008 Sitzung 1 Die Normalverteilung 2 Eigenschaften: • Der Mittelwert der Zufallsvariable ist µ, also: • E (X) = μ Die Varianz der Zufallsvariable ist σ² also: Var(X) E(X µ)² ² • mit Standardabweichung: = σ • wobei gilt: je kleiner σ² , desto „enger“ liegt die Verteilung um den wahren Wert Die Form der Dichtefunktion ist eine symmetrische Glockenkurve mit dem Zentrum im Mittelwert µ. Notation: 38 X~ N (µ ,σ²) Alexander Spermann WS 2007/2008 Sitzung 1 Die Normalverteilung 3 0,3 f X (x) Standardnormalverteilung mit =1 und =0 0,4 2=2,25 und =3 0,2 Dichte f(x) Dichte f(x) 0,25 =2,25 und =1 0,15 0,1 0,3 2=1,44 und =0 0,2 2=4 und =0 0,1 0,05 0 0 -5 -4 -3 -2 -1 39 f X (x) 0,5 0 1 2 3 4 5 6 7 -5 -4 -3 -2 -1 0 1 2 3 4 5 Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Erwartungswert 1 Gezogene Zufallsstichproben der Grundgesamtheit sind: X1,X2,X3,…,Xn Der Stichprobenmittelwert ist dann: X 1 n Xi n i1 Es gilt, dass der Erwartungswert der Summe der Stichprobe gleich der Summe der Erwartungswerte ist: n E ( X i ) E ( X1 ) E ( X 2 ) ... E ( X n ) i 1 Da jede Zufallsstichprobe Xi den Mittelwert μX hat, können wir schreiben: n E( Xi ) nµX i 1 40 Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Erwartungswert 2 Der Erwartungswert des Mittelwertes der Stichprobe ist dann: E(X) E( nµ 1 n 1 n X ) E( Xi ) X µX i n i1 n i1 n Also entspricht der Erwartungswert des Mittelwertes der Stichprobe dem Mittelwert der Grundgesamtheit. Das heißt, dass der Mittelwert der Stichprobe ein erwartungstreuer Schätzer für den Mittelwert der Grundgesamtheit ist. 41 Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Erwartungswert 3 Erwartungswert des Schätzers = wahrer Wert, d.h. unverzerrt (unbiased). f (x ) n = 100 Dichtefunktionen der Normalverteilung für wahre Stichprobenmittelwerte vom Umfang n=25 und n=100 Beobachtungen, mit der Standardabweichung=5. n=25 100 42 x Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Erwartungswert 4 Beispiel: Es sollen Arbeitsteams aus jeweils 4 Beschäftigten mit Berufserfahrung von 2 bis 8 Jahren zusammengestellt werden. Es werden fünfzehn Stichproben von vier Beobachtungswerten aus einer Grundgesamtheit von sechs „Werten“: 2,4,6,6,7,8, gezogen. 43 Stichprobe Mittelwert Stichprobe Mittelwert 2,4,6,6 4,5 2,6,7,8 5,75 2,4,6,7 4,75 2,6,7,8 5,75 2,4,6,8 5 4,6,6,7 5,75 2,4,6,7 4,75 4,6,6,8 6 2,4,6,8 5 4,6,7,8 6,25 2,4,7,8 5,25 4,6,7,8 6,25 2,6,6,7 5,25 6,6,7,8 6,75 2,6,6,8 5,5 Der wahre Mittelwert (sample mean) dieser Grundgesamtheit ist der Durchschnitt dieser sechs Werte: μX =5,5 Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Erwartungswert 5 Die Häufigkeitsverteilung der Wahrscheinlichkeiten von Mittelwerten der Stichproben (sampling distribution of the sample mean) ist: 1 2 PX ( 4,75) 15 15 2 1 (5,25) PX (5,5) 15 15 1 2 (6) PX (6,25) 15 15 PX ( 4,5) PX PX PX (5) 2 15 3 15 1 (6,75) 15 PX (5,75) PX Der Erwartungswert des Mittelwertes der Stichprobe entspricht dem Mittelwert der Grundgesamtheit: E(X) xPX (x) 4,5 44 1 2 1 4,75 * ... 6,75 * 5,5 x 15 15 15 Alexander Spermann WS 2007/2008 Sitzung 1 Stichprobe und Grundgesamtheit: Varianz 1 Es werden n Beobachtungen X1,X2,X3,…,Xn aus der Grundgesamtheit zufällig gezogen, wobei der wahre Mittelwert und die wahre Varianz unbekannt sind. Die Varianz der Grundgesamtheit ist: ² E( X µ )² X Da aber μX geschätzt. X unbekannt ist, wird es durch Die Varianz der Stichprobe lautet: X (= Mittelwert der Stichprobe) 1 n s XX ² ( X i X )² n 1 i 1 E (s XX ²) X ² Mit Hilfe dieser Definition der SXX² kann gezeigt werden, dass Das bedeutet, dass der erwartete Wert der Stichprobenvarianz der Varianz der Grundgesamtheit entspricht. Man sagt dann, dass der Schätzer für die Varianz erwartungstreu ist. 45 Alexander Spermann WS 2007/2008 Sitzung 1 Kovarianz Kovarianz einer Stichprobe: sXY 1 n (xi x)(yi y) n 1 i1 wegen der Approximation von µ durch x und ŷ wird als „Kompensation“ durch (n-1), anstatt durch n dividiert, d.h es wird ein Freiheitsgrad „aufgegeben“. 46 Alexander Spermann WS 2007/2008 Sitzung 1 Kovarianz einer Stichprobe – ein Beispiel Quelle:Dougherty Erläuterung: S : Anzahl der Jahre in Ausbildung Y : Stundenlohn in Dollar (1992) 47 Alexander Spermann WS 2007/2008 Sitzung 1 Kovarianz einer Stichprobe – ein Beispiel Illustration der Kovarianz: Y S Quelle:Dougherty sSY 15,294 2 Interpretation von SSY2 = 15,294 : es liegt positiver Zusammenhang vor y = 14,225 und 48 s = 13,250 Alexander Spermann WS 2007/2008 Sitzung 1 Vergleich Kovarianz und Korrelationskoeffizient – ein Beispiel • Nach Multiplikation von Y mit 100, SSY‘2 = 1529,4 d.h. trotz Änderung der Dimension bleibt der Zusammenhang unverändert und wird lediglich in eine andere Größenordnung (*100) transformiert. Quelle: Dougherty 49 Alexander Spermann WS 2007/2008 Sitzung 1 Korrelationskoeffizient Formel: Beispiel: rXY rSY ' sXY ² sXX ²sYY ² sSY ' ² sSS ²sY ' Y ' ² 15,294 10,888 771080 0,55 gegeben Vorteil des Korrelationskoeffizienten gegenüber der Kovarianz: dimensionslos 1 rx , y 1 mit : 50 Alexander Spermann WS 2007/2008 Sitzung 1 Literatur Dougherty, Christopher; Introduction to Econometrics Gujarati, Damodar; Basic Econometrics (4th Edition) Wooldridge, Jeffrey; Introductory Econometrics Datensätze und weitere Infos vom und zum Autor auch unter: http://wooldridge.swcollege.com Chiang, Alpha C.; Fundamental Methods of Mathematical Economics Simon, Carl and Lawrence Blume; Mathematics for Economists 51 Alexander Spermann WS 2007/2008