Beispiel: Unternehmenskonzentration, Excel-Arbeitsblatt Urliste i Sektor A 1 2 3 4 5 80 360 200 300 60 Sektor B 0 0 0 1000 0 Sortiert [i] Sektor A 1 2 3 4 5 60 80 200 300 360 Anteile kumuliert X-Achse Sektor A Anteile [i] Sektor A 1 2 3 4 5 0,06 0,08 0,20 0,30 0,36 1,68 0,41 0,328 0 0 0 0 1000 Sektor B Sektor B 0,00 0,00 0,00 0,00 1,00 Gini-Koeffizient und bereinigtes LM-Maß V K K* Sektor B 0,50 1 0,8 0 0,2 0,4 0,6 0,8 1 0 0,06 0,14 0,34 0,64 1,00 0 0,00 0,00 0,00 0,00 1,00 Beispiel: Unternehmenskonzentration, Excel-Diagramm 1 Lorenzkurven für die Unternehmenskonzentration 0,9 Anteil am gesamten Umsatz 0,8 0,7 0,6 0,5 0,4 0,3 Sektor A 0,2 Sektor B 0,1 0 0 0,2 0,4 0,6 Anteil der Unternehmen 0,8 1 Schließende Statistik ! ! Die Stichprobenparameter wie z.B. Mittelwert und Varianz sind Zufallsvariablen Wenn es sich um zufällige Stichproben handelt, dann kann man aus der Wahrscheinlichkeitstheorie ableiten, wie diese Zufallsvariblen verteilt sind Beispiel zur Veranschaulichung der Verteilung eines Stichprobenmittelwertes (Würfel) ! Man stelle sich die Verteilung des Mittelwertes der Augenzahl beim Werfen eines (fairen, pi=1/6) Würfels vor, wobei man die Stichprobengröße 1,...,n variiert und die Ergebnisse vergleicht. Man beginnt also mit Stichproben der Größe 1 und berechnet die Wahrscheinlichkeit der Ausprägungen für die möglichen Mittelwerte. Dann erhöht man die Stichprobengröße auf 2 und so weiter. Der Mittelwert der unendlich großen Grundgesamtheit ist 3,5. n=1 Density .2 .15 .1 .05 -1 0 Density 1 2 3 4 5 6 7 8 n=2 .3 .2 .1 -.5 0 .5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 Der zentrale Grenzwertsatz der Statistik Die Verteilung des arithmetischen Mittels (X) von n unabhängig, identisch verteilten Zufallsvariablen Xi mit i=1,...,n strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit E[X]=µx und der Varianz Var(X)=σ2/n. Das arithmetische Mittel ist also asymptotisch normalverteilt. Die Normalverteilung 1 N ( x | µ ,σ ) = e σ 2π 1 x −µ − 2 σ Hierbei handelt es sich um die Dichtefunktion, die die Wahrscheinlichkeit für das Eintreten der Ausprägung x Angibt. Diese wird bei einer Normalverteilung nur durch den Mittelwert der Größe und dessen Streuung bestimmt. Was ist also der Erwartungswert und die Streuung des Stichprobenmittelwertes? ! Erwartungswert (Mittelwert): 1 E [ x ] = E ( x1 + .... + xn ) = µ x n ! Streuung (Varianz): 1 σ Var [ x ] = Var ( x1 + .... + xn ) = n n 2 Schätzung der Varianz der Grundgesamtheit ! Stichprobenvarianz: n 1 2 2 S = ( xi − x ) ∑ n − 1 i =1 Es gilt, dass: E S 2 = σ 2 Die Zahl der Freiheitsgrade (FG) ! Die Zahl der Freiheitsgrade (FG) einer Zufallsvariable ist die Zahl der frei verfügbaren Beobachtungen. Das entspricht der Zahl der Beobachtungen minus der Zahl der geschätzten Parameter, die für die Berechnung der Zufallsvariable benötigt werden. Bsp. Varianz: Für die Schätzung der Varianz braucht man einen Schätzer für den Mittelwert. Dadurch reduziert sich die Zahl der FG auf n-1 Fehler bei Hypothesentests Entscheidung Ho trifft zu Ho wird nicht Richtige abgelehnt Entscheidung Ho wird abgelehnt Fehler erster Art (alpha-Fehler) Ho trifft nicht zu Fehler zweiter Art (beta-Fehler) Richtige Entscheidung Schließende Statistik Vorgehensweise bei statistischen Tests ! Aufstellen von Null- und Alternativhypothese ! Wählen des Signifikanzniveaus ! Festlegen der Prüfgröße und dessen Verteilung ! Bestimmung des kritischen Bereiches ! Berechnung der empirischen Prüfgröße ! Entscheidung (Ho ablehnen oder nicht) und Interpretation im Sinne der Fragestellung Schließende Statistik Vorgehensweise bei statistischen Tests (BSP.) ! Ho:Rauchen Frauen genauso viel wie Männer H0 : µx = µ y ! Alpha gleich 5% ! Festlegen der Prüfgröße und dessen Verteilung z= ( x − y ) − ( µx − µ y ) S x2 ! ! ! S 2 y ∼ asymptotisch standardnormalverteilt + nx ny Bestimmung des 95% Konfidenzintervalls Berechnung der empirischen Prüfgröße Wenn Ho nicht abgelehnt wird dann rauchen Frauen genauso viel wie Männer Fragebogen: Konsumgewohnheiten der Studierenden Geschlecht Weiblich= 1, männlich=0 φ Zahl der Zigaretten Stück pro Tag φ Konsum an Schokolade In Gramm pro Tag