Statistik - Übungen SS 2016 Blatt 1: Beschreibende Statistik 1. Wir unterscheiden verschiedene Arten von Merkmalen. Nennen Sie für jedes Erhebungsmerkmal eine zulässige Ausprägung, geben Sie jeweils eine (sachlogisch) plausible Skalierung an und bestimmen Sie, ob das Merkmal stetig oder diskret ist: Merkmal Ausprägung Skalenniveau diskret/stetig Lebensalter (vollendete Jahre) Geschlecht Nationalität Monatliche Miete Familienstand Beruf Unternehmensrating Akademischer Grad Einkommen Postleitzahl Schuhgröße Erwerbslosenanteil Statistik Übungen Blatt 1 1 SS 2016 2. Zum Abschluss einer Statistikübung wurden die 48 Studierenden aufgefordert, diese Lehrveranstaltung zu beurteilen. Eine zu beurteilende Aussage lautete: „Der vermittelte Stoff war gut verständlich“. Die Beurteilung erfolgte in einer fünfteiligen Skala mit den möglichen Antworten: 1: stimme sehr zu 2: stimme eher zu 3: weder noch 4: stimme weniger zu 5: stimme gar nicht zu Die Beurteilungen wurden in der nachfolgenden Tabelle zusammengefasst: 1 1 1 2 3 4 3 2 5 4 5 4 1 2 3 3 4 4 3 3 4 2 2 3 3 4 5 4 4 3 1 1 1 1 5 4 1 4 5 1 2 2 3 3 5 4 1 1 a) Wie ist das Merkmal skaliert? b) Wie lautet die (ursprüngliche) Tabelle der absoluten und der relativen Häufigkeiten? c) Stellen Sie die Daten in einem Stabdiagramm dar. d) Stellen Sie die Daten in einem Kreisdiagramm dar. e) Bestimmen Sie den geeigneten Lageparameter. 3. P Die Größe von Familien, die in einem Dorf leben, sind in folgender Häufigkeitstabelle zusammengefasst: Familiengröße 2 3 4 5 6 7 8 Anzahl 34 43 39 13 5 4 2 a) Geben Sie die relativen und die kumulierten relativen Häufigkeiten an. b) Stellen Sie die Daten durch ein Stabdiagramm dar. 4. Betrachten Sie die Daten des vorigen Beispiels. a) Skizzieren Sie die empirische Verteilungsfunktion. b) Berechnen Sie geeignete Lagemaße und begründen Sie ihre Wahl. Statistik Übungen Blatt 1 2 SS 2016 5. Die acht Filialen eines Kaufhauskonzerns erzielten 2014 folgende Umsätze (in Mio. Euro): Filiale i 1 2 3 4 5 6 7 8 Umsatz xi 56 59 66 70 58 78 65 86 a) Von welchem Typ und welcher Skalierung ist das Merkmal „Umsatz“? b) Berechnen Sie Modalwert, Median, Mittelwert, Varianz und Standardabweichung, Variationskoeffizient und Quartilsabstand und interpretieren Sie all diese Zahlen! Welche dieser Kennzahlen sind aussagekräftig? c) Zeichnen und interpretieren Sie einen Boxplot zu diesen Daten. d) Wie verändert eine falsche Zahl, wenn etwa statt „58“ der Wert „580“ eingegeben wurde, die Kennzahlen Median, Mittelwert, Quartilsabstand und Standardabweichung? 6. Das jährliche Haushaltseinkommen der Privathaushalte einer bestimmten Stadt für das Jahr 2014 ist in der folgenden Tabelle zusammengefasst: Jährl. Haushaltseinkommen in 1000 € [10, 25[ [25, 30[ [30, 40[ [40, 60[ [60, 90] 30 10 40 40 30 Anzahl der Haushalte (in 1000) a) Zeichnen Sie das zugehörige Histogramm! b) Zeichnen Sie die approximierende Verteilungsfunktion und markieren Sie in der Zeichnung den Median! c) Errechnen Sie den Median genau. Was bedeutet diese Zahl? Wie sinnvoll ist deren genaue Berechnung? 7. P In der nachstehenden Tabelle sind die Mietpreise (in €/m2 ) von 120 Zwei-ZimmerMietwohnungen in vergleichbarer Wohnlage, die im ersten Quartal auf dem Wohnungsmarkt einer Kleinstadt angeboten wurden, angegeben: Mietpreis (in €/m2 ) [von, bis[ Anzahl der Wohnungen [2, 3[ [3, 6[ [6, 12[ [12, 18] 5 30 75 10 a) Zeichnen Sie das zugehörige Histogramm! b) Zeichnen Sie die approximierende Verteilungsfunktion und markieren Sie in der Zeichnung den Median. c) Wie groß ist und was bedeutet die kumulierte relative Häufigkeit an der Stelle 12? 8. Betrachten Sie die Daten des vorigen Beispiels. a) Berechnen sie soweit möglich Mittelwert und Standardabweichung. b) Aus einer weiteren Erhebung mit 80 Zwei-Zimmer-Mietwohnungen ergab sich ein Mittelwert von 7,44 €/m2 . Wie groß ist – soweit berechenbar – der mittlere Mietpreis in allen 200 Wohnungen? c) Kann man auch die Varianz aller 200 Wohnungen bestimmen, wenn man weiß, dass die neuen 80 Beobachtungen eine Varianz von 10 aufweisen? Statistik Übungen Blatt 1 3 SS 2016 9. P In einer Umfrage wurde nach der Zustimmung zur Meinung: „Soziale Unterschiede sind gerecht“ gefragt. (Vgl. V168 ALLBUS 1998: die allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) – ist eine seit 1980 in Deutschland durchgeführte repräsentative Bevölkerungsbefragung mit ca. 3.000 Personen). Die Beurteilung erfolgte in einer vierteiligen Skala mit den möglichen Antworten: 1: stimme voll zu 2: stimme eher zu 3: stimme eher nicht zu 4: stimme gar nicht zu Die folgenden 20 Rohdaten könnten dieser Umfrage entnommen sein: Person 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Antwort 4 4 3 3 2 2 2 3 1 4 3 4 4 2 3 4 4 3 1 2 In derselben Umfrage wurde auch das Einkommen erhoben. Die Rohdaten für das Einkommen (in Euro) der oben befragten Personen lauteten: Person 1 2 3 4 5 6 7 8 9 10 Einkommen 800 2500 1900 2100 1900 2500 2150 3300 4100 900 Person 11 12 13 14 15 16 17 18 19 20 1800 1400 3600 2100 600 2200 2480 800 1400 2700 Einkommen a) Erstellen Sie jeweils eine geeignete Tabelle einer Häufigkeitsverteilung, indem Sie jeweils die absoluten, relativen und die kumulierten relativen Häufigkeiten angeben. b) Zeichnen Sie die empirische Verteilungsfunktion Statistik Übungen Blatt 1 4 SS 2016 10. P Die folgenden Häufigkeitstabellen stammen aus zwei Umfragen, die über die Zustimmung zur Meinung: „Soziale Unterschiede sind gerecht“ einmal in Deutschland (Vgl. V168 ALLBUS 1998) und einmal in den USA (Vgl. USCLASS8 im GSS = General Social Survey der USA 1984) durchgeführt wurden. Soziale Unterschiede sind gerecht Häufigkeit Gültig STIMME VOLL ZU 151 STIMME EHER ZU 587 STIMME EHER NICHT ZU 1168 STIMME GAR NICHT ZU 964 Gesamt Fehlend 2870 WEISS NICHT 135 KEINE ANGABE 7 Gesamt 142 Gesamt 3012 Social Differences are acceptable Häufigkeit Gültig STRONGLY AGREE 113 SOMEWHAT AGREE 635 SOMEWHAT DISAGREE 447 STRONGLY DISAGREE 192 Total Fehlend 1387 NO OPINION 61 NO ANSWER 5 Total 66 Total 1453 Lassen sich hinsichtlich der Meinung Unterschiede zwischen den USA und Deutschland feststellen? Begründen Sie ausführlich! Statistik Übungen Blatt 1 5 SS 2016 11. Ein Anleger kauft am 15.1., am 15.4. und am 15.7. eines Jahres jeweils Aktien eines Ölkonzerns. Der Kurs der Aktie betrug an diesen Börsetagen: Börsentag i 15.1. 15.4. 15.7. Kurs (€/Aktie) xi 200 250 400 Wie hoch ist der durchschnittliche Kaufpreis pro Aktie, wenn der Anleger: a) am 15.1. und am 15.4. jeweils 40 Aktien und am 15.7. noch einmal 20 Aktien kauft? b) am 15.1. und am 15.4. für jeweils 10.000 € und am 15.7. für 4.000 € Aktien kauft? 12. P Betrachten Sie die Daten des vorigen Beispiels. Wie hoch ist der durchschnittliche Kaufpreis pro Aktie, wenn der Anleger: a) am 15.1. und am 15.4. jeweils 35 % und am 15.7. die restlichen 30 % der insgesamt erworbenen Aktien gekauft hat? b) am 15.1. und am 15.4. jeweils 35 % und am 15.7. die restlichen 30 % des insgesamt ausgegebenen Budgets verwendet hat? 13. In Deutschland wird das Abitur zentral gestellt und mit Punkten von 0 bis 15 bewertet. Acht Abiturienten erreichten in den Fächern „Deutsch“ und „Mathematik“ die folgenden Punktezahlen: Deutsch 13 14 8 10 15 1 12 11 Mathematik 15 8 1 7 9 4 5 10 a) Berechnen Sie den Pearson-Korrelationskoeffizienten b) Berechnen Sie den Pearson-Korrelationskoeffizienten der Ränge c) Berechnen Sie den Rangkorrelationskoeffizienten gemäß Spearman-Formel! Statistik Übungen Blatt 1 6 SS 2016 14. P Folgendes Streudiagramm ist zu beurteilen: Gibt es einen (starken? schwachen?) linearen Zusammenhang? Lesen Sie so gut wie möglich die Daten ab und berechnen Sie damit den Pearson-Korrelationskoeffizienten und die Gleichung der Regressionsgeraden: 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 15. P Für acht Unternehmen desselben Wirtschaftszweiges soll untersucht werden, welcher Zusammenhang zwischen Umsatz und Beschäftigtenzahl besteht. Im Jahr 2015 wurden folgende Zahlen festgestellt: Beschäftigte (in Tsd.) 0,4 0,5 0,8 1,0 1,3 1,4 1,7 2,2 Umsatz (in Mio. Euro) 80 150 120 190 280 240 260 300 Bestimmen Sie den (Pearson-) Korrelationskoeffizienten und die Regressionsgerade zur Beschreibung der Abhängigkeit des Umsatzes von der Anzahl der Beschäftigten. 16. P Bei einem Bewerbungsgespräch wurden sieben Bewerber sowohl von einem externen Unternehmensberater als auch vom Leiter der Personalabteilung bewertet. Beide konnten dabei Bewertungen zwischen 1 (= „sehr schlecht“) und 6 (= „ausgezeichnet“) vergeben. Es ergab sich folgende Bewertung: Bewerber 1 2 3 4 5 6 7 Punkte des Unternehmensberaters 6 4 1 5 3 2 5 Punkte des Leiters der Personalabteilung 5 4 2 6 2 3 4 Bestimmen Sie geeignete Kennzahlen um den Zusammenhang zwischen den beiden Wertungen zu beschreiben! Begründen Sie Ihre Wahl und interpretieren Sie Ihr Ergebnis. Statistik Übungen Blatt 1 7 SS 2016 17. Um eine möglicherweise vorhandene Abhängigkeit zwischen höchstem Schulabschluss und regionaler Herkunft aufzudecken, wurden dreißigjährige Personen befragt und man erhielt folgende Ergebnisse in Form einer Tabelle: Schulabschluss Universität oder FH Matura Hauptschule Wien, Salzburg, Graz 55 21 24 Andere Bezirkshauptstädte 85 34 31 Herkunft Summe Berechnen Sie eine geeignete Kennzahl, um eine Aussage über die Abhängigkeit treffen zu können! 18. Die Umsatzentwicklung eines Unternehmens für die ersten sechs Monate des Jahres 2014 ist in folgender Tabelle dargestellt: Monat Jan Feb Mär Apr Mai Jun Umsatz (in Mio.) 376 455 568 685 844 1020 a) Bestimmen Sie die Koeffizienten der Regressionsgeraden (Trendgeraden) und prognostizieren sie damit den Umsatz für Juli und Dezember des Jahres 2014. b) Um wie viel Prozent ist der Umsatz jeweils in den Monatsabständen gewachsen? c) Um wie viel Prozent ist der Umsatz in den Monaten Januar bis Juni des Jahres 2014 insgesamt gewachsen, um wie viel Prozent im Monatsdurchschnitt? d) Prognostizieren sie auch mit Hilfe der Lösung von c) die Umsatzzahlen für die Monate Juli und Dezember des Jahres 2014. 19. P Preise und Mengen für einen Warenkorb aus drei Gütern sind für die Jahre 2014 und 2015 in der folgenden Tabelle angegeben: Gut 2014 2015 Preis Menge Preis Menge Brot (1kg) 2,1 70 2,3 75 Käse (100g) 1,5 55 1,6 60 Wein (0,75l) 4,2 200 3,9 220 a) Bestimmen Sie zur Basis 2014 den Preisindex nach Laspeyres. b) Bestimmen Sie für den gesamten Warenkorb den Preisindex nach Paasche! c) Berechnen Sie dazu auch den Umsatzindex. Statistik Übungen Blatt 1 8 SS 2016 20. Betrachten Sie die Daten des vorigen Beispiels. a) Fassen Sie Brot und Käse jeweils zu einer Produktgruppe zusammen, Wein soll eine zweite „Produktgruppe“ bilden. Berechnen Sie für diese Gruppen jeweils den (Sub)Preisindex und damit den Gesamtindex. b) Bestimmen Sie die prozentuale Preisänderung dieses Warenkorbes von 1991 auf 2015, wenn von 1991 auf 2001 der Preisindex 1,48 betrug und von 2001 auf 2014 die Preise jährlich um 1,8 Prozent gestiegen sind! 21. Der Jahresdurchschnitt des österreichischen VPI ist für verschiedene Jahre angegeben. Die jeweiligen Bezugsjahreszahlen – sie ändern sich alle 10 Jahre – sind die Jahre 1976, 1986 und 1996 bzw. ab 2000 alle 5 Jahre. Die (echten) Daten sind als „Indexprozent“ angegeben. Jahr 1986 1990 1996 2000 2003 2005 2010 2015 VPI in % 155,5 109,5 130,8 105,2 105,9 110,6 109,5 110,7 a) Berechnen Sie die Werte des VPI bezogen auf das Basisjahr 1976. b) Um wie viel sind die Preise von 2003 auf 2015 insgesamt gestiegen? c) Um wie viel sind die Preise von 2003 auf 2015 im Durchschnitt jährlich gestiegen? 22. P In nachstehender Tabelle ist der durchschnittliche Verbraucherpreisindex (Preisindex für die Lebenshaltung) für Österreich für den Zeitraum 2005 bis 2014 wiedergegeben. Da dieser Index nach Laspeyres ermittelt wird, ist es nötig den zugrundeliegenden Warenkorb in bestimmten Abständen zu aktualisieren. Laut EU-Verordnung (EC Nr.2494/95), haben Revisionen in 5-Jahres-Intervallen zu erfolgen. Seit dem Jahr 2000 wird dies in Österreich umgesetzt: Jahr 2005 2006 2007 2008 2009 2010 I05,i 100,0 101,5 103,7 107,0 107,5 109,5 100 I10,i 2011 2012 2013 2014 2015 103,3 105,8 107,9 109,7 110,7 a) Um wie viel Prozent sind die Preise von 2005 bis 2007, 2011, 2012, 2014 und 2015 gestiegen? b) Um wie viel Prozent sind die Preise von 2007 bis 2015 gestiegen? c) Warum kann die für 2011 durch Verknüpfung ermittelte Indexzahl zur Basis 2005 von der durch die Statistik Austria empirisch ermittelten Indexzahl für 2011, 2012, ... abweichen? Statistik Übungen Blatt 1 9 SS 2016 23. Ein Unternehmen bezieht Energie in Form von Strom, Öl und Gas. Die Durchschnittspreise für Öl sind in den angegebenen Jahren folgender Tabelle zu entnehmen: Jahr 2005 2006 2007 2008 2009 2010 Preis pro Barrel in EUR 42,7 52,0 52,2 67,9 43,5 56,2 a) Bei den Ausgaben für die verschiedenen Energiearten entfallen auf: Strom 65 % Gas 25 % Öl 10 % Von 2005 bis 2010 stiegen die Stromkosten um 12%, Gas wurde um acht Prozent teurer. Die Preisentwicklung von Öl ist obiger Tabelle zu entnehmen. Um wie viel Prozent sind die Verbrauchsausgaben für alle Energiearten zusammengenommen 2010 teurer als 2005? b) Für den „Warenkorb Energie“ sind folgende Indexzahlen bekannt: Man beachte die Umbasierungen! 1973 1976 1986 1996 2000 100 120 165 150 122 i. Um wie viel Prozent war Energie für das Unternehmen 2000 teurer als 1973? ii. Um wie viel Prozent war Energie 1986 billiger als 1996? Statistik Übungen Blatt 1 10 SS 2016 24. P Der Warenkorb zur Bestimmung des Verbraucherpreisindexes (berechnet nach Laspeyres) besteht aus vier Gütern (A, B, C, D). Während die Preise von A, B und C auf dem freien Markt gebildet werden, wird der Preis des Gutes D von der Regierung festgesetzt. In folgender Tabelle sind die aktuellen Preise, die von einem Wirtschaftsforschungsinstitut geschätzte Preisentwicklung der nächsten Periode (für A, B, C), sowie die aktuellen Verbrauchsmengen angegeben: Produkt A B C D aktuelle Menge 142 100 60 78 aktueller Preis 10 7 13 9 geschätzter Preis 11 6 14 a) Berechnen sie unter der Annahme, dass der Preis für D mit 12 GE festgesetzt wird, den Preisindex nach Laspeyres. b) Berechnen sie den Umsatzindex (in %) unter der Annahme, dass der Preis für D mit 12 GE festgesetzt wird, und folgende Mengenänderungen eintreten: i. die Mengen von A und D bleiben gleich, ii. durch die Preisverschiebung erhöht sich die Verbrauchsmenge von C um 10 %, und verringert sich die Verbrauchsmenge von B um 5 %. 25. Betrachten Sie die Daten des vorigen Beispiels. Wie hoch darf die Regierung den Preis von Produkt D maximal festsetzen, damit das wirtschaftspolitische Ziel „Inflationsrate von höchstens 3 %“ in der nächsten Periode nicht verletzt wird? Die mit P gekennzeichneten Beispiele sind von den Studierenden vorzubereiten und nach Aufruf durch den/die Lehrveranstaltungsleiter/in an der Tafel zu präsentieren! Statistik Übungen Blatt 1 11 SS 2016