Statistik – Übungen SS 2017 Blatt 1: Beschreibende Statistik 1. Wir unterscheiden verschiedene Arten von Merkmalen. Nennen Sie für jedes Erhebungsmerkmal eine zulässige Ausprägung, geben Sie jeweils eine (sachlogisch) plausible Skalierung an und bestimmen Sie, ob das Merkmal stetig oder diskret ist: Merkmal Ausprägung Skalenniveau diskret/stetig Lebensalter (vollendete Jahre) Geschlecht Nationalität Monatliche Miete Familienstand Beruf Unternehmensrating Akademischer Grad Einkommen Postleitzahl Schuhgröße Erwerbslosenanteil Statistik Übungen Blatt 1 1 SS 2017 2. Zum Abschluss einer Statistikübung wurden die 48 Studierenden aufgefordert, diese Lehrveranstaltung zu beurteilen. Eine zu beurteilende Aussage lautete: „Der vermittelte Stoff war gut verständlich“. Die Beurteilung erfolgte in einer fünfteiligen Skala mit den möglichen Antworten: 1: 2: 3: 4: 5: stimme sehr zu stimme eher zu weder noch stimme weniger zu stimme gar nicht zu Die Beurteilungen wurden in der nachfolgenden Tabelle zusammengefasst: 1 1 3 1 a) b) c) d) e) 1 2 4 4 1 3 5 5 2 3 4 1 3 4 4 2 4 4 3 2 3 3 1 3 2 3 1 3 5 4 1 5 4 2 1 4 5 2 5 1 4 3 4 1 Wie ist das Merkmal skaliert? Wie lautet die (ursprüngliche) Tabelle der absoluten und der relativen Häufigkeiten? Stellen Sie die Daten in einem Stabdiagramm dar. Stellen Sie die Daten in einem Kreisdiagramm dar. Bestimmen Sie den geeigneten Lageparameter. 3. P Die Größe von Familien, die in einem Dorf leben, sind in folgender Häufigkeitstabelle zusammengefasst: Familiengröße Anzahl 2 26 3 32 4 28 5 24 6 10 a) Geben Sie die relativen und die kumulierten relativen Häufigkeiten an. b) Stellen Sie die Daten durch ein Stabdiagramm dar. 4. Betrachten Sie die Daten des vorigen Beispiels. a) Skizzieren Sie die empirische Verteilungsfunktion. b) Berechnen Sie geeignete Lagemaße und begründen Sie ihre Wahl. Statistik Übungen Blatt 1 2 SS 2017 5. Die acht Filialen eines Kaufhauskonzerns erzielten 2016 folgende Umsätze (in Mio. Euro): Filiale i Umsatz xi 1 56 2 59 3 66 4 70 5 58 6 78 7 65 8 86 a) Von welchem Typ und welcher Skalierung ist das Merkmal Umsatz“? ” b) Berechnen Sie Modalwert, Median, Mittelwert, Varianz und Standardabweichung, Variationskoeffizient und Quartilsabstand und interpretieren Sie all diese Zahlen! Welche dieser Kennzahlen sind aussagekräftig? c) Zeichnen und interpretieren Sie einen Boxplot zu diesen Daten. d) Wie verändert eine falsche Zahl, wenn etwa statt „58“ der Wert „580“ eingegeben wurde, die Kennzahlen Median, Mittelwert, Quartilsabstand und Standardabweichung? 6. Das jährliche Haushaltseinkommen der Privathaushalte einer bestimmten Stadt für das Jahr 2015 ist in der folgenden Tabelle zusammengefasst: Jährl. Haushaltseinkommen in 1.000 e Anzahl der Haushalte (in 1.000) [10, 25[ 30 [25, 30[ 10 [30, 40[ 40 [40, 60[ 40 [60, 90] 30 a) Zeichnen Sie das zugehörige Histogramm! b) Zeichnen Sie die approximierende Verteilungsfunktion und markieren Sie in der Zeichnung den Median! c) Errechnen Sie den Median genau. Was bedeutet diese Zahl? Wie sinnvoll ist deren genaue Berechnung? 7. P In der nachstehenden Tabelle sind die Mietpreise (in e/m2 ) von Zwei-Zimmer-Mietwohnungen in vergleichbarer Wohnlage, die im ersten Quartal auf dem Wohnungsmarkt einer Kleinstadt angeboten wurden, angegeben: Mietpreis (in e/m2 ) [von, bis[ Anzahl der Wohnungen [2, 6[ 10 [6, 9[ 30 [9, 12[ 36 [12, 18] 24 a) Zeichnen Sie das zugehörige Histogramm! b) Zeichnen Sie die approximierende Verteilungsfunktion und markieren Sie in der Zeichnung den Median. c) Wie groß ist und was bedeutet die kumulierte relative Häufigkeit an der Stelle 12? 8. Betrachten Sie die Daten des vorigen Beispiels. a) Berechnen sie soweit möglich Mittelwert und Standardabweichung. b) Aus einer weiteren Erhebung mit 80 Zwei-Zimmer-Mietwohnungen ergab sich ein Mittelwert von 7,44 e/m2 . Wie groß ist – soweit berechenbar – der mittlere Mietpreis in allen Wohnungen? c) Kann man auch die Standardabweichung aller Wohnungen bestimmen, wenn man weiß, dass die neuen 80 Beobachtungen eine Standardabweichung von 3 aufweisen? Statistik Übungen Blatt 1 3 SS 2017 9. P In einer Umfrage wurde nach der Zustimmung zur Meinung: „Soziale Unterschiede sind gerecht“ gefragt. (Vgl. V168 ALLBUS 1998: die allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) – ist eine seit 1980 in Deutschland durchgeführte repräsentative Bevölkerungsbefragung mit ca. 3.000 Personen). Die Beurteilung erfolgte in einer vierteiligen Skala mit den möglichen Antworten: 1: 2: 3: 4: stimme stimme stimme stimme voll zu eher zu eher nicht zu gar nicht zu Die folgenden 20 Rohdaten könnten dieser Umfrage entnommen sein: Person Antwort 1 4 2 3 3 4 4 1 5 3 6 3 7 2 8 2 9 2 10 3 11 1 12 4 13 2 14 3 15 4 16 2 17 3 18 3 19 4 In derselben Umfrage wurde auch das Einkommen erhoben. Die Rohdaten für das Einkommen (in Euro) der oben befragten Personen lauteten: Person Einkommen 1 1800 2 1400 3 4200 4 2100 5 600 6 2200 7 3480 8 800 9 1400 10 2700 Person Einkommen 11 800 12 3500 13 1900 14 2100 15 1900 16 2500 17 2150 18 3300 19 4100 20 900 a) Erstellen Sie jeweils eine geeignete Tabelle einer Häufigkeitsverteilung, indem Sie jeweils die absoluten, relativen und die kumulierten relativen Häufigkeiten angeben. b) Zeichnen Sie die empirische Verteilungsfunktion Statistik Übungen Blatt 1 4 SS 2017 20 3 10. P Die folgenden Häufigkeitstabellen stammen aus zwei Umfragen, die über die Zustimmung zur Meinung: „Soziale Unterschiede sind gerecht“ einmal in Deutschland (Vgl. V168 ALLBUS 1998) und einmal in den USA (Vgl. USCLASS8 im GSS = General Social Survey der USA 1984) durchgeführt wurden. Soziale Unterschiede sind gerecht Gültig STIMME STIMME STIMME STIMME Gesamt VOLL ZU EHER ZU EHER NICHT ZU GAR NICHT ZU Fehlend WEISS NICHT KEINE ANGABE Gesamt Häufigkeit 152 685 1.216 1.003 3.056 149 15 164 3.220 Gesamt Social Differences are acceptable Gültig STRONGLY AGREE SOMEWHAT AGREE SOMEWHAT DISAGREE STRONGLY DISAGREE Total Fehlend NO OPINION NO ANSWER Total Total Häufigkeit 165 892 594 243 1.894 53 3 56 1.950 Lassen sich hinsichtlich der Meinung Unterschiede zwischen den USA und Deutschland feststellen? Begründen Sie ausführlich! Statistik Übungen Blatt 1 5 SS 2017 11. Ein Anleger kauft am 15.1., am 15.4. und am 15.7. eines Jahres jeweils Aktien eines Ölkonzerns. Der Kurs der Aktie betrug an diesen Börsetagen: Börsentag i Kurs (e/Aktie) xi 15.1. 200 15.4. 250 15.7. 400 Wie hoch ist der durchschnittliche Kaufpreis pro Aktie, wenn der Anleger: a) am 15.1. und am 15.4. jeweils 40 Aktien und am 15.7. noch einmal 20 Aktien kauft? b) am 15.1. und am 15.4. für jeweils e 10.000 und am 15.7. für e 4.000 Aktien kauft? 12. P Betrachten Sie die Tabelle des vorigen Beispiels – und nur die Tabelle, also nicht die Anzahl der erworbenen Aktien oder die Höhe des verwendeten Budgets. Wie hoch ist der durchschnittliche Kaufpreis pro Aktie, wenn der Anleger: a) am 15.1. und am 15.4. jeweils 25 % und am 15.7. die restlichen 50 % der insgesamt erworbenen Aktien gekauft hat? b) am 15.1. und am 15.4. jeweils 25 % und am 15.7. die restlichen 50 % des insgesamt ausgegebenen Budgets verwendet hat? 13. In Deutschland wird das Abitur zentral gestellt und mit Punkten von 0 bis 15 bewertet. Acht Abiturienten erreichten in den Fächern Deutsch“ und Mathematik“ die folgenden ” ” Punktezahlen: Deutsch Mathematik a) b) c) d) 13 15 14 8 8 1 10 7 15 9 1 4 12 5 11 10 Berechnen Sie den Pearson-Korrelationskoeffizienten Berechnen Sie den Pearson-Korrelationskoeffizienten der Ränge Berechnen Sie den Rangkorrelationskoeffizienten gemäß Spearman-Formel! Geben Sie die Gleichung der Regressionsgeraden zur Beschreibung der Abhängigkeit der Punkte in Mathematik von den Punkten in Deutsch an. 14. P Für acht Unternehmen desselben Wirtschaftszweiges soll untersucht werden, welcher Zusammenhang zwischen Umsatz und Beschäftigtenzahl besteht. Im Jahr 2015 wurden folgende Zahlen festgestellt: Beschäftigte (in Tsd.) Umsatz (in Mio. Euro) 0,3 60 0,8 100 1,2 260 1,6 220 0,6 130 1,1 150 1,5 210 2,3 280 Bestimmen Sie den (Pearson-) Korrelationskoeffizienten und die Regressionsgerade zur Beschreibung der Abhängigkeit des Umsatzes von der Anzahl der Beschäftigten. Gibt es einen (starken? schwachen?) linearen Zusammenhang? Zeichnen Sie die Regressionsgerade. Statistik Übungen Blatt 1 6 SS 2017 15. P In einem Betrieb wurden für sieben Lehrlinge jeweils der Notenschnitt des Abschlusszeugnisses aus der Schule und eine im Betrieb ermittelte Leistungskennzahl miteinander verglichen. Für die Leistungskennzahl wurden dabei Bewertungen zwischen 1 (= „sehr schlecht“) und 6 (= „ausgezeichnet“) vergeben. Lehrling Notenschnitt L-Kennzahl 1 2 3 4 5 6 7 1,5 4 2,7 3 2,1 3 1,8 5 2,5 4 3,2 2 1,3 6 Bestimmen Sie zwei unterschiedliche Kennzahlen, um den Zusammenhang zwischen den beiden Merkmalen zu beschreiben. Welche der beiden ist besser geeignet? Begründen Sie Ihre Wahl unter Berücksichtigung der Skalierung und interpretieren Sie Ihr Ergebnis. 16. Um eine möglicherweise vorhandene Abhängigkeit zwischen höchstem Schulabschluss und regionaler Herkunft aufzudecken, wurden dreißigjährige Personen befragt und man erhielt folgende Ergebnisse in Form einer Tabelle: Schulabschluss Universität/FH Matura 55 21 Herkunft Wien, Salzburg, Graz Andere Bezirkshauptstädte 85 Hauptschule Summe 24 31 34 Summe Berechnen Sie eine geeignete Kennzahl, um eine Aussage über die Abhängigkeit treffen zu können! 17. Die Bevölkerung Indiens von 1951 bis 2011 wird gemäß Census of India“ in folgender ” Tabelle dargestellt: Jahr Bev. (in Mio.) 1951 361 1961 439 1971 548 1981 683 1991 846 2001 1.029 2011 1.211 a) Bestimmen Sie die Koeffizienten der Regressionsgeraden (Trendgeraden) und prognostizieren sie damit den Wert für 2021 und 2031. b) Um wie viel Prozent ist die Bevölkerung Indiens jeweils in den Zehnjahresabständen gewachsen? c) Um wie viel Prozent ist die Bevölkerung Indiens in den Jahren 1951 bis 2011 insgesamt gewachsen, um wie viel Prozent im Jahresdurchschnitt? Geeignete Mittelwertbildung! d) Prognostizieren sie auch mit Hilfe der Lösung von c) die Bevölkerungszahlen für die Jahre 2021 und 2031. Statistik Übungen Blatt 1 7 SS 2017 18. P Preise und Mengen für einen Warenkorb aus drei Gütern sind für die Jahre 2015 und 2016 in der folgenden Tabelle angegeben: Gut Brot (1 kg) Käse (100 g) Wein (0,75 l) 2015 Preis Menge 2,4 80 1,7 50 6,1 22 2016 Preis Menge 2,5 86 1,9 55 6,0 24 a) Bestimmen Sie zur Basis 2015 den Preisindex nach Laspeyres. b) Bestimmen Sie für den gesamten Warenkorb den Preisindex nach Paasche! c) Berechnen Sie dazu auch den Umsatzindex. 19. Betrachten Sie die Daten des vorigen Beispiels. a) Fassen Sie Brot und Käse jeweils zu einer Produktgruppe zusammen, Wein soll eine zweite „Produktgruppe“ bilden. Berechnen Sie für diese Gruppen jeweils den (Sub)Preisindex und damit den Gesamtindex. b) Bestimmen Sie die prozentuale Preisänderung dieses Warenkorbes von 1991 auf 2016, wenn von 1991 auf 2001 der Preisindex 1,48 betrug und von 2001 auf 2015 die Preise jährlich um 1,8 Prozent gestiegen sind! 20. Der Jahresdurchschnitt des österreichischen VPI ist für verschiedene Jahre angegeben. Die jeweiligen Bezugsjahreszahlen – sie änderten sich alle 10 Jahre – sind die Jahre 1976, 1986 und 1996 bzw. ab 2000 alle 5 Jahre. Die (echten) Daten sind als Indexprozent“ ” angegeben. Jahr VPI in % 1986 155,5 1990 109,5 1996 130,8 2000 105,2 2003 105,9 2005 110,6 2010 109,5 2015 110,7 a) Berechnen Sie die Werte des VPI bezogen auf das Basisjahr 1976. b) Um wie viel sind die Preise von 2003 auf 2015 insgesamt gestiegen? c) Um wie viel sind die Preise von 2003 auf 2015 im Durchschnitt jährlich gestiegen? Statistik Übungen Blatt 1 8 SS 2017 21. P In nachstehender Tabelle ist der durchschnittliche Verbraucherpreisindex (Preisindex für die Lebenshaltung) für Österreich für den Zeitraum 2005 bis 2015 wiedergegeben. Da dieser Index nach Laspeyres ermittelt wird, ist es nötig den zugrundeliegenden Warenkorb in bestimmten Abständen zu aktualisieren. Laut EU-Verordnung (EC Nr.2494/95), haben Revisionen in 5-Jahres-Intervallen zu erfolgen. Seit dem Jahr 2000 wird dies in Österreich umgesetzt: Jahr I05,i I10,i 2005 100,0 2006 101,5 2007 103,7 2008 107,0 2009 107,5 2010 109,5 100 2011 2012 2013 2014 2015 103,3 105,8 107,9 109,7 110,7 a) Um wie viel Prozent sind die Preise von 2005 bis 2007, 2010 und 2012 gestiegen? b) Um wie viel Prozent sind die Preise von 2006 bis 2008 gestiegen? c) Um wie viel Prozent sind die Preise von 2007 bis 2014 gestiegen? 22. Ein Unternehmen bezieht Energie in Form von Strom, Öl und Gas. Die Durchschnittspreise für Öl sind in den angegebenen Jahren folgender Tabelle zu entnehmen: Jahr Preis pro Barrel in EUR 2005 42,7 2006 52,0 2007 52,2 2008 67,9 2009 43,5 2010 56,2 a) Bei den Ausgaben für die verschiedenen Energiearten entfallen auf: Strom 65 % Gas 25 % Öl 10 % Von 2005 bis 2010 stiegen die Stromkosten um 12%, Gas wurde um acht Prozent teurer. Die Preisentwicklung von Öl ist obiger Tabelle zu entnehmen. Um wie viel Prozent sind die Verbrauchsausgaben für alle Energiearten zusammengenommen 2010 teurer als 2005? b) Für den Warenkorb Energie“ sind folgende Indexzahlen bekannt: Man beachte die ” Umbasierungen! 1973 100 1976 120 1986 165 1996 150 2000 122 i. Um wie viel Prozent war Energie für das Unternehmen 2000 teurer als 1973? ii. Um wie viel Prozent war Energie 1986 billiger als 1996? Statistik Übungen Blatt 1 9 SS 2017 23. P Der Warenkorb zur Bestimmung des Verbraucherpreisindexes (berechnet nach Laspeyres) besteht aus vier Gütern (A, B, C, D). Während die Preise von A, B und C auf dem freien Markt gebildet werden, wird der Preis des Gutes D von der Regierung festgesetzt. In folgender Tabelle sind die aktuellen Preise, die von einem Wirtschaftsforschungsinstitut geschätzte Preisentwicklung der nächsten Periode (für A, B, C), sowie die aktuellen Verbrauchsmengen angegeben: Produkt aktuelle Menge aktueller Preis geschätzter Preis A 72 11 12 B 120 29 24 C 80 27 30 D 75 18 a) Berechnen sie unter der Annahme, dass der Preis für D mit 21 GE festgesetzt wird, den Preisindex nach Laspeyres. b) Berechnen sie den Umsatzindex (in %) unter der Annahme, dass der Preis für D mit 21 GE festgesetzt wird, und folgende Mengenänderungen eintreten: • die Mengen von A und D bleiben gleich, • durch die Preisverschiebung erhöht sich die Verbrauchsmenge von B um 10 %, und verringert sich die Verbrauchsmenge von C um 5 %. 24. Betrachten Sie die Daten des vorigen Beispiels. Wie hoch darf die Regierung den Preis von Produkt D maximal festsetzen, damit das wirtschaftspolitische Ziel „Inflationsrate von höchstens 2 %“ in der nächsten Periode nicht verletzt wird? Die mit P gekennzeichneten Beispiele sind von den Studierenden vorzubereiten und nach Aufruf durch die Lehrveranstaltungsleiterin oder durch den Lehrveranstaltungsleiter an der Tafel zu präsentieren! Statistik Übungen Blatt 1 10 SS 2017