Übungsaufgaben Einführung in die Statistik SS 2004 Dr. H. Grunert Franzstraße 49, 06406 Bernburg Tel. 03471-626493, Fax 03471-626496 Email: grunert @ mws-bbg.de Dr. H. Grunert Einführung in die Statistik SS 2004 I. Grundbegriffe A1) Mit Hilfe einer statistischen Untersuchung soll die durchschnittliche Studiendauer an der HS-Anhalt ermittelt werden. Nennen Sie Möglichkeiten der sachlichen, räumlichen und zeitlichen Abgrenzung der statistischen Masse! A2) Überlegen Sie, ob die folgenden Grundgesamtheiten Bestands- oder Bewegungsmassen sind : - in einer Werkhalle aufgestellte Drehbänke - Produktionsmenge - Bilanzsumme - Reklamationen von Kunden - gewährte Preisnachlässe. - Todesfälle in der Stadt Bernburg - Beschäftigte in einem Unternehmen - Anzahl Kunden im Supermarkt A3) Geben Sie zu folgenden Bestandsmassen korrespondierende Bewegungsmassen an - Einwohner der Stadt Bernburg - ihr Kontostand - PKW- Bestand im Fuhrpark. A4) Erläutern Sie den Unterschied zwischen Primär- und Sekundärstatistik ! Nennen Sie dazu entsprechende Einrichtungen/ Träger der Statistik ! A5) Skizzieren Sie den Ablauf einer statistischen Untersuchung ! A6) Erläutern Sie gebräuchliche Methoden und Techniken der Datenerhebung ! A7) Welche Merkmalstypen werden aus statistischer Sicht unterschieden ? A8) Ordnen Sie folgenden Merkmalen Merkmalstypen zu : - Wert der Auftragseingänge in einem Unternehmen - Warenart - Zahl der monatlich geführten Telefongespräche - Betrag der monatlichen Telefonrechnung - Anteil des Anlagevermögens am Gesamtvermögen eines Unternehmens - Farbe der in einer Woche produzierten Automobile. A9) Erläutern Sie die Bedeutung des Skalenniveaus statistischer Daten ! Seite 2 Dr. H. Grunert Einführung in die Statistik SS 2004 A10) Geben Sie das Skalenniveau folgender Merkmale an - Jahresumsatz eines Unternehmens - Körperlänge von männlichen Schülern - Nationalität von Sportlern - Geschlecht der Studierenden der HS Anhalt - Haushaltsgröße - Schulnoten von 1 bis 6 ! A11) Was versteht man unter der diskreten Erfassung stetiger Merkmale ? Seite 3 Dr. H. Grunert II. Einführung in die Statistik SS 2004 Häufigkeitsverteilungen, Mittelwerte, Streuungsmaße A12 ) Bei der Untersuchung der Wohnungsmieten in einer Kleinstadt ergaben sich für besser ausgestattete Wohnungen folgende Mietpreise [ DM / m² ] 12 14 12 12 8 12 14 14 14 16 8 12 10 14 16 10 12 12 10 16 10 12 14 8 14 16 10 10 8 12 16 10 10 12 12 8 10 12 14 8 a) Erstellen Sie aus dieser Urliste der Daten eine Häufigkeitstabelle mit den einfachen und relativen absoluten und kumulierten Häufigkeiten ! b) Stellen Sie die Häufigkeiten grafisch dar ! c) Berechnen Sie den Modus, Median und das arithmetische Mittel für die Urliste und die Häufigkeitstabelle ! d) Ermitteln Sie den zentralen Quartilsabstand für die Mietpreise ! e) Berechnen Sie Varianz, Standardabweichung und Variationskoeffizient interpretieren Sie diese Parameter ! A13 ) Es ist folgende Häufigkeitstabelle gegeben : i xi hi fi 1 2 3 4 14 15 16 17 6 10 5 4 0,24 0,40 0,20 0,16 25 1,00 ä Berechnen Sie den Modus, den Median und das arithmetische Mittel! Seite 4 Dr. H. Grunert Einführung in die Statistik SS 2004 A14 ) An 60 Tannen eines 40jährigen Bestandes wurde der Durchmesser ( in 1,50 m Höhe ) gemessen [ cm ]. Folgende Werte wurden dem Messprotokoll entnommen : 16 14 12 12 17 15 14 12 14 16 17 15 14 13 15 16 11 13 11 14 19 7 13 12 13 17 8 15 14 14 16 10 11 15 14 16 9 9 13 12 16 11 12 14 14 18 11 10 15 12 15 13 12 18 13 14 12 11 16 12 a) Erstellen Sie die Häufigkeitstabelle. Geben Sie die einfachen und kumulierten absoluten und relativen Häufigkeiten an ! b) Erstellen Sie eine Häufigkeitstabelle mit 7 Klassen ! Geben Sie die einfachen und kumulierten absoluten und relativen Häufigkeiten an ! c ) Berechnen Sie für die Häufigkeitstabellen jeweils Modus, Median und das arithmetische Mittel! d) Berechnen Sie Varianz, Standardabweichung und den Variationskoeffizienten beider Häufigkeitstabellen! A15 ) Bei einer Umfrage unter Studenten einer Fachhochschule zur durchschnittlichen Nutzung der Bibliothek pro Woche im Wintersemester ergaben sich folgende relative Häufigkeiten : Nutzungsdauer [ h ] fi 1 2 3 4 5 6 0,08 0,15 0,23 ? 0,19 0,07 Wieviele Studenten besuchten durchschnittlich 4 Stunden die Bibliothek, wenn insgesamt 2000 Studenten befragt wurden ? Seite 5 Dr. H. Grunert Einführung in die Statistik SS 2004 A16 ) Eine Untersuchung der Ausgaben von Kunden während eines Sonderverkaufs im Kaufhaus A ergab folgende Beträge [EUR] : 127,06 238,04 349,85 426,91 560,21 172,00 248,86 373,81 443,40 676,74 194,10 272,06 375,74 466,84 217,30 337,74 378,40 467,88 226,74 347,94 383,05 533,11 228,74 349,57 394,97 539,28 a) Erstellen Sie aus dieser Urliste eine aussagekräftige Häufigkeitstabelle mit 6 Klassen gleicher Klassenbreite ( 100 EUR )! Geben Sie die einfachen und kumulierten absoluten und relativen Klassenhäufigkeiten an! b) Erstellen Sie ein Histogramm der Klassenhäufigkeiten und zeichnen Sie die empirische Verteilungsfunktion ( Polygonzug )! c) Berechnen Sie das arithmetische Mittel für die Urliste und die Häufigkeitstabelle ! A17 ) Für die Brenndauer von 200 Glühbirnen wurden folgende Werte festgestellt: Brenndauer von .... bis unter 0 4000 6000 7000 8000 9000 ..... ..... ..... ..... ..... ..... 4000 6000 7000 8000 9000 10000 hj 12 28 44 68 30 18 a) Bestimmen Sie die einfachen und die kumulierten relativen Klassenhäufigkeiten ! b) Erstellen Sie das Histogramm der kumulierten Häufigkeiten und den Polygonzug für die empirische Verteilungsfunktion ! c) Bestimmen Sie die Modalklasse und das arithmetische Mittel der Verteilung ! Seite 6 Dr. H. Grunert Einführung in die Statistik SS 2004 A18) Die folgende Tabelle enthält Angaben zum Alter der Häuser einer Wohnungsgenossenschaft. Alter ( in Jahren ) von bis unter 0 8 16 24 32 40 Anzahl der Häuser 8 16 24 32 40 48 6 10 14 18 15 4 Berechnen Sie das arithmetische Mittel und die empirische Standardabweichung für diese Häufigkeitsverteilung ( Genauigkeit 1 Stelle nach dem Komma) ! A19) Es ist folgende Häufigkeitstabelle gegeben: i 1 2 3 4 5 xi 14 15 16 17 18 hi 6 9 14 10 8 fi 0,128 0,191 0,298 0,213 0,170 Berechnen Sie Modus, Median, arithmetisches Mittel, Varianz und Standardabweichung für diese Häufigkeitsverteilung ! Seite 7 Dr. H. Grunert Einführung in die Statistik SS 2004 A20) In einer Diskussionsrunde unter Wirtschaftsrechtlern wurde u.a. die Verfahrensweise bei Betriebsprüfungen durch die Finanzämter angesprochen. Für das vergangene Jahr wurden dabei folgende durchschnittliche Steuernachzahlungen, die durch die Unternehmen noch an die Finanzämter im Ergebnis der Überprüfungen abzuführen waren, bezogen auf verschiedene Branchen genannt : Branche Steuernachzahlungen (TEUR) A 12 B 8 C 14 D 10 E 12 F 16 G 14 H 16 I 8 J 10 Ermitteln Sie die Varianz, die Standardabweichung und den Variationskoeffizienten für die Steuernachzahlungen (2-stellige Genauigkeit) ! A21) Gegeben ist folgende Zahlenreihe: 1-2-2-2-3-3-4-5-5 Kreuzen Sie Varianz und Variationskoeffizient in der nachfolgenden Aufstellung an ! a) b) c) d) e) f) 1,3 und 44,4 % 1,3 und 59,3 % 1,7 und 44,4 % 1,7 und 59,3 % 3,0 und 44,4 % 3,0 und 59,3 % A22) In einer Schulklasse wird der Kariesbefall der Zähne bei Kindern überprüft. Es ergibt sich folgende Häufigkeitstabelle : befallene Zähne absolute Häufigkeit 0 4 1 7 2 5 3 3 4 1 Berechnen Sie den Median, das arithmetische Mittel, die Varianz und den Variationskoeffizienten ! Seite 8 Dr. H. Grunert Einführung in die Statistik SS 2004 A23 ) Die Statistik der Anzahl der Unternehmen einer Region zeigt folgende Entwicklung: Jahr Wachstumsrate [ % ] Wachstumsfaktor 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 - 2,39 - 1,93 - 1,77 - 1,35 - 0,81 0,32 0,10 0,43 3,87 4,03 1,15 0,9761 0,9807 0,9823 0,9865 0,9919 1,0032 1,0010 1,0043 1,0387 1,0403 1,0115 Berechnen Sie die durchschnittliche Wachstumsrate der Betriebsanzahl ! A24 ) Eine moderne Abfüllanlage füllt 50.000 Flaschen pro Stunde ab, eine ältere Maschine 30.000 Flaschen pro Stunde. Wieviel Flaschen werden durchschnittlich pro Stunde abgefüllt, wenn auf der modernen Anlage 300.000 Flaschen und auf der älteren Maschine 150.000 Flaschen abgefüllt werden ? A25 ) Eine Sparkasse bietet einen Schatzbrief mit einer Laufzeit von 5 Jahren an. Der Zinssatz steigt jährlich von 4,5% über 5%, 6%, 6,5% auf 7%. Die jährlichen Zinsen werden angesammelt und mitverzinst. Bestimmen Sie die durchschnittliche Verzinsung! Seite 9 Dr. H. Grunert III. Einführung in die Statistik SS 2004 Regressions- und Korrelationsanalyse A26) Am Wochenende analysierte Markthändler Meyer die Verkaufserfolge seiner sieben Marktstände. Bei den Spargelverkäufen ergaben sich die in der Tabelle dargestellten Preise und Verkaufsmengen. Preis [EUR/kg] verkaufte Menge [kg] 11 40 10 44 13 35 12 38 10 41 9 45 14 36 a) Stellen Sie die Daten in einem Streudiagramm dar und ziehen Sie Schlussfolgerungen bezüglich der zu analysierenden Abhängigkeit ! b) Berechnen Sie die Parameter der Regressionsfunktion und interpretieren Sie Regressionskonstante und Regressionskoeffizient ! c) Welche Menge wird im Durchschnitt bei einem Preis von 11,50 EUR nachgefragt ? d) Berechnen Sie die Residuen und deren Streuung . Interpretieren Sie die Ergebnisse ! e) Berechnen Sie den Maßkorrelationskoeffizienten und das Bestimmtheitsmaß! A27) Auf der Grundlage einer Untersuchung sollte die Frage beantwortet werden, wie sich bei der Verabreichung eines neuen Medikamentes über 12 Wochen hinweg die Blutwerte verändern, d.h., ob das neue Medikament dazu beiträgt, die Blutwerte zu erhöhen. Folgende Messwerte liegen vor: Untersuchungszeitraum [Wochen] xi 2 4 6 8 10 12 yi 3 2 4 2 3 1 3 2 5 3 3 2 4 3 6 3 4 2 5 4 6 4 4 3 7 4 7 4 5 3 7 5 7 5 6 3 ä 15 18 22 26 30 33 Berechnen Sie die Regressionsfunktion ! Seite 10 Dr. H. Grunert Einführung in die Statistik SS 2004 A28) Für 6 verschiedene Monate liegen die Daten über den Hypothekenzinssatz sowie über den saisonbereinigten Auftragseingang im Bauhauptgewerbe, der auf den privaten Wohnungsbau entfällt, vor : Monat 1 2 3 4 5 6 Zinssatz [%] 6 5 7 7 8 9 3200 2500 2300 2000 2000 Aufträge [Mio. DM] 3000 a) Erstellen Sie ein Streudiagramm und ziehen Sie Schlussfolgerungen bezüglich der zu analysierenden Abhängigkeit ! b) Berechnen Sie die Regressionsgerade ! c) Ermitteln Sie Prognosewerte für Auftragseingänge, die bei Hypothekenzinssätzen von 4 bzw. 7,5 % zu erwarten wären ! d) Berechnen Sie den Maßkorrelationskoeffizienten und das Bestimmtheitsmaß! A29) Bei 12 zufällig ausgewählten Unternehmen wurden der Umsatz in Mio. DM und die Werbeausgaben in 100 TDM ermittelt. Dabei ergab sich folgendes Resultat: Umsatz [Mio. EUR] Werbeausgaben [100 TEURO] 12,0 11,0 9,0 7,0 6,5 5,0 4,5 4,0 2,0 2,0 1,5 1,5 3,1 3,0 2,2 1,9 1,8 1,4 1,5 1,2 0,9 0,8 0,7 0,7 a) Berechnen Sie eine Regressionsfunktion für den Zusammenhang zwischen Umsatz (x) und Werbeausgaben (y) ! b) Berechnen Sie den Korrelationskoeffizienten r ! c) Ermitteln Sie das Unbestimmtheits- und das Bestimmtheitsmaß ! d) Ein Unternehmen habe einen Umsatz von 13 Mio. DM; ein zweites einen von 10 Mio. DM. Mit welchen Werbeausgaben ist bei beiden Unternehmen zu rechnen ? Seite 11 Dr. H. Grunert Einführung in die Statistik SS 2004 A30) Ein Speditionsunternehmen möchte wissen, ob zwischen dem Alter der LKW und den Reparaturkosten tatsächlich ein Zusammenhang besteht. Es sind folgende Daten bekannt: Alter [Jahre] 2 Reparaturkosten 1,8 [TEURO] 3 1,9 3 2,2 4 2,2 5 2,4 5 2,5 6 2,7 7 3,0 8 3,2 9 3,3 10 3,6 a) Ermitteln Sie die Regressionsgerade (Alter=x; Reparaturkosten=y) ! b) Berechnen Sie den Grad des Zusammenhanges zwischen Alter und Reparaturkosten nach Bravais-Pearson! c) Inwieweit wird der Zusammenhang durch die Regressionsgerade erklärt ? A31) Eine Untersuchung ergab folgende Daten zu den Aufwendungen für eine Werbekampagne eines Unternehmens in Vorbereitung der Einführung eines neuen Produktes und des danach erzielten Absatzes : Kunde Werbeaufwand je Kunde ( in 1000 DM ) Absatz je Kunde ( in 1000 DM ) A B C D E F G H 1,4 1,8 1,9 2,4 2,8 3,2 3,6 4,0 210 220 240 240 320 400 410 480 a) Bestimmen Sie eine lineare Regressionsfunktion für den Zusammenhang zwischen Werbeaufwendungen und Absatz des Unternehmens ! b) Ermitteln Sie den Korrelationskoeffizienten ( Bravais-Pearson) und das Bestimmtheitsmaß ! Seite 12 Dr. H. Grunert Einführung in die Statistik SS 2004 A32) Für 6 Wohnungen einer Großstadt liegen folgende Angaben vor: lfd. Nr. Wohnfläche [ m²] 1 2 3 4 5 6 66 72 80 55 47 70 Warmmiete [ DM/Monat ] 1055 1144 1296 910 800 1150 a) Ermitteln Sie eine lineare Regressionsfunktion für den Zusammenhang zwischen der Wohnfläche (x) und der monatlichen Warmmiete (y)! b) Berechnen Sie das Bestimmtheitsmass r² (3-stellige Genauigkeit) ! A33) Bei einem Eignungstest wurden folgende Ergebnisse erreicht : Teilnehmer Abschlussnote theoretischer Teil Punktezahl praktischer Teil A B C D E F G H 3,2 2,6 1,8 2,9 1,6 3,1 2,8 2,1 65 70 80 75 72 78 76 68 Besteht zwischen der Abschlussnote des theoretischen Teils und der erreichten Punktezahl im praktischen Teil ein Zusammenhang ? Berechnen Sie Klärung dieser Frage a) eine lineare Regressionsfunktion für den Zusammenhang zwischen der Abschlussnote im theoretischen Teil (x) und der erreichten Punktezahl im praktischen Teil (y) (2- stellige Genauigkeit)! b) den Korrelationskoeffizienten (Bravais-Pearson) und das Bestimmtheitsmaß! Seite 13 Dr. H. Grunert IV. Einführung in die Statistik SS 2004 Zeitreihenanalyse A34) Die Umsatzentwicklung eines Unternehmens in den letzten 9 Jahren zeigt folgende Übersicht: Jahr Umsatz in Mio. EUR 1991 1992 1993 1994 1995 1996 1997 1998 1999 a) b) c) d) 4,8 5,2 5,6 4,9 6,2 5,6 5,8 6,4 5,9 Skizzieren Sie den Verlauf der Zeitreihe ! Berechnen Sie den Trendverlauf nach der Methode der gleitenden Durchschnitte 3. und 4. Ordnung ! Berechnen Sie eine lineare Trendfunktion ! Mit welchem Umsatz ist im Jahre 2000 zu rechnen ? A35) Die nachfolgende Tabelle enthält die Anzahl der Hausschlachtungen von Schweinen ( in 100 000) in der Bundesrepublik. Jahr Quartal Anzahl der Hausschlachtungen 1 I II III IV I II III IV I II III IV 14 6 4 13 12 5 4 12 11 5 4 12 2 3 a) Prognostizieren Sie die Anzahl der Hausschlachtungen von Schweinen in der Bundesrepublik für die 4 Quartale des Jahres 4 mit dem Verfahren der Zeitreihenprognose ! b) Veranschaulichen Sie die Zeitreihenprognose durch eine grafische Darstellung ! Seite 14 Dr. H. Grunert Einführung in die Statistik SS 2004 A36) In einem Unternehmen sind folgende Umsatzzahlen zu verzeichnen: Jahr Umsatz (TDM) 1995 1996 1997 1998 1999 1625 1855 2105 2340 2575 a) b) Ermitteln Sie die lineare Trendfunktion und die Residuen für die Jahre 1995 und 1999 ! Prognostizieren Sie den Umsatz für das Jahr 2000 ! A37) In einem Unternehmen sind folgende Absatzzahlen zu verzeichnen: Jahr Absatz [Tonnen] 1993 1994 1995 1996 1997 1998 1999 2000 28,6 34,4 37,4 47,4 51,8 56,2 60,5 65,1 a) b) Ermitteln Sie eine lineare Trendfunktion! Prognostizieren Sie den Absatz für das Jahr 2001 ! Seite 15 Dr. H. Grunert Einführung in die Statistik SS 2004 A38) Die Kriminalstatistik der Stadt A weist für die letzten 10 Jahren u.a. die Anzahl der Laubeneinbrüche in den Kleingartensparten aus. Folgende Zahlen wurden registriert Jahr Anzahl der Einbrüche 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 59 59 63 65 73 77 81 87 90 88 a) Ermitteln Sie die lineare Trendfunktion nach der Methode der Summe der kleinsten Quadrate ( 2-stellige Genauigkeit)! b) Prognostizieren Sie die Zahl der Laubeneinbrüche für das laufende Jahr ! Seite 16