Fachbereich Grundlagenwissenschaften Prof. Dr. Viola Weiß Sommersemester 2010 Fachhochschule Jena University of Applied Sciences Jena Statistik für Business Administration Aufgaben zur Wiederholung Deskriptive Statistik 1. Bei einer Befragung wurden folgende jährliche Ausgaben für Reisen (in ¤) pro Person ermittelt: 900 2000 1500 1900 2600 5000 1000 2000 1000 3100 2000 . Berechnen Sie das arithmetische Mittel, den Median, die Standardabweichung und die Spannweite. Wieviel Prozent der Befragten haben mehr als 1600 ¤ ausgegeben? 2. Ein Fahrgast der Bahn AG legt 4 Teilstrecken einer Gesamtstrecke in folgenden Geschwindigkeiten zurück: Teilstrecke 1 Länge in km 45 Geschwindigkeit in km/h 40 2 65 110 3 4 20 70 60 80 Mit welcher (auf der Gesamtstrecke konstant gehaltenen) Durchschnittsgeschwindigkeit würde er die Gesamtstrecke in der gleichen Zeit zurücklegen? 3. Während eines halben Jahres mit 120 Arbeitstagen wird täglich im Rahmen einer Untersuchung über den Publikumsverkehr beim Sozialamt einer Großstadt die Anzahl der persönlich vorsprechenden Antragsteller festgehalten. Folgende Häufigkeitsverteilung hat sich ergeben: Anzahl Antragsteller 0 Anzahl der Tage 5 1 2 4 10 3 12 4 5 29 18 6 7 8 9 12 15 9 3 10 3 Berechnen Sie das arithmetische Mittel und den Zentralwert für die Anzahl der Antragsteller, die pro Tag vorsprechen. Skizzieren Sie die empirische Verteilungsfunktion für die Zahl der Antragsteller. 4. Von einem Merkmal X werden 6 verschiedene Ausprägungen ai , i = 1, ..., 6 mit folgenden relativen Häufigkeiten registriert: 3,2 Ausprägung ai relative Häufigkeit h(ai ) 10% 2,8 15% 2,7 20% 3,0 17% 3,1 25% 3,4 13% Berechnen Sie den Modalwert, den Zentralwert, das arithmetische Mittel, die Spannweite und die mittlere absolute Abweichung vom Zentralwert für dieses Merkmal! 5. Für die Kaufkraft einer Währung wurden für 7 aufeinanderfolgende Jahre folgende Werte ermittelt: 100; 95; 85; 80; 83; 78; 70. Bestimmen Sie den durchschnittlichen prozentualen jährlichen Kaufkraftschwund. 6. Bei Fernsehgeräten eines bestimmten Herstellers wurden bei 1000 Geräten folgende Lebensdauern (in Jahren) der Bildröhren ermittelt: Lebensdauer Anzahl Geräte 0 bis 2 33 über 2 bis 4 über 4 bis 6 276 404 über 6 bis 8 237 über 8 bis 10 50 Berechnen Sie die mittlere Lebensdauer für diese Geräte. Wie groß ist der Anteil der Bildröhren mit einer Lebensdauer über 6 Jahren? 1 7. Für ein Waschpulver eines bestimmten Herstellers wurden in 10 Geschäften in einer Stadt folgende Preise für ein 1-kg-Paket ermittelt (in ¤): 1,40 1,60 1,70 1,50 1,40 1,80 1,70 1,60 1,50 1,80 . Berechnen Sie Varianz und Standardabweichung des Preises. Bestimmen Sie das α-Quantil für α = 0, 45. Wie läßt sich dieser Wert interpretieren? 8. Folgende Tabelle enthält alle Ausprägungen und die unvollständige Verteilung zweier Merkmale: Y 1 2,1 3,2 4 X 2 0,02 0,15 0,1 0,03 4 0,08 0,07 α 0,05 5 0,1 0,08 0,1 0,02 (a) Berechnen Sie die Konstante α und die Randverteilungen beider Merkmale. (b) Berechnen Sie das arithmetische Mittel vom Merkmal Y . (c) Sind die beiden Merkmale unabhängig? (Begründung!) 9. In der folgenden Tabelle sind einige absoluten Häufigkeiten der unabhängigen Merkmale X und Y gegeben. Bestimme Sie die restlichen Werte: Y X 0 1 1 2 1 3 10 30 100 Bestimmen Sie die bedingten Häufigkeiten h(X = 0|Y = 2) und h(Y = 1|X = 1). 10. Ein Bauunternehmer bezieht Fertigfenster von den drei Firmen F1, F2 und F3. Innerhalb eines Jahres nach dem Einbau der Fenster erhält er 100 Reklamationen. Es werden folgende Fehler bemängelt: Fehler A: Die Fenster werden blind. Fehler B: Die Fenster bekommen Risse. Fehler C: Die Fenster lassen sich nicht mehr schließen. Es ergibt sich die folgende Kontingenztabelle: A B C F1 F2 F3 15 20 5 18 10 2 5 20 5 Berechnen Sie für diese Daten den Kontingenzkoeffizienten nach Pearson und interpretieren Sie den Wert. 11. Ein Handelsunternehmen für Lebensmittel analysiert die Umsätze seiner 10 gleichgroßen Filialen A,B,...,J einer Region. Die Filiale mit dem größten Umsatz erhält die Nummer 1, die mit dem zweitgrößten Umsatz die Nummer 2, usw. In einer Fragebogenaktion wird die Kundenmeinung über die Verkaufskultur (Sauberkeit, Umgang mit Kunden, Kundenservice) eingeholt. Die danach beste Filiale erhält die Nummer 1 usw., die schlechteste die Nummer 10: Filiale A B C D Umsatz 7 1 5 8 Verkaufskultur 5 1 6 10 E F 4 9 7 8 2 G H 2 10 4 9 I 6 2 J 3 3 Besteht ein Zusammenhang zwischen Umsatz und Verkaufskultur in den Filialen dieses Handelsunternehmens? Beantworten Sie die Frage mit Hilfe des Rangkorrelationskoeffizienten nach Spearman. 12. Aus 80 Wertepaaren der Merkmale X und Y wurde ein Korrelationskoeffizient rXY = −0, 95 berechnet. Welche der folgenden Aussagen sind richtig? (a) Die Beobachtungswerte streuen eng um eine Gerade mit fallendem Anstieg. (b) Ein Zusammenhang zwischen X und Y ist nicht erwiesen, da rXY < 0 gilt. (c) Die Werte von X und Y sind annähernd umgekehrt proportional zueinander. (d) Berechnet man für die Wertepaare eine Regressionsgerade Y = aX + b, dann erhält man für a einen negativen Wert. 13. In der folgenden Tabelle sind die verfügbaren Monatseinkommen von 8 fiktiven deutschen Haushalten sowie deren Ausgaben für öffentliche Verkehrsmittel angegeben (jeweils in ¤): Verfügbares Einkommen 2500 Ausgaben für Verkehrsmittel 150 4900 70 2900 180 3500 90 3700 160 5600 90 6300 20 2400 100 (a) Berechnen Sie für diese beiden Merkmale den Korrelationskoeffizienten nach Pearson. Wie läßt sich der Wert interpretieren? (b) Ermitteln Sie eine lineare Regressionsfunktion nach der Methode der kleinsten Quadrate für diese beiden Merkmale. (c) Bestimmen Sie mit Hilfe der Regressionsfunktion die monatlichen Ausgaben für öffentliche Verkehrsmittel bei einem verfügbaren Einkommen von 4000 ¤. 14. Ein Unternehmen hat bei folgenden Preisen p die Absatzmengen m eines Produktes pro Zeiteinheit beobachtet: Preis p Menge m 20 220 18 260 15 350 12 480 10 600 Berechnen Sie mit Regression eine Preis-Absatz-Funktion der Form m = a · pb . 15. Die Entwicklung der Bruttoerzeugung von Elektroenergie einer bestimmten Region ist folgender Tabelle zu entnehmen: Jahr 1992 Energie (in Mrd. kWh) 368,8 2002 449,5 2004 462,4 2005 453,2 2006 452,0 2007 455,9 Prognostizieren Sie die erzeugte Energiemenge für 2008 und 2009 mit Hilfe linearer Regression. 16. Bestimmen Sie eine Regressionsfunktion vom Typ Exponentialfunktion y = abx für xi 1 2 3 4 5 folgende Daten: . yi 3 7 12 26 51 17. Die Materialkosten eines Handwerksbetriebes entwickelten sich wie folgt: Jahr 2001 Materialkosten (in 1000 ¤) 102 2002 103 2003 109 2004 111 2005 116 2006 122 2007 109 Prognostizieren Sie die Materialkosten für 2008 mittels exponentieller Glättung mit Parameter α = 0, 6 und Startwert 102. 3 18. In einem Unternehmen wurden die Energiekosten über die Quartale von 4 Jahren erfaßt (in 1000 ¤): Quartal/Jahr I II III IV 2003 38,2 36,1 39,4 42,1 2004 40,3 38,6 42,1 45,3 2005 43,1 40,9 46,1 49,0 2006 44,6 44,1 49,2 52,4 Glätten Sie die Werte mit Hilfe gleitender Durchschnitte mit einer geeignet gewählten Ordnung. Den Daten wurde folgende lineare Trendfunktion angepaßt : x̂ = 36, 34 + 0, 81 · t, t = 1, 2, ..., 16 . Ermitteln Sie unter der Voraussetzung, daß saisonale Schwankungen dem Trend additiv überlagert sind, für das 4.Quartal die additive Saisonkomponente. Errechnen Sie daraus eine Prognose für das 4.Quartal 2007. Wie lautet diese Prognose für das 4.Quartal 2007 im Fall des multiplikativen Modells? 19. Die folgende Tabelle enthält Preise (in ¤/kg) und Produktionsmengen (in kg) von 4 wichtigen Gütern der Lebensmittelbranche für die Jahre 2002, 2003 und 2004 : Jahr 2002 2003 2004 Gut A Preis Menge 31 1450 30 1500 32 1400 Gut B Preis Menge 71 4800 70 4500 75 5000 Gut C Preis Menge 14 3100 15 3200 16 3000 Gut D Preis Menge 27 2600 29 2400 34 2800 Berechnen Sie den Preisindex nach Laspeyres und den Mengenindex nach Lowe jeweils für 2004 zur Basis 2002 . Wahrscheinlichkeitsrechnung 20. Wir betrachten das Lottospiel 6 aus 49 und vernachlässigen der Einfachheit halber die Zusatzzahl. Es bezeichne Ak das Ereignis „Genau k Richtige“, k = 0, 1, ..., 6. (a) Begründen Sie, daß die Ereignisse A0 , A1 , ..., A6 paarweise (je zwei Ereignisse) unvereinbar sind. (b) Man gewinnt ab 3 Richtigen. Stellen Sie das Ereignis G: „Erreichen einer Gewinnstufe“ mit Hilfe der Ereignisse Ak dar. (c) Berechnen Sie P (G) mit Hilfe folgender Wahrscheinlichkeiten: P (A3 ) = 0, 0176504, P (A4 ) = 0, 0009686, P (A5 ) = 0, 0000184 und P (A6 ) = 0, 0000007. 21. In einer Tombola befinden sich 200 Lose, davon sind 90% Nieten. Wie groß ist die Wahrscheinlichkeit, beim Ziehen von 5 Losen (a) genau einen Gewinn, (b) genau zwei Gewinne, (c) mindestens zwei Gewinne zu erhalten? 22. Es seien A und B Ereignisse mit p = P (B) und q = P (A ∪ B), 0 ≤ p, q ≤ 1. Berechnen Sie daraus P (A ∩ B̄) und P (Ā ∩ B̄). 4 23. Beim zweimaligen Würfeln werden folgende Ereignisse betrachtet: A - Die Augenzahl beim ersten Wurf ist mindestens 5. B - Die Augenzahl beim zweiten Wurf ist gerade. Begründen Sie, daß die beiden Ereignisse stochastisch unabhängig sind. 24. Es wird ein roter und ein grüner Würfel geworfen. Wie groß ist die Wahrscheinlichkeit dafür, daß die Augensumme größer als 8 ist wenn der grüne Würfel eine 4 zeigt? 25. Zwei Kugeln werden nacheinander ohne Zurücklegen aus einer Urne gezogen, die 3 schwarze und 7 weiße Kugeln enthält. X sei diejenige Zufallsgröße, die die Gesamtzahl gezogener schwarzer Kugeln angibt. (a) Geben Sie für jede Realisierung xi von X die dazugehörende Wahrscheinlichkeit pi = P (X = xi ) an. (b) Berechnen Sie P (X ≤ 1). (c) Berechnen Sie Erwartungswert und Varianz von X. 26. Zwei Kugeln werden nacheinander mit Zurücklegen aus einer Urne gezogen, die 4 schwarze und 6 weiße Kugeln enthält. X sei diejenige Zufallsgröße, die die Gesamtzahl gezogener schwarzer Kugeln angibt. (a) Geben Sie für jede Realisierung xi von X die dazugehörende Wahrscheinlichkeit pi = P (X = xi ) an. (b) Berechnen Sie P (X ≤ 1). (c) Berechnen Sie Erwartungswert und Varianz der Zufallsgröße X. 27. Eine diskrete Zufallsgröße X sei durch folgende Realisierungen xi und Wahrscheinlichkeiten P (X = xi ) gegeben: xi -3 P (X = xi ) 0.1 0 0.14 1 0.11 2 0.34 3 0.31 (a) Berechnen Sie P (X < 1) und P (X > 0). (b) Bestimmen Sie außerdem den Erwartungswert und die Varianz von X. (c) Wie lautet die Verteilungsfunktion FX der Zufallsgröße X? Skizzieren Sie FX . 28. Es sei bekannt, daß ein bestimmter Automat beim Herstellen von Schrauben 1,5% Ausschuß produziert. Mit welcher Wahrscheinlichkeit befinden sich unter 100 zufällig (bei laufender Produktion) herausgegriffenen Schrauben weniger als zwei defekte? 29. Beim einmaligen Werfen einer nicht homogenen Münze beträgt die Wahrscheinlichkeit für das Eintreten des Ereignisses “Zahl oben“ 55%. Wie oft muß die Münze geworfen werden, daß mit einer Wahrscheinlichkeit größer als 95% wenigstens einmal das Ereignis “Zahl oben“ eintritt? 30. In einer Autowerkstatt sei die zufällige Reparaturzeit X exponentialverteilt. Die mittlere Reparaturzeit beträgt 4 Stunden. Berechnen Sie die Wahrscheinlichkeit dafür, daß die Reparaturzeit höchstens 6 Stunden beträgt! 5 31. Die Lebensdauer X einer Softeismaschine (in Jahren) sei eine exponentialverteilte Zufallsgröße mit a = 61 . (a) Mit welcher Wahrscheinlichkeit “lebt“ die Maschine länger als 10 Jahre? (b) Mit welcher Wahrscheinlichkeit ist die Lebensdauer kleiner als der Erwartungswert? 32. Sei X eine normalverteilte Zufallsgröße mit Erwartungswert µ = 6, 5 und der Standardabweichung σ = 1, 5. (a) Berechnen Sie die Wahrscheinlichkeit dafür, daß X im Intervall I = [6; 8] liegt! (b) Wie groß ist die Wahrscheinlichkeit, daß X kleiner als 4, 5 ist? (c) Welche reelle Zahl x0 besitzt die Eigenschaft, daß 85% aller Realisierungen von X größer als x0 sind? 33. Es sei X die poissonverteilte Anzahl der Störungen pro Woche in einer Fertigungsanlage. Im Durchschnitt werden 5 Störungen pro Woche registriert. (a) Mit welcher Wahrscheinlichkeit treten pro Woche weniger als 3 Störungen auf? (b) Mit welcher Wahrscheinlichkeit treten pro Woche mehr als 6 Störungen auf? (c) Mit welcher Wahrscheinlichkeit treten für die Dauer einer Woche keine Störungen auf? 34. Die Länge X von Werkstücken, die auf einer Maschine gefertigt werden, sei eine normalverteilte Zufallsgröße mit Erwartungswert µ = 30mm und Standardabweichung σ = 0, 02mm. (a) Mit welcher Wahrscheinlichkeit weicht die Länge mehr als 0, 03mm von µ ab? (b) Welche Mindestlänge besitzen 85% aller gefertigten Werkstücke? 35. In einer Fußballmannschaft stammen statistisch gesehen 50% aller Torschüsse vom Stürmer A, 40% vom Stürmer B und 10% entfallen auf den Rest der Mannschaft. Die Trefferwahrscheinlichkeit von Stürmer A liegt bei 0,7, die von Stürmer B bei 0,8, die restlichen Spieler treffen mit Wahrscheinlichkeit 0,3. Mit welcher Wahrscheinlichkeit führt ein Torschuß dieser Mannschaft zu einem Tor? 36. Ein Posten von 100 Teilen enthält 60 Teile von Werk I und 40 Teile von Werk II. Es ist bekannt, daß die Ausschußwahrscheinlichkeit in Werk I bei 3% liegt und in Werk II bei 2%. Geben Sie die Wahrscheinlichkeit dafür an, daß ein zufällig ausgewähltes Teil dieses Postens (a) von Werk I stammt, (b) Ausschuß ist, (c) von Werk II stammt und kein Ausschuß ist, (d) kein Ausschuß ist, wenn es von Werk II stammt, (e) von Werk II stammt, wenn es kein Ausschuß ist? 6 37. Zwei Personen wollen sich an einem festgelegten Ort treffen, wobei beide garantiert zwischen 14 Uhr und 15 Uhr erscheinen. Die genaue Ankunftszeit der beiden Personen ist unabhängig voneinander und kann jeder Zeitpunkt innerhalb dieser Stunde sein. Sie vereinbaren, daß jeder 25 Minuten auf den anderen warten wird und dann wieder geht. Mit welcher Wahrscheinlichkeit treffen sich beide Personen? (Hinweis: Berechnen Sie die gesuchte Wahrscheinlichkeit mit Hilfe geometrischer Wahrscheinlichkeiten.) 38. Es sei X eine stetige Zufallsgröße mit der Verteilungsfunktion FX : 0 falls x<0 x3 (4 − 3x) falls 0 ≤ x < 1 FX (x) = . 1 falls x≥1 Ermitteln Sie die Dichte fX der Zufallsgröße X. R∞ fX (x)d(x) = 1 . Zeigen Sie, daß für die Dichte gilt −∞ Berechnen Sie den Erwartungswert EX der Zufallsgröße. Induktive Statistik 39. Die Zufallsgröße X beschreibe das Abfüllgewicht (in Gramm) von Maiskörnern in Dosen. Dabei sei X näherungsweise normalverteilt. 100 Dosen wurden zufällig ausgewählt und der Inhalt gewogen. Ihr Gesamtgewicht beträgt 34584 g. (a) Bestimmen Sie einen Schätzwert für den Erwartungswert µ von X. (b) Berechnen Sie ein Konfidenzintervall für µ zum Konfidenzniveau 0,95, falls die Standardabweichung σ = 4, 5 g eine bekannte (unveränderliche) Maschinengröße ist. (c) Wie groß muß der Stichprobenumfang n mindestens sein, damit man bei bekannter Standardabweichung σ = 4, 5 g zum Konfidenzniveau 0,99 ein Konfidenzintervall für µ erhält, dessen Länge höchstens 1 g ist? 40. Die Wirkung eines Medikaments zur Fiebersenkung wird an 12 Patienten beobachtet. Die folgende Tabelle enthält die Körpertemperatur (in ◦ C) vor und eine Stunde nach Verabreichung des Medikaments : vor nach 38,7 39,2 39,6 38,1 39,0 39,3 38,5 38,8 39,0 39,1 39,4 38,4 38,5 37,9 37,4 37,9 38,5 39,0 39,2 39,2 38,6 38,0 37,4 37,5 Berechnen Sie ein 95%-Konfidenzintervall für die mittlere Senkung des Fiebers durch dieses Mittel unter der Voraussetzung, daß die Werte normalverteilt sind. 41. Eine Abfüllmaschine für Kaffee ist auf ein Füllgewicht von 500 g eingestellt. Das Abfüllgewicht sei eine normalverteilte Zufallsgröße mit unbekannter Varianz. Durch folgende Stichprobe vom Umfang n = 8 für das Füllgewicht (in g) 498 501 502 497 502 504 496 496 soll überprüft werden, ob das mittlere Gewicht von 500 g eingehalten wird. Prüfen Sie die Hypothese H0 : µ = 500 gegen H1 : µ 6= 500 zum Niveau α = 0, 05. 7