Technische Universität Ilmenau Fachgebiet Quantitative Methoden der Wirtschaftswissenschaften Übungsaufgaben zu den Vorlesungen Statistik 1 und 2 April 2013 Aufgabe 1 Geben Sie zu den folgenden statistischen Aufgaben eine geeignete Grundgesamtheit sowie Merkmale, Ausprägungen und Skalenarten an: a) Es soll untersucht werden, wie groß das Verhältnis männlich zu weiblich in der Bevölkerung Deutschlands ist. b) In einem Großbetrieb soll die Altersstruktur der dort beschäftigten Arbeitnehmer, getrennt nach Frauen und Männern, untersucht werden. c) Die Marketing-Abteilung eines Pkw-Herstellers möchte ergründen, welche Autofarben auf dem deutschen Markt gefragt sind. d) An einer bestimmten Straßenkreuzung soll für freitags im zeitlichen Verlauf von 12 bis 13 Uhr die Verkehrsdichte ermittelt werden. e) Denken Sie sich selbst ein Beispiel aus, bei dem ein ordinal skaliertes Merkmal vorkommt. Aufgabe 2 a) Erstellen Sie aus der folgenden Urliste zum Kohlenstoffgehalt von Gusseisen eine primäre Häufigkeitstabelle mit absoluten und relativen Häufigkeiten und Summenhäufigkeiten (Angaben in Prozent): 3,34 3,31 3,35 3,27 3,37 3,34 3,39 3,36 3,35 3,36 3,29 3,37 3,40 3,35 3,32 3,30 3,38 3,35 3,31 3,41 3,35 3,30 3,38 3,39 3,31 3,41 3,32 3,29 3,33 3,29 3,36 3,24 3,30 3,26 3,35 3,31 3,40 3,32 3,40 3,35 3,34 3,33 3,29 3,32 3,35 3,37 3,22 3,39 3,36 3,35 3,37 3,35 3,39 3,31 3,41 3,31 3,30 3,38 3,33 3,40 3,42 3,32 3,30 3,34 3,34 3,39 3,37 3,32 3,35 3,29 3,29 3,37 3,24 3,35 3,27 3,38 3,36 3,31 3,41 3,18 3,33 3,34 3,33 3,31 3,44 3,35 3,37 3,33 3,29 3,40 3,22 3,35 3,32 3,29 3,37 3,40 3,37 3,29 3,33 3,29 3,31 3,44 3,35 3,35 3,34 3,33 3,37 3,41 3,36 3,29 3,34 3,33 3,22 3,30 3,25 3,37 3,31 3,41 3,20 3,32 3,34 3,39 3,31 3,28 3,30 3,37 3,35 3,34 3,39 3,34 3,37 3,39 3,30 3,27 3,28 3,37 3,29 3,34 3,35 3,39 3,24 3,33 3,32 3,27 3,35 3,35 3,38 3,34 3,36 3,39 3,37 3,32 3,30 3,28 3,34 3,42 3,35 3,39 3,31 3,33 3,37 3,39 3,35 3,36 3,29 3,36 3,37 b) Erstellen Sie zu der Urliste eine sekundäre Häufigkeitsverteilung aus 9 äquidistanten Klassen mit absoluten und relativen Häufigkeiten. Stellen Sie diese Verteilung als Histogramm grafisch dar. 2 Aufgabe 3 Ein Einzelhändler registriert für einen Exklusivartikel im Verlauf von 30 Verkaufstagen folgende Verkaufszahlen: Tag 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Anzahl 5 2 3 0 0 1 3 6 0 2 1 0 1 0 2 Tag 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Anzahl 3 5 1 0 0 3 5 3 1 0 0 0 6 3 1 Erstellen Sie die primäre Tabelle mit absoluten und relativen Häufigkeiten und zeichnen Sie die Häufigkeitsverteilung als Polygonzugdiagramm. Aufgabe 4 Eine Umfrage über den Bierkonsum Bremer Bürger ergibt bei 10 Personen folgende Zahlenreihe (Liter pro Woche): 3 10 1 2 3 0 2 1 0 3 a) Berechnen Sie den Modalwert, den Median, das arithmetische Mittel, die Spannweite, die empirische Varianz, die empirische Standardabweichung und den Variationskoeffizienten. b) Wie ändern sich die obigen Werte, falls als Maßeinheit ein Glas Bier (= 0,4 Liter) verwendet wird? Aufgabe 5 Ein Händler hatte bei einer bestimmte Ware in fünf aufeinander folgenden Jahren folgenden Absatz: i 0 1 2 3 4 Jahr 2003 2004 2005 2006 2007 Absatz in Stück 1000 1200 1080 1350 1512 a) Bestimmen Sie die mittlere Wachstumsrate und den mittleren Wachstumsfaktor. b) Geben Sie eine Prognose für den Absatz im Jahr 2008. 3 Aufgabe 6 Im Dezember 1999 erzielte die ARD mit einer Sendung im Abendprogramm in den einzelnen Bundesländern folgende Einschaltquoten: Bundesland Baden-Württemberg Bayern Berlin Brandenburg Bremen Hamburg Hessen Mecklenburg-Vorpommern Niedersachsen Nordrhein-Westfalen Rheinland-Pfalz Saarland Sachsen Sachsen-Anhalt Schleswig-Holstein Thüringen Deutschland Einschaltquote [%] 3,1 3,0 2,2 2,3 2,5 2,5 2,8 2,4 2,6 3,1 3,2 3,1 2,8 2,7 2,9 3,0 ? Einwohner in 1000 10 476 12 155 3 387 2 601 663 1 705 6 052 1 789 7 899 18 000 4 031 1 072 4 460 2 649 2 777 2 449 82 165 Wie groß war die Einschaltquote für ganz Deutschland? Aufgabe 7 a) Berechnen Sie x und s zum Kohlenstoffgehalt einmal aus der primären Häufigkeitstabelle zu Aufgabe 2a) und zum zweiten Mal näherungsweise aus der 9-Klassen-Häufigkeitstabelle zu Aufgabe 2b). b) Berechnen Sie den empirischen Median und den Quartilsabstand zum Merkmal Kohlenstoffgehalt. Benutzen Sie dabei die primäre Häufigkeitstabelle. c) Zeichnen Sie den Box-Whisker-Plot zum Kohlenstoffgehalt. 4 Aufgabe 8 An einer Hochschule wurden 100 männliche Studenten zufällig ausgewählt und ihr Körpergewicht bestimmt. Das Ergebnis ist in folgender Tabelle zusammengefasst worden: Masse in kg über 50 bis 55 über 55 bis 60 über 60 bis 65 über 65 bis 70 über 70 bis 75 über 75 bis 80 über 80 bis 85 über 85 bis 90 Anzahl der Studenten 3 17 30 22 12 9 5 2 a) Bestimmen Sie näherungsweise Mittelwert, Standardabweichung, zweites Zentralmoment, Schiefe und Exzess. b) Interpretieren Sie die Werte für Schiefe und Exzess. Aufgabe 9 In einem Geschäft für Elektrogeräte wurde ein Warenkorb aus fünf Gütern zusammengestellt und die Preis- und Absatzveränderungen im Laufe eines Jahres registriert. Dabei ergaben sich folgende Werte: Gut Kaffeemaschine Staubsauger Kühlschrank Waschmaschine Bügeleisen Absatz [Stück] Januar 2007 Januar 2008 16 18 12 11 4 3 5 6 8 6 Preis [€/Stück] Januar 2007 Januar 2008 24,00 27,00 204,00 199,00 330,00 339,00 389,00 389,00 25,99 24,99 Berechnen Sie zur Basis Januar 2007 a) den Preisindex nach Laspeyres, b) den Umsatzindex. Interpretieren Sie diese Indizes. Aufgabe 10 Für die fünf neuen Bundesländer wurde im Jahre 1994 die Arbeitslosenquote der Geburtsrate (Anzahl Geborener pro 1000 Einwohner) gegenübergestellt: Land ALQ in % Geburtsrate Brandburg Mecklenburg-V. 15,3 17,0 4,7 4,9 Sachsen 15,7 5,0 Sachsen-Anhalt 17,6 5,0 a) Zeichnen Sie den Scatterplot. b) Berechnen und interpretieren Sie den empirischen Korrelationskoeffizienten. 5 Thüringen 16,5 5,2 Aufgabe 11 Für die fünf neuen Bundesländer und Ost-Berlin wurde im Jahre 1991 die Arbeitslosenquote der Bevölkerungsdichte (Einwohner pro km²) gegenübergestellt: Land Bev.-Dichte ALQ in % Brandburg Meckl.-V. Sachsen 91 82 267 10,3 12,5 10,4 S.-Anhalt 145 9,1 Thüringen 165 10,2 Berlin (O.) 3860 12,2 Berechnen Sie den Rangkorrelationskoeffizienten von Spearman. Gibt es einen Zusammenhang zwischen Arbeitslosenquote und Bevölkerungsdichte? Aufgabe 12 Um die Wirksamkeit eines neuen Antiallergikums zu überprüfen, wurden 23 Pollenallergiker mit dieser Arznei und weitere 25 mit einem Placebo behandelt. Der Behandlungserfolg wurde in die Kategorien „Beschwerden vorhanden“ und „Beschwerden beseitigt“ eingeteilt. Die folgende Tabelle enthält die beobachteten Häufigkeiten: Medikament 15 8 Beschwerden beseitigt Beschwerden vorhanden Placebo 8 17 Hat das Medikament eine andere Wirkung als das Placebo? Berechnen Sie dazu den korrigierten Kontingenzkoeffizienten. Aufgabe 13 Herr Müller hat alle Bände der Taschenbuch-Ausgabe seines Lieblingsautors Henning Mankell. Er wählt acht dieser Bücher zufällig aus und legt sie auf die Waage. Hier das Ergebnis zusammen mit der Seitenzahl: Anzahl der Seiten Masse [g] 608 336 352 576 384 544 576 512 442 257 278 420 291 398 422 380 a) Zeichnen Sie den Scatterplot. b) Wie hoch sind Masse und Seitenumfang korreliert? c) Welche Masse hat im Mittel der Einband? d) Das nächste Buch aus der Reihe soll 400 Seiten haben. Wie viel wird es wiegen? 6 Aufgabe 14 Ein Eigenheim mit 120 m² Wohnfläche wird mit Gas beheizt. An fünf zufällig ausgewählten Tagen des vergangenen Jahres hat der Hauseigentümer die Tagesmitteltemperatur und den Energieverbrauch ermittelt: Tagesmitteltemperatur in °C Heizenergieverbrauch in kWh -2 5 15 27 20 125 75 38 15 25 a) Stellen Sie einen funktionalen Zusammenhang her zwischen Tagesmitteltemperatur X und Heizenergieverbrauch Y durch (I) lineare Regression y = a + b ⋅ x, (II) curvilineare Regression y = a ⋅ eb⋅ x . b) Welcher der beiden Ansätze (I) und (II) passt sich den Beobachtungswerten besser an? Aufgabe 15 Aus einem Gefäß mit roten, weißen und gelben Kugeln werde eine Kugel zufällig entnommen. Die Ergebnismenge sei Ω = {r, w, g}. a) Wie viele Ereignisse gibt es? b) R, W und G seien die Ereignisse, eine rote, eine weiße bzw. eine gelbe Kugel zu ziehen. Beschreiben Sie die Ereignisse R, W und G durch Angabe ihrer Elemente. c) Beschreiben Sie das Ereignis A, keine rote Kugel zu erwischen, durch Verknüpfung von R, W und G. d) Was bedeuten die Ereignisse B = {r, g} und C = {w, g}? e) Beschreiben und interpretieren Sie die Ereignisse B ∩ C , B ∪ C und B . f) Beschreiben Sie das Ereignis, eine blaue Kugel zu ziehen. Aufgabe 16 Julia und Romeo wollen Anfang Mai heiraten. Am 1. Mai wird deshalb ein Polterabend stattfinden. Was die Anzahl der Gäste und das Wetter zum Polterabend betrifft, gibt es einige Ungewissheiten. Es werden folgende zufälligen Ereignisse betrachtet: G30 ... Es kommen nicht mehr als 30 Gäste. G50 ... Es kommen nicht mehr als 50 Gäste. R ... Es regnet am Abend des 1. Mai. a) Was bedeuten die Ereignisse G 30 und G30 ∪ G50 ? b) Was bedeutet die Aussage G 50 ∩ R = ∅ ? c) Beschreiben Sie mittels der Symbole G30 und G50 das Ereignis A, dass die Gästezahl zwischen 31 und 50 (einschließlich Grenzen) liegen wird. 7 Aufgabe 17 Von allen unterschiedlichen 6-ziffrigen Zahlen sind diejenigen in einer Lostrommel, die dreimal die 2, zweimal die 1 und einmal die 6 enthalten. a) Wie groß ist die Wahrscheinlichkeit, durch zufällige einmalige Entnahme aus dieser Lostrommel die Zahl 122 621 zu ziehen? b) Wie groß ist die Wahrscheinlichkeit, dass durch zufällige einmalige Entnahme die gezogene Zahl mit 216 beginnt? Aufgabe 18 Wie groß ist die Wahrscheinlichkeit, mit einem idealen Würfel in drei Würfen a) genau einmal eine, b) keine, c) mindestens einmal eine d) erstmals im dritten Wurf eine Sechs zu werfen? Aufgabe 19 Die zwölf PCs eines Instituts sollen zu einem lokalen Netzwerk verbunden werden. Dazu muss jeder PC einen Namen bekommen. Der Netzwerkadministrator beschließt, die Namen der zwölf Apostel rein zufällig den Computern zuzuordnen. Wie groß ist die Wahrscheinlichkeit, dass die beiden PCs in Zimmer 17 Petrus und Paulus heißen werden? Aufgabe 20 Im Spiel 77 wird die 7-stellige Gewinnzahl ermittelt, indem siebenmal eine Ziffer (ohne Zurücklegen) aus einer Lostrommel gezogen wird. In der Lostrommel befinden sich zu Beginn der Ziehung die Ziffern 0, 1, 2, …, 9 je siebenmal. Unter den ersten fünf Ziffern einer Ziehung kam schon dreimal die Ziffer „7“ vor. Wie groß ist die Wahrscheinlichkeit, dass die letzten beiden Ziffern „77“ sein werden? Aufgabe 21 Ein Kraftfahrzeughändler weiß aus langjähriger Erfahrung, dass bei den in Zahlung genommenen Wagen 50 % Mängel am Motor, 70 % an der Karosserie und 30 % an Motor und Karosserie aufweisen. Wie groß ist die Wahrscheinlichkeit dafür, dass ein in Zahlung genommener Wagen a) ohne Mängel an Motor und Karosserie ist, b) auch einen Mangel am Motor besitzt, wenn bekannt ist, dass die Karosserie schadhaft ist? 8 Aufgabe 22 Die Chancen für einen deutlichen Kurswechsel in der Wirtschaftspolitik seien 90 %, wenn Kandidat R die Wahl gewinnt, und nur 30 %, wenn Kandidat C die Wahl gewinnt. Nach Expertenmeinung stehen die Chancen für R, anstelle von C die Wahl zu gewinnen, 55 : 45. a) Mit welcher Wahrscheinlichkeit muss mit einem wirtschaftlichen Kurswechsel gerechnet werden? b) Nach der Wahl wird ein Kurswechsel registriert. Wie groß ist die Wahrscheinlichkeit, dass R die Wahl gewonnen hat? Aufgabe 23 Bei einem schriftlichen Test werden Multiple-Choice-Fragen gestellt, bei denen von je 3 vorgegebenen Antworten genau eine richtig ist. Man nehme an, dass ein bestimmter Teilnehmer mit Wahrscheinlichkeit 0,75 auf jede Frage (unabhängig von den anderen Fragen) die richtige Antwort weiß und sonst zufällig ankreuzt. Man bestimme für eine einzelne Frage a) die Wahrscheinlichkeit, dass der Teilnehmer die richtige Antwort ankreuzt, b) die bedingte Wahrscheinlichkeit dafür, dass der Teilnehmer bei einer richtig angekreuzten Antwort diese auch tatsächlich wusste. c) Wie groß ist die Wahrscheinlichkeit, dass der Teilnehmer alle 12 Fragen des Tests richtig beantwortet? Aufgabe 24 Zum Kindergeburtstag wird eine Tombola veranstaltet. Im Lostopf sind 30 Lose, darunter 10 Gewinnlose. Das Geburtstagskind darf als erstes drei Lose ziehen. X bezeichne die zufällige Anzahl der Gewinnlose in dieser 1. Ziehung. X hat folgende Verteilung: 0 k P(X = k) 0,28 1 0,47 2 0,22 3 0,03 a) Zeichnen Sie die Verteilungsfunktion von X. b) Berechnen Sie Erwartungswert, Varianz und Schiefe dieser Verteilung. 9 Aufgabe 25 Bei der Planung eines Projekts schätzt man den zur Durchführung benötigten (zufälligen) Zeitbedarf mit t* = 3 Zeitperioden ein. Optimistische bzw. pessimistische Schätzungen, die sicher nicht unter- bzw. überschritten werden, sind tmin = 1 bzw. tmax = 4 . Darüber hinaus wird eine Dichtefunktion folgender Form unterstellt: 0 1 2 33 44 5 6t a) Beschreiben Sie die Dichtefunktion f durch einen analytischen Ausdruck. b) Berechnen und skizzieren Sie die Verteilungsfunktion F. Aufgabe 26 Der Besitzer eines Zeitschriftenladens hat für einen längeren Zeitraum in der Vergangenheit folgende (tägliche) Nachfrageverteilung nach einer bestimmten Tageszeitung beobachtet: pro Tag nachgefragte Exemplare Nachfragewahrscheinlichkeit 0 0,20 1 0,30 2 0,20 3 0,20 4 0,10 >4 0 Er rechnet für die Zukunft mit keiner Änderung der Nachfrageverteilung. Der Einkaufspreis eines Exemplars beträgt 0,50 €, der Verkaufspreis 1,50 €. Unverkaufte Exemplare können nicht zurückgegeben werden. Für einen längeren Zeitraum muss er eine feste Zahl von Zeitungen pro Tag bestellen. Wie viele Zeitungen pro Tag sollte er bestellen, um seinen (erwarteten) Gewinn zu maximieren? Aufgabe 27 Gewisse Bauelemente werden mit einer Ausschussquote von 10 % produziert. Aus der laufenden Produktion werden 10 Stück zufällig entnommen und geprüft. Wie groß ist die Wahrscheinlichkeit, dass sich a) genau fünf b) nicht mehr als zwei Ausschussteile in der Stichprobe befinden? 10 Aufgabe 28 Unter den 20 Passagieren eines Charterfluges befinden sich zwei Bewaffnete, die das Flugzeug entführen wollen. Zehn Passagiere werden zufällig ausgewählt und genau untersucht. Wie groß ist die Wahrscheinlichkeit dafür, dass die beiden Bewaffneten unentdeckt bleiben? Aufgabe 29 Das Rechenzentrum der Universität hat festgestellt, dass während einer Betriebszeit von 24 Stunden mit der Wahrscheinlichkeit 0,905 kein Ausfall des Systems zu verzeichnen ist. Die Anzahl der Systemausfälle sei Poisson-verteilt. a) Bestimmen Sie den Parameter λ der Poisson-Verteilung. b) Wie groß ist die Wahrscheinlichkeit, dass an einem Tag genau zwei Systemausfälle zu verzeichnen sind? c) Berechnen Sie die Wahrscheinlichkeit, dass es bei 5 gleichartigen Systemen, die unabhängig voneinander laufen, zu mindestens einem Ausfall am Tage kommt. Aufgabe 30 Eine Zufallsgröße X sei gleichmäßig stetig verteilt auf dem Intervall (a, b). Berechnen Sie Erwartungswert und Varianz von X. Aufgabe 31 X bezeichne einen bestimmten Durchmesser [mm] von Wellen. In der gegenwärtigen Produktion kann der Wellendurchmesser als N(25,58; 0,000225)-verteilt angesehen werden. Die Welle ist standardgerecht, wenn der Durchmesser zwischen 25,54 und 25,63 mm liegt. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Welle a) Ausschuss ist, b) nachgearbeitet werden muss? Aufgabe 32 Die Körpermasse X [in kg] zufällig ausgewählter Personen aus einer Grundgesamtheit G sei normalverteilt mit den Parameter μ und σ 2 . Es gilt: P( X ≤ 80) = 1 2 und P ( X ≤ 70) = 1 . 4 a) Geben Sie μ und σ an. b) Berechnen Sie P(X > 100). c) Wie viel Prozent der Personen der Grundgesamtheit, die mindestens 100 kg wiegen, wiegen über 110 kg? 11 Aufgabe 33 Man betrachte die Klausurergebnisse in Mathematik (Zufallsvariable X) und Statistik (Zufallsvariable Y). Die gemeinsame Wahrscheinlichkeitsfunktion der zweidimensionalen Zufallsvariablen (X, Y) sei durch die folgende Tabelle gegeben: y 1 2 3 4 5 0,04 0,04 0 02 0,01 0,00 0,03 0,10 0,08 0,02 0,01 0,02 0,03 0,20 0,04 0,03 0,01 0,02 0,08 0,10 0,03 0,00 0,01 0,02 0,03 0,03 x 1 2 3 4 5 a) Man bestimme die Wahrscheinlichkeiten i. in Mathematik zu bestehen und in Statistik nicht zu bestehen, ii. in beiden Klausuren zu bestehen, iii. in beiden Klausuren nicht zu bestehen, iv. in beiden Klausuren besser als 3 zu erhalten, v. in beiden Klausuren zwischen 2 und 4 zu erreichen. b) Geben Sie die Randverteilungen an. c) Sind die beiden Zufallsvariablen unabhängig? d) In Mathematik erzielt ein Student die Note 2. Wie sehen seine "Notenchancen" bei der Statistikklausur aus? Aufgabe 34 Zwei "faire" Würfel, einer weiß, der andere schwarz, werden unabhängig voneinander geworfen. Als Ergebnisse werden notiert: X = "Augenzahl des weißen" und Y = "Augenzahl des schwarzen Würfels". a) Bestimmen Sie die Wahrscheinlichkeitsverteilung der Zufallsvariablen Z = X - Y. b) Berechnen Sie Erwartungswert und Varianz von Z. Aufgabe 35 Die Zufallsvariablen X und Y haben die folgende gemeinsame Wahrscheinlichkeitsverteilung. y x 1 2 0 1 2 0,1 0,2 0,2 0 0,3 0,2 Man berechne a) die Randverteilungen, Erwartungswerte und Varianzen für X und Y, b) die Kovarianz und Korrelation zwischen X und Y. 12 Aufgabe 36 Ein Passagierflugzeug mit 125 Sitzplätzen ist ausgebucht. Die Körpermasse eines Passagiers liegt im Mittel bei 80 kg und schwankt mit der Standardabweichung 25 kg. Unter Anwendung des Zentralen Grenzwertsatzes bestimme man näherungsweise die Wahrscheinlichkeit dafür, dass die Gesamtmasse aller 125 Fluggäste die kritische Grenze von 10,56 t übersteigt. Aufgabe 37 Die Beobachtungen x1 , x2 , x3 können als Realisierungen von unabhängigen normalverteilten Zufallsvariablen X 1 , X 2 , X 3 mit dem unbekannten Parameter µ und dem bekannten Parameter σ 2 = 1 aufgefasst werden. a) Prüfen Sie, ob 1 1 μˆ1 = ( X 1 + X 3 ) und μˆ 2 = ( X 1 + X 2 + X 3 ) 2 3 erwartungstreue Schätzfunktionen für µ sind. b) Bestimmen Sie, welche der beiden Schätzfunktionen wirksamer ist. c) Welche Verteilung besitzen die Zufallsvariablen μˆ1 und μˆ 2 ? Aufgabe 38 Der Erwartungswert μ eines Merkmals X soll durch die Stichprobenfunktionen ϑˆn = 1 n ∑ Xi n i =1 ϑˆn′ = 2 n2 ϑˆn′′ = n 2 i ⋅ Xi ∑ n(n + 1) i =1 n ∑i ⋅ X i =1 i geschätzt werden. a) Prüfen Sie die Erwartungstreue der Schätzfunktionen. b) Ermitteln Sie unter den angegebenen Schätzern den wirksamsten. Aufgabe 39 Ein Merkmal sei gleichmäßig stetig verteilt auf dem Intervall [a, b]. Die beiden Parameter a und b sind unbekannt. Geben Sie für beide Schätzfunktionen nach der Momentenmethode an. 13 Aufgabe 40 Die Zeit vom Einschalten eines Geräts bis zum ersten Ausfall desselben ist eine stetig verteilte Zufallsvariable X mit der Dichte ⎧λ ⋅ e − λ x für x ≥ 0, f ( x) = ⎨ sonst. ⎩0 Der Parameter λ > 0 ist unbekannt und soll anhand einer Stichprobe vom Umfang n geschätzt werden. a) Beweisen Sie, dass X den Erwartungswert λ-1 hat, und geben Sie einen Momentenschätzer für λ an. b) Wie lautet die Maximum-Likelihood-Schätzfunktion für λ ? Aufgabe 41 Die Anzahl X der pro Zeiteinheit an einer Tankstelle tankenden Pkw kann als Poisson-verteilt mit dem unbekannten Parameter λ angesehen werden. Es werde eine Stichprobe vom Umfang n = 5 entnommen. a) Stellen Sie die Likelihoodfunktion auf. b) Eine konkrete Stichprobe vom Umfang n = 5 ergibt 4, 2, 3, 5, 6. Welchen Wert nimmt die Likelihoodfunktion in diesem Punkt an? c) Für welches λ wird die Likelihoodfunktion im Punkt (4, 2, 3, 5, 6) maximal? d) Wie lautet die Maximum-Likelihood-Schätzfunktion für λ bei allgemeinem Stichprobenumfang n? Ist sie erwartungstreu? Aufgabe 42 Ein Kreditinstitut möchte einige Aussagen über die Kredite [in EUR] einer bestimmten Bevölkerungsschicht erhalten. Die Kredithöhe wird als normalverteilte Zufallsvariable X angenommen. Eine Stichprobe vom Umfang n = 30 ergibt x = 1500 und s 2 = 20000. a) Welches Intervall überdeckt mit 95%iger Sicherheit den Erwartungswert μ der Kredithöhe? b) Berechnen Sie ein Schätzintervall für die Standardabweichung σ der Kredithöhe zum Konfidenzniveau 0,95. c) Mit welchem Konfidenzniveau 1 - α entsteht eine Bereichsschätzung für μ der Form [ x − 50; x + 50] ? 14 Aufgabe 43 In einer Gießerei wird Gusseisen hergestellt. Zur Kontrolle des Kohlenstoffgehalts wurden 167 Chargen zufällig entnommen und im Labor geprüft. Aus den 167 Beobachtungswerten zum C-Gehalt sind dann x = 3,33748 und s = 0,0471 [%] berechnet worden. Der C-Gehalt kann als normalverteilt angesehen werden. a) Bestimmen Sie ein 90%-Konfidenzintervall für den mittleren C-Gehalt und interpretieren Sie dieses. b) Geben Sie ein 95%-Konfidenzintervall für die Standardabweichung des C-Gehalts an. Aufgabe 44 Aus ca. 10000 Haushalten einer Region wurden n = 100 zufällig ausgewählt und danach befragt, ob sie einen Zweitwagen besitzen. Die Frage wurde von 30 Haushalten bejaht. a) Bestimmen Sie ein 95%-Konfidenzintervall (mit Stetigkeitskorrektur) für den Anteil an Zweitwagen. b) Kann es sein, dass der Anteil an Zweitwagen 40 % beträgt? Aufgabe 45 Die Masse von Eiern einer bestimmtem Güteklasse sei normalverteilt mit dem Erwartungswert µ = 78 g und der Streuung σ² = 36 g². Ein Kunde kauft 61 Eier und ermittelt x = 72,1 und s = 6,2 [g]. a) Steht dieses Ergebnis im Einklang mit der angegebenen Güteklasse? Testen Sie mit α = 0,05. b) Überprüfen Sie mit α = 0,05, ob die Masse der Eier wie vorgeschrieben streut. c) Überprüfen Sie mit α = 0,05, ob die Masse der Eier zu stark streut. Aufgabe 46 Ein Arbeiter braucht für die Bearbeitung eines Werkstücks im Durchschnitt 7 Minuten. Ein Berater des Unternehmens schlägt, um eine Zeitersparnis zu erreichen, eine andere Bearbeitungsart vor und will die Effektivität seines Vorschlags mit Hilfe einer Stichprobe von Umfang n = 16 testen. Die Stichprobe liefert die empirischen Kennwerte x = 408 und s = 25, 7 Sekunden. Es kann davon ausgegangen werden, dass die Grundgesamtheit normalverteilt ist. a) Überprüfen Sie mit α = 0,05 und mit α = 0,01, ob eine signifikante Zeiteinsparung erreicht worden ist. b) Die bisherige Bearbeitungsdauer streute mit der Standardabweichung σ = 30 Sekunden. Der Berater meint, dass die neue Fertigungsart auch die Varianz verringert hat. Testen Sie mit α = 0,05. 15 Aufgabe 47 Aus der laufenden Produktion werden n = 100 Teile zufällig entnommen und geprüft. Es stellt sich heraus, dass in der Stichprobe acht defekte Teile sind. Prüfen Sie mit α = 0,05, ob es sein kann, dass der Ausschussanteil in der Gesamtproduktion 5 % nicht übersteigt. Aufgabe 48 Bei seinen Kreuzungsversuchen mit Erbsen erhielt Mendel folgendes Ergebnis: Sorte glatt und gelb glatt und grün runzelig und gelb runzelig und grün Anzahl der Erbsen 315 108 101 32 Zu erwarten war nach der Theorie ein Verhältnis 9:3:3:1. Welche Aussage über die Richtigkeit seiner Theorie lässt sich zum Signifikanzniveau α = 0,05 machen? Aufgabe 49 Aus einer Zufallsstichprobe von 61 Eiern war für deren Masse x = 72,1 g und s = 6,2 g ermittelt worden. Mit Hilfe des einfachen t-Tests wurde dann nachgewiesen, dass die mittlere Masse der Eier signifikant vom Normativ abweicht. Der einfache t-Test setzt ein normalverteiltes Merkmal voraus. Überprüfen Sie diese Voraussetzung mit α = 0,10. Drittes und viertes empirisches Moment sind hier 1 n ( xi − x )3 = −149,34 ∑ n i =1 bzw. 1 n ( xi − x ) 4 = 4111,11 . ∑ n i =1 Aufgabe 50 An einer Tankstelle, die um 24 Uhr schließt, wurde erfasst, wie viele Kunden nach dieser Uhrzeit per Bankcard-Terminal die Zapfsäule nutzen. Dabei wurden an 100 aufeinander folgenden Tagen diese Beobachtungen registriert: Anzahl der TankAnzahl der Tage kunden nach 24 Uhr 0 16 1 34 2 28 3 18 4 4 Der Tankwart behauptet, dass die Anzahl X der nach 24 Uhr den Tankautomaten nutzenden Kunden Poisson-verteilt ist. Hat der Tankwart recht? Testen Sie mit α = 0,01. 16 Aufgabe 51 In einem Unternehmen werden Wellen für den Fahrzeugbau hergestellt. Ein Arbeitsgang besteht darin, in die Welle eine Nut zu fräsen. Die Tiefe der Nut wird durch eine Qualitätsregelkarte überwacht, indem ca. alle 2 Stunden fünf zufällig ausgewählte Wellen gemessen werden. Im ungestörten Produktionsprozess würde die Nutentiefe mit der Standardabweichung 0,1 mm um den Mittelwert 8,0 mm schwanken. Die letzten zehn Messungen ergaben folgende Nutentiefen: 1. Messung: 2. Messung: 3. Messung: 4. Messung: 5. Messung: 6. Messung: 7. Messung: 8. Messung: 9. Messung: 10. Messung: 8,0 8,1 8,1 8,0 7,9 8,0 8,0 7,9 7,8 7,9 8,0 8,0 8,1 8,1 8,0 8,1 8,0 8,0 7,9 7,9 8,0 8,1 7,9 8,0 8,1 7,9 7,9 7,8 8,0 7,9 8,1 7,9 8,0 7,9 8,0 7,8 7,8 8,0 7,7 7,7 8,0 8,0 7,9 7,9 7,8 7,9 7,9 7,8 8,0 7,9 a) Stellen Sie diese Messergebnisse in einer x -Karte mit Kontroll- und Warngrenzen grafisch dar. b) War der Prozess stets unter Kontrolle? c) Lässt sich in der Qualitätsgeschichte eine Tendenz erkennen? Wenn ja, welche? Aufgabe 52 Aus der laufenden Produktion von Plastformteilen werden pro Tag ca. 50 Teile zufällig ausgewählt und auf gut/schlecht geprüft. Aus einem Vorlauf von 28 Tagen war eine mittlere Ausschussquote von p = 0, 02 ermittelt worden. Für die nächsten 10 Tage ergibt sich Tag 1 2 3 4 5 ni 50 50 52 50 60 xi 1 1 2 3 5 Tag 6 7 8 9 10 ni 50 44 50 50 50 xi 0 1 2 1 1 Zeichnen und interpretieren Sie die p-Karte zu diesen Daten. 17 Aufgabe 53 Ein Abnehmer bezieht ein Los mit N = 50 Teilen, in dem M = 5 defekte Teile sind. Er zieht n = 10 Teile. a) Wie groß ist die Wahrscheinlichkeit, höchstens zwei schlechte Teile in der Stichprobe zu haben? b) Bei welcher Ausschussquote p hat die OC-Funktion ihren Medianpunkt, wenn c = 2 als Annahmezahl benutzt wird? c) Skizzieren Sie die OC-Funktion zu b). d) Zum Prüfplan (50,10,2) haben Lieferant und Abnehmer eine Gutlage von 10 % vereinbart. Wie groß ist das Lieferantenrisiko? Aufgabe 54 Für zehn aufeinander folgende Jahre wurde in der Region Potsdam die Niederschlagsmenge im Mai dem Hektarertrag bei Feldfutter gegenübergestellt: Jahr 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 Regen im Mai [l/m²] 30 51 112 61 23 113 64 15 16 33 Ertrag Feldfutter [dt/ha] 403,6 339,5 395,5 435,1 428,8 396,9 444,5 406,1 346,0 335,9 a) Berechnen Sie den empirischen Korrelationskoeffizienten rxy. b) Bestätigen die Daten die Bauernregel: „Ist der Maien kalt und nass, füllt’s dem Bauern Scheun’ und Fass.“? Setzen Sie Normalverteilung voraus und testen Sie mit α = 0,05. Aufgabe 55 Um die Wirksamkeit eines neuen Antiallergikums zu überprüfen, wurden 23 Pollenallergiker mit dieser Arznei und weitere 25 mit einem Placebo behandelt. Der Behandlungserfolg wurde in die Kategorien „Beschwerden vorhanden“ und „Beschwerden beseitigt“ eingeteilt. Aus der 2x2-Kontingenztafel ist dann χ² = 5,296 und daraus Cnorm = 0,446 berechnet worden. Unterscheiden sich das Medikament und das Placebo signifikant (α = 0,05) in ihrer Wirkung? 18 Aufgabe 56 100 Bachelorabsolventen, nämlich 30 Wirtschaftsingenieure, 35 Medienwirtschaftler und 35 Betriebswirte, die sich in einem Unternehmen beworben haben, werden nach einem Eignungstest in die Kategorien „geeignet“, „bedingt geeignet“ und „ungeeignet“ eingeordnet: geeignet bedingt geeignet ungeeignet Wirtschaftsingenieur 14 5 11 Betriebswirt 10 9 16 Medienwirt 16 6 13 a) Berechnen Sie den normierten Kontingenzkoeffizienten. b) Testen Sie mit α = 0,05 , ob die Eignung vom Studienfach abhängt. Aufgabe 57 Die Punktezahl, die ein Student in der Statistikklausur erreicht, kann als normalverteilt angesehen werden. Die Matrikel 2011 mit 41 Teilnehmern erreichte im Mittel 24,19 Punkte bei einer empirischen Standardabweichung von s1 = 3,82 Punkten. Die Matrikel 2012 mit 51 Teilnehmern erreichte im Mittel 22,81 Punkte bei einer empirischen Standardabweichung von s2 = 4,06 Punkten. Es gab keine Studenten, die an beiden Klausuren teilnahmen. a) Können die Varianzen der Punktezahl in beiden Jahrgängen als gleich groß angesehen werden? Testen Sie mit α = 0,10. b) Ist die mittlere Punktezahl in Matrikel 2012 signifikant niedriger als in Matrikel 2011? Testen Sie mit α = 0,05. Aufgabe 58 In vier Großstädten wurden die Preise für eine bestimmte Ware in n1 = 20, n2 = 25, n3 = 15 bzw. n4 = 24 Geschäften festgestellt. Dabei ergaben sich die Mittelwerte x1• = 5, 6, x2 • = 8, 4, x3• = 8,8 bzw. x4 • = 6, 0 und für die Varianz der gesamten Stichprobe (vom Umfang 84) MQT = 6. Testen Sie zu α = 0,01, ob der mittlere Preis der Ware in allen vier Großstädten gleich groß ist (Normalverteilung, Unabhängigkeit und Varianzhomogenität vorausgesetzt). 19 Aufgabe 59 Eine Produzentin will ein neues Produkt auf den Markt bringen und muss unter vier verschiedenen Verpackungen eine geeignete auswählen. Zur Untersuchung der Wirksamkeit auf die Kunden werden die vier Verpackungen jeweils einer Gruppe von fünf potenziellen Käufern vorgelegt. Die von diesen potenziellen Käufern angegebenen Preisschätzungen [in EUR] sind der folgenden Tabelle zu entnehmen: Verpackung 1 Verpackung 2 Verpackung 3 Verpackung 4 6 4 5 7 8 6 6 5 6 3 3 6 5 6 3 4 5 6 8 8 Nehmen Sie die Voraussetzungen für die einfache Varianzanalyse als erfüllt an und prüfen Sie, ob zum Signifikanzniveau α = 0,05 die Verpackung einen Einfluss auf die Preisschätzungen hat. Aufgabe 60 In einer Fertigungslinie werden Kleinteile in Handarbeit montiert. Auf Vorschlag eines Arbeiters wird ein Werkzeug so verändert, dass die Montage leichter von der Hand geht. Die folgende Tabelle enthält die Stückzahlen, die die 18 Monteure vor und nach der Veränderung pro Stunde schaffen: Arbeiter vorher nachher 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 131 132 126 116 138 125 127 118 124 130 124 129 129 117 125 126 126 128 138 133 128 115 142 128 134 117 123 132 132 130 132 114 126 130 127 128 Überprüfen Sie a) mit dem Vorzeichentest, b) mit dem einfachen t-Test (angewandt auf die Paar-Differenzen), ob durch die Veränderung des Werkzeugs eine signifikante (α = 0,05) Verbesserung eingetreten ist. Aufgabe 61 Im Jahr 2007 wurden in Thüringen 17.176 Kinder geboren, davon 8.925 männliche. Stehen diese Zahlen im Widerspruch zu der Annahme, dass die beiden Geschlechter bei Neugeborenen in Thüringen gleich wahrscheinlich sind? Testen Sie mittels Vorzeichentest zum Signifikanzniveau α = 0,01. 20 Lösungen 4 a) xMod = 3; xMed = 2; x = 2,5; R = 10; s 2 ≈ 8, 28; s ≈ 2,88; v ≈ 115% 5 a) r = 10,9 % b) 1677 6) 2,886 % 7 a) x = 3,33749 s = 0, 04708 b) xMed = 3,34 8 a) x ≈ 66,5 b) x ≈ 3,33695 s ≈ 0, 04745 Q = 0, 06 s ≈ 7,8817 M Zen,2 ≈ 61,5 M Zen ,3 ≈ 310,5 9 a) P L ≈ 100, 25% M Zen ,4 ≈ 10984,5 Sch ≈ 0, 644 Exz ≈ −0, 096 U ≈ 97,95% 10 b) 0,432 11) -0,0286 12) 0,446 13 b) r = 0,9991 c) 37,8 g 14 a) (I) yˆ = 104, 2655 − 3, 7435 ⋅ x d) 304 g (II) yˆ = 108,88 ⋅ exp(−0, 07294 ⋅ x) b) (II) ist besser. 17 a) 1 60 b) 18) a) 0,3472 19) 1 20 b) 0,5787 c) 0,4213 1 66 20) 0,00288 21 a) 1 10 22 a) 0,63 23 a) 5 6 24 b) μ = 1 b) 3 7 b) 0,786 c) ≈ 0,112 b) 0,9 σ 2 = 0, 62 S ≈ 0,37 21 d) 0,1157 für x ≤ 1 ⎧0 ⎪ 2 ⎪x − x + 1 ⎪ 25 b) F ( x) = ⎨ 6 2 3 6 ⎪− x + 8 x − 13 ⎪ 3 3 3 ⎪ ⎩1 für 1 < x ≤ 3 für 3 < x ≤ 4 für x > 4 26) 2 27 a) 0,001488 28) b) 0,930 9 38 29 a) λ ≈ 0,1 b) 0,004525 31 a) 0,00383 b) 0,000435 32 a) μ = 80, σ ≈ 14,8 33 a) i: 0,06 ii: 0,84 c) nein c) 0,393 b) 0,0885 iii: 0,03 c) 24 % iv: 0,21 v: 0,67 d) 20 %, 50 %, 15 %, 10 % und 5 % für die Noten 1, 2, 3, 4 bzw. 5 34 b) E ( Z ) = 0 Var ( Z ) = 35 6 35 a) E ( X ) = 1, 4 Var ( X ) = 0, 24 E (Y ) = 1, 2 Var (Y ) = 0, 76 b) Cov( X , Y ) = −0, 08 ρ xy ≈ −0,1873 36) 2,3 % 37 a) beide erwartungstreu b) μ̂2 38 a) ϑˆn und ϑˆn′′ erwartungstreu b) ϑ̂n 39) aˆ = x − 3 ⋅ s und bˆ = x + 3 ⋅ s 40 a) λ̂Mom = 1 X λ 20 ⋅ e −5λ b) λ̂ML = 1 X c) 4 d) λ̂ = X erwartungstreu 42 a) (1447,2; 1552,8) b) (112,65; 190,40) c) 0,935 43 a) (3,33145; 3,34351) b) (0,0425; 0,0528) 44 a) (0,205; 0,395) b) nein 45 a) nein b) könnte sein 41 b) 24883200 46 a) Zeiteinsparung ist signifikant. c) nicht nachweisbar b) nicht nachweisbar 22 47) könnte sein 48) keine Einwände gegen die Theorie 49) nicht normalverteilt 50) könnte sein ⎧8,1342 51 a) K o / u = ⎨ ⎩7,8658 ⎧8, 0894 Wo / u = ⎨ ⎩7,9106 b) nein ⎧0, 0794 52) K o / u = ⎨ ⎩0 53 a) 0,95174 b) 0,267 54 a) 0,188 b) nein d) 0,048 55) ja 56 a) 0,212 b) nicht nachweisbar 57 a) ja b) ja 58) nein 59) nein 60 a) ja b) ja 61) ja 23 c) ja