Dr. S. Wiesendorf Sommersemester 2016 12. Übung zur Mathematik II für Biologen (Abgabe der schriftlichen Aufgaben in der Übungsstunde am 11. bzw. 12. Juli) Hinweis zur Klausurzulassung: Dies ist das letzte Übungsblatt. Zum Erlangen der Klausurzulassung benötigen Sie dementsprechend, neben der regelmäßigen Teilnahme an den Übungen, 30% der Gesamtpunktzahl von 780 Punkten, d.h. Sie benötigen insgesamt aus beiden Semestern 234 Punkte. Das Testen von Hypothesen über den Erwartungswert Der Einstichproben-Gauß-Test prüft anhand des arithmetischen Mittels einer Stichprobe, ob der Erwartungswert µ der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist. Gegeben sei ein Stichprobe x1 , . . . , xn , die einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert µ und bekannter Standardabweichung σ entstamme. Wie wir wissen, ist Pn dann das arithmetische Mittel X̄ = 1/n i=1 Xi ebenfalls normalverteilt mit Er√ 0 unter der wartungswert µ und somit die standardisierte Zufallsvariable Y = X̄−µ σ/ n Nullhypothese µ = µ0 standardnormalverteilt. Um den Fehler 1. Art zu kontrollieren, müssen wir, bei vorgegebenem Signifikanzniveau α, den Annahmebereich so wählen, dass unter der Nullhypothese die Wahrscheinlichkeit einen Fehler zu machen gerade α ist, d.h. wir müssen wieder eine Grenze c finden, so dass P (−c ≤ Y ≤ c) = 1 − α. Wie wir in der Vorlesung gesehen haben, ist dies für c = z1−α/2 der Fall, was dann auf die Bedingung µ0 − √σn z1−α/2 ≤ X̄ ≤ µ0 + √σn z1−α/2 führt. Wir nehmen H0 also an, falls für den Schätzwert x̄ ∈ [µ0 − √σn z1−α/2 , µ0 + √σn z1−α/2 ] gilt, andernfalls lehnen wir H0 ab. Da in diesem Fall der Annahmebereich der Nullhypothese von beiden Seiten begrenzt ist, spricht man auch von einem zweiseitigen Test bzw. einer zweiseitigen Alternative. Einseitige Tests sind hingegen durch die Nullhypothesen H0 : µ ≤ µ0 (rechtsseitiger Test) bzw. H0 : µ ≥ µ0 (linksseitiger Test) gegeben. In diesen Fällen ist der Annahmebereich für H0 entsprechend x̄ ≤ µ0 + √σn z1−α für den rechtsseitigen Test bzw. x̄ ≥ µ0 − √σn z1−α für den linksseitigen Test. Diese Hypothesentests für den Erwartungswert kann man, bei hinreichend großen Stichproben (n ≥ 30), ebenfalls verwenden, wenn die zugrundeliegende Grundgesamtheit nur annähernd normalverteilt ist. Aufgabe 1. (10 Punkte, schriftlich) Eine Kommilitonin sagt Ihnen, dass die durchschnittliche Größe von Studierenden 173 cm beträgt. Können Sie ihre Aussage mittels der Angaben aus Aufgabe 2 von Blatt 10 zum Niveau α = 5% widerlegen? Aufgabe 2. (10 Punkte, schriftlich) Sie wollen sich ein neues Auto zulegen und lassen sich im Fachgeschäft beraten. In Zeiten der Erderwärmung achten Sie vor allem auf einen möglichst niedrigen Verbrauch des Autos. Der Verkäufer bietet Ihnen daher ein besonders sparsames Modell an, das (außerorts) mit einer einzigen Tankfüllung angeblich mindestens 800 km weit fahren soll. Sie können nun annehmen, dass die Reichweite mit einer Tankfüllung normalverteilt mit einer Standardabweichung von 60 km ist. Kurz darauf lesen Sie, dass die Angabe des Herstellers bezüglich der Reichweite einer Tankfüllung von einem Ihnen wohlbekannten Automobilclub getestet wurde. Bei 80 Tankfüllungen ergab sich eine mittlere Reichweite von 755.6 km. Kann die Herstellerangabe zu einem Signifikanzniveau von 5% widerlegt werden? Aufgabe 3. (10 Punkte, schriftlich) Der Vertriebsleiter einer Mehlfabrik geht davon aus, dass seine angebotenen Packungen Vollkornmehl ein mittleres Füllgewicht von rund 1000 Gramm mit einer Standardabweichung von σ = 12.5 Gramm haben. Irgendwann zweifelt er jedoch an dieser Angabe. Daher möchte er die Angabe mit einem statistischen Test, und zwar dem Gauß-Test, überprüfen. Eine genauere Untersuchung an n = 40 Packungen zeigt, dass die Füllmenge im Durchschnitt x̄ = 1004.32 Gramm beträgt. Soll der Vertriebsleiter, unter der Voraussetzung, dass die Füllmenge normalverteilt ist, mit der Produktionsleitung Kontakt aufnehmen? Aufgabe 4. (mündlich) Sascha Schlaumeier, Klaus Klug und Mr. Smart sind die Chefredakteure des gedruckten Grossen Universallexikons“. Um ihre schwächeln” den Verkaufszahlen anzukurbeln, wollen sie nachweisen, dass die Online-Konkurrenz der Wissenpedia“ nicht die gleiche Qualität hat. Aufgrund ihrer bisherigen Lektüre ” glauben sie, dass jeder achte Artikel der Wissenpedia substantielle Fehler enthält. Die Hypothese H0 : p ≥ 12.5% wird abgelehnt, wenn in einer Stichprobe von 100 Artikeln höchstens 5 Artikel substantielle Fehler enthalten. (a) Begründen Sie die Wahl der Chefredakteure im Sachzusammenhang. Ermitteln Sie die Wahrscheinlichkeit für einen Fehler 1. Art. Hierfür genügt es den Fehler für den Fall p = 12.5% zu kontrollieren. Zeigen Sie zudem, dass die Entscheidungsregel für p = 12.5% optimal zum Signifikanzniveau α = 1.5% ist. (b) Die Redakteure von Wissenpedia hören von der Anschuldigung und halten dagegen. Sie wollen ihre Artikel optimieren und werden in Zukunft dafür sorgen, dass weniger als 12.5% ihrer Artikel Fehler haben. Angenommen die Fehlerquote beträgt 11% und die Chefredakteure des Grossen Universallexikons prüfen noch einmal mit der gleichen Entscheidungsregel. Mit welcher Wahrscheinlichkeit würden sich die drei Universallexikon-Redakteure wieder darin bestätigt sehen, dass jeder achte Artikel in der Wissenpedia substantielle Fehler enthält? Aufgabe 5. (mündlich) (Wiederholung) Im Rahmen einer Studie wurde die Körpergröße (in cm) und die Schuhgröße von erwachsenen Männer festgehalten: (a) Zeichnen Sie einen Boxplot, der die Schuhgröße der erwachsenen Männer darstellt. Gehen Sie dafür wie folgt vor: (i) Berechnen Sie die benötigten Quantile. (ii) Berechnen Sie das arithmetische Mittel der Schuhgrößen. Schuhgröße Xi 39 42 44 45 43 46 42 41 Körpergröße Yi 173 178 183 195 185 190 178 180 Tabelle 1. Datensatz Schuhgröße und Körpergröße 45 185 (iii) Geben Sie die minimale und maximale Ausprägung an. (iv) Fassen Sie die Daten in einem Boxplot zusammen. (b) Berechnen Sie die Regressionsgerade, mittels der die Körpergröße der Männer in Abhängigkeit von ihrer Schuhgröße beschrieben wird. Gehen Sie dabei folgendermaßen vor: (i) Geben Sie die Formel für die Regressionsgerade an. (ii) Berechnen Sie das arithmetische Mittel der Körpergrößen. (iii) Berechnen Sie die Varianz der Schuhgröße. (iv) Berechnen Sie die Kovarianz zwischen der Körpergröße und der Schuhgröße. (v) Geben Sie nun die Regressionsgerade in der Form y(x) = m · x + b an mit m, b ∈ R. (vi) Welche Körpergröße lässt sich demnach bei einem erwachsenen Mann vermuten, der eine Schuhgröße von 42 hat.