Grundlagen der Biometrie in Agrarwissenschaften / Ernährungswissenschaften Dr. Antje Kiesel Institut für Angewandte Mathematik WS 2011/2012 Grundlagen der Biometrie, WS 2011/12 I Vorlesung: Dienstag 8.15 - 9.45, Hörsaal I, Donnerstag 9:00-9:45, Hörsaal X I Übungsgruppen: Einteilung nach der Vorlesung heute I Vorlesungshomepage: http://www.math.uni-bonn.de/people/kiesel/lehre.html I Die Teilnahme an den Übungsgruppen und die Bearbeitung der Übungsaufgaben sind freiwillig, aber DRINGEND zu empfehlen !!! Übung Grundlagen der Biometrie, WS 2011/12 I Gruppe 1 und 2: Montag 10-11 und 11-12 0.008 Leonardo Moradi I Gruppe 3 und 4: Montag 14-15 und 15-16 0.003 Leonardo Moradi I Gruppe 5 und 6: Montag 10-11 und 11-12 0.007 Jan-Christoph Bredemeier I Gruppe 7 und 8: Mittwoch 16-17 und 17-18 0.008 Jan-Christoph Bredemeier I Gruppe 9 und 10: Freitag 10-11 und 11-12 1.008 Till Massing Alle Übungen finden in der Endenicher Allee 60 statt. Vorlesung Grundlagen der Biometrie, WS 2011/12 I Die Vorlesungsfolien sind ursprünglich von Prof. Dr. Andreas Eberle erstellt worden. I Alle Vorlesungsfolien werden vor oder kurz nach der Vorlesung im Internet bereitgestellt. Auch die aktuellen Übungszettel finden Sie im Internet. I Das erste Übungsblatt gibt es schon heute. Drei Stufen der Analyse von Beobachtungsdaten I I I Beschreibende Statistik Modellierung und Wahrscheinlichkeitsrechnung Schließende Statistik I. Beschreibende Statistik I Aufbereitung der Daten I Graphische Darstellung (Stabdiagramm, Histogramm, Boxplot,...) I Berechnung von Kennzahlen (Quantile, Mittelwert, Standardabweichung,...) II. Modellierung und Wahrscheinlichkeitsrechnung I Erstellen von mathematischen Modellen für das betrachtete Zufallsexperiment. I In der Regel kennen wir das richtige Modell bestenfalls bis auf einige unbekannte Parameter. Bei einer Meinungsumfrage könnten wir z.B. annehmen, daß die Antworten verschiedener Personen unabhängig sind, und jeweils mit Wahrscheinlichkeit p ein bestimmter Kandidat bevorzugt wird. Den Wert von p kennen wir aber zunächst nicht. I Berechnung von Wahrscheinlichkeiten für die beobachteten Daten unter Annahme der (verschiedenen) Modelle. III. Schließende Statistik I Schätzung der unbekannten Parameter aus den Beobachtungsdaten (mit Aussagen über den Schätzfehler). Rückschluss auf das richtige zugrundeliegende mathematische Modell. I Überprüfen der Plausibilität verschiedener Hypothesen zum zugrundeliegenden Modell (z.B. Die Erfolgswahrscheinlichkeit von ” Kandidat A ist größer als 50 %“.) I Rückschluss von der Stichprobe auf die Grundgesamtheit. Das Hauptthema: die schließende Statistik Die folgende Aufgabe stammt aus der Biometrieklausur im WS 08/09: Das Alter der Studenten der Uni Bonn sei eine normalverteilte Größe. Behauptet wird: das Durchschnittsalter beträgt 27 Jahre. Um die Behauptung zu überprüfen, werden zufällig 7 Studenten mit folgenden Alterswerten ermittelt: Student Alter 1 26 2 35 3 23 4 30 5 21 6 27 7 20 I 1. Stellen Sie ein geeignetes statistisches Modell auf, und erörtern Sie die Voraussetzungen. I 2. Formulieren Sie die Nullhypothese und die Alternative. I 3. Welche Teststatistik verwenden Sie? Was ist die Verteilung der Teststatistik unter der Nullhypothese? I 4. Berechnen Sie den Wert der Teststatistik aus den Daten. I 5. Treffen Sie eine Testentscheidung zum Signifikanzniveau α =1%. Lösung I 1. Stellen Sie ein geeignetes statistisches Modell auf, und erörtern Sie die Voraussetzungen. I Lösung: Es sei Xi das Alter des i-ten Studenten. Wir nehmen an, dass die Xi unabhängig und identisch normalverteilt mit unbekanntem Erwartungswert µ und ebenfalls unbekannter Streuung σ sind. Vorauszusetzen ist also, dass die Xi tatsächlich normalverteilt sind. I 2. Formulieren Sie die Nullhypothese und die Alternative. I Lösung: H0 : µ = µ0 = 27, H1 : µ 6= µ0 I Erläuterung: Die Nullhypothese H0 ist die Hypothese, die wir an Hand der uns zur Verfügung stehenden Daten überprüfen wollen. I Wie können wir aus den Daten überprüfen, ob die Nullhypothese stimmt? Damit befasst sich die schließende Statistik ! I 3. Welche Teststatistik verwenden Sie? Was ist die Verteilung der Teststatistik unter der Nullhypothese? I Lösung: Wir benutzen hier die sogenannte t-Statistik: √ n X n − µ0 T = q n 1 2 n−1 ∑i =1 (Xi − X n ) Dabei ist X n = n1 ∑ni=1 Xi der empirische Mittelwert, den wir aus den Daten berechnen können. I Unter der Nullhypothese ( das Durchschnittsalter ist 27“) ist ” die Verteilung von T die t-Verteilung. I 4. Berechnen Sie den Wert der Teststatistik aus den Daten. I Lösung: Aus den Daten erhalten wir √ n X n − µ0 = −0,5. T = q n 1 2 X ) ( X − ∑ n i i = 1 n −1 I 5. Treffen Sie eine Testentscheidung zum Signifikanzniveau α =1%. I Lösung: H0 ist genau dann zu verwerfen, wenn |T | > tn−1;1−α/2 = t6;0,995 . I Wegen |T | = 0,5 und t6;0,995 = 3,707 > |T | kann H0 nicht verworfen werden. Machen Sie sich keine Sorgen, falls Sie nichts verstanden haben: dies ist eben das HAUPTTHEMA der Vorlesung, das wir erst im Laufe der Vorlesung behandeln werden!