Grundlagen der Biometrie in Agrarwissenschaften

Werbung
Grundlagen der Biometrie in Agrarwissenschaften
/ Ernährungswissenschaften
Dr. Antje Kiesel
Institut für Angewandte Mathematik
WS 2011/2012
Grundlagen der Biometrie, WS 2011/12
I Vorlesung: Dienstag 8.15 - 9.45, Hörsaal I, Donnerstag 9:00-9:45,
Hörsaal X
I Übungsgruppen: Einteilung nach der Vorlesung heute
I Vorlesungshomepage:
http://www.math.uni-bonn.de/people/kiesel/lehre.html
I Die Teilnahme an den Übungsgruppen und die Bearbeitung
der Übungsaufgaben sind freiwillig, aber DRINGEND zu
empfehlen !!!
Übung Grundlagen der Biometrie, WS 2011/12
I Gruppe 1 und 2: Montag 10-11 und 11-12 0.008 Leonardo Moradi
I Gruppe 3 und 4: Montag 14-15 und 15-16 0.003 Leonardo Moradi
I Gruppe 5 und 6: Montag 10-11 und 11-12 0.007 Jan-Christoph
Bredemeier
I Gruppe 7 und 8: Mittwoch 16-17 und 17-18 0.008 Jan-Christoph
Bredemeier
I Gruppe 9 und 10: Freitag 10-11 und 11-12 1.008 Till Massing
Alle Übungen finden in der Endenicher Allee 60 statt.
Vorlesung Grundlagen der Biometrie, WS 2011/12
I Die Vorlesungsfolien sind ursprünglich von Prof. Dr. Andreas Eberle
erstellt worden.
I Alle Vorlesungsfolien werden vor oder kurz nach der Vorlesung im
Internet bereitgestellt. Auch die aktuellen Übungszettel finden Sie
im Internet.
I Das erste Übungsblatt gibt es schon heute.
Drei Stufen der Analyse von Beobachtungsdaten
I
I
I
Beschreibende Statistik
Modellierung und Wahrscheinlichkeitsrechnung
Schließende Statistik
I. Beschreibende Statistik
I
Aufbereitung der Daten
I
Graphische Darstellung (Stabdiagramm, Histogramm,
Boxplot,...)
I
Berechnung von Kennzahlen (Quantile, Mittelwert,
Standardabweichung,...)
II. Modellierung und Wahrscheinlichkeitsrechnung
I Erstellen von mathematischen Modellen für das betrachtete
Zufallsexperiment.
I In der Regel kennen wir das richtige Modell bestenfalls bis auf einige
unbekannte Parameter. Bei einer Meinungsumfrage könnten wir z.B.
annehmen, daß die Antworten verschiedener Personen unabhängig
sind, und jeweils mit Wahrscheinlichkeit p ein bestimmter Kandidat
bevorzugt wird. Den Wert von p kennen wir aber zunächst nicht.
I Berechnung von Wahrscheinlichkeiten für die beobachteten Daten
unter Annahme der (verschiedenen) Modelle.
III. Schließende Statistik
I Schätzung der unbekannten Parameter aus den Beobachtungsdaten
(mit Aussagen über den Schätzfehler). Rückschluss auf das richtige
zugrundeliegende mathematische Modell.
I Überprüfen der Plausibilität verschiedener Hypothesen zum
zugrundeliegenden Modell (z.B. Die Erfolgswahrscheinlichkeit von
”
Kandidat A ist größer als 50 %“.)
I Rückschluss von der Stichprobe auf die Grundgesamtheit.
Das Hauptthema: die schließende Statistik
Die folgende Aufgabe stammt aus der Biometrieklausur im WS 08/09:
Das Alter der Studenten der Uni Bonn sei eine normalverteilte Größe.
Behauptet wird: das Durchschnittsalter beträgt 27 Jahre. Um die
Behauptung zu überprüfen, werden zufällig 7 Studenten mit folgenden
Alterswerten ermittelt:
Student
Alter
1
26
2
35
3
23
4
30
5
21
6
27
7
20
I 1. Stellen Sie ein geeignetes statistisches Modell auf, und erörtern
Sie die Voraussetzungen.
I 2. Formulieren Sie die Nullhypothese und die Alternative.
I 3. Welche Teststatistik verwenden Sie? Was ist die Verteilung der
Teststatistik unter der Nullhypothese?
I 4. Berechnen Sie den Wert der Teststatistik aus den Daten.
I 5. Treffen Sie eine Testentscheidung zum Signifikanzniveau α =1%.
Lösung
I
1. Stellen Sie ein geeignetes statistisches Modell auf, und
erörtern Sie die Voraussetzungen.
I
Lösung: Es sei Xi das Alter des i-ten Studenten. Wir nehmen
an, dass die Xi unabhängig und identisch normalverteilt mit
unbekanntem Erwartungswert µ und ebenfalls unbekannter
Streuung σ sind. Vorauszusetzen ist also, dass die Xi
tatsächlich normalverteilt sind.
I
2. Formulieren Sie die Nullhypothese und die Alternative.
I
Lösung: H0 : µ = µ0 = 27, H1 : µ 6= µ0
I
Erläuterung: Die Nullhypothese H0 ist die Hypothese, die wir
an Hand der uns zur Verfügung stehenden Daten überprüfen
wollen.
I
Wie können wir aus den Daten überprüfen, ob die
Nullhypothese stimmt? Damit befasst sich die schließende
Statistik !
I
3. Welche Teststatistik verwenden Sie? Was ist die Verteilung
der Teststatistik unter der Nullhypothese?
I
Lösung: Wir benutzen hier die sogenannte t-Statistik:
√
n X n − µ0
T = q
n
1
2
n−1 ∑i =1 (Xi − X n )
Dabei ist X n = n1 ∑ni=1 Xi der empirische Mittelwert, den wir
aus den Daten berechnen können.
I
Unter der Nullhypothese ( das Durchschnittsalter ist 27“) ist
”
die Verteilung von T die t-Verteilung.
I
4. Berechnen Sie den Wert der Teststatistik aus den Daten.
I
Lösung: Aus den Daten erhalten wir
√
n X n − µ0
= −0,5.
T = q
n
1
2
X
)
(
X
−
∑
n
i
i
=
1
n −1
I
5. Treffen Sie eine Testentscheidung zum Signifikanzniveau
α =1%.
I
Lösung: H0 ist genau dann zu verwerfen, wenn
|T | > tn−1;1−α/2 = t6;0,995 .
I
Wegen |T | = 0,5 und t6;0,995 = 3,707 > |T | kann H0 nicht
verworfen werden.
Machen Sie sich keine Sorgen, falls
Sie nichts verstanden haben: dies ist
eben das
HAUPTTHEMA
der Vorlesung, das wir erst im Laufe
der Vorlesung behandeln werden!
Herunterladen