Biostatistik, Sommer 2017 - Einführung, Quadratische Gleichungen

Werbung
Biostatistik, Sommer 2017
Einführung, Quadratische Gleichungen
Prof. Dr. Achim Klenke
http://www.aklenke.de
1. Vorlesung: 21.04.2017
1/37
Inhalt
1
Organisatorisches
Themen
Literatur
2
Mathematik anwenden
Vorgehen (einfach)
Vorgehen (anspruchsvoll)
3
Zahlen und Rechenregeln
Zahlendarstellung
Potenzen und Wurzeln
Bruchrechnung
4
Quadratische Gleichungen
Theorie
Beispiel: Hardy-Weinberg-Gleichgewicht
2/37
Organisatorisches
Orte, Zeiten, Übungen, Zulassungskriterien, . . .
http://www.aklenke.de
Übungen: elektronisch via ilias, von Timo Schlüter
betreut. Abgabe jeweils bis Freitag.
Tutorien für Fragen, Besprechung der Übungsaufgaben,
etc.
Klausur (Modul 4-1): 24.07.2017, 10-12 Uhr.
3/37
Organisatorisches
Tutoriumstermine und -räume
Es wird vier Tutorien geben. Voraussichtliche Termine:
1
2
3
4
Di 12–14, Raum 04-224 Lukas Metzdorf
Mi 12–14, Raum 05-514 Lukas Metzdorf
Do 14–16, Raum 04-516 Fabio Frommer
Fr 12–14, Raum 04-224 Fabio Frommer
Räume im Institut für Mathematik, Staudingerweg 9
Anmeldung elektronisch.
4/37
Organisatorisches
Themen
Themen
Wiederholung Schulmathematik
Dreisatz, Zahlen, quadratische Gleichungen, Folgen
Exponential- und Logarithmusfunktion
Differential- und Integralrechnung
Beschreibende Statistik
Mittelwert, Median, Quantile, Standardfehler
Lineare Regression
Histogramme etc.
Schließende Statistik
Grundbegriffe der Wahrscheinlichkeitstheorie
Schätzer
Konfidenzintervalle
Tests (t, χ2 , Rangtests)
5/37
Organisatorisches
Literatur
Literaturhinweise (UB Lehrbuchsammlung)
1
2
3
4
5
6
7
Steland, Mathematische Grundlagen der empirischen Forschung,
Springer 2004
Bohl, Mathematik in der Biologie, Springer 2001
H. Vogt, Grundkurs Mathematik für Biologen, 2. Aufl., Teubner,
1994.
A. Riede, Mathematik für Biologen, Vieweg, 1993.
F. Bärlocher, Biostatistik, Thieme, 1999.
W. Timischl, Biostatistik : eine Einführung für Biologen und
Mediziner, 2. Aufl., Springer, 2000.
W. Köhler, G. Schachtel, P. Voleske, Biostatistik : eine Einführung
für Biologen und Agrarwissenschaftler, 4. Aufl., Springer, 2007.
(Auch als E-Book vorhanden)
6/37
Organisatorisches
Quellen
Diese Vorlesung basiert in Teilen auf Material von
Brooks Ferebee (Universität Frankfurt)
Gaby Schneider (Universität Frankfurt)
Anton Wakolbinger (Universität Frankfurt)
Martin Hutzenthaler und Dirk Metzler (LMU München)
Matthias Birkner (Uni Mainz)
7/37
Mathematik anwenden
Vorgehen (einfach)
Was ist Mathematik?
Mathematik ist Sprache und Kalkül.
Drei Schritte:
(1) konkretes Problem formalisieren
(2) formales Problem lösen
(3) formale Lösung im Kontext interpretieren
8/37
Mathematik anwenden
Vorgehen (einfach)
Beispiel: Ansetzen einer chemischen Lösung.
Es sollen 20ml einer 2% igen wässrigen Lösung angesetzt
werden. Im Regal finden Sie:
15% ige Lösung
reines Wasser
9/37
Mathematik anwenden
Vorgehen (einfach)
(1) Formalisieren: Wir definieren Symbole x und y durch
x = Volumen der 15% igen Lösung, die verwendet wird
y = Volumen des Wassers, das verwendet wird
Es ergeben sich zwei Gleichungen
15% · x
= 2%,
20 ml
x + y = 20 ml.
10/37
Mathematik anwenden
15% · x
= 2%,
20 ml
Vorgehen (einfach)
x + y = 20 ml.
(2) Formale Lösung:
15% · x
= 2%
20 ml
=⇒
15% · x = 2% · 20 ml
=⇒
x=
8
2%
· 20 ml = ml ≈ 2.67 ml.
15%
3
Aus der zweiten Gleichung (x + y = 20 ml) folgt
y = 20 ml − x = 52
ml ≈ 17.33 ml.
3
11/37
Mathematik anwenden
Vorgehen (einfach)
(3) Interpretation
Es müssen 2.67 ml der 15% igen Lösung in 17.33 ml Wasser
pipettiert werden.
12/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
Anspruchsvollere Verwendung von
Mathematik
Fünf Schritte:
(1) Modell bilden
(2) Modell formalisieren
(3) formales Modell mathematisch analysieren
(4) formale Ergebnisse interpretieren
(5) Vergleich mit der Natur bzw. Schätzen von
Modellparametern (hier kommt Statistik ins Spiel)
13/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
Beispiel: Verseuchung des Edersees.
Durch einen Chemie-Unfall ist der Edersee mit PCB verseucht.
Konzentration c = 1µg/l.
Wie groß ist die Belastung nach einem Jahr?
14/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(1) Modell bilden.
Konstanter Wasserzufluss.
Jeden Tag durchmischt sich das zugeflossene Wasser
komplett mit dem Inhalt des Stausees und fließt dann ab.
Alternativen:
Das zugeflossene Wasser fließt ab, ohne sich zu
durchmischen.
Das zugeflossene Wasser verdrängt das vorhandene
Wasser.
...
15/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(2) Modell formalisieren.
Volumen des Sees: V = 200 Mio m3 .
Zufluss eines Jahres: Z = 600 Mio m3 .
Konzentration am Tag n = 0, 1, . . . , 365:
Speziell c0 = c = 1µg/l.
cn .
Modellannahme konstanter Zufluss“ liefert
”
Zufluss eines Tages:
Z
ZT =
.
365
Modellannahme täglich perfekte Vermischung“ liefert
”
V
cn+1 = cn ·
.
V + ZT
16/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(3) Formales Modell analysieren.
Wir haben c0 = 1 und
V
200 Mio
= cn ·
V + ZT
200 Mio + 600 Mio/365
1
.
= cn ·
1 + 3/365
cn+1 = cn ·
Also
1
1 + 3/365
2
1
1
c2 = c1 ·
= c0 ·
1 + 3/365
1 + 3/365
2
1
1
1
c3 = c2 ·
= c0 ·
·
1 + 3/365
1 + 3/365
1 + 3/365
3
1
= c0 ·
1 + 3/365
c1 = c0 ·
17/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(3) Formales Modell analysieren.
Also für jedes n:
cn = c0 ·
1
1 + 3/365
n
.
Speziell ist
c365 = c0 ·
1
1 + 3/365
365
= 0.0504 µg/l.
18/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(4) Formales Ergebnis interpretieren.
Nach einem Jahr beträgt die Konzentration PCB im Edersee
noch 0.0504 µg/l (falls das Modell realistisch ist).
19/37
Mathematik anwenden
Vorgehen (anspruchsvoll)
(5) Vergleich mit der Realität.
20/37
Zahlen und Rechenregeln
Zahlendarstellung
Schreibweisen für reelle Zahlen:
√
√
3, 1 − 2, π, e (das lieben Mathematiker)
1.73205 . . ., −0.41421 . . ., 3.14159 . . .
(das versteht der Taschenrechner)
5/3 = 1.6 = 1.66666 . . .
1.67 · 105 = 167 000, denn 105 = 100 000
2.3 · 10−4 = 0.00023, denn und 10−4 = 0.0001
1.67 E5 = 1.67 · 105
2.3 E − 4 = 2.3 · 10−4
(manche ältere Messinstrumente)
21/37
Zahlen und Rechenregeln
Zahlendarstellung
Zehnerpotenzen
101
Zehn
deka
da
10−1
dezi
d
102
Hundert
hekto
h
10−2
zenti
c
103
Tausend
kilo
k
10−3
milli
m
6
−6
10
Million
mega
M
10
mikro
µ
109
Milliarde
giga
G
10−9
nano
n
1012
Billion
tera
T
10−12
pico
p
1015
Billiarde
peta
P
10−15
femto
f
1018
Trillion
exa
E
10−18
atto
a
22/37
Zahlen und Rechenregeln
Zahlendarstellung
Zehnerpotenzen
101
Zehn
deka
da
10−1
dezi
d
102
Hundert
hekto
h
10−2
zenti
c
103
Tausend
kilo
k
10−3
milli
m
6
−6
10
Million
mega
M
10
mikro
µ
109
Milliarde
giga
G
10−9
nano
n
1012
Billion
tera
T
10−12
pico
p
1015
Billiarde
peta
P
10−15
femto
f
1018
Trillion
exa
E
10−18
atto
a
Gelbes Licht, Wellenlänge
440nm = 440 · 10−9 m = 4.4 · 10−7 m.
23/37
Zahlen und Rechenregeln
Zahlendarstellung
Zehnerpotenzen
101
Zehn
deka
da
10−1
dezi
d
102
Hundert
hekto
h
10−2
zenti
c
103
Tausend
kilo
k
10−3
milli
m
6
−6
10
Million
mega
M
10
mikro
µ
109
Milliarde
giga
G
10−9
nano
n
1012
Billion
tera
T
10−12
pico
p
1015
Billiarde
peta
P
10−15
femto
f
1018
Trillion
exa
E
10−18
atto
a
Stromerzeugung in Deutschland (2015):
646 TWh = 646 · 1012 Wh = 646 · 109 kWh.
1Wh = 3600 J, also wurden erzeugt:
646 · 1012 · 3600 J = 2.32 · 1018 J = 2.32 EJ.
24/37
Zahlen und Rechenregeln
Potenzen und Wurzeln
Für n = 1, 2, 3, . . . und a ∈ R (reelle Zahl)
an = a · a · a · · · a
(n Faktoren).
Regeln
am · an = am+n .
(am )n = amn .
an · bn = (ab)n .
Wir setzen
a0 = 1
und
1
falls a 6= 0.
am
durch
a−m =
Wir definieren
√
n
a = a1/n
(a1/n )n = a
falls a ≥ 0.
Rechenregeln gelten dann auch für ax mit x ∈ R.
25/37
Zahlen und Rechenregeln
Bruchrechnung
Bruchrechnung
a, b, c, d reelle Zahlen, b, d 6= 0. Rechenregeln
a
ac
·c =
b
b
a c
ac
=
bd
bd
a
b
d
a
b
c
d
=
a
bd
=
ad
,
bc
falls c 6= 0
a c
ad + bc
+ =
.
b d
bd
Brüche Kürzen erfordert Geschick.
26/37
Quadratische Gleichungen
Theorie
Seien a, b, c reelle Zahlen, a 6= 0. Gesucht: Lösungen von
0 = ax 2 + bx + c.
Definiere Diskriminante ∆ = b2 − 4ac. Quadratische
Ergänzung liefert die Lösungen
√
√
−b − ∆
−b + ∆
x1 =
,
x2 =
.
2a
2a
Satz
Es tritt stets genau einer der drei Fälle auf:
(i) ∆ = 0: x1 und x2 sind reell und x1 = x2 .
(ii) ∆ > 0:
x1 und x2 sind reell und x1 6= x2 .
(iii) ∆ < 0:
Dann sind x1 und x2 keine reellen Zahlen.
27/37
Quadratische Gleichungen
Theorie
Beispiel 1
0 = 2x 2 − 4x + 2.
a = 2,
b = −4,
c = 2.
∆ = b2 − 4ac = (−4)2 − 4 · 2 · 2 = 16 − 16 = 0.
Nach dem Satz: Einzige Lösung ist
√
−b − ∆
−(−4) − 0
x=
=
= 1.
2a
2·2
28/37
Quadratische Gleichungen
Theorie
Beispiel 1
f(x)
5
10
f (x) = 2x 2 − 4x + 2.
−5
0
●
−4
−2
0
2
4
29/37
Quadratische Gleichungen
Theorie
Beispiel 2
x 2 − 3x + 2 = 0.
a = 1,
b = −3,
c = 2.
∆ = b2 − 4ac = (−3)2 − 4 · 1 · 2 = 9 − 8 = 1 > 0.
Nach dem Satz: Die zwei Lösungen sind
√
−b − ∆
−(−3) − 1
=
=1
x1 =
2a
2
√
−b + ∆
−(−3) + 1
x2 =
=
= 2.
2a
2
30/37
Quadratische Gleichungen
Theorie
Beispiel 2
0.5
f(x)
1.5
2.5
f (x) = x 2 − 3x + 2.
●
−0.5
●
0.0 0.5 1.0 1.5 2.0 2.5 3.0
31/37
Quadratische Gleichungen
Theorie
Beispiel 3
x 2 + 2x + 2 = 0.
a = 1,
b = 2,
c = 2.
∆ = b2 − 4ac = (2)2 − 4 · 1 · 2 = 4 − 8 = −4 < 0.
Nach dem Satz: Es gibt keine reellen Lösungen.
32/37
Quadratische Gleichungen
Theorie
Beispiel 3
−5
5
f(x)
15
25
f (x) = x 2 + 2x + 2.
−6
−4
−2
0
2
4
33/37
Quadratische Gleichungen
Beispiel: Hardy-Weinberg-Gleichgewicht
Idealisierte Population: sehr groß, diploid, hermaphroditisch.
Annahme:
Neutralität“(keine Selektion)
”
rein zufällige Paarungen
Mendel’sche Segregation
zwei Allele A und a
Genotypenhäufigkeiten heute:
Genotyp
Anteil
AA
xAA
Aa
xAa
aa
xaa
(xAA + xAa + xaa = 1)
Allelhäufigkeiten heute
Allel
Anteil
A
pA = xAA +
a
1
x
2 Aa
pa =
1
x
2 Aa
+ xaa
Genotypenhäufigkeiten in der nächsten Generation?
34/37
Quadratische Gleichungen
Heute:
Genotyp
AA
Aa
aa
Anteil
xAA
xAa
xaa
Beispiel: Hardy-Weinberg-Gleichgewicht
Allel
A
a
Anteil
pA = xAA + 12 xAa
pa = 21 xAa + xaa
Nächste Generation:
Genotyp AA Aa
0
0
Anteil
xAA
xAa
aa
0
xaa
0
xAA
= pA2
0
xAa
= 2 pA pa
0
xaa
= pa2
Allel
Anteil
A
pA0
pA0
pa0
a
pa0
= pA
= pa .
35/37
Quadratische Gleichungen
Beispiel: Hardy-Weinberg-Gleichgewicht
Hardy-Weinberg-Gleichgewicht
Allelhäufigkeiten sind konstant über die Generationen.
Unabhängig von den ursprünglichen Genotyphäufigkeiten
stellt sich für die Genotypen AA, Aa, aa nach einer
Generation das Verhältnis
p2 : 2p(1 − p) : (1 − p)2
ein und ändert sich dann nicht mehr.
36/37
Quadratische Gleichungen
Beispiel: Hardy-Weinberg-Gleichgewicht
Hardy-Weinberg Gleichgewicht:
Heterozygoten
Kann man pA berechnen, wenn man nur den Anteil der
Heterozygoten (xAa ) kennt?
xAa = 2pA (1 − pA ) = 2pA − 2pA2 ,
also
1
pA2 − pA + xAa = 0.
2
Auflösen nach pA (quadratische Ergänzung) gibt
√
1 ± 1 − 2xAa
.
pA =
2
(Zusatzinformation erforderlich, um die Lösung auswählen, z.B.
welches der beiden Allele häufiger ist.)
37/37
Herunterladen