Herzlich Willkommen zur Vorlesung “Mathematik I für Studierende der Biologie und der Chemie” im Wintersemester 2017/2018 an der Universität zu Köln D. Horstmann: Oktober 2017 Dozent: apl. Prof. Dr. Dirk Horstmann Mathematisches Institut Weyertal 86-90, Raum 1.07 Email:[email protected] Homepage: http:\\www.mi.uni-koeln.de\˜ dhorst Sprechstunden: Mi. 12:30-13:30 Uhr, sowie im Anschluss an die Vorlesung Assistent: Dr. Samuel Littig Mathematisches Institut Weyertal 86-90, Raum 1.22 Email: [email protected] Sprechstunden: Di. 12:30-13:30 Uhr. Homepage zur Vorlesung mit Literatur- und allgemeinen Hinweisen: http:\\www.mi.uni-koeln.de\˜ dhorst\VorlesungWS17-18.htm D. Horstmann: Oktober 2017 1 Angebotene Veranstaltungen im Wintersemester 2017/2018 1. Pflichtveranstaltungen: (a) Vorlesung “Mathematik I für Studierende der Biologie und der Chemie”, 2 stündig jeweils Mittwochs, von 8:00-9:30 Uhr, im Kurt-Alder Hörsaal der Chemie. (b) Übungen zur Vorlesung “Mathematik I für Studierende der Biologie und der Chemie” in mehreren Gruppen, 1 St. Do. und Fr. in mehreren Gruppen. (Beginn ab dem 19.10. 17) 2. Freiwilliges Zusatzangebot: (a) Tutorium zur Vorlesung “Mathematik I für Studierende der Biologie und der Chemie” in mehreren Gruppen, 1 St. Do. und Fr. jeweils im Anschluss an die jeweiligen Übungen.(Beginn ab dem 19.10. 17) (b) Zusatztutorium A zur Vorlesung “Mathematik I fuer Studierende der Biologie und der Chemie” 2 St. Mo, 10 - 11.30 Uhr in Hörsaal XII, (Beginn ab dem 16.10. 17) (c) Zusatztutorium B zur Vorlesung “Mathematik I fuer Studierende der Biologie und der Chemie” 2 St. Do., 16 -17:30 Uhr im Hörsaal des Mathematischen Instituts (Beginn ab dem 12.10. 17) D. Horstmann: Oktober 2017 2 1.1 Graphische Darstellung von Messdaten und unterschiedliche Mittelwerte D. Horstmann: Oktober 2017 3 Graphische Darstellung von Daten und unterschiedliche Mittelwerte Eine Umfrage nach der Körpergröße wurde von 87 weiblichen Personen beantwortet, die folgende Angaben machten: Das untersuchte Merkmal“Körpergröße” ist ein metrisch messbares Merkmal. Das bedeutet, die Messung bzw. die Unterscheidung der Merkmalsausprägungen erfolgt anhand einer metrischen Skala, auf der die aufeinanderfolgenden Skalenpunkte gleichlange Intervalle begrenzen (man denke hierbei einfach an einen Zollstock). Aber welche möglichen graphischen Darstellungen gibt es hierfür? D. Horstmann: Oktober 2017 4 Darstellung der erhobenen Daten mit Hilfe eines Säulendiagramms. Wenn man die Daten mit Hilfe eines Säulendiagramms darstellen will, so trägt man die Ausprägungen des untersuchten Merkmals (in unserem Fall der Körpergröße) gegen die absolute Häufigkeit Hxi der entsprechenden Merkmalsausprägung xi (Anzahl der Individuen, die xi cm groß sind) auf. Hierbei kann die absolute Häufigkeit Hxi auch durch die relative Häufigkeit h xi = Hxi N = absolute Häufigkeit Gesamtzahl der klassifizierten Objekte ersetzt werden. D. Horstmann: Oktober 2017 5 Darstellung der erhobenen Daten mit Hilfe eines Säulendiagramms. D. Horstmann: Oktober 2017 6 Darstellung der erhobenen Daten mittels eines Strecken- bzw. Flächendiagramms. Eine Fläche mit einer Grundseite der Länge L wird in Teilabschnitte der Längen lxi = L · hxi unterteilt, die dann den Merkmalsausprägungen zugewiesen werden. D. Horstmann: Oktober 2017 7 Kuchen- bzw. Kreisdiagramme. Man ordnet der Merkmalsausprägung xi einen Kreissektor mit Öffnungswinkel αxi = 360◦ ·hxi zu. D. Horstmann: Oktober 2017 8 Illustration der Daten mit Hilfe eines Boxplots. Achtung!! Besonders klausurrelevant !! D. Horstmann: Oktober 2017 9 Illustration der Daten mit Hilfe eines Boxplots. 1. Zunächst ordnen wir die Messdaten der Größe nach und nennen sie um, so dass x1 den kleinsten und xN den größten Wert bezeichnet. 2. Nun ermitteln wir zunächst das arithmetische Mittel xM der Messdaten (den im üblichen Sprachgebrauch als Durchschnittswert bezeichneten Wert). Dies macht man wie folgt: Man addiert alle Messwerte xi auf und teilt die so entstehende Summe durch die Anzahl an vorliegenden Messdaten, d.h. xM = 1 (x1 + x2 + .... + xN −1 + xN ) . N Der Mathematiker verwendet hierfür eine andere Schreibweise. Statt der Klammer schreibt man xM = N 1 xi . N i=1 Dies bedeutet also nichts anderes, als dass man alle Werte xi anfangend mit x1 bis xN aufaddiert und dann durch den Wert N teilt. D. Horstmann: Oktober 2017 10 Das Summenzeichen Das Symbol bedeutet, dass alle hinter diesem Symbol vorkommenden “Objekte” aufaddiert werden sollen. Hierbei werden die einzelnen “Objekte” mit Hilfe eines Laufindex durchnummeriert (bzw. falls möglich hierdurch ausgedrückt), der von einem beliebigen (gegebenen) Wert aus beginnen kann und mit einem gegebenen Wert endet. Somit ergibt sich also die Notation: Endwert des Laufindex SummandLaufindex Laufindex=Startwert des Laufindex bzw. N xi = xk + xk+1 + ... + xN −1 + xN i=k D. Horstmann: Oktober 2017 11 Das Summenzeichen Beispiele: 10 i=1 10 1 = 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 10 i = 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 = 55 i=1 N N · (N + 1) 2 i=1 N +1 (N + 1) · (N + 2) i = 1 + 2 + ... + (N − 1) + N + (N + 1) = 2 i=1 N N · (N + 1) − 2 i = 2 + ... + (N − 1) + N = 2 i=2 N xi = x1 + x2 + ... + xN −1 + xN i = 1 + 2 + ... + (N − 1) + N = i=1 D. Horstmann: Oktober 2017 12 Das α-Quantil Als nächstes müssen wir einen weiteren Begriff einführen: das sogenannte α-Quantil (wobei hier die Zahl α einen Wert zwischen Null und 1 annimmt, d.h. 0 < α < 1) der Beobachtungsreihe x1, ..., xN des metrischen Merkmals X (in unserem Fall der Körpergröße). Das α-Quantil wird mit dem Symbol xα notiert und ist der Wert der Beobachtungsreihe, der wie folgt ermittelt wird: Die uns vorliegende Beobachtungsreihe ist nach aufsteigender Größe geordnet. Wir bilden den Ausdruck r = N · α. Wenn r nicht ganzzahlig ist, gehen wir zur nächst grösseren ganzen Zahl r über und setzen xα gleich dem Wert unserer geordneten Beobachtungsreihe, der an der r -ten Stelle in der geordneten Reihe steht. Ist r jedoch ganzzahlig, so setzen wir xα gleich dem arithmetischen Mittel aus dem r -ten und dem (r + 1)-ten Wert unserer geordneten Reihe. D. Horstmann: Oktober 2017 13 Das α-Quantil Beispiel: Es sei 0 < α < 1. x1 = 1, x2 = 1, x3 = 2, x4 = 3, x5 = 15, x6 = 1, x7 = 4, x8 = 26, x9 = 5, x10 = 4, x11 = 1, x12 = 9, x13 = 2, x14 = 4, x15 = 4, x16 = 9, x17 = 2, x18 = 1 1. Schritt: Sortieren der gegebenen Werte der Größe nach aufsteigend. x1 = 1, x2 = 1, x6 = 1, x11 = 1, x18 = 1, x3 = 2, x13 = 2, x17 = 2, x4 = 3, x7 = 4, x15 = 4, x10 = 4, x14 = 4, x9 = 5, x12 = 9, x16 = 9, x5 = 15, x8 = 26 2. Schritt: Umbenennen der Werte. x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 2, x7 = 2, x8 = 2, x9 = 3, x10 = 4, x11 = 4, x12 = 4, x13 = 4, x14 = 5, x15 = 9, x16 = 9, x17 = 15, x18 = 26 D. Horstmann: Oktober 2017 14 Das α-Quantil 3. Schritt: Bestimmung der Stelle, an der sich das α-Quantil befindet, in dem man N · α =: r berechnet. x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 2, x7 = 2, x8 = 2, x9 = 3, x10 = 4, x11 = 4, x12 = 4, x13 = 4, x14 = 5, x15 = 9, x16 = 9, x17 = 15, x18 = 26 In unserem Beispiel ist N = 18. Bislang hatten wir α nicht konkret bestimmt, sondern nur angenommen, dass es ein Wert zwischen 0 und 1 ist. Um nun das Beispiel konkret werden zu lassen, setzen wir für α zwei beliebige konkrete Werte ein. Zunächst setzen wir als Beispiel α = 0.125 = 18 . Damit ist N · α = 18 · 18 1 = = 2.25 8 8 Da 2.25 keine ganze Zahl ist, rundet man diesen Wert zur nächsten ganzen Zahl auf und nimmt als α-Quantil (hier als 0.125-Quantil oder als 12.5%-Quantil) den Wert, der in der aufsteigend geordneten und umbenannten Datenreihe an der 3. Stelle liegt. In unserem Fall ist es somit der Wert x3 = 1. D. Horstmann: Oktober 2017 15 Das α-Quantil x1 = 1, x2 = 1, x3 = 1, x4 = 1, x5 = 1, x6 = 2, x7 = 2, x8 = 2, x9 = 3, x10 = 4, x11 = 4, x12 = 4, x13 = 4, x14 = 5, x15 = 9, x16 = 9, x17 = 15, x18 = 26 Nun setzen wir als konkretes zweites Beispiel α = 0.5 = 12 . Damit ist N · α = 18 · 18 1 = =9 2 2 Hier erhält man nun mit 9 eine ganze Zahl. Anstatt nun den Wert an der neunten Stelle in der aufsteigend geordneten und umbenannten Datenreihe zu nehmen, bildet man das arithmetische Mittel der Werte, die sich an ihrer neunten und zehnten Stelle befinden. Das heißt, man berechnet den Wert x9 + x10 3+4 = = 3.5 2 2 auch wenn sich der Wert 3.5 nicht in der aufsteigend geordneten und umbenannten Datenreihe befindet, so ist dieser Wert das zu der Datenreihe gehörige 0.5-Quantil bzw. das 50%-Quantil, das man auch den Median der gegebenen Datenreihe nennt. D. Horstmann: Oktober 2017 16 Illustration der Daten mit Hilfe eines Boxplots. Für den Boxplot bestimmen wir nun die 3 Quartile der geordneten Beobachtungsreihe. Die Quartile sind die α-Quantile der Beobachtungsreihe für die Werte α = 0.25, α = 0.5, α = 0.75. Die Besonderheit dieser Werte sind die folgenden Eigenschaften, die sie besitzen. Durch die oben beschriebene Berechnung der Quartile ist sichergestellt, dass 25% der Werte der geordneten Beobachtungsreihe kleiner oder gleich dem 25%-Quantil sind. Analog bedeutet das für das 75%-Quantil, dass 75% der Werte der geordneten Beobachtungsreihe kleiner oder gleich sind. Für das 50%-Quantil gilt, dass genau die Hälfte der Werte der geordneten Beobachtungsreihe kleiner und die andere Hälfte größer diesem sind. Das 50%-Quantil ist also ein besonderer “Mittelwert”, der Median genannt wird. Ein Boxplot ist nun ein Kasten bzw. eine “Schachtel”, dessen bzw. deren beide äußeren Grenzen am Ort des 1. und des 3. Quartils liegen. Im Inneren der Schachtel befindet sich eine Linie, die die Lage des Medians angibt. Von den Grenzen der Schachtel ausgehend zeichnet man je einen Stempel. Diese erstrecken sich bis zu den Extremstellen xmin und xmax der geordneten Beobachtungsreihe. Der arithmetische Mittelwert wird mit einem Kreuz dargestellt. D. Horstmann: Oktober 2017 17 In unserem Beispiel mit den Körpergrößen ergeben sich nun folgende Werte: xM = 168.59, x0.25 = 164, x0.75 = 173, x0.50 = 168, xmin = 150, xmax = 181. Die folgende Abbildung zeigt einen solchen Boxplot für unser konkretes Beispiel. Anmerkung 1. In der Regel weichen Median und arithmetischer Mittelwert weit voneinander ab. D. Horstmann: Oktober 2017 18