„Kochrezept“ für das Erstellen eines Boxplots anhand eines konkreten Beispiels Die nachfolgenden fiktiven Messdaten sollen mit Hilfe eines Boxplots dargestellt werden. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 1 1 3 3 15 1 4 26 5 4 2 9 3 4 4 9 3 3 1. Zunächst ordnen wir die Messdaten der Größe nach aufsteigend an: x1 x2 x6 x11 x3 x4 x13 x17 x18 x7 x10 x14 x15 x9 x12 x16 x5 x8 1 1 1 2 3 3 3 3 3 4 4 4 4 5 9 9 15 26 1 Ergänzendes Material zur Vorlesung „Mathematik I für Studierende der Biologie und der Chemie“ im Wintersemester 2014/2015 an der Universität zu Köln Dozent: apl. Prof. Dr. Dirk Horstmann 2. Umbenennung/Neunummerierung der Messdaten: Nun nennen wir die Messdaten wie folgt um: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 1 1 1 2 3 3 3 3 3 4 4 4 4 5 9 9 15 26 Hierdurch wird sichergestellt, dass x1 den kleinsten und x18 den größten Wert bezeichnet. Des Weiteren gilt nun, dass Die Ordnung der Messreihe spiegelt sich somit nun auch im Laufindex wider. 3. Ermittlung von xmin und xmax. Wir sehen, dass xmin = x1 = 1 und xmax = x18 =26 ist. 2 Ergänzendes Material zur Vorlesung „Mathematik I für Studierende der Biologie und der Chemie“ im Wintersemester 2014/2015 an der Universität zu Köln Dozent: apl. Prof. Dr. Dirk Horstmann 4. Berechnung des arithmetischen Mittel der Messdaten: Das arithmetische Mittel xM der Messreihe ist gegeben durch die Formel: Wir erhalten somit den Wert: 5. Berechnung des 25%-Quantils: Zunächst einmal zur Wiederholung die allgemeine Vorgehensweise zur Bestimmung eines α-Quantils: Die Formel zur Berechnung der Position, an der sich das α-Quantil einer Messreihe befindet, besagt, dass man die Anzahl der Messdaten mit α multipliziert und nun überprüft, ob der sich so ermittelte Wert r ganzzahlig ist oder nicht. Ist r nicht ganzahlig, so geht man zur nächstgrößeren ganzen Zahl über und nimmt die Zahl als α-Quantil, die sich an dieser Stelle in der geordneten Messdatenreihe befindet. Ist r jedoch ganzzahlig, so bildet man aus den Werten der geordneten Messdatenreihe, die sich an der r-ten und der (r+1)-ten Position der Reihe befindet, das arithmetische Mittel und setzt das gesuchte α-Quantil gleich diesem Mittelwert der beiden Werte aus der Messdatenreihe. Zur Berechnung des 25%-Quantils müssen wir nun zunächst r=18*1/4=4,5 bestimmen. r ist also nicht ganzzahlig, so dass wir zur nächstgrößeren ganzen Zahl übergehen. Dies ist in unserem Fall die Zahl 5. Das 25%-Quantils ist folglich der 5. Wert in der geordneten Messdatenreihe. Dies ist in unserem Beispiel der Wert x5= 3. 6. Berechnung des 50%-Quantils (also Berechnung des Medians): Zur Berechnung des Medians müssen wir zunächst r =18*1/2=9 bestimmen. r ist nun ganzzahlig. Wir müssen also jetzt das arithmetische Mittel der beiden Werte an der 9. und an der 10. Stelle der Messdatenreihe bilden. Dies sind die Werte x9 = 3 und x10 = 4. So erhalten wir als 50%-Quantil den Wert (3+4)/2=3.5. Dies ist der Median der Messreihe auch wenn dieser Wert in der ursprünglichen Messdatenreihe gar nicht vorgekommen ist. 3 Ergänzendes Material zur Vorlesung „Mathematik I für Studierende der Biologie und der Chemie“ im Wintersemester 2014/2015 an der Universität zu Köln Dozent: apl. Prof. Dr. Dirk Horstmann 7. Berechnung des 75%-Quantils: Zur Berechnung des 75%-Quantils müssen wir somit zunächst r =18*3/4=13.5 bestimmen. r ist nicht ganzzahlig, so dass wir auch hier zur nächstgrößeren ganzen Zahl übergehen. Dies ist im jetzigen Fall die Zahl 14. Das 75%-Quantils ist daher der 14. Wert in der geordneten Messdatenreihe. Dies ist in unserem Beispiel der Wert x14= 5. 8. Zeichnung des Boxplots über einer Werteskala: 4 Ergänzendes Material zur Vorlesung „Mathematik I für Studierende der Biologie und der Chemie“ im Wintersemester 2014/2015 an der Universität zu Köln Dozent: apl. Prof. Dr. Dirk Horstmann