1 Beschreibende und explorative Statistik Die beschreibende oder deskriptive Statistik und die explorative Statistik betrachten eine vorliegende Menge von Objekten, von denen fur jedes Objekt ein Merkmal oder mehrere Merkmale beobachtet oder gemessen wurden. Um Ordnung in eine solche Datenmenge zu bringen, kann man z.B. auszahlen, wie oft die einzelnen Merkmalsauspragungen vorkommen oder wie oft diese in ein bestimmtes Intervall fallen. Die graphische Darstellung der Ergebnisse fuhrt zur sog. empirischen Haugkeitsverteilung der gegebenen Datenmenge. Diese Verteilung gibt das Datenmaterial in ubersichtlich aufbereiteter Form wieder. Die Gewinnung einer solchen Verteilung stellt eine Hauptaufgabe der beschreibenden Statistik dar. Wahrend eine Haugkeitsverteilung die wesentliche Information, die in einer Datenmenge steckt, nahezu unverandert enthalt, geben statistische Mazahlen, wie z.B. Mittelwert und Streuung stellvertretend fur die ganze Menge von Einzelwerten jeweils eine einzige Zahl als Parameter an. Neben den empirischen Haugkeitsverteilungen und entsprechenden Mazahlen werden spater die theoretischen Verteilungen und analoge Mazahlen vorgestellt. Sie dienen zur Angabe der Wahrscheinlichkeit fur das Eintreen bestimmter zufalliger Ereignisse. 1.1 Beschreibung eindimensionaler Stichproben Wird fur jedes Objekt einer Menge lediglich ein Merkmal beobachtet oder gemessen, so ist die entsprechende Haugkeitsverteilung dieses Merkmals eine eindimensionale Haugkeitsverteilung. Bestimmt man z.B. bei einer Anzahl von Autos die Kohlenmonoxidkonzentration der Abgase, so ist die zugehorige Verteilung des Merkmals \Kohlenmonoxid\ eindimensional. Eine zusatzliche Messung der Stickoxidkonzentration fuhrt zu zwei Mewerten pro Auto. Dieses Zahlenmaterial kann in einer zweidimensionalen Haugkeitsverteilung zusammengefat werden (Abschnitt 1.3). 1.1.1 Stichprobe und Grundgesamtheit Das Ergebnis einer statistischen Erhebung liegt in der Regel zunachst in Form einer Urliste vor. Darunter versteht man ein Protokoll, auf dem die beobachteten Werte in der Reihenfolge stehen, wie sie beobachtet und notiert wurden. Wird z.B. eine gewisse Anzahl von Studenten der Technischen Universitat MunchenWeihenstephan zufallig ausgewahlt und ihre Groe bestimmt, so erhebt man eine Stichprobe uber die Korpergroe der Studenten. Die notierten Mewerte in der Urliste, also die Groe der ausgewahlten Studenten, sind die Stichprobenwerte. Eine zufallige Teilmenge aus einer Menge von beliebigen Objekten (Personen, Tiere, Gegenstande usw.), die sich durch ein oder mehrere gemeinsame Merkmale auszeichnen, heit eine Stichprobe. Umfat diese Teilmenge genau n Objekte, so spricht man von einer Stichprobe vom Umfang n. Wenn zukunftig von Stichproben die Rede ist, dann ist damit meistens die Stichprobe der Merkmalswerte und weniger die der Objekte 6 1 Beschreibende und explorative Statistik gemeint. Die Grundgesamtheit ist die Menge aller moglichen oder denkbaren Objekte, die sich durch die gleiche Eigentumlichkeit auszeichnen, z.B. die Grundgesamtheit aller Weihenstephaner Studenten. Aus okonomischen, zeitlichen oder praktischen Grunden arbeitet man fast ausschlielich mit Stichprobenerhebungen und nur in Ausnahmefallen mit Vollerhebungen, d.h. mit einer Erhebung der ganzen Grundgesamtheit. Es ist z.B. praktisch ausgeschlossen, alle Weihenstephaner Studenten zu vermessen, da immer ein Teil davon im Praktikum ist. Eine annahernd vollstandige Vollerhebung liegt beispielsweise bei Volkszahlungen vor, die mit einem erheblichen Finanz- und Arbeitsaufwand durchgefuhrt werden. Ziel einer Stichprobenerhebung ist also, aufgrund einer Stichprobe realistische Aussagen uber die Grundgesamtheit zu machen, also beispielsweise die unbekannte tatsachliche Korpergroenverteilung der Studenten durch die Verteilung der Stichprobenwerte abzuschatzen. Eine gegebene Datenmenge soll im folgenden als eine Stichprobe aus einer Grundgesamtheit angesehen werden. Die Aufgabe der beschreibenden Statistik ist, die in einer Urliste gegebene Menge von Daten zu ordnen, ubersichtlich darzustellen und mit statistischen Mazahlen zu kennzeichnen, um einen U berblick uber die Verteilung der Merkmalswerte zu bekommen. Beispiele: 1. Tab. 1.1 zeigt die Urliste einer Stichprobe von 100 Jungsauen, bei denen das Merkmal \Anzahl der Ferkel pro Wurf\ betrachtet wurde. Es liegt eine eindimensionale Stichprobe vor, denn fur jedes Element, also fur jede Sau, wurde ein Merkmalswert gemessen. 11 9 9 13 9 12 16 10 7 12 13 14 12 10 13 10 11 7 9 8 7 11 6 8 14 12 9 9 10 12 15 10 7 10 9 11 10 11 9 11 6 10 8 12 11 9 11 10 10 10 11 8 12 11 9 11 9 9 11 7 8 14 9 9 11 9 12 11 8 15 7 7 10 8 10 10 10 10 13 9 4 12 7 6 11 12 13 14 9 10 12 10 9 10 7 8 11 8 10 8 Tabelle 1.1: Urliste uber die Anzahl der Ferkel pro Wurf bei einer Stichprobe von n = 100 Jungsauen 1.1 Beschreibung eindimensionaler Stichproben 7 2. Eine zweidimensionale Stichprobe vom Umfang n = 20 erhalt man beispielsweise, wenn man bei 20 zufallig ausgewahlten Rindern jeweils zwei Merkmale mit. In Tabelle 1.2 ist der Brustumfang und die Kreuzhohe von 20 Rindern festgehalten. Tier Brustum- KreuzNr: fang [cm] hohe [cm] 1 180 121 2 168 116 3 170 114 4 167 116 5 177 119 6 164 115 7 180 121 8 169 120 9 164 112 10 180 117 Tier Brustum- KreuzNr: fang [cm] hohe [cm] 11 170 123 12 170 118 13 175 115 14 172 117 15 175 119 16 172 123 17 171 114 18 167 117 19 168 115 20 155 115 Tabelle 1.2: Brustumfang und Kreuzhohe bei 20 Rindern 3. Allgemein erhalt man eine m-dimensionale Stichprobe vom Umfang n, wenn an jedem der n Elemente jeweils m Merkmale (x1 ; x2 ; : : : ; xm ) gemessen werden. Tab. 1.3 enthalt eine funfdimensionale Stichprobe vom Umfang n = 10. 28 Tage- Alter bei tagliche Stallend- SchlachtNr: Gewicht Mastende Zunahme gewicht gewicht [kg] [Tage] [g] [kg] [kg] 1 8:3 179 745 98 76:5 2 9:5 164 814 103 78:5 3 9:2 166 778 102 76:0 4 10:7 166 761 102 78:5 5 9:6 175 761 101 78:5 6 8:4 186 700 98 75:0 7 9:1 178 745 98 76:5 8 10:2 183 707 100 76:0 9 7:5 184 778 103 80:0 10 7:3 197 700 97 70:0 Tabelle 1.3: Schweinedaten uber funf verschiedene Merkmale der Mastleistung 8 1.1.2 Einteilung der Merkmale 1 Beschreibende und explorative Statistik Bei Merkmalen einer Stichprobe wird zunachst zwischen quantitativen, d.h. zahlenmaig erfabaren und qualitativen, d.h. artmaig erfabaren Merkmalen unterschieden. Beispiele fur qualitative Merkmale sind Geschlecht, Farbe, Schadens- oder Handelsklasse, Sorte, Beruf usw. Eine genauere Einteilung der qualitativen Merkmale unterscheidet ordinal und nominal erfabare Merkmale. Bei einem ordinalen Merkmal kann man die einzelnen Auspragungen nicht mehr messen im ublichen Sinne, wohl aber noch in eine Reihenfolge bringen oder ordnen. Ein solches Stichprobenelement besitzt jeweils einen Rang 1, Rang 2, Rang 3 usw., das heit aber nicht, da mittels dieser Rangzahlen ein echtes quantitatives metrisches Merkmal vorliegt. Mit einer solchen Rangskala kann man zwar eine Rangordnung konstatieren, aber nicht sagen, der Abstand zwischen Rang 1 und Rang 3 ist zweimal so gro wie zwischen Rang 1 und Rang 2. Bei einem nominalen Merkmal kann man nur noch die einzelnen Auspragungen des Merkmals feststellen und willkurlich nebeneinander aufreihen, ohne eine Abstufung durchzufuhren oder eine Angabe uber Abstande zu machen. Beispiele fur ordinale Merkmale sind Schadens- oder Handelsklassen, Schulnoten, Angaben uber die Befallshaugkeit einer bestimmten Krankheit bei Panzen oder die Stadien eines Tumors. Beispiele fur nominale Merkmale sind Konfession, Farbe, Geschlecht, Sorte oder Beruf. Quantitative oder metrische Merkmale konnen durch einen Me- oder Zahlvorgang erfat werden. Beispiele dafur sind Korpergroe, Gewicht, Ferkel- oder Kinderzahl, Einkommen. Quantitative Merkmale unterteilt man daruberhinaus in diskrete und stetige Merkmale. Stetige Merkmale konnen jeden beliebigen Wert innerhalb eines gewissen Intervalls annehmen, z.B. die Korpergroe oder das Korpergewicht. Diskrete Merkmale haben nur ganz bestimmte Auspragungen, die man abzahlen kann, wie z.B. Ferkel- und Kinderzahl oder die Anzahl der Blatter bei Panzen. Die Merkmalsauspragungen diskreter Merkmale sind also ganze, meist nichtnegative Zahlen. Eine zweite Art der Unterteilung der quantitativen Merkmale dierenziert, ob Merkmale mit einer Intervall- oder mit einer Verhaltnisskala erfat werden. Bei einer Intervallskala ist charakteristisch, da die Erfassung des Abstands, d.h. Bildung der Dierenz zwischen zwei Merkmalsauspragungen, moglich ist. Beispiel dafur ist die Temperaturmessung in Grad Celsius oder Fahrenheit. Bei einer Verhaltnisskala hat man zusatzlich einen wahren, absoluten Nullpunkt, auf den die einzelnen Merkmalsauspragungen bezogen werden konnen. Beispiele sind die Temperaturmessung in Grad Kelvin, die Langen-, Gewichts- und Zeitmessung. Der U bergang zwischen diskreten und stetigen Merkmalen ist zum Teil ieend. Wenn man die Lange eines Werkstucks, die ein stetiges Merkmal darstellt, auf volle Zentimeter abrundet, so nimmt dieses Merkmal den Charakter eines diskreten Merkmals an. Auerdem kann man jedes stetige Merkmal gruppieren und erhalt so ein diskretes Merkmal. 1.1 Beschreibung eindimensionaler Stichproben 9 Eine zusammenfassende U bersicht der Merkmalseinteilung mit Beispielen enthalt Tab. 1.4. qualitativ nominal artmaig Auspragungen Religion Geschlecht Art Typ qualitativ quantitativ quantitativ (metrisch) ordinal zahlenmaig Rangfolge Handelsklassen Schulnoten Schadensstufen diskret ganzzahlig Kinder Panzen Tiere nominal Merkmal Baumart ordinal Schadigung diskret stetig Rehe/ha Bleigehalt stetig beliebig Gewicht Zeit Stogehalt Tanne, Fichte, Kiefer, Buche, Eiche ohne, schwach, mittel, stark, tot 0 , 20 0:0 , 100:0 ppm Tabelle 1.4: Einteilung der Merkmale 1.1.3 Haugkeitsverteilungen bei diskreten Merkmalen Betrachtet wird das Merkmal \Anzahl der Ferkel pro Wurf\ in Tab. 1.1 auf Seite 6. Dieses Merkmal nimmt nur ganze Zahlen groer oder gleich Null als Werte an und stellt damit ein diskretes Merkmal dar. Wenn man auszahlt, wie oft die verschiedenen Ferkelzahlen vorkommen, erhalt man die Haugkeitstabelle, bzw. Verteilung der Merkmalswerte in Tab. 1.5. Ferkel pro Wurf Haugkeit 4 1 5 0 6 3 7 8 9 10 11 12 13 14 15 16 9 10 18 20 16 11 5 4 2 1 Tabelle 1.5: Haugkeitstabelle fur die Ferkelzahlen von Tab. 1.1 Beim Auszahlen der Urliste kann man sich mit einer Strichliste behelfen. In der Strichliste geben die Summen der einzelnen Striche in einer Zeile die absolute Haugkeit ni fur den i-ten Merkmalswert xi an (Tab. 1.6). Auf kariertem Papier kann man ebenfalls bequem eine Urliste auszahlen, indem man uber dem entsprechenden Merkmalswert ein Kreuz malt (Bild 1.1). Die Summe der Kreuze uber einem Merkmalswert ist die absolute Haugkeit ni . Wenn man die absoluten Haugkeiten auf den Umfang n der Stichprobe bezieht, erhalt man die relativen Haugkeiten hi fur die Merkmalswerte xi . 10 4 5 6 7 8 9 10 11 12 13 14 15 16 1 Beschreibende und explorative Statistik jjjj jjjj jjjj jjjj jjjj jjjj jjjj jjj jjjj jjjj jjjj j j j jjj jjjj jjjj jjjj jjjj jjjj jjjj jjjj jjjj jj j Tabelle 1.6: Strichliste der Ferkelzahlen von Tab. 1.1 absolute Häufigkeit 20 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 Ferkel Bild 1.1: Kreuztabelle der Ferkelzahlen aus Tabelle 1.1 Sei mit h(xi ) = hi die relative Haugkeit fur den Merkmalswert xi bezeichnet. Dann gilt: mit xi als Ergebnis hi = h(xi ) = Anzahl der Stichprobenwerte Stichprobenumfang n (1.1) Im Beispiel hat die Wurfzahl 8 die Haugkeit h8 = h(8) = 10=100 = 0:10 oder auch 10%. Es ist klar, da die relative Haugkeit einer Merkmalsauspragung (hier: einer Wurfzahl) zwischen 0 und 1 liegt bzw. zwischen 0% und 100%, die beiden Zahlen jeweils eingeschlossen. Es gilt also: 0 hi 1. Tab.1.7 zeigt die absoluten und relativen Haugkeiten der Ferkelzahlen aus Tab. 1.1. 1.1 Beschreibung eindimensionaler Stichproben 11 Ferkel pro Wurf absolute Haugkeit relative Haugkeit 4 1 0:01 5 0 0:00 6 3 0:03 7 9 0:09 8 10 0:10 9 18 0:18 10 20 0:20 11 16 0:16 12 11 0:11 13 5 0:05 14 4 0:04 15 2 0:02 1 0:01 16 Summe 100 1:00 Tabelle 1.7: Haugkeitstabelle der Ferkelzahlen von Tabelle 1.1 1.1.4 Haugkeitsfunktion einer Stichprobe Einer Stichprobe vom Umfang n mit m verschiedenen Werten x1 ; x2 ; : : : ; xm kann man eine Funktion fe(x), die sog. Haugkeitsfunktion, zuordnen. Wenn hi die relative Haugkeit h(xi ) fur i = 1; 2; : : :; m bezeichnet, so erfolgt die Zuordnung: ef (x) = h0 i fur x = xi (i = 1; 2; : : : ; m) sonst (1.2) Die Funktion fe(x) nimmt also an den m Stellen xi (i = 1; 2; : : :; m) die Werte hi an und ist sonst uberall gleich Null (vgl. Bild 1.2). ~ f 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 2 4 6 8 10 12 14 16 Ferkel Bild 1.2: Haugkeitsfunktion fe(x) der Ferkelzahlen aus Tabelle 1.1 Man verwendet jedoch als graphische Darstellung meist ein Balken-, Saulendiagramm oder Histogramm. Dies ist eine optisch etwas ansprechendere graphische 12 1 Beschreibende und explorative Statistik Form der Haugkeitsfunktion fe(x). Man zeichnet einfach eine Saule bzw. einen Balken uber den Stichprobenwert dessen Hohe der absoluten oder relativen Haugkeit des Stichprobenwerts entspricht. Man erhalt dann eine Auftragung wie in Bild 1.3, in der die absoluten Haugkeiten als Balken dargestellt sind. ~ f 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA 0 2 4 AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAA AAAA 6 8 10 12 14 16 Ferkel Bild 1.3: Histogramm der Ferkelzahlen aus Tabelle 1.1 Wenn man die Punkte der Haugkeitsfunktion bzw. die Mitten der Saulen beim Balkendiagramm durch Geradenstucke miteinander verbindet, erhalt man ein sog. Haugkeitspolygon. Das kann nutzlich sein, um z.B. die zeitliche Entwicklung eines Merkmals deutlich zu machen. 1.1.5 Haugkeitsverteilungen bei stetigen Merkmalen Hat eine Stichprobe einen sehr groen Umfang und kommen viele zahlenmaig verschiedene Werte vor, so ist die Zeichnung der Haugkeitsfunktion wenig ubersichtlich. Auch wenn die Stichprobenwerte keine ganzen Zahlen sind, wie im Beispiel mit der Anzahl der Ferkel, sondern Zahlen aus einem gewissen Intervall, wenn z.B. ein Ertrag, ein Gewicht oder eine Lange gemessen werden, ist eine Klassenbildung sinnvoll. Das Intervall, in dem alle vorkommenden Stichprobenwerte liegen, wird in eine zweckmaige Anzahl von Teilintervallen oder Klassenintervallen unterteilt. Es ist dabei oft nutzlich, da alle Klassen gleich gro sind, also konstante Klassenbreite haben. Eine Klasse wird entweder mit Hilfe der unteren (linken) und oberen (rechten) Klassengrenze oder mit der Klassenmitte und Klassenbreite festgelegt. Die Anzahl von Stichprobenwerten, die in eine bestimmte Klasse fallen, heit absolute Klassenhaugkeit dieser Klasse. Die relative Klassenhaugkeit erhalt man nach Division der absoluten Klassenhaugkeit durch den Stichprobenumfang. Vor der Zuordnung der Stichprobenwerte zu den einzelnen Klassen legt man eine sich nicht uberlappende Klassenteilung fest, so da die Zuordnung der Stichprobenwerte zu den einzelnen Klassen eindeutig ist. Man wahlt auerdem entweder die Klassenmitten oder die Klassenenden so, da sie moglichst einfachen Zahlen entsprechen. Bei der Klassenbildung geht naturlich Information verloren. Die Menge aller Stichprobenwerte wird reduziert auf die Haugkeiten in den einzelnen Klassen. 1.1 Beschreibung eindimensionaler Stichproben 13 Will man nachtraglich aufgrund einer Klassizierung den arithmetischen Mittelwert x (vgl. Kap. 1.2) berechnen bzw. schatzen, so nimmt man zweckmaigerweise an, da alle Werte in einer Klasse auf der Klassenmitte liegen. Der Fehler, den man dabei macht, ist umso kleiner, je gleichmaiger sich die Merkmalswerte uber das ganze Intervall verteilen. Man sollte generell nicht \zu klein\ klassizieren, weil dabei noch \zuviel\ Information aus der Urliste ubrig bleibt. Andererseits sollte auch nicht \zu gro\ klassiziert werden, da in diesem Fall \zuviel\ Information uber die Haugkeitsverteilung der Stichprobe verloren geht. Als Faustregel gilt: Die Anzahl der Klassen sollte p kleiner oder hochstens gleich der Wurzel aus der Anzahl der Stichprobenwerte sein ( n), wobei jedoch mindestens 5 und hochstens 25 Klassen vorkommen sollen. Auerdem sollten moglichst keine leeren Klassen auftreten. Die Haugkeit in Abhangigkeit von den Klassenmitten heit die Haugkeitsfunktion der klassizierten Stichprobe. Tab. 1.8 zeigt die Urliste der jahrlichen Milchleistung einer Stichprobe von 100 Kuhen. Es liegt eine eindimensionale Stichprobe vor, denn fur jedes Element, also fur jede Kuh, wurde ein Merkmalswert gemessen. 5614 5866 3952 5626 5170 4870 6270 5566 5049 5358 5662 5601 5952 6627 5142 4935 4908 5436 5067 4938 4344 6799 4951 5884 5250 5700 5046 4254 4558 5875 5268 4834 4875 5908 5329 5397 6505 5569 5613 5626 4629 4113 3702 6532 4891 5296 4555 5611 5898 3916 4273 5548 5262 4201 5055 4689 3867 4618 4611 4381 5754 3760 4986 4593 5659 5899 4305 6235 4593 5221 5197 4599 6352 5770 5292 5155 4660 5065 5259 4999 5448 5560 5614 4702 5542 5580 4947 5242 5059 4318 4552 5650 5577 4491 5662 5851 4504 5608 4933 5832 Tabelle 1.8: Milchleistung von 100 Milchkuhen in kg/a Es liegt ein stetiges Merkmal vor, auch wenn die Mewerte auf ganze Kilogramm gerundet sind. Die meisten Werte kommen nur einmal vor. Aus diesem Grund nimmt man eine Klasseneinteilung vor und zahlt, wieviele Messungen in eine bestimmte Klasse fallen. In Tab. 1.9 wurde eine konstante Klassenbreite von 400 kg=a festgelegt. Die untere Grenze der am weitesten links liegenden Klasse (sog. Reduktionslage) wurde auf 3600 kg=a gesetzt, so da man wie folgt klassizieren kann: 1. Klasse: [3600 : : : 4000), 2. Klasse: [4000 : : : 4400), usw. Die vorletzte Spalte von Tab. 1.9 zeigt die absolute Haugkeitsverteilung, die letzte Spalte die relative Haugkeitsverteilung dieser Stichprobe. Graphisch stellt man meistens die Haugkeitsverteilung einer klassizierten Stichprobe in Form eines Histogramms oder Treppenpolygons dar. Man reprasentiert die Haugkeit der einzelnen Klassen durch Rechtecke, deren Flachen uber den verschiedenen Intervallen den Haugkeiten in diesen Intervallen proportional sind. Dieses Prinzip der Flachentreue sollte man insbesondere beachten, wenn man verschiedene Klassenbreiten wahlt. Wenn man eine konstante Klassenbreite (xi , xi,1 ) = x gewahlt hat, 14 1 Beschreibende und explorative Statistik Klassen- Klassen- Absolute Klassenhaugkeit Relative Klassenintervall mitte Strichliste n haugkeit h 3600 : : : 4000 3800 jjjj 5 0:05 4000 : : : 4400 4200 jjjj jjj 8 0:08 4400 : : : 4800 4600 jjjj jjjj jjjj 14 0:14 4800 : : : 5200 5000 jjjj jjjj jjjj jjjj jj 22 0:22 5200 : : : 5600 5400 jjjj jjjj jjjj jjjj 20 0:20 5600 : : : 6000 5800 jjjj jjjj jjjj jjjj jjjj 24 0:24 6000 : : : 6400 6200 jjj 3 0:03 6400 : : : 6800 6600 jjjj 4 0:04 100 1:00 Tabelle 1.9: Haugkeitsverteilung zur Stichprobe aus Tabelle 1.8 braucht man nur die Hohe der einzelnen Rechtecke proportional zur Haugkeit hi zu zeichnen. Das Histogramm zur Verteilungstafel in Tab. 1.9 ist in Bild 1.4.a wiedergegeben. Als Ordinate ist dort die relative Haugkeit fe(x) in Prozent aufgetragen. Man kann jedoch genauso gut die absoluten Haugkeiten darstellen. relative Häufigkeit [%] 25 20 15 10 5 0 a) 30 AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAA AAAA AAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAAA AAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAA AAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAAAAA AAAAAAAAAAAAAAAA AAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAAAAAA AAAAAAAAAAA AAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAA AAA AAAA AAAA AAA AAAA AAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAA AAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAAA AAAAAAAAAAA AAAA AAAA AAAA AAAA AAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAA AAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAA AAAAAAAA AAAA AAAAAAA AAAAAAA AAAA AAAAAAA AAAA AAA AAAA AAAAAAA AAAA AAAA 25 relative Häufigkeit [%] 30 20 15 10 5 0 3600 4000 4400 4800 5200 5600 6000 6400 6800 b) AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAA AAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAA AAA AAAA AAAA AAAAAAAAAAA AAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAA AAAA AAAAAAAA AAAAAAAAAAA AAA AAAAAAA AAAA AAAAAAAA AAAA AAA AAAA AAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAA AAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAA AAA AAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAA AAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAAAAA AAAAAAAAAAA AAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAAAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAA AAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAA AAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAA 3700 4100 4500 4900 5300 5700 6100 6500 6900 Milchleistung [kg/a] relative Häufigkeit [%] 30 25 20 15 10 5 0 Milchleistung [kg/a] c) 60 AAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA A AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA AA AAAAAAAA AAAAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA A AAAAAAAA AA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA A AAAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAA AAAA AA AAAAAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAA AAAA A AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AA AAAAAAAAAA AAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAAAAAA AAAA AAAAAA AAAA AAAAAA AAAA AAAA A AAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AA AAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AA AAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAAAAAA AAAAAAAAA AAAA AAAA AAAAAAAAAAAAA A AAAAAAAA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAAAAAA AAAAAAAA AA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAAAAAAA A AAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA A AAAAAAAA AAAA AAAA AA AA AAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAA AAAAAAAA AAAAA AAAAAAAA AA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAA AAAA AAAA AAAA 3500 4000 4500 5000 5500 6000 6500 7000 Milchleistung [kg/a] 50 relative Häufigkeit [%] 35 40 30 20 10 0 d) AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAAAAAA A AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AA AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AA AAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AA AA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A 3000 4000 5000 Milchleistung [kg/a] Bild 1.4: Histogramme zur Stichprobe aus Tab. 1.8 6000 7000 1.1 Beschreibung eindimensionaler Stichproben 15 Das Histogramm einer Stichprobe hangt von der Festlegung der Klassenbreite und der Reduktionslage ab. Fur das Beispiel der Milchleistungsstichprobe wurden in Bild 1.4 verschiedene Reduktionslagen und Klassenbreiten gewahlt. Wenn man die Reduktionslage von 3600 kg=a (Bild 1.4.a) auf 3700 kg=a erhoht (Bild 1.4.b), dann verschwindet der bei 5200 kg=a zu beobachtende sog. Ruckschlag, d.h. ein Abfall und anschlieender Anstieg der Haugkeiten. Bild 1.4.c zeigt ein Histogramm mit sieben Klassen. In Bild 1.4.d mit einer Klassenbreite von 1000 kg=a sind nur vier Klassen besetzt. Diese Art der Darstellung ist aufgrund einer zu geringen Anzahl von Klassen fur eine Haugkeitsverteilung ungeeignet. 1.1.6 Summenhaugkeitsfunktion einer Stichprobe Die Stichprobe ist nicht in Klassen eingeteilt Will ein Tierzuchter bei der Stichprobe uber die Ferkelzahl von 100 Jungsauen wissen, wieviel Prozent der Tiere Ferkelzahlen von 10 oder weniger aufweisen, so kann er das aus der Haugkeitstabelle 1.7 bzw. aus der Haugkeitsfunktion nicht sofort entnehmen. Er mu die Haugkeiten fur die Ferkelzahlen 4; 5; : : : ; 10 aufsummieren: 0:01 + 0:00 + 0:03 + 0:09 + 0:10 + 0:18 + 0:20 = 0:61 61% der Tiere dieser Stichprobe haben also Ferkelzahlen von 10 oder weniger. Man kann nun fur jede in Tab. 1.7 vorkommende Ferkelzahl xi fragen, wieviel Prozent der Tiere weisen Ferkelzahlen von xi oder weniger auf und die entsprechenden relativen Summenhaugkeiten berechnen. Damit hat man die Summenhaugkeitsfunktion oder die empirische Verteilungsfunktion Fe(x) der Stichprobe gewonnen. Die Summenhaugkeitsfunktion Fe(x) einer diskreten Stichprobe ist also gleich der Summe der relativen Haugkeiten aller Stichprobenwerte t, die kleiner als x oder gleich x sind. Tabelle 1.10 zeigt die Berechnung der Summenhaugkeitsfunktion fur die Ferkelzahlen von Tab. 1.1. Als Formel geschrieben lautet die Denition der Summenhaugkeitsfunktion: Fe(x) = Xe tx f (t) (1.3) Bild 1.5 enthalt die graphische Darstellung der Summenhaugkeitsfunktion (1.3) fur die Ferkelzahlen von Tab. 1.1. Die Stichprobe ist in Klassen eingeteilt In diesem Fall mu man die Denition der Summenhaugkeitsfunktion etwas modizieren. In einer Klasse sind genau so viele Werte enthalten wie der absoluten Klassenhaugkeit entspricht. Die Summenhaugkeitsfunktion an der Stelle x soll nach der bisherigen Auassung angeben, wieviele Werte kleiner oder gleich x sind. Bei einer klassizierten Stichprobe lat 16 1 Beschreibende und explorative Statistik Anzahl der Fer- relative Hau- relative Summenkel pro Wurf xi gkeit fe(xi ) haugkeit Fe(xi ) 4 0:01 0:01 5 0:00 0:01 6 0:03 0:04 7 0:09 0:13 8 0:10 0:23 9 0:18 0:41 10 0:20 0:61 11 0:16 0:77 12 0:11 0:88 13 0:05 0:93 14 0:04 0:97 15 0:02 0:99 16 0:01 1:00 Tabelle 1.10: Relative Summenhaugkeit der Ferkelzahlen aus Tab. 1.1 ~ f 0.2 0.1 0.0 0 2 4 6 8 10 12 14 16 Ferkel 0 2 4 6 8 10 12 14 16 Ferkel ~ F 1.0 0.8 0.6 0.4 0.2 0.0 Bild 1.5: Haugkeits- und Summenhaugkeitsfunktion der Stichprobe aus Tabelle 1.1 sich diese Denition nicht exakt anwenden, weil die Werte in einer Klasse zusammengefat wurden und eine Zuordnung zu den x-Werten des Klassenintervalls nicht mehr moglich ist. Die beste Moglichkeit ist, die Stichprobenwerte gedanklich in einer Klasse gleichmaig uber die Intervallbreite zu verteilen. Man kann dann die Summenhaugkeitsfunktion als Polygonkurve zeichnen. Fe(x) verlauft dabei in jedem Klassenintervall als Geradenstuckchen, welches jeweils vom linken bis zum rechten Klassenende um 1.1 Beschreibung eindimensionaler Stichproben 17 die betreende Klassenhaugkeit ansteigt. Diese Version der Summenhaugkeitsfunktion lat sich in vielen Fallen sinnvoll anwenden. Als Beispiel dient noch einmal die Stichprobe aus Tab. 1.8 (siehe Tab. 1.11). Klassen : : : 3600 3600 : : : 4000 4000 : : : 4400 4400 : : : 4800 4800 : : : 5200 5200 : : : 5600 5600 : : : 6000 6000 : : : 6400 6400 : : : 6800 6800 : : : relative Klassen- relative Summenhaugkeit fe(x) haugkeit Fe(x) 0:00 0:00 0:05 0:00 : : : 0:05 0:08 0:05 : : : 0:13 0:14 0:13 : : : 0:27 0:22 0:27 : : : 0:49 0:20 0:49 : : : 0:69 0:24 0:69 : : : 0:93 0:03 0:93 : : : 0:96 0:04 0:96 : : : 1:00 0:00 1:00 Tabelle 1.11: Relative Summenhaugkeit der Stichprobe von Tab. 1.8 Bild 1.6 zeigt die zugehorige Summenhaugkeitsfunktion. ~ f 0.3 0.2 0.1 0.0 AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAA AAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAA AAA AAAAAAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAAAAAAA AAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAA AAAAAAAA AAA AAAAAAAAAAAAAAAA AAAAAAA AAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAA AAAA AAAA AAA AAAA AAAA AAAA AAAA AAAA AAA AAAA AAAA AAA AAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAA AAA 3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a ~ F 1.0 0.8 0.6 0.4 0.2 0.0 3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a Bild 1.6: Histogramm und Summenhaugkeitsfunktion der Stichprobe aus Tabelle 1.8 18 1 Beschreibende und explorative Statistik 1.1.7 Streudiagramme und Punkteplots Eindimensionale Streudiagramme oder Scatter Plots stellen alle Einzelwerte uber einem Zahlenstrahl dar. Sie sind besonders fur stetige Merkmale geeignet. Bild 1.7 zeigt das Streudiagramm fur die Milchleistungen aus Tab. 1.8. Bild 1.7: Streudiagramm der Milchleistung aus Tabelle 1.8 Das Merkmal Ferkelzahl ist diskret. Infolgedessen werden im Streudiagramm gleiche Werte mehrmals ubereinander gezeichnet. Besser ist in diesem Fall ein Punkteplot oder Dotplot, bei dem gleiche groe Werte als Punkte ubereinander gezeichnet werden. Er besitzt deshalb starke A hnlichkeit mit einem Haugkeitsdiagramm. Bild 1.8 zeigt einen Punkteplot fur die Ferkelzahlen aus Tab. 1.1. : : : : : : : : : : : : . . : : : : : : : : : : : : : : : : : . . : : : : : : : : . : : : : : : : : : : . -+-------+-------+-------+-Ferkel 4.0 8.0 12.0 16.0 Bild 1.8: Punkteplot der Ferkelzahlen aus Tab. 1.1 1.1.8 Haugkeitsverteilungen bei nominalen Merkmalen Tab. 1.12 zeigt die Haugkeitsverteilung von zehn Unkrautern auf einem Ackerachenstuck. Bei einem nominalen Merkmal wird die absolute oder relative Haugkeit in der Regel durch ein Balkendiagramm mit Zwischenraumen zwischen den Saulen prasentiert. Bild 1.9 zeigt das Balkendiagramm der Unkrautverteilung in Tab. 1.12. Da bei einem nominalen Merkmal die Reihenfolge der Stichprobenwerte beliebig variiert werden kann, ist es nicht sinnvoll, eine Summenhaugkeitsfunktion zu berechnen und darzustellen. Haug erfolgt die Darstellung der nach aufsteigenden oder abfallenden Haugkeiten geordneten Werte im Balkendiagramm (Bild 1.10). Beschreibung eindimensionaler Stichproben 19 Unkraut Anzahl Gansefu 13 Vogelmiere 30 Ehrenpreis 18 Ackerstiefmutterchen 9 Franzosenkraut 2 Hirtentaschel 8 Klettenlabkraut 17 Kamille 33 Kornblume 4 Klatschmohn 4 138 Tabelle 1.12: Unkrautverteilung auf einem Ackerachenstuck 35 absolute Häufigkeit 30 25 20 15 10 5 0 AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA n n e ß is el ut ut re lle sefu lm ie npre rche nkra äsch bkra Kami rnblumchmoh Gän Voge Ehre fmüttenzose irtentettenla K o K l a ts e H a l i r t K F e rs A ck Bild 1.9: Balkendiagramm der Unkrautverteilung von Tab. 1.13 35 30 absolute Häufigkeit 1.1 25 20 15 10 5 0 AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAAAAAA AAA AAAA AAA AAAAAAA AAAA AAAAAAA AAA AAAA AAA ille iere reis raut fuß hen chel me ohn raut Kamogelm hrenpenlabk Gänse ütterctentäs ornblutschm osenk E l e tt K K la a n z r V ti e f m H i K Fr er s A ck Bild 1.10: Verteilung der Unkrauter in Tab. 1.12 nach fallenden Haugkeiten 20 1 Beschreibende und explorative Statistik 1.1.9 Haugkeitsverteilungen bei ordinalen Merkmalen Bei einem ordinalen Merkmal wird die absolute oder relative Haugkeit wie bei nominalen Merkmalen dargestellt. Allerdings sollte die Anordnung der Merkmalswerte in aufsteigender Form erfolgen, so da auch die Berechnung der Summenhaugkeiten Sinn macht. Tab. 1.13 zeigt das Ergebnis der Schadklassenkartierung einer Stichprobe von Baumen in einem Untersuchungsgebiet. Schadstufe Baume relative Haugkeit Summenhaugkeit ohne 31 0.248 0.248 schwach 48 0.384 0.632 mittel 19 0.152 0.784 stark 22 0.176 0.960 tot 5 0.040 1.000 125 1.000 Tabelle 1.13: Haugkeitsverteilung von Baumschaden Bild 1.11 zeigt das Balkendiagramm der Stichprobe aus Tab. 1.13. absolute Häufigkeit 50 AAAAAAAA AAAAAAAA AAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAA AAAA A AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAA A AAAA AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAA AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA A AAAA AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAAA AAAA AAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAA AAAAAAAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAA AAAAAAAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAA AAAAAAAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAAAAAAA A AAAA AAAAAAAAA ohne schwach 40 30 20 10 0 AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA A AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAAAAAAA A AAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAAA A AAAA AAAAAAAA A AAAAAAAA AAAAA AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA A AAAA AAAAAAAAAAAAA A AAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAAAAAA AAAA AAAA AAAAAAAA mittel stark tot Schadstufe Bild 1.11: Balkendiagramm der Schadstufen aus Tabelle 1.13 1.2 Statistische Mazahlen eindimensionaler Stichproben 21 1.2 Statistische Mazahlen eindimensionaler Stichproben Bei vielen praktischen Fragestellungen will man eine Reihe von Stichprobenwerten durch einige charakteristische Mazahlen beschreiben. Man unterscheidet Mazahlen der Lage oder der zentralen Tendenz (Mittelwerte), der Variabilitat (Streuungsmae) sowie der Schiefe und Wolbung. 1.2.1 Arithmetischer Mittelwert Zunachst soll die Stichprobe vom Umfang n mit den quantitativen Stichprobenwerten x1 ; x2 ; : : : ; xn durch einen Mittelwert gekennzeichnet werden. Mittelwerte werden auch als Lageparameter bezeichnet. Der wichtigste Mittelwert ist der arithmetische Mittelwert x der Stichprobenwerte. Er ist deniert als: n X x = x1 + x2 +n : : : + xn = n1 xi i=1 (1.4) Beispiel: Bei 5 Kuhen wurden folgende jahrlichen Milchleistungen (in kg=a) gemessen: x1 = 5250, x2 = 4955, x3 = 4763, x4 = 5538, x5 = 4994 Die mittlere Milchleistung ist: x = 25500 5 = 5100 Eine weitere Stichprobe von 5 Kuhen brachte folgende Ergebnisse: y1 = 5032, y2 = 4270, y3 = 4922, y4 = 5430, y5 = 5846 Die mittlere Milchleistung ist: y = 25500 5 = 5100 Die Summe der Stichprobenwerte betragt bei beiden Stichproben 25500. Damit sind auch beide Mittelwerte x = y = 5100 gleich gro. 1.2.2 Spannweite und mittlere absolute Abweichung Die Mittelwerte oder die durchschnittlichen Jahresmilchleistungen betragen in beiden oben angefuhrten Stichproben 5100 kg. Die zweite Stichprobe unterscheidet sich jedoch auallend von der ersten Stichprobe durch die weiter auseinanderliegenden Stichprobenwerte. Also wird der arithmetische Mittelwert zur Kennzeichnung einer Stichprobe i.a. nicht ausreichen. Aus diesem Grund werden zusatzlich Mae fur die Streubreite der Stichprobe eingefuhrt. Als einfachstes Ma bietet sich die sogenannte Spannweite, Variationsbreite oder Range R an. Sie ist deniert als Dierenz zwischen dem groten Stichprobenwert xmax und dem kleinsten Stichprobenwert xmin: R = xmax , xmin (1.5) 22 1 Beschreibende und explorative Statistik Die Spannweite R ist ein brauchbares Ma fur die Streuung, wenn die Stichprobe nur wenige Mewerte umfat (etwa bis zu 10 Mewerten). Innerhalb der Spannweite von xmin bis xmax liegen alle Stichprobenwerte. Die Spannweite spielt eine Rolle bei der Festlegung der Klassenbreite, wenn man eine groere Stichprobe klassiziert. Sie ist aber weniger geeignet zur Kennzeichnung der Streuung einer groen Anzahl von Stichprobenwerten, vor allem weil sie stark von der Zahl der Stichprobenwerte abhangig ist. Je groer die Anzahl der Beobachtungen ist, desto groer ist die Wahrscheinlichkeit, da einzelne vom Mittelwert x stark abweichende Mewerte in der Stichprobe enthalten sind. Seltener wird die mittlere absolute Abweichung a vom Mittelwert x verwendet: n X a = n1 jxi , xj (1.6) i=1 Dabei wird die Abweichung jxi , xj des Wertes xi vom Mittelwert x absolut genommen, obwohl die Handhabung mit den Absolutwerten etwas umstandlich ist. Fur kleine Stichproben kann man jedoch die mittlere absolute Abweichung vom Mittelwert sowohl aus rechentechnischen als auch aus sachlichen Grunden als Streuungsma benutzen. Beispiel: Fur die Stichproben des Beispiels von Seite 21 berechnen sich folgende Spannweiten und mittleren absoluten Abweichungen in kg=a: max min R a Stichprobe x Stichprobe y 5538 5846 4763 4270 775 1576 235 430 Bei identischen Mittelwerten von x = y = 5100 sind Spannweite und mittlere absolute Abweichung bei der Stichprobe y praktisch doppelt so gro wie bei der Stichprobe x. 1.2.3 Empirische Varianz und Standardabweichung U berwiegend wird bei quantitativen Daten als Streuungsma die mittlere quadratische Abweichung oder empirische Varianz verwendet. Dieses Streuungsma wird ublicherweise mit s2 abgekurzt. Die Groe s2 ist fur n > 1 deniert als: s2 = n 1 X 2 n , 1 i=1 (xi , x) (1.7) Wenn die Stichprobenwerte nicht alle gleich gro sind, ist die Varianz immer groer als Null. Die positive Quadratwurzel aus der Varianz s2 heit Standardabweichung der Stichprobe oder empirische Standardabweichung und wird mit s bezeichnet. Die 1.2 Statistische Mazahlen eindimensionaler Stichproben 23 Standardabweichung s hat die gleiche Dimension wie die Stichprobenwerte. Es fallt auf, da die Quadratsumme in Gleichung (1.7) durch n , 1 und nicht durch n dividiert wird. Der Grund ist, da die Varianz s2 bestimmte Eigenschaften erfullen mu, die erst im Zusammenhang mit der Wahrscheinlichkeitstheorie erklart werden konnen (vgl. Kap. 4.5.2). Anschaulich lat sich die Summe von n Summanden in Gleichung (1.7) auf eine Summe von n , 1 Summanden reduzieren, da der Wert des n-ten Summanden bei fest gegebenen Werten von s2 und x dann x ist. Man sagt auch, die Quadratsumme in (1.7) hat n , 1 Freiheitsgrade. Eine zu Gleichung (1.7) alternative Berechnungsformel fur die empirische Varianz folgt durch Umformung der sog. Summe der Abweichungsquadrate oder Abweichungsquadratsumme: n X n X i=1 n X (xi , x)2 = = = i=1 i=1 n X i=1 (x2i , 2xi x + x2 ) = x2 , nx2 = i x2i , n1 n X i=1 n X i=1 n X i=1 x2i , 2nx2 + nx2 = n X x2i , n n1 xi xi !2 !2 i=1 = (1.8) Aus Gleichung (1.7) und (1.8) folgt: 0 n n X X s2 = n ,1 1 @ x2i , n1 xi i=1 i=1 !21 A (1.9) Gleichung (1.9) ist gegenuber (1.7) bei Handrechnung vorzuziehen. Bei Anwendung von (1.9) in Computern konnen jedoch in bestimmten Fallen sehr groe Rundungsfehler auftreten, und zwar dann, wenn die beiden Ausdrucke in der obigen Klammer nahezu gleich gro sind, d.h. wenn die Varianz im Vergleich zum Mittelwert sehr klein ist. Beispiel: Die Varianz der Stichprobe x des Beispiels von Seite 21 wird nach Gleichung (1.7) berechnet, die der Stichprobe y nach Gleichung (1.9): xi , x (xi , x)2 150 ,145 ,337 438 ,106 22500 21025 113569 191844 11236 360174 yi yi2 5032 25321024 4270 18232900 4922 24226084 5430 29484900 5846 34175716 25500 131440624 24 1 Beschreibende und explorative Statistik s2x = 41 360174 = 90043:5 ) sx = 300 [kg=a] s2y = 14 131440624 , 15 255002 = 347656 ) sy = 590 [kg=a] Die empirische Varianz in der Stichprobe y ist also trotz gleicher Mittelwerte groer. 1.2.4 Mittelwert und Varianz bei klassizierten Stichproben Haug ist die Stichprobe in einer Haugkeitstabelle oder in einem Histogramm zusammengefat, d.h. es kommen insgesamt m verschiedene Werte xi (i = 1; 2; : : :; m) vor mit jeweils den absoluten Haugkeiten ni (i = 1; 2; : : :; m), wobei n1 + n2 + : : : + nm = n, wenn n der Umfang der gesamten Stichprobe ist. Anstatt der absoluten Haugkeiten ni konnen auch die relativen Haugkeiten hi zur Berechnung herangezogen werden. Dies ist insbesondere dann notig, wenn der Gesamtstichprobenumfang n nicht bekannt ist, weil er nicht in der Haugkeitstabelle oder im Histogramm angegeben wurde. Das arithmetische Mittel x berechnet sich dann zu: x = n1 m X m X i=1 i=1 (ni xi ) = (hi xi ) (1.10) Entsprechend lautet die Berechnungsformel fur die Varianz: 0 m m X X s2 = n ,1 1 @ (ni x2i ) , n1 (ni xi ) i=1 i=1 ! m X m X i=1 i=1 (hi x2i ) , (hi xi ) 2 !2 1 A (1.11) Es ist zu beachten, da bei der Varianzschatzung uber die relativen Haugkeiten der Stichprobenumfang eigentlich durch n statt durch n , 1 geteilt wird. Fur groere Stich1 ist. proben ist dieser Fehler sehr gering, weil dann n1 n , 1 Beispiel: Die mittlere Ferkelzahl pro Wurf der Stichprobe aus Tab. 1.1 und ihre empirische Varianz wird mit Hilfe der absoluten Haugkeiten aus Tab.1.7 berechnet. 1.2 Statistische Mazahlen eindimensionaler Stichproben 25 xi ni ni xi ni x2i 4 5 6 7 8 9 10 11 12 13 14 15 16 P 1 4 16 0 0 0 3 18 108 9 63 441 10 80 640 18 162 1458 20 200 2000 16 176 1936 11 132 1584 5 65 845 4 56 784 2 30 450 1 16 256 100 1002 10518 1 1002 = 10:02, s2 = 1 10518 , 1 10022 = 4:828 ) s = 2:197 x = 100 99 100 Auch bei klassiziertem Datenmaterial einer Stichprobe berechnet man Mittelwert und Varianz mit Hilfe der Gleichungen (1.10) und (1.11). Man verfahrt so, als ob alle Stichprobenwerte einer Klasse auf der Klassenmitte liegen, allerdings unter der Voraussetzung, da keine oen endenden Intervalle wie z.B. x < a oder x > b vorkommen. Im Falle klassizierter Stichproben fallt der Fehler bei der Varianzschatzung uber die relativen Haugkeiten nicht sehr ins Gewicht, da die Groe von Mittelwert und Varianz von der Klasseneinteilung abhangen Beispiel: Als Beispiel dient die klassizierte Stichprobe der Milchleistungen aus Tab. 1.8. Es wird angenommen, da der Stichprobenumfang unbekannt ist, also lediglich die relativen Haugkeiten bekannt sind. xi (Klassenmitte) hi 3800 0:05 4200 0:08 4600 0:14 5000 0:22 5400 0:20 5800 0:24 6200 0:03 6600 0:04 P 1:00 hi xi hi x2i 190 722000 336 1411200 644 2962400 1100 5500000 1080 5832000 1392 8073600 186 1153200 264 1742400 5192 27296800 x = 5192 [kg=a], s2 = (27296800 , 51922) = 339936 ) s = 583 [kg=a] 26 1 Beschreibende und explorative Statistik 1.2.5 Gewogener arithmetischer Mittelwert Der gewogene arithmetische Mittelwert wird verwendet, wenn die einzelnen Stich- probenwerte xi nicht gleichberechtigt bei der Durchschnittsbildung mitwirken, sondern gewichtet werden sollen. Bei einer Diplomprufung gehen z.B. nicht alle Noten xi (i = 1; 2; : : : ; m) der Prufungsfacher mit gleichem Gewicht in die Endnote x ein, sondern entsprechend den in der Prufungsordnung festgelegten Gewichten g1 ; g2; : : : ; gm , wobei g1 + g2 + : : : + gm = n. Das gewogene Mittel xgew berechnet sich dann zu: xgew = n1 m X i=1 (gi xi ) (1.12) Wenn man Mittelwerte x1 ; x2 ; : : : ; xm von mehreren Stichproben verschiedenen Umfangs vorliegen hat, kann man einen gemeinsamen Mittelwert x ausrechnen, indem man entsprechend den Stichprobenumfangen n1 ; n2 ; : : : ; nm gewichtet: m X (ni xi ) n x + n x + : : : + n x 1 1 2 2 m m i =1 x = n +n +:::+n = X m 1 2 m ni (1.13) i=1 Beispiel: Auf einem Versuchsgut in Weihenstephan wurden folgende Ernteertrage erzielt: Winterweizen Sommerweizen Wintergerste Sommergerste Hafer dt=ha ha 63:4 15:1 54:8 14:5 56:4 7:0 51:2 8:1 45:9 8:3 53:0 Der durchschnittliche Getreideertrag aller Flachen errechnet sich dann durch Gewichtung der einzelnen Ertrage mit ihren Flachen: x = 63:4 15:1 + 54:8 14:5 + 5653:4:0 7:0 + 51:2 8:1 + 45:9 8:3 = 55:52 Das gewogene arithmetische Mittel wird insbesondere in der amtlichen Statistik zur Berechnung von sog. Indizes verwendet (z.B. Lebenshaltungskostenindex, Index der Grohandelspreise, Aktienindex usw.). 1.2 Statistische Mazahlen eindimensionaler Stichproben 27 1.2.6 Geometrischer Mittelwert Die Denition des geometrischen Mittels xgeom aus n positiven Beobachtungswerten x1 ; x2 ; : : : ; xn lautet: xgeom = pn x1 x2 : : : xn (1.14) Es ist log xgeom = n1 (log x1 + log x2 + : : : + log xn ), d.h. der Logarithmus des geometrischen Mittels xgeom ist gleich dem arithmetischen Mittel der Logarithmen der Stichprobenwerte. Das geometrische Mittel ist stets kleiner als das arithmetische Mittel (nur wenn alle Stichprobenwerte gleich sind, fallen die beiden Mittel zusammen). Eine sinnvolle Anwendung des geometrischen Mittels ist angebracht, wenn man relative A nderungen mitteln will, z.B. bei Wachstumsvorgangen, bei denen sich eine Variable mit der Zeit in annahernd konstantem Verhaltnis andert oder wenn die Variationsbreite der Stichprobenwerte im Vergleich zum arithmetischen Mittelwert sehr gro ist. Das geometrische Mittel wird namlich durch Extremwerte nicht so stark beeinut wie das arithmetische Mittel oder anders ausgedruckt, wenn die Stichprobenwerte annahernd logarithmisch normalverteilt sind (siehe Kap. 3.2). Beispiel: Gegeben seien die Absatzsteigerungen eines Unternehmens von 5%, 7% und 12% in drei aufeinanderfolgenden Jahren. Die Prozentzahlen sind dabei jeweils auf den vorjahrigen Absatz bezogen. Wie gro ist die durchschnittliche Absatzsteigerung x? Man mu x so berechnen, da die dreimalige Anwendung der durchschnittlichen Absatzsteigerung x zum gleichen Ergebnis fuhrt wie die oben angefuhrten verschiedenen Steigerungsraten x1 = 0:05, x2 = 0:07 und x3 = 0:12, also: (1 + x)3 = (1 + x1 ) (1 + x2 ) (1 + x3 ) = 1:05 1:07 1:12 ) p p 1 + x = 3 1:05 1:07 11:2 ) x = 3 1:25832 , 1 = 0:0796 8% Der durchschnittliche Multiplikationsfaktor 1 + x ist also das geometrische Mittel aus den drei unterschiedlichen Multiplikationsfaktoren 1:05, 1:07 und 1:12. Man kann zeigen, da das geometrische Mittel xgeom von Stichprobenwerten xi > 0 mit dem arithmetischen Mittel x sehr gut ubereinstimmt, wenn die relative Abweichung xi , x der Stichprobenwerte dem Betrag nach sehr klein ist. x 1.2.7 Variationskoezient Sehr oft interessiert nicht die Standardabweichung s allein, sondern ihre Relation zum Mittelwert. Dieses relative Ma der Standardabweichung prozentual bezogen auf den arithmetischen Mittelwert heit Variationskoezient (VK). VK = xs (1.15) 28 1 Beschreibende und explorative Statistik Mit Hilfe des Variationskoezienten kann man die Streuung oder die Variation zweier Merkmale miteinander vergleichen, die in verschiedenen Maeinheiten gemessen wurden. Wenig Sinn hat die Verwendung des Variationskoezienten, wenn in die Berechnung von x auch negative Beobachtungswerte eingehen. Beispiel: Tab. 1.14 zeigt die Mittelwerte und Standardabweichungen fur eine Reihe verschiedener Merkmale (Stichprobenumfang n = 30), die bei der Schweinemastprufung erfat werden. Aus der Spalte des Variationskoezienten ist zu entnehmen, da die Merkmale der Mastleistung (tagliche Zunahme, Futterverwertung) weniger variabel sind als die Merkmale der Schlachtkorperqualitat. Merkmal x s VK [%] tagl. Zunahme 720.2 g 46.3 g 6.43 Futterverwertung 3.016 0.164 5.44 99.53 cm 2.78 cm 2.79 Korperlange Schlachtkorpergewicht 77.083 kg 2.535 kg 3.29 Ruckenspeckdicke 2.86 cm 0.35 cm 12.24 Seitenspeckdicke 3.08 cm 0.62 cm 20.13 Fleischache 33.30 cm2 3.70 cm2 11.11 Fettache 24.91 cm2 4.14 cm2 16.62 Tabelle 1.14: Mittelwert x, Standardabweichung s sowie Variationskoezient VK verschiedener Merkmale einer Stichprobe uber die Mastleistung und Schlachtkorperqualitat bei Schweinen 1.2.8 Median oder Zentralwert Wenn man die Mewerte xi der Groe nach ordnet, so liegt der Zentralwert oder Median xe in der Mitte dieser Stichprobenwerte. Links und rechts von xe liegen gleich viele Stichprobenwerte oder Beobachtungen. Wenn eine ungerade Zahl von Beobachtungen vorliegt, so ist der Zentralwert eindeutig als die mittlere Beobachtung deniert. Bei einer geraden Zahl von Beobachtungen ist der Zentralwert nicht mehr eindeutig, sondern eine Zahl zwischen den beiden mittleren Beobachtungen. Meist nimmt man dann die Mitte dieser beiden mittleren Beobachtungen (vgl. Bild 1.12). Bereich fur xe xe x1 x2 x3 n =-7 x4 x5 x6 x7 x1 x2 x3 n =-6 x4 x5 x6 Bild 1.12: Median bei einer ungeraden und geraden Anzahl von Stichprobenwerten Der Median hat z.B. den Vorteil, da man ihn bei einer Rangskala, also bei ordinalen Daten verwenden kann, bei der die Berechnung des arithmetischen Mittels nicht mehr moglich ist. 1.2 Statistische Mazahlen eindimensionaler Stichproben 29 Beispiele: 1. Der Median bei der Schadklassenkartierung von Baumen in Tab. 1.13 ist die Schadstufe des 63: Baums, also xe = schwach. Das heit, die eine Halfte aller Baume ist schwach oder nicht geschadigt, die andere Halfte ist schwach oder schlimmer geschadigt. Man kann auch die Haugkeiten fur die Schadstufen berechnen und anschlieend die Summenhaugkeiten bestimmen. Der Median der Verteilung nimmt dann den Wert an, an dem die Summenhaugkeitsfunktion den Wert 0:5 erreicht. 2. Aus Tab. 1.10 uber die Stichprobe der Ferkelzahlen ist der Median leicht als xe = 10 abzulesen, da die Summenhaugkeitsfunktion bei 10 Ferkeln den Wert 0:5 uberschreitet. Im vorliegenden Fall gibt es auch keine Probleme mit dem geradzahligen Stichprobenumfang, da die nachst niedrigere und hohere Ferkelzahl ebenfalls 10 betragt. Die Halfte aller Sauen hat also 10 oder weniger Ferkel/Wurf, die andere Halfte 10 oder mehr. Mittelwert x = 10:2 und Median xe = 10 sind hier fast identisch. Der Median wird von den speziellen Werten der groten und kleinsten Beobachtung nicht beruhrt und er stellt daher ein \robusteres\ Ma der Lage oder der zentralen Tendenz dar als der arithmetische Mittelwert. Robust bedeutet in diesem Zusammenhang, da xe von moglichen \Ausreierwerten\ der Stichprobe nicht oder viel weniger abhangig ist als der Mittelwert x. Wenn die Stichprobenwerte bei einer stetigen Variablen klassiziert sind, gibt man als Zentralwert entweder nur die Medianklasse an, also die Klasse, in der der Zentralwert liegt, oder man liest in der Summenhaugkeitsfunktion den zu Fe(x) = 0:5 gehorigen Wert auf der Abszisse ab. Eine lineare Interpolation mit Hilfe der Summenhaugkeitsfunktion kann auch uber folgende Interpolationsformel erfolgen: e xe = u + b 0:5e, F (u) ; fMedian (1.16) wobei u die untere Klassengrenze der Medianklasse, b die Klassenbreite, Fe(u) der Wert der Summenhaugkeitsfunktion an der unteren Grenze der Medianklasse und feMedian die relative Haugkeit der Medianklasse ist. Beispiel: Es wird die klassizierte Stichprobe der Milchleistungen von Tab. 1.11 betrachtet. Die Medianklasse ist das Intervall von 5200 : : : 5600. In der Summenhaugkeitsfunktion von Bild 1.6 kann man bei Fe(0:5) den Median zu etwa xe = 5200 abschatzen. Dies korrespondiert auch mit den Werten in Tab. 1.11, denn bei 5200 hat die Summenhaugkeitsfunktion bereits den Wert 0:49 und 0:50 wird bei einem geringfugig hoheren Wert erreicht. Mit Hilfe von Gleichung (1.16) wird der Median zu xe = 5200 + 400 0:50,:200:49 = 5220 geschatzt. Der wahre Median, der aus den Originaldaten von Tab. 1.8 berechnet wurde, liegt zwischen 5221 und 5242. Das Mittel aus diesen beiden Werten ist 5231:5. Das arithmetische Mittel x = 5188:67 ist hier etwas kleiner als der Median. 30 1 Beschreibende und explorative Statistik Der Zentralwert hat die charakteristische Eigenschaft, da die Summe der absoluten Abweichungen der Beobachtungen xi von ihrem Zentralwert xe kleiner ist als von jeder anderen Zahl. Diese Summe ist also ein Minimum. 1.2.9 Modus oder Dichtemittel Der Modalwert, Modus oder das Dichtemittel xd ist derjenige Stichprobenwert, der am haugsten vorkommt. Beispiel: Bei der Stichprobe mit den Ferkelzahlen von Tab. 1.1 ist die Ferkelzahl xd = 10 der Modalwert (vgl. Bild 1.3). Es konnen in einer Stichprobe mehrere modale Werte vorkommen. So unterscheidet man neben unimodalen oder eingipigen Verteilungen auch bimodale oder zweigipige und schlielich multimodale oder mehrgipige Verteilungen. Ein Dichtemittel ist in solchen Fallen jeweils als ein Wert bestimmt, der hauger vorkommt als seine Nachbarwerte. So spricht man auch genauer vom haugsten Wert als dem absoluten Dichtemittel oder dem 1. Modalwert und bezeichnet weitere relative Dichtemittel als 2. Modalwert usw. Beispiel: Bei der Stichprobe in Bild 1.11 ist die Schadstufe schwach der erste Modus und die Schadstufe stark der zweite Modus. Bei nominalen bzw. kategorialen Daten ist nur die Bestimmung des ersten Dichtemittels moglich. Andere Mittel konnen in diesem Fall nicht bestimmt werden. Beispiel: Bei der Unkrautverteilung in Bild 1.9 macht nur das erste Dichtemittel bei der Kamille als Lageparameter Sinn, da die Anordnung der Nominaldaten auf der Abszisse beliebig variiert werden kann (vgl. Bild 1.10). Es ist einleuchtend, da bei einer ausgepragten Mehrgipigkeit einer Verteilung die Dichtemittel diese Verteilung besser beschreiben konnen als das arithmetische Mittel oder der Median, da deren Groe in einem Bereich liegen konnen, in denen sehr wenige oder im Extremfall gar keine Mewerte liegen. 1.2 Statistische Mazahlen eindimensionaler Stichproben 31 Beispiel: Bild 1.13 zeigt die Haugkeitsverteilung der in einer zweiwochigen Beobachtungsperiode gelegten Eier von Huhnern. 0.25 relative Häufigkeit 0.20 0.15 29 AAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA A AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA A AAAA AAAAAAAAAAAAA AAAAAAAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAA A AAAA AAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAAAAAAA A AAAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAA AAAAAAAAA AAAAAAAA A AAAAAAAAAAAAA AAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA A AAAAAAAAAAAAA A AAAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAAA AAAA AAAAAAAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAA AAAA AAAA A AAAAAAAAAAAAA A AAAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAAA AAAA AAAAAAAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAA AAAAA A AAAAAAAA AAAAA AAAA AAAA AAAAAAAAA AAAA AAAAAAAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA A AAAAAAAA AAAAA AAAAAAAA A AAAAAAAAA AAAA AAAA AAAA AAAA A AAAAAAAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAA A AAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAA AAAAA AAAA AAAA A AAAA AAAA AAAA AAAA A AAAAAAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAAAAAA A AAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAAA AAAA AAAA AAAA A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAA AAAA A AAAA AAAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAA AAAA A AAAA AAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAA AAAA A A AAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA A AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAA A AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA A AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAA AAAAAAAA A AAAAAAAA AAAAAAAA AAAA A A 23 15 0.10 0.05 14 13 13 6 4 2 1 0.00 4 5 6 7 8 9 10 11 12 13 Anzahl der Eier Bild 1.13: Histogramm der Anzahl von Huhnereiern Mittelwert und Median x = xe = 9 fallen genau in einen Bereich, in denen die Haugkeit sehr gering ist. Der erste Modus bei 11 und der zweite Modus bei 7 beschreiben die Verteilung als Lageparameter viel besser. Dies wird auch klar, wenn man wei, da das Histogramm in Bild 1.13 die Eianzahl zweier Huhnerrassen ist, deren Mittelwerte getrennt nach Rassen jeweils 7 und 11 betragt. Bei diskreten Merkmalsauspragungen ist die Bestimmung der Dichtemittel relativ einfach und klar. Wie geht man jedoch bei stetigen Merkmalswerten vor, wenn also eine klassizierte Verteilung in Form eines Histogramms vorliegt? Entweder nimmt man die gesamte Klassenbreite oder die Klassenmitte als Modus oder man pat der Verteilung in der Umgebung des zu bestimmenden Dichtemittels, also an der am starksten besetzten Klasse sowie den beiden Nachbarklassen, eine Interpolationsparabel an und nimmt die Stelle, an der die Parabel ihr Maximum hat, als Dichtemittel an dieser Stelle. Beispiel: Bild 1.14 zeigt die Verteilung der Schlafdauer von 150 Probanden beim Test eines Schlafmittels. Die haugsten Schlafdauern liegen zwischen 7 und 8 Stunden. Die Klassenmitte dieses Intervalls von 7:5 als Dichtemittel anzugeben ist hier nicht sehr elegant. Eine Schatzung kann durch Interpolation erfolgen, wenn man eine Parabel durch die Punkte (6:5; 44), (7:5; 61) und (8:5; 26) legt. Diese Parabel bestimmt man leicht zu ,26x2 +381x , 1334. Die erste Ableitung gleich Null gesetzt ergibt ,52x + 381 = 0. Daraus folgt xd = 7:3296 7:33. Auch bei sehr schiefen Verteilungen (vgl. Kap. 1.2.13) kann das Dichtemittel ein geeignetes Ma fur die Verteilung sein. 32 1 absolute Häufigkeit 60 50 40 30 20 10 61 AAAAAAAA AAAAAAAA AAAAAAAAA AAAA AAAAAAAAAAAA AAAAA AAAAAAAA AAAAAAAAA AAAA AAAAAAAAAAAAA AAAA A AAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA A AAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAAA AAAAAAAA A AAAAAAAAAAAAA AAAA AAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAAAAAAA AAAAAAAA A AAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAA AA AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AA AAAAAAAA A AAAAAAAAAA AAAAAAAAA AAAA AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAA AAAA AAAA AAAA AAAA AAAAAAAA AA AAAAAAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAA AA AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA A AAAAAAAAAA AAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAA AA AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA A AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AAAA A AAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAA AAAA AAAA A AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AA A AAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAA AAAA AAAA A AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AA AAAAAAAA AAAA AA A AAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA A AAAA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AA AAAAAAAA AAAA AA A AAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAA AA AAAAAAAAAAAAAAAAAAAA AAAA AA A AAAAAAAAAAAAAA AAAA AAAA A AAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA A AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AAAA AA A AAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA A AAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAA AA AAAA AAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A AA AAAA AA AAAA AAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA A AAAA A AAAAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAA AAAA AAAA A A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAA A AAAA AAAAAA AAAA AA AAAA AAAA AA AAAA AA AAAA AAAA A A AAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AA A AAAAAAAAAAAAAA A AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAA AAAAAAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA A AAAAAAAAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAAAAAAAA AAAAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAAAAAAAAAAAA 44 26 2 3 8 6 3 2 0 Beschreibende und explorative Statistik 4 5 6 7 8 9 Schlafdauer [h] Bild 1.14: Histogramm der Schlafzeiten von 150 Personen Beispiel: Es liegen folgende DM-Betrage als Stichprobenwerte einer Spendenaktion vor: 100000.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 50.{ DM Das arithmetische Mittel x ist rund 16741.{ DM. Wenn man behauptet, da im Durchschnitt rund 16741.{ DM gespendet wurden, so ist dies zwar mathematisch richtig, trit aber nicht den Kern der Sache. Hier verwendet man besser den Modalwert, und man kann in diesem Falle sagen: Die haugste Spende betrug 100.{ DM. 1.2.10 Standardfehler des arithmetischen Mittels Das arithmetische Mittel x einer Stichprobe wird haug als Approximation oder Schatzwert des unbekannten Mittelwerts der dazugehorigen Grundgesamtheit verwendet. Die Varianz s2 der Stichprobe ist entsprechend ein Schatzwert fur die unbekannte Varianz in der Grundgesamtheit (vgl. 4.5). Entnimmt man einer unendlich groen Grundgesamtheit mehrere Stichproben und berechnet jeweils das Stichprobenmittel, so stellt man fest, da diese Stichprobenmittelwerte weniger streuen als die Einzelbeobachtungen einer Stichprobe. Die Standardabweichung dieser Stichprobenmittelwerte ist ein Ma fur die Variabilitat der Stichprobenmittelwerte. Es ist einsichtig, da die Abweichung eines Stichprobenmittels x vom unbekannten Mittelwert der Grundgesamtheit umso kleiner ist, je kleiner die Streuung fur die Einzelwerte in der Grundgesamtheit ist und je groer der Stichprobenumfang ist. Stellt man sich nun gedanklich eine unendliche Wiederholung der Stichprobenziehung mit anschlieender Berechnung des arithmetischen Mittelwerts vor, so kommt man zu einer (hypothetischen) Grundgesamtheit von Stichprobenmittelwerten, die jeweils aus einem Umfang n berechnet wurden. Es besteht eine einfache Beziehung zwischen der Standardabweichung in der Grundgesamtheit der arithmetischen Mittelwerte und der Standardabweichung in der Grundgesamtheit der Einzelwerte, deren genaue Begrundung im Zusammenhang mit der Verteilung von Zufallsgroen ersichtlich wird. 1.2 Statistische Mazahlen eindimensionaler Stichproben 33 Indem man diese Beziehung auf die Schatzwerte ubertragt, wird der spateren Herleitung (vgl. 3.1.3) vorausgegrien. Der Schatzwert fur die Standardabweichung des arithmetischen Mittels x heit auch Standardfehler des arithmetischen Mittelwerts sx. Es gilt: sx = psn = = v u n u t 1 X(xi , x)2 = n (n , 1) i=1 v 0n 1 u n !2 u X X 1 1 u t n (n , 1) @ x2i , n xi A i=1 (1.17) i=1 In der Physik bezeichnet man sx auch als mittleren Fehler. Jede Stichprobe liefert namlich zufallige Werte fur die einzelnen xi und somit auch fur den Mittelwert x. Das Streuungsma der Standardabweichung wird dabei als \mittlere\ Abweichung interpretiert. So wird die Standardabweichung s als mittlerer Fehler fur ein xi bzw. eine Einzelbeobachtung bezeichnet, und der Standardfehler sx wird als mittlerer Fehler des Mittelwerts bezeichnet. 1.2.11 Zur Wahl eines Mittelwerts Jeder Mittelwert gibt stellvertretend fur eine ganze Reihe von Einzelwerten einen einzigen Wert als Lageparameter an. Ein Mittel kann deshalb nicht kurz in einer einzigen Zahl das Wesentliche ausdrucken und gleichzeitig alle Details der Haugkeitsverteilung enthullen. Ein Mittelwert verdeckt und glattet unter Umstanden Extremwerte und wird je nach Denition mehr oder weniger von ihnen beeinut. Um das richtige Mittel zu nden, uberlegt man sich vorher, welcher Lageparameter am besten zur Charakterisierung der Daten geeignet ist. Am haugsten wird das arithmetische Mittel verwendet. Die Vorteile des arithmetischen Mittels sind: 1. Multiplikation mit der Anzahl n ergibt die Summe der insgesamt beobachteten Merkmalswerte. 2. Die arithmetischen Mittelwerte verschiedener Gruppen konnen kombiniert werden. Durch ein gewogenes Mittel ndet man das arithmetische Mittel der kombinierten Gruppen. 3. n X (xi , x) = 0, d.h. die Summe der positiven und der negativen Abweichungen sind der Groe nach gleich. i=1 n X 4. Die Summe der quadratischen Abweichungen (xi , x)2 ist kleiner als fur jede i=1 andere Zahl. 34 1 Beschreibende und explorative Statistik Der zweitwichtigste Mittelwert ist der Zentralwert oder Median. Er teilt die Beobachtungen in zwei Halften, d.h. links und rechts von ihm liegen jeweils 50% der Beobachtungswerte. Bei ungeradem n fallt der Median genau auf den mittelsten Beobachtungswert, den man \halb zur linken und halb zur rechten Gruppe\ der Beobachtungswerte zahlt. Wenn man wei, da die betrachtete Verteilung symmetrisch ist, kann man den leichter zu bestimmenden Zentralwert als gute Schatzung fur das arithmetische Mittel heranziehen. Der Zentralwert kann im Gegensatz zum arithmetischen Mittel bei einer klassizierten Haugkeitsverteilung auch berechnet werden, wenn diese Verteilung oen-endende Klassen enthalt. Bei ordinalen Daten ist der Zentralwert das Mittelwertsma der Wahl. Der Modalwert oder das Dichtemittel ist sinnvoll, wenn man den gewohnlichsten oder haugsten Wert charakterisieren will, insbesondere bei stark unsymmetrischen oder schiefen Verteilungen. Bei nominalen Daten kann als Lageparameter ausschlielich das Dichtemittel angegeben werden. Das geometrische Mittel ist zur Messung des Mittels einer Veranderung angebracht, wenn man eine durchschnittliche Veranderungsrate berechnen mochte. Das geometrische Mittel oder auch der Median charakterisieren solche unsymmetrischen Verteilungen von positiven Werten gut, die durch U bergang auf die Logarithmen dieser Werte in eine symmetrische Verteilung transformiert werden. Bei einer symmetrischen eingipigen Verteilung fallen Modalwert, Median und arithmetisches Mittel zusammen. Bei unsymmetrischen Verteilungen weichen diese drei Mittel mehr oder weniger voneinander ab. Es reicht in solchen Fallen nicht immer aus, nur ein bestimmtes Mittel anzugeben, um die Lage der Verteilung zu charakterisieren. Neben Mittelwert gibt man dann noch Schiefe und evtl. Wolbung an (vgl. Kap. 1.2.13). In der beurteilenden Statistik wird bei quantitativen Beobachtungen vorwiegend das arithmetische Mittel x als Lageparameter und die Standardabweichung s als Variabilitatsma verwendet. Der Grund ist, da diese Mazahlen einer Stichprobe optimale Approximationseigenschaften (vgl. Kap. 4.5.2) in Bezug auf die analogen Mazahlen der Grundgesamtheit haben, insbesondere wenn man fur die Verteilung der Grundgesamtheit die Normalverteilung (vgl. Kap. 3.1) voraussetzt. So besitzt das arithmetische Mittel die kleinste Varianz unter allen moglichen Mittelwerten (vgl. Eigenschaft 4 oben) und strebt mit wachsendem Umfang der Stichprobe \am besten\ gegen den unbekannten Mittelwert der Grundgesamtheit. Lat man jedoch die Annahmen der Normalverteilung fallen und setzt beispielsweise eine Laplace-Verteilung (vgl. Kap. 4.5.2) fur die Grundgesamtheit voraus, dann ist der Median als Lageparameter dem arithmetischen Mittel eindeutig vorzuziehen. Normalverteilung und Laplace-Verteilung sind beide symmetrische Verteilungen, unterscheiden sich aber dadurch, da die Laplace-Verteilung \dickschwanziger\ ist, d.h. groere Abweichungen vom Mittelwert sind wahrscheinlicher als bei der Normalverteilung. Nimmt man fur die Grundgesamtheit eine gegenuber der Laplace-Verteilung noch dickschwanzigere Verteilung an, z.B. eine Cauchy-Verteilung (vgl. Kap. 4.5.2), dann kann man zeigen, da das arithmetische Mittel x als Ma der zentralen Tendenz sinnlos wird. Auch in diesem Fall ist es angebracht, den Median als Lageparameter zu verwenden. 1.2 Statistische Mazahlen eindimensionaler Stichproben 35 Neben arithmetischem Mittelwert und Median verwendet man im Rahmen der sog. robusten Statistik weitere Mittelwerte zur Beschreibung und Schatzung der zentralen Tendenz. Diese \robusten\ Mittelwerte versuchen, unabhangig von der Verteilung der zugrundeliegenden Grundgesamtheit, aus der man sich die Stichprobe gezogen denkt, moglichst eziente Schatzungen der zentralen Tendenz zu liefern (vgl. Kap. 4.5.2). Solche Mittelwerte sind z.B. die getrimmten Mittelwerte. Diese werden berechnet, indem man vom oberen und unteren Ende der geordneten Stichprobenwerte jeweils einen bestimmten Prozentsatz der Beobachtungen weglat und das arithmetische Mittel aus den restlichen Beobachtungen errechnet. Fur das 5%-getrimmte Mittel x5% (manchmal sagt man auch gestutztes Mittel) werden also jeweils die 5% groten und kleinsten Werte der Stichprobe abgeschnitten und aus den restlichen 90% der Werte wird das arithmetische Mittel berechnet. Diese getrimmten Mittelwerte haben den Vorteil, robust gegenuber Ausreiern zu sein. Ausreier sind Beobachtungen, die weit entfernt vom uberwiegenden Teil der Beobachtungen liegen, z.B. falsch notierte Werte, also grobe Fehler. Die Identizierung von Ausreiern ist nicht einfach. Ein einziger Ausreier kann aber das arithmetische Mittel als Schatzwert fur den Lageparameter vollig unbrauchbar machen. Der 5%-getrimmte Mittelwert dagegen toleriert 5% Ausreier auf beiden Seiten der Stichprobenwerte. Er verliert andererseits nur wenige Prozent an Ezienz bei der Schatzung des Lageparameters (vgl. Kap. 4.5.2). 1.2.12 Zur Wahl eines Streuungsmaes Anschaulich ist die Streuung einer Verteilung durch die Spannweite R, also die Differenz zwischen groter und kleinster Beobachtung, charakterisierbar. Bei Stichprobenumfangen bis etwa 10 kann man die Spannweite noch gut als Streuungsma im beschreibenden Sinne verwenden. Bei groeren Stichproben sagt die Spannweite aber wenig daruber aus, wie die Einzelwerte um den Mittelwert streuen, weil mit wachsendem n auch die Wahrscheinlichkeit zunimmt, da Ausreier auftreten, die die Spannweite als Streuungsma verzerren. Bei quantitativen Daten verwendet man in der Regel die Standardabweichung s bzw. die Varianz s2 als Streuungsma. In Verbindung mit dem arithmetischen Mittel gibt die Standardabweichung einen brauchbaren U berblick uber die empirische Verteilung der Stichprobe, wenn man Normalverteilung voraussetzt. Die Standardabweichung ist neben dem Mittelwert ein entscheidender Parameter der Normalverteilung. In Kapitel 3.1 wird gezeigt, da rund 68% aller Beobachtungen um hochstens eine Standardabweichung vom Mittelwert nach links oder rechts entfernt und rund 95% aller Beobachtungen um hochstens zwei Standardabweichungen nach links oder rechts vom Mittelwert entfernt liegen. Bei ordinalen Daten, aber auch im Rahmen der explorativen Statistik, verwendet man als Streuungsma den sog. Quartilsabstand. Dieser ist unempndlich gegen Ausreier und stellt daher ein robustes Streuungsma dar. Um den Quartilsabstand zu erklaren, denkt man sich die Stichprobenwerte der Groe nach geordnet und teilt die Daten in etwa gleich groe Gruppen auf. Bei 4 Gruppen gelangt man zu den Quartilen Q1 , Q2 , Q3 . Diese teilen die gesamte Spannweite xmin bis xmax so auf, da vier Gruppen entstehen, welche jeweils 25% der Stichprobenwerte enthalten (Bild 1.15). Als Streuungsma bietet sich dann der Interquartilsabstand Q3 , Q1 an, also der Bereich, in dem die mittleren 50% der Beobachtungen liegen. 36 1 Q1 xmin 25% Beschreibende und explorative Statistik Q2 = Median Q3 Q3 , Q1 - xmax 50% 25% Bild 1.15: Interquartilsabstand Q3 , Q1 als Streuungsma Ein weiteres sehr robustes Streuungsma ist die sog. Median-Abweichung MAD (von engl. median absolute deviation). Man erhalt sie, wenn man in Gleichung (1.6) fur die Berechnung der mittleren absoluten Abweichung jeweils die arithmetische Mittelwertbildung durch den Median ersetzt: MAD = Median (jxi , xej) (1.18) Auch im Bereich (xe , MAD : : : xe + MAD) liegen 50% der Stichprobenwerte. Zum Vergleich: Im Bereich (x , s : : : x + s) liegen ca. 2=3 der Stichprobenwerte. 1.2.13 Schiefe Das Dichtemittel weicht bei quantitativen Daten umso starker vom arithmetischen Mittel ab, je unsymmetrischer eine Verteilung ist. Bild 1.16 zeigt eine solche unsymmetrische Verteilung. Darin sind Weizenblatter auf ihren Befall nach einer Skala von 0 (kein Befall) bis 9 (Totalbefall) bonitiert. 25 24 AAAAAAAA AAAAAAAA AAAAAA AAAA AAAAAAAA AAAAA AAAAAAAA AAAA A AAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAA AAAAAAAA AAAA AA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAA AA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA A AAAA AAAA AAAA AAAA AAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA A A AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA A A AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAA AAAAAAAA A A AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAA A AAAAAAAA AAAA AAAA A AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA A A AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA A A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA A A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA A A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA A AAAA A A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAA A A AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA A AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAA A A AAAAAAAA A AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA A A A AA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A A AAAA AAAAAAAA AAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA A AAAA A AAAA A AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A A AAAA AAAAAAAA AAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA A AAAA A AAAA A AAAA A AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A A AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA A AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAA A AAAA A AAAA A AAAA AAAA AA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A A A AAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA A AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAA A A A AAAAAAAAAAAAAAAA A AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA A AAAA AAAAAAAA AAAAAAAAA A AAAAAAAA A AAAAAAAAAAAA A AAAAAAAA A AAAAAAAAAAAA A AAAAAAAA absolute Häufigkeit 21 20 15 10 15 10 7 5 5 3 3 1 0 0 1 1 2 3 4 5 6 7 8 9 Mehltaubonitur Bild 1.16: Bonitur des Mehltaubefalls von Weizenblattern Der Modus der Verteilung in Bild 1.16 ist xd = 1, das arithmetische Mittel ist x = 3. Der Median xe = 2 liegt zwischen Dichtemittel und arithmetischem Mittelwert und teilt die Verteilung in zwei gleiche Halften. Das arithmetische Mittel ist in diesem Fall das grote Mittel. Man nennt die Verteilung in Bild 1.16 linkssteil, linksschief oder positiv schief. Eine linksschiefe Verteilung ist typisch fur Bonituren, da starke Befalle wesentlich weniger haug auftreten als geringe Befalle. 1.2 Statistische Mazahlen eindimensionaler Stichproben 37 Eine Verteilung wie in Bild 1.14 nennt man rechtssteil, rechtsschief oder negativ schief . Fur die Stichprobe der Schlafdauern in Bild 1.14 ist im Unterschied zur linksschiefen Verteilung von Bild 1.16 das arithmetische Mittel x = 7:0 h der kleinste, der Median xe = 7:2 der mittlere und der Modalwert xd = 7:3 h der grote Lageparameter. Eine extrem linksschiefe Verteilung, deren Modalwert ganz links liegt, wird als LVerteilung bezeichnet. Bild 1.17 zeigt eine L-Verteilung des Betriebseinkommens einer Stichprobe von 25 landwirtschaftlichen Betrieben. absolute Häufigkeit 10 8 6 4 2 0 AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA 00 00 00 00 00 00 00 00 00 00 00 4 00 6 00 8 00 1 0 00 12 00 14 0 0 16 0 0 18 0 0 20 0 0 22 0 0 24 0 0 Reineinkommen [DM] Bild 1.17: Betriebseinkommen Landwirtschaftlicher Betriebe Eine extrem rechtsschiefe mit dem Modalwert rechts auen heit entsprechend JVerteilung. Die Bezeichnungen kommen von der Form der Buchstaben L und J, die annahernd wie solche Verteilungen aussehen. Bei L- und J-Verteilungen sind arithmetisches Mittel x und Modalwert xd keine geeigneten Parameter. Der Median xe ist in diesen Fallen vorzuziehen, da er die Stichprobe in zwei Halften teilt. Aus Bild 1.17 kann man z.B. das arithmetische Mittel nach Gleichung (1.10) zu x = 72800 DM schatzen. In der Klasse dieser Groe liegen jedoch nur zwei Beobachtungen. Auch die Klasse des Modus mit der Klassenmitte von 40000 DM charakterisiert die Einkommensverteilung nicht sehr gut. Es empehlt sich hier die Angabe des mittelsten Betriebs, da dieser Betrieb mindestens genauso viel wie die 12 schlechteren und weniger als die 12 besseren Betriebe erwirtschaftet hat. Dieser Betrieb liegt in der Medianklasse mit der Klassenmitte 60000 DM. Es gibt mehrere Moglichkeiten, die Schiefe einer Verteilung durch eine Mazahl zu charakterisieren. Ein einfaches Ma ist das Pearsonsche Schiefheitsma S1 . Es verwendet die Differenz zwischen arithmetischem Mittel x und Dichtemittel xd bezogen auf die Standardabweichung s, weil die Schiefe einer Verteilung umso weniger auallt, je groer die Streuung einer Stichprobe ist. S1 = x ,s xd (1.19) 38 1 Beschreibende und explorative Statistik Falls x > xd und damit S1 > 0 ist, handelt es sich um eine linksschiefe Verteilung. Falls x < xd und damit S1 < 0 ist, handelt es sich um eine rechtsschiefe Verteilung. Weil in manchen Fallen die Bestimmung des Dichtemittels nicht einfach bzw. auch nicht eindeutig ist, verwendet ein anderes Schiefema S2 die dreifache Dierenz zwischen arithmetischem Mittel x und Median xe, ebenfalls bezogen auf die Standardabweichung s. S2 = 3 (xs, xe) (1.20) Auch hier gilt: Falls x > xd und damit S2 > 0 ist, ist die Verteilung linksschief, im umgekehrten Fall (S2 < 0) rechtsschief. Am haugsten verwendet man jedoch als Schiefema das sog. 3. Moment bezuglich n X des Mittelwerts x, also M3 = n1 (xi , x)3 ), bezogen auf die dritte Potenz der Standardabweichung s: i=1 n X (xi , x)3 M S3 = s33 = i=1 n s3 (1.21) Auch S3 nimmt fur linksschiefe Verteilungen positive und fur rechtsschiefe Verteilungen negative Werte an. Beispiele: 1. Die Haugkeitsverteilung der Stichprobe mit den Ferkelzahlen in Bild 1.3 ist relativ symmetrisch. Deshalb liegen alle Schiefheitsmae in der Umgebung von 0: , 10 = 0:009 S1 = 10:202:197 , 10) = 0:027 S2 = 3 (102::02 197 183 : 321 S3 = 100 2:1973 = 0:173 2. Die Haugkeitsverteilung der Stichprobe der Milchleistungen aus Tab. 1.8 ist ebenfalls relativ symmetrisch. Da der Modus je nach Klasseneinteilung dieriert, werden nur die Schiefheitsmae S2 und S3 berechnet. Diese liegen naturlich auch in der Umgebung von 0: :7 , 5231:5) = ,0:196 S2 = 3 (5188655 :4 , 1130173824 S3 = 100 655:43 = ,0:040 1.2 Statistische Mazahlen eindimensionaler Stichproben 39 3. Die Verteilung der Bonituren in Bild 1.16 ist oensichtlich linksschief. Dies druckt sich auch in den Schiefheitsmaen aus, die alle sehr viel groer als 0 sind: 1 S1 = 23:, 033 = 0:984 , 2) = 1:476 S2 = 3 2(3:033 S3 = 90 744 2:0333 = 0:984 4. Die Verteilung der Schlafzeiten in Bild 1.14 ist oensichtlich rechtsschief. 7:33 = ,0:259 S1 = 7:021:, 196 3 (7 :02 , 7:20) = ,0:452 S2 = 1:196 , 357 746 = ,1:394 S3 = 150 1::196 3 In diesem Fall gibt das Schiefheitsma S3 die Rechtssteilheit am besten wieder. 1.2.14 Kurtosis oder Exze Symmetrische Haugkeitsverteilungen von Stichproben haben in vielen Fallen eine annahernd glockenformige Gestalt, die man durch eine sog. Gausche Glockenkurve approximieren kann (vgl. Kap. 3.1). Das Histogramm der Ferkelzahlen in Bild 1.3 besitzt z.B. eine solche Form. Andere Verteilungen sind jedoch wesentlich spitzer. Bild 1.18 zeigt eine solche steilgipige Verteilung von Ferkelzahlen. 35 31 absolute Häufigkeit 30 25 20 15 10 5 0 AAAA AAAAAA AAAAAAAA AA AAAA AAAA AAAAAA AAAAAAAA AA AAAA AA AAAAAAAA AA AAAAAA AAAA AAAA AAAA AAAAAA AAAAAAAA AA AAAA AAAAAA AAAAAAAA AA AAAA AAAA AAAAAAAAAA AA AAAA AA AAAA AAAA AAAAAA AAAAAAAA AA AAAA AAAAAA AAAAAAAA AA AAAA AAAAAA AAAA AAAAAA AAAAAAAA AA AAAA AAAAAAAA AA AAAA AA AAAA AAAA AA AAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AA AAAA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAA AA AAAA AA AAAA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAA AA AAAA AA AAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AA AAAA AAAA AAAA AA AAAA AAAA AAAA AAAA AA AAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAA AAAAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAAAAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AA AAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AA AA AA 22 19 10 8 3 0 1 1 4 5 6 7 3 8 9 10 11 12 13 1 0 1 14 15 16 Ferkelzahl Bild 1.18: Steilgipige Verteilung mit positiver Kurtosis Im umgekehrten Fall kann die Verteilung auch breiter als eine Glockenkurve sein. Bild 1.19 zeigt eine extrem achgipige Verteilung von Ferkelzahlen. 40 1 Beschreibende und explorative Statistik 35 absolute Häufigkeit 30 25 20 15 10 5 0 17 16 16 AAAA AAAAAA AAAAAAAA AA AAAAAAAAAA AAAAAA AAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AA AAAAAAAAAA AAAA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AAAAAA AAAAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAA AA AAAAAAAAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAAAAAAAA AAAA AAAA AAAA AAAA AA AAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAA AAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAAAAAAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAA AAAAAA AA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAA AAAA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AA AAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AA 14 12 0 0 0 4 5 6 7 14 11 8 9 10 11 12 13 0 0 0 14 15 16 Ferkelzahl Bild 1.19: Flachgipige Verteilung mit negativer Kurtosis Man verwendet zum Vergleich einigermaen symmetrischer Verteilungen, die annahernd gleiche Streuung, aber unterschiedliche Wolbung besitzen, die Kurtosis oder den Exze. Die Wolbung wird im wesentlichen erfat durch das auf x bezogene Moment 4. n X 1 Ordnung M4 = n (xi , x)4 , dividiert durch s4 . Da fur die wichtige standardisierte i=1 Normalverteilung mit glockenformiger Gestalt (vgl. Kap. 3.1) diese Groe den Wert 3 hat, wahlt man als Kurtosis K einer Verteilung den Wert von Ms44 , 3, also die Dierenz: n X (xi , x)4 K = i=1 n s4 ,3 (1.22) Die Kurtosis hangt vom Moment M4 sowie der Standardabweichung s ab. Wenn z.B. eine Verteilung eine positive Kurtosis hat, so heit das in etwa, da die Anzahl \groerer\ Abweichungen von x groer ist als bei einer Gauschen Glockenkurve mit gleicher Streuung. Die Verteilung wird also eine spitzere Form aufweisen (Bild 1.18). Ganz analog wird im Falle einer negativen Kurtosis diese Verteilung eine stumpfere Form haben (Bild 1.19). Beispiel: Die Stichproben mit den Ferkelzahlen in den Bildern 1.3, 1.18 und 1.19 haben alle den Mittelwert x = 10:02 und ungefahr die gleiche Standardabweichung. Die Kurtosis ist: :2 Bild 1.3 : K = 1007122 2:1974 , 3 = 0:057 :3 Bild 1.18 : K = 1003240 1:6204 , 3 = 1:705 :4 , 3 = ,1:337 Bild 1.19 : K = 1002661 2:0004 1.3 Beschreibung zweidimensionaler Stichproben 41 1.3 Beschreibung zweidimensionaler Stichproben Es werden im folgenden zwei Merkmale X und Y betrachtet. Das Merkmal X soll mit den Auspragungen x1 ; x2 ; : : : xm , das Merkmal Y mit den Auspragungen y1 ; y2 ; : : : yn vorkommen. Zugelassen sind nominale, ordinale und quantitative Auspragungen, die auch schon klassiziert sein konnen. Die Urliste einer zweidimensionalen Stichprobe zeigt z.B. Tab. 1.2. 1.3.1 Haugkeitsverteilungen Das allgemeine Schema einer zweidimensionalen Haugkeitsverteilung zeigt Tab. 1.15. x1 x2 y1 y2 : : : yj : : : yl R:H: n11 n12 : : : n1j : : : n1l n1: n21 n22 : : : n2j : : : n2l n2: xi ni1 ni2 : : : nij : : : nil xk nk1 nk2 : : : nkj : : : nkl nk: .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . ni: .. . R:H: n:1 n:2 : : : n:j : : : n:l n Tabelle 1.15: Zweidimensionale Haugkeitsverteilung als Kontingenztafel Eine solche Tabelle wird auch als Kontingenztafel bezeichnet. Die xi bzw. yi konnen im Falle quantitativer Daten diskrete Werte sein oder im Falle einer gruppierten Verteilung auch Klassenmitten. nij gibt die absolute Haugkeit fur das Auftreten von Elementen mit der Auspragung xi bzgl. des x-Merkmals und mit der Auspragung yi bzgl. des y-Merkmals an. Interessiert nur die Verteilung der Merkmalswerte eines Merkmals, so braucht man die sog. Randhaugkeiten R.H. oder Randverteilungen. Will man wissen, wie die x-Werte sich verteilen ohne Rucksicht auf die y-Werte, dann mu man in der obigen Haugkeitstafel die Zeilensummen bilden und erhalt die Randverteilung bezuglich x: ni: = Xl j =1 nij (i = 1; 2; : : : ; k) (1.23) Die Randverteilung von y ergibt sich aus den Spaltensummen: n:j = k X i=1 nij (j = 1; 2; : : :; l) (1.24) 42 1 Beschreibende und explorative Statistik Beispiel: Tab. 1.16 zeigt die Kontingenztafel fur die Anzahl der betriebseigenen Schlepper aufgeteilt nach Betriebs- und Schlepperleistungsklassen einer landwirtschaftlichen Region. Betriebsgroe [ha] < 30 30 , 50 50 , 70 > 70 R:H: Schlepperleistung [kW] < 30 30 , 50 50 , 70 70 , 90 > 90 R:H: 6 6 8 16 5 2 44 29 29 75 7 25 5 37 16 67 60 7 150 1 2 3 Tabelle 1.16: Kontingenztafel der Anzahl betriebseigener Schlepper aufgeteilt nach Betriebsgroen- und Schlepperleistungsklassen 30 25 15 60 10 40 5 0 [k 80 W ] >90 20 Sc hl ep pe rle ist un g absolute Häufigkeit Die zweidimensionale Haugkeitsverteilung der Kontingenztafel in Tab. 1.16 zeigt Bild 1.20. <30 <30 40 60 Betriebsgröße [ha] >70 Bild 1.20: Zweidimensionale Haugkeitsverteilung der Anzahl betriebseigener Schlepper aufgeteilt nach Betriebsgroen- und Schlepperleistungsklassen Die Haugkeiten konnen absolut (mit nij bezeichnet) oder relativ (mit hij bezeichnet) angegeben sein. Bei einer relativen Haugkeitsverteilung konnen jedoch die einzelnen Haugkeiten hij auf verschiedene Summen bezogen sein. Man kann sie erstens auf die Spaltensummen, zweitens auf die Zeilensummen und drittens auf die gesamte Anzahl n von untersuchten Elementen beziehen. Beispiel: Die Moglichkeiten zur Darstellung der relativen Haugkeiten am Beispiel der Schlepper in Tab. 1.16 zeigen die Tab. 1.17 { 1.19. 1.3 Beschreibung zweidimensionaler Stichproben 43 In Tab. 1.17 sind die Schlepperzahlen auf die Spaltensummen bezogen. Sie zeigt, wie sich Schlepper einer bestimmten Leistungsklasse auf einzelne Groenklassen der Betriebe verteilen. BetriebsSchlepperleistung [kW] groe [ha] < 30 30 , 50 50 , 70 70 , 90 > 90 < 30 100:0 27:6 2:7 30 , 50 55:2 58:7 18:9 50 , 70 17:2 38:7 67:6 33:3 > 70 13:5 66:7 100 100 100 100 100 Tabelle 1.17: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die Randhaugkeiten der Spalten In Tab. 1.18 sind die Schlepperzahlen auf die Zeilensummen bezogen. Sie zeigt, wie sich eine bestimmte Betriebsgroenklasse bei der Auswahl der Leistung ihres Schleppers verhalt. Betriebsgroe [ha] < 30 30 , 50 50 , 70 > 70 Schlepperleistung [kW] < 30 30 , 50 50 , 70 70 , 90 > 90 37:5 50:0 12:5 23:9 65:7 10:5 8:3 48:3 41:7 1:7 71:4 28:6 100 100 100 100 Tabelle 1.18: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die Randhaugkeiten der Zeilen Tab. 1.19 bezieht alle Schlepper in den einzelnen Gruppen auf die Gesamtzahl der untersuchten Schlepper und stellt die eigentliche zweidimensionale Verteilung dar, die Verteilung der Schlepper in Abhangigkeit von den Leistungsklassen und den Betriebsgroenklassen. Betriebsgroe [ha] < 30 30 , 50 50 , 70 > 70 Schlepperleistung [kW] < 30 30 , 50 50 , 70 70 , 90 > 90 4:0 5:3 1:3 10:7 10:7 29:3 4:7 44:7 3:3 19:3 16:7 0:7 40:0 3:3 1:3 4:7 4:0 19:3 49:9 24:7 2:0 100 Tabelle 1.19: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die Gesamtzahl der Schlepper 44 1 Beschreibende und explorative Statistik Es stellt sich die Frage, nach welcher Richtung (horizontal oder vertikal, d.h. Zeilensummen oder Spaltensummen als Bezugsbasis) man die absoluten Haugkeiten prozentuieren soll. Wenn man in einer solchen Kreuztabellierung zwei Merkmale oder zwei \Faktoren\ zusammenbringt und man eindeutig einen Faktor als Ursache und den anderen als Wirkung betrachten kann, so ist es sinnvoll, in der Richtung des Ursachenfaktors zu prozentuieren. Wenn die Stichprobe, aus der die Kreuztabelle errechnet wird, jedoch nicht \reprasentativ\ 1 ist, ist stets groe Vorsicht geboten, eine UrsacheWirkungs-Relation auf eine Grundgesamtheit zu verallgemeinern. Zwei Merkmale oder Faktoren mussen auch nicht immer in einem direkten Ursache-Wirkungs-Verhaltnis stehen. Sehr haug sind jedoch auch Merkmale in einer zweidimensionalen Haugkeitsverteilung miteinander verknupft, bei denen keine eindeutige Wirkungsrichtung von einem Merkmal auf das andere festzustellen ist. So hangen z.B. die Merkmale Brustumfang und Kreuzhohe beim Rind voneinander ab (sie sind miteinander korreliert), ohne da man sagen konnte, die eine Variable ist Kausalursache fur die andere. Der Zusammenhang zwischen zwei solchen Merkmalen ist wechselseitig. Fur das Folgende wird unterstellt, da eine zufallige Stichprobe zugrundeliegt. Daraus wird eine zweidimensionale, empirische Haugkeitsverteilung aufgestellt. In der Regel wird dabei von der absoluten Haugkeitsverteilung ausgegangen. 1.3.2 Zusammenhang zweier Merkmale In vielen Fallen kann man aus der Haugkeitsverteilung einer zweidimensionalen Stichprobe auf einen Zusammenhang zwischen zwei Merkmalen schlieen (Bild 1.21). 80 Relative Häufigkeit [%] 70 60 50 40 30 20 10 0 AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA <30 kW 30-50 kW 50-70 kW 70-90 kW >90 kW AAAAA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AAAAA AA AAA AA AAAAAA AAAAAA <30 ha AAAAAA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAAAA AAAA AAAAA AAAA AAAAAA AAAA AAAAAA AAAA AA AAAAAAAAAA AAAA A 30-50 ha AAAAAA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAAAA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAA AA AA 50-70 ha AAAAAA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AAAAAA AA AAAA AA AAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAA AAAAAA AAAAAA AA AAAA AAAAAAAAAA AAAAAA AA AAAA AA AA >70 ha Betriebsgröße Bild 1.21: Relative Haugkeitsverteilung der Schlepperleistung von Tab. 1.16 getrennt nach Betriebsgroen 1 Man benutzt gelegentlich nur eine Teilmenge aus einer endlichen Grundgesamtheit und zieht die Stichprobe dann aus dieser Teilmenge. In der Regel zeigt diese Teilmenge eine ahnliche Struktur wie die Grundgesamtheit. Man nimmt daher an, da die Stichprobe reprasentativ ist bzgl. der Grundgesamtheit. Damit man diese Teilmenge aus einer endlichen Grundgesamtheit richtig auswahlt, mu man jedoch die Struktur der Grundgesamtheit gut kennen. 1.3 Beschreibung zweidimensionaler Stichproben 45 Aus den Tabellen 1.17 , 1.19 wird deutlich, da in groeren Betrieben tendenziell auch Schlepper mit hoheren Leistungen vorkommen. Dies ist auch oensichtlich, wenn die relativen Haugkeiten der Schlepperleistungsklassen innerhalb der jeweiligen Betriebsgroe fur jede Betriebsgroe getrennt aufgetragen werden (Bild 1.21). Dies entspricht den Werten in Tab. 1.18. Die relativen Haugkeiten innerhalb einer Betriebsgroenklasse addieren sich zu 100%. Diese Abhangigkeit zweier Merkmale kann man in einem zweidimensionalen Streudiagramm oder engl. Scatter Plot darstellen. Dabei tragt man die Mewerte jedes Objekts gegeneinander auf. Beispiel: Bild 1.22 zeigt das Streudiagramm von Betriebsgroe und Schlepperleistung der ursprunglichen Stichprobenwerte von Tab. 1.16. 100 Schlepperleistung [kW] 90 80 70 60 50 40 30 20 10 20 30 40 50 60 70 80 Betriebsgröße [ha] Bild 1.22: Streudiagramm von Betriebsgroe und Schlepperleistung Es existiert oensichtlich eine positive lineare Abhangigkeit der beiden Merkmale. Der Zusammenhang ist jedoch nicht exakt linear, da die Mewerte mehr oder weniger um eine Gerade streuen. Bild 1.23 zeigt vier verschiedene zweidimensionale Streudiagramme. In Bild 1.23 a) ist der Zusammenhang zwischen den beiden Merkmalen streng linear, d.h. die Beobachtungen liegen exakt auf einer Geraden. Ein linearer Zusammenhang kann auch in Bild 1.23 b) angenommen werden, allerdings streuen die Werte in gewissem Umfang um eine Gerade. Bei Bild 1.23 c) existiert kein Zusammenhang zwischen den Merkmalen. Die Beziehung ist mehr oder weniger zufallig. Schlielich ist in Bild 1.23 d) durchaus ein Zusammenhang zwischen den Merkmalen abzuleiten, allerdings ist dieser oensichtlich nicht linear. 46 1 a) Beschreibende und explorative Statistik b) r = ,1 r = 0:62 c) r=0 d) (r = 0:91) Bild 1.23: Streudiagramme zweier Merkmale mit verschiedenen Korrelationen Eine Quantizierung der Starke des linearen Zusammenhangs zweier Merkmale ist mit der Korrelationsanalyse moglich. Dabei wird untersucht, ob zwei Merkmale voneinander linear abhangig, d.h. korreliert, oder linear unabhangig, also unkorreliert, sind2 . Ein Ma fur die Starke des linearen Zusammenhangs soll weder vom Nullpunkt der Meskalen noch von den Maeinheiten der Merkmale X und Y abhangen. Aus diesem Grund werden die Variablen X und Y auf den Mittelwert 0 und die Standardabweichung 1 skaliert. Die Skalierung auf den Mittelwert 0 erfolgt durch die Bildung der Dierenz der Stichprobenwerte xi bzw. yi minus den Mittelwerten x bzw. y. Haben die Dierenzen xi , x und yi , y das gleiche Vorzeichen, so deutet dies auf einen positiven Zusammenhang hin. Ein negativer Zusammenhang wird durch verschiedene Vorzeichen der Dierenzen angezeigt. 2 Es erfolgt hier lediglich eine kurze Einf uhrung in die Korrelationsanalyse. Eine umfassende Behandlung beinhaltet Band 2. 1.3 Beschreibung zweidimensionaler Stichproben 47 Die Summe SPxy = n X i=1 (xi , x)(yi , y) (1.25) heit Summe der Abweichungsprodukte in Analogie zur Summe der Abwei- chungsquadrate SQx = n X n X i=1 i=1 (xi , x)2 bzw. SQy = (yi , y)2 : (1.26) Die Groe n X 1 sxy = n , 1 (xi , x)(yi , y) = n ,1 1 SPxy i=1 (1.27) heit Kovarianz zwischen X und Y . Dividiert man die Dierenzen xi , x und yi , y durch die jeweilige Standardabweichung sx bzw. sy , so erhalt man die transformierten Variablen U und V , die den Mittelwert 0 und die Standardabweichung 1 haben: ui = xis, x ; x vi = yis, y y (1.28) Der lineare Zusammenhang zwischen X und Y ist jetzt umso groer, je ausgepragter die Tendenz ist, da U und V entweder gleiches Vorzeichen oder ungleiches Vorzeichen haben. Im ersten Fall spricht man von positivem linearen Zusammenhang bzw. positiver Korrelation, im zweiten Fall von negativem linearen Zusammenhang bzw. negativer Korrelation. Das Produkt ui vi ist ein einfaches Ma fur die Tendenz bzw. den linearen Zusammenhang zwischen xi und yi . Ein Ma fur den linearen Zusammenhang der ganzen Stichprobe ist das Mittel der einzelnen Betrage, wobei in Analogie zur Berechnung der Varianz nach Gleichung (1.7) anstatt durch n wieder durch n , 1 dividiert wird: n n x ,x y ,y X X 1 1 i rxy = n , 1 ui vi = n , 1 is s y i=1 i=1 x (1.29) rxy ist der empirische Korrelationskoezient zwischen X und Y . Dieser kann nach Gleichung (1.28), (1.25) und (1.29) auch ausgedruckt werden als: r = rxy = s sxy = p SPxy s SQx SQy x y (1.30) 48 1 Beschreibende und explorative Statistik Der Korrelationskoezient r kann Werte zwischen ,1 und +1 annehmen. Unkorrelierte Daten haben einen Korrelationskoezienten von r = 0 oder nahe 0 (Bild 1.23 c). Fur jrj = 1 liegen die (xi ; yi )-Werte im Streudiagramm exakt auf einer Geraden (Bild 1.23 a). Fur jrj < 1 streuen die Punkte mehr oder weniger um eine Ausgleichsgerade Der Datensatz in Bild 1.23 b) ist korreliert mit einem Koezienten von r = 0:62. Eine positive Steigung dieser Geraden liegt vor, wenn r > 0 ist (Bild 1.23 b). Die Steigung ist negativ fur r < 0 (Bild 1.23 a). Je groer r dem Betrag nach ist, desto geringer ist die Streuung um diese Ausgleichsgerade. Fur die Stichprobe in Bild 1.23 d) berechnet sich rein formal ein Korrelationskoezient von r = 0:91. Dieser ist jedoch nicht interpretierbar, da der Zusammenhang nicht linear ist. Beispiele: 1. Fur den Spezialfall xi = yi fur alle Stichprobenwerte liegt eine extreme lineare Abhangigkeit vor. Die Korrelation ist rxy = 1, denn es gilt: SPxy = n X i=1 (xi , x) (yi , y) = n X n X i=1 i=1 (xi , x)2 = SQx = (yi , y)2 = SQy Also folgt nach Gleichung (1.30) fur r: SPxy = p SPxy =1 rxy = pSQ SPxy SPxy x SQy 2. Wenn die Punkte exakt auf einer beliebigen Geraden yi = y0 + m xi liegen, dann ist yi , y = m (xi , x) und es gilt nach Gleichung (1.27): n n X X sxy = n ,1 1 (xi , x) (yi , y) = n ,1 1 m (xi , x)2 = m s2x i=1 i=1 2 2 2 Auerdem gilt sy = m sx . Der Korrelationskoezient ist deshalb: s2x = m rxy = s m x jmj sx jmj Fur m > 0 ist rxy = 1 und fur m < 0 ist rxy = ,1. Ein Koezient bei einer Geraden mit der Steigung m = 0 ist nicht deniert. 3. Der Korrelationskoezient zwischen der Betriebsgroe und der Schlepperleistung in Bild 1.22 ist r = 0:78. 1.3 Beschreibung zweidimensionaler Stichproben 49 Zur Berechnung von r per Hand empehlt es sich, folgende Berechnungsformel zu verwenden, welche analog zur Berechnungsformel (1.9) fur die empirische Varianz hergeleitet werden kann: n X (xi , x) (yi , y) SP xy i =1 v r = p = p =vn u n SQx SQy u X X u u t (xi , x)2 t (yi , y)2 i=1 = i=1 n ! X n ! n X X 1 xi yi xi yi , n i =1 i =1 i =1 v !2 v u u n n n n !2 u u X X X X 1 1 t x2i , xi t yi2 , yi i=1 n i=1 n i=1 (1.31) i=1 Es sind also folgende Summen mit einem Taschenrechner auszurechnen: X X xi , x2i , X X2X yi , yi , xi yi An dieser Stelle sei nochmals an die Tatsache erinnert, da bei einer Programmierung von Gleichung (1.31) die Gefahr von \Stellenausloschung\ und damit groer Rundungsfehler im Computer besteht, falls die beiden Ausdrucke im Zahler nahezu gleich gro sind. Beispiel: Die folgende Tabelle zeigt die Baumhohe und den Stammdurchmesser von sechs Kastanienbaumen. 12:3 10:1 5:4 2:6 14:1 7:3 Baumhohe [m] Stammdurchmesser [cm] 31:9 30:2 15:7 10:0 40:9 23:1 Der Korrelationskoezient wird nach Gleichung (1.31) bestimmt: i 1 2 3 4 5 6 P xi yi 12:3 31:9 10:1 30:2 5:4 15:7 2:6 10:0 14:1 40:9 7:3 23:1 51:8 151:8 x2i yi2 xi yi 151:29 1017:61 392:37 102:01 912:04 305:02 29:16 246:49 84:78 6:76 100:00 26:00 198:81 1672:81 576:69 53:29 533:61 168:63 541:32 4482:56 1553:49 1553:49 , 51p:8 151:8=6 = 0:98836 0:99 541:32 , 51:82=6 4482:56 , 151:82=6 r=p 50 1 Beschreibende und explorative Statistik 1.4 Beschreibung mehrdimensionaler Stichproben Werden mehrere Merkmale fur eine Beobachtung gemessen, so erhalt man multivariate Daten. In Tab. 1.20 liegt z.B. eine Stichprobe von 20 Getreidesorten uber die Merkmale Ertrag, Tausendkorngewicht, Kornzahl pro A hre und Panzen pro Quadratmeter vor. Ertrag [dt/ha] 76:0 69:5 65:0 73:0 69:1 78:5 72:3 68:7 75:7 74:1 64:2 67:2 65:6 79:1 74:7 60:8 71:8 64:8 64:5 63:4 TKG [g] 46:7 54:9 56:0 46:8 47:6 47:1 48:6 46:8 41:3 40:5 52:9 49:6 52:0 45:5 49:5 54:6 50:7 52:1 51:5 57:5 Kornzahl/A hre Panzen/m2 43 427 34 430 37 364 44 403 43 386 44 426 38 445 46 366 41 497 41 499 35 407 42 373 38 384 44 450 41 411 37 352 40 399 39 369 45 322 38 343 Tabelle 1.20: Ertragsmerkmale von 20 Getreidesorten Allgemein heit ein Schema der Art x11 x12 : : : x1j : : : x1m x21 x22 : : : x2j : : : x2m .. .. .. .. . .. .. .. .. . ... .. . x.ij .. . . . .. .. .. .. . xn1 xn2 : : : xnj : : : xnm eine Datenmatrix, wobei xij der Wert des j -ten Merkmals bzw. der j -ten Variablen fur die i-te Beobachtung ist. Man sagt in diesem Fall, da die Daten die Dimension m haben. Eine Datenmatrix ist auch die grundlegende Struktur fur die Eingabe von Daten in Statiskikprogrammen auf Computern. In Tab. 1.20 stehen die Daten jeder Sorte in den n = 20 Matrixzeilen, die Werte der einzelnen Merkmale stehen in den Spalten der Datenmatrix. Die Dimension der Daten betragt also m = 4. 1.4 Beschreibung mehrdimensionaler Stichproben 51 1.4.1 Haugkeitsverteilungen Ein Haugkeitsverteilung fur Datensatze mit einer Dimension von m 3 ist anschaulich nicht mehr moglich, da mindestens 4 Dimensionen zur Darstellung benotigt werden. Man mu sich auf die Haugkeitsverteilungen der Einzelmerkmale beschranken. Bild 1.24 zeigt die Histogramme jedes einzelnen Merkmals der Tab. 1.20. 30 20 10 0 40 AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 60 65 70 75 relative Häufigkeit [%] relative Häufigkeit [%] 40 30 20 10 0 80 AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 40 Ertrag [dt/ha] 10 0 30 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA 35.0 37.5 40.0 Körner/Ähre 42.5 45.0 relative Häufigkeit [%] relative Häufigkeit [%] 30 20 45 50 55 60 Tausendkorngewicht [g] 20 10 0 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAA AAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAA AAAA AAAA AAAA AAAA AAAAAAAAAAAAAAAAAAAAAAAA 300 350 400 450 500 Pflanzen/m2 Bild 1.24: Histogramme der Ertragsmerkmale von 20 Getreidesorten 1.4.2 Streumatrizen Streudiagramme wie bei zweidimensionalen Datensatzen sind fur hohere Dimensionen ebenfalls nicht mehr anschaulich darstellbar. Man tragt deshalb die Streudiagramme fur jeweils zwei Merkmale in einer Streumatrix oder einer Scatter-Plot-Matrix auf. Bild 1.25 zeigt die Streumatrix der Ertragsmerkmale von Tab. 1.20. Das Merkmal Ertrag ist in der ersten Zeile der Streumatrix von Bild 1.25 als Ordinate und in der ersten Spalte als Abszisse abgetragen. In der zweiten Zeile bzw. Spalte ist die Ordinate bzw. Abszisse das Tausendkorngewicht. Entsprechendes gilt fur die dritte und vierte Zeile bzw. Spalte fur die Merkmale Kornzahl/A hre und Panzen/m2. Es gibt nun fur jedes Merkmal das Streudiagramm in Bezug auf alle anderen Merkmale. Bei den Darstellungen gegenuber der Diagonalen, ist lediglich Abszisse und Ordinate vertauscht. Die Abbildungen sind also aquivalent. Es existiert oensichtlich ein negativer linearer Zusammenhang zwischen Tausendkorngewicht und Kornzahl pro A hre 52 1 74.525 Beschreibende und explorative Statistik Ertrag 65.375 53.25 TKG 44.75 43 Ko/Aehre 37 454.75 Pfl/m2 366.25 65 .37 5 74 .5 2 5 44 .75 53 .25 37 43 36 6.2 5 45 4.7 5 Bild 1.25: Streumatrix der Ertragsmerkmale von 20 Getreidesorten sowie Panzen pro Quadratmeter. Eine Korrelation zwischen Kornzahl pro A hre und Panzen pro Quadratmeter ist nicht erkennbar. Zwischen Ertrag und Panzen pro Quadratmeter besteht eine deutlich positive Korrelation. Die positive Beziehung zwischen Ertrag und Kornzahl pro A hre ist weniger stark ausgepragt. Auf den ersten Blick uberrascht die negative Beziehung zwischen Ertrag und Tausendkorngewicht. Betrachtet man jedoch die negative Korrelation des Tausendkorngewichts mit den anderen beiden ertragsbildenden Merkmalen, dann ist klar, da bei geringen Tausendkorngewichten die Ertragsbildung im wesentlichen uber die Kornzahl pro A hre und die Panzen pro Quadratmeter erfolgt. 1.4.3 Zusammenhang mehrerer Merkmale Die Streumatrix ist die graphische Variante einer Zusammenstellung der einfachen Korrelationen zwischen den beobachteten Merkmalen. Die Korrelationsmatrix ist ein Schema, das die Korrelationskoezienten zwischen jeder Variable enthalt. Fur die Merkmale in Tab. 1.20 bzw. die Streumatrix in Bild 1.25 lautet die Korrelationsmatrix: 1:000 ,0:756 0:484 0:764 1:000 ,0:617 ,0:738 0:484 ,0:617 1:000 0:004 0:764 ,0:738 0:004 1:000 ,0:756 Jedes Merkmal mit sich selbst ist naturlich zu r = 1 korreliert. Auerdem sind Koezienten oberhalb der Diagonalen identisch mit Koezienten unterhalb davon. Infolgedessen kann die Korrelationsmatrix zum Dreiecksschema in Tab. 1.21 vereinfacht werden: Die Korrelationsmatrix in Tab. 1.21 bestatigt die Schlufolgerungen aus der Streumatrix in Bild 1.25 und gibt daruberhinaus quantitative Mae fur den linearen Zusammenhang der Merkmale an. 1.4 Beschreibung mehrdimensionaler Stichproben TKG [g] Kornzahl/A hre Panzen/m2 Ertrag [dt/ha] ,0:756 0:484 0:764 53 TKG [g] Kornzahl/A hre ,0:617 ,0:738 0:004 Tabelle 1.21: Korrelationsmatrix fur die Ertragsmerkmale in Tab. 1.20 1.4.4 Sterndiagramme Mit Sterndiagrammen konnen im Prinzip beliebig viele Variablen dargestellt werden. Die Merkmale werden als Strahlen in verschiedene Richtungen der Ebene interpretiert. Die Lange der Strahlen entspricht der Groe der Merkmalswerte. Da die Merkmalswerte als Lange von Strahlen dargestellt werden, mussen sie alle positiv und etwa von gleicher Groe sein. Aus diesem Grund werden die Werte jeder Variablen auf das Intervall [c; 1] skaliert, wobei c das Verhaltnis der Langen des kleinsten und groten Strahls ist. Bezeichnet xij den i-ten Mewert der j -ten Variable, dann ist die skalierte Variable xij : j (xij ) xij = (1 , c) maxxij(x, )min , min (x ) + c j ij j ij (1.32) Wurden m Variablen gemessen, so wahlt man m Strahlen, die in m Richtungen der Zeichenebene zeigen. Der Winkel zwischen allen Strahlen ist gleich, also = 360=m. Fur jedes beobachtete Objekt i wird ein Stern mit m Strahlen gezeichnet, deren Lange den skalierten Merkmalswerten xij proportional ist. Bild 1.26 zeigt das Sterndiagramm fur die Ertragsmerkmale von Tab. 1.20. Bild 1.26: Sterndiagramm der Ertragsmerkmale aus Tab. 1.20 54 1 Beschreibende und explorative Statistik Jedes Merkmal wird in Bild 1.26 durch einen Strahl in vier verschiedene Richtungen dargestellt. Der Winkel zwischen den Strahlen ist = 360=4 = 90. Die Richtung ist im Diagramm oben rechts fur die einzelnen Variablen angegeben. Je langer ein Strahl innerhalb einer Variablen ist, desto groer ist der gemessene Stichprobenwert der Variablen. Sterndiagramme ermoglichen einen schnellen U berblick uber Objekte, die in mehreren oder allen Merkmalen sehr groe oder sehr kleine Werte besitzen. Sorte 9 bringt beispielsweise einen hohen Ertrag, der v.a. durch die Ertragskomponenten Panzen pro Quadratmeter und Kornzahl pro A hre bei geringem Tausendkorngewicht zustande kommt, wahrend bei Sorte 1 alle ertragsbestimmenden Komponenten an der Ertragsbildung beteiligt sind. Daruberhinaus kann man auch bestimmte Gruppen erkennen, bei denen der Ertrag auf ahnliche Weise gebildet wird. Sorte 1, 6 und 14 haben bei hohem Ertrag auch hohe Werte in allen drei ertragsbildenden Komponenten. Alle Sorten, die lediglich hohe Tausendkorngewichte aufweisen, wie z.B. 3, 11, 16 und 20, erreichen nicht annahernd die Ertrage mit hohen Werten der beiden anderen Komponenten. Daraus kann man schlieen, da die Ertragshohe vorwiegend durch die Komponenten Panzen pro Quadratmeter und Kornzahl pro A hre beeinut wird. 1.5 Explorative Statistik 55 1.5 Explorative Statistik In den letzten Jahren fanden sog. explorative Methoden im Vorfeld einer statistischen Analyse immer mehr Verbreitung. Diese Methoden gehen uber die bisher dargestellten Verfahren der beschreibenden Statistik hinaus und versuchen, vor allem mit graphischen Hilfsmitteln die Daten augenfallig und pragnant zu beschreiben und Besonderheiten bzw. Aualligkeiten einer Stichprobe deutlicher darzustellen, als dies mit den klassischen Mitteln der beschreibenden Statistik moglich ist. Daruberhinaus kann man bei der Erforschung und der Suche nach Zusammenhangen zwischen verschiedenen Merkmalen unabhangig von restriktiven Verteilungsannahmen vorgehen. Explorative Methoden werden in diesem Zusammenhang auch als hypothesenerzeugende Methoden bezeichnet, im Gegensatz zu den hypothesenbestatigenden Methoden der Inferenzstatistik. Die Vielfalt der explorativen Methoden, kurz EDA-Verfahren genannt (Exploratory Data Analysis), geht auf Tukey zuruck, der 1977 in seinem Buch \Exploratory Data Analysis\ eine groe Anzahl solcher Methoden erstmals umfassend vorstellte. Hier sollen einige ausgewahlte Methoden als Erganzung des bisher gebrachten Instrumentariums vorgestellt werden. 1.5.1 Stem-and-Leaf-Diagramme Stem-and-Leaf-Diagramme oder Stamm-und-Blatt-Diagramme geben ahnlich wie Histogramme die Haugkeitsverteilung einer Reihe von Beobachtungswerten wieder. Allerdings gehen die numerischen Werte in individueller, augenfalliger Weise in das Diagramm ein. Die Konstruktion eines Stem-and-Leaf-Diagramms wird anhand einer Stichprobe uber das Gewicht von 25 Versuchspersonen in Bild 1.27 erlautert. Die Merkmalswerte werden unter Berucksichtigung eines Mastabfaktors und eventueller Rundung auf zwei fuhrende Ziern transformiert. Die erste Zier stellt die Stem-Zier, die zweite die Leaf-Zier dar. Stem 4 5 5 6 6 7 7 8 8 Leaf 9 4 68 3 55577889 11334 5679 01 7 Bild 1.27: Stem-and-Leaf-Diagramm der Gewichtsverteilung von Versuchspersonen In der ersten, d.h. in der linken Spalte des Diagramms werden die Stem-Ziern der Groe nach eingetragen, bei Bedarf mehrfach. In Bild 1.27 sind in dieser Spalte die 56 1 Beschreibende und explorative Statistik Zehner-kg abgetragen. Rechts von den Stem-Ziern werden die dazugehorenden LeafZiern notiert, so da waagrechte Haugkeitssaulen mit den individuellen Leaf-Ziern (hier die Einer-kg), entstehen. Die dritte Zeile stellt also die Mewerte 56 kg und 58 kg dar. Das Stem-and-Leaf-Diagramm in Bild 1.27 enthalt demnach neben der gesamten Information uber die einzelnen Mewerte gleichzeitig die graphische Darstellung der Haugkeitsverteilung. 1.5.2 Letter-Value-Tabellen Letter-Value-Tabellen dienen dazu, Beobachtungswerte summarisch durch Angabe charakteristischer Mazahlen (Letter-Values oder Buchstabenwerte) zu beschreiben. Solche Mazahlen sind der Median (teilt die Datenreihe in 2 Halften), die Quartile (teilt die Datenreihe in etwa 4 Viertel) und weitere Quantilswerte, welche man durch fortgesetzte Halbierung der entsprechend geordneten Datenmenge erhalt. Bevor die Letter-Values deniert werden, sind die Werte einer Beobachtungsreihe der Groe nach zu ordnen. Fur jeden Wert wird dann bestimmt, wie weit er vom oberen oder unteren Ende der geordneten Zahlenreihe entfernt ist. Damit ist die Tiefe t eines Wertes gemeint, d.h. die Nummer der Position, welche bei demjenigen Ende der Reihe mit 1; 2; : : : zu zahlen beginnt, welches dem betreenden Wert naher ist. Die beiden auersten Werte, also der kleinste und der grote haben jeweils die Tiefe 1, der zweitkleinste und der zweitgrote jeweils die Tiefe 2 usw. Bei einer ungeraden Anzahl n von Werten gibt es einen tiefsten Wert, namlich den Median oder den mittelsten Wert, kurz mit M bezeichnet. Seine Tiefe t(M ) ist dann n + 1 . Bei einem geraden Stichprobenumfang, gibt es zwei mittelste Werte. Gewohnlich 2 sind diese Werte verschieden und keiner von ihnen teilt die Stichprobe exakt in zwei Halften. U blicherweise nimmt man dann den Mittelpunkt zwischen den zwei mittelsten 1 1 Werten, von denen jeder die Tiefe n + 2 , 2 hat. Dieser Median spaltet also die Reihe in zwei Halften auf, und man kann nun wieder nach der Mitte dieser Halften fragen, welche dann die sog. Hinges oder Fourth3 darstellen. Die Tiefe der Hinges berechnet sich zu: [t(M )] + 1 t(H ) = 2 (1.33) Mit [ ] ist die Entier-Funktion gemeint. [t(M )] bedeutet also die grote ganze Zahl, welche kleiner oder gleich t(M ) ist. Ist die berechnete Tiefe keine ganze Zahl, so nimmt man analog zum obigen Vorgehen bei der Festlegung des Medians in einem solchen Fall das arithmetische Mittel der benachbarten Werte als Letter-Value. (vgl. folgendes Beispiel). 3 Die Hinges bzw. die Fourth sind den Quartilen Q und Q (vgl. Bild 1.15) sehr ahnlich. Die 1 3 Quartilen Q1 und Q3 werden als Teilpunkte der Datenmenge so deniert, da 25% der Werte unterhalb von Q1 bzw. 25% der Werte oberhalb von Q3 liegen. Die Berechnung der Hinges mit Hilfe des Begris der Tiefe ist dagegen etwas einfacher. Die Unterschiede zwischen Hinges und Quartilen sind gering. Es kann sein, da die Hinges etwas naher als die Quartilen Q1 und Q3 beim Median liegen. 1.5 Explorative Statistik 57 Man kann in dieser Weise fortfahren und mittlere Werte fur die beiden aueren Viertel der Stichprobe nden. Diese Werte sind etwa ein Achtel der ganzen \Lange" zwischen Maximum und Minimum von den beiden Enden der geordneten Reihen entfernt und sie werden daher auch Achtel genannt bzw. mit E wie Eighth abgekurzt. Ihre Tiefe berechnet sich zu: [t(H )] + 1 t(E ) = 2 (1.34) Die Letter-Values auerhalb der Achtel-Werte werden seltener benutzt und haben keine als Standard akzeptierten Namen. Sie werden eventuell mit den Buchstaben D; C; B; A; Z; Y; : : : bezeichnet. Die nachsten Letter-Values nach den Achtel-Werten waren die D-Werte und ihre Tiefe ndet man mit: [t(E )] + 1 t(D) = 2 (1.35) Die beiden extremsten, also die auersten Werte der Stichprobe haben die Tiefe t = 1. Tab. 1.22 zeigt anschaulich, wie man die Letter-Values der Gewichtsstichprobe von Bild 1.27 berechnet. Die in Tab. 1.22 gefundenen Letter-Values werden i.a. in einer Tabelle ubersichtlich zusammengestellt, wobei zusammengehorige Letter-Values (oberer und unterer Wert) zeilenweise notiert werden. Auerdem wird der Mittelwert zusammengehorender LetterValues (Mitte) und die Spannweite (Weite) zwischen diesen beiden Letter-Values angegeben. Tab. 1.23 zeigt die zu den Gewichten in Bild 1.27 gehorige Letter-Value-Tabelle. Wenn die Mitten oder Mittelwerte ungefahr gleich sind, liegen die Letter-Values etwa symmetrisch um den Median. Wenn jedoch die H -, E -, D-Mitten usw. im Vergleich zum Median mehr nach der einen oder anderen Seite tendieren (also jeweils groer oder kleiner sind), deutet dies auf eine entsprechende Schiefe der Stichprobenverteilung hin. Wie die Mitten werden auch die Weiten mit dem entsprechenden Letter-Value-Symbol versehen. Man spricht also von H -Weite, E -Weite usw. und von der Range oder der Spannweite, wenn die Dierenz der Extremwerte gemeint ist. Die Mitten dienen dazu, Abweichungen einer Stichprobenverteilung von der Symmetrie, also Schiefe, anzuzeigen. Man mochte nun haug Stichprobenwerte so transformieren, da ihre Verteilung eine symmetrische Gestalt erhalt. Die Verwendung und die Beobachtung der oben eingefuhrten Mitten ist dabei ein nutzliches Hilfsmittel, die richtige Transformation der Stichprobenwerte herauszunden. 58 1 Beschreibende und explorative Statistik Tiefenberechnung Tiefe Wert Letter-Value 1 50 Extremwert 50 t(C ) = (2 + 1)=2 = 1:5 C = 51:5 2 53 t(D) = (4 + 1)=2 = 2:5 D = 56:5 3 60 t(E ) = (7 + 1)=2 = 4 4 60 E = 60 5 61 6 62 t(H ) = (13 + 1)=2 = 7 7 62 H = 62 8 63 9 63 10 64 11 64 12 65 t(M ) = (25 + 1)=2 13 67 M = 67 12 68 11 69 10 69 9 71 8 72 t(H ) = 7 7 72 H = 72 6 73 5 75 t(E ) = 4 4 79 E = 72 3 80 t(D) = 2:5 D = 80:5 2 81 t(C ) = 1:5 C = 83:5 1 86 Extremwert 86 Tabelle 1.22: Berechnung der Letter-Values fur die Gewichte von Bild 1.27 M H E D C Tiefe 13 7 4 2:5 1:5 1 Letter-Value unterer oberer 67 62 72 60 79 56:5 80:5 51:5 83:5 50 86 Mitte 67 67 69:5 68:5 67:5 68 Weite 10 19 24 32 36 Tabelle 1.23: Letter-Value-Tabelle fur die Gewichte von Bild 1.27 1.5 Explorative Statistik 59 1.5.3 Box-Plots Box-Plots oder Schachtel-Plots stellen die wesentlichen summarischen Charakteristika einer Reihe von Beobachtungswerten graphisch sehr anschaulich dar. Die funf Letter-Values Median, die beiden Hinges (bzw. Quartilen Q1 und Q3 ) sowie die zwei Extremwerte werden in einen sog. Box-and-Whiskers-Plot gezeichnet. Die mittlere Halfte der Werte, also vom oberen bis zum unteren Hinge wird durch ein Rechteck oder eine Box dargestellt. Der Median wird markiert, z.B. mit einem +Zeichen oder mit einem Strich quer durch die Box. Von jedem Hinge bzw. von jedem Ende der Box aus wird eine Linie bis zum Extremwert bzw. zum auersten Wert gezogen (vgl. Bild 1.28). Auf diese Weise erhalt man einen groben, aber schnellen U berblick uber die Stichprobe (Spannweite, Median, H -Weite, Symmetrie). Bild 1.28 zeigt den Box-and-Whiskers-Plot fur die Gewichte aus Bild 1.27. 50 60 70 80 90 Gewicht [kg] Bild 1.28: Box-and-Whiskers-Plot der Gewichte aus Bild 1.27 Manchmal enthalten Stichproben Werte, die so extrem niedrig oder hoch sind, da sie nicht zur Stichprobe gehorig erscheinen. Solche Werte nennt man Ausreier. Ausreier konnen z.B. durch falsches Messen oder Notieren entstehen. Solche Fehler will man verstandlicherweise korrigieren, bzw. wenn das nicht mehr moglich ist, wird man diese zweifelhaften Werte von der weiteren statistischen Untersuchung ausschlieen. Nicht alle Ausreier mussen falsche Werte sein. Sie konnen naturlich auch sehr ungewohnliche Werte in einer Stichprobe darstellen und man wird dann dem Grund ihres Auftretens ganz besondere Aufmerksamkeit widmen. Um Ausreier explorativ zu erfassen, kann man folgendermaen vorgehen (vgl. Tukey bzw. Vellemann/Hoaglin): 60 1 Beschreibende und explorative Statistik Ausgehend von den Hinges und der H -Weite deniert man die inneren Zaune (inner fences) als folgende Punkte: untere innere Zaune: obere innere Zaune: unterer Hinge , 1:5 H -Weite oberer Hinge + 1:5 H -Weite (1.36) Die aueren Zaune (outer fences) sind deniert als: untere auere Zaune: obere auere Zaune: unterer Hinge , 3 H -Weite oberer Hinge + 3 H -Weite (1.37) Wenn Stichprobenwerte auerhalb der inneren Zaune liegen, werden sie als auen oder als auere Werte bezeichnet, und Stichprobenwerte, die auerhalb der aueren Zaune liegen, werden als weit auen oder als weit auere Werte bezeichnet. Die Werte auf jeder Seite des Medians, welche innerhalb der inneren Zaune diesen am nachsten liegen, werden als Adjacent-Werte oder Anrainer-Werte bezeichnet. Fur die Gewichte in Bild 1.27 waren die Hinges 62 kg und 72 kg (vgl. Tab. 1.23). Die H -Weite ist also 10 kg. Damit erhalt man die inneren Zaune zu 62 , 1:5 10 = 47 und 72 + 1:5 10 = 87 und die aueren Zaune zu 62 , 3 10 = 32 und 72 + 3 10 = 102. Die beiden Extremwerte 50 und 86 liegen nicht auen, sie sind in diesem Fall gleich den Anrainer-Werten. Neben dem einfacheren Box-and-Whiskers-Plot verwendet man haug den sog. BoxPlot. Er wird folgendermaen konstruiert. Zuerst zeichnet man die Box von Hinge zu Hinge mit Kennzeichnung des Medians, genauso wie im Box-and-Whiskers-Plot. Dann zeichnet man Linien auf beiden Seiten der Box, jedoch nicht bis zu den Extremwerten, sondern nur bis zu den Adjacent-Werten. A uere Werte werden durch \ \ weit auere Werte durch \ \ gekennzeichnet. Weil fur die Gewichte in Bild 1.27 die Extremwerte gleich den Anrainer-Werten sind, sind Box-Plot und Box-and-Whiskers-Plot identisch (Bild 1.28). 1.6 Beschreibende und explorative Statistik mit MINITAB 61 1.6 Beschreibende und explorative Statistik mit MINITAB Die statistische Datenanalyse ist fur groe Datenmengen auerst rechenaufwendig. Aus diesem Grund benutzt man heute Statistikprogramme auf Computern. Es existieren viele anwenderfreundliche Softwareprodukte fur Personalcomputer am Markt. Das Programmsystem MINITAB ist ein preiswertes und einfach zu erlernendes Statistikpaket. In den folgenden Abschnitten werden einige Verfahren der beschreibenden und explorativen Statistik mit MINITAB durchgefuhrt. In der Windows-Version kann man nahezu alle statistischen Verfahren uber die grasche Benutzeroberache steuern. MINITAB setzt dann entsprechende Kommandos im Session-Fenster (Bild 1.29) ab, in dem auch die Ergebnisse der Analyse ausgegeben werden. Da die Kommandos im Session-Fenster auch vom Benutzer nach der Eingabeauorderung MTB > selbst eingegeben werden konnen, erfolgt die Benutzung dieser Befehle auf Kommandoebene, was die Darstellung in den folgenden Abschnitten drastisch verkurzt. 1.6.1 Datenformat und Dateneingabe Die zu analysierenden Daten werden in MINITAB in Spalten c (von engl. column = Spalte) abgelegt. Auf die einzelnen Spalten kann entweder uber die Spaltennummer, also c1, c2, c3 usw. oder uber individuell vergebene Namen, z.B. 'Ertrag', 'N min', 'Ozongeh.' zugegrien werden. Die Vergabe von Namen hat den Vorteil, da man sich nicht merken mu, welches Merkmal in welcher Spalte steht. Der zu analysierende Datensatz kann entweder direkt in das Data-Fenster (Bild 1.29) geschrieben und mit Namen belegt oder aus einer ASCII-Datei eingelesen werden. Die folgende Befehlssequenz liest den Datensatz von Tab. A.10 aus einer Datei KUEHE.DAT von der Festplatte in die Spalten c1 bis c8 in MINITAB ein. MTB > read 'kuehe.dat' c1-c8 Entering data from file: kuehe.dat 120 rows read. MTB > name c1 'Rasse' c2 'ML(kg)' c3 'Fett(%)' c4 'Eiw(%)' MTB > name c5 'Fett(kg)' c6 'Gew(kg)' c7 'KH(cm)' c8 'BU(cm)' MTB > save 'kuehe.mtw' Saving worksheet in file: kuehe.mtw MINITAB bestatigt das Einlesen von 120 Zeilen (rows). Anschlieend werden vom Benutzer Namen fur die Spalten mit den das jeweilige Merkmal erklarenden Namen vergeben (vgl. Tab. A.10 im Anhang). Das resultierende Data-Fenster zeigt Bild 1.29. Der Datensatz wird als MINITAB-Arbeitsblatt mit dem save-Befehl abgespeichert. MINITAB fugt die Endung .MTW (von engl. Minitab Worksheet) auch automatisch an den Dateinamen an und bestatigt die Speicherung. Es existiert nun eine Datei KUEHE.MTW, die durch das Kommando retrieve 'kuehe' nach einem Neustart wieder geladen werden kann. 62 1 Beschreibende und explorative Statistik Bild 1.29: MINITAB Session- und Data-Fenster 1.6.2 Statistische Mazahlen Der Befehl describe gibt einige wichtige statistische Mazahlen der angegebenen Spalten aus. MTB > describe 'ML(kg)' ML(kg) N 120 MEAN 5513.0 MEDIAN 5503.0 TRMEAN 5511.6 ML(kg) MIN 4123.0 MAX 7002.0 Q1 4921.7 Q3 6140.2 STDEV 722.6 SEMEAN 66.0 Es werden Stichprobenumfang n = N, arithmetisches Mittel x = MEAN, der Zentralwert oder Median xe = MEDIAN, empirische Standardabweichung s = STDEV (engl. standard deviation) und der Standardfehler des Mittelwerts sx = SEMEAN (engl. standard error of mean) ausgegeben. Fur TRMEAN (engl. trimmed mean) werden jeweils die 5% groten und kleinsten Werte abgeschnitten und aus den restlichen 90% der Mittelwert berech- 1.6 Beschreibende und explorative Statistik mit MINITAB 63 net. MIN und MAX sind jeweils die kleinsten und groten Stichprobenwerte. Q1 und Q3 bezeichnen die erste und dritte Quartile. Man kann die statistischen Mazahlen auch fur mehrere Spalten ausgeben. MTB > describe c2-c8 ML(kg) Fett(%) Eiw(%) Fett(kg) Gew(kg) KH(cm) BU(cm) N 120 120 120 120 120 120 120 MEAN 5513.0 4.0208 3.5072 221.27 699.92 141.99 197.92 MEDIAN 5503.0 4.0300 3.4950 219.00 702.00 142.00 198.00 TRMEAN 5511.6 4.0231 3.5048 221.15 700.36 142.06 197.96 ML(kg) Fett(%) Eiw(%) Fett(kg) Gew(kg) KH(cm) BU(cm) MIN 4123.0 3.3200 3.0600 167.00 602.00 129.00 184.00 MAX 7002.0 4.4400 4.0100 278.00 799.00 158.00 206.00 Q1 4921.7 3.8800 3.3900 198.00 674.25 139.00 195.00 Q3 6140.2 4.1700 3.6300 246.00 727.75 145.00 201.00 STDEV 722.6 0.2050 0.1966 28.19 41.21 4.97 4.45 SEMEAN 66.0 0.0187 0.0179 2.57 3.76 0.45 0.41 Die Bestimmung der Mazahlen fur die Rasse macht keinen Sinn, da es sich um ein nominales Merkmal handelt. Es ist jedoch sinnvoll, die Anzahl der Tiere verschiedener Rasse aufzulisten. MTB > table 'Rasse' ROWS: Rasse COUNT 1 2 3 4 ALL 40 50 20 10 120 Die Rassenverteilung ist also 40 Schwarzbunte, 50 Fleckvieh, 20 Braunvieh und 10 Gelbvieh, was zusammen den Gesamtstichprobenumfang von 120 ergibt. Wenn man die statistischen Mazahlen fur die Rassen getrennt ausgeben will, mu nach dem describe-Kommando ein Strichpunkt eingegeben werden. MINITAB wartet dann auf ein Subkommando, das mit einem Punkt abgeschlossen werden mu. 64 1 Beschreibende und explorative Statistik MTB > describe 'ML(kg)'; SUBC> by 'Rasse'. ML(kg) ML(kg) Rasse 1 2 3 4 N 40 50 20 10 MEAN 5990.2 4973.5 6464.5 4398.3 MEDIAN 6007.0 4959.0 6426.5 4275.5 TRMEAN 5988.9 4964.3 6472.6 4383.5 Rasse 1 2 3 4 MIN 5471.0 4533.0 5783.0 4123.0 MAX 6566.0 5715.0 7002.0 4792.0 Q1 5762.2 4870.8 6216.0 4168.0 Q3 6171.0 5115.2 6737.5 4644.0 STDEV 267.9 231.4 319.7 254.0 SEMEAN 42.4 32.7 71.5 80.3 Die mittlere Milchleistung von Schwarzbunten (1) und Braunvieh (3) liegt also im Bereich von 6000 kg, wahrend Fleckvieh (2) und Braunvieh (4) im Bereich unter 5000 kg liegt. 1.6.3 Haugkeitsverteilungen Der Befehl histogram liefert die Haugkeitsverteilung eines Merkmals. MTB > histogram 'ML(kg)' Bild 1.30 zeigt das von MINITAB erstellte Histogramm. 40 Frequency 30 20 10 0 4000 4500 5000 5500 6000 6500 7000 ML(kg) Bild 1.30: Histogramm der Milchleistung Auallig in Bild 1.30 ist die mehrgipige Verteilung der Milchleistung. Dies wird jedoch verstandlich, wenn man beachtet, da sich die Stichprobe aus mehreren Rassen mit unterschiedlicher mittlerer Milchleistung zusammensetzt. 1.6 Beschreibende und explorative Statistik mit MINITAB 65 1.6.4 Stem-and-Leaf-Diagramme Der Befehl stem-and-leaf erzeugt ein Stem-and-Leaf-Diagramm. Dieses wird nun fur den Milcheiweigehalt erstellt. MTB > stem-and-leaf 'Eiw(%)' Stem-and-leaf of Eiw(%) Leaf Unit = 0.010 2 9 17 31 60 60 37 18 11 3 1 30 31 32 33 34 35 36 37 38 39 40 N = 120 69 3559999 03344589 11355567777999 00123334444455566677778889999 00001122222334444555678 0001133344556777778 2336678 05566799 56 1 MINITAB gibt die Meldung Leaf Unit = 0.010 aus. Das bedeutet, da z.B. die beiden Werte in der ersten Zeile als 3:06 und 3:09 zu interpretieren sind. In der ersten Spalte werden lediglich die Anzahl der Stichprobenwerte bis zum Median hochgezahlt und anschlieend wieder abgezahlt. Das Stem-and-Leaf-Diagramm ist recht informativ, da es einerseits die Haugkeitsverteilung und andererseits die Stichprobenwerte selbst zeigt. 1.6.5 Letter-Value-Tabellen Der Befehl lvals erzeugt eine Letter-Value-Tabelle: MTB > lvals 'Eiw(%)' DEPTH LOWER N= 120 M 60.5 3.495 H 30.5 3.390 E 15.5 3.265 D 8.0 3.190 C 4.5 3.150 B 2.5 3.110 A 1.5 3.075 1 3.060 UPPER MID SPREAD 3.630 3.745 3.860 3.890 3.955 3.985 4.010 3.495 3.510 3.505 3.525 3.520 3.533 3.530 3.535 0.240 0.480 0.670 0.740 0.845 0.910 0.950 Es werden die Letter-Values mit ihren Tiefen (DEPTH), unteren (LOWER) und oberen (UPPER) Grenzen sowie deren Mitte (MID) ausgegeben. Die Weite (SPREAD) ist die Differenz zwischen oberem und unterem Letter-Value. 66 1 Beschreibende und explorative Statistik 1.6.6 Box-Plots Der Befehl boxplot erzeugt einen Box-Plot, MTB > boxplot 'Eiw(%)' 4.0 3.9 3.8 Eiw(%) 3.7 3.6 3.5 3.4 3.3 3.2 3.1 3.0 Bild 1.31: Boxplot des Eiweigehalts Die Verteilung besitzt rechts auen einen Anrainer-Wert. Beim boxplot-Befehl kann man die Merkmale nach Rassen getrennt darstellen. MTB > boxplot 'ML(kg)'*'Rasse' Bild 1.32 zeigt die einzelnen Verteilungen der Stichprobenwerte getrennt nach Rassen als Boxplot. Dabei werden die Rassenunterschiede in der Milchleistung deutlich. ML(kg) 7000 6000 5000 4000 1 2 3 Rasse 4 Bild 1.32: Boxplots der Milchleistung getrennt nach Rassen 1.6 Beschreibende und explorative Statistik mit MINITAB 67 1.6.7 Streudiagramme Die Analyse des Zusammenhangs zwischen zwei Variablen erfolgt im einfachsten Fall durch eine Auftragung der einen Variablen uber der anderen. Interessiert z.B. der Zusammenhang zwischen Fettertrag in kg und Milchleistung, so kann man fur jede untersuchte Kuh deren Milchleistung auf der Abszisse und deren Fettmenge auf der Ordinate abtragen. Es entsteht dann eine Punktewolke im Streudiagramm bzw. Scatter Plot (Bild 1.33). MTB > plot 'Fett(kg)'*'ML(kg)' Fett(kg) 280 230 180 4000 5000 6000 7000 ML(kg) Bild 1.33: Streudiagramm von Fettmenge und Milchleistung Es besteht oensichtlich ein linearer Zusammenhang zwischen der Fettmenge und Milchleistung. Dies ist einleuchtend, da eine hohere Milchmenge naturlich auch einen hoheren Fettertrag zur Folge hat. Daruberhinaus wurde der Fettertrag in kg aus dem Produkt von Milchleistung und Fettgehalt in % berechnet. Der Zusammenhang ist jedoch nicht exakt linear, da durch den unterschiedlichen Fettgehalt der Milch eine Streuung verursacht wird. Auerdem sind im Streudiagramm von Bild 1.33 auch wieder die beiden Gruppen der Milchleistungen erkennbar. 1.6.8 Streumatrizen Haug interessiert der Zusammenhang zwischen mehreren Merkmalen. Beispielsweise ist eine Abhangigkeit zwischen Gewicht, Kreuzhohe und Brustumfang wahrscheinlich. Man kann nun jede Variable uber der anderen in einem Streudiagramm auftragen. Eine Darstellung dieser Diagramme in einem einzigen Bild fuhrt zur Streumatrix oder Scatter Plot-Matrix (Bild 1.34). Eine Streumatrix wird mit dem Kommando matrixplot erzeugt. MTB > matrixplot 'Gew(kg)'-'BU(cm)' 68 1 Beschreibende und explorative Statistik 749.75 Gew(kg) 651.25 150.75 KH(cm) 136.25 200.5 BU(cm) 189.5 65 1.2 5 74 9.7 5 13 6.2 5 15 0.7 5 18 9.5 20 0.5 Bild 1.34: Streumatrix von Gewicht, Kreuzhohe und Brustumfang Links oben steht das Gewicht in kg, d.h. die Abszisse der Einzelbilder in der 1. Spalte und die Ordinate der Einzelbilder in der 1. Zeile der Matrix sind mit dem Gewicht skaliert. Entsprechendes gilt fur die Kreuzhohe in Spalte und Zeile 2 sowie fur den Brustumfang in der 3. Spalte und Zeile. Ein Zusammenhang ist fur alle drei Variablen in Bild 1.34 ersichtlich. Dies ist auch klar, da groere Tiere in allen drei Merkmalen hohere Werte haben als kleinere. 1.6.9 Korrelationskoezienten und Korrelationsmatrix Das correlate-Kommando berechnet den empirischen Korrelationskoezienten zwischen zwei Merkmalen. MTB > correlate 'ML(kg)' 'Fett(kg)' Correlation of ML(kg) and Fett(kg) = 0.921 Der Korrelationskoezient als Ma fur die Starke des linearen Zusammenhangs zwischen Milchleistung und Fettmenge betragt also r = 0:921. Dieser relativ hohe Wert bestatigt die oensichtlich enge lineare Beziehung der Werte in Bild 1.33. Der correlate-Befehl kann auch fur die Bestimmung der Korrelationskoezienten mehrerer Variablen verwendet werden und liefert dann die Korrelationsmatrix. 1.6 Fett(%) -0.133 0.117 -0.150 -0.011 -0.045 Eiw(%) Fett(kg) 0.857 0.838 Gew(kg) 0.797 KH(cm) -0.286 0.026 0.094 0.131 -0.661 -0.753 -0.577 Beschreibende und explorative Statistik mit MINITAB ML(kg) -0.276 -0.228 0.921 -0.577 -0.721 -0.535 MTB > correlate c2-c8 Fett(%) Eiw(%) Fett(kg) Gew(kg) KH(cm) BU(cm) 69 Aus dieser Korrelationsmatrix ist z.B. ersichtlich, da die Milchleistung mit der Fettmenge in kg hoch positiv korreliert ist, mit dem Fettgehalt in % jedoch eine negative Korrelation aufweist. Es ist also bei hoheren Milchmengen ein Verdunnungseekt im Fettgehalt erkennbar. Da die Fettmenge das Produkt aus Milchleistung und Fettgehalt ist, wird dieser Verdunnungseekt beim Fettgehalt durch die hohe Milchmenge kompensiert. 1.6.10 Balkendiagramme Balkendiagramme (engl. bar charts) eignen sich sehr gut zur Darstellung der Haugkeitsverteilung nominaler Merkmale. Die Auftragung der nominalen Merkmalsauspragung erfolgt an der Abszisse. U ber der jeweiligen Merkmalsauspragung wird ein Balken gezeichnet, dessen Hohe der Haugkeit des entsprechenden Merkmals entspricht. Zur Erstellung eines Balkendiagramms in MINITAB dient der Befehl chart. MTB > chart 'Rasse' 2 Rasse 3 4 Die Rassenverteilung der Kuhe, die auf Seite 63 mit dem table-Befehl erzeugt wurde, zeigt Bild 1.35 als Balkendiagramm. Dabei ist zu beachten, da die nominalen Merkmale an der Abszisse beliebig vertauscht werden konnen, da sie nicht in eine festgelegte Reihenfolge gebracht werden konnen, wie das bei ordinalen Merkmalen der Fall ist. 50 40 30 20 10 0 1 Bild 1.35: Balkendiagramm der Rassenverteilung von Kuhen Number Nonmissing of Rasse 70 1 Beschreibende und explorative Statistik 1.6.11 Kuchendiagramme Eine Alternative zu den Balkendiagrammen sind die haug verwendeten Kuchendiagramme (engl. pie charts). Der zugehorige Wert einer diskreten oder nominalen Merkmalsauspragung wird als Segment aus einem Kreis herausgeschnitten. Die Segmentgroe ist proportional zur Groe dieses Werts bzw. der entsprechenden Haugkeit. Kuchendiagramme werden mit dem Makro4 %pie erzeugt. Das entsprechende Kuchendiagramm zum Balkendiagramm fur die Rassenverteilung von Bild 1.35 zeigt Bild 1.36. MTB > %pie 'Rasse' Pie Chart of Rasse 1 (40, 33.3%) 2 (50, 41.7%) 4 (10, 8.3%) 3 (20, 16.7%) Bild 1.36: Kuchendiagramm der Rassenverteilung von Kuhen 4 Ein Makro ist eine Folge von Befehlen, die in einer eigenen Datei abgespeichert sind und bei Aufruf des Makros abgearbeitet werden. In MINITAB haben Makros die Dateierweiterung .MAC. Ihr Aufruf erfolgt durch ein vorangestelltes %-Zeichen.