1 Beschreibende und explorative Statistik

Werbung
1
Beschreibende und explorative Statistik
Die beschreibende oder deskriptive Statistik und die explorative Statistik betrachten eine vorliegende Menge von Objekten, von denen fur jedes Objekt ein Merkmal oder mehrere Merkmale beobachtet oder gemessen wurden. Um Ordnung in eine
solche Datenmenge zu bringen, kann man z.B. auszahlen, wie oft die einzelnen Merkmalsauspragungen vorkommen oder wie oft diese in ein bestimmtes Intervall fallen.
Die graphische Darstellung der Ergebnisse fuhrt zur sog. empirischen Haugkeitsverteilung der gegebenen Datenmenge. Diese Verteilung gibt das Datenmaterial in
ubersichtlich aufbereiteter Form wieder. Die Gewinnung einer solchen Verteilung stellt
eine Hauptaufgabe der beschreibenden Statistik dar.
Wahrend eine Haugkeitsverteilung die wesentliche Information, die in einer Datenmenge steckt, nahezu unverandert enthalt, geben statistische Mazahlen, wie z.B. Mittelwert und Streuung stellvertretend fur die ganze Menge von Einzelwerten jeweils
eine einzige Zahl als Parameter an.
Neben den empirischen Haugkeitsverteilungen und entsprechenden Mazahlen werden
spater die theoretischen Verteilungen und analoge Mazahlen vorgestellt. Sie dienen zur
Angabe der Wahrscheinlichkeit fur das Eintreen bestimmter zufalliger Ereignisse.
1.1 Beschreibung eindimensionaler Stichproben
Wird fur jedes Objekt einer Menge lediglich ein Merkmal beobachtet oder gemessen,
so ist die entsprechende Haugkeitsverteilung dieses Merkmals eine eindimensionale
Haugkeitsverteilung. Bestimmt man z.B. bei einer Anzahl von Autos die Kohlenmonoxidkonzentration der Abgase, so ist die zugehorige Verteilung des Merkmals
\Kohlenmonoxid\ eindimensional. Eine zusatzliche Messung der Stickoxidkonzentration fuhrt zu zwei Mewerten pro Auto. Dieses Zahlenmaterial kann in einer zweidimensionalen Haugkeitsverteilung zusammengefat werden (Abschnitt 1.3).
1.1.1 Stichprobe und Grundgesamtheit
Das Ergebnis einer statistischen Erhebung liegt in der Regel zunachst in Form einer
Urliste vor. Darunter versteht man ein Protokoll, auf dem die beobachteten Werte in
der Reihenfolge stehen, wie sie beobachtet und notiert wurden.
Wird z.B. eine gewisse Anzahl von Studenten der Technischen Universitat MunchenWeihenstephan zufallig ausgewahlt und ihre Groe bestimmt, so erhebt man eine Stichprobe uber die Korpergroe der Studenten. Die notierten Mewerte in der Urliste, also
die Groe der ausgewahlten Studenten, sind die Stichprobenwerte.
Eine zufallige Teilmenge aus einer Menge von beliebigen Objekten (Personen, Tiere,
Gegenstande usw.), die sich durch ein oder mehrere gemeinsame Merkmale auszeichnen, heit eine Stichprobe. Umfat diese Teilmenge genau n Objekte, so spricht man
von einer Stichprobe vom Umfang n. Wenn zukunftig von Stichproben die Rede ist,
dann ist damit meistens die Stichprobe der Merkmalswerte und weniger die der Objekte
6
1
Beschreibende und explorative Statistik
gemeint. Die Grundgesamtheit ist die Menge aller moglichen oder denkbaren Objekte, die sich durch die gleiche Eigentumlichkeit auszeichnen, z.B. die Grundgesamtheit
aller Weihenstephaner Studenten.
Aus okonomischen, zeitlichen oder praktischen Grunden arbeitet man fast ausschlielich mit Stichprobenerhebungen und nur in Ausnahmefallen mit Vollerhebungen,
d.h. mit einer Erhebung der ganzen Grundgesamtheit. Es ist z.B. praktisch ausgeschlossen, alle Weihenstephaner Studenten zu vermessen, da immer ein Teil davon
im Praktikum ist. Eine annahernd vollstandige Vollerhebung liegt beispielsweise bei
Volkszahlungen vor, die mit einem erheblichen Finanz- und Arbeitsaufwand durchgefuhrt werden. Ziel einer Stichprobenerhebung ist also, aufgrund einer Stichprobe
realistische Aussagen uber die Grundgesamtheit zu machen, also beispielsweise die unbekannte tatsachliche Korpergroenverteilung der Studenten durch die Verteilung der
Stichprobenwerte abzuschatzen.
Eine gegebene Datenmenge soll im folgenden als eine Stichprobe aus einer Grundgesamtheit angesehen werden. Die Aufgabe der beschreibenden Statistik ist, die in einer
Urliste gegebene Menge von Daten zu ordnen, ubersichtlich darzustellen und mit statistischen Mazahlen zu kennzeichnen, um einen U berblick uber die Verteilung der
Merkmalswerte zu bekommen.
Beispiele:
1. Tab. 1.1 zeigt die Urliste einer Stichprobe von 100 Jungsauen, bei denen das Merkmal \Anzahl der Ferkel pro Wurf\ betrachtet wurde. Es liegt eine eindimensionale
Stichprobe vor, denn fur jedes Element, also fur jede Sau, wurde ein Merkmalswert
gemessen.
11
9
9
13
9
12
16
10
7
12
13
14
12
10
13
10
11
7
9
8
7
11
6
8
14
12
9
9
10
12
15
10
7
10
9
11
10
11
9
11
6
10
8
12
11
9
11
10
10
10
11
8
12
11
9
11
9
9
11
7
8
14
9
9
11
9
12
11
8
15
7
7
10
8
10
10
10
10
13
9
4
12
7
6
11
12
13
14
9
10
12
10
9
10
7
8
11
8
10
8
Tabelle 1.1: Urliste uber die Anzahl der Ferkel pro Wurf bei einer Stichprobe von
n = 100 Jungsauen
1.1
Beschreibung eindimensionaler Stichproben
7
2. Eine zweidimensionale Stichprobe vom Umfang n = 20 erhalt man beispielsweise,
wenn man bei 20 zufallig ausgewahlten Rindern jeweils zwei Merkmale mit. In
Tabelle 1.2 ist der Brustumfang und die Kreuzhohe von 20 Rindern festgehalten.
Tier Brustum- KreuzNr: fang [cm] hohe [cm]
1
180
121
2
168
116
3
170
114
4
167
116
5
177
119
6
164
115
7
180
121
8
169
120
9
164
112
10
180
117
Tier Brustum- KreuzNr: fang [cm] hohe [cm]
11
170
123
12
170
118
13
175
115
14
172
117
15
175
119
16
172
123
17
171
114
18
167
117
19
168
115
20
155
115
Tabelle 1.2: Brustumfang und Kreuzhohe bei 20 Rindern
3. Allgemein erhalt man eine m-dimensionale Stichprobe vom Umfang n, wenn an
jedem der n Elemente jeweils m Merkmale (x1 ; x2 ; : : : ; xm ) gemessen werden. Tab.
1.3 enthalt eine funfdimensionale Stichprobe vom Umfang n = 10.
28 Tage- Alter bei tagliche Stallend- SchlachtNr: Gewicht Mastende Zunahme gewicht gewicht
[kg]
[Tage]
[g]
[kg]
[kg]
1
8:3
179
745
98
76:5
2
9:5
164
814
103
78:5
3
9:2
166
778
102
76:0
4
10:7
166
761
102
78:5
5
9:6
175
761
101
78:5
6
8:4
186
700
98
75:0
7
9:1
178
745
98
76:5
8
10:2
183
707
100
76:0
9
7:5
184
778
103
80:0
10
7:3
197
700
97
70:0
Tabelle 1.3: Schweinedaten uber funf verschiedene Merkmale der Mastleistung
8
1.1.2 Einteilung der Merkmale
1
Beschreibende und explorative Statistik
Bei Merkmalen einer Stichprobe wird zunachst zwischen quantitativen, d.h. zahlenmaig erfabaren und qualitativen, d.h. artmaig erfabaren Merkmalen unterschieden.
Beispiele fur qualitative Merkmale sind Geschlecht, Farbe, Schadens- oder Handelsklasse, Sorte, Beruf usw. Eine genauere Einteilung der qualitativen Merkmale unterscheidet
ordinal und nominal erfabare Merkmale.
Bei einem ordinalen Merkmal kann man die einzelnen Auspragungen nicht mehr
messen im ublichen Sinne, wohl aber noch in eine Reihenfolge bringen oder ordnen. Ein
solches Stichprobenelement besitzt jeweils einen Rang 1, Rang 2, Rang 3 usw., das heit
aber nicht, da mittels dieser Rangzahlen ein echtes quantitatives metrisches Merkmal
vorliegt. Mit einer solchen Rangskala kann man zwar eine Rangordnung konstatieren,
aber nicht sagen, der Abstand zwischen Rang 1 und Rang 3 ist zweimal so gro wie
zwischen Rang 1 und Rang 2.
Bei einem nominalen Merkmal kann man nur noch die einzelnen Auspragungen des
Merkmals feststellen und willkurlich nebeneinander aufreihen, ohne eine Abstufung
durchzufuhren oder eine Angabe uber Abstande zu machen.
Beispiele fur ordinale Merkmale sind Schadens- oder Handelsklassen, Schulnoten, Angaben uber die Befallshaugkeit einer bestimmten Krankheit bei Panzen oder die
Stadien eines Tumors. Beispiele fur nominale Merkmale sind Konfession, Farbe, Geschlecht, Sorte oder Beruf.
Quantitative oder metrische Merkmale konnen durch einen Me- oder Zahlvorgang
erfat werden. Beispiele dafur sind Korpergroe, Gewicht, Ferkel- oder Kinderzahl, Einkommen. Quantitative Merkmale unterteilt man daruberhinaus in diskrete und stetige
Merkmale.
Stetige Merkmale konnen jeden beliebigen Wert innerhalb eines gewissen Intervalls
annehmen, z.B. die Korpergroe oder das Korpergewicht. Diskrete Merkmale haben
nur ganz bestimmte Auspragungen, die man abzahlen kann, wie z.B. Ferkel- und Kinderzahl oder die Anzahl der Blatter bei Panzen. Die Merkmalsauspragungen diskreter
Merkmale sind also ganze, meist nichtnegative Zahlen.
Eine zweite Art der Unterteilung der quantitativen Merkmale dierenziert, ob Merkmale mit einer Intervall- oder mit einer Verhaltnisskala erfat werden.
Bei einer Intervallskala ist charakteristisch, da die Erfassung des Abstands, d.h.
Bildung der Dierenz zwischen zwei Merkmalsauspragungen, moglich ist. Beispiel dafur
ist die Temperaturmessung in Grad Celsius oder Fahrenheit.
Bei einer Verhaltnisskala hat man zusatzlich einen wahren, absoluten Nullpunkt, auf
den die einzelnen Merkmalsauspragungen bezogen werden konnen. Beispiele sind die
Temperaturmessung in Grad Kelvin, die Langen-, Gewichts- und Zeitmessung.
Der U bergang zwischen diskreten und stetigen Merkmalen ist zum Teil ieend. Wenn
man die Lange eines Werkstucks, die ein stetiges Merkmal darstellt, auf volle Zentimeter abrundet, so nimmt dieses Merkmal den Charakter eines diskreten Merkmals
an. Auerdem kann man jedes stetige Merkmal gruppieren und erhalt so ein diskretes
Merkmal.
1.1
Beschreibung eindimensionaler Stichproben
9
Eine zusammenfassende U bersicht der Merkmalseinteilung mit Beispielen enthalt Tab.
1.4.
qualitativ
nominal
artmaig
Auspragungen
Religion
Geschlecht
Art
Typ
qualitativ
quantitativ
quantitativ (metrisch)
ordinal
zahlenmaig
Rangfolge
Handelsklassen
Schulnoten
Schadensstufen
diskret
ganzzahlig
Kinder
Panzen
Tiere
nominal
Merkmal
Baumart
ordinal
Schadigung
diskret
stetig
Rehe/ha
Bleigehalt
stetig
beliebig
Gewicht
Zeit
Stogehalt
Tanne, Fichte, Kiefer,
Buche, Eiche
ohne, schwach, mittel,
stark, tot
0 , 20
0:0 , 100:0 ppm
Tabelle 1.4: Einteilung der Merkmale
1.1.3 Haugkeitsverteilungen bei diskreten Merkmalen
Betrachtet wird das Merkmal \Anzahl der Ferkel pro Wurf\ in Tab. 1.1 auf Seite 6.
Dieses Merkmal nimmt nur ganze Zahlen groer oder gleich Null als Werte an und
stellt damit ein diskretes Merkmal dar.
Wenn man auszahlt, wie oft die verschiedenen Ferkelzahlen vorkommen, erhalt man
die Haugkeitstabelle, bzw. Verteilung der Merkmalswerte in Tab. 1.5.
Ferkel pro Wurf
Haugkeit
4
1
5
0
6
3
7 8 9 10 11 12 13 14 15 16
9 10 18 20 16 11 5 4 2 1
Tabelle 1.5: Haugkeitstabelle fur die Ferkelzahlen von Tab. 1.1
Beim Auszahlen der Urliste kann man sich mit einer Strichliste behelfen. In der Strichliste geben die Summen der einzelnen Striche in einer Zeile die absolute Haugkeit
ni fur den i-ten Merkmalswert xi an (Tab. 1.6).
Auf kariertem Papier kann man ebenfalls bequem eine Urliste auszahlen, indem man
uber dem entsprechenden Merkmalswert ein Kreuz malt (Bild 1.1). Die Summe der
Kreuze uber einem Merkmalswert ist die absolute Haugkeit ni .
Wenn man die absoluten Haugkeiten auf den Umfang n der Stichprobe bezieht, erhalt
man die relativen Haugkeiten hi fur die Merkmalswerte xi .
10
4
5
6
7
8
9
10
11
12
13
14
15
16
1
Beschreibende und explorative Statistik
jjjj
jjjj
jjjj
jjjj
jjjj
jjjj
jjjj jjj
jjjj jjjj
jjjj j
j
j
jjj
jjjj
jjjj
jjjj
jjjj
jjjj
jjjj
jjjj
jjjj
jj
j
Tabelle 1.6: Strichliste der Ferkelzahlen von Tab. 1.1
absolute Häufigkeit
20
15
10
5
0 0 2 4 6 8 10 12 14 16 18 20
Ferkel
Bild 1.1: Kreuztabelle der Ferkelzahlen aus Tabelle 1.1
Sei mit h(xi ) = hi die relative Haugkeit fur den Merkmalswert xi bezeichnet. Dann
gilt:
mit xi als Ergebnis
hi = h(xi ) = Anzahl der Stichprobenwerte
Stichprobenumfang n
(1.1)
Im Beispiel hat die Wurfzahl 8 die Haugkeit h8 = h(8) = 10=100 = 0:10 oder auch
10%. Es ist klar, da die relative Haugkeit einer Merkmalsauspragung (hier: einer
Wurfzahl) zwischen 0 und 1 liegt bzw. zwischen 0% und 100%, die beiden Zahlen
jeweils eingeschlossen. Es gilt also: 0 hi 1.
Tab.1.7 zeigt die absoluten und relativen Haugkeiten der Ferkelzahlen aus Tab. 1.1.
1.1
Beschreibung eindimensionaler Stichproben
11
Ferkel pro Wurf absolute Haugkeit relative Haugkeit
4
1
0:01
5
0
0:00
6
3
0:03
7
9
0:09
8
10
0:10
9
18
0:18
10
20
0:20
11
16
0:16
12
11
0:11
13
5
0:05
14
4
0:04
15
2
0:02
1
0:01
16
Summe
100
1:00
Tabelle 1.7: Haugkeitstabelle der Ferkelzahlen von Tabelle 1.1
1.1.4 Haugkeitsfunktion einer Stichprobe
Einer Stichprobe vom Umfang n mit m verschiedenen Werten x1 ; x2 ; : : : ; xm kann man
eine Funktion fe(x), die sog. Haugkeitsfunktion, zuordnen. Wenn hi die relative
Haugkeit h(xi ) fur i = 1; 2; : : :; m bezeichnet, so erfolgt die Zuordnung:
ef (x) = h0 i
fur x = xi (i = 1; 2; : : : ; m)
sonst
(1.2)
Die Funktion fe(x) nimmt also an den m Stellen xi (i = 1; 2; : : :; m) die Werte hi an
und ist sonst uberall gleich Null (vgl. Bild 1.2).
~
f
0.20
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
0
2
4
6
8
10
12
14
16 Ferkel
Bild 1.2: Haugkeitsfunktion fe(x) der Ferkelzahlen aus Tabelle 1.1
Man verwendet jedoch als graphische Darstellung meist ein Balken-, Saulendiagramm oder Histogramm. Dies ist eine optisch etwas ansprechendere graphische
12
1
Beschreibende und explorative Statistik
Form der Haugkeitsfunktion fe(x). Man zeichnet einfach eine Saule bzw. einen Balken uber den Stichprobenwert dessen Hohe der absoluten oder relativen Haugkeit des
Stichprobenwerts entspricht. Man erhalt dann eine Auftragung wie in Bild 1.3, in der
die absoluten Haugkeiten als Balken dargestellt sind.
~
f
0.20
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
0
2
4
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAA
6
8
10
12
14
16 Ferkel
Bild 1.3: Histogramm der Ferkelzahlen aus Tabelle 1.1
Wenn man die Punkte der Haugkeitsfunktion bzw. die Mitten der Saulen beim Balkendiagramm durch Geradenstucke miteinander verbindet, erhalt man ein sog. Haugkeitspolygon. Das kann nutzlich sein, um z.B. die zeitliche Entwicklung eines Merkmals deutlich zu machen.
1.1.5 Haugkeitsverteilungen bei stetigen Merkmalen
Hat eine Stichprobe einen sehr groen Umfang und kommen viele zahlenmaig verschiedene Werte vor, so ist die Zeichnung der Haugkeitsfunktion wenig ubersichtlich.
Auch wenn die Stichprobenwerte keine ganzen Zahlen sind, wie im Beispiel mit der
Anzahl der Ferkel, sondern Zahlen aus einem gewissen Intervall, wenn z.B. ein Ertrag,
ein Gewicht oder eine Lange gemessen werden, ist eine Klassenbildung sinnvoll.
Das Intervall, in dem alle vorkommenden Stichprobenwerte liegen, wird in eine zweckmaige Anzahl von Teilintervallen oder Klassenintervallen unterteilt. Es ist dabei
oft nutzlich, da alle Klassen gleich gro sind, also konstante Klassenbreite haben. Eine
Klasse wird entweder mit Hilfe der unteren (linken) und oberen (rechten) Klassengrenze
oder mit der Klassenmitte und Klassenbreite festgelegt.
Die Anzahl von Stichprobenwerten, die in eine bestimmte Klasse fallen, heit absolute Klassenhaugkeit dieser Klasse. Die relative Klassenhaugkeit erhalt man
nach Division der absoluten Klassenhaugkeit durch den Stichprobenumfang. Vor der
Zuordnung der Stichprobenwerte zu den einzelnen Klassen legt man eine sich nicht
uberlappende Klassenteilung fest, so da die Zuordnung der Stichprobenwerte zu den
einzelnen Klassen eindeutig ist.
Man wahlt auerdem entweder die Klassenmitten oder die Klassenenden so, da sie
moglichst einfachen Zahlen entsprechen. Bei der Klassenbildung geht naturlich Information verloren. Die Menge aller Stichprobenwerte wird reduziert auf die Haugkeiten
in den einzelnen Klassen.
1.1
Beschreibung eindimensionaler Stichproben
13
Will man nachtraglich aufgrund einer Klassizierung den arithmetischen Mittelwert x
(vgl. Kap. 1.2) berechnen bzw. schatzen, so nimmt man zweckmaigerweise an, da alle
Werte in einer Klasse auf der Klassenmitte liegen. Der Fehler, den man dabei macht,
ist umso kleiner, je gleichmaiger sich die Merkmalswerte uber das ganze Intervall
verteilen.
Man sollte generell nicht \zu klein\ klassizieren, weil dabei noch \zuviel\ Information
aus der Urliste ubrig bleibt. Andererseits sollte auch nicht \zu gro\ klassiziert werden,
da in diesem Fall \zuviel\ Information uber die Haugkeitsverteilung der Stichprobe
verloren geht. Als Faustregel gilt: Die Anzahl der Klassen sollte
p kleiner oder hochstens
gleich der Wurzel aus der Anzahl der Stichprobenwerte sein ( n), wobei jedoch mindestens 5 und hochstens 25 Klassen vorkommen sollen. Auerdem sollten moglichst keine
leeren Klassen auftreten. Die Haugkeit in Abhangigkeit von den Klassenmitten heit
die Haugkeitsfunktion der klassizierten Stichprobe.
Tab. 1.8 zeigt die Urliste der jahrlichen Milchleistung einer Stichprobe von 100 Kuhen.
Es liegt eine eindimensionale Stichprobe vor, denn fur jedes Element, also fur jede Kuh,
wurde ein Merkmalswert gemessen.
5614
5866
3952
5626
5170
4870
6270
5566
5049
5358
5662
5601
5952
6627
5142
4935
4908
5436
5067
4938
4344
6799
4951
5884
5250
5700
5046
4254
4558
5875
5268
4834
4875
5908
5329
5397
6505
5569
5613
5626
4629
4113
3702
6532
4891
5296
4555
5611
5898
3916
4273
5548
5262
4201
5055
4689
3867
4618
4611
4381
5754
3760
4986
4593
5659
5899
4305
6235
4593
5221
5197
4599
6352
5770
5292
5155
4660
5065
5259
4999
5448
5560
5614
4702
5542
5580
4947
5242
5059
4318
4552
5650
5577
4491
5662
5851
4504
5608
4933
5832
Tabelle 1.8: Milchleistung von 100 Milchkuhen in kg/a
Es liegt ein stetiges Merkmal vor, auch wenn die Mewerte auf ganze Kilogramm gerundet sind. Die meisten Werte kommen nur einmal vor. Aus diesem Grund nimmt
man eine Klasseneinteilung vor und zahlt, wieviele Messungen in eine bestimmte Klasse fallen. In Tab. 1.9 wurde eine konstante Klassenbreite von 400 kg=a festgelegt. Die
untere Grenze der am weitesten links liegenden Klasse (sog. Reduktionslage) wurde
auf 3600 kg=a gesetzt, so da man wie folgt klassizieren kann:
1. Klasse: [3600 : : : 4000), 2. Klasse: [4000 : : : 4400), usw.
Die vorletzte Spalte von Tab. 1.9 zeigt die absolute Haugkeitsverteilung, die letzte
Spalte die relative Haugkeitsverteilung dieser Stichprobe.
Graphisch stellt man meistens die Haugkeitsverteilung einer klassizierten Stichprobe in Form eines Histogramms oder Treppenpolygons dar. Man reprasentiert die
Haugkeit der einzelnen Klassen durch Rechtecke, deren Flachen uber den verschiedenen Intervallen den Haugkeiten in diesen Intervallen proportional sind. Dieses Prinzip
der Flachentreue sollte man insbesondere beachten, wenn man verschiedene Klassenbreiten wahlt. Wenn man eine konstante Klassenbreite (xi , xi,1 ) = x gewahlt hat,
14
1
Beschreibende und explorative Statistik
Klassen- Klassen- Absolute Klassenhaugkeit Relative Klassenintervall
mitte Strichliste
n
haugkeit h
3600 : : : 4000 3800 jjjj
5
0:05
4000 : : : 4400 4200 jjjj jjj
8
0:08
4400 : : : 4800 4600 jjjj jjjj jjjj
14
0:14
4800 : : : 5200 5000 jjjj jjjj jjjj jjjj jj
22
0:22
5200 : : : 5600 5400 jjjj jjjj jjjj jjjj
20
0:20
5600 : : : 6000 5800 jjjj jjjj jjjj jjjj jjjj
24
0:24
6000 : : : 6400 6200 jjj
3
0:03
6400 : : : 6800 6600 jjjj
4
0:04
100
1:00
Tabelle 1.9: Haugkeitsverteilung zur Stichprobe aus Tabelle 1.8
braucht man nur die Hohe der einzelnen Rechtecke proportional zur Haugkeit hi zu
zeichnen.
Das Histogramm zur Verteilungstafel in Tab. 1.9 ist in Bild 1.4.a wiedergegeben. Als
Ordinate ist dort die relative Haugkeit fe(x) in Prozent aufgetragen. Man kann jedoch
genauso gut die absoluten Haugkeiten darstellen.
relative Häufigkeit [%]
25
20
15
10
5
0
a)
30
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAA
AAAA
AAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAA
AAAA
AAAA
AAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAA
AAAAAAAA
AAAA
AAAAAAA
AAAAAAA
AAAA
AAAAAAA
AAAA
AAA
AAAA
AAAAAAA
AAAA
AAAA
25
relative Häufigkeit [%]
30
20
15
10
5
0
3600 4000 4400 4800 5200 5600 6000 6400 6800
b)
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAA
AAA
AAAA
AAAA
AAAAAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAA
AAAAAAA
AAAA
AAAAAAAA
AAAA
AAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAAAAA
AAAAAAAAAAA
AAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAA
3700 4100 4500 4900 5300 5700 6100 6500 6900
Milchleistung [kg/a]
relative Häufigkeit [%]
30
25
20
15
10
5
0
Milchleistung [kg/a]
c)
60
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
A
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A
AAAA
AA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AA
AAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AA
AAAAAAAAAA
AAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAAAAAA
AAAA
AAAAAA
AAAA
AAAAAA
AAAA
AAAA
A
AAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AA
AAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AA
AAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAA
A
AAAAAAAA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAAAAAAA
A
AAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
A
AAAAAAAA
AAAA
AAAA
AA
AA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAAAA AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAA
AAAA
AAAA
AAAA
3500 4000 4500 5000 5500 6000 6500 7000
Milchleistung [kg/a]
50
relative Häufigkeit [%]
35
40
30
20
10
0
d)
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAAAAAA
A
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AA AAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AA
AA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
3000
4000
5000
Milchleistung [kg/a]
Bild 1.4: Histogramme zur Stichprobe aus Tab. 1.8
6000
7000
1.1
Beschreibung eindimensionaler Stichproben
15
Das Histogramm einer Stichprobe hangt von der Festlegung der Klassenbreite und der
Reduktionslage ab. Fur das Beispiel der Milchleistungsstichprobe wurden in Bild 1.4
verschiedene Reduktionslagen und Klassenbreiten gewahlt. Wenn man die Reduktionslage von 3600 kg=a (Bild 1.4.a) auf 3700 kg=a erhoht (Bild 1.4.b), dann verschwindet
der bei 5200 kg=a zu beobachtende sog. Ruckschlag, d.h. ein Abfall und anschlieender Anstieg der Haugkeiten. Bild 1.4.c zeigt ein Histogramm mit sieben Klassen.
In Bild 1.4.d mit einer Klassenbreite von 1000 kg=a sind nur vier Klassen besetzt.
Diese Art der Darstellung ist aufgrund einer zu geringen Anzahl von Klassen fur eine
Haugkeitsverteilung ungeeignet.
1.1.6 Summenhaugkeitsfunktion einer Stichprobe
Die Stichprobe ist nicht in Klassen eingeteilt
Will ein Tierzuchter bei der Stichprobe uber die Ferkelzahl von 100 Jungsauen wissen,
wieviel Prozent der Tiere Ferkelzahlen von 10 oder weniger aufweisen, so kann er das
aus der Haugkeitstabelle 1.7 bzw. aus der Haugkeitsfunktion nicht sofort entnehmen.
Er mu die Haugkeiten fur die Ferkelzahlen 4; 5; : : : ; 10 aufsummieren:
0:01 + 0:00 + 0:03 + 0:09 + 0:10 + 0:18 + 0:20 = 0:61
61% der Tiere dieser Stichprobe haben also Ferkelzahlen von 10 oder weniger. Man
kann nun fur jede in Tab. 1.7 vorkommende Ferkelzahl xi fragen, wieviel Prozent der
Tiere weisen Ferkelzahlen von xi oder weniger auf und die entsprechenden relativen
Summenhaugkeiten berechnen. Damit hat man die Summenhaugkeitsfunktion oder die empirische Verteilungsfunktion Fe(x) der Stichprobe gewonnen.
Die Summenhaugkeitsfunktion Fe(x) einer diskreten Stichprobe ist also gleich der
Summe der relativen Haugkeiten aller Stichprobenwerte t, die kleiner als x oder gleich
x sind.
Tabelle 1.10 zeigt die Berechnung der Summenhaugkeitsfunktion fur die Ferkelzahlen
von Tab. 1.1.
Als Formel geschrieben lautet die Denition der Summenhaugkeitsfunktion:
Fe(x) =
Xe
tx
f (t)
(1.3)
Bild 1.5 enthalt die graphische Darstellung der Summenhaugkeitsfunktion (1.3) fur
die Ferkelzahlen von Tab. 1.1.
Die Stichprobe ist in Klassen eingeteilt
In diesem Fall mu man die Denition der Summenhaugkeitsfunktion etwas modizieren. In einer Klasse sind genau so viele Werte enthalten wie der absoluten Klassenhaugkeit entspricht.
Die Summenhaugkeitsfunktion an der Stelle x soll nach der bisherigen Auassung angeben, wieviele Werte kleiner oder gleich x sind. Bei einer klassizierten Stichprobe lat
16
1
Beschreibende und explorative Statistik
Anzahl der Fer- relative Hau- relative Summenkel pro Wurf xi gkeit fe(xi ) haugkeit Fe(xi )
4
0:01
0:01
5
0:00
0:01
6
0:03
0:04
7
0:09
0:13
8
0:10
0:23
9
0:18
0:41
10
0:20
0:61
11
0:16
0:77
12
0:11
0:88
13
0:05
0:93
14
0:04
0:97
15
0:02
0:99
16
0:01
1:00
Tabelle 1.10: Relative Summenhaugkeit der Ferkelzahlen aus Tab. 1.1
~
f
0.2
0.1
0.0
0
2
4
6
8
10
12
14
16 Ferkel
0
2
4
6
8
10
12
14
16 Ferkel
~
F
1.0
0.8
0.6
0.4
0.2
0.0
Bild 1.5: Haugkeits- und Summenhaugkeitsfunktion der Stichprobe aus Tabelle 1.1
sich diese Denition nicht exakt anwenden, weil die Werte in einer Klasse zusammengefat wurden und eine Zuordnung zu den x-Werten des Klassenintervalls nicht mehr
moglich ist. Die beste Moglichkeit ist, die Stichprobenwerte gedanklich in einer Klasse
gleichmaig uber die Intervallbreite zu verteilen. Man kann dann die Summenhaugkeitsfunktion als Polygonkurve zeichnen. Fe(x) verlauft dabei in jedem Klassenintervall
als Geradenstuckchen, welches jeweils vom linken bis zum rechten Klassenende um
1.1
Beschreibung eindimensionaler Stichproben
17
die betreende Klassenhaugkeit ansteigt. Diese Version der Summenhaugkeitsfunktion lat sich in vielen Fallen sinnvoll anwenden. Als Beispiel dient noch einmal die
Stichprobe aus Tab. 1.8 (siehe Tab. 1.11).
Klassen
: : : 3600
3600 : : : 4000
4000 : : : 4400
4400 : : : 4800
4800 : : : 5200
5200 : : : 5600
5600 : : : 6000
6000 : : : 6400
6400 : : : 6800
6800 : : :
relative Klassen- relative Summenhaugkeit fe(x) haugkeit Fe(x)
0:00
0:00
0:05
0:00 : : : 0:05
0:08
0:05 : : : 0:13
0:14
0:13 : : : 0:27
0:22
0:27 : : : 0:49
0:20
0:49 : : : 0:69
0:24
0:69 : : : 0:93
0:03
0:93 : : : 0:96
0:04
0:96 : : : 1:00
0:00
1:00
Tabelle 1.11: Relative Summenhaugkeit der Stichprobe von Tab. 1.8
Bild 1.6 zeigt die zugehorige Summenhaugkeitsfunktion.
~
f
0.3
0.2
0.1
0.0
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAA
AAAAAAAA
AAA
AAAAAAAAAAAAAAAA
AAAAAAA
AAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAA
AAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAA
AAAA
AAA
AAAAAAAAAAAA AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAA
AAA
3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a
~
F
1.0
0.8
0.6
0.4
0.2
0.0
3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a
Bild 1.6: Histogramm und Summenhaugkeitsfunktion der Stichprobe aus Tabelle 1.8
18
1
Beschreibende und explorative Statistik
1.1.7 Streudiagramme und Punkteplots
Eindimensionale Streudiagramme oder Scatter Plots stellen alle Einzelwerte
uber einem Zahlenstrahl dar. Sie sind besonders fur stetige Merkmale geeignet. Bild
1.7 zeigt das Streudiagramm fur die Milchleistungen aus Tab. 1.8.
Bild 1.7: Streudiagramm der Milchleistung aus Tabelle 1.8
Das Merkmal Ferkelzahl ist diskret. Infolgedessen werden im Streudiagramm gleiche
Werte mehrmals ubereinander gezeichnet. Besser ist in diesem Fall ein Punkteplot
oder Dotplot, bei dem gleiche groe Werte als Punkte ubereinander gezeichnet werden.
Er besitzt deshalb starke A hnlichkeit mit einem Haugkeitsdiagramm. Bild 1.8 zeigt
einen Punkteplot fur die Ferkelzahlen aus Tab. 1.1.
:
: :
: : :
: : :
: : : .
. : : : : :
: : : : : :
: : : : : : .
. : : : : : : : :
.
: : : : : : : : : : .
-+-------+-------+-------+-Ferkel
4.0
8.0
12.0
16.0
Bild 1.8: Punkteplot der Ferkelzahlen aus Tab. 1.1
1.1.8 Haugkeitsverteilungen bei nominalen Merkmalen
Tab. 1.12 zeigt die Haugkeitsverteilung von zehn Unkrautern auf einem Ackerachenstuck.
Bei einem nominalen Merkmal wird die absolute oder relative Haugkeit in der Regel
durch ein Balkendiagramm mit Zwischenraumen zwischen den Saulen prasentiert. Bild
1.9 zeigt das Balkendiagramm der Unkrautverteilung in Tab. 1.12.
Da bei einem nominalen Merkmal die Reihenfolge der Stichprobenwerte beliebig variiert
werden kann, ist es nicht sinnvoll, eine Summenhaugkeitsfunktion zu berechnen und
darzustellen.
Haug erfolgt die Darstellung der nach aufsteigenden oder abfallenden Haugkeiten
geordneten Werte im Balkendiagramm (Bild 1.10).
Beschreibung eindimensionaler Stichproben
19
Unkraut
Anzahl
Gansefu
13
Vogelmiere
30
Ehrenpreis
18
Ackerstiefmutterchen
9
Franzosenkraut
2
Hirtentaschel
8
Klettenlabkraut
17
Kamille
33
Kornblume
4
Klatschmohn
4
138
Tabelle 1.12: Unkrautverteilung auf einem Ackerachenstuck
35
absolute Häufigkeit
30
25
20
15
10
5
0
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
n
n
e
ß
is
el
ut
ut
re
lle
sefu lm ie npre rche nkra äsch bkra Kami rnblumchmoh
Gän Voge Ehre fmüttenzose irtentettenla
K o K l a ts
e
H
a
l
i
r
t
K
F
e rs
A ck
Bild 1.9: Balkendiagramm der Unkrautverteilung von Tab. 1.13
35
30
absolute Häufigkeit
1.1
25
20
15
10
5
0
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAAAAAA
AAA
AAAA
AAA
AAAAAAA
AAAA
AAAAAAA
AAA
AAAA
AAA
ille iere reis raut fuß hen chel me ohn raut
Kamogelm hrenpenlabk Gänse ütterctentäs ornblutschm osenk
E l e tt
K K la a n z
r
V
ti e f m H i
K
Fr
er s
A ck
Bild 1.10: Verteilung der Unkrauter in Tab. 1.12 nach fallenden Haugkeiten
20
1
Beschreibende und explorative Statistik
1.1.9 Haugkeitsverteilungen bei ordinalen Merkmalen
Bei einem ordinalen Merkmal wird die absolute oder relative Haugkeit wie bei nominalen Merkmalen dargestellt. Allerdings sollte die Anordnung der Merkmalswerte
in aufsteigender Form erfolgen, so da auch die Berechnung der Summenhaugkeiten
Sinn macht. Tab. 1.13 zeigt das Ergebnis der Schadklassenkartierung einer Stichprobe
von Baumen in einem Untersuchungsgebiet.
Schadstufe Baume relative Haugkeit Summenhaugkeit
ohne
31
0.248
0.248
schwach
48
0.384
0.632
mittel
19
0.152
0.784
stark
22
0.176
0.960
tot
5
0.040
1.000
125
1.000
Tabelle 1.13: Haugkeitsverteilung von Baumschaden
Bild 1.11 zeigt das Balkendiagramm der Stichprobe aus Tab. 1.13.
absolute Häufigkeit
50
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAA
AAAA
A
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAA
AAAA
AAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAA
AAAAAAAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAA
AAAAAAAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAA
AAAAAAAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAAAAAAA
A
AAAA
AAAAAAAAA
ohne
schwach
40
30
20
10
0
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
A
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAAAAAAA
A
AAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAA
AAAAAAAA
A
AAAAAAAA
AAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
A
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAA
AAAAAAAAAAAAA
A
AAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
mittel
stark
tot
Schadstufe
Bild 1.11: Balkendiagramm der Schadstufen aus Tabelle 1.13
1.2
Statistische Mazahlen eindimensionaler Stichproben
21
1.2 Statistische Mazahlen eindimensionaler Stichproben
Bei vielen praktischen Fragestellungen will man eine Reihe von Stichprobenwerten
durch einige charakteristische Mazahlen beschreiben. Man unterscheidet Mazahlen
der Lage oder der zentralen Tendenz (Mittelwerte), der Variabilitat (Streuungsmae)
sowie der Schiefe und Wolbung.
1.2.1 Arithmetischer Mittelwert
Zunachst soll die Stichprobe vom Umfang n mit den quantitativen Stichprobenwerten x1 ; x2 ; : : : ; xn durch einen Mittelwert gekennzeichnet werden. Mittelwerte werden
auch als Lageparameter bezeichnet. Der wichtigste Mittelwert ist der arithmetische
Mittelwert x der Stichprobenwerte. Er ist deniert als:
n
X
x = x1 + x2 +n : : : + xn = n1 xi
i=1
(1.4)
Beispiel:
Bei 5 Kuhen wurden folgende jahrlichen Milchleistungen (in kg=a) gemessen:
x1 = 5250, x2 = 4955, x3 = 4763, x4 = 5538, x5 = 4994
Die mittlere Milchleistung ist: x = 25500
5 = 5100
Eine weitere Stichprobe von 5 Kuhen brachte folgende Ergebnisse:
y1 = 5032, y2 = 4270, y3 = 4922, y4 = 5430, y5 = 5846
Die mittlere Milchleistung ist: y = 25500
5 = 5100
Die Summe der Stichprobenwerte betragt bei beiden Stichproben 25500. Damit sind
auch beide Mittelwerte x = y = 5100 gleich gro.
1.2.2 Spannweite und mittlere absolute Abweichung
Die Mittelwerte oder die durchschnittlichen Jahresmilchleistungen betragen in beiden
oben angefuhrten Stichproben 5100 kg. Die zweite Stichprobe unterscheidet sich jedoch
auallend von der ersten Stichprobe durch die weiter auseinanderliegenden Stichprobenwerte. Also wird der arithmetische Mittelwert zur Kennzeichnung einer Stichprobe
i.a. nicht ausreichen. Aus diesem Grund werden zusatzlich Mae fur die Streubreite der
Stichprobe eingefuhrt.
Als einfachstes Ma bietet sich die sogenannte Spannweite, Variationsbreite oder
Range R an. Sie ist deniert als Dierenz zwischen dem groten Stichprobenwert xmax
und dem kleinsten Stichprobenwert xmin:
R = xmax , xmin
(1.5)
22
1
Beschreibende und explorative Statistik
Die Spannweite R ist ein brauchbares Ma fur die Streuung, wenn die Stichprobe
nur wenige Mewerte umfat (etwa bis zu 10 Mewerten). Innerhalb der Spannweite
von xmin bis xmax liegen alle Stichprobenwerte. Die Spannweite spielt eine Rolle bei
der Festlegung der Klassenbreite, wenn man eine groere Stichprobe klassiziert. Sie
ist aber weniger geeignet zur Kennzeichnung der Streuung einer groen Anzahl von
Stichprobenwerten, vor allem weil sie stark von der Zahl der Stichprobenwerte abhangig
ist. Je groer die Anzahl der Beobachtungen ist, desto groer ist die Wahrscheinlichkeit,
da einzelne vom Mittelwert x stark abweichende Mewerte in der Stichprobe enthalten
sind.
Seltener wird die mittlere absolute Abweichung a vom Mittelwert x verwendet:
n
X
a = n1 jxi , xj
(1.6)
i=1
Dabei wird die Abweichung jxi , xj des Wertes xi vom Mittelwert x absolut genommen, obwohl die Handhabung mit den Absolutwerten etwas umstandlich ist. Fur kleine
Stichproben kann man jedoch die mittlere absolute Abweichung vom Mittelwert sowohl
aus rechentechnischen als auch aus sachlichen Grunden als Streuungsma benutzen.
Beispiel:
Fur die Stichproben des Beispiels von Seite 21 berechnen sich folgende Spannweiten
und mittleren absoluten Abweichungen in kg=a:
max
min
R
a
Stichprobe x Stichprobe y
5538
5846
4763
4270
775
1576
235
430
Bei identischen Mittelwerten von x = y = 5100 sind Spannweite und mittlere absolute
Abweichung bei der Stichprobe y praktisch doppelt so gro wie bei der Stichprobe x.
1.2.3 Empirische Varianz und Standardabweichung
U berwiegend wird bei quantitativen Daten als Streuungsma die mittlere quadratische Abweichung oder empirische Varianz verwendet. Dieses Streuungsma wird
ublicherweise mit s2 abgekurzt. Die Groe s2 ist fur n > 1 deniert als:
s2 =
n
1 X
2
n , 1 i=1 (xi , x)
(1.7)
Wenn die Stichprobenwerte nicht alle gleich gro sind, ist die Varianz immer groer als
Null. Die positive Quadratwurzel aus der Varianz s2 heit Standardabweichung der
Stichprobe oder empirische Standardabweichung und wird mit s bezeichnet. Die
1.2
Statistische Mazahlen eindimensionaler Stichproben
23
Standardabweichung s hat die gleiche Dimension wie die Stichprobenwerte. Es fallt auf,
da die Quadratsumme in Gleichung (1.7) durch n , 1 und nicht durch n dividiert wird.
Der Grund ist, da die Varianz s2 bestimmte Eigenschaften erfullen mu, die erst im
Zusammenhang mit der Wahrscheinlichkeitstheorie erklart werden konnen (vgl. Kap.
4.5.2). Anschaulich lat sich die Summe von n Summanden in Gleichung (1.7) auf eine
Summe von n , 1 Summanden reduzieren, da der Wert des n-ten Summanden bei fest
gegebenen Werten von s2 und x dann x ist. Man sagt auch, die Quadratsumme in
(1.7) hat n , 1 Freiheitsgrade.
Eine zu Gleichung (1.7) alternative Berechnungsformel fur die empirische Varianz
folgt durch Umformung der sog. Summe der Abweichungsquadrate oder Abweichungsquadratsumme:
n
X
n
X
i=1
n
X
(xi , x)2 =
=
=
i=1
i=1
n
X
i=1
(x2i , 2xi x + x2 ) =
x2 , nx2 =
i
x2i , n1 n
X
i=1
n
X
i=1
n
X
i=1
x2i , 2nx2 + nx2 =
n
X
x2i , n n1 xi
xi
!2
!2
i=1
=
(1.8)
Aus Gleichung (1.7) und (1.8) folgt:
0
n
n
X
X
s2 = n ,1 1 @ x2i , n1 xi
i=1
i=1
!21
A
(1.9)
Gleichung (1.9) ist gegenuber (1.7) bei Handrechnung vorzuziehen. Bei Anwendung von
(1.9) in Computern konnen jedoch in bestimmten Fallen sehr groe Rundungsfehler
auftreten, und zwar dann, wenn die beiden Ausdrucke in der obigen Klammer nahezu
gleich gro sind, d.h. wenn die Varianz im Vergleich zum Mittelwert sehr klein ist.
Beispiel:
Die Varianz der Stichprobe x des Beispiels von Seite 21 wird nach Gleichung (1.7)
berechnet, die der Stichprobe y nach Gleichung (1.9):
xi , x (xi , x)2
150
,145
,337
438
,106
22500
21025
113569
191844
11236
360174
yi
yi2
5032 25321024
4270 18232900
4922 24226084
5430 29484900
5846 34175716
25500 131440624
24
1
Beschreibende und explorative Statistik
s2x = 41 360174 = 90043:5 ) sx = 300 [kg=a]
s2y = 14 131440624 , 15 255002 = 347656 ) sy = 590 [kg=a]
Die empirische Varianz in der Stichprobe y ist also trotz gleicher Mittelwerte groer.
1.2.4 Mittelwert und Varianz bei klassizierten Stichproben
Haug ist die Stichprobe in einer Haugkeitstabelle oder in einem Histogramm zusammengefat, d.h. es kommen insgesamt m verschiedene Werte xi (i = 1; 2; : : :; m) vor mit
jeweils den absoluten Haugkeiten ni (i = 1; 2; : : :; m), wobei n1 + n2 + : : : + nm = n,
wenn n der Umfang der gesamten Stichprobe ist. Anstatt der absoluten Haugkeiten
ni konnen auch die relativen Haugkeiten hi zur Berechnung herangezogen werden.
Dies ist insbesondere dann notig, wenn der Gesamtstichprobenumfang n nicht bekannt
ist, weil er nicht in der Haugkeitstabelle oder im Histogramm angegeben wurde.
Das arithmetische Mittel x berechnet sich dann zu:
x = n1 m
X
m
X
i=1
i=1
(ni xi ) =
(hi xi )
(1.10)
Entsprechend lautet die Berechnungsformel fur die Varianz:
0
m
m
X
X
s2 = n ,1 1 @ (ni x2i ) , n1 (ni xi )
i=1
i=1
!
m
X
m
X
i=1
i=1
(hi x2i ) ,
(hi xi )
2
!2 1
A
(1.11)
Es ist zu beachten, da bei der Varianzschatzung uber die relativen Haugkeiten der
Stichprobenumfang eigentlich durch n statt durch n , 1 geteilt wird. Fur groere Stich1 ist.
proben ist dieser Fehler sehr gering, weil dann n1 n ,
1
Beispiel:
Die mittlere Ferkelzahl pro Wurf der Stichprobe aus Tab. 1.1 und ihre empirische
Varianz wird mit Hilfe der absoluten Haugkeiten aus Tab.1.7 berechnet.
1.2
Statistische Mazahlen eindimensionaler Stichproben
25
xi ni ni xi ni x2i
4
5
6
7
8
9
10
11
12
13
14
15
16
P
1
4
16
0
0
0
3
18
108
9
63
441
10
80
640
18 162 1458
20 200 2000
16 176 1936
11 132 1584
5
65
845
4
56
784
2
30
450
1
16
256
100 1002 10518
1 1002 = 10:02, s2 = 1 10518 , 1 10022 = 4:828 ) s = 2:197
x = 100
99
100
Auch bei klassiziertem Datenmaterial einer Stichprobe berechnet man Mittelwert und
Varianz mit Hilfe der Gleichungen (1.10) und (1.11). Man verfahrt so, als ob alle Stichprobenwerte einer Klasse auf der Klassenmitte liegen, allerdings unter der Voraussetzung, da keine oen endenden Intervalle wie z.B. x < a oder x > b vorkommen. Im
Falle klassizierter Stichproben fallt der Fehler bei der Varianzschatzung uber die relativen Haugkeiten nicht sehr ins Gewicht, da die Groe von Mittelwert und Varianz
von der Klasseneinteilung abhangen
Beispiel:
Als Beispiel dient die klassizierte Stichprobe der Milchleistungen aus Tab. 1.8. Es wird
angenommen, da der Stichprobenumfang unbekannt ist, also lediglich die relativen
Haugkeiten bekannt sind.
xi (Klassenmitte) hi
3800
0:05
4200
0:08
4600
0:14
5000
0:22
5400
0:20
5800
0:24
6200
0:03
6600
0:04
P
1:00
hi xi
hi x2i
190
722000
336 1411200
644 2962400
1100 5500000
1080 5832000
1392 8073600
186 1153200
264 1742400
5192 27296800
x = 5192 [kg=a], s2 = (27296800 , 51922) = 339936 ) s = 583 [kg=a]
26
1
Beschreibende und explorative Statistik
1.2.5 Gewogener arithmetischer Mittelwert
Der gewogene arithmetische Mittelwert wird verwendet, wenn die einzelnen Stich-
probenwerte xi nicht gleichberechtigt bei der Durchschnittsbildung mitwirken, sondern gewichtet werden sollen. Bei einer Diplomprufung gehen z.B. nicht alle Noten xi
(i = 1; 2; : : : ; m) der Prufungsfacher mit gleichem Gewicht in die Endnote x ein, sondern entsprechend den in der Prufungsordnung festgelegten Gewichten g1 ; g2; : : : ; gm ,
wobei g1 + g2 + : : : + gm = n. Das gewogene Mittel xgew berechnet sich dann zu:
xgew = n1 m
X
i=1
(gi xi )
(1.12)
Wenn man Mittelwerte x1 ; x2 ; : : : ; xm von mehreren Stichproben verschiedenen Umfangs vorliegen hat, kann man einen gemeinsamen Mittelwert x ausrechnen, indem man
entsprechend den Stichprobenumfangen n1 ; n2 ; : : : ; nm gewichtet:
m
X
(ni xi )
n
x
+
n
x
+
:
:
:
+
n
x
1
1
2
2
m
m
i
=1
x = n +n +:::+n
= X
m
1
2
m
ni
(1.13)
i=1
Beispiel:
Auf einem Versuchsgut in Weihenstephan wurden folgende Ernteertrage erzielt:
Winterweizen
Sommerweizen
Wintergerste
Sommergerste
Hafer
dt=ha ha
63:4 15:1
54:8 14:5
56:4 7:0
51:2 8:1
45:9 8:3
53:0
Der durchschnittliche Getreideertrag aller Flachen errechnet sich dann durch Gewichtung der einzelnen Ertrage mit ihren Flachen:
x = 63:4 15:1 + 54:8 14:5 + 5653:4:0 7:0 + 51:2 8:1 + 45:9 8:3 = 55:52
Das gewogene arithmetische Mittel wird insbesondere in der amtlichen Statistik zur
Berechnung von sog. Indizes verwendet (z.B. Lebenshaltungskostenindex, Index der
Grohandelspreise, Aktienindex usw.).
1.2
Statistische Mazahlen eindimensionaler Stichproben
27
1.2.6 Geometrischer Mittelwert
Die Denition des geometrischen Mittels xgeom aus n positiven Beobachtungswerten
x1 ; x2 ; : : : ; xn lautet:
xgeom = pn x1 x2 : : : xn
(1.14)
Es ist log xgeom = n1 (log x1 + log x2 + : : : + log xn ), d.h. der Logarithmus des geometrischen Mittels xgeom ist gleich dem arithmetischen Mittel der Logarithmen der
Stichprobenwerte.
Das geometrische Mittel ist stets kleiner als das arithmetische Mittel (nur wenn alle Stichprobenwerte gleich sind, fallen die beiden Mittel zusammen). Eine sinnvolle
Anwendung des geometrischen Mittels ist angebracht, wenn man relative A nderungen
mitteln will, z.B. bei Wachstumsvorgangen, bei denen sich eine Variable mit der Zeit in
annahernd konstantem Verhaltnis andert oder wenn die Variationsbreite der Stichprobenwerte im Vergleich zum arithmetischen Mittelwert sehr gro ist. Das geometrische
Mittel wird namlich durch Extremwerte nicht so stark beeinut wie das arithmetische
Mittel oder anders ausgedruckt, wenn die Stichprobenwerte annahernd logarithmisch
normalverteilt sind (siehe Kap. 3.2).
Beispiel:
Gegeben seien die Absatzsteigerungen eines Unternehmens von 5%, 7% und 12% in drei
aufeinanderfolgenden Jahren. Die Prozentzahlen sind dabei jeweils auf den vorjahrigen
Absatz bezogen. Wie gro ist die durchschnittliche Absatzsteigerung x?
Man mu x so berechnen, da die dreimalige Anwendung der durchschnittlichen Absatzsteigerung x zum gleichen Ergebnis fuhrt wie die oben angefuhrten verschiedenen
Steigerungsraten x1 = 0:05, x2 = 0:07 und x3 = 0:12, also:
(1 + x)3 = (1 + x1 ) (1 + x2 ) (1 + x3 ) = 1:05 1:07 1:12 )
p
p
1 + x = 3 1:05 1:07 11:2 ) x = 3 1:25832 , 1 = 0:0796 8%
Der durchschnittliche Multiplikationsfaktor 1 + x ist also das geometrische Mittel aus
den drei unterschiedlichen Multiplikationsfaktoren 1:05, 1:07 und 1:12.
Man kann zeigen, da das geometrische Mittel xgeom von Stichprobenwerten xi > 0
mit dem arithmetischen Mittel x sehr gut ubereinstimmt, wenn die relative Abweichung
xi , x der Stichprobenwerte dem Betrag nach sehr klein ist.
x
1.2.7 Variationskoezient
Sehr oft interessiert nicht die Standardabweichung s allein, sondern ihre Relation zum
Mittelwert. Dieses relative Ma der Standardabweichung prozentual bezogen auf den
arithmetischen Mittelwert heit Variationskoezient (VK).
VK = xs
(1.15)
28
1
Beschreibende und explorative Statistik
Mit Hilfe des Variationskoezienten kann man die Streuung oder die Variation zweier
Merkmale miteinander vergleichen, die in verschiedenen Maeinheiten gemessen wurden.
Wenig Sinn hat die Verwendung des Variationskoezienten, wenn in die Berechnung
von x auch negative Beobachtungswerte eingehen.
Beispiel:
Tab. 1.14 zeigt die Mittelwerte und Standardabweichungen fur eine Reihe verschiedener Merkmale (Stichprobenumfang n = 30), die bei der Schweinemastprufung erfat
werden. Aus der Spalte des Variationskoezienten ist zu entnehmen, da die Merkmale
der Mastleistung (tagliche Zunahme, Futterverwertung) weniger variabel sind als die
Merkmale der Schlachtkorperqualitat.
Merkmal
x
s
VK [%]
tagl. Zunahme
720.2 g
46.3 g
6.43
Futterverwertung
3.016
0.164
5.44
99.53 cm 2.78 cm
2.79
Korperlange
Schlachtkorpergewicht 77.083 kg 2.535 kg
3.29
Ruckenspeckdicke
2.86 cm 0.35 cm 12.24
Seitenspeckdicke
3.08 cm 0.62 cm 20.13
Fleischache
33.30 cm2 3.70 cm2 11.11
Fettache
24.91 cm2 4.14 cm2 16.62
Tabelle 1.14: Mittelwert x, Standardabweichung s sowie Variationskoezient VK
verschiedener Merkmale einer Stichprobe uber die Mastleistung und
Schlachtkorperqualitat bei Schweinen
1.2.8 Median oder Zentralwert
Wenn man die Mewerte xi der Groe nach ordnet, so liegt der Zentralwert oder
Median xe in der Mitte dieser Stichprobenwerte. Links und rechts von xe liegen gleich
viele Stichprobenwerte oder Beobachtungen. Wenn eine ungerade Zahl von Beobachtungen vorliegt, so ist der Zentralwert eindeutig als die mittlere Beobachtung deniert.
Bei einer geraden Zahl von Beobachtungen ist der Zentralwert nicht mehr eindeutig,
sondern eine Zahl zwischen den beiden mittleren Beobachtungen. Meist nimmt man
dann die Mitte dieser beiden mittleren Beobachtungen (vgl. Bild 1.12).
Bereich fur xe
xe
x1
x2 x3
n =-7
x4 x5 x6 x7
x1
x2 x3
n =-6
x4 x5 x6
Bild 1.12: Median bei einer ungeraden und geraden Anzahl von Stichprobenwerten
Der Median hat z.B. den Vorteil, da man ihn bei einer Rangskala, also bei ordinalen
Daten verwenden kann, bei der die Berechnung des arithmetischen Mittels nicht mehr
moglich ist.
1.2
Statistische Mazahlen eindimensionaler Stichproben
29
Beispiele:
1. Der Median bei der Schadklassenkartierung von Baumen in Tab. 1.13 ist die Schadstufe des 63: Baums, also xe = schwach. Das heit, die eine Halfte aller Baume
ist schwach oder nicht geschadigt, die andere Halfte ist schwach oder schlimmer
geschadigt. Man kann auch die Haugkeiten fur die Schadstufen berechnen und anschlieend die Summenhaugkeiten bestimmen. Der Median der Verteilung nimmt
dann den Wert an, an dem die Summenhaugkeitsfunktion den Wert 0:5 erreicht.
2. Aus Tab. 1.10 uber die Stichprobe der Ferkelzahlen ist der Median leicht als xe = 10
abzulesen, da die Summenhaugkeitsfunktion bei 10 Ferkeln den Wert 0:5 uberschreitet. Im vorliegenden Fall gibt es auch keine Probleme mit dem geradzahligen
Stichprobenumfang, da die nachst niedrigere und hohere Ferkelzahl ebenfalls 10
betragt. Die Halfte aller Sauen hat also 10 oder weniger Ferkel/Wurf, die andere Halfte 10 oder mehr. Mittelwert x = 10:2 und Median xe = 10 sind hier fast
identisch.
Der Median wird von den speziellen Werten der groten und kleinsten Beobachtung
nicht beruhrt und er stellt daher ein \robusteres\ Ma der Lage oder der zentralen
Tendenz dar als der arithmetische Mittelwert. Robust bedeutet in diesem Zusammenhang, da xe von moglichen \Ausreierwerten\ der Stichprobe nicht oder viel weniger
abhangig ist als der Mittelwert x.
Wenn die Stichprobenwerte bei einer stetigen Variablen klassiziert sind, gibt man als
Zentralwert entweder nur die Medianklasse an, also die Klasse, in der der Zentralwert
liegt, oder man liest in der Summenhaugkeitsfunktion den zu Fe(x) = 0:5 gehorigen
Wert auf der Abszisse ab. Eine lineare Interpolation mit Hilfe der Summenhaugkeitsfunktion kann auch uber folgende Interpolationsformel erfolgen:
e
xe = u + b 0:5e, F (u) ;
fMedian
(1.16)
wobei u die untere Klassengrenze der Medianklasse, b die Klassenbreite, Fe(u) der Wert
der Summenhaugkeitsfunktion an der unteren Grenze der Medianklasse und feMedian
die relative Haugkeit der Medianklasse ist.
Beispiel:
Es wird die klassizierte Stichprobe der Milchleistungen von Tab. 1.11 betrachtet. Die
Medianklasse ist das Intervall von 5200 : : : 5600. In der Summenhaugkeitsfunktion von
Bild 1.6 kann man bei Fe(0:5) den Median zu etwa xe = 5200 abschatzen. Dies korrespondiert auch mit den Werten in Tab. 1.11, denn bei 5200 hat die Summenhaugkeitsfunktion bereits den Wert 0:49 und 0:50 wird bei einem geringfugig hoheren Wert
erreicht. Mit Hilfe von Gleichung (1.16) wird der Median zu
xe = 5200 + 400 0:50,:200:49 = 5220
geschatzt. Der wahre Median, der aus den Originaldaten von Tab. 1.8 berechnet wurde,
liegt zwischen 5221 und 5242. Das Mittel aus diesen beiden Werten ist 5231:5. Das
arithmetische Mittel x = 5188:67 ist hier etwas kleiner als der Median.
30
1
Beschreibende und explorative Statistik
Der Zentralwert hat die charakteristische Eigenschaft, da die Summe der absoluten
Abweichungen der Beobachtungen xi von ihrem Zentralwert xe kleiner ist als von jeder
anderen Zahl. Diese Summe ist also ein Minimum.
1.2.9 Modus oder Dichtemittel
Der Modalwert, Modus oder das Dichtemittel xd ist derjenige Stichprobenwert,
der am haugsten vorkommt.
Beispiel:
Bei der Stichprobe mit den Ferkelzahlen von Tab. 1.1 ist die Ferkelzahl xd = 10 der
Modalwert (vgl. Bild 1.3).
Es konnen in einer Stichprobe mehrere modale Werte vorkommen. So unterscheidet
man neben unimodalen oder eingipigen Verteilungen auch bimodale oder zweigipige und schlielich multimodale oder mehrgipige Verteilungen. Ein Dichtemittel ist in solchen Fallen jeweils als ein Wert bestimmt, der hauger vorkommt als
seine Nachbarwerte. So spricht man auch genauer vom haugsten Wert als dem
absoluten Dichtemittel oder dem 1. Modalwert und bezeichnet weitere relative Dichtemittel als 2. Modalwert usw.
Beispiel:
Bei der Stichprobe in Bild 1.11 ist die Schadstufe schwach der erste Modus und die
Schadstufe stark der zweite Modus.
Bei nominalen bzw. kategorialen Daten ist nur die Bestimmung des ersten Dichtemittels
moglich. Andere Mittel konnen in diesem Fall nicht bestimmt werden.
Beispiel:
Bei der Unkrautverteilung in Bild 1.9 macht nur das erste Dichtemittel bei der Kamille
als Lageparameter Sinn, da die Anordnung der Nominaldaten auf der Abszisse beliebig
variiert werden kann (vgl. Bild 1.10).
Es ist einleuchtend, da bei einer ausgepragten Mehrgipigkeit einer Verteilung die
Dichtemittel diese Verteilung besser beschreiben konnen als das arithmetische Mittel
oder der Median, da deren Groe in einem Bereich liegen konnen, in denen sehr wenige
oder im Extremfall gar keine Mewerte liegen.
1.2
Statistische Mazahlen eindimensionaler Stichproben
31
Beispiel:
Bild 1.13 zeigt die Haugkeitsverteilung der in einer zweiwochigen Beobachtungsperiode gelegten Eier von Huhnern.
0.25
relative Häufigkeit
0.20
0.15
29
AAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAA
AAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAA
AAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAAA
A
AAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAA
AAAAAAAAA
AAAAAAAA
A
AAAAAAAAAAAAA
AAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
A
AAAAAAAAAAAAA
A
AAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAAA
AAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAAA
A
AAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAAA
AAAA
AAAAAAAAAAAAA
AAAAAAAA
A
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAAAAAA
AAAAA
AAAA
AAAA
AAAAAAAAA
AAAA
AAAAAAAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAAAAAA
AAAAA
AAAAAAAA
A AAAAAAAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAA
A AAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAA
AAAAA
AAAA
AAAA
A AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAAAAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAA
AAAA
A
AAAA
AAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAA
AAAA
A
AAAA
AAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
A
A AAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAA
AAAA
AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
AAAA
AAAA
A
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAA
A AAAA
A AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A AAAAAAAA
A AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAA
AAAAAAAA
A AAAAAAAA
AAAAAAAA
AAAA
A
A
23
15
0.10
0.05
14
13
13
6
4
2
1
0.00
4
5
6
7
8
9
10
11
12
13
Anzahl der Eier
Bild 1.13: Histogramm der Anzahl von Huhnereiern
Mittelwert und Median x = xe = 9 fallen genau in einen Bereich, in denen die Haugkeit
sehr gering ist. Der erste Modus bei 11 und der zweite Modus bei 7 beschreiben die
Verteilung als Lageparameter viel besser. Dies wird auch klar, wenn man wei, da
das Histogramm in Bild 1.13 die Eianzahl zweier Huhnerrassen ist, deren Mittelwerte
getrennt nach Rassen jeweils 7 und 11 betragt.
Bei diskreten Merkmalsauspragungen ist die Bestimmung der Dichtemittel relativ einfach und klar. Wie geht man jedoch bei stetigen Merkmalswerten vor, wenn also eine
klassizierte Verteilung in Form eines Histogramms vorliegt? Entweder nimmt man die
gesamte Klassenbreite oder die Klassenmitte als Modus oder man pat der Verteilung
in der Umgebung des zu bestimmenden Dichtemittels, also an der am starksten besetzten Klasse sowie den beiden Nachbarklassen, eine Interpolationsparabel an und nimmt
die Stelle, an der die Parabel ihr Maximum hat, als Dichtemittel an dieser Stelle.
Beispiel:
Bild 1.14 zeigt die Verteilung der Schlafdauer von 150 Probanden beim Test eines
Schlafmittels.
Die haugsten Schlafdauern liegen zwischen 7 und 8 Stunden. Die Klassenmitte dieses
Intervalls von 7:5 als Dichtemittel anzugeben ist hier nicht sehr elegant. Eine Schatzung
kann durch Interpolation erfolgen, wenn man eine Parabel durch die Punkte (6:5; 44),
(7:5; 61) und (8:5; 26) legt. Diese Parabel bestimmt man leicht zu ,26x2 +381x , 1334.
Die erste Ableitung gleich Null gesetzt ergibt ,52x + 381 = 0. Daraus folgt xd =
7:3296 7:33.
Auch bei sehr schiefen Verteilungen (vgl. Kap. 1.2.13) kann das Dichtemittel ein geeignetes Ma fur die Verteilung sein.
32
1
absolute Häufigkeit
60
50
40
30
20
10
61
AAAAAAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAAA
AAAA
AAAAAAAAAAAAA
AAAA
A
AAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
A
AAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAAA
AAAAAAAA
A
AAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAA
AAAAAAAA
A
AAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AA
AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AA
AAAAAAAA
A
AAAAAAAAAA
AAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AA
AAAAAAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAA
AA
AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
A
AAAAAAAAAA
AAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAA
AA
AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAA
AAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
A
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AAAA
A AAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AA
A AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AAAA
AA
A AAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAA
AAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AAAA
AA
A AAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAA
AA
AAAAAAAAAAAAAAAAAAAA
AAAA
AA
A AAAAAAAAAAAAAA
AAAA
AAAA
A AAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAA
AAAA
AAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AAAA
AA
A AAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAA
AAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AA
AAAA
AAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AA
AAAA
AA
AAAA
AAAA
A AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
A AAAA
A
AAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAA
AAAA
AAAA
A
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
A AAAA
AAAAAA
AAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AAAA
A
A
AAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AA
A AAAAAAAAAAAAAA
A AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAA
AAAAAAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
A AAAAAAAAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A
AAAAAAAAAAAAAA
AAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAAAAAAAAAAAA
44
26
2
3
8
6
3
2
0
Beschreibende und explorative Statistik
4
5
6
7
8
9
Schlafdauer [h]
Bild 1.14: Histogramm der Schlafzeiten von 150 Personen
Beispiel:
Es liegen folgende DM-Betrage als Stichprobenwerte einer Spendenaktion vor:
100000.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 50.{ DM
Das arithmetische Mittel x ist rund 16741.{ DM. Wenn man behauptet, da im Durchschnitt rund 16741.{ DM gespendet wurden, so ist dies zwar mathematisch richtig, trit
aber nicht den Kern der Sache. Hier verwendet man besser den Modalwert, und man
kann in diesem Falle sagen: Die haugste Spende betrug 100.{ DM.
1.2.10 Standardfehler des arithmetischen Mittels
Das arithmetische Mittel x einer Stichprobe wird haug als Approximation oder Schatzwert des unbekannten Mittelwerts der dazugehorigen Grundgesamtheit verwendet. Die
Varianz s2 der Stichprobe ist entsprechend ein Schatzwert fur die unbekannte Varianz
in der Grundgesamtheit (vgl. 4.5).
Entnimmt man einer unendlich groen Grundgesamtheit mehrere Stichproben und berechnet jeweils das Stichprobenmittel, so stellt man fest, da diese Stichprobenmittelwerte weniger streuen als die Einzelbeobachtungen einer Stichprobe. Die Standardabweichung dieser Stichprobenmittelwerte ist ein Ma fur die Variabilitat der Stichprobenmittelwerte. Es ist einsichtig, da die Abweichung eines Stichprobenmittels x vom
unbekannten Mittelwert der Grundgesamtheit umso kleiner ist, je kleiner die Streuung
fur die Einzelwerte in der Grundgesamtheit ist und je groer der Stichprobenumfang
ist.
Stellt man sich nun gedanklich eine unendliche Wiederholung der Stichprobenziehung
mit anschlieender Berechnung des arithmetischen Mittelwerts vor, so kommt man
zu einer (hypothetischen) Grundgesamtheit von Stichprobenmittelwerten, die jeweils
aus einem Umfang n berechnet wurden. Es besteht eine einfache Beziehung zwischen
der Standardabweichung in der Grundgesamtheit der arithmetischen Mittelwerte und
der Standardabweichung in der Grundgesamtheit der Einzelwerte, deren genaue Begrundung im Zusammenhang mit der Verteilung von Zufallsgroen ersichtlich wird.
1.2
Statistische Mazahlen eindimensionaler Stichproben
33
Indem man diese Beziehung auf die Schatzwerte ubertragt, wird der spateren Herleitung (vgl. 3.1.3) vorausgegrien. Der Schatzwert fur die Standardabweichung des
arithmetischen Mittels x heit auch Standardfehler des arithmetischen Mittelwerts sx.
Es gilt:
sx = psn =
=
v
u
n
u
t 1 X(xi , x)2 =
n (n , 1) i=1
v
0n
1
u
n !2
u
X
X
1
1
u
t n (n , 1) @ x2i , n
xi A
i=1
(1.17)
i=1
In der Physik bezeichnet man sx auch als mittleren Fehler. Jede Stichprobe liefert
namlich zufallige Werte fur die einzelnen xi und somit auch fur den Mittelwert x. Das
Streuungsma der Standardabweichung wird dabei als \mittlere\ Abweichung interpretiert. So wird die Standardabweichung s als mittlerer Fehler fur ein xi bzw. eine
Einzelbeobachtung bezeichnet, und der Standardfehler sx wird als mittlerer Fehler des
Mittelwerts bezeichnet.
1.2.11 Zur Wahl eines Mittelwerts
Jeder Mittelwert gibt stellvertretend fur eine ganze Reihe von Einzelwerten einen einzigen Wert als Lageparameter an. Ein Mittel kann deshalb nicht kurz in einer einzigen
Zahl das Wesentliche ausdrucken und gleichzeitig alle Details der Haugkeitsverteilung enthullen. Ein Mittelwert verdeckt und glattet unter Umstanden Extremwerte
und wird je nach Denition mehr oder weniger von ihnen beeinut. Um das richtige Mittel zu nden, uberlegt man sich vorher, welcher Lageparameter am besten zur
Charakterisierung der Daten geeignet ist.
Am haugsten wird das arithmetische Mittel verwendet. Die Vorteile des arithmetischen Mittels sind:
1. Multiplikation mit der Anzahl n ergibt die Summe der insgesamt beobachteten
Merkmalswerte.
2. Die arithmetischen Mittelwerte verschiedener Gruppen konnen kombiniert werden.
Durch ein gewogenes Mittel ndet man das arithmetische Mittel der kombinierten
Gruppen.
3.
n
X
(xi , x) = 0, d.h. die Summe der positiven und der negativen Abweichungen
sind der Groe nach gleich.
i=1
n
X
4. Die Summe der quadratischen Abweichungen (xi , x)2 ist kleiner als fur jede
i=1
andere Zahl.
34
1
Beschreibende und explorative Statistik
Der zweitwichtigste Mittelwert ist der Zentralwert oder Median. Er teilt die Beobachtungen in zwei Halften, d.h. links und rechts von ihm liegen jeweils 50% der Beobachtungswerte. Bei ungeradem n fallt der Median genau auf den mittelsten Beobachtungswert, den man \halb zur linken und halb zur rechten Gruppe\ der Beobachtungswerte
zahlt. Wenn man wei, da die betrachtete Verteilung symmetrisch ist, kann man den
leichter zu bestimmenden Zentralwert als gute Schatzung fur das arithmetische Mittel
heranziehen. Der Zentralwert kann im Gegensatz zum arithmetischen Mittel bei einer klassizierten Haugkeitsverteilung auch berechnet werden, wenn diese Verteilung
oen-endende Klassen enthalt. Bei ordinalen Daten ist der Zentralwert das Mittelwertsma der Wahl.
Der Modalwert oder das Dichtemittel ist sinnvoll, wenn man den gewohnlichsten oder
haugsten Wert charakterisieren will, insbesondere bei stark unsymmetrischen oder
schiefen Verteilungen. Bei nominalen Daten kann als Lageparameter ausschlielich das
Dichtemittel angegeben werden.
Das geometrische Mittel ist zur Messung des Mittels einer Veranderung angebracht,
wenn man eine durchschnittliche Veranderungsrate berechnen mochte. Das geometrische Mittel oder auch der Median charakterisieren solche unsymmetrischen Verteilungen von positiven Werten gut, die durch U bergang auf die Logarithmen dieser Werte
in eine symmetrische Verteilung transformiert werden.
Bei einer symmetrischen eingipigen Verteilung fallen Modalwert, Median und arithmetisches Mittel zusammen. Bei unsymmetrischen Verteilungen weichen diese drei Mittel
mehr oder weniger voneinander ab. Es reicht in solchen Fallen nicht immer aus, nur ein
bestimmtes Mittel anzugeben, um die Lage der Verteilung zu charakterisieren. Neben
Mittelwert gibt man dann noch Schiefe und evtl. Wolbung an (vgl. Kap. 1.2.13).
In der beurteilenden Statistik wird bei quantitativen Beobachtungen vorwiegend das
arithmetische Mittel x als Lageparameter und die Standardabweichung s als Variabilitatsma verwendet. Der Grund ist, da diese Mazahlen einer Stichprobe optimale
Approximationseigenschaften (vgl. Kap. 4.5.2) in Bezug auf die analogen Mazahlen
der Grundgesamtheit haben, insbesondere wenn man fur die Verteilung der Grundgesamtheit die Normalverteilung (vgl. Kap. 3.1) voraussetzt.
So besitzt das arithmetische Mittel die kleinste Varianz unter allen moglichen Mittelwerten (vgl. Eigenschaft 4 oben) und strebt mit wachsendem Umfang der Stichprobe
\am besten\ gegen den unbekannten Mittelwert der Grundgesamtheit.
Lat man jedoch die Annahmen der Normalverteilung fallen und setzt beispielsweise
eine Laplace-Verteilung (vgl. Kap. 4.5.2) fur die Grundgesamtheit voraus, dann ist der
Median als Lageparameter dem arithmetischen Mittel eindeutig vorzuziehen.
Normalverteilung und Laplace-Verteilung sind beide symmetrische Verteilungen, unterscheiden sich aber dadurch, da die Laplace-Verteilung \dickschwanziger\ ist, d.h.
groere Abweichungen vom Mittelwert sind wahrscheinlicher als bei der Normalverteilung.
Nimmt man fur die Grundgesamtheit eine gegenuber der Laplace-Verteilung noch dickschwanzigere Verteilung an, z.B. eine Cauchy-Verteilung (vgl. Kap. 4.5.2), dann kann
man zeigen, da das arithmetische Mittel x als Ma der zentralen Tendenz sinnlos wird.
Auch in diesem Fall ist es angebracht, den Median als Lageparameter zu verwenden.
1.2
Statistische Mazahlen eindimensionaler Stichproben
35
Neben arithmetischem Mittelwert und Median verwendet man im Rahmen der sog. robusten Statistik weitere Mittelwerte zur Beschreibung und Schatzung der zentralen
Tendenz. Diese \robusten\ Mittelwerte versuchen, unabhangig von der Verteilung der
zugrundeliegenden Grundgesamtheit, aus der man sich die Stichprobe gezogen denkt,
moglichst eziente Schatzungen der zentralen Tendenz zu liefern (vgl. Kap. 4.5.2).
Solche Mittelwerte sind z.B. die getrimmten Mittelwerte. Diese werden berechnet,
indem man vom oberen und unteren Ende der geordneten Stichprobenwerte jeweils
einen bestimmten Prozentsatz der Beobachtungen weglat und das arithmetische Mittel aus den restlichen Beobachtungen errechnet. Fur das 5%-getrimmte Mittel x5%
(manchmal sagt man auch gestutztes Mittel) werden also jeweils die 5% groten
und kleinsten Werte der Stichprobe abgeschnitten und aus den restlichen 90% der
Werte wird das arithmetische Mittel berechnet. Diese getrimmten Mittelwerte haben
den Vorteil, robust gegenuber Ausreiern zu sein. Ausreier sind Beobachtungen, die
weit entfernt vom uberwiegenden Teil der Beobachtungen liegen, z.B. falsch notierte Werte, also grobe Fehler. Die Identizierung von Ausreiern ist nicht einfach. Ein
einziger Ausreier kann aber das arithmetische Mittel als Schatzwert fur den Lageparameter vollig unbrauchbar machen. Der 5%-getrimmte Mittelwert dagegen toleriert 5%
Ausreier auf beiden Seiten der Stichprobenwerte. Er verliert andererseits nur wenige
Prozent an Ezienz bei der Schatzung des Lageparameters (vgl. Kap. 4.5.2).
1.2.12 Zur Wahl eines Streuungsmaes
Anschaulich ist die Streuung einer Verteilung durch die Spannweite R, also die Differenz zwischen groter und kleinster Beobachtung, charakterisierbar. Bei Stichprobenumfangen bis etwa 10 kann man die Spannweite noch gut als Streuungsma im
beschreibenden Sinne verwenden. Bei groeren Stichproben sagt die Spannweite aber
wenig daruber aus, wie die Einzelwerte um den Mittelwert streuen, weil mit wachsendem n auch die Wahrscheinlichkeit zunimmt, da Ausreier auftreten, die die Spannweite als Streuungsma verzerren.
Bei quantitativen Daten verwendet man in der Regel die Standardabweichung s bzw.
die Varianz s2 als Streuungsma. In Verbindung mit dem arithmetischen Mittel gibt
die Standardabweichung einen brauchbaren U berblick uber die empirische Verteilung
der Stichprobe, wenn man Normalverteilung voraussetzt. Die Standardabweichung ist
neben dem Mittelwert ein entscheidender Parameter der Normalverteilung. In Kapitel
3.1 wird gezeigt, da rund 68% aller Beobachtungen um hochstens eine Standardabweichung vom Mittelwert nach links oder rechts entfernt und rund 95% aller Beobachtungen um hochstens zwei Standardabweichungen nach links oder rechts vom Mittelwert
entfernt liegen.
Bei ordinalen Daten, aber auch im Rahmen der explorativen Statistik, verwendet man
als Streuungsma den sog. Quartilsabstand. Dieser ist unempndlich gegen Ausreier
und stellt daher ein robustes Streuungsma dar. Um den Quartilsabstand zu erklaren,
denkt man sich die Stichprobenwerte der Groe nach geordnet und teilt die Daten in
etwa gleich groe Gruppen auf. Bei 4 Gruppen gelangt man zu den Quartilen Q1 ,
Q2 , Q3 . Diese teilen die gesamte Spannweite xmin bis xmax so auf, da vier Gruppen
entstehen, welche jeweils 25% der Stichprobenwerte enthalten (Bild 1.15). Als Streuungsma bietet sich dann der Interquartilsabstand Q3 , Q1 an, also der Bereich, in
dem die mittleren 50% der Beobachtungen liegen.
36
1
Q1
xmin
25%
Beschreibende und explorative Statistik
Q2 = Median
Q3
Q3 , Q1
-
xmax
50%
25%
Bild 1.15: Interquartilsabstand Q3 , Q1 als Streuungsma
Ein weiteres sehr robustes Streuungsma ist die sog. Median-Abweichung MAD (von
engl. median absolute deviation). Man erhalt sie, wenn man in Gleichung (1.6) fur die
Berechnung der mittleren absoluten Abweichung jeweils die arithmetische Mittelwertbildung durch den Median ersetzt:
MAD = Median (jxi , xej)
(1.18)
Auch im Bereich (xe , MAD : : : xe + MAD) liegen 50% der Stichprobenwerte. Zum Vergleich: Im Bereich (x , s : : : x + s) liegen ca. 2=3 der Stichprobenwerte.
1.2.13 Schiefe
Das Dichtemittel weicht bei quantitativen Daten umso starker vom arithmetischen
Mittel ab, je unsymmetrischer eine Verteilung ist. Bild 1.16 zeigt eine solche unsymmetrische Verteilung. Darin sind Weizenblatter auf ihren Befall nach einer Skala
von 0 (kein Befall) bis 9 (Totalbefall) bonitiert.
25
24
AAAAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
A
AAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAA
AA AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAA AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAA
AA AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAA AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
A
A AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
A
A AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAA
AAAAAAAA
A
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAA
A
AAAAAAAA
AAAA
AAAA
A
AA AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
A
A AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AA AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
A
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
A
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
AAA AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
A AAAA
A
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
A
A AAAA
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
A AAAA
A AAAA
A AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
A
A AAAAAAAA
A AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
A
A
A
AA AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
A
AAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
A AAAA
A AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
A
AAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
A AAAA
A AAAA
A AAAA
A AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
A
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAA
A AAAA
A AAAA
A AAAA
AAAA
AA AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
A
A
AAA AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
A
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAA
A
A
A
AAAAAAAAAAAAAAAA
A AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
A AAAA
AAAAAAAA
AAAAAAAAA
A
AAAAAAAA
A AAAAAAAAAAAA
A AAAAAAAA
A AAAAAAAAAAAA
A AAAAAAAA
absolute Häufigkeit
21
20
15
10
15
10
7
5
5
3
3
1
0
0
1
1
2
3
4
5
6
7
8
9
Mehltaubonitur
Bild 1.16: Bonitur des Mehltaubefalls von Weizenblattern
Der Modus der Verteilung in Bild 1.16 ist xd = 1, das arithmetische Mittel ist x = 3.
Der Median xe = 2 liegt zwischen Dichtemittel und arithmetischem Mittelwert und
teilt die Verteilung in zwei gleiche Halften. Das arithmetische Mittel ist in diesem Fall
das grote Mittel. Man nennt die Verteilung in Bild 1.16 linkssteil, linksschief oder
positiv schief. Eine linksschiefe Verteilung ist typisch fur Bonituren, da starke Befalle
wesentlich weniger haug auftreten als geringe Befalle.
1.2
Statistische Mazahlen eindimensionaler Stichproben
37
Eine Verteilung wie in Bild 1.14 nennt man rechtssteil, rechtsschief oder negativ
schief . Fur die Stichprobe der Schlafdauern in Bild 1.14 ist im Unterschied zur linksschiefen Verteilung von Bild 1.16 das arithmetische Mittel x = 7:0 h der kleinste, der
Median xe = 7:2 der mittlere und der Modalwert xd = 7:3 h der grote Lageparameter.
Eine extrem linksschiefe Verteilung, deren Modalwert ganz links liegt, wird als LVerteilung bezeichnet. Bild 1.17 zeigt eine L-Verteilung des Betriebseinkommens einer
Stichprobe von 25 landwirtschaftlichen Betrieben.
absolute Häufigkeit
10
8
6
4
2
0
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
00 00 00 00 00 00 00 00 00 00 00
4 00 6 00 8 00 1 0 00 12 00 14 0 0 16 0 0 18 0 0 20 0 0 22 0 0 24 0 0
Reineinkommen [DM]
Bild 1.17: Betriebseinkommen Landwirtschaftlicher Betriebe
Eine extrem rechtsschiefe mit dem Modalwert rechts auen heit entsprechend JVerteilung. Die Bezeichnungen kommen von der Form der Buchstaben L und J, die
annahernd wie solche Verteilungen aussehen.
Bei L- und J-Verteilungen sind arithmetisches Mittel x und Modalwert xd keine geeigneten Parameter. Der Median xe ist in diesen Fallen vorzuziehen, da er die Stichprobe
in zwei Halften teilt. Aus Bild 1.17 kann man z.B. das arithmetische Mittel nach Gleichung (1.10) zu x = 72800 DM schatzen. In der Klasse dieser Groe liegen jedoch nur
zwei Beobachtungen. Auch die Klasse des Modus mit der Klassenmitte von 40000 DM
charakterisiert die Einkommensverteilung nicht sehr gut. Es empehlt sich hier die
Angabe des mittelsten Betriebs, da dieser Betrieb mindestens genauso viel wie die 12
schlechteren und weniger als die 12 besseren Betriebe erwirtschaftet hat. Dieser Betrieb
liegt in der Medianklasse mit der Klassenmitte 60000 DM.
Es gibt mehrere Moglichkeiten, die Schiefe einer Verteilung durch eine Mazahl zu
charakterisieren.
Ein einfaches Ma ist das Pearsonsche Schiefheitsma S1 . Es verwendet die Differenz zwischen arithmetischem Mittel x und Dichtemittel xd bezogen auf die Standardabweichung s, weil die Schiefe einer Verteilung umso weniger auallt, je groer die
Streuung einer Stichprobe ist.
S1 = x ,s xd
(1.19)
38
1
Beschreibende und explorative Statistik
Falls x > xd und damit S1 > 0 ist, handelt es sich um eine linksschiefe Verteilung. Falls
x < xd und damit S1 < 0 ist, handelt es sich um eine rechtsschiefe Verteilung.
Weil in manchen Fallen die Bestimmung des Dichtemittels nicht einfach bzw. auch nicht
eindeutig ist, verwendet ein anderes Schiefema S2 die dreifache Dierenz zwischen
arithmetischem Mittel x und Median xe, ebenfalls bezogen auf die Standardabweichung
s.
S2 = 3 (xs, xe)
(1.20)
Auch hier gilt: Falls x > xd und damit S2 > 0 ist, ist die Verteilung linksschief, im
umgekehrten Fall (S2 < 0) rechtsschief.
Am haugsten verwendet man jedoch als Schiefema das sog. 3. Moment bezuglich
n
X
des Mittelwerts x, also M3 = n1 (xi , x)3 ), bezogen auf die dritte Potenz der
Standardabweichung s:
i=1
n
X
(xi , x)3
M
S3 = s33 = i=1 n s3
(1.21)
Auch S3 nimmt fur linksschiefe Verteilungen positive und fur rechtsschiefe Verteilungen
negative Werte an.
Beispiele:
1. Die Haugkeitsverteilung der Stichprobe mit den Ferkelzahlen in Bild 1.3 ist relativ
symmetrisch. Deshalb liegen alle Schiefheitsmae in der Umgebung von 0:
, 10 = 0:009
S1 = 10:202:197
, 10) = 0:027
S2 = 3 (102::02
197
183
:
321
S3 = 100 2:1973 = 0:173
2. Die Haugkeitsverteilung der Stichprobe der Milchleistungen aus Tab. 1.8 ist ebenfalls relativ symmetrisch. Da der Modus je nach Klasseneinteilung dieriert, werden
nur die Schiefheitsmae S2 und S3 berechnet. Diese liegen naturlich auch in der Umgebung von 0:
:7 , 5231:5) = ,0:196
S2 = 3 (5188655
:4
,
1130173824
S3 = 100 655:43 = ,0:040
1.2
Statistische Mazahlen eindimensionaler Stichproben
39
3. Die Verteilung der Bonituren in Bild 1.16 ist oensichtlich linksschief. Dies druckt
sich auch in den Schiefheitsmaen aus, die alle sehr viel groer als 0 sind:
1
S1 = 23:,
033 = 0:984
, 2) = 1:476
S2 = 3 2(3:033
S3 = 90 744
2:0333 = 0:984
4. Die Verteilung der Schlafzeiten in Bild 1.14 ist oensichtlich rechtsschief.
7:33 = ,0:259
S1 = 7:021:,
196
3
(7
:02 , 7:20) = ,0:452
S2 =
1:196
,
357
746 = ,1:394
S3 = 150 1::196
3
In diesem Fall gibt das Schiefheitsma S3 die Rechtssteilheit am besten wieder.
1.2.14 Kurtosis oder Exze
Symmetrische Haugkeitsverteilungen von Stichproben haben in vielen Fallen eine
annahernd glockenformige Gestalt, die man durch eine sog. Gausche Glockenkurve approximieren kann (vgl. Kap. 3.1). Das Histogramm der Ferkelzahlen in Bild 1.3
besitzt z.B. eine solche Form.
Andere Verteilungen sind jedoch wesentlich spitzer. Bild 1.18 zeigt eine solche steilgipige Verteilung von Ferkelzahlen.
35
31
absolute Häufigkeit
30
25
20
15
10
5
0
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AA
AAAAAAAA
AA
AAAAAA
AAAA
AAAA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAA
AAAAAAAAAA
AA
AAAA
AA
AAAA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAAAA
AAAA
AAAAAA
AAAAAAAA
AA
AAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAA
AA
AAAA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAA
AAAA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAA
AAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAAAAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AA
AA
AA
22
19
10
8
3
0
1
1
4
5
6
7
3
8
9
10 11
12
13
1
0
1
14
15
16
Ferkelzahl
Bild 1.18: Steilgipige Verteilung mit positiver Kurtosis
Im umgekehrten Fall kann die Verteilung auch breiter als eine Glockenkurve sein. Bild
1.19 zeigt eine extrem achgipige Verteilung von Ferkelzahlen.
40
1
Beschreibende und explorative Statistik
35
absolute Häufigkeit
30
25
20
15
10
5
0
17
16
16
AAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAAAA
AAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AAAAAA
AAAAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAAAAAAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAA
AAAAAA
AA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAA
AAAA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AA
AAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AAAAAAAAAA
AA
14
12
0
0
0
4
5
6
7
14
11
8
9
10 11
12
13
0
0
0
14
15
16
Ferkelzahl
Bild 1.19: Flachgipige Verteilung mit negativer Kurtosis
Man verwendet zum Vergleich einigermaen symmetrischer Verteilungen, die annahernd gleiche Streuung, aber unterschiedliche Wolbung besitzen, die Kurtosis oder den
Exze. Die Wolbung
wird im wesentlichen erfat durch das auf x bezogene Moment 4.
n
X
1
Ordnung M4 = n (xi , x)4 , dividiert durch s4 . Da fur die wichtige standardisierte
i=1
Normalverteilung mit glockenformiger Gestalt (vgl. Kap. 3.1) diese Groe den Wert 3
hat, wahlt man als Kurtosis K einer Verteilung den Wert von Ms44 , 3, also die Dierenz:
n
X
(xi , x)4
K = i=1 n s4
,3
(1.22)
Die Kurtosis hangt vom Moment M4 sowie der Standardabweichung s ab. Wenn z.B.
eine Verteilung eine positive Kurtosis hat, so heit das in etwa, da die Anzahl \groerer\ Abweichungen von x groer ist als bei einer Gauschen Glockenkurve mit gleicher
Streuung. Die Verteilung wird also eine spitzere Form aufweisen (Bild 1.18). Ganz analog wird im Falle einer negativen Kurtosis diese Verteilung eine stumpfere Form haben
(Bild 1.19).
Beispiel:
Die Stichproben mit den Ferkelzahlen in den Bildern 1.3, 1.18 und 1.19 haben alle den
Mittelwert x = 10:02 und ungefahr die gleiche Standardabweichung. Die Kurtosis ist:
:2
Bild 1.3 : K = 1007122
2:1974 , 3 = 0:057
:3
Bild 1.18 : K = 1003240
1:6204 , 3 = 1:705
:4 , 3 = ,1:337
Bild 1.19 : K = 1002661
2:0004
1.3
Beschreibung zweidimensionaler Stichproben
41
1.3 Beschreibung zweidimensionaler Stichproben
Es werden im folgenden zwei Merkmale X und Y betrachtet. Das Merkmal X soll mit
den Auspragungen x1 ; x2 ; : : : xm , das Merkmal Y mit den Auspragungen y1 ; y2 ; : : : yn
vorkommen. Zugelassen sind nominale, ordinale und quantitative Auspragungen, die
auch schon klassiziert sein konnen. Die Urliste einer zweidimensionalen Stichprobe
zeigt z.B. Tab. 1.2.
1.3.1 Haugkeitsverteilungen
Das allgemeine Schema einer zweidimensionalen Haugkeitsverteilung zeigt Tab.
1.15.
x1
x2
y1 y2 : : : yj : : : yl R:H:
n11 n12 : : : n1j : : : n1l n1:
n21 n22 : : : n2j : : : n2l n2:
xi
ni1 ni2 : : : nij : : : nil
xk
nk1 nk2 : : : nkj : : : nkl nk:
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
ni:
..
.
R:H: n:1 n:2 : : : n:j : : : n:l n
Tabelle 1.15: Zweidimensionale Haugkeitsverteilung als Kontingenztafel
Eine solche Tabelle wird auch als Kontingenztafel bezeichnet.
Die xi bzw. yi konnen im Falle quantitativer Daten diskrete Werte sein oder im Falle
einer gruppierten Verteilung auch Klassenmitten. nij gibt die absolute Haugkeit fur
das Auftreten von Elementen mit der Auspragung xi bzgl. des x-Merkmals und mit
der Auspragung yi bzgl. des y-Merkmals an. Interessiert nur die Verteilung der Merkmalswerte eines Merkmals, so braucht man die sog. Randhaugkeiten R.H. oder
Randverteilungen.
Will man wissen, wie die x-Werte sich verteilen ohne Rucksicht auf die y-Werte, dann
mu man in der obigen Haugkeitstafel die Zeilensummen bilden und erhalt die Randverteilung bezuglich x:
ni: =
Xl
j =1
nij
(i = 1; 2; : : : ; k)
(1.23)
Die Randverteilung von y ergibt sich aus den Spaltensummen:
n:j =
k
X
i=1
nij
(j = 1; 2; : : :; l)
(1.24)
42
1
Beschreibende und explorative Statistik
Beispiel:
Tab. 1.16 zeigt die Kontingenztafel fur die Anzahl der betriebseigenen Schlepper aufgeteilt nach Betriebs- und Schlepperleistungsklassen einer landwirtschaftlichen Region.
Betriebsgroe [ha]
< 30
30 , 50
50 , 70
> 70
R:H:
Schlepperleistung [kW]
< 30 30 , 50 50 , 70 70 , 90 > 90 R:H:
6
6
8
16
5
2
44
29
29
75
7
25
5
37
16
67
60
7
150
1
2
3
Tabelle 1.16: Kontingenztafel der Anzahl betriebseigener Schlepper aufgeteilt nach
Betriebsgroen- und Schlepperleistungsklassen
30
25
15
60
10
40
5
0
[k
80
W
]
>90
20
Sc
hl
ep
pe
rle
ist
un
g
absolute Häufigkeit
Die zweidimensionale Haugkeitsverteilung der Kontingenztafel in Tab. 1.16 zeigt Bild
1.20.
<30
<30
40
60
Betriebsgröße [ha]
>70
Bild 1.20: Zweidimensionale Haugkeitsverteilung der Anzahl betriebseigener Schlepper aufgeteilt nach Betriebsgroen- und Schlepperleistungsklassen
Die Haugkeiten konnen absolut (mit nij bezeichnet) oder relativ (mit hij bezeichnet)
angegeben sein. Bei einer relativen Haugkeitsverteilung konnen jedoch die einzelnen
Haugkeiten hij auf verschiedene Summen bezogen sein. Man kann sie erstens auf die
Spaltensummen, zweitens auf die Zeilensummen und drittens auf die gesamte Anzahl
n von untersuchten Elementen beziehen.
Beispiel:
Die Moglichkeiten zur Darstellung der relativen Haugkeiten am Beispiel der Schlepper
in Tab. 1.16 zeigen die Tab. 1.17 { 1.19.
1.3
Beschreibung zweidimensionaler Stichproben
43
In Tab. 1.17 sind die Schlepperzahlen auf die Spaltensummen bezogen. Sie zeigt, wie
sich Schlepper einer bestimmten Leistungsklasse auf einzelne Groenklassen der Betriebe verteilen.
BetriebsSchlepperleistung [kW]
groe [ha] < 30 30 , 50 50 , 70 70 , 90 > 90
< 30
100:0 27:6
2:7
30 , 50
55:2
58:7
18:9
50 , 70
17:2
38:7
67:6
33:3
> 70
13:5
66:7
100
100
100
100
100
Tabelle 1.17: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die
Randhaugkeiten der Spalten
In Tab. 1.18 sind die Schlepperzahlen auf die Zeilensummen bezogen. Sie zeigt, wie sich
eine bestimmte Betriebsgroenklasse bei der Auswahl der Leistung ihres Schleppers
verhalt.
Betriebsgroe [ha]
< 30
30 , 50
50 , 70
> 70
Schlepperleistung [kW]
< 30 30 , 50 50 , 70 70 , 90 > 90
37:5
50:0
12:5
23:9
65:7
10:5
8:3
48:3
41:7
1:7
71:4
28:6
100
100
100
100
Tabelle 1.18: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die
Randhaugkeiten der Zeilen
Tab. 1.19 bezieht alle Schlepper in den einzelnen Gruppen auf die Gesamtzahl der
untersuchten Schlepper und stellt die eigentliche zweidimensionale Verteilung dar, die
Verteilung der Schlepper in Abhangigkeit von den Leistungsklassen und den Betriebsgroenklassen.
Betriebsgroe [ha]
< 30
30 , 50
50 , 70
> 70
Schlepperleistung [kW]
< 30 30 , 50 50 , 70 70 , 90 > 90
4:0
5:3
1:3
10:7
10:7
29:3
4:7
44:7
3:3
19:3
16:7
0:7 40:0
3:3
1:3
4:7
4:0
19:3
49:9
24:7
2:0 100
Tabelle 1.19: Relative Haugkeiten [%] der Schlepper in Tab. 1.16 bezogen auf die
Gesamtzahl der Schlepper
44
1
Beschreibende und explorative Statistik
Es stellt sich die Frage, nach welcher Richtung (horizontal oder vertikal, d.h. Zeilensummen oder Spaltensummen als Bezugsbasis) man die absoluten Haugkeiten prozentuieren soll. Wenn man in einer solchen Kreuztabellierung zwei Merkmale oder zwei
\Faktoren\ zusammenbringt und man eindeutig einen Faktor als Ursache und den
anderen als Wirkung betrachten kann, so ist es sinnvoll, in der Richtung des Ursachenfaktors zu prozentuieren. Wenn die Stichprobe, aus der die Kreuztabelle errechnet
wird, jedoch nicht \reprasentativ\ 1 ist, ist stets groe Vorsicht geboten, eine UrsacheWirkungs-Relation auf eine Grundgesamtheit zu verallgemeinern. Zwei Merkmale oder
Faktoren mussen auch nicht immer in einem direkten Ursache-Wirkungs-Verhaltnis
stehen. Sehr haug sind jedoch auch Merkmale in einer zweidimensionalen Haugkeitsverteilung miteinander verknupft, bei denen keine eindeutige Wirkungsrichtung
von einem Merkmal auf das andere festzustellen ist. So hangen z.B. die Merkmale
Brustumfang und Kreuzhohe beim Rind voneinander ab (sie sind miteinander korreliert), ohne da man sagen konnte, die eine Variable ist Kausalursache fur die andere.
Der Zusammenhang zwischen zwei solchen Merkmalen ist wechselseitig. Fur das Folgende wird unterstellt, da eine zufallige Stichprobe zugrundeliegt. Daraus wird eine
zweidimensionale, empirische Haugkeitsverteilung aufgestellt. In der Regel wird dabei
von der absoluten Haugkeitsverteilung ausgegangen.
1.3.2 Zusammenhang zweier Merkmale
In vielen Fallen kann man aus der Haugkeitsverteilung einer zweidimensionalen Stichprobe auf einen Zusammenhang zwischen zwei Merkmalen schlieen (Bild 1.21).
80
Relative Häufigkeit [%]
70
60
50
40
30
20
10
0
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
<30 kW
30-50 kW
50-70 kW
70-90 kW
>90 kW
AAAAA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AAAAA
AA
AAA
AA
AAAAAA
AAAAAA
<30 ha
AAAAAA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAAAA
AAAA
AAAAA
AAAA
AAAAAA
AAAA
AAAAAA
AAAA
AA
AAAAAAAAAA
AAAA
A
30-50 ha
AAAAAA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAAAA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAA
AA AA
50-70 ha
AAAAAA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AA
AAAA
AA
AAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAA
AAAAAA
AAAAAA
AA
AAAA
AAAAAAAAAA
AAAAAA
AA
AAAA
AA AA
>70 ha
Betriebsgröße
Bild 1.21: Relative Haugkeitsverteilung der Schlepperleistung von Tab. 1.16 getrennt
nach Betriebsgroen
1 Man benutzt gelegentlich nur eine Teilmenge aus einer endlichen Grundgesamtheit und zieht die
Stichprobe dann aus dieser Teilmenge. In der Regel zeigt diese Teilmenge eine ahnliche Struktur wie
die Grundgesamtheit. Man nimmt daher an, da die Stichprobe reprasentativ ist bzgl. der Grundgesamtheit. Damit man diese Teilmenge aus einer endlichen Grundgesamtheit richtig auswahlt, mu
man jedoch die Struktur der Grundgesamtheit gut kennen.
1.3
Beschreibung zweidimensionaler Stichproben
45
Aus den Tabellen 1.17 , 1.19 wird deutlich, da in groeren Betrieben tendenziell auch
Schlepper mit hoheren Leistungen vorkommen. Dies ist auch oensichtlich, wenn die
relativen Haugkeiten der Schlepperleistungsklassen innerhalb der jeweiligen Betriebsgroe fur jede Betriebsgroe getrennt aufgetragen werden (Bild 1.21). Dies entspricht
den Werten in Tab. 1.18. Die relativen Haugkeiten innerhalb einer Betriebsgroenklasse addieren sich zu 100%.
Diese Abhangigkeit zweier Merkmale kann man in einem zweidimensionalen Streudiagramm oder engl. Scatter Plot darstellen. Dabei tragt man die Mewerte jedes
Objekts gegeneinander auf.
Beispiel:
Bild 1.22 zeigt das Streudiagramm von Betriebsgroe und Schlepperleistung der ursprunglichen Stichprobenwerte von Tab. 1.16.
100
Schlepperleistung [kW]
90
80
70
60
50
40
30
20
10
20
30
40
50
60
70
80
Betriebsgröße [ha]
Bild 1.22: Streudiagramm von Betriebsgroe und Schlepperleistung
Es existiert oensichtlich eine positive lineare Abhangigkeit der beiden Merkmale. Der
Zusammenhang ist jedoch nicht exakt linear, da die Mewerte mehr oder weniger um
eine Gerade streuen.
Bild 1.23 zeigt vier verschiedene zweidimensionale Streudiagramme.
In Bild 1.23 a) ist der Zusammenhang zwischen den beiden Merkmalen streng linear,
d.h. die Beobachtungen liegen exakt auf einer Geraden. Ein linearer Zusammenhang
kann auch in Bild 1.23 b) angenommen werden, allerdings streuen die Werte in gewissem
Umfang um eine Gerade. Bei Bild 1.23 c) existiert kein Zusammenhang zwischen den
Merkmalen. Die Beziehung ist mehr oder weniger zufallig. Schlielich ist in Bild 1.23 d)
durchaus ein Zusammenhang zwischen den Merkmalen abzuleiten, allerdings ist dieser
oensichtlich nicht linear.
46
1
a)
Beschreibende und explorative Statistik
b)
r = ,1
r = 0:62
c)
r=0
d)
(r = 0:91)
Bild 1.23: Streudiagramme zweier Merkmale mit verschiedenen Korrelationen
Eine Quantizierung der Starke des linearen Zusammenhangs zweier Merkmale ist
mit der Korrelationsanalyse moglich. Dabei wird untersucht, ob zwei Merkmale
voneinander linear abhangig, d.h. korreliert, oder linear unabhangig, also unkorreliert,
sind2 .
Ein Ma fur die Starke des linearen Zusammenhangs soll weder vom Nullpunkt der
Meskalen noch von den Maeinheiten der Merkmale X und Y abhangen. Aus diesem
Grund werden die Variablen X und Y auf den Mittelwert 0 und die Standardabweichung 1 skaliert.
Die Skalierung auf den Mittelwert 0 erfolgt durch die Bildung der Dierenz der Stichprobenwerte xi bzw. yi minus den Mittelwerten x bzw. y. Haben die Dierenzen xi , x
und yi , y das gleiche Vorzeichen, so deutet dies auf einen positiven Zusammenhang
hin. Ein negativer Zusammenhang wird durch verschiedene Vorzeichen der Dierenzen
angezeigt.
2 Es erfolgt hier lediglich eine kurze Einf
uhrung in die Korrelationsanalyse. Eine umfassende Behandlung beinhaltet Band 2.
1.3
Beschreibung zweidimensionaler Stichproben
47
Die Summe
SPxy =
n
X
i=1
(xi , x)(yi , y)
(1.25)
heit Summe der Abweichungsprodukte in Analogie zur Summe der Abwei-
chungsquadrate
SQx =
n
X
n
X
i=1
i=1
(xi , x)2 bzw. SQy =
(yi , y)2 :
(1.26)
Die Groe
n
X
1
sxy = n , 1 (xi , x)(yi , y) = n ,1 1 SPxy
i=1
(1.27)
heit Kovarianz zwischen X und Y .
Dividiert man die Dierenzen xi , x und yi , y durch die jeweilige Standardabweichung
sx bzw. sy , so erhalt man die transformierten Variablen U und V , die den Mittelwert
0 und die Standardabweichung 1 haben:
ui = xis, x ;
x
vi = yis, y
y
(1.28)
Der lineare Zusammenhang zwischen X und Y ist jetzt umso groer, je ausgepragter
die Tendenz ist, da U und V entweder gleiches Vorzeichen oder ungleiches Vorzeichen haben. Im ersten Fall spricht man von positivem linearen Zusammenhang bzw.
positiver Korrelation, im zweiten Fall von negativem linearen Zusammenhang bzw.
negativer Korrelation.
Das Produkt ui vi ist ein einfaches Ma fur die Tendenz bzw. den linearen Zusammenhang zwischen xi und yi . Ein Ma fur den linearen Zusammenhang der ganzen
Stichprobe ist das Mittel der einzelnen Betrage, wobei in Analogie zur Berechnung der
Varianz nach Gleichung (1.7) anstatt durch n wieder durch n , 1 dividiert wird:
n
n x ,x y ,y
X
X
1
1
i
rxy = n , 1 ui vi = n , 1
is
s
y
i=1
i=1 x
(1.29)
rxy ist der empirische Korrelationskoezient zwischen X und Y . Dieser kann nach
Gleichung (1.28), (1.25) und (1.29) auch ausgedruckt werden als:
r = rxy = s sxy
= p SPxy
s
SQx SQy
x y
(1.30)
48
1
Beschreibende und explorative Statistik
Der Korrelationskoezient r kann Werte zwischen ,1 und +1 annehmen. Unkorrelierte
Daten haben einen Korrelationskoezienten von r = 0 oder nahe 0 (Bild 1.23 c). Fur
jrj = 1 liegen die (xi ; yi )-Werte im Streudiagramm exakt auf einer Geraden (Bild
1.23 a). Fur jrj < 1 streuen die Punkte mehr oder weniger um eine Ausgleichsgerade
Der Datensatz in Bild 1.23 b) ist korreliert mit einem Koezienten von r = 0:62.
Eine positive Steigung dieser Geraden liegt vor, wenn r > 0 ist (Bild 1.23 b). Die
Steigung ist negativ fur r < 0 (Bild 1.23 a). Je groer r dem Betrag nach ist, desto
geringer ist die Streuung um diese Ausgleichsgerade. Fur die Stichprobe in Bild 1.23
d) berechnet sich rein formal ein Korrelationskoezient von r = 0:91. Dieser ist jedoch
nicht interpretierbar, da der Zusammenhang nicht linear ist.
Beispiele:
1. Fur den Spezialfall xi = yi fur alle Stichprobenwerte liegt eine extreme lineare
Abhangigkeit vor. Die Korrelation ist rxy = 1, denn es gilt:
SPxy =
n
X
i=1
(xi , x) (yi , y) =
n
X
n
X
i=1
i=1
(xi , x)2 = SQx =
(yi , y)2 = SQy
Also folgt nach Gleichung (1.30) fur r:
SPxy = p SPxy
=1
rxy = pSQ
SPxy SPxy
x SQy
2. Wenn die Punkte exakt auf einer beliebigen Geraden yi = y0 + m xi liegen, dann
ist yi , y = m (xi , x) und es gilt nach Gleichung (1.27):
n
n
X
X
sxy = n ,1 1 (xi , x) (yi , y) = n ,1 1 m (xi , x)2 = m s2x
i=1
i=1
2
2
2
Auerdem gilt sy = m sx . Der Korrelationskoezient ist deshalb:
s2x = m
rxy = s m
x jmj sx jmj
Fur m > 0 ist rxy = 1 und fur m < 0 ist rxy = ,1. Ein Koezient bei einer
Geraden mit der Steigung m = 0 ist nicht deniert.
3. Der Korrelationskoezient zwischen der Betriebsgroe und der Schlepperleistung
in Bild 1.22 ist r = 0:78.
1.3
Beschreibung zweidimensionaler Stichproben
49
Zur Berechnung von r per Hand empehlt es sich, folgende Berechnungsformel zu
verwenden, welche analog zur Berechnungsformel (1.9) fur die empirische Varianz hergeleitet werden kann:
n
X
(xi , x) (yi , y)
SP
xy
i
=1
v
r = p
=
p =vn
u
n
SQx SQy u
X
X
u
u
t (xi , x)2 t (yi , y)2
i=1
=
i=1
n ! X
n !
n
X
X
1
xi yi
xi yi , n i
=1
i
=1
i
=1
v
!2 v
u
u
n
n
n
n !2
u
u
X
X
X
X
1
1
t x2i , xi t yi2 , yi
i=1
n
i=1
n
i=1
(1.31)
i=1
Es sind also folgende Summen mit einem Taschenrechner auszurechnen:
X X
xi ,
x2i ,
X X2X
yi ,
yi ,
xi yi
An dieser Stelle sei nochmals an die Tatsache erinnert, da bei einer Programmierung
von Gleichung (1.31) die Gefahr von \Stellenausloschung\ und damit groer Rundungsfehler im Computer besteht, falls die beiden Ausdrucke im Zahler nahezu gleich gro
sind.
Beispiel:
Die folgende Tabelle zeigt die Baumhohe und den Stammdurchmesser von sechs Kastanienbaumen.
12:3 10:1 5:4 2:6 14:1 7:3
Baumhohe [m]
Stammdurchmesser [cm] 31:9 30:2 15:7 10:0 40:9 23:1
Der Korrelationskoezient wird nach Gleichung (1.31) bestimmt:
i
1
2
3
4
5
6
P
xi
yi
12:3 31:9
10:1 30:2
5:4 15:7
2:6 10:0
14:1 40:9
7:3 23:1
51:8 151:8
x2i
yi2
xi yi
151:29 1017:61 392:37
102:01 912:04 305:02
29:16 246:49 84:78
6:76 100:00 26:00
198:81 1672:81 576:69
53:29 533:61 168:63
541:32 4482:56 1553:49
1553:49 , 51p:8 151:8=6
= 0:98836 0:99
541:32 , 51:82=6 4482:56 , 151:82=6
r=p
50
1
Beschreibende und explorative Statistik
1.4 Beschreibung mehrdimensionaler Stichproben
Werden mehrere Merkmale fur eine Beobachtung gemessen, so erhalt man multivariate Daten. In Tab. 1.20 liegt z.B. eine Stichprobe von 20 Getreidesorten uber die
Merkmale Ertrag, Tausendkorngewicht, Kornzahl pro A hre und Panzen pro Quadratmeter vor.
Ertrag [dt/ha]
76:0
69:5
65:0
73:0
69:1
78:5
72:3
68:7
75:7
74:1
64:2
67:2
65:6
79:1
74:7
60:8
71:8
64:8
64:5
63:4
TKG [g]
46:7
54:9
56:0
46:8
47:6
47:1
48:6
46:8
41:3
40:5
52:9
49:6
52:0
45:5
49:5
54:6
50:7
52:1
51:5
57:5
Kornzahl/A hre Panzen/m2
43
427
34
430
37
364
44
403
43
386
44
426
38
445
46
366
41
497
41
499
35
407
42
373
38
384
44
450
41
411
37
352
40
399
39
369
45
322
38
343
Tabelle 1.20: Ertragsmerkmale von 20 Getreidesorten
Allgemein heit ein Schema der Art
x11 x12 : : : x1j : : : x1m
x21 x22 : : : x2j : : : x2m
..
..
..
..
.
..
..
..
..
.
...
..
.
x.ij
.. . . .
..
..
..
..
.
xn1 xn2 : : : xnj : : : xnm
eine Datenmatrix, wobei xij der Wert des j -ten Merkmals bzw. der j -ten Variablen
fur die i-te Beobachtung ist. Man sagt in diesem Fall, da die Daten die Dimension
m haben. Eine Datenmatrix ist auch die grundlegende Struktur fur die Eingabe von
Daten in Statiskikprogrammen auf Computern. In Tab. 1.20 stehen die Daten jeder
Sorte in den n = 20 Matrixzeilen, die Werte der einzelnen Merkmale stehen in den
Spalten der Datenmatrix. Die Dimension der Daten betragt also m = 4.
1.4
Beschreibung mehrdimensionaler Stichproben
51
1.4.1 Haugkeitsverteilungen
Ein Haugkeitsverteilung fur Datensatze mit einer Dimension von m 3 ist anschaulich nicht mehr moglich, da mindestens 4 Dimensionen zur Darstellung benotigt werden.
Man mu sich auf die Haugkeitsverteilungen der Einzelmerkmale beschranken. Bild
1.24 zeigt die Histogramme jedes einzelnen Merkmals der Tab. 1.20.
30
20
10
0
40
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
60
65
70
75
relative Häufigkeit [%]
relative Häufigkeit [%]
40
30
20
10
0
80
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
40
Ertrag [dt/ha]
10
0
30
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
35.0
37.5
40.0
Körner/Ähre
42.5
45.0
relative Häufigkeit [%]
relative Häufigkeit [%]
30
20
45
50
55
60
Tausendkorngewicht [g]
20
10
0
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAA
AAAA
AAAA
AAAA
AAAA
AAAAAAAAAAAAAAAAAAAAAAAA
300
350
400
450
500
Pflanzen/m2
Bild 1.24: Histogramme der Ertragsmerkmale von 20 Getreidesorten
1.4.2 Streumatrizen
Streudiagramme wie bei zweidimensionalen Datensatzen sind fur hohere Dimensionen
ebenfalls nicht mehr anschaulich darstellbar. Man tragt deshalb die Streudiagramme
fur jeweils zwei Merkmale in einer Streumatrix oder einer Scatter-Plot-Matrix auf.
Bild 1.25 zeigt die Streumatrix der Ertragsmerkmale von Tab. 1.20.
Das Merkmal Ertrag ist in der ersten Zeile der Streumatrix von Bild 1.25 als Ordinate
und in der ersten Spalte als Abszisse abgetragen. In der zweiten Zeile bzw. Spalte ist
die Ordinate bzw. Abszisse das Tausendkorngewicht. Entsprechendes gilt fur die dritte
und vierte Zeile bzw. Spalte fur die Merkmale Kornzahl/A hre und Panzen/m2. Es
gibt nun fur jedes Merkmal das Streudiagramm in Bezug auf alle anderen Merkmale.
Bei den Darstellungen gegenuber der Diagonalen, ist lediglich Abszisse und Ordinate
vertauscht. Die Abbildungen sind also aquivalent. Es existiert oensichtlich ein negativer linearer Zusammenhang zwischen Tausendkorngewicht und Kornzahl pro A hre
52
1
74.525
Beschreibende und explorative Statistik
Ertrag
65.375
53.25
TKG
44.75
43
Ko/Aehre
37
454.75
Pfl/m2
366.25
65
.37
5
74
.5 2
5
44
.75
53
.25
37
43
36
6.2
5
45
4.7
5
Bild 1.25: Streumatrix der Ertragsmerkmale von 20 Getreidesorten
sowie Panzen pro Quadratmeter. Eine Korrelation zwischen Kornzahl pro A hre und
Panzen pro Quadratmeter ist nicht erkennbar. Zwischen Ertrag und Panzen pro Quadratmeter besteht eine deutlich positive Korrelation. Die positive Beziehung zwischen
Ertrag und Kornzahl pro A hre ist weniger stark ausgepragt. Auf den ersten Blick uberrascht die negative Beziehung zwischen Ertrag und Tausendkorngewicht. Betrachtet
man jedoch die negative Korrelation des Tausendkorngewichts mit den anderen beiden
ertragsbildenden Merkmalen, dann ist klar, da bei geringen Tausendkorngewichten
die Ertragsbildung im wesentlichen uber die Kornzahl pro A hre und die Panzen pro
Quadratmeter erfolgt.
1.4.3 Zusammenhang mehrerer Merkmale
Die Streumatrix ist die graphische Variante einer Zusammenstellung der einfachen
Korrelationen zwischen den beobachteten Merkmalen. Die Korrelationsmatrix ist
ein Schema, das die Korrelationskoezienten zwischen jeder Variable enthalt. Fur die
Merkmale in Tab. 1.20 bzw. die Streumatrix in Bild 1.25 lautet die Korrelationsmatrix:
1:000 ,0:756 0:484 0:764
1:000 ,0:617 ,0:738
0:484 ,0:617 1:000 0:004
0:764 ,0:738 0:004 1:000
,0:756
Jedes Merkmal mit sich selbst ist naturlich zu r = 1 korreliert. Auerdem sind Koezienten oberhalb der Diagonalen identisch mit Koezienten unterhalb davon. Infolgedessen kann die Korrelationsmatrix zum Dreiecksschema in Tab. 1.21 vereinfacht
werden:
Die Korrelationsmatrix in Tab. 1.21 bestatigt die Schlufolgerungen aus der Streumatrix in Bild 1.25 und gibt daruberhinaus quantitative Mae fur den linearen Zusammenhang der Merkmale an.
1.4
Beschreibung mehrdimensionaler Stichproben
TKG [g]
Kornzahl/A hre
Panzen/m2
Ertrag [dt/ha]
,0:756
0:484
0:764
53
TKG [g]
Kornzahl/A hre
,0:617
,0:738
0:004
Tabelle 1.21: Korrelationsmatrix fur die Ertragsmerkmale in Tab. 1.20
1.4.4 Sterndiagramme
Mit Sterndiagrammen konnen im Prinzip beliebig viele Variablen dargestellt werden.
Die Merkmale werden als Strahlen in verschiedene Richtungen der Ebene interpretiert.
Die Lange der Strahlen entspricht der Groe der Merkmalswerte. Da die Merkmalswerte
als Lange von Strahlen dargestellt werden, mussen sie alle positiv und etwa von gleicher
Groe sein. Aus diesem Grund werden die Werte jeder Variablen auf das Intervall
[c; 1] skaliert, wobei c das Verhaltnis der Langen des kleinsten und groten Strahls ist.
Bezeichnet xij den i-ten Mewert der j -ten Variable, dann ist die skalierte Variable
xij :
j (xij )
xij = (1 , c) maxxij(x, )min
, min (x ) + c
j ij
j ij
(1.32)
Wurden m Variablen gemessen, so wahlt man m Strahlen, die in m Richtungen der
Zeichenebene zeigen. Der Winkel zwischen allen Strahlen ist gleich, also = 360=m.
Fur jedes beobachtete Objekt i wird ein Stern mit m Strahlen gezeichnet, deren Lange
den skalierten Merkmalswerten xij proportional ist.
Bild 1.26 zeigt das Sterndiagramm fur die Ertragsmerkmale von Tab. 1.20.
Bild 1.26: Sterndiagramm der Ertragsmerkmale aus Tab. 1.20
54
1
Beschreibende und explorative Statistik
Jedes Merkmal wird in Bild 1.26 durch einen Strahl in vier verschiedene Richtungen
dargestellt. Der Winkel zwischen den Strahlen ist = 360=4 = 90. Die Richtung
ist im Diagramm oben rechts fur die einzelnen Variablen angegeben. Je langer ein
Strahl innerhalb einer Variablen ist, desto groer ist der gemessene Stichprobenwert
der Variablen.
Sterndiagramme ermoglichen einen schnellen U berblick uber Objekte, die in mehreren oder allen Merkmalen sehr groe oder sehr kleine Werte besitzen. Sorte 9 bringt
beispielsweise einen hohen Ertrag, der v.a. durch die Ertragskomponenten Panzen
pro Quadratmeter und Kornzahl pro A hre bei geringem Tausendkorngewicht zustande
kommt, wahrend bei Sorte 1 alle ertragsbestimmenden Komponenten an der Ertragsbildung beteiligt sind. Daruberhinaus kann man auch bestimmte Gruppen erkennen,
bei denen der Ertrag auf ahnliche Weise gebildet wird. Sorte 1, 6 und 14 haben bei hohem Ertrag auch hohe Werte in allen drei ertragsbildenden Komponenten. Alle Sorten,
die lediglich hohe Tausendkorngewichte aufweisen, wie z.B. 3, 11, 16 und 20, erreichen
nicht annahernd die Ertrage mit hohen Werten der beiden anderen Komponenten.
Daraus kann man schlieen, da die Ertragshohe vorwiegend durch die Komponenten
Panzen pro Quadratmeter und Kornzahl pro A hre beeinut wird.
1.5
Explorative Statistik
55
1.5 Explorative Statistik
In den letzten Jahren fanden sog. explorative Methoden im Vorfeld einer statistischen Analyse immer mehr Verbreitung. Diese Methoden gehen uber die bisher dargestellten Verfahren der beschreibenden Statistik hinaus und versuchen, vor allem mit
graphischen Hilfsmitteln die Daten augenfallig und pragnant zu beschreiben und Besonderheiten bzw. Aualligkeiten einer Stichprobe deutlicher darzustellen, als dies mit
den klassischen Mitteln der beschreibenden Statistik moglich ist. Daruberhinaus kann
man bei der Erforschung und der Suche nach Zusammenhangen zwischen verschiedenen
Merkmalen unabhangig von restriktiven Verteilungsannahmen vorgehen. Explorative
Methoden werden in diesem Zusammenhang auch als hypothesenerzeugende Methoden bezeichnet, im Gegensatz zu den hypothesenbestatigenden Methoden
der Inferenzstatistik. Die Vielfalt der explorativen Methoden, kurz EDA-Verfahren
genannt (Exploratory Data Analysis), geht auf Tukey zuruck, der 1977 in seinem Buch
\Exploratory Data Analysis\ eine groe Anzahl solcher Methoden erstmals umfassend
vorstellte.
Hier sollen einige ausgewahlte Methoden als Erganzung des bisher gebrachten Instrumentariums vorgestellt werden.
1.5.1 Stem-and-Leaf-Diagramme
Stem-and-Leaf-Diagramme oder Stamm-und-Blatt-Diagramme geben ahnlich
wie Histogramme die Haugkeitsverteilung einer Reihe von Beobachtungswerten wieder. Allerdings gehen die numerischen Werte in individueller, augenfalliger Weise in
das Diagramm ein.
Die Konstruktion eines Stem-and-Leaf-Diagramms wird anhand einer Stichprobe uber
das Gewicht von 25 Versuchspersonen in Bild 1.27 erlautert. Die Merkmalswerte werden unter Berucksichtigung eines Mastabfaktors und eventueller Rundung auf zwei
fuhrende Ziern transformiert. Die erste Zier stellt die Stem-Zier, die zweite die
Leaf-Zier dar.
Stem
4
5
5
6
6
7
7
8
8
Leaf
9
4
68
3
55577889
11334
5679
01
7
Bild 1.27: Stem-and-Leaf-Diagramm der Gewichtsverteilung von Versuchspersonen
In der ersten, d.h. in der linken Spalte des Diagramms werden die Stem-Ziern der
Groe nach eingetragen, bei Bedarf mehrfach. In Bild 1.27 sind in dieser Spalte die
56
1
Beschreibende und explorative Statistik
Zehner-kg abgetragen. Rechts von den Stem-Ziern werden die dazugehorenden LeafZiern notiert, so da waagrechte Haugkeitssaulen mit den individuellen Leaf-Ziern
(hier die Einer-kg), entstehen. Die dritte Zeile stellt also die Mewerte 56 kg und 58 kg
dar. Das Stem-and-Leaf-Diagramm in Bild 1.27 enthalt demnach neben der gesamten
Information uber die einzelnen Mewerte gleichzeitig die graphische Darstellung der
Haugkeitsverteilung.
1.5.2 Letter-Value-Tabellen
Letter-Value-Tabellen dienen dazu, Beobachtungswerte summarisch durch Angabe
charakteristischer Mazahlen (Letter-Values oder Buchstabenwerte) zu beschreiben. Solche Mazahlen sind der Median (teilt die Datenreihe in 2 Halften), die Quartile (teilt die Datenreihe in etwa 4 Viertel) und weitere Quantilswerte, welche man
durch fortgesetzte Halbierung der entsprechend geordneten Datenmenge erhalt.
Bevor die Letter-Values deniert werden, sind die Werte einer Beobachtungsreihe der
Groe nach zu ordnen. Fur jeden Wert wird dann bestimmt, wie weit er vom oberen
oder unteren Ende der geordneten Zahlenreihe entfernt ist. Damit ist die Tiefe t eines Wertes gemeint, d.h. die Nummer der Position, welche bei demjenigen Ende der
Reihe mit 1; 2; : : : zu zahlen beginnt, welches dem betreenden Wert naher ist. Die
beiden auersten Werte, also der kleinste und der grote haben jeweils die Tiefe 1, der
zweitkleinste und der zweitgrote jeweils die Tiefe 2 usw.
Bei einer ungeraden Anzahl n von Werten gibt es einen tiefsten Wert, namlich den
Median oder den mittelsten Wert, kurz mit M bezeichnet. Seine Tiefe t(M ) ist dann
n + 1 . Bei einem geraden Stichprobenumfang, gibt es zwei mittelste Werte. Gewohnlich
2
sind diese Werte verschieden und keiner von ihnen teilt die Stichprobe exakt in zwei
Halften. U blicherweise nimmt man dann den Mittelpunkt zwischen den zwei mittelsten
1 1
Werten, von denen jeder die Tiefe n +
2 , 2 hat. Dieser Median spaltet also die Reihe
in zwei Halften auf, und man kann nun wieder nach der Mitte dieser Halften fragen,
welche dann die sog. Hinges oder Fourth3 darstellen.
Die Tiefe der Hinges berechnet sich zu:
[t(M )] + 1
t(H ) =
2
(1.33)
Mit [ ] ist die Entier-Funktion gemeint. [t(M )] bedeutet also die grote ganze Zahl,
welche kleiner oder gleich t(M ) ist.
Ist die berechnete Tiefe keine ganze Zahl, so nimmt man analog zum obigen Vorgehen
bei der Festlegung des Medians in einem solchen Fall das arithmetische Mittel der
benachbarten Werte als Letter-Value. (vgl. folgendes Beispiel).
3 Die Hinges bzw. die Fourth sind den Quartilen Q und Q (vgl. Bild 1.15) sehr 
ahnlich. Die
1
3
Quartilen Q1 und Q3 werden als Teilpunkte der Datenmenge so deniert, da 25% der Werte unterhalb
von Q1 bzw. 25% der Werte oberhalb von Q3 liegen. Die Berechnung der Hinges mit Hilfe des Begris
der Tiefe ist dagegen etwas einfacher. Die Unterschiede zwischen Hinges und Quartilen sind gering.
Es kann sein, da die Hinges etwas naher als die Quartilen Q1 und Q3 beim Median liegen.
1.5
Explorative Statistik
57
Man kann in dieser Weise fortfahren und mittlere Werte fur die beiden aueren Viertel
der Stichprobe nden. Diese Werte sind etwa ein Achtel der ganzen \Lange" zwischen
Maximum und Minimum von den beiden Enden der geordneten Reihen entfernt und
sie werden daher auch Achtel genannt bzw. mit E wie Eighth abgekurzt. Ihre Tiefe
berechnet sich zu:
[t(H )] + 1
t(E ) =
2
(1.34)
Die Letter-Values auerhalb der Achtel-Werte werden seltener benutzt und haben
keine als Standard akzeptierten Namen. Sie werden eventuell mit den Buchstaben
D; C; B; A; Z; Y; : : : bezeichnet.
Die nachsten Letter-Values nach den Achtel-Werten waren die D-Werte und ihre Tiefe
ndet man mit:
[t(E )] + 1
t(D) =
2
(1.35)
Die beiden extremsten, also die auersten Werte der Stichprobe haben die Tiefe t = 1.
Tab. 1.22 zeigt anschaulich, wie man die Letter-Values der Gewichtsstichprobe von Bild
1.27 berechnet.
Die in Tab. 1.22 gefundenen Letter-Values werden i.a. in einer Tabelle ubersichtlich
zusammengestellt, wobei zusammengehorige Letter-Values (oberer und unterer Wert)
zeilenweise notiert werden. Auerdem wird der Mittelwert zusammengehorender LetterValues (Mitte) und die Spannweite (Weite) zwischen diesen beiden Letter-Values angegeben.
Tab. 1.23 zeigt die zu den Gewichten in Bild 1.27 gehorige Letter-Value-Tabelle.
Wenn die Mitten oder Mittelwerte ungefahr gleich sind, liegen die Letter-Values etwa
symmetrisch um den Median. Wenn jedoch die H -, E -, D-Mitten usw. im Vergleich
zum Median mehr nach der einen oder anderen Seite tendieren (also jeweils groer oder
kleiner sind), deutet dies auf eine entsprechende Schiefe der Stichprobenverteilung hin.
Wie die Mitten werden auch die Weiten mit dem entsprechenden Letter-Value-Symbol
versehen. Man spricht also von H -Weite, E -Weite usw. und von der Range oder
der Spannweite, wenn die Dierenz der Extremwerte gemeint ist.
Die Mitten dienen dazu, Abweichungen einer Stichprobenverteilung von der Symmetrie,
also Schiefe, anzuzeigen.
Man mochte nun haug Stichprobenwerte so transformieren, da ihre Verteilung eine symmetrische Gestalt erhalt. Die Verwendung und die Beobachtung der oben eingefuhrten Mitten ist dabei ein nutzliches Hilfsmittel, die richtige Transformation der
Stichprobenwerte herauszunden.
58
1
Beschreibende und explorative Statistik
Tiefenberechnung
Tiefe Wert Letter-Value
1
50 Extremwert 50
t(C ) = (2 + 1)=2 = 1:5
C = 51:5
2
53
t(D) = (4 + 1)=2 = 2:5
D = 56:5
3
60
t(E ) = (7 + 1)=2 = 4
4
60 E = 60
5
61
6
62
t(H ) = (13 + 1)=2 = 7
7
62 H = 62
8
63
9
63
10
64
11
64
12
65
t(M ) = (25 + 1)=2
13
67 M = 67
12
68
11
69
10
69
9
71
8
72
t(H ) = 7
7
72 H = 72
6
73
5
75
t(E ) = 4
4
79 E = 72
3
80
t(D) = 2:5
D = 80:5
2
81
t(C ) = 1:5
C = 83:5
1
86 Extremwert 86
Tabelle 1.22: Berechnung der Letter-Values fur die Gewichte von Bild 1.27
M
H
E
D
C
Tiefe
13
7
4
2:5
1:5
1
Letter-Value
unterer
oberer
67
62
72
60
79
56:5
80:5
51:5
83:5
50
86
Mitte
67
67
69:5
68:5
67:5
68
Weite
10
19
24
32
36
Tabelle 1.23: Letter-Value-Tabelle fur die Gewichte von Bild 1.27
1.5
Explorative Statistik
59
1.5.3 Box-Plots
Box-Plots oder Schachtel-Plots stellen die wesentlichen summarischen Charakteristika einer Reihe von Beobachtungswerten graphisch sehr anschaulich dar.
Die funf Letter-Values Median, die beiden Hinges (bzw. Quartilen Q1 und Q3 ) sowie
die zwei Extremwerte werden in einen sog. Box-and-Whiskers-Plot gezeichnet. Die
mittlere Halfte der Werte, also vom oberen bis zum unteren Hinge wird durch ein
Rechteck oder eine Box dargestellt. Der Median wird markiert, z.B. mit einem +Zeichen oder mit einem Strich quer durch die Box. Von jedem Hinge bzw. von jedem
Ende der Box aus wird eine Linie bis zum Extremwert bzw. zum auersten Wert gezogen
(vgl. Bild 1.28). Auf diese Weise erhalt man einen groben, aber schnellen U berblick uber
die Stichprobe (Spannweite, Median, H -Weite, Symmetrie).
Bild 1.28 zeigt den Box-and-Whiskers-Plot fur die Gewichte aus Bild 1.27.
50
60
70
80
90
Gewicht [kg]
Bild 1.28: Box-and-Whiskers-Plot der Gewichte aus Bild 1.27
Manchmal enthalten Stichproben Werte, die so extrem niedrig oder hoch sind, da sie
nicht zur Stichprobe gehorig erscheinen. Solche Werte nennt man Ausreier. Ausreier
konnen z.B. durch falsches Messen oder Notieren entstehen. Solche Fehler will man
verstandlicherweise korrigieren, bzw. wenn das nicht mehr moglich ist, wird man diese
zweifelhaften Werte von der weiteren statistischen Untersuchung ausschlieen. Nicht
alle Ausreier mussen falsche Werte sein. Sie konnen naturlich auch sehr ungewohnliche
Werte in einer Stichprobe darstellen und man wird dann dem Grund ihres Auftretens
ganz besondere Aufmerksamkeit widmen. Um Ausreier explorativ zu erfassen, kann
man folgendermaen vorgehen (vgl. Tukey bzw. Vellemann/Hoaglin):
60
1
Beschreibende und explorative Statistik
Ausgehend von den Hinges und der H -Weite deniert man die inneren Zaune (inner
fences) als folgende Punkte:
untere innere Zaune:
obere innere Zaune:
unterer Hinge , 1:5 H -Weite
oberer Hinge + 1:5 H -Weite
(1.36)
Die aueren Zaune (outer fences) sind deniert als:
untere auere Zaune:
obere auere Zaune:
unterer Hinge , 3 H -Weite
oberer Hinge + 3 H -Weite
(1.37)
Wenn Stichprobenwerte auerhalb der inneren Zaune liegen, werden sie als auen oder
als auere Werte bezeichnet, und Stichprobenwerte, die auerhalb der aueren Zaune
liegen, werden als weit auen oder als weit auere Werte bezeichnet.
Die Werte auf jeder Seite des Medians, welche innerhalb der inneren Zaune diesen am
nachsten liegen, werden als Adjacent-Werte oder Anrainer-Werte bezeichnet.
Fur die Gewichte in Bild 1.27 waren die Hinges 62 kg und 72 kg (vgl. Tab. 1.23). Die
H -Weite ist also 10 kg. Damit erhalt man die inneren Zaune zu 62 , 1:5 10 = 47 und
72 + 1:5 10 = 87 und die aueren Zaune zu 62 , 3 10 = 32 und 72 + 3 10 = 102. Die
beiden Extremwerte 50 und 86 liegen nicht auen, sie sind in diesem Fall gleich den
Anrainer-Werten.
Neben dem einfacheren Box-and-Whiskers-Plot verwendet man haug den sog. BoxPlot. Er wird folgendermaen konstruiert. Zuerst zeichnet man die Box von Hinge zu
Hinge mit Kennzeichnung des Medians, genauso wie im Box-and-Whiskers-Plot. Dann
zeichnet man Linien auf beiden Seiten der Box, jedoch nicht bis zu den Extremwerten,
sondern nur bis zu den Adjacent-Werten. A uere Werte werden durch \ \ weit auere
Werte durch \ \ gekennzeichnet. Weil fur die Gewichte in Bild 1.27 die Extremwerte
gleich den Anrainer-Werten sind, sind Box-Plot und Box-and-Whiskers-Plot identisch
(Bild 1.28).
1.6
Beschreibende und explorative Statistik mit MINITAB
61
1.6 Beschreibende und explorative Statistik mit MINITAB
Die statistische Datenanalyse ist fur groe Datenmengen auerst rechenaufwendig. Aus
diesem Grund benutzt man heute Statistikprogramme auf Computern. Es existieren
viele anwenderfreundliche Softwareprodukte fur Personalcomputer am Markt. Das Programmsystem MINITAB ist ein preiswertes und einfach zu erlernendes Statistikpaket.
In den folgenden Abschnitten werden einige Verfahren der beschreibenden und explorativen Statistik mit MINITAB durchgefuhrt. In der Windows-Version kann man nahezu
alle statistischen Verfahren uber die grasche Benutzeroberache steuern. MINITAB
setzt dann entsprechende Kommandos im Session-Fenster (Bild 1.29) ab, in dem auch
die Ergebnisse der Analyse ausgegeben werden. Da die Kommandos im Session-Fenster
auch vom Benutzer nach der Eingabeauorderung MTB > selbst eingegeben werden
konnen, erfolgt die Benutzung dieser Befehle auf Kommandoebene, was die Darstellung in den folgenden Abschnitten drastisch verkurzt.
1.6.1 Datenformat und Dateneingabe
Die zu analysierenden Daten werden in MINITAB in Spalten c (von engl. column =
Spalte) abgelegt. Auf die einzelnen Spalten kann entweder uber die Spaltennummer,
also c1, c2, c3 usw. oder uber individuell vergebene Namen, z.B. 'Ertrag', 'N min',
'Ozongeh.' zugegrien werden. Die Vergabe von Namen hat den Vorteil, da man sich
nicht merken mu, welches Merkmal in welcher Spalte steht.
Der zu analysierende Datensatz kann entweder direkt in das Data-Fenster (Bild 1.29)
geschrieben und mit Namen belegt oder aus einer ASCII-Datei eingelesen werden. Die
folgende Befehlssequenz liest den Datensatz von Tab. A.10 aus einer Datei KUEHE.DAT
von der Festplatte in die Spalten c1 bis c8 in MINITAB ein.
MTB > read 'kuehe.dat' c1-c8
Entering data from file: kuehe.dat
120 rows read.
MTB > name c1 'Rasse' c2 'ML(kg)' c3 'Fett(%)' c4 'Eiw(%)'
MTB > name c5 'Fett(kg)' c6 'Gew(kg)' c7 'KH(cm)' c8 'BU(cm)'
MTB > save 'kuehe.mtw'
Saving worksheet in file: kuehe.mtw
MINITAB bestatigt das Einlesen von 120 Zeilen (rows). Anschlieend werden vom
Benutzer Namen fur die Spalten mit den das jeweilige Merkmal erklarenden Namen
vergeben (vgl. Tab. A.10 im Anhang). Das resultierende Data-Fenster zeigt Bild 1.29.
Der Datensatz wird als MINITAB-Arbeitsblatt mit dem save-Befehl abgespeichert.
MINITAB fugt die Endung .MTW (von engl. Minitab Worksheet) auch automatisch
an den Dateinamen an und bestatigt die Speicherung. Es existiert nun eine Datei
KUEHE.MTW, die durch das Kommando retrieve 'kuehe' nach einem Neustart wieder
geladen werden kann.
62
1
Beschreibende und explorative Statistik
Bild 1.29: MINITAB Session- und Data-Fenster
1.6.2 Statistische Mazahlen
Der Befehl describe gibt einige wichtige statistische Mazahlen der angegebenen Spalten aus.
MTB > describe 'ML(kg)'
ML(kg)
N
120
MEAN
5513.0
MEDIAN
5503.0
TRMEAN
5511.6
ML(kg)
MIN
4123.0
MAX
7002.0
Q1
4921.7
Q3
6140.2
STDEV
722.6
SEMEAN
66.0
Es werden Stichprobenumfang n = N, arithmetisches Mittel x = MEAN, der Zentralwert
oder Median xe = MEDIAN, empirische Standardabweichung s = STDEV (engl. standard
deviation) und der Standardfehler des Mittelwerts sx = SEMEAN (engl. standard error
of mean) ausgegeben. Fur TRMEAN (engl. trimmed mean) werden jeweils die 5% groten
und kleinsten Werte abgeschnitten und aus den restlichen 90% der Mittelwert berech-
1.6
Beschreibende und explorative Statistik mit MINITAB
63
net. MIN und MAX sind jeweils die kleinsten und groten Stichprobenwerte. Q1 und Q3
bezeichnen die erste und dritte Quartile.
Man kann die statistischen Mazahlen auch fur mehrere Spalten ausgeben.
MTB > describe c2-c8
ML(kg)
Fett(%)
Eiw(%)
Fett(kg)
Gew(kg)
KH(cm)
BU(cm)
N
120
120
120
120
120
120
120
MEAN
5513.0
4.0208
3.5072
221.27
699.92
141.99
197.92
MEDIAN
5503.0
4.0300
3.4950
219.00
702.00
142.00
198.00
TRMEAN
5511.6
4.0231
3.5048
221.15
700.36
142.06
197.96
ML(kg)
Fett(%)
Eiw(%)
Fett(kg)
Gew(kg)
KH(cm)
BU(cm)
MIN
4123.0
3.3200
3.0600
167.00
602.00
129.00
184.00
MAX
7002.0
4.4400
4.0100
278.00
799.00
158.00
206.00
Q1
4921.7
3.8800
3.3900
198.00
674.25
139.00
195.00
Q3
6140.2
4.1700
3.6300
246.00
727.75
145.00
201.00
STDEV
722.6
0.2050
0.1966
28.19
41.21
4.97
4.45
SEMEAN
66.0
0.0187
0.0179
2.57
3.76
0.45
0.41
Die Bestimmung der Mazahlen fur die Rasse macht keinen Sinn, da es sich um ein
nominales Merkmal handelt. Es ist jedoch sinnvoll, die Anzahl der Tiere verschiedener
Rasse aufzulisten.
MTB > table 'Rasse'
ROWS: Rasse
COUNT
1
2
3
4
ALL
40
50
20
10
120
Die Rassenverteilung ist also 40 Schwarzbunte, 50 Fleckvieh, 20 Braunvieh und 10
Gelbvieh, was zusammen den Gesamtstichprobenumfang von 120 ergibt.
Wenn man die statistischen Mazahlen fur die Rassen getrennt ausgeben will, mu
nach dem describe-Kommando ein Strichpunkt eingegeben werden. MINITAB wartet
dann auf ein Subkommando, das mit einem Punkt abgeschlossen werden mu.
64
1
Beschreibende und explorative Statistik
MTB > describe 'ML(kg)';
SUBC> by 'Rasse'.
ML(kg)
ML(kg)
Rasse
1
2
3
4
N
40
50
20
10
MEAN
5990.2
4973.5
6464.5
4398.3
MEDIAN
6007.0
4959.0
6426.5
4275.5
TRMEAN
5988.9
4964.3
6472.6
4383.5
Rasse
1
2
3
4
MIN
5471.0
4533.0
5783.0
4123.0
MAX
6566.0
5715.0
7002.0
4792.0
Q1
5762.2
4870.8
6216.0
4168.0
Q3
6171.0
5115.2
6737.5
4644.0
STDEV
267.9
231.4
319.7
254.0
SEMEAN
42.4
32.7
71.5
80.3
Die mittlere Milchleistung von Schwarzbunten (1) und Braunvieh (3) liegt also im
Bereich von 6000 kg, wahrend Fleckvieh (2) und Braunvieh (4) im Bereich unter 5000 kg
liegt.
1.6.3 Haugkeitsverteilungen
Der Befehl histogram liefert die Haugkeitsverteilung eines Merkmals.
MTB > histogram 'ML(kg)'
Bild 1.30 zeigt das von MINITAB erstellte Histogramm.
40
Frequency
30
20
10
0
4000
4500
5000
5500
6000
6500
7000
ML(kg)
Bild 1.30: Histogramm der Milchleistung
Auallig in Bild 1.30 ist die mehrgipige Verteilung der Milchleistung. Dies wird jedoch
verstandlich, wenn man beachtet, da sich die Stichprobe aus mehreren Rassen mit
unterschiedlicher mittlerer Milchleistung zusammensetzt.
1.6
Beschreibende und explorative Statistik mit MINITAB
65
1.6.4 Stem-and-Leaf-Diagramme
Der Befehl stem-and-leaf erzeugt ein Stem-and-Leaf-Diagramm. Dieses wird nun fur
den Milcheiweigehalt erstellt.
MTB > stem-and-leaf 'Eiw(%)'
Stem-and-leaf of Eiw(%)
Leaf Unit = 0.010
2
9
17
31
60
60
37
18
11
3
1
30
31
32
33
34
35
36
37
38
39
40
N
= 120
69
3559999
03344589
11355567777999
00123334444455566677778889999
00001122222334444555678
0001133344556777778
2336678
05566799
56
1
MINITAB gibt die Meldung Leaf Unit = 0.010 aus. Das bedeutet, da z.B. die beiden Werte in der ersten Zeile als 3:06 und 3:09 zu interpretieren sind. In der ersten
Spalte werden lediglich die Anzahl der Stichprobenwerte bis zum Median hochgezahlt
und anschlieend wieder abgezahlt. Das Stem-and-Leaf-Diagramm ist recht informativ,
da es einerseits die Haugkeitsverteilung und andererseits die Stichprobenwerte selbst
zeigt.
1.6.5 Letter-Value-Tabellen
Der Befehl lvals erzeugt eine Letter-Value-Tabelle:
MTB > lvals 'Eiw(%)'
DEPTH
LOWER
N= 120
M
60.5
3.495
H
30.5
3.390
E
15.5
3.265
D
8.0
3.190
C
4.5
3.150
B
2.5
3.110
A
1.5
3.075
1
3.060
UPPER
MID
SPREAD
3.630
3.745
3.860
3.890
3.955
3.985
4.010
3.495
3.510
3.505
3.525
3.520
3.533
3.530
3.535
0.240
0.480
0.670
0.740
0.845
0.910
0.950
Es werden die Letter-Values mit ihren Tiefen (DEPTH), unteren (LOWER) und oberen
(UPPER) Grenzen sowie deren Mitte (MID) ausgegeben. Die Weite (SPREAD) ist die Differenz zwischen oberem und unterem Letter-Value.
66
1
Beschreibende und explorative Statistik
1.6.6 Box-Plots
Der Befehl boxplot erzeugt einen Box-Plot,
MTB > boxplot 'Eiw(%)'
4.0
3.9
3.8
Eiw(%)
3.7
3.6
3.5
3.4
3.3
3.2
3.1
3.0
Bild 1.31: Boxplot des Eiweigehalts
Die Verteilung besitzt rechts auen einen Anrainer-Wert.
Beim boxplot-Befehl kann man die Merkmale nach Rassen getrennt darstellen.
MTB > boxplot 'ML(kg)'*'Rasse'
Bild 1.32 zeigt die einzelnen Verteilungen der Stichprobenwerte getrennt nach Rassen
als Boxplot. Dabei werden die Rassenunterschiede in der Milchleistung deutlich.
ML(kg)
7000
6000
5000
4000
1
2
3
Rasse
4
Bild 1.32: Boxplots der Milchleistung getrennt nach Rassen
1.6
Beschreibende und explorative Statistik mit MINITAB
67
1.6.7 Streudiagramme
Die Analyse des Zusammenhangs zwischen zwei Variablen erfolgt im einfachsten Fall
durch eine Auftragung der einen Variablen uber der anderen. Interessiert z.B. der
Zusammenhang zwischen Fettertrag in kg und Milchleistung, so kann man fur jede
untersuchte Kuh deren Milchleistung auf der Abszisse und deren Fettmenge auf der
Ordinate abtragen. Es entsteht dann eine Punktewolke im Streudiagramm bzw. Scatter
Plot (Bild 1.33).
MTB > plot 'Fett(kg)'*'ML(kg)'
Fett(kg)
280
230
180
4000
5000
6000
7000
ML(kg)
Bild 1.33: Streudiagramm von Fettmenge und Milchleistung
Es besteht oensichtlich ein linearer Zusammenhang zwischen der Fettmenge und
Milchleistung. Dies ist einleuchtend, da eine hohere Milchmenge naturlich auch einen
hoheren Fettertrag zur Folge hat. Daruberhinaus wurde der Fettertrag in kg aus dem
Produkt von Milchleistung und Fettgehalt in % berechnet. Der Zusammenhang ist
jedoch nicht exakt linear, da durch den unterschiedlichen Fettgehalt der Milch eine
Streuung verursacht wird. Auerdem sind im Streudiagramm von Bild 1.33 auch wieder die beiden Gruppen der Milchleistungen erkennbar.
1.6.8 Streumatrizen
Haug interessiert der Zusammenhang zwischen mehreren Merkmalen. Beispielsweise
ist eine Abhangigkeit zwischen Gewicht, Kreuzhohe und Brustumfang wahrscheinlich.
Man kann nun jede Variable uber der anderen in einem Streudiagramm auftragen.
Eine Darstellung dieser Diagramme in einem einzigen Bild fuhrt zur Streumatrix oder
Scatter Plot-Matrix (Bild 1.34).
Eine Streumatrix wird mit dem Kommando matrixplot erzeugt.
MTB > matrixplot 'Gew(kg)'-'BU(cm)'
68
1
Beschreibende und explorative Statistik
749.75
Gew(kg)
651.25
150.75
KH(cm)
136.25
200.5
BU(cm)
189.5
65
1.2
5
74
9.7
5
13
6.2
5
15
0.7
5
18
9.5
20
0.5
Bild 1.34: Streumatrix von Gewicht, Kreuzhohe und Brustumfang
Links oben steht das Gewicht in kg, d.h. die Abszisse der Einzelbilder in der 1. Spalte
und die Ordinate der Einzelbilder in der 1. Zeile der Matrix sind mit dem Gewicht
skaliert. Entsprechendes gilt fur die Kreuzhohe in Spalte und Zeile 2 sowie fur den
Brustumfang in der 3. Spalte und Zeile.
Ein Zusammenhang ist fur alle drei Variablen in Bild 1.34 ersichtlich. Dies ist auch
klar, da groere Tiere in allen drei Merkmalen hohere Werte haben als kleinere.
1.6.9 Korrelationskoezienten und Korrelationsmatrix
Das correlate-Kommando berechnet den empirischen Korrelationskoezienten zwischen zwei Merkmalen.
MTB > correlate 'ML(kg)' 'Fett(kg)'
Correlation of ML(kg) and Fett(kg) = 0.921
Der Korrelationskoezient als Ma fur die Starke des linearen Zusammenhangs zwischen Milchleistung und Fettmenge betragt also r = 0:921. Dieser relativ hohe Wert
bestatigt die oensichtlich enge lineare Beziehung der Werte in Bild 1.33.
Der correlate-Befehl kann auch fur die Bestimmung der Korrelationskoezienten
mehrerer Variablen verwendet werden und liefert dann die Korrelationsmatrix.
1.6
Fett(%)
-0.133
0.117
-0.150
-0.011
-0.045
Eiw(%) Fett(kg)
0.857
0.838
Gew(kg)
0.797
KH(cm)
-0.286
0.026
0.094
0.131
-0.661
-0.753
-0.577
Beschreibende und explorative Statistik mit MINITAB
ML(kg)
-0.276
-0.228
0.921
-0.577
-0.721
-0.535
MTB > correlate c2-c8
Fett(%)
Eiw(%)
Fett(kg)
Gew(kg)
KH(cm)
BU(cm)
69
Aus dieser Korrelationsmatrix ist z.B. ersichtlich, da die Milchleistung mit der Fettmenge in kg hoch positiv korreliert ist, mit dem Fettgehalt in % jedoch eine negative
Korrelation aufweist. Es ist also bei hoheren Milchmengen ein Verdunnungseekt im
Fettgehalt erkennbar. Da die Fettmenge das Produkt aus Milchleistung und Fettgehalt ist, wird dieser Verdunnungseekt beim Fettgehalt durch die hohe Milchmenge
kompensiert.
1.6.10 Balkendiagramme
Balkendiagramme (engl. bar charts) eignen sich sehr gut zur Darstellung der Haugkeitsverteilung nominaler Merkmale. Die Auftragung der nominalen Merkmalsauspragung erfolgt an der Abszisse. U ber der jeweiligen Merkmalsauspragung wird ein Balken
gezeichnet, dessen Hohe der Haugkeit des entsprechenden Merkmals entspricht.
Zur Erstellung eines Balkendiagramms in MINITAB dient der Befehl chart.
MTB > chart 'Rasse'
2
Rasse
3
4
Die Rassenverteilung der Kuhe, die auf Seite 63 mit dem table-Befehl erzeugt wurde,
zeigt Bild 1.35 als Balkendiagramm. Dabei ist zu beachten, da die nominalen Merkmale an der Abszisse beliebig vertauscht werden konnen, da sie nicht in eine festgelegte
Reihenfolge gebracht werden konnen, wie das bei ordinalen Merkmalen der Fall ist.
50
40
30
20
10
0
1
Bild 1.35: Balkendiagramm der Rassenverteilung von Kuhen
Number Nonmissing of Rasse
70
1
Beschreibende und explorative Statistik
1.6.11 Kuchendiagramme
Eine Alternative zu den Balkendiagrammen sind die haug verwendeten Kuchendiagramme (engl. pie charts). Der zugehorige Wert einer diskreten oder nominalen
Merkmalsauspragung wird als Segment aus einem Kreis herausgeschnitten. Die Segmentgroe ist proportional zur Groe dieses Werts bzw. der entsprechenden Haugkeit.
Kuchendiagramme werden mit dem Makro4 %pie erzeugt. Das entsprechende Kuchendiagramm zum Balkendiagramm fur die Rassenverteilung von Bild 1.35 zeigt Bild 1.36.
MTB > %pie 'Rasse'
Pie Chart of Rasse
1 (40, 33.3%)
2 (50, 41.7%)
4 (10, 8.3%)
3 (20, 16.7%)
Bild 1.36: Kuchendiagramm der Rassenverteilung von Kuhen
4 Ein Makro ist eine Folge von Befehlen, die in einer eigenen Datei abgespeichert sind und bei Aufruf
des Makros abgearbeitet werden. In MINITAB haben Makros die Dateierweiterung .MAC. Ihr Aufruf
erfolgt durch ein vorangestelltes %-Zeichen.
Herunterladen