Entwicklung einer neuen Probenahmemethode

Werbung
Bertram Zwisele
Entwicklung einer neuen
Probenahmemethode für
heterogene Abfälle
geringer Schüttdichte
RHOMBOS-VERLAG
Bibliografische Information Der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der
Deutschen Nationalbibliografie; detaillierte bibliografische Daten
sind im Internet über http://dnb.ddb.de abrufbar
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß
solche Namen im Sinne der Warenzeichen- und Markenschutzgesetzgebung als frei zu
betrachten wären und daher von jedermann benutzt werden dürfen. Eine Haftung für die
Richtigkeit der veröffentlichten Informationen kann trotz sorgfältiger Prüfung vom Verlag
nicht übernommen werden.
Forschung
Politik
RHOMBOS
VERLAG
Das Werk ist in allen seinen Teilen urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für
Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeisung
und Verarbeitung in elektronischen Systemen.
Umschlag: RHOMBOS-VERLAG, Berlin
VK-Nr. 65 859
www.rhombos.de
[email protected]
RHOMBOS-VERLAG, Kurfürstenstr. 17, 10785 Berlin
Druck: dbusiness GmbH, Berlin, Eberswalde
ISBN 3-937231-42-0
Entwicklung einer
neuen Probenahmemethode
für heterogene Abfälle
geringer Schüttdichte
vorgelegt von
Diplom-Ingenieur
Bertram Zwisele
aus Berlin
Von der Fakultät III - Prozesswissenschaften
der Technischen Universität Berlin
zur Erlangung des akademischen Grades
Doktor der Ingenieurwissenschaften
- Dr.-Ing. -
genehmigte Dissertation
Promotionsausschuss:
Vorsitzender:
Prof. Dr. rer. nat. W. Rotard
Berichter: Prof. Dr.-Ing. H. Kuyumcu
Berichter: Prof. Dr.-Ing. T. Pretz
Tag der wissenschaftlichen Aussprache: 29. Juli 2004
Berlin 2004
D 83
Teilergebnisse dieser Arbeit wurden bereits veröffentlicht:
Kuyumcu, H. Z.; Zwisele, B.: Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte; 7. Tagung des Arbeitskreises „Probenahme“; Tagungsbeiträge; Freiberg; 2001.
Kuyumcu, H. Z.; Zwisele, B.; Ochsenreiter, C.: Entwicklung eines Probenahmeverfahrens für
die Beurteilung von Ersatzbrennstoffen; Ersatzbrennstoffe 2; TK-Verlag; Neurupin; 2002.
Kuyumcu, H. Z. ; Zwisele, B.: Development of a Novel Sampling Method for Heterogeneous
Low-Density Materials; IXth International Mineral Processing Symposium Extended Abstracts; Cappadocia, Turkey; 2002.
Kuyumcu, H. Z.; Zwisele, B.: Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte; Postervortrag auf der Tagung Aufbereitung und Recycling;
Freiberg; 2002.
Vorwort
Die vorliegende Arbeit entstand während meiner wissenschaftlichen Tätigkeit am Lehrstuhl
für Aufbereitung von Roh- und Reststoffen der Technischen Universität Berlin. Sie basiert auf
den Arbeiten und Ergebnissen des Forschungsvorhabens „Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte“, das von der Deutschen Forschungsgemeinschaft finanziell unterstützt wurde.
Als ich auf der Fachtagung Probenahme in Freiberg von der Idee der Abfallkomprimierung
zur Verbesserung der Probenahme zum ersten Mal gehört habe, konnte ich mir wirklich nicht
vorstellen, dass ich mich mit diesem Thema über drei Jahre hinweg so intensiv beschäftigen
würde. Ich betrachtete die etwas unkonventionelle Herangehensweise von Prof. Kuyumcu
zunächst eher kritisch.
Dennoch ließ ich mich auf die Bearbeitung dieses Themas ein und habe daraus gelernt,
dass unkonventionelle Denkansätze in der Wissenschaft ein wichtiges Element des Weiterkommens sind. Mein herzlicher Dank gilt Herrn Prof. Kuyumcu, der mir bei meinem Promotionsvorhaben den nötigen Spielraum ließ und mich in kritischen Phasen mit wertvollen Hinweisen unterstützte.
Weiterhin möchte ich mich bei Renata Skorupski, Alexander Baath und Danny Schanze, den
studentischen Mitarbeitern im Forschungsprojekt für ihre tatkräftige Unterstützung danken.
Auch allen anderen beteiligten Mitarbeitern des Instituts danke ich für die mir gewährte Unterstützung.
Ganz besonders möchte ich mich bei meiner Frau, Dipl.-Ing. Barbara Müter-Zwisele für ihre
Unterstützung und große Geduld, die ich während der Promotion erhalten habe, bedanken.
Zuletzt möchte ich meinen Kindern Marc-Steffen, Fenja und Gunnar ein ganz herzliches
Dankeschön für ihre Geduld mit einem manchmal gestressten Papa aussprechen.
Inhaltsverzeichnis
1
Einleitung ...................................................................................................................... 1
2
Aufgabenstellung ......................................................................................................... 4
2.1
Untersuchungsgesamtheit ................................................................................................. 4
2.2
Untersuchungsziel ............................................................................................................. 6
2.3
Aufgaben ........................................................................................................................... 7
3
Methodische Grundlagen ............................................................................................. 8
3.1 Statistische Grundlagen..................................................................................................... 8
3.1.1
Der Wahrscheinlichkeitsbegriff ................................................................................... 8
3.1.2
Zufallsereignis ............................................................................................................ 11
3.1.3
Zufallsvariable............................................................................................................ 11
3.1.3.1 Diskrete Zufallsvariable........................................................................................... 12
3.1.3.2 Stetige Zufallsvariable ............................................................................................. 16
3.1.3.3 Zweidimensionale stetige Zufallsvariable ............................................................... 19
3.1.4
Die Grenzwertsätze .................................................................................................... 23
3.1.4.1 Das schwache Gesetz der großen Zahlen................................................................. 23
3.1.4.2 Das starke Gesetz der großen Zahlen....................................................................... 23
3.1.4.3 Der Zentrale Grenzwertsatz ..................................................................................... 25
3.1.5
Schätztheorie .............................................................................................................. 25
3.1.5.1 Statistischer Schluss................................................................................................. 25
3.1.5.2 Schätzfunktion ......................................................................................................... 26
3.1.5.3 Eigenschaften von Schätzfunktionen....................................................................... 27
3.1.5.4 Konstruktion von Schätzfunktionen......................................................................... 29
3.1.5.5 Punkt- und Intervallschätzung ................................................................................. 29
3.1.5.6 Schätzen in endlichen und unendlichen Grundgesamtheiten................................... 32
3.1.6
Modellbildung ............................................................................................................ 38
3.2 Grundlagen der Probenahme........................................................................................... 38
3.2.1
Einführung.................................................................................................................. 38
3.2.1.1 Abgrenzung des Probenahmebegriffes .................................................................... 40
3.2.1.2 Probenahmeplan und Probenahmekriterien ............................................................. 41
3.2.1.3 Fehler einer Stichprobenuntersuchung .................................................................... 43
3.2.2
Stichprobenverfahren ................................................................................................. 48
3.2.2.1 Nichtzufällige Auswahlverfahren ............................................................................ 48
3.2.2.2 Zufällige Auswahlverfahren .................................................................................... 48
3.2.2.3 Die grundlegenden einstufigen zufälligen Auswahlverfahren................................. 51
3.2.2.4 Vergleich der grundlegenden einstufigen zufälligen Auswahlverfahren................. 54
3.2.2.5 Mehrstufige Auswahlverfahren................................................................................ 55
3.2.2.6 Auswahlverfahren bei abhängigen Merkmalen ....................................................... 60
3.2.3
Hochrechnungs- oder Schätzverfahren ...................................................................... 62
3.2.3.1 Einfache oder reine Zufallsstichprobe ..................................................................... 62
3.2.3.2 Systematische Zufallsstichprobe.............................................................................. 65
3.2.3.3 Geschichtete Zufallsstichprobe ................................................................................ 68
3.2.3.4 Mehrstufige Zufallsstichprobe ................................................................................. 71
3.3 Probenahme von Stoffsystemen...................................................................................... 80
3.3.1
Auswahlvorgang......................................................................................................... 81
i
Inhaltsverzeichnis
3.3.1.1 Flächenbeprobung ....................................................................................................81
3.3.1.2 Gutstrombeprobung..................................................................................................81
3.3.2
Heterogenität...............................................................................................................82
3.3.2.1 Allgemein .................................................................................................................82
3.3.2.2 Modell für unabhängige Elementareinheiten ...........................................................84
3.3.2.3 Modell für abhängige Elementareinheiten ...............................................................90
4
Probenahmemodelle für heterogene Stoffsysteme – Stand des Wissens.............. 93
4.1 Allgemeines Probenahmemodell für disperse Stoffsysteme ...........................................93
4.1.1
Stoffmodell .................................................................................................................93
4.1.2
Auswahlmodell ...........................................................................................................96
4.1.2.1 Schätzwert ................................................................................................................97
4.1.2.2 Genauigkeit des Schätzwertes ..................................................................................98
4.1.3
Fehlerbetrachtung der Stichprobenahme ....................................................................99
4.1.3.1 Fehler, die in den mathematischen Beziehungen des Modells begründet
sind ...........................................................................................................................99
4.1.3.2 Fehler, die auf die praktische Ausführung der Probenahme und
Aufbereitung zurückzuführen sind .........................................................................100
4.1.3.3 Gesamtfehler...........................................................................................................103
4.1.4
Ansatz für ein Stoffmodell mit unabhängigen Stoffteilchen ....................................105
4.2 Praxisorientierte Probenahmemodelle für disperse Stoffsysteme .................................110
4.2.1
Physikalischer Ansatz für ein Probenahmemodell ...................................................110
4.2.2
Statistischer Ansatz für ein Probenahmemodell .......................................................119
4.2.2.1 Pareto-Verteilung ...................................................................................................119
4.2.2.2 RRSB-Verteilung ...................................................................................................121
5
Entwicklung einer angepassten Probenahmemethode für heterogene
Stoffsysteme geringer Schüttdichte........................................................................ 124
5.1
Ausgangssituation..........................................................................................................124
5.2
Die neue Probenahmemethode ......................................................................................126
5.3
Ein modifiziertes Probenahmemodell ...........................................................................129
6
6.1
Vorversuche zur Entwicklung der Versuchsgeräte, zur Ermittlung
relevanter Stoffeigenschaften und zur Bestimmung der
Probenahmeparameter............................................................................................. 133
Vorversuche zur Entwicklung der Versuchsgeräte .......................................................134
6.2 Vorversuche zur Ermittlung relevanter Stoffeigenschaften ..........................................138
6.2.1
Charakterisierung der Versuchsmaterialien..............................................................139
6.2.1.1 Zeitungspapier ........................................................................................................139
6.2.1.2 Kunststoffe .............................................................................................................139
6.2.1.3 Getränkedosen aus Weißblech ...............................................................................140
6.2.2
Ermittlung der Brennwerte für die Versuchsmaterialien und Aufnahme
einer Kalibriergeraden ..............................................................................................141
6.2.2.1 Zielstellung .............................................................................................................141
6.2.2.2 Versuchsdurchführung ...........................................................................................142
6.2.2.3 Ergebnisse...............................................................................................................142
6.2.3
Ermittlung der Stoffdichten für einzelne Stoffkomponenten und
Stoffgemische ...........................................................................................................143
6.2.3.1 Zielstellung .............................................................................................................144
ii
Inhaltsverzeichnis
6.2.3.2 Versuchsdurchführung ........................................................................................... 144
6.2.3.3 Ergebnisse .............................................................................................................. 145
6.2.4
Bestimmung der Teilchengrößenverteilung und der
Teilchenmassenverteilung für die synthetischen Stoffgemische und
realen Abfälle ........................................................................................................... 146
6.2.4.1 Zielstellung ............................................................................................................ 146
6.2.4.2 Versuchsmaterial.................................................................................................... 146
6.2.4.3 Versuchsdurchführung ........................................................................................... 147
6.2.4.4 Ergebnisse .............................................................................................................. 148
6.2.4.5 Schlussfolgerungen ................................................................................................ 157
6.3 Vorversuch zur Bestimmung der Probenahmeparameter ............................................. 158
6.3.1
Zielsetzung ............................................................................................................... 158
6.3.2
Versuchsdurchführung ............................................................................................. 159
6.3.2.1 Herstellung der Zufallsmischung ........................................................................... 159
6.3.2.2 Probenahme............................................................................................................ 159
6.3.2.3 Probenaufbereitung ................................................................................................ 162
6.3.2.4 Analyse .................................................................................................................. 162
6.3.3
Auswertung und Darstellung der Ergebnisse ........................................................... 163
6.3.3.1 Explorative Datenanalyse ...................................................................................... 164
6.3.3.2 Schätzung der Mittelwerte und Varianzen............................................................. 166
6.3.3.3 Analyse der Fehlereinflüsse der Teilungs- und Auswahlschritte........................... 167
6.3.3.4 Zusatzauswertungen............................................................................................... 168
6.3.3.5 Bewertung der Ergebnisse und Schlussfolgerungen für die
Durchführung der Hauptversuche.......................................................................... 171
6.4
7
Technische Umsetzung des neuen Probenahmeverfahrens und
Versuchsaufbau ............................................................................................................. 172
Durchführung der Versuche .....................................................................................175
7.1 Das Versuchsprogramm ................................................................................................ 175
7.1.1
Untersuchung der empirischen Heterogenität für Zwei- und
Dreikomponentengemische sowie für reale Abfälle ................................................ 177
7.1.2
Vergleich des neu entwickelten Probenahmeverfahrens nach der
Würfelteilungsmethode mit einem herkömmlichen Probenahmeverfahren
nach der Methode mit Teilungskreuz....................................................................... 179
7.1.3
Untersuchung von Einflussgrößen auf die Heterogenität des Stoffsystems
- Abhängigkeit von Stoffdichte und Teilchengröße ................................................. 180
7.1.3.1 Stoffdichte.............................................................................................................. 180
7.1.3.2 Teilchengröße ........................................................................................................ 180
7.1.4
Untersuchung der Ortsabhängigkeit der Heterogenität ............................................ 181
7.2
Durchführung der Versuche mit synthetischen Stoffgemischen bekannter
Zusammensetzung –Würfelteilungsmethode und mehrstufiges Modell....................... 181
7.2.1
Herstellung der Zufallsmischungen.......................................................................... 182
7.2.2
Probenahme .............................................................................................................. 182
7.3
Durchführung der Versuche mit synthetischen Stoffgemischen bekannter
Zusammensetzung - Würfelteilungsmethode und geschichtetes Modell...................... 184
7.3.1
Probenahme .............................................................................................................. 184
7.4
Durchführung der Versuche mit synthetischen Stoffgemischen bekannter
Zusammensetzung - Teilungskreuzmethode und mehrstufiges Modell........................ 185
7.4.1
Probenahme .............................................................................................................. 185
iii
Inhaltsverzeichnis
7.4.2
Probenaufbereitung und Analyse..............................................................................187
7.5
Durchführung der Versuche mit realen Abfallgemischen unbekannter
Zusammensetzung - Würfelteilungsmethode ................................................................187
7.5.1
Herstellung der Zufallsmischungen ..........................................................................187
7.5.2
Probenahme ..............................................................................................................188
7.6
Durchführung der Versuche mit synthetischen Stoffgemischen
unterschiedlicher Teilchengrößen..................................................................................188
7.6.1
Herstellung der Zufallsmischungen ..........................................................................188
7.6.2
Probenahme ..............................................................................................................189
8
8.1
Auswertung der Ergebnisse..................................................................................... 190
Einzelauswertung...........................................................................................................191
8.2 Gesamtauswertung.........................................................................................................192
8.2.1
Explorative Datenanalyse .........................................................................................192
8.2.2
Schätzung der Mittelwerte und Varianzen................................................................193
8.2.3
Fehlerbetrachtung der einzelnen Teilungs- und Auswahlschritte.............................197
8.2.4
Methodenvergleich: Teilungskreuz - Würfelteilung.................................................200
8.2.5
Untersuchung der Einflussgrößen Dichte und Teilchengröße auf die
Heterogenität.............................................................................................................201
8.2.6
Untersuchung der Ortsabhängigkeit der Messwerte.................................................206
8.2.7
Optimierung der Probenahmeparameter Stichprobengröße und
Stichprobenanzahl.....................................................................................................212
8.3
9
Zusammenfassung der Auswertungsergebnisse ............................................................215
Zusammenfassung ................................................................................................... 219
Anhang ...................................................................................................................... A 223
Tabellenverzeichnis...................................................................................................... A 217
Abbildungsverzeichnis................................................................................................. A 320
Verzeichnis der Formelzeichen und Symbole ............................................................ A 324
Literaturverzeichnis...................................................................................................... A 339
iv
Anhangverzeichnis
A Ergebnisse der Einzelauswertung................................................................................A-224
A.1
Versuch V 01........................................................................................................A-224
A.1.1
Explorative Datenanalyse ..................................................................................A-224
A.1.2
Schätzung der Mittelwerte und Varianzen.........................................................A-225
A.1.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-226
A.2
Versuch V 02........................................................................................................A-228
A.2.1
Explorative Datenanalyse ..................................................................................A-228
A.2.2
Schätzung der Mittelwerte und Varianzen.........................................................A-229
A.2.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-230
A.2.4
Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-231
A.3
Versuch V 03........................................................................................................A-234
A.3.1
Explorative Datenanalyse ..................................................................................A-234
A.3.2
Schätzung der Mittelwerte und Varianzen.........................................................A-235
A.3.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-236
A.4
Versuch V 04........................................................................................................A-237
A.4.1
Explorative Datenanalyse ..................................................................................A-237
A.4.2
Schätzung der Mittelwerte und Varianzen.........................................................A-238
A.4.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-239
A.4.4
Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-240
A.5
Versuch V 05........................................................................................................A-242
A.5.1
Explorative Datenanalyse ..................................................................................A-242
A.5.2
Schätzung der Mittelwerte und Varianzen.........................................................A-243
A.5.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-244
A.6
Versuch V 06........................................................................................................A-245
A.6.1
Explorative Datenanalyse ..................................................................................A-245
A.6.2
Schätzung der Mittelwerte und Varianzen.........................................................A-246
A.6.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-247
A.6.4
Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-248
A.7
Versuch V 07........................................................................................................A-249
A.7.1
Explorative Datenanalyse ..................................................................................A-250
A.7.2
Schätzung der Mittelwerte und Varianzen.........................................................A-251
A.7.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-252
A.8
Versuch V 08........................................................................................................A-253
A.8.1
Explorative Datenanalyse ..................................................................................A-253
A.8.2
Schätzung der Mittelwerte und Varianzen.........................................................A-254
A.8.3
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte..................................................................................................A-255
A.8.4
Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-256
A.9
Versuch V 09........................................................................................................A-258
A.9.1
Explorative Datenanalyse ..................................................................................A-258
A.9.2
Schätzung der Mittelwerte und Varianzen.........................................................A-259
v
Anhangverzeichnis
A.9.3
A.10
A.10.1
A.10.2
A.10.3
A.10.4
A.11
A.11.1
A.11.2
A.12
A.12.1
A.12.2
A.13
A.13.1
A.13.2
A.14
A.14.1
A.14.2
A.14.3
A.15
A.15.1
A.15.2
A.15.3
A.15.4
A.15.5
A.15.6
A.16
A.16.1
A.16.2
A.16.3
A.16.4
B
C
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-260
Versuch V 10 ....................................................................................................... A-261
Explorative Datenanalyse.................................................................................. A-261
Schätzung der Mittelwerte und Varianzen ........................................................ A-262
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-263
Untersuchung der Ortsabhängigkeit der Messwerte.......................................... A-264
Versuch V 11 ....................................................................................................... A-265
Schätzung der Mittelwerte und Varianzen ........................................................ A-266
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-267
Versuch V 12 ....................................................................................................... A-267
Schätzung der Mittelwerte und Varianzen ........................................................ A-268
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-269
Versuch V 13 ....................................................................................................... A-269
Schätzung der Mittelwerte und Varianzen ........................................................ A-270
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-271
Versuch V 14 ....................................................................................................... A-271
Explorative Datenanalyse.................................................................................. A-272
Schätzung der Mittelwerte und Varianzen ........................................................ A-273
Untersuchung der Mittelwertunterschiede für die Schichten ............................ A-274
Versuch V 15 ....................................................................................................... A-277
Explorative Datenanalyse.................................................................................. A-277
Schätzung der Mittelwerte und Varianzen ........................................................ A-278
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-279
Vergleich der Auswahlmethoden – einfache mehrstufige
Zufallsauswahl und geschichtete mehrstufige Zufallsauswahl ......................... A-283
Untersuchung einer optimierten Variante ......................................................... A-283
Untersuchung der Verschnittreste ..................................................................... A-285
Versuch V 16 ....................................................................................................... A-286
Explorative Datenanalyse.................................................................................. A-287
Schätzung der Mittelwerte und Varianzen ........................................................ A-288
Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und
Auswahlschritte ................................................................................................. A-289
Untersuchung einer optimierten Variante ......................................................... A-290
Begriffe und Formelzeichen der mehrstufigen Zufallsauswahl.................................. A-292
Berechnung der Mittelwerte und Varianzen in einem mehrstufigen
Auswahlmodell......................................................................................................... A-300
C.1
Das zweistufige Auswahlmodell ......................................................................... A-300
C.1.1
Mittelwerte ........................................................................................................ A-300
C.1.2
Varianzen........................................................................................................... A-300
C.1.3
Fehleranteile ...................................................................................................... A-302
C.2
Das dreistufiges Auswahlmodell ......................................................................... A-304
C.2.1
Mittelwerte ........................................................................................................ A-304
C.2.2
Varianzen........................................................................................................... A-305
C.2.3
Fehleranteile ...................................................................................................... A-306
vi
Anhangverzeichnis
C.3
C.3.1
C.3.2
C.3.3
Das vierstufige Auswahlmodell ...........................................................................A-310
Mittelwerte .........................................................................................................A-310
Varianzen ...........................................................................................................A-310
Fehleranteile....................................................................................................... A 312
vii
1 EINLEITUNG
Im Interesse einer nachhaltigen Wirtschaftsentwicklung gewinnt der Aufbau einer geordneten
Abfallwirtschaft und die Schließung von Stoffkreisläufen weltweit an Bedeutung. Insbesondere in den industrialisierten Ländern wird die Notwendigkeit einer sicheren und umweltverträglichen Beseitigung und die Nutzung der stofflichen und energetischen Potenziale von Abfällen erkannt.
In Deutschland wurden mit dem Kreislaufwirtschafts- und Abfallgesetzes (KrW-/AbfG) [1] und
seinen untergesetzlichen Regelwerken die rechtlichen Voraussetzungen für den Aufbau geschlossener Stoffkreisläufe geschaffen. Unter Berücksichtigung technischer und ökonomischer Gesichtspunkte soll ein größtmöglicher Anteil der nicht zu vermeidenden Abfälle einer
Verwertung zugeführt werden.
Bereits heute wird ein Großteil der Abfälle über vielfältige Verwertungsverfahren in den Stoffkreislauf zurückgeführt. Durch das Inkrafttreten der Abfallablagerungsverordnung (AbfAblV)
[2] ist zu erwarten, dass die Abfallmenge, die einer stofflichen oder energetischen Verwertung zugeführt wird, in den kommenden Jahren erheblich ansteigen wird, da ab dem
01.06.2005 nur noch vorbehandelte Siedlungsabfälle deponiert werden dürfen. Durch die
Getrennterfassung wertstoffhaltiger Stoffgruppen oder die Sortierung gemischter Abfälle in
verwertbare und zu beseitigende Stoffgruppen sind eine Vielzahl von Stoffströmen in der
Abfall- und Kreislaufwirtschaft entstanden.
Die Überwachungspflicht einerseits wie auch das steigende ökonomische Interesse an der
Abfallverwertung führen dazu, dass die Anforderungen an die zuverlässige Beurteilung der
Stoffströme in der Abfallwirtschaft steigen. So werden beispielsweise von den zuständigen
Abfallbehörden Daten zur Überwachung von Schadstoffbelastungen, zur Überprüfung von
Verwertungsquoten, zur Gewährleistung der Entsorgungssicherheit und zur Aufstellung von
Abfallwirtschaftsplänen gefordert. Planer und Betreiber von Abfallanlagen hingegen benötigen Daten zur Menge, zur Zusammensetzung und zu physikalischen, chemischen und technischen Eigenschaften der Abfälle. Der Qualitätssicherung in der Abfallwirtschaft kommt damit eine bedeutende Stellung zu. Qualitätssicherung ist aber in nahezu allen Fällen nur durch
die Entnahme von zuverlässigen Stichproben möglich.
Zur Beschreibung der bei der Verwertung und Beseitigung von Abfällen und Abfallgemischen
interessierenden Eigenschaften sind sowohl Merkmale, die den Wert eines Stoffes oder
Stoffgemisches beschreiben als auch Merkmale die das Gefährdungspotential für Mensch
und Umwelt charakterisieren, einzubeziehen. Für nahezu alle Verwertungs- und Beseitigungsverfahren ist es von elementarer Bedeutung, möglichst genaue und verlässliche Infor1
Kapitel 1
mationen über die verfahrensrelevanten Eigenschaften zu besitzen. Zu den interessierenden
Abfalleigenschaften gehören beispielsweise die stoffliche Zusammensetzung, der Wassergehalt, der Heizwert, der Glührückstand, der gesamte organische Kohlenstoffgehalt im Eluat
(TOCEluat), der Chlorgehalt, die Gasbildungsrate und das gesamte Spektrum an organischen
und anorganischen Schadstoffen. Der exakten Ermittlung des Heizwertes kommt durch das
KrW-/AbfG eine besondere Bedeutung insofern zu, da er als Kriterium für die Einstufung von
Abfällen zur Verwertung heranzuziehen ist. Der Glührückstand, der gesamte organische
Kohlenstoffgehalt im Eluat oder die Gasbildungsrate GB21 sind alternativ auszuwählende
Eigenschaftsmerkmale, die zukünftig die Ablagerung von Abfällen entscheidend beeinflussen
werden. Spätestens ab 2005 sind eindeutige Nachweise darüber zu führen, ob ein abzulagernder Abfall die in der Technischen Anleitung für Siedlungsabfälle (TASi) [3] und der AbfAblV [2] vorgegebenen Kriterien einhalten kann.
Weiteren Untersuchungsbedarf wird es bei der energetischen Nutzung von Sekundärbrennstoffen in industriellen Anlagen wie Kraft- oder Zementwerken geben. Um als Energieträger
genutzt zu werden, muss der aus heizwertreichen Abfallbestandteilen hergestellte Sekundärbrennstoff umfassenden rechtlichen und technischen Anforderungen genügen. Der erzeugte Sekundärbrennstoff soll eine möglichst gleichbleibende Brennstoffqualität und niedrige Schadstoffgehalte aufweisen [4].
Voraussetzung für eine zuverlässige Ermittlung dieser Abfalleigenschaften ist die Anwendung eines gesicherten und vor allem auch reproduzierbaren Probenahmeverfahrens. Die
Ziehung einer Stichprobe aus einer Grundgesamtheit oder kurz die Probenahme ist von
grundlegender Bedeutung in der Gewinnung von Daten und Informationen. Genau genommen beruht unser Wissen, unsere Einstellung und unser Handeln weitgehend auf Stichproben. Dies trifft gleichermaßen im Alltag und in der Forschung zu. Um fundierte Schlüsse aus
den Ergebnissen einer Stichprobe zu ziehen, muss die Stichprobe repräsentativ sein.
Erst Anfang der dreißiger Jahre begann die Entwicklung einer eigenen Theorie zur Auswahl
von repräsentativen Stichproben und deren Übertragung auf die zu beschreibende Wirklichkeit. Die Stichprobentheorie wurde in den USA zunächst für die Markt- und Meinungsforschung entwickelt. Sie basiert auf der Wahrscheinlichkeitsrechnung und ist in seiner allgemeinen Formulierung auf nahezu allen Gebieten anwendbar [5].
In der Praxis der Probenahme fester Stoffsysteme sind die mathematisch-statistischen
Grundlagen der Stichprobentheorie auf komplexe Grundgesamtheiten mit stark streuenden
Stoffeigenschaften anzuwenden. Grundgesamtheiten mit stark streuenden Stoffeigenschaften werden als heterogen bezeichnet. Grundsätzlich gilt, je heterogener eine Grundgesamtheit zusammengesetzt ist, desto höher sind die Anforderungen an das einzusetzende Stich-
2
Einleitung
probenverfahren. Das heißt, es kommt darauf an, wie die Elemente einer Grundgesamtheit
ausgewählt werden. Um „richtig“ auszuwählen, müssen ausführliche Informationen über die
Eigenschaften der Elementareinheiten fester Stoffsysteme vorliegen. Die Entwicklung geeigneter Stichprobenverfahren ist damit nicht nur ein mathematisch-statistisches Problem, es
sind auch grundlegende Kenntnisse aus den Stoffwissenschaften erforderlich.
Für feste Stoffsysteme wurden erstmals wissenschaftlich fundierte Arbeiten für die Probenahme von Böden und Gesteinen von dem Geostatistiker G. Matheron [6] und eine umfassende Probenahmetheorie für disperse Feststoffe von P. Gy [7] formuliert. Der Ansatz von
Gy hat sich für die Probenahme mineralischer und bergbaulicher Rohstoffe wie beispielsweise Kies, Erz oder Kohle bewährt.
Die vorliegende Arbeit befasst sich mit der Probenahme heterogener Stoffe und Stoffgemische geringer Schüttdichte aus dem Abfallbereich. Sie sind den stückigen und festdispersen
Stoffsystemen zuzuordnen, unterscheiden sich aber von mineralischen und bergbaulichen
Schüttgütern erheblich. Gesetzmäßigkeiten, die beispielsweise aus der Genese mineralischer Stoffe abzuleiten sind, existieren für Abfälle nicht. Im Stoffkreislauf stehen Abfälle und
Abfallgemische am Ende des Lebenszyklus von Produkten und Gebrauchsgegenständen.
Sie sind daher im Allgemeinen durch eine große Streubreite an verschiedenen Stoffbestandteilen, Teilchengrößen, Teilchenformen, Teilchendichten usw. gekennzeichnet.
Für die Probenahme im Abfallbereich bedeutet dies, dass die Methoden aus der Probenahme mineralischer Schüttgüter nicht übertragbar sind und dass die Anforderungen an ein geeignetes Probenahmeverfahren im Abfallbereich höher einzuschätzen sind. Gleichzeitig ist
zumindest die am Geldwert gemessene Wertschöpfung bei Abfallgemischen im Stoffkreislauf
am geringsten. Wie in der Anlagentechnik zeigt sich auch im Bereich der Probenahme, dass
auf Kosten eigener stoffangepasster Entwicklungen bestehende Methoden und Verfahren
aus dem Bergbau, der Aufbereitung oder dem Tiefbau übernommen wurden. Auf eigene
grundlegende Forschungs- und Entwicklungsarbeiten wurde meist aus ökonomischen Abwägungen verzichtet. Vor diesem Hintergrund wird deutlich, warum die repräsentative Probenahme heterogener Abfälle und Abfallgemische zur Beurteilung der physikalischen, chemischen und technologischen Eigenschaften bisher nicht befriedigend gelöst wurde.
Auf die Problematik der repräsentativen Probenahme heterogener Abfälle und Abfallgemische wurde von verschiedenen Autoren hingewiesen. Die Probenahme erfolgt bislang überwiegend mit „Hausrezepten“ oder Strategien, die nur unter bestimmten Voraussetzungen
angewandt werden können [9,10,11,12,13,14,15,16,17,18]. Mit dieser Arbeit soll die vorhandene Lücke in der Erforschung und Entwicklung einer geeigneten Probenahmemethode für
heterogene Abfälle geringer Schüttdichte geschlossen werden.
3
2 AUFGABENSTELLUNG
2.1 Untersuchungsgesamtheit
Untersuchungsgesamtheit im Rahmen dieser Arbeit sind Stoffsysteme, die in privaten Haushalten, Gewerbe- und Industriebetrieben als Abfälle und Abfallgemische anfallen sowie alle
weiteren Folgeprodukte aus der Verwertung und Beseitigung dieser Abfälle. Nicht zum
Untersuchungsgegenstand gehören Abfälle und Abfallgemische mit überwiegend mineralischem Anteil. Der Untersuchungsgegenstand ist damit durch eine geringe Schüttdichte des
Gemisches und durch geringe Stoffdichten der Stoffbestandteile gekennzeichnet. Stoffe und
Stoffgemische der Abfallwirtschaft sind im Allgemeinen stark heterogen. Sie lassen sich
durch folgende Eigenschaften charakterisieren:
1. Sie besitzen mehrere Stoffkomponenten (R ≥ 2).
2. Die Stoffkomponenten können eine Vielfalt von Stoffeigenschaften besitzen.
3. Die Verbindungsverhältnisse zwischen den Stoffkomponenten können komplex sein.
Mehrere Komponenten können zu einem Stück verschmolzen, verklebt, verschraubt,
verschweißt, verlötet, vernietet, oder verknäuelt sein.
4. Die Stoffe weisen insgesamt eine geringe Schüttdichte auf (ρSch [ 1 kg/dm3).
5. Die Stoffbestandteile weichen stark von der typischen Form für Körner ab und werden
daher als Teilchen oder Stücke bezeichnet.
6. Die Teilchen- oder Stückgrößen variieren über ein weites Spektrum.
7. Zur Bestimmung der Teilchen- oder Stückgrößen existieren keine einheitlichen
Methoden, d. h. ihre Teilchen- oder Stückgrößenverteilung ist nicht einheitlich
bestimmbar.
8. Die Form der Teilchen oder Stücke kann sehr unterschiedlich sein. Sie kann rund, eckig,
plattig, kantig, länglich, flach usw. sein.
9. Die Teilchen oder Stücke sind nicht formstabil, d. h. leicht verformbar. Eine Beschreibung
ihrer Form ist daher nicht sinnvoll.
10. Die Oberflächen der Teilchen oder Stücke können rau, glatt, beschichtet oder
verschmutzt sein.
11. Die Stoffsysteme sind im Gegensatz zu Schüttgütern nicht rieselfähig. Ihr
schüttgutmechanisches Verhalten ist komplex und bisher noch unerforscht.
4
Aufgabenstellung
Für Stoffsysteme aus der Abfallwirtschaft ist anzunehmen, dass eine zu untersuchende Eigenschaft (ein interessierendes Merkmal) von Teilchen zu Teilchen bzw. von Teilchengruppe
zu Teilchengruppe starken Schwankungen
unterliegen wird. Das Stoffsystem ist bezüglich der Zusammensetzung, der Geometrie
und des Durchmischungsgrades ihrer Bestandteile stark heterogen. Abbildung 2.1 und
Abbildung 2.2 zeigen die Beschaffenheit von
Berliner Hausmüll vor der Abfallerfassung und
auf der Deponie. Allein der Teilchengrößenbereich reicht von Staubpartikeln bis zu Teppichen und Bodenbelägen von mehreren MeAbbildung 2.1: Berliner Hausmüll
tern Länge. Es wird deutlich, welche Anforderungen derartige Stoffgemische an ein Probenahmeverfahren stellen.
Im Weiteren wird das in dieser Arbeit betrachtete Stoffsystem als heterogene Stoffe
und Stoffgemische geringer Schüttdichte aus
der Abfallwirtschaft oder kurz als Abfallgemisch bezeichnet. Im Kontext mit dem Begriff Stichprobe wird das Abfallgemisch als
Grundgesamtheit oder auch Untersuchungsgegenstand, Untersuchungsgesamtheit, Untersuchungsgut oder Prüfgut bezeichnet.
Abbildung 2.2: Siedlungsabfall auf der Deponie
Typische Beispiele für heterogene Abfallgemische geringer Schüttdichte sind der Hausmüll
aus privaten Haushalten und Gewerbe sowie
die davon getrennt erfassten Wertstoffe, wie
z. B. die Leichtverpackungsabfälle, die über
das „Duale System“ gesammelt werden, Papierkorbabfälle, Sortierreste aus der Abfallaufbereitung, wie z. B. Sortierreste aus der
Aufbereitung
von
Verpackungsabfällen
(Abbildung 2.3) der BaustellenabfallaufbereiAbbildung 2.3: Sortierrest aus einer DSD-Anlage
tung, der Bauschuttaufbereitung und der me-
5
Kapitel 2
chanisch-biologischen Aufbereitung von Siedlungsabfällen, Shredderleichtfraktion aus der
Entsorgung von Altautos und Kühlgeräten.
2.2 Untersuchungsziel
In der Einführung wurde die Notwendigkeit geeigneter Probenahmeverfahren zur Qualitätssicherung in der Abfallwirtschaft aufgezeigt. Für Stoffsysteme aus dem Bereich der Rohstoffwirtschaft existieren wissenschaftlich begründete Probenahmemodelle [8]. Die Probenahmemodelle beruhen auf vereinfachenden Annahmen über die Geometrie und Verteilung der
Körner und können für Stoffsysteme mit vertretbarer Korngrößenverteilung [19] und Rieselfähigkeit in der Praxis mit Erfolg angewandt werden. Die darauf beruhenden Probenahmemethoden für gleichkörnige, rieselfähige Schüttgüter aus der Rohstoffwirtschaft sind für heterogene Abfälle und Abfallgemische geringer Schüttdichte nicht ohne weiteres übertrag- und
anwendbar. Der Charakterisierung der heterogenen Abfallgemische geringer Schüttdichte ist
die starke Abweichung in den Stoffeigenschaften von mineralischen Schüttgütern zu entnehmen. Der Ansatz aus der Qualitätssicherung mineralischer Schüttgüter, die Stoffteilchen
über physikalische Modelle zu beschreiben [7], ist für die komplexen Stoffgemische aus der
Abfallwirtschaft nicht zielführend. Vor diesem Hintergrund wurde ein neuer Ansatz für die
Probenahme heterogener Abfallgemische geringer Schüttdichte entwickelt.
Ziel der Untersuchung war es daher, ausgehend von den speziellen Anforderungen, die heterogene Stoffsysteme in der Abfallwirtschaft an die repräsentative Probenahme stellen, ein
neuartiges Probenahmeverfahren zu entwickeln und eingehend wissenschaftlich zu untersuchen. Von zentraler Bedeutung ist die Heterogenität der Abfallgemische geringer Schüttdichte, die maßgeblich für den unvermeidbaren Fehler einer Stichprobenuntersuchung verantwortlich ist. Dafür müssen die relevanten Stoffeigenschaften identifiziert und ihre Auswirkungen auf die Heterogenität beschrieben werden.
Der Schwerpunkt dieser Arbeit liegt in der Erarbeitung der methodischen Grundlagen für ein
neues praxistaugliches Probenahmeverfahren sowie der Entwicklung und Umsetzung der
erforderlichen Probenahmeapparatur für Forschungszwecke. Das neue Probenahmeverfahren soll nach einer einheitlichen Vorgehensweise hinreichend genaue und reproduzierbare
(d. h. repräsentative) Daten zur Beurteilung einer Untersuchungsgesamtheit oder eines Prüfgutes liefern. Die Anwendbarkeit, Eignung und Zuverlässigkeit des Verfahrens wird durch ein
umfangreiches Versuchsprogramm verifiziert.
6
Aufgabenstellung
2.3 Aufgaben
Zur Erreichung des Untersuchungsziels werden folgende Arbeitsschritte durchgeführt:
1. Ausarbeitung eines methodischen Ansatzes.
2. Untersuchung der relevanten Stoffeigenschaften. Dazu gehören u. a. das
Komprimierungsverhalten, die Dichte, die Teilchengrößenverteilung und die
Teilchenmassenverteilung der Versuchsmaterialien.
3. Entwickeln und Testen der Probenahme-Apparatur.
4. Durchführung der Probenahme mit synthetischen Zwei- und Dreistoffgemischen
bekannter Zusammensetzung (Bestimmung der Fehlergrößen des
Probenahmeverfahrens).
5. Untersuchung von Einflussgrößen auf die Heterogenität des Stoffsystems.
6. Vergleich des neuen Probenahmeverfahrens mit der konventionellen
Teilungskreuzmethode.
7. Validierung des Probenahmeverfahrens mit realen Abfallgemischen unbekannter
Zusammensetzung.
7
3 METHODISCHE GRUNDLAGEN
3.1 Statistische Grundlagen
Die Aufgabe der Statistik besteht darin, aus Daten Informationen zu gewinnen. Die deskriptive Statistik ordnet, gruppiert und konzentriert Daten. Die induktive Statistik schließt aus beobachteten Daten auf unbeobachtete verborgene Strukturen; aus Stichprobendaten wird auf
die „wahren“ Parameter einer Grundgesamtheit geschlossen. Das Ziel besteht meist darin,
Aussagen über eine komplexe Wirklichkeit zu treffen, für deren Beschreibung entsprechende
Modelle zu entwickeln sind. Die Grundlagen hierfür stellt die Wahrscheinlichkeitstheorie zur
Verfügung [20].
Von den Mathematikern Pascal und Fermat wurden anhand der Beschreibung der Gewinnaussichten von Glücksspielen bereits im 17. Jahrhundert die ersten grundlegenden Begriffe
zur Wahrscheinlichkeitsrechnung entwickelt. 1933 veröffentlichte Alexey N. Kolmogoroff [21]
seine Axiomatik, die grundlegend für den Aufbau der Wahrscheinlichkeitstheorie ist. Die
Wahrscheinlichkeitstheorie ist ein geeignetes Werkzeug, das Modelle zur Beschreibung von
zufälligen Ereignissen liefert. Die Entnahme einer Stichprobe kann unter bestimmten Voraussetzungen als zufälliges Ereignis aufgefasst werden. Die Entnahme einer Stichprobe und
der Rückschluss von der Stichprobe auf die Grundgesamtheit können mit Hilfe der Modelle
aus der Wahrscheinlichkeitstheorie erklärt werden.
3.1.1 Der Wahrscheinlichkeitsbegriff
Über den Begriff der Wahrscheinlichkeit gibt es unterschiedliche Auffassungen und Sichtweisen. Es existiert der logische, der subjektive und der objektive Wahrscheinlichkeitsbegriff
[20]. Die Frage „Was ist die Wahrscheinlichkeit P{A} eines Ereignisses A?“ wird entsprechend der jeweiligen Sicht auf unterschiedliche Weise beantwortet. Für die Beschreibung der
Stichprobenahme eignet sich die objektive Sichtweise am besten. Die Wahrscheinlichkeit
wird dabei als objektive, „quasi-physikalische“ Eigenschaft aufgefasst. Grundlagen sind das
(mathematisch nicht beweisbare) „Intuitive Gesetz der großen Zahlen“ und das (beweisbare)
„Starke Gesetz der großen Zahlen“. Kolmogoroff [21] gibt an, welche Eigenschaften die
Wahrscheinlichkeit besitzen muss.
8
Methodische Grundlagen
Die Axiome von Kolmogoroff
Gegeben sei eine Menge S von Ereignissen, die folgende Eigenschaften besitzen1:
1. Omega selbst gehört zu S. Ω heißt das sichere Ereignis.
2. Ø, die leere Menge, gehört zu S. Ø heißt das unmögliche Ereignis.
3. Ist A ein Ereignis, dann ist auch das Komplement A von A ein Ereignis.
4. Sind A und B zwei Ereignisse, so sind A ∪ B sowie A ∩ B ebenfalls Ereignisse.
5. Die Forderung 4. wird auf abzählbar viele Ereignisse ausgedehnt: Aus Ai ∈ S für alle
i = 1, 2, ... folgt
∞
U Ai ∈ S und
i =1
∞
IA ∈S
i
(3-1)
i =1
Für jedes Ai ∈ S ist eine reelle Zahl als Wahrscheinlichkeit P von A definiert.
Für diese gilt:
Axiom I:
0 ≤ P{A} ≤ 1
Axiom II:
P{Ω} = 1
Axiom III:
Sind die höchstens abzählbar unendlich vielen Ereignisse Ai paarweise disjunkt, so gilt:
⎧∞ ⎫ ∞
P ⎨U Ai ⎬ = ∑ P{Ai }
⎩ i =1 ⎭ i =1
(3-2)
Der Wahrscheinlichkeitsbegriff nach Laplace besagt, dass unter den Voraussetzungen:
1. Es seien A1, A2, A3, ..., An disjunkte (Primär-)Ereignisse, von denen genau eines eintreten
muss:
n
UA
i
= Ω =: sicheres Ereignis
i =1
2. Alle Ereignisse seien gleich wahrscheinlich:
P{A1 } = P{A2 } = P{A3 } = ... = P{An }
1
S ist eine σ-Algebra und P ein Maß auf S
9
Kapitel 3
Dann folgt aus den Axiomen II und III:
P{Ai } =
1
n
(3-3)
Für zusammengesetzte Ereignisse B = Ai1 ∪ Ai2 ∪ ... ∪ Aik gilt dann:
P{B} =
k
n
(3-4)
wobei: k: Anzahl der Primärereignisse, aus denen sich das abgeleitete Ereignis zusammensetzt
n: Anzahl der möglichen gleichwahrscheinlichen Primärereignisse
Für die Entnahme von Stichproben ist das Modell der gleichwahrscheinlichen Primärereignisse nach der Laplace’schen Formel grundlegend.
Bedingte Wahrscheinlichkeit und Unabhängigkeit
Die Entnahme von Stichproben aus einer Grundgesamtheit kann nicht in jedem Falle als
zusammengesetztes unabhängiges Ereignis aufgefasst werden. Wird eine Stichprobe durch
mehrere nacheinander geschaltete Auswahlvorgänge gewonnen, oder sind räumliche oder
zeitliche Korrelationen zwischen den Elementen einer Grundgesamtheit gegeben, so liefert
das Primärereignis Ai möglicherweise ein „Vorwissen“ über das Primärereignis Ai+1.
Ist P{A} ≠ 0 , so ist die bedingte Wahrscheinlichkeit P{B A} definiert durch:
P{B A} :=
P{B ∩ A}
P{A}
(3-5)
Stochastische Unabhängigkeit liegt genau dann vor, wenn gilt:
A und B sind unabhängig genau dann, wenn P{B A} = P{B} ist. Mit Gleichung 3-5 ergibt
sich:
P{A ∩ B} = P{A}⋅ P{B}
10
(3-6)
Methodische Grundlagen
3.1.2 Zufallsereignis
Zu den Ereignissen zählen Vorgänge, die in der realen Welt beobachtet werden können (von
Menschen unbeeinflusst) oder Experimente, die nach einer ganz bestimmten Vorschrift ausgeführt werden und beliebig oft wiederholbar sind (von Menschen beeinflusst). Hängt der
Ausgang eines Ereignisses vom Zufall ab, wird das Ereignis als Zufallsereignis bezeichnet.
Sind die Ereignisse voneinander unabhängig, dann beeinflussen sich die Ergebnisse bei
Wiederholung des Zufallsereignisses nicht gegenseitig. Beispiele für Zufallsereignisse sind:
Werfen einer Münze
Würfeln
Kartenziehen
Ziehung der Lottozahlen
Zufallsstichprobe
In Modellen werden Wahrscheinlichkeiten für Ereignisse erklärt und Ereignisse werden durch
Mengen dargestellt.
3.1.3 Zufallsvariable
Die Beschreibung von Zufallsereignissen erfolgt mit zufälligen Variablen, die im Folgenden
auch Zufallsvariablen genannt werden. Jede Zufallsvariable ist eine Funktion auf Ω und
ordnet dem Element e eines Wahrscheinlichkeitsraumes eine Realisation zu. Sowohl den
Elementen als auch den Realisationen können Wahrscheinlichkeiten zugeordnet werden.
Es gilt:
1. Die zufällige Variable X ordnet jedem Element e der Grundmenge Ω eine reelle Zahl x
zu: X(e) = x.
2. Dabei muss sich für jede Zahl x der Aussage „ X ≤ x “ eine eindeutige Wahrscheinlichkeit
zuordnen lassen: P{X ≤ x} := P{e ∈ Ω / X (e ) ≤ x} .
Im Modell zur Beschreibung eines Stichprobenvorganges werden folgende „Übersetzungen“
benutzt:
Realität
Stichprobenmodell
Merkmal
Zufallsvariable
Merkmalsausprägung
Realisation
relative Häufigkeit
Wahrscheinlichkeit
Histogramm der relativen Häufigkeiten
Wahrscheinlichkeitsverteilung
11
Kapitel 3
3.1.3.1 Diskrete Zufallsvariable
Eine diskrete Zufallsvariable X nimmt endlich oder abzählbar unendlich viele Werte xi (Realisationen) an. Dabei kann für jedes xi die Eintrittswahrscheinlichkeit pi angegeben werden.
Die Angabe aller pi = P{X = xi } heißt Wahrscheinlichkeitsverteilung von X.
P( X = xi ) =
wobei: P:
ej:
∑ P(e ) = f (x ) = p
( )
j
i
(3-7)
i
X e j = xi
Wahrscheinlichkeit
Elementarereignis
X(ej): diejenigen Elementarereignisse ej, denen die Ausprägung xi der Zufallsvariable X zugeordnet ist X(ej) = xi
f(xi):
Beispiel:
Wahrscheinlichkeitsfunktion
"Zweimaliges Werfen einer Münze"
ElementarEreignisse
Anzahl
Wappen
Wahrscheinlichkeit für
das Elementarereignis
Zufallsvariable
"Anzahl Wappen"
Wahrscheinlichkeitsfunktion
P (ej)
xi
f (xi)
ej
e1 = ZZ
0
0,25
x1 = 0
f(x1) = 0,25
e2 = ZW
1
0,25
x2 = 1
f(x2) = 0,50
e3 = WZ
1
0,25
e4 = WW
2
0,25
x3 = 2
f(x3) = 0,25
W = Wappen Z = Zahl
Eigenschaften von diskreten Zufallsvariablen
1. Die Wahrscheinlichkeitsfunktion f(xi)
P ( X = xi ) = f ( x i )
f(xi)
x1
xn
xi
Abbildung 3.1: Wahrscheinlichkeitsverteilung einer
diskreten Zufallsvariable
12
(3-8)
Methodische Grundlagen
2. Die Verteilungsfunktion F(xi)
F ( xi ) = P{X ≤ xi } =
F(xi)
1
∑ f (x )
i
xi ≤ x
(3-9)
0
xi
Abbildung 3.2: Verteilungsfunktion einer diskreten
Zufallsvariable
Weiterhin lassen sich die Momente einer Verteilung definieren [23]:
Die Zahl m k :=
∞
∑x
k
i
⋅ p i heißt das k-te Moment der diskreten Zufallsgröße X, falls die Reihe
i =1
absolut konvergiert.
Die Zahl mk :=
∞
∑ (x
i =1
− m1 ) ⋅ pi heißt das k-te zentrale Moment der diskreten Zufallsgröße X.
k
i
Über die Momente der Verteilung lassen sich die grundlegenden Parameter von Zufallsvariablen, der Erwartungswert und die Varianz definieren. Der Erwartungswert ist das 1-te Moment der Zufallsvariablen. Für k = 1 ergibt sich:
3. Der Erwartungswert E(X)
∞
m1 = E ( X ) := ∑ xi ⋅ P{X = xi }
(3-10)
i =1
Der Erwartungswert kennzeichnet das „Zentrum“ einer Verteilung. Angenommen die pi
wären Säulen mit Massen entsprechend ihrer Höhe auf der x-Achse, dann ist der Erwartungswert genau der Schwerpunkt dieses Systems auf der x-Achse (Abbildung 3.3).
13
Kapitel 3
pi
1
2
7
E(X)
i
Abbildung 3.3: Anschauliche Darstellung des Erwartungswertes
Die Varianz ist das 2-te zentrale Moment der Zufallsvariablen. Für k = 2 ergibt sich:
4. Die Varianz
∞
m2 = Var ( X ) := ∑ ( xi − m1 ) ⋅ P{X = xi }
2
i =1
= E ( X − E ( X ))
2
( )
(3-11)
= E X 2 − (E ( X ))
2
5. Typische Verteilungen
Hypergeometrische Verteilung
⎧⎛ N x ⎞ ⎛ N − N x ⎞
⎟⎟
⎪ ⎜⎜ ⎟⎟ ⋅ ⎜⎜
⎪⎪ ⎝ nx ⎠ ⎝ n − nx ⎠
f H {n x / N ; n; N x } = ⎨
⎛N⎞
⎜⎜ ⎟⎟
⎪
⎝n⎠
⎪
⎪⎩0
wobei: N:
Nx:
n:
nx :
(3-12)
Anzahl der Elemente in der Grundgesamtheit
Anzahl der Elemente in der Grundgesamtheit, die die interessierende Eigenschaft aufweisen
Anzahl der Elemente in der Stichprobe
Anzahl der Elemente in der Stichprobe, die die interessierende Eigenschaft
aufweisen
E(X ) = n ⋅
Nx
N
Var ( X ) = n ⋅
14
⎫
⎪
für nx = 0, 1, ... , n⎪⎪
⎬
⎪
⎪
⎪⎭
sonst
Nx N − Nx N − n
⋅
⋅
N
N
N −1
(3-13)
(3-14)
Methodische Grundlagen
Die Hypergeometrische Verteilung eignet sich zur Beschreibung von Ereignissen, für die
das Untersuchungsmerkmal zwei Ausprägungen besitzt (dichotome Grundgesamtheit)
und sich die Wahrscheinlichkeiten bei Wiederholung des Ereignisses ändern.
Mit der Hypergeometrischen Verteilung lässt sich die Stichprobenauswahl ohne Zurücklegen beschreiben. In der Realität ist die Auswahl ohne Zurücklegen der Normalfall. Die
Hypergeometrische Verteilung eignet sich sehr gut für die Beschreibung der Stichprobenauswahl.
Binomialverteilung
⎧⎛ n ⎞ nx
n −nx
⎪⎜⎜ ⎟⎟ ⋅ p (1 − p )
f B {n x / n; p} = ⎨⎝ nx ⎠
⎪0
⎩
wobei: p:
n:
nx:
⎫
für n x = 0, 1, ... , n⎪
⎬
⎪
sonst
⎭
(3-15)
Anteil der Elemente in der Grundgesamtheit, die die interessierende Eigenschaft aufweisen
Anzahl der Elemente in der Stichprobe
Anzahl der Elemente in der Stichprobe, die die interessierende Eigenschaft
aufweisen
E(X ) = n ⋅ p
Var ( X ) = n ⋅ p ⋅ (1 − p ) ⋅
(3-16)
N −n
N −1
(3-17)
Die Binomialverteilung eignet sich zur Beschreibung von Ereignissen für die das Untersuchungsmerkmal zwei Ausprägungen besitzt (dichotome Grundgesamtheit) und
sich die Wahrscheinlichkeiten bei Wiederholung des Ereignisses nicht ändern.
Mit der Binomialverteilung lässt sich die Stichprobenauswahl mit Zurücklegen beschreiben. Die Binomialverteilung eignet sich für die Beschreibung der Stichprobenauswahl, wenn der Auswahlsatz f sehr klein ist, d. h. die Anzahl N der Elemente einer Grundgesamtheit im Vergleich zur Anzahl n der Elemente einer Stichprobe sehr
groß ist. Für kleine Auswahlsätze (in der Praxis f < 0,05) lässt sich die Hypergeometrische Verteilung gut durch die Binomialverteilung approximieren.
In der Praxis eignet sich die Binomialverteilung besser zur Beschreibung des Stichprobenvorganges, da weniger Parameter bekannt sein müssen und die mathematische Berechnung sich vereinfacht. Es können auch Grundgesamtheiten mit in der
Praxis nicht mehr abzählbar vielen Elementen oder unbekannter Anzahl N berechnet werden.
15
Kapitel 3
3.1.3.2 Stetige Zufallsvariable
Eine Zufallsvariable X heißt stetige Zufallsvariable, falls X eine Wahrscheinlichkeitsdichte
f X ( x ) besitzt. Dies ist eine nicht negative integrierbare Funktion mit der Eigenschaft
FX ( x ) =
x
∫f
X
(t )dt
(3-18)
−∞
Die Wahrscheinlichkeit, dass die stetige Zufallsvariable X einen Wert zwischen a und b annimmt entspricht der Fläche unter der Dichtefunktion f X ( x ) in den Grenzen a und b.
b
P(a ≤ X ≤ b) = ∫ f X ( x)dx = FX (b ) − FX (a )
(3-19)
a
Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable einen bestimmten Wert a annimmt,
ist immer gleich Null.
a
P( X = a ) = ∫ f X ( a )dx = FX (a ) − FX (a ) = 0
(3-20)
a
Eigenschaften von stetigen Zufallsvariablen
1. Die Wahrscheinlichkeitsdichtefunktion
F' X ( x ) = f X ( x )
fX(x)
mit
P{X = x} = 0
P{− ∞ ≤ X ≤ +∞} = 1
+∞
∫ f (x )dx = 1
X
x
Abbildung 3.4: Wahrscheinlichkeitsdichte einer stetigen
Zufallsvariable
16
(3-21)
−∞
Methodische Grundlagen
2. Die Verteilungsfunktion
FX(x)
FX ( x ) = P{X ≤ x} =
1
x
∫ f (x )dt
X
−∞
(3-22)
0
x
Abbildung 3.5: Verteilungsfunktion einer stetigen
Zufallsvariable
Analog der Beschreibung für den diskreten Fall, lassen sich die Momente der Verteilungen
für den stetigen Fall definieren.
Die Zahl mk ( X ) :=
+∞
∫x
k
⋅ f X ( x ) heißt das k-te Moment der stetigen Zufallsgröße X, falls das
−∞
Integral absolut konvergiert.
Die Zahl mk ( X ) :=
+∞
∫ (x − µ )
k
⋅ f X ( x ) heißt das k-te zentrale Moment der stetigen
−∞
Zufallsgröße X.
Der Erwartungswert ist das 1-te Moment der Zufallsvariablen. Für k = 1 ergibt sich:
3. Der Erwartungswert
m1( X ) = E ( X ) =
+∞
∫ x ⋅ f (x )dx = µ
X
(3-23)
−∞
Die Varianz ist das 2-te zentrale Moment der Zufallsvariablen. Für k = 2 ergibt sich:
4. Die Varianz
m2 ( X ) = Var ( X ) =
+∞
∫ (x − µ )
2
−∞
= E ( X − E ( X )) = σ
2
⋅ f X ( x )dx
(3-24)
2
17
Kapitel 3
5. Typische Verteilungen
Gleichverteilung
⎧ 1
⎪
fG {x / a ; b} = ⎨ b − a
⎪⎩0
fX(x)
1
b−a
E(X ) =
0
a
b
x
⎫
für a ≤ x ≤ b ⎪
⎬
sonst ⎪⎭
a+b
2
Var ( X ) =
(3-25)
(3-26)
(b − a )2
(3-27)
12
Abbildung 3.6: Wahrscheinlichkeitsdichte der
Gleichverteilung
Normalverteilung (Gauß´sche Glockenkurve)
(x−µ )
⎧⎪ 1
−
2
⋅ e 2σ
f N {x / µ ;σ 2 } = ⎨
σ
π
⋅
2
⎪⎩
fN(x)
2
⎫⎪
für − ∞ ≤ x ≤ +∞⎬
⎪⎭
(3-28)
x
E(X)
E(X ) = µ
(3-29)
Var ( X ) = σ 2
(3-30)
Abbildung 3.7: Wahrscheinlichkeitsdichte der
Normalverteilung
Log-Normalverteilung
2
1
⎧ 1
⎫
⋅ ⋅ e −(ln x − µ ) 2⋅σ für x > 0 ⎪
⎪
f ln N {x / µ ;σ } = ⎨σ ⋅ 2π x
⎬
⎪0
⎪
sonst
⎩
⎭
2
flnN(x)
(3-31)
E(X ) = e
E(X)
x
Abbildung 3.8: Wahrscheinlichkeitsdichte der LogNormalverteilung
18
µ+
σ2
2
(3-32)
(
)
Var ( X ) = e 2 µ +σ ⋅ eσ − 1
2
2
(3-33)
Methodische Grundlagen
3.1.3.3 Zweidimensionale stetige Zufallsvariable
Jeder Einheit Ui einer Grundgesamtheit UG wurde bislang ein Merkmal Xi zur Beschreibung
der Eigenschaften zugeordnet. Stehen zur Beschreibung zwei oder mehr Merkmale zur Verfügung, und sind diese Merkmale Zufallsgrößen, so können die Einheiten Ui der Grundgesamtheit im mehrdimensionalen Fall eindeutig mit dem n-tupel (X1, X2, ... ,Xn) beschrieben
werden. Ein n-tupel von Zufallsgrößen heißt n-dimensionaler Zufallsvektor. Im zweidimensionalen Fall werden die Eigenschaften der Einheiten einer Grundgesamtheit durch den Vektor
(X;Y) beschrieben.
Eigenschaften von zweidimensionalen stetigen Zufallsvariablen
1. Die gemeinsame Verteilungsfunktion
F ( x, y ) = P( X ≤ x; Y ≤ y ) = P({e ∈ Ω X (e ) ≤ x} ∩ {e ∈ Ω Y (e ) ≤ y})
(3-34)
Sie wird auch als die zweidimensionale Wahrscheinlichkeitsdichtefunktion bezeichnet.
Analog dem eindimensionalen Fall, lassen sich die Momente der Zufallsvariablen X und Y
definieren. Im zweidimensionalen Fall existieren zwei 1-te und drei 2-te Momente. Für
k = 1 bzw. k = 2 gilt:
2. Die Erwartungswerte
E(X ) =
x = +∞ y = +∞
∫ ∫ x ⋅ f (x; y )dxdy
(3-35)
x = −∞ y = −∞
E (Y ) =
x = +∞ y = +∞
∫ ∫ y ⋅ f (x; y )dxdy
(3-36)
x = −∞ y = −∞
x = +∞ y = +∞
( )= ∫ ∫ x
E X
2
2
⋅ f ( x; y )dxdy
(3-37)
2
⋅ f ( x; y )dxdy
(3-38)
x = −∞ y = −∞
x = +∞ y = +∞
( )= ∫ ∫ y
EY
2
x = −∞ y = −∞
E(X ;Y ) =
x = +∞ y = +∞
∫ ∫ x ⋅ y ⋅ f (x; y )dxdy
(3-39)
x = −∞ y = −∞
Die Varianzen lassen sich aus den 2-ten zentralen Momenten der Zufallsvariablen X und
Y ableiten. Im zweidimensionalen Fall existieren drei 2-te zentrale Momente. Für k = 2
gilt:
19
Kapitel 3
3. Die Varianzen
var ( X ) =
x = +∞ y = +∞
∫ ∫ (x − E ( X ))
2
( )
⋅ f ( x; y )dxdy = E X 2 − E 2 ( X )
x = −∞ y = −∞
var (Y ) =
x = +∞ y = +∞
∫ ∫ ( y − E (Y ))
2
( )
⋅ f ( x; y )dxdy = E Y 2 − E 2 (Y )
x = −∞ y = −∞
cov( X ;Y ) =
(3-40)
(3-41)
x = +∞ y = +∞
∫ ∫ (x − E ( X )) ⋅ ( y − E (Y )) ⋅ f (x; y )dxdy
x = −∞ y = −∞
(3-42)
= E ( X ⋅ Y ) − E ( X ) ⋅ E (Y )
4. Die Unabhängigkeit
Zwei
Zufallsvariable
X
und
Y
mit
einer
gemeinsamen
Verteilungsfunktion
F ( x, y ) = P( X ≤ x; Y ≤ y ) und den einzelnen Verteilungsfunktionen F1 ( x ) = P( X ≤ x )
und F2 ( y ) = P (Y ≤ y ) heißen unabhängig, wenn für alle Paare ( x; y ) ∈ ℜ 2 gilt:
F ( x, y ) = P( X ≤ x; Y ≤ y ) = P( X ≤ x ) ⋅ P(Y ≤ y ) = F1 ( x ) ⋅ F2 ( y )
(3-43)
5. Die Kovarianz
Die Kovarianz ist ein Maß für die Abhängigkeit von Zufallsgrößen.
cov( X ; Y ) := E (( X − E ( X )) ⋅ (Y − E (Y ))) =: σ xy = σ yx
= E ( X ⋅ Y ) − E ( X ) ⋅ E (Y )
Ist X=Y dann gilt:
(3-44)
cov( X ; X ) = var ( X )
Für unabhängige Größen X und Y gilt: cov( X ;Y ) = 0 . Die Umkehrung gilt nicht.
6. Der Korrelationskoeffizient
Wird die Kovarianz der Zufallsgrößen X und Y auf die Quadratwurzeln der Varianzen bezogen, erhält man den Korrelationskoeffizienten ρ von X und Y.
ρ xy :=
20
cov( X ;Y )
Var ( X ) ⋅ Var (Y )
=:
σ xy
σ x ⋅σ y
(3-45)
Methodische Grundlagen
Der Korrelationskoeffizient liegt zwischen –1 und +1. Er ist für unabhängige Zufallsgrößen identisch Null. Aus ρ = 0 kann nicht geschlossen werden, dass die Zufallsvariablen
unabhängig sind. Ist ρ = 0 nennt man die Größen X und Y unkorreliert.
7. Typische Verteilungen
Zweidimensionale Normalverteilung
Abbildung 3.9: Zweidimensionale Normalverteilung
f N ;2 −dim ( x; y ) =
1
2πσ xσ y ⋅ 1 − ρ
2
xy
⋅e
−
2
(
1
2
1− ρ xy
⎡ ( x − a )2
( x − a1 )⋅( y −a2 ) ( y −a2 )2 ⎤⎥
1
+
⋅⎢
− 2 ρ xy ⋅
2
σ x ⋅σ y
σ 2y ⎦⎥
⎣⎢ σ x
)
(3-46)
wobei a1, a2 = konstant
Für die zweidimensionale Verteilungssummenfunktion FN ;2 −dim (x; y ) gilt dann:
FN ;2−dim ( x; y ) =
x
y
∫ ∫f
N ; 2 − dim
(s; t )dsdt
s = −∞ t = −∞
FN ;2 −dim ( x; y ) =
x
y
∫ ∫
s = −∞ t = −∞
1
2πσ xσ y ⋅ 1 − ρ xy2
⋅e
−
⎡ ( s − a )2
( s −a1 )(⋅ t −a2 ) + (t −a2 )2 ⎤⎥
1
1
⋅⎢
− 2 ρ xy ⋅
2
σ x ⋅σ y
2 1− ρ xy
σ y2 ⎥⎦
⎢⎣ σ x2
(
)
dsdt
(3-47)
Die Erwartungswerte und Varianzen berechnen sich aus den Momenten der Verteilungssummenfunktion.
21
Kapitel 3
Für die Erwartungswerte gilt:
E(X ) =
+∞ +∞
∫ ∫x⋅ f
N ; 2 − dim
(x; y )dxdy
(3-48)
− ∞− ∞
= a1
Analog berechnen sich:
E (Y ) = a2 ;
( )
E X 2 = a1 + σ x2 ;
E ( X ⋅ Y ) = σ x ⋅ σ y ⋅ ρ xy + a1 ⋅ a 2
( )
E Y 2 = a 2 + σ y2
und
für cov( X ;Y ) = 0
bzw. X ;Y unabhängig
ergibt sich E ( X ⋅ Y ) = a1 ⋅ a 2
Für die Varianzen gilt:
( )
var ( X ) = E X 2 − E 2 ( X )
(
(3-49)
)
= a1 + σ x2 − a12
Analog berechnet sich:
(
)
var (Y ) = a 2 + σ y2 − a22
=σ 2
Für die Kovarianz gilt:
cov( X ; Y ) = E ( X ⋅ Y ) − E ( X ) ⋅ E (Y )
= σ x ⋅ σ y ⋅ ρ xy + a1 ⋅ a2 − a1 ⋅ a2
= σ x ⋅ σ y ⋅ ρ xy
22
(3-50)
Methodische Grundlagen
3.1.4 Die Grenzwertsätze
Es wird das asymptotische Verhalten der Schätzfunktionen für die Parameter Summe und
Mittelwert von unabhängigen Zufallsvariablen untersucht. Die Grenzwertsätze werden bei
der Parameterschätzung und der Übertragung der Stichprobenergebnisse auf die Grundgesamtheit benötigt.
3.1.4.1 Das schwache Gesetz der großen Zahlen
Ist X1, X2, ..., Xi, ... eine Folge von unabhängig identisch verteilten zufälligen Variablen mit
E ( X ) = µ und gleicher Varianz σ 2 . Dann gilt für jedes ε > 0
bzw.
⎞ σ2
⎛1 n
P⎜⎜ ⋅ ∑ X i − µ ≥ ε ⎟⎟ ≤
2
⎠ n ⋅ε
⎝ n i =1
(3-51)
⎞
⎛1 n
lim P⎜⎜ ⋅ ∑ X i − µ ≥ ε ⎟⎟ = 0
n ⎯⎯→ ∞
⎠
⎝ n i =1
(3-52)
Interpretation:
Bei wiederholbaren Ereignissen liegen die Realisierungen der Zufallsvariablen des arithmetischen Mittels X , bei genügend großem n, beliebig nahe beim festen Zahlenwert µ. Damit
wird der Mittelwert x einer Stichprobe als Realisierung der Zufallsvariablen X zu einem
recht guten Schätzwert für den meist unbekannten Erwartungswert µ. Es ist x ≈ µ .
3.1.4.2 Das starke Gesetz der großen Zahlen
Mit Wahrscheinlichkeit 1 gilt:
Ist X1, X2, ..., Xi, ... eine Folge von unabhängig identisch verteilten zufälligen Variablen mit
E ( X ) = µ . Dann gilt mit Wahrscheinlichkeit 1:
bzw.
1 n
lim ⋅ ∑ X i = µ
n ⎯⎯→ ∞ n i =1
(3-53)
⎧
⎫
1 n
P ⎨ lim ⋅ ∑ X i = µ ⎬ = 1
⎩n ⎯⎯→ ∞ n i =1
⎭
(3-54)
23
Kapitel 3
D. h. der Grenzwert der relativen Häufigkeit ist die Wahrscheinlichkeit.
Interpretation:
In einer Serie unabhängiger Versuche, bei der das Ereignis A mit der Wahrscheinlichkeit
P{A} auftreten kann, konvergiert die relative Häufigkeit, mit der A in der Serie auftritt, mit
Wahrscheinlichkeit 1 gegen den Grenzwert P{A}.
Bei wiederholbaren Ereignissen lassen sich aufgrund des starken Gesetzes der großen Zahlen Wahrscheinlichkeiten durch lange Versuchsreihen beliebig genau messen. Übertragen
auf die Stichprobenauswahl bedeutet dies, dass die „wahren“ Parameter einer Grundgesamtheit sich durch Stichprobenuntersuchungen hinreichend genau bestimmen lassen, wird
die Stichprobe nur groß genug gewählt.
Beispiel:
Ziehung von 9 Kugeln aus einer Urne mit 30 Kugeln, wovon 10 rot und 20 schwarz sind. Die Ziehung erfolgt
mit Zurücklegen und wird 30 bzw. 200 mal durchgeführt.
Wahrscheinlichkeitsverteilung von X:
Zufallsvariable X:
Realisation x:
Binomialverteilung für Ereignisse mit zwei Ausprägungen und
Auswahl mit Zurücklegen
Anzahl der gezogenen roten Kugeln
Anzahl der gezogenen roten Kugeln in der Stichprobe
{X1, X2, ..., Xn} eine Folge von unabhängig identisch verteilten zufälligen Variablen mit E ( X ) = µ . Der Erwartungswert ist bekannt und es gilt: E ( X ) = µ = 3
a)
Der Versuch wird 30 mal ausgeführt. Wir erhalten die Realisationen xi {x1, x2, ... , x30}={2, 1, ..., 3}
und x = 2,96666667 (Abbildung 3.10)
b)
Versuch wird 200 mal ausgeführt. Wir erhalten die Realisationen x i {x1, x2, ... , x200}={2, 4, ..., 3}
6
durchschnittliche Anzahl
roter Kugeln
durchschnittliche Anzahl
roter Kugeln
und x = 3,000 (Abbildung 3.11)
5
4
3
2
1
0
0
5
10
15
20
25
Anzahl der Versuche
Abbildung 3.10: Durchschnittliche Anzahl roter
Kugeln in der Stichprobe für n<30
24
30
6
5
4
3
2
1
0
0
50
100
150
200
Anzahl der Versuche
Abbildung 3.11: Durchschnittliche Anzahl roter
Kugeln in der Stichprobe für n<200
Methodische Grundlagen
3.1.4.3 Der Zentrale Grenzwertsatz
Es seien {X1, X2, X3, ..., Xn} eine Folge unabhängiger identisch verteilter Zufallsvariablen mit
E ( X ) = µ und Var ( X ) = σ 2 . Dann konvergiert die Verteilungsfunktion der standardisierten
Summen mit wachsendem n gegen die standardisierte Normalverteilung. Oder anders ausgedrückt, die standardisierte Summe ist asymptotisch normalverteilt.
⎧ n
⎫
u2
x
⎪⎪ ∑ X i − n ⋅ µ
⎪⎪
−
1
i =1
≤ x⎬ = f N (x ) =
P⎨
⋅ ∫ e 2 du
lim
n ⋅σ
2π −∞
⎯→ ∞ ⎪
n⎯
⎪
⎪⎩
⎪⎭
(3-55)
Interpretation:
Bei vielen in der Praxis vorkommenden Zufallsvariablen kann man davon ausgehen, dass sie
aus vielen unabhängigen nichtdominierenden Einzelereignissen additiv zusammengesetzt
sind. Sie sind dann nach dem zentralen Grenzwertsatz approximativ normalverteilt. Daher
spielt die Normalverteilung in der Statistik eine zentrale Rolle. Als Faustregel kann angegeben werden, dass die Summe und der Mittelwert beliebig verteilter Grundgesamtheiten in
guter Näherung für n > 30 normalverteilt sind.
3.1.5 Schätztheorie
3.1.5.1 Statistischer Schluss
In der Schätztheorie werden die Ergebnisse oder auch Informationen einer Stichprobenuntersuchung benutzt, um Aussagen über die Parameter oder Variablen einer Grundgesamtheit innerhalb des gewählten Modells zu treffen. Dazu müssen Aussagen zu der Wahrscheinlichkeitsverteilung der im Modell enthaltenen Variablen getroffen werden. Nur so kann
die Verlässlichkeit der Aussagen mit Wahrscheinlichkeitsmaßen bewertet werden.
Einer Grundgesamtheit mit N Einheiten wird eine bestimmte Anzahl von n Einheiten entnommen. Mithilfe der n Stichprobeneinheiten wird eine Aussage über den „wahren“ Parameter der Grundgesamtheit gemacht. Ein solcher Schluss von der Stichprobe auf die Parameter
einer Grundgesamtheit wird als Repräsentationsschluss (indirekter Schluss) bezeichnet.
25
Kapitel 3
Die Parameter einer Grundgesamtheit (auch „wahre Werte“) können durch Stichprobenuntersuchungen nicht exakt bestimmt werden. Wir sprechen deshalb bei der Ermittlung der
gesuchten Parameter der Grundgesamtheit von „Schätzen". Werte, die mit Hilfe einer Stichprobe die gesuchten Parameter schätzen, heißen Schätzwerte, die Vorschrift (Funktion), die
Schätzwerte aus den Stichprobenergebnissen liefert, heißt Schätzfunktion oder auch Stichprobenfunktion.
3.1.5.2 Schätzfunktion
Die Schätz- oder auch Stichprobenfunktion ist eine ein- oder mehrdimensionale, oft nicht
lineare Funktion, die den zufälligen Variablen X1, ..., Xn eine neue zufällige Variable f(X1, ...,
Xn) zuordnet. Die Zufallsvariablen sind bestimmt durch ihre Verteilungsfunktion, den Erwartungswert und die Varianz. Die Stichprobenergebnisse sind Realisationen der Stichprobenfunktion und weichen mit einer bestimmten Wahrscheinlichkeit vom „wahren Wert“ in der
Grundgesamtheit ab. Aufgrund dieser fundamentalen Unsicherheit von Stichprobenergebnissen wird der statistische Schluss auf die Grundgesamtheit auch als Schätzen bezeichnet.
Das Verfahren, mit deren Hilfe die „wahren Werte“ geschätzt werden wird Schätzverfahren
genannt.
Allgemein:
$ , die Schätzwerte θ̂ für die Parameter der Grundgesamtheit θ
Es gibt eine Schätzfunktion Θ
(wahrer Wert) liefert.
wobei:
ˆ = f ( X , X ,..., X )
Θ
1
2
n
(Schätzfunktion)
(3-56)
θˆ = f ( x1 , x 2 ,..., x n )
(Schätzwert)
(3-57)
θ:
der unbekannte Parameter der Grundgesamtheit
ˆ =Θ
ˆ ( X ) : die Schätzfunktion von θ mit der Wahrscheinlichkeitsverteilung
Θ
{}
P Θ̂
X:
Zufallsvariable mit X = ( X 1 , X 2 ,..., X n )
x:
Realisation der Zufallsvariable X mit x = ( x1 , x2 ,..., xn )
θˆ = θˆ( x ) :
der Schätzwert für den unbekannten Parameter θ in der
Grundgesamtheit
Die Schätzfunktion als Funktion von n Zufallsvariablen ist ebenfalls eine Zufallsvariable. Zufallsvariable sind, wie bereits gezeigt, durch ihre Wahrscheinlichkeitsdichtefunktion (für stetige Zufallsvariable) oder ihre Verteilungsfunktion eindeutig bestimmt.
26
Methodische Grundlagen
Ist die Verteilungsfunktion bekannt, so können Aussagen (Wahrscheinlichkeitsaussagen)
über die Parameter der Grundgesamtheit gemacht werden.
Es kann die Wahrscheinlichkeit dafür angegeben werden, dass die Zufallsvariable einen
Wert aus einem bestimmten Intervall (oder aus mehreren bestimmten Intervallen)
annimmt.
Bei vorgegebener Wahrscheinlichkeit kann die Größe des Intervalls (der Intervalle)
angegeben werden innerhalb dessen (derer) die Zufallsvariable Werte annimmt.
Für die Anwendung bedeutet dies, dass Aussagen über die Genauigkeit, die Reproduzierbarkeit und die Sicherheit der Schätzung getroffen werden können. Anhand der Eigenschaften von Schätzfunktionen wird dies allgemein hergeleitet und dann für das Schätzen in endlichen und unendlichen Grundgesamtheiten verdeutlicht.
3.1.5.3 Eigenschaften von Schätzfunktionen
Um beurteilen zu können, wie gut eine Stichprobe die Grundgesamtheit repräsentiert, werden Gütekriterien für die Schätzung herangezogen. Es ist die Frage zu beantworten, wie
wahrscheinlich Abweichungen des Schätzwertes vom „wahren Wert“ sind. Als Gütekriterien
dienen die Eigenschaften Erwartungstreue einer Schätzfunktion (gibt Auskunft über die Genauigkeit der Schätzung) und Wirksamkeit und Effizienz einer Schätzfunktion (geben Auskunft über die Reproduzierbarkeit einer Schätzung). Die Sicherheit einer Schätzung wird im
Allgemeinen durch die Fragestellung oder die Bedeutung einer Untersuchung vorgegeben
und in jedem Fall vor der Probenahme festgelegt.
Erwartungstreue
$ heißt erwartungstreu, falls ihr Erwartungswert mit dem wahren Wert
Die Schätzfunktion Θ
()
übereinstimmt E Θ̂ = θ . Andernfalls heißt Θ̂ verfälscht oder verzerrt. Die Verzerrung oder
(englisch) bias ist die Abweichung des „wahren Wertes“ vom Erwartungswert und berechnet
sich zu:
()
ˆ
bias := θ − E Θ
(3-58)
Wirksamkeit und Effizienz
Die beiden Schätzfunktionen Θ̂ 1 und Θ̂ 2 seien erwartungstreue Schätzer von θ . D. h. es
( ) ( )
ˆ =EΘ
ˆ = θ . Dann heißt Θ̂ wirksamer als Θ̂ , wenn für die Varianzen der
gilt: E Θ
1
2
1
2
Schätzfunktionen zutrifft, dass die Varianz von Θ̂ 1 kleiner ist als die Varianz von Θ̂ 2
27
Kapitel 3
( )
( )
( var Θˆ1 < var Θˆ 2 ). Eine Schätzfunktion Θ̂ heißt effizient, wenn sie unter allen erwartungstreuen Schätzern die kleinste Varianz aufweist.
Ein geeignetes Prüfkriterium für die Güte einer Stichprobe ist der mittlere quadratische Fehler, der MSE (englisch: Mean Square Error). Kann der Erwartungswert der mittleren quadratischen Abweichung minimiert werden, kann die Stichprobenfunktion (auch Schätzer oder
Schätzfunktion) als gut geeignet angesehen werden.
(
ˆ
E θ −Θ
) ) → Minimum
2
Nach Gleichung 3-11 gilt für die Varianz einer Zufallsvariablen:
(
var ( X ) = E ( X − E ( X ))
2
)
(3-59)
Damit lässt sich der Mean Square Error (MSE), als die Summe aus der Varianz und dem bias
berechnen.
((
ˆ
E θ −Θ
) )=
2
(
) ((
ˆ + (θ − E (Θ
ˆ ))
= var Θ
ˆ + Eθ −Θ
ˆ
var θ − Θ
))
2
2
(3-60)
ˆ + (bias )2 =: MSE
= var Θ
Je genauer eine Schätzfunktion ist (bias ist
klein) und je reproduzierbarer eine Schätzfunktion ist (Varianz ist klein), desto kleiner ist
()
f Θ̂
n=200
der MSE.
Konsistenz
n=50
Es wird das Verhalten einer Schätzfunktion bei
sich änderndem Stichprobenumfang n untersucht. Eine Schätzfunktion Θ̂ n wird als konsin=10
stent bezeichnet, wenn für jedes ε > 0 die
{
Wahrscheinlichkeit P θ − Θˆ n > ε
} mit wach-
n=5
sendem n gegen Null konvergiert. Eine
Schätzfunktion ist insbesondere dann konsi-
θ ← θ̂
ˆ
Θ
stent, wenn sie asymptotisch erwartungstreu
ist und ihre Varianz gegen Null konvergiert.
Abbildung 3.12: Wahrscheinlichkeitsfunktion einer
Das heißt der bias und die Varianz streben
konsistenten Schätzfunktion für wachsendes n
gegen Null.
28
Methodische Grundlagen
3.1.5.4 Konstruktion von Schätzfunktionen
Bei der Anwendung von Schätzfunktionen für normalverteilte Zufallsvariablen wird in Kapitel
3.1.5.6 gezeigt, dass der arithmetische Mittelwert eine geeignete Schätzfunktion zur Schätzung von normalverteilten Parametern ist. Zur Konstruktion von weiteren Schätzern bzw. zur
Beschreibung der Prinzipien, wie solche Schätzer hergeleitet werden, sind die Momentenmethode, die Maximum-Liklihood-Methode und die Methode der kleinsten Quadrate zu nennen [20, 25].
3.1.5.5 Punkt- und Intervallschätzung
Bei der Schätzung von Parametern kann eine Zahl, bei mehrdimensionalen Parametern ein
Vektor, oder ein Intervall bzw. ein Zahlenbereich geschätzt werden. Wird eine Zahl oder ein
Vektor geschätzt spricht man von einer Punktschätzung, wird ein Intervall oder ein Zahlenbereich geschätzt von einer Intervallschätzung.
Punktschätzung
Aus den Ergebnissen der Stichprobeneinheiten wird mit Hilfe der Stichprobenfunktion eine
Zahl, für mehrdimensionale Parameter ein Zahlenvektor berechnet, der den gesuchten Parameter der Grundgesamtheit beschreibt. Die Stichprobenfunktion liefert Schätzwerte für die
Parameter der Grundgesamtheit. Jeder Schätzwert eines Parameters ist eine Punktschätzung für diesen Parameter.
Für diskrete Merkmale ist die Wahrscheinlichkeit, dass eine Punktschätzung den „wahren
Wert“ trifft, meist sehr klein. Für stetige Merkmale beträgt die Wahrscheinlichkeit Null, dass
der Stichprobenparameter mit dem gesuchten Parameter in der Grundgesamtheit übereinstimmt.
Es ist daher sinnvoll Angaben zur Genauigkeit einer Punktschätzung zu machen. Ein geeignetes Maß hierfür ist die Varianz bzw. die aus ihr abgeleitete Standardabweichung. Soll ein
Parameter θ durch θˆ geschätzt werden, so kann die Standardabweichung des Schätzwertes σ θˆ , als Maß für die Genauigkeit herangezogen werden. Genau genommen müsste die
Standardabweichung der Schätzfunktion σ Θ̂ als Maß für die Genauigkeit herangezogen werden, da nur für die Zufallsvariable σ Θ̂ der Erwartungswert und die Varianz definiert sind. Da
die synonyme Verwendung von Schätzwert und Schätzfunktion weitverbreitete Konvention
ist, werden die Begriffe hier ebenfalls synonym verwandt. Es wird ausdrücklich darauf hin-
29
Kapitel 3
gewiesen, dass der Schätzwert nicht als Realisation aus den Stichprobenergebnissen angesehen werden darf. Er ist mit der Unsicherheit σ θˆ behaftet.
θˆ ± σ θˆ
(3-61)
Für erwartungstreue Schätzwerte gibt die Standardabweichung des Schätzwertes σ θˆ an,
wie stark der Schätzwert vom wahren Wert θ abweicht.
Ein anderer Weg, das Ergebnis der Schätzung eines Parameters anzugeben, besteht darin,
dass ein Intervall berechnet wird, das den wahren Wert des Parameters mit einer bestimmten Wahrscheinlichkeit einschließt bzw. überdeckt. Bei Stichprobenuntersuchungen werden
bevorzugt Vertrauensbereiche, sogenannte Konfidenzintervalle für die Ergebnisdarstellung
benutzt.
Intervallschätzung
Bei der Intervallschätzung ist zu unterscheiden, ob Prognosen über die zukünftigen Realisationen von zufälligen Variablen zu treffen sind – was kann über das Eintreten von Extremwerten vorausgesagt werden - oder ob Schätzungen über unbekannte Parameter und Verteilungen zu treffen sind. Für die erst genannte Art der Intervallschätzung werden Prognoseintervalle aufgestellt, für die Schätzungen über unbekannte Parameter und Verteilungen werden Konfidenz- oder Vertrauensintervalle angegeben.
Prognoseintervalle
Ist X eine zufällige Variable, dann heißt jedes Intervall [a;b] ein (1-α) – Prognoseintervall,
wenn gilt:
P{a ≤ X ≤ b} ≥ 1 − α
(3-62)
Mit dem (1-α) – Prognoseintervall ist es möglich Wahrscheinlichkeitsaussagen über zukünftige Realisationen einer Zufallsvariablen X zu machen. Für die Messwerte, die beispielsweise
aus einer Stichprobe gewonnen werden (Realisationen einer Zufallsvariablen), kann die
Aussage
getroffen
werden,
dass
sie
mit
der
Wahrscheinlichkeit
1-α im Intervall [a;b] liegen werden.
Konfidenzintervalle
Das Ziel einer Stichprobenuntersuchung ist es im Allgemeinen, möglichst genaue Aussagen
über die gesuchten Parameter einer Grundgesamtheit (Beispiel: mittlerer Brennwert eines
30
Methodische Grundlagen
Abfallgemisches) zu treffen. Im Gegensatz zu den Prognoseintervallen, die Wahrscheinlichkeitsaussagen über zukünftige Realisationen von Zufallsvariablen liefern, ist ein Konfidenzintervall eine Behauptung über einen unbekannten Parameter einer Grundgesamtheit. Nach
dem Gesetz der Großen Zahlen liefern Konfidenzintervalle einen Anteil an richtigen Aussagen, der mindestens 1-α beträgt.
Ein Konfidenzintervall ist um so genauer oder präziser, je kürzer es ist. Ein Konfidenzintervall
ist um so sicherer oder verlässlicher, je länger bzw. höher sein Konfidenzniveau 1-α ist. Aufgrund dieser Dualität muss immer ein Kompromiss zwischen Genauigkeit und Sicherheit
gefunden werden. Ein Punktschätzer ist sehr genau, aber vollkommen unsicher.
Allgemein lassen sich Konfidenzintervalle nach folgendem Prinzip aus Prognoseintervallen
konstruieren:
Für die Zufallsvariable X, deren Verteilung vom gesuchten Parameter θ abhängt, berechnet
man das Prognoseintervall
a (θ ) ≤ X ≤ b(θ )
(3-63)
Die Realisation von X sei x und liege im Prognoseintervall
a(θ ) ≤ x ≤ b(θ )
(3-64)
Wird nun die Ungleichung nach θ aufgelöst, so ergibt sich das Konfidenzintervall
A( x ) ≤ θ ≤ B( x )
(3-65)
Das Intervall [ A( X ); B ( X )] heißt Konfidenzintervall für θ zum Niveau 1 − α .
Die aus einer Stichprobe geschätzten Parameter Summe und arithmetischer Mittelwert sind
für Stichprobenumfänge > 30 in guter Näherung normalverteilte Zufallsvariablen (Kap.
3.1.4.3 Zentraler Grenzwertsatz). Damit ist die Verteilungsfunktion und die Wahrscheinlichkeitsdichtefunktion dieser Parameter bekannt.
Die allgemein formulierten Gesetzmäßigkeiten der Schätztheorie werden nun für die Schätzung des arithmetischen Mittelwerts und seiner Varianz in endlichen und unendlichen
Grundgesamtheiten näher betrachtet.
31
Kapitel 3
3.1.5.6 Schätzen in endlichen und unendlichen Grundgesamtheiten
Die Summe und der arithmetische Mittelwert sind häufig gesuchte Parameter normalverteilter Grundgesamtheiten. Soll der Mittelwert in einer Untersuchung bestimmt werden, wird der
Erwartungswert E ( X ) oder der „wahre Wert“ µ durch eine Schätzfunktion für den Mittelwert
ˆ = X ( n ) geschätzt. Analog wird die Summe durch die Schätzfunktieiner Grundgesamtheit Θ
ˆ = X ( n ) geschätzt. Die Schätzfunktionen für den arithmetischen Mittelwert und die
on Θ
Σ
Summe einer Grundgesamtheit X ( n ) bzw. X Σ( n ) sind Zufallsvariablen und liefern über die Vorschrift x bzw. xΣ Realisationen für die Schätzwerte Xˆ bzw. X̂ Σ .
Die Varianz gibt Auskunft über die Genauigkeit mit der eine Schätzfunktion den „wahren
Wert“ einer Grundgesamtheit trifft. Die Varianz ist für Grundgesamtheiten im Allgemeinen
ebenfalls nicht bekannt und muss aus der Stichprobe geschätzt werden. Dabei ist sowohl die
Varianz der Zufallsvariablen X als auch die Varianz der Schätzfunktion X (n ) von Interesse.
Grundsätzlich muss zwischen Schätzen in endlichen Grundgesamtheiten und Schätzen in
unendlichen Grundgesamtheiten unterschieden werden.
Schätzen in endlichen Grundgesamtheiten
Ist ς eine endliche Grundgesamtheit mit N Elementen und trägt jedes Element eine Ausprägung z eines Merkmals X, dann ist die Gesamtheit aller Ausprägungen in ς
Ω = {X 1 , X 2 ,..., X N } = {z1 , z 2 ,..., z N }
wobei:
(3-66)
Ω:
Grundgesamtheit
X:
Merkmal in der Grundgesamtheit
z:
Ausprägung des Merkmals X
Die gemeinsame Wahrscheinlichkeitsverteilung bei der Ziehung von n Stichproben aus ς
ohne Zurücklegen ist:
P( X 1 = z i1 ; X 2 = z i 2 ;...; X n = z in ) =
1
N ! n!⋅( N − n )
(3-67)
Für die Schätzung des arithmetischen Mittelwertes und der Varianz in endlichen Grundgesamtheiten gelten folgende Beziehungen:
32
Methodische Grundlagen
Parameter
arithm.
Mittelwert
Varianz
Schätzfunktion/Schätzwert
(
)
X=
1 N
X i = X (N )
∑
N i=1
S2 =
1 N
(X i − X )2
∑
N − 1 i=1
( )
= S (N )
2
= Var( X )
1 2 N −n
=0
⋅S ⋅
N −1
N
= Var (X )
S X2 =
wobei:
X (n ) =
1 n
X i = Xˆ
∑
n i =1
S (n ) =
1 n
X i − X (n )
∑
n − 1 i =1
2
Stichprobenfkt./ Schätzwert
x̂ =
(
)
2
1 n
( x i − x )2 = s 2
∑
n − 1 i =1
= var(x )
ŝ 2 =
= Ŝ 2 = var( X )
(S ( ) )
( )
1
⋅ S (n )
n
= Ŝ X2ˆ = var Xˆ
n
X
2
=
()
2
⋅
N −n
N −1
1 n
∑ xi = x
n i =1
1 2 N −n
= s x2
⋅ ŝ ⋅
N −1
n
= var( x )
ŝ X2ˆ =
X
wahrer Mittelwert der endlichen Grundgesamtheit (auch X ( N ) )
S2
wahre Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit
(
)
(auch S ( N ) )
2
S X2
wahre Varianz des Mittelwertes X in der endlichen Grundgesamtheit
X (n )
Schätzfunktion für den Mittelwert in der endlichen Grundgesamtheit
S (n )
Schätzfunktion für die Varianz der Einzelwerte (Zufallsvariable X) in
der endlichen Grundgesamtheit
2
(S ( ) )
n
X
2
Schätzfunktion für die geschätzte Varianz des geschätzten Mittelwertes
(Zufallsvariable X (n ) ) in der endlichen Grundgesamtheit
Xˆ
Schätzwert für den Mittelwert in der endlichen Grundgesamtheit;
Schätzwert ist Zufallsvariable
x̂
Schätzwert für den Mittelwert in der endlichen Grundgesamtheit;
Schätzwert ist Realisation
Ŝ 2
Schätzwert für die Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit; Schätzwert ist Zufallsvariable
ŝ 2
Schätzwert für die Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit; Schätzwert ist Realisation
Ŝ X2ˆ
Schätzwert für die Varianz des geschätzten Mittelwertes in der endlichen Grundgesamtheit; Schätzwert ist Zufallsvariable
ŝ X2ˆ
Schätzwert für die Varianz des geschätzten Mittelwertes in der endlichen Grundgesamtheit; Schätzwert ist Realisation
33
Kapitel 3
s2
Varianz der Stichprobenergebnisse xi
s X2
Varianz des Stichprobenmittelwertes x
N
Anzahl der Untersuchungseinheiten in der Grundgesamtheit
n
Anzahl der gezogenen Stichprobeneinheiten
Der Term N − n wird als Endlichkeitskorrektur bezeichnet. Die Endlichkeitskorrektur verkleiN −1
nert die Varianz des geschätzten Mittelwertes. Untersucht man alle Einheiten einer Grundgesamtheit, so ergibt sich für die Endlichkeitskorrektur N − n = 0 . Eine Varianz des geschätzN −1
ten Mittelwertes ist dann nicht vorhanden. Oder anders ausgedrückt, es gibt keine Unsicherheit über den geschätzten Mittelwert. Für n<<N strebt die Endlichkeitskorrektur gegen 1 und
kann vernachlässigt werden.
Schätzen in unendlichen Grundgesamtheiten
Ist ς eine unendliche Grundgesamtheit, dann ist die Gesamtheit aller Ausprägungen in ς
Ω=ℜ
wobei:
(3-68)
Ω:
Grundgesamtheit
ℜ:
Reelle Zahlen
Die gemeinsame Wahrscheinlichkeitsverteilung bei der Ziehung von n Stichproben aus ς ist:
P( X ≤ x ) = Fx ( x )
für n=1 bzw.
{X 1 , X 2 ,...X n } ~ i i d
für n>1
(3-69)
Für die Schätzung des arithmetischen Mittelwertes und der Varianz in unendlichen Grundgesamtheiten gelten folgende Beziehungen:
34
Methodische Grundlagen
Parameter
arithm.
Mittelwert
Varianz
Schätzfunktion/Schätzwert
1 n
µ = E ( X ) = lim ⋅ ∑ X i
n →∞ n
i =1
σ 2 = E( X − µ )
2
(
n
1
⋅ ∑ X i − X (n )
n→∞ n − 1
i =1
= lim
1
⋅σ 2 = 0
N
σ µ2 =
X (n ) =
1 n
X i = Xˆ = µ̂
∑
n i=1
S (n ) =
1 n
X i − X (n )
∑
n − 1 i=1
2
)
2
(
x̂ =
)
= Ŝ 2 = σˆ 2 = var( X )
(S ( ) )
n
X
2
( )
1
= ⋅ S (n )
n
2
()
= Ŝ X2ˆ = σˆ X2ˆ = var Xˆ
wobei:
Stichprobenfkt./ Schätzwert
2
1 n
∑ xi = x
n i=1
1 n
(xi − x )2 = s 2
∑
n − 1 i=1
= var(x )
ŝ 2 =
1
ŝ X2ˆ = ⋅ σˆ 2 = s x2
n
= var( x )
µ
wahrer Mittelwert der unendlichen Grundgesamtheit
σ2
wahre Varianz der Einzelwerte Xi in der unendlichen Grundgesamtheit
σ µ2
wahre Varianz des Mittelwertes µ in der unendlichen Grundgesamtheit
X (n )
Schätzfunktion für den Mittelwert in der unendlichen Grundgesamtheit
S (n )
Schätzfunktion für die Varianz der Einzelwerte (Zufallsvariable X) in
der unendlichen Grundgesamtheit
2
(S ( ) )
n
X
2
Schätzfunktion für die geschätzte Varianz des geschätzten Mittelwertes
(Zufallsvariable X (n ) ) in der unendlichen Grundgesamtheit
Xˆ
Schätzwert für den Mittelwert in der unendlichen Grundgesamtheit
(auch µ̂ ); Schätzwert ist Zufallsvariable
x̂
Schätzwert für den Mittelwert in der unendlichen Grundgesamtheit;
Schätzwert ist Realisation
Ŝ 2
Schätzwert für die Varianz der Einzelwerte Xi in der unendlichen
Grundgesamtheit (auch σ̂ 2 ); Schätzwert ist Zufallsvariable
ŝ 2
Schätzwert für die Varianz der Einzelwerte Xi in der unendlichen
Grundgesamtheit; Schätzwert ist Realisation
Ŝ X2ˆ
Schätzwert für Varianz des geschätzten Mittelwertes in der unendlichen
Grundgesamtheit (auch σ̂ X2ˆ ); Schätzwert ist Zufallsvariable
ŝ X2ˆ
Schätzwert für Varianz des geschätzten Mittelwertes in der unendlichen
Grundgesamtheit; Schätzwert ist Realisation
35
Kapitel 3
Die Ergebnisse einer Schätzung werden häufig in Form von Konfidenzintervallen angegeben. Für unendliche Grundgesamtheiten kann von iid-verteilten Zufallsvariablen und bei hinreichend großen Stichprobenumfängen (n > 30) von normalverteilten Schätzparametern ausgegangen werden. Für endliche Grundgesamtheiten gelten die Verteilungsannahmen näherungsweise, wenn N groß und n > 30 aber im Verhältnis zu N klein ist (n<<N). Dabei wird die
Wahrscheinlichkeitsdichte-Funktion der standardisierten Normalverteilung zur Bestimmung
der Intervallgrenzen herangezogen. Die mathematische Beschreibung und die Eigenschaften
der Wahrscheinlichkeitsdichte-Funktion der Normalverteilung sind in Kapitel 3.1.3.2 beschrieben.
Für die Angabe eines Konfidenzintervalls werden die Intervallgrenzen τ U und τ O so bestimmt, dass der gesuchte Parameter µ mit einer bestimmten Wahrscheinlichkeit 1-α überdeckt wird. Die Wahrscheinlichkeit 1-α wird Konfidenzniveau oder Sicherheitsgrad genannt.
α gibt bei einseitigen Konfidenzintervallen (bzw. jeweils α/2 bei zweiseitigen Konfidenzintervallen) die Irrtumswahrscheinlichkeit an.
Zur Berechnung der Intervallgrenzen sind weiterhin sogenannte Konfidenzkoeffizienten bzw.
1-α-Quantile erforderlich. Dabei wird das Quantil u1-α/2 für die Berechnung der zweiseitigen
Intervallgrenzen für die Normalverteilung und das Quantil t1−α
für t-Verteilung verwendet.
2 ; n −1
Jedem beliebigen Sicherheitsgrad 1-α ist ein Koeffizient u1-α/2 bzw. t1−α
2 ; n −1
zugeordnet. Nor-
malverteilte Zufallsvariable mit beliebigem Erwartungswert und beliebiger Varianz lassen
sich durch Standardisierung in Zufallsvariable mit dem Erwartungswert 0 und der Varianz 1
umformen:
X* =
X −µ
σ
(3-70)
(
)
X* ist eine standardnormalverteilte Zufallsvariable. Die N µ ; σ 2 -verteilte Zufallsvariable X
geht über in die N(0;1)-verteilte Zufallsvariable X*.
Multiplikation der Konfidenzkoeffizienten mit der Standardabweichung der geschätzten Parameter und Verschiebung um den Erwartungswert der geschätzten Parameter führt zu den
gesuchten Intervallgrenzen.
36
Methodische Grundlagen
f N {x / µ ;σ 2 }
α/2
1-α
τu
-u1-α/2
µ
0
α/2
τo
+u1-α/2
x
Abbildung 3.13: Darstellung von Konfidenzintervallen
Konfidenzintervalle für µ bei bekanntem σ2
Für die Berechnung von Konfidenzintervallen bei bekanntem σ2 (gilt für n > 30 oder Grundgesamtheit normalverteilt) gilt:
σ
σ ⎫
⎧
P ⎨ Xˆ − u1−α 2 ⋅
≤ µ ≤ Xˆ + u1−α 2 ⋅
⎬ = 1−α
n
n⎭
⎩
(3-71)
Der wahre Wert µ in der Grundgesamtheit wird vom angegebenen Intervall mit der Wahrscheinlichkeit 1-α überdeckt. Der Parameter µ liegt mit einer Wahrscheinlichkeit von
1-α innerhalb der angegebenen Intervallgrenzen.
Konfidenzintervalle für µ bei unbekanntem σ2
Die Varianz der Grundgesamtheit σ2 ist bei Stichprobenuntersuchungen im Allgemeinen nicht
bekannt. Für die Berechnung von Konfidenzintervallen bei unbekanntem σ2 wird bei der Bestimmung von Konfidenzintervallen die Varianz der Stichprobenergebnisse s2 geschätzt:
σˆ 2 = s 2
(3-72)
In diesem Fall müssen zur Berechnung des Konfidenzintervalls die t-Verteilung und die zugehörigen Quantile t1−α
2 ; n −1
herangezogen werden. Das Konfidenzintervall berechnet sich
nach Gleichung 3-73.
s ⎫
s
⎧
≤ µ ≤ Xˆ + t1−α 2;n −1 ⋅
P ⎨ Xˆ − t1−α 2;n −1 ⋅
⎬ = 1 −α
n⎭
n
⎩
(3-73)
Ab einem Stichprobenumfang von n > 30 lässt sich die t-Verteilung durch die Normalverteilung approximieren und es können die Quantile u1-α/2 verwendet werden.
37
Kapitel 3
3.1.6 Modellbildung
Ein real existierender, meist komplexer Sachverhalt (in der vorliegenden Arbeit ein Stoffsystem oder ein Probenahmevorgang) wird durch ein Modell so einfach wie möglich aber so gut
wie nötig abgebildet. Das Modell soll ein unverzerrtes, unverfälschtes und unvoreingenommenes Bild der Wirklichkeit beschreiben. Im Modell werden die benötigten Definitionen, die
Systemgrenzen und bestehende Abhängigkeiten beschrieben. In das Modell fließt das Vorwissen über den Sachverhalt ein. Es ignoriert weder relevante Tatsachen noch werden Folgerungen aus dem Modell zugelassen, die nicht durch Tatsachenwissen abgedeckt sind.
Das Modell muss für eine klare mathematische Beschreibung einfach genug sein. Ob ein
Modell wahr ist kann meist nicht abschließend beurteilt werden. Daher ist es besser die Frage zu beantworten, ob ein Modell brauchbar und plausibel ist. Ein Modell ist nicht brauchbar,
wenn mit dem verfügbaren mathematischen Apparat und den gegebenen Beobachtungen in
der vorhandenen Zeit keine verwendbaren Resultate erzielt werden können.
3.2 Grundlagen der Probenahme
3.2.1 Einführung
Die grundlegende Aufgabe von Probenahme ist es, eine Ausgangsmenge (statistischer Begriff: Grundgesamtheit), die in ihrer Gesamtheit aus ökonomischen und/oder technischen
Gründen nicht vollständig untersucht werden kann, so zu reduzieren, dass aus der gewonnenen Teilmenge (statistischer Begriff: Stichprobe) zuverlässige Aussagen über die Ausgangsmenge gewonnen werden können.
Allgemein formuliert, stellt die Stichprobe einen Ausschnitt aus der Wirklichkeit dar und erlaubt einen Blick auf die Gesamtheit. Die Probenahme ist ein (Auswahl-)Prozess, der aus
einer Grundgesamtheit eine bestimmte Teilmenge (Anzahl an Elementareinheiten, eine
Masse, ein Volumen) nach einer festgelegten Auswahlvorschrift entnimmt. Für Stoffsysteme
muss der Auswahl immer ein Teilungsprozess vorweggehen. Für die ausgewählte Teilmenge
wird das interessierende Merkmal (Untersuchungsmerkmal) untersucht.
Der Probenahmevorgang ist abhängig von der Zielstellung der Untersuchung und der Beschaffenheit oder Struktur der Grundgesamtheit. Die Beschaffenheit oder auch die Struktur
einer Grundgesamtheit wird für Stoffsysteme mit den Begriffen Heterogenität oder Homogenität beschrieben. Auf den Begriff der Heterogenität wird in Kapitel 3.3.1 näher eingegangen.
Beschaffenheit oder Struktur einer Grundgesamtheit, für Stoffsysteme die Heterogenität, ist
38
Methodische Grundlagen
damit zugleich eine wesentliche und unvermeidbare Ursache für die Entstehung von Stichprobenfehler.
Um den Prozess der Probenahme in seiner Komplexität beschreiben zu können, muss auf
die Entwicklung von Modellen zurückgegriffen werden. Dabei soll das Modell die Realität so
gut wie möglich abbilden. Bei Untersuchungen auf Stichprobenbasis sind folgende Aufgaben
zu bewältigen.
Übersetzung der Realität in ein Modell
Auswertung der Daten innerhalb des Modells
Rückübersetzung der Modellergebnisse in die Realität
Es müssen sowohl für die Probenahme als auch für die Hochrechnung oder auch die Schätzung Modellannahmen getroffen werden. Zunächst wird ausführlich auf das Modell der Probenahme eingegangen. Die Rückübersetzung der Modellergebnisse d. h. die Hochrechnung
der Stichprobenergebnisse auf die Grundgesamtheit oder auch die Schätzung der „wahren“
Parameter in der Grundgesamtheit hängen eng mit dem ausgewählten Probenahmeverfahren zusammen. Das Modell der Hochrechnung wird in Kapitel 3.2.3 behandelt.
Um den gesamten Probenahmevorgang modellieren zu können, muss sowohl die Struktur
und Beschaffenheit der Grundgesamtheit als auch der Auswahlvorgang beschrieben werden.
Im allgemeingültigen Fall wird davon ausgegangen, dass zwischen den Elementareinheiten
einer Grundgesamtheit ein Zusammenhang oder auch eine Ordnung besteht. Das bedeutet,
die Elementareinheiten untereinander sind abhängig oder auch korreliert und ihre räumliche
und/oder temporäre Lage ist von Bedeutung. Für Stoffsysteme – und dazu gehören heterogene Abfälle und Abfallgemische - trifft dies im Allgemeinen zu.
Liegen für die Stichprobenahme bereits klar abgegrenzte Untersuchungseinheiten vor, wie
z. B. Gemeinden, Haushalte, Glühbirnen einer Produktionsserie, Müllbehälter u. ä. und sind
die Untersuchungseinheiten bezüglich ihres Untersuchungsmerkmals nicht korreliert, kann
die Betrachtung einer Grundgesamtheit höherer Ordnung entfallen. Das Modell kann entsprechend vereinfacht werden. Es muss nur der Auswahlvorgang betrachtet werden.
Weiterhin gilt es zu entscheiden, ob das Modell besser mit diskreten oder stetigen Merkmalen beschrieben werden kann. Im Stichprobenmodell sind diese Merkmale diskrete oder stetige Zufallsvariablen. Besteht die Grundgesamtheit aus einer endlichen Anzahl N von Elementareinheiten U i und sind diese Einheiten untereinander nicht korreliert, kann das diskrete Modell angenommen werden. Strebt die Anzahl der Elementareinheiten U i gegen Unendlich oder liegt eine Ordnung der Elementareinheiten vor, d. h. die Lage der Elementareinhei-
39
Kapitel 3
ten U i in Raum und Zeit ist zu beachten, ist zur Beschreibung der Probenahme möglicherweise ein stetiges Modell vorzuziehen. Raum und Zeit sind stetige Größen und die Elementareinheiten einer korrelierten Grundgesamtheit können über stetige Funktionen (zur Beschreibung der Autokorrelation) in Zusammenhang gebracht werden. Ein stetiges Modell
eignet sich oft besser zur mathematischen Beschreibung eines Sachverhaltes. Diskrete Verteilungsfunktionen können durch stetige approximiert werden.
3.2.1.1 Abgrenzung des Probenahmebegriffes
Übergeordnet betrachtet ist Probenahme ein Teilprozess innerhalb einer Untersuchung oder
auch einer Datenerhebung. Ziel des gesamten Prozesses der Datenerhebung ist es, Informationen über einen realen Sachverhalt zu gewinnen. Zur vollständigen Beschreibung eines
Probenahmeverfahrens muss die gesamte Untersuchung (Probenahme, Aufbereitung der
gewonnenen Probe, Analyse der Probe, Auswertung der Analysenergebnisse und Rückschluss der Stichprobenergebnisse auf die Grundgesamtheit) betrachtet werden. Die
wesentlichen Schritte einer Datenerhebung sind Abbildung 3.14 zu entnehmen.
Stichprobenuntersuchung
1. Festlegung des Untersuchungsziels
2. Abgrenzung der Grundgesamtheit
3. Festlegung der zu erhebenden Merkmale
4. Festlegung der notwendigen Genauigkeit
(vereinbar mit Untersuchungsziel)
5. Festlegung der Messmethoden und
Analyseverfahren
6. Erstellung einer Auswahlgrundlage
7. Festlegung des Auswahlverfahrens
8. Praktische Durchführung der Probenahme
9. Auswertung der Stichprobendaten
10. Rückschluß (Hochrechnung) auf
die Grundgesamtheit
Abbildung 3.14: Schema einer Stichprobenuntersuchung
40
Methodische Grundlagen
Unter Probenahme versteht man die Entnahme einer oder mehrerer Teilproben aus einer
Grundgesamtheit. Die Probenahme umfasst alle Auswahl- und Aufbereitungsschritte von der
Entnahme einer „Primärstichprobe“ (= erster Zugriff auf die Grundgesamtheit) bis zur Übergabe einer Probenmenge für die Analyse. Aus der Analysenprobe wird das Untersuchungsmerkmal bestimmt. Die Analysenprobe darf keinen weiteren Teilungs- und Auswahlschritten
mehr unterliegen. Alle erforderlichen Aufbereitungsschritte bis zur Analysenprobe, wie z. B.
Mischen, Trennen (Klassieren, Sortieren), Zerkleinern und Agglomerieren gehören zur Probenahme. Aufbereitungsschritte, die mit der Probemenge zur Analyse durchgeführt werden,
gehören zur Analyse. In Abbildung 3.15 ist die Abgrenzung des Probenahmevorganges
schematisch dargestellt.
Grundgesamtheit
.....
1. Auswahlstufe
Probenahme
Primärprobe
1. Aufbereitungsstufe
.....
Sekundärprobe
2. Auswahlstufe
2. Aufbereitungsstufe
.
.
.
.
.
.
.....
Analyse
Analyseprobe
Q. Auswahlstufe
Q. Aufbereitungsstufe
Analyse der Probe
Abbildung 3.15: Abgrenzung des Probenahmevorganges
3.2.1.2 Probenahmeplan und Probenahmekriterien
Nachdem die Probenahme im Kontext einer Untersuchung eingeordnet und der Probenahmevorgang klar abgegrenzt wurde, wird nun auf die Probenahme selbst näher eingegangen.
Der erste Schritt einer Probenahme besteht in der Entwicklung und Festlegung des Probenahmeplans. Der Probenahmeplan wird aus den Untersuchungszielen und den verfügbaren
41
Kapitel 3
Vorinformationen entwickelt. Es werden die grundlegenden Kriterien für eine repräsentative,
zuverlässige und wirtschaftliche Probenahme beachtet und eingehalten. Abbildung 3.16 ist
die Stellung der Probenahmeplanung im Untersuchungsablauf zu entnehmen [22].
1. Untersuchungsziele
definieren
2. Verfügbare Vorinformationen
zusammenstellen
3. Probenahmeplan festlegen
(Probenahmekriterien)
4. Probenahme
5. Analyse
6. Auswertung und Hochrechnung;
Prüfung ob Untersuchungsziele
erreicht wurden
Abbildung 3.16: Probenahmeplanung im Untersuchungsablauf
Zur Aufstellung des Probenahmeplans müssen folgende Fragstellungen beantwortet und
Kriterien beachtet werden:
1. Kann mit der geplanten Probenahme das angestrebte Wissen gewonnen werden?
Repräsentativität: Liefert die Probenahme ein gutes Abbild der Grundgesamtheit oder ist
mit Verzerrungen oder Über- bzw. Unterschätzungen zu rechnen?
Suffizienz: Wird die verfügbare Vorinformation ausgeschöpft? D. h. werden alle Parameter erfasst? Ist die Probengröße ausreichend für die Schätzung von Mittelwert und Varianz? Lassen sich Aussagen über räumliche und zeitliche Schwankungen treffen?
Indikativität: Erlauben Probenahme und Analyse den Nachweis signifikanter Grenzwertüberschreitungen? Sind die Summenparameter indikativ?
2. Sind die Ergebnisse vertrauenswürdig?
Reliabilität: Werden Probenahme-, Aufbereitungs- und Analysefehler quantifiziert? Können Störeinflüsse bei der Entnahme, dem Transport und der Lagerung der Proben ausgeschlossen werden?
42
Methodische Grundlagen
Validität: Ist die Anzahl der erhobenen Parameter ausreichend? Wurden alle relevanten
Störvariablen erfasst?
3. Kann das angestrebte Wissen mit geringerem Aufwand gewonnen werden?
Ökonomie: Kann eine Vollerhebung durch eine Teilerhebung ersetzt werden? Ist die gewählte Probenahmemethode (zufällig, geschichtet systematisch) die effizienteste? Wird
nur der notwendige Stichprobenumfang erhoben?
Um die Probenahmekriterien nicht nur qualitativ beschreiben zu können, sondern sie auch
quantitativ nachprüfbar zu machen, wird nachfolgend auf die Fehler einer Stichprobenuntersuchung näher eingegangen. Dabei muss zwischen systematischen und zufälligen Fehlern
unerschieden werden. Systematische Fehler sind im Allgemeinen schwer zu quantifizieren,
da sie oftmals nicht erkannt werden. Hier muss im Vorfeld der Probenahme alles unternommen werden um systematische Fehler zu vermeiden.
Der zufällige Stichprobenfehler oder auch der fundamentale Fehler einer Stichprobenuntersuchung hingegen ist nicht zu vermeiden, kann aber quantifiziert werden (vergl. Kapitel
3.1.5.3 Wirksamkeit und Effizienz von Schätzfunktionen). Über die Fehlerbetrachtung lassen
sich die Probenahmekriterien nachprüfen. Mit dem Probenahmeplan wird die Grundlage für
die erfolgreiche Durchführung einer Probenahme geschaffen.
3.2.1.3 Fehler einer Stichprobenuntersuchung
Mathematisch kann der gesamte Fehler einer Stichprobenuntersuchung als Abweichung von
wahrem Wert und Schätzwert über das varianzanalytische Modell ausgedrückt werden.
µˆ = µ + ε U
(3-74)
Für den Fehler einer Stichprobenuntersuchung, der sich aus dem Probenahmefehler und
dem Analysefehler zusammensetzt gilt dann:
ε U = ε S total + ε A
wobei:
εU :
(3-75)
ε S total :
gesamter Fehler der Stichprobenuntersuchung (Probenahmefehler und
Analysefehler)
gesamter Probenahmefehler
εA:
Analysefehler
Für mehrstufige Auswahlverfahren berechnet sich der gesamte Fehler der Stichprobenuntersuchung zu:
εU = ∑ ε S total ,i + ε A
(3-76)
i
43
Kapitel 3
Wird zwischen dem systematischen Fehler, der durch praktische Ausführung der Probenahme und die Aufbereitungsschritte verursacht wird, und dem zufälligen Fehler, der durch den
Auswahlschritt verursacht wird, unterschieden, gilt für den Fehler der gesamten Stichprobenuntersuchung:
ε U = ∑ (ε s ,i + ε m ,i ) + ε A
(3-77)
i
wobei:
εs :
εm :
zufälliger Stichprobenfehler
systematischer Fehler, der auf die praktische Ausführung der Probenahme und Aufbereitung zurückzuführen ist
Der systematische Fehler kann nach Gleichung 3-58 als die Abweichung des „wahren Wertes“ vom Erwartungswert berechnet werden.
ε m = µ − E (µˆ )
(3-78)
Da der „wahre Wert“ µ in den meisten Fällen unbekannt ist, kann auch der systematische
Fehler nicht bestimmt werden. Die Beziehung eignet sich zur Validierung eines Probenahmeverfahrens mit bekannten Parametern der Grundgesamtheit. Der zufällige Fehler wird für
normalverteilte Zufallsvariable nach Gleichung (3-60) über die Varianz des Schätzwertes
var (µ̂ ) bestimmt. Die Varianz ist ein Maß für den zufälligen Stichprobenfehler.
ε s = var (µˆ ) = σ µˆ
(3-79)
Die Standardabweichung des Schätzwertes wird als der Standardfehler der Stichprobe bezeichnet. Wird die Standardabweichung des Schätzwertes auf den Erwartungswert bezogen
erhält man den relativen Standardfehler. Der relative Standardfehler wird auch als Variationskoeffizient des Schätzwertes Varkoeff (µ̂ ) bezeichnet.
ε s ,rel = var koeff (µˆ ) =
σ µˆ
E (µˆ )
(3-80)
Auf die Fehlerbetrachtung der Stichprobenahme, insbesondere auf die Betrachtung des systematischen Fehlers, verursacht durch die praktische Ausführung der Probenahme und Aufbereitung wird ausführlicher in Kapitel 4.1.3 eingegangen.
Aufbauend auf der allgemeinen Erörterung des Probenahmefehlers und der Quantifizierung
des systematischen und zufälligen Anteils wird nun der in der Stichprobenahme häufig verwendete aber selten anhand nachprüfbarer Kriterien definierte Begriff der Repräsentativität
eingeführt.
44
Methodische Grundlagen
Repräsentativität
Eine Stichprobe ist dann repräsentativ, wenn sie reproduzierbar und genau ist. Ob ein Stichprobenverfahren repräsentativ ist lässt sich quantitativ über die Berechnung des mittleren
quadratischen Fehlers (MSE) prüfen. In Kapitel 3.1.5.3 wurde als geeignetes Prüfkriterium für
die Güte einer Stichprobe der MSE eingeführt. Kann der Erwartungswert der mittleren quadratischen Abweichung minimiert werden oder anders ausgedrückt, bleibt der mittlere quadratische Fehler unterhalb einer vorgegebenen zulässigen Schranke, kann die Stichprobe als
repräsentativ angesehen werden.
Zunächst wird dazu der MSE (µ̂ ) in den systematischen und den zufälligen Fehleranteil
zerlegt.
2
MSE (µˆ ) = E (µˆ − µ )
2
= E[(µˆ − E (µˆ )) + (E (µˆ ) − µ )]
(3-81)
= E (µˆ − E (µˆ )) + 2 ⋅ (E (µˆ ) − µ ) ⋅ E (µˆ − E (µˆ )) + (E (µˆ ) − µ )
2
da E (µˆ − E (µˆ )) = 0
2
folgt
2
2
MSE (µˆ ) = E (µˆ − E (µˆ )) + (E (µˆ ) − µ )
(3-82)
Nach Gleichung 3-11 und 3-58 lässt sich schreiben:
2
MSE (µˆ ) = var (µˆ ) + (bias )
(3-83)
Werden als tolerierbare Grenzen für die Varianz und die Verzerrung folgende Kriterien eingeführt,
S 02 (ε ) :
obere zulässige Grenze für die Varianz var (µ̂ )
b02 (ε ) :
obere zulässige Grenze für die Verzerrung (bias )
2
wird die Stichprobe als repräsentativ bezeichnet, wenn gilt:
var (µˆ ) < S02 (ε ) und (bias ) < b02 (ε )
2
(3-84)
Die Probenahme aus realen Grundgesamtheiten ist immer ein fehlererzeugender Prozess.
Mit den Informationen, die aus einer Stichprobe gewonnen werden (Analysenergebnisse),
kann keine exakte Beschreibung der Eigenschaften einer realen Grundgesamtheit vorgenommen werden. Dies ist auf die Struktur oder auch Beschaffenheit realer Grundgesamtheiten zurückzuführen.
45
Kapitel 3
Für die Praxis der repräsentativen Stichprobenahme bedeutet dies:
Für Stoffsysteme darf die mittlere Teilchenverteilung, bestimmt durch ihre physikalischen
Eigenschaften wie z. B. die Größe, die Form, die Oberfläche und die Dichte der Teilchen,
durch den Probenahmevorgang nicht bzw. so wenig wie möglich verändert werden.
Eine weitere wichtige Größe einer Stichprobenahme ist der notwendige Stichprobenumfang.
Der notwendige Stichprobenumfang kann nur bestimmt werden, wenn der Stichprobenfehler
aus Voruntersuchungen quantifizierbar ist oder abgeschätzt werden kann. Nur ein ausreichender Stichprobenumfang garantiert, dass das gewünschte Wissen erreicht wird, die Ergebnisse zuverlässig sind und die Stichprobe wirtschaftlich ist.
Notwendiger Stichprobenumfang
Ziel einer Stichprobenuntersuchung ist es, die Parameter der Grundgesamtheit ausreichend
genau zu schätzen. Eine übergenaue Schätzung verursacht unnötige Kosten, da die Anzahl
an Stichprobeneinheiten in der Regel maßgeblich die Kosten einer Stichprobenuntersuchung
bestimmt. Hingegen führt eine zu ungenaue Schätzung dazu, dass das Ergebnis für einen
vorgesehenen Zweck (Entscheidungsgrundlage) nicht wie geplant herangezogen werden
kann oder gar unbrauchbar wird.
Es handelt sich letztlich bei der Festlegung des notwendigen oder auch optimalen Stichprobenumfangs um eine Optimierungsaufgabe. Bei der Ermittlung des optimalen Stichprobenumfangs einer Untersuchung muss zuerst die Genauigkeitsanforderung an die zu erzielenden Ergebnisse festgelegt werden.
Genauigkeitsanforderung
Die Genauigkeitsanforderung wird entsprechend der geforderten Untersuchungsqualität vor
der Untersuchung festgelegt. Die Genauigkeitsanforderung an ein Messergebnis besagt
nichts anderes, als dass der aus den Stichprobenergebnissen ermittelte Parameter (auch
Schätzparameter) um höchstens den Betrag ε0 mit der Vertrauenswahrscheinlichkeit 1-α vom
wahren Wert der Grundgesamtheit abweichen darf. Wird als Parameter der arithmetische
Mittelwert betrachtet, ergibt sich:
Xˆ − µ ≤ ε 0 u1−α 2
wobei:
ε0 :
(3-85)
absolute Genauigkeitsanforderung an ein Messergebnis
Unter der Annahme, dass die Schätzfunktion erwartungstreu ist und damit der bias entfällt,
kann die Genauigkeit über die Varianz des geschätzten Mittels ausgedrückt werden. Werden
die Beziehungen in Gleichung 3-81 eingesetzt, so ergibt sich:
46
Methodische Grundlagen
)
(
2
E Xˆ − µ = var Xˆ
(3-86)
2
var Xˆ ≤ (ε 0 u1 −α 2 )
(ˆ )
Wird nun in Gleichung 3-86 anstelle der Varianz des arithmetischen Mittelwerts var X die
Varianz der Einzelwerte var ( xi ) eingesetzt und die Gleichung nach n0 umgeformt, lässt sich
die Mindestprobenanzahl berechnen.
⎛ var ( xi ) ⋅ u 1−α 2 ⎞
⎟
n0 ≥ ⎜
⎜
⎟
ε
0
⎝
⎠
2
n0 : Mindestprobenanzahl
(3-87)
Zur Ermittlung des erforderlichen Stichprobenumfanges muss also die Varianz der Einzelwerte bekannt und die zulässige Abweichung des Mittelwertes vom wahren Wert festgelegt
werden. Die zulässige Abweichung kann auch als relative Genauigkeitsanforderung formuliert werden. ε0 wird dann als prozentuale Abweichung ε0,rel festgelegt. Die Varianz der Einzelwerte
wird
durch die relative Größe, den Variationskoeffizienten ersetzt. Die
Mindestprobenanzahl berechnet sich dann zu:
⎛ varkoeff ( xi ) ⋅ u 1−α 2 ⎞
⎟
n0 ≥ ⎜⎜
⎟
ε
0 ,rel
⎝
⎠
wobei:
ε 0 ,rel :
2
(3-88)
relative Genauigkeitsanforderung an ein Messergebnis
Bei der Festlegung des notwendigen Stichprobenumfangs ist das interessierende Merkmal
meist unbekannt. Das interessierende Merkmal muss entweder in einer Voruntersuchung
ermittelt oder nach unten abgeschätzt werden. Bei einer Abschätzung nach unten dürfen für
Θ nur Werte eingesetzt werden, die nicht größer als die zu erwartenden Werte des Parameters Θ sind.
Die Ermittlung des notwendigen Stichprobenumfangs hängt vom eingesetzten Stichprobenverfahren ab. Die Ermittlung des Stichprobenumfangs wurde aus Gründen des einfacheren
Verständnisses für die einfache Zufallsauswahl eingeführt. Die weitergehenden Stichprobenverfahren führen im Allgemeinen zu einer Varianzreduktion, d. h. die Ermittlung des Stichprobenumfangs bei der einfachen Zufallsauswahl kann als obere Schranke oder maximal
notwendiger Stichprobenumfang angesehen werden.
47
Kapitel 3
3.2.2 Stichprobenverfahren
Die Stichprobenverfahren oder auch Auswahlverfahren können generell in zufällige Auswahlverfahren und nichtzufällige Auswahlverfahren eingeteilt werden. Zufällige Auswahlverfahren sind dadurch gekennzeichnet, dass alle Elementareinheiten einer Grundgesamtheit
eine angebbare und – in endlichen Grundgesamtheiten - von Null verschiedene Wahrscheinlichkeit besitzen, ausgewählt zu werden. Für nichtzufällige Auswahlverfahren trifft dies nicht
zu.
In den folgenden Kapiteln werden die Stichprobenverfahren für endliche Grundgesamtheiten
beschrieben. Die Stichprobenverfahren lassen sich damit auch für Merkmale aus unendlichen Grundgesamtheiten (das weniger anspruchsvolle Modell) anwenden.
3.2.2.1 Nichtzufällige Auswahlverfahren
Zu den nichtzufälligen Auswahlverfahren zählen die bewussten Auswahlverfahren wie z. B.
die Auswahl „typischer“ Fälle, die Auswahl nach dem Konzentrationsprinzip und die Quotenauswahl [25]. Sie werden vorwiegend in der Markt- und Meinungsforschung eingesetzt und
dort auch Beurteilungsstichproben genannt. Über Kenntnisse zur Struktur der Grundgesamtheit wird versucht eine repräsentative Auswahl zu treffen. Die Vorteile liegen in der einfacheren Planung und der kostengünstigeren Umsetzung.
Für nichtzufällige Auswahlverfahren existiert keine mathematisch/statistische Grundlage zur
Berechnung von Stichprobenfehlern und Schätzwerten. Die Quantifizierung des unvermeidbaren oder auch fundamentalen Stichprobenfehlers ist aber gerade eine wichtige Voraussetzung für die Entwicklung eines Probenahmeplans mit nachprüfbaren Probenahmekriterien.
Sie ist nur für zufällige Auswahlverfahren auf Grundlage der Wahrscheinlichkeitstheorie
(starkes Gesetz der großen Zahlen; Kap. 3.1.4.2) möglich. Nichtzufällige Auswahlverfahren
eignen sich daher nicht für die Probenahme von Stoffsystemen und werden hier nicht weiter
behandelt.
3.2.2.2 Zufällige Auswahlverfahren
Allgemein wird die zufällige Auswahl durch ein Auswahlmodell beschrieben, in dem aus einer
Grundgesamtheit UG bestehend aus N Elementareinheiten Ui nach dem Zufallsprinzip eine
Teilmenge (Stichprobe) uS, bestehend aus n Elementareinheiten ui ausgewählt wird. Alle
Elementareinheiten Ui besitzen eine angebbare und - in endlichen Grundgesamtheiten - von
Null verschiedene Auswahlwahrscheinlichkeit π . Die zufällige Auswahl ist nicht korrekt,
wenn eine der Bedingungen nicht zutrifft.
48
Methodische Grundlagen
Die Menge N aller Elementareinheiten Ui der Grundgesamtheit UG ergeben die Grundgesamtheit.
N
UG = UUi
i =1
(3-89)
Die Menge n aller Elementareinheiten ui der Stichprobe uS ergeben die Stichprobe.
n
u S = U ui
i =1
(3-90)
Die Menge der N Elementareinheiten wird als Umfang der Grundgesamtheit, die Menge der
n Elementareinheiten als Umfang der Stichprobe bezeichnet.
Die zufällige Auswahl von Stichprobeneinheiten kann mit Hilfe einer Zufallszahlentabelle
oder einer Urne mit nummerierten Kugeln (Urnenmodell) durchgeführt werden. Dabei kann
die Auswahl mit und ohne Zurücklegen erfolgen. Die zufällige Auswahl ohne Zurücklegen ist
meist mehr von Interesse, da Informationen über eine Stichprobeneinheit in der Praxis nur
einmal von Interesse sind.
Zufallsstichproben besitzen weiterhin mindestens folgende Eigenschaften:
1. Aus einer Grundgesamtheit kann durch wiederholte Anwendung (mit Zurücklegen) von
Auswahlverfahren eine wohldefinierte Menge verschiedener Stichproben bestehen aus
den Stichprobenelementen u S1 , u S 2 , u S3 , ... , u S n gewonnen werden. Die Anzahl der möglichen Stichproben bei unterscheidbaren Elementen und ohne Berücksichtigung der
Reihenfolge berechnet sich nach Gleichung 3-91:
⎛N⎞
N!
⎜⎜ ⎟⎟ =
= N Cn
⎝ n ⎠ n!( N − n )!
(3-91)
Weiterhin muss genau feststehen, welche Elemente Ui einer Grundgesamtheit zu ui gehören.
2. Jedes mögliche Stichprobenelement u Si hat eine zugehörige Auswahlwahrscheinlichkeit
πi, die bekannt sein muss.
3. Ein oder mehrere mögliche Stichprobenelemente u Si werden mit den ihnen entsprechenden Wahrscheinlichkeiten πi ausgewählt. Die tatsächlich ausgewählten Stichproben
werden durch Zufallszahlen bestimmt.
4. Es ist anzugeben, wie der gesuchte Schätzwert aus der Stichprobe berechnet wird. Jeder
speziellen Stichprobe kann nur ein einziger Schätzwert zugeordnet werden, z. B der
arithmetische Mittelwert.
49
Kapitel 3
Zufallstichproben können grundsätzlich nach einem einfachen oder reinen Auswahlverfahren
oder einem systematischen Auswahlverfahren gewonnen werden. Wird die Grundgesamtheit
vor der Auswahl in mehrere Teilgesamtheiten, sogenannte Schichten, unterteilt, spricht man
von einer geschichteten Auswahl. Die Auswahl innerhalb der Schichten kann wiederum rein
oder systematisch sein.
Werden die Elemente einer Grundgesamtheit in einer Modellannahme entlang einer Geraden aufgereiht, können vier grundlegende Zufallsauswahlverfahren unterschieden werden.
Anschaulich ist dies in Abbildung 3.17 graphisch dargestellt.
= reine Zufallsauswahl
= geschichtete Zufallsauswahl
Schicht i=1
Schicht i=L
= systematische Zufallsauswahl
1k
2k
.........
6k
= systematisch geschichtete Zufallsauswahl
Schicht i=1
Abbildung 3.17: Vergleich der Zufallsauswahlverfahren
50
Schicht i=L
Methodische Grundlagen
3.2.2.3 Die grundlegenden einstufigen zufälligen Auswahlverfahren
Die einfache oder reine Zufallsauswahl
Eine reine, einfache oder uneingeschränkte Zufallsauswahl ist der einfachste Fall der zufälligen Auswahlverfahren. Sie liegt dann vor, wenn aus einer Gesamtheit von N Einheiten eine
Anzahl von n Einheiten zufällig entnommen werden. Für alle gleich großen Teilmengen einer
Grundgesamtheit ist die Wahrscheinlichkeit, dass ihre Elemente in die Auswahl gelangen,
gleich groß und nur abhängig von n, dem Umfang der Teilmenge.
Werden die Ui Elemente der Grundgesamtheit von i = 1 bis N durchnumeriert und werden n
Zufallszahlen aus 1 bis N gezogen, wird eine reine Zufallsauswahl durchgeführt. Bei der reinen Zufallsauswahl werden die n Stichprobeneinheiten praktisch einzeln, also Einheit für
Einheit aus den N Einheiten der Grundgesamtheit ausgewählt. Alle
N
Cn möglichen Stichpro-
ben besitzen die gleiche Auswahlwahrscheinlichkeit πi = π. Das Verhältnis aus Anzahl der
Stichprobeneinheiten n und Anzahl der Einheiten in der Grundgesamtheit N ist der Auswahlsatz der Stichprobe und wird mit f bezeichnet.
Die reine Zufallsstichprobe wird beschrieben durch:
Xi:
interessierendes Merkmal der i-ten Auswahleinheit in der Grundgesamtheit
N:
Umfang der Grundgesamtheit
n:
Umfang der Stichprobe
πi:
Auswahlwahrscheinlichkeit für die i-te Auswahleinheit π i =
f:
Auswahlsatz
f =
1
N
n
N
Die systematische Zufallsauswahl
Die systematische Zufallsauswahl kann nur unter der Voraussetzung angewandt werden,
dass sich die Grundgesamtheit anordnen lässt. Bei der systematischen Zufallsauswahl wird
die Grundgesamtheit in gleich große Intervalle oder Teilgesamtheiten „gleicher Länge“ aufgeteilt. Die erste Stichprobeneinheit wird zufällig aus dem ersten vorgegebenen Intervall k
[N 1 , N 2 , ... , N k ] ∩ [N 1 , N 2 , ... , N ] der N Elemente der Grundgesamtheit gezogen. Jede weitere Stichprobeneinheit ist durch den Abstand k festgelegt. Bei der systematischen Zufallsauswahl wird also ausgehend von einem ersten zufällig festgelegten Element Ui* jedes
Element mit Abstand k gezogen.
51
Herunterladen