Bertram Zwisele Entwicklung einer neuen Probenahmemethode für heterogene Abfälle geringer Schüttdichte RHOMBOS-VERLAG Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutzgesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürfen. Eine Haftung für die Richtigkeit der veröffentlichten Informationen kann trotz sorgfältiger Prüfung vom Verlag nicht übernommen werden. Forschung Politik RHOMBOS VERLAG Das Werk ist in allen seinen Teilen urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeisung und Verarbeitung in elektronischen Systemen. Umschlag: RHOMBOS-VERLAG, Berlin VK-Nr. 65 859 www.rhombos.de [email protected] RHOMBOS-VERLAG, Kurfürstenstr. 17, 10785 Berlin Druck: dbusiness GmbH, Berlin, Eberswalde ISBN 3-937231-42-0 Entwicklung einer neuen Probenahmemethode für heterogene Abfälle geringer Schüttdichte vorgelegt von Diplom-Ingenieur Bertram Zwisele aus Berlin Von der Fakultät III - Prozesswissenschaften der Technischen Universität Berlin zur Erlangung des akademischen Grades Doktor der Ingenieurwissenschaften - Dr.-Ing. - genehmigte Dissertation Promotionsausschuss: Vorsitzender: Prof. Dr. rer. nat. W. Rotard Berichter: Prof. Dr.-Ing. H. Kuyumcu Berichter: Prof. Dr.-Ing. T. Pretz Tag der wissenschaftlichen Aussprache: 29. Juli 2004 Berlin 2004 D 83 Teilergebnisse dieser Arbeit wurden bereits veröffentlicht: Kuyumcu, H. Z.; Zwisele, B.: Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte; 7. Tagung des Arbeitskreises „Probenahme“; Tagungsbeiträge; Freiberg; 2001. Kuyumcu, H. Z.; Zwisele, B.; Ochsenreiter, C.: Entwicklung eines Probenahmeverfahrens für die Beurteilung von Ersatzbrennstoffen; Ersatzbrennstoffe 2; TK-Verlag; Neurupin; 2002. Kuyumcu, H. Z. ; Zwisele, B.: Development of a Novel Sampling Method for Heterogeneous Low-Density Materials; IXth International Mineral Processing Symposium Extended Abstracts; Cappadocia, Turkey; 2002. Kuyumcu, H. Z.; Zwisele, B.: Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte; Postervortrag auf der Tagung Aufbereitung und Recycling; Freiberg; 2002. Vorwort Die vorliegende Arbeit entstand während meiner wissenschaftlichen Tätigkeit am Lehrstuhl für Aufbereitung von Roh- und Reststoffen der Technischen Universität Berlin. Sie basiert auf den Arbeiten und Ergebnissen des Forschungsvorhabens „Entwicklung eines neuen Probenahmeverfahrens für heterogene Abfälle geringer Schüttdichte“, das von der Deutschen Forschungsgemeinschaft finanziell unterstützt wurde. Als ich auf der Fachtagung Probenahme in Freiberg von der Idee der Abfallkomprimierung zur Verbesserung der Probenahme zum ersten Mal gehört habe, konnte ich mir wirklich nicht vorstellen, dass ich mich mit diesem Thema über drei Jahre hinweg so intensiv beschäftigen würde. Ich betrachtete die etwas unkonventionelle Herangehensweise von Prof. Kuyumcu zunächst eher kritisch. Dennoch ließ ich mich auf die Bearbeitung dieses Themas ein und habe daraus gelernt, dass unkonventionelle Denkansätze in der Wissenschaft ein wichtiges Element des Weiterkommens sind. Mein herzlicher Dank gilt Herrn Prof. Kuyumcu, der mir bei meinem Promotionsvorhaben den nötigen Spielraum ließ und mich in kritischen Phasen mit wertvollen Hinweisen unterstützte. Weiterhin möchte ich mich bei Renata Skorupski, Alexander Baath und Danny Schanze, den studentischen Mitarbeitern im Forschungsprojekt für ihre tatkräftige Unterstützung danken. Auch allen anderen beteiligten Mitarbeitern des Instituts danke ich für die mir gewährte Unterstützung. Ganz besonders möchte ich mich bei meiner Frau, Dipl.-Ing. Barbara Müter-Zwisele für ihre Unterstützung und große Geduld, die ich während der Promotion erhalten habe, bedanken. Zuletzt möchte ich meinen Kindern Marc-Steffen, Fenja und Gunnar ein ganz herzliches Dankeschön für ihre Geduld mit einem manchmal gestressten Papa aussprechen. Inhaltsverzeichnis 1 Einleitung ...................................................................................................................... 1 2 Aufgabenstellung ......................................................................................................... 4 2.1 Untersuchungsgesamtheit ................................................................................................. 4 2.2 Untersuchungsziel ............................................................................................................. 6 2.3 Aufgaben ........................................................................................................................... 7 3 Methodische Grundlagen ............................................................................................. 8 3.1 Statistische Grundlagen..................................................................................................... 8 3.1.1 Der Wahrscheinlichkeitsbegriff ................................................................................... 8 3.1.2 Zufallsereignis ............................................................................................................ 11 3.1.3 Zufallsvariable............................................................................................................ 11 3.1.3.1 Diskrete Zufallsvariable........................................................................................... 12 3.1.3.2 Stetige Zufallsvariable ............................................................................................. 16 3.1.3.3 Zweidimensionale stetige Zufallsvariable ............................................................... 19 3.1.4 Die Grenzwertsätze .................................................................................................... 23 3.1.4.1 Das schwache Gesetz der großen Zahlen................................................................. 23 3.1.4.2 Das starke Gesetz der großen Zahlen....................................................................... 23 3.1.4.3 Der Zentrale Grenzwertsatz ..................................................................................... 25 3.1.5 Schätztheorie .............................................................................................................. 25 3.1.5.1 Statistischer Schluss................................................................................................. 25 3.1.5.2 Schätzfunktion ......................................................................................................... 26 3.1.5.3 Eigenschaften von Schätzfunktionen....................................................................... 27 3.1.5.4 Konstruktion von Schätzfunktionen......................................................................... 29 3.1.5.5 Punkt- und Intervallschätzung ................................................................................. 29 3.1.5.6 Schätzen in endlichen und unendlichen Grundgesamtheiten................................... 32 3.1.6 Modellbildung ............................................................................................................ 38 3.2 Grundlagen der Probenahme........................................................................................... 38 3.2.1 Einführung.................................................................................................................. 38 3.2.1.1 Abgrenzung des Probenahmebegriffes .................................................................... 40 3.2.1.2 Probenahmeplan und Probenahmekriterien ............................................................. 41 3.2.1.3 Fehler einer Stichprobenuntersuchung .................................................................... 43 3.2.2 Stichprobenverfahren ................................................................................................. 48 3.2.2.1 Nichtzufällige Auswahlverfahren ............................................................................ 48 3.2.2.2 Zufällige Auswahlverfahren .................................................................................... 48 3.2.2.3 Die grundlegenden einstufigen zufälligen Auswahlverfahren................................. 51 3.2.2.4 Vergleich der grundlegenden einstufigen zufälligen Auswahlverfahren................. 54 3.2.2.5 Mehrstufige Auswahlverfahren................................................................................ 55 3.2.2.6 Auswahlverfahren bei abhängigen Merkmalen ....................................................... 60 3.2.3 Hochrechnungs- oder Schätzverfahren ...................................................................... 62 3.2.3.1 Einfache oder reine Zufallsstichprobe ..................................................................... 62 3.2.3.2 Systematische Zufallsstichprobe.............................................................................. 65 3.2.3.3 Geschichtete Zufallsstichprobe ................................................................................ 68 3.2.3.4 Mehrstufige Zufallsstichprobe ................................................................................. 71 3.3 Probenahme von Stoffsystemen...................................................................................... 80 3.3.1 Auswahlvorgang......................................................................................................... 81 i Inhaltsverzeichnis 3.3.1.1 Flächenbeprobung ....................................................................................................81 3.3.1.2 Gutstrombeprobung..................................................................................................81 3.3.2 Heterogenität...............................................................................................................82 3.3.2.1 Allgemein .................................................................................................................82 3.3.2.2 Modell für unabhängige Elementareinheiten ...........................................................84 3.3.2.3 Modell für abhängige Elementareinheiten ...............................................................90 4 Probenahmemodelle für heterogene Stoffsysteme – Stand des Wissens.............. 93 4.1 Allgemeines Probenahmemodell für disperse Stoffsysteme ...........................................93 4.1.1 Stoffmodell .................................................................................................................93 4.1.2 Auswahlmodell ...........................................................................................................96 4.1.2.1 Schätzwert ................................................................................................................97 4.1.2.2 Genauigkeit des Schätzwertes ..................................................................................98 4.1.3 Fehlerbetrachtung der Stichprobenahme ....................................................................99 4.1.3.1 Fehler, die in den mathematischen Beziehungen des Modells begründet sind ...........................................................................................................................99 4.1.3.2 Fehler, die auf die praktische Ausführung der Probenahme und Aufbereitung zurückzuführen sind .........................................................................100 4.1.3.3 Gesamtfehler...........................................................................................................103 4.1.4 Ansatz für ein Stoffmodell mit unabhängigen Stoffteilchen ....................................105 4.2 Praxisorientierte Probenahmemodelle für disperse Stoffsysteme .................................110 4.2.1 Physikalischer Ansatz für ein Probenahmemodell ...................................................110 4.2.2 Statistischer Ansatz für ein Probenahmemodell .......................................................119 4.2.2.1 Pareto-Verteilung ...................................................................................................119 4.2.2.2 RRSB-Verteilung ...................................................................................................121 5 Entwicklung einer angepassten Probenahmemethode für heterogene Stoffsysteme geringer Schüttdichte........................................................................ 124 5.1 Ausgangssituation..........................................................................................................124 5.2 Die neue Probenahmemethode ......................................................................................126 5.3 Ein modifiziertes Probenahmemodell ...........................................................................129 6 6.1 Vorversuche zur Entwicklung der Versuchsgeräte, zur Ermittlung relevanter Stoffeigenschaften und zur Bestimmung der Probenahmeparameter............................................................................................. 133 Vorversuche zur Entwicklung der Versuchsgeräte .......................................................134 6.2 Vorversuche zur Ermittlung relevanter Stoffeigenschaften ..........................................138 6.2.1 Charakterisierung der Versuchsmaterialien..............................................................139 6.2.1.1 Zeitungspapier ........................................................................................................139 6.2.1.2 Kunststoffe .............................................................................................................139 6.2.1.3 Getränkedosen aus Weißblech ...............................................................................140 6.2.2 Ermittlung der Brennwerte für die Versuchsmaterialien und Aufnahme einer Kalibriergeraden ..............................................................................................141 6.2.2.1 Zielstellung .............................................................................................................141 6.2.2.2 Versuchsdurchführung ...........................................................................................142 6.2.2.3 Ergebnisse...............................................................................................................142 6.2.3 Ermittlung der Stoffdichten für einzelne Stoffkomponenten und Stoffgemische ...........................................................................................................143 6.2.3.1 Zielstellung .............................................................................................................144 ii Inhaltsverzeichnis 6.2.3.2 Versuchsdurchführung ........................................................................................... 144 6.2.3.3 Ergebnisse .............................................................................................................. 145 6.2.4 Bestimmung der Teilchengrößenverteilung und der Teilchenmassenverteilung für die synthetischen Stoffgemische und realen Abfälle ........................................................................................................... 146 6.2.4.1 Zielstellung ............................................................................................................ 146 6.2.4.2 Versuchsmaterial.................................................................................................... 146 6.2.4.3 Versuchsdurchführung ........................................................................................... 147 6.2.4.4 Ergebnisse .............................................................................................................. 148 6.2.4.5 Schlussfolgerungen ................................................................................................ 157 6.3 Vorversuch zur Bestimmung der Probenahmeparameter ............................................. 158 6.3.1 Zielsetzung ............................................................................................................... 158 6.3.2 Versuchsdurchführung ............................................................................................. 159 6.3.2.1 Herstellung der Zufallsmischung ........................................................................... 159 6.3.2.2 Probenahme............................................................................................................ 159 6.3.2.3 Probenaufbereitung ................................................................................................ 162 6.3.2.4 Analyse .................................................................................................................. 162 6.3.3 Auswertung und Darstellung der Ergebnisse ........................................................... 163 6.3.3.1 Explorative Datenanalyse ...................................................................................... 164 6.3.3.2 Schätzung der Mittelwerte und Varianzen............................................................. 166 6.3.3.3 Analyse der Fehlereinflüsse der Teilungs- und Auswahlschritte........................... 167 6.3.3.4 Zusatzauswertungen............................................................................................... 168 6.3.3.5 Bewertung der Ergebnisse und Schlussfolgerungen für die Durchführung der Hauptversuche.......................................................................... 171 6.4 7 Technische Umsetzung des neuen Probenahmeverfahrens und Versuchsaufbau ............................................................................................................. 172 Durchführung der Versuche .....................................................................................175 7.1 Das Versuchsprogramm ................................................................................................ 175 7.1.1 Untersuchung der empirischen Heterogenität für Zwei- und Dreikomponentengemische sowie für reale Abfälle ................................................ 177 7.1.2 Vergleich des neu entwickelten Probenahmeverfahrens nach der Würfelteilungsmethode mit einem herkömmlichen Probenahmeverfahren nach der Methode mit Teilungskreuz....................................................................... 179 7.1.3 Untersuchung von Einflussgrößen auf die Heterogenität des Stoffsystems - Abhängigkeit von Stoffdichte und Teilchengröße ................................................. 180 7.1.3.1 Stoffdichte.............................................................................................................. 180 7.1.3.2 Teilchengröße ........................................................................................................ 180 7.1.4 Untersuchung der Ortsabhängigkeit der Heterogenität ............................................ 181 7.2 Durchführung der Versuche mit synthetischen Stoffgemischen bekannter Zusammensetzung –Würfelteilungsmethode und mehrstufiges Modell....................... 181 7.2.1 Herstellung der Zufallsmischungen.......................................................................... 182 7.2.2 Probenahme .............................................................................................................. 182 7.3 Durchführung der Versuche mit synthetischen Stoffgemischen bekannter Zusammensetzung - Würfelteilungsmethode und geschichtetes Modell...................... 184 7.3.1 Probenahme .............................................................................................................. 184 7.4 Durchführung der Versuche mit synthetischen Stoffgemischen bekannter Zusammensetzung - Teilungskreuzmethode und mehrstufiges Modell........................ 185 7.4.1 Probenahme .............................................................................................................. 185 iii Inhaltsverzeichnis 7.4.2 Probenaufbereitung und Analyse..............................................................................187 7.5 Durchführung der Versuche mit realen Abfallgemischen unbekannter Zusammensetzung - Würfelteilungsmethode ................................................................187 7.5.1 Herstellung der Zufallsmischungen ..........................................................................187 7.5.2 Probenahme ..............................................................................................................188 7.6 Durchführung der Versuche mit synthetischen Stoffgemischen unterschiedlicher Teilchengrößen..................................................................................188 7.6.1 Herstellung der Zufallsmischungen ..........................................................................188 7.6.2 Probenahme ..............................................................................................................189 8 8.1 Auswertung der Ergebnisse..................................................................................... 190 Einzelauswertung...........................................................................................................191 8.2 Gesamtauswertung.........................................................................................................192 8.2.1 Explorative Datenanalyse .........................................................................................192 8.2.2 Schätzung der Mittelwerte und Varianzen................................................................193 8.2.3 Fehlerbetrachtung der einzelnen Teilungs- und Auswahlschritte.............................197 8.2.4 Methodenvergleich: Teilungskreuz - Würfelteilung.................................................200 8.2.5 Untersuchung der Einflussgrößen Dichte und Teilchengröße auf die Heterogenität.............................................................................................................201 8.2.6 Untersuchung der Ortsabhängigkeit der Messwerte.................................................206 8.2.7 Optimierung der Probenahmeparameter Stichprobengröße und Stichprobenanzahl.....................................................................................................212 8.3 9 Zusammenfassung der Auswertungsergebnisse ............................................................215 Zusammenfassung ................................................................................................... 219 Anhang ...................................................................................................................... A 223 Tabellenverzeichnis...................................................................................................... A 217 Abbildungsverzeichnis................................................................................................. A 320 Verzeichnis der Formelzeichen und Symbole ............................................................ A 324 Literaturverzeichnis...................................................................................................... A 339 iv Anhangverzeichnis A Ergebnisse der Einzelauswertung................................................................................A-224 A.1 Versuch V 01........................................................................................................A-224 A.1.1 Explorative Datenanalyse ..................................................................................A-224 A.1.2 Schätzung der Mittelwerte und Varianzen.........................................................A-225 A.1.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-226 A.2 Versuch V 02........................................................................................................A-228 A.2.1 Explorative Datenanalyse ..................................................................................A-228 A.2.2 Schätzung der Mittelwerte und Varianzen.........................................................A-229 A.2.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-230 A.2.4 Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-231 A.3 Versuch V 03........................................................................................................A-234 A.3.1 Explorative Datenanalyse ..................................................................................A-234 A.3.2 Schätzung der Mittelwerte und Varianzen.........................................................A-235 A.3.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-236 A.4 Versuch V 04........................................................................................................A-237 A.4.1 Explorative Datenanalyse ..................................................................................A-237 A.4.2 Schätzung der Mittelwerte und Varianzen.........................................................A-238 A.4.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-239 A.4.4 Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-240 A.5 Versuch V 05........................................................................................................A-242 A.5.1 Explorative Datenanalyse ..................................................................................A-242 A.5.2 Schätzung der Mittelwerte und Varianzen.........................................................A-243 A.5.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-244 A.6 Versuch V 06........................................................................................................A-245 A.6.1 Explorative Datenanalyse ..................................................................................A-245 A.6.2 Schätzung der Mittelwerte und Varianzen.........................................................A-246 A.6.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-247 A.6.4 Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-248 A.7 Versuch V 07........................................................................................................A-249 A.7.1 Explorative Datenanalyse ..................................................................................A-250 A.7.2 Schätzung der Mittelwerte und Varianzen.........................................................A-251 A.7.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-252 A.8 Versuch V 08........................................................................................................A-253 A.8.1 Explorative Datenanalyse ..................................................................................A-253 A.8.2 Schätzung der Mittelwerte und Varianzen.........................................................A-254 A.8.3 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte..................................................................................................A-255 A.8.4 Untersuchung der Ortsabhängigkeit der Messwerte ..........................................A-256 A.9 Versuch V 09........................................................................................................A-258 A.9.1 Explorative Datenanalyse ..................................................................................A-258 A.9.2 Schätzung der Mittelwerte und Varianzen.........................................................A-259 v Anhangverzeichnis A.9.3 A.10 A.10.1 A.10.2 A.10.3 A.10.4 A.11 A.11.1 A.11.2 A.12 A.12.1 A.12.2 A.13 A.13.1 A.13.2 A.14 A.14.1 A.14.2 A.14.3 A.15 A.15.1 A.15.2 A.15.3 A.15.4 A.15.5 A.15.6 A.16 A.16.1 A.16.2 A.16.3 A.16.4 B C Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-260 Versuch V 10 ....................................................................................................... A-261 Explorative Datenanalyse.................................................................................. A-261 Schätzung der Mittelwerte und Varianzen ........................................................ A-262 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-263 Untersuchung der Ortsabhängigkeit der Messwerte.......................................... A-264 Versuch V 11 ....................................................................................................... A-265 Schätzung der Mittelwerte und Varianzen ........................................................ A-266 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-267 Versuch V 12 ....................................................................................................... A-267 Schätzung der Mittelwerte und Varianzen ........................................................ A-268 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-269 Versuch V 13 ....................................................................................................... A-269 Schätzung der Mittelwerte und Varianzen ........................................................ A-270 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-271 Versuch V 14 ....................................................................................................... A-271 Explorative Datenanalyse.................................................................................. A-272 Schätzung der Mittelwerte und Varianzen ........................................................ A-273 Untersuchung der Mittelwertunterschiede für die Schichten ............................ A-274 Versuch V 15 ....................................................................................................... A-277 Explorative Datenanalyse.................................................................................. A-277 Schätzung der Mittelwerte und Varianzen ........................................................ A-278 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-279 Vergleich der Auswahlmethoden – einfache mehrstufige Zufallsauswahl und geschichtete mehrstufige Zufallsauswahl ......................... A-283 Untersuchung einer optimierten Variante ......................................................... A-283 Untersuchung der Verschnittreste ..................................................................... A-285 Versuch V 16 ....................................................................................................... A-286 Explorative Datenanalyse.................................................................................. A-287 Schätzung der Mittelwerte und Varianzen ........................................................ A-288 Untersuchung der Fehlereinflüsse der einzelnen Teilungs- und Auswahlschritte ................................................................................................. A-289 Untersuchung einer optimierten Variante ......................................................... A-290 Begriffe und Formelzeichen der mehrstufigen Zufallsauswahl.................................. A-292 Berechnung der Mittelwerte und Varianzen in einem mehrstufigen Auswahlmodell......................................................................................................... A-300 C.1 Das zweistufige Auswahlmodell ......................................................................... A-300 C.1.1 Mittelwerte ........................................................................................................ A-300 C.1.2 Varianzen........................................................................................................... A-300 C.1.3 Fehleranteile ...................................................................................................... A-302 C.2 Das dreistufiges Auswahlmodell ......................................................................... A-304 C.2.1 Mittelwerte ........................................................................................................ A-304 C.2.2 Varianzen........................................................................................................... A-305 C.2.3 Fehleranteile ...................................................................................................... A-306 vi Anhangverzeichnis C.3 C.3.1 C.3.2 C.3.3 Das vierstufige Auswahlmodell ...........................................................................A-310 Mittelwerte .........................................................................................................A-310 Varianzen ...........................................................................................................A-310 Fehleranteile....................................................................................................... A 312 vii 1 EINLEITUNG Im Interesse einer nachhaltigen Wirtschaftsentwicklung gewinnt der Aufbau einer geordneten Abfallwirtschaft und die Schließung von Stoffkreisläufen weltweit an Bedeutung. Insbesondere in den industrialisierten Ländern wird die Notwendigkeit einer sicheren und umweltverträglichen Beseitigung und die Nutzung der stofflichen und energetischen Potenziale von Abfällen erkannt. In Deutschland wurden mit dem Kreislaufwirtschafts- und Abfallgesetzes (KrW-/AbfG) [1] und seinen untergesetzlichen Regelwerken die rechtlichen Voraussetzungen für den Aufbau geschlossener Stoffkreisläufe geschaffen. Unter Berücksichtigung technischer und ökonomischer Gesichtspunkte soll ein größtmöglicher Anteil der nicht zu vermeidenden Abfälle einer Verwertung zugeführt werden. Bereits heute wird ein Großteil der Abfälle über vielfältige Verwertungsverfahren in den Stoffkreislauf zurückgeführt. Durch das Inkrafttreten der Abfallablagerungsverordnung (AbfAblV) [2] ist zu erwarten, dass die Abfallmenge, die einer stofflichen oder energetischen Verwertung zugeführt wird, in den kommenden Jahren erheblich ansteigen wird, da ab dem 01.06.2005 nur noch vorbehandelte Siedlungsabfälle deponiert werden dürfen. Durch die Getrennterfassung wertstoffhaltiger Stoffgruppen oder die Sortierung gemischter Abfälle in verwertbare und zu beseitigende Stoffgruppen sind eine Vielzahl von Stoffströmen in der Abfall- und Kreislaufwirtschaft entstanden. Die Überwachungspflicht einerseits wie auch das steigende ökonomische Interesse an der Abfallverwertung führen dazu, dass die Anforderungen an die zuverlässige Beurteilung der Stoffströme in der Abfallwirtschaft steigen. So werden beispielsweise von den zuständigen Abfallbehörden Daten zur Überwachung von Schadstoffbelastungen, zur Überprüfung von Verwertungsquoten, zur Gewährleistung der Entsorgungssicherheit und zur Aufstellung von Abfallwirtschaftsplänen gefordert. Planer und Betreiber von Abfallanlagen hingegen benötigen Daten zur Menge, zur Zusammensetzung und zu physikalischen, chemischen und technischen Eigenschaften der Abfälle. Der Qualitätssicherung in der Abfallwirtschaft kommt damit eine bedeutende Stellung zu. Qualitätssicherung ist aber in nahezu allen Fällen nur durch die Entnahme von zuverlässigen Stichproben möglich. Zur Beschreibung der bei der Verwertung und Beseitigung von Abfällen und Abfallgemischen interessierenden Eigenschaften sind sowohl Merkmale, die den Wert eines Stoffes oder Stoffgemisches beschreiben als auch Merkmale die das Gefährdungspotential für Mensch und Umwelt charakterisieren, einzubeziehen. Für nahezu alle Verwertungs- und Beseitigungsverfahren ist es von elementarer Bedeutung, möglichst genaue und verlässliche Infor1 Kapitel 1 mationen über die verfahrensrelevanten Eigenschaften zu besitzen. Zu den interessierenden Abfalleigenschaften gehören beispielsweise die stoffliche Zusammensetzung, der Wassergehalt, der Heizwert, der Glührückstand, der gesamte organische Kohlenstoffgehalt im Eluat (TOCEluat), der Chlorgehalt, die Gasbildungsrate und das gesamte Spektrum an organischen und anorganischen Schadstoffen. Der exakten Ermittlung des Heizwertes kommt durch das KrW-/AbfG eine besondere Bedeutung insofern zu, da er als Kriterium für die Einstufung von Abfällen zur Verwertung heranzuziehen ist. Der Glührückstand, der gesamte organische Kohlenstoffgehalt im Eluat oder die Gasbildungsrate GB21 sind alternativ auszuwählende Eigenschaftsmerkmale, die zukünftig die Ablagerung von Abfällen entscheidend beeinflussen werden. Spätestens ab 2005 sind eindeutige Nachweise darüber zu führen, ob ein abzulagernder Abfall die in der Technischen Anleitung für Siedlungsabfälle (TASi) [3] und der AbfAblV [2] vorgegebenen Kriterien einhalten kann. Weiteren Untersuchungsbedarf wird es bei der energetischen Nutzung von Sekundärbrennstoffen in industriellen Anlagen wie Kraft- oder Zementwerken geben. Um als Energieträger genutzt zu werden, muss der aus heizwertreichen Abfallbestandteilen hergestellte Sekundärbrennstoff umfassenden rechtlichen und technischen Anforderungen genügen. Der erzeugte Sekundärbrennstoff soll eine möglichst gleichbleibende Brennstoffqualität und niedrige Schadstoffgehalte aufweisen [4]. Voraussetzung für eine zuverlässige Ermittlung dieser Abfalleigenschaften ist die Anwendung eines gesicherten und vor allem auch reproduzierbaren Probenahmeverfahrens. Die Ziehung einer Stichprobe aus einer Grundgesamtheit oder kurz die Probenahme ist von grundlegender Bedeutung in der Gewinnung von Daten und Informationen. Genau genommen beruht unser Wissen, unsere Einstellung und unser Handeln weitgehend auf Stichproben. Dies trifft gleichermaßen im Alltag und in der Forschung zu. Um fundierte Schlüsse aus den Ergebnissen einer Stichprobe zu ziehen, muss die Stichprobe repräsentativ sein. Erst Anfang der dreißiger Jahre begann die Entwicklung einer eigenen Theorie zur Auswahl von repräsentativen Stichproben und deren Übertragung auf die zu beschreibende Wirklichkeit. Die Stichprobentheorie wurde in den USA zunächst für die Markt- und Meinungsforschung entwickelt. Sie basiert auf der Wahrscheinlichkeitsrechnung und ist in seiner allgemeinen Formulierung auf nahezu allen Gebieten anwendbar [5]. In der Praxis der Probenahme fester Stoffsysteme sind die mathematisch-statistischen Grundlagen der Stichprobentheorie auf komplexe Grundgesamtheiten mit stark streuenden Stoffeigenschaften anzuwenden. Grundgesamtheiten mit stark streuenden Stoffeigenschaften werden als heterogen bezeichnet. Grundsätzlich gilt, je heterogener eine Grundgesamtheit zusammengesetzt ist, desto höher sind die Anforderungen an das einzusetzende Stich- 2 Einleitung probenverfahren. Das heißt, es kommt darauf an, wie die Elemente einer Grundgesamtheit ausgewählt werden. Um „richtig“ auszuwählen, müssen ausführliche Informationen über die Eigenschaften der Elementareinheiten fester Stoffsysteme vorliegen. Die Entwicklung geeigneter Stichprobenverfahren ist damit nicht nur ein mathematisch-statistisches Problem, es sind auch grundlegende Kenntnisse aus den Stoffwissenschaften erforderlich. Für feste Stoffsysteme wurden erstmals wissenschaftlich fundierte Arbeiten für die Probenahme von Böden und Gesteinen von dem Geostatistiker G. Matheron [6] und eine umfassende Probenahmetheorie für disperse Feststoffe von P. Gy [7] formuliert. Der Ansatz von Gy hat sich für die Probenahme mineralischer und bergbaulicher Rohstoffe wie beispielsweise Kies, Erz oder Kohle bewährt. Die vorliegende Arbeit befasst sich mit der Probenahme heterogener Stoffe und Stoffgemische geringer Schüttdichte aus dem Abfallbereich. Sie sind den stückigen und festdispersen Stoffsystemen zuzuordnen, unterscheiden sich aber von mineralischen und bergbaulichen Schüttgütern erheblich. Gesetzmäßigkeiten, die beispielsweise aus der Genese mineralischer Stoffe abzuleiten sind, existieren für Abfälle nicht. Im Stoffkreislauf stehen Abfälle und Abfallgemische am Ende des Lebenszyklus von Produkten und Gebrauchsgegenständen. Sie sind daher im Allgemeinen durch eine große Streubreite an verschiedenen Stoffbestandteilen, Teilchengrößen, Teilchenformen, Teilchendichten usw. gekennzeichnet. Für die Probenahme im Abfallbereich bedeutet dies, dass die Methoden aus der Probenahme mineralischer Schüttgüter nicht übertragbar sind und dass die Anforderungen an ein geeignetes Probenahmeverfahren im Abfallbereich höher einzuschätzen sind. Gleichzeitig ist zumindest die am Geldwert gemessene Wertschöpfung bei Abfallgemischen im Stoffkreislauf am geringsten. Wie in der Anlagentechnik zeigt sich auch im Bereich der Probenahme, dass auf Kosten eigener stoffangepasster Entwicklungen bestehende Methoden und Verfahren aus dem Bergbau, der Aufbereitung oder dem Tiefbau übernommen wurden. Auf eigene grundlegende Forschungs- und Entwicklungsarbeiten wurde meist aus ökonomischen Abwägungen verzichtet. Vor diesem Hintergrund wird deutlich, warum die repräsentative Probenahme heterogener Abfälle und Abfallgemische zur Beurteilung der physikalischen, chemischen und technologischen Eigenschaften bisher nicht befriedigend gelöst wurde. Auf die Problematik der repräsentativen Probenahme heterogener Abfälle und Abfallgemische wurde von verschiedenen Autoren hingewiesen. Die Probenahme erfolgt bislang überwiegend mit „Hausrezepten“ oder Strategien, die nur unter bestimmten Voraussetzungen angewandt werden können [9,10,11,12,13,14,15,16,17,18]. Mit dieser Arbeit soll die vorhandene Lücke in der Erforschung und Entwicklung einer geeigneten Probenahmemethode für heterogene Abfälle geringer Schüttdichte geschlossen werden. 3 2 AUFGABENSTELLUNG 2.1 Untersuchungsgesamtheit Untersuchungsgesamtheit im Rahmen dieser Arbeit sind Stoffsysteme, die in privaten Haushalten, Gewerbe- und Industriebetrieben als Abfälle und Abfallgemische anfallen sowie alle weiteren Folgeprodukte aus der Verwertung und Beseitigung dieser Abfälle. Nicht zum Untersuchungsgegenstand gehören Abfälle und Abfallgemische mit überwiegend mineralischem Anteil. Der Untersuchungsgegenstand ist damit durch eine geringe Schüttdichte des Gemisches und durch geringe Stoffdichten der Stoffbestandteile gekennzeichnet. Stoffe und Stoffgemische der Abfallwirtschaft sind im Allgemeinen stark heterogen. Sie lassen sich durch folgende Eigenschaften charakterisieren: 1. Sie besitzen mehrere Stoffkomponenten (R ≥ 2). 2. Die Stoffkomponenten können eine Vielfalt von Stoffeigenschaften besitzen. 3. Die Verbindungsverhältnisse zwischen den Stoffkomponenten können komplex sein. Mehrere Komponenten können zu einem Stück verschmolzen, verklebt, verschraubt, verschweißt, verlötet, vernietet, oder verknäuelt sein. 4. Die Stoffe weisen insgesamt eine geringe Schüttdichte auf (ρSch [ 1 kg/dm3). 5. Die Stoffbestandteile weichen stark von der typischen Form für Körner ab und werden daher als Teilchen oder Stücke bezeichnet. 6. Die Teilchen- oder Stückgrößen variieren über ein weites Spektrum. 7. Zur Bestimmung der Teilchen- oder Stückgrößen existieren keine einheitlichen Methoden, d. h. ihre Teilchen- oder Stückgrößenverteilung ist nicht einheitlich bestimmbar. 8. Die Form der Teilchen oder Stücke kann sehr unterschiedlich sein. Sie kann rund, eckig, plattig, kantig, länglich, flach usw. sein. 9. Die Teilchen oder Stücke sind nicht formstabil, d. h. leicht verformbar. Eine Beschreibung ihrer Form ist daher nicht sinnvoll. 10. Die Oberflächen der Teilchen oder Stücke können rau, glatt, beschichtet oder verschmutzt sein. 11. Die Stoffsysteme sind im Gegensatz zu Schüttgütern nicht rieselfähig. Ihr schüttgutmechanisches Verhalten ist komplex und bisher noch unerforscht. 4 Aufgabenstellung Für Stoffsysteme aus der Abfallwirtschaft ist anzunehmen, dass eine zu untersuchende Eigenschaft (ein interessierendes Merkmal) von Teilchen zu Teilchen bzw. von Teilchengruppe zu Teilchengruppe starken Schwankungen unterliegen wird. Das Stoffsystem ist bezüglich der Zusammensetzung, der Geometrie und des Durchmischungsgrades ihrer Bestandteile stark heterogen. Abbildung 2.1 und Abbildung 2.2 zeigen die Beschaffenheit von Berliner Hausmüll vor der Abfallerfassung und auf der Deponie. Allein der Teilchengrößenbereich reicht von Staubpartikeln bis zu Teppichen und Bodenbelägen von mehreren MeAbbildung 2.1: Berliner Hausmüll tern Länge. Es wird deutlich, welche Anforderungen derartige Stoffgemische an ein Probenahmeverfahren stellen. Im Weiteren wird das in dieser Arbeit betrachtete Stoffsystem als heterogene Stoffe und Stoffgemische geringer Schüttdichte aus der Abfallwirtschaft oder kurz als Abfallgemisch bezeichnet. Im Kontext mit dem Begriff Stichprobe wird das Abfallgemisch als Grundgesamtheit oder auch Untersuchungsgegenstand, Untersuchungsgesamtheit, Untersuchungsgut oder Prüfgut bezeichnet. Abbildung 2.2: Siedlungsabfall auf der Deponie Typische Beispiele für heterogene Abfallgemische geringer Schüttdichte sind der Hausmüll aus privaten Haushalten und Gewerbe sowie die davon getrennt erfassten Wertstoffe, wie z. B. die Leichtverpackungsabfälle, die über das „Duale System“ gesammelt werden, Papierkorbabfälle, Sortierreste aus der Abfallaufbereitung, wie z. B. Sortierreste aus der Aufbereitung von Verpackungsabfällen (Abbildung 2.3) der BaustellenabfallaufbereiAbbildung 2.3: Sortierrest aus einer DSD-Anlage tung, der Bauschuttaufbereitung und der me- 5 Kapitel 2 chanisch-biologischen Aufbereitung von Siedlungsabfällen, Shredderleichtfraktion aus der Entsorgung von Altautos und Kühlgeräten. 2.2 Untersuchungsziel In der Einführung wurde die Notwendigkeit geeigneter Probenahmeverfahren zur Qualitätssicherung in der Abfallwirtschaft aufgezeigt. Für Stoffsysteme aus dem Bereich der Rohstoffwirtschaft existieren wissenschaftlich begründete Probenahmemodelle [8]. Die Probenahmemodelle beruhen auf vereinfachenden Annahmen über die Geometrie und Verteilung der Körner und können für Stoffsysteme mit vertretbarer Korngrößenverteilung [19] und Rieselfähigkeit in der Praxis mit Erfolg angewandt werden. Die darauf beruhenden Probenahmemethoden für gleichkörnige, rieselfähige Schüttgüter aus der Rohstoffwirtschaft sind für heterogene Abfälle und Abfallgemische geringer Schüttdichte nicht ohne weiteres übertrag- und anwendbar. Der Charakterisierung der heterogenen Abfallgemische geringer Schüttdichte ist die starke Abweichung in den Stoffeigenschaften von mineralischen Schüttgütern zu entnehmen. Der Ansatz aus der Qualitätssicherung mineralischer Schüttgüter, die Stoffteilchen über physikalische Modelle zu beschreiben [7], ist für die komplexen Stoffgemische aus der Abfallwirtschaft nicht zielführend. Vor diesem Hintergrund wurde ein neuer Ansatz für die Probenahme heterogener Abfallgemische geringer Schüttdichte entwickelt. Ziel der Untersuchung war es daher, ausgehend von den speziellen Anforderungen, die heterogene Stoffsysteme in der Abfallwirtschaft an die repräsentative Probenahme stellen, ein neuartiges Probenahmeverfahren zu entwickeln und eingehend wissenschaftlich zu untersuchen. Von zentraler Bedeutung ist die Heterogenität der Abfallgemische geringer Schüttdichte, die maßgeblich für den unvermeidbaren Fehler einer Stichprobenuntersuchung verantwortlich ist. Dafür müssen die relevanten Stoffeigenschaften identifiziert und ihre Auswirkungen auf die Heterogenität beschrieben werden. Der Schwerpunkt dieser Arbeit liegt in der Erarbeitung der methodischen Grundlagen für ein neues praxistaugliches Probenahmeverfahren sowie der Entwicklung und Umsetzung der erforderlichen Probenahmeapparatur für Forschungszwecke. Das neue Probenahmeverfahren soll nach einer einheitlichen Vorgehensweise hinreichend genaue und reproduzierbare (d. h. repräsentative) Daten zur Beurteilung einer Untersuchungsgesamtheit oder eines Prüfgutes liefern. Die Anwendbarkeit, Eignung und Zuverlässigkeit des Verfahrens wird durch ein umfangreiches Versuchsprogramm verifiziert. 6 Aufgabenstellung 2.3 Aufgaben Zur Erreichung des Untersuchungsziels werden folgende Arbeitsschritte durchgeführt: 1. Ausarbeitung eines methodischen Ansatzes. 2. Untersuchung der relevanten Stoffeigenschaften. Dazu gehören u. a. das Komprimierungsverhalten, die Dichte, die Teilchengrößenverteilung und die Teilchenmassenverteilung der Versuchsmaterialien. 3. Entwickeln und Testen der Probenahme-Apparatur. 4. Durchführung der Probenahme mit synthetischen Zwei- und Dreistoffgemischen bekannter Zusammensetzung (Bestimmung der Fehlergrößen des Probenahmeverfahrens). 5. Untersuchung von Einflussgrößen auf die Heterogenität des Stoffsystems. 6. Vergleich des neuen Probenahmeverfahrens mit der konventionellen Teilungskreuzmethode. 7. Validierung des Probenahmeverfahrens mit realen Abfallgemischen unbekannter Zusammensetzung. 7 3 METHODISCHE GRUNDLAGEN 3.1 Statistische Grundlagen Die Aufgabe der Statistik besteht darin, aus Daten Informationen zu gewinnen. Die deskriptive Statistik ordnet, gruppiert und konzentriert Daten. Die induktive Statistik schließt aus beobachteten Daten auf unbeobachtete verborgene Strukturen; aus Stichprobendaten wird auf die „wahren“ Parameter einer Grundgesamtheit geschlossen. Das Ziel besteht meist darin, Aussagen über eine komplexe Wirklichkeit zu treffen, für deren Beschreibung entsprechende Modelle zu entwickeln sind. Die Grundlagen hierfür stellt die Wahrscheinlichkeitstheorie zur Verfügung [20]. Von den Mathematikern Pascal und Fermat wurden anhand der Beschreibung der Gewinnaussichten von Glücksspielen bereits im 17. Jahrhundert die ersten grundlegenden Begriffe zur Wahrscheinlichkeitsrechnung entwickelt. 1933 veröffentlichte Alexey N. Kolmogoroff [21] seine Axiomatik, die grundlegend für den Aufbau der Wahrscheinlichkeitstheorie ist. Die Wahrscheinlichkeitstheorie ist ein geeignetes Werkzeug, das Modelle zur Beschreibung von zufälligen Ereignissen liefert. Die Entnahme einer Stichprobe kann unter bestimmten Voraussetzungen als zufälliges Ereignis aufgefasst werden. Die Entnahme einer Stichprobe und der Rückschluss von der Stichprobe auf die Grundgesamtheit können mit Hilfe der Modelle aus der Wahrscheinlichkeitstheorie erklärt werden. 3.1.1 Der Wahrscheinlichkeitsbegriff Über den Begriff der Wahrscheinlichkeit gibt es unterschiedliche Auffassungen und Sichtweisen. Es existiert der logische, der subjektive und der objektive Wahrscheinlichkeitsbegriff [20]. Die Frage „Was ist die Wahrscheinlichkeit P{A} eines Ereignisses A?“ wird entsprechend der jeweiligen Sicht auf unterschiedliche Weise beantwortet. Für die Beschreibung der Stichprobenahme eignet sich die objektive Sichtweise am besten. Die Wahrscheinlichkeit wird dabei als objektive, „quasi-physikalische“ Eigenschaft aufgefasst. Grundlagen sind das (mathematisch nicht beweisbare) „Intuitive Gesetz der großen Zahlen“ und das (beweisbare) „Starke Gesetz der großen Zahlen“. Kolmogoroff [21] gibt an, welche Eigenschaften die Wahrscheinlichkeit besitzen muss. 8 Methodische Grundlagen Die Axiome von Kolmogoroff Gegeben sei eine Menge S von Ereignissen, die folgende Eigenschaften besitzen1: 1. Omega selbst gehört zu S. Ω heißt das sichere Ereignis. 2. Ø, die leere Menge, gehört zu S. Ø heißt das unmögliche Ereignis. 3. Ist A ein Ereignis, dann ist auch das Komplement A von A ein Ereignis. 4. Sind A und B zwei Ereignisse, so sind A ∪ B sowie A ∩ B ebenfalls Ereignisse. 5. Die Forderung 4. wird auf abzählbar viele Ereignisse ausgedehnt: Aus Ai ∈ S für alle i = 1, 2, ... folgt ∞ U Ai ∈ S und i =1 ∞ IA ∈S i (3-1) i =1 Für jedes Ai ∈ S ist eine reelle Zahl als Wahrscheinlichkeit P von A definiert. Für diese gilt: Axiom I: 0 ≤ P{A} ≤ 1 Axiom II: P{Ω} = 1 Axiom III: Sind die höchstens abzählbar unendlich vielen Ereignisse Ai paarweise disjunkt, so gilt: ⎧∞ ⎫ ∞ P ⎨U Ai ⎬ = ∑ P{Ai } ⎩ i =1 ⎭ i =1 (3-2) Der Wahrscheinlichkeitsbegriff nach Laplace besagt, dass unter den Voraussetzungen: 1. Es seien A1, A2, A3, ..., An disjunkte (Primär-)Ereignisse, von denen genau eines eintreten muss: n UA i = Ω =: sicheres Ereignis i =1 2. Alle Ereignisse seien gleich wahrscheinlich: P{A1 } = P{A2 } = P{A3 } = ... = P{An } 1 S ist eine σ-Algebra und P ein Maß auf S 9 Kapitel 3 Dann folgt aus den Axiomen II und III: P{Ai } = 1 n (3-3) Für zusammengesetzte Ereignisse B = Ai1 ∪ Ai2 ∪ ... ∪ Aik gilt dann: P{B} = k n (3-4) wobei: k: Anzahl der Primärereignisse, aus denen sich das abgeleitete Ereignis zusammensetzt n: Anzahl der möglichen gleichwahrscheinlichen Primärereignisse Für die Entnahme von Stichproben ist das Modell der gleichwahrscheinlichen Primärereignisse nach der Laplace’schen Formel grundlegend. Bedingte Wahrscheinlichkeit und Unabhängigkeit Die Entnahme von Stichproben aus einer Grundgesamtheit kann nicht in jedem Falle als zusammengesetztes unabhängiges Ereignis aufgefasst werden. Wird eine Stichprobe durch mehrere nacheinander geschaltete Auswahlvorgänge gewonnen, oder sind räumliche oder zeitliche Korrelationen zwischen den Elementen einer Grundgesamtheit gegeben, so liefert das Primärereignis Ai möglicherweise ein „Vorwissen“ über das Primärereignis Ai+1. Ist P{A} ≠ 0 , so ist die bedingte Wahrscheinlichkeit P{B A} definiert durch: P{B A} := P{B ∩ A} P{A} (3-5) Stochastische Unabhängigkeit liegt genau dann vor, wenn gilt: A und B sind unabhängig genau dann, wenn P{B A} = P{B} ist. Mit Gleichung 3-5 ergibt sich: P{A ∩ B} = P{A}⋅ P{B} 10 (3-6) Methodische Grundlagen 3.1.2 Zufallsereignis Zu den Ereignissen zählen Vorgänge, die in der realen Welt beobachtet werden können (von Menschen unbeeinflusst) oder Experimente, die nach einer ganz bestimmten Vorschrift ausgeführt werden und beliebig oft wiederholbar sind (von Menschen beeinflusst). Hängt der Ausgang eines Ereignisses vom Zufall ab, wird das Ereignis als Zufallsereignis bezeichnet. Sind die Ereignisse voneinander unabhängig, dann beeinflussen sich die Ergebnisse bei Wiederholung des Zufallsereignisses nicht gegenseitig. Beispiele für Zufallsereignisse sind: Werfen einer Münze Würfeln Kartenziehen Ziehung der Lottozahlen Zufallsstichprobe In Modellen werden Wahrscheinlichkeiten für Ereignisse erklärt und Ereignisse werden durch Mengen dargestellt. 3.1.3 Zufallsvariable Die Beschreibung von Zufallsereignissen erfolgt mit zufälligen Variablen, die im Folgenden auch Zufallsvariablen genannt werden. Jede Zufallsvariable ist eine Funktion auf Ω und ordnet dem Element e eines Wahrscheinlichkeitsraumes eine Realisation zu. Sowohl den Elementen als auch den Realisationen können Wahrscheinlichkeiten zugeordnet werden. Es gilt: 1. Die zufällige Variable X ordnet jedem Element e der Grundmenge Ω eine reelle Zahl x zu: X(e) = x. 2. Dabei muss sich für jede Zahl x der Aussage „ X ≤ x “ eine eindeutige Wahrscheinlichkeit zuordnen lassen: P{X ≤ x} := P{e ∈ Ω / X (e ) ≤ x} . Im Modell zur Beschreibung eines Stichprobenvorganges werden folgende „Übersetzungen“ benutzt: Realität Stichprobenmodell Merkmal Zufallsvariable Merkmalsausprägung Realisation relative Häufigkeit Wahrscheinlichkeit Histogramm der relativen Häufigkeiten Wahrscheinlichkeitsverteilung 11 Kapitel 3 3.1.3.1 Diskrete Zufallsvariable Eine diskrete Zufallsvariable X nimmt endlich oder abzählbar unendlich viele Werte xi (Realisationen) an. Dabei kann für jedes xi die Eintrittswahrscheinlichkeit pi angegeben werden. Die Angabe aller pi = P{X = xi } heißt Wahrscheinlichkeitsverteilung von X. P( X = xi ) = wobei: P: ej: ∑ P(e ) = f (x ) = p ( ) j i (3-7) i X e j = xi Wahrscheinlichkeit Elementarereignis X(ej): diejenigen Elementarereignisse ej, denen die Ausprägung xi der Zufallsvariable X zugeordnet ist X(ej) = xi f(xi): Beispiel: Wahrscheinlichkeitsfunktion "Zweimaliges Werfen einer Münze" ElementarEreignisse Anzahl Wappen Wahrscheinlichkeit für das Elementarereignis Zufallsvariable "Anzahl Wappen" Wahrscheinlichkeitsfunktion P (ej) xi f (xi) ej e1 = ZZ 0 0,25 x1 = 0 f(x1) = 0,25 e2 = ZW 1 0,25 x2 = 1 f(x2) = 0,50 e3 = WZ 1 0,25 e4 = WW 2 0,25 x3 = 2 f(x3) = 0,25 W = Wappen Z = Zahl Eigenschaften von diskreten Zufallsvariablen 1. Die Wahrscheinlichkeitsfunktion f(xi) P ( X = xi ) = f ( x i ) f(xi) x1 xn xi Abbildung 3.1: Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariable 12 (3-8) Methodische Grundlagen 2. Die Verteilungsfunktion F(xi) F ( xi ) = P{X ≤ xi } = F(xi) 1 ∑ f (x ) i xi ≤ x (3-9) 0 xi Abbildung 3.2: Verteilungsfunktion einer diskreten Zufallsvariable Weiterhin lassen sich die Momente einer Verteilung definieren [23]: Die Zahl m k := ∞ ∑x k i ⋅ p i heißt das k-te Moment der diskreten Zufallsgröße X, falls die Reihe i =1 absolut konvergiert. Die Zahl mk := ∞ ∑ (x i =1 − m1 ) ⋅ pi heißt das k-te zentrale Moment der diskreten Zufallsgröße X. k i Über die Momente der Verteilung lassen sich die grundlegenden Parameter von Zufallsvariablen, der Erwartungswert und die Varianz definieren. Der Erwartungswert ist das 1-te Moment der Zufallsvariablen. Für k = 1 ergibt sich: 3. Der Erwartungswert E(X) ∞ m1 = E ( X ) := ∑ xi ⋅ P{X = xi } (3-10) i =1 Der Erwartungswert kennzeichnet das „Zentrum“ einer Verteilung. Angenommen die pi wären Säulen mit Massen entsprechend ihrer Höhe auf der x-Achse, dann ist der Erwartungswert genau der Schwerpunkt dieses Systems auf der x-Achse (Abbildung 3.3). 13 Kapitel 3 pi 1 2 7 E(X) i Abbildung 3.3: Anschauliche Darstellung des Erwartungswertes Die Varianz ist das 2-te zentrale Moment der Zufallsvariablen. Für k = 2 ergibt sich: 4. Die Varianz ∞ m2 = Var ( X ) := ∑ ( xi − m1 ) ⋅ P{X = xi } 2 i =1 = E ( X − E ( X )) 2 ( ) (3-11) = E X 2 − (E ( X )) 2 5. Typische Verteilungen Hypergeometrische Verteilung ⎧⎛ N x ⎞ ⎛ N − N x ⎞ ⎟⎟ ⎪ ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎪⎪ ⎝ nx ⎠ ⎝ n − nx ⎠ f H {n x / N ; n; N x } = ⎨ ⎛N⎞ ⎜⎜ ⎟⎟ ⎪ ⎝n⎠ ⎪ ⎪⎩0 wobei: N: Nx: n: nx : (3-12) Anzahl der Elemente in der Grundgesamtheit Anzahl der Elemente in der Grundgesamtheit, die die interessierende Eigenschaft aufweisen Anzahl der Elemente in der Stichprobe Anzahl der Elemente in der Stichprobe, die die interessierende Eigenschaft aufweisen E(X ) = n ⋅ Nx N Var ( X ) = n ⋅ 14 ⎫ ⎪ für nx = 0, 1, ... , n⎪⎪ ⎬ ⎪ ⎪ ⎪⎭ sonst Nx N − Nx N − n ⋅ ⋅ N N N −1 (3-13) (3-14) Methodische Grundlagen Die Hypergeometrische Verteilung eignet sich zur Beschreibung von Ereignissen, für die das Untersuchungsmerkmal zwei Ausprägungen besitzt (dichotome Grundgesamtheit) und sich die Wahrscheinlichkeiten bei Wiederholung des Ereignisses ändern. Mit der Hypergeometrischen Verteilung lässt sich die Stichprobenauswahl ohne Zurücklegen beschreiben. In der Realität ist die Auswahl ohne Zurücklegen der Normalfall. Die Hypergeometrische Verteilung eignet sich sehr gut für die Beschreibung der Stichprobenauswahl. Binomialverteilung ⎧⎛ n ⎞ nx n −nx ⎪⎜⎜ ⎟⎟ ⋅ p (1 − p ) f B {n x / n; p} = ⎨⎝ nx ⎠ ⎪0 ⎩ wobei: p: n: nx: ⎫ für n x = 0, 1, ... , n⎪ ⎬ ⎪ sonst ⎭ (3-15) Anteil der Elemente in der Grundgesamtheit, die die interessierende Eigenschaft aufweisen Anzahl der Elemente in der Stichprobe Anzahl der Elemente in der Stichprobe, die die interessierende Eigenschaft aufweisen E(X ) = n ⋅ p Var ( X ) = n ⋅ p ⋅ (1 − p ) ⋅ (3-16) N −n N −1 (3-17) Die Binomialverteilung eignet sich zur Beschreibung von Ereignissen für die das Untersuchungsmerkmal zwei Ausprägungen besitzt (dichotome Grundgesamtheit) und sich die Wahrscheinlichkeiten bei Wiederholung des Ereignisses nicht ändern. Mit der Binomialverteilung lässt sich die Stichprobenauswahl mit Zurücklegen beschreiben. Die Binomialverteilung eignet sich für die Beschreibung der Stichprobenauswahl, wenn der Auswahlsatz f sehr klein ist, d. h. die Anzahl N der Elemente einer Grundgesamtheit im Vergleich zur Anzahl n der Elemente einer Stichprobe sehr groß ist. Für kleine Auswahlsätze (in der Praxis f < 0,05) lässt sich die Hypergeometrische Verteilung gut durch die Binomialverteilung approximieren. In der Praxis eignet sich die Binomialverteilung besser zur Beschreibung des Stichprobenvorganges, da weniger Parameter bekannt sein müssen und die mathematische Berechnung sich vereinfacht. Es können auch Grundgesamtheiten mit in der Praxis nicht mehr abzählbar vielen Elementen oder unbekannter Anzahl N berechnet werden. 15 Kapitel 3 3.1.3.2 Stetige Zufallsvariable Eine Zufallsvariable X heißt stetige Zufallsvariable, falls X eine Wahrscheinlichkeitsdichte f X ( x ) besitzt. Dies ist eine nicht negative integrierbare Funktion mit der Eigenschaft FX ( x ) = x ∫f X (t )dt (3-18) −∞ Die Wahrscheinlichkeit, dass die stetige Zufallsvariable X einen Wert zwischen a und b annimmt entspricht der Fläche unter der Dichtefunktion f X ( x ) in den Grenzen a und b. b P(a ≤ X ≤ b) = ∫ f X ( x)dx = FX (b ) − FX (a ) (3-19) a Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable einen bestimmten Wert a annimmt, ist immer gleich Null. a P( X = a ) = ∫ f X ( a )dx = FX (a ) − FX (a ) = 0 (3-20) a Eigenschaften von stetigen Zufallsvariablen 1. Die Wahrscheinlichkeitsdichtefunktion F' X ( x ) = f X ( x ) fX(x) mit P{X = x} = 0 P{− ∞ ≤ X ≤ +∞} = 1 +∞ ∫ f (x )dx = 1 X x Abbildung 3.4: Wahrscheinlichkeitsdichte einer stetigen Zufallsvariable 16 (3-21) −∞ Methodische Grundlagen 2. Die Verteilungsfunktion FX(x) FX ( x ) = P{X ≤ x} = 1 x ∫ f (x )dt X −∞ (3-22) 0 x Abbildung 3.5: Verteilungsfunktion einer stetigen Zufallsvariable Analog der Beschreibung für den diskreten Fall, lassen sich die Momente der Verteilungen für den stetigen Fall definieren. Die Zahl mk ( X ) := +∞ ∫x k ⋅ f X ( x ) heißt das k-te Moment der stetigen Zufallsgröße X, falls das −∞ Integral absolut konvergiert. Die Zahl mk ( X ) := +∞ ∫ (x − µ ) k ⋅ f X ( x ) heißt das k-te zentrale Moment der stetigen −∞ Zufallsgröße X. Der Erwartungswert ist das 1-te Moment der Zufallsvariablen. Für k = 1 ergibt sich: 3. Der Erwartungswert m1( X ) = E ( X ) = +∞ ∫ x ⋅ f (x )dx = µ X (3-23) −∞ Die Varianz ist das 2-te zentrale Moment der Zufallsvariablen. Für k = 2 ergibt sich: 4. Die Varianz m2 ( X ) = Var ( X ) = +∞ ∫ (x − µ ) 2 −∞ = E ( X − E ( X )) = σ 2 ⋅ f X ( x )dx (3-24) 2 17 Kapitel 3 5. Typische Verteilungen Gleichverteilung ⎧ 1 ⎪ fG {x / a ; b} = ⎨ b − a ⎪⎩0 fX(x) 1 b−a E(X ) = 0 a b x ⎫ für a ≤ x ≤ b ⎪ ⎬ sonst ⎪⎭ a+b 2 Var ( X ) = (3-25) (3-26) (b − a )2 (3-27) 12 Abbildung 3.6: Wahrscheinlichkeitsdichte der Gleichverteilung Normalverteilung (Gauß´sche Glockenkurve) (x−µ ) ⎧⎪ 1 − 2 ⋅ e 2σ f N {x / µ ;σ 2 } = ⎨ σ π ⋅ 2 ⎪⎩ fN(x) 2 ⎫⎪ für − ∞ ≤ x ≤ +∞⎬ ⎪⎭ (3-28) x E(X) E(X ) = µ (3-29) Var ( X ) = σ 2 (3-30) Abbildung 3.7: Wahrscheinlichkeitsdichte der Normalverteilung Log-Normalverteilung 2 1 ⎧ 1 ⎫ ⋅ ⋅ e −(ln x − µ ) 2⋅σ für x > 0 ⎪ ⎪ f ln N {x / µ ;σ } = ⎨σ ⋅ 2π x ⎬ ⎪0 ⎪ sonst ⎩ ⎭ 2 flnN(x) (3-31) E(X ) = e E(X) x Abbildung 3.8: Wahrscheinlichkeitsdichte der LogNormalverteilung 18 µ+ σ2 2 (3-32) ( ) Var ( X ) = e 2 µ +σ ⋅ eσ − 1 2 2 (3-33) Methodische Grundlagen 3.1.3.3 Zweidimensionale stetige Zufallsvariable Jeder Einheit Ui einer Grundgesamtheit UG wurde bislang ein Merkmal Xi zur Beschreibung der Eigenschaften zugeordnet. Stehen zur Beschreibung zwei oder mehr Merkmale zur Verfügung, und sind diese Merkmale Zufallsgrößen, so können die Einheiten Ui der Grundgesamtheit im mehrdimensionalen Fall eindeutig mit dem n-tupel (X1, X2, ... ,Xn) beschrieben werden. Ein n-tupel von Zufallsgrößen heißt n-dimensionaler Zufallsvektor. Im zweidimensionalen Fall werden die Eigenschaften der Einheiten einer Grundgesamtheit durch den Vektor (X;Y) beschrieben. Eigenschaften von zweidimensionalen stetigen Zufallsvariablen 1. Die gemeinsame Verteilungsfunktion F ( x, y ) = P( X ≤ x; Y ≤ y ) = P({e ∈ Ω X (e ) ≤ x} ∩ {e ∈ Ω Y (e ) ≤ y}) (3-34) Sie wird auch als die zweidimensionale Wahrscheinlichkeitsdichtefunktion bezeichnet. Analog dem eindimensionalen Fall, lassen sich die Momente der Zufallsvariablen X und Y definieren. Im zweidimensionalen Fall existieren zwei 1-te und drei 2-te Momente. Für k = 1 bzw. k = 2 gilt: 2. Die Erwartungswerte E(X ) = x = +∞ y = +∞ ∫ ∫ x ⋅ f (x; y )dxdy (3-35) x = −∞ y = −∞ E (Y ) = x = +∞ y = +∞ ∫ ∫ y ⋅ f (x; y )dxdy (3-36) x = −∞ y = −∞ x = +∞ y = +∞ ( )= ∫ ∫ x E X 2 2 ⋅ f ( x; y )dxdy (3-37) 2 ⋅ f ( x; y )dxdy (3-38) x = −∞ y = −∞ x = +∞ y = +∞ ( )= ∫ ∫ y EY 2 x = −∞ y = −∞ E(X ;Y ) = x = +∞ y = +∞ ∫ ∫ x ⋅ y ⋅ f (x; y )dxdy (3-39) x = −∞ y = −∞ Die Varianzen lassen sich aus den 2-ten zentralen Momenten der Zufallsvariablen X und Y ableiten. Im zweidimensionalen Fall existieren drei 2-te zentrale Momente. Für k = 2 gilt: 19 Kapitel 3 3. Die Varianzen var ( X ) = x = +∞ y = +∞ ∫ ∫ (x − E ( X )) 2 ( ) ⋅ f ( x; y )dxdy = E X 2 − E 2 ( X ) x = −∞ y = −∞ var (Y ) = x = +∞ y = +∞ ∫ ∫ ( y − E (Y )) 2 ( ) ⋅ f ( x; y )dxdy = E Y 2 − E 2 (Y ) x = −∞ y = −∞ cov( X ;Y ) = (3-40) (3-41) x = +∞ y = +∞ ∫ ∫ (x − E ( X )) ⋅ ( y − E (Y )) ⋅ f (x; y )dxdy x = −∞ y = −∞ (3-42) = E ( X ⋅ Y ) − E ( X ) ⋅ E (Y ) 4. Die Unabhängigkeit Zwei Zufallsvariable X und Y mit einer gemeinsamen Verteilungsfunktion F ( x, y ) = P( X ≤ x; Y ≤ y ) und den einzelnen Verteilungsfunktionen F1 ( x ) = P( X ≤ x ) und F2 ( y ) = P (Y ≤ y ) heißen unabhängig, wenn für alle Paare ( x; y ) ∈ ℜ 2 gilt: F ( x, y ) = P( X ≤ x; Y ≤ y ) = P( X ≤ x ) ⋅ P(Y ≤ y ) = F1 ( x ) ⋅ F2 ( y ) (3-43) 5. Die Kovarianz Die Kovarianz ist ein Maß für die Abhängigkeit von Zufallsgrößen. cov( X ; Y ) := E (( X − E ( X )) ⋅ (Y − E (Y ))) =: σ xy = σ yx = E ( X ⋅ Y ) − E ( X ) ⋅ E (Y ) Ist X=Y dann gilt: (3-44) cov( X ; X ) = var ( X ) Für unabhängige Größen X und Y gilt: cov( X ;Y ) = 0 . Die Umkehrung gilt nicht. 6. Der Korrelationskoeffizient Wird die Kovarianz der Zufallsgrößen X und Y auf die Quadratwurzeln der Varianzen bezogen, erhält man den Korrelationskoeffizienten ρ von X und Y. ρ xy := 20 cov( X ;Y ) Var ( X ) ⋅ Var (Y ) =: σ xy σ x ⋅σ y (3-45) Methodische Grundlagen Der Korrelationskoeffizient liegt zwischen –1 und +1. Er ist für unabhängige Zufallsgrößen identisch Null. Aus ρ = 0 kann nicht geschlossen werden, dass die Zufallsvariablen unabhängig sind. Ist ρ = 0 nennt man die Größen X und Y unkorreliert. 7. Typische Verteilungen Zweidimensionale Normalverteilung Abbildung 3.9: Zweidimensionale Normalverteilung f N ;2 −dim ( x; y ) = 1 2πσ xσ y ⋅ 1 − ρ 2 xy ⋅e − 2 ( 1 2 1− ρ xy ⎡ ( x − a )2 ( x − a1 )⋅( y −a2 ) ( y −a2 )2 ⎤⎥ 1 + ⋅⎢ − 2 ρ xy ⋅ 2 σ x ⋅σ y σ 2y ⎦⎥ ⎣⎢ σ x ) (3-46) wobei a1, a2 = konstant Für die zweidimensionale Verteilungssummenfunktion FN ;2 −dim (x; y ) gilt dann: FN ;2−dim ( x; y ) = x y ∫ ∫f N ; 2 − dim (s; t )dsdt s = −∞ t = −∞ FN ;2 −dim ( x; y ) = x y ∫ ∫ s = −∞ t = −∞ 1 2πσ xσ y ⋅ 1 − ρ xy2 ⋅e − ⎡ ( s − a )2 ( s −a1 )(⋅ t −a2 ) + (t −a2 )2 ⎤⎥ 1 1 ⋅⎢ − 2 ρ xy ⋅ 2 σ x ⋅σ y 2 1− ρ xy σ y2 ⎥⎦ ⎢⎣ σ x2 ( ) dsdt (3-47) Die Erwartungswerte und Varianzen berechnen sich aus den Momenten der Verteilungssummenfunktion. 21 Kapitel 3 Für die Erwartungswerte gilt: E(X ) = +∞ +∞ ∫ ∫x⋅ f N ; 2 − dim (x; y )dxdy (3-48) − ∞− ∞ = a1 Analog berechnen sich: E (Y ) = a2 ; ( ) E X 2 = a1 + σ x2 ; E ( X ⋅ Y ) = σ x ⋅ σ y ⋅ ρ xy + a1 ⋅ a 2 ( ) E Y 2 = a 2 + σ y2 und für cov( X ;Y ) = 0 bzw. X ;Y unabhängig ergibt sich E ( X ⋅ Y ) = a1 ⋅ a 2 Für die Varianzen gilt: ( ) var ( X ) = E X 2 − E 2 ( X ) ( (3-49) ) = a1 + σ x2 − a12 Analog berechnet sich: ( ) var (Y ) = a 2 + σ y2 − a22 =σ 2 Für die Kovarianz gilt: cov( X ; Y ) = E ( X ⋅ Y ) − E ( X ) ⋅ E (Y ) = σ x ⋅ σ y ⋅ ρ xy + a1 ⋅ a2 − a1 ⋅ a2 = σ x ⋅ σ y ⋅ ρ xy 22 (3-50) Methodische Grundlagen 3.1.4 Die Grenzwertsätze Es wird das asymptotische Verhalten der Schätzfunktionen für die Parameter Summe und Mittelwert von unabhängigen Zufallsvariablen untersucht. Die Grenzwertsätze werden bei der Parameterschätzung und der Übertragung der Stichprobenergebnisse auf die Grundgesamtheit benötigt. 3.1.4.1 Das schwache Gesetz der großen Zahlen Ist X1, X2, ..., Xi, ... eine Folge von unabhängig identisch verteilten zufälligen Variablen mit E ( X ) = µ und gleicher Varianz σ 2 . Dann gilt für jedes ε > 0 bzw. ⎞ σ2 ⎛1 n P⎜⎜ ⋅ ∑ X i − µ ≥ ε ⎟⎟ ≤ 2 ⎠ n ⋅ε ⎝ n i =1 (3-51) ⎞ ⎛1 n lim P⎜⎜ ⋅ ∑ X i − µ ≥ ε ⎟⎟ = 0 n ⎯⎯→ ∞ ⎠ ⎝ n i =1 (3-52) Interpretation: Bei wiederholbaren Ereignissen liegen die Realisierungen der Zufallsvariablen des arithmetischen Mittels X , bei genügend großem n, beliebig nahe beim festen Zahlenwert µ. Damit wird der Mittelwert x einer Stichprobe als Realisierung der Zufallsvariablen X zu einem recht guten Schätzwert für den meist unbekannten Erwartungswert µ. Es ist x ≈ µ . 3.1.4.2 Das starke Gesetz der großen Zahlen Mit Wahrscheinlichkeit 1 gilt: Ist X1, X2, ..., Xi, ... eine Folge von unabhängig identisch verteilten zufälligen Variablen mit E ( X ) = µ . Dann gilt mit Wahrscheinlichkeit 1: bzw. 1 n lim ⋅ ∑ X i = µ n ⎯⎯→ ∞ n i =1 (3-53) ⎧ ⎫ 1 n P ⎨ lim ⋅ ∑ X i = µ ⎬ = 1 ⎩n ⎯⎯→ ∞ n i =1 ⎭ (3-54) 23 Kapitel 3 D. h. der Grenzwert der relativen Häufigkeit ist die Wahrscheinlichkeit. Interpretation: In einer Serie unabhängiger Versuche, bei der das Ereignis A mit der Wahrscheinlichkeit P{A} auftreten kann, konvergiert die relative Häufigkeit, mit der A in der Serie auftritt, mit Wahrscheinlichkeit 1 gegen den Grenzwert P{A}. Bei wiederholbaren Ereignissen lassen sich aufgrund des starken Gesetzes der großen Zahlen Wahrscheinlichkeiten durch lange Versuchsreihen beliebig genau messen. Übertragen auf die Stichprobenauswahl bedeutet dies, dass die „wahren“ Parameter einer Grundgesamtheit sich durch Stichprobenuntersuchungen hinreichend genau bestimmen lassen, wird die Stichprobe nur groß genug gewählt. Beispiel: Ziehung von 9 Kugeln aus einer Urne mit 30 Kugeln, wovon 10 rot und 20 schwarz sind. Die Ziehung erfolgt mit Zurücklegen und wird 30 bzw. 200 mal durchgeführt. Wahrscheinlichkeitsverteilung von X: Zufallsvariable X: Realisation x: Binomialverteilung für Ereignisse mit zwei Ausprägungen und Auswahl mit Zurücklegen Anzahl der gezogenen roten Kugeln Anzahl der gezogenen roten Kugeln in der Stichprobe {X1, X2, ..., Xn} eine Folge von unabhängig identisch verteilten zufälligen Variablen mit E ( X ) = µ . Der Erwartungswert ist bekannt und es gilt: E ( X ) = µ = 3 a) Der Versuch wird 30 mal ausgeführt. Wir erhalten die Realisationen xi {x1, x2, ... , x30}={2, 1, ..., 3} und x = 2,96666667 (Abbildung 3.10) b) Versuch wird 200 mal ausgeführt. Wir erhalten die Realisationen x i {x1, x2, ... , x200}={2, 4, ..., 3} 6 durchschnittliche Anzahl roter Kugeln durchschnittliche Anzahl roter Kugeln und x = 3,000 (Abbildung 3.11) 5 4 3 2 1 0 0 5 10 15 20 25 Anzahl der Versuche Abbildung 3.10: Durchschnittliche Anzahl roter Kugeln in der Stichprobe für n<30 24 30 6 5 4 3 2 1 0 0 50 100 150 200 Anzahl der Versuche Abbildung 3.11: Durchschnittliche Anzahl roter Kugeln in der Stichprobe für n<200 Methodische Grundlagen 3.1.4.3 Der Zentrale Grenzwertsatz Es seien {X1, X2, X3, ..., Xn} eine Folge unabhängiger identisch verteilter Zufallsvariablen mit E ( X ) = µ und Var ( X ) = σ 2 . Dann konvergiert die Verteilungsfunktion der standardisierten Summen mit wachsendem n gegen die standardisierte Normalverteilung. Oder anders ausgedrückt, die standardisierte Summe ist asymptotisch normalverteilt. ⎧ n ⎫ u2 x ⎪⎪ ∑ X i − n ⋅ µ ⎪⎪ − 1 i =1 ≤ x⎬ = f N (x ) = P⎨ ⋅ ∫ e 2 du lim n ⋅σ 2π −∞ ⎯→ ∞ ⎪ n⎯ ⎪ ⎪⎩ ⎪⎭ (3-55) Interpretation: Bei vielen in der Praxis vorkommenden Zufallsvariablen kann man davon ausgehen, dass sie aus vielen unabhängigen nichtdominierenden Einzelereignissen additiv zusammengesetzt sind. Sie sind dann nach dem zentralen Grenzwertsatz approximativ normalverteilt. Daher spielt die Normalverteilung in der Statistik eine zentrale Rolle. Als Faustregel kann angegeben werden, dass die Summe und der Mittelwert beliebig verteilter Grundgesamtheiten in guter Näherung für n > 30 normalverteilt sind. 3.1.5 Schätztheorie 3.1.5.1 Statistischer Schluss In der Schätztheorie werden die Ergebnisse oder auch Informationen einer Stichprobenuntersuchung benutzt, um Aussagen über die Parameter oder Variablen einer Grundgesamtheit innerhalb des gewählten Modells zu treffen. Dazu müssen Aussagen zu der Wahrscheinlichkeitsverteilung der im Modell enthaltenen Variablen getroffen werden. Nur so kann die Verlässlichkeit der Aussagen mit Wahrscheinlichkeitsmaßen bewertet werden. Einer Grundgesamtheit mit N Einheiten wird eine bestimmte Anzahl von n Einheiten entnommen. Mithilfe der n Stichprobeneinheiten wird eine Aussage über den „wahren“ Parameter der Grundgesamtheit gemacht. Ein solcher Schluss von der Stichprobe auf die Parameter einer Grundgesamtheit wird als Repräsentationsschluss (indirekter Schluss) bezeichnet. 25 Kapitel 3 Die Parameter einer Grundgesamtheit (auch „wahre Werte“) können durch Stichprobenuntersuchungen nicht exakt bestimmt werden. Wir sprechen deshalb bei der Ermittlung der gesuchten Parameter der Grundgesamtheit von „Schätzen". Werte, die mit Hilfe einer Stichprobe die gesuchten Parameter schätzen, heißen Schätzwerte, die Vorschrift (Funktion), die Schätzwerte aus den Stichprobenergebnissen liefert, heißt Schätzfunktion oder auch Stichprobenfunktion. 3.1.5.2 Schätzfunktion Die Schätz- oder auch Stichprobenfunktion ist eine ein- oder mehrdimensionale, oft nicht lineare Funktion, die den zufälligen Variablen X1, ..., Xn eine neue zufällige Variable f(X1, ..., Xn) zuordnet. Die Zufallsvariablen sind bestimmt durch ihre Verteilungsfunktion, den Erwartungswert und die Varianz. Die Stichprobenergebnisse sind Realisationen der Stichprobenfunktion und weichen mit einer bestimmten Wahrscheinlichkeit vom „wahren Wert“ in der Grundgesamtheit ab. Aufgrund dieser fundamentalen Unsicherheit von Stichprobenergebnissen wird der statistische Schluss auf die Grundgesamtheit auch als Schätzen bezeichnet. Das Verfahren, mit deren Hilfe die „wahren Werte“ geschätzt werden wird Schätzverfahren genannt. Allgemein: $ , die Schätzwerte θ̂ für die Parameter der Grundgesamtheit θ Es gibt eine Schätzfunktion Θ (wahrer Wert) liefert. wobei: ˆ = f ( X , X ,..., X ) Θ 1 2 n (Schätzfunktion) (3-56) θˆ = f ( x1 , x 2 ,..., x n ) (Schätzwert) (3-57) θ: der unbekannte Parameter der Grundgesamtheit ˆ =Θ ˆ ( X ) : die Schätzfunktion von θ mit der Wahrscheinlichkeitsverteilung Θ {} P Θ̂ X: Zufallsvariable mit X = ( X 1 , X 2 ,..., X n ) x: Realisation der Zufallsvariable X mit x = ( x1 , x2 ,..., xn ) θˆ = θˆ( x ) : der Schätzwert für den unbekannten Parameter θ in der Grundgesamtheit Die Schätzfunktion als Funktion von n Zufallsvariablen ist ebenfalls eine Zufallsvariable. Zufallsvariable sind, wie bereits gezeigt, durch ihre Wahrscheinlichkeitsdichtefunktion (für stetige Zufallsvariable) oder ihre Verteilungsfunktion eindeutig bestimmt. 26 Methodische Grundlagen Ist die Verteilungsfunktion bekannt, so können Aussagen (Wahrscheinlichkeitsaussagen) über die Parameter der Grundgesamtheit gemacht werden. Es kann die Wahrscheinlichkeit dafür angegeben werden, dass die Zufallsvariable einen Wert aus einem bestimmten Intervall (oder aus mehreren bestimmten Intervallen) annimmt. Bei vorgegebener Wahrscheinlichkeit kann die Größe des Intervalls (der Intervalle) angegeben werden innerhalb dessen (derer) die Zufallsvariable Werte annimmt. Für die Anwendung bedeutet dies, dass Aussagen über die Genauigkeit, die Reproduzierbarkeit und die Sicherheit der Schätzung getroffen werden können. Anhand der Eigenschaften von Schätzfunktionen wird dies allgemein hergeleitet und dann für das Schätzen in endlichen und unendlichen Grundgesamtheiten verdeutlicht. 3.1.5.3 Eigenschaften von Schätzfunktionen Um beurteilen zu können, wie gut eine Stichprobe die Grundgesamtheit repräsentiert, werden Gütekriterien für die Schätzung herangezogen. Es ist die Frage zu beantworten, wie wahrscheinlich Abweichungen des Schätzwertes vom „wahren Wert“ sind. Als Gütekriterien dienen die Eigenschaften Erwartungstreue einer Schätzfunktion (gibt Auskunft über die Genauigkeit der Schätzung) und Wirksamkeit und Effizienz einer Schätzfunktion (geben Auskunft über die Reproduzierbarkeit einer Schätzung). Die Sicherheit einer Schätzung wird im Allgemeinen durch die Fragestellung oder die Bedeutung einer Untersuchung vorgegeben und in jedem Fall vor der Probenahme festgelegt. Erwartungstreue $ heißt erwartungstreu, falls ihr Erwartungswert mit dem wahren Wert Die Schätzfunktion Θ () übereinstimmt E Θ̂ = θ . Andernfalls heißt Θ̂ verfälscht oder verzerrt. Die Verzerrung oder (englisch) bias ist die Abweichung des „wahren Wertes“ vom Erwartungswert und berechnet sich zu: () ˆ bias := θ − E Θ (3-58) Wirksamkeit und Effizienz Die beiden Schätzfunktionen Θ̂ 1 und Θ̂ 2 seien erwartungstreue Schätzer von θ . D. h. es ( ) ( ) ˆ =EΘ ˆ = θ . Dann heißt Θ̂ wirksamer als Θ̂ , wenn für die Varianzen der gilt: E Θ 1 2 1 2 Schätzfunktionen zutrifft, dass die Varianz von Θ̂ 1 kleiner ist als die Varianz von Θ̂ 2 27 Kapitel 3 ( ) ( ) ( var Θˆ1 < var Θˆ 2 ). Eine Schätzfunktion Θ̂ heißt effizient, wenn sie unter allen erwartungstreuen Schätzern die kleinste Varianz aufweist. Ein geeignetes Prüfkriterium für die Güte einer Stichprobe ist der mittlere quadratische Fehler, der MSE (englisch: Mean Square Error). Kann der Erwartungswert der mittleren quadratischen Abweichung minimiert werden, kann die Stichprobenfunktion (auch Schätzer oder Schätzfunktion) als gut geeignet angesehen werden. ( ˆ E θ −Θ ) ) → Minimum 2 Nach Gleichung 3-11 gilt für die Varianz einer Zufallsvariablen: ( var ( X ) = E ( X − E ( X )) 2 ) (3-59) Damit lässt sich der Mean Square Error (MSE), als die Summe aus der Varianz und dem bias berechnen. (( ˆ E θ −Θ ) )= 2 ( ) (( ˆ + (θ − E (Θ ˆ )) = var Θ ˆ + Eθ −Θ ˆ var θ − Θ )) 2 2 (3-60) ˆ + (bias )2 =: MSE = var Θ Je genauer eine Schätzfunktion ist (bias ist klein) und je reproduzierbarer eine Schätzfunktion ist (Varianz ist klein), desto kleiner ist () f Θ̂ n=200 der MSE. Konsistenz n=50 Es wird das Verhalten einer Schätzfunktion bei sich änderndem Stichprobenumfang n untersucht. Eine Schätzfunktion Θ̂ n wird als konsin=10 stent bezeichnet, wenn für jedes ε > 0 die { Wahrscheinlichkeit P θ − Θˆ n > ε } mit wach- n=5 sendem n gegen Null konvergiert. Eine Schätzfunktion ist insbesondere dann konsi- θ ← θ̂ ˆ Θ stent, wenn sie asymptotisch erwartungstreu ist und ihre Varianz gegen Null konvergiert. Abbildung 3.12: Wahrscheinlichkeitsfunktion einer Das heißt der bias und die Varianz streben konsistenten Schätzfunktion für wachsendes n gegen Null. 28 Methodische Grundlagen 3.1.5.4 Konstruktion von Schätzfunktionen Bei der Anwendung von Schätzfunktionen für normalverteilte Zufallsvariablen wird in Kapitel 3.1.5.6 gezeigt, dass der arithmetische Mittelwert eine geeignete Schätzfunktion zur Schätzung von normalverteilten Parametern ist. Zur Konstruktion von weiteren Schätzern bzw. zur Beschreibung der Prinzipien, wie solche Schätzer hergeleitet werden, sind die Momentenmethode, die Maximum-Liklihood-Methode und die Methode der kleinsten Quadrate zu nennen [20, 25]. 3.1.5.5 Punkt- und Intervallschätzung Bei der Schätzung von Parametern kann eine Zahl, bei mehrdimensionalen Parametern ein Vektor, oder ein Intervall bzw. ein Zahlenbereich geschätzt werden. Wird eine Zahl oder ein Vektor geschätzt spricht man von einer Punktschätzung, wird ein Intervall oder ein Zahlenbereich geschätzt von einer Intervallschätzung. Punktschätzung Aus den Ergebnissen der Stichprobeneinheiten wird mit Hilfe der Stichprobenfunktion eine Zahl, für mehrdimensionale Parameter ein Zahlenvektor berechnet, der den gesuchten Parameter der Grundgesamtheit beschreibt. Die Stichprobenfunktion liefert Schätzwerte für die Parameter der Grundgesamtheit. Jeder Schätzwert eines Parameters ist eine Punktschätzung für diesen Parameter. Für diskrete Merkmale ist die Wahrscheinlichkeit, dass eine Punktschätzung den „wahren Wert“ trifft, meist sehr klein. Für stetige Merkmale beträgt die Wahrscheinlichkeit Null, dass der Stichprobenparameter mit dem gesuchten Parameter in der Grundgesamtheit übereinstimmt. Es ist daher sinnvoll Angaben zur Genauigkeit einer Punktschätzung zu machen. Ein geeignetes Maß hierfür ist die Varianz bzw. die aus ihr abgeleitete Standardabweichung. Soll ein Parameter θ durch θˆ geschätzt werden, so kann die Standardabweichung des Schätzwertes σ θˆ , als Maß für die Genauigkeit herangezogen werden. Genau genommen müsste die Standardabweichung der Schätzfunktion σ Θ̂ als Maß für die Genauigkeit herangezogen werden, da nur für die Zufallsvariable σ Θ̂ der Erwartungswert und die Varianz definiert sind. Da die synonyme Verwendung von Schätzwert und Schätzfunktion weitverbreitete Konvention ist, werden die Begriffe hier ebenfalls synonym verwandt. Es wird ausdrücklich darauf hin- 29 Kapitel 3 gewiesen, dass der Schätzwert nicht als Realisation aus den Stichprobenergebnissen angesehen werden darf. Er ist mit der Unsicherheit σ θˆ behaftet. θˆ ± σ θˆ (3-61) Für erwartungstreue Schätzwerte gibt die Standardabweichung des Schätzwertes σ θˆ an, wie stark der Schätzwert vom wahren Wert θ abweicht. Ein anderer Weg, das Ergebnis der Schätzung eines Parameters anzugeben, besteht darin, dass ein Intervall berechnet wird, das den wahren Wert des Parameters mit einer bestimmten Wahrscheinlichkeit einschließt bzw. überdeckt. Bei Stichprobenuntersuchungen werden bevorzugt Vertrauensbereiche, sogenannte Konfidenzintervalle für die Ergebnisdarstellung benutzt. Intervallschätzung Bei der Intervallschätzung ist zu unterscheiden, ob Prognosen über die zukünftigen Realisationen von zufälligen Variablen zu treffen sind – was kann über das Eintreten von Extremwerten vorausgesagt werden - oder ob Schätzungen über unbekannte Parameter und Verteilungen zu treffen sind. Für die erst genannte Art der Intervallschätzung werden Prognoseintervalle aufgestellt, für die Schätzungen über unbekannte Parameter und Verteilungen werden Konfidenz- oder Vertrauensintervalle angegeben. Prognoseintervalle Ist X eine zufällige Variable, dann heißt jedes Intervall [a;b] ein (1-α) – Prognoseintervall, wenn gilt: P{a ≤ X ≤ b} ≥ 1 − α (3-62) Mit dem (1-α) – Prognoseintervall ist es möglich Wahrscheinlichkeitsaussagen über zukünftige Realisationen einer Zufallsvariablen X zu machen. Für die Messwerte, die beispielsweise aus einer Stichprobe gewonnen werden (Realisationen einer Zufallsvariablen), kann die Aussage getroffen werden, dass sie mit der Wahrscheinlichkeit 1-α im Intervall [a;b] liegen werden. Konfidenzintervalle Das Ziel einer Stichprobenuntersuchung ist es im Allgemeinen, möglichst genaue Aussagen über die gesuchten Parameter einer Grundgesamtheit (Beispiel: mittlerer Brennwert eines 30 Methodische Grundlagen Abfallgemisches) zu treffen. Im Gegensatz zu den Prognoseintervallen, die Wahrscheinlichkeitsaussagen über zukünftige Realisationen von Zufallsvariablen liefern, ist ein Konfidenzintervall eine Behauptung über einen unbekannten Parameter einer Grundgesamtheit. Nach dem Gesetz der Großen Zahlen liefern Konfidenzintervalle einen Anteil an richtigen Aussagen, der mindestens 1-α beträgt. Ein Konfidenzintervall ist um so genauer oder präziser, je kürzer es ist. Ein Konfidenzintervall ist um so sicherer oder verlässlicher, je länger bzw. höher sein Konfidenzniveau 1-α ist. Aufgrund dieser Dualität muss immer ein Kompromiss zwischen Genauigkeit und Sicherheit gefunden werden. Ein Punktschätzer ist sehr genau, aber vollkommen unsicher. Allgemein lassen sich Konfidenzintervalle nach folgendem Prinzip aus Prognoseintervallen konstruieren: Für die Zufallsvariable X, deren Verteilung vom gesuchten Parameter θ abhängt, berechnet man das Prognoseintervall a (θ ) ≤ X ≤ b(θ ) (3-63) Die Realisation von X sei x und liege im Prognoseintervall a(θ ) ≤ x ≤ b(θ ) (3-64) Wird nun die Ungleichung nach θ aufgelöst, so ergibt sich das Konfidenzintervall A( x ) ≤ θ ≤ B( x ) (3-65) Das Intervall [ A( X ); B ( X )] heißt Konfidenzintervall für θ zum Niveau 1 − α . Die aus einer Stichprobe geschätzten Parameter Summe und arithmetischer Mittelwert sind für Stichprobenumfänge > 30 in guter Näherung normalverteilte Zufallsvariablen (Kap. 3.1.4.3 Zentraler Grenzwertsatz). Damit ist die Verteilungsfunktion und die Wahrscheinlichkeitsdichtefunktion dieser Parameter bekannt. Die allgemein formulierten Gesetzmäßigkeiten der Schätztheorie werden nun für die Schätzung des arithmetischen Mittelwerts und seiner Varianz in endlichen und unendlichen Grundgesamtheiten näher betrachtet. 31 Kapitel 3 3.1.5.6 Schätzen in endlichen und unendlichen Grundgesamtheiten Die Summe und der arithmetische Mittelwert sind häufig gesuchte Parameter normalverteilter Grundgesamtheiten. Soll der Mittelwert in einer Untersuchung bestimmt werden, wird der Erwartungswert E ( X ) oder der „wahre Wert“ µ durch eine Schätzfunktion für den Mittelwert ˆ = X ( n ) geschätzt. Analog wird die Summe durch die Schätzfunktieiner Grundgesamtheit Θ ˆ = X ( n ) geschätzt. Die Schätzfunktionen für den arithmetischen Mittelwert und die on Θ Σ Summe einer Grundgesamtheit X ( n ) bzw. X Σ( n ) sind Zufallsvariablen und liefern über die Vorschrift x bzw. xΣ Realisationen für die Schätzwerte Xˆ bzw. X̂ Σ . Die Varianz gibt Auskunft über die Genauigkeit mit der eine Schätzfunktion den „wahren Wert“ einer Grundgesamtheit trifft. Die Varianz ist für Grundgesamtheiten im Allgemeinen ebenfalls nicht bekannt und muss aus der Stichprobe geschätzt werden. Dabei ist sowohl die Varianz der Zufallsvariablen X als auch die Varianz der Schätzfunktion X (n ) von Interesse. Grundsätzlich muss zwischen Schätzen in endlichen Grundgesamtheiten und Schätzen in unendlichen Grundgesamtheiten unterschieden werden. Schätzen in endlichen Grundgesamtheiten Ist ς eine endliche Grundgesamtheit mit N Elementen und trägt jedes Element eine Ausprägung z eines Merkmals X, dann ist die Gesamtheit aller Ausprägungen in ς Ω = {X 1 , X 2 ,..., X N } = {z1 , z 2 ,..., z N } wobei: (3-66) Ω: Grundgesamtheit X: Merkmal in der Grundgesamtheit z: Ausprägung des Merkmals X Die gemeinsame Wahrscheinlichkeitsverteilung bei der Ziehung von n Stichproben aus ς ohne Zurücklegen ist: P( X 1 = z i1 ; X 2 = z i 2 ;...; X n = z in ) = 1 N ! n!⋅( N − n ) (3-67) Für die Schätzung des arithmetischen Mittelwertes und der Varianz in endlichen Grundgesamtheiten gelten folgende Beziehungen: 32 Methodische Grundlagen Parameter arithm. Mittelwert Varianz Schätzfunktion/Schätzwert ( ) X= 1 N X i = X (N ) ∑ N i=1 S2 = 1 N (X i − X )2 ∑ N − 1 i=1 ( ) = S (N ) 2 = Var( X ) 1 2 N −n =0 ⋅S ⋅ N −1 N = Var (X ) S X2 = wobei: X (n ) = 1 n X i = Xˆ ∑ n i =1 S (n ) = 1 n X i − X (n ) ∑ n − 1 i =1 2 Stichprobenfkt./ Schätzwert x̂ = ( ) 2 1 n ( x i − x )2 = s 2 ∑ n − 1 i =1 = var(x ) ŝ 2 = = Ŝ 2 = var( X ) (S ( ) ) ( ) 1 ⋅ S (n ) n = Ŝ X2ˆ = var Xˆ n X 2 = () 2 ⋅ N −n N −1 1 n ∑ xi = x n i =1 1 2 N −n = s x2 ⋅ ŝ ⋅ N −1 n = var( x ) ŝ X2ˆ = X wahrer Mittelwert der endlichen Grundgesamtheit (auch X ( N ) ) S2 wahre Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit ( ) (auch S ( N ) ) 2 S X2 wahre Varianz des Mittelwertes X in der endlichen Grundgesamtheit X (n ) Schätzfunktion für den Mittelwert in der endlichen Grundgesamtheit S (n ) Schätzfunktion für die Varianz der Einzelwerte (Zufallsvariable X) in der endlichen Grundgesamtheit 2 (S ( ) ) n X 2 Schätzfunktion für die geschätzte Varianz des geschätzten Mittelwertes (Zufallsvariable X (n ) ) in der endlichen Grundgesamtheit Xˆ Schätzwert für den Mittelwert in der endlichen Grundgesamtheit; Schätzwert ist Zufallsvariable x̂ Schätzwert für den Mittelwert in der endlichen Grundgesamtheit; Schätzwert ist Realisation Ŝ 2 Schätzwert für die Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit; Schätzwert ist Zufallsvariable ŝ 2 Schätzwert für die Varianz der Einzelwerte Xi in der endlichen Grundgesamtheit; Schätzwert ist Realisation Ŝ X2ˆ Schätzwert für die Varianz des geschätzten Mittelwertes in der endlichen Grundgesamtheit; Schätzwert ist Zufallsvariable ŝ X2ˆ Schätzwert für die Varianz des geschätzten Mittelwertes in der endlichen Grundgesamtheit; Schätzwert ist Realisation 33 Kapitel 3 s2 Varianz der Stichprobenergebnisse xi s X2 Varianz des Stichprobenmittelwertes x N Anzahl der Untersuchungseinheiten in der Grundgesamtheit n Anzahl der gezogenen Stichprobeneinheiten Der Term N − n wird als Endlichkeitskorrektur bezeichnet. Die Endlichkeitskorrektur verkleiN −1 nert die Varianz des geschätzten Mittelwertes. Untersucht man alle Einheiten einer Grundgesamtheit, so ergibt sich für die Endlichkeitskorrektur N − n = 0 . Eine Varianz des geschätzN −1 ten Mittelwertes ist dann nicht vorhanden. Oder anders ausgedrückt, es gibt keine Unsicherheit über den geschätzten Mittelwert. Für n<<N strebt die Endlichkeitskorrektur gegen 1 und kann vernachlässigt werden. Schätzen in unendlichen Grundgesamtheiten Ist ς eine unendliche Grundgesamtheit, dann ist die Gesamtheit aller Ausprägungen in ς Ω=ℜ wobei: (3-68) Ω: Grundgesamtheit ℜ: Reelle Zahlen Die gemeinsame Wahrscheinlichkeitsverteilung bei der Ziehung von n Stichproben aus ς ist: P( X ≤ x ) = Fx ( x ) für n=1 bzw. {X 1 , X 2 ,...X n } ~ i i d für n>1 (3-69) Für die Schätzung des arithmetischen Mittelwertes und der Varianz in unendlichen Grundgesamtheiten gelten folgende Beziehungen: 34 Methodische Grundlagen Parameter arithm. Mittelwert Varianz Schätzfunktion/Schätzwert 1 n µ = E ( X ) = lim ⋅ ∑ X i n →∞ n i =1 σ 2 = E( X − µ ) 2 ( n 1 ⋅ ∑ X i − X (n ) n→∞ n − 1 i =1 = lim 1 ⋅σ 2 = 0 N σ µ2 = X (n ) = 1 n X i = Xˆ = µ̂ ∑ n i=1 S (n ) = 1 n X i − X (n ) ∑ n − 1 i=1 2 ) 2 ( x̂ = ) = Ŝ 2 = σˆ 2 = var( X ) (S ( ) ) n X 2 ( ) 1 = ⋅ S (n ) n 2 () = Ŝ X2ˆ = σˆ X2ˆ = var Xˆ wobei: Stichprobenfkt./ Schätzwert 2 1 n ∑ xi = x n i=1 1 n (xi − x )2 = s 2 ∑ n − 1 i=1 = var(x ) ŝ 2 = 1 ŝ X2ˆ = ⋅ σˆ 2 = s x2 n = var( x ) µ wahrer Mittelwert der unendlichen Grundgesamtheit σ2 wahre Varianz der Einzelwerte Xi in der unendlichen Grundgesamtheit σ µ2 wahre Varianz des Mittelwertes µ in der unendlichen Grundgesamtheit X (n ) Schätzfunktion für den Mittelwert in der unendlichen Grundgesamtheit S (n ) Schätzfunktion für die Varianz der Einzelwerte (Zufallsvariable X) in der unendlichen Grundgesamtheit 2 (S ( ) ) n X 2 Schätzfunktion für die geschätzte Varianz des geschätzten Mittelwertes (Zufallsvariable X (n ) ) in der unendlichen Grundgesamtheit Xˆ Schätzwert für den Mittelwert in der unendlichen Grundgesamtheit (auch µ̂ ); Schätzwert ist Zufallsvariable x̂ Schätzwert für den Mittelwert in der unendlichen Grundgesamtheit; Schätzwert ist Realisation Ŝ 2 Schätzwert für die Varianz der Einzelwerte Xi in der unendlichen Grundgesamtheit (auch σ̂ 2 ); Schätzwert ist Zufallsvariable ŝ 2 Schätzwert für die Varianz der Einzelwerte Xi in der unendlichen Grundgesamtheit; Schätzwert ist Realisation Ŝ X2ˆ Schätzwert für Varianz des geschätzten Mittelwertes in der unendlichen Grundgesamtheit (auch σ̂ X2ˆ ); Schätzwert ist Zufallsvariable ŝ X2ˆ Schätzwert für Varianz des geschätzten Mittelwertes in der unendlichen Grundgesamtheit; Schätzwert ist Realisation 35 Kapitel 3 Die Ergebnisse einer Schätzung werden häufig in Form von Konfidenzintervallen angegeben. Für unendliche Grundgesamtheiten kann von iid-verteilten Zufallsvariablen und bei hinreichend großen Stichprobenumfängen (n > 30) von normalverteilten Schätzparametern ausgegangen werden. Für endliche Grundgesamtheiten gelten die Verteilungsannahmen näherungsweise, wenn N groß und n > 30 aber im Verhältnis zu N klein ist (n<<N). Dabei wird die Wahrscheinlichkeitsdichte-Funktion der standardisierten Normalverteilung zur Bestimmung der Intervallgrenzen herangezogen. Die mathematische Beschreibung und die Eigenschaften der Wahrscheinlichkeitsdichte-Funktion der Normalverteilung sind in Kapitel 3.1.3.2 beschrieben. Für die Angabe eines Konfidenzintervalls werden die Intervallgrenzen τ U und τ O so bestimmt, dass der gesuchte Parameter µ mit einer bestimmten Wahrscheinlichkeit 1-α überdeckt wird. Die Wahrscheinlichkeit 1-α wird Konfidenzniveau oder Sicherheitsgrad genannt. α gibt bei einseitigen Konfidenzintervallen (bzw. jeweils α/2 bei zweiseitigen Konfidenzintervallen) die Irrtumswahrscheinlichkeit an. Zur Berechnung der Intervallgrenzen sind weiterhin sogenannte Konfidenzkoeffizienten bzw. 1-α-Quantile erforderlich. Dabei wird das Quantil u1-α/2 für die Berechnung der zweiseitigen Intervallgrenzen für die Normalverteilung und das Quantil t1−α für t-Verteilung verwendet. 2 ; n −1 Jedem beliebigen Sicherheitsgrad 1-α ist ein Koeffizient u1-α/2 bzw. t1−α 2 ; n −1 zugeordnet. Nor- malverteilte Zufallsvariable mit beliebigem Erwartungswert und beliebiger Varianz lassen sich durch Standardisierung in Zufallsvariable mit dem Erwartungswert 0 und der Varianz 1 umformen: X* = X −µ σ (3-70) ( ) X* ist eine standardnormalverteilte Zufallsvariable. Die N µ ; σ 2 -verteilte Zufallsvariable X geht über in die N(0;1)-verteilte Zufallsvariable X*. Multiplikation der Konfidenzkoeffizienten mit der Standardabweichung der geschätzten Parameter und Verschiebung um den Erwartungswert der geschätzten Parameter führt zu den gesuchten Intervallgrenzen. 36 Methodische Grundlagen f N {x / µ ;σ 2 } α/2 1-α τu -u1-α/2 µ 0 α/2 τo +u1-α/2 x Abbildung 3.13: Darstellung von Konfidenzintervallen Konfidenzintervalle für µ bei bekanntem σ2 Für die Berechnung von Konfidenzintervallen bei bekanntem σ2 (gilt für n > 30 oder Grundgesamtheit normalverteilt) gilt: σ σ ⎫ ⎧ P ⎨ Xˆ − u1−α 2 ⋅ ≤ µ ≤ Xˆ + u1−α 2 ⋅ ⎬ = 1−α n n⎭ ⎩ (3-71) Der wahre Wert µ in der Grundgesamtheit wird vom angegebenen Intervall mit der Wahrscheinlichkeit 1-α überdeckt. Der Parameter µ liegt mit einer Wahrscheinlichkeit von 1-α innerhalb der angegebenen Intervallgrenzen. Konfidenzintervalle für µ bei unbekanntem σ2 Die Varianz der Grundgesamtheit σ2 ist bei Stichprobenuntersuchungen im Allgemeinen nicht bekannt. Für die Berechnung von Konfidenzintervallen bei unbekanntem σ2 wird bei der Bestimmung von Konfidenzintervallen die Varianz der Stichprobenergebnisse s2 geschätzt: σˆ 2 = s 2 (3-72) In diesem Fall müssen zur Berechnung des Konfidenzintervalls die t-Verteilung und die zugehörigen Quantile t1−α 2 ; n −1 herangezogen werden. Das Konfidenzintervall berechnet sich nach Gleichung 3-73. s ⎫ s ⎧ ≤ µ ≤ Xˆ + t1−α 2;n −1 ⋅ P ⎨ Xˆ − t1−α 2;n −1 ⋅ ⎬ = 1 −α n⎭ n ⎩ (3-73) Ab einem Stichprobenumfang von n > 30 lässt sich die t-Verteilung durch die Normalverteilung approximieren und es können die Quantile u1-α/2 verwendet werden. 37 Kapitel 3 3.1.6 Modellbildung Ein real existierender, meist komplexer Sachverhalt (in der vorliegenden Arbeit ein Stoffsystem oder ein Probenahmevorgang) wird durch ein Modell so einfach wie möglich aber so gut wie nötig abgebildet. Das Modell soll ein unverzerrtes, unverfälschtes und unvoreingenommenes Bild der Wirklichkeit beschreiben. Im Modell werden die benötigten Definitionen, die Systemgrenzen und bestehende Abhängigkeiten beschrieben. In das Modell fließt das Vorwissen über den Sachverhalt ein. Es ignoriert weder relevante Tatsachen noch werden Folgerungen aus dem Modell zugelassen, die nicht durch Tatsachenwissen abgedeckt sind. Das Modell muss für eine klare mathematische Beschreibung einfach genug sein. Ob ein Modell wahr ist kann meist nicht abschließend beurteilt werden. Daher ist es besser die Frage zu beantworten, ob ein Modell brauchbar und plausibel ist. Ein Modell ist nicht brauchbar, wenn mit dem verfügbaren mathematischen Apparat und den gegebenen Beobachtungen in der vorhandenen Zeit keine verwendbaren Resultate erzielt werden können. 3.2 Grundlagen der Probenahme 3.2.1 Einführung Die grundlegende Aufgabe von Probenahme ist es, eine Ausgangsmenge (statistischer Begriff: Grundgesamtheit), die in ihrer Gesamtheit aus ökonomischen und/oder technischen Gründen nicht vollständig untersucht werden kann, so zu reduzieren, dass aus der gewonnenen Teilmenge (statistischer Begriff: Stichprobe) zuverlässige Aussagen über die Ausgangsmenge gewonnen werden können. Allgemein formuliert, stellt die Stichprobe einen Ausschnitt aus der Wirklichkeit dar und erlaubt einen Blick auf die Gesamtheit. Die Probenahme ist ein (Auswahl-)Prozess, der aus einer Grundgesamtheit eine bestimmte Teilmenge (Anzahl an Elementareinheiten, eine Masse, ein Volumen) nach einer festgelegten Auswahlvorschrift entnimmt. Für Stoffsysteme muss der Auswahl immer ein Teilungsprozess vorweggehen. Für die ausgewählte Teilmenge wird das interessierende Merkmal (Untersuchungsmerkmal) untersucht. Der Probenahmevorgang ist abhängig von der Zielstellung der Untersuchung und der Beschaffenheit oder Struktur der Grundgesamtheit. Die Beschaffenheit oder auch die Struktur einer Grundgesamtheit wird für Stoffsysteme mit den Begriffen Heterogenität oder Homogenität beschrieben. Auf den Begriff der Heterogenität wird in Kapitel 3.3.1 näher eingegangen. Beschaffenheit oder Struktur einer Grundgesamtheit, für Stoffsysteme die Heterogenität, ist 38 Methodische Grundlagen damit zugleich eine wesentliche und unvermeidbare Ursache für die Entstehung von Stichprobenfehler. Um den Prozess der Probenahme in seiner Komplexität beschreiben zu können, muss auf die Entwicklung von Modellen zurückgegriffen werden. Dabei soll das Modell die Realität so gut wie möglich abbilden. Bei Untersuchungen auf Stichprobenbasis sind folgende Aufgaben zu bewältigen. Übersetzung der Realität in ein Modell Auswertung der Daten innerhalb des Modells Rückübersetzung der Modellergebnisse in die Realität Es müssen sowohl für die Probenahme als auch für die Hochrechnung oder auch die Schätzung Modellannahmen getroffen werden. Zunächst wird ausführlich auf das Modell der Probenahme eingegangen. Die Rückübersetzung der Modellergebnisse d. h. die Hochrechnung der Stichprobenergebnisse auf die Grundgesamtheit oder auch die Schätzung der „wahren“ Parameter in der Grundgesamtheit hängen eng mit dem ausgewählten Probenahmeverfahren zusammen. Das Modell der Hochrechnung wird in Kapitel 3.2.3 behandelt. Um den gesamten Probenahmevorgang modellieren zu können, muss sowohl die Struktur und Beschaffenheit der Grundgesamtheit als auch der Auswahlvorgang beschrieben werden. Im allgemeingültigen Fall wird davon ausgegangen, dass zwischen den Elementareinheiten einer Grundgesamtheit ein Zusammenhang oder auch eine Ordnung besteht. Das bedeutet, die Elementareinheiten untereinander sind abhängig oder auch korreliert und ihre räumliche und/oder temporäre Lage ist von Bedeutung. Für Stoffsysteme – und dazu gehören heterogene Abfälle und Abfallgemische - trifft dies im Allgemeinen zu. Liegen für die Stichprobenahme bereits klar abgegrenzte Untersuchungseinheiten vor, wie z. B. Gemeinden, Haushalte, Glühbirnen einer Produktionsserie, Müllbehälter u. ä. und sind die Untersuchungseinheiten bezüglich ihres Untersuchungsmerkmals nicht korreliert, kann die Betrachtung einer Grundgesamtheit höherer Ordnung entfallen. Das Modell kann entsprechend vereinfacht werden. Es muss nur der Auswahlvorgang betrachtet werden. Weiterhin gilt es zu entscheiden, ob das Modell besser mit diskreten oder stetigen Merkmalen beschrieben werden kann. Im Stichprobenmodell sind diese Merkmale diskrete oder stetige Zufallsvariablen. Besteht die Grundgesamtheit aus einer endlichen Anzahl N von Elementareinheiten U i und sind diese Einheiten untereinander nicht korreliert, kann das diskrete Modell angenommen werden. Strebt die Anzahl der Elementareinheiten U i gegen Unendlich oder liegt eine Ordnung der Elementareinheiten vor, d. h. die Lage der Elementareinhei- 39 Kapitel 3 ten U i in Raum und Zeit ist zu beachten, ist zur Beschreibung der Probenahme möglicherweise ein stetiges Modell vorzuziehen. Raum und Zeit sind stetige Größen und die Elementareinheiten einer korrelierten Grundgesamtheit können über stetige Funktionen (zur Beschreibung der Autokorrelation) in Zusammenhang gebracht werden. Ein stetiges Modell eignet sich oft besser zur mathematischen Beschreibung eines Sachverhaltes. Diskrete Verteilungsfunktionen können durch stetige approximiert werden. 3.2.1.1 Abgrenzung des Probenahmebegriffes Übergeordnet betrachtet ist Probenahme ein Teilprozess innerhalb einer Untersuchung oder auch einer Datenerhebung. Ziel des gesamten Prozesses der Datenerhebung ist es, Informationen über einen realen Sachverhalt zu gewinnen. Zur vollständigen Beschreibung eines Probenahmeverfahrens muss die gesamte Untersuchung (Probenahme, Aufbereitung der gewonnenen Probe, Analyse der Probe, Auswertung der Analysenergebnisse und Rückschluss der Stichprobenergebnisse auf die Grundgesamtheit) betrachtet werden. Die wesentlichen Schritte einer Datenerhebung sind Abbildung 3.14 zu entnehmen. Stichprobenuntersuchung 1. Festlegung des Untersuchungsziels 2. Abgrenzung der Grundgesamtheit 3. Festlegung der zu erhebenden Merkmale 4. Festlegung der notwendigen Genauigkeit (vereinbar mit Untersuchungsziel) 5. Festlegung der Messmethoden und Analyseverfahren 6. Erstellung einer Auswahlgrundlage 7. Festlegung des Auswahlverfahrens 8. Praktische Durchführung der Probenahme 9. Auswertung der Stichprobendaten 10. Rückschluß (Hochrechnung) auf die Grundgesamtheit Abbildung 3.14: Schema einer Stichprobenuntersuchung 40 Methodische Grundlagen Unter Probenahme versteht man die Entnahme einer oder mehrerer Teilproben aus einer Grundgesamtheit. Die Probenahme umfasst alle Auswahl- und Aufbereitungsschritte von der Entnahme einer „Primärstichprobe“ (= erster Zugriff auf die Grundgesamtheit) bis zur Übergabe einer Probenmenge für die Analyse. Aus der Analysenprobe wird das Untersuchungsmerkmal bestimmt. Die Analysenprobe darf keinen weiteren Teilungs- und Auswahlschritten mehr unterliegen. Alle erforderlichen Aufbereitungsschritte bis zur Analysenprobe, wie z. B. Mischen, Trennen (Klassieren, Sortieren), Zerkleinern und Agglomerieren gehören zur Probenahme. Aufbereitungsschritte, die mit der Probemenge zur Analyse durchgeführt werden, gehören zur Analyse. In Abbildung 3.15 ist die Abgrenzung des Probenahmevorganges schematisch dargestellt. Grundgesamtheit ..... 1. Auswahlstufe Probenahme Primärprobe 1. Aufbereitungsstufe ..... Sekundärprobe 2. Auswahlstufe 2. Aufbereitungsstufe . . . . . . ..... Analyse Analyseprobe Q. Auswahlstufe Q. Aufbereitungsstufe Analyse der Probe Abbildung 3.15: Abgrenzung des Probenahmevorganges 3.2.1.2 Probenahmeplan und Probenahmekriterien Nachdem die Probenahme im Kontext einer Untersuchung eingeordnet und der Probenahmevorgang klar abgegrenzt wurde, wird nun auf die Probenahme selbst näher eingegangen. Der erste Schritt einer Probenahme besteht in der Entwicklung und Festlegung des Probenahmeplans. Der Probenahmeplan wird aus den Untersuchungszielen und den verfügbaren 41 Kapitel 3 Vorinformationen entwickelt. Es werden die grundlegenden Kriterien für eine repräsentative, zuverlässige und wirtschaftliche Probenahme beachtet und eingehalten. Abbildung 3.16 ist die Stellung der Probenahmeplanung im Untersuchungsablauf zu entnehmen [22]. 1. Untersuchungsziele definieren 2. Verfügbare Vorinformationen zusammenstellen 3. Probenahmeplan festlegen (Probenahmekriterien) 4. Probenahme 5. Analyse 6. Auswertung und Hochrechnung; Prüfung ob Untersuchungsziele erreicht wurden Abbildung 3.16: Probenahmeplanung im Untersuchungsablauf Zur Aufstellung des Probenahmeplans müssen folgende Fragstellungen beantwortet und Kriterien beachtet werden: 1. Kann mit der geplanten Probenahme das angestrebte Wissen gewonnen werden? Repräsentativität: Liefert die Probenahme ein gutes Abbild der Grundgesamtheit oder ist mit Verzerrungen oder Über- bzw. Unterschätzungen zu rechnen? Suffizienz: Wird die verfügbare Vorinformation ausgeschöpft? D. h. werden alle Parameter erfasst? Ist die Probengröße ausreichend für die Schätzung von Mittelwert und Varianz? Lassen sich Aussagen über räumliche und zeitliche Schwankungen treffen? Indikativität: Erlauben Probenahme und Analyse den Nachweis signifikanter Grenzwertüberschreitungen? Sind die Summenparameter indikativ? 2. Sind die Ergebnisse vertrauenswürdig? Reliabilität: Werden Probenahme-, Aufbereitungs- und Analysefehler quantifiziert? Können Störeinflüsse bei der Entnahme, dem Transport und der Lagerung der Proben ausgeschlossen werden? 42 Methodische Grundlagen Validität: Ist die Anzahl der erhobenen Parameter ausreichend? Wurden alle relevanten Störvariablen erfasst? 3. Kann das angestrebte Wissen mit geringerem Aufwand gewonnen werden? Ökonomie: Kann eine Vollerhebung durch eine Teilerhebung ersetzt werden? Ist die gewählte Probenahmemethode (zufällig, geschichtet systematisch) die effizienteste? Wird nur der notwendige Stichprobenumfang erhoben? Um die Probenahmekriterien nicht nur qualitativ beschreiben zu können, sondern sie auch quantitativ nachprüfbar zu machen, wird nachfolgend auf die Fehler einer Stichprobenuntersuchung näher eingegangen. Dabei muss zwischen systematischen und zufälligen Fehlern unerschieden werden. Systematische Fehler sind im Allgemeinen schwer zu quantifizieren, da sie oftmals nicht erkannt werden. Hier muss im Vorfeld der Probenahme alles unternommen werden um systematische Fehler zu vermeiden. Der zufällige Stichprobenfehler oder auch der fundamentale Fehler einer Stichprobenuntersuchung hingegen ist nicht zu vermeiden, kann aber quantifiziert werden (vergl. Kapitel 3.1.5.3 Wirksamkeit und Effizienz von Schätzfunktionen). Über die Fehlerbetrachtung lassen sich die Probenahmekriterien nachprüfen. Mit dem Probenahmeplan wird die Grundlage für die erfolgreiche Durchführung einer Probenahme geschaffen. 3.2.1.3 Fehler einer Stichprobenuntersuchung Mathematisch kann der gesamte Fehler einer Stichprobenuntersuchung als Abweichung von wahrem Wert und Schätzwert über das varianzanalytische Modell ausgedrückt werden. µˆ = µ + ε U (3-74) Für den Fehler einer Stichprobenuntersuchung, der sich aus dem Probenahmefehler und dem Analysefehler zusammensetzt gilt dann: ε U = ε S total + ε A wobei: εU : (3-75) ε S total : gesamter Fehler der Stichprobenuntersuchung (Probenahmefehler und Analysefehler) gesamter Probenahmefehler εA: Analysefehler Für mehrstufige Auswahlverfahren berechnet sich der gesamte Fehler der Stichprobenuntersuchung zu: εU = ∑ ε S total ,i + ε A (3-76) i 43 Kapitel 3 Wird zwischen dem systematischen Fehler, der durch praktische Ausführung der Probenahme und die Aufbereitungsschritte verursacht wird, und dem zufälligen Fehler, der durch den Auswahlschritt verursacht wird, unterschieden, gilt für den Fehler der gesamten Stichprobenuntersuchung: ε U = ∑ (ε s ,i + ε m ,i ) + ε A (3-77) i wobei: εs : εm : zufälliger Stichprobenfehler systematischer Fehler, der auf die praktische Ausführung der Probenahme und Aufbereitung zurückzuführen ist Der systematische Fehler kann nach Gleichung 3-58 als die Abweichung des „wahren Wertes“ vom Erwartungswert berechnet werden. ε m = µ − E (µˆ ) (3-78) Da der „wahre Wert“ µ in den meisten Fällen unbekannt ist, kann auch der systematische Fehler nicht bestimmt werden. Die Beziehung eignet sich zur Validierung eines Probenahmeverfahrens mit bekannten Parametern der Grundgesamtheit. Der zufällige Fehler wird für normalverteilte Zufallsvariable nach Gleichung (3-60) über die Varianz des Schätzwertes var (µ̂ ) bestimmt. Die Varianz ist ein Maß für den zufälligen Stichprobenfehler. ε s = var (µˆ ) = σ µˆ (3-79) Die Standardabweichung des Schätzwertes wird als der Standardfehler der Stichprobe bezeichnet. Wird die Standardabweichung des Schätzwertes auf den Erwartungswert bezogen erhält man den relativen Standardfehler. Der relative Standardfehler wird auch als Variationskoeffizient des Schätzwertes Varkoeff (µ̂ ) bezeichnet. ε s ,rel = var koeff (µˆ ) = σ µˆ E (µˆ ) (3-80) Auf die Fehlerbetrachtung der Stichprobenahme, insbesondere auf die Betrachtung des systematischen Fehlers, verursacht durch die praktische Ausführung der Probenahme und Aufbereitung wird ausführlicher in Kapitel 4.1.3 eingegangen. Aufbauend auf der allgemeinen Erörterung des Probenahmefehlers und der Quantifizierung des systematischen und zufälligen Anteils wird nun der in der Stichprobenahme häufig verwendete aber selten anhand nachprüfbarer Kriterien definierte Begriff der Repräsentativität eingeführt. 44 Methodische Grundlagen Repräsentativität Eine Stichprobe ist dann repräsentativ, wenn sie reproduzierbar und genau ist. Ob ein Stichprobenverfahren repräsentativ ist lässt sich quantitativ über die Berechnung des mittleren quadratischen Fehlers (MSE) prüfen. In Kapitel 3.1.5.3 wurde als geeignetes Prüfkriterium für die Güte einer Stichprobe der MSE eingeführt. Kann der Erwartungswert der mittleren quadratischen Abweichung minimiert werden oder anders ausgedrückt, bleibt der mittlere quadratische Fehler unterhalb einer vorgegebenen zulässigen Schranke, kann die Stichprobe als repräsentativ angesehen werden. Zunächst wird dazu der MSE (µ̂ ) in den systematischen und den zufälligen Fehleranteil zerlegt. 2 MSE (µˆ ) = E (µˆ − µ ) 2 = E[(µˆ − E (µˆ )) + (E (µˆ ) − µ )] (3-81) = E (µˆ − E (µˆ )) + 2 ⋅ (E (µˆ ) − µ ) ⋅ E (µˆ − E (µˆ )) + (E (µˆ ) − µ ) 2 da E (µˆ − E (µˆ )) = 0 2 folgt 2 2 MSE (µˆ ) = E (µˆ − E (µˆ )) + (E (µˆ ) − µ ) (3-82) Nach Gleichung 3-11 und 3-58 lässt sich schreiben: 2 MSE (µˆ ) = var (µˆ ) + (bias ) (3-83) Werden als tolerierbare Grenzen für die Varianz und die Verzerrung folgende Kriterien eingeführt, S 02 (ε ) : obere zulässige Grenze für die Varianz var (µ̂ ) b02 (ε ) : obere zulässige Grenze für die Verzerrung (bias ) 2 wird die Stichprobe als repräsentativ bezeichnet, wenn gilt: var (µˆ ) < S02 (ε ) und (bias ) < b02 (ε ) 2 (3-84) Die Probenahme aus realen Grundgesamtheiten ist immer ein fehlererzeugender Prozess. Mit den Informationen, die aus einer Stichprobe gewonnen werden (Analysenergebnisse), kann keine exakte Beschreibung der Eigenschaften einer realen Grundgesamtheit vorgenommen werden. Dies ist auf die Struktur oder auch Beschaffenheit realer Grundgesamtheiten zurückzuführen. 45 Kapitel 3 Für die Praxis der repräsentativen Stichprobenahme bedeutet dies: Für Stoffsysteme darf die mittlere Teilchenverteilung, bestimmt durch ihre physikalischen Eigenschaften wie z. B. die Größe, die Form, die Oberfläche und die Dichte der Teilchen, durch den Probenahmevorgang nicht bzw. so wenig wie möglich verändert werden. Eine weitere wichtige Größe einer Stichprobenahme ist der notwendige Stichprobenumfang. Der notwendige Stichprobenumfang kann nur bestimmt werden, wenn der Stichprobenfehler aus Voruntersuchungen quantifizierbar ist oder abgeschätzt werden kann. Nur ein ausreichender Stichprobenumfang garantiert, dass das gewünschte Wissen erreicht wird, die Ergebnisse zuverlässig sind und die Stichprobe wirtschaftlich ist. Notwendiger Stichprobenumfang Ziel einer Stichprobenuntersuchung ist es, die Parameter der Grundgesamtheit ausreichend genau zu schätzen. Eine übergenaue Schätzung verursacht unnötige Kosten, da die Anzahl an Stichprobeneinheiten in der Regel maßgeblich die Kosten einer Stichprobenuntersuchung bestimmt. Hingegen führt eine zu ungenaue Schätzung dazu, dass das Ergebnis für einen vorgesehenen Zweck (Entscheidungsgrundlage) nicht wie geplant herangezogen werden kann oder gar unbrauchbar wird. Es handelt sich letztlich bei der Festlegung des notwendigen oder auch optimalen Stichprobenumfangs um eine Optimierungsaufgabe. Bei der Ermittlung des optimalen Stichprobenumfangs einer Untersuchung muss zuerst die Genauigkeitsanforderung an die zu erzielenden Ergebnisse festgelegt werden. Genauigkeitsanforderung Die Genauigkeitsanforderung wird entsprechend der geforderten Untersuchungsqualität vor der Untersuchung festgelegt. Die Genauigkeitsanforderung an ein Messergebnis besagt nichts anderes, als dass der aus den Stichprobenergebnissen ermittelte Parameter (auch Schätzparameter) um höchstens den Betrag ε0 mit der Vertrauenswahrscheinlichkeit 1-α vom wahren Wert der Grundgesamtheit abweichen darf. Wird als Parameter der arithmetische Mittelwert betrachtet, ergibt sich: Xˆ − µ ≤ ε 0 u1−α 2 wobei: ε0 : (3-85) absolute Genauigkeitsanforderung an ein Messergebnis Unter der Annahme, dass die Schätzfunktion erwartungstreu ist und damit der bias entfällt, kann die Genauigkeit über die Varianz des geschätzten Mittels ausgedrückt werden. Werden die Beziehungen in Gleichung 3-81 eingesetzt, so ergibt sich: 46 Methodische Grundlagen ) ( 2 E Xˆ − µ = var Xˆ (3-86) 2 var Xˆ ≤ (ε 0 u1 −α 2 ) (ˆ ) Wird nun in Gleichung 3-86 anstelle der Varianz des arithmetischen Mittelwerts var X die Varianz der Einzelwerte var ( xi ) eingesetzt und die Gleichung nach n0 umgeformt, lässt sich die Mindestprobenanzahl berechnen. ⎛ var ( xi ) ⋅ u 1−α 2 ⎞ ⎟ n0 ≥ ⎜ ⎜ ⎟ ε 0 ⎝ ⎠ 2 n0 : Mindestprobenanzahl (3-87) Zur Ermittlung des erforderlichen Stichprobenumfanges muss also die Varianz der Einzelwerte bekannt und die zulässige Abweichung des Mittelwertes vom wahren Wert festgelegt werden. Die zulässige Abweichung kann auch als relative Genauigkeitsanforderung formuliert werden. ε0 wird dann als prozentuale Abweichung ε0,rel festgelegt. Die Varianz der Einzelwerte wird durch die relative Größe, den Variationskoeffizienten ersetzt. Die Mindestprobenanzahl berechnet sich dann zu: ⎛ varkoeff ( xi ) ⋅ u 1−α 2 ⎞ ⎟ n0 ≥ ⎜⎜ ⎟ ε 0 ,rel ⎝ ⎠ wobei: ε 0 ,rel : 2 (3-88) relative Genauigkeitsanforderung an ein Messergebnis Bei der Festlegung des notwendigen Stichprobenumfangs ist das interessierende Merkmal meist unbekannt. Das interessierende Merkmal muss entweder in einer Voruntersuchung ermittelt oder nach unten abgeschätzt werden. Bei einer Abschätzung nach unten dürfen für Θ nur Werte eingesetzt werden, die nicht größer als die zu erwartenden Werte des Parameters Θ sind. Die Ermittlung des notwendigen Stichprobenumfangs hängt vom eingesetzten Stichprobenverfahren ab. Die Ermittlung des Stichprobenumfangs wurde aus Gründen des einfacheren Verständnisses für die einfache Zufallsauswahl eingeführt. Die weitergehenden Stichprobenverfahren führen im Allgemeinen zu einer Varianzreduktion, d. h. die Ermittlung des Stichprobenumfangs bei der einfachen Zufallsauswahl kann als obere Schranke oder maximal notwendiger Stichprobenumfang angesehen werden. 47 Kapitel 3 3.2.2 Stichprobenverfahren Die Stichprobenverfahren oder auch Auswahlverfahren können generell in zufällige Auswahlverfahren und nichtzufällige Auswahlverfahren eingeteilt werden. Zufällige Auswahlverfahren sind dadurch gekennzeichnet, dass alle Elementareinheiten einer Grundgesamtheit eine angebbare und – in endlichen Grundgesamtheiten - von Null verschiedene Wahrscheinlichkeit besitzen, ausgewählt zu werden. Für nichtzufällige Auswahlverfahren trifft dies nicht zu. In den folgenden Kapiteln werden die Stichprobenverfahren für endliche Grundgesamtheiten beschrieben. Die Stichprobenverfahren lassen sich damit auch für Merkmale aus unendlichen Grundgesamtheiten (das weniger anspruchsvolle Modell) anwenden. 3.2.2.1 Nichtzufällige Auswahlverfahren Zu den nichtzufälligen Auswahlverfahren zählen die bewussten Auswahlverfahren wie z. B. die Auswahl „typischer“ Fälle, die Auswahl nach dem Konzentrationsprinzip und die Quotenauswahl [25]. Sie werden vorwiegend in der Markt- und Meinungsforschung eingesetzt und dort auch Beurteilungsstichproben genannt. Über Kenntnisse zur Struktur der Grundgesamtheit wird versucht eine repräsentative Auswahl zu treffen. Die Vorteile liegen in der einfacheren Planung und der kostengünstigeren Umsetzung. Für nichtzufällige Auswahlverfahren existiert keine mathematisch/statistische Grundlage zur Berechnung von Stichprobenfehlern und Schätzwerten. Die Quantifizierung des unvermeidbaren oder auch fundamentalen Stichprobenfehlers ist aber gerade eine wichtige Voraussetzung für die Entwicklung eines Probenahmeplans mit nachprüfbaren Probenahmekriterien. Sie ist nur für zufällige Auswahlverfahren auf Grundlage der Wahrscheinlichkeitstheorie (starkes Gesetz der großen Zahlen; Kap. 3.1.4.2) möglich. Nichtzufällige Auswahlverfahren eignen sich daher nicht für die Probenahme von Stoffsystemen und werden hier nicht weiter behandelt. 3.2.2.2 Zufällige Auswahlverfahren Allgemein wird die zufällige Auswahl durch ein Auswahlmodell beschrieben, in dem aus einer Grundgesamtheit UG bestehend aus N Elementareinheiten Ui nach dem Zufallsprinzip eine Teilmenge (Stichprobe) uS, bestehend aus n Elementareinheiten ui ausgewählt wird. Alle Elementareinheiten Ui besitzen eine angebbare und - in endlichen Grundgesamtheiten - von Null verschiedene Auswahlwahrscheinlichkeit π . Die zufällige Auswahl ist nicht korrekt, wenn eine der Bedingungen nicht zutrifft. 48 Methodische Grundlagen Die Menge N aller Elementareinheiten Ui der Grundgesamtheit UG ergeben die Grundgesamtheit. N UG = UUi i =1 (3-89) Die Menge n aller Elementareinheiten ui der Stichprobe uS ergeben die Stichprobe. n u S = U ui i =1 (3-90) Die Menge der N Elementareinheiten wird als Umfang der Grundgesamtheit, die Menge der n Elementareinheiten als Umfang der Stichprobe bezeichnet. Die zufällige Auswahl von Stichprobeneinheiten kann mit Hilfe einer Zufallszahlentabelle oder einer Urne mit nummerierten Kugeln (Urnenmodell) durchgeführt werden. Dabei kann die Auswahl mit und ohne Zurücklegen erfolgen. Die zufällige Auswahl ohne Zurücklegen ist meist mehr von Interesse, da Informationen über eine Stichprobeneinheit in der Praxis nur einmal von Interesse sind. Zufallsstichproben besitzen weiterhin mindestens folgende Eigenschaften: 1. Aus einer Grundgesamtheit kann durch wiederholte Anwendung (mit Zurücklegen) von Auswahlverfahren eine wohldefinierte Menge verschiedener Stichproben bestehen aus den Stichprobenelementen u S1 , u S 2 , u S3 , ... , u S n gewonnen werden. Die Anzahl der möglichen Stichproben bei unterscheidbaren Elementen und ohne Berücksichtigung der Reihenfolge berechnet sich nach Gleichung 3-91: ⎛N⎞ N! ⎜⎜ ⎟⎟ = = N Cn ⎝ n ⎠ n!( N − n )! (3-91) Weiterhin muss genau feststehen, welche Elemente Ui einer Grundgesamtheit zu ui gehören. 2. Jedes mögliche Stichprobenelement u Si hat eine zugehörige Auswahlwahrscheinlichkeit πi, die bekannt sein muss. 3. Ein oder mehrere mögliche Stichprobenelemente u Si werden mit den ihnen entsprechenden Wahrscheinlichkeiten πi ausgewählt. Die tatsächlich ausgewählten Stichproben werden durch Zufallszahlen bestimmt. 4. Es ist anzugeben, wie der gesuchte Schätzwert aus der Stichprobe berechnet wird. Jeder speziellen Stichprobe kann nur ein einziger Schätzwert zugeordnet werden, z. B der arithmetische Mittelwert. 49 Kapitel 3 Zufallstichproben können grundsätzlich nach einem einfachen oder reinen Auswahlverfahren oder einem systematischen Auswahlverfahren gewonnen werden. Wird die Grundgesamtheit vor der Auswahl in mehrere Teilgesamtheiten, sogenannte Schichten, unterteilt, spricht man von einer geschichteten Auswahl. Die Auswahl innerhalb der Schichten kann wiederum rein oder systematisch sein. Werden die Elemente einer Grundgesamtheit in einer Modellannahme entlang einer Geraden aufgereiht, können vier grundlegende Zufallsauswahlverfahren unterschieden werden. Anschaulich ist dies in Abbildung 3.17 graphisch dargestellt. = reine Zufallsauswahl = geschichtete Zufallsauswahl Schicht i=1 Schicht i=L = systematische Zufallsauswahl 1k 2k ......... 6k = systematisch geschichtete Zufallsauswahl Schicht i=1 Abbildung 3.17: Vergleich der Zufallsauswahlverfahren 50 Schicht i=L Methodische Grundlagen 3.2.2.3 Die grundlegenden einstufigen zufälligen Auswahlverfahren Die einfache oder reine Zufallsauswahl Eine reine, einfache oder uneingeschränkte Zufallsauswahl ist der einfachste Fall der zufälligen Auswahlverfahren. Sie liegt dann vor, wenn aus einer Gesamtheit von N Einheiten eine Anzahl von n Einheiten zufällig entnommen werden. Für alle gleich großen Teilmengen einer Grundgesamtheit ist die Wahrscheinlichkeit, dass ihre Elemente in die Auswahl gelangen, gleich groß und nur abhängig von n, dem Umfang der Teilmenge. Werden die Ui Elemente der Grundgesamtheit von i = 1 bis N durchnumeriert und werden n Zufallszahlen aus 1 bis N gezogen, wird eine reine Zufallsauswahl durchgeführt. Bei der reinen Zufallsauswahl werden die n Stichprobeneinheiten praktisch einzeln, also Einheit für Einheit aus den N Einheiten der Grundgesamtheit ausgewählt. Alle N Cn möglichen Stichpro- ben besitzen die gleiche Auswahlwahrscheinlichkeit πi = π. Das Verhältnis aus Anzahl der Stichprobeneinheiten n und Anzahl der Einheiten in der Grundgesamtheit N ist der Auswahlsatz der Stichprobe und wird mit f bezeichnet. Die reine Zufallsstichprobe wird beschrieben durch: Xi: interessierendes Merkmal der i-ten Auswahleinheit in der Grundgesamtheit N: Umfang der Grundgesamtheit n: Umfang der Stichprobe πi: Auswahlwahrscheinlichkeit für die i-te Auswahleinheit π i = f: Auswahlsatz f = 1 N n N Die systematische Zufallsauswahl Die systematische Zufallsauswahl kann nur unter der Voraussetzung angewandt werden, dass sich die Grundgesamtheit anordnen lässt. Bei der systematischen Zufallsauswahl wird die Grundgesamtheit in gleich große Intervalle oder Teilgesamtheiten „gleicher Länge“ aufgeteilt. Die erste Stichprobeneinheit wird zufällig aus dem ersten vorgegebenen Intervall k [N 1 , N 2 , ... , N k ] ∩ [N 1 , N 2 , ... , N ] der N Elemente der Grundgesamtheit gezogen. Jede weitere Stichprobeneinheit ist durch den Abstand k festgelegt. Bei der systematischen Zufallsauswahl wird also ausgehend von einem ersten zufällig festgelegten Element Ui* jedes Element mit Abstand k gezogen. 51