08.11.2015 Stochastik Vorlesung in vier Teilen im Rahmen von Mathematik für alle, Leuphanasemester Folie 1 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Laplacian dices? Laplace‐Würfel ? Bei welchen Zufallsgeräten sind alle Elementar‐Ereignisse gleichwahrscheinlich? In what cases are elementary results equiprobable? Folie 2 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 1 08.11.2015 Laplacian dices Laplace‐Würfel Die Elementar‐Ereignisse sind gleichwahrscheinlich. For Laplacian dices elementary resuts are equiprobable. Ereignis = eine Menge von Elementar-Ereignissen Elementar Ereignissen An event is a set of elementary results. A={5,6} B=„ich würfele ein Primzahl“ I roll a prime number Folie 3 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Laplcian law Laplace‐Gesetz Sind alle Elementar‐Ereignisse gleich‐wahrscheinlich, dann ist die Wahrscheinlichkeit eines zusammengesetzten Ereignisses E : P( E ) Zahl der für E günstigen Fälle for E good cases possible cases Zahl der möglichen Fälle P=Wahrscheinlichkeit, probabitity beim Kubus-Würfel:P ( A) with a cube dice P({1,2}) 2 1 0.33... 33% 6 3 Folie 4 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 2 08.11.2015 Geometric probability as affiliation of the Laplacian law Geometrische Wahrscheinlichkeit als Zurückführung auf das Laplace‐Gesetz Wenn jjede Zeigerstellung g g die g gleiche Wahrscheinlichkeit hat, dann gilt: 90 1 0.25... 25% 360 4 each needle position has the same 120 1 P ( ggrün ) 0.33... 33% probability p y 360 3 P ( rot ) P(blau ) 360 90 120 150 5 0.4166... 42% 360 360 12 Folie 5 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Und hier ?????? Suhle,Seite, Haxe,Schnauze What can we do here? Astragali, römische Würfel dices of the romans What shall be the concept p of p probability? y Wahrscheinlichkeitsbegriff ??? Die relative Häufigkeit bei einer langen Wurfserie ist wahrscheinlich die Wahrscheinlichkeit!?!?!?!?!?!? Folie 7 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 3 08.11.2015 Und hier ?????? What can we do here? Zirkuläre Begriffsbildung Wahrscheinlichkeitsbegriff ??? Circular concepts does‘nt work! Die relative Häufigkeit bei einer langen Wurfserie ist wahrscheinlich die Wahrscheinlichkeit!?!?!?!?!?!? The relative frequency probably goes to the probability? Folie 8 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Wir sehen uns an, wie sich die relative Häufigkeit bei langen Wurfserien verhält. h(n ) Zahl der Einsen unter n Würfen number of case 1 among n rolls Zufallswege, random walks 1 6 theoretischer Wert 16,6...% n grün=+/- 0.5%-Streifen rot=1-sigma-Streifen stripes Folie 9 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 4 08.11.2015 Zufallswege, random walks Empirisches Gesetz der großen Zahl: Die relative Häufigkeit stabilisiert sich. relative frequency become stable Empirisches Gesetz der großen Zahl law of large numbers Weitere Fälle interaktiv oder auf dieser pdf-Seite Abb. 10.6 Abb. 20(-) Es wird für immer größere n immer unwahrscheinlicher, das ein vorgegebener Streifen wieder verlassen wird. For growing up n it become less probable that the observed Folie relative frequency leave a given stripe. 10 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Plan Stochastik Kapitel 10 Stochastik 1 • Zufallswege, • Fundierung des Wahrscheinlichkeitsbegriffes, • Zufallsgröße, Zufallsgröße deren • Verteilung und Erwartungswert, • Binomialverteilung und ihre Kenngrößen. Stochastik 2 • Hypothesentest bei Bernoulliversuchen auf der Grundlage der Binomialverteilung, • Signifikanz, • n-sigma-Grenzen und ihre Bedeutung • Schätzen,, Konfidenzintervalle. Stochastik 3 • Normalverteilung, • Standardabweichung, Messwerte, • Wurzel(n)-Gesetz • Hypothesentest bei Messwerten, • Irrtumswahrscheinlichkeit, P-Wert. Stochastik 4 • Überblick über Vorgehensweisen der Stochastik: • Elemente der beschreibenden Statistik, • Regression, Korrelation • Weitere Verteilungen, • Empirisches Forschen Folie 11 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 5 08.11.2015 Axiome zur Grundlegung einer Theorie foundation Forderungen an ein Axiomensystem: Forderungen an ein Axiomensystem: so wenige Axiome wie möglich 1. effizient 2. widerspruchsfrei consistant passend zu dem Gebiet, 3. valide für das es entworfen wird für das es entworfen wird Euklid: Axiome der Geometrie vor 2300 Jahren Newtonsche Axiome der Mechanik, um 1680 Axiome der Algebra, 19. Jh. Folie 12 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Wahrscheinlichkeitstheorie Axiome von Kolmogorow 1933 1 P( A) 0 1. 22. P () 1 theory of probability 33. A B P( A B ) P ( A) P ( B ) Ereignisraum sample space Elementarereignisse elementary events Folie 13 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 6 08.11.2015 Mehrstufige Zufallsversuche multi-level random experiments 3 rote und 2 grüne Socken in der Schublade zweimal hineingreifen ohne zurückzulegen urn model, pulling without putting back Mit welcher Wahrscheinlichkeit habe ich verschiedenfarbige Socken an? P(different colors)? Folie 14 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Mehrstufige Zufallsversuche multi-level random experiments 3 rote und 5 grüne Socken in der Schublade zweimal hineingreifen ohne zurückzulegen Baumdiagramm als Sparbaum als Sparbaum eco-tree kurze Strecken=Äste branches vom Start bis unten=Pfade pathes Mit welcher Wahrscheinlichkeit habe ich verschiedenfarbige Socken an? P(different colors)? Folie 15 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 7 08.11.2015 Mehrstufige Zufallsversuche multi-level random experiments Die Äste werden mit Wahrscheinlichkeiten beschriftet. Von einen Knoten abgehende Äste haben immer zusammen Wahrscheinlichkeit 1. 1 Oft braucht man nur Teile des Baumes, man nimmt einen Sparbaum (eco-tree) Pfadregeln: path-laws Die W. eines Pfades ist das Produkt der Ast‐Wahrscheinlichkeiten. Tragen mehrere Pfade zu einem Ereignis bei, sind die Pfad‐Wahrscheinlichkeiten zu addieren. Mit welcher Wahrscheinlichkeit habe Folie 16 ich verschiedenfarbige Socken an? Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Wahrscheinlichkeits‐ Verteilung probabitity distribution Abb.10.9 Es wird angegeben, wie die Gesamtwahrscheinlichkeit 1 bei dem Zufallsexperiment bei dem Zufallsexperiment auf die Ausgänge outcomes verteilt ist. Folie 17 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 8 08.11.2015 Gleichverteilung rectangular (equal) distribution n 150 1 p 6 Erwartungswert n p 150 expectation value 1 25 6 Folie 18 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Baumdiagramm und Verteilung tree diagramm and distibution Folie 19 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 9 08.11.2015 Baumdiagramm und Verteilung Folie 20 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Zufallsgröße, Erwartungswert und Verteilung random variable, expectation value and distibution Eine Zufallsgröße ist eine Größe, deren Wert vom Zufall abhängt. „Größe“ im Sinne der Physik: reelle Zahl, ggf. mit einer „Einheit“ like „dimension“ in physics: real number, if need so with an unit Jedem Ereignis wird ein Wert der Zufalls‐ größe zugeordnet. Die für das Ereignis Die für das Ereignis gültige Wahrscheinlichkeit wird als W. für diesen Wert genommen. The event E is a set of elementary outcomes. k is the value which is related to E. The the probability of k ist defined as the probability of the event E. Folie 21 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 10 08.11.2015 Krüge für den Handwerkermarkt crocks for the craftsmen market Verteilung | X mal P Entstehung von Formfehlern und Glasurfehlern failours in form and glaze as a 2-level random als zweistufiger Zufallsversuch. experiment 1. and 2. selection Merkmale: 1. und 2.Wahl, Ausschuss and waste Zufallsgröße: X= Einnahme in € g Liste P ( X X i ) Erwartungswert E(X)= i 1 X i P( X X i ) n Multipliziere die Liste der Werte von X mit der Liste der Wahrscheinlichkeiten und bilde die Summe der neuen Spalte. Multiply the X-values with the probabilities in a new column and add all. Folie 22 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Jakob I. Bernoulli, etwa 1700 Folie 23 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 11 08.11.2015 Bernoulli‐Versuch, Bernoulli‐Kette process trial, experiment Jakob I. Bernoulli, 1655-1705 Basel Bernoulliversuch: 1. klare Ja/Nein Entscheidung yes/no 2. Wahrscheinlichkeit für Ja ist p 2. Wahrscheinlichkeit für Ja ist p Bernoulli‐Kette: n Bernoulliversuche mit konstantem p Zufallsgröße : X = Zahl der „ja“ in der Kette random variable counts the number of successes under n Folie 24 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Bernoulli‐Kette führt zur Binomialverteilung Galton Brett britischer Naturforscher Sir Francis Galton (1822-1911) Folie 25 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 12 08.11.2015 Binomial‐Verteilung, Binomial distibution Die Zufallsgröße X einer Bernoullikette der Länge n ist binomialverteilt, binomially distributed n P( X k ) p k (1 p )n k k Taschenrechner Binom Pdf (n , p),k) Pdf(binomial distribution (10,0.3),2) Folie 26 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Binomial‐Verteilung Die Zufallsgröße X einer Bernoullikette der Länge n ist binomialverteilt n P( X k ) p k (1 p )n k k The binomial distribution is used to model the number of successes in a sample of size n drawn with replacement from a population of size N. It must be n<<N Folie 27 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 13 08.11.2015 Binomial‐Koeffizienten binomial coefficient ( a b)2 a 2 2ab b2 ( a b)3 a 3 3a 2b 3ab2 b3 ( a b)4 a 4 4a 3b 6a 2b2 4ab3 b4 Höh Höhere Binomische Formeln Bi i h F l n n( n 1)...( n k 1) k 1 2 3 ( k 1) k Schreibe unten das Produkt bis k und oben genauso viele Faktoren Folie 30 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Binomial‐Koeffizienten binomial coefficient Taschenrechner nCr(n,k) www.wolframalpha.com binomial coefficient Folie 31 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 14 08.11.2015 Binomial‐Koeffizienten binomial coefficient Taschenrechner nCr(n,k) www.wolframalpha.com binomial coefficient Folie 32 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Binomial‐Verteilung n P( X k ) p k (1 p )n k k Taschenrechner Binom Pdf (n , p),k) Pdf(binomial distribution (10,0.3),2) Folie 33 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 15 08.11.2015 Binomial‐Verteilung Die Zufallsgröße X einer Bernoullikette der Länge n ist binomialverteilt n P( X k ) p k (1 p )n k k Taschenrechner Binom Pdf (n , p),k) Pdf(binomial distribution (10,0.3),2) Folie 34 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Parameter der Binomial‐Verteilung Die Zufallsgröße X einer Bernoullikette der Länge n ist n P( X k ) p k (1 p )n k binomialverteilt k The random variable X is binomial distibuted. Parameter n und p The binomial distribution is used to model the number X of successes in a sample of size n drawn with replacement from a population of size N. The probabiltiy of one single success is p. The parameters are n and p. Folie 35 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 16 08.11.2015 Kenngrößen measures der Binomial‐Verteilung Fläche für den Balken k. n P( X k ) p k (1 p )n k Area of the bar with number k. k Erwartungswert expectation t ti value l n p dort steht der höchste Balken it is the position of the highest bar sigma 2 n pq Varianz n pq Standardabweichung variance standard deviation Folie 36 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Binomial‐ und Normalverteilung W.-Rechner 1-sigma-Abstand liegt bei den Wendepunkten sehr ungewöhnlich Ergebnisse g außerhalb dennoch des 2-sigma-Bereichs mit 0.3% W heißen „ungewöhnlich“, sie treten mit 5% W. auf. Folie 37 Beim Testen: signifikant auf dem 5% Niveau // hochsignifikant Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 17 08.11.2015 Fixe Überlegungen quick thinking Folie 39 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Fixe Überlegungen quick thinking Folie 41 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 18 08.11.2015 Kenngrößen der Binomialverteilung Erwartungswert der Zufallsgröße X = Anz. der „ja“ in der Kette n, p Oh je! E( X ) n p Klein Fritzchen‐ Wert Folie 42 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Kenngrößen der Binomialverteilung Varianz = Erwartungswert die Abweichungsquadrate k 2 vom Mittelwert Var P( X k ) ( k )2 noch schlimmer! Var ( X ) 2 np (1 p ) n p (1 p ) Standard‐ abweichung Folie 43 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 19 08.11.2015 Seminarplan Stochastik 1 W.-Rechner W. Rechner Das war Stochastik 1 • Zufallswege, • Fundierung des Wahrscheinlichkeitsbegriffes, • Zufallsgröße, deren • Verteilung und Erwartungswert, • Binomialverteilung und ihre Kenngrößen. ß www.mathematik‐sehen‐und‐verstehen.de Folie 44 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Statistik Beurteilende Statistik schließende inferentielle Statistik Aufgabe ist: inferential statistics Die The issue is: Schluss von einer Stichprobe auf die Grundgesamtheit statistical t ti ti l inference i f from f the th sample l to t the th population l ti zwei Handlungs-Typen there are two types to handle it Testen: Schätzen: Hypothesentest Konfidenzintervall hypothesis testing estimation confidence interval Wir wollen die Hypothese H1 durch eine Stichprobe statistisch stützen Bisher galt (unsere Geger meinen) Folie 45 H0 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 20 08.11.2015 Statistik Beurteilende Statistik schließende inferentielle Statistik Aufgabe ist: inferential statistics Die The issue is: Schluss von einer Stichprobe auf die Grundgesamtheit statistical t ti ti l inference i f from f the th sample l to t the th population l ti zwei Handlungs-Typen there are two types to handle it Testen: Schätzen: Hypothesentest Konfidenzintervall hypothesis testing estimation confidence interval Wir haben noch kein Wissen. Ziel: Forschungshypothese H1 Die Stichprobe soll Auskunft geben. durch Stichprobe stützen. Intention: the sample shall support H1 We are nescient, the sample shall inform usFolie 46 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Forderungen an die Stichprobe demands on the sample Generelle Voraussetzung: General condition Die Stichprobe muss „repräsentativ“ sein. Am besten man verwirklicht : Jedes Element der Grundgesamtheit muss dieselbe Chance haben, in die Stichprobe zu kommen, wie jedes andere. The sample has to be representativ. The best way to do this is: Any element of the population must have the same chance to come into the sample. Es gibt verschiedene Wege, zu repräsentativen Stichproben zu kommen und die werden in speziellen Büchern oder dickem Statistik-Büchern vorgestellt. Andreas Quatember ISBN 978-3-642-39605-2 ISBN 978-3-642-39606-9 (eBook) (verständlich) Folie 47 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 21 08.11.2015 Hypothesentest hypothesis testing The scientists observed that newly hatched chicks soon start picking only round grains rather than angular ones. They assume this behavior is hereditary, research hypothesis H1. Experiment: Biolix put a lot of cardboard pices on the ground :30% round and 70% triangels deutsch in meinem Buch 10.7.1 H1 : p 0.3 03 Man hat eine Vermutung, die wird zur „Forschungshypothese“ H1. H0 : p 0.3 Das logische g Gegenteil g wird zur „Nullhypothese“H0. Die Nullhypothese kann man niemals beweisen oder unterstützen oder (nach dem Test) für wahr halten. Sie bildet die stets die Rechengrundlage. The null hypothesis H0 must be the logical contrary of H1. Ist is never possible to proof or support H0. All computation will based on H0. Folie 48 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Hypothesentest hypothesis testing H0 : p 0.3 Bernoulli trial rund/ eckig round or triangle mehr Attrappen als im Bild, more dummies then the picture shows p 0.3 konstant Biolix watched one just sliped chick. It picked 5 times, among that 3 round forms. He prepared the demonstration for the scientists. Nein, keine Aussage möglich!!! No conclusion ist possible!!! not significant citical region Signifikanztest: Das Versuchsergebnis legt das „kritische Gebiet“ fest. 5% ? Dieser Versuch zeigt kein signifikantes Egebnis. Folie 49 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 22 08.11.2015 Hypothesentest als Signifikanztest Biolix zuerst 3 5 k 6 3 n 10 5 significant k 12 3 n 20 5 W.-Rechner high significant Die Aussagekraft steigt –bei gleichen Verhältnissenmit dem Stichprobenumfang n. the same ratio but more power Hier ist es ein einseitiger Test, weil man vorher wusste, dass eher mehr runde Körner gepickt werden. The knowlege at the begin give the permission for the one-sided test. Folie 50 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Sprechweisen beim Hypothesentest How to speak in hypothesis testing W.-Rechner W. Rechner 1. Bei n=10 haben die Küken signifikant ( 5% ) mehr runde Körner gepickt als zu erwarten war. 1. By n=10 the chicks picked significantly more round grains than we expected. 2. Bei n=20 haben die Küken hochsignifikant( 1%) mehr runde Körner gepickt als zu erwarten war war. 2. By n=20 the chicks picked high significantly (alpha < 1%) more …. 3. Wir nehmen daher unsere Forschungshypothese an: „Küken haben eine angeborene Vorliebe für runde Körner“ (Signifikanzniveau unter 5%) 3. We accept our research hypothesis: „Chicks have a hereditary preferenz for Folie 51 round grains.“ (level of significance less than 5%) Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 23 08.11.2015 Hypothesentest W.-Rechner Weitere Redeweisen: 4. Mit einer Irrtumswahrscheinlichkeit von weniger als 5% behaupten wir, dass Küken eine genetische Prägung auf runde Körner haben. 5. Wir konnten die Hypothese, Küken lernten erst allmählich, dass nur runde Körner essbar sind, auf einem Signifikanzniveau von unter 5% ablehnen. More modes of speaking: 4. With an error probability of less than 5% we suggest that Chicks have a genetic imprinting for round grains. grains 5. We could disclaim the hypothesis that chicks are learning day by day that only round grains are eatable with a 5%-level of significance. Hypothesen gelten ganz oder gar nicht, sie haben keinerlei Wahrscheinlichkeit. english sentence follows next Folie 52 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Hypothesentest W.-Rechner Falsche Redeweisen: 6. Die Hypothese, dass das Picken auf runde Körner angeboren ist, gilt mit 95% Wahrscheinlichkeit. 7. Nur 5% der Küken müssen das Picken auf runde Körner erst lernen. 8. 95% des Pickverhaltens kann man mit der Genetik erklären. Wrong modes of speaking: 6. The hypothesis that picking round grains is hereditary is valid with a probability of 95%. 95% 7. Only 5% of the chicks have to lern to pink better round grains. 8. 95% of the picking-behavior can be explained with genetics. Correct is: No hypothesis has any probability. A hypothesis is total correct or total incorrect. Folie 53 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 24 08.11.2015 Hypothesentest durchführen ‐1‐ • Entscheide, welche Verteilung zu deinem Experiment passt. • Entscheide, ob es ein einseitiger oder zweiseitiger Test sein soll. Für „einseitig“ muss man vor der Durchführung Gründe für eine Richtung nennen • Nimm als Forschungshypothese Hypothese H1 die Behauptung, die du mit dem Versuch absichern möchtest. • Die Nullhypothese H0 ist das logische Gegenteil. • Alle Rechnungen erfolgen mit den Parametern von H0. Diese sind die Basis für deine potentiellen Gegner. • Nun gibt es zwei Wege weiterzumachen: Erstens: Das Signifikanzniveau Zweitens: : Das Signifikanzniveau ergibt sich aus dem Test. wird vorgegeben. Du nimmst den Du kennst das Gesetz alpha<=5% Du kennst das Gesetz alpha<=5%. Der erste Weg reagiert darauf, dass es heute einfach ist, die Werte von P ( X k ) zu berechnen. Z.B. ist beim linkseinseitigen Test: P ( X k ) Verlust wichtiger Information in Kauf Verlust wichtiger Information in Kauf. Der zweite Weg ist der ältere. Man wählt das Niveau aus einer Liste aus. Z.B. gehört zu den 2-sigma-Grenzen das Niveau 5% zweiseitig. Folie 54 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Hypothesentest durchführen ‐2‐ Erstens: „Signifikanztest“: • Führe die Schritte der vorigen Seite durch.. • Führe den statistischen Versuch durch, das Ergebnis sei k. • k (inklusive) bildet die Grenze des kritischen Gebietes. Das ist der Teil der x-Achse mit den Ergebnissen, die für die Hypothese H1 noch besser sind als k. • Berechne auf der Basis von H0 P ( X kritischem Gebiet ) • Für 5% ist nichts entschieden. Das Ergebnis k ist verträglich mit H0, du weißt nicht, ob H0 gilt oder nicht, du weißt nicht, ob H1 gilt oder nicht, . • Für 5% kannst du H1 annehmen und H0 verwerfen. Das Ergebnis k ist signifikant auf dem Niveau . Darüberhinaus ist die Wahrscheinlichkeit für den Fehler 1. 1 Art, Art also H1 anzunehmen anzunehmen, obwohl H0 gilt gilt. Die Befürworter des zweiten Weges befürchten, man könnte das berechnete nehmen, auch wenn es größer als 5% ist. Aber das tut man nicht!! Zweitens: Das kritische Gebiet folgt bei diesem Weg aus der Vorgabe von Aber in einem zweiten Schritt wird bei diesem Weg der (genauere) Wert aus dem ersten Weg berechnet und man nennt ihn den P-Wert oder p-Wert. (Aus didaktischem Grund ist dieses ungeschickt, da p oft eine ganz andere Bedeutung hat.) Folie 55 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 25 08.11.2015 How to do Hypothesis testing ‐1‐ • Decide which type of distribution suits your experiment. • Decide, whether you take a one or a two sided test? For choosing „one sided“ you would need reasons before you do the test. • Take as reseach hypothesis H1 the assumption you wish to proove. • The null hypothesis H0 is the logical contrary. • Any computation works on the values of H0. That is the basis for your potential opponents. • There are two ways to proceed now: First: level of significance is result of testing. You accept the law alpha<=5% alpha< 5% Second: level of significance alpha is predefined. You accept that important information is lost. lost The first way is a modern approach, where the values of P( X k ) are easy to compute. I.e. for a left sided test is P ( X k ) The second way is the former type. You choose the level out of a list. I.e. with the 2-sigma-bounds you have level 5% two sided. Folie 56 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de How to do Hypothesis testing ‐2‐ First way: „significance testing“: • Do the steps on the previous page. • Do the experiment. The result shall be k. • k (incusive) is the bound of the critical region. This is the part of the x-axis, where the results are which are better than k for the hypothesis H1. • Compute with the values of H0 P ( X critical region ) • If 5% nothing is decided. The result k is compatible with H0, you don‘t know if H0 is valid or not, you don‘t know if H1 is valid ar not. • If 5% you can accept H1 and reject H0. The result k is significant on level . Furthermore is the probability for the error of the 1. 1 kind, kind that is the error to accept H1 while H0 is correct. correct The promotors of the second way are afraid, that one could take the computed without respecting the less 5%-law. But this fear for good scientists is unrealistic. Second way: The citical region comes here from the chosen . But in a second step the value from the first way will be computed und is called P-value or p-value. (For didactical reasons it is no so good, because has an other meaning). Folie 57 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 26 08.11.2015 Konfidenzintervalle intervals of confidence Konfidenz Folie 58 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Konfidenzintervalle intervals of confidence n=40 k=12 Die Grenzen des Konfidenzintervalles sind die Erwartungswerte der Verteilungen, g , mit denen die Zählung gerade noch verträglich auf dem Niveau 1 ist. english follows Folie 60 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 27 08.11.2015 Konfidenzintervalle intervals of confidence The bounds of the confidence interval are the expectation values of the distibutions which are just compatible with the data on the level 1 . approx minimum exact minium data …. 2 1 Wir nehmen Wi h z=2 2 fü für Niveau 95%. Genauer wäre z=1.96. Der Unterschied ist unerheblich. Folie 61 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Fixe Überlegungen quick thinking Beobachtung: observation: k=23 von 184 Feldern mit Kohl haben den Schädling k=23 of 184 fields with cabbage have the pest Punktschätzung point estimation 23 h 184 81 0.125 12.5% relative Häufigkeit, relative frequency Es passt die Binomialverteilung n=184, p=h The binomial distibution suits. yes/no pest/not pest Konfindezintervall näherungsweise auf dem 95%-Niveau= Verträglichkeitsbereich für die Punktschätzung Wir erwarten zwischen 7,6% und 17,4% Felder mit Schädlingen.We expect …… fields with pest. Confidence interaval approximative at the 95%-level = compatibility region of the point estimation Folie 62 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 28 08.11.2015 Fixe Überlegungen quick thinking Eine Startwochengruppe kann man Zufallsauswahl der Erstis betrachten. 25 von 30 Erstis fahren Weihnachten zu den Eltern. Geben Sie ein 95%-Konfidenzintervall an, für den Anteil der Erstis insgeamt, die Weihnachten zu den Eltern fahren. fahren One group of the starting week can be considered as random selction. 25 of 30 Erstis travel at christmas to the parents. Give the 95%-confidence interval an, for the ratio of all Erstis which travel at christmas to the parents. Folie 63 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de Fixe Überlegungen quick thinking Eine Startwochengruppe kann man Zufallsauswahl der Erstis betrachten. 25 von 30 Erstis fahren Weihnachten zu den Eltern. Geben Sie ein 95%-Konfidenzintervall an, für den Anteil der Erstis insgeamt, die Weihnachten zu den Eltern fahren. fahren Unsere kleine Umfrage hat ergeben, dass zwischen 73% und 97% unsere Erstis Weihnachten zu den Eltern fahren. Die Wahrscheinlich für die Richtigkeit dieser Aussage ist etwa 95%. One group of the starting week can be considered as random selction. 25 of 30 Erstis travel at christmas to the parents. Give the 95%-confidence interval for the ratio of all Erstis which travel at christmas to the parents. Our result says: between 73% and 97% travel at christmas to the Parents. Folie 64 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 29 08.11.2015 Seminarplan Stochastik 2 Das war Stochastik 2 • n-sigma-Grenzen und ihre Bedeutung • Hypothesentest H th t t bei b iB Bernoulliversuchen lli h auff der Grundlage derBinomialverteilung, • Signifikanz, • Schätzen, Konfidenzintervalle. Folien sind kein Lesebuch! Sides don‘t be a book for reading it! Ohne Lesen kein Studium! No studies without reading! Folie 65 Prof. Dr. Dörte Haftendorn, Leuphana Universität Lüneburg, 2015 http://www.mathematik‐sehen‐und‐verstehen.de 30