Statistik II für Betriebswirte Privat-Doz. Dr. H. Haase Inst. f. Math. u. Inf. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 05.05.2017 Vorlesung 4 05.05.2017 1 / 63 Wiederholung Schätztheorie −4 −2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 2 4 x Vorlesung 4 05.05.2017 2 / 63 Übersicht 1 2 3 Grundlagen der Testtheorie Normalverteilte Grundgesamtheiten Einstichprobenprobleme Zweistichprobenprobleme Wiederholung zu Statistik I Wahrscheinlichkeitsräume Bedingte Wahrscheinlichkeiten Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 3 / 63 Grundlagen der Testtheorie I Gegeben ist eine Grundgesamtheit X , deren Verteilung zumindestens teilweise unbekannt ist. Unter dem Hypothesenraum versteht man dann alle für X möglichen Verteilungen. Hängen die Verteilungen nur von der Festlegung von Parametern γ ∈ Γ, d.h. bestimmten Zahlenwerten, ab, so liegt ein parametrisches Testproblem vor. Z. B. könnte die Verteilung normalverteilt sein, wobei lediglich der Erwartungswert unbekannt sein soll. Ist dies nicht der Fall, so hat man ein nichtparametrisches Testproblem Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 4 / 63 Grundlagen der Testtheorie II Im Falle eines parametrischen Testproblems wird der Hypothesenraum, hier der Parameterraum Γ, in zwei Teilmengen Γ und Γ aufgeteilt. Sie dienen zu Formulierung der sogenannten Null- bzw. Alternativhypothese. Die Nullhypothese, d.h. die Hypothese, die angezweifelt werden soll, wird mit H bezeichnet. H steht für eine Aussage der Form γ ∈ Γ . Die Alternativhypothese H beinhaltet eine Aussage der Gestalt γ ∈Γ . Weiterhin unterteilt man die parametrischen Tests in Signikanztests und Alternativtests Setzt man d = inf {|γ − γ | ; γ ∈ Γ , γ ∈ Γ } , so gilt d = 0 für einen Signikanztest und d > 0 für einen Alternativtest. 0 1 0 0 0 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 1 0 Vorlesung 4 0 1 1 05.05.2017 5 / 63 Grundlagen der Testtheorie III Mit Hilfe einer konkreten Stichprobe (x , . . . , xn ) soll eine Entscheidung darüber getroen werden, ob 1 die Nullhypothese H0 abgelehnt oder beibehalten wird. Dazu wird eine Testgröÿe T benötigt: T ist eine Statistik, die von einer mathematischen Stichprobe (X1 , . . . , Xn ) der Grundgesamtheit X abhängt. T (X1 , . . . , Xn ) ist also eine (reelle) Zufallsgröÿe. Die Wahl von T erfolgt im allgemeinen so, als wäre der entsprechende Parameter γ zu schätzen. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 6 / 63 Grundlagen der Testtheorie IV Der Wertebereich von T wird in den kritischen Bereich K und den Annahmebereich K c (Komplement zu K ) unterteilt. Die Testentscheidung ndet nach folgenden Regeln statt: T (x1 , . . . , xn ) ∈ K wird H0 abgelehnt. T (x1 , . . . , xn ) ∈/ K wird H0 beibehalten Eine Bestätigung der Nullhypothese bedeutet die zweite Entscheidung, falls sie getroen würde, jedoch bei Signikanztests nicht. Da d = 0 ist, kann man beliebig dicht liegende Alternativwerte angeben. Für Für Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 7 / 63 Grundlagen der Testtheorie V Bei der Durchführung eines statistischen Tests können zwei Sorten von Fehlern auftreten: Die richtige Nullhypothese wird abgelehnt ( Fehler 1. Art). Fehler Die Nullhypothese wird nicht abgelehnt, obwohl sie falsch ist ( 2. Art) Wir holen jetzt die Festlegung des kritischen Bereichs K nach. Zu einem vorgegebenen Signikanzniveau 0 < α < 1 muÿ für K P γ (T (X1 , . . . , Xn ) ∈ K ) ≤ α für alle α γ ∈ Γ0 eingehalten werden. kontrolliert somit die Wahrscheinlichkeiten P γ (T (X1 , . . . , Xn ) ∈ K ) für einen Fehler erster Art. Man könnte natürlich auch einen kritischen Bereich einfach festlegen. Dann hat man keinen der beiden möglichen Fehler unter Kontrolle. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 8 / 63 Grundlagen der Testtheorie VI Beispiel: 12 unabhängige Versuche entweder mit einem Würfel oder mit einer Münze Dies ist nicht bekannt!!!! Ein Erfolg sei entweder das Werfen der Sechs und von Wappen. Hätten wir höchstens 3 Erfolge, so würde dies gegen die Münze sprechen. Mit anderen Worten: H0 : Verwendung der Münze gegen H1 : Verwendung des Würfels Festlegung vonK = {0, 1, 2, 3} als Ablehnungsbereich für H 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 9 / 63 Grundlagen der Testtheorie VII Beispiel (Fortsetzung): Betrachtung der absoluten Häugkeit T als Testgröÿe (binomialverteilt mit n = 12 und p ) Fehler erster Art durch p = und T ≤ 3 beschrieben: 1 2 12 3 α= 1 ∑ k= k 2 12 = 7. 2998 × 10−2 0 Fehler zweiter Art durch p = 12 β= 1 6 und T ≥ 4: k 12−k 12 1 5 ∑ k k =4 6 6 = 0.12518 als Wahrscheinlichkeit für den Fehler zweiter Art. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 10 / 63 Grundlagen der Testtheorie VIII Die Gütefunktion G (γ) = P γ (T (X , . . . , Xn ) ∈ K ) 1 gibt für jedes γ ∈ Γ die Ablehnungswahrscheinlichkeit für dieses γ an. Wir nennen dann einen Test unverfälsch, wenn G (γ) ≥ α für alle γ ∈ Γ gilt. Wenn also die Alternativhypothese richtig ist (γ ∈ Γ ), so wird die Nullhypothese, die ja dann falsch ist, mit gröÿerer Wahrscheinlichkeit abgelehnt als in Fällen, wo die Nullhypothese (γ ∈ Γ ) richtig ist. Diese Eigenschaft ist eine Minimalforderung an einen Test. 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 0 Vorlesung 4 05.05.2017 11 / 63 Grundlagen der Testtheorie IX Beispiel: Wir nehmen an, daÿ X dichotom sei. Für K = {n − 1, n} als kritischen Bereich erhalten wir für die mit n und γ ∈ [0, 1] binomialverteilte Testgröÿe T G (γ) = Pγ (T ≥ n − 1) = γ n + nγ n− (1 − γ) = nγ n− − (n − 1) γ n 1 1 als Gütefunktion. Für die erste Ableitung gilt G (γ) = n (n − 1) γ n− − n (n − 1) γ n− = n (n − 1) γ n− (1 − γ) ≥ 0 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 1 2 Vorlesung 4 05.05.2017 12 / 63 Grundlagen der Testtheorie X Beispiel (Fortsetzung): Damit ist G auf dem Denitionsbereich [0, 1] des Parameters γ monoton wachsend. Somit existiert zu jedem Signikanzniveau α < 1 ein γ ∈ [0, 1], so daÿ G (γ ) = α . 1 1 Für γ ≤ γ ist 1 G (γ) ≥ α. Wenn Γ = [γ , 1] ist der Test mit dem kritischen Bereich K und α unverfälscht. 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 13 / 63 Grundlagen der Testtheorie XI Der allgemeine Testablauf umfaÿt 7 Punkte, wobei man die ersten vier, die nächsten zwei und den letzten auch zu drei Schwerpunkten zusammenfassen kann: 1 Bestimmung der Verteilungsklasse der Grundgesamtheit bzw. des Wertebereiches des zu testenden Parameters. 2 Formulierung der Hypothesen H und H . 3 Festlegung des Signikanzniveaus α. 4 Festlegung einer Testgröÿe T in Abhängigkeit von einer mathematischen Stichprobe vom Umfang n mit vollständig bekannter Verteilung unter der Nullhypothese. 5 Wahl des kritischen Bereiches K unter Beachtung von 0 1 sup Pγ (T (X , . . . , Xn ) ∈ K ) ≤ α . 1 γ∈Γ0 6 7 Berechnung des konkreten Testwertes t = T (x , . . . , xn ) mit Hilfe einer konkreten Stichprobe. Anwenden der Entscheidungsregel. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 Vorlesung 4 05.05.2017 14 / 63 Grundlagen der Testtheorie XII Bei der Abfassung der Hypothesen unterscheidet man zwischen zweiseitigen und einseitigen Fragestellungen. Die Formulierung H0 : γ = γ0 gegen H1 : γ 6= γ0 nennt man die zweiseitige Fragestellung. H0 : γ = γ0 gegen H1 : γ > γ0 eine einseitige Fragestellung. Statt H : γ = γ wird dann oft auch H : γ ≤ γ geschrieben. Für einseitige Fragestellungen gibt es mehrere Möglichkeiten. Das folgende Beispiel zeigt, warum eine solche Unterteilung in zweiseitige und einseitige Fragestellungen sinnvoll sein kann. Hingegen ist 0 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 Vorlesung 4 0 05.05.2017 15 / 63 Grundlagen der Testtheorie XIII Beispiel: Füllmenge einer Ware in einer Verpackung, z. B. Waschpulver Standpunkte: eines Gesetzgebers, der eine Abfüllordnung festlegt, eines Verbrauchers und eines Erzeugers. Signikanztest: Zweifel an der Nullhypothese Nullhypothese: aufgedruckte Füllmenge gleich wahre Füllmenge Die zweiseitige Fragestellung ist für den Gesetzgeber interessant Verbraucher verwerfen die Nullhypothese, wenn die wahre Füllmenge deutlich geringer ausfällt. Erzeuger verwerfen die Nullhypothese hingegen, wenn die wahre Füllmenge gröÿer als die vorgeschriebene Füllmenge ist, was verständlich sein dürfte. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 16 / 63 Einstichprobenprobleme I Probleme, die mit einer normalverteilten Grundgesamtheit X im Zusammenhang stehen. Für die beiden Parameter µ und σ gibt es 4 verschiedene Testsituationen. Für einen zu testenden Parameter kann der zweite entweder bekannt oder unbekannt sein. Das Prüfen des Mittelwertes bei bekannter Varianz nennt man auch einen einfachen Gauÿtest. Diese Bezeichnung rührt von der Verteilung der verwendeten Testgröÿe her. Testgröÿe - standardisierte Normalverteilung. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 17 / 63 Einstichprobenprobleme II Der Gauss-Test X normalverteilte Grundgesamtheit, µ unbekannt, σ = σ bekannt. (X , . . . , Xn ) Stichprobe vom Umfang n Nullhypothese: µ = µ Testgröÿe X −µ √ T= n 0 1 0 0 σ0 ist standardnormalverteilt. Bestimmung des kritischen Wertes kα zum vorgegebenen Signikanzniveau α aus Φ (kα ) = 1 − α 2 Ablehnung der Nullhypothese, wenn der konkrete Testwert x −µ √ t= n 0 σ0 die Ungleichung |t | ≥ kα erfüllt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 18 / 63 Einstichprobenprobleme III Der Gauss-Test, Beispiel Für ein Sixpack an Getränkeaschen gilt die Norm 500 ± 10. Ein Stichprobe ergibt die Werte x = 490. Ist die Norm statistisch gesehen eingehalten? Testdurchführung: 6 Nullhypothese: µ = 500 Berechnung der konkreten Testgröÿe t= x − µ0 √ 490 − 500 √ n= 6 = −2. 449 5 10 σ0 Bestimmung des kritischen Wertes (kritischer Bereich) für (falls nicht explizit ein anderes α = 0.05 α ): Φ(kα ) = 0.975 =⇒ kα = 1.96 Testentscheidung: |t | > kα =⇒ Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Nullhypothese wird verworfen. Vorlesung 4 05.05.2017 19 / 63 Einstichprobenprobleme IV Da man selten eine bekannte Varianz zur Verfügung hat, ist ein Test, der den Mittelwert bei unbekannter Varianz prüft, von gröÿerer Bedeutung. Dieser Test wird einfacher t-Test genannt in Anlehnung an die Verteilung der Testgröÿe. Wir betrachten zunächst die möglichen Hypothesen: H0 : µ = µ0 gegen H1 : µ 6= µ0 bei zweiseitiger Fragestellung und H0 : µ ≤ µ0 gegen H1 : µ > µ0 bzw. H0 : µ ≥ µ0 gegen H1 : µ < µ0 bei einseitiger Fragestellung. µ hat in der Regel die Bedeutung eines Sollwertes bei zweiseitiger Fragestellung. Bei einseitiger Fragestellung wird angezweifelt, ob ein Grenzwert über oder unterschritten wird. 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 20 / 63 Einstichprobenprobleme V Mit diesem µ und einer mathematischen Stichprobe (X , . . . , Xn ) wird die Testgröÿe X −µ √ n T= S gebildet, wobei 1 n S = Xk − X ∑ n − 1 k= 0 1 0 2 2 1 T ist mit n − 1 Freiheitsgraden t -verteilt. Zu vorgebenem Signikanzniveau α werden die drei möglichen kritischen Bereiche folgendermaÿen bestimmt. Für die zweiseitige Fragestellung setzt man den kritischen Bereich K aus zwei Intervallen K = ]−∞, −c [ ∪ ]c , ∞[ 1 1 zusammen, wobei FT ,n− (c ) = 1 − α ist. 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 2 Vorlesung 4 05.05.2017 21 / 63 Einstichprobenprobleme VI Dabei beachten wir, daÿ FT die Verteilungsfunktion von T ist, die über eine symmetrische Dichte verfügt. Den beiden einseitigen Fragestellungen entsprechen dann K = ]c , ∞[ bzw. K = ]−∞, −c [ 2 2 als kritische Bereiche mit FT (c ) = 1 − α , wenn Abweichungen nach oben bzw. nach unten zur Ablehnung der Nullhypothese führen sollen. Hinweise für die Abfassung einseitiger Fragestellungen: 2 Wenn konkret Wenn konkret x < µ0 , so bestehen Zweifel an µ ≥ µ0 x > µ0 , so bestehen Zweifel an µ ≤ µ0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 22 / 63 Einstichprobenprobleme VII Beispiel: Die folgenden Daten sind die Dieselpreise in ¿ an 20 freien Tankstellen in Vorpommern (vor einigen Jahren!) 1,489 1,503 1,488 1,490 1,506 1,510 1,512 1,498 1,499 1,487 1,478 1,490 1,477 1,500 1,504 1,503 1,500 1,488 1,498 1,486. Testen, ob 1,500 der mittlere Dieselpreis ist! Vorgehensweise: Per Hand für die kleine Stichprobe 1,489 1,503 1,488 Für die groÿe Stichprobe mit R-Skript. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 23 / 63 Einstichprobenprobleme VIII Nullhypothese: µ = 1.5 (µ ) (zweiseitig) Testgröÿe: a) X −µ √ 1 n T= n mit S = Xk − X ∑ S n − 1 k= 0 0 2 2 1 b) 1.489 + 1.503 + 1.488 = 1. 4933 3 1.489 + 1.503 + 1.488 x = = 2. 2301 3 3 s = x − (x ) = 2.3267 × 10− 2 x= 2 2 2 2 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 4 2 4 05.05.2017 24 / 63 Einstichprobenprobleme IX Testgröÿe: c) Dann ist x −µ √ 1. 4933 − 1.5 √ n= √ · 3 s 2. 3267 × 10− = −0.76079 t= 0 4 Bestimmung des kritischen Wertes aus einer Tafel: Freiheitsgrad 1 0.975-Quantil 12.706 2 4.302 3 4 5 3.182 2.776 2.570 k = 4.302 Testentscheidung: Wegen |t | < k kann die Nullhypothese nicht verworfen werden. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 25 / 63 Einstichprobenprobleme mit R I Testdurchführung mit R: in der R-Hilfe (Taste F1) t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...) RScript: Einlesen der Daten mit dem c-Operator (Vektor bilden!) Punkt statt Komma ! t.test mit geeigneten Parametern aufrufen! Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 26 / 63 Einstichprobenprobleme mit R II x <- c(1.489, 1.503, 1.488, 1.49, 1.506, 1.51, 1.512, 1.498, 1.499, 1.487, 1.49, 1.477, 1.5, 1.504, 1.503, 1.5, 1.488, 1.498, 1.486) t.test(x, mu = 1.5) ## ## ## ## ## ## ## ## ## ## ## One Sample t-test data: x t = -2.12, df = 19, p-value = 0.04742 alternative hypothesis: true mean is not equal to 1.5 95 percent confidence interval: 1.491 1.500 sample estimates: mean of x 1.495 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 27 / 63 Einstichprobenprobleme X Interpretation: Testwert p-Wert (für Testentscheidung wichtig) Angabe der Alternativhypothese Angabe des 95%-Kondenzintervalls (kann geändert werden!) Mittelwert der Daten einseitige Fragestellung? 1.4953 < 1.5, also Zweifel an µ ≥ µ0 (Alternative: µ < µ0 =⇒ Option: less") Änderung im R-Skript: Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 28 / 63 Einseitiger Test mit R t.test(x, mu = 1.5, alternative = "less") ## ## ## ## ## ## ## ## ## ## ## One Sample t-test data: x t = -2.12, df = 19, p-value = 0.02371 alternative hypothesis: true mean is less than 1.5 95 percent confidence interval: -Inf 1.499 sample estimates: mean of x 1.495 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 29 / 63 Einstichprobenprobleme XI Prüfen auf eine bestimmte Varianz σ Nullhypothese: σ = σ Testgröÿe: 2 0 2 T= 2 0 2 (n − 1) S 2 1 n 2 mit S = Xk − X ∑ 2 n − 1 k =1 σ0 ist unter der Nullhypothese H : σ = σ mit n − 1 Freiheitsgraden χ -verteilt. Bestimmung zweier kritischer Werte kα/ und k −α/ mit 0 2 2 0 2 2 F kα/ = α und F k 1 2 = 1− α 2 2 Ablehnung der Nullhypothese, wenn für das konkrete t 2 −α/2 1 t < kα/ oder t > k Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 4 −α/2 1 05.05.2017 30 / 63 Einstichprobenprobleme XII kleine Dieselpreisstichprobe 1,489 1,503 1,488 Nullhypothese: σ = 0.01, Signikanzniveau: α = 0.05 Berechnung der Testgröÿe 2 T= s = Also 2 3 2 x − (x ) 2 2 2 (n − 1) S 2 1 n 2 mit S = Xk − X ∑ 2 n − 1 k =1 σ0 t= = 32 · 2. 2301 − 1. 49332 = 2. 3267 × 10−4 2 · 2. 3267 × 10− = 4. 6534 × 10− 0.01 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 4 2 Vorlesung 4 05.05.2017 31 / 63 Einstichprobenprobleme XIII Bestimmung des kritischen Wertes aus einer Tafel der χ -Verteilung: 2 Freiheitgrad q . q. 1 0.001 5.0238 2 0.0506 7.3777 3 0.2157 9.3484 − Wegen 4. 6534 × 10 < 0.0506 wird die Nullhypothese abgelehnt. Test mit R für die groÿe Stichprobe? Man muÿ sich etwas zusammen basteln!!! 0 025 0 975 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 32 / 63 Test mit R für die groÿe Stichprobe n <- length(x) df <- n - 1 sigma2 <- 0.01 t <- sd(x) * sd(x) * (n - 1)/sigma2 pchisq(t, df) ## [1] 1.342e-16 Dieses Mal wird .... ? Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 33 / 63 Zweistichprobenprobleme I Gleichheit der Varianzen zwei Grundgesamtheiten X und Y , wobei (X , . . . , Xn1 ) und (Y , . . . , Yn2 ) zwei mathematische Stichproben vom Umfang n und n sind X und Y normalverteilt mit µk und σk für k = 1, 2 verfügen. Nullhypothese: 1 1 1 2 H0 : σ12 = σ22 gegen die Alternativhypothese H1 : σ12 6= σ22 bei zweiseitiger Fragestellung H0 : σ12 ≤ σ22 gegen H1 : σ12 > σ22 bei einseitiger Fragestellung Die Testgröÿe ist nämlich S T = X (SX und SY die Stichprobenvarianzen). SY 2 2 2 2 Sie ist mit n − 1 und n − 1 Freiheitsgraden F -verteilt ( F-Test) 1 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 34 / 63 Zweistichprobenprobleme II Gleichheit der Varianzen Wahl des kritischen Bereiches: Bei zweiseitiger Fragestellung K = [0, c1 [ ∪ ]c2 , ∞[ für für das Signikanzniveau α FT (c1 ) = α und die beiden kritischen Grenzen und 2 FT (c2 ) = 1 − α 2 c1 , c2 . Bei einseitiger Fragestellung K = ]c , ∞[ mit F T (c ) = 1 − α stets wird angenommen: SX ≥ SY (Symmetrie) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 2 Vorlesung 4 05.05.2017 35 / 63 Zweistichprobenprobleme III Gleichheit der Varianzen Beispiel: Vergleich der Varianzen der Kühlschrankpreise, des Ottoversands für die Herbst-Wintersaison 2011/2012 mit der für die Frühjahrs-Sommersaison 2010. Für den zuerst genannten Zeitraum ndet man 549 679 899 899 499 799 769 699 389 449 529 549 599 729 699 und für den zweiten 679 599 549 899 869 799 699 389 499 629 529 899 699 599 899 jeweils in ¿. kleine Stichproben: ¿ Herbst-Wintersaison 2011/2012: 549, 679, 899, 899,Frühjahrs-Sommersaison 2010: 679, 599, 549,- ¿ Nullhypothese: H : σ = σ gegen die Alternativhypothese H : σ 6= σ Berechnung der Testgröÿe 0 1 2 1 2 1 2 2 2 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) S T = X, SY 2 2 Vorlesung 4 05.05.2017 36 / 63 Zweistichprobenprobleme IV Gleichheit der Varianzen Berechnung der Testgröÿe (Fortsetzung): Hilfsgröÿe sx2 : x= x2 = sx2 = Hilfsgröÿe 549 + 679 + 899 + 899 4 549 2 + 6792 + 8992 + 8992 4 4 3 · = 756. 5 5 5. 947 1 × 10 = 5. 947 1 × 105 − 756. 52 = 29890.0 sy2 : y= 679 + 599 + 549 = 609.0 3 y2 = 679 sy2 = 3 2 + 5992 + 5492 3 2 · Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 5 3. 737 5 × 10 Vorlesung 4 = 3. 737 5 × 105 − 609.02 = 4303. 5 05.05.2017 37 / 63 Zweistichprobenprobleme V Gleichheit der Varianzen Also: s 29890.0 t= x = = 6. 9455 sy 4303. 5 2 2 Bestimmung der kritischen Werte c , c mit Hilfe einer Verteilungstabelle für 1 − α = 0.975 1 2 2 1 2 3 1 2 3 1 647.8 38.5 17.4 0.0015 0.001 0.001 2 799.5 39.0 16.0 0.025 0.025 0.025 3 864.2 39.16 15.4 0.057 0.062 0.064 Nullhypothese kann nicht verworfen werden. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 38 / 63 Testdurchführung mit R I Test mit R: R-Hilfe: var.test(x, y,ratio = 1, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, ...) R-Skript: Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 39 / 63 Testdurchführung mit R II x <- c(549, 679, 899, 899, 499, 799, 769, 699, 389, 449, 529, 549, 599, 729 699) y <- c(679, 599, 549, 899, 869, 799, 699, 389, 499, 629, 529, 899, 699, 599 899) var.test(x, y) ## ## ## ## ## ## ## ## ## ## ## F test to compare two variances data: x and y F = 0.9284, num df = 14, denom df = 14, p-value = 0.8913 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3117 2.7652 sample estimates: ratio of variances 0.9284 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 40 / 63 Zweistichprobenprobleme VI Gleichheit der Mittelwerte zweier unabhängiger Grundgesamtheiten Dabei gibt es drei Verfahren in Abhängigkeit von der Tatsache, ob beide Varianzen bekannt, beide unbekannt , aber gleich, oder beide verschieden und unbekannt sind. Voraussetzungen: normalverteilte unabhängige Grundgesamtheiten X und Y von einander unabhängige mathematische Stichproben (X1 , . . . , Xn1 ) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) und Vorlesung 4 (Y1 , . . . , Yn2 ) 05.05.2017 41 / 63 Zweistichprobenprobleme VII Der doppelte Gauÿtest, wenn beide Varianzen bekannt Nullhypothese H : µ = µ gegen µ 6= µ Testgröÿe √ X −Y T=q · n n n σ +n σ 0 1 2 1 2 1 2 2 1 1 2 2 2 ist standardisiert normalverteilt. Bestimmung des kritischen Werten kα (für α = 0.95) aus einer Tabelle kα = 1.96 Wenn für den konkreten Testwert t |t | > kα wird die Nullhypothese abgelehnt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 42 / 63 Zweistichprobenprobleme VIII Der doppelte Gauÿtest, wenn beide Varianzen bekannt Beispiel: Kühlschrankdatensatz, Varianzen als bekannt angenommen Nullhypothese: µ = µ gegen µ 6= µ Berechnung der Testgröÿe: Wir benutzen R, um die Hilfsgröÿen zu bestimmen. Wir erhalten: 1 2 1 2 x = 649, σ = 24371 und n = 15 y = 682, σ = 26252. und n = 15 2 1 1 2 2 2 Dann √ x −y t=q · n n n σ +n σ √ 649 − 682 =√ · 15 · 15 15 · 24371 + 15 · 26252 = −0.56805 Wegen |−0.56805| < 1.96 Nullhypothese nicht verworfen. 1 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 1 1 2 2 2 Vorlesung 4 05.05.2017 43 / 63 Zweistichprobenprobleme IX Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz Nullhypothese: µ = µ gegen µ 6= µ Testgröÿe r X −Y nn T= S n +n unter der Hypothese H : µ = µ bei zweiseitiger Fragestellung bzw. bei beiden einseitigen Fragestellungen t -verteilt mit n + n − 2 Freiheitsgraden, wobei (n − 1) SX + (n − 1) SY S = n +n −2 die gepoolte Stichprobenvarianz Ablesen des kritischen Wertes kα zu vorgegebenen Signikanzniveau α aus einer Tabelle Ablehnen der Nullhypothese, wenn für den konkreten Testwert t |t | > kα 1 2 1 2 1 1 0 1 2 2 2 1 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 1 1 Vorlesung 4 2 2 2 2 05.05.2017 44 / 63 Zweistichprobenprobleme X Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz Beispiel: In zwei Waldächen wurden 3 bzw. 4 Bäume gefällt, die die folgenden Festmeter erbrachten: W1 1,2 1,1 2,0 W2 1,1 1,0 1,5 1,4 Kann man davon ausgehen, daÿ beide Flächen gleich ergiebig sind? Nullhypothese: µ = µ (mittlere Festmeter sind gleich) Berechnung der Testgröÿe: (Hilfsgröÿen) 1.2 + 1.1 + 2 x= = 1. 4333, 3 1.1 + 1 + 1.5 + 1.4 y= = 1. 25 4 1.2 + 1.1 + 2 = 2. 2167, x = 3 1.1 + 1 + 1.5 + 1.4 y = = 1. 605 4 1 2 2 2 2 2 2 2 2 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 45 / 63 Zweistichprobenprobleme XI Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz Beispiel Fortsetzung: Berechnung der Testgröÿe: gepoolte Stichprobenvarianz 3 sX = x − (x ) 2 3 = · 2. 2167 − 1. 4333 = 0.24353 2 4 SY = y − (y ) 3 4 = · 1. 605 − 1. 25 = 5. 6667 × 10− 3 (n − 1) sX + (n − 1) sY s = n +n −2 2 · 0.24353 + 3 · 5. 6667 × 10− = 3+4−2 = 0.13141. 2 2 2 2 2 2 2 2 2 2 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 2 2 2 2 2 Vorlesung 4 05.05.2017 46 / 63 Zweistichprobenprobleme XII Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz Beispiel Fortsetzung: Berechnung der Testgröÿe: (konkreter Testwert) x −y nn t= s n +n r 1. 4333 − 1. 25 12 = √ · = 0.66205 7 0.13141 r 1 1 2 2 Bestimmung des kritischen Wertes aus einer Tabelle (1 − α/2 = 0.975, 5 Freiheitsgrade: Freiheitsgrad 1 2 3 4 5 6 7 0.975-Quantil 12.70 4.3 3.18 2.77 2.57 2.44 2.36 Wegen 0.66205 < 2.57 kann die Nullhypothese nicht verworfen werden. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 47 / 63 Zweistichprobenprobleme XIII Der Welch-Test, wenn beide Varianzen unbekannt und ungleich Nullhypothese: µ = µ gegen µ 6= µ (σ 6= σ ) näherungsweise Testgröÿe 1 2 1 2 1 2 2 2 X − Y T=q 2 SX SY2 n1 + n2 ist t -verteilt mit annähernd ν− Freiheitsgraden (Runden!) s s v= x+ y n n 2 2 1 2 !2 sy /n sx /n + n −1 n −1 2 / 1 1 2 2 2 2 ! 2 Rest wie beim doppelten t-Test Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 48 / 63 Zweistichprobenprobleme XIV Der Welch-Test, wenn beide Varianzen unbekannt und ungleich Beispiel: Ergiebigkeit von zwei Waldächen Nullhypothese: µ1 = µ2 (mittlere Festmeter sind gleich) n1 = 3, n2 = 4 sx2 = 0.243 53 und sy2 = 5. 666 7 × 10−2 x = 1. 433 3 und y = 1. 25 Berechnung der Testgröÿe: Testwert: |x − y | t = q 2 s2 sx y n1 + n2 =q Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) |1. 433 3 − 1. 25| 0.243 53 3 + 5. 666 74×10 Vorlesung 4 −2 = 0.593 63 05.05.2017 49 / 63 Zweistichprobenprobleme XV Der Welch-Test, wenn beide Varianzen unbekannt und ungleich Berechnung der Testgröÿe: (Freiheitsgrade) s s v= x+ y n n 2 2 1 2 !2 sy /n sx /n + n −1 n −1 2 / 2 2 1 2 2 ! 2 0.24353 5. 6667 × 10 + / 3 4 ! 5. 6667 × 10− /4 (0.24353/3) + 3−1 4−1 −2 2 = 1 2 2 2 = 2.70408 kritischer Wertes aus Tabelle auf Folie 46: k = 3.18 Wegen 0.59363 < 3.18 kann die Nullhypothese nicht verworfen werden. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 50 / 63 Testdurchführung mit R (Variante I) x <- c(1.2, 1.1, 2) y <- c(1.1, 1, 1.5, 1.4) t.test(x, y) ## ## ## ## ## ## ## ## ## ## ## Welch Two Sample t-test data: x and y t = 0.5939, df = 2.705, p-value = 0.5985 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.8626 1.2292 sample estimates: mean of x mean of y 1.433 1.250 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 51 / 63 Testdurchführung mit R (Variante II) x <- c(1.2, 1.1, 2, 1.1, 1, 1.5, 1.4) g <- c(rep("I", 3), rep("II", 4)) t.test(x ~ g) ## ## ## ## ## ## ## ## ## ## ## Welch Two Sample t-test data: x by g t = 0.5939, df = 2.705, p-value = 0.5985 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.8626 1.2292 sample estimates: mean in group I mean in group II 1.433 1.250 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 52 / 63 Zweistichprobenprobleme XVI Gleichheit der Mittelwerte aus einer verbundenen Stichprobe verbundenen Stichprobe: die beiden Grundgesamtheiten X und Y abhängig (matched-pair design) Nullhypothese: H : µ = µ gegen µ 6= µ Testgröÿe: 0 1 2 1 2 Zum Testen der Nullhypothese wird die Zufallsgröÿe gebildet. mathematische Stichprobe (D1 , . . . , Dn ) D = X −Y und als Testgröÿe D√ n, SD T= n − 1 Freiheitsgraden t -verteilt ist. Bestimmung des kritischen Wertes k −α/ mit FT ,n− k Bei |t | > k −α/ Ablehnung der Nullhypothese die mit 1 1 2 1 −α/2 1 = 1 − α2 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 53 / 63 Zweistichprobenprobleme XVII Gleichheit der Mittelwerte aus einer verbundenen Stichprobe Beispiel: Gegeben x 1.1 1.1 1 y 1 1.2 1.1 Sind die beiden (theoretischen) Mittelwerte gleich? Nullhypothese: µ = µ gegen µ 6= µ Berechnung des Testwertes: d 0.1 −0.1 −0.1 1 d =− 1 30 und d = 2 1 2 100 1 1 : sd = · 2 3 2 2 1 1 − − 30 100 2 = 0.013333 √ Es ist T = √ .− 30 · 3 = −0.50001 Bestimmung des kritischen Wertes aus einer Tabelle: 0 013333 Freiheitsgrad 1 2 3 0.975-Quantil 12.70 4.3 3.18 Nullhypothese nicht verwerfen Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 54 / 63 Testdurchführung mit R x <- c(1.2, 1.1, 1) y <- c(1, 1.2, 1.1) t.test(x, y, paired = TRUE) ## ## ## ## ## ## ## ## ## ## ## Paired t-test data: x and y t = 0, df = 2, p-value = 1 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.4303 0.4303 sample estimates: mean of the differences 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 55 / 63 Regeln für Ereignisse und Wahrscheinlichkeiten Gegeben seien: Ω Σ eine nichtleere Menge von Elementarereignissen eine sogenannte σ -Algebra von Ereignissen P ein Wahrscheinlichkeitsmaÿ. Eigenschaften von Σ: Ω ∈ Σ (das sichere Ereignis) A ∈ Σ, dann auch Ac ∈ Σ (gegenteilige A, B ∈ Σ, dann auch A ∪ B ∈ Σ Ereignis) Für P gilt: P (Ω) = 1 (Normierungsbedingung) Additivitätsaxiom: A, B ∈ Σ, A ∩ B = ∅ (gegenseitiger Ausschluss): P (A ∪ B ) = P (A) + P (B ). P (A) = 1 − P (A). Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 56 / 63 Beispielaufgabe Wie groÿ ist die Wahrscheinlichkeit bei 5 Würfen mindesten eine 6 zu werfen? Lösung: E - Ereignis mindestens eine 6 in 5 Würfen E - Ereignis keine 6 in 5 Würfen Es gilt (Würfe sind unabhängige Ereignisse): p E = 5 6 5 Folglich Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) P (E ) = 1 − P (E ) 5 = 1− 6 = 0.59812. 5 Vorlesung 4 05.05.2017 57 / 63 Diskrete Wahrscheinlichkeitsräume Ω = {ω1 , . . . , ωn } Σ = ℘(Ω) ∑ni=1 pi = 1: p ({ωi }) = pi und analog Ω = {ω , . . . , ωn , . . .} mit einer unendliche Folge von Elementarereignissen Beispiel: ( Bis zum ersten Mal eine ) Sechs fällt: 1 Ω= 6, 66, 666, . . . , 66 . . 66}, . . . | .{z Dann wäre n n−1 5 1 · p 66 . . . 66 = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 6 Vorlesung 4 6 05.05.2017 58 / 63 Der Begri der bedingten Wahrscheinlichkeit Beispielaufgabe An einer Tagung nehmen Männer und Frauen, die sich zum Frühstück entweder Kae oder Tee bestellen: Kaee Tee weiblich 10 20 . . . männlich 30 20 . . . ... ... ... a) Ergänzen Sie obige Tabelle! b) Wie groÿ ist die Wahrscheinlichkeit, daÿ ein weiblicher Gast, der zum Frühstück kommt, Tee trinkt? c) Wie groÿ ist die Wahrscheinlichkeit, daÿ ein Kaetrinker ein Mann ist? d) Sind die Merkmale Geschlecht des Tagungsteilnehmers und Getränkewahl unabhängig? Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 59 / 63 Rechenregeln für bedingte Wahrscheinlichkeiten Pfadregel E1 , E2 , . . . , En beliebige Ereignisse P (E1 ) > 0, P (E1 ∩ E2 ) > 0, . . . , P (E1 ∩ E2 ∩ . . . ∩ En−1 ) > 0 P (E1 ∩ . . . ∩ En ) = P (E1 ) P (E2 |E1 ) P (E3 |E1 ∩ E2 ) · . . . · P (En |E1 ∩ E2 ∩ . . . ∩ En−1 ) Formel von der totalen Wahrscheinlichkeit vollständiges Ereignissystem: E1 , . . . , En für n ∈ N , n ≥ 2 P (E ) = ∑ni=1 P (Ei ) · P (E |Ei ) Satz von Bayes vollständiges Ereignissystem: E1 , . . . , En für n ∈ N , n ≥ 2 E irgendein Ereignis mit P (E ) > 0 Dann gilt: P (E ) · P (E |Ei ) P (Ei |E ) = n i ∑j =1 P (Ej ) · P (E |Ej ) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 60 / 63 Die 1. Mittelwertsregel für stochastische Graphen Zustandmenge aus inneren und Randzuständen Vorgabe einer Zielmenge Z ⊂ R 1. Mittelwertsregel stochastische Graphen: pi Wahrscheinlichkeit bei Start in i in nach Z zu gelangen: Für i ∈ Z gilt pi = 1 und für i ∈ R \ Z hat man pi = 0 i ∈ I (innerer Zustand): Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) n pi = ∑ pij · pj . j =1 Vorlesung 4 05.05.2017 61 / 63 Beispiel I Lernfähigkeit von Insekten: Insekten haben die Möglichkeit entweder nach links bis zum Gift zu gelangen oder nach rechts bis zum Nektar. Gesucht wird die Wahrscheinlichkeit p vom Nest aus zum Nektar zu gelangen. Bezeichnungen: p nach rechts, q nach links, p + q = 1 p , p , p , p und p Absorptionswahrscheinlichkeiten bei Start in den zugehörigen Zuständen Nest Nest Gift L R Nektar Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 4 05.05.2017 62 / 63 Beispiel II Gleichungen: p = 0, p Gift Nektar =1 p p = p·p = q ·p +p·p pR = p + q · p L Nest Nest L R Nest Durch Einsetzen: p p (1 − 2pq ) p Nest = q · p · pNest + p · (p + q · pNest ) Nest = 2pqpNest + p 2 Nest = p2 p Nest p p = . (1 − 2pq ) 2p − 2p + 1 2 2 = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 4 05.05.2017 63 / 63