Statistik II für Betriebswirte Vorlesung 1

Werbung
Statistik II für Betriebswirte
Vorlesung 1
Prof. Dr. Hans-Jörg Starkloff
TU Bergakademie Freiberg
Institut für Stochastik
19. Oktober 2016
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
1
Organisatorisches
I
Vorlesung: Mi., 7:30-9:00, KKB-2030.
I
Übungen:
I
I
I
I
Mo., 14:00-15:30, WER-1118, Dr. Ballani, 3.BWIW.
Do., 9:15-10:45, PRÜ-1104, Dipl.-Math. Dietz, 3.BBWL.
Do., 14:00-15:30, PRÜ-1104, Dr. Wünsche, 3.BBWL, 3.BWLRW.
Fr., 11:00-12:30, HUM-1115, Dipl.-Math. Dietz, 3.BBWL.
I
Selbststudium (Laut Modulbeschreibung zusammen für beide
Semester 120 h Präsenzzeit und 150 h Selbststudium.)
I
Information: http://www.mathe.tu-freiberg.de/wiwistat
I
Prüfung: Klausur 120 Minuten, zugelassen sind Taschenrechner,
Bücher, Mitschriften; nicht zugelassen sind Laptops, Handys.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
2
Themenkomplexe in diesem Semester
I
Statistische Tests.
I
Stichprobenpläne.
I
Varianzanalyse.
I
Regressionsanalyse.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
3
Klausurergebnisse Statistik 1 für Betriebswirte
Prof.
ANOVA Table for Punkte by Fach
Source
Sum of Squares Df
Mean Square F-Ratio
Between groups 666,085
3
222,028
3,10
Within groups
6952,78 Statistik97
71,6781 Vorlesung 1
Dr. Hans-Jörg
Starkloff
II für Betriebswirte
P-Value
0,0304
Version: 18. Oktober 2016
4
Erinnerung: Statistik I
I
Statistische Grundsituation: Zufallsgröße X , für die die Verteilung
gar nicht oder nicht vollständig bekannt ist.
I
Bekannt: Konkrete Stichprobe (x1 , . . . , xn ) vom Umfang n , die als
Realisierung einer mathematischen Stichprobe (X1 , . . . , Xn )
modelliert wird (X1 , . . . , Xn sind unabhängige Zufallsgrößen, die
dieselbe Verteilung wie X besitzen).
I
Parameterschätzungen durch Punktschätzungen mit Hilfe von
Stichprobenfunktionen, z.B. falls X ∼ N(µ, σ 2 ), µ, σ 2 unbekannt:
1
(x1 + . . . + xn ) ;
n
c2 (x1 , . . . , xn ) = s 2 = 1 ((x1 − x)2 + . . . + (xn − x)2 ) .
VarX ≈ σ
n−1
EX ≈ µ
b(x1 , . . . , xn ) = x =
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
5
Fortsetzung Erinnerung: Statistik I
I
Parameterschätzungen durch Intervallschätzungen mit Hilfe
von Stichprobenfunktionen für die untere und obere Intervallgrenze,
z.B. falls X ∼ N(µ, σ 2 ), µ, σ 2 unbekannt:
Mit dem Quantil tn−1;1− α2 zum Niveau 1 − α2 der t-Verteilung mit
n − 1 Freiheitsgraden gilt
√ X −µ
≤ tn−1;1− α2 = 1 − α ,
P −tn−1;1− α2 ≤ n
S
S
S
P X − √ tn−1;1− α2 ≤ µ ≤ X + √ tn−1;1− α2 = 1 − α .
n
n
I
Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall
Iµ für den Erwartungswert µ einer Normalverteilung bei unbekannter
Varianz σ 2 zum Konfidenzniveau 1 − α
S
S
Iµ = X − √ tn−1;1− α2 ; X + √ tn−1;1− α2 .
n
n
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
6
4. Grundlagen des statistischen Schließens II (Tests)
4.1 Parametertests
I
I
Eine Hauptaufgabe der schließenden Statistik besteht in der
Durchführung von Tests.
Dabei werden Hypothesen (d.h. Annahmen, Vorgaben, etc.) über
wahrscheinlichkeitstheoretische Modelle mit Hilfe von Stichproben
überprüft, z.B.
I
I
I
I
die Einhaltung von Sollwerten,
die Einhaltung von Toleranzgrenzen,
die Einhaltung von Ausschusswahrscheinlichkeiten oder
der Vergleich von unterschiedlichen Verfahren hinsichtlich eines
(mittleren) Qualitätsparameters.
Der Zufallseinfluss (man nutzt Werte einer Stichprobe zur
Entscheidung, eine andere Stichprobe kann zu einer anderen
Entscheidung führen) spielt eine wesentliche Rolle.
⇒ Man kann keine 100%-ig richtigen Entscheidungen treffen, sondern
die Entscheidungen sind immer auch mit möglichen Fehlern und
entsprechenden Fehlerwahrscheinlichkeiten verbunden.
I
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
7
Beispielaufgabe: Waschmittelpackungen
I
Bei einem Verbrauchertest für Waschmittel werde auch die
Abfüllmenge kontrolliert. Dabei ergaben sich bei 10 zufällig
ausgewählten 5 kg Packungen einer bestimmten Sorte folgende
Abfüllmengen (in kg):
4.6 , 4.95 , 4.8 , 4.9 , 4.75 , 5.05 , 4.9 , 5.1 , 4.85 , 4.95 .
Ist auf der Basis dieser Beobachtungswerte die Auffassung
vertretbar, dass die Packungen im Mittel weniger Waschmittel als
angegeben enthalten ?
I
Wir modellieren die tatsächliche Abfüllmenge (in kg) einer
Waschmittelpackung als Zufallsgröße X .
I
Berechnete Schätzwerte für den Erwartungswert, die
Standardabweichung und die Varianz der Merkmalsgröße sind:
x = 4.885 ,
Prof. Dr. Hans-Jörg Starkloff
s = 0.145 ,
s 2 = 0.0211 .
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
8
Mathematische Überlegungen zur Beispielaufgabe
I
Wir nehmen an, diese Zufallsgröße X ist normalverteilt (Addition
vieler kleiner zufälliger Schwankungen im Abfüllprozess und zentraler
Grenzwertsatz).
I
Der Erwartungswert µ ist unbekannt.
I
Zur Vereinfachung nehmen wir an, die Varianz sei σ 2 = 0.025 .
I
Zu überprüfen ist die Richtigkeit der Vermutung, dass der
Erwartungswert µ kleiner ist als der Sollwert µ0 = 5 .
I
Dies kann aber nicht einfach aus der Tatsache
x = 4.885 < 5 = µ0
gefolgert werden.
I
Man kann schließlich zufällig eine Stichprobe mit geringen
Abfüllmengen erwischt haben.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
9
Grundlegende Überlegungen zu statistischen Tests I
I
Aufstellen der Hypothesen:
man formuliert 2 komplementäre Hypothesen, die Nullhypothese H0
und die Alternativhypothese HA (oft auch mit H1 bezeichnet)
z.B.
oder
H0 : µ = µ 0
H0 : µ ≥ µ 0
und
und
HA : µ 6= µ0
HA : µ < µ0 .
Beachte: Die Hypothese, die statistisch abgesichert werden soll,
sollte als Alternativhypothese formuliert werden!
I
2 mögliche Entscheidungen beim Testen:
1. H0 wird verworfen: Es gibt in der erhobenen Stichprobe starke
Hinweise darauf, dass H0 nicht gelten kann, also HA gelten muss.
Diese Hinweise sind so stark, dass man nicht von einem zufälligen
Zustandekommen ausgehen kann.
2. H0 wird nicht verworfen: Man hat keine Hinweise gefunden, die gegen
H0 sprechen. Alle aufgetretenen Effekte könnten genauso gut
zufallsbedingt sein.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
10
Grundlegende Überlegungen zu statistischen Tests II
I
Statistisches Testproblem: Aufgabenstellung, zwischen der Gültigkeit
von H0 und HA zu unterscheiden.
I
Statistischer Test: formale Entscheidungsregel für eine der 2
Möglichkeiten.
I
Mögliche Fehler beim Testen:
I
I
Fehler 1. Art: man verwirft H0 , obwohl H0 richtig ist;
Fehler 2. Art: man verwirft H0 nicht, obwohl H0 falsch ist.
⇒ Tests sind so zu konstruieren, dass beide Fehler möglichst klein sind.
I
Aber: Es können nicht beide Fehler gleichzeitig kontrolliert werden.
⇒ Man gibt sich eine (relativ kleine) obere Schranke für die
Wahrscheinlichkeit des Fehlers 1. Art vor, die nicht überschritten
werden soll – das sogenannte Signifikanzniveau α.
I
Übliche Werte für das Signifikanzniveau α sind 0.05 oder 0.01.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
11
Grundlegende Überlegungen zu statistischen Tests III
I
In der Regel wird ein statistischer Test so konstruiert, dass er unter
allen Tests, für die die Wahrscheinlichkeit des Fehlers 1. Art das
gegebene Signifikanzniveau nicht überschreitet, den Fehler 2. Art
minimiert.
I
Wie erhält man eine Entscheidungsregel für ein gegebenes
Testproblem?
I
Im obigen Beispiel würde man intuitiv so vorgehen:
I
I
I
I
Hypothesen: H0 : µ ≥ µ0 = 5 , HA : µ < 5 ;
liegt der Schätzwert x für µ über oder nur knapp unter µ0 = 5 ,
so kann man nicht mit hinreichender Sicherheit schließen, dass
H0 : µ ≥ µ0 = 5 nicht gilt;
liegt hingegen x unter einem kritischen Wert deutlich unter
µ0 = 5 , so kann man die Nullhypothese verwerfen.
Wie weit der kritische Wert unter µ0 liegen muss, hängt vom
Signifikanzniveau α ab.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
12
Allgemeine Struktur der Entscheidungsregel
I
Testgröße T :
I
I
I
I
I
Kritischer Bereich Kα (auch Ablehnungsbereich) :
I
I
I
I
ist eine Stichprobenfunktion (d.h. eine Funktion der mathematischen
Stichprobe X1 , ..., Xn ), also eine Zufallsgröße;
ist bei Parametertests oft eine Schätzfunktion für den zu testenden
Parameter oder davon abgeleitet (im Beispiel X );
die Verteilung von T bei Gültigkeit der Nullhypothese muss bekannt
sein;
setzt man statt der mathematischen Stichprobe eine konkrete
Stichprobe x1 , ..., xn ein, so erhält man eine reelle Zahl t als
Realisierung der Zufallsgröße T .
ist von α abhängig;
wird so konstruiert, dass P(T ∈ Kα |H0 ) ≤ α gilt;
im Beispiel ist Kα = {t ∈ R : t < tα } , wobei tα der oben
erwähnte kritische Wert ist.
Die Entscheidung lautet dann: ist t ∈ Kα , so wird H0 verworfen,
andernfalls nicht.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
13
Allgemeiner Testablauf
I
Alternative Entscheidungsregel (zumeist in statistischer Software
umgesetzt):
I
I
I
Berechnung eines p-Werts : p = min{α : t ∈ Kα } ;
H0 wird verworfen, wenn p ≤ α , bei p > α wird H0 beibehalten.
Allgemeiner Ablauf eines statistischen Tests:
1.
2.
3.
4.
Aufstellen der Hypothesen
Festlegen des Signifikanzniveaus α
Bestimmen der Testgröße T
Berechnung der Realisierung t der Testgröße T auf der Basis
der konkreten Stichprobe (x1 , . . . , xn )
5. Bestimmen des kritischen Bereichs Kα bzw. des p-Wertes
6. Testentscheidung:
t ∈ Kα
t 6∈ Kα
I
⇔
⇔
p≤α
p>α
⇒ Ablehnung von H0 ;
⇒ Stichprobe spricht nicht gegen H0 .
Neben der formalen Testentscheidung sollte noch eine inhaltliche
Aussage entsprechend der Aufgabenstellung getroffen werden.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
14
Interpretation der Testergebnisse
I
Beim Testen wird nur die Wahrscheinlichkeit für den Fehler 1. Art
kontrolliert, d.h.
P(H0 ablehnen | H0 wahr) ≤ α .
I
Wenn also H0 tatsächlich gilt, wird man sich nur in α · 100% der
Fälle für HA entscheiden.
I
Die Entscheidung für HA ist in diesem Sinn statistisch abgesichert.
I
Bei einer Entscheidung gegen H0 und damit für HA spricht man von
einem signifikanten Ergebnis.
I
Die Wahrscheinlichkeit für den Fehler 2. Art wird erst einmal nicht
kontrolliert.
⇒ Eine Entscheidung H0 beizubehalten ist nicht statistisch abgesichert.
⇒ Kann man H0 nicht verwerfen, bedeutet das daher nicht, dass man
sich aktiv“ für H0 entscheidet; es spricht nur nichts gegen H0 .
”
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
15
Einfluss verschiedener Größen auf das Ergebnis eines Tests
I
Einfluss von α (andere Parameter fest):
I
I
I
Für kleiner werdende Werte α wird die Wahrscheinlichkeit für den
Fehler 1. Art kleiner, d.h. H0 wird weniger häufig abgelehnt, falls H0
tatsächlich zutrifft.
Je kleiner α ist, desto kleiner ist der kritische Bereich.
Einfluss von n (andere Parameter fest):
I
I
Für größer werdende Werte n werden die Schätzungen auf Basis von
erwartungstreuen und konsistenten Schätzgrößen genauer und man
wird öfters richtig entscheiden.
Insbesondere wird die Wahrscheinlichkeit für den Fehler 2. Art kleiner
und damit wird man öfter die Nullhypothese H0 ablehnen, wenn sie
falsch ist.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
16
Konfidenzintervalle und Parametertests
I
Eine Hypothese über einen Parameter einer Verteilung heißt einfach,
wenn durch sie nur ein Element der Parametermenge festgelegt wird
(z.B. µ = µ0 ), sonst heißt eine Hypothese zusammengesetzt.
I
Ein Konfidenzintervall mit Konfidenzniveau 1 − α für einen
Parameter enthält genau diejenigen Werte des Parameters, für die
die einfache Nullhypothese zu diesem Parameter mit einem
Signifikanzniveau α nicht abgelehnt wird.
I
Im Folgenden sollen einige wichtige Tests bei normalverteilten
Grundgesamtheiten kurz vorgestellt werden.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
17
Mittelwerttest bei bekanntem σ (Gauß-Test)
I
Annahme: X ∼ N(µ, σ 2 ),
I
Zweiseitiger Test
I
I
I
I
I
σ 2 bekannt.
Hypothesen: H0 : µ = µ0 , HA : µ 6= µ0 .
2
Unter H0 gilt: X ∼ N µ0 , σn .
X − µ0 √
n ∼ N(0, 1) .
σ
Kritischer Bereich: Kα = {t ∈ R : |t| > z1−α/2 } .
Testgröße: T =
Einseitige Tests
I
Im Fall von H0 : µ ≥ µ0 ,
HA : µ < µ0 gilt
Kα = {t ∈ R : t < zα = −z1−α } .
I
Im Fall von H0 : µ ≤ µ0 ,
HA : µ > µ0 gilt
Kα = {t ∈ R : t > z1−α } .
I
Die Tests sind für große Werte n (n ≥ 30) auch ohne
Normalverteilungsvoraussetzung anwendbar.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
18
Mittelwerttest bei unbekanntem σ ( t−Test“)
”
I
Annahme: X ∼ N(µ, σ 2 ),
I
Zweiseitiger Test
I
I
I
I
σ 2 unbekannt.
Hypothesen: H0 : µ = µ0 , HA : µ 6= µ0 .
X − µ0 √
Testgröße: T =
n ∼ tn−1 (t−Verteilung mit n − 1
S
Freiheitsgraden).
Kritischer Bereich: Kα = {t ∈ R : |t| > tn−1;1−α/2 } .
Einseitige Tests
I
Im Fall von H0 : µ ≥ µ0 ,
HA : µ < µ0 gilt
Kα = {t ∈ R : t < tn−1;α = −tn−1;1−α } .
I
Im Fall von H0 : µ ≤ µ0 ,
HA : µ > µ0 gilt
Kα = {t ∈ R : t > tn−1;1−α } .
I
Die Tests sind für große Werte n (n ≥ 30) auch ohne
Normalverteilungsvoraussetzung anwendbar.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
19
Streuungstest
( χ2 −Streuungstest“)
”
I
Annahme: X ∼ N(µ, σ 2 ) ,
I
Zweiseitiger Test
I
I
I
I
µ unbekannt.
Hypothesen: H0 : σ = σ0 , HA : σ 6= σ0 .
(n − 1)S 2
∼ χ2n−1 (χ2 -Verteilung mit n − 1
Testgröße: T =
σ02
Freiheitsgraden).
Kritischer Bereich:
Kα = {t ∈ R : t < χ2n−1;α/2 } ∪ {t ∈ R : t > χ2n−1;1−α/2 }
Einseitige Tests
I
Im Fall von H0 : σ ≥ σ0 ,
HA : σ < σ0 gilt
Kα = {t ∈ R : t < χ2n−1;α } .
I
Im Fall von H0 : σ ≤ σ0 ,
HA : σ > σ0 gilt
Kα = {t ∈ R : t > χ2n−1;1−α } .
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
20
Mittelwertvergleich bei gleichen (unbekannten) Varianzen
( doppelter t−Test“)
” I Geg.: zwei unabh. Merkmale X ∼ N(µ , σ2 ), X ∼ N(µ , σ2 ) ;
1
1
2
2
entsprechend zwei Stichproben vom Umfang n1 und n2 mit
arithmetischen Mittelwerten X 1 und X 2 und
Stichprobenvarianzen S12 und S22 .
I
Voraussetzung: beide Varianzen sind gleich σ 2 , σ 2 ist unbekannt.
I
Hypothesen: H0 : µ1 = µ2 , HA : µ1 6= µ2 (zweiseitiger Test).
r
X1 − X2
n1 n2
Testgröße: T = q
.
(n1 −1)S12 +(n2 −1)S22
n1 + n2
I
n1 +n2 −2
Im Fall von n1 = n2 = n gilt
X1 − X2 √
T =q
n.
S12 + S22
I
Kritischer Bereich: Kα = {t ∈ R : |t| > tn1 +n2 −2;1−α/2 } .
I
Die Tests sind für große Werte n1 , n2 (Faustregel: n1 , n2 ≥ 30) auch
ohne Normalverteilungsvoraussetzung anwendbar.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
21
Mittelwertvergleich bei möglicherweise ungleichen
Varianzen ( Welch-Test“)
”
I
Geg.: Zwei unabh. Merkmale X1 ∼ N(µ1 , σ12 ) , X2 ∼ N(µ2 , σ22 ) ;
entsprechend zwei Stichproben vom Umfang n1 und n2 mit
arithmetischen Mittelwerten X 1 und X 2 und
Stichprobenvarianzen S12 und S22 .
I
Voraussetzung: σ12 , σ22 sind unbekannt.
I
Hypothesen: H0 : µ1 = µ2 ,
X1 − X2
Testgröße: T = q 2
S1
S22
n1 + n2
I
I
(zweiseitiger Test).
Kritischer Bereich: Kα = {t ∈ R : |t| > tm;1−α/2 },
2


2 2
m=
I
HA : µ1 6= µ2
S1
n1
1
n1 −1
S2
1
n1
S
+ n2
2
2
+ n 1−1
2
S2
2
n2
2 
(Abrundung zur ganzen Zahl)
int
Bemerkung: Dies ist ein approximativer Test.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
22
Streuungsvergleich
( F −Test“)
”
I
Geg.: Zwei unabh. Merkmale X1 ∼ N(µ1 , σ12 ) , X2 ∼ N(µ2 , σ22 ) ;
entsprechend zwei Stichproben vom Umfang n1 und n2 mit
Stichprobenvarianzen S12 und S22 .
I
Voraussetzung: µ1 , µ2 unbekannt.
I
Hypothesen: H0 : σ12 = σ22 ,
I
Testgröße: T =
I
Kritischer Bereich:
Kα = {t > 0 : t < Fn1 −1;n2 −1;α/2 } ∪ {t > 0 : t > Fn1 −1;n2 −1;1−α/2 }
HA : σ12 6= σ22
(zweiseitiger Test).
S12
.
S22
(Quantile der F −Verteilung mit (n1 − 1; n2 − 1)-Freiheitsgraden).
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
23
Beispiel: Analyseverfahren
I
Verfahren 1 :
x 1 = 0.99 , s1 = 0.0236 , n1 = 10 .
1.01 , 0.99 , 1.02 , 0.97 , 1.00 , 0.94 , 0.98 , 1.00 , 1.01 , 0.98
Verfahren 2 :
x 2 = 1.00 , s2 = 0.0471 , n2 = 10 .
0.98 , 1.02 , 1.04 , 1.00 , 1.06 , 0.96 , 1.02 , 0.90 , 0.98 , 1.04
I
H0 : µ1 = 1.00 ,
HA : µ1 6= 1.00 , α = 0.05 .
I
H0 : σ1 ≤ 0.01 ,
HA : σ1 > 0.01 , α = 0.05 .
I
H0 : σ12 = σ22 ,
HA : σ12 6= σ22 , α = 0.10 .
I
H 0 : µ1 = µ2 ,
HA : µ1 6= µ2 , α = 0.05 (Welch-Test).
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 1
Version: 18. Oktober 2016
24
Herunterladen