MAT ZSF

Werbung
Mathematik- Zusammenfassung
M5 Folgen und Reihen
Def: an+1 – an = d
Folge
(Sobald Veränderungen im Exponent => GF)
= Sequenz von Werten
an = a1 + (n – 1) × d (Bildungsgesetz)
endlich:
unendlich:
<a1, a2, a3>
<a1, a2, ...>
f:n→an, n ∈ |N*3
f:n→an, n ∈ |N*
=>Startwert ist immer erstes Glied der Folge
Bildungsgesetz
an = f(n) ist nicht rekursiv!
Rekursion
Vorschrift:
Basis:
Beispiel:
ergibt
Bildung:
an+1 = f(an), n ∈ |N*
a1 = 3
an+1 = 2 × an, n ∈ |N*, a1 = 3
<3, 6, 12, 24, ...>
a1 = 3
a2 = 3 × 2
a3 = 3 × 2 × 2
a4 = 3 × 2 × 2 × 2
an = 3 × 2n–1
unendlich:
a1 + a2 + ...
Summe der ersten n Glieder
n
? (ai)
i=1
Summe aller Glieder (unendliche Summe)
8
s =
n
n × (n – 1)
× (a1 + an) = n × a1 +
×d
2
2
Geometrische Folge/Reihe
an+1
=q
an
an = a1 × qn–1 (Bildungsgesetz)
sn = a1 ×
qn – 1
,q≠1
q–1
Summe unendliche geom. Reihe
a1
s=
, |q| < 1
1–q
Multiplikator =
a1
s
Monotonie / Beschränktheit
= Summen einer Folge
endlich:
a1 + a2 + a3
sn =
Def:
Reihe
sn =
Arithmetische Folge/Reihe
an+1 ≥ an
an+1 ≤ an
an ≤ s
an ≥ s
an ≤ smax ∧ an ≥ smin
monoton wachsend
monoton fallend
nach oben beschränkt
nach unten beschränkt
beschränkt
s: reele Zahl
Logarithmusregeln
? (ai)
i=1
an => n-tes Glied
< an> => Folge
y = a x ⇔ x = log a y
loga b n = n ⋅ log a b
loga (b ⋅ c) = log a b + log a c
b
loga   = loga b − log a c
c
log y ln y
loga y =
=
log a ln a
Der Logarithmus negativer Zahlen ist nicht definiert.
2. Jahr (29.4.2003)
Christian Meyer
Seite 1 / 17
Stetige Verzinsung
Grenzwert
Zinseszins mit jährlicher Verzinsung (ZiZi)
offene ε-Umgebung von a: Uε(a) = ]a – ε, a + ε[
Jährl. effektive Wachstumsrate
Def: a ist Grenzwert von <an>, wenn in jeder noch so
kleinen Umgebung von a, alle bis auf endlich viele an
liegen.
lim an = a
Kn = K0 × (1 +
peff n
) , peff = effektiver Jahreszins
100
Zinseszins mit m-jährlicher Verzinsung:
1 m× n
k× p
1
m=
=
und
Kn = K0 × (1 + k )
100
n→8
Jede Folge, die monoton und beschränkt ist, hat einen
Grenzwert.
Häufungswerte: Folge schwankt zwischen n Werten
Nullfolge: Grenzwert = 0
=> ∞ ist KEIN Grenzwert
konvergiert: Folge hat Grenzwert
divergiert: Folge hat keinen Grenzwert
k
p
m ⋅ 100
Zinseszins mit stetiger Verzinsung
Stetige Rendite / stetige od. nominale Wachstumsrate
Kn = K0 × e0.01 × ps
×n
, ps = stetiger/nominaler Jahresz.
Umrechnung:
peff = 100 × (e0.01 × ps – 1)
ps = 100 × ln (1 +
peff
)
100
Grenzwert berechnen:
Bei Potenzen:
immer mit dem Kehrwert der höchsten Potenz
multiplizieren
•
Wenn ein Nenner eine Nullfolge ist, gibt es
keinen Grenzwert
•
Wenn Zähler und Nenner eine Nullfolge sind,
KANN es einen Grenzwert geben (beide Fkt.
Müssen gleichschnell nach 0 laufen)
Durchschnittliche Rendite
= geom. Mittel von peff (5% = 1.05)
= arithm. Mittel von ps
Renditeberechnung mit Anfangs- und Endwert NUR
wenn keine Dividenden ausgeschüttet wurden.
Standardabweichung darf nur von ps berechnet
werden!
Grenzwertsätze
Renditen
Gegeben
<an> mit lim an = a und <bn> mit lim bn = b
∅ Rendite
n→8
Zur Bestimmung von ∅ Wachstumsraten:
n→8
=> gilt nur, wenn a und b konvergent sind
<c × an> gilt
lim (c × an ) =
<an ± bn> gilt
n→8
lim (an ± bn)=
lim ( an ) ± lim ( bn ) = a ± b
n→8
n→8
<an × bn > gilt lim (an × bn) =
n→8
lim
an
bn
=c×a
c lim ( an )
n→8
≠
lim an
lim bn
n→8
lim ( an ) × lim ( bn)
n→8
reff = 100 ⋅ n a1 ⋅ a2⋅ ...a n wobei z.B. 1.1 für 10%
∅ stetige Rendite
n→8
=a×b
 reff 

rs = 100 ⋅ ln
 100 
rs = 100 ⋅ ln n a1 ⋅ a2 ⋅ ... ⋅ a n
∅-stetige Rendite ist arithmetisches Mittel der stetigen
Renditen:
n
rs =
2. Jahr (29.4.2003)
Christian Meyer
∑r
k =1
sk
n
Seite 2 / 17
M6 Finanzmathematik
Renten
Abschreibungen
I0 = Anschaffungswert
In = Schrottwert / Liq. Erlös
At = Abschreibungsbetrag
im Jahr t
It = Zeitwert im Jahr t (Restwert)
A = Annuität
n = Nutzungsdauer in Jahre
t = Jahr
p
q = 1 + 100
Lineare Abschreibung
Jedes Jahr wird ein fester Betrag (A) abgeschrieben.
I –I
A= 0 n
(AF) (A: Abschreibungseinheit)
n
t
0
1
2
3
At
It
10’000
8’000
6’000
4’000
2’000
2’000
2’000
A
A
A
Zeitwerte It liegen auf einer Geraden
Digitale / arithm. degressive Abschreibung
Im ersten Jahr werden n Einheiten, im zweiten (n – 1)
Einheiten, im n-ten Jahr 1 Einheit abgeschrieben.
2 × (I0 – In)
E=
(AF)
n × (n + 1)
E: Summe der Abschreibungsbeiträge bis zum n-ten Jahr
At = (n – t + 1) × E (Veränderung Abschr.Wert)
nachschüssiger Rentenendwert
qn – 1
sn = r ×
q–1
vorschüssiger Rentenendwert
qn – 1
sn' = r × q ×
q–1
2’500
vorschüssiger Rentenbarwert
r
qn – 1
B' =
n–1×
q
q–1
Zahlung Ende Jahr: postnumerando / nachschüssig
Zahlung zu Periodenbeginn: vorschüssig
Kapital K0 zum Zeitpunkt 0,
Einzahlung/Entnahme von r Franken, n Jahre lang,
peff Jahreszins.
It liegt auf einer nach oben geöffneten Parabel mit
t
At
It
Scheitelpunkt:
0
25’000
s (n + 1 / ... )
1
3*E
7’500 17’500
2
2
2*E
5’000 12’500
nachschüssiger Endwert
Kn = K0 × qn ± (r ×
10’000
Geometrisch degressive Abschreibung
Jedes Jahr werden p% vom Zeitwert des Vorjahres
abgeschrieben.
p
At = I0 ×
100
qn – 1
)
q–1
E = K ⋅ q n ± sn
vorschüssiger Endwert
Kn' = K0 × qn ± (r × q ×
qn – 1
)
q–1
E ' = K ⋅ q n ± s 'n
p n
It = I0 × (1 –
)
100
t
1
2
3
4
At
Formel

I 
p = 1 − n n  ⋅100
I0 

p
100
Sparkassenformel
E
1
It = × t2 – E × (n + ) × t + I 0
2
2
1*E
q −1 =
nachschüssiger Rentenbarwert
r qn – 1
B= n×
q
q–1
It = I 0 – t × A
3
Einzahlung von r Franken, n Jahre lang, peff
Jahreszins. sn:RentenENDwert
It
40’000
10’000 30’000
7’500 22’500
5’625 16’875
+ Einzahlung
- Entnahme
(Zeitwerte It liegen auf einer Exponentialkurve.)
Die Abschreibungsbeträge und die Zeitwerte bilden
eine geometrische Folge.
2. Jahr (29.4.2003)
Christian Meyer
Seite 3 / 17
Barkredit
Ewige Rente
Methode der mittleren Kreditfrist
Kapital K0 zum Zeitpunkt 0,
n Jahre lang, peff Jahreszins.
(KEIN Zinseszins)
Es wird nur soviel Rente ausbezahlt, wie Zins
vorhanden ist, das Kapital wird nicht aufbebraucht:
K×p
r=
100
nachschüssiger Barwert:
r
B=
q–1
vorschüssiger Barwert:
r×q
B' =
q–1
Modell "HSW Luzern"
=> Raten und Tilgungen immer nachschüssig
Höhe einer Monatsrate:
K × qn × (q – 1)
r = n
(q – 1) × (12 + 5.5 × [q – 1])
Annuität = Zins + Tilgungsbetrag
Gleichbleibende Tilgung (Ratentilgung)
K
n
Zins
2’400
1’800
1’200
600
Tilgung
10’000
10’000
10’000
10’000
Angewandter Zinssatz:
Mit dem Solver die folgende Gleichung nach q
auflösen:
q–1
r × (12 + 5.5 × [q – 1]) – K × qn × n
=0
q –1
Annuität
12’400
11’800
11’200
10’600
Annuitätenmethode
Gleichbleibende Annuität
(Annuitätentilgung)
Monatliche Verzinsung der Schuld wird unterstellt. Der
Kredit wird in gleichen Monatsraten getilgt.
Fester Zinssatz:
Annuität A = K × qn ×
t
1
2
3
4
Schuld
41’130
31’728
21’762
11’198
Monatszinsatz:
Folgende Gleichung mit Solver nach q auflösen:
q–1
r = K × qn × n
q–1
q–1
qn– 1
Zins
2’468
1’904
1’306
672
Tilgung
9’402
9’966
10’564
11’198
Annuität
11’870
11’870
11’870
11’870
è SOLVE è SOLVE FINANCE è
N: Anzahl Raten
I%YR: Jahreszins PV: Barwert
PMT: Rate (negativ) P/YR: Anzahl Raten pro Jahr
FV: Endwert
Für einzelne Tilgungen: AMOR è bei PRINCIPAL:
AMOR è BàPV è AMOR usw.
Principal: Tilgung
Interest: Zins
bei gleichen Raten und gleichen Zahlungsabständen:
erste Frist + letzte Frist
MK =
2
Angewandter Zinssatz:
1200 × (n × r – K)
p =
MK × K
Die Schuld K ist in n nachschüssigen Annuitäten
abzutragen.
Schuld
40’000
30’000
20’000
10’000
? der Kreditfristen
Anzahl Raten
n: Anzahl Raten, p: Jahreszins (effektiv)
Tilgung
t
1
2
3
4
Mittlere Kreditfrist MK =
Höhe einer Monatsrate:
K
MK × K × p
+
r =
n
n × 1200
Jährlicher Aufwand => immer nachschüssig
Tilgung T =
bei gleichen Raten:
Balance: Schuld
Zinssatz wechselt nach w Jahren:
q1 = Zins bis und mit Jahr w (5 % = 1.05)
q2 = Zins ab Jahr w bis Jahr n
K × q1w × q2n–w
A=
w
q1 – 1
q n–w – 1
× q2n–w + 2
q1 – 1
q2 – 1
Jahreszinsssatz:
Nominaler Jahreszins aus Monatszinsatz:
pjs = 12 × PM
Effektiver Jahreszins aus Monatszinsatz:
PM 12
pjeff = [ (1 +
) – 1] × 100
100
Beispiel: Kredithöhe 20'000.–, rückzahlbar in 30
Monaten zu Fr. 803.55, beginnend 1 Monat nach
Kreditaufnahme.
Höhe einer Monatsrate:
q–1
r = K × qn × n
q–1
Auf TR Annui-> WeAnn
q1=q
q2=t
2. Jahr (29.4.2003)
Christian Meyer
Seite 4 / 17
Dynamische Investitionsrechnung
Bei der dynamischen Investitionsrechnung wird nur in
die Zukunft gerechnet. Werte aus der Vergangenheit
werden nie berücksichtigt, weil man diese nicht mehr
beeinflusenkann.
Kapitalwertmethode
(Net Present Value Method)
e: Einzahlung (Personal-, Servicekosten)
a: Auszahlung (Verkaufserlös)
en-a n=Nettoeinzahlung
Die Investition ist vorteilhaft, wenn K0 > 0 ist.
n
e –a
L
K0 = ? ( t t t ) + nn – I0 wobei q = (1+p/100)
q
q
t=1
Barwert: (Zeitpunkt t=0) aller Nettoeinzahlungen bei Verwendung
eines Kalkulationszinssatzes: p
(Gegenwartswert, Nettobarwert, Discounted cash-Flow)
Methode des internen Ertragssatzes
(Internal Rate of Return Method)
Die Investition ist vorteilhaft, wenn der interne Ertragssatz
mindestens so hoch ist, wie die geforderte Zielrendite.
n
K0 = ? (
t=1
L
et – at
) + nn – I0 = 0
qt
q
Der interne Ertragsatz ist derjenige Kalkulationszinssatz, für
den der Kapitalwert = 0 ist.
Spezialfall ewige Rente:
e–a
p = 100 ×
I0
Spezialfall gleiche Nettoeinzahlungen und Ln = I0:
e–a
p = 100 ×
I0
n: unbegrenzt, kein Liquidationserlös, NUR bei
konstanten Raten lösbar
Spezialfall Es gibt nur 2 Zahlungen:
L
p = 100 × [ n√( n )– 1]
I0
Mehr als ein oder kein interner Ertragssatz
Ökonomisch unnütz, stattdessen auf Kapitalwertmethode
oder Annuitätenmethode ausweichen.
Annuitätenmethode
Die Investition ist vorteilhaft, wenn
Einzahlungsannuität > Auszahlungsannuität
Einzahlungsannuität:
AE = BE ⋅ q n ⋅
q −1  n et Ln  n q −1
=∑ + ⋅ q ⋅ n
q n −1  t=1 qt qn 
q −1
Auszahlungsannuität:
AA = BA ⋅ q n ⋅

q − 1  n at
q −1
=  ∑ t + I 0  ⋅ q n ⋅ n
n
q − 1  t =1 q
q −1

et − at Ln
+ n − I0
qt
q
t =1
q −1
A = K 0 ⋅ qn ⋅ n
q −1
n
Kapitalwert:
Annuität:
K0 = ∑
2. Jahr (29.4.2003)
Christian Meyer
Seite 5 / 17
Extremwerte, Wendepunkte
Differentialrechnung
f'(x0) = 0
Ableitungsregeln
⇔ Horizontale Tangente
x0 = f'(x) = 0 und f''(x0) < 0
(Umkehrun gilt nicht)
x0 = f'(x) = 0 und f''(x0) > 0
x0 = f''(x) = 0 und f'''(x0) ≠ 0
Wendetangente geht durch Punkt P(0 /0)
⇒ f'(x) = 1
f(x) = xn
⇒ f'(x) = n • xn – 1 , n ∈ |Q*
f(x) = x–n
⇒ f'(x) = –n • x–n – 1
f(x) = c • g(x)
⇒ f'(x) = c • g'(x) (Faktorregel)
Im Wendepunkt ist die Steigung des Graphen
bezüglich seiner Umgebung von x0 maximal oder
minimal.
f''(x) > 0 : Graph ist nach links gekrümmt (konvex)
f''(x) < 0 : Graph ist nach rechts gekrümmt (konkav)
f(x) = g(x) ± h(x) ⇒ f'(x) = g'(x) ± h'(x) (Summenregel)
Ganz-Rationalen Funktion
f(x) = anxn + an–1xn–1 + ... + a2x2 + a1 x + a0 ⇒
f(x) = n × anxn–1 + (n–1) × an–1xn–2 + ... + 2 × a2x + a1
Produktregel
f(x) = g(x) • h(x) ⇒ f'(x) = g'(x) • h(x) + g(x) • h'(x)
Quotientenregel
Z(x)
f(x) =
⇒ f'(x) = Z' • N –2Z • N'
N(x)
N
f(x) = ax
Berechnung Wendetangente:
f''(x) = 0 =>
x1 => f'''(x1) ≠ 0 = m1
x2 => f'''(x2) ≠ 0 = m2
m1/ m2: Steigung der Wendetangente
in f'(m1) = y: um y zu erhalten
Bestimmung von m, so dass Parabel und Gerad
sich berühren
f1(x) = ax2+bx+c
f2(x) = mx + q (wobei q gegeben)
Steigung: f'1(x) = f'2(x) = m
Berührungspunkt: f1(x) = f2(x)
ax2+bx+c = mx + q auf => x lösen !
x in vorhandene (gegebene) Formel einsetzen um y
zu erhalten
Logarithmus- und der Exponentialfunktion
1
1
f(x) = ln x = loge x ⇒ f'(x) = x =
וln e
f(x) = ex ⇒ f'(x) = e x
⇒ Wendepunkt
(Umkehrun gilt nicht)
f(x) = x
⇒ f'(x) =
⇒ Lokales Minimum
(Umkehrun gilt nicht)
Ableitungen der Funktion
f(x) = c
⇒ f'(x) = 0
f(x) = loga x
⇒ Lokales Maximum
Ökonomische Anwendungen
1
× •·ln a
Produktionsfunktion
f(x) = e2x ⇒ f'(x) = 2•e2x
⇒ f'(x) = ax • ln a
Kettenregel
Klassisches Ertragsgesetz
Bei wachsendem Faktoreinsatz steigt der
Ertragszuwachs zunächst. Nach erreichen eines
bestimmten Optimums (Wendepunkt) sinkt der
Ertragszuwachs bei wachsendem Faktoreinsatz.
=>Optimum ist beim Wendepunkt = grösster
Grenzertrag
f(x) = g( h(x) ) = g(v) ⇒ f'(x) = g'(v) • h'(x)
⇒ f'(x) = g'(h(x)) • h'(x)
Durchschnittsertrag am grösten, Steigung maximal
Gewinn maximal ó Grenzkosten = Grenzerlös
G'(x) = 0
ó K'(x) = E'(x)
Differentiale
Schreibweise (Sprich "dy nach dx"):
dy
y'(x) =
dx
Neoklassische Produktionsfunktion
Die Grenzerträge sind immer positiv nehmen aber
stets ab (konkave Kurven).
Bedeutet, dass y von x abhängt:
Die Gleichung muss somit nach y aufgelöst sein.
Alle Variablen ausser x werden als konstante Werte betrachtet.
x'(r) ist immer > 0
x''(r) ist immer < 0
Kosten
Linearer Kostenverlauf
K'(x) ist immer > 0 und ist konstant
K''(x) ist immer = 0
Progressiver Kostenverlauf (konvex)
K'(x) ist immer > 0 und ist wachsend
K''(x) ist immer > 0
2. Jahr (29.4.2003)
Wenn der Verlauf einer Parabel entspricht dann:
Christian Meyer
Seite 6 / 17
Gewinnmaximierung
K'(x) ist immer > 0 und ist konstant
K''(x) ist immer > 0 und ist konstant
Monopolist
G(x) = E(x) – K(x)
Degressiver Kostenverlauf (konkav)
K'(x) ist immer > 0 und ist abnehmend
K''(x) ist immer < 0
G(x) = PN(X) •x – K(x)
Das Gewinnmaximum ist dort, wo Steigung der
Kosten = Steigung des Erlös.
Typischer Kostenverlauf
K'(x) ist immer > 0
K''(x) ist < 0 von x=0 bis zum Wendepunkt xw
= 0 am Wendepunkt xw
> 0 vom Wendepunkt xw bis x=8
K'(x) = E'(x) = G'(x) = 0 und G''(x) < 0
Grenzerlös = Grenzkosten
Die Steigung des Gewinns ist:
G'(x) = E'(x) – K'(x)
mathematisch ökonomische Definition der
Grenzkosten:
K'(x) = lim K(x + ?x) – K(x) = lim ?K
?x→0
?x→0
?x
?x
K'(x) gibt näherungsweise den Kostenzuwachs an,
wenn x um 1 Einheit erhöht wird.
Grenzkosten: K’(x) = Kv’ (x)
dE
Grenzerlös
E' (x ) =
dx
dG
Grenzgewinn G' (x ) =
dx
Betriebsoptimum
[ME] = Schnittpunkt: K ' ( x ) ∩ k (x )
[GE] = Økosten(x) beim Minimum
à langfristige Preisuntergrenze
(fix + var.Kosten gedeckt)à ist Preis grosser wird ein
Gewinn erzielt
K’(x) = k(x) => nach x lösen =>
x: betriebsoptimale Erzeugungsmenge => x in k(x)
einsetzen => langfr. Preisuntergrenze
Betriebsminimum
[ME] = Schnittpunkt K ' ( x ) ∩ k v ( x )
[GE] = kv(x) beim Minimum à kurzfristige
Preisuntergrenze (var.Kosten gedeckt)
(Deckungsbeitrag = 0)
kv(x)’: Scheitelpunkt von kv = 0 => nach x lösen
x: betriebsminimale Erzeugungsmenge;
dann x in kv(x) einsetzen => kzfr. Preisuntergrenze
Gewinnmaximierung
G' (x ) = E' ( x ) − K ' (x ) = 0 à E' ( x ) = K ' (x ) und
G' ' (x ) < 0 = Gewinnmax. ME
Gewinnmax. Wenn Grenzerlös = Grenzkosten
Gewinn im Gewinnmax: x(Pnachfrage(x) – k(x))
Vollkommene Konkurrenz
Der Erlös ist eine Gerade, weil wir den Preis nicht
beinflussen können.
Das Gewinnmaximum ist dort, wo Steigung der
Kosten = Erlös bzw. wo Grenzkosten = Verkaufspreis.
K'(x) = E(x) G(x)= p • x - K(x)
Preis = Grenzkosten: p = K’(x)
Die Steigung des Gewinns ist:
G'(x) = E'(x) – K'(x)
Marginale Konsum- und Sparquote
Konsumfunktion
Y = C+S
C = Konsum eines Haushaltes
S = Ersparnis des Haushaltes
Y = Einkommen des Haushaltes
Marginale Konsumquote
Die marginale Konsumquote gibt näherungsweise an,
um wieviel sich der Konsum des Haushaltes ändert,
wenn das Einkommen um eine Einheit erhöht wird.
dC
= marginale Konsumquote (Grenzneigung zum Konsum)
dY
Marginale Sparquote
Die marginale Sparquote gibt näherungsweise an, um
wieviel sich die Ersparnis des Haushaltes ändert,
wenn das Einkommen um eine Einheit erhöht wird.
dS
= marginale Sparquote (Grenzneigung zum Sparen)
dY
Die marginalen Konsum- und Sparquote ergänzen
sich zu 1!
Produktivität
x (r )
r
'
 x( r ) 
max . Pr oduktivität = 

 r 
Durchschnittsertrag =
2. Jahr (29.4.2003)
Christian Meyer
Seite 7 / 17
Elastizität
dy
x
×
dx
y(x)
ε y(x) gibt näherungsweise an, um wieviel Prozent sich
die abhängige Variable y ändert, wenn die
unabhängige Variable x um 1 Prozent verändert wird.
ε y(x) =
Wahrscheinlichkeitsrechnung
Kombinatorische Grundlagen
Nachfragefunktion
Preiselastizität der Nachfage
x = Nachfrage
p = Preis
dx
p
ε x(p) =
×
dp
x(p)
Angebotsfunktion
Preiselastizität des Angebots
x = Angebot
p = Preis
dx
p
ε x(p) =
×
dp
x(p)
Produktionsfunktion
Produktionselastizität
x = Output
r = Input des Produktionsfaktors
dx
r
ε x(r) =
×
dr
x(r)
Permutation mit Wiederholung*:
n!
wobei i+j+k=n
i!⋅ j!⋅k!
Anzahl Variationen von k aus n Elementen
=nK
Permutation
=n!
Anzahl Variationen von k aus n Elementen
Konsumfunktion
Einkommenselastizität des Konsums
C = Konsum
Y = Einkommen
dC
Y
ε C(Y) =
×
dY
C(Y)
=
n!
(n − k )!
Kombination mit Wiederh. von k gleichen
Elementen*
Kostenfunktion
Kostenelastizität
K = Kosten
x = Produktionsmenge
dK
x
ε K(p) =
×
dx
K(x)
=
(k + n − 1)!
k!⋅(n − 1)!
Kombination von k aus n Elementen
=( nk ) mit TR: [COMB] (für Prosten + Match)
*nur zur Vollständigkeit nicht in Übungsserien
ε K(p) = K'(x)
x
1
K'(x)
Grenzk.
=
=
K(x) = K'(x) • k(x)
k(x) Durchschnk.
n tief k
Im Betriebsoptimum ist K' = k, somit ε = 1
n tief k = (
Optimale Bestellmenge
n
( )=1
0
xopt = v
200 • M × F
e•p
M = Bedarfsmenge pro Planperiode
F = Fixe Kosten pro Bestellung
e = Stückkosten
p = Zins und Lagerkosten in % für das im Lager
gebundene Kapital: 20 % = 0.2
n
n!
k Faktoren abw. von n
)=
=
k
k Faktoren aufw. von 1
(n – k)! • k!
Anzahl Mehrspieler:
n: Anzahl ursprüngliche Spieler
( n2+m ) − ( n2 ) = Anzahl Mehrspieler
m
= n ⋅ m + (2 )
0
( )=1
0
n·m: Spiele gegen Dritte
n
n
( )=(
)
k
n–k
( m2 ) : Spiele untereinander
Binomialkoeffizient
n
Anzahl Bestellungen:
M
Anz =
xopt
2. Jahr (29.4.2003)
(a + b) n = ∑ ( nk ) ⋅ a n−k ⋅ b k
K =0
Christian Meyer
(a-b)n => auf
Vorzeichen achten
ungerade wird -
Seite 8 / 17
Wahrscheinlichkeit
Wahrscheinlichkeit P =
Total Anz. günstige Fälle
Anz. gleichmögliche Fälle
S: Ereignisraum / Stichprobenraum
Münze: S= {Zahl, Kopf}
Multiplikationssatz
Wahrscheinlichkeit, dass A und B eintritt, wenn A und
B voneinander unabhängig sind:
P(A ∩ B) = P(A) • P(B)
Wahrscheinlichkeit dass A und B eintreten, wenn B
von A abhängig ist:
P(A ∩ B) = P(A) • P(A / B) '/' steht für 'ohne'
Häufigkeits- und
Wahrscheinlichkeitsverteilungen
Zufallsvariable
Eine Zufallsvariable ist eine Funktion, die jedem
Elementarereignis eine Zahl zuordnet.
• Diskrete ZV: Variable kann nur isolierte
Werte annehmen.
• Stetige ZV: Variable kann jede beliebige
reelle Zahl annehmen.
Diskrete
Wahrscheinlichkeitsverteilungen
Bernoulli-Verteilung
Wahrscheinlichkeit, dass entweder A oder B von zwei
sich ausschliessenden Ereignissen eintritt:
P(A ∪ B) = P(A) + P(B), wenn A ∩ B = ∅
Verteilfunktion: P(X=1) = p
µ=p
P(X=0) = 1 – p
σ = n • p • (1 - p)
Elementare Misserfolg-Erfolg-ZV. Meist ist
Wahrscheinlichkeit von Erfolg und Misserfolg nicht
identisch. Nur ein Versuch; zwei mögliche Ergebnisse
Allgemeiner Additionssatz
Binomialverteilung
Wahrscheinlichkeit, dass A oder B eintritt oder beide
Fälle:
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
Verteilungsfunktion einer binomialverteilten
Zufallsvariable S:
Additionssatz
Lotto
6
45 – 6
)
)×(
n
6–n
n richtige Zahlen =
45
)
(
6
(
•
•
Urne mit schwarzen und weissen Kugeln
ks = Anzahl schwarze Kugeln
kw = Anzahl weisse Kugeln
n = ks + kw = Anzahl Kugeln insgesamt
k
( w )
4
P(4 weisse Kugeln) =
n
( )
4
n− k )
Ziehen mit Zurücklegenvon je 1 Element aus
einer dichtochomen Grundgesamtheit.
Stichprobe < 5 %
Für die Binomialverteilung gilt:
µ=n ×p
 10 
 ⋅ 0,04 1 ⋅ 0,96 9
1
 
kw
ks
)
2 )•( 3
n
(
)
2+3
è P(1 untergewic htig, 9 richtig) = 
usw.
Bsp II: 6% aller Blutspender haben Blutgruppe AB. Wieviel
Spender müssen sich beteiligen, bis man sicher (99%) eine gesucht
Spende erhält?
1
4
P(9 gleichfarbige
35 = 36
Karten) =
( )
(
)
8
9
n
1-P(kein AB Blutspender)= 1- 0.94 > 0.99
0.01 > 0.94n
n > ln(0.01) / ln(0.94)
n = 74.426
1
36
( )
9
Hier ist nicht mehr egal, welche Karte zuerst gezogen
wird.
2. Jahr (29.4.2003)
k
Beispiel Produktionsüberwachung: Auf 100 sind 4
untergewichtig und 10 werden auf zufällige Weise
herausgegriffen.
10 
P(0 untergewic htig, 10 richtig) =   ⋅ 0,04 0 ⋅ 0,9610 =66,5%
0
(dass keine Untergewichtig ist)
Karten ziehen
P(9 Eicheln) =
n
k
σ = n ⋅ p ⋅ (1 − p)
P(min. 1 schw. Kugel) = 1 - P(4 weisse Kugeln)
(
( )⋅ p ⋅ (1 − p )(
p: Erfolgswahrscheinlichkeit eines Versuchs
(Parameter)
n: Totale Anzahl identischer, unabhäng. Versuche
k: Anzahl erfolgreicher, positiver Versuche
(p meist nicht gegeben)
1
Gewinnchance = 45
( )
6
P(2 weisse Kugeln
und 3 schw. Kugeln) =
P(S = k ) =
Poissonverteilung
Wenn:
• p < 0.05 (seltenes Ereignis)
• n > 10
kann die Poissonvert. die Binomialverteilung gut
approximieren.
Christian Meyer
Seite 9 / 17
λk
mit λ > 0
P( X = k ) = e ⋅
k!
E(x) = λ
σ = λ
P(0 Notfälle=k) = ... %
−λ
V(x) = λ
...
P(5 Notfälle=k) = ...%
P(...) solange addieren, bis die gewünschte Fläche gefüllt
ist.
µ =λ
P(0 bis 5 Notfälle=k) = 99.85 %
Parameter: λ = p • n
oft ø pro Tag = λ
Beispiel Impfung: Auf 1000 vertragen 1 die Impfung
schlecht. 2000 werden geimpft. Somit λ = 2000 ⋅ 0,001 = 2
è P( X = 0 ) = e −2 ⋅
20
21
è P( X = 1) = e −2 ⋅
usw.
0!
1!
Bsp: an wieviel Tagen passiert kein Verkehrsunfall ?
E(x) = λ = 1
P (x = λ ) • 365
Masszahlen einer ZV X:
E [x ] = µ = ∑i =1 x i ⋅ p i
n
 x− µ 

σ 
µ = Erwartungswert der ZV (Maximum der Glockenkurve)
σ = Standardabweichung der ZV (Streuung um den
Erwartungswert µ)
]
kleines
VAR ( X ) = E ( x − E [x ]) = σ = ∑i =1 ( xi − µ ) ⋅ pi
2
2
n
2⋅
Standardabweichung:
i =1
Erwartungswert (Gipfel der Kurve)
Standardabweichung (Streuung)
Fläche = Wahrscheinlichkeit
grosses
σ
σ
: hohes Maximum, schlanke Kurve
: niedriges Maximum, breite Kurve
• Wendepunkt der Gauss’schen Glockenkurve liegen
bei µ ± σ
Standardnormalverteilung
n
∑(x
− µ ) ⋅ pi
Entspricht der Normalverteilung, wobei µ=0 und σ=1
gesetzt sind:
2
i
Näherungswert bei n → ∞ : σ = s
σ : Standardabweichung für Population
s: Standardabweichung für Stichprobe
Coeffitient of Variation:
VAR ( X ) σ
cv =
=
E [X ]
µ
σ
(“Risikomass”)
-z
+z
-3
Rechenregeln E[X] und V(X)
-2
-1
0
µ
1
2
3
Umrechnen der Zufallsvariable X in die
standardnormalverteilte Zufallsvariable z:
X–µ
z=
σ
E[X+Y]= E[X]+E[Y]
E[a • X] = a • E[X]
var (X) = E[X2] – (E[X])2
σ ( x + y ) = σ x2 + σ y2
var (a • X) = a • var(X)
var (X+ Y) = var (X) + var (Y)
2
Verteilung
Bernoulli
Parameter
p
E[X]
p
Varianz σ2
Binomial
Poisson
n, p
λ
n•p
λ
n•p• (1-p)
λ
P • (1-p)
Die Binomialverteilung kann durch die
Standardnormalverteilung angenähert werden, wenn
9
n>
p • (1 – p)
Beispiel
Das Spital erwartet 1.2 Notfälle pro Tag: λ = 1.2.
Maximal 1 von 500 Notfällen müssen durch die
Notfallstation abgedeckt sein: P(X=k)=99.8%.
Wieviele Plätze braucht die Notfallstation?
2. Jahr (29.4.2003)
2
− 0.5⋅
1
⋅e 
2 ⋅π ⋅σ
F(z)
Näherungswert bei n → ∞ : µ = x
VAR ( X ) = σ =
Die Normalverteilung basiert auf der Dichtefunktion
(Graph siehe Standardnormalverteilung).
µ:
σ:
Erwartungswert:
[
Normalverteilung
f (x) =
Kennzahlen von diskreten Verteilungen
Varianz:
Die Notfallstation braucht 5 Plätze um 499 von 500 Fällen
abzudecken.
Tabelle 1: Fläche von -z bis +z
z
1
1.96
2
F[z] 68.269%
95%
95.5%
2.58
99%
3
99.73%
Tabelle 2. Fläche von -8 bis z
z
0
1.65
1.96
F[z]
50%
95%
97.5%
2.35
99%
2.58
99.5%
Approximation der Binomial- durch die
Normalverteilung
Wenn n •p•(1-p) > 9 ist es zulässig, die Binomialverteilung
durch Normalverteilung zu approximieren.
8-ung: Stetigkeitskorrektur wird benötigt, wenn mit einer
stetigen Verteilung als Approximation für eine diskrete
Häufigkeit od Verteilung gearbeitet wird.
Stetigkeitskorrektur: halbe Klassenbreite oder den
halben Abstand zw. benachbarten diskreten Werten.
x oder weniger => + halbe Klassenbreite
x oder mehr
=> - halbe Klassenbreite
Christian Meyer
Seite 10 / 17
Schliessende Statistik
Schätzungen: Für welche Parameter der
Grundgesamtheit sind die gemachten Beobachtungen
am wahrscheinlichsten ?
Tests: Sind die Beobachtungen für einen
vorgegebenen Parameter (un-)wahrscheinlich ?
Mit einer zu t gehörenden Wahrscheinlichkeit enthält
das Intervall von
x −t ⋅
Vertrauensintervalle: Für welche Parameter
(Intervall) sind die Beobachtungen genug
wahrscheinlich (plausibel), für welche eher
unwahrscheinlich ?
weggelassen werden (resp. durch 1 ersetzt werden)
Liste von t-Werten:
Stichprobengr
össe 5
Stichprobengr
össe 20
X1, X2, …
N
•
X
N
X = ∑ Xi = N ⋅ X
Proportion von G
P=
Empirische Varianz
s2 =
•
X
n
1
⋅ ∑ ( xi − x ) 2
n − 1 i =1
•
X1, X2, …
x1, x2, …
n
n
x = ∑ xi = n ⋅ x
Proportion von S
p=
Empirische Standardabw
s=
Daten der Stichprobe (S)
x1, x2, …
i =1
x
n
1
⋅ ∑ ( xi − x ) 2
n − 1 i =1
Konfidenzintervalle von
quantitativen Variablen
Stichprobengrös
se 10
Stichprobengrös
se 100
s
N −n
s
N −n
x−z⋅
⋅
bis x + z ⋅
⋅
das
N −1
N −1
n
n
arithmetische Mittel µ der Grundgesamtheit.
=>n: Grösse der Stichprobe
x
X
durch p
P ⋅ (1 − P )
σ durch
durch P
p ⋅ (1 − p )
und s durch
Mit einer zu z gehörenden Wahrscheinlichkeit enthält das
Intervall von
p1 =
p− z⋅
p ⋅ (1 − p )
N −n
⋅
n
N −1
bis
p2 =
p+z⋅
p ⋅ (1 − p )
N −n
⋅
n
N −1
die Proportion P,
bzw. die relative Häufigkeit eines qualitativen Merkmals der
Grundgesamtheit.
N −n
N −1
Ist n kleiner als 5% von N, so kann
werden (resp. durch 1 ersetzt werden)
Liste von z-Werten:
z=1
z=2
z=1
z=2
z=1.96
z=2.58
Für Stichproben kleiner 100:
2. Jahr (29.4.2003)
= 2.26 /
= 3.25
= 1.98 /
= 2.63
Der einzige Unterschied zu oben besteht darin, dass die
zufälligen Stichprobendaten x1, x2, … jetzt binär sind und
damit eine einfachere Verteilungsfunktion besitzen.
Wir ersetzten somit:
weggelassen werden (resp. durch 1 ersetzt werden)
Liste von z-Werten:
Für W’keit von 68.3%
Für W’keit von 95.5%
95%
99%
95%
99%
ist n ⋅ p ⋅ (1 − p) > 9 können wir wieder wie folgt rechnen
(der andere Fall wird weggelassen):
Für Stichproben grösser 100:
Mit einer zu z gehörenden Wahrscheinlichkeit enthält
das Intervall von
Ist n kleiner als 5% von N, so kann
= 2.78 /
= 4.60
= 2.09 /
= 2.86
Konfidenzintervalle für qualitative
Variablen (Proportion/Anteilswert)
x
Gesamtsumme
95%
99%
95%
99%
je grösser die Sicherheit, desto breiter der
Vertrauensbereich
je grösser die Standardabweichung der
Stichprobe, dest breiter der Vertrauensbereich
Für das Verhältnis zur Grundgesamtheit kleine
Stichproben (n / N < 0,05 ) gilt: Die Grösse
der Grundgesamtheit hat keinen Einfluss auf
der Vertauensbereich (z)
Je grösser Stichprobe, desto kleiner das
Vertrauensintervall
•
i =1
Daten der Grundgesamtheit
Daten der Stichprobe (S)
Umfang der Stichprobe (S)
Durchschnitt von (S)
N −n
N −1
Ist n kleiner als 5% von N, so kann
Schätzungen
Gesamtsumme
s
N −n
s
N −n
⋅
bis x + t ⋅
⋅
das
N −1
N −1
n
n
arithmetische Mittel µ der Grundgesamtheit.
Formulierung: Das Intervall mx±.. enthält µ mit
95%iger Sicherheit.
Daten der Grundgesamtheit
Umfang der Grundgesam
(G)
Durchschnitt von (G)
Je kleiner desto schlechter sind die Grenzen des
obgenannten Intervalls >> t-Verteilung
Bei der t-Verteilung nähern sich die beiden Flanken
der Kurve weniger schnell der horizontalen Achse als
die Seiten der Normalverteilung, daraus folgt:
Für W’keit von 95%
Für W’keit von 99%
Für W’keit von 68.3%
Für W’keit von 95.5%
Hochrechnung:
Christian Meyer
N −n
N −1
z=1.96
z=2.58
p1 • N
P2 • N
weggelassen
Für W’keit von 95%
Für W’keit von 99%
N: Grundgesamtheit
Seite 11 / 17
Stichprobengrösse
Wie gross muss die Stichprobengrösse mindestens sein,
wenn mit mit einer Sicherheit von p %, nicht mehr als ±F
Elemente daneben liegen möchte?
Quantitativer Fall der Stichprobengrösse
Grosse Stichproben:
n=
N
F ⋅ ( N − 1)
+1
z 2 ⋅σ 2
2
F = maximale Abweichung, maximaler Fehler
Kleine Stichproben (n / N < 0,05 ) :
n=
z ⋅σ
F2
2
Signifikanzniveau
• Vorwegstichprobe: σ = s
•
Drei-Sigma-Regel:
α = P ( X > c ) = 1 − P ( X ≤ c ) = 1 − P ( X ≤ kritischer Wert)
Spannweite maximaler Wert - minimaler Wert
=
6
6
(> um den maximalen Fehler zu halbieren, Stichprobengrösse • 4)
(> immer zuerst Netto-Stichprobe berechnen, erst dann BruttoStichprobe)
Beispiel Packungen: Durch eine Zufalls-Stichprobe soll abgeklärt
werden, für wie viele Personen der Inhalt einer Packung XY
durchschnittlich reicht. Mit 95.5%iger Sicherheit soll der gefundene
Wert x um nicht mehr als F = 0.1 Personen vom richtigen Wert
µ der Grundgesamtheit abweichen. (Annahme: Packung reicht für
maximal 6 und minimal 1.5 Personen)
Drei-Sigma-Regel:
6 − 1 .5
= 0.75 è
6
σ =
Qualitativer Fall der Stichprobengrösse
Grosse Stichproben (n / N ≥ 0,05 ) :
z 2 ⋅ P ⋅ (1 − P ) ⋅ N
F 2 ⋅ ( N − 1) + z 2 ⋅ P ⋅ (1 − P )
Einstichproben t-Test (gepaarten Zweichstichproben
t-Test):
z 2 ⋅ P ⋅ (1 − P)
F2
Ist in der Grundgesamtheit das arithm. Mittel µ
verschieden von einem vermuteten Wert µ0 ?
Beispiel Videokameras: Durch eine Zufallsstichprobe soll abgeklärt
werden, wie gross der Anteil der Haushaltungen mit eigenen
Videokamaras ist. Mit 95% Sicherheit soll der gefundene Wert p um
nicht mehr als F=3% vom wahren Wert A der Grundgesamtheit
abweichen. Grösse der Stichprobe?
Kein Schätzwert >>
P = 0.5 : n =
2
⋅ 0 . 5 ⋅ (1 − 0 . 5 )
= 1067
0 . 03 2
Berechnung der Standardabweichung:
•
•
σ = s oder auch: P * (1-P) = s
Schlechtester Fall: σ = 0.5 oder auch: P * (1-P) = 0.5
Vorwegstichprobe:
• Die Nullhypothese ist richtig, wird aber trotzdem
verworfen. Ein solcher Fehler heisst „Fehler 1. Art“. Die
Wahrscheinlichkeit ist α .
• Die Nullhypothese ist falsch, wird aber nicht verworfen.
Ein solcher Fehler heisst „Fehler 2. Art“. Die
Wahrscheinlichkeit β ist oft schwer oder überhaupt
nicht zu berechnen.
Tests bezüglich µ
Kleine Stichproben (n / N < 0,05 ) :
1 . 96
Fehlerarten:
Verwerfung der Hypothese:
Sobald z resp. t (Testgrösse) im kritischen Bereich
(Verwerfungsbereich) liegt, muss Hypothese
verworfen werden.
F = maximale Abweichung, maximaler Fehler
n=
z.B. α = 1% : Wenn viele Tests durchgeführt
werden, so sind in genau jenen Fällen, in denen
H0 richtig ist, etwa 1% der Urteile falsch.
è 5% für signifikant und 1% für hochsignifikant
Macht des Tests:
Je Grösser die Macht des Tests (1 – ß) bei
gegebenem a, desto besser ist die Trennschärfe
(Qualität des Tests). Macht des Tests ist abhängig
von der Stichprobengrösse.
z 2 ⋅ σ 2 2 2 ⋅ 0.75 2
n=
=
= 225
F2
0.12
n=
Logischer Ablauf eines Hypothesen-Tests:
• Die Vermutung über eine Grundgesamtheit soll indirekt
bestätigt werden.
• Die Nullhypothese H0 wird als "Gegenhypothese"
aufgestellt. Ziel ist H0 zu widerlegen.
• Planung des Zufallsexperiments: Wahl der Testgrösse,
deren Wert durch das Zufallsexperiment bestimmt
werden kann.
• Signifikanzniveau α wählen, Verwerfungsbereich
bestimmen, Entscheidungsregel aufstellen.
• Zufallsexperiment durchführen, Wert der Testgrösse
bestimmen.
Wert der Testgrösse fällt in Verwerfungsbereich:
⇒ H0 verwerfen :Wert der Testgrösse fällt nicht in
Verwerfungsbereichs
⇒ H0 ist nicht widerlegt und wird somit bis auf
weiteres beibehalten)
2
Berechnung der Standardabweichung σ :
σ =
Testen von Hypothesen
Testgrösse:
n ≥ 100 :
z=
n < 100 :
t=
(x − µ 0 ) ⋅
n
s
(x − µ 0 ) ⋅
n
s
Einstichprobentest einseitig
H0: µ = µ0
HA: µ > µ 0 bzw. µ < µ 0
• Verwerfungsbereich:
α = 5% : | z | > 1.65
2. Jahr (29.4.2003)
Christian Meyer
Seite 12 / 17
α = 1% : | z | > 2.33
• t für n=20
α = 1% :
Beispiel Studiendauer:
n1 = n2 = 100; x1 = 6.03; x 2 = 5.87; s1 = 1.53; s2 = 1.42
è H0: µ1 = µ2
| z | > 2.33 | t | > 2.54
HA: µ1 ≠ µ 2
Einstichprobentest zweiseitig
H0: µ = µ 0
HA: µ ≠ µ 0
3.
4.
Testgrösse n=100 à z (wenn n<100 àt)
Signifikantsniveau : α = 5% : | z | > 1.96
α = 1% : | z | > 2.58
5.
z=
s
(2.7 − 2.5) ⋅
0 .4
100
Kritischer
Bereich
=5
6.
| z | > 2.58 und | z | > 1.96
Die Nullhypothese H0 wird verworfen. Der Wirkstoffgehalt weicht
hochsignifikant vom Sollwert ab.
Beispiel einseitiger Test:
Lebensdauer von Reifen: Test: 62000, 56000, 75000, 70000,
82000, 76000 km; Hersteller behauptet Lebensdauer=80000km
7.
Vermutung Lebensdauer ≠ 80000km (nur zu kleine
Lebensdauer schadet)
8.
H0: µ = µ 0 = 80000 HA: µ < µ0 à einseitiger Test
9.
Testgrösse n=6 à t
10. Signifikantsniveau :
11.
6.03 − 5.87
2
2
= 0.766
è | z | < 1.96
1.53 1.42
+
100
100
Tests bezüglich p
Wirkstoffgehalt: n = 100; x = 2.7; s = 0.4, SOLL-x = 2.5
1.
Vermutung Wirkstoffgehalt .≠ 2.5 (zu grosser und zu
kleiner Wirkstoffgehalt schadet)
2.
H0: µ = µ 0 = 2,5 HA: µ ≠ µ 0 à zweiseitiger Test
=
=
2
Die Nullhypothese H0 kann nicht verworfen werden. Sie muss bis
auf weiteres beibehalten werden.
Beispiel zweiseitiger Test:
n
2
s1
s
+ 2
n1
n2
• Verwerfungsbereich:
α = 5% : | z | > 1.96
α = 1% : | z | > 2.58
• t für n=20
α = 1% : | z | > 2.58 | t | > 2.86
(x − µ0 )⋅
x1 − x2
z=
α = 5% : | t | > 2.02;
(x − µ 0 ) ⋅ n = (70166 − 80000 ) ⋅ 6 = 2.498
t=
s
9642
Einstichprobentest
Ist in der Grundgesamtheit der Anteil P eines
Merkmals verschieden von einem vermuteten p0 ?
Voraussetzung:
(für die Approximation der Binomialverteilung mit der
Normalvereilung)
n • p0 • (1 - p0) > 9
=> Achtung Stetigkeitskorrektur
Testgrösse:
z=
( p − p 0 )⋅
σ
n
mit σ =
p 0 ⋅ (1 − p0 )
Einstichprobentest einseitig
H0: P = p0
HA : P > p0 bzw. P < p0
Einstichprobentest zweiseitig
H0: P = p0
HA : P ≠ p0
Tabelle 2: (einseitig)
α = 5% : | z | > 1.65
α = 1% : | z | > 2.33
Die Nullhypothese H0 wird verworfen. Die Lebensdauer der Reifen
weicht signifikant vom Sollwert ab.
Tabelle 1: (zweiseitig)
α = 5% : | z | > 1.96
α = 1% : | z | > 2.58
Zweistichprobentest (zwei voneinander
unabhängige Stichproben à immer zweiseitig):
Zweistichprobentest (zwei voneinander
unabhängige Stichproben à immer zweiseitig)
12. | t | > 2.02
Haben zwei Grundgesamtheiten verschiedene
arithmetische Mittel µ1 und µ2 ?
Hypothesen:
H0: µ 1 = µ 2
HA : µ 1 ≠ µ 2
Testgrösse:
n1 ≥ 100 , n 2 ≥ 100
z=
x1 − x2
s 12 s 2 2
+
n1
n2
Verwerfungsbereich:
α = 5% : | z | > 1.96
α = 1% : | z | > 2.58
2. Jahr (29.4.2003)
H0: p1 = p 2
p1: Anteil d. Merkmals in der 1. Stichprobe
HA : p1 ≠ p 2
p2: Anteil d. Merkmals in der 2. Stichprobe
(n1 + n 2 ) ⋅ p > 5 ∧ (n1 + n2 ) ⋅ (1 − p ) > 5 ∧
p ⋅ n + p2 ⋅ n2
n1 ≥ 50 , n 2 ≥ 50 wobei p = 1 1
n1 + n 2
p1 − p 2
z=
1
1
p ⋅ (1 − p) ⋅  + 
 n1 n2 
Tabelle 1:
α = 5% :
Christian Meyer
| z | > 1.96
α = 1% : | z | > 2.58
Seite 13 / 17
2. Jahr (29.4.2003)
Christian Meyer
Seite 14 / 17
Hinweise zu Excel:
Gepaarter t-Test
Abhängig = gepaart
Nicht gepaarter Zweistichprobentest
Regressionsrechnung:
Sie ermittelt einen funktionalen Zusammenhang, ein Modell zwischen abhängigen Zielvariablen und den unabhängigen
Erklärungsvariablen, basierend auf einer Reihe von Beobachtungen oder Messwerten. Die Erklärungsvariablen werden
auch Regressoren genannt. Dabei wird zwischen linearen und nichtlinearen Regressionen unterscheiden:
Lineare Regression
y = ax+b
y = a+bx2
(nur ein Regressor: x1)
y = a+b*2x
à a und b kommen hier stets in linearer Form vor
Multiple Regression
1
1
y = a⋅ 2 +b⋅ 2 + c
x1
x2
(zwei Regressoren : x1 und x2)
Nichtlineare Regression
y = a*b
y = a+bx+b2+x
y = ax/bx
y = a+b*ax
Beispiel Regression:
Bevor der Vertrieb eines neuen Produktes in der ganzen Schweiz aufgenommen wird, soll ein Marktforschungsinstitut
den Zusammenhang von Verkaufspreis und Absatz des neuen Produktes bestimmen. Dies geschieht in ausgewählten
15 Ortschaften in der Schweiz, in welchen die Produkte zu unterschiedlichen Preisen angeboten werden
• Beispiel einer einfachen linearen Regression aus Sicht der beschreibenden Statistik:
Diese Preis/Absatz Korrelationen können nun in einem Diagramm aufgezeichnet werden – und dabei versucht
werden eine Regressionsgerade einzupassen. Dies geschieht oftmals mit der Methode der „kleinsten
Quadrate“, es minimiert die y-Abstände zwischen allen Punkten und der Geraden (Achtung, nur die yAbstände minimieren à nur der Preis ist die abhängige Variable. Die dabei entstehen y-Abstände werden als
Fehler, bzw. Residuen bezeichnet.
[Konklusion: die beschreibende Statistik bemüht sich ideale (lineare o. exponentielle) Formeln für eine
Punktschätzung, d.h. ein möglichst gutes anpassen an vorhandene Datenpunkte, zu finden]
•
Beispiel einer einfachen linearen Regression aus Sicht der schliessenden Statistik:
Voraussetzung: Konfidenzintervalle können gerechnet werden. Regressionsmodell muss mit einem
Wahrscheinlichkeitsmodell beschrieben werden.
Unbekannte Parameter: a, b und s
Aufgrund dieser Daten können nun Fragen bezüglich der Wahrscheinlichkeit/Plausibilität, deren
Konfidenzintervallen und mögliche Testmöglichkeiten beantwortet werden. Dazu muss die Regression mit
einem Wahrscheinlichkeitsmodell beschrieben werden. Die bei der Erhebung aufgetretenen Fehler werden
also normalverteilt und voneinander unabhängig angenommen. Deshalb anhand komplizierter Formeln a, b
und neu auch σ geschätzt werden, dies ergibt â, b̂ und σˆ .Dabei sind alles Zufallsvariablen ausser die
Regressorenwerte xi.
[Konklusion: die schliessende Statistik versucht Fragen bezüglich Genauigkeit, Plausibilität anhand von
Intervallschätzungen zu beantworten]
2. Jahr (29.4.2003)
Christian Meyer
Seite 15 / 17
Output einer Excel-Regression:
Regressions-Statistik
Multipler Korrelationskoeffizient
Bestimmtheitsmaß = R2
Adjustiertes Bestimmtheitsmaß
Standardfehler
Beobachtungen
Schätzung für s : σˆ
Anzahl
Beobachtungen: n
0.644855921
0.415839159
0.391499124
17.23221876
26
∑r
2
i
1
ri 2 = σˆ 2
∑
Anzahl Re siduen
ANOVA (Analysis of Variance)
Freiheitsgra
de (df)
Regression
Residue
Gesamt
Quadratsummen
1
24
25
5073.2537
7126.7847
12200.038
Koeffizienten
Schnittpunkt
136.73611
X Variable 1
24.548611
Stdfehler
Mittlere
Quadratsumme
(MS)
5073.253739
296.9493634
t-Statistik
23.453164
5.9391575
Prüfgröße
(F)
F krit
17.0845
P-Wert
0.0003
Untere
95%
5.83017738
0.00007
88.331
-4.133349154
0.00038
36.806
â (Schätzung der Steigung)
b̂ (Achsenabschnitt)
Korrelation von
y-Werten und
Prognosewerten
Obere
95%
185.1
4
12.29
3
Untere
95.0%
Obere
95.0%
88.331
185.14
36.807
12.293
Rot: Konfidenzintervall für b
Blau: Konfidenzintervall für a
Grün: t-Test, ob b = 0 und a = 0 plausibel ist (Wahrscheinlichkeit, dass Werte = 0)
Bestimmtheitsmass R2
σ 
= SSx = ∑ x − n ⋅ x =  
 xi 
2
i
2
R2 =
2
Varianz (Yˆ )
Varianz (Y )
Zähler: durch Regression erklärte Varianz von y
Nenner: Gesamtvarianz von y
Regression mit nichtlinearen Funktionen:
0< R2 ein
<1 Erklärungskraft
d.zwei
Regression
umso grösser,
Die Punkte streuen nun nicht mehr um eine Gerade, sonder
Kurve. Dies lässt
Möglichkeiten
offen: je
näher R2 bei 1 liegt.
• Transformation der x-Variablen
Beispiel: Die Punkte ergeben mehr eine Kurve 2. Grades (y=ax2+bx+c). Hier werden die alle x-Werte quadriert,
die y-Werte nicht verändert. So erweitert sich das sich der Graph verflacht und das Einpassen einer Gerade
ermöglicht. Jetzt kann ebenso wie bei der linearen Regression a und b bestimmt und in die quad. Gleichung
übernommen werden ( bei Fkt 3. Grades wird ganzer Term mit 3 Potenziert)
• Der zweite Fall kann nur angewendet werden wenn sich die Funktionen nur auf die unabhängige x Variable
beziehen. Nun kann mit Hilfe einer Trendlinie oder einer polynomischen Ordnung die Regression
herausgelesenen werden.
Konfidenzintervall für a:
bˆ ± t (α ;n − 2) ⋅
σˆ
n
∑x
i =1
2
i
mit σˆ =
− n ⋅ x2
n
1
⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1
n − 2 i =1
ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden
Konfidenzintervall für b:
1
⋅
bˆ ± t(α ;n −2) ⋅ σˆ ⋅
n
x2
n
∑x
2
i
− n⋅ x 2
it σˆ =
n
1
⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1
n − 2 i =1
i =1
ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden
2. Jahr (29.4.2003)
Christian Meyer
Seite 16 / 17
Konfidenzintervall für eine Prognose y(x0), Funktionswert bei einem zukünftigen x0-Wert:
1 (x − x)2
(aˆ ⋅ x0 + bˆ) ± t(α ;n −2) ⋅ σˆ ⋅ 1 + ⋅ n 0
mit σˆ =
n
2
2
∑ xi − n ⋅ x
n
1
⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1
n − 2 i =1
i =1
ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden
Bemerkungen:
n
Der Term
∑x
i =1
2
i
− n ⋅ x 2 wird auch als SSx bezeichnet (sum of Squares of x)
n
Er kann aus der Varianz berechnet werden:
∑ xi2 − n ⋅ x 2 =
i =1
n
∑( x
i =1
i
− x ) 2 = (n-1) ? var(x)
2
Anwendung von R
• Bestimmtheitsmass ist geeignet um die Güte der Anpassung von verschiedenen Regressionsmodellen
miteinander zu vergleichen.
• Mit Hilfe R2 von dürfen nur Modelle mit gleich vielen Regressoren beurteilt werden
• Besitzt ein Modell ein deutlich grösseres R2, so ist es zu bevorzugen
• Sind die Werte von R2 ähnlich gross, so ist das einfachere Modell zu wählen
Vorgehen Stepwise Regression:
• Man wählt sich ein Modell und führt die entsprechende Regression durch (Analyse Funktion)
• Im Output wählt analysiert man die P-Werte der einzelnen Regressoren (jedoch ohne Schnittpunkt)
P-Wert gibt Auskunft, ob der entsprechende Regressor einen signifikanten Beitrag zur Güte des Modells
beiträgt.
• Ist mindestens ein P-Wert grösser als 0.05, so lässt man denjenigen Regressor mit dem grössten P-Wert weg
(a = 5% für Test der Nullhypothese: Regressor hat keinen Einfluss)
• Man wiederholt die letzten beiden Punkte bis alle P-Werte über der Schranke von 5% bleiben und wählt das
verbleibende Modell.
Korrelation:
•
•
•
Streuen sich die Punkte nur wenige um die Regressionsgerade, repräsentiert die Gerade den Zusammenhang
zwischen X und Y gut. Ich (der Statistiker) sage: X und Y korrelieren stark. Das gleiche umgekehrt natürlich
auch.
Der empirische Korrelationskoeffizient nach Bravais-Pearson ist ein Mass für die Stärke des linearen
Zusammenhangs zwischen X und Y. Bei nichtlinearen Zusammenhängen ist er unbrauchbar. Er macht auch
über Kausalität von X und Y keine Aussage.
Im Gegensatz dazu misst die Spearmansche Korrelation (Rangkorrelation) nicht die Stärke und Richtung des
linaren, sondern des monotonen Zusammenhanges. Ein grober Fehler oder ein Ausreisserwert beeinflusst
dabei die Rangkorrelation nur in beschränktem Mass (robuste Masszahl wie Median).
2. Jahr (29.4.2003)
Christian Meyer
Seite 17 / 17
Zugehörige Unterlagen
Herunterladen