Mathematik- Zusammenfassung M5 Folgen und Reihen Def: an+1 – an = d Folge (Sobald Veränderungen im Exponent => GF) = Sequenz von Werten an = a1 + (n – 1) × d (Bildungsgesetz) endlich: unendlich: <a1, a2, a3> <a1, a2, ...> f:n→an, n ∈ |N*3 f:n→an, n ∈ |N* =>Startwert ist immer erstes Glied der Folge Bildungsgesetz an = f(n) ist nicht rekursiv! Rekursion Vorschrift: Basis: Beispiel: ergibt Bildung: an+1 = f(an), n ∈ |N* a1 = 3 an+1 = 2 × an, n ∈ |N*, a1 = 3 <3, 6, 12, 24, ...> a1 = 3 a2 = 3 × 2 a3 = 3 × 2 × 2 a4 = 3 × 2 × 2 × 2 an = 3 × 2n–1 unendlich: a1 + a2 + ... Summe der ersten n Glieder n ? (ai) i=1 Summe aller Glieder (unendliche Summe) 8 s = n n × (n – 1) × (a1 + an) = n × a1 + ×d 2 2 Geometrische Folge/Reihe an+1 =q an an = a1 × qn–1 (Bildungsgesetz) sn = a1 × qn – 1 ,q≠1 q–1 Summe unendliche geom. Reihe a1 s= , |q| < 1 1–q Multiplikator = a1 s Monotonie / Beschränktheit = Summen einer Folge endlich: a1 + a2 + a3 sn = Def: Reihe sn = Arithmetische Folge/Reihe an+1 ≥ an an+1 ≤ an an ≤ s an ≥ s an ≤ smax ∧ an ≥ smin monoton wachsend monoton fallend nach oben beschränkt nach unten beschränkt beschränkt s: reele Zahl Logarithmusregeln ? (ai) i=1 an => n-tes Glied < an> => Folge y = a x ⇔ x = log a y loga b n = n ⋅ log a b loga (b ⋅ c) = log a b + log a c b loga = loga b − log a c c log y ln y loga y = = log a ln a Der Logarithmus negativer Zahlen ist nicht definiert. 2. Jahr (29.4.2003) Christian Meyer Seite 1 / 17 Stetige Verzinsung Grenzwert Zinseszins mit jährlicher Verzinsung (ZiZi) offene ε-Umgebung von a: Uε(a) = ]a – ε, a + ε[ Jährl. effektive Wachstumsrate Def: a ist Grenzwert von <an>, wenn in jeder noch so kleinen Umgebung von a, alle bis auf endlich viele an liegen. lim an = a Kn = K0 × (1 + peff n ) , peff = effektiver Jahreszins 100 Zinseszins mit m-jährlicher Verzinsung: 1 m× n k× p 1 m= = und Kn = K0 × (1 + k ) 100 n→8 Jede Folge, die monoton und beschränkt ist, hat einen Grenzwert. Häufungswerte: Folge schwankt zwischen n Werten Nullfolge: Grenzwert = 0 => ∞ ist KEIN Grenzwert konvergiert: Folge hat Grenzwert divergiert: Folge hat keinen Grenzwert k p m ⋅ 100 Zinseszins mit stetiger Verzinsung Stetige Rendite / stetige od. nominale Wachstumsrate Kn = K0 × e0.01 × ps ×n , ps = stetiger/nominaler Jahresz. Umrechnung: peff = 100 × (e0.01 × ps – 1) ps = 100 × ln (1 + peff ) 100 Grenzwert berechnen: Bei Potenzen: immer mit dem Kehrwert der höchsten Potenz multiplizieren • Wenn ein Nenner eine Nullfolge ist, gibt es keinen Grenzwert • Wenn Zähler und Nenner eine Nullfolge sind, KANN es einen Grenzwert geben (beide Fkt. Müssen gleichschnell nach 0 laufen) Durchschnittliche Rendite = geom. Mittel von peff (5% = 1.05) = arithm. Mittel von ps Renditeberechnung mit Anfangs- und Endwert NUR wenn keine Dividenden ausgeschüttet wurden. Standardabweichung darf nur von ps berechnet werden! Grenzwertsätze Renditen Gegeben <an> mit lim an = a und <bn> mit lim bn = b ∅ Rendite n→8 Zur Bestimmung von ∅ Wachstumsraten: n→8 => gilt nur, wenn a und b konvergent sind <c × an> gilt lim (c × an ) = <an ± bn> gilt n→8 lim (an ± bn)= lim ( an ) ± lim ( bn ) = a ± b n→8 n→8 <an × bn > gilt lim (an × bn) = n→8 lim an bn =c×a c lim ( an ) n→8 ≠ lim an lim bn n→8 lim ( an ) × lim ( bn) n→8 reff = 100 ⋅ n a1 ⋅ a2⋅ ...a n wobei z.B. 1.1 für 10% ∅ stetige Rendite n→8 =a×b reff rs = 100 ⋅ ln 100 rs = 100 ⋅ ln n a1 ⋅ a2 ⋅ ... ⋅ a n ∅-stetige Rendite ist arithmetisches Mittel der stetigen Renditen: n rs = 2. Jahr (29.4.2003) Christian Meyer ∑r k =1 sk n Seite 2 / 17 M6 Finanzmathematik Renten Abschreibungen I0 = Anschaffungswert In = Schrottwert / Liq. Erlös At = Abschreibungsbetrag im Jahr t It = Zeitwert im Jahr t (Restwert) A = Annuität n = Nutzungsdauer in Jahre t = Jahr p q = 1 + 100 Lineare Abschreibung Jedes Jahr wird ein fester Betrag (A) abgeschrieben. I –I A= 0 n (AF) (A: Abschreibungseinheit) n t 0 1 2 3 At It 10’000 8’000 6’000 4’000 2’000 2’000 2’000 A A A Zeitwerte It liegen auf einer Geraden Digitale / arithm. degressive Abschreibung Im ersten Jahr werden n Einheiten, im zweiten (n – 1) Einheiten, im n-ten Jahr 1 Einheit abgeschrieben. 2 × (I0 – In) E= (AF) n × (n + 1) E: Summe der Abschreibungsbeiträge bis zum n-ten Jahr At = (n – t + 1) × E (Veränderung Abschr.Wert) nachschüssiger Rentenendwert qn – 1 sn = r × q–1 vorschüssiger Rentenendwert qn – 1 sn' = r × q × q–1 2’500 vorschüssiger Rentenbarwert r qn – 1 B' = n–1× q q–1 Zahlung Ende Jahr: postnumerando / nachschüssig Zahlung zu Periodenbeginn: vorschüssig Kapital K0 zum Zeitpunkt 0, Einzahlung/Entnahme von r Franken, n Jahre lang, peff Jahreszins. It liegt auf einer nach oben geöffneten Parabel mit t At It Scheitelpunkt: 0 25’000 s (n + 1 / ... ) 1 3*E 7’500 17’500 2 2 2*E 5’000 12’500 nachschüssiger Endwert Kn = K0 × qn ± (r × 10’000 Geometrisch degressive Abschreibung Jedes Jahr werden p% vom Zeitwert des Vorjahres abgeschrieben. p At = I0 × 100 qn – 1 ) q–1 E = K ⋅ q n ± sn vorschüssiger Endwert Kn' = K0 × qn ± (r × q × qn – 1 ) q–1 E ' = K ⋅ q n ± s 'n p n It = I0 × (1 – ) 100 t 1 2 3 4 At Formel I p = 1 − n n ⋅100 I0 p 100 Sparkassenformel E 1 It = × t2 – E × (n + ) × t + I 0 2 2 1*E q −1 = nachschüssiger Rentenbarwert r qn – 1 B= n× q q–1 It = I 0 – t × A 3 Einzahlung von r Franken, n Jahre lang, peff Jahreszins. sn:RentenENDwert It 40’000 10’000 30’000 7’500 22’500 5’625 16’875 + Einzahlung - Entnahme (Zeitwerte It liegen auf einer Exponentialkurve.) Die Abschreibungsbeträge und die Zeitwerte bilden eine geometrische Folge. 2. Jahr (29.4.2003) Christian Meyer Seite 3 / 17 Barkredit Ewige Rente Methode der mittleren Kreditfrist Kapital K0 zum Zeitpunkt 0, n Jahre lang, peff Jahreszins. (KEIN Zinseszins) Es wird nur soviel Rente ausbezahlt, wie Zins vorhanden ist, das Kapital wird nicht aufbebraucht: K×p r= 100 nachschüssiger Barwert: r B= q–1 vorschüssiger Barwert: r×q B' = q–1 Modell "HSW Luzern" => Raten und Tilgungen immer nachschüssig Höhe einer Monatsrate: K × qn × (q – 1) r = n (q – 1) × (12 + 5.5 × [q – 1]) Annuität = Zins + Tilgungsbetrag Gleichbleibende Tilgung (Ratentilgung) K n Zins 2’400 1’800 1’200 600 Tilgung 10’000 10’000 10’000 10’000 Angewandter Zinssatz: Mit dem Solver die folgende Gleichung nach q auflösen: q–1 r × (12 + 5.5 × [q – 1]) – K × qn × n =0 q –1 Annuität 12’400 11’800 11’200 10’600 Annuitätenmethode Gleichbleibende Annuität (Annuitätentilgung) Monatliche Verzinsung der Schuld wird unterstellt. Der Kredit wird in gleichen Monatsraten getilgt. Fester Zinssatz: Annuität A = K × qn × t 1 2 3 4 Schuld 41’130 31’728 21’762 11’198 Monatszinsatz: Folgende Gleichung mit Solver nach q auflösen: q–1 r = K × qn × n q–1 q–1 qn– 1 Zins 2’468 1’904 1’306 672 Tilgung 9’402 9’966 10’564 11’198 Annuität 11’870 11’870 11’870 11’870 è SOLVE è SOLVE FINANCE è N: Anzahl Raten I%YR: Jahreszins PV: Barwert PMT: Rate (negativ) P/YR: Anzahl Raten pro Jahr FV: Endwert Für einzelne Tilgungen: AMOR è bei PRINCIPAL: AMOR è BàPV è AMOR usw. Principal: Tilgung Interest: Zins bei gleichen Raten und gleichen Zahlungsabständen: erste Frist + letzte Frist MK = 2 Angewandter Zinssatz: 1200 × (n × r – K) p = MK × K Die Schuld K ist in n nachschüssigen Annuitäten abzutragen. Schuld 40’000 30’000 20’000 10’000 ? der Kreditfristen Anzahl Raten n: Anzahl Raten, p: Jahreszins (effektiv) Tilgung t 1 2 3 4 Mittlere Kreditfrist MK = Höhe einer Monatsrate: K MK × K × p + r = n n × 1200 Jährlicher Aufwand => immer nachschüssig Tilgung T = bei gleichen Raten: Balance: Schuld Zinssatz wechselt nach w Jahren: q1 = Zins bis und mit Jahr w (5 % = 1.05) q2 = Zins ab Jahr w bis Jahr n K × q1w × q2n–w A= w q1 – 1 q n–w – 1 × q2n–w + 2 q1 – 1 q2 – 1 Jahreszinsssatz: Nominaler Jahreszins aus Monatszinsatz: pjs = 12 × PM Effektiver Jahreszins aus Monatszinsatz: PM 12 pjeff = [ (1 + ) – 1] × 100 100 Beispiel: Kredithöhe 20'000.–, rückzahlbar in 30 Monaten zu Fr. 803.55, beginnend 1 Monat nach Kreditaufnahme. Höhe einer Monatsrate: q–1 r = K × qn × n q–1 Auf TR Annui-> WeAnn q1=q q2=t 2. Jahr (29.4.2003) Christian Meyer Seite 4 / 17 Dynamische Investitionsrechnung Bei der dynamischen Investitionsrechnung wird nur in die Zukunft gerechnet. Werte aus der Vergangenheit werden nie berücksichtigt, weil man diese nicht mehr beeinflusenkann. Kapitalwertmethode (Net Present Value Method) e: Einzahlung (Personal-, Servicekosten) a: Auszahlung (Verkaufserlös) en-a n=Nettoeinzahlung Die Investition ist vorteilhaft, wenn K0 > 0 ist. n e –a L K0 = ? ( t t t ) + nn – I0 wobei q = (1+p/100) q q t=1 Barwert: (Zeitpunkt t=0) aller Nettoeinzahlungen bei Verwendung eines Kalkulationszinssatzes: p (Gegenwartswert, Nettobarwert, Discounted cash-Flow) Methode des internen Ertragssatzes (Internal Rate of Return Method) Die Investition ist vorteilhaft, wenn der interne Ertragssatz mindestens so hoch ist, wie die geforderte Zielrendite. n K0 = ? ( t=1 L et – at ) + nn – I0 = 0 qt q Der interne Ertragsatz ist derjenige Kalkulationszinssatz, für den der Kapitalwert = 0 ist. Spezialfall ewige Rente: e–a p = 100 × I0 Spezialfall gleiche Nettoeinzahlungen und Ln = I0: e–a p = 100 × I0 n: unbegrenzt, kein Liquidationserlös, NUR bei konstanten Raten lösbar Spezialfall Es gibt nur 2 Zahlungen: L p = 100 × [ n√( n )– 1] I0 Mehr als ein oder kein interner Ertragssatz Ökonomisch unnütz, stattdessen auf Kapitalwertmethode oder Annuitätenmethode ausweichen. Annuitätenmethode Die Investition ist vorteilhaft, wenn Einzahlungsannuität > Auszahlungsannuität Einzahlungsannuität: AE = BE ⋅ q n ⋅ q −1 n et Ln n q −1 =∑ + ⋅ q ⋅ n q n −1 t=1 qt qn q −1 Auszahlungsannuität: AA = BA ⋅ q n ⋅ q − 1 n at q −1 = ∑ t + I 0 ⋅ q n ⋅ n n q − 1 t =1 q q −1 et − at Ln + n − I0 qt q t =1 q −1 A = K 0 ⋅ qn ⋅ n q −1 n Kapitalwert: Annuität: K0 = ∑ 2. Jahr (29.4.2003) Christian Meyer Seite 5 / 17 Extremwerte, Wendepunkte Differentialrechnung f'(x0) = 0 Ableitungsregeln ⇔ Horizontale Tangente x0 = f'(x) = 0 und f''(x0) < 0 (Umkehrun gilt nicht) x0 = f'(x) = 0 und f''(x0) > 0 x0 = f''(x) = 0 und f'''(x0) ≠ 0 Wendetangente geht durch Punkt P(0 /0) ⇒ f'(x) = 1 f(x) = xn ⇒ f'(x) = n • xn – 1 , n ∈ |Q* f(x) = x–n ⇒ f'(x) = –n • x–n – 1 f(x) = c • g(x) ⇒ f'(x) = c • g'(x) (Faktorregel) Im Wendepunkt ist die Steigung des Graphen bezüglich seiner Umgebung von x0 maximal oder minimal. f''(x) > 0 : Graph ist nach links gekrümmt (konvex) f''(x) < 0 : Graph ist nach rechts gekrümmt (konkav) f(x) = g(x) ± h(x) ⇒ f'(x) = g'(x) ± h'(x) (Summenregel) Ganz-Rationalen Funktion f(x) = anxn + an–1xn–1 + ... + a2x2 + a1 x + a0 ⇒ f(x) = n × anxn–1 + (n–1) × an–1xn–2 + ... + 2 × a2x + a1 Produktregel f(x) = g(x) • h(x) ⇒ f'(x) = g'(x) • h(x) + g(x) • h'(x) Quotientenregel Z(x) f(x) = ⇒ f'(x) = Z' • N –2Z • N' N(x) N f(x) = ax Berechnung Wendetangente: f''(x) = 0 => x1 => f'''(x1) ≠ 0 = m1 x2 => f'''(x2) ≠ 0 = m2 m1/ m2: Steigung der Wendetangente in f'(m1) = y: um y zu erhalten Bestimmung von m, so dass Parabel und Gerad sich berühren f1(x) = ax2+bx+c f2(x) = mx + q (wobei q gegeben) Steigung: f'1(x) = f'2(x) = m Berührungspunkt: f1(x) = f2(x) ax2+bx+c = mx + q auf => x lösen ! x in vorhandene (gegebene) Formel einsetzen um y zu erhalten Logarithmus- und der Exponentialfunktion 1 1 f(x) = ln x = loge x ⇒ f'(x) = x = וln e f(x) = ex ⇒ f'(x) = e x ⇒ Wendepunkt (Umkehrun gilt nicht) f(x) = x ⇒ f'(x) = ⇒ Lokales Minimum (Umkehrun gilt nicht) Ableitungen der Funktion f(x) = c ⇒ f'(x) = 0 f(x) = loga x ⇒ Lokales Maximum Ökonomische Anwendungen 1 × •·ln a Produktionsfunktion f(x) = e2x ⇒ f'(x) = 2•e2x ⇒ f'(x) = ax • ln a Kettenregel Klassisches Ertragsgesetz Bei wachsendem Faktoreinsatz steigt der Ertragszuwachs zunächst. Nach erreichen eines bestimmten Optimums (Wendepunkt) sinkt der Ertragszuwachs bei wachsendem Faktoreinsatz. =>Optimum ist beim Wendepunkt = grösster Grenzertrag f(x) = g( h(x) ) = g(v) ⇒ f'(x) = g'(v) • h'(x) ⇒ f'(x) = g'(h(x)) • h'(x) Durchschnittsertrag am grösten, Steigung maximal Gewinn maximal ó Grenzkosten = Grenzerlös G'(x) = 0 ó K'(x) = E'(x) Differentiale Schreibweise (Sprich "dy nach dx"): dy y'(x) = dx Neoklassische Produktionsfunktion Die Grenzerträge sind immer positiv nehmen aber stets ab (konkave Kurven). Bedeutet, dass y von x abhängt: Die Gleichung muss somit nach y aufgelöst sein. Alle Variablen ausser x werden als konstante Werte betrachtet. x'(r) ist immer > 0 x''(r) ist immer < 0 Kosten Linearer Kostenverlauf K'(x) ist immer > 0 und ist konstant K''(x) ist immer = 0 Progressiver Kostenverlauf (konvex) K'(x) ist immer > 0 und ist wachsend K''(x) ist immer > 0 2. Jahr (29.4.2003) Wenn der Verlauf einer Parabel entspricht dann: Christian Meyer Seite 6 / 17 Gewinnmaximierung K'(x) ist immer > 0 und ist konstant K''(x) ist immer > 0 und ist konstant Monopolist G(x) = E(x) – K(x) Degressiver Kostenverlauf (konkav) K'(x) ist immer > 0 und ist abnehmend K''(x) ist immer < 0 G(x) = PN(X) •x – K(x) Das Gewinnmaximum ist dort, wo Steigung der Kosten = Steigung des Erlös. Typischer Kostenverlauf K'(x) ist immer > 0 K''(x) ist < 0 von x=0 bis zum Wendepunkt xw = 0 am Wendepunkt xw > 0 vom Wendepunkt xw bis x=8 K'(x) = E'(x) = G'(x) = 0 und G''(x) < 0 Grenzerlös = Grenzkosten Die Steigung des Gewinns ist: G'(x) = E'(x) – K'(x) mathematisch ökonomische Definition der Grenzkosten: K'(x) = lim K(x + ?x) – K(x) = lim ?K ?x→0 ?x→0 ?x ?x K'(x) gibt näherungsweise den Kostenzuwachs an, wenn x um 1 Einheit erhöht wird. Grenzkosten: K’(x) = Kv’ (x) dE Grenzerlös E' (x ) = dx dG Grenzgewinn G' (x ) = dx Betriebsoptimum [ME] = Schnittpunkt: K ' ( x ) ∩ k (x ) [GE] = Økosten(x) beim Minimum à langfristige Preisuntergrenze (fix + var.Kosten gedeckt)à ist Preis grosser wird ein Gewinn erzielt K’(x) = k(x) => nach x lösen => x: betriebsoptimale Erzeugungsmenge => x in k(x) einsetzen => langfr. Preisuntergrenze Betriebsminimum [ME] = Schnittpunkt K ' ( x ) ∩ k v ( x ) [GE] = kv(x) beim Minimum à kurzfristige Preisuntergrenze (var.Kosten gedeckt) (Deckungsbeitrag = 0) kv(x)’: Scheitelpunkt von kv = 0 => nach x lösen x: betriebsminimale Erzeugungsmenge; dann x in kv(x) einsetzen => kzfr. Preisuntergrenze Gewinnmaximierung G' (x ) = E' ( x ) − K ' (x ) = 0 à E' ( x ) = K ' (x ) und G' ' (x ) < 0 = Gewinnmax. ME Gewinnmax. Wenn Grenzerlös = Grenzkosten Gewinn im Gewinnmax: x(Pnachfrage(x) – k(x)) Vollkommene Konkurrenz Der Erlös ist eine Gerade, weil wir den Preis nicht beinflussen können. Das Gewinnmaximum ist dort, wo Steigung der Kosten = Erlös bzw. wo Grenzkosten = Verkaufspreis. K'(x) = E(x) G(x)= p • x - K(x) Preis = Grenzkosten: p = K’(x) Die Steigung des Gewinns ist: G'(x) = E'(x) – K'(x) Marginale Konsum- und Sparquote Konsumfunktion Y = C+S C = Konsum eines Haushaltes S = Ersparnis des Haushaltes Y = Einkommen des Haushaltes Marginale Konsumquote Die marginale Konsumquote gibt näherungsweise an, um wieviel sich der Konsum des Haushaltes ändert, wenn das Einkommen um eine Einheit erhöht wird. dC = marginale Konsumquote (Grenzneigung zum Konsum) dY Marginale Sparquote Die marginale Sparquote gibt näherungsweise an, um wieviel sich die Ersparnis des Haushaltes ändert, wenn das Einkommen um eine Einheit erhöht wird. dS = marginale Sparquote (Grenzneigung zum Sparen) dY Die marginalen Konsum- und Sparquote ergänzen sich zu 1! Produktivität x (r ) r ' x( r ) max . Pr oduktivität = r Durchschnittsertrag = 2. Jahr (29.4.2003) Christian Meyer Seite 7 / 17 Elastizität dy x × dx y(x) ε y(x) gibt näherungsweise an, um wieviel Prozent sich die abhängige Variable y ändert, wenn die unabhängige Variable x um 1 Prozent verändert wird. ε y(x) = Wahrscheinlichkeitsrechnung Kombinatorische Grundlagen Nachfragefunktion Preiselastizität der Nachfage x = Nachfrage p = Preis dx p ε x(p) = × dp x(p) Angebotsfunktion Preiselastizität des Angebots x = Angebot p = Preis dx p ε x(p) = × dp x(p) Produktionsfunktion Produktionselastizität x = Output r = Input des Produktionsfaktors dx r ε x(r) = × dr x(r) Permutation mit Wiederholung*: n! wobei i+j+k=n i!⋅ j!⋅k! Anzahl Variationen von k aus n Elementen =nK Permutation =n! Anzahl Variationen von k aus n Elementen Konsumfunktion Einkommenselastizität des Konsums C = Konsum Y = Einkommen dC Y ε C(Y) = × dY C(Y) = n! (n − k )! Kombination mit Wiederh. von k gleichen Elementen* Kostenfunktion Kostenelastizität K = Kosten x = Produktionsmenge dK x ε K(p) = × dx K(x) = (k + n − 1)! k!⋅(n − 1)! Kombination von k aus n Elementen =( nk ) mit TR: [COMB] (für Prosten + Match) *nur zur Vollständigkeit nicht in Übungsserien ε K(p) = K'(x) x 1 K'(x) Grenzk. = = K(x) = K'(x) • k(x) k(x) Durchschnk. n tief k Im Betriebsoptimum ist K' = k, somit ε = 1 n tief k = ( Optimale Bestellmenge n ( )=1 0 xopt = v 200 • M × F e•p M = Bedarfsmenge pro Planperiode F = Fixe Kosten pro Bestellung e = Stückkosten p = Zins und Lagerkosten in % für das im Lager gebundene Kapital: 20 % = 0.2 n n! k Faktoren abw. von n )= = k k Faktoren aufw. von 1 (n – k)! • k! Anzahl Mehrspieler: n: Anzahl ursprüngliche Spieler ( n2+m ) − ( n2 ) = Anzahl Mehrspieler m = n ⋅ m + (2 ) 0 ( )=1 0 n·m: Spiele gegen Dritte n n ( )=( ) k n–k ( m2 ) : Spiele untereinander Binomialkoeffizient n Anzahl Bestellungen: M Anz = xopt 2. Jahr (29.4.2003) (a + b) n = ∑ ( nk ) ⋅ a n−k ⋅ b k K =0 Christian Meyer (a-b)n => auf Vorzeichen achten ungerade wird - Seite 8 / 17 Wahrscheinlichkeit Wahrscheinlichkeit P = Total Anz. günstige Fälle Anz. gleichmögliche Fälle S: Ereignisraum / Stichprobenraum Münze: S= {Zahl, Kopf} Multiplikationssatz Wahrscheinlichkeit, dass A und B eintritt, wenn A und B voneinander unabhängig sind: P(A ∩ B) = P(A) • P(B) Wahrscheinlichkeit dass A und B eintreten, wenn B von A abhängig ist: P(A ∩ B) = P(A) • P(A / B) '/' steht für 'ohne' Häufigkeits- und Wahrscheinlichkeitsverteilungen Zufallsvariable Eine Zufallsvariable ist eine Funktion, die jedem Elementarereignis eine Zahl zuordnet. • Diskrete ZV: Variable kann nur isolierte Werte annehmen. • Stetige ZV: Variable kann jede beliebige reelle Zahl annehmen. Diskrete Wahrscheinlichkeitsverteilungen Bernoulli-Verteilung Wahrscheinlichkeit, dass entweder A oder B von zwei sich ausschliessenden Ereignissen eintritt: P(A ∪ B) = P(A) + P(B), wenn A ∩ B = ∅ Verteilfunktion: P(X=1) = p µ=p P(X=0) = 1 – p σ = n • p • (1 - p) Elementare Misserfolg-Erfolg-ZV. Meist ist Wahrscheinlichkeit von Erfolg und Misserfolg nicht identisch. Nur ein Versuch; zwei mögliche Ergebnisse Allgemeiner Additionssatz Binomialverteilung Wahrscheinlichkeit, dass A oder B eintritt oder beide Fälle: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) Verteilungsfunktion einer binomialverteilten Zufallsvariable S: Additionssatz Lotto 6 45 – 6 ) )×( n 6–n n richtige Zahlen = 45 ) ( 6 ( • • Urne mit schwarzen und weissen Kugeln ks = Anzahl schwarze Kugeln kw = Anzahl weisse Kugeln n = ks + kw = Anzahl Kugeln insgesamt k ( w ) 4 P(4 weisse Kugeln) = n ( ) 4 n− k ) Ziehen mit Zurücklegenvon je 1 Element aus einer dichtochomen Grundgesamtheit. Stichprobe < 5 % Für die Binomialverteilung gilt: µ=n ×p 10 ⋅ 0,04 1 ⋅ 0,96 9 1 kw ks ) 2 )•( 3 n ( ) 2+3 è P(1 untergewic htig, 9 richtig) = usw. Bsp II: 6% aller Blutspender haben Blutgruppe AB. Wieviel Spender müssen sich beteiligen, bis man sicher (99%) eine gesucht Spende erhält? 1 4 P(9 gleichfarbige 35 = 36 Karten) = ( ) ( ) 8 9 n 1-P(kein AB Blutspender)= 1- 0.94 > 0.99 0.01 > 0.94n n > ln(0.01) / ln(0.94) n = 74.426 1 36 ( ) 9 Hier ist nicht mehr egal, welche Karte zuerst gezogen wird. 2. Jahr (29.4.2003) k Beispiel Produktionsüberwachung: Auf 100 sind 4 untergewichtig und 10 werden auf zufällige Weise herausgegriffen. 10 P(0 untergewic htig, 10 richtig) = ⋅ 0,04 0 ⋅ 0,9610 =66,5% 0 (dass keine Untergewichtig ist) Karten ziehen P(9 Eicheln) = n k σ = n ⋅ p ⋅ (1 − p) P(min. 1 schw. Kugel) = 1 - P(4 weisse Kugeln) ( ( )⋅ p ⋅ (1 − p )( p: Erfolgswahrscheinlichkeit eines Versuchs (Parameter) n: Totale Anzahl identischer, unabhäng. Versuche k: Anzahl erfolgreicher, positiver Versuche (p meist nicht gegeben) 1 Gewinnchance = 45 ( ) 6 P(2 weisse Kugeln und 3 schw. Kugeln) = P(S = k ) = Poissonverteilung Wenn: • p < 0.05 (seltenes Ereignis) • n > 10 kann die Poissonvert. die Binomialverteilung gut approximieren. Christian Meyer Seite 9 / 17 λk mit λ > 0 P( X = k ) = e ⋅ k! E(x) = λ σ = λ P(0 Notfälle=k) = ... % −λ V(x) = λ ... P(5 Notfälle=k) = ...% P(...) solange addieren, bis die gewünschte Fläche gefüllt ist. µ =λ P(0 bis 5 Notfälle=k) = 99.85 % Parameter: λ = p • n oft ø pro Tag = λ Beispiel Impfung: Auf 1000 vertragen 1 die Impfung schlecht. 2000 werden geimpft. Somit λ = 2000 ⋅ 0,001 = 2 è P( X = 0 ) = e −2 ⋅ 20 21 è P( X = 1) = e −2 ⋅ usw. 0! 1! Bsp: an wieviel Tagen passiert kein Verkehrsunfall ? E(x) = λ = 1 P (x = λ ) • 365 Masszahlen einer ZV X: E [x ] = µ = ∑i =1 x i ⋅ p i n x− µ σ µ = Erwartungswert der ZV (Maximum der Glockenkurve) σ = Standardabweichung der ZV (Streuung um den Erwartungswert µ) ] kleines VAR ( X ) = E ( x − E [x ]) = σ = ∑i =1 ( xi − µ ) ⋅ pi 2 2 n 2⋅ Standardabweichung: i =1 Erwartungswert (Gipfel der Kurve) Standardabweichung (Streuung) Fläche = Wahrscheinlichkeit grosses σ σ : hohes Maximum, schlanke Kurve : niedriges Maximum, breite Kurve • Wendepunkt der Gauss’schen Glockenkurve liegen bei µ ± σ Standardnormalverteilung n ∑(x − µ ) ⋅ pi Entspricht der Normalverteilung, wobei µ=0 und σ=1 gesetzt sind: 2 i Näherungswert bei n → ∞ : σ = s σ : Standardabweichung für Population s: Standardabweichung für Stichprobe Coeffitient of Variation: VAR ( X ) σ cv = = E [X ] µ σ (“Risikomass”) -z +z -3 Rechenregeln E[X] und V(X) -2 -1 0 µ 1 2 3 Umrechnen der Zufallsvariable X in die standardnormalverteilte Zufallsvariable z: X–µ z= σ E[X+Y]= E[X]+E[Y] E[a • X] = a • E[X] var (X) = E[X2] – (E[X])2 σ ( x + y ) = σ x2 + σ y2 var (a • X) = a • var(X) var (X+ Y) = var (X) + var (Y) 2 Verteilung Bernoulli Parameter p E[X] p Varianz σ2 Binomial Poisson n, p λ n•p λ n•p• (1-p) λ P • (1-p) Die Binomialverteilung kann durch die Standardnormalverteilung angenähert werden, wenn 9 n> p • (1 – p) Beispiel Das Spital erwartet 1.2 Notfälle pro Tag: λ = 1.2. Maximal 1 von 500 Notfällen müssen durch die Notfallstation abgedeckt sein: P(X=k)=99.8%. Wieviele Plätze braucht die Notfallstation? 2. Jahr (29.4.2003) 2 − 0.5⋅ 1 ⋅e 2 ⋅π ⋅σ F(z) Näherungswert bei n → ∞ : µ = x VAR ( X ) = σ = Die Normalverteilung basiert auf der Dichtefunktion (Graph siehe Standardnormalverteilung). µ: σ: Erwartungswert: [ Normalverteilung f (x) = Kennzahlen von diskreten Verteilungen Varianz: Die Notfallstation braucht 5 Plätze um 499 von 500 Fällen abzudecken. Tabelle 1: Fläche von -z bis +z z 1 1.96 2 F[z] 68.269% 95% 95.5% 2.58 99% 3 99.73% Tabelle 2. Fläche von -8 bis z z 0 1.65 1.96 F[z] 50% 95% 97.5% 2.35 99% 2.58 99.5% Approximation der Binomial- durch die Normalverteilung Wenn n •p•(1-p) > 9 ist es zulässig, die Binomialverteilung durch Normalverteilung zu approximieren. 8-ung: Stetigkeitskorrektur wird benötigt, wenn mit einer stetigen Verteilung als Approximation für eine diskrete Häufigkeit od Verteilung gearbeitet wird. Stetigkeitskorrektur: halbe Klassenbreite oder den halben Abstand zw. benachbarten diskreten Werten. x oder weniger => + halbe Klassenbreite x oder mehr => - halbe Klassenbreite Christian Meyer Seite 10 / 17 Schliessende Statistik Schätzungen: Für welche Parameter der Grundgesamtheit sind die gemachten Beobachtungen am wahrscheinlichsten ? Tests: Sind die Beobachtungen für einen vorgegebenen Parameter (un-)wahrscheinlich ? Mit einer zu t gehörenden Wahrscheinlichkeit enthält das Intervall von x −t ⋅ Vertrauensintervalle: Für welche Parameter (Intervall) sind die Beobachtungen genug wahrscheinlich (plausibel), für welche eher unwahrscheinlich ? weggelassen werden (resp. durch 1 ersetzt werden) Liste von t-Werten: Stichprobengr össe 5 Stichprobengr össe 20 X1, X2, … N • X N X = ∑ Xi = N ⋅ X Proportion von G P= Empirische Varianz s2 = • X n 1 ⋅ ∑ ( xi − x ) 2 n − 1 i =1 • X1, X2, … x1, x2, … n n x = ∑ xi = n ⋅ x Proportion von S p= Empirische Standardabw s= Daten der Stichprobe (S) x1, x2, … i =1 x n 1 ⋅ ∑ ( xi − x ) 2 n − 1 i =1 Konfidenzintervalle von quantitativen Variablen Stichprobengrös se 10 Stichprobengrös se 100 s N −n s N −n x−z⋅ ⋅ bis x + z ⋅ ⋅ das N −1 N −1 n n arithmetische Mittel µ der Grundgesamtheit. =>n: Grösse der Stichprobe x X durch p P ⋅ (1 − P ) σ durch durch P p ⋅ (1 − p ) und s durch Mit einer zu z gehörenden Wahrscheinlichkeit enthält das Intervall von p1 = p− z⋅ p ⋅ (1 − p ) N −n ⋅ n N −1 bis p2 = p+z⋅ p ⋅ (1 − p ) N −n ⋅ n N −1 die Proportion P, bzw. die relative Häufigkeit eines qualitativen Merkmals der Grundgesamtheit. N −n N −1 Ist n kleiner als 5% von N, so kann werden (resp. durch 1 ersetzt werden) Liste von z-Werten: z=1 z=2 z=1 z=2 z=1.96 z=2.58 Für Stichproben kleiner 100: 2. Jahr (29.4.2003) = 2.26 / = 3.25 = 1.98 / = 2.63 Der einzige Unterschied zu oben besteht darin, dass die zufälligen Stichprobendaten x1, x2, … jetzt binär sind und damit eine einfachere Verteilungsfunktion besitzen. Wir ersetzten somit: weggelassen werden (resp. durch 1 ersetzt werden) Liste von z-Werten: Für W’keit von 68.3% Für W’keit von 95.5% 95% 99% 95% 99% ist n ⋅ p ⋅ (1 − p) > 9 können wir wieder wie folgt rechnen (der andere Fall wird weggelassen): Für Stichproben grösser 100: Mit einer zu z gehörenden Wahrscheinlichkeit enthält das Intervall von Ist n kleiner als 5% von N, so kann = 2.78 / = 4.60 = 2.09 / = 2.86 Konfidenzintervalle für qualitative Variablen (Proportion/Anteilswert) x Gesamtsumme 95% 99% 95% 99% je grösser die Sicherheit, desto breiter der Vertrauensbereich je grösser die Standardabweichung der Stichprobe, dest breiter der Vertrauensbereich Für das Verhältnis zur Grundgesamtheit kleine Stichproben (n / N < 0,05 ) gilt: Die Grösse der Grundgesamtheit hat keinen Einfluss auf der Vertauensbereich (z) Je grösser Stichprobe, desto kleiner das Vertrauensintervall • i =1 Daten der Grundgesamtheit Daten der Stichprobe (S) Umfang der Stichprobe (S) Durchschnitt von (S) N −n N −1 Ist n kleiner als 5% von N, so kann Schätzungen Gesamtsumme s N −n s N −n ⋅ bis x + t ⋅ ⋅ das N −1 N −1 n n arithmetische Mittel µ der Grundgesamtheit. Formulierung: Das Intervall mx±.. enthält µ mit 95%iger Sicherheit. Daten der Grundgesamtheit Umfang der Grundgesam (G) Durchschnitt von (G) Je kleiner desto schlechter sind die Grenzen des obgenannten Intervalls >> t-Verteilung Bei der t-Verteilung nähern sich die beiden Flanken der Kurve weniger schnell der horizontalen Achse als die Seiten der Normalverteilung, daraus folgt: Für W’keit von 95% Für W’keit von 99% Für W’keit von 68.3% Für W’keit von 95.5% Hochrechnung: Christian Meyer N −n N −1 z=1.96 z=2.58 p1 • N P2 • N weggelassen Für W’keit von 95% Für W’keit von 99% N: Grundgesamtheit Seite 11 / 17 Stichprobengrösse Wie gross muss die Stichprobengrösse mindestens sein, wenn mit mit einer Sicherheit von p %, nicht mehr als ±F Elemente daneben liegen möchte? Quantitativer Fall der Stichprobengrösse Grosse Stichproben: n= N F ⋅ ( N − 1) +1 z 2 ⋅σ 2 2 F = maximale Abweichung, maximaler Fehler Kleine Stichproben (n / N < 0,05 ) : n= z ⋅σ F2 2 Signifikanzniveau • Vorwegstichprobe: σ = s • Drei-Sigma-Regel: α = P ( X > c ) = 1 − P ( X ≤ c ) = 1 − P ( X ≤ kritischer Wert) Spannweite maximaler Wert - minimaler Wert = 6 6 (> um den maximalen Fehler zu halbieren, Stichprobengrösse • 4) (> immer zuerst Netto-Stichprobe berechnen, erst dann BruttoStichprobe) Beispiel Packungen: Durch eine Zufalls-Stichprobe soll abgeklärt werden, für wie viele Personen der Inhalt einer Packung XY durchschnittlich reicht. Mit 95.5%iger Sicherheit soll der gefundene Wert x um nicht mehr als F = 0.1 Personen vom richtigen Wert µ der Grundgesamtheit abweichen. (Annahme: Packung reicht für maximal 6 und minimal 1.5 Personen) Drei-Sigma-Regel: 6 − 1 .5 = 0.75 è 6 σ = Qualitativer Fall der Stichprobengrösse Grosse Stichproben (n / N ≥ 0,05 ) : z 2 ⋅ P ⋅ (1 − P ) ⋅ N F 2 ⋅ ( N − 1) + z 2 ⋅ P ⋅ (1 − P ) Einstichproben t-Test (gepaarten Zweichstichproben t-Test): z 2 ⋅ P ⋅ (1 − P) F2 Ist in der Grundgesamtheit das arithm. Mittel µ verschieden von einem vermuteten Wert µ0 ? Beispiel Videokameras: Durch eine Zufallsstichprobe soll abgeklärt werden, wie gross der Anteil der Haushaltungen mit eigenen Videokamaras ist. Mit 95% Sicherheit soll der gefundene Wert p um nicht mehr als F=3% vom wahren Wert A der Grundgesamtheit abweichen. Grösse der Stichprobe? Kein Schätzwert >> P = 0.5 : n = 2 ⋅ 0 . 5 ⋅ (1 − 0 . 5 ) = 1067 0 . 03 2 Berechnung der Standardabweichung: • • σ = s oder auch: P * (1-P) = s Schlechtester Fall: σ = 0.5 oder auch: P * (1-P) = 0.5 Vorwegstichprobe: • Die Nullhypothese ist richtig, wird aber trotzdem verworfen. Ein solcher Fehler heisst „Fehler 1. Art“. Die Wahrscheinlichkeit ist α . • Die Nullhypothese ist falsch, wird aber nicht verworfen. Ein solcher Fehler heisst „Fehler 2. Art“. Die Wahrscheinlichkeit β ist oft schwer oder überhaupt nicht zu berechnen. Tests bezüglich µ Kleine Stichproben (n / N < 0,05 ) : 1 . 96 Fehlerarten: Verwerfung der Hypothese: Sobald z resp. t (Testgrösse) im kritischen Bereich (Verwerfungsbereich) liegt, muss Hypothese verworfen werden. F = maximale Abweichung, maximaler Fehler n= z.B. α = 1% : Wenn viele Tests durchgeführt werden, so sind in genau jenen Fällen, in denen H0 richtig ist, etwa 1% der Urteile falsch. è 5% für signifikant und 1% für hochsignifikant Macht des Tests: Je Grösser die Macht des Tests (1 – ß) bei gegebenem a, desto besser ist die Trennschärfe (Qualität des Tests). Macht des Tests ist abhängig von der Stichprobengrösse. z 2 ⋅ σ 2 2 2 ⋅ 0.75 2 n= = = 225 F2 0.12 n= Logischer Ablauf eines Hypothesen-Tests: • Die Vermutung über eine Grundgesamtheit soll indirekt bestätigt werden. • Die Nullhypothese H0 wird als "Gegenhypothese" aufgestellt. Ziel ist H0 zu widerlegen. • Planung des Zufallsexperiments: Wahl der Testgrösse, deren Wert durch das Zufallsexperiment bestimmt werden kann. • Signifikanzniveau α wählen, Verwerfungsbereich bestimmen, Entscheidungsregel aufstellen. • Zufallsexperiment durchführen, Wert der Testgrösse bestimmen. Wert der Testgrösse fällt in Verwerfungsbereich: ⇒ H0 verwerfen :Wert der Testgrösse fällt nicht in Verwerfungsbereichs ⇒ H0 ist nicht widerlegt und wird somit bis auf weiteres beibehalten) 2 Berechnung der Standardabweichung σ : σ = Testen von Hypothesen Testgrösse: n ≥ 100 : z= n < 100 : t= (x − µ 0 ) ⋅ n s (x − µ 0 ) ⋅ n s Einstichprobentest einseitig H0: µ = µ0 HA: µ > µ 0 bzw. µ < µ 0 • Verwerfungsbereich: α = 5% : | z | > 1.65 2. Jahr (29.4.2003) Christian Meyer Seite 12 / 17 α = 1% : | z | > 2.33 • t für n=20 α = 1% : Beispiel Studiendauer: n1 = n2 = 100; x1 = 6.03; x 2 = 5.87; s1 = 1.53; s2 = 1.42 è H0: µ1 = µ2 | z | > 2.33 | t | > 2.54 HA: µ1 ≠ µ 2 Einstichprobentest zweiseitig H0: µ = µ 0 HA: µ ≠ µ 0 3. 4. Testgrösse n=100 à z (wenn n<100 àt) Signifikantsniveau : α = 5% : | z | > 1.96 α = 1% : | z | > 2.58 5. z= s (2.7 − 2.5) ⋅ 0 .4 100 Kritischer Bereich =5 6. | z | > 2.58 und | z | > 1.96 Die Nullhypothese H0 wird verworfen. Der Wirkstoffgehalt weicht hochsignifikant vom Sollwert ab. Beispiel einseitiger Test: Lebensdauer von Reifen: Test: 62000, 56000, 75000, 70000, 82000, 76000 km; Hersteller behauptet Lebensdauer=80000km 7. Vermutung Lebensdauer ≠ 80000km (nur zu kleine Lebensdauer schadet) 8. H0: µ = µ 0 = 80000 HA: µ < µ0 à einseitiger Test 9. Testgrösse n=6 à t 10. Signifikantsniveau : 11. 6.03 − 5.87 2 2 = 0.766 è | z | < 1.96 1.53 1.42 + 100 100 Tests bezüglich p Wirkstoffgehalt: n = 100; x = 2.7; s = 0.4, SOLL-x = 2.5 1. Vermutung Wirkstoffgehalt .≠ 2.5 (zu grosser und zu kleiner Wirkstoffgehalt schadet) 2. H0: µ = µ 0 = 2,5 HA: µ ≠ µ 0 à zweiseitiger Test = = 2 Die Nullhypothese H0 kann nicht verworfen werden. Sie muss bis auf weiteres beibehalten werden. Beispiel zweiseitiger Test: n 2 s1 s + 2 n1 n2 • Verwerfungsbereich: α = 5% : | z | > 1.96 α = 1% : | z | > 2.58 • t für n=20 α = 1% : | z | > 2.58 | t | > 2.86 (x − µ0 )⋅ x1 − x2 z= α = 5% : | t | > 2.02; (x − µ 0 ) ⋅ n = (70166 − 80000 ) ⋅ 6 = 2.498 t= s 9642 Einstichprobentest Ist in der Grundgesamtheit der Anteil P eines Merkmals verschieden von einem vermuteten p0 ? Voraussetzung: (für die Approximation der Binomialverteilung mit der Normalvereilung) n • p0 • (1 - p0) > 9 => Achtung Stetigkeitskorrektur Testgrösse: z= ( p − p 0 )⋅ σ n mit σ = p 0 ⋅ (1 − p0 ) Einstichprobentest einseitig H0: P = p0 HA : P > p0 bzw. P < p0 Einstichprobentest zweiseitig H0: P = p0 HA : P ≠ p0 Tabelle 2: (einseitig) α = 5% : | z | > 1.65 α = 1% : | z | > 2.33 Die Nullhypothese H0 wird verworfen. Die Lebensdauer der Reifen weicht signifikant vom Sollwert ab. Tabelle 1: (zweiseitig) α = 5% : | z | > 1.96 α = 1% : | z | > 2.58 Zweistichprobentest (zwei voneinander unabhängige Stichproben à immer zweiseitig): Zweistichprobentest (zwei voneinander unabhängige Stichproben à immer zweiseitig) 12. | t | > 2.02 Haben zwei Grundgesamtheiten verschiedene arithmetische Mittel µ1 und µ2 ? Hypothesen: H0: µ 1 = µ 2 HA : µ 1 ≠ µ 2 Testgrösse: n1 ≥ 100 , n 2 ≥ 100 z= x1 − x2 s 12 s 2 2 + n1 n2 Verwerfungsbereich: α = 5% : | z | > 1.96 α = 1% : | z | > 2.58 2. Jahr (29.4.2003) H0: p1 = p 2 p1: Anteil d. Merkmals in der 1. Stichprobe HA : p1 ≠ p 2 p2: Anteil d. Merkmals in der 2. Stichprobe (n1 + n 2 ) ⋅ p > 5 ∧ (n1 + n2 ) ⋅ (1 − p ) > 5 ∧ p ⋅ n + p2 ⋅ n2 n1 ≥ 50 , n 2 ≥ 50 wobei p = 1 1 n1 + n 2 p1 − p 2 z= 1 1 p ⋅ (1 − p) ⋅ + n1 n2 Tabelle 1: α = 5% : Christian Meyer | z | > 1.96 α = 1% : | z | > 2.58 Seite 13 / 17 2. Jahr (29.4.2003) Christian Meyer Seite 14 / 17 Hinweise zu Excel: Gepaarter t-Test Abhängig = gepaart Nicht gepaarter Zweistichprobentest Regressionsrechnung: Sie ermittelt einen funktionalen Zusammenhang, ein Modell zwischen abhängigen Zielvariablen und den unabhängigen Erklärungsvariablen, basierend auf einer Reihe von Beobachtungen oder Messwerten. Die Erklärungsvariablen werden auch Regressoren genannt. Dabei wird zwischen linearen und nichtlinearen Regressionen unterscheiden: Lineare Regression y = ax+b y = a+bx2 (nur ein Regressor: x1) y = a+b*2x à a und b kommen hier stets in linearer Form vor Multiple Regression 1 1 y = a⋅ 2 +b⋅ 2 + c x1 x2 (zwei Regressoren : x1 und x2) Nichtlineare Regression y = a*b y = a+bx+b2+x y = ax/bx y = a+b*ax Beispiel Regression: Bevor der Vertrieb eines neuen Produktes in der ganzen Schweiz aufgenommen wird, soll ein Marktforschungsinstitut den Zusammenhang von Verkaufspreis und Absatz des neuen Produktes bestimmen. Dies geschieht in ausgewählten 15 Ortschaften in der Schweiz, in welchen die Produkte zu unterschiedlichen Preisen angeboten werden • Beispiel einer einfachen linearen Regression aus Sicht der beschreibenden Statistik: Diese Preis/Absatz Korrelationen können nun in einem Diagramm aufgezeichnet werden – und dabei versucht werden eine Regressionsgerade einzupassen. Dies geschieht oftmals mit der Methode der „kleinsten Quadrate“, es minimiert die y-Abstände zwischen allen Punkten und der Geraden (Achtung, nur die yAbstände minimieren à nur der Preis ist die abhängige Variable. Die dabei entstehen y-Abstände werden als Fehler, bzw. Residuen bezeichnet. [Konklusion: die beschreibende Statistik bemüht sich ideale (lineare o. exponentielle) Formeln für eine Punktschätzung, d.h. ein möglichst gutes anpassen an vorhandene Datenpunkte, zu finden] • Beispiel einer einfachen linearen Regression aus Sicht der schliessenden Statistik: Voraussetzung: Konfidenzintervalle können gerechnet werden. Regressionsmodell muss mit einem Wahrscheinlichkeitsmodell beschrieben werden. Unbekannte Parameter: a, b und s Aufgrund dieser Daten können nun Fragen bezüglich der Wahrscheinlichkeit/Plausibilität, deren Konfidenzintervallen und mögliche Testmöglichkeiten beantwortet werden. Dazu muss die Regression mit einem Wahrscheinlichkeitsmodell beschrieben werden. Die bei der Erhebung aufgetretenen Fehler werden also normalverteilt und voneinander unabhängig angenommen. Deshalb anhand komplizierter Formeln a, b und neu auch σ geschätzt werden, dies ergibt â, b̂ und σˆ .Dabei sind alles Zufallsvariablen ausser die Regressorenwerte xi. [Konklusion: die schliessende Statistik versucht Fragen bezüglich Genauigkeit, Plausibilität anhand von Intervallschätzungen zu beantworten] 2. Jahr (29.4.2003) Christian Meyer Seite 15 / 17 Output einer Excel-Regression: Regressions-Statistik Multipler Korrelationskoeffizient Bestimmtheitsmaß = R2 Adjustiertes Bestimmtheitsmaß Standardfehler Beobachtungen Schätzung für s : σˆ Anzahl Beobachtungen: n 0.644855921 0.415839159 0.391499124 17.23221876 26 ∑r 2 i 1 ri 2 = σˆ 2 ∑ Anzahl Re siduen ANOVA (Analysis of Variance) Freiheitsgra de (df) Regression Residue Gesamt Quadratsummen 1 24 25 5073.2537 7126.7847 12200.038 Koeffizienten Schnittpunkt 136.73611 X Variable 1 24.548611 Stdfehler Mittlere Quadratsumme (MS) 5073.253739 296.9493634 t-Statistik 23.453164 5.9391575 Prüfgröße (F) F krit 17.0845 P-Wert 0.0003 Untere 95% 5.83017738 0.00007 88.331 -4.133349154 0.00038 36.806 â (Schätzung der Steigung) b̂ (Achsenabschnitt) Korrelation von y-Werten und Prognosewerten Obere 95% 185.1 4 12.29 3 Untere 95.0% Obere 95.0% 88.331 185.14 36.807 12.293 Rot: Konfidenzintervall für b Blau: Konfidenzintervall für a Grün: t-Test, ob b = 0 und a = 0 plausibel ist (Wahrscheinlichkeit, dass Werte = 0) Bestimmtheitsmass R2 σ = SSx = ∑ x − n ⋅ x = xi 2 i 2 R2 = 2 Varianz (Yˆ ) Varianz (Y ) Zähler: durch Regression erklärte Varianz von y Nenner: Gesamtvarianz von y Regression mit nichtlinearen Funktionen: 0< R2 ein <1 Erklärungskraft d.zwei Regression umso grösser, Die Punkte streuen nun nicht mehr um eine Gerade, sonder Kurve. Dies lässt Möglichkeiten offen: je näher R2 bei 1 liegt. • Transformation der x-Variablen Beispiel: Die Punkte ergeben mehr eine Kurve 2. Grades (y=ax2+bx+c). Hier werden die alle x-Werte quadriert, die y-Werte nicht verändert. So erweitert sich das sich der Graph verflacht und das Einpassen einer Gerade ermöglicht. Jetzt kann ebenso wie bei der linearen Regression a und b bestimmt und in die quad. Gleichung übernommen werden ( bei Fkt 3. Grades wird ganzer Term mit 3 Potenziert) • Der zweite Fall kann nur angewendet werden wenn sich die Funktionen nur auf die unabhängige x Variable beziehen. Nun kann mit Hilfe einer Trendlinie oder einer polynomischen Ordnung die Regression herausgelesenen werden. Konfidenzintervall für a: bˆ ± t (α ;n − 2) ⋅ σˆ n ∑x i =1 2 i mit σˆ = − n ⋅ x2 n 1 ⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1 n − 2 i =1 ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden Konfidenzintervall für b: 1 ⋅ bˆ ± t(α ;n −2) ⋅ σˆ ⋅ n x2 n ∑x 2 i − n⋅ x 2 it σˆ = n 1 ⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1 n − 2 i =1 i =1 ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden 2. Jahr (29.4.2003) Christian Meyer Seite 16 / 17 Konfidenzintervall für eine Prognose y(x0), Funktionswert bei einem zukünftigen x0-Wert: 1 (x − x)2 (aˆ ⋅ x0 + bˆ) ± t(α ;n −2) ⋅ σˆ ⋅ 1 + ⋅ n 0 mit σˆ = n 2 2 ∑ xi − n ⋅ x n 1 ⋅ ∑ ri 2 und t(a;n-2) = t-Wert aus der Tabelle 1 n − 2 i =1 i =1 ist n > 100, so kann der t-Wert mit dem entsprechenden z-Wert ersetzt werden Bemerkungen: n Der Term ∑x i =1 2 i − n ⋅ x 2 wird auch als SSx bezeichnet (sum of Squares of x) n Er kann aus der Varianz berechnet werden: ∑ xi2 − n ⋅ x 2 = i =1 n ∑( x i =1 i − x ) 2 = (n-1) ? var(x) 2 Anwendung von R • Bestimmtheitsmass ist geeignet um die Güte der Anpassung von verschiedenen Regressionsmodellen miteinander zu vergleichen. • Mit Hilfe R2 von dürfen nur Modelle mit gleich vielen Regressoren beurteilt werden • Besitzt ein Modell ein deutlich grösseres R2, so ist es zu bevorzugen • Sind die Werte von R2 ähnlich gross, so ist das einfachere Modell zu wählen Vorgehen Stepwise Regression: • Man wählt sich ein Modell und führt die entsprechende Regression durch (Analyse Funktion) • Im Output wählt analysiert man die P-Werte der einzelnen Regressoren (jedoch ohne Schnittpunkt) P-Wert gibt Auskunft, ob der entsprechende Regressor einen signifikanten Beitrag zur Güte des Modells beiträgt. • Ist mindestens ein P-Wert grösser als 0.05, so lässt man denjenigen Regressor mit dem grössten P-Wert weg (a = 5% für Test der Nullhypothese: Regressor hat keinen Einfluss) • Man wiederholt die letzten beiden Punkte bis alle P-Werte über der Schranke von 5% bleiben und wählt das verbleibende Modell. Korrelation: • • • Streuen sich die Punkte nur wenige um die Regressionsgerade, repräsentiert die Gerade den Zusammenhang zwischen X und Y gut. Ich (der Statistiker) sage: X und Y korrelieren stark. Das gleiche umgekehrt natürlich auch. Der empirische Korrelationskoeffizient nach Bravais-Pearson ist ein Mass für die Stärke des linearen Zusammenhangs zwischen X und Y. Bei nichtlinearen Zusammenhängen ist er unbrauchbar. Er macht auch über Kausalität von X und Y keine Aussage. Im Gegensatz dazu misst die Spearmansche Korrelation (Rangkorrelation) nicht die Stärke und Richtung des linaren, sondern des monotonen Zusammenhanges. Ein grober Fehler oder ein Ausreisserwert beeinflusst dabei die Rangkorrelation nur in beschränktem Mass (robuste Masszahl wie Median). 2. Jahr (29.4.2003) Christian Meyer Seite 17 / 17