Zusammenfassung Statistik Inhalt Kennzahlen statistischer Verteilung .................................................................................................. 3 Merkmalstypen .............................................................................................................................. 3 Häufigkeitsverteilung .................................................................................................................... 3 Mittelwert ...................................................................................................................................... 3 Mittelwert von Wachstumsfaktoren .............................................................................................. 3 Median ........................................................................................................................................... 3 Modus ............................................................................................................................................ 4 Kennzahlen der Streuung – muss nicht interpretiert werden ............................................................ 4 Varianz .......................................................................................................................................... 4 Standardabweichung ..................................................................................................................... 4 Varianzkoeffizient ......................................................................................................................... 4 Kennzahlen der Konzentration .......................................................................................................... 4 Konzentration ................................................................................................................................ 4 Lorenzkurve (kein Ausrechnen notwendig – THEORIE!!) .......................................................... 5 Nominierte Ginikoeffizient ........................................................................................................... 5 Kennzahlen des statistischen Zusammenhangs ................................................................................. 5 Nominale Merkmale ...................................................................................................................... 5 χ² (Chiquadrat)........................................................................................................................... 5 Cramers V ................................................................................................................................. 5 Metrische Merkmale ..................................................................................................................... 6 Streudiagramme ........................................................................................................................ 6 Kovarianz .................................................................................................................................. 6 Korrelationskoeffizient.............................................................................................................. 6 Regressionsgerade ..................................................................................................................... 6 Bestimmtheitsmaß ..................................................................................................................... 6 Ordinale Merkmale ....................................................................................................................... 7 Wahrscheinlichkeitsrechnung ........................................................................................................... 7 Abzählregel ................................................................................................................................... 7 Binominalkoeffizient ..................................................................................................................... 7 Multiplikationsregel ...................................................................................................................... 7 Wahrscheinlichkeitsverteilung .......................................................................................................... 7 Die Hypergeometrische Verteilung (Urnenmodell) ...................................................................... 7 Die Normalverteilung .................................................................................................................... 7 Die stetige Verteilung................................................................................................................ 7 Die Standardnormalverteilung .................................................................................................. 7 1/8 Zusammenfassung Statistik Schließende Statistik ......................................................................................................................... 8 Intervallschätzung ......................................................................................................................... 8 Hypothesenüberprüfung ................................................................................................................ 8 Schätzen einer relativen Häufigkeit (π Parameter) – Konfidenzintervall ................................ 8 Schwankungsbreite und Errechnung des Stichprobenumfanges (S130) ....................................... 8 Überprüfung von Hypothesen mit 2-Seitiger Fragestellung ......................................................... 9 Überprüfung von Hypothesen mit 1-Seitiger-Fragestellung ......................................................... 9 2/8 Zusammenfassung Statistik Kennzahlen statistischer Verteilung Merkmalstypen Nominal Ordinal Metrisch nicht ordenbar, durch Namen unterscheidbar besitzen Reihenfogle (zB Schulnoten) (1 besser als 2) Reihenfolge und ein Vielfaches einer Einheit Diskret Stetig bestimmte Ausprägung (zB Namen, Noten) alle reellen Werte (zB Größe, Gewicht) Häufigkeitsverteilung Häufigkeit Relative Häufigkeit Prozent Prozentpunkte Relative Summenhäuf. wie oft ein Merkmal vorkommt Häufigkeit in Bezug auf die Grundmenge Relative Häufigkeit * 100 Abstand zwischen Prozentzahlen Addierte relative Häufigkeiten Mittelwert Definition Durchschnittswert bei gleicher Aufteilung Berechnung auch durch: Ausprägung*rel.Häuf. Gleitender Mittelwert bei Zeitreihe (zB Mittelwerte aus 100 Tageperioden) Geeignet für metrische Merkmale Mittelwert von Wachstumsfaktoren Wachstumsfaktor Zahl mit der multipliziert werden muss um den höheren Wert zu bekommen (zB 10 % Steigerung 1,1 / 10 % Senkung 0,9) Ber. geom. Mittelwert (x-Jahrte)√(Umsatz nach x Jahren/Umsatz jetzt) Oder: (x-Jahrte)√(Summe der Wachstumsfaktoren) Ausreißer zB einer verdient 100.000 € 9 andere nur 1.000 Median Ber. Bei N= ungerade Ber. Bei N= gerade Geeignet für Interpretation Rel. Summenhäuf. Anmerkung Bei 0,25 / 0,75 Nach Größe sortieren mittlerer Wert = Median wie oben dann Mittelwert aus den beiden Mittleren metrische und ordinale Merkmale 1. Hälfte hat max. die Merkmalsausprägung 2. Hälfte hat mind. die Merkmalsausprägung Median der Wert wo 0,5 der rel. Sum. überschr. wird falls Median genau 0,5 wieder Mittelwert unteres und oberes Quartil 3/8 Zusammenfassung Statistik Modus Anwendung Bestimmung Intervalle bei nominalen Merkmalen Merkmal welches am öftesten vorkommt = Modus häufigste vorkommende Intervall = Modus Kennzahlen der Streuung – muss nicht interpretiert werden Nur für metrische Merkmale anwendbar! Messung des Abstandes der Merkmalsausprägungen zum Mittelwert. Wird für metrische Merkmale angewandt. Varianz Bezeichnung Berechnung Interpretation s² Summe der quadrierten Abstände zum Mittelwert / N Mittelwert aus der Summe der quadrierten Abweichungen zum Mittelwert Standardabweichung Bezeichnung Berechnung Interpretation s √s² Wurzel aus Varianz gleiche Maßeinheit Varianzkoeffizient Bezeichnung Berechnung Bedeutung Interpretation v s/Mittelwert Für mehrere Merkmale, die sich im Mittelwert stark Unterscheiden s wird vergleichbar (zB Salz, Zement) Standardabweichung vergleichbarer! Bezug auf MW!! Kennzahlen der Konzentration Nur für metrische Merkmale Konzentration Berechnung Interpretation zB 5 Personen 1. Person 0,2 Anteil der 5 Personen Brechung der Einkommensanteile (Tabelle) S 57 Verteilung des Einkommens auf Anteile der Personen 4/8 Zusammenfassung Statistik Lorenzkurve (kein Ausrechnen notwendig – THEORIE!!) Erstellung Sonderfall 1 Sonderfall 2 Konz. Maß Fläche bei S.2: Konz. In Diagramm(x Pax-Anteile / y EK-Anteile) gleichmäßige Aufteilung des Gehalts Mittelwert! S58 Als Nullkonzentration bezeichnet 1er komplettes Einkommen bis N-1/N auf X-Achse S Als Maximalkonzentration bezeichnet ist die Fläche zwischen Diagonalen und Konzentration 0,5-(1/(2*N)) Nominierte Ginikoeffizient Berechnung Eigenschaft Relation zwischen Fläche bei gegebener. Konzentration und Fläche bei Maximalkonzentration bei Nullkonzentration ist er 0 und bei Max. K ist er 1 Kennzahlen des statistischen Zusammenhangs Statistisches Zusammenhang ist NICHT gleich kausaler Zusammenhang Wenn 2 Merkmale unterschiedlicher Kategorien sind „niedrigere“ Kategorie nehmen! Nominale Merkmale χ² (Chiquadrat) Aufgabe Berechnung Teil 1 Berechnung Teil 2 Anmerkung Interpretation misst statistischen Zusammenhang relative Häufigkeiten an den Rändern multiplizieren (ges. BWL Studenten*Anteil der Frauen) (SUMME ((rel Häuf-erw. rel. Häuf)²)/erw. rel Häuf)*N Differenzen einzeln quadrieren und dividieren *N wenn mit Häufigkeiten gerechnet wird NICHT *N!! bei keinen Zusammenhang 0!! Stärke nicht berücks.! Cramers V Aufgabe Berechnung Interpretation misst Stärke des Zusammenhangs (S.66) √(χ²/(N*(kleinere Anz. der Ausprägung -1) 0 = kein Zus. / 1 = vollständiger Zus. Je größer CV desto mehr Zus. (0-0,2 / 0,2-0,6 / 0,6-1) Nur Stärke des Zusammenhangs KEINE Richtung 5/8 Zusammenfassung Statistik Metrische Merkmale Streudiagramme Darstellung Interpretation (S68) Merkmale in Koordinatensystem +X / +Y gleichsinniger Zusammenhang „Kugel“ kein Zusammenhang (scheinbar) +X / -Y gegensinniger Zusammenhang Je näher Punkte beisammen, desto mehr Zusammenhang Kovarianz Abkürzung Berechnung Interpretation Sxy (SUMME((xi – MWx)*(yi – MWy))) / N Messung der „Richtung“ Sxy positiv: gleichsinnig / Sxy negativ: gegensinnig Je größer Sxy bei Gleichsinnigkeit, desto mehr stat. Zus. Je mehr im Minus Sxy bei Gegensinnigk., mehr stat. Zus. Korrelationskoeffizient Abkürzung Berechnung Interpretation: ACHTUNG (S71) Anmerkung WICHTIG!!! r Sxy /(sx*sy) sx, sy Standardabweichung +r gleichsinnig / -r gegensinnig Schwach: 0 – 0,2 / mittel: 0,2 – 0,6 / stark: 0,6 – 1 Bei 0 kein statistische Zusammenhang Richtung muss angegeben werden! wenn X immer steigt Y folgt, aber irgendwann sinkt! gleichsinnig = linear Statistischer Zusammenhang ungleich kausaler Zus.hang! Regressionsgerade Aufgabe Berechnung Regressionskoeffizient Regressionsgerade Residuum Schätzungen Gerade mit geringsten Abständen zu den Ausprägungen Gesucht! (Methode der kleinsten Quadrate) Basis: y=kx+d k = b1 = Sxy / S²x - Kovarianz / Varianz von x d = b2 = MWvony – k * MWvonx b1 und b2 y=b1*x+b2 Abstand von Regressionsgerade zu Werten können durch einsetzten von Werten in die Gleichung Getroffen werden! Bei hoher Korrelation (gl. geg. Zush.) Gerade darf nicht zu weit von Realität entfernt sein (B!!) Bestimmtheitsmaß Name Aufgabe Berechnung Interpretation B Darstellung der Realitätsgetreuheit B = r² (Korrelationskoeffizient²) je höher desto realitätsgetreuer (ab 0,6 gut!) 6/8 Zusammenfassung Statistik Ordinale Merkmale Es wird eine „Rangverteilung“ vorgenommen (siehe Buch S. 76) (bei Noten – nicht bei Platzierungen, wie zum Beispiel bei Skispringen) Danach werden ganz normal Kovarianz und Korrelationskoeffizient berechnet. Nur wird der Korrelationskoeffizient nun als Spearmansche Korrelationskoeffizient betitelt Wahrscheinlichkeitsrechnung Abzählregel Berechnung: günstige Fälle / mögliche Fälle Gegenwahrscheinlichk. 1 – Wahrscheinlichkeit eines bestimmten Falles Bedingte Wahrscheinl. zB Los ist keine Niete Binominalkoeffizient Anwendung Berechnung: wenn man Gruppen aus einer Grundgesamtheit zieht groß N (Grundgesamtheit) über klein n (Gruppe) NCR!! Multiplikationsregel Anwendung Zum Beispiel Multiplizierung 2er unabhängiger Wahrscheinlichkeiten 2x Würfeln 2x ein Sechser 1/6 * 1/6 Wahrscheinlichkeitsverteilung Die Hypergeometrische Verteilung (Urnenmodell) Für diskrete Merkmale geeignet Zuerst Binominalkoeffizient und danach Abzählregel! Berechnung von theoretischem Mittelwert und der theoretischen Varianz! o SUMME (Anzahl der Kugeln*Wahrscheinlichkeit) o SUMME (quadratische Abweichungen*Wahrscheinlichkeit) Mittelwertberechnung: n*(A/N) Die Normalverteilung Für stetige Merkmale Die stetige Verteilung zB Warten auf einen Bus Berechnung der WS Minuten des Intervalls*(1. Einheit (min)/N) Die Standardnormalverteilung Normalverteilungen können alle durch folgende Formel „standardisiert“ werden: o Uo=(Xo-Mü) / Standardabweichung Ablesen der Werte in der Tabelle Grenzen von Intervallen mit Wahrscheinlichkeiten sind immer gleich weit von MÜ entfernt 7/8 Zusammenfassung Statistik Schließende Statistik Wichtig: Unterscheidung Punktschätzer (Stichprobe) und Parameter (Grundgesamtheit): Punktschätzer (Stichprobe) Relative Häufigkeit Mittelwert Stichprobenvarianz Differenz zweier rel. Häuf. Chiquadrat Korrelationskoeffizient Regressionskoeffizienten p x s² d χ²err r b1 und b2 Parameter (Grundgesamtheit) Relative Häufigkeit π Mittelwert μ Varianz σ² Differenz zweier rel. Häuf. δ Chiquadrat χ² Korrelationskoeffizient ρ Regressionskoeffizienten β1 und β2 Intervallschätzung Überdeckungshäufigkeit = 1-α Wahrscheinlichkeit, dass es nicht zutrifft: α Hypothesenüberprüfung Null-Hypothese (wird angenommen) und Eins-Hypothese Wenn es Zweifel gibt ausreichend?! Findest man starke Beweise / Indizien signifikantes Testergebnis α-Fehler: Wahrscheinlichkeit, dass man sich fälschlicherweise für die 1 Hypothese entscheidet Schranken β-Fehler: Wahrscheinlichkeit, dass man sich fälschlicherweise für die 0-Hypothese entscheidet (nicht berücksichtigt) Schätzen einer relativen Häufigkeit (π Parameter) – Konfidenzintervall Konfidenzintervall prüfen indem π mit 1-α-Wahrscheinlichkeit liegt Wahrscheinlichkeit um u herauszufinden = 1-α/2 Formeln für die Schrankenfindung von p (Punktschätzer) (Buch S. 127) o po=π+u1-α/2*√(π*(1-π)/n o pu=π -- u1-α/2*√(π*(1-π)/n Formeln für die Schrankenfindung von π (Parameter) (Buch S. 128) o πo=p+u1-α/2*√(p*(1-p)/n o πu=p -- u1-α/2*√(p*(1-p)/n 1-α ist in WiWi meistens 0,95! Interpretation: in 95 von 100 gewählten Stichproben überdeckt ein so konstruiertes Intervall einen Parameter! (bei 1-α=0,95) Man rechnet sich aus in welchen Intervall (Parameter=Wirklichkeit) eine relative Häufigkeit einer Stichprobe liegt mit 95 % Wahrscheinlichkeit Schwankungsbreite und Errechnung des Stichprobenumfanges (S130) Schwankungsbreite ist jener Wert der zu p addiert, bzw. subtrahiert wird Formel für Stichprobenumfang siehe Buch (wobei Epsilon die akzeptierte Abweichung ist!!!) π wird aus früheren Umfragen gewonnen sonst π=0,5!! Wenn für π ein Intervall geschätzt Zahl mit größten Umfang wählen!! 8/8 Zusammenfassung Statistik Überprüfung von Hypothesen mit 2-Seitiger Fragestellung u1-α/2 IMMER: 1,96!!! Wenn zB π bewiesen werden soll und ein p angegeben ist, werden die p Grenzen berechnet! NICHT Konfidenzintervall (bei dem werden Grenzen für π berechnet) P-Wert ist die Abweichung die man haben soll zwischen π und p Berechnung des P-Wertes: Buch S. 137 – 138 Beibehaltung der Nullhypothese wenn α2 > α Überprüfung von Hypothesen mit 1-Seitiger-Fragestellung u1-α/2 IMMER: 1,65!!! Nur eine Grenze wird berechnet! P-Wert wird nicht mal 2 gerechnet! Wahrscheinlichkeit dass p mindestens im Wertebereich der 1-Hypothese liegt BIS SEITE 142!!!! Noch nicht mehr in Statistik gemacht! 9/8 Powered by TCPDF (www.tcpdf.org)