Statistik Zusammenfassung

Werbung
Zusammenfassung Statistik
Inhalt
Kennzahlen statistischer Verteilung .................................................................................................. 3
Merkmalstypen .............................................................................................................................. 3
Häufigkeitsverteilung .................................................................................................................... 3
Mittelwert ...................................................................................................................................... 3
Mittelwert von Wachstumsfaktoren .............................................................................................. 3
Median ........................................................................................................................................... 3
Modus ............................................................................................................................................ 4
Kennzahlen der Streuung – muss nicht interpretiert werden ............................................................ 4
Varianz .......................................................................................................................................... 4
Standardabweichung ..................................................................................................................... 4
Varianzkoeffizient ......................................................................................................................... 4
Kennzahlen der Konzentration .......................................................................................................... 4
Konzentration ................................................................................................................................ 4
Lorenzkurve (kein Ausrechnen notwendig – THEORIE!!) .......................................................... 5
Nominierte Ginikoeffizient ........................................................................................................... 5
Kennzahlen des statistischen Zusammenhangs ................................................................................. 5
Nominale Merkmale ...................................................................................................................... 5
χ² (Chiquadrat)........................................................................................................................... 5
Cramers V ................................................................................................................................. 5
Metrische Merkmale ..................................................................................................................... 6
Streudiagramme ........................................................................................................................ 6
Kovarianz .................................................................................................................................. 6
Korrelationskoeffizient.............................................................................................................. 6
Regressionsgerade ..................................................................................................................... 6
Bestimmtheitsmaß ..................................................................................................................... 6
Ordinale Merkmale ....................................................................................................................... 7
Wahrscheinlichkeitsrechnung ........................................................................................................... 7
Abzählregel ................................................................................................................................... 7
Binominalkoeffizient ..................................................................................................................... 7
Multiplikationsregel ...................................................................................................................... 7
Wahrscheinlichkeitsverteilung .......................................................................................................... 7
Die Hypergeometrische Verteilung (Urnenmodell) ...................................................................... 7
Die Normalverteilung .................................................................................................................... 7
Die stetige Verteilung................................................................................................................ 7
Die Standardnormalverteilung .................................................................................................. 7
1/8
Zusammenfassung Statistik
Schließende Statistik ......................................................................................................................... 8
Intervallschätzung ......................................................................................................................... 8
Hypothesenüberprüfung ................................................................................................................ 8
Schätzen einer relativen Häufigkeit (π  Parameter) – Konfidenzintervall ................................ 8
Schwankungsbreite und Errechnung des Stichprobenumfanges (S130) ....................................... 8
Überprüfung von Hypothesen mit 2-Seitiger Fragestellung ......................................................... 9
Überprüfung von Hypothesen mit 1-Seitiger-Fragestellung ......................................................... 9
2/8
Zusammenfassung Statistik
Kennzahlen statistischer Verteilung
Merkmalstypen
 Nominal
 Ordinal
 Metrisch
nicht ordenbar, durch Namen unterscheidbar
besitzen Reihenfogle (zB Schulnoten) (1 besser als 2)
Reihenfolge und ein Vielfaches einer Einheit
 Diskret
 Stetig
bestimmte Ausprägung (zB Namen, Noten)
alle reellen Werte (zB Größe, Gewicht)
Häufigkeitsverteilung





Häufigkeit
Relative Häufigkeit
Prozent
Prozentpunkte
Relative Summenhäuf.
wie oft ein Merkmal vorkommt
Häufigkeit in Bezug auf die Grundmenge
Relative Häufigkeit * 100
Abstand zwischen Prozentzahlen
Addierte relative Häufigkeiten
Mittelwert
 Definition
Durchschnittswert bei gleicher Aufteilung
Berechnung auch durch: Ausprägung*rel.Häuf.
 Gleitender Mittelwert bei Zeitreihe (zB Mittelwerte aus 100 Tageperioden)
 Geeignet für
metrische Merkmale
Mittelwert von Wachstumsfaktoren
 Wachstumsfaktor
Zahl mit der multipliziert werden muss um den
höheren Wert zu bekommen
(zB 10 % Steigerung 1,1 / 10 % Senkung 0,9)
 Ber. geom. Mittelwert (x-Jahrte)√(Umsatz nach x Jahren/Umsatz jetzt)
 Oder:
(x-Jahrte)√(Summe der Wachstumsfaktoren)
 Ausreißer
zB einer verdient 100.000 € 9 andere nur 1.000
Median




Ber. Bei N= ungerade
Ber. Bei N= gerade
Geeignet für
Interpretation
 Rel. Summenhäuf.
 Anmerkung
 Bei 0,25 / 0,75
Nach Größe sortieren  mittlerer Wert = Median
wie oben  dann Mittelwert aus den beiden Mittleren
metrische und ordinale Merkmale
1. Hälfte hat max. die Merkmalsausprägung
2. Hälfte hat mind. die Merkmalsausprägung
Median der Wert wo 0,5 der rel. Sum. überschr. wird
falls Median genau 0,5  wieder Mittelwert
unteres und oberes Quartil
3/8
Zusammenfassung Statistik
Modus
 Anwendung
 Bestimmung
 Intervalle
bei nominalen Merkmalen
Merkmal welches am öftesten vorkommt = Modus
häufigste vorkommende Intervall = Modus
Kennzahlen der Streuung – muss nicht interpretiert werden
Nur für metrische Merkmale anwendbar!
Messung des Abstandes der Merkmalsausprägungen zum Mittelwert. Wird für metrische
Merkmale angewandt.
Varianz
 Bezeichnung
 Berechnung
 Interpretation
s²
Summe der quadrierten Abstände zum Mittelwert / N
Mittelwert aus der Summe der quadrierten
Abweichungen zum Mittelwert
Standardabweichung
 Bezeichnung
 Berechnung
 Interpretation
s
√s²
Wurzel aus Varianz  gleiche Maßeinheit
Varianzkoeffizient
 Bezeichnung
 Berechnung
 Bedeutung
 Interpretation
v
s/Mittelwert
Für mehrere Merkmale, die sich im Mittelwert stark
Unterscheiden  s wird vergleichbar (zB Salz, Zement)
Standardabweichung vergleichbarer! Bezug auf MW!!
Kennzahlen der Konzentration
Nur für metrische Merkmale
Konzentration
 Berechnung
 Interpretation
zB 5 Personen  1. Person 0,2 Anteil der 5 Personen
Brechung der Einkommensanteile (Tabelle)  S 57
Verteilung des Einkommens auf Anteile der Personen
4/8
Zusammenfassung Statistik
Lorenzkurve (kein Ausrechnen notwendig – THEORIE!!)
 Erstellung
 Sonderfall 1
 Sonderfall 2
 Konz. Maß
 Fläche bei S.2:
Konz. In Diagramm(x Pax-Anteile / y EK-Anteile)
gleichmäßige Aufteilung des Gehalts  Mittelwert! S58
Als Nullkonzentration bezeichnet
1er komplettes Einkommen  bis N-1/N auf X-Achse S
Als Maximalkonzentration bezeichnet
ist die Fläche zwischen Diagonalen und Konzentration
0,5-(1/(2*N))
Nominierte Ginikoeffizient
 Berechnung
 Eigenschaft
Relation zwischen Fläche bei gegebener. Konzentration
und Fläche bei Maximalkonzentration
bei Nullkonzentration ist er 0 und bei Max. K ist er 1
Kennzahlen des statistischen Zusammenhangs
Statistisches Zusammenhang ist NICHT gleich kausaler Zusammenhang
Wenn 2 Merkmale unterschiedlicher Kategorien sind  „niedrigere“ Kategorie nehmen!
Nominale Merkmale
χ² (Chiquadrat)
 Aufgabe
 Berechnung Teil 1
 Berechnung Teil 2
 Anmerkung
 Interpretation
misst statistischen Zusammenhang
relative Häufigkeiten an den Rändern multiplizieren
(ges. BWL Studenten*Anteil der Frauen)
(SUMME ((rel Häuf-erw. rel. Häuf)²)/erw. rel Häuf)*N
Differenzen einzeln quadrieren und dividieren *N
wenn mit Häufigkeiten gerechnet wird  NICHT *N!!
bei keinen Zusammenhang  0!! Stärke nicht berücks.!
Cramers V
 Aufgabe
 Berechnung
 Interpretation
misst Stärke des Zusammenhangs (S.66)
√(χ²/(N*(kleinere Anz. der Ausprägung -1)
0 = kein Zus. / 1 = vollständiger Zus.
Je größer CV desto mehr Zus. (0-0,2 / 0,2-0,6 / 0,6-1)
Nur Stärke des Zusammenhangs  KEINE Richtung
5/8
Zusammenfassung Statistik
Metrische Merkmale
Streudiagramme
 Darstellung
 Interpretation (S68)
Merkmale in Koordinatensystem
+X / +Y  gleichsinniger Zusammenhang
„Kugel“  kein Zusammenhang (scheinbar)
+X / -Y  gegensinniger Zusammenhang
Je näher Punkte beisammen, desto mehr Zusammenhang
Kovarianz
 Abkürzung
 Berechnung
 Interpretation
Sxy
(SUMME((xi – MWx)*(yi – MWy))) / N
Messung der „Richtung“
Sxy positiv: gleichsinnig / Sxy negativ: gegensinnig
Je größer Sxy bei Gleichsinnigkeit, desto mehr stat. Zus.
Je mehr im Minus Sxy bei Gegensinnigk., mehr stat. Zus.
Korrelationskoeffizient
 Abkürzung
 Berechnung
 Interpretation:
 ACHTUNG (S71)
 Anmerkung
 WICHTIG!!!
r
Sxy /(sx*sy) sx, sy  Standardabweichung
+r  gleichsinnig / -r  gegensinnig
Schwach: 0 – 0,2 / mittel: 0,2 – 0,6 / stark: 0,6 – 1
Bei 0  kein statistische Zusammenhang
Richtung muss angegeben werden!
wenn X immer steigt Y folgt, aber irgendwann sinkt!
gleichsinnig = linear
Statistischer Zusammenhang ungleich kausaler Zus.hang!
Regressionsgerade
 Aufgabe
 Berechnung




Regressionskoeffizient
Regressionsgerade
Residuum
Schätzungen
Gerade mit geringsten Abständen zu den Ausprägungen
Gesucht! (Methode der kleinsten Quadrate)
Basis: y=kx+d
k = b1 = Sxy / S²x - Kovarianz / Varianz von x
d = b2 = MWvony – k * MWvonx
b1 und b2
y=b1*x+b2
Abstand von Regressionsgerade zu Werten
können durch einsetzten von Werten in die Gleichung
Getroffen werden! Bei hoher Korrelation (gl. geg. Zush.)
Gerade darf nicht zu weit von Realität entfernt sein (B!!)
Bestimmtheitsmaß




Name
Aufgabe
Berechnung
Interpretation
B
Darstellung der Realitätsgetreuheit
B = r² (Korrelationskoeffizient²)
je höher desto realitätsgetreuer (ab 0,6  gut!)
6/8
Zusammenfassung Statistik
Ordinale Merkmale
Es wird eine „Rangverteilung“ vorgenommen (siehe Buch S. 76) (bei Noten – nicht bei
Platzierungen, wie zum Beispiel bei Skispringen)
Danach werden ganz normal Kovarianz und Korrelationskoeffizient berechnet.
Nur wird der Korrelationskoeffizient nun als Spearmansche Korrelationskoeffizient betitelt
Wahrscheinlichkeitsrechnung
Abzählregel
 Berechnung:
günstige Fälle / mögliche Fälle
 Gegenwahrscheinlichk. 1 – Wahrscheinlichkeit eines bestimmten Falles
 Bedingte Wahrscheinl. zB Los ist keine Niete
Binominalkoeffizient
 Anwendung
 Berechnung:
wenn man Gruppen aus einer Grundgesamtheit zieht
groß N (Grundgesamtheit) über klein n (Gruppe) NCR!!
Multiplikationsregel
 Anwendung
 Zum Beispiel
Multiplizierung 2er unabhängiger Wahrscheinlichkeiten
2x Würfeln  2x ein Sechser  1/6 * 1/6
Wahrscheinlichkeitsverteilung
Die Hypergeometrische Verteilung (Urnenmodell)
Für diskrete Merkmale geeignet
 Zuerst Binominalkoeffizient und danach Abzählregel!
 Berechnung von theoretischem Mittelwert und der theoretischen Varianz!
o SUMME (Anzahl der Kugeln*Wahrscheinlichkeit)
o SUMME (quadratische Abweichungen*Wahrscheinlichkeit)
 Mittelwertberechnung: n*(A/N)
Die Normalverteilung
Für stetige Merkmale
Die stetige Verteilung
 zB Warten auf einen Bus
 Berechnung der WS
Minuten des Intervalls*(1. Einheit (min)/N)
Die Standardnormalverteilung
 Normalverteilungen können alle durch folgende Formel „standardisiert“ werden:
o Uo=(Xo-Mü) / Standardabweichung
 Ablesen der Werte in der Tabelle
 Grenzen von Intervallen mit Wahrscheinlichkeiten sind immer gleich weit von MÜ
entfernt
7/8
Zusammenfassung Statistik
Schließende Statistik
Wichtig: Unterscheidung Punktschätzer (Stichprobe) und Parameter (Grundgesamtheit):
Punktschätzer (Stichprobe)
Relative Häufigkeit
Mittelwert
Stichprobenvarianz
Differenz zweier rel. Häuf.
Chiquadrat
Korrelationskoeffizient
Regressionskoeffizienten
p
x
s²
d
χ²err
r
b1 und b2
Parameter (Grundgesamtheit)
Relative Häufigkeit
π
Mittelwert
μ
Varianz
σ²
Differenz zweier rel. Häuf.
δ
Chiquadrat
χ²
Korrelationskoeffizient
ρ
Regressionskoeffizienten
β1 und β2
Intervallschätzung
 Überdeckungshäufigkeit = 1-α
Wahrscheinlichkeit, dass es nicht zutrifft: α
Hypothesenüberprüfung




Null-Hypothese (wird angenommen) und Eins-Hypothese
Wenn es Zweifel gibt  ausreichend?!
Findest man starke Beweise / Indizien  signifikantes Testergebnis
α-Fehler: Wahrscheinlichkeit, dass man sich fälschlicherweise für die 1 Hypothese
entscheidet  Schranken
 β-Fehler: Wahrscheinlichkeit, dass man sich fälschlicherweise für die 0-Hypothese
entscheidet (nicht berücksichtigt)
Schätzen einer relativen Häufigkeit (π  Parameter) – Konfidenzintervall
 Konfidenzintervall prüfen indem π mit 1-α-Wahrscheinlichkeit liegt
 Wahrscheinlichkeit um u herauszufinden = 1-α/2
 Formeln für die Schrankenfindung von p (Punktschätzer) (Buch S. 127)
o po=π+u1-α/2*√(π*(1-π)/n
o pu=π -- u1-α/2*√(π*(1-π)/n
 Formeln für die Schrankenfindung von π (Parameter) (Buch S. 128)
o πo=p+u1-α/2*√(p*(1-p)/n
o πu=p -- u1-α/2*√(p*(1-p)/n
 1-α ist in WiWi meistens 0,95!
 Interpretation: in 95 von 100 gewählten Stichproben überdeckt ein so konstruiertes
Intervall einen Parameter! (bei 1-α=0,95)
 Man rechnet sich aus in welchen Intervall (Parameter=Wirklichkeit) eine relative
Häufigkeit einer Stichprobe liegt  mit 95 % Wahrscheinlichkeit
Schwankungsbreite und Errechnung des Stichprobenumfanges (S130)
 Schwankungsbreite ist jener Wert der zu p addiert, bzw. subtrahiert wird
 Formel für Stichprobenumfang siehe Buch (wobei Epsilon die akzeptierte
Abweichung ist!!!) π wird aus früheren Umfragen gewonnen  sonst π=0,5!!
 Wenn für π ein Intervall geschätzt  Zahl mit größten Umfang wählen!!
8/8
Zusammenfassung Statistik
Überprüfung von Hypothesen mit 2-Seitiger Fragestellung
 u1-α/2  IMMER: 1,96!!!
 Wenn zB π bewiesen werden soll und ein p angegeben ist, werden die p Grenzen
berechnet!  NICHT Konfidenzintervall (bei dem werden Grenzen für π
berechnet)
 P-Wert ist die Abweichung die man haben soll zwischen π und p
 Berechnung des P-Wertes: Buch S. 137 – 138
 Beibehaltung der Nullhypothese wenn α2 > α
Überprüfung von Hypothesen mit 1-Seitiger-Fragestellung
 u1-α/2  IMMER: 1,65!!!
 Nur eine Grenze wird berechnet!
 P-Wert wird nicht mal 2 gerechnet!  Wahrscheinlichkeit dass p mindestens im
Wertebereich der 1-Hypothese liegt
 BIS SEITE 142!!!! Noch nicht mehr in Statistik gemacht!
9/8
Powered by TCPDF (www.tcpdf.org)
Herunterladen