Darstellung eindimensionaler Häufigkeitsverteilungen 18.10.2010

Werbung
Darstellung eindimensionaler Häufigkeitsverteilungen
18.10.2010
Bsp.: Herstellung von Stahlblechen (Stärken in mm)
4,9
5,5
5,4
5,6
5,6
5,3
5,1
5,1
5,3
5,9
5,2
5,6
4,9
5,8
5,4
5,4
4,8
4,8
5,5
5,2
Klassenverteilung
Klasse
Klassenintervall
1
[4,7;5,0]
2
]5,0;5,3]
3
]5,3;5,6]
4
]5,6;5,9]
Σ
Urliste Σ20
Klassenmitten
4,85
5,15
5,45
5,75
absolute Häufigkeit
4
6
8
2
20
relative Häufigkeit
0,2
0,3
0,4
0,1
1
Summenhäufigkeit: Kumulation aller Häufigkeiten bis zur jeweiligen Klasse (relative oder absolute).
relative Häufigkeitsdichte:
π‘Ÿπ‘’π‘™.𝐻äπ‘’π‘“π‘–π‘”π‘˜π‘’π‘–π‘‘
πΎπ‘™π‘Žπ‘ π‘ π‘’π‘›π‘π‘Ÿπ‘’π‘–π‘‘π‘’
π‘Žπ‘π‘ .𝐻äπ‘’π‘“π‘–π‘”π‘˜π‘’π‘–π‘‘
absolute Häufigkeitsdichte:
πΎπ‘™π‘Žπ‘ π‘ π‘’π‘›π‘π‘Ÿπ‘’π‘–π‘‘π‘’
β—‹;1Histogramm
↳Darstellung der (rel) HD anhand unmittelbar aneinander grenzender Rechtecke
↳Die Fläche der Rechtecke stellt die rel./abs. Häufigkeit dar
↳Die Breite stellt die Klassenbreite dar / Die Höhe stellt die rel. Häufigkeitsdichte dar
1 2/5
1 1/5
1
4/5
3/5
2/5
1/5
0
4,7 - 5,0
5,0 - 5,3
5,3 - 5,6
5,6 - 5,9
β—‹;2Summenhäufigkeit
1) Stetiges Merkmal: Polygon
1.2
rel. SH
1
0.8
0.6
0.4
0.2
0
4.7
5.0
5.3
Klassenbreite
5.6
5.9
rel. Häufigkeitsdichte
0,2/0,3=2/3
0,3/0,3=1
0,4/0,3=4/3
0,1/0,3=1/3
rel. Summenhäufigkeit
0+0,2=0,2
0,2+0,3=0,5
0,2+0,3+0,4=0,9
0,2+0,3+0,4+0,1=1
2)Diskretes Merkmal: Treppenkurve
Beispiel für eine Treppenkurve
Aus diesen beiden Darstellungen können wir die Wahrscheinlichkeit für einen bestimmten Zustand herausfinden.
Konzentration einer Verteilung
Lorenzkurve
Bsp.: Unternehmen – Umsatz
Wenn es zwei (oder mehr) Unternehmen mit dem gleichen Wert
gibt. In diesem Fall F mit 100 Umsatz.
Unternehmen
B
E(,F)
D
C
A
Umsatz in Mio.€
50
100
150
250
350
Ums. Σ (SH)
50
150(250)
300(400)
550(650)
900(1000)
Unt. Σ 3(SH)
1
2(3)
3(4)
4(5)
5(6)
1000
900
800
700
600
Gleichverteilungskurve
500
Lorenzkurve
400
Ungleichverteilungskurve
300
200
100
0
0
1
2
3
4
5
Gleichverteilungskurve: Zeigt ein niedriges Extrem an, in dem alle Unternehmen denn selben Umsatz machen.
Ungleichverteilungskurve: Zeigt ein hohes Extrem an, in dem vier Firmen keinen und eine Firma denn Höchstumsatz hat.
↳Desto näher die Lorenzkurve an der Gleichverteilungskurve ist, desto niedrige ist die Konzentration der Verteilung und umgekehrt.
Korrelations- & Regressionsanalyse
↳Korrelation: Existiert ein Zusammenhang zwischen zwei Merkmalen und wie stark ist dieser Zusammenhang?
↳Regression: Wie kann ein linearer Zusammenhang dargestellt werden
↳ y=mx+b (Lorenzkurve/Regressionsgerade)
Lorenzkurve/Regressionsgerade:
Untern. i
1
2
3
4
5
6
7
8
9
10
Σ
Mitarb. xi
3
2
4
5
8
7
5
3
2
1
40
Ums. yi
30
20
60
70
100
80
50
40
30
20
500
xi*yi
90
40
240
350
800
560
250
120
60
20
2530
(xi)²
9
4
16
25
64
49
25
9
4
1
206
(yi)²
900
400
3600
4900
10000
6400
2500
1600
900
400
31600
Ansatz:
y=b0+b1*x
Notwendige Formeln:
𝑛
1
πœ‡π‘₯ = ∑ π‘₯𝑖
𝑛
𝑖=1
𝑛
πœ‡π‘¦ =
1
∑ 𝑦𝑖
𝑛
𝑖=1
1 𝑛
𝜎π‘₯𝑦 ∑𝑛𝑖=1(π‘₯𝑖 ∗ 𝑦𝑖 ) − 𝑛 ∗ πœ‡π‘₯ ∗ πœ‡π‘¦ 𝑛 ∑𝑖=1(π‘₯𝑖 ∗ 𝑦𝑖 ) − πœ‡π‘₯ ∗ πœ‡π‘¦
𝑏1 =
=
=
1 𝑛
∑𝑛𝑖=1(π‘₯𝑖 )2 − 𝑛 ∗ πœ‡π‘₯2
𝜎π‘₯ 2
∑ (π‘₯ )2 − πœ‡π‘₯2
𝑛 𝑖=1 𝑖
𝑏0 = πœ‡π‘¦ − 𝑏1 ∗ πœ‡π‘₯
→ 𝑏1 =
2530−10∗4∗50
206−10∗16
=
530
46
≈ 11,52
→ 𝑏0 = 50 − 11,52 ∗ 4 ≈ 3,92
π’š = πŸ‘, πŸ—πŸ + 𝟏𝟏, πŸ“πŸπ’™ 𝑖𝑠𝑑 𝑑𝑖𝑒 πΏπ‘œπ‘Ÿπ‘’π‘›π‘§π‘˜π‘’π‘Ÿπ‘£π‘’ π‘‘π‘–π‘’π‘ π‘’π‘Ÿ π‘Šπ‘’π‘Ÿπ‘‘π‘’π‘‘π‘Žπ‘π‘’π‘™π‘™π‘’
Mithilfe der Lorenzkurve können wir nun einen Erwartungswert formulieren.
So kann man zum Beispiel erwarten, dass ein Unternehmen mit 7 Mitarbeitern (x=7), einen Umsatz von 84,56 erzielt.
Genauso kann man die Erwartung aufstellen, dass ein Unternehmen 5 Mitarbeiter braucht (4,87) um einen Umsatz von 60 (y=60) zu erzielen.
All dies hängt natürlich von den gegebenen Daten ab.
Die Korrelation nach Pearson
↳Tabelle muss um yi² erweitert werden
π‘Ÿ=
∑(π‘₯𝑖 ∗ 𝑦𝑖 ) − 𝑛 ∗ πœ‡π‘₯ ∗ πœ‡π‘¦
√∑(π‘₯𝑖 )2 − 𝑛 ∗ πœ‡π‘₯2 ∗ √∑(𝑦𝑖 )2 − 𝑛 ∗ πœ‡π‘¦2
es gilt rΡ”[-1;1]
π‘Ÿ=
2530 − 10 ∗ 4 ∗ 50
√206 − 10 ∗ 16 ∗ √31600 − 10 ∗ 2500
≈ 0,962
Desto näher r an den Grenzen ist, desto Aussagekräftiger ist die Lorenzkurve.
- näher an 1 → starke Korrelation
- näher an 0 → Tendenz zur Punktwolke / nicht aussagekräftig
- näher an -1→positiv schwache Korrelation
Herunterladen