Darstellung eindimensionaler Häufigkeitsverteilungen 18.10.2010 Bsp.: Herstellung von Stahlblechen (Stärken in mm) 4,9 5,5 5,4 5,6 5,6 5,3 5,1 5,1 5,3 5,9 5,2 5,6 4,9 5,8 5,4 5,4 4,8 4,8 5,5 5,2 Klassenverteilung Klasse Klassenintervall 1 [4,7;5,0] 2 ]5,0;5,3] 3 ]5,3;5,6] 4 ]5,6;5,9] Σ Urliste Σ20 Klassenmitten 4,85 5,15 5,45 5,75 absolute Häufigkeit 4 6 8 2 20 relative Häufigkeit 0,2 0,3 0,4 0,1 1 Summenhäufigkeit: Kumulation aller Häufigkeiten bis zur jeweiligen Klasse (relative oder absolute). relative Häufigkeitsdichte: πππ.π»äπ’πππππππ‘ πΎπππ π πππππππ‘π πππ .π»äπ’πππππππ‘ absolute Häufigkeitsdichte: πΎπππ π πππππππ‘π β;1Histogramm β³Darstellung der (rel) HD anhand unmittelbar aneinander grenzender Rechtecke β³Die Fläche der Rechtecke stellt die rel./abs. Häufigkeit dar β³Die Breite stellt die Klassenbreite dar / Die Höhe stellt die rel. Häufigkeitsdichte dar 1 2/5 1 1/5 1 4/5 3/5 2/5 1/5 0 4,7 - 5,0 5,0 - 5,3 5,3 - 5,6 5,6 - 5,9 β;2Summenhäufigkeit 1) Stetiges Merkmal: Polygon 1.2 rel. SH 1 0.8 0.6 0.4 0.2 0 4.7 5.0 5.3 Klassenbreite 5.6 5.9 rel. Häufigkeitsdichte 0,2/0,3=2/3 0,3/0,3=1 0,4/0,3=4/3 0,1/0,3=1/3 rel. Summenhäufigkeit 0+0,2=0,2 0,2+0,3=0,5 0,2+0,3+0,4=0,9 0,2+0,3+0,4+0,1=1 2)Diskretes Merkmal: Treppenkurve Beispiel für eine Treppenkurve Aus diesen beiden Darstellungen können wir die Wahrscheinlichkeit für einen bestimmten Zustand herausfinden. Konzentration einer Verteilung Lorenzkurve Bsp.: Unternehmen – Umsatz Wenn es zwei (oder mehr) Unternehmen mit dem gleichen Wert gibt. In diesem Fall F mit 100 Umsatz. Unternehmen B E(,F) D C A Umsatz in Mio.€ 50 100 150 250 350 Ums. Σ (SH) 50 150(250) 300(400) 550(650) 900(1000) Unt. Σ 3(SH) 1 2(3) 3(4) 4(5) 5(6) 1000 900 800 700 600 Gleichverteilungskurve 500 Lorenzkurve 400 Ungleichverteilungskurve 300 200 100 0 0 1 2 3 4 5 Gleichverteilungskurve: Zeigt ein niedriges Extrem an, in dem alle Unternehmen denn selben Umsatz machen. Ungleichverteilungskurve: Zeigt ein hohes Extrem an, in dem vier Firmen keinen und eine Firma denn Höchstumsatz hat. β³Desto näher die Lorenzkurve an der Gleichverteilungskurve ist, desto niedrige ist die Konzentration der Verteilung und umgekehrt. Korrelations- & Regressionsanalyse β³Korrelation: Existiert ein Zusammenhang zwischen zwei Merkmalen und wie stark ist dieser Zusammenhang? β³Regression: Wie kann ein linearer Zusammenhang dargestellt werden β³ y=mx+b (Lorenzkurve/Regressionsgerade) Lorenzkurve/Regressionsgerade: Untern. i 1 2 3 4 5 6 7 8 9 10 Σ Mitarb. xi 3 2 4 5 8 7 5 3 2 1 40 Ums. yi 30 20 60 70 100 80 50 40 30 20 500 xi*yi 90 40 240 350 800 560 250 120 60 20 2530 (xi)² 9 4 16 25 64 49 25 9 4 1 206 (yi)² 900 400 3600 4900 10000 6400 2500 1600 900 400 31600 Ansatz: y=b0+b1*x Notwendige Formeln: π 1 ππ₯ = ∑ π₯π π π=1 π ππ¦ = 1 ∑ π¦π π π=1 1 π ππ₯π¦ ∑ππ=1(π₯π ∗ π¦π ) − π ∗ ππ₯ ∗ ππ¦ π ∑π=1(π₯π ∗ π¦π ) − ππ₯ ∗ ππ¦ π1 = = = 1 π ∑ππ=1(π₯π )2 − π ∗ ππ₯2 ππ₯ 2 ∑ (π₯ )2 − ππ₯2 π π=1 π π0 = ππ¦ − π1 ∗ ππ₯ → π1 = 2530−10∗4∗50 206−10∗16 = 530 46 ≈ 11,52 → π0 = 50 − 11,52 ∗ 4 ≈ 3,92 π = π, ππ + ππ, πππ ππ π‘ πππ πΏπππππ§ππ’ππ£π ππππ ππ ππππ‘ππ‘ππππππ Mithilfe der Lorenzkurve können wir nun einen Erwartungswert formulieren. So kann man zum Beispiel erwarten, dass ein Unternehmen mit 7 Mitarbeitern (x=7), einen Umsatz von 84,56 erzielt. Genauso kann man die Erwartung aufstellen, dass ein Unternehmen 5 Mitarbeiter braucht (4,87) um einen Umsatz von 60 (y=60) zu erzielen. All dies hängt natürlich von den gegebenen Daten ab. Die Korrelation nach Pearson β³Tabelle muss um yi² erweitert werden π= ∑(π₯π ∗ π¦π ) − π ∗ ππ₯ ∗ ππ¦ √∑(π₯π )2 − π ∗ ππ₯2 ∗ √∑(π¦π )2 − π ∗ ππ¦2 es gilt rΡ[-1;1] π= 2530 − 10 ∗ 4 ∗ 50 √206 − 10 ∗ 16 ∗ √31600 − 10 ∗ 2500 ≈ 0,962 Desto näher r an den Grenzen ist, desto Aussagekräftiger ist die Lorenzkurve. - näher an 1 → starke Korrelation - näher an 0 → Tendenz zur Punktwolke / nicht aussagekräftig - näher an -1→positiv schwache Korrelation