im Word-Format

Statistik I – R
3. Übung
SS 2005
Histogramme/Säulendiagramme
Zur graphischen Darstellung unter R bietet sich neben dem bereits bekannten plot()Befehl noch der hist()-Befehl und der boxplot()-Befehl an.
Der Befehl hist(x) erstellt ein Histogramm der unter x gespeicherten Daten im
„Graphics“-Fenster. Werden keine zusätzlichen Optionen in der Klammer angegeben,
verwendet R absolute Werte bzw. Häufigkeiten und vorgegebene Klasseneinteilungen. Der
Befehl
boxplot(x) erzeugt einen Boxplot der unter x gespeicherten Daten.
Für den hist()-Befehl bieten sich deswegen folgende Optionen an:
Bei
prob=T/F
prob=F
(Standardwert)
absolute
Häufigkeiten
während
bei
werden
verwendet,
prob=T
relative
Häufigkeiten benutzt werden.
Mit
die
breaks=c(3,5,7,9,10)
der
Option
breaks
lassen
Klasseneinteilungen
einstellen.
Dabei
Klassengrenzen
sich
beliebig
müssen
als
die
Vektor
(c(a,b,c,...)) angegeben werden.
Hiermit
plot=T/F
wird
bestimmt,
Histogramm
im
dargestellt
werden
ob
das
„Graphics“-Fenster
soll
(plot=T;
Standardwert), oder ob R lediglich
die
Klasseneinteilung
entsprechenden
und
die
Häufigkeiten
als
Zahlen ausgeben soll (plot=F).
(Syntax: hist(x,prob=...,breaks=c(...),plot=... )
(Weitere Informationen dazu siehe Einführung in R, Seite 22)
Statistik I – R
3. Übung
SS 2005
Aufgabe 1:
Der Datensatz gewicht („Füllmenge von Kornflakes-Packungen“) soll mit Hilfe von R näher
untersucht werden:

Dazu muss der Datensatz gewicht zunächst betrachtet werden (durch Eingabe von
gewicht).

Des weiteren sollen die Daten in einem Histogramm dargestellt werden. R gibt eine
Klasseneinteilung vor; es ist aber auch möglich, die Klassengrößen zu variieren.

Als nächstes sollen die Häufigkeiten in den einzelnen Klassen bestimmt werden.

Die nächste Teilaufgabe besteht darin, statistische Kennzahlen wie Lage- und Streuungsmaße zu
bestimmen. Dazu verwendet man entweder die Befehle mean(), var() oder den Befehl
summary().

Erstellen Sie den Boxplot für den Datensatz gewicht.
Aufgabe 2:
Die folgenden diskreten Daten sind mit Hilfe eines Fragebogens in einer Großübung erhoben
worden und geben die Schuhgröße der Studierenden dieser Veranstaltung an. Aus dem gesamten
Datensatz ist eine zufällige Stichprobe von n= 100 Ausprägungen ausgewählt worden.
Schuhgröße x
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
1
3
7
10
12
11
12
10
9
8
8
4
3
1
1
Häufigkeit y
Geben Sie die Daten zunächst zeilenweise ein und speichern Sie diese unter x bzw. y . Stellen Sie
diese dann in einem Säulendiagramm graphisch dar.