Statistik I – R 3. Übung SS 2005 Histogramme/Säulendiagramme Zur graphischen Darstellung unter R bietet sich neben dem bereits bekannten plot()Befehl noch der hist()-Befehl und der boxplot()-Befehl an. Der Befehl hist(x) erstellt ein Histogramm der unter x gespeicherten Daten im „Graphics“-Fenster. Werden keine zusätzlichen Optionen in der Klammer angegeben, verwendet R absolute Werte bzw. Häufigkeiten und vorgegebene Klasseneinteilungen. Der Befehl boxplot(x) erzeugt einen Boxplot der unter x gespeicherten Daten. Für den hist()-Befehl bieten sich deswegen folgende Optionen an: Bei prob=T/F prob=F (Standardwert) absolute Häufigkeiten während bei werden verwendet, prob=T relative Häufigkeiten benutzt werden. Mit die breaks=c(3,5,7,9,10) der Option breaks lassen Klasseneinteilungen einstellen. Dabei Klassengrenzen sich beliebig müssen als die Vektor (c(a,b,c,...)) angegeben werden. Hiermit plot=T/F wird bestimmt, Histogramm im dargestellt werden ob das „Graphics“-Fenster soll (plot=T; Standardwert), oder ob R lediglich die Klasseneinteilung entsprechenden und die Häufigkeiten als Zahlen ausgeben soll (plot=F). (Syntax: hist(x,prob=...,breaks=c(...),plot=... ) (Weitere Informationen dazu siehe Einführung in R, Seite 22) Statistik I – R 3. Übung SS 2005 Aufgabe 1: Der Datensatz gewicht („Füllmenge von Kornflakes-Packungen“) soll mit Hilfe von R näher untersucht werden: Dazu muss der Datensatz gewicht zunächst betrachtet werden (durch Eingabe von gewicht). Des weiteren sollen die Daten in einem Histogramm dargestellt werden. R gibt eine Klasseneinteilung vor; es ist aber auch möglich, die Klassengrößen zu variieren. Als nächstes sollen die Häufigkeiten in den einzelnen Klassen bestimmt werden. Die nächste Teilaufgabe besteht darin, statistische Kennzahlen wie Lage- und Streuungsmaße zu bestimmen. Dazu verwendet man entweder die Befehle mean(), var() oder den Befehl summary(). Erstellen Sie den Boxplot für den Datensatz gewicht. Aufgabe 2: Die folgenden diskreten Daten sind mit Hilfe eines Fragebogens in einer Großübung erhoben worden und geben die Schuhgröße der Studierenden dieser Veranstaltung an. Aus dem gesamten Datensatz ist eine zufällige Stichprobe von n= 100 Ausprägungen ausgewählt worden. Schuhgröße x 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 1 3 7 10 12 11 12 10 9 8 8 4 3 1 1 Häufigkeit y Geben Sie die Daten zunächst zeilenweise ein und speichern Sie diese unter x bzw. y . Stellen Sie diese dann in einem Säulendiagramm graphisch dar.