Mathematisches Institut der Universität München K. Keilhofer WiSe 2016/17 – Blatt 11 – 17.1.2017 Computergestützte Mathematik Aufgabe 11.1: Bearbeiten und Plotten von Datensätzen Bei dem eingebauten Dataframe iris wurde bei 150 Iris-Exemplaren unter anderem die Länge S der Kelchblätter (Sepal.Length) und der Länge P der Kronblätter (Petal.Length) gemessen. a) Berechnen Sie Mittelwert, Median und Standardabweichung von S und P . b) Erstellen Sie ein Histogramm für S und für P . c) Berechnen Sie die Standardabweichung von S innerhalb der Art (Species) virginica. d) Zeichnen Sie ein Streudiagramm mit S auf der waagrechten und P auf der senkrechten Achse. Sie erkennen darin klar zwei verschiedene Populationen. Berechnen Sie die mittlere Länge der Kronblätter P für die größere Population. Aufgabe 11.2: Empirische Verteilungsfunktion Die empirische Verteilungsfunktion einer Stichprobe x1 , . . . , xn ist die Verteilungsfunktion des Wahrscheinlichkeitsmaßes, das jedem xi die Wahrscheinlichkeit n1 zuordnet. Mit der Funktion ecdf(x) können Sie die empirische Verteilungsfunktion F berechnen und anschließend mit plot(F) plotten. Schreiben Sie eine Funktion, die eine zufällige Stichprobe mit n standardnormalverteilten Werten erzeugt und deren empirische Verteilungsfunktion zusammen mit der Verteilungsfunktion der Normalverteilung plottet. Führen Sie die Funktion für n = 30 und n = 3000 einige Male aus. Aufgabe 11.3: Streudiagramm und Korrelation a) Simulieren Sie zwei unabhängige standardnormalverteilte Zufallsvariablen durch Vektoren X und Y mit jeweils 1000 Einträgen. Plotten Sie X und Y in einem Streudiagramm. Wegen der Unabhängigkeit sind die Zufallsvariablen unkorreliert: Was ergibt der empirische Korrelationskoeffizient? b) Die Variablen U := X + Y und V := 3X − Y sind korreliert. Erstellen Sie wieder das Streudiagramm und berechnen Sie Korrelationskoeffizienten von U und V . Man kann berechnen, dass die exakte Korrelation √15 beträgt: Vergleichen Sie!