C. Ortseifen: SAS – Einführung in die Programmierung 1 SS 2006 Übungsaufgaben Zu Kapitel 1 1. Starten Sie das Anwendungsprogramm SAS 9.1 und machen Sie sich mit der Oberfläche vertraut. 2. Legen Sie zwei neue Bibliotheken an: Eine namens urz, die auf den Ordner O:\KURS\SAS\Daten zeigt und eine namens meine, die auf den neu zu erstellenden Ordner M:\saskurs zeigt. 3. Kopieren Sie die SAS-Tabellen iris, blutbild und fitness aus der Bibliothek urz in die Bibliothek meine. 4. Welche Variablen gibt es in der Tabelle iris, wie viele Beobachtungen in fitness? Zu Kapitel 2 5. Übertragen Sie die Beispielprogramme Programm3.sas in den SAS-Editor. Programm1.sas, Programm2.sas und 6. Führen Sie die Programme nacheinander aus Wechseln Sie ins Protokollfenster und prüfen Sie die Meldungen! Eigentlich sollten dabei keine Fehlermeldungen und Warnungen auftreten. Falls doch, wiederholen Sie die Schritte und vergleichen Sie das Programm mit dem in Ihren Unterlagen bzw. aus der Vorlesung. 7. Spielen Sie mit den Anweisungen solange, bis Sie alle verstanden haben. 8. Die Textdatei sonne.txt im Ordner O:\KURS\SAS\Daten enthält die vor- und nachmittäglichen Gesamtsonnenscheinstunden der 12 Monate Januar bis Dezember. Machen Sie aus diesen Werten eine SAS-Tabelle sasuser.sonne. Wie viele Beobachtungen und Variablen enthält diese? Geben Sie den Variablen einprägsame Namen (Anweisung Label oder Variablenfenster). 9. Fünf Sportler mussten fürs Vordiplom unter anderem Schwimmen, Basketball spielen und Turnen. Ihr Trainer hat die Noten dieser drei Sportarten in folgender Tabelle notiert. Hans Claudia Jörg Heidi Martina 10 14 13 15 11 8 14 8 10 12 7 13 Übertragen Sie diese Werte in eine SAS-Tabelle. Lücken heißen, dass die Note fehlt, weil der Sportler krank war oder aus anderen Gründen fehlte. 10. Der Durchschnitt aus diesen drei Noten gibt die erste Teilnote fürs Vordiplom. Schreiben Sie ein geeignetes SAS-Programm, das diese Teilnote berechnet (Datenschritt mit Zuweisung!). URZ Heidelberg Seite 1 C. Ortseifen: SAS – Einführung in die Programmierung 1 SS 2006 Übungsaufgaben 11. Berechnen Sie auch den Notendurchschnitt des gesamten Minikurses mit der Prozedur Means. Da wir die Syntax noch nicht kennengelernt haben, rufen Sie am besten die Online-Hilfe zur Prozedur MEANS auf mit dem Kommando help means. 12. Suchen Sie sich aus der Online-Liste der SAS-Funktionen fünf beliebige Funktionen aus! Spielen Sie mit diesen herum, bis Sie deren Funktion verstanden haben. Schreiben Sie einen kleinen Datenschritt, in dem diese Funktionen eingesetzt werden. (Tip: Erzeugen Sie sich durch Zuweisung eine Variablen, wenden Sie dann die Funktion darauf an, um einer zweiten Variablen diesen neuen Wert zuzuweisen. (Tip: Mit der Anweisung PUT können Sie die Werte der Variablen direkt ins Protokollfenster herausschreiben.) Zu Kapitel 3 13. Erzeugen Sie eine mit Titel und Fußzeile beschriftete Liste der ersten zehn Werte aus der SAS-Tabelle iris, die in Bibliothek meine liegt. 14. Beschränken Sie sich jetzt auf die Fälle der Blumengruppe 1. Erzeugen Sie eine Liste und verwenden Sie eine zweite Titelzeile zur Unterscheidung von der ersten Liste aus Aufgabe 13. 15. Es gibt eine Option der Prozedur PRINT, die die Spalte mit den Beobachtungsnummern unterdrückt. Suchen Sie diese Option (am besten mithilfe des Kommandos help print) und probieren Sie die gefundene Option gleich aus. 16. Ordnen Sie Fälle der Tabelle Iris nach der Größe der sl-Werte an. 17. Geben Sie die Beobachtungen 10 bis 20 der sortierten Tabelle mit neuer Titelzeile im Ausgabefenster aus. 18. Geben Sie die gleichen Beobachtungen der sortierten Tabelle nochmals aus, unterdrücken Sie dabei aber durch entsprechende Änderungen im Optionsfenster die Angabe des aktuellen Datums und der Seitennummer. Zu Kapitel 4 Die SAS-Tabelle blutbild enthält die Ergebnisse eines größeren Experiments, bei der der Einfluss von Kontrazeptiva auf verschiedene Blutparameter untersucht wurde. In die Studie wurden nur Frauen aufgenommen. Die Variable PILLE gibt Auskunft darüber, ob Kontrazeptiva eingenommen wurden (Pille=2) oder nicht (Pille=1). An Blutparametern wurden untersucht: Albumin, Cholesterin und Calcium. 19. Berechnen Sie die wichtigsten statistischen Kennwerte für die Variablen Körpergröße und Körpergewicht und für die drei Blutparameter, zunächst für die gesamte Stichprobe, anschließend getrennt für die beiden Pille-Gruppen. URZ Heidelberg Seite 2 C. Ortseifen: SAS – Einführung in die Programmierung 1 SS 2006 Übungsaufgaben 20. Betrachten Sie die einzelnen Gruppenmittelwerte und Standardabweichungen. Notieren Sie auf einem Zettel diejenigen Variablen, von denen Sie glauben, dass sich die Werte auch statistisch signifikant in einem Zweigruppenvergleich unterscheiden. 21. Diese und die nächste Aufgabe machen nur Sinn, wenn Sie schon mal vom t-Test gehört haben und wissen, warum man diesen anwendet bzw. wie man sein Ergebnis interpretiert. Führen Sie nun die Tests durch und vergleichen Sie die SAS-Ergebnisse mit Ihren Vorüberlegungen. 22. Können Sie nun folgende Fragen beantworten? A) Sind die beiden Pille-Gruppen hinsichtlich des Alters und dem Körpergewicht vergleichbar? B) Unterscheiden sich die Blutparameter zwischen den Gruppen statistisch signifikant? Wenn ja, in welcher Art und Weise. Zu Kapitel 5 23. Übertragen Sie folgende Werte in die SAS-Tabelle sasuser.eins: Name Hans Jutta Jörg Franz Alter 27 31 40 51 und die folgenden Werte in die SAS-Tabelle sasuser.zwei: Name Anneliese Jens Helga Alter 29 21 54 und schließlich noch sasuser.drei: Name Anneliese Jens Jutta Jörg Helga Franz Größe 1,65 1,90 1,76 2,05 1,80 1,70 24. Verknüpfen Sie zunächst die beiden Tabellen sasuser.eins und sasuser.zwei und dann dazu noch sasuser.drei und benennen Sie das Resultat sasuser.vier. Betrachten Sie das Ergebnis und kontrollieren Sie es mit den Ausgangswerten. URZ Heidelberg Seite 3 C. Ortseifen: SAS – Einführung in die Programmierung 1 SS 2006 Übungsaufgaben 25. Eine Alternative zur Verknüpfung im Datenschritt mit Set und Merge stellt die Prozedur SQL dar, die der SAS/Enterprise Guide verwendet. Verknüpfen Sie nochmals die drei SAS-Tabellen miteinander, diesmal aber mit Hilfe der SAS/Enterprise Guide Software und erarbeiten Sie sich die Syntax dieser Prozedur zur Verknüpfung, so dass Sie die Tabellen alt1 und alt2 aus der Vorlesung ohne Enterprise Guide Menü verknüpfen können. Zu Kapitel 6.1 26. Laden Sie das Programm schleifen.sas (aus O:\KURS\SAS\Programme) in das Programmfenster, führen Sie es schrittweise aus und untersuchen Sie die einzelnen Anweisungen, bis Ihnen alles verständlich ist. 27. Verwenden Sie die Anweisung Put, um die Werte der Variablen während des Ablaufs im Log-Fenster anzuzeigen. 28. Im Datenschritt sind auch beiden internen Variablen _N_ (für die Nummer der aktuellen Beobachtung) und _Error_ (für auftretende Fehler) definiert. Geben Sie deren Werte auch mal aus. Zu Kapitel 6.2 29. Im Ordner O:\Kurs\SAS\Daten finden Sie die Datei Ozon.Dat, welche für die Jahre 1926 bis 1971 die gemessenen Ozonwerte pro Monat eines bestimmten Ortes enthält. Überführen sie diese Daten in eine SAS-Tabelle. 30. Wie sind die fehlenden Werte definiert? Für die folgende Aufgabe müssen Sie diese in einen Punkt (.) umkodieren. Verwenden Sie dazu einen Datenschritt mit Array. 31. Ermitteln Sie pro Jahr die mittleren Ozonwerte. 32. Bestimmen Sie – mit SAS-Mitteln - das Jahr mit dem niedrigsten mittleren Ozonwert. (Tipp: Eine Liste mit einer Beobachtung ausgeben.) 33. Ermitteln Sie pro Jahr die mittleren Ozonwerte des Winter- (Oktober-März) und des Sommerhalbjahrs (April – September). 34. Weitere Aufgaben zu If/Then/Else und Select/When finden Sie in „The SAS Workbook“ von Ron Cody im Kapitel 3, zu Arrays im Kapitel 8. URZ Heidelberg Seite 4