Wiederholung Kapitel 1 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Was versteht man unter den Begriffen statistische Einheiten, Grundgesamtheit, Teilgesamtheit, Stichprobe, Merkmal und Merkmalsausprägung? Sie können diese Begriffe allgemein und anhand einer Aufgabe definieren (siehe Blatt 1, A1). • Einteilung der Merkmale in qualitativ/quantitativ, diskret/stetig, quasi-stetig, gruppiert • Skalenniveau von Merkmalen: nominal, ordinal, metrisch (intervallskaliert oder verhältnisskaliert) Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 1 Wiederholung • Sinnhaftigkeit der Operationen Auszählen, ordnen, Differenzen bilden, Quotienten bilden bei den verschiedenen Skalenniveaus • Nicht jedes verhältnisskalierte Merkmal ist stetig oder quasi-stetig. Beispiel? • Was versteht man unter einer Querschnittsstudie, was unter einer Panel– oder Longitudinalstudie? Was ist eine Zeitreihe? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 2 Wiederholung Kapitel 2 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Was ist eine Urliste? • Was ist eine geordnete Urliste? • Wie gelangt man von der Urliste zu Häufigkeitsdaten? Wann macht die Darstellung der Häufigkeitsdaten in einer Tabelle vor allem Sinn? • Absolute/relative Häufigkeit, absolute/relative Häufigkeitsverteilung Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 3 Wiederholung • Wie nennt man die kumulierte, relative Häufigkeitsverteilung? Wann macht diese Sinn? • Wann hat man bei Häufigkeitsdaten einen Informationsverlust? • Welche graphischen Darstellungen gibt es? Wann bevorzugen sie welche Darstellung? • Was ist ein Histogramm? Wann wird es verwendet, welche Eigenschaften besitzt es, wie wird es konstruiert? Ist ein Histogramm für gegebene Daten eindeutig definiert? Problematik? • Wann ist eine Verteilung unimodal, bimodal, multimodal? • Wann ist eine Verteilung symmetrisch/linkssteil(rechtsschief)/rechssteil(linksschief)? Lageregeln für Stichprobenmittel, Stichprobenmedian, Stichprobenmodus (soStatistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 4 Wiederholung fern eindeutig!) und Erwartungswert, Median, Modus (sofern eindeutig). Zwischenfrage: ist der Stichprobenmedian eindeutig? Ist der Median einer stetigen Verteilung, z.B. Normalverteilung, eindeutig? • Absolute und relative kumulierte Häufigkeitsverteilung (s.o.). Wozu kann man diese benutzen? • Welche Lagemaße kennen Sie? Wann ist welches Lagemaß nur sinnvoll? Wie berechnet man diese Maße? • Geben Sie ein Beispiel, wann das geometrische Mittel verwendet wird! • Welche (attraktive und unangenehme) Eigenschaften hat das artihmetische Mittel? (Denken Sie an Häufigkeitsdaten, Schichtenbildung, Ausreisser!) • Welches Lagemaß bezeichnet man gemeinhin als robust? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 5 Wiederholung • Wie verhalten sich die Maße unter linearen Datentransformationen? (ab welchem Skalenniveau sind diese überhaupt anwendbar?) • Warum bezeichnet man arithmetisches Mittel und Median bei diskreten Daten als künstlich? • Lageregeln! • Welche Optimalitätseigenschaften haben arithmetisches Mittel und Median? • Was ist die 5 Punkte Zusammenfassung einer Verteilung? Wie nennt man deren graphische Darstellung? Welche Streuungsmaße werden in diesem Zusammenhang definiert? • Wie wird diese graphische Darstellung i.a. noch modifiziert? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 6 Wiederholung • Welches Streuungsmaß baut auf der Abweichung vom Mittelwert auf? Warum nimmt man nicht die einfache Abweichung vom Mittelwert als Streuungsmaß? • Wie verhält sich die Varianz/Standardabweichung bei linearen Datentransformationen? • Was ist der Verschiebungssatz? • Welche (attraktive und unangenehme) Eigenschaften hat die Varianz? (Denken Sie an Häufigkeitsdaten, Schichtenbildung, Ausreisser, Streuungszerlegung!) • Verbale Erklärung der Streuungszerlegung! • Variationskoeffizient! Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 7 Wiederholung Kapitel 3 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Welche Darstellung wählt man für zwei diskrete Merkmale, wenn beide Merkmale nur wenige Ausprägungen (k und m) besitzen? • Was versteht man dabei unter (gemeinsamer) absoluter/relativer Häufigkeitsverteilung? Was versteht man unter der Randverteilung? Wieviel Randverteilungen gibt es bei zwei Merkmalen? • Was ist die bedingte Häufigkeitsverteilung von Y gegeben X? Wieviel solcher bedingter Häufigkeitsverteilungen gibt es, wenn X (Y ) k (m) Ausprägungen hat? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 8 Wiederholung • Kann man aus bedingten Verteilungen und Randverteilungen die gemeinsame Verteilung bestimmen? • Welche Zusammenhangsmaße (Assoziationsmaße) für nominale Merkmale kennen Sie? • Im Fall von zwei Merkmalen mit jeweils zwei Ausprägungen (Vierfeldertafel) ist welches Maß besonders interessant? Warum? Ist diese Maß invariant gegenüber Zeilen– und Spaltenvertauschungen? • Verbale Erklärung der Grundidee des χ2-Koeffizienten! Welche Nachteile besitzt dieses Maß? Verbesserungen? Versetzen Sie sich in die Rolle eines Beraters: warum sind auch diese verbesserten Maße noch unbefriedigend hinsichtlich der Aussage ob ein starker Zusammenhang besteht oder nicht? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 9 Wiederholung • Wird ein eventuelles ordinales Skalenniveau der beiden diskreten Merkmale berücksichtigt? • Welche graphische Darstellungen mehrerer quantitativer Merkmale kennen Sie? (Problematik?) • Welches Zusammenhangsmaß wird hier meist verwendet? (Definition) • Erläuterung dieses Maßes (verbal, graphisch)! • Was beobachten Sie, wenn, ausgehend von einer exakten linearen Beziehung, eines der Merkmale zunehmend verrauscht wird? • Wie verhält sich das Maß bei linearen Datentransformationen der beiden Merkmale? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 10 Wiederholung • Der Rangkorrelationskoeffizient ist eine Alternative zum herkömmlichen Korrelationskoeffizienten. Warum müssen Sie sich keine eigene Formel für diesen einprägen? • Welchen Vorteil hat dann der Rangkorrelationskoeffizient gegenüber dem herkömmlichen Korrelationskoeffizienten (Denken Sie an die Art des Zusammenhangs!) • Was versteht man in diesem Zusammenhang unter Bindungen? Was sollten Sie wissen, wenn keine Bindungen vorliegen und Sie den Rangkorrelationskoeffizienten (ohne Computer) ausrechnen müssen? • Welche Aussagen gelten hinsichtlich Datentransformationen für den Rangkorrelationskoeffizienten? • Scheinkorrelation und verdeckte Korrelation: Beispiele? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 11 Wiederholung Kapitel 4 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Wie lautet der Ergebnisraum Ω beim zweimaligen Wurf eines fairen Würfels? • Bestimmen Sie das Ereignis A: Augensumme beider Würfe ist 7. Wie groß ist dessen Wahrscheinlichkeit? • Axiome von Kolmogoroff. Formal und verbale Erläuterung! • Sind die Ereignisse A: Augensumme ist 7, und B: Augensumme ist 4, disjunkt? Wenn ja, welches Axiom liefert Ihnen die Wahrscheinlichkeit dafür, dass A Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 12 Wiederholung oder B eintritt? Wie groß ist die Wahrscheinlickeit, dass A und B gleichzeitig eintreten? Sind die beiden Ereignisse unabhängig? • Wie groß ist die Wahrscheinlickeit, dass die Augensumme nicht 2 ist? Welche Axiome verwenden Sie dabei? • Sind die Ereignisse A: Augensumme ist 7, und B: erster Wurf ist kleiner 3, disjunkt? Wie groß ist die Wahrscheinlichkeit, dass A und B gleichzeitig eintreten? Welche Formel verwenden Sie hierfür? Sind die beiden Ereignisse unabhängig? • Kombinatorik: welche zwei grundlegende Fälle müssen Sie unterscheiden? Welches Modell verwenden Sie bei der Bestimmung der Wahrscheinlichkeit, dass beim viermaligen Würfeln zweier Würfel mindestens einmal ein SechserPasch eintritt? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 13 Wiederholung • Bedingte Wahrscheinlichkeit, totale Wahrscheinlichkeit, Satz von Bayes, a priori und a posteriori Verteilung! • Unendliche Ergebnisräume (Würfeln bis zur ersten Sechs)! Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 14 Wiederholung Kapitel 5 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Zufallsvariable, Beispiele, Zufallsvariable als Abbildung • Diskrete Zufallsvariable, Träger • Endliche diskrete Zufallsvariable • Verteilungsfunktion (Eigenschaften, Rechenregeln), Wahrscheinlichkeitsfunktion • Beispiele für diskrete Verteilungen? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 15 Wiederholung • Unabhängigkeit von Zufallsvariablen • Erwartungswert (Eigenschaften, Rechenregeln). Nichtlineare Transformationen? Produktregel? • Modus, Median, Quantile • Varianz, Verschiebungssatz, lineare Transformationen, Additionssatz (Voraussetzung?) • Spezielle diskrete Verteilungsmodelle (welches Modell steht jeweils dahinter?) Additionssätze? Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 16 Wiederholung Kapitel 6 Was müssen Sie wissen, welche Fragen sollten Sie beantworten können? • Definition stetige Zufallsvariable, Dichte, Verteilungsfunktion (Eigenschaften) • Unabhängigkeit von stetigen Zufallsgrößen • Beispiele! • Erwartungswert, Modus, Median (Eigenschaften, Lageregeln) • Varianz, Verschiebungssatz, lineare Transformationen, Varianz der Summe von Zufallsvariablen (Vorausssetzung?) Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 17 Wiederholung • Spezielle Verteilungsmodelle • Normalverteilung, Standardisierung, Quantile, zentrale Schwankunsintervalle, lineare Transformatzion, Additionssatz • Berechnung von Wahrscheinlichkeiten P (X ≤ x), P (a ≤ X ≤ b), P (X ≥ x) wenn X ∼ N (µ, σ 2 ) • Verteilunsgmodelle für positive ZVen • Prüfverteilungen Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07 18