Kapitel 1

Werbung
Wiederholung
Kapitel 1
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Was versteht man unter den Begriffen statistische Einheiten, Grundgesamtheit,
Teilgesamtheit, Stichprobe, Merkmal und Merkmalsausprägung? Sie können
diese Begriffe allgemein und anhand einer Aufgabe definieren (siehe Blatt 1,
A1).
• Einteilung der Merkmale in qualitativ/quantitativ, diskret/stetig, quasi-stetig,
gruppiert
• Skalenniveau von Merkmalen: nominal, ordinal, metrisch (intervallskaliert oder
verhältnisskaliert)
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
1
Wiederholung
• Sinnhaftigkeit der Operationen Auszählen, ordnen, Differenzen bilden, Quotienten bilden bei den verschiedenen Skalenniveaus
• Nicht jedes verhältnisskalierte Merkmal ist stetig oder quasi-stetig. Beispiel?
• Was versteht man unter einer Querschnittsstudie, was unter einer Panel– oder
Longitudinalstudie? Was ist eine Zeitreihe?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
2
Wiederholung
Kapitel 2
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Was ist eine Urliste?
• Was ist eine geordnete Urliste?
• Wie gelangt man von der Urliste zu Häufigkeitsdaten? Wann macht die
Darstellung der Häufigkeitsdaten in einer Tabelle vor allem Sinn?
• Absolute/relative Häufigkeit, absolute/relative Häufigkeitsverteilung
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
3
Wiederholung
• Wie nennt man die kumulierte, relative Häufigkeitsverteilung? Wann macht
diese Sinn?
• Wann hat man bei Häufigkeitsdaten einen Informationsverlust?
• Welche graphischen Darstellungen gibt es? Wann bevorzugen sie welche Darstellung?
• Was ist ein Histogramm? Wann wird es verwendet, welche Eigenschaften
besitzt es, wie wird es konstruiert? Ist ein Histogramm für gegebene Daten
eindeutig definiert? Problematik?
• Wann ist eine Verteilung unimodal, bimodal, multimodal?
• Wann ist eine Verteilung symmetrisch/linkssteil(rechtsschief)/rechssteil(linksschief)?
Lageregeln für Stichprobenmittel, Stichprobenmedian, Stichprobenmodus (soStatistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
4
Wiederholung
fern eindeutig!) und Erwartungswert, Median, Modus (sofern eindeutig). Zwischenfrage: ist der Stichprobenmedian eindeutig? Ist der Median einer stetigen
Verteilung, z.B. Normalverteilung, eindeutig?
• Absolute und relative kumulierte Häufigkeitsverteilung (s.o.). Wozu kann man
diese benutzen?
• Welche Lagemaße kennen Sie? Wann ist welches Lagemaß nur sinnvoll? Wie
berechnet man diese Maße?
• Geben Sie ein Beispiel, wann das geometrische Mittel verwendet wird!
• Welche (attraktive und unangenehme) Eigenschaften hat das artihmetische
Mittel? (Denken Sie an Häufigkeitsdaten, Schichtenbildung, Ausreisser!)
• Welches Lagemaß bezeichnet man gemeinhin als robust?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
5
Wiederholung
• Wie verhalten sich die Maße unter linearen Datentransformationen? (ab welchem Skalenniveau sind diese überhaupt anwendbar?)
• Warum bezeichnet man arithmetisches Mittel und Median bei diskreten Daten
als künstlich?
• Lageregeln!
• Welche Optimalitätseigenschaften haben arithmetisches Mittel und Median?
• Was ist die 5 Punkte Zusammenfassung einer Verteilung? Wie nennt man
deren graphische Darstellung? Welche Streuungsmaße werden in diesem Zusammenhang definiert?
• Wie wird diese graphische Darstellung i.a. noch modifiziert?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
6
Wiederholung
• Welches Streuungsmaß baut auf der Abweichung vom Mittelwert auf? Warum
nimmt man nicht die einfache Abweichung vom Mittelwert als Streuungsmaß?
• Wie verhält sich die Varianz/Standardabweichung bei linearen Datentransformationen?
• Was ist der Verschiebungssatz?
• Welche (attraktive und unangenehme) Eigenschaften hat die Varianz? (Denken
Sie an Häufigkeitsdaten, Schichtenbildung, Ausreisser, Streuungszerlegung!)
• Verbale Erklärung der Streuungszerlegung!
• Variationskoeffizient!
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
7
Wiederholung
Kapitel 3
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Welche Darstellung wählt man für zwei diskrete Merkmale, wenn beide Merkmale nur wenige Ausprägungen (k und m) besitzen?
• Was versteht man dabei unter (gemeinsamer) absoluter/relativer Häufigkeitsverteilung? Was versteht man unter der Randverteilung? Wieviel Randverteilungen gibt es bei zwei Merkmalen?
• Was ist die bedingte Häufigkeitsverteilung von Y gegeben X? Wieviel solcher
bedingter Häufigkeitsverteilungen gibt es, wenn X (Y ) k (m) Ausprägungen
hat?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
8
Wiederholung
• Kann man aus bedingten Verteilungen und Randverteilungen die gemeinsame
Verteilung bestimmen?
• Welche Zusammenhangsmaße (Assoziationsmaße) für nominale Merkmale kennen Sie?
• Im Fall von zwei Merkmalen mit jeweils zwei Ausprägungen (Vierfeldertafel) ist
welches Maß besonders interessant? Warum? Ist diese Maß invariant gegenüber
Zeilen– und Spaltenvertauschungen?
• Verbale Erklärung der Grundidee des χ2-Koeffizienten! Welche Nachteile besitzt
dieses Maß? Verbesserungen? Versetzen Sie sich in die Rolle eines Beraters:
warum sind auch diese verbesserten Maße noch unbefriedigend hinsichtlich der
Aussage ob ein starker Zusammenhang besteht oder nicht?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
9
Wiederholung
• Wird ein eventuelles ordinales Skalenniveau der beiden diskreten Merkmale
berücksichtigt?
• Welche graphische Darstellungen mehrerer quantitativer Merkmale kennen Sie?
(Problematik?)
• Welches Zusammenhangsmaß wird hier meist verwendet? (Definition)
• Erläuterung dieses Maßes (verbal, graphisch)!
• Was beobachten Sie, wenn, ausgehend von einer exakten linearen Beziehung,
eines der Merkmale zunehmend verrauscht wird?
• Wie verhält sich das Maß bei linearen Datentransformationen der beiden
Merkmale?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
10
Wiederholung
• Der Rangkorrelationskoeffizient ist eine Alternative zum herkömmlichen Korrelationskoeffizienten. Warum müssen Sie sich keine eigene Formel für diesen
einprägen?
• Welchen Vorteil hat dann der Rangkorrelationskoeffizient gegenüber dem
herkömmlichen Korrelationskoeffizienten (Denken Sie an die Art des Zusammenhangs!)
• Was versteht man in diesem Zusammenhang unter Bindungen? Was sollten
Sie wissen, wenn keine Bindungen vorliegen und Sie den Rangkorrelationskoeffizienten (ohne Computer) ausrechnen müssen?
• Welche Aussagen gelten hinsichtlich Datentransformationen für den Rangkorrelationskoeffizienten?
• Scheinkorrelation und verdeckte Korrelation: Beispiele?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
11
Wiederholung
Kapitel 4
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Wie lautet der Ergebnisraum Ω beim zweimaligen Wurf eines fairen Würfels?
• Bestimmen Sie das Ereignis A: Augensumme beider Würfe ist 7. Wie groß ist
dessen Wahrscheinlichkeit?
• Axiome von Kolmogoroff. Formal und verbale Erläuterung!
• Sind die Ereignisse A: Augensumme ist 7, und B: Augensumme ist 4, disjunkt?
Wenn ja, welches Axiom liefert Ihnen die Wahrscheinlichkeit dafür, dass A
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
12
Wiederholung
oder B eintritt? Wie groß ist die Wahrscheinlickeit, dass A und B gleichzeitig
eintreten? Sind die beiden Ereignisse unabhängig?
• Wie groß ist die Wahrscheinlickeit, dass die Augensumme nicht 2 ist? Welche
Axiome verwenden Sie dabei?
• Sind die Ereignisse A: Augensumme ist 7, und B: erster Wurf ist kleiner
3, disjunkt? Wie groß ist die Wahrscheinlichkeit, dass A und B gleichzeitig
eintreten? Welche Formel verwenden Sie hierfür? Sind die beiden Ereignisse
unabhängig?
• Kombinatorik: welche zwei grundlegende Fälle müssen Sie unterscheiden?
Welches Modell verwenden Sie bei der Bestimmung der Wahrscheinlichkeit,
dass beim viermaligen Würfeln zweier Würfel mindestens einmal ein SechserPasch eintritt?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
13
Wiederholung
• Bedingte Wahrscheinlichkeit, totale Wahrscheinlichkeit, Satz von Bayes, a
priori und a posteriori Verteilung!
• Unendliche Ergebnisräume (Würfeln bis zur ersten Sechs)!
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
14
Wiederholung
Kapitel 5
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Zufallsvariable, Beispiele, Zufallsvariable als Abbildung
• Diskrete Zufallsvariable, Träger
• Endliche diskrete Zufallsvariable
• Verteilungsfunktion (Eigenschaften, Rechenregeln), Wahrscheinlichkeitsfunktion
• Beispiele für diskrete Verteilungen?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
15
Wiederholung
• Unabhängigkeit von Zufallsvariablen
• Erwartungswert (Eigenschaften, Rechenregeln). Nichtlineare Transformationen? Produktregel?
• Modus, Median, Quantile
• Varianz, Verschiebungssatz, lineare Transformationen, Additionssatz (Voraussetzung?)
• Spezielle diskrete Verteilungsmodelle (welches Modell steht jeweils dahinter?)
Additionssätze?
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
16
Wiederholung
Kapitel 6
Was müssen Sie wissen, welche Fragen sollten Sie beantworten können?
• Definition stetige Zufallsvariable, Dichte, Verteilungsfunktion (Eigenschaften)
• Unabhängigkeit von stetigen Zufallsgrößen
• Beispiele!
• Erwartungswert, Modus, Median (Eigenschaften, Lageregeln)
• Varianz, Verschiebungssatz, lineare Transformationen, Varianz der Summe von
Zufallsvariablen (Vorausssetzung?)
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
17
Wiederholung
• Spezielle Verteilungsmodelle
• Normalverteilung, Standardisierung, Quantile, zentrale Schwankunsintervalle,
lineare Transformatzion, Additionssatz
• Berechnung von Wahrscheinlichkeiten P (X ≤ x), P (a ≤ X ≤ b), P (X ≥ x)
wenn X ∼ N (µ, σ 2 )
• Verteilunsgmodelle für positive ZVen
• Prüfverteilungen
Statistik I für Statistiker, Mathematiker und Informatiker im WS 2006/07
18
Herunterladen