Vorlesungsklausur Statistik 1 für Informatiker, Juli 2004 1. Welche der folgenden Beziehungen gelten für zwei unabhängige Ereignisse A, B? Schreiben Sie die Begründung dazu. P(A | B) = P(A|B¯ ); P(A B) = P(A) . P(B); A B = {}; P(A B) = P(A) + P(B); P(A | B) = P(A); 2. Welche Aussagen lassen sich aus der Wahrscheinlichkeitsdichte f(x) einer stetigen Zufallsvariablen X gewinnen? Welche Eigenschaften muß f(x) aufweisen, um eine zulässige Dichtefunktion zu bilden? 3. Welche Art von Zufallsvariablen (diskret/stetig) liegt den beiden folgenden Verteilungsfunktionen zugrunde? Zeichen Sie dazu eine passende Funktion f(x). F(x) F(x) 1 1 x x 4. Die Varianz der hypergeometrischen Verteilung unterscheidet sich von jener der Binomialverteilung durch die sogenannte Endlichkeitskorrektur (N-n) / (N –1). Geben Sie eine Begründung für die Notwendigkeit einer solchen Korrektur, und geben Sie an, wie sich diese Korrektur in Abhängigkeit vom Stichprobenumfang auswirkt. 5. Wie kann bei Kenntnis der Verteilungsfunktion F(x,y) einer zweidimensionalen stetigen Zufallsvariablen (X,Y) die Wahrscheinlichkeit dafür berechnet werden, dass (X,Y) in ein achsenparalleles Rechteck fällt: P(a X b, c Y d)? 6. Formulieren Sie das Gesetz der großen Zahlen von Bernoulli und interpretieren Sie es anhand eines konkreten Beispiels. 7. Für die empirische Verteilung eines quantitativen Merkmals X ergaben sich folgende Maßzahlen: x¯ = 24,7; s x = 3,9; x̃ 0,5 = 22,3; γ 1x = 0,69. Geben Sie die Werte dieser Maßzahlen für das Merkmal Y = 4X – 5 an. 8. Wie wird in der beschreibenden Statistik die Varianz bzw. die Standardabweichung berechnet? Für welche Merkmalskategorien ergibt dies sinnvolle Maßzahlen? Welcher dieser beiden Maßzahlen gibt man in der beschreibenden Statistik den Vorzug und warum? 9. Nach welchem Prinzip wird üblicherweise die "beste" Regressionsgerade durch ein Streudiagramm gelegt? Geben Sie an, wozu man eine Regressionsgerade verwenden kann. 10. Aus einer normalverteilten Grundgesamtheit liege eine Stichprobe vom Umfang n vor: x1, x2, ..., xn. Diese Stichprobe soll dazu benützt werden, um ein Konfidenzintervall für den unbekannten Parameter μ = E(x) der Normalverteilung zu bestimmen. Beschreiben Sie Ihre Vorgangsweise und stellen Sie insbesondere dar, welche Voraussetzung die Berechnung wesentlich beeinflusst und welche Wahlmöglichkeiten bez. der Lage des Konfidenzintervalls bestehen!