Vorlesung Statistik 1 für Informatiker, Juli 2004

Werbung
Vorlesungsklausur Statistik 1 für Informatiker, Juli 2004
1. Welche der folgenden Beziehungen gelten für zwei unabhängige Ereignisse A, B? Schreiben Sie
die Begründung dazu.
P(A | B) = P(A|B¯ );
P(A  B) = P(A) . P(B);
A  B = {};
P(A  B) = P(A) + P(B);
P(A | B) = P(A);
2. Welche Aussagen lassen sich aus der Wahrscheinlichkeitsdichte f(x) einer stetigen
Zufallsvariablen X gewinnen? Welche Eigenschaften muß f(x) aufweisen, um eine zulässige
Dichtefunktion zu bilden?
3. Welche Art von Zufallsvariablen (diskret/stetig) liegt den beiden folgenden Verteilungsfunktionen
zugrunde? Zeichen Sie dazu eine passende Funktion f(x).
F(x)
F(x)
1
1
x
x
4. Die Varianz der hypergeometrischen Verteilung unterscheidet sich von jener der
Binomialverteilung durch die sogenannte Endlichkeitskorrektur (N-n) / (N –1). Geben Sie eine
Begründung für die Notwendigkeit einer solchen Korrektur, und geben Sie an, wie sich diese
Korrektur in Abhängigkeit vom Stichprobenumfang auswirkt.
5. Wie kann bei Kenntnis der Verteilungsfunktion F(x,y) einer zweidimensionalen stetigen
Zufallsvariablen (X,Y) die Wahrscheinlichkeit dafür berechnet werden, dass (X,Y) in ein
achsenparalleles Rechteck fällt: P(a  X  b, c  Y  d)?
6. Formulieren Sie das Gesetz der großen Zahlen von Bernoulli und interpretieren Sie es anhand
eines konkreten Beispiels.
7. Für die empirische Verteilung eines quantitativen Merkmals X ergaben sich folgende Maßzahlen:
x¯ = 24,7; s x = 3,9; x̃ 0,5 = 22,3; γ 1x = 0,69. Geben Sie die Werte dieser Maßzahlen für das
Merkmal Y = 4X – 5 an.
8. Wie wird in der beschreibenden Statistik die Varianz bzw. die Standardabweichung berechnet?
Für welche Merkmalskategorien ergibt dies sinnvolle Maßzahlen? Welcher dieser beiden
Maßzahlen gibt man in der beschreibenden Statistik den Vorzug und warum?
9. Nach welchem Prinzip wird üblicherweise die "beste" Regressionsgerade durch ein
Streudiagramm gelegt? Geben Sie an, wozu man eine Regressionsgerade verwenden kann.
10. Aus einer normalverteilten Grundgesamtheit liege eine Stichprobe vom Umfang n vor: x1, x2, ...,
xn. Diese Stichprobe soll dazu benützt werden, um ein Konfidenzintervall für den unbekannten
Parameter μ = E(x) der Normalverteilung zu bestimmen. Beschreiben Sie Ihre Vorgangsweise und
stellen Sie insbesondere dar, welche Voraussetzung die Berechnung wesentlich beeinflusst und
welche Wahlmöglichkeiten bez. der Lage des Konfidenzintervalls bestehen!
Herunterladen