1 - ByteLABS

Werbung
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
Fragenkatalog Statistik 1 Vo
Dieser Fragenkatalog wurde heruntergeladen von www.informatiker.at.tf
1. Wodurch unterscheidet sich ein quantitativ stetiges Merkmal von einem quantitativ diskreten Merkmal?
Geben Sie je ein Beispiel für die Zerlegung einer passend gewählten Grundgesamtheit durch ein quantitativ
stetiges bzw. quantitativ diskretes Merkmal.
Grundsätzliches: Ein qualitatives Merkmal ist nominskaliert (d.h. Merkmalsausprägungen bilden keine
natürliche Rangfolge, z.B. Religion, Farbe, Geschlecht, ...).
Ein quantitatives Merkmal ist metrisch skaliert (Intervallskala: Möglichkeit, Rang und Abstände zwischen den
einzelnen Merkmalsausprägungen anzugeben, z.B.: Temperaturmessungen, Kalenderzeitrechnung,
Verhältnisskala: zusätzlich zu den Eigenschaften der Intervallskala hat die Verhältnisskala einen absoluten
Nullpunkt, z.B.: Körpergröße, Alter, Einkommen, ...).
Metrisch skalierte Merkmale werden in diskrete und stetige (kontinuierliche) Merkmale gegliedert.
Diskret nimmt auf einer metrischen Skala nur bestimmte, isolierte Werte an (z.B.: Zahl der Studierenden in
einem Hörsaal, Geldeinkommen, ...).
Stetig kann in einem bestimmten Intervall jeden beliebigen Wert annehmen (z.B.: Lebensalter, Länge eines
Werkstücks, Füllgewicht, ...).
2. Wie wirken sich bei einem quantitativ stetigen Merkmal unterschiedliche Klassenbreiten aus? Begründen Sie
die notwendige Vorgangsweise. Sind bei der Zeichnung der Summenkurve bei ungleicher Klassenbreite ebenfalls
besondere Maßnahmen zu ergreifen?
Bei unterschiedlichen Klassenbreiten muß die Säulenhöhe korrigiert werden. Besitzt eine Klasse i die
Klassenbreite xi = ci * xi, dann ergibt sich die zugehörige Säulenhöhe hi 
*
hi
.
ci
Da unbekannt ist, welche Merkmalswerte die einzelnen Elemente innerhalb einer Klasse besitzen, kann die
Summenhäufigkeit immer nur der oberen Klasssengrenze zugeordnet werden. Die Klassenbreiten sind daher
unerheblich für die Zeichnung der Summenkurve.
3. Was versteht man unter dem statistischen, was unter dem klassischen Wahrscheinlichkeitsbegriff? Welche
Eigenschaften sollten gegeben sein?
Die Wahrscheinlichkeit ist ein Maß zur Quantifizierung der Sicherheit (bzw. der Unsicherheit) des Eintretens
eines bestimmten Ereignisses im Rahmen eines Zufallsexperimentes.
Nach der klassischen Definition der Wahrscheinlichkeit (Laplace-Wahrscheinlichkeit, a-prioriWahrscheinlichkeit), ist die Wahrscheinlichkeit, daß bei einem bestimmten Zufallsexperiment das Ereignis A
eintritt, der Quotient aus der Zahl der günstigen Fälle durch die Zahl der möglichen Fälle. Der klassische
Wahrscheinlichkeitsbegriff ist nur auf gleichwahrscheinliche Elementarereignisse anwendbar.
Bei der statistischen Definition der Wahrscheinlichkeit (a-posteriori-Wahrscheinlichkeit) geht man von einem
Zufallsexperiment aus, das aus einer langen Folge voneinander unabhängiger Versuche besteht. Die
Wahrscheinlichkeit des Ereignisses ist als Grenzwert der relativen Häufigkeit des Auftretens von A
definiert. ( P( A)  lim hn ( A), hn ( A) 
n
k
)
n
Die geometrische Wahrscheinlichkeit hingegen ist anwendbar, wenn sich S als geometrische Größe darstellen
läßt (Länge, Fläche, Volumen) und A sich (als Teilmenge) als geometrische Größe darstellen läßt.. Die
Wahrscheinlichkeit ist dann der Quotient aus geometrischem Maß von A und geometrischem Maß von S.
Der Wahrscheinlichkeitsbegriff soll objektivierbar sein und keine subjektive Größe, und er soll anwendbar sein
auf beliebig oft wiederholbare Situationen.
1
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
4. Welche Zugänge sind bei der Wahrscheinlichkeit von Ereignissen möglich? Wie lautet jeweils die
Fragestellung?
Intiutiver Zugang: „Wie bestimme ich die Wahrscheinlichkeiten?“
Mathematischer Zugang: „Welche Eigenschaften müssen die Wahrscheinlichkeiten haben?“
Die Klasse E von Ereignissen werden nach R abgebildet, und zwar mit den 3 Axiomen von Kolmogoroff:
I. P(A)  0
(Nichtnegativität)
II. P(S) = 1
(Normierung)
III. AB = {}  P(AB) = P(A)+P(B)
(Additivität)
IIIa. A1, A2, ..., An paarweise disjunkt  P(A1A2...An) = P(A1) + P(A2) + ... + P(An)
5. Wo ist der Unterschied zwischen der a-priori- und der a-posteriorie-Wahrscheinlichkeit?
Die a-priori-Wahrscheinlichkeit ist die Wahrscheinlichkeit des relativen Anteils. Die a-posterioriWahrscheinlichkeit ist die Wahrscheinlichkeit der relativen Häufigkeit.
(siehe auch Frage 3).
6. Wie lautet der Additions-, bzw. der Multiplikationssatz?
Additionssatz: Sind A und B zwei bel. Ereignisse eines Zufallsexperiments, dann ist die Wahrscheinlichkeit des
Ereignisses AB gegeben durch P(AB) = P(A) + P(B) - P(AB). Die Wahrscheinlichkeit dafür, daß entweder
Ereignis A oder Ereignis B auftritt, ergibt sich also durch Addition der Wahrscheinlichkeit von A und B
abzüglich der Wahrscheinlichkeit für das gemeinsame Auftreten von A und B.
Multiplikationssatz: Aus der bedingten Wahrscheinlichkeit
P( A| B) 
P( A  B)
folgt unmittelbar der
P( B)
Multiplikationssatz: P(AB) = P(A)*P(B|A) = P(B)*P(A|B). Er ermöglicht die Berechnung der
Wahrscheinlichkeit, daß sowohl Ereignis A als auch Ereignis B eintritt (also Ereignis AB). Sind die Ereignisse
unabhängig voneinander, lautet der Multiplikationssatz P(AB) = P(A)*P(B).
Verallgemeinerung: P(ABC) = P(A) * P(B|A) * P(C|AB).
Was besagt der Satz von Bayes bzw. das Theorem der totalen Wahrscheinlichkeit?
Wir zerlegen S in einander ausschließende Ereignisse. Jedes beliebige Ereignis läßt sich nun als Vereinigung von
sich gegenseitig ausschließenden Ereignissen darstellen, und zwar durch B = SB = (A1A2...An)B =
(A1B)(A2B)...(AnB). Nach Anwendung des Additions- und dann des Multiplikationssatzes ergibt sich
(gekürzt):
n
P( B)   P( Ai ) P( B| Ai ) (Satz von der totalen Wahrscheinlichkeit)
i 1
Mit dem Satz von Bayes kann man, wenn das Ereignis B eingetreten ist, nachträglich die Wahrscheinlichkeit
dafür ermitteln, daß gleichzeitig mit B das Ereignis Ai eingetreten ist.
P( Ak | B) 
P( Ak )  P( B| Ak )
n
 P( A )  P( B| A )
i 1
i
k = 1, 2, ..., n
i
2
(Satz von Bayes)
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
8. Wie sind Erwartungswert und Varianz einer diskreten bzw. einer stetigen Zufallsvariable definiert?
X diskret:
k /
k /
E ( X )   xi  P{ X  xi }   xi  f ( xi )
i 1
i 1
Var ( X )   ( xi  E ( X ))  f ( xi )
2
i
Verschiebungssatz: Var(X) = E(X2) - [E(X)]2
X stetig:

E( X ) 
 x  f ( x)dx


Var ( x ) 
  x  E ( X )
2
 f ( x )dx

9. Was ist eine Zufallsvariable?
Eine Zufallsvariable ist eine Funktion, deren Definitionsbereich der Ereignisraum und deren Wertebereich eine
Teilmenge der reellen Zahlen ist; also eine Funktion (oder Abbildung) X von S nach R:
X  R.
10. Eigenschaften von Erwartungswert und Varianz.
I)
II)
III)
IV)
geg.: a, b bel. Reelle Zahlen
E(aX + b) = aE(X) + b
geg.: 1(X), 2(X) zwei beliebige Funktionen der Zufallsvariable X
E[1(X) + 2(X)] = E[1(X)] + E[2(X)]
Var(aX + b) = a2 . Var(X)
Die Verschiebung (b) beeinflußt die Varianz nicht, a ist ein Formfaktor, der die Funktion beeinflußt.
Verschiebesatz: Var(X) = E(X2) - [E(X)]2
11. Geben sie eine verbale Definition des Medians von n reellen Zahlen. Warum hängt die tatsächliche
Berechnung davon ab, ob n gerade oder ungerade ist?
Der Median (Zentralwert) ist die Merkmalsausprägung desjenigen Elements, das in der der Größe nach
geordneten Beobachtungsreihe in der Mitte steht.
Damit die Berechnung des Medians exakt ist, muß unterschieden werden, ob n gerade oder ungerade ist. Bei
ungeradem n nimmt man den mittleren Wert, bei geradem n das arithmetische Mittel der beiden mittleren Werte.
12. Der Momentkoeffizient der Schiefe ist definiert als
1 
3
s3
.Wie wird das dritte zentrale Moment 3
berechnet? Könnte man anstelle von 3 auch andere zentrale Momente verwenden, um ein sinnvolles Schiefemaß
zu definieren? Wenn ja, welche?
3 = E[(X-E(X))3] = E(X3) - 3E(X2)E(X) + 2[E(X)]3
Das erste zentrale Moment ist immer Null. Da sonst aber alle ungeraden Momente bei symmetrischer Verteilung
Null sind, könnte man auch diese verwenden.
3
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
13. Wie wird nach dem statistischen (a-posteriori) Wahrscheinlichkeitsbegriff die Wahrscheinlichkeit eines
Ereignisses A, also P(A) berechnet? Geben Sie dazu eine ausführliche Beschreibung.
Bei der statistischen Definition der Wahrscheinlichkeit geht man von einem Zufallsexperiment aus, das aus einer
langen Folge voneinander unabhängiger Versuche besteht. Die Wahrscheinlichkeit P(A) des Ereignisses A ist als
der Grenzwert der relativen Häufigkeit des Auftretens von A definiert:
hn ( A) 
k
ist die relative Häufigkeit des Ereignisses A bei n-maliger Durchführung eines Zufallexperiments,
n
wobei k die absolute Häufigkeit des Ereignisses A bei n-maliger Durchführung eines Zufallexperiments ist.
P( A)  lim hn ( A)
n
Beispiel: Wie groß ist die Wahrscheinlichkeit, mit einer Münze „Wappen“ oder „Zahl“ zu werfen?
Man wird feststellen, daß sich hn(A) mit zunehmender Zahl von Versuchen immer mehr dem Wert 0.5 nähert.
14. Wie bezeichnet man ein Ereignis, das durch eine Teilmenge aus a) genau einem Element, b) mehr als einem
Element, c) keinem Element, d) allen Elementen des Ereignisraumes besteht?
a) Elementarereignis
b) ein zusammengesetztes Ereignis
c) das unmögliche Ereignis
d) das sichere Ereignis
15. geben Sie die Folgerungen aus den Axiomen von Kolmogoroff an!
Satz 1: für endlich viele, paarweise disjunkte Ereignisse A1, ..., An gilt:
P(A1A2...An) = P(A1) + P(A2) + ... + P(An)
Satz 2: P({}) = 0
Satz 3: (P(A) = 1 - P(A)
Satz 4: A  B  P(A)  P(B)
Satz 5: P(A)  1
Satz 6: P(A \ B) = P(A) - P(A  B)
Satz 7: P(A  B) = P(A) + P(B) - P(A  B)
Satz 7’: P(A  B  C) = P(A) +P(B) + P(C) - P(A  B) - P(B  C) - P(A  C) + P(A  B  C)
16. Welche Beziehungen müssen erfüllt sein, damit wir zwei bzw. drei Ereignisse A, B, C als unabhängig
bezeichnen?
Ein Ereignis B ist dann von einem Ereignis A stochastisch unabhängig, wenn das Eintreten des Ereignisses B
von dem Eintreten oder dem Nichteintreten des Ereignisses A NICHT abhängt, also wenn gilt:
P(A  B) = P(A) * P(B).
Der Begriff der Unabhängigkeit läßt sich auf mehr als zwei Ereignisse ausdehnen: Die Ereignisse A, B, C sind
dann voneinander unabhängig, wenn folgende Beziehungen gelten:
P(ABC) = P(A) * P(B) * P(C)
P(AB) = P(A) * P(B)
P(AC) = P(A) * P(C)
P(BC) = P(B) * P(C)
Es müssen alle vier Bedingungen gelten!! (Nur die letzten drei alleine gelten nicht!!)
4
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
17. Wie ist die Varianz einer Zufallsvariable X definiert? Stellen Sie die Varianz einer diskreten Zufallsvariable
der Varianz der Verteilung eines quantitativ diskreten Merkmals in einer empirischen Grundgesamtheit
gegenüber.
Die Varianz ist ein Streuungsmaß und ist das zweite zentrale Moment E[(X-E(X))²] = E[(X-)²]. Sie ist für den
diskreten Fall folgendermaßen definiert:
Var(X) = ²x = ² := E[(X-E(X))²] =  (xi - E(X))²*f(xi).
Die Varianz der Verteilung eines quantitativ diskreten Merkmals in einer empirischen Grundgesamtheit ist
folgendermaßen definiert:
s2 
1 n
 ( x  x) 2
n i 1 i
18. Welches Modell und welche Fragestellung liegt der „Hypergeometrischen Verteilung“ zugrunde?
Die Hypergeometrische Verteilung entspricht dem Urnenmodell ohne Zurücklegen. Aus einer Urne, die mit M
schwarze und N-M weiße Kugeln - also insgesamt N Kugeln - gefüllt ist, wird eine Zufallsstichprobe im Umfang
n entnommen, ohne daß jedoch eine einmal gezogene Kugel wieder in die Urne zurückgelegt wird. Die
Fragestellung lautet: „Wie groß ist die Wahrscheinlichkeit, daß sich unter n gezogenen Kugeln genau x schwarze
befinden?“ Anwendungen sind z. B. Qualitätskontrolle oder Markt- und Meinungsforschung.
 M  N  M
  

 x   nx 
f ( x) 
 N
 
 n
M
M
M
 n p
,q  1
wobei p 
N
N
N
M 
M N n
N n
Var ( X )  n 
 1   
 n pq
N 
N  N 1
N 1
M
p
bei Annäherung durch Binomialverteilung:
N
E( X )  n
19. Welche modellmäßige Situation und welche Fragestellung liegt der Binomialverteilung zugrunde?
Modell: Bei Einzelversuch tritt Ereignis A (Erfolg) mit Wahrscheinlichkeit p auf, Ereignis A (Mißerfolg) mit
Wahrscheinlichkeit q = 1-p. Durchführung von n  1 solcher Einzelversuche, die Versuche seien unabhängig und
p = P(A) bei jedem Versuch gleich (Bernoulli-Versuche).
Fragestellung: Tritt Ereignis A auf oder nicht.
X ... Anzahl der Erfolge (A) bei n Versuchen
 n
f ( x)  P( X  x)     p x  q n x , x  0,1,..., n
 x
E( X )  n  p
Var ( X )  n  p  (1  p)  n  p  q
20. Welche Parameter hat die Binomialverteilung, und in welchem Wertebereich können diese liegen?
Die Binomialverteilung besitzt drei Parameter: n bezeichnet die Anzahl der Versuche (< ), p die
Wahrscheinlichkeit, daß das Ereignis auftritt (p  [0,1]), und x, das die Anzahl der Versuche mit erfolgreichem
Ausgang beschreibt (x  n).
5
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
21. Was sind die Voraussetzungen einer Näherung der hypergeometrischen durch die Binomialverteilung, einer
Binomialverteilung durch die Poissonverteilung bzw. einer Binomialverteilung durch die Normalverteilung?
Approximation der hypergeomerischen durch die Binomialverteilung:
N sehr groß, n relativ klein, n << N, Faustregel: n < 0.1 * N
Approximation der Binomialverteilung durch die Poissonverteilung:
p sehr klein, n sehr groß, Faustregel: p < 0.1, n > 10
Approximation der Binomialverteilung durch die Normalverteilung:
Mit wachsendem n nähert sich die Binomialverteilung immer mehr der Glockenform der
Normalverteilung an. Eine Annäherung ist dann möglich, wenn gilt: n.p.q > 9, wobei n.p.q = ². Unter der
Stetigkeitskorrektur versteht man hierbei die Korrektur der grenzen, die vorgenommen werden muß, wenn man
eine diskrete Verteilung (Binomialverteilung) durch eine stetige Verteilung (Normalverteilung) approximiert. Bei
größeren Werten von n macht man keinen allzu großen Fehler, wenn man die Stetigkeitskorrektur unterläßt.
Sei V die diskrete Zufallsvariable, X die dazugehörige normalverteilte „Näherungsvariable“, so ergibt sich eine
verbesserte Näherung durch:
P(a  V  b)  P(a - 0.5  X  b + 0.5), bzw.
P(V  c)  P(X  c + 0.5); P(V  d)  P(X  d - 0.5)
22. Geben Sie die Formel für die Dichte der Normalverteilung an! Welche Werte kann die zugehörige
Zufallsvariable X annehmen? Mit Hilfe welcher Transformation wir X standardisiert?
Eine stetige Zufallsvariable X heißt normalverteilt nach N(, ²), wenn sie folgende Wahrscheinlichkeitsdichte
besitzt:
f ( x) 
1
2  
e
1  x 
 

2  
2
, wobei - < x < 
Mit Hilfe der linearen Transformation wird die normalverteilte Zufallsvariable X standardisiert (Übergang in
N(0,1)-Verteilung). Die Formel für die Standardisieung lautet:
Z
X 

2
 f ( z) 
z
1

e 2
2 
23. Welche Rolle spielt die Exponentialverteilung im Zusammenhang mit einem Poisson-Prozeß? Was bedeutet
ihr Parameter ?
Die Länge der Intervalle zwischen zwei aufeinanderfolgenden Ereignissen in einem Poissonprozeß mit Parameter
 ist exponentialverteilt mit dem gleichen Parameter.
Eine stetige Zufallsvariable X heißt exponentialverteilt, wenn sie folgende Wahrscheinlichkeitsdichte besitzt:
f ( x)    e  x für x  0,  > 0;
1
1
E ( X )  , Var ( X )  2


f(x) = 0 für x < 0,
6
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
24. Beschreiben Sie die wesentlichen (geometrischen) Eigenschaften der Wahrscheinlichkeitsdichte
(Dichtefunktion) f(x,y) einer zweidimensionalen stetigen Zufallsvariable.
Bei der zweidimensionalen Zufallsvariable bilden wir S in die reelle Zahlenebene R² ab. Unter analogen
Bedingungen wie früher bezeichnen wir diese Abbildung als zweidimensionale Zufallsvariable (X,Y), da ihr
gleichzeitig eine Abbildung in die x-Achse und eine in die y-Achse entspricht.
Wir können wesentliche Eigenschaften und Definitionen vom eindimensionalen Fall übernehmen. Bei einer
stetigen zweidimensionalen Zufallsvariable sprechen wir von der Wahrscheinlichkeitsdichte f(x,y), die mit der
Verteilungsfunktion F(x,y) wie folgt zusammenhängt:
F ( x, y)  
x

y
 
f ( x * , y * )dx *dy *
 2 F ( x, y)
f ( x, y) 
 x y
25. Formulieren Sie das „Gesetz der großen Zahlen“. Wie kann man diese Aussage interpretieren?
Sei X1, X2, ..., Xn eine Folge von unabhängigen Zuvallsvariablen mit identischer Verteilung, also insbesondere
mit gleichem  und gleichem ².
1 n
Sei Sn   xi . Dann gilt für jedes  > 0:
n i 1


lim P Sn      0
n
(„Schwaches Gesetz der großen Zahlen“)
Speziell für Bernoulli-Versuche:
Sei p(A) = P die Wahrscheinlichkeit eines Erfolgs beim Einzelversuch, X binomialverteilt mit Parametern n und
p. Dann gilt:
 X

lim P  p     0
n  n

(„Gesetz der großen zahlen von Bernoulli“).
26. Wann heißt eine Schätzfunktion erwartungstreu? Wie könnte eine Verbesserung einer Schätzfunktion erzielt
werden, wenn man weiß, daß die dort verwendete Schätzfunktion erwartungstreu ist?
Eine Schätzfunktion T = g(X1, ..., Xn) für einen Parameter  heißt erwartungstreu, wenn E(T) = E[g(X1, ..., Xn)]
=  ist, d.h. wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt (bei jedem beliebigen
Stichprobenumfang).
Eine erwartungstreue Schätzfunktion T = g(X1, ..., Xn) für  heißt effizienteste oder wirksamste Schätzfunktion,
wenn T eine endliche Varianz hat und wenn es für  keine andere erwartungstreue Schätzfunktion gibt, die eine
kleinere Varianz als T besitzt.
27. Was sind die Vor- und Nachteile eines parameterfreien gegenüber einem (für das gestellte Problem)
„maßgeschneiderten“ parametrischen Tests?
Parametrische (verteilungsabhängige) Tests:
Es werden gewisse Voraussetzungen über die Verteilung der Grundgesamtheit getroffen, insbesondere über den
vorliegenden Verteilungstyp.
Parameterfreie (verteilungsunabhängige) Tests:
Sie gelten für beliebige Verteilungstypen, sind daher universeller anwendbar, i.a. aber daher nicht so „wirksam“.
7
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
28. Was versteht man unter „Operationscharakteristik“ eines Tests? Wie sieht diese aus, wenn ein zweiseitiger
Test für eine Nullhypothese H0: fi = fi0 - betreffend den unbekannten Parameter fi - vorliegt?
Fehler 2. Art (Konsumentenrisiko, Alarmversager):
Die Hypothese H0 wird nicht abgelehnt, obwohl sie falsch ist. Die Wahrscheinlichkeit, einen Fehler der 2.Art zu
begehen, wird mit  bezeichnet. Wir können  nicht in dem Maß vorgeben, wie dies bei  der fall ist.  hängt ab
von  , vom Stichprobenumfang n und insbesondere vom wahren Wert des Parameters : Je geringer der
Unterschied zwischen dem hypothetischen und dem wahren Wert von  ist, umso größer wird bei sonst gleichen
Bedingungen (d.h. gleichem  und gleichem n) die Fehlerwahrscheinlichkeit 2. Art.
Lediglich bei der Punktalternative  = 1 hat  einen festen Wer. Im Falle der Bereichsalternative ist sie eine
Funktion von , diese wird als Operationscharakteristik L(R,) des Tests bezeichnet.
Bei einem zweiseitigen Test hat L(R,) an der Stelle  = 0 den größten Wert, nämlich L(R,0) = . Dies
bedeutet, daß die Fehlerwahrscheinlichkeit 2.Art  für „wahre“ Werte von , die nahe bei 0 liegen, sehr groß
wird (je nach Wahl von  Werte bis zu 0.95 oder 0.99). Entfernt sich  jedoch von 0, so fällt in beiden
Richtungen L(R,) stetig gegen 0.
29. Was versteht man unter den Parametern einer Verteilung (Beispiel)?
Man unterscheidet zwischen expliziten und Funktionalparametern einer Verteilung. Die expliziten Parameter
scheinen direkt in der Formel für die Wahrscheinlichkeitsfunktion auf, z.B. n, p für die Binomialverteilung.
Funktionalparameter sind die „Maßzahlen“ einer Verteilung, wie z.B. Erwartungswert und Varianz, Median,
Momente einer Verteilung, usw.
30. Wozu verwendet man sie Maximum-Likelihood-Methode, und auf welcher Idee beruht sie? Charakterisieren
Sie die Vorgehensweise bei dieser Methode und geben Sie ihre Eigenschaften an!
Die Maximum-Likelihood-Methode gestattet die Schätzung von expliziten Parametern.
Gegeben sei ein Zufallsexperiment mit zugehöriger Zufallsvariable X; deren Wahrscheinlichkeitsfunktion, bzw. dichte soll von einem Parameter  abhängen: f(x;). Wird das Zufallsexperiment n-mal ausgeführt, erhalten wir
eine Stichprobe: (x1, x2, ..., xn).
X diskret: Die Wahrscheinlichkeit, gerade diese Stichprobe zu erhalten, beträgt

l( x ,  )  l( x1 , x2 ,..., xn ;  )  f ( x1 ;  ) f ( x2 ;  )... f ( xn ;  ), ´
wobei die Terme der rechten Seite von  abhängen.
X stetig: Die Wahrscheinlichkeit, eine Stichprobe vom Umfang n zu erhalten, bei der die Stichprobenwerte in
den Intervallen
x1  x  x1 + x, x2  x  x2 + x, ..., xn  x  xn + x
liegen, ist angenähert gegeben durch
f(x1;) x. f(x2;) x. ... f(xn;) x = f(x1; ) .. f(xn;) (x)n.
Kürzen wir durch (x)n, sehen wir, daß auch in diesem Fall die gesuchte Wahrscheinlichkeit proportional dem

Ausdruck l ( x ;  )  f ( x1 ;  )... f ( xn ;  ) ist.

l ( x ;  ) heißt die Likelihoodfunktion des vorliegenden Schätzproblems.
Prinzip der Maximum-Likelihood-Methode:

Als Schätzfunktion  wollen wir jenen Wert nehmen, für den l ( x ;  ) möglichst groß wird.

 1( x ;  )
0
Notwendige Bedingung dafür:


Die Lösung ist eine Funktion in x1, x2, ..., xn:   g ( x1 , x2 ,..., xn ) kann als Realisation einer Schätzfunktion T
= g(X1, ..., Xn) aufgefaßt werden. T heißt Maximum-Likelihood-Schätzfunktion für den unbekannten Parameter.
Eigenschaften der Maximum-Likelihood-Schätzung:
Sie ist eine konsistente, aber nicht notwendigerweise erwartungstreue (aber asymetrisch erwartungstreue)
Schätzfunktion. Existiert eine effiziente Schätzfunktion und ist die Maximum-Likelihood-Schätzung
erwartungstreu, so ist sie auch effizient.
8
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
31. Definieren Sie die Stichprobenvarianz! Warum ist der Faktor
Die Stichprobenvarianz S ² 
1
1
und nicht ?
n
n1
1 n
 ( X  X )² ist eine erwartungstreue Schätzfunktion für die Varianz
n  1 i 1 i
Var(X) = ² der Verteilung der Grundgesamtheit.
Der Faktor ist deshalb
1
1
, weil dies ein genaueres Ergebnis liefert als .
n
n1
32. Was versteht man unter einem Fehler 1. Art? Kann er vom Tester vorgegeben werden? Wenn ja, warum wird
er dann nicht extrem klein gewählt?
Fehler 1. Art (Produzentenrisiko, falscher Alarm): Die Hypothese H 0 wird abgelehnt, obwohl sie richtig ist. Die
Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, ist durch die Vorgabe des Wertes  festgelegt. Sie beträgt 
= 1 - , ist also im allgemeinen klein ( = 0.05 bzw. 0.01).
Ziel des Statistikers ist es, das Testverfahren so zu konzipieren, daß die Wahrscheinlichkeit für den - bzw. für
den -Fehler (der von  abhängt) in vertretbaren Grenzen gehalten wird. Er kann also nicht vom Tester gewählt
oder vorgegeben werden, sondern er ergibt sich aus dem gewählten Testverfahren.
33. Erklären Sie die Fragestellung der sogenannten „Umkehraufgabe“ im Zusammenhang mit der
Dichtefunktion einer Zufallsvariablen! Auf wieviele Arten kann die Umkehraufgabe gelöst werden, und welche
sind die normalerweise behandelten Fälle?
Geg.: 0    1
Ges.: [a,b], sodaß P(a  X  B) = 
Bei der Umkehraufgabe wird nicht nach der Wahrscheinlichkeit gefragt, daß ein Wert zwischen zwei Grenzen a
und b liegt, sondern nach den Grenzen a und b, sodaß P(a  X  b) =  (unendlich vieldeutig, aber 3 Spezialfälle:
links unbegrenztes, rechts unbegrenztes, symmetrisches Intervall).
34. Was versteht man unter der „Randverteilung“ einer zweidimensionalen Zufallsvariablen, und wie berechnet
man diese im stetigen Fall?
Aus der gemeinsamen Wahrscheinlichkeitsfunktion zweier Zufallsvariablen X und Y läßt sich sowohl für X als
auch für Y eine Randverteilung ableiten. Die Randverteilung fx(xi) für X gibt an, wie groß die
Wahrscheinlichkeit dafür ist, daß X einen speziellen Wert xi annimmt, wobei es gleichgültig ist, welchen Wert
die zweite Zufallsvariable Y annimmt (analoges gilt für Y). gebildet wird die Randverteilung durch Bildung der
Spalten- bzw. Zeilensummen der gemeinsamen Verteilfunktion.
f 1 ( x):  P( X  x, Y beliebig )   f ( x, y)
Diskret:
y
f 2 ( y):  P( X
beliebig , Y  y)   f ( x, y)
x
Stetig:
x



F1 ( x)  P( X  x, Y beliebig )  P( X  x,  Y  )   dx * 
F2 ( y)  P( X
f ( x * , y)dy  
f 1 ( x * )dx *

y



beliebig , Y  y)  P(   X  , Y  y)   dy * 
9

f ( x, y * )dx  
y

f 2 ( y * )dy *
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
35. Wann heißen (X,Y) einer zweidimensionalen Zufallsvariable unabhängig?
Gegeben sei eine zweidimensionale Zufallsvariable (X,Y) mit der gemeinsamen Verteilungsfunktion F(x,y). Die
durch die Randverteilungen von (X,Y) definierten Zufallsvariablen X mit F1(x) bzw. Y mit F2(y) heißen
unabhängig, wenn gilt:
F(x,y) = F1(x) . F2(y)
Im allgemeinen gilt dann auch für die Wahrscheinlichkeits- bzw. Dichtefunktionen:
f(x,y) = f1(x) . f2(y)
36. Was versteht man unter der Kovarianz von (X,Y) (Definitionsformel und Berechnung!)? Erklären Sie, welche
Beziehungen zwischen der Kovarianz und der Unabhängigkeit zweier Zufallvariablen besteht!
Bei zweidimensionalen Verteilungen läßt sich oft beobachten, daß die beiden Zufallsvariablen mehr oder weniger
korreliert sind, d.h. daß bei großen Werten von X auch Y tendenzmäßig größere Werte annimmt (positive
Korrelation), bzw. daß großen Werten von X kleine Werte von Y zugeordnet sind (negative Korrelation). Ein
Parameter, der die Stärke dieses Zusammenhangs beschreibt, ist die sogenannte Kovarianz.
Sie berechnet sich durch Cov(X,Y) = E[(X-E(X))*(Y-E(Y))] = E(X*Y) - E(X)*E(Y).
Bei unabhängigen Zufallsvariablen besitzen die Kovarianz und der Korrelationskoeffizient immer den Wert 0.
Umgekehrt kann jedoch nicht aus der Kovarianz von 0 allgemein auf Unabhängigkeit geschlossen werden.
37. Geben Sie die Formel der Ungleichung von Tschebyscheff für den Fall c =  an! Welchen Vorteil besitzt sie
trotz ihrer geringen Genauigkeit?
Geg.: X bel. Zufallsvariable, E(X) = , Var(X) = ², c bel. reell,  > 0.
Dann gilt die Ungleichung von Tschebyscheff:
P X  c    
1

2

2
E  X  c

speziell für c = :


P X   
2
2
38. In einem Studentenheim wird eine Totalbefragung aller Bewohner bezüglich ihres monatlich verfügbaren
Einkommens durchgeführt. Welche unterschiedlichen Zielsetzungen könnten hinter dieser Befragung stehen, je
nachdem, ob sie im Sinne der deskriptiven oder der induktiven Statistik durchgeführt wurde?
Die beschreibende (deskriptive, explorative) Statistik befaßt sich mit der Datenerfassung und Datenordnung, der
grafischen und tabellarischen Darstellung, sowie mit den Maß- und Kennzahlen der abgeschlossenen
Grundgesamtheit (Semester, Geld/Semester). Sie beschreibt eine abgeschlossene (empirische) Grundgesamtheit.
Eine Stichprobe wird für Zwecke der schließenden Statistik aufbereitet.
Die schließende (induktive, konfirmative) Statistik hingegen versucht, Schlüsse von den Daten auf die
dahinterliegenden Gesetzmäßigkeiten zu ziehen und das Testen von Hypothesen durchzuführen.
39. Beschreiben Sie die wesentlichen Eigenschaften eines Zufallsexperiments, und begründen Sie die an das
Zufallsexperiment gestellten Voraussetzungen!
Ein Zufallsexperiment wird unter ganz bestimmten Voraussetzungen durchgeführt, wobei der Vorgang beliebig
oft wiederholbar sein muß. Der Ausgang des Zufallsexperiments ist vom Zufall abhängig. Wird das Experiment
mehrmals durchgeführt, so wird vorausgesetzt, daß sich die einzelnen Ergebnisse gegenseitig nicht beeinflussen,
also unabhängig voneinander sind (z.B.: Münz-, Würfelwurf, aber auch Ermittlung der durchschnittlichen
Brenndauer von Glühbirnen). Bei jeder einzelnen Ausführung des Zufallsexperiments kann stets immer nur ein
Elementarereignis auftreten, es muß aber auch immer eines von ihnen auftreten.
10
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
40. Was ist eine Wahrscheinlichkeitsfunktion? Bei welchem Typ von Zufallsvariablen findet man sie? Welche
Eigenschaften weist sie auf? Zeichnen Sie exemplarisch den Graphen einer Wahrscheinlichkeitsfunktion!
Mit der Wahrscheinlichkeit, daß die Zufallsvariable X einen bestimmten Wert x annimmt, symbolisch P(X=x),
bezeichnen wir die Wahrscheinlichkeit jener Menge von Elementarereignissen, die als Urbilder von x auftreten.
Diese Wahrscheinlichkeit bezeichnen wir mit f(x) und nennen sie die Wahrscheinlichkeitsfunktion der
Zufallsvariable X: F(x) = P(X=x) = P({ekS:X(ek) = x}).
Man findet die Wahrscheinlichkeitsfunktion nur bei diskreten Zufallsvariablen.
Jede Wahrscheinlichkeitsfunktion besitzt zwei Eigenschaften:
I)
f(x)  0 für alle xi; es gibt eine endliche (abzählbar unendliche) Anzahl von x-Werten, für die f(x) > 0.
n()
II)
Sind x1, x2, ..., xn (x1, x2, ...) alle x Werte, für welche f(x) positiv ist, dann gilt:
 f x   1.
k 1
k
Exemplarischer Graph einer Wahrscheinlichkeitsfunktion:
50
40
30
20
10
0
1.
Qrtl.
2.
Qrtl.
3.
Qrtl.
4.
Qrtl.
41. Was ist eine Verteilungsfunktion? Welche Eigenschaften hat sie?
Diskreter Fall:
Als Verteilungsfunktion F(x) der Zufallsvariablen X bezeichnen wir die Funktion:
F ( x)  P( X  x)  P({ek  S: X (ek )  x})   f ( xi ) ,
xi  x
die folgende Eigenschaften besitzt:
I)
0  F(x)  1
II)
F(x) ist monoton wachsend (im weiteren Sinn), d.h. für x1 < x2  F(x1)  F(x2)
III)
F(x) ist eine Treppenfunktion mit einer endlichen (abzählbar unendlichen) Anzahl von Sprungstellen.
Die Sprungstellen sind jeweils jene Werte xk, für welche f(xk) > 0 ist. Der Wert von F(x) an der Sprungstelle ist
stets der größere Wert der beiden Stückenden.
IY)
P(a < X  b) = F(b) - F(a)
stetiger Fall:
Die Verteilungsfunktion F(x) wird analog definiert:
F ( x)  P( X  x)  
x

f ( x')dx'
mit folgenden Eigenschaften:
I)
0  F(x)  1
II)
F(x) ist monoton wachsend
III)
df ( x)
 f ( x)
dx
IV)
P(a < X  b) = F(b) - F(a)
11
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
42. Was ist eine Dichtefunktion? Welche Eigenschaften hat sie?
Ein Ereignisraum mit überabzählbar unendlich vielen Elementen wird durch die stetige Zufallsvariable X auf ein
Intervall der reellen Achse abgebildet. An die Stelle der diskreten Wahrscheinlichkeitsfunktion f(x) tritt hier die
stetige Wahrscheinlichkeitsdichte, die wir ebenfalls mit f(x) bezeichnen.
Die Frage nach P(X = x) ist hier nicht sinnvoll, da für jedes x P(X = x) = 0 wird. Sinnvoll ist nur die Frage nach
der Wahrscheinlichkeit, daß X einen Wert in einem Intervall (a,b] annimmt:
P(a  X  b)   f ( x)dx .
b
a
Eigenschaften:
I)
f(x)  0 für alle x, f(x) > 0 zumindest für ein Intervall
II)
P(   X  )  


f ( x)dx  1
43. Die Varianz der Hypergeometrischen Verteilung unterscheidet sich von jener der Binomialverteilung durch
die sogenannte Endlichkeitskorrektur
N n
. Geben Sie eine Begründung für die Notwendigkeit einer solchen
N 1
Korrektur und geben Sie an, wie sich diese Korrektur in Abhängigkeit vom Stichprobenumfang auswirkt.
Man benötigt deshalb eine solche Korrektur, weil bei der Hypergeometrischen Verteilung der
Stichprobenumfang n bekannt ist, bei der Binomialverteilung nicht. Für einen festen Wert von n strebt dieser
Korrekturfaktor mit wachsendem N gegen 1.
44. Eine physikalische Größe soll mit einem Meßinstrument bestimmt werden. Was versteht man unter einem
systematischen Fehler und was unter einem Zufallsfehler? Aufgrund welches Satzes kann man annehmen, daß
die Zufallsfehler i.a. normalverteilt sind?
Systematische Fehler sind Fehler, die aufgrund einer Fehlbedienung oder weil das Gerät falsch ist auftreten.
Zufallsfehler sind „zufällige“ Abweichungen“ vom Normalwert.
Aufgrund des zentralen Grenzwertsatzes, der besagt, daß die Summe von unabhängigen Zufallsgrößen (unter
sehr weitgehenden Bedingungen) gegen die Normalverteilung strebt, kann man annehmen, daß Zufallsfehler
normalverteilt sind.
12
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
45. Wie wird in der beschreibenden Statistik die Varianz bzw. die Standardabweichung berechnet? Für welche
Merkmalskategorien ergibt dies sinnvolle Maßzahlen? Welcher dieser beiden Maßzahlen gibt man in der
beschreibenden Statistik den Vorzug und warum?
Varianz: s ² 

1 n
 x  x
n i 1 i
Standardabweichung: s 

2

1 n
 x x
n i 1 i

2
Für die numerische Berechnung der Varianz sind folgende Formeln oft praktischer („Verschiebungssatz“):
s² 
1 n 2
2
xi  x , bzw.

n i 1
2

 n  

  xi  
1  n 2  i 1  
s ²   xi 

n i 1
n




Die Varianz oder die Standardabweichung sind Streuungsparameter, d.h. sie sagen etwas darüber aus, wie die
Werte zueinander liegen.
In der beschreibenden Statistik wird die Standardabweichung bevorzugt, in der induktiven Statistik wird die
Varianz bevorzugt.
46. Erklären Sie die Begriffe Stichprobe, Zufallsstichprobe, Stichprobenfunktion!
Gegeben sei eine unendliche Grundgesamtheit, an der ein Merkmal X beobachtet wird. X ist eine Zufallsvariable
und durch die Verteilungsfunktion f(x) charakterisiert.
Unter einer Stichprobe verstehen wir eine endliche Teilmenge der Elemente der Grundgesamtheit, die wir der
Einfachheit halber mit
{A1, A2, ..., An} bezeichnen. n heißt der Umfang der Stichprobe.
Die n ausgewählten Elemente liefern als Ausprägung der Zufallsvariable X die Werte:
(x1, x2, ..., xn).
Da i.a. nicht die ausgewählten Elemente, sondern die an ihnen beobachteten Merkmalswerte interessieren, wird
meistens diese Menge von Merkmalswerten als Stichprobe bezeichnet.
Von einer Zufallsstichprobe sprechen wir, wenn jedes Element der Grundgesamtheit die gleiche Chance hat, in
die Stichprobe aufgenommen zu werden. Mathematisch interpretiert man eine Zufallsstichprobe vom Umfang n
folgendermaßen:
Man denkt sich eine Folge von Zufallsstichproben gleichen Umfangs im oben beschriebenen Sinn entnommen.
Dann kann der jeweils an 1.Stelle stehende Merkmalswert x1 selbst als Zufallsvariable interpretiert werden,
ebenso der an 2., ... allgemein i-ter Stelle stehende Merkmalswert.
Eine spezielle Stichprobe kann somit aufgefaßt werden als Realisation einer n-dimensionalen Zufallsvariablen:
(X1, X2, ..., Xn), wobei aufgrund der Forderung der Zufälligkeit der Stichprobenentnahme alle Xi voneinander
unabhängig sind und die gleiche Verteilung des Merkmals X in der Grundgesamtheit und somit durch F(x)
bestimmt ist.
Eine Funktion T = g(X1, X2, ..., Xn) ist wieder eine Zufallsvariable und heißt Stichprobenfunktion. Wendet man
die Funktion g auf eine tatsächlich ermittelte Stichprobe (X1, x2, ..., xn) an, so ist t = g(x1, ..., xn) eine Realisation
der Stichprobenfunktion T.
13
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
47. Welche Schätzverfahren kennen Sie? Beschreiben Sie diese!
Das Grundproblem der Parameterschätzung ist es, Parameter der Grundgesamtheit, die unbekannt sind, durch
Stichprobenfunktionen zu schätzen.
Punktschätzung: Durch eine geeignet gewählte Stichprobenfunktion, die in diesem Fall auch als Schätzfunktion
bezeichnet wird, wird ein Schätzwert für den unbekannten Parameter ermittelt. Da für die Schätzung eines
bestimmten Parameters i.a. mehrere Schätzfunktionen denkbar wären, definiert man Eigenschaften, die eine
„gute“ Schätzfunktion haben soll.
Intervallschätzung: Eine andere Form der Parameterschätzung wird durch das Konfidenzintervall geliefert. Ein
Konfidenzintervall ist ein Intervall, das mit einer gewissen vorgegebenen Wahrscheinlichkeit  den unbekannten
Parameter  überdeckt.
48. Was ist eine Schätzfunktion? Welche wünschenswerte Eigenschaften von Schätzfunktionen kennen Sie?
Die Schätzfunktion gibt an, wie aus den Ergebnissen einer Stichprobe ein Schätzwert für den zu schätzenden
Parameter zu bestimmen ist. Da die Ergebnisse der einzelnen Ziehungen einer Zufallsstichprobe vom Umfang n
Zufallsvariable X1 bis Xn sind, ist die Schätzfunktion selbst als Funktion der n Zufallsvariablen ebenfalls eine
Zufallsvariable.
Eigenschaften von Schätzfunktionen:
Erwartungstreue:
Eine Schätzfunktion T = g(X1, ..., Xn) für einen Parameter  heißt erwartungstreu, wenn E(T) = E[g[X1, ..., Xn)]
=  ist, d.h. daß ihr Erwartungswert mit dem wahren Parameter übereinstimmt, und zwar bei jedem beliebigen
Stichprobenumfang n.
Effizienz:
Eine erwartungstreue Schätzfunktion T = g(X1, ..., Xn) für  heißt effiziente oder wirksamste Schätzfunktion,
wenn T eine endliche Varianz hat und wenn es für  keine andere erwartungstreue Schätzfunktion gibt, die eine
kleinere Varianz als T besitzt.
Konsistenz:
Ist eine asymptotische Eigenschaft der Schätzfunktion, die vom Stichprobenumfang n abhängt.
Eine Schätzfunktion Tn = g(X1, X2, ..., Xn) für  sei für beliebige Stichprobenumfang n definiert. Tn heißt
konsistent, wenn für alle  > 0 gilt:


lim P Tn      0.
n
Suffizienz:
Eine Schätzfunktion ist dann suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden
Parameter, welche die Stichprobe enthält, ausschöpft.
49. Was versteht man unter der Sicherheit, was unter der Genauigkeit eines Konfidenzintervalls? Wie kann man
eventuell beide verbessern?
Beim Konfidenzintervall unterscheiden wir die Genauigkeit der Schätzung, ausgedrückt durch die Länge L des
Konfidenzintervalls, und die Sicherheit der Schätzung, ausgedrückt durch die Wahrscheinlichkeit , mit der das
Konfidenzintervall den unbekannten Parameter überdeckt.
Eine Steigerung der Genauigkeit der Schätzung geht auf Kosten der Sicherheit und umgekehrt.
Beide Eigenschaften können i.a. verbessert werde, wenn der Stichprobenumfang vergrößert wird.
14
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
50. Welche Voraussetzungen muß ein Poisson-Prozeß erfüllen?
Ein Poisson-Prozeß ist ein stochastischer Prozeß, ein Punktprozeß. Er muß folgende Voraussetzungen erfüllen:
1.
Der Strom der Ereignisse muß regellos sein (ohne Nachwirkungen).
2.
Mittlere Intensität des Stromes muß konstant sein.
3.
Es tritt nie mehr als ein Ereignis gleichzeitig ein.
Für einen Poisson-Prozeß gilt: Die Wahrscheinlichkeit, daß x Ereignisse in der Zeit t eintreten, ist gegeben
durch:
  t x
x!
 e   t
51. Was versteht man unter der Gleichverteilung einer diskreten bzw. stetigen Zufallsvariable? Welcher
Sonderfall kann auftreten?
Eine diskrete Zufallsvariable ist gleichverteilt, wenn jede ihrer k Ausprägungen x1, ..., xk die gleiche
Wahrscheinlichkeit besitzen, wenn also P( X  x) 
1
(z.B.: ein idealer Würfel).
k
Eine stetige Zufallsvariable X heißt gleichverteilt, wenn sie folgende Wahrscheinlichkeitsdichte besitzt:
a, b  R, a < b
 0
 0
xa
xa
 1
x  a
f ( x)  
a  x  b, F ( X )  
a xb
b

a
b

a


xb
xb
 0
 1
a b
(b  a ) 2
E( X ) 
,Var ( X ) 
2
12
Spezialfall: a = 0, b = 1
Die entsprechende Zufallsvariable wird mit U(0,1) bezeichnet. Für sie gilt insbesonders: P(U  u) = F(u) = u für
0  u  1.
52. Wie kann bei Kenntnis der Verteilungsfunktion F(x,y) einer zweidimensionalen stetigen Zufallsvariablen
(X,Y) die Wahrscheinlichkeit dafür berechnet werden, daß (X,Y) in ein achsenparalleles Rechteck fällt:
P(a  X b, c  Y  d)?
P((X,Y)  Rechteck) = P(a < X  b, c < Y  d) = F(b,d) - F(a,d) - F(b,c) + F(a,c) (stetig und diskret).
15
Klausurfragen Satistik1 für Informatiker
 Heckmann Dietmar, Juni, November 1995
überarbeitet von Andreas Kaiser, November 1997
53. Welchem Modell entspricht die Chi-Quadrat-Verteilung? Wozu wird sie verwendet?
Die Chi-Quadrat-Verteilung entspricht folgendem stochastischen Modell:
Sind X1, X2, ...Xn unabhängig standardnormalverteilte Zufallsvariable (d.h. Zufallsvariable mit Erwartungswert 0
und Varianz 1), so besitzt die Quadratsumme ² = X1² + X2² + ... + Xn² eine Chi-Quadrat-Verteilung mit n
Freiheitsgraden. Die Zufallsvariable ² hat folgende Wahrscheinlichkeitsdichte:
0

n2
x
f ( x)  
2
2
 Kn  x  e
1
Kn  n
 n
2 2   
 2
x0
x0

 ( x )   e t  t x 1dt ,(Gamma  Funktion)
0
Man benötigt sie als Grundlage für den Chi-Quadrat-Anpassungstest, den Chi-Quadrat-Homogenitätstest sowie
den Chi-Quadrat-Unabhängigkeitstest. Außerdem benötigt man sie zur Bestimmung von Konfidenzintervallen für
Varianzen.
Parameter: E(²) = n, Var(²) = 2n
Mit wachsendem n nähert sich die Chi-Quadrat-Verteilung einer Normalverteilung mit den Parametern  = n ² =
2n.
16
Herunterladen