Allgemein kann man bei Erhöhung der Anzahl der Versuchsdurchführungen feststellen, dass eine Stabilisierung der relativen Häufigkeiten eines Ereignisses A eintritt. Bei großem Stichprobenumfang (oder großer Anzahl von Versuchen) schwanken die relativen Häufigkeiten mehr oder minder stark um einen festen Zahlenwert. Den festen Zahlenwert, um den die relativen Häufigkeiten schwanken, nennt man die Wahrscheinlichkeit des Ereignisses A. Die Wahrscheinlichkeit P(A) kann als ein Schätzwert für die relative Häufigkeit verwendet werden. Den Stabilisierungseffekt nennt man auch das Gesetz der großen Zahlen. Dieser Stabilisierungseffekt tritt nur unter den Bedingungen ein, a) dass der Versuch jedes Mal unter derselben Bedingung durchgeführt wird. b) dass die einzelnen Versuche keinen Einfluss auf die Ergebnisse nachfolgender Versuche haben. ! Ein Häufgikeitspolygon ist ein Liniendiagram, bei dem die Klassenmitten auf den Spitzen der Rechtecke im Histogramm mit einander verbunden werden. Der Inhalt der Fläche unter dem Polygon ist gleich dem der Rechtecke des Histograms. Das Diagramm, das die relativen kumulierten Häufigkeiten für klassierten Häufigkeiten darstellt, wird kumulatives relatives Häufigkeitspolygon, Summenkurve oder Empirische Verteilungsfunktion der klassierten Häufigkeitsverteilungen genannt. " Aus der folgende Liste für die Wochenlöhne in $ von 10 Angestellten der Firma P&R wurde eine Tabelle der klassierten Häufigkeiten erstellt. { 241,5 ; 244 ; 244 ; 248 ; 248 ; 250,4 ; 251 ; 254,1 ; 255 ; 256,2 } # Erstellen Sie eine Tabelle der Häufigkeiten, ein Histogramm der Klassendichten der relativen Häufigkeiten, ein Polygon sowie die Empirische Verteilungsfunktion. # Wie groß ist die Wahrscheinlichkeit, dass die Löhne weniger als 248 [$] sind? $% & # M = 5 ; N = 10 Spannweite: 256,2 – 241 = 15,2 j Wochenlohn Klassen Klassen -Breite: -Mitte: Klasse: Kj dj mj 1 [ 240 ; 244 ) 4 242 2 [ 244 ; 248 ) 4 246 3 [ 248 ; 252 ) 4 250 4 [ 252 ; 256 ) 4 254 5 [ 256 ; 260 ) 4 258 260 – 240 = 20 Abs. Rel. Häufig. Häufigkeit: hj fj 1 1 / 10 = 0,1 2 0,2 4 0,4 2 0,2 1 0,1 Klassen-Dichte der Rel. Häufig. * f j 0,1 / 4 = 0,025 0,05 0,1 0,05 0,025 Kumulierte Rel. Häufig F j 0,1 0,3 0,7 0,9 1,0 1 0,075 f *j Histogramm der Klassendichten der rel. Häufigkeiten Polygon 0,05 Empirische Verteilungsfunktion Fj Häufigkeiten Häufigkeiten 0,1 Kumulatives Relatives Häufigkeitspolygon 1 0,8 0,6 0,4 0,025 0,2 238 242 246 250 254 258 262 240 244 248 252 256 260 # aus dem Histogramm: * * P ( X < 248 ) = f 1 ⋅ d 1 + f 2 ⋅ d 2 = 4 ⋅ 0,025 + 4 ⋅ 0,05 = 0,3 oder einfacher aus der Empirische Verteilungsfunktion (Kumulierte Relativen Häufigkeiten: P ( X < 248 ) = F 2 = 0,3 '( # Wählt man aus einer Grundgesamtheit eine Stichprobe mit sehr großem Umfang, so sind viele Beobachtungen vorhanden. Somit ist es theoretisch möglich die Klassenintervalle sehr klein zu wählen und trotzdem eine erfassbare Anzahl von Beobachtungen in jeder Klasse zu erhalten. Folglich kann das relative Häufigkeitspolygon durch ein geglättetes Häufigkeitspolygon oder auch Häufigkeitskurve genannt ersetzt werden. In ähnlicher Weise erhält man geglättete kumulative relative Häufigkeitspolygone (geglättete Summenkurven). Im Allgemeinen ist es leichter, ein kumulatives relatives Häufigkeitspolygon (eine Summenkurve) zu glätten. In der Praxis nehmen Häufigkeitskurven gewisse Formen an, wie Parabeln, symmetrische oder unsymmetrische Gaußsche Glockenkurve oder Graphen von Exponentialfunktionen. Mit Hilfe der Methoden der Interpolation können anschließend Funktionsgleichungen für diese Kurven erstellt werden. ) * Definition 1) Zufallsvariable Die Zufallsvariable X ist eine Funktion, die jedem ElementarErEigniss aus der Ergebnismenge eines Zufallsexperimentes genau eine Zahl zuordnet. Die Zufallsvariable heißt diskret, wenn sie endlich viele oder abzählbar unendlich viele reelle Werte annehmen kann. Die Zufallsvariable heißt stetig, wenn sie jeden beliebigen reellen Wert in einem endlichen oder unendlichen Intervall annehmen kann. " + & X : Zufallsvariable (Funktion) mit großen Buchstaben. x k : Werte, die die Zufallsvariable annimmt, mit kleinen Buchstaben. X = x k ; mit k = 1 ; 2 ; . . . 2 " Folgende Zufallsvariable ist gegeben: X : „Ereichte Augenzahl beim Wurf eines homogenen Würfels“ Geben Sie die Wahrscheinlichkeiten, für das Eintreten der jeweiligen Augenzahlen an. $% & P ( X = x 1 ) = P ( X = 1 ) = 1/6 ; P ( X = x 3 ) = P ( X = 3 ) = 1/6 ; P ( X = x 5 ) = P ( X = 5 ) = 1/6 ; P ( X = x 2 ) = P ( X = 2 ) = 1/6 ; P ( X = x 4 ) = P ( X = 4 ) = 1/6 ; P ( X = x 6 ) = P ( X = 6 ) = 1/6 . ) * Definition 2) Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariable Sei X eine diskrete Zufallsvariable mit den Werten x 1 , x 2 , . . . . Die Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariable X kann wie folgt durch die Wahrscheinlichkeitsfunktion f (x ) beschrieben werden. f (x k ) = p k = P ( X = x k ) Dabei ist p k die Wahrscheinlichkeit dafür, dass X den Wert x k annimmt. Die Verteilungsfunktion einer Zufallsvariable X ist die Wahrscheinlichkeit dafür, dass die Zufallsvariable X einen Wert annimmt, der kleiner oder gleich einer vorgegebenen reellen Zahl x ist. F(x ) = P( X≤x ) = ( f x k ) xk ≤ x Bemerkung: Die Wahrscheinlichkeiten f (x k ) = p k haben eine Analogie zu den relativen Häufigkeiten f j Die Verteilungsfunktion F (x ) hat eine Analogie zu den kumulierten relativen Häufigkeiten F j Eigenschaften der Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable Sei X eine diskrete Zufallsvariable mit den Werten x 1 , x 2 , . . . ., so besitzt die Wahrscheinlichkeitsfunktion folgende Eigenschaft: ( f x k ) = 1 , mit f (x k) 0 k Bemerkung: Die Ereignisse X = x k bilden eine disjunkte Zerlegung von und wegen P ( ) = 1 gilt: pk 1 = P( Ω f (xk )= ) k 3 " ) Folgende Zufallsvariable ist gegeben: X : „Ereichte Augenzahl , beim Wurf eines homogenen Würfels“ Stellen Sie die Wahrscheinlichkeitsverteilung von X graphisch dar. X= xk = k P (X = x k ) = P (X = k ) = f ( k ) F(xk) = F(k) 1 1/6 1/6 2 1/6 2/6 Stabdiagramm der Wahrscheinlichkeitsfunktion f ( xk ) 3 1/6 3/6 4 1/6 4/6 5 1/6 5/6 6 1/6 6/6 Verteilungsfunktion FF (( xxkk) ) 1 1/6 0,15 0,10 2/6 0,05 1/6 0 0 1 2 3 4 Augenzahl 5 6 xk ) –1 0 1 2 3 4 5 Augenzahl 6 xk * Definition 3) Dichtefunktion und Wahrscheinlichkeitsdichte Die Wahrscheinlichkeitsverteilung einer stetigen Zufallsvariable X lässt sich durch die Dichtefunktion oder Wahrscheinlichkeitsdichte f (x) oder durch die dazugehörige Verteilungsfunktion: x F(x) = P( X ≤x ) = f ( u ) du − ∞ beschreiben. Die Dichtefunktion erfüllt folgende Eigenschaften: f (x) 0 f ist stetig bis auf endliche Punkte ∞ f ( x ) dx = 1 − ∞ 4 " , Die Lebensdauer T (in Jahren) eines bestimmten elektronischen Bauteils sei eine exponentialverteilte Zufallsgröße mit der Dichtefunktion: f (t 0 )= 0 ,1 e t ≤ 0 für − 0 , 1t t > 0 für # Stellen Sie die Wahrscheinlichkeitsverteilung von T graphisch dar. # Wie groß ist der Anteil an Bauelemente, deren Lebensdauer den Wert t = 10 Jahren überschreitet? $% & # Die Wahrscheinlichkeitsverteilung ist 0 0d u t F (t )= f (u )d u = − ∞ t ≤ 0 für − ∞ 0 für t ≤ 0 für t > 0 = t 0 ,1 e − 0 ,1 u du 1 − e− t > 0 für 0 , 1t 0 Dichtefunktion Verteilungsfunktion F(t) f(t) t t # Die Zufallsvariable ist: T. Die Wahrscheinlichkeit für alle Zeiten unterhalb von t = 10 Jahren lässt sich berechnen durch: 10 P ( T ≤ 10 ) = F ( 10 ) = 0 f (t )d t = 0 ⋅d t + − ∞ = 0 + 10 0 ,1 ⋅ − 0 ,1 t ( − 0 ,1 ) − 0 ,1 t ⋅d t 0 − ∞ e 0 ,1e 10 = [ ( − e −1 ) − ( − 1 ) ] = 0 , 632 0 oder einfacher mit der Verteilungsfunktion F ( t ) P ( T ≤ 10 ) = F ( 10 ) = 1 − e − 0 , 1 ⋅ 10 = 0 , 632 5 ∞ f (t ) dt = 1 Für die Gesamtwahrscheinlichkeit der Dichtefunktion gilt: − ∞ Folglich ist die Wahrscheinlichkeit für alle Zeiten oberhalb von t = 10 Jahren: P ( T > 10 ) = 1 − [ P ( T ≤ 10 ) ] = 1 − 0 , 632 = 0 , 368 Also rund 36,8% der Bauteile sind nach t = 10 Jahren noch funktionsfähig. f(t) F ( 10 ) = P ( T 10 ) P ( T > 10 ) t , - . . ' / . # Führt man ein Zufallsexperiment sehr oft durch (N ∞) , so nähern sich die relativen Häufigkeiten fk für die jeweiligen Werte xk den jeweiligen Werten der Wahrscheinlichkeitsfunktion f (xk) = pk an. Definition 4) Erwartungswert einer Zufallsvariable Der Erwartungswert E( X ) einer Zufallsvariable X ist: pk µ xk ⋅ f (xk = ) , falls X diskret ist. k Dabei ist p k = f ( x k ) die Wahrscheinlichkeitsfunktion der diskreten Zufallsvariable. ∞ x ⋅ f ( x ) dx µ = , falls X stetig ist. − ∞ Dabei ist f ( x ) die Dichtefunktion der stetigen Zufallsvariable. 6 " Folgende Zufallsvariable ist für das Zufallsexperiment „Wurf eines homogenen Würfels“ gegeben: X : Ereichte Augenzahl beim einmaligem Wurf eines Würfels Bestimmen Sie den Erwartungswert für diese Zufallsvariable des Zufallsexperiments. $% & Die Zufallsvariable X kann die Werte x k = k = 1 ; 2 ; . . . ; 6 annehmen xk ⋅ µ = pk 6 f (xk ) == k k =1 6 k ⋅f (k ) = 1⋅ k = 1 1 6 + 2⋅ 1 6 + + 6⋅ 1 = 3 ,5 6 " 0 Die Lebensdauer T (in Jahren) eines bestimmten elektronischen Bauteils sei eine exponentialverteilt Zufallsgröße mit der Dichtefunktion: f(t) f (t 0 )= 0 ,1 e t ≤ 0 für − 0 , 1t für t > 0 t Berechnen Sie die mittlere Lebensdauer des Bauteils. $% & 0 ∞ t ⋅ f (t ) d t = µ = − ∞ = 0,1 ⋅ ∞ t ⋅ 0 ⋅ dt + t → ∞ − 0,1 t − 1 ⋅e 0,1 2 dt = 0,1 ⋅ 0 − ∞ lim t ⋅ 0,1 e − 0 ,1t − 0 ,1t − − 0,1 ⋅ 0 − 1 ⋅e 0,1 2 − 0 ,1⋅ 0 1 − 0,1 t − 1 ⋅e 0,1 2 = 0,1 ⋅ ∞ − 0 ,1t 0 1 = 10 [ Jahre ] 0,1 2 0 Also beträgt die mittlere Lebensdauer des Bauteils 10 Jahre. 7 , 1 + . Varianz der Stichprobe für Stichproben mit sehr großem Umfang Ist die Anzahl der Wiederholungen eines Zufallsexperiments (die Anzahl der Elemente einer Stichprobe) sehr groß (N ∞) so kann die Varianz mit Hilfe von absoluten bzw. relativen Häufigkeiten wie folgt berechnet werden. M h k ⋅ (xk − x M )2 k s2 = M f k ⋅ (xk − x ⋅ (xk − x k )2 M k === N − 1 = h Sehr große N = N k h k N ⋅ (xk − x )2 )2 k Dabei gibt M die Anzahl der verschiedenen Merkmalausprägungen. Führt man ein Zufallsexperiment sehr oft durch (N ∞) , so nähern sich die relativen Häufigkeiten f k für die jeweiligen Werte k den jeweiligen Werten der Wahrscheinlichkeitsfunktion f (k) = f (xk) = pk an. Definition 5) Varianz ² und Standardabweichung einer Zufallsvariable Die Varianz VAR( X ) einer Zufallsvariable X ist: pk σ 2 f (xk = ) ⋅( xk − µ )2 , falls X diskret ist. k Dabei sind p k = f ( x k ) die Wahrscheinlichkeitsfunktion und diskreten Zufallsvariable. der Erwartungswert der ∞ σ 2 f (x)⋅( x − µ = ) 2 dx , falls X stetig ist. − ∞ Dabei sind f ( x ) die Dichtefunktion und Die Standardabweichung ist: σ = σ der Erwartungswert der stetigen Zufallsvariable. 2 Bemerkung: Die Varianz für diskrete bzw. stetige Zufallsvariablen kann auch mit der bequemeren Formel berechnet werden. σ 2 2 k − µ dx − µ f ( x k )⋅ x = 2 , falls X diskret ist. , falls X stetig ist. k ∞ σ 2 f (x)⋅ x = 2 2 − ∞ 8 " 2 Folgende Zufallsvariable ist für das Zufallsexperiment „Wurf eines homogenen Würfels“ gegeben: X : Ereichte Augenzahl beim einmaligem Wurf eines Würfels Berechnen Sie die Varianz für diese Zufallsvariable des Zufallsexperiments. $% & Die Zufallsvariable X kann die Werte x k = k = 1 ; 2 ; . . . ; 6 annehmen. Im Beispiel 5 ergab sich für den Erwartungswert: µ = 3,5 .Somit ergibt sich für die Varianz: 6 2 σ f (xk = )⋅ ( ) xk − µ 2 k ⋅ ( 1− 3 , 5 6 )2 + 1 6 )2 k = 1 k =1 1 = f (k )⋅ ( k − 3,5 == ⋅ ( 2 − 3,5 )2 + 1 + 6 ⋅ ( 6 − 3,5 )2 = 2 , 916 Man kann die Varianz auch mit Hilfe der bequemeren Formel ausrechnen. 6 σ 2 f (k ) ⋅ k 2 = − 3 ,5 2 1 = 6 k =1 ⋅ 12 + + 1 6 ⋅ 62 − 3 , 5 2 = 2 , 916 " 3 Die Lebensdauer T (in Jahren) eines bestimmten elektronischen Bauteils sei eine exponentialverteilte Zufallsgröße mit der Dichtefunktion: f (t 0 )= t ≤ 0 für − 0 , 1t 0 ,1 e für t > 0 Die mittlere Lebensdauer dieses Bauteils beträgt 10 Jahre (s. Bsp. 6). Berechnen Sie die Standardabweichung für die Lebensdauer des Bauteils. $% & 0 ∞ σ 2 ∞ 2 f ( t ) ⋅ ( t − µ ) d t == = − ∞ 0 ⋅ ( t − 10 ) 2 0 , 1t ⋅ ( t − 10 ) 2 dt = 100 0 µ = 10 − ∞ Also beträgt die Standardabweichung: 0 ,1e − dt + = 10 [Jahre] Man kann die Varianz auch mit Hilfe der bequemeren Formel ausrechnen. 0 σ 2 ∞ 0⋅t = 2 − ∞ 0 ,1e − ⋅ dt + 0 , 1t ⋅ t 2 ⋅ dt − 10 2 = 100 0 = 10 [Jahre] 9