2. Stochastische Prozesse. 3. Eigenschaften von

Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 1 von 7
2. Stochastische Prozesse.
Warteschlangen treten als Erscheinungsformen von in der Zeit ablaufenden Prozessen
auf, von denen – wie oben erwähnt – mindestens einer nicht–deterministisch (stochastisch) ist. Wir können das System, in dem sich der Prozess abspielt, entweder
kontinuierlich oder in gewissen diskreten Zeitabständen analysieren. Je nach dieser
Wahl, müssen wir mithin einen diskreten oder kontinuierlichen stochastischen
Prozess betrachten. Hierzu verwenden wir das Konzept der Zufallsvariablen.
Definition 1:
Eine Familie von Zufallsvariablen {Xt | t ∈ T} , die sich in zufälliger, aber
wohl definierter Weise entwickelt, heisst ein stochastischer Prozess. T bezeichnet dabei häufig die (entweder kontinuierlich oder in diskreten Schritten)
betrachtete Zeit. Ein stochastischer Prozess soll im folgenden als vollständig
zufällig – kurz "zufällig" – bezeichnet werden, wenn
(2.1)
Pr(Xt+s= i | Xt= j; A) = Pr(Xt+s= i | Xt= j)
für alle t, s gilt, wobei A ein beliebiges einfaches oder zusammengesetztes, in
irgend einer Weise durch {Xr | r < t} bedingtes Ereignis ist und Pr die Wahrscheinlichkeit bezeichnet. Die angegebene Wahrscheinlichkeit ist mithin unabhängig von Ereignissen, die vor der Zeit t stattgefunden haben.
3. Eigenschaften von Warteschlangen.
Die Struktur einer Warteschlange wird durch drei Faktoren bestimmt:
– den Typ TA des Ankunftsmusters,
– den Typ TB des Bedienungsmusters und
– die Warteregel.
Ankunfts– und/oder Bedienungsmuster sind stochastische Prozesse.
Das Ankunftsmuster gibt an, in welchem zeitlichen Abstand die Klienten an dem
Bedienungseingang erscheinen.
Das Bedienungsmuster gibt an, wie der zeitliche Ablauf des Bedienungs– (Behandlungs–) Vorgangs abläuft. Hierzu gehört auch die Angabe der Anzahl der Bediener.
Die Warteregel gibt an, nach welcher Regel die wartenden Klienten zur Bedienung
ausgesucht werden.
Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 2 von 7
Entsprechend diesen Charakteristika wird die Warteschlange in Kurzschreibweise in
der Form (TA / TB / k) notiert, wobei k die Anzahl der Bediener angibt und die Token T als
M : (Markov) – vollständig zufällige Verteilung,
D : deterministische Verteilung (konstante Zeitintervalle),
G : beliebige Verteilung
angegeben werden.
Mathematisch am einfachsten ist eine Warteschlange zu beschreiben, bei der die
Klienten "vollständig zufällig" am Bedienungseingang auftauchen, die Bedienung
durch einen Bediener erfolgt, die Bedienungsdauer ebenfalls "vollständig zufällig",
und die Warteregel "First In First Out" (FIFO) ist (in der angegebenen Schreibweise
also die Warteschlange (M / M / 1)).
4. Der "gedächtnislose" Ankunftsprozess.
Der im folgenden formulierte Ankunftsprozess ist ein vollständig zufälliger stochastischer Prozess im Sinne der eingangs gegebenen Definition:
Sei λ die mittlere Anzahl von Ankünften in der Zeiteinheit. Dann ist die Wahrscheinlichkeit dafür, dass im Zeitintervall zwischen t und t + dt ein Klient eintrifft,
gleich λ dt + o(dt), die Wahrscheinlichkeit dafür, dass in diesem Zeitintervall kein
Klient eintrifft, gleich 1 – λ dt + o(dt), und die Wahrscheinlichkeit dafür, dass in diesem Intervall zwei oder mehr Klienten eintreffen, gleich o(dt) 1 .
Dazu zeigen wir zunächst:
Satz 1:
Für einen Ankunftsprozess sind die Bedingungen
(1)
Sei λ die mittlere Anzahl von Ankünften in der Zeiteinheit. Dann ist die Wahrscheinlichkeit dafür, dass im Zeitintervall zwischen t und t + dt ein Klient
eintrifft, gleich λ dt + o(dt), die Wahrscheinlichkeit dafür, dass in diesem Zeitintervall kein Klient eintrifft, gleich 1 – λ dt + o(dt),
(2)
Die Anzahl der Ankünfte während einer Zeit τ ist eine Zufallsvariable N, die
eine POISSON–Verteilung mit dem Parameter λ besitzt,
1
Die betrachteten Wahrscheinlichkeiten hängen also nur vom Zeitintervall dt ab und sind unabhängig von
vorangegangenen Ereignissen
Prof. Dr. Gerhard Berendt
SS 2006
(3)
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 3 von 7
Das Zeitintervall zwischen der Ankunft zweier aufeinander folgender Klienten
ist eine Zufallsvariable T, die eine Exponentialverteilung mit dem Parameter λ
besitzt,
äquivalent.
Beweis:
(1) → (2):
Das Intervall τ wird in m äquidistante Intervalle der Länge dt zerlegt; es ist also τ
= m dt . Dann folgt aus (1) für die Wahrscheinlichkeit Prλ(N = n) nach der Binomialverteilung
(4.1)
(4.2)
⎛ m⎞
Pλ ( N = n) = ⎜⎜ ⎟⎟ (λ dt + o(dt ) ) n (1 − λ dt + o(dt ) ) m−n
⎝n⎠
→
(λ τ )n exp(−λ τ )
n!
im Limes m→ ∞ , dt → 0 , m dt → τ .
Die Wahrscheinlichkeit dafür, dass die Anzahl der Ereignisse zur Zeit τ gleich n ist,
ist mithin nur von λτ abhängig: Pr(N=n) = Pr(n ; λτ)
(zur Herleitung vgl. den Abschnitt A 1.6 aus Arbeitsblatt 1).
Erwartungswert und Varianz von N sind E(N) = V(N) = λ τ .
(2) → (3):
Seien f(t) und F(t) die Dichte– bzw. die Verteilungsfunktion der Zufallsvariablen T.
Angenommen, ein Klient erscheine zu einem bestimmten Zeitpunkt, und wir messen
die danach verstreichende Zeit t bis zur Ankunft des nächsten Klienten. Dann ist
Pr(T > t) = Pr(kein Klient erscheint in (0,t)) = e − λ t nach (2).
Da jedoch Pr(T > t) = 1 – Pr(T ≤ t) = 1 – F(t) ist, folgt
F (t ) = 1 − e − λ t ; t ≥ 0 ,
und damit
(4.3)
f (t ) = F ′(t ) = λ e − λ t ; t ≥ 0.
Es folgt für beliebige t, s ≥ 0 :
(4.4)
Pr(T > s+t | T > t) = Pr(T > s) ,
da die Menge {τ | τ > s+t} in der Menge {τ | τ > t} enthalten ist. Das zu erwartende
Zeitintervall bis zur nächsten Ankunft ist also unabhängig von der Vorgeschichte.
Erwartungswert und Varianz von T sind E(T) = 1/ λ und V(T) = 1/ λ2 .
Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 4 von 7
(3) → (1):
Nach (3) ist die Wahrscheinlichkeit dafür, dass in der Zeit zwischen t = 0 und t = dt
ein Klient erscheint,
Pr(0 ≤ T < dt) = F(dt) – F(0) = λ dt + O(dt 2) = λ dt + o(dt) ,
(4.5)
die, dass kein Klient erscheint,
Pr(T > dt) = e – λ dt = 1 – λ dt + O(dt 2) = 1 – λ dt +o(dt)
(4.6)
und, wegen der Unabhängigkeit der Zwischenankunftsintervalle, die, dass zwei oder
mehr Klienten erscheinen, gleich o(dt).
Wie gezeigt, ist ein exponentialverteilter Prozess "gedächtnislos". Es gilt aber auch
die Umkehrung:
Satz 2:
Für jeden (stetigen) Zufallsprozess mit der Dichtefunktion f(x) auf dem Intervall
]0,∞] und der Eigenschaft, dass für beliebige t, s ≥ 0 gilt:
(4.7)
Pr(T > s+t | T > t) = Pr(T > s) ,
folgt, dass ein λ > 0 derart existiert, dass f(x) = λ exp(-λ x) für alle x ≥ 0 ist.
Zum Beweis wird der folgende Hilfssatz aus der Analysis benötigt:
Lemma:
Sei G: ]0,∞] → ℝ eine stetige Funktion mit G(s+t) = G(s) G(t) für alle s, t ≥ 0.
G sei nicht die Nullfunktion. Dann gibt es ein λ ∈ ℝ so, dass G(t) = Gλ(t) =
exp(λ t) für alle t ≥ 0.
Zum Beweis des Lemmas vgl. etwa [3].
Beweis von Satz 2:
Aus (4.7) folgt zunächst wegen {ω ≥ s+t} ⊂ {ω ≥ t}, dass
Pr{ω ≥ s+t} = Pr{ω ≥ s} Pr{ω ≥ t}.
∞
Man setze nun G ( x) := ∫ f (t ) dt . Dann ist G eine stetige Funktion auf ]0,∞] mit den
x
aus den Voraussetzungen leicht ablesbaren Eigenschaften:
• G(0) = 1, G(x) ≥ 0 für alle x,
• G(s+t) = G(s) G(t) für alle s,t ≥ 0,
• G(t) → 0 für t → ∞ .
Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 5 von 7
Das Lemma garantiert, dass es wegen der zweiten Eigenschaft ein reelles α geben
muss, mit G(x) = exp(α x). Aufgrund der dritten Eigenschaft muss α = - λ mit λ > 0
sein, und der Hauptsatz der Differential- und Integralrechnung liefert direkt
G ' ( x) =
∞
d
dx
∫ f (t ) dt = − f ( x) = −λ exp(−λ x) ,
x
also f(x) = λ exp(-λ x), wie behauptet.
Als Beispiel für eine kompliziertere Fragestellung soll im folgenden die Verteilung
der Zufallsvariablen Vk hergeleitet werden, die die Zeit beschreibt, die bis zum Eintreffen von k unabhängigen, mit dem Parameter λ gleichverteilten Ereignissen vergeht.
Es ist Vk = T1 + T2 + …Tk und damit die Wahrscheinlichkeit Pr(Vk ≤ t) dafür, dass
mindestens Vk Ereignisse im Intervall [0,t] stattfinden, gleich
k −1
k −1
r =0
r =0
Gk (t ) = 1− ∑ Pr(r ; λ t ) =1− ∑ e
−λ t
(λ t ) r
.
r!
Die Dichtefunktion von Vk erhält man daraus durch Differentiation nach t zu
(4.8)
(λ t ) k −1 −λ t
g k (t ) = λ
e
(k − 1)!
t ≥ 0.
Eine weitere Frage ist die nach dem Maximum T von n mit dem Parameter λ exponential gleichverteilten k Zufallsvariablen T: = max{T1, T2, … Tk}. Gesucht wird also
die Wahrscheinlichkeit Pr(T ≤ b), für die aufgrund der Unabhängigkeit der Ti folgt,
dass
Pr(T ≤ b) = Pr(T1 ≤ b) Pr(T2 ≤ b) … Pr(Tk ≤ b)
ist. Damit wird
Pr(T ≤ b) = (1 − e − λ b ) k ,
und für die Dichtefunktion ϕ von T folgt als erste Ableitung
ϕ k(b) = k λ exp(-λ b) (1- exp(-λ b))k-1 .
Für k > 1 ist dieses Maximum mithin nicht exponentialverteilt. Der Erwartungswert
der Zufallsvariablen T = max{T1, T2, … Tk} wird in den Übungen berechnet.
Dagegen gilt für das Minimum voneinander unabhängiger exponential gleichverteilter Zufallsvariablen die Aussage:
Das Minimum von k unabhängigen mit λ exponential gleichverteilten Xi ist ebenfalls
exponentialverteilt mit dem Parameter kλ .
Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 6 von 7
Die folgenden Beispiele werden in den Übungen besprochen:
In einem Telefonnetz werde das Besetzen einer Leitung durch einen vollständig zufälligen Prozess mit der mittleren Wartezeit 1/λ = 10 Minuten modelliert. Damit
können z.B. leicht die folgenden Fragen beantwortet werden:
• B 1: Wie gross ist die Wahrscheinlichkeit, nach 5 Minuten eine freie Leitung
zu erhalten ?
• B 2: Wie lange muss ein Teilnehmer warten, um mit 80% Wahrscheinlichkeit
eine freie Leitung zu erhalten ?
• B 3: Kann der Teilnehmer davon ausgehen, dass seine Wartezeit bei wiederholten vergeblichen Anrufen geringer wird ?
• B 4: Angenommen, Sie kommen zu einer Telefonzelle, in der gerade jemand
telefoniert und noch 2 Leute vor Ihnen warten. Die mittlere Zeit eines Telefonats sei 1 Minute. Wie groß ist die Wahrscheinlichkeit, dass Sie noch höchstens 3 Minuten warten müssen ?
Weitere Beispiele:
• B 5: Berechnen Sie die LAPLACE-Transformation und Erwartungswert für die
Zufallsvariable Vk .
• B 6: Berechnen Sie den Erwartungswert von T: = max{T1 …Tk}.
• B 7: Unter der Annahme, der Abstand aufeinander folgender Fahrzeuge auf einer in einer Richtung befahrbaren Strasse folge einer exponentiellen Verteilung
mit einem Mittelwert von 100 Metern zwischen den Fahrzeugen, berechnen
Sie die Wahrscheinlichkeit dafür, dass sich in einem Bereich der Länge von 5
km zwischen 50 und 60 Fahrzeuge befinden.
• B 8: Unter der Annahme, der Verkehr auf einer Einbahnstrasse sei vollständig
zufällig mit einer Intensität von 30 Fahrzeugen pro Minute, berechnen Sie die
Wahrscheinlichkeit P dafür, dass n = 4 Fahrzeuge mehr als N = 10 Sekunden
benötigen, um eine Messstelle zu passieren.
Die Frage, ob eine real vorliegende Situation sinnvoll durch einen vollständig zufälligen Prozess modelliert werden kann, ist natürlich nicht allgemein zu beantworten.
Die Aussagen von Satz 1 zeigen, dass diese Annahme dann plausibel ist, wenn mit
einiger Sicherheit angenommen werden kann, dass der zugrunde liegende Prozess
gedächtnislos ist, also beispielsweise Ankunftswahrscheinlichkeiten nicht von vergangenen Vorgängen beeinflusst werden. Dies trifft häufig zumindest in erster Näherung zu (eine Exponentialverteilung für die Ankunft von Fahrzeugen an einer Stelle
im Strassenverkehr ist jedoch z.B. dann sicherlich nicht gerechtfertigt, wenn sich diese Stelle kurz hinter einer Ampelregelung mit festen Rot– und Grün–Zeitintervallen
befindet). Da gedächtnislose Prozesse mathematisch am einfachsten zu behandeln
Prof. Dr. Gerhard Berendt
SS 2006
Modellierung und Simulation von Warteschlangen
Arbeitsblatt 2 / S. 7 von 7
sind, werden wir uns zunächst auf solche beschränken und allgemeinere Prozesse erst
später behandeln.
Literatur zu 2., 3. und 4.:
[3]
E. Behrends, "Überall Zufall", BI Wissenschaftsverlag 1994, S. 148 ff.