Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 1 von 7 2. Stochastische Prozesse. Warteschlangen treten als Erscheinungsformen von in der Zeit ablaufenden Prozessen auf, von denen – wie oben erwähnt – mindestens einer nicht–deterministisch (stochastisch) ist. Wir können das System, in dem sich der Prozess abspielt, entweder kontinuierlich oder in gewissen diskreten Zeitabständen analysieren. Je nach dieser Wahl, müssen wir mithin einen diskreten oder kontinuierlichen stochastischen Prozess betrachten. Hierzu verwenden wir das Konzept der Zufallsvariablen. Definition 1: Eine Familie von Zufallsvariablen {Xt | t T} , die sich in zufälliger, aber wohl definierter Weise entwickelt, heisst ein stochastischer Prozess. T bezeichnet dabei häufig die (entweder kontinuierlich oder in diskreten Schritten) betrachtete Zeit. Ein stochastischer Prozess soll im folgenden als vollständig zufällig – kurz "zufällig" – bezeichnet werden, wenn (2.1) Pr(Xt+s= i | Xt= j; A) = Pr(Xt+s= i | Xt= j) für alle t, s gilt, wobei A ein beliebiges einfaches oder zusammengesetztes, in irgend einer Weise durch {Xr | r < t} bedingtes Ereignis ist und Pr die Wahrscheinlichkeit bezeichnet. Die angegebene Wahrscheinlichkeit ist mithin unabhängig von Ereignissen, die vor der Zeit t stattgefunden haben. 3. Eigenschaften von Warteschlangen. Die Struktur einer Warteschlange wird durch drei Faktoren bestimmt: – den Typ TA des Ankunftsmusters, – den Typ TB des Bedienungsmusters und – die Warteregel. Ankunfts– und/oder Bedienungsmuster sind stochastische Prozesse. Das Ankunftsmuster gibt an, in welchem zeitlichen Abstand die Klienten an dem Bedienungseingang erscheinen. Das Bedienungsmuster gibt an, wie der zeitliche Ablauf des Bedienungs– (Behandlungs–) Vorgangs abläuft. Hierzu gehört auch die Angabe der Anzahl der Bediener. Die Warteregel gibt an, nach welcher Regel die wartenden Klienten zur Bedienung ausgesucht werden. Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 2 von 7 Entsprechend diesen Charakteristika wird die Warteschlange in Kurzschreibweise in der Form (TA / TB / k) notiert, wobei k die Anzahl der Bediener angibt und die Token T als M : (Markov) – vollständig zufällige Verteilung, D : deterministische Verteilung (konstante Zeitintervalle), G : beliebige Verteilung angegeben werden. Mathematisch am einfachsten ist eine Warteschlange zu beschreiben, bei der die Klienten "vollständig zufällig" am Bedienungseingang auftauchen, die Bedienung durch einen Bediener erfolgt, die Bedienungsdauer ebenfalls "vollständig zufällig", und die Warteregel "First In First Out" (FIFO) ist (in der angegebenen Schreibweise also die Warteschlange (M / M / 1)). 4. Der "gedächtnislose" Ankunftsprozess. Der im folgenden formulierte Ankunftsprozess ist ein vollständig zufälliger stochastischer Prozess im Sinne der eingangs gegebenen Definition: Sei die mittlere Anzahl von Ankünften in der Zeiteinheit. Dann ist die Wahrscheinlichkeit dafür, dass im Zeitintervall zwischen t und t + dt ein Klient eintrifft, gleich dt + o(dt), die Wahrscheinlichkeit dafür, dass in diesem Zeitintervall kein Klient eintrifft, gleich 1 – dt + o(dt), und die Wahrscheinlichkeit dafür, dass in diesem Intervall zwei oder mehr Klienten eintreffen, gleich o(dt) 1 . Dazu zeigen wir zunächst: Satz 1: Für einen Ankunftsprozess sind die Bedingungen (1) Sei die mittlere Anzahl von Ankünften in der Zeiteinheit. Dann ist die Wahrscheinlichkeit dafür, dass im Zeitintervall zwischen t und t + dt ein Klient eintrifft, gleich dt + o(dt), die Wahrscheinlichkeit dafür, dass in diesem Zeitintervall kein Klient eintrifft, gleich 1 – dt + o(dt), (2) Die Anzahl der Ankünfte während einer Zeit ist eine Zufallsvariable N, die eine POISSON–Verteilung mit dem Parameter besitzt, 1 Die betrachteten Wahrscheinlichkeiten hängen also nur vom Zeitintervall dt ab und sind unabhängig von vorangegangenen Ereignissen Prof. Dr. Gerhard Berendt SS 2006 (3) Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 3 von 7 Das Zeitintervall zwischen der Ankunft zweier aufeinander folgender Klienten ist eine Zufallsvariable T, die eine Exponentialverteilung mit dem Parameter besitzt, äquivalent. Beweis: (1) (2): Das Intervall wird in m äquidistante Intervalle der Länge dt zerlegt; es ist also = m dt . Dann folgt aus (1) für die Wahrscheinlichkeit Pr(N = n) nach der Binomialverteilung (4.1) (4.2) m P ( N n) ( dt o(dt) ) n (1 dt o(dt) ) mn n n exp( ) n! im Limes m , dt 0 , m dt . Die Wahrscheinlichkeit dafür, dass die Anzahl der Ereignisse zur Zeit gleich n ist, ist mithin nur von abhängig: Pr(N=n) = Pr(n ; ) (zur Herleitung vgl. den Abschnitt A 1.6 aus Arbeitsblatt 1). Erwartungswert und Varianz von N sind E(N) = V(N) = . (2) (3): Seien f(t) und F(t) die Dichte– bzw. die Verteilungsfunktion der Zufallsvariablen T. Angenommen, ein Klient erscheine zu einem bestimmten Zeitpunkt, und wir messen die danach verstreichende Zeit t bis zur Ankunft des nächsten Klienten. Dann ist Pr(T > t) = Pr(kein Klient erscheint in (0,t)) = e t nach (2). Da jedoch Pr(T > t) = 1 – Pr(T t) = 1 – F(t) ist, folgt t F ( t ) 1 e ;t 0 , und damit (4.3) t f ( t ) F ( t ) e ;t 0 . Es folgt für beliebige t, s 0 : (4.4) Pr(T > s+t | T > t) = Pr(T > s) , da die Menge { | > s+t} in der Menge { | > t} enthalten ist. Das zu erwartende Zeitintervall bis zur nächsten Ankunft ist also unabhängig von der Vorgeschichte. Erwartungswert und Varianz von T sind E(T) = 1/ und V(T) = 1/ 2 . Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 4 von 7 (3) (1): Nach (3) ist die Wahrscheinlichkeit dafür, dass in der Zeit zwischen t = 0 und t = dt ein Klient erscheint, Pr(0 T < dt) = F(dt) – F(0) = dt + O(dt 2) = dt + o(dt) , (4.5) die, dass kein Klient erscheint, Pr(T > dt) = e – dt = 1 – dt + O(dt 2) = 1 – dt +o(dt) (4.6) und, wegen der Unabhängigkeit der Zwischenankunftsintervalle, die, dass zwei oder mehr Klienten erscheinen, gleich o(dt). Wie gezeigt, ist ein exponentialverteilter Prozess "gedächtnislos". Es gilt aber auch die Umkehrung: Satz 2: Für jeden (stetigen) Zufallsprozess mit der Dichtefunktion f(x) auf dem Intervall ]0,∞] und der Eigenschaft, dass für beliebige t, s 0 gilt: (4.7) Pr(T > s+t | T > t) = Pr(T > s) , folgt, dass ein > 0 derart existiert, dass f(x) = exp(- x) für alle x 0 ist. Zum Beweis wird der folgende Hilfssatz aus der Analysis benötigt: Lemma: Sei G: ]0,∞] → ℝ eine stetige Funktion mit G(s+t) = G(s) G(t) für alle s, t 0. G sei nicht die Nullfunktion. Dann gibt es ein ℝ so, dass G(t) = G(t) = exp( t) für alle t 0. Zum Beweis des Lemmas vgl. etwa [3]. Beweis von Satz 2: Aus (4.7) folgt zunächst wegen { s+t} { t}, dass Pr{ s+t} = Pr{ s} Pr{ t}. Man setze nun G ( x) : f (t ) dt . Dann ist G eine stetige Funktion auf ]0,∞] mit den x aus den Voraussetzungen leicht ablesbaren Eigenschaften: G(0) = 1, G(x) 0 für alle x, G(s+t) = G(s) G(t) für alle s,t 0, G(t) 0 für t ∞ . Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 5 von 7 Das Lemma garantiert, dass es wegen der zweiten Eigenschaft ein reelles geben muss, mit G(x) = exp( x). Aufgrund der dritten Eigenschaft muss = - mit > 0 sein, und der Hauptsatz der Differential- und Integralrechnung liefert direkt G ' ( x) d dx f (t ) dt f ( x) exp( x) , x also f(x) = exp(- x), wie behauptet. Als Beispiel für eine kompliziertere Fragestellung soll im folgenden die Verteilung der Zufallsvariablen Vk hergeleitet werden, die die Zeit beschreibt, die bis zum Eintreffen von k unabhängigen, mit dem Parameter gleichverteilten Ereignissen vergeht. Es ist Vk = T1 + T2 + …Tk und damit die Wahrscheinlichkeit Pr(Vk t) dafür, dass mindestens Vk Ereignisse im Intervall [0,t] stattfinden, gleich k 1 k 1 r 0 r 0 Gk (t ) 1 Pr(r ; t ) 1 e t ( t ) r . r! Die Dichtefunktion von Vk erhält man daraus durch Differentiation nach t zu (4.8) ( t ) k 1 t g k (t ) e (k 1)! t 0. Eine weitere Frage ist die nach dem Maximum T von n mit dem Parameter exponential gleichverteilten k Zufallsvariablen T: = max{T1, T2, … Tk}. Gesucht wird also die Wahrscheinlichkeit Pr(T b), für die aufgrund der Unabhängigkeit der Ti folgt, dass Pr(T b) = Pr(T1 b) Pr(T2 b) … Pr(Tk b) ist. Damit wird Pr(T b) (1 e b ) k , und für die Dichtefunktion von T folgt als erste Ableitung k(b) = k exp(- b) (1- exp(- b))k-1 . Für k > 1 ist dieses Maximum mithin nicht exponentialverteilt. Der Erwartungswert der Zufallsvariablen T = max{T1, T2, … Tk} wird in den Übungen berechnet. Dagegen gilt für das Minimum voneinander gleichverteilter Zufallsvariablen die Aussage: unabhängiger exponential Das Minimum von k unabhängigen mit exponential gleichverteilten Xi ist ebenfalls exponentialverteilt mit dem Parameter k . Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 6 von 7 Die folgenden Beispiele werden in den Übungen besprochen: In einem Telefonnetz werde das Besetzen einer Leitung durch einen vollständig zufälligen Prozess mit der mittleren Wartezeit 1/ = 10 Minuten modelliert. Damit können z.B. leicht die folgenden Fragen beantwortet werden: B 1: Wie gross ist die Wahrscheinlichkeit, nach 5 Minuten eine freie Leitung zu erhalten ? B 2: Wie lange muss ein Teilnehmer warten, um mit 80% Wahrscheinlichkeit eine freie Leitung zu erhalten ? B 3: Kann der Teilnehmer davon ausgehen, dass seine Wartezeit bei wiederholten vergeblichen Anrufen geringer wird ? B 4: Angenommen, Sie kommen zu einer Telefonzelle, in der gerade jemand telefoniert und noch 2 Leute vor Ihnen warten. Die mittlere Zeit eines Telefonats sei 1 Minute. Wie groß ist die Wahrscheinlichkeit, dass Sie noch höchstens 3 Minuten warten müssen ? Weitere Beispiele: B 5: Berechnen Sie die LAPLACE-Transformation und Erwartungswert für die Zufallsvariable Vk . B 6: Berechnen Sie den Erwartungswert von T: = max{T1 …Tk}. B 7: Unter der Annahme, der Abstand aufeinander folgender Fahrzeuge auf einer in einer Richtung befahrbaren Strasse folge einer exponentiellen Verteilung mit einem Mittelwert von 100 Metern zwischen den Fahrzeugen, berechnen Sie die Wahrscheinlichkeit dafür, dass sich in einem Bereich der Länge von 5 km zwischen 50 und 60 Fahrzeuge befinden. B 8: Unter der Annahme, der Verkehr auf einer Einbahnstrasse sei vollständig zufällig mit einer Intensität von 30 Fahrzeugen pro Minute, berechnen Sie die Wahrscheinlichkeit P dafür, dass n = 4 Fahrzeuge mehr als N = 10 Sekunden benötigen, um eine Messstelle zu passieren. Die Frage, ob eine real vorliegende Situation sinnvoll durch einen vollständig zufälligen Prozess modelliert werden kann, ist natürlich nicht allgemein zu beantworten. Die Aussagen von Satz 1 zeigen, dass diese Annahme dann plausibel ist, wenn mit einiger Sicherheit angenommen werden kann, dass der zugrunde liegende Prozess gedächtnislos ist, also beispielsweise Ankunftswahrscheinlichkeiten nicht von vergangenen Vorgängen beeinflusst werden. Dies trifft häufig zumindest in erster Näherung zu (eine Exponentialverteilung für die Ankunft von Fahrzeugen an einer Stelle im Strassenverkehr ist jedoch z.B. dann sicherlich nicht gerechtfertigt, wenn sich diese Stelle kurz hinter einer Ampelregelung mit festen Rot– und Grün– Zeitintervallen befindet). Da gedächtnislose Prozesse mathematisch am einfachsten Prof. Dr. Gerhard Berendt SS 2006 Modellierung und Simulation von Warteschlangen Arbeitsblatt 2 / S. 7 von 7 zu behandeln sind, werden wir uns zunächst auf solche beschränken und allgemeinere Prozesse erst später behandeln. Literatur zu 2., 3. und 4.: [3] E. Behrends, "Überall Zufall", BI Wissenschaftsverlag 1994, S. 148 ff.