Diskrete Strukturen (WS 2009/10)

Werbung
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
6: Diskrete Wahrscheinlichkeit
6: Diskrete Wahrscheinlichkeit
– 219 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Wahrscheinlichkeitsrechnung
Eines der wichtigsten mathematischen Werkzeuge für
Informatiker (Analyse probabilistischer Algorithmen,
Zuverlässigkeit eines Systems, . . . )
I Diskrete Wahrscheinlichkeit als besonders einfacher Fall
(im Gegensatz zur kontinuierlichen Wahrscheinlichkeit)
1. Einige Grundbegriffe (z.B. was ist “Wahrscheinlichkeit”?)
2. Secret Sharing bzw. Verschlüsselung mit “perfekter
Sicherheit”
3. Neuer Blick auf den Diffie-Hellman Schlüsselaustausch
Wie berechnet man Diskrete Logarithmen möglichst
effizient? (Oder: Warum verlangen wir q > 2160 ?)
I
6: Diskrete Wahrscheinlichkeit
– 220 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 221 –
6.1: Grundbegriffe
Definition 91
Ein diskreter Wahrscheinlichkeitsraum besteht aus
I der Menge der Elementarereignisse, einer abzählbaren
Menge Ω, zusammen mit
I der Wahrscheinlichkeitsverteilung, einer Funktion
X
Pr : Ω → R≥0 , mit
Pr(x) = 1.
x∈Ω
Dabei bezeichnet R≥0 die Menge aller reellen Zahlen ≥ 0.
In diesem Kapitel benutzen wir den Bezeichner Ω stets für eine
abzählbare Menge von Elementarereignissen und Pr für die
zugehörige Wahrscheinlichkeitsverteilung.
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Beispiele (Würfel)
I
I
I
Fairer Würfel (“Laplace-Würfel”):
Ω = {1, 2, 3, 4, 5, 6}, ∀x ∈ Ω : Pr[x] = 1/6.
Würfel mit Bleigewicht unter der 1:
Ω = {1, 2, 3, 4, 5, 6},
Pr[2] = Pr[3] = Pr[4] = Pr[5] = 1/6, Pr[6] = 3/9.
Was ist Pr[1]?
Wie wahrscheinlich ist es, eine gerade Zahl zu
würfeln?
Fairer Würfel mit manipulierten Augenzahlen
2,3,4,5,6,6:
Ω = {1, 2, 3, 4, 5, 6},
Pr[1] = 0, Pr[2] = Pr[3] = Pr[4] = Pr[5] = 1/6,
Pr[6] = 1/3.
6: Diskrete Wahrscheinlichkeit
6.1:
– 222 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 223 –
Ereignisse und ihre Wahrscheinlichkeit
Definition 92
Die Elemente von Ω sind die Elementarereignisse,
alle Teilmengen von Ω sind Ereignisse,
und die Wahrscheinlichkeit Pr[E] eines Ereignisses E ⊆ Ω ist
X
Pr[E] =
Pr(x).
x∈E
Das Ereignis {} ist das unmögliche und Ω selbst ist das sichere
Ereignis.
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Beispiel: Gleichverteilung
(“Laplace-Verteilung”)
Sei Ω endlich. Sind alle Elementarereignisse gleich
wahrscheinlich, dann ist ∀x ∈ Ω : Pr[x] = 1/|Ω|.
Ferner gilt für alle Ereignisse E ⊆ Ω:
Pr[E] =
|E|
.
|Ω|
Konkretes Beispiel:
Fairer (“Laplace”-) Würfel
(kennen wir schon).
Ω = {1, 2, 3, 4, 5, 6},
∀x ∈ Ω : Pr[x] = 1/6, Pr[{2, 4, 6}] = 1/2.
6: Diskrete Wahrscheinlichkeit
6.1:
– 224 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Eigenschaften der Wahrscheinlichkeit
Satz 93 (Monotonie der Wahrscheinlichkeit)
Sei A ⊆ B ⊆ Ω. Dann gilt
Pr[A] ≤ Pr[B].
Satz 94 (Additivität der Wahrscheinlichkeit)
Seien A, B ⊆ Ω. Dann gilt
Pr[A ∪ B] = Pr[A] + Pr[B] − Pr[A ∩ B].
6: Diskrete Wahrscheinlichkeit
6.1:
– 225 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 226 –
Folgerungen
Seien A ein Ereignis. Dann gilt:
0 ≤ Pr[A] ≤ 1.
Sind die Ereignisse A und B disjunkt, also A ∩ B = {}, dann gilt
Pr[A ∪ B] = Pr[A] + Pr[B].
Seien A ⊆ Ω. Dann gilt
Pr[A] = 1 − Pr[A].
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 227 –
Beispiel: Mehrere Würfe mit einem Würfel
I
I
I
Man werfe den “fairen” 2,3,4,5,6,6-Würfel zweimal.
Nun ist Ω = {(1, 1), (1, 2), . . . , (6, 6)}
(Beachte: (i, j) heißt “zuerst i, dann j gewürfelt”)
für i 6= j ist (i, j) 6= (j, i)!)
Pr[(1, 1)] = · · · = Pr[(1, 6)] = 0, Pr[(2, 3)] = 1/36, . . .
Was ist Pr[(3, 6)]?
Was ist Pr[(i, i)] für i ∈ {2, . . . , 6}?
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 228 –
Zwei unabhängige Ereignisse
Definition 95
Zwei Ereignisse A, B ⊆ Ω heißen (stochastisch) unabhängig,
wenn
Pr[A ∩ B] = Pr[A] ∗ Pr[B]
gilt. Andernfalls heißen sie (stochastisch) abhängig.
Beispiel: Laplace-Würfel.
E1 = {2, 3}
E2 = {3, 5}
E3 = {2, 3, 4}.
E4 = {1, 2, 3}.
6: Diskrete Wahrscheinlichkeit
6.1:
I
I
Es gibt 6 Paare von Ereignissen
(E1 , E2 ), (E1 , E3 ) . . . , (E3 , E4 ).
Welche dieser Paare sind
unabhängig, welche nicht?
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 229 –
Das Zwei-Würfel Experiment
Wir haben zwei “faire” Würfel, 1,1,2,3,4,5 und 2,3,4,5,6,6. Wir
wählen zufällig einen der beiden Würfel und würfeln.
Es ist Ω = {1, 2, . . . , 6}, und für alle x ∈ Ω ist Pr[x] = 1/6.
(Nachrechnen!)
Nun würfeln wir zweimal. Also ist Ω = {1, 2, . . . , 6}2 . Sei X das
Ereignis, dass wir im ersten Wurf eine 6 werfen, Y das Ereignis,
dass wir im zweiten Wurf eine 6 werfen.
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 230 –
Das Zwei-Würfel Experiment (2)
Wenn wir für beide Würfel den gleichen (zuvor zufällig
gewählten) Würfel wählen, dann sind X und Y abhängig.
(Nachrechnen!)
Wenn wir dagegen den Würfel nach dem ersten Wurf
zurücklegen und vor dem zweiten Wurf wieder zufällig einen der
beiden Würfel wählen, dann sind X und Y unabhängig.
(Nachrechnen – auch wenn es offensichtlich erscheint!)
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 231 –
Bedingte Wahrscheinlichkeit
Definition 96
Seien A und B zwei Ereignisse mit Pr[B] > 0. Die bedingte
Wahrscheinlichkeit Pr[A|B], dass das Ereignis A unter der
Bedingung B eintritt, ist
Pr[A|B] =
Pr[A ∩ B]
.
Pr[B]
Beispiel: Das Zwei-Würfel-Experiment (ohne Zurücklegen),
X : “Beim ersten Wurf eine 6”, Y : “Beim zweiten Wurf eine 6”.
Man rechne Pr[X |Y ] aus!
Satz 97
Zwei Ereignisse A, B ⊆ Ω sind unabhängig, genau dann, wenn
Pr[A|B] = Pr[A].
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 232 –
Beispiel: Eine Familie mit zwei Kindern
Wir besuchen eine Familie, von der wir wissen, dass sie zwei
Kinder hat. An der Tür werden wir von einem der beiden Kinder
begrüßt. Es ist ein Junge.
Wie wahrscheinlich ist es, dass das andere Kind auch ein Junge
ist?
(Dabei sei es gleich wahrscheinlich, dass ein Kind als Junge
geboren wird, oder als Mädchen. Insbesondere sei dieses
Ereignis unabhängig vom Geschlecht der anderen
Geschwister.)
6: Diskrete Wahrscheinlichkeit
6.1:
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Eigenschaften der bedingten
Wahrscheinlichkeit
Satz 98 (Multiplikationssatz für Wahrscheinlichkeiten)
Pr[A ∪ B] = Pr[B] ∗ Pr[A|B].
Satz 99 (Bayes)
Seien A, B ⊂ Ω Ereignisse mit Pr[A] > 0 < Pr[B]. Dann gilt:
Pr[A|B] =
6: Diskrete Wahrscheinlichkeit
6.1:
Pr[A]
∗ Pr[B|A].
Pr[B]
– 233 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 234 –
6.2: Perfekt sichere Verschlüsselung
Szenario:
I
I
I
I
M ∈ {0, 1}n : vertrauliche Nachricht
C = EK (M): Chiffretext (Verschlüsselung von M unter
einem geheimen Schlüssel K )
“Angreifer” kennt C, aber weder M noch K
Legaler Empfänger kennt K , erfährt C und berechnet
M = DK (C) durch Entschlüsselung von C unter K
Idee
Ein Verschlüsselungssystem heißt perfekt, falls der “Angreifer”
aus dem Chiffretext “nichts über M erfährt, was er nicht sowieso
schon weiß”.
6: Diskrete Wahrscheinlichkeit
6.2: Perfekt sichere Verschlüsselung
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Von der Idee zur formalen Definition
Definition 100
Ein Verschlüsselungssystem heißt perfekt, falls für den
“Angreifer” und für alle Nachrichten M ∈ {0, 1}n und alle
Chiffretexte C gilt:
Pr[“M”|“C”] = Pr[“M”].
(Achtung: Etwas missbräuchliche Notation! Für M ∈ {0, 1}n
bezeichnet “M” das Ereignis, dass der Sender diese Nachricht
verschickt. Ebenso für Chiffretexte “C” und Schlüssel “K ”.)
Das Shamir Secret Sharing kann man als perfektes
Verschlüsselungssystem auffassen. Wir betrachten im
folgenden ein einfacheres Beispiel.
6: Diskrete Wahrscheinlichkeit
6.2: Perfekt sichere Verschlüsselung
– 235 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Die Vernam-Chiffre
(“One-Time Pad”, Vernam, 1917)
I
I
I
I
M ∈ {0, 1}n : vertrauliche Nachricht
Schlüssel K ∈ {0, 1}n , gleichverteilt
Chiffretext C ∈ {0, 1}n : C = M ⊕ K .
Entschlüsselung: M = C ⊕ K .
Satz 101 (Shannon, 1949)
Die Vernam-Chiffre ist perfekt.
6: Diskrete Wahrscheinlichkeit
6.2: Perfekt sichere Verschlüsselung
– 236 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 237 –
Perfekte Verschlüsselung ist in der Praxis
eine seltene Ausnahme
Satz 102
Bei jedem perfekten Verschlüsselungssystem muss der
Schlüssel mindestens so lang sein, wie die Nachricht.
Werden mehrere Nachrichten verschlüsselt, muss der Schlüssel
mindestens so lang sein, wie die Längen aller Nachrichten
zusammen.
(Ohne Beweis)
6: Diskrete Wahrscheinlichkeit
6.2: Perfekt sichere Verschlüsselung
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
6.3: Das Geburtstagsparadoxon
Wie wahrscheinlich ist
es, dass von 23 Leuten
auf einem Fußballfeld
(beide Teams und der
Schiedsrichter) zwei am
gleichen Tag
Geburtstag haben
Etwa 50.7 %. Überrascht?
hhttp://de.wikipedia.org/wiki/Geburtstagsparadoxoni
6: Diskrete Wahrscheinlichkeit
6.3: Das Geburtstagsparadoxon
– 238 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Wie rechnet man das aus?
I
I
n ≤ 365 Bälle, die jeweils zufällig in einen
von 365 Körben geworfen werden.
Die Wahrscheinlichkeit pn , dass von n
Bällen in jedem Korb höchstens ein Ball ist:
I
I
I
I
I
p1 = (365/365) = 1
p2 = (364/365)
p3 = (364/345) ∗ (363/365)
p4 = (364/345) ∗ (363/365) ∗ (362/365)
...
Y 365 − i
.
pn =
365
0≤i<n
I
Die Wahrscheinlichkeit, dass in mindestens
einem Korb mehr als ein Ball liegt, ist
natürlich 1 − pn , siehe Tabelle.
6: Diskrete Wahrscheinlichkeit
6.3: Das Geburtstagsparadoxon
– 239 –
Anz.
1
2
3
4
..
.
1 − pn
0.0000
0.0027
0.0082
0.0164
..
.
20
21
22
23
24
25
26
27
28
0.4114
0.4437
0.4757
0.5073
0.5383
0.5687
0.5982
0.6269
0.6545
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
Verallgemeinerung des
Geburtstagsproblems
I
I
k Körbe und (wie bisher) n ≤ k Bälle.
Die Wahrscheinlichkeit, dass Bälle in verschiedenen
Körben landen:
Y k−i
.
pn =
k
0≤i<n
I
I
Für “große” k erwartet man eine Kollision (zwei Bälle im
gleichen Korb) bei
r
π √
n=
∗ k
2
p
(ohne Beweis). Es ist π2 ≈ 1.25.
√
p
Ist n = c ∗ π2 ∗ k, dann ist die erwartete Anzahl an
Kollisionen c2 .
6: Diskrete Wahrscheinlichkeit
6.3: Das Geburtstagsparadoxon
– 240 –
Stefan Lucks
Diskrete Strukturen (WS 2009/10)
– 241 –
Warum ist das für die Informatik relevant?
I
I
I
I
Die Effizienz vieler probabilistischer Algorithmen hängt eng
mit der Anzahl an “zufälligen Kollisionen” zusammen.
Uns schon bekannt ist das Problem des Diskreten
Logarithmus: (→ Diffie-Hellman Schlüsselaustausch):
Seien ein erzeugendes Element g einer (zyklischen)
Gruppe der Ordnung q und x = g y gegeben, gesucht ist y.
Es gibt Algorithmen zur Berechnung des Diskreten
Logarithmus, die mit
q
√
π
∗ q Rechenschritten
2
auskommen (Berechne viele g i ∗ x j , → Tafel).
Warum verlangen wir für den D.-H. Schlüsselaustausch
q > 2160 ? Wir wollen Angreifer zwingen, mindestens 280
Rechenschritte durchzuführen – in der Erwartung, dass sie
diese Rechenleistung nicht aufbringen können.
6: Diskrete Wahrscheinlichkeit
6.3: Das Geburtstagsparadoxon
Herunterladen