3 Lineare Dualitätstheorie. Heuristik

Werbung
25
3
Lineare Dualitätstheorie. Heuristik
3.1
Ein paar Vorbemerkungen
Ziel: Informationen über Z finden.
3.1.1
Die Grundobjekte der Funktionalanalysis
Mengen mit Struktur
Abbildungen
Funktionen
Funktionale
a ∈ A, b ∈ B
X = {f : A −
→ B}, b = f (a)
Operatoren
M : X−
→ X, g = Mf
Alles noch mal für reelle Zahlen
z ∈ Z, x ∈ R C(Z) = {g : Z −
→ R}, x = g(z) M : C(Z′ ) −
→ C(Z)
′
′
′
′
′
z ∈ Z , y ∈ R C(Z ) = {f : Z −
→ R}, y = f (z )
g = Mf
Die Funktionalanalysis beschäftigt sich mit drei Objekten: Mengen X und Y, Funktionen
f die zwischen diesen Mengen wirken und in einem Funktionenraum M(X, Y) liegen, in dem
Operatoren A Funktionen auf Funktionen abbilden, die wiederum in einem Operatorenraum
liegen können.
X
❄
f∈
Y
M(X, Y)
❄
A ∈ L(M, M′ )
M′ (X′ , Y′ )
✎☞
1
✍✌
✎☞
2
✍✌
✎☞
3
✍✌
Jede Zusammenfassung von neuen Objekten in Mengen erhöht einerseits die Abstraktionsstufe und damit den Kompliziertheitsgrad, läßt sich aber andererseits stets als
Wirken von Funktionen zwischen Mengen
betrachten. Da diese neuen Mengen meistens
aber mit anderen Methoden untersucht werden müssen ist es sinnvoll, zwischen Funktionen und Operatoren zu unterscheiden, obwohl das nicht prinzipiell ist. Die einzelnen
Teilgebiete der Funktionalanalysis unterscheiden sich darin, welche Strukturen in den Mengen
definiert oder welche Funktionen aus der Menge aller denkbaren Funktionen ausgewählt werden.
26
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
3.1.2
Mengen mit Strukturen. Kanonische Objekte
Werden Mengen aufeinander abgebildet, werden vorhandene Strukturen übertragen. Wir betrachten zwei Mengen A und B, und die Menge X = X(A, B) aller Abbildungen f : A −
→B
und untersuchen drei Typen von Strukturen:
• algebraische Struktur (B, ∗)
Man definiert eine binäre Abbildung B × B −
→ B.
• Ordnungsstruktur (B, ≤)
Man markiert eine Teilmenge des Kreuzproduktes ... ⊂ B × B.
• topologische Struktur (B, τB )
Man markiert eine Menge von Teilmengen und nennt sie offen OB ⊂ 2B .
Durch Funktionen f ∈ X werden diese Strukturen übertragen, d.h. es werden entsprechende
Strukturen induziert.
• algebraische Struktur: Von B nach X
(f ∗ g)(a) = f (a) ∗ g(a), a ∈ A
X sollte abgeschlossen sein bezüglich dieser Operation.
• Ordnungsstruktur: Von B nach X
f ≤ g ⇐⇒ f (a) ≤ g(a), a ∈ A
Sinnvoll ist es, Das schränkt die Menge X nicht ein. Wenn es aber bereits eine natürliche
Ordnungsstruktur auf X gibt, sollten beide Strukturen zusammenfallen.
• topologische Struktur: Von B nach A (Initialtopologie)
OA = {f −1 (U) | U ∈ OB , f ∈ X}
X ist dann die Menge der stetigen Abbildungen A −
→ B. Hier gibt es also zwei Möglichkeiten: Wir definieren in A und B eine Topologie und betrachten nur stetige Abbildungen,
oder wir gehen von einer Topologie in B aus und definieren uns eine Topologie in A mithilfe einer Menge von Funktionen, die wir für geeignet halten. Genau genommen wird so
nur eine Subbasis der Topologie in A definiert.
Eine häufig verwendete sehr erfolgreiche Idee in der Funktionalanalysis (und auch anderswo) ist
es, die Eigenschaften einer Menge unbekannter Elemente zu ermitteln, indem die Abbildungen
dieser Menge in eine Menge mit einer vielfältigen bekannten Struktur betrachtet werden. Eine
besonders vielfältige Struktur haben die reellen Zahlen (lineare Ordnung, zwei algebraische
Operationen und eine Topologie). Wir werden deshalb den Zustandraum mit Hilfe reellwertiger
Abbildungen untersuchen.
3.2 Der Zustandsraum Z als Menge
3.2
27
Der Zustandsraum Z als Menge
In den betrachteten Beispielen kamen verschiedene Varianten des Zustandsraumes vor. Als
Menge war der Zustandsraum
• eine endliche Mengen
• eine abzählbare Mengen
• ein Kontinuum
Oft hat der Zustandsraum bereits eine natürliche Struktur (z.B. wenn er ein Gebiet im Rn ist),
auf die zurückgegriffen werden sollte. Das sind aber spezielle Strukturen, die nur für spezielle
Aufgaben interessant sind. Wir werden im weiteren die lineare Dualitätstheorie rein formal so
entwickeln, wie sie sich kanonisch allein aus der Tatsache, daß wir ein physikalisches System
beschreiben wollen ergibt.
Wir werden keine neuen Definitionen einführen sondern nur die Eigenschaften der kanonischen
Objekte beschreiben. Das hat den Vorteil, daß man sich nicht mit technischen Problemen
aufhalten muß und sich ganz auf die Eigenschaften der Objekte konzentrieren kann.
Als Ergebnis erhält man einen mathematischen Rahmen, dem man einen physikalischen Sinn
geben. Allerdings werden wir feststellen, daß alles nur im Fall Z eine endliche Menge ist, mathematisch einwandfrei ist. Die nächste Aufgabe ist dann, künstlich Änderungen derart vorzunehmen, daß auch abzählbare Mengen und Kontinua in diesem Rahmen beschrieben werden
können.
Ist Z eine abstrakte Menge, gibt es in Z nichts kanonisches als die Menge der Teilmengen (auch
Potenzmenge genannt) von Z. Wir bezeichnen diese Potenzmenge mit 2Z .
In 2Z gibt es eine kanonische Ordnungsstruktur (⊂), eine algebraische Struktur (⊔ und ∩) und
eine Verbandstruktur (∪ und ∩).
3.3
3.3.1
Der duale Raum Z∗. Beobachtungen
Funktionen als Funktionale. Der duale Raum
Da es auf Z a-priori keine Struktur gibt, ist ein Funktional auf Z also erstmal eine beliebige
reellwertige Funktion auf Z, die für jedes z ∈ Z einen definierten Wert annimmt. Wir bezeichnen
diese Menge mit
Z∗ = {f : Z −
→ R}
Später werden wir in Z eine geeignete Struktur festlegen und nur solche Funktion betrachten,
die diese Struktur erhalten. Damit wird sich diese Menge einschränken.
Ein Element aus f ∈ Z∗ , angewendet auf z ∈ Z ist f (z). Z∗ wird der zu Z duale Raum genannt.
Meinstens wird für diese Objekte der Begriff “Funktion” und nicht der Begriff “Funktional”
verwendet.
3.3.2
Z∗ als linearer Raum
Die vielfältige Struktur von R überträgt sich auf Funktionen von Z nach R also auf Z∗ . Dank
der algebraischen Strukturen in R können wir endliche Linearkombinationen von Funktionen
bilden. Sind fi ∈ Z∗ , sind für alle reellen αi auch
n
X
f=
αi fi ∈ Z∗
i=1
28
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
da wohlPdefiniert ist, welchen Wert f an einer beliebigen Stelle z ∈ Z annimmt, nämlich
f (z) = ni=1 αi fi (z).
Wie in jedem linearen Raum ist die Funktion, die konstant 0 ist enthalten, 0 ∈ Z.
3.3.3
Ordnung und Positivität
Die Ordnungsstruktur in R generiert auf kanonische Weise eine Halbordnung in Z∗ :
f ≥ g ⇐⇒ f (z) ≥ g(z), z ∈ Z
Der Begriff der Ordnung in einem linearen Raum ist äquivalent mit dem Begriff der Positivität.
Wir schreiben f ≥ 0.
3.3.4
Z∗ als kommutative Algebra
Die Multiplikation in R generiert die Struktur einer kommutativen Algebra ist Z mit der punktweisen Multiplikation:
h = f · g ⇐⇒ h(z) = f (z) · g(z), z ∈ Z
3.3.5
Beschränkte Funktionen als konvexe Menge
Wir nennen eine Funktion f beschränkt, wenn es zwei reelle Zahlen α und β ≥ α mit
α1 ≤ f ≤ β 1
gibt. Zu so einer Funktion können wir eine skalierte Funktion
f˜ =
1
(f − α1)
β−α
definieren, die “affin äquivalent” ist zu f . Im weiteren sei
α = inf f (z), β = sup f (z)
z
z
Wenn wir alle beschränkten Funktionen mit derselben skalierte Funktion f˜ als identisch auffassen, reicht es Funktionen zu betrachten, die die Ungleichung
0≤f ≤1
erfüllen. Wir bezeichnen diese Menge mit
R = {f ∈ Z∗ | 0 ≤ f ≤ 1}
Offensichtlich ist R eine konvexe Menge.
Bemerkung: Die Funktion f˜ “berühert” die 0- und 1- Linie. In R liegen aber auch Funktionen,
die strikt zwischen 0 und 1 liegen.
3.3 Der duale Raum Z∗ . Beobachtungen
3.3.6
29
Niveaumengen (level sets)
Zu einer Funktion f : Z −→ R können wir den Wertebereich R(f ) ⊂ x auf die übliche Art
definieren.
Zu jeder Funktion läßt sich auf die übliche Weise eine “inverse Funktion” f −1 definieren:
f −1 (x) = {z ∈ Z|f (z) = x} ⊂ Z, x ∈ R(f )
f −1 (x) = ∅, x ∈ R(f )
Diese Funktion wird “inverse Funktion” genannt, obwohl ihr Wertebereich ein anderer ist als
der Definitionsbereich von f . Es ist f −1 : R −
→ 2Z . Eigentlich müßte hier ein anderes Symbol als
−1
f eingeführt werden. Wir verzichten darauf, weil das unüblich ist. f −1 (x) heißt Niveaumenge
von f zum Wert x.
f −1 ist auf R(f ) eineindeutig: x 6= y ⇐⇒ f −1 (x) 6= f −1 (y). Deshalb zerlegt jede Funktion
seinen Definitionsbereich Z in Äquivalenzklassen.
f −1 erhält die Mengenoperationen ∪ und ∩.
3.3.7
Charakteristische Funktionen
Die betrachteten Funktionen haben Werte im Zahlenkörper R. Anstelle von R könnte man andere Körper betrachten (was wir nicht tun werden). Deshalb sind besonders solche Funktionen
interessant, die es für jedem Körper gibt, daß sind Funktionen, die nur die Werte 0 und 1 annehmen (diese beiden Zahlen gibt es in jedem Körper). Solche Funktionen sind für gewisse Punkte
z einer Menge A gleich 1 und für alle anderen Werte 0. Das sind gerade die charakteristischen
Funktionen.
Jeder Teilmenge A ∈ 2Z können wir eine charakteristische Funktion 1A durch 1A (z) = 1 falls
z ∈ A, 1A (z) = 0 falls z ∈ Z \ A.
Umgekehrt können wir jeder Funktion g auf Z, die nur die Werte 0 oder 1 annimmt, mit
A = g −1 (1) eine Teilmenge aus Z zuordnen.
Damit haben wir eine 121-Abbildung (121 bedeutet eineindeutig, aus dem englischen: one-toone) der Teilmengen von Z in eine wohl definierte Teilmenge von Z∗ erhalten. Wir können
1A , die Bilder von A, mit A selbst dank dieser Einbettung identifizieren. Z∗ enthält also die
Teilmengen von Z. Wir können uns Z∗ damit als Verallgemeinerung des Begriffs der Teilmenge
vorstellen.
Die kanonische Struktur in 2Z überträgt sich auf die Menge der charakteristischen Funktionen.
Insbesondere sind Produkte, Summen und Suprema von charakteristische Funktionen Operationen mit Teilmengen von Z und ebenfalls Teilmengen.
Operationen und Relationen zwischen Mengen übertragen sich auf Operationen zwischen Zahlen
(A ⊔ B bedeutet Vereinigung disjunkter Mengen, also A ∪ B falls A ∩ B = ∅):
A⊂B
C =A∩B
C =A⊔B
C =A∩B
C =A∪B
⇐⇒
⇐⇒
⇐⇒
⇐⇒
⇐⇒
1A ≤ 1B
1C = 1A · 1B
1C = 1A + 1B
1C = inf{1A , 1B } = min{1A , 1B }
1C = sup{1A , 1B } = max{1A , 1B }
Die definierte 121-Abbildung
1A ←→ A ∈ 2Z ⊂ Z∗ = {f : Z −
→ R}
30
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
erhält also die Ordnungsrelation, die algebraischen Operationen und die Verbandstruktur.
Bei der speziellen charakteristischen Funktion 1Z lassen wir in Zukunft den Index weg und
schreiben einfach 1. Das ist die konstante 1-Funktion.
1∅ ist die konstante 0-Funktion.
3.3.8
Linearkombinationen charakteristischer Funktionen
Die vielfältige Struktur von R überträgt sich auf Funktionen von Z nach R also auf Z∗ . Dank der
algebraischen Strukturen in R können wir Linearkombinationen der charakteristischen Funktionen bilden, etwa
f=
n
X
αi 1Ai
(9)
i=1
Diese Funktionen sind aus der Theorie des Lebesgueintegrals gut bekannt und heißen einfache
Funktionen. Offensichtlich nimmt so eine Funktion nur endliche viele Werte an. Sie wird häufig
stückweise konstante Funktion genannt (genauer wäre es so eine Funktion als Funktion mit
endlichem Wertebereich zu bezeichnen). Es gilt
R(f ) = {f (z1 ), ..., f (zm )}
mit gewissen zi ∈ Z und m ≥ n. Die Mengen f −1 f (zi ) sind disjunkt und zerlegen Z. Wir
werden deshalb im weiteren stets Darstellungen der Form (9) betrachten, für die die Ai eine
disjunkte Zerlegung von Z bilden:
!
n
n
G
[
Ai = Z, heißt
Ai = Z, Ai ∩ Aj = ∅, i 6= j
i=1
i=1
und zi ∈ Ai liegt. Es gilt
Ai = f −1 f (zi )
(10)
Wir können die αi näher bestimmen: Wenden wir f in der Form (9) auf ein zj an, erhalten wir
f (zj ) =
n
X
αi 1Ai (zj ) =
i=1
n
X
αi δij = αj
i=1
mit dem Kroneckersymbol δij = 1Ai (zj ). Damit gilt
f=
n
X
i=1
f (zi )1Ai , zi ∈ Ai
(11)
Die Ai sind die Niveaumengen der Funktion f . Mit (10) erhalten wir aus (11)
f=
n
X
i=1
f (zi )1Ai =
n
X
i=1
f (zi )1f −1 (f (zi )) =
X
x∈R
x · 1f −1 (x)
(12)
wobei im letzten Schritt x = f (zi ) gesetzt wurde. Die Summe läßt sich über ganz R ausdehnen,
da 1f −1 (x) = 1∅ = 0 für x 6∈ R(f ).
3.3 Der duale Raum Z∗ . Beobachtungen
31
Diese Schreibweise ist für Funktionen mit endlich vielen Werten sogar exakt. Sie ist eine Darstellung, die sich auf allgemeinen Funktionen veralgemeinern läßt, wenn man der Summe in
(12) einen Sinn geben kann.
Die Darstellung (11) erinnert an die aus der linearen Algebra bekannte Zerlegung bezüglich
einer Basis. Hier wären die Basiselemente die charakteristischen Funktionen 1A . Die charakteristischen Funktionen könnte man als kanonische Basis bezeichnen. Ein einfaches Beispiel
zeigt, daß sie im allgemeinen nicht die Basis von Z∗ als linearer Raum sein können. Ist Z eine
endliche n-Menge, dann ist Z∗ = Rn . Die Basis besteht also aus n Elementen. Es gibt in Z aber
2n Teilmengen und damit auch 2n charakteristische Funktionen.
Die charakteristischen Funktionen sind allerdings genau die extremalen Elemente von R. Wir
bezeichnen sie mit
Re = 1A ∈ Z∗ | A ∈ 2Z
Die konvexe Kombination von Elementen aus Re ergeben Elemente aus R, im allgemeinen leider
nicht alle. Das wäre eine besonders wünschenswerte Eigenschaft der Menge R. Es würde
Re = extr R , Re ∼ 2Z
R = conv Re
gelten. Die charakteristischen Funktionen könte man damit als “Basis” für R bezeichnen,
bezüglich derer man alle Elemente der konvexen Menge als konvexe Kombination von “Basiselementen” darstellen kann. Wenn Z eine endliche Menge ist, gilt dieser Zusammenhang.
Allerdings ist diese Darstellung im allgemeinen nicht eindeutig (siehe die Beispiele weiter hinten).
3.3.9
Positivität charakteristischer Funktionen
Offensichtlich ist 1A ≥ 0. Hieraus folgt für endliche Linearkombinationen, daß f ≥ 0 ⇐⇒
fi ≥ 0.
3.3.10
Physikalische Bedeutung von Z∗
Jede Beobachtung hat eine physikalische Bedeutung. Z.B. bedeutet 1A (z), wir testen, ob z ∈ A,
d.h., ob sich das phys. System in einem Zustand aus A befindet.
P
Linearkombinationen von charakteristischen Funktionen i αi 1Ai kann man als verfeinerte Beobachtungen betrachten, die ermöglichen, die Zugehörigkeit des Zustandes zu Mengen gleichzeitig zu beobachten. Das erfordert aber, daß man die αi gut unterscheiden kann.
Beobachtungen verhalten sich wie intensive Größen. Von solchen Größen wissen wir, daß sie
sich nicht eindeutig reellen Zahlen zuordnen lassen. Zwei verschiedene Darstellungen sind aber
durch affine Transformation (Verschiebung und Skalierung) inneinander überführbar. Das heißt,
es reicht aus, Beobachtung aus der konvexen Menge
R = {f ∈ Z∗ | 0 ≤ f ≤ 1}
zu betrachten. Allerdings ist das keine echte Faktorisierung bezüglich affiner Transformationen,
da in R nach wie vor affin äquivalente Beobachtunen liegen, z.B. 1 und 12 1 .
32
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
Der biduale Raum Z∗∗. Statistische Zustände
3.4
Mit Z∗ könnte man sich zufriedengeben, wir haben Abbildungen unserer physikalischen Zustände
in die reellen Zahlen. Aber irgendein Mathematiker kam mal auf die Idee das ganze noch mal
zu machen. Vielleicht hat er gedacht: “Wenn ich mit Funktionen Information aus meiner Menge
ans Licht bringen kann, dann kann ich vielleicht mit weiteren Funktionalen Informationen über
die Funktionen ans Licht bringen.
Z∗ ist wieder eine Menge. Sie enthält aber die durch die algebraische Struktur der reellen
Zahlen induzierte Struktur eines linearen Raumes. Wir betrachten deshalb auf Z∗ nur lineare
Funktionale.
Wir bezeichnen mit
Z∗∗ = {p : Z∗ −
→ R}
die Menge der linearen Funktionale auf Z∗ und nennen Z∗∗ den zu Z bidualen Raum.
Die Wirkung eines Elementes p ∈ Z∗∗ auf ein Element f ∈ Z∗ nennen wir duale Paarung oder
duales Produkt und schreiben hf, pi, f ∈ Z∗ , p ∈ Z∗∗ .
Z∗∗ als linearer Raum linearer Funktionale
3.4.1
Nach Voraussetzung wollen wir nur linearer Funktionale betrachten, es gilt also für endliche
Summen
* n
+
n
X
X
αi fi , p =
αi hfi , pi
i=1
i=1
Außerdem induziert die algebraische Struktur in R eine lineare Struktur in Z∗∗ :
* n
+
n
X
X
f,
βj pj =
βj hf, pj i
j=1
3.4.2
j=1
Ordnung und Positivität
Die Ordnungsstruktur in R induziert eine Halbordnung in Z∗∗ . Dank der Linearität ist das
äquivalent zur Definition der Positivität. Wir nennen ein Element aus Z∗∗ , wenn seine Wirkung
auf alle positiven Elemente aus Z∗ positiv ist:
p ≥ 0 ⇐⇒ hf, pi ≥ 0, f ∈ Z∗ , f ≥ 0
3.4.3
Elemente in Z∗∗ als Funktionen von Mengen
Auf der Teilmenge 2Z ∼ Re ⊂ Z∗ kann man die die Funktionale p ∈ Z∗∗ als Funktionen auf
Mengen p : 2Z −
→ R betrachten. Wir benutzen dafür dasselbe Symbol und schreiben
p(A) := h1A , pi
Damit läßt sich die WirkungP
eines Funktional p ∈ Z∗∗ auf die Linearkombination von charakteristischen Funktionen f =
f (zi )1Ai auch als
+
* n
n
n
X
X
X
f (zi )h1Ai , pi =
f (zi )p(Ai )
(13)
hp, f i =
f (zi )1Ai , p =
i=1
i=1
i=1
3.4 Der biduale Raum Z∗∗ . Statistische Zustände
33
schreiben.
Offenbar gilt für positive p ≥ 0, p(A) ≥ 0. D.h., ein positives Element aus Z∗∗ ist auch positiv als Funktion auf Mengen. Da für eine Linearkombination charakteristischer Funktionen
Positivität äquivalent zur Positivität der f (zi ), folgt, daß – zumindest für endliche Linearkombinationen – die beiden kanonischen Halbordnungen, Positivität von p als Funktion auf Mengen
und Positivität von p als Funktion auf Funktionen identisch sind.
Für positive p gelten weiter folgende offensichtliche Eigenschaften:
P
P
• A = ⊔Ai ⇐⇒ 1A = 1Ai =⇒ p(A) = p(Ai ).
• p(∅) = 0
• A ⊂ B =⇒ 1A ≤ 1B
=⇒ p(A) ≤ p(B)
Das sind Eigenschaften, die von Maßen gefordert werden. Elemente des bidualen Raumes haben
also vieles gemeinsam mit Maßen.
3.4.4
Spezielle Elemente in Z∗∗
In Z∗∗ liegen abstrakte Objekte, Funktionale. Gibt es darunter welche, die wir verstehen? Man
Z
könnte meinen, daß eine Beziehung der Art 22 ⊂ Z∗∗ gilt, entsprechend der Beziehung 2Z ⊂ Z∗ .
Das ist aber nicht der Fall wie das Beispiel endlicher Mengen zeigt (siehe 3.4.7).
Wir können für festes z auch f (z) als Funktional auf Z∗ betrachten, denn das ist eine reelle
Zahl und offesichtlich ist das Funktional linear. Wir können also jedem Element z ∈ Z ein
Funktional δz ∈ Z∗∗ zuordnen durch
hf, δz i = f (z)
Dieses Funktional wird Punktmaß oder Diracmaß genannt. Ist diese Zuordnung injektiv? Es
könnte sein, daß für zwei Punkte z1 und z2 für alle f ∈ Z∗ gilt f (z1 ) = f (z2 ). Das bedeutet,
daß aus der Sicht der Funktionale die beiden Punkte z1 und z2 nicht zu unterscheiden wären.
Physikalisch bedeutet das, daß es keine Beobachtung gibt, die die beiden Zustände z1 und z2 des
physikalischen Systems unterscheiden kann. Dann sind für uns diese beiden Zustände identisch.
Dann hätten wir aber von Anfang an, bei der Definition von Z, überhaupt nicht auf die Idee
kommen können, daß die Zustände verschieden sind (Hausdorffeigenschaft).
Wir nehmen also an, daß dieser Fall nicht auftreten kann. Das nennt man: Die Funktionale
trennen die Punkte. Tatsächlich haben wir damit eine stillschweigende Faktorisierung vorgenommen, ein Verfahren, daß in der klassischen Physik Standard ist. Es gibt in der klassischen
Physik keine nichtunterscheidbaren Objekte.
Damit haben wir eine 121-Zuordnung zwischen Punkten z ∈ Z und Punktmaßen δz ∈ Z∗∗ und
können ab sofort diese Objekte Identifizieren δz ←→ z. Damit wird Z zu einer Teilmenge von Z∗∗
– genau wie wir jeder Teilmenge A ein Funktional – nämlich eine charakteristische Funktion
– auf Z zuordnen konnten. Z ist also in Z∗∗ eingebettet. Diese Einbettung heißt kanonische
Einbettung eines Raumes in seinen bidualen.
Das besondere an dieser Konstruktion ist, daß wir in Z keine oder wenig Struktur haben, in Z∗∗
dagegen – das sind ja Abbildungen in die reellen Zahlen – alle Strukturen der reellen Zahlen.
Wir erhalten somit in Z eine Fülle von Strukturen, die kanonisch entstanden sind, ohne daß
wir sie definieren mußten.
Die Funktionale aus Z∗∗ müssen auf alle Elemente aus Z∗ angewendet werden können, also auch
auf charakteristische Funktionen die wir mit Teilmengen identifiziert haben. Funktionale aus
Z∗∗ sind also unter anderem Funktionen von Teilmengen p(A).
34
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
Insbesondere wirken die Punktmaße auf charakteristischen Funktionen wie folgt:
δz (A) = h1A , δz i = 1A (z)
Das ist = 1, falls z ∈ Z ansonsten = 0.
3.4.5
Eine Basis in Z∗∗ ?
Genau wie in Z∗ , liegen – als Abbildungen in die reellen Zahlen – auch Linearkombinationen
von Punktmaßen in Z∗∗ .
n
X
p=
βj δzj
j=1
Es seien Ai disjunkte Mengen, die jeweils nur zi enthalten, es gelte also 1Ai (zj ) = δij . Dann
folgt
n
n
n
X
X
X
βj δij = βi
p(Ai ) =
βj δzj (Ai ) =
βj 1Ai (zj ) =
j=1
j=1
j=1
und damit
n
X
p(Aj )δzj .
p=
j=1
Zu beachten ist, daß die Ai zwar disjunkt sein müssen, aber keine Zerlegung von Z bilden
müssen. Wir können also äquivalent auch
n
X
p({zj })δzj .
p=
j=1
schreiben.
3.4.6
Z∗∗ als Algebra?
Man könnte den Wunsch verspüren, auch die Multiplikativität p(f · g) = p(f ) · p(g) zu fordern,
aber das kann man schon für charakteristische Funktionen nicht gewährleisten. Es müßte dann
nämlich
p(A ∩ B) = p(1A · 1B ) = p(1A ) · p(1B ) = p(A) · p(B)
gelten, was für B = A zu p(A) = p2 (A) führt für alle A. Diese Forderung führt also auf konstante
Funktionale p.
Man kann Multiplikativität also nicht für alle Maße und Funktionen (oder Teilmengen) fordern.
Trotzdem spielt die Multiplikativität oft eine wichtige Rolle, u.a.:
• Multiplikativität für spezielle Funktionale auf allen Funktionen: Das gilt für Punktmaße
und nur für diese:
hf · g, δz i = (f · g)(z) = f (z) · g(z) = hf, δz i · hg, δz i
• Multiplikativität für ein gegebenes Funktional und gewisse Mengen: p(A ∩ B) = p(A) ·
p(B) Das gilt in der Wahrscheinlichkeitstheorie für unabhängige Ereignisse (so heißen die
Borelmengen der Maßtheorie in der W-Theorie).
3.4 Der biduale Raum Z∗∗ . Statistische Zustände
35
Z
Es ist 22 6⊂ Z∗∗
3.4.7
Man könnte annehmen, daß analog zum Übergang von Z zu Z∗ , für den 2Z ⊂ Z∗ folgte, sich
Z
beim Übergang von Z∗ zu Z∗∗ die Zahl der Elemente derart erhöht, daß 22 ⊂ Z∗∗ gilt. Das ist
aber nicht der Fall. Der Grund hierfür ist, daß in Z∗∗ nicht alle Funktionen sondern nur lineare
Z
Funktionen liegen sollen. Das führt dazu, daß man zwischen 22 und Elementen aus Z∗∗ keine
Eineindeutige Abbildung finden kann, was Voraussetzung für eine Einbettung wäre. Das sieht
man am einfachsten daran, daß sowohl die leere Menge ∅ als auch die Menge {0} auf die 0 des
Raumes Z∗∗ abgebildet werden. ∅ −
→ 0 ist klar und {0} −
→ 0 folgt aus {0} = 0 · {1}, d.h., egal
wohin 1 abgebildet wird, wegen der Linearität muß {0} auf das 0-fache dieser Zahl abgebildet
werden.
Physikalische Bedeutung von Z∗∗
3.4.8
Jetzt wollen wir untersuchen, wie man Linearkombinationen von Punktmaßen interpretieren
könnte. Dazu betrachten wir die Rolle von Wahrscheinlichkeiten in der Physik.
Die Berücksichtigung von Wahrscheinlichkeiten kann wenigstens aus zwei Gründen nötig sein.
Die Ursache ist in beiden Fällen Mangel an Information. Es kann sein, daß 1) nicht mit Sicherheit feststellbar ist, in welchem Zustand sich das System befindet und 2) nicht mit Sicherheit
vorherzusagen ist welcher Zustand nach einer Veränderung angenommen wird. Wir betrachten
vorläufig der ersten Fall.
Wir führen m mal ein Experiment durch und stellen fest, daß sich unser System ki mal im
Zustand zi befunden hat mit m = k1 + k2 + k3 + .... Dann können wir sagen, daß sich das
System mit Wahrscheinlichkeit (genauer Häufigkeit) βi = ki /m im Zustand zi befunden hat
und die Größe
′ ′
z
=
k1 ′ ′ k2 ′ ′ k3 ′ ′
z1 +
z2 +
z3 + ... = β1 ′z1′ + β2 ′z2′ + β3 ′z3′ + ...
m
m
m
können wir als statistischen Zustand des Systems bezeichnen. Das ist eine konvexe Kombination
von Zuständen, eine spezielle Linearkombinationen. Soetwas können wir mit Punkten aus Z aber
nicht bilden, wohl aber aus Elementen aus Z∗∗ . Wir können das Funktional
p=
n
X
j=1
βj δzj ,
n
X
j=1
βj = 1, βj ≥ 0
als statistischen – oder gemischten – Zustand des Systems bezeichnen. Der Fall p = δz würde
bedeuten, daß sich das System mit Sicherheit im – reinen – Zustand z befindet.
Die gemischten Zustände sind also konvexe Kombinationen reiner Zustände. Und umgekehrt, die
reinen Zustände sind die Zustände, die sich nicht gemischt darstellen lassen, also die extremalen
Elemente der konvexen Menge der gemischten Zustände.
Wir können also einem Teil der Funktionale aus Z∗∗ einen physikalischen Sinn geben. Wir
können die konvexen Kombinationen von Punktmaßen als Wahrscheinlichkeiten interpretieren.
Bemerkung: Es ist wichtig zu verstehen, daß die konvexe Kombination von Zuständen selbst
kein Zustand ist, auch wenn Z einen lineare Menge ist. Befindet sich das System z.B. mit
halber Wahrscheinlichkeit in den Zuständen z1 und z2 , so befindet es sich nicht im Zustand
z = 21 z1 + 12 z2 . Das wäre auch ein reiner und kein gemischter Zustand. Es ist ein Unterschied,
ob sich das System im Zustand z oder mit gleicher Wahrscheinlichkeit in den Zuständen z1 und
2
z2 befindet. Der Wunsch, anstelle von z.B. 21 δz1 + 21 δz2 lieber z1 +z
als statistischen Zustand zu
2
36
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
betrachten, ist ein weitverbreiteter Fehler, der Folgefehler nach sich zieht, die die mathematische
Analyse des Problems sehr erschweren können.
Die konvexen Kombinationen von Punktmaßen haben die offensichtlichen Eigenschaften p ≥ 0
und h1, pi = 1. Wir nennen solche Maße Wahrscheinlichkeitsmaße und bezeichnen sie mit
P = p ∈ Z∗∗ | p ≥ 0, h1, pi = 1
Die Punktmaße
Pe = δz ∈ Z∗∗ | z ∈ Z}
liegen in dieser Menge und bilden ihre extremalen Elemente.
Wie im Falle der charakteristischen Funktionen lassen sich im Falle endlicher Mengen Z alle
Elemente aus P als konvexe Kombinationen ihrer extremalen Elemente darstellen.
Pe = extr P , Pe ∼ Z
P = conv Pe
Diese Darstellung ist – im Gegensatz zu R – eindeutig. Das liegt daran, daß die n extremalen
Elemente δz affin unabhängig sind. Sie spannen eine n−1 dimensionale Hyperebene auf, aus der
die konvexen Kombinationen der δz einen n−1 dimensionalen Simplex ausscheiden. Die eindeutig bestimmten Koeffizienten zu einem p ∈ P sind gerade seine baryzentrischen Koordinaten in
diesem Simplex.
3.4.9
Baryzentrische Koordinaten
Im Rn heißen k ≤ n Punkte P1 , P2 , ..., Pk affin unabhängig, wenn die k Vektoren P2 −
P1 , ..., Pk −P1 linear unabhängig sind (hier ist egal, welcher Punkt subtrahiert wird). Die Punkte
P1 , P2 , ..., Pk spannen dann einen k − 1-dimensionalen Simplex auf. Die Eckpunkte Pi dieses
Simplex sind die extremalen Elemente des Simplex als konvexe Menge. Jeder Punkt P0 im
Inneren dieses Simplex läßt sich eindeutig als konvexe Kombination
P0 = α1 P1 + ... + αk Pk , αi ≥ 0, α1 + ... + αk = 1
der Eckpunkte darstellen. Die Koeffizienten αi heißen baryzentrische Koordinaten und
lassen sich explizit als
αi =
S(P1 , ..., Pi−1 , P0 , Pi+1 , ..., Pk )
S(P1 , ..., Pk )
berechnen, wobei S(P1 , ..., Pk ) das Volumen des Simplexes mit den Eckpunkte Pi ist.
Baryzentrische Koordinaten bestehen aus einer Koordinate mehr als lineare Koordinaten. Sie
ermöglichen es, Punkte in einem Simplex zu beschreiben, unabhängig davon wo der Simplex
im Koordinatensystem liegt und wie das Koordinatensystem skaliert ist. Beispielsweise hat
der Schwerpunkt in jedem Dreieck die baryzentrischen Koordinaten ( 13 , 31 , 31 ). Absolute lineare
Koordinaten des Schwerpunktes lassen sich natürlich nicht angeben.
Bemerkung: Im Dreieck gibt es neben baryzentrischen Koordinaten auch noch trilineare Koordinaten, die anders definiert sind und keine konvexe Kombination bilden.
37
3.5 Die duale Paarung
3.5
3.5.1
Die duale Paarung
Extensive und intensive Größen
Die duale Paarung für endliche Linearkombinationen (13)
hp, f i =
n
X
f (zi )p(Ai )
i=1
läßt sich interpretieren als Summ von Produkten intensiver Größen (mittelnde Funktionen von
Punkten f ) mit extensiven Größen (additive Funktionen von Mengen p).
Die mittelnde Eigenschaft von f wird beim Zusammenfassen von Objekten deutlich: Aus
f (z)p(A1 ⊔ A2 ) = f (z) p(A1 ) + p(A2 ) = f (z1 )p(A1 ) + f (z2 )p(A2 )
folgt
f (z) =
p(A1 )
p(A2 )
f (z1 )p(A1 ) + f (z2 )p(A2 )
=
f (z1 ) +
f (z2 )
p(A1 ) + p(A2 )
p(A1 ) + p(A2 )
p(A1 ) + p(A2 )
Wir betrachten eine Menge A, die nicht Z sein soll, eine Zerlegung von A = ⊔i Ai , ein f ∈ Z∗
und den Ausdruck
n
X
q(A) =
f (zi )p(Ai )
(14)
i=1
Wir können dadurch auf Pe ein Funktional q durch
h1A , qi = q(A) =
n
X
f (zi )p(Ai )
i=1
definieren. Damit läßt sich q auf Linearkombinationen ausweiten. Es sei g =
Wir betrachten hg, qi. Dazu müssen wir q auf 1Bj anwenden. Es sei
q(Bj ) = h1Bj , qi =
mit zji ∈ Aji und
hg, qi =
=
m
X
i
i,j=1
j=1
g(zj )1Bj .
f (zji )p(Aji )
i=1
Aji = Bj . Das ergibt
g(zj )h1Bj , qi =
j=1
n,m
X
S
n
X
Pm
m
X
j=1
g(zj )
n
X
f (zji )p(Aji ) =
i=1
n,m
X
g(zj )f (zji )p(Aji ) =
i,j=1
g(zji )f (zji )p(Aji ) = hg · f, pi
Im vorletzten Schritt wurde verwendet, daß g auf Bj und damit auch auf allen Aji konstant
ist. Es gilt also g(zj ) = g(zji ).
Im letzten Schritt wurde
S die Summe als Linearkombination von charakteristischen Funktionen
auf der Zerlegung Z = ij Aji betrachtet.
Formal gilt diese Darstellung nur für endliche Linearkombinationen, aber die rechte Seite ist
für alle Elemente f, g ∈ Z∗ definiert, da Z∗ eine Algebra ist.
Wir können also die durch (14) definierte Größe als Element aus Z∗∗ betrachten. Diese Darstellung läßt sich als Darstellung einer extensiven Größe q als duale Paarung einer intensiven
f und einer extensiven Größe p interpretieren.
38
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
3.5.2
Verallgemeinerungen
Im allgemeinen wären folgende Darstellungen wünschenswert:
X
X
X
X
x · 1f −1 (x)
p {z} δz
p=
pj δzj =
f=
fi 1Ai =
j
z∈Z
X
x∈R
X
x∈R
x · p f −1 (x) = hf, pi =
Riemannintegral
z∈Z
f (z) · p {z}
Lebesgueintegral
Beweis der Gleichheit:
X
X
X
X
hf, pi =
x · p f −1 (x) =
x·
p {z} =
f (z) · p {z}
x∈R
x∈R
z∈Z
z|f (z)=x
Für f = 1 erhält man hieraus
X
p {z}
h1, pi = p(Z) =
z∈Z
3.6
Zusammenfassung
Z∗
Z∗∗
Typ der Welt
geistig
materiell
Typ der Größe
intensiv (mittelnd)
extensiv (positiv, additiv)
Funktionen von
Punkten
Mengen
kanonische Objekte, “Basis”
Re = {1A , A ∈ 2Z }
Pe = {δz , z ∈ Z}
Dualität
sinnvolle Elemente
extremale Elemente
konvexe Hülle
1A (z)
= =
δz (A)
R = {f : 0 ≤ f ≤ 1} P = {p : p ≥ 0, p(Z) = 1}
Re = extr R
Pe = extr P
R = conv Re
P = conv Pe
Re = 2Z
Pe = Z
Da Z in Z∗∗ erhalten ist, gibt es keinen Grund, sich weiter für Z zu interessieren. Wir haben
zwei lineare Räume Z∗ und Z∗∗ gefunden, mit denen sich alle relavanten Probleme beschreiben
lassen.
Wir können von Z∗∗ zu Z auf folgendem Weg gelangen:
Z∗∗ −
→ P−
→ extr P = Pe = Z
und analog
Z∗ −
→ R−
→ extr R = Re = 2Z .
Das sind Möglichkeiten, aus der Menge der Potenzmenge die Menge selbst und umgekehrt zu
erhalten.
39
3.7 Probleme
3.7
Probleme
An Beispielen haben wir gesehen, daß es sinnvol ist, für den Zustandsraum Z die Möglichkeiten
• Z ist eine endliche Menge
• Z ist eine abzählbare Menge
• Z ist ein Kontinuum
zuzulassen. Falls Z eine endliche Menge ist, ist die vorgestellt Konstruktion mathematisch
einwandfrei. Es ergibt sich Z∗ = Rn und Z∗∗ = R∗n .
Im Falle, daß Z eine abzählbare Menge ist, muß geklärt werden, wie die Summen zu verstehen
sind, wenn sie sich über unendlich viele Elemente erstrecken. Ohne den Begriff des Grenzwertes
ist hier eine einwandfreie mathematische Konstruktion nicht möglich. Mit diesen Problemen
werden wir uns später beschäftigen.
Im Falle, daß Z die Mächtigkeit eines Kontinuums hat, gibt es bereits bei der Definition von
Summen Probleme. Das ist vielleicht am offensichtlichsten an der wünschenswerten Gleichung
X
p {z}
h1, pi = p(Z) =
z∈Z
Es gilt folgender
Satz: Ist die Summe von einer gewissen Anzahl nichtnegativer reeller Zahlen endlich, können
höchstens abzählbar viele von ihnen echt positiv sein.
Beweis: Es sei M die Menge der gegebenen nichtnegativen reellen Zahlen. Wir bilden Bk =
1
{x ∈ M| k+1
< x ≤ k1 }, die Menge der Elemente aus M, die zwischen aufeinanderfolgenden
Stammbrüchen liegen. Diese Mengen sind disjunkt. Offensichtlich liegen in jeder Menge Ik nur
endlich viele Elemente, denn sonst wäre ihre Summe bereits ∞. Andererseits liegt jede strikt
positive Zahl in irgendeiner der Mengen Bk . Die Menge ∪k Bk enthält also alle strikt positiven
Zahlen. Sie ist als abzählbare Vereinigung endlicher Mengen abzählbar.
Eine analoge Frage ist, ob man eine Funktion f ∈ R als konvexe Kombination von extremalen
Elementen aus Re darstellen kann:
X
f=
αi 1Ai
i∈I
Es ist klar, daß es nur abzählbar viele echt positive αi geben kann. Damit erscheint es unmöglich,
eine Funktion f mit mehr als abzählbar vielen Freiheitsgraden derart darzustellen.
D.h., es ist prinzipiell sinnlos, von Summen über mehr als abzählbar viele positive Zahlen zu
sprechen. Das ist gut aus der Maßtheorie bekannt. Dazu dient der dort eingeführte Begriff der
σ-Additivität.
Als erstes sollte man überlegen, inwiefern der Begriff der Menge überhaupt der Realität entnommen ist. Eine Menge ist eine Zusammenfassung wohlunterscheidbarer Objekte der Natur
oder des Denkens. Das bedeutet u.a. auch, daß man von einem Objekt genau sagen kann, ob
es zur Menge gehört oder nicht.
Endliche diskrete Mengen sind deshalb sicher sinnvoll als Mengen zu betrachten. Auch Mengen
mit abzählbar vielen Elementen kann man sich noch vorstellen. Allerdings haben sich nicht
40
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
ohne Grund – wie wir noch sehen werden – die antiken griechischen Mathematiker selbst mit
solchen Mengen schwer getan.
Aber bei Kontinua hört der Spaß endgültig auf. Wir wollen dazu ein paar Probleme betrachten.
3.7.1
Paradoxa mit Kontinua, reellen Zahlen und Beobachtungen
Kontinua werden u.a. in folgenden Situationen benutzt:
• Gebiete im euklidischen Raum, der als physikalischer Raum interpretiert wird
• Beliebig teilbare Wahrnehmungen (Helligkeit, Alk.gehalt, ..)
• reelle Zahlen als Beobachtungsergebnisse (Meßwerte)
An die ersten beiden Punkte haben wir uns dermaßen gewöhnt, daß wir darauf nicht verzichten
wollen.
Dabei wollen wir das Problem, was das physikalische intuitive Kontinuum mit dem mathematischen (reelle Zahlen) zu tun hat nicht untersuchen. Meistens wird in der Physik eine Größe
dann als kontinuierlich bezeichnet, wenn zwischen zwei Werten auch alle Zwischenwerte möglich
sind, d.h. wenn zu jedem Wert ein physikalisches Objekt existiert, für das die untersuchte Größe
diesen Wert annimmt. Diese Definition ist insofern unvollständi, da sie nicht erklärt, was für
Werte eine physikalische Größe annehmen kann. Implizit ist immer gemeint: jede reelle Zahl.
Das setzt per definitionem das physikalische und das mathematische Kontinuum gleich.
Einerseits ist klar, daß rationale Zahlen für physikalische Größen nicht ausreichen. Das wußten
schon die Griechen. Andererseits ist auch klar, daß niemals für jede reelle Zahl ein entsprechendes physikalisches Objekt gefunden werden kann, da es nur endlich viele und mit gutem
Vorstellungsvermögen vielleicht abzählbar viele Meßwerte geben kann.
3.7.2
Reelle Zahlen und Beobachtungen
Man benutzt zwar real nur die rationalen Zahlen, braucht aber die reellen Zahlen um eine
absolute Obermenge zu haben, in der alle Meßwerte bei beliebiger Meßgenauigkeit und alle
möglichen Lösungen von Gleichungen drinliegen.
Der Grund (und die Sinnhaftigkeit) der reellen Zahlen liegt in der Abgeschlossenheit. Der
Mittelwertsatz für beliebige stetige Funktionen funktioniert nur in den reellen Zahlen. Reelle
Zahlen kann man als Grenzwerte von Folgen rationaler Zahlen definieren. Das führt sofort zur
Überabzählbarkeit und damit zu einer Reihe von Paradoxa:
• Mit den reellen Zahlen lassen sich keine tatsächlichen Vorhersagen treffen. Angenommen,
wir vergleichen mit einer Balkenwaage die Massen dreier Kugeln m1 , m2 und m3 ist folgendes Ergebnis möglich: m1 = m2 , m2 = m3 . Werden die mi als reelle Zahlen interpretiert,
folgt m1 = m3 . In der Realität kann aber aufgrund der Meßgenauigkeit m1 6= m3 erhalten
werden (z.B. bei einer Meßgenauigkeit von 0.5g: m1 = 5.1g, m2 = 5.5g, m3 = 5.9g).
Meßergebnisse kann man praxisgerechter besser als “Enthaltensein in offenen Mengen”
interpretieren:
m1 m2 m3
m1 = m2 , m2 = m3 6=⇒ m1 = m3
Benutzt man natürliche Zahlen zum Messen der Masse, indem man etwa die Atome zählt,
tritt diese Paradoxon nicht auf.
41
3.7 Probleme
• Von zwei reellen Zahlen x und y, die als Dezimalbrüche gegeben sind, läßt sich x 6= y durch
sukzessive Stellenberechnung beweisen, x = y dagegen nicht. Als Beispiel betrachten wir
zwei reelle Zahlen x und y:
π
x = tan 7.5◦ = tan
√
√ 24
√
6+ 2− 3−2
y =
x = y = 0.131652497...
ÜA 4a: Entscheide of x = y oder x 6= y.
Beweis daß x = y: Wir gehen von der bekannten Tatsache tan π3 =
aus der Lösung der quadratischen Gleichung
tan 2α =
√
3 aus und erhalten
2 tan α
1 − tan2 α
sukzessive
π
3
π
tan
6
π
tan
12
π
tan
24
tan
Aus
2
p
q
=
=
√
3
1√
3
3
√
= 2− 3
p
√
q
√
√
1− 8−4 3
√
= (2 − 3) 8 − 4 3 =
=
3−2
q
q
√
√
√
√
= −2 − 3 + 2 8 − 4 3 + 3 8 − 4 3
√
q√
√
√
√
8 − 4 3 = ( 6 − 2)2 = 6 − 2 folgt
√
8−4 3+
√
3
q
√
√
√
√
√
√
√
8 − 4 3 = 2( 6 − 2) + 3 2 − 6 = 6 + 2
und damit die Behauptung.
Im Gegensatz dazu sind die beiden Zahlen
3
x = 640320
+ 744
√
π 163
= 262537412640768743.9999999999992500725971981856888...
y = e
ab der 31. Stelle tatsächlich verschieden. Hier ist die Verschiedenheit offensichtlich, weil
x ganz und y transzedent ist.
• Sind reelle Zahlen z.B. gleichverteilt (jede Verteilung ist geeignet) so kann es sein, daß die
Wahrscheinlichkeit, daß x genommen wird 0 ist für fast alle x. Trotzdem wird aber ein
ganz konkretes x angenommen.
• Keine Wahrscheinlichkeiten (Punkt auf der Kugel)
• Reelle Zahlen sind im allgemeinen Grenzwerte von Folgen rationaler Zahlen und als Grenzwerte prinzipiell nicht empirisch ermittelbar.
42
3.7.3
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
Die Potenzmenge ist zu groß
Neben der Menge Z an sich benötigen wir noch die Potenzmenge 2Z . Die Dualität der Mengen
Z∗ und Z∗∗ spiegelte sichgerade in der Dualität von Elementen und Teilmengen wieder. Neben
der möglichen Überabzählbarkeit von Z, die Probleme bereitet, ist 2Z bereits für abzählbare Z
überabzählbar, da sich die Kardinalität beim Übergang von einer Menge zu seiner Potenzmenge
erhöht.
Dieser Umstand spielt sogar bei endlichen Mengen eine Rolle, obwohl man ihn erst bei praktischen, nicht bei theoretischen Problemen wahrnimmt. Hat man etwa ein numerisches Problem
für Mengen mit n Elementen gestellt, kann es sein, daß es seine Lösung erfordert alle Teilmengen (2n Stück) oder alle Funktionen in eine k-Menge (k n Stück) zu betrachten. Solche Problem
heißen NP-vollständig und sind de facto unlösbar, wenn es nicht gelingt einen Algorythmus mit
einer kleineren Komplexität zu finden.
43
3.8 Beispiel: Endliche Mengen. Übungsaufgaben
3.8
Beispiel: Endliche Mengen. Übungsaufgaben
3.8.1
Der Fall Z = {z1 , z2 , z3 }
Ist Z = {z1 , z2 , z3 } eine Mengen aus drei Elementen, dann ist eine Abbildung in die reellen
Zahlen eineindeutig gegeben, wenn klar ist, welcher reellen Zahl z1 , welcher reellen Zahl z2 und
welcher reellen Zahl z3 zugeordnet ist. Sind die drei reellen Zahlen g1 , g2 und g3 , so entspricht
jeder solchen Abbildung ein Tripel g = (g1 , g2 , g3 ). Es ist also
Z∗ = {(g1 , g2, g3 ) | gi ∈ R}
Damit ist Z∗ der dreidimensionale reelle Raum, ohne Berücksichtigung irgendeiner Norm (später
wird noch eine geeignete Norm dazu genommen). Wir nennen ihn R3 .
Charakteristische Funktionen sind Tripel g, mit gi = 1 oder gi = 0. Davon gibt es 23 = 8 Stück.
Das sind die extremalen Elemente des Würfels
R = {g ∈ R3 | 0 ≤ gi ≤ 1}
Den dualen Raum Z∗∗ zu Z∗ bezeichne wir mit R∗3 . Es ist ebenfalls der dreidimensionale reelle
Raum, allerdings wird er eine andere Norm erhalten.
Die Menge der statistischen Zustände ist der zweidimensionale Simplex
o
n
P =
p ∈ R∗3 p1 + p2 + p3 = 1, pi ≥ 0
Seine extremalen
Elemente sind die kanonischen

 
 

1
0

Pe = δz1 =  0  , δz2 =  1  , δz3 = 

0
0
Basisvektoren

0 
0 

1
Es bietet sich an, Vektoren aus R3 und R∗3 als Zeilen– bzw. Spaltenvektoren zu unterscheiden.
Die duale Paarung ist dann die übliche Matrizenmultiplikation


p1
hg, pi = (g1 , g2 , g3 )  p2  = g1 p1 + g2 p2 + g3 p3
p3
Re✏✏◗✉
✏✏
◗
✏✏
◗
✏
✏
◗
✏
✉✏
◗
◗
◗
◗
◗
◗
◗◗✉
◗
✏
✏
◗
✏✏
◗
✏
✏
◗
✏✏
◗◗✏
✏
✉
✶
✏
✏✏
✏✏ z2
✉
✏
✏✏ ◗◗
✏✏
✏
◗
✏✏
◗
✏✏
✉
◗
◗
◗
◗
◗
◗
◗◗✉
◗
✏✏
◗
✏
◗
✏✏
◗
✏✏
✏
◗ ✏
✏
◗✉
◗
◗
◗ z1
◗
◗
s
◗
✻
z3
✻ z3
1 ✉
R
✔
✔
✔✔❚❚
❚
0
Pe
❚
❚
❚
❚
❚
❚
✑◗
❚
✑
◗
✔
❚
✑
◗
✑
◗
✔
❚
◗
✔ ✑✑
◗ ❚
◗❚
✔✑
✑
◗❚✉
✉
✔
◗
z1 ✑✑1
1 ◗ z2
✑
◗
✰
✑
s
◗
✔
✔
✔
✔
✔
✔
P
44
3 LINEARE DUALITÄTSTHEORIE. HEURISTIK
3.8.2
Berechnung von konvexen Kombinationen in R2
ÜA 5a) Es sei R2 das Quadrat im R2 mit den Eckpunkten (0, 0), (1, 0), (0, 1), (1, 1). Finde
die allgemeine Darstellung eines Punktes x = (x1 , x2 ) innerhalb dieses Quadrates als konvexe
Kombination der Eckpunkte.
Lösung: Die allgemeine Lösung ist
1
1
0
0
x1
+ (x1 + x2 − t)
+ (t − x2 )
+ (t − x1 )
= (1 − t)
1
0
1
0
x2
wobei an den Parameter t die Bedingungen min{1, x1 + x2 } ≥ t ≥ max{x1 , x2 } gestellt werden
müssen (sonst bilden die Koeffizienten keine konvexe Kombination).
Spezielle (Rand-)Lösungen wären t = 1, t = x1 + x2 und t = x2 > x1
1
1
0
0
x1
+ (x1 + x2 − 1)
+ (1 − x2 )
+ (1 − x1 )
=0
1
0
1
0
x2
x1
x2
x1
x2
3.8.3
= (1 − x1 − x2 )
= (1 − x2 )
0
0
0
1
+ x1
+ (x2 − x1 )
0
1
0
0
+ x2
+0
1
0
1
0
1
1
+ x1
1
1
+0
Berechnung von konvexen Kombinationen in Rn
ÜA 5b) Es sei Rn der n-dim Würfel im Rn mit den 2n Eckpunkten (0, ..., 0), ..., (1, ..., 1).
Finde eine Darstellung eines allgemeinen Punktes x = (x1 , x2 , ..., xn ) innerhalb dieses Würfel
als konvexe Kombination seiner extremalen Elemente.
Lösung: Es sei x = (x1 , x2 , ..., xn ) ein beliebiger gegebener Vektor. O.B.d.A. kann x1 ≤ x2 ≤
... ≤ xn angenommen werden. Das kann durch Umnummerierung der Zustände z1 stets erreicht
werden.
Wir schreiben die Darstellung für R4 auf:
 
 

 

0
0
0
x1
 0 
 0 
 0 
 x2 
 
 

 

 x3  = (1 − x4 )  0  + (x4 − x3 )  0  + (x3 − x2 )  1  +
1
1
0
x3
 
 
1
0
 1 
 1 

 
+ (x2 − x1 ) 
 1  + x1  1 
1
1
Nach Voraussetzung ist xk ≥ xk−1 , x1 ≥ 0 und 1 ≥ x4 . Deshalb sind alle Koeffizienten nichtnegativ. Offensichtlich ist auch die Summe 1.
Die allgemeine Lösung kann leicht hieraus gefolgert werden.
x = (1 − xn )P0 +
n−1
X
k=1
(xn+1−k − xn−k )
k
X
i=0
Pk + x1
n
X
k=1
Pk
3.8 Beispiel: Endliche Mengen. Übungsaufgaben
45
oder kompakter, wenn man xn+1 = 1 und x0 = 0 setzt:
!
n
k
X
X
x =
(xn+1−k − xn−k )
Pk =
i=0
k=0
= (xn+1 − xn )P0 + (xn − xn−1 )(P0 + P1 ) +
+ (xn−1 − xn−2 )(P0 + P1 + P2 ) + ... + (x2 − x1 )(P0 + P1 + ... + Pn−1 ) +
+ (x1 − x0 )(P0 + P1 + ... + Pn )
Hier ist P0 = ∅ der Koordinatenursrpung
und Pi = {zi }.
P
Für kleine Koordinaten mit i xi ≤ 1 wäre auch
!
n
n
X
X
x= 1−
xi P0 +
xi Pi
i=1
i=1
eine Lösung.
3.8.4
Der Satz des Pythagoras im Simplex
ÜA 5c) Ein rechtwinkliger Simplex im Rn sei gegeben durch die n Schnittpunkte einer Ebene
mit den Koordinatenachsen und dem Koordinatenursprung. Dabei entstehen n + 1 “Seitenflächen” der Dimension n − 1. Es sei Ai der Flächeninhalt der Seitenfläche senkrecht auf der
i-ten Koordinatenachse und A der Flächeninhalt der Grundfläche (gebildet von den Koordinatenachsenschnittpunkten). Beweise den Satz des Pythagoras im Simplex:
A2 = A21 + A22 + ... + A2n
Beweis:
Herunterladen