25 3 Lineare Dualitätstheorie. Heuristik 3.1 Ein paar Vorbemerkungen Ziel: Informationen über Z finden. 3.1.1 Die Grundobjekte der Funktionalanalysis Mengen mit Struktur Abbildungen Funktionen Funktionale a ∈ A, b ∈ B X = {f : A − → B}, b = f (a) Operatoren M : X− → X, g = Mf Alles noch mal für reelle Zahlen z ∈ Z, x ∈ R C(Z) = {g : Z − → R}, x = g(z) M : C(Z′ ) − → C(Z) ′ ′ ′ ′ ′ z ∈ Z , y ∈ R C(Z ) = {f : Z − → R}, y = f (z ) g = Mf Die Funktionalanalysis beschäftigt sich mit drei Objekten: Mengen X und Y, Funktionen f die zwischen diesen Mengen wirken und in einem Funktionenraum M(X, Y) liegen, in dem Operatoren A Funktionen auf Funktionen abbilden, die wiederum in einem Operatorenraum liegen können. X ❄ f∈ Y M(X, Y) ❄ A ∈ L(M, M′ ) M′ (X′ , Y′ ) ✎☞ 1 ✍✌ ✎☞ 2 ✍✌ ✎☞ 3 ✍✌ Jede Zusammenfassung von neuen Objekten in Mengen erhöht einerseits die Abstraktionsstufe und damit den Kompliziertheitsgrad, läßt sich aber andererseits stets als Wirken von Funktionen zwischen Mengen betrachten. Da diese neuen Mengen meistens aber mit anderen Methoden untersucht werden müssen ist es sinnvoll, zwischen Funktionen und Operatoren zu unterscheiden, obwohl das nicht prinzipiell ist. Die einzelnen Teilgebiete der Funktionalanalysis unterscheiden sich darin, welche Strukturen in den Mengen definiert oder welche Funktionen aus der Menge aller denkbaren Funktionen ausgewählt werden. 26 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK 3.1.2 Mengen mit Strukturen. Kanonische Objekte Werden Mengen aufeinander abgebildet, werden vorhandene Strukturen übertragen. Wir betrachten zwei Mengen A und B, und die Menge X = X(A, B) aller Abbildungen f : A − →B und untersuchen drei Typen von Strukturen: • algebraische Struktur (B, ∗) Man definiert eine binäre Abbildung B × B − → B. • Ordnungsstruktur (B, ≤) Man markiert eine Teilmenge des Kreuzproduktes ... ⊂ B × B. • topologische Struktur (B, τB ) Man markiert eine Menge von Teilmengen und nennt sie offen OB ⊂ 2B . Durch Funktionen f ∈ X werden diese Strukturen übertragen, d.h. es werden entsprechende Strukturen induziert. • algebraische Struktur: Von B nach X (f ∗ g)(a) = f (a) ∗ g(a), a ∈ A X sollte abgeschlossen sein bezüglich dieser Operation. • Ordnungsstruktur: Von B nach X f ≤ g ⇐⇒ f (a) ≤ g(a), a ∈ A Sinnvoll ist es, Das schränkt die Menge X nicht ein. Wenn es aber bereits eine natürliche Ordnungsstruktur auf X gibt, sollten beide Strukturen zusammenfallen. • topologische Struktur: Von B nach A (Initialtopologie) OA = {f −1 (U) | U ∈ OB , f ∈ X} X ist dann die Menge der stetigen Abbildungen A − → B. Hier gibt es also zwei Möglichkeiten: Wir definieren in A und B eine Topologie und betrachten nur stetige Abbildungen, oder wir gehen von einer Topologie in B aus und definieren uns eine Topologie in A mithilfe einer Menge von Funktionen, die wir für geeignet halten. Genau genommen wird so nur eine Subbasis der Topologie in A definiert. Eine häufig verwendete sehr erfolgreiche Idee in der Funktionalanalysis (und auch anderswo) ist es, die Eigenschaften einer Menge unbekannter Elemente zu ermitteln, indem die Abbildungen dieser Menge in eine Menge mit einer vielfältigen bekannten Struktur betrachtet werden. Eine besonders vielfältige Struktur haben die reellen Zahlen (lineare Ordnung, zwei algebraische Operationen und eine Topologie). Wir werden deshalb den Zustandraum mit Hilfe reellwertiger Abbildungen untersuchen. 3.2 Der Zustandsraum Z als Menge 3.2 27 Der Zustandsraum Z als Menge In den betrachteten Beispielen kamen verschiedene Varianten des Zustandsraumes vor. Als Menge war der Zustandsraum • eine endliche Mengen • eine abzählbare Mengen • ein Kontinuum Oft hat der Zustandsraum bereits eine natürliche Struktur (z.B. wenn er ein Gebiet im Rn ist), auf die zurückgegriffen werden sollte. Das sind aber spezielle Strukturen, die nur für spezielle Aufgaben interessant sind. Wir werden im weiteren die lineare Dualitätstheorie rein formal so entwickeln, wie sie sich kanonisch allein aus der Tatsache, daß wir ein physikalisches System beschreiben wollen ergibt. Wir werden keine neuen Definitionen einführen sondern nur die Eigenschaften der kanonischen Objekte beschreiben. Das hat den Vorteil, daß man sich nicht mit technischen Problemen aufhalten muß und sich ganz auf die Eigenschaften der Objekte konzentrieren kann. Als Ergebnis erhält man einen mathematischen Rahmen, dem man einen physikalischen Sinn geben. Allerdings werden wir feststellen, daß alles nur im Fall Z eine endliche Menge ist, mathematisch einwandfrei ist. Die nächste Aufgabe ist dann, künstlich Änderungen derart vorzunehmen, daß auch abzählbare Mengen und Kontinua in diesem Rahmen beschrieben werden können. Ist Z eine abstrakte Menge, gibt es in Z nichts kanonisches als die Menge der Teilmengen (auch Potenzmenge genannt) von Z. Wir bezeichnen diese Potenzmenge mit 2Z . In 2Z gibt es eine kanonische Ordnungsstruktur (⊂), eine algebraische Struktur (⊔ und ∩) und eine Verbandstruktur (∪ und ∩). 3.3 3.3.1 Der duale Raum Z∗. Beobachtungen Funktionen als Funktionale. Der duale Raum Da es auf Z a-priori keine Struktur gibt, ist ein Funktional auf Z also erstmal eine beliebige reellwertige Funktion auf Z, die für jedes z ∈ Z einen definierten Wert annimmt. Wir bezeichnen diese Menge mit Z∗ = {f : Z − → R} Später werden wir in Z eine geeignete Struktur festlegen und nur solche Funktion betrachten, die diese Struktur erhalten. Damit wird sich diese Menge einschränken. Ein Element aus f ∈ Z∗ , angewendet auf z ∈ Z ist f (z). Z∗ wird der zu Z duale Raum genannt. Meinstens wird für diese Objekte der Begriff “Funktion” und nicht der Begriff “Funktional” verwendet. 3.3.2 Z∗ als linearer Raum Die vielfältige Struktur von R überträgt sich auf Funktionen von Z nach R also auf Z∗ . Dank der algebraischen Strukturen in R können wir endliche Linearkombinationen von Funktionen bilden. Sind fi ∈ Z∗ , sind für alle reellen αi auch n X f= αi fi ∈ Z∗ i=1 28 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK da wohlPdefiniert ist, welchen Wert f an einer beliebigen Stelle z ∈ Z annimmt, nämlich f (z) = ni=1 αi fi (z). Wie in jedem linearen Raum ist die Funktion, die konstant 0 ist enthalten, 0 ∈ Z. 3.3.3 Ordnung und Positivität Die Ordnungsstruktur in R generiert auf kanonische Weise eine Halbordnung in Z∗ : f ≥ g ⇐⇒ f (z) ≥ g(z), z ∈ Z Der Begriff der Ordnung in einem linearen Raum ist äquivalent mit dem Begriff der Positivität. Wir schreiben f ≥ 0. 3.3.4 Z∗ als kommutative Algebra Die Multiplikation in R generiert die Struktur einer kommutativen Algebra ist Z mit der punktweisen Multiplikation: h = f · g ⇐⇒ h(z) = f (z) · g(z), z ∈ Z 3.3.5 Beschränkte Funktionen als konvexe Menge Wir nennen eine Funktion f beschränkt, wenn es zwei reelle Zahlen α und β ≥ α mit α1 ≤ f ≤ β 1 gibt. Zu so einer Funktion können wir eine skalierte Funktion f˜ = 1 (f − α1) β−α definieren, die “affin äquivalent” ist zu f . Im weiteren sei α = inf f (z), β = sup f (z) z z Wenn wir alle beschränkten Funktionen mit derselben skalierte Funktion f˜ als identisch auffassen, reicht es Funktionen zu betrachten, die die Ungleichung 0≤f ≤1 erfüllen. Wir bezeichnen diese Menge mit R = {f ∈ Z∗ | 0 ≤ f ≤ 1} Offensichtlich ist R eine konvexe Menge. Bemerkung: Die Funktion f˜ “berühert” die 0- und 1- Linie. In R liegen aber auch Funktionen, die strikt zwischen 0 und 1 liegen. 3.3 Der duale Raum Z∗ . Beobachtungen 3.3.6 29 Niveaumengen (level sets) Zu einer Funktion f : Z −→ R können wir den Wertebereich R(f ) ⊂ x auf die übliche Art definieren. Zu jeder Funktion läßt sich auf die übliche Weise eine “inverse Funktion” f −1 definieren: f −1 (x) = {z ∈ Z|f (z) = x} ⊂ Z, x ∈ R(f ) f −1 (x) = ∅, x ∈ R(f ) Diese Funktion wird “inverse Funktion” genannt, obwohl ihr Wertebereich ein anderer ist als der Definitionsbereich von f . Es ist f −1 : R − → 2Z . Eigentlich müßte hier ein anderes Symbol als −1 f eingeführt werden. Wir verzichten darauf, weil das unüblich ist. f −1 (x) heißt Niveaumenge von f zum Wert x. f −1 ist auf R(f ) eineindeutig: x 6= y ⇐⇒ f −1 (x) 6= f −1 (y). Deshalb zerlegt jede Funktion seinen Definitionsbereich Z in Äquivalenzklassen. f −1 erhält die Mengenoperationen ∪ und ∩. 3.3.7 Charakteristische Funktionen Die betrachteten Funktionen haben Werte im Zahlenkörper R. Anstelle von R könnte man andere Körper betrachten (was wir nicht tun werden). Deshalb sind besonders solche Funktionen interessant, die es für jedem Körper gibt, daß sind Funktionen, die nur die Werte 0 und 1 annehmen (diese beiden Zahlen gibt es in jedem Körper). Solche Funktionen sind für gewisse Punkte z einer Menge A gleich 1 und für alle anderen Werte 0. Das sind gerade die charakteristischen Funktionen. Jeder Teilmenge A ∈ 2Z können wir eine charakteristische Funktion 1A durch 1A (z) = 1 falls z ∈ A, 1A (z) = 0 falls z ∈ Z \ A. Umgekehrt können wir jeder Funktion g auf Z, die nur die Werte 0 oder 1 annimmt, mit A = g −1 (1) eine Teilmenge aus Z zuordnen. Damit haben wir eine 121-Abbildung (121 bedeutet eineindeutig, aus dem englischen: one-toone) der Teilmengen von Z in eine wohl definierte Teilmenge von Z∗ erhalten. Wir können 1A , die Bilder von A, mit A selbst dank dieser Einbettung identifizieren. Z∗ enthält also die Teilmengen von Z. Wir können uns Z∗ damit als Verallgemeinerung des Begriffs der Teilmenge vorstellen. Die kanonische Struktur in 2Z überträgt sich auf die Menge der charakteristischen Funktionen. Insbesondere sind Produkte, Summen und Suprema von charakteristische Funktionen Operationen mit Teilmengen von Z und ebenfalls Teilmengen. Operationen und Relationen zwischen Mengen übertragen sich auf Operationen zwischen Zahlen (A ⊔ B bedeutet Vereinigung disjunkter Mengen, also A ∪ B falls A ∩ B = ∅): A⊂B C =A∩B C =A⊔B C =A∩B C =A∪B ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ 1A ≤ 1B 1C = 1A · 1B 1C = 1A + 1B 1C = inf{1A , 1B } = min{1A , 1B } 1C = sup{1A , 1B } = max{1A , 1B } Die definierte 121-Abbildung 1A ←→ A ∈ 2Z ⊂ Z∗ = {f : Z − → R} 30 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK erhält also die Ordnungsrelation, die algebraischen Operationen und die Verbandstruktur. Bei der speziellen charakteristischen Funktion 1Z lassen wir in Zukunft den Index weg und schreiben einfach 1. Das ist die konstante 1-Funktion. 1∅ ist die konstante 0-Funktion. 3.3.8 Linearkombinationen charakteristischer Funktionen Die vielfältige Struktur von R überträgt sich auf Funktionen von Z nach R also auf Z∗ . Dank der algebraischen Strukturen in R können wir Linearkombinationen der charakteristischen Funktionen bilden, etwa f= n X αi 1Ai (9) i=1 Diese Funktionen sind aus der Theorie des Lebesgueintegrals gut bekannt und heißen einfache Funktionen. Offensichtlich nimmt so eine Funktion nur endliche viele Werte an. Sie wird häufig stückweise konstante Funktion genannt (genauer wäre es so eine Funktion als Funktion mit endlichem Wertebereich zu bezeichnen). Es gilt R(f ) = {f (z1 ), ..., f (zm )} mit gewissen zi ∈ Z und m ≥ n. Die Mengen f −1 f (zi ) sind disjunkt und zerlegen Z. Wir werden deshalb im weiteren stets Darstellungen der Form (9) betrachten, für die die Ai eine disjunkte Zerlegung von Z bilden: ! n n G [ Ai = Z, heißt Ai = Z, Ai ∩ Aj = ∅, i 6= j i=1 i=1 und zi ∈ Ai liegt. Es gilt Ai = f −1 f (zi ) (10) Wir können die αi näher bestimmen: Wenden wir f in der Form (9) auf ein zj an, erhalten wir f (zj ) = n X αi 1Ai (zj ) = i=1 n X αi δij = αj i=1 mit dem Kroneckersymbol δij = 1Ai (zj ). Damit gilt f= n X i=1 f (zi )1Ai , zi ∈ Ai (11) Die Ai sind die Niveaumengen der Funktion f . Mit (10) erhalten wir aus (11) f= n X i=1 f (zi )1Ai = n X i=1 f (zi )1f −1 (f (zi )) = X x∈R x · 1f −1 (x) (12) wobei im letzten Schritt x = f (zi ) gesetzt wurde. Die Summe läßt sich über ganz R ausdehnen, da 1f −1 (x) = 1∅ = 0 für x 6∈ R(f ). 3.3 Der duale Raum Z∗ . Beobachtungen 31 Diese Schreibweise ist für Funktionen mit endlich vielen Werten sogar exakt. Sie ist eine Darstellung, die sich auf allgemeinen Funktionen veralgemeinern läßt, wenn man der Summe in (12) einen Sinn geben kann. Die Darstellung (11) erinnert an die aus der linearen Algebra bekannte Zerlegung bezüglich einer Basis. Hier wären die Basiselemente die charakteristischen Funktionen 1A . Die charakteristischen Funktionen könnte man als kanonische Basis bezeichnen. Ein einfaches Beispiel zeigt, daß sie im allgemeinen nicht die Basis von Z∗ als linearer Raum sein können. Ist Z eine endliche n-Menge, dann ist Z∗ = Rn . Die Basis besteht also aus n Elementen. Es gibt in Z aber 2n Teilmengen und damit auch 2n charakteristische Funktionen. Die charakteristischen Funktionen sind allerdings genau die extremalen Elemente von R. Wir bezeichnen sie mit Re = 1A ∈ Z∗ | A ∈ 2Z Die konvexe Kombination von Elementen aus Re ergeben Elemente aus R, im allgemeinen leider nicht alle. Das wäre eine besonders wünschenswerte Eigenschaft der Menge R. Es würde Re = extr R , Re ∼ 2Z R = conv Re gelten. Die charakteristischen Funktionen könte man damit als “Basis” für R bezeichnen, bezüglich derer man alle Elemente der konvexen Menge als konvexe Kombination von “Basiselementen” darstellen kann. Wenn Z eine endliche Menge ist, gilt dieser Zusammenhang. Allerdings ist diese Darstellung im allgemeinen nicht eindeutig (siehe die Beispiele weiter hinten). 3.3.9 Positivität charakteristischer Funktionen Offensichtlich ist 1A ≥ 0. Hieraus folgt für endliche Linearkombinationen, daß f ≥ 0 ⇐⇒ fi ≥ 0. 3.3.10 Physikalische Bedeutung von Z∗ Jede Beobachtung hat eine physikalische Bedeutung. Z.B. bedeutet 1A (z), wir testen, ob z ∈ A, d.h., ob sich das phys. System in einem Zustand aus A befindet. P Linearkombinationen von charakteristischen Funktionen i αi 1Ai kann man als verfeinerte Beobachtungen betrachten, die ermöglichen, die Zugehörigkeit des Zustandes zu Mengen gleichzeitig zu beobachten. Das erfordert aber, daß man die αi gut unterscheiden kann. Beobachtungen verhalten sich wie intensive Größen. Von solchen Größen wissen wir, daß sie sich nicht eindeutig reellen Zahlen zuordnen lassen. Zwei verschiedene Darstellungen sind aber durch affine Transformation (Verschiebung und Skalierung) inneinander überführbar. Das heißt, es reicht aus, Beobachtung aus der konvexen Menge R = {f ∈ Z∗ | 0 ≤ f ≤ 1} zu betrachten. Allerdings ist das keine echte Faktorisierung bezüglich affiner Transformationen, da in R nach wie vor affin äquivalente Beobachtunen liegen, z.B. 1 und 12 1 . 32 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK Der biduale Raum Z∗∗. Statistische Zustände 3.4 Mit Z∗ könnte man sich zufriedengeben, wir haben Abbildungen unserer physikalischen Zustände in die reellen Zahlen. Aber irgendein Mathematiker kam mal auf die Idee das ganze noch mal zu machen. Vielleicht hat er gedacht: “Wenn ich mit Funktionen Information aus meiner Menge ans Licht bringen kann, dann kann ich vielleicht mit weiteren Funktionalen Informationen über die Funktionen ans Licht bringen. Z∗ ist wieder eine Menge. Sie enthält aber die durch die algebraische Struktur der reellen Zahlen induzierte Struktur eines linearen Raumes. Wir betrachten deshalb auf Z∗ nur lineare Funktionale. Wir bezeichnen mit Z∗∗ = {p : Z∗ − → R} die Menge der linearen Funktionale auf Z∗ und nennen Z∗∗ den zu Z bidualen Raum. Die Wirkung eines Elementes p ∈ Z∗∗ auf ein Element f ∈ Z∗ nennen wir duale Paarung oder duales Produkt und schreiben hf, pi, f ∈ Z∗ , p ∈ Z∗∗ . Z∗∗ als linearer Raum linearer Funktionale 3.4.1 Nach Voraussetzung wollen wir nur linearer Funktionale betrachten, es gilt also für endliche Summen * n + n X X αi fi , p = αi hfi , pi i=1 i=1 Außerdem induziert die algebraische Struktur in R eine lineare Struktur in Z∗∗ : * n + n X X f, βj pj = βj hf, pj i j=1 3.4.2 j=1 Ordnung und Positivität Die Ordnungsstruktur in R induziert eine Halbordnung in Z∗∗ . Dank der Linearität ist das äquivalent zur Definition der Positivität. Wir nennen ein Element aus Z∗∗ , wenn seine Wirkung auf alle positiven Elemente aus Z∗ positiv ist: p ≥ 0 ⇐⇒ hf, pi ≥ 0, f ∈ Z∗ , f ≥ 0 3.4.3 Elemente in Z∗∗ als Funktionen von Mengen Auf der Teilmenge 2Z ∼ Re ⊂ Z∗ kann man die die Funktionale p ∈ Z∗∗ als Funktionen auf Mengen p : 2Z − → R betrachten. Wir benutzen dafür dasselbe Symbol und schreiben p(A) := h1A , pi Damit läßt sich die WirkungP eines Funktional p ∈ Z∗∗ auf die Linearkombination von charakteristischen Funktionen f = f (zi )1Ai auch als + * n n n X X X f (zi )h1Ai , pi = f (zi )p(Ai ) (13) hp, f i = f (zi )1Ai , p = i=1 i=1 i=1 3.4 Der biduale Raum Z∗∗ . Statistische Zustände 33 schreiben. Offenbar gilt für positive p ≥ 0, p(A) ≥ 0. D.h., ein positives Element aus Z∗∗ ist auch positiv als Funktion auf Mengen. Da für eine Linearkombination charakteristischer Funktionen Positivität äquivalent zur Positivität der f (zi ), folgt, daß – zumindest für endliche Linearkombinationen – die beiden kanonischen Halbordnungen, Positivität von p als Funktion auf Mengen und Positivität von p als Funktion auf Funktionen identisch sind. Für positive p gelten weiter folgende offensichtliche Eigenschaften: P P • A = ⊔Ai ⇐⇒ 1A = 1Ai =⇒ p(A) = p(Ai ). • p(∅) = 0 • A ⊂ B =⇒ 1A ≤ 1B =⇒ p(A) ≤ p(B) Das sind Eigenschaften, die von Maßen gefordert werden. Elemente des bidualen Raumes haben also vieles gemeinsam mit Maßen. 3.4.4 Spezielle Elemente in Z∗∗ In Z∗∗ liegen abstrakte Objekte, Funktionale. Gibt es darunter welche, die wir verstehen? Man Z könnte meinen, daß eine Beziehung der Art 22 ⊂ Z∗∗ gilt, entsprechend der Beziehung 2Z ⊂ Z∗ . Das ist aber nicht der Fall wie das Beispiel endlicher Mengen zeigt (siehe 3.4.7). Wir können für festes z auch f (z) als Funktional auf Z∗ betrachten, denn das ist eine reelle Zahl und offesichtlich ist das Funktional linear. Wir können also jedem Element z ∈ Z ein Funktional δz ∈ Z∗∗ zuordnen durch hf, δz i = f (z) Dieses Funktional wird Punktmaß oder Diracmaß genannt. Ist diese Zuordnung injektiv? Es könnte sein, daß für zwei Punkte z1 und z2 für alle f ∈ Z∗ gilt f (z1 ) = f (z2 ). Das bedeutet, daß aus der Sicht der Funktionale die beiden Punkte z1 und z2 nicht zu unterscheiden wären. Physikalisch bedeutet das, daß es keine Beobachtung gibt, die die beiden Zustände z1 und z2 des physikalischen Systems unterscheiden kann. Dann sind für uns diese beiden Zustände identisch. Dann hätten wir aber von Anfang an, bei der Definition von Z, überhaupt nicht auf die Idee kommen können, daß die Zustände verschieden sind (Hausdorffeigenschaft). Wir nehmen also an, daß dieser Fall nicht auftreten kann. Das nennt man: Die Funktionale trennen die Punkte. Tatsächlich haben wir damit eine stillschweigende Faktorisierung vorgenommen, ein Verfahren, daß in der klassischen Physik Standard ist. Es gibt in der klassischen Physik keine nichtunterscheidbaren Objekte. Damit haben wir eine 121-Zuordnung zwischen Punkten z ∈ Z und Punktmaßen δz ∈ Z∗∗ und können ab sofort diese Objekte Identifizieren δz ←→ z. Damit wird Z zu einer Teilmenge von Z∗∗ – genau wie wir jeder Teilmenge A ein Funktional – nämlich eine charakteristische Funktion – auf Z zuordnen konnten. Z ist also in Z∗∗ eingebettet. Diese Einbettung heißt kanonische Einbettung eines Raumes in seinen bidualen. Das besondere an dieser Konstruktion ist, daß wir in Z keine oder wenig Struktur haben, in Z∗∗ dagegen – das sind ja Abbildungen in die reellen Zahlen – alle Strukturen der reellen Zahlen. Wir erhalten somit in Z eine Fülle von Strukturen, die kanonisch entstanden sind, ohne daß wir sie definieren mußten. Die Funktionale aus Z∗∗ müssen auf alle Elemente aus Z∗ angewendet werden können, also auch auf charakteristische Funktionen die wir mit Teilmengen identifiziert haben. Funktionale aus Z∗∗ sind also unter anderem Funktionen von Teilmengen p(A). 34 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK Insbesondere wirken die Punktmaße auf charakteristischen Funktionen wie folgt: δz (A) = h1A , δz i = 1A (z) Das ist = 1, falls z ∈ Z ansonsten = 0. 3.4.5 Eine Basis in Z∗∗ ? Genau wie in Z∗ , liegen – als Abbildungen in die reellen Zahlen – auch Linearkombinationen von Punktmaßen in Z∗∗ . n X p= βj δzj j=1 Es seien Ai disjunkte Mengen, die jeweils nur zi enthalten, es gelte also 1Ai (zj ) = δij . Dann folgt n n n X X X βj δij = βi p(Ai ) = βj δzj (Ai ) = βj 1Ai (zj ) = j=1 j=1 j=1 und damit n X p(Aj )δzj . p= j=1 Zu beachten ist, daß die Ai zwar disjunkt sein müssen, aber keine Zerlegung von Z bilden müssen. Wir können also äquivalent auch n X p({zj })δzj . p= j=1 schreiben. 3.4.6 Z∗∗ als Algebra? Man könnte den Wunsch verspüren, auch die Multiplikativität p(f · g) = p(f ) · p(g) zu fordern, aber das kann man schon für charakteristische Funktionen nicht gewährleisten. Es müßte dann nämlich p(A ∩ B) = p(1A · 1B ) = p(1A ) · p(1B ) = p(A) · p(B) gelten, was für B = A zu p(A) = p2 (A) führt für alle A. Diese Forderung führt also auf konstante Funktionale p. Man kann Multiplikativität also nicht für alle Maße und Funktionen (oder Teilmengen) fordern. Trotzdem spielt die Multiplikativität oft eine wichtige Rolle, u.a.: • Multiplikativität für spezielle Funktionale auf allen Funktionen: Das gilt für Punktmaße und nur für diese: hf · g, δz i = (f · g)(z) = f (z) · g(z) = hf, δz i · hg, δz i • Multiplikativität für ein gegebenes Funktional und gewisse Mengen: p(A ∩ B) = p(A) · p(B) Das gilt in der Wahrscheinlichkeitstheorie für unabhängige Ereignisse (so heißen die Borelmengen der Maßtheorie in der W-Theorie). 3.4 Der biduale Raum Z∗∗ . Statistische Zustände 35 Z Es ist 22 6⊂ Z∗∗ 3.4.7 Man könnte annehmen, daß analog zum Übergang von Z zu Z∗ , für den 2Z ⊂ Z∗ folgte, sich Z beim Übergang von Z∗ zu Z∗∗ die Zahl der Elemente derart erhöht, daß 22 ⊂ Z∗∗ gilt. Das ist aber nicht der Fall. Der Grund hierfür ist, daß in Z∗∗ nicht alle Funktionen sondern nur lineare Z Funktionen liegen sollen. Das führt dazu, daß man zwischen 22 und Elementen aus Z∗∗ keine Eineindeutige Abbildung finden kann, was Voraussetzung für eine Einbettung wäre. Das sieht man am einfachsten daran, daß sowohl die leere Menge ∅ als auch die Menge {0} auf die 0 des Raumes Z∗∗ abgebildet werden. ∅ − → 0 ist klar und {0} − → 0 folgt aus {0} = 0 · {1}, d.h., egal wohin 1 abgebildet wird, wegen der Linearität muß {0} auf das 0-fache dieser Zahl abgebildet werden. Physikalische Bedeutung von Z∗∗ 3.4.8 Jetzt wollen wir untersuchen, wie man Linearkombinationen von Punktmaßen interpretieren könnte. Dazu betrachten wir die Rolle von Wahrscheinlichkeiten in der Physik. Die Berücksichtigung von Wahrscheinlichkeiten kann wenigstens aus zwei Gründen nötig sein. Die Ursache ist in beiden Fällen Mangel an Information. Es kann sein, daß 1) nicht mit Sicherheit feststellbar ist, in welchem Zustand sich das System befindet und 2) nicht mit Sicherheit vorherzusagen ist welcher Zustand nach einer Veränderung angenommen wird. Wir betrachten vorläufig der ersten Fall. Wir führen m mal ein Experiment durch und stellen fest, daß sich unser System ki mal im Zustand zi befunden hat mit m = k1 + k2 + k3 + .... Dann können wir sagen, daß sich das System mit Wahrscheinlichkeit (genauer Häufigkeit) βi = ki /m im Zustand zi befunden hat und die Größe ′ ′ z = k1 ′ ′ k2 ′ ′ k3 ′ ′ z1 + z2 + z3 + ... = β1 ′z1′ + β2 ′z2′ + β3 ′z3′ + ... m m m können wir als statistischen Zustand des Systems bezeichnen. Das ist eine konvexe Kombination von Zuständen, eine spezielle Linearkombinationen. Soetwas können wir mit Punkten aus Z aber nicht bilden, wohl aber aus Elementen aus Z∗∗ . Wir können das Funktional p= n X j=1 βj δzj , n X j=1 βj = 1, βj ≥ 0 als statistischen – oder gemischten – Zustand des Systems bezeichnen. Der Fall p = δz würde bedeuten, daß sich das System mit Sicherheit im – reinen – Zustand z befindet. Die gemischten Zustände sind also konvexe Kombinationen reiner Zustände. Und umgekehrt, die reinen Zustände sind die Zustände, die sich nicht gemischt darstellen lassen, also die extremalen Elemente der konvexen Menge der gemischten Zustände. Wir können also einem Teil der Funktionale aus Z∗∗ einen physikalischen Sinn geben. Wir können die konvexen Kombinationen von Punktmaßen als Wahrscheinlichkeiten interpretieren. Bemerkung: Es ist wichtig zu verstehen, daß die konvexe Kombination von Zuständen selbst kein Zustand ist, auch wenn Z einen lineare Menge ist. Befindet sich das System z.B. mit halber Wahrscheinlichkeit in den Zuständen z1 und z2 , so befindet es sich nicht im Zustand z = 21 z1 + 12 z2 . Das wäre auch ein reiner und kein gemischter Zustand. Es ist ein Unterschied, ob sich das System im Zustand z oder mit gleicher Wahrscheinlichkeit in den Zuständen z1 und 2 z2 befindet. Der Wunsch, anstelle von z.B. 21 δz1 + 21 δz2 lieber z1 +z als statistischen Zustand zu 2 36 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK betrachten, ist ein weitverbreiteter Fehler, der Folgefehler nach sich zieht, die die mathematische Analyse des Problems sehr erschweren können. Die konvexen Kombinationen von Punktmaßen haben die offensichtlichen Eigenschaften p ≥ 0 und h1, pi = 1. Wir nennen solche Maße Wahrscheinlichkeitsmaße und bezeichnen sie mit P = p ∈ Z∗∗ | p ≥ 0, h1, pi = 1 Die Punktmaße Pe = δz ∈ Z∗∗ | z ∈ Z} liegen in dieser Menge und bilden ihre extremalen Elemente. Wie im Falle der charakteristischen Funktionen lassen sich im Falle endlicher Mengen Z alle Elemente aus P als konvexe Kombinationen ihrer extremalen Elemente darstellen. Pe = extr P , Pe ∼ Z P = conv Pe Diese Darstellung ist – im Gegensatz zu R – eindeutig. Das liegt daran, daß die n extremalen Elemente δz affin unabhängig sind. Sie spannen eine n−1 dimensionale Hyperebene auf, aus der die konvexen Kombinationen der δz einen n−1 dimensionalen Simplex ausscheiden. Die eindeutig bestimmten Koeffizienten zu einem p ∈ P sind gerade seine baryzentrischen Koordinaten in diesem Simplex. 3.4.9 Baryzentrische Koordinaten Im Rn heißen k ≤ n Punkte P1 , P2 , ..., Pk affin unabhängig, wenn die k Vektoren P2 − P1 , ..., Pk −P1 linear unabhängig sind (hier ist egal, welcher Punkt subtrahiert wird). Die Punkte P1 , P2 , ..., Pk spannen dann einen k − 1-dimensionalen Simplex auf. Die Eckpunkte Pi dieses Simplex sind die extremalen Elemente des Simplex als konvexe Menge. Jeder Punkt P0 im Inneren dieses Simplex läßt sich eindeutig als konvexe Kombination P0 = α1 P1 + ... + αk Pk , αi ≥ 0, α1 + ... + αk = 1 der Eckpunkte darstellen. Die Koeffizienten αi heißen baryzentrische Koordinaten und lassen sich explizit als αi = S(P1 , ..., Pi−1 , P0 , Pi+1 , ..., Pk ) S(P1 , ..., Pk ) berechnen, wobei S(P1 , ..., Pk ) das Volumen des Simplexes mit den Eckpunkte Pi ist. Baryzentrische Koordinaten bestehen aus einer Koordinate mehr als lineare Koordinaten. Sie ermöglichen es, Punkte in einem Simplex zu beschreiben, unabhängig davon wo der Simplex im Koordinatensystem liegt und wie das Koordinatensystem skaliert ist. Beispielsweise hat der Schwerpunkt in jedem Dreieck die baryzentrischen Koordinaten ( 13 , 31 , 31 ). Absolute lineare Koordinaten des Schwerpunktes lassen sich natürlich nicht angeben. Bemerkung: Im Dreieck gibt es neben baryzentrischen Koordinaten auch noch trilineare Koordinaten, die anders definiert sind und keine konvexe Kombination bilden. 37 3.5 Die duale Paarung 3.5 3.5.1 Die duale Paarung Extensive und intensive Größen Die duale Paarung für endliche Linearkombinationen (13) hp, f i = n X f (zi )p(Ai ) i=1 läßt sich interpretieren als Summ von Produkten intensiver Größen (mittelnde Funktionen von Punkten f ) mit extensiven Größen (additive Funktionen von Mengen p). Die mittelnde Eigenschaft von f wird beim Zusammenfassen von Objekten deutlich: Aus f (z)p(A1 ⊔ A2 ) = f (z) p(A1 ) + p(A2 ) = f (z1 )p(A1 ) + f (z2 )p(A2 ) folgt f (z) = p(A1 ) p(A2 ) f (z1 )p(A1 ) + f (z2 )p(A2 ) = f (z1 ) + f (z2 ) p(A1 ) + p(A2 ) p(A1 ) + p(A2 ) p(A1 ) + p(A2 ) Wir betrachten eine Menge A, die nicht Z sein soll, eine Zerlegung von A = ⊔i Ai , ein f ∈ Z∗ und den Ausdruck n X q(A) = f (zi )p(Ai ) (14) i=1 Wir können dadurch auf Pe ein Funktional q durch h1A , qi = q(A) = n X f (zi )p(Ai ) i=1 definieren. Damit läßt sich q auf Linearkombinationen ausweiten. Es sei g = Wir betrachten hg, qi. Dazu müssen wir q auf 1Bj anwenden. Es sei q(Bj ) = h1Bj , qi = mit zji ∈ Aji und hg, qi = = m X i i,j=1 j=1 g(zj )1Bj . f (zji )p(Aji ) i=1 Aji = Bj . Das ergibt g(zj )h1Bj , qi = j=1 n,m X S n X Pm m X j=1 g(zj ) n X f (zji )p(Aji ) = i=1 n,m X g(zj )f (zji )p(Aji ) = i,j=1 g(zji )f (zji )p(Aji ) = hg · f, pi Im vorletzten Schritt wurde verwendet, daß g auf Bj und damit auch auf allen Aji konstant ist. Es gilt also g(zj ) = g(zji ). Im letzten Schritt wurde S die Summe als Linearkombination von charakteristischen Funktionen auf der Zerlegung Z = ij Aji betrachtet. Formal gilt diese Darstellung nur für endliche Linearkombinationen, aber die rechte Seite ist für alle Elemente f, g ∈ Z∗ definiert, da Z∗ eine Algebra ist. Wir können also die durch (14) definierte Größe als Element aus Z∗∗ betrachten. Diese Darstellung läßt sich als Darstellung einer extensiven Größe q als duale Paarung einer intensiven f und einer extensiven Größe p interpretieren. 38 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK 3.5.2 Verallgemeinerungen Im allgemeinen wären folgende Darstellungen wünschenswert: X X X X x · 1f −1 (x) p {z} δz p= pj δzj = f= fi 1Ai = j z∈Z X x∈R X x∈R x · p f −1 (x) = hf, pi = Riemannintegral z∈Z f (z) · p {z} Lebesgueintegral Beweis der Gleichheit: X X X X hf, pi = x · p f −1 (x) = x· p {z} = f (z) · p {z} x∈R x∈R z∈Z z|f (z)=x Für f = 1 erhält man hieraus X p {z} h1, pi = p(Z) = z∈Z 3.6 Zusammenfassung Z∗ Z∗∗ Typ der Welt geistig materiell Typ der Größe intensiv (mittelnd) extensiv (positiv, additiv) Funktionen von Punkten Mengen kanonische Objekte, “Basis” Re = {1A , A ∈ 2Z } Pe = {δz , z ∈ Z} Dualität sinnvolle Elemente extremale Elemente konvexe Hülle 1A (z) = = δz (A) R = {f : 0 ≤ f ≤ 1} P = {p : p ≥ 0, p(Z) = 1} Re = extr R Pe = extr P R = conv Re P = conv Pe Re = 2Z Pe = Z Da Z in Z∗∗ erhalten ist, gibt es keinen Grund, sich weiter für Z zu interessieren. Wir haben zwei lineare Räume Z∗ und Z∗∗ gefunden, mit denen sich alle relavanten Probleme beschreiben lassen. Wir können von Z∗∗ zu Z auf folgendem Weg gelangen: Z∗∗ − → P− → extr P = Pe = Z und analog Z∗ − → R− → extr R = Re = 2Z . Das sind Möglichkeiten, aus der Menge der Potenzmenge die Menge selbst und umgekehrt zu erhalten. 39 3.7 Probleme 3.7 Probleme An Beispielen haben wir gesehen, daß es sinnvol ist, für den Zustandsraum Z die Möglichkeiten • Z ist eine endliche Menge • Z ist eine abzählbare Menge • Z ist ein Kontinuum zuzulassen. Falls Z eine endliche Menge ist, ist die vorgestellt Konstruktion mathematisch einwandfrei. Es ergibt sich Z∗ = Rn und Z∗∗ = R∗n . Im Falle, daß Z eine abzählbare Menge ist, muß geklärt werden, wie die Summen zu verstehen sind, wenn sie sich über unendlich viele Elemente erstrecken. Ohne den Begriff des Grenzwertes ist hier eine einwandfreie mathematische Konstruktion nicht möglich. Mit diesen Problemen werden wir uns später beschäftigen. Im Falle, daß Z die Mächtigkeit eines Kontinuums hat, gibt es bereits bei der Definition von Summen Probleme. Das ist vielleicht am offensichtlichsten an der wünschenswerten Gleichung X p {z} h1, pi = p(Z) = z∈Z Es gilt folgender Satz: Ist die Summe von einer gewissen Anzahl nichtnegativer reeller Zahlen endlich, können höchstens abzählbar viele von ihnen echt positiv sein. Beweis: Es sei M die Menge der gegebenen nichtnegativen reellen Zahlen. Wir bilden Bk = 1 {x ∈ M| k+1 < x ≤ k1 }, die Menge der Elemente aus M, die zwischen aufeinanderfolgenden Stammbrüchen liegen. Diese Mengen sind disjunkt. Offensichtlich liegen in jeder Menge Ik nur endlich viele Elemente, denn sonst wäre ihre Summe bereits ∞. Andererseits liegt jede strikt positive Zahl in irgendeiner der Mengen Bk . Die Menge ∪k Bk enthält also alle strikt positiven Zahlen. Sie ist als abzählbare Vereinigung endlicher Mengen abzählbar. Eine analoge Frage ist, ob man eine Funktion f ∈ R als konvexe Kombination von extremalen Elementen aus Re darstellen kann: X f= αi 1Ai i∈I Es ist klar, daß es nur abzählbar viele echt positive αi geben kann. Damit erscheint es unmöglich, eine Funktion f mit mehr als abzählbar vielen Freiheitsgraden derart darzustellen. D.h., es ist prinzipiell sinnlos, von Summen über mehr als abzählbar viele positive Zahlen zu sprechen. Das ist gut aus der Maßtheorie bekannt. Dazu dient der dort eingeführte Begriff der σ-Additivität. Als erstes sollte man überlegen, inwiefern der Begriff der Menge überhaupt der Realität entnommen ist. Eine Menge ist eine Zusammenfassung wohlunterscheidbarer Objekte der Natur oder des Denkens. Das bedeutet u.a. auch, daß man von einem Objekt genau sagen kann, ob es zur Menge gehört oder nicht. Endliche diskrete Mengen sind deshalb sicher sinnvoll als Mengen zu betrachten. Auch Mengen mit abzählbar vielen Elementen kann man sich noch vorstellen. Allerdings haben sich nicht 40 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK ohne Grund – wie wir noch sehen werden – die antiken griechischen Mathematiker selbst mit solchen Mengen schwer getan. Aber bei Kontinua hört der Spaß endgültig auf. Wir wollen dazu ein paar Probleme betrachten. 3.7.1 Paradoxa mit Kontinua, reellen Zahlen und Beobachtungen Kontinua werden u.a. in folgenden Situationen benutzt: • Gebiete im euklidischen Raum, der als physikalischer Raum interpretiert wird • Beliebig teilbare Wahrnehmungen (Helligkeit, Alk.gehalt, ..) • reelle Zahlen als Beobachtungsergebnisse (Meßwerte) An die ersten beiden Punkte haben wir uns dermaßen gewöhnt, daß wir darauf nicht verzichten wollen. Dabei wollen wir das Problem, was das physikalische intuitive Kontinuum mit dem mathematischen (reelle Zahlen) zu tun hat nicht untersuchen. Meistens wird in der Physik eine Größe dann als kontinuierlich bezeichnet, wenn zwischen zwei Werten auch alle Zwischenwerte möglich sind, d.h. wenn zu jedem Wert ein physikalisches Objekt existiert, für das die untersuchte Größe diesen Wert annimmt. Diese Definition ist insofern unvollständi, da sie nicht erklärt, was für Werte eine physikalische Größe annehmen kann. Implizit ist immer gemeint: jede reelle Zahl. Das setzt per definitionem das physikalische und das mathematische Kontinuum gleich. Einerseits ist klar, daß rationale Zahlen für physikalische Größen nicht ausreichen. Das wußten schon die Griechen. Andererseits ist auch klar, daß niemals für jede reelle Zahl ein entsprechendes physikalisches Objekt gefunden werden kann, da es nur endlich viele und mit gutem Vorstellungsvermögen vielleicht abzählbar viele Meßwerte geben kann. 3.7.2 Reelle Zahlen und Beobachtungen Man benutzt zwar real nur die rationalen Zahlen, braucht aber die reellen Zahlen um eine absolute Obermenge zu haben, in der alle Meßwerte bei beliebiger Meßgenauigkeit und alle möglichen Lösungen von Gleichungen drinliegen. Der Grund (und die Sinnhaftigkeit) der reellen Zahlen liegt in der Abgeschlossenheit. Der Mittelwertsatz für beliebige stetige Funktionen funktioniert nur in den reellen Zahlen. Reelle Zahlen kann man als Grenzwerte von Folgen rationaler Zahlen definieren. Das führt sofort zur Überabzählbarkeit und damit zu einer Reihe von Paradoxa: • Mit den reellen Zahlen lassen sich keine tatsächlichen Vorhersagen treffen. Angenommen, wir vergleichen mit einer Balkenwaage die Massen dreier Kugeln m1 , m2 und m3 ist folgendes Ergebnis möglich: m1 = m2 , m2 = m3 . Werden die mi als reelle Zahlen interpretiert, folgt m1 = m3 . In der Realität kann aber aufgrund der Meßgenauigkeit m1 6= m3 erhalten werden (z.B. bei einer Meßgenauigkeit von 0.5g: m1 = 5.1g, m2 = 5.5g, m3 = 5.9g). Meßergebnisse kann man praxisgerechter besser als “Enthaltensein in offenen Mengen” interpretieren: m1 m2 m3 m1 = m2 , m2 = m3 6=⇒ m1 = m3 Benutzt man natürliche Zahlen zum Messen der Masse, indem man etwa die Atome zählt, tritt diese Paradoxon nicht auf. 41 3.7 Probleme • Von zwei reellen Zahlen x und y, die als Dezimalbrüche gegeben sind, läßt sich x 6= y durch sukzessive Stellenberechnung beweisen, x = y dagegen nicht. Als Beispiel betrachten wir zwei reelle Zahlen x und y: π x = tan 7.5◦ = tan √ √ 24 √ 6+ 2− 3−2 y = x = y = 0.131652497... ÜA 4a: Entscheide of x = y oder x 6= y. Beweis daß x = y: Wir gehen von der bekannten Tatsache tan π3 = aus der Lösung der quadratischen Gleichung tan 2α = √ 3 aus und erhalten 2 tan α 1 − tan2 α sukzessive π 3 π tan 6 π tan 12 π tan 24 tan Aus 2 p q = = √ 3 1√ 3 3 √ = 2− 3 p √ q √ √ 1− 8−4 3 √ = (2 − 3) 8 − 4 3 = = 3−2 q q √ √ √ √ = −2 − 3 + 2 8 − 4 3 + 3 8 − 4 3 √ q√ √ √ √ 8 − 4 3 = ( 6 − 2)2 = 6 − 2 folgt √ 8−4 3+ √ 3 q √ √ √ √ √ √ √ 8 − 4 3 = 2( 6 − 2) + 3 2 − 6 = 6 + 2 und damit die Behauptung. Im Gegensatz dazu sind die beiden Zahlen 3 x = 640320 + 744 √ π 163 = 262537412640768743.9999999999992500725971981856888... y = e ab der 31. Stelle tatsächlich verschieden. Hier ist die Verschiedenheit offensichtlich, weil x ganz und y transzedent ist. • Sind reelle Zahlen z.B. gleichverteilt (jede Verteilung ist geeignet) so kann es sein, daß die Wahrscheinlichkeit, daß x genommen wird 0 ist für fast alle x. Trotzdem wird aber ein ganz konkretes x angenommen. • Keine Wahrscheinlichkeiten (Punkt auf der Kugel) • Reelle Zahlen sind im allgemeinen Grenzwerte von Folgen rationaler Zahlen und als Grenzwerte prinzipiell nicht empirisch ermittelbar. 42 3.7.3 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK Die Potenzmenge ist zu groß Neben der Menge Z an sich benötigen wir noch die Potenzmenge 2Z . Die Dualität der Mengen Z∗ und Z∗∗ spiegelte sichgerade in der Dualität von Elementen und Teilmengen wieder. Neben der möglichen Überabzählbarkeit von Z, die Probleme bereitet, ist 2Z bereits für abzählbare Z überabzählbar, da sich die Kardinalität beim Übergang von einer Menge zu seiner Potenzmenge erhöht. Dieser Umstand spielt sogar bei endlichen Mengen eine Rolle, obwohl man ihn erst bei praktischen, nicht bei theoretischen Problemen wahrnimmt. Hat man etwa ein numerisches Problem für Mengen mit n Elementen gestellt, kann es sein, daß es seine Lösung erfordert alle Teilmengen (2n Stück) oder alle Funktionen in eine k-Menge (k n Stück) zu betrachten. Solche Problem heißen NP-vollständig und sind de facto unlösbar, wenn es nicht gelingt einen Algorythmus mit einer kleineren Komplexität zu finden. 43 3.8 Beispiel: Endliche Mengen. Übungsaufgaben 3.8 Beispiel: Endliche Mengen. Übungsaufgaben 3.8.1 Der Fall Z = {z1 , z2 , z3 } Ist Z = {z1 , z2 , z3 } eine Mengen aus drei Elementen, dann ist eine Abbildung in die reellen Zahlen eineindeutig gegeben, wenn klar ist, welcher reellen Zahl z1 , welcher reellen Zahl z2 und welcher reellen Zahl z3 zugeordnet ist. Sind die drei reellen Zahlen g1 , g2 und g3 , so entspricht jeder solchen Abbildung ein Tripel g = (g1 , g2 , g3 ). Es ist also Z∗ = {(g1 , g2, g3 ) | gi ∈ R} Damit ist Z∗ der dreidimensionale reelle Raum, ohne Berücksichtigung irgendeiner Norm (später wird noch eine geeignete Norm dazu genommen). Wir nennen ihn R3 . Charakteristische Funktionen sind Tripel g, mit gi = 1 oder gi = 0. Davon gibt es 23 = 8 Stück. Das sind die extremalen Elemente des Würfels R = {g ∈ R3 | 0 ≤ gi ≤ 1} Den dualen Raum Z∗∗ zu Z∗ bezeichne wir mit R∗3 . Es ist ebenfalls der dreidimensionale reelle Raum, allerdings wird er eine andere Norm erhalten. Die Menge der statistischen Zustände ist der zweidimensionale Simplex o n P = p ∈ R∗3 p1 + p2 + p3 = 1, pi ≥ 0 Seine extremalen Elemente sind die kanonischen 1 0 Pe = δz1 = 0 , δz2 = 1 , δz3 = 0 0 Basisvektoren 0 0 1 Es bietet sich an, Vektoren aus R3 und R∗3 als Zeilen– bzw. Spaltenvektoren zu unterscheiden. Die duale Paarung ist dann die übliche Matrizenmultiplikation p1 hg, pi = (g1 , g2 , g3 ) p2 = g1 p1 + g2 p2 + g3 p3 p3 Re✏✏◗✉ ✏✏ ◗ ✏✏ ◗ ✏ ✏ ◗ ✏ ✉✏ ◗ ◗ ◗ ◗ ◗ ◗ ◗◗✉ ◗ ✏ ✏ ◗ ✏✏ ◗ ✏ ✏ ◗ ✏✏ ◗◗✏ ✏ ✉ ✶ ✏ ✏✏ ✏✏ z2 ✉ ✏ ✏✏ ◗◗ ✏✏ ✏ ◗ ✏✏ ◗ ✏✏ ✉ ◗ ◗ ◗ ◗ ◗ ◗ ◗◗✉ ◗ ✏✏ ◗ ✏ ◗ ✏✏ ◗ ✏✏ ✏ ◗ ✏ ✏ ◗✉ ◗ ◗ ◗ z1 ◗ ◗ s ◗ ✻ z3 ✻ z3 1 ✉ R ✔ ✔ ✔✔❚❚ ❚ 0 Pe ❚ ❚ ❚ ❚ ❚ ❚ ✑◗ ❚ ✑ ◗ ✔ ❚ ✑ ◗ ✑ ◗ ✔ ❚ ◗ ✔ ✑✑ ◗ ❚ ◗❚ ✔✑ ✑ ◗❚✉ ✉ ✔ ◗ z1 ✑✑1 1 ◗ z2 ✑ ◗ ✰ ✑ s ◗ ✔ ✔ ✔ ✔ ✔ ✔ P 44 3 LINEARE DUALITÄTSTHEORIE. HEURISTIK 3.8.2 Berechnung von konvexen Kombinationen in R2 ÜA 5a) Es sei R2 das Quadrat im R2 mit den Eckpunkten (0, 0), (1, 0), (0, 1), (1, 1). Finde die allgemeine Darstellung eines Punktes x = (x1 , x2 ) innerhalb dieses Quadrates als konvexe Kombination der Eckpunkte. Lösung: Die allgemeine Lösung ist 1 1 0 0 x1 + (x1 + x2 − t) + (t − x2 ) + (t − x1 ) = (1 − t) 1 0 1 0 x2 wobei an den Parameter t die Bedingungen min{1, x1 + x2 } ≥ t ≥ max{x1 , x2 } gestellt werden müssen (sonst bilden die Koeffizienten keine konvexe Kombination). Spezielle (Rand-)Lösungen wären t = 1, t = x1 + x2 und t = x2 > x1 1 1 0 0 x1 + (x1 + x2 − 1) + (1 − x2 ) + (1 − x1 ) =0 1 0 1 0 x2 x1 x2 x1 x2 3.8.3 = (1 − x1 − x2 ) = (1 − x2 ) 0 0 0 1 + x1 + (x2 − x1 ) 0 1 0 0 + x2 +0 1 0 1 0 1 1 + x1 1 1 +0 Berechnung von konvexen Kombinationen in Rn ÜA 5b) Es sei Rn der n-dim Würfel im Rn mit den 2n Eckpunkten (0, ..., 0), ..., (1, ..., 1). Finde eine Darstellung eines allgemeinen Punktes x = (x1 , x2 , ..., xn ) innerhalb dieses Würfel als konvexe Kombination seiner extremalen Elemente. Lösung: Es sei x = (x1 , x2 , ..., xn ) ein beliebiger gegebener Vektor. O.B.d.A. kann x1 ≤ x2 ≤ ... ≤ xn angenommen werden. Das kann durch Umnummerierung der Zustände z1 stets erreicht werden. Wir schreiben die Darstellung für R4 auf: 0 0 0 x1 0 0 0 x2 x3 = (1 − x4 ) 0 + (x4 − x3 ) 0 + (x3 − x2 ) 1 + 1 1 0 x3 1 0 1 1 + (x2 − x1 ) 1 + x1 1 1 1 Nach Voraussetzung ist xk ≥ xk−1 , x1 ≥ 0 und 1 ≥ x4 . Deshalb sind alle Koeffizienten nichtnegativ. Offensichtlich ist auch die Summe 1. Die allgemeine Lösung kann leicht hieraus gefolgert werden. x = (1 − xn )P0 + n−1 X k=1 (xn+1−k − xn−k ) k X i=0 Pk + x1 n X k=1 Pk 3.8 Beispiel: Endliche Mengen. Übungsaufgaben 45 oder kompakter, wenn man xn+1 = 1 und x0 = 0 setzt: ! n k X X x = (xn+1−k − xn−k ) Pk = i=0 k=0 = (xn+1 − xn )P0 + (xn − xn−1 )(P0 + P1 ) + + (xn−1 − xn−2 )(P0 + P1 + P2 ) + ... + (x2 − x1 )(P0 + P1 + ... + Pn−1 ) + + (x1 − x0 )(P0 + P1 + ... + Pn ) Hier ist P0 = ∅ der Koordinatenursrpung und Pi = {zi }. P Für kleine Koordinaten mit i xi ≤ 1 wäre auch ! n n X X x= 1− xi P0 + xi Pi i=1 i=1 eine Lösung. 3.8.4 Der Satz des Pythagoras im Simplex ÜA 5c) Ein rechtwinkliger Simplex im Rn sei gegeben durch die n Schnittpunkte einer Ebene mit den Koordinatenachsen und dem Koordinatenursprung. Dabei entstehen n + 1 “Seitenflächen” der Dimension n − 1. Es sei Ai der Flächeninhalt der Seitenfläche senkrecht auf der i-ten Koordinatenachse und A der Flächeninhalt der Grundfläche (gebildet von den Koordinatenachsenschnittpunkten). Beweise den Satz des Pythagoras im Simplex: A2 = A21 + A22 + ... + A2n Beweis: