Vektorrechnung Vektor Ein Skalar hat einen Betrag aber keine Richtung. Beispiel: Temperatur, Masse. Ein Vektor ist eine Größe mit einem Betrag und einer Richtung. Beispiele für einen Vektor sind die Geschwindigkeit und Kraft. Vektoren werden durch Pfeile dargestellt. Das Bild links zeigt drei verschiedene Vektoren. Unter einem Vektor versteht man die "Menge aller Pfeile" mit gleicher Richtung und gleichem Betrag. Repräsentant des Vektors Jeder Pfeil aus dieser Menge ist ein sogenannter Stellvertreter oder "Repräsentant des Vektors". Schreibweisen Einen Vektor kennzeichnet man oft durch einen Pfeil oder durch Fettdruck. In modernen, computergeschriebenen Texten werden Vektoren auch durch Unterstreichen markiert. Frakturschrift In älteren Veröffentlichungen werden Vektoren, aber auch andere mathematische und physikalische Größen, mit Frakturbuchstaben gekennzeichnet. Abgebildet ist jeweils der Buchstabe in unserer heutigen Schrift und darunter der Groß- und Kleinbuchstabe in Frakturschrift. Vektorraum Eine Menge V heißt Vektorraum, wenn für ihre Elemente (Vektoren) eindeutige, stets ausführbare Addition und Multiplikation definiert sind und es gilt: ∀ a→, b→, c→ ∈ V und r,s ∈ R 1. Kommutativgesetz a→ + b→ = b→ + a→ 2. Assoziativgesetz (a→+b→)+c→ = a→+(b→+c→) → → 3. Zu je zwei a , b gibt es stets genau ein c→ mit a→ + c→ = b→ 4. Einselement 1a→ = a→ 5. Distributivgesetz (r+s) a→ = r a→ + s a→ 6. Distributivgesetz r (a→ + b→) = r a→ + r b→ 7. Assoziativgesetz r (s a→) = (rs) a→ Die Elemente von V werden als Vektoren bezeichnet; das neutrale Element der additiven Gruppe heißt Nullvektor. Ein Vektor ist durch seinen Betrag (Länge) sowie Richtung und Orientierung charakterisiert. In einem Vektorraum V über einem Körper K gilt: 0v→ = 0→ ; für alle v→ ∈ V a0→ = 0→ ; für alle a ∈ K (-1)v→ = -v→ v→ ∈ V und a ∈ K gilt: Aus av→ = 0→ folgt a = 0 oder v→ = 0→. Nullvektor o→ ⇔ Betrag = 0 Der Nullvektor ist ein Vektor vom Betrag Null, Anfangs- und Endpunkt fallen zusammen. Der Nullvektor hat die Länge Null und eine unbestimmte Richtung. Einheitsvektor ⇔ Betrag = 1 Entgegengesetzter Vektor zu a→ ⇔ Entgegengesetzter Vektor zu a→ ist der Vektor -a → mit gleichem Betrag, gleicher Richtung und entgegengesetzter Orientierung. Es gilt: a→ + (-a→) = o→ Basis eines Vektorraumes ... ein in einer festen Reihenfolge angeordnetes linear unabhängiges System Bn von Vektoren aus Vn mit der Eigenschaft, dass sich jeder Vektor aus Vn auf genau eine Weise als Linearkombination der Elemente von Bn darstellen Rechte-Hand-Regel ... gestreckter Daumen (ex) und Zeigefinger (ey) und der um 90° abgewinkelte Mittelfinger (ez) der rechten Hand bilden ein für eine dreidimensionale Basis ein Rechtssystem Dimension eines Vektorraumes ... Anzahl der Basisvektoren orthogonale Basis ... Basisvektoren sind paarweise senkrecht zueinander Orthonormalbasis ... Basisvektoren stehen senkrecht aufeinander und sind normierte Einheitsvektoren 172 kartesische Basis (Einheitsvektoren) ... geradliniges Orthonormalbasissystem, das eine besonders einfache geometrische Interpretation der zu beschreibenden Probleme erlaubt normierte Basis ... Basisvektoren sind Einheitsvektoren Freier Vektor ... darf beliebig verschoben, aber nicht gespiegelt, nicht gedreht und nicht skaliert werden. Linienflüchtiger Vektor ... Vektor, der entlang seiner Wirkungslinie beliebig verschiebbar ist. Kräfte am starren Körper sind linienflüchtige Vektoren. Gleichheit von Vektoren Zwei Vektoren werden als gleich betrachtet, wenn sie in Betrag und Richtung übereinstimmen. Gleich lange Vektoren sind nur dann gleich, wenn sie ohne Drehung (Rotation), nur durch eine Parallelverschiebung, zur Überdeckung gebracht werden können. Parallele Vektoren ... können durch Parallelverschiebung auf dieselbe Gerade gebracht werden. Gleichgerichtete Vektoren ... haben die gleiche Richtung. Entgegengesetzte (antiparallele) Vektoren ... haben entgegengesetzte Richtungen. Vektorfeld Gesamtheit der den Raumpunkten zugeordneten Vektoren; Funktion von Rn nach Rn Beispiele: Gravitationsfeldstärke, magnetische Feldstärke, elektrische Feldstärke Beispiele für Vektorräume Nullvektorraum {0→} mit 0→ + 0→ = 0→ und 0→ = a0→ für alle a ∈ K ist ein K-Vektorraum, der Nullvektorraum. Einfache Beispiele Der euklidische Vektorraum Rn ist eine Vektorraum über den reellen Zahlen. Allgemein kann man für einen beliebigen Körper K den Vektorraum Kn definieren. Dieser enthält die n-Tupel von Elementen aus K als Vektoren, deren Addition und Skalarmultiplikation komponentenweise definiert ist. R ist ein Q-Vektorraum, wie aus den Körpereigenschaften von R folgt. Ebenso ist C ein R-Vektorraum und ein Q-Vektorraum. Allgemein gilt: Jeder Körper L, der K als Teilkörper enthält, ist ein Vektorraum über K. Vektorraum der Abbildungen Sei X eine nicht leere Menge, und sei Abb(X, K) = {f: X → K} die Menge der Abbildungen von X mit Werten aus K. Für Abbildungen f, g ∈ Abb(X, K) und a ∈ K definiert man (1) Addition f + g: (f+g)(x) = f(x) + g(x) ; ∀x ∈ X (2) Skalarmultiplikation a f: (af)(x) = a f(x) ; ∀x ∈ X Die Operationen werden punktweise für alle x ∈ X definiert. Abb(X, K) wird dadurch zu einem K-Vektorraum. Dass Abb(X, K) ein K-Vektorraum ist, zeigt man durch Rückführung auf die entsprechenden Vektorraumeigenschaften von K. Das neutrale Element der Addition, der Nullvektor, ist die Nullabbildung, die jedes Element aus X auf 0→ ∈ K abbildet. Die zu f inverse Abbildung -f ist fann -f(x). Bei Abb(X, K) handelt es sich um einen Funktionenraum mit Werten in K. Für zwei Vektorräume V und W über dem selben Körper kann man Abb(V, W) mit zu (1) und (2) analogen Festlegungen den Vektorraum aller Abbildungen zwischen den beiden Vektorräumen definieren. Polynomvektorraum Es sei Pn die Menge aller Abbildungen f von R in R, die durch Formeln der Form f(x) = an · xn + an-1 · xn-1 + ... + a1 · x + a0 (an, an-1, ..., a0 ∈ R) beschrieben werden können. Pn ist die Menge aller Polynome, deren Grad höchstens n ist. Auf der Menge Pn lassen sich eine Addition und eine Multiplikation mit Skalar (aus R) wie folgt erklären: Für f(x) := Σi=0n ai · xi und g(x) := Σi=0n bi · xi n seien (f+g)(x) := Σi=0 (ai+bi) · xi und (c·f)(x) := Σi=0n (c ai) · xi wobei c reelle Zahl ist. Pn bildet zusammen mit den definierten Operationen einen Vektorraum über R. Indem man die Koeffizienten der Polynome nur aus Q oder aus C wählt, erhält man analog zu oben auch Vektorräume über Q oder C. Der Vektorraum Pn lässt sich verallgemeinern. Bekanntlich ist die Summe zweier stetiger Funktionen über einem gewissen Intervall [a,b] und auch das λ-fache einer stetigen Funktion wieder eine stetige Funktion, λ ∈ R. Damit ist die Menge C[a,b] aller 173 stetigen Funktionen, die den Definitionsbereich [a,b] ⊆ R haben, zusammen mit den auf natürliche Weise erklärten Addition und Multiplikation mit Skalar ein Vektorraum über R. Anstelle des Intervalls [a,b] können auch halboffene oder offene Intervalle [a,b), (a,b] oder (a,b) gewählt werden. Kartesisches orthonomiertes Koordinatensystem Punkt 0 und paarweise senkrecht aufeinander stehende Einheitsvektoren i→, j→, k→ → → → i , j , k bilden in dieser Reihenfolge ein Rechtssystem Ortsvektor des Punktes P1(x1,y1,z1) x→ = x1 i→ + y1 j→ + z1 k→ Vektor, dessen Anfangspunkt (O) im Koordinatenursprung liegt und dessen Spitze zum Punkt P führt Komponentendarstellung x→ = (ax, ay, az) → Betrag eines Vektors | x | = √[ ax² + ay² + az² ] Beispiel: Ortsvektor des Punktes (3; 2.5; 3.5) Ist ein Punkt P gegeben, so sind P' der Grundriss, P" der Aufriss und P"' der Kreuzriss des Punktes. Der Koordinatenquader ist der Quader, dessen Kantenlängen die Absolutbeträge der Koordinaten des Punktes P(xP, yP, zP) besitzen. Ein Koordinatenweg ist ein im Ursprung beginnender und in P endender Streckenzug aus drei Kanten eines Koordinatenquaders, welcher alle drei Koordinaten von P zeigt. Linkskoordinatensystem, Rechtskoordinatensystem Prinzipiell existieren zwei Möglichkeiten zur Orientierung der drei Achsen eines kartesischen Koordinatensystems im R³. Im Allgemeinen wird in der Mathematik das Rechtskoordinatensystem bevorzugt. Für dieses gilt die Rechte-Hand-Regel: "x-Achse, y-Achse und z-Achse eines Rechtskoordinatensystems sind orientiert wie Daumen, Zeigefinger und Mittelfinger der rechten Hand" Bei einem; selten genutzten; Linkskoordinatensystem gilt die Orientierung für die linke Hand. Richtungskosinus des Ortsvektors r→ in der Ebene x = | r→ | cos α y = | r→ | sin α α = ∠ ( i→, r→ ) im Raum x = | r→ | sin β cos α y = | r→ | sin β sin α z = | r→ | cos β → → → → → α = ∠ ( i , i x + j y) β = ∠ ( k , r ) y = | r→ | cos β z = | r→ | cos γ bzw. x = | r→ | cos α mit cos² α + cos² β + cos² γ = 1: cos α = x/√(x² + y² + z²) cos β = y/√(x² + y² + z²) cos γ = z/√(x² + y² + z²) →0 r =r → → /|r Einheitsvektor in Richtung r→, Gerichteter Einheitsvektor | Addition von 2 Vektoren a→ + b→ = (ax+bx, ay+by, az+bz) Die Addition mehrerer Vektoren erfolgt nach der Polygonregel: Der jeweils nächste zu addierende Vektor wird mit seinem Anfangspunkt am Endpunkt des vorherigen abgetragen. Dies führt zu einem Polygon. Ist das Vektorpolygon geschlossen, so ist der Summenvektor der Nullvektor. Führt die Vektoraddition von Kräften zum Nullvektor, so heben sich die Kräfte in ihrer Wirkung gegenseitig auf. Beispiel: Kräfte sind vektorielle Größen Teilkräfte F→1, F→2 ; Resultierende Kraft F→R 1. gleiche Wirkungslinie: Summe der Beträge, Wirkungslinie bleibt erhalten FR = F1 + F2 2. gleicher Angriffspunkt Kräfte werden vektoriell addiert F→R = F→1 + F→2 FR = √( F1² + F2² + 2 F1F2 * cos (α + β) ) für rechtwinklig wirkende Kräfte FR = √( F1² + F2²) Richtung der resultierenden Kraft sin α = F2/FR * sin (α+β) 174 sin β = F1/FR * sin (α+β) Durch mehrfaches Anwenden des Kräfteparallelogramms können mehrere Kräfte zu einer Gesamtkraft F zusammengesetzt werden. Zerlegung von Kräften ... zu zerlegende Kraft F→, Teilkräfte F→1, F→2, Winkel α zwischen F→1 und F→, Winkel β zwischen F→2 und F→ F1 = F * sin α / sin(α + β) F2 = F * sin β / sin(α + β) Sind die Komponenten F1 und F2 senkrecht zueinander, gilt F1 = F * sin α = F * cos β F2 = F * sin β = F * cos α Um eine Kraft eindeutig in zwei Teilkräfte zu zerlegen, müssen entweder die Richtungen oder die Beträge der Teilkräfte bekannt sein. Parallele Kräfte ... die Wirkungslinien paralleler Kräfte besitzen keinen Schnittpunkt. Für die Summe ihrer Beträge gilt FR = F1 + F2 Die Wirkungslinie der Resultierenden teilt den Abstand beider Kräfte im umgekehrten Verhältnis beider Kräfte. Hinweis: Bei antiparallelen Kräften liegt die Resultierende außerhalb und nicht zwischen den beiden Kräften! Die Wirkungslinien paralleler Kräfte haben keinen Schnittpunkt. Man addiert daher zu jeder Kraft eine Hilfskraft. Die Hilfskräfte müssen den gleichen Betrag und die entgegengesetzte Richtung haben; sie heben sich dann gegenseitig auf und ändern nichts am Resultat. Dann addiert man die Resultierenden aus Kraft und jeweiliger Hilfskraft wie Kräfte mit verschiedenen Angriffspunkten zur Gesamtresultierenden. Die Abstände der beiden Ausgangskräfte zur Gesamtresultierenden sind umgekehrt proportional zu den Beträgen der Kräfte. Kräfte mit verschiedenen Angriffspunkten ... diese Kräfte verschiebt man auf ihren Wirkungslinien bis zu ihrem Schnittpunkt und wendet darauf das Kräfteparallelogramm an. Subtraktion a→ - b→ = a→ + (-b→) Dreiecksungleichung für Vektoren | a→ + b→ | ≤ | a→ | + | b→ | | a→ - b→ | ≥ | a→ | - | b→ | Gegensatz zum Rechnen mit reellen Zahlen: Der Betrag der Summe zweier Vektoren kann kleiner sein als der Betrag ihrer Differenz, nämlich dann, wenn der von den Vektoren eingeschlossene Winkel größer als 90° ist. Multiplikation von Vektoren Vielfachbildung mit Skalar r und s sind beliebige reelle Zahlen, Skalare r a→ = r a1x→ + r ay j→ + r az k→ r (s a→) = (rs) a→ r (a→ + b→) r a→ + r b→ (r + s) a→ = r a→ + s a→ 0 a→ = o→ 1 a→ = a→ Operation wird auch skalare Multiplikation (nicht mit Skalarprodukt verwechseln !) oder S-Multiplikation genannt. Linearkombination von Vektoren Gegeben sei eine Menge {a→, b→, ...} von Vektoren . k1, k2, ... seien reelle Zahlen. Dann nennt man jeden Vektor x→ der Form x→ = k1 a→ + k2 b→ + ... eine Linearkombination der Vektoren a→, b→, ... Nullsummen Eine Linearkombination k1 a→ + k2 b→ + ... kann gleich dem Nullvektor sein. Die Linearkombination nennt man in diesem Fall eine Nullsumme, die grafisch einer geschlossenen Vektorkette entspricht. Nichtriviale Nullsummen Ein Spezialfall ist die triviale Nullsumme, bei der alle Koeffizienten k1, k2, ... gleich 0 sind: 0 = 0 a→ + 0 b→ + ... Lineare Abhängigkeit Gegeben sei eine Menge {a→, b→, ...} aus Vektoren. Findet man unter den Linearkombinationen der Menge außer der "trivalen Nullsumme" auch eine "nichttriviale Nullsumme", so nennt man die Menge {a→, b→, ...} linear abhängig. Zwei Vektoren sind genau dann linear abhängig, wenn sie kollinear sind. Drei Vektoren nennt man komplanar, wenn sie alle in einer Ebene liegen. 175 Drei Vektoren sind genau dann linear abhängig, wenn sie komplanar sind. Vier Vektoren im Raum (oder Ebene) sind immer linear abhängig. Ist eine Menge aus Vektoren linear abhängig, so gibt es mindestens einen Vektor, der sich als Linearkombination der restlichen Vektoren ausdrücken lässt. Aufgaben zu Linearkombinationen von Vektoren Aufgabe: Der Vektor d→ ist als Linearkombination der drei Vektoren a→, b→ und c→ darzustellen. Die Vektoren werden hier als Zeilenvektoren angegeben: 1) a→ = (1 | -1 | 1) ; b→ = (2 | 1 | -1) ; c→ = (2 | -2 | 1) ; d→ = (-8 | -13 | 12) 2) a→ = (4 | -2 | 0) ; b→ = (-2 | 3 | 7) ; c→ = (1 | 1 | -4) ; d→ = (2 | -12 | -20) 3) a→ = (-1 | 3 | 2) ; b→ = (5 | 0 | 4) ; c→ = (5 | -6 | -7) ; d→ = (-8 | 9 | 2) 4) a→ = (2 | 1 | 3) ; b→ = (-3 | 1 | -7) ; c→ = (2 | 3 | -4) ; d→ = (-5 | -8 | 18) 5) a→ = (2 | 1 | -3) ; b→ = (-3 | 5 | 7) ; c→ = (0 | 5 | -4) ; d→ = (-6 | 2 | 5) 6) a→ = (3 | 0 | -4) ; b→ = (0 | 3 | 5) ; c→ = (7 | 0 | 0) ; d→ = (0 | 12 | -8) Lösung: 1) d→ = 4 a→ -7 b→ + c→ 2) d→ = - a→ -4 b→ -2 c→ 3) d→ = 3 a→ - b→ → → → → → → → 4) d = 3 a + b -4 c 5) d = -3 a + c 6) d→ = 7 a→ +4 b→ -3 c→ Parallelität von Vektoren a→ = λ b→ ⇔ µ a→ = b→ ⇔ linear abhängige Vektoren ⇔ kollineare Vektoren Komplanare Vektoren ... liegen in einer Ebene; sind a→, b→ und c→ komplanar, gilt c→ = r*a→ + s*b→ bzw. a x a y a z bx by bz = 0 cx cy cz Skalarprodukt (inneres Produkt) a→ * b→ = axbx + ayby + azbz = | a→ | * | b→ | * cos ∠ (a→ ,b→) Es gilt: i→ * i→ = j→ * j→ = k→ * k→ = 1 ; i→ * j→ = j→ * k→ = i→ * k→ = 0 Es gelten: Kommutativ- und Distributivgesetz. Das Assoziativgesetz gilt nicht ! Orthogonalitätsbedingung ... a→ ⊥ b→ ⇒ a→ * b→ = 0 Formel von Euler, Eulersche Vektorformel Sind A, B, C und D vier Punkte auf einer Geraden, so gilt BC→ • AD→ + CA→ • BD→ + AB→ • CD→ = 0 Formel von Simpson, Simpsonsche Vektorformel Sind A, B, C und D vier Punkte auf einer Geraden, so gilt AD→² BC→ + BD→² CA→ + CD→² AB→ + BC→ • CA→ AB→ = 0→ Schwarzsche Ungleichung für Vektoren | a→ * b→ | ≤ | a→ | * | b→ | ... das Gleichheitszeichen gilt genau dann, wenn a→ und b→ linear abhängig sind a→ * b→ = | a→ | * | b→ | , wenn a→ ↑↑ b→ a→ * b→ = - | a→ | * | b→ | , wenn a→ ↑↓ b→ Kosinussatz für Vektoren ( a→ + b→ )² = a→² + 2 a→ b→ + b→² ( a→ - b→ )² = a→² - 2 a→ b→ + b→² | a→ + b→ | = √[ a→² + 2 a→ b→ + b→² ] | a→ - b→ | = √[ a→² - 2 a→ b→ + b→² ] Längskomponente von a→ in Richtung b→, Längskomponente eines Vektors ab = a→ * b→ / | b→| ... (Betrag) Orthogonale Projektion von a→ auf b→ ab→ = a→ * b→ / | b→|² * b→ Projektion eines Vektors Skalarprodukt a→ * b→ = |a→| * |b→| * cos(a→,b→) Das Skalarprodukt zweier Vektoren a→ und b→ kann auch als das Produkt aus dem Betrag von a→ und dem Betrag der Projektion von b→ auf a→ festgelegt werden: a→ * b→ = |a→| * | Projektion von b→ auf a→| | Projektion von b→ auf a→| = |b→| * cos(a→,b→) Die Gleichung zur Projektion von b→ auf a→ wird auch Schattenformel genannt, da sie u.a. die Länge des Schattens von b→ angibt, wenn die Lichtquelle senkrecht über b→ steht. Gesetze des Skalarproduktes das Skalarprodukt ist kommutativ das Skalarprodukt ist distributiv 176 a→ * b→ = b→ * a→ k * (a→ * b→ ) = k a→ + k b→ , mit jedem reellen k das Skalarprodukt ist im allgemeinen nicht assoziativ (a→ * b→) * c→ ≠ a→ * (b→ * c→) das Skalarprodukt ist gemischt assoziativ (k * a→) * b→ = k (a→ * b→) a→ * (k b→) = k (a→ * b→) Das Quadrat eines Vektors ist gleich dem Quadrat seines Betrages: a→2 = | a→ |2 Skalarprodukt und Kosinussatz Aus dem Kosinussatz am allgemeinen Dreieck kann eine Definition des Skalarprodukts hergeleitet und die Berechnung des Winkels zwischen zwei Richtungsvektoren über das Skalarprodukt begründet werden. Gegeben ist das Dreieck ABC mit den drei Vektoren BC→= -a→, CA→= b→ und c→ = a→ - b→. Für den Betrag |c→| gilt dann |c→|² = |a→ - b→|² und über den Kosinussatz |c→|² = |a→|² + |b→|² - 2|a→||b→| cos γ Gleichsetzen ergibt |a→ - b→|² = |a→|² + |b→|² - 2|a→||b→| cos γ und Berechnung der Beträge (ax-bx)² + (ay-by)² = ax² + ay² + bx² + by² - 2|a→||b→| cos γ -2axbx - 2ayby = - 2|a→||b→| cos γ axbx + ayby = |a→||b→| cos γ Und somit für den Winkel γ cos γ = (axbx + ayby) / |a→||b→| cos γ = (a→ • b→) / |a→||b→| Für den dreidimensionalen Fall gilt die Herleitung analog. Normalenvektor Ein Normalenvektor n→ zu zwei anderen Vektoren a→ und b→ im Raum, ist ein Vektor, der sowohl senkrecht zu a→ als auch zu b→ steht. Gegeben sind die Vektoren a→ = (ax | ay | az) und b→ = (bx | by | bz). Gesucht ist ein Normalenvektor n→ = (x | y | z). Lösung: Da n→ auf a→ und b→ senkrecht steht, wird nach dem Skalarprodukt ax x + ay y + az z = 0 und bx x + by y + bz z = 0 Multipliziert man die 1.Gleiung mit -bz und die zweite mit az und addiert beide, ergibt sich (bxaz - axbz) x + (byaz - aybz) y = 0 Da eine Variable frei wählbar ist, setzt man z.B. x = aybz + azby Mit Ersetzen, Auflösen nach y und in einer der Ausgangsgleichungen nach z wird y = azbx + axbz z = axby + ayba Der Normalenvektor n→ wird damit (*) n→ = (aybz + azby | azbx + axbz | axby + ayba) Alle anderen Normalenvektoren ergeben sich durch Vervielfachung von n→. Die Darstellung (*) entspricht gerade dem Vektorprodukt von a→ und b→: n→ = a→ x b→ Vektorprodukt ... Vektor c→ = a→ x b→ mit folgenden Eigenschaften | c→ | = | a→ | * | b→ | * sin ∠ (a→,b→) c→ ⊥ a→ und c→ ⊥ b→ a→, b→, c→ bilden in dieser Reihenfolge ein Rechtssystem Das Vektorprodukt ist dem Betrage nach gleich der Fläche des von a→ und b→ gebildeten Parallelogramms Es gilt: i→ x i→ = j→ x j→ = k→ x k→ = 0 i→ x j→ = k→ i→ x k→ = - j→ j→ x k→ = i→ a→ x b→ = - b→ x a→ a→ x (b→ + c→) = a→ x b→ + a→ x c→ → → 2 → → 2 |a xb | =(a xb ) (λa→) x b→ = a→ x (λb→) = λ(a→ x b→) a→ x b→ = 0→ genau dann, wenn a→, b→ sind linear abhängig Komponentendarstellung = a→ x b→ = (aybz - azby) i→ + (azbx - axbz) j→ + (axby - aybx) k→ Vektorprodukt (2) Nachweis der Äquivalenz der Vektorproduktdarstellungen |c→| = |a→ x b→| = | a→ | · | b→ | · sin ∠ (a→,b→) und |c→| = |a→ x b→| = |(aybz - azby) i→ + (azbx - axbz) j→ + (axby - aybx) k→| Zum Nachweis wird |c→|² betrachtet. Die zweite Gleichung ergibt |c→|² = (aybz - azby)² + (azbx - axbz)² + (axby - aybx)² = 177 = ay²bz² - 2 ayazbybz + az²by² + az²bx² - 2 azaxbzbx + ax²bz² + ax²by² - 2 axaybxby + ay²bx² Für die erste Gleichung erhält man |c→|² = |a→|² |b→|² sin² ∠ (a→,b→) = = |a→|² |b→|² (1 - cos² ∠ (a→,b→)) = |a→|² |b→|² - |a→|² |b→|² cos² ∠ (a→,b→) = und mit dem Skalarprodukt a→ • b→ = |a→| |b→| cos ∠ (a→,b→) = |a→|² |b→|² - (a→ • b→)² = = (ax² + ay² + az²) (bx² + by² + bz²) - (axbx + ayby + azbz)² = Ausmultiplizieren ergibt = ax²bx² + ax²by² + ax²bz² + ay²bx² + ay²by² + ay²bz² + az²bx² + az²by² + az²bz² - ax²bx² - axbxayby axbxazbz - aybyaxbx - ay²by² - aybyazbz - azbzaxbx - azbzayby - az²bz² = und Zusammenfassen = ay²bz² - 2 ayazbybz + az²by² + az²bx² - 2 azaxbzbx + ax²bz² + ax²by² - 2 axaybxby + ay²bx² D.h., die beiden Ausdrücke sind äquivalent. Spatprodukt, Raumprodukt Das Spatpodukt ist dem Betrage nach gleich dem Volumen des von a→, b→ und c→ aufgespannten Parallelepipeds (Spat) Volumen V = (a→ x b→) * | c→ | cos φ V = 0 ⇔ 3 Punkte liegen in einer Ebene ⇔ das Vektortripel a→, b→, c→ ist dann ausgeartet → → → → → → → → → a x a y a z = (a x b ) * c = a * (b x c ) = [a b c ] bx cx by cy bz cz Eigenschaften [a→b→c→] > 0 ⇔ a→, b→, c→ bilden ein Rechtssystem [a→b→c→] = 0 ⇔ a→, b→, c→ sind linear abhängig, liegen in einer Ebene [a→b→c→] < 0 ⇔ a→, b→, c→ bilden ein Linkssystem [a→b→c→] = - [b→a→c→] = - [a→c→b→] = - [c→b→a→] [a→b→c→] ... orientiertes Volumen des von den 3 Vektoren aufgespannten Spats | [a→b→c→] | / 6 ... Volumen des aufgespannten Tetraeders Die Geraden x→ = a→ + t b→ und x→ = c→ + t d→ sind genau dann windschief, wenn [a→ - c→ b→ d→ ] ≠ 0 Spatprodukt, Herleitung Das Spatpodukt ist dem Betrage nach gleich dem Volumen des von a→, b→ und c→ aufgespannten Parallelepipeds (Spat) Herleitung: Volumen des Prismas V = A h Flächeninhalt des Parallelogramms ABCD: A = ||a→| |b→| sin α | V = ||a→| |b→| sin α | h Betrag des Kreuzproduktes ist der Flächeninhalt des aufgespannten Parallelogramms V = |a→ x b→| h Winkelbeziehung im rechtwinkligen Dreieck ∆ AHE: cos β = h/|c→| V = ||a→ x b→| |c→| cos β| Berechnung von π mit dem Skalarprodukt mit Hilfe der Vektoren (a→ x b→) und c→: Vektorprodukt-Übungsausgabe Aufgabe: A ist Kantenmittelpunkt des Würfels, siehe Figur. a) Berechnen Sie den Flächeninhalt des Dreiecks ABC. (obere Abbildung) Lösung: Über die Koordinaten der Punkte ergeben sich die Vektoren AB→ = (-2, 2, 2) und AC→ = (-4, 4, -1) Über das Vektorprodukt wird AB→ × AC→ = (-10, -10, 0) und für den Flächeninhalt A AABC = 1/2 √(100+100+0) = 5 √2 Aufgabe b) b) Ein Punkt P liegt auf der Kante DE. Welche Koordinaten hat P, wenn die Fläche des Dreiecks APB den Inhalt A = 2 √6 hat? Lösung: AP→ = (0, y, -2) und AB→ = (-2, 2, 2) → AP × AB→ = (2y+4, 4, 2y) Für das Quadrat der Flächen (Parallelogramm = doppeltes Dreieck) wird (2y + 4)² + 16 + y² = (2 2√6)² y² + 2y - 8 = (y+4) (y-2) = 0 y1 = -4 liegt nicht auf der Kante y2 = 2 mit P(4; 2; 0) ist der gesuchte Punkt 178 V = |(a→ x b→) · c→| Tripelprodukt (Vektorielles Doppelprodukt) Graßmannscher Entwicklungssatz a→ x (b→ x c→) = (a→ * c→) * b→ - (a→ * b→) * c→ (a→ x b→) x c→ = b→ * (a→ * c→) - a→ * (b→ * c→) a→ x (b→ x c→) ≠ (a→ x b→) x c→ Der Vektor des Tripelproduktes liegt mit den Vektoren a→ und b→ in einer Ebene Die erste Gleichung wird oft a→ x (b→ x c→) = b→ · (a→ • c→) - c→ · (a→ • b→) geschrieben und bac-cabRegel genannt. Jacobi-Identität a→ x (b→ x c→) + b→ x (c→ x a→) + c→ x (a→ x b→) = 0→ Polare und axiale Vektoren Polare Vektoren dienen der Darstellung von Größen mit Maßzahl und Raumrichtung, wie Geschwindigkeit und Beschleunigung, axiale Vektoren dagegen der Darstellung von Größen mit Maßzahl, Raumrichtung und Drehsinn, wie Winkelgeschwindigkeit und Winkelbeschleunigung. In der zeichnerischen Wiedergabe werden sie durch einen polaren bzw. axialen Pfeil unterschieden. In der mathematischen Behandlung besteht zwischen ihnen kein Unterschied. Produkte mit vier Vektoren - Identität von Lagrange (a→ x b→) * (c→ x d→) = (a→ * c→) * (b→ * d→) - (b→ * c→) * (a→ * d→) (a→ x b→) ² = a→² + b→² - (a→ * b→)² (a→ x b→) x (c→ x d→) = c→ [a→b→d→] - d→ [a→b→c→] = b→ [a→c→d→] - a→ [b→c→d→] ((a→ x b→) x c→) x d→ = (a→*c→)*(b→xd→) - (b→*c→)*(a→xd→) Galilei-Transformation ... Transformation der Zeit und der Raumkoordinaten bei einer gleichförmigen Bewegung mit einer konstanten Geschwindigkeit v (klassische Newtonsche Mechanik) Orthokomplement In der euklidischen Ebene existiert das Orthokomplement a→⊥ eines Ortsvektors a→ = (xy). Dieses bildet einen Ortsvektor und man definiert a→⊥ = (-yx) a→⊥ entsteht damit aus dem Vektor a→ durch Drehung um 90°. Für Ortsvektoren a→ und b→ der euklidischen Ebene und reelle Zahlen t gilt: (a→⊥)⊥ = -a→ (a→ + b→)⊥ = a→⊥ + b→⊥ (t a→)⊥ = t a→⊥ <a→⊥, a→> = 0 <a→⊥, b→> = -<a→, b→⊥> ||a→⊥|| = ||a→|| ⊥ Damit ist eine lineare Abbildung. Für drei Vektoren a→, b→ und c→ der euklidischen Ebene gilt: <a→, b→>² + <a→, b→⊥>² = ||a→||² ||b→||² <a→, b→⊥> c→ + <b→, c→⊥> a→ + <c→, a→⊥> b→ = 0 Die zweite Gleichung ergibt, dass drei Vektoren im R² linear abhängig sind. Aus der ersten Gleichung folgt unmittelbar die Cauchy-Schwarzsche Ungleichung. Genetische Distanz Als Maß für die genetische Unterschiedlichkeit verschiedener Völker wurde in der Biologie die genetische Distanz eingeführt. Dazu untersucht man die auftretende Häufigkeit der Hauptblutgruppen des Volkes. Als genetische Distanz definiert man nun den Winkel zwischen den Blutgruppen-Einheitsvektoren, womit die Berechnung zu einer biologischen Anwendung der Vektorrechnung wird. Dabei werden die relativen Häufigkeiten der Blutgruppen zu den Einheitsvektoren zusammengefasst. Beabsichtigt man die genetische Distanz zu einem anderen Volk zu berechnen, stellt man dessen Vektor auf und ermittelt über das vierdimensionale Skalarprodukt den Winkel zwischen beiden Vektoren. Achtung! Der Programmautor weist ausdrücklich daraufhin, dass die Berechnung der genetischen Distanz nichts mit der Bewertung der "Qualität von Völkern und Rassen" zu tun hat. Die genetische Distanz ist ausschließlich eine wissenschaftliche Größe mit deren Hilfe Aussagen, z.B. über die historische Entwicklung bestimmter Volksgruppen, gewonnen werden können. Nationalismus und geisteskranker Rassenwahn haben nichts mit Wissenschaft zu tun! Kosinus-Ähnlichkeit Kosinus-Ähnlichkeit ist ein Maß für die Ähnlichkeit zweier Vektoren, genauer für die Ähnlichkeit ihrer Richtungen, nicht ihrer Beträge. Liegen zwei Vektoren vor, so wird der Kosinus des eingeschlossenen Winkels berechnet. 179 Ist die Winkel = 0°, so ergibt sich für die Kosinus-Ähnlichkeit 1, sind die Vektoren senkrecht zueinander, d.h. vollständig unähnlich, so ergibt sich 0. Der Kosinus des eingeschlossenen Winkels ist somit ein Maß dafür, ob zwei Vektoren ungefähr in die gleiche Richtung zeigen. Die Kosinus-Ähnlichkeit wird in der Praxis zum Vergleich von Dokumenten, von Multimedia-Objekten, im Auffinden von Plagiaten, bei Suchmaschinen oder in der Kryptographie bei der Entschlüsselung chiffrierter Texte verwendet. 2011 gelang es, durch die Ermittlung der Kosinus-Ähnlichkeit der Zeichen-Platzierungsvektoren die Entschlüsselung des Codex Copiale, eines Dokuments in Geheimschrift. Bei Textvergleichen verwendet man als Vektoren Häufigkeitsvektoren des Dokuments, entweder von Wörtern, Phrasen oder auch nur Buchstaben. Alternativ wird zur Auswertung von Texten auch eine Buchstabenhäufigkeitsanalyse mit der Berechnung eines Koinzidenzindex genutzt. Orthonormierungsverfahren Methode, um aus einem gegebenen Satz ai→, i = 1,...,m von m linear unabhängigen Vektoren im Rn (n ≥ m) m paarweise orthogonale Vektoren qi→, i = 1,...,m der Länge Eins zu konstruieren, die den gleichen Unterraum aufspannen wie die Vektoren ai→. Schmidtsches Orthonormierungsverfahren Aus dem gegebenen Satz ai→, i = 1,...,m von m linear unabhängigen Vektoren im Rn (n ≥ m) werden m paarweise orthogonale Vektoren qi→, i = 1,...,m der Länge 1 konstruiert, die den gleichen Unterraum aufspannen. Man bildet der Reihe nach für i = 1,...,m: Orthogonalisierung vi→ = ai→ - Σ (ai→ • ak→) ak→ ; Summe von k = 1 bis i-1 Normierung qi→ = vi→ / |vi→| QR-Zerlegung Die Vektoren ai→ und qi→ des n-dimensionalen Raumes werden als Spalten einer n x m-Matrix A bzw. Q aufgefasst. Das Orthogonalisierungsverfahren entspricht der Aufgabe, für eine gegebene n x m-Matrix A eine orthogonale Matrix Q zu finden, so dass A = QR für eine geeignete rechte obere m x mDreiecksmatrix R ist. QR-Zerlegungen spielen eine zentrale Rolle bei Eigenwertproblemen. Verfahren zur QR-Zerlegung sind das Cholesky-Verfahren für symmetrische, positiv definite Matrizen und das Gram-Schmidt-Verfahren. Gram-Schmidt-Verfahren Pascal-Quelltext zur QR-Zerlegung (Orthonormieren von Basisvektoren) mit dem GramSchmidt-Verfahren Eingabe: a[i,k], i=1..n, k=1..m Ausgabe: a[i,k], i=1..n, k=1..m / r[i,k], i=1..n, k=i..m BEGIN FOR k:=1 TO m DO BEGIN sum:=0 ; FOR i:=1 TO n DO sum:=sum+SQR(a[i,k]) ; r[k,k]:=SQRT(sum) ; { Wenn r[k,k]=0, so sind Spalten von A nicht linear unabhängig} FOR i:=1 TO n DO a[i,k]:=a[i,k]/r[k,k] ; FOR j:=k+1 TO m DO BEGIN sum:=0 ; FOR i=1 TO n DO sum:=sum+a[i,k]*a[i,j] ; r[k,j]:=sum ; FOR i:=1 TO n DO a[i,j]:=a[i,j]-a[i,k]*r[k,j] ; END END END Euklidischer Vektorraum Um in abstrakten Vektorräumen Begriffe wie Länge, Winkel, Orthogonalität verwenden zu können, werden Euklidische Vektorräume eingeführt. Definition Es sei V ein reeller Vektorraum. Ist φ: V × V → R eine Abbildung mit folgenden Eigenschaften (statt φ(v,w) wird v * w geschrieben), dann gilt für alle u,v,m ∈ V und für alle reelle r: v*w=w*v (u + v) * w = u * w + v * w r (v * w) = (r v) * w = v * (r w) v * v > 0 genau dann, wenn v ≠ 0 φ heißt Skalarprodukt auf V. Ist auf V ein Skalarprodukt definiert, so heißt V Euklidischer Vektorraum. Alternativ definiert man: Einen Vektorraum V über den reellen Zahlen R versehen mit einer positiv definiten symmetrischen Bilinearform σ: V × V → R nennt man einen euklidischen Vektorraum. σ ist dann auch hier das Skalarprodukt. Euklidische Norm 180 Mit || v || = √(v * v) wird die Euklidische Norm (Länge) von v bezeichnet. Der Winkel α zwischen v, w aus V wird über die Gleichung cos α = v * w / (|| v || * || w ||) erklärt. Ist v * w = 0, so werden v und w zueinander orthogonal genannt. Winkel in euklidischen Vektorräumen Das Skalarprodukt σ(a,b) kann zur Messung von Winkeln herangezogen werden. Man definiert für zwei Vektoren a und b: cos Φa,b = σ(a,b) / (||a|| ||b||) Φa,b ist der Winkel zwischen a und b. Der Quotient immer im Intervall [-1, 1], womit der Winkel berechenbar ist. Da das Skalarprodukt symmetrisch ist, besitzt der Winkel keine Richtung, wodurch die Winkelgrößen im Intervall von 0 bis π = 180° liegen. Es seien a und b Vektoren eines euklidischen Vektorraums. Dann gilt: Φa,b = Φb,a Φa,-b = π - Φa,b Φαa,βb = Φa,b , für α, β > 0 a, b sind linear abhängig ⇔ Φa,b ∈ {0, π} Kosinussatz in euklidischen Vektorräumen Es seien a, b zwei vom Nullvektor verschiedene Vektoren eines euklidischen Vektorraums V. Dann gilt: ||a-b||² = ||a||² + ||b||² - 2 ||a|| ||b|| cos Φa,b Nachweis: ||a-b||² = α(a-b, a-b) = σ(a, a) + σ(b, b) - 2σ(a, b) = = ||a||² + ||b||² - 2 ||a|| ||b|| σ(a,b)/(||a|| ||b||) = = ||a||² + ||b||² - 2 ||a|| ||b|| cos Φa,b Bilinearform Es sei V ein Vektorraum über den reellen Zahlen R. Eine Abbildung σ heißt eine Bilinearform, wenn folgende Eigenschaften gelten: σ(αa + βb, c) = α σ(a, c) + β σ(b, c) σ(a, αb + βc) = α σ(a, b) + β σ(a, c) Das bedeutet, dass σ in beiden Argumenten linear ist, daher auch der Name Bilinearform. Eine Bilinearform σ heißt symmetrisch, wenn σ(a, b) = σ(b, a) für alle a, b ∈ V gilt. Eine Bilinearform σ heißt positiv definit, wenn σ(a, a) > 0 für alle a ≠ 0 gilt. Eigenschaften positiv definiter symmetrischer Bilinearformen Es sei V ein Vektorraum über den reellen Zahlen R und σ eine positiv definite symmetrische Bilinearform. Dann gilt für alle a ∈ V: σ(a, a) = 0 ⇔ a = 0 Für jede Bilinearform σ gilt: σ(a, 0) = σ(0, a) = 0 Nachweis: σ(a, 0) = σ(a, a-a) = σ(a, a) - σ(a, a) = 0; σ(0, a) folgt analog. Ist σ(a, 0) = 0, so muss wegen der positiven Definitheit a = 0 gelten; andernfalls wäre ja σ(a, a) > 0. Cauchy-Schwarzsche Ungleichung für Bilinearformen Es sei V ein Vektorraum über den reellen Zahlen R und σ eine positiv definite symmetrische Bilinearform. Dann gilt für alle a, b ∈ V: [σ(a, b)]² ≤ σ(a, a) · σ(b, b) Die Gleichheit gilt genau dann, wenn a und b linear abhängig sind. Für den Zusammenhang zwischen positiv definiten symmetrischen Bilinearformen und normierten Vektorräumen gilt: Es sei V ein Vektorraum über den reellen Zahlen und σ eine positiv definite symmetrische Bilinearform. Dann gibt es eine von dieser Bilinearform induzierte Norm || ||. Diese ist für einen Vektor a ∈ V definiert mit ||a|| = √σ(a,a) Für alle a, b ∈ V gilt: |σ(a,b)| ≤ ||a|| ||b|| Auf Grund der positiven Definitheit von σ ist die Norm wohldefiniert und ||a|| > 0 für a ≠ 0. Für λ ∈ R gilt ||λa|| = √σ(λa,λa) = √λ² √σ(a,a) = |λ| ||a|| Die Umkehrung des Satzes gilt im Allgemeinen nicht. Parallelogrammgesetz ||a + b||² + ||a - b||² = 2(||a||² + ||b||²) Es sei V ein normierter Vektorraum. Dann gilt in V genau dann das Parallelogrammgesetz, wenn die Norm von einer positiv definiten symmetrischen Bilinearform erzeugt wird. Orthogonalität und Norm Es sei V ein euklidischer Vektorraum mit einem Skalarprodukt und der daraus induzierten Norm || ||. Dann gilt für alle a, b ∈ V: a ⊥ b ⇔ ||a+b|| = ||a-b|| Folgerung: Ein Parallelogramm ist genau dann ein Rechteck, wenn seine Diagonalen gleich lang sind. 181 Man kann die Vektoren a und b als Seiten eines Vierecks auffassen, dann sind a + b und a - b aber genau die Diagonalen. Unterraum Gegeben sei ein Vektorraum V, der aus dem Körper K, der Menge G und den Verknüpfungen R und S besteht. Ein Gebilde V' nennt sich Unterraum von V, wenn dem Gebilde V' der gleiche Körper K, die gleichen Verknüpfungen R und S, und eine Teilmenge G' der Menge G zugrundeliegen, und das Gebilde V' selbst ein Vektorraum ist. Unterraum-Kriterium Gegeben sei ein Vektorraum V, der aus dem Körper K, der Menge G und den Verknüpfungen R und S besteht. Ein Gebilde V' nennt sich Unterraum von V, wenn dem Gebilde V' der gleiche Körper K, die gleichen Verknüpfungen R und S, und eine Teilmenge G' der Menge G zugrundeliegen, und das Gebilde V' die Axiome R1, S1 und R4 erfüllt. Axiom R1 ... Abgeschlossenheit der Addition Axiom S1 ... Produkt aus Skalar und Vektor ergibt Vektor Axiom R4 ... Existenz inverser Elemente Ist V ein Vektorraum und I eine beliebige Indexmenge. Wenn alle Ui Teilräume von V sind, so ist auch der Durchschnitt aller Ui ein Untervektorraum von V. Dies ist im Allgemeinen bei der Vereinigung von Teilräumen nicht der Fall. Beispiel: Teilmenge der 2×2-Diagonalmatrizen bilden einen Unterraum des Vektorraumes der 2×2Matrizen Austauschlemma im Vektorraum Gegeben sei eine Vektorraum V, eine Basis B= {v1, ..., vn} von V und ein beliebiger vom Nullvektor verschiedener Vektor w des Vektorraumes V. Dann gilt: Fügt man den Vektor w zur Basis B hinzu, und entfernt man im Gegenzug einen geeigneten Vektor aus der Basis B, so erhält man eine neue Basis des Vektorraumes V. Dabei gilt: Es gibt immer mindestens einen Vektor v aus B der geeignet ist, um gegen w ausgetauscht zu werden. Ausgetauscht werden können die Vektoren v, welche in der Linearkombination von w: w = k1·v1 + k2·v2 + ... + kn·vn einen Koeffizienten ki haben, der von Null verschieden ist. Steinitzscher Austauschsatz Gegeben seien:1. ein Vektorraum V 2. eine Basis B dieses Vektorraumes: B = {b1, ..., bn} 3. eine linear unabhängige Menge A aus Vektoren dieses Vektorraumes: A = {a1, ..., am} Daraus folgt: 1. n ≥ m 2. fügt man zur Basis B = {b1, ..., bn} die linear unabhängige Menge A = {a1, ..., am} hinzu, und entfernt im Gegenzug m Vektoren aus der Basis b, so erhält man eine neue Basis B' = {a1, ..., am, bm+1, ..., bn} Jede linear unabhängige Menge A = {a1, ..., am} kann durch Hinzunahme geeigneter Vektoren aus einer B' = {a1, ..., am, bm+1, ..., bn} Basis B = {b1, ..., bn} zu einer Basis B' ergänzt werden: Nebenklasse Sei U ein Unterraum des Vektorraumes V. Addiert man zu jedem Element des Unterraumes u einen Vektor v aus V hinzu, so erhält man die Nebenklasse v+U = {v+u1, v+u2, v+u3, ...} Sind zwei Nebenklassen v+U und w+U gleich, dann liegt die Differenz der Repräsentanten (v-w) in U. Umgekehrt gilt: Liegt die Differenz zweier Repräsentanten in U, dann sind sie Repräsentanten derselben Nebenklasse. Jedes Element der Nebenklasse v+U ist auch Repräsentant, und umgekehrt ist jeder Repräsentant von v+U auch Element von v+U. Faktormengen Die Faktormenge V/U ist die Menge aller Nebenklassen von U, also die Menge V/U = {v+U, w+U, x+U, y+U...} Lineare Hülle x→ sei Linearkombination der Vektoren a→1, a→2, ..., a→k eines Vektorraumes. Die lineare Hülle von a→1, a→2, ..., a→k ist die Menge aller Linearkombinationen von a→1, a→2, ..., a→k, d.h. die Menge L(a→1, a→2, ..., a→k) = { x1a→1 + ... + xka→k | xi ∈ R } Schmidtsches Orthogonalisierungsverfahren 182 Ist L(a→1, a→2, ..., a→m) die lineare Hülle der m Vektoren a→1, ..., a→m, so lässt sich schrittweise eine orthogonale Basis (b→1, ..., b→k) von L gewinnen. b→1 = a→1 Ist a→1 ≠ 0→, so setzt man → → → Ist a 2 ∉ L(a 1) = L(b 1), so setzt man b→2 = a→2 - a→2 * b→1 / (b→1)2 b→1 → → → → → Ist a 3 ∉ L(a 1,a 2) = L(b 1,b 2), so setzt man b→3 = a→3 - a→3 * b→1 / (b→1)2 b→1 - a→3 * b→2 / (b→2)2 b→2 usw... Das Verfahren bricht ab, wenn L(a→1, a→2, ..., a→m) = L(b→1, b→2, ..., b→k) ist, d.h. kein Vektor a→k+1 gefunden werden kann, der nicht in L(b→1, b→2, ..., b→k) liegt. Normiert man die Vektoren b→1, b→2, ..., b→k, so erhält man eine Orthonormalbasis. Orthogonale Menge, orthonormale Menge Eine endliche oder unendliche Menge von Vektoren x1→, x2→, … eines Vektorraums heißt orthogonale Menge, wenn für alle i, j (i ≠ j) xi→ • xj→ = 0 gilt, d.h. alle Vektoren paarweise zueinander senkrechte stehen. Orthonormal heißt die Menge von Vektoren x1→, x2→, … eines Vektorraums, wenn für alle i |xi→| = 1 gilt, d.h. jeder Vektor die Länge 1 besitzt. Ein Vektor der Länge 1 heißt normalisiert oder normiert. Eine Menge von linear abhängigen Vektoren xi→ kann mit dem Gram-Schmidt-Verfahren in eine orthonormale Menge von Vektoren yi→ umgewandelt werden, die linear abhängig von den Vektoren xi→ sind. Ein Linearoperator T eines Vektorraums V ist eine Regel, die jedem Vektor a→ von V einen eindeutige Vektor Ta→ aus V zuordnet, so dass T(α a→ + b→) = α Ta→ + Tb→ → → für jedes Vektorpaar a , b und jede komplexe Zahl α zuordnet. Der identische Linearoperator I ordnet jedem a→ sich selbst zu. Zwei Operatoren T und U sind gleich, wenn sie die gleiche Zuordnung ausführen. Unter dem Linearoperatorprodukt TU wird (TU) a→ = T (U a→) verstanden. Im Allgemeinen ist das Linearoperatorprodukt nicht kommutativ. Unter dem Kommutator versteht man [T, U] = TU - UT Zwei Operatoren T und U sind vertauschbar, wenn ihr Kommutator der Nulloperator ist. Existiert zu einem Operator T ein Operator U mit TU = UT = I, so heißt U inverser Linearoperator und wird mit T-1 bezeichnet. Ein Operator T mit einem inversen Operator heißt nichtsingulär, ohne T-1 singulär. Sind S und T nichtsingulär, so gilt (ST)-1 = T-1S-1. Vektoreigenvektor, Vektoreigenwert T sei ein Linearoperator auf dem Vektorraum V. Betrachtet werden alle Nichtnullvektoren von V, die bei der Anwendung von T nur ihre Größe, aber nicht die Richtung ändern. Insbesondere gibt es einen Vektor f→ und eine komplexe Zahl λ mit T f→ = λ f→ Jeder solcher Vektor f→ heißt Eigenvektor oder charakteristischer Vektor. Zur Unterscheidung von Eigenvektoren bei Matrizen wird hier von einem Vektoreigenvektor gesprochen. Die komplexe Zahl λ heißt dann Eigenwert oder charakteristischer Wert, hier Vektoreigenwert, von T in Bezug zum Vektor f→. Beispiel: Im Vektorraum V aller ungeraden trigonometrische Polynome der Form f(x) = a1 sin x + a2 sin 2x + … + an sin nx wird der Operator T f(x) = - f"(x) betrachtet. Ein Eigenvektor dieses Operators ist dann ein f(x) von V mit -f"(x) = λ f(x) Dies sind gerade die Funktionen fn(x) = An sin nx ; n = 1,2,3,… mit den Eigenwerten 1, 4, 9, …, n², … Ein Operator T* heißt adjungierter Operator des Operators T, wenn für alle Vektoren x→ und y→ aus V x→ • Ty→ = T*x→ • y→ gilt. Hermitescher Operator Ein Vektorraum, in dem jeder Operator einen adjungierten Operator besitzt, ist ein vollständiger Vektorraum oder Hilbert-Raum. Ein Operator heißt hermitesch, wenn er zu sich selbst adjungiert ist, d.h. x→ • Ty→ = Tx→ • y→ Für adjungierte und Hermitesche Operatoren gilt: 1) Sind T, U Operatoren und T*, U* die adjungierten Operatoren, dann existiert zu TU der adjungierte Operator mit U*T*. 2) Ist T ein Hermitescher Operator und x→ ein beliebiger Vektor von V, dann ist x→ • Tx→ eine reelle Zahl. 3) Die Eigenwerte eines Hermiteschen Operators sind reell. 183 4) Sind x→ und y→ Eigenvektoren des Hermiteschen Operators T mit den verschiedenen Eigenwerten λ1, λ2, so sind x→ und y→ orthogonal zueinander. Unitärer Operator Ein Operator U heißt unitär, wenn er einen inversen Operator U-1 und einen adjungierten Operator U* besitzt und beide gleich sind: U-1 = U* Ein Operator U heißt weiterhin isometrisch, wenn er das innere Produkt (Skalarprodukt) nicht beeinflusst, d.h. x→ • y→ = Ux→ • Uy→ Ein isometrischer Operator verändert von keinem Vektor die Länge. Existiert der adjungierte Operator U*, so ist U genau dann isometrisch, wenn U unitär ist. Unitärer Raum Die unitäre Geometrie basiert auf dem Begriff des positiv definiten Skalarprodukts, welches das klassische Skalarprodukt uv für Vektoren u und v verallgemeinert. Alle wichtigen Begriffe der unitären Geometrie erlauben, eine direkte physikalische Interpretation im Quarkmodell der Elementarteilchen. Definition: Unter einem unitären Raum versteht man einen linearen Raum über K, auf dem ein Skalarprodukt gegeben ist. Das bedeutet, jedem Vektorpaar u, v ∈ X wird eine Zahl (u, v) ∈ K zugeordnet, so dass für alle u, v,w ∈ X und alle α, β ∈ K gilt: 1) (u, u) ≥ 0 ; (u, u) = 0 genau dann, wenn u = 0 2) (w, αu + βv) = α(w, u) + β(w, v) 3) (u, v)* = (v, u) Aus 2) und (3) folgt (αu + βv,w) = α*(u,w) + β*(v,w) für alle u,v,w ∈ X , α,β ∈ K. Dabei bezeichnet α* die konjugierte komplexe Zahl zu α, d.h., im Falle eines reellen Raumes K = R kann man überall die Querstriche weglassen. Hilbertraum: Jeder endlichdimensionale unitäre Raum ist zugleich ein Hilbertraum im Sinne der allgemeinen Definition. Affine Koordinaten Affine Koordinaten sind eine Verallgemeinerung der kartesischen Koordinaten auf ein System aus drei linear unabhängigen, also auch nicht mehr zwingend rechtwinklig aufeinander stehenden nichtkomplanaren Grundvektoren e1→, e2→, e3→ mit drei Koeffizienten a1, a2, a3 (die oberen Indizes sind keine Exponenten!). Für den Vektor a→ ergibt sich dann a→ = a1 e1→ + a2 e2→ + a3 e3→ oder a→ = { a1, a2, a3 } 1 2 3 Diese Schreibweise ist vorteilhaft, als die Skalare a , a , a die kontravarianten Koordinaten eines Vektors sind. Für die Linearkombination der Vektoren sowie für die Summe und die Differenz zweier Vektoren gelten die Komponentengleichungen k1 = α a1 + β b1 + ... + δ d1 k2 = α a2 + β b2 + ... + δ d2 3 3 3 3 c1 = a1 ± b1 usw. k = α a + β b + ... + δ d Man spricht von affinen Koordinaten, wenn die Koordinatenachsen durch Geraden gebildet werden. Affine Koordinaten können sowohl schiefwinklig als auch orthogonal; senkrecht; sein. Sind die Koordinaten sowohl geradlinig als auch senkrecht, so spricht man von kartesischen Koordinaten. Graßmanns Vektorrechnung 1840 verfasste Hermann Graßmann ein auf hohem Niveau geschriebenes Werk der Vektorrechnung, das auch bereits die Vektoranalysis (Einbeziehung des Vektorbegriffs in die Differential- und Integralrechnung) umfasste. Aus dieser Arbeit schöpfte Graßmann eine Vielzahl seiner mathematischen Ideen für „Die lineare Ausdehnungslehre, ein neuer Zweig der Mathematik“ von 1844. Dieses Buch war jedoch seiner Zeit weit voraus und ist selbst heute nicht einfach zu verstehen und fand deshalb in der Öffentlichkeit keine Beachtung. Dennoch muss Graßmann als der Begründer der Vektorrechnung gelten. Grundgedanken von Graßmanns Vektorrechnung: 1. Beziehungen zwischen räumlichen Größen können mithilfe algebraischer Verknüpfungsgesetze beschrieben werden 2. Auffassung der Strecken AB und BA als entgegengesetzte Größen (Betrachtung des Negativen in der Geometrie), neben der Länge einer Strecke ist nun deren Richtung von Bedeutung 3. im Unterschied zu Hamilton, ist Graßmann daran interessiert seine Gedanken auf n Dimensionen auszudehnen 4. Es gilt AB+BC=AC auch dann, wenn A, B, C nicht in einer geraden Linie liegen 5. wenn man alle Elemente einer Strecke denselben Änderungen (heute: Parallelverschiebungen) unterwirft, so ist die dadurch entstehende Strecke der ursprünglichen gleich 6. es gelten die Rechengesetze: Kommutativgesetz, Assoziativgesetz, Distributivgesetz 184 7. das geometrische Produkt zweier Strecken ist der Flächeninhalt des aus ihnen gebildeten Parallelogramms Es kamen bereits die Begriffe der linearen Abhängigkeit und Unabhängigkeit, der Basis, der Dimension, wenn auch unter anderem Namen bei Graßmann alle vor. Graßmann spricht von Strecken und Größen, das Wort „Vektor“ kommt bei ihm nie vor. Tensorrechnung Geometrischer Tensor Tensor als geometrisches Objekt: Gilt für die Verzerrung f der vier Punkte P, Q, R, S eines Parallelogramms die Vorschrift so ist f von ein geometrischer Tensor 2. Stufe Tensor Ist eine allgemeine Abbildung A aus Vn linear, so spricht man von einem Tensor 2. Stufe. Ein Tensor nullter Stufe hat nur eine Komponente, d.h., er ist ein Skalar. Lineare Abbildung Gegeben seien Vn als ein n-dimensionaler Raum sowie die Abbildung A: Vn → Vn. A heißt dann lineare Abbildung, wenn folgende Eigenschaften erfüllt sind: a→, b→ ∈ Vn, λ ∈ R: A(a→ + b→) = A(a→) + A(b→) A(λ a→) = λ A(a→) Beispiele für Tensoren Drehtensor, Dielektrischer Tensor, Polarisationstensor, Trägheitstensor, Deformationstensor, Spannungstensor, ... Tensor 1. Stufe Ein Tensor erster Stufe hat 3 Komponenten t1, t2 und t3 mit dem Transformationsgesetz tµ = Σ aµi ti ; i = 1,2,3 Dies ist das Transformationsgesetz für Vektoren, d.h., ein Vektor ist ein Tensor 1. Stufe. Projektionstensor Gegeben sei ein Vektor b→ ∈ Vn. Die nachfolgende Projektionsabbildung ist dann ein Tensor: P(x→) = Projb→ x→ = x→ b→ / | b→|2 b→ Koordinatendarstellung von P: Pji = P(ei→) ej→ = ei→ b→ / | b→|2 b→ ej→ = bi bj / | b→|2 Dyadisches Produkt zweier Vektoren Die Vektoren u→, v→ ∈ Vn seien fest. Dann ist folgende Abbildung D ein Tensor: D(w→) = Du→v→(w→) = u→ (v→ w→) ... w→ ∈ Vn Koordinatendarstellung: dij = D(ei∈ Vn) ej∈ Vn = uj vi 1. Su→ 2. Su→ 3. Su→ Spiegelungstensor Su→ = 1 - 2 Du→u→(x) Es sei der Vektor u→ ∈ Vn mit ||u→||=1. Dann stellt → → → eine Spiegelung an der Ebene E: u x = 0 dar. Su heißt Spiegelungstensor. Du→u→(x) ist das dyadische Produkt. Die Koordinatendarstellung dieser Spiegelung ist in der Abbildung zu sehen. Daraus folgt: ist eine symmetrische Matrix ist orthogonal ist zu sich selbst invers: S²u→ = E Drehtensor Drehtensor: Drehung im Raum R3 um eine feste Drehachse Es sei der Vektor a→ ≠ 0→ ∈ V3, Voraussetzung: ||a||=1. Die Drehung Da→(ϕ) aller Vektoren um den Winkel ϕ gegen den Uhrzeigersinn um eine Drehachse der Richtung a→ ist ein Tensor. Es gilt die in der Abbildung gezeigte Gleichung. Die Determinante det(D) eines Drehtensors beträgt immer +1. Eulersche Drehmatrizen Die drei Spezialfälle der allgemeinen Drehtensoren ergeben sich durch Einsetzen der drei Basisvektoren e1→, e2→ und e3→ für a→. Es entstehen dabei Drehtensoren um die drei Achsen des Koordinatensystems. 185 Drehung um die e3→-Achse (z-Achse) Drehung um die e2→-Achse (y-Achse) Drehung um die e1→-Achse (x-Achse) Verkettung von Drehtensoren Ist D eine Eulersche Drehmatrix, dann gibt es drei Winkel α, β, γ, so dass Folgendes gilt: D = E1(α) * E2(β) * E3(γ) Ausmultipliziert ergibt sich als Drehmatrix die dargestellte Form: Koordinatendarstellung der Translation von Vektoren Es sei der Vektor a→ ∈ V³ ein fester Vektor. Dann ist die Abbildung T: x→ --> x→ - a→, x→ ∈ V³ eine Translation, kein Tensor. Ist nun T die Koordinatendarstellung eines Tensors in der Basis (e→1, e→2, e→3) und T' die Koordinatendarstellung desselben Tensors in der Basis (e→1', e→2', e→3'), so gilt T = T'. Dies liegt an der Invarianz der Basisvektoren bei Translation. Orthogonale Transformationen Es sei P eine orthogonale Transformation des R³. Aus dem Basisvektor e→1 wird damit der Basisvektor e→1': P: (e→1, e→2, e→3) --> (e→1', e→2', e→3') e→j' = P * e→j Das entstehende Koordinatensystem ist wieder orthogonal. Es gilt des weiteren: PT P = E --> PT e→j' T → → =P Pe j=e j Wenn det(P) = +1, d.h. Drehung, dann ist (e→1', e→2', e→3') wieder ein Rechtssystem. Transformationsverhalten eines Vektors Der Vektor a→ bezüglich der ursprünglichen Basis (e→1, e→2, e→3) wird nach der Transformation P zu a→' = P ⋅ a→ ⇔ a→j' = Σ ai pij; i=1,2,3. Hierbei ist pij eine Komponente der Transformationmatrix P. Transformationsverhalten von Tensoren Ist T ein Tensor mit den Matrixkomponenten tji und P eine orthogonale Transformation des R3, ergibt sich Folgendes: Matrixkomponente von T tji' = T(e→j') ⋅ e→j' = Σ Σ plj pki tlk Summenbildung für k=1,2,3 und l=1,2,3 Matrix T' T' = P-1 ⋅ T ⋅ P = PT ⋅ T ⋅ P Erzeugt der Basiswechsel nicht-orthogonale Basisvektoren, so werden die Transformationformeln komplizierter. Hyperfläche 2.Grades oder Quadrik Man definiert folgende Funktion Q(x→): Rn → R, aik, bk, c ∈ R Q(x→) = Σ (i=1..n) Σ (k=1..n) aik xi xk + 2 Σ (k=1..n) bk xk + c = x→T A x→ + 2 b→T x→ + c Die hier auftretende A muss symmetrisch sein. Die Menge der Punkte P mit O→P = x→ = (x1, x2, ..., xn)T, welche die Gleichung Q(x→) = 0 erfüllt, heißt Hyperfläche 2.Grades oder eine Quadrik im Rn. Mittelpunkt einer Quadrik Betrachtet man die Translation x→ = x'→ + p→ der Quadrik um p→, so gilt: Q(x'→+p→) = x'→T A x'→ + 2 (p→T A + b→t) x'→ + Q(p→) Ist nun die Gleichung Ap→ = -b→ lösbar, so besitzt Q(x→) ein Zentrum, für das gilt: Z = { p→ | Ap→ = -b→ } = {m→} m→ heißt Mittelpunkt der Quadrik. Normalform einer Quadrik Mit Hilfe geeigneter Koordinatentransformationen lässt sich jede Quadrik auf eine der beiden folgenden Normalformen bringen: 1. Fall: Zentrum der Quadrik ist verschieden der leeren Menge λ1 y1² + λ2 y2² + ... + λr yr² + γ = 0 mit r = Rang(A), die λi sind die Eigenwerte von A, die ungleich Null sind 186 2. Fall: Zentrum der Quadrik ist die leere Menge λ1 y1² + λ2 y2² + ... + λr yr² + 2 γ yn = 0 mit r = Rang(A) < n, γ > 0, die λi sind die Eigenwerte von A, die ungleich Null sind Klassifikation von Quadriken Gegeben Q(x→) = x→T A x→ + 2 b→T x→ + c Umformungen Q(x→ + m→) = x→T A x→ + 2(A m→ + x→)T x→ + Q(m→) Q(m→) = b→T m→ + c Auswertung der abgebildeten Matrix, Ermittlung von P Q(P x→) = x→T PT A P x→ + b→T P x→ + c Q(P x→ + m→) = x→T PT A P x→ + 2(A m→ + b→)T P x→ + Q(m→) Klassifikation von Quadriken, Auswertung 1.Fall: Am→ = -b→ ist lösbar; es liegt eine Zentrumsquadrik vor Schritte: Bestimmen von m→ und Q(m→). Bestimmen der Eigenwerte und Eigenvektoren von A. (u.U. Bestimmung des Typs) Bestimmen der Drehmatrix P aus den Eigenvektoren von A. Setze die neuen Koordinaten: u→ = PT (x→ - m→) ... x→ = P u→ + m→ Daraus ergibt sich die abgebildete Gleichung und die Normalform im R3: λ1 u1² + λ2 u2² + λ3 u3² + γ = 0 und entsprechend der Tabelle der Typ der Quadrik λ1 + + + + + + + + + + λ2 + + + + + + 0 0 λ3 + 0 0 0 0 0 0 γ + 0 +/0 0 0 Typ Ellipsoid zweischaliges Hyperboloid einschaliges Hyperboloid Kegel mit Spitze in m elliptischer Zylinder hyperbolischer Zylinder 1 Gerade 2 Ebenen mit Schnitt 2 parallele Ebenen Doppelebene 2.Fall: Am→ = -b→ ist nicht lösbar; es liegt keine Zentrumsquadrik vor Es folgt daraus, dass 0 ein Eigenwert von A ist, denn det(A) = det(A - 0E) = 0 Schritte: 1. Bestimmen der Eigenwerte von A. 2. Bestimmen der Eigenvektoren ν1, ..., νr zu den λi = 0 3. Bestimmen der Eigenvektoren νi zu den λr+1, ..., λn-1 = 0 mit νi→ ⊥ b→ 4. Bestimmen von νn 5. Quadratische Ergänzung 6. Normalform im R3: λ1 u1² + λ2 u2² + 2 γ u3 = 0 und entsprechend der Tabelle der Typ der Quadrik λ1 + + + λ2 + 0 λ3 0 0 0 γ +/+/+/- Typ elliptisches Paraboloid hyperbolisches Paraboloid parabolischer Zylinder Superquadriken Superquadriken wurden als Erweiterung der Quadriken von dem dänischen Designer Peit Hein veröffentlicht. Ihre allgemeine Formel beschreibt symmetrische Objekte: f(x,y,z) = (((x-xm)/a1)2/e2 + ((y-ym)/a2)2/e2)e2/e1 + ((z-zm)/a3)2/e1 Dabei ist M = (xm, ym, zm) der Mittelpunkt und die Parameter a1, a2 und a3 geben die Ausdehnung in der x-, y- und z-Richtung an. Die Form wird durch e1 und e2 beschrieben. So ergibt sich zum Beispiel für e1 = e2 = 1 ein Ellipsoid, für e1 = 0.1; e2 = 1 ein Zylinder und für e1 = 0.1; e2 = 0.1 ein Quader. Superquadriken sind geeignet als verschiedenartig abgerundete Grundformen. Superquadriken bilden eine mächtigere Familie verschiedener Formen als die Quadriken: Superellipsoid, Superhyperboloid und Supertorus. Die Oberfläche des Superellipsoids wird implizit durch folgende Gleichung ausgedrückt: ((x/a1)2/e2 + (y/a2)2/e2)e2/e1 + (z/a3)2/e1 = 1 Die Parameter e1 und e2 bestimmen die Form des Superellipsoids entlang der beiden sphärischen Komponenten. Demzufolge ist für e1 = e2 = 1 und a1 = a2 = a3 = 1 diese Oberfläche eine Kugel. Abbildung: Superellipsoid 187 Krummlinige Koordinaten Gegeben seien drei Eckpunkte eines zu den Koordinatenachsen parallelen Rechtecks im R2 durch deren Ortvektoren x0→, x1→ = x0→ + ∆x1 ( 10 ), x2→ = x0→ + ∆x2 ( 01 ) Die Verzerrung des Rechtecks mit dem Flächeninhalt FQ = |∆x1 ∆x2| in ein Parallelogramm, dargestellt durch die neuen Eckpunkte f→(x0→), f→(x1→), f→(x2→) mit der Funktion f→ ergibt für den Grenzwert der Verhältnisse zwischen dem ursprünglichen Flächeninhalt FQ und dem neuen Flächeninhalt FP: lim∆xi→0 FP/FQ = | det (D f→(x0→)) | Diese Flächenverzerrung im zweidimensionalen Raum lässt sich analog übertragen auf Gebilde im R3. Dort stellt sie die Volumenverzerrung im dreidimensionalen Raum dar. Wird bei solchen Verzerrungen kein begrenztes Objekt betrachtet, sondern eine offene Menge U in eine offene Menge V verzerrt, so spricht man bei f→ von der Koordinatentransformation von U auf V. Für die Umkehrung einer solchen Koordinatentransformation gilt unter der Voraussetzung, dass y→ = f→(x→) und x→ ∈ U: det(D f-1→ (y→)) = 1 / det (D f→(x→)) Jacobideterminante oder Funktionaldeterminante J f → (x→) = det (D f→(x→)) Transformationsformeln krummliniger Koordinaten Polarkoordinaten Koordinatentransformation f→: ( rφ ) --> ( r cos φr sin φ ) = ( f1(r,φ) f2(r,φ) ) = ( xy ) f→-1: ( rφ ) --> ( √(x²+y²)arctan(y/x) ) = ( f1(r,φ)-1 f2(r,φ)-1 ) = ( rφ ) Jacobideterminante von f det (D f→(r,φ)) = r² cos φ + r² sin φ = r Zylinderkoordinaten Koordinatentransformation siehe obere zwei Gleichungen Jacobideterminante von f det (D f→(r,φ,z)) = r² cos φ + r² sin φ = r Kugelkoordinaten Koordinatentransformation siehe untere zwei Gleichungen Hierbei liegt der Winkel φ zwischen der x-Achse und dem in die x-y-Ebene projizierten Ortsvektor des Punktes. Der Winkel θ liegt zwischen der z-Achse und dem Ortsvektor des Punktes Jacobideterminante von f det (D f→(r,φ,θ)) = r² sin θ (cos² θ + sin² θ) = r² sin θ Geometrische Objekte im Vektorraum Legt man ein Koordinatenkreuz in die Zeichenebene, so ist jeder Punkt der Zeichenebene durch seinen xund y-Wert bestimmt. Wir können also die Punkte der Ebene mit Paaren von reellen Zahlen gleichsetzen. Die Menge der Punkte der Ebene ist dann die Menge R². Die Menge R² bildet einen Vektorraum über R. Geometrische Objekte wie Linien und Flächen sind Mengen von Punkten. Diese Punkte lassen sich durch Vektoroperationen beschreiben. Definition: Ein Punkt in der Ebene ist ein Paar von reellen Zahlen, also ein Element p ∈ R² mit p = (x, y). Definition: Eine Gerade durch zwei Punkte p und q ist die Punktemenge pq = { r ∈ R² | r = p + a(q – p), a ∈ R}. Ein Liniensegment ist die Verbindungsstrecke von zwei Punkten p und q: pq = { r ∈ R² | r = p + a(q – p), a ∈ R, 0≤a≤1 }. Man lässt den Querstrich über pq auch weg, wenn klar ist, dass das Liniensegment zwischen p und q gemeint ist. Aus Liniensegmenten lassen sich weitere geometrische Gebilde zusammensetzen. Definition: Ein Kantenzug ist eine Kette von Liniensegmenten w = p0p1, p1p2, ..., pn-1pn. Die Punkte pi heißen Ecken des Kantenzugs, die Liniensegmente heißen Kanten. Ein Polygonzug ist ein geschlossener Kantenzug w = p0p1, p1p2, ..., pn-1p0. Ein Polygonzug, bei dem alle Ecken pi verschieden sind und bei dem je zwei Kanten außer den gemeinsamen Ecken keine Punkte gemeinsam haben, heißt einfacher Polygonzug. Das von einem einfachen Polygonzug umschlossene Gebiet, einschließlich des Polygonzugs selber, heißt Polygon. Matrizen, Determinanten Matrix vom Typ (m,n) 188 ... rechteckig angeordnetes Schema von m*n Größen (m Zeilen, n Spalten), den Elementen aij. Zeilen und Spalten werden auch Reihen genannt. Darstellung = A(m,n) = (aik)(m,n) Achtung: Bei der Schreibweise A(m,n) werden mit m zuerst die Zeilen und anschließen mit n die Spalten genannt Spezielle Matrizen m = n ⇔ n-reihige quadratische Matrix spur A = a11+a22...+ann ⇔ Spur der Matrix A aij=0 für i≠j ⇔ Diagonalmatrix aij=0 für i≠j und aij=1 für i=j ⇔ Einheitsmatrix E aij=0 für alle i,j ⇔ Nullmatrix O Eine Matrix a mit nur einer Reihe heißt ... Vektor a = ( a1 a2 a3 ... an ) mit nur einer Zeile ⇒ Zeilenvektor mit nur einer Spalte ⇒ Spaltenvektor, Spaltenmatrix Diagonalmatrix Ein Spezialfall der quadratischen Matrix ist die sogenannte Diagonalmatrix, bei der alle außerhalb der Hautdiagonalen liegenden Elemente gleich Null sind. Die Multiplikation zweier Diagonalmatrizen gestaltet sich besonders einfach und ergibt wieder eine Diagonalmatrix. Einheitsmatrix Die Einheitsmatrix ist ein Spezialfall der Diagonalmatrix, die wiederum ein Spezialfall der quadratischen Matrix ist: Ein Diagonalmatrix, bei der alle Diagonalelemente gleich 1 sind, nennt man Einheitsmatrix. Ein Diagonalmatrix, bei der alle Diagonalelemente gleich einer reellen Zahl c sind, nennt man Skalarmatrix. Untere Dreiecksmatrix Bei einer unteren Dreiecksmatrix sind alle Elemente oberhalb der Hauptdiagonalen gleich Null Obere Dreiecksmatrix Bei der oberen Dreiecksmatrix sind alle Elemente unterhalb der Hauptdiagonalen gleich Null Die Transponierte einer oberen Dreiecksmatrix ist eine untere Dreiecksmatrix und umgekehrt. Die Determinante einer Dreiecksmatrix ist das Produkt der Diagonalelemente. Jede Matrix lässt sich durch Zeilenvertauschungen so umformen, dass sie sich in ein Produkt aus einer linken und einer rechten Dreiecksmatrix zerlegen lässt. Antidiagonalmatrix Eine Antidiagonalmatrix ist eine quadratische Matrix, bei der alle Elemente außerhalb der Gegendiagonale Null sind. Eine nxn-Matrix A = (aij) heißt antidiagonal, wenn für alle i,j mit i+j <> n+1 der (i,j)-Eintrag Null aij ist. Die Determinante der oben abgebildeten antidiagonalen Matrix ist det(A) = (-1)(n2) q1q2...qn Sind alle qi der Gegendiagonale von Null verschieden sind, dann ist A invertierbar und die zu A inverse Matrix ist die unten abgebildete Matrix A-1. Das Produkt zweier Antidiagonalmatrizen ist eine Diagonalmatrix. Das Produkt einer Antidiagonalmatrix mit einer Diagonalmatrix ist eine Antidiagonalmatrix. Symmetrische Matrix Bei der symmetrischen Matrix sind alle Elemente spiegelbildlich zur Hauptdiagonalen angeordnet Eine Matrix A die mit ihrer transponierten Matrix übereinstimmt, für die also A = AT gilt, ist symmetrisch. Dies ist nur für quadratische Matrizen möglich. Einfachste Beispiele für symmetrische Matrizen sind die Nullmatrix und die Einheitsmatrix. Schiefsymmetrische Matrix Eine schiefsymmetrischen Matrix liegt vor, wenn gilt: 1. Die Elemente, die spiegelbildlich zur Hauptdiagonalen liegen, sind vom Betrag gleich, haben aber entgegengesetzte Vorzeichen. 2. Die Hauptdiagonalenelemente sind gleich Null 189 Jede quadratische Matrix kann in eine Summe aus einer symmetrischen und einer antisymmetrischen Matrix zerlegt werden. Transponierte Matrix Vertauschen der Zeilen und Spalten führt zur transponierten Matrix AT (AT)T = A (A + B)T = AT + BT A = AT ⇔ symmetrische quadratische Matrix A = - AT ⇔ antisymmetrische Matrix Matrizengesetze Gleichheit von MatrizenA = B ⇔ aik = bik, ∀ i,k Zwei Matrizen A und B sind gleich, wenn 1. die beiden Matrizen vom gleichen Typ sind und 2. die Matrizen in jedem Element übereinstimmen. Summe zweier Matrizen C = A ± B ⇔ ( aik ± bik ) , Matrizen werden komponentenweise addiert Kommutativgesetz A+B=B+A Assoziativgesetz (A + B) + C = A + (B + C) Multiplikation mit einer reellen Zahl (Skalar) k A = k(aik) = (k aik) Distributivgesetz k (A + B) = k A + k B (k ± l) A = k A ± l A Skalares Produkt ... von Zeilenvektor a mit dem Spaltenvektor b ⇔ a1b1 + a2b2 + ... + anbn Produkt von Matrizen Das Element cik des Matrizenproduktes C = A*B ergibt sich als skalares Produkt des i.ten Zeilenvektors von A mit dem k.ten Spaltenvektor von B. Voraussetzung: Spaltenzahl von A = Zeilenzahl von B a b e f ae + bg af + bh Beispiel 2 zweireihige Matrizen: ⋅ = c d g h ce + dg cf + dh Multiplikationsgesetze für Matrizen Kommutativgesetz gilt nicht ! A*B≠B*A (A * B)T = BT * AT A*E=E*A A*O=O*A=O A * (B * C) = (A * B) * C A * (B + C) = A * B + A * C spur (A * B) = spur (B * A) Die Matrizenmultiplikation ist nicht nullteilerfrei ! A * B = O bedeutet nicht notwendig ... A = O oder B = O Nilpotente Matrix Eine quadratische Matrix A heißt nilpotent, wenn eine ihrer Potenzen die Nullmatrix ergibt. Ist die Matrix A nilpotent, so hat sie genau einen Eigenwert gleich Null. Sie ist nicht invertierbar, ihre Determinante ist Null, ebenso die Spur. Dyadisches Produkt ... Produkt einer (n,1)-Matrix mit einer (1,n)-Matrix. Es entsteht eine (n,n)-Matrix. Das Produkt einer (1,n)-Matrix mit einer (n,1)-Matrix ergibt eine (1,1)-Matrix, eine Matrix mit einem Element. Hermitesche Matrix A* Eine Matrix mit komplexen Zahlen als Elementen heißt hermitesch, wenn aik = aki__ gilt, wobei aki__ die konjugiert komplexe Zahl von aki ist. Für reelle Koeffizienten fallen symmetrische und hermitesche Matrix zusammen. Eine antihermitesche oder schiefhermitesche Matrix iat eine quadratische Matrix, die dem Negativen ihrer Adjungierten gleich ist, d.h. es gilt aik = - aki__. Jede quadratische Matrix kann in eine Summe aus einer hermiteschen Matrix Ah und einer antihermiteschen Matrix Aah zerlegt werden A = Ah + Aah, mit Ah = 1/2 (A + AAdjungierte) Aah = 1/2 (A - AAdjungierte) Eine Matrix A ist unitär, wenn die Multiplikation von A mit ihrer adjungierten Matrix die Einheitsmatrix ergibt, bzw. A-1 = A* Tridiagonalmatrix Quadratische Matrix, bei der alle Matrixelemente gleich Null sind, außer denen, die auf der Hauptdiagonalen aij, i = j, und der eins darunter oder eins darüber liegenden Diagonalen aij, i = j ± 1 liegen: aij = 0 für |i - j| > 1 Bandmatrix Quadratische Matrix, bei der alle Matrixelemente gleich Null sein müssen, außer denen, die auf der Hauptdiagonalen und k darüber und l darunter liegenden Diagonalen aij, j ≤ i + k bzw. i ≤ j + l liegen. Die Matrixelemente ungleich Null sind alle auf einem diagonal verlaufenden "Band" angeordnet: aij = 0 für i - j > l, j - i > k, l < n 190 Rechte Hessenbergmatrix Quadratische Matrix, bei der alle Matrixelemente gleich Null sind, die unterhalb der ersten linken Diagonalen aij, i = j+1 liegen: aij = 0 für i - j > 1 Analog definiert man die linke Hessenbergmatrix. Falksches Schema Für die praktische Durchführung der Matrixmultiplikation gemäß AB = C verwendet man der größeren Übersichtlichkeit halber das Falksche Schema. Das Element cij der Produktmatrix C erscheint genau im Kreuzungspunkt der i.ten Zeile von A mit der j.ten Spalte von B. In der Abbildung werden als Beispiel zwei dreireihige Matrizen multipliziert. Inverse Matrix, Kehrmatrix Zwei quadratische Matrizen A, A-1 heißen zueinander invers ⇔ ⇔ A * A-1 = A-1 * A = E und es gilt (A-1)-1 = A (A * B)-1 = B-1 * A-1 det A-1 = (det A)-1 = 1/ det A -1 spur (A * B * A) = spur B (AT)-1 = (A-1)T, kontragrediente Matrix zu A A-1 = AT, A heißt orthogonale Matrix Die transponierte und die inverse Matrix einer orthogonalen Matrix sind auch orthogonal; weiterhin gilt det A = ±1. Produkte orthogonaler Matrizen sind wieder orthogonal. A A* = A* A, A heißt normale Matrix Rang einer Matrix r(A) ... Anzahl der linear unabhängigen Zeilen in A Singuläre Matrix: Matrix A heißt singulär ⇔ A-1 existiert nicht ⇔ r(A) < n Reguläre Matrix: Matrix A heißt regulär bzw. invertierbar ⇔ A-1 existiert ⇔ r(A) = n einer quadratischen Matrix Zeilenregulär ist die (m,n)-Matrix A, wenn r(A) = m, spaltenregulär, wenn r(A) = n. Inverse Matrix (2) Beispiel zur Berechnung der inversen Matrix mit Hilfe des Gauß-Jordan-Verfahrens. Gesucht ist die inverse Matrix zu 1 0 -2 A= -1 1 2 0 4 -1 Im Schema werden links die Matrix A und rechts die dreireihige Einheitsmatrix notiert. Ziel der Operationen ist es, links die Einheitsmatrix zu konstruieren. 1 0 -2 1 0 0 -1 1 2 0 1 0 ; Addition mit Zeile 1 0 4 -1 0 0 1 1 0 -2 1 0 0 010 110 0 4 -1 0 0 1 ; Subtraktion mit der 4fachen Zeile 2 1 0 -2 1 0 0 ; Subtraktion der 2fachen Zeile 3 010 110 0 0 -1 -4 -4 1 ; Multiplikation mit (-1) 1 0 0 9 8 -2 010 110 0 0 1 4 4 -1 Die zu A inverse Matrix lautet A-1 9 8 -2 110 4 4 -1 Beispiel zur Berechnung der inversen Matrix mit Hilfe des Gauß-Jordan-Verfahrens. Gesucht ist die inverse Matrix zu 683 A= 473 121 191 Im Schema werden links die Matrix A und rechts die dreireihige Einheitsmatrix notiert. Ziel der Operationen ist es, links die Einheitsmatrix zu konstruieren. 683 100 4 7 3 0 1 0 ; Addition mit (-4)*Zeile 1 1 2 1 0 0 1 ; Addition mit (-6)*Zeile 1 1 2 1 0 0 1 ; Addition mit 2*Zeile 2 0 -1 -1 0 1 -4 0 -4 -3 1 0 -6 ; Subtraktion mit der 4fachen Zeile 2 1 0 -1 0 2 -7 ; Addition der Zeile 3 0 1 1 0 -1 -4 ; Subtraktion der Zeile 3 0 0 1 1 -4 10 1 0 0 1 -2 3 0 1 0 -1 3 -6 0 0 1 1 -4 10 Die zu A inverse Matrix lautet A-1 1 -2 3 -1 3 -6 1 -4 10 Matrizengleichung: Die Gleichung AX = B (A, B sind Matrizen) hat die Lösung X = B A-1 ,d.h. die Gleichung ist lösbar, wenn zu A die inverse Matrix A-1 existiert Rechenregeln für Determinanten von Matrizen A, B ... Matrizen, E ... Einheitsmatrix, c ... reelle Zahl det (AB) = det (A) * det (B) ; Produktregel det (AT) = det (A) n n det (E ) = 1 det (c A) = c det (A) Rangabfall, Nullität d = n - r(A) Zur Berechnung des Ranges einer (m,n)-Matrix werden die größtmöglichen Unterdeterminanten gebildet. Ist eine von ihnen nicht null, so ist der Rang gleich der Ordnung (Anzahl der Spaltenvektoren) dieser Unterdeterminante. Gegebenenfalls muss die Ordnung der Unterdeterminante verringert werden, bis eine von ihnen ungleich null ist. Matrizennormen Spektralnorm ||A|| = ||A||2 = √(λmax (ATA)), dabei wird mit λmax (ATA) der größte Eigenwert der Matrix ATA bezeichnet Zeilensummennorm ||A|| = ||A||∞ = max Σ |aij|, wobei die Summierung für j=1,...,n erfolgt und das Maximum für 1 ≤ i ≤ n gebildet wird Spaltensummennorm ||A|| = ||A||1 = max Σ |aij|, wobei die Summierung für i=1,...,n erfolgt und das Maximum für 1 ≤ j ≤ n gebildet wird Eigenwerte, Eigenvektoren Lineare Abbildung x→ --> f(x→) = A * x→ Unter den Eigenwerten λ und den Eigenvektoren ν→ der Matrix A versteht man alle diejenigen Konstanten bzw. Vektoren, für die gilt: A * ν→ = λ * ν→ Aus der Definition folgt: A * ν→ = λ * ν→ ⇔ (A - λ * E) ν→ = o→ und → → für ν ≠ o ... det( A - λ * E ) = 0 In Determinantenschreibweise det(A - λ*E) = 0 = Spezialfall: Für eine Matrix, in der außerhalb der Hauptdiagonalen nur Nullen stehen, bilden die Werte in der Hauptdiagonalen zugleich die Eigenwerte. Allgemeines Eigenwertproblem A und B seien zwei quadratische Matrizen vom Typ (n;n). Ihre Elemente können reelle oder komplexe Zahlen sein. Die Aufgabe, Zahlen λ und zugehörige Vektoren x→ (Nicht-Nullvektoren) mit A x→ = λ B x→ zu bestimmen, wird als allgemeines Eigenwertproblem bezeichnet. Die Zahl λ heißt Eigenwert, der Vektor x→ Eigenvektor. Ein Eigenvektor ist lediglich bis auf einen Faktor bestimmt, da mit x→ auch c x→ Eigenvektor zu λ ist. Der Spezialfall B = E, wobei E eine n-reihige Einheitsmatrix ist, wird als spezielles Eigenwertproblem bezeichnet. Dieses tritt in vielen Anwendungen auf, vorwiegend mit symmetrischer Matrix A. Bezüglich des allgemeinen Eigenwertproblems muss auf Spezialliteratur verwiesen werden. A sei (n;n)-Matrix. 192 1. Anzahl der Eigenwerte: Die Matrix A hat genau n reelle Eigenwerte λi; i = 1,...,n, die entsprechend ihrer Vielfachheit zu zählen sind 2. Orthogonalität der Eigenvektoren: Die zu verschiedenen Eigenwerten λi ≠ λj gehörenden Eigenvektoren xi→ und xj→ sind orthogonal. 3. Matrix mit p-fachem Eigenwert: Zu einem p-fachen Eigenwert λ = λ1 = ... = λp existieren p linear unabhängige Eigenvektoren x1→, x2→, ..., xp→. Alle nichttrivialen Linearkombinationen sind Eigenvektoren zu λ. Davon können p ausgewählt werden, die orthogonal sind. Eigenwertberechnung einer Matrix Bei kleinen Matrizen können die Eigenwerte symbolisch mit Hilfe des charakteristischen Polynoms berechnet werden. Bei großen Matrizen ist dies oft nicht möglich, so dass hier Verfahren der numerischen Mathematik zum Einsatz kommen. Symbolische Berechnung Die Eigenwerte definierende Gleichung (A - λ · E) · x = 0 stellt ein homogenes lineares Gleichungssystem dar. Da x ≠ 0 vorausgesetzt wird, ist dieses genau dann lösbar, wenn gilt det (A - λ E) = 0 Expandiert man die Determinante auf der linken Seite, so erhält man ein Polynom n-ten Grades in λ. Dieses wird charakteristisches Polynom genannt und dessen Nullstellen sind die Eigenwerte, also die Lösungen der Gleichung αn · λn + αn-1 · λn-1 + … + α1 · λ + α0 = 0 Da ein Polynom vom Grad n höchstens n Nullstellen besitzt, gibt es höchstens n Eigenwerte. Zerfällt das Polynom vollständig, z.B. jedes Polynom über C, so gibt es genau n Nullstellen, wobei mehrfache Nullstellen mit ihrer Vielfachheit gezählt werden. Eigenraum zum Eigenwert Ist λ ein Eigenwert der linearen Abbildung f: V → V, dann nennt man die Menge aller Eigenvektoren zu diesem Eigenwert den Eigenraum zum Eigenwert λ. Der Eigenraum ist definiert durch Eig(f, λ) = {v ∈ V | f(v) = λ · v} Spektrum und Vielfachheiten Mehrfache Vorkommen eines bestimmten Eigenwertes fasst man zusammen und erhält so nach Umbenennung die Aufzählung λ1, λ2, …, λk der verschiedenen Eigenwerte mit ihren Vielfachheiten µ1, µ2, …, µk. Die Vielfachheit eines Eigenwertes als Nullstelle des charakteristischen Polynoms bezeichnet man als algebraische Vielfachheit. Die Menge der Eigenwerte wird Spektrum genannt und σ(A) geschrieben. Es gilt σ(A) = {λ ∈ C | ∃ ≠ 0: Ax = λx} Als Spektralradius bezeichnet man den Betrag des betragsmäßig größten Eigenwerts. Kennt man die Eigenwerte und ihre Vielfachheiten, kann man die Jordansche Normalform der Matrix erstellen. Beispiel: Gegeben sei die quadratische Matrix (0 2 -1) A= (2 -1 1) (2 -1 3) Subtraktion der mit λ multiplizierten Einheitsmatrix von A (0-λ 2 -1) A-λE= (2 -1-λ 1) (2 -1 3-λ) Ausrechnen der Determinante dieser Matrix mit Hilfe der Regel von Sarrus ergibt det(A - λ E) = -(λ - 2) (λ - 2) (λ + 2) Die Eigenwerte entsprechen den Nullstellen des Polynoms, d.h. die rechte Seite der obigen Gleichung gleich Null setzen und man erhält λ1 = 2 ; λ2 = -2 Der Eigenwert 2 hat die algebraische Vielfachheit 2, da er doppelte Nullstelle des charakteristischen Polynoms ist. Berechnung der Eigenvektoren Für einen Eigenwert λ lassen sich die Eigenvektoren aus der Gleichung (A - λ E) x = 0 bestimmen. Die Eigenvektoren spannen einen Raum auf, dessen Dimension als geometrische Vielfachheit des Eigenwertes bezeichnet wird. Für einen Eigenwert λ der geometrischen Vielfachheit µ lassen sich Eigenvektoren x1, x2, …, xµ finden, so dass die Menge aller Eigenvektoren zu λ gleich der Menge der Linearkombinationen von x1, x2, …, xµ ist. (x1, x2, …, xµ) heißt dann Basis aus Eigenvektoren zum Eigenwert λ. 193 Die geometrische Vielfachheit eines Eigenwertes kann man als die maximale Anzahl linear unabhängiger Eigenvektoren zu diesem Eigenwert definieren. Die geometrische Vielfachheit ist immer kleiner oder gleich der algebraischen Vielfachheit. Beispiel: Gegeben ist die quadratische Matrix A: (0 2 -1) A= (2 -1 1) (2 -1 3) Die Eigenwerte sind λ1 = 2, λ2 = -2. Für λ1 = 2 ergibt das zugehörige Gleichungssystem (-2 2 -1) (2 -3 1 ) x→ = 0→ (2 -1 1) als Lösung den Vektor (1/2 ; 0; -1) und alle seine Vielfachen, nicht jedoch das Nullfache des Vektors, da Nullvektoren niemals Eigenvektoren sind. Obwohl dieser Eigenwert eine algebraische Vielfachheit von 2 hat, existiert nur ein linear unabhängiger Eigenvektor. Damit hat dieser Eigenwert eine geometrische Vielfachheit von 1. Für λ2 erhält man den Eigenvektor (3/2 ; -2 ; -1). Ähnlichkeitstransformation einer Matrix Zu jeder reellen symmetrischen Matrix A gibt es eine orthogonale Matrix U und eine Diagonalmatrix D mit A = U D UT Dabei sind die Diagonalelemente von D die Eigenwerte von A, und die Spalten von U sind die dazugehörigen normierten Eigenvektoren. Aus der Gleichung folgt unmittelbar D = UT A U Man bezeichnet diese Gleichung als Hauptachsentransformation. Auf diese Weise wird A in die Diagonalform überführt. Wird die quadratische Matrix A mit Hilfe der regulären quadratischen Matrix G nach der Vorschrift GT A G = A' transformiert, dann spricht man von einer Ähnlichkeitstransformation. Die Matrizen A und A' heißen ähnlich, und es gilt: 1. Die Matrizen A und A' haben dieselben Eigenwerte, d.h., bei einer Ähnlichkeitstransformation ändern sich die Eigenwerte nicht. 2. Ist A symmetrisch, dann ist auch A' symmetrisch, falls G orthogonal ist: A' = GT A G mit GT G = E Bei dieser Beziehung bleiben Eigenwerte und Symmetrie erhalten. Dies besagt, dass eine symmetrische Matrix A orthogonal ähnlich auf die reelle Diagonalform D transformiert werden kann. Eigenwerte, Eigenvektoren und Eigenräume von Endomorphismen Es sei V ein Vektorraum über K beliebiger Dimension und f: V → V ein Endomorphismus. Für alle λ ∈ K gilt: Eλ = {x ∈ V | f(x) = λx} = {x ∈ V | (f - λ id)(x) = 0} = ker (f - λ id) ist ein Unterraum von V. Ein Skalar λ ∈ K heißt Eigenwert des Endomorphismus, wenn dim Eλ = dim ker(f - λ id) > 0 ist, das heißt wenn ein Eigenvektor x ∈ V\{0} existiert mit f(x) = λx. Eλ = ker(f - λ id) heißt dann Eigenraum von f zum Eigenwert λ, und seine Dimension d ≥ 1 die geometrische Vielfachheit des Eigenwertes λ. Der Nullvektor ist niemals Eigenvektor und kein Eigenraum ist 0-dimensional. Für ein λ gilt: Entweder ist λ Eigenwert von f, oder f - λ id ist regulär. Ein Eigenraum Eλ zum Eigenwert λ von f: V → V ist invariant, das heißt es gilt f[Eλ] ⊆ Eλ, falls λ ≠ 0. Die Eigenvektoren x1, …, xm zu paarweise verschiedenen Eigenwerten λ1, …, λm eines Endomorphismus f: V → V sind linear unabhängig. Die Anzahl der verschiedenen Eigenwerte eines Endomorphismus f: V → V ist nicht größer als die Dimension von V. Pascal-Matrix Eine Matrix mit n Spalten und n Zeilen, in die wie in der Abbildung die Koeffizienten des Pascalschen Dreiecks eingetragen, d.h. die Binomialkoeffizienten, ist symmetrisch und besitzt stets, unabhängig von der Zahl der Reihen, die Determinante 1. Ist n > 6 so besitzt die Matrix einen Eigenwert von 1 und den Eigenvektor (1 ; 0 ; 0 ; 0 ; 0 ; 0 ; 0 ; 0). Ab n = 8 tritt zusätzlich ein Eigenwert 2 mit dem Vektor (0 ; 1 ; 0 ; 0 ; 0 ; 0 ; 0 ; 0; 0) auf, ab n = 10 der Eigenwert 6, ab n = 11 der Eigenwert 20 usw. Lineares Gleichungssystem Ein lineares Gleichungssystem kann in der Form A * x = b dargestellt werden. A ... Koeffizientenmatrix, b ... Vektor der Absolutglieder, x ... Lösungsvektor 194 Für das Gleichungssystem a11 x1 + a12 x2 + ... + a1n xn = bn a21 x1 + a22 x2 + ... + a2n xn = bn ... am1 x1 + am2 x2 + ... + amn xn = bn ist die Koeffizientenmatrix A gleich Allgemeines Lösungsverfahren Zunächst wird die Hauptdeterminante D = | A | berechnet, was bis Rang n = 3 ohne weitere Umformungen möglich ist. Ist der Rang n > 3, ist meistens der Gaußsche Algorithmus am günstigsten. 1. Fall: D = 0: keine eindeutige Lösung, d.h. Gauß'scher Algorithmus (geometrisch ist die Lösungsmenge eine Ebene oder eine Gerade) 2. Fall: D ≠ 0: eindeutige Lösung, d.h. Cramer'sche Regel (Determinantenverfahren) Überbestimmtes lineares Gleichungssystem: notwendige, aber nicht hinreichende Voraussetzung n < m Unterbestimmtes lineares Gleichungssystem: notwendige, aber nicht hinreichende Voraussetzung n > m Der Mangel an mathematischer Bildung gibt sich durch nichts so auffallend zu erkennen wie durch maßlose Schärfe im Zahlenrechnen. Gauß Lösungsverfahren von Gleichungssystemen Einfache lineare Gleichungssysteme mit zwei Variablen x, y und zwei Gleichungen können mit einfachen Verfahren gelöst werden. 1) Das Gleichsetzungsverfahren wird vor allem genutzt, wenn alle Gleichungen nach ein und derselben Unbekannten aufgelöst sind. Die Werte werden gleichgesetzt und die lineare Gleichung gelöst. Beispiel: -4x + 2y = 8 und 9x + 3y = -6 Auflösen nach y ergibt y = 2x + 4 ; y = -3x - 2 Gleisetzen führt zur Gleichung 2x + 4 = -3x - 2 mit der Lösung x = -6/5. Einsetzen in eine Ausgangsgleichung ergibt y = 8/5, d.h. L = {(-6/5 ; 8/5)} 2) Beim Einsetzungsverfahren wird eine Gleichung nach einer Unbekannten umgestellt und der Term für die Variable in die andere Gleichung eingesetzt. Beispiel: Im obigen Beispiel wird die erste Gleichung nach y umgestellt, d.h. y = 2x + 4. Einsetzen in die zweite Gleichung ergibt 9x + 3(2x + 4) = -6 die zur gleichen Lösung führt. 3) Das Additionsverfahren wird genutzt, wenn die Koeffizienten einer Unbekannten in beiden Gleichungen dem Betrage nach gleich sind. Beispiel: Multiplizieren der Gleichung -4x + 2y = 8 mit 3 und der Gleichung 9x + 3y = -6 mit 2 führt zu -12x + 6y = 24 ; 18x + 6y = -12 Subtrahiert man die 2.Gleichung von der ersten, verschwindet der y-Term und es wird -30x = 36 mit der oben genannten Lösung. Kronecker-Capelli-Theorem Das Kronecker-Capelli-Theorem gibt eine Aussage über die Lösbarkeit von linearen Gleichungssystemen. Diesen Satz gab Kronecker 1903 in "Vorlesungen über die Theorie der Determinanten" an, allerdings wurde die Aussage; in der heutigen(!) Form; schon 1892 von A.Capelli in "Sopra la compatibilitá o incompatibilitá di più equazioni di primo grado fra picì incognite" bewiesen. Satz: Ein System von Gleichungen a11 x1 + a12 x2 + … + a1n xn = b1 a21 x1 + a22 x2 + … + a2n xn = b2 … am1 x1 + am2 x2 + … + amn xn = bm ist genau dann lösbar, wenn der Rang r(A) der Koeffizientenmatrix A gleich dem Rang r(A|B) der erweiterten Koeffizientenmatrix A|B; Koeffizientenmatrix um Vektor der Absolutglieder erweitert; ist. Ist r(A) < r(A|B), so ist das System unlösbar Ist r(A) = r(A|B) = n, so ist das System eindeutig lösbar Ist r(A) = r(A|B) < n, so besitzt das System unendliche viele Lösungen Gaußscher Lösungsalgorithmus, Gauß'scher Algorithmus Umwandlung der Koeffizientenmatrix in eine Dreiecksmatrix mit folgenden äquivalenten Umformungen: - Vertauschen von Gleichungen - Multiplikation einer Gleichung mit einer konstanten, reellen Zahl ≠0 - Addition des Vielfachen einer Gleichung zu einer anderen (Linearkombination) 195 Das Gauß-Verfahren versagt, falls das Diagonalelement oder Pivotelement (engl. für Dreh- und Angelpunkt) eines Eliminationsschrittes gleich Null ist: Das Verfahrens bricht dann auf Grund von Division durch Null ab. Pivotsuche: Ist ein Diagonalelement akk, so vertauscht man die Pivot-Zeile k vor Ausführung des k-ten Eliminationsschrittes mit derjenigen Zeile m > k, die den betragsmäßig größten Koeffizienten xk besitzt. Lösung des Systems mittels inverser Matrix Ist dann lineare Gleichungssystem in der Form A * x→ = b→ gegeben, wobei A die Koeffizientenmatrix darstellt, so kann die Lösung mittels inverser Matrix A-1 ermittelt werden. Es wird: A-1 * A * x→ = A-1 * b→ E * x→ = A-1 * b→ ; E ... Einheitsmatrix ; x→ = A-1 * b→ Gauß'scher Algorithmus Lineares Gleichungssystem x1 + 2x2 + 3x3 + 4x4 = -2 2x1 + 3x2 + 4x3 + x4 = 2 3x1 + 4x2 + x3 + 2x4 = 2 4x1 + x2 + 2x3 + 3x4 = -2 Durch rückwärtiges Lösen der Gleichungen XVI bis XIII erhält man: x1 = 0 x2 = 1 x3 = 0 x4 = -1 Die Probe durch Einsetzen bestätigt dieses Ergebnis Lineares Gleichungssystem -x1 - 3x2 - 12x3 = -5 -x1 + 2x2 + 5x3 = 2 5x2 + 17x3 = 7 3x1 - x2 + 2x3 = 1 7x1 - 4x2 - x3 = 0 Eine Lösung existiert, sie ist aber nicht eindeutig. Man kann eine Unbekannte als Parameter wählen, z.B. x3. Die Lösung lautet dann: x1 = 4/5 - 9/5 t x2 = 7/5 - 17/5 t x3 = t Die geometrische Deutung der Lösungsmenge eines LGS mit drei Unbekannten ist die Bestimmung der Schnittmenge der durch die drei Gleichungen des LGS gegebenen Ebenen. In diesem Beispiel ist die Lösungsmenge eine Gerade LR-Zerlegung Jede Matrix A, bei der für die Durchführung des Gauß-Algorithmus keine Pivotisierung erforderlich ist, kann als Produkt einer linken unteren und einer rechten oberen Dreiecksmatrix geschrieben werden A=LR Dies wird als LR-Zerlegung (LR links-rechts) bezeichnet: im englischen LU (lower-upper-decomposition) Algorithmus zur Lösung des Gleichungssystems A x = c 1.LR-Zerlegung der Koeffizientenmatrix A x = L ... R x = c 2.Einführung eines unbekannten Hilfsvektors y und Lösung des linearen Gleichungssystems L y = c y = L-1 c 3.Schritt: Lösung des Gleichungssystems R x = y ... x = R-1 y Die LR-Zerlegung ist dann zu empfehlen, wenn mehrere lineare Gleichungssysteme mit gleicher Koeffizientenmatrix A, aber jeweils verschiedener Inhomogenität c zu lösen sind; Schritt 1 ist dann nur einmal durchzuführen. Die Zerlegung der Koeffizientenmatrix A in die linke Dreiecksmatrix L und die rechte Dreiecksmatrix R ist nicht eindeutig. Die wichtigsten Zerlegungen, basierend auf der Gaußelimination, sind die Doolittle-, die Crout- und die Cholesky-Zerlegung. Cholesky-Zerlegung 196 Die Cholesky-Zerlegung ist ein numerisches Verfahren zur Zerlegung einer symmetrischen positiv definiten Matrix in das Produkt einer unteren Dreiecksmatrix und ihrer Transponierten. Jede symmetrische positiv definite, reelle (n x n)-Matrix A kann eindeutig in der Form A = L D LT geschrieben werden. Dabei ist L eine untere Dreiecksmatrix, deren Diagonalelemente alle gleich 1 sind und D eine Diagonalmatrix mit positiven Einträgen. Mit der Matrix-Wurzel von D und dem Matrix-Faktor G, definiert durch D = D1/2 D1/2 und G = LD1/2 wird die Cholesky-Zerlegung auch formuliert als A = G GT Liegt eine Berechnung der Cholesky-Zerlegung vor, so lässt sich das Gleichungssystem Ax = b effizient durch Vorwärts- und Rückwärtseinsetzen lösen: • Durch Vorwärtseinsetzen: Lösung des linearen Gleichungssystems Gy = b • Durch anschließendes Rückwärtseinsetzen: Lösung des linearen Gleichungssystems GTx = y Doolittle-Zerlegung Die Diagonalelemente der linken Dreiecksmatrix L sind gleich Eins, ljj = 1, d.h. det L = 1 besitzt die oben abgebildete Form. Bei der Doolittle-Zerlegung ist R die Matrix der bei der Gaußelimination entstehenden Koeffizienten, siehe untere Abbildung. Berechnung der Koeffizienten rjk r1k = a1k, k = 1, ..., n rjk = ajk - Σs=1 j-1 ljs rsk, k = j, ..., n, j > 1 Berechnung der Koeffizienten ljk, die Eliminationskonstanten lj1 = aj1 / r11, j = 2, ..., n ljk = 1/rkk (ajk - Σs=1 k-1 ljs rsk, j = k+1, ..., n, k > 1 Bei der Crout-Zerlegung sind die Diagonalelemente der rechten Dreiecksmatrix R sind gleich Eins. Die Berechnung erfolgt analog. Jacobi-Verfahren Das Jacobi-Verfahren ist eine Erweiterung des Newtonverfahrens zum Approximieren von Nullstellen auf mehrere Dimensionen. Um Lösungen einer Gleichung als Nullstelle zu gewinnen, muss die Gleichung LinkeSeite = RechteSeite in der Form Term = 0 vorliegen. Das kann bewerkstelligt werden mit LinkeSeite - (RechteSeite) = 0. Lösungen dieser Gleichung sind dann die Nullstellen der Funktion f := LinkeSeite (RechteSeite) Bei eindimensionalen Funktionen R → R gewinnt man ausgehend von einer günstigen Startnäherung für x bessere Näherungen durch die Rekursion xi+1 = xi - f(x)/f'(x) = xi - f(x)·(f'(x))-1 wobei f'(x) die erste Ableitung von f(x) ist. Im Rn tritt anstelle der Ableitung die Jacobimatrix Jf(x) (siehe Abbildung) bzw. an die Stelle von (f'(x))--1 die inverse Jacobimatrix. Die Nullstellen eines dreidimensionalen Gleichungssystems mit den Variablen x, y und z sowie den Funktionen f1(x,y,z), f2(x,y,z) und f3(x,y,z) werden durch folgende Rekursionen angenähert: xi+1 = xi - j1,1 · f1(x,y,z) - j1,2 · f2(x,y,z) - j1,3 · f3(x,y,z) yi+1 = yi - j2,1 · f1(x,y,z) - j2,2 · f2(x,y,z) - j2,3 · f3(x,y,z) zi+1 = zi - j3,1 · f1(x,y,z) - j3,2 · f2(x,y,z) - j3,3 · f3(x,y,z) wobei j2,3 das Element in der 2. Zeile und der 3. Spalte der inversen Jacobimatrix ist. Die partiellen Ableitungen in der Jacobimatrix werden durch Differenzenquotienten mit sehr kleinem d approximiert: ∂f/∂x ≈ (f(x+d)-f(x))/d. Die inverse Jacobimatrix wird gefunden über den Gauß-Algorithmus durch Umformen der Jacobimatrix in die Einheitsmatrix und paralleles Umformen einer Einheitsmatrix mit denselben Transformationen. Gleichungssysteme System I: 4x + 3y = 14 I: -4x - y = 40 I: 2x - 6y = 6 I: 4x + 2y = 4 I: 12x + 11y = 18 I: 3x - 10y = 3 I: 14x - 8y = 10 II: II: II: II: II: II: II: 2x - y = 12 x + 5y = 9 5x + 3y = 42 -6x + 3y = 33 16x - 7y = -2 -9x + 24y = -10 -21x + 15y = 60 Lösung (5 / -2) (-11 / 4) (7,5 / 1,5) (-2,25 / 6,5) (0,4 / 1,2) (14/9 / 1/6) (15 / 25) 197 I: I: I: I: I: I: I: I: I: I: I: I: 18x + 24y = -132 11x - 10y = 13 12x + 9y = 15 x - 4y = 3 4x + 6y = 7 6x - 2y = -8 2x + 3y + 5 = 5x + 6y - 1 3(x + 5) = 2(2y - 1) 5(2x + y) = 4(3y - 5x) + 13 2(2x + 3y) = 3(3x - y) + 5 (x + 5)(y + 1) = (x + 8)(y - 3) (x + 2)(y - 3) = (x - 3)(y + 4) II: II: II: II: II: II: II: II: II: II: II: II: 27x - 40y = 676 -8x + 7y = -7 4x + 3y = 5 -5x + 20y = 10 6x + 9y = 10 -15x + 5y = 20 x - 4y - 2 = 2x - 2y 4(3x - 6) = 3(y + 4) 6(8x - 2y + 6) = 4(2y - 3x) - 4 4(3x - 4y) = 2(x + y) - 10 (x - 3)(y - 1) = (x - 1)(y + 3) (x - 6)(y + 9) = (x + 4)(y - 5) (8 / -11,5) (-7 / -9) unendlich viele Lösungen L=∅ L=∅ unendlich viele Lösungen (6 / -4) (5 / 8) (3 / 11) unendlich viele Lösungen (-2 / 7) L=∅ Stöchiometrisches Rechnen Das stöchimetrische Rechnen, insbesondere das Aufstellen einer chemischen Reaktionsgleichung kann mittels linearer Gleichungssysteme gelöst werden. Auf Grund des Gesetzes von der Erhaltung der Masse, nach Lomonossow, und des Gesetzes der konstanten Proportionen, nach Proust 1797, lassen sich für jede vollständig verlaufende chemische Reaktion, von der chemischen Gleichung ausgehend, aus der Menge eines Reaktionsteilnehmers die Mengen aller anderen Reaktionsteilnehmer berechnen. Solche Berechnungen sind Gegenstand eines Teilgebietes der Chemie der Stöchiometrie. Beispiel: Reagiert Eisen (II)-sulfat FeSO4 mit Schwefelsäure H2SO4 unter Anwesenheit von Kaliumpermanganat KmnO4, so entstehen nach der Reaktionsgleichung FeSO4 + H 2 SO4 + KMnO4 → Fe2 ( SO4 ) 3 + MnSO4 + K 2 SO4 neben Wasser drei Salze, Eisen (III)-sulfat, Mangansulfat und Kaliumsulfat. Soll das Gesetz der Erhaltung der Masse eingehalten werden, kann die Gleichung so aber nicht akzeptiert werden. So treten auf der linken Seite nur 1 Eisenatom, rechts aber 2, links 12 Sauerstoffatome, rechts aber 21 auf. Daher werden alle Substanzen mit einem entsprechenden Faktor versehen, so dass auf beiden Gleichungsseiten gleiche Anzahlen von Atomen für jedes Element vorhanden sind. Aus aFeSO4 + bH 2 SO4 + cKMnO4 → dFe2 ( SO4 ) 3 + eMnSO4 + fK 2 SO4 + gH 2 O entsteht das Gleichungssystem Fe: a = 2e S: a + b = 3d + e + f O: 4 a + 4b + 4c = 12 d + 4e + 4f +g H: 2b = 2g K: c = 2f Mn: c=e Dieses Gleichungssystem ist unterbestimmt. Der Parameter der Lösung muss dann so gewählt werden, dass alle Einzellösungen ganzzahlig werden. Für die genannte Gleichung ergibt sich damit: 10 FeSO4 + 8 H 2 SO4 + 2 KMnO4 → 8 H 2O + 5 Fe2 ( SO4 ) 3 + 2 MnSO4 + K 2 SO4 Mit der korrekten Reaktionsgleichung kann nun weiter gerechnet werden. Sollen 100 g Eisen (II)-sulfat reagieren, so ergeben sich unter Berücksichtigung der molaren Massen mit einfachen Verhältnisgleichungen, dass 51,6 g Schwefelsäure und 20,8 g Kaliumpermanganat zugeben werden müssen. An Reaktionsprodukten erhalten Sie 9,5 g Wasser, 131,6 h Eisen (III)-sulfat, 19,9 g Mangansulfat und 11,5 g Kaliumsulfat. Mischen von Legierungen Anwendung von linearen Gleichungssystemen: Edelstahl ist eine Legierung aus Eisen, Chrom und Nickel. Beispielsweise besteht V2A-Stahl aus 74% Eisen, 18% Chrom und 8% Nickel. In der Tabelle sind vorhandene Legierungen (I-IV) angegeben, mit denen 1000 kg V2A-Stahl gemischt werden soll. I II III IV Eisen 70% 72% 80% 85% Chrom 22% 20% 10% 12% Nickel 8% 8% 10% 3% Sind x1, x2, x3 und x4 die Anteile der Legierungen I-IV in Einheiten kg, so gilt für die Summe aller Mischungsanteile in kg x1 + x2 + x3 + x4 = 1000 Für die Einzelbestandteile Eisen, Chrom und Nickel gelten die Erhaltungsgleichungen 0,7 x1 + 0,72 x2 + 0,8 x3 + 0,85 x4 = 740 0,22 x1 + 0,2 x2 + 0,1 x3 + 0,12 x4 = 180 0,08 x1 + 0,08 x2 + 0,1 x3 + 0,03 x4 = 80 Diese vier Gleichungen liefern ein inhomogenes lineares Gleichungssystem, das nach dem Gaußschen Lösungsverfahren die Form x1 + x2 + x3 + x4 = 1000 0 x1 + 2 x2 + 10 x3 + 15 x4 = 4000 0 x1 + 0 x2 - 2 x3 + 5 x4 = 0 0 x1 + 0 x2 + 0 x3 + 0 x4 = 0 hat. Man wählt x4 = k beliebig. Daraus folgt x3 = 5/2 k 198 x2 = 2000 - 20 k und x1 = -1000 + 16,5 k. Damit die Lösung realisierbar ist, müssen alle Anteile x1, x2, x3, x4 ≥ 0 sein. Wegen der Bedingung für x2 folgt 100 ≥ k und wegen der Bedingung für x1 folgt k ≥ 60.6. D.h. für 100 ≥ k ≥ 60.6 ist das Problem physikalisch lösbar. Beispiele zu linearen Gleichungssystemen Aufgabe 1 Verlängert man an einem Dreieck die Grundseite um 3 cm und die zugehörige Höhe um 2 cm, so wächst der Flächeninhalt um 53 cm². Verkürzt man dagegen die Grundseite um 2 cm und die zugehörige Höhe um 3 cm, so verringert sich der Flächeninhalt um 42 cm². Berechne die Grundseite und die Höhe des Dreiecks! Lösung Grundseite g, Höhe h (g+3) (h+2) / 2 = gh / 2 + 53 und (g-2) (h-3) / 2 = gh / 2 - 42 … g = 14 cm, h = 24 cm Aufgabe 2 Verlängert man an einem Rechteck die kleinere Seite um 2 cm und die größere um 3 cm, so wächst der Flächeninhalt um 60 cm². Verlängert man dagegen die kleinere Seite um 7 cm und die größere um 5 cm, so wächst der Flächeninhalt um 180 cm². Berechne die Seiten des Rechtecks! Lösung größere Seite a, kleinere Seite b (a+4) (b+2) = ab + 60 und (a+5) (b+7) = ab + 180 … a = 15 cm, b = 8 cm Aufgabe 3 In einem Rechteck beträgt die Länge einer Seite 3/4 der Länge der anderen. Vergrößert man die größere Seite um 4 cm und verkleinert man die kleinere um 2 cm, so ändert sich der Flächeninhalt nicht. Wie lang sind die Seiten des ursprünglichen Rechtecks? Lösung größere Seite a, kleinere Seite b b = 3/4 a und (a+4) (b-2) = a·b … a = 8 cm, b = 6 cm Aufgabe 4 Verlängert man an einem Rechteck die längere Seite um 3 cm und die kürzere Seite um 6 cm, so entsteht ein Quadrat, dessen Flächeninhalt um 117 cm² größer ist als der Flächeninhalt des Rechtecks. Berechne die Seiten des Rechtecks! Lösung größere Seite a, kleinere Seite b (a+3) (b+6) = ab + 117 und a+3 = b+6 … a = 12 cm, b = 9 cm Aufgabe 5 Von zwei Brüdern ist der eine 6 Jahre älter als der andere. Vor 6 Jahren war er gerade dreimal so alt. Wie alt ist jeder jetzt? Lösung x Alter des älteren, y Alter des jüngeren Bruders x = y + 6 und x - 6 = 3 (y - 6) … x = 15 Jahre, y = 9 Jahre Aufgabe 6 Vater und Sohn wiegen zusammen 115 kg. Würden beide 5 kg abnehmen, dann würde der Vater genau doppelt so schwer sein wie sein Sohn. Wie viel kg wiegen Vater und Sohn? Lösung x Masse des Vaters, y Masse des Sohnes x + y = 115 und x - 5 = 2 (y - 5) … x = 75 kg, y = 40 kg Aufgabe 7 Eine Kassiererin zahlt 2000 € in 50 € Scheinen und 20 € Scheinen aus. Es sind insgesamt 55 Scheine. Wie viel 50 € Scheine und wie viel 20 € Scheine sind das? Lösung x Anzahl 50 € Scheine, y Anzahl 20 € Scheine x + y = 55 und 50x + 20y = 2000 … x = 30, y = 25 Aufgabe 8 Um 9:00 Uhr startet ein Fußgänger zu einer Wanderung mit einer durchschnittlichen Geschwindigkeit von 6 km/h. Um 11:30 Uhr folgt ihm ein Radfahrer mit einer durchschnittlichen Geschwindigkeit von 18 km/h. Wann holt der Radfahrer den Wanderer ein? Lösung x Anzahl der Stunden, die der Fußgänger unterwegs ist, y entsprechend für den Radfahrer 9 + x = 11,5 + y und x · 6 = y · 18 … x = 3,75, y = 1,25, d.h. um 12:45 Uhr Aufgabe 9 Eine Bergbahn verlangt für Berg- und Talfahrt zusammen 6 €, für die Bergfahrt allein 4,50 € und für die Talfahrt ohne Bergfahrt 3 €. An einem Sonntag fuhren im ganzen 680 Personen mit der Bahn hinauf und 520 Personen hinab. Es gingen 3930 € ein. Wie viele Personen nutzten Berg- und Talfahrt, nur die Bergfahrt oder nur die Talfahrt? 199 Lösung x … Anzahl Bergfahrt, y … Anzahl Talfahrt, z … Anzahl Berg- und Talfahrt Gleichungssystem: 4,5 x + 3 y + 6 z = 3930 ; x + z = 680 ; y + z = 520 ergibt Bergfahrtbillette x = 220, Retourbillette z = 680-x = 460, Talfahrtbillette y = 520-z = 60 Aufgabe 10 Ein Kapital von 330740 Fr. ist in drei Posten abgelegt, zu 4%, 5% und 6%. Werden nach einem Jahr die Zinsen dazu geschlagen. so werden alle Posten gleich groß. Wie groß waren die Posten am Anfang? Lösung x + y + z = 330740; 1,06 z = 1,04 x; 1,05 y = 1,04 x ergibt 1.Posten x = 111300 Fr. , 2.Posten y = 110240 Fr. , 3.Posten z = 109200 Fr. Aufgabe 11 Ein Radfahrer hat eine Geschwindigkeit von 25 km/h auf ebenem Gelände, von 15 km/h bergaufwärts und von 30 km/h abwärts. Wieviel ebenen, ansteigenden und absteigenden Weg enthält unter diesen Voraussetzungen eine Strasse von 100 km, wenn der Radfahrer 4 Stunden 24 Minuten braucht, um sie in der einen Richtung, und 4 Stunden 36 Minuten, um sie in der anderen Richtung zu durchfahren? Lösung x/25 + y/15 + z/30 = 4,4 ; x/25 + y/30 + z/15 = 4,6 ; x+y+z = 100 Auf dem Hinweg geht es z = 28 km abwärts und y = 22 km aufwärts. Der Rest x = 50 km ist eben. Aufgabe 12 Ein Kind ist 21 Jahre jünger als seine Mutter. In 6 Jahren wird die Mutter 5mal so alt wie das Kind sein. Wo ist der Vater? Die Aufgabe ist nicht ganz ernst gemeint! Lösung: das Kind ist -¾ Jahre alt … :-) Historische Beispiele zu linearen Gleichungssystemen Aufgabe 1 In einem Käfig sind Hasen und Fasane. Sie haben zusammen 35 Köpfe und 94 Füße. Wie viele Hasen und Fasane sind im Käfig? (China, ca. 2500 v.u.Z.) Lösung: 12, 23 Aufgabe 2 Fünf Ochsen und zwei Schafe kosten acht Goldstücke, zwei Ochsen und acht Schafe kosten acht Goldstücke. Wie hoch ist der Preis für jedes einzelne Tier? (China, 3. Jh. v.u.Z.) Lösung: 4/3, 2/3 Aufgabe 3 Ein Mann sagt zu einem anderen: "Wenn du mir einen von deinen Denaren gibst, so habe ich soviel wie du!" Der andere antwortet: "Wenn du mir einen von deinen gibst, habe ich zehnmal soviel wie du!" Wieviel Denare hatte jeder? (Leonardo von Pisa, Fibonacci, 1202) Lösung: 13/9, 31/9 Aufgabe 4 Wenn der Preis von 9 Äpfeln vermindert um den Preis einer Birne 13 Denare beträgt und der Preis von 19 Birnen vermindert um den Preis eines Apfels 8 Denare beträgt, so frage ich, wie teuer ein Apfel und wie teuer eine Birne ist? (Johannes Buteo, 1549) Lösung: 1½, ½ Aufgabe 5 Zwei Personen wollen ein Pferd für 11 Gulden kaufen. A sagt zu B: "Gib mir 1/3 von deinem Geld, so will ich meines dazutun und das Pferd bezahlen." B sagt zu A: "Gib mir von deinem Geld 1/4, so will ich mit meinem zusammen das Pferd bezahlen." Nun frage ich, wieviel Geld jeder gehabt hat. (Adam Ries) Lösung: A: 8 Gulden, B: 9 Gulden Aufgabe 6 In den "Erzählungen aus Tausendundeiner Nacht" befindet sich folgendes Rätsel: Eine fliegende Taubenschar kam zu einem hohen Baume; ein Teil von ihnen setzte sich auf den Baum, ein anderer darunter. Da sprachen die auf dem Baume zu denen die darunter lagerten: "Wenn eine von euch herauffliegt, so seid ihr ein Drittel von uns allen; und wenn eine von uns hinabfliegt, so werden wir euch an Zahl gleich sein." Wie viel Tauben waren auf dem Baum, wie viel darunter ? Lösung: Tauben oben = o, Tauben unten = u o - 1 = u + 1 und o = u + 2 o + 1 = 3 (u - 1) → (u + 2) + 1 = 3u - 3 → u + 3 = 3u -3 und 6 = 2u u = 3 ; o = 3 + 2 = 5, d.h. 5 Tauben waren auf dem Baum, 3 darunter. Aufgabe 7 200 Jemand hat 30 Vögel für 30 Münzen gekauft. Für 3 Spatzen zahlte er eine Münze, für zwei Wildtauben ebenfalls eine Münze und für jede Taube zwei Münzen. Wie viele Vögel jeder Art hat er gekauft ? (Fibonacci) Lösung: System x + y + z = 30 und z = 30 - x - y Als ganzzahlige Lösungen ergeben sich x = 9, y = 10, z = 11, d.h. er kauft 9 Spatzen, 10 Wildtauben und 11 Haustauben. Aufgabe 8 Drei Personen wollen ein Grundstück um 100 Gulden kaufen. A fehlt die Hälfte des Geldes von B auf den Kaufpreis. B fehlt 1/3 des Geldes von C, und C fehlt 1/4 von A. Wieviel hat jeder? (Adam Ries) Lösung: A: 64 Gulden, B: 72 Gulden, C: 84 Gulden Aufgabe 9 Die Mitgift von Francescos Frau ist um 100 Gulden höher als Francescos eigenes Vermögen, und das Quadrat der Mitgift ist um 400 größer als das Quadrat des Vermögens. Berechne die Mitgift und das Vermögen. (Cardano, 1545) Lösung: Mitgift: 52 Gulden; Francesco hat 48 Gulden Schulden Aufgabe 10 Aus 3 Garben einer guten Ernte, 2 Garben einer mittelmäßigen Ernte und 1 Garbe einer schlechten Ernte erhält man den Ertrag von 39 Körben. Aus 2 Garben einer guten Ernte, 3 Garben einer mittelmäßigen Ernte und 1 Garbe einer schlechten Ernte erhält man 34 Körbe. Aus 1 Garbe guter Ernte, 2 Garben mittelmäßiger Ernte und 3 Garbe schlechter Ernte erhält man 26 Körbe. Wie viel ist der Ertrag je einer Garbe der guten, der mittelmäßigen und der schlechten Ernte? (China, 3.Jahrhundert u.Z.) Lösung: 9¼, 4¼, 2¾ Aufgabe 11 Jetzt hat man 2 Rinder und 5 Schafe verkauft und damit 13 Schweine gekauft, wobei ein Rest von 1000 Geldstücken übrig blieb. Man hat 3 Rinder und 3 Schweine verkauft und damit 9 Schafe gekauft; das Geld reichte gerade. Man hat 6 Schafe und 8 Schweine verkauft und damit 5 Rinder gekauft, aber das Geld reichte nicht um 600 Geldstücke. Wie hoch ist der Preis von jedem, vom Rind, vom Schaf und vom Schwein? (China, 3.Jahrhundert u.Z.) Lösung: 1200, 500, 300 Aufgabe 12 Drei Personen werden nach ihrem Vermögen gefragt. Der erste und der zweite besitzen zusammen um 20 Denare mehr als der dritte; der erste und der dritte haben zusammen um 40 Denare mehr als der zweite; und der zweite und der dritte haben zusammen um 30 Denare mehr als der erste. Wieviel besitzt jeder der drei? (nach Diophant, 3.Jh. u.Z.) Lösung: 30, 25, 35 Aufgabe 13 Drei Kaufleute sahen auf dem Weg eine Geldbörse mit 15 Goldstücken. Einer von ihnen sagte zu den anderen: "Wenn ich diese Börse behalte, so werde ich zweimal so reich sein wie ihr beide zusammen mit dem Geld, das ihr in der Hand habt!" Da sagte der zweite von ihnen: "Ich werde dreimal so reich sein!" Dann sagte der dritte: "Ich werde fünfmal so reich sein." Wieviel Geld hatte jeder Kaufmann? (Indien, 9. Jh. u.Z.) Lösung: 1, 3, 5 Aufgabe 14 Vier Männer finden eine Börse mit 11 Drachmen. Wenn der erste sie behält, besitzt er doppelt so viel wie der zweite und der dritte zusammen; behält sie der zweite, hat er dreimal so viel wie der dritte und der vierte zusammen; der dritte hätte viermal so viel wie der vierte und der erste, und der vierte hätte fünfmal so viel wie der erste und der zweite. Wieviel besitzt jeder der vier? (nach Leonardo von Pisa) Lösung: -1, 4, 1, 4 Aufgabe 15 Für 100 Drachmen sollen 100 Vögel gekauft werden: Enten, Sperlinge und Hühner. Eine Ente kostet 5 Drachmen, 20 Sperlinge kosten 1 Drachme und ein Huhn 1 Drachme. (China, 5.Jh. u.Z.) Lösung: 19 Enten, 80 Sperlinge, 1 Huhn Blume des Thymaridas Thymaridas (um 375 v.u.Z.) löste folgende Aufgabe, die als "Blume des Thymaridas" bekannt wurde: "Schmiede mir einen Kranz! Verwende mir Gold zur der Mischung, Kupfer und Zinn und trefflich gehärtetes Eisen von 60 Minen Gewicht im Ganzen! 201 Von diesem Gewicht betrage das Gold mit dem Kupfer 2/3, das Gold mit dem Zinn 3/4, schließlich das Gold mit dem Eisen 3/5 des fertigen Stücks." Gesucht sind die Anteile der Metalle an den 60 Minen. Die allgemeine Lösung von Thymaridas ist: Gleichungssystem x1 + x2 + ... + xn = s x1 + x2 = a1 x2 + x3 = a2 ... xn + x1 = an-1 Lösung x1 = (a1 + a2 + ... + an-1 - s) / (n-2) x2 = a1 - x1 ... xn = an-1 - x1 Konkret für die Aufgabe wird: x1 + x2 + x3 + x4 = 60 x1 + x2 = 40 x2 + x3 = 45 x3 + x1 = 36 mit 30 1/2 Anteilen Gold, 9 1/2 Kupfer, 14 1/2 Zinn und 5 1/2 Eisen. Es ist besonders erstaunlich, dass schon vor über 2300 Jahren eine derartige Aufgabe gelöst werden konnte. Siegfried Beyers Honigkuchen geg.: w … g Weizenmehl ; h … g Honig ; f … g Feinzucker ; m … g Halbfettmargarine ; z … g gewürfeltes Zitronat ; o … g gewürfeltes Orangeat Die oben genannten Zutaten wiegen insgesamt 1470 g. Die beiden erstgenannten wiegen zusammen 230 g mehr als die vier letztgenannten. Die 8,8fache Masse des Zitronats ergibt die Masse aller restlichen Zutaten. Das Mehl wiegt so viel wie Margarine, Zitronat und Orangeat zusammen, der Honig so viel wie Margarine und Zitronat zusammen. Ein Drittel des Zitronats und ein Fünftel des Honigs machen zusammen die Masse des Zuckers aus. 2 Eier 100 ml Milch (1,5 % Fett) 1 EL Lebkuchengewürz 25 g Belegkirschen 1 Päckchen Orangeback 50 g Mandelstifte 2 TL gemahlener Zimt 1 Eiweiß 1 Päckchen Backpulver 1 EL Wasser 1 EL Kakao Rezept: Honig und Margarine in einem Topf bei mäßiger Hitze mit dem Zucker schmelzen, in eine Rührschüssel geben und abkühlen lassen. Eier, Lebkuchengewürz, Orangeback und Zimt mit den Besen eines Handrührgeräts auf höchster Stufe unter die abgekühlte Honigmasse rühren. Das Mehl mit Backpulver und Kakao mischen, sieben und auf mittlerer Stufe zusammen mit der Milch unter die Honigmasse rühren. Zitronat und Orangeat unter den Teig heben. Den Backofen auf 180° vorheizen. Ein Backblech mit Backpapier auslegen und den Teig darauf verteilen. Nun 5 x 5 cm große Quadrate auf dem Teig markieren und mit Belegkirschen und Mandelstiften garnieren. Das Eiweiß mit Wasser verrühren und den Teig damit bestreichen. Auf der mittleren Schiene etwa 30 Minuten backen. Lösung des Gleichungssystems 1w + 1h + 1f + 1m + 1z + 1o = 1470 1w + 1h - 1f - 1m - 1z - 1o = 230 1w + 1h + 1f + 1m - 8,8z + 1o = 0 1w - 1m - 1z - 1o = 0 1h - 1m - 1z = 0 3h -15f + 5z = 0 w = 500 g Weizenmehl ; h = 350 g Honig ; f = 120 g Feinzucker ; m = 200 g Halbfettmargarine ; z = 150 g gewürfeltes Zitronat ; o = 150 g gewürfeltes Orangeat Siegfried Beyers Honigkuchen (2) Die Aufgabe der vorhergehenden Seite kann auch zu einem unterbestimmten Gleichungssystem verändert werden. Für den Honigkuchen werden benötigt: w … g Weizenmehl, h … g Honig, f … g Feinzucker, m … g Halbfettmargarine, z … g gewürfeltes Zitronat, o … g gewürfeltes Orangeat und keine Zutat darf fehlen. Die oben genannten Zutaten wiegen insgesamt 1470 g. Die beiden erstgenannten wiegen zusammen 230 g mehr als die vier letztgenannten. Das Mehl wiegt so viel wie Margarine, Zitronat und Orangeat zusammen, der Honig so viel wie Margarine und Zitronat zusammen. Ein Drittel des Zitronats und ein Fünftel des Honigs machen zusammen die Masse des Zuckers aus. Von den Margarinewürfeln zu je 100 g musste nie ein Stück abgeschnitten werden. Außerdem waren alle Massen der Zutaten stets ohne Rest durch 10 teilbar. 202 Wieviel Weizenmehl, Honig, Feinzucker, Halbfettmargarine, Zitronat und Orangeat gehören in den Kuchen? Lösung: Das Rätsel erfordert das Aufstellen und Lösen eines linearen Gleichungssystems. 1w + 1h + 1f + 1m + 1z + 1o = 1470 1w + 1h - 1f - 1m - 1z - 1o = 230 1w - 1m - 1z - 1o = 0 1h - 1m - 1z = 0 3h -15f + 5z = 0 Dieses ist unterbestimmt und liefert die Lösungen w = 425 +0,5·e h = 425 -0,5·e f = 195 -0,5·e m = 95 +0,7·e z = 330 -1,2·e o = 1·e Da m ein Vielfaches von 100 sein soll, kann m nur 100, 200, … werden. Da alle Anteile durch 10 teilbar sein sollen, muss 10(m-95) durch 7 teilbar sein, andernfalls treten Dezimalbrüche auf. Dies geht nur für m = 200, 900, … Nur für m = 200 ergeben sich für die anderen Zutaten stets positive Werte, d.h. die Lösung ist w = 500 g Weizenmehl ; h = 350 g Honig ; f = 120 g Feinzucker ; m = 200 g Halbfettmargarine ; z = 150 g gewürfeltes Zitronat ; o = 150 g gewürfeltes Orangeat. Entfernung vom "Bären" zum "Löwen" Nach einem Becher im "Löwen" macht sich Herr Bieri mit konstanter Geschwindigkeit auf den Weg zum "Bären". Zur gleichen Zeit bricht Herr Weinhold vom "Bären" in Richtung "Löwen" auf. Bis zum Treffpunkt legt Herr Bieri 200 Meter mehr als Herr Weinhold zurück. Nach einem Gespräch gehen sie weiter, wegen Nachsinnen über das zufällige Treffen aber jeweils nur noch mit halber Geschwindigkeit. Herr Bieri benötigt noch 8 Minuten bis zum "Bären", Herr Weinhold noch 18 Minuten bis zum "Löwen". Berechnen Sie die Entfernung vom "Löwen" zum "Bären". Lösung: Die Strecke vom "Löwen" zum "Bären" sei x Meter. Die Geschwindigkeit von Bieri sei vB Meter pro Minute, diejenige von Weinhold sei vW Meter pro Minute. In derselben Zeit t legt dann Bieri bis zum Treffpunkt T (0,5x + 100) Meter, Weinhold (0,5x - 100) Meter zurück. (1) vB t = 0,5x + 100 (2) vW t = 0,5x - 100 Nach dem Treffpunkt legt Bieri die Strecke der Länge (0,5x - 100) Meter mit Geschwindigkeit 0,5vB in 8 Minuten, Weinhold die Strecke (0,5x + 100) Meter mit Geschwindigkeit 0,5vW in 18 Minuten zurück. Also gilt: (3) 0,5vB · 8 = 0,5x - 100 (4) 0,5vW · 18 = 0,5x + 100 Dividiert man (1) durch (2), so erhält man dasselbe Resultat wie bei der Division von (4) durch (3): (5) vB / vW = (0,5x + 100) / (0,5x - 100) = 9vW / 4vB d.h. 4vB² = 9vW² und 2vB = 3vW Einsetzen in (5) gibt 3vW / vW = (x + 200) / (0,5x - 100) Auflösung der entstandenen Gleichung ergibt eine Entfernung von x = 1000 m. Quelle: http://www.mathematik.ch/puzzle/puzzle24.php Wiegeproblem Aufgabe: Auf einer gewöhnlichen Balkenwaage sind folgende Gegenstände im Gleichgewicht: Kreis und Dreieck mit Quadrat Kreis mit Dreieck und Fünfeck Zwei Quadrate mit drei Fünfecken Wie viele Dreiecke wiegt ein Kreis? Lösung: Zur Lösung ist ein System von drei Gleichungen mit drei Unbekannten zu lösen (1) Q = K+D Kreis und Dreieck mit Quadrat (2) K = D+F Kreis mit Dreieck und Fünfeck (3) 2Q = 3F Zwei Quadrate mit drei Fünfecken (4) Q = 2D+F (1),(2) (5) 3F = 4D+2F (4),(3) F = 4D (6) K = 4D+D (5),(2) K = 5D Ein Kreis wiegt also fünf Dreiecke. 203 Pumpenprobleme Aufgabe: Ein Behälter soll durch 2 Pumpen P1 und P2 gefüllt werden. Arbeiten beide Pumpen gleichzeitig, so benötigt man 6 Stunden. Da aber P2 nach 3 Stunden abgeschaltet wurde, musste P1 noch weitere 5 Stunden allein arbeiten. In welcher Zeit hätten die Pumpen einzeln den Behälter gefüllt? Lösung: Es seien x und y die prozentualen Füllmengen jeder Pumpe je Stunde Arbeitszeit. Dann ergibt sich das System 6/x + 6/y = 1 und 8/x + 3/y = 1 mit der Lösung x = 1/10, y = 1/15. Damit benötigt die Pumpe P1 allein 10 Stunden, die Pumpe P2 allein 15 Stunden. Aufgabe 2: Ein Wasserbecken wird mit zwei Pumpen befüllt, die dafür gemeinsam 12 Stunden benötigen. Betriebe man sie einzeln, wäre die schnelle Pumpe 10 Stunden eher fertig als die langsame. Wie lange brauchen die beiden Pumpen im Einzelbetrieb zur Füllung des Beckens? Lösung: Analog erhält man das System 12/x + 12/y = 1 ; 1/y = 1/(x+10) mit der Lösung x = 1/20, y = 1/30, d.h. 20 und 30 Stunden. Aufgabe 3: Ein Schwimmbassin wird durch zwei Pumpen gefüllt. Die erste Pumpe füllt das Bassin alleine in 16 Stunden, die zweite alleine in 12 Stunden. Um 8.00 Uhr werden beide Pumpen zur Füllung des Bassin eingeschaltet. Doch nach einer Stunde fällt die zweite Pumpe aus. Die Reperatur benötigt ganze 9 Stunden, danach arbeiten für den Rest der Füllung wieder beide Pumpen zusammen. Wann ist das Bassin gefüllt? Lösung: Es sei x die Zeit, welche nach der Reperatur noch vergeht, bis das Bassin voll ist. Dann wird 100/16 (10+x) + 100/12 (1+x) = 100 mit der Lösung x = 2. Das Bassin ist nach 12 Stunden, d.h. um 20.00 Uhr gefüllt. Nichtlineares Gleichungssystem – Beispiel Aufgabe: Ein Schwimmbecken wird aus zwei Hähnen mit Wasser gefüllt. Öffnet man zunächst den ersten Hahn ein Drittel der Zeit, welche man benötigt, das Becken mit dem zweiten Hahn zu füllen, und anschließend den zweiten Hahn ein Drittel der Zeit, welche man benötigt, das Becken mit dem ersten Hahn zu füllen, so hat man das Becken zu 13/18 gefüllt. Man berechne, wie viel Zeit jeder Hahn für sich benötigt, das Becken zu füllen, wenn bei Öffnung beider Hähne das Becken in 216 Minuten gefüllt ist. Lösung: Für Hahn i sei xi die Flüssigkeit pro Minute und ti die zur Füllung benötigten Minuten (i = 1,2). x2 t2 = 1 (1) Aufgrund dieser Definitionen gilt: x1 t1 = 1 (2) x1 t2/3 + x2 t1/3 = 13/18 (x1 + x2) 216 = 1 (3) Aus (2) folgt 6x1t2 + 6x2t1 = 13, und mit (1) erhält man: 6 x1/x2 + 6 x2/x1 = 13. Mit y = x1/x2 führt dies auf die Gleichung y² - 13/6 y + 1 = 0. mit den zwei Lösungen y1 = 3/2 und y2 = 2/3. 1.Fall: x1/x2 = 3/2 in (3) eingesetzt, ergibt x1 = 1/360, x2 = 1/540 und somit t1 = 360, t2 = 540. 2.Fall: x1/x2 = 2/3 in (3) eingesetzt, ergibt x1 = 1/540, x2 = 1/360 und somit t1 = 540, t2 = 360. Der eine Hahn füllt das Becken in 540 Minuten, der andere in 360 Minuten. Diophantische Gleichungen ...Gleichung mit ganzzahligen Koeffizienten und Variablen (linear) a x + b y = c; a,b,c,x,y ∈ Z Die Lösungsmenge wird in der Menge der ganzen Zahlen gesucht. Lösbar mit unendlich vielen Lösung ⇔ ggT(a,b) teilt c Die Namensgebung erfolgte zu Ehren des irgendwann zwischen 100 v.Chr. und 350 in Alexandria wirkenden Mathematikers Diophant. Wahrscheinlichste Lebensdaten liegen zwischen 200 bis 284 n.Chr. Die einfachste diophantische Gleichung ist a X - b = 0. Sie ist lösbar, falls a = 0 und b = 0, dann ist jede ganze Zahl X eine Lösung. Falls a ≠ 0, hat die Gleichung nur dann eine Lösung, wenn a ein Teiler von b ist. Die Lösung ist in diesem Fall X = b / a. Auf der rechten Seiten werden die Lösungen der diophantischen Gleichungen A*X+B*Y = ggT[A,B] und AX = 1 mod B ermittelt. Über die Gleichung A*X = 1 mod B kann der geheime Schlüssel beim asymmetrischen Verschlüsselungsverfahren RSA berechnet werden. Eine lineare Diophantische Gleichung mit natürlichen Koeffizienten a x + b y = c; a, b, c ∈ N, x, y ∈ Z besitzt unendliche viele Lösungen, wenn der ggT(a,b) die Zahl c teilt. 204 Die ganzzahligen Lösungen x, y können dabei auch negativ sein. Mitunter fragt man aber nach einem Lösungspaar (x, y), bei dem beide Zahlen natürlich sind. Auch wenn die Gleichung ganzzahlige Lösungen besitzt, muss eine natürliche Lösung nicht existieren. Zum Beispiel erhält man für 5 x + 7 y = 24 die Lösung (2, 2) für 5 x + 7 y = 23 keine natürliche Lösung. Das hier genannte Problem tritt relativ häufig auf. Bei der Aufgabe der Ding-Bong-Zahlen ergibt sich zum Beispiel, dass ab c = 24 alle Zahlen durch zwei Töne dargestellt werden können; ab c = 24 existiert für die Gleichung 5x+7y=c stets ein natürliches Lösungspaar. Diophantische Gleichung mit zwei Variablen Die lineare diophantische Gleichung ax + by = c (1) mit vorgegebenen ganzen Zahlen a, b, c hat genau dann ganzzahlige Lösungen in x und y, wenn c durch den größten gemeinsamen Teiler g von a und b teilbar ist. Die linke Seite ist durch g teilbar, also muss auch c durch g teilbar sein. Wie bei jeder linearen Gleichung ist die Differenz zweier Lösungen eine Lösung der zugehörigen homogenen Gleichung ax + by = 0 Bestimmt man also eine Lösung der ursprünglichen, inhomogenen Gleichung, so erhält man durch Addition von Lösungen der homogenen Gleichung sämtliche anderen Lösungen der inhomogenen Gleichung (1). Lösungen der homogenen Gleichung Schreibt man a = ga' und b = gb' mit g = ggT(a, b), so ist die homogene Gleichung äquivalent zu a'x = - b'y, und da a' und b' teilerfremd sind, ist x durch b' und y durch a' teilbar. Sämtliche Lösungen der homogenen Gleichung sind also durch x = tb' ; y = - ta' für eine beliebige ganze Zahl t gegeben. Auffinden einer Partikularlösung Mithilfe des erweiterten euklidischen Algorithmus kann man Zahlen u, v bestimmen, so dass au + bv = g mit g = ggT(a, b) gilt. Setzt man s = c/g, so ist x0 = su ; y0 = sv eine Lösung der Gleichung (1). Gesamtheit der Lösungen Die Gesamtheit der Lösungen von (1) ist gegeben durch für beliebige ganze Zahlen t. x = x0 + tb' ; y = y0 - ta' Reduktion diophantischer Gleichungen Gegeben ist die lösbare diophantische Gleichung a1 x1 + a2 x2 + ... + an xn = b , n > 2 mit (a1, a2, ..., an) <> (0, 0, ..., 0) und ggT(a1, a2, ..., an) = 1. Wäre der ggT(a1, a2, ..., an) <> 1, so müsste man die Gleichung noch durch ggT(a1, a2, ..., an) dividieren. Nach der Umformung a1 x1 + a2 x2 + ... + an-1 xn-1 = b - an xn betrachtet man xn als ganzzahlige Konstante und erhält eine lineare diophantische Gleichung mit n-1 Unbekannten, die genau dann lösbar ist, wenn ggT(a1, a2, ..., an-1) ein Teiler von b - an xn ist. Die Bedingung ggT(a1, a2, ..., an-1) | b - an xn ist genau dann erfüllt, wenn es ganze Zahlen c, cn gibt, für die gilt: ggT(a1, a2, ..., an-1) c + an cn = b Das ist eine lineare diophantische Gleichung in zwei Unbekannten, die mit Hilfe des allgemeinen Lösungsverfahrens für n = 2 gelöst werden kann. Ist ihre Lösung bekannt, dann hat man nur noch eine lineare diophantische Gleichung in n-1 Unbekannten zu lösen. Die beschriebene Reduktion ist fortsetzbar, bis man schließlich eine lineare diophantische Gleichung in zwei Unbekannten erhält, die gelöst werden kann. Aus den zwischenzeitlich berechneten Lösungsmengen für diophantische Gleichungen in zwei Unbekannten muss man nun noch die Lösungsmenge der Ausgangsgleichung ablesen. Esel-Maultier-Problem ... klassisches Problem, erstmals von Euklid aufgestellt und gelöst Aufgabenstellung: Ein Esel und ein Maultier tragen jeweils eine Anzahl Säcke. Spricht das Maultier zum Esel: "Gibst Du mir einen Sack, so haben wir beide gleich viele". Antwortet der Esel: "Gibst Du mir einen Sack, so habe ich doppelt so viel wie Du." Wie viele Säcke tragen beide? Problem führt zum linearen Gleichungssystem x+1=y–1 2 (x - 1) = y + 1 mit der Lösung (5 ; 7). Das Maultier trägt 5 Säcke, der Esel 7. 205 Verallgemeinerung Maultier: "Gibst Du mir a Säcke, dann habe ich b Mal so viele wie Du". Esel: "Gibst Du mir c Säcke, so habe ich d Mal so viel wie Du." Die allgemeinen Lösungen sind x = c + (b + 1)(a + c) / (bd - 1) y= a + (d + 1)(a + c) / (bd - 1) Nur wenn (bd - 1) ein Teiler sowohl von (b + 1)(a + c) als auch von (d + 1)(a + c) ist, existiert eine ganzzahlige Lösung. Wechselgeldaufgabe Aufgabe: Als ich letzte Woche ein Buch mit einem Hundertmarkschein bezahlt hatte, stellte ich zu Hause fest, dass mir die Kassiererin doppelt soviel und noch fünf Pfennige mehr an Wechselgeld gegeben hatte, als mir zustand. Offensichtlich hatte sie den Markbetrag mit dem Pfennigbetrag des Wechselgeldes vertauscht. Wie teuer war das Buch? Lösung (Arne Heizmann): Der Mark-Betrag sei m, der Pfennig-Betrag p. Das Wechselgeld ist also 100m + p. Das vertauschte Wechselgeld ist demnach m + 100p. Es ergibt sich die Gleichung: m + 100p = 2 (p + 100m) + 5 = 2p + 5 + 100 (2m) [a] = 2p - 95 + 100 (2m+1) [b] Falls 2p+5 < 100, d.h. p < 48 ist, wählt man Gleichung [a]. Nimmt man daraus den Mark- und PfennigBetrag heraus, ergeben sich zwei Gleichungen: m = 2p + 5 p = 2m → m = 4m + 5 → m = -5/3 Das widerspricht der Annahme, m sei eine ganze Zahl. Also ist p > 47. Nach Gleichung [b] wird: m = 2p - 95 p = 2m + 1 → m = 2(2m+1)-95 → m = 31 → p = 63 Archimedisches Rinderproblem Durch Archimedes wurde folgendes Problem gestellt: Die Rinderherde des Gottes Helios besteht aus x weißen, y schwarzen, z gescheckten und t braunen Stieren und aus x' weißen, y' schwarzen, z' gescheckten und t' braunen Kühen. (a) Es gilt x = (1/2+1/3)y+t , y = (1/4+1/5)z+t , z = (1/6+1/7)x+t und x' = (1/3+1/4)(y+y') , y' = (1/4+1/5)(z+z') , z' = (1/5+1/6)(t+t') , t' = (1/6+1/7)(x+x') (b) Die weißen und die schwarzen Stiere zusammen können sich in Form eines Quadrats aufstellen, d.h. x+y ist eine Quadratzahl. (c) Die gescheckten und die braunen Stiere zusammen können sich in Form eines Dreiecks aufstellen, d.h. 8(z+t)+1 ist Quadratzahl Zu ermitteln ist die Anzahl der Rinder in der Herde. Lösung der ersten 3 Gleichungen (x,y,z,t) = m(2226,1602,1580,891), m ist natürliche Zahl Die nächsten Gleichungen sind nur dann ganzzahlig lösbar, falls m durch 4657 teilbar ist. Sei also m = 4657·k mit einer natürlichen Zahl k, dann ist (x',y',z',t') = k (7206360, 4893246, 3515820, 5439213). Bedingung (b): x+y und 8(z+t)+1 sind Quadratzahlen Ist x+y Quadratzahl, so ist k = a·l² mit a = 3·11·29·4657. Ist 8(z+t)+1 = h², so erhalten wir die Gleichung h² = 8(z+t)+1 = 8·4657·2471·a·l² + 1, also ist (h,l) eine Lösung der Pellschen Gleichung für d = 8·4657·2471·a = 2·3·7·11·29·353·22·46572 = 410 286 423 278 424 Diese Pell'sche Gleichung wurde 1880 von A.Amthor gelöst: Die Gesamtzahl der Rinder ist eine Zahl mit 206545 Ziffern, die mit 77602714064868182695302328332138866642323224059233 … beginnt. Die nachfolgende Abbildung zeigt die allgemeine Lösung von Lenstra 206 Das Problem wurde 1773 von Gotthold Ephraim Lessing in einem griechischem Manuskript der Herzog August Bibliothek in Wolfenbüttel entdeckt, das einen in 44 Distichen abgefassten Brief des Archimedes an Eratosthenes von Kyrene enthielt. Quelle: Lessing "Zur Geschichte der Literatur. Aus den Schatzen der herz. Bibliothek zu Wolfenbüttel. Zweiter Beitrag." Braunschweig 1773 Ob der Brief tatsächlich von Archimedes stammt wird angezweifelt, das Problem selbst ist aufgrund seiner Schwierigkeit jedoch möglicherweise auf Archimedes zurückzuführen. Eine deutsche Übertragung des Gedichts wurde 1842 von G.H.F.Nesselmann angefertigt und veröffentlicht, eine weitere von B.Krumbiegel 1880. Auszug aus dem Originaltext: "Προβληµα Πλθυν Ηελιοιο βοων, ω ξεινε, µετρησον φροντιδ επιστησας, ει µετεχεις σοφιης, ποσση αρ εν πεδιοις Σικελης πορ εβοσκετο νησου Θρινακυης τετραχη στιφεα δασσαµενη χροιην αλλασσοντα το µεν λευκοιο γαλακτος, κυανεω ετερον χροωµατι λαµποµενον, αλλο γε µεν ξανθον το δε ποικιλον." Der von Lessing veröffentlichte Text enthält eine Teillösung, die aber zwei Forderungen aus dem zweiten Teil des Gedichtes nicht erfüllt. Dies blieb wegen der zur Lösung nötigen Berechnung von sehr großen Zahlen bis vor einigen Jahren ungelöst. Ein Lösungsverfahren wurde 1880 von A. Amthor gefunden. Diophantische Gleichung bei Alcuin von York Auf den angelsächsischen Gelehrten Alcuin von York (732 – 804) geht folgende Aufgabe zurück: Ein Familienvater hatte ein Hausgesinde von 100 Personen, unter das er vom Jahresertrag 100 Scheffel austeilen ließ, und zwar in der Weise, dass die Männer je 3, die Frauen je 2 und die Kinder je ½ Scheffel erhielten. Wie viele Männer, Frauen und Kinder waren es? Lösung: Es seien x Männer, y Frauen und z Kinder gegeben. Dann wird x + y + z = 100 und 3x + 2y + z/2 = 100 6x + 4y + z = 200 Subtraktion führt zu 5x + 3y = 100 und somit y = (100 – 5x)/3 = 33 – x + (1-2x)/3. Setzt man (1-2x)/3 = u, wird 2x + 3u = 1 x = (1-u)/2 – u. Mit (1-u)/2 = v wird u = 1 – 2v. Rücksubstitution ergibt x=3v–1 y = 35 – 5v z = 100 – x – y Für v = 1,2,…,6 ergeben sich insgesamt sechs mögliche Lösungen der Aufgabe: Männer Frauen Kinder Männer Frauen Kinder Männer Frauen Kinder 2 30 68 5 25 70 8 20 72 11 15 74 14 10 76 17 5 78 Münzproblem von Frobenius In einer Währung seien Münzen mit den Werten 1, 2, 5, 10, 50, 100, 200 und 500 Einheiten vorhanden. Gesucht sind Lösungen, einen Geldbetrag G mit diesen Münzen auszuzahlen. Das Problem führt zu der Gleichung: 1x0 + 2x1 + 5x2 + 10x3 + 50x4 + 100x5 + 200x6 + 500x7 = G Münzproblem von Frobenius Es seien ai, k ∈ N und xi ∈ N. Man betrachte die diophantische Gleichung a1x1 + a2x2 + … + anxn = k, mit ai fest und ggt(a1, a2, …, an) = 1. Gesucht ist g(a1, a2, …, an), also die größte natürliche Zahl k, für die die diophantische Gleichung keine ganzzahlige Lösung mehr hat. Lösung für i=2 von Sylvester 1884: Seien a,b ∈ N mit ggt(a,b)=1, dann gilt g(a,b) = ab-a-b. Beweis: Sei n > ab-a-b eine Zahl. Man muss zunächst zeigen, dass für diese Zahl die diophantische Gleichung ax+by = n immer eine ganzzahlige Lösung hat. Es gilt: Sei für x0, y0 ∈ Z das Paar (x0, y0) eine ganzzahlige Lösung dieser Gleichung. Dann wird: (x, y) ist eine Lösung der diophantischen Gleichung ⇔ ∃ t ∈ Z: x = x0 + bt ∧ y = y0 - at. Wählt man t so, dass 0 ≤ y0 - at ≤ a-1 ist, dann gilt ax + by = n, ax = n - by a(x0 + bt) = n - b(y0- at) > ab-a-b-b(a-1) = -a, also a(x0 + bt) > -a und x0 + bt > -1, also x0 + bt ≥ 0. Es existiert eine Lösung. Es bleibt zu zeigen, dass ax + by = ab-a-b keine Lösung hat. Wenn ax+by = ab-a-b eine Lösung hätte, dann gelte ab = ax + a + by + b = a(x+1) + b(y+1). Da a und b teilerfremd per Voraussetzung, muss y+1 teilbar durch a sein und x+1 teilbar b durch sein. Also muss y+1 ≥ a und x+1 ≥ b. Doch dann gilt 207 ab = a(x+1) + b(y+1) ≥ ab+ab = 2ab. Widerspruch, da a und b ungleich 0. Gleichungssystem - Netzwerk Mit Hilfe der Kirchhoffschen Regeln und linearer Gleichungssysteme können elektrische Netzwerke einfach berechnet werden. Beispiel Maschensatz für M1 R1 I1 + U2 = U0 Knotensatz für K2 -I1 + G2 U2 + I3 = 0 Maschensatz für M3 -U2 + R3 I3 + U4 = 0 Knotengleichung für K4 -I3 + G4 U4 = 0 Gemischte Diophantische Gleichung Eine Diophantische Gleichung der Form x·y + a·x + b·y + c = 0 mit den zwei Variablen x und y sowie dem gemischten Glied x·y kann mit der Eulerschen Reduktionsmethode gelöst werden. Auflösen nach x ergibt x = - (b·y + c) / (y + a) = -b + (b·d - c) / (y + a) Da der zweite Term ganzzahlig sein muss, setzt man r = (b·a - c) / (y + a) d.h. y = -a + (a·b - c) / r Damit können nur Lösungen gefunden werden, für die r ein ganzzahliger Teiler von a·b - c ist. Im Allgemeinen existieren nur endlich viele Lösungen. Pellsche Gleichung Die Pellsche Gleichung X2 - D*Y2 = 1 erhielt ihren Namen von Euler zu Ehren von John Pell (1611-1685). Für D = 61 und 109 ist die Lösung extrem schwierig und wurde erstmals von Lord William Brouncker und John Wallis gefunden. Z.B. ergibt sich für D = 109 : X = 158070671986249 und Y = 15140424455100 Kennt man eine Lösung x0 und y0, so ergeben sich weitere Lösungen mit x1 = C*x1 -1 y1 = C*y0 mit C = 2*x0 xn = C*xn-1 -xn-2 yn = C*yn-1 - yn-2 D Lösungen der Pellschen Gleichung 5 9/4 6 5/2 7 8/3 13 649 / 180 61 1766319049 / 226153980 73 2281249 / 267000 109 158070671986249 / 15140424455100 157 46698728731849 / 3726964292220 181 2469645423824185801 / 183567298683461940 241 10085143557001249 / 649641205044600 277 159150073798980475849 / 9562401173878027020 409 25052977273092427986049 / 1238789998647218582160 421 3879474045914926879468217167061449 / 189073995951839020880499780706260 Die Lösung der Pellschen Gleichung X2 - D*Y2 = 1 ergibt schon für kleine D sehr große Lösungen X und Y. Die Tabelle enthält die Werte für D, bei denen X ein neues Maximum annimmt. (gesucht bis 1,2 Millionen) D 5 13 46 61 181 397 421 gerundeter Wert für X D gerundeter Wert für X 9 10 19 649 29 9801 24335 53 66249 1766319049 109 158070671986249 2469645423824185801 277 159150073798980475849 838721786045180184649 409 25052977273092427986049 3879474045914926879468217167061449 541 370745336002386702880064559966700500 661 16421658242965910275055840472270471049 1021 198723867690977573219668252231077415636351801801 1069 742925865816843150858935268959512942700219559049 1381 91889645003972654622127399341267476203024769394634584316300287049 ... 1167709 3.35239450597464815152511177808367904503088052112714420 * 10^2779 Pellsche Gleichung und Hastings - Die Schlacht von Hastings ... aus Amusements in Mathematics, von Henry Ernest Dudeney, 1917 Die Aufgabe bezieht sich auf die Schlacht bei Hastings, jenen berühmten Kampf, in dem 1066 die Normannen unter Wilhelm dem Eroberer die Sachsen unter König Harald besiegten, und fortan die Geschicke Englands bestimmten. Nach Dudeney schildert die alte Chronik: 208 "Haralds Mannen standen tapfer zusammen und bildeten 61 Quadrate mit gleich vielen Recken in jedem Quadrat. Als Harald sich in die Schlacht warf, bildeten die Sachsen mit ihm zusammen ein einziges, mächtiges Quadrat." Gesucht ist nun die minimal mögliche Anzahl der Krieger. Lösung Wir bezeichen die Kantenlänge der kleinen Quadrate mit y und die vom großen Quadrat mit x, d.h. 61 y² + 1 = x² Es handelt es sich um eine diophantische Gleichung 2.Ordnung, konkret um die Pellsche Gleichung x² - d y² = 1 mit d = 61 Deren kleinste natürliche Lösung ist y = 226153980, x = 1766319049. Mit Harald zusammen wäre also etwa 3.11 Trillionen Sachsen dabei gewesen. Und da sollen die verloren haben? Pellsche Gleichung und Quadratwurzel Mittels Pellscher Gleichung X2 - D*Y2 = 1 kann eine Näherungsformel für die Quadratwurzel √D ermittelt werden. Durch Umstellen ergibt sich mit der Lösung (x0 , y0) als 1.Näherung √D ≈ x0 / y0 Mit der Lösung (xn , yn) ist auch xn+1 = xn² + D yn² ; yn+1 = 2 xn yn Lösung der Gleichung, wobei die Quotienten xn / yn mit wachsendem n immer besser die Wurzel √D annähern. Ein schnellere Konvergenz ergibt sich durch Abschätzen des Fehlers √D = x0 / y0 - 1/2 (1/(x0 y0) + 1/(x1 y1) + 1/(x2 y2) + ...) Zum Beispiel wird für D = 2: x0 = 3, y0 = 2, x1 = 9+2*4 = 17, y1 = 2*3*2 = 12 , x2 = 289+2*144 = 577, y2 = 2*17*12 = 408 und somit √2 = 3/2 - 1/2 (1/(3*2) + 1/(17*12) + 1/(577*408) + ...) Mit den ersten 3 Summanden erhält man als Näherung 1,41421356237... (√2 ≈ 1.41421356237310...) mit elf exakten Ziffern. Berücksichtigt man x3 = 665857, y3 = 470832 stimmt der Näherungswert auf 21 Stellen. Pellsche Gleichung und Kettenbruch Mithilfe von Kettenbrüchen von Quadratwurzeln kann die Pellsche Gleichung gelöst werden. x² - d·y² = 1 Dazu entwickelt man √d in einen Kettenbruch und wählt an, die vorletzte Zahl einer Periode. Ist die Länge der Periode ungerade, so nutzt man die vorletzte Zahl der zweiten Periode. Ist [a1, a2, a3, …] der Kettenbruch, so ermittelt man den n.ten Näherungsbruch pn/qn. Dazu verwendet man p0 = 1, q0 = 0, p1 = a1, q1 = 1 pn = anpn-1 + pn-2, qn = anqn-1 + qn-2 Das Paar x = pn und y = qn ist dann eine Lösung der Gleichung. Beispiel: x² - 7y² = 1 Die Kettenbruchentwicklung von √7 ist [2; 1, 1, 1, 4, 1, 1, 1, 4 …]. Die vorletzte Zahl der ersten Periode ist a4 = 1 und der 4.Näherungsbruch ist 8/3. x = 8 und y = 3 sind also Lösung der Gleichung, denn 8² - 7·3² = 1. Eine weitere Lösung erhält man aus a8, der vorletzten Zahl der zweiten Periode, der 8.Näherungsbruch ist 127/48, und 127² - 7·48² = 1. Diophantische Gleichung 2.Grades Eine diophantischen Gleichung 2.Grades ist eine Gleichung für ganzzahlige a, c und k mit ganzzahligen Lösungen x und y mit ax² + cy² = k Pythagoreische Gleichung Spezialform A² + B² = C² Lösung alle ganzzahligen pythagoreischen Tripel (A,B,C) Spezialform A² = B² + C² + D² Lösung ganzzahlige pythagoreische Quadrupel (A,B,C,D) Spezialform (A²+B²) (C²+D²) = E² + F² Lösung über Fibonacci-Identität (a²+b²)(c²+d²) = (ac ± bc)² + (bc ± (-ad))² = e² + f² Eulersche 4-Quadrate-Identität(a²+b²) (c²+d²) (e²+f²) (g²+h²) = j² + k² + m² + n² Lebesque-Identität (a² + b² + c² + d²)² = (a² + b² - c² - d²)² + (2ac + 2bd)² + (2ad - 2bc)² 6-6-Lösung einer Diophantischen Gleichung 2.Grades 87² + 233² + 264² + 396² + 496² + 540² = 90² + 206² + 309² + 366² + 522² + 523² Ramanujan Quadratgleichung ... die Gleichung 2n - 7 = x² hat ausschließlich für n = 3, 4, 5, 7 und 15 ganzzahlige Lösungen (nach Schroeppel) Diophantische Gleichung n.Grades 209 ... Gleichung mit ganzzahligen Koeffizienten und Lösungen x1k + x2k + ... + xmk = y1k + y2k + ... + ynk Die Tabelle enthält die kleinsten n für welche ganzzahlige Lösungen für ein k und 1 ≤ m ≤ n bekannt sind: m k=2 3 4 5 6 7 8 9 10 1 2 3 3 4 7 8 11 15 23 2 2 2 2 4 7 8 9 12 19 3 3 3 7 8 11 24 4 4 7 10 23 5 5 5 11 16 6 6 27 Diophantische Gleichung 2.Grades a² + b² = c² + d² = e² Die Liste enthält ganzzahlige Lösungen der Diophantischen Gleichung a² + b² = c² + d² = e² = n Angegeben werden teilerfremde a und b sowie deren Summe, welche eines Quadratzahl von e darstellt. In Klammern stehen Paare (c ; d), für die gerade die Gleichung erfüllt ist. Jedes Quadrupel (a, b, c, d) ist genau einmal in der Tabelle enthalten. Gesucht wurde bis a, b, c, d < 10000. (Februar 2007) Ausgewählte a² +b² 7² + 24² 13² + 84² 16² + 63² 17² + 144² 21² + 220² 23² + 264² 27² + 364² 31² + 480² 33² + 544² 36² + 323² 253) 37² + 684² 41² + 840² 43² + 924² 740) 44² + 117² 44² + 483² 47² + 1104² ; 1020) 53² + 1404² 55² + 1512² Lösungen e² n = 25² = 625 = 85² = 7225 = 65² = 4225 = 145² = 21025 = 221² = 48841 = 265² = 70225 = 365² = 133225 = 481² = 231361 = 545² = 297025 = 325² = 105625 (c; d) (15 ; 20) (36 ; 77) (40 ; 75) (51 ; 68) (25 ; 60) (33 ; 56) (39 ; 52) (24 ; 143) (87 ; 116) (100 ; 105) (85 ; 204) (104 ; 195) (140 ; 171) (96 ; 247) (140 ; 225) (159 ; 212) (76 ; 357) (219 ; 292) (240 ; 275) (156 ; 455) (185 ; 444) (319 ; 360) (184 ; 513) (300 ; 455) (327 ; 436) (80 ; 315) (91 ; 312) (125 ; 300) (165 ; 280) (195 ; 260) (204 ; = 685² = 469225 = 841² = 707281 = 925² = 855625 (156 ; 667) (411 ; 548) (440 ; 525) (580 ; 609) (259;888) (285;880) (300 ; 875) (520 ; 765) (533 ; 756) (555 ; = 125² = 15625 (75 ; 100) = 485² = 235225 (93 ; 476) (291 ; 388) (325 ; 360) = 1105² = 1221025 (105 ; 1100) (169 ; 1092) (264 ; 1073) (272 ; 1071) (425 = 1405² = 1513² = 1974025 = 2289169 (444 ; 1333) (800 ; 1155) (843 ; 1124) (663 ; 1360) (712 ; 1335) (888 ; 1225) Diophantische Gleichung 2.Grades a² + b² = n Während auf der vorhergehenden Seite nach Lösungen der Gleichung a² + b² = c² + d² = e² = n gefragt wurde, muss die Summe zweier Quadrate nicht unbedingt selbst Quadrat sein, d.h. gesucht sind für ein gegebenes natürliches n alle natürlichen Lösungen der Gleichung a² + b² = n Eine Zahl n ist genau dann Summe von Quadraten, wenn alle ungeraden Primfaktoren der Form 3 mod 4 in gerader Potenz auftreten. Die Anzahl der Summen, bis auf Vertauschungen, ist gleich der halben Anzahl der Teiler der Form 1 mod 4. Während es für einige n keine Lösung gibt, treten für andere Mehrfachlösungen auf. Zum Beispiel ist 105625 = 36² + 323² = 80² + 315² = 91² + 312² = 125² + 300² = 165² + 280² = 195² + 260² = 204² + 253² oder 2442050 = 73² + 1561² = 155² + 1555² = 221² + 1547² = 367² + 1519² = 391² + 1513² = 455² + 1495² = 533² + 1469² = 595² + 1445² = 799² + 1343² = 809² + 1337² = 923² + 1261² = 995² + 1205² = 1057² + 1151² = 1105² + 1105² Die Anzahl von genau 1, 2, 3, … Lösungen ergeben sich zuerst für die natürlichen Zahlen n = 2, 50, 325, 1105, 8125, 5525, 105625, 27625, 71825, 138125, 5281250, 160225, 1221025, 2442050, 1795625, 801125, 446265625, 2082925, ?, 4005625, 44890625, 30525625, 61051250, 5928325, 303460625, … Gua-Quadrupel, Pythagoras-Quadrupel Nach dem Satz von de Gua gilt: 210 Hat ein Tetraeder an einer Ecke drei rechte Kantenwinkel, so gilt für die Seitenflächeninhalte der angrenzenden Tetraederflächen A² + B² + C² = D² Der Satz von de Gua stellt damit eine zum Satz des Pythagoras äquivalente Form im dreidimensionalen Raum dar. Natürliche Zahlen, welche die diophantische Gleichung A² + B² + C² = D² können daher Gua-Quadrupel oder Pythagoras-Quadrupel genannt werden. Die kleinsten echten GuaQuadrupel, d.h. ohne 0 und gleiche oder nichtteilerfremde Zahlen, sind (2, 3, 6, 7), (1, 4, 8, 9), (2, 6, 9, 11), (3, 4, 12, 13), (2, 5, 14, 15), (2, 10, 11, 15), (8, 9, 12, 17), (1, 6, 18, 19), … Möglicher Generator für x² + y² + z² = w²: x = a² - b² - c² y = 2ac z = 2ab w = a² + b² + c² für beliebige ganzzahlige Parameter a, b und c. Diophantische Gleichung 2.Grades a² + b² + c² = n Für die diophantische Gleichung der Form a² + b² + c² = d² existieren verschiedene Lösungstripel. Allerdings muss die Summe dreier Quadrate nicht unbedingt selbst Quadrat sein, d.h. gesucht sind für ein gegebenes natürliches n alle natürlichen Lösungen der Gleichung a² + b² + c² = n Während es für einige n keine Lösung gibt, treten für andere auch Mehrfachlösungen auf. Die kleinsten n, für die keine Zerlegung in eine Summe von 3 Quadraten existiert, sind 7, 15, 23, 28, 31, 39, 47, 55, 60, 63, 71, 79, 87, 92, 95, 103, 111, 112, 119, 124, 127, 135, … Zu diesen natürlichen Zahlen gehören u.a. alle n = 7 + 8k und n = 28 + 32k, k > 0. Diophantische Gleichung 3.Grades Die nachfolgende Tabelle enthält Lösungen für Diophantische Gleichungen 3.Grades. Angezeigt werden Gleichungen der Typen a-b = 1-3, ... die Summe von a Potenzen 3.Grades natürlicher Zahlen gleich einer Summe von b Potenzen 3.Grades. Typ 1-3 6³ = 3³ + 4³ + 5³ 9³ = 1³ + 6³ + 8³ 20³ = 7³ + 14³ + 17³ 29³ = 11³ + 15³ + 27³ 84³ = 28³ + 53³ + 75³ 87³ = 26³ + 55³ + 78³ 105³ = 33³ + 70³ + 92³ 709³ = 193³ + 461³ + 631³ 929³ = 69³ + 447³ + 893³ 505³ = 59³ + 163³ + 499³ 535³ = 349³ + 379³ + 383³ Typ 1-4 20³ = 11³ + 12³ + 13³ + 14³ 13³ = 5³ + 7³ + 9³ + 10³ Typ 1-5 9³ = 1³ + 3³ + 4³ + 5³ + 8³ 12³ = 3³ + 4³ + 5³ + 8³ + 10³ Typ 1-6 13³ = 1³ + 5³ + 6³ + 7³ + 8³ + 10³ Typ 2-2 1729 = 1³ + 12³ = 9³ + 10³ 4104 = 2³ + 16³ = 9³ + 15³ 13832 = 2³ + 24³ = 18³ + 20³ 20683 = 10³ + 27³ = 19³ + 24³ 32832 = 4³ + 32³ = 18³ + 30³ 39312 = 2³ + 34³ = 15³ + 33³ 40033 = 9³ + 34³ = 16³ + 33³ 46683 = 3³ + 36³ = 27³ + 30³ 64232 = 17³ + 39³ = 26³ + 36³ 65728 = 12³ + 40³ = 31³ + 33³ Typ 2-2-2 87539319 = 167³ + 436³ = 228³ + 423³ = 255³ + 414³ 119824488 = 11³ + 493³ = 90³ + 492³ = 346³ + 428³ 143604279 = 111³ + 522³ = 359³ + 460³ = 408³ + 423³ 175959000 = 70³ + 560³ = 198³ + 552³ = 315³ + 525³ 327763000 = 300³ + 670³ = 339³ + 661³ = 510³ + 580³ Typ 2-2-2-2 6963472309248 = 2421³ + 19083³ = 5436³ + 18948³ = 10200³ + 18072³ = 13322³ + 16630³ Typ 4-4 2³ + 3³ + 10³ + 11³ = 1³ + 5³ + 8³ + 12³ Typ 6-6 1³ + 2³ + 4³ + 8³ + 9³ + 12³ = 3³ + 5³ + 6³ + 7³ + 10³ + 1³ 87³ + 233³ + 264³ + 396³ + 496³ + 540³ = 90³ + 206³ + 309³ + 366³ + 522³ + 523³ Ramanujan-Quadrupel Für die Diophantische Gleichung 3.Grades x³ + y³ + z³ = t³ gab der indische Mathematiker Srinivasa Ramanujan eine Berechnungsvorschrift an: Sind a und b beliebige ganze Zahlen, so gilt x³ + y³ + z³ = t³ mit x = 3a² + 5ab - 5b² y = 4a² - 4ab + 6b² z = 5a² - 5ab - 3b² t = 6a² - 4ab + 4b² Die Berechnungsvorschrift ergibt Lösungen der Gleichung, die im Allgemeinen nicht primitiv sind, d.h. der größte gemeinsame Teiler von x,y,z,t kann größer 1 sein. Außerdem können nicht alle möglichen ganzzahligen Quadrupel (x,y,z,t) ermittelt werden. Für einige t existieren verschiedene Tripel (x,y,z). Die kleinsten t mit genau n verschiedenen, teilerfremden Darstellungen x³ + y³ + z³ = t³ sind n 1 6³ = 3³ + 4³ + 5³ 2 41³ = 2³ + 17³ + 40³ = 6³ + 32³ + 33³ 3 87³ = 20³ + 54³ + 79³ = 26³ + 55³ + 78³ = 38³ + 48³ + 79³ 211 4 5 167³ + 6 = 243³ 219³ = 606³ = 436³ + 492³ = + 358³ 50³ + 67³ + 216³ = 51³ + 152³ + 190³ = 67³ + 167³ + 177³ = 108³ + 163³ + 170³ 9³ + 290³ + 583³ = 24³ + 389³ + 547³ = 47³ + 358³ + 561³ = 95³+ 393³ + 544³ = 513³ 48³ + 85³ + 491³ = 113³ + 264³ + 463³ = 149³ + 336³ + 427³ = 190³ + 279³ + 449³ + 389³ = 281³ + 322³ + 399³ Diophantische Gleichung 4.Grades Als Sonderfall des Großen Satzes von Fermat haben die Gleichungen A4 + B4 = C4 keine nichttrivialen ganzzahligen Lösungen. 1772 vermutete Euler, dass auch A4 + B4 + C4 = D4 keine echten Lösungen besitzt. 1987 fand aber N.Elkies eine Lösung 206156734 = 26824404 + 153656394 + 187967604 ; 1988 ermittelte Roger Frye 4224814 = 958004 + 2175194 + 4145604 und bewies, dass die kleinste Lösung ist. Bis heute ist noch keine Parameterlösung bekannt. Überraschenderweise existieren dagegen für A4 + B4 + C4 = 2D4 eine Vielzahl von Lösungen. Für den Gleichungstyp A4 + B4 = C4 + D4 existiert eine Parameterlösung mit A=a+b B=c-d C=a-b D=c+d a = n(m2+n2)(-m4+18m2n2-n4) b = 2m(m6+10m4n2+m2n4+4n6) 6 4 2 2 4 6 c = 2n(4m +m n +10m n +n ) d = m(m2+n2)(-m4+18m2n2-n4) Weitere Gleichungen nach Ramanujan 34+(2x4-1)4+(4x5+x)4 = (4x4+1)4+(6x4-3)4+(4x5-5x)4 2(ab+ac+bc)2=a4+b4+c4 mit a+b+c=0 2(ab+ac+bc)4=a4(b-c)4+b4(c-a)4+c4(a-b)4 mit a+b+c=0 2(ab+ac+bc)6=(a2b+b2c+c2a)4+(ab2+bc2+ca2)4+(3abc)4 mit a+b+c=0 Ferrari-Identität (a2+2ac-2bc-b2)4+(b2-2ab-2ac-c2)4+(c2+2ab+2bc2 4 2 2 2 4 a ) =2(a +b +c -ab+ac+bc) Bhargavas-Theorem (a+b+c)4+(b+c+d)4+(a-d)4 = (c+d+a)4+(d+a+b)4+(b-c)4, mit a/b = c/d Die ersten natürlichen Zahlen n, welche Summe von 4 Biquadraten sind, erhält man für 353, 651, 2487, 2501, 2829, ... Die einzige Zahl der Form 4x4+y4 ist 5. Die nachfolgende Tabelle enthält Lösungen für Diophantische Gleichungen 4.Grades. Angezeigt werden Gleichungen der Typen a-b = 1-3, 1-4, 1-5, 2-2, 2-3, 2-4 und 3-3, d.h. die Summe von a Potenzen 4.Grades natürlicher Zahlen gleich einer Summe von b Potenzen 4.Grades. Gleichungen 4.Grades Typ 1-3 (Status: getestet bis höchste Potenz = 724) 4224814 = 958004 + 2175194 + 4145604 4 4 4 20615673 = 2682440 + 15365639 + 187967604 6385232494 = 6306626244 + 2751562404 + 2190764654 4 6514 = 2404 + 3404 + 4304 + 5994 Typ 1-4353 = 304 + 1204 + 2724 + 3154 24874 = 4354 + 7104 + 13844 + 24204 154 = 134 + 124 + 64 + 2*24 Typ 1-554 = 2*44 + 34 + 2*24 4 4 4 4 4 4 15 = 14 + 9 + 8 + 6 + 4 74 = 64 + 4*44 + 34 Typ 1-634 = 5*24 + 14 94 = 74 + 3*64 + 44 + 4 Typ 2-2, nach Euler 1802 594 + 1584 = 1334 + 1344 = 635318657 4 4 4 4 7 + 239 = 157 + 227 = 3262811042 1934 + 2924 = 2564 + 2574 = 8657437697 Typ 2-32*74 = 84 + 54 + 34 2*134 = 154 + 84 + 74 2*194 = 214 + 164 + 54 Typ 2-494 + 34 = 84 + 64 + 2*54 94 + 84 = 104 + 54 + 2*24 4 4 4 4 4 4 11 + 3 = 10 + 8 + 5 + 1 Typ 3-3 (getestet bis 344) 74 + 44 + 24 = 2*64 + 34 4 4 4 4 4 4 9 +2 +1 =8 +7 +3 114 + 64 + 54 = 104 + 94 + 14 Diophantische Gleichung 5.Grades Die nachfolgende Tabelle enthält Lösungen für Diophantische Gleichungen 5.Grades. Angezeigt werden Gleichungen der Typen a-b = 1-4, 1-5, 1-6, 1-7, 2-3, 2-4, 2-5, 3-3 und höhere, d.h. die Summe von a Potenzen 5.Grades natürlicher Zahlen gleich einer Summe von b Potenzen 5.Grades. Typ 1-4 1445 = 275 + 845 + 1105 + 1335 Typ 1-5 725 = 195 + 435 + 465 + 475 + 675 945 = 215 + 235 + 375 + 795 + 845 5 5 5 5 5 5 107 = 7 + 43 + 57 + 80 +100 Typ 1-6 125 = 45 + 55 + 65 + 75 + 95 + 115 305 = 55 + 105 + 115 + 165 + 195 + 295 5 5 5 5 5 5 5 = 15 + 16 + 17 + 22 + 24 + 28 32 Typ 1-7 235 = 15 + 75 + 85 + 145 + 155 + 185 + 205 Typ 2-3 141325 + 2205 = 140685 + 62375 + 50275 Typ 2-4 295 + 35 = 285 + 205 + 105 + 45 385 + 125 = 375 + 255 + 135 + 55 525 + 285 = 505 + 355 + 295 + 265 212 Typ 2-5 Typ 3-3 Typ Typ Typ Typ Typ 3-4 4-4 4-4-4 5-6 6-6 225 + 15 = 45 + 55 + 75 + 165 + 215 295 + 235 = 95 + 115 + 145 + 185 + 305 385 + 165 = 105 + 145 + 265 + 315 + 335 675 + 285 + 245 = 625 + 545 + 35 245 + 285 + 675 = 35 + 545 + 625 5 5 5 5 5 5 18 + 44 + 66 = 13 + 51 + 64 35 + 225 + 255 = 15 + 85 + 145 + 275 55 + 2*65 + 85 = 45 + 3*75 35 + 485 + 525 + 615 = 135 + 365 + 515 + 645 = 185 + 365 + 445 + 665 225 + 175 + 165 + 65 + 55 = 215 + 205 + 125 + 105 + 25 + 15 875 + 2335 + 2645 + 3965 + 4965 + 5405 = 905 + 2065 + 3095 + 3665 + 5225 + 5235 Diophantische Gleichung Tabelle Die nachfolgende Tabelle enthält Beispiellösungen für Diophantische Gleichungen n.Grades, wobei unter einem Typ a-b eine Gleichung zu verstehen ist, bei welcher die Summe von a Potenzen n.Grades natürlicher Zahlen gleich einer Summe von b Potenzen n.Grades sind. n=6 Typ 1-7, Lander 1967 11416 = 746 + 2346 + 4026 + 4746 + 7026 + 8946 + 10776 Typ 1-8 2516 = 86 + 126 + 306 + 786 + 1026 + 1386 + 1656 + 2466 4316 = 486 + 1116 + 1566 + 1866 + 1886 + 2286 + 2406 + 4266 Typ 1-9, Lander 1967 546 = 16 + 176 + 196 + 226 + 316 + 2*376 + 416 + 496 Typ 1-10, Lander 1967 396 = 26 + 46 + 76 + 146 + 166 + 2*266 + 306 + 326 Typ 1-11, Lander 1967 186 = 26 + 3*56 + 2*76 + 2*96 + 106 + 146 + 176 Typ 1-16, Martin 1893 286 = 16+26+46+56+66+76+96+126+136+156+166+186+206+216+ 226+ 236 Typ 2-2 noch keine Lösung bis a6+b6 = 7.25 * 1026 gefunden Typ 2-5, Brisse, Resta 1999 10926 + 8616 + 6026 + 2126 + 846 = 11176 + 7706 18936 + 14686 + 14076 + 13026 + 12466 = 20416 + 6916 Typ 2-6, Ekl 1998 2416 + 176 = 2186 + 2106 + 1186 + 2*636 + 426 Typ 2-7, Lander 1967 186 + 226 + 366 + 586 + 696 + 2*786 = 566 + 916 Typ 2-8, Lander 1967 86 + 106 + 126 + 156 + 246 + 306 + 336 + 366 = 356 + 376 Typ 2-9, Lander 1967 16 + 2*56 + 76 + 3*136 + 176 + 196 = 66 + 216 Typ 2-10, Lander 1967 3*16 + 2*46 + 76 + 96 + 3*116 = 2*126 Typ 3-3 236 + 156 + 106 = 226 + 196 + 36 366 + 376 + 676 = 156 + 526 + 656 Typ 3-4 736 + 586 + 416 = 706 + 656 + 326 + 156 856 + 626 + 616 = 836 + 696 + 566 + 526 Typ 4-4, Rao 1934 2*26 + 2*96 = 36+56+66+106 746 + 836 + 696 + 526 = 876 + 716 + 266 + 626 Typ 4-4-4, Lander 1967 16 + 346 + 496 + 1116 = 76 + 436 + 696 + 1106 = 186 + 256 + 776 + 1096 Typ 7-8, Moessner, Gloden 1944 326 + 316 + 236 + 226 + 136 + 66 + 56 = 6 6 6 6 6 6 6 6 33 +28 +27 +20 +11 +10 +2 +1 n=7 Typ 1-7, Dodrill 1999 5687 = 5257 + 4397 + 4307 + 4137 + 2667 + 2587 + 1277 Typ 1-8, Lander 1967 1027 = 127 + 357 + 537 + 587 + 647 + 837 + 857 + 907 Typ 1-9, Lander 1967 627 = 67 + 147 + 207 + 227 + 277 + 337 + 417 + 507 + 597 Typ 2-6, Meyrignac 1257 + 247 = 1217 + 947 + 837 + 617 + 577 + 277 Typ 2-8, Lander 1967 107 + 337 = 57 + 67 + 77 + 2*157 + 207 + 287 + 317 Typ 2-10, Lander 1967 27 + 277 = 47 + 87 + 137 + 2*147 + 167 + 187 + 227 + 2*237 = 2*77 + 97 + 137 + 147 + 187 + 207 + 2*227 + 237 Typ 3-5 967 + 417 + 177 =877 + 2*777 + 687 + 567 1537 + 437 + 147 = 1407 + 1377 + 597 + 2*427 Typ 3-7, Lander 1967 267 + 2*307 = 2*77 + 127 + 167 + 277 + 287 + 317 Typ 4-4, Ekl 1998, Lau 1999 1497 + 1237 + 147 + 107 = 1467 + 1297 + 907 + 157 1947 + 1507 + 1057 + 237 = 1927 + 1527 +1327 + 387 Typ 4-5, Gloden 1948 507 + 437 + 167 + 127 = 527 + 297 + 267 + 117 + 37 817 + 587 + 197 + 97 = 777 + 687 + 567 + 487 + 27 Typ 5-5, Gloden 1949 2*87 + 137 + 167 + 197 = 27 + 127 + 157 + 177 + 187 47 + 87 + 147 + 167 + 237 = 2*77 + 97 + 207 + 227 Typ 6-6, Sastry, Rai 1948 27 + 37 + 2*67 + 107 + 137 = 2*17 + 2*77 + 2*127 7 7 7 7 87 +233 +264 +396 +4967 + 5407 = 907 + 2067 + 3097 + 3667 + 5227 + 5237 Typ 9-10, Moessner, Golden 1944 427+377+367+ 297 + 237 + 197 + 137 + 67 + 57 = 417 + 407 + 337 + 287 + 277 + 157 +147 + 97 + 27 + 17 n=8 Typ 1-10, Kuosa 2358 = 2268 + 1848 + 1718 + 1528 + 1428 + 668 + 588 + 348 + 168 + 68 Typ 1-11, Lander 1967 1258 = 148 + 188 + 2*448 + 668 + 708 + 928 + 938 + 968 + 1068 + 1128 Typ 1-12, Lander 1967 658 = 2*88 + 108 + 3*248 + 268 + 308 + 348 + 448 + 528 + 638 Typ 2-8 1298 + 958 = 1288 + 928 + 868 + 828 + 748 + 578 + 558 + 208 Typ 2-9, Lander 1967 118 + 278 = 28 + 78 + 88 + 168 + 178 + 2*208 + 2*248 213 1088 + 688 + 58 = 1028 + 2*888 + 528 + 378 + 268 + 68 Lander 1967 88 + 178 + 508 = 68 + 128 + 2*168 + 2*388 + 408 + 478 2218 + 1088 + 2*948 = 1958 + 1948 + 1888 + 1268 + 388 Ekl 1998 478 + 298 + 128 + 58 = 458 + 408 + 308 + 268 + 238 + 38 Lander 1967 78 + 98 + 168 + 2*228 + 288 + 348 = 68 + 118 + 208 + 358 Letac 1942 438 + 208 + 118 + 108 + 18 = 418 + 358 + 328 + 288 + 58 428 + 418 + 358 + 98 + 68 = 458 + 368 + 278 + 138 + 88 Typ 5-5, Ekl 1998 2*368 + 338 + 258 + 218 = 388 + 348 + 328 + 2*158 + 138 398 + 338 + 328 + 258 + 198 = 378 + 2*358 + 178 + 168 + 28 Typ 6-6, Moessner, Gloden 1944 38 + 68 + 88 + 108 + 158 + 238 = 58 + 2*98 + 128 + 208 + 228 Typ 7-7, Moessner 1947 18 + 38 + 58 + 2*68 + 88 + 138 = 48 + 78 + 2*98 + 108 + 118 + 128 Typ 8-8, Lander 1967 18 + 38 + 3*78 + 2*108 + 128 = 48 + 2*58 + 2*68 + 3*118 Typ 9-10, Moessner, Gloden 1944 548 + 538 + 468 + 378 + 298 + 238 + 228 + 68 + 58 = 558 + 508 + 498 + 338 + 328 + 268 +188 + 98 + 28 + 18 n=9 Typ 1-12 1039 = 2*919 + 899 + 719 + 689 + 659 + 439 + 429 + 199 + 169 + 139 + 9 5 Typ 1-14, Ekl 1998 669 = 639+549+519+499+389+359+299 + 249 + 219 + 129 + 109 + 79 + 9 9 2 +1 Typ 1-15, Lander 1967 269 = 2*29 + 49 + 2*69 + 79 + 2*99 + 109 + 159 + 189 + 2*219 + 2*239 Typ 2-10, Morelli 1999 1379 + 699 = 1219 + 2*1169 + 1159 + 899 + 529 + 289 + 269 + 149 + 99 Typ 2-12, Lander 1967 159 + 219 = 4*29 + 2*39 + 49 + 79 + 169 + 179 + 2*199 Typ 3-9, Ekl 1998 2*389 + 39 = 419 + 239 + 2*209 + 189 + 2*139 + 129 + 99 Typ 3-11, Lander 1967 139 + 169 + 309 = 29 + 39 + 69 + 79 + 2*99 + 2*199 + 219 + 259 + 299 Typ 4-6 909 + 649 + 2*359 = 869 + 809 + 629 + 439 + 279 + 169 Typ 4-9, Ekl 1998 389 + 319 + 129 + 29 = 369 + 2*329 + 309 + 159 + 139 + 89 + 49 + 39 Typ 4-10, Lander 1967 29 + 2*69 + 99 + 109 + 119 + 149 + 189 + 2*199 = 59 + 129 + 169 + 219 Typ 5-5 1929 + 1019 + 919 + 309 + 269 = 1809 + 1759 + 1169 + 179 + 129 Typ 5-7, Ekl 1998 359 + 269 + 2*159 + 129 = 339 + 329 + 249 + 169 + 149 + 89 + 69 Typ 5-11, Lander 1967 39 + 2*59 + 2*99 + 129 + 2*159 + 169 + 2*219 = 79 + 89 + 149 + 209 + 9 22 Typ 6-6 239 + 189 + 149 + 2*139 + 19 = 229 + 219 + 159 + 109 + 99 + 59 319 + 239 + 219 + 149 + 99 + 29 = 2*299 + 159 + 119 + 109 + 69 Typ 11-12, Moessner, Gloden 1944729 + 679 + 669 + 539 + 439 + 379 + 359 + 299 + 199 + 69 + 59 = 719 + 709 + 639 + 559 + + 409 + 399 + 339 + 329 + 179 + 99 + 29 + 19 n=10 Typ 1-15, Meyrignac 1999 10810 = 10010 + 9410 + 9110 + 2*7710 + 7610 + 6310 + 6210 + 5210 + 4510 + 3510 + 3310 + 1610 + 1010 + 110 Typ 1-22, Ekl 1998 3310 = 2*3010 + 2*2610 + 2310 + 2110 + 1910 + 1810 + 2*1310 + 2*1210 + 5*1010 + 2*910 + 710 + 610 + 310 Typ 1-23, Lander 1967 1510 = 5*110 + 210 + 310 + 610 + 6*710 + 4*910 + 1010 + 2*1210 + 1310 + 1410 Typ 2-13 5110 + 3210 = 4910+4310+4110+3710+2810+2610+2510+1510+2*1010 +910+510+310 Typ 2-15, Ekl 1998 3510 + 310 = 3310 + 3210 + 2410 + 2110 + 2*2010 + 3*1310 + 1210 +1110 +910 +710 +2*110 Typ 2-19, Lander 1967 910 + 1710 = 5*210 + 510 + 610 + 1010 + 6*1110 + 2*1210 + 3*1510 Typ 3-13 4610 + 3210 + 2210 = 2*4310 + 2710 + 2610 + 1710 + 1610 + 1210 + 2*910 +610 +410 +2*310 Typ 3-14, Ekl 1998 3010 + 2810 + 410 = 3110+2310+2*2010+2*1710+1610+1010+ 3*910 + 510 + 2*210 Typ 3-24, Lander 1967 1110 + 2*1510 = 110+210+310 + 10*410 + 710 + 7*810 + 1010 + 1210 + 1610 Typ 4-12, Bainville 1999 5310 +2*4410 +2210 = 5110 +4910 +4310 +3910 +2910 +2810 +2*1710 +1610 +1310+710 +410 Typ 4-15, Ekl 1998 4*2310 = 2610 + 5*1810 + 3*1710 + 1510 + 1210 + 610 + 3*410 Typ 4-23, Lander 1967 3*1110 + 1610 = 5*110 + 2*210 + 2*310 + 410 + 4*610 + 2*1410 + 1510 Typ 5-16, Lander 1967 2*310+810+1410+1610 = 4*110+210+2*410 + 610 + 2*1210 + 5*1310 + 1510 2010 + 1110 + 810 + 310 + 110 = 2*1810 + 1710 + 1610 + 1010 + 2*710 + 6*410 + 2*210 Typ 6-6 9510+7110+3210 + 2810 + 2510 + 1610 = 9210 + 8510 + 2*3410 + 2310 + 510 Typ 6-16, Ekl 1998 1810 + 1210 + 1110 + 1010 + 310 + 210 = 1710 + 1610 + 4*1310 + 4*710 + 4*610 +510 + 410 Typ 6-27, Lander 1967 2*210 + 810 + 1110 + 2*1210 = 110 + 4*310 + 2*410 + 2*510 + 7*610 + 9*710 +1010 + 1310 Typ 7-7, Lander 1967 3810 + 3310 + 2*2610 + 1510 + 810 + 110 = 3610 + 3510 + 3210 + 2910 + 2410 + 2310 + 2210 Typ Typ Typ Typ Typ Typ 214 3-7 3-8, 4-5 4-6, 4-7, 5-5, 6810+6110+5510+3210+3110+2810+110 = 6710+6410+4910+4410+2310 +2010 +1710 Diophantische Gleichungen der Form xa + ya = za + ub mit b > a Alle nachfolgenden Gleichungen wurden kontinuierlich gesucht für x, y, z < 100, z < x < y und a < 50: a = 3: 273+303 = 33+66 183+303 = 43+85 403+603 = 43+67 83+103 = 63+64 153+173 = 83+65 363+603 = 83+49 363+603 = 83+86 193+243 = 103+39 3 3 3 8 3 3 3 4 3 3 3 4 29 +35 = 12 +4 29 +35 = 12 +16 17 +24 = 16 +11 393+893 = 173+155 3 3 3 4 3 3 3 5 3 3 3 8 27 +45 = 18 +18 36 +60 = 24 +12 90 +99 = 27 +6 903+993 = 273+364 3 3 3 12 3 3 3 6 3 3 3 4 57 +72 = 30 +3 57 +72 = 30 +9 57 +72 = 30 +27 403+683 = 363+244 483+603 = 363+67 a = 4: 64+94 = 34+65 184+214 = 154+125 204+314 = 174+106 364+544 = 184+69 4 4 4 5 40 +100 = 20 +40 Diophantische Gleichung A = B²-C² Jede ungerade Zahl a = 2z+1 kann sicher als Differenz zweier Quadrate natürlicher Zahlen dargestellt werden, da a = 2z+1 = (z+1)² - z² gilt. Für gerade Zahlen muss ein solche Darstellung nicht existieren. Die kleinste gerade Zahl mit einer Darstellung als Differenz zweier Quadrate ist die 8 = 3² - 1². Für die 15 existieren zwei Möglichkeiten, für die 45 drei, für die 96 vier, … Diophantische Gleichung (4) 1955 wurde durch L.J.Mordell, Miller und Woollett die Frage nach Lösungen der Diophantischen Gleichung x³ + y³ + z³ = d für verschiedene natürliche Zahlen d gestellt. x, y, z sind dabei ganze Zahlen. Für d = 2 berechneten sie die Parameterlösung -6t² ; -6t3 +1 ; 6t³ +1 Bekannt ist auch, dass für d = 9m ± 4 keine Lösungen existieren. Durch Andreas-Stephan Elsenhans und Joerg Jahnel wurden 2007 alle x, y, z bis 1014 untersucht und die Lösungen bis maximal d = 1000 ermittelt. Für folgende 14 Zahlen d unter 1000 wurde noch keine Darstellung gefunden: d = 33, 42, 74, 114, 165, 390, 579, 627, 633, 732, 795, 906, 921, 975 Diophantische Identitäten (28k+4 +1)8 = (28k+4 -1)8 + (27k+4)8 + (2k+1)8 + 7 * [ (25k+3)8 + (23k+2)8 ] (75 v5 - u5)5 + (u5 + 25 v5)5 + (u5 - 25 v5)5 + (10 u3v2)5 + (50 uv4)5 = (u5 + 75 v5)5 nach Ramanujan (8s² + 40st - 24t²)4 + (6s² - 44st - 18t²)4 + (14s² - 4st - 42t²)4 + (9s² + 27t²)4 + (4s² + 12t²)4 = (15s² + 45t²)4 (4m² - 12n²)4 + (3m² + 9n²)4 + (2m² - 12mn - 6n²)4 + (4m² + 12n²)4 + (2m² + 12mn - 6n²)4 = (5m² + 15n²)4 34 + (2x4 - 1)4 + (4x5 + x)4 = (4x4 + 1)4 + (6x4 - 3)4 + (4x5 - 5x)4 Vier-Quadrate-Identität Euler am 15.4.1705 an Goldbach: (a12+a22+a32+a42)(b12+b22+b32+b42) = (a1b1 - a2b2 - a3b3 - a4b4)2 + + (a1b2 + a2b1 + a3b4 + a4b3)2 + (a1b3 - a2b4 + a3b1 + a4b2)2 + (a1b4 + a2b3 - a3b2 + a4b1)2 Fermats elliptisches Kurventheorem Die diophantische Gleichung y³ = x² + 2 hat ausschließlich die ganzzahligen Lösungen (x , y) = (5, 3) und (-5, 3). Ramanujan 6-10-8 Identität Gilt a d = b c, so wird 64 [(a + b + c)6 + (b + c + d)6 - (c + d + a)6 - (d + a + b)6 + (a - d)6 - (b - c)6] * * [(a + b + c)10 + (b + c + d)10 - (c + d + a)10 - (d + a + b)10 + (a - d)10 - (b - c)10] = 45 [(a + b + c)8 + (b + c + d)8 - (c + d + a)8 - (d + a + b)8 + (a - d)8 - (b - c)8 Hardy, Wright (1979) a3 (a3 + b3)3 = b3 (a3 + b3)3 + a3 (a3 - 2b3)3 + b3 (2a3 - b3)3 a3 (a3 + 2b3)3 = a3 (a3 - b3)3 + b3 (a3 - b3)3 + b3 (2a3 + b3)3 nach Euler hat A3 + B3 = C2 die Lösung A = 3n3 + 6n2 – n B = -3n3 + 6n2 + n C = 6n2 (3n2 + 1) Die diophantische Gleichung n 1² + (n-1) 2² + (n-2) 3² + . . . + 1 n² = k² 215 gilt nur für wenige k und n. Die ersten zwei nichttrivialen Lösungen sind n=6, k=14, und n=25, k=195. Diese können durch Zerlegung eines Quadrates der Seitenlänge k in ein Quadrat der Länge n, zwei Quadrate der Länge n-1, … veranschaulicht werden. Die entsprechenden Lösungen für n = 6 und n = 25 sind links zu sehen. Diophantische Gleichung Ax² + Bxy + Cy² + Dx + Ey + F = 0 Gesucht sind die ganzzahligen Lösungen der diophantischen Gleichung Ax² + Bxy + Cy² + Dx + Ey + F = 0 in Abhängigkeit der Parameter A, B, C, D, E und F. Mehrere Lösungsfälle existieren, wobei deren Bezeichnung von der durch die Gleichung in der xy-Ebene gebildeten Kurve entnommen sind. Diese Kurven stellen die reellen Lösungen dar. linearer Fall einfacher hyperbolischer Fall elliptischer Fall parabolischer Fall hyperbolischer Fall A=B=C=0 A = C = 0; B ≠ 0 B² - 4AC < 0 B² - 4AC = 0 B² - 4AC > 0 linearer Fall A = B = C = 0 Die Gleichung wird zu Dx + Ey + F = 0, d.h. der einfachen diophantischen linearen Gleichung. Für D = 0 und E = 0 existieren Lösungen für F = 0; alle Paare (x,y) ganze Zahlen. Für D = 0 und E ≠ 0 wird Ey + F = 0 → y = -F/E, x beliebig Für D ≠ 0 und E = 0 ergibt sich Dx + F = 0 → x = -F/D, y beliebig Für D ≠ 0 und E ≠ 0 sei g = ggT(D, E). Wenn D und E Vielfache von g sind, dann auch Dx + Ey. Ist F kein Vielfaches von g, so existiert damit keine Lösung. Ist F Vielfaches wird die Gleichung reduziert dx + ey = -f ; d = D/g, e = E/g und f = F/g Über den erweiterten Euklidischen Algorithmus findet man u', v' mit uu'+vv' = ±ggT(u, v). Setzt man u = d, v = e wird du' + ev' = ±1 → d(±fu') + e(±fv') = -f → d (±fu') + det + e(±fv') - det = -f → d (et ± fu') + e (-dt ± fv') = f und der allgemeinen Lösung x = et ± fu' ; y = -dt ± fv' für beliebiges ganze t einfacher hyperbolischer Fall A = C = 0; B ≠ 0 Die diophantische Gleichung reduziert sich damit auf Bxy + Dx + Ey + F = 0, und (Bx + E) (By + D) = DE - BF 1.Möglichkeit: DE - BF = 0; zwei zu den Achsen parallele Geraden Hier gilt Bx + E = 0 oder By + D = 0. Für B ≠ 0 ergibt sich die Lösung x = - E/B ; y beliebige ganze Zahl x beliebig, y = - D/B 2.Möglichkeit: DE - BF ≠ 0; Hyperbel mit zu den Achsen parallelen Asymptoten In diesem Fall müssen alle Teiler von DE - BF gesucht werden. Dazu sei d1, d2, …, dn die Teilermenge von DE - BF. Dann wird Bx + E = di By + D = (DE - BF) / di Bx = di - E By = (DE - BF) / di - D x = (di - E) / B und y = ((DE - BF) / di - D) / B Beispiel: Gleichung 2xy + 5x + 56y + 7 = 0 Die Teilermenge von DE - BF = 5·56 - 2·7 = 266 ist ±1, ±2, ±7, ±14, ±19, ±38, ±133, ±266. Mit (2x + 56) (2y + 5) = 266 wird: d1 = 1 x = (1-56)/2 = -55/2, y = (266/1-5)/2 = 261/2 ; keine Lösung, da nicht ganzzahlig d2 = -1 x = (-1-56)/2 = -57/2, y = [266/(-1)-5]/2 = 271/2 ; keine Lösung, da nicht ganzzahlig d3 = 2 x = (2-56)/2 = -27, y = (266/2-5)/2 = 64 d4 = -2 x = (-2-56)/2 = -29, y = [266/(-2)-5]/2 = -69 usw. x = (14-56)/2 = -21, y = (266/14-5)/2 = 7 d7 = 14 d8 = -14 x = (-14-56)/2 = -35, y = [266/(-14)-5]/2 = -12 d11 = 38 x = (38-56)/2 = -9, y = (266/38-5)/2 = 1 d12 = -38 x = (-38-56)/2 = -47, y = [266/(-38)-5]/2 = -6 d15 = 266 x = (266-56)/2 = 105, y = (266/266-5)/2 = -2 216 d16 = -266 x = (-266-56)/2 = -161, y = [266/(-266)-5]/2 = -3 elliptischer Fall B² - 4AC < 0 Da eine Ellipse eine geschlossene Kurv ist, kann es nur endlich viele Lösungen geben. Die diophantische Gleichung wird zu Ax² + Bxy + Cy² + Dx + Ey + F = 0 (*) y = (-(Bx + E) ± √((Bx + E)² - 4C(Ax² + Dx + F))) / (2C) Für jeden Wert von x existieren zwei Werte von y, jeweils auf den entgegengesetzten Seiten der Ellipse. Liegt x an einem Scheitel der Ellipse gibt es nur ein y. Die möglichen x-Werte können nur zwischen den reellen Nullstellen von (Bx + E)² - 4C(Ax² + Dx + F) = 0 (B² - 4AC) x² + 2(BE - 2CD) x + (E² - 4CF) = 0 liegen. Damit sind alle ganzzahligen x-Werte zwischen den Nullstellen in Gleichung (*) zu prüfen. Beispiel: Gleichung 42x² + 8xy + 15y² + 23x + 17y - 4915 = 0. Da B² - 4AC = 8² - 4·42·15 = -2456 < 0 ist, liegt der elliptische Fall vor. Die möglichen Werte für x liegen zwischen den Nullstellen von (B² - 4AC)x² + 2(BE - 2CD)x + (E² - 4CF) = -2456 x² - 1108 x + 295189 = 0. Die Nullstellen sind -11,19… und 10,74…, so dass alle x von -11 bis 10 zu prüfen sind. Wird x in (*) eingesetzt, so ergibt sich nur für x = -11 ein ganzzahliges y = -1, so dass nur diese Lösung existiert. parabolischer Fall B² - 4AC = 0 Es sei g = ggT(A,C), a = A/g ≥ 0, b = B/g, c = C/g ≥ 0. Wenn b² = 4ac positiv ist, so kann g so gewählt werden, dass es das gleiche Vorzechen wie A besitzt. Dann sind a und c positiv oder ein Wert gleich 0. Aus b² - 4ac = 0 wird b²/4 = ac. Da ggT(a,c) = 1 sind a und c vollständige Quadrate. Multiplikation mit √a wird √a g (ax² + bxy + cy²) + √a Dx + √a Ey + √a F = 0 √a g (√a x + √c y)² + √a Dx + √a Ey + √a F = 0 wobei √c das Vorzeichen von B/A hat. √a g (√a x + √c y)² + D (√a x + √c y) - √c Dy + √a Ey + √a F = 0 Mit u = √a x + √c y wird √a g u² + Du + (√a E - √c D) y + √a F = 0 (√c D - √a E) y = √a gu² + Du + √a F Es gibt zwei Fälle: √c D - √a E = 0 (zwei parallele Geraden) oder √c D - √a E ≠ 0 (Parabel). 1.Fall: √c D - √a E = 0. √a gu² + Du + √a F = 0 Wenn x und y zwei ganze Zahlen sind, so muss auch u ganzzahlig sein. Es seien u1 und u2 die Lösungen der Gleichung, d.h. √a x + √c y - u1 = 0 und √a x + √c y - u2 = 0 was als lineare Gleichungen lösbar ist. 2.Fall: √a gu² + Du + √a F ist ein Vielfaches von √c D - √a E. Sind u0, u1,… die Werte von u im Bereich 0 ≤ u < |√c D - √a E|, so u = ui + (√c D - √a E) t, wobei t eine ganze Zahl ist. Einsetzen und mehrere Umwandlungen ergeben dann x = √c g (√a E - √c D) t² - (E + 2√c gui) t - (√c gui² + Eui + √c F) / (√c D - √a E) y = √a g (√c D - √a E) t² - (D + 2√a gui) t - (√a gui² + Dui + √a F) / (√c D - √a E) Hilberts 10.Problem: Entscheidung der Lösbarkeit einer Diophantischen Gleichung Hilbert fragte: Gibt es einen endlichen Algorithmus, der feststellt, ob eine Diophantische Gleichung lösbar ist? Yuri Matiyasevich bewies 1970, dass es einen solchen Algorithmus nicht geben kann. Grundlage seines Beweises ist die Beziehung Diophantischer Gleichungen zu rekursiv aufzählbaren Teilmengen natürlicher Zahlen. Dies sind Mengen S, für die ein Algorithmus existiert, der in endlich vielen Schritten die Zugehörigkeit einer natürlichen Zahl zu S feststellt - aber nur, wenn die Zahl auch tatsächlich in S liegt, d.h. die Feststellung der Nicht-Zugehörigheit zu S muss der Algorithmus nicht leisten. Matiyasevich konnte zeigen, dass zu jeder rekursiv aufzählbaren Menge S eine Diophantische Gleichung PS(x, y1, …, yn) = 0 gehört; m gehört genau dann zu S, wenn PS(m, y1, …, yn) = 0 lösbar ist. 217 Nun gibt es aber rekursiv aufzählbare Mengen, deren Komplement nicht rekursiv aufzählbar ist, d.h. es gibt keinen Algorithmus, der von jeder beliebigen natürlichen Zahl in endlich vielen Schritten feststellt, ob sie in der Menge liegt oder nicht. Für die abschließende Argumentation nennt man eine dieser Mengen K. Wenn es einen endlichen Algorithmus für die Lösbarkeit Diophantischer Gleichungen gäbe, so müsste dieser auch auf PK(m, y1, …, yn) = 0 anwendbar sein - damit ließe sich also für jedes m feststellen, ob es zu K gehört oder nicht. Dies ist aber ein Widerspruch zur Definition von K. Also gibt es keinen endlichen Algorithmus für die Lösbarkeit Diophantischer Gleichungen. Ganzzahlige Identitäten 22 = 0! + 1! + 2! 32 = 1! + 2! + 3! 2 5 = 1! + 4! 112 = 1! + 5! 2 12 = 4! + 5! 272 = 1! + 2! + 3! + 6! 292 = 1! + 5! + 6! 712 = 1! + 7! 722 = 4! + 5! + 7! 2132 = 1! + 2! + 3! + 7! + 8! 2 215 = 1! + 4! + 5! + 6! + 7! + 8! 6032 = 1! + 2! + 3! + 6! + 9! 2 635 = 1! + 4! + 8! + 9! 19172 = 1! + 2! + 3! + 6! + 7! + 8! + 10! 11838932 = 1! + 2! + 3! + 7! + 8! + 9! + 10! + 11! + 12! + 13! + 14! + 15! n ! = a! b! c! ... getestet für n < 18160 9! = 7! 3! 3! 2! 10! = 7! 6! = 7! 5! 3! 16! = 14! 5! 2! Le Lionnais (1983): (n - 1)! + 1 ≡ 0 (mod n²) für n<200000 ... Gleichung gilt für n = 5, 13, 563 Brocards Problem ... gesucht sind ganzzahlige Paare (m , n), welche die Gleichung n! + 1 = m2 erfüllen. Die einzigen existierenden Lösungen (Guy 1994) sind : (5,4) , (11,5) und (71,7) Diese Zahlenpaare werden auch Brown-Zahlen genannt. Diophantisches Gleichungssystem Beispiel: a + 2b – c – d + 3f = 3 -a + 4b + 2c + d – e = -1 2a + b + c – d + f = 1 a + 3b + e + f = 2 b–c–d+e=7 Gesucht sind Lösungen in ganzen Zahlen: X6 = -5+17*k, X5 = -5+25*k, X4 = -3-5*k, X3 = -6+22*k, X2 = 3-8*k, X1 = 3-18*k wobei k ∈ Z. Für k = 1 wird damit X1 = -15, X2 = -5, X3 = 15, X4 = -8, X5 = 20, X6 = 12. Sucht man ähnliche Gleichungen der Form n! + a = m², so findet man für |a| ≤ 10 und n < 1000 nur: 4! -8 = 4² ; 3! -5 = 1² ; 3! -2 = 2² ; 2! -1 = 1² ; 4! + 1 = 5² ; 5! + 1 = 11² ; 7! + 1 = 71² ; 2! + 2 = 2² ; 3! + 3 = 3² ; 2! + 7 = 3² ; 6! + 9 = 27² ; 3! + 10 = 4² Fakultäten n! können für n > 3 stets als Summe zweier Quadrate dargestellt werden, d.h. b² Die kleinsten a für die n = 4, 5, … sind 4! + 1² = 5² 5! + 1² = 11² 6! + 3² = 27² 7! + 1² = 71² 8! + 9² = 201² 9! + 27² = 603² 10! + 15² = 1905² 11! + 18² = 6318² 12! + 288² = 21888² 13! + 288² = 78912² 14! + 420² = 295260² 15! + 464² = 1143536² 16! + 1856² = 4574144² 17! + 10080² = 18859680² 18! + 46848² = 80014848² 19! + 210240² = 348776640² 20! + 400320² = 1559776320² 21! + 652848² = 7147792848² 22! + 3991680² = 33526120320² 23! + 27528402² = 160785625902² 24! + 32659200² = 787685472000² n! + a² = Diophantische Ungleichungen ... Ungleichungen deren Lösungen im Bereich der ganzen Zahlen gesucht werden 1<|a|+|b|<n Allgemeine Lösungsanzahl: 2·(n + 1)·(n - 2) 0<|a|+|b|<n Allgemeine Lösungsanzahl: 2·(n2 + n - 6) Kronecker-Symbol Das Kronecker-Symbol oder Kronecker-Delta ist ein mathematisches Zeichen, das durch ein kleines Delta δij mit zwei Indizes dargestellt wird und nach Leopold Kronecker benannt ist. Dieses Zeichen wird in Summenformeln und bei Matrix- oder Vektoroperationen verwendet bzw. um Fallunterscheidungen in Formeln zu vermeiden. 218 Das Kronecker-Delta ist definiert als: δij = 1 falls i = j = 0 falls i ≠ j Das Kronecker-Delta kann in der Form δ = 1D: I × I → {0,1} geschrieben werden und ist damit die charakteristische Funktion 1D der Diagonalmenge D = {(i,j) ∈ I × I: i=j} Häufig wird dabei an Stelle von {0, 1} ein erweiterter Bildraum, z.B. die reellen Zahlen, betrachtet. In der linearen Algebra kann zum Beispiel die n×n -Einheitsmatrix als (δij)1 ≤ i,j ≤ n geschrieben werden. Mit dem Kronecker-Delta kann auch das Skalarprodukt orthonormierter Basisvektoren e1, …, en als 〈ei, ej〉 = δij schreiben. Determinante Eine Determinante ist eine Funktion, die einer n-reihigen quadratischen Matrix eindeutig eine reelle Zahl zuordnet. n ... Ordnung der Determinante, aik ... Elemente der Determinanten, i ... Zeile, k ... Spalte Determinanten einer Matrix werden mit det A oder | A | bezeichnet. Hauptdiagonale ⇔ a11 a22 ... ann Nebendiagonale ⇔ a1n a2(n-1) ... an1 Berechnung der zweireihigen Determinante = a1 * a4 - a2 * a3 Die zum Element aik gehörende Adjunkte Aik ist die Determinante (n-1).Ordnung, die durch Streichen der i.ten Zeile und k.ten Spalte, multipliziert mit (-1)i+k entsteht. Leibniz-Formel Die Determinante einer quadratischen Matrix A ist gleich det A = Σ sign(σ) a1σ(1) ... anσ(n) Die Summenbildung erfolgt über alle σ = (σ(1), σ(2), ..., σ(n)) möglichen Permutationen von (1, 2, ..., n). Dabei ist sign(σ) = 1, falls σ eine gerade Permutation ist, andernfalls -1. Eine Permutation heißt gerade, wenn die Anzahl der Inversionen der Elemente gerade ist. Sarrusche Regel Entwicklungsregel für dreireihige Determinanten = (a1 *a5 *a9) +(a2 *a6 *a7) + (a3 *a4 *a8) -(a1 *a6 *a8) - (a2 *a4 *a9) -(a3 *a5 *a7) Regel: Hauptdiagonalenprodukte addieren, Nebendiagonalenprodukte subtrahieren: Vierreihige Determinante Werden die Glieder einer 4reihigen Determinante von links oben nach rechts unten mit a0 bis a15 bezeichnet, ist die Determinante gleich D= a0 · (a5 · (a10 · a15 - a11 · a14) - a6 · (a9 · a15 - a11 · a13) + a7 · (a9 · a14 - a10 · a13)) - a1 · (a4 · (a10 · a15 - a11 · a14) - a6 · (a8 · a15 - a11 · a12) + a7 · (a8 · a14 - a10 · a12)) + a2 · (a4 · (a9 · a15 - a11 · a13) - a5 · (a8 · a15 - a11 · a12) + a7 · (a8 · a13 - a9 · a12)) - a3 · (a4 · (a9 · a14 - a10 · a13) - a5 · (a8 · a14 - a10 · a12) + a6 · (a8 · a13 - a9 · a12)) Determinantenentwicklung, Laplacescher Entwicklungssatz Determinanten höherer Ordnung lassen sich durch Determinanten niedriger Ordnung, sogenannte Unterdeterminanten (Adjunkte), berechnen. ... nach den Elementen der i.ten Zeile D = ai1 Ai1 + ai2 Ai2 + ... + ain Ain ... nach den Elementen der k.ten Spalte D = a1k A1k + a2k A2k + ... + ank Ank Die zum Element aik gehörende Unterdeterminante, Adjunkte Aik ist die Determinante (n-1).Ordnung, die durch Streichen der i.ten Zeile und k.ten Spalte, multipliziert mit (-1)i+k entsteht. Die Adjunkte Aik wird auch algebraisches Komplement von aik genannt. Der Vorzeichenfaktor im algebraischen Komplement kann mit der Schachbrettregel (siehe Abbildung) bestimmt werden. Vandermondsche Determinante, Potenzdeterminante 1 a1 a1² a1³ ... a1n-1 1 a2 a2² a2³ ... a2n-1 ... = Π (ar - as) Produktbildung für alle r>s von 1 bis n 1 an an² an³ ... ann-1 Determinantengesetze • Vertauschen der Zeilen mit den gleichstelligen Spalten ändert den Wert nicht. • Vertauschen von zwei parallelen Reihen ändert das Vorzeichen. 219 • Ein allen Elementen einer Reihe gemeinsamer Faktor kann ausgehoben werden, auch umgekehrt • Addition eines Vielfachen der Elemente einer Reihe zu einer parallelen Reihe ändert den Wert nicht. • Ein Determinante hat den Wert 0, wenn - die Elemente von zwei parallelen Reihen proportional sind - die Elemente einer Reihe Linearkombinationen der Elemente paralleler Reihen sind - alle Elemente einer Reihe Null sind • Die Summe der Produkte aus den zu einer Reihe gehörenden Unterdeterminanten und den Elementen einer parallelen Reihe ist 0. • Eine Determinante wird gerändert, indem übereck eine Zeile und eine Spalte angefügt werden. Deren gemeinsames Element ist 1. Die restlichen Elemente einer der beiden Reihen sind 0, der anderen Reihe beliebig. Der Wert der Determinante ändert sich nicht. • Stürzen der Matrix: Der Wert einer Determinante bleibt unverändert, wenn die Determinante der an der Hauptdiagonalen gespiegelten (transponierten) Matrix bestimmt wird. Praxis der Determinantenberechnung Tips zur Berechnung n-reihiger Determinanten: • Laplace-Entwicklung nach einer Zeile oder Spalte mit möglichst vielen Nullen. • Durch elementare Umformungen wird der Wert der Determinante nicht geändert. • Nullen in Zeilen erzeugen durch Addition oder Subtraktion von Vielfachen von Zeilen. • Nullen in Spalten erzeugen durch Addition oder Subtraktion von Vielfachen von Spalten. • Berechnung von n-reihigen Determinanten durch elementare Umformungen: Die praktische Berechnung von Determinanten höherer Ordnung erfolgt mit numerischen Verfahren. Die Matrix wird dabei durch elementare Umformungen, die den Wert der Determinante nicht verändern, in eine Dreiecksmatrix übergeführt. Die Determinante ist dann einfach zu berechnen. Die Determinante einer Dreiecksmatrix ist das Produkt der Elemente auf der Hauptdiagonalen: det A = a11 a22 ... ann A und B seien n-reihige quadratische Matrizen, det A und det B deren Determinanten. Dann gilt: Produktsatz det (A * B) = det A * det B Das Multiplikationstheorem liefert eine Möglichkeit, die Determinante eines Matrixproduktes direkt aus den Determinanten der einzelnen Matrizen zu berechnen. Die Berechnung des Matrixproduktes ist so nicht notwendig. det (α A) = αn det A det AT = det A det A-1 = 1 / det A Eine Determinante det A ist genau dann verschieden von Null, wenn eine der Eigenschaften gilt: 1. die Zeilen (Spalten) von A sind linear unabhängig 2. die Zeilen (Spalten) von A sind eine Basis des Rn 3. der Rang von A ist gleich n 4. die Matrix A-1 existiert, A ist invertierbar, regulär 5. die Gleichung A x→ = b→ ist eindeutig lösbar durch x→ = A-1 b→ Beispiel: Die Anzahl der inkongruenten Netze der Platonischen Körper Ikosaeder und Dodekaeder kann über die Determinante der 11reihigen Matrix berechnet werden, mit dem Ergebnis 5184000. Ableitung einer Determinante Hängen die Elemente einer Determinante von einer Variablen t ab, dann erhält man die Ableitung D'(t) der Determinante D(t), indem man der Reihe nach jede Zeile bezüglich t differenziert und alle diese Determinanten addiert. Beispiel: Für die Ableitung von D(t) = |a(t)c(t) b(t)d(t)| ergibt sich D'(t) = |a'(t)c(t) b'(t)d(t)| + |a(t)c'(t) b(t)d'(t)| Maximale Determinante Unter der maximalen Determinante einer quadratische n x n - Matrix versteht man die Anordnung der Zahlen 1, 2, …, n² in der Determinante, so dass diese den größten Wert erreicht. Für n = 1, 2, 3, … sind bisher die Werte D = 1, 10, 412, 40800, 6839492, 1865999570, 762150368499 bekannt. Für die ersten vier Fälle sind links die Determinanten abgebildet. Die Bestimmung der maximalen Determinante ist auch mit Hochleistungscomputern sehr zeitaufwendig, da die Anzahl der verschiedenen Determinanten bei der n x n-Matrix gleich (n²)! ist, d.h. für n = 1, 2, 3, … 1! = 1, 2²! = 24, 3²! = 9! = 362880, 4²! = 16! = 20922789888000, … Für die Fälle n > 7 kennt man bisher nur untere Grenzen (nach Hermann Jurksch), d.h. die maximale Determinante ist mindestens so groß: 220 D(8) ≥ 440943507851753 D(9) ≥ 3,46254605664 · 1017 D(10) ≥ 3,56944784623 · 1020 maximale Determinante der Ordnung 7 (46, 42, 15, 2, 27, 24, 18), ( 9, 48, 36, 30, 7, 14, 31), (39, 11, 44, 34, 13, 29, 5), (26, 22, 17, 41, 47, 1, 21), (20, 8, 40, 6, 33, 23, 45), ( 4, 28, 19, 25, 38, 49, 12), (32, 16, 3, 37, 10, 35, 43) ); d7 = 762150368499 maximale Determinante der Ordnung 8 ( 1, 34, 55, 19, 59, 26, 45, 20), (23, 2, 18, 61, 35, 57, 39, 25), (21, 56, 3, 27, 47, 41, 12, 53), (50, 42, 31, 4, 17, 60, 43, 13), (24, 33, 64, 40, 5, 38, 8, 48), (49, 6, 30, 14, 36, 16, 46, 63), (29, 54, 22, 52, 11, 7, 58, 28), (62, 32, 37, 44, 51, 15, 9, 10) ); d8 = 440943507851753 maximale Determinante der Ordnung 9 (68, 7, 12, 62, 73, 26, 29, 58, 34), (67, 37, 43, 10, 3, 61, 33, 78, 36), (30, 20, 79, 53, 49, 71, 40, 25, 2), (56, 50, 8, 27, 42, 60, 81, 4, 41), (23, 14, 54, 63, 11, 18, 72, 44, 70), ( 1, 38, 32, 21, 65, 66, 22, 48, 76), (45, 74, 31, 80, 17, 46, 5, 24, 47), (15, 77, 35, 39, 51, 16, 59, 69, 9), (64, 52, 75, 13, 57, 6, 28, 19, 55) ) d9 = 3.46254605664224e+17 maximale Determinante der Ordnung 10 ( 1, 2, 61, 84, 81, 82, 39, 54, 41, 60), (53, 57, 3, 65, 94, 20, 91, 22, 66, 33), (46, 63, 47, 4, 45, 78, 83, 28, 13, 98), (79, 42, 49, 71, 5, 95, 51, 10, 77, 26), (17, 75, 87, 58, 30, 6, 38, 27, 86, 80), (68, 93, 76, 50, 85, 56, 7, 37, 14, 19), (100,16, 31, 35, 62, 34, 8, 64, 67, 88), (21, 72, 29, 9, 48, 73, 43, 97, 89, 25), (52, 70, 23, 96, 11, 36, 55, 92, 12, 59), (69, 15, 99, 32, 44, 24, 90, 74, 40, 18) ) d10 = -3.56944784623E+020 Alle Determinanten gefunden durch Herman Jurksch Cramersche Regel Die Cramersche Regel (nach Cramer, 1704-1752) ermöglicht das Auflösen eines linearen Gleichungssystems mit Hilfe von Determinanten. Gegeben sei ein Gleichungssystem mit n Gleichungen und n Variablen. D ... Koeffizientendeterminante Zählerdeterminante Dxk ... Zählerdeterminante, entsteht aus D, indem die Koeffizienten aik von xk durch die Absolutglieder bi ersetzt werden Lösung des Gleichungssystems: xk = Dxk / D, k = 1,2,3,...,n Lösbarkeitsregeln D ≠ 0 und Dxk reell ⇒ eindeutige Lösung D = 0 und alle Dxk = 0 ⇒ unendliche Lösungsmenge D = 0 und ein Dxk ≠ 0 ⇒ leere Lösungsmenge Gleichungssystem mit 2 Gleichungen und 2 Variablen Gleichungssystem a11x + a12y = b1 a21x + a22y = b2 Lösung x = (a22b1 - a12b2) / (a11a22 - a12a21) y = (a11b2 - a21b1) / (a11a22 - a12a21) Lösungsfälle a) Gleichungen linear unabhängig und widerspruchsfrei ⇒ genau eine Lösung ⇒ graphisch: zwei sich schneidende Geraden (oberste Abbildung) b) Gleichungen linear abhängig ⇒ unendlich viele Lösungen ⇒ graphisch: zwei zusammenfallende Geraden (unterste Abbildung) 221 c) Gleichungen widersprüchlich ⇒ keine Lösung ⇒ graphisch: zwei parallele nicht zusammenfallende Geraden (mittlere Abbildung) Gleichungssystem mit 2 Gleichungen und 3 Variablen homogene Form ... alle Absolutglieder bi sind gleich 0 a11x + a12y + a13z = 0 a21x + a22y + a23z = 0 Lösung x = (a12a23 - a13a22) * t y = - (a11a23 - a13a21) * t z = (a11a22 - a12a21) * t inhomogene Form ... wenigstens ein Absolutglied bi ist verschieden von 0 a11x + a12y + a13z = b1 a21x + a22y + a23z = b2 Lösung bei Einzellösung (a,b,c) y = - (a11a23 - a13a21) * t + b x = (a12a23 - a13a22) * t + a z = (a11a22 - a12a21) * t + c Gleichungssystem mit 3 Gleichungen und 3 Variablen 0 = a·x + b·y + c·z + d 0 = e·x + f·y + g·z + h 0 = i·x + j·y + k·z + l Lösung: x = [b·(g·l-h·k) + c·(h·j-f·l) + d·(f·k - g·j)] / [a·(f·k - g·j) + b·(g·i - e·k) + c·(e·j - f·i)] y = [a·(g·l-h·k) + c·(h·i-e·l) + d·(e·k - g·i)] / [a·(f·k - g·j) + b·(g·i - e·k) + c·(e·j - f·i)] z = [a·(f·l-h·j) + b·(h·i-e·l) + d·(e·j - f·i)] / [a·(f·k - g·j) + b·(g·i - e·k) + c·(e·j - f·i)] Ungleichungen ... sind Verknüpfungen zweier algebraischer Ausdrücke durch eins der folgenden Zeichen > größer < kleiner ≠ verschieden von, ungleich <> größer oder kleiner ≥ größer oder gleich ≤ kleiner oder gleich Addition und Subtraktion von Ungleichungen Addition und Subtraktion einer Größe ... ist a > b, dann gilt a+c > b+c sowie a-c > b-c. Durch Addition oder Subtraktion ein und derselben Größe auf beiden Seiten ändert sich der Sinn der Ungleichung nicht Addition von Ungleichungen ... Ist a > b und c > d, dann gilt a+c > b+d. Zwei gleichsinnige Ungleichungen können seitenweise addiert werden Subtraktion von Ungleichungen ... Ist a > b und c < d, dann gilt a-c > b-d. Von einer Ungleichung kann eine andere ihr ungleichsinnige Ungleichung glied- oder seitenweise subtrahiert werden, wobei das Ungleichheitszeichen der ersten Ungleichung erhalten bleibt. Regel der Mittelzahlen Diese Regel wurde zuerst von dem französischen Mathematiker Nicolas Chuquet angegeben. Hat man zwei Brüche mit positiven Zählern und Nennern und bildet man dazu einen dritten Bruch, dessen Zähler gleich der Summe der Zähler und dessen Nenner gleich der Summe der Nenner der beiden gegebenen Brüche ist, so liegt dieser dritte Bruch auf der Zahlengeraden stets zwischen den beiden gegebenen Brüchen. Aus a/b < x/y folgt a/b < (a+x)/(b+y) < x/y für a, b, x, y > 0. Systeme linearer Ungleichungen ... können grafisch gelöst werden Beispiel y ≥ 2x – 1 y ≤ -x + 1 y ≥ -0.4x – 1.7 Dazu stellt man die Ungleichung nach y um, d.h. y > c/b –a/b x und stellt die lineare Funktion y = c/b –a/b x dar. Die Koordinaten aller Punkte der Koordinatenebene, die über der Geraden liegen, da y > c/b –a/b x, stellen dann Lösungen der Ungleichung dar. Für die verschiedenen Relationszeichen gilt dann: Zeichen „>“ ... alle Punkte über der linearen Funktion Zeichen „≥“ ... alle Punkte über der linearen Funktion und die Punkte der Funktion Zeichen „<“ ... alle Punkte unterhalb der linearen Funktion Zeichen „<=“ ... alle Punkte unterhalb der linearen Funktion und die Punkte der Funktion erfüllen die Ungleichung. Betrachtet man nun mehrere Ungleichungen gleichzeitig, d.h. ein System von Ungleichungen, so überlappen sich die Lösungsmengen. Interessiert man sich ausschließlich für ganzzahlige Lösungen, so entsprechen diese den Punkten mit ganzzahligen Koordinaten. 222 Achtung ! Gleichsinnige Ungleichungen lassen sich nicht gliedweise subtrahieren Rechenregeln für Ungleichungen Für beliebige Ungleichungen gilt (T ... sinnvoller Term im Variablenbereich) T1 < T2 → T1 + T < T2 + T T1 < T2 → T1*T < T2*T , wenn T > 0 T1 < T2 → T1*T > T2*T , wenn T < 0 0 < T1 < T2 → 1/T1 > 1/T2 T1 < T2 und T3 < T4 → T1 + T3 < T2 + T4 T1 < T2 und T3 < T4→ T1 * T3 < T2 * T4 , wenn T2, T3 > 0 T1 < T2 → -T1 > -T2 T1n + T2n ≤ (T1 + T2)n , wenn T1, T2 > 0 und n positiv Arten von Ungleichungen Lineare Ungleichungen Lineare Ungleichungen werden durch Addition, Subtraktion und Multiplikation mit Konstanten ähnlich wie lineare Gleichungen gelöst. Quadratische Ungleichungen Bei quadratischen Ungleichungen zerfällt der Lösungsbereich in drei Abschnitte, die sich aus der der Ungleichung entsprechenden quadratischen Gleichung ergeben. Diese sind in der Abbildung die gezeigten Abbildung, die Abschnitte blau - rot - blau. Als Lösungen kommen nun entweder alle blau markierten oder alle rot markierten Werte der x-Achse infrage. Lösung mit quadratischer Ergänzung Ein Verfahren zur Lösung basiert auf der quadratischen Ergänzung. Als Beispiel soll die Ungleichung x² - 0,5·x - 0,5 > 0 gelöst werden (Abbildung). x² - 0,5·x - 0,5 > 0 | +0,5 Das Quadrat der Hälfte des Betrags des linearen Gliedes addieren x² - 0,5·x > 0,5 | +(0,5/2)² Ausklammern x² - 0,5·x + 0,25² > 0,5625 Wurzel ziehen (x - 0,25)² > 0,75² Dabei sind zwei Fälle zu betrachten. Fall 1: x ≥ 0,25 Dann ist die Ungleichung x - 0,25 > 0,75 zu lösen, also gilt x > 1, wobei in diesem Fall die Voraussetzung x ≥ 0,25 ebenfalls erfüllt ist Fall 2: x ≤ 0,25 Dann ist die Ungleichung 0,25 - x > 0,75 zu lösen, also gilt -0,5 > x, wobei auch in diesem Fall die Voraussetzung x ≤ 0,25 erfüllt ist. Diese beiden Aussagen haben keinen Überschneidungsbereich. Dann sind alle Zahlen, die entweder kleiner als -0,5 oder größer als +1 sind, Lösungen der Ungleichung. Das ist im Bild der blaue Bereich. Beispiel zu einer quadratischen Ungleichung Die Ungleichung -x² > x - 2 , D = R kann folgendermaßen gelöst werden: -x² > x - 2 | -(x-2) -x² - x + 2 > 0 | ·(-1) x2 + x - 2 < 0 (x - 1)(x + 2) < 0 Graphisch kann man die Lösungsmenge als die x-Werte bestimmen, für die der Graph der Funktion f(x) = x² + x - 2 echt unter x-Achse verläuft. In der Abbildung ist dieser Bereich grün gekennzeichnet, die Lösungsmenge ist das rot eingezeichnete Intervall (-2, 1) der x-Achse; die Grenzen x = -2 und x = 1 sind keine Elemente der Lösungsmenge. Zur rechnerischen Lösung bestimmt man die Nullstellen der linken Seite. Diese können aus der letzten der obigen Ungleichungen direkt als x1 = -2 und x2 = 1 abgelesen werden. Durch Einsetzen von x = 0 in die Ungleichung erkennt man, dass x = 0 Element der Lösungsmenge ist. Es gilt also x² + x - 2 ≤ 0 für -2 ≤ x ≤ 1 und damit ist L = {x ∈ R : -2 < x < 1} die Lösungsmenge der Ungleichung. Arten von Ungleichungen (2) Ungleichungen höherer Ordnung Bei Ungleichungen ab der Ordnung 3 ist üblicherweise nur die Umwandlung auf eine Ungleichung für ein Produkt sinnvoll, beispielsweise indem eine Ungleichung der Ordnung 3 auf die Form (x-a) (x-b) (x-c) > 0 für reelle oder (a-x) (x²+bx+c) > 0 für ein Paar komplexer Nullstellen gebracht wird. Diese Faktorisierung ist nach dem Fundamentalsatz der Algebra für Ungleichungen beliebig hoher Ordnung möglich. Die analytische Berechnung der Nullstellen 223 ist aber nicht immer möglich, sodass dafür meist ein numerisches Verfahren wie beispielsweise Bisektion herangezogen werden muss. Eine graphische Lösung kann bei der Suche nach geeigneten Startwerten hilfreich sein. Bruchungleichungen Für das Lösen von Bruchungleichungen ergeben sich Probleme, wenn die gesuchte Größe x auch in mindestens einem der Nenner erscheint. Durch beidseitiges Multiplizieren der Gleichung mit den Nennern und anschließendes Ausmultiplizieren wird die Bruchungleichung in eine Ungleichung aus zwei Polynomen überführt. Beim Multiplizieren mit den Nennern ist vorher zu bestimmen, für welche Werte von x sie einen negativen Wert annehmen, da sich dann ja durch die Multiplikation das Vergleichszeichen umkehrt. Gibt es einen Bereich von x, in dem beide Nenner negativ sind, so wird das Vergleichszeichen zweimal umkehrt, was sich gegenseitig aufhebt. Diese Vorabklärung wird als Fallunterscheidung bezeichnet. Grafische Lösung von Ungleichungen Graphische Verfahren können im Rahmen der Zeichengenauigkeit Anhaltspunkte über Anzahl und Lage der Lösungen geben. Liegt die Ungleichung in einer der Normalform von Gleichungen entsprechenden Form vor, lässt sich die linke Seite als Funktion auffassen, deren Graph nach einer Wertetafel mit hinreichender Genauigkeit zu zeichnen ist. Die Bereiche links oder rechts der Nullstellen (d.h. Schnittpunkte mit der xAchse) stellen dann die Lösungsmengen grafisch dar. Andernfalls sind die Funktionen, die der rechten und der linken Seite der Ungleichung entsprechen, zusammen in ein Achsenkreuz zu zeichnen. Die x-Werte der Schnittpunkte geben die Grenzen der Lösungsbereiche an. Betragsungleichung Betragsungleichungen sind Ungleichungen, die mindestens einen Term enthalten, der in Betragsstriche eingeschlossen ist. Damit treten zwei kritische Operationen auf: das Auflösen der Betragsstriche und die Multiplikation mit einem Term kleiner 0. Beispiel: |x-2| + 2/x + |x+2| > 0 Lösung: An drei Stellen muss die Ungleichung besonders untersucht werden; an der Stelle x = 0, da dort die Ungleichung undefiniert ist, und an den Stellen x = 2 und x = -2, da sich dort die Vorzeichen der Beträge ändern. Damit ist eine Fallunterscheidung für die Bereiche (-∞,-2) , [-2,0) , (0,2) und [2,∞] durchzuführen. 1) Bereich (-∞,-2) ergibt -x + 2 + 2/x - x - 2 > 0 d.h. x² > 1 und |x| > 1 mit der Lösungsmenge L1 = {x | x < -2} 2) Bereich [-2,0) ergibt -x + 2 + 2/x + x + 2 > 0 d.h. x < -1/2 mit der Lösungsmenge L2 = {x | -2 ≤ x < -1/2} 3) Bereiche (0,2) und [2,∞] In diesem Fall sind alle Terme auf der linken Seite der Ausgangsungleichung positiv, d.h. x > 0. Gesamtlösungsmenge L = {x | x < -1/2 und x > 0} Ungleichungen und Mittelwerte Arithmetisches und geometrisches Mittel (a1+a2+…+an) / n ≥ n√( a1 a2 … an ) ; für ai > 0 Das arithmetische Mittel von n positiven Zahlen ist größer oder gleich dem geometrischen Mittel dieser Zahlen. Das Gleichheitszeichen gilt nur, wenn alle n Zahlen gleich sind. Arithmetisches und quadratisches Mittel | (a1+a2+…+an) / n | ≤ √( (a1²+a2²+…+an²) / n ) Der Absolutbetrag des arithmetischen Mittels mehrerer Zahlen ist kleiner oder gleich dem quadratischen Mittel. Lineare Ungleichung-Aufgabe Fünfte Fürther - Mathematik-Olympiade 1996 - Klassenstufe 7/8 Aufgabe 2: Anton will zur Vorbereitung auf eine Mathematikprüfung eine bestimmte Anzahl von Aufgaben lösen. Auf die Frage, wie viele Aufgaben er schon gelöst habe, antwortet er: "Die Anzahl der gelösten Aufgaben ist um 31 größer als die Zahl der nicht gelösten Aufgaben. Addiert man zur Zahl der gelösten Aufgaben die doppelte Anzahl der nicht gelösten Aufgaben, so erhält man eine 224 Zahl die kleiner als 100 ist. Addiert man aber zur Zahl der gelösten Aufgaben ein Drittel der Anzahl nicht gelösten Aufgaben, so ergibt sich eine ganze Zahl, die größer als 45 ist." Ist durch die obigen Angaben die Zahl der Aufgaben, deren Lösung sich Anton vorgenommen hat, eindeutig bestimmt? Wenn ja, wie groß ist die Zahl? Wenn nein, welche Anzahlen an Aufgaben sind möglich? Lösung: Es sei x = Anzahl der gelösten Aufgaben, y = Anzahl der ungelösten Aufgaben und n = Zahl der Aufgaben = x+y. Dann erhält man das System aus Gleichungen und einer Ungleichung (I) x = y+31 (II) x+2y < 100 (III) x+y/3 > 45 Aus diesen Gleichungen ergibt sich (IV) y/3 ∈ N ⇒ y = 3k mit k ∈ N mit Einsetzen in (II) 9k < 69 ⇒ k ≤ 7 und in (II) 4k > 14 ⇒ k > 3 und somit die möglichen Lösungen k 4 5 6 7 y 12 15 18 21 x 43 46 49 52 n 55 61 67 73 Bernoullische Ungleichung (1 + T)n ≥ 1 + n T , wenn T ≥ 0, n natürlich n √(1 + T) < 1 + T/n , wenn T > 0, n positiv 2x > x , wenn x natürlich Beispiele für Betragsungleichungen bzw. -Gleichungen über Q (1) | x + 3 | ≥ 2,2 ⇔ | x – ( - 3 ) | | ≥ 2,2 L = ] - ∞ ; - 5,2 ] ∪ [ - 0,8; ∞ [ (2) |x–7| =5 L = { 2; 12 } (3) | x – 10 | = - 2 L=∅ (4) | x + 3 | = 502 L = { -505; 499 } (5) | x + 1,5 | = 2/3 L = { - 1,5 – 2/3 ; - 1,5 + 2/3 } = { - 13/6; - 5/6 } (6) | x + 0,7 | < 3,05 L = ] – 3,75 ; + 2,35 [ (7) | x – 1,25 | ≥ 10,1 L = = ] - ∞ ; - 8,85 ] ∪ [ 11,35 ; ∞ [ (8) | x + 14/5 | ≤ 4/3 L = [ -62/15 ; -19/12] Numerische Verfahren Numerische Verfahren und Algorithmen werden of aus folgenden Gründen genutzt: 1) es gibt zu dem Problem keine explizite Lösungsdarstellung oder 2) die Lösungsdarstellung existiert, ist jedoch zu kompliziert oder langsam zu ermitteln Folgende numerische Verfahren werden häufig genutzt: Lineare Gleichungssysteme a) Gaußsches Eliminationsverfahren bzw. LR-Zerlegung: klassisches direktes Verfahren - für große Matrizen allerdings aufwändig b) Cholesky-Zerlegung: für symmetrische positiv definite Matrizen kann ähnlich wie die LRZerlegung eine symmetrische Zerlegung erstellt werden bei halbem Aufwand c) QR-Zerlegung: ein direktes Verfahren mit doppelter Laufzeit im Vergleich zum Gauß-Verfahren aber besseren Stabilitätseigenschaften d) Splitting-Verfahren: klassische iterative Verfahren e) Gauß-Seidel-Verfahren: auch als Einzelschrittverfahren bezeichnet f) Jacobi-Verfahren: auch als Gesamtschrittverfahren bezeichnet g) Richardson-Verfahren; SOR-Verfahren; SSOR-Verfahren h) Krylow-Unterraum-Verfahren: moderne iterative Verfahren, die für große, dünnbesetzte Gleichungssysteme gedacht sind i) Mehrgitterverfahren: modernes Verfahren mit linearer Komplexität speziell für Gleichungssysteme, die von partiellen Differenzialgleichungen herrühren j) Vorkonditionierung: Technik, die Kondition einer Matrix zu verbessern k) ILU-Zerlegung: wichtiges Vorkonditionierungsverfahren Nichtlineare Gleichungssysteme a) Bisektion: sehr einfaches Verfahren, welches auf Halbierung eines Intervalls beruht. Konvergiert linear, der Fehler halbiert sich etwa in jedem Iterationsschritt b) Bisektion-Exklusion: spezielles Bisektionsverfahren für Polynome, welches alle Nullstellen innerhalb einer Startregion beliebig genau einschränkt c) Regula Falsi: einfaches iteratives Verfahren zur Nullstellenbestimmung eindimensionaler Funktionen d) Fixpunktverfahren: Klasse linear konvergenter Verfahren zum Auffinden von Fixpunkten von Funktionen, auch im mehrdimensionalen 225 e) Newton-Verfahren: quadratisch konvergentes Verfahren zum Auffinden von Nullstellen differenzierbarer Funktionen. Auch im mehrdimensionalen anwendbar, dann ist in jedem Iterationsschritt ein lineares Gleichungssystem zu lösen f) Halley-Verfahren, Euler-Tschebyschow-Verfahren: kubisch konvergentes Verfahren zum Auffinden von Nullstellen zweimal differenzierbarer Funktionen. Auch im mehrdimensionalen anwendbar, dann sind in jedem Schritt zwei lineare Gleichungssysteme zu lösen g) Homotopieverfahren: Methode, bei der ein frei wählbaren Problem mit einfacher Lösung mit einem vorgegebenen Problem stetig verbunden wird. In vielen Fällen kann die Lösung des einfachen Problems zu einer Lösung des eigentlichen Problems verfolgt werden h) Verfahren des steilsten Abstiegs: langsames Verfahren zur Lösung des Minimierungsproblems i) Bairstow-Verfahren: spezielles Iterationsverfahren, um komplexe Nullstellen von Polynomen mittels reeller Operationen zu bestimmen j) Weierstrass-Verfahren, Aberth-Ehrlich-Verfahren, Trennkreisverfahren: spezielle, aus dem Newton-Verfahren abgeleitete Methoden zur simultanen Bestimmung aller komplexen Nullstellen eines Polynoms Numerische Integration a) Newton-Cotes-Formeln: einfache Quadraturformeln, die auf Polynominterpolation basieren b) Gauß-Quadratur: Quadraturformeln mit optimaler Konvergenzordnung c) Romberg-Extrapolation: Technik zur Verbesserung von Newton-Cotes-Formeln d) Mittelpunktsregel; Trapezregel; Simpsonregel e) Lie-Integration: Integrationsverfahren, das auf einem verallgemeinerten Differenzialoperator aufbaut Approximation und Interpolation a) Polynominterpolation: Interpolation durch Polynome b) Spline-Interpolation: Interpolation durch stückweise stetige Polynome c) Trigonometrische Interpolation: Interpolation durch trigonometrische Polynome d) Remez-Algorithmus: findet die optimale Approximation bezüglich der Supremumsnorm e) De Casteljau-Algorithmus: Algorithmus zur Berechnung von Bézier-Kurven Ausgleichsprobleme a) QR-Zerlegung: Geeignet für lineare Ausgleichsprobleme, auch Householder-Verfahren) b) Gauß-Newton-Verfahren: Ein iteratives Verfahren zur Lösung nichtlinearer Ausgleichsprobleme c) Kurvenfitten: Allgemein Ermitteln von Parameterwerten durch Anpassung an Messkurven Optimierung a) Branch-and-Bound: Enumerationsverfahren zur Lösung ganzzahliger Optimierungsprobleme. b) Schnittebenenverfahren, Branch-and-Cut: Verfahren zur Lösung ganzzahliger linearer Optimierungsprobleme. c) Simplex-Verfahren: Ein direktes Verfahren der linearen Programmierung. d) Downhill-Simplex-Verfahren: Ein ableitungsloses Verfahren der nichtlinearen Optimierung. e) Innere-Punkte-Verfahren: Ein iteratives Verfahren auch für nichtlineare Optimierungsprobleme. f) Logarithmisches Barriereverfahren: Ebenfalls ein iteratives Verfahren für nichtlineare Optimierungsprobleme. g) Simulierte Abkühlung: Ein heuristisches Verfahren für Optimierungsprobleme hoher Komplexität. Numerik gewöhnlicher Differenzialgleichungen a) Eulersches Polygonzugverfahren: das einfachste Lösungsverfahren, ein 1-stufiges Einschrittverfahren b) Einschrittverfahren: Verfahren, die nur Informationen des aktuellen Zeitschrittes benutzen, um daraus die nächste Näherung zu berechnen c) Mehrschrittverfahren: Verfahren, die Informationen der letzten Zeitschritte nutzen. In Abhängigkeit von der Zahl der Zeitschritte sind die entsprechenden Startwerte z.B. mit einem Einschrittverfahren zu ermitteln d) Adams-Bashforth-Verfahren: Familie von expliziten Mehrschrittverfahren e) Adams-Moulton-Verfahren: Familie von impliziten Mehrschrittverfahren f) Prädiktor-Korrektor-Verfahren: Kombination eines expliziten und eines impliziten Mehrschrittverfahrens gleicher Fehlerordnung. Das explizite Verfahren ergibt eine Näherung (Prädiktor), das implizite Verfahren verbessert den Näherungswert (Korrektor) g) Runge-Kutta-Verfahren: Familie von Einschrittverfahren inkl. dem klassischen Runge-KuttaVerfahren Numerik partieller Differenzialgleichungen a) Finite-Elemente-Methode: modernes, flexibles Verfahren zur Lösung vor allem elliptischer partieller Differenzialgleichungen b) Finite-Volumen-Verfahren: modernes Verfahren zur Lösung von Erhaltungsgleichungen 226 c) Finite-Differenzen-Verfahren: klassisches Verfahren für beliebige partielle Differenzialgleichungen d) Randelementmethode: Verfahren zur Lösung elliptischer partieller Differenzialgleichungen, wobei lediglich der Gebietsrand und nicht das Gebiet selbst zu diskretisieren ist e) Spektralmethode: neuartiges Verfahren, das zur Diskretisierung Polynome sehr hoher Ordnung benutzt f) Level-Set-Methode: moderne Methode zur Verfolgung von bewegten Rändern. g) Leapfrog-Verfahren: abgewandeltes Eulerverfahren mit Termen nur zweiter Ordnung, bei dem die Zeitschritte für Ort und Geschwindigkeit um die halbe Integrationschrittweite versetzt sind h) Finite-Punkte-Methode: neueres Berechnungsverfahren nur mit Punkten, aber ohne Elemente i) Orthogonale Kollokation: Verfahren für beliebige partielle Differenzialgleichung, oft kombiniert mit dem Finite-Differenzen-Verfahren Berechnung von Eigenwerten a) QR-Algorithmus: Berechnung aller Eigenwerte b) LR-Algorithmus: Treppeniteration genannt, ein dem QR-Verfahren vergleichbarer aber weniger stabiler Algorithmus c) Potenzmethode: erlaubt die Berechnung des betragsgrößten Eigenwertes d) Unterraumiteration: mehrdimensionale Erweiterung der Potenzmethode und erlaubt die gleichzeitige Berechnung mehrerer der betragsgrößten Eigenwerte e) Lanczos-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen f) Arnoldi-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen g) Jacobi-Verfahren: Berechnung aller Eigenwerte und Eigenvektoren von kleinen symmetrischen Matrizen h) Jacobi-Davidson-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen sonstige Verfahren a) Schnelle Fourier-Transformation (FFT) b) Wavelet-Transformation c) Gram-Schmidtsches Orthogonalisierungsverfahren d) Horner-Schema zur Polynomwertberechnung e) Bresenham-Algorithmus zur Linien- oder Kreisinterpolation in der Computergrafik f) Extrapolation g) Summationsverfahren und Folgentransformationen für divergente Folgen und Reihen h) Konvergenzbeschleunigung für konvergente Folgen und Reihen von reellen oder komplexen Zahlen, Vektoren und Matrizen Zahlentheoretische Funktionen n sei eine natürliche Zahl ... Eine zahlentheoretische Funktion ist eine auf der Menge der positiven ganzen Zahlen erklärte, reell- oder komplexwertige Funktion. Eine zahlentheoretische Funktion f(n) heißt multiplikativ, wenn f(m n) = f(m) f(n) für teilerfremde m und n gilt. Für multiplikative, zahlentheoretische Funktionen f(n) gilt damit stets f(1) = 1. Gilt f(m n) = f(m) f(n) ohne jede Einschränkung für m und n, so ist die Funktion f(n) total multiplikativ. Eulersche Funktion φ(n) ... Anzahl der zu n teilerfremden natürlichen Zahlen m, welche kleiner als n sind φ(x) ist multiplikativ ⇒ φ(m*n) = φ(m) * φ(n) für ggT(mn,n)=1 Ist p Primzahl ⇒ φ(p) = p-1 Ist n=pk und p Primzahl ⇒ φ(n) = pk-1(p-1) Besitzt n die untereinander verschiedenen Primfaktoren p1, p2, ..., pr ⇒ φ(n) = n (1-1/p1)(1-1/p2)...(11/pr) Weitere Funktionen d(n) ... Anzahl aller positiven Teiler von n; multiplikative Funktion σ(n) ... Summe aller positiven Teiler von n π(n) ... Anzahl der Primzahlen kleiner gleich n r(n) ... Anzahl der ganzzahligen Lösungspaare der Gleichung x²+y²=n Satz von Euler-Fermat Es seien a, n natürliche Zahlen und ggT(a, n) = 1 Dann gilt: aφ(n) ≡ 1 mod n wobei φ(n) die Eulersche Phi-Funktion bezeichnet. Da für prime Moduln p gilt: φ(p) = p-1, geht für diese der Satz von Euler in den kleinen Satz von Fermat über. 227 Beweis: Sei (Z/nZ)× = {r1, …, rφ(n)} die Menge der multiplikativ modulo n invertierbaren Elemente. Für jedes a mit ggT(a, n) = 1 ist dann x → ax eine Permutation von (Z/nZ)×, denn aus ax ≡ ay mod n folgt x ≡ y mod n Da die Multiplikation kommutativ ist, folgt r1…rφ(n) ≡ (a r1)…(a rφ(n)) ≡ r1…rφ(n) aφ(n) mod n und da die ri invertierbar sind für alle i, gilt 1 ≡ aφ(n) mod n. Anwendung: Der Satz von Euler dient der Reduktion großer Exponenten modulo n. Praktische Anwendung findet er in dieser Eigenschaft in der computergestützten Kryptografie, beispielsweise im RSAVerschlüsselungsverfahren. Problem: Was ist die letzte Dezimalstelle von 7222, d.h. welcher Zahl ist 7222 kongruent modulo 10? Es ist ggT(7, 10) = 1 und φ(10) = 4. Damit liefert der Satz von Euler 74 ≡ 1 mod 10 und 7222 ≡ 74·55+2 ≡ (74)55·7² ≡ 49 ≡ 9 mod 10 Allgemein gilt ab ≡ ab mod φ(n) mod n, für teilerfremde natürliche a und b Abschätzung der phi-Funktion Σn=1N φ(n) = 1/(2 ζ(2)) N² + O(N log N) wobei ζ die Riemannsche Zetafunktion und O das Landau-Symbol ist. D.h., im Mittel ist φ(n) / n ≈ π² / 12 Eulersche Funktion (2) Die Eulersche Funktion φ(n) gibt die Anzahl der zu n teilerfremden natürlichen Zahlen m an, welche kleiner als n sind. Dabei zeigt sich, dass φ(n) nicht jede natürliche Zahl als Funktionswert annehmen kann. Schinzel bewies 1956, dass für jedes k > 0 die Werte 2·zk nicht auftreten. 1976 zeigte Mendelsohn, dass es unendlich viele Primzahlen p gibt, für die 2kp (k > 0) nicht zum Wertebereich von φ(n) gehören. Antikoindikator-Zahl Unter einer Antikoindikator-Zahl (engl. noncototient, franz. anticoïndicateur) versteht man eine natürliche Zahl n, für die es keine natürliche Zahl m gibt, so dass m - φ(m) = n gilt, wobei φ(m) die Eulersche Funktion ist. Die Differenz m - φ(m) wird Koindikator genannt. Mitunter wird die Funktion ψ(m) = m - φ(m) auch als Eulersche Psi-Funktion, oder kurz psi-Funktion, bezeichnet. Die ersten Antikoindikator-Zahlen sind 10, 26, 34, 50, 52, 58, 86, 100, 116, 122, 130, 134, 146, 154, 170, 172, 186, 202, 206, 218, 222, 232, 244, 260, 266, 268, 274, 290, 292, 298, 310, 326, 340, 344, 346, 362, 366, 372, 386, 394, 404, 412, 436, 466, 470, 474, 482, 490, 518, 520, … Durch Erdös und Sierpinski wurde die Vermutung aufgestellt, dass es unendlich viele derartige Zahlen gibt. 1995 wurde dies durch Browkin und Schinzel endgültig bewiesen. Eine sehr große AntikoindikatorZahl ist 509203 · 2k. Noch nicht beantwortet ist die Vermutung, dass alle diese Zahlen gerade sind. Dies folgt aber aus der Goldbachschen Vermutung. Kann eine gerade Zahl n als Summe von zwei verschiedenen Primzahlen p und q dargestellt werden, dann ist pq - φ(pq) = pq - (p - 1)(q - 1) = p + q - 1 = n - 1 Damit kann keine ungerade Zahl größer 5 Antikoindikator-Zahl sein. Carmichael-Funktion Die Carmichael-Funktion λ ist eine zahlentheoretische Funktion, die eng mit der Euler-Funktion φ(n) zusammenhängt. Wie diese hat λ eine Beziehung zu Primzahlen und zu der Ordnung ganzer Zahlen. Der Name der Funktion geht auf den US-amerikanischen Mathematiker Robert D.Carmichael (1879-1967) zurück. Die Definition der Carmichael-Funktion λ: N → N ist anspruchsvoll: Ist die Primfaktorzerlegung von n gegeben durch n = p1a1 … pkak, so gilt λ(n) = kgV[λ(p1a1), …, λ(pkak)], wo (piai) = 2ai-2 wenn pi = 2 und ai > 2, sonst piai-1 (pi-1) Beispiel: Es sei n = 12, mit der Primzahlzerlegung 12 = 2²·3; dann ist λ(12) = kgV[ λ(2²), λ(3)], mit λ(2²) = 1 und λ(3) = 2, also λ(12) = 2. Mit etwas Aufwand ermittelt man die λ-Werte für die ersten natürlichen Zahlen n = 1, 2, …, 15 zu λ(n) = 1, 1, 2, 2, 4, 2, 6, 2, 6, 4, 10, 2, 12, 6, 4 Eine der Eigenschaften der Carmichael-Funktion lässt sich für jede natürliche Zahl n beweisen: Der Wert der Carmichael-Funktion λ(n) teilt stets den Wert der Euler-Funktion φ(n), d.h. λ(n)|φ(n). Der Wert der Carmichael-Funktion für eine Primzahl p ist einfach zu ermitteln: λ(p) = p-1 ; p prim 228 Ist n das Produkt zweier Primzahlen p und q, n = p q, so gilt λ(pq) = kgV(p-1, q-1). Beispiel: λ(15) = kgV(3-1, 5-1) = 4. Ferner gilt der folgende wichtige Satz. Satz von Carmichael Für zwei natürliche teilerfremde Zahlen m, n gilt mλ(n) = 1 mod n. Für festes n und variables m ist λ(n) der kleinste Exponent mit dieser Eigenschaft. Dirichletsches Produkt Es seien f(n) und g(n) zwei zahlentheoretische Funktionen. Die zahlentheoretische Funktion h(n) = Σt/n f(t) g(n/t) heißt ihr Dirichletsches Produkt. Der Summationsindex bedeutet, dass die Summer über alle Teiler t von n zu bilden ist. Das Dirichletsche Produkt ist kommutativ und assoziativ. Sätze über zahlentheoretische Funktionen 1. Die Menge der zahlentheoretischen Funktionen f(n) mit f(1) ≠ 0 bildet bezüglich der Dirichletschen Multiplikation eine kommutative Gruppe. 2. Sind f und g multiplikative Funktionen, so ist auch f*g multiplikativ. 3. Die zahlentheoretischen Funktionen g(n) und f(n)*g(n) seien mutiplikativ. Dann ist auch f(n) multiplikativ. Möbiussche µ-Funktion Die zu f(n) = 1 bezüglich der Dirichletschen Multiplikation inverse Funktion heißt Möbiussche µ-Funktion. Es gilt µ(1) = 1 µ(p) = -1 , p ... Primzahl Mit der eindeutigen Primfaktorzerlegung für n = Σi=1r piai gilt µ(n) = (-1)r für a1 = a2 = ... = ar = 1 µ(n) = 0 für alle anderen Fälle Die zahlentheoretisch wichtige Möbius-Funktion µ(n) kann auch wie folgt definiert werden: µ(n) = 1 , wenn n quadratfrei ist und eine gerade Azahl verschiedener Primteiler besitzt µ(n) = -1 , wenn n quadratfrei ist und eine ungerade Azahl verschiedener Primteiler besitzt µ(n) = 0 , wenn n nicht quadratfrei ist Weiterhin ist µ(1) = 1. µ(0) ist undefiniert. Die Folge der Funktionswerte der Möbius-Funktion beginnt mit 1,-1,-1,0,-1,1,-1,0,0,1,-1,0,-1,1,1,0,-1,0,-1,0,1,1,-1,0,0, … Zahlen mit µ = -1 und genau drei Primfaktoren werden sphenische Zahlen genannt. Die ersten sind 30, 42, 66, 70, 78, 102, 105, 110, 114, 130, 138, 154, 165, 170, 174, 182, 186, 190, 195, 222, … Die kleinsten Zahlen mit µ = -1 und genau fünf Primfaktoren sind 2310, 2730, 3570, 3990, 4290, 4830, 5610, 6006, 6090, 6270, 6510, 6630, 7410, 7590, 7770, 7854, 8610, 8778, 8970, 9030, 9282, 9570, 9690, … Die Möbius-Funktion ist mit anderen wichtigen Funktionen verbunden. Mertens-Funktion M(n) = Σk=1n µ(k) Riemannsche Zeta-Funktion 1/ζ(s) = Σn=1∞ µ(n)/ns Möbiussche Formeln Ist g(n) eine multiplikative, zahlentheoretische Funktion, so gilt F(n) = f(n) * g(n) ⇔ f(n) = F(n) * [µ(n) g(n)] g(n) = Σt/n f(t) ⇒ f(n) = Σt/n µ(t) g(n/t) h(n) = Σt/n µ(t) f(n/t) ⇒ f(n) = Σt/n h(n) Tschebyschowsche Funktionen Als Tschebyschowsche Funktionen werden bezeichnet ϑ(x) = Σp≤x ln p ψ(x) = Σp^m≤x m ln p Die zweite Summe ist wie folgt zu verstehen: ln p tritt als Summand genau n-mal auf, wenn pm die höchste Potenz von p ist, welche x nicht überschreitet, zum Beispiel ψ(10) = 3 ln 2 + 2 ln 3 + ln 5 + ln 7 Aus der Definition folgt ϑ(x) = ln (Πp≤x p) ψ(x) = ln (kgV aller positiven ganzen Zahlen ≤ x) Mangoldt-Funktion Die Mangoldt-Funktion (nach dem deutschen Mathematiker Hans von Mangoldt) ist eine zahlentheoretische Funktion, die mit Λ bezeichnet wird. Die Mangoldtsche Funktion ist definiert als Λ(n) = ln p, wenn n sich als n = pk darstellen lässt, wobei p prim und k eine natürliche Zahl sind. Andernfalls ist Λ(n) = 0. Die Funktion ist weder additiv noch multiplikativ. 229 Meist wird die Funktion eΛ(n) betrachtet. Für diese Funktion wird eΛ(n) = kgV(1,2,…,n) / kgv(1,2,3,…,n-1) Die erste Werte sind 1, 2, 3, 2, 5, 1, 7, 2, 3, 1, 11, 1, 13, 1, 1, 2, 17, 1, 19, 1, 1, 1, 23, 1, 5, 1, 3, 1, 29, 1, 31, 2, 1, 1, 1, 1, 37, 1, 1, 1, 41, 1, 43, 1, 1, 1, 47, 1, 7, 1, 1, 1, 53, 1, 1, 1, 1, 1, 59, 1, 61, 1, 1, 2, 1, 1, 67, 1, 1, 1, 71, 1, 73, 1, 1, 1, 1, 1, 79, 1, 3, 1, 83, 1, 1, 1, 1, 1, 89, 1, 1, 1, 1, 1, 1, … Die summierte Mangoldt-Funktion ψ(n) = Σi=1n Λ(i) ist eine der Tschebyschowschen Funktionen. Diese ist beim Beweis des Primzahlsatzes von Bedeutung. Zwischen der Mangoldt-Funktion µ(n) und der Möbius-Funktion bestehen die Beziehungen: Σd|n Λ(d) = ln n Σd|n µ(n/d) ln d = Λ(n) Σd|n µ(d) ln d = -Λ(n) Σd|n µ(n/d) Λ(d) = -µ(n) ln n Liouville-Funktion Die Liouville-Funktion (nach Joseph Liouville), ist eine multiplikative zahlentheoretische Funktion. Sie ist definiert durch λ(n) = (-1)Ω(n) wobei Ω(n) die Anzahl der nicht notwendigerweise verschiedenen Primfaktoren bezeichnet. Außerdem wird λ(0) = 0 und λ(1) = 1 festgelegt. Die ersten Werte der Liouville-Funktion für n = 1, 2, … sind 1, -1, -1, 1, -1, 1, -1, -1, 1, 1, -1, -1, -1, 1, 1, 1, -1, -1, -1, -1, 1, 1, -1, 1, 1, 1, -1, -1, -1, -1, -1, -1, 1, 1, 1, 1, -1, 1, 1, 1, -1, -1, -1, -1, -1, 1, -1, -1, 1, -1, 1, -1, -1, 1, 1, 1, 1, 1, -1, 1, -1, 1, -1, 1, 1, -1, -1, -1, 1, -1, -1, -1, -1, 1, -1, -1, 1, -1, -1, -1, 1, 1, -1, 1, 1, 1, 1, 1, -1, 1, 1, -1, 1, 1, 1, 1, -1, -1, -1, 1, -1, … Weiterhin gilt Σd|n λ(d) = 1 , wenn n eine Quadratzahl ist, sonst = 0 Für die Summe L(n) = Σk=1n λ(k) vermutete Polya, dass stets L(n) < 0 gilt. Diese Vermutung wurde widerlegt; das kleinste Gegenbeispiel ist n = 906150257. Es ist noch nicht bekannt, ob L sein Vorzeichen unendlich oft wechselt. Sigma-Funktion Die Sigma-Funktion ist eine zahlentheoretische Funktion: σ(n) … Summe aller positiven Teiler von n Die Sigma-Funktion σ(n) ist multiplikativ. Dabei ist für eine Primzahl p : σ(p) = p+1 und es gilt der Satz: Ist p Primzahl und n natürliche Zahl, n > 0, so ist σ(pn) = (pn+1 - 1)/(p-1) . d.h. z.B. σ(2000) = σ(2453) = σ(24) σ(53) = (25 - 1)/(2-1) (54 - 1)/(5-1) = 31 · 156 = 4836. Die verallgemeinerte Sigmafunktion σ(n, k) in n.ter Potenz gibt für k = 0 die Anzahl der Teiler einer Zahl an und sonst die Summe der Teiler in n.ter Potenz. Allgemein gilt σk(n) = Σd|n dk σ0(n) hat die Werte 1, 2, 2, 3, 2, 4, 2, 4, 3, 4, 2, 6, … für n ∈ N. σ1(n) hat die Werte 1, 3, 4, 7, 6, 12, 8, 15, 13, 18, … für n ∈ N σ2(n) hat die Werte 1, 5, 10, 21, 26, 50, 50, 85, 91, 130, … für n ∈ N σ3(n) hat die Werte 1, 9, 28, 73, 126, 252, 344, 585, 757, 1134, … für n ∈ N Wallis-Problem Gesucht sind alle Paare (x, y) natürlicher Zahlen, für welche σ(x²) = σ(y²) gilt, wobei σ(n) die zahlentheoretische Funktion der Summe aller positiven Teiler von n darstellt. Aus der kleinsten bekannten Lösung (4 , 5) erhält man für m = 3, 7, 9, 11, 13, 17, 19, 23, ... mit (mx, my) weitere Lösungen des Wallis-Problems. Weitere n-Tupel (x1 , x2, ..., xn), welche jeweils paarweise das Wallis-Problem erfüllen, sind (326, 407), (406, 489), (627, 749), (740, 878), (880, 1451), (888, 1102), (1026, 1208), (1110, 1943), (1284, 1528, 1605), (1510, 1809), (1628, 1630, 2035), (1956, 2030, 2445), (2013, 2557), (2072, 3097), (2508, 2996, 3135, 3745), ... Smarandache-Funktion Die Smarandache-Funktion ist zahlentheoretische Funktion, die wie folgt definiert ist: Die Smarandache-Funktion µ(n) ist die kleinste natürliche Zahl, für die n die Fakultät von µ(n) teilt. d.h. µ(n) ist die kleinste natürliche Zahl, für die gilt n | µ(n)! Für den Wert µ(8) testet man die kleinste der Zahlen 1!, 2!, 3!, …, die durch 8 teilbar ist. Hier wird 4! = 24 als Vielfaches von 8, d.h. µ(8) = 4. Die ersten Werte der Funktion für n = 1, 2, 3, … sind 1, 2, 3, 4, 5, 3, 7, 4, 6, 5, 11, 4, 13, 7, 5, 6, 17, 6, 19, 5, 7, 11, 23, 4, 10, 13, 9, 7, 29, 5, 31, 8, 11, 17, 7, 6, 37, 19, 13, 5, 41, 7, 43, 11, 6, 23, 47, 6, 14, 10, 17, 13, 53, 9, 11, 7, 19, 29, 59, 5, 61, 31, 7, 8, 13, 11, 67, 17, 23, 7, 71, 6, 73, 37, 10, 19, 11, 13, 79, 6, 9, 41, 83, 7, … Mitunter wird µ(1) auch gleich 0 gesetzt. Zuerst wurde diese Funktion 1883 von Lucas, 1887 von Neuberg und 1918 von Kempner beschrieben. 1980 wurde sie von Florentin Smarandache wiederentdeckt. 230 Für alle n gilt µ(n) ≤ n, für Primzahlen p folglich µ(p) = p. Außerdem ist µ(n!) = n. Ist t der größte Primfaktor von n, dann wird auch µ(n) ≥ t. Durch Tutescu wird vermutet, dass für zwei aufeinanderfolgende Zahlen die Werte der SmarandacheFunktion verschieden sind: µ(n) ≠ µ(n+1) Bisher konnte die Vermutung durch Computereinsatz bis 109 nachgewiesen werden. Pseudosmarandache-Funktion Unter dem Funktionswert der pseudosmarandache-Funktion Z(n) versteht man die kleinste ganze natürliche Zahl, für die 1 + 2 + 3 + … + Z(n) Vielfaches von n ist, d.h. das kleinste natürliche n, für das gilt n | Z(n)(Z(n)+1) / 2 Die ersten Werte sind 1, 3, 2, 7, 4, 3, 6, 15, 8, 4, 10, 8, 12, 7, 5, 31, 16, 8, 18, 15, 6, 11, 22, 15, 24, 12, 26, 7, 28, 15, 30, 63, 11, 16, 14, 8, 36, 19, 12, 15, 40, 20, 42, 32, 9, 23, 46, 32, 48, 24, 17, 39, 52, 27, 10, 48, 18, 28, 58, 15, 60, 31, 27, 127, 25, 11, 66, 16, 23, 20, 70, 63, 72, 36, 24, … Additive Funktion Eine Funktion f(x) wird additiv genannt, wenn für alle relativ primen a, b des Definitionsbereiches die Beziehung f(a+b) = f(a) + f(b) gilt. Gilt die Beziehung für alle a, b, auch für zueinander nicht prime, so heißt die Funktion vollständig additiv. Additive und vollständig additive Funktionen sind im Allgemeinen nicht umkehrbar. Beispiele: Primteilersummenfunktion f(n) = a0(n), welche die Summe der Primteiler der natürlichen Zahl n darstellt, z.B. a0(20) = a0(2²·5) = 2 + 2 + 5 = 9. a0(4) = 4 a0(144) = a0(24·3²) = a0(24) + a0(3²) = 8 + 6 = 14 echte Primteilersummenfunktion g(n) = a1(n), welche de Summe der verschiedenen Primteiler der natürlichen Zahl n darstellt, z.B. a1(1) = 0, a1(20) = 2 + 5 = 7. a1(144) = a1(24·3²) = a1(24) + a1(3²) = 2 + 3 = 5 Primteilerfunktion Ω(n), die Anzahl der Primteiler einer natürlichen Zahl n echte Primteilerfunktion ω(n), die Anzahl der verschiedenen Primteiler einer natürlichen Zahl n Das Radikal einer natürlichen Zahl n ist das Produkt ihrer verschiedenen Primteiler. Primfakultät Die Primfakultät von n ist das Produkt aller Primzahlen kleiner oder gleich n. Die Primfakultär ist eine natürliche Definition für das Produkt von Primzahlen. Als Notation verwendet man n#. In der Zahlentheorie ist es üblich, bei der Betrachtung der Primfakultät nicht die multiplikative Schreibweise, sondern die additive zu verwenden, d.h statt n# wird ln(n#) untersucht. Der Logarithmus der Primfakultät ist dabei die Tschebyschowsche Funktion ϑ(n) = Σp≤n ln p = ln (n#) Quadratfreier Kern Der quadratfreie Kern sfk(n); squarefree kernel; von n ist das Produkt der verschiedenen Primfaktoren von n. Damit wird die Primfakultät mit der gewöhnlichen Fakultät n! und dem kleinsten gemeinsamen Vielfachen der ersten n Zahlen in Zusammenhang gebracht: n# = sfk(n!) Die Primfakultät ist damit der quadratfreie Kern der gewöhnlichen Fakultät, und auch der quadratfreie Kern des kleinsten gemeinsamen Vielfachen des Anfangsabschnitts der natürlichen Zahlen. Sphenische Zahlen Als sphenische Zahl (griechisch σφην = keilförmig) wird eine positive ganze Zahl bezeichnet, die das Produkt von genau drei verschiedenen Primzahlen ist. Alle sphenischen Zahlen besitzten genau acht Teiler. Sind p, q, r deren Primfaktoren, so sind die Teiler {1, p, q, r, pq, pr, qr, pqr} Sphenische Zahlen sind quadratfrei und haben einen Möbius-Funktionswert von -1. Die ersten sphenischen Zahlen sind 30, 42, 66, 70, 78, 102, 105, 110, 114, 130, 138, 154, … Die größte gegenwärtig (2007) bekannte sphenische Zahl ist (232582657 - 1)⋅(230402457 - 1)⋅(225964951 - 1) Deren Primfaktoren sind die größten bekannten Primzahlen (Mersennesche Primzahlen). Die ersten zwei aufeinanderfolgenden sphenischen Zahlen sind 230 = 2⋅5⋅23 und 231 = 3⋅7⋅11, die ersten drei aufeinanderfolgenden 1309 = 7⋅11⋅17, 1310 = 2⋅5⋅131 und 1311 = 3⋅19⋅23. Vier und mehr unmittelbar aufeinanderfolgende sphenische Zahlen kann es nicht geben, da dann wenigstens eine durch 4 teilbar und somit nicht quadratfrei wäre. 231 Golomb-Lineal Ein Golomb-Lineal ist ein Lineal, bei dem es keine zwei Markierungen mit dem gleichen Abstand zueinander gibt. Die Abbildung zeigt ein Golomb-Lineal der Ordnung 4 und Länge 6. Golomb-Lineale wurden nach Solomon W.Golomb benannt. Golomb-Lineale werden nach Ordnung und Länge kategorisiert. Die Ordnung eines Golomb-Lineals ist definiert durch die Anzahl der Markierungen, die Länge durch den größten Abstand zweier Markierungen, wobei die kleinste Markierung üblicherweise auf 0 gesetzt wird. Kann ein Golomb-Lineal alle Abstände bis zu seiner Länge messen, wird es ein perfektes Golomb-Lineal genannt. Ein Golomb-Lineal ist optimal, wenn es keine kürzeren Lineale derselben Ordnung gibt. Optimale Golomb-Lineale für eine gegebene Ordnung zu finden, ist eine rechenintensive Aufgabe. Mittels verteiltem Rechnen wurde der bisher bekannte Kandidat für optimale Golomb-Lineale der Ordnung 24 bestätigt. Golomb-Lineale werden beim Entwurf von Gruppenantennen, wie beispielsweise Radioteleskopen, verwendet. Antennen in [0,1,4,6] Golomb-Anordnung findet man häufig bei Mobilfunkmasten. Induktive Definition Ähnlich wie bei reellen Zahlenfolgen kann man mittels Rekursionsgleichungen Funktionen in den natürlichen Zahlen definieren. Zum Beispiel wäre φ(0) = 1 ; φ(n+1) = φ(n) + 2 die Definition der ungeraden natürlichen Zahlen. Für die Fakultät n! ergibt sich in den natürlichen Zahlen 0! = 1 ; (n+1)! = (n+1) n! Weitere Beispiele sind Stirling-Zahlen s(n,r) = s(n - 1,r - 1) + (n - 1) · s(n - 1,r) mit den Anfangswerten s(0,0) = 1 ; s(n,n) = 1 ; s(n,0) = 0 für n > 0 ; s(0,r) = 0 für r > 0 Delannoy-Zahlen D(a,b) = D(a-1,b) + D(a,b-1) + D(a-1,b-1) mit D(0,0) = 1 Schröder-Zahlen S(n) = S(n-1) + Σ S(k) · S(n-1-k) ; Summenbildung von k = 0 bis n-1 mit S(0) = 1 usw. Insbesondere bei der Definition von Mengen und in der theoretischen Informatik werden induktive Definitionen gern verwendet. Algebraische Strukturtheorie Mengenabbildungen (Relationen) Allgemein versteht man unter einer n-stelligen Relation R in einer Menge A eine Teilmenge von An = A x A x … x A , d.h. R ⊆ An Jede Teilmenge R ⊆ A x B heißt zweistellige Relation oder binäre Relation zwischen A und B. Schreibweise: x R y mit x aus A und y aus B; Ist A = B = dann heißt R Relation auf M. Für A = B ist eine binäre Relation eine Korrespondenz von A in A. Mit jeder binären Relation R ist auch R-1; die Umkehrrelation; eine Relation und mit zwei binären Relationen R und S auch die Verknüpfung R • S eine Relation. Eigenschaften: R ist reflexiv ⇔ für alle x: x R x R ist symmetrisch ⇔ für alle x,y: Aus x R y folgt y R x R ist transitiv ⇔ für alle x,y,z: Aus x R y und y R z folgt x R z R ist irreflexiv ⇔ für kein x gilt x R x R ist asymmetrisch ⇔ für kein x,y folgt aus x R y auch y R x R ist antisymmetrisch ⇔ für alle x,y folgt aus x R y und y R x sofort x = y R ist identitiv ⇔ für alle x,y aus x R y und y R x folgt x = y R ist linear ⇔ für alle x,y gilt: es existiert mindestens eine der Beziehungen x R y, y R x oder x = y Mit jeder Relation R ist auch die Umkehrung R-1 reflexiv, irreflexiv, symmetrisch, asymmetrisch oder antisymmetrisch. Außerdem folgt aus der Asymmetrie die Irreflexivität. Spezielle Relationen Für spezielle Relationen R auf einer Menge A wird definiert: R heißt reflexive teilweise Ordnung auf A ⇔ R ist reflexiv, transitiv und antisymmetrisch R heißt lineare Ordnung (totale Ordnung) ⇔ R ist transitiv, antisymmetrisch und linear R heißt irreflexive teilweise Ordnung auf A ⇔ R ist irreflexiv und transitiv R heißt Äquivalenzrelation auf A ⇔ R ist reflexiv, symmetrisch und transitiv. 232 M, Für die (gewöhnlichen) Ordnungsrelationen auf den reellen Zahlen ergibt sich: Es seien a, b, c reelle Zahlen. Dann gilt für alle a, b und c a ≤ a ; ≤ ist reflexiv a b ⇒ (¬(b < a) ∨ a = b) ; ≤ ist antisymmetrisch (a ≤ b ∧ b ≤ c) ⇒ a ≤ c ; ≤ ist transitiv a < b ⇒ a ≠ b ; < ist irreflexiv (a < b ∧ b < c) ⇒ a < c ; < ist transitiv a ≤ b ∨ b ≤ a ; ≤ ist linear Allgemein kann man Ordnungen in einer Menge A als Festlegungen einer Rangfolge von Elemente der Menge A auffassen, wobei Ordnungen nicht unbedingt linear sein müssen, d.h., nicht für jedes Paar von Elementen aus A muss festgelegt sein, welches vom größeren Rang ist. Eine reflexive teilweise Ordnung kann mit einem Hasse-Diagramm veranschaulicht werden. Ordnungsrelation Eine binäre Relation R in einer Menge A heißt Ordnung oder Ordnungsrelation, wenn R reflexiv, antisymmetrisch und transitiv ist. Man spricht auch von einer teilweisen Ordnung. Ist R zusätzlich linear, so heißt R vollständige Ordnung, vollständige Ordnungsrelation oder Kette. Die Menge A heißt dann durch R geordnet bzw. vollständig geordnet. In einer vollständig geordneten Menge sind also je zwei Elemente vergleichbar. Statt aRb verwendet man auch die Bezeichnung a ≤R b oder a ≤ b, wenn die Ordnungsrelation R aus dem Zusammenhang bekannt ist. Anstelle von Ordnung ist auch die Bezeichnung Halbordnung oder partielle Ordnung üblich. R heißt reflexive Ordnungsrelation, wenn sie reflexiv, transitiv, identitiv und linear ist. R heißt irreflexive Ordnungsrelation, wenn sie irreflexiv, transitiv und linear ist. Eine teilweise Ordnung R in A heißt Wohlordnung genau dann, wenn jede Teilmenge ein kleinstes Element besitzt. Jede Wohlordnung ist linear. Denn mit zwei Elementen x, y besitzt die Menge {x, y} ein kleinstes Element; oBdA sei dies x. Dann gilt x R y. Andererseits ist aber nicht jede linear geordnete Menge wohlgeordnet. In Q mit der natürlichen Ordnung ≤ sei B = {q ∈ Q | 2 ≤ q²}. Das kleinste Element dieser Menge wäre √2, was keine rationale Zahl ist. Beispiele: Die Zahlenbereiche N, Z, Q, R sind vollständig geordnet. Die Teilmengenbeziehung ist eine Ordnung, die nicht vollständig ist. Die lexikografische Ordnung auf den Wörtern der deutschen Sprache ist eine Kette. Teilweise geordnete Mengen Eine Menge M heißt teilweise geordnet, oder halbgeordnet wenn sie mit einer Relation ≤ versehen ist, die den folgenden Eigenschaften genügt: x ≤ x für alle x ∈ M (Reflexivität) für alle x, y ∈ M gilt: Aus x ≤ y und y ≤ x folgt x = y (Antisymmetrie) für alle x, y, z ∈ M gilt: Aus x ≤ y und y ≤ z folgt x ≤ z (Transitivität) Im Englischen heißen teilweise geordnete Mengen auch posets von partially ordered set. Die Bezeichnung "teilweise" wird mitunter auch weggelassen. Gilt für zwei Elemente x und y weder x ≤ y noch y ≤ x, so heißen die Elemente unvergleichbar. Im Allgemeinen müssen in einer teilweisen Ordnung zwei Elemente nicht vergleichbar sein. Sind je zwei Elemente vergleichbar, so heißt die Ordnung linear. ∈ ist linear genau dann, wenn für alle x, y: x ∈ y oder y ∈ x Ist die Ordnung linear, so spricht man auch von einer totalen Ordnung oder einer kettengeordneten Menge. Eine total geordnete Teilmenge von M heißt auch Kette. Aus der Linearität folgt die Reflexivität. Beispiele 1) Die Zahlenbereiche wie die natürlichen Zahlen N, ganzen Zahlen Z oder reellen Zahlen R bilden bzgl. der natürlichen Ordnungsrelation ∈ lineare Ordnungen. 2) Die natürlichen Zahlen N bilden bzgl. der Teilbarkeit eine teilweise Ordnung. Diese Ordnung ist nicht linear, da zwei teilerfremde Zahlen nicht vergleichbar sind. 3) Die Potenzmenge einer beliebigen Menge M bildet bzgl. der Inklusion eine teilweise geordnete Menge. Diese Ordnung ist nicht linear. Hasse-Diagramm Für endliche geordnete Mengen veranschaulicht man die Ordnungsstruktur in Form von speziellen Graphen. Diese werden Ordnungsdiagramme oder Hassediagramme genannt. Die Elemente der geordneten Menge werden als Punkte dargestellt und zwei direkt vergleichbare Elemente werden durch Strecken verbunden, wobei kleinere Elemente weiter unten stehen. Die obere Grafik veranschaulicht eine aus zwei Elementen bestehende linear geordnete Menge. 233 2.Abbildung: Das Hasse-Diagramm zeigt die Teiler der Zahl 12, bezüglich der durch die Teilbarkeit gegebenen Ordnungsbeziehung. 3.Abbildung: Für die Zahl 30 können die Teiler durch dieses Ordnungsdiagramm veranschaulicht werden. untere Abbildung: Zu einem gleich aussehenden Diagramm gelangt man, indem man von einer dreielementigen Menge ausgeht und die Inklusion als Ordnung in ihrer Potenzmenge definiert. Majoranten und Minoranten Sei M eine teilweise geordnete Menge mit der Ordnung ≤. Für eine nichtleere Teilmenge A ⊆ M heißt ein Element s ∈ M obere Schranke von A, wenn a ≤ s für alle a ∈ A gilt. Analog heißt s untere Schranke von A, wenn s ≤ a für alle a ∈ A gilt. Existieren die obere (untere) Schranke, so heißt die Menge nach oben (unten) beschränkt. Die Menge aller oberen Schranken von A heißt Majorante von A (Bezeichnung: Ma(A)) und die Menge aller unteren Schranken heißt Minorante von A und wird mit Mi(A) bezeichnet. Ma(A) = {x ∈ M | a ≤ x ∀a ∈ A} Mi(A) = {x ∈ M | x ≤ a ∀a ∈ A} Beispiel (Abbildung): Betrachtet man die Zahl 30 und ihre Teiler mit der Ordnung bezüglich der Teilbarkeit als Ordnung, und sei A = {2; 5}. Dann ist Mi(A) = {1} und Ma(A) = {10; 30}. Eigenschaften von Minorante und Majorante Sei M eine teilweise geordnete Menge mit der Ordnung ≤. Für nichtleere Teilmengen A, B ⊆ M gilt dann A ⊆ Ma(Mi(A)) und A ⊆ Mi(Ma(A)) A ⊆ B ⇒ Ma(B) ⊆ Ma(A) und Mi(B) ⊆ Mi(A) Mi(Ma(Mi(A))) = Mi(A) und Ma(Mi(Ma(A))) = Ma(A) für a, b ∈ M gilt: a ≤ b ⇔ Mi(a) ⊆ Mi(b) ⇔ Ma(b) ⊆ Mi(a) Infimum und Supremum Sei M eine teilweise geordnete Menge mit der Ordnung ≤ und A eine nichtleere Teilmenge A ⊆ M. Minimum und Maximum Unter dem Minimum min(A) von A versteht man alle unteren Schranken von A, die zu A gehören und dementsprechend ist das Maximum max(A) die Menge aller oberen Schranken von A, die zu A gehört. Mittels Minorante und Majorante kann man definieren min(A) = A ∩ Mi(A) max(A) = A ∩ Ma(A) (*) Existieren Minimum (Maximum) einer Menge A so sind sie eindeutig bestimmt. Infimum und Supremum Das Infimum inf(A) einer Menge A ist die größte untere Schranke von A und das Supremum sup(A) ist die kleinste obere Schranke von A. Mit (*) wird inf(A) = max(Mi(A)) = Mi(A) ∩ Ma(Mi(A)) sup(A) = min(Ma(A)) = Ma(A) ∩ Mi(Ma(A)) Auch Infimum und Supremum sind eindeutig bestimmt, sofern sie existieren, da sie als Minimum bzw. Maximum von Minoranten- bzw. Majorantenmengen definiert sind. Sätze: Sei s = inf(A), dann gilt s ≤ a für alle a ≤ A und für alle t ≤ Mi(A) gilt: s ≥ t. Das Infimum ist die größte untere Schranke. Insbesondere gilt: falls x ≤ a für alle a ≤ A, dann ist auch x ≤ inf(A). Sei s = sup(A), dann gilt a ≤ s für alle a ≤ A und für alle t ≤ Ma(A) gilt: t ≥ s. Das Supremum ist die kleinste untere Schranke. Insbesondere gilt: falls a ≤ x für alle a ≤ A, dann ist auch x ≥ sup(A). Sei (M, ≤) eine teilweise geordnete Menge. A ⊆ M eine Teilmenge. Dann gilt: Existiert das Minimum (Maximum) von A so stimmt es mit dem Infimum (Supremum) überein. Aus a = inf(A) bzw. a = sup(A) und a ≤ A folgt a = max(A) bzw. a = min(A) Isotone Abbildung Es seien M und N zwei teilweise geordnete Mengen und f: M → N eine Abbildung. Die Abbildung f heißt isoton oder ordnungserhaltend genau dann, wenn für alle a, b ∈ M gilt a ≤ b ⇒ f(a) ≤ f(b) Die Abbildung heißt antiton, wenn gilt a ≤ b ⇒ f(a) ≥ f(b) f ist ein Ordnungsisomorphismus zwischen M und N genau dann, wenn f bijektiv ist und sowohl f als auch die Umkehrabbildung f-1 isoton sind. Die beiden Mengen M und N heißen dann auch ordnungsisomorph. Eine isotone Bijektion muss nicht notwendigerweise eine isotone Umkehrung haben, daher ist diese Forderung in der Definition des Ordnungsisomorphismus wesentlich. Für die abgebildeten Hassediagramme ist die identische Abbildung A → B (a → a, b → b, c → c) isoton. Die Umkehrung ist nicht isoton, da a ≤ b in B; jedoch a und b in A unvergleichbar sind. Für linear geordnete Mengen gilt: Seien M und N linear geordnete Mengen und f: M → N eine isotone Bijektion. Dann ist die Umkehrabbildung von f isoton und damit ist f ein Ordnungsisomorphismus. Umkehrrelation ... Zu jeder Relation existiert eine Umkehrrelation 234 Äquivalenzrelation Ein Äquivalenzrelation ist eine Relation, welche reflexiv, symmetrisch und transitiv ist. Für a R b verwendet man a ∼ b, wenn die Äquivalenzrelation bekannt ist, und sagt, a ist äquivalent zu b. reflexiv a~a symmetrisch aus a ~ b folgt b ~ a transitiv aus a ~ b und b ~ c folgt a ~ c Beispiel: A = Z und m natürliche Zahl > 0. Dann gilt a ∼ b genau dann, wenn a und b bei Division durch m den gleichen Rest lassen (Kongruenzrechnung modulo m) Äquivalenzklassen Eine Menge M wird durch jede Äquivalenzrelation in Äquivalenzklassen zerlegt, welche paarweise elementfremd (disjunkt) sind. Alle Elemente einer Klasse sind untereinander äquivalent, d.h. jedes a aus der Klasse kann als Repräsentant der Klasse gewählt werden. Die Menge aller Äquivalenzklassen A | R heißt das Restesystem von R nach A. Auf die Reflexivität kann in der Definition der Äquivalenzrelation nicht verzichtet werden. Eine symmetrische und transitive Relation muss nicht notwendigerweise reflexiv sein. Es folgt zwar aus x R y wegen der Symmetrie sofort y R x und mit der Transitivität auch x R x. Dieser Schluss ist aber nur dann korrekt, wenn es ein y mit x R y gibt. Zwei Äquivalenzklassen x | R und y | R sind genau dann gleich, wenn x R y, d.h. ihre Repräsentanten in Relation zueinander stehen. Sei R eine Äquivalenzrelation in A. Dann gelten für das Restesystem A | R folgende Eigenschaften keine Äquivalenzklasse ist leer die Vereinigung aller Äquivalenzklassen ist die Menge A selbst je zwei verschiedene Äquivalenzklassen sind disjunkt Ein Teilmengensystem mit diesen Eigenschaften nennt man auch eine Zerlegung oder Partition. Relationsalgebra Man kann die Eigenschaften von binären Relationen rein mengentheoretisch charakterisieren. Sei R ⊆ A × A eine binäre Relation. Wir bezeichnen mit RT = R-1 die inverse Relation oder transponierte Relation. Die Bezeichnung transponierte Relation ergibt sich daher, dass bei einer Matrixdarstellung sie genau der transponierten Matrix entspricht. Sind R und S binäre Relationen auf A, so ist auch R • S = {(a, c): ∃ b ∈ A: (a, b) ∈ R und (b, c) ∈ S} eine binäre Relation. Sie heißt die Komposition oder das Relationenprodukt von R und S. Zu beachten ist, dass diese Schreibweise entgegengesetzt zur Hintereinanderausführung von Abbildungen ist. Bezeichnen man mit IA = {(a, a) | a ∈ A} die Identität, so ergibt sich für die algebraischen Eigenschaften von Relationen: Sei R ⊆ A × A eine binäre Relation. Dann gilt: R ist reflexiv ⇔ IA ⊆ R R ist irreflexiv ⇔ IA ∩ R = ∅ R ist symmetrisch ⇔ R = RT R ist asymmetrisch ⇔ R ∩ RT = ∅ R ist antisymmetrisch ⇔ R ∩ RT ⊆ IA R ist transitiv ⇔ R • R ⊆ R Auswahlaxiom Das Auswahlaxiom sichert die Existenz einer Auswahlfunktion für eine beliebige Familie von nichtleeren Mengen. Diese wählt aus jeder Menge ein Element aus. Sei I eine beliebige Indexmenge und Ai eine Familie von nichtleeren Mengen (Ai ≠ ∅) dann existiert eine Abbildung f: I → ∪i∈I Ai mit f(I) ∈ Ai Obwohl die Aussage dieses Axioms einleuchtend erscheint, ist sie für unendliche Mengen nicht trivial. Zu beachten ist, dass es sich um eine reine Existenzaussage handelt. Es wird kein Verfahren angegeben, wie die Auswahlfunktion konstruiert werden kann. Wohlordnungssatz Der Wohlordnungssatz sagt aus, dass jede Menge wohlgeordnet werden kann. In der axiomatischen Mengenlehre nach Zermelo-Fraenkel sind Auswahlaxiom, Wohlordnungssatz und Zornsches Lemma äquivalent. Das Lemma von Kuratowski-Zorn oder Zornsches Lemma, ist ein Theorem der Zermelo-FraenkelMengenlehre, die das Auswahlaxiom einbezieht. Es ist benannt nach dem Mathematiker Max Zorn, der es 1935 wieder entdeckte, obwohl es schon 1922 von dem polnischen Mathematiker Kazimierz Kuratowski gefunden wurde. Lemma von Kuratowski-Zorn, Zornsches Lemma Jede nichtleere halbgeordnete Menge, in der jede Kette, d.h. jede total geordnete Teilmenge, eine obere Schranke hat, enthält mindestens ein maximales Element. Dieses Lemma wird in vielen wichtigen Beweisen benutzt, zum Beispiel für 235 den Satz, dass jeder Vektorraum eine Basis hat das Hahn-Banach-Theorem in der Funktionalanalysis, nach dem man lineare Funktionale fortsetzen kann Tychonoffs Theorem, dass jedes Produkt kompakter Räume selbst kompakt ist den Satz, dass jeder Ring mit 1 ein maximales Ideal hat den Satz, dass jeder Körper einen algebraischen Abschluss hat Multimenge Die Multimenge ist ein Begriff aus der Mengenlehre der Mathematik. Die Besonderheit von Multimengen gegenüber dem gewöhnlichen Mengenbegriff besteht darin, dass die Elemente einer Multimenge mehrfach vorkommen können. Entsprechend haben auch die verwendeten Mengenoperationen eine modifizierte Bedeutung. Als Multimenge über einer Menge M bezeichnet man eine Abbildung V von M in die Menge der natürlichen Zahlen. V(x) bezeichnet dann die Vielfachheit des Elementes x aus M. Anschaulich ist eine Multimenge eine Menge, in der jedes Element beliebig oft vorkommen kann. Man notiert Multimengen dann auch wie Mengen explizit mit geschweiften Klammern und schreibt ein Element so oft hinein, wie es in der Multimenge vorkommt. Mengen sind in diesem Sinne ein Spezialfall von Multimengen, bei denen nur die Werte 0 (nicht enthalten) und 1 (enthalten) zugeordnet werden können. Beispiel Sei V die Multimenge über {a, b, c}, mit V(a) = 1, V(b) = 3 und V(c) = 0. Dann schreibt man auch V = {a, b, b, b}. Man nehme einen Würfel und würfle 20 mal hintereinander. Dann kann es sein, dass man 3 mal eine 1 2 mal eine 2 4 mal eine 3 5 mal eine 4 3 mal eine 5 3 mal eine 6 geworfen hat. Die Grundmenge ist dann {1, 2, 3, 4, 5, 6}; die Vielfachheit der 3 ist 4; also V(3) = 4. Die Multimenge listet jeden Wurf auf, wobei die Reihenfolge außer Acht gelassen wird: V = {1, 1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6}. Anzahl der möglichen Multimengen Gegeben sei eine Menge M mit n Elementen. Wie viele Multimengen über M gibt es dann, die k Elemente enthalten? Es gilt: (n+k-1k) Multimengen Abbildung Eine beliebige Teilmenge F ⊆ X × Y des kartesischen Produkts zweier Mengen X und Y heißt Korrespondenz oder Zuordnung. Wenn einem Element x ∈ X durch eine Korrespondenz F höchstens ein Element y ∈ Y zugeordnet wird, spricht man von einer eindeutigen Korrespondenz. Diese Korrespondenzen werden als Abbildungen oder Funktionen bezeichnet. Die Grafik verdeutlicht das Wesen der Abbildung. Die Zuordnungen sind durch Pfeile symbolisiert. Von jedem Element der linken Menge geht höchstens ein Pfeil aus. Derartige Darstellungen werden Pfeildiagramm genannt. Die Abbildung der Menge A auf die Menge B ordnet jedem Element x aus A Elemente y aus B zu. Man nennt x die unabhängige Variable und y die abhängige Variable. Schreibweise: f: A → B A … Definitionsbereich, Definitionsmenge, Urbildmenge, Urbildbereich, Argumentbereich B … Bildmenge, Bildbereich, Wertebereich, Zielmenge x … Argument, Original, Urbild y … Wert von x, Bild von x Die Schreibweise f: A → B mit x ∈ A und y ∈ B kann auch in der Form (x,y) ∈ f angegeben werden, d.h. eine Abbildung ist als eine Menge geordneter Paare (x,y) interpretierbar. Die Abbildung f: A → B ist damit eine Teilmenge des Kreuzproduktes A x B (Kartesisches Produkt). Zwei Abbildungen f und g sind gleich, wenn ihre Definitionsbereiche gleich sind und für jedes Argument x auch f(x) = g(x) gilt. Während man zu jeder Korrespondenz F unmittelbar die Umkehrung F-1 bilden kann, muss die Umkehrung einer Abbildung f nicht unbedingt eindeutig sein und damit wieder eine Abbildung. Hinweis: Mitunter wird die Zuordnung als Abbildung bezeichnet und deren Eindeutigkeit nicht gefordert. Eine eindeutige Abbildung ist dann Funktion. Verkettung von Abbildungen Wenn zwei Korrespondenzen F ⊆ A × B und G ⊆ B × C gegeben sind, kann die Verkettung oder Hintereinanderausführung oder Komposition von F und G definiert werden. Man schreibt dafür G • F. Dabei ist zu beachten, dass F zuerst ausgeführt wird. Die Verkettung von Korrespondenzen ist assoziativ. Sind F, G und H Korrespondenzen, dann gilt (F • G) • H = F • (G • H) 236 Nachweis: Ist (a, d) ∈ (F • G) • H, dann existiert ein c mit (a, c) ∈ F • G und (c, d) ∈ H und weiter existiert ein b mit (a, b) ∈ F und (b, c) ∈ G. Damit ist aber (b, d) ∈ G • H und (a, d) ∈ F • (G • H), womit gezeigt ist, dass (F • G) • H ⊆ F • (G • H). Die andere Inklusion zeigt man analog. Für den Zusammenhang zwischen Umkehrung und Verkettung gilt (F • G)-1 = G-1 • F-1 -1 Nachweis: Sei (c, a) ∈ (F • G) dann ist (a, c) ∈ F • G und es gibt ein b mit (a, b) ∈ F und (b, c) ∈ G. Damit ist aber auch (b, a) ∈ F-1 und (c, b) ∈ G-1 und (c, a) ∈ G-1 • F-1. Entsprechend zeigt man die Umkehrung. Funktion f (eindeutige Abbildung aus D in Z) heißt injektiv ⇔ aus a ≠ b folgt f(a) ≠ f(b) surjektiv ⇔ Wertebereich = Zielmenge Z bijektiv ⇔ f ist injektiv und surjektiv Eineindeutige Abbildung Eine bijektive Abbildung ist eineindeutig, umkehrbar eindeutig, d.h. jedem Elemente aus D wird eindeutig ein Elemente aus B und diesem Element aus B eindeutig das Ausgangselement aus D zugewiesen. Inverse Abbildung Ist eine Abbildung injektiv und surjektiv, also eine eineindeutige Abbildung von A auf B, so gibt es eine inverse Abbildung, die jedem Element b aus B dasjenige Element von A zuordnet, dessen Bild b ist. Gleichheit von Abbildungen Zwei Abbildungen f: A → B und g: C → D heißen gleich ⇔ A=C und B=D und für alle x aus A gilt f(x) = g(x) Fixelement Erfüllt eine Element x ∈X bei einer Abbildung f: X → Y die Gleichung f(x) = x, so heißt x Fixelement von X bei der Abbildung f. Identische Abbildung Die Abbildung f: X → X, welches jedes Element x auf sich selbst abbildet, heißt identische Abbildung. Injektive Funktion Definition: Gegeben sei eine Funktion A → B. Eine injektive Funktion (Injektion) liegt vor, wenn jedes Element der Zielmenge B höchstens einmal als Bild (eines Elementes der Definitionsmenge) vorkommt. Für eine solche Funktion f ist deren Umkehrung f-1 wieder eindeutig. f nennt man eineindeutig oder umkehrbar eindeutig oder injektiv. Die Injektivität fordert nicht, dass alle Elemente aus B als Werte vorkommen müssen; dann wäre die Funktion surjektiv. Die Grafik verdeutlicht das Wesen der Injektivität. Zu keinem Wert aus B gehen zwei Pfeile; bei jedem Element von B endet höchstens ein Pfeil. Die Bezeichnung umkehrbar eindeutig drückt aus, dass die Umkehrung einer injektiven Funktion f wieder eine Funktion ist. Diese heißt Umkehrfunktion und wird mit f-1 bezeichnet. Wenn f nicht injektiv ist, muss die Umkehrung nicht eindeutig sein und damit keine Abbildung. In einer Koordinatendarstellung ist die Kurve entweder streng monoton steigend oder streng monoton fallend. Beispiele: Die Funktion f1(x) = x ist injektiv auf R. Die Funktion f2(x) = x² ist nicht injektiv auf R, denn jedem x wird der gleiche Funktionswert wie -x zugeordnet. Schränkt man den Definitionsbereich von f2 auf die nichtnegativen reellen Zahlen ein, so ist die Funktion auf diesem Intervall injektiv. Die Injektivität hängt damit vom Definitionsbereich der Funktion ab. Surjektive Funktion Definition: Gegeben sei eine Funktion A → B. Gehört jedes Element der Zielmenge B auch zur Wertemenge, so nennt man die Funktion surjektiv, d.h. wenn bei der Funktion die Bildmenge mit B zusammenfällt. Man spricht mitunter auch von einer Aufabbildung. Die Grafik verdeutlicht das Wesen der Surjektivität: Alle Werte aus B werden als Funktionswerte angenommen, was dadurch symbolisiert wird, dass sie von einem Pfeil erreicht werden; bei jedem Element von B endet mindestens ein Pfeil. 237 In einer Koordinatendarstellung kommt jedes Element von B als Bild vor. Beispiele: Die Funktion f1(x) = x ist surjektiv auf R. Die Funktion f2(x) = x² ist nicht surjektiv auf R, denn negative Zahlen werden nicht als Funktionswerte angenommen. Schränkt man den Wertebereich auf die nichtnegativen reellen Zahlen ein, so ist die Funktion auf diesem Intervall surjektiv. Bijektive Funktion Eine bijektive Funktion ist eine Funktion, die surjektiv und injektiv ist. Damit ist f eine eineindeutige Aufabbildung. Jedem Element aus A wird genau ein Element aus B zugeordnet und alle Elemente aus B kommen als Bilder vor. andere Bezeichnungen: Umkehrbare Funktion bzw. eineindeutige Funktion Unter den bijektiven Abbildungen einer Menge M auf sich gibt es eine ausgezeichnete Bijektion, die identische Abbildung f. f(a) = a. Die Hintereinanderausführung zweier Bijektionen ist wieder eine Bijektion; ebsono ist die Umkehrung einer Bijektion eine Bijektion. Ist f: A → B eine injektive Abbildung, dann ist die Einschränkung f: A → f(A) eine Bijektion, ebenso die Umkehrung f-1: f(A) → A. Im Fall der Abbildung einer endlichen Menge auf sich sind die Eigenschaften injektiv und bijektiv gleichwertig. Es gilt: Es sei f: A → A eine Abbildung einer endlichen Menge A auf sich. Dann sind die folgenden Aussagen paarweise äquivalent. f ist injektiv f ist surjektiv f ist bijektiv Konstante Abbildung Ist y ein festes Element von Y, dann ist X x {y} eine eindeutige Abbildung von X in Y, die jedem x ∈X dasselbe Element y zuordnet, sie wird konstante Abbildung genannt. Einschränkung einer Abbildung Ist A eine Teilmenge von X und F eine Abbildung von X in Y, so ist die Menge F ∩ (A x Y) eine Abbildung, die Einschränkung von F auf die Menge A. Schreibweise: F |A Abbildungen von Mengen Seien A, B Mengen und f: A → B eine Abbildung sowie A1, A2 ⊆ A und B1, B2 ⊆ B, dann gilt: B1 ⊆ B2 → f-1(B1) ⊆ f-1(B2) A1 ⊆ A2 → f(A1) ⊆ f(A2) f(A1 ∩ A2) ⊆ f(A1) ∩ f(A2) f(A1 ∪ A2) = f(A1) ∪ f(A2) f(A1 ∩ A2) = f(A1) ∩ f(A2) ⇔ f ist injektiv f1(f(A1)) ⊇ A1 ist f injektiv so gilt f-1(f(A1)) = A1 f1(f(B1)) ⊆ B1 ist f surjektiv so gilt f-1(f(B1)) = B1 f-1(B \ B1) = A \ f-1(B1) Verkettung von Abbildungen Das Hintereinanderausführen von mehreren Abbildungen ist eine Verkettung von Abbildungen. Gilt f: A → B und g: B → C, so existiert eine Abbildung (Verkettung g°f von f und g) mit g°f: A → C mit (g°f)(x) = g[f(x)] Es gilt: h°(g°f) = (h°g)°f ... assoziativ Es seien f: X → Y, g: Y → Z, h: Z → W Abbildungen zwischen nichtleeren Mengen X, Y, Z, W. Dann gilt h • (g • f) = (h • g) • f ; Assoziativität der Hintereinanderausführung Sind f und g beide injektiv, so auch g • f. Sind beide surjektiv, so auch g • f. Ist g • f injektiv, so ist f injektiv Ist g • f surjektiv, so ist g surjektiv Satz von Schröder-Bernstein Bei Untersuchungen zur Gleichmächtigkeit von Mengen ist es oft einfacher injektive Abbildungen zwischen den Mengen zu finden als Bijektionen. Dabei hilft der Satz von Schröder-Bernstein weiter, der aus der Injektiviität zweier Mengen untereinander die Bijektivität folgert. Mit dem Hilfssatz Sei f: A → B eine injektive Abbildung und B ⊆ A, dann lassen sich A und B bijektiv aufeinander abbilden. kann bewiesen werden Satz von Schröder-Bernstein Seien A und B zwei Mengen und f: A → B sowie g: B → A zwei injektive Abbildungen. Dann existiert eine Bijektion h zwischen den Mengen A und B; insbesondere sind sie dann gleichmächtig. Hüllen Sei M eine Menge. Eine Abbildung H: P(M) → P(M) (P … Potenzmenge) heißt genau dann Hüllenoperator, wenn für alle A, B ⊆ M folgende Eigenschaften gelten: 238 A ⊆ H(A) ; Extensivität A ⊆ B ⇒ H(A) ⊆ H(B) ; Monotonie H(H(A)) = H(A) ; Idempotenz Beispiele: In einem Vektorraum V ist die lineare Hülle ein Hüllenoperator. Die abgeschlossene Hülle in einem metrischen Raum ist ein Hüllenoperator. Algebraische Verknüpfung, Operation A, B, M seien nicht leere Mengen. Jede Abbildung (A × B) → M, bei der jedem geordneten Paar (a,b) ∈ (A × B) ein Bild (a • b) ∈ M zugeordnet ist, heißt algebraische Verknüpfung oder Operation. Innere Verknüpfung ... (M × M) → M Äußere Verknüpfung 1.Art ... (A × M) → M Äußere Verknüpfung 2.Art ... (A × A) → M Abgeschlossenheit einer Verknüpfung Die Tatsache, dass eine Verknüpfung auf einer Menge G abgeschlossen ist, entspricht einer innerer Verknüpfung in der Menge G: G × G → G Algebraische Struktur ... ist eine nicht leere Menge mit mindestens einer inneren Verknüpfung (M , •): (a,b) → (a • b), mit a,b,a•b ∈ M M ... Trägermenge, (M , •) mit genau einer Operation heißt Gruppoid Abbildung algebraischer Strukturen (A , •1), (B , •2) seien algebraische Strukturen mit den Operationen •1 und •2 Die Abbildung f: mit a ∈ A und f(a) = a' ∈ B heißt Homomorphismus, wenn für alle a,b ∈ A gilt: f( a •1 b) = f(a) •2 f(b) = a' •2 b' Die Strukturen heißen zueinander homomorph, d.h. strukturverträglich. Ist h: G1 --> G2 ein Gruppenhomomorphismus, so wird die Menge ker h aller Elemente von G1, die auf das neutrale Element von G2 abgebildet werden, Kern von h genannt. Der Kern von h erweist sich als Normalteiler von G1. Isomorphismus ... wenn f ein bijektiver Homomorphismus ist. Die Strukturen heißen zueinander isomorph (strukturgleichwertig). Es gilt ker f = E. Automorphismus ... Ist ein Isomorphismus, von der Form f: G → G. Homomorphismus, Beispiele Sei R* = R \ {0} und (R*, ·) die multiplikative Gruppe der reellen Zahlen. Die Exponentialfunktion f(x) = ex ist ein Homomorphismus der additiven Gruppe der reellen Zahlen in die multiplikative Gruppe der positiven reellen Zahlen. Es gilt: f(a + b) = ea + b = ea eb = f(a) f(b) Sei sgn: R → R die Signumfunktion wie folgt definiert: sgn(x) = 1 für x > 0 ; = 0 für x = 0 ; = -1 für x < 0 Dann ist sgn ein Homomorphismus von der multiplikativen Gruppe R in die multiplikative Gruppe {+1, 1}. Dieser Homomorphismus spiegelt gerade die Regeln für die Multiplikation vorzeichenbehafteter Zahlen wider. Der Kern dieses Homomorphismus ist die multiplikative Gruppe der positiven reellen Zahlen. In der multiplikativen Gruppe der reellen Zahlen ist f(x) = 1/x ein Homomorphismus. Es gilt: f(a·b) = 1 / (a·b) = 1/a · 1/b = f(a) · f(b) Da die Abbildung bijektiv ist, handelt es sich sogar um einen Isomorphismus. Neutrales Element bei Homomorphismus Es seien G und H zwei Gruppen, eG und eH die neutralen Elemente in G und H und f: G → H ein Homomorphismus. Dann gilt: f(eG) = eH f(a-1) = f(a)-1 für alle a ∈ G Homomorphismen überführen neutrale Elemente in neutrale Elemente und inverse Elemente in inverse. Kern eines Homomorphismus Ist h: G1 → G2 ein Gruppenhomomorphismus, so wird die Menge ker h aller Elemente von G1, die auf das neutrale Element von G2 abgebildet werden, Kern von h genannt. Der Kern von h erweist sich als Normalteiler von G1. Das Bild von f im(f) ist die Menge aller in G2 vorkommenden Bilder und wird Bild des Homomorphismus genannt. im(f) ist Untergruppe von G2. Kanonische Homomorphismen von Normalteilern Sei G eine Gruppe und H Normalteiler in G. Dann existiert ein Homomorphismus f: G → G/H mit ker(f) = H Dieser Homomorphismus wird kanonischer Homomorphismus genannt und ist durch f(g) = gH gegeben. 239 Nachweis: f ordnet jedem Gruppenelement seine Linksnebenklasse zu. Außerdem ist G/H eine Gruppe. Die Homomorphie von f ergibt sich einfach auch der Definition. Bleibt zu zeigen ker(f) = H. Dazu kann man folgende Äquivalenzkette aufbauen: h ∈ H ⇒ hH = H ⇒ f(H) = H ⇒ h ∈ ker(f) Automorphismengruppe Die Menge der Automorphismen einer Gruppe G wird mit aut(G) bezeichnet. Die Automorphismen einer Gruppe aut(G) bilden bezüglich der Hintereinanderausführung von Abbildungen eine Gruppe, die so genannte Automorphismengruppe. Isomorphie Es seien (G, ·) und (G', ·) zwei Gruppen. Diese heißen isomorph genau dann, wenn es eine Abbildung f: G → G' mit folgenden Eigenschaften gibt: f ist bijektiv, also eine eineindeutige Aufabbildung f lässt das Produkt invariant: ∀a, b ∈ G: f(a·b) = f(a)·f(b) Ein Isomorphismus ist ein bijektiver Homomorphismus. Durch den Begriff der Isomorphie kann man Eigenschaften einer Gruppe auf eine andere übertragen, ohne sie im Einzelnen beweisen zu müssen. In isomorphen Gruppen gelten die gleichen Eigenschaften. Die Isomorphie legt damit Gestaltgleichheit fest. Beispiele: Die Restklassengruppe Zn ist isomorph zur zyklischen Gruppe Cn. Den Isomorphismus erhält man, wenn man logarithmiert, d.h. die Exponenten aus Cn als die Zahlen aus Zn auffasst. Einfach zu sehen ist, dass die zyklische Gruppe C4 nicht isomorph zur Kleinschen Vierergruppe D2 ist. Letzte enthält Elemente a ≠ 1, für die gilt a·a = 1, was für kein von 1 verschiedenes Element der zyklischen Gruppe gilt. Wenn f ein Isomorphismus von G auf G', dann ist die Umkehrabbildung f-1: G' → G ebenfalls ein Isomorphismus. Algebra (Struktur) ... mathematische Struktur, die den Vektorraum- und den Ringeigenschaften genügt. Beispiel: Die Menge der n x n-Matrizen mit der gewöhnlichen Matrizenaddition und -multiplikation ist eine Algebra. Arten algebraischer Strukturen Zusammenstellung verschiedener algebraischer Strukturen: Magma (G,*) eine Menge mit einer zweistelligen Verknüpfung * Quasigruppe (G,*) ein Gruppoid in dem die Division stets eindeutig möglich ist Loop (G,*,1) eine Quasigruppe mit einem neutralen Element Halbgruppe (G,*) ein assoziatives Gruppoid Monoid (G,*,1) eine Halbgruppe mit einem neutralen Element 1 Gruppe (G,*,1,-1) ein Monoid mit einem inversen Element a-1 für jedes a, oder äquivalent dazu, eine assoziative Loop Abelsche Gruppe (G,+,0,-) eine kommutative Gruppe Ring (R,+,0,-,·) eine Menge R mit zwei Verknüpfungen + (Addition) und · (Multiplikation), so dass (R,+,0,-) eine Abelsche Gruppe, (R,·) eine Halbgruppe ist und die Distributivgesetze erfüllt sind Unitärer Ring (R,+,0,-,·,1) ein Ring mit neutralem Element 1 für die Multiplikation Körper (R,+,0,-,·,1,-1) ein Ring, so dass (R\{0},·,1,-1) eine Abelsche Gruppe ist Modul (M,+,0,-,·,R) über einem Ring R, Eine Menge M mit einer inneren Verknüpfung + und einer äußeren Verknüpfung ·: R×M → M (Skalarmultiplikation), so dass (M,+,0,-) eine Abelsche Gruppe ist, die Skalarmultiplikation assoziativ ist und die Distributivgesetze erfüllt sind Vektorraum (V,+,0,-,·,K) ein Modul über einem Körper K Algebra (V,+,0,-,·,*,K) Ein Vektorraum mit einer bilinearen Verknüpfung * ("Vektormultiplikation"), die die Distributivgesetze erfüllt und assoziativ mit der Skalarmultiplikation ist Assoziative Algebra eine K-Algebra, deren Multiplikation assoziativ ist Kommutative Algebra eine assoziative K-Algebra, deren Multiplikation kommutativ ist algebraischer Verband (V,∩,∪) eine Menge mit zwei kommutativen, assoziativen, idempotenten Verknüpfungen (Durchschnitt und Vereinigung), die Absorptionsgesetze erfüllen Boolescher Verband (V,∩,∪,0,1,¬) ein Verband mit neutralen Elementen 0 und 1 für ∩ und ∪, der zwei Distributivgesetze erfüllt und Komplemente ¬a hat Menge, eine algebraische Struktur ohne Verknüpfungen Strukturen mit einer Verknüpfung Die algebraischen Strukturen besitzen ein oder zwei zweistellige innere Verknüpfungen auf einer Menge M. Betrachtet werden folgende Axiom: (E) Existenz und Eindeutigkeit: 240 ∀ a,b ∈ M: a • b ∈ M (A) Assoziativgesetz: (N) Existenz eines neutralen Elements (I) Existenz des inversen Elements: (K) Kommutativgesetz: ∀ a,b,c ∈ M: (a • b) • c = a • (b • c) ∃ e ∈ M: ∀ a ∈ M: a • e = e • a = a ∀ a ∈ M: ∃ a-1 ∈ M: a • a-1 = a-1 • a = e ∀ a,b ∈ M: a • b = b • a Die folgenden Strukturen mit einer zweistelligen inneren Verknüpfung erfüllen folgende Axiome Magma auch Gruppoid Axiom E: Menge mit zweistelliger innerer Verknüpfung Halbgruppe Axiome EA: Gruppoid mit Assoziativgesetz Monoid: Axiome EAN: Halbgruppe mit einem neutralen Element e Quasigruppe auch Semigruppe: Axiome EI: Magma mit Inversen Loop: Axiome ENI: Quasigruppe mit neutralem Element Gruppe: Axiome EANI: Monoid und Quasigruppe Abelsche Gruppe: Axiome EANIK: Gruppe mit kommutativer Verknüpfung Gruppoid Unter einem Gruppoid oder einem Magma (G,*) versteht man eine nichtleere Menge G, auf der eine (zweistellige) (innere) Verknüpfung * definiert ist, d.h. je zwei Elementen a und b aus G ist ein drittes Element a*b aus G zugeordnet. Dabei nennt man * meistens eine Multiplikation auf G und a*b das Produkt des linken Faktors a und des rechten Faktors b. In vielen Anwendungsfällen ist jedoch auch die additive Schreibweise üblich: Man schreibt + für das Verknüpfungssymbol und nennt sie Addition auf G und a+b dann die Summe der Summanden a und b. Eigenschaften Eine innere Verknüpfung * auf G bzw. das Gruppoid (G,*) heißt kommutativ, wenn für alle a und b aus G gilt: (1) a*b = b*a Hat man (2) a*a = a für ein a aus G, so nennt man dieses Element idempotent. Man bezeichnet mit E(G) die Menge aller idempotenten Elemente von (G,*) und nennt * bzw. (G,*) idempotent, falls E(G) = G gilt. Ordnung eines Gruppoids Unter der Ordnung eines Gruppoids (G,*) versteht man die Anzahl |G| der Elemente von G. Speziell für Gruppoide (G,*) kleiner Ordnungen beschreibt man die Verknüpfung * oft mit Hilfe einer Verknüpfungstafel. Neutrales Element Ein neutrales Element e eines Gruppoids (G,*) wird durch die Forderung (3) e*a = a = a*e für alle a aus G charakterisiert. Gilt wenigstens immer die linke Gleichung in (3), so nennt man e linksneutral, und entsprechend rechtsneutral, wenn wenigstens die rechte Gleichung in (3) für alle a aus G erfüllt ist. In jedem dieser Fälle ist e idempotent. Außerdem ist ein neutrales Element immer eindeutig bestimmt, denn ist e1 auch nur ein linksneutrales und e2 ein rechtsneutrales Element desselben Gruppoids (G,*), so muss ihr Produkt e1*e2 sowohl mit e2 als auch mit e1 übereinstimmen. Bei multiplikativer Schreibweise nennt man ein neutrales Element auch ein Einselement und schreibt dafür oft 1, bei additiver Bezeichnung spricht man dagegen von einer Null und benutzt das Symbol 0 oder o. Komplexprodukt Sind U und V beliebige Teilmengen eines Gruppoids (G,*), so heißt die Teilmenge U*V = { u*v | u aus U und v aus V } von G das Komplexprodukt von U und V. Natürlich ist U*V genau dann leer, wenn mindestens eine der Mengen U oder V leer ist. Für einelementige Teilmenge U = { u } oder V = { v } schreibt man einfach u*V anstelle von { u }*V und U*v anstelle von U*{ v }. Damit wird die Potenzmenge P(G) zu einem Gruppoid (P(G),*), das die leere Menge als absorbierendes Element besitzt. Weiterhin ist (P(G),*) genau dann assoziativ bzw. kommutativ, wenn (G,*) die entsprechende Eigenschaft hat. Halbgruppe Eine algebraische Struktur (G, •) heißt Halbgruppe, wenn gilt: 1. Assoziativgesetz für alle a,b,c aus G: (a • b) • c = a • (b • c) Eine idempotente Halbgruppe heißt auch ein Band, eine kommutative und idempotente Halbgruppe ein Halbverband. Ein Element e einer Halbgruppe (G,•) ist genau dann linksneutral, wenn es idempotent und linkskürzbar ist. Ist nämlich e = e • e linkskürzbar, so folgt aus e •(e • a) = (e • e) • a = e • a bereits e • a = a für alle a aus G. Umgekehrt ist ein linksneutrales Element in jedem Gruppoid linkskürzbar und idempotent. Ein Monoid ist eine Halbgruppe mit einem Einselement, dabei fallen links- und rechtsneutrales Element zusammen. 241 Sei M ein Monoid mit dem neutralen Element 1 und a ∈ M. Ein b ∈ M heißt rechtsinvers zu a falls ab = e; analog heißt c ∈ M linksinvers zu a falls ca = 1. Ist b ∈ M rechtsinvers und c ∈ M linksinvers zu a, so ist b = c. Ist a invertierbar, so schreibt man für das Inverse a-1. Sind a, b ∈ M invertierbar, so gilt (a-1)-1 = a (ab)-1 = b-1 a-1 Beispiele: Sind N die natürlichen Zahlen einschließlich der Null, so ist (N, +) ein Monoid und (N\{0}, +) ist eine Halbgruppe. (N\{0}, •) ist ein Monoid. Die Menge der ganzen Zahlen mit der Addition (Z, +, 0) ist ein Monoid. (Z, - 0) ist kein Monoid, da die Subtraktion nicht assoziativ ist. Der dreidimensionale euklidische Raum mit dem Vektorprodukt (R³, ×, 0→) ist kein Monoid, da das Assoziativgesetz verletzt ist. Die Menge der Vielfachen einer ganzen Zahl n (nZ, + 0) ist ein Monoid. Die Menge der nichtnegativen rationalen Zahlen mit der Addition (Q+, +, 0) ist ebenso wie die Menge der positiven rationalen Zahlen mit der Multiplikation ein Monoid. Die Potenzmenge einer Menge X mit dem Durchschnitt ist ein kommutatives Monoid. Es sei (H, •) eine Halbgruppe. Dann gilt: (1) H besitzt höchstens ein Einselement und höchstens ein Nullelement. (2) Hat H ein Einselement e und ist h ∈ H invertierbar, so ist das zu h inverse Element h' eindeutig bestimmt. Nachweis (1): Angenommen, e und e' sind Einselemente von H. Dann gilt e • e' = e' • e = e' wegen der Eigenschaft von e und e • e' = e' • e = e wegen der Eigenschaft von e'. Also e = e'. Analog folgt, dass es höchstens ein Nullelement gibt. (2): Seien h' und h" inverse Elemente zu h. Dann gilt h' = e • h' = (h" • h) • h' = h" • (h • h') = h" • e = h". Unterhalbgruppe Es sei (H, •) eine Halbgruppe und H' ⊆ H. Dann heißt H' Unterhalbgruppe von H, wenn (H', •) Halbgruppe ist. Abschluss Definition: Es sei (H, •) eine algebraische Struktur mit nur einer inneren Verknüpfung und H' ⊆ H. Unter dem Abschluss <H'> von H' versteht man die Menge aller möglichen endlichen Produkte von Elementen aus H', d.h. <H'> := {a1 • a2 • ... ar | r ∈ N ∧ {a1, a2, ..., ar} ⊆ H'}. Falls (H, •) Halbgruppe, so ist <H'> die kleinste Unterhalbgruppe von H, die H' enthält. Definitionen: Es sei (H, •) eine algebraische Struktur und H' ⊆ H. Man sagt H' erzeugt H :⇔ <H'> = H H ist endlich erzeugt :⇔ ∃H': <H'> = H ∧ H' endlich. Es sei (H, •) eine algebraische Struktur und <E> = H. Gilt für beliebige x und z aus H und beliebiges e aus E stets x • (e • z) = (x • e) • z, so ist (H, •) eine Halbgruppe. Gruppe, algebraische Gruppe Eine algebraische Struktur (G, •) heißt Gruppe, wenn G nicht leere Menge ist und es gilt: 1. Zusammensetzungsvorschrift jedem Elementepaar a, b aus G wird ein drittes Element a • b derselben Menge eindeutig zugeordnet, welches meist Produkt von a und b genannt wird 2. Assoziativgesetz für alle a, b, c aus G: (a • b) • c = a • (b • c) 3. Neutrales Element in G existiert ein neutrales Element e, so dass für alle a aus G gilt: a • e = e • a = a 4. Inverses Element Zu jedem a aus G existiert ein a' in G, so dass a • a' = a' • a = e 3* linksseitiges Einselement es genügt statt 3. nur die Existenz eines linksseitigen Einselementes zu fordern, d.h. es existiert ein e in G mit e • a = a 4* linksseitiges Inverses ebenso genügt es nur die Existenz eines linksseitigen Inversen zu fordern, d.h. a' • a = e Satz: Für alle a, b aus G existieren stets x, y in G mit a • x = b und y • a = b Bei jeder Gruppe handelt es sich um ein Monoid, in dem jedes Element ein Inverses besitzt. Wie für jedes Monoid ist daher das Einselement einer Gruppe auch eindeutig bestimmt. Das zu jedem a aus G 242 existierende inverse Element ist ebenfalls eindeutig bestimmt, denn sind a1-1 und a2-1 beide invers zu a, so folgt aus der Assoziativität ihre Gleichheit gemäß a1-1 = a1-1 • e = a1-1 • (a • a2-1) = (a1-1 • a) • a2-1 = e • a2-1 = a2-1 Sind a und b beliebige Elemente einer Gruppe (G,•), so sind die beiden Gleichungen x • a = b und a • y = b durch die Elemente x = b • a-1 und y = a-1 • b (eindeutig) lösbar. Additive Gruppe Bei dem Gruppenbegriff ist die Bezeichnung der Operation a • b ohne Bedeutung, d.h. die Operation kann auch eine Addition sein. Eine Gruppe, die eine Addition als Operation beinhaltet, wird additive Gruppe oder Modul genannt. Das Einselement wird nun Nullelement genannt. Gruppe (2) Man kann Gruppen als solche Halbgruppen charakterisieren, in denen jede Gleichung der Form x • a = b und a • y = b wenigstens eine Lösung besitzt: Ist nämlich a ein beliebiges Element aus G, so gibt es ein e aus G, das e • a = a erfüllt. Weiterhin existiert zu jedem b aus G ein y aus G mit a • y = b. Hieraus folgt e • b = e • a • y = a • y = b, d.h., dass e ein Linkseinselement von (G,•) ist. Weiterhin existiert wegen (5) zu jedem a aus G ein a' aus G mit a' • a = e für dieses Linkseinselement. Aus dieser Eigenschaft lässt sich aber nun die Gruppeneigenschaft der Halbgruppe (G,•) zeigen. Zunächst folgt a' • a • a' = e • a' = a' und die Existenz von a'' aus G mit a'' • a' = e. Dies impliziert a • a' = e • a • a' = a'' • a' • a • a' = a'' • a' = e und a = e • a = a • a' • a = a • e. Dies zeigt, dass e sogar zweiseitiges Einselement von (G,•) ist und a' zweiseitiges Inverses von a. Damit ist (G,•) Gruppe. Die allgemeine Lösbarkeit von nur einer der beiden Gleichungen (5) führt dagegen jeweils auf eine größere Klasse von Halbgruppen. Morphismus (Gruppenmorphismus) Eine Abbildung f: G → F, a → f(a) heißt Morphismus, wenn f(ab) = f(a) f(b) für alle a,b ∈ G gilt. Kern des Morphismus Es sei f: G → F ein Morphismus, r das Einselement von G und e' das Einselement von F. Alle Elemente von G, die auf das Einselement von F abbilden, gehören zum Kern des Morphismus f. D.h. ker f := {x ∈ G: f(x) = e'} Abelsche Gruppe Eine Gruppe heißt kommutativ oder Abelsche Gruppe, wenn 4. Kommutativgesetz: für alle a,b aus G: a o b = b o a gilt. Beispiele: Die Menge der ganzen Zahlen mit der gewöhnlichen Addition ist eine Abelsche Gruppe. Die Menge der Drehungen im dreidimensionalen Raum mit der Nacheinanderausführung als Verknüpfung der Elemente ist eine nichtkommutative Gruppe. Die Tabelle enthält die Anzahl der Abelschen Gruppen A und aller endlichen Gruppen N einer Ordnung h. h 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 N 1 1 1 2 1 2 1 5 2 2 1 5 1 2 1 14 1 5 1 5 A 1 1 1 2 1 1 1 3 2 1 1 2 1 1 1 5 1 2 1 2 h 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 N 1 5 1 15 2 13 2 2 1 13 1 2 4 267 1 4 1 5 1 4 A 1 2 1 3 1 3 1 1 1 2 1 1 2 11 1 1 1 2 1 1 h 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 N 1 4 1 14 2 2 1 45 1 6 2 43 1 6 1 5 4 2 1 47 A 1 1 1 3 1 1 1 6 1 1 1 5 1 1 1 2 2 1 1 3 h 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 N 1 12 2 4 2 18 1 2 1 238 1 55 1 5 2 2 1 57 2 4 A 1 3 2 1 1 2 1 1 1 7 1 5 1 2 1 1 1 3 2 1 243 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 2 2 1 15 2 2 5 4 1 4 1 51 1 2 1 14 1 2 2 14 1 6 1 4 2 2 1 52 2 2 1 1 1 3 2 1 3 2 1 1 1 7 1 1 1 4 1 1 1 3 1 1 1 2 2 1 1 5 2 2 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 1 50 1 2 3 4 1 6 1 52 15 2 1 15 1 2 1 12 1 10 1 4 2 2 1 230 1 5 2 16 1 6 1 1 2 2 1 1 1 5 5 1 1 2 1 1 1 3 1 2 1 2 1 1 1 7 1 2 2 4 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 2 2 1 4 5 16 1 2328 2 4 1 10 1 2 5 15 1 4 1 11 1 2 1 197 1 2 6 5 1 13 2 1 1 2 3 2 1 15 1 1 1 2 1 1 3 3 1 1 1 2 1 1 1 1 1 1 2 2 1 2 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 5 4 1 4 2 42 1 2 1 37 1 4 2 12 1 6 1 4 13 4 1 1543 1 2 2 17 1 10 1 52 2 2 1 1 2 5 1 1 1 4 1 1 1 3 1 1 1 2 3 1 1 11 1 1 1 4 1 2 1 6 Die Anzahl A(n) der nicht isomorphen abelschen Gruppen der Ordnung n kann nach folgendem Verfahren berechnet werden. Wenn n = ∏i piαi die Primfaktorzerlegung mit paarweise verschiedenen Primfaktoren pi ist, so gilt für die Anzahl A(n) = ∏i P(αi) wobei P(αi) die Anzahl der Partitionen der P(αi) ist. Beispiel: Für die Anzahl A(n) der abelschen Gruppen der Ordnung 1008 wird n = 24 3² 7 αi = 4, 2, 1 P(αi) = 5, 2, 1 und somit A(35280) = 5 * 2 * 1 = 10, d.h. 10 nichtisomorphe abelsche Gruppen der Ordnung 1008. Die kleinsten Ordnungen n, für welche A(n) = 1, 2, 3, ... nichtisomorphe abelsche Gruppen existieren, sind damit 1, 4, 8, 36, 16, 72, 32, 900, 216, 144, 64, 1800, 0, 288, 128, ... Dabei bedeutet die 0 für A(n) = 13, dass für keine Ordnung n existiert, für die es genau 13 verschiedenen nichtisomorphe abelsche Gruppen existieren. Außer der 13 gibt es für A(n) = 13, 17, 19, 23, 26, 29, 31, 34, 37, 38, 39, 41, 43, 46, ... keine Ordnungen n. Die Folge der wachsenden Werte A(n) ist 1, 2, 3, 5, 7, 11, 15, 22, 30, 42, 56, 77, 101, ... Diese Anzahl abelscher Gruppen tritt erstmals für die wachsenden Ordnungen n = 1, 4, 8, 16, 32, 64, 128, 256, 512, 1024, ..., also die Zweierpotenzen auf. Zerlegungssatz von Kronecker: Jede endliche abelsche Gruppe kann als das direkte Produkt von zyklischen Gruppen mit Primzahlpotenzordnung erzeugt werden. Ist die Ordnung der endlichen Gruppe eine Primzahl p, so existiert damit genau eine abelsche Gruppe der Ordnung p, konkret der Restklassengruppe Zp. Eine nichtabelsche Gruppe der Ordnung p gibt es dann nicht. Ist die Ordnung ein Primzahlquadrat p², so existieren zwei abelsche Gruppen Zp² und Zp ⊗ Zp. Ist die Ordnung ein Primzahlkubus p³, so existieren drei abelsche Gruppen Zp³, Zp ⊗ Zp² und Zp ⊗ Zp ⊗ Zp. Zusätzlich gibt es hier noch 2 nichtabelsche Gruppen. Ist die Ordnung das Produkt pq zweier Primzahlen, so findet man genau eine abelsche Gruppe Zp ⊗ Zq, aber keine nichtabelsche Gruppe. Überraschend ist die von Srinivasan (1973) gefundene; und noch nicht verstandene; Beziehung der Anzahl A(n) der abelschen Gruppen der Ordnung n mit der Riemannschen Zetafunktion ζ(s): Σ A(n) n-s = ζ(s) ζ(2s) ζ(3s) ..., Summenbildung n = 1, ..., ∞ Gruppentheorie - Begriffe Innerhalb der Gruppentheorie werden spezielle Fachbegriffe genutzt. Eine unvollständige Auswahl ist: abelsch 244 Abelsch heißt eine Gruppe (G,⊗), wenn die Verknüpfung ⊗ kommutativ ist, also g⊗h = h⊗g für alle g, h ∈ G. Benannt nach Niels Henrik Abel. allgemeine lineare Gruppe GL(n,F) vom Grad n über einem Körper F Menge aller invertierbaren n×n-Matrizen mit Koeffizienten aus F und mit der Matrixmultiplikation als Gruppenverknüpfung. alternierende Gruppe Menge aller geraden Permutationen einer Menge von n Elementen; für n>2 eine nicht-triviale Untergruppe der symmetrischen Gruppe. Darstellung einer Gruppe vom Grad n Ein Homomorphismus von einer Gruppe auf eine allgemeine lineare Gruppe GL(n,..) mit der Absicht, eine abstrakte Gruppe durch invertierbare Matrizen darzustellen. Die Darstellungstheorie ist ein umfangreiches Unterkapitel der Gruppentheorie. direktes Produkt (bei abelschen Gruppen auch direkte Summe) zweier Gruppen G und H Eine Gruppe, deren Elemente Paare (g,h) mit g ∈ G und h ∈ H sind. einfache Gruppe Einfach heißt eine Gruppe, die nur {e} und sich selbst als Normalteiler enthält. Jede endliche Gruppe ist in gewisser Weise aus einfachen Gruppen zusammengesetzt. Die endlichen einfachen Gruppen sind abschließend klassifiziert. Einselement … das neutrale Element in einer Gruppe mit multiplikativ aufgefasster Verknüpfung. endlich … heißt eine Gruppe, wenn sie endlich viele Elemente enthält. Epimorphismus … heißt ein surjektiver Homomorphismus. Faktorgruppe, Quotientengruppe, Restklassengruppe Für eine Gruppe G und einen Normalteiler N von G ist die Faktorgruppe G/N die Menge der LinksNebengruppen {aN: a ∈ G} mit der Verknüpfung aN•bN = abN. Der Zusammenhang von Normalteilern, Homomorphismen und Faktorgruppen ist im Homomorphiesatz zusammengefasst. Grad einer Darstellung … Grad der allgemeinen linearen Gruppe, in die eine Darstellung abbildet Grad einer linearen Gruppe … die Zahl der Spalten oder Zeilen der quadratischen Matrizen, aus denen diese Gruppe besteht. Homomorphiesatz Verknüpft das Bild eines Gruppen-Homomorphismus mit der Faktorgruppe nach seinem Kern. Homomorphismus von Gruppen Eine Abbildung f: (G,·) → (H,×), die die Verknüpfungstafel erhält: f(a · b) = f(a) × f(b) für alle a und b aus G. Index einer Untergruppe … die Kardinalität der Menge der Rechts- oder Linksnebenklassen einer Untergruppe isomorph … heißen Gruppen, die durch einen Isomorphismus aufeinander abgebildet werden können. Isomorphe Gruppen können als bis auf die Benennung ihrer Elemente identisch angesehen werden. Isomorphismus von Gruppen … bijektiver, d.h. umkehrbarer Homomorphismus Kern eines Gruppen-Homomorphismus Die Teilmenge der Ausgangsgruppe, die auf das neutrale Element der Zielgruppe abgebildet wird. Jeder Normalteiler ist Kern eines Gruppen-Isomorphismus und umgekehrt. Linksnebenklassen Linksnebenklasse zu einem Gruppenelement g ∈ G und einer Untergruppe U von G: die Menge g·U, also die Menge aller n ∈ G, die sich als n = g·u mit u ∈ I schreiben lassen. Eine Linksnebenklasse, die zugleich Rechtsnebenklasse ist, ist Normalteiler. Monomorphismus heißt ein injektiver Homomorphismus. Normalteiler Normalteiler heißt eine Untergruppe N von G, wenn für alle n ∈ N und alle g ∈ G das konjugierte Element g-1ng in N liegt. Ein Normalteiler ist zugleich Rechts- und Links-Nebenklasse. Nullelement … das neutrale Element in einer Gruppe mit additiv aufgefasster Verknüpfung Ordnung einer endlichen Gruppe … die Anzahl ihrer Elemente 245 Ordnung eines Elements g einer Gruppe G Wenn existent, die kleinste Zahl m ∈ N+ für die gm = e. Die Ordnung einer endlichen Gruppe ist durch die Ordnung jeden Elements teilbar p-Gruppe … eine Gruppe mit der Eigenschaft: Die Ordnung eines jeden Elements ist eine Potenz der Primzahl p Permutationsgruppe … symmetrische Gruppe - oder auch deren Untergruppe, d.h. alternierende Gruppe Punktgruppe … Symmetriegruppe eines Körpers, insbesondere eines Moleküls Raumgruppe … Symmetriegruppe eines Kristalls spezielle lineare Gruppe SL(n,F) vom Grad n über einem Körper F Menge aller invertierbaren n×n-Matrizen mit der Determinante 1; Untergruppe der allgemeinen linearen Gruppe symmetrische Gruppe … besteht aus allen Permutationen einer Menge mit n Elementen, Gruppenverknüpfung ist die Verkettung der Permutationen Quelle http://de.wikipedia.org/wiki/Gruppentheorie-Glossar Lie-Gruppe Eine Lie-Gruppe ist eine Gruppe, die auch analytische reelle oder komplexe Mannigfaltigkeit ist, und deren Verknüpfung eine analytische Funktion ist. Typische Beispiele für Liesche Gruppen sind die allgemeine lineare Gruppe, die Gruppe der invertierbaren Matrizen mit der Matrizenmultiplikation als Verknüpfung und deren Untergruppen, zum Beispiel die Gruppe S(3) aller Drehungen im dreidimensionalen Raum. Der Euklidische Raum Rn mit der Vektoraddition als Gruppenoperation ist eine reelle Lie-Gruppe. Jede Lie-Gruppe ist eine topologische Gruppe. Man kann Lie-Gruppen auch nach ihren algebraischen, gruppentheoretischen Eigenschaften klassifizieren. 2007 gelang es nach fast fünf Jahren intensiver Forschung Mathematikern um Jeffrey Adams von der University of Maryland in College Park eine der komplexesten mathematischen Strukturen zu entschlüsseln, die Lie-Gruppe E8. Deren Elemente beschreiben die isomorphen Drehungen eines 57-dimensionalen geometrischen Objekts. Die Abbildung zeigt eine Veranschaulichung dieser Gruppe. Zyklische Gruppe Eine Gruppe G, die von genau einem Element p erzeugt wird: alle Elemente von G sind Potenzen von p. Endlicher Fall Zuerst nehmen wir an, die Gruppe sei endlich und ord(G) = n. Wenn n = 1 muss das erzeugende Element a mit dem neutralen Element e der Gruppe identisch sein. Nehmen wir jetzt n > 1 an. In G liegen dann die folgenden Elemente e = a0, a1, a2, …, an, an+1 , … Da G endlich ist, muss ak = al für gewisse k, l ∈ N. ObdA. gelte k > l, dann ist auf Grund der Potenzgesetze ak-l = e. Sei m die kleinste Zahl, für die am = e. Wenn i, j < m und i ≠ j, dann gilt ai ≠ aj. Damit bildet <a> = ({e, a, a², …, am-1}, ·) eine Untergruppe von G. Andererseits ist G als von a erzeugte Gruppe die kleinste Untergruppe, die G und damit <a> enthält. Es gilt also und folglich am = an = e. Unendlicher Fall Im Unendlichen Fall besteht die zyklische Gruppe C∞ aus den Elementen {… , a-n, …, a-2, a-1, e, a, a², …, an, …}. C∞ ist isomorph zur additiven Gruppe der ganzen Zahlen. Alle zyklischen Gruppen sind abelsche Gruppen. Weiter gilt: Sei G eine Gruppe mit ord(G) = p und p eine Primzahl, dann ist G zyklisch. Auflösbare Gruppen Eine Gruppe G heißt genau dann auflösbar, wenn es eine Folge G0 ⊆ G1 ⊆ … ⊆ Gn-1 ⊆ Gn = G von Untergruppen Gj in G gibt mit G0 = {e} und Gn = G, wobei für alle j gilt: Gj ist Normalteiler von Gj+1 und Gj+1/Gj ist kommutativ. Beispiele: 1) Jede kommutative Gruppe ist auflösbar. 2) Permutationsgruppen: Die kommutative Gruppe S2 ist auflösbar. 246 Die Gruppe S3 ist auflösbar, z.B. {e} ⊆ A3 ⊆ S3. Die Gruppe S4 ist auflösbar, z.B. {e} ⊆ K4 ⊆ A4 ⊆ S4. Man beachte ord(A3) = 3, ord(Sj/Aj) = 2 und ord(A4/K4) = 3. Da die Ordnungen Primzahlen sind, sind diese Gruppen zyklisch und kommutativ. 3) Die Gruppe Sn ist für n ≥ 5 nicht auflösbar. Der Grund liegt in der Einfachheit der Gruppe A5. Nach der Galoistheorie sind damit Gleichungen vom Grad ≥ 5 nicht durch geschlossene Formeln darstellbar sind. Quasigruppen, Loop Fordert man die eindeutige Lösbarkeit sämtlicher Gleichungen der Form x*a = b und a*y = b dagegen unter Verzicht auf die Assoziativität, so gelangt man zu speziellen Gruppoiden, den Quasigruppen. Besitzt solch eine Quasigruppe ein Einselement, so spricht man von einer Loop. Wie für jede algebraische Struktur bezeichnet man auch hier die Mächtigkeit | G | der Trägermenge G als Ordnung der Gruppe (Quasigruppe, Loop). Beispiele für Gruppen sind: Die additive Gruppe (Z,+) der ganzen Zahlen mit dem neutralen Element 0. Sie ist abelsch und von unendlicher Ordnung. Die additiven Gruppen (Q,+), (R,+) und (C,+) der Körper der rationalen, der reellen und der komplexen Zahlen sind ebenfalls abelsche Gruppen unendlicher Ordnung. Die multiplikativen Gruppen (Q\{0},*), (R\{0},*) und (C\{0},*) der Körper der rationalen, der reellen und der komplexen Zahlen sind ebenfalls abelsche Gruppen unendlicher Ordnung. Die Menge V der Vektoren eines Vektorraumes bildet bezüglich der Addition von Vektoren eine abelsche Gruppe (V,+). Insbesondere gehören hierzu die arithmetischen Vektorräume (Rn,+), die unendliche Ordnung besitzen. Die Menge T der Translationen, also der Parallelverschiebungen, eines Vektorraumes bildet bezüglich der Hintereinanderanwendung von Abbildungen eine abelsche Gruppe (T,o) Quasigruppen der Ordnung 3 Auf einer dreielementigen Menge G = {a, b, c} lassen sich die fünf Verknüpfungen durch ihre jeweiligen Cayley-Tafeln definieren. Jede von ihnen liefert eine Quasigruppe, denn jedes Element kommt in jeder Zeile und jeder Spalte genau einmal vor. Außerdem sind alle diese Quasigruppen nicht isomorph untereinander. Andererseits existieren genau 12 verschiedene Verknüpfungstafeln mit drei Elementen. Von diesen 12 Quasigruppen ist jede zu genau einer der angegebenen fünf isomorph. von oben nach unten: 1. zyklische (kommutative) Gruppe der Ordnung 3. Sie enthält genau ein idempotentes Element, hier a 2. diese Quasigruppe ist nicht kommutativ und hat ein Linkseinselement a, das kein Rechtseinselement ist 3. die Quasigruppe ist nicht kommutativ und hat ein Rechtseinselement a, das kein Linkseinselement ist 4. die Quasigruppe ist idempotent und kommutativ 5. die Quasigruppe enthält kein idempotentes Element und ist kommutativ Cayley-Tafeln Zur Definition einer Verknüpfung * auf einer kleinen endlichen Menge G benutzt man oft die Form einer Tabelle, eine Methode die auf Arthur Cayley zurückgeht, der sie erstmals bei der Beschreibung von Gruppen einsetzte. Daher werden diese Verknüpfungstafeln auch oft Cayley-Tafeln genannt. Dabei schreibt man die Elemente der Menge G in einer festen Reihenfolge als Kopfzeile und Kopfspalte einer quadratischen Tabelle und schreibt an den Schnittpunkt der mit dem Element a beschrifteten Zeile und der mit dem Element b beschrifteten Spalte dasjenige Element von G, das sich bei der Verknüpfung a*b ergeben soll. So kann man auf der Menge G = {e, a, b, c, d} die Verknüpfung * wie folgt definieren: Nun kann man beispielsweise aus dem Eintrag "b" in der mit "a" beschrifteten Zeile und der mit "c" beschrifteten Spalte ablesen, dass a*c = b gelten soll. Einige Eigenschaften der Verknüpfung * kann man leicht aus der Cayley-Tafel ablesen: Die Kommutativität zeigt sich an der Symmetrie der Tafel zur "Hauptdiagonalen", die von links oben nach rechts unten verläuft. Sie ist im obigen Beispiel nicht gegeben, da etwa a*c = b aber c*a = d gilt. Die Idempotenz eines Elementes zeigt sich an seinem Auftreten auf der Hauptdiagonalen an der durch das Element selbst bestimmten Zeile und/oder Spalte. Damit ist auch die Idempotenz der Verknüpfung einfach zu erkennen. Im angegebenen Beispiel ist nur das Element e idempotent. Ein neutrales Element macht sich dadurch bemerkbar, dass in "seiner" Zeile und "seiner" Spalte die Kopfzeile bzw. die Kopfspalte wiederholt wird. Dies ist im obigen Beispiel genau für das Element e der Fall. 247 Die Linkskürzbarkeit bzw. Rechtskürzbarkeit eines Elementes erkennt man daran, dass in seiner Zeile bzw. seiner Spalte jedes Element von G höchstens (und damit wegen der Endlichkeit von G genau) einmal auftritt. Sie ist im obigen Beispiel für alle Elemente gegeben und daher handelt es sich um eine Quasigruppe, wegen des neutralen Elementes also sogar um eine Loop. Light's-Assoziativtest Am schwierigsten zu prüfen ist die Assoziativität. Dies geschieht durch den folgenden Assoziativitätstest nach F. W. Light. Für jedes Element y von G ist zu prüfen, ob für alle x, z gilt : v(x,z) = x*(y*z) = (x*y)*z = v'(x,z), d.h., ob die beiden durch v und v' definierten Verknüpfungen auf G übereinstimmen. Man schreibt also im Prinzip für jedes y die Verknüpfungstafel für v(x,z)=x*(y*z) und für v'(x,z)=(x*y)*z nebeneinander und vergleicht sie anschließend. Zur Aufstellung der Tafel für v(x,z) muss einfach nur in der Tafel für * die Spalte des Elemente "z" durch die Spalte des Elementes "y*z" ersetzt werden. Zur Aufstellung der Tafel für v'(x,z) muss entsprechend nur in der Tafel für * die Zeile des Elemente "x" durch die Zeile des Elementes "x*y" ersetzt werden. Dabei kann man sich das explizite Hinschreiben der Tafel für v'(x,z) sparen und nur nachschauen, ob die hinzuschreibende Zeile für v'(x,z)schon in der betreffenden Zeile für v(x,z) steht. Ist dies einmal nicht der Fall, hat man die Assoziativität von * bereits widerlegt und auch ein Gegenbeispiel gefunden. In dem konkreten Beispiel von oben verläuft etwa der Test für y=a wie folgt: Man stellt die Tafel für v(x,z)=x*(a*z) auf, indem man als Kopfzeile die Zeile von "a" aus der Tafel für * nimmt. Dies sind die Spaltenindizes a*z. Die Kopfspalte lässt man zunächst noch leer! Nun schreibt man unter jedes Element der Kopfzeile die zugehörige Spalte aus der Tafel für *. Damit ist die Tafel bis auf die Kopfspalte ausgefüllt. In diese Kopfspalte schreibt man nun die Spalte von "a" aus der Tafel von *. Dies sind die Zeilenindizes x*a. Jetzt muss man prüfen, ob die Zeile hinter jedem Element der Kopfspalte die Zeile dieses Elementes aus der Tafel von * ist. Dies entspricht dem Vergleich mit der Tafel von v'(x,z)=(x*a)*z. In dem Beispiel stimmt dies erstmals nicht in der Zeile von e=(a*a) und der Spalte von d=(a*b). Dort steht ein c und es müsste ein b stehen. Man sieht also, dass (a*a)*b = e*b = b nicht gleich a*(a*b) = a*d = c ist und die Verknüpfung * daher nicht assoziativ. Es handelt sich also um eine echte Loop, die keine Gruppe ist. Natürlich leisten heutige Computerprogramme das Testen auf Assoziativität bedeutend schneller als dieser Test "per Hand". Untergruppe Gegeben sei eine Gruppe G und eine Menge G'. Das Gebilde (eine Menge und eine Verknüpfung) G' nennt man dann Untergruppe G' der Gruppe G, wenn das Gebilde G' folgende drei Bedingungen erfüllt: 1. G' liegt die gleiche Verknüpfung • zugrunde wie G 2. G' liegt eine nichtleere Teilmenge G' der Menge G zugrunde 3. Das Gebilde G' ist selbst wieder eine Gruppe Aus 3. ergeben sich die Forderungen: die Verknüpfung • muss auch in der Teilmenge G' abgeschlossen sein zu jedem Element g' der Teilmenge G' muss ein inverses Element existieren, welches wieder in G' liegt ist e das neutrale Element von G, dann ist e auch das neutrale Element von G'. Untergruppenkriterium Eine nichtleere Teilmenge H ⊆ G ist genau dann Untergruppe von G, wenn für zwei Elemente a, b ∈ H gilt a • b1 ∈ H Durchschnittssatz Der Durchschnitt beliebiger Untergruppen ist eine Untergruppe. Beispiele (Z, +) ist eine Untergruppe von (Q, +), die ihrerseits eine Untergruppe von (R, +) ist. (Zn, +mod n) ist für alle n eine Untergruppe von (Z, +). Betrachtet man alle durch 2 teilbaren Zahlen aus Z, so bilden diese bzgl. der Addition ein Gruppe, sind also Untergruppe von (Z, +). Analoges kann man für alle durch 3, 4, … teilbaren Zahlen feststellen. Wenn S(F) die Symmetriegruppe einer ebenen Figur ist, so bilden die Drehungen Rot(F) eine Untergruppe zu dieser. Die Spiegelungen bilden im Allgemeinen keine Untergruppe, da man sich schon an der Symmetriegruppe des Rechtecks klarmachen kann, dass die Hintereinanderausführung der Spiegelungen eine Drehung ergibt. Auch ist die Symmetriegruppe des Rechtecks eine Untergruppe der Symmetriegruppe des Quadrats. Erzeugte Untergruppen Sei (G, •) eine Gruppe und M ⊆ G eine nichtleere Teilmenge von G. Dann heißt <M> als Durchschnitt aller Untergruppen, die M enthalten, die von M erzeugte Untergruppe oder das Erzeugnis von M. 248 Diese Definition ist möglich, da der Durchschnitt einer beliebigen Familie von Untergruppen wieder eine Untergruppe ist. <M> ist die kleinste Untergruppe von G ist, die die Menge M umfasst. Wenn e das neutrale Element ist, ist <e> die triviale Untergruppe, die nur aus dem neutralen Element besteht. Weiterhin ist <G> = G, d.h. die ganze Gruppe erzeugt sich selbst. Vereinigung von Untergruppen Die Vereinigung zweier Untergruppen H1 und H2 muss nicht notwendigerweise wieder eine Untergruppe sein. Benutzt man jedoch die von H1 und H2 erzeugte Untergruppe <H1 ∪ H2>, so kann man auch für die Vereinigung von Untergruppen sinnvoll eine Untergruppe definieren. Komplexprodukt Seien A und B zwei nichtleere Teilmengen einer Gruppe G, dann definiert man das Komplexprodukt AB wie folgt: AB = {a • b | a ∈ A, b ∈ B} Das Komplexprodukt enthält damit alle Elemente aus G, die sich als Produkt von Elementen aus A und B darstellen lassen. Zyklische Untergruppen Die Gruppe G selbst und {e} sind Untergruppen von G, die trivialen Untergruppen. Außerdem bestimmt jedes Element a ∈ G eine Untergruppe, die von a erzeugte zyklische Untergruppe < a > = {…, a-2, a-1, e, a, a1, a², …} Ist die Gruppenoperation eine Addition, so schreibt man statt der Potenzen ak als Abkürzung für die kfache Verknüpfung von a mit sich selbst ganzzahlige Vielfache ka als Abkürzung für die k-fache Addition. < a > ist die kleinste Untergruppe von G die a enthält. Gilt < a > = G für ein Element a aus G so heißt G eine zyklische Gruppe. Es gibt endliche und unendliche zyklische Gruppen. Ist die Elementeanzahl einer endlichen Gruppe G eine Primzahl, so ist G stets zyklisch. Man kann den Begriff der zyklischen Gruppe wie folgt verallgemeinern: Ist M eine nichtleere Teilmenge einer Gruppe G, so wird mit <M> die Untergruppe von G bezeichnet, deren Elemente sich sämtlich als Produkt von endlich vielen Elementen aus M und deren Inversen schreiben lassen. Die Teilmenge M heißt dann Erzeugendensystem von <M>. Besteht M nur aus einem Element, dann ist <M> zyklisch. Zentrum einer Gruppe Unter dem Zentrum Cent(G) einer Gruppe G versteht man alle kommutierenden Elemente. Cent(G) = {g ∈ G | ∀a ∈ G: ag = ga} Das Zentrum einer abelschen Gruppe ist die Gruppe insgesamt, da in ihr alle Elemente kommutieren. Das Zentrum einer Gruppe G ist Normalteiler. Cent(G) ist eine kommutative Gruppe. Gruppenordnung, Links- und Rechtsnebenklassen In der Gruppentheorie wird die Elementenzahl einer endlichen Gruppe mit ord G bezeichnet. Ist die von einem Element a einer Gruppe erzeugte zyklische Untergruppe <a> endlich, so heißt deren Ordnung auch Ordnung des Elements a, d.h. ord <a> = ord a Ist U eine Untergruppe einer Gruppe (G, •) und a ∈ G, so heißen die Teilmengen aU = {a • u | u ∈ U} bzw. Ua = {u • a | u ∈ U} von G Linksnebenklassen bzw. Rechtsnebenklassen von U in G. Sei H eine Untergruppe von G, a, b ∈ G und e das neutrale Element. Dann gilt aH = bH ⇔ b-1a ∈ H ⇔ a-1b ∈ H eH = H a ∈ H ⇔ aH = Ha = H Entsprechende Aussagen lassen sich auch für Rechtsnebenklassen formulieren. Die Links- bzw. Rechtsnebenklassen bilden jeweils eine Zerlegung von G. Damit sind zwei Nebenklassen entweder disjunkt oder sie sind gleich und jedes Gruppenelement kommt in einer Nebenklasse vor. Je zwei Nebenklassen lassen sich bijektiv aufeinander abbilden und sind daher gleichmächtig. Alle Links- oder Rechtsnebenklassen einer Untergruppe U in einer Gruppe G haben die gleiche Anzahl von Elementen, nämlich ord U. Daraus ergibt sich, dass die Anzahl der Linksnebenklassen gleich der Anzahl der Rechtsnebenklassen ist. Diese Zahl wird Index von U in G genannt. Aus den genannten Fakten ergibt sich der Satz von Lagrange. Satz von Lagrange Die Ordnung einer Untergruppe ist stets Teiler der Gruppenordnung. Im allgemeinen ist es schwierig, alle Untergruppen einer Gruppe anzugeben. Im Falle endlicher Gruppen ist der Satz von Lagrange als notwendige Bedingung für die Existenz von Untergruppen hilfreich. Darstellungssatz von Cayley Zur Klassifikation von Gruppen gilt der Darstellungssatz von Cayley: 249 Jede Gruppe ist isomorph zu einer Gruppe von Permutationen. Für jede Gruppe (G; °) gibt es einen injektiven Gruppenhomomorphismus π: G → S(G) in die symmetrische Gruppe auf G, und dessen Bild ist eine zu G isomorphe Untergruppe der S(G). Für a ∈ G leistet π(a) := (g ∈ G → ag ∈ G) das Gewünschte. Normalteiler Es seien (G; °) eine Gruppe und N ≤ G eine Untergruppe. Man nennt N einen Normalteiler oder eine invariante Untergruppe von G, falls N unter Konjugationen mit Gruppenelementen invariant bleibt, ∀ g ∈ G: gNg-1 ⊆ N. In einer Abelschen Gruppe ist jede Untergruppe auch Normalteiler, in einer nicht-Abelschen Gruppe im Allgemeinen jedoch nicht. Eine Untergruppe vom Index 2 ist immer Normalteiler. Für n ∈ N bildet die Menge An aller geraden Permutationen einen Normalteiler von Sn. Äquivalente Bedingung für eine Untergruppe N, Normalteiler in G zu sein: ∀ g ∈ G: gN = Ng d.h. Linksnebenklasse = Rechtsnebenklasse. Insbesondere ist die Menge aller Linksnebenklassen gleich der Menge aller Rechtsnebenklassen. Diese Menge G/N = { gN | g ∈ G} ist für die Struktur von Gruppen und von Gruppenhomomorphismen besonders wichtig. Auf ihr lässt sich in natürlicher Weise eine Gruppenoperation definieren, gN ° hN = (gh)N womit G/N die Struktur einer Gruppe mit dem neutralen Element N erhält. Die Abbildung π: G → G/N mit π(g) = gN die jedem Gruppenelement seine Nebenklasse zuordnet, ist surjektiv und wird als kanonische Projektion bezeichnet. Einfache Gruppe Eine Gruppe G der Ordnung n wird einfache Gruppe genannt, wenn alle ihrer Normalteiler die Ordnung 1 oder n haben. Einfache Gruppen werden in vier Typen eingeteilt: zyklische Gruppen von Primzahlordnung alternierende Gruppen von mindestens Ordnung 5 endliche Liesche Gruppen vom Typ Chevalley endliche Liesche Drehgruppen der Ordnung 14, 52, 78, 133 und 248 sporadische Gruppen (26 Möglichkeiten) 1980 wurde mit dem Nachweis, dass es nur 26 sporadische Gruppen gibt, die Klassifikation der einfachen Gruppen vervollständigt. Sporadische Gruppe Während die ersten vier Arten einfacher Gruppen in Serien eingeteilt werden können, sind die sporadischen Gruppen isoliert. Bis 1965 waren nur fünf dieser Gruppen bekannt, die alle von dem französischen Mathematiker Mathieu zwischen 1861 und 1873 entdeckt wurden. Diese sehr speziellen Gebilde beschreiben Funktionen und kombinatorische Strukturen in 12- und 24-dimensionalen Räumen mit besonderen Symmetrieeigenschaften. Interessant ist, dass die Mathieu-Gruppen die Grundlage zur Konstruktion hocheffizienter Korrekturcodes sind. Die Ordnungen dieser Gruppen sind 7920, 95040, 443520, 10200960 und 244823040. 1965 wurde durch Janko die sechste sporadische Gruppe mit der Ordnung 175560 entdeckt. Mittlerweile kennt man alle möglichen 26 sporadischen Gruppen. Die mit der größten Ordnung von 246 · 320 · 59 · 76 · 11² · 13³ · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71 = 808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 · 109 = 8,08… · 1053 wird Monster-Gruppe genannt. Diese wurde 1982 von Robert Griess als Rotationsgruppe in einem 196883-dimensionalen Raum nachgewiesen. Liste siehe Liste der sporadischen Gruppen Gruppe Ordnung Mathieugruppe M11 7 920 Mathieugruppe M12 95 040 Mathieugruppe M22 443 520 Mathieugruppe M23 10 200 960 Mathieugruppe M24 244 823 040 Jankogruppe J1 175 560 Jankogruppe J2 604 800 Jankogruppe J3 50 232 960 Jankogruppe J4 86 775 571 046 077 562 880 Higman-Sims-Gruppe HS 44 352 000 Conwaygruppe Co1 4 157 776 806 543 360 000 250 Conwaygruppe Co2 42 305 421 312 000 Conwaygruppe Co3 495 766 656 000 Heldgruppe He 4 030 387 200 McLaughlin-Gruppe Mc 898 128 000 SuzukigruppeSuz 448 345 497 600 Fischergruppe F22 64 561 751 654 400 Fischergruppe F23 4 089 470 473 293 004 800 Fischergruppe F24 1 255 205 709 190 661 721 292 800 Lyonsgruppe Ly 51 765 179 004 000 000 Rudvalisgruppe Ru 145 926 144 000 Baby-Monstergruppe F2 4 154 781 481 226 426 191 177 580 544 000 000 O'Nan-Gruppe ON 460 815 505 920 Thompsongruppe F3 90 745 943 887 872 000 Harada-Norton-Gruppe F5 273 030 912 000 000 Monstergruppe F1 808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000 20 der 26 sporadischen Gruppen lassen sich als Untergruppen oder Quotientengruppen von Untergruppen der Monstergruppe auffassen. Die sechs Ausnahmegruppen sind die Jankogruppen J1, J3 und J4, die O'Nan-Gruppe, die Rudvalisgruppe und die Lyonsgruppe. Freie Halbgruppen Es sei A eine beliebige nichtleere Menge, die in diesem Zusammenhang auch Alphabet genannt wird und deren Elemente entsprechend Buchstaben heißen. Weiterhin bezeichne FA die Menge aller Worte, d.h. aller endlichen Sequenzen (a1,...,an) von Elementen ai aus A. Dabei ist auch das leere Wort als Sequenz der Länge 0 eingeschlossen. Für Worte (a1,...,an) und (b1,...,bm) definiert man als innere Verknüpfung die Konkatenation gemäß (a1,...,an)*(b1,...,bm) =(a1,...,an,b1,...,bm). Diese Verknüpfung ist assoziativ und das leere Wort ist neutrales Element. Also ist (FA,*) ein Monoid, das freie Monoid oder die freie Halbgruppe über A. Dieses Monoid ist genau dann kommutativ, wenn A aus einem Element besteht. Man schreibt ein Wort (a1,...,an) auch kurz als a1...an und lässt das Verknüpfungssymbol bei der Konkatenation weg. Will man das leere Worte explizit ansprechen, so verwendet man meistens das Symbol l oder auch e, das natürlich nicht schon in A vorkommen darf. Eine große Bedeutung besitzen freie Monoide FA in der Theorie der formalen Sprachen, wo sie meistens mit A* bezeichnet werden, denn eine formale Sprache L wird dort als beliebige Teilmenge von A* definiert. Transformationshalbgruppen Für eine beliebige nichtleere Menge X betrachte man die Menge TX aller Abbildungen f: X -> X von X in sich, die Transformationen von X. Durch die Nacheinanderanwendung (f o g)(x) = f(g(x)) für alle x aus X und alle f und g aus TX ist eine assoziative Verknüpfung o auf TX definiert. Die identische Abbildung idX auf X, die jedes x aus X auf sich selbst abbildet, ist neutrales Element bezüglich dieser Verknüpfung, so dass (TX,o) ein Monoid ist. In (TX,o) sind genau die konstanten Abbildungen cx : X -> X mit cx(y) = x für alle y aus X und ein jeweils festes x aus X linksabsorbierend und genau die injektiven Abbildungen linkskürzbar. Sobald X zwei verschiedene Elemente enthält, existieren zwei verschiedene konstante Abbildungen, und (TX,o) ist weder kommutativ noch eine Gruppe. Symmetrische Gruppen Wie in jedem Monoid, so kann man auch in (TX,o) die Untergruppe der Einheiten bilden, d.h. in diesem Fall, der invertierbaren Abbildungen f: X -> X. Diese nennt man auch die Permutationen (der Elemente) von X und schreibt (SX,o) für diese symmetrische Gruppe auf X. Im Fall X = {1,...,n} kürzt man dies zu (Sn,o) ab. Man sieht, dass Sn aus genau n! = 1*2*3*...*n verschiedenen Permutationen besteht und dass diese symmetrische Gruppe für n > 2 nicht kommutativ ist. Die symmetrische Gruppe Sn enthält jede Gruppe der Ordnung n als Untergruppe. Die Abbildung zeigt die Gruppentafel der symmetrischen Gruppe S3. Permutationsgruppe Unter einer Permutation einer Menge M versteht man die eineindeutige Abbildung der Menge M auf sich, d.h. eine Zuordnung s, bei der jedem Element a von M ein Bild s(a) entspricht und jedes Element von M das Bild genau eines a ist. Ist M endlich und sind ihre Elemente mit den Nummern 1, 2, …, n versehen, so kann man jede Permutation vollständig durch ein Schema beschreiben, in dem man unter jeder Nummer k die Nummer s(k) des Bildelementes schreibt. (siehe Abbildung) 251 Unter dem Produkt st zweier Permutationen s und t wird diejenige Permutation verstanden, die entsteht, wenn man zuerst die Permutation t und dann auf die Bildmenge die Permutation s ausübt, d.h. st(a) = s(t(a)) Für drei Permuationen r, s, t gilt das Assoziativgesetz (rs) t = r (st) Die identische Permutation I bildet jedes Element auf sich selbst ab und es gilt I(a) = a sowie Is = s Das Inverse einer Permutation s ist diejenige Permutation, die s(a) auf a abbildet. Bezeichnet man sie mit s-1, so gilt s-1s(a) = a und s-1s = I Damit bildet die Menge der Permuationen einer Menge M mit der Produktbildung eine Gruppe, die Permutationsgruppe. Ist die Menge M endlich mit n Elementen, so spricht man von der symmetrischen Gruppe σn oder Sn. Der Name wurde gewählt, weil die Funktionen, die bei allen Permutationen der Gruppe invariant bleiben, die symmetrischen Funktionen sind. Permutationsgruppe S3 Die Permutationsgruppe S3 bzw. symmetrische Gruppe S3 besteht aus 6 Elementen, den Permutationen einer dreielementigen Menge. In Zyklenschreibweise ergibt sich die oben abgebildete Gruppentafel. Der Gruppentafel entnimmt man sofort, dass die S3 isomorph zur Diedergruppe D3 ist. Auch die Untergruppen der S3 lassen sich relativ einfach aufklären. Einerseits gibt es eine zur C3 isomorphe Untergruppe, die von der Permutation (123) erzeugt wird. Diese Untergruppe ist auch genau die alternierende Gruppe A3. Andererseits erzeugen die Transpositionen (12), (13) und (23) zur C2 isomorphe Untergruppen. Der Zusammenhang zwischen den einzelnen Untergruppen wird durch den unten abgebildeten Untergruppengraphen veranschaulicht. Permutationsgruppe S4 S4 sei die Menge aller möglichen 24 Permutationen von vier Elementen {1, 2, 3, 4}. Mit der Nacheinanderausführung zweier Permutationen bildet S4 eine Gruppe, die Permutationsgruppe S4. Die Permutationsgruppe S4 besitzt 30 verschiedene Untergruppen. Zwei Untergruppen G1 und G2 gehören zur gleichen Klasse, wenn ein Element x mit G1 = x-1 G2 x existiert. Für S4 existieren 11 verschiedene Klassen. In der Tabelle sind alle Untergruppen mit ihren Elementen nach Klassen sortiert aufgelistet. Als Kurzschreibweise wird [abcd] verwendet, d.h. zum Beispiel für die abgebildete Permutation [3421]. Desweiteren steht "e" für [1234], d.h. die identische Permutation. Klasse Elementzahl Anzahl der Klasse Elementzahl Anzahl der Untergruppen Untergruppen 1 1 1 2 6 2 3 3 2 4 4 3 5 3 4 6 3 4 7 1 4 8 4 6 9 3 8 10 1 12 11 1 24 Klasse Klasse Klasse Klasse Klasse Klasse Klasse Klasse 1 2 3 4 5 6 7 8 Klasse 9 Klasse 10 Klasse 11 e e [1243], e [1432], e [1324], e [4231], e [3214], e [2134] e [2143], e [3412], e [4321] e [1342] [1423], e [3241] [4213], e [2431] [4132], e [2314] [3124] e [2341] [3412] [4123], e [2413] [4321] [3142], e [3421] [2143] [4312] e [1243] [2134] [2143], e [1432] [3214] [3412], e [1324] [4231] [4321] e [2143] [3412] [4321] e [1243] [1324] [1423] [1342] [1432], e [1243] [3214] [4213] [3241] [4231] e [1432] [2134] [4132] [2431] [4231], e [1324] [2134] [3124] [2314] [3214] e [1243] [3412] [4312] [3421] [2134] [4321] [2143] e [1432] [2143] [4123] [2341] [3214] [4321] [3412] e [1324] [2143] [3142] [2413] [4231] [3412] [4321] e [1342] [1423] [2143] [3124] [4132] [2431] [2314] [4213] [3241] [3412] [4321] S4 Permutationsgruppe S5 S5 sei die Menge aller möglichen 120 Permutationen von fünf Elementen {1, 2, 3, 4, 5}. Mit der Nacheinanderausführung zweier Permutationen bildet S5 eine Gruppe, die Permutationsgruppe S5. Die Permutationsgruppe S5 besitzt 156 verschiedene Untergruppen. Zwei 252 Untergruppen G1 und G2 gehören zur gleichen Klasse, wenn ein Element x mit G1 = x-1 G2 x existiert. Für S5 existieren 19 verschiedene Klassen. In der Tabelle ist jeweils eine Untergruppe mit ihren Elementen nach Klassen sortiert aufgelistet. Als Kurzschreibweise wird [abcde] verwendet, d.h. zum Beispiel für die abgebildete Permutation [35124]. Desweiteren steht "e" für [12345], d.h. die identische Permutation. 1. 2. 12. 27. 37. 52. 67. 72. 78. 88. 98. 108. 123. 129. 144. 150. 155. 156. e e [12354] e [13254] e [12453] [12534] e [13452] [14523] [15234] e [12354] [13245] [13254] e [13254] [14523] [15432] e [23451] [34512] [45123] [51234] e [21453] [12534] [21345] [12453] [21534] e [12354] [12435] [12534] [12453] [12543] e [12453] [12534] [21354] [21435] [21543] e [12354] [14523] [15423] [14532] [13245] [15432] [13254] e [13254] [21435] [31524] [24153] [42513] [35142] [53412] [54321] [45231] e [12354] [21435] [21534] [21453] [12543] [21543] [12453] [12435] [21345] [21354] [12534] e [13254] [23415] [32514] [24351] [34125] [43521] [31452] [41235] [14532] [42153] [21543] [35241] [25134] [52431] [51324] [15423] [53142] [54213] [45312] e [12354] [13425] [13524] [13452] [14235] [14532] [14253] [12543] [13542] [15234] [15432] [15243] [12453] [15423] [14352] [14325] [13245] [12534] [15324] [14523] [15342] [13254] [12435] e [12453] [12534] [23145] [24153] [25134] [23451] [23514] [31245] [34251] [35214] [31452] [31524] [14352] [15324] [24531] [24315] [41253] [45231] [43215] [41532] [41325] [15432] [13425] [45312] [45123] [52431] [53412] [51423] [52314] [52143] [21543] [53124] [53241] [34512] [32541] [34125] [42351] [15243] [54132] [25341] [25413] [51234] [54213] [51342] [13542] [14523] [32415] [32154] [21354] [13254] [35142] [54321] [42513] [43521] [42135] [21435] [14235] [43152] [35421] S5 Restklassengruppe Z/(n) Für jede natürliche Zahl n bilden die ganzzahligen Vielfachen n*Z = { g*n | g aus Z} = {...,-2*n, -n, 0, n, 2*n,... } eine Untergruppe der abelschen Gruppe (Z,+), denn die Differenz zweier Elemente aus n*Z liegt wieder in (der nichtleeren Menge) n*Z. Für n = 0 bzw. n = 1 sind dies gerade die trivialen Untergruppen { 0 } bzw. Z selbst. Wegen der Kommutativität von (Z,+) ist jede dieser Untergruppen schon ein Normalteiler. Damit erhält man die jeweilige Faktorgruppe (Z/n*Z,+) = (Z/(n),+), die aus den Klassen der durch n*Z bestimmten Kongruenzrelation ~ besteht. Sie wird die Restklassengruppe Z modulo n genannt. Dabei sind zwei Elemente a und b aus Z genau dann kongruent modulo n, wenn ihre Differenz durch n ohne Rest teilbar ist, d.h., wenn sie beide bei Division durch n denselben ganzzahligen Rest liefern. Für n > 0 wählt man als Repräsentanten der Klassen üblicherweise die Zahlen 0, 1, ..., n-1 und erhält so Z/(n) = { [0]n, [1]n, ..., [n-1]n } (Z/(n),+) hat dann die Ordnung n und damit sind für verschiedene natürliche Zahlen n und m die Restklassengruppen (Z/(n),+) und (Z/(m),+) nicht isomorph. Außerdem ist jede dieser Gruppen zyklisch, denn sie wird von der Restklasse [1]n erzeugt. Es gibt also zu jeder natürlichen Zahl n > 0 eine (zyklische und damit abelsche) Gruppe der Ordnung n. Restklassengruppe, Untergruppe Ist (U,+) irgendeine von { 0 } verschiedene Untergruppe von der Restklassengruppe (Z,+), so gibt es wenigstens ein von 0 verschiedenes Element u in U. Damit liegt aber auch -u in U und daher wenigstens eine positive natürliche Zahl. Es sei nun n die kleinste positive natürliche Zahl aus U. Dann ist n*Z schon in U enthalten. Ist nun u irgendein Element von U, so liefert die Division mit Rest eine Zerlegung u = g*n + r mit einer ganzen Zahl g und einem Rest 0 ≤ r < n. Nun liegt aber r = u - g*n in U und wegen der Minimalität von n ist dies nur für r = 0 möglich, d.h. u = g*n liegt schon in n*Z und es gilt folglich U = n*Z. Daher sind die Untergruppen n*Z bereits sämtliche Untergruppen (und Normalteiler) von (Z,+). Also ist nach dem Homomorphiesatz jedes homomorphe Bild von (Z,+) zu genau einer der zyklischen Restklassengruppen (Z/(n),+) isomorph. Gruppe euklidischer Vektoren Grundmenge: die Menge der (euklidischen) Vektoren der Ebene Verknüpfung: Addition zweier euklidischer Vektoren der Ebene 253 Man addiert zwei Vektoren a und b, indem man den Anfang des Vektors b an das Ende des Vektors a verschiebt. Der Vektor a+b ist dann der Vektor, der vom Anfang vom a bis zum Ende von b reicht. Abgeschlossenheit der Verknüpfung: Addiert man zwei Vektoren der Ebene, so ist das Ergebnis wieder ein Vektor der Ebene. Assoziativität: Die Addition dreier Vektoren der Ebene ist assoziativ. Neutrales Element: Das neutrale Element ist der Nullvektor. Inverse Elemente: Die inversen Elemente sind Vektoren mit umgekehrter Richtung. Kommutativität: Die Vektoraddition zweier Vektoren der Ebene ist kommutativ. (Kräfteparallelogramm) Ideale von Gruppoiden Unter einem Linksideal eines Gruppoids (G,*) versteht man eine nichtleere Teilmenge L von G, die (l) g*a liegt in L für alle a aus L und alle g aus G erfüllt. Analog heißt eine nichtleere Teilmenge R von G ein Rechtsideal von (G,*), wenn (r) a*g liegt in R für alle a aus R und alle g aus G gilt. Ein (zweiseitiges) Ideal I von (G,*) ist eine Teilmenge von G, die sowohl Links- als auch Rechtsideal ist. Insbesondere ist jedes Linksideal, jedes Rechtsideal und jedes Ideal ein Untergruppoid von (G,*) und G selbst ist stets ein Ideal von (G,*). Eine einelementige Teilmenge L = { a } ist wegen (l) genau dann Linksideal, wenn a ein rechts-absorbierendes Element von (G,*) ist. Die analoge Aussage gilt für Rechtsideale und linksabsorbierende Elemente. Daher besitzt ein Gruppoid genau dann ein (einziges) einelementiges Ideal, wenn es ein absorbierendes Element besitzt. Dieses (nur eventuell vorhandene) Ideal und G selbst heißen die trivialen Ideale von (G,*). Ein Gruppoid, welches nur triviale Ideale besitzt, nennt man auch ideal-einfach. Ideale Aus rein mengentheoretischen Definitionen folgt, dass der Durchschnitt D von beliebig vielen Linksidealen (Rechtsidealen, zweiseitigen Idealen) von (G,*) entweder leer ist oder ein Linksideal (Rechtsideal, zweiseitiges Ideal) von (G,*). Daher existiert zu jeder nichtleeren Teilmenge A von G der Durchschnitt aller Linksideale Li von (G,*), die A enthalten, und ist ein Linksideal von (G,*), das von A erzeugte Linksideal. Es ist somit das kleinste Linksideal von (G,*), das A enthält. Analog existieren das von A erzeugte Rechtsideal und das von A erzeugte Ideal. Wird ein Linksideal von einer einelementigen Menge { a } erzeugt, so spricht man von einem Hauptlinksideal (oder Linkshauptideal) und entsprechend von einem Hauptrechtsideal (oder Rechtshauptideal) bzw. Hauptideal. Ist das Gruppoid sogar eine Halbgruppe (S,*), so ist für jedes a aus S die Menge S*a = { s*a | s aus S } zwar ein Linksideal von (S,*), das aber nicht unbedingt a enthält. Dagegen ist stets S1*a = { a } ∪ S*a das von a erzeugte Hauptideal, das in vielen Fällen, z.B. für Monoide (S,*), mit S*a übereinstimmt. Entsprechendes gilt für Rechtsideale a*S und a*S1 ={ a } ∪ a*S. Daher ist das von a erzeugte (zweiseitige) Ideal gegeben durch S1*a*S1 = { a } ∪ a*S ∪ S*a ∪ S*a*S. Algebraischer Ring Ringe und Körper sind algebraische Strukturen mit zwei Operationen, allgemein einer Addition und einer Multiplikation, wobei diese Namen nur der Anschaulichkeit halber gewählt sind. Eine algebraische Struktur (G, +, •) mit zwei Operationen + und • heißt Ring, wenn gilt: 1. (G, +) ist Abelsche Gruppe 2. Assoziativgesetz für alle a,b,c aus G: (a • b) • c = a • (b • c) 3. Distributivgesetz für alle a,b,c aus G: (a + b) • c = a • b + a • c Ein Ring heißt kommutativer Ring, falls zusätzlich das Kommutativgesetz bezüglich der zweiten Operation gilt. Gibt es ein neutrales Element bzgl. der Multiplikation e mit e • a = a • e = a für alle a, so spricht man von einem Ring mit Einselement oder unitären Ring. Beispiele: Die Menge der ganzen Zahlen mit der gewöhnlichen Addition und Multiplikation ist ein kommutativer Ring. Die Menge der Polynome mit der gewöhnlichen Addition und Multiplikation ist ein kommutativer Ring. Ist (G, +) eine abelsche Gruppe, so bilden die Endomorphismen von A einen Ring, den Endomorphismenring End(A). Die Multiplikation • ist dabei die Komposition von Abbildungen. Für f, g ∈ End(A) sind f + g und f • g komponentenweise durch (f + g)(x) = f(x) + g(x) und (f•g)(x) = f(g(x)) definiert. Restklassenring Ein Restklassenring ist ein kommutativer Ring (Zn,⊕,⊗) mit Einselement, wobei die Verknüpfungen ⊕ und ⊗ die gewöhnliche Addition und Multiplikation mod n darstellen 254 Ringeigenschaften In einem Ring R gilt für alle a, b ∈ R: 0a = a0 = a (-a)b = a(-b) = -ab (-a)(-b) = ab Nachweis: (I) 0a = (a - a)a = aa - aa = 0 (II) (-a)b = (0 - a)b = 0b - ab = 0 - ab = -ab (III) (-a)(-b) = - (-ab) = ab In einem unitären Ring folgt die Kommutativität der Addition aus den anderen Ringaxiomen und es gilt 1 ≠ 0, wenn der Ring vom Nullring verschieden ist und 1 das neutrale Element der Multiplikation und 0 das der Addition ist. Nachweis: a + a + b + b = 1a + 1a + 1b + 1b = (1+1) a + (1 + 1)b = (1 + 1)(a + b) = (a + b) + (a + b) = a + b + a + b Addiert man nun -a von links und -b von rechts ergibt sich mit a + b = b + a die Behauptung. Wenn R verschieden vom Nullring ist, gibt es ein 0 ≠ a ∈ R. Angenommen es ist 0 = 1, dann gilt auch 0a = 1a, also a = 0. Widerspruch! Nullteiler Ein Nullteiler eines kommutativen Ringes R ist ein vom Nullelement verschiedenes Element a, für das es ein Element b ungleich 0 gibt, so dass ab = 0, d.h. wird a b = 0, ohne dass a = 0 oder b = 0, sind a und b Nullteiler von R Ist R ein nichtkommutativer Ring und a ≠ 0, dann unterscheidet man zwischen: Linksnullteiler: es gibt ein Element b ≠ 0, so dass ab = 0 Rechtsnullteiler: es gibt ein Element b ≠ 0, so dass ba = 0 beidseitiger Nullteiler: es gibt Elemente b,c ≠ 0, so dass ab = 0, ca = 0. Ein Ring ohne einseitige oder beidseitige Nullteiler heißt nullteilerfrei. Ein nullteilerfreier kommutativer Ring mit multiplikativem Einselement heißt Integritätsring. Integritätsbereich, Integritätsring Ein Integritätsring oder Integritätsbereich ist ein nullteilerfreier kommutativer Ring mit Einselement. Integritätsringe sind Verallgemeinerungen der ganzen Zahlen und bilden den allgemeinsten Rahmen für die Untersuchung von Teilbarkeiten. Alternativ kann man einen Integritätsring definieren als einen kommutativen Ring mit 1, in dem das Nullideal {0} ein Primideal ist, oder als einen Teilring eines Körpers. Beispiele: Das bekannteste Beispiel ist der Ring Z der ganzen Zahlen. Jeder Körper ist ein Integritätsring. Umgekehrt ist jeder artinsche Integritätsring ein Körper. Insbesondere ist jeder endliche Integritätsring ein endlicher Körper. Ein Polynomring ist ein Integritätsring, wenn die Koeffizienten aus einem Integritätsring stammen. Zum Beispiel ist der Ring Z[X] der Polynome mit ganzzahligen Koeffizienten ein Integritätsring, ebenso wie der Ring R[X,Y] der reellen Polynome in zwei Variablen. Der Ring aller reellen Zahlen der Form a+b√2 mit ganzen Zahlen a,b ist ein Integritätsring, da er Teilring von R ist. Ist U ⊆ C ein Gebiet; eine zusammenhängende offene Teilmenge; in den komplexen Zahlen, dann ist der Ring H(U) der homomorphen Funktionen f: U → C ein Integritätsring. Ist R ein kommutativer Ring und P ein Primideal in R, dann ist der Faktorring R/P ein Integritätsring. Der Restklassenring Z/nZ ist genau dann ein Integritätsring, wenn n eine Primzahl ist. Charakteristik eines Integritätsrings Die Charakteristik eines Integritätsrings ist entweder 0 oder eine Primzahl. Ist R ein Integritätsring mit der Primzahl-Charakteristik p, dann ist die Abbildung f: R → R, x ® xp ein injektiver Ringhomomorphismus und heißt Frobeniushomomorphismus. Teilbarkeit, Primelemente, Irreduzibilität Sind a und b Elemente des Integritätsrings R, dann sagt man a teilt b oder a ist ein Teiler von b oder b ist ein Vielfaches von a, wenn es ein Element x in R gibt, so dass ax = b. Man schreibt dann a | b. Gilt a | b und b | c, dann folgt daraus a | c. Gilt a | b, dann gilt auch a | bc für jedes c aus R, insbesondere auch a | - b. Gilt a | b und a | c, dann gilt auch a | b + c und a | b - c. Gilt a | b und b | a, dann heißen a und b zueinander assoziiert. a und b sind genau dann assoziiert, wenn es eine Einheit u gibt, so dass au = b. 255 Ist q keine Einheit, dann heißt q irreduzibel, falls q nicht als Produkt zweier Nicht-Einheiten darstellbar ist, falls also aus q = ab folgt a ∈ R* oder b ∈ R. Ist p eine Nicht-Einheit ungleich 0, dann heißt p prim oder Primelement, falls gilt: Aus p | ab folgt p | a oder p | b. Ist p ein Primelement von R, dann ist das Hauptideal (p) ein Primideal. Jedes Primelement ist irreduzibel, aber nicht immer ist jedes irreduzible Element prim. In faktoriellen Ringen (engl. unique factorization domain, UFD) ist dagegen jedes irreduzible Element prim. Der Begriff des Primelements verallgemeinert den Begriff der Primzahl. Primzahlen werden üblicherweise als irreduzible Elemente von Z definiert. Quotientenkörper Ist R ein Integritätsring, dann existiert ein kleinster Körper Quot(R), der R als Teilring enthält. Quot(R) ist bis auf Isomorphie eindeutig bestimmt und heißt Quotientenkörper von R. Seine Elemente haben die Form a/b mit a,b in R, b ungleich 0. Der Quotientenkörper des Rings der ganzen Zahlen ist der Körper der rationalen Zahlen. Der Quotientenkörper eines Körpers ist der Körper selbst. Abstrakt definiert man Quotientenkörper durch folgende Eigenschaft: Ein Quotientenkörper ist ein Paar (K, φ), wobei φ ein Ringhomomorphismus von R nach K ist mit der Eigenschaft: Für jeden Körper L und Ringhomomorphismus ψ: R → L, gibt es genau einen Körperhomomorphismus α: K → L mit ψ(x) = α(φ(x)) für alle x aus R. Einheiten in Ringen Ein Element a ∈ R eines unitären Ringes heißt invertierbar oder Einheit, falls es ein b ∈ R gibt mit ab = ba = 1. Die Menge aller invertierbaren Elemente eines unitären Rings werden mit U(R) oder R* bezeichnet. Sie bilden eine Gruppe, die Einheitengruppe. Ein unitärer Ring R ist genau dann ein Körper, wenn die Einheitengruppe von R alle Elemente bis auf die 0 umfasst. Nachweis: Es ist offensichtlich, dass in einem Körper die Einheitengruppe der multiplikativen Gruppe des Körpers entspricht. Alle von Null verschiedenen Elemente sind invertierbar. Wenn die Einheitengruppe alle Ringelemente bis auf die 0 enthält, sind aber auch gerade die Körperaxiome erfüllt. Beispiele: Im Ring der ganzen Zahlen Z besteht die Einheitengruppe aus {-1, 1}. Im Falle des Matrizenrings Mat(n x n, K) umfasst die Einheitengruppe alle invertierbaren Matrizen (det A ≠ 0). Sie heißt generelle lineare Gruppe und wird mit GL(n, K) bezeichnet. Teilring Eine Teilmenge T eines Ringes R heißt Teilring, wenn T bezüglich der Ringoperationen einen Ring bildet. Analog wird ein Teilkörper definiert. Beispiele: Z ⊆ Q ⊆ R ⊆ C ist eine Folge von Teilringen. nZ = {na | n, a ∈ Z} sind alle Vielfachen von n. nZ ist ein Unterring von Z. Es ist 4Z ein Unterring von 2Z. Jeder Ring R ist Teilring des Polynomrings R[X]. Primitivwurzel Die additive Gruppe des Restklassenringes (Zn,⊕,⊗) mit den Verknüpfungen ⊕ und ⊗ ist nach Definition zyklisch, ein erzeugendes Element ist zum Beispiel die 1. Ist die multiplikative Gruppe (Zn,⊗) auch zyklisch, so existiert ein Element ξ, dessen Potenzen ξk sämtliche Elemente von Zn durchlaufen. Ein solches Element ξ heißt Primitivwurzel. Es gilt: Ist n eine Primzahl p oder Potenz einer ungeraden Primzahl, so gibt es in (Zn,⊗) mit Sicherheit Primitivwurzeln. Dies folgt aus einem Satz von Gauß, dass eine multiplikative Restklassengruppe Zp, bei der p Primzahl ist, zyklisch ist. Nach einem unbewiesenen Satz von Artin gibt es unendlich viele Primzahlen deren kleinste Primitivwurzel die 2 ist. Die Tabelle enthält das Anwachsen der Rekordwerte für die kleinsten Primitivwurzeln kPW der Primzahlen p (gesucht bis 160 Millionen): p kPW p kPW p kPW p kPW 3 2 7 3 23 5 41 6 71 7 191 19 409 21 2161 23 5881 31 36721 37 55441 38 71761 44 110881 69 760321 73 5109721 94 17551561 97 29418841 101 33358081 107 45024841 111 90441961 113 Nilpotenz 256 Ein Element x eines Rings R wird als nilpotent bezeichnet, wenn eine positive natürliche Zahl n existiert, so dass xn = 0 gilt. Ein Ideal I von R wird als nilpotent bezeichnet, wenn eine positive natürliche Zahl n existiert, so dass In = 0 ist. Die Definition lässt sich insbesondere auf quadratische Matrizen anwenden. Beispielsweise ist die Matrix A = (0 10 0) nilpotent, da A² die Nullmatrix ergibt. Im Restklassenring Z/8Z sind die Restklassen von 0, 2, 4 und 6 nilpotent, da jeweils ihre dritte Potenz kongruent zu 0 modulo 8 ist. In diesem Ring ist jedes Element entweder nilpotent oder Einheit. Im Restklassenring Z/12Z sind die nilpotenten Elemente genau die Restklassen von 0 und 6. Das Nullelement eines Ringes ist stets nilpotent, da 01 = 0 ist. Die Menge aller nilpotenten Elemente eines kommutativen Ringes bildet ein Ideal, das so genannte Nilradikal. Der Durchschnitt aller Primideale in einem kommutativen Ring mit 1 ist genau das Nilradikal. Sei im folgenden R ein Ring, a ein nilpotentes Element von R und n die kleinste natürliche Zahl mit an = 0. Ist a ≠ 0, dann ist n > 1 und a ist Nullteiler, denn aan-1 = 0 und an-1 = 0. Ist zusätzlich R ein Ring mit 1, dann gilt: a ist bezüglich der Multiplikation nicht invertierbar, denn aus ab = 1 für ein Ringelement b folgt der Widerspruch 0 = anb = an-1. 1-a ist invertierbar, denn es gilt (1 - a)(1 + a + a² + … + an-1) = 1 - an = 1 = (1 + a + a² + … + an-1)(1 a) Ist b eine Einheit von R, dann ist auch b + a invertierbar. Sei R ein Restklassenring Z/mZ und p das Produkt aller Primteiler von m, d.h. aller Primzahlen die in der Primfaktorzerlegung von m auftreten. Dann sind die nilpotenten Elemente von R genau die Restklassen von ganzen Zahlen, die Vielfache von p sind. Multiplikationstafel des Restklassenrings Z6 0 1 2 0 0 0 0 1 0 1 2 2 0 2 4 3 0 3 0 4 0 4 2 5 0 5 4 Damit sind 2, 3 und 4 Nullteiler. Im Restklassenring Z7 Körper ist. 3 0 3 0 3 0 3 gibt 4 5 0 0 4 5 2 4 0 3 4 2 2 1 es keine Nullteiler, da dieser Ring sogar Algebraischer Körper Eine algebraische Struktur (K, +, •) heißt Körper, wenn gilt: 1. (K,+) ist Abelsche Gruppe mit dem neutralen Element 0. 2. (K\{0},•) ist kommutative Gruppe mit dem neutralen Element 1. 3. Für alle a,b,c aus K gilt das Distributivgesetz a • (b + c) = (a • b) + (a • c) Beispiel: Körper der reellen bzw. komplexen Zahlen Der Begriff "Körper" wurde zuerst von Richard Dedekind (1831-1916) benutzt. Ältere Bezeichnungen waren rationales Gebiet (ebenfalls Dedekind) und Rationalitätsbereich (Kronecker). Schiefkörper: Eine algebraische Struktur, die alle Körperkriterien, bis auf die kommutative Multiplikation, erfüllt, heißt Schiefkörper. Nullteilerfreiheit: Aus a • b = 0 folgt stets a = 0 oder b = 0, d.h. die Struktur ist nullteilerfrei. Zu beliebigen a und b aus K existiert genau ein x aus K mit a • x = b, d.h. die Division kann für a≠0 eindeutig durchgeführt werden. Vollständigkeit eines Körpers Eine Körper ist vollständig, wenn jede Fundamentalfolge einen Grenzwert in diesem Körper besitzt. Beispiel: Körper der reellen Zahlen Unterkörper und Oberkörper Ein Unterkörper oder Teilkörper eines Körpers L ist eine Teilmenge K ⊆ L, die 0 und 1 enthält und mit den auf K eingeschränkten Verknüpfungen selbst ein Körper ist. L wird dann Oberkörper von K genannt. Eine Teilmenge K ⊆ L ist genau dann ein Teilkörper von L, wenn sie 0 und 1 enthält und bezüglich der vier Verknüpfungen Addition, Multiplikation, Negation und Kehrwertbildung abgeschlossen ist, d.h. die Verknüpfung von Elementen von K liefert wieder ein Element von K. Zum Beispiel ist der Körper C der komplexen Zahlen ein Oberkörper des Körpers R der reellen Zahlen. 257 Primkörper Unter einem Primkörper versteht man einen Körper, der keine echten Teilkörper enthält. Eigenschaften von Primkörpern Jeder Primkörper ist bis auf Isomorphie entweder Q, der Körper der rationalen Zahlen, oder ein Fp-Körper mit p prim, d.h. ein Restklassenkörper modulo p. Jeder Körper enthält einen Primkörper. Ist die Charakteristik des Körpers 0, so ist dessen Primkörper isomorph zu Q, ist sie hingegen eine Primzahl p, so ist der Primkörper isomorph zu Fp. Damit kann jeder Körper als Erweiterungskörper seines Primkörpers angesehen werden. Galoisfelder Genau die endlichen Schiefkörper heißen Galoisfelder. Jedes Galoisfeld ist ein Körper. Zu jeder Primzahl p und zu n = 1, 2, … gibt es einen Körper mit pn Elementen. Auf diese Weise erhält man alle Galoisfelder. Zwei Galoisfelder sind genau dann isomorph, wenn sie die gleiche Anzahl von Elementen besitzen. Geordneter Körper Ein Körper heißt geordnet, wenn in K eine Relation "<" mit den Eigenschaften definiert ist: (a, b, c aus K) 1. Trichotomiegesetz Es gilt entweder a < b, a = b oder a > b 2. Transitivgesetz Aus a < b und b < c folgt a < c 3. Monotoniegesetz Aus a < b folgt a+c < b+c Aus a < b und 0 < c folgt a · c < b · c Die Richtung einer Ungleichung ändert sich nicht, wenn sie auf beiden Seiten gleich viel verkleinert oder vergrößert wird, oder wenn beide Seiten mit der gleichen positiven Zahl multipliziert oder dividiert werden. Multipliziert oder dividiert man hingegen mit einer negativen Zahl, dreht sich das Ungleichheitszeichen um. Archimedisches Axiom Zu jedem rationalen a und positivem rationalen b gibt es eine natürliche Zahl n, so dass n·b > a gilt Archimedische geordnete Körper Körper, die das archimedische Axiom erfüllen, heißen archimedisch geordneter Körper. Diese Eigenschaft wird auch auf Nichtkörper erweitert. Die Menge der natürlichen Zahlen erfüllt ebenfalls das Archimedische Axiom und ist somit auch archimedisch geordnet. Charakteristik eines Ringes Die Charakteristik ist eine Kennzahl eines Ringes oder Körpers. Sie gibt an, wie oft man die im Ring bzw. Körper enthaltene Zahl 1 aufaddieren muss, um als Ergebnis 0 zu erhalten. Die Charakteristik eines unitären Ringes R ist die kleinste natürliche Zahl n ≥ 1, für die in der Arithmetik des Ringes die n-fache Summe des Einselementes 1 gleich dem Nullelement wird, also Σi=1n 1 = 0 Ist jede endliche Summe von Einsen ungleich Null, wie zum Beispiel bei den reellen Zahlen, dann wird dem Ring definitionsgemäß die Charakteristik 0 zugeordnet. Eine übliche Abkürzung der Charakteristik von R ist char(R). Sie Charakteristik des unitären Rings R ist der eindeutig bestimmte nichtnegative Erzeuger des Kerns des kanonischen unitären Ringhomomorphismus Z → R. Die Charakteristik des unitären Rings R ist die eindeutig bestimmte nichtnegative ganze Zahl n, für die R einen unitären Teilring enthält, der isomorph zum Restklassenring Z/nZ ist. Eigenschaften bei Ringen Jeder unitäre Teilring S eines unitären Rings R hat dieselbe Charakteristik wie R. Gibt es einen Ringhomomorphismus R → S zwischen zwei unitären Ringen R und S, so ist die Charakteristik von S ein Teiler der Charakteristik von R. Für jeden Integritätsring, und insbesondere jeden Körper, ist die Charakteristik entweder 0 oder eine Primzahl. Im letzteren Fall spricht man auch von positiver Charakteristik. Ist R ein unitärer Ring mit Primzahlcharakteristik p, dann gilt (x + y)p = xp + yp für alle x, y ∈ R. Die Abbildung f: R → R, x → xp ist dann ein Ringhomomorphismus und wird FrobeniusHomomorphismus genannt. Beispiele: Der Restklassenring Z/nZ hat die Charakteristik n. Da die komplexen Zahlen die rationalen enthalten, ist auch ihre Charakteristik 0. Für ein irreduzibles Polynom g vom Grad n über dem Restklassenkörper Fp ist der Faktorring Fp[X]/(g) ein Körper, der isomorph ist zum endlichen Körper Fpn, der Fp enthält und die Charakteristik p hat. Charakteristik eines Körpers In jedem Körper K existieren natürliche Zahlen vermöge der Abbildung 258 i: N → K: n → i(n) = n × 1 = Σk=1n 1 = 1 + … + 1 (k-mal) Allerdings besteht die Möglichkeit, dass ein m ∈ N existiert mit i(m) = 1 + … + 1 = 0, zum Beispiel ist im Z2: 1 + 1 = i(2) = 0. Die Charakteristik eines Körpers ist χ(K) = min {m ∈ N | i(m) = Σk=1n 1 = 0 } ≥ 2 , falls ∃ m ∈ N: i(m) = 0 andernfalls χ(k) = 0 Beispiele: χ(Q) = χ(R) = χ(C) = 0 ; χ(Z2) = 2 Eigenschaften der Charakteristik i(m + n) = i(m) + i(n) und für m > n: i(m - n) = i(m) - i(n) χ(K) = 0 ⇔ i: N → K ist injektiv falls χ(K) ≠ 0, so ist die Charakteristik eine Primzahl Charakteristik bei Körpern Jeder geordnete Körper hat die Charakteristik 0; Beispiele sind die rationalen Zahlen oder die reellen Zahlen. Jeder Körper der Charakteristik 0 ist unendlich; er enthält einen Primkörper, der isomorph zum Körper der rationalen Zahlen ist. Beispiele: Es gibt unendliche Körper mit Primzahlcharakteristik; Beispiele sind der Körper der rationalen Funktionen über Fp oder der algebraische Abschluss von Fp. Die Mächtigkeit eines endlichen Körpers der Charakteristik p ist eine Potenz von p. Denn in diesem Fall enthält er den Teilkörper Fp und ist ein endlichdimensionaler Vektorraum über diesem Teilkörper. In der linearen Algebra wird gezeigt, dass die Ordnung des Vektorraums dann eine Potenz von p ist. D.h., dass jeder endliche Vektorraum als Mächtigkeit eine Primzahlpotenz hat, da dieser dann ein endlichdimensionaler Vektorraum über einem endlichen Körper sein muss. Euklidischer Ring Ein Euklidischer Ring ist ein Ring, in dem eine verallgemeinerte Division mit Rest möglich ist, wie man sie von den ganzen Zahlen kennt. Ein Integritätsring R, d.h. ein kommutativer, nullteilerfreier Ring mit 1; heißt euklidischer Ring, falls eine Bewertungsfunktion g: R\{0} → N existiert, so dass es für Elemente x, y ∈ R mit y ≠ 0, Elemente q, r ∈ R gibt, mit x = qy + r, wobei entweder r = 0 oder g(r) < g(y) ist. Die Abbildung g heißt dabei Euklidische Normfunktion oder Euklidischer Betrag. D.h., ein euklidischer Ring ermöglicht eine Division mit Rest und dadurch einen euklidischen Algorithmus zur Bestimmung des größten gemeinsamen Teilers (ggT) zweier Ringelemente. Von dieser Eigenschaft ist der Name abgeleitet. Ein Integritätsbereich R heißt euklidischer Ring, falls eine Bewertungsfunktion g: R → N existiert, so dass g(0) = 0 gilt und für alle y ∈ R\{0}, x ∈ R Elemente q, r ∈ R existieren, so dass x = qy + r gilt und g(r) < g(y) ist. Jeder euklidische Ring besitzt eine minimale euklidische Norm. Außerdem existiert ein Algorithmus zur iterativen Bestimmung des minimalen euklidischen Betrages in einem euklidischen Ring. Jeder euklidische Ring ist ein Hauptidealring, denn wenn a ein minimal bewertetes Element eines Ideals I ist, so ist I = (a), also ein Hauptideal. Insbesondere ist jeder euklidische Ring faktoriell. Beispiele: Der Ring Z der ganzen Zahlen ist ein euklidischer Ring. Die übliche Wahl für einen euklidischen Betrag ist x → |x|. Der minimale euklidische Betrag einer ganzen Zahl ist gegeben durch die Länge der Binärdarstellung ihres Absolutbetrages. Jeder Körper K ist ein euklidischer Ring mit dem euklidischen Betrag a → δ0,a, wobei δ0,a das KroneckerDelta bezeichnet. Der Polynomring K[X] über einem Körper K in einer Variablen X ist ebenfalls euklidischer Ring. Der Ring Z[i] der gaußschen Zahlen erklärt durch (a+bi) → a²+b² ist ein euklidischer Ring. Dagegen ist der Polynomring Z[X] kein euklidischer Ring. Auch der Ring Z[√-3] ist nicht euklidisch, da 2+2√-3 und 4 keinen ggT haben. Monoidring Seien R Ring und M Monoid. Ein Monoidring ist die folgende Menge von Abbildungen R[M] = {(am)m∈M ∈ Abb(M, R) | am = 0 für fast alle m} mit der Zuordnungsvorschrift m ∈ M → am ∈ R. Die am heißen Koeffizienten und nach Definition sind nur endlich viele verschieden von 0. R[M] ist Ring mit komponentenweiser Addition: (am)m∈M + (bm)m∈M = (am + bm)m∈M und der Faltung als Multiplikation: (am')m'∈M · (bm")m"∈M = Σ{(m', m")| m = m'+m"} am' · bm" Dabei ist 0 = (0)m∈M und 1 = (am)m∈M mit am = 1 für m = 0, sonst am = 0. Monoidringe sind eine Verallgemeinerung von Polynomringen. R und M sind auf natürliche Weise in R[M] eingebettet. φ: R → R[M] mit λ ∈ R, φ(λ) = λ x0 ist ein injektiver Ringhomomorphismus. 259 Durch φ wird R[M] zu einer R-Algebra. Insbesondere ist im Falle eines Körpers R = K der Monoidring K[M] ein K-Vektorraum. Ringideale Es sei R ein Ring. Eine nichtleere Teilmenge I ⊆ R heißt beidseitiges Ideal oder einfach nur Ideal, falls gilt a, b ∈ I ⇒ a + b ∈ I r ∈ R, a ∈ I ⇒ r a ∈ I und a r ∈ I Ein Ideal ist eine Teilmenge I, die abgeschlossen bezüglich R-Linearkombinationen ist. Beispiele: Für jeden Ring R sind R und {0} Ideale. Für jedes Ideal I ⊆ R gilt 0 ∈ I. Die Menge der geraden ganzen Zahlen in Z ist ein Ideal, denn die Summe zweier gerader ganzer Zahlen ist gerade und die Multiplikation einer geraden mit einer beliebigen ganzen Zahl ist wieder gerade. Wenn φ: R → S ein Ringhomomorphismus ist, dann ist der Kern ker φ ein Ideal. Hauptideal, Hauptidealring Es sei R ein Ring, a ∈ R ein Element. Dann ist (a) = {r a | r ∈ R} ein Ideal, das von a erzeugte Ideal. Schreibweise: (a) = aR = Ra. Solche Ideale heißen Hauptideale. Ringe, die nur Hauptideale besitzen, heißen Hauptidealringe. Dies sind nach Körpern die einfachsten Ringe. Jeder Körper ist Hauptidealring. Der Ring der ganzen Zahlen Z ist ebenfalls Hauptidealring. Maximales Ideal Es sei R ein kommutativer Ring und M ein Ideal. Man nennet M maximal oder ein maximales Ideal, wenn für alle Ideale I ⊆ R gilt: aus M ⊄ I folgt I = R D.h., ein Ideal M ist maximal, wenn es nicht echte Teilmenge eines echten Ideals von R ist. Primideal Ein Primideal ist eine Teilmenge eines Ringes, die viele Eigenschaften einer Primzahl hat. Primideal eines kommutativen Ringes Sei R ein kommutativer Ring mit 1 und P ein Ideal in R. Man nennt P Primideal oder prim, wenn für alle x, y ∈ R gilt: aus xy ∈ P folgt x ∈ p oder y ∈ p. Ein Ideal P ist genau dann prim, wenn der Faktorring R/P Integritätsring ist. für alle Ideale a, b ⊆ R gilt: a, b ⊆ P ⇒ a ⊆ P und b ⊆ P und P ≠ R Beispiele: Die Menge 2Z der geraden ganzen Zahlen ist ein Primideal im Ring Z der ganzen Zahlen, da ein Produkt zweier ganzer Zahlen nur dann gerade ist, wenn wenigstens ein Faktor gerade ist. Die Menge 6Z der durch 6 teilbaren ganzen Zahlen ist kein Primideal in Z, da 2·3 = 6 in der Teilmenge liegt, aber weder 2 noch 3. Jedes maximale Ideal ist prim. Ein Element p ∈ R ist genau dann ein Primelement, wenn das von p erzeugte Hauptideal (p) ein Primideal ist. Enthält ein Primideal einen Durchschnitt ∩ai von Idealen, so enthält es auch ein ai. Primideal eines nichtkommutativen Ringes Sei R ein Ring mit 1 und P ⊆ R ein beidseitiges Ideal in R. Man nennt P Primideal oder prim, wenn für alle x, y ∈ R gilt: wenn für alle r ∈ R gilt, dass xry ∈ P liegt, dann ist x ∈ P oder y ∈ P. Für einen kommutativen Ring stimmt diese Definition mit der obigen überein, für einen nichtkommutativen unterscheiden sie sich im allgemeinen. Algebra über einem kommutativen Ring, R-Algebra Als Algebra über einem kommutativen Ring oder R-Algebra; wobei R ein kommutativer Ring ist; bezeichnet man eine algebraische Struktur, die aus einem Modul über einem kommutativen Ring und einer zusätzlichen, mit der Modulstruktur verträglichen Multiplikation besteht. Es seien R ein kommutativer Ring und A ein R-Modul. Die Multiplikation ist eine bilineare, zweistellige Verknüpfung A×A→A d.h., für beliebige Elemente x, y, z ∈ A und Skalare λ ∈ R gilt (x + y) · z = x·z + y·z x · (y + z) = x·y + x·z λ (x·y) = (λ x) · y = x · (λ y) Dabei ist weder die Assoziativität noch Kommutativität noch die Existenz eines Einselements der AlgebraMultiplikation vorausgesetzt. Beispiel: Jeder Ring ist eine Z-Algebra, also eine Algebra über dem kommutativen Ring Z der ganzen Zahlen. Körpererweiterung Sei L ein Körper, und sei K ein Unterkörper von L, dann heißt L Erweiterungskörper von K. Die verbreitetste Schreibweise für Körpererweiterungen ist L/K, mintunter auch L | K, selten L : K. 260 Ein Körper M heißt Zwischenkörper der Körpererweiterung L/K, wenn M ein Unterkörper von L und ein Oberkörper von K ist, also K ⊆ M ⊆ L gilt. Körperadjunktion Ist V eine Teilmenge von L, dann ist der Körper K(V) ("K adjungiert V") definiert als der kleinste Teilkörper von L, der K und V enthält. Er besteht aus allen Elementen von L, die mit endlich vielen Verknüpfungen +,-,·,/ aus den Elementen von K und V gebildet werden können. Ist L = K(V), dann sagt man, L wird von V erzeugt. Beispiele für algebraische Strukturen Die Zahlenbereiche Z, Q, R und C sind bezüglich der Addition und Multiplikation kommutative Ringe mit Einselement; Q, R und C sind sogar Körper. Die Menge der geraden ganzen Zahlen ist ein Beispiel für einen Ring ohne Einselement. Die Menge C ist der Erweiterungskörper von R. Die Menge Mn aller n-reihigen Matrizen über den reellen Zahlen bildet einen nichtkommutativen Ring mit der Einheitsmatrix als Einselement. Die Menge der reellen Polynome p(x) = anxn + an-1xn-1 + … + a1 x + a0 bildet bezüglich der üblichen Addition und Multiplikation von Polynomen einen Ring, den Polynomring R[x]. Allgemeiner kann man anstelle des Polynomringes über R auch Polynomringe über beliebigen kommutativen Ringen mit Einselement betrachten. Erweiterungsgrad, Grad einer Körpererweiterung Sei L/K eine Körpererweiterung. Man kann L als Vektorraum über K auffassen, wobei die Vektoraddition die Körper-Addition in L ist und die Skalarmultiplikation die Körper-Multiplikation von Elementen aus L mit Elementen aus K. Die Dimension dieses Vektorraums nennt man den Grad der Erweiterung, und schreibt [L : K]. Die Erweiterung heißt endlich oder unendlich, je nachdem ob der Grad endlich oder unendlich ist. Zum Beispiel ist [C:R] = 2, d.h. die Erweiterung der reellen Zahlen zu den komplexen Zahlen ist endlich. Im Gegensatz dazu ist [R:Q] = ∞. Sind M/L und L/K Körpererweiterungen, dann ist auch M/K eine Körpererweiterung, und es gilt der Gradsatz: [M:K] = [M:L] · [L:K]. Dies gilt für unendliche Erweiterungen. L/K heißt dabei eine Teilerweiterung von M/K. Minimalpolynom Sei L/K eine Körpererweiterung und x ein Element von L. Ein Minimalpolynom m = minpolK(x) von x über K ist definiert als normiertes Polynom kleinsten Grades mit Koeffizienten in K, das x als Nullstelle hat. Falls ein Minimalpolynom von x existiert, ist es eindeutig bestimmt, und das Element x heißt algebraisches Element der Erweiterung L/K oder algebraisch über K. Daher spricht man von dem Minimalpolynom. Falls kein Minimalpolynom von x existiert, dann heißt x transzendent über K. Minimalpolynome sind irreduzibel über dem Grundkörper. Jedes Polynom mit Koeffizienten im Grundkörper, das ein algebraisches Element x als Nullstelle hat, ist ein Polynomvielfaches des Minimalpolynoms von x. Der Grad des Minimalpolynoms von x ist gleich dem Grad der einfachen Erweiterung K(x)/K. Beispiel: Gegeben sei die Körpererweiterung Q(i)/Q mit der imaginären Einheit i. Das Minimalpolynom von i ist x²+1, denn es hat i als Nullstelle, ist normiert und jedes Polynom kleineren Grades wäre linear und hätte nur eine Nullstelle in Q. Das Polynom x³ + x ist kein Minimalpolynom irgendeines Elementes irgendeiner Erweiterung, da es sich als (x² + 1) x darstellen lässt, und für keine seiner Nullstellen ein Polynom kleinsten Grades ist. Körper der reellen Zahlen Das Axiomensystem der reellen Zahlen besteht aus drei Arten von Axiomen: Körperaxiome Anordnungsaxiome Vollständigkeitsaxiom Die reellen Zahlen R werden dann als diejenige Menge charakterisiert, die obige Axiome erfüllen. Körperaxiome Die Körperaxiome fordern, dass es sich bei den reellen Zahlen um einen kommutativen Körper handeln soll. Es existieren also binäre Operationen, die Addition + und die Multiplikation ·. Es gelten folgende Gesetze Assoziativgesetze für alle a, b, c ∈ R gilt a + (b + c) = (a + b) + c a · (b · c) = (a · b) · c 261 Existenz neutraler Elemente: es existieren zwei ausgezeichnete reelle Zahlen 0 und 1, so dass für alle a ∈ R gilt a + 0 = a und a · 1 = a Existenz inverser Elemente: zu jedem a ∈ R existiert ein -a ∈ R mit a + (-a) = 0 Wenn a verschieden von 0 ist gibt es ein a-1; für a-1 schreibt man auch 1/a; mit a · (a-1) = 1 Kommutativgesetze für alle a, b ∈ R gilt: a + b = b + a und a · b = b · a Distributivgesetz a · (b + c) = a · b + a· c Mit den Axiomen gelten für die reellen Zahlen alle Eigenschaften, die für alle Körper gelten. Insbesondere sind die neutralen und inversen Elemente eindeutig bestimmt. Auf Grund dieses Axiomensystems kann man in den reellen Zahlen wie in jedem Körper rechnen und alle bekannten Rechenregeln herleiten. U.a. folgt sofort Es seien a, b, x, y ∈ R, dann gilt: x·0=0 (-x) · y = -(x·y) -(-a) = a Die Gleichung a + x = b hat bei gegebenen a, b genau eine Lösung x = b - a. Die Gleichung a · x = b hat für jedes a verschieden 0 genau eine Lösung x =b·a-1 = b/a. Es ist x·y = 0 genau dann, wenn x = 0 oder y = 0 gilt. Die Körperaxiome liefern Aussagen über das algebraische Verhalten der reellen Zahlen. Aus der Anschauung ist bekannt, dass die reellen Zahlen einer gewissen Anordnung unterliegen, so dass Begriffe wie kleiner und größer einen Sinn ergeben. Diese Anordnung wird durch die folgende Gruppe von Axiomen beschrieben. Anordnungsaxiome Es gibt eine Relation ≤ (kleiner gleich) in R mit folgenden Eigenschaften ≤ ist eine lineare Ordnung, d.h. ∀ x: x ≤ x (Reflexivität) ∀ x,y: x ≤ y und y ≤ x ⇒ x = y (Antisymmetrie) ∀ x,y,z: x ≤ y und y ≤ z ⇒ x ≤ z (Transitivität) Für alle x,y gilt: x ≤ y oder y ≤ x. Zwei Zahlen sind immer vergleichbar. In Beziehung zur Addition und Multiplikation fordert man die Gültigkeit der Monotoniegesetze: ≤ ist bzgl. der Addition monoton, d.h. ∀ a,b,c: a ≤ b ⇒ a+c ≤ b+c ≤ ist bzgl. der Multiplikation monoton; d.h. ∀ a,b,c: a ≤ b und 0 ≤ c ⇒ a·c ≤ b·c Aus dieser Gruppe von Axiomen folgt: 1) a ≤ b ⇒ -b ≤ -a 2) a ≤ b und c ≤ d ⇒ a+c ≤ b ≤ d 3) a ≠ 0 ⇒ a·a > 0 4) a > 0 ⇒ 1/a > 0 5) 0 < a < b ⇒ 1/b < 1/a 6) a < b und b > 0 und 0 < c < d ⇒ ac < bd Vollständigkeitsaxiom der reellen Zahlen Die Körperaxiome und Anordnungsaxiome genügen nicht, um die reellen Zahlen zu charakterisieren. Auch die rationalen Zahlen sind ein Modell für dieses Axiomensystem. Was die reellen Zahlen von den rationalen Zahlen unterscheidet ist, dass sie vollständig sind, es keine Lücken auf der Zahlengeraden mehr gibt. Mit den Begriffen Infimum und Supremum kann die Vollständigkeit erklärt werden. Vollständigkeitsaxiom: Jede nichtleere nach unten beschränkte Menge reeller Zahlen besitzt ein Infimum. oder äquivalent: Jede nichtleere nach oben beschränkte Menge besitzt ein Supremum. Satz: 1) ist 2) ist 3) ist 4) ist Es seien B ⊂ A ⊂ R, B ≠ ∅, dann gilt: A beschränkt, so gilt inf A ≤ sup A A nach oben beschränkt, so ist auch B nach oben beschränkt und sup B ≤ sup A A nach unten beschränkt, so ist auch B nach unten beschränkt und inf A ≤ inf B A nach oben beschränkt und γ eine obere Schranke von A, so gilt γ = sup A ⇔ ∀ε > 0 ∃x ∈ A: x > γ-ε ist A nach unten beschränkt und γ eine untere Schranke von A, so gilt γ = inf A ⇔ ∀ε > 0 ∃x ∈ A: x < γ+ε Aus dem Vollständigkeitsaxiom ergibt sich die Existenz und Eindeutigkeit von Wurzeln nichtnegativer, reeller Zahlen. Einzigkeit der reellen Zahlen Die Axiome (Körperaxiome, Anordnungsaxiome und das Vollständigkeitsaxiom) verleihen dem Körper der reellen Zahlen eine Einzigartigkeit. Bis auf ordnungserhaltende Isomorphismen ist diese Körper eindeutig bestimmt. Natürliche Zahlen als Teilmenge der reellen Zahlen 262 Neben dem in der Zahlentheorie üblichen Aufbau der natürlichen Zahlen mittels der Peanoschen Axiome, können die natürlichen Zahlen N auch als Teilmenge der reellen Zahlen charakterisiert werden. Induktive Mengen Eine Teilmenge I ⊆ R heißt induktiv genau dann, wenn 0∈I ∀ x: x ∈ I ⇒ (x+1) ∈ I Eine induktive Menge umfasst stets dass, was man anschaulich unter den natürlichen Zahlen versteht; sie kann jedoch auch größer sein. Es gibt z.B. eine induktive Menge I, so dass {1/2, 3/2, …} ⊆ I ist. J = {I: I ⊂ R, I ist induktiv} entspricht der Menge aller induktiven Mengen aus R. Man definiert die natürlichen Zahlen N als Durchschnitt aller induktiven Teilmengen von R. N = ∩ J = {x ∈ R: ∀ I ∈ J: x ∈ I} (1) Es gilt: Die Menge N in (1) ist die kleinste induktive Teilmenge von N. Dies liefert die Rechtfertigung für das Prinzip der vollständigen Induktion. Gilt eine Aussage H für 0 und kann man aus der Gültigkeit von H auf die Gültigkeit für n+1 schließen, so gilt H für alle natürlichen Zahlen. Körper der algebraischen Zahlen Die Menge der algebraischen Zahlen ist abzählbar und bildet einen Körper. Der Körper der algebraischen Zahlen ist algebraisch abgeschlossen, d.h. jedes Polynom mit algebraischen Koeffizienten besitzt nur algebraische Nullstellen. Dieser Körper ist ein minimaler algebraisch abgeschlossener Oberkörper von Q und damit ein algebraischer Abschluss von Q. Dieser Körper hat viele Automorphismen und jeder davon liefert eine Einbettung in die komplexen Zahlen C, d.h., es gibt keine kanonische Einbettung. Zum Beispiel kann man die Nullstellen des Polynoms x² + 1 innerhalb des Körpers der algebraischen Zahlen nicht voneinander unterscheiden. Somit kann man wählen, welche der beiden als imaginäre Einheit i genutzt wird. Die andere Nullstelle dieses Polynoms ist dann eindeutig bestimmt und hat den Wert -i. Oberhalb des Körpers der rationalen Zahlen und unterhalb des Körpers der algebraischen Zahlen befinden sich unendlich viele Zwischenkörper, zum Beispiel die Menge aller Zahlen der Form a + b·q, wobei a und b rationale Zahlen sind und q die Quadratwurzel einer rationalen Zahl r ist. Auch der Körper der mit Zirkel und Lineal aus {0, 1} konstruierbaren Punkte der komplexen Zahlenebene ist ein solcher algebraischer Zwischenkörper. In der Galoistheorie werden diese Zwischenkörper untersucht, um Einblicke über die Lösbarkeit oder Nichtlösbarkeit von Gleichungen zu erhalten. Ein Resultat der Galoistheorie ist, dass zwar jede komplexe Zahl algebraisch durch "Radikale darstellbar" ist, die man aus rationalen Zahlen durch Verwendung der Grundrechenarten +,-,·,/ und Ziehen n-ter Wurzeln erhalten kann, umgekehrt aber algebraische Zahlen existieren, die man nicht in dieser Weise darstellen kann. Alle diese Zahlen sind Nullstellen von Polynomen des Grades > 4. Algebraische Zahlen, die sogar Nullstellen eines normierten Polynoms mit ganzzahligen Koeffizienten sind, heißen algebraische Ganzzahlen oder ganzalgebraische Zahlen. Die ganzalgebraischen Zahlen, die rational sind, sind genau die ganzen Zahlen. Die ganzalgebraischen Zahlen bilden einen Unterring der algebraischen Zahlen. Endliche Gruppen Eine endliche Gruppe ist eine algebraische Gruppe endlicher Ordnung, d.h. mit endlich vielen Elementen. Typische Vertreter sind die Restklassengruppen, welche zu Restklassenkörpern oder -ringen erweitert werden können. Anfang 2000 ist noch keine Gleichung bekannt, mit der die Anzahl nicht isomorpher endlicher Gruppen einer Ordnung n berechnet werden kann. Die Liste enthält eine Aufstellung der Anzahl endlicher Gruppen einer Ordnung n. Nach A steht die Anzahl Abelscher Gruppen, nach NA nichtabelscher Gruppen. Bis zur Ordnung 15 werden alle Gruppen genannt. Z(n) ist die zyklische Gruppe, A(n) die alternierende Gruppe, D(n) die dihedrale Gruppe, T die kubische Gruppe, Q die Gruppe der Quaternionen. x symbolisiert das direkte Produkt zweier Gruppen. Ordnung 1 2 3 4 5 6 7 A 1 1 1 2 1 1 1 NA 0 0 0 0 0 1 0 Vertreter Gruppe des Einselements Z2 Z3 Z2 ⊗ Z2, Z4 Z5 Z 6 = Z2 ⊗ Z3, D 3 Z7 263 8 9 10 11 12 13 14 15 3 2 1 1 2 1 1 1 2 0 1 1 3 0 1 0 Z2 ⊗ Z2 ⊗ Z2, Z2 ⊗ Z4, Z 8, Q 8, D 4 Z 9, Z3 ⊗ Z3 Z 10, D 5 Z 11 Z 12, A 4, D 6, T, Z2 ⊗ Z6 Z 13 Z 14, D 7 Z 15 Isomorphietypen Ordnung 1 Es gibt nur eine Gruppe mit einem Element, die nur aus dem neutralen Element bestehende Gruppe <e> = (e, ·). Eigenschaften: abelsche Gruppe, zyklische Gruppe C1 Ordnung 2 Bis auf Isomorphie gibt es nur eine Gruppe mit 2 Elementen, bestehend aus e und a, wobei gilt a² = e. Eigenschaften: abelsche Gruppe, zyklische Gruppe C2, triviale Diedergruppe D1 Ordnung 3 Bis auf Isomorphie gibt es nur eine Gruppe mit 3 Elementen. Eigenschaften: abelsche Gruppe, zyklische Gruppe C3 Ordnung 4 Bei den vierelementigen Gruppen gibt es zwei Isomorphietypen. 1.Zyklische Gruppe, Eigenschaften: abelsche Gruppe, zyklische Gruppe C4 2. Kleinsche Vierergruppe Gruppe, die von zwei Elementen mit den Beziehungen a² = b² = (ab)² = e erzeugt wird. Eigenschaften: abelsche Gruppe, Diedergruppe D2, Symmetriegruppe des Rechtecks, direktes Produkt der zyklischen Gruppen C2 × C2 Ordnung 5 Bis auf Isomorphie gibt es nur eine Gruppe mit 5 Elementen, diese ist isomorph zur zyklischen Gruppe mit 5 Elementen; zyklische Gruppe C5 Zyklische Gruppen Eine Gruppe G, die nur aus den Potenzen g, g², g³, …, gn = e eines Elementes g besteht, heißt zyklische Gruppe Zn der Ordnung n. Ein Element g, aus dessen Potenzen Zn besteht, heißt erzeugendes Element von Zn. Zu jeder natürlichen Zahl n gibt es genau eine zyklische Gruppe der Ordnung n. Sie ist kommutativ und isomorph zur additiven Restklassengruppe modulo n. Es sei G eine von g erzeugte zyklische Gruppe. Dann gelten die folgenden Aussagen: a) Jede Untergruppe U von G ist zyklisch. b) Hat G = {e, g, g², g3, … gn-1} die Ordnung n, so gibt es zu jeder natürlichen Zahl d, die n teilt, genau eine zyklische Untergruppe Ud der Ordnung d von G, die von n/d erzeugt wird. (in der Abbildung: links Struktur, rechts Multiplikationstafel) zyklische Gruppe Z2 Z2 ist die einzige endliche Gruppe der Ordnung 2, abelsch und zyklisch. Beispiele: Integeraddition modulo 2 Die Gruppe enthält das Einselement und ein Element A mit A² = 1 zyklische Gruppe Z3 Z3 ist die einzige Gruppe der Ordnung 3, abelsch und zyklisch. Beispiel: Addition natürlicher Zahlen modulo 3 Zyklische Gruppe Z4 Z4 ist eine der zwei Gruppen der Ordnung 4 (vier Elemente). Die Gruppe ist ähnlich zur Gruppe Z2 ⊗ Z2. Sie ist abelsch, allerdings auch zyklisch. Beispiele: Modulo Multiplikationsgruppen M5 und M10 Die Gruppe kann durch die Zuordnung 1 = 1, A = i, B = -1 und C = -i, als Multiplikationsgruppe der komplexen Zahlen 1, -1, i und -i 264 interpretiert werden. Die untere Abbildung und das zugehörige Beispiel entstammen der sowjetischen mathematischen Schülerzeitschrift "Quant" 2/87: Betrachtet man einen Wachposten, so kann und darf dieser eigentlich nur vier Bewegungen ausführen: 90° nach links, 90° nach rechts, 180° drehen (Kehrtwendung) und natürlich Stillstehen. Führt der Wachtposten zwei Bewegungen nacheinander aus, so ergibt sich wieder eine der vier Bewegungen. Die zugehörige Gruppe ist gerade die zyklische Gruppe Z4, die Drehgruppe eines Quadrates. Kleinsche Vierergruppe Bei dieser 4 elementigen Gruppe handelt es sich um die Diedergruppe D2, die in der Kristallografie auch als 222 notiert wird. In der Mathematik wird sie Kleinsche Vierergruppe V4 genannt. Diese Gruppe ist die Symmetriegruppe des Rechtecks. Sie ist isomorph zum direkten Produkt Z2 x Z2. Die Kleinsche Vierergruppe ist die kleinste abelsche, nicht zyklische Gruppe. Die Gruppe wurde nach Felix Klein benannt, der sie in seinen "Vorlesungen über das Ikosaeder" 1884 Vierergruppe nannte, und wird oft mit dem Buchstaben V bezeichnet. Die Vierergruppe tritt als Symmetriegruppe eines Rechtecks, dass kein Quadrat ist, auf. Die vier Elemente sind dabei: die Identität, die Spiegelung an der waagerechten Mittelachse, die Spiegelung an der senkrechten Mittelachse und die 180°-Drehung um den Mittelpunkt des Rechtecks. Die drei Elemente ungleich der Identität haben die Ordnung 2. Eine Permutationsdarstellung von V liefert die Nummerierung der Ecken eines Rechtecks: V = e, (1,2)(3,4), (1,3)(2,4), (1,4)(2,3). In dieser Darstellung ist V die Kommutatorgruppe und damit ein Normalteiler der alternierenden Gruppe A4 und auch Normalteiler der symmetrischen Gruppe S4. In der Galoistheorie erklärt die Existenz der Kleinschen Vierergruppe die Existenz der Lösungsformel für Gleichungen vierten Grades. Die Einheitengruppe des Ringes Z/8Z, das sind die Restklassen von 1, 3, 5 und 7 unter Multiplikation modulo 8, ist isomorph zu V. Kleinsche Vierergruppe (2) Die Kleinsche Vierergruppe tritt als die Symmetriegruppe eines nicht gleichseitigen Rechtecks, d.h. kein Quadrat, auf. Die vier Elemente sind dabei: 1 als die Identität oder Drehung um 0°, a als die Spiegelung an der senkrechten Mittelachse, b als die Spiegelung an der waagerechten Mittelachse, und c = ab als die 180°-Drehung um den Mittelpunkt, die auch als Kombination der horizontalen und vertikalen Spiegelung aufgefasst werden kann. (A,B,C,D) → (A,B,C,D), das Element 1 darstellend (A,B,C,D) → (B,A,D,C), das Element a darstellend (A,B,C,D) → (D,C,B,A), das Element b darstellend (A,B,C,D) → (C,D,A,B), das Element ab darstellend Die Vierergruppe ist Kommutatorgruppe und ein Normalteiler der alternierenden Gruppe A4 und auch Normalteiler der symmetrischen Gruppe S4. In der Galoistheorie erklärt die Existenz der Kleinschen Vierergruppe die Existenz der Lösungsformel für Gleichungen vierten Grades. Zyklische Gruppe Z5 Die Gruppe Z5 ist die einzige Gruppe der Ordnung 5, abelsch und zyklisch. Da die Ordnung 5 Primzahl ist, existieren außer den trivialen Untergruppen keine anderen Untergruppen. Z5 ist eine einfache Gruppe. In der Kristallographie tritt sie nicht auf, da in den dort betrachteten Symmetriegruppen keine Drehungen der Ordnung 5 vorkommen können Beispiel: Addition natürlicher Zahlen modulo 5 Zyklische Gruppe Z6 Z6 ist eine der zwei Gruppen der Ordnung 6. Sie ist isomorph zur Gruppe Z2 ⊗ Z3, abelsch, zyklisch. Beispiele: Modulo Multiplikationsgruppen M7, M9, M14; Addition natürlicher Zahlen modulo 6 265 Restklassengruppe modulo 6 bezüglich der Addition als Verknüpfung Z6 = {e, g, g², g³, g4, g5} = {0, 1, 2, 3, 4, 5}, erzeugendes Element 1 (I) = {0, 5, 4, 3, 2, 1}, erzeugendes Element 5 (II) Zyklische Untergruppen Z3 = {e, g, g²} = {0, 2, 4}, erzeugendes Element 2 = {0, 4, 2}, erzeugendes Element 4 Z2 = {e, g} = {0, 3}, erzeugendes Element 3 Restklassengruppe modulo 7 bezüglich der Multiplikation als Verknüpfung Z6 = {e, g, g², g³, g4, g5} = {1, 3, 2, 6, 4, 5}, erzeugendes Element 3 (III) = {1, 5, 4, 6, 2, 3}, erzeugendes Element 5 (IV) Zyklische Untergruppen Z3 = {e, g, g²} = {1, 2, 4} , erzeugendes Element 2 = {1, 4, 2} , erzeugendes Element 4 Z2 = {e, g} = {1, 6}, erzeugendes Element 6 Zyklische Gruppe von Einheitswurzeln Die zyklische Gruppe der 6-ten Einheitswurzeln bezüglich der Multiplikation als Verknüpfung ist isomorph zur zyklischen Gruppe Z6. Kreisteilungsgleichung z6 = 1 , z ist komplexe Zahl Lösungen zk = cos (k/6 2π) + i sin (k/6 2π), k ∈ {0, 1, 2, 3, 4, 5} Zyklische Gruppe der Ordnung 6 Z6 = {e, g, g², g³, g4, g5} = {1, z1, z2, z3, z4, z5} Linksdrehung = {1, z5, z4, z3, z2, z1} Rechtsdrehung Zyklische Untergruppen Z3 = {e, g, g²} = {1, z2, z4} Linksdrehung = {1, z4, z2} Rechtsdrehung Z2 = {e, g} = {1, z3} Zyklische Gruppe Z7 Z7 ist die einzige Gruppe der Ordnung 7, abelsch und zyklisch. In der Kristallographie tritt sie nicht auf, da in den dort betrachteten Symmetriegruppen keine Drehungen der Ordnung 7 vorkommen können Beispiel: Addition natürlicher Zahlen modulo 7 Diedergruppe Die n.te Diedergruppe (di-eder gesprochen) wird bezeichnet mit Dn oder D2n. Sie ist für n > 2 geometrisch erklärt als Symmetriegruppe der Drehungen und Spiegelungen eines regelmäßigen n-Ecks ("Dieder" = "Zweiflach"). Die Gruppe D1 besteht neben der Identität nur aus einer einzigen Spiegelung und hat somit zwei Elemente. Die Gruppe D2 beschreibt die Symmetriegruppe eines nichtquadratischen Rechtecks oder einer Strecke. D3 ist die Symmetriegruppe des gleichseitigen Dreiecks, D4 die Symmetriegruppe des Quadrates. Nach Durchnummerierung der Ecken kann man die Diedergruppe für n > 2 als Untergruppe der n.ten symmetrischen Gruppe Sn, also als Permutationsgruppe auffassen. Die Diedergruppe wird erzeugt von zwei Abbildungen, der Drehung um den Winkel α = 2π / n und der Spiegelung A an der Symmetrieachse durch den Punkt 1. Die einzelnen Erzeuger erzeugen je eine Untergruppe der Diedergruppe, die isomorph zu den zyklischen Gruppen Zn beziehungsweise Z2 sind. Die Ordnung der n.ten Diedergruppe ist 2n. Die durch die Permutation definierte Zahlenverknüpfung wird bei Prüfsummenverfahren als Alternative zu diversen modulo-basierten Verfahren angewendet. Die deutschen Banknoten besaßen früher DiederPrüfsummen. Geldschein-Prüfcode Durch die Bundesbank der BRD wurde ein System zur Konstruktion von Prüfcodes auf Geldscheinen genutzt, dass die Diedergruppe D5 verwendet. Das Interessante an dieser Gruppe ist, dass sie nicht kommutativ ist. Zum Beispiel gilt 1·6 = 7 aber 6·1 = 5. Diese Eigenschaft ist für die Erkennung von Zahlendrehern wichtig. Auf den DM-Scheinen wurde die Prüfziffer derart gewählt, dass die Dieder-Verknüpfung aller Stellen stets 0 ergibt. 266 Außer 8 Ziffern enthalten die Prüfcodes drei Buchstaben, an der 1., 2. und 10.Stelle. Die Buchstaben dienten ebenfalls der Absicherung gegen Fehler, besonders der letzte verhindert Dreher der letzten beiden Positionen. Dabei wurden die Buchstaben während der Kontrolle durch Ziffern ersetzt: A D G K L N S U Y Z 0 1 2 3 4 5 6 7 8 9 Um weitere Zahlendreher zu unterbinden, werden die einzelnen Ziffern permutiert. Eine Permutation, die dies leistet, ist p = {1, 5, 7, 6, 2, 8, 3, 0, 9, 4}. Diese wird auf die erste Ziffer angewandt. Die Permutation für die 2. bis 10.Ziffer sind 5, 8, 0, 3, 7, 9, 6, 1, 4, 2, 8, 9, 1, 6, 0, 4, 3, 5, 2, 7, 9, 4, 5, 3, 1, 2, 6, 8, 7, 0, 4, 2, 8, 6, 5, 7, 3, 9, 0, 1, 2, 7, 9, 3, 8, 0, 6, 4, 1, 5, 7, 0, 4, 6, 9, 1, 3, 2, 5, 8, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 5, 7, 6, 2, 8, 3, 0, 9, 4, 5, 8, 0, 3, 7, 9, 6, 1, 4, 2 Die 11.Ziffer wird nicht permutiert. Abbildung: 10 DM-Schein mit Prüfcode Dihedrale Gruppe D3 Die dihedrale Gruppe wird auch Diedergruppe genannt. Sie ist eine der beiden Gruppen der Ordnung 6. Sie ist isomorph zur symmetrischen Gruppe S3, nicht-abelsche und nicht-kommutative Gruppe. Sie ist die kleinste nicht-Abelsche Gruppe. Beispiele: Symmetriegruppe des gleichseitigen Dreiecks, Permutationsgruppe von drei Elementen Dihedrale Gruppe D4 Eine der beiden nicht-Abelschen Gruppen der Ordnung 8, auch OktaGruppe genannt. Ist isomorph zur Symmetriegruppe des Quadrates Untergruppen der Diedergruppe D3 Untergruppen von D3 können nach dem Satz von Lagrange nur die Mächtigkeiten 1, 2, 3 und 6 haben, da die Mächtigkeit von D3 gleich 6 ist. Hij sei eine Untergruppe von D3, wobei i die Mächtigkeit dieser Untergruppe bezeichnet und j der Nummerierung dient. Als Untergruppe mit der Mächtigkeit 1 kommt nur H1 = {e} in Frage, da das Einselement in jeder Gruppe vorhanden sein muss. Untergruppen mit der Mächtigkeit 2: H21 = {e,A}, H22 = {e,B}, H23 = {e,C} Diese bestehen jeweils aus dem Einselement und einem anderem Element, das sein eigenes Inverses ist. Diese Forderung erfüllen die Spiegelungen am gleichseitigen Dreieck. Untergruppen mit der Mächtigkeit 3: Würde die Untergruppe eine Spiegelung enthalten, wäre eine weitere Spiegelung für die Mächtigkeit 3 nötig. Die Verknüpfung von zwei verschiedenen Spiegelungen ergibt aber eine Drehung. Die Untergruppe 267 wäre nicht abgeschlossen. Diese Untergruppe muss daher zwei inverse Drehungen beinhalten, d.h. es ist nur H3 {e,D,E} möglich, die Drehgruppe des regulären Dreiecks. Von den Untergruppen von D3 sind H1, H3 und D3 selbst Normalteiler. Bewegungsgruppe des Quadrates D4 Die Bewegungsgruppe des Quadrates ist eine nicht-Abelsche Gruppe der Ordnung 8, auch Okta-Gruppe genannt. Die Automorphismengruppe von D4 ist isomorph zu D4. Die Gruppe lässt sich durch die acht Bewegungen (I, A bis G) beschreiben. Diese affinen Bewegungen überführen das Quadrat wieder in ein kongruentes Quadrat. I identische Abbildung A Drehung um Quadratmittelpunkt mit 90° B Drehung um Quadratmittelpunkt mit 180° C Drehung um Quadratmittelpunkt mit 270° D Spiegelung an Strecke EG E Spiegelung an Strecke AC F Spiegelung an Strecke FH G Spiegelung an Strecke BD Die Gruppe besitzt 10 Untergruppen {I}, {I,B}, {I,D}, {I,E}, {I,F}, {I,G}, {I,A,B,C}, {I,B,D,F}, {I,B,E,G} und D4. Von diesen sind {I}, {I,B}, {I,A,B,C}, {I,B,D,F}, {I,B,E,G} und D4 Normalteiler. dung Gruppen der Ordnung 8 Gruppe Z2 ⊗ Z2 ⊗ Z2 eine der drei Abelschen Gruppe, der fünf Gruppen der Ordnung 8; entspricht der Multplikationsgruppe modulo 24 Gruppe Z2 ⊗ Z4 abelsche Gruppe der Ordnung 8 entspricht den Mulitplikationsgruppen modulo 15, 16, 20 und 30 Endliche Gruppe Q8 Eine der zwei nicht-Abelschen Gruppen der insgesamt 5 endlichen Gruppen der Ordnung 8. Diese Gruppe hat die Multiplikationstafel der Quaternionen ± 1, ± i, ± j, ± k und wird deshalb auch Quaternionengruppe genannt. Quaternionen: {±E, ±I, ±J, ±K}. Jedes dieser 8 Elemente kann man mit einer 2 x 2-Matrix identifizieren Mit der üblichen Multiplikation von Matrizen und der Relation i² = -1 erhält man die multiplikative Gruppe Q der Quaternionen. Für Anwendungen in der Dynamik, Astronomie und Wellentheorie suchte Hamilton fünfzehn Jahre lang nach einer geeigneten Multiplikation in der vierten Dimension. Die Automorphismengruppe von Q8 ist isomorph zur symmetrischen Gruppe S4. Auf einem Spaziergang kam ihm dann die geniale Idee, einfach auf das Kommutativgesetz zu verzichten. Voller Begeisterung über seine Entdeckung ritzte er sofort die Formeln in den Pfeiler einer Brücke, auf der er gerade stand. (siehe Quaternionen) Dies war allerdings auch der Beginn einer Tragödie, denn von diesem Zeitpunkt an arbeitete er Tag und Nacht daran, mit seinen Quaternionen den ganzen Kosmos erklären zu wollen. Er verfiel dem Alkohol, und nach seinem Tode entdeckte man in seinem Arbeitszimmer unter Bergen mathematischer Aufzeichnungen eine unglaubliche Menge von Tellern mit eingetrocknetem Essen. Gruppe der Ordnung 12 Die endliche Gruppe Z2 ⊗ Z6 ist eine Gruppe der Ordnung 12 und das direkte Produkt der zyklischen Gruppen Z2 und Z6. Sie ist eine der beiden Abelschen Gruppen der Ordnung 12. Die andere Abelsche Gruppe dieser Ordnung ist die zyklische Gruppe Z12. Die Abbildung zeigt die Multiplikationstafel von Z2 ⊗ Z6, wobei die Elemente durch unterschiedliche Farben charakterisiert werden. Restklassengruppen modulo n mit n = 21, 28, 36 und 42 sind isomorph zu Z2 ⊗ Z6. Die Gruppe besitzt 10 Untergruppen: die triviale Untergruppe, 3 Gruppen der Ordnung 2, 1 der Ordnung 3, 1 der Länge 4, 3 der Länge 6 und natürlich die ganze Gruppe. 268 Weitere Gruppen der Ordnung 12 sind die abelsche, zyklische Gruppe Z12, und die nichtabelschen Gruppen: A4 die alternierende Gruppe, D6 die dihedrale Gruppe der Ordnung 6 und eine Gruppe T, die als semidirektes Produkt von Z4 und Z3 aufgefasst werden kann. Die dihedrale Gruppe D6 ist isomorph zu S3 x Z2 . Gruppen der Ordnung 9 Es existieren 2 abelsche Gruppen: Z9 und Z3 x Z3. Gruppen der Ordnung 10 Es existieren 2 Gruppen, eine abelsche Z10 und eine nichtabelsche D5. Gruppe T der Ordnung 12 Die nichtabelsche Gruppe T der Ordnung 12 kann durch <s, t; s6 = 1, s³ = t², sts = t> charakterisiert werden. T ist damit das semidirekte Produkt der zyklischen Gruppen Z3 und Z4. Äquivalent ist auch die Definition mit <x, y; x4 = y³ = 1, yxy = x> Betrachtet man die Elemente der Gruppe 1 = 00 ; x = 10 ; x² = 20 ; x³ = 30 ; y = 01 ; y² = 02 ; xy = 11 ; x²y = 21 ; x3y = 31 ; xy² = 12 ; x²y² = 22 ; x³y² = 32 ergibt sich die links stehende Gruppentafel. Eine Matrizendarstellung ergibt sich mit x = (0 wobei w die nichtreelle kubische Einheitswurzel ist. i i 0) und y = (w 00 w²) Endliche Gruppen der Ordnung 14 und 15 Gruppen der Ordnung 14 existieren 2, eine abelsche, die zyklische Gruppe Z14, und eine nichtabelsche, die dihedrale Gruppe D7. Mit der Ordnung 15 gibt es nur eine Gruppe, die zyklische Gruppe Z15. Gruppen der Ordnung 16 Folgende Gruppen der Ordnung 16 existieren: Es gibt 14 Isomorphieklassen von Gruppen der Ordnung 16, d.h. 14 verschiedene endliche Gruppen der Ordnung 16, 5 abelsche und 9 nichtabelsche. Folgende Gruppen der Ordnung 16 existieren: <16,1>: die zyklische Gruppe Z16 <16,2>: das direkte Produkt zyklischer Gruppen Z4 x Z4 <16,3>: das direkte Produkt zyklischer Gruppen Z4 x Z2 x Z2 <16,4>: das direkte Produkt zyklischer Gruppen Z2 x Z2 x Z2 x Z2 <16,5>: das direkte Produkt zyklischer Gruppen Z8 x Z2 <16,6>: die dihedrale Gruppe: D8 = < a,b | a² = b² = 1, (ab)8 = 1 >, Abbildung 1 <16,7>: das direkte Produkt einer dihedralen Gruppe mit einer zyklischen Gruppe D4 x Z2, Abbildung 2 <16,8>: das direkte Produkt der Quaternionengruppe mit einer zyklischen Gruppe Q x Z2, Abbildung 4 <16,9>: die semihedrale Gruppe der Ordnung 16 mit der Darstellung <s,t: s8 = t² = 1, st = ts³>, Abbildung 7 <16,10>:die Gruppe der Ordnung 16 mit der Darstellung < s,t: s4 = t4 = 1, st = ts³>, Abbildung 5 <16,11>:die Gruppe der Ordnung 16 mit der Darstellung <a,b,c: a4 = b² = c² = 1, cbca²b = 1, bab = a, cac = a>, Abbildung 6 <16,12>:die Gruppe der Ordnung 16 mit der Darstellung <s,t: s4 = t4 = 1, stst = 1, ts³ = st³> <16,13>:die verallgemeinerte Quaternionengruppe mit der Darstellung <s,t: s8 = 1, s4 = t², sts = t>, Abbildung 3 <16,14>:die modulare Gruppe der Ordnung 16 mit der Darstellung <s,t: s8 = t² = 1, st = ts5> sie besitzt die Elemente sktm mit k = 0, 1, …, 7 und m = 0, 1 Gruppen der Ordnung 18 Gruppen der Ordnung 18 gibt es 5, die zwei abelschen Gruppen Z18 und Z6 x Z3 und 3 nichtabelsche: <18,3>: die dihedrale Gruppe D9 <18,4>: das direkte Produkt S3 x Z3 <18,4>: das semidirekte Produkt Z3 x Z3 mit Z2 mit der Darstellung <x,y,z: x² = y³ = z³ = 1, yz = zy, yxy = x, zxz = x> Gruppen der Ordnung 20 269 Es gibt 5 Gruppen der Ordnung 20, zwei abelsche und 3 nichtabelsche. <20,1>: die zyklische Gruppe Z20 <20,2>: das direkte Produkt zyklischer Gruppen Z10 x Z2 <20,3>: die dihedrale Gruppe D10 <20,4>: das semidirekte Produkt Z5 mit Z4 mit der Darstellung <s,t: s4 = t5 = 1, tst = s> <20,5>: die Frobenius-Gruppe der Ordnung 20 mit der Darstellung <s,t: s4 = t5 = 1, ts = st²> diese Gruppe ist die Galois-Gruppe von x5 - 2 über den rationalen Zahlen Gruppen der Ordnung 21 Es gibt 2 Gruppen der Ordnung 21, die abelsche Z21 und eine nichtabelsche Gruppe mit der Darstellung <a,b: a³ = b7 = 1, ba = ab²> diese Gruppe ist ebenfalls Frobenius-Gruppe und die Galois-Gruppe über den rationalen Zahlen von x7 - 14x5 + 56x³ -56x + 22 Gruppen der Ordnung 22 Als Gruppen der Ordnung 22 gibt es die abelsche Gruppe Z22 und die nichtabelsche, dihedrale Gruppe D11 Gruppen der Ordnung 25 zwei abelsche Gruppen Z25 und Z5 x Z5 Gruppen der Ordnung 26 die abelsche zyklische Gruppe Z26 und die nichtabelsche dihedrale Gruppe D13 Gruppen der Ordnung 24 U.a. existieren folgende Gruppen der Ordnung 24: <24,1>: < a,b | a8 = 1, b³ = 1, bab = a>, Z12, Z6, Z4, Z3, Z2 sind Untergruppen <24,2>: die zyklische Gruppe Z24: Z24 = Z8 x Z3 <24,3>: die lineare Gruppe über GF(3), Untergruppen Q4, Z2 SL(2,3) = < a,b | a4 = 1, a² = b², c³ = 1, aba = b , ac = cb , cab = bc > <24,4>: dizyklische Gruppe der Ordnung 24: Q12 = < a,b | a² = b6, b12 = 1, bab = a > Untergruppen Z12, Q6, Z6, Z4, Z33, Z2 <24,5>: direktes Produkt D6 x Z4 = S3 x Z4 <24,6>: dihedrale Gruppe D24, Untergruppen sind Z12, D12, Z6, Z2 x Z2, Z3, Z2 <24,7>: < a,b | a4 = 1, b6 = 1, bab = a >, Untergruppen D12, Z2 x Z6, Z6, Z2 x Z2, Z3, Z2 <24,8>: < a,b,c | a³ = 1, b4 = 1, c² = 1, bcb = c, aba = b, ac = ca > Untergruppen D12, Q6, Z2 x Z6, Z2 x Z2, Z3, Z2 <24,9>: direktes Produkt Z12 x Z2 = Z6 x Z4 = Z4 x Z3 x Z2 <24,13>: direktes Produkt A4 x Z2 <24,14>: direktes Produkt D12 x Z2 <24,15>: direktes Produkt Z6 x Z2 x Z2 Insgesamt gibt es 3 abelsche und 12 nichtabelsche Gruppen der Ordnung 24. Gruppen der Ordnung 27 5 Gruppen, davon 3 abelsche und 2 nichtabelsche <27,1>: die zyklische Gruppe Z27 <27,2>: das direkte Produkt Z9 x Z3 <27,3>: das direkte Produkt Z3 x Z3 x Z3 <27,4>: die nichtabelsche Gruppe mit der Darstellung <s,t: s9 = t³ = 1, st = ts4> <27,5>: die nichtabelsche Gruppe mit der Darstellung <x,y,z: x³ = y³ = z³ = 1, yz = zyx, xy = yx, xz = zx> Gruppen der Ordnung 28 <28,1>: die zyklische Gruppe Z28 <28,2>: das direkte Produkt Z14 x Z2 <28,3>: die nichtabelsche dihedrale Gruppe D14 <28,4>: das direkte Produkt dihedraler Gruppen D7 x D2 Gruppen der Ordnung 30 <30,1>: die zyklische Gruppe Z30 <30,2>: die nichtabelsche dihedrale Gruppe D15 <30,3>: das direkte Produkt einer dihedralen mit einer zyklischen Gruppe D5 x Z3 <30,4>: das direkte Produkt einer dihedralen mit einer zyklischen Gruppe D3 x Z5 Homomorphiesatz für Gruppen Die Menge der Nebenklassen eines Normalteilers N in einer Gruppe G wird bezüglich der Operation aN · bN = abN zu einer Gruppe, der Faktorgruppe von G nach N, die mit G/N bezeichnet wird. 270 Der folgende Satz beschreibt einen Zusammenhang zwischen homomorphen Bildern und Faktorgruppen einer Gruppe und wird deshalb Homomorphiesatz für Gruppen genannt: Ein Gruppenhomomorphismus h: G1 → G2 bestimmt einen Normalteiler von G1 nämlich ker h = {a ∈ G1 | h(a) = e}. Die Faktorgruppe G1/ ker h ist isomorph zum homomorphen Bild h(G1) = {h(a) | a ∈ G1}. Umgekehrt bestimmt jeder Normalteiler N von G1 eine homomorphe Abbildung natN: G1 → G2/N mit natN(a) = aN. Diese Abbildung natN wird natürlicher Homomorphismus genannt. Homomorphiesatz für Ringe Ersetzt man im Homomorphiesatz für Gruppen den Begriff Normalteiler durch Ideal, so erhält man den Homomorphiesatz für Ringe: Ein Ringhomomorphismus h: R1 → R2 bestimmt ein Ideal von R1 nämlich ker h = {a ∈ R1 | h(a) = 0}. Die Faktorgruppe R1/ ker h ist isomorph zum homomorphen Bild h(R1) = {h(a) | a ∈ R1}. Umgekehrt bestimmt jedes Ideal I von R1 eine homomorphe Abbildung natI: R1 → R2/I mit natI(a) = a+I. Diese Abbildung natI wird natürlicher Homomorphismus genannt. Faktorring Zum 150.Geburtstag Dedekinds wurde die abgebildete Briefmarke in der DDR herausgegeben. Neben dem Porträt enthält sie eine Formel. Diese beschreibt die von Dedekind gefundene Primfaktorzerlegung in Faktorringen. Z ist ein faktorieller Ring, d.h. mit den Eigenschaften: eine Menge mit kommutativer und assoziativer Addition mit Null und inversen Elementen, kommutativer und assoziativer Multiplikation mit Eins Distributivgesetz, Eins und Null sind verschieden. Nullteilerfreiheit: Aus n·m = 0 folgt n = 0 oder m = 0, d.h. "Integritätsring" Faktorisierbarkeit: Jedes Element außer den Einheiten und der Null hat eine Zerlegung in irreduzible Elemente, die bis auf die Multiplikation der Faktoren mit Einheiten eindeutig bestimmt ist. In faktoriellen Ringen stimmen die irreduziblen Elemente und die Primelemente überein. Dedekind untersuchte andere Ringe von Zahlen darauf, ob sie faktoriell sind. Das erste Beispiel ist die Menge der Gauß'schen Zahlen Z[i], bestehend aus den komplexen Zahlen n + m·i mit n, m ganzzahlig. Z[i] wird durch die Gitterpunkte mit ganzzahligen Koordinatenwerten in der komplexen Zahlenebene dargestellt. Z[i] ist ein faktorieller Ring mit den Einheiten 1, -1, i, -i . Während z.B. 3 eine Primzahl in Z[i] ist, gilt dies nicht für alle natürlichen Primzahlen: Es ist z.B. 2 = (1+i)·(1-i) und 5 = (2+i)·(2-i), also sind 2 und 5 nicht prim in Z[i]. Die Faktoren 1 ± i und 2 ± i sind Primzahlen, also wurden für 2 und 5 die eindeutige Primfaktorzerlegung angegeben. Diese gilt aber nur bis auf die Multiplikation der Faktoren mit Einheiten; es gilt auch 5 = (1+2i)·(-1-2i). Das zweite Beispiel sein Z[d]; hier soll d für i·√5 stehen. Z[d] besteht aus allen Zahlen n + m·i·√5 mit n, m ganzzahlig und wird ebenfalls durch ein Gitter in der komplexen Zahlenebene dargestellt; 1 und -1 sind die einzigen Einheiten. Auch in Z[d] lassen sich die Zahlen irreduzibel faktorisieren, aber hier gilt nicht mehr die Eindeutigkeit. So ist z.B. 6 = 2·3 = (1+d)·(1-d). Alle vier Faktoren sind irreduzibel, aber nicht prim. Z[d] ist also kein faktorieller Ring. Dedekind fand einen Weg, eindeutige Primfaktorzerlegungen auch für Z[d] und andere Ringe ganzer Zahlen zu ermöglichen, allerdings nicht für Zahlen, sondern für Ideale. Echte Ideale sind von {0} und vom Ring verschieden. Ein Ideal p heißt Primideal, wenn aus x1·x2 in p folgt, dass x1 oder x2 in p liegt. In Z und Z[i] sind die Primideale genau die durch jeweils eine Primzahl erzeugten Ideale. Darauf bezieht sich der auf Richard Dedekind zurückgehende Satz: In Z[d] und anderen Ringen ganzer Zahlen in imaginär-quadratischen Zahlkörpern lässt sich jedes echte Ideal a eindeutig als endliches Produkt von Primidealen pi darstellen: a = p1^e1 p2^e2 ... pk^ek. Da Z[d] nicht faktoriell ist, gibt es hier im allgemeinen keine eindeutige Zerlegung in Ideale, die nur von einer einzigen Zahl erzeugt werden. Algebraischer Modul Ist R ein Ring und (V,+) eine abelsche Gruppe, so heißt V R-Modul oder Modul über R, wenn gilt (R...Skalare , V...Vektoren): ∀α, β ∈ R, ∀x ∈ V: (α + β) x = α x + β x ∀α ∈ R, ∀x, y ∈ V: α (x + y) = α x + α y ∀α, β ∈ R, ∀x ∈ V: α (β x) = (α β) x ∀x ∈ V: 1 x = x 271 Falls R ein Körper ist, so heißt V R-Vektorraum oder Vektorraum über R. Untermodul Aus x, y ∈ V' und α ∈ R folgt stets x + y ∈ V' und α x ∈ V' Aus x, y ∈ V' und α, β ∈ R folgt stets α x + β y ∈ V' Zahlbereiche (algebraische Strukturen) Der Teilbereich der gebrochenen Zahlen der Form (k/1) ist dem Bereich der natürlichen Zahlen hinsichtlich Rechenoperationen und Ordnung isomorph. Der Bereich der positiven rationalen Zahlen ist dem Bereich der absoluten rationalen Zahlen hinsichtlich Rechenoperationen und Ordnung isomorph. Zahlkörper Die rationalen Zahlen bilder einen archimedisch geordneten Körper. Der Körper der reellen Zahlen enthält einen Teilkörper, welcher dem Körper der rationalen Zahlen hinsichtlich Operationen und Ordnung isomorph ist. Restklassenkörper ist n Primzahl, so ist der Restklassenring Zn nullteilerfrei und Körper Diskretes Logarithmusproblem diskrete Exponentiation y = ax (mod p) ist innerhalb eines endlichen Körpers effizient ausführbar ... die Ermittlung des Index x von y zur Basis a heißt diskreter Logarithmus ... heute (1998) nicht in polynomialer Zeit ausführbar ... im Jahr 1801 veröffentlichte Gauß Tafeln bis p<100 ... der Algorithmus von Gordan mit exponentiellen Aufwand benötigt für p mit 512 Bit ca. 108 Jahre Index-Calculus-Algorithmus Der Index-Calculus-Algorithmus ist ein Algorithmus zur Berechnung des diskreten Logarithmus x = logα β Es sei G eine endliche zyklische Gruppe der Ordnung n, die durch α erzeugt wird. Es sei S = p1, p2, …, pt, die Faktorbasis, eine Untermenge von G mit der Eigenschaft, dass ein bedeutender Teil der Gruppenelemente sich als Produkt der Elemente S schreiben lässt. 1. Schritt: Es wird eine Zufallszahl a gewählt und versucht α a als Produkt der Elemente aus der Faktorbasis S zu schreiben: αa = Πi=1t piλi Wenn eine entsprechende Darstellung gefunden wurde kann eine lineare Kongruenz gebildet werden. a ≡ Σi=1t λi logα pi mod n Wenn eine genügend große Anzahl, mehr als t, an Relationen gefunden wurde, kann erwartet werden, dass das zugehörige lineare Gleichungssystem eine eindeutige Lösung für die Unbekannten logα pi mit 1 ≤ i ≤ t besitzt. 2. Schritt: In diesem Schritt werden die individuelle Logarithmen in G berechnet. β ∈ G ist gegeben. Es werden solange Zufallszahlen s gewählt, bis αs β sich als Produkt von Elementen aus S schreiben lässt αs β = Πi=1t pibi Es gilt: logα β = Σi=1t bi logα pi - s mod n Quelle http://de.wikipedia.org/wiki/Index-Calculus-Algorithmus Babystep-Giantstep-Algorithmus Der Babystep-Giantstep-Algorithmus berechnet den diskreten Logarithmus eines Elements einer zyklischen Gruppe. Der Algorithmus ist laufzeitmäßig dem Ausprobieren aller Möglichkeiten überlegen, aber dennoch für sehr große Gruppen praktisch nicht durchführbar. Sei G = <g> eine endliche zyklische Gruppe der Ordnung n und m = [√n]. a sei ein Gruppenelement, x = logga der diskrete Logarithmus von a zur Basis g, d.h. die modulo n eindeutig bestimmte Zahl mit a = gx. Mit Division mit Rest gibt es dann eindeutige 0 ≤ i, j < m mit x = im + j. Es gilt a = gx = gim + j, und damit gj = ag-im. Der Algorithmus berechnet gj für alle j und danach ag-im für wachsendes i, bis der Wert einem gj entspricht. Damit ergibt sich x = im + j. Algorithmus Eingabe: Endliche zyklische Gruppe G, Erzeuger g, Gruppenelement a Ausgabe: x = logga mit gx = a Berechne n = | G | Für alle j ∈ {0, …, m-1}: Berechne gj und speichere (j,gj) in einer Tabelle. Für alle i ∈ {0, …, m-1}: Berechne a(g-m)i und suche danach in der zweiten Spalte der Tabelle. Wenn gefunden, gib im + j aus. Wegen a(g-m)i = a(g-m)i-1 g-m lässt sich das Gruppenelement im letzten Schritt aus dem der vorhergehenden Iteration berechnen. 272 Für die Datenhaltung von (j,gj) empfiehlt es sich, eine Hashtabelle zu verwenden, wobei der Hash-Wert von gj berechnet wird. Sowohl Zeit- als auch Platzkomplexität liegen in O(√n). Prinzip der kleinsten Zahlen Für einen Zahlenbereich gilt das Prinzip der kleinsten Zahl, wenn jede nichtleere Teilmenge aus diesem Zahlenbereich eine kleinste Zahl besitzt Permanenzprinzip bei Zahlbereichserweiterungen Hermann Hankel formulierte 1867 das Prinzip von der Erhaltung der formalen Rechengesetze. Es besagt, dass bei Erweiterungen eines Zahlbereiches die Rechengesetze des Ausgangsbereiches nach Möglichkeit auch im erweiterten Bereich gelten sollen. Diese Forderung wird Permanenzprinzip genannt. Dabei handelt es sich weder um ein Axiom noch um einen Satz mit Beweiskraft, sondern um ein Prinzip. Es kann auch nicht erreicht werden, dass alle Gesetze des Ausgangsbereiches im erweiterten Zahlbereich unverändert gelten. Z.B. existieren im Bereich der komplexen Zahlen keine Monotoniegesetze mehr, da eine Größenrelation bei komplexen Zahlen nicht definiert werden kann. Betrachtet man den Aufbau der Zahlenbereiche mengentheoretisch, so bedeutet dies, dass der neue Bereich den vorhergehenden Zahlenbereich als Teilmenge enthalten sollte. Ganze Zahlen als Paare natürlicher Zahlen Entsprechend dem Permanenzprinzip erweitert man zum Beispiel die natürlichen Zahlen zu den ganzen Zahlen, indem jede ganze Zahl einem Paar natürlicher Zahlen (a, b) mit den Eigenschaften die natürliche Zahl a = (a+b, b) die Null 0 = (b, b) die negative Zahl -a = (b, a+b) entspricht. Die Grundoperationen werden dann (a,b) + (c,d) = (a+c, b+d) (a,b) · (c,d) = (ac +bd, ad + bc) (a,b) < (c,d) falls (a+d < b+c Galoistheorie, Galois-Gruppe Zusammenstellung einfacher Definitionen und Sätze des Galois-Theorie Zur Untersuchung der Wurzeln eines Polynoms f(x) = 0 werden der Körper K, der durch die Koeffizienten des Polynoms f(x) erzeugt wird, und der Zerfällungskörper F von f(x) über K betrachet. Ist F eine Körpererweiterung von K. Die Menge der Automorphismen φ: F -> F, so dass φ(a) = a für alle a von K ist, bildet mit der Nacheinanderausführung von Funktionen eine Gruppe. Definition: Ist F eine erweiterung des Körper K, so heißt die Menge {θ ∈ Aut(F) | θ(a) = a für alle a ∈ K} die Galois-Gruppe von F über K und wird mit Gal(F/K) bezeichnet. Definition: Ist K ein Körper, f(x) ∈ K[x], und ist F Zerfällungskörper von f(x) über K, dann wird Gal(F/K) die Galois-Gruppe von f(x) über K genannt, oder auch Galois-Gruppe der Gleichung f(x) = 0 in K. Satz: Ist F eine Körpererweiterung von K sowie f(x) ∈ K[x]. Dann definiert jedes Element von Gal(F/K) eine Permutation der Wurzeln von f(x), die in F liegen. Lemma: Es sei f(x) ∈ K[x] ein Polynom ohne doppelze Wurzlen und F der Zerfällungskörper von f(x) über K. Wenn φ: K -> L ein Körperisomorphismus ist, der f(x) auf g(x) ∈ L[x] abbildet und E ist der Zerfällungskörper von g(x) über L, dann existiert genau ein [F:K] Isomorphismus θ: F -> E, so dass θ(a) = φ(a) für alle a in K ist. Satz: Es sei K Körper, f(x) ∈ K[x], und F die Zerfällung von f(x) über K. Hat f(x) keine doppelten Wurzeln, dann ist |Gal(F/K)| = [F:K]. Folgerung: Ist K ein endlicher Körper, F eine Erweiterung von K mit [F:K] = m, dann ist Gal(F/K) eine zyklische Gruppe der Ordnung m. Definition: Es sei f(x) ein Polynom in K[x] und F ein Zerfällungskörper für f(x) über K. Hat f(x) die Faktorisierung f(x) = (x - r1)m1 (x - r2)m2 … (x - rt)mt über F, so hat die Wurzel ri die Vielfachheit mi. Ist mi = 1, so wird ri einfache Lösung genannt. Es sei f(x) ∈ K[x] mit f(x) = Σk=0t ak xk. Als formale Ableitung f'(x) von f(x) wird dann f'(x) = Σk=0t k ak xk-1 verstanden. Satz: Das Polynom f(x) in K[x] hat nur einfache Nullstellen, genau dann, wenn ggT(f(x),f'(x)) = 1 ist. 273 Satz: Es sei f(x) ein irreduzibles Polynom über dem Körper K. Dann hat f(x) keine mehrfachen Lösungen, wenn chr(K) = p ≠ 0 und f(x) von der Form ist f(x) = a0 + a1 xp + a2 x2p + … + an xnp. Definition: Ein Polynom f(x) über dem Körper K heißt separabel, wenn sein irreduziblen Faktoren keine einfachen Lösungen haben. Ein algebraische Körpererweiterung F von K ist separabel über K, wenn das Minimalpolynom jedes Elements von F separabel ist. Ein Körper K wird vollkommen genannt, wenn jedes Polynom über F separabel ist. Satz: Jeder Körper der Charakteristik 0 ist vollkommen. Ein Körper mit einer Charakteristik p > 0 ist vollkommen, genau dann, wenn jedes Element ein p-te Wurzel besitzt. Jeder endliche Körper ist vollkommen. Satz: Es sei F eine endliche Erweiterung über dem Körper K. Ist F separable über K, dann ist F eine einfache Erweiterung über K. Satz: Es sei F ein Körper und G eine Untergruppe von Aut(F). Dann ist FG = {a ∈ F | θ(a) = a für alle θ ∈ G} ein Unterkörper von F. FG wird dann G-invarianter Teilkörper von F genannt. Satz: Ist F Zerfällungskörper über K eines separierbaren Polynoms und G = Gal(F/K), so ist FG = K. Artinsches Lemma: Es sei G eine endliche Gruppe von Automorphismen über einem Körper F und K = FG. Dann gilt [F:K] ≤ |G| Definition: F sei algebraische Erweiterung des Körper K. F heißt dann normale Körpererweiterung von K, wenn jedes irreduzible Polynom in K[x], die eine Lösung in F enthält, ein Produkt von Linearfaktoren in F[x] ist. Theorem: Folgende Bedingungen sind für einen Erweiterungskörper F von K äquivalent (1) F ist Zerfällungskörper über K eines separablen Polynoms (2) K = FG für eine endliche Gruppe G von Automorphismen von F (3) F ist endliche, normale und separable Erweiterung von K Folgerung: Wenn F Erweiterungskörper von K mit K = FG für eine endliche Gruppe G von Automorphismen von F ist, so gilt G = Gal(F/K). Beispiel: Die Galois-Gruppe von GF(pn) über GF(p) ist zyklisch von der Ordnung n und wird von dem Automorphismus θ: θ(x) = xp für alle x in GF(pn) erzeugt. Dieser Automorphismus wird Frobenius-Automorphismus von GF(pn) genannt. Fundamentalsatz der Galois-Theorie: F sei der Zerfällungskörper eines separablen Polynoms über einem Körper K. Es sei weiter G = Gal(F/K). (a) Dann existiert eine 1-1-ordnungserhaltende Beziehung zwischen den Untergruppen und G und Unterkörpern von F, die in K enthalten sind: (i) Wenn H Untergruppe von G ist, dann ist der korrespondierende Teilkörper FH mit H = H Gal(F/F ). (ii) Wenn E Teilkörper von F ist und in K enthalten, dann ist die korrespondierende Untergruppe von G die Untergruppe H = Gal(F/E) mit E = FH. (b) Für jede Untergruppe H von G gilt [F:FH] = | H | und [FH:K] = [G:H]. (c) Die Untergruppe H ist genau dann normal, wenn der Teilkörper E = FH eine normale Erweiterung von K ist. Dann gilt Gal(E/K) ≅ Gal(F/K) / Gal(F/E). Als Folgerung kann vereinfacht gesagt werden, dass normale Untergruppen normalen Körpererweiterungen zugeordnet werden können. Folgerungssatz: F sei Zerfällungskörper eines separablen Polynoms über dem Körper K. E sei Teilkörper mit K ⊆ E ⊆ F, mit H = Gal(F/E). Wenn φ ∈ Gal(F/K) gilt, so ist Gal(F/φ(E)) = φ H φ-1. Fundamentalsatz der Algebra: Jedes Polynom in C[x] hat eine Lösung in den komplexen Zahlen C. Lösbarkeit in Radikalen Definition: Ein Erweiterungskörper F über K wird radikale Erweiterung von K genannt, wenn Elemente u1, u2, … in F existieren, so dass (i) F = K(u1, u2, …, um) und (ii) u1n1 ∈ K und uini ∈ K(u1, …, ui-1) für i = 2, …, m und n1, n2, …, nm ∈ Z. 274 Für f(x) ∈ K[x] heißt die Polynomgleichung f(x) = 0 lösbar in Radikalen, wenn eine radikale Erweiterung F von K existiert, die alle Lösungen von f(x) enthält. Satz: Es sei F ein Zerfällungskörper von xn - 1 über dem Körper K der Charakteristik Null. Dann ist Gal(F/K) eine abelsche Gruppe. Theorem: Es sei K Körper der Charakteristik 0, der alle n-ten Wurzeln der Einheit enthält. Es sei a ∈ K und F Zerfällungskörper von xn-a über K. Dann ist Gal(F/K) zyklische Gruppe, deren Ordnung Teiler von n ist. Theorem: p sei Primzahl. Der Körper K enthalte alle p-ten Wurzeln der Einheit und F sei Erweiterung von K. Wenn [F:K] = |Gal(F/K)| = p ist, dann ist F = K(u) für einige u ∈ F, so dass up ∈ K. Lemma: K ist Körper der Charakteristik 0 und E eine radikale Erweiterung von K. Dann existiert eine Erweiterung F von E, die normale radikale Erweiterung von K ist. Theorem: f(x) sei Polynom über dem Körper K der Charakteristik 0. Die Gleichung f(x) = 0 ist lösbar durch Radikale genau dann, wenn die Galois-Gruppe von f(x) über K auflösbar ist. Lemma: Jede Untergruppe von S5, die eine Transposition und einen Zyklus der Länge 5 enthält, ist S5 selbst. Und da die symmetrische Gruppe Sn für n > 4 nicht auflösbar ist: Theorem: Es existiert ein Polynom des Grades 5 mit rationalen Koeffizienten, das nicht in Radikalen lösbar ist. Algebra (Struktur) Eine Algebra (Plural: Algebren) ist eine Verallgemeinerung des Begriffes Ring. Es gibt zwei verschiedene Arten von Algebren: 1) Boolesche Algebren, insbesondere Mengenalgebren wie z.B. σ-Algebren 2) Algebren über Ringen, die eine Synthese aus den Begriffen Vektorraum und Ring darstellen, d.h. die den Vektorraum- und den Ringeigenschaften genügt. Eine Algebra A über einem Körper k ist ein k-Vektorraum mit einer k-bilinearen Verknüpfung A × A → A Multiplikation genannt, die durch a·b oder ab symbolisiert wird. Das bedeutet für Elemente x, y, z von A und Skalare λ in k: (x + y) · z = xy + yz x · (y + z) = xy + xz λ · (xy) = (λ x) · y = x · (λ y) Beispiel: Die Menge der n x n-Matrizen mit der gewöhnlichen Matrizenaddition und -multiplikation ist eine Algebra. Die Eigenschaften assoziativ, kommutativ oder unitär werden häufig vorausgesetzt. Eine assoziative Algebra ist eine Algebra, in der für die Multiplikation das Assoziativgesetz gilt. Eine assoziative Algebra ist ein Ring. Eine kommutative Algebra ist eine, meist assoziative, Algebra, in der für die Multiplikation das Kommutativgesetz gilt. Eine unitäre Algebra ist eine Algebra mit einem Einselement. Unitäre assoziative Algebren A über einem kommutativen Grundring R mit Einselement entsprechen unitären Ringhomomorphismen R → A, deren Bild im Zentrum von A liegt. Eine Divisionsalgebra ist eine Algebra, in der man dividieren kann, d.h. in der Gleichungen ax = b oder xa = b für a ≠ 0 stets lösbar sind. Eine Lie-Algebra ist eine Algebra, in der die beiden Bedingungen gelten; das Produkt wird in Lie-Algebren als [x, y] geschrieben: [x, x] = 0 [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0 ; Jacobi-Identität Assoziative Algebra Ein Vektorraum B über einem Körper A oder ein Modul B über einem Ring A zusammen mit einer bilinearen Abbildung •: B × B → B ; (a, b) → a • b heißt assoziative Algebra, wenn das Assoziativgesetz gilt: a • (b • c) = (a • b) • c Es handelt sich um eine spezielle Algebra. Beispiele: Die Menge aller Polynome mit reellen oder komplexen Koeffizienten bilden eine assoziative Algebra über den reellen bzw. den komplexen Zahlen. Die linearen Abbildungen auf einem Vektorraum bilden mit der Verkettung eine assoziative Algebra Der Vektorraum aller reell- oder komplexwertigen Funktionen auf einem beliebigen topologischem Raum bildet eine assoziative Algebra; dabei werden die Funktionen punktweise addiert und multipliziert. Der Vektorraum aller stetigen reell- oder komplexwertigen Funktionen auf einem Banachraum bildet eine assoziative Algebra, bzw. sogar eine Banach-Algebra. Die Menge aller n × n Matrizen zusammen mit der Matrizenmultiplikation bilden eine assoziative Algebra. 275 Die komplexen Zahlen bilden eine assoziative Algebra über dem Körper der reellen Zahlen. Die Quaternionen sind eine assoziative Algebra über dem Körper der reellen Zahlen, aber nicht über den komplexen Zahlen. Divisionsalgebra Vereinfacht gesagt handelt es sich bei einer Divisionsalgebra um einen Vektorraum, in dem man Elemente multiplizieren und dividieren kann. Eine Divisionsalgebra D ist eine nicht notwendigerweise assoziative Algebra, in der zu jedem a ∈ D und zu jedem b ∈ D, b ≠ 0 genau ein x ∈ D mit der Eigenschaft a=x·b existiert. Dabei bezeichnet "·" die Vektormultiplikation in der Algebra. Zusätzlich fordert man, dass D mindestens zwei Elemente enthält. Eine Divisionsalgebra über den reellen Zahlen hat stets die Dimension 1, 2, 4 oder 8. Dies wurde 1958 von Milnor und Kervaire bewiesen. Enthält die Divisionsalgebra die Zahl 1, so dass a·1 = 1·a = a gilt, spricht man von einer Divisionsalgebra mit Eins. Die 4 reellen Divisionsalgebren mit Eins sind bis auf Isomorphie die reellen Zahlen selbst die komplexen Zahlen die Quaternionen die Oktaven auch Oktonionen oder Cayley-Zahlen. Dies ergibt sich aus dem Satz von Hurwitz, 1898. Beispiel einer Divisionsalgebra ohne Einselement mit den beiden Einheiten e1 und e2, die mit beliebigen reellen Zahlen multipliziert werden können: e1 · e2 = -e2 e2 · e1 = -e2 e2 · e2 = -e1 e1 · e1 = e1 Banachalgebra Banachalgebren (nach Stefan Banach) sind mathematische Objekte der Funktionalanalysis, die Funktionenräume anhand wesentlicher gemeinsamer Eigenschaften verallgemeinern. Eine Banachalgebra ist ein Vektorraum, in dem zusätzlich auch eine Multiplikation und eine Norm so definiert sind, die Zusatzbedingungen erfüllen. Ein Vektorraum (V,+) über dem Körper K = R oder C mit einer Norm || || und einem Produkt •: V x V → V ist eine Banachalgebra, wenn gilt: (V, +, || ||) ist ein Banachraum, d.h. ein vollständiger normierter Vektorraum, (V, +, •) ist eine assoziative K-Algebra, ||A • B|| ≤ ||A|| • ||B||, d.h. die Norm ist submultiplikativ. Beispiele: Jeder Banachraum wird mit der Null-Multiplikation, d.h. xy = 0 für alle Elemente x,y des Banachraums, zu einer Banachalgebra. Ist V ein Banachraum, so ist die Algebra B(V) der stetigen, linearen Operatoren auf V eine Banachalgebra, die im Falle dim(v) > 1 nicht kommutativ ist. Ist V ein Hilbertraum, so ist B(V) eine C*Algebra. Definition: Eine Banach-*-Algebra A über C oder involutive Banachalgebra ist eine Banachalgebra zusammen mit einer *-Involution *: A → A, a → a*, so dass ∀ a ∈ A: (a*)* = a (involutiv) ∀ a,b ∈ A: (ab)* = b*a* (anti-multiplikativ) ∀ a,b ∈ A, ∀ z,w ∈ C: (za + wb)* = z-- a* + w-- b* (semilinear, anti-linear oder konjugiert linear) ∀ a ∈ A: ||a|| = ||a*|| (isometrisch) Für Banachalgebren B(H), wobei H ein Hilbertraum ist, definiert man: Eine Banachalgebra V, auf der zusätzlich eine semilineare Involution *: V → V gegeben ist, heißt C*Algebra, wenn gilt: ||x* x|| = ||x||² ; ∀ x ∈ V Boolesche Algebra - Algebraische Struktur Eine algebraische Struktur (B,∩,∪,¬) heißt Boolesche Algebra, wenn 1. ∩ und ∪ zweistellige Verknüpfungen in B sind 2. ¬ eine einstellige Abbildung von B in B ist und wenn für alle a,b,c aus B gilt: 3.Kommutativgesetze a ∩ b = b ∩ a a∪b=b∪a 4.Distributivgesetze a ∩ (b ∪ c) = (a ∩ b) ∪ (a ∩ c) a ∪ (b ∩ c) = (a ∪ b) ∩ (a ∪ c) 5. es gibt mindestens ein Element 0 in B, so dass a ∪ 0 = a und a ∩ ¬a = 0 6. es gibt mindestens ein Element 1 in B, so dass a ∩ 1 = a und a ∪ ¬a = 1 Es gelten: Idempotenzgesetze, Assoziativgesetze, Morgansche Gesetze und Absorptionsgesetze Omega-Algebra, Ω-Algebra Es sei Ω eine Menge von Operationssymbolen, die in paarweise disjunkte Teilmengen Ωn, n ∈ N, zerfällt. In Ω0 liegen die Konstanten, in Ωn, n>0, die n-stelligen Operationssymbole. Die Familie (Ωn)n ∈N heißt Typ 276 oder Signatur. Ist A eine Menge und ist jedem n-stelligen Operationssymbol ω Ωn eine n-stellige Operation ωA in A zugeordnet, so heißt A = (A, {ωA | ω ∈ Ω} eine Ω-Algebra oder Algebra vom Typ (oder der Signatur) Ω. Ist Ω endlich, Ω = {ω1, ..., ωk}, so schreibt man für A auch A = (A, ω1A, ..., ωkA). Fasst man einen Ring als Ω-Algebra auf, so zerfällt Ω in Ω0 = {ω1}, Ω1 = {ω2}, Ω2 = {ω3, ω4}, wobei den Operationssymbolen die Konstante 0, Inversenbildung bezüglich Addition, Addition und Multiplikation zugeordnet sind. Es seien A und B Ω-Algebren. B heißt Ω-Unteralgebra von A, falls B ⊆ A ist und die Operationen ωB die Einschränkungen der Operationen ωA (ω ∈ Ω) auf die Teilmenge B sind. Direktes Produkt Es seien A und B Gruppen, deren Gruppenoperation (z.B. Addition oder Multiplikation) mit * bezeichnet sein soll. Im kartesischen Produkt A × B kann man durch die folgende Vorschrift eine Operation • einführen: (a1, b1) • (a2, b2) = (a1 * a2, b1 * b2) Damit wird A × B zu einer Gruppe, die das direkte Produkt von A und B genannt wird. Mit (e,e) wird das Einselement von A × B bezeichnet, und (a-1, b-1) ist das inverse Element zu (a, b). Für endliche Gruppen A, B gilt ord A × B = ord A * ord B. Die Gruppen A' = {(a,e) | a ∈ A} bzw. B' = {(e,b) | b ∈ B} sind zu A bzw. B isomorphe Normalteiler von A × B. Das direkte Produkt Abelscher Gruppen ist wieder abelsch. Für zyklische Gruppen gilt: Das direkte Produkt zweier zyklischer Gruppen A, B ist genau dann zyklisch, wenn der größte gemeinsame Teiler der Gruppenordnungen gleich 1 ist Basissatz für Abelsche Gruppen Jede endliche Abelsche Gruppe ist als direktes Produkt zyklischer Gruppen von der Primzahlpotenzordnung darstellbar. Semidirektes Produkt Das semidirekte Produkt beschreibt eine Methode, um aus zwei gegebenen Gruppen eine neue Gruppe zu konstruieren. Diese Konstruktion verallgemeinert das Konzept des direkten Produkts von Gruppen. Definition: Gegeben seien zwei Gruppen N und H, sowie ein Homomorphismus θ: H → Aut(N) der Gruppe H in die Gruppe der Automorphismen von N. Das kartesische Produkt G = N × H der Mengen N und H wird dann zu einer Gruppe, indem man die Verknüpfung durch (n1, h1) · (n2, h2) = (n1 · θ(h1)(n2), h1 · h2) definiert. Man notiert das semidirekte Produkt als N ×θ H, da der Homomorphismus θ die Struktur dieser Gruppe bestimmt. Das semidirekte Produkt ist weder kommutativ noch assoziativ. Äußeres und Inneres Produkt Die durch die Definition konstruierte Produktgruppe ist das äußere semidirekte Produkt, da die Gruppe G bei dieser Definition aus vorgegebenen, disjunkten Gruppen konstruiert wird. Innere Definitionen beziehen sich dagegen auf eine bereits gegebene Gruppe G mit einem Normalteiler N und einer Untergruppe H. Beispiele: Die Diedergruppe Dn, die Symmetriegruppe eines ebenen regelmäßigen n-Ecks, ist isomorph zum semidirekten Produkt der zyklischen Drehsymmetriegruppe Zn mit einer zweielementigen zyklischen Gruppe Z4-2. Für n > 1 ist die symmetrische Gruppe Sn isomorph zu einem semidirekten Produkt ihres Normalteilers N = An, der alternierenden Gruppe, und einer zweielementigen zyklischen Gruppe Z2. Strukturen der natürlichen Zahlen Unter den natürlichen Zahlen wird die Menge N = {0, 1, 2, …} verstanden, die mit ihrer natürlichen Anordnung 0 < 1 < 2 < … versehen sein soll. Halbgruppen natürlicher Zahlen Auf dieser Menge N ist als eine innere Verknüpfung die gewöhnliche Addition + definiert. Sie ist assoziativ und kommutativ und die Zahl 0 ist neutrales Element dieser Verknüpfung. Es handelt sich bei (N,+) um ein kommutatives Monoid. Andererseits ist auf N auch die gewöhnliche Multiplikation · als innere Verknüpfung definiert, die ebenfalls assoziativ und kommutativ ist und für die die Zahl 1 neutrales Element ist. Damit ist (N,·) ein kommutatives Monoid. Man kann auf N auch die durch a·b=min(a,b) für alle a und b aus N definierte Verknüpfung · betrachten. Sie ist nicht nur assoziativ und kommutativ, sondern auch idempotent, besitzt aber kein neutrales Element. Es handelt sich bei (N,min) um eine (kommutative und idempotente) Halbgruppe, die kein Monoid ist. Ändert man die Verknüpfung aus dem vorigen Beispiel zu a·b=max(a,b), so erhält man ein kommutatives und idempotentes Monoid (N,max), denn die Zahl 0 ist nun neutrales Element. 277 Halbringe natürlicher Zahlen Da für die gewöhnliche Addition + und Multiplikation · natürlicher Zahlen die beiden Distributivgesetze gelten, handelt es sich bei (N,+,·) um einen kommutativen Halbring mit absorbierendem Nullelement 0 und Einselement 1. Da für alle a, b, c aus N die Gleichungen a·max(b,c) = max(a·b,a·c) und a+max(b,c) = max(a+b,a+c) a·min(b,c) = min(a·b,a·c) und a+min(b,c) = min(a+b,a+c) gelten, sind auch (N,max,·), (N,max,+), (N,min,·) und (N,min,+) Halbringe. Da es sich bei min und max um die beiden Verbandsoperationen in der linear geordneten Menge N = {0 < 1 < 2 < …} handelt, bilden sowohl (N, min, max) als auch (N, max, min) einen distributiven Verband, also ebenfalls je einen Halbring. Multioperatorgruppe, Ω-Gruppe Eine, nicht notwendig kommutative, Gruppe (G, +), auf der ein System Ω n-ärer algebraischer Operationen ωn, n > 1, gegeben ist, heißt genau dann Multioperatorgruppe oder Ω-Gruppe, wenn gilt: Für alle j: aj = 0 und c = 0 wird für beliebige Operationen ωn 0…0ωn = 0 Die Multioperatorgruppe vereint das Konzept von Gruppe, linearer Algebra und Ring. Ein Ideal einer Ω-Gruppe ist eine normale Untergruppe N von G mit -(x1…xnω) + (x1…xi-1(a+xi)xi+1…xnω) ∈ N für alle a aus N, xi aus G und jeder Operation ω. Sind A, B und C Ω-Untergruppen der Ω-Gruppe G, wobei C von A und B erzeugt wird, so ist der Kommutator [A,b] der Untergruppen A und B in C das Ideal aller Elemente der Form -a-b + a+b -(a1…an ω) -(b1…bn ω) +((a1b1)…(an+bn) ω) Es sei G' = [G,G]. Dann ist die Ω-Gruppe abelsch, wenn G' = 0 ist. Multioperatorring Eine abelsche Gruppe (G, +), auf der ein System Ω n-ärer algebraischer Operationen ωn, n > 1, gegeben ist, heißt genau dann Multioperatorring oder Ω-Ring, wenn für alle ωn, alle Elemente ai, b, c aus G, i = 1,...,n, und alle i gilt a1...ai-1(b+c)ai+1…anωn = a1...ai-1bai+1…anωn + a1...ai-1cai+1…anωn (1) Jeder Multioperatorring ist Multioperatorgruppe. Für alle j: aj = 0 und c = 0 wird für beliebige Operationen ωn: 0...0b0...0ωn = 0…0(b+0)0…0ωn = 0…0b0…0ωn + 0…0ωn = 0…0b0…0ωn + 0 Für ein leeres Operationensystem wird G zum Modul. Enthält Ω nur eine algebraische binäre Multiplikation, bildet G eine ringartige Struktur, womit jeder assoziative oder nichtassoziative Ring Multioperatorring ist. Für diese Strukturen wird (1) zum bekannten Distributivgesetz. Die vom Nullelement eines Moduls additiv erzeugte Untergruppe wird für ein beliebiges Operationensystem Ω n-ärer Operationen, n > 1, mit 0...0ωn = 0 zum Ω-Nullring. Einen Multioperatorring bildet der zweidimensionale reelle Punktraum R² mit der Vektoraddition und dem vektoriellen Tripelprodukt, welches ternär ist. Ein Multioperatorring heißt assoziativ, wenn für jedes Paar von Operationen ωn, ωk aus dem Operationensystem für jedes i = 1,...,k (x1...xnωn)xn+1…xn+k-1ωk = x1...xi-1(xi...xn+i-1ωn)xn+i...xn+k-1ωk für alle xj aus G, j=1,...,n+k-1, gilt. Kommutativ nennt man einen Multioperatorring, wenn für jede Operation ωn aus dem Operationensystem und jedes Paar (i, j), mit i ≠ j, und i, j = 1,...,n, für alle xl aus G, l = 1,...,n x1...xi…xj…xnωn = x1...xj…xi…xnωn gilt. Ein Element 1 von G heißt Einselement von G, wenn für alle x aus G und jede Operation ωn aus Ω: 1...1x1...1ωn = x ist. Ein Element a eines Ω-Ringes nennt man genau dann Nullteiler bezüglich einer Operation ωn aus dem Operationensystem, wenn ein (n-1)-Tupel von Elementen in G existiert, so dass x1...xi-1axj+1…xnωn = 0 für ein beliebiges i gilt, wobei sowohl a als auch alle xj des Tupels verschieden vom Nullelement sein müssen. In Multioperatorringen gilt x1...xi-10xj+1…xnωn = 0 für alle Operationen und alle xi aus G. Dies folg unmittelbar aus dem Distributivgesetz und den Gruppeneigenschaften. Geschichte der Gruppentheorie In den Problemen, bei deren Untersuchung Gruppen auftraten, wie etwa der Symmetrie der Platonischen Körper, waren diese Axiome von selbst erfüllt. Daher hatte man schon einige Erfahrungen über den Umgang mit diesen algebraischen Strukturen gesammelt, bevor die heute vier üblichen Axiome zu ihrer Definition aus diesen Erfahrungen extrahiert wurden. Die Bezeichnung Gruppe für derartige Strukturen wurde erstmals 1868 durch Camille Jordan verwendet (Memoire sur les groupes des mouvements, Annali de matematica pura ed applicata, Ser. II, Vol. II, No. 278 3 (1868) 167 - 215, 322-345), obwohl er nur das Axiom der Abgeschlossenheit gegenüber der Verknüpfung von zwei Gruppenelementen explizit forderte. Da er Symmetriegruppen untersuchte, folgten die anderen Gruppeneigenschaften automatisch. Er entdeckte z. B. nicht die Existenz der eindeutig bestimmten inversen Symmetrieabbildung innerhalb der von ihm untersuchten Gruppen. Im Jahre 1854 hatte Arthur Cayley die Notwendigkeit des Assoziativgesetzes und die Existenz eines Einselementes entdeckt. Er bezeichnete die Gruppenelemente durch abstrakte Symbole und definierte deren Verknüpfung mittels einer Tabelle, die heutzutage Cayley-Tafel genannt wird. Im Jahre 1856 gab William Rowan Hamilton (Memorandum Respecting a New System of Roots of Unity) die erste Darstellung einer Gruppe, der Ikosaedergruppe, an, eine sehr platzsparende Methode eine konkrete Gruppe zu definieren, die in diesem Fall auf einer einzigen Zeile hingeschrieben werden kann, im Vergleich zu der Tabelle von 60 x 60 Einträgen der Cayley-Tafel. Die erste Definition der Gruppe mit den heute üblichen Axiomen erfolgte 1882 unabhängig voneinander durch Walter van Dyck (Gruppentheoretische Studien) und Heinrich Weber. Die erste große außermathematische Anwendung der Gruppentheorie bestand in der Bestimmung aller 230 Raumgruppen durch den russischen Kristallographen Fedorov im Jahre 1890. Dies sind die Symmetriegruppen der dreidimensionalen Punktgitter. Solche periodischen diskreten Punktgitter wurden als Modelle für den Aufbau von Kristallen aus Atomen angesehen, obwohl dies erst 1912 experimentell bestätigt werden konnte. Jedes solche Gitter kann nämlich eindeutig durch seine Symmetriegruppe charakterisiert werden. Tetraedergruppe Bei der Tetraedergruppe geht es um Drehungen des Tetraeders um eine Achse, bei denen es in sich selbst übergeht. Beispiel: Links sei eine Ausgangsstellung. Man legt durch eine Ecke und den Mittelpunkt des gegenüberliegenden Dreiecks eine Achse. Das Tetraeder wird um 120° nach links gedreht und kommt zur Deckung mit dem ersten Tetraeder. Der dunkelblau markierte Winkel wandert. Die Gesamtheit aller Drehungen bildet eine Gruppe. Übersicht über alle Drehungen: Man erhält eine weitere Drehung, wenn man das gedrehte Tetraeder um 120° weiterdreht. Da das Tetraeder vier Seitenflächen bzw. Eckpunkte hat, gibt es drei weitere Drehachsen durch den Eckpunkt und den Mittelpunkt eines Dreiecks. Zu jeder Drehachse gibt es zwei Drehungen, die ein Tetraeder in sich selbst überführen. Insgesamt ergeben sich 8 Drehungen. Verbindet man gegenüberliegende Kantenmitten, so ergeben sich drei weitere Drehachsen. Eine Drehung um 180° führt zu einer weiteren Deckung des Tetraeders. Diese Drehung könnte man auch Klappung nennen. Insgesamt gibt es 3 Drehungen. Es gibt insgesamt 11 Drehungen, die ein Tetraeder in sich selbst überführen. Drehung um eine Ecke/Mitte-Achse Eine Drehung beschreibt man besser durch Zahlen. Man nummeriert die Ecken des Ausgangstetraeders mit 1, 2, 3 und 4. Nach einer 120°-Drehung nehmen die Eckpunkte die neue Position 3,1 und 2 an, 4 bleibt. Das hält man in einer Schreibfigur fest: In der ersten Zeile 1 2 3 4, in der zweiten Zeile 3 1 2 4. Die Zuordnungen stehen untereinander. Noch kürzer ist die Notation mit dem Zyklus (132)(4) oder kurz (132). Das muss man so lesen: 1 geht über in 3, 3 geht über in 2 und 2 in 1. 123 wird zyklisch vertauscht. Die Ecke 4 bleibt stehen. Für eine 240°-Drehung ergibt sich die nebenstehende Notation. Man könnte diese Stellung des Tetraeders auch erreichen, wenn man das Ausgangstetraeder um 120° nach rechts dreht. Alle Drehungen dieser Art sind (132), (123), (134), (143), (142), (124), (234), (243). 279 Drehung um eine Mitte/Mitte-Achse Bei den Drehungen um eine Achse durch zwei Kantenmitten werden die Eckpunkte, die zu einer halbierten Kante gehören, paarweise ausgetauscht. Die restlichen Möglichkeiten: Die drei Klappungen sind (12)(34), (14)(23), (13)(24). Es liegt nahe den Fall zu untersuchen, ein Tetraeder zuerst um eine Achse und danach um eine zweite Achse zu drehen. Eine solche Verknüpfung zweier Drehungen, inklusive der identischen Drehung, ergibt wieder eine der genannten Drehungen. Beispiel: Es wird das um zwei Kantenmitten gedrehte Tetraeder um die vertikale Achse um 120° nach links weitergedreht. Es ergibt sich das rechte Tetraeder, das die Darstellung (143) hat. Diesen Vorgang kann man als Verknüpfung von Zyklen beschreiben: Aus (12)(34) und (132)(4) wird (143) oder (12)(34) • (132)(4) = (143) Mit dem Symbol • wird ausgedrückt, dass man zwei Drehungen verknüpft hat. Drehgruppe Es gibt 12 Drehungen. Die triviale Drehung (1) ist mitgezählt. Die Drehungen werden durch ein Hintereinanderschalten verknüpft. Diese beschriebene Struktur ist eine abelsche Gruppe. Setzt man r = (123) und f = (13)(24), so lassen sich die übrigen Elemente der Drehgruppe aus ihnen errechnen. Die Drehungen r und f beispielsweise "erzeugen" die Gruppe. f²=(1), r²=(132), rf=(243), fr=(142), (fr)²=(124), (rf)²=(234), frf=(134), rfr=(143), r²fr=(14)(23), rfr²=(12)(34) Diese Drehgruppe ist isomorph zur Untergruppe der geraden Permutation der Permutationsgruppe S4. Diese Untergruppe ist die alternierende Gruppe. Auch die ungeraden Permutationen von S4 kann man als Abbildungen des Tetraeders interpretieren. Sie stellen eine Spiegelung an einer Mittelebene des Tetraeders dar. Es gibt sechs Spiegelungen dieser Art. Die übrigen Permutationen (1234), (1243), (1342), (1324), (1432), (1423) sind Drehspiegelungen. Damit sind alle Elemente der symmetrischen Gruppe als Abbildungen des Tetraeders gedeutet. Die Gesamtheit dieser Abbildungen bilden eine zur Symmetriegruppe S4 isomorphe Gruppe. Graph zur Tetraedergruppe Die kleinen Dreiecke stehen für die Drehungen um die Ecke-Mitte-Achsen, die roten Linien für die Drehungen um die Mitte-Mitte-Achsen. Oktaedergruppe Man ersetzt das Tetraeder durch das Oktaeder bzw. den Würfel. Das führt zu einer Drehgruppe mit 24 Elementen. Sie ist isomorph der symmetrischen Gruppe S4 zu vier Zahlen. Die dritte Polyedergruppe ist die Ikosaedergruppe mit 60 Elementen. Man könnte wegen der Dualität statt des Ikosaeders das Pentagondodekaeder wählen. Die Ikosaedergruppe ist isomorph zu der alternierenden Gruppe zu fünf Zahlen. Hauptsatz für endliche Drehgruppen: Eine endliche Drehgruppe ist notwendig von einem der folgenden Gruppentypen: Zyklische Gruppe, Diedergruppe, Tetraedergruppe, Oktaedergruppe, Ikosaedergruppe. Endliche Transformationen in der Ebene Viele Buchstaben des Alphabets genügen sehr einfachen Symmetrien. So sind zum Beispiel die Buchstaben A E spiegelsymmetrisch. Spiegelungen sind Transformationen der Ebene und werden immer durch die Angabe einer Spiegelungsachse gegeben. Andere Buchstaben weisen Drehsymmetrien auf O Z Diese Transformationen werden durch die Angabe von Drehzentrum und Drehwinkel gegeben, wobei das Zentrum als n-Polygon dargestellt wird. Damit soll angedeutet werden, dass an diesem Zentrum eine 280 Drehung um 360o/n stattfinden soll. Drehsymmetrien werden durch die zyklischen Gruppen n-ter Ordnung Cn beschrieben Cn = {1, d, d 2, d 3, ..., d n-1} = < d > Die Gruppe ist von endlicher Ordnung n, falls es eine positive ganze Zahl n gibt, so dass d n = 1 gilt. Kombiniert man Spiegelungen mit Drehungen, so erhält man die Diedergruppen Dn. Sie sind die Symmetriegruppen der regelmässigen n-Ecke. Im allgemeinen Fall gibt es eine Drehung d mit dn = 1 und n Spiegelungen sj mit sj2 = 1. Dn = {1, d, d 2, ..., d n-1, s1, d o s1, ..., d n-1 o s1} Bezeichne G die Gruppe aller diskreten Isometrien der euklidischen Ebene E. Ferner sei P ein in E liegendes Polygon: P ⊂ E. S(P) sei die zum Polygon P gehörige Symmetriegruppe: S(P) = {φ ∈ G | φ(P) = P} Es sei ferner Γ die Gruppe aller Isometrien der Ebene, die den Nullpunkt O festhalten. Schon Leonardo da Vinci suchte nach allen möglichen Untergruppen von Γ. Hermann Weyl fand die vollständige Antwort auf da Vincis Frage: Satz von Weyl: Die endlichen Untergruppen von Γ werden, bis auf Konjugation, durch folgende vier Gruppen gegeben: Cn , Dn , V4 , W={1,s}, wobei s die Spiegelung an einer Geraden durch den Nullpunkt ist. Die Gruppe V4 ist die Kleinsche Vierergruppe, gegeben durch eine Drehung um 180o um den Nullpunkt O und zwei Spiegelungen an rechtwinklig aufeinanderstehenden Geraden durch O. So enthält z.B. die Symmetriegruppe eines Rhomboids mit Diagonalen unterschiedlicher Länge V4 als Untergruppe. Die Translationen bilden eine wichtige Untergruppe der Gruppe G der diskreten Bewegungen von E. Wir bezeichnen sie im folgenden mit T(G). T(G) ermöglicht eine Strukturierung von G: (I) Gruppen H ⊂ G mit T(H) = ∅ heißen Rosettengruppen oder Punktgruppen (II) Gruppen H ⊂ G, für die T(H) aus nur einer Translationsrichtung besteht, heissen Friesgruppen (III) Gruppen H ⊂ G, für die T(H) aus zwei verschiedenen Translationsrichtungen besteht, heissen Ornamentgruppen Friesgruppen H+ seien die eigentlichen und H- die uneigentlichen Transformationen aus einer Friesgruppe H. Insbesondere ist dann T(H) ⊂ H+. Im ersten Fall gilt T(H) = H+. Da T(H) eindimensional ist, wird H+ von einem einzigen Element t, erzeugt H+ = < t > Ist H leer, Ist H nicht leer, so oder Schließlich gibt es die Möglichkeit, dass H- eine wird kann senkrecht zur Schubspiegelung, d.h. die Kombination aus einer man eine Friesrichtung Spiegelung und einer Translation um t/2 in Spiegelachse in Richtung der Spiegelachse enthält Friesrichtung legen Im zweiten Fall gilt T(H) ⊂ H+ aber T(H) ≠ H+. Es gibt neben den Translationen noch andere eigentliche Abbildungen. Dies kann die Kombination zweier Spiegelungen mit je Es können auch Drehungen einer Achse in Friesrichtung und einer senkrecht dazu auftreten wie sein in den beiden letzten Fällen Insgesamt finden sich auf diese Weise alle sieben möglichen Friesgruppen. Fries-Symmetrien und Streifenornamente Ein Fries ist ein theoretisch unendlich langes, periodisches Ornament, das zwischen zwei parallelen Geraden angeordnet ist. Damit es periodisch ist, muss zu seinen Symmetrie-Abbildungen, die es mit sich selbst zur Deckung bringen, eine kürzeste Parallelverschiebung in Richtung dieser Geraden gehören. Außer diesen unendlich vielen Translationen kann es weitere Symmetrieabbildungen geben: 1) Spiegelungen an der waagerechten Mittellinie w des Streifens 2) Spiegelungen an einer zu den begrenzenden Geraden Senkrechten 3) Drehungen um 180 Grad um einen Punkt P der Mittelparallelen 4) Gleitspiegelungen, d.h. Translationen in Längsrichtung mit anschließender Spiegelung an der waagerechten Mittellinie 281 Für die sieben möglichen Kombinationen der Bewegungen gibt es eine Vielzahl von Beispielen aus verschiedenen Kulturkreisen bzw. Epochen. 1) nur Translationen oberste zwei Abbildungen aus Babylon 2) Translationen und Drehungen um 180° Die Drehpunkte befinden sich sowohl in der Mitte jedes Grundbildes als auch in der Mitte zwischen diesen. 3.Abbildung: antikes Olympia / 4.Abbildung: Italien 15.Jahrhundert 3) Translationen und Spiegelungen an waagerechter Mittalachse, d.h. auch Gleitspiegelungen Bilder der 1.Reihe: Byzanz 5./6. Jahrhundert und Kloster Maulbronn 14. Jahrhundert 4) Translationen und Spiegelungen an senkrechten Achsen Bilder der 2.Reihe: Theben, Altägypten und Chorsabad, antikes Assyrien 5) Translationen, Spiegelungen an waagerechten und senkrechten Achsen, d.h. auch Gleitspiegelungen Bilder der 3.Reihe: Peruanisches Textilmuster und Palast in Nimrud 6) Gleitpiegelungen und Spiegelungen an senkrechten Achsen Bild der 4.Reihe: Fußboden der Sanct Marien-Kirche in Rom 7) nur Gleitspiegelungen und die sich daraus ergebenden Translationen Bild der 5.Reihe: Sanct Cunibert, Köln, romanisch Geflochtene Friesornamente Außer den klassischen Friesgruppen kommen vor allem in der islamischen Ornamentik auch Flechtmuster, geflochtene Friesornamente, vor. Die Abbildungen von links oben nach rechts unten zeigen: zwei Fußböden römischer Villen, Fußboden San Marco Venedig, Fußboden in Pisa, Darstellungen in Cordoba bzw. Sevilla Lässt man Translationen entlang der x-Achse, Drehungen um die x-, y- und z-Achse, Spiegelungen an den zu den Raumachsen senkrechten Ebenen, Punktspiegelung am Schnittpunkt der Raumachsen, Gleitspiegelungen und die Schraubung um die x-Achse zu, so existieren 31 verschiedene Klassen von geflochtenen Friesornamenten. Translationen, Gleitspiegelungen und Schraubungen sind nur in Richtung des Frieses möglich, da sie sonst aus dem Bereich des Frieses herausführen würden. Ornamentgruppen und Parkettierungen Schon schwieriger ist die komplette Aufzählung aller möglichen Ornamentgruppen. Es gibt genau 17 Ornamentgruppen, die sogenannten 17 ebenen kristallographischen Gruppen. Diese 17 Gruppen erlauben 93 verschiedene Parkettierungen der Ebene. Wie die alternative Bezeichnung der Ornamentgruppen andeutet, waren es vor allem die Kristallographen, die erste Fortschritte bei der Untersuchung dieser Gruppen geliefert haben. Die Aufzählung der 17 Gruppen ist ein Resultat von Fedorov (1890), dessen Beweis von Schoenflies 1891 vervollständigt wurde, und das 1924 von Polya wiederentdeckt wurde. Das Parkettierungsproblem der Ebene besteht darin, dieselbe durch lauter deckungsgleiche Parkettsteine lückenlos und überlappungsfrei zu überdecken. Zur Klassifikation der angekündigten 93 Parkettierungen gibt es zwei Zugänge: einen algebraischen und einen topologischen Ansatz. Der algebraische Zugang stellt auf die Symmetriegruppen der Parkette ab. Nach dem zitierten Satz von Fedorow gibt es 17 mögliche Symmetriegruppen für ebene Parkette. Für später ist es nützlich, die Operation einer Ornamentgruppe H auf die Ebene E zu beschreiben. Dies geschieht am einfachsten durch Anwenden aller Gruppenelemente auf den Ursprung 0 in E. Man erhält als Bild ein Gitter, das wir mit G bezeichnen werden: G = { g * 0 | g ∈ H } ⊂ E 282 Das Gitter liegt diskret in E. Nun gibt es für H in der Ebene E einen ausgezeichneten Bereich, den Fundamental- oder Dirichelet-Bereich. Sei dazu P irgendein Punkt der Ebene und g aus H so gewählt, dass g * P ≠ P. Wir definieren den Bereich Hg;P = {x ∈ E | dist(x,p) < dist(x,g*p)] Damit definieren wir den Fundamentalbereich von H auf E als FH = ∩ Hg,P wobei der Durchschnitt über alle g ∈ H erfolgt. Der Fundamentalbereich hat folgende charakteristische Eigenschaften: F(H) ∩ g F(H) = ∅ für alle g ∈ H und die Vereinigung der topologischen Abschlüsse der g F(H) ist E, d.h. alle ihre Randpunkte seien inbegriffen. Das zweite Unterscheidungsmerkmal für Parkette ist topologischer Natur. Man schaut sich an, in welcher Weise die Grenzlinien der Parkettsteine zu einem Netzwerk verknüpft sind. Dies führt auf die sogenannten Lavesnetze. Sei P ein Parkett, p ∈ P ein einzelner Punkt. Wir definieren die Zuordnung p n(p), wo n(p) die Anzahl der Parkettsteine angibt, auf denen p liegt. Es gilt sicher immer n(p) >= 1. Ist n(p) = 1, so nennt man p einen inneren Punkt. Ein Randpunkt p, der in keiner Ecke des Parketts liegt, erfüllt n(p) = 2, während für alle Eckpunkte n(p) >= 2 gilt. Damit definieren wir das Lavesnetz für P als L = {p ∈ P | n(p) >= 3} Die Symmetriegruppe von P operiert auf L und führt es in sich über. Ein reguläres Parkett hat ja nur einen typischen Parkettstein. Somit können wir jedem Parkett P ein ausgezeichnetes Tupel von Zahlen zuordnen, welches das Lavesnetz L beschreibt: Es bezeichne ε = {e1, ..., eT} die Menge der Ecken eines einzelnen Parkettsteins. Dann sei ej nj = n(ej) und P = [n1, ..., nT] ist das dem Parkett mit seinem Lavesnetz zugeordnete ausgezeichnete r-Tupel. Mit diesem Instrument lässt sich folgendes Resultat beweisen: Für reguläre Parkettierungen gibt es genau 11 nichtäquivalente Lavesnetze. Verband Sei M eine teilweise geordnete Menge mit der Ordnung ≤. M heißt verbandsgeordnete Menge oder Verband, wenn folgende Eigenschaften gelten 1) zu je zwei Elementen a, b ∈ M existiert das Infimum inf(a, b) 2) zu je zwei Elementen a, b ∈ N existiert das Supremum sup(a, b) Damit besitzen dann auch endliche Teilmengen von M Infimum und Supremum. Der Beweis erfolgt durch vollständige Induktion. Ist M selbst endlich, so besitzt M sowohl ein Minimum, das Ordnungsnull heißt, als auch ein Maximum, welches Ordnungseins genannt wird. Jede kettengeordnete Menge ist ein Verband. Für jede zweielementige Teilmenge existieren dann Minimum und Maximum und sind mit dem Infimum und Supremum identische. Beispiel: Das abgebildete Hassediagramm, ohne die hellrote Linie, veranschaulicht einen Verband. Es gilt d = sup(a, b) und a = inf(c, d). Nimmt man die hellrote Linie hinzu, so ist die Verbandsstruktur zerstört, da sowohl c als auch d obere Schranken von a und b sind. Wegen ihrer Unvergleichbarkeit existiert jedoch d = sup(a, b) nicht. Schreibweise: Um Gesetze mit Supremum und Infimum ohne Klammerung formulieren zu können, werden in Verbänden die Symbole ∨ für Supremum und ∧ für Infimum verwendet. a ∨ b = sup(a, b) a ∧ b = inf(a, b) Mengenverband Sei M eine beliebige Menge und P(M) ihre Potenzmenge. Unter einem Mengenverband M ⊆ P(M) versteht man eine Teilmenge der Potenzmenge, die mit zwei Mengen A und B auch ihre Vereinigung A ∪ B und ihren Durchschnitt A ∩ B enthält. Ein Mengenverband ist bezüglich der endlichern Durchschnitts- und Vereinigungsbildung abgeschlossen. 283 Jeder Mengenverband ist bezüglich der Inklusion ⊆ ein Verband. Geschichte der Algebra Ursprünglich befasste sich die Algebra mit dem Lösen algebraischer Gleichungen, d.h. der Bestimmung der Nullstellen von Polynomen mit rationalen oder ganzzahligen Koeffizienten. In diesem Zusammenhang mussten immer neue Möglichkeiten entwickelt werden, was unter anderem auch zur Einführung der imaginären Zahlen führte. Wenn man z.B. die Nullstellen der Gleichung x²+1=0 bestimmen will, reichen die reellen Zahlen nicht mehr aus, da das Quadrat einer reellen Zahl immer positiv oder Null ist und man nie auf Null kommt, wenn man zu einer nicht-negativen Zahl eins addiert. Durch die Einführung der komplexen Zahlen, die sich aus reellen und imaginären Zahlen zusammensetzen, und der Hilfe der Analysis war es dann auch möglich den Fundamentalsatz der Algebra zu beweisen. Er besagt, dass in den komplexen Zahlen jede Gleichung in Linearfaktoren zerfällt, d.h. die Anzahl der Nullstellen mit dem Grad der Gleichung übereinstimmt. Auch versuchte man allgemeine Lösungen durch Radikale, was einfach verschachtelte Wurzelausdrücke sind, für Gleichungen zu finden. Inzwischen befasst sich die Algebra jedoch nicht mehr nur damit Lösungen algebraischer Gleichungen zu finden, sondern mit der Theorie der Verknüpfungen auf einer Menge. Eine derartige Struktur einer Menge mit einer Verknüpfung nennt sich dann algebraische Struktur. Mit Hinzunahme besonderer Anforderungen an diese algebraischen Strukturen kommt man zu Begriffen wie Gruppe, Körper oder Vektorraum, deren Untersuchungen ein wichtiges Teilgebiet der Algebra bilden. Durch die Bildung unterschiedlicher Strukturen lässt sich auch die Algebra in verschiedene Teilgebiete unterteilen: Die lineare Algebra behandelt vorwiegend die Theorie der Vektorräume über Körpern, die Körpertheorie, wie der Name schon sagt, die Theorie allgemeiner Körper und Körpererweiterungen, die Gruppentheorie und daneben gibt es noch weitere Bereiche (z.B. Ringtheorie, homologische Algebra, ...). Auch wird die Algebra in vielen anderen Gebieten eingebunden. In der Logik (Boolesche Algebra) oder der Zahlentheorie spielt sie eine wichtige Rolle. Dass die Aufgabe der Algebra ursprünglich im Lösen von Gleichungen bestand, steckt schon in ihrem Namen, der aus dem Werk al-kitab al-muhtasir fi hisab al-gabr wa-l-muqabala (Das kurzgefasste Buch über Rechnen mit Ergänzen und Zusammenfassen von Ausdrücken) von dem arabischen Gelehrten alHwarizmi (rechte Abbildung oben) aus dem 9. Jahrhundert stammt. Aus dem Ausdruck al-gabr im Titel wurde später Algebra. Sich mit algebraischen Problemen zu befassen wurde jedoch schon im alten Ägypten und bei den Griechen begonnen. Die meisten algebraischen Methoden entstanden hierbei aus einem geometrischen Hintergrund. Weiterentwickelt wurde die Theorie dann zunächst hauptsächlich in China, Indien und der arabischen Welt, und erst im Mittelalter beschäftigte man sich in Europa wieder mit der Algebra. Hier ist als wichtigster Vertreter Leonardo von Pisa, der auch unter dem Namen Leonardo Fibonacci (linke Abbildung, unten) bekannt ist, zu nennen. Im 16. Jahrhundert fand Niccolo Tartaglia (linke Abbildung, oben) dann die heute unter dem Namen Cardanosche Formel bekannte Lösung für Gleichungen dritten Grades und Ludovico Ferrari die für Gleichungen vierten Grades. Auch Isaac Newton und Leonard Euler leisteten wichtige Arbeiten. Für den bis dato unbewiesenen Fundamentalsatz lieferte Carl-Friedrich Gauß gleich vier voneinander unabhängige Beweise, deren erster aus dem Jahre 1799 Gegenstand seiner Dissertation war. Im Jahre 1824 war es Niels Henrik Abel, der beweisen konnte, dass Gleichungen fünften Grades nicht durch Radikale gelöst werden können. Den bedeutendsten Beitrag des 19. Jahrhundert zur Weiterentwicklung lieferte jedoch Evariste Galois durch die systematische Entwicklung einer Theorie, die heute unter dem Namen Galois-Theorie bekannt ist. Mit Hilfe dieser Theorie war es nun einfach zu beweisen, dass generell Gleichungen höheren als vierten Grades nicht durch Radikale lösbar sind. Dies ist auch Enrico Betti (1823-1892, rechte Abbildung unten) zu verdanken ist, der ab 1851 eine erste Präzisierung der Galois-Theorie mit einer Vervollständigung der Beweise präsentierte, da dies Galois aufgrund seiner kurzen Lebenszeit nicht möglich war. 284 Lineare Optimierung Die lineare Optimierung (LO) ist ein mathematisches Verfahren zur Bestimmung des Maximums oder Minimums einer linearen Funktion z, der sogenannten Zielfunktion, unter einschränkenden Bedingungen, die in Form linearer Ungleichungen oder Gleichungen gegeben sind. Diese Systeme von Ungleichungen werden mit Methoden der linearen Algebra und der analytischen Geometrie gelöst. Beispiele: Maximierung des Reingewinns einer Produktion Minimierung des Gesamtabfalls einer Produktion Suche des Extremums einer gewichteten Linearkombination solcher Kriterien Mathematisches Modell: Das Aufstellen der Zielfunktion, der Nebenbedingungen und der Nichtnegativitätsbedingungen. Normalfall: Nebenbedingungen von Maximierungsmodellen enthalten nur ≤-Beziehungen, diejenigen von Minimierungsmodellen dagegen nur ≥-Beziehungen. Enthalten einzelne Nebenbedingungen das entgegengesetzte Ungleichheitszeichen, so können diese durch Multiplikation mit -1 in Ungleichungen mit der im Normalfall gewünschten Bedingung umgeformt werden. Verallgemeinerter, erweiterter Normalfall: Zusätzlich zu den Ungleichungen können auch lineare Gleichungen als Nebenbedingungen auftreten. Die lineare Optimierung hat sich aus der linearen Algebra herausgebildet. Die Bestimmung eines Extremwertes ist aus der Differenzialrechnung bekannt. Sie wird dort auf nichtlineare Funktionen einer oder mehrerer unabhängiger Variablen angewendet. Für die Extremwertberechnungen linearer Funktionen versagen die Methoden der Differenzialrechnung. Lineare Funktionen sind zwar differenzierbar, da aber ihre erste Ableitung stets konstant ist, kann die für ein Extremwert bestehende notwendige Bedingung nicht erfüllt werden. Die Frage nach einem Extremwert einer linearen Funktion geht bei den Problemen der linearen Optimierung von wesentlich anderen Gesichtspunkten aus als bei der Differenzialrechnung. Sie wird erst sinnvoll durch die stets mit auftretenden Nebenbedingungen, die die Form von linearen Gleichungen und Ungleichungen haben. Lineare Optimierung Bei einem linearen Optimierungsproblem (LOP) ist das Maximum oder Minimum einer linearen Zielfunktion Z (ZF) zu bestimmen, wobei die Struktur- oder Entscheidungsvariablen x1, x2, ..., xn den Nebenbedingungen (NB) oder Restriktionen und der Nichtnegativitätsbedingung (NNB) genügen müssen. Z = c0 + c1 x1 + c2 x2 + ... + cn xn max/min a11 x1 + a12 x2 + ... + a1n xn R b1 a21 x1 + a22 x2 + ... + a2n xn R b2 … am1 x1 + am2 x2 + ... + amn xn R bm R ∈ (≤, =, ≥) xj ≥ 0, j = 1, 2, ..., n . Die Größen aij, bi, cj sind bekannt. Beispiel ZF: Z = x1 + 4x2 Zielfunktion mit zwei Variablen x1 und x2 NB: x1 + 8x2 ≤ 200 System von drei Nebenbedingungen, 5x1 + 4x2 ≤ 200 in diesem Fall drei ≤ Beziehungen 5x2 ≤ 100 NNB: x1, x2 ≥ 0 Nichtnegativitätsbedingung für die beiden Variablen x1 und x2 Jeder Vektor x, der den Nebenbedingungen genügt, heißt Lösung des linearen Optimierungsproblems. Jeder Vektor x, der den Nebenbedingungen und der Nichtnegativitätsbedingung genügt, heißt zulässige Lösung des linearen Optimierungsproblems. Die Gesamtheit aller zulässigen Lösungen eines linearen Optimierungsproblems heißt Menge der zulässigen Lösungen. Jede zulässige Lösung, die die Zielfunktion maximiert bzw. minimiert, heißt optimale Lösung des linearen Optimierungsproblems. Beispielaufgabe 1: "Zeltekauf" Eine Jugendgruppe beschließt, Zelte einzukaufen. In einem Sonderangebot werden zwei verschiedene Sorten von Zelten für jeweils 10 und 15 Personen preiswert angeboten. Von den 10-Personenzelten sind noch 5 und von den 15-Personenzelten nur noch 4 vorrätig. Die Zelte für 10 Personen kosten 200 DM je Stück und diejenigen für 15 Personen insgesamt 400 DM je Stück. Die Jugendgruppe kann insgesamt höchstens 1800 DM für die Zelte ausgeben. Wie viele 10- und 15Personenzelte kann die Jugendgruppe kaufen, damit eine möglichst große Anzahl von Jugendlichen in den Zelten untergebracht werden 285 kann? Lösungsansatz: Zuordnung von Variablen x = 10-Personenzelte y = 15-Personenzelt Umformen der Bedingungen: x≥0 y≥0 x≤5 y≤4 Außerdem ist bekannt, dass der Jugendgruppe nur 1800 DM zur Verfügung stehen und dass die Zelte 200 DM bzw. 400DM kosten. Daraus ergibt sich die Ungleichung: 200*x+400*y ≤ 1800 x+2y ≤ 9 Zuordnung von Gleichungen für die grafische Darstellung x=0 ; y=0 ; x=5 ; y=4 ; x+2y=9 Graphische Lösung: Nur die gelb gefärbten Punkte des Bereiches erfüllen die Bedingungen. Von diesen zulässigen Lösungen muss nun das Wertepaar (x/y) bestimmt werden, mit dem die Jugendgruppe die meisten Personen unterbringen kann. Zielfunktion: 10 x + 15 y = Z , wobei Z die Menge der Personen ist Die Funktion y= -2/3x + Z/15 wird zusätzlich in das Koordinatensystem für verschiedene Z eingetragen, bis eine Funktion nur noch einen Punkt mit der Menge der zulässigen Lösungen gemeinsam hat. Dieser Punkt kennzeichnet das Wertepaar, mit dem die meisten Personen untergebracht werden können. Das abzulesende Ergebnis (5 Zehnpersonenzelte und 2 Fünfzehn-Personenzelte) lässt sich auch rechnerisch überprüfen, indem man die Probe macht: 5*200 DM+2*400 DM=1800 DM Beispielaufgabe 2: "Sortimentproblem" Ein Hersteller produziert zwei Sortimente eines Artikels, der aus Teilen besteht, die geschnitten, zusammengebaut und fertiggestellt werden müssen. Der Unternehmer weiß, dass er so viele Artikel verkaufen kann, wie er produziert. Sortiment 1 benötigt 25 Minuten zum Zerschneiden, 60 Minuten zum Zusammenbau und 68 Minuten, um es verkaufsfertig zu machen. Es erzielt 30 DM Gewinn. Für Sortiment 2 braucht man 75 Minuten zum Schneiden, 60 Minuten für den Zusammenbau und 34 Minuten, zur Fertigstellung. Dieses Sortiment erzielt einen Gewinn von 40 DM. Es stehen nicht mehr als 450 Minuten zum, Zerschneiden, 480 Minuten zum Zusammenbau und 476 Minuten zum Fertigstellen pro Tag zur Verfügung. Nun stellt sich dem Unternehmer die Frage, wie viele Artikel von jedem Sortiment jeden Tag produziert werden müssen, um den Gewinn zu maximieren. Lösungsansatz: Es seien x die Anzahl der Artikel aus Sortiment 1 und y die Anzahl der Artikel aus Sortiment zwei. Die Werte für x und y können nicht negativ sein, sondern nur Beträge größer oder gleich null annehmen: x≥0,y≥0 Ungleichungen:25x+75y ≤ 450 60x+60y ≤ 480 68x+34y ≤ 476 Graphische Lösung: In der Grafik repräsentieren die drei Ungleichungen die Flächen unterhalb den vorgegebenen Linien, während die ersten beiden Ungleichungen genau auf den Achsen liegen, und damit die Fläche abgrenzen. Zielfunktion: 30*x+40*y = Z ; y = -3/4x + Z/40 Jetzt gibt man wieder beliebige Werte für Z ein, bis eine der entstehenden Funktionen den möglichen Bereich nur noch in einem Punkt schneidet. Dieser Punkt kennzeichnet das Wertepaar, mit dem eine optimale Anzahl an Sortimenten hergestellt wird (siehe roter Kreis). Dieses Ergebnis (3 / 5) lässt sich wieder mit der Probe überprüfen: 3*30DM+5*40DM=290DM. Der Unternehmer sollte also drei Artikel aus Sortiment 1 und fünf Artikel aus Sortiment 2 herstellen, um die Arbeitszeit optimal auszunutzen und den Gewinn dabei zu maximieren. Einfache Probleme Beispiel: Die Größe z sei von a und b mit z = a + 4b (Zielfunktion) abhängig, wobei für die Variablen a und b vier Nebenbedingungen gelten sollen: a >=0 b >=0 2a + 3b <=4 3a + b <=3 Lösung: a = 0 b = 1.33 Maximum 5.33 Beispiel: Die Größe z sei von a, b und c mit z = a + 4b + c (Zielfunktion) abhängig, wobei für die Variablen Nebenbedingungen gelten sollen: a > 1 b > 2 2a + 3b – c < 12 3a + b > 13 c<7 Lösung: a = 3.67 b = 2 c = 1.33 Minimum 13 Beispiel: Die Größe z sei von a, b und c mit z = a + 4b + c (Zielfunktion) abhängig, wobei für die Variablen Nebenbedingungen gelten sollen: a < 3 b > 2 2a + 3b – c < 12 3a + b > 13 c<7 Lösung: a=3 b=4 c=6 Minimum 25 286 Beispielaufgabe 3: Welchen finanziellen Spielraum hat die Baugesellschaft? Eine Baugesellschaft hat ein Grundstück von 12 000 m2 erworben. Darauf sollen zwei- und dreistöckige Häuser gebaut werden, die zweistöckigen mit Garten, die dreistöckigen ohne Garten. Die zweistöckigen Häuser sind für je 5 Familien, die dreistöckigen für je 7 Familien bestimmt. Die Kosten betragen bei einem zweistöckigen Haus 400 000 DM, bei einem dreistöckigen Haus 600 000 DM. Insgesamt hat die Gesellschaft ein Kapital von12 000 000 DM für den Bau der Häuser zur Verfügung. Für ein zweistöckiges Haus wird eine Grundstücksfläche von 600 m2 , für ein dreistöckiges Haus von 400 m2 benötigt. Die Zahl der Arbeitsstunden zum Bau eines zweistöckigen Hauses beträgt 6 000 Stunden, bei einem dreistöckigen Haus 12 000 Stunden. Insgesamt können höchstens 228 000 Stunden aufgebracht werden. Nach dem Bebauungsplan dürfen nicht mehr als 16 zweistöckige Häuser gebaut werden. Wie ist das Grundstück zu bebauen, damit möglichst viele Familien auf ihm wohnen können? Nebenbedingungen: 600 x + 400 y ≤ 1200 400000 x + 60000 y ≤ 12000000 6000 x + 12000 y ≤ 228000 Zielfunktion: 5 x + 7 y = G Maximum schwarz: Geraden, die das Planungsvieleck(blau) begrenzen (Kapital, Fläche, Arbeitszeit) rote Punkte: in Frage kommende Lösungen rote Parallelenschar: Zielgeraden für bestimmte Werte von G Wenn diese Zielgerade parallel bis zum Punkt (12,12) verschoben wird, ergibt sich ein maximaler Gewinn. Diese Gerade hat im Vergleich zur Geraden durch Q(6,16) mit derselben Steigung -5/7 den größten y-Achsenabschnitt. Beispielaufgabe 4: Optimale Vorbereitung - Zeit ist wertvoll! Peter kalkuliert scharf! Er muss in zwei Fächern - nämlich in Mathematik und in Englisch - eine Nachprüfung machen. Um den versäumten Stoff nachzuarbeiten, benötigt er in Mathematik mindestens 2 Tage und in Englisch mindestens 1,5 Tage. Das Nacharbeiten allein genügt nicht, da er auch den Stoff üben muss. Bei einem Arbeitsaufwand von einem Tag kann er in Mathematik 4 Punkte und in Englisch 8 Punkte oder eine entsprechende Kombination bei einer anderen Tagesaufteilung erreichen. Insgesamt muss er in beiden Fächern zusammen mindestens 44 Punkte erreichen. Sein Freund hat sich bereit erklärt, mit ihm mindestens 10 Stunden zusammenzuarbeiten und zwar täglich 2 Stunden im Fach Mathematik und eine Stunde im Fach Englisch. Wie muss Peter seine Zeit einteilen, damit er mit einem möglichst geringen Aufwand sein Ziel erreicht? Lösung: x : Anzahl der Tage für Mathematik, y: Anzahl der Tage für Englisch mindestens 2 Tage Mathe erforderlich x≥2 mindestens 1,5 Tage Englisch erforderlich y ≥ 1.5 Unterstützung durch den Freund 2 x + y ≥ 10 zu erreichende Punkte 4 x + 8 y ≥ 44 zu minimieren ist die Zahl der Arbeitstage E(x,y) = x + y Minimum an Arbeitstagen 3 Tage für Mathematik 4 Tage für Englisch Beispielaufgabe 5: Entscheidungen eines Süßwarenherstellers Ein Süßwarenhersteller erhält von zwei verschiedenen Schokoladenfabrikanten Mischungen, die er zu einer dritten Sorte zusammenmischen will. Die Sorten "Praliné d' Or" und "Knusper Gala" enthalten in jeweils unterschiedlicher Zusammensetzung Krokantpralinen, Pralinen aus Vollmilch- bzw. weißer Schokolade und Bitterschokolade. Die folgende Aufstellung gibt jeweils an, wie viel von jeder Pralinengeschmacksart in den Packungen der beiden Sorten enthalten ist und was die Grundlage für seine Kalkulation ist. Inhalt Praliné d' Or (8 kg) Knusper Gala (11 kg) Krokantpralinen 2 kg 1 kg Vollmilch/weiße 4 kg 5 kg Schokolade Bitterschokolade 2 kg 5 kg Preis pro 500 DM 400 DM Packungseinheit Die neue Mischung soll mindestens 146 kg Krokantpralinen, mindestens 550 kg Vollmilch- und mindestens 400 kg Pralinen aus dunkler Schokolade enthalten. Wie viele Packungseinheiten muss er von der Sorte "Praliné d' Or" und von der zweiten Sorte "Knusper Gala" ordern, um die neue Sorte möglich kostengünstig einzukaufen? 287 Lösung: Die zugehörigen Ungleichungen I. 2x + y ≥ 146 y ≥ -2 x +146 blauer Bereich II. 4x + y ≥ 550 y ≥ -0,8 x + 110 roter Bereich III. 2x + 5y ≥ 400 y ≥ -0,4 x + 80 grüner Bereich Die weiß gezeichnete Linie gibt die Berandung des Zielgebiets an; oberhalb dieses Streckenzugs. Zielfunktion: 500 x + 400 y = Z y = -5/4 x + Z/400 Mögliche Punkte innerhalb des Zielgebiets sind z.B. P1 (0, 146), P2 (200, 0) oder P3(50, 50) (weiss gezeichnet). Legt man parallele Geraden (gelb, mit der Steigung 5/4) durch diese Punkte, so stellt man fest, dass die Gerade, die durch den mit P beschrifteten Punkt (30/86) geht, den kleinsten y-Achsenabschnitt hat. Der y-Achsenabschnitt dieser Geraden ist jeweils Z/400. Wenn Z/400 so klein wie möglich ist, dann ist auch Z so klein wie möglich unter den obigen angegebenen 3 Bedingungen. Die Berechnung des optimalen Punktes P (die Gerade durch P liefert den kleinsten y-Achsenabschnitt) erfolgt durch Lösen des Gleichungssystems: I) 2x + y =146 und II) 4x + 5y = 550 Es ergibt sich: (30/86), d.h. x=30, y=86. Einsetzen dieser Werte für x und y in die Gleichung der Zielfunktion ergibt Z = 500*30 + 400*86 = 49 400 und damit 30 Packungseinheiten zu 8 kg (Nuss+Marzipan+Krokant). Von der 2.Sorte müssen 86 Packungseinheiten genommen werden, die je 11 kg schwer sind (1+5+5). Das heißt: 240 kg von Sorte 1 und 946 kg von Sorte 2 wird der Süßwarenhersteller wohl ordern. Dieses Problem führte zu 3 Bedingungen mit 2 Variablen. Man kann sich vorstellen, dass ein Süßwarenhersteller ein solches Problem wirklich lösen muss. Meist sind die lineare Optimierungsprobleme aber komplexer. Simplex-Verfahren Das Simplex-Verfahren läuft die Ecken des Polyeders ab, bis es an einer Optimallösung angekommen ist. Das Simplex-Verfahren, im Jahre 1947 von George Dantzig entwickelt, ist der wichtigste Algorithmus zur Lösung linearer Programme in der Praxis. Die Grundidee besteht darin, von einer Ecke des Polyeders zu einer benachbarten Ecke mit besserem Zielfunktionswert zu laufen, bis dies nicht mehr möglich ist. Da es sich bei der linearen Optimierung um ein konvexes Optimierungsproblem handelt, ist die damit erreichte lokal optimale Ecke auch global optimal. Das Verfahren ist im Bild illustriert: Ziel ist es, einen möglichst weit oben (in Richtung des Vektors c) liegenden Punkt zu finden. In roter Farbe ist ein möglicher Pfad des Simplex-Verfahrens entlang der Ecken des Polyeders dargestellt, wobei sich der Zielfunktionswert mit jedem Schritt verbessert. Innere-Punkte-Verfahren Innere-Punkte-Verfahren nähern sich einer Optimallösung durch das Innere des Polyeders. Innere-Punkte-Verfahren, auch Barrier-Verfahren genannt, nähern sich einer optimalen Ecke durch das Innere des Polyeders (siehe Bild). Der erste solche Algorithmus wurde 1984 von Narendra Karmarkar beschrieben. Seine Bedeutung lag vor allem darin, dass er der erste polynomiale Algorithmus zum Lösen linearer Programme war, der das Potential hatte, auch praktisch einsetzbar zu sein. Die entscheidenden Durchbrüche, die Innere-Punkte-Verfahren konkurrenzfähig zum Simplex-Algorithmus machten, wurden aber erst in den 1990er Jahren erzielt. Ein Vorteil dieser Verfahren ist, dass sie, im Gegensatz zum Simplex-Verfahren, in leichter Abwandlung auch zum Lösen quadratischer oder bestimmter nichtlinearer Programme eingesetzt werden können. Ellipsoidmethode Die Ellipsoidmethode zur Lösung linearer Programme wurde 1979 von Leonid Khachiyan veröffentlicht und war das erste polynomiale Verfahren für dieses Problem. Für praktische Zwecke ist sie allerdings nicht geeignet. Die Ellipsoidmethode dient dazu, einen beliebigen Punkt in einem volldimensionalen Polyeder zu finden oder festzustellen, dass das Polyeder leer ist. Die Grundidee des Verfahrens besteht darin, ein Ellipsoid zu definieren, das alle Ecken des Polyeders enthält. Anschließend wird festgestellt, ob der Mittelpunkt dieses Ellipsoids im Polyeder enthalten ist. Falls ja, hat man ein Punkt im Polyeder gefunden und kann aufhören. Andernfalls kann man das Halbellipsoid bestimmen, in dem das Polyeder enthalten sein muss, und ein neues, kleineres Ellipsoid um das Polyeder legen. 288