Proseminar Achilles und die Schildkröte SS 2008 - Wie viele Bäume gibt es? Martin Westhoven 15. April 2008 Cayleys Formel für die Anzahl der Bäume Der Vortrag behandelt Arthur Cayleys Formel für die Anzahl der beschrifteten Bäume, was in diesem Falle bedeutet, dass die Knoten jeweils eindeutig markiert sind. Die Frage die man sich stellt ist folgende: Wie viele verschiedene Bäume kann man aus n Knoten bilden? Für kleine n lässt sich dies noch relativ einfach veranschaulichen. Für n=1 kann nur ein einzelner Baum existieren n=2 kann auch nur ein Baum gebildet werden, der aus 2 Knoten und der verbindenden Kante besteht. Für n=3 bieten sich schon 3 verschiedene Möglichkeiten einen Baum zu konstruieren, da jeder der 3 Knoten als Vater der beiden anderen in Frage kommt. Für n=4 und n=5 betrachtet man die nicht-isomorphen Bäume und berechnet für diese, wie viele unterschiedliche Beschriftungen diese erhalten können. Für n=4 gibt es 2 nicht-isomorphische Bäume für die einmal 4 und einmal 12 unterschiedliche Beschriftungen existieren, also gibt es 16 Bäume für n=4. n=5 weist 3 nicht-isomorphische Bäume auf, von denen einer 5 Beschriftungen besitzt, und die anderen beiden je 60. Aus 125 = 53 ,16 = 42 ,3 = 31 ,2 = 20 und 1 = 1−1 lässt sich nun schliessen, dass wir für n Knoten nn−2 Bäume konstruieren können, die Anzahl, die Caley als Theorem aufstellt. Es werden nun 3 Beweise für diese Formel vorgestellt, die auf verschiedenen mathematischen Methoden basieren. Bijektionsbeweis Diese Methode basiert darauf, dass man eine Bijektion von der Menge aller Bäume mit n Knoten in eine andere Menge sucht, deren Kardinalität nn−2 ist. Joyal verwendet in seinem Beweis zusätzlich zur Betrachtung von Bäumen t auf 1,...,n, zwei weitere Markierungen Links und Rechts die jeweils auf einem beliebigen Knoten liegen können. Zusammen mit dem Theorem ergibt sich dann, dass |τn | = n2 ∗ Tn , mit τn = (t, Links, Rechts) , da wir jeweils n Optionen zusätzlich haben, die Markierungen zu setzen. Zusammen mit dem Theorem ergibt sich nun, dass wir |τn | = nn beweisen müssen. Die Menge aller Abbildungen von N nach N besitzt nun gerade die Kardinalität nn weswegen der Beweis erbracht ist, wenn wir eine Bijektion von N N nach τn nden können. Sei f : N → N eine beliebige Abbildung. Wir stellen f als gerichteten Graphen G dar, indem wir Kanten von 1 i nach f(i) zeichnen. Da von jedem Knoten eine Kante ausgeht, muss es in dem Graphen mindestens einen Kreis geben. Sei M ⊆ N die Vereinigung der Knotenmengen dieser Kreise. M ist die gröÿte Untermenge von N für die eine Einschränkung von f auf die Menge M als Bijektion auf M fungiert. Wir schreiben nun fM als fM = a b ··· f (a) f (b) · · · z f (z) mit a < b < · · · < z . Wir markieren nun f(a) mit Links und f(z) mit Rechts. Der zu f korrespondierende Baum t wird nun folgendermaÿen konstruiert: Zeichne f(a), · · · , f(z) als Pfad von f(a) nach f(z) ein und füge die übrigen Knoten aus G so ein, wie in f vorgegeben. Die Kanten im Baum sind ungerichtet. Um vom Baum t zurück zur Abbildung f zu gelangen, betrachten wir den Pfad P von Links nach Rechts, was uns sowohl M als auch f |M liefert. Die übrigen i → f (i) werden über ihren Pfad von i nach P in f eingefügt. qed. Beweis über Rekursion Wenn wir eine Rekursion konstruieren und sie per Induktion beweisen können, kann Caleys Formel ebenfalls bewiesen werden. Die vorgestellte Rekursion geht zurück auf Riordan und Rényi. Sie behandelt ein allgemeineres Problem welches ebenfalls in Caleys Papieren auftaucht. Sei A eine Menge von k Knoten. Mit Tn,k bezeichnen wir die Anzahl der beschrifteten Wälder auf 1, ... ,n bestehend aus k Bäumen, wobei die Knoten aus A in verschiedenen Bäumen liegen. Es liegt auf der Hand, dass nur die Gröÿe k zählt, nicht aber welche Knoten in A enthalten sind. Es gilt Tn,1 = Tn da der vorliegende Wald so nur aus einem Baum auf 1, ..., n besteht. Sei nun F solch ein Wald mit A = 1, 2, ... , k und der Knoten mit Markierung 1 sei benachbart zu weiteren i Knoten. Löschen wir nun den Knoten 1, dann ergeben die i Knoten zusammen mit 2, ... , k Tn−1,k−1+i Wälder. Da wir die i Knoten beliebig aus den n-k Knoten auswählen können, die sich von den Knoten 1, ... , k unterscheiden, können wir für n ≥ k ≥ 1 schlieÿen, dass: Tn,k = n−k X i=0 n−k Tn−1,k−1+i i wobei wir T0,0 = 1 und Tn,0 = 0 setzen für n ≥ 0. T0,0 = 1 ist notwendig, damit Tn,n = 1 gilt. Annahme: Tn,k = knn−k−1 im speziellen wäre dann Tn,1 = Tn = nn−2 . Der Beweis erfolgt über Induktion und wird aus Platzgründen nicht aufgeführt. Der Double Counting Beweis Beim Double Counting wird weder Bijektion, noch Induktion angewandt. Vielmehr wird, wie der Name schon vermuten lässt, auf zwei wegen gleichzeitig gezählt. Der Beweis stammt von Jim Pitman und arbeitet auf verwurzelten Wäldern, ähnlich zu denen im Rekursionsbeweis, jedoch mit einem Knoten je Baum, der zusätzlich als Wurzel markiert 2 r die Menge aller verwurzelten Wälder auf 1, . . . , n die aus k Bäumen ist. Sei also Fn,k r die Menge aller verwurzelten Bäume. Da in jedem Baum n Mögbestehen. Dann ist Fn,1 r | = nT . lichkeiten existieren eine Wurzel zu wählen, gilt oensichtlich |Fn,1 n r Wir betrachten nun Fn,k ∈ Fn,k als einen gerichteten Graphen, auf dem alle Kanten von der Wurzel weg führen. Ein Wald F enthält einen anderen Wald F', falls F' in F als gerichteter Graph vorkommt. Da F' in F enthalten ist, muss F aus weniger Bäumen bestehen als F'. Dem Beweis zugrunde liegt folgende Idee: Eine Folge F1 , . . . , Fk ist eine verfeinernde r und F enthält F r Folge, wenn für alle i gilt: Fi ∈ Fn,i i i+1 . Sei Fk ein Wald in Fn,k und schreibe als N(Fk ) die Anzahl der verwurzelten Bäume die Fk enthalten und als N*(Fk ) die Anzahl der verfeinernden Folgen die in Fk enden. Wir zählen N*(Fk ) auf zwei Wegen, zuerst indem wir mit einem Baum starten und dar enthält F . Wir können nun nach, indem wir bei Fk starten. Angenommen F1 ∈ Fn,1 k die k-1 Kanten aus F1 in jeder möglichen Reihenfolge entfernen um unsere verfeinernde Folge von F1 nach Fk zu erhalten. Daraus folgt N*(Fk ) = N (Fk )(k − 1)!. Um nun aus einem Fk ein Fk−1 zu bilden, müssen wir eine gerichtete Kante von einem beliebigen Knoten a zu einer der k-1 Wurzeln einfügen, die zu einem Baum gehören, der a nicht enthält. Dazu haben wir n Möglichkeiten a zu wählen, weshalb wir n(k-1) Möglichkeiten haben diesen Schritt durchzuführen. Mit derselben Prozedur können wir nun für Fk−1 eine gerichtete Kante zu einer der verbleibenden k-2 Wurzeln einfügen. Führen wir dies fort, so erhalten wir N*(Fk ) = nk−1 (k − 1)!. Da wir N*(Fk ) bereits oben berechnet haben, können wir diese beiden Ergebnisse zur . Für k = n besteht sammenfügen und erhalten N (Fk ) = nk−1 für jeden Wald Fk ∈ Fn,k Fn lediglich aus den n einzelnen Knoten, weshalb N(Fn ) die Anzahl aller verwurzelten r | = nn−1 = nT , qed. Bäume zählt. Wir erhalten |Fn,k n Auf dieser Beweisstruktur lässt sich ab dieser Stelle auch noch relativ einfach eine Bestätigung des Rekursionsbeweises aufbauen, die ohne Induktion abläuft. Allerdings wird dies hier aufgrund von Platzmangel nicht aufgeführt. Literatur [AigZie] Martin Aigner, Günter M. Ziegler Proofs lage: 3. A. (Oktober 2003), 141-146 [Aigner] Martin Aigner Combinatorial 1979, Nachdruck 1997 Theory. from the book. Springer, Berlin; Auf- Springer, Berlin Heidelberg New York [Cayley] Arthur Cayley A theorem on trees. Quart. J. Pure Appl. Math. 23 (1889), 376378; Collected Mathematical Papers Vol. 13, Cambridge University Press 1897, 26-28 [Joyal] A. Joyal Une 42(1981), 1-82 théorie combinatoire des séries formelles. 3 Advances in Math. [Pitman] J. Pitman Coalescent UC Berkeley 1996 random forests. Technical Report 457, Dept. Statistics, [Prüfer] H. Prüfer Neuer Beweis eines Physik (3) 27 (1918), 142-144 Satzes über Permutationen. Archiv der Math. u. [Rényi] A. Rényi Some remarks on the theory of trees. MTA Mat. Kut. Inst. Kozl. (Publ. math. Inst. Hungar. Acad. Sci.) 4 (1959), 73-85; Selected Papers Vol. 2, Akadémiai Kiadó, Budapest 1976, 363-374 [Riordan] J. Riordan Forests of labeled trees. J. Combinatorial Theory 5 (1968), 90-103 4