Themen für Bachelor- und/oder Masterarbeiten aus den Bereichen Kombinatorische bzw. Finanzmathematische Optimierung Dr. Eranda Dragoti-Cela Institut für Optimierung und Diskrete Mathematik (Math B), TU Graz April 2015 Themen aus kombinatorischer Optimierung 1. Gebrochene Färbungprobleme in Graphem Gebrochene Färbungsprobleme (in English fractional coloring) gehören zur sogenannten gebrochenen Graphentheorie (in Englisch fractional graph theory) und verallgemeinen die Färbungprobleme aus der klassischen Graphentheorie. Eine b-fache Kantenfärbung (Knotenfärbung) eines Graphen ist eine Zuordnung von (Farb)Mengen mit Kardinalität b zu den Kanten (Knoten) des Graphen, sodass benachbarte Kanten (Knoten) disjunkte Farbmengen erhalten. Eine a : b-fache Kantenfärbung (Knotenfärbung) ist eine b-fache Kantenfärbung (Knotenfärbung) mit Farben aus einer Grundmenge von Farben mit Kardinalität a. Der b-fache chromatischer Index χ′b (G) (die b-fache chromatische Zahl χb (G)) eines Graphen G ist der kleinste Wert von a, für den eine b-fache Kantenfärbung (Knotenfärbung) existiert. Der gebrochene chromatische Index χ′f (G) und die gebrochene chromatische Zahl χf (G)) sind folgendermaßen definiert: χ′b (G) χb (G) χf (G) = lim . b→∞ b→∞ b b χ′f (G) = lim Die gebrochenen Färbungprobleme lassen sich als lineare Optimierungsprobleme formulieren; die Anzahl der Restriktionen dieser linearen Probleme kann aber exponential groß im Vergleich zur Anzahl der Knoten bzw. Kanten des Graphen sein, was die effiziente Berechnung dieser Größen durch das Lösen des enstprechenden linearen Problems in generell natürlich unmöglich macht. Während der chromatische Index effizient berechnet werden kann ist die Berechnung der chromatischen Zahl in beliebigen Graphen ein NP-schweres Problem, siehe Scheinerman und Ullman [31]. Im Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene Einführung in die gebrochenen Färbungprobleme in Graphen, deren Eigenschaften und Anwendungen gegeben werden. Die Arbeit sollte auch den Zusammenhang der gebrochenen Färbungproblememen mit den dazugehörigen klassischen Analoga und auch die effiziente Berechnung des gebrochenen chromatischen Index erläutern. 2. Das inverse Gleiche-Kürzeste-Wegeproblem (The inverse equal shortest paths problem) Das Input des inversen Gleiche-Kürzeste-Wegeproblems (GKWP) ist ein zusammenhängender, nicht einfacher Graph G (d.h. Mehrfachkanten sind erlaubt). Sei V die Knotenmenge von G und A die Menge der geordneten Knotenpaare (i, j) mit i, j ∈ V , i 6= j. Weiters sei für jedes (i, j) ∈ A eine Menge Rij von gewichteten gerichteten Kanten gegeben, sodass für jedes r ∈ Rij r und eine gerichtete Kante von j nach i mit eine gerichtete Kante von i nach j mit Gewicht wij r Gewicht −wij existiert. Die Gewichte sind also schief-symmetrisch. Weiters gibt es eine Menge r () für jedes (i, j) ∈ A und jedes r ∈ Rij . Eine zulässige Lösung des von Straffunktionen fwij ∗ , für jedes Paar (i, j) ∈ A und Problems ist eine Menge von schief-symmetrischen Gewichten wij jedes r ∈ Rij , für die gilt: alle gerichteten s-t-Wege haben die gleiche Länge bzgl. den Gewichten w∗ für je zwei Knoten s und t, s 6= t. Gesucht wird ein optimalerPGewichtvektor w∗ , d.h. ein Gewichtvektor w∗ , der die Gesamtsumme der Straffunktionswerte (i,j)∈A,r∈Rij fwijr (wij ) unter allen zulässigen Gewichtvektoren w minimiert. Dieses Problem tritt (unter anderem) auf, wenn sogenannte aggregierte Reihungen berechnet werden sollten. Das ist dann der Fall, wenn gewisse Objekte, Individuen oder Teams (etwa Sportteams) gereiht werden sollten. Dabei gibt es unterschiedliche Reihungsvorschläge (etwa von unterschiedlichen Experten bzw. aus unterschiedlichen Gesischtspunkten) und es gilt eine Reihung zu bestimmen, die sogenannte aggregierte Reihung, die alle vorhandenen subjektiven Reihungen berücksichtigt und mit diesen so gut wie möglich in Einklang ist. Für die Modellierung dieses Problems mit Hilfe des GKWP sei auf Hochbaum [14] verwiesen. Das Problem ist effizient lösbar mit Hilfe von kombinatorischen Algorithmen für den Fall, wenn die Straffunktionen convex sind, siehe [14]. Im Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene Beschreibung des Problems und dessen Anwendung zur adequaten Modellierung des aggregierten Reihungproblems gegeben werden. Weiters sollten der effizient lösbare Spezialfall und der dazugehörige Algorithmus erläutert werden. 3. Das Frequenzzuordnungsproblem (the frequency assignment problem) (FZP) Das Frequenzzuordnungsproblem in seinen vielen Varianten entspricht praktischen Fragestellungen in Telekommunikationsnetzwerken. Das grundlegende Problem kann in ein allgemeines Framework folgendermaßen beschrieben. Ein Telekommunikationsnetzwerk wird als Graph modelliert, dessen Knoten Kommunikationszellen (Antennen, Basisstationen udgl.) entsprechen. Die Kanten entsprechen den Verbindungen (Kanälen) zwischen den KommunikatiThe Steiner Tree Problem Book Subtitle A Tour through Graphs, Algorithms, and Complexityonszellen. Jedem Knoten muss eine gewisse Anzahl von Frequenzen zugeordnet werden, damit der Knoten die ihm zugeordneten Verbindungen realisieren kann. In manchen Anwendungen gibt es für jeden Knoten eine im Voraus festgelegte Menge von Frequenzen, die diesem Knoten zugeordnet werden können. Abhängig von der Topologie des Graphen und den vorgenommenen Frequenzzuordnungen können zwischen bestimmten Verbindungspaaren kommunikationstörende Interferenzen eintreten. Die potentiellen Interferenzen werden oft anhand eines sogenannten Interferenzgraphen modelliert. In manchen Anwendungen muss das Eintreten von Interferenzen gänzlich ausgeschlossen werden, in Anderen wiederum wird das Eintreten von Interferenzen anhand von Straftermen in der Zielfunktion penalisiert. Das Ziel ist es eine Zuordnung von Frequenzen zu den Kommunikationszellen zu finden, die alle Anforderungen erfüllt und eine bestimmte Zielfunktion optimiert. Eine häufig verwendete Zielfunktion ist die Minimierung der Gesamtanzahl der verwendeteten Frequenzen. Eine andere in der Praxis relevante Zielfunktion ist die Minimierung der Differenz zwischen der höchsten und der niedrigsten Frequenz, die demselben Knoten zugeordnet werden. In der Regel sind die Varianten des FZP NP-schwer und es besteht ein starker Zusammenhang mit Färbungsproblemen in Graphen. Einige Forschungsaspekte im Bereich der Frequenzzuordnungsprobleme sind: gemischt-ganzzahlige Formulierungen, die eine approximative Lösung des Problems ermöglichen, strukturelle Untersuchungen des dazugehörigen Polytops, die Ermittlung von unteren (oberen) Schranken, die Entwicklung von heuristischen Verfahren, die die Ermittlung von guten Lösungen für praktische Probleme ermöglichen. Als allgemeine Orientierungshilfe und als Quelle von weiteren adequaten und modellspezifischen Referenzen kann die Arbeit von Aardal et al.˜(2003) dienen. 4. Optimierungsmodelle für die Aggregation unterschiedlicher Reihungen Das Problem der Aggregation unterschiedlicher Reihungen tritt bei diversen Anwendungen in der (multikriteriellen) Entscheidungstheorie, in Reihung von Webseiten, in Sport und in der künstlichen Intelligenz auf. Sehr allgemein formuliert besteht das Problem darin aus einer Grozahl von einzelnen Reihungen eine optimale Endreihung zu generieren, die - unterschiedlichen Kriterien entsprechend - die einzelnen Inputreihungen am besten repräsentiert. Eine Möglichkiet die Repräsentanz einer aggregierten Reihung zu modellieren ist die Verwendung der Abweichungen der aggregierten Reihung von den einzelnen Reihungen in einer Zielfunktion die eben diese Abweichung bestrafft. Ein ideales Modell sollte auch unterschiedliche Präferenzen des Entscheidungsträgers bzw. unterschiedliche Vertrauensgrade der jeweiligen Reihungen der Expertise deren Autoren entsprechend berücksichtigen. Weiters werden statt den ordinalen Reihungen oder als zusätzliche Inputs auch paarweise Vergleiche betrachtet und deren Einfluss auf die Optimierungsmodelle und deren Lösbarkeit untersucht. Einige mathematische Formulierungen dieser Klasse von Problemen führen auf Flussprobleme in Graphen, andere auf sogenannte Separation und Separation-Deviation Modelle. Das Ziel dieser Bachelor-Arbeit ist es die Problemstellung zu klären und unterschiedliche Ansätze zur Modellierung des Problems vorzustellen. Spezifische Eigenschaften der Reihungen wie Konsistenz, Gewichtung, Präferenz und Intesität sollen besprochen und modelliert werden. Darüber hinaus sollen für ausgewählte Modelle Lösungsverfahren besprochen und anhand von Beispielen getestet werden. Als Grundreferenzen können folgende Papers von Hochbaum et al. [16, 17, 18] herangezogen werden. 5. Polynomielle Algorithmen für die die sogenannten Ratio Regions und eine Varianten des noma” lisierten Schnitproblems. Die Grundlage dieses Themas ist eine Arbeit von Dorit Hochbaum [15]. In diversen Anwendungen ist es notwendig unterschiedliche Objekte so zu gruppieren oder partitionieren, dass die Objekte innerhalb einner Gruppe/Teil der Partition ähnlich sind und die Objekte aus unterschiedlichen Gruppen/Teile der Partition sich von einander unterscheiden, wobei auch die Gruppengröße gewisse Kriterien erfüllen muss. Solche Problemstellungen enstehen unter Anderem im Rahmen der sogenannten Segmentierung in der Bildverarbeitung. Oft werden die oben genannten zwei Ziele als Quotientenfunktion modelliert, die dann optimiert wird. Zwei Beispiele solcher Optimierungsprobleme sind das sogenannte Ratio Regions Pro” blem (RRP) und das normalisierte Schnittproblem (NSP). Diese zwei Probleme und ein paar anderen Varianten von Quotientenoptimierungsproblemen sind polynomial lösbar mit Hilfe von kombinatorischen Optimierungsalgorithmen, die auf eine rekurrente Anwendung eines minimalen s-t-Schnittalgorithmus in einem Hilfsgraphen beruhen. Die Größe des Hilfsgraphen ist polynomial bzgl. der Inputsgröße des ursprünglichen Problems. Diese Algorithmen lassen sich auf eine ganze Klasse von Quotientenoptimierungsproblemen anwenden, die eine Fomulierung als ein sogenanntes monotones ganzzahliges lineares Program zulassen. Insbesondere im Falle von Segmentation-Anwendungen ist die Verwendung dieser Algorithmen von Vorteil im Vergleich zur Alternativansätzen der kontinueirlichen Optimierung (meistens basierend aus Spektralanalyse): erstens sind die mit kontinuierlichen Methoden ermittelten Lösung reelle Zahlen und daher nicht direkt zulässig als Lösungen diskreter Partitionierungsprobleme, und zweitens sind die kontinuierlichen Methoden auch Relativ aufwendig was die Rechenzeit betrifft. Das Ziel dieser Bachelor-Arbeit ist es Quotientenoptimierungsprobleme, die mit der oben erwähnten Technik lösen lassen, zu formulieren und analysieren. Weiters sollen die kombinatorischen Lösungsalgorithmen präsentiert, analysiert und anhand von Beispielen veranschaulicht werden. Themen aus dem Bereich der Finanzmathematischen Optimierung 6. Die absolute Abweichung vom erwarteten Portfolioertrag als Risikomaß in der Portfolio- optimierung: Ein Vergleich mit dem Markowitzshen Portfolioptimierungsmodell Das Markowitzsche Portfolio-Optimierung berücksichtigt neben dem erwarteten Portfolioertrag auch die Varianz des Portfolio in der Zielfunktion des Optimierungsproblems. Das führt zu einem quadratischen Optimierungsproblem, siehe zB. Steinbach [30]. Ein alternativer Ansatz verwendet die erwartete absolute Abweichung der Portfoliorendite vom Erwartungswert statt der Varianz als Risikomaß. Daraus resultiert ein lineares Problem. Untersuchungen zeigen, dass die den beiden Modellen entsprechenden optimalen Portfolii in der Regel nicht sehr unterschiedlich sind. Daher wäre es unter Umständen sogar sinnvoll das lineare Modell gegenüber dem Markowitzschen Modell zu bevorzugen. Eine ausführlichere Diskussion dieser Thematik ist in Konno und Yamazaki (1991) zu finden. 7. Maximierung des Sharpe Ratio (SR) eines Portfolios im Vergleich zur Markowitzschen Portfoliooptimierung Das Sharpe Ratio (SR) eines Portfolios ist der Quotient des überschüssigen Portfolioertrags und der Portfoliovarianz, wobei der überschüssige Ertrag als Portfolioertrag abzüglich dem risikolosen Ertrag definiert wird, siehe Sharpe (1964). Die Maximierung des SR unter üblichen Investitionsrestriktionen ist eine mit der Markowitzschen Portfoliooptimierung eng verbundene Aufgabe aus dem Bereich des fractional programming“. Dieses Problem kann unter Einsatz ” der Kegeloptimierung gelöst werden, siehe Cornuejols und Tütüncü (2007). Im Rahmen der Behandlung dieses Themas sollte der Zusammenhang des Sharpe Ratio maximierenden Portfolios und der Markowitz-optimalen Portfolios anhand der sogenannten Kapitalmarktlinie (capital market line) erläutert werden, siehe zB. Fabozzi et al (2007). Die theoretische Auführung solle auch durch experimentelle Untersuchungen veranschaulicht werden. Bereits vergebene/behandelte Themen 1. Varianten des Briefträgerproblems (chinese postman problem) (BtP) (VERGEBEN) Sei G = (V, E) ein einfacher, zusammenhängender (gerichteter oder ungerichteter) gewichteter Graph in dem jeder Kante {i, j} ∈ E ein Gewicht cij zugeordnet wurde. Die Formulierung des klassischen Briefträgerproblems (BtP) geht auf dem chinesischen Mathematiker Kwan (1962)Im Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene zrück. Gesucht ist eine geschlossene Kantenfolge mit minimaler Länge derart, dass jede Kante des Graphen mindestens einmal in der Kantenfolge vorkommt. Eine derartige Kantenfolge heißt Briefträgertour. Dieses Problem is lösbar in polynomieller Zeit und gehört zur Folklore der kombinatorischen Optimierung. Mehrere Variationen des Problems wurden in der Literatur untersucht. Beispilesweise sei hier das von Dror, Stern und Trudeau (1987) eingeführte hierarchische Briefträgerproblem (HBtP) erwähnt. Hier liegt eine Partition der Kantenmenge, d.h. E = E1 ∪ E2 ∪ . . . Ek und Ei ∩ Ej = ∅, für alle i 6= j, i, j ∈ {1, 2, . . . , k}, und eine Totalordnung ≺ in {E1 , . . . , Ek } vor.Im Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene Das Ziel ist eine Briefträgertour von minimaler Länge zu bestimmen so, dass alle Kanten aus Ei vor allen Kanten aus Ei durchlaufen werden, für alle i, j ∈ {1, 2 . . . , k} mit Ei ≺ Ej . Falls G ungerichtet und die durch Ei , i ∈ {1, 2, . . . , k} induzierten Subgraphen von Ei zusammenhängend sind, dann ist dieses Problem polynomial lösbar etwa in O(kn4 ) Zeit (Korteweg, 2002). Es gibt weitwere Variationen des Problems in denen die Kanten des Graphen nicht nur durlaufen sondern auch bedient werden sollen. Es wird unterschieden zwischen Durchlaufzeit und Servicekosten und das Ziel ist es sowohl die gesamte Durchlaufzeit als auch die gesamten Servicekosten anhand einer lexikographischen Zielfunktion zu minimieren (Letchford and Iglese 1998). Als erste gut lesbare Referenz zu HBtP sei die Masterarbeit von Korteweg [21] erwähnt; diese Arbeit kann insbesondere auch als Quelle für weitere Referenzen dienen. 2. Das robuste Rucksackproblem (the robust knapsack problem) (RRsP) (abgeschlossen) Beim klassischen Rucksackproblem muss entschieden werden, welche Objekte aus einer gegebenen Grundmenge {O1 , O2 , . . . , On } in einem Rucksack eingepackt werden sollten, sodass das Gesamtgewicht des Rucksacks eine vorgegebene Grenze B nicht überschreitet und der Gesamtnutzen des Rucksacks maximiert wird. Hierbei sind Gewicht wi und Nutzen pi von Objekt Oi gegeben, i ∈ {1, 2, . . . , n}. Beim robusten Rucksackproblem wird angenommen, dass (einige) Inputs des Problems nicht als deterministische Größen sondern nur mit einer gewissenIm Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene Unsicherheit bekannt sind. Das Ziel ist es eine Lösung zu finden, die für alle bzw. die meisten Realisierungen der unsicheren Parameter gute Zielfunktionswerte leifert. Es gibt viele Möglichkeiten ein derartiges robustes Modell genau zu spezifizieren. Eine Variante des robusten Rucksackproblems lässt alle Inputs bis auf die Gewichte deterministische Größen sein während das Gewicht von Objekt Oi Werte aus einem Intervall der Form (wi − w̄i , wi + w̄i ) annehmen kann, wobei w̄i = δwi , für i ∈ {1, 2, . . . , n} und δ ∈ [0, 1] (siehe Bertsimas und Sim, 2003; Monaci und Pferschy, 2011) . Es wird weiters angenommen, dass die Gewichte höchstens für einen vorgegebenen Anteil Γ der Objekte unsicher sind, während für jedes andere Objekt Oi die Gewichte gleich dem Mittelpunkt wi des jeweiligen Intervalls sind. Eine Optimallösung des robusten Knapsackproblems ist eine Lösung die für alle möglichen Realisierungen der Gewichte wie oben beschrieben zulässig ist und unter allen Lösungen dieser Art einem maximalen Gesamtnutzen erreicht. Es ist intuitiv klar, dass der Optimaler Ziefunktionswert Opt(I) einer Instanz I des klassischen Rucksackproblems größer ist als der optimale Ziefunktionswert OptR (I) δ,Γ OptR δ,Γ (I) des robusten Rucksackproblems. Den Quotient Opt(I) wird als Preis der Robustheit (price of robustness) bezeichnet und ist Subjekt von Untersuchungen. Ein interessanter Aspekt ist zB. die Berechnung von unteren Schranken fr den obigen Quotienten. Analog kann der Preis der Robustheit für das kontinuierliche Rucksackproblem untersucht werden. Weiters gibt es auch einen effizienten Algorithmus zu Lösung des kontinuierlichen robusten Rucksackproblems, siehe Monaci und Pferschy [25]. Für eine tiefgehende theoretische Untersuchung über die Robustifizierung allgemeiner kombinatorischer Optimierungsprobleme sei auf Bertsimas und Sim [4] verwiesen. 3. Matching interdiction (MI) in Graphen mit beschränkter Baumweite (VERGEBEN) Die Eingabe dieses Problems ist ein so-genanntes Verbot-Netzwerk (G, w, c) mit einem gewichteten ungerichteten Graphen G = (V, E), Gewichten w : E → N und Verbot-Kosten c : E → N für die Kanten. Weiters wird ein Budget B ∈ Z+ gegeben. Sei M(G) die Menge aller Matchings in P G und ν(G) das maximale P Gewicht eines Matchings in G, d.h. ν(G) := maxM ∈M(G) e∈m w(e). Eine Menge R ⊆ E mit x∈R c(x) ≤ B heißt Verbot-Menge (interdiction set) in G. Der Graph, der aus G nach dem Entfernen aller Kanten einer Menge R entsteht wird mit G − R bezeichnet. Gesucht wird nun eine Verbot-Menge R∗ , sodass das maximale Gewicht eines Matchings in G − R minimiert wird: ν(G − R∗ ) = min{ν(G − R)|R ist eine Verbot-Menge in G} . In beliebeigen Verbot-Netzwerken ist MI streng NP-schwer, auch wenn die Kantengweichte bzw. die Verbot-Kosten alle gleich 1 sind (unit model). In Netzwerken mit beschränkter Baumweite ist das Problem jedoch psudopolynomial lösbar. Die Baumweite eines Graphen G = (V, E) wird mit Hilfe einer Baum-Zerlegung definiert. Eine Baum-Zerlegung von G = (V, E) ist ein Paar (X = {Xi : i ∈ I}, T = (I, F )), wobei T = (I, F ) ein Baum, sodass zu jedem Knoten i ∈ I eine Teilmenge Xi ⊆ V der Knoten von G assoziiert wird und folgende Eigenschaften gelten: (i) ∪i∈I Xi = V (ii) Für jede Kante {v, w} ∈ e gibt es ein i ∈ I,sodass {v, w} ⊆ Xi . (iii) Für jeden Knoten v ∈ V , die Menge der Knoten {i ∈ I|v ∈ Xi } induziert einen Teilbaum in T . Die Weite einer Baum-Zerlegung (X , T ) ist als maxi∈I {|Xi | − 1} definiert. Die Baumweite eines Graphen G = (V, E) ist als minimale Weite einer Baum-Zerlegung von G, d.h. als min max(|Xi | − 1)|(X , T ) ist eine Baum-Zerlegung von G i∈T definiert. Literaturquellen: Zenklusen [33, 35] 4. Das Steiner-Baumproblem (SBP) (VERGEBEN) Das Steiner-Baumproblem ist ein Klassiker der kombinatorischen Optimierung. Sei G = (V, E) ein (ungerichteter) Graph mit Gewichten w : E → R+ auf den Kanten und sei T ⊆ V eine Teilmenge von Knoten in G, die sogenannten Terminale. Gesucht wird ein zusammenhängender Teilgraph von G, der alle Terminale beinhaltet und minimales Gewicht hat. Dieser Teilgraph, der ein Baum ist, wird als Steiner-Baum bezeichnet. Wenn T = V , dann stimmt das SBP mit dem minimalen Spannbaumproblem (MSP) überein; in diesem Sinne ist das MSP ein Spezialfall vom SBP. Anders als das MSP ist das SBP jedoch NP-schwer. Diese Komplexität bleibt auch für den Euklidischen SBP erhalten, ein Spezialfall in dem die Knoten des Graphen Punkte im euklidischen Raum (zB. Ebene) sind und die Kantenlängen den Euklidischen Abständen entsprechen. Für 3 Punkte in der Ebene stimmt das Euklidische SBP mit dem Fermat Problem überein. Es sei an dieser Stelle jedoch erwähnt, dass das Euklidische SBP und das allgemeine SBP (in Graphen) ganz unterschiedliche Probleme sind was deren Eigenschaften und Lösungsansätzen betrifft. SBP ist ein schwieriges und gut untersuchtes Problem. Viele strukturelle Eigenschaften des Problems sind bekannt, etwa, dass die Anzahl der Steiner-Punkte n − 2 nicht überschreitet, wobei n := |V | und d ie Steiner-Punkte als jene Knoten v im Steiner-Baum definiert sind, für die v 6∈ T und deg(v) ≥ 3 gelten. Es gibt viele Heuristiken und Approximationsalgorithmen für das SBP, sowie polynomial lösbare Spezialfälle, etwa für Graphen mit beschränkter Baumweite, für k-planare Graphen, für seriell-parallele Graphen, Permutation-Graphen usw. Unter negativen“ ” Ergebnissen sei etwa erwähnt, dass das BSP auch für planare Graphen und Gitter-Graphen NPschwer bleibt. Als Grundreferenz kann das Buch von Prömel und Steger [27] verwendet werden. Es liefert einen umfangreichen Überblick über dieverse Aspekte des SBP und seine Verallgemeinerungen sowie weitere Referenzen über (fast) alle untersuchten Aspekte des Problems. Für diverse Aspekte des Problems knnen weitere maßgescheiderte Referenzen spezifiziert werden. 5. Das lineare Einbettungsproblem für Graphen (minimum linear arrangement problem (MLAP) (VERGEBEN) Beim MLAP müssen die Knoten eines ungerichteten (gewichteten) Graphen G = (V, E) mit Kantegewichten w : E → R in den Konten eines eindimensionalen equidistanten Gitters so eingebettet werden, dass die Summe der gewichteten Abstände zwischen den Bildern von Endknoten über alle Kanten von G minimiert wird. D.h., wenn n := |V | und die Gitterpunkte mit {1, 2, . . . , n} durchnummeriert werden, dann wird eine bijektive Abbildung f : V → {1, 2, . . . , n} P gesucht, sodass {u,v}∈E |f (u)−f (v)| minimiert wird. MLAP und seine Variationen haben zahlreiche Anwendung in Bereichen wie Komputerarchitektur, VLSI (very large scale integrated) design, Data Mining usw. Dieses Problem ist streng NP-schwer auch wenn G ein bipartiter Graph ist. Es gibt jedoch ein paar spezielle Klassen von Graphen in denen MLAP polynomial lösbar ist, etwa in Bäumen oder outerplanaren Graphen, d.h. in Graphen, die eine planare Einbettung besitzen, in der alle Knoten am Rande der äußeren Seite eingebettet werden. Weitere intensiv untersuchte Aspekte des Problems umfassen untere Schranken, Approximationsalgorithmen und Heuristiken. MLAP gehört zu einer breiteren Klasse von linearen Einbettungsproblemen, siehe Diaz, Petit und Serna [10]. Eine aktuellere Literaturübersicht über das MLAP ist in Caprara, Letchford und Salazar-Gonzalez [5] zu finden. Die oben genannten polynomial lösbaren Spezialfälle stammen aus Shiloach [29], Chung [6] und Frederickson und Hambrush [13]. Eine eventuell zugänglichere Referenz des polynomialen Algorithmus für das MLAP in planaren Graphen ist Hochberg [19]. 6. Das Markowitzsche Portfoliooptimierungsmodell: kritische Analyse und Resampling (abgeschlossen) Das Markowitzsche Portfoliooptimierungsmodell wird als erstes mathematisch-rigoroses Modell gefeiert, das neben dem erwarteten Ertrag auch das Risiko eines Portfolios in der Optimierung miteinbezieht. Einige wichtige Inputparameter dieses Modells, zB. die erwarteten Rendite der einzelnen Assets, sind jedoch nichtdeterministische Größen, die geschätzt werden müssen. Die apriori ermittelten Schätzer werden als Inputs im Markowitzschen Portfoliooptimierungsproblem eingesetzt. Naturgemäß hängt die Qualität des optimalen Portfolios stark von der Genauigkeit der Schätzer. In der Literatur wurden einige Ansätze diskutiert, um die oben genannte Abhängigkeit zu entschärfen. Ein möglicher Ansatz wäre das sogenannte portfolio resampling, siehe Michaud (1989, 2008). Im Rahmen der Behandlung dieses Themas ist eine quantitative Analyse der Auswirkungen des Resamplings durchzuführen. 7. Das robuste Spannbaumproblem (robust spanning tree problem) (RSbP) (abgeschlossen) Sei G = (V, E) ein gewichteter Graph mit unsicheren Gewichten. Das Ziel ist es einen Spannbaum in G zu finden, der für alle Realisierungen der Gewichte eine relativ gute Lösung“ des ” klassischen minimalen Spannbaumproblem mit eben diesen Kantegewichten darstellt. Natürlich ist dieses Ziel nur vage formuliert, denn es wurde weder ein Unsicherheitsmodell spezifiziert noch wurde klar definiert was eine gute Lösung“ ist. Unterschiedliche Spezifikationen führen ” zu unterschiedlichen Modellen des robusten Spannbaumproblems. Das Analogon zum obigen robusten Rucksackproblem ist polynomial lösbar, siehe Bertsimas und Sim [4]. Ein anderes Modell liegt vor, wenn jede Kante e ∈ E ein Gewicht ce aus einem Intervall [ce , c̄e ] haben kann. Für jede Realisierung {ce : e ∈ E, ce ∈ [ce , c̄e ]} der Gewichte bezeichnen wir mit c(Tc ) den optimalen Wert des klassischen Spannbaumproblems mit eben diesen Gewichtskoeffizienten. Tc sei also ein minimaler Spannbaum des klassischen Spannbaumproblems mit Kantenlängen c. Das Ziel des robusten Spannbaumproblems ist es einen Spannbaum T∗ zu finden, der das Maximum max{c(T∗ ) − c(Tc ) : c = (ce )e∈E mit ce ∈ [ce , c̄e ]} minimiert. Diese Variante des robusten Spannbaumproblems ist NP-schwer, siehe Aron und Van Hentenryck (2004). Dafür gibt es aber gemischt ganzzahlige Formulierungen, die die Berechnung von approximativen Lösung sowie die Ermittlung von strukturellen Eigenschaften des Problems ermöglichen, siehe Yaman, Karasan und Pinar (2001). 8. Network flow interdiction (NFI) in planaren Graphen (abgeschlossen) In diesem Problem werden ein Netzwerk (G, u, s, t) mit einem gerichteten planaren Graphen G = (V, E), Kapazitäten u : E → R+ eine Quelle s und eine Senken t, gegeben. Zu jedem Knoten bzw. Kante werden Verbot-Kosten (interdiction costs) c : V ∪ E → Z+ ∪ {∞} assoziiert, wobei c(s) P = c(t) = ∞ gilt. Weiters wird ein Budget B ∈ Z+ gegeben. Eine Menge R ⊆ V ∪ E mit x∈R c(x) ≤ B heißt Verbot-Menge (iterdiction set) in G. Der Graph, der aus G nach dem Entfernen aller Knoten bzw. Kanten einer Menge R entsteht wird mit G − R bezeichnet. Gesucht wird nun eine Verbot-Menge R∗ , sodass der Wert f ∗ (G− R) des maximalen s-t-Flusses in G − R minimiert wird: f ∗ (G − R∗ ) = min{f ∗ (G − R)|R ist eine Verbot-Menge in G} . Eine derartige Verbot-Menge R∗ heißt optimal. Eine optimale Verbot-Menge R∗ heißt effizient, wenn sie unter allen optimalen Verbot-Menge minimale Kosten besitzt, d.h. wenn X c(R∗ ) := = min{c(R)|R ist eine optimale Verbot-Menge} , x∈R∗ gilt. Eine optimale Verbot-Menge R∗ heißt minimal, wenn sie unter den optimalen VerbotMengen inklusion-minimal ist, keine echte Teilmenge von R∗ ist eine optimale Verbot-Menge. Ein mit NFI eng verbundetes Problem is das Netzwerksicherheitsproblem (NSP). Bezeichnen wir mit f ∗ (G) und fB∗ den Wert des maximalen s-t-Flusses in G bzw. in G − R∗ , wobei R∗ eine optimale Verbot-Menge ist. Beim Netzwerksicherheitsproblem (NSP) wird das kleinstmögliche Budget B ∗ gesucht, sodass f ∗ (B ∗ ) < f ∗ , d.h. B ∗ ∈ argmin{B ∈ Z+ |f ∗ (B) < f ∗ } . In beliebeigen Netzwerken ist NFI streng NP-schwer. In planeren Netzwerken ist das Problem durch pseudopolynomiale Algorithmen lösbar. Auch das NSP ist pseudopolynomial lösbar in planeren Netzwerken. Liteturquellen: Zenklusen [33, 34] 9. Clustering in Graphen und der Gomory-Hu-Baum (abgeschlossen) Ein Clustering in einem Graphen ist eine Zerlegung des Graphen in Teilgraphen mit gewissen vorspezifizierten Eigenschaften. Je nach Anwendungsbereich gibt es viele unterschiedliche Kriterien für gute Clusterings. Im Allgemeinen zielt ein Clustering darauf ab, das Ganze so in Teilen zu zerlegen, dass jedes Teil für sich möglichst homogen und die unterschiedlichen Teile gut separiert sind. Zwei Kriterien anhand derer Clusterings in Graphen bewertet werden können sind Expansion und Conductance. Gute Clusterings bzgl. diesen zwei Kriterien können mit Hilfe des Gomorys-Hu-Baums konstruiert werden. Sei G = (V, E) ein ungerichteter gewichteter Graph und w : E → R+ die Gewichtsfunktion auf die Kanten. Sei [S, S̄] ein Schnitt in G, d.h. ∅ = 6 S ( V , S̄ = V \ S und [S, S̄] = {u, v} ∈ E|u ∈ S, v ∈ S̄ . Die Expansion ψ([S, S̄]) und die Conductance φ([S, S̄]) sind folgendermaßen definiert: P P e∈[S,S̄] w(e) e∈[S,S̄] w(e) φ([S, S̄]) = ψ([S, S̄]) = min{|S|, |S̄|} min{c(S), c(S̄)} wobei c(S) := X w({u, v}) für ∅ = 6 S (V. {u, v} ∈ E : u ∈ S, v ∈ V Die Expansion eines Teilgraphen von G ist die minimale Expansion über alle Schnitte im Graphen. Die Expansion einer Clustering ist die minimale Expansion der Teilgraphen, die durch die Cluster induziert werden. Je größer die Expansion einer Clustering, um so besser ihre Qualität. Analog, die Conductance eines Teilgraphen von G ist die minimale Conductance über alle Schnitte im Graphen. Die Conductance einer Clustering ist die minimale Conductance der Teilgraphen, die durch die Cluster induziert werden. Je größer die Conductance einer Clustering, um so besser ihre Qualität. Für einen gegebenen Graphen ist es NP-schwer eine Clustering mit maximaler Expansion bzw. maximaler Conductance zu bestimmen. Mit Hilfe des Gomory-Hu-Baums kann jedoch in effizienter Weise eine Clustering bestimmt werden, sodass (a) die Expansion (Conductance) eine vorgegebene Schranke überschreitet, (b) die Summe der Gewichte der Kanten zwischen einem beliebigen Cluster und dem restlichen Graphen unterschreitet eine vorgegebene obere Schranke, und das gilt für jedes Cluster. Für einen ausführlichen Überblick über Clustering in Graphen sei auf Schaeffer [28] verwiesen. Der oben genannte Gomory-Hu-Baum basierte Algorithmus ist in Flake, Tarjan und Tsioutsiouliklis [12] beschrieben. 10. Kantenfärbung in Graphen (abgeschlossen) Eine Kantenfärbung in einem Graphen G = (V, E) mit m Kanten, m := |E|, ist eine Zuordnung von Farben aus {1, 2, . . . , m} zu den Kanten des Graphen, sodass keine benachbarten Kanten (d.h. Kanten, die einen gemeinsamen Knoten haben) die gleiche Farbe erhalten. Die kleinstmögliche Anzahl von Farben, die eine derartige Kantenfärbung erlaubt, heißt chromatischer Index des Graphen und wird mit χ′ (G) bezeichnet. Ein berühmtes Resultat ist der Satz von Vizing, der besagt, dass ∆(G) ≤ χ′ (G) ≤ ∆(G) + 1 für jeden einfachen Graphen G gilt, wobei ∆(G) das Maximum über alle Knotengrade in G ist. Es ist also sehr einfach eines der zwei möglichen Werte des chromatischen Index eines gegebenen Graphen zu ermitteln. Denoch ist es generelle schwer zu entscheiden welcher der beiden Werte der Richtige ist: die Berechnung des chromatisches Index ist in allgemeinen Graphen NP-schwer! Es gibt jedoch spezielle Graphenklassen für die der chromatischer Index effizient berechnet werden kann, etwa für bipartite Graphen oder für planare Graphen. Für einen bipartiten Graphen G gilt χ′ (G) = ∆(G) und eine Färbung, die χ′ (G) Farben benötigt, kann in O(m log ∆) berechnet werden (siehe Cole, Ost und Schirra [8]). Ein einfacherer aber etwas langsamerer Algorithmus wurde von Alon [2] präsentiert. Auch für planare Graphen G mit ∆(G) ≥ 7 gilt χ′ (G) = ∆(G); wenn ∆(G) ≥ 9 kann man eine optimale Kantenfärbung, d.h. eine Kantenfärbung die eine minimale Anzahl von Farben benötigt, in linearer Zeit finden, siehe Cole und Kowalik [7]. Im Rahmen einer Bachelorarbeit Arbeit könnte neben einer allgeimenen Einführung in das Kantenfärbungproblem die effiziente Lösbarkeit des Problems für eine der oben erwähnte Graphenklassen untersucht werden. Ein anderer Aspekt, der untersucht werden könnte, sind effiziente Algorithmen, die eine Kantenfärbung eines beliebigen Graphen G mit höchstens ∆(G) + 1 Farben ermöglichen, siehe z.B. Misra and Griess [24]. Literatur [1] K.I. Aardal, S.P.M. Van Hoesel, A.M.C.A. Koster, C. Mannino und A. Sassano, Models and solutions techniques for frequency assignment problems, 4OR, Operations Research Quarterly 1(4), 261-317, 2003. [2] N. Alon, A simple algorithms for edge coloring bipartite multigraphs, Information Processing Letters 86, 2003, 301–302. [3] I.D. Aron und P. Van Hentenryck, On the complexity of the robust spanning tree problem with interval data, Operations Research Letters˜32, 36-40, 2004. [4] D. Bertsimas und M. Sim, Robust discrete optimization and network floes, Mathematical Programming 98, 49–71, 2003. [5] A. Caprara, A.N. Letchford und J. Salazar-Gonzalez, Decorous lower bounds for minimum linear arrangement, INFORMS Journal on Computing 23(1), 26–40, 2011. [6] F.R.K. Chung, An optimal linear arrangement of trees, Comp. Math. Appl. 10(1), 1984, 43–60. [7] R. Cole, L. Kowalik, New linear-time algorithms for edge-coloring planar graphs, Algorithmica 50 (3), 2008, 351–368. [8] R. Cole, K. Ost, S. Schirra, Edge-coloring bipartite multigraphs in O(ElogD) time, Combinatorica 21 (1), 2001, 5–12. [9] G. Cornuejols und R. Tütüncü, Optimization Methods in Finance, Cambridge University Press, 2007. [10] J. Diaz, J. Petit und M. Serna, A survey of graph layout problems, ACM Computing Surveys 34(3), 313–356, 2002. [11] F. Fabozzi, P. Kolm, D. Pachamanova und S. Focardi, Robust Portfolio Optimization and Managenent, Wiley, 2007. [12] G.W. Flake, R.E. Tarjan, K. Tsioutsiouliklis, Graph clustering and minimum cut trees, Internet Mathematics 1(4), 2004, 385–408. [13] G.N. Frederickson, E.E. Hambrush, Planar linear arrangements of outerplanar graphs, IEEE Transactions on Circuits and Systems 35, 1988, 323–332. [14] D. Hochbaum, Ranking sport teams and the inverse equal paths problem, Lecture Notes ion Computer Science 4286, P. Spirakis et al. Hrsg., 2006, S. 307–318. [15] D. Hochbaum, Polynomial time algorithms for ratio regions and a variant of normalized cut, IEEE Transactions on Pattern Analysis and Machine Intelligence 32(5), 2010, 889–898. [16] D. Hochbaum, The separation and separation-deviation methodology for group decision making and aggregate ranking, J.J. Hasenbein, ed., TutORials in Operations Research, INFORMS Vol. 7, 2010, Hanover, MD, pp. 116–141. [17] D. Hochbaum und A. Levin, Methodologies for the group rankings decision, Management Science 52, (9), 2006, 1394–1408. [18] D. Hochbaum und E. Moreno-Centeno, Country credit-risk rating aggregation via the separationdeviation model, Optimization Methods and Software 23(5), 2008, 741–762. [19] R. Hochberg, Minimum linear arrangement of trees, Master Thesis, North Carolina State University, 2002. [20] H. Konno und H. Yamazaki, Mean-absolute deviation portfolio optimization model and its applications tu Tokyo stock market, Management Science 37(5), 519-531, 1991. [21] Peter Korteweg, Postman problems, priorities and the concept of serving, Master Thesis, Unversity of Amsterdam, 2002. [22] R.O. Michaud, The Markowitz optimization enigma: Is ’optimized’ optimal? Financial Analysts Journal 42, 1989. Im Rahmen einer Bachelorarbeit Arbeit könnte eine allgeimene [23] R. Michaud und R. Michaud, Estimation error and portfolio optimization: a resampling solution, Journal of Investment Management 6(2), 8-28, 2008. [24] J. Misra, D. Gries, A constructive proof of Vizing’s Theorem, Information Processing Letters 41 (3), 1992, 131–133. [25] M. Monaci und U. Pferschy, On the robust knapsack problem, verfügbar via Optimization Online 2011-04-3019, 2011. [26] W.F. Sharpe, Capital asset prices: A theory of market equilibrium under conditions of risk, Journal of Finance 19(3), 425-442, 1964. [27] J. Prömel und A. Steger, The Steiner Tree Problem: A Tour through Graphs, Algorithms and Complexity, Springer, 2002. [28] S.E. Schaeffer, Graph Clustering, Computer Science Reviews 1, 2007, 27–64. [29] Y. Shiloach, A minimum linear arrangement algorithm for undirected trees, SIAM Journal on Computing 8, 15–32, 1979. [30] M.C. Steinbach, Markowitz revisited: Mean-variance models in financial portfolio analysis, SIMA Review 43(1), 31-85, 2001. [31] E. Scheinerman, D. Ullman, Fractional graph theory, 2008. http://www.ams.jhu.edu/ ers/fgt/index.html [32] H. Yaman, O.E. Karasan und M.C. Pinar, The robust spanning tree problem with interval data, Operations Research Letters˜29, 31-40, 2001. [33] Rico Zenklusen, Combinatorial methods for analyzing network security and reliability, Dissertation, ETZ Zürich, 2009. [34] Rico Zenklusen, Network flow interdiction on planar graphs, Discrete Applied Mathematics 158(13), 1441–1455, 2010. [35] Rico Zenklusen, Matching interdiction, Discrete Applied Mathematics 158(15), 1676–1690, 2010.