1 Allgemeine Angaben Fortsetzungsantrag auf Gewährung einer Sachbeihilfe 1.1 Antragsteller Martin Ziegler, Dr.rer.nat. (Dipl.-Math. Dipl.-Phys.) wiss. Angestellter (derzeit bis 30.4.2008) Geburtstag: 19.11.1968, Nationalität: deutsch Geschäftszeichen des Vorantrags: Zi 1009/1-1 Fakultät V (Elektrotechnik, Informatik und Mathematik) Universität Paderborn Warburger Str. 100, 33095 Paderborn Telefon: 05251/60-3067 Fax: 05251/60-6482 Email: [email protected] Privat: Franziskanermauer 22, 33098 Paderborn, 05251/8785870 1.2 Thema Real Hypercomputation: Berechenbarkeitstheorie reeller Funktionen jenseits der Church-Turing Hypothese 1.3 Kennwort Real Hypercomputation 1.4 Fachgebiet und Arbeitsrichtung Theoretische Informatik, Berechenbarkeitstheorie und Rechenmodelle über reellen Zahlen 1.5 Voraussichtliche Gesamtdauer Das Vorhaben läuft und wird von der DFG gefördert seit Oktober 2005. Diese Förderung erstreckt sich, inklusive einer mit der DFG abgestimmten Aussetzung (April 2006 bis einschliesslich Oktober 2006 zur Wahrnehmung eines fremdfinanzierten Aufenthalts am Japan Advanced Institute of Science and Technology), bis derzeit Ende April 2008. Das Projekt soll noch bis April 2009 laufen; für diese weiteren 12 Monate beantrage ich hiermit Förderung durch die DFG. 1.6 Antragszeitraum 1.5.2008 – 30.4.2009 Das Schreiben der bisherigen Bewilligung ist datiert vom 18.5.2005. Die darin bewilligten Personal- und Sachmittel reichen voraussichtlich bis Ende April 2008. 1.7 Zusammenfassung Bei Real Hypercomputation handelt es sich um die Synthese zweier moderner Forschungsgebiete: der Theorie des Rechnens über und mit reellen Zahlen einerseits, andererseits der Entwicklung und Analyse von (diskreten) Rechenmodellen jenseits der Church-Turing Hypothese. (Siehe auch den Abschnitt “Zusammenfassung” des Erstantrags.) 1 Beispielsweise lassen sich die gängigen Modelle reellen Rechnens durch Orakelzugriff (z.B. auf das Halteproblem) erweitern und, in Analogie zur diskreten Theorie der Turing-Grade, deren jeweilige Fähigkeiten studieren und charakterisieren. Darüber hinaus – und im wesentlichen Unterschied zum diskreten Fall – ergeben sich in natürlicher Weise nicht-orakelartige Erweiterungen und so eine außerordentlich reichhaltige Theorie. Auf der anderen Seite erlauben die so erweiterten Maschinen einen Vergleich der (ansonsten unvergleichbaren) klassischen reellen Rechenmodelle. Die Projektverlängerung hat zum einen eine Übertragung der bekannten diskreten Kolmogorov’schen Komplexitätstheorie zum Inhalt; zum anderen soll in der Rekursiven Analysis der Nutzen beschränkter diskreter (und damit i.d.R. unberehenbarer) Zusatzinformation zu reellen Problemen bestimmt werden. Letzteres hilft, numerisch instabile Aufgaben zu behandeln und steht überraschenderweise in Zusammenhang zu ersterem. 2 Stand der Forschung, eigene Vorarbeiten Grundsätzlich sei auf den entsprechenden Abschnitt des Erstantrags1 verwiesen, so daß ich im Folgenden die seitdem entstandenen Neuerungen diskutiere. 2.1 Stand der Forschung Der aktuelle Forschungsstand zum Gebiet Real Hypercomputation mit fremden und eigenen Arbeiten ist in meiner Habilitationsschrift (Verfahren eröffnet am 10.9.2007) ausführlich dargestellt [36]; ein kürzerer Überblicksartikel erschien als [33]; beide liegen dem Antrag als Anlage bei. (Literaturreferenzen beziehen sich auf Seiten 5ff. . . ) Zusätzlich ist für das Arbeitsprogramm des vorliegenden Fortsetzungsantrag, neben dem bereits im Erstantrag angegebenen und den Standardbüchern [BCSS98] und [Weih00], folgender Stand der Forschung relevant: 2.1.1 Kolmogorov-Komplexität Ein bekanntes Maß für die Komprimierbarkeit langer Bitstrings x̄ ∈ {0, 1}∗ ist deren Kolmogorov-Komplexität K(x̄) ∈ N; formal: die minimale Beschreibungslänge |hM i| einer Turingmaschine M , welche x̄ ausgibt und hält [LiVi97]. Wichtige Eigenschaften dieser Größe sind unter anderem: a) ihre Unabhängigkeit, bis auf additive Konstanten, vom betrachteten Programmiersystem (d.h. der Gödelisierung h · i); b) die Existenz unkomprimierbarer Instanzen x̄; c) die Unberechenbarkeit (und sogar Turing-Vollständigkeit) der Funktion x̄ 7→ K(x̄) d) Anwendungen in der Analyse von Algorithmen und dem Beweis (z.B. unterer) Laufzeitschranken. 2.1.2 Topologische Komplexität von Funktionen Der manchmal sogenannte Hauptsatz der Rekursiven Analysis besagt, daß jede berechenbare Funktion f : X → Y notwendig stetig ist; mit anderen Worten: das Urbild f −1 [V ] ⊆ X einer offenen Menge V ⊆ Y is offen (in X), d.h. gehört zur 1 Dieser und weitere Anlagen wie beispielsweise eigene Publikationen sind verfügbar unter http://www.upb.de/cs/ag-madh/WWW/ziegler/DFG/ 2 Klasse Σ1 der Borel Hierarchie. Um für unstetige Funktionen das Abweichen von dieser Bedingung zu messen, gibt es verschiedene Ansätze: a) [Hert96] definiert f als zur d-ten Ebene der Unstetigkeit gehörend, falls der folgende Prozeß nach d Schritten zur leeren Menge führt: Bilde die Teilmenge X1 ⊆ X aller Unstetigkeitspunkte von f = f |X , dann die Menge X2 ⊆ X1 aller Unstetigkeitspunkte von f |X1 etc. b) Borel-d-Meßbarkeit bedeutet, daß f −1 [V ] ⊆ X zur Klasse Σd gehört für jedes offene V ⊆ Y ; vgl. [Brat05]. c) Weitere topologische Hierarchien wie Wadge etc. [Seli06] 2.1.3 Nichtuniform-berechenbare Analysis Der o.g. Hauptsatz der Rekursiven Analysis schließt zahlreiche praktische Funktionen f (ebenso Funktionale und Operatoren) von der Berechenbarkeit alleine deshalb aus, weil sie unstetig sind: Berechenbare Argumente x werden dennoch auf berechenbare Werte f (x) abgebildet, d.h. nichtuniform ist ein solches f berechenbar. Konkrete und praxisrelevante Beispiele für letzteres sind wohlbekannt, z.B. in der effektiven Funktionalanalysis [PERi89, First Main Theorem] oder [Brat03]. Andererseits ist hier der Grad2 der Nichtuniformität unbeschränkt. 2.1.4 Bibliotheken/Programme für exaktes reelles Rechnen Gleitkommazahlen werden in den Genauigkeitsformaten float und double (und ggf. noch ein weiteres) von gängiger Hardware unterstützt. Darüberhinausgehende Mantissenlängen simulieren Bibliotheken wie MPFR oder GMP. In Verbindung mit Intervall-Arithmetik erreicht man so jede gewünschte Ausgabepräzision — wenn nur die Zwischenoperationen in hinreichend hoher Genauigkeit durchgeführt werden: diese adaptiv zu bestimmen erfordert weitere Software. Für das Rechnen auf rationalen und algebraischen Zahlen sind hier primär LEDA [BKM*95] und Core [KLPY99] zu nennen; sie nutzen sogenannte root bounds algorithmisch aus [BFMS00] und sind sehr nützlich in der Algorithmischen Geometrie. Basierend auf dem der Rekursiven Analysis zugrunde liegenden Rechenmodell [BrHe98] können iRRAM [Muel01] und RealLib [Lamb05] auch transzendente Daten effizient verarbeiten. Ariadne [Coll07] soll sich besonders für dynamische Systeme (z.B. Approximation invarianter Mengen) eignen, MmxLib [vdHo06] legt den Schwerpunkt auf das Lösen von Differentialgleichungen. 2.2 Eigene Vorarbeiten / Arbeitsbericht Der aktuelle Forschungsstand zum Gebiet Real Hypercomputation mit fremden und eigenen Arbeiten ist in meiner Habilitationsschrift (Verfahren eröffnet am 10.9.2007) ausführlich dargestellt [36]; ein kürzerer Überblicksartikel erschien als [33]. Primäre Modelle reellen Rechnens sind die BCSS-Maschine (arithmetische Operationen und Vergleiche, exakt) und das der Rekursive Analysis (Approximation durch rationale Folgen auf der Turing-, d.h. Typ-2 Maschine). Entsprechend fallen die meisten Arbeiten zu reellen Hypercomputern in zwei Klassen: Erweiterungen des einen (siehe Abschnitt 2.2.1) oder des anderen (siehe Abschnitte 2.2.2 und 2.2.3) Modells. Ein Vergleich der jeweils induzierten Arithmetischen Hierarchien (d.h. iterierten Halte-Orakeln, vgl. Abschnitte 3.2.1 und 3.2.6 laut Arbeitsprogramm des Erstantrags) wird in [33] unternommen. [36, Kapitel 6] vergleicht u.a. die Mächtigkeit der 2 in einem hier intuitiv gemeinten und in Abschnitt 3.2.13 präzisierten Sinn 3 (nicht-erweiterten sondern, um Trivialitäten zu vermeiden – vgl. Abschnitt 3.2.5 im Arbeitsprogramm des Vorantrags – sogar eingeschränkten) BCSS-Maschine mit jenen einer Orakel Typ-2 Maschine. Als Synthese beider erweisen sich die sogenannten robust quasi-starken δ–Q–Analytischen Maschinen nach Chadzelek und Hotz. 2.2.1 Eigene Vorarbeiten für das BCSS-Modell Wie im diskreten Fall kommt es auch im Reellen vor, daß Unentscheidbarkeit ohne Vollständigkeit (im Sinne von Reduzierbarkeit vom anstatt auf das Halteproblem) einhergeht [24, 29]; vgl. Abschnitt 3.2.11 im Arbeitsprogramm des Erstantrags. Anders als bei Turingmaschinen scheint diese Antwort von Posts Problem im BCSSFall jedoch sozusagen dermaßen ‘die Regel’ zu sein, daß man sich schon gehörig anstrengen muß, um eine (‘natürliche’) BCSS-vollständige reelle Sprache zu konstruieren [34]; siehe auch [36, Kapitel 5.5]. [27] und [36, Kapitel 2.3.4] befassen sich mit genauer mit dem Mächtigkeitsgewinn, den zusätzliche reelle Konstanten einer BCSS-Maschine verschaffen. Beispielsweise erfordert die Äquivalenz zwischen Aufzählbarkeit und Semi-Entscheidbarkeit im allgemeinen eine zusätzliche solche Konstante. Diese Überlegungen verallgemeinert [36, Kapitel 5.2] auf Orakelmaschinen und insbesondere [36, Kapitel 5.4] auf die Arithmetische BCSS-Hierarchie. Überraschenderweise gibt es hier (zugegebenermaßen artifizielle) Orakel, relativ zu denen Aufzählbarkeit nicht Entscheidbarkeit impliziert, egal wie viele zusätzliche Konstanten man spendiert (Abschnitte 3.2.5 und 3.2.6 im Arbeitsprogramm des Vorantrags). Die (deterministische) Arithmetische BCSS-Hierarchie steht in engem Zusammenhang zur klassischen Borel-Hierarchie topologischer Räume, wohingegen die von nichtdeterministischen BCSS-Maschinen induzierte Hierarchie (vgl. Abschnitt 3.2.9 im Arbeitsprogramm des Erstrantrags) in der projektiven Hierarchie leben [Cuck92]. 2.2.2 Eigene Vorarbeiten in Rekursiver Analysis Jede im Sinne der Rekursiven Analysis berechenbare Funktion ist notwendig stetig (“Hauptsatz”). Meine Arbeiten untersuchen verschiedene Ansätze, diese Einschränkung durch ‘Hypercomputation’ zu überwinden. Hierbei erweisen sich Orakelmaschinen als zu schwach [26], da der o.g. Hauptsatz aus rein informationstheoretischen Argumenten folgt. Erst • eine Relaxierung des Approximationsbegriffs (z.B. von ‘mit’ zu ‘ohne Fehlerschranken’) macht gewisse unstetige Funktionen berechenbar — ist allerdings nicht abgeschlossen unter Komposition. Dies hingegen gewährleisten nicht-deterministische Typ-2 Maschinen [28]; vgl. Abschnitt 3.2.2 im Arbeitsprogramm des Erstantrags. (Solche sind also, anders als im diskreten Fall, wesentlich mächtiger als deterministische.) Die o.g. Relaxierung des Approximationsbegriffs läßt sich gemäß [30] interessanterweise äquivalent auch verstehen als • informationstheoretische Variante des Halte-Orakels oder als • “Revising Computation” á la [Gold65, Putn65, Burg04, Schm02], oder als • Algorithmen für (unendliche) Datenströmen im sog. “Turnstile model ” [Muth05]; vergleiche [36, Kapitel 4.4]. Dies erlaubt [30] eine Charakterisierung der so hyperberechenbaren Funktionen in Termen effektiver Borel-Meßbarkeit [Brat05]. 4 2.2.3 Realistische Hyperberechenbarkeit unstetiger Funktionen Die Realisierbarkeit sowohl von nichtdeterministischen Maschinen wie auch von Halte-Orakeln ist derzeit zumindest fraglich. Erheblich praxisrelevanter hingegen ist der Ansatz, den die Arbeiten [18, 21, 32] verfolgen: nämlich die Einschränkung der betrachteten Funktion f auf Teilbereiche Zi ⊆ dom(f ), auf welchen sie stetig ist. [21] beispielsweise erlaubt die Einschränkung f |Z eines unstetigen Problems f : R2 → N aus der algorithmischen Geometrie, um es so berechenbar—dafür jedoch partiell zu machen. Oder [18, Abschnitt 3.3] beweist formal, was die numerische Erfahrung schon lange beobachtet: daß die Diagonalisierung symmetrischer Matrizen (Spektralsatz) im Allgemeinen nicht berechenbar, bei Einschränkung auf nichtdegenerierte Eigenwerte (d.h. Multiplizität jeweils 1) jedoch schon. Ganz interessant: für Berechenbarkeit genügt es zu wissen, wie viele verschiedene Eigenwerte die gegebene Matrix A ∈ Rn×n besitzt. [32, Abschnitt 5] gibt weitere Beispiele für natürliche unstetige Probleme, welche nicht-uniform (d.h. für jedes einzelne Zi ) berechenbar werden. 2.2.4 Rapid Numerical Prototyping und empirische Stabilitätsanalyse Auch hierfür, d.h. zusätzlich zu den in Abschnitt 2.1.4 angegebenen Anwendungsgebieten, eignen sich Systeme für exaktes reelles Rechnen (genauer: mit automatischer, Ausgabe-orientierter Genauigkeitsanpassung): Man implementiert fluchs den interessierenden Algorithmus und läßt für relevante Beispieleingaben das Programm selbst feststellen, welche Rechengenauigkeit es benötigt. Mittels der o.g. iRRAM hat dies mein Student Sven Köhler in seiner Diplomarbeit [35] für die FFT-basierte schnelle Polynommehrfachauswertung durchgeführt. Eigene Publikationen3 [18] M. Ziegler, V. Brattka: “Computability in linear algebra”, S.187-211 in Theoretical Computer Science Bd.326 (2004). [19] C. Schindelhauer, K. Volbert, M. Ziegler: “Spanners, Weak Spanners, and Power Spanners”, S.805-821 in Proc. 15th Annual International Symposium on Algorithms and Computation (ISAAC’04), Springer LNCS Bd.3341. [20] M. Ziegler, B. Fuchssteiner: “Nonlinear Reformulation of Heisenberg’s Dynamics”, S.693-717 im International Journal of Theoretical Physics (IJTP) Bd.44:7 (2005). [21] M. Ziegler: “Stability versus Speed in a Computable Algebraic Model”, in Proc. 5th Conference on Real Numbers and Computers (RNC5, 2003); Vollversion: S.14-26 in Theoretical Computer Science Bd.351 (2006). [22] M. Ziegler: “Effectively Open Real Functions”, S.827–849 im Journal of Complexity Bd.22 (2006). [23] M. Ziegler: “Computational Power of Infinite Quantum Parallelism”, S.20572071 im International Journal of Theoretical Physics (IJTP) Bd.44:11 (2005). [24] K. Meer, M. Ziegler: “An Explicit Solution to Post’s Problem over the Reals”, S.456-467 in Proc. 15th International Symposium on Fundamentals of Computation Theory (FCT’05), Springer LNCS Bd.3623; siehe auch [29]. 3 Nummerierung fortgesetzt aus dem Erstantrag. . . 5 [25] S. Köhler, C. Schindelhauer, M. Ziegler: “On Approximating RealWord Halting Problems”, S.433-455 in Proc. 15th International Symposium on Fundamentals of Computation Theory (FCT’05), Springer LNCS Bf.3623. [26] M. Ziegler: “Computability and Continuity on the Real Arithmetic Hierarchy”, S.562-571 in Proc. CiE 2005: New Computational Paradigms, Springer LNCS Bd.3526. [27] K. Meer, M. Ziegler: “Uncomputability below the Real Halting Problem”, S.368-377 in 2nd Conf. on Computability in Europe (CiE’06), Springer LNCS Bd.3988. [28] M. Ziegler: “Real Hypercomputation and Continuity”, S.177–206 in Theory of Computing Systems vol.41 (2007). [29] K. Meer, M. Ziegler: “An Explicit Solution to Post’s Problem over the Reals”, Journal of Complexity vol.23 (2007). [30] M. Ziegler: “Revising Type-2 Computation and Degrees of Discontinuity”, S.255–274 in Proc. 3rd International Conference on Computability and Complexity in Analysis (CCA’06), Electronic Notes in Theoretical Computer Science Bd.167 (2007). [31] M.R. Emamy-K., M. Ziegler: “On the Coverings of the d-Cube for d ≤ 6”, angenommen bei Discrete Applied Mathematics/Discrete Optimization, special issue Proc. CTW 2005 ; erscheint vor. 2008. [32] S. Le Roux, M. Ziegler: “Singular Coverings and Non-Uniform Notions of Closed Set Computability”, S.169–185 in Proc. 4th International Conference on Computability and Complexity in Analysis (CCA’07), Electronic Notes in Theoretical Computer Science. [33] M. Ziegler: “(Short) Survey of Real Hypercomputation” S.809–824 in Proc. 3rd Conference on Computability in Europe (CiE’07), Springer LNCS Bd.4497 (eingeladener Beitrag). [34] K. Meer, M. Ziegler: “Real Computational Universality: The Word Problem for a Class of Groups with Infinite Presentation”, S.726–737 in Proc. 32nd International Symposium on Mathematical Foundations of Computer Science (MFCS 2007), Springer LNCS Bd.4708; Vollversion eingereicht. [35] S. Köhler: “Zur Praktikabilität schneller Polynomarithmetik”, Diplomarbeit (2007). [36] M. Ziegler: “Real Computability and Hypercomputation”, eingereicht als Habilitationsschrift (September 2007). [37] K. Lürwer-Brüggemeier, M. Ziegler: “On Faster Integer Calculations using Non-Arithmetic Primitives”, eingereicht. Weitere Referenzen [BCdN06] P. Bürgisser, F. Cucker, P. de Naurois: “The Complexity of Semilinear Problems in Succinct Representation”, pp.197–235 in Computational Complexity vol.15 (2006). 6 [BCSS98] L. Blum, F. Cucker, M. Shub, S. Smale: “Complexity and Real Computation”, Springer (1998). [BFMS00] C. Burnikel, R. Fleischer, K. Mehlhorn, S. Schirra: “A Strong and Easily Computable Separation Bound for Arithmetical Expressions Involving Radicals”, pp.87–99 in Algorithmica vol.27 (2000). [BKM*95] C. Burnikel, J. Könemann, K. Mehlhorn, S. Näher, S. Schirra, C. Uhrig: “Exact Geometric Computation in LEDA”, pp.418–419 in Proc. 11th Annual Symposium on Computational Geometry (SoCG’95). [Brat03] V. Brattka: “The Inversion Problem for Computable Linear Operators”, pp.391–402 in Proc. 20th Annual Symposium on Theoretical Aspects of Computer Science (STACS 2003), Springer LNCS vol.2607. [Brat05] V. Brattka: “Effective Borel measurability and reducibility of functions”, pp.19–44 in Mathematical Logic Quarterly vol.51 (2005). [BrHe98] V. Brattka, P. Hertling: “Feasible real random access machines”, pp.490–526 in Journal of Complexity vol.14:4 (1998). [BSS89] L. Blum, M. Shub, S. Smale: “On a Theory of Computation and Complexity over the Real Numbers: N P-Completeness, Recursive Functions, and Universal Machines”, pp.1–46 in Bulletin of the American Mathematical Society (AMS Bulletin) vol.21 (1989). [Burg04] M. Burgin: “Algorithmic Complexity of Recursive and Inductive Algorithms”, pp.31–60 in Theoretical Computer Science vol.317 (2004). [Coll07] P. Collins: “Effective Computation for Nonlinear Systems”, pp.169– 178 in Proc. 3rd Conference on Computability in Europe (CiE 2007), Springer LNCS vol.4497. [Cuck92] F. Cucker: “The arithmetical hierarchy over the reals”, pp.375–395 in Journal of Logic and Computation vol.2(3) (1992). [Gold65] E.M. Gold: “Limiting Recursion”, pp.28–48 in Journal of Symbolic Logic vol.30:1 (1965). [Hert96] P. Hertling: “Topological Complexity with Continuous Operations”, pp.315–338 in Journal of Complexity vol.12 (1996). [vdHo06] J. van der Hoeven: “Effective real numbers in Mmxlib”, pp.138–145 in Proc. International Symposium on Symbolic and Algebraic Computation (ISSAC 2006). [KLPY99] V. Karamcheti, C. Li, I. Pechtchanski, C.K. Yap: “A core library for robust numeric and geometric computation”, pp.351–359 in Proc. 15th Annual Symposium on Computational Geometry (SoCG’99). [Koep01] W. Koepf: “Besprechungen zu Büchern der Computeralgebra: Klaus Weihrauch Computable Analysis”, p.29 in Computeralgebra Rundbrief vol.29 (2001), http://www.fachgruppe-computeralgebra.de/CAR/CAR29/node19.html [Lamb05] B. Lambov: “RealLib: an Efficient Implementation of Exact Real Arithmetic”, pp.81–98 in Mathematical Structures in Computer Science vol.17 (2007). 7 [LiVi97] M. Li, P. Vitányi: “An Introduction to Kolmogorov Complexity and Its Applications” (2nd Edition) Springer (1997). [Muel01] N. Müller: “The iRRAM: Exact Arithmetic in C++”, pp.222–252 in Proc. 4th International Workshop on Computability and Complexity in Analysis (CCA’2000), Springer LNCS vol.2064. [Muth05] S. Muthukrishnan: “Data Streams: Algorithms and Applications”, r vol.1:2 of Foundations and Trends in Theoretical Computer Science (Editor: Madhu Sudan), now publishers (2005); preliminary version: http://www.cs.rutgers.edu/~muthu/stream-1-1.ps [PERi89] M.B. Pour-El, J.I. Richards: “Computability in Analysis and Physics”, Springer (1989). [Putn65] H. Putnam: “Trial and Error Predicates”, pp.49–57 in Journal of Symbolic Logic vol.30:1 (1965). [Schm02] J. Schmidhuber: “Hierarchies of Generalized Kolmogorov Complexities and Nonenumerable Universal Measures Computable in the Limit”, pp.587–612 in International Journal of Foundations of Computer Science vol.13:4 (2002). [Seli06] V. Selivanov: “Towards a Descriptive Set Theory for Domainlike Structures”, pp.258–282 in Theoretical Computer Science vol.365 (2006). [Weih00] K. Weihrauch: “Computable Analysis”, Springer (2000). 3 Ziele und Arbeitsprogramm Unter Bezug auf die Ziele und das Arbeitsprogramm des Erstantrags wird im Folgenden dessen Nummerierung fortgesetzt. . . 3.1 Ziele Die Verlängerung soll dazu dienen, das Projekt inhaltlich abzurunden und einige im Erstantrag genannte Fragestellungen, die sich als besonders ergiebig erwiesen haben, vertieft zu behandeln. 3.1.8 Ziel: Übertragung klassischer Rekursionstheorie ins BCSS-Modell Die klassische Rekursions- und Berechenbarkeitstheorie ist zu einem wohlausgearbeiteten Gebiet gereift und reichhaltig sowohl an Struktur (z.B. der der TuringGrade) als auch an praxisrelevanten Ergebnissen (z.B. Hilberts 10. Problem, Wortproblem für Gruppen etc). Die BCSS- anstelle der Turingmaschine induziert bekanntlich [BSS89] eine ähnliche Theorie über R, die allerdings bei weitem nicht auch nur annähernd so ausgearbeitet ist. Diesem Ziel möchte ich mich mit Abschnitt 3.2.12 des Arbeitsprogramms nähern. 3.1.9 Ziel: Behebung des Hauptkritikpunkts an der Rekursiven Analysis Das der Rekursiven Analysis (vgl. Abschnitt 2.2.2) zugrundeliegende Modell (die Turingmaschine mit dem semantischen Twist, unendliche Folgen von z.B. rationalen Approximationen an z.B. reelle Zahlen ein- und auszugeben) gilt einerseits als das 8 realistischste reellen Rechnens, wird andererseits oftmals kritisiert [Koep01] wegen der sich daraus ergebenden Implikationen: Eine berechenbare Funktion muß notwendig stetig sein, verlangt der bereits erwähnte ‘Hauptsatz’. Dieser Kritik möchte ich begegnen mit der Untersuchung, ob und in wiefern (schwächste) Hyper computer in der Lage sind, zumindest gewisse unstetige Funktionen effektiv auszuwerten; siehe Abschnitten 3.2.13 und 3.2.14 des Arbeitsprogramms. 3.1.10 Ziel: Schwache Hypercomputer in die Praxis Das Halteproblem H wird wohl auch auf Weiteres nicht praktisch gelöst werden können. Andererseits gibt es Hypercomputer, die zwar mächtiger als die Turingmaschine aber echt schwächer als H sind: vgl. Posts Problem. Gerade über den reellen Zahlen ergeben sich solche Rechenmodelle sehr natürlich (z.B. Abschnitt 2.2.1) und/oder sind, trotz ihrer Schwäche, überraschend nützlich und zudem numerisch relevant. Diese zu realisieren zu wollen, klingt nur auf den ersten Blick vermessen: siehe Abschnitt 3.2.15 des Arbeitsprogramms. 3.1.11 Ziel: Beziehungen zwischen Wissenschaftsgebieten Berechenbarkeits- und Informationstheorie stehen schon lange in fruchtbarem Dialog; Sichtworte wie Kolmogorov-Komplexität, Zufälligkeit oder Martingale sind hier beispielsweise zu nennen. Letztere werden bereits routinemäßig für reelle Zahlen eingesetzt (z.B. von Jack Lutz, Peter Hertling, Rod Downey etc) im Sinne der Rekursiven Analysis. Diese wiederum steht in Beziehung zur Numerik (In/Stabilität ⇔ Un-/Stetigkeit) und zur Topologie (vgl. Abschnitt 2.1.2). Ich möchte weiterhin Verbindungen zur Kolmogorov-Komplexität unendlicher Strings herstellen (Frage 3.3 in Abschnitt 3.2.13 des Arbeitsprogramms). Über R gibt es andererseits das BCSS-Modell. Auch hier soll eine Kolmogorov’sche Komplexitätstheorie entwickelt werden (Abschnitte 3.2.12) in der Hoffnung auf Verwandtschaft zur Information-Based Complexity. Die Erfahrung aus den bisherigen Arbeiten läßt vermuten, daß hier reelle Algebra eine wesentliche Rolle spielen wird. 3.2 Arbeitsprogramm Grob zusammengefaßt möchte ich • den Fokus auf schwache (und daher realistischer e) Hypercomputer legen (Abschnitte 3.2.12 und 3.2.13), • ausgewählte davon prototypisch implementieren (sic!, siehe Abschnitt 3.2.15) und • über bloße (hyper-)Berechenbarkeits- hinaus auch (hyper-)Komplexitätsaussagen gewinnen (Abschnitt 3.2.13). Der letzte Punkt steht offenbar in Zusammenhang mit dem zweiten; und dieser wiederum mit dem ersteren. Dank der Vorarbeiten (Abschnitt 2.2) können sie simultan angegangen werden. 3.2.12 BCSS-Gegenstücke klassischer Berechenbarkeitstheorie Die Frage nach der Terminierung einer gegebenen (Kodierung einer) Turingmaschine ist das klassische, d.h. diskrete Halteproblem H und als solches unentscheidbar durch eine Turingmaschine. Eine BCSS-Maschine hingegen kann dieses Problem 9 lösen; für sie unentscheidbar ist die Terminierung einer gegebenen (Kodierung einer) BCSS-Maschine: das reelle Halteproblem H. In [34] haben wir, thematisch analog doch technisch aufwendig, die Unentscheidbarkeit und Vollständigkeit des klassischen Wortproblems für Gruppen auf die BCSS-Welt übertragen. Andere über R = Z Turing-unentscheidbare Probleme hingegen werden über R = R BCSS-entscheidbar : die Lösbarkeit polynomieller Gleichungssysteme (‘Hilberts Zehntes Problem’) über R[X] beispielsweise mittels Tarskis Quantorenelimination. Dies zeigt, daß solche Übertragungen durchaus nichttrivial sein können. I Entsprechende Untersuchungen möchte ich für weitere klassisch-unentscheidbare Probleme durchführen: a) Radós Busy Beaver und Maximum Shift Funktionen Σ(n) und S(n); b) die Kolmogorov-Komplexitätsfunktion; c) Einfachzusammenhang gewisser Mannigfaltigkeiten. I Weiterhin stellt sich die Frage nach reellen Gegenstücken zu klassischen Resultaten wie d) Rekursionstheorem, Fixpunktsatz und Quines. I I Bei a) und b) spielt die Zahl n der Zustände bzw. die Kodierungslänge einer Turingmaschine die wichtige Rolle eines Parameters. Ihr entspricht, zumal als Maß für (nicht-)Uniformität, im BCSS-Milieu die Zahl der reellen Konstanten. Die BCSSKolmogorov-Komplexität einer endlichen Folge reeller Zahlen wird dann wohl im Wesentlichen durch deren Transzendenzgrad bestimmt, ist also vermutlich BCSSunberechenbar; aber ist sie auch BCSS-vollständig? Dies scheint, zumal im Licht der Diskussion aus Abschnitt 2.2.1, völlig offen und soll ein erstes Ziel meiner Forschung werden. Die Frage c) nach der BCSS-Entscheidbarkeit des Problems, ob eine gegebene semi-lineare Menge einfachzusammenhängend ist, wurde in [BCdN06, Abschnitt 8] aufgeworfen. Der Turing-Unentscheidbarkeitsbeweis für den Fall endlich-präsentierter Mannigfaltigkeiten basiert auf Reduktion vom Wortproblem; im Hinblick auf das BCSS-Modell legt dies nahe, auf der (Vor-)Arbeit [34] aufzubauen zu versuchen. 3.2.13 Nichtuniform-berechenbare Analysis Abschnitt 2.2.3 hat aus eigenen Vorarbeiten Beispiele natürlicher Funktionen (oder Funktionale) f präsentiert, welche nicht-uniform berechenbar sind in dem Sinne, daß f (x) für jedes x eine (gemäß Rekursiver Analysis und relativ zu x) berechenbare Zahl ist. Genauer scheiterte dort die uniforme Berechenbarkeit alleine aus Unstetigkeitsgründen: Den Resultaten (nicht jedoch deren i.d.R. grundverschiedenen Beweisen!) lag nämlich folgendes gemeinsame Schema zugrunde: Die Abbildung x 7→ f (x) wird berechenbar, sobald zusätzlich der ‘kanonischen’ kontinuierlichen Kodierung von x als Eingabe eine gewisse diskrete Zusatzinformation über x beigefügt wird (welche die Maschine aus Stetigkeitsgründen nämlich nicht selbst bestimmen kann). Ein solchermaßen abgeschwächter Berechenbarkeitsbegriff i) basiert also auf der Rekursiven Analysis als anerkannt realistischstes reelles Rechenmodell, ii) nimmt dabei der vorherrschenden Kritik [Koep01] am ‘Hauptsatz ’ den Wind aus den Segeln, 10 iii) macht numerisch Sinn, wie im zweiten Absatz von von Abschnitt 2.2.3 erläutert, iv) und ist praktisch realisierbar (da zu der ohnehin unendlichen Information über x nur ein paar wenige zusätzliche Bits hinzuzufügen sind). Frage 3.1 Wie viele Zusatzbits (gemäß iv) sind hinreichend und notwendig, um ein nichtuniform berechenbares Problem zu lösen? I Diese möchte ich (asymptotisch) für die in Abschnitt 2.2.3 vorgestellten sowie für einige weitere aus der Literatur bekannte Probleme angehen: a) Spektralzerlegung symmetrischer n × n–Matrizen [18, Abschnitt 3.5] (Vermutung: Θ(log n) Bits); b) Konvertierung von rationalen Approximationen mit Fehlerschranken (sog. CauchyDarstellung reeller Zahlen) in Binärdarstellung [Weih00, Theorem 4.1.13.2]; c) den effektiven Zwischenwertsatz [Weih00, Theorem 6.3.8.1] (“Jede berechenbare Funktion f : [0, 1] → R mit f (0) < 0 < f (1) besitzt eine berechenbare Nullstelle.”) d) Finden eines berechenbaren Punktes in nichtleeren konvexen co-r.e. abgeschlossenen Mengen [32, Abschnitt 5]. Weitere solche Probleme ergeben sich naturgemäß im Verlauf der Forschung automatisch. Methoden und Lösungsansätze: Die geplante Fragestellung steht in Beziehung zu zahlreichen wohlbekannten Begriffen der Literatur auf. Man kann sie beispielsweise Auffassen als Frage 3.2 In wie viele (nicht notwendig berechenbare) Bereiche X1 , . . . , XN muß man dom(f ) zerlegen, damit die Einschränkungen f |Xi (i = 1, . . . , N ) jeweils berechenbar werden. In der Tat besteht die diskrete Zusatzinformation dann in der Angabe, zusätzlich zum Argument x für f , zu welchem Xi das x gehört. Frage 3.2 scheint Punkt a) in Abschnitt 2.1.2 zu ähneln. Andererseits unterscheidet sich das hier angepeilte Maß quantitativ wesentlich von den in Abschnitt 2.1.2 vorgestellten: • Die charakteristische Funktion 1X : Rd → {0, 1} einer beliebigen Menge X ⊆ Rd ist mit nur einem Bit an Zusatzinformation berechenbar. P • Die konstante Funktion f : x 7→ n∈H 2−n ist topologisch beliebig gutartig aber selbst mit beliebig (endlich) vielen Zusatzbits nicht berechenbar. Andererseits kann man das Maß überraschenderweise zumindest asymptotisch äquivalent quantifizieren in Termen der relativen Kolmogorov-Komplexität (vgl. Abschnitt 2.1.1) unendlicher Zeichenketten: Frage 3.3 Für ȳ, x̄ ∈ {0, 1}N bezeichne K(ȳ|x̄) die minimale Beschreibungslänge einer Turingmaschine, welche ȳ ausgibt bei Eingabe von x̄; “∞” wenn keine solche existiert. Fixiere F :⊆ {0, 1}N → {0, 1}N ; was ist dann supx̄∈dom(F ) K F (x̄)|x̄ ? I Hierbei ist F natürlich eine Realisierung der Funktion f aus Frage 3.1 oder 3.2. Diese drei verschiedenen Sichtweisen (numerisch, topologisch, informationstheoretisch) auf die Fragestellung bringen mit sich eine Vielzahl an Methoden, die ich zur Lösung der oben unter a)-d) genannten Probleme anwenden möchte. 11 3.2.14 I Berechenbare diskret-wertige Funktionen Der o.g. ‘Hauptsatz’ für berechenbare Funktionen über R besitzt bekannte Verallgemeinerungen auf andere Räume [Weih00, Theorem 3.2.11], um beispielsweise auch mengenwertige Funktionen, Funktionale [Weih00, Theorem 6.3.2] oder Operatoren [Weih00, Theorem 6.4.3.2] zu erfassen. Er verbietet damit die Berechenbarkeit von Funktionen mit diskretem Wertebereich wie f : X → N — sofern deren Definitionsbereich X zusammenhängend ist bezüglich der durch die (in der Regel kanonischen) Kodierung der Elemente x ∈ X induzierten Topologie. Gleichwohl letzteres oft der Fall ist, kann man es doch nicht a priori sehen; konkret waren wir sehr überrascht, als sich die Dimension eines homogenen Unterraums von Rn als berechenbar herausstellte [18, Theorem 9iii]. Hier möchte ich weitere solche Beispiele für scheinbare ‘Gegenbeispiele’ zum Hauptsatz finden. Für konkrete Kandidaten halte ich: a) Die Windungszahl eines Weges γ : [0, 1] → R2 b) oder allgemeiner den Brouwer Grad d(f, Ω, p) einer Funktion f : Ω → Rn c) bzw. die Anzahl (inkl. Multiplizität) der Pole einer analytischen Funktion; d) die Dimension einer (irreduziblen) semi-algebraischen Varietät, e) eventuell auch die Anzahl ihrer Zusammenhangskomponenten. 3.2.15 I Implementierung von Hyper-Algorithmen Der in Abschnitt 3.2.13 beschriebene Ansatz zur Berechnung reeller Funktionen, Funktionale und Operatoren ist, wie dort bereits erwähnt, in hohem Maße realistisch: gleichwohl dem Gebiet Hyper computation zugehörig, sind beschränkt viele Zusatzbits in der Regel (z.B. auf Grund von Hintergrundinformationen über die Eingabe) leicht bereitzustellen; zudem ist das zugrundeliegende Rechenmodell der Rekursiven Analysis ja bereits tatsächlich in Programme gegossen worden (Abschnitt 2.1.4). Im vorliegenden Punkt des Arbeitsprogramms sollen daher die unter Abschnitten 3.2.13 und 3.2.14 entwickelten Algorithmen, ebenso wie die bereits gefundenen (vgl. Abschnitt 2.2.3), implementiert und experimentell evaluiert werden. Gespannt bin ich insbesondere auf das Abschneiden des o.g. Verfahrens zur Diagonalisierung degenerierter Matrizen. Als Grundlage ist die iRRAM angepeilt (vgl. Abschnitt 2.2.4). Sie muß dafür zunächst auf das Rechnen mit Unterräumen (als Spezialfall abgeschlossener reeller Mengen) erweitert werden – in Anlehnung an oder durch Kombination mit Ariadne. 3.3 Sonstige Angaben — entfallen — 4 Beantragte Mittel 4.1 Personalkosten Ich beantrage: • 1 eigene Stelle (BAT IIa/TVL 13), 12 Monate Vollzeit; • 8 Personenmonate SHK (19h/Woche). 12 Der Antragsteller hat am 11.11.2002 promoviert. Als Hilfskraft soll mich Sven Köhler bei Arbeitspunkt 3.2.15 unterstützen. Ergebnisse seiner Bachelorarbeit waren als [25] erschienen; in der gerade abgegebenen Diplomarbeit [35] hat er Erfahrungen mit Bibliotheken für reelles Rechnen gesammelt (vgl Abschnitt 2.2.4). 4.1.1 Erklärung Die Universität Paderborn stellt Herrn Ziegler im Falle der Bewilligung seines Antrags auf die Eigene Stelle befristet für die Dauer seiner Förderung durch die Deutsche Forschungsgemeinschaft (DFG), höchstens aber für drei Jahre, als wissenschaftlichen Mitarbeiter ein. Sie stellt ihm für diesen Zeitraum die notwendige Grundausstattung (z.B. Laborräume, Büroräume etc.) zur Verfügung. Es gelten die an unserer Einrichtung einschlägigen Tarifvorschriften mit der Maßgabe, dass a) sich die Arbeitspflicht von Herrn Ziegler auf sein von der DFG gefördertes Forschungsvorhaben Zi 1009/1-1 und damit unmittelbar zusammenhängende wissenschaftliche Dienstleistungen beschränkt und b) der Arbeitgeber nicht durch dienstliche Anordnungen Einfluss auf die selbständige Bearbeitung des genannten Forschungsvorhabens nimmt. (Datum und Unterschrift) 4.2 Wissenschaftliche Geräte — entfallen — 4.3 Verbrauchsmaterial — entfällt — 4.4 Reisen Im Hinblick auf das beantragte Projekt sind u.a. folgende regelmäßige Konferenzen thematisch relevant: • Computability in Europe (CiE) • Computability and Complexity in Analysis (CCA) • Foundations of Computational Mathematics (FoCM) • Mathematical Foundations of Computer Science (MFCS) • Domains and Computability over Continuous Data Types • International Colloqium on Algorithms, Logic, and Programming (ICALP) • Logic in Computer Science (LICS) Zur Präsentation von Forschungsergebnissen auf ausgewählten dieser Kongresse rechne ich, die bisherige Konferenzvortragsdichte (vgl. [24, 25, 26, 27, 30, 32, 33, 34], dazu wichtige Workshops wie z.B. Domains VIII oder Dagstuhl Seminar 06021) extrapolierend, mit voraussichtlich zwei inner- (Kosten: je ca. 500 Euro) und einer außer-europäischen Reise (Kosten: ca. 1000 Euro) und beantrage daher an Mitteln: 2000 Euro 13 4.5 Publikationskosten Zur Veröffentlichung (insbesondere der Arbeit [36]) beantrage ich einen Publikationskostenzuschuß in Höhe von 500 Euro. 4.6 Sonstige Kosten — keine — 5 Voraussetzungen für die Durchführung des Vorhabens 5.1 Zusammensetzung der Arbeitsgruppe Martin Ziegler, Dr. rer.nat. Sven Köhler, cand.-inf. 5.2 Zusammenarbeit mit anderen Wissenschaftlern Im Rahmen des Forschungsgebiets des Projekts arbeite ich insbesondere zusammen mit • Prof. Dr. Vasco Brattka (University of Cape Town, Südafrika) • Prof. Dr. Peter Bürgisser (Universität Paderborn) • Dr. Pieter Collins (CWI, Amsterdam) • Prof. PhD Felipe Cucker (Hong Kong City University) • Prof. Dr. Peter Hertling (Universität der Bundeswehr, München) • Prof. Dr. Hajime Ishihara (JAIST, Japan) • Prof. Dr. Ulrich Kohlenbach (Technische Universität Darmstadt) • Prof. Dr. Klaus Meer (Universität Cottbus) • Prof. Dr.-math. Friedhelm Meyer auf der Heide (Universität Paderborn) • PD Dr. Norbert Müller (Universität Trier) • Prof. Dr. Dieter Spreen (Universität Siegen) • Prof. John V. Tucker (University of Wales Swansea, Großbritannien) • Prof. Dr. Klaus Weihrauch (FernUniversität in Hagen) • Prof. Chee K. Yap (Courant Institute, New York) 5.3 Arbeiten im Ausland und Kooperation mit ausländischen Partnern Die Kommunikation mit den im Ausland befindlichen der oben genannten Wissenschaftlern wird vorzugsweise über Email/Fax/Telefon bzw. während Treffen auf den unter Abschnitt 4.4 genannten Konferenzen stattfinden; daher sind hierfür — keine weiteren Mittel erforderlich. — 14 5.4 Apparative Ausstattung Die Lehrstühle für Algebraische Komplexität und Algorithmische Algebra (Bürgisser) und für Algorithmen und Komplexität (Meyer auf der Heide) der Fakultät V (Elektrotechnik, Informatik und Mathematik) der Universität Paderborn haben sich freundlicherweise bereiterklärt, einen Büro- und Computerarbeitsplatz zur Verfügung zu stellen. Daher sind auch hierfür — keine weiteren Mittel erforderlich. — 6 Erklärungen 6.1 Ein Antrag auf Finanzierung dieses Vorhabens wurde bei keiner anderen Stelle eingereicht. Wenn ich einen solchen Antrag stelle, werde ich die Deutsche Forschungsgemeinschaft unverzüglich benachrichtigen. 6.2 Dem Vertrauensmann der DFG an der Universität Paderborn, Prof. Dr.-math. Friedhelm Meyer auf der Heide, ist dieser Antrag bekannt. 6.3 — entfällt — 7 Unterschrift Paderborn, den 16. Oktober 2007 8 • • • • (Dr. Martin Ziegler) Anlagen (elektronisch) Lebenslauf und wissenschaftlicher Werdegang (Short) Survey of Real Hypercomputation [33] Habilitationsschrift [36] (eingereicht am 2.9.2007) Webseite http://www.upb.de/cs/ag-madh/WWW/ziegler/DFG 15