Lehrstuhl für Informationsmanagement Masterarbeitsthema Vergleich der Dokument-basierten NoSQL-Datenbanken Couchbase Server, MongoDB und Elasticsearch Hintergrund: Während eine relationale Datenbank aus Datenbanktabellen besteht, sind in einer Dokument-basierten NoSQL-Datenbank Dokumente die Grundeinheit zur Speicherung der Daten. MongoDB, Couchbase Server und Elasticsearch sind drei der bedeutendsten Dokument-basierten NoSQL-Datenbanken. In vielen Produktivsystemen werden diese NoSQL-Datenbanken anstatt oder ergänzend zu relationalen Datenbanksystemen für die Datenspeicherung genutzt. Zum Beispiel Disney, die New York Times und SourceForge verwenden MongoDB. LinkedIn, PayPal und eBay setzen auf Couchbase Server. Und Facebook, Mozilla, GitHub, Stack Exchange und Netflix nutzen Elasticsearch. Aufgabenstellung: Ziel dieser Arbeit ist der Vergleich der NoSQL-Datenbanken MongoDB, Couchbase Server und Elasticsearch untereinander und mit einer relationalen Datenbank (z.B. PostgreSQL oder der Oracle Datenbank) in Hinblick auf sowohl Funktionalität als auch unterschiedliche Last. Als Forschungsobjekt und durchgehender Beispiel-Use-Case soll ein vereinfachtes Datenmodell einer BPM/CRM-Software dienen (mit Kunden, Tickets und Vorgängen). Das Datenmodell der BPM/CRM-Software soll für die verschiedenen Datenbanken modelliert und die Anfragen darauf sollen transformiert werden. Das Ziel ist die Entwicklung eines Kriterien-Katalogs unter welchen Umständen für BPM/CRM-Software welche Dokumenten-basierte NoSQL-Datenbank am geeignetsten ist. Es soll untersucht werden, wann für BPM/CRM-Software von dem Einsatz einer Dokument-basierten NoSQL-Datenbank abgeraten werden muss und die Verwendung einer klassischen relationalen Datenbank sinnvoller ist. Folgende Funktionalitäten sollen mindestens verglichen werden: Datenmodell Einfügen, Ändern und Löschen von Daten Anfragen o Selektion o Join o Gruppierung und Aggregation o Sortierung Lehrstuhl für Informationsmanagement Atomares Schreiben, (verteilte) Transaktionen, Rollbacks Konsistenz Verfügbarkeit Skalierbarkeit, Replikation Persistenz, Wiederherstellen nach Absturz (eines Knotens) Backups Berechtigungskonzept Folgende Last-Tests sollen mindestens durchgeführt werden: Einfügen, Ändern und Löschen von Daten Selektionen Joins Voraussetzungen: Gute Kenntnisse in der Vorlesung „Datenbanken und Informationssysteme“ Seite 2 von 3 Lehrstuhl für Informationsmanagement Organisation & Prozedere Thema: Interessantes, aktuelles Thema, welches zwischen Lehrstuhl für Informationsmanagement und ConSol bereits abgesprochen ist Betreuung: Sowohl einen Betreuer am Lehrstuhl für Informationsmanagement als auch einen Betreuer bei ConSol: Regelmäßiges Betreuungsgespräch mit Betreuer am Lehrstuhl Betreuung bei ConSol durch Dr. Fabian Stäber, Head of Research & Development Dr. Christoph Ehlers, Alumnus des Lehrstuhl für Informationsmanagement Zwei Varianten: Betreuungsgespräch alle ein bis zwei Wochen bei ConSol in München (weitere Absprachen via E-Mail, Telefon oder Skype) Abschlussarbeit als Praktikum vor Ort bei ConSol in München Ablauf: 1. Bewerbung 2. Einarbeitung in das Thema der Abschlussarbeit 3. Antrittsvortrag im Oberseminar des Lehrstuhls in Passau 4. Zwischenvortrag im Oberseminar des Lehrstuhls in Passau 5. Abgabe der schriftlichen Ausarbeitung 6. Abschlussvortrag im Oberseminar des Lehrstuhls in Passau 7. Abschlussvortrag in der ConSol-Akademie in München Fragen? Fragen zum Thema oder zum Ablauf der Arbeit gern via E-Mail an: [email protected] Interesse? Sende Deine aussagekräftige Bewerbung (mit aktuellem HISQIS-Notenauszug) für diese Abschlussarbeit am Lehrstuhl für Informationsmanagement und bei ConSol bitte an: [email protected] Seite 3 von 3