Vergleich der Dokument-basierten NoSQL-Daten

Werbung
Lehrstuhl für Informationsmanagement
Masterarbeitsthema
Vergleich der Dokument-basierten NoSQL-Datenbanken Couchbase Server, MongoDB und Elasticsearch
Hintergrund:
Während eine relationale Datenbank aus Datenbanktabellen besteht, sind in einer Dokument-basierten NoSQL-Datenbank Dokumente die Grundeinheit zur Speicherung der
Daten. MongoDB, Couchbase Server und Elasticsearch sind drei der bedeutendsten Dokument-basierten NoSQL-Datenbanken. In vielen Produktivsystemen werden diese
NoSQL-Datenbanken anstatt oder ergänzend zu relationalen Datenbanksystemen für die
Datenspeicherung genutzt. Zum Beispiel Disney, die New York Times und SourceForge
verwenden MongoDB. LinkedIn, PayPal und eBay setzen auf Couchbase Server. Und
Facebook, Mozilla, GitHub, Stack Exchange und Netflix nutzen Elasticsearch.
Aufgabenstellung:
Ziel dieser Arbeit ist der Vergleich der NoSQL-Datenbanken MongoDB, Couchbase Server und Elasticsearch untereinander und mit einer relationalen Datenbank (z.B. PostgreSQL oder der Oracle Datenbank) in Hinblick auf sowohl Funktionalität als auch unterschiedliche Last. Als Forschungsobjekt und durchgehender Beispiel-Use-Case soll ein
vereinfachtes Datenmodell einer BPM/CRM-Software dienen (mit Kunden, Tickets und
Vorgängen). Das Datenmodell der BPM/CRM-Software soll für die verschiedenen Datenbanken modelliert und die Anfragen darauf sollen transformiert werden.
Das Ziel ist die Entwicklung eines Kriterien-Katalogs unter welchen Umständen für
BPM/CRM-Software welche Dokumenten-basierte NoSQL-Datenbank am geeignetsten
ist. Es soll untersucht werden, wann für BPM/CRM-Software von dem Einsatz einer Dokument-basierten NoSQL-Datenbank abgeraten werden muss und die Verwendung einer klassischen relationalen Datenbank sinnvoller ist.
Folgende Funktionalitäten sollen mindestens verglichen werden:
 Datenmodell
 Einfügen, Ändern und Löschen von Daten
 Anfragen
o Selektion
o Join
o Gruppierung und Aggregation
o Sortierung
Lehrstuhl für Informationsmanagement







Atomares Schreiben, (verteilte) Transaktionen, Rollbacks
Konsistenz
Verfügbarkeit
Skalierbarkeit, Replikation
Persistenz, Wiederherstellen nach Absturz (eines Knotens)
Backups
Berechtigungskonzept
Folgende Last-Tests sollen mindestens durchgeführt werden:
 Einfügen, Ändern und Löschen von Daten
 Selektionen
 Joins
Voraussetzungen:
 Gute Kenntnisse in der Vorlesung „Datenbanken und Informationssysteme“
Seite 2 von 3
Lehrstuhl für Informationsmanagement
Organisation & Prozedere
Thema:
Interessantes, aktuelles Thema, welches zwischen Lehrstuhl für Informationsmanagement und ConSol bereits abgesprochen ist
Betreuung:
Sowohl einen Betreuer am Lehrstuhl für Informationsmanagement als auch einen Betreuer bei ConSol:
 Regelmäßiges Betreuungsgespräch mit Betreuer am Lehrstuhl
 Betreuung bei ConSol durch
Dr. Fabian Stäber,
Head of Research
& Development
Dr. Christoph Ehlers,
Alumnus des Lehrstuhl für
Informationsmanagement
Zwei Varianten:
 Betreuungsgespräch alle ein bis zwei Wochen bei ConSol in München
(weitere Absprachen via E-Mail, Telefon oder Skype)
 Abschlussarbeit als Praktikum vor Ort bei ConSol in München
Ablauf:
1. Bewerbung
2. Einarbeitung in das Thema der Abschlussarbeit
3. Antrittsvortrag im Oberseminar des Lehrstuhls in Passau
4. Zwischenvortrag im Oberseminar des Lehrstuhls in Passau
5. Abgabe der schriftlichen Ausarbeitung
6. Abschlussvortrag im Oberseminar des Lehrstuhls in Passau
7. Abschlussvortrag in der ConSol-Akademie in München
Fragen?
Fragen zum Thema oder zum Ablauf der Arbeit gern via E-Mail an:
[email protected]
Interesse?
Sende Deine aussagekräftige Bewerbung (mit aktuellem HISQIS-Notenauszug) für diese
Abschlussarbeit am Lehrstuhl für Informationsmanagement und bei ConSol bitte an:
[email protected]
Seite 3 von 3
Herunterladen