Next Generation Storage

Werbung
Case Study – Next Generation Storage
Case Study
Next Generation Storage
Public Version
Status: Entwurf, Geprüft, Definitiv
Autoren
Name
Studiengang
Klasse
Kurs
Stefan Escher
Wirtschaftsinformatik
WINF6
Case Studies
Martin Manser
Wirtschaftsinformatik
WINF6
Case Studies
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 1 von 33
Case Study – Next Generation Storage
Allgemeines
Inhaltsverzeichnis
Über dieses Dokument ........................................................................................................................ 4
Dokumenten-History .............................................................................................................................................. 4
Einleitung ............................................................................................................................................. 5
Storage Einführung ................................................................................................................................................ 5
Storage Trends ...................................................................................................................................................... 5
Wachstum........................................................................................................................................................... 5
Technologie ........................................................................................................................................................ 5
Speichermanagement ........................................................................................................................................ 5
Kosten ................................................................................................................................................................ 5
Sicherheit............................................................................................................................................................ 6
Storage Problematik............................................................................................................................................... 6
Möglicher Lösungsansatz ...................................................................................................................................... 7
Archivierungslösung ........................................................................................................................................... 7
Storage Domain Director .................................................................................................................................... 8
Themenumfang .................................................................................................................................... 9
Ausgangslage ........................................................................................................................................................ 9
Heutige Situation.................................................................................................................................................... 9
Fallstudienziel / Auftrag.......................................................................................................................................... 9
Organisation....................................................................................................................................... 10
Projektorganisation .............................................................................................................................................. 10
Know How Network.............................................................................................................................................. 11
Zeitplan............................................................................................................................................... 12
Vorgesehener Zeitplan......................................................................................................................................... 12
Effektiver Zeitplan ................................................................................................................................................ 12
Produkt Analyse................................................................................................................................. 13
KVS Enterprise Vault ........................................................................................................................................... 13
Mail Archiving ................................................................................................................................................... 13
File Archiving .................................................................................................................................................... 14
Journaling ......................................................................................................................................................... 14
IST Analyse ........................................................................................................................................ 15
Konzept / Infrastruktur.......................................................................................................................................... 15
NAS – Network Attached Storage .................................................................................................................... 15
Datensicherung ................................................................................................................................................ 17
Übersicht .......................................................................................................................................................... 17
Kosten .................................................................................................................................................................. 19
Überlegungen zur Kostenberechnung.............................................................................................................. 19
Datenerhebung .................................................................................................................................................... 19
Siemens Schweiz AG ....................................................................................................................................... 20
Siemens Building Technologies ....................................................................................................................... 20
Speicherwachstum............................................................................................................................................... 20
Datenspeichergrössen ......................................................................................................................................... 20
Netto Datenvolumen......................................................................................................................................... 21
Netto Speicherplatz auf Filern .......................................................................................................................... 21
Brutto Speicherplatz auf Filern ......................................................................................................................... 21
Backupdatenwachstumsfaktor ............................................................................................................................. 21
Reinvest ............................................................................................................................................................... 21
SOLL Analyse .................................................................................................................................... 22
Konzept / Infrastruktur.......................................................................................................................................... 22
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 2 von 33
Case Study – Next Generation Storage
Übersicht .......................................................................................................................................................... 22
Kosten .................................................................................................................................................................. 24
Datenverdrängung durch Archivierung ................................................................................................................ 25
Business Plan .................................................................................................................................... 26
Kosten Dienstleistersicht...................................................................................................................................... 26
Kosten Kundensicht ............................................................................................................................................. 27
Fazit .................................................................................................................................................... 28
Literaturverzeichnis / Hilfsmittel....................................................................................................... 29
Bücher / Dokumente / Unterlagen........................................................................................................................ 29
Internet ................................................................................................................................................................. 29
Software ............................................................................................................................................................... 29
Grafiken................................................................................................................................................................ 29
Schlusswort ....................................................................................................................................... 30
Zur Case Study .................................................................................................................................................... 30
Bestandteile ......................................................................................................................................................... 30
Online Adresse..................................................................................................................................................... 30
Elektronische Form .............................................................................................................................................. 31
Glossar ............................................................................................................................................... 32
NAS ...................................................................................................................................................................... 32
SAN ...................................................................................................................................................................... 32
FAS ...................................................................................................................................................................... 32
NDMP................................................................................................................................................................... 32
CIFS ..................................................................................................................................................................... 33
HSM ..................................................................................................................................................................... 33
PST ...................................................................................................................................................................... 33
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 3 von 33
Case Study – Next Generation Storage
Über dieses Dokument
Dokumenten-History
Version
Datum
Autor
Änderung zu früheren Versionen
0.1
10.12.04
Stefan Escher
Ersterstellung
0.2
18.12.04
Martin Manser
Einleitung, Zeitplan (Plan)
0.3
21.12.04
Stefan Escher
Ausgangslage, Organisation
0.4
25.01.05
Martin Manser
Ist Analyse
0.5
25.02.05
Stefan Escher
Soll Analyse
0.6
26.02.05
Stefan Escher
Solution Design
0.7
18.03.05
Martin Manser
Businessplan
0.8
30.03.05
Stefan Escher
Berechnungsmodell, Fazit
0.9
30.03.05
Martin Manser
Korrekturen
1.0
31.03.05
Stefan Escher
Korrekturen und Druck
1.0_pub
18.05.05
Stefan Escher
Publizierung, (Freigabe durch M. Kempf)
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 4 von 33
Case Study – Next Generation Storage
Einleitung
Storage Einführung
Die Zeiten wo Firmen auf dutzenden Windows NT Servern ihre Daten abspeichern, gehören der
Vergangenheit an. Heute werden zentrale Speicherlösungen aufgebaut, sei es für einfache File-Sharing
Funktionen, Datenbanken von Exchange-, Oracle- oder SQL-Services. Dadurch werden grössere
Datenmengen einfacher verwaltet (Reduktion der Hardware, Reduktion der Anzahl Betriebssysteme,
Reduktion des Verwaltungsaufwands).
Dies bringt folgende Vorteile:
•
Tiefere Total Cost of Ownership
•
Höhere Verfügbarkeit (Redundanz,…)
•
Heterogene Verbindungen der Systeme (Windows, Linux, Solaris, etc.)
•
Skalierbare Architektur
Storage Trends
Wachstum
Nach dem explosionsartigen Anstieg nach mehr Speicherbedarf während den Boomjahren 1998 bis
2000, wo Wachstumsraten von bis zu 120% pro Jahr erreicht wurden, hat sich der Anstieg wieder auf
50% bis 70% pro Jahr beruhigt.
Technologie
Kapazität und Performance der optischen Speichermedien nehmen zu. Allerdings ist diese Entwicklung
wesentlich langsamer als die Fortschritte im Bereich der magnetischen Speicherkomponenten.
Die Kapazität von Disk Storage nimmt pro Jahr um 60% zu. Die Kosten sinken gleichzeitig um rund
30%. Im Vergleich zu Tape Storage haben sich die Kosten pro MB Speicher im Disk Bereich wesentlich
schneller reduziert. Es wäre sogar möglich, dass die Preise für Disk Storage unter die Preise für Tape
Storage fallen werden.
Speichermanagement
Speichermanagement beschränkt sich nicht mehr auf die Beschaffung von genügend Kapazität, heute
müssen komplexe SAN und NAS Strukturen verwaltet werden. Die Entwicklung der Storage
Management Tools kann mit diesen rasanten Entwicklungen nicht mithalten. Es wird geschätzt, dass
etwa 75% der Daten in Netzwerkumgebungen nicht effektiv verwaltet werden. Das heisst es wird kein
Backup erstellt oder die Daten wären nicht leicht wiederherstellbar.
Kosten
Die Kosten von Speicher beschränken sich nicht nur auf den Einkaufspreis, er muss auch verwaltet
werden. Die TCO (total cost of ownership) übersteigen den Einkaufspreis der Hardware um das zweibis zehnfache. Obwohl die Kosten für Speicher Hardware jährlich um 30-40% kleiner werden, steigen
deren TCO stark an. Dies aufgrund des steigenden Aufwandes des Speichermanagements,
Backup/Recovery und steigenden Kosten für Sicherheit.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 5 von 33
Case Study – Next Generation Storage
Sicherheit
Neben dem Schutz vor menschlichen Fehlern, Software- oder Hardwarefehlern, müssen Daten
zunehmend vor zusätzlichen Gefahren geschützt werden. Im Septemer 2000 kam ein Virus auf 2000
versandte Mails. Im Mai 2001 wurde bereits in einem von 400 Mails ein Virus entdeckt. Um Attacken mit
möglichst geringem Schaden zu überstehen, müssen die Daten vor dem Verlust repliziert werden.
Der Wert von Daten steigt in sämtlichen Bereichen stark an, zudem steigen die Kosten und der Aufwand
für deren Sicherheit. Trotzdem muss versucht werden, dem Phänomen des „frequent data loss“
entgegenzutreten, da diese Datenverluste erhebliche Kosten verursachen können. Ebenfalls kann der
Betrieb erheblich beeinträchtigt werden, wenn zum Beispiel wichtige Dokumente, Arbeitspläne, etc.
verloren gehen. Digitale Informationen wie Emails und Verträge werden auch als Beweismittel bei
Rechtsstreitigkeiten immer wichtiger.
Informationen sind für jedes Unternehmen überlebenswichtig, dadurch wird auch die Nachfrage nach
effizientem, sicherem Speicher Management weiter zunehmen.
Den Zusammenhang all dieser Aspekte wiedergibt sehr schön die folgende Grafik:
[1] The INfusion Paradox
Storage Problematik
Durch anhaltendes Wachstum und das Bedürfnis nach immer grösserer Verfügbarkeit wird das
Management der Daten und des Speichers selbst zu einer der Hauptherausforderungen der IT. Die
immer grösser werdenden Datenmengen führen unter Anderem dazu, dass Backupfenster zu klein
werden oder Restores zu lange dauern.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 6 von 33
Case Study – Next Generation Storage
Speicher zu managen heisst heute viel mehr als nur für ausreichend Kapazität zu sorgen. Verschiedene
Tape- und Disk-Technologien, SAN’s, NAS’, Backup, hochverfügbarer Speicher sorgen für sehr grossen
Kosten- und Verwaltungsaufwand. Die TCO (total cost of ownership) liegen bei Storage rund 2-10 Mal
über dem Anschaffungspreis.
In den USA wurden bereits sehr strikte Gesetzesartikel eingeführt (Sarbanes-Oxley-Act), welche
Unternehmen dazu zwingen sämtlichen Email Verkehr zu archivieren. Auch in der EU werden solche
Gesetze diskutiert und folglich wird sich auch die Schweiz solche Überlegungen machen müssen. Wie
können solche riesigen Datenmengen verwaltet werden?
Möglicher Lösungsansatz
Archivierungslösung
Zur Erfüllung dieser Vorgaben wurden Archivsysteme, bestehend aus Datenbanken, Archivsoftware und
Storage-Systemen geschaffen. Diese Lösungen basieren meistens auf dem Ansatz über eine
Datenbank mit den Verwaltungs- und Indexkriterien auf einen externen Speicher zu verweisen, wo die
Daten gespeichert werden. Diese so genannte Referenz-Datenbank-Architektur ist notwendig, um große
Mengen von Informationen von den zwar schnellen aber teueren Online-Speichern in separate,
günstigere Archivspeicher auszulagern.
Die Datenbank, über welche die Applikationen auf das Speichernetzwerk zugreift, erlaubt über den Index
jederzeit Dokumente wieder zu finden und mit einem entsprechenden Anzeigeprogramm (z.B. mit XMLFormat) dem Anwender bereitzustellen.
Erste Schritte wurden mit NAS unternommen, indem man separate Speicherkomponenten im Netzwerk
platzierte, auf denen Daten abgespeichert werden können. Mit zunehmender Nachfrage nach Speicher
wurden später separate Speichernetzwerke, SAN eingeführt. SAN erlaubt jederzeit und ohne
Unterbrechung Full Backups, Snapshots oder Incremental Backups. Die höheren Ausgaben für das SAN
werden durch Verbesserungen im Betrieb schnell kompensiert.
Moderne Archivsysteme gliedern sich nahtlos in die IT-Infrastruktur ein. Anwendungen erhalten
automatisch alle Daten die die Applikationen zur Verarbeitung oder Anzeige benötigen. Für den
Anwender ist es unerheblich, wo seine Information wie gespeichert werden. Die Archivspeichersysteme
und die Speicherorte seiner Dokumente sind für ihn intransparent. Dadurch können Speichernetzwerke
auch heterogene Speicherkomponenten benutzen, allerdings steigt dadurch der Aufwand für deren
Verwaltung erheblich an.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 7 von 33
Case Study – Next Generation Storage
[2] Langzeitarchivierung
Ein relativ neuer Ansatz in der Verwaltung von archivierten Daten ist das ILM (Information Lifecycle
Management). Hier geht es darum, Daten auf dem geeigneten Speichermedium zur Verfügung zu
stellen. Daten, die schnell Verfügbar sein müssen, oft benutzt werden sind auf teurem Online Storage
gespeichert, selten verwendete Daten, alte werden auf günstigeren Nearline Storage oder auf Band
abgelegt. Dadurch können erhebliche Kosteneinsparungen erzielt werden, die TCO von Daten werden
reduziert.
Elektronische Archivierungssysteme sind verantwortlich für die Sicherstellung der Verfügbarkeit der
gespeicherten Informationen über einen längeren Zeitraum, der in Policies geregelt werden muss. Wie
bereits erwähnt wird die Relevanz von Geschäftsdaten in den nächsten Jahren stark zunehmen, in
einigen Bereichen, z.B. Rechtsabteilungen, werden sie zu den kritischen Faktoren gehören.
Archivierungssysteme sind auch dafür zuständig, dass nur berechtigte Personen zugriff auf Daten haben
und inkonsistent gewordene oder gestörte Systeme verlustfrei wieder aufgebaut werden können. Dazu
müssen Archivierungssysteme eine effiziente Wiederherstellung (Recovery) zur Verfügung stellen.
Storage Domain Director
In Speichernetzwerken können viele heterogene Komponenten integriert werden. Die optimale
Speichernetzwerk-Architektur verbindet einzelne Speichernetzwerke mit angebundenen Clients, welche
verschiedene Server benutzen können. In der Mitte dieses Netzwerkes befindet sich der so genannte
Storage Domain Director. Dieser kontrolliert den SAN Datenverkehr, ist die zentrale Management
Komponente und steuert die Disk- und Bandlaufwerke. Die gesamten Daten sind in einem Netzwerk
vereint und, je nach Zugriffsrechten, auch Verfügbar.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 8 von 33
Case Study – Next Generation Storage
Themenumfang
Ausgangslage
Siemens Business Services betreibt für Siemens Schweiz AG und weitere Kunden bereits ein Volumen
von 7TB (Tera Byte) Daten. In Anlehnung an die Möglichkeiten von Daten-Archvierung (siehe Einleitung)
sollen Möglichkeiten geprüft und deren Rentabilität berechnet werden.
Heutige Situation
Im Netzwerk der Siemens Business Services gibt es ein SAN, in welchem die Speicheraufgaben weg
von den Servern, hin zu externen Speichermedien gebracht werden. Die Clients greifen über LAN auf
Applikationsserver zu. Werden nun Daten benötigt, werden diese über IP-SAN von zwei Filern geliefert.
Separat gibt es Backup Server, welche jede Nacht Backups erstellen. Diese werden über FC-SAN auf
Bändern im Roboter abgelegt.
Die beiden Data Center Sites sind redundant, Daten von der ersten Location werden in der zweiten,
Daten der zweiten Location werden in der ersten über ISL (Inter Switch Link) gesichert. Dies erlaubt
problemlose Wiederherstellung von Daten in Notfällen oder Katastrophenszenarios (z.B.
Gebäudebrand).
Fallstudienziel / Auftrag
Im Rahmen dieser Case Study soll ermittelt werden, wie mit dem Einsatz von hierarchischen
Speicherlösungen (HSM) und/oder Archivierungslösungen die bestehenden Daten auf billigere Medien
verdrängt werden können. Dabei ist schwerpunktmässig der Datensicherungsaspekt zu berücksichtigen,
da mit der Einführung einer Datenarchivierung auch die Datensicherungsstrategie massgeblich
beeinträchtigt wird.
Bei der Evaluation der HSM/Archivierungslösung soll sowohl auf die Archivierung von Dateien und
Verzeichnissen, als auch auf die Archivierung von E-Mails über das vorhandene Microsoft Exchange /
Outlook-System berücksichtigt werden.
Für den Einsatz einer durchgängigen E-Mail-Archivierung empfiehlt Network Appliance die
Software der Firma KVS. Da diese Software weltweit eines der am meist verbreiteten Produkte für die
Archivierung von E-Mails ist, soll der Einsatz dieser Software in Verbindung mit den Produkten des
bisherigen HW-Lieferanten der Storage Systeme untersucht werden
Die Case Study soll den Zeitrahmen der nächsten drei Jahre berücksichtigen.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 9 von 33
Case Study – Next Generation Storage
Organisation
Projektorganisation
Um der Wichtigkeit des Speicherwachstums Rechnung zu tragen, wurde ein Projekt definiert und
gestartet, welches die konkrete Implementierung einer Archivierungsumgebung prüfen soll. Es geht in
erster Linie darum, Informationen über die Thematik aufzuarbeiten, konkrete Offerten einzuholen,
Workshops mit den Beteiligten durchzuführen (Storage, Backup, Mail) und ein erforderliches Budget für
das Jahr 2006 (voraussichtlicher Realisierungszeitraum) dem Informatik Leitungskreis abzugeben.
Pj Auftraggeber
Pj Leitung SLIM
Pj Ausschuss
xxx
xxx
xxx
Case Study – NGS
Leader Stefan Escher
Stefan
Escher
Storage
Backup
Mail
xxx
xxx
xxx
Martin
Manser
Die Case Study ist also Teil eines sehr grossen Projekts, in welches weit mehr als nur die hier
ersichtlichen Personen einbezogen sind. Weiter sind zum Beispiel die ganzen CIO Organisationen der
Kunden involviert.
Die Case Study hat ihren konkreten Auftrag einen möglichen Lösungsansatz mit Lösungsdesign und
Rentabilitätsrechnung zu erarbeiten. Es können vor allem auf Informationen von hier aufgeführten
Personen und auch im folgenden Know How Network zugegriffen werden.
Konkreter Auftraggeber für die Case Study ist Michael Kempf, Leader von SBS ORS SDD (Siemens
Business Services, Operation Related Services, Service Delivery Data Center).
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 10 von 33
Case Study – Next Generation Storage
Know How Network
xxx
xxx
Fa. xxx
Stefan
Escher
Fa. xxx
Martin
Manser
Fa. xxx
xxx
xxx
xxx
Informationsfluss Projekt
Informationsfluss Case Study
Externe Zusammenarbeit
Interne Zusammenarbeit
Backup
Storage
Archiving
Mail
Wirtschaftsinformatik (Werkstudenten)
Die hier aufgeführten Personen haben direkten Kontakt zum Projekt oder zur Case Study. Es sind auch
Firmen, welche in diese Thematik involviert sind ersichtlich.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 11 von 33
Case Study – Next Generation Storage
Zeitplan
Vorgesehener Zeitplan
Tasks
Dez 04
Jan 05
Feb 05
Mrz 05
Apr 05
Dez 04
Jan 05
Feb 05
Mrz 05
Apr 05
Projektstart
Informationsbeschaffung über Storage / Archivierung
Analyse der bisherigen Infrastruktur
Datenerhebung und Analyse
Meeting (eVault Produktpräsentation, allg. Infos)
Beschaffung von Zahlenmaterial (Kosten, Investitionen)
Berechnung der IST-Kosten
Konzeption der Archivierungslösung
Meeting (eVault Workshop)
Berechnung der SOLL-Kosten
Businessplan
Dokumentation
Projektabschluss, Abgabe
Präsentation
Effektiver Zeitplan
Tasks
Projektstart
Informationsbeschaffung über Storage / Archivierung
Analyse der bisherigen Infrastruktur
Datenerhebung und Analyse
Meeting (eVault Produktpräsentation, allg. Infos)
Beschaffung von Zahlenmaterial (Kosten, Investitionen)
Berechnung der IST-Kosten
Konzeption der Archivierungslösung
Meeting (eVault Workshop)
Berechnung der SOLL-Kosten
Businessplan
Dokumentation
Projektabschluss, Abgabe
Präsentation
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 12 von 33
Case Study – Next Generation Storage
Produkt Analyse
KVS Enterprise Vault
Enterprise Vault ist ein Produkt der Firma KVS, ein global tätiges Unternehmen mit Sitz in England. KVS
hat sich auf Archivierungslösungen spezialisiert, ist Leader für Email active archiving products.
Mail Archiving
Der Bedarf an Exchange Speicherbedarf steigt jährlich um rund 40%. Durch die beschränkte
Speicherkapazität müssen immer mehr Informationen gelöscht werden, oder es werden PST Files
angelegt. Diese PST Files belasten allerdings die File Server und durch Vielfachkopien wird sehr viel
Backup Speicher verschwendet. Um Mails wieder zu finden wird täglich viel Zeit aufgewendet. In
einigen Geschäftsbereichen besteht die Gefahr, dass sensible Daten gelöscht werden, die z.B. bei
Rechtsstreitigkeiten relevant werden könnten.
Emails sowie Attachements kommen beinahe immer doppelt vor (z.B. Inbox und Sent Items). Dadurch
werden sie auch in PST Files mehrfach abgelegt. Mit der Migration der PST Files speichert Enterprise
Vault diese Mails und Attachements nur einmalig ab, dadurch wird die Single Instance hergestellt, was
eine starke Reduzierung des Speicherbedarfs bedeutet.
Exchange Server
Exchange Store
User
Vault Server
Vault Store
PST
Files
File Server
PST Files
[3] eVault Mail Archiving
Enterprise Vault für Exchange ermöglicht unlimitierte Postfächer. Dadurch müssen keine sensiblen
Informationen mehr gelöscht werden und PST Files werden überflüssig. Eine Alta-Vista Suchmaschine
bietet zudem eine effiziente Suche, welche Bodytext und Attachements durchsucht. Dies ermöglicht
enorme Zeiteinsparungen bei der Suche nach Informationen.
Für den User gibt es keine grossen Veränderungen, dass Look&Feel von Microsoft Outlook wird
beibehalten. Lediglich der Placeholder bei den Mails sowie einige Funktionsbuttons (z.B. direkt
archivieren) sind neu.
Es ergeben sich also Vorteile:
•
Mühsame PST Files fallen weg
•
Das Speicherwachstum wird auf das billigere Archiv ausgelagert
•
Single Instance wird hergestellt (doppelte Mails & Anhänge werden nur ein mal gespeichert)
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 13 von 33
Case Study – Next Generation Storage
•
Reduziert den Speicherbedarf bis zu 70% gegenüber PSTs und bis zu 90% gegenüber dem
bisherigen Backupvolumen
•
Volltextsuche für Mails und/oder Anhänge und deren Inhalte
File Archiving
Auch auf File Servern wächst der Speicherbedarf ständig. User bewahren alles auf, es gibt keine klare
Zuständigkeit/Verantwortung für Löschen auf Gruppen-, Abteilungs-, Projektlaufwerken. Wieder finden
von benötigten Informationen wird zeitintensiv. Zudem entstehen hohe Backupkosten, Wiederherstellung
wird aufwändig. Vollaufende Plattensysteme werden zum Risiko für Verfügbarkeit.
Enterprise Vault führt eine automatische Daten-Archivierung durch. Dabei sind verschiedene
Dateiattribute als Kriterium für Archievierung wählbar, wie zum Beispiel: Alter, Größe,
Änderungszeitpunkt der Daten. Auch Dateisystem-Quota sind als Archivierungskriterium möglich. Die
Aufbewahrungsfristen sind definierbar, so wird gezieltes Records Management möglich. Die File
Archivierung besitzt ebenfalls eine integrierte AltaVista Suchfunktion. Files werden Volltext indiziert und
Stichwortsuche ermöglicht Finden von Files in Sekundenschnelle. Die heute gängigsten Dateiformate
können auch nach 10 Jahren mittels XML-Format eingesehen werden, ungeachtet dessen, ob die
Applikation mit der die Datei einst erstellt wurde noch in der richtigen Version vorhanden ist.
Journaling
Die Relevanz elektronischer Daten als Beweismittel bei rechtlichen Vorfällen wird weiter zunehmen. Um
den gesamten elektronischen Datenaustausch festzuhalten gibt es die Möglichkeit des Journaling.
Hierbei wird der gesamte Email Verkehr im Archiv gespeichert. Der damit verbundene Bedarf an
Speicherkapazität ist enorm. Zudem wird der Email Verkehr auch weiterhin stark zunehmen, was einen
kontinuierlichen Ausbau der Infrastruktur nach sich zieht. Auch muss hier das Archivierungssystem mit
genügend Ressourcen (CPU, RAM) dimensioniert werden, da die Protokollierung praktisch in Echtzeit
geschieht.
In der Schweiz gibt es bisher noch keine rechtlichen Vorgaben wie in den USA, allerdings wird
Journaling in gewissen Bereichen wie zum Beispiel Rechtskanzleien als sinnvoll erachtet.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 14 von 33
Case Study – Next Generation Storage
IST Analyse
Konzept / Infrastruktur
Die bestehende Infrastruktur ist auf die zwei Standorte aufgeteilt. An diesen beiden Sites werden
Systeme der Siemens Schweiz (SCH), Siemens Building Technologies (SBT) und weiteren Kunden
betrieben. Wir fokusieren uns auf die zentrale Thematik des Massenspeichers und der Datensicherung,
welche zurzeit für SCH und SBT genutzt wird, jedoch mit dem Hinblick mandantenfähig zu sein, die
Services also weiteren potentiellen Kunden anbieten zu können.
NAS – Network Attached Storage
Die Siemens Schweiz hat bereits mit der Windows 2000 Migration (von der damals Windows NT
Umgebung) die verteilten Speicherablagen der einzelnen Windowsserver eine Speicherzentralisierung
vorgenommen. Diese wurde mit einem Network Attached Storage System realisiert, welches aus einer
Rechnereinheit (Head) und dazugehörigem Speichersubsystem (Disk Shelfs) besteht. Die Vorteile liegen
in der einfachen Verwaltung, extrem hohen Verfügbarkeit und der einfachen Skalierbarkeit dieses
Systems. Auch die Backup Thematik wurde mit „serverless/networkless backup“ mittels NDMP Protokoll
wesentlich vereinfacht. Kurzum: Network Attached Storage verwaltet lediglich Speicher, dies aber
effizient.
In einer erst kürzlich zweiten Migration wurden die Server und Speichersysteme nun an die beiden
Standorte (1+2) zentralisiert, so dass nun nur noch diese zwei Rechenzentren-Standorte betrieben
werden. Für diese Migration wurden wiederum neue NAS Systeme beschafft. Folglich sind nun
nachstehende „Filer“ in Betrieb:
Online Storage Filer 1
Auf diesem NAS System sind die eigentlichen Anwendungsdaten der Exchange-, Datenbank- und
Internet Information (Intranet) und Unix Server abgelegt. Das bedeutet, dass die Server nur ihr eigenes
Betriebssystem mit den entsprechenden Applikationen lokal installiert haben und die Datenpartitionen
mittels iSCSI über ein dediziertes IP-SAN eingebunden werden. Unix Server verbinden sich mit NFS via
gewöhnliches LAN. Vorteile dabei sind, dass die Datensicherung auf Blockebene (mit NDMP) direkt über
das FC-SAN gesichert werden können, bei Serverausfällen lediglich die Hardware ausgetauscht und die
entsprechende Datenpartition wieder eingebunden werden kann. Dieses NAS System verfügt über zwei
Heads, falls der eine ausfällt, kann der andere die Anfragen des fehlerhaften Heads übernehmen. Im
Normalbetrieb teilen sich die beiden die Last (statische Verteilung).
Online Storage Filer 2
Auf diesem geclusterten NAS System befinden sich alle Datei-Ablagen der Siemens Schweiz. Diese
werden mittels CIFS Protokoll direkt via LAN Backbone dem User zur Verfügung gestellt. Der NAS ist im
Active Directory eingebunden, damit er die Authentifizierungsprozeduren selber übernehmen kann. Auch
hier wird die Datensicherung direkt via FC-SAN auf die Backupdrives im Tape Roboter bewerkstelligt.
Online Storage Filer 3
Dieses NAS System besteht lediglich aus einem Head und bewirtschaftet die Partitionen für Exchangeund File-Server der Siemens Building Technologies, welche mit iSCSI übers FC-SAN zugreifen. Ein
Serverless Backup kann hier aus politischen Gründen nicht gemacht werden, sondern die Daten werden
von Exchange- (mit Datenbankdump Modul) und Fileserver übers LAN zum Backupserver gemacht.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 15 von 33
Case Study – Next Generation Storage
Datensicherung
Die Datensicherung wird ausgekreutz in die zwei gegebenen Standorte gemacht. Dazu werden pro Site
ein Backupserver und 3 Backup Storage Nodes mit Nearline Storage betrieben. Auf diesen werden die
Daten derjenigen Server gespeichert, welche ihre Daten nicht zentral auf einem Storage System
abgelegt haben, oder diese nicht direkt von dort gesichert werden können (Bsp. Fileserver am Stao 2,
welche mit iSCSI am Filer angeschlossen sind). So können die Daten unterbruchsfrei und unzerstückelt
auf die Bänder geschrieben werden, was bei einer Wiederherstellung der Daten eine grosse
Zeitersparnis bringen kann. Pro Site gibt es eine grosse Tape Library, welche bis 3000 Tapes und
unzählige Sicherungslaufwerke aufnehmen kann. Die beiden Standorte verfügen jeweils über ein
Storage Area Network (SAN), welches mit einem Inter Switch Link (ISL) mit dem anderen Standort
verbunden ist (2 x 2GB, Fibre Channel).
Übersicht
Zur besseren Veranschaulichung haben wir ein Modell der Storage- und Backupumgebung
aufgezeichnet. Es ist bewusst eine starke Vereinfachung der physischen Umgebung. Auf Grund der
Informationsdichte sind wir gezwungen mit Abkürzungen zu arbeiten, welche aber kurz noch erläutert
werden sollen:
SRV
Server
EXC
Exchange
FIL
File
DB
Data Base
IIS
Internet Information Server
UNX
Unix
LAN
Local Area Network
FC-SAN
Fibre Channel – Storage Area Network
IP-SAN
IP based Storage Area Network mittels iSCSI Protokoll
LOC1
Standort 1
LOC2
Standort 2
CIFS
Zugriffsprotokoll unter Windows
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 17 von 33
Case Study – Next Generation Storage
LOC 2
LOC 1
Tape
Library
Tape
Library
Brocade
FC-SAN (NDMP)
Filer 3
Online Storage
BCK
SRV
FC Switch
FC-SAN (NDMP)
BCK
SRV
Filer 2
Online Storage
Filer 1
Online Storage
EXC
SRV
CIFS
IP-SAN (iSCSI)
Ethernet
Switch
FILE
SRV
IP-SAN (iSCSI)
EXC
SRV
EXC
SRV
LAN
IIS
SRV
UNX
SRV
LAN
Client
Client
LOC 2
18. Mai 2005 / Version 1.0_pub
DB
SRV
Ethernet
Switch
© Stefan Escher, Martin Manser
LOC 1
Seite 18 von 33
Client
Case Study – Next Generation Storage
Kosten
Überlegungen zur Kostenberechnung
Nach der Beschaffung der Daten der relevanten Positionen mussten wir uns überlegen, wie die Kosten
der heutigen Infrastruktur geeignet berechnet werden können.
Dabei muss der Zeitpunkt der Beschaffung, die Investitionssumme, wiederkehrende Kosten (z.B.
Wartung), Administrationskosten (Manpower), allfällige Kosten für Ausbau der Systeme (Reinvest) und
die Abschreibungsdauer berücksichtigt werden.
Als erstes betrachteten wir die Investitionssumme. Welche Summe für die Komponente bezahlt wurde.
Aus der Investitionssumme kann zusammen mit dem Reinvest unter Berücksichtigung der
Abschreibungsdauer eine Abschreibungssumme berechnet werden. Zudem fallen wiederkehrende
Kosten an. Die Summe der jährlichen Abschreibung und der wiederkehrenden Kosten betrachten wir als
die Kosten, welche von der Komponente pro Jahr verursacht werden.
Zusätzlich wird die Entwicklung der Technik berücksichtigt. Die Kapazitäten der Speicherkomponenten
nehmen zu, während die Kosten kontinuierlich abnehmen. Dies würde zu degressiven Abschreibungen
führen, wobei am Anfang sehr viel, gegen Ende sehr wenig abgeschrieben würde. Allerdings beziehen
wir diesen Aspekt nicht in unsere Berechnungen ein. Die Technik der Speicherkomponenten entwickelt
sich zwar rasant weiter, die Kapazität der Komponenten die wir bereits zu einem festen Preis beschafft
haben bleiben jedoch dieselben. Konkret würde dies nämlich bedeuten, dass ein heute gekauftes
Storage System in einem Jahr lediglich noch einen Wert hat, der 45% (60% grössere Kapazität bei 30%
tieferen Kosten) des Invests entspricht. Wir übernehmen hier also weitgehend die Abschreibungsdauer
aus dem Anlagevermögen.
In einem weiteren Schritt versuchen wir die Opportunitätskosten zu ermitteln, die aus Sicht des
Benutzers entstehen, indem er sich tagtäglich durch den Daten- und Maildschungel kämpft. Dies hat
zwar in erster Linie keinen Einfluss auf die Rentabilitätsrechnung aus Dienstleistersicht, jedoch auf die
Rentabilitätsrechnung des Kunden.
Datenerhebung
Um überhaupt ein potentielles Storagevolumen ermitteln zu können, welches von einem teuren auf ein
günstigeres Speichermedium verdrängt werden kann, ist es unerlässlich vorgängig eine umfassende
Datenerhebung durchzuführen. Dieses Potential fliesst anschliessend in die Kostenrechnung mit ein.
Die Datenerhebung ermittelt die beiden Teile „File-Storage“ und „Mail-Storage“. Sie müssen daher
separat betrachtet werden, weil ihre Beschaffenheit eine völlig andere ist. Im Bereich File-Storage, findet
eine Archivierung wie bei Papierakten statt. Die ältesten Daten werden weiter weg gestapelt, als zum
Beispiel diejenigen des aktuellen Geschäftsjahres. Bei den Emails werden hingegen viele Nachrichten
an mehrere Empfänger verschickt, welche anschliessend auf Mailservern ableget werden. Angehängte
Dokumente werden unter Umständen mehrfach auf dem gleichen System abgelegt. Hier besteht die
Möglichkeit die Duplikate nur einmal abzulegen und jedem Dokumentbesitzer eine Verknüpfung zur
Verfügung zur stellen (Single Instance). Hinzu kommen zahlreiche persönliche Speicherordner (.PST),
welche bei einer einzigen dazustossenden Mail (Bsp: Grösse 1Kb), das Archiv-Attribut wieder
zurücksetzt und in den nächtlichen Backup Prozess läuft. Dies obschon nur eine minimale Verränderung
stattgefunden hat.
Für die Datenerhebung werden folgende Systeme untersucht. Es handelt sich hierbei um sämtliche Mailund File-Systeme der Siemens Schweiz AG und der Siemens Building Technologies:
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 19 von 33
Case Study – Next Generation Storage
Siemens Schweiz AG
File-Ablagen
Unter dem unternehmensweiten Laufwerkpfad (DFS Share) sind sämtliche Ablagen der Siemens
Schweiz logisch zusammenfasst. Hier erfasst sind: Divisions-, Intranet-, Project- und Special-Ablagen.
Die Files werden mittels eines rudimentären DIR-Befehls ermittelt und in ein Logfile geschrieben.
Zusätzlich erheben wir noch die Home-Shares.
Mailboxen / PST-Files
Für die Datenerhebung der Mailboxen wird der EV-Store-Reporter auf den Mailservern eingesetzt.
Damit wir das Archivierungspotential der PST Files ermitteln können, müssen wir diese separat erheben.
Selbstverständlich sind wir in der Lage nur diese zu erfassen, welche auf dem zentralen File System
abgelegt sind. In wie fern weitere, lokal gespeicherte PST Files später in die Archivierung hinein migriert
werden, können wir im Moment nicht abschätzen, da uns hier die Erfahrungswerte fehlen.
Die Ergebnisse unserer Datenerhebung haben wir jeweils direkt in unser Berechnungsmodell (siehe
Anhang) einfliessen lassen. Wir verweisen also an dieser Stelle dahin.
Siemens Building Technologies
File-Ablagen
Für Siemens Building Technologies werden die Daten über mehrere File-Server den Benutzer zur
Verfügung gestellt. Auf diesen befinden sich sämtliche Home-, Divisions- und Projekt- Ablagen.
Mailboxen / PST-Files
Für die Datenerhebung der Mailboxen wird der EV-Store-Reporter auf den Mailservern eingesetzt:
Auch hier haben wir wiederum die PST Files auf dem zentralen File System separat ermittelt.
Speicherwachstum
Über das zukünftige Speicherwachstum werden verschiedenste Grössen prognostiziert. Die geringste
Wachstumsrate liegt bei 40% und stammt aus dem Haus Gartner Group. Gemäss Horison Information
Strategies liegt die Rate zwischen 50 und 70%. In Rahmen einer Neukonzeption der Backup Lösung,
welche im Sommer 2004 durch Dicom Security durchgeführt wurde, wurden zusammen mit Siemens
gestützt auf bereits gesammelten Erfahrungswerten ein Wachstum von 50% für File-Storage und 100%
für Mail-Storage prognostiziert.
Als Wachstumsfaktor für Mail wurde in dieser Arbeit eine Rate von 110% eingesetzt. Diese setzt sich
zusammen aus einer gemittelten Zunahme des Email Verkehrs von 75% und einem zusätzlichen
Wachstum durch Neukunden von 20% pro Jahr (75+20+75*20).
Für das Wachstum der Files wurden jährlich 50% übernommen plus 20% Zunahme durch Neukunden,
was einem Wachstumsfaktor von 80% entspricht (50+20+50*20).
Datenspeichergrössen
Je nachdem unter welchem Aspekt man die Speichervolumina ermittelt, erhält man erheblich
differierende Grössen.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 20 von 33
Case Study – Next Generation Storage
Netto Datenvolumen
Diese Grösse bestimmt die effektive Summe der File Size bzw. der Mailbox Size. Diese ist relevant, um
die Ressourcen für das Backup zu ermitteln.
Netto Speicherplatz auf Filern
Diese Grösse bestimmt die effektive Auslastung auf den Speichersystemen. Bei einem CIFS oder NFS
Aggregate entspricht dies in etwa dem Netto Datenvolumen. Werden Aggregates jedoch wie bei
Siemens Building Technologies mittels iSCSI angebunden, so muss die Partition für den Fileserver
genügend gross sein, damit die Benutzer auch in naher Zukunft ihre Daten speichern können. Sie ist
also deutlich grösser als die Summe der abgespeicherten Files. Bei Aggregates für Exchange Server ist
es ähnlich, nur kommen dort noch Belegungen von Logs, etc. hinzu. Diese müssen wir für das
Speicherwachstum und die damit verbundene Storagebelegung mitberücksichtigen.
Brutto Speicherplatz auf Filern
Je nach Funktionalität wie etwa Snapshots oder Raid Konfigurationen mit Spare Disks gibt es noch
einen Unterschied zwischen der logischen und physischen Grösse, also der Summe aller darin
enthaltenen Disks.
Dieser Umstand, viel Speicher „unnütz“ zu verschwenden, könnte aber bald mit einem der neuen
Betriebsystemen vermieden werden. Dort soll eine stärkere Virtualisierung des Filers und eine
dynamischere Handhabung (Resizing) der Aggregates ermöglicht werden.
Backupdatenwachstumsfaktor
Um die Sicherheit der Verfügbarkeit von Daten zu garantieren werden diese nicht nur auf File- oder
Exchangeservern bzw. auf den zugehörigen Storage Systemen abgelegt, sondern regelmässig auf ein
dediziertes Sicherungssystem ausgelagert. Dies ist allerdings mit einem sehr hohen Aufwand an
zusätzlicher Speicherkapazität verbunden. Im Umfang dieser Case Study wurde ausgerechnet, dass der
Speicherbedarf für Backup von Filedaten deren Nettogrösse um das 6.6-fache, dasjenige von Maildaten
sogar um das 200-fache übersteigt. Diese hohen Faktoren ergeben sich durch die Anzahl Full Saves,
Incremental Saves und bei Mails vor allem durch Logdaten. Würde zusätzlich ein Band Duplikat
angefertigt (Cloning), so wäre der Faktor doppelt so gross.
Reinvest
Da die Nachfrage nach Speicherkapazität stetig zunimmt muss die Infrastruktur laufend den
Bedürfnissen angepasst werden. Wenn ein Fileserver an seine Kapazitätsgrenzen kommt, müssen
zusätzliche Disks eingesetzt werden, beim Backup müssen zusätzliche Tapes und Bandlaufwerke
gekauft werden. Um praxisnahe Resultate zu erhalten wurden in dieser Arbeit notwendige
Reinvestitionen unter Berücksichtigung der Preiserosion (geschätzt) eingesetzt.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 21 von 33
Case Study – Next Generation Storage
SOLL Analyse
Konzept / Infrastruktur
Es soll ein Mail- & Filesystemarchiv mit Nearline Storage (ohne Exchange Journal Archiving)
implementiert werden, welches für beide Standorte verwendet werden kann. Eine LAN Verbindung
zwischen den beiden Data Centers besteht ebenfalls mittels eines Inter Switch Links (ISL von 1GB).
Übersicht
Wir haben nachstehend die Archivierungslösung in unser Modell eingebaut. Jede Nacht holt sich der
eVault Archivierungsserver mittels dem MAPI Portokoll die zu archivierenden (gemäss Regeln)
Mailobjekte vom Exchange Server ab und indexiert sie auf dem SQL Server. Die Objekte werden dann
auf dem Nearline Storage abgelegt, der Exchange Server erhält einen Place Holder. Analog funktioniert
dies mit den Files, die archiviert werden. Sie werden vom Online zum Nearline Storage verschoben,
diese werden auf dem SQL Server indiziert und auf dem ursprünglichen Speichersystem bleiben
Verknüpfungen übrig. Anfragen auf archivierte Objekte, werden dann vom eVault Server beantwortet.
Legende:
SRV
Server
EXC
Exchange
FIL
File
DB
Data Base
IIS
Internet Information Server
UNX
Unix
LAN
Local Area Network
FC-SAN
Fibre Channel – Storage Area Network
IP-SAN
IP based Storage Area Network mittels iSCSI Protokoll
LOC1
Standort 1
LOC2
Standort 2
CIFS
Zugriffsprotokoll unter Windows
ODBC
Schnittstelle für Database Connection
MAPI
Protokoll um auf Exchange Server zuzugreifen
eV
Enterprise Vault (Archivierungsserver)
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 22 von 33
Case Study – Next Generation Storage
LOC 2
LOC 1
Tape
Library
Tape
Library
Brocade
FC
Switch
FC-SAN (NDMP)
Filer 3
Online Storage
BCK
SRV
FC Switch
FC-SAN (NDMP)
Nearline
Storage
Filer 2
Online Strage
BCK
SRV
SQL
SRV
Filer 1
Online Storage
EXC
SRV
FILE
SRV
CIFS
EXC
SRV
ODBC
CIFS Mail Obj.
HTTPS
iSCSI Altavista
CIFS
IP-SAN (iSCSI)
Ethernet
Switch
eV
SRV
IP-SAN (iSCSI)
MAPI
EXC
SRV
DB
SRV
IIS
SRV
Ethernet
Switch
UNX
SRV
HTTPS
LAN
LAN
Client
Client
LOC 2
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
LOC 1
Seite 23 von 33
Client
Case Study – Next Generation Storage
Kosten
Die Kosten werden realistisch, gemäss empfohlenem Solution Design (eVault-Archiv-, SQL-Index-Server
und Nearline Archivespeicher), berechnet. Der Fokus liegt in der gesamtheitlichen Betrachtung mit
konkreten Werten aus Offerten, welche bereits im Vorfeld eingeholt wurden.
KOSTENKALKULATION
Hardware
Position
Archivserver
Indexserver
Archivspeicher
Verwendungszweck / Bemerkung
(eVault SRV) 4 CPUs, 8GB RAM
(SQL Index SRV) 2 CPUs, 4GB RAM
(Nearline Storage) inkl. Lizenzen & 3j Wart.,
CHF
40'000
12'000
200'000
Subtotal
252'000
Software
Position
Win 2k3 EE
Win 2k3 SE
SQL Standard Edition
KVS eV Archiving Engine
KVS eV Mailbox Archiving
KVS eV File System Archiving
Subtotal
Verwendungszweck / Bemerkung
(eVault SRV) inkl 3j SW-Assurance
(SQL Index SRV) inkl 3j SW-Assurance
(SQL Index SRV) inkl 3j SW-Assurance
eVault Archiving Engine für 5000 User
eVault Archiving Mailbox Archiving für 5000 User
eVault File System Archiving für 5TB (income) Daten
Projekt
Position
Beratung/Engineering
Engineering/Implement.
Subtotal
Verwendungszweck / Bemerkung
15 Tage à 2000chf (extern)
30Tage à 1000chf (intern)
TOTAL EINMALIGER INVEST
CHF
6'000
1'000
1'000
270'000
25'000
303'000
CHF
30'000
30'000
60'000
CHF 615'000
Administration, SW-Wartung
Position
Verwendungszweck / Bemerkung
Admin Man Power
0.5 Manntage à 150'000chf/jahr
KVS eVault, Support
1j Maintenance/Phone Support (18% der Σ Lizenzkosten)
Subtotal
TOTAL JÄHRLICHE KOSTEN
CHF
75'000
53'100
128'100
CHF 128'100
Angefertigte Budgeteingabe unter alleiniger Betrachtung der Implementierung für Siemens Schweiz AG.
Die genauen Zahlen, welche für die konkrete Realisierung massgebend sind, sind dem
Berechnungsmodell im Anhang zu entnehmen.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 24 von 33
Case Study – Next Generation Storage
Datenverdrängung durch Archivierung
Archivierung von eMails:
• eMails > 14d & > 0KB
• eMails > 7d < 14d & >1024KB
Online
Storage:
EXCHANGE
SERVER
Archiv:
NetApp R200
Online
Storage:
FILE
SERVER
Archivierung von allen PST Files und
Files, welche älter als 6 Monate sind
Verdrängung von Maildaten
Durch Einführung der eVault können sämtliche PST Dateien ins Archiv verlagert werden. Dieser
einmalige Vorgang führt bereits zu einer Datenverdrängung von rund 1.5TB. Gleichzeitig können
Policies eingerichtet werden, wann welche Mails archiviert werden sollen. In dieser Arbeit wurden
folgende Archivierungsregeln angenommen:
•
Archivierung von sämtlichen eMails, welche älter als 14 Tage sind
•
Archivierung von eMails, welche zwischen 7 und 14 Tage alt und grösser als 1024kB sind
Bei der Archivierung der Exchange Daten gibt es eine zusätzliche Kompression der Daten. Diese wird
bei Single Instance hergestellt. Dies bedeutet, dass eine eMail, welche intern an mehrere Personen
versandt wird, nur ein Mal im Archiv gespeichert wird. Single Instance ist bei Exchange Daten sehr
sinnvoll, dass jede Mail mindestens zwei Mal gespeichert wird (Outbox des Senders, Inbox des
Empfängers). Vor allem bei Attachements wird eine enorme Einsparung an Speicherbedarf erzielt. Die
Verdrängung wird auf 80% berechnet.
Die Exchange Server besitzen bereits Single Instance für Mails und Anhänge, allerdings nicht zwischen
den verschiedenen Servern. Deshalb wurde als zusätzliche Reduzierung des Speicherbedarfs um 20%
für SCH bzw. 40% für SBT angenommen.
Verdrängung von Filedaten
Ähnlich wie bei den Exchange Daten, gibt es auch bei der File Archivierung eine einmalige und eine
wiederkehrende Verdrängung. Auch hier müssen Archivierungsregeln aufgestellt werden, welche Files
wann archiviert werden sollen. In dieser Arbeit wurde folgende Archivierungsregel aufgestellt:
•
Archivierung aller Files, die älter als 6 Monate sind
Bei der einmaligen Verdrängung werden dadurch rund die Hälfte aller File Daten ins Archiv ausgelagert.
Ebenfalls würde die Single Instance hergestellt, allerdings werden Files viel seltener mehrfach abgelegt
als Mails. Als Komprimierungsrate für Filedaten wurden pauschal 10% eingesetzt. Dies entspricht in
etwa der eigenen Kompression von eVault.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 25 von 33
Case Study – Next Generation Storage
Business Plan
Kosten Dienstleistersicht
Um herauszufinden, ob die Implementierung einer Archivierung für den Dienstleister (Siemens Business
Services) profitabel ist, haben wir die Kosten mit und ohne eVault gegenübergestellt. Der Focus ist auf 3
Jahre gelegt (2006-2008), welche orange hinterlegt sind.
Kosten ohne eVault
Storagekosten p.a.
Backupkosten
Gesamtkosten
Jahr 0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
1'154'793
1'165'317
1'214'763
993'445
1'460'752
1'587'820
1'587'820
1'082'581
920'958
1'079'190
2'742'612
2'753'137
2'297'345
1'914'403
2'539'942
Kosten mit eVault
Storagekosten p.a.
Backupkosten
Gesamtkosten
Jahr 0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
1'154'798
1'548'317
1'390'751
886'742
711'266
1'587'820
1'587'820
1'082'581
778'463
890'821
2'742'617
3'136'136
2'473'333
1'665'205
1'602'087
Kostendifferenz mit/ohne eVault Jahr 0
Gesamtkostendiffernez
0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
383'000
175'988
-249'197
-937'855
Einsparung durch Archivierung Enterprise Vault
Einsparung durch Archivierung Enterprise Vault (bis Jahr 3 / 2008)
-628'060
309'795
(Auszug aus dem Berechnungsmodell)
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 26 von 33
Case Study – Next Generation Storage
Kosten Kundensicht
Um herauszufinden, ob die Implementierung einer Archivierung für den Kunden (Siemens Schweiz und
Siemens Building Technologies) profitabel ist, haben wir die Kosten mit und ohne eVault
gegenübergestellt, allerdings noch die Opportunitätskosten mit einbezogen. Der Focus ist auf 3 Jahre
gelegt (2006-2008), welche orange hinterlegt sind.
Kosten ohne eVault
Storagekosten p.a.
Backupkosten
Opportunitätskosten
Gesamtkosten
Jahr 0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
1'154'793
1'165'317
1'214'763
993'445
1'460'752
1'587'820
1'587'820
1'082'581
920'958
1'079'190
50'080'000 69'547'500 90'100'000 111'737'500
134'460'000
52'822'612 72'300'637 92'397'345 113'651'903 136'999'942
Kosten mit eVault
Storagekosten p.a.
Backupkosten
Opportunitätskosten
Gesamtkosten
Jahr 0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
1'154'798
1'548'317
1'390'751
886'742
711'266
1'587'820
1'587'820
1'082'581
778'463
890'821
50'080'000 31'680'000 48'960'000 67'200'000
86'400'000
52'822'617 34'816'136 51'433'333 68'865'205
88'002'087
Kostendifferenz mit eVault
Gesamtkosten
Jahr 0
0
Jahr 1
Jahr 2
Jahr 3
Jahr 4
-37'484'500 -40'964'012 -44'786'697
-48'997'855
Einsparung durch Archivierung Enterprise Vault
-172'233'060
Einsparung durch Archivierung Enterprise Vault (bis Jahr 3 / 2008)
-123'235'205
(Auszug aus dem Berechnungsmodell)
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 27 von 33
Case Study – Next Generation Storage
Fazit
Wie bereits aus dem Business Plan ersichtlich ist, kann nicht eindeutig von einem profitablen Geschäft
für den Dienstleister gesprochen werden. Die jährlichen Kosten sind so hoch, dass eine
Kostenoptimierung nach 5 Jahren sehr spekulativ ist. Es sind einfach zu viele Faktoren, welche
geschätzt und nicht eindeutig sind (Wachstumsrate, Umsatzsteigerung, Storage Preise, …). Als in sich
geschlossene Finanzanlage würden wir also davon absehen. Zudem müsste der jährliche „Ertrag“ noch
abdiskontiert werden, was die minimal notwendigen Ergebnisse in den späteren Jahren noch mehr
schmälert. Doch gibt es sehr wohl Punkte, die für eine Realisierung sprechen:
•
•
•
•
•
Bessere Skalierbarkeit mit Archiv
Innovationsführer mit Archiving im Outsourcing Bereich
KnowHow Aufbau für Speicherwachstum in Zukunft (5-10J)
gewappnet für gesetzliche Anpassungen wie Journaling etc.
mandatenfähige Infrastruktur
Es lässt sich sogar die Frage stellen, ob Siemens Business Services als Dienstleister es sich überhaupt
leisten kann, kein Archiving in seinem Dienstleistungsportfolio zu haben. Im Sinne von:
•
•
•
Total Outsourcing (als IT Generalunternehmung)
Eventuell als Türöffnerprodukt
Um internationale Kunden auch im europäischen Raum (mit bald strengeren gesetzlichen
Bestimmungen) mit IT zu versorgen
Die immense Einsparung aus Kundensicht, welche mittels Enterprise Vault erzielt wird, würde die
Realisation der Archivierung rechfertigen. Es ist klar, dass dies weiche Faktoren sind, auch wenn sie tief
(3min pro Tag) angesetzt sind. Man müsste also die Archivierung als zusätzliches Feature
kaufen/verkaufen und die damit verbundenen Mehrkosten mit den fiktiven Opportunitätskosten (welche
noch viel grösser sind) rechtfertigen.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 28 von 33
Case Study – Next Generation Storage
Literaturverzeichnis / Hilfsmittel
Bei unserer Arbeit stützen wir uns auf folgende Quellen:
Bücher / Dokumente / Unterlagen
-
Storage Manifesto (Horison Information Strategies / StorageTek)
-
Backup-Konzept Projekt Match 2 / Phase I
-
Diverse alte Bestellungen
-
Diverse Auszüge aus dem Anlagevermögen
-
Diverse Offerten
-
Produktinformationen eVault
Internet
-
http://www.speicherguide.de
-
http://www.horison.com
-
http://www.adic.com
Software
-
Microsoft Word 2003 & Excel 2003
-
EV Store Reporter
-
Diverse Scripts, um die Datenerhebung zu verdichten
Grafiken
[1] The INfusion Paradox
Storage Manifesto, Horison, Seite 9
[2] Langzeitarchivierung
Website adic.com, StoreNext Storage Manager
[3] eVault Mail Archiving
eV Präsentation, KVS, Folie 17
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 29 von 33
Case Study – Next Generation Storage
Schlusswort
Zur Case Study
Diese Fallstudie verbindet die Themen des Storages und Backups (Informatik) mit der Kostenkalkulation
und Rentabilitätsrechnung (Betriebswirtschaft). Ein ideales Derivat für zwei Wirtschaftsinformatikstudenten.
Die Arbeit war durch die neue Technologie der Archivierung sehr interessant und durch die
verschiedenen Meetings und Workshops sehr abwechslungsreich. Mit der zunehmenden
Auseinandersetzung des Themas wurde die Materie allerdings immer komplexer. Zum einen haben viele
Zahlen gefehlt, Faktoren mussten bestimmt oder andere Annahmen getroffen werden. Wir konnten uns
durch das strukturierte Vorgehen und die systematische Erarbeitung von Wachstumsraten,
Verdrängungsfaktoren, usw. ans Ziel herantasten und versuchten schrittweise an Detailierungsgrad zu
gewinnen.
Anstelle von zahlreichen Excel Files, welche wir dann in dieses Dokument einfügen, haben wir uns
entschlossen ein einziges Excel File als Berechnungsmodell zu kreieren, in welchem möglichst alle
Faktoren dynamisch miteinander verknüpft und mit Kommentaren versehen sind. So ist es möglich,
nachträglich gewisse Anpassungen vorzunehmen, ohne die statischen Screenshots ersetzen zu
müssen.
Bestandteile
Unsere Case Study besteht hauptsächlich aus zwei Teilen:
•
Die Dokumentation, die Sie im Moment vor sich liegen haben
•
Das Berechnungsmodell, welches Sie ausgedruckt im Anhang vorfinden.
Online Adresse
Die öffentliche Version wird ab Mai unter folgender Adresse erreichbar sein:
http://www.escher.bz/ngs
Username:
casestudy
Password:
pwd4study
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 30 von 33
Case Study – Next Generation Storage
Elektronische Form
Hier sind sämtliche, auch weiterführende, Unterlagen der Case Study auf CD-Rom abgespeichert:
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 31 von 33
Case Study – Next Generation Storage
Glossar
Hier befinden sich die Erläuterungen zu den manchmal doch sehr fachtechnischen Abkürzungen:
NAS
Network Attached Storage
Speicher, welcher direkt in das Netzwerk integriert wird. Diese Speichergeräte besitzen eigene
Prozessoren und Betriebssysteme, welche allerdings nur für den Betrieb des Speichermediums gedacht
sind, nicht um Applikationen auszuführen.
SAN
Storage Area Network
Ein spezielles, sehr schnelles Netzwerk (Fibre Channel), welches die Server mit den Speichermedien
verbindet. Durch die Trennung des Speichers vom Server wird Speicher zentralisiert, effizienter und
besser verwaltbar.
FAS
Fabric Attached Storage
Analog zu NAS, jedoch mit iSCSI anbindbar über Fabric, also geswitches SAN.
NDMP
Network Data Management Protokoll
Das Network Data Management Protocol gehört der TCP/IP-Protokoll-Familie an. NDMP übermittelt
grosse Datenmengen in Blockebene. Mittels NDMP kann ein LANless Backup gemacht werden, was
einerseits eine enorme Entlastung für das LAN und andrerseits einen uneingeschränkten
Datendurchsatz bedeutet.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 32 von 33
Case Study – Next Generation Storage
CIFS
Common Internet File System
Das Common Internet File System basiert auf dem Server Message Block Dienst (SMB) und ermöglicht
Datenlaufwerke in einem Netzwerk freizugeben. Dieses Protokoll wurde einst von Microsoft entwickelt
und definiert wie die Clients mit dem Server kommunizieren (Netzlaufwerk-Browsing).
HSM
Hierarchisches Speichermanagement
Das traditionelle HSM dient der automatischen Migration von Dateien, auf die eine bestimmte Zeit nicht
zugegriffen wurde, von schnellen Online-Festplattenspeichern auf langsamere, billigere Speicher wie
optische Jukeboxen oder Bandlaufwerke. Einige HSM-Systeme bieten noch eine dritte Migrationsstufe
auf 8mm Tape oder CD-ROM. Das HSM in Information Warehouse Systemen dient der Übertragung und
Bereitstellung von Informationen in verteilten Umgebungen. Das HSM in Document Imaging und
Dokumenten-Management-Systemen dient der schnellen Bereitstellung abgelegter oder archivierter
Dokumente. Das HSM sorgt insbesondere für den schnellen Transport großer Dokumentenmengen und
zur Zwischenspeicherung aktuell benötigter Informationen.
PST
Personal Folder Store
Der Personal Folder Store ermöglicht einem Outlook Benutzer einen eigenen Ordner entweder bei sich
lokal oder auf einem Netzlaufwerk zu erstellen und darin seine Mailobjekte abzuspeichern. Diese PSTs
sind als eine Art Datenbank aufgebaut und können je nach Outlook Version bis 2GB (Outlook 2000) oder
sogar unbegrenzt (Outlook 2003) gross sein.
Der Nachteil eines PST auf einem Netzlaufwerk ist, dass es bei einem Zuwachs eines einzelnen Mails
von wenigen Kilobytes bereits wieder in den Backupprozess eingeschleust wird. Dabei werden teure
Backupmedien verbraten und wertvolle Zeit des Backupfensters verschwendet.
Ist das PST hingegen auf dem lokalen Disk, besteht die Gefahr, dass gar nie eine Datensicherung
angefertigt sind. Bei Defekt oder Diebstahl des Laptops sind somit wertvolle Unternehmensdaten
verloren.
Das Erzeugen von PST Dateien wird indirekt über die Grössenlimitierung der Mailbox auf dem Exchange
Server provoziert. Der Benutzer muss also entweder seine Daten löschen oder mit PST Files primitive
Archivierung betreiben.
18. Mai 2005 / Version 1.0_pub
© Stefan Escher, Martin Manser
Seite 33 von 33
Herunterladen