Case Study – Next Generation Storage Case Study Next Generation Storage Public Version Status: Entwurf, Geprüft, Definitiv Autoren Name Studiengang Klasse Kurs Stefan Escher Wirtschaftsinformatik WINF6 Case Studies Martin Manser Wirtschaftsinformatik WINF6 Case Studies 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 1 von 33 Case Study – Next Generation Storage Allgemeines Inhaltsverzeichnis Über dieses Dokument ........................................................................................................................ 4 Dokumenten-History .............................................................................................................................................. 4 Einleitung ............................................................................................................................................. 5 Storage Einführung ................................................................................................................................................ 5 Storage Trends ...................................................................................................................................................... 5 Wachstum........................................................................................................................................................... 5 Technologie ........................................................................................................................................................ 5 Speichermanagement ........................................................................................................................................ 5 Kosten ................................................................................................................................................................ 5 Sicherheit............................................................................................................................................................ 6 Storage Problematik............................................................................................................................................... 6 Möglicher Lösungsansatz ...................................................................................................................................... 7 Archivierungslösung ........................................................................................................................................... 7 Storage Domain Director .................................................................................................................................... 8 Themenumfang .................................................................................................................................... 9 Ausgangslage ........................................................................................................................................................ 9 Heutige Situation.................................................................................................................................................... 9 Fallstudienziel / Auftrag.......................................................................................................................................... 9 Organisation....................................................................................................................................... 10 Projektorganisation .............................................................................................................................................. 10 Know How Network.............................................................................................................................................. 11 Zeitplan............................................................................................................................................... 12 Vorgesehener Zeitplan......................................................................................................................................... 12 Effektiver Zeitplan ................................................................................................................................................ 12 Produkt Analyse................................................................................................................................. 13 KVS Enterprise Vault ........................................................................................................................................... 13 Mail Archiving ................................................................................................................................................... 13 File Archiving .................................................................................................................................................... 14 Journaling ......................................................................................................................................................... 14 IST Analyse ........................................................................................................................................ 15 Konzept / Infrastruktur.......................................................................................................................................... 15 NAS – Network Attached Storage .................................................................................................................... 15 Datensicherung ................................................................................................................................................ 17 Übersicht .......................................................................................................................................................... 17 Kosten .................................................................................................................................................................. 19 Überlegungen zur Kostenberechnung.............................................................................................................. 19 Datenerhebung .................................................................................................................................................... 19 Siemens Schweiz AG ....................................................................................................................................... 20 Siemens Building Technologies ....................................................................................................................... 20 Speicherwachstum............................................................................................................................................... 20 Datenspeichergrössen ......................................................................................................................................... 20 Netto Datenvolumen......................................................................................................................................... 21 Netto Speicherplatz auf Filern .......................................................................................................................... 21 Brutto Speicherplatz auf Filern ......................................................................................................................... 21 Backupdatenwachstumsfaktor ............................................................................................................................. 21 Reinvest ............................................................................................................................................................... 21 SOLL Analyse .................................................................................................................................... 22 Konzept / Infrastruktur.......................................................................................................................................... 22 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 2 von 33 Case Study – Next Generation Storage Übersicht .......................................................................................................................................................... 22 Kosten .................................................................................................................................................................. 24 Datenverdrängung durch Archivierung ................................................................................................................ 25 Business Plan .................................................................................................................................... 26 Kosten Dienstleistersicht...................................................................................................................................... 26 Kosten Kundensicht ............................................................................................................................................. 27 Fazit .................................................................................................................................................... 28 Literaturverzeichnis / Hilfsmittel....................................................................................................... 29 Bücher / Dokumente / Unterlagen........................................................................................................................ 29 Internet ................................................................................................................................................................. 29 Software ............................................................................................................................................................... 29 Grafiken................................................................................................................................................................ 29 Schlusswort ....................................................................................................................................... 30 Zur Case Study .................................................................................................................................................... 30 Bestandteile ......................................................................................................................................................... 30 Online Adresse..................................................................................................................................................... 30 Elektronische Form .............................................................................................................................................. 31 Glossar ............................................................................................................................................... 32 NAS ...................................................................................................................................................................... 32 SAN ...................................................................................................................................................................... 32 FAS ...................................................................................................................................................................... 32 NDMP................................................................................................................................................................... 32 CIFS ..................................................................................................................................................................... 33 HSM ..................................................................................................................................................................... 33 PST ...................................................................................................................................................................... 33 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 3 von 33 Case Study – Next Generation Storage Über dieses Dokument Dokumenten-History Version Datum Autor Änderung zu früheren Versionen 0.1 10.12.04 Stefan Escher Ersterstellung 0.2 18.12.04 Martin Manser Einleitung, Zeitplan (Plan) 0.3 21.12.04 Stefan Escher Ausgangslage, Organisation 0.4 25.01.05 Martin Manser Ist Analyse 0.5 25.02.05 Stefan Escher Soll Analyse 0.6 26.02.05 Stefan Escher Solution Design 0.7 18.03.05 Martin Manser Businessplan 0.8 30.03.05 Stefan Escher Berechnungsmodell, Fazit 0.9 30.03.05 Martin Manser Korrekturen 1.0 31.03.05 Stefan Escher Korrekturen und Druck 1.0_pub 18.05.05 Stefan Escher Publizierung, (Freigabe durch M. Kempf) 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 4 von 33 Case Study – Next Generation Storage Einleitung Storage Einführung Die Zeiten wo Firmen auf dutzenden Windows NT Servern ihre Daten abspeichern, gehören der Vergangenheit an. Heute werden zentrale Speicherlösungen aufgebaut, sei es für einfache File-Sharing Funktionen, Datenbanken von Exchange-, Oracle- oder SQL-Services. Dadurch werden grössere Datenmengen einfacher verwaltet (Reduktion der Hardware, Reduktion der Anzahl Betriebssysteme, Reduktion des Verwaltungsaufwands). Dies bringt folgende Vorteile: • Tiefere Total Cost of Ownership • Höhere Verfügbarkeit (Redundanz,…) • Heterogene Verbindungen der Systeme (Windows, Linux, Solaris, etc.) • Skalierbare Architektur Storage Trends Wachstum Nach dem explosionsartigen Anstieg nach mehr Speicherbedarf während den Boomjahren 1998 bis 2000, wo Wachstumsraten von bis zu 120% pro Jahr erreicht wurden, hat sich der Anstieg wieder auf 50% bis 70% pro Jahr beruhigt. Technologie Kapazität und Performance der optischen Speichermedien nehmen zu. Allerdings ist diese Entwicklung wesentlich langsamer als die Fortschritte im Bereich der magnetischen Speicherkomponenten. Die Kapazität von Disk Storage nimmt pro Jahr um 60% zu. Die Kosten sinken gleichzeitig um rund 30%. Im Vergleich zu Tape Storage haben sich die Kosten pro MB Speicher im Disk Bereich wesentlich schneller reduziert. Es wäre sogar möglich, dass die Preise für Disk Storage unter die Preise für Tape Storage fallen werden. Speichermanagement Speichermanagement beschränkt sich nicht mehr auf die Beschaffung von genügend Kapazität, heute müssen komplexe SAN und NAS Strukturen verwaltet werden. Die Entwicklung der Storage Management Tools kann mit diesen rasanten Entwicklungen nicht mithalten. Es wird geschätzt, dass etwa 75% der Daten in Netzwerkumgebungen nicht effektiv verwaltet werden. Das heisst es wird kein Backup erstellt oder die Daten wären nicht leicht wiederherstellbar. Kosten Die Kosten von Speicher beschränken sich nicht nur auf den Einkaufspreis, er muss auch verwaltet werden. Die TCO (total cost of ownership) übersteigen den Einkaufspreis der Hardware um das zweibis zehnfache. Obwohl die Kosten für Speicher Hardware jährlich um 30-40% kleiner werden, steigen deren TCO stark an. Dies aufgrund des steigenden Aufwandes des Speichermanagements, Backup/Recovery und steigenden Kosten für Sicherheit. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 5 von 33 Case Study – Next Generation Storage Sicherheit Neben dem Schutz vor menschlichen Fehlern, Software- oder Hardwarefehlern, müssen Daten zunehmend vor zusätzlichen Gefahren geschützt werden. Im Septemer 2000 kam ein Virus auf 2000 versandte Mails. Im Mai 2001 wurde bereits in einem von 400 Mails ein Virus entdeckt. Um Attacken mit möglichst geringem Schaden zu überstehen, müssen die Daten vor dem Verlust repliziert werden. Der Wert von Daten steigt in sämtlichen Bereichen stark an, zudem steigen die Kosten und der Aufwand für deren Sicherheit. Trotzdem muss versucht werden, dem Phänomen des „frequent data loss“ entgegenzutreten, da diese Datenverluste erhebliche Kosten verursachen können. Ebenfalls kann der Betrieb erheblich beeinträchtigt werden, wenn zum Beispiel wichtige Dokumente, Arbeitspläne, etc. verloren gehen. Digitale Informationen wie Emails und Verträge werden auch als Beweismittel bei Rechtsstreitigkeiten immer wichtiger. Informationen sind für jedes Unternehmen überlebenswichtig, dadurch wird auch die Nachfrage nach effizientem, sicherem Speicher Management weiter zunehmen. Den Zusammenhang all dieser Aspekte wiedergibt sehr schön die folgende Grafik: [1] The INfusion Paradox Storage Problematik Durch anhaltendes Wachstum und das Bedürfnis nach immer grösserer Verfügbarkeit wird das Management der Daten und des Speichers selbst zu einer der Hauptherausforderungen der IT. Die immer grösser werdenden Datenmengen führen unter Anderem dazu, dass Backupfenster zu klein werden oder Restores zu lange dauern. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 6 von 33 Case Study – Next Generation Storage Speicher zu managen heisst heute viel mehr als nur für ausreichend Kapazität zu sorgen. Verschiedene Tape- und Disk-Technologien, SAN’s, NAS’, Backup, hochverfügbarer Speicher sorgen für sehr grossen Kosten- und Verwaltungsaufwand. Die TCO (total cost of ownership) liegen bei Storage rund 2-10 Mal über dem Anschaffungspreis. In den USA wurden bereits sehr strikte Gesetzesartikel eingeführt (Sarbanes-Oxley-Act), welche Unternehmen dazu zwingen sämtlichen Email Verkehr zu archivieren. Auch in der EU werden solche Gesetze diskutiert und folglich wird sich auch die Schweiz solche Überlegungen machen müssen. Wie können solche riesigen Datenmengen verwaltet werden? Möglicher Lösungsansatz Archivierungslösung Zur Erfüllung dieser Vorgaben wurden Archivsysteme, bestehend aus Datenbanken, Archivsoftware und Storage-Systemen geschaffen. Diese Lösungen basieren meistens auf dem Ansatz über eine Datenbank mit den Verwaltungs- und Indexkriterien auf einen externen Speicher zu verweisen, wo die Daten gespeichert werden. Diese so genannte Referenz-Datenbank-Architektur ist notwendig, um große Mengen von Informationen von den zwar schnellen aber teueren Online-Speichern in separate, günstigere Archivspeicher auszulagern. Die Datenbank, über welche die Applikationen auf das Speichernetzwerk zugreift, erlaubt über den Index jederzeit Dokumente wieder zu finden und mit einem entsprechenden Anzeigeprogramm (z.B. mit XMLFormat) dem Anwender bereitzustellen. Erste Schritte wurden mit NAS unternommen, indem man separate Speicherkomponenten im Netzwerk platzierte, auf denen Daten abgespeichert werden können. Mit zunehmender Nachfrage nach Speicher wurden später separate Speichernetzwerke, SAN eingeführt. SAN erlaubt jederzeit und ohne Unterbrechung Full Backups, Snapshots oder Incremental Backups. Die höheren Ausgaben für das SAN werden durch Verbesserungen im Betrieb schnell kompensiert. Moderne Archivsysteme gliedern sich nahtlos in die IT-Infrastruktur ein. Anwendungen erhalten automatisch alle Daten die die Applikationen zur Verarbeitung oder Anzeige benötigen. Für den Anwender ist es unerheblich, wo seine Information wie gespeichert werden. Die Archivspeichersysteme und die Speicherorte seiner Dokumente sind für ihn intransparent. Dadurch können Speichernetzwerke auch heterogene Speicherkomponenten benutzen, allerdings steigt dadurch der Aufwand für deren Verwaltung erheblich an. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 7 von 33 Case Study – Next Generation Storage [2] Langzeitarchivierung Ein relativ neuer Ansatz in der Verwaltung von archivierten Daten ist das ILM (Information Lifecycle Management). Hier geht es darum, Daten auf dem geeigneten Speichermedium zur Verfügung zu stellen. Daten, die schnell Verfügbar sein müssen, oft benutzt werden sind auf teurem Online Storage gespeichert, selten verwendete Daten, alte werden auf günstigeren Nearline Storage oder auf Band abgelegt. Dadurch können erhebliche Kosteneinsparungen erzielt werden, die TCO von Daten werden reduziert. Elektronische Archivierungssysteme sind verantwortlich für die Sicherstellung der Verfügbarkeit der gespeicherten Informationen über einen längeren Zeitraum, der in Policies geregelt werden muss. Wie bereits erwähnt wird die Relevanz von Geschäftsdaten in den nächsten Jahren stark zunehmen, in einigen Bereichen, z.B. Rechtsabteilungen, werden sie zu den kritischen Faktoren gehören. Archivierungssysteme sind auch dafür zuständig, dass nur berechtigte Personen zugriff auf Daten haben und inkonsistent gewordene oder gestörte Systeme verlustfrei wieder aufgebaut werden können. Dazu müssen Archivierungssysteme eine effiziente Wiederherstellung (Recovery) zur Verfügung stellen. Storage Domain Director In Speichernetzwerken können viele heterogene Komponenten integriert werden. Die optimale Speichernetzwerk-Architektur verbindet einzelne Speichernetzwerke mit angebundenen Clients, welche verschiedene Server benutzen können. In der Mitte dieses Netzwerkes befindet sich der so genannte Storage Domain Director. Dieser kontrolliert den SAN Datenverkehr, ist die zentrale Management Komponente und steuert die Disk- und Bandlaufwerke. Die gesamten Daten sind in einem Netzwerk vereint und, je nach Zugriffsrechten, auch Verfügbar. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 8 von 33 Case Study – Next Generation Storage Themenumfang Ausgangslage Siemens Business Services betreibt für Siemens Schweiz AG und weitere Kunden bereits ein Volumen von 7TB (Tera Byte) Daten. In Anlehnung an die Möglichkeiten von Daten-Archvierung (siehe Einleitung) sollen Möglichkeiten geprüft und deren Rentabilität berechnet werden. Heutige Situation Im Netzwerk der Siemens Business Services gibt es ein SAN, in welchem die Speicheraufgaben weg von den Servern, hin zu externen Speichermedien gebracht werden. Die Clients greifen über LAN auf Applikationsserver zu. Werden nun Daten benötigt, werden diese über IP-SAN von zwei Filern geliefert. Separat gibt es Backup Server, welche jede Nacht Backups erstellen. Diese werden über FC-SAN auf Bändern im Roboter abgelegt. Die beiden Data Center Sites sind redundant, Daten von der ersten Location werden in der zweiten, Daten der zweiten Location werden in der ersten über ISL (Inter Switch Link) gesichert. Dies erlaubt problemlose Wiederherstellung von Daten in Notfällen oder Katastrophenszenarios (z.B. Gebäudebrand). Fallstudienziel / Auftrag Im Rahmen dieser Case Study soll ermittelt werden, wie mit dem Einsatz von hierarchischen Speicherlösungen (HSM) und/oder Archivierungslösungen die bestehenden Daten auf billigere Medien verdrängt werden können. Dabei ist schwerpunktmässig der Datensicherungsaspekt zu berücksichtigen, da mit der Einführung einer Datenarchivierung auch die Datensicherungsstrategie massgeblich beeinträchtigt wird. Bei der Evaluation der HSM/Archivierungslösung soll sowohl auf die Archivierung von Dateien und Verzeichnissen, als auch auf die Archivierung von E-Mails über das vorhandene Microsoft Exchange / Outlook-System berücksichtigt werden. Für den Einsatz einer durchgängigen E-Mail-Archivierung empfiehlt Network Appliance die Software der Firma KVS. Da diese Software weltweit eines der am meist verbreiteten Produkte für die Archivierung von E-Mails ist, soll der Einsatz dieser Software in Verbindung mit den Produkten des bisherigen HW-Lieferanten der Storage Systeme untersucht werden Die Case Study soll den Zeitrahmen der nächsten drei Jahre berücksichtigen. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 9 von 33 Case Study – Next Generation Storage Organisation Projektorganisation Um der Wichtigkeit des Speicherwachstums Rechnung zu tragen, wurde ein Projekt definiert und gestartet, welches die konkrete Implementierung einer Archivierungsumgebung prüfen soll. Es geht in erster Linie darum, Informationen über die Thematik aufzuarbeiten, konkrete Offerten einzuholen, Workshops mit den Beteiligten durchzuführen (Storage, Backup, Mail) und ein erforderliches Budget für das Jahr 2006 (voraussichtlicher Realisierungszeitraum) dem Informatik Leitungskreis abzugeben. Pj Auftraggeber Pj Leitung SLIM Pj Ausschuss xxx xxx xxx Case Study – NGS Leader Stefan Escher Stefan Escher Storage Backup Mail xxx xxx xxx Martin Manser Die Case Study ist also Teil eines sehr grossen Projekts, in welches weit mehr als nur die hier ersichtlichen Personen einbezogen sind. Weiter sind zum Beispiel die ganzen CIO Organisationen der Kunden involviert. Die Case Study hat ihren konkreten Auftrag einen möglichen Lösungsansatz mit Lösungsdesign und Rentabilitätsrechnung zu erarbeiten. Es können vor allem auf Informationen von hier aufgeführten Personen und auch im folgenden Know How Network zugegriffen werden. Konkreter Auftraggeber für die Case Study ist Michael Kempf, Leader von SBS ORS SDD (Siemens Business Services, Operation Related Services, Service Delivery Data Center). 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 10 von 33 Case Study – Next Generation Storage Know How Network xxx xxx Fa. xxx Stefan Escher Fa. xxx Martin Manser Fa. xxx xxx xxx xxx Informationsfluss Projekt Informationsfluss Case Study Externe Zusammenarbeit Interne Zusammenarbeit Backup Storage Archiving Mail Wirtschaftsinformatik (Werkstudenten) Die hier aufgeführten Personen haben direkten Kontakt zum Projekt oder zur Case Study. Es sind auch Firmen, welche in diese Thematik involviert sind ersichtlich. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 11 von 33 Case Study – Next Generation Storage Zeitplan Vorgesehener Zeitplan Tasks Dez 04 Jan 05 Feb 05 Mrz 05 Apr 05 Dez 04 Jan 05 Feb 05 Mrz 05 Apr 05 Projektstart Informationsbeschaffung über Storage / Archivierung Analyse der bisherigen Infrastruktur Datenerhebung und Analyse Meeting (eVault Produktpräsentation, allg. Infos) Beschaffung von Zahlenmaterial (Kosten, Investitionen) Berechnung der IST-Kosten Konzeption der Archivierungslösung Meeting (eVault Workshop) Berechnung der SOLL-Kosten Businessplan Dokumentation Projektabschluss, Abgabe Präsentation Effektiver Zeitplan Tasks Projektstart Informationsbeschaffung über Storage / Archivierung Analyse der bisherigen Infrastruktur Datenerhebung und Analyse Meeting (eVault Produktpräsentation, allg. Infos) Beschaffung von Zahlenmaterial (Kosten, Investitionen) Berechnung der IST-Kosten Konzeption der Archivierungslösung Meeting (eVault Workshop) Berechnung der SOLL-Kosten Businessplan Dokumentation Projektabschluss, Abgabe Präsentation 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 12 von 33 Case Study – Next Generation Storage Produkt Analyse KVS Enterprise Vault Enterprise Vault ist ein Produkt der Firma KVS, ein global tätiges Unternehmen mit Sitz in England. KVS hat sich auf Archivierungslösungen spezialisiert, ist Leader für Email active archiving products. Mail Archiving Der Bedarf an Exchange Speicherbedarf steigt jährlich um rund 40%. Durch die beschränkte Speicherkapazität müssen immer mehr Informationen gelöscht werden, oder es werden PST Files angelegt. Diese PST Files belasten allerdings die File Server und durch Vielfachkopien wird sehr viel Backup Speicher verschwendet. Um Mails wieder zu finden wird täglich viel Zeit aufgewendet. In einigen Geschäftsbereichen besteht die Gefahr, dass sensible Daten gelöscht werden, die z.B. bei Rechtsstreitigkeiten relevant werden könnten. Emails sowie Attachements kommen beinahe immer doppelt vor (z.B. Inbox und Sent Items). Dadurch werden sie auch in PST Files mehrfach abgelegt. Mit der Migration der PST Files speichert Enterprise Vault diese Mails und Attachements nur einmalig ab, dadurch wird die Single Instance hergestellt, was eine starke Reduzierung des Speicherbedarfs bedeutet. Exchange Server Exchange Store User Vault Server Vault Store PST Files File Server PST Files [3] eVault Mail Archiving Enterprise Vault für Exchange ermöglicht unlimitierte Postfächer. Dadurch müssen keine sensiblen Informationen mehr gelöscht werden und PST Files werden überflüssig. Eine Alta-Vista Suchmaschine bietet zudem eine effiziente Suche, welche Bodytext und Attachements durchsucht. Dies ermöglicht enorme Zeiteinsparungen bei der Suche nach Informationen. Für den User gibt es keine grossen Veränderungen, dass Look&Feel von Microsoft Outlook wird beibehalten. Lediglich der Placeholder bei den Mails sowie einige Funktionsbuttons (z.B. direkt archivieren) sind neu. Es ergeben sich also Vorteile: • Mühsame PST Files fallen weg • Das Speicherwachstum wird auf das billigere Archiv ausgelagert • Single Instance wird hergestellt (doppelte Mails & Anhänge werden nur ein mal gespeichert) 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 13 von 33 Case Study – Next Generation Storage • Reduziert den Speicherbedarf bis zu 70% gegenüber PSTs und bis zu 90% gegenüber dem bisherigen Backupvolumen • Volltextsuche für Mails und/oder Anhänge und deren Inhalte File Archiving Auch auf File Servern wächst der Speicherbedarf ständig. User bewahren alles auf, es gibt keine klare Zuständigkeit/Verantwortung für Löschen auf Gruppen-, Abteilungs-, Projektlaufwerken. Wieder finden von benötigten Informationen wird zeitintensiv. Zudem entstehen hohe Backupkosten, Wiederherstellung wird aufwändig. Vollaufende Plattensysteme werden zum Risiko für Verfügbarkeit. Enterprise Vault führt eine automatische Daten-Archivierung durch. Dabei sind verschiedene Dateiattribute als Kriterium für Archievierung wählbar, wie zum Beispiel: Alter, Größe, Änderungszeitpunkt der Daten. Auch Dateisystem-Quota sind als Archivierungskriterium möglich. Die Aufbewahrungsfristen sind definierbar, so wird gezieltes Records Management möglich. Die File Archivierung besitzt ebenfalls eine integrierte AltaVista Suchfunktion. Files werden Volltext indiziert und Stichwortsuche ermöglicht Finden von Files in Sekundenschnelle. Die heute gängigsten Dateiformate können auch nach 10 Jahren mittels XML-Format eingesehen werden, ungeachtet dessen, ob die Applikation mit der die Datei einst erstellt wurde noch in der richtigen Version vorhanden ist. Journaling Die Relevanz elektronischer Daten als Beweismittel bei rechtlichen Vorfällen wird weiter zunehmen. Um den gesamten elektronischen Datenaustausch festzuhalten gibt es die Möglichkeit des Journaling. Hierbei wird der gesamte Email Verkehr im Archiv gespeichert. Der damit verbundene Bedarf an Speicherkapazität ist enorm. Zudem wird der Email Verkehr auch weiterhin stark zunehmen, was einen kontinuierlichen Ausbau der Infrastruktur nach sich zieht. Auch muss hier das Archivierungssystem mit genügend Ressourcen (CPU, RAM) dimensioniert werden, da die Protokollierung praktisch in Echtzeit geschieht. In der Schweiz gibt es bisher noch keine rechtlichen Vorgaben wie in den USA, allerdings wird Journaling in gewissen Bereichen wie zum Beispiel Rechtskanzleien als sinnvoll erachtet. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 14 von 33 Case Study – Next Generation Storage IST Analyse Konzept / Infrastruktur Die bestehende Infrastruktur ist auf die zwei Standorte aufgeteilt. An diesen beiden Sites werden Systeme der Siemens Schweiz (SCH), Siemens Building Technologies (SBT) und weiteren Kunden betrieben. Wir fokusieren uns auf die zentrale Thematik des Massenspeichers und der Datensicherung, welche zurzeit für SCH und SBT genutzt wird, jedoch mit dem Hinblick mandantenfähig zu sein, die Services also weiteren potentiellen Kunden anbieten zu können. NAS – Network Attached Storage Die Siemens Schweiz hat bereits mit der Windows 2000 Migration (von der damals Windows NT Umgebung) die verteilten Speicherablagen der einzelnen Windowsserver eine Speicherzentralisierung vorgenommen. Diese wurde mit einem Network Attached Storage System realisiert, welches aus einer Rechnereinheit (Head) und dazugehörigem Speichersubsystem (Disk Shelfs) besteht. Die Vorteile liegen in der einfachen Verwaltung, extrem hohen Verfügbarkeit und der einfachen Skalierbarkeit dieses Systems. Auch die Backup Thematik wurde mit „serverless/networkless backup“ mittels NDMP Protokoll wesentlich vereinfacht. Kurzum: Network Attached Storage verwaltet lediglich Speicher, dies aber effizient. In einer erst kürzlich zweiten Migration wurden die Server und Speichersysteme nun an die beiden Standorte (1+2) zentralisiert, so dass nun nur noch diese zwei Rechenzentren-Standorte betrieben werden. Für diese Migration wurden wiederum neue NAS Systeme beschafft. Folglich sind nun nachstehende „Filer“ in Betrieb: Online Storage Filer 1 Auf diesem NAS System sind die eigentlichen Anwendungsdaten der Exchange-, Datenbank- und Internet Information (Intranet) und Unix Server abgelegt. Das bedeutet, dass die Server nur ihr eigenes Betriebssystem mit den entsprechenden Applikationen lokal installiert haben und die Datenpartitionen mittels iSCSI über ein dediziertes IP-SAN eingebunden werden. Unix Server verbinden sich mit NFS via gewöhnliches LAN. Vorteile dabei sind, dass die Datensicherung auf Blockebene (mit NDMP) direkt über das FC-SAN gesichert werden können, bei Serverausfällen lediglich die Hardware ausgetauscht und die entsprechende Datenpartition wieder eingebunden werden kann. Dieses NAS System verfügt über zwei Heads, falls der eine ausfällt, kann der andere die Anfragen des fehlerhaften Heads übernehmen. Im Normalbetrieb teilen sich die beiden die Last (statische Verteilung). Online Storage Filer 2 Auf diesem geclusterten NAS System befinden sich alle Datei-Ablagen der Siemens Schweiz. Diese werden mittels CIFS Protokoll direkt via LAN Backbone dem User zur Verfügung gestellt. Der NAS ist im Active Directory eingebunden, damit er die Authentifizierungsprozeduren selber übernehmen kann. Auch hier wird die Datensicherung direkt via FC-SAN auf die Backupdrives im Tape Roboter bewerkstelligt. Online Storage Filer 3 Dieses NAS System besteht lediglich aus einem Head und bewirtschaftet die Partitionen für Exchangeund File-Server der Siemens Building Technologies, welche mit iSCSI übers FC-SAN zugreifen. Ein Serverless Backup kann hier aus politischen Gründen nicht gemacht werden, sondern die Daten werden von Exchange- (mit Datenbankdump Modul) und Fileserver übers LAN zum Backupserver gemacht. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 15 von 33 Case Study – Next Generation Storage Datensicherung Die Datensicherung wird ausgekreutz in die zwei gegebenen Standorte gemacht. Dazu werden pro Site ein Backupserver und 3 Backup Storage Nodes mit Nearline Storage betrieben. Auf diesen werden die Daten derjenigen Server gespeichert, welche ihre Daten nicht zentral auf einem Storage System abgelegt haben, oder diese nicht direkt von dort gesichert werden können (Bsp. Fileserver am Stao 2, welche mit iSCSI am Filer angeschlossen sind). So können die Daten unterbruchsfrei und unzerstückelt auf die Bänder geschrieben werden, was bei einer Wiederherstellung der Daten eine grosse Zeitersparnis bringen kann. Pro Site gibt es eine grosse Tape Library, welche bis 3000 Tapes und unzählige Sicherungslaufwerke aufnehmen kann. Die beiden Standorte verfügen jeweils über ein Storage Area Network (SAN), welches mit einem Inter Switch Link (ISL) mit dem anderen Standort verbunden ist (2 x 2GB, Fibre Channel). Übersicht Zur besseren Veranschaulichung haben wir ein Modell der Storage- und Backupumgebung aufgezeichnet. Es ist bewusst eine starke Vereinfachung der physischen Umgebung. Auf Grund der Informationsdichte sind wir gezwungen mit Abkürzungen zu arbeiten, welche aber kurz noch erläutert werden sollen: SRV Server EXC Exchange FIL File DB Data Base IIS Internet Information Server UNX Unix LAN Local Area Network FC-SAN Fibre Channel – Storage Area Network IP-SAN IP based Storage Area Network mittels iSCSI Protokoll LOC1 Standort 1 LOC2 Standort 2 CIFS Zugriffsprotokoll unter Windows 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 17 von 33 Case Study – Next Generation Storage LOC 2 LOC 1 Tape Library Tape Library Brocade FC-SAN (NDMP) Filer 3 Online Storage BCK SRV FC Switch FC-SAN (NDMP) BCK SRV Filer 2 Online Storage Filer 1 Online Storage EXC SRV CIFS IP-SAN (iSCSI) Ethernet Switch FILE SRV IP-SAN (iSCSI) EXC SRV EXC SRV LAN IIS SRV UNX SRV LAN Client Client LOC 2 18. Mai 2005 / Version 1.0_pub DB SRV Ethernet Switch © Stefan Escher, Martin Manser LOC 1 Seite 18 von 33 Client Case Study – Next Generation Storage Kosten Überlegungen zur Kostenberechnung Nach der Beschaffung der Daten der relevanten Positionen mussten wir uns überlegen, wie die Kosten der heutigen Infrastruktur geeignet berechnet werden können. Dabei muss der Zeitpunkt der Beschaffung, die Investitionssumme, wiederkehrende Kosten (z.B. Wartung), Administrationskosten (Manpower), allfällige Kosten für Ausbau der Systeme (Reinvest) und die Abschreibungsdauer berücksichtigt werden. Als erstes betrachteten wir die Investitionssumme. Welche Summe für die Komponente bezahlt wurde. Aus der Investitionssumme kann zusammen mit dem Reinvest unter Berücksichtigung der Abschreibungsdauer eine Abschreibungssumme berechnet werden. Zudem fallen wiederkehrende Kosten an. Die Summe der jährlichen Abschreibung und der wiederkehrenden Kosten betrachten wir als die Kosten, welche von der Komponente pro Jahr verursacht werden. Zusätzlich wird die Entwicklung der Technik berücksichtigt. Die Kapazitäten der Speicherkomponenten nehmen zu, während die Kosten kontinuierlich abnehmen. Dies würde zu degressiven Abschreibungen führen, wobei am Anfang sehr viel, gegen Ende sehr wenig abgeschrieben würde. Allerdings beziehen wir diesen Aspekt nicht in unsere Berechnungen ein. Die Technik der Speicherkomponenten entwickelt sich zwar rasant weiter, die Kapazität der Komponenten die wir bereits zu einem festen Preis beschafft haben bleiben jedoch dieselben. Konkret würde dies nämlich bedeuten, dass ein heute gekauftes Storage System in einem Jahr lediglich noch einen Wert hat, der 45% (60% grössere Kapazität bei 30% tieferen Kosten) des Invests entspricht. Wir übernehmen hier also weitgehend die Abschreibungsdauer aus dem Anlagevermögen. In einem weiteren Schritt versuchen wir die Opportunitätskosten zu ermitteln, die aus Sicht des Benutzers entstehen, indem er sich tagtäglich durch den Daten- und Maildschungel kämpft. Dies hat zwar in erster Linie keinen Einfluss auf die Rentabilitätsrechnung aus Dienstleistersicht, jedoch auf die Rentabilitätsrechnung des Kunden. Datenerhebung Um überhaupt ein potentielles Storagevolumen ermitteln zu können, welches von einem teuren auf ein günstigeres Speichermedium verdrängt werden kann, ist es unerlässlich vorgängig eine umfassende Datenerhebung durchzuführen. Dieses Potential fliesst anschliessend in die Kostenrechnung mit ein. Die Datenerhebung ermittelt die beiden Teile „File-Storage“ und „Mail-Storage“. Sie müssen daher separat betrachtet werden, weil ihre Beschaffenheit eine völlig andere ist. Im Bereich File-Storage, findet eine Archivierung wie bei Papierakten statt. Die ältesten Daten werden weiter weg gestapelt, als zum Beispiel diejenigen des aktuellen Geschäftsjahres. Bei den Emails werden hingegen viele Nachrichten an mehrere Empfänger verschickt, welche anschliessend auf Mailservern ableget werden. Angehängte Dokumente werden unter Umständen mehrfach auf dem gleichen System abgelegt. Hier besteht die Möglichkeit die Duplikate nur einmal abzulegen und jedem Dokumentbesitzer eine Verknüpfung zur Verfügung zur stellen (Single Instance). Hinzu kommen zahlreiche persönliche Speicherordner (.PST), welche bei einer einzigen dazustossenden Mail (Bsp: Grösse 1Kb), das Archiv-Attribut wieder zurücksetzt und in den nächtlichen Backup Prozess läuft. Dies obschon nur eine minimale Verränderung stattgefunden hat. Für die Datenerhebung werden folgende Systeme untersucht. Es handelt sich hierbei um sämtliche Mailund File-Systeme der Siemens Schweiz AG und der Siemens Building Technologies: 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 19 von 33 Case Study – Next Generation Storage Siemens Schweiz AG File-Ablagen Unter dem unternehmensweiten Laufwerkpfad (DFS Share) sind sämtliche Ablagen der Siemens Schweiz logisch zusammenfasst. Hier erfasst sind: Divisions-, Intranet-, Project- und Special-Ablagen. Die Files werden mittels eines rudimentären DIR-Befehls ermittelt und in ein Logfile geschrieben. Zusätzlich erheben wir noch die Home-Shares. Mailboxen / PST-Files Für die Datenerhebung der Mailboxen wird der EV-Store-Reporter auf den Mailservern eingesetzt. Damit wir das Archivierungspotential der PST Files ermitteln können, müssen wir diese separat erheben. Selbstverständlich sind wir in der Lage nur diese zu erfassen, welche auf dem zentralen File System abgelegt sind. In wie fern weitere, lokal gespeicherte PST Files später in die Archivierung hinein migriert werden, können wir im Moment nicht abschätzen, da uns hier die Erfahrungswerte fehlen. Die Ergebnisse unserer Datenerhebung haben wir jeweils direkt in unser Berechnungsmodell (siehe Anhang) einfliessen lassen. Wir verweisen also an dieser Stelle dahin. Siemens Building Technologies File-Ablagen Für Siemens Building Technologies werden die Daten über mehrere File-Server den Benutzer zur Verfügung gestellt. Auf diesen befinden sich sämtliche Home-, Divisions- und Projekt- Ablagen. Mailboxen / PST-Files Für die Datenerhebung der Mailboxen wird der EV-Store-Reporter auf den Mailservern eingesetzt: Auch hier haben wir wiederum die PST Files auf dem zentralen File System separat ermittelt. Speicherwachstum Über das zukünftige Speicherwachstum werden verschiedenste Grössen prognostiziert. Die geringste Wachstumsrate liegt bei 40% und stammt aus dem Haus Gartner Group. Gemäss Horison Information Strategies liegt die Rate zwischen 50 und 70%. In Rahmen einer Neukonzeption der Backup Lösung, welche im Sommer 2004 durch Dicom Security durchgeführt wurde, wurden zusammen mit Siemens gestützt auf bereits gesammelten Erfahrungswerten ein Wachstum von 50% für File-Storage und 100% für Mail-Storage prognostiziert. Als Wachstumsfaktor für Mail wurde in dieser Arbeit eine Rate von 110% eingesetzt. Diese setzt sich zusammen aus einer gemittelten Zunahme des Email Verkehrs von 75% und einem zusätzlichen Wachstum durch Neukunden von 20% pro Jahr (75+20+75*20). Für das Wachstum der Files wurden jährlich 50% übernommen plus 20% Zunahme durch Neukunden, was einem Wachstumsfaktor von 80% entspricht (50+20+50*20). Datenspeichergrössen Je nachdem unter welchem Aspekt man die Speichervolumina ermittelt, erhält man erheblich differierende Grössen. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 20 von 33 Case Study – Next Generation Storage Netto Datenvolumen Diese Grösse bestimmt die effektive Summe der File Size bzw. der Mailbox Size. Diese ist relevant, um die Ressourcen für das Backup zu ermitteln. Netto Speicherplatz auf Filern Diese Grösse bestimmt die effektive Auslastung auf den Speichersystemen. Bei einem CIFS oder NFS Aggregate entspricht dies in etwa dem Netto Datenvolumen. Werden Aggregates jedoch wie bei Siemens Building Technologies mittels iSCSI angebunden, so muss die Partition für den Fileserver genügend gross sein, damit die Benutzer auch in naher Zukunft ihre Daten speichern können. Sie ist also deutlich grösser als die Summe der abgespeicherten Files. Bei Aggregates für Exchange Server ist es ähnlich, nur kommen dort noch Belegungen von Logs, etc. hinzu. Diese müssen wir für das Speicherwachstum und die damit verbundene Storagebelegung mitberücksichtigen. Brutto Speicherplatz auf Filern Je nach Funktionalität wie etwa Snapshots oder Raid Konfigurationen mit Spare Disks gibt es noch einen Unterschied zwischen der logischen und physischen Grösse, also der Summe aller darin enthaltenen Disks. Dieser Umstand, viel Speicher „unnütz“ zu verschwenden, könnte aber bald mit einem der neuen Betriebsystemen vermieden werden. Dort soll eine stärkere Virtualisierung des Filers und eine dynamischere Handhabung (Resizing) der Aggregates ermöglicht werden. Backupdatenwachstumsfaktor Um die Sicherheit der Verfügbarkeit von Daten zu garantieren werden diese nicht nur auf File- oder Exchangeservern bzw. auf den zugehörigen Storage Systemen abgelegt, sondern regelmässig auf ein dediziertes Sicherungssystem ausgelagert. Dies ist allerdings mit einem sehr hohen Aufwand an zusätzlicher Speicherkapazität verbunden. Im Umfang dieser Case Study wurde ausgerechnet, dass der Speicherbedarf für Backup von Filedaten deren Nettogrösse um das 6.6-fache, dasjenige von Maildaten sogar um das 200-fache übersteigt. Diese hohen Faktoren ergeben sich durch die Anzahl Full Saves, Incremental Saves und bei Mails vor allem durch Logdaten. Würde zusätzlich ein Band Duplikat angefertigt (Cloning), so wäre der Faktor doppelt so gross. Reinvest Da die Nachfrage nach Speicherkapazität stetig zunimmt muss die Infrastruktur laufend den Bedürfnissen angepasst werden. Wenn ein Fileserver an seine Kapazitätsgrenzen kommt, müssen zusätzliche Disks eingesetzt werden, beim Backup müssen zusätzliche Tapes und Bandlaufwerke gekauft werden. Um praxisnahe Resultate zu erhalten wurden in dieser Arbeit notwendige Reinvestitionen unter Berücksichtigung der Preiserosion (geschätzt) eingesetzt. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 21 von 33 Case Study – Next Generation Storage SOLL Analyse Konzept / Infrastruktur Es soll ein Mail- & Filesystemarchiv mit Nearline Storage (ohne Exchange Journal Archiving) implementiert werden, welches für beide Standorte verwendet werden kann. Eine LAN Verbindung zwischen den beiden Data Centers besteht ebenfalls mittels eines Inter Switch Links (ISL von 1GB). Übersicht Wir haben nachstehend die Archivierungslösung in unser Modell eingebaut. Jede Nacht holt sich der eVault Archivierungsserver mittels dem MAPI Portokoll die zu archivierenden (gemäss Regeln) Mailobjekte vom Exchange Server ab und indexiert sie auf dem SQL Server. Die Objekte werden dann auf dem Nearline Storage abgelegt, der Exchange Server erhält einen Place Holder. Analog funktioniert dies mit den Files, die archiviert werden. Sie werden vom Online zum Nearline Storage verschoben, diese werden auf dem SQL Server indiziert und auf dem ursprünglichen Speichersystem bleiben Verknüpfungen übrig. Anfragen auf archivierte Objekte, werden dann vom eVault Server beantwortet. Legende: SRV Server EXC Exchange FIL File DB Data Base IIS Internet Information Server UNX Unix LAN Local Area Network FC-SAN Fibre Channel – Storage Area Network IP-SAN IP based Storage Area Network mittels iSCSI Protokoll LOC1 Standort 1 LOC2 Standort 2 CIFS Zugriffsprotokoll unter Windows ODBC Schnittstelle für Database Connection MAPI Protokoll um auf Exchange Server zuzugreifen eV Enterprise Vault (Archivierungsserver) 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 22 von 33 Case Study – Next Generation Storage LOC 2 LOC 1 Tape Library Tape Library Brocade FC Switch FC-SAN (NDMP) Filer 3 Online Storage BCK SRV FC Switch FC-SAN (NDMP) Nearline Storage Filer 2 Online Strage BCK SRV SQL SRV Filer 1 Online Storage EXC SRV FILE SRV CIFS EXC SRV ODBC CIFS Mail Obj. HTTPS iSCSI Altavista CIFS IP-SAN (iSCSI) Ethernet Switch eV SRV IP-SAN (iSCSI) MAPI EXC SRV DB SRV IIS SRV Ethernet Switch UNX SRV HTTPS LAN LAN Client Client LOC 2 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser LOC 1 Seite 23 von 33 Client Case Study – Next Generation Storage Kosten Die Kosten werden realistisch, gemäss empfohlenem Solution Design (eVault-Archiv-, SQL-Index-Server und Nearline Archivespeicher), berechnet. Der Fokus liegt in der gesamtheitlichen Betrachtung mit konkreten Werten aus Offerten, welche bereits im Vorfeld eingeholt wurden. KOSTENKALKULATION Hardware Position Archivserver Indexserver Archivspeicher Verwendungszweck / Bemerkung (eVault SRV) 4 CPUs, 8GB RAM (SQL Index SRV) 2 CPUs, 4GB RAM (Nearline Storage) inkl. Lizenzen & 3j Wart., CHF 40'000 12'000 200'000 Subtotal 252'000 Software Position Win 2k3 EE Win 2k3 SE SQL Standard Edition KVS eV Archiving Engine KVS eV Mailbox Archiving KVS eV File System Archiving Subtotal Verwendungszweck / Bemerkung (eVault SRV) inkl 3j SW-Assurance (SQL Index SRV) inkl 3j SW-Assurance (SQL Index SRV) inkl 3j SW-Assurance eVault Archiving Engine für 5000 User eVault Archiving Mailbox Archiving für 5000 User eVault File System Archiving für 5TB (income) Daten Projekt Position Beratung/Engineering Engineering/Implement. Subtotal Verwendungszweck / Bemerkung 15 Tage à 2000chf (extern) 30Tage à 1000chf (intern) TOTAL EINMALIGER INVEST CHF 6'000 1'000 1'000 270'000 25'000 303'000 CHF 30'000 30'000 60'000 CHF 615'000 Administration, SW-Wartung Position Verwendungszweck / Bemerkung Admin Man Power 0.5 Manntage à 150'000chf/jahr KVS eVault, Support 1j Maintenance/Phone Support (18% der Σ Lizenzkosten) Subtotal TOTAL JÄHRLICHE KOSTEN CHF 75'000 53'100 128'100 CHF 128'100 Angefertigte Budgeteingabe unter alleiniger Betrachtung der Implementierung für Siemens Schweiz AG. Die genauen Zahlen, welche für die konkrete Realisierung massgebend sind, sind dem Berechnungsmodell im Anhang zu entnehmen. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 24 von 33 Case Study – Next Generation Storage Datenverdrängung durch Archivierung Archivierung von eMails: • eMails > 14d & > 0KB • eMails > 7d < 14d & >1024KB Online Storage: EXCHANGE SERVER Archiv: NetApp R200 Online Storage: FILE SERVER Archivierung von allen PST Files und Files, welche älter als 6 Monate sind Verdrängung von Maildaten Durch Einführung der eVault können sämtliche PST Dateien ins Archiv verlagert werden. Dieser einmalige Vorgang führt bereits zu einer Datenverdrängung von rund 1.5TB. Gleichzeitig können Policies eingerichtet werden, wann welche Mails archiviert werden sollen. In dieser Arbeit wurden folgende Archivierungsregeln angenommen: • Archivierung von sämtlichen eMails, welche älter als 14 Tage sind • Archivierung von eMails, welche zwischen 7 und 14 Tage alt und grösser als 1024kB sind Bei der Archivierung der Exchange Daten gibt es eine zusätzliche Kompression der Daten. Diese wird bei Single Instance hergestellt. Dies bedeutet, dass eine eMail, welche intern an mehrere Personen versandt wird, nur ein Mal im Archiv gespeichert wird. Single Instance ist bei Exchange Daten sehr sinnvoll, dass jede Mail mindestens zwei Mal gespeichert wird (Outbox des Senders, Inbox des Empfängers). Vor allem bei Attachements wird eine enorme Einsparung an Speicherbedarf erzielt. Die Verdrängung wird auf 80% berechnet. Die Exchange Server besitzen bereits Single Instance für Mails und Anhänge, allerdings nicht zwischen den verschiedenen Servern. Deshalb wurde als zusätzliche Reduzierung des Speicherbedarfs um 20% für SCH bzw. 40% für SBT angenommen. Verdrängung von Filedaten Ähnlich wie bei den Exchange Daten, gibt es auch bei der File Archivierung eine einmalige und eine wiederkehrende Verdrängung. Auch hier müssen Archivierungsregeln aufgestellt werden, welche Files wann archiviert werden sollen. In dieser Arbeit wurde folgende Archivierungsregel aufgestellt: • Archivierung aller Files, die älter als 6 Monate sind Bei der einmaligen Verdrängung werden dadurch rund die Hälfte aller File Daten ins Archiv ausgelagert. Ebenfalls würde die Single Instance hergestellt, allerdings werden Files viel seltener mehrfach abgelegt als Mails. Als Komprimierungsrate für Filedaten wurden pauschal 10% eingesetzt. Dies entspricht in etwa der eigenen Kompression von eVault. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 25 von 33 Case Study – Next Generation Storage Business Plan Kosten Dienstleistersicht Um herauszufinden, ob die Implementierung einer Archivierung für den Dienstleister (Siemens Business Services) profitabel ist, haben wir die Kosten mit und ohne eVault gegenübergestellt. Der Focus ist auf 3 Jahre gelegt (2006-2008), welche orange hinterlegt sind. Kosten ohne eVault Storagekosten p.a. Backupkosten Gesamtkosten Jahr 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 1'154'793 1'165'317 1'214'763 993'445 1'460'752 1'587'820 1'587'820 1'082'581 920'958 1'079'190 2'742'612 2'753'137 2'297'345 1'914'403 2'539'942 Kosten mit eVault Storagekosten p.a. Backupkosten Gesamtkosten Jahr 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 1'154'798 1'548'317 1'390'751 886'742 711'266 1'587'820 1'587'820 1'082'581 778'463 890'821 2'742'617 3'136'136 2'473'333 1'665'205 1'602'087 Kostendifferenz mit/ohne eVault Jahr 0 Gesamtkostendiffernez 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 383'000 175'988 -249'197 -937'855 Einsparung durch Archivierung Enterprise Vault Einsparung durch Archivierung Enterprise Vault (bis Jahr 3 / 2008) -628'060 309'795 (Auszug aus dem Berechnungsmodell) 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 26 von 33 Case Study – Next Generation Storage Kosten Kundensicht Um herauszufinden, ob die Implementierung einer Archivierung für den Kunden (Siemens Schweiz und Siemens Building Technologies) profitabel ist, haben wir die Kosten mit und ohne eVault gegenübergestellt, allerdings noch die Opportunitätskosten mit einbezogen. Der Focus ist auf 3 Jahre gelegt (2006-2008), welche orange hinterlegt sind. Kosten ohne eVault Storagekosten p.a. Backupkosten Opportunitätskosten Gesamtkosten Jahr 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 1'154'793 1'165'317 1'214'763 993'445 1'460'752 1'587'820 1'587'820 1'082'581 920'958 1'079'190 50'080'000 69'547'500 90'100'000 111'737'500 134'460'000 52'822'612 72'300'637 92'397'345 113'651'903 136'999'942 Kosten mit eVault Storagekosten p.a. Backupkosten Opportunitätskosten Gesamtkosten Jahr 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 1'154'798 1'548'317 1'390'751 886'742 711'266 1'587'820 1'587'820 1'082'581 778'463 890'821 50'080'000 31'680'000 48'960'000 67'200'000 86'400'000 52'822'617 34'816'136 51'433'333 68'865'205 88'002'087 Kostendifferenz mit eVault Gesamtkosten Jahr 0 0 Jahr 1 Jahr 2 Jahr 3 Jahr 4 -37'484'500 -40'964'012 -44'786'697 -48'997'855 Einsparung durch Archivierung Enterprise Vault -172'233'060 Einsparung durch Archivierung Enterprise Vault (bis Jahr 3 / 2008) -123'235'205 (Auszug aus dem Berechnungsmodell) 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 27 von 33 Case Study – Next Generation Storage Fazit Wie bereits aus dem Business Plan ersichtlich ist, kann nicht eindeutig von einem profitablen Geschäft für den Dienstleister gesprochen werden. Die jährlichen Kosten sind so hoch, dass eine Kostenoptimierung nach 5 Jahren sehr spekulativ ist. Es sind einfach zu viele Faktoren, welche geschätzt und nicht eindeutig sind (Wachstumsrate, Umsatzsteigerung, Storage Preise, …). Als in sich geschlossene Finanzanlage würden wir also davon absehen. Zudem müsste der jährliche „Ertrag“ noch abdiskontiert werden, was die minimal notwendigen Ergebnisse in den späteren Jahren noch mehr schmälert. Doch gibt es sehr wohl Punkte, die für eine Realisierung sprechen: • • • • • Bessere Skalierbarkeit mit Archiv Innovationsführer mit Archiving im Outsourcing Bereich KnowHow Aufbau für Speicherwachstum in Zukunft (5-10J) gewappnet für gesetzliche Anpassungen wie Journaling etc. mandatenfähige Infrastruktur Es lässt sich sogar die Frage stellen, ob Siemens Business Services als Dienstleister es sich überhaupt leisten kann, kein Archiving in seinem Dienstleistungsportfolio zu haben. Im Sinne von: • • • Total Outsourcing (als IT Generalunternehmung) Eventuell als Türöffnerprodukt Um internationale Kunden auch im europäischen Raum (mit bald strengeren gesetzlichen Bestimmungen) mit IT zu versorgen Die immense Einsparung aus Kundensicht, welche mittels Enterprise Vault erzielt wird, würde die Realisation der Archivierung rechfertigen. Es ist klar, dass dies weiche Faktoren sind, auch wenn sie tief (3min pro Tag) angesetzt sind. Man müsste also die Archivierung als zusätzliches Feature kaufen/verkaufen und die damit verbundenen Mehrkosten mit den fiktiven Opportunitätskosten (welche noch viel grösser sind) rechtfertigen. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 28 von 33 Case Study – Next Generation Storage Literaturverzeichnis / Hilfsmittel Bei unserer Arbeit stützen wir uns auf folgende Quellen: Bücher / Dokumente / Unterlagen - Storage Manifesto (Horison Information Strategies / StorageTek) - Backup-Konzept Projekt Match 2 / Phase I - Diverse alte Bestellungen - Diverse Auszüge aus dem Anlagevermögen - Diverse Offerten - Produktinformationen eVault Internet - http://www.speicherguide.de - http://www.horison.com - http://www.adic.com Software - Microsoft Word 2003 & Excel 2003 - EV Store Reporter - Diverse Scripts, um die Datenerhebung zu verdichten Grafiken [1] The INfusion Paradox Storage Manifesto, Horison, Seite 9 [2] Langzeitarchivierung Website adic.com, StoreNext Storage Manager [3] eVault Mail Archiving eV Präsentation, KVS, Folie 17 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 29 von 33 Case Study – Next Generation Storage Schlusswort Zur Case Study Diese Fallstudie verbindet die Themen des Storages und Backups (Informatik) mit der Kostenkalkulation und Rentabilitätsrechnung (Betriebswirtschaft). Ein ideales Derivat für zwei Wirtschaftsinformatikstudenten. Die Arbeit war durch die neue Technologie der Archivierung sehr interessant und durch die verschiedenen Meetings und Workshops sehr abwechslungsreich. Mit der zunehmenden Auseinandersetzung des Themas wurde die Materie allerdings immer komplexer. Zum einen haben viele Zahlen gefehlt, Faktoren mussten bestimmt oder andere Annahmen getroffen werden. Wir konnten uns durch das strukturierte Vorgehen und die systematische Erarbeitung von Wachstumsraten, Verdrängungsfaktoren, usw. ans Ziel herantasten und versuchten schrittweise an Detailierungsgrad zu gewinnen. Anstelle von zahlreichen Excel Files, welche wir dann in dieses Dokument einfügen, haben wir uns entschlossen ein einziges Excel File als Berechnungsmodell zu kreieren, in welchem möglichst alle Faktoren dynamisch miteinander verknüpft und mit Kommentaren versehen sind. So ist es möglich, nachträglich gewisse Anpassungen vorzunehmen, ohne die statischen Screenshots ersetzen zu müssen. Bestandteile Unsere Case Study besteht hauptsächlich aus zwei Teilen: • Die Dokumentation, die Sie im Moment vor sich liegen haben • Das Berechnungsmodell, welches Sie ausgedruckt im Anhang vorfinden. Online Adresse Die öffentliche Version wird ab Mai unter folgender Adresse erreichbar sein: http://www.escher.bz/ngs Username: casestudy Password: pwd4study 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 30 von 33 Case Study – Next Generation Storage Elektronische Form Hier sind sämtliche, auch weiterführende, Unterlagen der Case Study auf CD-Rom abgespeichert: 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 31 von 33 Case Study – Next Generation Storage Glossar Hier befinden sich die Erläuterungen zu den manchmal doch sehr fachtechnischen Abkürzungen: NAS Network Attached Storage Speicher, welcher direkt in das Netzwerk integriert wird. Diese Speichergeräte besitzen eigene Prozessoren und Betriebssysteme, welche allerdings nur für den Betrieb des Speichermediums gedacht sind, nicht um Applikationen auszuführen. SAN Storage Area Network Ein spezielles, sehr schnelles Netzwerk (Fibre Channel), welches die Server mit den Speichermedien verbindet. Durch die Trennung des Speichers vom Server wird Speicher zentralisiert, effizienter und besser verwaltbar. FAS Fabric Attached Storage Analog zu NAS, jedoch mit iSCSI anbindbar über Fabric, also geswitches SAN. NDMP Network Data Management Protokoll Das Network Data Management Protocol gehört der TCP/IP-Protokoll-Familie an. NDMP übermittelt grosse Datenmengen in Blockebene. Mittels NDMP kann ein LANless Backup gemacht werden, was einerseits eine enorme Entlastung für das LAN und andrerseits einen uneingeschränkten Datendurchsatz bedeutet. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 32 von 33 Case Study – Next Generation Storage CIFS Common Internet File System Das Common Internet File System basiert auf dem Server Message Block Dienst (SMB) und ermöglicht Datenlaufwerke in einem Netzwerk freizugeben. Dieses Protokoll wurde einst von Microsoft entwickelt und definiert wie die Clients mit dem Server kommunizieren (Netzlaufwerk-Browsing). HSM Hierarchisches Speichermanagement Das traditionelle HSM dient der automatischen Migration von Dateien, auf die eine bestimmte Zeit nicht zugegriffen wurde, von schnellen Online-Festplattenspeichern auf langsamere, billigere Speicher wie optische Jukeboxen oder Bandlaufwerke. Einige HSM-Systeme bieten noch eine dritte Migrationsstufe auf 8mm Tape oder CD-ROM. Das HSM in Information Warehouse Systemen dient der Übertragung und Bereitstellung von Informationen in verteilten Umgebungen. Das HSM in Document Imaging und Dokumenten-Management-Systemen dient der schnellen Bereitstellung abgelegter oder archivierter Dokumente. Das HSM sorgt insbesondere für den schnellen Transport großer Dokumentenmengen und zur Zwischenspeicherung aktuell benötigter Informationen. PST Personal Folder Store Der Personal Folder Store ermöglicht einem Outlook Benutzer einen eigenen Ordner entweder bei sich lokal oder auf einem Netzlaufwerk zu erstellen und darin seine Mailobjekte abzuspeichern. Diese PSTs sind als eine Art Datenbank aufgebaut und können je nach Outlook Version bis 2GB (Outlook 2000) oder sogar unbegrenzt (Outlook 2003) gross sein. Der Nachteil eines PST auf einem Netzlaufwerk ist, dass es bei einem Zuwachs eines einzelnen Mails von wenigen Kilobytes bereits wieder in den Backupprozess eingeschleust wird. Dabei werden teure Backupmedien verbraten und wertvolle Zeit des Backupfensters verschwendet. Ist das PST hingegen auf dem lokalen Disk, besteht die Gefahr, dass gar nie eine Datensicherung angefertigt sind. Bei Defekt oder Diebstahl des Laptops sind somit wertvolle Unternehmensdaten verloren. Das Erzeugen von PST Dateien wird indirekt über die Grössenlimitierung der Mailbox auf dem Exchange Server provoziert. Der Benutzer muss also entweder seine Daten löschen oder mit PST Files primitive Archivierung betreiben. 18. Mai 2005 / Version 1.0_pub © Stefan Escher, Martin Manser Seite 33 von 33