Storage I Foto: Fotolia / Vladimir Caribb Infrastruktur Start-ups treiben den Speichermarkt Storage-Systeme 2016: Höher, schneller, weiter? Moderne Speicherlösungen setzen auf Flash-Speicher und Analyse-Software. S Alle lieben Flash eit jeher muss die IT-Infrastruktur eines Unternehmens Die meisten Flash-Systeme – seien es hybride Flash- oder Allvielfältigste Anforderungen erfüllen – sie unterstützt ProFlash-Arrays (AFA) – wurden anfangs eingesetzt, um die Perduktion, Verkauf, Marketing, Lieferanten- und Kundenkonformance für einzelne Anwendungen, zum Beispiel Datentakte, Buchhaltung und Rechnungswesen, Webseiten und banken oder VDI-Umgebungen (Virtual Desktop In­ vieles mehr. Daran hat auch die weit um sich greifenfrastructure), zu erhöhen. Aufgrund der positiven de Digitalisierung nichts Grundlegendes geänAuswirkungen für bestehende, oft wenig perfordert. Wohl aber hat sie die Geschäftsapplikatiomante Systeme haben sich in der Folge immer nen immer mächtiger und umfassender wermehr Unternehmen dafür interessiert, den Anden lassen, und immer schneller fallen immer der Unternehmen haben wendungsbereich von Flash-Systemen, vor almehr Daten an, die mit immer höherem Temmindestens zehn Kopien von jedem lem von All-Flash-Systemen, zu erweitern. po verarbeitet werden sollen. gespeicherten Zunächst waren es nur wenige Newcomer, Ein wesentlicher Baustein, um mit diesen HeDokument die diesen Wünschen der Anwender entgegenrausforderungen fertigzuwerden, ist die Modergekommen sind. Als führend haben sich hier laut nisierung der Speicherausstattung. Entscheidend Quelle: EMC IDC in erster Linie PureStorage mit FlashArray//m, Kamidabei ist: Fortschrittliche Speicher-Arrays sind nicht einnario mit K2 und Violin Memory mit Flash Storage Platform fach nur große Bündel von Festplatten, Flash-Storage oder einen Namen gemacht. als hybride Arrays eine Mischung aus beidem, sondern sie EMC, HPE oder IBM geben es nicht gern zu, aber ihr rückunterscheiden sich vor allem in dem, was die einzelnen Herläufiges Geschäft bei den traditionellen Speicher-Arrays ist steller an Software hinzupacken. 82 % 58 7/2016 com! professional Storage I Infrastruktur Foto: DataCore hauptsächlich durch den Erfolg der Flash-Konkurrenz verurseinem cloudbasierten Predictive-Analytics-Tool Info­Sight zusacht worden – trotz der zunächst höheren Preise pro Gigasätzliche Betriebssicherheit brachten. Inzwischen hat Nimble byte. sein Portfolio auch auf All-Flash-Storage ausgedehnt. (Zu Inzwischen haben aber fast alle traditionellen Hersteller Nimble siehe auch das Interview mit Nimble-CEO Suresh klassischer Platten-Arrays oder hybrider Arrays nachgezoVasudevan auf Seite 62.) gen: Zu nennen wären hier in erster Linie EMC Kaminario: 2008 gegründet, spezialisierte mit XtremIO, HPE mit 3PAR StoreServ 7450c und sich Kaminario auf High-End-Flash-Arrays StoreServ 20850, IBM mit FlashSystem A9000, mit einer Scale-out-Architektur, ausgestattet A9000R, StorwizeV7000F und dem High-Endmit DRAM-Technologie, womit hohe PerforSystem DS8888 sowie NetApp mit SolidFire SF mance und geringe Netzwerklatenzen mögSeries. lich wurden. Das Besondere an den hybriden und All-FlashAufgrund der relativ kostspieligen Systeme Arrays ist: Sie verfügen häufig über eine breite erreichte Kaminario zunächst nur einen gePalette an mitgelieferten Software-Funktionen ringen Marktanteil. Das Unternehmen änderwie Snapshots, Replikation, Komprimierung, Dete dann jedoch seine Strategie und setzte, wie duplizierung oder Thin Provisioning, ohne dass andere Flash-Hersteller auch, auf günstigere dafür Extralizenzen verlangt werden. Solid State Drives. Außerdem führte man „Das klassische Speichermodell ist Der tief greifende Wandel bei den großen StoSoftware-Features wie Deduplizierung und zusammengebrochen.“ rage-Herstellern wird auch an zwei weiteren Komprimierung ein. Entwicklungen sichtbar: Zum einen reagierten Der Scale-out- wurde eine Scale-up-ArchiGeorge Teixeira die Hersteller mit einer Akquisition nach der antektur hinzugefügt, sodass die Kunden jetzt CEO und Co-Founder von deren auf den Druck der zahlreich aufkommenbesser zwischen Performance- und KostenDataCore www.datacore.com den neuen Konkurrenten, um ihr Portfolio an anforderungen auswählen können. Gartner Speicherprodukten vor allem in Richtung Flash Research bewertet Kaminario deshalb als zu erweitern. Zum anderen entdeckten sie plötzsehr positiv und empfiehlt die Lösung für Dalich reihenweise ihre Sympathie für offene Systeme und tenbanken, virtuelle Server, VDI-Umgebungen, Big Data/ Schnittstellen. Fast alle namhaften Hersteller sind mittlerweiAnalytics und Life Sciences – überall dort, wo ein großes Dale zum Beispiel in der einen oder anderen Form bei Opentenaufkommen zu erwarten ist. Stack dabei (mit Funding-Geldern und/oder EntwicklungsHedvig: Das noch sehr junge Start-up – Hedvig wurde 2012 beiträgen für die Open-Source-Software). gegründet und ging im März 2015 mit seinem ersten Produkt Und sogar EMC – in der Vergangenheit alles andere als an die Öffentlichkeit – wird von Gartner zu den „Cool Ven„open“ ausgerichtet – hat 2015 auf seiner Kundenveranstaldors in Storage Technologies 2016“ gezählt. tung EMC World in Las Vegas eine Open-Source-Version Mit seiner Distributed Storage Platform liefert Hedvig eine (Project CoprHD) seiner proprietären Controller-Plattform Unified Platform, die Commodity-Hardware (x86 und ARM) ViPR vorgestellt. Ebenfalls noch 2015 wurde mit EMC {code} sowie verschiedene Hypervisor-, Container- oder Cloudein weiteres offenes Projekt präsentiert, das auf die EntwickPlattformen unterstützt. lung von DevOps, Open Source und Open Communities foDie Lösung kann entweder in einem Hyperscale-Modus kussiert ist. mit getrennter Speicher- und Rechenfunktionalität installiert Im Folgenden stellen wir die interessantesten Start-ups aus werden oder als hyperkonvergentes System, in dem Storage▶ der Storage-Szene kurz vor – zunächst Spezialisten für Flashund Rechenprozesse eng verzahnt sind. Speicher, dann Firmen, die im Bereich Datenmanagement und Datenanalyse neue Wege gehen. Flash-Spezialisten PureStorage: Das Start-up aus dem kalifornischen Mountain View war einer der ersten Anbieter von All-Flash-Arrays überhaupt. Viele Unternehmen überzeugte Pure­Storage darüber hinaus durch seine herausragenden Service-Leistungen und aktiven Hilfestellungen bei der Installation der Systeme. (Zu PureStorage siehe auch die Case-Study über die Einführung seiner All-Flash-Arrays beim Dentalspezialisten KaVo auf Seite 66.) Nimble Storage: Das 2008 von Varun Mehta und Umesh Maheshwari gegründete Start-up kam 2010 mit CS2000, einer Serie hybrider Arrays, auf den Markt. In nur sechs Jahren gelang es Nimble, über 7500 Kunden zu gewinnen, nicht zuletzt, weil fest eingebaute Monitoring- und Service-Funktionen in : to Fo IBM v9000: Auch der IT-Riese hat All-Flash-Arrays für sich entdeckt. com! professional 7/2016 59 M IB Infrastruktur Storage I Neben Standardprotokollen und APIs für Speicher – da­ runter iSCSI, NFS, Amazon Simple Storage Service (S3), Swift und SMB – unterstützt Hedvig das OpenStack-Block-StorageProjekt Cinder sowie Fuel Drivers für OpenStack von Mirantis. Treiber für Docker und vCenter von VMware gehören ebenfalls zur Ausstattung. Die Kunden erhalten also eine große Bandbreite gemischter Konfigurationen. Der gesamte Speicherbereich mit Provisioning von Block-, File- und Object-Storage wird dabei als gemeinsamer Pool verwaltet. Rubrik: Auch in der Backup-Szene, in der es lange keine Bewegung gab, sind jüngst neue Initiativen zu verzeichnen. So hat das ebenfalls sehr junge Start-up Rubrik Mitte 2015 eine integrierte All-in-one-Backup-Appliance vorgestellt. Das für Scale-out-Zwecke geeignete Produkt soll die komplexen Backup-Infrastrukturen von Unternehmen vereinfachen: Dazu installiert es ein agentenloses, Policy-basiertes BackupManagement und legt über ein Tiering der Backup-Module die langfristig aufzubewahrenden Daten auf kostengünstigen externen Speichersystemen ab (zum Beispiel in einer Cloud). Klassische Backup-Software kommt dabei nicht zum Einsatz, die Appliance setzt hier auf eine Eigenentwicklung. Rubrik verwendet am Backup-Ort nach dem anfänglichen vollen Backup eine Inline-Deduplizierung und arbeitet danach mit inkrementellen Forever-Backups. Virtuelle Kopien Hedvig: Gartner zählt das Start-up zu den „Cool Vendors in Storage Technologies 2016“. werden in ihrem ursprünglichen Format abgespeichert, was sofortige Lese-/Schreibprozesse für ein schnelles Recovery erlaubt. Die Appliance erzeugt zudem einen globalen Metadaten-Index des Backups. Das ermöglicht eine schnelle Suche auf allen Tiering-Stufen bis hin zum Archiv. Auf der Hardware-Seite sorgt eine Scale-out-Architektur mit einem verteilten File-System für die automatische Erweiterung der Rechen- und Speicherressourcen. Cognitive Storage – die nächste Stufe der Evolution? Forscher am Institut „IBM Research“ in Zürich skizzieren in der April-Ausgabe der IEEE-Zeitschrift „Computer“ in ihrem Aufsatz „Cognitive Storage for Big Data“ eine neue Stufe der Speichertechnologie. Sie behaupten, die Effizienz von Speichersystemen ließe sich signifikant verbessern, wenn der Wert der gespeicherten Daten eindeutig festgelegt werde. Vorbild für diesen „Datenwert“ ist der Wert von Kunstwerken – dort gilt: Je höher die Nachfrage und je seltener ein Werk, desto höher ist sein Wert und desto stärker muss es gesichert werden. Würden zum Beispiel 1000 Mitarbeiter jeden Tag auf die gleichen Dateien zugreifen, dann wäre der Wert dieses Datensets sehr hoch. Ein kognitives Speichersystem würde dies erkennen und die Files automatisch auf schnellen Medien wie Flash ab­ legen. Zusätzlich würde das System sie automatisch mehrfach speichern. Und schließlich würden diese Dateien so gesichert, dass niemand ohne Berechtigungsnachweis auf sie zugreifen könnte. Natürlich gibt es auch das Gegenteil. Ein Datenset, auf das selten zugegriffen wird – etwa PDFDateien mit 20 Jahre alten Steuerunterlagen –, sollte automatisch auf „kalten“ Medien wie Tapes gespeichert und Foto: IBM Research Forschergeist: Jens Jelitto, Co-Autor des Reports „Cognitive Storage for Big Data“ 60 nur auf Anfrage zugänglich gemacht werden. Ein kognitives Speichersystem würde auch wissen, dass Steuerunterlagen eine bestimmte Anzahl an Jahren aufbewahrt werden müssen und danach gelöscht werden können. Eine Möglichkeit, den Wert von Dateien zu bestimmen, besteht den IBM-Forschern zufolge im Tracking der Zugangsmuster oder der Häufigkeit, in der sie geöffnet werden. Auch könnten die Anwender den Dateien Metadaten-Tags hinzufügen, um das System bei seinem Lernprozess zu unterstützen. Zum Beispiel könnte ein Astronom ein Datenset, das von der Andromeda-Galaxie kommt, je nach seiner Einschätzung mit einem Tag „besonders wichtig“ oder „weniger wichtig“ versehen. Die IBM-Forscher haben ihren Cognitive-Storage-Ansatz mit sieben Anwendern und 1,77 Millionen Files ausprobiert. Sie setzten ein einfaches, auf Metadaten beruhendes Ranking mit den Klassen 1, 2 und 3 ein. Dazu gehörten: User-ID, Gruppen-ID, Dateigröße, Zugangsberechtigungen für die Datei, Datum und Zeit der Entstehung, File-Extension und Verzeichnispfade. Dann teilten sie die Server-Daten pro User auf, wobei jeder Anwender File-Klassen bestimmen konnte, die ihm wichtig erschienen. Nach Ansicht der Forscher sind bestehende Speichersysteme wie Software-defined Storage oder Tiering nicht in der Lage, automatisch den Wert von Daten zu bestimmen. In der Regel erfordert es noch manuelle Eingriffe der Administratoren, um den Speicherplatz von Dateien gemäß ihrem wirklichen Wert zu bestimmen. Ein Problem sehen sie auch darin, dass bislang Sicherheitsvorkehrungen oft noch nach dem Zufallsprinzip vorgenommen werden – was ein riesiges Einfallstor für Hacker bedeutet, die auf der Suche nach wichtigen Daten sind. 7/2016 com! professional Storage I Datenmanagement und -analyse die Konzerne aber kein Interesse an einer Verwirklichung – so kam es in der Regel nur zu einem Lock-in mit SANs aus einem Herstellerhaus. Insofern ist EMC mit der Open-SourceVersion von ViPR nun dem DataCore-Modell gefolgt. Diese neue Entwicklung ist ein Indiz dafür, dass sich EMC unter dem Druck zurückgehender Margen zumindest partiell zu einem „offenen“ Speicheranbieter gewandelt hat. Die neueste Version von SANsymphony-V erlaubt es Multi­Core-Servern, die geballte Prozessorkraft aller Cores für mehrere parallele Workloads zu verwenden, um so Engpässe zu vermeiden und die Performance der Systeme deutlich zu erhöhen. Die Software SANsymphony-V Adaptive Parallel I/O ermöglicht es damit, mehrere Anfragen von virtuellen Maschinen (VMs) oder Applikationen gleichzeitig zu bearbeiten. Die neuen Storage-Produkte bieten Vorteile an beiden klassischen Polen der Speichertechnologie – Performance (Datengeschwindigkeit) und Kapazität (Datenmenge). Darüber hinaus erhalten die Anwender immer mehr Möglichkeiten, auch direkt – ohne aufwendige und kostspielige Tools für Business Intelligence und Data Warehouses – die Inhalte der gespeicherten Daten zu durchsuchen, zu systematisieren und zu analysieren. Qumulo: Das Start-up bietet mit Qumulo Core ein Scale-out-NAS, das sehr große Datenmengen von File und Object Storage verwalten kann. Die Software läuft auf Commodity-Hardware oder virtuellen Maschinen. Mit seinen Analytics-Funktionen können die Unternehmen besonders wertvolle Daten suchen und ihre Speicherorte und die dazugehörigen Zugangsberechtigungen feststellen. Als Ergebnis der Analytics-Prozesse kann bestimmt werden, welche Daten sich ohne Weiteres löschen lassen. Die Cluster-Struktur von Qumulo passt sich laut Hersteller an das Da- Elefantenhochzeit: Michael Dell (rechts), Gründer des gleichnamigen Konzerns, tenwachstum an. Integriert sind ferner klas- übernimmt EMC, das seit vielen Jahren von Joe Tucci (links) geführt wird. sische Backup- und Archivierungsaufgaben. Die Relevanz von Datenanalysen hat auch Teixeira schreibt in einem Whitepaper: „Viele Hersteller haein Speicherkonzern wie EMC erkannt. Auf der EMC World ben versucht, das Performance-Problem auf der Geräte-Ebe2016 stellte EMC mit Enterprise Copy Data Management ne durch Hinzufügen von Solid-State Storage (Flash) anzuge(eCDM) ein Tool zum Aufspüren und Löschen von Dateiduhen, um die wachsenden Ansprüche der Business-Applikatiplikaten vor, das im dritten Quartal dieses Jahres ausgeliefert onen zu erfüllen. Oder sie haben diese schnellen Geräte in hywerden soll. Die Software, die es zunächst nur für proprietäperkonvergenten Systemen eng mit VMs verknüpft. Die Perre EMC-Umgebungen gibt, bietet Funktionen für automatiformance der Speicher nur durch den Austausch sich drehensches Monitoring, Management und Analytics von Dateien. der Platten durch Flash zu steigern, berücksichtigt jedoch nur Das eCDM-Tool ergänzen soll Enterprise Copy Data Anaeinen Aspekt des I/O-Stacks – die Lese-Performance.“ lytics (eCDA) als Analytics as a Service. Es soll „den notwenDie Komplexität der Speicherprozesse in den Griff zu bedigen tieferen Einblick in die Dateninhalte und -strukturen kommen – Kapazität versus Performance und Dateninhalte – liefern“, so Caitlin Gordon, Director Product Marketing und ist eine Aufgabe, die heute von sehr vielen Herstellern unterData Protection bei EMC, gegenüber com! professional. schiedlicher Provenienz wahrgenommen wird. Die AnwenDataCore: Für den CEO und Co-Founder von DataCore, der haben es insofern einfacher als früher, sich nicht zu sehr George Teixeira, war die Einführung der EMC-Software an einen einzigen Hersteller zu binden und neue Konzepte ViPR „das Signal dafür, dass das traditionelle Speichermodell einzusetzen. Hinzu kommen die Möglichkeiten, über zeitlich zusammengebrochen“ ist. Er erkannte das Potenzial von Softbegrenzte oder längerfristige Verträge mit Providern von ware-defined Storage auf der Basis von Commodity-HardCloud Storage deren technologische Fähigkeiten zu nutzen – ware. Data­Core, 1998 gegründet und noch in Privatbesitz, und Kostenvorteile einzustecken. Die Cloud wird immer sieht sich gut positioniert für diese neue Ära der Storage-Inmehr zu einer ernsthafdustrie. Sein Kernprodukt SANsymphony war von Anfang an ten Alternative zum Eindarauf ausgelegt, über eine Software-Schicht Speicher-Arrays satz von Speicher im eiunterschiedlichster Hersteller in einem Pool zu verwalten. Hartmut Wiehr/js genen Rechenzentrum. Diese Form eines herstellerübergreifenden Storage Area [email protected] Aber das ist eine andere Networks (SAN) war von Herstellern wie EMC, HP oder IBM ◾ Geschichte. zwar immer wieder versprochen worden, eigentlich hatten com! professional 7/2016 61 Foto: EMC Insgesamt ersetzt Rubrik das traditionelle jobbasierte Backup-Management durch ein Policy-basiertes SLA-Management. Rubrik ist mit dem Motto „We will kill backup“ angetreten. Es bleibt abzuwarten, wie die etablierten Backup-Anbieter, die in den letzten Jahren schon viele neue Features zu ihren Produkten hinzugefügt haben, reagieren werden. Infrastruktur