Validierung durch ESG Lab Bericht EMC Data Domain und Avamar Performance und Effizienz der Datensicherheit in VMware-Umgebungen Autor: Kerry Dolan, Lab Analyst Oktober 2015 © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 2 Inhalt Einführung .................................................................................................................................................... 3 Hintergrund .............................................................................................................................................................. 3 Validierung durch ESG Lab ............................................................................................................................ 6 Einfachheit der Integration....................................................................................................................................... 6 Performance und Effizienz........................................................................................................................................ 9 Highlights der Validierung durch ESG Lab .................................................................................................. 17 Wichtige Aspekte ........................................................................................................................................ 17 Die ganze Wahrheit .................................................................................................................................... 18 Anhang ........................................................................................................................................................ 19 ESG Lab Reports ESG Lab Reports sollen IT-Experten über Technologieprodukte für Rechenzentren informieren, die für Unternehmen jeder Art und Größe geeignet sind. ESG Lab Reports sind nicht dafür vorgesehen, den Bewertungsprozess vor der Kaufentscheidung zu ersetzen, sondern sollen lediglich Einblicke in diese neuen Technologien vermitteln. Unser Ziel ist es einige wertvollere Produktfunktionen durchzugehen, zu zeigen wie sie bei Lösung echter Kundenprobleme und der Identifizierung der Bereiche, die Verbesserung benötigen, verwendet werden können. Die Sicht von Drittanbietern des ESG-Laborexperten basiert auf unseren eigenen praktischen Tests, sowie auf Interviews mit Kunden, die diese Produkte in Produktionsumgebungen verwenden. Der vorliegende Bericht von ESG Lab wurde von EMC gesponsert. Alle Marken sind das Eigentum ihrer jeweiligen Inhaber. Die in diesem Dokument enthaltenen Informationen stammen aus Quellen, die von The Enterprise Strategy Group (ESG) als vertrauenswürdig eingestuft werden. Eine Gewähr kann jedoch von ESG nicht übernommen werden. Dieses Dokument kann Meinungen von ESG wiedergeben, die sich von Zeit zu Zeit ändern können. Das Dokument ist von The Enterprise Strategy Group, Inc. urheberrechtlich geschützt. Jegliche Vervielfältigung oder Verbreitung dieses Dokuments, ob ganz oder in Teilen, in gedruckter, elektronischer oder sonstiger Form an nicht Empfangsberechtigte ohne die vorherige schriftliche Genehmigung von The Enterprise Strategy Group, Inc. stellt eine Verletzung des US-amerikanischen Urheberrechts dar und wird zivil- bzw. strafrechtlich verfolgt. Falls Sie Fragen haben, wenden Sie sich bitte unter der Rufnummer +1 508 482-0188 an ESG Client Relations. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 3 Einführung Der vorliegende Bericht dokumentiert praktische Tests und die Validierung einer Datensicherheitslösung von EMC für virtuelle Umgebungen. Testkriterien für die aus Avamar Virtual Edition und einem Data Domain-System bestehende Lösung waren Einfachheit der Integration, Effizienz, Skalierbarkeit und Performance von Backup/Wiederherstellung. Hintergrund Von ESG mithilfe von IT-Experten durchgeführte Umfragen ergeben seit fünf Jahren konsistent die gleichen wichtigsten IT-Prioritäten: Verbesserung von Backup und Recovery der Daten, Management des Datenwachstums und vermehrter Einsatz der Servervirtualisierung. In der von ESG durchgeführten 2015 IT Spending Intentions Survey wurden nur Initiativen im Bereich Informationssicherheit noch häufiger genannt (siehe Abbildung 1).1 Eine Herausforderung für Unternehmen ist die enorme Auswirkung des Datenwachstums auf Backup und Recovery von Daten: Ständig wachsende Datenmengen verlängern Backupzeitfenster und Recovery-Zeiten – oft in einem so hohen Ausmaß, dass Produktionsaktivitäten betroffen sind – und erfordern immer mehr Back-end-Speicher. Abbildung 1. Die am häufigsten genannten 10 wichtigsten IT-Prioritäten 2015 Top 10 mostDie important IT priorities over the next 12 kommenden months. (Percent of respondents, 10 wichtigsten IT-Prioritäten für die 12 Monate N=601, ten responses accepted) (Prozent der Befragten, N=601, zehn Antworten möglich) Initiativen zur Verbesserung der Information security initiatives Informationssicherheit 34 % 34% Improving data backupund andRecovery recovery Verbesserung von Backup 26 % 26% ManagementManaging des Datenwachstums data growth 26% 26 % Stärkere Nutzunguse derofServervirtualisierung Increasing server virtualization 25% 25 % Desktop virtualization Desktopvirtualisierung 25% 25 % Using cloud infrastructure services Einsatz von Cloudinfrastrukturservices 25% 25 % Initiativen zur Regulatory Einhaltung behördlicher Auflagen compliance initiatives 24 % 24% Programme für Business Continuity/Disaster Business continuity/disaster recoveryRecovery programs 23% 23 % Einrichtung Private-Cloud-Infrastruktur Buildingeiner a “private cloud” infrastructure 22 % 22% Verbesserung der Funktionen für die Improving collaboration capabilities Zusammenarbeit 22% 22 % 00% % 10% 10 % 20% 20 % 30% 30 % 40%% 40 Quelle: Enterprise Strategy Group, 2015. Eine zusätzliche Herausforderung für viele Unternehmen ist die Suche nach der besten Lösung zum Schutz ihrer ständig wachsenden Zahl virtueller VMware-Maschinen (VMs). Jede VM erfordert einen eigenen Backupjob – eine bei Skalierung schwierige Aufgabe. Herkömmliche Backuplösungen sind nicht auf die gemeinsame Ressourcennutzung der VMs ausgelegt und gefährden die Einhaltung von SLAs. Bei VM-Backups werden oft redundante Betriebssystem-, Anwendungs- und File-basierte Daten gesichert. Aufgrund der enormen Datenmengen können Backups nicht immer innerhalb des Backupzeitfensters abgeschlossen werden, ohne dass einige VMs 1 Quelle: ESG Research Report, 2015 IT Spending Intentions Survey, Februar 2015. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 4 ungeschützt bleiben. Das Management all dieser Backups kann sich als operativer Albtraum erweisen. Eine weitere Herausforderung besteht darin, dass separate physische und virtuelle Backups die Anschaffung und das Management zusätzlicher Server, Speicher und Software erfordern, wodurch Kosten und Komplexität in die Höhe getrieben werden. EMC Data Domain und Avamar Diese Datensicherheitslösung von EMC besteht aus der Kombination der einfachen und effizienten Backup- und Recovery-Software Avamar mit dem leistungsstarken, skalierbaren und effizienten Data Domain-System. Data Domain Data Domain-Systeme sind hochskalierbare, speziell entwickelte Datenschutzspeicher-Appliances. Sie bieten eine schnelle Deduplizierung für Backup und Archivierung sowie Replikationsfunktionen für Disaster Recovery. Die Modelle dieser Serie lassen sich bis auf eine logische Kapazität von 86,4 PB skalieren. Durch die Deduplizierung mit variabler Länge werden Deduplizierungsraten maximiert, was zur Folge hat, dass Backup und Archivierung durchschnittlich 10- bis 30-mal weniger Speicher benötigen. Data Domain ist somit eine kostengünstige Alternative zu anderen Backup-Appliances und Backups auf Band. Diese Systeme eignen sich als Ziel für ein breites Angebot an Enterprise-Backup- und Archivierungs-Workloads, einschließlich VMs, Datenbanken, Mainframes, IBM i-Systeme, NAS, E-Mail, Big Data, Contentmanagement-Anwendungen und Remotestandorte. Data Domain-Systeme unterstützen simultanes Backup und Archivieren von Daten, sodass die Anschaffung und Verwaltung einer separaten Speicherplattform für die Archivierung entfällt und die globale Deduplizierung von Backup- und Archivierungsdaten ermöglicht wird. Die sichere Mehrmandantenfähigkeit ist integraler Bestandteil des Data Domain-Betriebssystems (DD OS) und ermöglicht Unternehmen und Serviceprovidern die Bereitstellung von Data Protection as a Service auf Hybrid-Cloud-Basis. Die Einfachheit von Installation und Management tragen zur Senkung der Betriebskosten bei. Die in Data Domain-Systemen integrierte Data Domain Data Invulnerability Architecture bietet höchste Zuverlässigkeit und Datenintegrität durch Inline-Verifizierung von Schreib- und Lesevorgängen und automatische Wiederherstellung nach I/O-Fehlern bei Aufnahme und Abruf. Backup und Recovery können so erfolgreich ausgeführt werden. Data Domain unterstützt mit NFS, CIFS, VTL, NDMP und Data Domain Boost ein breites Angebot an Backupoptionen. Durch die Integration von Data Domain Boost in Backup- und Unternehmensanwendungen werden Backups deutlich schneller und unter verringerter Netzwerkauslastung ausgeführt. Avamar Mit der Backupsoftware Avamar können täglich komplette Backups mit Deduplizierung mit variabler Länge für VMware-Umgebungen sowie für geschäftskritische Anwendungen, NAS, Desktops/Laptops und Remotestandorte durchgeführt werden. Avamar kann mit einer physischen Appliance für Metadaten oder über die Avamar Virtual Edition-Appliance (der hier getesteten Variante) bereitgestellt werden. Durch den kombinierten Einsatz von Avamar und Data Domain werden Teile des Deduplizierungsprozesses über den im Avamar-Client enthaltenen DD BoostCode auf die Clientseite verlagert und dadurch Backupdaten reduziert und Bandbreite eingespart. Das webbasierte Management von Avamar ermöglicht die zentrale Steuerung einer gesamten Bereitstellung. Das Management kann auch über vSphere erfolgen. In VMware-Umgebungen werden Backups auf Gast- und Image-Ebene unterstützt. Avamar ist in vStorage APIs for Data Protection (VADP) von VMware integriert und ermöglicht Gastbackups ohne Agent. Bei Backups auf ImageEbene wird der Backupprozess von den Anwendungs-VMs nach Bedarf und unter intelligentem Lastenausgleich auf mehrere Proxy-VMs ausgelagert. Zur Beschleunigung von Backup und Wiederherstellung nutzt Avamar CBT (Changed Block Tracking) von VMware. Nach dem ersten kompletten Backup werden nur noch geänderte Daten von Avamar übertragen, es wird jedoch ein vollständiger Recovery-Punkt für die Wiederherstellung erstellt. Diese „Immer komplett“-Methode liefert eine schnelle Performance bei Backup und Wiederherstellung, wohingegen herkömmliche Methoden ein Rollback auf das letzte komplette Backup und ein Staging der nachfolgenden inkrementellen Backups erfordert, was nicht nur mehr Zeit beansprucht, sondern auch zu einer Beeinträchtigung der Recovery-Zuverlässigkeit führen kann. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 5 Mit Avamar kann die Recovery von einzelnen Dateien und kompletten VMs in einem einzigen Schritt schnell durchgeführt werden. Außerdem kann auf die auf dem Data Domain-Ziel gespeicherten Avamar-VM-Images direkt zugegriffen werden. Diese Technik kommt bei Entwicklung/Tests und bei der Recovery-Prüfung häufig zum Einsatz; VMs können direkt in der Data Domain ausgeführt und verwendet werden, während die ausgeführte VM im Hintergrund mit vMotion wieder an den Ausgangsort übertragen wird. Getestete Lösung: EMC Data Domain und Avamar Von ESG Lab wurde eine EMC Datensicherheitslösung mit Data Domain und Avamar in einer auf einem EMC XtremIO-All-Flash-Speicherarray gehosteten virtuellen Umgebung getestet. Abbildung 2 zeigt einen konzeptuellen Lösungsüberblick. Auf der linken Seite ist ein VMware ESX-Hypervisor dargestellt, der mehrere Anwendungs-VMs, die VM mit Avamar Virtual Edition und Proxy-VMs hostet. Oben ist das Avamar Administrator-Dashboard zu sehen. Eine Proxy-VM identifiziert mithilfe von VMware-CBT geänderte Daten. Über DD Boost werden Teile des Data Domain-Deduplizierungsprozesses an Avamar zur clientseitigen Deduplizierung übertragen, damit nur eindeutige Daten vom Avamar-Client an das Data Domain-System gesendet werden. Das rechts dargestellte, hochskalierbare Data Domain-System kann gleichzeitig als Ziel für weitere Backup- und Archivierungs-Workloads eingesetzt werden. Bei diesem Test wurde zur Vermeidung möglicher Speicherengpässe als clientseitige Speicherplattform XtremIO eingesetzt. Abbildung 2. Lösungsüberblick: EMC Avamar und Data Domain Avamar Administrator Metadaten VM 1 VM 2 ProxyVM Avamar VE-VM RMAN-Backup VMware ESXi Backup LAN LAN Mainframebackup VADP/CBT VMDK VM1 VMDK VM2 Data Domain © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Archivierung Validierung durch ESG Lab: EMC Data Domain und Avamar 6 Validierung durch ESG Lab Im Rahmen der Validierung führte ESG Lab praktische Tests durch und prüfte Testergebnisse eines MA-Labors von EMC in Hopkinton, USA. Testkriterien waren die Einfachheit der Integration von Avamar und Data Domain, die Effizienz im Hinblick auf Kapazität und CPU-Nutzung und die Performance von Backup und Wiederherstellung mit Fokus auf VMware-Backups. Einfachheit der Integration Die Integration von EMC Avamar- und EMC Data Domain-Systemen ist extrem einfach. Die Skalierbarkeit und integrierte Datensicherheit von Data Domain können daher von Unternehmen bei Backups mit Avamar genutzt werden. Das von ESG Lab durchgeführte Audit des Integrationsverfahren bestand aus wenigen Schritten und war in unter fünf Minuten abgeschlossen. ESG Lab-Test Zunächst wurde ein eingeschaltetes und mit dem Netzwerk verbundenes Data Domain DD4500-System als Ziel für Avamar hinzugefügt. Die Data Domain System Manager-GUI oder -CLI sind bei diesem Vorgang nicht erforderlich, das Provisioning kann komplett über die Avamar Administrator-Managementkonsole erfolgen. Abbildung 3 (links) zeigt die Registerkarte „Server“ der Avamar Administrator-GUI mit den Back-end-Systemkonfigurationen. Oben rechts wird ein Avamar-Server mit Back-end-Kapazität angezeigt. Abbildung 3. Hinzufügen eines Data Domain-Systems über die Avamar Administrator-Konsole Als Nächstes wurde auf der Registerkarte Server die Option Server Management und dann Add Data Domain System ausgewählt (Abbildung 3, rechts). Auf der Registerkarte System wurden der qualifizierte Systemname (dd4500a) und die (bei der Einrichtung des DD4500a-Systems angegebenen) DD Boost-Anmeldeinformationen eingegeben. Damit wurde das Zielsystem authentifiziert und Schreibberechtigungen für Avamar-Clients vergeben. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 7 Eine wichtige Einstellung ist die Gesamtzahl der Avamar-Clientbackupstreams, die gleichzeitig gestartet werden können. Bei diesem Test waren es 270 Streams. Da Data Domain als Ziel für mehrere gleichzeitige Backup- und Archivierungsaufgaben eingesetzt werden kann, muss für ein optimales Gleichgewicht gesorgt werden, damit das Data Domain-Ziel von keiner Anwendung unbeabsichtigt überbeansprucht wird. Als Nächstes wurden SNMP-Daten hinzugefügt, um die Erfassung und Anzeige von Details bezüglich Systemintegrität, Warnmeldungen und Kapazität in Avamar zu ermöglichen. Nach Ausführung dieser Schritte konnte ESG Lab das Data Domain-Ziel auf dem Avamar Administrator-Dashboard sehen (Abbildung 4 oben). Über die Registerkarten Server/Server Management konnten zudem mit einem Klick auf das Symbol dd auf der Symbolleiste die Systemdetails des neu hinzugefügten dd4500a-Systems aufgerufen werden (u. a. Hostname, belegte und freie Kapazität, geschützte Bytes, Replikationsstatus, Streamlimit und Status von Verschlüsselung, Authentifizierung und Monitoring, siehe Abbildung 4 unten). Abbildung 4. Management von Data Domain über die Avamar Administrator-GUI Nach der ordnungsgemäßen Konfiguration des dd4500a-Ziels bestand der letzte Schritt in der Erstellung einer Avamar-Backup-Policy für die VMware-VMs. Für den Backupjob VM_Test wurde die Registerkarte Options ausgewählt. Im Drop-down-Feld wurde Linux VMware Image ausgewählt und Change Block Tracking aktiviert. Nach Aktivierung des Kontrollkästchens Store Backup on Data Domain system wurde aus der Liste verfügbarer Ziele dd4500a ausgewählt und auf OK geklickt. Beim nächsten manuellen oder geplanten Backup von Dataset VM_Test würden die Daten nun direkt an das Data Domain-Ziel gesendet. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 8 Abbildung 5. Erstellen einer Backup-Policy Bedeutung Unternehmen bietet die Flexibilität moderner virtualisierter Rechenzentren enorme Vorteile. Für die IT hingegen – und insbesondere für Backupadministratoren – stellt sie eine große Herausforderung dar. In vielen Unternehmen gibt es separate Infrastruktursilos und Backupanwendungen für physische und virtuelle Datasets oder für verschiedene Unternehmensanwendungen. Ihr Betrieb geht mit erhöhtem Zeitaufwand, größeren Backupzeitfenstern (die Produktionsaktivitäten beeinträchtigen können) und höheren Investitions- und Betriebskosten einher. Die Avamar/Data Domain-Systemlösung wurde von ESG Lab unter dem Gesichtspunkt der schnellen und einfachen Integration und Policy-Erstellung verifiziert. Das Hinzufügen des Data Domain-Ziels über die Avamar Administrator-Konsole und Erstellen der VM-Backup-Policy war in nur wenigen Schritten in unter 5 Minuten abgeschlossen. Dank der einfachen und schnellen Integration eignet sich die Lösung ideal für Administratoren zur Konsolidierung von Backups für ein breites Angebot an Anwendungen, Systemen und Standorten mit flexiblen Avamar- und Data Domain-Komponenten mit vollem Funktionsumfang. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 9 Performance und Effizienz Die Performance von Backup und Wiederherstellung hat große Auswirkungen auf den Produktionsbetrieb. Von der Backupgeschwindigkeit hängt es oft ab, ob alle VMs im Backupzeitfenster gesichert werden können oder Daten ungeschützt bleiben. Eine schnelle Wiederherstellung ermöglicht die schnelle Wiederaufnahme des geschäftlichen Betriebs. Die Avamar/Data Domain-Systemlösung ermöglicht dank erweiterter Deduplizierung extrem effiziente VM-Backups und als Folge eine drastische Reduzierung der zu übertragenden und zu speichernden Datenmenge; dies wiederum führt zu einer deutlichen Steigerung der Backupperformance. Bei Backups in virtuellen Umgebungen stellt auch die effiziente Nutzung der Host-CPU-Ressourcen einen wichtigen Faktor dar, da sie eine Störung der Produktionsaktivitäten durch Datensicherheitsprozesse verhindert. Backupmethode mit Avamar und Data Domain Ein wichtiges Alleinstellungsmerkmal der Avamar/Data Domain-Lösung ist die Backupmethodologie. Nach einem ersten kompletten Backup werden von Avamar nur noch inkrementelle Backups durchgeführt. Durch die Integration in VMware-CBT werden anschließend nur neue oder geänderte Daten gesichert. DD Boost sorgt dafür, dass nur eindeutige Daten von Avamar an das Data Domain-System gesendet werden. Metadaten werden immer in einer separaten Datei gespeichert, damit die für eine Recovery benötigten Daten von Avamar schnell gefunden werden können. Die geänderten Daten, die gesichert werden, werden zur Erstellung eines Recovery-Punkts nach jedem inkrementellen Backup auf die vorherigen Backupdaten angewendet. Das bedeutet, dass jedes Backup mit Avamar nur die Zeit eines inkrementellen Backups beansprucht, im Endergebnis jedoch ein komplettes Backup darstellt und eine schnelle und effiziente Recovery ermöglicht. Dank dieser „Immer komplett“-Methode muss die IT, anders als bei herkömmlichen Backupanwendungen, keine weiteren regelmäßigen kompletten Backups und Katalogaktualisierungen durchführen (siehe Abbildung 6). Diese zusätzlichen kompletten Backups sind zeit- und arbeitsaufwändig. Die herkömmliche Wiederherstellung erfordert zudem ein Rollback auf das letzte komplette Backup und die anschließende Bereitstellung inkrementeller Backups – ein mühevoller Prozess, der zu Verzögerungen und unzuverlässigen Ergebnissen führen kann. Abbildung 6. Immer-komplett-Backups mit Avamar/Data Domain im Vergleich zu herkömmlichen Methoden Avamar und Data Domain Januar Februar Immer komplett Erstes komplettes Backup Herkömmliche Backuplösungen Januar Februar Inkrementelle Backups Erstes komplettes Backup Inkrementelle Backups Komplettes Backup, Katalogaktualisierung Inkrementelle Backups Komplettes Backup, Katalogaktualisierung Inkrementelle Backups Komplettes Backup, Katalogaktualisierung © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Komplettes Backup, Katalogaktualisierung Validierung durch ESG Lab: EMC Data Domain und Avamar 10 VM-Backups und -Wiederherstellungen auf Image-Ebene mit Avamar Aufgrund der engen Integration von Avamar mit VADP werden bei Backups auf Image-Ebene Backup- und Deduplizierungsprozesse von Client-VMs auf Proxy-VMs ausgelagert. Client-VMs werden mit vSphere dynamisch (und unter Lastenausgleich über mehrere Proxys) mit den Avamar-Proxy-VMs verbunden, ohne dass Daten über das Netzwerk übertragen werden. Auf diese Weise ist ein schnelles Backup mehrerer VMs möglich. Der Backupprozess wird von VMware-CBT durch Senden einer Liste geänderter Blöcke an Avamar weiter beschleunigt. Die Blöcke werden mit DD Boost in Segmente variabler Länge unterteilt und vor der Übertragung an Data Domain dedupliziert. CBT kann auch zur schnellen Wiederherstellung geänderter Daten auf einer vorhandenen VM verwendet werden. Anhand des aktuellen VM-Zustands und der CBT-Protokolle ermittelt Avamar jene Blöcke, die aus dem gewünschten Recovery-Punkt wiederhergestellt werden müssen, und stellt ausschließlich diese Blöcke schnell wieder her. ESG Lab-Test Die Performance- und Effizienztests wurden von ESG Lab mit zwei VMware vCenter ESX 5.5-Servern auf dualen Cisco UCS 240-Servern durchgeführt. Auf jedem UCS-Server wurden 50 VMs (insgesamt 200 VMs) gehostet. Als Speicher für die Server dienten zwei XtremIO-Brick-Bausteine mit je 7,56 TB verfügbarem Speicherplatz. Die Datensicherheit wurde durch eine virtuelle Appliance mit Avamar Virtual Edition 7.2 und Data Domain DD4500 mit 86 TB nutzbarer Kapazität und 10-GbE-Ports bereitgestellt. Als Testdaten wurden diverse Dateien mit einer Größe von je etwa 1 MB erzeugt und mit einem internen Tool (Data Gen) für die Backupverarbeitung modifiziert, sodass ein konsistentes Dataset für mehrere Testiterationen entstand. Es wurden drei Tests durchgeführt: Simulation eines 28-tägigen Backupzyklus mit 200 VMs Simulation einer Wiederherstellung von 31 VMs mit CBT-Wiederherstellung Simulation einer Backupskalierung mit 200 VMs Die VMs umfassten jeweils etwa 70 GB an Daten. Diese setzten sich aus dem Betriebssystem und den File-basierten Daten zusammen, die generiert wurden, um erste Backupdaten und zwischen den Backups neu erstellte/geänderte Daten zu erstellen. Kennzahlen wurden aufgezeichnet für Deduplizierung, Laufzeitperformance von Backup/Wiederherstellung und CPU-Auslastung. Jeder Test wurde zur Bewertung der Ergebniskonsistenz drei Mal vollständig durchgeführt. Es wurden sowohl praktische Tests als auch Audits vorheriger Tests durchgeführt. Zunächst untersuchte ESG Lab die Kapazitätseffizienz der Avamar/Data Domain-Lösung bei der Simulation eines 28tägigen Backupzyklus für 200 VMs. Für jeden Testlauf wurde über das Data Gen-Tool für jede VM ein simuliertes Dateisystem mit Verzeichnissen und Dateien in einer Größe von etwa 50 GB erstellt. Nach der Durchführung des ersten kompletten Backups wurden mit dem Tool pro Client 4 % geänderte Daten und 0,125 % neue Daten erzeugt. Daraufhin wurde ein inkrementelles Backup ausgeführt. Dieser Ablauf wurde zur Simulation eines typischen 4Wochen-Backupzyklus 28 Mal wiederholt. Aufgrund der in Avamar verwendeten „Immer komplett“Backupmethode war nur ein einziges komplettes Backup erforderlich. Es wurden drei Testläufe durchgeführt mit einem kompletten Reset zwischen den Testläufen für eine saubere Umgebung. Anhand eines Audits der Testprotokolle wurden Deduplizierungsstatistiken jedes Testlaufs von ESG Lab erfasst. Alle drei Testläufe des kompletten 28-Tage-Backuptests waren praktisch identisch. Abbildung 7 zeigt die Daten aus einer Testiteration. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 11 Abbildung 7. Deduplizierung während des 28-Tage-Backuptests Deduplizierung: Deduplication:28-Tage-Backuptest 28-Day Backup Test 450 400 350 300 TiB TiB 250 Deduplizierungsrate Dedupe rate 72.3 x 72,3 x 200 150 100 50 0 Data Protected Geschützte Daten Data Stored after Dedupe/Compression Nach Deduplizierung/Komprimierung gespeicherte Daten Bedeutung der Zahlen Die Menge der geschützten VM-Daten betrug 402,15 TiB. Nach der Komprimierung und Deduplizierung wurden in Data Domain 5,56 TiB Daten gespeichert. Die Kapazitätsreduzierung für diesen Test betrug 98,6 %, wodurch eine 72,3-fache Deduplizierungsrate erzielt werden konnten. Als Nächstes wurde die Backupperformance des 28-Tage-Backupzyklus von ESG Lab überprüft. Das erste Backup der 200 VM-Clients (je 70 GB) dauerte 2 Stunden und 56 Minuten (siehe Abbildung 8). Danach dauerte jedes inkrementelle Backup mit 4 % geänderten und 0,125 % neuen Daten nur noch 7–10 Minuten. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 12 Abbildung 8. Backupperformance 28-day Test Backup:Laufzeit Runtime 28-Tage-Backup: 200.00 180.00 160.00 Minuten Minutes 140.00 120.00 100.00 80.00 60.00 40.00 20.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Bedeutung der Zahlen Die Laufzeit des ersten kompletten Backups betrug 176 Minuten (2:56:12). Die Laufzeit der 28 inkrementellen Backups betrug im Durchschnitt 8,68 Minuten. Jeder Recovery-Punkt repräsentiert ein vollständiges Image des Clients, obwohl nur inkrementelle Daten übertragen wurden. Die konzeptuelle Grafik in Abbildung 9 zeigt die Vorteile der Lösung im Hinblick auf Kapazitätseffizienz und Laufzeit. Auf der linken Seite der Abbildung sind die virtuellen Maschinen und die geschützte Gesamtkapazität zu sehen. CBT und Deduplizierungsprozesse reduzieren die Menge der zu übertragenden Daten und beschleunigen die Backupzeit. In diesem Fall wurden durchschnittlich 19,8 GiB pro Tag übertragen, was zu einer durchschnittlichen täglichen Backupzeit von 8,68 Minuten führte. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 13 Abbildung 9. Datenreduzierung und Backupzeit 28-Tage-Backuptest Datenübertragung und Backupzeit Geschützte Daten: 402,15 TiB Gespeicherte Daten: 5,56 TiB LAN Durchschnittliche tägliche Backupzeit: 8,68 min Durchschnittlich täglich übertragene Daten: 19,8 GiB Als Nächstes überprüfte ESG Lab Daten für einen Wiederherstellungstest mit CBT. Nach einem kompletten Reset der Umgebung wurde ein neues Dataset von 50 GB für 31 VMs mit je 70 GB erzeugt. Dem ersten kompletten Backup folgte ein einziger Datenmodifizierungszyklus. Anschließend wurden CBT-Wiederherstellungen für eine einzige VM, für gleichzeitig 10 VMs und für gleichzeitig 20 VMs durchgeführt. Auf diese Weise wird die Wiederherstellung für eine VM bzw. für eine Gruppe von VMs nach einer Beschädigung bzw. nach einem Rollback von Anwendungsdaten auf einen spezifischen Point-in-Time simuliert. Abbildung 10 zeigt die durchschnittliche Wiederherstellungszeit der drei Testiterationen. Abbildung 10. Wiederherstellungsperformance Wiederherstellungszeit steigender Restore Timebei as Clients ScaleClientzahl Restore Wiederherstellung von 20 Clients Wiederherstellung von 10 Clients Restore Wiederherstellung von 11 Client Client Restore 0 2 4 6 8 10 12 14 Minuten Minutes © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. 16 18 Validierung durch ESG Lab: EMC Data Domain und Avamar 14 Bedeutung der Zahlen Es mussten nur geänderte Daten (etwa 1,5 GB pro VM) wiederhergestellt werden. Die Wiederherstellungsperformance für einen einzigen Client betrug durchschnittlich 7 Minuten. Die Wiederherstellungsperformance für 10 Clients betrug durchschnittlich 10,5 Minuten. Die Wiederherstellungsperformance für 20 Clients betrug durchschnittlich 15 Minuten. Als Nächstes überprüfte ESG Lab den für die Backuptests benötigten CPU-Overhead. Die Backupverarbeitung mit Avamar und Data Domain umfasst eine zwischen Client und Ziel aufgeteilte Deduplizierung. Anhand eines Audits der Protokolldateien des 28-Tage-Backuptests ermittelte ESG Lab die CPU-Auslastung des Data Domain-Ziels und der ESX-Hosts. Während des 28-Tage-Backuptests erfolgten zwischen den Testläufen jeweils eine automatische Bereinigung und die Erzeugung neuer Daten, gefolgt von einem kompletten Backup sowie einer Reihe inkrementeller Backups mit neuen und geänderten Daten, die zwischen den inkrementellen Backups erzeugt wurden. Abbildung 11 zeigt, dass die CPU-Auslastung des Data Domain-Systems nach einer anfänglichen Spitze von 90 % beim ersten kompletten Backup während des gesamten Tests unter 30 % blieb. Kleinere Spitzen wurden während der Bereinigung und dem Reset zwischen den simulierten Wochen gemessen. Die CPU-Auslastung der vier ESX-Hosts blieb sehr gering. Abbildung 11. CPU-Auslastung auf dem Data Domain-System und den ESX-Servern CPU-Auslastung: CPU Utilization: 28-Tage-Backuptest 28-day Backup Test 100 90 80 70 Data Domain Percentage % 60 ESX 1 50 ESX 2 40 ESX 3 30 ESX 4 20 10 0 Time Zeit Bedeutung der Zahlen Die Data Domain-CPU-Auslastung betrug während des 28-Tage-Backupzyklus durchschnittlich 23 %, wobei beim kompletten Backup eine Spitze von etwa 90 % gemessen wurde. Die CPU-Auslastung lag bei allen vier ESX-Hosts bei durchschnittlich 6–8 % und stieg zu keinem Zeitpunkt über 15 %. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 15 Zuletzt untersuchte ESG Lab die Performance der Avamar/Data Domain-Lösung bei einer Backupskalierung. Nach dem ersten kompletten Backup wurden neue und geänderte Daten hinzugefügt und inkrementelle Backups für jeweils 50 VMs gleichzeitig ausgeführt. Der gleiche Prozess wurde mit 100, 150 und 200 gleichzeitigen inkrementellen Backups wiederholt. Abbildung 12 zeigt das Datenwachstum für jede Gruppe gleichzeitig durchgeführter inkrementeller Backups sowie die für die gleichzeitigen inkrementellen Backups benötigte Zeitdauer. Die dunkelblauen Balken repräsentieren die anfänglichen Datenmengen, die hellblauen Balken zeigen die geänderten Daten für jede Gruppe von VMs und die orangefarbene Linie repräsentiert die für die Backups benötigte Zeitdauer. Es ist deutlich zu sehen, dass die Backupperformance durch das Datenwachstum nicht negativ beeinträchtigt wurde. Abbildung 12. Skalierungstest: Backupperformance bei wachsendem Datenvolumen 11 200 10.8 180 10.6 160 10.4 140 10.2 120 10 100 9.8 80 9.6 60 9.4 40 9.2 20 9 Minuten Minutes TBs TB Scale Test: Duration Concurrent inkrementeller Incremental Backups Skalierungstest: Dauer of gleichzeitiger Backups 0 Ausgangsdaten, Initial Data 200 200VMs VMs Inkrementell,50 Incremental 50Vms VMs Anfängliche Initial data Daten Inkrementell, Incremental 100 100VMs VMs Inkrementell, Incremental 150 150 VMs VMs. Neue/geänderte New/changed data Daten Inkrementell, Incremental 200 200 VMs VMs Minuten Minutes Bedeutung der Zahlen Das anfängliche komplette Backup dauerte 184 Minuten. Die inkrementellen Backups dauerten bei 50 VMs 11 Minuten, bei 100 VMs 8 Minuten, bei 150 VMs 8 Minuten und bei 200 VMs 7 Minuten. Für die Skalierung auf 200 VMs wurden keine zusätzlichen Proxyserver benötigt. Der Test wurde mit 200 VMs ausgeführt, doch die globale Deduplizierung der Lösung resultiert bei einem Zuwachs von VMs im Pool sehr wahrscheinlich in einer Performancesteigerung. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 16 Bedeutung Kontinuierlich steigende Datenvolumen stellen die IT in vielerlei Hinsicht, vor allem jedoch im Bereich Backup, vor große Herausforderungen. Unternehmen müssen Daten schützen und aufbewahren, damit sie bei Beschädigungen oder in Notfällen wiederhergestellt und strenge Compliance- und Governance-Auflagen erfüllt werden können. Die langfristige Datenspeicherung verursacht allerdings steigende Kosten. Das Datenwachstum wird durch die starke Zunahme von VMs erheblich gesteigert, wobei Backups häufig redundante Betriebssystem-, Anwendungs- und Datenkopien speichern. ESG Lab konnte die deutliche Reduzierung der Menge an Backupdaten durch die Deduplizierungstechnologien der Avamar/Data Domain-Lösung verifizieren. Die Data Domain-Deduplizierung mit variabler Länge ermöglicht höchste Deduplizierungsraten. Speicher- und Bandbreitenanforderungen beim Backup werden so auf ein Minimum reduziert und Zeit und Kosten deutlich eingespart. Zusätzlich ergeben sich damit weitere Zeit- und Kosteneinsparungen durch die ebenfalls geringeren Bandbreitenanforderungen für die Disaster-RecoveryReplikation. Im Rahmen der Tests wurde auch die Geschwindigkeit des Backups von 200 VMs, gleichzeitiger Backups und gleichzeitiger Wiederherstellungen gemessen. Der Einsatz von CBT-Wiederherstellungen ermöglicht eine schnelle Recovery und minimiert die Auswirkungen auf den Datensicherheits-Stack bei Skalierung der VMUmgebung. Schließlich verifizierte ESG Lab, dass während der Verarbeitung einzelner und gleichzeitiger Backupstreams und der Durchführung von Wiederherstellungsaufgaben genügend CPU-Kapazität auf dem Data Domain-Ziel und den ESX-Hosts verfügbar bleibt. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 17 Highlights der Validierung durch ESG Lab ESG Lab war beeindruckt von der einfachen und schnellen Integration von Avamar und Data Domain für ein konsolidiertes Management der Datensicherheit. Die gemessenen Datendeduplizierungsraten zeigten, dass eine Reduzierung der Kapazität um das 73-Fache erreicht werden kann, sodass Unternehmen Einsparungen bei Speicher und Bandbreite erzielen können. ESG Lab war sehr zufrieden mit der effizienten CPU-Auslastung auf dem Data Domain-Ziel und den ESXiHosts während der gesamten Backupverarbeitung mit ausreichender Kapazität für andere Aufgaben. Auch die bei hohen Workloads von Data Domain vorgenommene Auslagerung der Hauptlast von den Hosts fielen ESG Lab positiv auf. Die Backupperformancetests zeigten, dass mit dieser kapazitäts- und netzwerkeffizienten Lösung Geschwindigkeitsvorteile bei „Immer komplett“-Backups erzielt werden können. ESG Lab konnte zudem verifizieren, dass gleichzeitige VM-Backups keine negativen Auswirkungen auf die Performance hatten und die Wiederherstellung mit VMware-CBT schnell und effizient erfolgte. Wichtige Aspekte Mit der Data Domain-Deduplizierung mit variabler Länge werden Speicheranforderungen minimiert, während durch die Integration von DD Boost durch Verteilung von Teilen der Data Domain-Deduplizierung auf Avamar zur clientseitigen Deduplizierung die Bandbreite minimiert wird. Das ist bei VM-Backups wichtig, denn diese enthalten häufig redundante Betriebssystem- und andere Daten. Die Effizienz der CPU-Auslastung ist nicht nur für ESXi-Hosts, die Produktionsanwendungen unterstützen, von großer Bedeutung, sondern auch für das Data Domain-System, das gleichzeitig als Ziel für andere Datensicherheitsaktivitäten dienen kann. Die CBT-Wiederherstellung ist eine gute Alternative, die eine schnelle Wiederherstellung nach einer Beschädigung spezifischer VM-Daten ermöglicht. Dabei ist allerdings zu beachten, dass bei einer vollständig zerstörten VM die CBT-Wiederherstellung nicht effektiv ist, da in einem solchen Fall sämtliche VMDKs wiederhergestellt werden müssen. Die Deduplizierungsraten hängen immer von der Art der gesicherten Daten ab. Einige Datentypen (wie z. B. File-basierte Daten) weisen tendenziell einen hohen Duplizierungsgrad auf, während bei anderen Datentypen (wie etwa Videos und Bilder) die Duplizierung eher gering ist. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 18 Die ganze Wahrheit Seit Jahren, so ergeben Umfragen von ESG, haben in mittelständischen Unternehmen und Konzernen die Verbesserung der Datensicherheit, die Bewältigung des Datenwachstums und die steigende Servervirtualisierung höchste Priorität im IT-Bereich.2 Die Gründe dafür liegen auf der Hand: Die Transformation von Produktionsvorgängen hat direkte und starke Auswirkungen auf Sicherheitsmechanismen. Die bahnbrechende Technologie von VMware hat eine Revolution in Gang gesetzt, die zur Etablierung der Virtualisierung und weltweit zu einer starken Zunahme von VMs in Unternehmen geführt hat. Der Schutz der entsprechend großen Datenmengen bleibt nach wie vor eine Herausforderung. Avamar und Data Domain sind hochentwickelte Datensicherheitslösungen, die kombiniert noch leistungsstärker sind. Data Domain war eine bahnbrechende Entwicklung auf dem Gebiet der Deduplizierung, aber auch Skalierbarkeit und Flexibilität – ein kritischer Faktor für die Datensicherheit in VMware-Umgebungen – sind zu diesem Zeitpunkt gleichermaßen wichtig, denn Unternehmen müssen ständig neue VMs einrichten und dafür sorgen, dass hunderte, wenn nicht gar tausende VMs geschützt sind. Data Domain bietet eine beispiellose Flexibilität und eignet sich als Ziel für verschiedene Backupanwendungen, direkte Backups aus Unternehmensanwendungen wie Oracle RMAN, SQL, SAP und DB2, direkte Backups vom primären Speicher wie VMAX3 und XtremIO, Backups von Mainframe- und IBM i-Systemen und Archivierungslösungen wie SourceOne. Während die IT den Überblick über sämtliche Datensicherheitsaktivitäten behält – etwa mithilfe von EMC Data Protection Advisor – können Administratoren ihre eigenen Backups durchführen (z. B. können Datenbankadministratoren RMAN ausführen und Virtualisierungsadministratoren VMBackups). Auf diese Weise lässt sich das Management mehrerer Datensicherheitsaktivitäten verteilen, ohne dass separate Infrastruktur-Stacks angeschafft und verwaltet werden müssen. Data Domain ist außerdem dank Data Invulnerability Architecture mit Datenprüfungen, kontinuierlicher Fehlererkennung und automatischer Fehlerkorrektur als „paranoides“ System für seine inhärente Zuverlässigkeit bekannt. Dank dieser Merkmale ist es eine absolut solide Lösung für große und kleine Unternehmen und Serviceprovider. Avamar bietet anwendungs- und VM-konsistente Backups mit einer schnellen, granularen Recovery. Avamar nutzt VADP für VMware-Backups und ist in vSphere integriert. Durch den Einsatz von Proxy-VMs mit automatischem Lastenausgleich bietet Avamar genau wie Data Domain die für Umgebungen mit virtuellen Servern erforderliche Skalierbarkeit. Die Fähigkeit zur Nutzung von CBT für Backup und Wiederherstellung steigert die Performance beider Aufgaben und reduziert Datenverschiebungen über das Netzwerk. Avamar bietet zudem sofortigen VM-Zugriff auf unter Data Domain gespeicherte Images (auch wenn dies im Rahmen dieses Projekts nicht getestet wurde), sodass die von Unternehmen heute zur Aufrechterhaltung der Produktion geforderte Flexibilität und Fähigkeit zur schnellen Recovery gegeben ist. ESG Lab hat den kombinierten Einsatz von Avamar und Data Domain in einem realistischen Szenario auf die in einer Kundenumgebung zu erwartende Performance getestet. Gegenstand des Tests war auch ein für eine moderne ITLandschaft wichtiges Kriterium: die Einfachheit der Integration beider Komponenten. An 200 VMs wurden die Kapazitätseffizienz der dualen Deduplizierungsmechanismen, die Performancevorteile inkrementeller Backups, die gleichzeitige Verarbeitung hunderter VM-Backups bei gleichbleibend schneller Performance und die Möglichkeit der Nutzung von CBT-Wiederherstellungen für eine schnelle Recovery verifiziert. Viele Unternehmen setzen heute aus zwei wichtigen Gründen auf integrierte Backup-Appliances: Einfachheit der Bereitstellung und Reduzierung der Investitions- und Betriebskosten. Die Kombination aus Data Domain und Avamar ist formal keine integrierte Appliance. Allerdings liefert dieser Lösungsansatz höhere Deduplizierungsraten als herkömmliche integrierte Backup-Appliances und darüber hinaus die für den uneingeschränkten Schutz einer gesamten Umgebung erforderliche Skalierbarkeit und Flexibilität. Mit diesem leistungsstarken Tandem können Unternehmen den Schutz von Daten vereinfachen und konsolidieren und gleichzeitig ihre Kosten senken. 2 Quelle: ESG Research Report, 2015 IT Spending Intentions Survey, Februar 2015. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. Validierung durch ESG Lab: EMC Data Domain und Avamar 19 Anhang Tabelle 1: ESG-Labor-Prüfstand Backupsoftware Festplattenziel Avamar Virtual Edition 7.2 2 x vCPU 6 x vRAM 900 GB Speicherplatz Data Domain DD4500 DD OS 5.6.0.3 4 x ES30-30-Festplatteneinschübe 4 x 10-GbE-Schnittstellen (2 im Test verwendet) Virtualisierung Server VMware vCenter 5.5.2 4 x Cisco UCS 240 Betriebssystem: SLES 12.3 Speicher Netzwerk 2 x EMC XtremIO, je 7,56 TB verfügbar 10 GbE Methoden der Messwerterfassung Sämtliche Tests sollten ein realistisches Szenario widerspiegeln: tägliche Backups mit realistischen Datenänderungsraten für einen Monat. Deduplizierung: Deduplizierungsmessungen wurden direkt vom Data Domain-Ziel unter Verwendung des Befehls filesys show compression in den Backupjob-Skripten abgerufen. Die Daten wurden sofort nach jedem Backupjob gesammelt und in eine Protokolldatei geschrieben. Performance bei Backup/Wiederherstellung: Die Ausführungsdauer von Backup- und Wiederherstellungsjobs wurde mit dem Unix/Linux-Dienstprogramm time ermittelt. Alle Backup- und Wiederherstellungsjobs wurden über Skripte und die Avamar-mccli-Befehlszeilenoberfläche ausgeführt. Über das Dienstprogramm time wurde die Gesamtlaufzeit aller Jobs von Anfang bis Ende ausgegeben. Diese Ergebnisse wurden während der Tests in eine Protokolldatei geschrieben. CPU: Informationen über die CPU und andere Systemressourcen für diverse Komponenten in der Testumgebung wurden mit EMC Data Protection Advisor gesammelt. DPA wurde zudem als zweite Methode zur Überprüfung der Deduplizierungs- und Laufzeitergebnisse verwendet. © 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten. 20 Asylum Street | Milford, MA 01757 | Tel: 508.482.0188 Fax: 508.482.0218 | www.esg-global.com