EMC Data Domain und Avamar Performance und Effizienz der

Werbung
Validierung durch
ESG Lab
Bericht
EMC Data Domain und Avamar
Performance und Effizienz der Datensicherheit in VMware-Umgebungen
Autor: Kerry Dolan, Lab Analyst
Oktober 2015
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
2
Inhalt
Einführung .................................................................................................................................................... 3
Hintergrund .............................................................................................................................................................. 3
Validierung durch ESG Lab ............................................................................................................................ 6
Einfachheit der Integration....................................................................................................................................... 6
Performance und Effizienz........................................................................................................................................ 9
Highlights der Validierung durch ESG Lab .................................................................................................. 17
Wichtige Aspekte ........................................................................................................................................ 17
Die ganze Wahrheit .................................................................................................................................... 18
Anhang ........................................................................................................................................................ 19
ESG Lab Reports
ESG Lab Reports sollen IT-Experten über Technologieprodukte für Rechenzentren informieren, die für
Unternehmen jeder Art und Größe geeignet sind. ESG Lab Reports sind nicht dafür vorgesehen, den
Bewertungsprozess vor der Kaufentscheidung zu ersetzen, sondern sollen lediglich Einblicke in diese
neuen Technologien vermitteln. Unser Ziel ist es einige wertvollere Produktfunktionen
durchzugehen, zu zeigen wie sie bei Lösung echter Kundenprobleme und der Identifizierung der
Bereiche, die Verbesserung benötigen, verwendet werden können. Die Sicht von Drittanbietern des
ESG-Laborexperten basiert auf unseren eigenen praktischen Tests, sowie auf Interviews mit Kunden,
die diese Produkte in Produktionsumgebungen verwenden. Der vorliegende Bericht von ESG Lab
wurde von EMC gesponsert.
Alle Marken sind das Eigentum ihrer jeweiligen Inhaber. Die in diesem Dokument enthaltenen Informationen stammen aus Quellen, die von The Enterprise
Strategy Group (ESG) als vertrauenswürdig eingestuft werden. Eine Gewähr kann jedoch von ESG nicht übernommen werden. Dieses Dokument kann
Meinungen von ESG wiedergeben, die sich von Zeit zu Zeit ändern können. Das Dokument ist von The Enterprise Strategy Group, Inc. urheberrechtlich
geschützt. Jegliche Vervielfältigung oder Verbreitung dieses Dokuments, ob ganz oder in Teilen, in gedruckter, elektronischer oder sonstiger Form an nicht
Empfangsberechtigte ohne die vorherige schriftliche Genehmigung von The Enterprise Strategy Group, Inc. stellt eine Verletzung des US-amerikanischen
Urheberrechts dar und wird zivil- bzw. strafrechtlich verfolgt. Falls Sie Fragen haben, wenden Sie sich bitte unter der Rufnummer +1 508 482-0188 an ESG
Client Relations.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
3
Einführung
Der vorliegende Bericht dokumentiert praktische Tests und die Validierung einer Datensicherheitslösung von EMC
für virtuelle Umgebungen. Testkriterien für die aus Avamar Virtual Edition und einem Data Domain-System
bestehende Lösung waren Einfachheit der Integration, Effizienz, Skalierbarkeit und Performance von
Backup/Wiederherstellung.
Hintergrund
Von ESG mithilfe von IT-Experten durchgeführte Umfragen ergeben seit fünf Jahren konsistent die gleichen
wichtigsten IT-Prioritäten: Verbesserung von Backup und Recovery der Daten, Management des Datenwachstums
und vermehrter Einsatz der Servervirtualisierung. In der von ESG durchgeführten 2015 IT Spending Intentions
Survey wurden nur Initiativen im Bereich Informationssicherheit noch häufiger genannt (siehe Abbildung 1).1 Eine
Herausforderung für Unternehmen ist die enorme Auswirkung des Datenwachstums auf Backup und Recovery von
Daten: Ständig wachsende Datenmengen verlängern Backupzeitfenster und Recovery-Zeiten – oft in einem so
hohen Ausmaß, dass Produktionsaktivitäten betroffen sind – und erfordern immer mehr Back-end-Speicher.
Abbildung 1. Die am häufigsten genannten 10 wichtigsten IT-Prioritäten 2015
Top 10 mostDie
important
IT priorities
over the next
12 kommenden
months. (Percent
of respondents,
10 wichtigsten
IT-Prioritäten
für die
12 Monate
N=601,
ten
responses
accepted)
(Prozent der Befragten, N=601, zehn Antworten möglich)
Initiativen zur Verbesserung der
Information
security initiatives
Informationssicherheit
34
%
34%
Improving data
backupund
andRecovery
recovery
Verbesserung
von Backup
26 %
26%
ManagementManaging
des Datenwachstums
data growth
26%
26 %
Stärkere
Nutzunguse
derofServervirtualisierung
Increasing
server virtualization
25%
25 %
Desktop virtualization
Desktopvirtualisierung
25%
25
%
Using
cloud
infrastructure services
Einsatz
von
Cloudinfrastrukturservices
25%
25
%
Initiativen zur Regulatory
Einhaltung behördlicher
Auflagen
compliance initiatives
24
%
24%
Programme für Business Continuity/Disaster
Business continuity/disaster recoveryRecovery
programs
23%
23
%
Einrichtung
Private-Cloud-Infrastruktur
Buildingeiner
a “private
cloud” infrastructure
22
%
22%
Verbesserung der Funktionen für die
Improving collaboration capabilities
Zusammenarbeit
22%
22
%
00%
%
10%
10 %
20%
20
%
30%
30
%
40%%
40
Quelle: Enterprise Strategy Group, 2015.
Eine zusätzliche Herausforderung für viele Unternehmen ist die Suche nach der besten Lösung zum Schutz ihrer
ständig wachsenden Zahl virtueller VMware-Maschinen (VMs). Jede VM erfordert einen eigenen Backupjob – eine
bei Skalierung schwierige Aufgabe. Herkömmliche Backuplösungen sind nicht auf die gemeinsame
Ressourcennutzung der VMs ausgelegt und gefährden die Einhaltung von SLAs. Bei VM-Backups werden oft
redundante Betriebssystem-, Anwendungs- und File-basierte Daten gesichert. Aufgrund der enormen Datenmengen
können Backups nicht immer innerhalb des Backupzeitfensters abgeschlossen werden, ohne dass einige VMs
1
Quelle: ESG Research Report, 2015 IT Spending Intentions Survey, Februar 2015.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
4
ungeschützt bleiben. Das Management all dieser Backups kann sich als operativer Albtraum erweisen. Eine weitere
Herausforderung besteht darin, dass separate physische und virtuelle Backups die Anschaffung und das
Management zusätzlicher Server, Speicher und Software erfordern, wodurch Kosten und Komplexität in die Höhe
getrieben werden.
EMC Data Domain und Avamar
Diese Datensicherheitslösung von EMC besteht aus der Kombination der einfachen und effizienten Backup- und
Recovery-Software Avamar mit dem leistungsstarken, skalierbaren und effizienten Data Domain-System.
Data Domain
Data Domain-Systeme sind hochskalierbare, speziell entwickelte Datenschutzspeicher-Appliances. Sie bieten eine
schnelle Deduplizierung für Backup und Archivierung sowie Replikationsfunktionen für Disaster Recovery. Die
Modelle dieser Serie lassen sich bis auf eine logische Kapazität von 86,4 PB skalieren. Durch die Deduplizierung mit
variabler Länge werden Deduplizierungsraten maximiert, was zur Folge hat, dass Backup und Archivierung
durchschnittlich 10- bis 30-mal weniger Speicher benötigen. Data Domain ist somit eine kostengünstige Alternative
zu anderen Backup-Appliances und Backups auf Band. Diese Systeme eignen sich als Ziel für ein breites Angebot an
Enterprise-Backup- und Archivierungs-Workloads, einschließlich VMs, Datenbanken, Mainframes, IBM i-Systeme,
NAS, E-Mail, Big Data, Contentmanagement-Anwendungen und Remotestandorte. Data Domain-Systeme
unterstützen simultanes Backup und Archivieren von Daten, sodass die Anschaffung und Verwaltung einer
separaten Speicherplattform für die Archivierung entfällt und die globale Deduplizierung von Backup- und
Archivierungsdaten ermöglicht wird. Die sichere Mehrmandantenfähigkeit ist integraler Bestandteil des Data
Domain-Betriebssystems (DD OS) und ermöglicht Unternehmen und Serviceprovidern die Bereitstellung von Data
Protection as a Service auf Hybrid-Cloud-Basis. Die Einfachheit von Installation und Management tragen zur
Senkung der Betriebskosten bei.
Die in Data Domain-Systemen integrierte Data Domain Data Invulnerability Architecture bietet höchste
Zuverlässigkeit und Datenintegrität durch Inline-Verifizierung von Schreib- und Lesevorgängen und automatische
Wiederherstellung nach I/O-Fehlern bei Aufnahme und Abruf. Backup und Recovery können so erfolgreich
ausgeführt werden. Data Domain unterstützt mit NFS, CIFS, VTL, NDMP und Data Domain Boost ein breites Angebot
an Backupoptionen. Durch die Integration von Data Domain Boost in Backup- und Unternehmensanwendungen
werden Backups deutlich schneller und unter verringerter Netzwerkauslastung ausgeführt.
Avamar
Mit der Backupsoftware Avamar können täglich komplette Backups mit Deduplizierung mit variabler Länge für
VMware-Umgebungen sowie für geschäftskritische Anwendungen, NAS, Desktops/Laptops und Remotestandorte
durchgeführt werden. Avamar kann mit einer physischen Appliance für Metadaten oder über die Avamar Virtual
Edition-Appliance (der hier getesteten Variante) bereitgestellt werden. Durch den kombinierten Einsatz von Avamar
und Data Domain werden Teile des Deduplizierungsprozesses über den im Avamar-Client enthaltenen DD BoostCode auf die Clientseite verlagert und dadurch Backupdaten reduziert und Bandbreite eingespart. Das webbasierte
Management von Avamar ermöglicht die zentrale Steuerung einer gesamten Bereitstellung. Das Management kann
auch über vSphere erfolgen.
In VMware-Umgebungen werden Backups auf Gast- und Image-Ebene unterstützt. Avamar ist in vStorage APIs for
Data Protection (VADP) von VMware integriert und ermöglicht Gastbackups ohne Agent. Bei Backups auf ImageEbene wird der Backupprozess von den Anwendungs-VMs nach Bedarf und unter intelligentem Lastenausgleich auf
mehrere Proxy-VMs ausgelagert. Zur Beschleunigung von Backup und Wiederherstellung nutzt Avamar CBT
(Changed Block Tracking) von VMware. Nach dem ersten kompletten Backup werden nur noch geänderte Daten
von Avamar übertragen, es wird jedoch ein vollständiger Recovery-Punkt für die Wiederherstellung erstellt. Diese
„Immer komplett“-Methode liefert eine schnelle Performance bei Backup und Wiederherstellung, wohingegen
herkömmliche Methoden ein Rollback auf das letzte komplette Backup und ein Staging der nachfolgenden
inkrementellen Backups erfordert, was nicht nur mehr Zeit beansprucht, sondern auch zu einer Beeinträchtigung
der Recovery-Zuverlässigkeit führen kann.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
5
Mit Avamar kann die Recovery von einzelnen Dateien und kompletten VMs in einem einzigen Schritt schnell
durchgeführt werden. Außerdem kann auf die auf dem Data Domain-Ziel gespeicherten Avamar-VM-Images direkt
zugegriffen werden. Diese Technik kommt bei Entwicklung/Tests und bei der Recovery-Prüfung häufig zum Einsatz;
VMs können direkt in der Data Domain ausgeführt und verwendet werden, während die ausgeführte VM im
Hintergrund mit vMotion wieder an den Ausgangsort übertragen wird.
Getestete Lösung: EMC Data Domain und Avamar
Von ESG Lab wurde eine EMC Datensicherheitslösung mit Data Domain und Avamar in einer auf einem EMC
XtremIO-All-Flash-Speicherarray gehosteten virtuellen Umgebung getestet. Abbildung 2 zeigt einen konzeptuellen
Lösungsüberblick. Auf der linken Seite ist ein VMware ESX-Hypervisor dargestellt, der mehrere Anwendungs-VMs,
die VM mit Avamar Virtual Edition und Proxy-VMs hostet. Oben ist das Avamar Administrator-Dashboard zu sehen.
Eine Proxy-VM identifiziert mithilfe von VMware-CBT geänderte Daten. Über DD Boost werden Teile des Data
Domain-Deduplizierungsprozesses an Avamar zur clientseitigen Deduplizierung übertragen, damit nur eindeutige
Daten vom Avamar-Client an das Data Domain-System gesendet werden. Das rechts dargestellte, hochskalierbare
Data Domain-System kann gleichzeitig als Ziel für weitere Backup- und Archivierungs-Workloads eingesetzt werden.
Bei diesem Test wurde zur Vermeidung möglicher Speicherengpässe als clientseitige Speicherplattform XtremIO
eingesetzt.
Abbildung 2. Lösungsüberblick: EMC Avamar und Data Domain
Avamar Administrator
Metadaten
VM 1
VM 2
ProxyVM
Avamar
VE-VM
RMAN-Backup
VMware ESXi
Backup
LAN
LAN
Mainframebackup
VADP/CBT
VMDK VM1
VMDK VM2
Data Domain
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Archivierung
Validierung durch ESG Lab: EMC Data Domain und Avamar
6
Validierung durch ESG Lab
Im Rahmen der Validierung führte ESG Lab praktische Tests durch und prüfte Testergebnisse eines MA-Labors von
EMC in Hopkinton, USA. Testkriterien waren die Einfachheit der Integration von Avamar und Data Domain, die
Effizienz im Hinblick auf Kapazität und CPU-Nutzung und die Performance von Backup und Wiederherstellung mit
Fokus auf VMware-Backups.
Einfachheit der Integration
Die Integration von EMC Avamar- und EMC Data Domain-Systemen ist extrem einfach. Die Skalierbarkeit und
integrierte Datensicherheit von Data Domain können daher von Unternehmen bei Backups mit Avamar genutzt
werden. Das von ESG Lab durchgeführte Audit des Integrationsverfahren bestand aus wenigen Schritten und war in
unter fünf Minuten abgeschlossen.
ESG Lab-Test
Zunächst wurde ein eingeschaltetes und mit dem Netzwerk verbundenes Data Domain DD4500-System als Ziel für
Avamar hinzugefügt. Die Data Domain System Manager-GUI oder -CLI sind bei diesem Vorgang nicht erforderlich,
das Provisioning kann komplett über die Avamar Administrator-Managementkonsole erfolgen. Abbildung 3 (links)
zeigt die Registerkarte „Server“ der Avamar Administrator-GUI mit den Back-end-Systemkonfigurationen. Oben
rechts wird ein Avamar-Server mit Back-end-Kapazität angezeigt.
Abbildung 3. Hinzufügen eines Data Domain-Systems über die Avamar Administrator-Konsole
Als Nächstes wurde auf der Registerkarte Server die Option Server Management und dann Add Data Domain
System ausgewählt (Abbildung 3, rechts). Auf der Registerkarte System wurden der qualifizierte Systemname
(dd4500a) und die (bei der Einrichtung des DD4500a-Systems angegebenen) DD Boost-Anmeldeinformationen
eingegeben. Damit wurde das Zielsystem authentifiziert und Schreibberechtigungen für Avamar-Clients vergeben.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
7
Eine wichtige Einstellung ist die Gesamtzahl der Avamar-Clientbackupstreams, die gleichzeitig gestartet werden
können. Bei diesem Test waren es 270 Streams. Da Data Domain als Ziel für mehrere gleichzeitige Backup- und
Archivierungsaufgaben eingesetzt werden kann, muss für ein optimales Gleichgewicht gesorgt werden, damit das
Data Domain-Ziel von keiner Anwendung unbeabsichtigt überbeansprucht wird. Als Nächstes wurden SNMP-Daten
hinzugefügt, um die Erfassung und Anzeige von Details bezüglich Systemintegrität, Warnmeldungen und Kapazität
in Avamar zu ermöglichen.
Nach Ausführung dieser Schritte konnte ESG Lab das Data Domain-Ziel auf dem Avamar Administrator-Dashboard
sehen (Abbildung 4 oben). Über die Registerkarten Server/Server Management konnten zudem mit einem Klick auf
das Symbol dd auf der Symbolleiste die Systemdetails des neu hinzugefügten dd4500a-Systems aufgerufen werden
(u. a. Hostname, belegte und freie Kapazität, geschützte Bytes, Replikationsstatus, Streamlimit und Status von
Verschlüsselung, Authentifizierung und Monitoring, siehe Abbildung 4 unten).
Abbildung 4. Management von Data Domain über die Avamar Administrator-GUI
Nach der ordnungsgemäßen Konfiguration des dd4500a-Ziels bestand der letzte Schritt in der Erstellung einer
Avamar-Backup-Policy für die VMware-VMs. Für den Backupjob VM_Test wurde die Registerkarte Options
ausgewählt. Im Drop-down-Feld wurde Linux VMware Image ausgewählt und Change Block Tracking aktiviert. Nach
Aktivierung des Kontrollkästchens Store Backup on Data Domain system wurde aus der Liste verfügbarer Ziele
dd4500a ausgewählt und auf OK geklickt. Beim nächsten manuellen oder geplanten Backup von Dataset VM_Test
würden die Daten nun direkt an das Data Domain-Ziel gesendet.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
8
Abbildung 5. Erstellen einer Backup-Policy
Bedeutung
Unternehmen bietet die Flexibilität moderner virtualisierter Rechenzentren enorme Vorteile. Für die IT
hingegen – und insbesondere für Backupadministratoren – stellt sie eine große Herausforderung dar. In vielen
Unternehmen gibt es separate Infrastruktursilos und Backupanwendungen für physische und virtuelle Datasets
oder für verschiedene Unternehmensanwendungen. Ihr Betrieb geht mit erhöhtem Zeitaufwand, größeren
Backupzeitfenstern (die Produktionsaktivitäten beeinträchtigen können) und höheren Investitions- und
Betriebskosten einher.
Die Avamar/Data Domain-Systemlösung wurde von ESG Lab unter dem Gesichtspunkt der schnellen und
einfachen Integration und Policy-Erstellung verifiziert. Das Hinzufügen des Data Domain-Ziels über die Avamar
Administrator-Konsole und Erstellen der VM-Backup-Policy war in nur wenigen Schritten in unter 5 Minuten
abgeschlossen. Dank der einfachen und schnellen Integration eignet sich die Lösung ideal für Administratoren zur
Konsolidierung von Backups für ein breites Angebot an Anwendungen, Systemen und Standorten mit flexiblen
Avamar- und Data Domain-Komponenten mit vollem Funktionsumfang.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
9
Performance und Effizienz
Die Performance von Backup und Wiederherstellung hat große Auswirkungen auf den Produktionsbetrieb. Von der
Backupgeschwindigkeit hängt es oft ab, ob alle VMs im Backupzeitfenster gesichert werden können oder Daten
ungeschützt bleiben. Eine schnelle Wiederherstellung ermöglicht die schnelle Wiederaufnahme des geschäftlichen
Betriebs. Die Avamar/Data Domain-Systemlösung ermöglicht dank erweiterter Deduplizierung extrem effiziente
VM-Backups und als Folge eine drastische Reduzierung der zu übertragenden und zu speichernden Datenmenge;
dies wiederum führt zu einer deutlichen Steigerung der Backupperformance. Bei Backups in virtuellen Umgebungen
stellt auch die effiziente Nutzung der Host-CPU-Ressourcen einen wichtigen Faktor dar, da sie eine Störung der
Produktionsaktivitäten durch Datensicherheitsprozesse verhindert.
Backupmethode mit Avamar und Data Domain
Ein wichtiges Alleinstellungsmerkmal der Avamar/Data Domain-Lösung ist die Backupmethodologie. Nach einem
ersten kompletten Backup werden von Avamar nur noch inkrementelle Backups durchgeführt. Durch die
Integration in VMware-CBT werden anschließend nur neue oder geänderte Daten gesichert. DD Boost sorgt dafür,
dass nur eindeutige Daten von Avamar an das Data Domain-System gesendet werden. Metadaten werden immer in
einer separaten Datei gespeichert, damit die für eine Recovery benötigten Daten von Avamar schnell gefunden
werden können. Die geänderten Daten, die gesichert werden, werden zur Erstellung eines Recovery-Punkts nach
jedem inkrementellen Backup auf die vorherigen Backupdaten angewendet. Das bedeutet, dass jedes Backup mit
Avamar nur die Zeit eines inkrementellen Backups beansprucht, im Endergebnis jedoch ein komplettes Backup
darstellt und eine schnelle und effiziente Recovery ermöglicht.
Dank dieser „Immer komplett“-Methode muss die IT, anders als bei herkömmlichen Backupanwendungen, keine
weiteren regelmäßigen kompletten Backups und Katalogaktualisierungen durchführen (siehe Abbildung 6). Diese
zusätzlichen kompletten Backups sind zeit- und arbeitsaufwändig. Die herkömmliche Wiederherstellung erfordert
zudem ein Rollback auf das letzte komplette Backup und die anschließende Bereitstellung inkrementeller Backups –
ein mühevoller Prozess, der zu Verzögerungen und unzuverlässigen Ergebnissen führen kann.
Abbildung 6. Immer-komplett-Backups mit Avamar/Data Domain im Vergleich zu herkömmlichen Methoden
Avamar und Data Domain
Januar
Februar
Immer komplett
Erstes
komplettes
Backup
Herkömmliche Backuplösungen
Januar
Februar
Inkrementelle
Backups
Erstes
komplettes
Backup
Inkrementelle
Backups
Komplettes Backup,
Katalogaktualisierung
Inkrementelle
Backups
Komplettes Backup,
Katalogaktualisierung
Inkrementelle
Backups
Komplettes Backup,
Katalogaktualisierung
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Komplettes Backup,
Katalogaktualisierung
Validierung durch ESG Lab: EMC Data Domain und Avamar
10
VM-Backups und -Wiederherstellungen auf Image-Ebene mit Avamar
Aufgrund der engen Integration von Avamar mit VADP werden bei Backups auf Image-Ebene Backup- und
Deduplizierungsprozesse von Client-VMs auf Proxy-VMs ausgelagert. Client-VMs werden mit vSphere dynamisch
(und unter Lastenausgleich über mehrere Proxys) mit den Avamar-Proxy-VMs verbunden, ohne dass Daten über das
Netzwerk übertragen werden. Auf diese Weise ist ein schnelles Backup mehrerer VMs möglich.
Der Backupprozess wird von VMware-CBT durch Senden einer Liste geänderter Blöcke an Avamar weiter
beschleunigt. Die Blöcke werden mit DD Boost in Segmente variabler Länge unterteilt und vor der Übertragung an
Data Domain dedupliziert.
CBT kann auch zur schnellen Wiederherstellung geänderter Daten auf einer vorhandenen VM verwendet werden.
Anhand des aktuellen VM-Zustands und der CBT-Protokolle ermittelt Avamar jene Blöcke, die aus dem
gewünschten Recovery-Punkt wiederhergestellt werden müssen, und stellt ausschließlich diese Blöcke schnell
wieder her.
ESG Lab-Test
Die Performance- und Effizienztests wurden von ESG Lab mit zwei VMware vCenter ESX 5.5-Servern auf dualen
Cisco UCS 240-Servern durchgeführt. Auf jedem UCS-Server wurden 50 VMs (insgesamt 200 VMs) gehostet. Als
Speicher für die Server dienten zwei XtremIO-Brick-Bausteine mit je 7,56 TB verfügbarem Speicherplatz. Die
Datensicherheit wurde durch eine virtuelle Appliance mit Avamar Virtual Edition 7.2 und Data Domain DD4500 mit
86 TB nutzbarer Kapazität und 10-GbE-Ports bereitgestellt. Als Testdaten wurden diverse Dateien mit einer Größe
von je etwa 1 MB erzeugt und mit einem internen Tool (Data Gen) für die Backupverarbeitung modifiziert, sodass
ein konsistentes Dataset für mehrere Testiterationen entstand.
Es wurden drei Tests durchgeführt:



Simulation eines 28-tägigen Backupzyklus mit 200 VMs
Simulation einer Wiederherstellung von 31 VMs mit CBT-Wiederherstellung
Simulation einer Backupskalierung mit 200 VMs
Die VMs umfassten jeweils etwa 70 GB an Daten. Diese setzten sich aus dem Betriebssystem und den File-basierten
Daten zusammen, die generiert wurden, um erste Backupdaten und zwischen den Backups neu erstellte/geänderte
Daten zu erstellen. Kennzahlen wurden aufgezeichnet für Deduplizierung, Laufzeitperformance von
Backup/Wiederherstellung und CPU-Auslastung. Jeder Test wurde zur Bewertung der Ergebniskonsistenz drei Mal
vollständig durchgeführt. Es wurden sowohl praktische Tests als auch Audits vorheriger Tests durchgeführt.
Zunächst untersuchte ESG Lab die Kapazitätseffizienz der Avamar/Data Domain-Lösung bei der Simulation eines 28tägigen Backupzyklus für 200 VMs. Für jeden Testlauf wurde über das Data Gen-Tool für jede VM ein simuliertes
Dateisystem mit Verzeichnissen und Dateien in einer Größe von etwa 50 GB erstellt. Nach der Durchführung des
ersten kompletten Backups wurden mit dem Tool pro Client 4 % geänderte Daten und 0,125 % neue Daten erzeugt.
Daraufhin wurde ein inkrementelles Backup ausgeführt. Dieser Ablauf wurde zur Simulation eines typischen 4Wochen-Backupzyklus 28 Mal wiederholt. Aufgrund der in Avamar verwendeten „Immer komplett“Backupmethode war nur ein einziges komplettes Backup erforderlich. Es wurden drei Testläufe durchgeführt mit
einem kompletten Reset zwischen den Testläufen für eine saubere Umgebung.
Anhand eines Audits der Testprotokolle wurden Deduplizierungsstatistiken jedes Testlaufs von ESG Lab erfasst. Alle
drei Testläufe des kompletten 28-Tage-Backuptests waren praktisch identisch. Abbildung 7 zeigt die Daten aus einer
Testiteration.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
11
Abbildung 7. Deduplizierung während des 28-Tage-Backuptests
Deduplizierung:
Deduplication:28-Tage-Backuptest
28-Day Backup Test
450
400
350
300
TiB
TiB
250
Deduplizierungsrate
Dedupe rate 72.3 x 72,3 x
200
150
100
50
0
Data Protected
Geschützte
Daten
Data Stored after Dedupe/Compression
Nach Deduplizierung/Komprimierung
gespeicherte Daten
Bedeutung der Zahlen



Die Menge der geschützten VM-Daten betrug 402,15 TiB.
Nach der Komprimierung und Deduplizierung wurden in Data Domain 5,56 TiB Daten gespeichert.
Die Kapazitätsreduzierung für diesen Test betrug 98,6 %, wodurch eine 72,3-fache Deduplizierungsrate
erzielt werden konnten.
Als Nächstes wurde die Backupperformance des 28-Tage-Backupzyklus von ESG Lab überprüft. Das erste Backup der
200 VM-Clients (je 70 GB) dauerte 2 Stunden und 56 Minuten (siehe Abbildung 8). Danach dauerte jedes
inkrementelle Backup mit 4 % geänderten und 0,125 % neuen Daten nur noch 7–10 Minuten.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
12
Abbildung 8. Backupperformance
28-day
Test Backup:Laufzeit
Runtime
28-Tage-Backup:
200.00
180.00
160.00
Minuten
Minutes
140.00
120.00
100.00
80.00
60.00
40.00
20.00
0.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
Bedeutung der Zahlen



Die Laufzeit des ersten kompletten Backups betrug 176 Minuten (2:56:12).
Die Laufzeit der 28 inkrementellen Backups betrug im Durchschnitt 8,68 Minuten.
Jeder Recovery-Punkt repräsentiert ein vollständiges Image des Clients, obwohl nur inkrementelle Daten
übertragen wurden.
Die konzeptuelle Grafik in Abbildung 9 zeigt die Vorteile der Lösung im Hinblick auf Kapazitätseffizienz und Laufzeit.
Auf der linken Seite der Abbildung sind die virtuellen Maschinen und die geschützte Gesamtkapazität zu sehen. CBT
und Deduplizierungsprozesse reduzieren die Menge der zu übertragenden Daten und beschleunigen die Backupzeit.
In diesem Fall wurden durchschnittlich 19,8 GiB pro Tag übertragen, was zu einer durchschnittlichen täglichen
Backupzeit von 8,68 Minuten führte.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
13
Abbildung 9. Datenreduzierung und Backupzeit
28-Tage-Backuptest
Datenübertragung und Backupzeit
Geschützte Daten:
402,15 TiB
Gespeicherte Daten:
5,56 TiB
LAN
Durchschnittliche
tägliche Backupzeit:
8,68 min
Durchschnittlich täglich
übertragene Daten:
19,8 GiB
Als Nächstes überprüfte ESG Lab Daten für einen Wiederherstellungstest mit CBT. Nach einem kompletten Reset
der Umgebung wurde ein neues Dataset von 50 GB für 31 VMs mit je 70 GB erzeugt. Dem ersten kompletten
Backup folgte ein einziger Datenmodifizierungszyklus. Anschließend wurden CBT-Wiederherstellungen für eine
einzige VM, für gleichzeitig 10 VMs und für gleichzeitig 20 VMs durchgeführt. Auf diese Weise wird die
Wiederherstellung für eine VM bzw. für eine Gruppe von VMs nach einer Beschädigung bzw. nach einem Rollback
von Anwendungsdaten auf einen spezifischen Point-in-Time simuliert. Abbildung 10 zeigt die durchschnittliche
Wiederherstellungszeit der drei Testiterationen.
Abbildung 10. Wiederherstellungsperformance
Wiederherstellungszeit
steigender
Restore Timebei
as Clients
ScaleClientzahl
Restore
Wiederherstellung
von 20 Clients
Wiederherstellung
von 10 Clients
Restore
Wiederherstellung
von 11 Client
Client
Restore
0
2
4
6
8
10
12
14
Minuten
Minutes
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
16
18
Validierung durch ESG Lab: EMC Data Domain und Avamar
14
Bedeutung der Zahlen




Es mussten nur geänderte Daten (etwa 1,5 GB pro VM) wiederhergestellt werden.
Die Wiederherstellungsperformance für einen einzigen Client betrug durchschnittlich 7 Minuten.
Die Wiederherstellungsperformance für 10 Clients betrug durchschnittlich 10,5 Minuten.
Die Wiederherstellungsperformance für 20 Clients betrug durchschnittlich 15 Minuten.
Als Nächstes überprüfte ESG Lab den für die Backuptests benötigten CPU-Overhead. Die Backupverarbeitung mit
Avamar und Data Domain umfasst eine zwischen Client und Ziel aufgeteilte Deduplizierung. Anhand eines Audits
der Protokolldateien des 28-Tage-Backuptests ermittelte ESG Lab die CPU-Auslastung des Data Domain-Ziels und
der ESX-Hosts.
Während des 28-Tage-Backuptests erfolgten zwischen den Testläufen jeweils eine automatische Bereinigung und
die Erzeugung neuer Daten, gefolgt von einem kompletten Backup sowie einer Reihe inkrementeller Backups mit
neuen und geänderten Daten, die zwischen den inkrementellen Backups erzeugt wurden. Abbildung 11 zeigt, dass
die CPU-Auslastung des Data Domain-Systems nach einer anfänglichen Spitze von 90 % beim ersten kompletten
Backup während des gesamten Tests unter 30 % blieb. Kleinere Spitzen wurden während der Bereinigung und dem
Reset zwischen den simulierten Wochen gemessen. Die CPU-Auslastung der vier ESX-Hosts blieb sehr gering.
Abbildung 11. CPU-Auslastung auf dem Data Domain-System und den ESX-Servern
CPU-Auslastung:
CPU Utilization: 28-Tage-Backuptest
28-day Backup Test
100
90
80
70
Data Domain
Percentage
%
60
ESX 1
50
ESX 2
40
ESX 3
30
ESX 4
20
10
0
Time
Zeit
Bedeutung der Zahlen


Die Data Domain-CPU-Auslastung betrug während des 28-Tage-Backupzyklus durchschnittlich 23 %, wobei
beim kompletten Backup eine Spitze von etwa 90 % gemessen wurde.
Die CPU-Auslastung lag bei allen vier ESX-Hosts bei durchschnittlich 6–8 % und stieg zu keinem Zeitpunkt
über 15 %.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
15
Zuletzt untersuchte ESG Lab die Performance der Avamar/Data Domain-Lösung bei einer Backupskalierung. Nach
dem ersten kompletten Backup wurden neue und geänderte Daten hinzugefügt und inkrementelle Backups für
jeweils 50 VMs gleichzeitig ausgeführt. Der gleiche Prozess wurde mit 100, 150 und 200 gleichzeitigen
inkrementellen Backups wiederholt. Abbildung 12 zeigt das Datenwachstum für jede Gruppe gleichzeitig
durchgeführter inkrementeller Backups sowie die für die gleichzeitigen inkrementellen Backups benötigte Zeitdauer.
Die dunkelblauen Balken repräsentieren die anfänglichen Datenmengen, die hellblauen Balken zeigen die
geänderten Daten für jede Gruppe von VMs und die orangefarbene Linie repräsentiert die für die Backups
benötigte Zeitdauer. Es ist deutlich zu sehen, dass die Backupperformance durch das Datenwachstum nicht negativ
beeinträchtigt wurde.
Abbildung 12. Skalierungstest: Backupperformance bei wachsendem Datenvolumen
11
200
10.8
180
10.6
160
10.4
140
10.2
120
10
100
9.8
80
9.6
60
9.4
40
9.2
20
9
Minuten
Minutes
TBs
TB
Scale Test: Duration
Concurrent inkrementeller
Incremental Backups
Skalierungstest:
Dauer of
gleichzeitiger
Backups
0
Ausgangsdaten,
Initial Data 200
200VMs
VMs
Inkrementell,50
Incremental
50Vms
VMs
Anfängliche
Initial data
Daten
Inkrementell,
Incremental
100
100VMs
VMs
Inkrementell,
Incremental
150
150
VMs
VMs.
Neue/geänderte
New/changed
data
Daten
Inkrementell,
Incremental
200
200
VMs
VMs
Minuten
Minutes
Bedeutung der Zahlen




Das anfängliche komplette Backup dauerte 184 Minuten.
Die inkrementellen Backups dauerten bei 50 VMs 11 Minuten, bei 100 VMs 8 Minuten, bei 150 VMs
8 Minuten und bei 200 VMs 7 Minuten.
Für die Skalierung auf 200 VMs wurden keine zusätzlichen Proxyserver benötigt.
Der Test wurde mit 200 VMs ausgeführt, doch die globale Deduplizierung der Lösung resultiert bei einem
Zuwachs von VMs im Pool sehr wahrscheinlich in einer Performancesteigerung.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
16
Bedeutung
Kontinuierlich steigende Datenvolumen stellen die IT in vielerlei Hinsicht, vor allem jedoch im Bereich Backup, vor
große Herausforderungen. Unternehmen müssen Daten schützen und aufbewahren, damit sie bei Beschädigungen
oder in Notfällen wiederhergestellt und strenge Compliance- und Governance-Auflagen erfüllt werden können. Die
langfristige Datenspeicherung verursacht allerdings steigende Kosten. Das Datenwachstum wird durch die starke
Zunahme von VMs erheblich gesteigert, wobei Backups häufig redundante Betriebssystem-, Anwendungs- und
Datenkopien speichern.
ESG Lab konnte die deutliche Reduzierung der Menge an Backupdaten durch die Deduplizierungstechnologien der
Avamar/Data Domain-Lösung verifizieren. Die Data Domain-Deduplizierung mit variabler Länge ermöglicht höchste
Deduplizierungsraten. Speicher- und Bandbreitenanforderungen beim Backup werden so auf ein Minimum
reduziert und Zeit und Kosten deutlich eingespart. Zusätzlich ergeben sich damit weitere Zeit- und
Kosteneinsparungen durch die ebenfalls geringeren Bandbreitenanforderungen für die Disaster-RecoveryReplikation. Im Rahmen der Tests wurde auch die Geschwindigkeit des Backups von 200 VMs, gleichzeitiger
Backups und gleichzeitiger Wiederherstellungen gemessen. Der Einsatz von CBT-Wiederherstellungen ermöglicht
eine schnelle Recovery und minimiert die Auswirkungen auf den Datensicherheits-Stack bei Skalierung der VMUmgebung. Schließlich verifizierte ESG Lab, dass während der Verarbeitung einzelner und gleichzeitiger
Backupstreams und der Durchführung von Wiederherstellungsaufgaben genügend CPU-Kapazität auf dem Data
Domain-Ziel und den ESX-Hosts verfügbar bleibt.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
17
Highlights der Validierung durch ESG Lab
 ESG Lab war beeindruckt von der einfachen und schnellen Integration von Avamar und Data Domain für ein
konsolidiertes Management der Datensicherheit.
 Die gemessenen Datendeduplizierungsraten zeigten, dass eine Reduzierung der Kapazität um das 73-Fache
erreicht werden kann, sodass Unternehmen Einsparungen bei Speicher und Bandbreite erzielen können.
 ESG Lab war sehr zufrieden mit der effizienten CPU-Auslastung auf dem Data Domain-Ziel und den ESXiHosts während der gesamten Backupverarbeitung mit ausreichender Kapazität für andere Aufgaben.
 Auch die bei hohen Workloads von Data Domain vorgenommene Auslagerung der Hauptlast von den Hosts
fielen ESG Lab positiv auf.
 Die Backupperformancetests zeigten, dass mit dieser kapazitäts- und netzwerkeffizienten Lösung
Geschwindigkeitsvorteile bei „Immer komplett“-Backups erzielt werden können. ESG Lab konnte zudem
verifizieren, dass gleichzeitige VM-Backups keine negativen Auswirkungen auf die Performance hatten und
die Wiederherstellung mit VMware-CBT schnell und effizient erfolgte.
Wichtige Aspekte
 Mit der Data Domain-Deduplizierung mit variabler Länge werden Speicheranforderungen minimiert,
während durch die Integration von DD Boost durch Verteilung von Teilen der Data Domain-Deduplizierung
auf Avamar zur clientseitigen Deduplizierung die Bandbreite minimiert wird. Das ist bei VM-Backups wichtig,
denn diese enthalten häufig redundante Betriebssystem- und andere Daten.
 Die Effizienz der CPU-Auslastung ist nicht nur für ESXi-Hosts, die Produktionsanwendungen unterstützen,
von großer Bedeutung, sondern auch für das Data Domain-System, das gleichzeitig als Ziel für andere
Datensicherheitsaktivitäten dienen kann.
 Die CBT-Wiederherstellung ist eine gute Alternative, die eine schnelle Wiederherstellung nach einer
Beschädigung spezifischer VM-Daten ermöglicht. Dabei ist allerdings zu beachten, dass bei einer vollständig
zerstörten VM die CBT-Wiederherstellung nicht effektiv ist, da in einem solchen Fall sämtliche VMDKs
wiederhergestellt werden müssen.
 Die Deduplizierungsraten hängen immer von der Art der gesicherten Daten ab. Einige Datentypen (wie z. B.
File-basierte Daten) weisen tendenziell einen hohen Duplizierungsgrad auf, während bei anderen
Datentypen (wie etwa Videos und Bilder) die Duplizierung eher gering ist.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
18
Die ganze Wahrheit
Seit Jahren, so ergeben Umfragen von ESG, haben in mittelständischen Unternehmen und Konzernen die
Verbesserung der Datensicherheit, die Bewältigung des Datenwachstums und die steigende Servervirtualisierung
höchste Priorität im IT-Bereich.2 Die Gründe dafür liegen auf der Hand: Die Transformation von
Produktionsvorgängen hat direkte und starke Auswirkungen auf Sicherheitsmechanismen. Die bahnbrechende
Technologie von VMware hat eine Revolution in Gang gesetzt, die zur Etablierung der Virtualisierung und weltweit
zu einer starken Zunahme von VMs in Unternehmen geführt hat. Der Schutz der entsprechend großen
Datenmengen bleibt nach wie vor eine Herausforderung.
Avamar und Data Domain sind hochentwickelte Datensicherheitslösungen, die kombiniert noch leistungsstärker
sind.


Data Domain war eine bahnbrechende Entwicklung auf dem Gebiet der Deduplizierung, aber auch
Skalierbarkeit und Flexibilität – ein kritischer Faktor für die Datensicherheit in VMware-Umgebungen – sind
zu diesem Zeitpunkt gleichermaßen wichtig, denn Unternehmen müssen ständig neue VMs einrichten und
dafür sorgen, dass hunderte, wenn nicht gar tausende VMs geschützt sind. Data Domain bietet eine
beispiellose Flexibilität und eignet sich als Ziel für verschiedene Backupanwendungen, direkte Backups aus
Unternehmensanwendungen wie Oracle RMAN, SQL, SAP und DB2, direkte Backups vom primären Speicher
wie VMAX3 und XtremIO, Backups von Mainframe- und IBM i-Systemen und Archivierungslösungen wie
SourceOne. Während die IT den Überblick über sämtliche Datensicherheitsaktivitäten behält – etwa
mithilfe von EMC Data Protection Advisor – können Administratoren ihre eigenen Backups durchführen
(z. B. können Datenbankadministratoren RMAN ausführen und Virtualisierungsadministratoren VMBackups). Auf diese Weise lässt sich das Management mehrerer Datensicherheitsaktivitäten verteilen, ohne
dass separate Infrastruktur-Stacks angeschafft und verwaltet werden müssen. Data Domain ist außerdem
dank Data Invulnerability Architecture mit Datenprüfungen, kontinuierlicher Fehlererkennung und
automatischer Fehlerkorrektur als „paranoides“ System für seine inhärente Zuverlässigkeit bekannt. Dank
dieser Merkmale ist es eine absolut solide Lösung für große und kleine Unternehmen und Serviceprovider.
Avamar bietet anwendungs- und VM-konsistente Backups mit einer schnellen, granularen Recovery.
Avamar nutzt VADP für VMware-Backups und ist in vSphere integriert. Durch den Einsatz von Proxy-VMs
mit automatischem Lastenausgleich bietet Avamar genau wie Data Domain die für Umgebungen mit
virtuellen Servern erforderliche Skalierbarkeit. Die Fähigkeit zur Nutzung von CBT für Backup und
Wiederherstellung steigert die Performance beider Aufgaben und reduziert Datenverschiebungen über das
Netzwerk. Avamar bietet zudem sofortigen VM-Zugriff auf unter Data Domain gespeicherte Images (auch
wenn dies im Rahmen dieses Projekts nicht getestet wurde), sodass die von Unternehmen heute zur
Aufrechterhaltung der Produktion geforderte Flexibilität und Fähigkeit zur schnellen Recovery gegeben ist.
ESG Lab hat den kombinierten Einsatz von Avamar und Data Domain in einem realistischen Szenario auf die in einer
Kundenumgebung zu erwartende Performance getestet. Gegenstand des Tests war auch ein für eine moderne ITLandschaft wichtiges Kriterium: die Einfachheit der Integration beider Komponenten. An 200 VMs wurden die
Kapazitätseffizienz der dualen Deduplizierungsmechanismen, die Performancevorteile inkrementeller Backups, die
gleichzeitige Verarbeitung hunderter VM-Backups bei gleichbleibend schneller Performance und die Möglichkeit
der Nutzung von CBT-Wiederherstellungen für eine schnelle Recovery verifiziert.
Viele Unternehmen setzen heute aus zwei wichtigen Gründen auf integrierte Backup-Appliances: Einfachheit der
Bereitstellung und Reduzierung der Investitions- und Betriebskosten. Die Kombination aus Data Domain und
Avamar ist formal keine integrierte Appliance. Allerdings liefert dieser Lösungsansatz höhere Deduplizierungsraten
als herkömmliche integrierte Backup-Appliances und darüber hinaus die für den uneingeschränkten Schutz einer
gesamten Umgebung erforderliche Skalierbarkeit und Flexibilität. Mit diesem leistungsstarken Tandem können
Unternehmen den Schutz von Daten vereinfachen und konsolidieren und gleichzeitig ihre Kosten senken.
2
Quelle: ESG Research Report, 2015 IT Spending Intentions Survey, Februar 2015.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
Validierung durch ESG Lab: EMC Data Domain und Avamar
19
Anhang
Tabelle 1: ESG-Labor-Prüfstand
Backupsoftware
Festplattenziel
Avamar Virtual Edition 7.2
2 x vCPU
6 x vRAM
900 GB Speicherplatz
Data Domain DD4500
DD OS 5.6.0.3
4 x ES30-30-Festplatteneinschübe
4 x 10-GbE-Schnittstellen (2 im Test verwendet)
Virtualisierung
Server
VMware vCenter 5.5.2
4 x Cisco UCS 240
Betriebssystem: SLES 12.3
Speicher
Netzwerk
2 x EMC XtremIO, je 7,56 TB verfügbar
10 GbE
Methoden der Messwerterfassung
Sämtliche Tests sollten ein realistisches Szenario widerspiegeln: tägliche Backups mit realistischen
Datenänderungsraten für einen Monat.



Deduplizierung: Deduplizierungsmessungen wurden direkt vom Data Domain-Ziel unter Verwendung des
Befehls filesys show compression in den Backupjob-Skripten abgerufen. Die Daten wurden sofort nach
jedem Backupjob gesammelt und in eine Protokolldatei geschrieben.
Performance bei Backup/Wiederherstellung: Die Ausführungsdauer von Backup- und
Wiederherstellungsjobs wurde mit dem Unix/Linux-Dienstprogramm time ermittelt. Alle Backup- und
Wiederherstellungsjobs wurden über Skripte und die Avamar-mccli-Befehlszeilenoberfläche ausgeführt.
Über das Dienstprogramm time wurde die Gesamtlaufzeit aller Jobs von Anfang bis Ende ausgegeben. Diese
Ergebnisse wurden während der Tests in eine Protokolldatei geschrieben.
CPU: Informationen über die CPU und andere Systemressourcen für diverse Komponenten in der
Testumgebung wurden mit EMC Data Protection Advisor gesammelt. DPA wurde zudem als zweite
Methode zur Überprüfung der Deduplizierungs- und Laufzeitergebnisse verwendet.
© 2015, Enterprise Strategy Group, Inc. Alle Rechte vorbehalten.
20 Asylum Street | Milford, MA 01757 | Tel: 508.482.0188 Fax: 508.482.0218 | www.esg-global.com
Herunterladen