HADOOP-LÖSUNG MIT EMC ISILON UND CLOUDERA ENTERPRISE

Werbung
HADOOP-LÖSUNG MIT
EMC ISILON UND CLOUDERA
ENTERPRISE
ÜBERBLICK
EMC ISILON
•
Erste und einzige Scale-outNAS-Lösung mit nativer
Hadoop-Unterstützung
•
Unternehmen in verschiedensten Branchen dar. Viele Unternehmen erkennen mittlerweile jedoch,
dass Big Data eine wertvolle Ressource ist, die genutzt werden kann, um neue Geschäftschancen
Höhere Effizienz mit mehr als
80 % Speicherauslastung und
Unterstützung für mehrere
Hadoop-Versionen und Instanzen gleichzeitig
•
•
Das schnelle Datenwachstum stellt heute eine signifikante Herausforderung für zahlreiche
schnellere Ergebnisse mit
Datendeduplizierung
•
DIE BIG DATA-CHANCE
Geringere Kosten und
In-Place-Datenanalysen
•
Effiziente und flexible In-Place-HadoopAnalysen
aufzudecken, die Geschäfte zu beschleunigen und Wettbewerbsvorteile zu sichern. Hadoop, eine
innovative Big Data-Analytik-Engine, die speziell für die Analyse großer Datenmengen entwickelt
wurde, spielt bei der Realisierung dieser Geschäftschancen eine zentrale Rolle.
HERAUSFORDERUNGEN BEI HERKÖMMLICHEN HADOOP-BEREITSTELLUNGEN
Die meisten Unternehmen beginnen, Hadoop zum Erfassen und Speichern von Daten für
zukünftige Analysen in einem konsolidierten Speicherpool einzusetzen. Viele Unternehmen
besitzen bereits NAS- (Network Attached Storage) oder SAN-basierte (Storage Area Network)
Zusätzliche betriebliche
Speichersysteme, die in über das gesamte Unternehmen verteilten Silos vorhanden sind. Wie
Flexibilität mit
können Sie diese Datenspeichersysteme nutzen, ohne separate Kapitalinvestitionen oder
Multiprotokollunterstützung
zusätzliche Ressourcen aufbringen zu müssen? Wie umgehen Unternehmen die folgenden
Herausforderungen?
Schnelle und einfache
Skalierbarkeit auf 68 PB in
einem einzigen Isilon-Cluster
•
Ineffizienter Speicher mit schlechter Auslastung und erschwertem Management aufgrund von
Silos
•
Manuelle Aufnahme großer Datenmengen in Hadoop, die zeit- und ressourcenaufwendig ist
•
Zugriff auf oder Weitergabe von Daten und Analyseergebnissen im gesamten Unternehmen,
da die meisten Systeme HDFS (Hadoop Distributed File System) nicht unterstützen
DER KOMBINIERTE ANSATZ MIT ISILON UND
CLOUDERA
EMC® Isilon® stellt gemeinsam mit Cloudera eine umfassende, getestete und beliebte Lösung
bereit, die Apache Hadoop-Distributionen und zugehörige Projekte umfasst. Die Kombination aus
Isilon Big Data Shared Storage und der Cloudera Enterprise-Datenmanagementplattform
unterstützt Unternehmen dabei, schneller Erkenntnisse zu erhalten, eine konsistente Sicherheit
durchzusetzen, einen Multiprotokollzugriff zu ermöglichen und Speichersilos mit einer
leistungsstarken, aber dennoch einfachen, effizienten, skalierbaren und umfassenden Lösung zu
beseitigen.
LÖSUNGSÜBERBLICK
Isilon ist die erste und einzige Scale-out-NAS-Plattform mit nativer HDFS-Unterstützung zusätzlich
zu herkömmlichen Protokollen wie SMB (Server Message Block), NFS (Network File System),
HTTP und FTP. Damit können Unternehmen ein Shared-Storage-System bereitstellen, das sowohl
für herkömmliche als auch neue und zukünftige Workloads geeignet ist.
Neben der Bereitstellung der Kernelemente von Hadoop liegt der Schwerpunkt von Cloudera
Enterprise auf einer sicheren, verwalteten, geregelten und offenen Big Data-Managementplattform.
Cloudera Enterprise ist eine gründlich getestete, dokumentierte und unterstützte Lösung, die einen
Aufbau der Hadoop-Bereitstellung auf der Basis reiner Vermutungen vermeidet.
Gemeinsam bieten Isilon und Cloudera eine umfassend skalierbare Speicher- und verteilte
Rechnerlösung, mit der die meisten Anforderungen von Unternehmen an die Big Data-Analytik
erfüllt werden.
EMC ISILON SHARED STORAGE
Isilon vereint eine leistungsstarke, aber dennoch einfache, höchst effiziente und massiv skalierbare
Speicherplattform mit integriertem Support für Hadoop-Analysen. Durch die native HDFSUnterstützung von Isilon können Sie schnell eine Lösung für die In-Place-Datenanalyse
implementieren und unnötige Investitionsausgaben, höhere Betriebskosten und eine
zeitaufwendige Replikation Ihrer Big Data an eine separate Infrastruktur vermeiden. Stellen Sie
einfach eine Verbindung zwischen Ihren Rechnerressourcen für die Analyse und Ihrem IsilonSpeichersystem her – Sie können Ihre Analyseprojekte unmittelbar beginnen.
Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016
SCHNELLERE ERKENNTNISSE
Durch den In-Place-Ansatz für die Datenanalyse können Sie sich mit Isilon die Zeit und
Ressourcen für die Replikation Ihrer Big Data an eine separate Hadoop-Infrastruktur sparen.
Beispielsweise kann es mehr als 24 Stunden dauern, um 100 TB Daten über eine 10-Gbit-Leitung
zu übertragen. Stattdessen können Sie mit Isilon Datenanalyseprojekte unmittelbar initiieren und
schneller Ergebnisse erhalten.
MEHR FLEXIBILITÄT
Isilon unterstützt mehrere Instanzen und mehrere Versionen von Apache Hadoop-Distributionen
gleichzeitig. So können Sie die Analysetools nutzen, die Sie für die Analyse Ihrer verschiedenen
unstrukturierten Daten benötigen. Zusätzlich zur nativen Unterstützung für HDFS 1.0 und
HDFS 2.0 bieten Isilon-Lösungen eine integrierte Unterstützung für zahlreiche
Branchenstandardprotokolle wie NFS, SMB, HTTP, FTP und SWIFT sowie einen REST-basierten
Objektzugriff.
MASSIVE SKALIERBARKEIT
Mit Isilon sichern Sie sich viel Raum für das Wachstum Ihrer unstrukturierten Datenressourcen und
der damit verbundenen Analyseprojekte. Isilon kann von einer Kapazität von 18 TB auf 68 TB in
einem einzigen Isilon-Cluster skaliert werden. Dank des EMC Isilon OneFS®-Betriebssystems
CLOUDERA ENTERPRISE
•
Unified: ein integriertes System,
das verschiedene Benutzer und
Anwendungs-Workloads in
einem Speicherpool mit Daten in
einer gemeinsamen
Infrastruktur zusammenbringt,
ohne dass eine
Datenverschiebung erforderlich
ist
•
Ansatz und der Möglichkeit, ein Scale-out im Einklang mit Ihren geschäftlichen Anforderungen
durchzuführen. Mit Isilon können Sie Kapazität und Performance skalieren.
SCHUTZ FÜR IHRE BIG DATA-RESSOURCEN
Isilon bietet Datensicherheit und -verfügbarkeit auf bisher unerreichtem Niveau und erfüllt so
verschiedenste Enterprise-Anforderungen. Mit OneFS können alle Nodes im Isilon-Speichercluster
zu NameNodes werden, wodurch die Ausfallsicherheit Ihrer Hadoop-Umgebung verbessert wird.
Isilon bietet zudem End-to-End-Datensicherheitsoptionen für eine schnelle und effiziente
Sicher: Perimetersicherheit,
Datenbackup- und Recovery-Funktion. Sie können Snapshots so oft planen, wie es zur Erfüllung
Authentifizierung,
Ihrer speziellen Recovery Point Objectives erforderlich ist. Für einen zuverlässigen Disaster-
granulare Autorisierung
Recovery-Schutz bietet Isilon eine schnelle Datenreplikation mit einfach aufrufbarem Failover und
und Datensicherheit
•
kann ein Speichersystem symmetrisch oder unabhängig wachsen, wenn mehr Speicherplatz oder
Verarbeitungsleistung erforderlich wird. Damit profitieren Sie von einem echten Grow-as-you-go-
Verwaltet: native
Hochverfügbarkeit,
Fehlertoleranz und Speicher mit
automatischer Fehlerkorrektur,
Failback, um die Verfügbarkeit Ihrer Datenressourcen weiter zu steigern. Da Clients außerdem
basierend auf der Last automatisch an Nodes weitergeleitet werden, wird eine übermäßige
Belegung bereits stark belasteter Speicher-Nodes mit hohen Workload-Volumen vermieden.
Darüber hinaus bieten wir mit der Verwendung von Access Zone eine Trennung des
Datenverkehrs, damit Hadoop-Workloads von anderen wichtigen Workloads isoliert werden
können.
automatisierte Backup- und
Recovery-Funktionen sowie
erweitertes System- und
Datenmanagement
•
SICHERHEIT FÜR IHRE BIG DATA-RESSOURCEN
Zur Einhaltung von behördlichen Auflagen und Corporate-Governance-Anforderungen bietet Isilon
solide Sicherheitsoptionen wie Dateisystemaudits und WORM-Datensicherheit (Write Once, Read
Offen: Von Apache lizenzierte
Many), um ein versehentliches oder böswilliges Ändern oder Löschen zu vermeiden. Mit Isilon
Open Source, damit Ihre Daten
können Sie außerdem eine sichere Rollentrennung zwischen Speicheradministration und
und Anwendungen stets bei
Ihnen bleiben, und eine offene
Plattform, die mit allen
Dateisystemzugriff sowie Authentifizierungszonen festlegen, um sichere, isolierte Speicherpools
für bestimmte Abteilungen in Ihrem Unternehmen zu erstellen. Wir bieten eine End-to-EndVerschlüsselungslösung, unabhängig davon, ob Sie In-Flight- oder At-Rest-Daten verarbeiten.
vorhandenen Investitionen in
Technologie und Know-how
verbunden werden kann
Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016
BESSERE SPEICHERAUSLASTUNG
Mit Isilon können Sie Ihre Speicherinfrastruktur konsolidieren, einschließlich halb strukturierter und
unstrukturierter Datenressourcen. Sie profitieren von einer Speicherauslastungsrate von mehr als
80 Prozent, die durch die Nutzung der EMC Isilon SmartDedupe-Datendeduplizierung zur
Vermeidung redundanter Daten um weitere bis zu 35 Prozent verbessert werden kann. Sie
benötigen weniger Speicherkapazität und physischen Platz für Ihr Datenvolumen und reduzieren
so sowohl den anfänglichen Kapitalaufwand als auch die laufenden Betriebskosten.
CLOUDERA ENTERPRISE
Cloudera Enterprise unterstützt Sie auf dem Weg zu einem datengesteuerten Unternehmen, indem
Sie das Beste aus der Open-Source-Community mit den erforderlichen Funktionen der EnterpriseKlasse nutzen, damit Ihr Unternehmen Apache Hadoop erfolgreich einsetzen kann. Cloudera
Enterprise wurde speziell für erfolgskritische Umgebungen entwickelt und beinhaltet CDH, die
weltweit beliebteste Hadoop-basierte Open-Source-Plattform, sowie erweiterte
Systemmanagement- und Datenmanagementtools. Darüber hinaus erhalten Sie einen dedizierten
Support und Communityratschläge von unserem erstklassigen Team mit Hadoop-Entwicklern und Experten. Cloudera ist Ihr Partner auf dem Weg zu Big Data.
DATENMANAGEMENT NEU DURCHDACHT
Cloudera Enterprise ist darauf ausgelegt, als Datenhub für das Unternehmen zu agieren. Die
Lösung bietet Folgendes:
•
Eine enorm skalierbare Plattform zum Speichern beliebiger Datenmengen oder -typen in ihrer
ursprünglichen Form über einen flexiblen gewünschten oder erforderlichen Zeitraum
•
Integration in Ihre vorhandene Infrastruktur und Toolsammlung
•
Flexibilität für die Ausführung vielfältiger Enterprise Workloads – darunter Stapelverarbeitung,
interaktives SQL, Enterprise-Suche und erweiterte Analysen
•
Stabile, für Unternehmen erforderliche Funktionen für Sicherheit, Governance, Schutz der
Daten und Management
Mit Cloudera Enterprise können moderne führende Unternehmen ihre Daten in das Zentrum der
Betriebsabläufe stellen, um die geschäftliche Transparenz zu steigern, Kosten zu reduzieren sowie
gleichzeitig Risiken und Complianceanforderungen erfolgreich zu managen.
Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016
ONLINE NOSQL – HBASE
HBase ist ein verteilter Schlüsselwertspeicher, mit dem Sie Echtzeitanwendungen für riesige
Tabellen mit Milliarden von Zeilen und Millionen von Spalten mit schnellem zufälligem Zugriff
erstellen können. Wenn Sie HBase als Teil der Cloudera Enterprise Flex Edition oder Data Hub
Edition im Rahmen eines Enterprise-Datenhubs bereitstellen, können Sie sich auf unseren
marktführenden technischen Support für HBase verlassen und aktiv die Zukunft des Projekts
mitgestalten.
ANALYTIC SQL – CLOUDERA IMPALA
Cloudera Impala ist die branchenführende SQL-Abfrage-Engine für MPP-Anwendungen (Massively
Parallel Processing), die nativ in Apache Hadoop ausgeführt wird. Mit Impala ermöglichen Sie es
Analysten und Data Scientists, mithilfe vorhandener BI-Tools (Business Intelligence) und
Kenntnisse über eine Branchenstandard-SQL-Benutzeroberfläche direkt mit allen in Hadoop
gespeicherten Daten zu interagieren. Sie können außerdem Selfservice-Business-Intelligence an
Hadoop auslagern und damit sowohl die Belastung für vorhandene analytische Datenbanken als
auch Ihr „BI-Backlog“ verkleinern.
SUCHE – CLOUDERA SEARCH
Mit Cloudera Search können Ihre Benutzer Daten in Hadoop so abfragen und durchsuchen, wie
sie es von Google oder ihrer bevorzugten E-Commerce-Website gewohnt sind. Unterstützt von
Apache Hadoop und Apache Solr, dem Enterprise-Standard für die Open-Source-Suche, bietet
Cloudera Search Skalierung und Zuverlässigkeit für eine neue Generation integrierter
Suchfunktionen für mehrere Workloads. Durch die einzigartige Integration in Cloudera Enterprise
bietet Cloudera Search dieselbe Fehlertoleranz, Skalierbarkeit, Transparenz, Sicherheit und
Flexibilität, die für andere Enterprise-Datenhub-Workloads bereitgestellt werden.
SPEICHERINTERNE FUNKTIONEN FÜR MASCHINELLES LERNEN UND
STREAMVERARBEITUNG – APACHE SPARK
Apache Spark (in Entwicklung) ist ein Open-Source-Framework für die parallele
Datenverarbeitung, das Apache Hadoop ergänzt, um die Entwicklung schneller, einheitlicher Big
Data-Anwendungen zu vereinfachen, die Stapel-, Streaming- und interaktive Analysen Ihrer
gesamten Daten vereinen.
Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016
ZUSAMMENFASSUNG
EMC Isilon bietet zusammen mit Cloudera eine Speicher -und Analyselösung für Big Data, die
leistungsstark, aber dennoch einfach und höchst effizient ist. Die Lösung stellt eine enorm
skalierbare Shared-Storage-Plattform und branchenführende Hadoop-Analysedistributionen bereit.
Mit Isilon können Sie Ihre Speicherinfrastruktur rationalisieren, indem Sie umfangreiche Datei- und
unstrukturierte Datenressourcen konsolidieren und so Speichersilos vermeiden und Kosten
reduzieren. Mithilfe von Isilon-Lösungen können Sie durch In-Place-Analysen außerdem schneller
Erkenntnisse gewinnen. Gleichzeitig erhalten Sie die Flexibilität, mehrere Instanzen von Apache
Hadoop-Distributionen von verschiedenen Anbietern gleichzeitig zu unterstützen.
Mit Cloudera Enterprise erhalten neben den Kernelementen von Hadoop zusätzliche
Komponenten wie eine Benutzeroberfläche, erforderliche Unternehmensfunktionen wie Sicherheit
KONTAKT
•
Wenn Sie mehr darüber
erfahren möchten, wie Sie mit
den Produkten, Services und
sowie Optionen für die Integration in ein breites Angebot an Hardware- und Softwarelösungen. Die
Integration wurde bereits komplett für Sie abgeschlossen und die gesamte Lösung ist gründlich
getestet und vollständig dokumentiert. Da Sie beim Aufbau Ihrer Hadoop-Bereitstellung auf reine
Vermutungen verzichten können, bietet Ihnen Cloudera Enterprise eine rationalisierte Möglichkeit,
reale geschäftliche Probleme erfolgreich zu beheben.
Lösungen von Dell EMC Ihre
Geschäfts- und ITHerausforderungen meistern
können, wenden Sie sich an
Ihren EMC Vertriebsmitarbeiter
vor Ort oder einen
autorisierten Reseller. Oder
besuchen Sie uns unter
www.germany.emc.com/isilon.
MACHEN SIE DEN NÄCHSTEN SCHRITT
Wenn Sie mehr darüber erfahren möchten, wie Ihr Unternehmen von EMC Isilon-Speicher- und Analyselösungen für Big Data profitieren kann, wenden Sie sich an Ihren EMC Account Manager
oder einen autorisierten Reseller.
Sehen Sie sich außerdem unsere Lösungen im EMC Store unter https://store.emc.com/isilon und
Cloudera-Lösungen unter www.cloudera.com an.
Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016
Herunterladen