HADOOP-LÖSUNG MIT EMC ISILON UND CLOUDERA ENTERPRISE ÜBERBLICK EMC ISILON • Erste und einzige Scale-outNAS-Lösung mit nativer Hadoop-Unterstützung • Unternehmen in verschiedensten Branchen dar. Viele Unternehmen erkennen mittlerweile jedoch, dass Big Data eine wertvolle Ressource ist, die genutzt werden kann, um neue Geschäftschancen Höhere Effizienz mit mehr als 80 % Speicherauslastung und Unterstützung für mehrere Hadoop-Versionen und Instanzen gleichzeitig • • Das schnelle Datenwachstum stellt heute eine signifikante Herausforderung für zahlreiche schnellere Ergebnisse mit Datendeduplizierung • DIE BIG DATA-CHANCE Geringere Kosten und In-Place-Datenanalysen • Effiziente und flexible In-Place-HadoopAnalysen aufzudecken, die Geschäfte zu beschleunigen und Wettbewerbsvorteile zu sichern. Hadoop, eine innovative Big Data-Analytik-Engine, die speziell für die Analyse großer Datenmengen entwickelt wurde, spielt bei der Realisierung dieser Geschäftschancen eine zentrale Rolle. HERAUSFORDERUNGEN BEI HERKÖMMLICHEN HADOOP-BEREITSTELLUNGEN Die meisten Unternehmen beginnen, Hadoop zum Erfassen und Speichern von Daten für zukünftige Analysen in einem konsolidierten Speicherpool einzusetzen. Viele Unternehmen besitzen bereits NAS- (Network Attached Storage) oder SAN-basierte (Storage Area Network) Zusätzliche betriebliche Speichersysteme, die in über das gesamte Unternehmen verteilten Silos vorhanden sind. Wie Flexibilität mit können Sie diese Datenspeichersysteme nutzen, ohne separate Kapitalinvestitionen oder Multiprotokollunterstützung zusätzliche Ressourcen aufbringen zu müssen? Wie umgehen Unternehmen die folgenden Herausforderungen? Schnelle und einfache Skalierbarkeit auf 68 PB in einem einzigen Isilon-Cluster • Ineffizienter Speicher mit schlechter Auslastung und erschwertem Management aufgrund von Silos • Manuelle Aufnahme großer Datenmengen in Hadoop, die zeit- und ressourcenaufwendig ist • Zugriff auf oder Weitergabe von Daten und Analyseergebnissen im gesamten Unternehmen, da die meisten Systeme HDFS (Hadoop Distributed File System) nicht unterstützen DER KOMBINIERTE ANSATZ MIT ISILON UND CLOUDERA EMC® Isilon® stellt gemeinsam mit Cloudera eine umfassende, getestete und beliebte Lösung bereit, die Apache Hadoop-Distributionen und zugehörige Projekte umfasst. Die Kombination aus Isilon Big Data Shared Storage und der Cloudera Enterprise-Datenmanagementplattform unterstützt Unternehmen dabei, schneller Erkenntnisse zu erhalten, eine konsistente Sicherheit durchzusetzen, einen Multiprotokollzugriff zu ermöglichen und Speichersilos mit einer leistungsstarken, aber dennoch einfachen, effizienten, skalierbaren und umfassenden Lösung zu beseitigen. LÖSUNGSÜBERBLICK Isilon ist die erste und einzige Scale-out-NAS-Plattform mit nativer HDFS-Unterstützung zusätzlich zu herkömmlichen Protokollen wie SMB (Server Message Block), NFS (Network File System), HTTP und FTP. Damit können Unternehmen ein Shared-Storage-System bereitstellen, das sowohl für herkömmliche als auch neue und zukünftige Workloads geeignet ist. Neben der Bereitstellung der Kernelemente von Hadoop liegt der Schwerpunkt von Cloudera Enterprise auf einer sicheren, verwalteten, geregelten und offenen Big Data-Managementplattform. Cloudera Enterprise ist eine gründlich getestete, dokumentierte und unterstützte Lösung, die einen Aufbau der Hadoop-Bereitstellung auf der Basis reiner Vermutungen vermeidet. Gemeinsam bieten Isilon und Cloudera eine umfassend skalierbare Speicher- und verteilte Rechnerlösung, mit der die meisten Anforderungen von Unternehmen an die Big Data-Analytik erfüllt werden. EMC ISILON SHARED STORAGE Isilon vereint eine leistungsstarke, aber dennoch einfache, höchst effiziente und massiv skalierbare Speicherplattform mit integriertem Support für Hadoop-Analysen. Durch die native HDFSUnterstützung von Isilon können Sie schnell eine Lösung für die In-Place-Datenanalyse implementieren und unnötige Investitionsausgaben, höhere Betriebskosten und eine zeitaufwendige Replikation Ihrer Big Data an eine separate Infrastruktur vermeiden. Stellen Sie einfach eine Verbindung zwischen Ihren Rechnerressourcen für die Analyse und Ihrem IsilonSpeichersystem her – Sie können Ihre Analyseprojekte unmittelbar beginnen. Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016 SCHNELLERE ERKENNTNISSE Durch den In-Place-Ansatz für die Datenanalyse können Sie sich mit Isilon die Zeit und Ressourcen für die Replikation Ihrer Big Data an eine separate Hadoop-Infrastruktur sparen. Beispielsweise kann es mehr als 24 Stunden dauern, um 100 TB Daten über eine 10-Gbit-Leitung zu übertragen. Stattdessen können Sie mit Isilon Datenanalyseprojekte unmittelbar initiieren und schneller Ergebnisse erhalten. MEHR FLEXIBILITÄT Isilon unterstützt mehrere Instanzen und mehrere Versionen von Apache Hadoop-Distributionen gleichzeitig. So können Sie die Analysetools nutzen, die Sie für die Analyse Ihrer verschiedenen unstrukturierten Daten benötigen. Zusätzlich zur nativen Unterstützung für HDFS 1.0 und HDFS 2.0 bieten Isilon-Lösungen eine integrierte Unterstützung für zahlreiche Branchenstandardprotokolle wie NFS, SMB, HTTP, FTP und SWIFT sowie einen REST-basierten Objektzugriff. MASSIVE SKALIERBARKEIT Mit Isilon sichern Sie sich viel Raum für das Wachstum Ihrer unstrukturierten Datenressourcen und der damit verbundenen Analyseprojekte. Isilon kann von einer Kapazität von 18 TB auf 68 TB in einem einzigen Isilon-Cluster skaliert werden. Dank des EMC Isilon OneFS®-Betriebssystems CLOUDERA ENTERPRISE • Unified: ein integriertes System, das verschiedene Benutzer und Anwendungs-Workloads in einem Speicherpool mit Daten in einer gemeinsamen Infrastruktur zusammenbringt, ohne dass eine Datenverschiebung erforderlich ist • Ansatz und der Möglichkeit, ein Scale-out im Einklang mit Ihren geschäftlichen Anforderungen durchzuführen. Mit Isilon können Sie Kapazität und Performance skalieren. SCHUTZ FÜR IHRE BIG DATA-RESSOURCEN Isilon bietet Datensicherheit und -verfügbarkeit auf bisher unerreichtem Niveau und erfüllt so verschiedenste Enterprise-Anforderungen. Mit OneFS können alle Nodes im Isilon-Speichercluster zu NameNodes werden, wodurch die Ausfallsicherheit Ihrer Hadoop-Umgebung verbessert wird. Isilon bietet zudem End-to-End-Datensicherheitsoptionen für eine schnelle und effiziente Sicher: Perimetersicherheit, Datenbackup- und Recovery-Funktion. Sie können Snapshots so oft planen, wie es zur Erfüllung Authentifizierung, Ihrer speziellen Recovery Point Objectives erforderlich ist. Für einen zuverlässigen Disaster- granulare Autorisierung Recovery-Schutz bietet Isilon eine schnelle Datenreplikation mit einfach aufrufbarem Failover und und Datensicherheit • kann ein Speichersystem symmetrisch oder unabhängig wachsen, wenn mehr Speicherplatz oder Verarbeitungsleistung erforderlich wird. Damit profitieren Sie von einem echten Grow-as-you-go- Verwaltet: native Hochverfügbarkeit, Fehlertoleranz und Speicher mit automatischer Fehlerkorrektur, Failback, um die Verfügbarkeit Ihrer Datenressourcen weiter zu steigern. Da Clients außerdem basierend auf der Last automatisch an Nodes weitergeleitet werden, wird eine übermäßige Belegung bereits stark belasteter Speicher-Nodes mit hohen Workload-Volumen vermieden. Darüber hinaus bieten wir mit der Verwendung von Access Zone eine Trennung des Datenverkehrs, damit Hadoop-Workloads von anderen wichtigen Workloads isoliert werden können. automatisierte Backup- und Recovery-Funktionen sowie erweitertes System- und Datenmanagement • SICHERHEIT FÜR IHRE BIG DATA-RESSOURCEN Zur Einhaltung von behördlichen Auflagen und Corporate-Governance-Anforderungen bietet Isilon solide Sicherheitsoptionen wie Dateisystemaudits und WORM-Datensicherheit (Write Once, Read Offen: Von Apache lizenzierte Many), um ein versehentliches oder böswilliges Ändern oder Löschen zu vermeiden. Mit Isilon Open Source, damit Ihre Daten können Sie außerdem eine sichere Rollentrennung zwischen Speicheradministration und und Anwendungen stets bei Ihnen bleiben, und eine offene Plattform, die mit allen Dateisystemzugriff sowie Authentifizierungszonen festlegen, um sichere, isolierte Speicherpools für bestimmte Abteilungen in Ihrem Unternehmen zu erstellen. Wir bieten eine End-to-EndVerschlüsselungslösung, unabhängig davon, ob Sie In-Flight- oder At-Rest-Daten verarbeiten. vorhandenen Investitionen in Technologie und Know-how verbunden werden kann Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016 BESSERE SPEICHERAUSLASTUNG Mit Isilon können Sie Ihre Speicherinfrastruktur konsolidieren, einschließlich halb strukturierter und unstrukturierter Datenressourcen. Sie profitieren von einer Speicherauslastungsrate von mehr als 80 Prozent, die durch die Nutzung der EMC Isilon SmartDedupe-Datendeduplizierung zur Vermeidung redundanter Daten um weitere bis zu 35 Prozent verbessert werden kann. Sie benötigen weniger Speicherkapazität und physischen Platz für Ihr Datenvolumen und reduzieren so sowohl den anfänglichen Kapitalaufwand als auch die laufenden Betriebskosten. CLOUDERA ENTERPRISE Cloudera Enterprise unterstützt Sie auf dem Weg zu einem datengesteuerten Unternehmen, indem Sie das Beste aus der Open-Source-Community mit den erforderlichen Funktionen der EnterpriseKlasse nutzen, damit Ihr Unternehmen Apache Hadoop erfolgreich einsetzen kann. Cloudera Enterprise wurde speziell für erfolgskritische Umgebungen entwickelt und beinhaltet CDH, die weltweit beliebteste Hadoop-basierte Open-Source-Plattform, sowie erweiterte Systemmanagement- und Datenmanagementtools. Darüber hinaus erhalten Sie einen dedizierten Support und Communityratschläge von unserem erstklassigen Team mit Hadoop-Entwicklern und Experten. Cloudera ist Ihr Partner auf dem Weg zu Big Data. DATENMANAGEMENT NEU DURCHDACHT Cloudera Enterprise ist darauf ausgelegt, als Datenhub für das Unternehmen zu agieren. Die Lösung bietet Folgendes: • Eine enorm skalierbare Plattform zum Speichern beliebiger Datenmengen oder -typen in ihrer ursprünglichen Form über einen flexiblen gewünschten oder erforderlichen Zeitraum • Integration in Ihre vorhandene Infrastruktur und Toolsammlung • Flexibilität für die Ausführung vielfältiger Enterprise Workloads – darunter Stapelverarbeitung, interaktives SQL, Enterprise-Suche und erweiterte Analysen • Stabile, für Unternehmen erforderliche Funktionen für Sicherheit, Governance, Schutz der Daten und Management Mit Cloudera Enterprise können moderne führende Unternehmen ihre Daten in das Zentrum der Betriebsabläufe stellen, um die geschäftliche Transparenz zu steigern, Kosten zu reduzieren sowie gleichzeitig Risiken und Complianceanforderungen erfolgreich zu managen. Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016 ONLINE NOSQL – HBASE HBase ist ein verteilter Schlüsselwertspeicher, mit dem Sie Echtzeitanwendungen für riesige Tabellen mit Milliarden von Zeilen und Millionen von Spalten mit schnellem zufälligem Zugriff erstellen können. Wenn Sie HBase als Teil der Cloudera Enterprise Flex Edition oder Data Hub Edition im Rahmen eines Enterprise-Datenhubs bereitstellen, können Sie sich auf unseren marktführenden technischen Support für HBase verlassen und aktiv die Zukunft des Projekts mitgestalten. ANALYTIC SQL – CLOUDERA IMPALA Cloudera Impala ist die branchenführende SQL-Abfrage-Engine für MPP-Anwendungen (Massively Parallel Processing), die nativ in Apache Hadoop ausgeführt wird. Mit Impala ermöglichen Sie es Analysten und Data Scientists, mithilfe vorhandener BI-Tools (Business Intelligence) und Kenntnisse über eine Branchenstandard-SQL-Benutzeroberfläche direkt mit allen in Hadoop gespeicherten Daten zu interagieren. Sie können außerdem Selfservice-Business-Intelligence an Hadoop auslagern und damit sowohl die Belastung für vorhandene analytische Datenbanken als auch Ihr „BI-Backlog“ verkleinern. SUCHE – CLOUDERA SEARCH Mit Cloudera Search können Ihre Benutzer Daten in Hadoop so abfragen und durchsuchen, wie sie es von Google oder ihrer bevorzugten E-Commerce-Website gewohnt sind. Unterstützt von Apache Hadoop und Apache Solr, dem Enterprise-Standard für die Open-Source-Suche, bietet Cloudera Search Skalierung und Zuverlässigkeit für eine neue Generation integrierter Suchfunktionen für mehrere Workloads. Durch die einzigartige Integration in Cloudera Enterprise bietet Cloudera Search dieselbe Fehlertoleranz, Skalierbarkeit, Transparenz, Sicherheit und Flexibilität, die für andere Enterprise-Datenhub-Workloads bereitgestellt werden. SPEICHERINTERNE FUNKTIONEN FÜR MASCHINELLES LERNEN UND STREAMVERARBEITUNG – APACHE SPARK Apache Spark (in Entwicklung) ist ein Open-Source-Framework für die parallele Datenverarbeitung, das Apache Hadoop ergänzt, um die Entwicklung schneller, einheitlicher Big Data-Anwendungen zu vereinfachen, die Stapel-, Streaming- und interaktive Analysen Ihrer gesamten Daten vereinen. Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016 ZUSAMMENFASSUNG EMC Isilon bietet zusammen mit Cloudera eine Speicher -und Analyselösung für Big Data, die leistungsstark, aber dennoch einfach und höchst effizient ist. Die Lösung stellt eine enorm skalierbare Shared-Storage-Plattform und branchenführende Hadoop-Analysedistributionen bereit. Mit Isilon können Sie Ihre Speicherinfrastruktur rationalisieren, indem Sie umfangreiche Datei- und unstrukturierte Datenressourcen konsolidieren und so Speichersilos vermeiden und Kosten reduzieren. Mithilfe von Isilon-Lösungen können Sie durch In-Place-Analysen außerdem schneller Erkenntnisse gewinnen. Gleichzeitig erhalten Sie die Flexibilität, mehrere Instanzen von Apache Hadoop-Distributionen von verschiedenen Anbietern gleichzeitig zu unterstützen. Mit Cloudera Enterprise erhalten neben den Kernelementen von Hadoop zusätzliche Komponenten wie eine Benutzeroberfläche, erforderliche Unternehmensfunktionen wie Sicherheit KONTAKT • Wenn Sie mehr darüber erfahren möchten, wie Sie mit den Produkten, Services und sowie Optionen für die Integration in ein breites Angebot an Hardware- und Softwarelösungen. Die Integration wurde bereits komplett für Sie abgeschlossen und die gesamte Lösung ist gründlich getestet und vollständig dokumentiert. Da Sie beim Aufbau Ihrer Hadoop-Bereitstellung auf reine Vermutungen verzichten können, bietet Ihnen Cloudera Enterprise eine rationalisierte Möglichkeit, reale geschäftliche Probleme erfolgreich zu beheben. Lösungen von Dell EMC Ihre Geschäfts- und ITHerausforderungen meistern können, wenden Sie sich an Ihren EMC Vertriebsmitarbeiter vor Ort oder einen autorisierten Reseller. Oder besuchen Sie uns unter www.germany.emc.com/isilon. MACHEN SIE DEN NÄCHSTEN SCHRITT Wenn Sie mehr darüber erfahren möchten, wie Ihr Unternehmen von EMC Isilon-Speicher- und Analyselösungen für Big Data profitieren kann, wenden Sie sich an Ihren EMC Account Manager oder einen autorisierten Reseller. Sehen Sie sich außerdem unsere Lösungen im EMC Store unter https://store.emc.com/isilon und Cloudera-Lösungen unter www.cloudera.com an. Dell EMC Isilon und Cloudera CDH – Lösungsüberblick – September 2016