Apache Spark Training for Data Scientists Zielgruppe: Analysten, Software-Entwickler Software-Architekten Dauer: 3 Tage Preis: 1.800 Euro zzgl. MwSt. Abstract Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb von kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet. Dieses Training richtet sich primär an Data Scientists und vermittelt den grundlegenden Aufbau und die Architektur von Spark, sowie den Umgang mit mächtigen Frontend-Tools aus dem Spark-Ökosystem zur Durchführung der Analysen. Ein inhaltlicher Schwerpunkt des Trainings ist Machine Learning. Nach einer allgemeinen Einführung, wird die Spark MLlib eingehend vorgestellt, eine Bibliothek, welche dem Anwender viele mächtige Machine Learning Algorithmen „out oft he box“ zur Verfügung stellt. In diesem Training steht immer die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmern geübt werden. Dabei wird Python als Programmiersprache verwendet. Zielgruppe: Data Scientists Dauer: 3 Tage Agenda: Tag 1 -- Spark • Einführung in Apache Spark • Einführung in Apache Zeppelin inovex GmbH | Ludwig-Erhard-Allee 6 | 76131 Karlsruhe | Tel. +49 721 619021-0 | [email protected] | www.inovex.de Apache Spark Training for Data Scientists • • • Spark API und RDDs KeyValue-RDD und Joins Spark SQL und Dataframes/DataSets Tag 2 -- Machine Learning • Einführung in Machine Learning o Supervised / Unsupervised Learning o Features Extraction o Validation Tag 3 -- Machine Learning in der Praxis • Überblick über Modelle, Algorithmen und ihre Einsatzgebiete • Vor- und Aufbereitung der Daten • Machine Learning in der Praxis: o Anwendung von Spark ML auf einer großen Datenbasis Trainingsorte: Karlsruhe inovex GmbH Office Karlsruhe Ludwig-Erhard-Allee 6 76131 Karlsruhe Tel. +49 721 619021-0 Köln inovex GmbH Office Köln Kupferhütte 4.1 Schanzenstraße 6 – 20 51063 Köln Tel. +49 173 3181 064 inovex GmbH | Ludwig-Erhard-Allee 6 | 76131 Karlsruhe | Tel. +49 721 619021-0 | [email protected] | www.inovex.de Apache Spark Training for Data Scientists München inovex GmbH Office München Valentin-Linhof-Straße 2 81829 München Tel. +49 89 726 332 62-0 Sollten Sie Fragen zum Training haben, eine Hotelempfehlung benötigen oder ein anderes Anliegen rund um unsere Trainings haben, kontaktieren Sie uns bitte unter [email protected]. Vielen Dank! Wir freuen uns auf Sie! inovex GmbH | Ludwig-Erhard-Allee 6 | 76131 Karlsruhe | Tel. +49 721 619021-0 | [email protected] | www.inovex.de