Internet of Things für die produzierende Industrie? Praktische Beispiele und Problemlösungen Dr Michael Missbach About the Speaker Global HANA & Hadoop Architect, author of: the strategy behind HAssos New Architecture: one database to store them all S/4 = Suite on HANA simplification in-Memory SRM on HANA ERP on HANA SOA NetWeaver Business Suite BI 7 SCM on HANA BI on HANA PO LVM SMP3 EP 7 BWA ERP 6.x SSM on HANA CRM on HANA SCM 7 MDM SRM 7 MI PI ACC XI SSM CRM 7 MSA mySAP R/3 4.7 mySAP.com R/3 4.6 Enjoy new dimension integration BI 3.x SCM 4 EBP CRM 4 EP 4.0 TREX APO R/3 4.5 R/3 4.0 BBP ITS Online Store lifeCache BW B2B R/3 SFA BC CCMS WP the Future: somewhat foggy IBP Cloud simplification concur hybris C4C BOC BW/4 (EDW) S/4 (SoH) UI FS HCI PO MDG Solman on HANA LaMa in-Memory ERP on HANA SOA NetWeaver Business Suite BI 7 R/3 4.7 mySAP.com R/3 4.6 new dimension integration SCM on HANA EP 7 BWA ERP 6.x mySAP Enjoy BI on HANA SRM on HANA BI 3.x CRM on HANA Afaria SCM 7 SRM 7 SCM 4 EBP LVM MDM MI CRM 7 CRM 4 PI XI ACC SolMan EP 4.0 TREX APO R/3 4.5 R/3 4.0 BBP ITS Online Store lifeCache BW B2B R/3 SFA BC CCMS WP die Freudenberg Gruppe - typisch Mittelstand Innovationsführer auf dem jeweiligen Gebiet Filters Household products Mechatronic products Medical technology Nonwovens Release agents R&D services Seals Specialty lubricants Surface treatment products IT Services Vibration control technology components VAR Gold Status Fast Growing Company Award SAP develops DB MM module for R/2 in FIT data center 1977 1981 1995 FIT beomes SAP certified in hosting services 2007 2008 SAP Pinnacle Award Infrastructure expansion • New data center • New offices 2009 2010 SAP certified in RUN SAP implementation I Infrastructure expansions • New data center • New offices 2011 2012 Start of HANA test drive service Freudenberg becomes SAP’s 7th customer Freudenberg IT spinoff founded Setup of COEs for SAP HANA, Sybase ASE and Mobility SAP Pinnacle Award finalist FIT becomes SAP certified in cloud services FIT is worldwide one of the first SAP HANA and Mobile Operations Partner Global implementation of In-MemorySoftware by FIT 2013 2014 2016 FIT becomes Application Development Partner ofSAP FIT becomes first certified hosting partner in China for SAP HANA Enterprise Cloud Opening of 4th FIT data center –US location 6 >2.000 installierte Systeme, davon HANA: 65+ 1% 30+ 5+ 1% 5% 27% 21% 50% 52% 15% 20% 8% Linux AIX Windows other Oracle MaxDB DB2 7 “Big data analytics is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.” Dan Ariely Professor of psychology and behavioral economics Data to Actionable Insights (but avoid information overkill) B.I. + A.I. = Analytical reasoning facilitated by visual interactive interfaces A balanced interface between the offline data analytics and the online interactive analysis processes Was ist den nun eigentlich neu bei Industrie 4.0? Automatisierte Auswertung von Sensordaten ist im Prinzip nichts neues. Stand der Technik sind: • Geschlossene Regelkreise • statistische Prozesskontrolle • Vorbeugende Wartung bei Erreichen bekannter Grenzwerte Aber nur für bekannte UrsacheWirkungs-Zusammenhänge! Was ist wirklich neu? 1. Die Anzahl der Sensoren hat sich dramatisch erhöht – heute sind in einem Smartphone mehr Sensoren verbaut als früher in einem ganzen Maschinenanlage 2. Neue Datenquellen: • Ortung aufgrund von GPS Koordinaten oder Triangulation von WLAN Access Points …… • Automatische Bilderkennung , Auswertung von Videostreams, … 3. On-line Connectivity und real-time Auswertung großer Datenmengen Dies alles ermöglicht: • Adaptive Regelkreise • Korrelationsstudien für die Suche nach unbekannten Ursache – WirkungsBeziehungen • Vorbeugende Wartung aufgrund einer Kombination von Sensorwerten mit externen Einflussfaktoren Beispiel für neue Datenquellen Kundenrating auf Amazon Sentiment Analyse: was sagen Kunden über meine Produkte? neue Datenquellen: Dichtung mit eingebautem Drehwinkel Encoder Magnetisierbare Elastomere werden bei der Fertigung mit einem helixförmigen Magnetfeld „bespielt“. • Stellung einer Welle wird gemessen, ohne erst – wie üblich - einen Referenzpunkt • Hohe Präzision (< 1Grad) • Hohe Drehzahl (bis zu 8000 rpm) © Freudenberg Sealing Technologies anzufahren zu müssen Innovative Sealing Solutions | March 2014 | 14 Beispiel für neue Datenquellen WLAN Access points triangulieren die Position jedes Kunden, der ein WLAN fähiges Gerät mit sich trägt • Basierend auf bestehenden WLANZugangspunkten • Add-hoc-Analyse der Passagierbewegungen • Verkehrsmusteranalyse • Stauerkennung • Optimierung des „Einkaufs Erlebnisses“ • mit “Hyperlocation” auf 1 m genau Beispiel für Real-Time Auswertung Real-time „Strassenzustandsbericht“ in einer Goldmine durch Messung des Drehmoments an der Hinterachse Durch rechtzeitiges Planieren der Wellblechpisten: • Signifikante Einsparung bei Treibstoff und Reifen • Höhere Lebensdauer von Motor und Antriebstrang • Mehr Fördervolumen durch höhere Fahrgeschwindigkeit Beispiel für neue Auswertungsmethoden KSB Sonolyzer App „hört“ das Einsparpotential Die App analysiert das Audiosignal des Motorlüfters und ermittelt auf Basis von passenden Pumpenkennlinien ob das Aggregat im optimalen Lastbereich läuft oder ob Einsparpotential vorhanden ist. Die App funktioniert nicht nur mit KSBPumpen, sondern lässt sich auch auf das Rotating Equipment vieler anderer Hersteller anwenden. Beispiel für neue Services Freudenberg Filtration Products: Clean Air as a Service • • Saubere Luft für Lackieranlagen und Reinräume (jetzt auch mit Gasphasenfiltration) Kontinuierliche Fernüberwachung ermöglicht Wechsel der Filterkartuschen exakt vorzuplanen Aber nicht alle Maschinen sind Internetfähig • • Viele Unternehmen haben einen großen Maschinenpark oder einzelne Anlagen deren Messtechnik nicht „internet enabled“ ist Eine Um- und Aufrüstung mit neuen Sensoren und Steuerungssystemen ist • Teuer • Benötigt spezielles know how • Bedingt lange down-time Lösung für “nicht” IoT fähige Maschinen 1. 2. „Ablesung“ durch Webcam IoT Service von Freudenberg-IT extrahiert den Messwert aus dem Videostream Vorteil • Berührungsfrei • Montage im laufenden Betrieb • Minimale Investitions- und Betriebskosten • Kunde muss sich nicht mit den Feinheiten der Bilderkennungssoftware beschäftigen Industry 4.0 = Big Data? Ganz so „big“ ist „Data“ meist gar nicht • Sentiment Analyse aus einigen zehntausend web Kommentaren = 0 MB • Gleisanalyse mit 35.0000 Datensätzen/Stunde = 2,5MB (auf der 16GB MicroSD eines Raspberry Pi währe Platz für 95.200.000 Datensätze - genug für 113 Tage) • Conti-Produktion von Medikamentenfläschchen: 60 Datensätze mit 150 Messpunkten /Minute (1.5 - 2KB) = 147 MB /Tag = 52 GB /Jahr • Bei 100 Produktionslinien wären das in 10 Jahren (FDI!) aber dann doch 51TB Big Data = Hadoop? was ist Hadoop? • • • • • Der Name des Spielzeugelefanten des 2-jährigem Sohn‘s von Doug Cutting, einfach auszusprechen und zu googeln Ein open source framework zum verteilten Speichern und Rechnen auf commodity hardware mit internen Platten Daten werden immer auf 3 Knoten verteilt Wie bei open source üblich gibt es einen ganzen Zoo von Unterprojekten (Hbase, Hive, Pig, Impala, Kudu, Spark, YARN, Sqoop, Kafka …..Zookeeper) Wie bei Linux gibt es Distributoren die den Support gewährleisten (Cloudera, MapR, Hortonworks…. Amazon (EMR) & Azure (HDInsight)) Big Data = Hadoop? was man über Hadoop wissen sollte • • • Kein „natives“ Frontend -> braucht andere Tools als GUI für User (SAP, Tableau, qlik…) Keine „nativen“ Auswertungen -> hat die Sprache R an Bord (wie auch HANA oder Business Objects), aber die Auswertung muss man selber programmieren (oder andere tools nutzen) Keine Transaktionale Konsistenz, Redo-Logs etc. -> keine „Buchhaltung auf Hadoop“ Sizing • • • • • • Eine Datei wird immer auf drei Worker nodes repliziert (unabhängig von der node Anzahl), zusätzlich sollte man noch 30-40% Puffer für temporäre Dateien lassen Daher benötigt man bei x TB Rohdaten 3x soviel disk Speicher. Datensätze werden meist komprimiert um die SQL Performance zu verbessern. Dabei erreicht man Kompressionsraten von 2 – 10. Anfangspackung ~ 19 TB (2 Master, 3 Worker); mit MapR genügen dafür 3 Server MapR Multi-Mandantenfähigkeit ermöglicht Nutzung durch verschiedene Kunden. Unter 10TB reichen meist klassische Datenbanken mit column store aus Big Data ist mehr als eine Server Farm Data management Data acquisition Data analysis Customer Data visualization On-site service Consulting Data Collection Data Storage Data Analytics FIT - Innovation IoT Platform Visualization Automation Advanced Analytics FIT IoT Platform HANA, Hadoop, Vora, DB2blue, NoSQL, ….. Data Connection Azure HDInsight etc Big & Fast Data hadoop & HANA kombinieren Fiori, Lumira, Design Studio… 1. Daten liegen auf hadoop 2. HANA schickt Anfragen an hadoop über Any DB – die Smart Data Access (SDA) Schnittstelle an Hive – die Virtual User Defined Functions (vUDF) direkt an HDFS um Map Reduce Jobs zu starten 3. hadoop berechnet das Ergebnis und gibt dieses an HANA – Daten müssen nicht kopiert werden – HANA Footprint bleibt klein 4. HANA integriert mit ERP Daten und stellt Methoden zur Verfügung für predictive Maintenance, Mustererkennung…… 5. User können die gewohnten SAP Frontend tools einsetzen HANA Smart Data Access Big & Fast Data SAP Vora = in memory query engine Fiori, Lumira, Design Studio… 1. Datenhaltung in-Memory auf hadoop Spark 2. HANA schickt Anfragen an hadoop über – HANA HANA Spark Controller 3. Vora berechnet das Ergebnis und gibt dieses an HANA + Für HANA entwickelte Algorithmen für predictive Maintenance, Mustererkennung etc. laufen direkt auf Hadoop Spark + Abfragen werden in C++ compiliert – SAP berechnet Lizenzgebühren pro Hadoop Knoten 4. User können die gewohnten SAP Frontend tools einsetzen HANA Spark Controller Fragen?