Azure SQL Database vs. Azure SQL DW Marcel Franke Our Sponsors Über mich – Marcel Franke VP Technology & Growth, pmOne Analytics GmbH Fokus ist Data Science & Advanced Analytics Sehr enge Verbundenheit mit der Universität Paderborn Büros in Paderborn & Wien P-TSP für Microsoft für das Thema Big Data & Analytics Web: www.pmoneanalytics.com E-Mail: [email protected] 4 5 6 8 9 Agenda • Einleitung • Architektur & genereller Aufbau • Tools & Entwicklungsumgebung • Skalierbarkeit & Workloads • Berechtigungen & Security • Hochverfügbarkeit, Backup & Restore • Kosten • Zusammenfassung ÜBERBLICK Visualize + Decide Applications Data Reports Dashboards Natural language query Mobile Modeling Machine learning Streaming Internal & external Transform + Analyze Orchestration Information management Complex event processing Capture + Manage The Microsoft data platform Relational Non-relational NoSQL DW vision & portfolio Choice. On-Premises Connected. Beyond relational Microsoft SQL Server Microsoft Analytics Hortonworks HDP Analytics Platform System SQL Server 2014 SQL Server 2016 Fast Track for SQL Server Analytics Platform System Azure Data Factory Federated Query Azure Machine Learning PowerBI Cloud Comprehensive. Relational Microsoft Azure Microsoft Azure SQL Server for DW in Azure VM Azure HDInsight Azure SQL Database Azure Data Lake Azure SQL Data Warehouse Document DB Spark Software-as-a-Service (SaaS) Datenbank als Service Infrastruktur managed by Microsoft Up & Running in Minuten Multitenant für verschiedene Szenarien möglich Nahezu lineare Skalierbarkeit Weniger Verwaltungsaufwand notwendig “Garantierte” Performance Gerantierte SLAs Preis orientiert sich rein am Nutzungsverhalten Scale up vs. Scale-Out (SMP vs. MPP) Quelle: http://cbblog.azurewebsites.net/content/images/2015/06/KB_Scale_Out-Up.png SQL DATABASE - ARCHITEKTUR SQL Database vs. SQL Server SQL Server auf physischen Maschinen auf on-premise virtuellen Maschinen (private cloud) auf Azure virtuellen Maschinen (public cloud) SQL Database (public cloud) Was ist der Unterschied zum SQL Server auf virtuellen Maschinen? SQL Server in einer Azure VM Geeignet für… Ressourcen Kostenvorteile Skalierbarkeit Azure SQL Datenbank SQL Database Server SQL Server als logische Organisationseinheit enthält mehrere Azure SQL Datenbanken regelt generellen Zugriff über IPs SQL DATA WAREHOUSE - ARCHITEKTUR Introducing Azure SQL DW Service A relational data warehouse-as-a-service, fully managed by Microsoft. Industries first elastic cloud data warehouse with proven SQL Server capabilities. Support your smallest to your largest data storage needs. Azure Azure Power of Integration Hadoop SQL Azure SQL Data Warehouse Azure SQL Database App Service Intelligent App Power BI Azure Machine Learning Positioning SQL DW • Cloud-based • Dev/test/exploratory (on-demand) • Local to cloud-born data • Supports hub & spoke approach for PaaS and IaaS offerings • Better than non-relational platforms for interactive reporting • Integrates with ADF, ML and other Azure services • License-free approach – designed as a service offering rather than an investment • Fast elastic scale up and down • Hybrid upsell and integration supports APS or on-premises investment Trennung von Compute & Storage Azure Compute Compute Compute Azure Blob Storage Control Compute Azure Blob Storage Compute Mirrored DC Azure SQL Data Warehouse Architecture Application or User connection DMS (Data Movement Service) executes across all database nodes Control Data Loading (SSIS, REST, OLE, ADO, ODBC, DMS WebHDFS, AZCopy, PS) Node Massively Parallel Processing (MPP) Engine DMS DMS SQL DB 100 DWU < > 2000 DWU DMS SQL DB SQL DB DMS SQL DB Compute Compute Compute Compute Node Node Node Node Azure Infrastructure and Storage Blob storage [WASB(S)] HDInsight Storage and Compute are de-coupled, enabling a true elastic service and separate charging for both compute and storage Compute Scale compute up or down when required (SLA <= 60 seconds). Pause, Restart, Stop, Start. Storage Add\Load data to WASB(S) without incurring compute costs SQL DATA WAREHOUSE VS. APS Analytics Platform System Microsoft’s big data appliance MPP SQL Server PolyBase Hadoop • Pre-built HW appliance • Massively Parallel Processing (MPP) to scale to 6 PBs • In-memory columnstore for 100x speed improvement • Dedicated region for Hadoop • PolyBase enables joining relational & non-relational data • Available from HP, Dell and Quanta • AU3/AU4 High-level comparison Supported table types APS Cloud-enabled SQL DW Cloud-based Distributed Replicated Round-robin Distributed Replicated Round-robin Cloudera HortonWorks HDInsight Cloudera HortonWorks HDInsight User defined Table value Scalar User defined Table value Scalar ETL/ELT SSIS DWLoader BCP SSIS DWLoader BCP Architecture MPP Shared nothing Scale unit hardware MPP Shared nothing SQL DB database instances GB TB PB GB TB PB Storage support Local/JBOD WASB(s) Azure Premium Local/JBOD WASB(s) Azure Premium Analytical integration OLAP/SSAS AA Suite/ML Third party OLAP/SSAS AA Suite/ML Third party Workload use case Governance Archive Dev/test Governance Archive Dev/test Predicate PushDown support Function support Data volumes Datenmodellierung SQL DW Daten werden automatisch verteilt Man muss sich über das Design des Datenmodells gedanken machen, nicht über die physikalische Verteilung Abfragen werden auch automatisch verteilt Aufpassen auf die Datenverteilung Faustregel: mindest. 600 distinkte Werte für Hash Disribution, sonst Round Robin Demo Time WIE LADE ICH DATEN? SQL Azure DB BCP, Bulk Insert, SQLBulkCopy Data sources Unstructured Semi-structured SQL Server Integration Services PaaS Structured Relational (RDBMS) SQL Azure Azure Data Factory SQL Data Warehouse BCP, Bulk Insert, SQLBulkCopy Data sources Unstructured SQL Server Integration Services Semi-structured PaaS SQL Structured Relational (RDBMS) Azure Data Factory Blob Store PolyBase Azure SQL Data Warehouse Polybase • Integrierter Zugriff auf Hadoop oder Blob Store via T-SQL • Integration von Semistrukturierten Daten • Interessant für Archivierungskonzepte • Hochparalleler Zugriff zwischen SQL DW & Hadoop / Blob Store / (Data Lake) • Ermöglicht kombinierte Abfragen TOOLS & ENTWICKLUNGSUMGEBUNG Admin & Monitoring Tools Azure Management Portal Performance Monitor Alerts SQL Server Management Studio Gewohnte Oberfläche Mehrere Datenbanken verwalten System Views master.sys.resource_stats user_db.dm_db_resource_stats Dev Tools Data Tools in Visual Studio REST Powershell T-SQL DAC Framework SSIS C# Ruby Python etc. Execution Pläne für SQL DW select * from sys.dm_pdw_exec_requests where status like 'Running' select * from sys.dm_pdw_request_steps where request_id like 'QIDxxxx' ORDER BY Step_index ASC Reporting Tools / Power BI SQL Server Reportinf Services Power BI Excel 3rd Party ODBC Konnektoren https://azure.microsoft.com/en-us/documentation/articles/sqldata-warehouse-integrate-power-bi/ Analytics – Cortana Analytics Suite SQL DATABASE - SKALIERBARKEIT DTU – Database Transaction Unit Abgeschlossene Transaktionen pro Sekunde 5 DTUs = 5 Transaktionen pro Sekunde 75% Lesen Schreiben CPU Auslastung 50% Speicher 60% Benchmark Überblick: https://azure.microsoft.com/enus/documentation/articles/sql-database-benchmarkoverview/ Einzeldatenbank Unterschiedliche Leistungsstufen innerhalb der drei Dienstebenen DTU vs. eDTU Zusammenfassung mehrerer Datenbanken Auslastung wird nach Bedarf verteilt Garantierte Mindestleistung Elastische Datenbankpools Drei Dienstebenen mit Angabe der maximalen Leistungen je Datenbank SQL DATA WAREHOUSE - SKALIERBARKEIT SQL Data Warehouse - Skalierbarkeit Rechenleistung / Memory skalierbar mittels DWU Scan/Aggregation für IP und CPU Laden für Netzwerkleistung und CPU Create Table as Select für CPU und Netzwerkleistung Speicherskalierbarkeit basierend auf Azure Blob Speicher Blob Größe Blob Anzahl Darf’s ein bisschen mehr sein? 100 DWU – 2000 DWU 3000 & 6000 DWUs über Support möglich --TSQL zum Anpassen der DWUs ALTER DATABASE Demo MODIFY (SERVICE_OBJECTIVE = 'DW2000'); DWU 100 1 Control Node 1 Compute Node 60 Distributions DWU 200 1 Control Node 2 Compute Nodes 60 Distributions in Summe 30 Distributions / Node Demo Time SQL DATABASE BERECHTIGUNGEN & SECURITY SQL Database - Sicherheit Schützen der Datenbank Schützen der Daten Schützen der Datenänderungen APP Azure SQL Database SQL Database - Berechtigungen Active Directory Integration Datenmaskierung in Echtzeit und dauerhaft Datenverschlüsselung für sensible Daten Monitoring der Zugriffe Table.CreditCardNo 4465-6571-78685796 4468-7746-38481978 4484-5434-68586550 SQL Datenbank Echtzeit Datenmaskierung SQL DATA WAREHOUSE BERECHTIGUNGEN & SECURITY Berechtigungen & Security Connection Security IP-& Firewall-Regeln, VPN Authentifizierung Aktuell SQL Authentifizierung, AD kommt Logins, Rollen & Berechtigungen Verschlüsselung Verschlüsselung der Daten in der Datenbank & Backups Verwendet Transparent Data Encryption (TDE) SQL DATABASE HOCHVERFÜGBARKEIT, BACKUP & RESTORE SQL Database - Backups Point-in-time Wiederherstellung Kein separater Service Wiederherstellung zu einem konkreten Zeitpunkt Automatische Datenaufbewahrung Modell Basic bis zu 7 Tage Modell Standard bis zu 14 Tage Modell Premium bis zu 35 Tage Regelmäßige interne Backups Wöchentliches Fullbackup Tägliches Differentialbackup Backup des Transaktionenlogs jede 5 Minuten SQL Database - Hochverfügbarkeit 99,99% Verfügbarkeit durch SLA Standard Geo-Replication mit einer Stand-by Kopie Aktive Geo-Replication mit bis zu 4 lesbaren Kopien SQL Database backups Georeplicated Restore from backup Azure Storage SQL DATA WAREHOUSE HOCHVERFÜGBARKEIT, BACKUP & RESTORE Backup & Restore Backup Snapshots der Datenbank mindestens alle 8 Stunden Snapshots sind 7 Tage verfügbar Derzeit keine weitere Backup-Funktionalität möglich Restore Restore aus Snapshots zu einem Zeitpunkt möglich Restore auch von gelöschten Datenbanken möglich Automatismen Automatisierbar via Power Shell oder Rest API SLAs derzeit noch nicht verfügbar (Preview) Demo Time SQL DATABASE - PREISE & SLAS SQL Database - Preise Basic, Standard & Premium Modell Geo-Replication möglich Support Pläne ab 25€ / Monat verfügbar Garantierte Verfügbarkeit von 99,99% SQL DATA WAREHOUSE – PREISE & SLAS SQL Data Warehouse - Preise Compute & Storage werden separate bezahlt Compute kann man pausieren Storage Kosten basieren auf Standard RA-GRS Page Blob Preise Zur Zeit noch kein SLA ZUSAMMENFASSUNG Zusammenfassung Microsoft mit SQL Database & SQL Data Warehouse zwei gute Angebote für Datenbank als Service Up & Running innerhalb von Minuten Skalierbarkeit bis in den Bereich von TB bereits möglich SMP & MPP funktionieren ein bisschen anders Support für Data Tools und Management Studio wird weiter ausgebaut Integration in andere Azure Services möglich (Data Factory, Power BI, Azure ML) Preis-Leistungs-Verhältnis ist unschlagbar How did you like it? Please give feedback to the event: http://www.sqlsaturday.com/494/eventeval.aspx to me as a speaker: http://www.sqlsaturday.com/494/sessions/ sessionevaluation.aspx Ressources SQL Server 2016 in 15 Minuten https://channel9.msdn.com/Series/SQLServer-2016-in-15-Minuten SQL PASS Austria Meeting Archive http://sdrv.ms/ZFVdnM Thank you!