Introducción a Hadoop y sus herramientas. Presentación de las herramientas de integración que ofrece SQL Server Integration Services 2016 con Hadoop y HDInsight
2. ##SQLSatMadrid
¿Quién soy?
Ángel M. Rayo
twitter.com/oyara
Technology Lead Expert en Netmind
Más de 9.000 horas de experiencia formativa
Microsoft Certified Trainer desde 2005
MCDBA SQL 2000 – MCSA SQL 2014
13. ##SQLSatMadrid
HDInsight – Uso
• Hadoop as a Service (HaaS)
• Crear soluciones y servicios Big Data
• Administrar y monitorizar clústeres Hadoop
• Analizar y generar estadísticas de:
• Disponibilidad
• Utilización
16. ##SQLSatMadrid
SQL Server
• ¿Hace falta decir qué es? ;-)
• Sistema gestor de bases de datos relacionales Microsoft
• 1989 – SQL Server 1.0
• 1 de junio de 2016 – SQL Server 2016 (14.0)
17. ##SQLSatMadrid
SQL Server 2016 – Servicios y herramientas
Service
Broker
Replication
Services
Analysis
Services
Reporting
Services
Notification
Services
Visual
Studio
Integration
Services
SQL Server
Management
Studio
Full Text
Search
Service
Business
Intelligence
Dev Studio
SQLCMD
18. ##SQLSatMadrid
SQL Server 2016 SSIS
• Plataforma de integración datos y aplicaciones de flujos
de trabajo
• Herramienta Data Warehouse rápida y flexible
• ETL
• Extraction
• Transformation
• Loading
19. ##SQLSatMadrid
SQL Server 2016 SSIS
Data
Transformation
Services (DTS)
SQL Server
Integration
Services (SSIS)
Disponible desde SQL Server 6.5 a
SQL Server 2000
Disponible desde SQL Server 2005
.NET como base de ejecución
Control Flow
Data Flow
Event Handlers
Package Explorer
20. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Situación desde SQL Server 2016
• Se incluye Hadoop como fuente de datos
• SSIS 2016 se integra con soluciones Big Data
Situación hasta SQL Server 2014
• Podemos utilizar Hadoop mediante conexión ODBC
• Acceso a recursos con scripts PowerShell
21. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Gestor de conexiones
• WebHCat – API REST
Apache™ Hive
• WebHDFS – API
REST HDFS
22. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Tareas de flujo de control (Control Flow)
Hadoop File
System Task
Hadoop Hive
Task
Hadoop Pig Task
23. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop File
System Task
Funcionamiento
• Obtiene, copia o mueve ficheros
• Utiliza la API REST del clúster
• El acceso es directo al almacén HDFS
25. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Hive
Task
Funcionamiento
• Envía consultas HiveQL
• Utiliza la API REST WebHCat (aka Templeton)
• Funcionamiento mediante sistema de colas
27. ##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Pig
Task
Funcionamiento
• Envía scripts Pig
• Pig Latin + API REST de WebHCat (aka Templeton)
• Funcionamiento mediante sistema de colas
40. ##SQLSatMadrid
4 Sponsor Sessions at 11:40
Don’t miss them, they might be getting
distributing some awesome prizes!
HPE
SolidQ
KABEL
TSD Consulting
Also BIG Raffle prizes at the end of the
event provided by:
Plainconcepts, SolidQ, Kabel, TSD
Consulting, Pyramid Analytics & sqlpass.es