El nuevo Microsoft Azure SQL Data Warehouse (SQL DW) es un versátil servicio de almacén de datos que provee una solución Massively Parallel Processing (MPP) para "Big data" con verdaderas características de alta infraestructura empresarial. El servicio SQL DW está construido para la carga de datos en ejecución de unos cien gigabytes hasta petabytes de datos con características únicas como cálculo desagregado, permitiendo así que los clientes sean capaces de utilizar el servicio para satisfacer sus necesidades de almacenamiento. En la presente exposición les mostrare una mirada en profundidad de este nuevo servicio de Azure como la implementación, el escalamiento elástico (Grow, Shrink, y Pause), y las nubes de datos híbrida con integración de Hadoop a través Polybase permitiendo una verdadera experiencia de SQL a través de datos estructurados y no estructurados.
Hybrid cloud uses a mix of on-premises private cloud and public cloud services. Azure Stack allows organizations to deliver Azure services from their own data centers for a hybrid cloud environment. It provides benefits like cost savings, flexibility, control and reliability. Azure Stack offers a consistent development platform whether workloads are on private or public clouds. It allows organizations to develop applications in Azure and seamlessly deploy them to Azure Stack and vice versa without code changes.
This document provides an overview of AWS CloudHSM, a managed cryptographic key management service by AWS. It discusses AWS CloudHSM and AWS KMS services for key management, compares their features, and describes how AWS CloudHSM provides FIPS 140-2 Level 3 compliant HSMs for single-tenant key storage and cryptographic operations offloading. The presentation agenda includes cryptography basics, AWS key management, AWS CloudHSM capabilities and use cases, management and operations.
企業間連携や IT 基盤のモダナイズなど、API の活用が広がり、国内でも API エコノミーが発展しつつあります。
API を最大限に活用するためには、セキュリティやアナリティクス、利用者サポートなど、いわゆる API 管理が重要です。
今回の放送では、Google Cloud の API 管理基盤、Apigee の特徴や機能概要、事例などをデモを交えて紹介します。
This document discusses Amazon Neptune, a fully managed graph database service. It provides an overview of graphs and graph databases, introduces Amazon Neptune's key features like high performance, availability and security. Gremlin and property graph models are explained. The webinar will cover what graphs are, graph databases, an introduction to Amazon Neptune, getting started with Neptune and a conclusion.
A private cloud provides hosted computing services behind a company's firewall. It offers benefits like flexibility, mobility, confidentiality, availability, and cost savings over traditional IT. A private cloud gives a company direct control over its data and infrastructure while providing high availability, security, and efficiency through virtualization and elastic resources. It transforms IT from a cost center to a strategic enabler by reducing maintenance costs and allowing on-demand provisioning and reallocation of resources.
Hybrid cloud uses a mix of on-premises private cloud and public cloud services. Azure Stack allows organizations to deliver Azure services from their own data centers for a hybrid cloud environment. It provides benefits like cost savings, flexibility, control and reliability. Azure Stack offers a consistent development platform whether workloads are on private or public clouds. It allows organizations to develop applications in Azure and seamlessly deploy them to Azure Stack and vice versa without code changes.
This document provides an overview of AWS CloudHSM, a managed cryptographic key management service by AWS. It discusses AWS CloudHSM and AWS KMS services for key management, compares their features, and describes how AWS CloudHSM provides FIPS 140-2 Level 3 compliant HSMs for single-tenant key storage and cryptographic operations offloading. The presentation agenda includes cryptography basics, AWS key management, AWS CloudHSM capabilities and use cases, management and operations.
企業間連携や IT 基盤のモダナイズなど、API の活用が広がり、国内でも API エコノミーが発展しつつあります。
API を最大限に活用するためには、セキュリティやアナリティクス、利用者サポートなど、いわゆる API 管理が重要です。
今回の放送では、Google Cloud の API 管理基盤、Apigee の特徴や機能概要、事例などをデモを交えて紹介します。
This document discusses Amazon Neptune, a fully managed graph database service. It provides an overview of graphs and graph databases, introduces Amazon Neptune's key features like high performance, availability and security. Gremlin and property graph models are explained. The webinar will cover what graphs are, graph databases, an introduction to Amazon Neptune, getting started with Neptune and a conclusion.
A private cloud provides hosted computing services behind a company's firewall. It offers benefits like flexibility, mobility, confidentiality, availability, and cost savings over traditional IT. A private cloud gives a company direct control over its data and infrastructure while providing high availability, security, and efficiency through virtualization and elastic resources. It transforms IT from a cost center to a strategic enabler by reducing maintenance costs and allowing on-demand provisioning and reallocation of resources.
FinOps: A Culture Transformation to Bring DevOps, Finance and the Business To...Amazon Web Services
Ten years ago, DevOps broke down the silos between Engineering and Ops and accelerated the pace of innovation. Today, a similar pattern is emerging where effective cloud infrastructure adoption and usage requires a deep collaboration between technical teams (DevOps) and their new partners in finance and business. Attendees will learn from cloud innovators how to scale their cloud adoption by collaborating across operations, development and finance to continuously optimise cloud spend, using an emerging practice known as FinOps.
This session will review design principles and considerations when developing your e-commerce solution on AWS. Hear how Popsa, a machine learning start-up, built its e-commerce solution on AWS; and how AO.com, an online retailer of electrical goods, migrated a bespoke e-commerce platform into AWS. Discover what the cultural impact was, and what the future holds.
Azure Cost Management is a native Azure service that helps you analyze costs, create and manage budgets, export data, and review and act on optimization recommendations to save money.
In this session, we show you how to understand what data you have, how to drive insights, and how to make predictions using purpose-built AWS services. Learn about the common pitfalls of building data lakes and discover how to successfully drive analytics and insights from your data. Also learn how services such as Amazon S3, AWS Glue, Amazon Redshift, Amazon Athena, Amazon EMR, Amazon Kinesis, and Amazon Machine Learning (Amazon ML) services work together to build a successful data lake for various roles, including data scientists and business users.
This document provides an overview and agenda for an AWS webinar on AWS Glue. It introduces AWS Glue as a fully managed and serverless ETL service that can manage metadata for various data sources. The webinar will cover the background of AWS Glue, its key features including being serverless and enabling secure development in notebooks, use cases, pricing, and a conclusion. It also provides details on the components and functions of AWS Glue like the data catalog, orchestration, and serverless engines.
Why a Multi-cloud Strategy is EssentialAlibaba Cloud
See webinar recording of this presentation at: https://resource.alibabacloud.com/webinar/live.htm?&webinarId=62
When first discussing a multi-cloud strategy, we must start with its importance, its reasoning (why you need it) and what formats can be adopted. Only then can we dive deeper into the different ways a customer could distribute their infrastructure across multiple clouds as well as the business and technical considerations that should be kept in mind while adopting any of these models. Finally, we will touch upon why Alibaba Cloud fits well in your Multi-cloud strategy.
This document provides an overview of Azure App Service and its capabilities. It discusses Web Apps, Mobile Apps, Logic Apps, and API Apps. It also covers topics like continuous delivery, staging environments, App Service plans, and the App Service Environment premium tier. The presentation includes demos and allows time for questions.
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!Yoichi Kawasaki
Web App for Containers は、アプリスタックのホストに Docker コンテナーを使用するため皆さんが今Linux上で利用しているOSSベースのアプリもアプリスタックごとDockerコンテナ化することでそのまま Web App for Containersで利用することができます。本ウェビナーでは簡単なMySQL + Ruby on Rails アプリ を題材に、アプリをコンテナ化し Web App for Containersにデプロイするまでの一連の流れを解説し、CIツールを使った継続的なデプロイ方法についてご紹介します。今回、AzureのフルマネージドMySQLサービスであるAzure DB for MySQLを利用して完全マネージドな環境でのアプリ実行を実現します。
DXC ESO for SAP Client Event presentationJoachim Mayer
Reduce the total cost of operations for your SAP® environment by using a cloud solution. Is the current provisioning time for your SAP® environment weeks or even months? Could your business benefit from the guarantee of an easily accessible, always-on and proactive system to protect your mission-critical operations? Join us to learn how a cloud-based solution for your SAP landscape can enhance agility and flexibility, allowing you to react to changes in customer needs and market demands, while also significantly increasing utilization of your entire SAP landscape. This demo provides an overview how the new Enterprise Solutions On Demand (ESO) for SAP offering supports digital business outcomes in an SAP environment such as: accelerate time-to-value, reduce TCO, continuous improvement as well as always-on and resilient business.
Azure Arc is a solution that simplifies management across different hybrid clouds or multi-clouds. Azure Arc extends Azure management and security beyond the walls of Azure to other cloud platforms or on-premises environments enabling you to make use of Azure services to manage infrastructure at these environments. In this session, you will be introduced to Azure Arc, why should you use it and how to make use of it in different scenarios.
This document provides an overview and agenda for Azure Data Lake. It discusses:
- Azure Data Lake Store, which is a hyper-scale repository for big data analytics workloads that supports unlimited storage of any data type.
- Azure Data Lake Analytics, which is an elastic analytics service built on Apache YARN that processes large amounts of data using the U-SQL language. U-SQL unifies SQL and C# for querying structured, semi-structured and unstructured data.
- Tools for working with Data Lake, including Visual Studio for developing U-SQL queries and managing jobs, and PowerShell for administering Data Lake resources and submitting jobs.
FinOps: A Culture Transformation to Bring DevOps, Finance and the Business To...Amazon Web Services
Ten years ago, DevOps broke down the silos between Engineering and Ops and accelerated the pace of innovation. Today, a similar pattern is emerging where effective cloud infrastructure adoption and usage requires a deep collaboration between technical teams (DevOps) and their new partners in finance and business. Attendees will learn from cloud innovators how to scale their cloud adoption by collaborating across operations, development and finance to continuously optimise cloud spend, using an emerging practice known as FinOps.
This session will review design principles and considerations when developing your e-commerce solution on AWS. Hear how Popsa, a machine learning start-up, built its e-commerce solution on AWS; and how AO.com, an online retailer of electrical goods, migrated a bespoke e-commerce platform into AWS. Discover what the cultural impact was, and what the future holds.
Azure Cost Management is a native Azure service that helps you analyze costs, create and manage budgets, export data, and review and act on optimization recommendations to save money.
In this session, we show you how to understand what data you have, how to drive insights, and how to make predictions using purpose-built AWS services. Learn about the common pitfalls of building data lakes and discover how to successfully drive analytics and insights from your data. Also learn how services such as Amazon S3, AWS Glue, Amazon Redshift, Amazon Athena, Amazon EMR, Amazon Kinesis, and Amazon Machine Learning (Amazon ML) services work together to build a successful data lake for various roles, including data scientists and business users.
This document provides an overview and agenda for an AWS webinar on AWS Glue. It introduces AWS Glue as a fully managed and serverless ETL service that can manage metadata for various data sources. The webinar will cover the background of AWS Glue, its key features including being serverless and enabling secure development in notebooks, use cases, pricing, and a conclusion. It also provides details on the components and functions of AWS Glue like the data catalog, orchestration, and serverless engines.
Why a Multi-cloud Strategy is EssentialAlibaba Cloud
See webinar recording of this presentation at: https://resource.alibabacloud.com/webinar/live.htm?&webinarId=62
When first discussing a multi-cloud strategy, we must start with its importance, its reasoning (why you need it) and what formats can be adopted. Only then can we dive deeper into the different ways a customer could distribute their infrastructure across multiple clouds as well as the business and technical considerations that should be kept in mind while adopting any of these models. Finally, we will touch upon why Alibaba Cloud fits well in your Multi-cloud strategy.
This document provides an overview of Azure App Service and its capabilities. It discusses Web Apps, Mobile Apps, Logic Apps, and API Apps. It also covers topics like continuous delivery, staging environments, App Service plans, and the App Service Environment premium tier. The presentation includes demos and allows time for questions.
Web App for Containers + MySQLでコンテナ対応したRailsアプリを作ろう!Yoichi Kawasaki
Web App for Containers は、アプリスタックのホストに Docker コンテナーを使用するため皆さんが今Linux上で利用しているOSSベースのアプリもアプリスタックごとDockerコンテナ化することでそのまま Web App for Containersで利用することができます。本ウェビナーでは簡単なMySQL + Ruby on Rails アプリ を題材に、アプリをコンテナ化し Web App for Containersにデプロイするまでの一連の流れを解説し、CIツールを使った継続的なデプロイ方法についてご紹介します。今回、AzureのフルマネージドMySQLサービスであるAzure DB for MySQLを利用して完全マネージドな環境でのアプリ実行を実現します。
DXC ESO for SAP Client Event presentationJoachim Mayer
Reduce the total cost of operations for your SAP® environment by using a cloud solution. Is the current provisioning time for your SAP® environment weeks or even months? Could your business benefit from the guarantee of an easily accessible, always-on and proactive system to protect your mission-critical operations? Join us to learn how a cloud-based solution for your SAP landscape can enhance agility and flexibility, allowing you to react to changes in customer needs and market demands, while also significantly increasing utilization of your entire SAP landscape. This demo provides an overview how the new Enterprise Solutions On Demand (ESO) for SAP offering supports digital business outcomes in an SAP environment such as: accelerate time-to-value, reduce TCO, continuous improvement as well as always-on and resilient business.
Azure Arc is a solution that simplifies management across different hybrid clouds or multi-clouds. Azure Arc extends Azure management and security beyond the walls of Azure to other cloud platforms or on-premises environments enabling you to make use of Azure services to manage infrastructure at these environments. In this session, you will be introduced to Azure Arc, why should you use it and how to make use of it in different scenarios.
This document provides an overview and agenda for Azure Data Lake. It discusses:
- Azure Data Lake Store, which is a hyper-scale repository for big data analytics workloads that supports unlimited storage of any data type.
- Azure Data Lake Analytics, which is an elastic analytics service built on Apache YARN that processes large amounts of data using the U-SQL language. U-SQL unifies SQL and C# for querying structured, semi-structured and unstructured data.
- Tools for working with Data Lake, including Visual Studio for developing U-SQL queries and managing jobs, and PowerShell for administering Data Lake resources and submitting jobs.
Generando Toma de Decisiones Inteligente con Microsoft Big DataJoseph Lopez
Big Data llama mucho la atención e interés de los tecnólogos así como a los usuarios de negocios por igual. Sin embargo pocas organizaciones pueden en realidad cosechar los beneficios de Big Data hoy porque las barreras para acceder a esta tecnología son todavía demasiado altas. Las herramientas de trabajo existentes (Microsoft Windows Server 2012 R2, Microsoft Azure, Microsoft SQL Server 2014, Microsoft Visual Studio 2014 - SQL Server Data Tools 2013 y Microsoft Office 2013) así como de terceros que son muy complejas y requieren a su vez, conocimientos profundos entre otros de Hadoop y Análisis de Datos que son en definitiva, la fuente de origen de todo. En esta sesión, les mostraré cómo Microsoft está democratizando Big Data para las masas. Microsoft permite administrar todos los datos de cualquier tipo o tamaño, enriquecer sus datos con los datos de todo el mundo y entregar conocimientos a todos los usuarios con herramientas conocidas como Excel.
Inteligencia de Negocio - Que Planeta es eso?Joseph Lopez
Qué es Inteligencia de Negocio? Qué conocimientos, habilidades y aptitudes se deberían conocer? Como comprender esta filosofía de Negocio? Cuales conocimientos se deberían tener a la hora de ejecutar un proyecto de esta índole? Qué habilidades y técnicas de comunicación deberíamos tener? Durante estaré guiándolos a comprender todas estas inquietudes.
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
The age of knowledge: Building the modern architecture of hybrid data for Big Data with Microsoft and Apache Hadoop Considering that knowledge is a value added for businesses today, in this exhibition show in a simple way as Microsoft and Hortonworks unite its efforts, in order to combine their data platforms ("Hortonworks Data Platform" and Microsoft: Windows, Office, SQL Server, Parallel Data Warehouse and Azure), to build with this, the modern architecture of data hybrid for Big Data.
Este documento describe el desarrollo de un data warehouse para la gestión de listas de espera sanitarias. Explica conceptos clave como OLTP vs data warehouse, las fases de construcción de un data warehouse, técnicas de modelado dimensional, procesos ETL y presentación de la información. Luego detalla el diseño e implementación del data warehouse para listas de espera, incluyendo el modelo dimensional, tablas de hechos y dimensiones, y procesos ETL. Finalmente, concluye y propone trabajos futuros.
Este documento describe los desafíos que enfrenta una cadena de comidas rápidas llamada RapiServ para aumentar sus ventas. RapiServ necesita analizar datos sobre ventas, sucursales, productos y horarios para tomar mejores decisiones, pero sus sistemas actuales no brindan la información necesaria de manera oportuna. La solución propuesta es crear un data warehouse con la estructura adecuada para extraer información relevante de los datos de la compañía y apoyar el análisis y la toma de decisiones.
Este documento presenta cuatro recetas saludables para un taller de cocina: tabuleh de bulgur, timbal de verduras gratina das, croquetas de tempeh y puerro, y tarta de tofu y arándanos. Cada receta incluye una lista de ingredientes y pasos sencillos para preparar cada plato. El taller parece enfocarse en platos vegetarianos y veganos hechos con ingredientes naturales y energéticos.
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Joseph Lopez
Muchas de las empresas y corporaciones en la actualidad, se encuentran moviendo sus plataformas de datos a la nube a velocidades sin precedentes nunca antes vista, haciendo de esto para todos los que conformamos el ecosistema de IT Pro, DBA's y desarrolladores de soluciones empresariales, una fuente de investigación y estudio para desarrollar destrezas en el conocimiento de todas estas nuevas tecnologías a implementar en estos escenarios. En la presente conferencia les estaré a todos impartiendo los conceptos apropiados de como utilizar la Plataforma de Datos de Microsoft en estos contextos empresariales de manera simple y sencilla sin tanto tecnicismos ni vocabularios avanzados.
Manual Para Inscripcion en IVSS Venezolano.Erika Sanchez
Este documento presenta un manual de usuario para el Sistema de Solicitud de Registro TIUNA del Instituto Venezolano de los Seguros Sociales (IVSS). Explica el proceso de solicitud de registro para empresas ya afiliadas al IVSS y para nuevas empresas no afiliadas, incluyendo los pasos para iniciar sesión, acceder al sistema, consultar el manual de usuario y preguntas frecuentes, y completar la solicitud de registro.
This document contains the resume of Imed Eddine Bouchoucha. It outlines his contact information, education history, work experience, qualifications, and references. Bouchoucha has over 10 years of experience in computer engineering, including projects involving Android development, vehicle diagnostics, digital frame prototyping, 3D weather reporting, and workflow platform development using technologies like Java, C++, and .NET. He is proficient in operating systems, programming languages, frameworks, databases, and design/project management tools.
Observatorio Redes Sociales: Empresas del IBEX 35Medialuna
Este informe analiza cómo 17 empresas españolas líderes usan redes sociales como Twitter, Facebook y YouTube para comunicarse. La mayoría usa Twitter y Facebook para atender clientes y promover productos, mientras usa YouTube para compartir sobre responsabilidad social corporativa. Los usuarios mencionan a las empresas principalmente para discutir noticias, precios de acciones, plantear dudas o comentar sobre productos. El informe concluye que las empresas se comunican más sobre promociones y RSC que sobre noticias, y que los sectores bancario y de seguros son
Este documento presenta información sobre el guaraní y sus características. Resume las partes principales del idioma guaraní: la fonología (sonidos), la morfología (cómo se forman las palabras) y la sintaxis (estructura de las oraciones). Explica algunos verbos guaraníes comunes y sus significados. Finalmente, proporciona una breve descripción general de las características más importantes del idioma guaraní.
1. O documento apresenta informações sobre a representação descritiva de documentos, pontos de acesso principais e secundários, e cabeçalhos de entrada para nomes pessoais e entidades coletivas de acordo com as regras do AACR2.
2. São abordados conceitos como áreas da descrição, fontes de informação, escolha de pontos de acesso principais e secundários de acordo com o tipo de responsabilidade da obra, além de regras para a formação de cabeçalhos de entrada para pessoas e entidades coletivas.
3.
El documento presenta un resumen del libro y película "El Príncipe de las Mareas". Narra la historia de Tom Wingo, quien visita a su hermana Savannah en Nueva York luego de que ella intentara suicidarse. Tom conoce a Susan Lowenstein, la psiquiatra de Savannah, y comienza a contarle sobre su difícil infancia y el secreto que guarda su familia. A lo largo del tiempo, Tom y Susan desarrollan una relación sentimental mientras él ayuda a Savannah a sanar de sus traumas.
Big Data - Desarrollando soluciones efectivasJoseph Lopez
Este documento presenta una introducción a los conceptos de Big Data y análisis de datos. Define Big Data como la capacidad de extraer información de múltiples fuentes de datos dentro y fuera de una empresa para tomar mejores decisiones de negocios. Explica que la mayoría de los datos se generan fuera de las bases de datos estructuradas tradicionales y que es necesario integrar y analizar diferentes tipos y cantidades de datos. También introduce conceptos como Hadoop, datos en tiempo real, almacenes de datos modernos y la diferencia entre procesamiento paralelo mas
Este documento resume varios estudios de caso de grandes implementaciones de almacenes de datos con SQL Server. Incluye detalles sobre cómo Microsoft AdCenter maneja cubos de hasta 3,2 TB, cómo Xbox Live usa SSD para mejorar el rendimiento y particiona datos para procesamiento paralelo, y cómo Yahoo! maneja un cubo de 12 TB con particionamiento y almacenamiento en archivos.
Qué es Inteligencia de Negocios, Qué es Azure BI, Gestión de la Información, ETLs, Herramientas de Análisis, Visualización de la Información, BI Entrenamientos - iT Synergy
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
Este documento presenta varias mejores prácticas para el diseño y administración de data warehouses con SQL Server. Incluye estudios de caso de empresas como Microsoft AdCenter y Xbox Live que utilizan particionamiento, SSD y balanceo de carga para lograr escalabilidad. También recomienda usar un modelo de datos optimizado para consultas, limpiar datos durante ETL y adoptar un enfoque de "una sola verdad" de datos.
24 HOP edición Español - Patrones de escalalidad en microsoft azure sql datab...SpanishPASSVC
Este documento resume los patrones de escalabilidad en Microsoft Azure SQL Database. Ofrece varias opciones para escalar el rendimiento de forma vertical u horizontal. La escalabilidad vertical se logra cambiando entre los diferentes niveles de servicio (Básico, Estándar y Premium), mientras que la horizontal se logra agregando o eliminando bases de datos. También describe las opciones de sharding para escalar hasta miles de bases de datos y el uso de consultas multi-shard para procesar consultas a través de múltiples shards.
AWS ofrece una gran variedad de servicios de base de datos que se adaptan a los requisitos de su aplicación. Los servicios de bases de datos están totalmente administrados y se pueden implementar en cuestión de minutos con tan solo unos clics.
https://aws.amazon.com/es/products/databases/
Una sencilla y simple exposición rápida de lo que es el servicio de las bases de datos NoSQL en Microsoft Azure "Azure DocumentDB" yéndonos desde las conceptualizaciones y cimientos conceptuales básicos hasta entender y validar como trabajar con modelo de datos JSON document para la creación de documentos repositorios así como de procedimientos almacenados en JavaScript como plataforma de servicio en Azure para con ellos, aplicarlos en las empresas de hoy. Estan tod@s cordialmente invitados a la misma.
Azure SQL Data Warehouse desde cada_anguloAdrian Miranda
Adjunto la presentación de la charla dada el 17 de mayo como parte del Capitulo Virtual de Pass en español. Pronto podrán ver el video en el canal de YouTube. También los invito a visitar el canal de BILATAM también en YouTube, donde pueden encontrar más videos sobre Azure, BI y bases de datos en general.
En lugar de aprovisionar grandes recursos para tu DW, Azure ofrece una versión especial de SQL Server como DataWarehouse. Si está familiarizado con el appliance APS, SQLDW en Azure viene a ser su versión como servicio. Usted crea su DW desde el portal de Azure y ya puede empezar a cargar datos y explotarlos. En esta sesión veremos cómo habilitar el servicio y cómo empezar a explotar SQLDW como tu DW en la nube.
Datawarehouse como servicio en Azure (sqldw)SolidQ
http://summit.solidq.com
En lugar de aprovisionar grandes recursos para tu DW, Azure ofrece una versión especial de SQL Server como DataWarehouse. Si está familiarizado con el appliance APS, SQLDW en Azure viene a ser su versión como servicio. Usted crea su DW desde el portal de Azure y ya puede empezar a cargar datos y explotarlos. En esta sesión veremos cómo habilitar el servicio y cómo empezar a explotar SQLDW como tu DW en la nube.
El documento presenta una agenda para una capacitación sobre Big Data y Data Lakes. Incluye temas como la arquitectura de Data Lake, la creación de metadatos y análisis de información, y la transformación y procesamiento de datos. También incluye casos de uso de compañías como FINRA, Netflix y Yelp que utilizan servicios de AWS como S3, Redshift, EMR y Athena para almacenar y analizar grandes volúmenes de datos de manera rentable.
Sql azure data warehouse gab jorge muchaypinaMUG Perú
Este documento describe Azure SQL Datawarehouse, un almacén de datos relacional como servicio administrado por Microsoft que permite escalar el almacenamiento e infraestructura desde pequeñas hasta grandes cantidades de datos. Usa un motor de procesamiento paralelo masivo para distribuir los datos y la computación a través de nodos de control y proceso. Los datos se almacenan en Azure Blob storage para carga sin costos de procesamiento.
En esta sesión se discutirán las bases de datos, incluyendo las diferencias entre bases de datos SQL y NoSQL. Se explorarán las bases de datos más populares como SQL Server, Oracle, MongoDB, Oracle NoSQL y Cassandra, analizando sus características y ventajas. Finalmente, se revisarán los pasos para crear una base de datos en una ONG.
Este documento resume las principales características y conceptos de SQL Server 2008 Analysis Services (SSAS). SSAS permite el almacenamiento y análisis de grandes cantidades de datos multidimensionales para facilitar la toma de decisiones. Ofrece capacidades OLAP y de minería de datos utilizando un modelo de datos unificado que combina las tecnologías relacionales, multidimensionales e híbridas. El documento también describe conceptos como cubos, dimensiones, jerarquías, medidas y la arquitectura de SSAS.
Este documento resume una presentación sobre Azure Data Factory. La presentación explorará las principales características de Azure Data Factory para la migración de datos entre la nube y localmente, así como la creación de tareas ELT. El orador, Raúl Martín Saráchaga Díaz, es un consultor de inteligencia de negocios y plataforma de datos con experiencia en integración, modelado, análisis y visualización de datos.
Este documento describe Azure SQL Data Warehouse, una plataforma como servicio en la nube de Azure que ofrece procesamiento masivo en paralelo. Azure SQL DW permite escalar el almacenamiento y la computación de forma dinámica en minutos, distribuyendo los datos y las consultas en múltiples nodos de forma paralela para lograr altos rendimientos. El documento explica conceptos como la arquitectura MPP, las distribuciones de datos por hash y round-robin, y las unidades de datos almacenadas (DWU) que determinan los recursos asignados
Este documento describe las características de varias bases de datos populares, incluyendo SQL, Oracle, MongoDB, Oracle NoSQL, y Cassandra. Explica que las bases de datos SQL y NoSQL difieren en su estructura y propósito, con bases de datos SQL diseñadas para datos relacionales y bases de datos NoSQL diseñadas para escalabilidad en grandes volúmenes de datos. Resalta las ventajas de cada base de datos como rendimiento, flexibilidad, tolerancia a fallos y escalabilidad horizontal.
Similaire à Introducción a Microsoft Azure SQL Data Warehouse (20)
Este documento presenta una introducción al entorno de datos de Microsoft Cloud. Comienza introduciendo al orador, Jose Redondo, y su experiencia. Luego presenta una breve agenda que incluye definiciones de nube, Microsoft Azure y nube híbrida, así como demostraciones de Azure IaaS y PaaS. Finalmente, ofrece descripciones generales de conceptos clave como qué es la nube, Microsoft Azure, nube híbrida y los beneficios de usar la nube.
Este documento presenta una introducción al entorno de datos en Microsoft Azure. Explica la evolución de la inteligencia de negocios a través de las versiones 1.0, 2.0 y 3.0. También describe los principales servicios como Data Lake y almacén de datos, y realiza demostraciones de herramientas como Big Data Analytics y Microsoft Data Factory. El objetivo es ayudar a las organizaciones a comprender mejor cómo aplicar la arquitectura de datos adecuada para satisfacer sus necesidades empresariales.
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineJoseph Lopez
En la presente exposición mostrare las diversas caracteristicas que Microsoft Azure Virtual Machine nos ofrece a la hora de implementar una solución virtualizada bajo esta tecnología.
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...Joseph Lopez
Los datos siendo unos de los activos más importantes de la empresas de hoy, debemos tener el poder de mantenerlos seguros y disponibles en cualquier momento. Conocer los diferentes tipos de enmascaramientos asi como entender su funcionalidad y beneficios es una realidad absolutamente imprescindible para los que ejercen control de la seguridad de los datos. Durante la presente exposición, expondré desde las conceptualizaciones basicas de esta tecnología hasta las diferencias que existen entre los diversos metodos de aplicacion de enmascaramiento en escenarios reales tanto On-Premise asi como Cloud.
Conociendo los cambios de SQL Server a partir de 2012 a 2016Joseph Lopez
En la presente charla, les estare mostrando los cambios y mejoras mas relevantes que se generaron en el servidor de base de datos SQL Server de Microsoft a partir de la version 2012 hasta llegar a la version 2016 con faciles demostraciones para entender dichos cambios.
Aplicando Azure Search en Sistemas HibridosJoseph Lopez
Esta presentación es la introducción al mundo real de las búsquedas en Azure Search. Para comprender como construir un buen funcionamiento de búsqueda de un sitio web no es sencillo, ya que para lograr este objetivo se necesita planificación de índices de búsqueda, análisis de solución técnica y buen conocimiento sobre cómo los usuarios interactúan con la búsqueda. Azure Search es un servicio de búsqueda que permite buscar en los sitios web y otros sistemas independientemente donde se encuentre si en la misma plataforma Azure o en plataformas On-Premise, permitiendo consumir resultados de busquedas con el fin de ampliar el espectro de conocimiento de un escenario a tratar. Las demostraciones que mostrare como ejemplo se basan en un sencillo sitio web para husmear profundamente con Azure Search a la búsqueda de Azure y mostrar ampliamente cómo construir soluciones de búsqueda escalable y de gran alcance sobre el mismo.
Performance Tuning en Azure SQL DatabaseJoseph Lopez
Este documento proporciona una introducción al rendimiento de consulta en Azure SQL Database v12. Explica por qué es importante aplicar ajustes de rendimiento, las herramientas disponibles como T-SQL, PowerShell, SQL Server Management Studio y de terceros, las métricas a desarrollar como DMVs y Query Store, y concluye que aplicar ajustes de rendimiento puede ahorrar dinero aprovechando las mismas técnicas que en SQL Server local. Incluye demostraciones de estas herramientas.
Tablas temporales en SQL Server 2016 y Azure SQL Database v12Joseph Lopez
En la presente exposición, les mostrare de forma sencilla a través de demostraciones reales sobre como debemos entender el concepto sobre tablas temporales, las también llamadas tablas versionadas por el sistema; como reciente caracteristica añadida al servidor SQL en su versión 2016 teniendo finalmente como resultado, el mantener automáticamente el historial de los datos en la tabla.
Recuperación ante desastres y continuidad del negocio con Azure SQL DatabaseJoseph Lopez
La continuidad de un negocio implica el diseño, la implementación y la ejecución de todas las aplicaciones que hoy en día sirven de operabilidad en las compañías bajo cualquier escenario de negocio, de manera que las mismas sean resistentes a los eventos de interrupción, planeados o no planeados, que provocan la pérdida permanente o temporal de la capacidad de cualquiera aplicación para realizar efectivamente su función empresarial. Entre los eventos no planeados se incluyen desde los errores humanos hasta las interrupciones permanentes o temporales, pasando por los desastres regionales que pueden provocar la pérdida a gran escala de la instalación en una determinada región de Azure. Los eventos planificados incluyen la reimplementación de la aplicación en una región diferente, la aplicación de actualizaciones de aplicaciones, etc. El objetivo de la continuidad del negocio es que su aplicación siga funcionando durante estos eventos con un impacto mínimo en la función empresarial que desempeña. En la presente sesión, estaré impartiendole de forma sencilla cuáles deberían ser las herramientas y sus respectivos tips para mantener en perfecto estado de ejecución, las bases de datos SQL Database en Azure de cualquier escalabilidad ante cualquier escenario de desastre.
Este documento presenta una agenda para un evento de SharePoint Saturday Day en Lima 2015. La agenda incluye sesiones sobre la arquitectura de SharePoint, la instalación e configuración de SharePoint y SQL Server, el motor de búsqueda, la inteligencia de negocios, copias de seguridad y restauración, alta disponibilidad y recuperación ante desastres. El documento también proporciona antecedentes sobre la historia de SharePoint y describe aspectos clave de la arquitectura como las granjas de SharePoint y las bases de datos.
En esta sesión, exploraremos las inversiones de todas las características referente a la tecnología In-Memory OLTP en Microsoft SQL Server tanto On-Premises así como en la nube, incluyendo el T-SQL Surface Area, Los Procedimientos Almacenados nativamente compilados, así como las mejoras en cuanto a escalabilidad entre muchas otras.
En la presente exposición, se estarán cubriendo todos los productos que bajo el producto Power BI, Microsoft no ofrece en la actualidad. La cual, resumiéndoles todos los productos involucrados mostraremos como funcionan en conjunto. Durante la presente sesión, les explicare y guiare a responder todas las interrogantes que se nos presenten en la vida real para con ellos, logran impartir a nuestros clientes un servicio mas efectivo a la hora de vender este productos en nuestros proyectos.
Sabes que es un almacén de datos? Por qué utilizarlo? Como crearlo? Que modelo utilizar, si normalizado o dimensional? Cual metodología, Kimball o Inmon? Que modelo de tablas? Almacén de datos o Data Mart. Infraestructura de Hardware. Big Data, la nueva moda empresarial. Durante esta sesión les explicare todas estas inquietudes.
Microsoft Azure SQL Database es un servicio de base de datos relacional en la nube que ofrece escalabilidad, disponibilidad y seguridad. Los clientes pueden elegir entre diferentes niveles de servicio (Basic, Standard y Premium) que varían en capacidades como el tamaño y rendimiento de la base de datos. Azure SQL Database proporciona características como copias de seguridad automáticas, recuperación ante desastres y alta disponibilidad a través de la replicación geo-distribuida.
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...Joseph Lopez
This document discusses configuring a SharePoint Server 2013 environment for Business Intelligence with SQL Server 2014. It begins with an introduction to the speaker and agenda. It then provides an overview of SharePoint BI components and how they have evolved. Requirements and architectures for installing and configuring various BI components like Excel Services, PowerPivot, Analysis Services, Reporting Services, and PerformancePoint are covered. Finally, different deployment scenarios are discussed and a demo of SharePoint BI in action is promised.
Configurar su entorno SharePoint para Business IntelligenceJoseph Lopez
Las granjas de SharePoint tienen una gran variedad de formas y tamanhos, y dependen de multiples tecnologias de soporte, incluyendo SQL Server, Active Directory, Analysis Services y Reporting Services. Desafortunadamente, no todas las versiones de estas tecnologias, soportan las nuevas caracteristicas de inteligencia empresarial de SharePoint 2013 y Office 2013. En esta sesion, les expondre de forma simple los multiples escenarios de configuracion que podriamos disenhar para aprovechar al maximo TCO en BI ofrecidos en SharePoint y Office 2013. Utilizaremos tambien, a traves de demos, todo el contorno de servicios que son necesarios para utilizar el nuevo modelo tabular de datos y PowerView en Excel, as como cundo y donde se necesitaran PowerPivot y PowerPivot para SharePoint, y todo lo que deberan hacer en su granja para tomar ventaja de estas caracteristicas. Ademas, vamos a explorar algunos de las caracteristicas disponibles en PerformancePoint Services, y que configuraciones pueden ayudar a sacar lo mejor de este entorno. Finalmente, exploraremos algunas de las mejores practicas alrededor de configuracion de Reporting Services para SharePoint.
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014Joseph Lopez
Debido a que la utilización de MS PowerPivot en los últimos años se ha incrementado significativamente, viendo así como más y más datos se agregan a SharePoint u otros sistemas de negocio, los usuarios de negocios están reconociendo el valor que tiene PowerPivot como una herramienta de análisis. MS SQL Server 2012 y MS SharePoint 2013 proporcionan una fantástica infraestructura para PowerPivot, pero la instalación y configuración de lo específicamente adaptados a su entorno pueden ser complicados, dependiendo de las necesidades de los usuarios empresariales. En esta presentación, primero vamos a recrear a través de una instalación de PowerPivot, una instancia de MS SQL Server Analysis Services 2012 en modo SharePoint, con lo cual mostraremos como segundo paso, cómo instalar y configurar PowerPivot en SharePoint incluyendo las opciones de configuración para la autenticación, la actualización de datos y los servicios de Excel (Excel Services).
Sinopsis avanzada sobre la tecnología de base de datos en memoria optimizado para mejorar el rendimiento de las cargas de trabajo OLTP. De manera general, introduciremos los tópicos sobre las tablas de memoria que se optimizan con el fin de accesar los datos eficientemente, libre de contención y procedimientos almacenados nativamente compilados para una ejecución eficaz de lógica de negocio.
MS SQL Server 2014 - In-Memory ColumnStore Index - Haciendo un almacén de datosJoseph Lopez
Las características "In Memory" es la tendencia más de perspectiva en el área de alto rendimiento. Los Índices de ColumnStore es uno de las tales características, y aún con sus limitaciones, pueden aceleran a veces sus consultas! ¿Cómo obtener más de esta característica? ¿En qué situaciones debemos usarlos? ¿Qué mecanismos internos ayudan a lograr eso? Usted puede obtener respuestas a estas y otras preguntas que se haya generado en algún momento en esta sesión.
SOPRA STERIA presenta una aplicació destinada a persones amb discapacitat intel·lectual que busca millorar la seva integració laboral i digital. Permet crear currículums de manera senzilla i intuitiva, facilitant així la seva participació en el mercat laboral i la seva independència econòmica. Aquesta iniciativa no només aborda la bretxa digital, sinó que també contribueix a reduir la desigualtat proporcionant eines accessibles i inclusives. A més, "inCV" està alineat amb els Objectius de Desenvolupament Sostenible de l'Agenda 2030, especialment els relacionats amb el treball decent i la reducció de desigualtats.
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)AbrahamCastillo42
Power point, diseñado por estudiantes de ciclo 1 arquitectura de plataformas, esta con la finalidad de dar a conocer el componente hardware llamado tarjeta de video..
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...AMADO SALVADOR
Descarga el Catálogo General de Tarifas 2024 de Vaillant, líder en tecnología para calefacción, ventilación y energía solar térmica y fotovoltaica. En Amado Salvador, como distribuidor oficial de Vaillant, te ofrecemos una amplia gama de productos de alta calidad y diseño innovador para tus proyectos de climatización y energía.
Descubre nuestra selección de productos Vaillant, incluyendo bombas de calor altamente eficientes, fancoils de última generación, sistemas de ventilación de alto rendimiento y soluciones de energía solar fotovoltaica y térmica para un rendimiento óptimo y sostenible. El catálogo de Vaillant 2024 presenta una variedad de opciones en calderas de condensación que garantizan eficiencia energética y durabilidad.
Con Vaillant, obtienes más que productos de climatización: control avanzado y conectividad para una gestión inteligente del sistema, acumuladores de agua caliente de gran capacidad y sistemas de aire acondicionado para un confort total. Confía en la fiabilidad de Amado Salvador como distribuidor oficial de Vaillant, y en la resistencia de los productos Vaillant, respaldados por años de experiencia e innovación en el sector.
En Amado Salvador, distribuidor oficial de Vaillant en Valencia, no solo proporcionamos productos de calidad, sino también servicios especializados para profesionales, asegurando que tus proyectos cuenten con el mejor soporte técnico y asesoramiento. Descarga nuestro catálogo y descubre por qué Vaillant es la elección preferida para proyectos de climatización y energía en Amado Salvador.
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)codesiret
Los protocolos son conjuntos de
normas para formatos de mensaje y
procedimientos que permiten a las
máquinas y los programas de aplicación
intercambiar información.
HPE presenta una competició destinada a estudiants, que busca fomentar habilitats tecnològiques i promoure la innovació en un entorn STEAM (Ciència, Tecnologia, Enginyeria, Arts i Matemàtiques). A través de diverses fases, els equips han de resoldre reptes mensuals basats en àrees com algorísmica, desenvolupament de programari, infraestructures tecnològiques, intel·ligència artificial i altres tecnologies. Els millors equips tenen l'oportunitat de desenvolupar un projecte més gran en una fase presencial final, on han de crear una solució concreta per a un conflicte real relacionat amb la sostenibilitat. Aquesta competició promou la inclusió, la sostenibilitat i l'accessibilitat tecnològica, alineant-se amb els Objectius de Desenvolupament Sostenible de l'ONU.
KAWARU CONSULTING presenta el projecte amb l'objectiu de permetre als ciutadans realitzar tràmits administratius de manera telemàtica, des de qualsevol lloc i dispositiu, amb seguretat jurídica. Aquesta plataforma redueix els desplaçaments físics i el temps invertit en tràmits, ja que es pot fer tot en línia. A més, proporciona evidències de la correcta realització dels tràmits, garantint-ne la validesa davant d'un jutge si cal. Inicialment concebuda per al Ministeri de Justícia, la plataforma s'ha expandit per adaptar-se a diverses organitzacions i països, oferint una solució flexible i fàcil de desplegar.
para programadores y desarrolladores de inteligencia artificial y machine learning, como se automatiza una cadena de valor o cadena de valor gracias a la teoría por Manuel Diaz @manuelmakemoney
1. José Redondo
Microsoft SQL Server MVP | CEO EntornoDB | DPA SolidQ
redondoj@gmail.com | @redondoj | redondoj.wordpress.com
Introducción a
Microsoft Azure
SQL Data Warehouse
2. Expositor
• CEO de EntornoDB, USA
• Arquitecto de Datos – Especialista en Inteligencia de Negocio, Análisis de Datos y Big Data
• Desarrollador de aplicaciones de Escritorio, Web y Bases de Datos en .NET y Java
• Desarrollador y DBA en plataformas de datos Microsoft, SyBase, IBM y Oracle
• Conferencista en eventos tecnológicos de Microsoft y PASS en Latinoamérica y Estados Unidos
• SQL Server MCP - MSTS – MTA
• DPA SolidQ
• Contributing Technical Reviewer Packt Publishing
• Microsoft SQL Server MVP
4. • Análisis: La Tradicional "Bodega de datos" y La Moderna "Bodega de datos"
• Arquitectura: Microsoft APS (Analytics Platform System)
• Hadoop & PolyBase
• Performance y Escalabilidad
• Beneficios
• Resumen
• Preguntas y Respuestas
Agenda
6. Microsoft & Bodega de Datos
Parallel
Data Warehouse
v1
Data Allegro en Windows y SQL.
Primera aplicación de DW por
MSFT en colaboración con Dell
y HP
Microsoft Adquiere
Data Allegro
Empresas han consultado la
forma mas eficiente de llevar
MPP (Massively Parallel
Processing) al entorno de SQL
Server
Lanzamiento de
Fast Track
Data Warehouse
Arquitectura de referencia DW
basadas en las mejores
prácticas SMP DW (Symmetric
Multi-Processing Data
Warehousing) ofrecidas con los
principales socios de H/W
2008 2010 2011
7. Microsoft & Bodega de Datos
Azure SQL
Data Warehouse
Service
Introducción del servicio de
Azure SQL Data Warehouse
basado en las capacidades MPP
(Massively Parallel Processing)
de APS (Analytics Platform
System)
Parallel
Data Warehouse
v2
Producto rediseñado ofreciendo
nuevos factores de forma y una
mejor relación
Precio/Rendimiento.
Analytics Platform
System
(APS)
Introducción de Hadoop a la
región dentro de la aplicación y
nuevo nombramiento para
reflejar las más amplias
capacidades de Big Data
2013 2014 2015
8. APS y SQL DW: Estrategia Hibrida
APS (On-Premises)
14. Paralelismo
• Utiliza muchos CPU's separados en paralelo para ejecutar un solo programa
• Nada Compartido: Cada CPU tiene su propia memoria y disco (Scale-Out)
• Los Segmentos se comunican a través de la red de alta velocidad entre
Nodos
MPP -
Procesamiento en
Paralelo Masivo
• Múltiples CPU's solía completar distintos procesos simultáneamente
• Todas las CPU comparten la misma memoria, los discos y los controladores de
red (Scale-Up)
• Todas las implementaciones de SQL Server hasta ahora han sido SMP
• Sobre todo, la solución se encuentra en un SAN compartido
SMP -
Multiprocesamiento
Simétrico
16. Arquitectura lógica
Nodo “Control”
SQL
DMS
Nodo “Control” – La “Razón de Ser”
de SQL Data Warehouse
• También funciona con Azure SQL
Server DB
• Mantiene una copia del "Interprete
de comando o Shell" de cada base
de datos
• Metadatos, Estadísticas, etc.
• El "Rostro Público" de la Aplicación
17. Arquitectura lógica
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
Nodo de Computo - La "Abeja
Obrera" de SQL Data Warehouse
• Ejecuta Azure SQL Server DB
• Contiene una “Parte o Slice" de
cada base de datos
• CPU está saturado por el
almacenamiento
18. Arquitectura lógica
Data Movement Services (DMS)
• Parte del "Condimento secreto" de
SQL Data Warehouse
• Mueve los datos alrededor de su
contexto según sea necesario
• Permite operaciones paralelas entre
los nodos de cómputo (Consultas,
cargas, etc.)
Nodo “Compute”
Almacenamiento
BalanceadoSQL
Nodo “Compute”
Almacenamiento
BalanceadoSQL
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
Nodo “Compute”
Almacenamiento
BalanceadoSQL
DMS
DMS
DMS
20. Opciones de la capa de datos
Nodo “Compute”
Almacenamiento
BalanceadoSQL
Almacenamiento
Balanceado
Nodo “Compute”
SQL
Nodo “Compute”
SQL
Nodo “Compute”
SQL
DMS
DMS
DMS
DMS
Time Dim
Date Dim ID
Calendar Year
Calendar Qtr
Calendar Mo
Calendar Day
Store Dim
Store Dim ID
Store Name
Store Mgr
Store Size
Product Dim
Prod Dim ID
Prod Category
Prod Sub Cat
Prod Desc
Customer Dim
Cust Dim ID
Cust Name
Cust Addr
Cust Phone
Cust Email
Sales Fact
Date Dim ID
Store Dim ID
Prod Dim ID
Cust Dim ID
Qty Sold
Dollars Sold
T
D
P
D
S
D
C
D
T
D
S
D
T
D
P
D
S
D
C
D
T
D
S
D
SalesFact
Replicado
Tabla copiada a cada "Nodo Compute"
Distribuido
Publicación de la Tabla a través de los nodos de cómputo basado en el "Hash"
Esquema Estrella
Almacenamiento
Balanceado
Almacenamiento
Balanceado
P
D
C
D
P
D
C
D
21. Distribución de los datos
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
FactSales_
A
FactSales_
B
FactSales_
C
FactSales_
D
FactSales_
E
FactSales_
F
FactSales_
G
FactSales_
H
Nodo Control
…Nodo Compute 1 Nodo Compute 2 Nodo Compute X
Envia Create Table SQL a cada “Nodo Compute”
Create Table FactSales_A
Create Table FactSales_B
Create Table FactSales_C
……
Create Table FactSales_H
FactSalesA
FactSalesB
FactSalesC
FactSalesD
FactSalesE
FactSalesF
FactSalesG
FactSalesH
FactSalesA
FactSalesB
FactSalesC
FactSalesD
FactSalesE
FactSalesF
FactSalesG
FactSalesH
FactSalesA
FactSalesB
FactSalesC
FactSalesD
FactSalesE
FactSalesF
FactSalesG
FactSalesH
La metadata del Create
Table en el Nodo Control
CREATE TABLE FactSales
(
ProductKey INT NOT NULL ,
OrderDateKey INT NOT NULL ,
DueDateKey INT NOT NULL ,
ShipDateKey INT NOT NULL ,
ResellerKey INT NOT NULL ,
EmployeeKey INT NOT NULL ,
PromotionKey INT NOT NULL ,
CurrencyKey INT NOT NULL ,
SalesTerritoryKey INT NOT NULL ,
SalesOrderNumber VARCHAR(20) NOT NULL,
) WITH
(
DISTRIBUTION = HASH(ProductKey),
CLUSTERED INDEX(OrderDateKey) ,
PARTITION
(OrderDateKey RANGE RIGHT FOR VALUES
( 19950601,
19950901,
) ) );
22. APS
Balanceo equilibrado
de carga entre
servidores
Tablas mas grandes 600,000,000,000
Distribuidos aleatoriamente entre 40 nodos de cómputo (5 racks) 15,000,000,000
En cada servidor aleatoriamente distribuido en 8 tablas (Por consiguiente
hasta 320 tablas en total)
1,875,000,000
Cada partición = 2 años de datos particionados por semana (Beneficiando
todas las consultas por fecha)
18,028,846
23. APS
Balanceo equilibrado de carga entre servidores
Como un usuario final o un DBA que piensa en 1 tabla.
Ejemplo: LineItem.
“SELECT * FROM LineItem” está dividido en 320
consultas en paralelo contra 320 (1.875 billones de
registros) tablas.
“SELECT * FROM LineItem WHERE OrderDate =
‘1/1/2012’" son 320 consultas en 320 (18 millones de
registros) tablas.
Es totalmente irrelevante el saber que en realidad existan
320 tablas que representan 1 tabla lógica.
CCI (Clustered Columnstore Index) puede agregar mayor
rendimiento mediante la eliminación del segmento.
24. Introduciendo el Servicio Azure SQL DW
Un almacén de datos relacionales "as-a-service",
totalmente gestionado por Microsoft.
La primera empresa con servicios flexible de
almacenamiento de datos en la nube con
capacidades de nivel empresarial.
Soporte a su más pequeñas necesidades de
almacenamiento de datos más grandes durante la
gestión de consultas hasta 100 veces más rápido.
26. Desplegar rápidamente y obtener una visión
Ship Disks
Azure Storage
HDInsight
Herramientas
de migración
Todos los Tipos de
Datos Analíticos con
Power BI + ML
27. Flexibilidad en tiempo real
• Produzca alternativas de grandes cargas
de trabajo, generando períodos bajos de
actividad diaria.
• Obtenga tiempo de visualizar
requerimientos basado en lo que usted
necesita, cuando usted lo necesita.
• Elija el combo de cálculo y
almacenamiento de información que
satisfaga sus necesidades.
29. Cuando está en Pausa, Pague sólo por
Almacenamiento
Utilícelo sólo cuando lo necesite, sin recargar o
restaurar datos
Ahorre costos con paradas dinámicas y reinicios inmediatos
• Cuando está en pausa, el almacenamiento en la nube a
gran escala es de costo mínimo.
• Basado en políticas (Es decir, noches y fines de semana)
• Automatice mediante PowerShell & REST API
• Los datos permanecen en su lugar
30. SQL DW:
Desarrollado sobre SQL DB Foundation
Flexible
Escalabilidad a Petabytes
Optimizado para DW
99.99% de tiempo de actividad SLA*
Geo-Restauración
Cumplimiento de normas en Azure
(ISO, HIPAA, EU, etc.)
Verdadera Experiencia SQL Server
Magnificas herramientas de trabajo
SQL DW
SQL DB
Niveles de servicio
* Service Level Agreement - Acuerdo de nivel de servicio
31. Unidad de Almacenamiento de Datos (DWU)
Basta con adquirir el rendimiento que se necesitan en las consultas, no solo de
hardware
Cuantificados mediante objetivos de volumen de trabajo: cómo rápidamente las
filas de registros son escaneadas, cargadas, copiadas, etc.
Medidas de Poder
Transparencia
Primer servicio de DW para ofrecer potencia de cálculo bajo demanda,
independientemente de almacenamiento a requerir.
Bajo Demanda
32. Unidad de Almacenamiento de Datos (DWU)
*
100 DWU = 297 seg
400 DWU = 74 seg
800 DWU = 37 seg
1,600 DWU = 19 seg
*
Velocidad de Lectura 3.36M reg/seg
Tasa de Carga 130K reg/seg
Table Copy Rate 350K reg/seg
*
34. Qué es Hadoop?
34
Core Services
OPERATIONAL
SERVICES
DATA
SERVICES
HDFS
SQOOP
FLUME
NFS
LOAD &
EXTRACT
WebHDFS
OOZIE
AMBARI
YARN
MAP
REDUCE
HIVE &
HCATALOG
PIG
HBASEFALCON
Hadoop Cluster
compute
&
storage . . .
. . .
. .
compute
&
storage
.
.
Hadoop Clusters proporcionan
almacenamiento de
escalabilidad horizontal y
procesamiento de datos
distribuido en el hardware en
cada uno de los servicios
básicos
.
.
.
35. Qué es Hadoop?
Distribuido, Sistema Escalable en
componentes de Hardware
Compuesto de unas pocas partes:
HDFS – Sistema Distribuido de
Archivos
MapReduce – Modelo de
Programación
Otras herramientas: Hive, Pig, SQOOP,
HCatalog, HBase, Flume, Mahout,
YARN, Tez, Spark, Stinger, Oozie,
ZooKeeper, Flume, Storm
36. Qué es Hadoop?
Los principales actores son
Hortonworks, Cloudera, MapR
ADVERTENCIA: Hadoop es ideal
para el procesamiento de grandes
volúmenes de datos PERO es
insuficiente para el análisis de los
datos en tiempo real (Las
empresas hacen análisis de lotes
en su lugar)
37. Consulta de datos no estructurados mediante
Polybase/T-SQL
Instancia SQL DW
Escalabilidad de computo
Hadoop VMs /
Azure StoragePolyBase
38. Consulta de datos no estructurados mediante
Polybase/T-SQL
• Permite capacidades de consultar a través
de distribuciones de Hadoop comunes
(HDP y Cloudera) y formatos de archivo de
Hadoop en Azure Storage.
• Permite el aprovechamiento de las
habilidades de SQL existentes y
herramientas de BI
• Soporta múltiples formatos de archivo no
relacionales
• Mejora el ciclo de conocimiento y
conceptualización de ideas y generación
de ETL simplificado
Polybase para consultar y administrar datos no relacionales de Hadoop y datos relacionales
39. Consultar datos Hadoop con T-SQL
utilizando PolyBase
Reunir a todos los paradigmas de
almacenamiento o Big Data y a los
repositorios de datos en conjunto para
los usuarios finales e IT
Select… Result set
SQL DW
Cloudera CHD Linux 4.6
Hortonworks HDP 2.1
(Windows, Linux)
Windows Azure
HDInsight (HDP 2.1)
(HDFS)
PolyBase
SQL DW
Otros (SQL Server, DB2,
Oracle)?
Verdaderos motores de
consultas federadas
Windows Azure Storage-Blob
(WASB)
40. Consultar datos Hadoop con T-SQL utilizando
PolyBase
Reunir a todos los paradigmas de almacenamiento o Big Data y a los repositorios de datos
en conjunto para los usuarios finales e IT
• Proporciona un modelo único de consulta T-SQL
("Capa semántica") para APS y Hadoop con ricas
características de T-SQL, incluyendo uniones sin
ETL
• Utiliza el poder del MPP para mejorar el
rendimiento de ejecución de consultas
• Compatible con Windows Azure HDInsight para
habilitar nuevos escenarios de nube híbrida
• Proporciona la capacidad de consulta de las
distribuciones de Hadoop no Microsoft, como
Hortonworks y Cloudera
• Usar habilidades SQL existente, sin intervención
de personal IT
41. Use cases where PolyBase
simplifies using Hadoop data
Bringing islands of Hadoop data together
High performance queries against Hadoop data
(Predicate pushdown)
Archiving data warehouse data to Hadoop (move)
(Hadoop as cold storage)
42. Los casos de uso donde
PolyBase simplifica los datos
utilizando Hadoop
Recopilar todos los escollos de datos Hadoop
Exportación datos relacionales a Hadoop (Copia)
(Hadoop como Copia de seguridad,
Análisis, Uso On-Premise)
Importación de datos Hadoop dentro del data warehouse
(Copia)
(Hadoop como área Staging, Sandbox,
Data Lake)
43. Comprendiendo Big Data para cualquier
persona
Integración nativa de Microsoft BI para crear nuevos competencias con herramientas
conocidas
Herramientas
como Power BI
reduce al mínimo
la intervención
para descubrir
datos
T-SQL para DBA
y Usuarios para
unirse a datos
relacionales y
Hadoop
Herramientas
Hadoop como
Map-Reduce,
Hive y Pig para
Data Scientists
Aprovecha alta
adopción de
Excel, Power
View, Power Pivot
y SSSA
44. Usuarios Finales
Data Scientist
Todo el mundo utilizando
herramientas de Microsoft BI
Comprendiendo Big Data para cualquier
persona
Integración nativa de Microsoft BI para crear nuevos competencias con herramientas
conocidas
45. Tecnologías de escalabilidad en SQL Data Warehouse
Procesamiento Paralelo Masivo (MPP)
paraleliza las consultas (No basada en la
capacidad impulsada por velocidad)
Múltiples nodos con CPU dedicada,
memoria, almacenamiento "No
compartido"
Añade incrementalmente Hardware para
la escala casi lineal al multi-PB (No es
necesario eliminar los datos más
antiguos entre otros)
Maneja escalablemente la complejidad
de las consultas y las concurrencia a las
mismas
46. No "Forklift" del almacén antes
de aumentar la capacidad
Comenzar con unos almacenes
de tamaño de Terabyte
Soporte mixto para la carga de
trabajo: Consulta mientras se
carga (250GB/hora por nodo).
No hay necesidad de activar una
ventana de mantenimiento
Tecnologías de escalabilidad en SQL Data Warehouse
48. MPP y In-Memory Columnstore para un rendimiento de próxima generación
Representación del índice de Columnstore
C1 C3 C5C4C2 C6
Ejecución de consultas en paralelo
Query
Resultados
49. iento
MPP y In-Memory Columnstore para un
rendimiento de próxima generación
• Almacenar datos en formato de
columnas para la compresión masiva
• Cargar datos dentro o fuera de la
memoria para un rendimiento de
próxima generación
• Actualizable y agrupado para carga
lenta en tiempo real
• No hay índices secundarios requeridos
Consultas más rápidas
de hasta 100x
Columnstore agrupados actualizable vs. Tablas con indexación habitual
Hasta compresión
de mas de 15x
50. Resultados de los Servicios de Negocios de la
Empresa antes y después
SMP vs. APS
54x
de mejora
cargando datos
(48 horas vs. 53
minutos)
25x, 193x, de
mejora en la
ejecución de las
consultas (4 días
y 6 horas vs. 32
minutos)
51. 1.4 TB/hr tiempo
de carga (7
billones de
registros) (1.21TB
en 53:20)
Con las misma
herramientas de
trabaja de
Microsoft BI
conocidas
Resultados de los Servicios de Negocios de la
Empresa antes y después
SMP vs. APS
52. Las DWU serán
de doble
rendimiento
9.4x
compresión (7
billones de
registros) (De
1.7TB a 179GB)
Resultados de los Servicios de Negocios de la
Empresa antes y después
SMP vs. APS
53. Visión y Arquitectura general del flujo de datos
Stream Analytics
TransformaciónCapturar
Web logs
Presentación &
Toma de decisiones
IoT, Dispositivos
móviles, etc.
Social Data
Event Hubs HDInsight
Azure Data
Factory
Azure SQL DB
Azure Blob Storage
Azure Machine
Learning
(Detección de
Fraude, etc.)
Power BI
Web
dashboards
Dispositivos móviles
DW /
Almacenamiento a
Largo Plazo
Análisis Predictivo
Eventos &
Producción de
datos
Azure SQL DW
54. Llevar fácilmente tu DW a la nube
• Migración transparente de una
variedad de orígenes On-Premise y
Cloud
• Carga rápida, coherente y estable para
la migración
• Herramientas de migración integradas
con soporte para todos las cargas de
trabajo
56. Migración SQL Data Warehouse Services - Detalles
1. Acelerador de Migración
2. Importar/Exportar
3. ExpressRoute/Herramientas de Carga
57. Opciones de Carga de Datos
• Gran ecosistema de potentes herramientas
ETL
• Cargar directamente de una variedad de
fuentes de orígenes
• Cargas de forma transparente paralelizados
• Estabilidad y consistencia garantizada
58. Ecosistema de socios muy bien extensible de
SQL Server
+ Establecido con Azure ML, HDInsight,
PowerBI, ADF, y mas.
+ El Ecosistema más amplio de la industria de
los socios de Data Warehouse, incluyendo
Tableau, Informatica, Attunity, y SAP. Azure ML
Azure Event Hub
Azure Stream
Analytics
Azure
HDInsight
Power BI
Microsoft
59. Ecosistema de socios muy bien extensible de
SQL Server
Despliegue optimizado con el Portal de
Azure.
Integración profunda con las herramientas
de los principales socios incluyendo:
• Configuración con un solo clic
• Movimiento de datos optimizado
• Pushdown lógico
Azure SQL DW
60. Líder en el mercado Precio/Rendimiento
• La mejor oferta del mercado
Precio/Rendimiento
• Ventajas en elasticidad y pausa
para reducir costos al cliente
• Iniciando con pequeño SQL
DW, pudiendo crecer a PB
rápidamente sin inconveniente
alguno
• Pagar por el rendimiento
mediante la ampliación de
cómputo contra el
almacenamiento 100GB 1TB 2TB 1+PB
Performance
64. Ejemplo de Análisis
Descriptivo: ¿Cuántos de nuestros
clientes persisten en el último
mes? ¿Cuántos de estos clientes
son rentable?
Diagnostico: Por qué dejaron
estos clientes el ser rentables??
Predictivo: Cuántos clientes
rentables son propensos a dejar
el mes que viene?
Prescriptivo: Cómo podemos
reducir esta tasa de rotación de
clientes rentables?
65. Copia de seguridad automática y Geo-Restore
Recuperarse de eliminación de datos o la alteración o desastre
Geo-Replicado
Restauración desde
las copias de
seguridad
SQL Data Warehouse
Backups
sabcp01bl21
Azure Storage
sabcp01bl21
66. Copias de seguridad automática cada
4 horas, en el Azure Storage
("Recuperación de desastres") y Geo-
Replicado ("alta disponibilidad")
Copias de seguridad On-Demand en
Azure Storage donde el usuario final
puede habilitar la Geo-Replicación
REST API, PowerShell o El Portal de
Azure
Exportaciones programadas para la
retención a largo plazo
Copia de seguridad automática y Geo-Restore
Recuperarse de eliminación de datos o la alteración o desastre
67. Copia de Seguridad y Restauración en
línea basado en copias instantáneas de
almacenamiento
Política de retención de Copias de
Seguridad:
• Copia de Seguridad automáticas
hasta 35 días
• Copias de seguridad bajo demanda
retenidas indefinidamente
Copia de seguridad automática y Geo-Restore
Recuperarse de eliminación de datos o la alteración o desastre
69. Menos mantenimiento y monitoreo del DBA
• No hay creación de índice
• No hay datos eliminados o archivados
para ahorrar espacio
• Simplicidad de gestión (System Center,
Consola de Administración, DMVs)
• Sin bloqueo
• Sin registros de transacciones
• Sin sugerencias de consulta
• Sin estados de espera
• Sin tuning de IO
70. Menos mantenimiento y monitoreo del DBA
• No hay optimización de consulta /
Tuning
• No hay índice para reorganizarlos /
reconstruirlos
• No particiones
• No hay grupos de archivos que
gestionan
• No hay bases de datos para
contraer o expandir
• No hay gestión de servidores físicos
• No hay servidores y software de
parchado
RESULTADO: DBA invierten más de su
tiempo como arquitectos y no
perdedera de tiempo en tonterías!
71. Mejor juntos – SQL DW
con APS
SQL Server
Parallel Data
Warehouse
Microsoft
HDInsight
(Hadoop)
PolyBase
Azure ML
Azure Event Hub
Azure HDInsight
SQL DW Service
Analytics Platform System
72. Mejor juntos – SQL DW con APS
Utilizar el servicio de SQL DW o APS
como su solución de recuperación
ante desastres con carga Dual
Recuperación
de Desastres
Los Datos Históricos al Servicio de SQL
DW pero manteniendo completo el
poder de MPP en ejecución
Datos
Históricos
Restricciones y
políticas de las
Empresas
Pruebas /
Desarrollo o
Producción
Almacenar datos en APS que la política
de la empresa prohíbe estar en la nube
Poner a prueba nuevas ideas en el
servicio de SQL DW antes de salir a
producción en APS
73. Lo que esta por venir…
Verano 2015
Preview Publica
• Pausada y Reanudada Dinámica
• Integración con la Plataforma de Servicio de Azure
(CloudML, ADF, HDInsight, SQL-IP)
• Integración con todo el ecosistema de los Partners de
SQL Server
• Geo-Restauración
• Servicio o Aplicación híbrida
• PolyBase para la integración a Big Data
• T-SQL preparado para las empresas
• Primera ola de socio certificados en SQL
A finales 2015/ A comienzo
2016
Acuerdo a esperar
• Certificado ISO, PCI
• Clausula de Modelo HIPAA, BAA, &
EU
Acuerdo de Nivel de Servicio
• 99.99% SLA