O documento apresenta uma palestra sobre desmistificando Big Data com o Microsoft Azure HDInsight e Power BI. A palestra aborda conceitos de Big Data, Apache Spark, Apache Hive, Apache Ambari e Power BI e faz uma demonstração utilizando o Azure HDInsight.
2. PALESTRANTE
#GlobalAzureBH
Paulo Ricardo Santos –
Desmistificando o Big Data com o Microsoft Azure HDInsight + PowerBI
Arquiteto de Dados
Rede social | @pauloricardovds
pauloricardodba@gmail.com
pauloricardovds
5. Big Data é o termo que descreve o imenso volume de dados –
estruturados e não estruturados – que impactam os negócios
no dia a dia. Mas o importante não é a quantidade de dados, e
sim o que as empresas fazem com os dados que realmente
importam.
Definição de Big Data
6.
7.
8. O que torna o Spark rápido?
Spark X MapReduce tradicional
12. O Azure HDInsight é um serviço de nuvem totalmente
gerenciamento que facilita e torna mais rápido e econômico
processar grandes quantias de dados. Use as estruturas de
software livre populares como Hadoop, Spark, Hive, LLAP, Kafka,
Storm, R e mais. O Azure HDInsight permite uma ampla gama
de cenários como ETL, Data Warehousing, Machine Learning,
IoT e mais.
Azure HDInsight?
13. O que você pode criar com o Azure HDInsight?
https://azure.microsoft.com/pt-br/services/hdinsight/