Descomplicando Queries com Elasticsearch

•Télécharger en tant que PPTX, PDF•

0 j'aime•72 vues

1. O documento descreve o Elasticsearch, incluindo o que é (mecanismo de busca e análise de dados distribuído), seu histórico (desenvolvido sobre o Apache Lucene e lançado em 2010) e conceitos-chave (como clusters, nodes, indexes e documents). 2. Apresenta casos comuns de uso do Elasticsearch, como consultas de texto, relevância de resultados, observabilidade e gerenciamento de logs. 3. Discutem vários tipos de queries que podem ser feitas no Elasticsearch, como consultas por ID, parâmetro, em todos os

Technologie

1
Descomplicando queries
no Elasticsearch
Roberto Alves
Lead Software Engineer @ Altran

• É um mecanismo de busca e análise de dados distribuído;
• Desenvolvido sobre o Apache Lucene;
• Lançado em 2010 pela Elasticsearch N.V. (atualmente Elastic);
• Possui um conjunto de REST APIs;
• Integrante da ELK Stack.
Elasticsearch?

Valorização do log
Ciclo de um desenvolvedor
1 2 3 4 5
Extração do
log do
container ou
da máquina
virtual
Armazena
o log da
response
no banco
de dados
Armazena o
log da
response e
da request
no banco de
dados
Cria um
banco de
dados NoSQL
para logs
Armazena log
em um
mecanismo
inteligente -
Elasticsearch

1
Cluster
Grupo de nós
(servidores) que
guardam dados.
3
Index
Agrupamento de
documentos.
Análogo ao conceito
de base de dados
em SQL.
2
Node
Servidor individual de
armazenamento de
dados.
Participa de um cluster.

4
Shards
Subgrupo de
documentos de um
index.
Um index pode ter
vários shards.
6
Document
Objeto JSON com
dados. Unidade de
informação a ser
indexada.
5
Type
Definição de um
Schema de um Index.
Análogo ao conceito de
tabela em SQL.

O segredo da performance
● Text blob + indexes
● Index invertido

• Consultas de texto que exijam alta velocidade;
• Relevância de resultados;
• Observabilidade;
• Geolocalização;
• O conjunto da obra;
• Gerenciamento de logs.
• Entre outros.
Cenários comuns de uso

Contenu connexe

Similaire à Descomplicando Queries com Elasticsearch

TDC2017 | São Paulo - Trilha NOSQL How we figured out we had a SRE team at - ...tdc-globalcode

Palestra Elasticsearch - The Developers Conference - São Paulo - 2017Thiago Barradas

Apresentação no Meetup da Elastic em Florianopolisluis antonio Nunes

Intro Arquitetura OraclePablo Garcia

Python na nuvem: OpenStack SwiftDenis Cavalcante

Elasticsearch 5.0Thiago Souza

AWS Meetup - Processando dados em alta escala com Node.js e AWS LambdaDaniel Baptista Dias

Search: Explorando Todo O Poder das Buscas - Liferay Symposium Brasil 2015, S...André Ricardo Barreto de Oliveira

Otimização MySQLElton Minetto

LINQLeonardo Lourenço Silva

Aula03 - protocolo ldapCarlos Veiga

NosqlSuissa

Course Hibernate 2008Milfont Consulting

Material Seminário NoSQLLorran Pegoretti

Banco de Dados em Grafos com Neo4J Daniel San Martin

TDC2017 | São Paulo - Trilha NODEJS How we figured out we had a SRE team at -...tdc-globalcode

TDC - Processamento de dados em alta escala com Node.js e AWS LambdaDaniel Baptista Dias

Oracle Day - Produtos de banco de dadosRodrigo Almeida

Azure Data OverviewFabrício Catae

Desenvolvendo para o Windows Azure e SQL AzureLuciano Condé

Similaire à Descomplicando Queries com Elasticsearch (20)

TDC2017 | São Paulo - Trilha NOSQL How we figured out we had a SRE team at - ...

Palestra Elasticsearch - The Developers Conference - São Paulo - 2017

Apresentação no Meetup da Elastic em Florianopolis

Intro Arquitetura Oracle

Python na nuvem: OpenStack Swift

Elasticsearch 5.0

AWS Meetup - Processando dados em alta escala com Node.js e AWS Lambda

Search: Explorando Todo O Poder das Buscas - Liferay Symposium Brasil 2015, S...

Otimização MySQL

LINQ

Aula03 - protocolo ldap

Nosql

Course Hibernate 2008

Material Seminário NoSQL

Banco de Dados em Grafos com Neo4J

TDC2017 | São Paulo - Trilha NODEJS How we figured out we had a SRE team at -...

TDC - Processamento de dados em alta escala com Node.js e AWS Lambda

Oracle Day - Produtos de banco de dados

Azure Data Overview

Desenvolvendo para o Windows Azure e SQL Azure

Plus de Roberto Alves

Descomplicando Service MeshRoberto Alves

LGPD aplicada na área da Saúde - TDC Transformation 2021Roberto Alves

Avançando em Queries no Elasticsearch - TDC Sala ElasticRoberto Alves

DockerConBR 2021Roberto Alves

Blue/Green Deployment Pattern - DevOpsDays 2020Roberto Alves

Teste de carga com Node.js - Americana Tech Conf 2020Roberto Alves

Como o Einstein se preparou para sustentar o aumento exponencial de uso da Te...Roberto Alves

Serverless weekRoberto Alves

LocalStack - TDC Porto Alegre 2020Roberto Alves

Node.js Streams - TDC SPRoberto Alves

Explorando o mundo serverlessRoberto Alves

Plus de Roberto Alves (11)

Descomplicando Service Mesh

LGPD aplicada na área da Saúde - TDC Transformation 2021

Avançando em Queries no Elasticsearch - TDC Sala Elastic

DockerConBR 2021

Blue/Green Deployment Pattern - DevOpsDays 2020

Teste de carga com Node.js - Americana Tech Conf 2020

Como o Einstein se preparou para sustentar o aumento exponencial de uso da Te...

Serverless week

LocalStack - TDC Porto Alegre 2020

Node.js Streams - TDC SP

Explorando o mundo serverless

Descomplicando Queries com Elasticsearch

1. 1 Descomplicando queries no Elasticsearch Roberto Alves Lead Software Engineer @ Altran

2. 5 O que exatamente é o Elasticsearch?

3. • É um mecanismo de busca e análise de dados distribuído; • Desenvolvido sobre o Apache Lucene; • Lançado em 2010 pela Elasticsearch N.V. (atualmente Elastic); • Possui um conjunto de REST APIs; • Integrante da ELK Stack. Elasticsearch?

4. Valorização do log Ciclo de um desenvolvedor 1 2 3 4 5 Extração do log do container ou da máquina virtual Armazena o log da response no banco de dados Armazena o log da response e da request no banco de dados Cria um banco de dados NoSQL para logs Armazena log em um mecanismo inteligente - Elasticsearch

5. Use cases

6. Conceitos no Elasticsearch

7. 1 Cluster Grupo de nós (servidores) que guardam dados. 3 Index Agrupamento de documentos. Análogo ao conceito de base de dados em SQL. 2 Node Servidor individual de armazenamento de dados. Participa de um cluster.

8. 4 Shards Subgrupo de documentos de um index. Um index pode ter vários shards. 6 Document Objeto JSON com dados. Unidade de informação a ser indexada. 5 Type Definição de um Schema de um Index. Análogo ao conceito de tabela em SQL.

10. Verbo DocID Index Type Document

11. Verbo DocID Index Type Document

12.

13.

14.

15.

16.

17. O segredo da performance ● Text blob + indexes ● Index invertido

18. Index invertido

19. 5 Quando utilizar o Elasticsearch?

20. • Consultas de texto que exijam alta velocidade; • Relevância de resultados; • Observabilidade; • Geolocalização; • O conjunto da obra; • Gerenciamento de logs. • Entre outros. Cenários comuns de uso

21. Avançando em queries

22. Consulta por ID

23. Consulta por ID

24. Consulta por ID

25. Consulta por ID

26. Consulta por parâmetro Parâmetro Valor

27. Consulta por parâmetro

28. Consulta em todos os índices

29. Consulta em todos os índices

30. Match query

31. Match query

32. Match query com operator

33. Match com operator

34. Minimum should match

35. Minimum should match

36. Multi-Match Query

37. Multi-Match Query

38. Match Phrase

39. Match Phrase

40. Slop Parameter

41. Slop Parameter

42. Term Query

43. Term Query

44. Range Queries

45. Range Queries

46. Wildcard Parameter

47. Wildcard Parameter

48. Regexp

49. Regexp

50. Funny Queries

51. Funny Queries

52. Combinando operações

53. Combinando operações

54. Obrigado!

Notes de l'éditeur

Aberto para todos os tipos de dados, incluindo textuais, numéricos, estruturados e não estruturados – orientado a documentos; O Apache Lucene é uma biblioteca de software de mecanismo de pesquisa gratuita e de código aberto – construído em Java; Possui um suporte para entrada, processamento e saída de dados; Elasticsearch é o componente central do Elastic Stack, um conjunto de ferramentas gratuitas e abertas para ingestão, enriquecimento, armazenamento, análise e visualização de dados; Altamente escalável; Armazenamento e busca/análise de dados com altíssimo desempenho – quase que em tempo real; Documentação muito completa; Comunidade grande e ativa.
Cisco, Adobe, Docker, iFood, Udemy, SoundCloud, etc. Empresas destaques nos seus respectivos ramos e de áreas distintas utilizam a ferramenta, o que mostra sua flexibilidade e adaptabilidade ao negócio.
Shards é análogo a partição em SQL; Conceitos semelhantes aos do MongoDB para quem está familiarizado.
Justamente, por conta dessa arquitetura, o Elasticsearch possui facilidade para escalar e crescer horizontalmente. Para escalar, bastar adicionar mais um “Node” no seu cluster. O Shard é uma instância de um índice de Lucene, basicamente um mecanismo de pesquisa que indexa e manipula consultas para um subconjunto dos dados no cluster do Elasticsearch. À medida que os dados são gravados em um shard, eles são publicados em novos segmentos Lucene, e é nessa hora que ficam disponíveis para consultas.
O Elasticsearch possui flexibilidade no gerenciamento de IDs, caso não seja informado, ele gera automaticamente.
Quando um documento é armazenado, ele é indexado e totalmente pesquisável quase em tempo real - em 1 segundo. O Elasticsearch usa uma estrutura de dados chamada índice invertido que oferece suporte a pesquisas de texto completo muito rápidas. Um índice invertido lista cada palavra única que aparece em qualquer documento e identifica todos os documentos em que cada palavra ocorre.
Ao invés de armazenar apenas um id e colunas de valor, como um banco de dados relacional tradicional, o Elastic armazena “termos” (palavras), sua quantidade de repetições e documentos onde ocorrem; Desta forma, em uma busca por texto específico, ao invés de realizar um fullscan em talvez milhões de registros, ele pode localizar diretamente apenas os registros onde as palavras filtradas de fato ocorrem; Priorização por repetição de acordo com os termos pesquisados; É possível indexar por região; Normalização de termos repetitivos maiúsculo e minúsculo, singular e plural – tudo depende de como você configura e impacta na forma de como as suas queries irão obter o resultado.
O conjunto da obra – ELK, REST APIs e funcionalidades prontas como agregação de informações, vocês quis dizer, e etc;
O Elasticsearch possui flexibilidade no gerenciamento de IDs, caso não seja informado, ele gera automaticamente.
A consulta de “Match” é uma das consultas mais básicas e comumente usadas no Elasticsearch e funciona como uma consulta de texto completo. Podemos usar esta consulta para pesquisar texto, números ou valores booleanos; Isso retorna o mesmo documento de antes porque, por padrão, o Elasticsearch trata cada palavra na consulta de pesquisa com um operador OR.
O conjunto da obra – ELK, REST APIs e funcionalidades prontas como agregação de informações, vocês quis dizer, e etc;

Descomplicando Queries com Elasticsearch

Recommandé

Recommandé

Contenu connexe

Similaire à Descomplicando Queries com Elasticsearch

Similaire à Descomplicando Queries com Elasticsearch (20)

Plus de Roberto Alves

Plus de Roberto Alves (11)

Descomplicando Queries com Elasticsearch

Notes de l'éditeur