SlideShare une entreprise Scribd logo
1  sur  17
Télécharger pour lire hors ligne
Indexação e busca
baseada em metadados
em um sistema P2P
Híbrido
Centro de Informática
Universidade Federal de
Pernambuco

Marco André Santos Machado
masm@cin.ufpe.br
Agenda
●
  Indexação e Buscas
●
  Metadados
●
  Trabalhos Relacionados
●
  Proposta
●
  Análise Comparativa




                           2
Indexação e Buscas




                     3
Metadados
●
  ID
●
  Nome
●
  Tamanho (Kb)
●
  Path
●
  Datas de criação, indexação, modificação
●
  Interesses do usuário
●
  Categoria
●
  Conteúdo

                                        4
Trabalhos Relacionados




                     5
Trabalhos Relacionados
●   Sixearch
    –   Composto por muito componentes:
    –   Crawler
    –   Sistema para Indexação
    –   Mecanismo de Recuperação
    –   Sistema de aprendizado baseado em
        contexto
●   Index local, aggregated, em clustering)

                                       6
Trabalhos Relacionados
●   Minerva
    –   Cada peer descobre e indexa seus arquivos
    –   Envia um conjunto de metadados baseado em
        termos para um index global
    –   Possui um index local e global (2-steps)




                                                   7
Trabalhos Relacionados
●   eSearch
    –   Indexação baseado em palavras-chave
    –   Possui peer divididos por palavras-chave para
        armazenar o index
    –   Index local e global
    –   Local: documento X contêm os termos a, b
    –   Global: termos a está nos documentos X, Z




                                                   8
Proposta
●   Indexação
    – Extrair o conteúdo (Apache Tika)
    – Extrair metadados
    – Indexar (Lucene)
    – Local
    – SearchServer
●   Busca
    – Local
    – Global
    – Distribuída

                                         9
Análise Comparativa

Cenário 1
●

●
  Index local, global, distribuído




                                     10
Análise Comparativa

Cenário 1
●

●
  Index local, global, distribuído




                                     11
Análise Comparativa
●   Cenário 1
    –   Index local, global, distribuído
    –   Vantagens
        ● A busca sempre retornará resultados
        ● SearhServer ON => index completo


    –   Desvantagens
        ●   Dupla indexação
        ●   Maior quantidade de mensagens
        ●   Sobrecarga do SearchServer
        ●   Busca distribuída => Flood
                                                12
Análise Comparativa

Cenário 2
●

●
  Index global




                      13
Análise Comparativa
●   Cenário 2
    –   Index global
    –   Vantagens
        ●   Única indexação
        ●   Menor qnt. de mensagens
        ●   SearhServer ON => index completo
    –   Desvantagens
        ●   Sobrecarga do SearchServer
        ●   A busca pode NÃO retorna resultados
            (SearchServer => OFF)

                                                  14
Análise Comparativa

Cenário 3
●

●
  Index local / distribuído




                              15
Análise Comparativa
●   Cenário 3
    –   Index local / distribuído
    –   Vantagens
         ●   Única indexação
         ●   Menor qnt. de mensagens para indexar
    –   Desvantagens
         ●   A busca só retorna resultados do peers
             online
         ●   Não possui um index completo

                                                      16
Obrigado!


            17

Contenu connexe

Similaire à P2P metadata-based indexing and search proposal

Epidemic Marketplace DrupalCamp Porto 2012
Epidemic Marketplace DrupalCamp Porto 2012Epidemic Marketplace DrupalCamp Porto 2012
Epidemic Marketplace DrupalCamp Porto 2012paulo_graca
 
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...Celso Crivelaro
 
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...Celso Crivelaro
 
Sistemas de Recomendação com Neo4j + Surprise
Sistemas de Recomendação com Neo4j + SurpriseSistemas de Recomendação com Neo4j + Surprise
Sistemas de Recomendação com Neo4j + SurpriseMorvana Bonin
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebFernando Hideo Fukuda
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduceKarla Okada
 
[GTS-BA] Ruby on rails 5 - UNIFAC
[GTS-BA] Ruby on rails 5 - UNIFAC[GTS-BA] Ruby on rails 5 - UNIFAC
[GTS-BA] Ruby on rails 5 - UNIFACGTS Bahia
 
Introdução a JPA e Hibernate - TDC 2012
Introdução a JPA e Hibernate - TDC 2012Introdução a JPA e Hibernate - TDC 2012
Introdução a JPA e Hibernate - TDC 2012Frederico Maia Arantes
 
Campus Party - Sistemas de Recomendação
Campus Party - Sistemas de RecomendaçãoCampus Party - Sistemas de Recomendação
Campus Party - Sistemas de RecomendaçãoMarlesson Santana
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Orlando Junior
 
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...edigley
 
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...tdc-globalcode
 
Elasticsearch Aggregations
Elasticsearch AggregationsElasticsearch Aggregations
Elasticsearch AggregationsWaldemar Neto
 
Performance no MongoDB - TDC 2017 | Florianópolis
Performance no MongoDB - TDC 2017 | FlorianópolisPerformance no MongoDB - TDC 2017 | Florianópolis
Performance no MongoDB - TDC 2017 | FlorianópolisJefferson Martins de Andrade
 
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...iMasters
 
Pesquisa do Sapo
Pesquisa do SapoPesquisa do Sapo
Pesquisa do Sapocodebits
 
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Danusa Ribeiro
 

Similaire à P2P metadata-based indexing and search proposal (20)

Link Prediction with Neo4j
Link Prediction with Neo4jLink Prediction with Neo4j
Link Prediction with Neo4j
 
Epidemic Marketplace DrupalCamp Porto 2012
Epidemic Marketplace DrupalCamp Porto 2012Epidemic Marketplace DrupalCamp Porto 2012
Epidemic Marketplace DrupalCamp Porto 2012
 
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...
WTA2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recome...
 
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...
WTA 2012 - Proposta de Modelo Adaptativo para Geração de Contextos na Recom...
 
Sistemas de Recomendação com Neo4j + Surprise
Sistemas de Recomendação com Neo4j + SurpriseSistemas de Recomendação com Neo4j + Surprise
Sistemas de Recomendação com Neo4j + Surprise
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da Web
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
 
[GTS-BA] Ruby on rails 5 - UNIFAC
[GTS-BA] Ruby on rails 5 - UNIFAC[GTS-BA] Ruby on rails 5 - UNIFAC
[GTS-BA] Ruby on rails 5 - UNIFAC
 
Migracao colaborativa
Migracao colaborativaMigracao colaborativa
Migracao colaborativa
 
Introdução a JPA e Hibernate - TDC 2012
Introdução a JPA e Hibernate - TDC 2012Introdução a JPA e Hibernate - TDC 2012
Introdução a JPA e Hibernate - TDC 2012
 
Campus Party - Sistemas de Recomendação
Campus Party - Sistemas de RecomendaçãoCampus Party - Sistemas de Recomendação
Campus Party - Sistemas de Recomendação
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
 
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
Estimando o Valor de uma Grade P2P usando Provedores de IaaS como Parâmetro d...
 
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...
TDC2016POA | Trilha BigData - Respostas em tempo real para perguntas complexa...
 
Elasticsearch Aggregations
Elasticsearch AggregationsElasticsearch Aggregations
Elasticsearch Aggregations
 
Performance no MongoDB - TDC 2017 | Florianópolis
Performance no MongoDB - TDC 2017 | FlorianópolisPerformance no MongoDB - TDC 2017 | Florianópolis
Performance no MongoDB - TDC 2017 | Florianópolis
 
BANCO DE DADOS.pptx
BANCO DE DADOS.pptxBANCO DE DADOS.pptx
BANCO DE DADOS.pptx
 
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...
DevCommerce Conference 2016 - Workshop: Desenvolvimento Integrado, Desacoplad...
 
Pesquisa do Sapo
Pesquisa do SapoPesquisa do Sapo
Pesquisa do Sapo
 
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
Reescrita de Consultas em Federações de Dados Interligados usando uma Abordag...
 

Dernier

QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxIsabellaGomes58
 
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 anoAdelmaTorres2
 
Educação São Paulo centro de mídias da SP
Educação São Paulo centro de mídias da SPEducação São Paulo centro de mídias da SP
Educação São Paulo centro de mídias da SPanandatss1
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfAdrianaCunha84
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresLilianPiola
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfEditoraEnovus
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfAnaGonalves804156
 
Prática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISPrática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISVitor Vieira Vasconcelos
 
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024Sandra Pratas
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfaulasgege
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfHenrique Pontes
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirIedaGoethe
 
Aula 13 8º Ano Cap.04 Revolução Francesa.pptx
Aula 13 8º Ano Cap.04 Revolução Francesa.pptxAula 13 8º Ano Cap.04 Revolução Francesa.pptx
Aula 13 8º Ano Cap.04 Revolução Francesa.pptxBiancaNogueira42
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 anoandrealeitetorres
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 

Dernier (20)

Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
 
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
 
Educação São Paulo centro de mídias da SP
Educação São Paulo centro de mídias da SPEducação São Paulo centro de mídias da SP
Educação São Paulo centro de mídias da SP
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdf
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
 
Simulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdfSimulado 1 Etapa - 2024 Proximo Passo.pdf
Simulado 1 Etapa - 2024 Proximo Passo.pdf
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
 
Prática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISPrática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGIS
 
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
 
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
Orientação Técnico-Pedagógica EMBcae Nº 001, de 16 de abril de 2024
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdf
 
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdfBRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
BRASIL - DOMÍNIOS MORFOCLIMÁTICOS - Fund 2.pdf
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimir
 
Aula 13 8º Ano Cap.04 Revolução Francesa.pptx
Aula 13 8º Ano Cap.04 Revolução Francesa.pptxAula 13 8º Ano Cap.04 Revolução Francesa.pptx
Aula 13 8º Ano Cap.04 Revolução Francesa.pptx
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 ano
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 

P2P metadata-based indexing and search proposal

  • 1. Indexação e busca baseada em metadados em um sistema P2P Híbrido Centro de Informática Universidade Federal de Pernambuco Marco André Santos Machado masm@cin.ufpe.br
  • 2. Agenda ● Indexação e Buscas ● Metadados ● Trabalhos Relacionados ● Proposta ● Análise Comparativa 2
  • 4. Metadados ● ID ● Nome ● Tamanho (Kb) ● Path ● Datas de criação, indexação, modificação ● Interesses do usuário ● Categoria ● Conteúdo 4
  • 6. Trabalhos Relacionados ● Sixearch – Composto por muito componentes: – Crawler – Sistema para Indexação – Mecanismo de Recuperação – Sistema de aprendizado baseado em contexto ● Index local, aggregated, em clustering) 6
  • 7. Trabalhos Relacionados ● Minerva – Cada peer descobre e indexa seus arquivos – Envia um conjunto de metadados baseado em termos para um index global – Possui um index local e global (2-steps) 7
  • 8. Trabalhos Relacionados ● eSearch – Indexação baseado em palavras-chave – Possui peer divididos por palavras-chave para armazenar o index – Index local e global – Local: documento X contêm os termos a, b – Global: termos a está nos documentos X, Z 8
  • 9. Proposta ● Indexação – Extrair o conteúdo (Apache Tika) – Extrair metadados – Indexar (Lucene) – Local – SearchServer ● Busca – Local – Global – Distribuída 9
  • 10. Análise Comparativa Cenário 1 ● ● Index local, global, distribuído 10
  • 11. Análise Comparativa Cenário 1 ● ● Index local, global, distribuído 11
  • 12. Análise Comparativa ● Cenário 1 – Index local, global, distribuído – Vantagens ● A busca sempre retornará resultados ● SearhServer ON => index completo – Desvantagens ● Dupla indexação ● Maior quantidade de mensagens ● Sobrecarga do SearchServer ● Busca distribuída => Flood 12
  • 14. Análise Comparativa ● Cenário 2 – Index global – Vantagens ● Única indexação ● Menor qnt. de mensagens ● SearhServer ON => index completo – Desvantagens ● Sobrecarga do SearchServer ● A busca pode NÃO retorna resultados (SearchServer => OFF) 14
  • 15. Análise Comparativa Cenário 3 ● ● Index local / distribuído 15
  • 16. Análise Comparativa ● Cenário 3 – Index local / distribuído – Vantagens ● Única indexação ● Menor qnt. de mensagens para indexar – Desvantagens ● A busca só retorna resultados do peers online ● Não possui um index completo 16
  • 17. Obrigado! 17