SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
Recuperação da Informação


      Renato Fernandes Corrêa
          Recuperação da Informação -
                  Introdução
                       2010.2


                DCI-UFPE                1
2


              Roteiro
Motivação/Introdução
Definição
Sistema de Recuperação de Informação
Exemplos de SRI
3



       Motivação/Introdução
O problema: "a tarefa massiva de tornar mais
acessível, um acervo crescente de conhecimento“.
VANNEVAR BUSH (1945)
   Explosão informacional
   Importância estratégica da informação
4



         Motivação/Introdução
A solução: Calvin MOOERS (1951) cunhou o termo
recuperação de informação, destacando que ele "engloba os
aspectos intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer sistemas,
técnicas ou máquinas empregados para o desempenho da
operação.“
“Certamente, a recuperação da informação não foi a única
responsável pelo desenvolvimento da CI [Ciência da
Informação], mas pode ser considerada como principal; ao
longo do tempo, a CI ultrapassou a recuperação da informação,
mas os problemas principais tiveram sua origem aí e ainda
constituem seu núcleo.” SARACEVIC (1991)
5
    Recuperação de Informação
            Definição
Área de pesquisa e desenvolvimento que
  investiga métodos e técnicas
  para a representação, a organização, o
  armazenamento, a busca e a recuperação de itens
  de informação

Objetivo principal
  facilitar o acesso a documentos (itens de informação)
  relevantes à necessidade de informação do usuário
     Geralmente representada através de consultas
     baseadas em palavras-chaves
6
Tarefa típica de Recuperação de
        Informação (RI)
Dados
  Um corpus de documentos e
  Uma consulta do usuário
Encontrar
  Um conjunto (ordenados) de documentos que
  são relevantes para a consulta
7


   Elementos de um Sistemas de RI

                Corpus de
                documentos



 Consulta       Sistema de RI


                                1. Doc1
                                2. Doc2
Usuário         Documentos      3. Doc3
                 ordenados         .
                                   .
8
             Recuperação de Informação

         Como funciona?




                                                                      Necessidade de
                                                                       Informação
                           Armazenamento

               Indexação                      Indexação    Consulta
Documentos   Representação                   Representação


        Sistema de                                        Resultado   Usuário
 Recuperação da Informação
                                  Recuperação
                                  Casamento, Ordenação
Modelos de Recuperação de Informação

 Existe uma distinção entre:
   A tarefa do usuário
      Recuperação ou Navegação
   A visão lógica dos documentos
      sua representação no sistema
   O modelo de recuperação de informação
      Clássico ou estruturado ou navegação
Navegação



Embrapa - Infoteca
Recuperação
12


             Sistemas de RI
Um sistema automático para RI pode ser visto como
  a parte do sistema de informação responsável pelo
  armazenamento ordenado dos documentos em um
  banco de dados,
  e sua posterior recuperação
  para responder a consulta do usuário.
Etapas principais na construção:
  Aquisição (seleção) dos documentos
  Preparação dos documentos
  Indexação dos documentos
  Armazenamento
  Recuperação
     Busca (casamento com a consulta do usuário)
     Ordenação dos documentos recuperados
Exemplos de sistemas de                13


  recuperação de informação
Sistemas de RI em DVD e Cederrom
Catálogo em linha de acesso público
Engenhos de busca
Serviços de busca em linha
Sistemas de gerenciamento de documentos
Sistemas de Filtragem de Informação
Sistemas de Extração de Informação
Catálogo em linha de acesso público
              (OPAC)
 Sistemas que recuperam informação em
 bases de dados catalográficos de bibliotecas.
 Exemplo:
15

               Engenhos de Busca

                                                        Engenho de Busca

 Usuário               Servidor de Consultas

                                                                2
            Consulta        1       Recuperador


 Browser    Resposta    4                          3
                                Ordenador
                                                          Base de
                                                          Índices
                       Motor de
                       Indexação       Indexador

                                               Representação dos Docs
            Spider
                        Docs          Pré-Processador
           Aquisição
Web
Serviços de busca em linha
Sistemas que recuperam informação em
bases de dados bibliográficos.
Exemplos:
Sistemas de gerenciamento de
          documentos
Sistemas que gerenciam versões e recuperam
informação em um corpus de documentos digitais.
Exemplos:
  Softwares Proprietários da IBM, Xerox, Oracle e
  Microsoft
  Softwares Livres
     Alfresco
     KnowledgeTree
     Main//Pyrus DMS
     Nuxeo
     OpenKM
     Archivista
Sistemas de Filtragem de Informação
  Sistemas que filtram a informação recuperada
  de acordo com o interesse do usuário

 Usuário       Servidor News



             Artigos       Perfil do
             Indexados     usuário

              Engenho de
                Busca                  Internet
19


Sistemas de Extração de Informação

  Sistemas capazes de extrair de documentos
  relevantes apenas a informação requerida
  A informação extraída pode ser apresentada
  ao usuário e/ou armazenada em BDs.
Página de Hotel
                                  Template
                                   Nome:
                  Sistema de EI    End.:
                                   Fone:
                                   Fax:
                                   Preços:
                                             BD
20


             Referências
BAYEZA-YATES, RIBEIRO-NETO. Modern
Information Retrieval. Addison Wesley:
1999.
ROWLEY, J. A Biblioteca Eletrônica. 2 ed.
Brasília: Brinquet Lemos Livros, 2002.
SARACEVIC, T. Ciência da informação:
origem, evolução e relações. Perspec. Ci.
Inf., Belo Horizonte, v. 1, n. 1, p. 41-62,
jan./jun. 1996

Contenu connexe

Tendances

Base de dados em Pesquisa
Base de dados em PesquisaBase de dados em Pesquisa
Base de dados em Pesquisa
profcelsoklein
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma biblioteca
David Canjamba 2D
 
1º trabalho base dados
1º trabalho base dados1º trabalho base dados
1º trabalho base dados
essa
 
MARC 21
MARC 21MARC 21
MARC 21
UNESP
 
7 Desenvolvimento de coleções: avaliação
7 Desenvolvimento de coleções: avaliação7 Desenvolvimento de coleções: avaliação
7 Desenvolvimento de coleções: avaliação
Leticia Strehl
 
2 Desenvolvimento de coleções: política
2 Desenvolvimento de coleções: política2 Desenvolvimento de coleções: política
2 Desenvolvimento de coleções: política
Leticia Strehl
 
Tecnologia da informação infraestrutura de ti
Tecnologia da informação   infraestrutura de tiTecnologia da informação   infraestrutura de ti
Tecnologia da informação infraestrutura de ti
Vicente Willians Nunes
 
Fontes de Informação On-line
Fontes de Informação On-lineFontes de Informação On-line
Fontes de Informação On-line
BibliotecaUfes
 

Tendances (20)

Banco de Dados - Sistemas de Gerenciamento de Banco de Dados
Banco de Dados - Sistemas de Gerenciamento de Banco de DadosBanco de Dados - Sistemas de Gerenciamento de Banco de Dados
Banco de Dados - Sistemas de Gerenciamento de Banco de Dados
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Base de dados em Pesquisa
Base de dados em PesquisaBase de dados em Pesquisa
Base de dados em Pesquisa
 
Mer - Modelo Entidade Relacionamento
Mer - Modelo Entidade RelacionamentoMer - Modelo Entidade Relacionamento
Mer - Modelo Entidade Relacionamento
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma biblioteca
 
1º trabalho base dados
1º trabalho base dados1º trabalho base dados
1º trabalho base dados
 
Sistemas de Informação
Sistemas de InformaçãoSistemas de Informação
Sistemas de Informação
 
Os Rumos da Catalogação Contemporâneas: RDA: Resource Description Access
Os Rumos da Catalogação Contemporâneas: RDA: Resource Description AccessOs Rumos da Catalogação Contemporâneas: RDA: Resource Description Access
Os Rumos da Catalogação Contemporâneas: RDA: Resource Description Access
 
Sistemas de Arquivos do Windows
Sistemas de Arquivos do WindowsSistemas de Arquivos do Windows
Sistemas de Arquivos do Windows
 
Banco de dados exercícios resolvidos
Banco de dados exercícios resolvidosBanco de dados exercícios resolvidos
Banco de dados exercícios resolvidos
 
MARC 21
MARC 21MARC 21
MARC 21
 
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane FidelixFundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
 
Manual de protocolo e expedição de documentos
Manual de protocolo e expedição de documentosManual de protocolo e expedição de documentos
Manual de protocolo e expedição de documentos
 
7 Desenvolvimento de coleções: avaliação
7 Desenvolvimento de coleções: avaliação7 Desenvolvimento de coleções: avaliação
7 Desenvolvimento de coleções: avaliação
 
2 Desenvolvimento de coleções: política
2 Desenvolvimento de coleções: política2 Desenvolvimento de coleções: política
2 Desenvolvimento de coleções: política
 
Tecnologia da informação infraestrutura de ti
Tecnologia da informação   infraestrutura de tiTecnologia da informação   infraestrutura de ti
Tecnologia da informação infraestrutura de ti
 
Minicurso - Catalogação em RDA
Minicurso - Catalogação em RDAMinicurso - Catalogação em RDA
Minicurso - Catalogação em RDA
 
Classificação Decimal Universal (aula completa)
Classificação Decimal Universal (aula completa)Classificação Decimal Universal (aula completa)
Classificação Decimal Universal (aula completa)
 
Estudo de Usuários - Conceitos e Aplicações
Estudo de Usuários - Conceitos e AplicaçõesEstudo de Usuários - Conceitos e Aplicações
Estudo de Usuários - Conceitos e Aplicações
 
Fontes de Informação On-line
Fontes de Informação On-lineFontes de Informação On-line
Fontes de Informação On-line
 

Similaire à Aula 01 - Recuperação da Informação

Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informação
Fábio Andrade
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
csmp
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
WANDERSON JONER
 

Similaire à Aula 01 - Recuperação da Informação (20)

7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Base de Dados
Base de Dados Base de Dados
Base de Dados
 
MARKETING2
MARKETING2MARKETING2
MARKETING2
 
Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]Principios tecnicas de_indexacao[1]
Principios tecnicas de_indexacao[1]
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informação
 
Ppt curso access 2010
Ppt curso access 2010Ppt curso access 2010
Ppt curso access 2010
 
Data mining
Data miningData mining
Data mining
 
Sistemas e redes de informação
Sistemas e redes de informaçãoSistemas e redes de informação
Sistemas e redes de informação
 
Representação da Informação
Representação da InformaçãoRepresentação da Informação
Representação da Informação
 
Bases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dadosBases de Dados, Metadados e Formatos de intercâmbio de dados
Bases de Dados, Metadados e Formatos de intercâmbio de dados
 
Módulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpaceMódulo 06 Introdução a metadados no DSpace
Módulo 06 Introdução a metadados no DSpace
 
Introdução a Bancos de Dados
Introdução a Bancos de DadosIntrodução a Bancos de Dados
Introdução a Bancos de Dados
 
Introdução ao banco de dados
Introdução ao banco de dadosIntrodução ao banco de dados
Introdução ao banco de dados
 
Artigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informaçãoArtigo sistema automático de disseminação seletiva de informação
Artigo sistema automático de disseminação seletiva de informação
 
Aula 1
Aula 1Aula 1
Aula 1
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
 
Ver
VerVer
Ver
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
 
Dataverse cariniana 2017
Dataverse cariniana 2017Dataverse cariniana 2017
Dataverse cariniana 2017
 

Dernier

Dernier (8)

ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
Luís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdf
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 
Programação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfProgramação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdf
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 

Aula 01 - Recuperação da Informação

  • 1. Recuperação da Informação Renato Fernandes Corrêa Recuperação da Informação - Introdução 2010.2 DCI-UFPE 1
  • 2. 2 Roteiro Motivação/Introdução Definição Sistema de Recuperação de Informação Exemplos de SRI
  • 3. 3 Motivação/Introdução O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945) Explosão informacional Importância estratégica da informação
  • 4. 4 Motivação/Introdução A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“ “Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência da Informação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)
  • 5. 5 Recuperação de Informação Definição Área de pesquisa e desenvolvimento que investiga métodos e técnicas para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação Objetivo principal facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário Geralmente representada através de consultas baseadas em palavras-chaves
  • 6. 6 Tarefa típica de Recuperação de Informação (RI) Dados Um corpus de documentos e Uma consulta do usuário Encontrar Um conjunto (ordenados) de documentos que são relevantes para a consulta
  • 7. 7 Elementos de um Sistemas de RI Corpus de documentos Consulta Sistema de RI 1. Doc1 2. Doc2 Usuário Documentos 3. Doc3 ordenados . .
  • 8. 8 Recuperação de Informação Como funciona? Necessidade de Informação Armazenamento Indexação Indexação Consulta Documentos Representação Representação Sistema de Resultado Usuário Recuperação da Informação Recuperação Casamento, Ordenação
  • 9. Modelos de Recuperação de Informação Existe uma distinção entre: A tarefa do usuário Recuperação ou Navegação A visão lógica dos documentos sua representação no sistema O modelo de recuperação de informação Clássico ou estruturado ou navegação
  • 12. 12 Sistemas de RI Um sistema automático para RI pode ser visto como a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados, e sua posterior recuperação para responder a consulta do usuário. Etapas principais na construção: Aquisição (seleção) dos documentos Preparação dos documentos Indexação dos documentos Armazenamento Recuperação Busca (casamento com a consulta do usuário) Ordenação dos documentos recuperados
  • 13. Exemplos de sistemas de 13 recuperação de informação Sistemas de RI em DVD e Cederrom Catálogo em linha de acesso público Engenhos de busca Serviços de busca em linha Sistemas de gerenciamento de documentos Sistemas de Filtragem de Informação Sistemas de Extração de Informação
  • 14. Catálogo em linha de acesso público (OPAC) Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas. Exemplo:
  • 15. 15 Engenhos de Busca Engenho de Busca Usuário Servidor de Consultas 2 Consulta 1 Recuperador Browser Resposta 4 3 Ordenador Base de Índices Motor de Indexação Indexador Representação dos Docs Spider Docs Pré-Processador Aquisição Web
  • 16. Serviços de busca em linha Sistemas que recuperam informação em bases de dados bibliográficos. Exemplos:
  • 17. Sistemas de gerenciamento de documentos Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais. Exemplos: Softwares Proprietários da IBM, Xerox, Oracle e Microsoft Softwares Livres Alfresco KnowledgeTree Main//Pyrus DMS Nuxeo OpenKM Archivista
  • 18. Sistemas de Filtragem de Informação Sistemas que filtram a informação recuperada de acordo com o interesse do usuário Usuário Servidor News Artigos Perfil do Indexados usuário Engenho de Busca Internet
  • 19. 19 Sistemas de Extração de Informação Sistemas capazes de extrair de documentos relevantes apenas a informação requerida A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs. Página de Hotel Template Nome: Sistema de EI End.: Fone: Fax: Preços: BD
  • 20. 20 Referências BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999. ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002. SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996