1. Recuperação da Informação
Renato Fernandes Corrêa
Recuperação da Informação -
Introdução
2010.2
DCI-UFPE 1
2. 2
Roteiro
Motivação/Introdução
Definição
Sistema de Recuperação de Informação
Exemplos de SRI
3. 3
Motivação/Introdução
O problema: "a tarefa massiva de tornar mais
acessível, um acervo crescente de conhecimento“.
VANNEVAR BUSH (1945)
Explosão informacional
Importância estratégica da informação
4. 4
Motivação/Introdução
A solução: Calvin MOOERS (1951) cunhou o termo
recuperação de informação, destacando que ele "engloba os
aspectos intelectuais da descrição de informações e suas
especificidades para a busca, além de quaisquer sistemas,
técnicas ou máquinas empregados para o desempenho da
operação.“
“Certamente, a recuperação da informação não foi a única
responsável pelo desenvolvimento da CI [Ciência da
Informação], mas pode ser considerada como principal; ao
longo do tempo, a CI ultrapassou a recuperação da informação,
mas os problemas principais tiveram sua origem aí e ainda
constituem seu núcleo.” SARACEVIC (1991)
5. 5
Recuperação de Informação
Definição
Área de pesquisa e desenvolvimento que
investiga métodos e técnicas
para a representação, a organização, o
armazenamento, a busca e a recuperação de itens
de informação
Objetivo principal
facilitar o acesso a documentos (itens de informação)
relevantes à necessidade de informação do usuário
Geralmente representada através de consultas
baseadas em palavras-chaves
6. 6
Tarefa típica de Recuperação de
Informação (RI)
Dados
Um corpus de documentos e
Uma consulta do usuário
Encontrar
Um conjunto (ordenados) de documentos que
são relevantes para a consulta
7. 7
Elementos de um Sistemas de RI
Corpus de
documentos
Consulta Sistema de RI
1. Doc1
2. Doc2
Usuário Documentos 3. Doc3
ordenados .
.
8. 8
Recuperação de Informação
Como funciona?
Necessidade de
Informação
Armazenamento
Indexação Indexação Consulta
Documentos Representação Representação
Sistema de Resultado Usuário
Recuperação da Informação
Recuperação
Casamento, Ordenação
9. Modelos de Recuperação de Informação
Existe uma distinção entre:
A tarefa do usuário
Recuperação ou Navegação
A visão lógica dos documentos
sua representação no sistema
O modelo de recuperação de informação
Clássico ou estruturado ou navegação
12. 12
Sistemas de RI
Um sistema automático para RI pode ser visto como
a parte do sistema de informação responsável pelo
armazenamento ordenado dos documentos em um
banco de dados,
e sua posterior recuperação
para responder a consulta do usuário.
Etapas principais na construção:
Aquisição (seleção) dos documentos
Preparação dos documentos
Indexação dos documentos
Armazenamento
Recuperação
Busca (casamento com a consulta do usuário)
Ordenação dos documentos recuperados
13. Exemplos de sistemas de 13
recuperação de informação
Sistemas de RI em DVD e Cederrom
Catálogo em linha de acesso público
Engenhos de busca
Serviços de busca em linha
Sistemas de gerenciamento de documentos
Sistemas de Filtragem de Informação
Sistemas de Extração de Informação
14. Catálogo em linha de acesso público
(OPAC)
Sistemas que recuperam informação em
bases de dados catalográficos de bibliotecas.
Exemplo:
15. 15
Engenhos de Busca
Engenho de Busca
Usuário Servidor de Consultas
2
Consulta 1 Recuperador
Browser Resposta 4 3
Ordenador
Base de
Índices
Motor de
Indexação Indexador
Representação dos Docs
Spider
Docs Pré-Processador
Aquisição
Web
16. Serviços de busca em linha
Sistemas que recuperam informação em
bases de dados bibliográficos.
Exemplos:
17. Sistemas de gerenciamento de
documentos
Sistemas que gerenciam versões e recuperam
informação em um corpus de documentos digitais.
Exemplos:
Softwares Proprietários da IBM, Xerox, Oracle e
Microsoft
Softwares Livres
Alfresco
KnowledgeTree
Main//Pyrus DMS
Nuxeo
OpenKM
Archivista
18. Sistemas de Filtragem de Informação
Sistemas que filtram a informação recuperada
de acordo com o interesse do usuário
Usuário Servidor News
Artigos Perfil do
Indexados usuário
Engenho de
Busca Internet
19. 19
Sistemas de Extração de Informação
Sistemas capazes de extrair de documentos
relevantes apenas a informação requerida
A informação extraída pode ser apresentada
ao usuário e/ou armazenada em BDs.
Página de Hotel
Template
Nome:
Sistema de EI End.:
Fone:
Fax:
Preços:
BD
20. 20
Referências
BAYEZA-YATES, RIBEIRO-NETO. Modern
Information Retrieval. Addison Wesley:
1999.
ROWLEY, J. A Biblioteca Eletrônica. 2 ed.
Brasília: Brinquet Lemos Livros, 2002.
SARACEVIC, T. Ciência da informação:
origem, evolução e relações. Perspec. Ci.
Inf., Belo Horizonte, v. 1, n. 1, p. 41-62,
jan./jun. 1996