2 Gestão em unidades de informação: planejamento. 1
Funções e disfunções das bases de dados em levantamentos bibliométricos
1. Funções e disfunções das bases de
dados em levantamentos
bibliométricos
Letícia Strehl
Biblioteca Central
Universidade Federal do Rio Grande do Sul
Seminário “Citações: usos e limitações”, Rio de Janeiro, 23 de agosto de 2012.
2. Sumário
• Bases de dados e levantamentos bibliométricos
– Componentes das bases de dados:
• cobertura
• indexação
• busca
• resultado
– A produção e o impacto como dado:
• autores
• instituições
• referências
3. Componentes das bases de dados
1. Cobertura: o conjunto de registros ou
documentos (conjunto de documentos)
2. Indexação: o método de indexação ou acesso ao
conjunto de documentos (método de acesso)
3. Busca: a verbalização desta necessidade em uma
seqüência de expressões de busca (estratégia de
busca)
4. Resultado: a seqüência dos itens apresentados
como um resultado da estratégia de busca
(conjunto de itens recuperados ou seqüência)
Quatro do 6 componentes enumerados por: TAGUE-SUTCLIFFE, J. M. Em: Some perspectives on the evaluation of
information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.
4. Requisitos das bases de dados para estudos
de produção e impacto
• Indexação de:
– uma quantidade representativa de documentos
(cobertura);
– identificação consiste de autores, instituições e as
referências citadas nas publicações.
Atualmente, as principais bases de dados para o
cumprimento desta finalidade são a Web of Science
(WoS), a Scopus e o Google Acadêmico (GA)
7. Cobertura:
O conjunto de registros ou documentos
– Número de registros:
• Total
• Por tipo de documento (artigos de revistas, trabalhos
em eventos, teses, livros, etc.)
• Por tipo de fonte (instituições públicas e privadas,
associações nacionais e estrangeiras, etc.)
• Por idioma
• Por país responsável pela publicação das fontes
– Período de cobertura das fontes
– Periodicidade de atualização
JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p.
231-267, 1997.
8. Análise quantitativa da composição de
bases de dados: um exemplo
Periódicos arbitrados
≈30 mil
Scopus
≈18 mil
Web os Science
≈10 mil
Bustos-González, Atilio. Edición de revistas científicas con visibilidad ficas internacional: criterios para ser incluidos en bases de datos comprensivas.
Apresentação realizada no "Seminário de Comunicação Científica, São Paulo, 13 de junho de 2008".
ELSEVIER. About Scopus. 2011.
THOMSON REUTERS. Web of Science. 2011.
9. A importância da cobertura
retrospectiva
WoS:
1945-,
1956- e
1975-
--
Scopus:
1996
--
GA
?????
LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007.
Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.
10. A cobertura:
seletiva versus exaustiva
bom e ruim em ambas
O seletivo bom e o seletivo ruim
Produção em Destes,
periódicos que apenas os que
adotam tratam de
criteriosa interesse
avaliação por internacional
pares
11. Todavia, a busca
retrospectiva
continua um
problema.
A competição instaurada em 2005 entre WoS e
Scopus alterou o quadro em 2009.
12. A cobertura:
seletiva versus exaustiva
bom e ruim em ambas
O exaustivo bom e o exaustivo ruim
Produção em Produção em
periódicos que periódicos que
adotam
adotam
criteriosa duvidosa
avaliação por avaliação por
pares ?
pares
da produção ONDE
do impacto DO que NO que
14. Indexação
• A forma de representação que dá acesso ao
conjunto de dados
• Recursos cada vez mais sofisticados
• Todavia, em regra, os dados tem a qualidade
limitada à própria informação dada pelos autores
15. A qualidade dos dados e a precisão das
informações dos próprios autores
Autor Instituição
Referência
16. A precisa identificação dos autores e instituições:
recursos atenuantes (1)
Researcher ID:
o pesquisador reune consistentemente a
informação sobre sua produção com dados da WoS
18. A precisa identificação dos autores e
instituições: recursos atenuantes (3)
O usuário informa à base que os
diferentes registros identificam
um único autor ou instituição
19. A precisa identificação das referências:
situações agravantes
Disponibilidade dos artigos nos sites publishers antes da publicação
A identificação do DOI
nas referências é um
atenuante.
Disponibilidade dos manuscritos nos repositórios sem identificação dos dados de publicação
24. A precisa identificação da produção:
recursos atenuantes
Perfil do pesquisador no GA:
o pesquisador reune as diferentes
versões que correspondem a uma
única produção
25. Algumas ressalvas para o uso do
Google Acadêmico
• Nem todos os periódicos importantes indexados
pelas bases de dados tradicionais estão
indexados pelo GA;
• as citação a documentos recentes são mais
comuns no GA uma vez que documentos mais
antigos estão disponíveis em menor quantidade
na Web;
• algumas áreas estão melhor representadas por
contarem tradicionalmente com repositórios
mais antigos e exaustivos, um exemplo é a física
como a pioneira base de pré-prints arXiv.org.
26. TODAS AS BASES POSSUEM
INCONSISTÊNCIAS!
TODO O LEVANTAMENTO
BILIOMÉTRICO EXIGE LIMPEZA DE
DADOS!
27. Todavia, para PeterJácso as inconsistências do
GA são tantas que inviabilizam por completo o
uso dos dados para cálculo de índices
bibliométricos
Mas, para a recuperação, o GA é uma excelente
ferramenta
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
29. A busca
• Limitação do universo de documentos a ser
estudado por sua representação em
expressões de busca
• As inconsistências na indexação requerem a
realização de uma série buscas intermediárias
para contemplar todas as diferentes formas de
representação do objeto de estudo
30. Recursos das bases de dados para a
reunião de registros dispersos pelas
inconsistências
31. Depois de identificar “todas” as formas
possíveis de representação:
use e abuse dos operadores booleanos, de proximidade e truncagem:
o “help” das bases de dados será o seu único amigo
32. Um exemplo de expressão de busca
para recuperar a produção da UFRGS
OG=(Univ Fed Rio Grande Sul OR UFRGS OR Federal
University Rio Grande do Sul OR Fed Univ Rio Grande do
Sul OR Fed Univ Rio Grande Sul OR Rio Grande do Sul Fed
Univ OR Rio Grande Sul Fed Univ OR Agron Univ Fed Rio
Grande do Sul OR Fed Univ RS OR Univ Fed Rio Grande do
Sul OR Fdn Univ Fed Rio Grande Sul OR URFGS OR UFGRS
OR Univ Fed Rio Do Sul OR Fed Univ Rio Grande Sul
UFRGS OR Fdn Univ Fed Rio Grande Sul OR Fed Univ Hosp
Rio Grande Sul OR Fed Univ Rio Grande Sul State OR Fed
Univ Fed Rio Grande Sul OR IF UFRGS)