2. Indexação
principal objectivo da indexação é assegurar a recuperação
de qualquer documento ou informação no momento em que
o utilizador procura um assunto num catálogo bibliográfico.
A indexação de assuntos envolve duas etapas principais: a
análise do documento para definir que assuntos são
tratados e fazer a transposição desses assuntos para
conceitos e em seguida transformar estes conceitos em
linguagem documental de termos controlados.
5. Processo de Indexação
Fazer a abordagem do documento,
determinar o seu assunto principal,
reconhecer os elementos essenciais que
devem ser realçados e descritos, extrair os
conceitos, estabelecer a sua correspondência
em linguagem documental e verificar a
pertinência dessa representação, são as
etapas sucessivas para transmitir, de forma
inequívoca, o conteúdo do documento com o
objectivo final da difusão correcta da
informação.
6. Normalização
As normas em que nos apoiamos: NP 3715, de 1989, e a NP
4036, de 1992 são pouco claras.
Estas normas são mais um corpo metodológico de
acompanhamento no processo de indexação.
7. Tipos de Linguagens
Linguagem Categorial Linguagem Combinatória
1 - Utiliza notações 1 - Utiliza palavras
2 - As notações integram-se num 2 - Os termos podem não estar
plano pré-estabelecido (pré- dependentes de uma estrutura
coordenação) hierárquica previamente
estabelecida
3 - Ordenação sistemática
3 - Ordenação alfabética dos termos
4 - As notações estão localizadas
num ponto especifico do plano 4 - Os termos podem ser usados
(tabela) “soltos”, combinando-se
livremente entre si. (pós
coordenação)
8. Linguagem Categorial
A linguagem categorial estrutura-se no que vulgarmente se designa
por classificações.
As classificações não utilizam termos da linguagem natural, mas
um código (notação), que pode ser composto por algarismos,
letras e outros símbolos gramaticais.
Elaborada no início do século XX, a CDU apresenta-se como um
plano destinado à classificação do conjunto do conhecimento
humano.
Permite reagrupar todas as referências relativas a um determinado
assunto e, posteriormente, localizar rapidamente essa
documentação.
Graças à sua notação normalizada facilmente utilizável é aplicada
universalmente, embora com maior relevância na Europa.
9. Classificação Decimal Universal
Partindo do conceito considerado o mais geral, considera que lhe
estão subordinados outros conceitos mais restritivos e
específicos. O conceito mais geral determina a classe principal
à qual pertence o documento, podendo-se acrescentar tantas
subclasses quantas o documento assim o permitir e o perfil do
utilizador assim o determinar.
10. Linguagem Combinatória
É uma linguagem pós-coordenada, expressa em thesaurus
ou listas estruturadas de termos, cujo princípio repousa na
combinação entre os termos.
As palavras (conceitos) não estão dependentes de uma
estrutura hierárquica previamente estabelecida, podendo ser
combinados livremente entre si (pós coordenação).
Dentro deste grupo de linguagens documentais encontram-se:
· Listas de encabeçamentos de assuntos;
· Thesaurus (no plural Thesauri)
11. Thesaurus
Numa definição sucinta, poder-se-ia dizer que o thesaurus é composto por
uma lista alfabética de descritores que evidenciam as diferentes
relações existentes entre si.
Para além dos descritores o thesaurus contém também identificadores,
na sua maior parte constituídos por nomes próprios, nomes de lugares
e instituições.
12. Listas de termos
A lista de termos controlados constrói-se à medida que os
conceitos vão sendo transformados em pontos de acesso para
a recuperação da informação.
13. Vocabulário controlado
o vocabulário controlado estabelece a forma de representar os assuntos
que compõem uma área limitada do conhecimento, tornando possível
maior coerência entre os termos indexados.
A partir do conteúdo real do documento o indexador deverá decidir:
– a parte desse conteúdo que será susceptível de responder realmente
às necessidades dos utilizadores;
– os conceitos importantes que devem ser conservados para
representar este conteúdo;
– os descritores definidos para representar esses conceitos
14. Regras de Indexação
a) Número de palavras por descritor
Os descritores podem ser formados por uma ou mais palavras,
sendo importante que expressem adequadamente o conceito.
Entretanto, recomenda-se que esse número de palavras seja o
menor possível.
15. Regras de Indexação
b) Uso de singular e do plural
Os termos do vocabulário controlado devem ser usados no
singular, mas o plural é admitido em determinadas
circunstâncias.
A norma NP 4036 determina:
Quando os termos são enumeráveis (quantos) aplica-se o
plural.
Quando os termos não são enumeráveis (quanto) aplica-se o
singular
16. Regras de Indexação
c) Sinónimos
Quando um conceito pode ser expresso por dois ou
mais termos diferentes, escolhe-se um deles como
descritor, fazendo-se remissiva dos demais. O
descritor mais conhecido pelo utilizador deve ser
escolhido como termo indexador.
Ex.: arte sacra
e não
arte religiosa
17. Regras de Indexação
d) Descritores compostos
Nos descritores compostos as palavras são apresentadas na
sua ordem natural.
Ex.: ensino em grupo
e não
grupo, ensino em
18. Regras de Indexação
e) Termos homógrafos ou inconsistentes
Os termos homógrafos ou inconsistentes podem ser definidos
pelo acréscimo de palavras elucidativas. Esse acréscimo pode
ser feito colocando-se palavras elucidativas após o termo
principal, que identifica o assunto de um documento separando
os descritores por dois pontos ( : )
Ex.: surrealismo : arte
surrealismo : literatura
19. Regras de Indexação
f) Identificadores geográficos
Os descritores geográficos associados a um outro assunto
devem ser representados em ordem indirecta, excepto no caso
de estarem relacionados com a literatura.
Ex.: filosofia : ocidente
pintura renascentista : Itália
mas
literatura alemã