Indexação de documentos
Introdução
Em geral
De acordo com a norma ISO 5963 (1985), indexação é o processo de descrever ou representar o conteúdo temático de um recurso de informação.
Esse processo resulta em um índice de termos de indexação que será utilizado como ferramenta de busca e acesso ao conteúdo de recursos em sistemas de recuperação de informação.
Estágios
A indexação é uma atividade técnico-intelectual composta por procedimentos que visam decompor, decifrar, analisar e resumir o conteúdo dos documentos, tudo com o objetivo de possibilitar o armazenamento, recuperação, acesso e divulgação da informação, facilitando a sua recuperação, seja diretamente pelos usuários ou através de índices, catálogos, bases de dados, etc., e é realizada de forma controlada e padronizada através de um processo composto por quatro etapas:
Tipos de indexação
Esta concepção de indexação, cujos elementos centrais são a determinação humana do tema e a atribuição de termos a partir de um vocabulário controlado, distingue-a da indexação automática e da indexação livre.
Indexação automática é indexação pull.
Palavras-chave são extraídas do título, resumo ou texto completo de um recurso e utilizadas para representar seu conteúdo, sem serem submetidas a qualquer tipo de controle terminológico.
Os artigos "Artigo (gramática)"), conjunções "Conjunção (gramática)"), pronomes, preposições, interjeições, numerais "Número (linguística)") e alguns verbos e advérbios são palavras irrelevantes. Substantivos, adjetivos e alguns verbos e advérbios são palavras não vazias.
Indexação livre é aquela que não utiliza, na representação de tópicos, termos de um vocabulário controlado, mas sim termos extraídos do próprio recurso ou da mente do indexador.
Políticas de indexação
Por política de indexação entendemos tanto a forma de indexar uma determinada instituição quanto o esforço para especificar, sistematizar e capturar em guias ou manuais os processos seguidos na indexação.