elaboração de linguagens documentárias, e é denominado “garantia do uso comum,
endosso do usuário ou consenso”. E, ainda, que “um termo se justifica apenas se ocorre
dentro da literatura recente de um determinado assunto, e com algum grau de
freqüência”.
Com a experiência das revisões anteriores e a respeito da literatura citada por
Lancaster, observou-se que muitas variáveis estão presentes no momento da escolha da
literatura que atuará como a fonte de informação e validação dos termos de um
vocabulário. Não ter critérios para controlar tais variáveis passa a ser um problema no
fechamento do processo metodológico, pois além de dificultar a escolha propriamente dita
diante de muitas opções de literatura, ainda pode encaminhar tal escolha em função de
critérios subjetivos, não formalizados, portanto, tendenciosos. Nesse cenário a fonte de
informação seria selecionada já antevendo os resultados pretendidos, não sendo fonte de
validação íntegra e imparcial.
Nesse raciocínio a Linguística de Corpus foi consultada e introduzida ao contexto
da Ciência da Informação, da revisão terminológica para vocabulários controlados, com o
objetivo de orientar na seleção da literatura ou fonte de informação. Nesse estudo tratou-
se a literatura como um corpus a ser ‘construído’ para a etapa de consulta dos termos,
embora na prática tenha sido uma seleção e não construção.
A Linguística de Corpus ocupa-se da coleta e da exploração de conjunto de dados
linguísticos textuais como fonte para pesquisa de uma língua ou variedade linguística,
explica Sardinha (2004). O corpus é, assim, esse conjunto de dados linguísticos. É uma
coleção de partes de textos, num determinado idioma, armazenada de forma eletrônica,
selecionada de acordo com critérios externos para representar, na medida do possível,
uma língua ou variedade de língua, como fonte de dados para a pesquisa linguística
(SINCLAIR, 2004). Observando que a pesquisa pode ser um estudo de uso de formas
lingüísticas.
Os critérios adotados pela Linguística de Corpus e utilizados na seleção da
literatura foram representatividade dos textos, tempo, tamanho ou extensão, equilíbrio e