top
Estudos da Tradução II B8
         
 
a) Listas de Palavras

Segundo KENNY (1998) a técnica mais básica para exibir informações sobre os elementos lingüísticos em um corpus é gerada por meio de listas de palavras . As listas de palavras permitem ao pesquisador obter informações estatísticas sobre o número de tipos (palavras diferentes) e ocorrências (número total de palavras) para textos individuais em um corpus, como também para um corpus por completo.
A relação entre os tipos de palavras para com as suas ocorrências no corpus, neste caso, exibe a amplitude e diversidade de vocabulário utilizada por um escritor ou um tradutor representado naquele corpus. Para BAKER (2000), uma relação alta de tipos/ocorrências pode significar que um escritor/tradutor utiliza um conjunto amplo de palavras, enquanto uma relação baixa de tipos/ocorrências pode significar que um escritor/tradutor utiliza um conjunto de palavras mais restrito.
Outras técnicas quantitativas fornecidas por meio de listas de palavras incluem calcular a média de palavras e a extensão de sentenças; número de parágrafos e suas respectivas extensões; e, também, a quantidade de espaço necessária para o armazenamento de um caractere utilizado pelo corpus, como um todo e, também, individualmente, cada um dos textos. A vantagem dessas técnicas é que elas permitem ao analista humano obter uma visão geral quantitativa da maneira que os textos em um dado corpus estão estruturados, em termos de informações estatísticas que tais técnicas proporcionam (isto é, número de tipos, ocorrências, parágrafos e etc.).