top
Estudos da Tradução II B8
         
 

Entretanto, é válido citar que as técnicas quantitativas apresentadas não são tão simples e, tampouco, livres de problemas. Há certo número de problemas práticos que os analistas humanos devem levar em consideração. No caso da relação entre tipos/ocorrências, por exemplo, KENNY (2001) aponta que este tipo de relação é extremamente sensitivo para a extensão do texto, o mais provável é que palavras gramaticais irão estar naquele texto, resultando assim em uma relação baixa de tipos/ocorrências. E, a fim de superar esse problema, as relações entre tipos/ocorrências estão, normalmente, padronizadas para permitir comparações entre textos de diferentes extensões. Esta padronização é normalmente obtida pelo cálculo da relação entre partes do texto corrido (diz 1.000 ocorrências), e então feita uma média no final de tudo isso.
É importante citar que não é nossa intenção discutir os problemas relacionados para todas as técnicas utilizadas em listas de palavras , visto que já tenham sido feitas em outros estudos. O que parece importante enfatizar é que, para realizar essa contagem, o computador tem como base palavras ortográficas, e, portanto, não contam com a desambiguação semântica de palavras homográficas.