De acordo com KENNY (2001), um corpus per se tem pouca utilização prática se não houver técnicas para pesquisar, classificar e catalogar uma grande quantidade de dados que possam por ele ser fornecido. Nesta seção, centraremos nossa atenção em técnicas que podem ser utilizadas com textos em seus estados naturais (isto é, textos sem/ou com apenas marcação mínima) e em análises lexicais, mostrando como estas técnicas podem ser utilizadas para manipular dados em um corpus paralelo bilíngüe. As técnicas básicas adotadas no presente estudo são: listas de palavras e concordâncias , porém serão discutidas também questões relacionadas a palavras-chave.
- Corpus paralelo Corpora Paralelos – consistem de “textos originais da língua fonte A e suas versões traduzidas na língua B” (p. 230, nossa tradução);