Recentemente, pesquisadores do mundo todo estão fazendo uso de corpora computadorizados. Inicialmente, alguns pesquisadores mantêm uma falsa idéia de que tudo o que precisam para fazer um trabalho baseado em corpus é um computador pessoal, um escaner de mesa com tecnologia de reconhecimento óptico de caracteres (OCR) , um programa padrão de processamento de corpus, e um grande número de livros. No entanto, mais tarde, eles descobrem que as coisas não são tão simples quanto, inicialmente, haviam imaginado. Um trabalho baseado em corpus envolve muito planejamento, o estabelecimento de critérios explícitos e rigorosos na seleção de equipamentos, programas e textos. É esse planejamento cuidadoso que possibilita um corpus fornecer descrições precisas e confiáveis, garantindo que ele possa ser utilizado ou referenciado por outros pesquisadores (KENNEDY, 1998). Além disso, o desenho ideal de um corpus depende muito do objetivo para qual se pretende utilizá-lo e, também, com as questões associadas ao tipo de corpus, a representatividade, os direitos autorais e a seleção dos textos.