Dificuldades relacionadas à língua e conjunto de caracteres: Algumas línguas são mais fáceis de serem processadas do que outras, por isso, é importante certificar-se que o sistema de memória de tradução selecionado será capaz de processar o par lingüístico sendo utilizado. No caso da língua de sinais, como língua espaço-visual, necessita de dois bytes para armazenar cada caractere (assim como o japonês, chinês e coreano) ao passo que na maioria das línguas um caractere pode ser armazenado utilizando um byte (i.e. uma unidade de armazenamento). Felizmente, hoje em dia, a maioria dos sistemas de MT disponíveis no mercado utiliza o padrão de codificação de caracteres Unicode que permite codificar línguas cujos caracteres necessitam de dois bytes para serem armazenados. Outra dificuldade adicional está relacionada à segmentação da língua. Ao se criar uma memória de tradução o sistema deve ser capaz de dividir a língua fonte em segmentos. Isso significa que o sistema deve reconhecer quais elementos indicam o fim de um segmento (e.g. pontuação). Neste caso, alguns sistemas de MT têm dificuldade em identificar onde um segmento termina e o outro começa. A maioria dos desenvolvedores de MT reconhece tais problemas e está trabalhando para resolvê-los.