Dentre os corpora on-line disponíveis para o estudo de língua de sinais podemos destacar três:
a) BSL Corpus da Língua de Sinais Britânica b) ATIS Corpus de Língua de Sinais e Sistemas de Informação de Viagens Aéreas
c) ASL Corpus Corpus da Língua de Sinais Norte Americana
a) BSL – é parte de um projeto financiado pela Conselho da Pesquisa Social e Econômica da Grã-bretanha e gerenciado pelo Centro de Pesquisa sobre a Língua e Cognição Surda (DCAL) da University College London. O objetivo do projeto é criar um corpus de vídeos clipes mostrando pessoas surdas utilizando a BSL que será disponibilizado on-line. Além disso, o projeto pretende desenvolver pesquisa no que diz respeito à gramática e o vocabulário da BSL e a variação da BSL através do país e como a mesma está mudando.
b) ATIS – é um corpus adequado para a análise de língua de sinais e sistemas estatísticos de tradução automática. O corpus é baseado em um conjunto de dados sobre sistemas de informações sobre viagens aéreas (HEMPPHILL, 1990). Ele contém frases e sentenças transcritas em inglês e extraídas de publicações para a reserva de vôos e viagens. Deste conjunto de dados, 595 sentenças foram escolhidas como base. O corpus foi traduzido com a ajuda de falantes nativos e se encontra disponível em cinco línguas: inglês, alemão, língua de sinais irlandesa (ISL), língua de sinais alemã (DGS) e língua de sinais sul-africana (SASL). Segundo os compiladores, este corpus é especialmente interessante para sistemas de tradução automática, pois ele está limitado a apenas um domínio. Além disso, o mesmo permite moldar métodos para se lidar com características específicas da língua de sinais tais como o posicionamento de objetos no espaço de sinalização, conforme o uso extensivo de referências espaciais relacionadas a aeroportos e outras localizações.
c) ASL Corpus – este corpus faz parte de um projeto que pesquisa o reconhecimento baseado em computador dos sinais da ASL. Um dos objetivos é o desenvolvimento de uma interface de pesquisa lexical como parte de um dicionário multimídia da língua de sinais norte americana. Embora, dicionários impressos sobre a ASL existem, eles geralmente estão organizados de acordo com a tradução inglesa mais próxima do sinal da ASL, pois não há forma escrita para a ASL.
O corpus proposto permite que o sinalizante selecione um vídeo clipe correspondente a um sinal desconhecido ou produzir um sinal em frente de uma câmera, para pesquisa. O sistema encontra uma melhor combinação a partir do seu inventário com milhares de sinais da ASL. Conhecimento sobre as limitações lingüísticas da produção de sinais é utilizado para melhorar o reconhecimento.
– BSL - O BSL Corpus (British Sign Language Corpus), que se encontra ainda em construção, pode ser acessado no sítio eletrônico http://www.bslcorpusproject.org/ .