top
Estudos da Tradução II B8
         
 
5. Aplicabilidade

Dentre os corpora on-line disponíveis para o estudo de língua de sinais podemos destacar três:

a) BSL Corpus da Língua de Sinais Britânica
b) ATIS Corpus de Língua de Sinais e Sistemas de Informação de Viagens Aéreas
c) ASL Corpus Corpus da Língua de Sinais Norte Americana

a) BSL – é parte de um projeto financiado pela Conselho da Pesquisa Social e Econômica da Grã-bretanha e gerenciado pelo Centro de Pesquisa sobre a Língua e Cognição Surda (DCAL) da University College London.
O objetivo do projeto é criar um corpus de vídeos clipes mostrando pessoas surdas utilizando a BSL que será disponibilizado on-line. Além disso, o projeto pretende desenvolver pesquisa no que diz respeito à gramática e o vocabulário da BSL e a variação da BSL através do país e como a mesma está mudando.
b) ATIS – é um corpus adequado para a análise de língua de sinais e sistemas estatísticos de tradução automática. O corpus é baseado em um conjunto de dados sobre sistemas de informações sobre viagens aéreas (HEMPPHILL, 1990). Ele contém frases e sentenças transcritas em inglês e extraídas de publicações para a reserva de vôos e viagens. Deste conjunto de dados, 595 sentenças foram escolhidas como base.
O corpus foi traduzido com a ajuda de falantes nativos e se encontra disponível em cinco línguas: inglês, alemão, língua de sinais irlandesa (ISL), língua de sinais alemã (DGS) e língua de sinais sul-africana (SASL).
Segundo os compiladores, este corpus é especialmente interessante para sistemas de tradução automática, pois ele está limitado a apenas um domínio. Além disso, o mesmo permite moldar métodos para se lidar com características específicas da língua de sinais tais como o posicionamento de objetos no espaço de sinalização, conforme o uso extensivo de referências espaciais relacionadas a aeroportos e outras localizações.
c) ASL Corpus – este corpus faz parte de um projeto que pesquisa o reconhecimento baseado em computador dos sinais da ASL. Um dos objetivos é o desenvolvimento de uma interface de pesquisa lexical como parte de um dicionário multimídia da língua de sinais norte americana. Embora, dicionários impressos sobre a ASL existem, eles geralmente estão organizados de acordo com a tradução inglesa mais próxima do sinal da ASL, pois não há forma escrita para a ASL.

O corpus proposto permite que o sinalizante selecione um vídeo clipe correspondente a um sinal desconhecido ou produzir um sinal em frente de uma câmera, para pesquisa. O sistema encontra uma melhor combinação a partir do seu inventário com milhares de sinais da ASL. Conhecimento sobre as limitações lingüísticas da produção de sinais é utilizado para melhorar o reconhecimento.