V-LIBRASIL : uma base de dados com sinais na língua brasileira de sinais (Libras)

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: RODRIGUES, Ailton José
Orientador(a): ZANCHETTIN, Cleber
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/43491
Resumo: A língua de sinais é um instrumento de comunicação visual que permite que indivíduos com diferentes tipos de deficiência auditiva e surdez se comuniquem. É a língua e o símbolo de identificação usada, no dia a dia, pelas pessoas com este tipo de deficiência. A grande maioria das pessoas com essa deficiência não têm contato com a língua oficial falada e escrita, e com isso enfrentam severas barreiras de comunicação, tendo enormes dificuldades de acesso a informações básicas e a serviços públicos. Língua Brasileira de Sinais (Libras), é a língua oficial de sinais do Brasil sendo usada por milhões de brasileiros surdos e também ouvintes. É sabido que, apesar dos esforços de inclusão social e laboral, ainda é pequeno o número de ouvintes habilitados a se comunicar por meio de Libras. Essa barreira invisível interfere na comunicação entre esses dois grupos e não promove autonomia do cidadão surdo nas atividades rotineiras de trabalho e de cidadania. Nesse sentido, a Inteligência Artificial têm sido usada como uma ferramenta para facilitar esta comunicação e promover a inclusão sócio-digital de surdos, oferecendo modelos baseados em aprendizagem de máquina que podem reconhecer e traduzir sinais de uma língua para a outra. Apesar do sucesso dos modelos de aprendizagem de máquina em diferentes tarefas, seu desempenho em reconhecimento de sinais ainda é limitado pela dificuldade de obtenção de dados para treinamento; já que existem poucas e limitadas bases de dados disponíveis nas línguas de sinais e menor ainda é a quantidade de sinais e dados rotulados em Libras. Este trabalho propõe a criação de uma base de dados rotulada de vídeos com intérpretes nativos e tradutores profissionais sinalizando palavras e expressões em Libras. Para a construção desta base foi criada uma metodologia baseada em estudos relacionados, no suporte da equipe de sinalizadores e nas bases existentes na literatura. Outro ponto considerado foi utilizar sinais que permitam fazer uma correlação com uma das principais bases de dados de sinais utilizada na literatura, a base de Sinais Americana (em inglês, American Sign Language Video Dataset - ASLVD), de forma a viabilizar uma associação entre os sinais em Libras e os sinais em ASL a fim de fomentar o desenvolvimento de sistemas de reconhecimento e tradução entre as duas línguas de sinais. A base de dados V-LIBRASIL é constituída de uma compilação paralela Português-Libras. A partição em Português é formada por 1364 termos extraídos e traduzidos da parte em Inglês da base de dados ASLLVD. Esses termos foram sinalizados na Língua Brasileira de Sinais por 3 articuladores perfazendo 4089 sinais que integram a parte Libras. Ademais, para oferecer uma cobertura a diferentes planos de fundo, os sinalizadores foram filmados em um ambiente chroma key, o qual permite adicionar diferentes cenários de fundo após a gravação dos sinais, possibilitando o treinamento de modelos computacionais mais robustos a ruídos e condições adversas. A base de dados está disponibilizada em um portal estruturado V-LIBRASIL Vídeo Dataset, o qual permite a pesquisa por sinais e também o download dos dados para impulsionar o desenvolvimento de novos modelos e sistemas na área de reconhecimento de língua de sinais.