Comunicação aumentativa e alternativa utilizando rastreamento ocular e recomendação de palavras através de modelos de linguagem

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Waideman, Bruno
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro Universitário FEI, São Bernardo do Campo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.fei.edu.br/handle/FEI/5539
Resumo: Desde as mais antigas formas de comunicação até os mais recentes desenvolvimentos na tecnologia computacional, a produção, o armazenamento e a circulação de informação e conteúdo têm sido aspectos centrais da vida social. Com o contínuo avanço da tecnologia, os meios digitais se tornaram relevantes para aproximar pessoas e facilitar ainda mais a circulação de informações. Para utilizar estes dispositivos, usualmente são utilizados teclados, sejam eles físicos ou digitais, e outros dispositivos, como mouses e canetas em telas eletrônicas sensíveis. Utilizar estes dispositivos pode ser uma tarefa trivial para a maior parte das pessoas, no entanto, é limitante para aqueles que apresentam dificuldades motoras em determinados contextos de uso. A Comunicação Aumentativa e Alternativa (CAA) é então utilizada para ampliar estas habilidades de comunicação, possibilitando a construção de canais alternativos, através da valorização de todas as formas de expressão existentes. Desta forma, novas modalidades de interação com dispositivos de comunicação, como a entrada por gestos, comandos de voz e diversos tipos de sensores, são cada vez mais comuns. A entrada de informação através do rastreamento ocular é uma modalidade que encontra grande aplicação em sistemas de acessibilidade. No entanto, muitas limitações podem ser observadas, como fadiga visual e imprecisão na decodificação, causando erros de digitação e maior tempo para inserção de estruturas de texto, quando comparado com os métodos tradicionais. Desse modo, este trabalho apresenta um método de interação baseado no rastreamento do movimento ocular e orientação da cabeça, acoplado a um teclado virtual, utilizando uma rede neural artificial para decodificar o traçado do olhar e traduzir as intenções dos usuários na interface. De forma complementar, é utilizado um Modelo de Linguagem (ML) para realizar a recomendação de próximas palavras. Com isso, investigou-se a influência destas tecnologias no sistema proposto, medindo a velocidade de digitação, taxa de erros e perplexidade que, de forma geral, demonstraram resultados satisfatórios para auxiliar pessoas com deficiência a se comunicarem melhor