Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais

Oliveira, Anne de Souza; http://lattes.cnpq.br/0700648537595120

Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais

Detalhes bibliográficos
Ano de defesa:	2019
Autor(a) principal:	Oliveira, Anne de Souza
Outros Autores:	http://lattes.cnpq.br/0700648537595120
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA
Link de acesso:	https://tede.ufam.edu.br/handle/tede/6956
Resumo:	Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.

Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais

Registros relacionados