Reconhecimento das configurações de mão da língua brasileira de sinais - LIBRAS em imagens de profundidade através da análise de componentes principais e do classificador k-vizinhos mais próximos

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Souza, Robson Silva de
Outros Autores: http://lattes.cnpq.br/6520605275818926
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Faculdade de Tecnologia
Brasil
UFAM
Programa de Pós-graduação em Engenharia Elétrica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede.ufam.edu.br/handle/tede/5012
Resumo: De acordo com o IBGE (Censo 2010), o Brasil possui 9,7 milhões de brasileiros com algum grau de deficiência auditiva, mais de cinco por cento da população. Para a maior parte destas pessoas a língua natural principal utilizada para sua comunicação é a LIBRAS (Língua Brasileira de Sinais) e não o português. O reconhecimento de sinais visa permitir uma maior inserção sócio digital da comunidade surda através da interpretação da língua de sinais pelo computador em formato de áudio ou texto. Esta dissertação apresenta o reconhecimento de um dos parâmetros globais da LIBRAS, as configurações de mão, utilizando o classificador k-vizinhos mais próximos e a técnica de redução de dimensionalidade 2D²PCA. Um conjunto de dados, robusto e representativo das condições do cotidiano, constituído de 12.200 imagens de profundidade das 61 configurações de mão, capturadas pelo sensor Kinect® foi construído. Todas as imagens foram submetidas inicialmente a uma etapa de segmentação que buscou isolar a região da mão direita do resto do corpo. Buscando a eliminação de redundância no conjunto de dados foi implementado uma etapa de extração de características, através da técnica 2D2PCA que determina as formas mais representativas de dados a partir de combinações lineares dos pixels originais. O classificador “k-vizinhos mais próximos” foi a técnica utilizada para a etapa final de reconhecimento automático das configurações de mão. O referido classificador, implementado com k=1 e matriz de característica de 10x10, conseguiu o melhor desempenho, classificando corretamente 96,31% das amostras de testes. Foram obtidas taxas de acerto de 100% para seis configurações de mão.