Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina

Bibliographic Details
Main Author: Favero, Daniel Gustavo
Publication Date: 2024
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Download full: http://repositorio.utfpr.edu.br/jspui/handle/1/34394
Summary: This paper presents the Hand Mouse browser extension, developed to enable mouse control on web pages through the user’s hand gestures, using Computer Vision and Machine Learning techniques. This approach aims to enhance flexibility and ergonomics, offering a natural alternative to the traditional use of the mouse, potentially reducing the risk of repetitive strain injuries. The main innovation of this paper is the development of the gesture customization feature, allowing the user to define and train new gestures to perform actions such as moving the mouse cursor, clicking, scrolling up, scrolling down, going back a page, going forward a page, and free movement. To achieve this objective, a set of gesture images was created, which served as input for the TensorFlow.js Convolutional Neural Network (CNN) Hand Pose Detection model to extract hand key points (landmarks). These data were then used to test two classification models based on K-Nearest Neighbors (KNN) and Support Vector Machines (SVM) algorithms, selected for their application in related works and their tested results in gesture classification. During the classifier selection phase, tests were conducted to determine the minimum number of images needed to maximize the model’s accuracy, the influence of the distance between the hand and the camera, and the similarity between the gestures in the recognition process. The results show that the KNN model achieved satisfactory accuracy and F1 score values in gesture recognition, even under conditions with a reduced training set, variable distances, and gesture similarities. Within the Hand Mouse extension, a web page interface was developed that allows the user to register new gestures and retrain the KNN classifier. It is concluded that this paper not only achieved its goals of developing a functional tool to control the mouse using gestures but also paved the way for future research and improvements in the field of human-computer interaction, especially regarding the customization and usability of gesture-based interfaces.
id UTFPR-12_1ece5c7ab59cee1a2fe9f68ef0ea020d
oai_identifier_str oai:repositorio.utfpr.edu.br:1/34394
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquinaRecognition and personalization of hand gestures for interaction with web pages through computer vision and machine learningAprendizado do computadorVisão por computadorInteração homem-máquinaRedes neurais (Computação)Machine learningComputer visionHuman-computer interationNeural networks (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis paper presents the Hand Mouse browser extension, developed to enable mouse control on web pages through the user’s hand gestures, using Computer Vision and Machine Learning techniques. This approach aims to enhance flexibility and ergonomics, offering a natural alternative to the traditional use of the mouse, potentially reducing the risk of repetitive strain injuries. The main innovation of this paper is the development of the gesture customization feature, allowing the user to define and train new gestures to perform actions such as moving the mouse cursor, clicking, scrolling up, scrolling down, going back a page, going forward a page, and free movement. To achieve this objective, a set of gesture images was created, which served as input for the TensorFlow.js Convolutional Neural Network (CNN) Hand Pose Detection model to extract hand key points (landmarks). These data were then used to test two classification models based on K-Nearest Neighbors (KNN) and Support Vector Machines (SVM) algorithms, selected for their application in related works and their tested results in gesture classification. During the classifier selection phase, tests were conducted to determine the minimum number of images needed to maximize the model’s accuracy, the influence of the distance between the hand and the camera, and the similarity between the gestures in the recognition process. The results show that the KNN model achieved satisfactory accuracy and F1 score values in gesture recognition, even under conditions with a reduced training set, variable distances, and gesture similarities. Within the Hand Mouse extension, a web page interface was developed that allows the user to register new gestures and retrain the KNN classifier. It is concluded that this paper not only achieved its goals of developing a functional tool to control the mouse using gestures but also paved the way for future research and improvements in the field of human-computer interaction, especially regarding the customization and usability of gesture-based interfaces.Este trabalho apresenta a extensão de navegador Hand Mouse, desenvolvida para possibilitar o controle do mouse em páginas web por meio dos gestos das mãos do usuário, utilizando técnicas de Visão Computacional e Aprendizado de Máquina. Esta abordagem visa aumentar a flexibilidade e ergonomia, oferecendo uma alternativa natural ao uso tradicional do mouse, potencialmente reduzindo o risco de lesões por esforços repetitivos. A principal inovação do trabalho é o desenvolvimento da funcionalidade de personalização de gestos, permitindo que o usuário defina e treine novos gestos para executar ações de mover o cursor do mouse, clique, scroll up, scroll down, voltar uma página, avançar uma página e movimento livre. Para atingir esse objetivo, foi construído um conjunto de imagens de gestos, que serviram de entrada para o modelo de Rede Neural Convolucional (CNN) Hand Pose Detection do TensorFlow.js para extrair os pontos-chave (landmarks) das mãos. Esses dados foram então pré-processados e utilizados para testar dois modelos de classificação baseados nos algoritmos K-Nearest Neighbors (KNN) e Support Vector Machines (SVM), selecionados por sua aplicação nos trabalhos relacionados e nos resultados testados na classificação de gestos. Durante a fase de seleção do classificador, foram realizados testes para determinar a quantidade mínima de imagens necessárias para maximizar a precisão do modelo, a influência da proximidade da mão em relação à câmera e a similaridade entre as imagens de gestos no reconhecimento dos gestos. Os resultados demonstraram que o modelo KNN atingiu valores de acurácia e score F1 satisfatórios na identificação de gestos, mesmo em condições com um conjunto de treino reduzido, variáveis de distância e gestos similares. Dentro da extensão Hand Mouse, foi desenvolvida uma interface web que permite ao usuário cadastrar novos gestos e treinar novamente o classificador KNN. Conclui-se que o trabalho não apenas alcançou seu objetivo de desenvolver uma ferramenta funcional para o controle do mouse via gestos, mas também abriu caminho para futuras pesquisas e aprimoramentos na área de interação ser humano-computador, especialmente no que tange à personalização e usabilidade de interfaces baseadas em gestos.Universidade Tecnológica Federal do ParanáPato BrancoBrasilDepartamento Acadêmico de InformáticaEngenharia de ComputaçãoUTFPRAscari, Soelaine RodriguesAscari, Rúbia Eliza de Oliveira SchultzRodrigues, Érick OliveiraOliva, Jefferson TalesAscari, Soelaine RodriguesAscari, Rúbia Eliza de Oliveira SchultzFavero, Daniel Gustavo2024-08-09T15:40:23Z2024-08-09T15:40:23Z2024-06-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfFAVERO, Daniel Gustavo. Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2024.http://repositorio.utfpr.edu.br/jspui/handle/1/34394porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2024-08-10T06:10:13Zoai:repositorio.utfpr.edu.br:1/34394Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2024-08-10T06:10:13Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
Recognition and personalization of hand gestures for interaction with web pages through computer vision and machine learning
title Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
spellingShingle Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
Favero, Daniel Gustavo
Aprendizado do computador
Visão por computador
Interação homem-máquina
Redes neurais (Computação)
Machine learning
Computer vision
Human-computer interation
Neural networks (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
title_full Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
title_fullStr Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
title_full_unstemmed Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
title_sort Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina
author Favero, Daniel Gustavo
author_facet Favero, Daniel Gustavo
author_role author
dc.contributor.none.fl_str_mv Ascari, Soelaine Rodrigues
Ascari, Rúbia Eliza de Oliveira Schultz
Rodrigues, Érick Oliveira
Oliva, Jefferson Tales
Ascari, Soelaine Rodrigues
Ascari, Rúbia Eliza de Oliveira Schultz
dc.contributor.author.fl_str_mv Favero, Daniel Gustavo
dc.subject.por.fl_str_mv Aprendizado do computador
Visão por computador
Interação homem-máquina
Redes neurais (Computação)
Machine learning
Computer vision
Human-computer interation
Neural networks (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Aprendizado do computador
Visão por computador
Interação homem-máquina
Redes neurais (Computação)
Machine learning
Computer vision
Human-computer interation
Neural networks (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This paper presents the Hand Mouse browser extension, developed to enable mouse control on web pages through the user’s hand gestures, using Computer Vision and Machine Learning techniques. This approach aims to enhance flexibility and ergonomics, offering a natural alternative to the traditional use of the mouse, potentially reducing the risk of repetitive strain injuries. The main innovation of this paper is the development of the gesture customization feature, allowing the user to define and train new gestures to perform actions such as moving the mouse cursor, clicking, scrolling up, scrolling down, going back a page, going forward a page, and free movement. To achieve this objective, a set of gesture images was created, which served as input for the TensorFlow.js Convolutional Neural Network (CNN) Hand Pose Detection model to extract hand key points (landmarks). These data were then used to test two classification models based on K-Nearest Neighbors (KNN) and Support Vector Machines (SVM) algorithms, selected for their application in related works and their tested results in gesture classification. During the classifier selection phase, tests were conducted to determine the minimum number of images needed to maximize the model’s accuracy, the influence of the distance between the hand and the camera, and the similarity between the gestures in the recognition process. The results show that the KNN model achieved satisfactory accuracy and F1 score values in gesture recognition, even under conditions with a reduced training set, variable distances, and gesture similarities. Within the Hand Mouse extension, a web page interface was developed that allows the user to register new gestures and retrain the KNN classifier. It is concluded that this paper not only achieved its goals of developing a functional tool to control the mouse using gestures but also paved the way for future research and improvements in the field of human-computer interaction, especially regarding the customization and usability of gesture-based interfaces.
publishDate 2024
dc.date.none.fl_str_mv 2024-08-09T15:40:23Z
2024-08-09T15:40:23Z
2024-06-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FAVERO, Daniel Gustavo. Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2024.
http://repositorio.utfpr.edu.br/jspui/handle/1/34394
identifier_str_mv FAVERO, Daniel Gustavo. Reconhecimento e personalização de gestos das mãos para interação com páginas web por meio de visão computacional e aprendizado de máquina. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2024.
url http://repositorio.utfpr.edu.br/jspui/handle/1/34394
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
Brasil
Departamento Acadêmico de Informática
Engenharia de Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
Brasil
Departamento Acadêmico de Informática
Engenharia de Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498048738721792