Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística

Bibliographic Details
Main Author: Trindade, Mateus Oliveira Salvador da
Publication Date: 2023
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UFRN
dARK ID: ark:/41046/001300000szt4
Download full: https://repositorio.ufrn.br/handle/123456789/55980
Summary: This work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power.
id UFRN_a921e2d2a66f0d7d3f5873a7f560024e
oai_identifier_str oai:repositorio.ufrn.br:123456789/55980
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatísticaExploration and comparison of classification algorithms in Machine Learning: a statistical approachNaive BayesK-Vizinhos mais PróximosRandom ForestAprendizado de MáquinaK-Nearest NeighborsMachine LearningThis work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power.Esse trabalho estuda a relação da Estatística com o Aprendizado de Máquina, especificamente no contexto de Métodos de Classificação, onde o computador deve aprender padrões estatísticos e computacionais com base nos dados propostos e conseguir classificar dados ainda não vistos com base em seu aprendizado. O banco de dados analisado nesse trabalho contém informações sobre pacientes com ou sem doenças no coração, em que o objetivo dos métodos é classificar novos pacientes, estimando se eles possuem ou não a doença. Os classificadores escolhidos para esse trabalho foram o Naive Bayes, K-Vizinhos mais próximos e o Random Forest. O desempenho foi medido através das métricas estatísticas acurácia, especificidade e sensitividade. Além disso, também foi medido o tempo de execução de cada classificador. No final, foi visto que o Random Forest obteve os melhores resultados nas métricas acurácia e sensitividade, apesar dos outros métodos alcançarem valores bastante próximos. Entretanto, também apresentou o pior resultado de tempo de execução. Dessa forma, é possível concluir que a seleção do melhor modelo, pode ser subjetiva, pois deve ser levado em consideração o contexto da aplicação e o poder computacional disponível.Universidade Federal do Rio Grande do NorteBrasilUFRNEstatísticaEstatísticaCosta, Eliardo Guimarães daNunes, Marcus AlexandreCastro, Bruno Monte deSilva Júnior, Antônio Hermes Marques daTrindade, Mateus Oliveira Salvador da2023-12-15T19:20:32Z2023-12-15T19:20:32Z2023-12-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfTRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/55980ark:/41046/001300000szt4porreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNinfo:eu-repo/semantics/openAccess2024-09-16T17:07:44Zoai:repositorio.ufrn.br:123456789/55980Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2024-09-16T17:07:44Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
Exploration and comparison of classification algorithms in Machine Learning: a statistical approach
title Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
spellingShingle Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
Trindade, Mateus Oliveira Salvador da
Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
title_short Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_full Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_fullStr Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_full_unstemmed Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
title_sort Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística
author Trindade, Mateus Oliveira Salvador da
author_facet Trindade, Mateus Oliveira Salvador da
author_role author
dc.contributor.none.fl_str_mv Costa, Eliardo Guimarães da
Nunes, Marcus Alexandre
Castro, Bruno Monte de
Silva Júnior, Antônio Hermes Marques da
dc.contributor.author.fl_str_mv Trindade, Mateus Oliveira Salvador da
dc.subject.por.fl_str_mv Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
topic Naive Bayes
K-Vizinhos mais Próximos
Random Forest
Aprendizado de Máquina
K-Nearest Neighbors
Machine Learning
description This work studies the relationship between Statistics and Machine Learning, specifically in the context of Classifiers Methods, where the computer must learn statistical and computational patterns from the provided data and be able to classify new data based on its learning. The database analyzed in this study contains information about patients with or without heart diseases, and the goal of the methods is to classify new patients as either having or not having the disease. The classifiers chosen for this work were Naive Bayes, K-Nearest Neighbors, and Random Forest. Performance was measured using statistical metrics such as accuracy, specificity, and sensitivity. Additionally, the execution time of each classifier was also measured. In the end, it was observed that Random Forest achieved the best accuracy and specificity, despite other classifiers showing similar results, but it had the worst execution time result. It can be concluded that the selection of the best model may be subjective, as it should take into consideration the application context and the available computational power.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-15T19:20:32Z
2023-12-15T19:20:32Z
2023-12-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.
https://repositorio.ufrn.br/handle/123456789/55980
dc.identifier.dark.fl_str_mv ark:/41046/001300000szt4
identifier_str_mv TRINDADE, Mateus Oliveira Salvador da. Exploração e comparação de algoritmos de classificação em Machine Learning: uma abordagem estatística. Orientador: Eliardo Guimarães da Costa. 2023. 36 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.
ark:/41046/001300000szt4
url https://repositorio.ufrn.br/handle/123456789/55980
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
Estatística
Estatística
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
Estatística
Estatística
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1839178767439757312