Análise de plágio em código fonte usando similaridade de sinal 1D

Detalhes bibliográficos
Autor(a) principal: Mancuzo, Kaique Venuto
Data de Publicação: 2025
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://hdl.handle.net/20.500.14289/21615
Resumo: Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools.
id SCAR_4e9c984ce326bacf8b1f9f6ad1299b1e
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/21615
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Mancuzo, Kaique VenutoBackes, André Ricardohttps://lattes.cnpq.br/85901403375712492025-03-21T17:12:18Z2025-02-26MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615.https://hdl.handle.net/20.500.14289/21615Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools.O plágio em código-fonte é um problema recorrente no meio acadêmico, e sua detecção manual torna-se inviável devido ao alto volume de trabalhos desenvolvidos em disciplinas de programação. Diante disso, este trabalho propõe uma abordagem que mede a similaridade entre códigos-fonte por meio de técnicas de processamento de sinais, tratando-os como sinais unidimensionais. Parte-se da hipótese de que essa abordagem pode ser mais resistente a técnicas de ofuscação do que os métodos convencionais. Foram exploradas três abordagens: análise no domínio do tempo, com Transformada de Fourier e Transformada de Wavelet. As métricas aplicadas foram avaliadas em bases de códigos contendo casos previamente identificados de plágio e comparadas com as ferramentas MOSS e JPlag. Os resultados indicam que a análise no domínio do tempo, especialmente com a Distância DTW e a Correlação de Pearson, apresentou maior eficácia na identificação de plágio, aproximando-se do desempenho das ferramentas tradicionais.porUniversidade Federal de São CarlosCâmpus São CarlosEngenharia de Computação - ECUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAODetecção de plágioAnálise de sinaisTransformada de FourierTransformada de WaveletAnálise de plágio em código fonte usando similaridade de sinal 1DPlagiarism analysis in source code using 1D signal similarityinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTCC-KaiqueMancuzo-VFinalCorrecoes.pdfTCC-KaiqueMancuzo-VFinalCorrecoes.pdfapplication/pdf3494812https://repositorio.ufscar.br/bitstreams/e3e24b9b-c361-447d-a26e-034c86146ed3/downloadb08b3ed03afeda1b5f440dfd24026624MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81025https://repositorio.ufscar.br/bitstreams/a11416ff-a3b4-40a1-baa7-d9094223be87/download5a033ee506f3a0a175bee8fc81f0bd66MD52falseAnonymousREADTEXTTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.txtTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.txtExtracted texttext/plain62539https://repositorio.ufscar.br/bitstreams/a61adc9a-53bb-40ab-8542-e6f3973e0dcb/download9e75426d0f6359027e9e916da203041bMD53falseAnonymousREADTHUMBNAILTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.jpgTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.jpgGenerated Thumbnailimage/jpeg4129https://repositorio.ufscar.br/bitstreams/e71d67e2-ec7f-47eb-b78b-8c84eea9ccef/downloadabf8dcf3bf6ef80a8183a4862982495cMD54falseAnonymousREAD20.500.14289/216152025-03-22 00:04:00.159http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21615https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-03-22T03:04Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Análise de plágio em código fonte usando similaridade de sinal 1D
dc.title.alternative.eng.fl_str_mv Plagiarism analysis in source code using 1D signal similarity
title Análise de plágio em código fonte usando similaridade de sinal 1D
spellingShingle Análise de plágio em código fonte usando similaridade de sinal 1D
Mancuzo, Kaique Venuto
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Detecção de plágio
Análise de sinais
Transformada de Fourier
Transformada de Wavelet
title_short Análise de plágio em código fonte usando similaridade de sinal 1D
title_full Análise de plágio em código fonte usando similaridade de sinal 1D
title_fullStr Análise de plágio em código fonte usando similaridade de sinal 1D
title_full_unstemmed Análise de plágio em código fonte usando similaridade de sinal 1D
title_sort Análise de plágio em código fonte usando similaridade de sinal 1D
author Mancuzo, Kaique Venuto
author_facet Mancuzo, Kaique Venuto
author_role author
dc.contributor.author.fl_str_mv Mancuzo, Kaique Venuto
dc.contributor.advisor1.fl_str_mv Backes, André Ricardo
dc.contributor.advisor1Lattes.fl_str_mv https://lattes.cnpq.br/8590140337571249
contributor_str_mv Backes, André Ricardo
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Detecção de plágio
Análise de sinais
Transformada de Fourier
Transformada de Wavelet
dc.subject.por.fl_str_mv Detecção de plágio
Análise de sinais
Transformada de Fourier
Transformada de Wavelet
description Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-03-21T17:12:18Z
dc.date.issued.fl_str_mv 2025-02-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/21615
identifier_str_mv MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615.
url https://hdl.handle.net/20.500.14289/21615
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Engenharia de Computação - EC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Engenharia de Computação - EC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/e3e24b9b-c361-447d-a26e-034c86146ed3/download
https://repositorio.ufscar.br/bitstreams/a11416ff-a3b4-40a1-baa7-d9094223be87/download
https://repositorio.ufscar.br/bitstreams/a61adc9a-53bb-40ab-8542-e6f3973e0dcb/download
https://repositorio.ufscar.br/bitstreams/e71d67e2-ec7f-47eb-b78b-8c84eea9ccef/download
bitstream.checksum.fl_str_mv b08b3ed03afeda1b5f440dfd24026624
5a033ee506f3a0a175bee8fc81f0bd66
9e75426d0f6359027e9e916da203041b
abf8dcf3bf6ef80a8183a4862982495c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1834468922284310528