Análise de plágio em código fonte usando similaridade de sinal 1D
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2025 |
| Tipo de documento: | Trabalho de conclusão de curso |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UFSCAR |
| Texto Completo: | https://hdl.handle.net/20.500.14289/21615 |
Resumo: | Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools. |
| id |
SCAR_4e9c984ce326bacf8b1f9f6ad1299b1e |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21615 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
4322 |
| spelling |
Mancuzo, Kaique VenutoBackes, André Ricardohttps://lattes.cnpq.br/85901403375712492025-03-21T17:12:18Z2025-02-26MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615.https://hdl.handle.net/20.500.14289/21615Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools.O plágio em código-fonte é um problema recorrente no meio acadêmico, e sua detecção manual torna-se inviável devido ao alto volume de trabalhos desenvolvidos em disciplinas de programação. Diante disso, este trabalho propõe uma abordagem que mede a similaridade entre códigos-fonte por meio de técnicas de processamento de sinais, tratando-os como sinais unidimensionais. Parte-se da hipótese de que essa abordagem pode ser mais resistente a técnicas de ofuscação do que os métodos convencionais. Foram exploradas três abordagens: análise no domínio do tempo, com Transformada de Fourier e Transformada de Wavelet. As métricas aplicadas foram avaliadas em bases de códigos contendo casos previamente identificados de plágio e comparadas com as ferramentas MOSS e JPlag. Os resultados indicam que a análise no domínio do tempo, especialmente com a Distância DTW e a Correlação de Pearson, apresentou maior eficácia na identificação de plágio, aproximando-se do desempenho das ferramentas tradicionais.porUniversidade Federal de São CarlosCâmpus São CarlosEngenharia de Computação - ECUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAODetecção de plágioAnálise de sinaisTransformada de FourierTransformada de WaveletAnálise de plágio em código fonte usando similaridade de sinal 1DPlagiarism analysis in source code using 1D signal similarityinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTCC-KaiqueMancuzo-VFinalCorrecoes.pdfTCC-KaiqueMancuzo-VFinalCorrecoes.pdfapplication/pdf3494812https://repositorio.ufscar.br/bitstreams/e3e24b9b-c361-447d-a26e-034c86146ed3/downloadb08b3ed03afeda1b5f440dfd24026624MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81025https://repositorio.ufscar.br/bitstreams/a11416ff-a3b4-40a1-baa7-d9094223be87/download5a033ee506f3a0a175bee8fc81f0bd66MD52falseAnonymousREADTEXTTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.txtTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.txtExtracted texttext/plain62539https://repositorio.ufscar.br/bitstreams/a61adc9a-53bb-40ab-8542-e6f3973e0dcb/download9e75426d0f6359027e9e916da203041bMD53falseAnonymousREADTHUMBNAILTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.jpgTCC-KaiqueMancuzo-VFinalCorrecoes.pdf.jpgGenerated Thumbnailimage/jpeg4129https://repositorio.ufscar.br/bitstreams/e71d67e2-ec7f-47eb-b78b-8c84eea9ccef/downloadabf8dcf3bf6ef80a8183a4862982495cMD54falseAnonymousREAD20.500.14289/216152025-03-22 00:04:00.159http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21615https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-03-22T03:04Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.none.fl_str_mv |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| dc.title.alternative.eng.fl_str_mv |
Plagiarism analysis in source code using 1D signal similarity |
| title |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| spellingShingle |
Análise de plágio em código fonte usando similaridade de sinal 1D Mancuzo, Kaique Venuto CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Detecção de plágio Análise de sinais Transformada de Fourier Transformada de Wavelet |
| title_short |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| title_full |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| title_fullStr |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| title_full_unstemmed |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| title_sort |
Análise de plágio em código fonte usando similaridade de sinal 1D |
| author |
Mancuzo, Kaique Venuto |
| author_facet |
Mancuzo, Kaique Venuto |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Mancuzo, Kaique Venuto |
| dc.contributor.advisor1.fl_str_mv |
Backes, André Ricardo |
| dc.contributor.advisor1Lattes.fl_str_mv |
https://lattes.cnpq.br/8590140337571249 |
| contributor_str_mv |
Backes, André Ricardo |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Detecção de plágio Análise de sinais Transformada de Fourier Transformada de Wavelet |
| dc.subject.por.fl_str_mv |
Detecção de plágio Análise de sinais Transformada de Fourier Transformada de Wavelet |
| description |
Source code plagiarism is a recurring issue in academia, and its manual detection is a highly time-consuming task due to the large volume of assignments in programming courses. To address this, this study proposes an approach to measuring similarity between source codes using signal processing techniques, treating them as one-dimensional signals. The hypothesis is that this approach may be more resistant to obfuscation techniques than conventional methods. Three approaches were explored: time-domain analysis, Fourier Transform, and Wavelet Transform. The applied metrics were evaluated on datasets containing previously identified cases of plagiarism and compared with the MOSS and JPlag tools. The results indicate that time-domain analysis, particularly with Dynamic Time Warping (DTW) distance and Pearson correlation, was the most effective in identifying plagiarism, achieving performance comparable to traditional tools. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-03-21T17:12:18Z |
| dc.date.issued.fl_str_mv |
2025-02-26 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/21615 |
| identifier_str_mv |
MANCUZO, Kaique Venuto. Análise de plágio em código fonte usando similaridade de sinal 1D. 2025. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21615. |
| url |
https://hdl.handle.net/20.500.14289/21615 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Engenharia de Computação - EC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos Engenharia de Computação - EC |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/e3e24b9b-c361-447d-a26e-034c86146ed3/download https://repositorio.ufscar.br/bitstreams/a11416ff-a3b4-40a1-baa7-d9094223be87/download https://repositorio.ufscar.br/bitstreams/a61adc9a-53bb-40ab-8542-e6f3973e0dcb/download https://repositorio.ufscar.br/bitstreams/e71d67e2-ec7f-47eb-b78b-8c84eea9ccef/download |
| bitstream.checksum.fl_str_mv |
b08b3ed03afeda1b5f440dfd24026624 5a033ee506f3a0a175bee8fc81f0bd66 9e75426d0f6359027e9e916da203041b abf8dcf3bf6ef80a8183a4862982495c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1834468922284310528 |