Classifying code smell reviews with semantic search.

Bibliographic Details
Main Author: RIBEIRO, Carlos Henrique Gonçalves.
Publication Date: 2024
Format: Bachelor thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da UFCG
Download full: https://dspace.sti.ufcg.edu.br/handle/riufcg/38005
Summary: Contexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação.
id UFCG_d87c0fdee92a201477cba2ac5118aeea
oai_identifier_str oai:dspace.sti.ufcg.edu.br:riufcg/38005
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Classifying code smell reviews with semantic search.Classificando avaliações de code smell com pesquisa semântica.Code SmellsCode ReviewSemantic SearchClassiication - Code Smell ReviewsBusca SemânticaClassificação - Avaliações de Code SmellCiência da ComputaçãoContexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação.Background: Code smells refer to patterns in source code that deviate from established design principles. During code review, developers have the opportunity to identify and correct these smells, thereby enhancing the overall quality of the codebase. Further examination of the discussions within code reviews can reveal valuable insights about how code smells are discussed. Aim: In order to enable future research to better understand developers behavior regarding code smells, we set out to build a dataset of code-smell related discussions. In practice, we want to classify comments in two categories: code smell comments and non code smell comments. Method: To do so, we conducted an experiment that leveraged semantic search as a classiication technique. The training data was scraped from three popular open source GitHub repositories and consisted of over 100,000 entries. Results: As a result, we have automatically classiied 4,058 review comments as being code smell related. Although employing a novel technique and disposing of limited resources we could achieve a precision of 0.41 for the task of classiication.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIUFCGBRUNET, João Arthur Monteiro.BRUNET, J. A. M.http://lattes.cnpq.br/7892247821251194RIBEIRO, Carlos Henrique Gonçalves.20242024-09-25T10:50:55Z2024-09-252024-09-25T10:50:55Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttps://dspace.sti.ufcg.edu.br/handle/riufcg/38005RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2025-11-18T07:06:56Zoai:dspace.sti.ufcg.edu.br:riufcg/38005Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-11-18T07:06:56Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Classifying code smell reviews with semantic search.
Classificando avaliações de code smell com pesquisa semântica.
title Classifying code smell reviews with semantic search.
spellingShingle Classifying code smell reviews with semantic search.
RIBEIRO, Carlos Henrique Gonçalves.
Code Smells
Code Review
Semantic Search
Classiication - Code Smell Reviews
Busca Semântica
Classificação - Avaliações de Code Smell
Ciência da Computação
title_short Classifying code smell reviews with semantic search.
title_full Classifying code smell reviews with semantic search.
title_fullStr Classifying code smell reviews with semantic search.
title_full_unstemmed Classifying code smell reviews with semantic search.
title_sort Classifying code smell reviews with semantic search.
author RIBEIRO, Carlos Henrique Gonçalves.
author_facet RIBEIRO, Carlos Henrique Gonçalves.
author_role author
dc.contributor.none.fl_str_mv BRUNET, João Arthur Monteiro.
BRUNET, J. A. M.
http://lattes.cnpq.br/7892247821251194
dc.contributor.author.fl_str_mv RIBEIRO, Carlos Henrique Gonçalves.
dc.subject.por.fl_str_mv Code Smells
Code Review
Semantic Search
Classiication - Code Smell Reviews
Busca Semântica
Classificação - Avaliações de Code Smell
Ciência da Computação
topic Code Smells
Code Review
Semantic Search
Classiication - Code Smell Reviews
Busca Semântica
Classificação - Avaliações de Code Smell
Ciência da Computação
description Contexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação.
publishDate 2024
dc.date.none.fl_str_mv 2024
2024-09-25T10:50:55Z
2024-09-25
2024-09-25T10:50:55Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.sti.ufcg.edu.br/handle/riufcg/38005
RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.
url https://dspace.sti.ufcg.edu.br/handle/riufcg/38005
identifier_str_mv RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1850321204402978816