Classifying code smell reviews with semantic search.
| Main Author: | |
|---|---|
| Publication Date: | 2024 |
| Format: | Bachelor thesis |
| Language: | por |
| Source: | Biblioteca Digital de Teses e Dissertações da UFCG |
| Download full: | https://dspace.sti.ufcg.edu.br/handle/riufcg/38005 |
Summary: | Contexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação. |
| id |
UFCG_d87c0fdee92a201477cba2ac5118aeea |
|---|---|
| oai_identifier_str |
oai:dspace.sti.ufcg.edu.br:riufcg/38005 |
| network_acronym_str |
UFCG |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| repository_id_str |
4851 |
| spelling |
Classifying code smell reviews with semantic search.Classificando avaliações de code smell com pesquisa semântica.Code SmellsCode ReviewSemantic SearchClassiication - Code Smell ReviewsBusca SemânticaClassificação - Avaliações de Code SmellCiência da ComputaçãoContexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação.Background: Code smells refer to patterns in source code that deviate from established design principles. During code review, developers have the opportunity to identify and correct these smells, thereby enhancing the overall quality of the codebase. Further examination of the discussions within code reviews can reveal valuable insights about how code smells are discussed. Aim: In order to enable future research to better understand developers behavior regarding code smells, we set out to build a dataset of code-smell related discussions. In practice, we want to classify comments in two categories: code smell comments and non code smell comments. Method: To do so, we conducted an experiment that leveraged semantic search as a classiication technique. The training data was scraped from three popular open source GitHub repositories and consisted of over 100,000 entries. Results: As a result, we have automatically classiied 4,058 review comments as being code smell related. Although employing a novel technique and disposing of limited resources we could achieve a precision of 0.41 for the task of classiication.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIUFCGBRUNET, João Arthur Monteiro.BRUNET, J. A. M.http://lattes.cnpq.br/7892247821251194RIBEIRO, Carlos Henrique Gonçalves.20242024-09-25T10:50:55Z2024-09-252024-09-25T10:50:55Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttps://dspace.sti.ufcg.edu.br/handle/riufcg/38005RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2025-11-18T07:06:56Zoai:dspace.sti.ufcg.edu.br:riufcg/38005Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-11-18T07:06:56Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
| dc.title.none.fl_str_mv |
Classifying code smell reviews with semantic search. Classificando avaliações de code smell com pesquisa semântica. |
| title |
Classifying code smell reviews with semantic search. |
| spellingShingle |
Classifying code smell reviews with semantic search. RIBEIRO, Carlos Henrique Gonçalves. Code Smells Code Review Semantic Search Classiication - Code Smell Reviews Busca Semântica Classificação - Avaliações de Code Smell Ciência da Computação |
| title_short |
Classifying code smell reviews with semantic search. |
| title_full |
Classifying code smell reviews with semantic search. |
| title_fullStr |
Classifying code smell reviews with semantic search. |
| title_full_unstemmed |
Classifying code smell reviews with semantic search. |
| title_sort |
Classifying code smell reviews with semantic search. |
| author |
RIBEIRO, Carlos Henrique Gonçalves. |
| author_facet |
RIBEIRO, Carlos Henrique Gonçalves. |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
BRUNET, João Arthur Monteiro. BRUNET, J. A. M. http://lattes.cnpq.br/7892247821251194 |
| dc.contributor.author.fl_str_mv |
RIBEIRO, Carlos Henrique Gonçalves. |
| dc.subject.por.fl_str_mv |
Code Smells Code Review Semantic Search Classiication - Code Smell Reviews Busca Semântica Classificação - Avaliações de Code Smell Ciência da Computação |
| topic |
Code Smells Code Review Semantic Search Classiication - Code Smell Reviews Busca Semântica Classificação - Avaliações de Code Smell Ciência da Computação |
| description |
Contexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024 2024-09-25T10:50:55Z 2024-09-25 2024-09-25T10:50:55Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://dspace.sti.ufcg.edu.br/handle/riufcg/38005 RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024. |
| url |
https://dspace.sti.ufcg.edu.br/handle/riufcg/38005 |
| identifier_str_mv |
RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024. |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG |
| publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
| instname_str |
Universidade Federal de Campina Grande (UFCG) |
| instacron_str |
UFCG |
| institution |
UFCG |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
| repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
| _version_ |
1850321204402978816 |