Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Coelho Neto, Luiz Eugênio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://locus.ufv.br//handle/123456789/29685
https://doi.org/10.47328/ufvbbt.2021.028
Resumo: Estimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.