Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea

Bibliographic Details
Main Author: Fernandes, Jackson Celestino
Publication Date: 2024
Other Authors: Carvalho, Leandro Silva Galvão de, Oliveira, David Braga Fernandes de, Oliveira, Elaine Harada Teixeira de, Pereira, Filipe Dwan, Lauschner, Tanara
Format: Article
Language: por
Source: Revista Brasileira de Informática na Educação
Download full: https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587
Summary: Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.
id SBC-6_b21ec8fa5a65530226a3a0d47e2f8bbf
oai_identifier_str oai:journals-sol.sbc.org.br:article/3587
network_acronym_str SBC-6
network_name_str Revista Brasileira de Informática na Educação
repository_id_str
spelling Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en líneaComplexity versus difficulty: An analysis of their correlation in programming questions in online judgesComplexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-lineJuízes en líneaDificultad de preguntasMétricas de dificultadMétricas de complejidadAprendizaje automáticoJuízes on-lineDificuldade de questõesMétricas de dificuldadeMétricas de complexidadeAprendizado de máquinaOnline JudgesQuestions difficultyDifficulty metricsComplexity metricsMachine LearningAmbientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.Automatic code correction environments are increasingly used in the teaching-learning process of programming disciplines. However, a problem often faced by teachers who use these systems is to determine the difficulty of the questions registered in the environment. This work aims to carry out a correlation analysis between code complexity metrics and the difficulty faced by students, so that it is possible to automatically predict the difficulty level of a question just by knowing its solution model. This study was divided into three stages: i) analysis of Spearman’s correlation between complexity metrics (extracted from the question) and difficulty (extracted from the student’s interaction with the question), ii) prediction of the difficulty class of questions through models machine learning for classification and iii) prediction of difficulty metrics using regression models. Regarding item i), it was observed that 96% of the correlations were weak or non-existent between individual metrics of code complexity and difficulty, 4% of cases of moderate correlation and no cases of strong correlation. For item ii), the highest f1-score obtained was 88%, considering classification with two levels of difficulty (“easy” and “hard”), and a maximum f1-score of 67%, considering classification with three levels (“easy”, “medium” and “hard”). For item iii), the best result obtained was an adjusted correlation coefficient of 63%.Ambientes de corrección automática de código son cada vez más utilizados en el proceso de enseñanza-aprendizaje de disciplinas de programación. Sin embargo, un problema enfrentado frecuentemente por los profesores que utilizan tales sistemas es determinar la dificultad de las preguntas registradas en el entorno. Este trabajo tiene como objetivo realizar un análisis de correlación entre métricas de complejidad de código y la dificultad enfrentada por los alumnos, de manera que sea posible predecir automáticamente el nivel de dificultad de una pregunta solo conociendo su modelo de solución. Este estudio se dividió en tres etapas: i) análisis de correlación de Spearman entre métricas de complejidad (extraídas de la pregunta) y de dificultad (extraídas de la interacción del alumno con la pregunta), ii) predicción de la clase de dificultad de preguntas mediante modelos de aprendizaje automático para clasificación, y iii) predicción de métricas de dificultad usando modelos de regresión. En cuanto al ítem i), se observó que el 96 % de las correlaciones fueron débiles o inexistentes entre métricas individuales de complejidad de código y de dificultad, 4 % de casos de correlación moderada y ningún caso de correlación fuerte. Para el ítem ii), el mayor f1-score obtenido fue del 88 %, considerando la clasificación con dos niveles de dificultad ("fácil2 "difícil"), y el f1-score máximo de 67 %, considerando la clasificación con tres niveles ("fácil", "medio2 "difícil"). Para el ítem iii), el mejor resultado obtenido fue un coeficiente de determinación ajustado del 63 %.Sociedade Brasileira de Computação2024-01-16info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArtículo extendido revisado por paresPeer-reviewed extended articleArtigo estendido avaliado pelos paresapplication/pdfhttps://journals-sol.sbc.org.br/index.php/rbie/article/view/358710.5753/rbie.2024.3587Revista Brasileña de Informática en la Educación; Vol. 32 (2024); 22-49Revista Brasileira de Informática na Educação; Vol. 32 (2024); 22-49Brazilian Journal of Computers in Education; Vol. 32 (2024); 22-492317-61211414-5685reponame:Revista Brasileira de Informática na Educaçãoinstname:Sociedade Brasileira de Computação (SBC)instacron:SBCporhttps://journals-sol.sbc.org.br/index.php/rbie/article/view/3587/2502Copyright (c) 2024 Jackson Celestino Fernandes, Leandro Silva Galvão de Carvalho, David Braga Fernandes de Oliveira, Elaine Harada Teixeira de Oliveira, Filipe Dwan Pereira, Tanara Lauschnerhttps://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessFernandes, Jackson CelestinoCarvalho, Leandro Silva Galvão deOliveira, David Braga Fernandes deOliveira, Elaine Harada Teixeira dePereira, Filipe DwanLauschner, Tanara2024-07-31T12:50:04Zoai:journals-sol.sbc.org.br:article/3587Revistahttps://journals-sol.sbc.org.br/index.php/rbieONGhttps://journals-sol.sbc.org.br/index.php/rbie/oaipublicacoes@sbc.org.br2317-61211414-5685opendoar:2024-07-31T12:50:04Revista Brasileira de Informática na Educação - Sociedade Brasileira de Computação (SBC)false
dc.title.none.fl_str_mv Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
Complexity versus difficulty: An analysis of their correlation in programming questions in online judges
Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line
title Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
spellingShingle Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
Fernandes, Jackson Celestino
Juízes en línea
Dificultad de preguntas
Métricas de dificultad
Métricas de complejidad
Aprendizaje automático
Juízes on-line
Dificuldade de questões
Métricas de dificuldade
Métricas de complexidade
Aprendizado de máquina
Online Judges
Questions difficulty
Difficulty metrics
Complexity metrics
Machine Learning
title_short Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_full Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_fullStr Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_full_unstemmed Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_sort Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
author Fernandes, Jackson Celestino
author_facet Fernandes, Jackson Celestino
Carvalho, Leandro Silva Galvão de
Oliveira, David Braga Fernandes de
Oliveira, Elaine Harada Teixeira de
Pereira, Filipe Dwan
Lauschner, Tanara
author_role author
author2 Carvalho, Leandro Silva Galvão de
Oliveira, David Braga Fernandes de
Oliveira, Elaine Harada Teixeira de
Pereira, Filipe Dwan
Lauschner, Tanara
author2_role author
author
author
author
author
dc.contributor.author.fl_str_mv Fernandes, Jackson Celestino
Carvalho, Leandro Silva Galvão de
Oliveira, David Braga Fernandes de
Oliveira, Elaine Harada Teixeira de
Pereira, Filipe Dwan
Lauschner, Tanara
dc.subject.por.fl_str_mv Juízes en línea
Dificultad de preguntas
Métricas de dificultad
Métricas de complejidad
Aprendizaje automático
Juízes on-line
Dificuldade de questões
Métricas de dificuldade
Métricas de complexidade
Aprendizado de máquina
Online Judges
Questions difficulty
Difficulty metrics
Complexity metrics
Machine Learning
topic Juízes en línea
Dificultad de preguntas
Métricas de dificultad
Métricas de complejidad
Aprendizaje automático
Juízes on-line
Dificuldade de questões
Métricas de dificuldade
Métricas de complexidade
Aprendizado de máquina
Online Judges
Questions difficulty
Difficulty metrics
Complexity metrics
Machine Learning
description Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.
publishDate 2024
dc.date.none.fl_str_mv 2024-01-16
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Artículo extendido revisado por pares
Peer-reviewed extended article
Artigo estendido avaliado pelos pares
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587
10.5753/rbie.2024.3587
url https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587
identifier_str_mv 10.5753/rbie.2024.3587
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587/2502
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Sociedade Brasileira de Computação
publisher.none.fl_str_mv Sociedade Brasileira de Computação
dc.source.none.fl_str_mv Revista Brasileña de Informática en la Educación; Vol. 32 (2024); 22-49
Revista Brasileira de Informática na Educação; Vol. 32 (2024); 22-49
Brazilian Journal of Computers in Education; Vol. 32 (2024); 22-49
2317-6121
1414-5685
reponame:Revista Brasileira de Informática na Educação
instname:Sociedade Brasileira de Computação (SBC)
instacron:SBC
instname_str Sociedade Brasileira de Computação (SBC)
instacron_str SBC
institution SBC
reponame_str Revista Brasileira de Informática na Educação
collection Revista Brasileira de Informática na Educação
repository.name.fl_str_mv Revista Brasileira de Informática na Educação - Sociedade Brasileira de Computação (SBC)
repository.mail.fl_str_mv publicacoes@sbc.org.br
_version_ 1832111043130687488