Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea

Fernandes, Jackson Celestino; Carvalho, Leandro Silva Galvão de; Oliveira, David Braga Fernandes de; Oliveira, Elaine Harada Teixeira de; Pereira, Filipe Dwan; Lauschner, Tanara

Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea

Bibliographic Details
Main Author:	Fernandes, Jackson Celestino
Publication Date:	2024
Other Authors:	Carvalho, Leandro Silva Galvão de, Oliveira, David Braga Fernandes de, Oliveira, Elaine Harada Teixeira de, Pereira, Filipe Dwan, Lauschner, Tanara
Format:	Article
Language:	por
Source:	Revista Brasileira de Informática na Educação
Download full:	https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587
Summary:	Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.

Item metadata

id	SBC-6_b21ec8fa5a65530226a3a0d47e2f8bbf
oai_identifier_str	oai:journals-sol.sbc.org.br:article/3587
network_acronym_str	SBC-6
network_name_str	Revista Brasileira de Informática na Educação
repository_id_str
spelling	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en líneaComplexity versus difficulty: An analysis of their correlation in programming questions in online judgesComplexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-lineJuízes en líneaDificultad de preguntasMétricas de dificultadMétricas de complejidadAprendizaje automáticoJuízes on-lineDificuldade de questõesMétricas de dificuldadeMétricas de complexidadeAprendizado de máquinaOnline JudgesQuestions difficultyDifficulty metricsComplexity metricsMachine LearningAmbientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.Automatic code correction environments are increasingly used in the teaching-learning process of programming disciplines. However, a problem often faced by teachers who use these systems is to determine the difficulty of the questions registered in the environment. This work aims to carry out a correlation analysis between code complexity metrics and the difficulty faced by students, so that it is possible to automatically predict the difficulty level of a question just by knowing its solution model. This study was divided into three stages: i) analysis of Spearman’s correlation between complexity metrics (extracted from the question) and difficulty (extracted from the student’s interaction with the question), ii) prediction of the difficulty class of questions through models machine learning for classification and iii) prediction of difficulty metrics using regression models. Regarding item i), it was observed that 96% of the correlations were weak or non-existent between individual metrics of code complexity and difficulty, 4% of cases of moderate correlation and no cases of strong correlation. For item ii), the highest f1-score obtained was 88%, considering classification with two levels of difficulty (“easy” and “hard”), and a maximum f1-score of 67%, considering classification with three levels (“easy”, “medium” and “hard”). For item iii), the best result obtained was an adjusted correlation coefficient of 63%.Ambientes de corrección automática de código son cada vez más utilizados en el proceso de enseñanza-aprendizaje de disciplinas de programación. Sin embargo, un problema enfrentado frecuentemente por los profesores que utilizan tales sistemas es determinar la dificultad de las preguntas registradas en el entorno. Este trabajo tiene como objetivo realizar un análisis de correlación entre métricas de complejidad de código y la dificultad enfrentada por los alumnos, de manera que sea posible predecir automáticamente el nivel de dificultad de una pregunta solo conociendo su modelo de solución. Este estudio se dividió en tres etapas: i) análisis de correlación de Spearman entre métricas de complejidad (extraídas de la pregunta) y de dificultad (extraídas de la interacción del alumno con la pregunta), ii) predicción de la clase de dificultad de preguntas mediante modelos de aprendizaje automático para clasificación, y iii) predicción de métricas de dificultad usando modelos de regresión. En cuanto al ítem i), se observó que el 96 % de las correlaciones fueron débiles o inexistentes entre métricas individuales de complejidad de código y de dificultad, 4 % de casos de correlación moderada y ningún caso de correlación fuerte. Para el ítem ii), el mayor f1-score obtenido fue del 88 %, considerando la clasificación con dos niveles de dificultad ("fácil2 "difícil"), y el f1-score máximo de 67 %, considerando la clasificación con tres niveles ("fácil", "medio2 "difícil"). Para el ítem iii), el mejor resultado obtenido fue un coeficiente de determinación ajustado del 63 %.Sociedade Brasileira de Computação2024-01-16info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArtículo extendido revisado por paresPeer-reviewed extended articleArtigo estendido avaliado pelos paresapplication/pdfhttps://journals-sol.sbc.org.br/index.php/rbie/article/view/358710.5753/rbie.2024.3587Revista Brasileña de Informática en la Educación; Vol. 32 (2024); 22-49Revista Brasileira de Informática na Educação; Vol. 32 (2024); 22-49Brazilian Journal of Computers in Education; Vol. 32 (2024); 22-492317-61211414-5685reponame:Revista Brasileira de Informática na Educaçãoinstname:Sociedade Brasileira de Computação (SBC)instacron:SBCporhttps://journals-sol.sbc.org.br/index.php/rbie/article/view/3587/2502Copyright (c) 2024 Jackson Celestino Fernandes, Leandro Silva Galvão de Carvalho, David Braga Fernandes de Oliveira, Elaine Harada Teixeira de Oliveira, Filipe Dwan Pereira, Tanara Lauschnerhttps://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessFernandes, Jackson CelestinoCarvalho, Leandro Silva Galvão deOliveira, David Braga Fernandes deOliveira, Elaine Harada Teixeira dePereira, Filipe DwanLauschner, Tanara2024-07-31T12:50:04Zoai:journals-sol.sbc.org.br:article/3587Revistahttps://journals-sol.sbc.org.br/index.php/rbieONGhttps://journals-sol.sbc.org.br/index.php/rbie/oaipublicacoes@sbc.org.br2317-61211414-5685opendoar:2024-07-31T12:50:04Revista Brasileira de Informática na Educação - Sociedade Brasileira de Computação (SBC)false
dc.title.none.fl_str_mv	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea Complexity versus difficulty: An analysis of their correlation in programming questions in online judges Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line
title	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
spellingShingle	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea Fernandes, Jackson Celestino Juízes en línea Dificultad de preguntas Métricas de dificultad Métricas de complejidad Aprendizaje automático Juízes on-line Dificuldade de questões Métricas de dificuldade Métricas de complexidade Aprendizado de máquina Online Judges Questions difficulty Difficulty metrics Complexity metrics Machine Learning
title_short	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_full	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_fullStr	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_full_unstemmed	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
title_sort	Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea
author	Fernandes, Jackson Celestino
author_facet	Fernandes, Jackson Celestino Carvalho, Leandro Silva Galvão de Oliveira, David Braga Fernandes de Oliveira, Elaine Harada Teixeira de Pereira, Filipe Dwan Lauschner, Tanara
author_role	author
author2	Carvalho, Leandro Silva Galvão de Oliveira, David Braga Fernandes de Oliveira, Elaine Harada Teixeira de Pereira, Filipe Dwan Lauschner, Tanara
author2_role	author author author author author
dc.contributor.author.fl_str_mv	Fernandes, Jackson Celestino Carvalho, Leandro Silva Galvão de Oliveira, David Braga Fernandes de Oliveira, Elaine Harada Teixeira de Pereira, Filipe Dwan Lauschner, Tanara
dc.subject.por.fl_str_mv	Juízes en línea Dificultad de preguntas Métricas de dificultad Métricas de complejidad Aprendizaje automático Juízes on-line Dificuldade de questões Métricas de dificuldade Métricas de complexidade Aprendizado de máquina Online Judges Questions difficulty Difficulty metrics Complexity metrics Machine Learning
topic	Juízes en línea Dificultad de preguntas Métricas de dificultad Métricas de complejidad Aprendizaje automático Juízes on-line Dificuldade de questões Métricas de dificuldade Métricas de complexidade Aprendizado de máquina Online Judges Questions difficulty Difficulty metrics Complexity metrics Machine Learning
description	Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.
publishDate	2024
dc.date.none.fl_str_mv	2024-01-16
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Artículo extendido revisado por pares Peer-reviewed extended article Artigo estendido avaliado pelos pares
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587 10.5753/rbie.2024.3587
url	https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587
identifier_str_mv	10.5753/rbie.2024.3587
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://journals-sol.sbc.org.br/index.php/rbie/article/view/3587/2502
dc.rights.driver.fl_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0 info:eu-repo/semantics/openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Sociedade Brasileira de Computação
publisher.none.fl_str_mv	Sociedade Brasileira de Computação
dc.source.none.fl_str_mv	Revista Brasileña de Informática en la Educación; Vol. 32 (2024); 22-49 Revista Brasileira de Informática na Educação; Vol. 32 (2024); 22-49 Brazilian Journal of Computers in Education; Vol. 32 (2024); 22-49 2317-6121 1414-5685 reponame:Revista Brasileira de Informática na Educação instname:Sociedade Brasileira de Computação (SBC) instacron:SBC
instname_str	Sociedade Brasileira de Computação (SBC)
instacron_str	SBC
institution	SBC
reponame_str	Revista Brasileira de Informática na Educação
collection	Revista Brasileira de Informática na Educação
repository.name.fl_str_mv	Revista Brasileira de Informática na Educação - Sociedade Brasileira de Computação (SBC)
repository.mail.fl_str_mv	publicacoes@sbc.org.br
_version_	1832111043130687488

Complejidad versus dificultad: Un análisis de su correlación en preguntas de programación en jueces en línea

Similar Items