Previsão de evasão universitária com aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: MALERBA, Adriano lattes
Orientador(a): MORAES, Carlos Henrique Valério de lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Itajubá
Programa de Pós-Graduação: Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
Departamento: IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.unifei.edu.br/jspui/handle/123456789/4072
Resumo: A evasão de alunos é um problema que afeta as instituições de ensino superior no mundo todo, tendo impactos negativos tanto para os alunos quanto para as instituições, sejam elas públicas ou privadas. É essencial, que as instituições tenham ferramentas que os auxiliem no controle da evasão, proporcionando aos gestores a compreensão das expectativas educacionais dos alunos que ingressam no ensino superior, a fim de aprimorar a compreensão desse fenômeno. Os estudos recentes sobre previsão de evasão universitária utilizando aprendizado de máquina representa um avanço significativo na área da educação. Ao empregar a Técnica de Validação Cruzada (K-Fold) juntamente com uma variedade de algoritmos de classificação, como árvores de decisão, regressão logística, floresta aletória e máquinas de vetores de suporte, entre outros. Este trabalho busca entender e antecipar os padrões de evasão entre os alunos. Essa abordagem não apenas identifica fatores de risco para a evasão, mas também fornece informações valiosas para instituições educacionais no desenvolvimento de estratégias proativas de retenção de alunos. Ao prever com precisão a probabilidade de um estudante abandonar seus estudos, as universidades podem intervir precocemente, oferecendo suporte personalizado e recursos adicionais para ajudar os alunos a superar desafios acadêmicos e pessoais.Para isso, em relação ao modelo de recuperação dos alunos as técnicas LogisticRegression, GradientBoosting e XG Boost obtiveram resultados semelhantes e promissores, acima de 90% para F1-Score de formando e F1-score de evasão próximo a 89%. Já para os casos de algoritmos interpretáveis, modelo para desligamento de Alunos, os melhores resultados foram para os modelos Random Forest e Decision Tree com valores de 91% para F1-Score de Formando, 84% para F1-score de evasão. Este trabalho representa uma contribuição significativa para a melhoria da qualidade e da eficácia dos programas educacionais, promovendo a retenção e o sucesso dos alunos universitários.