Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Centro de Ciências Exatas e Naturais - CCEN
Brasil UFERSA Universidade Federal Rural do Semi-Árido Programa de Pós-Graduação em Ciência da Computação |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufersa.edu.br/handle/prefix/12033 |
Resumo: | Um dos maiores desafios da educação no Brasil é a evasão estudantil. A evasão estudantil é o ato de deixar de frequentar as aulas, abandonar o ensino em decorrência de um ou mais fatores. Esse problema afeta a qualidade de ensino, impactando os âmbitos econômicos e ambientais, refletindo negativamente no desenvolvimento social. Identificar as causas da evasão estudantil, bem como detectar previamente os perfis de estudantes considerados possíveis evasores em todos os níveis de ensino, tornou-se um tema de grande interesse e tem desencadeado pesquisas nacionais e internacionais. Para tanto, objetiva-se com este trabalho, desenvolver e avaliar modelos de Machine Learning capazes de realizar a predição, de forma precoce, de estudantes com alto risco de evasão estudantil, nos cursos de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. A abordagem foi validada, utilizando dados de ex-alunos dos cursos superiores de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. Neste trabalho foram utilizadas técnicas de classificação em modelos de Machine Learning. Na validação da abordagem foram empregados sete algoritmos: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron e Support vector machine, sendo que o modelo Support vector machine obteve os melhores resultados dentre as métricas: Accuracy, Precision, Recall e F1 Score. Em relação aos resultados, observou-se que: estudantes que não ingressaram na sua primeira opção de curso, têm uma maior probabilidade de evadir-se; estudantes que não possuem um conhecimento prévio na área do seu curso, têm uma maior probabilidade de evadir-se; o maior índice de evasão ocorre no primeiro ano de curso; estudantes que reprovam em uma ou mais disciplinas no primeiro ano de curso, têm uma maior probabilidade de evadir-se; estudantes do gênero feminino têm uma maior probabilidade de evadir-se; o mesmo modelo de Machine Learning pode ser aplicado para grupos de estudantes de diferentes cursos |