Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Nascimento , Fernanda Ferreira do
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro de Ciências Exatas e Naturais - CCEN
Brasil
UFERSA
Universidade Federal Rural do Semi-Árido
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufersa.edu.br/handle/prefix/12033
Resumo: Um dos maiores desafios da educação no Brasil é a evasão estudantil. A evasão estudantil é o ato de deixar de frequentar as aulas, abandonar o ensino em decorrência de um ou mais fatores. Esse problema afeta a qualidade de ensino, impactando os âmbitos econômicos e ambientais, refletindo negativamente no desenvolvimento social. Identificar as causas da evasão estudantil, bem como detectar previamente os perfis de estudantes considerados possíveis evasores em todos os níveis de ensino, tornou-se um tema de grande interesse e tem desencadeado pesquisas nacionais e internacionais. Para tanto, objetiva-se com este trabalho, desenvolver e avaliar modelos de Machine Learning capazes de realizar a predição, de forma precoce, de estudantes com alto risco de evasão estudantil, nos cursos de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. A abordagem foi validada, utilizando dados de ex-alunos dos cursos superiores de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. Neste trabalho foram utilizadas técnicas de classificação em modelos de Machine Learning. Na validação da abordagem foram empregados sete algoritmos: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron e Support vector machine, sendo que o modelo Support vector machine obteve os melhores resultados dentre as métricas: Accuracy, Precision, Recall e F1 Score. Em relação aos resultados, observou-se que: estudantes que não ingressaram na sua primeira opção de curso, têm uma maior probabilidade de evadir-se; estudantes que não possuem um conhecimento prévio na área do seu curso, têm uma maior probabilidade de evadir-se; o maior índice de evasão ocorre no primeiro ano de curso; estudantes que reprovam em uma ou mais disciplinas no primeiro ano de curso, têm uma maior probabilidade de evadir-se; estudantes do gênero feminino têm uma maior probabilidade de evadir-se; o mesmo modelo de Machine Learning pode ser aplicado para grupos de estudantes de diferentes cursos