O uso de aprendizado de máquina para identificar alunos em risco de evasão na educação a distância

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Oliveira, Myke Morais de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.furg.br/handle/1/9858
Resumo: Identificar alunos em risco de evasão tornou-se um importante objeto de pesquisa, visto que é um problema que ocasiona danos sociais, acadêmicos e financeiros. Diante desse cenário, surgiram diversas pesquisas na literatura que propõem soluções para ajudar na identificação prévia de estudantes em risco de evasão. Muitas delas utilizam algoritmos convencionais de aprendizado de máquina sobre dados educacionais, com o objetivo de detectar padrões que denunciem o perfil de um aluno que evade. No entanto, existem maneiras mais avançadas na atualidade, que poderiam explorar melhor, em termos de desempenho e qualidade, os dados educacionais para gerar um modelo preditivo mais robusto, como Deep Learning. Assim, nesta dissertação, apresentam-se duas abordagens para ajudar no processo de identificação prévia de alunos em risco de evasão. Na primeira abordagem, oito algoritmos convencionais de aprendizado de máquina foram utilizados para explorar o dataset que foi construído com dados da plataforma Moodle de dois cursos a distância, e avalia-lo no processo de modelagem preditiva. Essa abordagem resultou em dois experimentos que foram essenciais para a implementação da segunda abordagem, em que utilizou-se Deep Learning para a implementação de uma Recurrent Neural Network que, com células de LSTM em sua arquitetura, tem uma grande capacidade de aprendizagem. Com esta abordagem, realizou-se um terceiro experimento, em que pode ser observado o potencial de uma LSTM para lidar com a natureza dos dados dessa pesquisa.