Detalhes bibliográficos
Ano de defesa: |
2021 |
Autor(a) principal: |
Costa, Alexandre Gomes da |
Orientador(a): |
Mattos, Júlio Carlos Balzano de |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pelotas
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Computação
|
Departamento: |
Centro de Desenvolvimento Tecnológico
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Área do conhecimento CNPq: |
|
Link de acesso: |
http://guaiaca.ufpel.edu.br/handle/prefix/7716
|
Resumo: |
Os sistemas de gestão para educação armazenam uma grande quantidade de dados oriundos de diversas modalidades de interação entre alunos e professores, mas também entre os alunos e o ambiente educacional. Analisar e encontrar padrões nesta quantidade de dados manualmente é inviável, por isso a utilização de Mineração de Dados Educacionais (MDE) é largamente utilizada. Este trabalho apresenta modelos de predição de alunos em risco de evasão usando apenas os dados dos três primeiros semestres cursados pelos alunos (N=1514) no curso de Ciência da Computação e alunos (N=6351) de doze cursos de Engenharia da Universidade Federal de Pelotas (UFPel). Ambos conjuntos de dados utilizaram os mesmos atributos, que foi no total de 22 atributos entre socio-econômicos e acadêmicos. Neste trabalho é utilizada a metodologia CRISP-DM e os dados extraídos no sistema acadêmico da UFPel (Cobalto). Foram selecionados Para as duas bases de dados (Ciência da Computação e Engenharias) são apresentados resultados para cinco algoritmos de predição. Para o curso de Ciência da Computação, o melhor resultado foi com o modelo de Regressão Logística que obteve um precisão de 90,16% e uma revocação de 90,34%. Já para os doze cursos de Engenharia, o resultado obtido para o modelo de Floresta Aleatória foi de uma precisão de 83,40% e uma revocação de 79,48%. Em ambas as bases de dados os resultados indicam que é possível criar um modelo de predição utilizando apenas os dados dos três primeiros semestres. |