Detalhes bibliográficos
Ano de defesa: |
2017 |
Autor(a) principal: |
SILVA FILHO, Rogério Luiz Cardoso |
Orientador(a): |
ADEODATO, Paulo Jorge Leitão |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/28008
|
Resumo: |
O Ensino Médio brasileiro vem, ao longo dos anos, passando por constantes debates acerca dos seus problemas de acesso e permanência, qualidade do ensino e ate mesmo da sua identidade. O crescimento da oferta da educação profissional integrada ao ensino médio protagonizada pelos Institutos Federais (IFs), criados em 2008, vem trazendo resultados interessantes diante dos grandes investimentos do Governo Federal. Dessa forma, novos mecanismos que subsidiem gestores no processo de tomada de decisão e na avaliação do binômio “oferta-qualidade” dessas instituições tornam-se cada vez mais necessários. Esta dissertação, considerando o papel avaliativo do Exame Nacional do Ensino Médio (ENEM), apresenta uma solução de mineração de dados em um processo de Knowledge Discovery in Databases (KDD) para predição e estimação do desempenho dos alunos do Ensino Médio dos IFs. Para a extração do conhecimento, foi utilizado o método baseado em etapas CRoss-Industry Standard Process for Data Mining (CRISP-DM) aliado as ideias do framework Domain-Driven Data Mining (D3M), visando a produção de resultados mais amigáveis aos especialistas do domínio. As bases de dados do ENEM e as do Censo escolar foram integradas para a formação de um data-mart apresentado no grao aluno. Apos a interpretação e modelagem do problema, os dados foram preparados para diferentes técnicas de Inteligência Artificial; inserindo, modificando, preenchendo e excluindo variáveis através de informações de contexto. A etapa de transformação contou ainda com um procedimento supervisionado de redução de dimensionalidade que considerou a taxa de valores ausentes, variância e a correlação entre as variáveis independentes. Na construção dos modelos, a técnica de regressão logística produziu índices de propensão de sucesso dos alunos e atingiu resultados superiores a 0,84 e 0,51 para as métricas AUC_ROC e KS2_MAX, respectivamente. Para a extração do conhecimento em linguagem natural, arvores de decisão construíram condições sequenciais e regras foram geradas por meio de indução baseada em escores. Essas técnicas foram avaliadas quanto as métricas: confiança, suporte e lift. Ao final, concluiu-se que a abordagem apresentada (Domain-Driven Data Mining) teve um ótimo resultado na modelagem e na validação de politicas publicas. |