Estatística não-paramétrica: estimação, classificação e uma nova abordagem de seleção automática para largura de banda

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Souza, David de Melo lattes
Orientador(a): Nóbrega, Rafael Antunes lattes
Banca de defesa: Andrade Filho, Luciano Manhães de lattes, Gonzalez, Luis Fernando Gomez lattes, Campos, Marcello Luiz Rodrigues de lattes, Cerqueira, Augusto Santiago lattes
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Juiz de Fora (UFJF)
Programa de Pós-Graduação: Programa de Pós-graduação em Engenharia Elétrica
Departamento: Faculdade de Engenharia
País: Brasil
Palavras-chave em Português:
KDE
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufjf.br/jspui/handle/ufjf/11934
Resumo: Esta tese teve como motivação conhecer o estado da arte em estimação nãoparamétrica de densidade de probabilidade, avaliar as técnicas mais proeminentes encontradas em publicações científicas, compará-las em diversas situações e avaliar seu impacto em classificação utilizando verossimilhança. Para isto, foi realizado um estudo sobre a escolha automática da largura de banda, principal parâmetro utilizado pelos quatro estimadores não-paramétricos de densidade clássicos: Histograma, Average Shifted Histogram (ASH), Polígono de Frequência (PF) e Kernel Density Estimation (KDE). Em linhas gerais, o método KDE mostrou os melhores resultados em todas as distribuições testadas e devido a esse desempenho sua análise foi mais aprofundada, adentrando nas teorias do KDE com largura de banda variável. Ademais, foi percebido nos diversos testes realizados que os seletores baseados em validação-cruzada são mais resilientes do que os métodos de Plug-In (PI), levando a melhores resultados de estimação e classificação em realidades complexas. Por fim, este trabalho teve como desdobramento algumas contribuições para o estado da arte no assunto de investigação, cujas principais são elencadas a seguir: aumento do conhecimento sobre alguns dos principais estimadores não-paramétricos discutidos no mundo científico; desenvolvimento de uma técnica de avaliação de estimadores de densidade, nomeada de Region of Interest Map (RoIMap); proposta de uma técnica automática híbrida para ajustar o seletor de largura de banda variável, denominada Region of Interest-based Kernel Density Estimation (ROIKDE); e avaliação do impacto da estimação não-paramétrica em classificação de amostras.