Uma versão aprimorada do algoritmo de projeções sucessivas para seleção de variáveis em regressão linear múltipla

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Canova, Luciana dos Santos
Orientador(a): Gomes, Adriano de Araújo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/274079
Resumo: O algoritmo de Projeções Sucessivas (APS), também conhecido em inglês como SPA, foi desenvolvido com o propósito de selecionar um subconjunto de variáveis informativas e minimamente redundantes para a construção de modelos de regressões lineares múltiplas (MLR). Esse método visa minimizar o impacto da multicolinearidade, que é comumente presente em dados instrumentais, ao mesmo tempo em que alcança uma melhor acurácia na previsão. A combinação do APS com o MLR, como uma abordagem de seleção variável/calibração multivariada, resultou no método APS-MLR, o qual tem sido relatado na literatura como capaz de produzir modelos com boa capacidade de previsão em comparação com os modelos convencionais de "espectro completo" via mínimos quadrados parciais (PLS), em alguns casos. Neste trabalho, é proposta a adição de uma etapa de filtro (f) à versão atual do algoritmo APS, a fim de reduzir o número de variáveis não informativas antes da fase de projeção. Essa adição auxilia o algoritmo na seleção das melhores variáveis nas etapas subsequentes. O algoritmo resultante, denominado de fAPS-MLR, é avaliado em dois estudos de caso que envolvem dados de espectroscopia no infravermelho próximo: (i) quantificação do ingrediente farmacêutico ativo (IFA) em comprimidos e (ii) quantificação de biodiesel em misturas diesel/biodiesel. Comparados com o método PLS, os modelos fAPS-MLR demonstram desempenho semelhante ou superior. Além disso, os modelos fAPS-MLR superam o APS-MLR original tanto na validação cruzada quanto na previsão externa. Independentemente do algoritmo de pré-processamento testado, incluindo primeira derivada Savitzky-Golay (SG) e Standard Normal Variate (SNV), ou mesmo em dados de espectros brutos, os modelos fAPS-MLR oferecem resultados superiores.