Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Leite, Débora Pompilio
Orientador(a): Anzanello, Michel José
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/289502
Resumo: A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos.