Detalhes bibliográficos
Ano de defesa: |
2024 |
Autor(a) principal: |
Leite, Débora Pompilio |
Orientador(a): |
Anzanello, Michel José |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Palavras-chave em Inglês: |
|
Link de acesso: |
http://hdl.handle.net/10183/289502
|
Resumo: |
A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos. |