Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação

Bibliographic Details
Main Author: Souza, Juliana da Cruz
Publication Date: 2023
Format: Doctoral thesis
Language: por
Source: Repositório Institucional da UFPB
Download full: https://repositorio.ufpb.br/jspui/handle/123456789/32100
Summary: O uso da Análise Discriminante Linear (LDA) em modelagem de classificação multivariada permite a construção de modelos no domínio dos dados originais, o que possibilita a realização de inferência química direta dos resultados. Entretanto, essa técnica requer uma baixa dimensionalidade dos dados e produz modelos com problemas de generalização quando existe uma alta multicolinearidade entre as variáveis. Para superar esses problemas, o uso de algoritmos de seleção de variáveis tem se mostrado muito eficiente especialmente quando dados UV-Vis, NIR, etc, são usados. Nesse contexto, o uso de algoritmos bio-inspirados (a exemplo do algoritmo genético-GA) tem permitido a realização bem-sucedida de seleção de variáveis. No presente trabalho, propõe-se o algoritmo inspirado no comportamento dos morcegos (Bat Algorithm-BA) para a seleção de variáveis em modelagem via LDA. O algoritmo proposto, denominado aqui BA-LDA, utiliza uma função de custo associada ao risco médio de classificação incorreta (Gcost), a qual foi implementada no código do seu programa escrito em Matlab. O desempenho do BA-LDA foi avaliado em quatro estudos de caso, envolvendo o emprego de dados espectrométricos de massas (MS), NIR, UV-Vis e em dados com informação simulada. Para cada conjunto de dados analisados, os parâmetros do BA-LDA foram otimizados usando um planejamento fatorial fracionário 24-1. Os dados MS foram provenientes de análises de 216 amostras de soro de pacientes com e sem câncer de ovário. Os dados NIR foram obtidos na análise de 60 amostras de cafés pertencentes a duas classes (gourmet e tradicionais). Para obtenção de dados UV-Vis, foram registrados espectros de amostras de óleos vegetais pertencentes a quatro classes, a saber: soja, canola, milho e girassol. Para o estudo com uma classe de amostras simuladas, foram empregados dados NIR de diesel. O desempenho do BA-LDA foi comparado ao obtido com os algoritmos GA-LDA e SPA-LDA usados para seleção de variáveis e com as técnicas de análise discriminante por mínimos quadrados parciais (PLS-DA) e modelagem independente e flexível por analogia de classe (SIMCA). O algoritmo proposto selecionou 11, 3, 7 e 9 variáveis e obteve as taxas de classificação correta (TCC) de 93, 100, 100 e 100 % na classificação baseada nos dados de, respectivamente, MS, NIR, UV-Vis e da classe simulada (NIR). No conjunto de dados MS, o BA-LDA superou o desempenho do SPA-LDA (79,1 % de TCC) e GA-LDA (88.4 % de TCC ), porém foi inferior ao do algoritmo PLS-DA que apresentou 98% de TCC. Para os demais conjuntos de dados, a performance do BA-LDA foi comparável ao desempenho dos algoritmos clássicos. Em todos os estudos de caso, o BA-LDA superou o desempenho do SIMCA. Ademais, o BA-LDA se mostrou menos susceptível ao ruído adicionado aos espectros das amostras de teste do conjunto de dados simulados. Visto que o BA-LDA é estocástico, seu principal diferencial é a convergência e robustez que demonstrou em todos os conjuntos de dados, nos quais as variáveis selecionadas possibilitaram uma interpretação química segura.
id UFPB-2_8bb888745571562b2e7b26c128eb3d0c
oai_identifier_str oai:repositorio.ufpb.br:123456789/32100
network_acronym_str UFPB-2
network_name_str Repositório Institucional da UFPB
repository_id_str 2546
spelling 2024-10-08T16:35:35Z2023-04-112024-10-08T16:35:35Z2023-03-03https://repositorio.ufpb.br/jspui/handle/123456789/32100O uso da Análise Discriminante Linear (LDA) em modelagem de classificação multivariada permite a construção de modelos no domínio dos dados originais, o que possibilita a realização de inferência química direta dos resultados. Entretanto, essa técnica requer uma baixa dimensionalidade dos dados e produz modelos com problemas de generalização quando existe uma alta multicolinearidade entre as variáveis. Para superar esses problemas, o uso de algoritmos de seleção de variáveis tem se mostrado muito eficiente especialmente quando dados UV-Vis, NIR, etc, são usados. Nesse contexto, o uso de algoritmos bio-inspirados (a exemplo do algoritmo genético-GA) tem permitido a realização bem-sucedida de seleção de variáveis. No presente trabalho, propõe-se o algoritmo inspirado no comportamento dos morcegos (Bat Algorithm-BA) para a seleção de variáveis em modelagem via LDA. O algoritmo proposto, denominado aqui BA-LDA, utiliza uma função de custo associada ao risco médio de classificação incorreta (Gcost), a qual foi implementada no código do seu programa escrito em Matlab. O desempenho do BA-LDA foi avaliado em quatro estudos de caso, envolvendo o emprego de dados espectrométricos de massas (MS), NIR, UV-Vis e em dados com informação simulada. Para cada conjunto de dados analisados, os parâmetros do BA-LDA foram otimizados usando um planejamento fatorial fracionário 24-1. Os dados MS foram provenientes de análises de 216 amostras de soro de pacientes com e sem câncer de ovário. Os dados NIR foram obtidos na análise de 60 amostras de cafés pertencentes a duas classes (gourmet e tradicionais). Para obtenção de dados UV-Vis, foram registrados espectros de amostras de óleos vegetais pertencentes a quatro classes, a saber: soja, canola, milho e girassol. Para o estudo com uma classe de amostras simuladas, foram empregados dados NIR de diesel. O desempenho do BA-LDA foi comparado ao obtido com os algoritmos GA-LDA e SPA-LDA usados para seleção de variáveis e com as técnicas de análise discriminante por mínimos quadrados parciais (PLS-DA) e modelagem independente e flexível por analogia de classe (SIMCA). O algoritmo proposto selecionou 11, 3, 7 e 9 variáveis e obteve as taxas de classificação correta (TCC) de 93, 100, 100 e 100 % na classificação baseada nos dados de, respectivamente, MS, NIR, UV-Vis e da classe simulada (NIR). No conjunto de dados MS, o BA-LDA superou o desempenho do SPA-LDA (79,1 % de TCC) e GA-LDA (88.4 % de TCC ), porém foi inferior ao do algoritmo PLS-DA que apresentou 98% de TCC. Para os demais conjuntos de dados, a performance do BA-LDA foi comparável ao desempenho dos algoritmos clássicos. Em todos os estudos de caso, o BA-LDA superou o desempenho do SIMCA. Ademais, o BA-LDA se mostrou menos susceptível ao ruído adicionado aos espectros das amostras de teste do conjunto de dados simulados. Visto que o BA-LDA é estocástico, seu principal diferencial é a convergência e robustez que demonstrou em todos os conjuntos de dados, nos quais as variáveis selecionadas possibilitaram uma interpretação química segura.The use of Linear Discriminant Analysis (LDA) in multivariate classification modeling allows the construction of models in the domain of the original data, in which a direct chemical inference of the results may be accomplished. However, this technique requires a low dimensionality of the data and produces models with generalization problems when there is a high multicollinearity among the variables. To overcome these drawbacks, the use of variable selection algorithms has proved to be very efficient especially when UV-Vis, NIR, etc, data are used. In this context, bio-inspired algorithms (such as the genetic algorithm-GA) have allowed the successful selection of variables. In the present work, a bat-inspired algorithm (BA) for selection variables in modeling via LDA is proposed. This algorithm, here named BA-LDA, uses a cost function associated with the average risk of misclassification (Gcost), which was implemented in its code written in Matlab. The performance of BA-LDA was evaluated in four case studies, involving the use of mass spectrometric (MS), NIR, and UV-Vis data, as well as a dataset with simulated information. For each analyzed dataset, the BA-LDA parameters were optimized using a 24-1 fractional factorial design. MS data were resulting of analyzes of 216 serum samples from patients with and without ovarian cancer. The NIR data were acquired in analysis of 60 coffee samples belonging to two classes (gourmet and traditional). UV-Vis data were obtained from recorded spectra of vegetable oil samples belonging to four classes, namely: soybean, canola, corn and sunflower. For the study with a class of simulated samples, diesel NIR data were employed. The performance of BA-LDA was compared to those obtained with the GA-LDA and SPA-LDA algorithms used for variable selection; it was also compared to the partial least squares discriminant analysis (PLS-DA) and independent and flexible modeling by class analogy (SIMCA). The proposed algorithm selected 11, 3, 7 and 9 variables and obtained correct classification rates (TCC %) of 93, 100, 100 and 100% in the classification based on data from MS, NIR, UV-Vis and of the simulated class (NIR). In the case of MS data, BA-LDA outperformed SPA-LDA (79.1% TCC) and GA-LDA (88.4% TCC), but was lower than the PLS-DA algorithm that showed a TCC of 98%. For the other datasets, the BA-LDA performance was comparable to the classical algorithms. In all case studies, BA-LDA outperformed SIMCA. Furthermore, the BA-LDA proved to be less susceptible to noise added to the spectra of the test samples from the simulated dataset. Since the BA-LDA is stochastic, its main differential is the convergence and robustness that it demonstrated in all data sets, in which the selected variables allowed a safe chemical interpretation.Submitted by Fernando Augusto Alves Vieira (fernandovieira@biblioteca.ufpb.br) on 2024-10-08T16:35:35Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) JulianaDaCruzSouza_Tese.pdf: 4784903 bytes, checksum: 8fc6ed99a6934873f03e509e8d1a4798 (MD5)Made available in DSpace on 2024-10-08T16:35:35Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) JulianaDaCruzSouza_Tese.pdf: 4784903 bytes, checksum: 8fc6ed99a6934873f03e509e8d1a4798 (MD5) Previous issue date: 2023-03-03Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESporUniversidade Federal da ParaíbaPrograma de Pós-Graduação em QuímicaUFPBBrasilQuímicaAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAQuímica analíticaBioinspiraçãoAnálise discriminante linearClassificação multivariadaAnalytical chemistryBiospirationLinear discriminant analysisMultivariate classificationAlgoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisSilva, Edvan Cirino dahttp://lattes.cnpq.br/1777102714370218Soares, Sófacles Figueredo Carreirohttp://lattes.cnpq.br/765320733438566610423138499http://lattes.cnpq.br/0664393800086445Souza, Juliana da Cruzreponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPBTEXTJulianaDaCruzSouza_Tese.pdf.txtJulianaDaCruzSouza_Tese.pdf.txtExtracted texttext/plain241126https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/4/JulianaDaCruzSouza_Tese.pdf.txtf1f3fc4cca33b90616f45cdbfb17c163MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82390https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/3/license.txte20ac18e101915e6935b82a641b985c0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/2/license_rdfc4c98de35c20c53220c07884f4def27cMD52ORIGINALJulianaDaCruzSouza_Tese.pdfJulianaDaCruzSouza_Tese.pdfapplication/pdf4784903https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/1/JulianaDaCruzSouza_Tese.pdf8fc6ed99a6934873f03e509e8d1a4798MD51123456789/321002024-10-09 03:04:58.218oai:repositorio.ufpb.br:123456789/32100QVVUT1JJWkHDh8ODTyBFIExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBdXRvcml6byBlIGVzdG91IGRlIGFjb3JkbywgbmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbyBhdXRvLWRlcG9zaXRhZGEsIGNvbmZvcm1lIExlaSBuwrogOTYxMC85OCwgb3Mgc2VndWludGVzIHRlcm1vczoKIApEYSBEaXN0cmlidWnDp8OjbyBuw6NvLWV4Y2x1c2l2YSAKTyBhdXRvciBkZWNsYXJhIHF1ZTogCmEpIE8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0ZSB0ZXJtby4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuIApiKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0ZSB0ZXJtbywgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IGNvbnRlw7pkbyBkbyB0cmFiYWxobyBlbnRyZWd1ZS4gCmMpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCmQpIENvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBvIGRpcmVpdG8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIsIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KZSkgVm9jw6ogY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgcHVibGljYcOnw6NvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgpmKSBWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKRG9zIEVtYmFyZ29zIGUgUmVzdHJpw6fDtWVzIGRlIEFjZXNzbwpPIGVtYmFyZ28gcG9kZXLDoSBzZXIgbWFudGlkbyBwb3IgYXTDqSAxICh1bSkgYW5vLCBwb2RlbmRvIHNlciBwcm9ycm9nYWRvIHBvciBpZ3VhbCBwZXLDrW9kbywgY29tIGEgbmVjZXNzaWRhZGUgZGUgYW5leGFyIGRvY3VtZW50b3MgY29tcHJvYmF0w7NyaW9zLiBPIHJlc3VtbyBlIG9zIG1ldGFkYWRvcyBkZXNjcml0aXZvcyBzZXLDo28gZGlzcG9uaWJpbGl6YWRvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCLgpPIGRlcMOzc2l0byBkbyB0cmFiYWxobyDDqSBvYnJpZ2F0w7NyaW8sIGluZGVwZW5kZW50ZSBkbyBlbWJhcmdvLgpRdWFuZG8gZW1iYXJnYWRvLCBvIHRyYWJhbGhvIHBlcm1hbmVjZXLDoSBpbmRpc3BvbsOtdmVsIGVucXVhbnRvIHZpZ29yYXIgYXMgcmVzdHJpw6fDtWVzLiBQYXNzYWRvIG8gcGVyw61vZG8gZG8gZW1iYXJnbywgbyB0cmFiYWxobyBzZXLDoSBhdXRvbWF0aWNhbWVudGUgZGlzcG9uaWJpbGl6YWRvIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEIuIAo=Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.bropendoar:25462024-10-09T06:04:58Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.pt_BR.fl_str_mv Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
title Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
spellingShingle Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
Souza, Juliana da Cruz
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
Química analítica
Bioinspiração
Análise discriminante linear
Classificação multivariada
Analytical chemistry
Biospiration
Linear discriminant analysis
Multivariate classification
title_short Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
title_full Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
title_fullStr Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
title_full_unstemmed Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
title_sort Algoritmo inspirado nos morcegos para seleção de variáveis em problemas de classificação
author Souza, Juliana da Cruz
author_facet Souza, Juliana da Cruz
author_role author
dc.contributor.advisor1.fl_str_mv Silva, Edvan Cirino da
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1777102714370218
dc.contributor.advisor-co1.fl_str_mv Soares, Sófacles Figueredo Carreiro
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/7653207334385666
dc.contributor.authorID.fl_str_mv 10423138499
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0664393800086445
dc.contributor.author.fl_str_mv Souza, Juliana da Cruz
contributor_str_mv Silva, Edvan Cirino da
Soares, Sófacles Figueredo Carreiro
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
Química analítica
Bioinspiração
Análise discriminante linear
Classificação multivariada
Analytical chemistry
Biospiration
Linear discriminant analysis
Multivariate classification
dc.subject.por.fl_str_mv Química analítica
Bioinspiração
Análise discriminante linear
Classificação multivariada
Analytical chemistry
Biospiration
Linear discriminant analysis
Multivariate classification
description O uso da Análise Discriminante Linear (LDA) em modelagem de classificação multivariada permite a construção de modelos no domínio dos dados originais, o que possibilita a realização de inferência química direta dos resultados. Entretanto, essa técnica requer uma baixa dimensionalidade dos dados e produz modelos com problemas de generalização quando existe uma alta multicolinearidade entre as variáveis. Para superar esses problemas, o uso de algoritmos de seleção de variáveis tem se mostrado muito eficiente especialmente quando dados UV-Vis, NIR, etc, são usados. Nesse contexto, o uso de algoritmos bio-inspirados (a exemplo do algoritmo genético-GA) tem permitido a realização bem-sucedida de seleção de variáveis. No presente trabalho, propõe-se o algoritmo inspirado no comportamento dos morcegos (Bat Algorithm-BA) para a seleção de variáveis em modelagem via LDA. O algoritmo proposto, denominado aqui BA-LDA, utiliza uma função de custo associada ao risco médio de classificação incorreta (Gcost), a qual foi implementada no código do seu programa escrito em Matlab. O desempenho do BA-LDA foi avaliado em quatro estudos de caso, envolvendo o emprego de dados espectrométricos de massas (MS), NIR, UV-Vis e em dados com informação simulada. Para cada conjunto de dados analisados, os parâmetros do BA-LDA foram otimizados usando um planejamento fatorial fracionário 24-1. Os dados MS foram provenientes de análises de 216 amostras de soro de pacientes com e sem câncer de ovário. Os dados NIR foram obtidos na análise de 60 amostras de cafés pertencentes a duas classes (gourmet e tradicionais). Para obtenção de dados UV-Vis, foram registrados espectros de amostras de óleos vegetais pertencentes a quatro classes, a saber: soja, canola, milho e girassol. Para o estudo com uma classe de amostras simuladas, foram empregados dados NIR de diesel. O desempenho do BA-LDA foi comparado ao obtido com os algoritmos GA-LDA e SPA-LDA usados para seleção de variáveis e com as técnicas de análise discriminante por mínimos quadrados parciais (PLS-DA) e modelagem independente e flexível por analogia de classe (SIMCA). O algoritmo proposto selecionou 11, 3, 7 e 9 variáveis e obteve as taxas de classificação correta (TCC) de 93, 100, 100 e 100 % na classificação baseada nos dados de, respectivamente, MS, NIR, UV-Vis e da classe simulada (NIR). No conjunto de dados MS, o BA-LDA superou o desempenho do SPA-LDA (79,1 % de TCC) e GA-LDA (88.4 % de TCC ), porém foi inferior ao do algoritmo PLS-DA que apresentou 98% de TCC. Para os demais conjuntos de dados, a performance do BA-LDA foi comparável ao desempenho dos algoritmos clássicos. Em todos os estudos de caso, o BA-LDA superou o desempenho do SIMCA. Ademais, o BA-LDA se mostrou menos susceptível ao ruído adicionado aos espectros das amostras de teste do conjunto de dados simulados. Visto que o BA-LDA é estocástico, seu principal diferencial é a convergência e robustez que demonstrou em todos os conjuntos de dados, nos quais as variáveis selecionadas possibilitaram uma interpretação química segura.
publishDate 2023
dc.date.available.fl_str_mv 2023-04-11
2024-10-08T16:35:35Z
dc.date.issued.fl_str_mv 2023-03-03
dc.date.accessioned.fl_str_mv 2024-10-08T16:35:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/32100
url https://repositorio.ufpb.br/jspui/handle/123456789/32100
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Química
dc.publisher.initials.fl_str_mv UFPB
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Química
publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Repositório Institucional da UFPB
collection Repositório Institucional da UFPB
bitstream.url.fl_str_mv https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/4/JulianaDaCruzSouza_Tese.pdf.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/3/license.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/2/license_rdf
https://repositorio.ufpb.br/jspui/bitstream/123456789/32100/1/JulianaDaCruzSouza_Tese.pdf
bitstream.checksum.fl_str_mv f1f3fc4cca33b90616f45cdbfb17c163
e20ac18e101915e6935b82a641b985c0
c4c98de35c20c53220c07884f4def27c
8fc6ed99a6934873f03e509e8d1a4798
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br
_version_ 1833858258561925120