Análise de desempenho de modelos de aprendizagem de máquina na classificação de séries temporais dos compostos voláteis fúngicos
Ano de defesa: | 2023 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufpe.br/handle/123456789/55248 |
Resumo: | Fungos são organismos essenciais para garantir a manutenção da vida no meio am- biente. Leveduras do gênero Candida fazem parte da microbiota do corpo humano, colo- nizando a pele e mucosas dos tratos digestivo e urinário, bucal e vaginal. Em condições normais, a maioria não causa danos ao indivíduo, entretanto, esses mesmos fungos podem apresentar características patogênicas. Atualmente, existem cerca de duzentas espécies do gênero Candida, no entanto, pouco mais de vinte são nocivas ao homem. O principal fator do desenvolvimento de infecções por essas leveduras, ocorre pelo rompimento do equilí- brio parasita-hospedeiro, desencadeado por alterações na barreira tecidual, alterações na microbiota normal e pelo comprometimento do sistema imunológico. Esse desequilíbrio pode causar desde doenças superficiais até invasivas, e, principalmente em hospedeiros debilitados, pode ser fatal. Dado a criticidade das infecções causadas por esses fungos, a identificação fúngica é fundamental para um tratamento eficaz. Métodos alternativos vêm sendo estudados e desenvolvidos com o objetivo de aliar a entrega de um resultado rápido e preciso a um baixo custo, e que não precise de um conhecimento especializado para operá-los. Uma tecnologia que se destaca entre esses métodos é a dos narizes eletrônicos (e-nose). Os dados produzidos por esses instrumentos, normalmente, possuem caracterís- ticas complexas. Dessa forma, o objetivo deste trabalho é buscar por métodos e técnicas satisfatórios com menores custos computacionais, especificamente o tempo de processa- mento, para o processo de identificação das espécies de fungos Candida. Neste estudo, a metodologia envolveu a coleta de amostras de compostos orgânicos voláteis (COVs) emi- tidos por seis espécies do gênero Candida usando um nariz eletrônico. Os dados gerados foram submetidos a um processo de pré-processamento, incluindo técnicas de remoção de características de baixa variância e recursos altamente correlacionados. Em seguida, aplicou-se uma técnica de redução de dimensão chamada UMAP para melhorar a sepa- ração das classes. Cinco classificadores baseados em séries temporais foram treinados e avaliados usando validação cruzada. Os resultados foram analisados para avaliar o desem- penho e a eficácia das técnicas utilizadas na identificação das espécies. O estudo abrangeu três experimentos, demonstrando a evolução das técnicas e o desempenho dos classifica- dores em cada estágio. O tempo de processamento e as métricas de desempenho, como acurácia, sensibilidade e precisão, foram usados para avaliar o sucesso da metodologia. No geral, o classificador TimeSeries Forest obteve os melhores resultados com a acurácia, sensibilidade de precisão de 100% e um tempo de processamento de 0.58 segundos. Como trabalhos futuros tem-se a expansão e a diversificação das espécies de leveduras clínicas do gênero Candida utilizadas para estudo, visando cobrir uma gama mais ampla de pro- blemas e patologias, além disso, a criação e utilização de um ambiente controlado para realização de novos experimentos, a fim de minimizar erros causados por fatores externos. |