Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Oyama, Luiz Otávio lattes
Orientador(a): Etto, Rafael Mazer lattes
Banca de defesa: Rocha, José Carlos Ferreira da lattes, Leite, Wellington Claiton lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual de Ponta Grossa
Programa de Pós-Graduação: Programa de Pós Graduação Computação Aplicada
Departamento: Departamento de Informática
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.uepg.br/jspui/handle/prefix/4059
Resumo: A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.