Identificação de proteínas ribossomais em espectro de massa do tipo Maldi-Tof

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Nascimento, Rodrigo da Silva do lattes
Orientador(a): Campos Junior, Arion lattes
Banca de defesa: Cruz, Leonardo Magalhães lattes, Senger, Luciano José lattes, Siqueira, Hugo Valadares lattes, Rocha, José Carlos Ferreira da lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual de Ponta Grossa
Programa de Pós-Graduação: Programa de Pós Graduação Computação Aplicada
Departamento: Departamento de Jornalismo
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.uepg.br/jspui/handle/prefix/3013
Resumo: As proteínas ribossomais são utilizadas como biomarcadores na identificação taxonômica das bactérias encontradas nas subunidades 50S e 30S, a partir de sua expressão proteica no espectro de massa do tipo MALDI-TOF. É possível determinar o táxon bacteriano, com o confronto entre os espectros conhecidos e os desconhecidos. Possuindo aplicações em diversas áreas, como por exemplo, na agronomia na qual demandam da identificação de novos microrganismos que auxiliem no crescimento vegetal. Desta forma a identificação das proteínas ribossomais a partir das distribuições estatísticas se fez necessária. Para assim obter um modelo de reconhecimento probabilístico das possíveis proteínas ribossomais. Adiante foi necessário construir um Modelo Linear Generalizado - GLM, acompanhado do Algoritmo Genético, que se destaca pela simplicidade, robustez em solucionar problemas binários complexos e na seleção das variáveis para treinamento. Para a distinção dos melhores modelos classificatórios, foi levado em consideração o menor critério de informação de akaike - AIC. Os resultados foram 59 histogramas de proteínas ribossomais. Assim foram selecionadas oito distribuições estatísticas para o teste e um modelo mistura Laplaciano, algumas distribuições foram promissoras quando analisados pelos testes estatísticos e ainda assim, alguns dados se mostraram com diversos picos. O algoritmo genético mostrou-se favorável na busca de combinações de proteínas para o treinamento do modelo classificatório. Estas combinações geraram dois modelos, o primeiro com uma melhor acurácia e o outro mais específico com uma menor acurácia. A metodologia elaborada neste estudo apresentou como alternativa a discriminação de proteínas ribossomais a partir do classificador GLM. Palavras-chave:Algori Classificador GLM; tmo Genético; Proteínas Ribossomais; Espectros de Massa; Histogramas de proteínas; Modelos Estatísticos