Nova proposta de representação de genoma viral aplicada na classificação do Sars-Cov-2 com aprendizagem profunda

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Souza, Luisa Christina de
Orientador(a): Fernandes, Marcelo Augusto Costa
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/49959
Resumo: Em dezembro de 2019, o primeiro caso de COVID-19 foi observado, e em julho de 2022, já haviam 540 milhões de casos confirmados. Devido a rápida propagação do vírus, esforços vêm sendo realizados pela comunidade científica para o desenvolvimento de técnicas de classificação viral do SARS-CoV-2. Neste trabalho, foi desenvolvida uma nova proposta de representação de sequências genéticas aplicada a amostras de seis vírus da família Coronaviridae, à qual pertence o vírus SARS-CoV-2, utilizando um conjunto de técnicas de Processamento de Sinais Genômicos. A assinatura viral obtida pelo método proposto foi aplicada a uma arquitetura de aprendizagem profunda para classificação viral, obtendo uma acurácia de 98,9%, 97,9% e 99,4% para os comprimentos de vetor 64, 128 e 256, respectivamente, e obtendo uma precisão de 99,97% para os vetores com tamanho 256, demonstrando que o mapeamento proposto alcançou desempenho satisfatório com baixos custos de memória computacional e tempo de processamento. Por fim, dada a taxa de mutação de vírus de RNA, novas variantes surgiram e com elas a possibilidade de aumento de casos. Utilizando a técnica desenvolvida, foi realizada uma análise da evolução de cinco variantes de preocupação do vírus SARS-CoV-2 em dois procedimentos de classificação viral. Os resultados obtidos auxiliam na compreensão da evolução do perfil genético das variantes analisadas.