Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Coutinho, Maria Gracielly Fernandes |
Orientador(a): |
Fernandes, Marcelo Augusto Costa |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
|
Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Área do conhecimento CNPq: |
|
Link de acesso: |
https://repositorio.ufrn.br/handle/123456789/57359
|
Resumo: |
Desde dezembro de 2019, o mundo foi severamente afetado pela pandemia de COVID19, ocasionada pelo vírus SARS-CoV-2. Em casos como este de nova identificação viral, a elucidação precoce da classificação taxonômica e origem dos genomas de vírus são essenciais para planejamento, contenção e tratamentos. As técnicas de Aprendizagem Profunda vêm sendo utilizadas com sucesso em diversos problemas de classificação viral, associadas ao diagnóstico de infecções virais, metagenômica, análise filogenética, entre outros. Considerando esta motivação, este trabalho tem como proposta gerar um eficaz classificador do genoma viral direcionado ao vírus SARS-CoV-2, utilizando a técnica de Aprendizagem Profunda baseada em Stacked Sparse Autoencoder (SSAE). Para o melhor desempenho do modelo, exploramos a utilização de representações de imagens das sequências completas do genoma como entrada do SSAE para fornecer a classificação do vírus SARS-CoV-2. Para isso, foram explorados dois conjuntos de dados: utilizando representações de imagens baseadas em k-mers e utilizando representações de imagens basedas em Chaos Game Repesentation (CGR). O conjunto de dados composto por representações de imagens baseadas em k-mers foi aplicado nos experimentos de classificação em diferentes níveis de taxonomia do vírus SARS-CoV-2, enquanto o conjunto de dados baseado em imagens CGR foi aplicado nos experimentos de classificação das variantes de preocupação do SARS-CoV-2. Para os experimentos de classificação taxonômica, a técnica SSAE forneceu ótimos resultados, alcançando acurácias entre 92% e 100% para o conjunto de validação, e entre 98.9% e 100% de acurácia para o conjunto de teste, que aplicou amostras do SARS-CoV-2. Isto indica que o nosso modelo pode ser adaptado para classificar outros vírus emergentes. Para os experimentos de classificação das variantes do SARS-CoV-2 utilizando imagens CGR, a técnica SSAE proporcionou resultados ainda melhores, alcançando acurácia de classificação de 99,9% para o conjunto de validação e 99,8% para o conjunto de teste. Por fim, os resultados indicaram a aplicabilidade desta técnica de aprendizagem profunda em problemas de classificação de genomas. |