Desenvolvimento de pipeline para análise de amplicons

Detalhes bibliográficos
Autor(a) principal: Bini, Aline Mara Rudsit
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/36550
Resumo: The application of computational tools in the field of molecular biology began in the last century, however it was in the 21st century that its high momentum came about. This is mainly due to the increase in data available for analysis, coming from the New Generation Sequencing (NGS), which made genomic sequencing cheaper and more efficient. In 2011, the annual global sequencing capacity reached 13 quadrillion nitrogen bases. Amid so much data generated, it is necessary to develop technological applications to extract useful information to be applied in research. In this work, a pipeline was developed to analyze amplicons based on an existing project. The code was refactored in order to make it scalable and portable, thus contributing to the bioinformatics community. For this, modern and well-respected tools were used to manipulate the pipeline, containerization, versioning and sharing: Nextflow, Docker and GitHub.
id UTFPR-12_415e21bfcd8f5cbaee6ac3667a7d43b2
oai_identifier_str oai:repositorio.utfpr.edu.br:1/36550
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Desenvolvimento de pipeline para análise de ampliconsBioinformáticaSojaGenética vegetalBioinformaticsSoybeanPlant geneticsCNPQ::ENGENHARIASThe application of computational tools in the field of molecular biology began in the last century, however it was in the 21st century that its high momentum came about. This is mainly due to the increase in data available for analysis, coming from the New Generation Sequencing (NGS), which made genomic sequencing cheaper and more efficient. In 2011, the annual global sequencing capacity reached 13 quadrillion nitrogen bases. Amid so much data generated, it is necessary to develop technological applications to extract useful information to be applied in research. In this work, a pipeline was developed to analyze amplicons based on an existing project. The code was refactored in order to make it scalable and portable, thus contributing to the bioinformatics community. For this, modern and well-respected tools were used to manipulate the pipeline, containerization, versioning and sharing: Nextflow, Docker and GitHub.A aplicação de ferramentas computacionais na área da biologia molecular teve seu início no século passado, entretanto foi no século 21 que sucedeu seu elevado impulsionamento. Isto se deve principalmente ao aumento de dados disponíveis para análise, provindos do Sequenciamento de Nova Geração (NGS), o qual tornou mais barato e eficiente o sequenciamento genômico. No ano de 2011, a capacidade global anual de sequenciamento chegou a 13 quadrilhões de bases nitrogenadas. Em meio a tantos dados gerados, torna-se necessário o desenvolvimento de aplicações tecnológicas para extrair informações úteis a serem aplicadas em pesquisas. Neste trabalho, foi desenvolvido um pipeline para análise de amplicons baseado em um projeto já existente. O código foi refatorado a fim de torná-lo escalonável e portátil, contribuindo assim para a comunidade de bioinformática. Para isto, foram utilizadas ferramentas modernas e bem conceituadas para manipulação do pipeline, conteinerização, versionamento e compartilhamento: Nextflow, Docker e GitHub.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilEngenharia da ComputaçãoUTFPRKashiwabara, André YoshiakiKashiwabara, André YoshiakiPaschoal, Alexandre RossiVicente, Fábio Fernandes da RochaBini, Aline Mara Rudsit2025-04-16T11:08:28Z2025-04-16T11:08:28Z2021-05-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfBINI, Aline Mara Rudsit. Desenvolvimento de pipeline para análise de amplicons. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/36550porAttribution-NonCommercial 4.0 Internationalhttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-04-17T06:11:06Zoai:repositorio.utfpr.edu.br:1/36550Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-04-17T06:11:06Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Desenvolvimento de pipeline para análise de amplicons
title Desenvolvimento de pipeline para análise de amplicons
spellingShingle Desenvolvimento de pipeline para análise de amplicons
Bini, Aline Mara Rudsit
Bioinformática
Soja
Genética vegetal
Bioinformatics
Soybean
Plant genetics
CNPQ::ENGENHARIAS
title_short Desenvolvimento de pipeline para análise de amplicons
title_full Desenvolvimento de pipeline para análise de amplicons
title_fullStr Desenvolvimento de pipeline para análise de amplicons
title_full_unstemmed Desenvolvimento de pipeline para análise de amplicons
title_sort Desenvolvimento de pipeline para análise de amplicons
author Bini, Aline Mara Rudsit
author_facet Bini, Aline Mara Rudsit
author_role author
dc.contributor.none.fl_str_mv Kashiwabara, André Yoshiaki
Kashiwabara, André Yoshiaki
Paschoal, Alexandre Rossi
Vicente, Fábio Fernandes da Rocha
dc.contributor.author.fl_str_mv Bini, Aline Mara Rudsit
dc.subject.por.fl_str_mv Bioinformática
Soja
Genética vegetal
Bioinformatics
Soybean
Plant genetics
CNPQ::ENGENHARIAS
topic Bioinformática
Soja
Genética vegetal
Bioinformatics
Soybean
Plant genetics
CNPQ::ENGENHARIAS
description The application of computational tools in the field of molecular biology began in the last century, however it was in the 21st century that its high momentum came about. This is mainly due to the increase in data available for analysis, coming from the New Generation Sequencing (NGS), which made genomic sequencing cheaper and more efficient. In 2011, the annual global sequencing capacity reached 13 quadrillion nitrogen bases. Amid so much data generated, it is necessary to develop technological applications to extract useful information to be applied in research. In this work, a pipeline was developed to analyze amplicons based on an existing project. The code was refactored in order to make it scalable and portable, thus contributing to the bioinformatics community. For this, modern and well-respected tools were used to manipulate the pipeline, containerization, versioning and sharing: Nextflow, Docker and GitHub.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-11
2025-04-16T11:08:28Z
2025-04-16T11:08:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BINI, Aline Mara Rudsit. Desenvolvimento de pipeline para análise de amplicons. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
http://repositorio.utfpr.edu.br/jspui/handle/1/36550
identifier_str_mv BINI, Aline Mara Rudsit. Desenvolvimento de pipeline para análise de amplicons. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/36550
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial 4.0 International
http://creativecommons.org/licenses/by-nc/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial 4.0 International
http://creativecommons.org/licenses/by-nc/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Engenharia da Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Engenharia da Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850497847049322496