Ferramenta de extração de características de sequências biológicas

Bibliographic Details
Main Author: Gregorio, Vitor
Publication Date: 2021
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Download full: http://repositorio.utfpr.edu.br/jspui/handle/1/37666
Summary: Bioinformatics is an area of science that seeks to analyze, interpret and solve biological pro- blems. In the analysis, an exploratory data analysis allows you to visualize and have a greater understanding of the data. For example, graphical or tabular representations are friendly ways of having this vision. In this sense, this TCC presents the final result of the construction of a Desktop tool for exploratory analysis of biological sequences, appealing for visualization of this data. The tool was developed in Python, which allows generating reports to view the results. Nine characteristics were implemented, namely: sequence size, GC content and GC ratio, k-mer count (ex: dinucleotides and trinucleotides), Dinucleotide-based Auto Covarience, Dinucleotide- based Cross Covarience, Trinucleotide-based Auto Covarience and Trinucleotide-based Cross Covarience. Thus, libraries such as Biopython, Numpy, Tkinter and Matplotlib, were used in the construction of the analysis of biological sequences and creation of graphics, through an intuitive and usual interface. Finally, it is a user-friendly tool in which the user can insert the sequence and export his reports and graphs in various formats to be used in his scientific works.
id UTFPR-12_ba32ee8a28e81d9ed51c59c82fe8fbfa
oai_identifier_str oai:repositorio.utfpr.edu.br:1/37666
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Ferramenta de extração de características de sequências biológicasBioinformáticaPython (Linguagem de programação de computador)Aquisição de dadosBioinformaticsPython (Computer program language)Data AcquisitionCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOBioinformatics is an area of science that seeks to analyze, interpret and solve biological pro- blems. In the analysis, an exploratory data analysis allows you to visualize and have a greater understanding of the data. For example, graphical or tabular representations are friendly ways of having this vision. In this sense, this TCC presents the final result of the construction of a Desktop tool for exploratory analysis of biological sequences, appealing for visualization of this data. The tool was developed in Python, which allows generating reports to view the results. Nine characteristics were implemented, namely: sequence size, GC content and GC ratio, k-mer count (ex: dinucleotides and trinucleotides), Dinucleotide-based Auto Covarience, Dinucleotide- based Cross Covarience, Trinucleotide-based Auto Covarience and Trinucleotide-based Cross Covarience. Thus, libraries such as Biopython, Numpy, Tkinter and Matplotlib, were used in the construction of the analysis of biological sequences and creation of graphics, through an intuitive and usual interface. Finally, it is a user-friendly tool in which the user can insert the sequence and export his reports and graphs in various formats to be used in his scientific works.A bioinformática é uma área da ciência que busca analisar, interpretar e solucionar problemas biológicos. Na computação, a análise exploratória de dados permite visualizar e ter uma maior compreensão sobre os dados. Por exemplo, representações gráficas ou tabelares são formas amigáveis de ter essa visão. Nesse sentido, este TCC apresenta o resultado final da construção de uma ferramenta Desktop para análise exploratória de sequências biológicas, apelando para a visualização destes dados. A ferramenta foi desenvolvida em Python, que permite gerar relatórios para visualização dos resultados. Foram implementadas nove características, sendo: tamanho da sequência, conteúdo GC e taxa (ratio) GC, contagem k-mer (e.g., dinucleotídeos e trinucleotideos), Dinucleotide-based Auto Covarience, Dinucleotide-based Cross Covarience, Trinucleotide-based Auto Covarience e Trinucleotide-based Cross Covarience. Assim, bibliotecas como Biopython, Numpy, Tkinter e Matplotlib, foram usadas na construção da análise das sequências biológicas e criação de gráficos, através de uma interface intuitiva e usual. Por fim, esta é uma ferramenta amigável em que o usuário pode inserir a sequência e exportar seus relatórios e gráficos em vários formatos para ser usado em seus trabalhos científicos.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilEngenharia da ComputaçãoUTFPRPaschoal, Alexandre RossiPaschoal, Alexandre RossiKashiwabara, André YoshiakiVicente, Fábio Fernandes da RochaGregorio, Vitor2025-08-01T18:58:49Z2025-08-01T18:58:49Z2021-05-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfGREGORIO, Vitor. Ferramenta de extração de características de sequências biológicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/37666porAttribution-NonCommercial-ShareAlike 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-08-02T06:12:12Zoai:repositorio.utfpr.edu.br:1/37666Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-08-02T06:12:12Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Ferramenta de extração de características de sequências biológicas
title Ferramenta de extração de características de sequências biológicas
spellingShingle Ferramenta de extração de características de sequências biológicas
Gregorio, Vitor
Bioinformática
Python (Linguagem de programação de computador)
Aquisição de dados
Bioinformatics
Python (Computer program language)
Data Acquisition
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Ferramenta de extração de características de sequências biológicas
title_full Ferramenta de extração de características de sequências biológicas
title_fullStr Ferramenta de extração de características de sequências biológicas
title_full_unstemmed Ferramenta de extração de características de sequências biológicas
title_sort Ferramenta de extração de características de sequências biológicas
author Gregorio, Vitor
author_facet Gregorio, Vitor
author_role author
dc.contributor.none.fl_str_mv Paschoal, Alexandre Rossi
Paschoal, Alexandre Rossi
Kashiwabara, André Yoshiaki
Vicente, Fábio Fernandes da Rocha
dc.contributor.author.fl_str_mv Gregorio, Vitor
dc.subject.por.fl_str_mv Bioinformática
Python (Linguagem de programação de computador)
Aquisição de dados
Bioinformatics
Python (Computer program language)
Data Acquisition
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Bioinformática
Python (Linguagem de programação de computador)
Aquisição de dados
Bioinformatics
Python (Computer program language)
Data Acquisition
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Bioinformatics is an area of science that seeks to analyze, interpret and solve biological pro- blems. In the analysis, an exploratory data analysis allows you to visualize and have a greater understanding of the data. For example, graphical or tabular representations are friendly ways of having this vision. In this sense, this TCC presents the final result of the construction of a Desktop tool for exploratory analysis of biological sequences, appealing for visualization of this data. The tool was developed in Python, which allows generating reports to view the results. Nine characteristics were implemented, namely: sequence size, GC content and GC ratio, k-mer count (ex: dinucleotides and trinucleotides), Dinucleotide-based Auto Covarience, Dinucleotide- based Cross Covarience, Trinucleotide-based Auto Covarience and Trinucleotide-based Cross Covarience. Thus, libraries such as Biopython, Numpy, Tkinter and Matplotlib, were used in the construction of the analysis of biological sequences and creation of graphics, through an intuitive and usual interface. Finally, it is a user-friendly tool in which the user can insert the sequence and export his reports and graphs in various formats to be used in his scientific works.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-11
2025-08-01T18:58:49Z
2025-08-01T18:58:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GREGORIO, Vitor. Ferramenta de extração de características de sequências biológicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
http://repositorio.utfpr.edu.br/jspui/handle/1/37666
identifier_str_mv GREGORIO, Vitor. Ferramenta de extração de características de sequências biológicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/37666
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
http://creativecommons.org/licenses/by-nc-sa/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
http://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Engenharia da Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Engenharia da Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498021776687104