Sistema automático para caracterização de rnas não-codificantes
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2023 |
| Tipo de documento: | Dissertação |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/33100 |
Resumo: | Non-coding RNAs (ncRNA) are RNAs that can be transcribed, but not translated into proteins. Although their functions are not fully known, ncRNAs have many biological functions, generally focusing on regulatory or interactional processes, such as chromatin alterations, transcriptional regulation, nuclear organization, translation, etc. Two key ways to identify ncRNAs are by sequence similarity analysis (alignment), which can be done with the BLAST tool, or structural search, by using the INFERNAL tool. However, the post-results data analysis among both tools output is still a gap. In this context, there are two major tools (StructRNAfinder and FindNonCoding) that have been developed to facilitate the ncRNA annotation. However, they do not cover all the main strategies for ncRNA identification. To fill this gap, we developed an automatic and scalable system for large-scale data annotation analysis of ncRNAs which use both sequence and structural search strategy for ncRNA annotation. Our tool uses the most updated version of INFERNAL together with RFAM and BLAST along with RNAcentral databases to perform the ncRNA identification, and bring the output in user-friendly reports, files and statistics for the final user. To validate the tool, we present a benchmark with two other tools that aims to facilitate the annotation of ncRNAs (StructRNAfinder and FindNonCoding), and tested in public genomes from RefSeq, Ensembl Plants and GENCODE. The dataset for the test contained seven nuclear genomes available in public databases, which were Chlamydia trachomatis, Drosophila melanogaster, Escherichia coli and Saccharomyces cerevisiae from RefSeq; Homo sapiens from Gencode; Arabidopsis thaliana, Oryza sativa and Zea mays from Ensembl Plants. Our tool presents better sensitivity and accuracy when compared to other tools, which may indicate that our method presents better results for the annotation of ncRNAs. |
| id |
UTFPR-12_4830f4a9cff869157bd149f20e579e6c |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/33100 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Sistema automático para caracterização de rnas não-codificantesAutomatic System For Characterization Of Non-Coding RnasBioinformáticaAutomaçãoGenômicaBioinformaticsAutomationGenomicsCNPQ::CIENCIAS BIOLOGICASEngenharia/Tecnologia/GestãoNon-coding RNAs (ncRNA) are RNAs that can be transcribed, but not translated into proteins. Although their functions are not fully known, ncRNAs have many biological functions, generally focusing on regulatory or interactional processes, such as chromatin alterations, transcriptional regulation, nuclear organization, translation, etc. Two key ways to identify ncRNAs are by sequence similarity analysis (alignment), which can be done with the BLAST tool, or structural search, by using the INFERNAL tool. However, the post-results data analysis among both tools output is still a gap. In this context, there are two major tools (StructRNAfinder and FindNonCoding) that have been developed to facilitate the ncRNA annotation. However, they do not cover all the main strategies for ncRNA identification. To fill this gap, we developed an automatic and scalable system for large-scale data annotation analysis of ncRNAs which use both sequence and structural search strategy for ncRNA annotation. Our tool uses the most updated version of INFERNAL together with RFAM and BLAST along with RNAcentral databases to perform the ncRNA identification, and bring the output in user-friendly reports, files and statistics for the final user. To validate the tool, we present a benchmark with two other tools that aims to facilitate the annotation of ncRNAs (StructRNAfinder and FindNonCoding), and tested in public genomes from RefSeq, Ensembl Plants and GENCODE. The dataset for the test contained seven nuclear genomes available in public databases, which were Chlamydia trachomatis, Drosophila melanogaster, Escherichia coli and Saccharomyces cerevisiae from RefSeq; Homo sapiens from Gencode; Arabidopsis thaliana, Oryza sativa and Zea mays from Ensembl Plants. Our tool presents better sensitivity and accuracy when compared to other tools, which may indicate that our method presents better results for the annotation of ncRNAs.Fundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do ParanáOs RNAs não-codificantes (ncRNAs) são RNAs que podem ser transcritos, mas não traduzidos em proteínas. Embora suas funções não sejam totalmente conhecidas, os ncRNAs possuem diversas funções biológicas, geralmente relacionadas a processos regulatórios ou interacionais, como alterações da cromatina, regulação transcricional, organização nuclear, tradução, entre outros. Duas principais formas de identificar ncRNAs são a análise de similaridade de sequência (alinhamento), que pode ser realizada com a ferramenta BLAST, ou a busca estrutural, usando a ferramenta INFERNAL. No entanto, a análise de dados após a obtenção dos resultados de ambas as ferramentas ainda é um desafio. Nesse contexto, existem duas ferramentas principais (StructRNAfinder e FindNonCoding) que foram desenvolvidas para facilitar a anotação de ncRNAs. Porém, elas não abrangem todas as principais formas de identificação de ncRNAs. Para preencher essa lacuna, desenvolvemos um sistema automático e escalável para a análise de anotação de ncRNAs em larga escala, que utiliza tanto a estratégia de busca de sequência quanto a de busca estrutural para anotação de ncRNAs. Em nossa ferramenta, utilizamos a versão mais atualizada do INFERNAL em conjunto com os bancos de dados RFAM, e BLAST juntamente com os bancos de dados RNAcentral, para realizar a identificação de ncRNAs e fornecer os resultados em relatórios, arquivos e estatísticas de fácil compreensão para o usuário final. Para validar a ferramenta, apresentamos um teste comparativo com outras duas ferramentas que visam facilitar a anotação de ncRNAs (StructRNAfinder e FindNonCoding), e realizamos os testes em genomas públicos do RefSeq, Ensembl Plants e GENCODE. O conjunto de dados para o teste contém sete genomas nucleares disponíveis em bancos de dados públicos, que são Chlamydia trachomatis, Drosophila melanogaster, Escherichia coli e Saccharomyces cerevisiae do RefSeq; Homo sapiens do Gencode; Arabidopsis thaliana, Oryza sativa e Zea mays do Ensembl Plants. Nossa ferramenta apresenta maior sensibilidade e precisão em comparação com outras ferramentas, o que pode indicar que nosso método fornece melhores resultados para a anotação de ncRNAs.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em BioinformáticaUTFPRPaschoal, Alexandre Rossihttps://orcid.org/0000-0002-8887-0582http://lattes.cnpq.br/5834088144837137Durham, Alan Mitchellhttp://lattes.cnpq.br/1927611801056285Paschoal, Alexandre Rossihttp://lattes.cnpq.br/5834088144837137Kashiwabara, Andre Yoshiakihttp://lattes.cnpq.br/3194328548975437Domingues, Douglas Silvahttp://lattes.cnpq.br/7905667701769534Lopes, Flavia Lombardihttp://lattes.cnpq.br/2957834927297648Gregorio, Vitor2023-12-19T12:08:38Z2023-12-19T12:08:38Z2023-10-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGREGORIO, Vitor. Sistema automático para caracterização de rnas não-codificantes. 2023. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2023.http://repositorio.utfpr.edu.br/jspui/handle/1/33100porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2023-12-20T06:07:50Zoai:repositorio.utfpr.edu.br:1/33100Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2023-12-20T06:07:50Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Sistema automático para caracterização de rnas não-codificantes Automatic System For Characterization Of Non-Coding Rnas |
| title |
Sistema automático para caracterização de rnas não-codificantes |
| spellingShingle |
Sistema automático para caracterização de rnas não-codificantes Gregorio, Vitor Bioinformática Automação Genômica Bioinformatics Automation Genomics CNPQ::CIENCIAS BIOLOGICAS Engenharia/Tecnologia/Gestão |
| title_short |
Sistema automático para caracterização de rnas não-codificantes |
| title_full |
Sistema automático para caracterização de rnas não-codificantes |
| title_fullStr |
Sistema automático para caracterização de rnas não-codificantes |
| title_full_unstemmed |
Sistema automático para caracterização de rnas não-codificantes |
| title_sort |
Sistema automático para caracterização de rnas não-codificantes |
| author |
Gregorio, Vitor |
| author_facet |
Gregorio, Vitor |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Paschoal, Alexandre Rossi https://orcid.org/0000-0002-8887-0582 http://lattes.cnpq.br/5834088144837137 Durham, Alan Mitchell http://lattes.cnpq.br/1927611801056285 Paschoal, Alexandre Rossi http://lattes.cnpq.br/5834088144837137 Kashiwabara, Andre Yoshiaki http://lattes.cnpq.br/3194328548975437 Domingues, Douglas Silva http://lattes.cnpq.br/7905667701769534 Lopes, Flavia Lombardi http://lattes.cnpq.br/2957834927297648 |
| dc.contributor.author.fl_str_mv |
Gregorio, Vitor |
| dc.subject.por.fl_str_mv |
Bioinformática Automação Genômica Bioinformatics Automation Genomics CNPQ::CIENCIAS BIOLOGICAS Engenharia/Tecnologia/Gestão |
| topic |
Bioinformática Automação Genômica Bioinformatics Automation Genomics CNPQ::CIENCIAS BIOLOGICAS Engenharia/Tecnologia/Gestão |
| description |
Non-coding RNAs (ncRNA) are RNAs that can be transcribed, but not translated into proteins. Although their functions are not fully known, ncRNAs have many biological functions, generally focusing on regulatory or interactional processes, such as chromatin alterations, transcriptional regulation, nuclear organization, translation, etc. Two key ways to identify ncRNAs are by sequence similarity analysis (alignment), which can be done with the BLAST tool, or structural search, by using the INFERNAL tool. However, the post-results data analysis among both tools output is still a gap. In this context, there are two major tools (StructRNAfinder and FindNonCoding) that have been developed to facilitate the ncRNA annotation. However, they do not cover all the main strategies for ncRNA identification. To fill this gap, we developed an automatic and scalable system for large-scale data annotation analysis of ncRNAs which use both sequence and structural search strategy for ncRNA annotation. Our tool uses the most updated version of INFERNAL together with RFAM and BLAST along with RNAcentral databases to perform the ncRNA identification, and bring the output in user-friendly reports, files and statistics for the final user. To validate the tool, we present a benchmark with two other tools that aims to facilitate the annotation of ncRNAs (StructRNAfinder and FindNonCoding), and tested in public genomes from RefSeq, Ensembl Plants and GENCODE. The dataset for the test contained seven nuclear genomes available in public databases, which were Chlamydia trachomatis, Drosophila melanogaster, Escherichia coli and Saccharomyces cerevisiae from RefSeq; Homo sapiens from Gencode; Arabidopsis thaliana, Oryza sativa and Zea mays from Ensembl Plants. Our tool presents better sensitivity and accuracy when compared to other tools, which may indicate that our method presents better results for the annotation of ncRNAs. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12-19T12:08:38Z 2023-12-19T12:08:38Z 2023-10-09 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
GREGORIO, Vitor. Sistema automático para caracterização de rnas não-codificantes. 2023. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2023. http://repositorio.utfpr.edu.br/jspui/handle/1/33100 |
| identifier_str_mv |
GREGORIO, Vitor. Sistema automático para caracterização de rnas não-codificantes. 2023. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2023. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/33100 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Bioinformática UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Bioinformática UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850497979588280320 |