Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo

Detalhes bibliográficos
Autor(a) principal: Pereira, Hudson
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/30201
Resumo: Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia.
id UTFPR-12_8891366157eab71bd204823a107408b7
oai_identifier_str oai:repositorio.utfpr.edu.br:1/30201
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Análise de dados públicos de expressão gênica de distúrbios do espectro do autismoÁcido ribonucleico - SínteseAutismoBioinformáticaRNA - SynthesisAutismBioinformaticsCNPQ::CIENCIAS EXATAS E DA TERRAEngenharia/Tecnologia/GestãoAutism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia.A síndrome do Transtorno do Espectro do Autismo (TEA) é caracterizada por dificuldades de interação, desvio na comunicação e comportamentos repetitivos. Essa síndrome também é definida como perda de contato com a realidade, causada por impossibilidade ou grande dificuldade na comunicação interpessoal. O TEA pode ser classificado de acordo com a gravidade em: leve, moderado e grave. O diagnóstico precoce do autismo é essencial para um tratamento eficaz. As análises transcriptomicas são um meio de obter informações regulatórias para entender o TEA. Nesse sentido, este trabalho apresenta o resultado de uma meta-análise em dados públicos de expressão gênica disponíveis do TEA em estudos associados. A metodologia aplicada consistiu em utilizarmos dados de expressão obtidos após uma revisão da literatura sobre a TEA, Sendo, três conjuntos de dados selecionados, coletados no portal NCBI GEO em Dezembro/19, e analisados via dados RNA-Seq os genes chaves relativos à TEA. O pipeline de análise de RNA-Seq foi utilizado para: (i) extração dos dados em SRA utilizando o fastq-dump, no Rstudio; (ii) avaliação e controle de qualidade via programa Trimmomatic, no qual foi feito o corte de qualidade das sequências; (iii) em seguida, os dados foram alinhados com o genoma de referência (GRCh38) utilizando o Salmon e aplicado a estimativa de quantificação e nível de transcrição; e (iv) o txtimport foi utilizado para a montagem da matriz de contagem, por fim, utilizamos o DESeq para análise de expressão diferencial. A análise da dispersão dos dados de expressão foram exibidos graficamente usando o Vulcano. Em seguida, a técnica PCA (do inglês Principal component analysis) para análise de grupos, junto com a análise de genes enriquecidos, utilizando os termos do GO, identificamos potenciais, grupos e funções dos genes analisados sendo possível identificar um total de dez genes diferencialmente expressos, sendo três genes altamente expressos e sete genes com baixa expressão. Destes genes, oito são codificadores de proteínas, e dois RNAs pequenos. Além disso, foi observado que alguns genes apresentam relação com outra doença genética, no caso a esquizofrenia.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em BioinformáticaUTFPRPaschoal, Alexandre Rossi0000-0002-8887-0582http://lattes.cnpq.br/5834088144837137Queiroz, Artur Trancoso Lopo dehttp://lattes.cnpq.br/5222182427171497Paschoal, Alexandre Rossihttp://lattes.cnpq.br/5834088144837137Sanches, Danilo Sipolihttp://lattes.cnpq.br/6377657274398145Freitas, Flavia Cristina de Paulahttp://lattes.cnpq.br/5139566975444110Oliveira, Jaqueline Carvalho dehttp://lattes.cnpq.br/8730828720954911Martins, Marcella Scoczynski Ribeirohttp://lattes.cnpq.br/5212122361603572Pereira, Hudson2022-11-29T17:01:24Z2022-11-29T17:01:24Z2022-04-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.http://repositorio.utfpr.edu.br/jspui/handle/1/30201porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2022-11-30T06:07:00Zoai:repositorio.utfpr.edu.br:1/30201Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2022-11-30T06:07Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
spellingShingle Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
Pereira, Hudson
Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
CNPQ::CIENCIAS EXATAS E DA TERRA
Engenharia/Tecnologia/Gestão
title_short Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_full Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_fullStr Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_full_unstemmed Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
title_sort Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
author Pereira, Hudson
author_facet Pereira, Hudson
author_role author
dc.contributor.none.fl_str_mv Paschoal, Alexandre Rossi
0000-0002-8887-0582
http://lattes.cnpq.br/5834088144837137
Queiroz, Artur Trancoso Lopo de
http://lattes.cnpq.br/5222182427171497
Paschoal, Alexandre Rossi
http://lattes.cnpq.br/5834088144837137
Sanches, Danilo Sipoli
http://lattes.cnpq.br/6377657274398145
Freitas, Flavia Cristina de Paula
http://lattes.cnpq.br/5139566975444110
Oliveira, Jaqueline Carvalho de
http://lattes.cnpq.br/8730828720954911
Martins, Marcella Scoczynski Ribeiro
http://lattes.cnpq.br/5212122361603572
dc.contributor.author.fl_str_mv Pereira, Hudson
dc.subject.por.fl_str_mv Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
CNPQ::CIENCIAS EXATAS E DA TERRA
Engenharia/Tecnologia/Gestão
topic Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
CNPQ::CIENCIAS EXATAS E DA TERRA
Engenharia/Tecnologia/Gestão
description Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-29T17:01:24Z
2022-11-29T17:01:24Z
2022-04-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
http://repositorio.utfpr.edu.br/jspui/handle/1/30201
identifier_str_mv PEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30201
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Bioinformática
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Bioinformática
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498022839943168