VenCode – a versatile entry code for post-DNA delivery identification of target cells

Detalhes bibliográficos
Autor(a) principal: Macedo, André Lopes Martins
Data de Publicação: 2021
Idioma: eng
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: http://hdl.handle.net/10362/111331
Resumo: RESUMO: O corpo humano é feito de centenas, talvez milhares de tipos e estados celulares distintos, a maioria atualmente inacessíveis através de ferramentas genéticas. A acessibilidade genética traz consigo um potencial terapêutico e de diagnostico significante, ao permitir a entrega seletiva de mensagens genéticas, ou terapias, diretamente às células. Trabalhos em organismos modelo mostram que a atividade de um só elemento regulatório (ER) é raramente específica para um tipo celular, o que limita o seu uso a sistemas genéticos desenhados para controlar a expressão genica após a sua entrega nas células. Abordagens de genética interseccional podem, em teoria, aumentar o número de células acessíveis sem esta restrição, mas o âmbito e a segurança dessas abordagens para o organismo humano não foram ainda sistematicamente estudados devido a uma falta de bases de dados de ERs para um extenso número de tipos celulares, e de métodos para as explorar. Um típico método interseccional funciona como uma porta logica AND ao converter a informação de dois ou mais ERs ativos num só sinal de saída, que se torna único para a célula analisada. Neste trabalho, estudamos sistematicamente o panorama da genética intersecional no organismo humano, usando um grupo de células selecionado a partir de um atlas de atividade de ERs obtido através do sequenciamento “Cap analysis of Gene Expression” (CAGE-seq) de centenas de células primárias e de cancro (o atlas do consórcio FANTOM5). Desenvolvemos algoritmos e heurísticas para encontrar e recolher intersecções do tipo porta AND e em seguida para determinar a sua qualidade. Descobrimos que mais de 90% dos 154 tipos celulares primários estudados podem ser distinguidos uns dos outros com apenas 3 ou 4 ERs ativos, com segurança e robustez. Chamamos de “Versatile Entry Codes” (VEnCodes) a esse número mínimo de intersecções de ERs ativos com potencial de distinção celular. Cada uma das 158 células cancerígenas estudadas poderam ser distinguidas do grupo de células saudáveis com VEnCodes de poucos ERs, a maioria dos quais são altamente robustos à variação intra- e inter-individual. Finalmente, fornecemos métodos para a validação dos VEnCodes obtidos e para a obtenção de VEnCodes a partir de bases de dados de sequenciamento ao nível de célula-a-célula. O nosso trabalho oferece uma visão sistemática do panorama da genética interseccional no organismo humano e demonstra o potencial dessas abordagens para tecnologias futuras de terapia genética.
id RCAP_05e75216f68cacec7e652fdd096de181
oai_identifier_str oai:run.unl.pt:10362/111331
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling VenCode – a versatile entry code for post-DNA delivery identification of target cellsCancer cell typesVEnCode cross-validationGenetic TherapyCiências MédicasRESUMO: O corpo humano é feito de centenas, talvez milhares de tipos e estados celulares distintos, a maioria atualmente inacessíveis através de ferramentas genéticas. A acessibilidade genética traz consigo um potencial terapêutico e de diagnostico significante, ao permitir a entrega seletiva de mensagens genéticas, ou terapias, diretamente às células. Trabalhos em organismos modelo mostram que a atividade de um só elemento regulatório (ER) é raramente específica para um tipo celular, o que limita o seu uso a sistemas genéticos desenhados para controlar a expressão genica após a sua entrega nas células. Abordagens de genética interseccional podem, em teoria, aumentar o número de células acessíveis sem esta restrição, mas o âmbito e a segurança dessas abordagens para o organismo humano não foram ainda sistematicamente estudados devido a uma falta de bases de dados de ERs para um extenso número de tipos celulares, e de métodos para as explorar. Um típico método interseccional funciona como uma porta logica AND ao converter a informação de dois ou mais ERs ativos num só sinal de saída, que se torna único para a célula analisada. Neste trabalho, estudamos sistematicamente o panorama da genética intersecional no organismo humano, usando um grupo de células selecionado a partir de um atlas de atividade de ERs obtido através do sequenciamento “Cap analysis of Gene Expression” (CAGE-seq) de centenas de células primárias e de cancro (o atlas do consórcio FANTOM5). Desenvolvemos algoritmos e heurísticas para encontrar e recolher intersecções do tipo porta AND e em seguida para determinar a sua qualidade. Descobrimos que mais de 90% dos 154 tipos celulares primários estudados podem ser distinguidos uns dos outros com apenas 3 ou 4 ERs ativos, com segurança e robustez. Chamamos de “Versatile Entry Codes” (VEnCodes) a esse número mínimo de intersecções de ERs ativos com potencial de distinção celular. Cada uma das 158 células cancerígenas estudadas poderam ser distinguidas do grupo de células saudáveis com VEnCodes de poucos ERs, a maioria dos quais são altamente robustos à variação intra- e inter-individual. Finalmente, fornecemos métodos para a validação dos VEnCodes obtidos e para a obtenção de VEnCodes a partir de bases de dados de sequenciamento ao nível de célula-a-célula. O nosso trabalho oferece uma visão sistemática do panorama da genética interseccional no organismo humano e demonstra o potencial dessas abordagens para tecnologias futuras de terapia genética.ABSTRACT: The human body is made up of hundreds, perhaps thousands of cell types and states, most of which are currently inaccessible genetically. Genetic accessibility carries significant diagnostic and therapeutic potential by allowing the selective delivery of genetic messages or cures to cells. Research in model organisms has shown that single regulatory element (RE) activities are seldom cell type specific, limiting their usage in genetic systems designed to restrict gene expression posteriorly to their delivery to cells. Intersectional genetic approaches can theoretically increase the number of genetically accessible cells, but the scope and safety of these approaches to human have not been systematically assessed due primarily to the lack of suitable thorough RE activity databases and methods to explore them. A typical intersectional method acts like an AND logic gate by converting the input of two or more active REs into a single synthetic output, which becomes unique for that cell. Here, we systematically assessed the intersectional genetics landscape of human using a curated subset of cells from a large RE usage atlas obtained by Cap Analysis of Gene Expression sequencing (CAGE-seq) of thousands of primary and cancer cells (the FANTOM5 consortium atlas). We developed the heuristics and algorithms to retrieve AND gate intersections and quality-rank them intra- and interindividually. We find that >90% of the 154 primary cell types surveyed can be distinguished from each other with as little as 3 to 4 active REs, with quantifiable safety and robustness. We call these minimal intersections of active REs with cell-type diagnostic potential "Versatile Entry Codes" (VEnCodes). Each of the 158 cancer cell types surveyed could also be distinguished from the healthy primary cell types with small VEnCodes, most of which were highly robust to intra- and interindividual variation. Finally, we provide methods for the cross-validation of CAGE-seq-derived VEnCodes and for the extraction of VEnCodes from pooled single cell sequencing data. Our work provides a systematic view of the intersectional genetics landscape in human and demonstrates the potential of these approaches for future gene delivery technologies in human.Gontijo, AlissonRUNMacedo, André Lopes Martins2022-01-28T01:30:42Z2021-01-282021-02-052021-01-28T00:00:00Zdoctoral thesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://hdl.handle.net/10362/111331TID:101479948enginfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-22T17:50:20Zoai:run.unl.pt:10362/111331Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T17:21:29.355624Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv VenCode – a versatile entry code for post-DNA delivery identification of target cells
title VenCode – a versatile entry code for post-DNA delivery identification of target cells
spellingShingle VenCode – a versatile entry code for post-DNA delivery identification of target cells
Macedo, André Lopes Martins
Cancer cell types
VEnCode cross-validation
Genetic Therapy
Ciências Médicas
title_short VenCode – a versatile entry code for post-DNA delivery identification of target cells
title_full VenCode – a versatile entry code for post-DNA delivery identification of target cells
title_fullStr VenCode – a versatile entry code for post-DNA delivery identification of target cells
title_full_unstemmed VenCode – a versatile entry code for post-DNA delivery identification of target cells
title_sort VenCode – a versatile entry code for post-DNA delivery identification of target cells
author Macedo, André Lopes Martins
author_facet Macedo, André Lopes Martins
author_role author
dc.contributor.none.fl_str_mv Gontijo, Alisson
RUN
dc.contributor.author.fl_str_mv Macedo, André Lopes Martins
dc.subject.por.fl_str_mv Cancer cell types
VEnCode cross-validation
Genetic Therapy
Ciências Médicas
topic Cancer cell types
VEnCode cross-validation
Genetic Therapy
Ciências Médicas
description RESUMO: O corpo humano é feito de centenas, talvez milhares de tipos e estados celulares distintos, a maioria atualmente inacessíveis através de ferramentas genéticas. A acessibilidade genética traz consigo um potencial terapêutico e de diagnostico significante, ao permitir a entrega seletiva de mensagens genéticas, ou terapias, diretamente às células. Trabalhos em organismos modelo mostram que a atividade de um só elemento regulatório (ER) é raramente específica para um tipo celular, o que limita o seu uso a sistemas genéticos desenhados para controlar a expressão genica após a sua entrega nas células. Abordagens de genética interseccional podem, em teoria, aumentar o número de células acessíveis sem esta restrição, mas o âmbito e a segurança dessas abordagens para o organismo humano não foram ainda sistematicamente estudados devido a uma falta de bases de dados de ERs para um extenso número de tipos celulares, e de métodos para as explorar. Um típico método interseccional funciona como uma porta logica AND ao converter a informação de dois ou mais ERs ativos num só sinal de saída, que se torna único para a célula analisada. Neste trabalho, estudamos sistematicamente o panorama da genética intersecional no organismo humano, usando um grupo de células selecionado a partir de um atlas de atividade de ERs obtido através do sequenciamento “Cap analysis of Gene Expression” (CAGE-seq) de centenas de células primárias e de cancro (o atlas do consórcio FANTOM5). Desenvolvemos algoritmos e heurísticas para encontrar e recolher intersecções do tipo porta AND e em seguida para determinar a sua qualidade. Descobrimos que mais de 90% dos 154 tipos celulares primários estudados podem ser distinguidos uns dos outros com apenas 3 ou 4 ERs ativos, com segurança e robustez. Chamamos de “Versatile Entry Codes” (VEnCodes) a esse número mínimo de intersecções de ERs ativos com potencial de distinção celular. Cada uma das 158 células cancerígenas estudadas poderam ser distinguidas do grupo de células saudáveis com VEnCodes de poucos ERs, a maioria dos quais são altamente robustos à variação intra- e inter-individual. Finalmente, fornecemos métodos para a validação dos VEnCodes obtidos e para a obtenção de VEnCodes a partir de bases de dados de sequenciamento ao nível de célula-a-célula. O nosso trabalho oferece uma visão sistemática do panorama da genética interseccional no organismo humano e demonstra o potencial dessas abordagens para tecnologias futuras de terapia genética.
publishDate 2021
dc.date.none.fl_str_mv 2021-01-28
2021-02-05
2021-01-28T00:00:00Z
2022-01-28T01:30:42Z
dc.type.driver.fl_str_mv doctoral thesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/111331
TID:101479948
url http://hdl.handle.net/10362/111331
identifier_str_mv TID:101479948
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833596636439248896