Montagem De novo de genomas contrastantes de soja para estudo da resistência ao complexo de percevejos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Godoy Filho, Marcos Antonio de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/11/11137/tde-30112020-201429/
Resumo: A soja é uma importante commodity no Brasil, em 2019, a soja e seus derivados responderam por US$ 32,63 bilhões em exportações. No entanto, existem alguns obstáculos à obtenção de maior produtividade, como ataque de insetos, principalmente pelo complexo de percevejos, representados principalmente por Euschistus heros, Nezara viridula e Piezodorus guildinii, que diminuem o rendimento da cultura e podem transmitir fitopatógenos. Uma alternativa ao uso de inseticidas é o desenvolvimento de cultivares resistentes. Para um melhor entendimento da arquitetura genética envolvida na resistência da soja ao complexo do percevejo, foram sequenciados os genomas da cultivar de soja IAC-100 (resistente) e da cultivar CD-215 (suscetível), foram usados os dados de genotipagem por sequenciamento de uma população de 236 de linhagens endogâmicas recombinantes oriundas do cruzamento entre as cultivares estudadas, visando encontrar variantes comuns as mais resistentes e presentes apenas na cultivar IAC-100. Para a montagem dos genomas, utilizamos a tecnologia Chromium Genome (10x Genomics, San Francisco, EUA). A montagem do genoma foi realizada com os softwares Supernova 2.1.1, Ragoo 1.1 e REAPR 1.0.17, gerando montagens com aproximadamente 1 GB e scaffold N50 próximos de 54 MB, para ambas as cultivares nossos genomas apresentam de alta sintênia com os cromossomos da Williams 82 com número de genes e elementos repetitivos muito próximos (aproximadamente 58 mil genes e 44% de elementos repetitivos). A partir dos dados do sequenciamento do genoma, o pipeline do GATK foi usado para a descoberta de variantes e usando dados de genotyping-by-sequencing (GBS), de 236 indivíduos de uma população de linhagens endogâmicas recombinantes, oriundas do cruzamento entre a IAC-100 e CD-215, o pipeline do GATK foi usado para a chamada de SNPs. Foram selecionadas, a partir de dados históricos, as 25 linhagens mais resistentes ao complexo de percevejos, e polimorfismos compartilhados entre as mesmas e IAC-100 foram identificados. Foram identificados um total de 290.189 mil SNPs únicos na IAC-100 quando comparados com CD-215, além de 335.229 mil Indels únicos. A partir dos dados de GBS foram identificados 852 SNPs, compartilhados entre as 25 linhagens mais resistente da população e IAC-100, com esses SNPs muito próximos da posição de QTLs relatados para a resistência. Variantes estruturais foram visualizadas com o software IGV na região de QTLs relatados para a resistência, onde grandes variantes únicas na IAC-100, foram encontradas próximas de genes considerados candidatos a resistência, envolvidos com a biossíntese de fenilpropanóides/lignina, terpenos, número de vagens e desenvolvimento de sementes. Além de disponibilizar dois genomas de soja brasileiros com os melhores scaffolds N50 até hoje relatados, esses resultados abrem as portas para vários outros estudos e aplicações no melhoramento, como mapeamento fino, seleção assistida, expressão de genes candidatos e modificações genéticas nos mesmos usando CRISPR ou outros métodos.