Acurácia de predição do valor genético genômico em bovinos da raça Gir para produção de leite até os 305 dias de lactação

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Sena, Thomaz Marques
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/254469
Resumo: — Estudos para a incorporação de dados moleculares em conjunto com a avaliação genética animal têm sido propostos com os objetivos de aumento da acurácia na predição de valores genéticos genômicos (GEBV), aumento da intensidade de seleção e diminuição dos intervalos de gerações, visando aumentar o ganho genético pela seleção ao longo de sucessivas gerações de acasalamento. O uso de painéis customizados de nucleotídeos de polimorfismo único (SNP) de baixa densidade se mostra interessante devido ao menor custo em relação aos painéis de SNP de alta densidade. Dessa forma, um maior número de animais candidatos a seleção podem ser genotipados. Para a seleção dos SNP que compõem os painéis customizados o algoritmo de aprendizado de máquina tem demonstrado bons resultados em pesquisa. No entanto, com painéis de baixa densidade de SNP, dificuldades de convergência podem ocorrer nas análises de predição do GEBV. Desse modo, o objetivo desse estudo foi verificar a habilidade de predição do GEBV em bovinos da raça Gir a partir de subconjunto de SNP, classificado segundo sua importância para a produção de leite até os 305 dias de lactação. Os SNP foram classificados por regressão não paramétrica por meio do algoritmo Random Forest (RF) e foram testados 20 cenários, os quais variaram quanto à proporção da matriz A22 dentro da G e A22 -1 dentro da matriz H -1 , buscando-se verificar o impacto do subconjunto de SNP na acurácia e no viés de predição. A presença de genes em uma janela de 1Mb foi verificada usando os pacotes biomaRt, com a versão 110 de Ensembl Genomes, clusterProfiler do software R. Dentre os cenários de RF, o melhor foi aquele em que os grupos de treinamento e validação foram separados de acordo com as gerações, cujo Ntree e Mtry foram 8192 e 0,3 vezes no número de SNP presentes no painel de 400 mil marcadores, respectivamente. Os SNP com maior relevância apresentaram oito genes relacionados a importantes vias metabólicas e funções biológicas, presentes em várias espécies de animais. Para os diferentes cenários testados observou-se diferenças significativas (p-valor < 0,05) entre estimativas da variância e da média do GEBV, do fenótipo predito (YHat) e do valor dos resíduos que representam o valor fenotípico descontado dos efeitos incluídos no modelo) para os diferentes cenários de ponderação da matriz G e A22 -1 testados e para os diferentes painéis de customizados. Esse resultado mostrou-se promissor, uma vez que é possível criar painéis de SNP com menores densidades sem perder o poder de predição do GEBV.