Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Sena, Thomaz Marques |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://hdl.handle.net/11449/254469
|
Resumo: |
— Estudos para a incorporação de dados moleculares em conjunto com a avaliação genética animal têm sido propostos com os objetivos de aumento da acurácia na predição de valores genéticos genômicos (GEBV), aumento da intensidade de seleção e diminuição dos intervalos de gerações, visando aumentar o ganho genético pela seleção ao longo de sucessivas gerações de acasalamento. O uso de painéis customizados de nucleotídeos de polimorfismo único (SNP) de baixa densidade se mostra interessante devido ao menor custo em relação aos painéis de SNP de alta densidade. Dessa forma, um maior número de animais candidatos a seleção podem ser genotipados. Para a seleção dos SNP que compõem os painéis customizados o algoritmo de aprendizado de máquina tem demonstrado bons resultados em pesquisa. No entanto, com painéis de baixa densidade de SNP, dificuldades de convergência podem ocorrer nas análises de predição do GEBV. Desse modo, o objetivo desse estudo foi verificar a habilidade de predição do GEBV em bovinos da raça Gir a partir de subconjunto de SNP, classificado segundo sua importância para a produção de leite até os 305 dias de lactação. Os SNP foram classificados por regressão não paramétrica por meio do algoritmo Random Forest (RF) e foram testados 20 cenários, os quais variaram quanto à proporção da matriz A22 dentro da G e A22 -1 dentro da matriz H -1 , buscando-se verificar o impacto do subconjunto de SNP na acurácia e no viés de predição. A presença de genes em uma janela de 1Mb foi verificada usando os pacotes biomaRt, com a versão 110 de Ensembl Genomes, clusterProfiler do software R. Dentre os cenários de RF, o melhor foi aquele em que os grupos de treinamento e validação foram separados de acordo com as gerações, cujo Ntree e Mtry foram 8192 e 0,3 vezes no número de SNP presentes no painel de 400 mil marcadores, respectivamente. Os SNP com maior relevância apresentaram oito genes relacionados a importantes vias metabólicas e funções biológicas, presentes em várias espécies de animais. Para os diferentes cenários testados observou-se diferenças significativas (p-valor < 0,05) entre estimativas da variância e da média do GEBV, do fenótipo predito (YHat) e do valor dos resíduos que representam o valor fenotípico descontado dos efeitos incluídos no modelo) para os diferentes cenários de ponderação da matriz G e A22 -1 testados e para os diferentes painéis de customizados. Esse resultado mostrou-se promissor, uma vez que é possível criar painéis de SNP com menores densidades sem perder o poder de predição do GEBV. |