Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Andrietta, Lucas Tassoni
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/
Resumo: Estratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução.