Procedimentos numéricos e estimação de componentes de covariância em análise multivariada pelo método da máxima verossimilhança restrita - modelos mistos aplicados ao melhoramento animal

Detalhes bibliográficos
Ano de defesa: 1994
Autor(a) principal: Verneque, Rui da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/11/11134/tde-20191220-135928/
Resumo: Este trabalho tem por objetivos: a) descrever alguns procedimentos numéricos para obtenção de solução de sistemas de equações lineares, e para estimação de componentes de covariância, em análise multivariada, aplicados à área de melhoramento animal; b) realizar uma avaliação comparativa entre os três sistemas de processamento de dados: DFREML (Derivative Free Restricted Maximum Likelihood (MEYER, 1993), MTC (Multitrait REML Estimation) (MISZTAL, 1992) e MTDFREML (Multiple Traits Derivative Free Restricted Maximum Likelihood) (BOLDMAN et al., 1993); e c) sugerir estratégias de análises, utilizando os programas em avaliação. Esses sistemas visam estimar componentes de covariância, adotando-se o método da máxima verossimilhança restrita (REML). Realiza-se uma breve descrição dos métodos numéricos comumente empregados na solução de sistemas de equações lineares. São mostrados os métodos de maior aplicação na área de melhoramento animal e áreas afins. Descrevem-se os principais métodos de estimação de componentes de covariância, deduzindo-se, na maioria dos casos, a forma de obtenção dos estimadores para cada um dos métodos. Apresentam-se formas apropriadas para simulação de dados baseada em modelo animal, considerando-se ou não o parentesco entre indivíduos. Estimam-se os componentes de variância e covariância a partir de dados cedidos por autores de diversas pesquisas; dados simulados e dados de campo, provenientes de registros de produção de leite de rebanhos da raça Gir leiteiro, extraídos do arquivo zootécnico nacional, mantido no CNPGL/EMBRAPA. Foram simuladas até três características para cada experimento, admitindo-se diferentes modelos (com um ou dois fatores aleatórios além do erro) e várias matrizes de componentes de covariância. Os sistemas são rápidos e eficientes para estimação de variâncias em análise univariada. Em análise multivariada, os métodos livres de derivadas são eficientes para estimação de componentes de covariância, para o caso em que as características apresentem correlações não muito elevadas e quando os valores preliminares ou valores de partida representem uma boa aproximação das estimativas. Estes métodos, no entanto, não se mostram apropriados quando os valores iniciais utilizados são distantes das estimativas. Da mesma forma, para análise em que se inclui um número elevado de características (maior do que 3) e para situações em que a matriz de coeficientes do modelo linear misto não é esparsa, os métodos livres de derivadas, embora estimem adequadamente os parâmetros, tornam-se extremamente lentos. Por outro lado, estes sistemas são flexíveis, permitindo adotar diferentes estratégias de estimação, para aumentar a velocidade e eficiência do processo. É possível, por exemplo, executar uma análise univariada, seguida de análise multivariada, fixando-se alguns dos componentes. Posteriormente, adotando-se os parâmetros pré-estimados, pode-se realizar a análise multivariada repetidas vezes, sem se fixar qualquer componente. Este procedimento é denominado neste trabalho de estratégia B. Tal estratégia conduz a bons resultados, ou seja, é um procedimento que permite estimar componentes de covariância em menor tempo, menor número de iterações e de avaliações da verossimilhança. O sistema MTC que adota o método REML e o algoritmo EM (maximização de esperanças), com transformação canônica do vetor de observações multivariadas, mostra-se muito eficiente para análise de modelos mistos com um único fator aleatório além do erro (modelo animal ou modelo de touro). No entanto, para modelos em que se incluem efeitos aleatórios adicionais (efeito permanente de meio, por exemplo), principalmente quando não há a diagonalização perfeita da matriz de componentes de covariância G, este sistema fornece estimativas apenas aproximadas. Este também não permite análise de modelos com presença de efeito aleatório adicional correlacionado com animal (efeito materno, por exemplo) Além disso, em análise multivariada, o sistema exige igualdade de matriz de delineamento entre variáveis. Neste caso, a perda de um dado implica na perda total do registro. Trata-se de um método rápido para estimação de componentes de covariâncias e produz estimativas sempre no espaço de parâmetros. Quando a convergência ocorre próximo ao limite do espaço de parâmetros ou quando se trata de superfícies muito planas, o método de Powell, adotado no sistema DFREML, apresenta frequentemente convergência irregular ou prematura, não sendo de uso indicado nestes casos. Nos demais casos, ele apresenta-se como um método eficiente. O sistema MTDFREML mostra-se muito eficiente na procura de máximos da função de verossimilhança. No entanto, é o sistema que apresenta convergência mais lenta em análise multivariada, praticamente em todas situações avaliadas. Tal lentidão pode, em algumas situações, comprometer o uso deste, dependendo do tipo de modelo a ser analisado, número de equações e de características a serem avaliadas. No geral, os sistemas em avaliação constituem-se em ótimas ferramentas para estimação de componentes de covariância para modelos bem gerais, com grande número de classes de efeitos fixos e aleatórios.