Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar

Detalhes bibliográficos
Ano de defesa: 2001
Autor(a) principal: Moreira, Jeanete Alves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-150114/
Resumo: Em muitos trabalhos científicos, o interesse dos pesquisadores está em identificar variáveis ou fatores que influenciem no tempo de ocorrência de um determinado evento, o qual geralmente é conhecido como tempo de falha. Nem sempre, porém, é possível observar o tempo exato de ocorrência da falha, conhecendo-se somente o intervalo em que a mesma ocorreu. Dados deste tipo são conhecidos como agrupados ou de sobrevivência com censura intervalar e apresentam observações empatadas. Quando o número de empates é pequeno, a análise desses dados pode ser feita através do ajuste do modelo de Cox (Cox, 1972) considerando-se aproximações para a verossimilhança parcial. No caso de ocorrerem muitos empates, deve-se considerar o tempo como discreto e modelar a probabilidade de ocorrência do evento num determinado intervalo, dado que ele não ocorreu no intervalo imediatamente anterior. Isto pode ser feito considerando-se a variável resposta como uma variável indicadora de falha, que é binária, e ajustando-se os modelos de Cox para dados agrupados ou o modelo logístico, através dos modelos lineares generalizados com funções de ligação complemento log-log e logit, respectivamente. Após o ajuste dos modelos, existe o interesse em selecionar qual deles melhor se adequa aos dados experimentais. Para isto, algumas técnicas de seleção de modelos estão disponíveis na literatura, como o Critério de Informação de Akaike (Akaike, 1973), os Testes Escores propostos por Colosimo et al. (2000), dentre outras. Este trabalho propõe uma nova metodologia para a seleção entre os modelos de Cox e logístico para dados de sobrevivência com censura intervalar, utilizando o método de reamostragem bootstrap dos resíduos. Isto é feito extraindo-se os resíduos dos ajustes dos modelos propostos e calculando-se a diferença de deviances entre os modelos ajustados. Após isto, as novas observações são recompostas a partir dos resíduos bootstrap e novas diferenças de deviances são calculadas. Um histograma para esses valores é, então, obtido e um nível de significância empírico é proposto comparando-se os valores das diferenças de deviances das amostras bootstrap com a diferença de deviances inicial. Os resíduos utilizados são os resíduos simples, de Pearson e de Pearson padronizados. A aplicação da técnica é realizada através de dois conjuntos de dados de experimentos agronômicos, em que, no primeiro, a variável resposta foi o tempo até a murcha de um cultivar de linho susceptível ao patógeno Fusarium oxysporum e, no segundo, a variável resposta é o tempo até o inseto Podysus nigrispinus atingir a fase adulta. O método bootstrap indicou evidência de que o modelo logístico é o mais adequado para ajustar os dados do experimento com linho. Já no caso do experimento com insetos, o método indicou o modelo de Cox como o mais adequado aos dados e o resíduo de Pearson e Pearson padronizado, em ambos os casos, foram os que forneceram uma maior indicação para a escolha dos modelos em questão.