Detalhes bibliográficos
Ano de defesa: |
2014 |
Autor(a) principal: |
SANTOS, Rafael Henrique da Silva |
Orientador(a): |
GUIMARÃES, Katia Silva |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/11968
|
Resumo: |
O Vírus da Imunodeficiência Humana (HIV) vem causando a morte de milhões de vítimas todos os anos. Trata-se de um retrovírus capaz de alterar o material genético das células hospedeiras, utilizando-as para produzir cópias de si. Nesse processo de replicação, podem ocorrer falhas no pareamento das bases nitrogenadas, resultando em mutações do HIV. Essas mutações são as responsáveis pela resistência aos medicamentos antirretrovirais e fazem com que o sistema imunológico do hospedeiro não reconheça mais o vírus. Assim, identificar as mutações no HIV que levam à resistência do vírus a certos medicamentos e predizer se o paciente terá uma resposta satisfatória a terapia antes mesmo dela ser iniciada, é de fundamental importância para o sucesso do tratamento. Muitos métodos estatísticos e de aprendizagem de máquina têm sido aplicados para tentar solucionar esse problema. Nesse trabalho, dados de indivíduos com HIV foram utilizados para desenvolver modelos responsáveis por predizer a resposta dos pacientes ao tratamento antirretroviral. Informações clínicas (carga viral e quantidade de células T-CD4+) juntamente com sequências de RNA do vírus (transcriptase reversa e protease) foram empregadas no treinamento dos classificadores Perceptron Multicamadas, Função de Base Radial, e Máquinas de Vetor Suporte. O algoritmo SMOTE foi aplicado para lidar com a enorme diferença entre o número de amostras de casos e controles, o que foi crucial para a precisão dos modelos. Os resultados mostram que o modelo SVM é mais preciso do que os outros dois, com uma área de curva ROC de 0,9398. Dos 1000 pacientes, 646 foram preditos corretamente por todos os modelos, ao passo que 69 foram classificados incorretamente na mesma situação. Analisando esses dados mais atentamente, foram identificados códons e propriedades importantes na diferenciação desses dois grupos de pacientes. Entre os códons identificados, alguns tem respaldo na literatura e outros são novos. A análise empregada oferece várias informações que podem ser muito úteis na predição da resposta de pacientes ao tratamento antirretroviral. |