Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Macedo, Dayana Carla de lattes
Orientador(a): Francisco, Antonio Carlos de lattes
Banca de defesa: Artoni, Roberto Ferreira, Vaz, Maria Salete Marcon Gomes, Trojan, Flavio, Sola, Antonio Vanderley Herrero
Tipo de documento: Tese
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Ponta Grossa
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia de Produção
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/2481
Resumo: A respectiva pesquisa encontra-se no contexto de um ciclo produtivo de um laboratório de análises clínicas da área genômica. Esse trabalho propôs um método de redução de dimensionalidade que auxilia o diagnóstico para a medicina laboratorial genômica. O novo método de redução de dimensão de dados é chamado de DRM-F e é capaz de identificar em bases deste domínio os atributos (gene) mais relevantes, por meio de conceitos de equivalência e generalização. Foi efetuada a comparação do Método DRM-F com o Método de Seleção de Atributos. Essa comparação objetivou a avaliação do método proposto com o método já existente na mineração de dados, Seleção de Atributos. O Método DRM-F fundamentado em Framework usou conceitos de equivalência e generalização. Esses dois métodos foram aplicados no domínio de expressão de genes usando três bases, denominadas DLBCL, DLBCL Tumor sobre leucemia e ALL/AML contendo dados do linfoma. Analisando os resultados obtidos, utilizando como critérios de avaliação a Validação Cruzada, verificou-se que o uso dos métodos resultou em uma melhora nos valores de taxa de acerto quando comparados com as bases, possuindo todos os atributos no domínio de expressão gênica. Nesse domínio, o melhor método de redução foi com o uso da Abordagem Wrapper nas três bases. Não obstante, ressalta-se que o método proposto apresentou um resultado superior a 80% de taxa de acerto, não podendo ser considerado um método de redução com desempenho ruim. O Método DRM-F, embora tenha apresentado resultados inferiores ao método de Seleção de Atributos, na média geral não apresentou taxa de acerto inferior a 80% na geração de modelos preditivos. O Método DRM-F busca extrair os atributos (gene) comuns e específicos do domínio de estudo, expressão gênica, porém não somente de uma única base, mas, entre todas as bases que pertencem ao domínio. Assim, podem-se obter os atributos (gene) comuns entre as várias doenças analisadas entre as bases. No presente experimento, foi possível extrair os atributos (gene) comuns e específicos entre as doenças analisadas. Com os atributos (gene) comuns e específicos de cada doença, podem-se submeter esses subconjuntos a uma análise biológica, a fim de verificar o significado biológico dos atributos objetivando uma contribuição na área biomédica e direcionamento de diagnósticos.