Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
Ano de defesa: | 2015 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , , , |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso embargado |
Idioma: | por |
Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Ponta Grossa |
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Engenharia de Produção
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/2481 |
Resumo: | A respectiva pesquisa encontra-se no contexto de um ciclo produtivo de um laboratório de análises clínicas da área genômica. Esse trabalho propôs um método de redução de dimensionalidade que auxilia o diagnóstico para a medicina laboratorial genômica. O novo método de redução de dimensão de dados é chamado de DRM-F e é capaz de identificar em bases deste domínio os atributos (gene) mais relevantes, por meio de conceitos de equivalência e generalização. Foi efetuada a comparação do Método DRM-F com o Método de Seleção de Atributos. Essa comparação objetivou a avaliação do método proposto com o método já existente na mineração de dados, Seleção de Atributos. O Método DRM-F fundamentado em Framework usou conceitos de equivalência e generalização. Esses dois métodos foram aplicados no domínio de expressão de genes usando três bases, denominadas DLBCL, DLBCL Tumor sobre leucemia e ALL/AML contendo dados do linfoma. Analisando os resultados obtidos, utilizando como critérios de avaliação a Validação Cruzada, verificou-se que o uso dos métodos resultou em uma melhora nos valores de taxa de acerto quando comparados com as bases, possuindo todos os atributos no domínio de expressão gênica. Nesse domínio, o melhor método de redução foi com o uso da Abordagem Wrapper nas três bases. Não obstante, ressalta-se que o método proposto apresentou um resultado superior a 80% de taxa de acerto, não podendo ser considerado um método de redução com desempenho ruim. O Método DRM-F, embora tenha apresentado resultados inferiores ao método de Seleção de Atributos, na média geral não apresentou taxa de acerto inferior a 80% na geração de modelos preditivos. O Método DRM-F busca extrair os atributos (gene) comuns e específicos do domínio de estudo, expressão gênica, porém não somente de uma única base, mas, entre todas as bases que pertencem ao domínio. Assim, podem-se obter os atributos (gene) comuns entre as várias doenças analisadas entre as bases. No presente experimento, foi possível extrair os atributos (gene) comuns e específicos entre as doenças analisadas. Com os atributos (gene) comuns e específicos de cada doença, podem-se submeter esses subconjuntos a uma análise biológica, a fim de verificar o significado biológico dos atributos objetivando uma contribuição na área biomédica e direcionamento de diagnósticos. |