Efeito do tamanho da mostra de treinamento da predição de perfis faltantes por técnica de análise multivariada.
Ano de defesa: | 2011 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Tecnologia e Recursos Naturais - CTRN PÓS-GRADUAÇÃO EM ENGENHARIA DE MINAS UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/10580 |
Resumo: | Perfis geofísicos de poços constituem uma importante fonte de dados para a avaliação do potencial de uma dada área, com fins de exploração de recursos naturais subterrâneos. Por diversas razões, dentre as quais destacamos as dificuldades operacionais, indisponibilidade de sondas ou por questões relativas a priorização no momento da contratação do serviço de aquisição dos dados, assim sendo dificilmente se dispõe do conjunto completo de perfis, de modo que pode haver perfis faltantes em um dado poco. No entanto, uma característica marcante dos perfis geofísicos de poços e que existe certo nível de redundância entre eles, de modo que se pode fazer uso desta característica para estimar um dado perfil faltante a partir dos demais perfis disponíveis. Neste trabalho as estimativas de perfis faltantes foram realizadas através da aplicação da técnica de estatística multivariada KNN (K-esimos valores mais próximos), a qual se baseia na medição da similaridade, no espaço multidimensional, entre valores dos diversos perfis de uma amostra de treinamento. A estimativa do valor de um dado perfil faltante e obtida pela similaridade entre os perfis disponíveis e os perfis da amostra de treinamento. Em particular, neste trabalho se avaliou o efeito do tamanho da amostra de treinamento sobre a eficiência da predição pelo método KNN. Os resultados obtidos mostram que o aumento do tamanho da amostra e treinamento conduz a redução da diferença entre a curva real e a estimada. No entanto, amostras de treinamento com apenas 10% dos dados disponíveis já fornecem resultados aceitáveis de predição para os perfis cuja variação ocorre em escala linear, como os perfis de densidade, sônico, raios gama e porosidade de neutrons. Para o perfil de resistividade elétrica não se obteve resultados aceitáveis, pois o mesmo não guarda redundância em relação aos demais perfis disponíveis. |