Aplicação de inteligência artificial e machine learning em dados litoestratigráficos e geofísicos das expedições do Programa Internacional de Descobertas Oceânicas (IODP)

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Bressan, Thiago Santi
Orientador(a): Chemale Junior, Farid
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade do Vale do Rio dos Sinos
Programa de Pós-Graduação: Programa de Pós-Graduação em Geologia
Departamento: Escola Politécnica
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://www.repositorio.jesuita.org.br/handle/UNISINOS/9664
Resumo: Ferramentas computacionais específicas auxiliam o geólogo a identificar litologias e o empilhamento estratigráfico em perfuração de poços, reduzindo custos operacionais e gerenciando tempo de trabalho prático dos profissionais, direcionando-os para interpretações eficientes de dados ou mesmo no aprimoramento das pesquisas científicas na região o trabalho ou em regiões geologicamente distintas. Neste estudo, a aplicação de algoritmos de aprendizado de máquina para a classificação supervisionada de litologias foi avaliada. Foram utilizados dados de registros de parâmetros multivariados em poços offshore, relacionados ao Programa Internacional de Descobertas Oceânicas (IODP) com dados supervisionados e não supervisionados (imagens), com a criação de um contexto de aplicação híbrida de algoritmos, dividida em dois manuscritos. No manuscrito I, por meio da análise das litologias propostas em 7 Expedições IODP e do uso da utilização dos algoritmos, foi possível agrupar e dividir os conjuntos litológicos em quatro grupos de litologias e templates. As propriedades geofísicas utilizadas no presente estudos incluíram GRA, PWL, MS, RSC e SRM. Os templates foram submetidos a treinamento e testes pelos métodos Multi-Layer Perceptron (MLP), DecisionTree, RandomForest e Support Vector Machine (SVM) utilizando como avaliação dos resultados as métricas de classificação. Como resultado, observou-se que Template1 obteve melhores resultados no algoritmo MLP, Template2 e Template3 obtiveram melhores resultados no algoritmo RandomForest acima de 80,00% de acurácia. Para Cross-validation, o algoritmo RandomForest obteve ótimo desempenho em todos os cenários. No Practical Template, o grupo de litologia G2 obteve melhor resultado com o algoritmo MLP com acurácia média superior a 85,00%. Para o manuscrito II, a divisão dos dados incluiu a formatação de três conjuntos de dados: dataset0, dataset1 e dataset2, especificamente com os dados obtidos durante a Expedição IODP 362. As propriedades petrofísicas utilizadas incluíram PWL, GRA, RSC, NGR, MAD, MS, RGB e imagens de alta definição. Dataset0 incluiu dados de formação temporária para validar o melhor interpolador. O dataset1 possui os dados interpolados das propriedades petrofísicas, perfazendo um total de 295.945 registros para U1480 e U1481 com 17 features. O dataset2 abrange os dados de textura e cor extraídos da segmentação das imagens, perfazendo um total de 85.058 registros para o U1480 e U1481, com 90 features. Cada conjunto de dados é replicado em dois grupos de litologia: Grupo 1 e Grupo 2. Para o dataset2, novas combinações são adicionadas entre as features formando 102 arranjos práticos com resultados específicos em cada combinação. Os valores foram interpolados por Linear, Spline, Slinear, Quadratic, Cubic, Akima, Pchip e Piecewise. O método de aprendizado de máquina empregado para todos os datasets é o RamdomForest. Os resultados mostram que o melhor interpolador avaliado no dataset0 é o Akima com acurácia igual a 98,22%. Para dataset1, U1480, o valor de acurácia é 96,96% na combinação de 70% de treinamento e 30% de teste no Grupo 1 e 97,71% na combinação de 70% de treinamento e 30% de teste no Grupo 2. Para dataset1, U1481, o valor de acurácia é 99,68% na combinação de 80% de treinamento e 20% de teste no Grupo 1 e 99,74% na combinação de 80% de treinamento e 20% de teste no Grupo 2. Para o dataset2, os arranjos práticos melhores avaliados são o 51 (Grupo 1) e o 102 (Grupo 2) para U1480 e os arranjos práticos 32, 33, 44, 45 e 51 (Grupo 1) e 102 (Grupo 2) para U1481. Em relação ao novo método Area Superpixel (Apx), os melhores resultados estão no Grupo 1 com maior combinação de treinamento e menor combinação de testes. Os conjuntos de dados avaliados foram agrupados numa organização entre os locais da expedição, em que se gerou um contexto de aplicação prática real na atividade diária do geólogo com excelentes resultados de classificação litológica. A interpolação de propriedades petrofísicas é válida e necessária quando há poucos dados para treinamento respeitando as características de cada propriedade e interpolador. Propriedades extraídas das imagens são relevantes e agrupadas em conjunto com as propriedades petrofísicas criam um contexto de extrema importância na descoberta e apresentação da informação para o profissional geólogo.