A machine learning approach for petroleum production forecasting in a digital twin

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Pivetta, Marcos Vinicius Ludwig
Orientador(a): Carbonera, Joel Luis
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/275440
Resumo: Os Gêmeos Digitais (GDs), uma tecnologia de ponta na Indústria 4.0, encontram amplas aplicações no setor de Óleo e Gás (O&G), especialmente na gestão de desempenho de ativos. Ao replicar virtualmente um ativo físico, os GDs fornecem uma plataforma digital para explorar vários cenários e estratégias de resolução de problemas sem interromper os processos operacionais. A integração dos princípios dos GDs e técnicas de Aprendizado de Máquina (AM) oferece uma promessa importante para aprimorar as capacidades de previsão de produção na indústria de O&G, possibilitando uma tomada de decisão mais informada e uma gestão de produção mais eficiente. Métodos tradicionais de previsão de produção na indústria têm limitações, como dependência da experiência especializada, disponibilidade de dados e custos computacionais. A utilização de algoritmos de AM oferece uma alternativa promissora aos métodos complexos. Neste trabalho, propomos um componente Prova de Conceito (POC) para GDs capaz de treinar modelos de AM para previsão de petróleo, executá-los em cenários hipotéticos e apresentar os resultados ao usuário final. Também reunimos resultados e insights de uma estratégia de seleção de modelo executada por esse componente de GD. Esta estratégia investigou o impacto no desempenho do modelo de: (1) diferentes tamanhos de janelas amostrais de treinamento, (2) uso de variáveis operacionais futuras e (3) escolha de diferentes frequências de amostragem de dados. A arquitetura proposta atendeu aos requisitos das partes interessadas e serve como um componente de gêmeo digital adequado para o setor de upstream. Os resultados da estratégia de comparação de modelos mostraram que o modelo de árvore ensemble XGBoost apresentou melhor desempenho do que as técnicas de aprendizado profundo para este conjunto de dados específico. Verificamos que o tamanho ideal da janela amostral depende da frequência de amostragem dos dados. Também determinamos que a incorporação de características operacionais futuras melhora o desempenho do modelo. Concluímos que são necessários melhores padrões para previsões de petróleo baseadas em dados, especialmente quanto as práticas de pré-processamento e seleção de features, que necessitam de uma avaliação mais aprofundada.