Mineração de dados para predição de falhas em sistemas de coleta de efluentes

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Silva, Brenner Biasi Souza
Orientador(a): Esquerre, Karla Patricia Santos Oliveira Rodriguez
Banca de defesa: Esquerre, Karla Patricia Santos Oliveira Rodriguez, Queiroz, Luciano Matos, Schnitman, Leizer
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia. Escola Politécnica.
Programa de Pós-Graduação: em Engenharia Industrial
Departamento: Não Informado pela instituição
País: brasil
Palavras-chave em Português:
Link de acesso: http://repositorio.ufba.br/ri/handle/ri/30626
Resumo: A ocorrência de transbordamentos nos sistemas de retenção de efluentes industriais é um aspecto ambiental e operacional importante na maioria das indústrias. O objetivo deste trabalho foi analisar o comportamento do sistema de coleta e contenção de efluentes industriais em uma refinaria de petróleo, e propor um modelo preditivo para evento de falha, transbordamento, de uma bacia de contenção. A análise inicial foi realizada utilizando técnica de agrupamento para objetos considerando Índice de Similaridade, sendo também realizado abordagem de séries temporais de precipitação pluviométrica e percentual do nível de tanques de contenção do sistema a partir da perspectiva de similaridade, da detecção de pontos de mudança e análise de tendências. Modelos preditivos foram construídos utilizando k-nearest neighbors (KNN) e Random Forest para predição de classificação, com o objetivo de indicar se a bacia de contenção transbordará numa projeção para o horizonte de 24 horas. O conjunto de metodologias de aprendizado de máquina não supervisionadas usadas aqui permite obter informações sobre eventos hidrológicos e de processo em cenários com baixa disponibilidade de dados sem a necessidade de aumentar a informação. Identificou-se que, na ausência de precipitação ou ocorrência de baixos volumes diários de precipitação, o sistema falhou, e a porcentagem de transbordamentos é maior do que o valor natural esperado. Além disso, não houveram transbordamentos em períodos chuvosos em casos de operação considerada satisfatória do sistema. Cenários e variações de técnicas de amostragem para o treinamento dos modelos de classificação foram utilizados. Os melhores resultados dos modelos preditivos construídos foram obtidos a partir do algoritmo Random Forest com emprego da técnica de reamostragem oversampling, undersampling e ROSE.