Machine learning algorithms for assessment and prediction of the performance of wastewater treatment plants

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Marina Salim Dantas
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Minas Gerais
Brasil
ENG - DEPARTAMENTO DE ENGENHARIA SANITÁRIA E AMBIENTAL
Programa de Pós-Graduação em Saneamento, Meio Ambiente e Recursos Hídricos
UFMG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/77984
https://orcid.org/0000-0002-7084-7798
Resumo: O lançamento de efluentes domésticos brutos ou tratados de maneira insuficiente representa a maior pressão sobre os recursos hídricos no Brasil. Estações de tratamento de esgotos (ETEs) são essenciais para a garantia da saúde pública e ambiental. No entanto, problemas de projeto e operação podem levar à geração de efluentes em desconformidades com padrões ambientais. Desta forma, o monitoramento dos processos de tratamento é de fundamental importância, permitindo a análise dos dados gerados nos programas de monitoramento e ampliando o conhecimento sobre os sistemas em operação, com reflexos positivos no desempenho dos processos. Técnicas que utilizam o aprendizado de máquina, definido como um conjunto de ferramentas que utilizam computadores para transformar dados em conhecimento, são promissoras para o monitoramento de processos de tratamento de esgotos. Dentre os algoritmos existentes, as redes neurais artificiais (RNAs) têm sido amplamente empregadas no setor, uma vez que são robustas e eficientes para lidar com dados não lineares e complexos, como os dados de monitoramento de estações de tratamento de esgotos. A configuração dos modelos e seus hiperparâmetros é uma tarefa essencial para um desempenho satisfatório dos modelos preditivos. Apesar disso, não existe um direcionamento sobre as melhores práticas de configuração dos modelos de RNAs, e esta tarefa é deixada a cargo da experiência do pesquisador. Neste estudo, uma revisão sistemática da literatura sobre o uso de RNAs na previsão do desempenho de ETEs em escala real foi conduzida. Publicações que modelaram diferentes sistemas de tratamento de efluentes domésticos em diversos países foram levantadas e selecionadas e as principais características dos modelos utilizados foram identificadas. Em seguida, o estudo selecionou uma ETE em operação no Brasil e uma nos Estados Unidos como estudos de caso para aplicação da ferramenta. A ETE Brasília Sul foi escolhida por ser a maior ETE do Distrito Federal em termos de vazão de projeto e apresentar tecnologia de tratamento avançada para a remoção de nitrogênio e fósforo. A ETE John E. Egan, em operação em Illinois/EUA, foi selecionada por possuir porte similar à ETE Brasília Sul, mas banco de dados com diferentes características, o que poderia levar a melhor desempenho do modelo de RNA. Análises aprofundadas foram conduzidas nos dados de monitoramento para compreender o desempenho das ETEs e identificar importantes definições para a etapa de aplicação dos modelos. A última etapa da pesquisa foi a aplicação das RNAs para a previsão das concentrações efluentes, principalmente de nutrientes, nas ETEs Brasília Sul e John E. Egan. De maneira geral, os modelos tiveram adequado desempenho preditivo. No entanto, para os modelos da ETE Brasília Sul, houve maior sobreajuste aos dados de treinamento, o que levou a um declínio no desempenho durante o teste dos modelos. Os resultados podem ser explicados devido às diferentes tecnologias de tratamento e distintas características dos bancos de dados das estações, como número de observações e frequências de monitoramento. Espera-se que este trabalho contribua para a melhor gestão dos sistemas de esgotamento sanitário no Brasil, principalmente no que diz respeito à avaliação e previsão do desempenho de processos.