Modelo de aprendizado de máquina para detecção de consumos não autorizados no sistema de abastecimento de água de Joinville: estudo de caso aplicado em um distrito de medição e controle

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Stramari, Marcos Roberto
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.udesc.br/handle/UDESC/16792
Resumo: Entre as diversas medidas de gestão da água, destacam-se a necessidade de universalização do acesso aos recursos hídricos e a sustentabilidade dos serviços de abastecimento de água. Esses assuntos estão fortemente ligados à otimização do uso dos recursos e à gestão dos sistemas de combate a perdas de água, seja do ponto de vista operacional, combatendo as perdas físicas, assim como as perdas aparentes, que se dividem em erros de medição, falhas de cadastro e consumos não autorizados relacionados a fraudes. A ocorrência desse tipo de fraude no sistema de abastecimento de água pode resultar em prejuízos para o setor, podendo representar uma parcela expressiva do total de perdas aparentes de água. Atualmente, as companhias de abastecimento de água buscam combater o problema utilizando métodos empíricos, verificando denúncias e realizando treinamento dos funcionários responsáveis pela leitura do consumo mensal. O objetivo dessa pesquisa é apresentar um modelo de identificação de consumo ilegal de água, contribuindo para o combate às perdas aparentes no sistema originadas por consumos não autorizados. Inicialmente foi realizada uma extensa revisão bibliográfica acerca do tema abordado, identificando os métodos já pesquisados para a detecção de consumo não autorizados de água. Posteriormente, foi realizado um estudo de caso em um Distrito de Medição de Controle (DMC), localizado no munícipio de Joinville-SC, utilizando como base de dados, informações técnicas e histórico de consumo de 1.416 matrículas localizadas nessa área, fornecidas pela Companhia Águas de Joinville. A metodologia proposta utiliza um método de aprendizado de máquina denominado de Random Forest (floresta aleatória). A combinação do modelo floresta aleatória com a técnica de SMOTE para balanceamento dos dados apresentou taxas de acerto de 88,10% na classificação das fraudes na fase de treino do modelo e 88,20% na fase de teste. Com valores de acurácia balanceada acima de 75% tanto na fase de treino como na fase de teste, o modelo obtido demonstra possuir boa capacidade de classificar corretamente as fraudes e não fraudes no sistema de sistema de abastecimento de água no DMC avaliado. A utilização do modelo de classificação floresta aleatória, combinado com a técnica SMOTE para balanceamento dos dados, demonstra ser uma alternativa técnica viável para a detecção de consumos de água não autorizados