Proposta de métodos de clusterização de dados com validação por testes de heterogeneidade e discordância aplicados à regionalização de bacias hidrográficas

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Oliveira, Leroi Floriano de
Orientador(a): Aguiar, Marilton Sanchotene de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/4352
Resumo: Através da regionalização de bacias hidrográficas, é possível, dentre outras aplicações, fazer previsões estatísticas de vazões máximas e mínimas em cursos d’água. Diversos estudos demonstram bons resultados na utilização de clusterização para a formação de melhores regiões do ponto de vista hidrológico. Este trabalho aplica técnicas de aprendizado de máquina para a formação de regiões hidrologicamente homogêneas. Mais especificamente, neste trabalho foi explorada a utilização dos métodos: k-means, affinnity propagation, aglomerative clustering e regions of influence para a formação de regiões, fazendo-se, portanto, uma comparação entre os métodos e a utilização de técnicas de seleção de atributos. Ainda, neste trabalho também são propostos três métodos para a solução do problema, utilizando ajuste dos clusters com base nas medidas de heterogeneidade e discordância de Hosking. Dois destes métodos utilizam o algoritmo k-means fazendo variações nos clusters iniciais de forma a buscar centroides que melhor representem regiões hidrologicamente homogêneas. O outro método combina resultados de clusterização com o método regions of influence. Com os métodos propostos, foi possível alcançar uma melhora, de 63,2% para 90,5% de aproveitamento das regiões formadas para a aplicação da análise de frequência regional. Com este trabalho, concluiu-se que os atributos selecionados apresentaram melhores resultados que a utilização de todos os atributos; e, que os métodos propostos demonstram grande potencial, visto que apresentaram melhores resultados que outros métodos já existentes.