Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Vilca Zuñiga, Esteban Wilfredo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/
Resumo: A democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção.