Classificação baseada em protótipos de decisão mais próximos e distâncias adaptativas

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: SILVA FILHO, Telmo de Menezes e
Orientador(a): SOUZA, Renata Maria Cardoso Rodrigues de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/29396
Resumo: A aprendizagem de máquina é um ramo da inteligência artificial, cujo objetivo é desenvolver algoritmos capazes de aprender a partir de dados a fim de realizar diferentes tarefas, como por exemplo, classificação e estimação de probabilidades de classe supervisionadas e semi-supervisionadas. Essas tarefas podem ser realizadas de forma intuitiva e com predições interpretáveis pelos métodos baseados em protótipos. Quanto a esses métodos, é preciso considerar dois pontos importantes: (i) são suscetíveis a mínimos locais causados pela má inicialização dos protótipos e (ii) são sensíveis à distância escolhida para comparar protótipos e instâncias, pois essa precisa ser capaz de modelar a variabilidade interna dos protótipos e classes para alcançar um bom desempenho. Assim, este trabalho visa a explorar a versatilidade dos métodos baseados em protótipos para apresentar soluções para as tarefas de classificação supervisionada e semi-supervisionada, ao mesmo tempo em que apresenta soluções para os dois pontos mencionados acima, principalmente na forma de novas distâncias adaptativas. Para a primeira tarefa, este trabalho introduz um novo método que apresenta uma solução para o problema dos mínimos locais e usa uma distância generalizada aplicada a dados intervalares, capaz de modelar classes desbalanceadas e sub-regiões de classe de diferentes formas e tamanhos. Esse algoritmo também é capaz de eliminar protótipos inativos e selecionar atributos automaticamente. Para a tarefa de classificação semi-supervisionada, este trabalho propõe um algoritmo de propagação de rótulos através de grafos que, ao contrário dos métodos presentes na literatura, não foca apenas na classificação de instâncias não-rotuladas, mas sim na predição de probabilidades de classe apropriadas. Este trabalho também provê uma análise de desempenho dos dois métodos propostos, comparando-os a métodos existentes, em termos de taxa de erro de classificação (primeiro método) e funções de escore apropriadas (segundo método), usando conjuntos de dados reais e sintéticos. Experimentos mostram que ambos os métodos apresentam desempenhos significativamente superiores ao estado da arte.