Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Lima, Márcio Dias de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Instituto de Informática - INF (RG)
Brasil
UFG
Programa de Pós-graduação em Ciência da Computação em Rede UFG/UFMS (INF)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
SVM
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/11066
Resumo: Mineração de dados é uma área emergente, devido à quantidade crescente de dados produzidos nas mais variadas áreas. Neste contexto, as máquinas de vetores de suportes duplos (TWSVM) têm recebido muita atenção por partes de pesquisadores. Elaboramos um algoritmo seletor de variáveis e um algoritmo para problemas de múltiplas classes baseado no TWSVM. Esse algoritmo de aprendizagem com saídas ternárias {-1,0,+1} é baseado na teoria de vetores de suporte de Vapnik, e avalia todas as amostras de treinamento com uma estrutura 1-×-1-×-restante, durante a fase de decomposição. Uma das principais vantagens do algoritmo proposto é que utilizamos a versão mínimos quadrados para problemas de múltiplas classes, onde é necessário resolver dois sistemas de equações lineares, ao contrário do TWSVM em que é necessário resolver dois problemas de programação quadrática. Implementamos o princípio de minimização do risco estrutural, a fim de melhorar a habilidade de generalização. Utilizamos a fórmula de Sherman-Morisson-Woodbury com o intuito de reduzir a complexidade na formulação não linear do algoritmo. Abordamos também aplicações de técnicas de mineração de dados que combinam a utilização de técnicas analíticas com algoritmos de mineração de dados na classificação de diversas amostras, podendo ser considerada uma excelente ferramenta na detecção de fraudes de diversos tipos, como na verificação de produtos cultivados nos sistemas orgânicos ou convencional, a fim de diferenciá-los, e também na verificação quanto a origem geográfica de vinhos produzidos de um determinado tipo de uva.