Mínimos quadrados para problemas de múltiplas classes envolvendo twin support vector machine e aplicações de mineração de dados
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Goiás
Instituto de Informática - INF (RG) Brasil UFG Programa de Pós-graduação em Ciência da Computação em Rede UFG/UFMS (INF) |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/11066 |
Resumo: | Mineração de dados é uma área emergente, devido à quantidade crescente de dados produzidos nas mais variadas áreas. Neste contexto, as máquinas de vetores de suportes duplos (TWSVM) têm recebido muita atenção por partes de pesquisadores. Elaboramos um algoritmo seletor de variáveis e um algoritmo para problemas de múltiplas classes baseado no TWSVM. Esse algoritmo de aprendizagem com saídas ternárias {-1,0,+1} é baseado na teoria de vetores de suporte de Vapnik, e avalia todas as amostras de treinamento com uma estrutura 1-×-1-×-restante, durante a fase de decomposição. Uma das principais vantagens do algoritmo proposto é que utilizamos a versão mínimos quadrados para problemas de múltiplas classes, onde é necessário resolver dois sistemas de equações lineares, ao contrário do TWSVM em que é necessário resolver dois problemas de programação quadrática. Implementamos o princípio de minimização do risco estrutural, a fim de melhorar a habilidade de generalização. Utilizamos a fórmula de Sherman-Morisson-Woodbury com o intuito de reduzir a complexidade na formulação não linear do algoritmo. Abordamos também aplicações de técnicas de mineração de dados que combinam a utilização de técnicas analíticas com algoritmos de mineração de dados na classificação de diversas amostras, podendo ser considerada uma excelente ferramenta na detecção de fraudes de diversos tipos, como na verificação de produtos cultivados nos sistemas orgânicos ou convencional, a fim de diferenciá-los, e também na verificação quanto a origem geográfica de vinhos produzidos de um determinado tipo de uva. |