Agrupamento e regressão linear de dados simbólicos intervalares baseados em novas representações

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: SOUZA, Leandro Carlos de
Orientador(a): SOUZA, Renata Maria Cardoso Rodrigues da
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/17640
Resumo: Um intervalo é um tipo de dado complexo usado na agregação de informações ou na representação de dados imprecisos. Este trabalho apresenta duas novas representações para intervalos com o objetivo de se construir novos métodos de agrupamento e regressão linear para este tipo de dado. O agrupamento por nuvens dinâmicas define partições nos dados e associa protótipos a cada uma destas partições. Os protótipos resumem a informação das partições e são usados na minimização de um critério que depende de uma distância, responsável por quantificar a proximidade entre instâncias e protótipos. Neste sentido, propõe-se a formulação de uma nova distância híbrida entre intervalos baseando-se em distâncias para pontos. Os pontos utilizados são obtidos dos intervalos através de um mapeamento. Também são propostas duas versões com pesos para a distância criada: uma com pesos no hibridismo e outra com pesos adaptativos. Na regressão linear, propõe-se a representação dos intervalos através da equação paramétrica da reta. Esta parametrização permite o ajuste dos pontos nas variáveis regressoras que dão as melhores estimativas para os limites da variável resposta. Antes da realização da regressão, um critério é calculado para a verificação da coerência matemática da predição, na qual o limite superior deve ser maior ou igual ao inferior. Se o critério mostra que a coerência não é garantida, propõe-se a aplicação de uma transformação sobre a variável resposta. Assim, este trabalho também propõe algumas transformações que podem ser aplicadas a dados intervalares, no contexto de regressão. Dados sintéticos e reais são utilizados para comparar os métodos provenientes das representações propostas e aqueles presentes na literatura.