Detecção de Spam em Imagens Usando Redes Neurais Artificiais.

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: SANCHES, Bruno Crivelari
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
Departamento: IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
País: Não Informado pela instituição
Link de acesso: https://repositorio.unifei.edu.br/jspui/handle/123456789/551
Resumo: O correio eletrônico ou e-mail é um dos meios de comunicação mais utilizados na atualidade. No entanto, sua grande popularidade e sua arquitetura tornaram-no alvo de mensagens spam. Mensagens spam carregam, usualmente, informes publicitários, conteúdos fraudulentos ou maliciosos e são enviadas de forma indiscriminada a muitos usuários sem que estes desejem recebê-las. Acarretam diversos prejuízos aos usuários do sistema de e-mail e desperdiçam os recursos de rede das instituições. Para eliminar estas mensagens, foram criados diversos sistemas anti-spam que analisam o conteúdo textual das mensagens e classificam-nas. Devido ao bom desempenho destes filtros, mensagens spam passaram a ocorrer em imagens. Isto tornou inútil o uso de sistemas baseados apenas em análise do conteúdo textual, fomentando, assim, o desenvolvimento dos sistemas anti-spam de imagens. O processamento de imagens é bem mais custoso computacionalmente que o processamento textual e os resultados dos sistemas anti-spam de imagens têm sido inferiores aos dos sistemas textuais. Outra dificuldade da pesquisa na área de sistemas anti-spam de imagens é devida à pouca disponibilidade de bases de dados públicas, o que dificulta a avaliação de resultados experimentais. Este trabalho propõe um sistema anti-spam de imagens que faz uso de diversos métodos de extração de características de imagens e de um modelo neural artificial, para a classificação dos e-mails. Os métodos de extração são avaliados de forma individual e de forma combinada. O modelo neural é avaliado de forma exaustiva utilizando-se bases de dados disponíveis publicamente. A utilização destas bases de dados é descrita em detalhes, de forma a facilitar a reprodução dos resultados. Além de se analisar a capacidade de classificação do sistema proposto, este trabalho avalia seus custos computacionais, incluindo os custos para a extração de características das imagens e para a classificação destas. Os resultados obtidos mostram-se promissores tanto em termos das taxas de classificações corretas e de falsos positivos produzidas pelo sistema anti-spam, quanto em termos de seu custo computacional.