Detalhes bibliográficos
Ano de defesa: |
2014 |
Autor(a) principal: |
SANCHES, Bruno Crivelari |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
|
Departamento: |
IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
|
País: |
Não Informado pela instituição
|
Link de acesso: |
https://repositorio.unifei.edu.br/jspui/handle/123456789/551
|
Resumo: |
O correio eletrônico ou e-mail é um dos meios de comunicação mais utilizados na atualidade. No entanto, sua grande popularidade e sua arquitetura tornaram-no alvo de mensagens spam. Mensagens spam carregam, usualmente, informes publicitários, conteúdos fraudulentos ou maliciosos e são enviadas de forma indiscriminada a muitos usuários sem que estes desejem recebê-las. Acarretam diversos prejuízos aos usuários do sistema de e-mail e desperdiçam os recursos de rede das instituições. Para eliminar estas mensagens, foram criados diversos sistemas anti-spam que analisam o conteúdo textual das mensagens e classificam-nas. Devido ao bom desempenho destes filtros, mensagens spam passaram a ocorrer em imagens. Isto tornou inútil o uso de sistemas baseados apenas em análise do conteúdo textual, fomentando, assim, o desenvolvimento dos sistemas anti-spam de imagens. O processamento de imagens é bem mais custoso computacionalmente que o processamento textual e os resultados dos sistemas anti-spam de imagens têm sido inferiores aos dos sistemas textuais. Outra dificuldade da pesquisa na área de sistemas anti-spam de imagens é devida à pouca disponibilidade de bases de dados públicas, o que dificulta a avaliação de resultados experimentais. Este trabalho propõe um sistema anti-spam de imagens que faz uso de diversos métodos de extração de características de imagens e de um modelo neural artificial, para a classificação dos e-mails. Os métodos de extração são avaliados de forma individual e de forma combinada. O modelo neural é avaliado de forma exaustiva utilizando-se bases de dados disponíveis publicamente. A utilização destas bases de dados é descrita em detalhes, de forma a facilitar a reprodução dos resultados. Além de se analisar a capacidade de classificação do sistema proposto, este trabalho avalia seus custos computacionais, incluindo os custos para a extração de características das imagens e para a classificação destas. Os resultados obtidos mostram-se promissores tanto em termos das taxas de classificações corretas e de falsos positivos produzidas pelo sistema anti-spam, quanto em termos de seu custo computacional. |