ChaSAM Forensics: Uma Arquitetura para Detecção de Imagens na Forense Computacional Utilizando Hashes Perceptivos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Santos, Hericson dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02082024-103051/
Resumo: O objetivo deste trabalho foi desenvolver um algoritmo de hash perceptivo para detecção de similaridade entre imagens para ser implementado em uma arquitetura portátil e independente de plataforma computacional. Esta arquitetura tem por finalidade proporcionar ao analista forense a comparação de grandes volumes de imagens em busca de arquivos que possuem características visuais em comum. Atualmente, a grande parte das soluções forenses se baseiam em bases de hashes criptográficos, os quais apresentam deficiência neste quesito, isto é, hashes criptográficos são capazes de comparar apenas arquivos idênticos computacionalmente gerando resultados falsos negativos, pois se um arquivo for minimamente alterado em seu conteúdo, o seu valor hash mudará completamente e assim não será detectado como um arquivo de interesse. Em contrapartida, os hashes perceptivos levam em consideração as características visuais da imagem. Neste sentido dois arquivos computacionalmente diferentes, mas com similaridades visuais poderão ser apresentados como possíveis resultados desta comparação se estas diferenças visuais estiverem dentro de um intervalo de tolerância. Para sustentar o método proposto através dos hashes perceptivos foi desenvolvido um protótipo de software forense denominado ChaSAM. Para testar a eficiência e a eficácia do software foi criado um dataset de imagens composto de 12.920 arquivos, os quais foram submetidos às mais diversas transformações como: recortes, inclinações, inserção de textos e etc. Procurou-se responder se o ChaSAM apresenta eficiência, isto é, se ele é capaz de processar grandes volumes de imagens com velocidade e; se possui eficácia, isto é, os hashes perceptivos apresentam resultados mais eficazes que os hashes criptográficos. Para realizar estes testes utilizamos vários algoritmos de hashes perceptivos existentes e desenvolvemos outras duas variantes: o domiHash e o chHash. Este último apresentou resultados acima de 80% em relação aos demais algoritmos, principalmente quando executando em conjunto com outro algoritmo de hash perceptivo.