Bert Sherlock: refinamento de um modelo de linguagem para classificação de mensagens em investigações criminais

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Lemos, Rafael Bezerra Melo Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/591025
Resumo: Esta dissertação apresenta contribuições no campo da investigação criminal digital. Por meio do uso de um corpus de mensagens de redes sociais provenientes de telefones celulares apreendidos em prisões, um modelo de linguagem em português denominado BERT Sherlock foi aprimorado para auxiliar na classificação de trechos de conversas que possam indicar atividades criminosas. A comparação entre algoritmos que utilizam o modelo BERT Sherlock e abordagens tradicionais demonstra uma vantagem do primeiro sobre os métodos convencionais. Além disso, as análises revelaram que o BERT Sherlock é capaz de identificar mensagens suspeitas que indicam atividades ilícitas, inclusive aquelas que fazem uso de gírias e linguagem específica desconhecida pelos investigadores. Esses resultados proporcionam evidências de que o modelo é eficaz na identificação de mensagens suspeitas, considerando o contexto em que são utilizadas. A pesquisa, portanto, contribui para aumentar a eficiência dos analistas criminais ao lidar com mensagens de redes sociais em investigações criminais, especialmente aquelas relacionadas a atividades ilícitas. Palavras-chaves: Processamento de Linguagem Natural, Classificação de Mensagens Informais, Refinamento do Modelo BERTimbau, Treinamento de Modelo de Língua.