Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Lira, Diego Bezerra |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07122022-101230/
|
Resumo: |
O Twitter é uma importante mídia social, mas sofre com a presença constante de bots, perfis controlados por algoritmos. Esses bots podem ser malignos, se passando por usuários humanos e distorcendo o discurso da rede. Para possibilitar sua detecção, sistemas baseados em aprendizado de máquina são a solução mais comum. Entretanto, esses sistemas geralmente são limitados, pois só detectam tipos de bots muito próximos aos encontrados nos conjuntos de treinamento utilizados. Para remediar essa situação, a literatura explorou algumas opções, mas o uso de agrupamento para melhorar o desempenho nessa tarefa ainda é pouco difundido. O presente projeto avaliou alguns tipos de pré-processamento, utilizando um algoritmo de agrupamento, e conseguiu mostrar uma melhora nos resultados em parcela razoável dos testes. Neste trabalho também foi avaliado como os detectores mais comuns se comportam num cenário de mudança entre os dados de treino e o uso do modelo em outras bases de dados, justificando uma forma diferente de avaliar os resultados. Como conclusões, foi observado que uma avaliação em vários conjuntos de dados é necessária para um correto entendimento da performance, e os pré-processamentos avaliados são alternativas válidas que podem ser testadas para melhorar a performance dos modelos |