Um modelo baseado em regras para a detecção de bots no Twitter

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Leite, Maria Alice Gomes Lopes
Orientador(a): Guelpeli, Marcus Vinícius Carvalho
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: UFVJM
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f
Resumo: O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.