Sec4ML: anonimização de dados de incidentes de segurança da informação para tarefas de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Silva, Madalena Lopes e
Orientador(a): Cavalcanti, Maria Cláudia Reis
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto Militar de Engenharia (IME)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.repositorio.mar.mil.br/handle/ripcmb/845628
Resumo: Apesar do crescimento exponencial da World Wide Web desde sua criação, ainda há poucos conjuntos de dados disponíveis de incidentes de cibersegurança a serem reutilizados devido a várias questões, tais como preocupações de preservação da privacidade e padronização do formato de publicação de dados. Como resultado, a análise de incidentes de domínio tem um impacto precário no desenvolvimento de Sistemas de Detecção de Intrusão (IDS). As práticas LOD (Linked Open Data), que permitem o compartilhamento de dados na Web como um grafo de dados grande e interligado, juntamente com os princípios FAIR (Findable, Accessible, Interoperable, and Reusable), que orientam a publicação de dados para reutilização, podem apoiar o compartilhamento de conjuntos de dados de incidentes de segurança cibernética. Ademais, técnicas de anonimização podem ser usadas para lidar com preocupações de privacidade. Além disso, as técnicas de Aprendizado de Máquina (AM) podem ser usadas para melhorar a eficácia do IDS. Este trabalho propõe a abordagem Sec4ML que apoia a preparação de conjuntos de dados de incidentes de cibersegurança para técnicas de AM usando práticas LOD e seguindo os princípios FAIR, envolvendo, entre outros, subprocessos de anonimização e pré-processamento, que são ilustrados usando dados de conjuntos de dados públicos.