On deceiving malware classification with section injection: attack and defense using deep neural networks

Bibliographic Details
Main Author: Silva, Adeilson Antonio da
Publication Date: 2022
Format: Master thesis
Language: eng
Source: Repositório Institucional da UFBA
Download full: https://repositorio.ufba.br/handle/ri/36683
Summary: Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩.
id UFBA-2_5aa5dec4dee9e2dbb83f6b656bc9b6cb
oai_identifier_str oai:repositorio.ufba.br:ri/36683
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling 2023-03-07T10:05:40Z2023-03-07T10:05:40Z2022-11-22SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.https://repositorio.ufba.br/handle/ri/36683Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩.We investigate how to modify executable files to deceive malware classification systems. This work’s main contribution is a methodology to inject bytes across a malware file randomly and use it both as an attack to decrease classification accuracy but also as a defensive method, augmenting the data available for training. It respects the operating system file format to make sure the malware will still execute after our injection and will not change its behavior. We reproduced five state-of-the-art malware classification approaches to evaluate our injection scheme: one based on GIST+KNN, three CNN variations and one Gated CNN. We performed our experiments on a public dataset with 9,339 malware samples from 25 different families. Our results show that a mere increase of 7% in the malware size causes an accuracy drop between 25% and 40% for malware family classification. They show that an automatic malware classification system may not be as trustworthy as initially reported in the literature. We also evaluate using modified malwares alongside the original ones to increase networks robustness against mentioned attacks. Results show that a combination of reordering malware sections and injecting random data can improve overall performance of the classification. Code available at ⟨https://github.com/adeilsonsilva/malware-injection⟩.Submitted by Adeilson Silva (adeilson.antonio@ufba.br) on 2023-03-06T11:24:19Z No. of bitstreams: 2 license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5) PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2023-03-07T10:05:40Z (GMT) No. of bitstreams: 2 PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5) license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5)Made available in DSpace on 2023-03-07T10:05:40Z (GMT). No. of bitstreams: 2 PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5) license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5) Previous issue date: 2022-11-22engUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de Computação - ICAttribution-NonCommercial-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/3.0/br/info:eu-repo/semantics/openAccessNeural NetworksMalware AnalysisMachine LearningMalware (Software)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAORedes NeuraisAnálise de MalwareAprendizado de MáquinaMalware (Software)On deceiving malware classification with section injection: attack and defense using deep neural networksSobre enganar a classificação de malware com injeção de seção: ataque e defesa usando redes neurais profundasMestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionPamplona Segundo, Mauricio0000-0003-4529-5757http://lattes.cnpq.br/9402272133670888Pamplona Segundo, Mauricio0000-0003-4529-5757http://lattes.cnpq.br/9402272133670888Agüero, Karl Philips Apaza0000-0002-0786-902Xhttp://lattes.cnpq.br/9947294815403759Wyzykowski, André Brasil Vieira0000-0002-2279-4177http://lattes.cnpq.br/92808278415268370000-0002-9851-8910http://lattes.cnpq.br/8400419718779986Silva, Adeilson Antonio dareponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBATEXTPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf.txtPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf.txtExtracted texttext/plain94261https://repositorio.ufba.br/bitstream/ri/36683/4/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf.txtd0b3f8e8627ce9c50fd27bc7defc03e2MD54ORIGINALPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdfPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdfDissertação de Mestrado de Adeilson Antonio da Silvaapplication/pdf5593004https://repositorio.ufba.br/bitstream/ri/36683/1/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf89cbb13a01c40187f844f59987db615eMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://repositorio.ufba.br/bitstream/ri/36683/2/license_rdf996f8b5afe3136b76594f43bfda24c5eMD52LICENSElicense.txtlicense.txttext/plain1715https://repositorio.ufba.br/bitstream/ri/36683/3/license.txt67bf4f75790b0d8d38d8f112a48ad90bMD53ri/366832023-03-11 02:04:17.259oai:repositorio.ufba.br:ri/36683TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIG5vIGZvcm1hdG8gaW1wcmVzc28gZS9vdSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyAKZm9ybWF0b3Mgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gZS9vdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLCBwb2RlbmRvIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSBwdWJsaWNhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBICBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSAgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08sIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28gZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttps://repositorio.ufba.br/oai/requestrepositorio@ufba.bropendoar:19322023-03-11T05:04:17Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv On deceiving malware classification with section injection: attack and defense using deep neural networks
dc.title.alternative.pt_BR.fl_str_mv Sobre enganar a classificação de malware com injeção de seção: ataque e defesa usando redes neurais profundas
title On deceiving malware classification with section injection: attack and defense using deep neural networks
spellingShingle On deceiving malware classification with section injection: attack and defense using deep neural networks
Silva, Adeilson Antonio da
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Redes Neurais
Análise de Malware
Aprendizado de Máquina
Malware (Software)
Neural Networks
Malware Analysis
Machine Learning
Malware (Software)
title_short On deceiving malware classification with section injection: attack and defense using deep neural networks
title_full On deceiving malware classification with section injection: attack and defense using deep neural networks
title_fullStr On deceiving malware classification with section injection: attack and defense using deep neural networks
title_full_unstemmed On deceiving malware classification with section injection: attack and defense using deep neural networks
title_sort On deceiving malware classification with section injection: attack and defense using deep neural networks
author Silva, Adeilson Antonio da
author_facet Silva, Adeilson Antonio da
author_role author
dc.contributor.advisor1.fl_str_mv Pamplona Segundo, Mauricio
dc.contributor.advisor1ID.fl_str_mv 0000-0003-4529-5757
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9402272133670888
dc.contributor.referee1.fl_str_mv Pamplona Segundo, Mauricio
dc.contributor.referee1ID.fl_str_mv 0000-0003-4529-5757
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/9402272133670888
dc.contributor.referee2.fl_str_mv Agüero, Karl Philips Apaza
dc.contributor.referee2ID.fl_str_mv 0000-0002-0786-902X
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/9947294815403759
dc.contributor.referee3.fl_str_mv Wyzykowski, André Brasil Vieira
dc.contributor.referee3ID.fl_str_mv 0000-0002-2279-4177
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/9280827841526837
dc.contributor.authorID.fl_str_mv 0000-0002-9851-8910
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/8400419718779986
dc.contributor.author.fl_str_mv Silva, Adeilson Antonio da
contributor_str_mv Pamplona Segundo, Mauricio
Pamplona Segundo, Mauricio
Agüero, Karl Philips Apaza
Wyzykowski, André Brasil Vieira
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Redes Neurais
Análise de Malware
Aprendizado de Máquina
Malware (Software)
Neural Networks
Malware Analysis
Machine Learning
Malware (Software)
dc.subject.por.fl_str_mv Redes Neurais
Análise de Malware
Aprendizado de Máquina
Malware (Software)
dc.subject.other.pt_BR.fl_str_mv Neural Networks
Malware Analysis
Machine Learning
Malware (Software)
description Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩.
publishDate 2022
dc.date.issued.fl_str_mv 2022-11-22
dc.date.accessioned.fl_str_mv 2023-03-07T10:05:40Z
dc.date.available.fl_str_mv 2023-03-07T10:05:40Z
dc.type.driver.fl_str_mv Mestrado Acadêmico
info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/36683
identifier_str_mv SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.
url https://repositorio.ufba.br/handle/ri/36683
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv Attribution-NonCommercial-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação (PGCOMP) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Computação - IC
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/36683/4/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf.txt
https://repositorio.ufba.br/bitstream/ri/36683/1/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf
https://repositorio.ufba.br/bitstream/ri/36683/2/license_rdf
https://repositorio.ufba.br/bitstream/ri/36683/3/license.txt
bitstream.checksum.fl_str_mv d0b3f8e8627ce9c50fd27bc7defc03e2
89cbb13a01c40187f844f59987db615e
996f8b5afe3136b76594f43bfda24c5e
67bf4f75790b0d8d38d8f112a48ad90b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv repositorio@ufba.br
_version_ 1847339303764492288