On deceiving malware classification with section injection: attack and defense using deep neural networks
| Main Author: | |
|---|---|
| Publication Date: | 2022 |
| Format: | Master thesis |
| Language: | eng |
| Source: | Repositório Institucional da UFBA |
| Download full: | https://repositorio.ufba.br/handle/ri/36683 |
Summary: | Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩. |
| id |
UFBA-2_5aa5dec4dee9e2dbb83f6b656bc9b6cb |
|---|---|
| oai_identifier_str |
oai:repositorio.ufba.br:ri/36683 |
| network_acronym_str |
UFBA-2 |
| network_name_str |
Repositório Institucional da UFBA |
| repository_id_str |
1932 |
| spelling |
2023-03-07T10:05:40Z2023-03-07T10:05:40Z2022-11-22SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.https://repositorio.ufba.br/handle/ri/36683Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩.We investigate how to modify executable files to deceive malware classification systems. This work’s main contribution is a methodology to inject bytes across a malware file randomly and use it both as an attack to decrease classification accuracy but also as a defensive method, augmenting the data available for training. It respects the operating system file format to make sure the malware will still execute after our injection and will not change its behavior. We reproduced five state-of-the-art malware classification approaches to evaluate our injection scheme: one based on GIST+KNN, three CNN variations and one Gated CNN. We performed our experiments on a public dataset with 9,339 malware samples from 25 different families. Our results show that a mere increase of 7% in the malware size causes an accuracy drop between 25% and 40% for malware family classification. They show that an automatic malware classification system may not be as trustworthy as initially reported in the literature. We also evaluate using modified malwares alongside the original ones to increase networks robustness against mentioned attacks. Results show that a combination of reordering malware sections and injecting random data can improve overall performance of the classification. Code available at ⟨https://github.com/adeilsonsilva/malware-injection⟩.Submitted by Adeilson Silva (adeilson.antonio@ufba.br) on 2023-03-06T11:24:19Z No. of bitstreams: 2 license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5) PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2023-03-07T10:05:40Z (GMT) No. of bitstreams: 2 PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5) license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5)Made available in DSpace on 2023-03-07T10:05:40Z (GMT). No. of bitstreams: 2 PGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf: 5593004 bytes, checksum: 89cbb13a01c40187f844f59987db615e (MD5) license_rdf: 1037 bytes, checksum: 996f8b5afe3136b76594f43bfda24c5e (MD5) Previous issue date: 2022-11-22engUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de Computação - ICAttribution-NonCommercial-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/3.0/br/info:eu-repo/semantics/openAccessNeural NetworksMalware AnalysisMachine LearningMalware (Software)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAORedes NeuraisAnálise de MalwareAprendizado de MáquinaMalware (Software)On deceiving malware classification with section injection: attack and defense using deep neural networksSobre enganar a classificação de malware com injeção de seção: ataque e defesa usando redes neurais profundasMestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionPamplona Segundo, Mauricio0000-0003-4529-5757http://lattes.cnpq.br/9402272133670888Pamplona Segundo, Mauricio0000-0003-4529-5757http://lattes.cnpq.br/9402272133670888Agüero, Karl Philips Apaza0000-0002-0786-902Xhttp://lattes.cnpq.br/9947294815403759Wyzykowski, André Brasil Vieira0000-0002-2279-4177http://lattes.cnpq.br/92808278415268370000-0002-9851-8910http://lattes.cnpq.br/8400419718779986Silva, Adeilson Antonio dareponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBATEXTPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf.txtPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdf.txtExtracted texttext/plain94261https://repositorio.ufba.br/bitstream/ri/36683/4/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf.txtd0b3f8e8627ce9c50fd27bc7defc03e2MD54ORIGINALPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdfPGCOMP-2022-Dissertação_Mestrado-Adeilson_Silva.pdfDissertação de Mestrado de Adeilson Antonio da Silvaapplication/pdf5593004https://repositorio.ufba.br/bitstream/ri/36683/1/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf89cbb13a01c40187f844f59987db615eMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://repositorio.ufba.br/bitstream/ri/36683/2/license_rdf996f8b5afe3136b76594f43bfda24c5eMD52LICENSElicense.txtlicense.txttext/plain1715https://repositorio.ufba.br/bitstream/ri/36683/3/license.txt67bf4f75790b0d8d38d8f112a48ad90bMD53ri/366832023-03-11 02:04:17.259oai:repositorio.ufba.br:ri/36683TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIG5vIGZvcm1hdG8gaW1wcmVzc28gZS9vdSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyAKZm9ybWF0b3Mgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gZS9vdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLCBwb2RlbmRvIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSBwdWJsaWNhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBICBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSAgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08sIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28gZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttps://repositorio.ufba.br/oai/requestrepositorio@ufba.bropendoar:19322023-03-11T05:04:17Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
| dc.title.pt_BR.fl_str_mv |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| dc.title.alternative.pt_BR.fl_str_mv |
Sobre enganar a classificação de malware com injeção de seção: ataque e defesa usando redes neurais profundas |
| title |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| spellingShingle |
On deceiving malware classification with section injection: attack and defense using deep neural networks Silva, Adeilson Antonio da CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Redes Neurais Análise de Malware Aprendizado de Máquina Malware (Software) Neural Networks Malware Analysis Machine Learning Malware (Software) |
| title_short |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| title_full |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| title_fullStr |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| title_full_unstemmed |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| title_sort |
On deceiving malware classification with section injection: attack and defense using deep neural networks |
| author |
Silva, Adeilson Antonio da |
| author_facet |
Silva, Adeilson Antonio da |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Pamplona Segundo, Mauricio |
| dc.contributor.advisor1ID.fl_str_mv |
0000-0003-4529-5757 |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9402272133670888 |
| dc.contributor.referee1.fl_str_mv |
Pamplona Segundo, Mauricio |
| dc.contributor.referee1ID.fl_str_mv |
0000-0003-4529-5757 |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/9402272133670888 |
| dc.contributor.referee2.fl_str_mv |
Agüero, Karl Philips Apaza |
| dc.contributor.referee2ID.fl_str_mv |
0000-0002-0786-902X |
| dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/9947294815403759 |
| dc.contributor.referee3.fl_str_mv |
Wyzykowski, André Brasil Vieira |
| dc.contributor.referee3ID.fl_str_mv |
0000-0002-2279-4177 |
| dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/9280827841526837 |
| dc.contributor.authorID.fl_str_mv |
0000-0002-9851-8910 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/8400419718779986 |
| dc.contributor.author.fl_str_mv |
Silva, Adeilson Antonio da |
| contributor_str_mv |
Pamplona Segundo, Mauricio Pamplona Segundo, Mauricio Agüero, Karl Philips Apaza Wyzykowski, André Brasil Vieira |
| dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Redes Neurais Análise de Malware Aprendizado de Máquina Malware (Software) Neural Networks Malware Analysis Machine Learning Malware (Software) |
| dc.subject.por.fl_str_mv |
Redes Neurais Análise de Malware Aprendizado de Máquina Malware (Software) |
| dc.subject.other.pt_BR.fl_str_mv |
Neural Networks Malware Analysis Machine Learning Malware (Software) |
| description |
Neste trabalho investigamos como modificar arquivos executáveis de software com o intuito de enganar sistemas automatizados de classificação de malwares. A principal contribuição deste trabalho consiste em uma metodologia para injetar bytes em um arquivo aleatoriamente e utilizar isso como ataque para reduzir a acurácia da classificação, mas também como um método de defesa, aumentando a quantidade de dados disponı́veis durante o treino desses sistemas. A injeção mencionada respeita o formato de arquivos do sistema operacional, de forma a garantir que o malware ainda será executável depois das modificações e não terá seu comportamento modificado. Nós reproduzimos cinco abordagens diferentes do estado da arte para classificação de malwares e avaliamos nosso esquema de injeção de dados: um baseado em GIST+KNN, três variações de CNN e uma Gated CNN. Nossos experimentos foram feitos utilizando um dataset disponı́vel publicamente com 9339 exemplares de malware de 25 famı́lias diferentes. Nossos resultados mostram que um simples aumento de 7% no tamanho do malware pode causar uma diminuição entre 25% e 40% na classificação de famı́lias. Eles mostram também que um sistema automatizado de classificação pode não ser tão confiável quanto inicialmente reportado na literatura. Nós avaliamos também a utilização de malwares modificados em conjunto aos originais para aumentar a robustez da rede contra os ataques mencionados. Os resultados apontam que uma combinação da reordenação das seções dos malwares com a injeção de dados pode resultar em uma melhora no desempenho da classificação. Os códigos utilizados estão disponı́veis em ⟨https://github.com/adeilsonsilva/malware-injection⟩. |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022-11-22 |
| dc.date.accessioned.fl_str_mv |
2023-03-07T10:05:40Z |
| dc.date.available.fl_str_mv |
2023-03-07T10:05:40Z |
| dc.type.driver.fl_str_mv |
Mestrado Acadêmico info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufba.br/handle/ri/36683 |
| identifier_str_mv |
SILVA, Adeilson Antonio da. On deceiving malware classification with section injection: attack and defense using deep neural networks. 2022. 47 f. Dissertação (Mestrado em Ciência da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022. |
| url |
https://repositorio.ufba.br/handle/ri/36683 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-nc-sa/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-nc-sa/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal da Bahia |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação (PGCOMP) |
| dc.publisher.initials.fl_str_mv |
UFBA |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Computação - IC |
| publisher.none.fl_str_mv |
Universidade Federal da Bahia |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
| instname_str |
Universidade Federal da Bahia (UFBA) |
| instacron_str |
UFBA |
| institution |
UFBA |
| reponame_str |
Repositório Institucional da UFBA |
| collection |
Repositório Institucional da UFBA |
| bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/36683/4/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf.txt https://repositorio.ufba.br/bitstream/ri/36683/1/PGCOMP-2022-Disserta%c3%a7%c3%a3o_Mestrado-Adeilson_Silva.pdf https://repositorio.ufba.br/bitstream/ri/36683/2/license_rdf https://repositorio.ufba.br/bitstream/ri/36683/3/license.txt |
| bitstream.checksum.fl_str_mv |
d0b3f8e8627ce9c50fd27bc7defc03e2 89cbb13a01c40187f844f59987db615e 996f8b5afe3136b76594f43bfda24c5e 67bf4f75790b0d8d38d8f112a48ad90b |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
| repository.mail.fl_str_mv |
repositorio@ufba.br |
| _version_ |
1847339303764492288 |