Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
| Main Author: | |
|---|---|
| Publication Date: | 2025 |
| Format: | Doctoral thesis |
| Language: | por |
| Source: | Biblioteca Digital de Teses e Dissertações da USP |
| Download full: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/ |
Summary: | A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes. |
| id |
USP_5a6fcd9dcfeff6d205f471ea48d28e36 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-06052025-090853 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
2721 |
| spelling |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.Hardware trojan detection in open-source hardware designs using machine learning.Aprendizado computacionalCódigo abertoHardwareHardwareMachine learningNatural language processingOpen hardwareOpensourceProcessamento de linguagem naturalSecuritySegurançaA globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.The globalization of the hardware supply chain reduces costs but increases security challenges with the potential insertion of hardware trojans by third parties. Traditional detection methods face scalability limitations by relying solely on simple examples (e.g., AES). Although open-source hardware promotes transparency, it does not guarantee security. In this research, Natural Language Processing (NLP) and Machine Learning (ML) techniques were applied to identify hardware trojans in complex designs (e.g., RISC-V). Using data from existing benchmarks (ISCAS85-89, TrustHub) and synthetic data generated with Large Language Models (LLM), a dataset of 3,808 instances was used in this research. The approach using TF-IDF and Decision Tree achieved 97.26% accuracy with this dataset, surpassing the state of the art. The use of LLMs with prompt optimization achieved a recall of 99%, minimizing false negatives. As main contributions, a novel framework was developed integrating NLP, ML and LLMs to increase security in open source hardware, including new methods for generation and detection of complex hardware trojans and the resulting open datasets.Biblioteca Digitais de Teses e Dissertações da USPRuggiero, Wilson VicenteHayashi, Victor Takashi2025-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-05-07T11:36:02Zoai:teses.usp.br:tde-06052025-090853Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-05-07T11:36:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. Hardware trojan detection in open-source hardware designs using machine learning. |
| title |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| spellingShingle |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. Hayashi, Victor Takashi Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança |
| title_short |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| title_full |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| title_fullStr |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| title_full_unstemmed |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| title_sort |
Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. |
| author |
Hayashi, Victor Takashi |
| author_facet |
Hayashi, Victor Takashi |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ruggiero, Wilson Vicente |
| dc.contributor.author.fl_str_mv |
Hayashi, Victor Takashi |
| dc.subject.por.fl_str_mv |
Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança |
| topic |
Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança |
| description |
A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-03-11 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1844786146171682816 |