Export Ready — 

Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Bibliographic Details
Main Author: Hayashi, Victor Takashi
Publication Date: 2025
Format: Doctoral thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da USP
Download full: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
Summary: A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.
id USP_5a6fcd9dcfeff6d205f471ea48d28e36
oai_identifier_str oai:teses.usp.br:tde-06052025-090853
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.Hardware trojan detection in open-source hardware designs using machine learning.Aprendizado computacionalCódigo abertoHardwareHardwareMachine learningNatural language processingOpen hardwareOpensourceProcessamento de linguagem naturalSecuritySegurançaA globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.The globalization of the hardware supply chain reduces costs but increases security challenges with the potential insertion of hardware trojans by third parties. Traditional detection methods face scalability limitations by relying solely on simple examples (e.g., AES). Although open-source hardware promotes transparency, it does not guarantee security. In this research, Natural Language Processing (NLP) and Machine Learning (ML) techniques were applied to identify hardware trojans in complex designs (e.g., RISC-V). Using data from existing benchmarks (ISCAS85-89, TrustHub) and synthetic data generated with Large Language Models (LLM), a dataset of 3,808 instances was used in this research. The approach using TF-IDF and Decision Tree achieved 97.26% accuracy with this dataset, surpassing the state of the art. The use of LLMs with prompt optimization achieved a recall of 99%, minimizing false negatives. As main contributions, a novel framework was developed integrating NLP, ML and LLMs to increase security in open source hardware, including new methods for generation and detection of complex hardware trojans and the resulting open datasets.Biblioteca Digitais de Teses e Dissertações da USPRuggiero, Wilson VicenteHayashi, Victor Takashi2025-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-05-07T11:36:02Zoai:teses.usp.br:tde-06052025-090853Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-05-07T11:36:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
Hardware trojan detection in open-source hardware designs using machine learning.
title Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
spellingShingle Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
Hayashi, Victor Takashi
Aprendizado computacional
Código aberto
Hardware
Hardware
Machine learning
Natural language processing
Open hardware
Opensource
Processamento de linguagem natural
Security
Segurança
title_short Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_full Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_fullStr Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_full_unstemmed Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_sort Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
author Hayashi, Victor Takashi
author_facet Hayashi, Victor Takashi
author_role author
dc.contributor.none.fl_str_mv Ruggiero, Wilson Vicente
dc.contributor.author.fl_str_mv Hayashi, Victor Takashi
dc.subject.por.fl_str_mv Aprendizado computacional
Código aberto
Hardware
Hardware
Machine learning
Natural language processing
Open hardware
Opensource
Processamento de linguagem natural
Security
Segurança
topic Aprendizado computacional
Código aberto
Hardware
Hardware
Machine learning
Natural language processing
Open hardware
Opensource
Processamento de linguagem natural
Security
Segurança
description A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.
publishDate 2025
dc.date.none.fl_str_mv 2025-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1844786146171682816