Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Hayashi, Victor Takashi

Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Bibliographic Details
Main Author:	Hayashi, Victor Takashi
Publication Date:	2025
Format:	Doctoral thesis
Language:	por
Source:	Biblioteca Digital de Teses e Dissertações da USP
Download full:	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
Summary:	A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.

Item metadata

id	USP_5a6fcd9dcfeff6d205f471ea48d28e36
oai_identifier_str	oai:teses.usp.br:tde-06052025-090853
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.Hardware trojan detection in open-source hardware designs using machine learning.Aprendizado computacionalCódigo abertoHardwareHardwareMachine learningNatural language processingOpen hardwareOpensourceProcessamento de linguagem naturalSecuritySegurançaA globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.The globalization of the hardware supply chain reduces costs but increases security challenges with the potential insertion of hardware trojans by third parties. Traditional detection methods face scalability limitations by relying solely on simple examples (e.g., AES). Although open-source hardware promotes transparency, it does not guarantee security. In this research, Natural Language Processing (NLP) and Machine Learning (ML) techniques were applied to identify hardware trojans in complex designs (e.g., RISC-V). Using data from existing benchmarks (ISCAS85-89, TrustHub) and synthetic data generated with Large Language Models (LLM), a dataset of 3,808 instances was used in this research. The approach using TF-IDF and Decision Tree achieved 97.26% accuracy with this dataset, surpassing the state of the art. The use of LLMs with prompt optimization achieved a recall of 99%, minimizing false negatives. As main contributions, a novel framework was developed integrating NLP, ML and LLMs to increase security in open source hardware, including new methods for generation and detection of complex hardware trojans and the resulting open datasets.Biblioteca Digitais de Teses e Dissertações da USPRuggiero, Wilson VicenteHayashi, Victor Takashi2025-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-05-07T11:36:02Zoai:teses.usp.br:tde-06052025-090853Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212025-05-07T11:36:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. Hardware trojan detection in open-source hardware designs using machine learning.
title	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
spellingShingle	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina. Hayashi, Victor Takashi Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança
title_short	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_full	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_fullStr	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_full_unstemmed	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
title_sort	Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.
author	Hayashi, Victor Takashi
author_facet	Hayashi, Victor Takashi
author_role	author
dc.contributor.none.fl_str_mv	Ruggiero, Wilson Vicente
dc.contributor.author.fl_str_mv	Hayashi, Victor Takashi
dc.subject.por.fl_str_mv	Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança
topic	Aprendizado computacional Código aberto Hardware Hardware Machine learning Natural language processing Open hardware Opensource Processamento de linguagem natural Security Segurança
description	A globalização da cadeia de suprimentos de hardware reduz custos, mas aumenta os desafios de segurança com a possível inserção de hardware trojans por terceiros. Métodos tradicionais de detecção apresentam limitações de escalabilidade ao usar apenas exemplos simples (e.g., AES). Embora o hardware de código aberto promova transparência, ele não garante segurança. Nesta pesquisa, técnicas de Processamento de Linguagem Natural (PLN) e Machine Learning (ML) foram aplicadas para identificar hardware trojans em designs complexos (e.g., RISC-V). Usando dados de benchmarks existentes (ISCAS85-89, TrustHub) e dados sintéticos gerados com Large Language Models (LLM), foi utilizado um conjunto de 3808 instâncias nesta pesquisa. A abordagem com TF-IDF e Decision Tree alcançou 97,26% de acurácia com este conjunto de dados, superando o estado da arte. O uso de LLMs com prompt optimization atingiu recall de 99%, minimizando falsos negativos. Como principais contribuições, foi desenvolvido um novo framework integrando PLN, ML e LLMs para aumentar a segurança em hardwares de código aberto, contemplando a geração e detecção de hardware trojans complexos e os conjuntos de dados abertos resultantes.
publishDate	2025
dc.date.none.fl_str_mv	2025-03-11
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
url	https://www.teses.usp.br/teses/disponiveis/3/3141/tde-06052025-090853/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1844786146171682816

Detecção de hardware trojans em descrições de hardware de código aberto utilizando aprendizado de máquina.

Similar Items