Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho
| Main Author: | |
|---|---|
| Publication Date: | 2023 |
| Format: | Doctoral thesis |
| Language: | por |
| Source: | Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| Download full: | https://www.repositorio.mar.mil.br/handle/ripcmb/846568 |
Summary: | As redes neurais convolucionais, especialmente as embarcadas em dispositivos com requisitos de baixo consumo de energia, apresentam um desafio significativo: equilibrar a alta precisão esperada das redes neurais, o tempo de resposta e as demandas de recursos computacionais, lógicos e de memória. Este trabalho apresenta três arquiteturas de hardware para redes neurais convolucionais com alto grau de paralelismo e reutilização de componentes implementadas em um dispositivo programável. O primeiro projeto, denominado arquitetura com memória, utiliza a quantidade de memória necessária para armazenar os dados de entrada e os resultados intermediários. O segundo projeto, denominado arquitetura sem memória, define e explora um padrão específico de sequenciamento da entrada para evitar o uso de memória RAM. O terceiro projeto, denominado arquitetura com memória cache, é uma solução intermediária, onde a padronização da sequência de entrada também é explorada mas uma memória auxiliar é utilizada para armazenar alguns resultados intermediários e, consequentemente, melhorar o tempo de processamento. Comparamos as três arquiteturas em termos de potência, área e tempo de processamento. Permitir o uso de memória aumenta o custo geral de hardware, mas reduz o tempo de processamento. Na outra extremidade, dispensar completamente o uso de memória aumenta o nível de paralelismo mas compromete o tempo de processamento. O balanceamento entre uso de memória e desempenho é alcançado na arquitetura com memória cache que otimiza o tempo de processamento mas com custo em termos de recursos de hardware. |
| id |
MB_34c4d22fc2fe5cd57d43f2d4c0fbf304 |
|---|---|
| oai_identifier_str |
oai:www.repositorio.mar.mil.br:ripcmb/846568 |
| network_acronym_str |
MB |
| network_name_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| repository_id_str |
|
| spelling |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenhoRedes Neurais Convolucionais (CNN)Field-Programmable Gate Arrays (FPGA)LeNet-5Engenharia elétricaDiretoria-Geral do Material da Marinha (DGMM)As redes neurais convolucionais, especialmente as embarcadas em dispositivos com requisitos de baixo consumo de energia, apresentam um desafio significativo: equilibrar a alta precisão esperada das redes neurais, o tempo de resposta e as demandas de recursos computacionais, lógicos e de memória. Este trabalho apresenta três arquiteturas de hardware para redes neurais convolucionais com alto grau de paralelismo e reutilização de componentes implementadas em um dispositivo programável. O primeiro projeto, denominado arquitetura com memória, utiliza a quantidade de memória necessária para armazenar os dados de entrada e os resultados intermediários. O segundo projeto, denominado arquitetura sem memória, define e explora um padrão específico de sequenciamento da entrada para evitar o uso de memória RAM. O terceiro projeto, denominado arquitetura com memória cache, é uma solução intermediária, onde a padronização da sequência de entrada também é explorada mas uma memória auxiliar é utilizada para armazenar alguns resultados intermediários e, consequentemente, melhorar o tempo de processamento. Comparamos as três arquiteturas em termos de potência, área e tempo de processamento. Permitir o uso de memória aumenta o custo geral de hardware, mas reduz o tempo de processamento. Na outra extremidade, dispensar completamente o uso de memória aumenta o nível de paralelismo mas compromete o tempo de processamento. O balanceamento entre uso de memória e desempenho é alcançado na arquitetura com memória cache que otimiza o tempo de processamento mas com custo em termos de recursos de hardware.Convolutional neural networks, especially when embedded in devices with low power consumption requirements, present a significant challenge: balancing the typically high precision expected of neural networks, response time, and the demands on computational, logical, and memory resources. This work presents three hardware architectures for convolutional neural networks with high degree of parallelism and component reuse implemented in a programmable device. The first design, which is termed memoryful architecture, uses as much memory as necessary to store the input data and intermediate results. The second design, which is termed memoryless architecture, defines and explores a specific input sequencing pattern to completely avoid the use of RAM. The third design, which is termed cache memory-based architecture, is an intermediate solution, where the standardization of the input sequence is also explored but an auxiliary memory is used to store some intermediate results and, consequently, improve processing time. We compare the three designs in terms of power, area and processing time. Allowing memory usage increases overall hardware cost but reduces processing time. At the other end, completely eliminating memory usage increases operation parallelism, but compromises processing time. A trade-off between memory usage and processing performance is achieved in the cache memory-based architecture that optimizes processing time but at a cost in terms of hardware resources.Universidade Federal do Rio de Janeiro (UFRJ)Gomes, José Gabriel Rodríguez CarneiroOliveira, Fernanda Duarte Vilela Reis deNedjah, NadiaFrança, Alexandre Bazyl Zacarias de2024-01-17T12:38:26Z2024-01-17T12:38:26Z2023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.repositorio.mar.mil.br/handle/ripcmb/846568info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MB2025-08-26T18:42:25Zoai:www.repositorio.mar.mil.br:ripcmb/846568Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2025-08-26T18:42:25Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false |
| dc.title.none.fl_str_mv |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| title |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| spellingShingle |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho França, Alexandre Bazyl Zacarias de Redes Neurais Convolucionais (CNN) Field-Programmable Gate Arrays (FPGA) LeNet-5 Engenharia elétrica Diretoria-Geral do Material da Marinha (DGMM) |
| title_short |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| title_full |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| title_fullStr |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| title_full_unstemmed |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| title_sort |
Arquiteturas de hardware para redes neurais convolucionais visando compromisso entre custo e desempenho |
| author |
França, Alexandre Bazyl Zacarias de |
| author_facet |
França, Alexandre Bazyl Zacarias de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Gomes, José Gabriel Rodríguez Carneiro Oliveira, Fernanda Duarte Vilela Reis de Nedjah, Nadia |
| dc.contributor.author.fl_str_mv |
França, Alexandre Bazyl Zacarias de |
| dc.subject.por.fl_str_mv |
Redes Neurais Convolucionais (CNN) Field-Programmable Gate Arrays (FPGA) LeNet-5 Engenharia elétrica Diretoria-Geral do Material da Marinha (DGMM) |
| topic |
Redes Neurais Convolucionais (CNN) Field-Programmable Gate Arrays (FPGA) LeNet-5 Engenharia elétrica Diretoria-Geral do Material da Marinha (DGMM) |
| description |
As redes neurais convolucionais, especialmente as embarcadas em dispositivos com requisitos de baixo consumo de energia, apresentam um desafio significativo: equilibrar a alta precisão esperada das redes neurais, o tempo de resposta e as demandas de recursos computacionais, lógicos e de memória. Este trabalho apresenta três arquiteturas de hardware para redes neurais convolucionais com alto grau de paralelismo e reutilização de componentes implementadas em um dispositivo programável. O primeiro projeto, denominado arquitetura com memória, utiliza a quantidade de memória necessária para armazenar os dados de entrada e os resultados intermediários. O segundo projeto, denominado arquitetura sem memória, define e explora um padrão específico de sequenciamento da entrada para evitar o uso de memória RAM. O terceiro projeto, denominado arquitetura com memória cache, é uma solução intermediária, onde a padronização da sequência de entrada também é explorada mas uma memória auxiliar é utilizada para armazenar alguns resultados intermediários e, consequentemente, melhorar o tempo de processamento. Comparamos as três arquiteturas em termos de potência, área e tempo de processamento. Permitir o uso de memória aumenta o custo geral de hardware, mas reduz o tempo de processamento. Na outra extremidade, dispensar completamente o uso de memória aumenta o nível de paralelismo mas compromete o tempo de processamento. O balanceamento entre uso de memória e desempenho é alcançado na arquitetura com memória cache que otimiza o tempo de processamento mas com custo em termos de recursos de hardware. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023 2024-01-17T12:38:26Z 2024-01-17T12:38:26Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.repositorio.mar.mil.br/handle/ripcmb/846568 |
| url |
https://www.repositorio.mar.mil.br/handle/ripcmb/846568 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro (UFRJ) |
| publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro (UFRJ) |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) instname:Marinha do Brasil (MB) instacron:MB |
| instname_str |
Marinha do Brasil (MB) |
| instacron_str |
MB |
| institution |
MB |
| reponame_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| collection |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
| repository.name.fl_str_mv |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB) |
| repository.mail.fl_str_mv |
dphdm.repositorio@marinha.mil.br |
| _version_ |
1844954156185419776 |