Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia

Detalhes bibliográficos
Autor(a) principal: Millani, Luís Felipe Garlet
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/131874
Resumo: Devido as limitações de consumo energético impostas a supercomputadores, métricas de eficiência energética estão sendo usadas para analisar aplicações paralelas desenvolvidas para computadores de alto desempenho. O objetivo é a redução do custo energético dessas aplicações. Algumas estratégias de redução de consumo energética consideram a aplicação como um todo, outras reduzem ajustam a frequência dos núcleos apenas em certas regiões do código paralelo. Fases de balanceamento de carga ou de comunicação bloqueante podem ser oportunas para redução do consumo energético. A análise de eficiência dessas estratégias é geralmente realizada com metodologias tradicionais derivadas do domínio de análise de desempenho. Uma metodologia de grão mais fino, onde a redução de energia é avaliada para cada região de código e frequência pode lever a um melhor entendimento de como o consumo energético pode ser minimizado para uma determinada implementação. Para tal, os principais desafios são: (a) a detecção de um número possivelmente grande de regiões paralelas; (b) qual frequência deve ser adotada para cada região de forma a limitar o impacto no tempo de execução; e (c) o custo do ajuste dinâmico da frequência dos núcleos. O trabalho descrito nesta dissertação apresenta uma metodologia de análise de desempenho para encontrar, dentre as regiões paralelas, os melhores candidatos a redução do consumo energético. (Cotninua0 Esta proposta consiste de: (a) um design inteligente de experimentos baseado em Plackett-Burman, especialmente importante quando um grande número de regiões paralelas é detectado na aplicação; (b) análise tradicional de energia e desempenho sobre as regiões consideradas candidatas a redução do consumo energético; e (c) análise baseada em eficiência de Pareto mostrando a dificuldade em otimizar o consumo energético. Em (c) também são mostrados os diferentes pontos de equilíbrio entre desempenho e eficiência energética que podem ser interessantes ao desenvolvedor. Nossa abordagem é validada por três aplicações: Graph500, busca em largura, e refinamento de Delaunay.
id URGS_e2b3963cfbe5e2b16ead1e84f4c2c2a1
oai_identifier_str oai:www.lume.ufrgs.br:10183/131874
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Millani, Luís Felipe GarletMaillard, Nicolas BrunoSchnorr, Lucas Mello2016-01-16T02:42:02Z2015http://hdl.handle.net/10183/131874000982004Devido as limitações de consumo energético impostas a supercomputadores, métricas de eficiência energética estão sendo usadas para analisar aplicações paralelas desenvolvidas para computadores de alto desempenho. O objetivo é a redução do custo energético dessas aplicações. Algumas estratégias de redução de consumo energética consideram a aplicação como um todo, outras reduzem ajustam a frequência dos núcleos apenas em certas regiões do código paralelo. Fases de balanceamento de carga ou de comunicação bloqueante podem ser oportunas para redução do consumo energético. A análise de eficiência dessas estratégias é geralmente realizada com metodologias tradicionais derivadas do domínio de análise de desempenho. Uma metodologia de grão mais fino, onde a redução de energia é avaliada para cada região de código e frequência pode lever a um melhor entendimento de como o consumo energético pode ser minimizado para uma determinada implementação. Para tal, os principais desafios são: (a) a detecção de um número possivelmente grande de regiões paralelas; (b) qual frequência deve ser adotada para cada região de forma a limitar o impacto no tempo de execução; e (c) o custo do ajuste dinâmico da frequência dos núcleos. O trabalho descrito nesta dissertação apresenta uma metodologia de análise de desempenho para encontrar, dentre as regiões paralelas, os melhores candidatos a redução do consumo energético. (Cotninua0 Esta proposta consiste de: (a) um design inteligente de experimentos baseado em Plackett-Burman, especialmente importante quando um grande número de regiões paralelas é detectado na aplicação; (b) análise tradicional de energia e desempenho sobre as regiões consideradas candidatas a redução do consumo energético; e (c) análise baseada em eficiência de Pareto mostrando a dificuldade em otimizar o consumo energético. Em (c) também são mostrados os diferentes pontos de equilíbrio entre desempenho e eficiência energética que podem ser interessantes ao desenvolvedor. Nossa abordagem é validada por três aplicações: Graph500, busca em largura, e refinamento de Delaunay.Due to energy limitations imposed to supercomputers, parallel applications developed for High Performance Computers (HPC) are currently being investigated with energy efficiency metrics. The idea is to reduce the energy footprint of these applications. While some energy reduction strategies consider the application as a whole, certain strategies adjust the core frequency only for certain regions of the parallel code. Load balancing or blocking communication phases could be used as opportunities for energy reduction, for instance. The efficiency analysis of such strategies is usually carried out with traditional methodologies derived from the performance analysis domain. It is clear that a finer grain methodology, where the energy reduction is evaluated per each code region and frequency configuration, could potentially lead to a better understanding of how energy consumption can be reduced for a particular algorithm implementation. To get this, the main challenges are: (a) the detection of such, possibly parallel, code regions and the large number of them; (b) which frequency should be adopted for that region (to reduce energy consumption without too much penalty for the runtime); and (c) the cost to dynamically adjust core frequency. The work described in this dissertation presents a performance analysis methodology to find the best parallel region candidates to reduce energy consumption. The proposal is three folded: (a) a clever design of experiments based on screening, especially important when a large number of parallel regions is detected in the applications; (b) a traditional energy and performance evaluation on the regions that were considered as good candidates for energy reduction; and (c) a Pareto-based analysis showing how hard is to obtain energy gains in optimized codes. In (c), we also show other trade-offs between performance loss and energy gains that might be of interest of the application developer. Our approach is validated against three HPC application codes: Graph500; Breadth-First Search, and Delaunay Refinement.application/pdfengSupercomputadoresProcessamento paraleloMethodologyEnergyHPCDVFSMulticorePerformanceOpenMPUma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energiaA performance evaluation methodology to find the best parallel regions to reduce energy consumption info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2015mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000982004.pdf000982004.pdfTexto completoapplication/pdf450900http://www.lume.ufrgs.br/bitstream/10183/131874/1/000982004.pdf372b2c06b95bc5d04a450d793a14a58fMD51TEXT000982004.pdf.txt000982004.pdf.txtExtracted Texttext/plain100493http://www.lume.ufrgs.br/bitstream/10183/131874/2/000982004.pdf.txt0089cf0fc257e063c9ba63f61b9faf01MD52THUMBNAIL000982004.pdf.jpg000982004.pdf.jpgGenerated Thumbnailimage/jpeg1118http://www.lume.ufrgs.br/bitstream/10183/131874/3/000982004.pdf.jpg593ec79535f827757020b096c1fe9cd6MD5310183/1318742018-10-25 10:12:50.748oai:www.lume.ufrgs.br:10183/131874Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-25T13:12:50Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
dc.title.alternative.en.fl_str_mv A performance evaluation methodology to find the best parallel regions to reduce energy consumption
title Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
spellingShingle Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
Millani, Luís Felipe Garlet
Supercomputadores
Processamento paralelo
Methodology
Energy
HPC
DVFS
Multicore
Performance
OpenMP
title_short Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
title_full Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
title_fullStr Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
title_full_unstemmed Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
title_sort Uma metodologia de avaliação de desempenho para identificar as melhore regiões paralelas para reduzir o consumo de energia
author Millani, Luís Felipe Garlet
author_facet Millani, Luís Felipe Garlet
author_role author
dc.contributor.author.fl_str_mv Millani, Luís Felipe Garlet
dc.contributor.advisor1.fl_str_mv Maillard, Nicolas Bruno
dc.contributor.advisor-co1.fl_str_mv Schnorr, Lucas Mello
contributor_str_mv Maillard, Nicolas Bruno
Schnorr, Lucas Mello
dc.subject.por.fl_str_mv Supercomputadores
Processamento paralelo
topic Supercomputadores
Processamento paralelo
Methodology
Energy
HPC
DVFS
Multicore
Performance
OpenMP
dc.subject.eng.fl_str_mv Methodology
Energy
HPC
DVFS
Multicore
Performance
OpenMP
description Devido as limitações de consumo energético impostas a supercomputadores, métricas de eficiência energética estão sendo usadas para analisar aplicações paralelas desenvolvidas para computadores de alto desempenho. O objetivo é a redução do custo energético dessas aplicações. Algumas estratégias de redução de consumo energética consideram a aplicação como um todo, outras reduzem ajustam a frequência dos núcleos apenas em certas regiões do código paralelo. Fases de balanceamento de carga ou de comunicação bloqueante podem ser oportunas para redução do consumo energético. A análise de eficiência dessas estratégias é geralmente realizada com metodologias tradicionais derivadas do domínio de análise de desempenho. Uma metodologia de grão mais fino, onde a redução de energia é avaliada para cada região de código e frequência pode lever a um melhor entendimento de como o consumo energético pode ser minimizado para uma determinada implementação. Para tal, os principais desafios são: (a) a detecção de um número possivelmente grande de regiões paralelas; (b) qual frequência deve ser adotada para cada região de forma a limitar o impacto no tempo de execução; e (c) o custo do ajuste dinâmico da frequência dos núcleos. O trabalho descrito nesta dissertação apresenta uma metodologia de análise de desempenho para encontrar, dentre as regiões paralelas, os melhores candidatos a redução do consumo energético. (Cotninua0 Esta proposta consiste de: (a) um design inteligente de experimentos baseado em Plackett-Burman, especialmente importante quando um grande número de regiões paralelas é detectado na aplicação; (b) análise tradicional de energia e desempenho sobre as regiões consideradas candidatas a redução do consumo energético; e (c) análise baseada em eficiência de Pareto mostrando a dificuldade em otimizar o consumo energético. Em (c) também são mostrados os diferentes pontos de equilíbrio entre desempenho e eficiência energética que podem ser interessantes ao desenvolvedor. Nossa abordagem é validada por três aplicações: Graph500, busca em largura, e refinamento de Delaunay.
publishDate 2015
dc.date.issued.fl_str_mv 2015
dc.date.accessioned.fl_str_mv 2016-01-16T02:42:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/131874
dc.identifier.nrb.pt_BR.fl_str_mv 000982004
url http://hdl.handle.net/10183/131874
identifier_str_mv 000982004
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/131874/1/000982004.pdf
http://www.lume.ufrgs.br/bitstream/10183/131874/2/000982004.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/131874/3/000982004.pdf.jpg
bitstream.checksum.fl_str_mv 372b2c06b95bc5d04a450d793a14a58f
0089cf0fc257e063c9ba63f61b9faf01
593ec79535f827757020b096c1fe9cd6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831314490888552448