Transparent optimization of OpenMP applications via thread throttling and boosting techniques

Marques, Sandro Matheus Vila Nova

Transparent optimization of OpenMP applications via thread throttling and boosting techniques

Bibliographic Details
Main Author:	Marques, Sandro Matheus Vila Nova
Publication Date:	2021
Format:	Bachelor thesis
Language:	eng
Source:	Repositório Institucional da UNIPAMPA
Download full:	https://dspace.unipampa.edu.br/jspui/handle/riu/5612
Summary:	O número crescente de núcleos em arquiteturas multicore modernas trouxe consigo a necessidade de melhor uso dos recursos de hardware. Consequentemente, duas técnicas têm se tornado amplamente utilizadas para otimizar o desempenho e o consumo de energia desses ambientes: o Dynamic Concurrency Throttling (DCT) e Boosting. Por um lado, o DCT ajusta o número de threads em regiões paralelas para minimizar os efeitos das características intrínsecas das aplicações que afetam o desempenho e o consumo de energia (e.g., comunicação e sincronização de dados). Por outro lado, as técnicas de Boosting focam em fazer o desempenho atingir seu nível máximo durante todas as fases da aplicação, por meio do aumento das frequências do processador, respeitando o Thermal Design Power (TDP). Um dos principais desafios é que cada região de uma aplicação paralela pode se comportar de forma diferente (e.g., comportamento de acesso à memória e grau de paralelismo), o que torna o uso de ambas as técnicas combinadas tarefa complicada. Escolher o número errado de threads e habilitar/desabilitar as frequências de boost nas fases erradas pode levar ao aumento do consumo de energia e degradação do desempenho. Para resolver este problema, este trabalho apresenta duas estratégias que aplicam DCT e Boosting para melhorar o trade-off entre desempenho e consumo de energia (representado pelo energy-delay product - EDP): PFG, uma estratégia que otimiza cada região de um determinada aplicação, individualmente; e PCG que considera a combinação de regiões paralelas e sequenciais durante a otimização. Ambas as estratégias são transparentes, automáticas e profundamente integradas à interface de programação paralela OpenMP, portanto, nenhuma modificação ou recompilação de código é necessária. Por meio da execução de doze benchmarks amplamente conhecidos em três sistemas multicore, PFG e PCG melhoram EDP em até, respectivamente, 95,3% e 95,5% em comparação com a execução OpenMP padrão, 90,9 % e 94,8 % em Varuna-PM e 80,5% e 83,7% contra a técnica Core Packing. Também mostramos que o PFG é mais adequado para aplicações com alta variabilidade na carga de trabalho da CPU, enquanto o PCG é melhor quando há baixa variabilidade da carga de trabalho.

Item metadata

id	UNIP_42d3db9db669b9a9d480b3868bb4e711
oai_identifier_str	oai:repositorio.unipampa.edu.br:riu/5612
network_acronym_str	UNIP
network_name_str	Repositório Institucional da UNIPAMPA
repository_id_str
spelling	Lorenzon, Arthur FranciscoMarques, Sandro Matheus Vila Nova2021-05-31T15:18:00Z2021-05-282021-05-31T15:18:00Z2021-05-07MARQUES, Sandro Matheus Vila Nova. Transparent optimization of OpenMP applications via thread throttling and boosting techniques. Orientador: Arthur Francisco Lorenzon. 2021. 64p. Trabalho de Conclusão de Curso (Bacharel em Engenharia de software) - Universidade Federal do Pampa, Curso de Engenharia de software, Alegrete, 2021.https://dspace.unipampa.edu.br/jspui/handle/riu/5612O número crescente de núcleos em arquiteturas multicore modernas trouxe consigo a necessidade de melhor uso dos recursos de hardware. Consequentemente, duas técnicas têm se tornado amplamente utilizadas para otimizar o desempenho e o consumo de energia desses ambientes: o Dynamic Concurrency Throttling (DCT) e Boosting. Por um lado, o DCT ajusta o número de threads em regiões paralelas para minimizar os efeitos das características intrínsecas das aplicações que afetam o desempenho e o consumo de energia (e.g., comunicação e sincronização de dados). Por outro lado, as técnicas de Boosting focam em fazer o desempenho atingir seu nível máximo durante todas as fases da aplicação, por meio do aumento das frequências do processador, respeitando o Thermal Design Power (TDP). Um dos principais desafios é que cada região de uma aplicação paralela pode se comportar de forma diferente (e.g., comportamento de acesso à memória e grau de paralelismo), o que torna o uso de ambas as técnicas combinadas tarefa complicada. Escolher o número errado de threads e habilitar/desabilitar as frequências de boost nas fases erradas pode levar ao aumento do consumo de energia e degradação do desempenho. Para resolver este problema, este trabalho apresenta duas estratégias que aplicam DCT e Boosting para melhorar o trade-off entre desempenho e consumo de energia (representado pelo energy-delay product - EDP): PFG, uma estratégia que otimiza cada região de um determinada aplicação, individualmente; e PCG que considera a combinação de regiões paralelas e sequenciais durante a otimização. Ambas as estratégias são transparentes, automáticas e profundamente integradas à interface de programação paralela OpenMP, portanto, nenhuma modificação ou recompilação de código é necessária. Por meio da execução de doze benchmarks amplamente conhecidos em três sistemas multicore, PFG e PCG melhoram EDP em até, respectivamente, 95,3% e 95,5% em comparação com a execução OpenMP padrão, 90,9 % e 94,8 % em Varuna-PM e 80,5% e 83,7% contra a técnica Core Packing. Também mostramos que o PFG é mais adequado para aplicações com alta variabilidade na carga de trabalho da CPU, enquanto o PCG é melhor quando há baixa variabilidade da carga de trabalho.The growing number of cores in modern multicore architectures has brought together the need for better use of hardware resources. Consequently, two techniques have become widely used to optimize the performance and energy consumption of these environments: Dynamic Concurrency Throttling (DCT) and Boosting. On the one hand, DCT adjusts the number of threads in parallel regions to minimize the effects of intrinsic characteristics of the applications that impact performance and energy consumption (e.g., data synchronization and communication). On the other hand, Boosting techniques focus on making the performance reach its maximum level during all phases of the application by increasing the processor frequencies while respecting the Thermal Design Power (TDP). One of the main challenges is that each region of a parallel application can behave differently (i.e., memory access behavior and degree of parallelism) which makes using both techniques combined not a straightforward task. Choosing the wrong number of threads and enabling/disabling boosting frequencies in the incorrect phases can lead to increasing the energy consumption and performance degradation. To solve this problem, this work presents two strategies that apply DCT and Boosting to improve the trade-off between performance and energy consumption (represented by the energy-delay product - EDP): PFG, a strategy that optimizes each region of a given application, individually; and PCG that considers the combination of parallel and sequential regions during optimization. Both strategies are transparent, automatic, and deeply integrated into the OpenMP parallel programming interface, so no code modification or recompilation is necessary. By executing twelve well-known benchmarks in three multicore systems, PFG and PCG improve EDP by up to, respectively, 95.3% and 95.5% compared to standard OpenMP execution, 90.9%, and 94.8% on Varuna-PM and 80.5% and 83.7% against the Core Packing technique. We also show that PFG is more suitable for applications with high variability in the CPU workload, while PCG is better when there is low workload variability.engUniversidade Federal do PampaUNIPAMPABrasilCampus AlegreteCNPQ::CIENCIAS EXATAS E DA TERRAEngenharia de softwareComputação de alto desempenhoProgramação paralela (Computação)Software engineeringHigh performance computingParallel programming (Computer science)Transparent optimization of OpenMP applications via thread throttling and boosting techniquesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIPAMPAinstname:Universidade Federal do Pampa (UNIPAMPA)instacron:UNIPAMPAORIGINALSandro Matheus Vila Nova Marques-2021.pdfSandro Matheus Vila Nova Marques-2021.pdfapplication/pdf747821https://repositorio.unipampa.edu.br/bitstreams/82c55b9b-aeb8-4d97-aaf9-a58154be9ee4/download9498c1b11bd3f478ca1c5a67a31b0de4MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81867https://repositorio.unipampa.edu.br/bitstreams/512b6a38-7458-4a58-9f02-4c2cc0b32c29/downloadba21f2de58f2bed282863187a61580ffMD52falseAnonymousREADTEXTSandro Matheus Vila Nova Marques-2021.pdf.txtSandro Matheus Vila Nova Marques-2021.pdf.txtExtracted texttext/plain129611https://repositorio.unipampa.edu.br/bitstreams/355fb1ae-20a4-4002-84af-85ed85ae7fc8/downloadc7904c0cd2836116348895eca6f6154dMD53falseAnonymousREADriu/56122025-05-22 19:00:00.776open.accessoai:repositorio.unipampa.edu.br:riu/5612https://repositorio.unipampa.edu.brRepositório InstitucionalPUBhttp://dspace.unipampa.edu.br:8080/oai/requestsisbi@unipampa.edu.bropendoar:2025-05-22T19:00Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVU5JUEFNUEEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSAgYSBVTklQQU1QQSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIGZpbnMgZGUgc2VndXJhbsOnYSwgYmFjay11cCAKZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiAKVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgcHVibGljYcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIApkZSBuaW5ndcOpbS4KCkNhc28gYSBzdWEgcHVibGljYcOnw6NvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmEgcXVlIApvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVU5JUEFNUEEgb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIApuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byAKb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gCk9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVTklQQU1QQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyAKYXV0b3JhaXMgZGEgcHVibGljYcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==
dc.title.pt_BR.fl_str_mv	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
title	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
spellingShingle	Transparent optimization of OpenMP applications via thread throttling and boosting techniques Marques, Sandro Matheus Vila Nova CNPQ::CIENCIAS EXATAS E DA TERRA Engenharia de software Computação de alto desempenho Programação paralela (Computação) Software engineering High performance computing Parallel programming (Computer science)
title_short	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
title_full	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
title_fullStr	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
title_full_unstemmed	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
title_sort	Transparent optimization of OpenMP applications via thread throttling and boosting techniques
author	Marques, Sandro Matheus Vila Nova
author_facet	Marques, Sandro Matheus Vila Nova
author_role	author
dc.contributor.advisor1.fl_str_mv	Lorenzon, Arthur Francisco
dc.contributor.author.fl_str_mv	Marques, Sandro Matheus Vila Nova
contributor_str_mv	Lorenzon, Arthur Francisco
dc.subject.cnpq.fl_str_mv	CNPQ::CIENCIAS EXATAS E DA TERRA
topic	CNPQ::CIENCIAS EXATAS E DA TERRA Engenharia de software Computação de alto desempenho Programação paralela (Computação) Software engineering High performance computing Parallel programming (Computer science)
dc.subject.por.fl_str_mv	Engenharia de software Computação de alto desempenho Programação paralela (Computação) Software engineering High performance computing Parallel programming (Computer science)
description	O número crescente de núcleos em arquiteturas multicore modernas trouxe consigo a necessidade de melhor uso dos recursos de hardware. Consequentemente, duas técnicas têm se tornado amplamente utilizadas para otimizar o desempenho e o consumo de energia desses ambientes: o Dynamic Concurrency Throttling (DCT) e Boosting. Por um lado, o DCT ajusta o número de threads em regiões paralelas para minimizar os efeitos das características intrínsecas das aplicações que afetam o desempenho e o consumo de energia (e.g., comunicação e sincronização de dados). Por outro lado, as técnicas de Boosting focam em fazer o desempenho atingir seu nível máximo durante todas as fases da aplicação, por meio do aumento das frequências do processador, respeitando o Thermal Design Power (TDP). Um dos principais desafios é que cada região de uma aplicação paralela pode se comportar de forma diferente (e.g., comportamento de acesso à memória e grau de paralelismo), o que torna o uso de ambas as técnicas combinadas tarefa complicada. Escolher o número errado de threads e habilitar/desabilitar as frequências de boost nas fases erradas pode levar ao aumento do consumo de energia e degradação do desempenho. Para resolver este problema, este trabalho apresenta duas estratégias que aplicam DCT e Boosting para melhorar o trade-off entre desempenho e consumo de energia (representado pelo energy-delay product - EDP): PFG, uma estratégia que otimiza cada região de um determinada aplicação, individualmente; e PCG que considera a combinação de regiões paralelas e sequenciais durante a otimização. Ambas as estratégias são transparentes, automáticas e profundamente integradas à interface de programação paralela OpenMP, portanto, nenhuma modificação ou recompilação de código é necessária. Por meio da execução de doze benchmarks amplamente conhecidos em três sistemas multicore, PFG e PCG melhoram EDP em até, respectivamente, 95,3% e 95,5% em comparação com a execução OpenMP padrão, 90,9 % e 94,8 % em Varuna-PM e 80,5% e 83,7% contra a técnica Core Packing. Também mostramos que o PFG é mais adequado para aplicações com alta variabilidade na carga de trabalho da CPU, enquanto o PCG é melhor quando há baixa variabilidade da carga de trabalho.
publishDate	2021
dc.date.accessioned.fl_str_mv	2021-05-31T15:18:00Z
dc.date.available.fl_str_mv	2021-05-28 2021-05-31T15:18:00Z
dc.date.issued.fl_str_mv	2021-05-07
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	MARQUES, Sandro Matheus Vila Nova. Transparent optimization of OpenMP applications via thread throttling and boosting techniques. Orientador: Arthur Francisco Lorenzon. 2021. 64p. Trabalho de Conclusão de Curso (Bacharel em Engenharia de software) - Universidade Federal do Pampa, Curso de Engenharia de software, Alegrete, 2021.
dc.identifier.uri.fl_str_mv	https://dspace.unipampa.edu.br/jspui/handle/riu/5612
identifier_str_mv	MARQUES, Sandro Matheus Vila Nova. Transparent optimization of OpenMP applications via thread throttling and boosting techniques. Orientador: Arthur Francisco Lorenzon. 2021. 64p. Trabalho de Conclusão de Curso (Bacharel em Engenharia de software) - Universidade Federal do Pampa, Curso de Engenharia de software, Alegrete, 2021.
url	https://dspace.unipampa.edu.br/jspui/handle/riu/5612
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal do Pampa
dc.publisher.initials.fl_str_mv	UNIPAMPA
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Campus Alegrete
publisher.none.fl_str_mv	Universidade Federal do Pampa
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNIPAMPA instname:Universidade Federal do Pampa (UNIPAMPA) instacron:UNIPAMPA
instname_str	Universidade Federal do Pampa (UNIPAMPA)
instacron_str	UNIPAMPA
institution	UNIPAMPA
reponame_str	Repositório Institucional da UNIPAMPA
collection	Repositório Institucional da UNIPAMPA
bitstream.url.fl_str_mv	https://repositorio.unipampa.edu.br/bitstreams/82c55b9b-aeb8-4d97-aaf9-a58154be9ee4/download https://repositorio.unipampa.edu.br/bitstreams/512b6a38-7458-4a58-9f02-4c2cc0b32c29/download https://repositorio.unipampa.edu.br/bitstreams/355fb1ae-20a4-4002-84af-85ed85ae7fc8/download
bitstream.checksum.fl_str_mv	9498c1b11bd3f478ca1c5a67a31b0de4 ba21f2de58f2bed282863187a61580ff c7904c0cd2836116348895eca6f6154d
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA)
repository.mail.fl_str_mv	sisbi@unipampa.edu.br
_version_	1853241651037732864

Transparent optimization of OpenMP applications via thread throttling and boosting techniques

Similar Items