Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.

Bibliographic Details
Main Author: ASSIS, Leonardo de.
Publication Date: 2009
Format: Master thesis
Language: por
Source: Repositório Institucional da UCB
Download full: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
Summary: A tecnologia de grids foi criada com o objetivo de facilitar o compartilhamento de recursos entre indivíduos que estão vinculados a diferentes domínios administrativos. Nos últimos anos, o uso de grids computacionais está cada vez mais comum devido ao grande poder computacional que esta tecnologia pode prover a um baixo custo. Devido a isso, a execução de aplicações paralelas que processam uma grande quantidade de dados (dataintensive) está cada vez mais comum neste tipo de plataforma. Uma aplicação paralela pode ser vista como uma coleção de tarefas que podem ser executadas em paralelo. Para algumas destas aplicações, essas tarefas são independentes e podem ser escalonadas para execução paralela em qualquer ordem. Este tipo de aplicação paralela é referenciada na literatura como aplicações Bag-of-Tasks (BoT). Com o intuito de escalonar tarefas em recursos de uma maneira eficiente, escalonadores de aplicações em grid utilizam heurísticas de escalonamento. As heurísticas de escalonamento existentes podem ser classificadas em duas abordagens: i) heurísticas bin-packing, e ii) heurísticas baseadas em replicação. A primeira abordagem requer informação completa e precisa sobre o ambiente de execução e a aplicação. A segunda abordagem não utiliza informação alguma, mas, ao invés disso, ela aplica o princípio da replicação de tarefas para atingir um bom desempenho. Porém, ambas abordagens têm desvantagens; obter informação completa e precisa sobre o ambiente de execução e a aplicação não é sempre possível em um ambiente de grid computacional, enquanto que a redundância das heurísticas baseadas em replicação ocasiona no desperdício de recursos. Em um trabalho recente, foi investigado que apesar de que em um ambiente de grid a informação precisa é difícil de se obter, o acesso a ela não é impossível. Na prática, parte da informação pode ser obtida usando serviços que coletam informação sobre o ambiente de execução e publicada em serviços de informação do grid. Aquele mesmo trabalho mostrou que é possível reduzir o custo de execução de aplicações CPU-intensive, mantendo a mesma eficiência, usando qualquer informação que esteja disponível. Com base no pressuposto daquele trabalho, este trabalho apresenta uma heurística de escalonamento para aplicações BoT data-intensive, que é adaptativa à disponibilidade da informação, chamada de Adaptive Data-Intensive. Os resultados obtidos pela heurística Adaptive Data-Intensive mostraram que o uso racional da informação que estiver disponível leva a uma redução no tempo de execução da aplicação e no desperdício dos recursos.
id UCB-2_e84c853754c744ab4e7c2bb60979e3a5
oai_identifier_str oai:localhost:riufcg/12222
network_acronym_str UCB-2
network_name_str Repositório Institucional da UCB
repository_id_str
spelling Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.A scaling heuristic adaptive to information availability for data-intensive bag-of-tasks applications in computational grids.Redes de ComputadoresEscalonamentoGrids ComputacionaisComputer NetworkSchedulingComputational GridsCiência da ComputaçãoA tecnologia de grids foi criada com o objetivo de facilitar o compartilhamento de recursos entre indivíduos que estão vinculados a diferentes domínios administrativos. Nos últimos anos, o uso de grids computacionais está cada vez mais comum devido ao grande poder computacional que esta tecnologia pode prover a um baixo custo. Devido a isso, a execução de aplicações paralelas que processam uma grande quantidade de dados (dataintensive) está cada vez mais comum neste tipo de plataforma. Uma aplicação paralela pode ser vista como uma coleção de tarefas que podem ser executadas em paralelo. Para algumas destas aplicações, essas tarefas são independentes e podem ser escalonadas para execução paralela em qualquer ordem. Este tipo de aplicação paralela é referenciada na literatura como aplicações Bag-of-Tasks (BoT). Com o intuito de escalonar tarefas em recursos de uma maneira eficiente, escalonadores de aplicações em grid utilizam heurísticas de escalonamento. As heurísticas de escalonamento existentes podem ser classificadas em duas abordagens: i) heurísticas bin-packing, e ii) heurísticas baseadas em replicação. A primeira abordagem requer informação completa e precisa sobre o ambiente de execução e a aplicação. A segunda abordagem não utiliza informação alguma, mas, ao invés disso, ela aplica o princípio da replicação de tarefas para atingir um bom desempenho. Porém, ambas abordagens têm desvantagens; obter informação completa e precisa sobre o ambiente de execução e a aplicação não é sempre possível em um ambiente de grid computacional, enquanto que a redundância das heurísticas baseadas em replicação ocasiona no desperdício de recursos. Em um trabalho recente, foi investigado que apesar de que em um ambiente de grid a informação precisa é difícil de se obter, o acesso a ela não é impossível. Na prática, parte da informação pode ser obtida usando serviços que coletam informação sobre o ambiente de execução e publicada em serviços de informação do grid. Aquele mesmo trabalho mostrou que é possível reduzir o custo de execução de aplicações CPU-intensive, mantendo a mesma eficiência, usando qualquer informação que esteja disponível. Com base no pressuposto daquele trabalho, este trabalho apresenta uma heurística de escalonamento para aplicações BoT data-intensive, que é adaptativa à disponibilidade da informação, chamada de Adaptive Data-Intensive. Os resultados obtidos pela heurística Adaptive Data-Intensive mostraram que o uso racional da informação que estiver disponível leva a uma redução no tempo de execução da aplicação e no desperdício dos recursos.The technology of grid was created to facilitate the resource sharing among individuals belonging to different administrative domains. In recent years, the use of grid computing is increasingly common due to the large computational power that this technology can provide at a low cost. Because of this, the execution of parallel applications that process a large amount of data (data-intensive) is increasingly common in this type of platform. A parallel application can be viewed as a collection of tasks that can be executed in parallel. A parallel application can be viewed as a collection of tasks that can be executed in parallel. For some of these applications, these tasks are independent and can be scheduled to run parallel in any order. This type of parallel application is referenced in literature as Bag-of-Tasks (BoT) applications. In order to schedule tasks onto resources in an efficient manner, grid applications schedulers use scheduling heuristics. The scheduling heuristics can be classified into two approaches: i) bin-packing heuristics, and ii) heuristics based on replication. The first approach requires complete and accurate information about the execution environment and the application. The second approach does not use any information, but, instead, it applies the principle of tasks replication to achieve good performance. But both approaches have disadvantages, complete and accurate information about the execution environment and the application is not always possible in a grid computing environment, while the redundancy of replication heuristics causes resource waste. In a recent work, it was investigated despite the fact that in a grid environment, the accurate information is difficult to get, it is not impossible to have it. In practice, the information can be obtained by using services that collect information about the environment and the application and publish it on grid information services. That same study showed that it is possible to reduce the execution cost of CPU-intensive applications, while maintaining the same efficiency, using any information that is available. Based on the assumption of that work, this dissertation presents a scheduling heuristic for BoT data-intensive applications that is adaptive to the information availability, called Adaptive Data-Intensive. The results obtained by heuristic Adaptive Data-Intensive indicated that the rational use of available information leads to a reduction of application execution time and resource waste.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBRASILEIRO, Francisco Vilar.Brasileiro, F.V.http://lattes.cnpq.br/5957855817378897BARCELLOS, Antonio Marinho Pillã.BUZATO, Luiz Eduardo.ASSIS, Leonardo de.2009-09-022020-02-28T18:12:58Z2020-02-282020-02-28T18:12:58Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222ASSIS, L. de. Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais. 2009. 75 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2009. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UCBinstname:Universidade Católica de Brasília (UCB)instacron:UCB2022-03-28T20:19:03Zoai:localhost:riufcg/12222Repositório InstitucionalPRIhttps://repositorio.ucb.br/oai/requestsara.ribeiro@ucb.bropendoar:2022-03-28T20:19:03Repositório Institucional da UCB - Universidade Católica de Brasília (UCB)false
dc.title.none.fl_str_mv Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
A scaling heuristic adaptive to information availability for data-intensive bag-of-tasks applications in computational grids.
title Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
spellingShingle Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
ASSIS, Leonardo de.
Redes de Computadores
Escalonamento
Grids Computacionais
Computer Network
Scheduling
Computational Grids
Ciência da Computação
title_short Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
title_full Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
title_fullStr Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
title_full_unstemmed Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
title_sort Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais.
author ASSIS, Leonardo de.
author_facet ASSIS, Leonardo de.
author_role author
dc.contributor.none.fl_str_mv BRASILEIRO, Francisco Vilar.
Brasileiro, F.V.
http://lattes.cnpq.br/5957855817378897
BARCELLOS, Antonio Marinho Pillã.
BUZATO, Luiz Eduardo.
dc.contributor.author.fl_str_mv ASSIS, Leonardo de.
dc.subject.por.fl_str_mv Redes de Computadores
Escalonamento
Grids Computacionais
Computer Network
Scheduling
Computational Grids
Ciência da Computação
topic Redes de Computadores
Escalonamento
Grids Computacionais
Computer Network
Scheduling
Computational Grids
Ciência da Computação
description A tecnologia de grids foi criada com o objetivo de facilitar o compartilhamento de recursos entre indivíduos que estão vinculados a diferentes domínios administrativos. Nos últimos anos, o uso de grids computacionais está cada vez mais comum devido ao grande poder computacional que esta tecnologia pode prover a um baixo custo. Devido a isso, a execução de aplicações paralelas que processam uma grande quantidade de dados (dataintensive) está cada vez mais comum neste tipo de plataforma. Uma aplicação paralela pode ser vista como uma coleção de tarefas que podem ser executadas em paralelo. Para algumas destas aplicações, essas tarefas são independentes e podem ser escalonadas para execução paralela em qualquer ordem. Este tipo de aplicação paralela é referenciada na literatura como aplicações Bag-of-Tasks (BoT). Com o intuito de escalonar tarefas em recursos de uma maneira eficiente, escalonadores de aplicações em grid utilizam heurísticas de escalonamento. As heurísticas de escalonamento existentes podem ser classificadas em duas abordagens: i) heurísticas bin-packing, e ii) heurísticas baseadas em replicação. A primeira abordagem requer informação completa e precisa sobre o ambiente de execução e a aplicação. A segunda abordagem não utiliza informação alguma, mas, ao invés disso, ela aplica o princípio da replicação de tarefas para atingir um bom desempenho. Porém, ambas abordagens têm desvantagens; obter informação completa e precisa sobre o ambiente de execução e a aplicação não é sempre possível em um ambiente de grid computacional, enquanto que a redundância das heurísticas baseadas em replicação ocasiona no desperdício de recursos. Em um trabalho recente, foi investigado que apesar de que em um ambiente de grid a informação precisa é difícil de se obter, o acesso a ela não é impossível. Na prática, parte da informação pode ser obtida usando serviços que coletam informação sobre o ambiente de execução e publicada em serviços de informação do grid. Aquele mesmo trabalho mostrou que é possível reduzir o custo de execução de aplicações CPU-intensive, mantendo a mesma eficiência, usando qualquer informação que esteja disponível. Com base no pressuposto daquele trabalho, este trabalho apresenta uma heurística de escalonamento para aplicações BoT data-intensive, que é adaptativa à disponibilidade da informação, chamada de Adaptive Data-Intensive. Os resultados obtidos pela heurística Adaptive Data-Intensive mostraram que o uso racional da informação que estiver disponível leva a uma redução no tempo de execução da aplicação e no desperdício dos recursos.
publishDate 2009
dc.date.none.fl_str_mv 2009-09-02
2020-02-28T18:12:58Z
2020-02-28
2020-02-28T18:12:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
ASSIS, L. de. Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais. 2009. 75 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2009. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
identifier_str_mv ASSIS, L. de. Uma heurística de escalonamento adaptativa à disponibilidade da informação para aplicações bag-of-tasks data-intensive em grids computacionais. 2009. 75 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2009. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12222
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCB
instname:Universidade Católica de Brasília (UCB)
instacron:UCB
instname_str Universidade Católica de Brasília (UCB)
instacron_str UCB
institution UCB
reponame_str Repositório Institucional da UCB
collection Repositório Institucional da UCB
repository.name.fl_str_mv Repositório Institucional da UCB - Universidade Católica de Brasília (UCB)
repository.mail.fl_str_mv sara.ribeiro@ucb.br
_version_ 1834012952662900736