Tolerância a falhas no armazenamento distribuído de dados em grades oportunistas

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Huaman, Pablo Francisco Laura
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124708/
Resumo: Grades computacionais oportunistas permitem o compartilhamento de recursos computacionais ociosos, como processador, memória espaço em disco, para a execução de aplicações que necessitam de grandes quantidades de poder computacional e para o armazenamento de dados de usuários e aplicações. OppStore é um sistema de Middleware que realiza o gerenciamento das máquinas de uma grade computacional oportunista, permitindo o armazenamento de dados utilizando o espaço em disco livre durante seu período de ociosidade. Para permitir uma maior disponibilidade dos dados armazenados, OppStore codifica os arquivos em fragmentos redundantes, que são distribuídos em diferentes máquinas. Mas as máquinas de grade podem falhar, ficar inacessíveis ou passar de ociosas a ocupadas inesperadamente, impedindo o acesso aos fragmentos nela armazenados. Um mecanismo de tolerância a falhas que permita manter a disponibilidade destes fragmentos é um quesito importante para esse sistema. Neste trabalho, definimos, analisamos, implementamos e avaliamos dois mecanismos de tolerância a falhas que permitem a recuperação de fragmentos perdidos devido à falhas ou indisponibilidades nas máquinas da grade. O primeiro mecanismo realiza a reconstrução do arquivo original, que é utilizado para gerar novamente os fragmentos perdidos. O segundo mecanismo mantém uma cópia adicional de cada fragmento, que é utilizada para recuperar os fragmentos perdidos sem a necessidade de reconstruir o arquivo original. Por meio de simulações, avaliamos o custo de cada mecanismo, como o número de mensagens geradas e a quantidade de tráfego na rede, e a capacidade de cada mecanismo de manter a disponibilidade dos arquivos armazenados na presença de falhas.