Export Ready — 

Planet-scale leaderless consensus

Bibliographic Details
Main Author: Duarte, Vitor Manuel Enes
Publication Date: 2022
Language: eng
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: https://hdl.handle.net/1822/81307
Summary: Programa de Doutoramento em Informática das Universidades do Minho, de Aveiro e do Porto
id RCAP_91f02e1db5e2d7e833c8996039e65a54
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/81307
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Planet-scale leaderless consensusConsenso distribuídoGeo-replicaçãoTolerância a falhasConsensusFault toleranceGeo-replicationEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaPrograma de Doutoramento em Informática das Universidades do Minho, de Aveiro e do PortoAs aplicações de web modernas replicam os seus dados à escala planetária e exigem fortes garantias na coerência dos seus dados mais críticos. Essas garantias são geralmente fornecidas por meio de replicação de máquina de estados (RME). Avanços recentes em RME concentraram-se em protocolos sem líder, pois estes melhoram o desempenho e a disponibilidade das soluções tradicionais baseadas em Paxos. Embora os protocolos sem líder se tenham mostrado muito promissores, estes são ainda pouco adequados para sistemas de escala planetária, pois utilizam grandes quóruns, oferecem um desempenho imprevisível e têm mecanismos de recuperação complexos. Nesta tese propomos dois protocolos sem líder, Atlas e Tempo, adaptados para sistemas de escala planetária. O Atlas minimiza o tamanho dos seus quóruns fazendo uso da observação de que falhas simultâneas em centros de dados são raras. Também processa uma percentagem elevada de comandos da aplicação em uma única round trip, mesmo quando estes comandos conflituam. O Atlas consegue isto com um mecanismo de recuperação que é significativamente mais simples do que os protocolos sem líder que o precederam. O Tempo baseia-se no Atlas, mas atinge um rendimento superior e oferece um desempenho previsível mesmo em cargas de trabalho com elevado nível de conflitos. Para obter estes benefícios, o Tempo marca cada comando da aplicação com uma timestamp e executa-o somente após esta timestamp se tornar estável, ou seja, quando todos os comandos com uma timestamp menor são conhecidos. Ambos os mecanismos para gerar uma timestamp e detetar quando esta fica estável são totalmente descentralizados, evitando assim a necessidade de um líder. Avaliámos o Atlas e o Tempo em ambientes geo-distribuídos reais e simulados e demonstramos que eles superam as alternativas oferecidas pelo estado da arte.Modern web applications replicate their data across the globe and require strong consistency guarantees for their most critical data. These guarantees are usually provided via state-machine replication (SMR). Recent advances in SMR have focused on leaderless protocols, which improve the performance and availability of traditional Paxos-based solutions. Although leaderless protocols have shown great promise, they are poorly suited to planet-scale systems as they leverage large quorums, offer unpredictable performance and have complex recovery mechanisms. In this thesis we propose two leaderless protocols, Atlas and Tempo, tailored to planet-scale systems. Atlas minimizes the size of its quorums by making use of the observation that concurrent data center failures are rare. It also processes a high percentage of accesses in a single round trip, even when these conflict. Atlas achieves this while having a recovery mechanism that is significantly simpler than that of previous leaderless protocols. Tempo builds upon Atlas, but achieves superior throughput and offers predictable performance even in contended workloads. To achieve these benefits, Tempo timestamps each application command and executes it only after the timestamp becomes stable, i.e., all commands with a lower timestamp are known. Both the timestamping and stability detection mechanisms are fully decentralized, thus obviating the need for a leader replica. We evaluate Atlas and Tempo in both real and simulated geo-distributed environments and demonstrate that they outperform state-of-the-art alternatives.This work was partially supported by an FCT – “Fundação para a Ciência e Tecnologia” – PhD Fellowship (PD/BD/142927/2018).Gotsman, AlexeyBaquero, CarlosUniversidade do MinhoDuarte, Vitor Manuel Enes2022-11-182022-11-18T00:00:00Zdoctoral thesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://hdl.handle.net/1822/81307eng101677278info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T04:18:46Zoai:repositorium.sdum.uminho.pt:1822/81307Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T14:45:01.618911Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Planet-scale leaderless consensus
title Planet-scale leaderless consensus
spellingShingle Planet-scale leaderless consensus
Duarte, Vitor Manuel Enes
Consenso distribuído
Geo-replicação
Tolerância a falhas
Consensus
Fault tolerance
Geo-replication
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Planet-scale leaderless consensus
title_full Planet-scale leaderless consensus
title_fullStr Planet-scale leaderless consensus
title_full_unstemmed Planet-scale leaderless consensus
title_sort Planet-scale leaderless consensus
author Duarte, Vitor Manuel Enes
author_facet Duarte, Vitor Manuel Enes
author_role author
dc.contributor.none.fl_str_mv Gotsman, Alexey
Baquero, Carlos
Universidade do Minho
dc.contributor.author.fl_str_mv Duarte, Vitor Manuel Enes
dc.subject.por.fl_str_mv Consenso distribuído
Geo-replicação
Tolerância a falhas
Consensus
Fault tolerance
Geo-replication
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Consenso distribuído
Geo-replicação
Tolerância a falhas
Consensus
Fault tolerance
Geo-replication
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Programa de Doutoramento em Informática das Universidades do Minho, de Aveiro e do Porto
publishDate 2022
dc.date.none.fl_str_mv 2022-11-18
2022-11-18T00:00:00Z
dc.type.driver.fl_str_mv doctoral thesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/81307
url https://hdl.handle.net/1822/81307
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 101677278
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833594862537015296